Post on 25-Jul-2015
ANÁLISIS DE DATOS
PROFESOR: ALEJANDRO GERARDO ACEVEDO KALLENS (AGAK)E-MAIL: agakallens@yahoo.com
CARRERA: INGENIERÍA EN INFORMÁTICA
ESTADÍSTICA DESCRIPTIVA
Se ocupa de la organización y presentación de
los datos en forma convenientemente útil y de
fácil comunicación además de hacer
mediciones con esta información.
CONCEPTOS BÁSICOS
POBLACIÓN O UNIVERSO
Es el conjunto de todos los individuos u objetos que poseen alguna característica común observable.
MUESTRA
Es un subconjunto de la población.
VARIABLE ESTADÍSTICA
Es la característica o atributo a observar.
DATO
Es el conjunto de valores asignados a la variable.
CONCEPTOS BÁSICOS
º VARIABLE CUALITATIVAVARIABLE CUALITATIVA
Característica que representa una cualidad de los individuos de la población.
º VARIABLE CUANTITATIVAVARIABLE CUANTITATIVA
Característica que corresponde a una magnitud asociada a los individuos de la población.
CONSIDEREMOS LA SIGUIENTE MUESTRA
68 72 45 70 70 83 77 78 80 93
71 74 60 84 72 84 73 81 84 92
77 62 76 59 85 74 78 79 91 97
83 67 66 75 79 82 93 90 96 80
79 69 76 94 71 96 95 83 86 69
Número Mayor
Número Menor
ETAPAS DE LA ESTADÍSTICA DESCRIPTIVA
Los datos muéstrales se clasifican en clases:
A1,A2,A3,……AK
Las clases deben ser excluyentes, es decir todo elemento debe
pertenecer sólo a una clase.
¿Cómo definir la cantidad de clases?
Si se dispone de n datos muéstrales se suele usar la regla de “Sturges”.
K=(3,3*log (n) )+1 Para nuestra tabla quedaría: K=(3,3*log(50))+1=6,606… se aproxima a 7 Por lo tanto la información la clasificaremos
en 7 clases.
¿Cómo definir la longitud de la clase?
Utilizaremos la siguiente formula:
C = (MAX-MIN)/K
Para nuestro caso quedará de la siguiente
forma:
C=(97-45)/7 = 7,428 se aproxima a 8
(entero superior)
¿Cómo quedará nuestra tabla de frecuencia?
De los cálculos anteriores la información la podemos agrupar en 7 clases de largo 8, quedando de la siguiente forma:
TABLA DE FRECUENCIA
Clase Intervalo de Clase
Marca de Clase
A1 [45 - 53[ 49
A2 [53 - 61[ 57
A3 [61 - 69[ 65
A4 [69 - 77[ 73
A5 [77 - 85[ 81
A6
A7
[85 - 93[
[93 - 101]
89
97
¿Cómo organizaremos éstos datos?
Para descubrir como se reparten los datos entre las clases, consideraremos las frecuencias.
Frecuencia Absoluta
Es el número de observaciones muéstrales que caen en cada clase fi
para i = 1,….n.
fi
Frecuencia Absoluta Acumulada
Es la suma acumulada de las frecuencias
absolutas hasta cada clase Fi
para i=1,….n.
Se tiene que:
n
i ii fF1
Frecuencia Relativa
Es la proporción de datos con respecto a toda la
muestra que pertenecen a cada clase hi
para i=1,….n.
Se tiene que:
hi = fi/n
Frecuencia Relativa Acumulada
Es la suma acumulada de las frecuencias
relativas hasta cada clase Hipara i=1,….n. Se tiene que:
n
i ii hH1
Tabla de FrecuenciasClase Intervalo de
ClaseMarca de
Clasefi Fi hi Hi
A1 [45 - 53[ 49 1 1 0,02 0,02
A2 [53 - 61[ 57 2 3 0,04 0,06
A3 [61 - 69[ 65 4 7 0,08 0,14
A4 [69 - 77[ 73 14 21 0,28 0,42
A5 [77 - 85[ 81 17 38 0,34 0,76
A6 [85 - 93[ 89 5 43 0,10 0,86
A7 [93 - 101] 97 7 50 0,14 1,00
50 1
EJERCICIOREALICE EL PROCEDIMIENTO ANTERIOR CON LA
SIGUIENTE TABLA
55 88 73 11 21 8 99 110
63 48 97 10 22 17 29 30
36 48 21 99 7 14 23 77
66 95 61 39 44 57 75 61