3.pdf

22
TEMA 3 Organización y Clasificación de los Datos

Transcript of 3.pdf

TEMA 3

•Organización y

Clasificación

de los Datos

A. Organización y

Clasificación de los

datos Habiendo recopilado un conjunto de datos, el primer paso a realizar es expresarlos y clasificarlos en una forma simple, para esto se siguen los siguientes pasos.

1. Revisión, corrección y simplificación de los datos

2. Construcción de las tablas de frecuencias

3. Representación tabular o cuadros estadísticos y gráficos

1. Revisión, corrección y simplificación de los datos

Es obligatoriamente el paso previo a la clasificación y computación de los datos, porque siempre hay errores de medición y transcripción, se ha comprobado que hay entre un 2 y un 5% de observaciones con errores.

2. Construcción de las tablas de frecuencias

Si los datos que se dispone son numerosos es indispensable clasificarlos en un cuadro o tabla resumen de las observaciones originales.

2.1. Construcción tablas para datos de variables

continuas

• Se deben clasificar los datos en clases

• Donde clase = se llama a cada uno de los grupos en que se divide el conjunto de datos.

Intervalo de clase (y’i – 1--------yi)

Marca de clase

yi

Frecuencia absoluta

ni

Y’i -1-------Y’i Y1 n1

Y’1 ------- Y’2 Y2 n2

Y’2 ------- Y’3 Y3 n3

|

| |

Y’m -1 ----- Y’m Ym nm

n

Clase

2.2. Tablas de frecuencias para datos de variables continuas

• Determinación de la frecuencia absoluta

• Sean x1 , x2 , x3…………………...xn

un conjunto de observaciones que pertenecen a cada intervalo

de clase

• La frecuencia absoluta (ni) de la clase iésima es el número de observaciones del conjunto original que pertenece a dicha clase

-Sean m el número de clases de y’1 , y’2 , y’3………………y’m

Los extremos o límites del intervalo de clase

Y’i -1 ---------- y’i donde i= 1,2,3…….……………m límite inferior

cerrado Límite superior

abierto

• Sólo veremos la teoría para tablas de amplitud iguales

• Respecto al Nro. de clases no existe un consenso para un número determinado de las mismas, algunos toman entre 10 y 20 otros entre 8 y 15, pero el sentido común nos dice que no deben ser muy pocas

• Reglas que deben seguirse:

a) Tomar el número de clases (m) igual al entero más próximo

de √𝒏 o 𝟐√𝒏 n= Nro. de observaciones

b) m > √𝒏

c) Regla de Sturges K = 1 + 3,3 log n = Impar más próximo

d) En general se recomienda que el número de clases esté entre 5 y 20

Regla para Elaborar la Distribución de

Frecuencias de Datos Continuos

1. Definir el Nro. de clases 2. Determinar el recorrido o rango de

los datos xmáx y xmín

3. Determinar la amplitud de recorrido

minmax xxl )(l

4. Determinar la amplitud de clase o longitud de los intervalos de clase (c)

Conveniente que sea de la misma longitud

m

lc

mn (m)

5. Conformar los intervalos de clase determinando los límites de clase

Límite inferior (yi -1) ---------- (yi) Límite superior

6. Determinar las marcas de Clases (yi) o

punto medio del intervalo de clase

Yi = 𝑦𝑖

−1

+

𝑦𝑖

2

7. Finalmente hallar la frecuencia

absoluta de cada clase

EJEMPLO PARA SEGUIR PASO A PASO:

10 42 61 68 79 81

20 45 62 73 79 81

25 50 62 73 79 83

30 50 62 73 80 84

30 52 65 75 80 84

35 53 65 75 80 85

40 60 67 78 81 85

40 60 67 78 81 86

Las notas de calificación de Evaluación Continua de la materia de Estadística I, de la carrera de Farmacia de la gestión 2013 fueron las siguientes:

X mínimo

X máximo

n = 48 # total de observaciones

Datos obtenidos siguiendo el Ejemplo:

mn 1. 79,648 # clases

2. xmáx = 86 y xmín = 10

3. 761086 l

4. 1185,10

7

76c

5,021 +1

1185,107

76c

xmáx = 86 y xmín = 10 + 0,5 - 0,5 86,5 9,5

La cifra 1, que estamos aumentando para que c sea un # entero, debemos dividirla entre los dos extremos, porque estamos aumentando el rango

Por lo que el xmin o límite inferior, sería 9,5 y nuestro intervalo de clases quedaría conformado de la siguiente forma:

Construcción Tabla conformación intervalos de clase

Calificaciones de Evaluación Continua

9,5 ------ 20,5

20,5-------31,5

31,5-------42,5

42,5-------53,5

53,5-------64,5

64,5-------75,5

75,5-------86,5

Total

X min

Construcción Tabla Determinación Marcas de clase

Calificaciones de Evaluación

Continua

Marca

de clase ni

9,5 ------ 20,5 15 2

20,5-------31,5 26 3

31,5-------42,5 37 4

42,5-------53,5 48 5

53,5-------64,5 59 6

64,5-------75,5 70 10

75,5-------86,5 81 18

Total 48

Intervalo de Clase

Yi

Tabla construida Distribución de frecuencias

con intervalos de clase

Calificaciones de Evaluación

Continua yi ni hi pi Ni

Hi

Hi

x 100

N*i H*i

H*i

x

100

9,5 ----20,5 15 2 0,042 4,2 2 0,042 4,2 48 1 100

20,5----31,5 26 3 0,063 6,3 5 0,105 10,5 46 0,958 95,8

31,5----42,5 37 4 0,083 8,3 9 0,188 18,8 43 0,895 89,5

42,5----53,5 48 5 0,104 10,4 14 0,292 29,2 39 0,812 81,2

53,5----64,5 59 6 0,125 12,5 20 0,417 41,7 34 0,708 70,8

64,5----75,5 70 10 0,208 20,8 30 0,625 62,5 28 0,583 58,3

75,5-----86,5 81 18 0,375 37,5 48 1 100 18 0,375 37,5

Total 48 1 100

Nro. de alumnos

Interpretación n7 = 18, 18 estudiantes tienen una nota de evaluación

continua de 75,5 o más pero menos de 86,5

Y2 = 26, es el punto medio del intervalo que representa a dicha clase

N4 = 14, 14 estudiantes tienen una nota de evaluación continua menor a 53,5

N*3 = 43, 43 estudiantes tienen una nota de evaluación continua de por lo menos 31,5

H4 = 0,292,es la proporción de estudiantes que

tienen una nota de evaluación continua menor a 53,5

Interpretación h6 = 0,208, es la proporción de estudiantes que tienen

una nota de evaluación continua de 70

Y2 = 26, es el punto medio del intervalo que representa a dicha clase

H3 x 100 = el 18,8% de los estudiantes tienen una nota de evaluación continua menor a 42,5

H*5 x 100 = el 70,8%, de los estudiantes tienen una nota de evaluación continua de por lo menos 53,5

H4 = 0,292,es la proporción de estudiantes que

tienen una nota de evaluación continua menor a 53,5

GRACIAS POR SU ATENCION

Variable Cuantitativa

Continua (ejercicio)