Caracterización de Datos Cuantitativos Agrupados

8
CONGREGACIÓN DE LOS HERMANOS DE LAS ESCUELAS CRISTIANAS DISTRITO DE MEDELLÍN INSTITUTO LA SALLE LA EXIGENCIA DA EXCELENCIA Código Material de Estudio No. 1 Fecha 07 - 04 - 11 Docente: Angélica María López Asignatura: Estadística Curso: 9°03 – 9°04 Caracterización de Variables Cuantitativas Para caracterizar variables cuantitativas se consideran dos casos teniendo en cuenta la forma en que están presentados los datos: datos agrupados y datos no agrupados. Datos agrupados: Se caracterizan a partir de la construcción de un diagrama de tallo y hojas, una tabla de frecuencias, los histogramas y polígonos correspondientes. Datos no agrupados: Se caracterizan a partir de las medidas de tendencia central, las medidas de posición, las medidas de dispersión y el diagrama de caja y bigotes. Caracterización de datos agrupados Tabla de frecuencias Una tabla de frecuencias es un arreglo tabular de las frecuencias con que ocurre cada característica en que se han dividido los datos. La construcción de una tabla de frecuencias para datos cuantitativos presenta como su punto de mayor importancia la determinación del número de intervalos (clases) que la conformaran. Este número depende de la cantidad y de la naturaleza de los datos a resumir y del propósito que se busca con el resumen. A continuación se presentan ciertas pautas para la construcción de una tabla de frecuencias. 1. El número de intervalos debe escogerse de acuerdo con el número de datos. Para ello se emplea la siguiente aproximación:

Transcript of Caracterización de Datos Cuantitativos Agrupados

Page 1: Caracterización de Datos Cuantitativos Agrupados

CONGREGACIÓN DE LOS HERMANOS DE LAS ESCUELAS CRISTIANASDISTRITO DE MEDELLÍN

INSTITUTO LA SALLELA EXIGENCIA DA EXCELENCIA

CódigoMaterial de Estudio No. 1

Fecha07 - 04 -

11

Docente: Angélica María López Asignatura: Estadística Curso: 9°03 – 9°04

Caracterización de Variables Cuantitativas

Para caracterizar variables cuantitativas se consideran dos casos teniendo en cuenta la forma en que están presentados los datos: datos agrupados y datos no agrupados.

Datos agrupados: Se caracterizan a partir de la construcción de un diagrama de tallo y hojas, una tabla de frecuencias, los histogramas y polígonos correspondientes.

Datos no agrupados: Se caracterizan a partir de las medidas de tendencia central, las medidas de posición, las medidas de dispersión y el diagrama de caja y bigotes.

Caracterización de datos agrupados

Tabla de frecuencias

Una tabla de frecuencias es un arreglo tabular de las frecuencias con que ocurre cada característica en que se han dividido los datos. La construcción de una tabla de frecuencias para datos cuantitativos presenta como su punto de mayor importancia la determinación del número de intervalos (clases) que la conformaran. Este número depende de la cantidad y de la naturaleza de los datos a resumir y del propósito que se busca con el resumen. A continuación se presentan ciertas pautas para la construcción de una tabla de frecuencias.

1. El número de intervalos debe escogerse de acuerdo con el número de datos. Para ello se emplea la siguiente aproximación:

Donde n corresponde al número de datos que se van a agrupar.

2. Una vez escogido el número de intervalos, se determina la longitud o tamaño que deben tener los intervalos, de tal manera que todos los intervalos tengan el mismo tamaño. Para ello se utiliza el siguiente criterio:

Page 2: Caracterización de Datos Cuantitativos Agrupados

3. Construcción de la tabla: Se construye el primer intervalo a partir del dato menor, así:

En el primer intervalo siempre debe estar contenido el dato menor y en el último el dato mayor.

Al elaborar la tabla de frecuencias se debe incluir:

f la cual es la frecuencia del intervalo y corresponde al número de datos que están en ese rango.

fr es la frecuencia relativa o proporción y corresponde a la frecuencia comparada con el total.

F es la frecuencia acumulada y corresponde a la sumatoria de las frecuencias de los intervalos anteriores incluyendo su frecuencia.

Fr es la frecuencia acumulada relativa y corresponde a la frecuencia acumulada comparada con el total.

Mi es la marca de clase y corresponde al punto medio de cada uno de los intervalos. Se calcula mediante la siguiente expresión:

Ejemplo: Elaboraremos la tabla de frecuencias para los datos que se encuentran en siguiente tabla.

Tabla 1

33.1

35.3

34.2

33.6

33.6

33.1

37.6

33.6

34.5

34.7

33.4

32.5

35.4

34.6

37.3

34.1

35.6

35.0

34.7

34.1

34.6

35.9

34.6

34.7

36.3

35.4

34.6

35.1

33.8

34.7

35.5

35.7

35.1

36.2

35.2

36.8

37.1

33.6

32.8

36.8

Page 3: Caracterización de Datos Cuantitativos Agrupados

34.7

36.8

35.0

37.9

34.0

32.9

32.1

34.3

33.6

35.1

34.9

36.4

34.1

33.5

34.5

32.7

32.6

33.6

33.8

34.2

34.6

34.7

35.8

37.8

Desarrollo:

1. El número de intervalos a utilizar es 8. Puesto que:

2. Tamaño del intervalo:

3. Construcción de la tabla:

Intervalo

f fr F Fr Mi

32.1 – 32.8

5 0,08

5 0,08

32.45

32.9 – 33.6

11

0,17

16

0,25

33.25

33.7 – 34.4

9 0,14

25

0,39

34.05

34.5 – 35.2

20

0,31

45

0,70

34.85

35.3 – 36.0

8 0,13

53

0,83

35.65

36.1 – 36.8

6 0,09

59

0,92

36.45

36.9 – 37.6

3 0,05

62

0,97

37.25

37.7 – 38.4

2 0,03

64

1,00

38.05

Total64

1,00

Algunas conclusiones a partir de la tabla son:

Page 4: Caracterización de Datos Cuantitativos Agrupados

El 8% de las camisas fue fabricado con un material que contenía entre el 32.1% y el 32.8% de algodón y un porcentaje igual fue fabricado con un material que contenía entre el 36.9% y el 38.4% de algodón.

El 84% de las camisas fue fabricado con un material que contenía entre el 32.9% y el 36.8% de algodón.

Diagramas para datos cuantitativos agrupados

Diagrama de tallo y hojas

Un diagrama de tallo y hojas es una representación gráfica en la cual, los datos se clasifican de acuerdo con la expresión decimal de cada uno de ellos. Este diagrama es usado cuando hay una cantidad no muy pequeña de datos y dan una idea de la localización de los datos y de la forma de la distribución.

Para construir un diagrama de este estilo se debe dividir cada dato en tallo y hoja. El tallo corresponde a la primera, o primeras cifras del dato, y en la mayoría de los casos la hoja corresponde a la última cifra del dato.

Ejemplo:

La siguiente tabla representa el porcentaje de algodón en un material utilizado para la fabricación de camisas para caballeros.

Tabla 1. Datos del porcentaje de algodón

33.1

35.3

34.2

33.6

33.6

33.1

37.6

33.6

34.5

34.7

33.4

32.5

35.4

34.6

37.3

34.1

35.6

35.0

34.7

34.1

34.6

35.9

34.6

34.7

36.3

35.4

34.6

35.1

33.8

34.7

35.5

35.7

35.1

36.2

35.2

36.8

37.1

33.6

32.8

36.8

34.7

36.8

35.0

37.9

34.0

32.9

32.1

34.3

33.6

35.1

34.9

36.4

34.1

33.5

34.5

32.7

32.6

33.6

33.8

34.2

34.6

34.7

35.8

37.8

El diagrama de tallos y hojas para los anteriores datos aparece a continuación.

Page 5: Caracterización de Datos Cuantitativos Agrupados

Diagrama de tallo y hojas para porcentaje de algodón. n = 64. Unidad de la hoja = 0.10 (el número 1 después del punto significa que se usa una sola cifra decimal).

Tallo

Hojas

32 15678933 11456666668834 011122355666667777

77935 0011123445678936 23488837 13689

Del diagrama se puede concluir que:

En 6 camisas se usó un porcentaje de algodón entre el 32.0 y 33.0; 12 camisas fueron elaboradas con un porcentaje de algodón entre el 33.0 y 33.9; 21 camisas fueron elaboradas con un porcentaje de algodón entre el 33.9 y el 35.0; 14 camisas fueron elaboradas con un porcentaje de algodón entre el 34.9 y el 36.0; 6 camisas fueron elaboradas con un porcentaje de algodón entre el 36.0 y el 37.0 y 5 camisas fueron elaboradas con un porcentaje de algodón entre el 37.0 y el 38.0. Luego la mayoría de las camisas tienen un porcentaje de algodón entre el 33.9 y el 35.0.

Histogramas

Un histograma es una representación gráfica de una variable en forma de barras. Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases.

En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados.

Así el histograma correspondiente a los datos de la tabla 1 seria:

Page 6: Caracterización de Datos Cuantitativos Agrupados

Polígono de Frecuencias

A partir del diagrama de clases (Mi) es posible construir el diagrama de líneas o polígono de frecuencias; en el eje horizontal se ubican las marcas de clase y en el eje vertical las frecuencias.

Las marcas de clase coinciden con el punto medio de cada rectángulo de un histograma y se unen mediante segmentos para formar el polígono de frecuencias.

Page 7: Caracterización de Datos Cuantitativos Agrupados

El polígono de frecuencias acumuladas se llama ojiva. Para el caso de la tabla 1 la ojiva se muestra a continuación.