Distribuciones de frecuencias

15
DISTRIBUCIÓN DE FRECUENCIAS FUENTE: FUENTE: Gómez, Elementos de Estadística Descriptiva Levin & Rubin. Estadística para Administradores UNIVERSIDAD DE COSTA RICA ESCUELA DE ESTADÍSTICA Prof. Olman Ramírez Moreira

description

distribuciones

Transcript of Distribuciones de frecuencias

Page 1: Distribuciones de frecuencias

DISTRIBUCIÓN DE FRECUENCIAS

FUENTE:FUENTE:Gómez, Elementos de Estadística DescriptivaLevin & Rubin. Estadística para Administradores

UNIVERSIDAD DE COSTA RICA

ESCUELA DE ESTADÍSTICA

Prof. Olman Ramírez Moreira

Page 2: Distribuciones de frecuencias

DEFINICIDEFINICIÓÓN Y USON Y USO

� Necesidad de resumir la información. Para que los datos sean útiles deben organizarse para distinguir patrones y tendencias y llegar así a conclusiones lógicas

� Una forma de organizar un conjunto de datos es clasificarlos en categorías o clases y luego contar cuántas observaciones quedan dentro de cada categoría.

� Para el análisis e interpretación de datos es valioso conocer:� La forma o patrón de distribución de los datos� La posición de la distribución: alrededor de qué valor se tienden a concentrar

los datos� Variabilidad: la dispersión de los datos alrededor de los valores centrales

� Ordenamiento o arreglo de los datos en clases o categorías indicando para cada una de ellas, el número de elementos que contiene o frecuencia

Page 3: Distribuciones de frecuencias

VISITAS DIARIAS HECHAS AL SITIO WEB DE VISITAS DIARIAS HECHAS AL SITIO WEB DE ESTUDIOS SOBRE DIVERSIDAD CULTURAL EN ESTUDIOS SOBRE DIVERSIDAD CULTURAL EN EL PRIMER CUATRIMESTRE DEL 2007EL PRIMER CUATRIMESTRE DEL 2007

22 30 33 35 38 40 45 49

22 30 33 35 38 41 45 50

23 30 33 35 38 41 45 50

24 30 34 35 38 42 46 52

25 30 34 36 38 42 46 52

26 30 34 36 38 42 47 52

26 30 34 36 39 42 47 52

26 31 35 37 39 43 47 53

27 31 35 37 39 43 47 53

27 31 35 37 40 43 47 54

27 31 35 37 40 44 48 55

28 31 35 38 40 44 48 61

28 32 35 38 40 45 48 62

28 32 35 38 40 45 49 64

29 33 35 38 40 45 49 72

Page 4: Distribuciones de frecuencias

MANIPULACIMANIPULACIÓÓN DE LOS DATOSN DE LOS DATOS

Conclusiones obtenidas de estos datos:� Edad máxima: 72� Edad mínima: 22� Amplitud general: 50� Mayoría de valores está entre 30 y 50

Una visión más clara se puede obtener construyendo una distribución de frecuencias. Requiere definir:

Valor de inicio de la primer claseAmplitud o intervalo a usarConociendo ambas queda definida la cantidad de clases a contruir

Page 5: Distribuciones de frecuencias

EL NEL NÚÚMERO DE CLASESMERO DE CLASESDepende de la cantidad de datos u observaciones y de la amplitud general

Muchas observaciones � permiten un mayor número de clases

Pocos datos � no conviene hacer muchas clases

Buscar un balance entre necesidad de resumir la información y mantener suficientes detalles para apreciar las características de los datos

Partir de la amplitud general y probar con diferente número de clases hasta alcanzar un número de clases y un intervalo adecuado (rango / # clases)

Decidir si usar clases iguales o desiguales

El número de clases recomendable está asociado con la cantidad de datos.

Clases abiertas: Clases abiertas: � Ubicadas al principio o al final de la distribución de frecuencias, � Necesarias cuando unos pocos datos se alejan mucho de la mayoría (hacia arriba o hacia abajo), � Evitar construir clases intermedias vacías (para clases de igual amplitud)

Recomendaciones:Recomendaciones:� Las clases deben ser exhaustivas y mutuamente excluyentes� Procurar que el número de clases oscile entre 5 y 10� Evitar, hasta donde sea posible, clases de diferente amplitud

Page 6: Distribuciones de frecuencias

COMPONENTES DE LA DISTRIBUCICOMPONENTES DE LA DISTRIBUCIÓÓN DE N DE FRECUENCIASFRECUENCIAS

FRECUENCIAS ABSOLUTAS:

� Número de elementos u observaciones pertenecientes a una misma clase.

FRECUENCIA RELATIVA:

� Se obtiene dividiendo la frecuencia absoluta por el número de observaciones

� Denota la importancia de la clase, al expresarse en términos porcentuales

� Facilitan el análisis de los datos, en especial para comparar distribuciones de frecuencias basadas en diferentes número de observaciones

FRECUENCIA ACUMULADA

� Número de observaciones que son menores que el límite superior de la clase

Se obtiene sumando las frecuencias (absolutas o relativas) en sentido descendente

PUNTO MEDIO:

� Valor central de la clase

� Promedio entre el límite inferior de entre dos clases sucesivas

� Es el valor representativo de la clase

Page 7: Distribuciones de frecuencias

InterpretaciInterpretacióón:n:f3: en 37 días del primer cuatrimestre del 2007 las visitas diarias al

sitio WEB estuvieron entre 40 y 49 f%3: el 30.8% de los días del primer cuatrimestre de 2007 las visitas

diarias al sitio WEB oscilaron entre 40 y 49 añosF3: 106 días del primer cuatrimestre del 2007 las visitas diarias al

sitio WEB fueron 59 visitas o menosF%3: el 88.3% de los días del primer cuatrimestre del 2007 las

visitas diarias al sitio WEB fueron 59 visitas o menos

CLASIFICACIÓN VISITAS DIARIAS AL SITIO WEB ESTUDIOS SOBRE DIVERSIDAD. PRIMER CUATRIMESTRE 2007.

VISITAS DIARIAS Punto

medio

FRECUENCIA ACUMULADA

Absoluta Relativa Absoluta Relativa

20 - 29 25 15 12,5 15 12,5

30 - 39 35 54 45,0 69 57,5

40 - 49 45 37 30,8 106 88,3

50 - 59 55 10 8,3 116 96,7

60 - 69 65 3 2,5 119 99,2

70 - 79 75 1 0,8 120 100,0

Total 120 100,0

Page 8: Distribuciones de frecuencias

REPRESENTACIREPRESENTACIÓÓN GRN GRÁÁFICAFICA

La representación gráfica contribuye a un mejor análisis de los datos

Facilita la comprensión del fenómeno considerado

Pierde detalle de información pero se obtiene otro tipo de información

Gráficos utilizados: histograma, polígono de frecuencia y ojiva son útiles pues resaltan los patrones de los datos y atraen la atención

Page 9: Distribuciones de frecuencias

HISTOGRAMAHISTOGRAMA� Gráfico de barras verticales, las barras no guardan separación entre sí

� Definidas las escalas en el eje cartesiano se dibuja un rectángulo acorde a la frecuencia de la clase (altura)

� En clases de igual amplitud las barras son proporcionales a la frecuencia de la clase

Page 10: Distribuciones de frecuencias

POLPOLÍÍGONO DE FRECUENCIASGONO DE FRECUENCIAS� La altura de cada punto la determina el punto medio (abscisa) y la frecuencia simple

(ordenada) de la clase� Los puntos se unen con secciones de rectas� Se procede como si existiera una clase adicional al principio y al final, ambas con

frecuencia cero� Útiles para representar dos distribuciones de frecuencia en un mismo gráfico

Page 11: Distribuciones de frecuencias

OJIVASOJIVAS� Para representar la frecuencia acumulada� La ordenada se levanta sobre el límite superior� Tiene forma de S alargada

Page 12: Distribuciones de frecuencias

TENGA PRESENTE QUE:TENGA PRESENTE QUE:

HISTOGRAMA: � La altura debe ser proporcional al número de elementos de la

clase� En ocasiones puede resultar más útil el histograma elaborado

con la frecuencia relativa porque permite comparar conjuntos de datos de tamaño diferente

POLIGONO DE FRECUENCIASPOLIGONO DE FRECUENCIAS� Es más sencillo que el histograma correspondiente� Traza con mayor claridad el perfil del patrón de los datos� Se vuelve cada vez más liso y parecido a una curva al

agregar cada vez más y más datos

SUGERENCIA� Añadir siempre dos clases en los gráficos: una al inicio y otra

al final con frecuencia cero

Page 13: Distribuciones de frecuencias

EJERCICIO PREJERCICIO PRÁÁCTICOCTICO

� En el Hospital de la Mujer se dispone de los siguientes datos del peso en libras de 200 bebés prematuros nacidos en 2006.

� Construya una distribución de frecuencias completa:� ¿Cuál es el valor medio aproximado del conjunto de datos original?� Si los bebés prematuros que pesan menos de 3.0 libras se les suele mantener en incubadora

durante varios días como medida precautoria, ¿aproximadamente qué porcentaje de bebés prematuros nacidos en el Hospital de la Mujer en 2006 necesitaron incubadora?

� ¿Qué forma (patrón) tiene la distribución de los datos?

0,5 - 0,9 101,0 - 1,4 191,5 - 1,9 242,0 - 2,4 272,5 - 2,9 293,0 - 3,4 343,5 - 3,9 404,0 - 4,4 17

Page 14: Distribuciones de frecuencias

A b s o lut a R e la t iv a A b s o lut a R e la t iv a

0,5 - 0,9 0,8 10 5,0 10 5,01,0 - 1,4 1,3 19 9,5 29 14,51,5 - 1,9 1,8 24 12,0 53 26,52,0 - 2,4 2,3 27 13,5 80 40,02,5 - 2,9 2,8 29 14,5 109 54,53,0 - 3,4 3,3 34 17,0 143 71,53,5 - 3,9 3,8 40 20,0 183 91,54,0 - 4,4 4,3 17 8,5 200 100,0

200 100,0

= 2,74

TOTAL

P unt o

m e d io

FRECUENCIA

Promedio: 547,35 / 200

ACUMULADAPESO (lbs)

DISTRIBUCIÓN DE LOS PESOS DE LOS 200 BEBES PREMATUROS NACIDOS EN EL HOSPITAL DE LA MUJER EN 2006

Page 15: Distribuciones de frecuencias

0

5

10

15

20

25

0,3 0,8 1,3 1,8 2,3 2,8 3,3 3,8 4,3 5,3

PESO EN LIBRAS

FR

EC

UE

NC

IA

PESO EN LIBRAS DE LOS 200 BEBES PREMATUROS NACIDOS EN EL HOSPITAL DE LA MUJER EN 2006