3-Distribucioìn de Frecuencias.ppt
-
Upload
starfoxsoldier -
Category
Documents
-
view
218 -
download
0
Transcript of 3-Distribucioìn de Frecuencias.ppt
-
7/22/2019 3-Distribucion de Frecuencias.ppt
1/44
Distribucin de FrecuenciasObjetivos a identificar
Frecuencias absolutas
Frecuencias relativas
Frecuencia acumulada. Tablas.
Medidas de Tendencia Central.
Histogramas y polgonos. Grficos
Ejercicios y Aplicaciones.
-
7/22/2019 3-Distribucion de Frecuencias.ppt
2/44
Objetivos a identificar:
Conocer la definicin de frecuencias y sus tipos.
Aplicacin de las frecuencias
Conocer la distribucin de frecuencias
Aprender a ubicar los intervalos de clase y su utilidad.
Medidas de tendencia central en datos agrupados.
Conocer los percentiles y cuartiles. Aplicaciones.
-
7/22/2019 3-Distribucion de Frecuencias.ppt
3/44
Resumiendo los datos
Tanto las variables cualitativascomo lascuantitativas,originan observaciones, lascuales se conocen como: series cualitativasoseries cuantitativas.
Mientras que los datos que originan estasseries, (vectores o conjuntos de datos) sonpocos, basta solo ordenarlos para saber elvalor mayor y menor, la existencia deconcentraciones alrededor de algunos valores
-
7/22/2019 3-Distribucion de Frecuencias.ppt
4/44
Tipos de Distribucin
Por ejemplo una distribucin simple sera:
Provincias de nacimiento de 10 ticos:(atendiendo al cdigo de la provincia)
1,2,3,4,5,6,7,7,7,7
Esta es una forma ordenada de expresar esa
distribucin
No obstante, el problema se crea cuando elconjunto de datos es muy voluminoso.
-
7/22/2019 3-Distribucion de Frecuencias.ppt
5/44
Concepto de Distribucin de Frecuencias
La Distribucin de Frecuencias es un conjunto de
elementos ordenados, resumidos o distribuidos en las
diferentes categoras de una serie de datos
determinada.
El nmero que aparece resumiendo cada categora es
conocido como la frecuencia y cada categoratiene
una frecuencia, denominada absoluta.
La suma de estas frecuencias absolutas, nos da el
nmero de unidades observadas en todas las
categoras
-
7/22/2019 3-Distribucion de Frecuencias.ppt
6/44
Caractersticas de las Clases, para
datos agrupados
Las Clases o Intervalos o Categoras seleccionadastienen que ser exhaustivas y mutuamente excluyentes.
Eso significa que ningn elemento del conjunto a lahora de clasificar, puede encontrar ambigedad en ladefinicin del intervalo. Ejemplo:
Un intervalo de la variable No. de hijos, pudiera ser:
1-4 hijos: Se entiende que en ese intervalo clasificantodos los encuestados que tienen 1,2,3, y hasta 4hijos. Los que no tienen hijos, no estn aqu, al igual siel nmero de hijos es mayor a 4.
-
7/22/2019 3-Distribucion de Frecuencias.ppt
7/44
Ejemplo de una distribucin de
frecuencias
Estudiamos el nmero de embarazos
anteriores de 20 parturientas (discreta) en elHospital de la Mujer Adolfo Carit en abril de
2012.
El vector obtenido de la revisin realizada de
estos 20 elementos es como sigue en la tablapreparada para el efecto
-
7/22/2019 3-Distribucion de Frecuencias.ppt
8/44
Ejemplo de distrib..... cont
Tabla de Recoleccin de Datos sobre E.ANo E.A No. E.A No E.A No E.A
1 4 6 8 11 5 16 3
2 6 7 4 12 3 17 3
3 9 8 11 13 4 18 14
4 4 9 7 14 7 19 3
5 9 10 8 15 1 20 3
-
7/22/2019 3-Distribucion de Frecuencias.ppt
9/44
Ordenando los datos
Serie sin Ordenar:
4, 6, 9, 4, 9, 8, 4, 11, 7, 8, 5, 3, 4, 7, 1, 3, 3, 14, 3, 3
Serie Ordenada:
1, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 11, 14
Ahora se debe seleccionar el nmero de intervalos de clases
que vamos a tener . Nunca deben ser menores de 4 y nomayores de 10, pues no tiene razn el resumen hecho.
Para ello tambin calculamos la amplitud de la serie (14-1) y
la dividimos entre el nmero de clases que deseamos (4)
14-1 / 4 = 3.25 ~ 4
-
7/22/2019 3-Distribucion de Frecuencias.ppt
10/44
Resultados de la tabla de distribucin
con f recuenc ias abso lutas
Distribucin de Embarazos anteriores
No. Embarazos Anteriores No. Madres
1-4 embarazos 10
5-8 embarazos 6
9-12 embarazos 3
13- 16 embarazos 1
TOTAL 20
-
7/22/2019 3-Distribucion de Frecuencias.ppt
11/44
Calculemos la Frecuenc ia Relativa
Para ello tomamos la frecuencia de la clase y
la dividimos entre el total de elementosobservados. El resultado es un %. Ejemplo:
Para el intervalo de 1-4 embarazos, donde la
frecuencia absoluta es =10, la Frecuencia
relativa es: (10 / 20) x 100 = 50 % As tendremos en todo el cuadro anterior:
-
7/22/2019 3-Distribucion de Frecuencias.ppt
12/44
Cuadro de frecuencias absolutasy relat ivas
Frecuencias absolutas y relativas
No. Embarazos
Anteriores
No. Madres
(f)
Porcentaje
(%) (fr)
1-4 embarazos 10 50
5-8 embarazos 6 309-12 embarazos 3 15
13- 16 embarazos 1 5
TOTAL 20 100
-
7/22/2019 3-Distribucion de Frecuencias.ppt
13/44
Calculemos la Frecuencia
Acumulada
A medida que vamos analizando cada
intervalo de clase, con su frecuencia absoluta,esta se va sumando a la frecuencia anterior.
Ayuda a conocer en donde estn concentrados
los valores en los intervalos.
Vemoslo, en este ejemplo
-
7/22/2019 3-Distribucion de Frecuencias.ppt
14/44
Ejemplo de Frecuencia absoluta acumulada
(FAA) y Frecuencia Relativa Acumulada (FRA)
Distribucin de frecuencias (fa), (faa),(fr),(fra) del ejemplo anterior
IC fa Fr (%) faa fra1-4
embarazos
10 50 10 50
5-8
embarazos
6 30 16 80
9-12embarazos
3 15 19 95
13- 16
embarazos
1 5 20 100
TOTAL 20 100
-
7/22/2019 3-Distribucion de Frecuencias.ppt
15/44
Caractersticas de las distribuciones de
variables discretas y continuas
1.- Las distribuciones de variables discretasson fcilesde realizar, mientras que las de variables cont inuas
deben tener en cuenta los limites reales indicados desus intervalos de clase. Ejemplo: ( intervalo de clasede peso)
Lmite indicado Lmite Real
30-34 kg 29.534,5 Kg
2.- Todos los intervalos de clase deben estar cerrados.Las clases abiertas deben evitarse, pues los clculosde datos agrupados en distribuciones, pueden ser
inexactos
-
7/22/2019 3-Distribucion de Frecuencias.ppt
16/44
Medidas de Tendencia Central ode Posicin
La Media, La Moda y La
Mediana, en conjuntos
de datos no agrupados
-
7/22/2019 3-Distribucion de Frecuencias.ppt
17/44
Principal funcin
El propsito de estas medidas es el de tratarde resumir en un solo nmero, la posicin o
localizacin de la distribucin.
-
7/22/2019 3-Distribucion de Frecuencias.ppt
18/44
La Media o Promedio
La media o el promedio, es el resultado de sumar todos losvalores que toma la variable en el conjunto y dividir el nmero deelementos de ese propio conjunto entre esa cantidad sumadaanteriormente.
Por definicin, cada conjunto tiene un solo promedio.
Ejemplo:
X= variable en estudio
N= nmero de elementos en el conjunto
= promedio de la variable en el conjunto total
= simbolo de sumatoria
Xi= X1 + X2+ X3.... XN= todos los valores de la variable X en losN elementos del conjunto.
-
7/22/2019 3-Distribucion de Frecuencias.ppt
19/44
Ejemplo de la media
Siendo el conjunto de estudio la frecuencia
cardiaca (pulsaciones por minuto) de 6estudiantes de la clase:
55,64,53,79,64,68
Aplicando la frmula:
55+64+53+79+64+68 = = 63.8~ 64 pul/min
6
-
7/22/2019 3-Distribucion de Frecuencias.ppt
20/44
La Moda
Esta medida se asocia con el valor mas comn, mstpico que ocurre mas frecuentemente en un conjuntos
de datos. Es el valor de mayor frecuencia. Ejemplo:1, 3, 3, 3, 4, 4, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 11, 14
En este caso, la Moda (Mo)= 4
Puede suceder que no est definida la Moda en un
conjunto o que existan varias Modas (igual nmero defrecuencias ), para lo que la utilidad de la Moda esreducida.
La Moda tambin es til con las variables cualitativas(el diagnstico mas frecuente en emergencias en el
da de hoy fue la EDA)
-
7/22/2019 3-Distribucion de Frecuencias.ppt
21/44
La Mediana
Es el valor central de una serie de datos ordenados y su
ubicacin equidista de los limites mayor y menor del conjunto. Ej.:
55,63,53,79,64,68,78 ( N=7)Ordenando el conjunto:
53, 55, 63, 64, 68, 78, 79
Me = N +1/2
= 7 + 1/ 2= 8/2
= 4
(lo que quiere expresar que en este caso, el 4to. Elemento de la
serie ordenada, que en este caso es 64
-
7/22/2019 3-Distribucion de Frecuencias.ppt
22/44
La Mediana... cont
En el caso de que la serie sea par:
55,63,53,79,64,68 donde N = 6
Se ordena tambin: 53, 55, 63,64,68,79
Se calcula promediando los dos valores centrales:
Me = 63+64/ 2
= 63.5
lo que significa que el 50% de los elementos estudiadostienen una frecuencia cardiaca menor o igual a 63.5
-
7/22/2019 3-Distribucion de Frecuencias.ppt
23/44
Ventajas y desventajas de las
medidas de posicin
La Media depende del valor exacto de cada observacin y estosvalores se pierden cuando los datos se agrupan, por lo que hayque estimarla.
La Mediana no tiene en cuenta la magnitud exacta de la mayorade las observaciones y por ello es que es menos eficaz que laMedia porque implica una prdida de informacin
La Mediana es mucho menos manejable que la Media para eltratamiento matemtico y se utiliza poco en las tcnicas
estadsticas complejas. La Mediana resulta til para el trabajo descriptivo.
La Moda no se toma muy en cuenta, por la variabilidad de susobservaciones.
-
7/22/2019 3-Distribucion de Frecuencias.ppt
24/44
Medidas de Tendencia Central condatos agrupados
Clculos y Aplicaciones
-
7/22/2019 3-Distribucion de Frecuencias.ppt
25/44
Caractersticas de las medidas de
posicin en datos agrupados
1.- Cuando los datos se agrupan, las observaciones
individuales pierden su identidad.
2.- En una distribucin de frecuencia, es posible
determinar el nmero de observaciones que caen
dentro de varios intervalos de clase, pero los valores
reales no se pueden determinar.
3.- Es por ello, que los valores obtenidos son
suposiciones y estos resultados son nicamente
aproximaciones a los valores reales.
-
7/22/2019 3-Distribucion de Frecuencias.ppt
26/44
Clculo de la Media en datos agrupados
Aqu se supone que todos los valores que caen dentro
de un intervalo de clase especfico se localizan en el
punto medio del intervalo.
El punto medio del intervalo se calcula, promediando
los limites inferior y superior del intervalo de clase.
( Li + Ls) / 2
Ejemplo: Si el Intervalo de Clase est entre 0 y 4;
(0+4) / 2= 2
El punto medio (Pm) ser 2
-
7/22/2019 3-Distribucion de Frecuencias.ppt
27/44
Clculo de la Media... cont
Obtenido el Punto medio (pm), se multiplica la
frecuencia (f) de cada intervalo por su Pm y
posteriormente, se realiza una sumatoria de
todos los productos obtenidos por Intervalo de
Clase (IC) y esa suma se divide entre la
sumatoria de las f obtenidas y esa ser laMedia ( ) de estos datos.
Vemoslo en un ejemplo:
-
7/22/2019 3-Distribucion de Frecuencias.ppt
28/44
Ejemplo de Media en datos
agrupados
IC Pm fa Pm x fa
1-4Embarazos
2.5 10 25
5-8
Embarazos
6.5 6 39
9-12
Embarazos
10.5 3 31.5
13- 16
Embarazos
14.5 1 14.5
TOTAL 20 110
-
7/22/2019 3-Distribucion de Frecuencias.ppt
29/44
Ejemplo... final
= 110 / 20 = 5.5 ~ 6
Lo que significa que el promedio de
embarazos anteriores de ese grupo de
20 parturientas fue de 6
-
7/22/2019 3-Distribucion de Frecuencias.ppt
30/44
Clculo de la Mediana en datos
agrupados
Aqu se supone que los valores estn distribuidos
uniformemente a travs del intervalo.
Pasos a seguir para el clculo:
1.- n / 2, o sea, se divide la sumatoria de las
frecuencias absolutas entre 2. Este paso ubica el valor
de la mediana en el intervalo de clase (IC)
correspondiente
2.- Se procede a la sustraccin del Ls-Li del IC.
3.- Se aplica entonces la siguiente frmula:
-
7/22/2019 3-Distribucion de Frecuencias.ppt
31/44
Frmula para el clculo de la mediana en
datos agrupados
Me = Li + (n/2)Fa X c
FiDonde: n =es la sumatoria de las frecuencias absolutas
Me =Mediana
Li =Lmite inferior real de la clase donde esta la Me
Fi =Frecuencia absoluta de la clase donde est la Me
Fa = Frecuencia acumulada de la clase anterior a la
clase donde est la Me
C = la diferencia del LsLi del IC donde est la Me
-
7/22/2019 3-Distribucion de Frecuencias.ppt
32/44
Ejemplo del clculo de la Me para
datos agrupados
Utilicemos el de las 20 parturientas, anteriormente citado.
N = 20 ; n/2 = 10, lo que quiere decir que la Me est en el
intervalo 1-4 embarazos Aplicando la frmula:
1 + [(100) / 10] * 3 = 1+ (1) (3) = 4
Me = 4
Esto nos recuerda que menos del 50% de lasparturientas tuvieron 4 embarazos anteriores y
mas del 50% tuvieron mas de esa cifra.
-
7/22/2019 3-Distribucion de Frecuencias.ppt
33/44
Aspecto importante a tener en cuenta con el uso devariables continuas en datos agrupados
Recordar que en el caso de las V.C, los
intervalos de clase tienen valores reales y
valores indicados.
Hay que definir antes de efectuar los clculos,
con cual de estos valores vamos a trabajar.
Esto es aplicable para cualquier medida deposicin que se quiera calcular.
-
7/22/2019 3-Distribucion de Frecuencias.ppt
34/44
Calculando la moda en datos agrupados
La Moda (Mo), pierde su definicin, al ser
aplicada a datos agrupados, donde se aplica
entonces el concepto de Clase Modal, o sea,
aquella clase donde se concentra la mayor
densidad de frecuencias por unidad de
intervalo y es por eso que se dice que en estoscasos la Mo se estima.
-
7/22/2019 3-Distribucion de Frecuencias.ppt
35/44
Frmula de clculo de la Mo
Mo = Li + [ d1/ ( d1+ d2)] * C, siendo
Mo = ModaLi = Lmite inferior de la clase modal (C.M)
d1= diferencia entre la f de la C.M y la f de la
clase anterior.
d2= diferencia entre la f de la C.M y la f de la
clase posterior
C = LsLi del intervalo de la C.M
-
7/22/2019 3-Distribucion de Frecuencias.ppt
36/44
Ejemplo del clculo de la Mo
Tomemos una distribucin de resultados de Papanicolau
Positivo en 40 mujeres de 30 a 75 aos.
Grupos de Edades No. Mujeres (f)
29.5- 34.5 1
34.5- 39.5 3
39.5- 44.5 8
44.5- 49.5 9
49.5- 54.5 7
54.5- 59.5 4
59.5- 64.5 3
64.5- 69.5 3
69.5- 74.5 2
TOTAL 40
-
7/22/2019 3-Distribucion de Frecuencias.ppt
37/44
Aplicando la frmula para el clculo de
la Moda
Clase Modal (C.M)= 44.549.5
Li = 44.5D1= 9-8 = 1
D2= 9-7 = 2
C = 49.5-44.5= 5
Entonces : 44.5 + [(1/ 3) * 5] = 44.5+1.67
Mo = 46.17
-
7/22/2019 3-Distribucion de Frecuencias.ppt
38/44
Otras Medidas de Posicin
Los Percentiles y
Cuartiles
-
7/22/2019 3-Distribucion de Frecuencias.ppt
39/44
Cuartiles y Percentiles
Los cuartiles son valores que dividen el conjunto de
una variable en cuatro partes:
Q1= toma en cuenta el primer cuarto
Q2= es la mediana
Q3= toma en cuenta las partes
Q4= toma todo el conjunto. Ese mismo conjunto puede dividirse en deciles,
quintiles y percentiles ( 5, 10 y 100 unidades,
respectivamente)
-
7/22/2019 3-Distribucion de Frecuencias.ppt
40/44
Usos de los percentiles
Los percentiles se utilizan como parmetros de
ubicacin y solo se calculan para grandes conjuntos
de datos. Ejemplo: los grandes estudios decrecimiento y desarrollo, donde se buscan construir
parmetros para una poblacin de sujetos
determinada, ubican a travs de la edad, sexo, peso y
talla, los percentiles adecuados en los que debe crecery desarrollarse saludablemente una persona. (Ver
tablas de crecimiento y desarrollo del pas).
-
7/22/2019 3-Distribucion de Frecuencias.ppt
41/44
Clculo de los percentiles
En un conjunto de datos agrupados, para ubicar unpercentil, se usa :
Pk = ( k/ 100)* nPor ejemplo: Si queremos ubicar el P72 en un conjunto de 40elementos:
P72= ( 72 / 100) * 40 = 28,8
lo que significa que el septuagsimo segundopercentil est ubicado en la medida # 28,8.Analizando las fac de los intervalos de clases del
conjunto agrupado, ubicamos de inmediato dondeesta ubicada esta cifra (28,8)
-
7/22/2019 3-Distribucion de Frecuencias.ppt
42/44
Calculando los perc.....cont
Tomemos la distribucin de resultados de Papanicolau
Positivo en 40 mujeres de 30 a 75 aos.
Grupos de Edades No. Mujeres (f) fac
29.5- 34.5 1 1
34.6- 39.5 3 4
39.6- 44.5 8 12
44.6- 49.5 9 21
49.6- 54.5 7 2854.6- 59.5 4 32
59.6- 64.5 3 35
64.6- 69.5 3 38
69.6- 74.5 2 40
TOTAL 40
-
7/22/2019 3-Distribucion de Frecuencias.ppt
43/44
Aplicando la frmula para perc...
Pk= Li + [ (k/100)*n]fa* c
fiDonde: Li = lmite inferior de la clase donde est el Pkfa = frecuencia acumulada de la clase anterior
fi = frecuencia absoluta de la clase donde esta Pk
C = la diferencia del intervalo de clase donde est Pk
-
7/22/2019 3-Distribucion de Frecuencias.ppt
44/44
Sustituyendo en la frmula
P72= 54.5 + ( 28.8-28) * 5
4P72= 54.5 + 1.0 = 55.5
Lo que significa que un 72 % de las mujeres
positivas al Papanicolau tienen edades
inferiores a los 55.5 aos y un 28% sonpositivas por encima de esa edad.