3-Distribucioìn de Frecuencias.ppt

download 3-Distribucioìn de Frecuencias.ppt

of 44

Transcript of 3-Distribucioìn de Frecuencias.ppt

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    1/44

    Distribucin de FrecuenciasObjetivos a identificar

    Frecuencias absolutas

    Frecuencias relativas

    Frecuencia acumulada. Tablas.

    Medidas de Tendencia Central.

    Histogramas y polgonos. Grficos

    Ejercicios y Aplicaciones.

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    2/44

    Objetivos a identificar:

    Conocer la definicin de frecuencias y sus tipos.

    Aplicacin de las frecuencias

    Conocer la distribucin de frecuencias

    Aprender a ubicar los intervalos de clase y su utilidad.

    Medidas de tendencia central en datos agrupados.

    Conocer los percentiles y cuartiles. Aplicaciones.

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    3/44

    Resumiendo los datos

    Tanto las variables cualitativascomo lascuantitativas,originan observaciones, lascuales se conocen como: series cualitativasoseries cuantitativas.

    Mientras que los datos que originan estasseries, (vectores o conjuntos de datos) sonpocos, basta solo ordenarlos para saber elvalor mayor y menor, la existencia deconcentraciones alrededor de algunos valores

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    4/44

    Tipos de Distribucin

    Por ejemplo una distribucin simple sera:

    Provincias de nacimiento de 10 ticos:(atendiendo al cdigo de la provincia)

    1,2,3,4,5,6,7,7,7,7

    Esta es una forma ordenada de expresar esa

    distribucin

    No obstante, el problema se crea cuando elconjunto de datos es muy voluminoso.

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    5/44

    Concepto de Distribucin de Frecuencias

    La Distribucin de Frecuencias es un conjunto de

    elementos ordenados, resumidos o distribuidos en las

    diferentes categoras de una serie de datos

    determinada.

    El nmero que aparece resumiendo cada categora es

    conocido como la frecuencia y cada categoratiene

    una frecuencia, denominada absoluta.

    La suma de estas frecuencias absolutas, nos da el

    nmero de unidades observadas en todas las

    categoras

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    6/44

    Caractersticas de las Clases, para

    datos agrupados

    Las Clases o Intervalos o Categoras seleccionadastienen que ser exhaustivas y mutuamente excluyentes.

    Eso significa que ningn elemento del conjunto a lahora de clasificar, puede encontrar ambigedad en ladefinicin del intervalo. Ejemplo:

    Un intervalo de la variable No. de hijos, pudiera ser:

    1-4 hijos: Se entiende que en ese intervalo clasificantodos los encuestados que tienen 1,2,3, y hasta 4hijos. Los que no tienen hijos, no estn aqu, al igual siel nmero de hijos es mayor a 4.

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    7/44

    Ejemplo de una distribucin de

    frecuencias

    Estudiamos el nmero de embarazos

    anteriores de 20 parturientas (discreta) en elHospital de la Mujer Adolfo Carit en abril de

    2012.

    El vector obtenido de la revisin realizada de

    estos 20 elementos es como sigue en la tablapreparada para el efecto

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    8/44

    Ejemplo de distrib..... cont

    Tabla de Recoleccin de Datos sobre E.ANo E.A No. E.A No E.A No E.A

    1 4 6 8 11 5 16 3

    2 6 7 4 12 3 17 3

    3 9 8 11 13 4 18 14

    4 4 9 7 14 7 19 3

    5 9 10 8 15 1 20 3

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    9/44

    Ordenando los datos

    Serie sin Ordenar:

    4, 6, 9, 4, 9, 8, 4, 11, 7, 8, 5, 3, 4, 7, 1, 3, 3, 14, 3, 3

    Serie Ordenada:

    1, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 11, 14

    Ahora se debe seleccionar el nmero de intervalos de clases

    que vamos a tener . Nunca deben ser menores de 4 y nomayores de 10, pues no tiene razn el resumen hecho.

    Para ello tambin calculamos la amplitud de la serie (14-1) y

    la dividimos entre el nmero de clases que deseamos (4)

    14-1 / 4 = 3.25 ~ 4

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    10/44

    Resultados de la tabla de distribucin

    con f recuenc ias abso lutas

    Distribucin de Embarazos anteriores

    No. Embarazos Anteriores No. Madres

    1-4 embarazos 10

    5-8 embarazos 6

    9-12 embarazos 3

    13- 16 embarazos 1

    TOTAL 20

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    11/44

    Calculemos la Frecuenc ia Relativa

    Para ello tomamos la frecuencia de la clase y

    la dividimos entre el total de elementosobservados. El resultado es un %. Ejemplo:

    Para el intervalo de 1-4 embarazos, donde la

    frecuencia absoluta es =10, la Frecuencia

    relativa es: (10 / 20) x 100 = 50 % As tendremos en todo el cuadro anterior:

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    12/44

    Cuadro de frecuencias absolutasy relat ivas

    Frecuencias absolutas y relativas

    No. Embarazos

    Anteriores

    No. Madres

    (f)

    Porcentaje

    (%) (fr)

    1-4 embarazos 10 50

    5-8 embarazos 6 309-12 embarazos 3 15

    13- 16 embarazos 1 5

    TOTAL 20 100

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    13/44

    Calculemos la Frecuencia

    Acumulada

    A medida que vamos analizando cada

    intervalo de clase, con su frecuencia absoluta,esta se va sumando a la frecuencia anterior.

    Ayuda a conocer en donde estn concentrados

    los valores en los intervalos.

    Vemoslo, en este ejemplo

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    14/44

    Ejemplo de Frecuencia absoluta acumulada

    (FAA) y Frecuencia Relativa Acumulada (FRA)

    Distribucin de frecuencias (fa), (faa),(fr),(fra) del ejemplo anterior

    IC fa Fr (%) faa fra1-4

    embarazos

    10 50 10 50

    5-8

    embarazos

    6 30 16 80

    9-12embarazos

    3 15 19 95

    13- 16

    embarazos

    1 5 20 100

    TOTAL 20 100

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    15/44

    Caractersticas de las distribuciones de

    variables discretas y continuas

    1.- Las distribuciones de variables discretasson fcilesde realizar, mientras que las de variables cont inuas

    deben tener en cuenta los limites reales indicados desus intervalos de clase. Ejemplo: ( intervalo de clasede peso)

    Lmite indicado Lmite Real

    30-34 kg 29.534,5 Kg

    2.- Todos los intervalos de clase deben estar cerrados.Las clases abiertas deben evitarse, pues los clculosde datos agrupados en distribuciones, pueden ser

    inexactos

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    16/44

    Medidas de Tendencia Central ode Posicin

    La Media, La Moda y La

    Mediana, en conjuntos

    de datos no agrupados

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    17/44

    Principal funcin

    El propsito de estas medidas es el de tratarde resumir en un solo nmero, la posicin o

    localizacin de la distribucin.

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    18/44

    La Media o Promedio

    La media o el promedio, es el resultado de sumar todos losvalores que toma la variable en el conjunto y dividir el nmero deelementos de ese propio conjunto entre esa cantidad sumadaanteriormente.

    Por definicin, cada conjunto tiene un solo promedio.

    Ejemplo:

    X= variable en estudio

    N= nmero de elementos en el conjunto

    = promedio de la variable en el conjunto total

    = simbolo de sumatoria

    Xi= X1 + X2+ X3.... XN= todos los valores de la variable X en losN elementos del conjunto.

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    19/44

    Ejemplo de la media

    Siendo el conjunto de estudio la frecuencia

    cardiaca (pulsaciones por minuto) de 6estudiantes de la clase:

    55,64,53,79,64,68

    Aplicando la frmula:

    55+64+53+79+64+68 = = 63.8~ 64 pul/min

    6

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    20/44

    La Moda

    Esta medida se asocia con el valor mas comn, mstpico que ocurre mas frecuentemente en un conjuntos

    de datos. Es el valor de mayor frecuencia. Ejemplo:1, 3, 3, 3, 4, 4, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 11, 14

    En este caso, la Moda (Mo)= 4

    Puede suceder que no est definida la Moda en un

    conjunto o que existan varias Modas (igual nmero defrecuencias ), para lo que la utilidad de la Moda esreducida.

    La Moda tambin es til con las variables cualitativas(el diagnstico mas frecuente en emergencias en el

    da de hoy fue la EDA)

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    21/44

    La Mediana

    Es el valor central de una serie de datos ordenados y su

    ubicacin equidista de los limites mayor y menor del conjunto. Ej.:

    55,63,53,79,64,68,78 ( N=7)Ordenando el conjunto:

    53, 55, 63, 64, 68, 78, 79

    Me = N +1/2

    = 7 + 1/ 2= 8/2

    = 4

    (lo que quiere expresar que en este caso, el 4to. Elemento de la

    serie ordenada, que en este caso es 64

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    22/44

    La Mediana... cont

    En el caso de que la serie sea par:

    55,63,53,79,64,68 donde N = 6

    Se ordena tambin: 53, 55, 63,64,68,79

    Se calcula promediando los dos valores centrales:

    Me = 63+64/ 2

    = 63.5

    lo que significa que el 50% de los elementos estudiadostienen una frecuencia cardiaca menor o igual a 63.5

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    23/44

    Ventajas y desventajas de las

    medidas de posicin

    La Media depende del valor exacto de cada observacin y estosvalores se pierden cuando los datos se agrupan, por lo que hayque estimarla.

    La Mediana no tiene en cuenta la magnitud exacta de la mayorade las observaciones y por ello es que es menos eficaz que laMedia porque implica una prdida de informacin

    La Mediana es mucho menos manejable que la Media para eltratamiento matemtico y se utiliza poco en las tcnicas

    estadsticas complejas. La Mediana resulta til para el trabajo descriptivo.

    La Moda no se toma muy en cuenta, por la variabilidad de susobservaciones.

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    24/44

    Medidas de Tendencia Central condatos agrupados

    Clculos y Aplicaciones

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    25/44

    Caractersticas de las medidas de

    posicin en datos agrupados

    1.- Cuando los datos se agrupan, las observaciones

    individuales pierden su identidad.

    2.- En una distribucin de frecuencia, es posible

    determinar el nmero de observaciones que caen

    dentro de varios intervalos de clase, pero los valores

    reales no se pueden determinar.

    3.- Es por ello, que los valores obtenidos son

    suposiciones y estos resultados son nicamente

    aproximaciones a los valores reales.

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    26/44

    Clculo de la Media en datos agrupados

    Aqu se supone que todos los valores que caen dentro

    de un intervalo de clase especfico se localizan en el

    punto medio del intervalo.

    El punto medio del intervalo se calcula, promediando

    los limites inferior y superior del intervalo de clase.

    ( Li + Ls) / 2

    Ejemplo: Si el Intervalo de Clase est entre 0 y 4;

    (0+4) / 2= 2

    El punto medio (Pm) ser 2

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    27/44

    Clculo de la Media... cont

    Obtenido el Punto medio (pm), se multiplica la

    frecuencia (f) de cada intervalo por su Pm y

    posteriormente, se realiza una sumatoria de

    todos los productos obtenidos por Intervalo de

    Clase (IC) y esa suma se divide entre la

    sumatoria de las f obtenidas y esa ser laMedia ( ) de estos datos.

    Vemoslo en un ejemplo:

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    28/44

    Ejemplo de Media en datos

    agrupados

    IC Pm fa Pm x fa

    1-4Embarazos

    2.5 10 25

    5-8

    Embarazos

    6.5 6 39

    9-12

    Embarazos

    10.5 3 31.5

    13- 16

    Embarazos

    14.5 1 14.5

    TOTAL 20 110

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    29/44

    Ejemplo... final

    = 110 / 20 = 5.5 ~ 6

    Lo que significa que el promedio de

    embarazos anteriores de ese grupo de

    20 parturientas fue de 6

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    30/44

    Clculo de la Mediana en datos

    agrupados

    Aqu se supone que los valores estn distribuidos

    uniformemente a travs del intervalo.

    Pasos a seguir para el clculo:

    1.- n / 2, o sea, se divide la sumatoria de las

    frecuencias absolutas entre 2. Este paso ubica el valor

    de la mediana en el intervalo de clase (IC)

    correspondiente

    2.- Se procede a la sustraccin del Ls-Li del IC.

    3.- Se aplica entonces la siguiente frmula:

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    31/44

    Frmula para el clculo de la mediana en

    datos agrupados

    Me = Li + (n/2)Fa X c

    FiDonde: n =es la sumatoria de las frecuencias absolutas

    Me =Mediana

    Li =Lmite inferior real de la clase donde esta la Me

    Fi =Frecuencia absoluta de la clase donde est la Me

    Fa = Frecuencia acumulada de la clase anterior a la

    clase donde est la Me

    C = la diferencia del LsLi del IC donde est la Me

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    32/44

    Ejemplo del clculo de la Me para

    datos agrupados

    Utilicemos el de las 20 parturientas, anteriormente citado.

    N = 20 ; n/2 = 10, lo que quiere decir que la Me est en el

    intervalo 1-4 embarazos Aplicando la frmula:

    1 + [(100) / 10] * 3 = 1+ (1) (3) = 4

    Me = 4

    Esto nos recuerda que menos del 50% de lasparturientas tuvieron 4 embarazos anteriores y

    mas del 50% tuvieron mas de esa cifra.

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    33/44

    Aspecto importante a tener en cuenta con el uso devariables continuas en datos agrupados

    Recordar que en el caso de las V.C, los

    intervalos de clase tienen valores reales y

    valores indicados.

    Hay que definir antes de efectuar los clculos,

    con cual de estos valores vamos a trabajar.

    Esto es aplicable para cualquier medida deposicin que se quiera calcular.

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    34/44

    Calculando la moda en datos agrupados

    La Moda (Mo), pierde su definicin, al ser

    aplicada a datos agrupados, donde se aplica

    entonces el concepto de Clase Modal, o sea,

    aquella clase donde se concentra la mayor

    densidad de frecuencias por unidad de

    intervalo y es por eso que se dice que en estoscasos la Mo se estima.

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    35/44

    Frmula de clculo de la Mo

    Mo = Li + [ d1/ ( d1+ d2)] * C, siendo

    Mo = ModaLi = Lmite inferior de la clase modal (C.M)

    d1= diferencia entre la f de la C.M y la f de la

    clase anterior.

    d2= diferencia entre la f de la C.M y la f de la

    clase posterior

    C = LsLi del intervalo de la C.M

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    36/44

    Ejemplo del clculo de la Mo

    Tomemos una distribucin de resultados de Papanicolau

    Positivo en 40 mujeres de 30 a 75 aos.

    Grupos de Edades No. Mujeres (f)

    29.5- 34.5 1

    34.5- 39.5 3

    39.5- 44.5 8

    44.5- 49.5 9

    49.5- 54.5 7

    54.5- 59.5 4

    59.5- 64.5 3

    64.5- 69.5 3

    69.5- 74.5 2

    TOTAL 40

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    37/44

    Aplicando la frmula para el clculo de

    la Moda

    Clase Modal (C.M)= 44.549.5

    Li = 44.5D1= 9-8 = 1

    D2= 9-7 = 2

    C = 49.5-44.5= 5

    Entonces : 44.5 + [(1/ 3) * 5] = 44.5+1.67

    Mo = 46.17

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    38/44

    Otras Medidas de Posicin

    Los Percentiles y

    Cuartiles

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    39/44

    Cuartiles y Percentiles

    Los cuartiles son valores que dividen el conjunto de

    una variable en cuatro partes:

    Q1= toma en cuenta el primer cuarto

    Q2= es la mediana

    Q3= toma en cuenta las partes

    Q4= toma todo el conjunto. Ese mismo conjunto puede dividirse en deciles,

    quintiles y percentiles ( 5, 10 y 100 unidades,

    respectivamente)

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    40/44

    Usos de los percentiles

    Los percentiles se utilizan como parmetros de

    ubicacin y solo se calculan para grandes conjuntos

    de datos. Ejemplo: los grandes estudios decrecimiento y desarrollo, donde se buscan construir

    parmetros para una poblacin de sujetos

    determinada, ubican a travs de la edad, sexo, peso y

    talla, los percentiles adecuados en los que debe crecery desarrollarse saludablemente una persona. (Ver

    tablas de crecimiento y desarrollo del pas).

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    41/44

    Clculo de los percentiles

    En un conjunto de datos agrupados, para ubicar unpercentil, se usa :

    Pk = ( k/ 100)* nPor ejemplo: Si queremos ubicar el P72 en un conjunto de 40elementos:

    P72= ( 72 / 100) * 40 = 28,8

    lo que significa que el septuagsimo segundopercentil est ubicado en la medida # 28,8.Analizando las fac de los intervalos de clases del

    conjunto agrupado, ubicamos de inmediato dondeesta ubicada esta cifra (28,8)

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    42/44

    Calculando los perc.....cont

    Tomemos la distribucin de resultados de Papanicolau

    Positivo en 40 mujeres de 30 a 75 aos.

    Grupos de Edades No. Mujeres (f) fac

    29.5- 34.5 1 1

    34.6- 39.5 3 4

    39.6- 44.5 8 12

    44.6- 49.5 9 21

    49.6- 54.5 7 2854.6- 59.5 4 32

    59.6- 64.5 3 35

    64.6- 69.5 3 38

    69.6- 74.5 2 40

    TOTAL 40

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    43/44

    Aplicando la frmula para perc...

    Pk= Li + [ (k/100)*n]fa* c

    fiDonde: Li = lmite inferior de la clase donde est el Pkfa = frecuencia acumulada de la clase anterior

    fi = frecuencia absoluta de la clase donde esta Pk

    C = la diferencia del intervalo de clase donde est Pk

  • 7/22/2019 3-Distribucion de Frecuencias.ppt

    44/44

    Sustituyendo en la frmula

    P72= 54.5 + ( 28.8-28) * 5

    4P72= 54.5 + 1.0 = 55.5

    Lo que significa que un 72 % de las mujeres

    positivas al Papanicolau tienen edades

    inferiores a los 55.5 aos y un 28% sonpositivas por encima de esa edad.