3_ Clase. Medidas de Tendencia Central y Posición (2)

33
MEDIDAS EN LA ESTADÍSTICA DESCRIPTIVA Profesor. Wilver Rodríguez

description

clase de bioestadistica

Transcript of 3_ Clase. Medidas de Tendencia Central y Posición (2)

  • MEDIDAS EN LA ESTADSTICA DESCRIPTIVAProfesor.Wilver Rodrguez

  • MEDIDAS DE TENDENCIA CENTRALLas medidas de tendencia central nos permiten resumir el conjunto de observaciones en un valor, que describe a la caracterstica de estudio de la poblacin.Las tres medidas de tendencia central de uso ms frecuente son:La mediaLa modaLa mediana

  • Medidas de tendencia central para datos no agrupados _Media Aritmtica: XEs el valor representativo del conjunto de datos que se esta estudiando y caracteriza a toda una distribucin.Se define como: n _ xi /n X = i=1 Ejemplo: Los siguientes datos son das hospitalarios obtenidos de 5 pacientes Xi 10, 13, 15, 12 y 8 dasEl nmero promedio de das de hospitalizacin - 58 X = 10 + 13 + 15 + 12 + 8 = __ = 11.6 5 5Interpretacin: El nmero das promedio de hospitalizacin en los pacientes es de 12 das aproximadamente.

  • PROMEDIO ARITMETICOPONDERADO.Se define como suma del producto de cada dato por el peso, importancia o repeticin, dividido entre la suma de todos los pesos, importancia o repeticin.

    n xi ni _ i=1 X = ------------------- n ni i=1

  • Ejemplo:En un estudio se observo en nmero de das de hospitalizacin de los pacientes por servicio en un hospital. Los resultados son los siguientes: _ _ Servicio. Xini xi ni A 126012 x 60 = 7 20B 8308 x 30 = 240C 4104 x 10 = 40 ni 100 xini = 1000Luego:

    - xini 1000 X = _______ ________ = 10 ni 100

    Interpretacin: El nmero de das promedio de hospitalizacin de los pacientes por servicio es aproximadamente de 10 das.

  • PROPIEDADES DE LA MEDIA ARITMETICA.1. Es nica, puede ser un valor positivo, cero o un valor negativo.2. Si a los valores que estudiamos le sumamos o restamos una constante, el valor de la nueva media quedara sera igual a la media aritmtica de los datos originales ms o menos la constante que se ha agregado.3. Si a los valores que estamos estudiando lo multiplicamos por una constante, la nueva media aritmtica sera igual a la media aritmtica original multiplicada por la constante.4. La suma de las desviaciones de los datos con respecto a la media es cero, es decir n _ ( xi - X) = 0i=1

  • DESVENTAJA DE LA MEDIA ARITMETICA.La desventaja mas relevante de la media aritmtica es de que esta afectada por los valores extremos, ya que para el calculo se incluye todos los datos.

  • LA MEDIANA (Me)La mediana es un valor que divide a la distribucin ordenada (en forma ascendente o descendente) en dos grupos iguales, es decir a cada grupo le corresponde el 50% de los datos.

    50% | 50%V. min. Me. V. mx.Para calcular el valor de la mediana de los datos x1, x2 ... Xn se tendr en cuenta el siguiente procedimiento:

    1. Se ordenan los datos en forma ascendente o descendente.

  • 2. Si n es impar, el valor de la mediana es el valor del centro, es decir:Me = X (n+1) / 2

    donde: (n+1) /2 es la posicin de la mediana.3. Si n es par , el valor de la mediana ser el promedio entre X(n/2) y X(n/2)+1 ; es decir: X(n/2) + X(n/2)+1Me = ____________ 2Esto quiere decir, que el valor de la mediana se encuentra entre los valores cuya posicin son n/2 y (n/2) + 1 .

  • Ejemplo:Hallar la mediana de los siguientes datos, que indica el nmero de das de hospitalizacin de 5 pacientes: 12, 15, 13, 4, 10 .Ordenando la serie se tiene : 4, 10, 12, 13, 15 Como el nmero de datos es impar (n=5), se tiene que la posicin de la mediana es (n+1)/2=(5+1)/2 =3, por consiguiente, el valor de la mediana est ubicada en la posicin 3, es decir Me= x3 = 12 das.Interpretacin: El 50% de los pacientes tienen 12 das de hospitalizacin o menos y el 50% restante tiene por encima de 12 das de hospitalizacin.

  • Ejemplo:Calcular la medina de los siguientes pesos (en Kg) de 6 nios: 35, 37, 40, 31, 27, 39

    Ordenando los pesos en forma ascendente:Peso: 27, 31, 35, 37, 39, 40

    En este caso n es un nmero par por consiguiente la mediana se localizara entre la posicin X n/2 y X (n/2+1) = X3 y X4

    n/2 = 6/2 = 3(n/2) + 1 = 3 + 1 = 4

    Es decir entre los valores 35 y 37

    Por tanto el valor de la mediana es:Me = 35 + 37 = 72 = 36 2 2 Interpretacin: El 50% de los nios tienen un pesos igual o inferior a 36 Kg. Y el 50% restante tendrn una peso por encima de los 36 Kg.

  • PROPIEDADES DE LA MEDIANA.1. Es nica , existe solamente una mediana para un conjunto de datos.2. Los valores extremos no tienen efectos importantes sobre la mediana.3. Se aplica tambin a variables que pertenecen a la escala ordinal.

  • La Moda (Mo)Se utiliza mayormente cuando se esta interesado en la observacin mas frecuente.

    La Moda es la observacin que mayormente se repite (o es la observacin que posee la mayor frecuencia).Ejemplo: Hallar la moda en los siguientes datos:

    2,5,7,2,8,2,2,1,2,4,2,2 La Mo = 2

    1,8,6,4,2,4,3,2,1,5 Mo = 1 Mo = 2 Mo = 4

    1,7,9,3,8,5,6 No existe moda

  • PROPIEDADES DE LA MODA1. Si todos los valores son diferentes, no hay moda.2. En una distribucin puede existir dos o ms modas.

  • MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS. _MEDIA ARITMETICA. ( X ).Cuando los datos estn agrupados en intervalos, para hallar la media se utiliza la siguiente frmula: K fi Xi i=1 _ -----------------------

    X = K fi i=1

    donde:x1, X2 ... XK : Son marcas de clase.f1, f2 ... fK : frecuencias absolutas que corresponden a las marcas de clase o intervalos.K : nmero de clase o intervalos.

  • Ejemplos:Los siguientes datos son los pesor(Kg) en una muestra de pacientes que pasaron consulta en un hospital.

    _X = 3190 / 50 = 63.8 64 kilos.

    Interpretacin: El peso promedio de los pacientes es aproximadamente de 64 kilos.

    PesoXifiXi*fi40-5045731550-60551055060-706520130070-8075860080-90855425TOTAL503190

  • E. MEDIANA (Me)Para calcular la mediana en una tabla de distribucin se usa la siguiente frmula: (n/2 - F i-1 ) ME= Li + _____________ x C f MeDonde:n / 2 : posicin de la MeL i : Lmite real inferior de la clase que contiene la Me.n: nmero total de observaciones.Fi-1: Frecuencia absoluta acumulada de la que contiene a la mediana (clase mediana).fMe: frecuencia absoluta de la clase que contiene a la Me.C: Amplitud de la clase que contiene a la mediana.* Clase mediana: es la primera clase cuya frecuencia absoluta acumulada excede a n/2

  • Ejemplo:Calcular la Me de la siguiente distribucin de frecuencias:

    Peso(Kg)XifiFi40-50457750-6055101760-7065203770-807584580-9085550TOTAL50

  • Procedimiento:1. Calcular las frecuencias acumuladas Fi 2. Calcular n/2 = 50/2 = 25 sirve para detectar la clase mediana.3. Clase mediana: clase cuyo Fi excede a 25 (60 - 70)4. De la clase mediana se obtiene:L i = 60 Fi - 1 = 17 C =10 fMe = 20Los valores encontrados en (2), (3) y (4) lo reemplazamos en la formula y se tiene:Me = 60 + 25 - 17 x 10 20Me = 64Interpretacin: El 50% de los pacientes tienen un peso igual o inferior a 64 kilos y el otro 50% tendr un peso superior a 64 kilos.

  • F. MODA (Mo)En una tabla de distribucin de frecuencias es aproximadamente la marca de clase o punto medio de la clase que tiene la mayor frecuencia absoluta simple.Aptitud fi40 - 50750 - 601060 - 702070 - 80880 - 905total50La moda estar ubicado en el intervalo:Aptitud fi60 - 7020

  • Por lo tanto la marca de clase ser 60 + 70 _______ 2Luego la Mo = 65

    Interpretacin: El peso ms frecuente en los pacientes es aproximadamente de 65 kilos.

  • LOS CUANTILES.Son aquellos que dividen a la distribucin en cuatro, diez o cien partes iguales.Cuartiles.Deciles.Percentiles.

  • Cuartiles (Q).Son aquellos que dividen a la distribucin en cuatro partes iguales, en donde cada uno de ellos incluye el 25% de las observaciones. 25%_I._25%__I.__25%_ I.__25%__ Q1 Q2 Q3 MeLas frmulas para calcular los cuartiles son parecidas a la de la mediana, as:Q1 = L1 + 1n/4 - Fi-1 x C fQ1Q2 = Me

    Q3 = Li + 3n/4 - F i-1 x C fQ3Donde:Li = Limite real inferior de la clase que contiene el Q1 Q3 .Fi-1= frecuencia absoluta acumulada de la clase anterior a la que contiene a Q1 Q3fQ1 fQ3 = frecuencia absoluta de la clase que contiene el Q1 Q3C= ancho de la clase que contiene el Q1 Q3

  • Ejemplo:Calcular el Q1 de la siguiente distribucin de frecuencias:

    Peso(Kg)fiFi40-507750-60101760-70203770-8084580-90550TOTAL50

  • Q1.Primero se calcula 1n/4; es decir 1x50/4 = 12.5

    Luego se observa que frecuencia absoluta acumulada contiene a 12.5 La frecuencia absoluta acumulada que contiene a 12.5 es 17

    Entonces el intervalo que contiene al Q1 es: 50 - 60

    De esta informacin se tiene qu:

    Li = 50 Fi-1 = 7 fQ1 = 10 C = 10

    Reemplazando en la frmula se

    Q1 = L1 + 1n/4 - Fi-1 x C fQ1Q1 = 50 + 12.5 - 7 = 55.5 10 x 10Interpretacin: El 25% de los pacientes tienen un peso igual o inferior a 55.5 kilos y el 75% tiene un peso superior a 55.5 kilos.

  • DECILES (D)Son aquellos que dividen a la distribucin en diez partes iguales en donde cada uno de ello incluye el 10% de las observaciones_10%_I._10%_I.10%_I._10%_I._10%_I._10%_I._10%_I._10%_I._10%_I._10%_ D1 D2 D3 D4 D5 D6 D7 D8 D9Q2MeLas formulas son tambin similares a las de Q1 , Q3 As:

    D1 = Li +1n/10 - F i-1 x C fD1D5 = MeD7 = Li + (7n/10 - F i-1 ) x C fD7Donde:Li = Limite real inferior de la clase que contiene el D1 D7 .Fi-1= frecuencia absoluta acumulada de la clase anterior a la que contiene a D1 Q7fD1 fD7 = frecuencia absoluta de la clase que contiene el D1 D7C= ancho de la clase que contiene el D1 D7

  • Ejemplo:Calcular el D4 de la siguiente distribucin de frecuencias:

    Peso(Kg)fiFi40-507750-60101760-70203770-8084580-90550TOTAL50

  • D4.Primero se calcula 4n/10 ; es decir 4x50/10 = 20

    Luego se observa que frecuencia absoluta acumulada contiene a 20 La frecuencia absoluta acumulada que contiene a 20 es 37

    Entonces el intervalo que contiene al D4 es: 60 - 70

    De esta informacin se tiene qu:

    Li = 60 Fi-1 =17 fQ1 = 20 C = 10

    Reemplazando en la frmula se

    D4 = L1 + 4n/10 - Fi-1 x C fQ1 D4 = 60 + 20 - 17 = 61.5 20 x 10Interpretacin: El 40% de los pacientes tienen un peso igual o inferior a 61.5 kilos y el 60% tiene un peso superior a 61.5 kilos.

  • PERCENTILES (P)Son aquellos que dividen a la distribucin en cien partes iguales en donde cada uno de ello incluye el 1% de las observaciones_1%_I. 1%_I. 1%_I._1%_I._1%_. .........._1%_I_1%_I._1%_I._1%_I._1%_ P1 P2 P3 P4 ........... P96 P97 P98 P99

    Las formulas son parecidas a los cuartiles y deciles, As:

    P10 = Li + 10n/100 - F i-1 x C fP10

    P60 = Li + 60n/100 - F i-1 x C fP60

    C= ancho de la clase que contiene el P10 P60

  • Ejemplo:Calcular el P10 de la siguiente distribucin de frecuencias:

    Peso(Kg)fiFi40-507750-60101760-70203770-8084580-90550TOTAL50

  • P10.Primero se calcula 10n/100 ; es decir 10x50/100 = 5

    Luego se observa que frecuencia absoluta acumulada contiene a 5 La frecuencia absoluta acumulada que contiene a 5 es 7

    Entonces el intervalo que contiene al P10 es: 40 - 50

    De esta informacin se tiene qu:

    Li = 40 Fi-1 =0 fQ1 = 7 C = 10

    Reemplazando en la frmula se

    P10 = Li + 10n/100 - Fi-1 x C fQ1 P10 = 40 + 5 - 0 x 10 = 47.14 47 7Interpretacin: El 10% de los pacientes tienen un peso igual o inferior a 47 kilos y el 90% tiene un peso superior a 47 kilos.

  • Ejercicio:Los siguientes datos son nmero de das de hospitalizacin en una muestra de pacientes que fueron intervenidos quirrgicamente en un hospital. Los resultados se presentan a continuacin: __________________________ N de DasfiFi __________________________5 - 750508 - 1010015011 - 13 2017014 - 16 1018017 - 19 5185 ___________________________ Total 185 ____________________________ Calcular e interpretar las tres medidas de tendencia central. Calcular e interpretar Q1, Q3, D3, D8. P20. P90