Tema 4. Medidas de Localización (9!02!2015)

2
Grupo 13 9/12/2015 Tema 4: Medidas de localización. Introducción: Las variables cuantitativas tienen dos características importantes: medidas de localización y medidas de dispersión. Las medidas de localización tienen localizada la variable a lo largo de la recta de los numeros reales entre mas, menos e infinito. MEDIDAS DE LOCALIZACIÓN Media aritmética: es la medida de localización más utilizada. Las variables se escriben con mayúsculas y los valores con minúscula. Recoge datos agrupados o desagregados. Se calcula sumando todos los valores y dividiendo entre ‘n’, y el resultado es el número intermedio. Media ponderada: se escribe en forma de proporción y analiza el peso de cada una de las observaciones. (el sumatorio de las frecuencias absolutas es igual a ‘n’) Media para datos agrupados: se escribe a partir de tablas de frecuencias, es preferible trabajar con datos individuales, ya que a partir de datos agrupados no tiene por qué dar el mismo valor, puesto que aquí consideramos la marca de clase. A partir de los datos agrupados se pueden calcular percentiles. Medias modificadas o recortadas: no está afectada por datos extremos, ya que para su cálculo es necesario prescindir del valor más alto, y del valor más bajo. Y con el resto de valores se hace la media aritmética. Igualmente podemos hacer la media 2 recortada quitando dos máximos y dos mínimos, y con el resto se hace la media aritmética. Media winsorizada: es un promedio, que en lugar de eliminar un número entero de observaciones, como lo hace la media recortada, los sustituye por el último valor que forma parte del cálculo, en cada extremo. Este índice es una medida de localización resistente tras el recorte de los posibles valores anómalos presentes en la distribución. Por ejemplo: Si tenemos los siguientes datos: 3, 4, 4, 5, 5, 6, 7, 8, 9, 11. En la media winsorizada, los datos 3 y 4 (los dos menores) y el 9 y 11 (los dos mayores) se sustituyen por 4 y 8 respectivamente. Es decir que los datos que quedarían serian los siguientes: 4, 4, 4, 5, 5, 6, 7, 8, 8, 8 y luego se calcula la media de los mismos. MEDIDAS DE DISPERSIÓN Permiten ver la distancia a la que está cada dato respecto a la media. Si un valor es menor que la media, la diferencia es negativa, y si es mayor, es positiva. Siempre tendremos dispersiones negativas o positivas. La suma de todas las diferencias será 0. Por lo que no

description

Comi

Transcript of Tema 4. Medidas de Localización (9!02!2015)

  • Grupo 13 9/12/2015 Tema 4: Medidas de localizacin. Introduccin: Las variables cuantitativas tienen dos caractersticas importantes: medidas de localizacin y medidas de dispersin. Las medidas de localizacin tienen localizada la variable a lo largo de la recta de los numeros reales entre mas, menos e infinito. MEDIDAS DE LOCALIZACIN

    Media aritmtica: es la medida de localizacin ms utilizada. Las variables se escriben con maysculas y los valores con minscula. Recoge datos agrupados o desagregados. Se calcula sumando todos los valores y dividiendo entre n, y el resultado es el nmero intermedio.

    Media ponderada: se escribe en forma de proporcin y analiza el peso de cada una de las observaciones. (el sumatorio de las frecuencias absolutas es igual a n)

    Media para datos agrupados: se escribe a partir de tablas de frecuencias, es preferible trabajar con datos individuales, ya que a partir de datos agrupados no tiene por qu dar el mismo valor, puesto que aqu consideramos la marca de clase.

    A partir de los datos agrupados se pueden calcular percentiles.

    Medias modificadas o recortadas: no est afectada por datos extremos, ya que para su clculo es necesario prescindir del valor ms alto, y del valor ms bajo. Y con el resto de valores se hace la media aritmtica. Igualmente podemos hacer la media 2 recortada quitando dos mximos y dos mnimos, y con el resto se hace la media aritmtica.

    Media winsorizada: es un promedio, que en lugar de eliminar un nmero entero de observaciones, como lo hace la media recortada, los sustituye por el ltimo valor que forma parte del clculo, en cada extremo. Este ndice es una medida de localizacin resistente tras el recorte de los posibles valores anmalos presentes en la distribucin. Por ejemplo: Si tenemos los siguientes datos: 3, 4, 4, 5, 5, 6, 7, 8, 9, 11. En la media winsorizada, los datos 3 y 4 (los dos menores) y el 9 y 11 (los dos mayores) se sustituyen por 4 y 8 respectivamente. Es decir que los datos que quedaran serian los siguientes: 4, 4, 4, 5, 5, 6, 7, 8, 8, 8 y luego se calcula la media de los mismos.

    MEDIDAS DE DISPERSIN Permiten ver la distancia a la que est cada dato respecto a la media. Si un valor es menor que la media, la diferencia es negativa, y si es mayor, es positiva. Siempre tendremos dispersiones negativas o positivas. La suma de todas las diferencias ser 0. Por lo que no

  • nos sirve entonces para hallar la dispersin, para ello precisamos de dos mtodos, que consisten en evitar los valores negativos, para que la suma sea distinta de 0:

    Desviacin media absoluta: (aunque no se utiliza). Usamos los valores absolutos.

    Varianza o desviacin cuadrtica media: Solucin para quitar el signo de las desviaciones al elevarlas al cuadrado. Esta medida tampoco es muy adecuada porque las unidades se elevaran al cuadrado. Ej: aos2

    Desviacin estndar o desviacin tpica: para solucionar el problema de las unidades, se hace la raz cuadrada de la varianza y as quitamos el cuadrado. Y por lo tanto, las unidades sern las mismas que tenga la variable.

    Tambin se pueden calcular medidas de dispersin para datos agrupados, aunque stas son aproximaciones. La diferencia entre medidas de localizacin tambin son medidas de dispersin. Ej: la diferencia entre la mediana y el percentil 25.

    Rango de la variable: diferencia entre el mximo y el mnimo. Est afectado por datos extremos.

    Rango intercuartlico: Diferencia entre cuartil 3 (perceptil 75) y del cuartil 1 (perceptil 25).

    Coeficiente de variacin (CV): mide la dispersin relativa (la dispersin absoluta se refiere a la desviacin tpica), se utiliza si queremos comparar la dispersin o desviacin de dos variables o dos distribuciones. Se trata de un estadstico que no tiene unidades de medidas. Ser mas homogneo el que tenga ms pequeo el CV. En medicina nos ayuda a la hora de elegir cual de los tratamientos es ms efectivo.

    ESTADSTICOS DE FORMA

    Coeficiente de asimetra: resta la moda y la media y divide por la desviacin estndar. Si el coeficiente de asimetra = 0, media, moda y mediana coinciden.

    Si el coeficiente de asimetra > 0, hay asimetra hacia la derecha. Si el coeficiente de asimetra < 0, hay asimetra hacia la izquierda, la media ser menor que la mediana y la moda.

    Curtosis: habla de como es la distribucin, indica su grado de apuntamiento.