MEDIDAS DE POSICIÓN
www.clasesuniversitarias.com
Departamento Métodos CuantitativosUniversidad Pablo de Olavide
Profesor: Juan Antonio González Díaz
Medidas de Posición, Dispersión y Forma
www.clasesuniversitarias.com
Cuando disponemos de una distribución de frecuencias asociada a cierta variable estadística, ésta puede resumirse por unas medidas que dan una idea general de cómo es la distribución sin tener que tratar todos los datos con frecuencias absolutas o relativas. Dichas medidas se pueden dividir en:
Medidas de posición; estas medidas dan una idea de en qué valores se distribuye la variable estadística: medias aritmética, geométrica y armónica, mediana, moda y cuantiles.
Medidas de dispersión; estas medidas tratan de medir el grado de esparcimiento de la variable estadística en torno a una medida de posición, indicándonos lo representativa que es ésta. A mayor dispersión, menor representatividad de la medida de posición y viceversa. Veremos como ejemplos, entre otros, la varianza, el recorrido y el coeficiente de variación de Pearson.
Medidas de forma; se distinguen principalmente dos medidas que estudian la simetría de una distribución (coeficiente de asimetría de Fisher) y el grado de semejanza de la misma a la distribución campaniforme de Gauss o también llamada normal (coeficiente de curtosis de Fisher).
MEDIDAS DE POSICIÓN
Medidas de Posición
www.clasesuniversitarias.com
Estudiaremos las Medidas de Posición, también llamadas Medidas de Centralización, ya que estamos estudiando los valores centrales de la variable estadística, distinguiendo:
Variables Estadísticas de Datos Simples
MODA ABSOLUTA (Mo): El dato o datos con mayor frecuencia absoluta, es decir, el dato que aparece más veces en la variable estadística. En caso de existir más de una Moda Absoluta, se puede decir que la variable es bimodal, trimodal o multimodal.Resulta también interesante definir moda relativa como aquel valor de la variable (o valores) cuya frecuencia absoluta no es superada por los valores contiguos.
MEDIDAS DE POSICIÓN
Variables Estadísticas de Datos Agrupados en Intervalos
MEDIANA (Me): Dada una distribución de frecuencias con los valores ordenados de forma creciente, llamamos Mediana y la representamos por Me al valor de la variable que deja a su izquierda y a su derecha exactamente el 50% del número de frecuencias absolutas. Se obtiene con facilidad a partir de la Tabla Estadística, analizando las Frecuencias Absolutas Acumulados, buscando el valor N/2, es decir, la mitad de la población.
Medidas de Posición
www.clasesuniversitarias.com
Moda Absoluta y Mediana para Variables Estadísticas de Datos Simples (Ejemplo 1)
MEDIDAS DE POSICIÓN
Dada la siguiente Variable Estadística: 1 , 2 , 2 , 3 , 3 , 3 , 3 , 4 , 5
12345
12411
13789
xi ni iN
N=9
Mo=3 La Moda es 3, ya que se trata del valor con mayor frecuencia absoluta.
Me=3 Para calcular la Mediana, hay que calcular el valor central de la variable estadística, para lo cuál obtenemos el valor:
5,429
2
N
En la Tabla Estadística buscamos el primer valor cuya Frecuencia Absoluta Acumulada supere el valor 4,5.
Si, como en este caso, no aparece una Frecuencia Absoluta Acumulada que coincida con el valor 4,5, la Mediana será el primer valor cuya Frecuencia Absoluta Acumulada supere el valor 4,5. En este caso, será 3, ya que su Frecuencia Absoluta Acumulada supera 4,5, siendo en este caso, 7
Medidas de Posición
www.clasesuniversitarias.com
Moda Absoluta y Mediana para Variables Estadísticas de Datos Simples (Ejemplo 2)
MEDIDAS DE POSICIÓN
Dada la siguiente Variable Estadística: 1 , 2 , 2 , 3 , 3 , 4
xi ni iN
N=6
Mo=2 y 3 Se trata de una Variable Estadística bimodal, ya que hay dos valores con una Frecuencia Absoluta mayor
Me=2,5 Partimos igualmente del valor 326
2
N
Y buscamos en la Tabla Estadística el valor 3. En este caso sí aparece el valor 3 en las Frecuencias Absolutas Acumuladas, por lo que el proceso para el cálculo de la mediana, varía.
En este caso, tomamos el valor xi, cuya Frecuencia Absoluta Acumulada coincide con 3 y el valor siguiente, x i+1, cuya Frecuencia Absoluta Acumulada supera el valor 3, y calculamos la media de ambos valores.
1234
1221
1356
5,2232
21
ii xxMe
Medidas de Posición
www.clasesuniversitarias.com
Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)
MEDIDAS DE POSICIÓN
Dada la siguiente Tabla Estadística, calculemos la MODA:
N=30
Mo=[1,6;1,7) En este caso es un Intervalo modal, ya que este intervalo presenta la mayor Frecuencia Absoluta.
Pero tenemos que asignar un valor numérico a este intervalo modal, para que la Moda sea un número. Vamos a ver dos formas de hacerlo:
La primera, muy sencilla, es asignar al Intervalo el valor numérico correspondiente a su Marca de Clase, es decir, el valor medio de los extremos. En este caso, 1,65.
Intervalo
[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)
41871
4222930
ni iN
Mo=1,65
La segunda, más elaborada, nos obliga a ampliar la información de la Tabla Estadística, incorporando los conceptos:- densidad de frecuencia de los intervalos anterior y posterior al intervalo modal (hi-1 y hi+1)- Límite Inferior del Intervalo Modal, (Li-1) - su amplitud, (ci)
Medidas de Posición
www.clasesuniversitarias.com
Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)
MEDIDAS DE POSICIÓN
Ampliamos la Tabla Estadística con los valores mencionados anteriormente:
N=30
Intervalo
[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)
41871
4222930
niiNic ih
0,10,10,10,1
0,41,80,70,1
iii
iio c
hhh
LM
11
11
Si, como en este caso, los intervalos de amplitud son constantes, la moda absoluta se puede calcular utilizando frecuencias absolutas en vez de densidades de frecuencia.
6878,11,0429
296,111
11
i
ii
iio c
NNNLM
Medidas de Posición
www.clasesuniversitarias.com
Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)
MEDIDAS DE POSICIÓN
Dada la siguiente Tabla Estadística, calculemos la MEDIANA:
N=30
Me=[1,6;1,7)
Pero tenemos que asignar un valor numérico a este intervalo mediano, para que la Mediana sea un número. Vamos a ver dos formas de hacerlo:
La primera, muy sencilla, es asignar al Intervalo el valor numérico correspondiente a su Marca de Clase, es decir, el valor medio de los extremos. En este caso, 1,65.
Intervalo
[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)
41871
4222930
ni iN
La segunda, más elaborada, nos obliga a ampliar la información de la Tabla Estadística, incorporando los conceptos:- Límite Inferior del Intervalo Modal, (Li-1) - su amplitud, (ci)
Partimos igualmente del valor 15230
2
N
Medidas de Posición
www.clasesuniversitarias.com
Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)
MEDIDAS DE POSICIÓN
Ampliamos la Tabla Estadística con los valores mencionados anteriormente:
N=30
Intervalo
[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)
41871
4222930
niiNic
0,10,10,10,1 6611,11,0
184156,12 1
1
ii
i
ie cn
NN
LM
ii
iie c
nNNLM
1
12/
Si no quieres aprenderte esta fórmula de memoria, se puede razonar esta manera de calcular la Mediana de una forma más sencilla, sin recurrir a complejas fórmulas….
Medidas de Posición
www.clasesuniversitarias.com
Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)
MEDIDAS DE POSICIÓN
N=30
Me=[1,6;1,7)
Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo [1,6;1,7) comienza con una frecuencia acumulada 4 y termina con una frecuencia acumulada 22
Intervalo
[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)
41871
4222930
ni iN Partimos igualmente del valor 15
230
2
N
1,6 1,7
Frecuencia acumulada 4
Frecuencia acumulada 22
Frecuencia acumulada 15
x
Dos triángulos equivalentes (Teorema de Tales):
)6,17,1()422(
)6,1()415(
x )1,0()18(
)6,1()11(
x
Me = x = 1,6611
Como ves, el resultado coincide y no hemos tenido que memorizar ninguna fórmula…
Medidas de Posición
www.clasesuniversitarias.com
Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 2)
MEDIDAS DE POSICIÓN
Dada la siguiente Tabla Estadística, calculemos la MEDIANA:
N=30
En este caso, existe un valor para el que la Frecuencia Absoluta Acumulada coincide con 15, por lo que el Intervalo mediano se correspondería con la media de los intervalos [1,6;1,7) y [1,7;1,8) ¿Cómo puedo hacer esto?
La primera, muy sencilla, es asignar a cada intervalo, el valor numérico correspondiente a su Marca de Clase, es decir, el valor medio de los extremos, para calcular la semisuma, o media, de ambos valores numéricos.
Intervalo
[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)
ni iN Partimos del valor 15
230
2
N69
132
6152830
Dos Formas:
Marca de clase del intervalo [1,6;1,7) = 1,65
Marca de clase del intervalo [1,7;1,8) = 1,75 70,1275,165,1
eM
Medidas de Posición
www.clasesuniversitarias.com
Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 2)
MEDIDAS DE POSICIÓN
Dada la siguiente Tabla Estadística, calculemos la MEDIANA:
N=30
Intervalo
[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)
ni iN
69
132
6152830
La segunda forma, consideramos que la evolución de las frecuencias absolutas dentro de cada uno de los intervalos es constante, por lo que el intervalo [1,6;1,7) comienza con una frecuencia acumulada de 6 y el intervalo [1,7;1,8) termina con una frecuencia acumulada 28
1,6 1,8
Frecuencia acumulada 4
Frecuencia acumulada 28
Frecuencia acumulada 15
1,7
Siguiendo esta argumentación, debemos encontrar el valor para el cuál la Frecuencia Absoluta Acumulada coincida con el valor 15. En este ejemplo, está claro que ese valor es el 1,7, por lo que:
Me = 1,7
Medidas de Posición
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
VENTAJAS:
MEDIANA1.Es la medida más representativa en los
casos de variables que solo admitan la escala ordinal.
2.Es sencilla de calcular.3.Tiene fácil interpretación.4.Es insensible a los valores extremos y solo
influyen en ella los valores centrales.
MODA5.Es la única medida de posición central que
puede calcularse en aquellas variables que solo admitan escala nominal.
6.Es sencilla de calcular.7.Tiene fácil interpretación.
INCONVENIENTES:
MEDIANA 1.No participan todos los valores de
la variable sino todas las frecuencias absolutas.
MODA2.Se centra en una sola variable y
no en todas (como la media) o en las frecuencias (mediana).
Medidas de Posición
www.clasesuniversitarias.com
MEDIA ARITMÉTICA: la suma de todos los valores de la distribución dividida por el número total de observaciones.
El concepto de media aritmética de una distribución de frecuencias se debe utilizar cuando los datos observados son de naturaleza aditiva (rentas, salarios, beneficios, primas de seguros, etc.) de tal forma que una suma representa el total de los recursos repartidos entre todos los elementos de una distribución.
r
iiinxN
x1
1
Propiedades:
1. Si a la variable estadística xi la sometemos al mismo tiempo a un cambio de origen y escala mediante una transformación lineal (yi = a+bxi) entonces resulta que xbay 2. La suma de las desviaciones de los valores o datos respecto a su media aritmética es cero: 0)(
1
r
iii nxx
3. La suma de los cuadrados de las desviaciones de los valores observados unitarios respecto a una constante arbitraria C es mínima cuando dicha constante coincide con la media aritmética.
4. Si el total de datos se estratifica en L grupos distintos, la media aritmética del total es una media aritmética de las distintas medias de los estratos ponderadas por el número de observaciones que tienen los mismos
MEDIDAS DE POSICIÓN
Medidas de Posición
www.clasesuniversitarias.com
MEDIA GEOMÉTRICA de una distribución de frecuencias y la denotaremos por G, como la raíz N-ésima del producto de los N valores observados
El concepto de media geométrica se debe utilizar cuando los valores representan la evolución de una característica con respecto al valor que tiene en un período que llamamos base (números índices, tasas de porcentajes, tipos de interés, etc.). La media geométrica es la medida de posición central más representativa cuando la variable presenta variaciones acumulativas
Propiedad: su logaritmo coincide con la media aritmética de los logaritmos de los valores de la variable.
Nr
i
niixG
1
MEDIA ARMÓNICA se define como:
Supongamos que queramos hallar el promedio de los beneficios por unidad de producción (xi) obtenidos en r empresas de un sector económico determinado. Denominaremos ni a la cantidad de beneficios obtenida por cada una de ellas, así el cociente (ni / xi) será el número de unidades producidas por cada empresa. Llamaremos a su vez, N al total de beneficios obtenidos por el sector.
r
i i
i
xnNH
1
MEDIDAS DE POSICIÓN
Medidas de Posición
www.clasesuniversitarias.com
VENTAJAS
MEDIA ARITMÉTICA1.Utiliza todos los valores de la distribución.2.Es calculable en variables cuantitativas.3.Está objetivamente definida y es única.4.Representa el centro de gravedad
MEDIA GEOMÉTRICA5.Utiliza todos los valores de la distribución.6.Está objetivamente definida y es única, si existe.7.Es más representativa que la aritmética en variables que representan evolución.8.Es menos influenciable por los valores extremos.
MEDIA ARMÓNICA9.Utiliza todos los valores de la distribución.10.Está objetivamente definida y es única, si existe.11.Sencillo cálculo.12.Es más representativa en casos de promedios en velocidades, rendimientos y productividades.
MEDIDAS DE POSICIÓN
Medidas de Posición
www.clasesuniversitarias.com
INCONVENIENTES
MEDIA ARITMÉTICA1.Es muy sensible a valores extremos.
MEDIA GEOMÉTRICA2.No puede calcularse cuando algún valor es cero o cuando el tenemos un número par de datos negativos y el
número total de datos es impar o viceversa.3.Cálculo más complejo.
MEDIA ARMÓNICA4.No puede calcularse cuando algún valor sea cero.5.Si los valores están próximos a 0 la media armónica quedaría sobredimen-sionada.
RELACIÓN ENTRE LAS MEDIAS: xGH
MEDIDAS DE POSICIÓN
Medidas de Posición no centrales
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
Cuando hablamos de Mediana, hablamos de la posición central respecto a la totalidad de datos ordenados. Por tanto a la hora de obtener esa posición central calculamos el cociente
2N
Sin embargo, podemos analizar posiciones no centrales de la variable estadística. Los cuantiles son aquellos valores de la variable que dividen a la distribución en un número de intervalos, que tienen un número proporcional de frecuencias absolutas. Distinguimos:
CUARTILES: Dividimos los valores en cuatro partes, distinguiendo tres tipos de cuartiles:
41NQ
42
2NQ
43
3NQ
DECILES: Dividimos los valores en diez partes, distinguiendo nueve tipos de deciles:
101ND
102
2ND
103
3ND
109
9ND
PERCENTILES: Dividimos los valores en cien partes, distinguiendo noventa y nueve tipos de percentiles:
1001NP
1002
2NP
1003
3NP
100kNPk
10099
99NP
Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
75,4 85,2 79 87,3 82 84 86,2 80 78,3 81,3 76,2 83,1 82,9 80 80,6 89,8 83,9 82,4 83,9 78,4
Volvemos al ejemplo del PPT anterior: El peso de los alumnos de una clase son los siguientes:
ni iNIntervalo
N=20
[75,78)[78,81)[81,84)[84,87)[87,90]
26831
28
161920
76,579,582,585,588,5
xiMODA: En este caso es un Intervalo modal, ya que hay un intervalo presenta la mayor Frecuencia Absoluta. Mo=[81;84)
Para elegir un valor numérico representativo del intervalo modal, bien utilizamos su marca de clase, 82,5, bien utilizamos la fórmula más compleja…
ic ih iii
iio c
hhh
LM
11
11Intervalo
[75,78)[78,81)[81,84)[84,87)[87,90]
76,579,582,585,588,5
xi
33333
Como los intervalos de amplitud son constantes, utilizo las frecuencias absolutas
82336381
11
11
i
ii
iio c
NNNLM
624485760
Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
ni iNIntervalo
N=20
[75,78)[78,81)[81,84)[84,87)[87,90]
26831
28
161920
76,579,582,585,588,5
xiMEDIANA: Utilizamos el valor 10
220
2
N
Me=[81,84)El intervalo mediano será el primero que tenga una Frecuencia Absoluta Acumulada superior a 10, por tanto, será:
Pero tenemos que asignar un valor numérico a este intervalo mediano, para que la Mediana sea un número, bien eligiendo su Marca de Clase, 82,5, bien aplicando la siguiente argumentación:
Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo [81,84) comienza con una frecuencia acumulada 8 y termina con una frecuencia acumulada 16
81 84
Frecuencia acumulada 8
Frecuencia acumulada 16
Frecuencia acumulada 10
x
Dos triángulos equivalentes (Teorema de Tales):
)8184()816(
)81()810(
x 38
)81(3
x
Me = 81,75
Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
ni iNIntervalo
N=20
[75,78)[78,81)[81,84)[84,87)[87,90]
26831
28
161920
76,579,582,585,588,5
xiCUARTIL 3: Utilizamos el valor 15
4203
43
N
Q3=[81,84)El intervalo Q3 será el primero que tenga una Frecuencia Absoluta Acumulada superior a 15, por tanto, será:
Pero tenemos que asignar un valor numérico a este Q3, para que sea un número, bien eligiendo su Marca de Clase, 82,5, bien aplicando la siguiente argumentación:
Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo [81,84) comienza con una frecuencia acumulada 8 y termina con una frecuencia acumulada 16
81 84
Frecuencia acumulada 8
Frecuencia acumulada 16
Frecuencia acumulada 15
x
Dos triángulos equivalentes (Teorema de Tales):
)8184()816(
)81()815(
x 38
)81(7
x
Q3 = 83,625
Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
ni iNIntervalo
N=20
[75,78)[78,81)[81,84)[84,87)[87,90]
26831
28
161920
76,579,582,585,588,5
xiDECIL 3: Utilizamos el valor 6
10203
103
N
D3=[78,81)El intervalo D3 será el primero que tenga una Frecuencia Absoluta Acumulada superior a 16, por tanto, será:
Pero tenemos que asignar un valor numérico a este D3, para que sea un número, bien eligiendo su Marca de Clase, 79,5, bien aplicando la siguiente argumentación:
Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo [78,81) comienza con una frecuencia acumulada 2 y termina con una frecuencia acumulada 8
78 81
Frecuencia acumulada 2
Frecuencia acumulada 8
Frecuencia acumulada 6
x
Dos triángulos equivalentes (Teorema de Tales):
)7881()28(
)78()26(
x 36
)78(4
x
D3 = 80
Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
ni iNIntervalo
N=20
[75,78)[78,81)[81,84)[84,87)[87,90]
26831
28
161920
76,579,582,585,588,5
xiPERCENTIL 96: Utilizamos el valor 2,19
1002096
10096
N
P96=[87,90]El intervalo P96 será el primero que tenga una Frecuencia Absoluta Acumulada superior a 16, por tanto, será:
Pero tenemos que asignar un valor numérico a este P96, para que sea un número, bien eligiendo su Marca de Clase, 88,5, bien aplicando la siguiente argumentación:
Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo [87,90) comienza con una frecuencia acumulada 19 y termina con una frecuencia acumulada 20
87 90
Frecuencia acumulada 19
Frecuencia acumulada 20
Frecuencia acumulada 19,2
x
Dos triángulos equivalentes (Teorema de Tales):
)8790()1920(
)87()192,19(
x 31
)87(2,0
x
P96 = 87,6
Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
ni iNIntervalo
N=20
[75,78)[78,81)[81,84)[84,87)[87,90]
26831
28
161920
76,579,582,585,588,5
xiMEDIA ARITMETICA
75,8120
)1*5,883*5,858*5,826*5,792*5,76(1
N
nxx
r
iii
MEDIA GEOMÉTRICA 69,815,885,855,825,795,7620 13862
1
Nr
i
niixG
MEDIA ARMÓNICA 64,81
5,881
5,853
5,828
5,796
5,762
20
1
r
i i
i
xnNH