Capítulo 4. Las medidas de dispersión, de concentración y ... · Las medidas de dispersión, de...
Transcript of Capítulo 4. Las medidas de dispersión, de concentración y ... · Las medidas de dispersión, de...
Capítulo 4. Las medidas de dispersión, de concentración
y de forma en una distribución de frecuencia
unidimensional
JOSÉ JAIME NOGUERA
1
Introducción a la Estadística (ADE-Economía)
DE DISPERSIÓN (* no entran en Economía)
• Rango, recorrido o amplitud:
mayor valor –menor valor
• Coeficiente de apertura: 𝐶𝑎𝑝 =𝑚𝑎𝑦𝑜𝑟 𝑣𝑎𝑙𝑜𝑟
𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟
• Recorrido intercuartílico: 𝑅𝑖 = 𝑄3 − 𝑄1
• Rango entre percentiles: 𝑅𝑃 = 𝑃90 − 𝑃10
• Recorrido relativo(*): 𝑅𝑅 =𝑅
𝑥
• Recorrido semi-intercuartílico: 𝑅𝑠𝑖 =𝑄3−𝑄1
𝑄3+𝑄1
2
DE DISPERSIÓN
• Desviación media (*):
𝐷𝑥 =𝑛1 𝑥1 − 𝑥 + 𝑛2 𝑥2 − 𝑥 + ⋯+ 𝑛𝑛 𝑥𝑛 − 𝑥
𝑁
• Desviación mediana
𝐷𝑀𝑒=𝑛1 𝑥1 −𝑀𝑒 + 𝑛2 𝑥2 −𝑀𝑒 +⋯+ 𝑛𝑛 𝑥𝑛 −𝑀𝑒
𝑁
• Varianza: 𝜎2 =𝑛1 𝑥1−𝑥
2+𝑛2 𝑥2−𝑥 2+⋯+𝑛𝑛 𝑥𝑛−𝑥
2
𝑁
• Desviación típica: 𝜎 = 𝜎2
• Coeficiente de variación de Pearson γ =𝜎
𝑥
3
Ejemplo
Sabiendo que :
𝑥 = 1.2; 𝑄1 = 1;𝑄2 = 1;𝑄3 = 2; 𝑃90 = 2; 𝑃10 = 0
• R=3-0=3;
• 𝐶𝑎𝑝 =3
1= 3
• 𝑅𝑖 =2-1=1
• 𝑅𝑃 =2-0
• 𝑅𝑅 =3
1,2= 2,5
• 𝑅𝑠𝑖 =2−1
2+1= 0,33
4
Ejemplo
Sabiendo que :
𝑥 = 1.2; Me=1
• 𝐷𝑥 =5 0−1.2 +12 1−1.2 +6 2−1.2 +2 3−1.2
25 = 0,67
• 𝐷𝑀𝑒 =5 0−1 +12 1−1 +6 2−1 +2 3−1
25 = 0,6
• 𝜎2 =5 0−1.2 2+12 1−1.2 2+6 2−1.2 2+2 3−1.2 2
25= 0,72
• 𝜎 = 𝜎2 = 0.86 = 0,85
• 𝛾 =0.85
1.2= 0.6
5
A tener en cuenta
• Si la distribución es agrupada por intervalos se calcula todo igual, ya que trabajamos con las marcas de clase.
• La cuasi-varianza es igual que la varianza pero dividida por N-1 en vez de por N (no entra en Economía)
• La cuasi-desviación típica es la raíz cuadrada de la cuasi-varianza.
• La varianza puede calcularse como:
𝜎2 = 𝑎2 − 𝑎12 =
𝑛𝑖 · 𝑥𝑖2
𝑁− 𝑥
𝑛
𝑖=1
6
A tener en cuenta
• La media se ve afectada tanto por cambios de
origen como de escala Si 𝑥𝑖
∗ = 𝑥𝑖 + 𝑎 → 𝑥 ∗ = 𝑥 + 𝑎
Si 𝑥𝑖∗ = 𝑏𝑥𝑖 → 𝑥
∗ = 𝑏𝑥 • La desviación típica no se ve afectada por
cambios de origen pero sí por cambios de escala. Si 𝑥𝑖
∗ = 𝑥𝑖 + 𝑎 → σ∗ = σ
Si 𝑥𝑖∗ = 𝑏𝑥𝑖 → σ
∗ = 𝑏σ
7
Teorema de Chebychev (Solo Economía)
• Al menos 1 −1
ℎ2 de los elementos de cualquier
conjunto de datos estarán a menos de h desviaciones típicas de separación respecto de la media (h>1)
IMAGEN: https://es.slideshare.net/vaneguz12/teorema-de-chebyshev-68586057
8
9
Si la distribución es una campana de Gauss, los porcentajes se pueden ajustar más:
Coeficiente de variación de Pearson
• Se define como 𝛾 =𝜎
𝑥
• Es invariante ante cambios de escala pero sí cambia ante cambios de origen.
• Es adimensional y permite comparar poblaciones diferentes (a diferencia de la varianza)
• Nos indica si la la media es representativa: – 𝛾 = 0 Representatividad máxima – 𝛾 < 0.5 es representativa – 𝛾 > 0.5 poca representatividad – 𝛾 = 1 No hay representatrividad
10
DE CONCENTRACIÓN
• ÍNDICE DE GINI: índice que nos informa si la variable está distribuida homogéneamente (=0) o no (=1).
Calcula el índice de GINI para
11
Intervalos 𝒏𝒊
[0,10) 3
[10,20) 15
[20,30) 10
[30,40) 7
DE CONCENTRACIÓN
12
𝒙𝒊 𝒏𝒊 𝑵𝒊 𝒏𝒊 · 𝒙𝒊 𝝁𝒊 = 𝒏𝒋 · 𝒙𝒋
𝒊
𝒋=𝟏
𝑷𝒊 =𝑵𝒊𝑵· 𝟏𝟎𝟎 𝒒𝒊 =
𝝁𝒊𝝁𝒏· 𝟏𝟎𝟎
5 3 3 15 15 8,57 3,29
10 15 18 150 165 51,42 36,26
15 10 28 150 315 80 69,23
20 7 35 140 455 100 100
N=35 𝜇𝑛 = 455
𝐼𝐺 = (𝑝𝑖−𝑞𝑖)𝑛−1𝑖=1
𝑝𝑖𝑛−1𝑖=1
=8,57−3,29 + 51,42−36,26 +(80−69,23)
139,99=31,21
139,99= 0,22
DE CONCENTRACIÓN: curva de Lorenz
13
Imagen de: https://www.enciclopediafinanciera.com/diccionario/curva-de-Lorenz.html
MEDIDAS DE FORMA
Imagen: https://www.100cia.site/index.php/matematicas/item/3484-que-es-la-asimetria-en-estadistica
14
• De asimetría de Pearson
𝐴𝑝 =3(𝑥 −𝑀𝑒)
𝜎 o bien 𝐴𝑝 =
3(𝑥 −𝑀𝑜)
𝜎
– 𝐴𝑝 = 0, es simétrica
– 𝐴𝑝 > 0, es asimétrica positiva o a la derecha
– 𝐴𝑝 < 0, es asimétrica negativa o a la izquierda
15
• De asimetría de Fisher
𝑔1 =𝑚3𝜎3=
1𝑁 𝑥𝑖 − 𝑥
3𝑛𝑖𝑘𝑖=1
1𝑁 𝑥𝑖 − 𝑥
3𝑛𝑖𝑘𝑖=1
3
– 𝑔1 = 0 → simétrica
– 𝑔1 > 0 → asimétrica positiva
– 𝑔1 < 0 → asimétrica negativa
16
• De Bowley (solo ADE)
𝐶𝑎 =𝑄3 + 𝑄1 − 2𝑀𝑒𝑄3 − 𝑄1
– 𝐶𝑎 = 0 → simétrica
– 𝐶𝑎 > 0 → asimétrica positiva
– 𝐶𝑎 < 0 → asimétrica negativa
17
Medidas de apuntamiento o curtosis
• Coeficiente de Fisher
𝑔2 =𝑚4𝜎4− 3 =
1𝑁 𝑥𝑖 − 𝑥
4𝑛𝑖𝑘𝑖=1
1𝑁 𝑥𝑖 − 𝑥
2𝑛𝑖𝑘𝑖=1
2 − 3
– 𝑔2 = 0 → mesocúrtica o Normal
– 𝑔2 > 0 → leptocúrtica o más apuntada que la Normal
– 𝑔2 < 0 → platicúrtica o menos apuntada que la Normal
18
19
Imagen: https://es.slideshare.net/alexandernunez/medidas-de-asimetrias-y-curtosis
EJERCICIO
Siguiendo los ejercicios anteriores, agrupa los datos en 6 intervalos (ya realizado) y calcula: 1. La desviación mediana, la desviación típica, el rango, el
recorrido intercuartílico y el coeficiente de variación de Pearson.
2. Índice de Gini e interpretación 3. Coeficiente de asimetría de Pearson
20