MEDIDAS DE DISTRIBUCION
ASIMETRIA Y CURTOSIS
Dr. EDGAR APAZA ZUÑIGA UNIVERSIDAD NACIONAL DEL ALTIPLANO
MEDIDAS DE DISTRIBUCIÓN
Las Medidas de Distribución permiten identificar y caracterizar la forma en que se separan o aglomeran los valores de acuerdo a su representación gráfica. Estas medidas describen la manera de cómo los datos tienden a agruparse en relación con la frecuencia con la que se hallen dentro de la información. La utilidad fundamental de las Medidas de distribución radica en la posibilidad de identificar las características y discriminar la distribución sin necesidad de generar el gráfico.
I. ASIMETRIA
Es una expresión de la forma de la distribución, para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable. Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). Más precisamente, permiten establecer el grado de Simetría que presenta una distribución de probabilidad de una variable aleatoria.
ASIMETRÍA Presenta tres formas diferentes. Cada
una de ellas define y precisa la manera
de cómo están distribuidos los datos
respecto al eje de simetría
1. Asimetría positiva. Cuando la cola más dispersa se extiende en el lado de los valores altos de la variable con escaza frecuencia. 2. Simétrica. Si la dispersión es igual o muy similar a ambos lados, a una distribución de frecuencias simétrica. 3. Asimetría negativa. La cola más dispersa se extiende al lado de los valores más bajos.
COEFICIENTES DE ASIMETRÍA:
1. COEFICIENTES DE ASIMETRÍA DE K. PEARSON:
1.1. PRIMER COEFICIENTE DE ASIMETRÍA DE PEARSON 1.2. SEGUNDO COEFIENTE DE ASIMETRÍA DE PEARSON 1.3. TERCER COEFIENTE DE ASIMETRÍA DE PEARSON 2. COEFICIENTE DE ASIMETRÍA DE YOULE BOWLEY 3. COEFICIENTES DE ASIMETRÍA DE R. FISHER 3.1. PARA UNA SERIE SIMPLE DE DATOS 3.2. PARA DATOS DE UNA VARIABLE CUANTITATIVA
DISCRETA AGRUPADOS POR SUS FRECUENCIAS ABSOLUTAS 3.3. PARA DATOS DE VARIABLES CUANTITATIVAS
CONTINUAS AGRUPADOS EN TABLAS DE DISTRIBUCIONES DE FRECUENCIAS
1. COEFICIENTE DE ASIMETRIA DE KARL PEARSON.
s
XXA
m
S
)(3
SA Oscila entre -3 a 3
X
mX
s
DONDE:
Media aritmética Mediana
Desviación estándar de la muestra
SA = 0, La distribución es simétrica
SA > 0, La distribución es simétrica positiva
SA < 0, La distribución es simétrica negativa
2. COEFICIENTE DE ASIMETRIA DE YOULE BOWLEY.
13
2312
QQQA
S
DONDE:
1Q Cuartil uno
2Q Cuartil dos
3Q Cuartil tres
SA Oscila entre -1 a 1
Si : SA = 0, La distribución es simétrica
Si : SA > 0, La distribución es asimétrica positiva
Si : SA < 0, La distribución es asimétrica negativa
3. COEFICIENTES DE ASIMETRIA DE RONALD FISHER.
3.1. PARA DATOS DE UNA SERIE SIMPLE DE
DATOS (DATOS NO AGRUPADOS POR CLASES)
3
1
3
1
*)(
*1
S
nXX
ng
n
i
ii
LOS COEFICIENTES DE ASIMETRIA MÁS PRECISOS SON LOS DE FISHER
iX = Valores de la de la variable
X = Media aritmética de los valores de la muestra
in = Frecuencia absoluta de los valores de la variable n = Número total de datos S = Desviación estándar de la muestra
3.2. PARA DATOS DE UNA VARIABLE
CUANTITATIVA DISCRETA AGRUPADOS POR SUS
FRECUENCIAS ABSOLUTAS
3. COEFICIENTES DE ASIMETRIA DE RONALD FISHER
2
3
1
2
1
3
1
*)(1
*)(1
n
i
ii
n
i
ii
nXXn
nXXn
g)3)(1)(2(
)1(6
1nnn
nne
g
iX = Valores de la variable
X = Media aritmética de los valores de la muestra
in = Frecuencia absoluta de los valores de la variable n = Número total de datos
g1= 0 distribución simétrica g1> 0 Distribución asimétrica positiva g1< 0 Distribución asimétrica negativa
3. COEFICIENTES DE ASIMETRIA DE RONALD FISHER.
3.3. PARA DATOS DE VARIABLES CUANTITATIVAS
CONTINUAS AGRUPADOS EN TABLAS DE
DISTRIBUCIONES DE FRECUENCIAS
3
1
3
1
*)(
*1
S
nXXi
ng
n
i
i
iX = Valores de la marca de clase
X = Media aritmética de los valores de la muestra
in = Frecuencia absoluta de los valores de la variable n = Número total de datos
)3)(1)(2(
)1(6
1nnn
nne
g
3. COEFICIENTES DE ASIMETRIA DE RONALD FISHER.
3.2. PARA DATOS DE VARIABLES CUANTITATIVAS
CONTINUAS AGRUPADOS POR SUS FRECUENCIAS
ABSOLUTAS.
EJEMPLO. 20 21 23 19 19 18 22 20
23 19 22 18 21 23 19 20
20 19 21 21 23 20 19 22
20 20 23 20 18 20 22 23
19 18 18 19 19 21 22 21
21 18 19 19 23 22 18 21
21 21 22 23 20 22 23 22
21 18 22 20 18 22 18 19
23 21 18 19 19 18 18 21
18 22 22 22 22 21 21 23
19 21 21 23 23 19 21
22 18 18 22 19 19 18
18 21 23 21 22 21 19
21 23 22 20 23 18 20
18 19 23 18 23 19 21
19 21 19 22 22 18 23
19 18 23 23 21 22 22
21 23 18 19 19 23 20
18 18 23 18 22 19 20
19 18 21 18 20 19 23
LONGITUD DEL DIAMETRO DE FIBRA EN ALPACAS TUIS DE LA RAZA HUCAYO (n = 150)
CONCLUSION: COMO EL VALOR DEL COEFICIENTE DE
ASIMETRÍA DE FISHER ES MENOR QUE CERO
(0.042), LA DISTRIBUCIÓN DE DIÁMETROS DE
FIBRA EN ALPACAS ES ASIMETRICA NEGATIVA,
ES DECIR QUE EXISTE MAYORES
CONCENTRACIONES DE FRECUENCIAS DE
DIAMETROS DE FIBRA EN LAS UBICACIONES
DE VALORES ALTOS.
II. CURTOSIS
A inicios del siglo XX, Karl Pearson, utilizó por primera vez la palabra Curtosis en el contexto estadístico para referirse a la forma de una distribución de frecuencias. En efecto, la Curtosis es un parámetro que determina el grado centralización que presentan los valores, en la región central de la distribución. K. Pearson, introdujo los términos: Platicúrtica, Mesocúrtica y Leptocúrtica para referirse a curvas de distribuciones de frecuencias menos, igual o más achatadas que la curva Normal. En consecuencia, la Curtosis hace referencia al apuntamiento de la distribución en relación a un estándar que es la distribución normal.
CURTOSIS
La Curtosis es una medida de forma, más precisamente de apuntamiento de las distribuciones, determina la mayor o menor concentración de las frecuencias alrededor de la Media y en la zona central de la distribución. Hace referencia al apuntamiento de la distribución en relación a un Estándar, que es la Distribución Normal, la que en este caso representa una distribución Mesocúrtica. Si la distribución es más apuntada que la Normal la distribución es Leptocúrtica; y si es más achatada esta es Platicúrtica. La Curtosis es independiente de la Variabilidad. No es cierto que una distribución Leptocúrtica tenga menos variación y que por eso es más apuntada, contrariamente, la distribución platicúrtica no por el hecho de ser más achatada, esta debe ser más variable.
1. Leptocúrtica. La distribución es más apuntada que la distribución normal
2. Mesocúrtica. La distribución es normal
3. Platicúrtica. La distribución es más achatada que la distribución normal
1 2 3
CURTOSIS
COEFICIENTE DE CURTOSIS.
EXISTEN VARIAS FORMAS DE DETERMINAR ESTE COEFIENTE:
1. COEFICIENTE DE CURTOSIS PERCENTÍLICO. Este coeficiente relaciona la desviación cuartil con el espacio inter percentílico obteniéndose el siguiente coeficiente.
k = 0.263 LA DISTRIBUCIÓN ES MESOCURTICA k > 0.263 LA DISTRIBUCIÓN ES LEPTOCURTICA k > 0.263 LA DISTRIBUCIÓN ES PLATICURTICA
PESO AL DESTETE EN TERNEROS DE LA RAZA BROWN SWISS
PESO AL DESTETE EN TERNEROS DE LA RAZA BROWN SWISS
212339.04.62
25.13
)30.12550.156(2
)00.13425.147(
)(2
)(
1090
13
PP
QQK
Como k = 0.2123 es menor que 0.263, la distribución es PLATICURTICA
2. COEFICIENTE DE CURTOSIS OBTENIDO POR LA HOJA ELECTRONICA EXCEL.
EL EXCEL USA LA SIGUIENTE ECUACIÓN PARA CALCULAR LA CURTOSIS:
PESO AL DESTETE EN TERNEROS DE LA RAZA BROWN SWISS
)3)(1(
)1(3
)3)(2)(1(
)1(2
1
4
nn
n
S
XX
nnn
nnk
n
i
i
PESO
Media 140.82
Error típico 1.455935074
Mediana 140
Moda 138
Desviación estándar 10.29501564
Varianza de la muestra 105.9873469
Curtosis -0.446368167
Coeficiente de asimetría 0.003150698
Rango 41
Mínimo 120
Máximo 161
Suma 7041
Cuenta 50
3. COEFICIENTE DE CURTOSIS DE PEARSON.
Pearson introdujo los términos Platicúrtica, Mesocúrtica y Platicúrtica para referirse a curvas menos, igual y más achatadas que la Curva Normal. Pearson, demostró para una distribución Normal que:
Define a = Como el “Grado de Curtosis” una medida de alejamiento con respecto a la distribución Normal. El cual es definido por:
32
3
)(1
)(1
2
1
2
1
4
2n
i
i
n
i
i
Xn
Xn
b)5)(3)(2)(3(
)1(242
2nnnn
nnEE
g
Top Related