1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.
-
Upload
francisca-molina-hidalgo -
Category
Documents
-
view
222 -
download
0
Transcript of 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.
1-2008 1
Resumen y descripción de datos
numéricos
EstadísticaCapítulo 3.2
1-2008 2
Medidas de Variación
1-2008 3
Medidas de Variación
La variación es la cantidad de dispersión o “separación” que presentan los datos entre sí.
Muestra A Muestra B
Los edificios B están más separados
que los de grupo A. La dispersión en B es mayor que en A.
1-2008 4
Medidas de variación
• Rango• Rango intercuartil• Varianza• Desviación Estándar• Coeficiente de variación
La medidas de variación más importantes en la estadística son:
1-2008 5
RangoTal como se vio en las distribuciones de frecuencia, el rango es el valor que se
encuentra restando los valores mayor y menor de los datos de una muestra con sus
datos ordenados.
menorDatomayorDatoRango
1-2008 6
Para determinar el rango de los tiempos necesario para arreglarse, los datos se ordenan de mayor a menor
29 31 35 39 39 40 43 44 44 53
Rango = 53 - 29 = 24
1-2008 7
Rango IntercuartilEl rango intercuartil se obtiene al restar el
primer cuartil del tercer cuartil.
13 QQilIntercuartRango
Esta medida considera la dispersión de la mitad de los datos; por lo tanto los valores extremos
no influyen en los resultados.
1-2008 8
El rango intercuartil de los rendimientos anuales que obtuvieron los fondos
nacionales cuyos cargos de venta se pagan con los activos de los fondos es de US$ 3.70
1-2008 9
Varianza y Desviación Estándar
El rango es una medida de dispersión total y el rango intercuartil es una medida de dispersión media; sin embargo, ninguna de ellas toma en cuenta cómo se distribuyen o se agrupan las
observaciones.
1-2008 10
Varianza y Desviación Estándar
La varianza y la desviación estándar toman en cuenta cómo se distribuyen los datos entre sí.
Estas medidas evalúan la manera en que fluctúan los valores respecto a la media
aritmética (promedio).
Lo anterior la convierte en una fuerte herramienta con la suficiente confianza para
preparar conclusiones y proyecciones.
1-2008 11
Varianza(Muestral)
• S2 Ξ Varianza• Xi Ξ Dato u observación• Ξ Media Aritmética • n Ξ Tamaño de la muestra
La varianza muestral es la suma de los cuadrados de las diferencias con relación a la media
aritmética dividida entre el cuadrado de la muestra menos 1
1
)(1
2
2
n
XXS
n
ii
X
1-2008 12
Varianza(Muestral)
1. Se calcula la media aritmética2. A cada dato de la muestra se le resta el valor de
media aritmética3. El resultado de la resta se eleva al cuadrado4. Se suman todos los cuadrados obtenidos5. Dividir el resultado entre total de muestra menos
1
El proceso para calcular la varianza se resume así:
1
)(1
2
2
n
XXS
n
ii
1-2008 13
Para una muestra de 17 fondos de acciones generales con cargos de venta pagados por activos
de los fondos, calcular la varianza.
1
)(1
2
2
n
XXS
n
ii
32.2 29.5 29.9 32.4 30.5
30.1 32.1 35.2 10.0 20.6
28.6 30.5 38.0 33.0 29.4
37.1 28.6
1-2008 14
Calcular la media aritmética
32.229.529.932.430.530.132.135.210.020.628.630.538.033.029.437.128.6
507.7
86.2917
7.507X
1-2008 15
X1 = 32.2 29.86 2.34 5.4756
X2 = 29.5 29.86 -0.36 0.1296
X3 = 29.9 29.86 0.04 0.0016
X4 = 32.4 29.86 2.54 6.4516
X5 = 30.5 29.86 0.64 0.4096
X6 = 30.1 29.86 0.24 0.0576
X7 = 32.1 29.86 2.24 5.0176
X8 = 35.2 29.86 5.34 28.5156
X9 = 10.0 29.86 -19.86 394.4196
iX XX i 2)( XX i X
1-2008 16
X10 = 20.6 29.86 -9.26 85.7476
X11 = 28.6 29.86 -1.26 1.5876
X12 = 30.5 29.86 0.64 0.4096
X13 = 38.0 29.86 8.14 66.2596
X14 = 33.0 29.86 3.14 9.8596
X15 = 29.4 29.86 -0.46 0.2116
X16 = 37.1 29.86 7.24 52.4176
X17 = 28.6 29.86 -1.26 1.5876
Total 658.5592
iX X XX i 2)( XX i
1-2008 17
15995.41
117
5592.6581
)(
2
2
1
2
2
S
S
n
XXS
n
ii
1-2008 18
Desviación Estándar
La desviación estándar de la muestra es la raíz cuadrada de la varianza.
1
)(1
2
n
XXS
n
ii
1-2008 19
Para la muestra que contiene 17 fondos de acciones generales con cargos de venta pagados por activos de los fondos, calcular la varianza.
32.2 29.5 29.9 32.4 30.5
30.1 32.1 35.2 10.0 20.6
28.6 30.5 38.0 33.0 29.4
37.1 28.6
1
)(1
2
n
XXS
n
ii
1-2008 20
En el ejemplo 3.11, se hizo el cálculo de la varianza, con un resultado de 41.15995.
42.6
15995.41
1
)(
2
1
2
S
S
SS
n
XXS
n
ii
1-2008 21
Coeficiente de Variación
A diferencia de las medidas que hemos estudiado hasta ahora, el coeficiente de variación es una indicación relativa de la variación. Siempre se expresa en porcentajes, no en términos de la unidad de medida de los datos estudiados.
Mide la dispersión en los datos con relación a la media .Es más útil cuando se trata de hacer
comparaciones entre muestras.
1-2008 22
Coeficiente de Variación
El coeficiente de variación se calcula de la siguiente manera:
100*X
SCV
1-2008 23
Calcular el coeficiente de variación para los 17 fondos de acciones generales
32.2 29.5 29.9 32.4 30.5
30.1 32.1 35.2 10.0 20.6
28.6 30.5 38.0 33.0 29.4
37.1 28.6
1-2008 24
* El valor de la media aritmética es 29.86
* El valor de la desviación estándar es 6.42
%50.21)100(86.29
42.6 XS
CV
El coeficiente de variación es 21.50%
1-2008 25
Puntuaciones Z
Un valor extremo o atípico es un valor ubicado muy lejos de la media. Las puntuaciones Z son útiles para identificar atípicos. Cuanto mayor es la puntuación Z, mayor es la distancia entre tal
valor y la media.
La puntuación Z es igual a la diferencia entre ese valor y la media, dividida por la desviación
estándar.
1-2008 26
Puntuación Z
s
XxZ
Una puntuación Z se considera atípica si es menor que -3.0 o mayor que +3.0
1-2008 27
Se considera que la media para arreglarse en la mañana es de 39.6 minutos y la desviación estándar de 6.77 minutos.
Sí el día lunes se toma 39.0 minutos para arreglarse. Calcular la puntuación Z para este día.
09.077.6
6.390.39
Z
Z
1-2008 28
Supongamos que el gerente de operaciones de un servicio de paquetería desea adquirir una nueva
flotilla de vehículos. Cuando los paquetes se guardan con eficiencia en el interior de los vehículos – durante la preparación de las
entregas-, se deben considerar dos restricciones: el peso (en libras) y el volumen (en pies cúbicos)
de cada paquete.
1-2008 29
Ahora supongamos que en una muestra de 200 paquetes, el peso promedio es de 26.0 libras
con una desviación estándar de 3.9 libras. Por otro lado, el volumen promedio de cada paquete es 8.8 pies cúbicos con una desviación estándar de 2.2 pies cúbicos. ¿Cómo se puede comparar
la variación del peso y el volumen?
1-2008 30
Coeficiente de Variación del Peso
%15%)100(0.26
9.3 pesoCV
Coeficiente de Variación del Volumen
%25%)100(8.82.2 volumenCV
El volumen de un paquete es más variable que el peso. Ya que el coeficiente de variación del volumen es 25% mientras que el peso es de
15%.
1-2008 31
Cada acción de la compañía “As” ha promediado 50 dólares en los últimos meses, con una
desviación estándar de 10 dólares. Además, durante el mismo período el precio promedio de las acciones de la compañía “Bonita” fue de 12
dólares con una desviación estándar de 4 dólares. ¿Cómo puede determinar un inversionista cuáles
acciones son más variables?
1-2008 32
Coeficiente de Variación de la Compañía “As”
%20%)100(5010 asCV
Coeficiente de Variación de Compañía “Bonita”
%3.33%)100(124 bonitaCV
El precio de las acciones de “Bonita” varía más que el precio de las acciones de “As”. El inversionista puede decidir comprar las acciones de “As”; su coeficiente de
variación fluctúa menos.
1-2008 33
Forma
Se refiere a la forma en que se distribuyen los datos.
La observación de la forma puede obtenerse a través de distribución de frecuencias o del
gráfico
1-2008 34
Forma
• Asimétrica• Sesgada
La distribución de los datos puede ser simétrica o no. La no simetría también se le
conoce como:
1-2008 35
Forma
• La media es igual a la mediana, la distribución es simétrica (insesgada)
• La media es menor a la mediana, la distribución es sesgada a la izquierda (sesgo negativo)
• Si la media es mayor que la medina, la distribución es sesgada a la derecha (sesgo positivo)
La simetría se determina con la comparación de la media y la mediana
1-2008 36
0
24
6
8
1012
14
1 2 3 4 5 6 7 8 9
Insesgada
• La media es igual a la mediana, la distribución es simétrica.
1-2008 37
0
5
10
15
20
1 2 3 4 5 6 7 8 9
Sesgada a la izquierda
• La media es menor a la mediana, la distribución es sesgada a la izquierda (sesgo negativo)
1-2008 38
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9
Sesgada a la derecha
• Si la media es mayor que la mediana, la distribución es sesgada a la derecha (sesgo positivo)