1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

38
1-2008 1 Resumen y descripción de datos numéricos Estadístic a Capítulo 3.2

Transcript of 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

Page 1: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 1

Resumen y descripción de datos

numéricos

EstadísticaCapítulo 3.2

Page 2: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 2

Medidas de Variación

Page 3: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 3

Medidas de Variación

La variación es la cantidad de dispersión o “separación” que presentan los datos entre sí.

Muestra A Muestra B

Los edificios B están más separados

que los de grupo A. La dispersión en B es mayor que en A.

Page 4: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 4

Medidas de variación

• Rango• Rango intercuartil• Varianza• Desviación Estándar• Coeficiente de variación

La medidas de variación más importantes en la estadística son:

Page 5: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 5

RangoTal como se vio en las distribuciones de frecuencia, el rango es el valor que se

encuentra restando los valores mayor y menor de los datos de una muestra con sus

datos ordenados.

menorDatomayorDatoRango

Page 6: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 6

Para determinar el rango de los tiempos necesario para arreglarse, los datos se ordenan de mayor a menor

29 31 35 39 39 40 43 44 44 53

                   

Rango = 53 - 29 =   24    

Page 7: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 7

Rango IntercuartilEl rango intercuartil se obtiene al restar el

primer cuartil del tercer cuartil.

13 QQilIntercuartRango

Esta medida considera la dispersión de la mitad de los datos; por lo tanto los valores extremos

no influyen en los resultados.

Page 8: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 8

El rango intercuartil de los rendimientos anuales que obtuvieron los fondos

nacionales cuyos cargos de venta se pagan con los activos de los fondos es de US$ 3.70

Page 9: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 9

Varianza y Desviación Estándar

El rango es una medida de dispersión total y el rango intercuartil es una medida de dispersión media; sin embargo, ninguna de ellas toma en cuenta cómo se distribuyen o se agrupan las

observaciones.

Page 10: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 10

Varianza y Desviación Estándar

La varianza y la desviación estándar toman en cuenta cómo se distribuyen los datos entre sí.

Estas medidas evalúan la manera en que fluctúan los valores respecto a la media

aritmética (promedio).

Lo anterior la convierte en una fuerte herramienta con la suficiente confianza para

preparar conclusiones y proyecciones.

Page 11: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 11

Varianza(Muestral)

• S2 Ξ Varianza• Xi Ξ Dato u observación• Ξ Media Aritmética • n Ξ Tamaño de la muestra

La varianza muestral es la suma de los cuadrados de las diferencias con relación a la media

aritmética dividida entre el cuadrado de la muestra menos 1

1

)(1

2

2

n

XXS

n

ii

X

Page 12: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 12

Varianza(Muestral)

1. Se calcula la media aritmética2. A cada dato de la muestra se le resta el valor de

media aritmética3. El resultado de la resta se eleva al cuadrado4. Se suman todos los cuadrados obtenidos5. Dividir el resultado entre total de muestra menos

1

El proceso para calcular la varianza se resume así:

1

)(1

2

2

n

XXS

n

ii

Page 13: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 13

Para una muestra de 17 fondos de acciones generales con cargos de venta pagados por activos

de los fondos, calcular la varianza.

1

)(1

2

2

n

XXS

n

ii

32.2 29.5 29.9 32.4 30.5

30.1 32.1 35.2 10.0 20.6

28.6 30.5 38.0 33.0 29.4

37.1 28.6

Page 14: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 14

Calcular la media aritmética

32.229.529.932.430.530.132.135.210.020.628.630.538.033.029.437.128.6

507.7

86.2917

7.507X

Page 15: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 15

X1 = 32.2 29.86 2.34 5.4756

X2 = 29.5 29.86 -0.36 0.1296

X3 = 29.9 29.86 0.04 0.0016

X4 = 32.4 29.86 2.54 6.4516

X5 = 30.5 29.86 0.64 0.4096

X6 = 30.1 29.86 0.24 0.0576

X7 = 32.1 29.86 2.24 5.0176

X8 = 35.2 29.86 5.34 28.5156

X9 = 10.0 29.86 -19.86 394.4196

iX XX i 2)( XX i X

Page 16: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 16

X10 = 20.6 29.86 -9.26 85.7476

X11 = 28.6 29.86 -1.26 1.5876

X12 = 30.5 29.86 0.64 0.4096

X13 = 38.0 29.86 8.14 66.2596

X14 = 33.0 29.86 3.14 9.8596

X15 = 29.4 29.86 -0.46 0.2116

X16 = 37.1 29.86 7.24 52.4176

X17 = 28.6 29.86 -1.26 1.5876

Total 658.5592

iX X XX i 2)( XX i

Page 17: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 17

15995.41

117

5592.6581

)(

2

2

1

2

2

S

S

n

XXS

n

ii

Page 18: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 18

Desviación Estándar

La desviación estándar de la muestra es la raíz cuadrada de la varianza.

1

)(1

2

n

XXS

n

ii

Page 19: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 19

Para la muestra que contiene 17 fondos de acciones generales con cargos de venta pagados por activos de los fondos, calcular la varianza.

32.2 29.5 29.9 32.4 30.5

30.1 32.1 35.2 10.0 20.6

28.6 30.5 38.0 33.0 29.4

37.1 28.6

1

)(1

2

n

XXS

n

ii

Page 20: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 20

En el ejemplo 3.11, se hizo el cálculo de la varianza, con un resultado de 41.15995.

42.6

15995.41

1

)(

2

1

2

S

S

SS

n

XXS

n

ii

Page 21: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 21

Coeficiente de Variación

A diferencia de las medidas que hemos estudiado hasta ahora, el coeficiente de variación es una indicación relativa de la variación. Siempre se expresa en porcentajes, no en términos de la unidad de medida de los datos estudiados.

Mide la dispersión en los datos con relación a la media .Es más útil cuando se trata de hacer

comparaciones entre muestras.

Page 22: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 22

Coeficiente de Variación

El coeficiente de variación se calcula de la siguiente manera:

100*X

SCV

Page 23: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 23

Calcular el coeficiente de variación para los 17 fondos de acciones generales

32.2 29.5 29.9 32.4 30.5

30.1 32.1 35.2 10.0 20.6

28.6 30.5 38.0 33.0 29.4

37.1 28.6

Page 24: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 24

* El valor de la media aritmética es 29.86

* El valor de la desviación estándar es 6.42

%50.21)100(86.29

42.6 XS

CV

El coeficiente de variación es 21.50%

Page 25: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 25

Puntuaciones Z

Un valor extremo o atípico es un valor ubicado muy lejos de la media. Las puntuaciones Z son útiles para identificar atípicos. Cuanto mayor es la puntuación Z, mayor es la distancia entre tal

valor y la media.

La puntuación Z es igual a la diferencia entre ese valor y la media, dividida por la desviación

estándar.

Page 26: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 26

Puntuación Z

s

XxZ

Una puntuación Z se considera atípica si es menor que -3.0 o mayor que +3.0

Page 27: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 27

Se considera que la media para arreglarse en la mañana es de 39.6 minutos y la desviación estándar de 6.77 minutos.

Sí el día lunes se toma 39.0 minutos para arreglarse. Calcular la puntuación Z para este día.

09.077.6

6.390.39

Z

Z

Page 28: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 28

Supongamos que el gerente de operaciones de un servicio de paquetería desea adquirir una nueva

flotilla de vehículos. Cuando los paquetes se guardan con eficiencia en el interior de los vehículos – durante la preparación de las

entregas-, se deben considerar dos restricciones: el peso (en libras) y el volumen (en pies cúbicos)

de cada paquete.

Page 29: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 29

Ahora supongamos que en una muestra de 200 paquetes, el peso promedio es de 26.0 libras

con una desviación estándar de 3.9 libras. Por otro lado, el volumen promedio de cada paquete es 8.8 pies cúbicos con una desviación estándar de 2.2 pies cúbicos. ¿Cómo se puede comparar

la variación del peso y el volumen?

Page 30: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 30

Coeficiente de Variación del Peso

%15%)100(0.26

9.3 pesoCV

Coeficiente de Variación del Volumen

%25%)100(8.82.2 volumenCV

El volumen de un paquete es más variable que el peso. Ya que el coeficiente de variación del volumen es 25% mientras que el peso es de

15%.

Page 31: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 31

Cada acción de la compañía “As” ha promediado 50 dólares en los últimos meses, con una

desviación estándar de 10 dólares. Además, durante el mismo período el precio promedio de las acciones de la compañía “Bonita” fue de 12

dólares con una desviación estándar de 4 dólares. ¿Cómo puede determinar un inversionista cuáles

acciones son más variables?

Page 32: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 32

Coeficiente de Variación de la Compañía “As”

%20%)100(5010 asCV

Coeficiente de Variación de Compañía “Bonita”

%3.33%)100(124 bonitaCV

El precio de las acciones de “Bonita” varía más que el precio de las acciones de “As”. El inversionista puede decidir comprar las acciones de “As”; su coeficiente de

variación fluctúa menos.

Page 33: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 33

Forma

Se refiere a la forma en que se distribuyen los datos.

La observación de la forma puede obtenerse a través de distribución de frecuencias o del

gráfico

Page 34: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 34

Forma

• Asimétrica• Sesgada

La distribución de los datos puede ser simétrica o no. La no simetría también se le

conoce como:

Page 35: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 35

Forma

• La media es igual a la mediana, la distribución es simétrica (insesgada)

• La media es menor a la mediana, la distribución es sesgada a la izquierda (sesgo negativo)

• Si la media es mayor que la medina, la distribución es sesgada a la derecha (sesgo positivo)

La simetría se determina con la comparación de la media y la mediana

Page 36: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 36

0

24

6

8

1012

14

1 2 3 4 5 6 7 8 9

Insesgada

• La media es igual a la mediana, la distribución es simétrica.

Page 37: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 37

0

5

10

15

20

1 2 3 4 5 6 7 8 9

Sesgada a la izquierda

• La media es menor a la mediana, la distribución es sesgada a la izquierda (sesgo negativo)

Page 38: 1-20081 Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.

1-2008 38

0

5

10

15

20

25

1 2 3 4 5 6 7 8 9

Sesgada a la derecha

• Si la media es mayor que la mediana, la distribución es sesgada a la derecha (sesgo positivo)