Clase 2 4 medidas estadísticas - dispersión

31
Estadística y probabilidad Santiago de Chile 2013 Profesor Rubén Rodríguez A. Física y Matemáticas

Transcript of Clase 2 4 medidas estadísticas - dispersión

Page 1: Clase 2 4 medidas estadísticas - dispersión

Estadística y probabilidad

Santiago de Chile 2013

Profesor Rubén Rodríguez A. Física y Matemáticas

Page 2: Clase 2 4 medidas estadísticas - dispersión

Repaso:

Tendencia central: punto medio de una distribución.

Dispersión: separación de los datos en una distribución.

Sesgo: Las curvas representan los datos puntuales de un conjunto de datos que pueden ser simétricas o sesgadas.

Curtosis: Cuando se mide la curtosis de una distribución, se mide qué tan puntiaguda es.

Page 3: Clase 2 4 medidas estadísticas - dispersión

Sueldos mensuales iniciales en una muestra de 12 recién egresados de la carrera de administración

Egresado Sueldo mensual inicial

Egresado Sueldo mensual inicial ($)

1 1690500 7 1710100

2 1739500 8 1827700

3 1788500 9 1734600

4 1705200 10 1923250

5 1643950 11 1724800

6 1621900 12 1705200

Page 4: Clase 2 4 medidas estadísticas - dispersión

𝑥 = 𝑥𝑖

𝑘𝑖=1

𝑛=𝑥1+𝑥2+⋯𝑥12

12=

1690500 +1739500 +⋯+1705200 12

=

1734600

Para la media poblacional es lo mismo excepto la notación:

𝜇 = 𝑥𝑖

𝑁

Page 5: Clase 2 4 medidas estadísticas - dispersión

En una empresa en la que hay 80 empleados, 60 ganan 4900 pesos chilenos por hora y 20 ganan 6370 por hora.

a) Determinar el sueldo medio por hora

𝑋 = 𝑓𝑋

𝑛=

60 4900 +(20)(6370)

60+20=

Page 6: Clase 2 4 medidas estadísticas - dispersión

Las desviaciones de los números dados respecto al 9 son -4, -1, 2, 0, 3, -3, 5 y 1. Calcule la media aritmética para datos agrupados.

𝑋 = 𝐴 + 𝑑

𝑁=9 +

3

8=

Page 7: Clase 2 4 medidas estadísticas - dispersión

Mediana para los sueldos… 1621900 1643950 1690500 1705200 1705200 1710100 1724800 1734600 1739500 1827700 1788500 1923250

Los valores de en medio

La mediana es el promedio de estos dos valores

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =1710100 + 1724800

2= 1717450

Page 8: Clase 2 4 medidas estadísticas - dispersión

A partir de los datos de la siguiente la mediana es un peso tal que la mitad del total de las frecuencias (40/2=20) quede por encima de él y la mitad del total de las frecuencias quede por debajo de él.

Peso (lb) Frecuencias

118-126 3

127-135 5

136-144 9

145-153 12

154-162 5

163-171 4

172-180 2

Total 40

Page 9: Clase 2 4 medidas estadísticas - dispersión

-- la suma de las tres primeras frecuencias de clases es 3+5+9=17. Por tanto, para dar la frecuencia 20, que es la buscada, se necesitan tres más de los 12 casos que pertenecen a la cuarta clase.

-- como el cuarto intervalo de clase, 145-153, en realidad corresponde a los pesos desde 144.5 hasta 153.5, la mediana debe encontrase a 3/12 entre 144.5 y 153.5.

Page 10: Clase 2 4 medidas estadísticas - dispersión

L1=frontera inferior de clase de la clase mediana =144.5

N=número de datos=40

𝑓1 = 3 + 5 + 9 suma de todas las frecuencias de todas las clases anteriores a la clase mediana.

𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎 =frecuencia de la clase mediana=12

C=amplitud del intervalo de la clase mediana=9

Mediana=𝐿1 + (𝑁

2 − 𝑓 1

𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎)𝑐

Page 11: Clase 2 4 medidas estadísticas - dispersión

La moda en los sueldos es lámina 6 es:

El valor que se presenta con mayor frecuencia: 1705200

Page 12: Clase 2 4 medidas estadísticas - dispersión

Emplear la fórmula empírica media-moda=3(media-mediana) para hallar el salario modal de los 65 empleados de la empresa P&R sabiendo que la media es =131130.70 pesos chilenos y mediana =136710.66.

Page 13: Clase 2 4 medidas estadísticas - dispersión

Encontrar: a) la media geométrica y b) la media aritmética de los números 3,5,6,6,7,10 y 12. Se supone que los números son exactos.

Page 14: Clase 2 4 medidas estadísticas - dispersión

Cuartiles, deciles y percentiles

Aporta información acerca de la dispersión de los datos en el intervalo que va del menor al mayor valor de los datos.

Page 15: Clase 2 4 medidas estadísticas - dispersión

Por ejemplo la mediana divide en dos partes iguales a los datos.

-- Sean 𝑄1, 𝑄2 𝑦 𝑄3 el primer, segundo y tercer cuartil (dividen los datos en cuatro partes iguales); 𝑄2 coincide con la mediana.

-- Los deciles dividen al conjunto de datos en diez partes iguales 𝐷1,𝐷2, … , 𝐷𝑔.

-- Los valores que dividen al conjunto en 100 partes iguales son los percentiles 𝑃1, 𝑃2 , …, 𝑃𝑔𝑔

Page 16: Clase 2 4 medidas estadísticas - dispersión

Calculo de los cuartiles para datos no agrupados:

𝑘 𝑛 + 1

4, 𝑘 = 1,2,3 𝑦 4

Donde:

n= número de observaciones

K=cuartil

Page 17: Clase 2 4 medidas estadísticas - dispersión

Cálculo de cuartiles para datos agrupados

𝑄𝑘 = 𝐿𝑖 +𝐿𝑓 − 𝐿𝑖

4, 𝑐𝑜𝑛 𝐾 = 1,2,3 𝑦 4

Donde:

𝑄𝑘=cuartil k,

𝐿𝑖=límite inferior,

𝐿𝑓=límite superior.

Page 18: Clase 2 4 medidas estadísticas - dispersión

Ejercicio:

Considere las siguientes temperaturas (en grados Celcius) reportadas en un experimento:

25 28 25 26 28 28

35 32 31 31 32 27

25 29 26 28 27 28

30 30 31 31 30 31

Page 19: Clase 2 4 medidas estadísticas - dispersión

Calcular :

a) La posición del primer cuartil,

b) La posición del segundo cuartil,

c) La posición del tercer cuartil.

Nota: Puedes interpolar para encontrar el valor correcto a la posición de los cuartiles.

Page 20: Clase 2 4 medidas estadísticas - dispersión

Cálculo de Deciles

En primer lugar se busca donde se encuentra 𝑘𝑁

10, 𝑝𝑎𝑟𝑎 𝑘 = 1,2,3,4, … 9, en la tabla de

frecuencias acumuladas.

𝐷𝑘 = 𝐿𝑘 +

𝑘𝑁10

− 𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)

𝑓𝑖𝑐

Para datos no agrupados

Page 21: Clase 2 4 medidas estadísticas - dispersión

Donde:

𝐿𝑘=límite inferior de la clase del decil k

N= número de datos

𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)=Frecuencia acumulada de la

clase que antecede a la clase del decil k.

𝑓𝑘=frecuencia de la clase del decil k

c=longitud del intervalo de la clase del decil k.

Page 22: Clase 2 4 medidas estadísticas - dispersión

Ejercicio: Calcular los deciles de la distribución siguiente:

f

[50,60) 8

[60,70) 10

[70,80) 16

[80,90) 14

[90,100) 10

[100,110) 5

[110,120) 2

Page 23: Clase 2 4 medidas estadísticas - dispersión

Cálculo de percentiles

Para datos agrupados:

𝑃𝑘 = 𝐿𝑘 +𝑘

𝑛100

− 𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)

𝑓𝑘𝑐

Para datos no agrupados:

𝑘𝑛

100

Page 24: Clase 2 4 medidas estadísticas - dispersión

Ejercicio:

Determinar el primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla de salarios:

Salarios Número de empleados

200000-299000 85

300000-299000 90

400000-499000 120

500000-599000 70

600000-699000 62

700000-800000 36

Page 25: Clase 2 4 medidas estadísticas - dispersión

Desviación media 𝐷𝑚

Es la división de la sumatoria del valor absoluto de las distancias existentes entre cada dato y su media aritmética y el número de total de datos:

𝐷𝑚 = 𝑋𝑖 − 𝑋 𝑛

𝑖=1

𝑛

**Este indicador muestra que tan disperso se encuentran un

conjunto de datos a un punto de concentración.

Page 26: Clase 2 4 medidas estadísticas - dispersión

Ejercicio:

Halar la desviación media en la siguiente distribución de frecuencias:

Clases f

8-10 3

11-13 6

14-16 9

17-19 11

20-22 5

Page 27: Clase 2 4 medidas estadísticas - dispersión

Desviación Estándar 𝜎

La desviación estándar es la raíz cuadrada de los cuadrados de las desviaciones de los valores de la variable respecto a su media:

𝜎 = 𝑋𝑖−𝑋 2𝑛

𝑖=1

𝑛

**Mide la dispersión de un grupo o población (indica si la población esta muy dispersa respecto de la media) una desviación estándar pequeña indica que la población está muy compacta alrededor de la media.

Page 28: Clase 2 4 medidas estadísticas - dispersión

Varianza 𝜎2

Mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética.

Se define como el cuadrado de la desviación estándar: v=𝜎2

Page 29: Clase 2 4 medidas estadísticas - dispersión

Ejercicio:

Hallar la desviación estándar y la varianza de la siguiente serie de datos: 10, 18, 15, 12, 3, 6, 5, 7.

Page 30: Clase 2 4 medidas estadísticas - dispersión

Ejercicio:

Hallar la desviación estándar y la varianza para la siguiente distribución de frecuencias.

clases f

10-15 2

16-21 8

22-27 13

28-33 10

34-39 6

Page 31: Clase 2 4 medidas estadísticas - dispersión

Próxima clase:

Contenidos:

-- Coeficiente de variación

-- Diagramas de dispersión

-- Covarianza

-- Correlación

-- Regresión lineal por covarianza

-- Regresión lineal por mínimos cuadrados

-- Sesgos, momentos y curtosis