Medidas de Dispersión o Variabilidad

31
Blondell, Reinaldo Barrios, José Medidas de Dispersión o Variabilidad ESTADÍSTICA

Transcript of Medidas de Dispersión o Variabilidad

Blondell, ReinaldoBarrios, José

Medidas de Dispersióno Variabilidad

ESTADÍSTICA

Medidas de Dispersión

Información adicional que debe indicar el grado de dispersión de las Calificaciones alrededor de la media de

tendencia central

x

σ

µ

%

Caso de Estudio

Apartamentos en Alquiler

Tomemos una muestra de los valores de alquiler mensuales para un Apartamento de una habitación. Los datos son una muestra de 28 apartamentos en una ciudad. Los datos se presentan en orden ascendente.

Datos No Agrupados

425 430 430 435 435 435 435 435 440 440440 440 440 445 445 445 445 445 450 450450 450 450 450 450 460 460 460

Distribución de Frecuencia No Agrupadas

Xi Fi

425 1430 2435 5440 5445 5450 7460 3

∑ 28

Repaso

Media Aritmética

Percentiles

Cuartiles

MEDIA ARITMETICA

La Media de un conjunto de datos es el promedio de todos los valores de los datos.

Datos no agrupadosDist. De frecuencia

Agrupada y no agrupada

Datos No Agrupados

Dist. De Frecuencia No Agrupadas

PERCENTILES PUn percentil provee información de cómo los datos están dispersos sobre un intervalo desde el valor mas pequeño hasta el valor mas grande.

Como se Calcula Ejemplo

• Acomodar los datos en orden ascendente.• Calcular el índice i, la posición de el percentil

p-esimo.

i = (p/100)n

• Si i no es entero, redondee hacia arriba. El percentil p-esimo es el valor en la posición i .

• Si i es un entero, el percentil p-esimo es el promedio de los valores en las posiciones i e i+1

Percentil de 25

425 430 430 435 435 435 435 435 440 440440 440 440 445 445 445 445 445 450 450450 450 450 450 450 460 460 460

Percentil de 25

i = (p/100)n = (25/100)28 = 7

Promediando los valores de los datos 7mo y 8vo :

Percentil de 25 = (435 + 435)/2 = 435

CUARTILES QLos Cuartiles son percentiles específicos

• Primer Cuartil = Percentil de 25 = Q1

• Segundo Cuartil = Percentil de 50 = Mediana = Q2

• Tercer Cuartil = Percentil de 75 = Q3

425 430 430 435 435 435 435 435 440 440440 440 440 445 445 445 445 445 450 450450 450 450 450 450 460 460 460

Percentil de 75 = Q3

i = (p/100)n = (75/100)28 = 21

Promediando los valores de los datos 21vo y 22vo :

Percentil de 75 = (450 + 450)/2 = 450

Medidas de Variabilidad

Rango Desviación Media Varianza Desviación Estándar Rango Intercuartil Calificación Z Coeficiente de Variación

RANGO O CAMPO DE VARIACION RANGO• El rango de un conjunto de datos es la diferencia entre los valores más grande y

más pequeño • Es la medida mas simple de variabilidad• Es muy sensitivo a los valores muy pequeños o muy grandes

425 430 430 435 435 435 435 435 440 440440 440 440 445 445 445 445 445 450 450450 450 450 450 450 460 460 460

Rango

Rango = valor mayor – valor menorRango = 460 - 425 = 35

Distribución de Frecuencia No Agrupadas

Xi Fi Fi Xi

425 1 425 425 – 443,39 = -18,39 18,39 18,39

430 2 860 430 – 443,39 = -13,39 13,39 26,78

435 5 2175 435 – 443,39 = -8,39 8,39 41,95

440 5 2200 440 – 443,39 = -3,39 3,39 16,95

445 5 2225 445 – 443,39 = 1,61 1,61 8,05

450 7 3150 450 – 443,39 = 6,61 6,61 46,27

460 3 1380 460 – 443,39 = 16,61 16,61 49,83

∑ 28 12415 68,39 208,22

DESVIACIÓN MEDIA DM• Es la media de las diferencias en valor absoluto de los valores a la media.• Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil

manipular dicha función al no ser derivable.

Datos No AgrupadosDistribución de Frecuencia

Agrupada y no Agrupada

Dist. De Frecuencia No Agrupadas

Interpretación

La dispersión promedio de los precios de un apartamento de una habitación con respecto a la media es de 7,44

VARIANZA

• La varianza es una medida de variabilidad que utiliza todos los datos.• Esta basada en la diferencia entre los valores de cada observación (xi) y la media.

(x para una muestra, µ para una población).

Número de Datos

Datos No AgrupadosDistribución de Frecuencia

Agrupada y no Agrupada

N>=30

N<30

Población

Xi Fi Fi Xi

425 1 425 425 – 443,39 = -18,39 338,19 338,19

430 2 860 430 – 443,39 = -13,39 179,29 358,58

435 5 2175 435 – 443,39 = -8,39 70,39 351,96

440 5 2200 440 – 443,39 = -3,39 11,49 57,46

445 5 2225 445 – 443,39 = 1,61 2,59 12,96

450 7 3150 450 – 443,39 = 6,61 43,69 305,84

460 3 1380 460 – 443,39 = 16,61 275,89 827,68

∑ 28 12415 921,54 2.252,68

Distribución de Frecuencia No Agrupadas

Dist. De Frecuencia No Agrupadas

Interpretación

La dispersión promedio de los precios de un apartamento de una habitación con respecto a la media es de 83,43

DESVIACION ESTANDAR O TIPICA S• La desviación estándar de un conjunto de datos es la raíz cuadrada positiva de la

varianza.• Se mide en las mismas unidades que los datos, haciéndola mas comparable, que la

variancia, a la media.

Si el Conjunto de Datos es una Muestra se denota por S

Si el Conjunto de Datos es una Población se denota por σ (sigma)

Dist. De Frecuencia No Agrupadas

Interpretación

La dispersión promedio de los precios de un apartamento de una habitación es de 9,13 con respecto a la media

Importancia de la Desviación Estándar

Permite una interpretación precisa de los datos dentro de una distribución

Provee una mejor estimación del error en la predicción de los datos

Es miembro de un sistema matemático, que permite su utilización en consideraciones estadísticas más avanzadas

RANGO INTERCUARTIL R.I.C• El rango intercuartil de un conjunto de datos es la diferencia entre el tercer cuartil

y el primer cuartil.• Es el rango donde se encuentra el 50% central de los datos.• Elimina la sensibilidad de los valores de datos extremos.• Se utiliza para superar la inestabilidad del rango como medida de dispersión

Como se Calcula Ejemplo

Q3 - Q1 = 450 - 435 = 15

Rango Intercuartil

3er. Cuartil (Q3) = 450

1er. Cuartil (Q1) = 435

Rango intercuartil = Q3 - Q1 = 450 - 435 = 15

Entre los precios correspondientes al cuartil tres y el cuartil uno, existen 15 puntos de diferencia

425 430 430 435 435 435 435 435 440 440440 440 440 445 445 445 445 445 450 450450 450 450 450 450 460 460 460

CALIFICACION ESTANDAR O Z Z• El valor z es frecuentemente llamado el valor estandarizado• Denota el numero de desviaciones estándar que el valor de un dato xi está de la media.• Un dato con valor menor que la media de la muestra tendrá un valor de z menor que cero.• Un dato con valor mayor que el promedio de la muestra tendrá un valor de z mayor que cero• Un dato con valor igual que el promedio de la muestra tendrá un valor de z igual a cero

Como se Calcula Ejemplo

-2,01 -1,47 -1,47 -0,92 -0,92 -0,92 -0,92 -0,92 -0,37 -0,37-0,37 -0,37 -0,37 0,18 0,18 0,18 0,18 0,18 0,72 0,720,72 0,72 0,72 0,72 0,72 1,82 1,82 1,82

Valor z del menor valor (425)

Valores estandarizados para Apartamentos en renta

COEFICIENTE DE VARIACIÓN CVEl coeficiente de variación indica que tan grande es la desviación estándar en relación

al promedio.

Como se Calcula Ejemplo

Interpretación

La distribución promedio de los precios de un apartamento de una habitación presenta menor variación o es menos heterogénea.

Bibliografía

© 2002 South-Western /Thomson Learning© 2002 South-Western /Thomson Learning

Tomar nota de los Ejercicios Indicados por

la Profesora