Medidas de Dispersion

21
Agosto 2010 “Tiene por misión, la formación de la persona humana, y el fortalecimiento de la identidad cultural de la nación, fundado con el conocimiento científico y tecnológico, en correspondencia con el desarrollo humano sostenible.” Sesión 5 Medidas de Dispersión Mg. Miriam Mattos

description

estadistica

Transcript of Medidas de Dispersion

Page 1: Medidas de Dispersion

Agosto 2010

“Tiene por misión, la formación de la persona humana,

y el fortalecimiento de la identidad cultural de la

nación, fundado con el conocimiento científico y

tecnológico, en correspondencia con el desarrollo

humano sostenible.”

Sesión 5

Medidas de

Dispersión

Mg. Miriam Mattos

Page 2: Medidas de Dispersion

Definición

Es un tipo de indicador que permite

apreciar el grado de dispersión o

variabilidad existente en el grupo de

variantes en estudio.

Las medidas de tendencia central

tienen como objetivo el sintetizar los

datos en un valor representativo, las

medidas de dispersión nos dicen

hasta que punto estas medidas de

tendencia central son

representativas como síntesis de la

información.

Las medidas de dispersión cuantifican la separación, la dispersión, la

variabilidad de los valores de la distribución respecto al valor central

Page 3: Medidas de Dispersion

• Quizá se desee comparar las

dispersiones de diferentes muestras.

Necesitamos tener habilidad de

reconocerlo y evitar escoger

distribuciones que tengan las

dispersiones más grandes.

La dispersión es importante porque:

• Proporciona información adicional

que permite juzgar la confiabilidad

de la medida de tendencia central.

Si los datos se encuentran

ampliamente dispersos, la posición

central es menos representativa de

los datos.

• Ya que existen problemas

característicos para datos

ampliamente dispersos, debemos

ser capaces de distinguir que

presentan esa dispersión antes de

abordar esos problemas.

Importancia

Page 4: Medidas de Dispersion

Se tomaron las temperaturas en dos regiones “A"

y "B", se registraron los datos que se muestran en

la tabla adjunta.

Al obtener la media, en ambos casos resultó que

la temperatura promedio fue de 20.68º, cuya

interpretación podría ser que en torno, alrededor o

cerca a 20.68º fluctúan los demás valores.

Pero como puede verse, los datos más alejados

en “A” son 19.3º y 22º, que realmente están

próximos a 20.68º; en cambio, los datos más

alejados en “B” son -3º y 39º, que están muy

distantes del promedio.

A B

19.3 -3

20 0

20.2 6

20.4 22

21 31.5

21.3 34

21.3 36

22 39

Promedio: 20.69 20.69

¿Por qué si en ambos casos se tiene igual promedio, no se puede afirmar lo mismo de los

valores que están a su alrededor?.

La respuesta está en que no se ha tomado en cuenta la dispersión, es decir, la manera en

que se disgregan los datos respecto de la media, pues en “A” casi no se dispersan mientras

que en “B” sí, .Cabría decir que el conjunto de datos “A” es bastante compacto mientras que

el “B” es muy dilatado.

Ejemplo

Page 5: Medidas de Dispersion

Medidas de Dispersión absolutas

1. El Rango

2. La Varianza

3. La Desviación Estándar

Medidas de Dispersión Relativas

4. El Coeficiente de Variación

.

Distinguimos entre medidas de

dispersión absolutas, que no

son comparables entre

diferentes muestras y las

relativas que nos permitirán

comparar varias muestras. Las

mas comunes son:

Principales Medidas de Dispersión

Page 6: Medidas de Dispersion

max minR X X

Ejemplo1: para una serie de datos de carácter cuantitativo como es

la hemoglobina en 5 arquitectos:

x1 = 18.5, x2 = 16.5, x3 = 17.0, x4 = 18.2, x5 = 15.5

De este modo, el rango sería la diferencia entre el valor máximo (k) y

el mínimo; o, lo que es lo mismo: R = 185-155 = 30.

1. Rango o Recorrido

La medida de dispersión más inmediata es

el recorrido de la distribución estadística,

también llamado rango o amplitud. Dada una

serie de valores x1, x2, ..., xn, su recorrido es la

diferencia aritmética entre el máximo y el

mínimo de estos valores :

Page 7: Medidas de Dispersion

Ejemplo2: Sea los siguientes datos el tiempo en minutos que corre un arquitecto, a lo largo de 10 días hábiles consecutivos. Calcular el Rango.

39 29 43 52 39

44 40 31 44 35

Para determinar el rango, los datos se ordenan de menor a mayor

29 31 35 39 39 40 43 44 44 52

Rango = 52 - 29 = 23

1.1 Ejemplo

Page 8: Medidas de Dispersion

La Varianza es un valor numérico que cuantifica el grado de alejamiento de

los valores de una variable respecto a su media aritmética.

VARIANZA POBLACIONAL:

VARIANZA MUESTRAL:

2

22

2 1

1 1

n

ii

i

X XX nX

Varianza Sn n

La varianza es el promedio de los cuadrados de los desvíos respecto a la media

aritmética

2

22

2 1

N

ii

i

X XX N X

VarianzaN N

2. Varianza

Page 9: Medidas de Dispersion

Ejemplo: Se pregunto a 10 arquitectos cuántos clientes atendieron en

un mes. Los resultados fueron:

82 66 90 84 75

88 80 94 110 91

Calcular la varianza del numero de pacientes: 10

1

2

2 2 22 1

2

8610

( )(82 86) (66 86) ....(91 86)

1 10 1

1262140.22

9

i

i

n

i

i

x

X h

X X

Sn

S

2.1 Ejemplo

Page 10: Medidas de Dispersion

Se lo define como la raíz cuadrada de la Varianza. Es la medida de

dispersión más utilizada y aparece para simplificar la interpretación de la

varianza.

Desviación Estándar Poblacional

Desviación Estándar Muestral

2

22

1

N

ii

i

X XX N X

N N

2

2 2

1

1 1

n

ii

i

x xx nx

sn n

3. Desviación Estándar para Datos no Agrupados

Page 11: Medidas de Dispersion

Ejemplo: Calcular la desviación estándar del número de meses que

trabajan 10 arquitectos en COSAPI:

82 66 90 84 75 88 80 94 110 91

2

2 1

2 2

( )

1

140.22

n

i

i

X X

Sn

S h

3.1 Ejemplo

En promedio los meses que llevan los arquitectos en COSAPI se alejan de la media en 12 meses aproximadamente.

Page 12: Medidas de Dispersion

. ( )Desv estandar s V x 2.Desv estandar

Se utilizan cuando los datos están agrupados en una tabla de

distribución de frecuencias. Su formulas de cálculo son:

POBLACIONAL:

MUESTRAL:

2 2

2

2 1 1

m m

ii i

i iin X X n X N X

VarianzaN N

2 2

1 1

2

2

1 1

m m

i

i ii i i

n x x n x nx

Varianza sn n

2.Desv estandar s s

4. Varianza y Desviación Estándar para Datos Agrupados

Page 13: Medidas de Dispersion

Se esta analizando el numero de clientes de 80 arquitectos al año, en cierta

inmobiliaria internacional, y se ha obtenido la siguiente distribución de

frecuencias:

Calcular la varianza:

2 2

2

12 46324 80 22.6865.49

1 80 1

m

i

ii

n x nx

sn

N° de yi ni ni*yi ni*yi2 Clientes

Li Ls 5 12 8.5 10 85 722.5

12 19 15.5 14 217 3363.5

19 26 22.5 28 630 14175

26 33 29.5 20 590 17405

33 40 36.5 8 292 10658

TOTAL 80 1814 46324

181422.68

80

i in y

xn

4.1 Ejemplo

Page 14: Medidas de Dispersion

265.49 8.09s s

Del ejemplo anterior calcular e interpretar la desviación estándar

4.2 Ejemplo de Desviación Estándar

En promedio el número de clientes se alejan de su media aritmética en

8 clientes aproximadamente.

Page 15: Medidas de Dispersion

Artesco realizó una encuesta a 60 empresas sobre el número de días que les

dura el papel cansón. Los datos son:

N° de dias xi ni ni*xi ni*xi2 Li Ls

1 5 3 6 18 54

5 9 7 24 168 1176

9 13 11 15 165 1815

13 17 15 10 150 2250

17 21 19 5 95 1805 TOTAL 60 596 7100

2

2

1

2

2 7100 60 9.9319.995

1 60 1

n

ii i

n x nx

sn

5969.93

60

i in x

xn

19.995 4.47s

4.3 Ejemplo

En promedio los días de permanencia del papel cansón se desvían de la media

en 5 días aproximadamente.

Page 16: Medidas de Dispersion

5. Aclaraciones

Dadas dos poblaciones existe

mayor dispersión en aquella que

posee mayor varianza que

equivale a mayor desvío

estándar.

Se interpreta que menor

dispersión implica mayor

concentración de los datos

alrededor de la media aritmética,

obteniendo o logrando mayor

precisión en el tratamiento de la

información.

Teniendo en cuenta las

observaciones anteriores en los

procedimientos y métodos

estadísticos se buscará minimizar

varianzas

Page 17: Medidas de Dispersion

. .% 100S

C Vx

Muestral

Poblacional

. .% 100C V

OBSERVACIÓN:

1. Al realizar comparaciones entre dos variables, el C.V. mas pequeño será el que tenga menor

dispersión relativa.

2. Un C.V. mayor a 0.3 ó 30% indica un alto grado de dispersión y pequeña representatividad de

la media, pero cuanto menor sea a 30% la media será mas representativa.

6. Coeficiente de Variación

Mide la dispersión en los datos

con relación a la media .Es más

útil cuando se trata de hacer

comparaciones entre muestras.

No tiene unidades de medida.

Siempre se expresa en

porcentajes, no en términos de la

unidad de medida de los datos

estudiados

Page 18: Medidas de Dispersion

Calcular el coeficiente de variación del número de horas que leen

diez arquitectos en un mes:

82 66 90 84 75 88 80 94 110 91

11.84. 100

86

. (0.137)(100)

. 13.7%

SC V

x

C V

C V

Sabemos por cálculos que:

86X h 11.84 S horas

El coeficiente de variación es 13.7%<30% por lo tanto la

distribución del número de horas que leen es homogénea o

uniforme

6.1 Ejemplo

Page 19: Medidas de Dispersion

6.2 Ejemplo

Page 20: Medidas de Dispersion

a) 2var 0X S ; la varianza de una variable X es siempre positiva.

b) var 0C : donde C es una constante

c) var X C Var X

d) 2Var CX C Var X ;

e) 2Var CX b C Var X ; C y b constantes

7. Propiedades de la Varianza

Page 21: Medidas de Dispersion

Gracias…