Medidas de Dispersion

Post on 11-Feb-2016

7 views 0 download

description

estadistica

Transcript of Medidas de Dispersion

Agosto 2010

“Tiene por misión, la formación de la persona humana,

y el fortalecimiento de la identidad cultural de la

nación, fundado con el conocimiento científico y

tecnológico, en correspondencia con el desarrollo

humano sostenible.”

Sesión 5

Medidas de

Dispersión

Mg. Miriam Mattos

Definición

Es un tipo de indicador que permite

apreciar el grado de dispersión o

variabilidad existente en el grupo de

variantes en estudio.

Las medidas de tendencia central

tienen como objetivo el sintetizar los

datos en un valor representativo, las

medidas de dispersión nos dicen

hasta que punto estas medidas de

tendencia central son

representativas como síntesis de la

información.

Las medidas de dispersión cuantifican la separación, la dispersión, la

variabilidad de los valores de la distribución respecto al valor central

• Quizá se desee comparar las

dispersiones de diferentes muestras.

Necesitamos tener habilidad de

reconocerlo y evitar escoger

distribuciones que tengan las

dispersiones más grandes.

La dispersión es importante porque:

• Proporciona información adicional

que permite juzgar la confiabilidad

de la medida de tendencia central.

Si los datos se encuentran

ampliamente dispersos, la posición

central es menos representativa de

los datos.

• Ya que existen problemas

característicos para datos

ampliamente dispersos, debemos

ser capaces de distinguir que

presentan esa dispersión antes de

abordar esos problemas.

Importancia

Se tomaron las temperaturas en dos regiones “A"

y "B", se registraron los datos que se muestran en

la tabla adjunta.

Al obtener la media, en ambos casos resultó que

la temperatura promedio fue de 20.68º, cuya

interpretación podría ser que en torno, alrededor o

cerca a 20.68º fluctúan los demás valores.

Pero como puede verse, los datos más alejados

en “A” son 19.3º y 22º, que realmente están

próximos a 20.68º; en cambio, los datos más

alejados en “B” son -3º y 39º, que están muy

distantes del promedio.

A B

19.3 -3

20 0

20.2 6

20.4 22

21 31.5

21.3 34

21.3 36

22 39

Promedio: 20.69 20.69

¿Por qué si en ambos casos se tiene igual promedio, no se puede afirmar lo mismo de los

valores que están a su alrededor?.

La respuesta está en que no se ha tomado en cuenta la dispersión, es decir, la manera en

que se disgregan los datos respecto de la media, pues en “A” casi no se dispersan mientras

que en “B” sí, .Cabría decir que el conjunto de datos “A” es bastante compacto mientras que

el “B” es muy dilatado.

Ejemplo

Medidas de Dispersión absolutas

1. El Rango

2. La Varianza

3. La Desviación Estándar

Medidas de Dispersión Relativas

4. El Coeficiente de Variación

.

Distinguimos entre medidas de

dispersión absolutas, que no

son comparables entre

diferentes muestras y las

relativas que nos permitirán

comparar varias muestras. Las

mas comunes son:

Principales Medidas de Dispersión

max minR X X

Ejemplo1: para una serie de datos de carácter cuantitativo como es

la hemoglobina en 5 arquitectos:

x1 = 18.5, x2 = 16.5, x3 = 17.0, x4 = 18.2, x5 = 15.5

De este modo, el rango sería la diferencia entre el valor máximo (k) y

el mínimo; o, lo que es lo mismo: R = 185-155 = 30.

1. Rango o Recorrido

La medida de dispersión más inmediata es

el recorrido de la distribución estadística,

también llamado rango o amplitud. Dada una

serie de valores x1, x2, ..., xn, su recorrido es la

diferencia aritmética entre el máximo y el

mínimo de estos valores :

Ejemplo2: Sea los siguientes datos el tiempo en minutos que corre un arquitecto, a lo largo de 10 días hábiles consecutivos. Calcular el Rango.

39 29 43 52 39

44 40 31 44 35

Para determinar el rango, los datos se ordenan de menor a mayor

29 31 35 39 39 40 43 44 44 52

Rango = 52 - 29 = 23

1.1 Ejemplo

La Varianza es un valor numérico que cuantifica el grado de alejamiento de

los valores de una variable respecto a su media aritmética.

VARIANZA POBLACIONAL:

VARIANZA MUESTRAL:

2

22

2 1

1 1

n

ii

i

X XX nX

Varianza Sn n

La varianza es el promedio de los cuadrados de los desvíos respecto a la media

aritmética

2

22

2 1

N

ii

i

X XX N X

VarianzaN N

2. Varianza

Ejemplo: Se pregunto a 10 arquitectos cuántos clientes atendieron en

un mes. Los resultados fueron:

82 66 90 84 75

88 80 94 110 91

Calcular la varianza del numero de pacientes: 10

1

2

2 2 22 1

2

8610

( )(82 86) (66 86) ....(91 86)

1 10 1

1262140.22

9

i

i

n

i

i

x

X h

X X

Sn

S

2.1 Ejemplo

Se lo define como la raíz cuadrada de la Varianza. Es la medida de

dispersión más utilizada y aparece para simplificar la interpretación de la

varianza.

Desviación Estándar Poblacional

Desviación Estándar Muestral

2

22

1

N

ii

i

X XX N X

N N

2

2 2

1

1 1

n

ii

i

x xx nx

sn n

3. Desviación Estándar para Datos no Agrupados

Ejemplo: Calcular la desviación estándar del número de meses que

trabajan 10 arquitectos en COSAPI:

82 66 90 84 75 88 80 94 110 91

2

2 1

2 2

( )

1

140.22

n

i

i

X X

Sn

S h

3.1 Ejemplo

En promedio los meses que llevan los arquitectos en COSAPI se alejan de la media en 12 meses aproximadamente.

. ( )Desv estandar s V x 2.Desv estandar

Se utilizan cuando los datos están agrupados en una tabla de

distribución de frecuencias. Su formulas de cálculo son:

POBLACIONAL:

MUESTRAL:

2 2

2

2 1 1

m m

ii i

i iin X X n X N X

VarianzaN N

2 2

1 1

2

2

1 1

m m

i

i ii i i

n x x n x nx

Varianza sn n

2.Desv estandar s s

4. Varianza y Desviación Estándar para Datos Agrupados

Se esta analizando el numero de clientes de 80 arquitectos al año, en cierta

inmobiliaria internacional, y se ha obtenido la siguiente distribución de

frecuencias:

Calcular la varianza:

2 2

2

12 46324 80 22.6865.49

1 80 1

m

i

ii

n x nx

sn

N° de yi ni ni*yi ni*yi2 Clientes

Li Ls 5 12 8.5 10 85 722.5

12 19 15.5 14 217 3363.5

19 26 22.5 28 630 14175

26 33 29.5 20 590 17405

33 40 36.5 8 292 10658

TOTAL 80 1814 46324

181422.68

80

i in y

xn

4.1 Ejemplo

265.49 8.09s s

Del ejemplo anterior calcular e interpretar la desviación estándar

4.2 Ejemplo de Desviación Estándar

En promedio el número de clientes se alejan de su media aritmética en

8 clientes aproximadamente.

Artesco realizó una encuesta a 60 empresas sobre el número de días que les

dura el papel cansón. Los datos son:

N° de dias xi ni ni*xi ni*xi2 Li Ls

1 5 3 6 18 54

5 9 7 24 168 1176

9 13 11 15 165 1815

13 17 15 10 150 2250

17 21 19 5 95 1805 TOTAL 60 596 7100

2

2

1

2

2 7100 60 9.9319.995

1 60 1

n

ii i

n x nx

sn

5969.93

60

i in x

xn

19.995 4.47s

4.3 Ejemplo

En promedio los días de permanencia del papel cansón se desvían de la media

en 5 días aproximadamente.

5. Aclaraciones

Dadas dos poblaciones existe

mayor dispersión en aquella que

posee mayor varianza que

equivale a mayor desvío

estándar.

Se interpreta que menor

dispersión implica mayor

concentración de los datos

alrededor de la media aritmética,

obteniendo o logrando mayor

precisión en el tratamiento de la

información.

Teniendo en cuenta las

observaciones anteriores en los

procedimientos y métodos

estadísticos se buscará minimizar

varianzas

. .% 100S

C Vx

Muestral

Poblacional

. .% 100C V

OBSERVACIÓN:

1. Al realizar comparaciones entre dos variables, el C.V. mas pequeño será el que tenga menor

dispersión relativa.

2. Un C.V. mayor a 0.3 ó 30% indica un alto grado de dispersión y pequeña representatividad de

la media, pero cuanto menor sea a 30% la media será mas representativa.

6. Coeficiente de Variación

Mide la dispersión en los datos

con relación a la media .Es más

útil cuando se trata de hacer

comparaciones entre muestras.

No tiene unidades de medida.

Siempre se expresa en

porcentajes, no en términos de la

unidad de medida de los datos

estudiados

Calcular el coeficiente de variación del número de horas que leen

diez arquitectos en un mes:

82 66 90 84 75 88 80 94 110 91

11.84. 100

86

. (0.137)(100)

. 13.7%

SC V

x

C V

C V

Sabemos por cálculos que:

86X h 11.84 S horas

El coeficiente de variación es 13.7%<30% por lo tanto la

distribución del número de horas que leen es homogénea o

uniforme

6.1 Ejemplo

6.2 Ejemplo

a) 2var 0X S ; la varianza de una variable X es siempre positiva.

b) var 0C : donde C es una constante

c) var X C Var X

d) 2Var CX C Var X ;

e) 2Var CX b C Var X ; C y b constantes

7. Propiedades de la Varianza

Gracias…