Presentacion modulo 4 Estadistica i

30
1 Métodos para el análisis descriptivo: Variabilidad Estadística

Transcript of Presentacion modulo 4 Estadistica i

1

Métodos para el análisis descriptivo: Variabilidad

Estadística

Medidas de Variación

2

La variación es la cantidad de dispersión o

“separación” que presentan los datos entre sí.

Los edificios B están más separados que los de grupoA. La dispersión en B es mayor que en A.

Rango

3

Tal como se vio en las distribuciones de frecuencia, el

rango es el valor que se encuentra restando los valores

mayor y menor de los datos de una muestra con sus

datos ordenados.

menorDatomayorDatoRango

Ejemplo

4

Se define en minutos el tiempo que le lleva arreglarse,

desde que se levanta hasta que sale de casa. A lo largo de

10 días hábiles consecutivos, Usted recaba los tiempos

(redondeados a minutos) que se muestra a continuación

39 29 43 52 39

44 40 31 44 35

Ejemplo

5

Para determinar el rango de los tiempos necesario para

arreglarse, los datos se ordenan de menor a mayor

29 31 35 39 39 40 43 44 44 52

Rango = 52 - 29 = 23

6

Rango Intercuartil

13 QQilIntercuartRango

El rango intercuartil se obtiene al restar el primer cuartil

del tercer cuartil.

Esta medida considera la dispersión de la mitad de los

datos; por lo tanto los valores extremos no influyen en los

resultados.

7

29 31 35 39 39 40 43 44 44 52

Para calcular el rango intercuartil del tiempo necesario

para arreglarse antes de salir al trabajo se siguen los

siguientes pasos:

(1))Ordenar de menor a mayor la muestra

(2) Calcular el cuartil 1 y el 3

Muestra de tamaño 10 ya ordenada

Ejemplo

Ejemplo

8

29 31 35 39 39 40 43 44 44 52

9

3544

44)8()25.8()4

33()

4

)110(3(

35)3()75.2()4

)11(1()

4

)110(1(

13

3

1

RI

QQRI

vpvpvpvpQ

vpvpvpvpQ

El rango intercuartil consta de 9 numerales

Posición 3 Posición 8

Desviación Media

9

La desviación media es la media aritmética de los valores

absolutos de las desviaciones respecto a la media.

La desviación media se representa por 𝐷𝑚

Ejemplo

Media

ഥ𝒙 =𝟐+𝟑+𝟔+𝟖+𝟏𝟏

𝟓=6

Desviación media

𝐷𝑚 =2−6 + 3−6 + 6−6 + 8−6 + 11−6

5= 2.8

2 3 6 8 11

Varianza y Desviación Estándar

10

La varianza y la desviación estándar toman en cuenta

cómo se distribuyen los datos entre sí. Estas medidas

evalúan la manera en que fluctúan los valores respecto

a la media aritmética (promedio).

Lo anterior la convierte en una fuerte herramienta con

la suficiente confianza para preparar conclusiones y

proyecciones.

11

Varianza

S2 = Varianza

Xi = Dato u observación

ҧ𝑥 = Media Aritmética

n = Tamaño de la muestra

1

)(1

2

2

n

XX

S

n

i

i

La varianza muestral es la suma de los cuadrados de las

diferencias con relación a la media aritmética dividida

entre el cuadrado de la muestra menos 1.

12

1

)(1

2

2

n

XX

S

n

i

i

1. Se calcula la media aritmética

2. A cada dato de la muestra se le resta el valor de media aritmética

3. El resultado de la resta se eleva al cuadrado

4. Se suman todos los cuadrados obtenidos

5. Dividir el resultado entre total de muestra menos 1

El proceso para calcular la varianza se resume así:

Ejemplo

13

Se define en minutos el tiempo que le lleva arreglarse,

desde que se levanta hasta que sale de casa. A lo largo de

10 días hábiles consecutivos, Usted recaba los tiempos

(redondeados a minutos) que se muestra a continuación

39 29 43 52 39

44 40 31 44 35

14

29 31 35 39 39 40 43 44 44 52

Para calcular la varianza de la muestra de los tiempos que

tardó en arreglarse por la mañana durante 10 días se sigue

el siguiente proceso:

(1) Calcular la media aritmética

(2) Calcular la varianza

Muestra de tamaño 10 ya ordenada

El ordenamiento es opcional

15

39 29 43 52 39

44 40 31 44 35

Datos de la muestra

min6.39

10

396

10

35443140443952432939

10

10

1

X

X

X

x

X i

i

El tiempo que tarda

para arreglarse es

aproximadamente

40 minutos cada día

16

Tiempo (x)

Paso 1 Paso 2

29 29 - 40 = -11 (-11)2 = 121

31 31 - 40 = -9 (-9)2 = 81

35 35 - 40 = -5 (-5)2 = 25

39 39 - 40 = -1 (-1)2 = 1

39 39 - 40 = -1 (-1)2 = 1

40 40 - 40 = 0 (0)2 = 0

43 43 - 40 = 3 (3)2 = 9

44 44 - 40 = 4 (4)2 = 16

44 44 - 40 = 4 (4)2 = 16

52 52 - 40 = 12 (12)2 = 144

Sumatoria 414

17

46

9

414

110

414

1

)(

2

2

2

1

2

2

S

S

S

n

XX

S

n

i

i

La varianza es de 46 minutos cuadrados

18

Desviación Estándar

1

)(1

2

n

XX

S

n

i

i

La desviación estándar de la muestra es la raíz cuadrada

de la varianza.

Ejemplo

19

29 31 35 39 39 40 43 44 44 52

46

1

)(

2

1

2

2

S

n

XX

S

n

i

i

Para calcular la desviación estándar de la muestra de los

tiempos que tarda en arreglarse por la mañana durante 10

días se calcula la raíz cuadrada de la varianza

20

7823.6

46

1

)(

2

1

2

S

S

SS

n

XX

S

n

i

i

La desviación estándar con respecto a la media

aritmética es de 6.78 minutos por día

21

Coeficiente de Variación

A diferencia de las medidas que hemos estudiado hastaahora, el coeficiente de variación es una indicaciónrelativa de la variación.Siempre se expresa en porcentajes, no en términos de launidad de medida de los datos estudiados.

Mide la dispersión en los datos con relación a la media.Es más útil cuando se trata de hacer comparaciones entremuestras.

22

100*X

SCV

El coeficiente de variación se calcula de la

siguiente manera:

Donde:

S = Desviación estándar

ҧ𝑥 = Media Aritmética

23

29 31 35 39 39 40 43 44 44 52

min6.39

10

10

1

X

x

X i

i

7823.6

1

)(1

2

S

n

XX

S

n

i

i

Para calcular el coeficiente de variación de la muestra de los

tiempos que tarda en arreglarse por la mañana durante 10 días

se divide la desviación estándar entre la media aritmética y el

resultado se multiplica por 100.

Ejemplo

24

%96.16

)100)(016956(

)100(40

7823.6

CV

CV

X

SCV

• El valor de la media aritmética es 40

• El valor de la desviación estándar es 6.7823

El coeficiente de variación es 16.96%

25

Varianza y Desviación Estándar de

Datos Agrupados

26

27

• 𝜎 2 = varianza de la población

• 𝜎 =desviación estándar de la población

• f= frecuencia de cada una de las clases

• x= punto medio de cada clase

• µ= media de la población

• N= tamaño de la población

28

El vicepresidente de mercadotecnia de una

cadena de restaurantes de comida rápida está

estudiando el desarrollo de las ventas de las 100

sucursales que se encuentran en el distrito

oriental y ha elaborado la siguiente distribuciónde frecuencias para las ventas anuales:

29

Venta (miles) Frecuencia Ventas (miles) Frecuencia

700 - 799 4 1,300 – 1,399 13

800 - 899 7 1,400 – 1,499 10

900 - 999 8 1,500 – 1,599 9

1,000 – 1,099 10 1,600 – 1,699 7

1,100 – 1,199 12 1,700 – 1,799 2

1,2000 – 1,299 17 1,800 – 1,899 1

El vicepresidente desea comparar las ventas del distrito oriental con

las ventas de otros tres distritos del país. Para llevar a cabo esto,

hará un resumen de la distribución, poniendo especial cuidado en el

acopio de información sobre la tendencia central de los datos. En

este capítulo analizaremos también cómo se puede medir la

variabilidad de una distribución y, por tanto, cómo obtener una

percepción mucho mejor de los datos.

30