Estadística - UNITEC

27
1 . Estadística. UNITEC Tema 3: Medidas de Posición Prof. L. Lugo Estadística Tema 3: Medidas de Posición

Transcript of Estadística - UNITEC

Page 1: Estadística - UNITEC

1

. Estadística. UNITEC Tema 3: Medidas de Posición Prof. L. Lugo

Estadística

Tema 3: Medidas de Posición

Page 2: Estadística - UNITEC

2

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Estadísticos de posiciónSe define el cuantil de orden k como un valor de la variable por debajo del cual se

encuentra una frecuencia acumulada k.

Icf

Fcnk

LCuantili

1i

i

−+=

Donde:Li = Límite inferior de la clase i; es decir, aquella donde se encuentra el cuantil k.n = número total de valores de x involucrados.c = número total de partes iguales en que dividimos el grupo de datos.fi = frecuencia absoluta de la clase i; es decir, de la clase donde se encuentra el cuantil k.Fi – 1 = frecuencia absoluta acumulada de la clase previa a la clase i; es decir, frecuencia

acumulada de todas las clases previas a la clase donde se encuentra el cuantil k.Ic = intervalo de clase. (longitud del intervalo que abarca la clase)

Page 3: Estadística - UNITEC

3

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Estadísticos de posición

Cuartiles: Dividen a la muestra en 4 grupos con frecuencias similares.

Casos particulares son los cuartiles, quintiles, deciles, percentiles, etc.

Mediana

Deciles: Dividen a la muestra en 10 grupos con frecuencias similares.

Quintiles: Dividen a la muestra en 5 grupos con frecuencias similares.

Percentiles: Dividen a la muestra en 100 grupos con frecuencias similares.

Page 4: Estadística - UNITEC

4

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Estadísticos de posiciónCuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales: primero, segundo y tercer cuartil.

Primer cuartil = Percentil 25

Segundo cuartil = Percentil 50 = mediana

Tercer cuartil = Percentil 75

Para datos no agrupados los cuartiles se ubican, aproximadamente, ordenando y dividiendo el total de datos en 4 grupos con igual número de datos. Para ello se multiplica el total de datos por la fraccióncorrespondiente a cada cuartil. Si el resultado no es un entero se redondea al entero inmediato superior y se ubica ese dato, si el resultado es entero se ubica ese dato y se promedia con el dato siguiente a el.

Para datos agrupados los cuartiles se ubican de la siguiente manera:

Page 5: Estadística - UNITEC

5

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Estadísticos de posición

Icf

F4nk

LQCuartili

1i

ik

−+==

Donde:Li = Límite inferior de la clase i; es decir, aquella donde se encuentra el cuartil k.n = número total de valores involucrados.fi = frecuencia absoluta de la clase i; es decir, de la clase donde se encuentra el cuartil k.Fi – 1 = frecuencia absoluta acumulada de la clase previa a la clase i; es decir, frecuencia

acumulada de todas las clases previas a la clase donde se encuentra el cuartil k.Ic = intervalo de clase. (longitud del intervalo que abarca la clase)

Page 6: Estadística - UNITEC

6

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Estadísticos de posiciónQuintiles: Hay 4 quintiles que dividen a una distribución en 5 partes iguales: primero, segundo, tercero y cuarto quintil.

Primer quintil = Percentil 20Segundo quintil = Percentil 40Tercer quintil = Percentil 60Cuarto quintil = Percentil 80

Para datos no agrupados los quintiles se ubican, aproximadamente, ordenando y dividiendo el total de datos en 5 grupos con igual número de datos. Para ello se multiplica el total de datos por la fraccióncorrespondiente a cada quintil. Si el resultado no es un entero se redondea al entero inmediato superior y se ubica ese dato, si el resultado es entero se ubica ese dato y se promedia con el dato siguiente a el.

Para datos agrupados los quintiles se ubican de la siguiente manera:

Page 7: Estadística - UNITEC

7

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Estadísticos de posición

Icf

F5nk

LqilintQui

1i

ik

−+==

Donde:Li = Límite inferior de la clase i; es decir, aquella donde se encuentra el quintil k.n = número total de valores involucrados.fi = frecuencia absoluta de la clase i; es decir, de la clase donde se encuentra el quintil k.Fi – 1 = frecuencia absoluta acumulada de la clase previa a la clase i; es decir, frecuencia

acumulada de todas las clases previas a la clase donde se encuentra el quintil k.Ic = intervalo de clase. (longitud del intervalo que abarca la clase)

Page 8: Estadística - UNITEC

8

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Estadísticos de posiciónDeciles: Hay 9 deciles que dividen a una distribución en 9 partes iguales:

Primer decil = Percentil 10Segundo decil = Percentil 20Tercer decil = Percentil 30Cuarto decil = Percentil 40Quinto decil = Percentil 50 = medianaSexto decil = Percentil 60Séptimo decil = Percentil 70Octavo decil = Percentil 80Noveno decil = Percentil 90

Para datos no agrupados los deciles se ubican, aproximadamente, ordenando y dividiendo el total de datos en 10 grupos con igual número de datos. Para ello se multiplica el total de datos por la fracción correspondiente a cada decil. Si el resultado no es un entero se redondea al entero inmediato superior y se ubica ese dato, si el resultado es entero se ubica ese dato y se promedia con el dato siguiente a el.

Para datos agrupados los deciles se ubican de la siguiente manera:

Page 9: Estadística - UNITEC

9

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Estadísticos de posición

Icf

F10nk

LDDecili

1i

ik

−+==

Donde:Li = Límite inferior de la clase i; es decir, aquella donde se encuentra el decil k.n = número total de valores involucrados.fi = frecuencia absoluta de la clase i; es decir, de la clase donde se encuentra el decil k.Fi – 1 = frecuencia absoluta acumulada de la clase previa a la clase i; es decir, frecuencia

acumulada de todas las clases previas a la clase donde se encuentra el decil k.Ic = intervalo de clase. (longitud del intervalo que abarca la clase)

Page 10: Estadística - UNITEC

10

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Estadísticos de posiciónPercentiles: Hay 99 percentiles que dividen a una distribución en 100 partes iguales. Se interpretan como el porcentaje de datos que se encuentran agrupados por debajo del percentil considerado.

Para datos no agrupados los percentiles se ubican, aproximadamente, ordenando y dividiendo el total de datos en 100 grupos con igual número de datos. Para ello se multiplica el total de datos por la fracción correspondiente a cada percentil. Si el resultado no es un entero se redondea al entero inmediato superior y se ubica ese dato, si el resultado es entero se ubica ese dato y se promedia con el dato siguiente a el.

Para datos agrupados los percentiles se ubican de la siguiente manera:

Page 11: Estadística - UNITEC

11

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Estadísticos de posición

Icf

F100nk

LPPercentili

1i

ik

−+==

Donde:Li = Límite inferior de la clase i; es decir, aquella donde se encuentra el percentil k.n = número total de valores involucrados.fi = frecuencia absoluta de la clase i; es decir, de la clase donde se encuentra el percentil k.Fi – 1 = frecuencia absoluta acumulada de la clase previa a la clase i; es decir, frecuencia

acumulada de todas las clases previas a la clase donde se encuentra el percentil k.Ic = intervalo de clase. (longitud del intervalo que abarca la clase)

Page 12: Estadística - UNITEC

12

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

EjemplosEl 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué

peso se considera “demasiado bajo”?Percentil 5

¿Qué peso es superado sólo por el 25% de los individuos?Percentil 75

El colesterol se distribuye simétricamente en la población. Se considera patológico los valores extremos. El 90% de los individuos son normales ¿Entre qué valores se encuentran los individuos normales?

Entre el percentil 5 y el 95¿Entre qué valores se encuentran la mitad de los individuos “másnormales” de una población?

Entre el cuartil 1º y 3º

Page 13: Estadística - UNITEC

13

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Ejemplo con datos no agrupadosDe acuerdo con la revista Informes al Consumidor en su número de febrero de

1980, las cuotas anuales de 40 compañías para un seguro de $ 25000 para hombres de 35 años de edad son la siguientes: (en $) (Canavos, 1988. p 5)

112110110109107107107106

103

97

92

86

103

98

93

87

101

95

91

85

105105104103101

100100999995

9595959491

9089898782

Determine: ¿el máximo a cotizar por el cuarto menor de los empleados?, ¿ Por encima de que valor cotizan los empleados en el quintil superior?, ¿Entre que valores cotizan las 8 décimas partes centrales de los empleados?, ¿cuánto es el mínimo a cotizar por el 32 % de los empleados con las mayores cotizaciones?

Page 14: Estadística - UNITEC

14

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

¿El máximo a cotizar por el cuarto menor de los empleados?El cuarto menor de los empleados corresponde al primer cuartil; asi que vamos a

definir este y el máximo a cotizar por ellos será precisamente la frontera de este cuartil.

112110110109107107107106

103

97

9286

103

98

9387

101

95

9185

105105104103101

100100999995

95959594919089898782

( ) 104041

=

( ) ( ) 5,9129291Q1 =

+=

Primero multiplicamos el total de datos por la fracción correspondiente al primer cuartil.

Dado que el resultado es entero, promediamos el dato 10 con el dato 11, obteniendo el primer cuartil.

91,5 $ es la máxima cotización anual entre los empleados que se ubican en la cuarta parte que menos cotiza.

Page 15: Estadística - UNITEC

15

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

¿ Por encima de que valor cotizan los empleados en el quintil superior?

El quintil superior corresponde a los empleados que están por encima del cuarto quintil; asi que vamos a definir este y el valor por encima del cual cotiza el quintil superior será precisamente la frontera del cuarto quintil.

112110110109107107107106

103

97

9286

103

98

9387

101

95

9185

105105104103101

100100999995

95959594919089898782

( ) 324054

=

( ) ( ) 5,1052105106q4 =

+=

Primero multiplicamos el total de datos por la fracción correspondiente al cuarto quintil.

Dado que el resultado es entero, promediamos el dato 32 con el dato 33, obteniendo el cuarto quintil.

Los empleados del quintil superior tienen una cotización anual que supera los 105,5 $

Page 16: Estadística - UNITEC

16

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

¿Entre que valores cotizan las 8 décimas partes centrales de los empleados?

Las 8 décimas partes centrales se refiere a los empleados que se ubican entre el primer decil y el noveno decil. Por tanto debemos calcular estos y obtenemos el intervalo de cotizaciones que se está solicitando.

112110110109107107107106

103

97

9286

103

98

9387

101

95

9185

105105104103101

100100999995

95959594919089898782

( ) ( ) 3640109440

101 =∧=

( ) ( ) 8728787D1 =

+=

Primero multiplicamos el total de datos por la fracción correspondiente al primer decil y al noveno decil.

Dado que el resultado es entero, promediamos el dato 4 con el dato 5 y el dato 36 con el dato 37, obteniendo el primero y el noveno deciles.

Las 8 décimas partes centrales de los empleados cotizan entre 87 y 108 $ anuales.

( ) ( ) 1082109107D9 =

+=

Page 17: Estadística - UNITEC

17

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

¿Cuánto es el mínimo a cotizar por el 32 % de los empleados con las mayores cotizaciones?

El 32% de los empleados con las mayores cotizaciones se refiere a los empleados que están por encima del percentil 68. Por tanto calculamos este último y el límite de este percentil es precisamente la respuesta.

112110110109107107107106

103

97

9286

103

98

9387

101

95

9185

105105104103101

100100999995

95959594919089898782

( ) 2,274010068

=

103P68 =

Primero multiplicamos el total de datos por la fracción correspondiente al 68 percentil.

Dado que el resultado no es entero, redondeamos al entero inmediato; es decir, al dato 28, obteniendo el 68 percentil.

103 $ es la mínima cotización anual entre el 32 % de los empleados que hacen las mayores cotizaciones anuales.

Page 18: Estadística - UNITEC

18

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Ejemplo con datos agrupadosPara el ejemplo de los salarios semanales de los 65 empleados de la empresa P&R (clase

pasada), hallar, agrupándolos en una tabla de distribución de frecuencias, ¿cuánto gana el segundo cuartil?, ¿cuál es el mínimo salario de los dos quintos superiores?, ¿cuál es el máximo salario de los cuatro deciles centrales?, ¿cuál es el máximo salario del 45% de los empleados que menos ganan?.

319.5295283276.75263314.1294.25282275262308293281.5272.5261

306.35292281.35272.25260.25305288281272260304287279271258

302.75286.5279271256299.5286.3279270.8255.5299286278267253

296.25286278266.75253296285277.55265252.5296284277263.5251295283.25277263250

Page 19: Estadística - UNITEC

19

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

Ejemplo con datos agrupados

.10Icunyclases7contablaunaconstruirpodemos,Asi705,692505,319R

=≅=−=

En cada clase vamos a considerar incluidos los límites inferiores; y por ende, excluidos los límites superiores.

630652315310 - 3201525635305300 – 310

26501810265260 – 27044003416275270 – 28039904814285280 – 29029505810295290 – 300

250 – 260Ic

204088255xi*fiFifixi

Page 20: Estadística - UNITEC

20

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

En primer lugar hallamos los límites correspondientes al segundo cuartil; es decir, entre los datos 16 y 17 para el primer cuartil (segunda clase) y entre los datos 32 y 33 para el segundo cuartil (tercera clase).

Calculamos cada uno aplicando la fórmula anterior.

( ) 25,2681010

8465

260Q1 =

−+=

Icf

F4nk

LQCuartili

1i

ik

−+==

( )( ) 06,27910

16

1842*65

270Q2 =

−+=

Los empleados ubicados en el segundo cuartiltienen un salario semanal que oscila entre 268,25 y 279,06 $.

Observe que el límite del segundo cuartil es la mediana que calculamos la semana pasada.

¿Cuánto gana el segundo cuartil?

Page 21: Estadística - UNITEC

21

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

8

18

34

48

5863 65

0

10

20

30

40

50

60

70

255 265 275 285 295 305 315

Salario Semanal

Frec

uenc

ia A

cum

ulad

a

Ojiva de Frecuencias Acumuladas

Q1(268,25)

Q2 = Mediana(279,06)

Page 22: Estadística - UNITEC

22

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

En primer lugar hallamos el límite correspondientes al tercer quintil; es decir, las tres quintas partes del total de datos, o sea entre los datos 39 y 40 que se encuentran en la cuarta clase.

Calculamos aplicando la fórmula anterior.

( )( ) 57,28310

14

3453*65

280q3 =

−+=

Los empleados ubicados en los dos quintos superiores tienen un salario semanal superior a 283,57 $.

¿Cuál es el mínimo salario de los dos quintos superiores?

Icf

F5nk

LqilintQui

1i

ik

−+==

Page 23: Estadística - UNITEC

23

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

8

18

34

48

5863 65

0

10

20

30

40

50

60

70

255 265 275 285 295 305 315

Salario Semanal

Frec

uenc

ia A

cum

ulad

a

Ojiva de Frecuencias Acumuladas

q3(283,57)

Page 24: Estadística - UNITEC

24

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

En primer lugar hallamos el límite correspondiente al séptimo decil; es decir, entre los datos 45 y 46 (cuarta clase).

Calculamos aplicando la fórmula anterior.

( )( ) 71,28910

14

34107*65

280D7 =

−+=

Los empleados ubicados en los cuatro deciles centrales tienen un salario semanal máximo de 289,71 $.

¿Cuál es el máximo salario de los cuatro deciles centrales?

Icf

F10nk

LDDecili

1i

ik

−+==

Page 25: Estadística - UNITEC

25

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

8

18

34

48

5863 65

0

10

20

30

40

50

60

70

255 265 275 285 295 305 315

Salario Semanal

Frec

uenc

ia A

cum

ulad

a

Ojiva de Frecuencias AcumuladasD7

(289,71)

Page 26: Estadística - UNITEC

26

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

En primer lugar hallamos el límite correspondientes al 45 percentil; es decir, multiplicar por 0,45 el total de datos, o sea entre los datos 29 y 30 que se encuentran en la tercera clase.

Calculamos aplicando la fórmula anterior.

( )( ) 03,27710

16

1810045*65

270P45 =

−+=

El máximo salario semanal del 45 % de los empleados que menos ganan es 277,03 $.

¿Cuál es el máximo salario del 45% de los empleados que menos ganan? Ic

f

F100nk

LPPercentili

1i

ik

−+==

Page 27: Estadística - UNITEC

27

Tema 3: Medidas de Posición Prof. L. Lugo. Estadística. UNITEC

8

18

34

48

5863 65

0

10

20

30

40

50

60

70

255 265 275 285 295 305 315

Salario Semanal

Frec

uenc

ia A

cum

ulad

a

Ojiva de Frecuencias Acumuladas

P45(277,03)