Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición:...

32
Medidas descriptivas

Transcript of Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición:...

Page 1: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Medidas descriptivas

Page 2: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

• Los fenómenos biológicos no suelen ser

constantes, por lo que será necesario

que junto a una medida que indique el

valor alrededor del cual se agrupan los

datos, se asocie una medida que haga

referencia a la variabilidad que refleje

dicha fluctuación.

Page 3: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

• La tendencia central de los datos.

• La dispersión o variación con respecto a

este centro.

• Los datos que ocupan ciertas posiciones.

• La simetría de los datos.

• La forma en la que los datos se agrupan.

Page 4: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Medidas representativas de un

conjunto de datos estadísticos

Page 5: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Estadísticos de tendencia

central

• la media

• la mediana

• la moda

En ciertas ocasiones estos tres

estadísticos suelen coincidir, aunque

generalmente no es así. Cada uno de

ellos presenta ventajas e inconvenientes.

Page 6: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

La media

• Es la medida mas popular.

• Es decir, tenemos una muestra de n observaciones: x1, x2,…,xn. Su media muestral es:

• De forma compacta:n

)x...xx( n21 +++=x

=

=n

1i

ixn

1x

Suma de las observaciones

Número de observacionesMedia =

Page 7: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

=+++++

=

= =

6

xxxxxx

6

xx 654321i

61i

• Ejemplo:

La media de la muestra de seis

observaciones:

7, 3, 9, -2, 4, 6

esta dada por:

7 3 9 4 64.5

2−

Page 8: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

16 empleados

5.116

)3(2)2(7)1(4)0(3

16

x...xx

16

xx 1621i

161i =

+++=

++=

= =

Medidas de Posición Central: la media

Cuando muchas observaciones toman el mismo valor, estas se pueden

resumir en una tabla de frecuencias. Supongamos que el número de

Hijos en una muestra de 16 empleados fuera el siguiente:

NUMERO DE HIJOS 0 1 2 3

NUMERO DE EMPLEADOS 3 4 7 2

• Ejemplo:

Page 9: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Propiedades de la media

• La suma de los desvíos de los valores de la

variable, calculado con respecto de la media

aritmética es = 0

=−

=−

0)(

0)(

ii

i

nXx

Xx

Page 10: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

• La media aritmética

del producto de una

constante por una

variable es = a la

constante por la

media aritmética de

la variable:

Xaxa .. =

Page 11: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

• La media aritmética

de la suma de dos

variables es = a la

suma de sus

respectivas medias

aritméticas:YXyx +=+

Page 12: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Mediana

• Es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores).

• Los datos deben ordenarse de menor a mayor

• No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).

Page 13: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

La mediana

Nro. de observaciones es impar

26,26,28,29,30,32,60

Los salarios de siete empleados fueron

los siguientes (en 1000s) :

28, 60, 26, 32, 30, 26, 29.

¿Cuál es la mediana?

Supongamos que se agrega al grupo el

Salario de un empleado más ($31,000).

¿Cuál es la mediana?

Nro. de observaciones es par

26,26,28,29, 30,31, 32,60

Hay dos valores en el medio!

Primero, ordenar los salarios.

Luego, localizar el valor en el medio.

26,26,28,29, 30,31,32,6029.5,

• Ejemplo:

Primero, ordenar los salarios.

Luego, localizar el valor en el medio.

Page 14: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

La moda es el valor que ocurre con

mayor frecuencia en un grupo de

observaciones.

La modaCuando la muestra

es grande, los datos

se agrupan en intervalos

y obtenemos el

Intervalo modal

La Moda

En un conjunto de observaciones puede haber más de una

moda.

Page 15: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Ejemplo

El gerente de una tienda de ropa posee la siguiente

información sobre el talle de los pantalones que

se vendieron ayer:

31, 34, 36, 33, 28, 34, 30, 34, 32, 40.

La Moda es 34

En muchos casos, la moda nos da

información mas valiosa que la

mediana: 33.2.

La Moda

Page 16: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Ejemplo

• Vamos a utilizar la

distribución de

frecuencias con

datos de la estatura

(altura a la cruz) de

los terneros de un

lote a remate.

VariableFrecuencias absolutas

Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%

1,28 4 24 13,3% 80,0%

1,29 3 27 10,0% 90,0%

1,30 3 30 10,0% 100,0%

Page 17: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

• Media aritmética:

• Luego:

• Por lo tanto, la estatura media de este

grupo de es de 1,253 m.

( ) ( ) ( )30

330,1421,1120,1 +++=

x

253,1=x

Page 18: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

• Mediana: La mediana

de esta muestra es 1,26

m, ya que por debajo

está el 50% de los

valores y por arriba el

otro 50%. Esto se puede

ver al analizar la

columna de frecuencias

relativas acumuladas.

Como el valor 1,26 se repite en 3 ocasiones, la media

se situaría exactamente entre el primer y el segundo

valor de este grupo, ya que entre estos dos valores se

encuentra la división entre el 50% inferior y el 50%

superior.

Variable

Frecuencias absolutas

Frecuencias relativas

(Valor) SimpleAcumula

daSimple

Acumulada

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%

1,28 4 24 13,3% 80,0%

1,29 3 27 10,0% 90,0%

1,30 3 30 10,0%100,0

%

Page 19: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

• Moda: Hay 3 valores

que se repiten en 4

ocasiones: el 1,21, el

1,22 y el 1,28, por lo

tanto esta seria

cuenta con 3 modas.

VariableFrecuencias absolutas

Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%

1,28 4 24 13,3% 80,0%

1,29 3 27 10,0% 90,0%

1,30 3 30 10,0% 100,0%

Page 20: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Media y Mediana

• La media es sensible a observaciones extremas y a outliers.

• La mediana solo es sensible a cambios en su entorno que la cruzan. Por ello, se dice que la mediana es un estimador robusto de la tendencia central.

• La media y la mediana de una distribución simétrica se encuentran muy cerca. Si la distribución es exactamente simétrica, la media y la mediana coinciden.

Page 21: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Distribuciones simétricas

y asimétricas

• Una distribución es simétrica si el lado derecho e izquierdo del histograma con respecto a la mediana son aproximadamente iguales.

• Un distribución es asimétrica hacia laderecha si el lado derecho del histograma seextiende sobre un mayor número de valores(intervalos) que el lado izquierdo.

• Una distribución es asimétrica hacia la izquierda si el lado izquierdo del histograma se extiende sobre un mayor número de valores (intervalos) que el lado derecho.

Page 22: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Asimetría hacia la derecha

Asimetría hacia la izquierda

Page 23: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Aspecto general de una

distribución

• La figura muestra la distribución de ventas de libros

por individuo en la feria del libro. Esta distribución es

asimétrica hacia la derecha. Es decir hay muchas

ventas de 3 o 4 libros y pocas ventas de 10 libros.

0

5

10

15

20

25

1 2 3 4 5 6 7 8 9 10 11 12

Page 24: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

• Si una distribución es simétrica, la media,

mediana y modo coinciden

• Si una distribución no es simétrica, las tres

medidas difieren.

Asimetría hacia la derecha

(asimetría positiva)

Media

MedianaModo

Media

Mediana

Modo

Asimetría hacia la izquierda

(asimetría negativa)

Media, Mediana y Moda

Page 25: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Estadísticos de posición:

Cuartiles (Ql)

• Son un caso

particular de los

percentiles. Hay 3, y

se definen como:753

502

251

PQ

M PQ

PQ

ed

=

==

=

Page 26: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Estadísticos de Posición:

Percentiles• Los percentiles son otro conjunto de medidas de tendencia no central

de una distribución.

• Dividen los datos ordenados en 100 partes iguales.

• El percentil 25 es el primer cuartil ...

• Ejemplo

– Supongamos que el 78% de los resultados del GMAT es menor o igual a 600 puntos. Entonces, 600 es el percentil 78 de la distribución.

600200 800

78% de todos los resultados 22%

Page 27: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

• En el caso de una variable continua, el

intervalo donde se encuentra ,

se calcula buscando el que deja debajo

de si al k% de las observaciones.

Dentro de él, Pk se obtiene según la

relación:

( iik llP − −1

i

i

i

ik a . n

Nk

n

lP1

1

100−

+=

Page 28: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

– Percentiles frecuentemente utilizados

• Primer decil = percentil 10

• Primer cuartil, Q1, = percentil 25

• Segundo cuartil,Q2, = percentil 50

• Tercer cuartil, Q3, = percentil 75

• Noveno decil = percentil 90

Ejemplo

Encontrar los cuartiles del siguiente conjunto de

datos:

7, 8, 12, 17, 29, 18, 4, 27, 30, 2, 4, 10, 21, 5, 8

Page 29: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

– Solución

• Primero, ordenar las observaciones

2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, 27, 29, 30

Como máximo, (.25)(15) = 3.75

observaciones deberían aparecer por

debajo del primer cuartil.

Como máximo, (.75)(15)=11.25

observaciones deberían aparecer por

encima del primer cuartil.

Primer cuartil

Si el numero de observaciones es par,

los resultados se encuentran entre dos observaciones.

En ese caso, hay que elegir el punto medio entre ambas observaciones.

15 observaciones

Page 30: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Deciles

• Se definen como los valores de la variable

que dividen a las observaciones en 10

grupos de igual tamaño.

• Más precisamente, definimos D1,D2, ..., D9

como:

,91,2,i PD ii == 10

Page 31: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Ejemplo

• Dada la siguiente

distribución en el

número de crías de

cien perras, calcular

sus cuartiles

xi ni Ni

0 14 14

1 10 24

2 15 39

3 26 65

4 20 85

5 15 100

n = 100

Page 32: Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición: Cuartiles (Q l) • Son un caso particular de los percentiles. Hay 3, y se definen

Solución

• Primer cuartil:

• Segundo cuartil:

• Tercer cuartil:

2Q luego ;394/N Primera ;254

1i === nn

3;654/2;504

2=== 2i Q luego nN Primera

n

4;854/3;754

3=== 3i Q luego nN Primera

n

xi ni Ni

0 14 14

1 10 24

2 15 39

3 26 65

4 20 85

5 15 100

n = 100