Estadistica I 03

26
1 UCV/FACES/EAC Estadísticas I Medidas de Tendencia Central Prof. Leonardo Simmons k i i i f X 1

description

Medidas de Tendencia Central

Transcript of Estadistica I 03

Page 1: Estadistica  I 03

1

UCV/FACES/EACEstadísticas I

Medidas de Tendencia Central Prof. Leonardo Simmons

k

iii fX

1

Page 2: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

2

MEDIDAS DE TENDENCIA CENTRAL

Las características globales de una población o muestra de una variable cuantitativa pueden resumirse mediante una serie de cantidades numéricas representativas llamadas parámetros o estadísticos, según sea el caso de una población o una muestra. Entre ellas, las medidas de tendencia central, como la media aritmética, la moda o la mediana, ayudan a conocer de forma aproximada el comportamiento de una distribución estadística.

Se llama medidas de tendencia central o centralización a unos valores numéricos en torno a los cuales se agrupan, en mayor o menor medida, los valores de una variable estadística.

Las tres medidas más usuales de tendencia central son:

La media Aritmética

La Mediana

El Modo o Moda

Page 3: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

3

Las medidas de tendencia central son parámetros o estadísticos representativos de distribuciones de frecuencia como las que

ilustra la imagen.

MEDIDAS DE TENDENCIA CENTRAL

Page 4: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

4

MEDIA ARITMETICA

Media Aritmética:

Se define como el “centro de gravedad” de la distribución estadística de una variable.

Sea X una variable cuantitativa donde X1, X2, ….. Xk; y f1, f2,….. fk son sus respectivos valores y frecuencias, entonces a la media aritmética de X la denotaremos por si se trata de una muestra ó µx si analizamos la población, luego:

X

n

fxfxf

n

fxX kk

k

iii

....x

22111

N

fxfxf

N

fxkk

k

iii

x

....x

22111

Page 5: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

Distribución del Tiempo de Primeros Pasos

02468

1012141618

7 9 11 13 15 17

Número de Meses

Can

tid

ad d

e N

iño

s

5

CALCULO DE LA MEDIA ARITMETICA

Caso de una Distribución de Frecuencia de Datos No Agrupados (DFDNA):

P.ej: Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de andar por primera vez:

meses 2,1250

610....x 22111

n

fxfxf

n

fxX kk

k

iii

Luego:Meses (x) Niños (f) xf

9 1 910 4 4011 9 9912 16 19213 11 14314 8 11215 1 15

610Ubicación de la

Media Aritmética

12,2

Page 6: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

6

CALCULO DE LA MEDIA ARITMETICA

Caso de una Distribución de Frecuencia de Datos Agrupados:

P.ej: Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla:

cms 63,18623

5,4292 1

n

fxX

k

iii

Luego:

Altura (cms)Nº de

jugadores x xf[170, 175) 1 172,5 172,5[175, 180) 3 177,5 532,5[180, 185) 4 182,5 730[185, 190) 8 187,5 1500[190, 195) 5 192,5 962,5[195, 2.00] 2 197,5 395

23 4292,5

172,5 177,5 182,5 187,5 192,5 197,5

1

3

2

5

4

6

8

7

X

No.

Jug

ador

es

Estatura (cms)

Page 7: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

7

PROPIEDADES DE LA MEDIA ARITMETICA

1 . La suma de las diferencias de la variable con respecto a la media es nula, es decir:

0)( 1

k

iii fXx

2 . La suma de los desvíos de los valores de una variable respecto a la media aritmética de estos es un mínimo, es decir:

XCfCxfXxk

iii

k

iii

)()( 1

2

1

2

3 . Si sumamos o restamos una constante a todos los valores de una variable manteniendo fijas las frecuencias entonces la media de la nueva variable así generada será igual a la media de la variable origina más o menos la constante, según sea el caso:

Page 8: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

8

PROPIEDADES DE LA MEDIA ARITMETICA

Sean X1, X2, ….. Xk y f1, f2,….. fk los valores de la variable X y sus respectivas frecuencias y cuya media es , entonces si sumamos o restamos una constante C a cada valor de X para así generar la variable Y, es decir: Y1= X1 ± C ; Y2= X2 ± C ; ……Yk,=Xk ± C, manteniendo Y las mismas frecuencias que X entonces:

4 . Si multiplicamos o dividimos por una constante a todos los valores de una variable manteniendo fijas las frecuencias entonces la media de la nueva variable así generada será igual a la media de la variable original multiplicada o dividida por la constante, según sea el caso:

CXY

CXY

CXY

/

X

Page 9: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

9

PROPIEDADES DE LA MEDIA ARITMETICA

5. La media aritmética es un operador lineal, es decir:

Si Y = aX + b; donde a, b son constantes entonces:

6. Dados r muestras de la misma variable cada una de tamaño n1, n2, ..., nr

observaciones y siendo , , ..., las respectivas medias de cada uno de ellas; entonces la media aritmética de la unión de todas las muestras es:

r

1ii

1 nn donde ;n

nXX

r

iii

bXaY

1X 2X rX

r

r

iii

wwwnnnn

nXX r2211

rr

22

11

rr22111 X..XXn

X..n

Xn

Xn

nX..nXnX

A la expresión demarcada se le conoce como media ponderada

Page 10: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

10

PROPIEDADES DE LA MEDIA ARITMETICA

7. Dados r muestras de la misma variable cada una de igual tamaño n

observaciones y siendo , , ..., las respectivas medias de cada uno de ellas; entonces la media aritmética de la unión de todas las muestras es:

r

XX

r

i

i 1

1X 2X rX

Es la media simple de las medias de las muestras

Page 11: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

11

OBSERVACIONES SOBRE LA MEDIA ARITMETICA

1. La media se puede hallar sólo para variables cuantitativas2. La media es independiente de las amplitudes de los intervalos de una DFDA3. La media es muy sensible a las puntuaciones extremas. P.ej. Si tenemos una

distribución con los siguientes pesos:65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.

La media es igual a 74 kg, que es una medida de centralización pocorepresentativa de la distribución

6. La media no se puede calcular en una DFDA si hay un intervalo o clase con una amplitud indeterminada, es decir, de rango abierto

7. La media es un estadístico “suficiente” porque usa toda la información de la muestra

ValoresExtremos

La Mediapierde

Representatividad

X

Page 12: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

12

MEDIANA

Mediana

Se define como el valor de la variable que divide la distribución en dos parte iguales del 50%, es decir, el 50% de los datos es menor o igual a él y el restante 50% el mayor o igual a él. Se denota Me

El 50%de los

primeros datos de la

distribución son≤ Me

El restante 50%de los

datos de distribución son

≥ Me

Me

Page 13: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

13

CALCULO DE LA MEDIANA

Caso de una Distribución de Frecuencia de Datos No Agrupados (DFDNA):

P.ej: Caso del pediatra Procedimiento:

2. Calcular n/2

3. Si Fj tal que Fj= n/2 Me = Xj de lo contrario, Me será aquel valor de X cuya frecuencia acumulada sea mayor inmediato a n/2

Meses (x) Niños (f) F9 1 1

10 4 511 9 1412 16 3013 11 4114 8 4915 1 50

50

En este caso n/2 = 50/2 =25 y como no existe una frecuencia acumulada igual a 25 y la frecuencia acumulada mayor inmediata a n/2 es 30 entonces:

Me = X4 = 12 meses

Vemos que efectivamente hay 25 (50%) valores ≤ a 12 y 25 (50% ≥ a 12

Page 14: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

14

CALCULO DE LA MEDIANA

Si organizamos la serie de datos anterior denotando la posición que ocupa cada observación tenemos:X 9, 10, 10, 10, 10, 11, 11, 11, ….. 11, 12, 12,……12,12,……50Posición: 1ª, 2ª, 3ª, 4ª, 5ª, 6ª, 7ª, 8ª,……,14ª, 15ª,16ª,……25ª,26ª,..50ª

9 10 11 12 13 14 15

2

6

4

10

8

12

16

14

X

No.

Niñ

os

Me

Meses

Page 15: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

Procedimiento:

2. Calcular n/2

3. Si Fj tal que Fj= n/2 Me= Lme,donde Lme es el limite superior de la clase correspondiente a la Fj= n/2; de lo contrario:

15

CALCULO DE LA MEDIANA

Caso de una Distribución de Frecuencia de Datos Agrupados (DFDA):

P.ej: Caso de la estatura de los jugadores de baloncesto

Altura (cms)Nº de

jugadores x F[170, 175) 1 172,5 1[175, 180) 3 177,5 4[180, 185) 4 182,5 8[185, 190) 8 187,5 16[190, 195) 5 192,5 21[195, 2.00] 2 197,5 23

23

meme

me

mee cf

Fn

lM

12

Page 16: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

16

CALCULO DE LA MEDIANA

Donde:lme = limite inferior de clase que contiene a la Me

Fme-1 = Frecuencia acumulada hasta la clase inmediata anterior a la clase que contiene a la Me

fme = la frecuencia de la clase que contiene a la Me ; y

Cme = El rango de la clase que contiene a la Me

Nota: La clase o intervalo que contiene a la Me es aquella correspondiente a la frecuencia acumulada inmediata mayor a n/2

Page 17: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

17

CALCULO DE LA MEDIANA

En el ejemplo:n/2 = 23/2 = 11,5 luego no existe frecuencia acumulada igual a n/2 por lo tanto buscamos la frecuencia acumulada inmediata superior a N/2 que resulta la F4 = 16, luego la clase que contiene a la Me es la cuarta clase entonces:

cmscf

Fn

lM meme

me

mee 1875,18758

85,111852 1

172,5 177,5 182,5 187,5 192,5 197,5

1

3

2

5

4

6

8

7

X

No.

Jug

ador

es

Estatura (cms)

Page 18: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

18

CALCULO DE LA MEDIANA

meme

me

mee cf

Fn

lM

12

l1 L1 L2 ………. Lme-1 Lme ……………

F1

F2

Fme-1

Fme

:

:

:

:

n

n/2

Me

AB

C

E

D

Analizando trigonométricamente los triangulas rectángulos ABC y ADE se genera la formula de interpolación de la Mediana:

Page 19: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

19

OBSERVACIONES ACERCA DE LA MEDIANA

1. La mediana no esta influenciada por los valores extremos ya que su determinación se apoya en los valores centrales de la variable

6. Su uso es apropiado ante distribuciones asimétricas

7. No es un estadístico “suficiente” ya que no aprovecha toda la información de la muestra

ValoresExtremos

La Mediapierde

Representatividad

XMe

Page 20: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

20

MODO o MODA

Modo o Moda

Se define como el valor de la variable que más se repite, es decir, el valor de la variable que tenga frecuencia máxima. Se denota con Mo

Mo = Xj si y solo si fj = Max { fi, i=1, 2, 3,…..k}

Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.

Page 21: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

21

CALCULO DEL MODO

Caso de una Distribución de Frecuencia de Datos No Agrupados (DFDNA):

P.ej: Caso del pediatra Procedimiento:

2. Determinar la frecuencia máxima, fmax, el modo será igual al valor de la variable asociado a dicha frecuencia.

Meses (x) Niños (f) F9 1 1

10 4 511 9 1412 16 3013 11 4114 8 4915 1 50

50

En este caso fmax = 16 por lo tanto:Mo = 12 meses

Page 22: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

22

CALCULO DEL MODO

Caso de una Distribución de Frecuencia de Datos No Agrupados (DFDA):

P.ej: Caso de los jugadores

Procedimiento:

2. Determinar la frecuencia máxima, fmax, el modo estará ubicado en la clase correspondiente a dicha frecuencia máxima y entonces:

12

11

21

1

momo

momo

momoo

ff

ff

ClM

Donde:fmo = frecuencia de la clase que contiene al Mo

fmo-1= frecuencia de la clase anterior a la que contiene al Mo

fmo-1= frecuencia de la clase siguiente a la que contiene al Mo

Altura (cms)Nº de

jugadores[170, 175) 1[175, 180) 3[180, 185) 4[185, 190) 8[190, 195) 5[195, 2.00] 2

23

Page 23: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

23

CALCULO DEL MODO

En nuestro ejemplo:

fmo = 8; luego

358

448

8571,187534

4185

12

11

21

1

momo

momo

momoo

ff

ff

cmsClM

172,5 177,5 182,5 187,5 192,5 197,5

1

3

2

5

4

6

8

7N

o. J

ugad

ores

Estatura (cms)

X = 186,63 cms

Me= 187,18 cms

Mo = 187, 86

Page 24: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

24

OBSERVACIONES ACERCA DEL MODO

2. La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de intervalos, y relativa).

3. La moda tiene la ventaja de no ser afectada por valores extremos.

4. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.

5. En muchas series de datos no hay moda porque ningún valor aparece más de una vez.

6. En algunas series de datos hay más de una moda, en este caso uno podría preguntarse ¿cual es el valor representativo de la serie de datos?

Page 25: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

25

RELACION EMPIRICA ENTRE MEDIA, MEDIANA Y MODO

2. En distribuciones totalmente simétricas, la media, la mediana y la moda coinciden, localizándose en un mismo valor. En cambio, en distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente:

Media – Moda = 3(Media – Mediana

3. Posiciones relativas de la media, la mediana y la moda para curvas de frecuencias asimétricas a derecha e izquierda respectivamente, para curvas simétricas los tres valores coinciden

Page 26: Estadistica  I 03

Prof. Leonardo Simmons Estadísticas I -03

26

TAREA No. 3

2. Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 3, los ejercicios del 5 al 14 (pag. 79 al 83)

3. Investigue acerca de estas otras medias Armónica y Geométrica: definición, calculo, aplicaciones y propiedades. La relación existente entre la media aritmética, la armónica y la geométrica

4. Investigue en internet algunas medidas de tendencia de la economía venezolana