Estadistica y Prob 03

23
CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez 1 Ing. William León Velásquez [email protected] Son valores numéricos que tienden a localizar, en algún sentido, la parte central de un conjunto de datos. A menudo el término promedio se i f asocia a estas mediciones. Cada una de las diferentes medidas de tendencia central puede recibir el nombre de valor medio o promedio. ING. WILLIAM LEON V. 2 MEDIDAS DE TENDENCIA CENTRAL Conocer el dato que aparece con mayor frecuencia en el conjunto. Saber cuál es el número que está a igual distancia de los valores i f máximo y mínimo. el número que resultaría de repartir el total de los datos equitativamente entre el número de individuos. ING. WILLIAM LEON V. 3 MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central son útiles como “descriptivas” del conjunto de datos, pero no puede decirse que una de ellas es más descripti a qe las i f i f i f más descriptiva que las otras; depende de los datos que tenga más sentido utilizar una u otra. ING. WILLIAM LEON V. 4 i f i f MEDIDAS DE TENDENCIA CENTRAL Media Aritmética : Mediana : Me i f i f x x Moda : Mo ING. WILLIAM LEON V. 5 i f i f x MEDIDAS DE TENDENCIA CENTRAL Es el valor que tomaría cada uno de los datos si el total de los valores se repartiera uniformemente entre el número de ellos i f x número de ellos. ING. WILLIAM LEON V. 6 i f x MEDIA ARIMÉTICA

Transcript of Estadistica y Prob 03

Page 1: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

1

Ing. William León Velá[email protected]

Son valores numéricos que tiendena localizar, en algún sentido, laparte central de un conjunto dedatos.

A menudo el término promedio se

if

pasocia a estas mediciones. Cadauna de las diferentes medidas detendencia central puede recibir elnombre de valor medio o promedio.

ING. WILLIAM LEON V. 2

MEDIDAS DE

TENDENCIA

CENTRAL

Conocer el dato que aparece con mayor frecuencia en el conjunto.

Saber cuál es el número que está a igual distancia de los valores

if

máximo y mínimo. el número que resultaría de repartir

el total de los datos equitativamente entre el número de individuos.

ING. WILLIAM LEON V. 3

MEDIDAS DE

TENDENCIA

CENTRAL

Las medidas de tendenciacentral son útiles como“descriptivas” del conjuntode datos, pero no puededecirse que una de ellas esmás descripti a q e las

if

if if más descriptiva que lasotras; depende de los datosque tenga más sentidoutilizar una u otra.

ING. WILLIAM LEON V. 4

if if

MEDIDAS DE

TENDENCIA

CENTRAL

Media Aritmética :

Mediana : Meif ifx

x

ed a a e

Moda : Mo

ING. WILLIAM LEON V. 5

if ifx

MEDIDAS DE

TENDENCIA

CENTRAL

Es el valor que tomaría cadauno de los datos si el total delos valores se repartierauniformemente entre elnúmero de ellosifx número de ellos.

ING. WILLIAM LEON V. 6

ifx

MEDIA

ARIMÉTICA

Page 2: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

2

La media aritmética es unamedida muy precisa, por lomenos bajo ciertascircunstancias, por ejemplo,cuando la presencia de valoresextremos no es significativa.extremos no es significativa.La media aritmética juega unpapel importante en laestadística descriptiva, peropor ser una medida de altaprecisión, su rol esfundamental en la estadísticainferencial.

ING. WILLIAM LEON V. 7

MEDIA

ARIMÉTICA

Media poblacional :

Media muestral :

ING. WILLIAM LEON V. 8

)X(M,x

MEDIA

ARIMÉTICA

La media aritmética de n números tales como X1 , X2 , ....... , Xn

se define como la suma de losvalores de los n números divididosif if

x

valores de los n números, divididosentre n.

ING. WILLIAM LEON V. 9

if if

n

n

1iiX

X

MEDIA

ARIMÉTICA

SIMPLE

Ejemplo: Las edades correspondientes a cinco

alumnos de la UNMSM son las siguientes:

x

23 , 27 , 19 , 24 , 21

Calcular la edad promedio.

ING. WILLIAM LEON V. 10

MEDIA

ARIMÉTICA

SIMPLE

5

x

5

2124192723

5

5

1

i iX

X

.8,225

5

1 añosi iXX

ING. WILLIAM LEON V. 11

El promedio de edades es de 22.8 añosMEDIA

ARIMÉTICA

SIMPLE

Sean X1 , X2 , ....... , Xk valoresde la variable X con sus respectivasfrecuencias absolutas f1 , f2 ,...... , fk ,

x

la media de X se calcula mediante lassiguientes fórmulas:

ING. WILLIAM LEON V. 12

MEDIA

ARIMÉTICA

PONDERADA

Page 3: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

3

x

Usando frecuencias absolutas:

Usando frecuencias relativas:

k

ING. WILLIAM LEON V. 13

n

fX

x

k

1iii

k

1iii hXx

MEDIA

ARIMÉTICA

PONDERADA

Ejemplo:1.-La siguiente tabla muestra la distribución del peso de un grupo de personas.

x

Peso N º de personasXi f158 7

ING. WILLIAM LEON V. 14

MEDIA

ARIMÉTICA

PONDERADA

58 765 1270 972 1478 6Total n = 48

Calcular e interpretar el promedio aritmético del peso.

x

.6958,6848

3292

48

5

1 skiloi iXifX

ING. WILLIAM LEON V. 15

4848

En promedio de peso de estas personas es aproximadamente de 69 kilos.

MEDIA

ARIMÉTICA

PONDERADA

Ejemplo:2.-Un grupo de personas han sido clasificadas de acuerdo a su edad, obteniéndose los siguientes resultados.

x

Edad Nº de PersonasXi fi

ING. WILLIAM LEON V. 16

MEDIA

ARIMÉTICA

PONDERADA

18 4 0,1220 12 0,3524 6 0,1827 10 0,2930 2 0,06Total n = 34 1,00

if if

x

años2311,235

1iiXihX

ING. WILLIAM LEON V. 17

if if

Nota: En el caso de intervalos es la marca de clase. iX

En promedio estas personas tienen una edad de 23 años

MEDIA

ARIMÉTICA

PONDERADA

Ejemplo:3.-La siguiente es la distribución del número de accidentes registrados durante 60 meses en cierta ciudad.

f

x

Nº Accident. Nº mesesIi : ´[Li 1 Li]

ING. WILLIAM LEON V. 18

if x

MEDIA

ARIMÉTICA

PONDERADA

Ii : [Li-1 - Li]10 – 19 2 14,520 – 29 10 24,530 – 39 4 34,540 – 49 16 44,550 – 59 20 54,560 – 69 8 64,5Total n = 60

Page 4: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

4

Nota:La media aritmética es quizála medida de tendenciacentral más comúnmenteusada

x

usada.Sin embargo, no es siempreideal usarla como unpromedio, porque es muysensible a los valoresextremos.

ING. WILLIAM LEON V. 19

MEDIA

ARIMÉTICA

PONDERADA

if ifx

x

.accidentes465,4560

273060

6

1iiXif

X

ING. WILLIAM LEON V. 20

if ifx

En promedio en esta ciudad se registran 46 accidentes

MEDIA

ARIMÉTICA

PONDERADA

Ejemplo:4.-Calcular el promedio aritmético de los pesos de un conjunto de alumnos y que se muestran en la siguiente tabla de distribución de frecuencias.

if if

x

Peso Nº alumnos

ING. WILLIAM LEON V. 21

if if

MEDIA

ARIMÉTICA

PONDERADA

Peso N alumnosXi

Ii : [Li-1 - Li[50 – 55 255 – 60 1060 – 65 465 - 70 8Total n =

if ih

x

if ifx1

4

i iXihX

ING. WILLIAM LEON V. 22

if ifx

?XMEDIA

ARIMÉTICA

PONDERADA

Peso Nº alumnos XiIi : [Li-1 - Li[50 – 55 2 0.08 52.555 – 60 10 0.42 57.5

x

ihif

60 – 65 4 0.17 62.565 - 70 8 0.33 67.5Total n = 24

ING. WILLIAM LEON V. 23

MEDIA

ARIMÉTICA

PONDERADA

Xi *xi

0.08 52.5 4.200.42 57.5 24.15

x

ihih

0.17 62.5 10.360.33 67.5 22.28

Total 61.26

ING. WILLIAM LEON V. 24

MEDIA

ARIMÉTICA

PONDERADA

El promedio aritmético de los alumnos es de 61.26 Kg.

Page 5: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

5

La media ponderada es unamedida de tendenciacentral, se construyeasignándole a cada clase un

bt i dpeso, y obteniendo unpromedio para los pesos.

ING. WILLIAM LEON V. 25

MEDIA

PONDERADA

n

i

n

iii

w

w

xwx 1

donde i

i1

idatox

nponderacióoxparapesodevalorw

i

ii

ING. WILLIAM LEON V. 26

MEDIA

PONDERADA

Ejemplo:En una asignatura se asignan pesos de importancia, de la siguiente forma: Unida I (20% del curso), Unidad II (25% del curso), Unidad III (20% del curso), Unidad IV (15% de la calificación)if ifx Unidad IV (15% de la calificación), Unidad V (20% de la calificación ). Si las calificaciones de un alumno son 8 en la primera unidad, 5 en la segunda, 8 en la tercera unidad, 10 en la cuarta unidad y 8 en la última unidad.

ING. WILLIAM LEON V. 27

if ifx

MEDIA

PONDERADA

Es decir, se tienen la siguiente tabla:

Unidad Ponderación (Wi) Datos (Wi)

I 20% = 0.2 8if ifx

II 25% = 0.35 5

III 20% = 0.2 8

IV 15% = 0.15 10

V 20% = 0.10 8

ING. WILLIAM LEON V. 28

if ifx

MEDIA

PONDERADA

25.71.0

7.25

0.100.150.20.350.2

(0.1)8(0.15)10(0.2)8(0.35)5(0.2)8

wx

El promedio de los alumnos es 7.25

ING. WILLIAM LEON V. 29

MEDIA

PONDERADA

Observe que diferencia existe con la media aritmética. La media para los datos es igual a

810888.7

5

810858

x

ING. WILLIAM LEON V. 30

MEDIA

PONDERADA

Page 6: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

6

Si una muestra de tamaño n se particiona en k muestras de tamaño cada una con su correspondiente

if if

in

promedio aritmético ,

ING. WILLIAM LEON V. 31

if if

ix

MEDIA

ARIMÉTICA

TOTAL O GLOBAL

Entonces el promedio aritmético para los k grupos juntos se calcula mediante:

xnk

ii

ING. WILLIAM LEON V. 32

n

xn

x 1iii

T

k

1iinn

donde

MEDIA

ARIMÉTICA

TOTAL O GLOBAL

Se tienen los datos correspondientes a la duración de los focos (horas) en las empresas A y B. Calcular el promedio aritmético para las dos empresas juntas.

Empresa A Empresa B

Duración Nº Duración Nº

ING. WILLIAM LEON V. 33

MEDIA

ARIMÉTICA

TOTAL O GLOBAL

focos ni focos ni

17 7 12-18 7

23 5 18-24 4

28 8 24-30 12

35 15 30-38 5

42 7 38-46 3

n -> 42 n -> 31

Empresa A Empresa B

ni xi ni xi

17*7=119 15*7=105

23*5=115 21*4= 84

28*8=224 27*12=324

35*15=525 34*5=170

42*7=294 42*3=126

1277/42 809/31

30.40 26.10

ING. WILLIAM LEON V. 34

MEDIA

ARIMÉTICA

TOTAL O

GLOBAL

73

10,263140,30421

k

iTx

horasx T 2957,28

ING. WILLIAM LEON V. 35

MEDIA

ARIMÉTICA

TOTAL O

GLOBAL

A pesar de las buenas propiedades que ofrece la media, ésta posee algunos inconvenientes: Es muy sensible a los valores extremos de la variable: ya que todas las b i i t i l ál lobservaciones intervienen en el cálculo

de la media, la aparición de una observación extrema, hará que la media se desplace en esa dirección

ING. WILLIAM LEON V. 36

INCONVENIENTES

DE LA MEDIA

ARIMÉTICA

Page 7: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

7

Calcular la edad promedio de cinco personas, cuyas edades son:

18 20 19 23 55if ifx

ING. WILLIAM LEON V. 37

if ifx

años275

135X

INCONVENIENTES

DE LA MEDIA

ARIMÉTICA

Decir que la edad representativa es de 27 años , es erróneo

En consecuencia, NO ES RECOMENDABLE USAR LA MEDIA

if ifx COMO MEDIDA CENTRAL EN LAS DISTRIBUCIONES MUY ASIMÉTRICAS

ING. WILLIAM LEON V. 38

if ifx

INCONVENIENTES

DE LA MEDIA

ARIMÉTICA

La suma de las diferencias de los datos y la media nos representa un promedio simétrico de la información, es decir, se cumple la siguiente relación:

if ifx

0xxi

ING. WILLIAM LEON V. 39

if ifx

PROPIEDADES

DE LA MEDIA

ARIMÉTICA

La demostración es la siguiente

xxxx ii

if ifx como la media es una constante y

xnx

xxxx

i

ii

ING. WILLIAM LEON V. 40

if ifx como la media es una constante y además la suma se supone con respecto n valores entonces

PROPIEDADES

DE LA MEDIA

ARIMÉTICA

empleando la definición de la media

n

xx i

if ifx t d

0

ii

ii

ii

xxn

xnx

xxxx

ING. WILLIAM LEON V. 41

if ifx tendremos:

PROPIEDADES

DE LA MEDIA

ARIMÉTICA

La media al ser traslada o remplazadapor una cantidad constante para cadauna de las medidas se modifica de laforma

if ifx

cxy

ING. WILLIAM LEON V. 42

if ifx

PROPIEDADES

DE LA MEDIA

ARIMÉTICA

Page 8: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

8

Demostración.Sea una muestra de nmediciones las que se lesremplaza sumándoles una cantidadc, es decir,

if ifx

ycxycxy ,, 32211

ING. WILLIAM LEON V. 43

if ifx

PROPIEDADES

DE LA MEDIA

ARIMÉTICA

cxycx nn ,,3

por lo que al obtener la media para tenemoscxi

n

cxy i

i

if ifx

cxn

ncx

n

c

n

x

n

i

ING. WILLIAM LEON V. 44

if ifx

PROPIEDADES

DE LA MEDIA

ARIMÉTICA

Completar las siguientes tablas de distribución de frecuencias, para la información dada:

1.- Xi : edad f1 = 4 f2 - f5 = 2= 50

if if

xX1 = 10 f3 = 20Simétrica k = 5

u.e.: personas

ING. WILLIAM LEON V. 45

if if x

EJERCICIOS

f2-f5 = 2 f2 = 6

n

Xfx

ii ii Xfxn

40 * 50 = f1X1 + f2X2 + f3X3 + f4X4 + f5X52000 = 4x10 + 6(X1+A)+ 20(X1+2A)+ 6(X1+3A)+ 4(X1+4A)

A = 20

ING. WILLIAM LEON V. 46

n

EJERCICIOS

Edad[Li-1-Li[

E. prom

Xi

Nº pers.

fi

Prop. pers

hi

% pers.hi%

Nº pers.

Fi

Prop.PersHi

% pers.Hi%

0- 20 10 4 0,10 10 4 0,10 10

20- 40 30 6 0 15 15 10 0 25 25if ifxxx 30 6 0,15 15 10 0,25 25

40- 60 50 20 0,50 50 30 0,75 75

60- 80 70 6 0,15 15 36 0,90 90

80-100 90 4 0,10 10 40 1,00 100

TOTAL 40 1,00 100 - -

ING. WILLIAM LEON V. 47

if ifxxx

EJERCICIOS

Completar las siguientes tablas de distribución de frecuencias, para la información dada:

2.- Xi : temperatura f5 = 9H1 = 0,12 k = 6X3 = 10 H2 = 0,28f1 = f6 = 6 A = 10u.e.: Días. =15,2

ING. WILLIAM LEON V. 48

x

EJERCICIOS

Page 9: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

9

hi =

nhi = fi 29 + f3 + f4 = 50f3 + f4 = 21

n =

nf i

n

Xfx

ii

ii Xfxni

i

f

h

n = 50 x15,2 = -60 + 0 + 10f3 + 20f4+270+24031 = f3 + 2f4

n = 50 f4 = 10 f3 = 11

ING. WILLIAM LEON V. 49

if = 50

0,12

6

EJERCICIOS

Temperatura

[Li-1-Li[

T. prom.

Xi

Nº días

fi

Prop. días

hi

% díashi%

Nº días

Fi

Prop.díasHi

% díasHi%

-15--5 -10 6 0,12 12 6 0,12 12

-5- 5 0 8 0,16 16 14 0,28 28

5-15 10 11 0,22 22 25 0,50 50

15-25 20 10 0,20 20 35 0,70 70

25-35 30 9 0,18 18 44 0,88 88

35-45 40 6 0,12 12 50 1,00 100

TOTAL 50 1,00 100 - -

ING. WILLIAM LEON V. 50EJERCICIOS

Sea una distribución de frecuencias (x, n). La media geométrica, que denotaremos por G. se define como la raíz N-ésima del producto de los N valores de ladel producto de los N valores de la distribución.

G = nkk

nN n xxx ·····22

11

ING. WILLIAM LEON V. 51

MEDIA

GEOMETRICA

Si los datos están agrupados en intervalos, la expresión de la media geométrica, es la misma, pero utilizando la marca de clase (Xi).El uso mas frecuente de la media geométrica es el de promediar

if ifxxx geométrica es el de promediar variables tales como porcentajes, tasas, números índices. etc., es decir, en los casos en los que se supone que la variable presenta variaciones acumulativas.

ING. WILLIAM LEON V. 52

if ifxxx

MEDIA

GEOMETRICA

1. Las siguientes temperaturas han sidotomadas de un proceso químico, 13.4oC,12.8, 11.9, 13.6, determine la temperaturapromedio de este proceso.

ING. WILLIAM LEON V. 53

Solución:

G = 44 796827758613911812413 ..x.x.x.

= 12.9077 oC

MEDIA

GEOMETRICA

2. Las siguientes temperaturas han sidotomadas de un proceso para fabricarqueso chihuahua, 21.4oC, 23.1, 20.2,19.7, 21.0, determine la temperaturapromedio de este proceso.

55 8524131070021719220123421 ..x.x.x.x.

ING. WILLIAM LEON V. 54

Solución:G =

= 21.048 oC

MEDIA

GEOMETRICA

Page 10: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

10

En su cálculo intervienen todos los valores de la distribución.Los valores extremos tienen menor influencia que en la media aritmética.

úEs única.Su cálculo es más complicado que el de la media aritmética.

ING. WILLIAM LEON V. 55

MEDIA

GEOMETRICA

Además, cuando la variable toma almenos un x = 0 entonces G se anula, ysi la variable toma valores negativos sepueden presentar una gama de casosparticulares en los que tampoco quedaparticulares en los que tampoco quedadeterminada debido al problema de lasraíces de índice par de númerosnegativos.

ING. WILLIAM LEON V. 56

MEDIA

GEOMETRICA

En muchas ocasiones, los valoresde la distribución nos impidenpoder efectuar los cálculos alexceder la capacidad de lacalculadoracalculadora.Se debe utilizar las propiedades de los logaritmos:lg (a.b) = lg a + lg blg an = n lg a

ING. WILLIAM LEON V. 57

MEDIA

GEOMETRICA

).......lg(1

).......lg(lg 321321321

1

321kk n

knnnnn

knnn xxxx

nxxxxG

1

ING. WILLIAM LEON V. 58MEDIA GEOMÉTRICA

)lg....lg2lg(lg1

321321

knk

nnn xxxxn

sabiendo que lo podemos expresar en notación compacta:

l d d i G

n

xnxnxnxnxn

nii

kk lglg

)lg......lglglg(1

332211

por lo que podemos decir que G = anti lg

ING. WILLIAM LEON V. 59

MEDIA GEOMÉTRICA

n

xn ii lg

Ejemplo: Hallar la media geométrica de la siguiente distribución:Xi ni100 10120 5125 4140 3n = 22

ING. WILLIAM LEON V. 60

EJEMPLOn

xnG ii lg

lg

Page 11: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

11

xi ni lg xi ni lg xi

100 10 lg 100 = 2 20

120 5 lg 120 = 2.079 10,396if ifxxx

por lo tanto será conveniente ampliar la tabla con loque nos quedará

125 4 lg 125 = 2.097 8,387

140 3 lg 140 = 2.146 6,438

n = 22 45.221

ING. WILLIAM LEON V. 61

if ifx

EJEMPLO

xx if ifxxx

056,222221,45lg

lg n

xnG ii

ING. WILLIAM LEON V. 62

if ifx

EJEMPLO

xx

G = anti lg. 2,0555 = 113,632

22n

if ifxxx

Es la inversa de la media aritmética de las inversas de los valores de la variable

nn

ING. WILLIAM LEON V. 63

if ifx

DEFINICIÓN

xx

....3

3

21

2

1

1

x

n

x

n

x

nn

x

nn

H

i

i

if ifxxx

Se utiliza para promediar velocidades, tiempos, rendimiento, etc. (cuando influyen los valores pequeños).

ING. WILLIAM LEON V. 64

if ifx

USOS

xx influyen los valores pequeños).Su problema: cuando algún valor de la variable es 0 o próximo a cero no se puede calcular.

xi ni

100 10if ifxxx

Ejemplo:Calcular la media armónica de la siguientedistribución:

120 5

125 4

140 3

ING. WILLIAM LEON V. 65

if ifx

EJEMPLO

xx

xi ni 1/xi ni/xi xini

100 10 1/100 0 1 1000if ifxxx

Para poder hallarla, es necesario que calculemos elinverso de x y el inverso de la frecuencia por lo queampliaremos la tabla con 2 columnas adicionales :

100 10 1/100 0.1 1000

120 5 1/120 0.042 600

125 4 1/125 0.032 500

140 3 1/140 0.021 420

N= 22 0.195 2520

ING. WILLIAM LEON V. 66

if ifx

EJEMPLO

xx

Page 12: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

12

if ifxxx

82,112195,022

i

i

x

nn

H

ING. WILLIAM LEON V. 67

if ifx

EJEMPLO

xx ix

545,11422

2520

n

nxX ii

if ifxxx

Entre la media aritmética lamedia geométrica y mediaarmónica se da siempre lasiguiente relación:

ING. WILLIAM LEON V. 68

if ifx

EJEMPLO

xx

XGH

2. Determine la media armónica de los siguientes datos, 3.1, 2.8, 2.84, 3.05, 3.09

Solución:

093105318421821131

5

./././././H

ING. WILLIAM LEON V. 69

9703268331

5

3236032790352103571032260

5.

......

EJEMPLO

Es el valor que divide al total de lasobservaciones, ordenadas en formaascendente o descendente en dos partes deigual tamaño.

Es decir que a uno y otro lado de la mediana

if

if if

ING. WILLIAM LEON V. 70

Es decir que a uno y otro lado de la medianase encuentra no más del 50% del total de lasobservaciones.

if if

MEDIANA

Me

< Me

Xmín 50% 50% Xmáx

if

if if

ING. WILLIAM LEON V. 71

if if

MEDIANA

Me

La mediana es igual al valor del término central.

XM

ING. WILLIAM LEON V. 72

2

1nXMe

MEDIANAMe

Para datos No Agrupados

Page 13: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

13

Los periodos de tiempo, en minutos,que once clientes esperaron en lacola de un Banco antes de seratendidos fueron:

if if

ING. WILLIAM LEON V. 73

5 5 11 10 8 510 4 10 6 10Variable : Tiempo de espera (minutos)

Unidades estadísticas : Clientes.

if if

MEDIANAMe

Para datos No Agrupados

Ordenando los datos:

4 , 5 , 5 , 5 , 6 , 8 , 10 , 10 , 10 , 10 , 11

if if

ING. WILLIAM LEON V. 74

El 50% de los clientes esperaron menos de 8 minutos mientras que el otro 50% esperó 8 minutos o más.

if if

.sutomin8Me

MEDIANAMe

Para datos No Agrupados

Ordenando los datos:

4 , 5 , 5 , 5 , 6 , 8 , 10 , 10 , 10 , 10 , 11

if if

ING. WILLIAM LEON V. 75

El 50% de los clientes esperaron menos de 8 minutos mientras que el otro 50% esperó 8 minutos o más.

if if

.sutomin8Me

MEDIANAMe

Para datos No Agrupados

La Mediana es igual a la media aritmética de los dos valores centrales.

if if

ING. WILLIAM LEON V. 76

if if

2

12nX

2nX

Me

MEDIANAMe

Para datos No Agrupados

Seis alumnos del tercer ciclo de la facultad de Ingeniería Industrial de la UNMSM obtuvieron las siguientes notas en su primera evaluación de estadística:15, 05 , 20 , 16 , 09 , 12 Calcular e interpretar la mediana.

if if

ING. WILLIAM LEON V. 77

if if

MEDIANAMe

Para datos No Agrupados

Ordenando los datos:

05 , 09 , 12 , 15 , 16 , 20

if if t5131512

M

ING. WILLIAM LEON V. 78

El 50% de los alumnos obtuvieron una nota inferior a 13,5 ; el 50% restante obtuvo una nota de 13,5 o más.

if if .ospunt5,132

Me

MEDIANAMe

Para datos No Agrupados

Page 14: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

14

La Mediana es un promedioadecuado en los casos en que sepresenten valores extremos (muyalto o muy pequeño).

if if

ING. WILLIAM LEON V. 79

if if

MEDIANAMe

Para datos No Agrupados

El número de e-mails que recibieroncada uno de los empleados de unacompañía se muestran acontinuación:50 35 20 65 22 98if if

ING. WILLIAM LEON V. 80

50 , 35 , 20 , 65 , 22 , 98 , 38Calcular e interpretar la Mediana.

if if

MEDIANAMe

Para datos No Agrupados

Ordenando los datos:20 , 22 , 35 , 38 , 50 , 65 ,

98Me = 38 e mailsif if

ING. WILLIAM LEON V. 81

Me = 38 e-mails.La mitad de estos empleados hanrecibido menos de 38 e-mails; laotra mitad ha recibido al menos 38e-mails.

if if

MEDIANAMe

Para datos No Agrupados

Si la variable es cualitativa ordinal,la mediana se encuentra en el n/2lugar, por lo tanto se ubica dichoif if

ING. WILLIAM LEON V. 82

lugar, por lo tanto se ubica dicholugar en la columna de lasfrecuencias absolutas acumuladas.

if if

iFMEDIANA

MePara datos Agrupados

La siguiente tabla presenta la distribución de un grupo de alumnos elegidos en forma aleatoria clasificados según su ciclo de estudios.

if if

ING. WILLIAM LEON V. 83

if if

MEDIANAMe

Para datos Agrupados

Ciclo de Estudios

Nº alumnos

1ero. 4 4 lugar.vo85,72n

iF

ING. WILLIAM LEON V. 84

2do. 2 6

3ero. 6 12

4to. 3 15

.ero3Me

∑=15MEDIANA

MePara datos Agrupados

Page 15: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

15

Respuesta

El 50% de los alumnos está como máximo en 2do. Ciclo, el 50% restante está como mínimo en tercer ciclo

ING. WILLIAM LEON V. 85

en tercer ciclo.

MEDIANAMe

Para datos Agrupados

a.- Cuando se encuentra ubicado entredos frecuencias absolutas acumuladas:

ING. WILLIAM LEON V. 86

j1j F

2n

F

jXMe MEDIANA

MePara datos Agrupados

Sin Intervalos

Nº trabajad

ores

Nº empres

as iF

ING. WILLIAM LEON V. 87

120 6 6

180 8 14

220 9 23

250 7 30

estrabajador220Me

lugar.vo15152n

i

MEDIANAMe

Para datos Agrupados

Sin Intervalos

Respuesta

El 50% de las empresas tienen menos

ING. WILLIAM LEON V. 88

de 220 trabajadores, el resto tienen 220 a más trabajadores.

MEDIANAMe

Para datos Agrupados

Sin Intervalos

b.- Cuando coincide con unafrecuencia absoluta acumulada:

j1j Fn

F

ING. WILLIAM LEON V. 89

j1j F2

F

2

XXMe

j1j

MEDIANAMe

Para datos Agrupados

Sin Intervalos

Nº hijos Nº señoras

n

iF

ING. WILLIAM LEON V. 90

1 6 6

2 9 15

4 7 22

5 8 30

hijos3Me

lugar.vo15152n

MEDIANAMe

Para datos Agrupados

Sin Intervalos

Page 16: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

16

Se determina el intervalo mediano, es decir el intervalo que va a contener a la mediana, ubicando en la columna de las frecuencias acumuladas el lugar mediante:

ING. WILLIAM LEON V. 91

2

n

jj Fn

F 21 jIMe

MEDIANA

Me

Para datos Agrupados

con Intervalos

Luego se aplica la fórmula:

j

1j

jj f

F2n

ALRIMe

ING. WILLIAM LEON V. 92

donde:: es el límite real inferior del intervalo

mediano.: es la amplitud del intervalo mediano.

j

jLRI

jAMEDIANAMe

Para datos Agrupados

con Intervalos

Temperatura.

( C )

Nº días

10 15 8 8lugar.vo1818

2n

iF

ING. WILLIAM LEON V. 93

10-15 8 8

15-18 9 17

18-25 12 29

25-30 7 36

2

MEDIANAMe

Para datos Agrupados

con Intervalos

32 F2n

F 3IMe

L

ING. WILLIAM LEON V. 94

58,1812

1718718Me

Luego:

MEDIANAMe

Para datos Agrupados

con Intervalos

Respuesta:

En el 50% de los días se registro una temperatura por debajo de los 19 C, en el resto de los días hubo una temperatura

ING. WILLIAM LEON V. 95

resto de los días hubo una temperatura superior o igual a los 19 C.

MEDIANAMe

Para datos Agrupados

con Intervalos

Como medida descriptiva, tiene la ventaja deno estar afectada por las observacionesextremas, ya que no depende de los valoresque toma la variable, sino del orden de lasmismas. Por ello es adecuado su uso en

ING. WILLIAM LEON V. 96

mismas. Por ello es adecuado su uso endistribuciones asimétricas.

MEDIANA

Me

Page 17: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

17

Es de cálculo rápido y de interpretaciónsencilla.

A diferencia de la media, la mediana de unabl d l d l

ING. WILLIAM LEON V. 97

MEDIANA

Me

variable discreta es siempre un valor de lavariable que estudiamos (ej. La mediana deuna variable número de hijos toma siemprevalores enteros).

Si una población está formada por 2subpoblaciones de medianas Med1 y Med2,sólo se puede afirmar que la mediana, Med,de la población está comprendida entre Med1y Med2

ING. WILLIAM LEON V. 98

y Med2

MEDIANA

Me

El mayor defecto de la mediana es que tiene unas propiedades matemáticas complicadas, lo que hace que sea muy difícil de utilizar en inferencia estadística.

Sea X una variable discreta que ha presentado sobre una muestra

las modalidades

ING. WILLIAM LEON V. 99

LA MEDIA Y

MEDIANA

Me

Si cambiamos la últimaobservación por otraanormalmente grande, esto noafecta a la mediana, pero si a la

ING. WILLIAM LEON V.100

, pmedia:

LA MEDIA Y

MEDIANA

Me

Obtener la media aritmética y lamediana en la distribución adjunta.Determinar gráficamente cuál de losdos promedios es más significativo.

ING. WILLIAM LEON V.101

li-1 - li ni

0 - 10 60

10 - 20 80

20 - 30 30

30 - 100 20

100 - 500 10LA MEDIA Y

MEDIANA

Me

li-1 - li fi ai xi xi fi Ni

0 - 10 60 10 5 300 60 60

10 - 20 80 10 15 1.200 140 80

20 30 30 10 25 750 170 30

Solución:

ING. WILLIAM LEON V.102

20 - 30 30 10 25 750 170 30

30 - 100 20 70 65 1.300 190 2,9

100 - 500 10 400300

3.000 200 0,25

n=200

LA MEDIA YMEDIANA

Me

Page 18: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

18

La media aritmética es:

ING. WILLIAM LEON V.103

LA MEDIA YMEDIANA

Me

La primera frecuencia absoluta acumulada que supera el valor n/2=100 es Ni=140.

Por ello el intervalo mediano es [10;20).

ING. WILLIAM LEON V.104

Así:

LA MEDIA YMEDIANA

Me

ING. WILLIAM LEON V.105

LA MEDIA YMEDIANA

Me

Para ver la representatividad deambos promedios, se ve en elhistograma de la figura anterior y

ING. WILLIAM LEON V.106

histograma de la figura anterior, yobservamos que dada la forma dela distribución, la mediana es másrepresentativa que la media.

LA MEDIA YMEDIANA

Me

Es el valor de la variable que sepresenta con mayor frecuencia.

Una distribución de frecuencias

ING. WILLIAM LEON V.107

Una distribución de frecuenciaspuede ser unimodal (una moda),bimodal (dos modas) , ............ ,multimodal (n modas).

LAMODA

Mo ING. WILLIAM LEON V.108

unimodal bimodal multimodal

LAMODA

Mo

Page 19: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

19

La Moda es el dato que más se repite.

ING. WILLIAM LEON V.109

LA MODAMo

Para datos NOAGRUPADOS

Seis personas presentan las edades siguientes: 25 , 18 , 20 , 25 , 30 , 25Calcular e interpretar la Moda.Mo = 25 añosL í d t ti 25 ñ

ING. WILLIAM LEON V.110

La mayoría de estas personas tienen 25 años.

LA MODAMo

Para datos NOAGRUPADOS

Se ubica la máxima frecuencia absoluta simple ( ) , la moda es el valor de la variable que presenta dichaif

ING. WILLIAM LEON V.111

valor de la variable que presenta dicha frecuencia.

LA MODAMo

Para datosAGRUPADOS

SIN NTERVALOS

Hallar e interpretar la moda de la siguientetabla de distribución de frecuencias.

Nº de PCs vendidas

Nº de meses

f

ING. WILLIAM LEON V.112

vendidas

20 5

22 7

24 10

30 6

32 8

iX if

LA MODAMo

Para datosAGRUPADOS

SIN INTERVALOS

Máx = 10 Mo = 24 PCs.

Respuesta:

if

ING. WILLIAM LEON V.113

En la mayoría de los meses se vendieron 24 PCs.

LA MODAMo

Para datosAGRUPADOS

SIN NTERVALOS

Sólo la Moda tiene significado paravariables cualitativas nominales.

ING. WILLIAM LEON V.114

LA MODAMo

Para datosAGRUPADOS

SIN INTERVALOS

Page 20: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

20

iXif

Nº de impresoras

Marca

1.- Hallar e interpretar la moda de la siguiente tabla de distribución de frecuencias.

ING. WILLIAM LEON V.115

HewlettPackard

7

Epson 11

Canon 23

Lexmark 9

p

LA MODAMo

Para datosAGRUPADOS

SIN INTERVALOS

iXif

Máx = 23

Mo = Canon.

if

ING. WILLIAM LEON V.116

Respuesta La mayoría de las impresoras vendidas corresponde a la marca Canon.

LA MODAMo

Para datosAGRUPADOS

SIN NTERVALOS

iXif

Interpretar la moda de la siguiente tabla de distribución de frecuencias correspondiente a la importación de equipos informáticos:if

Año Nº equipos (en miles)

1996 5

1997 47

ING. WILLIAM LEON V.117

1997 47

1998 55

1999 96

2000 145

2001 170

2002 190

2003 220

2004 160

LA MODA

Mo

Para datos

AGRUPADOS

SIN INTERVALOS

iXif

Máx = 220

Mo = 2003

if

ING. WILLIAM LEON V.118

Respuesta:

La mayor cantidad de equipos informáticos se importaron durante el año 2003.LA MODA

MoPara datos

AGRUPADOSSIN INTERVALOS

iX

En la columna de las frecuenciasabsolutas simples se ubica la máximafrecuencia; entonces el intervalo queposee dicha frecuencia es el intervalojf

ING. WILLIAM LEON V.119

posee dicha frecuencia es el intervalomodal, es decir el intervalo al cual va apertenecer la moda.

Máxima frecuencia =

La mediana pertenece al intervalo

jI

jf

jILA MODAMo

Para datosAGRUPADOS

CON INTERVALOS

iX

Luego se aplica la siguiente fórmula:

)ff()ff(

)ff(ALRIMo

1jj1jj

1jjjj

ING. WILLIAM LEON V.120

donde:: es el límite real inferior del intervalo modal.

: es la amplitud del intervalo modal.: es la mayor frecuencia absoluta simple.

jLRI

jA

jfLA MODA

MoPara datos

AGRUPADOSCON INTERVALOS

Page 21: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

21

iX

1.- La siguiente tabla muestra ladistribución de las edades de un grupo depersonas.Calcular e interpretar la moda.

ING. WILLIAM LEON V.121

5I

LA MODAMo

Para datosAGRUPADOS

CON INTERVALOS

iX

Entonces:

75,78)515()915(

)915(1872Mo

ING. WILLIAM LEON V.122

La mayoría de estas personas tieneaproximadamente 79 años.LA MODA

MoPara datos

AGRUPADOSCON INTERVALOS

iX

2.-Los siguientes datos corresponden alnúmero de impresoras que se hanvendido en una tienda durante losúltimos tres meses.

Nº impresoras :

20-39 40-49 50-59 60-80 81-96

ING. WILLIAM LEON V.123

impresoras :

Nº de días :

8 22 30 16 14

Calcular e interpretar la moda.

LA MODAMo

Para datosAGRUPADOS

CON INTERVALOS

iX

Entonces:

14,53)1630()2230(

)2230(105,49Mo

ING. WILLIAM LEON V.124

En la mayoría de días se han vendido aproximadamente 53 impresoras.

)1630()2230(

LA MODAMo

Para datosAGRUPADOS

CON INTERVALOS

iX

Es muy fácil de calcular. Puede no ser única. Es función de los intervalos elegidos a

través de su amplitud, número y límites

ING. WILLIAM LEON V.125

de los mismos. Aunque el primero o el último de los

intervalos no posean extremos inferior o superior respectivamente, la moda puede ser calculada.

LAMODA

Mo

iX

Una distribución de frecuencias puede presentaruna de las tres formas:

Simétrica Asimétrica positiva Asimétrica negativa

ING. WILLIAM LEON V.126

MoMex xMeMo MoMex

RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

Page 22: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

22

iX

En el caso de distribucionesunimodales, la mediana está confrecuencia comprendida entre la

ING. WILLIAM LEON V.127

frecuencia comprendida entre lamedia y la moda (incluso máscerca de la media).

RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

iX

En distribuciones que presentan ciertainclinación, es más aconsejable el usode la mediana.

ING. WILLIAM LEON V.128

Sin embargo en estudios relacionadoscon propósitos estadísticos y deinferencia suele ser más apta la media.

RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

iX

Consideramos una tabla estadística relativa a una variable continua, de la que nos dan los intervalos, las marcas de clase ci y las frecuencias absolutas

ING. WILLIAM LEON V.129

de clase ci, y las frecuencias absolutas, ni.

RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

iX

Intervalos ci ni

0 2 1 2

ING. WILLIAM LEON V.130

0 -- 2 1 2

2 -- 4 3 1

4 -- 6 5 4

6 -- 8 7 3

8 - 10 9 2RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

Para calcular la media podemos añadir una columna con las cantidades

. La suma de los términos de esa

iX

ING. WILLIAM LEON V. 131

La suma de los términos de esa columna dividida por n=12 es la media:

RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

iX

Intervalos ci ni Ni

0 -- 2 1 2 2 2

2 -- 4 3 1 3 3

ING. WILLIAM LEON V. 132

4 -- 6 5 4 7 20

6 -- 8 7 3 10 21

8 - 10 9 2 12 18

12 64

RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

Page 23: Estadistica y Prob 03

CLASE 03 MEDIDAS DE CENTRALIZACIÓN Ing William León Velásquez

23

iX

ING. WILLIAM LEON V.133

La media es 5.3RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

La mediana es el valor de la variable que deja por debajo de sí a la mitad de las nobservaciones, es decir 6.

Construimos la tabla de las frecuencias absolutas acumuladas Ni y vemos que eso

iX

ING. WILLIAM LEON V.134

absolutas acumuladas, Ni, y vemos que eso ocurre en la modalidad tercera, es decir,

RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

iX

ING. WILLIAM LEON V.135

La mediana es 5.5RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

Para el cálculo de la moda, lo primero es encontrar los intervalos modales, buscando los máximos relativos en la columna de las frecuencias absolutas, ni. iX

ING. WILLIAM LEON V.136

RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

iX

El intervalo modal es (l2,l3]=(4;6], siendo la moda el punto perteneciente al mismo que se obtiene como:

ING. WILLIAM LEON V. 137

obtiene como:

RELACIÓN

ENTRE LA MEDIA, LA MEDIANA Y LA MODA

[email protected]

ING. WILLIAM LEON V.138