Medidas de Tendencia Central Arvelo

48
ANGEL FRANCISCO ARVELO LUJAN Angel Francisco Arvelo Luján es un Profesor Universitario Venezolano en el área de Probabilidad y Estadística, con más de 40 años de experiencia en las más reconocidas universidades del área metropolitana de Caracas. Universidad Católica “Andrés Bello” : Profesor Titular Jubilado 1970 a 2003 Universidad Central de Venezuela: Profesor por Concurso de Oposición desde 1993 al presente Universidad Simón Bolívar: Profesor desde 2005 al presente Universidad Metropolitana: Profesor desde 1973 a 1987 Universidad Nacional Abierta: Revisor de contenidos, desde 1979 hasta 2004 Sus datos personales son : Lugar y Fecha de Nacimiento: Caracas, 16-02-1947 Correo electrónico: [email protected] Teléfono: 58 416 6357636 Estudios realizados: Ingeniero Industrial. UCAB Caracas 1968 Máster en Estadística Matemática CIENES , Universidad de Chile 1972 Cursos de Especialización en Estadística No Paramétrica Universidad de Michigan 1982 Doctorado en Gestión Tecnológica: Universidad Politécnica de Madrid 2006 al Presente El Profesor Arvelo fue Director de la Escuela de Ingeniería Industrial de la Universidad Católica “Andrés Bello” (1974-1979) , Coordinador de los Laboratorios de esa misma Universidad especializados en ensayos de Calidad, Auditor de Calidad, y autor del libro “Capacidad de Procesos Industriales” UCAB 1998. En numerosas oportunidades, el Profesor Arvelo ha dictado cursos empresariales en el área de “Estadística General” y “Control Estadístico de Procesos”. Una mayor información puede ser obtenida en la siguiente página web: www.arvelo.com.ve

description

Presenta un estudio detallado sobre el uso y aplicaciones de las las medidas estadisticas conocidas como "promedios"

Transcript of Medidas de Tendencia Central Arvelo

Page 1: Medidas de Tendencia Central Arvelo

ANGEL FRANCISCO ARVELO LUJAN Angel Francisco Arvelo Luján es un Profesor Universitario Venezolano en el área de Probabilidad y Estadística, con más de 40 años de experiencia en las más reconocidas universidades del área metropolitana de Caracas. Universidad Católica “Andrés Bello” : Profesor Titular Jubilado 1970 a 2003 Universidad Central de Venezuela: Profesor por Concurso de Oposición desde 1993 al presente Universidad Simón Bolívar: Profesor desde 2005 al presente Universidad Metropolitana: Profesor desde 1973 a 1987 Universidad Nacional Abierta: Revisor de contenidos, desde 1979 hasta 2004 Sus datos personales son : Lugar y Fecha de Nacimiento: Caracas, 16-02-1947 Correo electrónico: [email protected] Teléfono: 58 416 6357636 Estudios realizados: Ingeniero Industrial. UCAB Caracas 1968 Máster en Estadística Matemática CIENES , Universidad de Chile 1972 Cursos de Especialización en Estadística No Paramétrica Universidad de Michigan 1982 Doctorado en Gestión Tecnológica: Universidad Politécnica de Madrid 2006 al Presente El Profesor Arvelo fue Director de la Escuela de Ingeniería Industrial de la Universidad Católica “Andrés Bello” (1974-1979) , Coordinador de los Laboratorios de esa misma Universidad especializados en ensayos de Calidad, Auditor de Calidad, y autor del libro “Capacidad de Procesos Industriales” UCAB 1998. En numerosas oportunidades, el Profesor Arvelo ha dictado cursos empresariales en el área de “Estadística General” y “Control Estadístico de Procesos”.

Una mayor información puede ser obtenida en la siguiente página web: www.arvelo.com.ve

Page 2: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

2

MEDIDAS DE TENDENCIA CENTRAL Cuando se tiene un conjunto de datos cuantitativos que representan a una población o a una muestra, se hace necesario obtener a partir de ellos ciertos valores que describan su comportamiento, y que permitan comparar a esta población o muestra con otra, con el objeto de llegar a conclusiones acerca de como es el comportamiento de una con relación al de la otra. Estos valores cuando se calculan sobre toda la población se denominan “Parámetros Poblacionales” ; mientras que cuando se calculan sobre una muestra se denominan “Estadigrafos” o “Estadísticos muestrales” . La Estadística Descriptiva sin embargo , no hace distinción entre población y muestra , pues su objetivo es simplemente describir el comportamiento de los datos, y por ese motivo , a estos valores los llama “Medidas” . Según sea el aspecto de los datos que se quiera analizar, existen distintos tipos de “Medidas” , y en este capítulo se analizará el primer grupo de ellas conocidas bajo el nombre de “Medidas de Tendencia Central” . A las medidas de tendencia central, también se les suele llamar “promedios”, son siempre un valor numérico comprendido entre los dos valores extremos , es decir entre el mínimo y el máximo valor de los datos, y se utilizan como valor representativo de ellos. A continuación se estudiaran las principales medidas de tendencia central con sus propiedades, y mas adelante, se analizaran las ventajas y desventajas del uso de cada uno de ellos como “promedios” .

V.1. La media aritmética simple . Dado un conjunto de “n” datos

cuantitativos sin agrupar , x1, x2 ,x3 , ......, xn , se define como “media aritmética

simple” X , a su suma dividida entre el número de datos, es decir ;

Xx x x

n

x

nn

ii

i n

1 2 1

La media aritmética simple es la más conocida y utilizada de las medidas de tendencia central , y también se le conoce bajo otros nombres , tales como “promedio simple” , “media” , etc. ; cuando los “n” datos constituyen toda la población , se le llama “media poblacional” y se suele designar con la letra griega

“ ”, mientras que cuando los “n” datos corresponden a una muestra, se le llama “media muestral” . Ejemplo 5.1 : Un alumno obtuvo en los cuatro exámenes parciales de una asignatura , las siguientes calificaciones : 14 , 08 , 12 y 18 . Calcular la media aritmética simple de sus calificaciones .

Solución : X14 8 12 18

4

52

413

Page 3: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

3

Propiedades de la media aritmética simple: Propiedad N°1: Si cada uno de los datos es sustituido por la media aritmética , la

suma no se altera , es decir : x1+ x2 +x3 + ...... + xn = X+X+X+......+X = n X .

Demostración : Por definición : Xx x x

nn1 2

Por lo tanto : x1+ x2 +x3 + ...... + xn = n X = X+ X+ X +...... + X . Esta propiedad significa que la media aritmética representa a los datos en su suma, pues si se sustituye cada uno de los datos por la media aritmética, la suma no se altera; así por ejemplo, aplicada al caso del Ejemplo 5.1 , significa que si el alumno en lugar de haber obtenido las calificaciones 14 , 08 , 12 y 18 , hubiese obtenido una calificación constante de 13 puntos en cada uno de los cuatro exámenes parciales, al final del curso , habría acumulado la misma cantidad de puntos ; o dicho en otras palabras , 13 puntos representa a las calificaciones obtenidas por este alumno , pues para él es indiferente obtener 13 puntos en cada uno de los exámenes , que obtener 14 , 08 , 12 y 18 . Propiedad N°2: El valor de la media aritmética está siempre comprendido entre el mínimo y el máximo valor de los datos . Demostración : Supongamos que los “n” datos están ordenados de menor a mayor

, y que por lo tanto : x1 x2 x3 ...... xn .

Por la propiedad anterior se tiene : n X = x1+ x2 +x3 + ...... + xn Si en la suma, cada dato es sustituido por el menor valor x1 , la suma se hace más

pequeña , y por tanto : n X x1+ x1 +x1 + ...... + x1 = n x1 X x1 Análogamente , si en la suma cada dato es sustituido por el mayor valor xn , la suma se hace más grande , y por tanto :

n X xn+ xn +xn + ...... + xn = n xn X xn

y por lo tanto se concluye en que : x1 X xn

Esta propiedad de encontrarse siempre entre el mínimo y el máximo valor de los datos , la tienen todas las medidas de tendencia central , y por lo tanto resulta imposible que al calcular una media aritmética , o cualquier otra medida de tendencia central , el resultado del cálculo se salga del intervalo de variación de los datos .

Nótese que en el Ejemplo 5.1 , X = 13 , que es un valor comprendido entre los dos valores extremos de los datos que son 08 y 18 .

Esta propiedad no garantiza sin embargo ,que el valor de X sea igual a uno de los valores del conjunto de datos , y por ello , es perfectamente posible obtener como

valor de X una cifra no perteneciente al conjunto de datos .

Así, en el Ejemplo 5.1 , el valor X = 13 , no pertenece al conjunto de datos que es { 08 , 12 , 14 , 18 } .

Por esta razón , es un error redondear el valor de X a un entero , aún en el caso en que se esté trabajando con datos enteros ; y así por ejemplo si se tiene un

Page 4: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

4

conjunto de datos como { 12 , 15 , 16 } , X12 15 16

3

43

314 33. , y este valor

no tiene porque ser redondeado . Propiedad N°3: La suma de las desviaciones de los datos respecto de la media aritmética siempre se anula . Se define como desviación de un dato “xi” respecto de un valor “A” a la diferencia xi - A . Cuando esta diferencia resulta positiva , significa que el dato es mayor que el valor “A” ; mientras que cuando da negativa , significa que el dato “xi” es menor que el valor “A” .

Según esta propiedad cuando A = X , esta suma de desviaciones se anula . Demostración : Designando por “di” a la desviación de cada dato “xi” respecto de

la media aritmética X , se tiene : d1 = x1 - X , d2 = x2 - X , ....., dn = xn - X .

dii

i n

1

= (x1 - X ) + (x2 - X ) + .....+ (xn - X ) = (x1+ x2 + .....+ xn ) - n X = 0 , por la

propiedad N° 1 .

Esta propiedad significa que la media aritmética X , se coloca en un punto tal que las suma de las distancias de los datos que están a su izquierda, es siempre igual a la suma de las distancias de los datos que están a su derecha.

En los datos del Ejemplo 5.1, { 08 , 12 , 14 , 18 } donde X = 13 ; los datos a su izquierda 08 y 12 están desviados de ella en -5 y -1 respectivamente ; mientras que los datos a la derecha 14 y 18 están desviados en +1 y +5 respectivamente. La suma de desviaciones obviamente se compensa pues : -5-1+1+5 = 0 . La propiedad garantiza que la suma de desviaciones da cero , pero no que cada desviación negativa tendrá otra positiva igual en valor absoluto , como en este ejemplo . Cuando se da la circunstancia de este ejemplo, se dice que los datos son simétricos respecto de la media aritmética . Ejemplo 5.2 Dado el conjunto de datos { 12 , 20 , 21 , 25 , 30 } . Verificar que la suma de desviaciones respecto de la media aritmética se anula , y analizar si la muestra es o no , simétrica respecto de ella .

Solución : X12 20 21 25 30

5 = 21.60

Las desviaciones respecto de X son : -9.60 , - 1.60 , - 0.60 , 3.40 y 8.40 . La suma de las desviaciones resulta ser cero , tal como garantiza la propiedad , pero no existe simetría respecto de ella , pues las desviaciones a la izquierda no son iguales en valor absoluto a las desviaciones a la derecha . Propiedad N°4: La suma de los cuadrados de las desviaciones de los datos es mínima, cuando estas desviaciones se calculan respecto de la media aritmética. Demostración : Supongamos que se calcula la desviación de cada dato respecto de un valor cualquiera “A”, y que se efectúa la suma de sus cuadrados .

Se tiene entonces: ( )x Aii

i n2

1

; y se pretende demostrar que esta suma es mínima,

cuando A= X .

Page 5: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

5

En efecto , sumando y restando X dentro de la sumatoria, se llega a :

[( ) ( )]x X X Aii

i n2

1

= [( ) ( ) ( )( )]x X X A x X X Ai ii

i n2 2

1

2 =

( )x Xii

i n2

1

+ n ( )X A 2 + 21

( ) ( )X A x Xii

i n

Pero ( )x Xii

i n

1

= 0 , por la propiedad N° 3 , y por tanto se concluye que:

( )x Aii

i n2

1

= ( )x Xii

i n2

1

+ n ( )X A 2

en donde resulta obvio , que cuando A= X , la suma de los cuadrados de las

desviaciones se hace mínima , pues el término ( )X A 2 se anula .

Propiedad N°5 : Cuando un conjunto de datos { x1, x2 , x3 ,

......, xn } es sometido a una transformación lineal : Y = a + b X , entonces la media aritmética queda

afectada por esa misma transformación lineal, es decir : Y= a + bX . Demostración: Supongamos que por efecto de la transformación lineal : Y = a+bX, el conjunto de datos { x1, x2 , x3 ,

......, xn } se transforma en { y1, y2 , y3 , ......, yn } , en

donde yi =a + b xi . Se tiene entonces que :

Yy y y

nn1 2 =

y

n

ii

i n

1 =

( )a bx

n

ii

i n

1 =

na b x

n

ii

i n

1 = a +b

x

n

ii

i n

1 = a + bX

Como corolario , se obtienen otras dos propiedades Propiedad N° 5.1: Si a un conjunto de datos se les suma a cada uno , una constante , entonces la nueva media es la anterior sumada a esa constante .

Este es el caso particular: b=1 , donde Y = X + a Y X + a Propiedad N° 5.2 : Si a un conjunto de datos se les multiplica a cada uno por una constante , entonces la nueva media es la anterior multiplicada por esa misma constante.

Este es el caso particular a = 0 , donde Y = b X Y b X Estas propiedades tienen una gran aplicación práctica , pues tal como se analizó en el capítulo anterior , los cambios de unidades en los datos son por lo general transformaciones lineales que consisten en multiplicarlos por un factor , y según esta propiedad , en estos casos , para calcular la nueva media basta con multiplicar la media anterior por el factor de conversión . Ejemplo 5.3 : Al medir el diámetro de cinco ejes se encontraron los siguientes resultados expresados en pulgadas : 2.50 , 2.80 , 2.73 , 2.56 y 2.61 . Calcular la media aritmética simple de estos datos expresada en centímetros. Solución : Existen dos procedimientos: a) Transformar cada dato a centímetros, y luego calcularles su media. El factor de conversión de pulgadas a centímetros es 2.54 , y por lo tanto los datos al transformarlos resultan : 6.3500 , 7.1120 , 6.9342 , 6.5024 y 6.6294.

Page 6: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

6

La media aritmética simple de los datos transformados es en consecuencia:

Y6.3500 7.1120 6.9342 6.5024 6.6294

5 = 6.7056 centímetros.

b) Aplicar la propiedad N°5 , pues la conversión de pulgadas a centímetros es una

transformación lineal de la forma : Y = 2.54 X , y por lo tanto: Y 2.54 X

X2.50 2.80 2.73 2.56 2

5

.61 = 2.64 Y = 2.54 ( 2.64 ) = 6.7056 cm.

Es de hacer notar que cuando la transformación no es lineal , la nueva media no puede ser calculada transformando la media anterior , y en consecuencia no es lo mismo por ejemplo, el cuadrado de la media que la media de los cuadrados, o el logaritmo de la media que la media de los logaritmos. Ejemplo 5.4 : Dados los siguientes datos ; 3 , 5 , 8 y 12 . Hallar la media aritmética de sus cuadrados .

Solución : La transformación en este caso es de la forma : Y = X2 , y para calcular

la media aritmética de sus cuadrados , es necesario elevar al cuadrado cada dato.

Y = 3 +5 +8 +12

4

2 2 2 2

= 60.5

Nótese que: Y X2 ; pues X =

3 +5 +8 +12

4 = 7 , y 60.5 7

2 = 49 .

En este caso no se mantiene la relación , por no ser lineal la transformación. Propiedad N°6 : Si se tienen dos conjuntos de datos disjuntos (que no tienen

elementos comunes) , el primero de tamaño n1 con media aritmética X1 , y el

segundo de tamaño n2 , con media aritmética X2 , entonces la media aritmética de

la unión es: Xn X n X

n n1 1 2 2

1 2

.

Demostración : Sea x n11 12 13 1 1, , , , x x x el primer conjunto de datos , y

x n21 22 23 2 2, , , , x x x el segundo conjunto de datos .

Como por hipótesis , no existen elementos en común , el número total de datos en la unión será : n = n1+n2 , y la media de la unión será :

Xx x x x

n n

n n11 12 1 21 22 2

1 2

1 2+ x + x + +

Pero, por la propiedad N° 1 se verifica : x x X

x x n X

n

n

11 12 1 1 1

21 22 2 2 2

1

2

+ x n

+ x + + ; y por lo tanto:

Xn X n X

n n1 1 2 2

1 2

; tal como se quería demostrar .

Por una demostración análoga, esta propiedad se puede generalizar al caso en que se tengan “k” conjuntos de datos disjuntos , cada uno con un tamaño y una

Page 7: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

7

media aritmética conocida, y se quiera calcular la media aritmética de su unión , la

cual viene dada por la expresión: Xn X n X n X

n n nk k

k

1 1 2 2

1 2

.

Ejemplo 5.5 : Se administró un mismo examen de Estadística a dos secciones . La primera sección tenia 25 alumnos , y su media resultó ser de 12,40 puntos ; mientras que la segunda sección tenia 40 alumnos , y su media fue de 14, 25 puntos. ¿ Cual es la media de las dos secciones en conjunto ? . Solución : Según la propiedad anterior , la media de todo el grupo de 65 alumnos

es de : X25 12 40 40 14 25

25 40

( , ) ( , ) =

880

65 = 13,54 .

Propiedad N° 7 : Cuando los datos están agrupados en una tabla de frecuencias , la media aritmética se calcula mediante la expresión :

X

L

f

i i

i

i k

i

i

i k

* f1

1

=

L

n

i i

i

i k* f

1 = L hi

i

i k

i*

1

Donde : Li* = Punto Medio del intervalo “i”, también llamado “Marca de Clase”.

fi = Frecuencia absoluta del intervalo “i” . hi = Frecuencia relativa del intervalo “i” . k = número de intervalos .

n = fii

i k

1

= número de datos .

Demostración : La fórmula anterior es obtenida como una aproximación a la definición de “Media Aritmética” dada para datos sin agrupar . En efecto , tal como se definió anteriormente cuando se tiene un conjunto de “n”

datos sin agrupar { x1, x2 ,x3 , ......, xn } : X

x x x

n

x

nn

ii

i n

1 2 1 .

Sin embargo , tal como se explicó en el Capítulo anterior , al agrupar , se pierde la información acerca del verdadero valor del dato , y por lo tanto no se sabe cual es

el valor exacto de cada xi , y no es posible calcular exactamente X . Frente a esta situación , se hace la siguiente aproximación : Cada dato se supondrá igual al punto medio de su intervalo de clase , también llamado “Marca de Clase” . Lo anterior significa que si un dato cae en el intervalo [10 ; 20 ) , se supondrá que su verdadero valor es 15 . Esta aproximación se fundamenta en el supuesto de que al agrupar, los datos se distribuyen de manera uniforme dentro del intervalo , y que por ello se producirá

Page 8: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

8

una compensación ; pues se encontraran igual número de datos a la izquierda del punto medio , que a su derecha. Al hacer esta aproximación, tendremos que cada dato pasa a estar representado

por su marca de clase , es decir : xi Li* ; y como existen tantos datos dentro del

intervalo como sea su frecuencia , al sumar todos los datos , la marca de clase de cada intervalo se repetirá tantas veces como sea la frecuencia del intervalo, y de

allí que: Xx x x

n

L

f

n

i i

i

i k

i

i

i k1 2 1

1

* f

.

Ejemplo 5.6 : La siguiente tabla representa el contenido en gramos de unos ciertas cajas de cereal. Contenido Frecuencia 470 a 479 8 480 a 489 19 490 a 499 47 500 a 509 55 510 a 519 31 520 a 529 14 530 a 539 6 Calcule la media aritmética de esta distribución de frecuencias . Solución : Conviene organizar los cálculos de la siguiente manera : Límites de Clase Límites reales

Li* = Marca de Clase fi = Frecuencia

Li* fi

470 ; 479 469.50 ; 479.50 474.50 8 3.796,00

480 ; 489 479.50 ; 489.50 484.50 19 9.205,50

490 ; 499 489,50 ; 499.50 494.50 47 23.241,50

500 ; 509 499.50 ; 509.50 504.50 55 27.747,50

510 ; 519 509.50 ; 519.50 514.50 31 15.949,50

520 ; 529 519.50 ; 529.50 524.50 14 7.343,00

530 ; 539 529.50 ; 539.50 534.50 6 3.207,00

TOTAL 180 90.490,00

X = 90 490 00

180

. , = 502,722

Método abreviado de cálculo : Cuando no se dispone de una buena calculadora para realizar los cálculos , y siempre que la tabla de frecuencias sea con intervalos de igual amplitud, es posible abreviar los cálculos siguiendo los siguientes pasos : Paso 1 : Al intervalo de mayor frecuencia se le asigna marca de clase igual a cero. Paso 2 : A los intervalos anteriores al de mayor frecuencia , se le asignan marcas de clase en forma decreciente -1 , -2 , -3 etc., y a los intervalos posteriores al de

Page 9: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

9

mayor frecuencia se les asignan marcas de clase en orden creciente +1 , +2 , +3,

etc. Estas marcas de clase artificiales se designaran por Ui* .

Paso 3 : Se calcula U

U

f

i

i

i k

i

i

i k

* fi1

1

.

Paso 4 : La media de los datos se obtiene mediante la expresión : X = L j* + c U

Donde : L j* = Marca de clase del intervalo de mayor frecuencia .

c = Amplitud real de los intervalos o Ancho de clase . Ejemplo 5.7 : Calcular la media de los datos del Ejercicio 5.6 , por el método abreviado . Solución : En este caso , el intervalo de mayor frecuencia es el cuarto , y a él se le asigna marca de clase igual a cero . ( En caso de existir dos o mas intervalos con la mayor frecuencia , se puede elegir cualquiera de ellos ) . Siguiendo los pasos explicados , se elabora la siguiente tabla: Límites de Clase Límites reales

Ui* = Marca de Clase

fi = Frecuencia Ui

* fi

470 ; 479 469.50 ; 479.50 -3 8 -24

480 ; 489 479.50 ; 489.50 -2 19 -38

490 ; 499 489,50 ; 499.50 -1 47 -47

500 ; 509 499.50 ; 509.50 0 55 0

510 ; 519 509.50 ; 519.50 1 31 31

520 ; 529 519.50 ; 529.50 2 14 28

530 ; 539 529.50 ; 539.50 3 6 18

TOTAL 180 -32

U = 32

180 = -0.1778 ; y teniendo en cuenta que L j

* = 504,50 y que c= 10 , se

concluye que : X = 504,50 - 0,1788 (10 ) = 504,50 - 1,788 = 502,722 Justificación teórica del método abreviado : Este método se fundamenta en las propiedades de la media aritmética ,pues en realidad lo que se ha hecho es una

transformación lineal de los datos definida por : UX A

c ; en donde “A” puede

ser teóricamente cualquier valor , pero que por comodidad de trabajo se toma

como A = L j* , marca de clase del intervalo de mayor frecuencia , pues de esa

manera el número más grande que corresponde a la mayor frecuencia va a quedar multiplicada por cero , y todas las demás marcas de clase van a quedar transformada en números enteros .

Calculada la media “U“de los datos transformados , y teniendo en cuenta que : X = A + c U

Por la propiedad N° 5 : X = A + c U

Page 10: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

10

V.2. La media aritmética ponderada Cuando se calcula una media

aritmética simple , no se establece una discriminación entre los datos , y a todos ellos se les da la misma importancia . En muchas aplicaciones prácticas , el investigador considera que ciertos datos son más importantes que otros , y que por lo tanto deben tener una mayor influencia en el cálculo del promedio que otros. Cuando aparece eta circunstancia , la media correspondiente se denomina “Media

aritmética ponderada” , se designa por “ Xp ” , y se define como :

Xx x x

pn n

n

1 1 2 2

1 2

=

i i

i

i n

i

i

i n

x1

1

; donde i 0

Los coeficientes “ i” se denominan “factores de ponderación” , son arbitrarios , deben ser positivos, y reflejan la importancia que tiene su correspondiente dato xi dentro del conjunto de datos { x1, x2, x3,…, xn}. La dificultad práctica de una media ponderada radica precisamente en la elección de los factores de ponderación , pues en muchas oportunidades esta elección es completamente subjetiva . Nótese que si se seleccionan iguales factores de ponderación para cada dato , la “media aritmética ponderada” se convierte en una “media aritmética simple”; es

decir , que cuando : 1 = 2 = … = n entonces Xp = X ; lo que significa que la

media aritmética simple es un caso particular de una ponderada . Otra manera equivalente de definir una media aritmética ponderada es mediante porcentajes de ponderación . En este caso , a cada dato le corresponderá un cierto porcentaje de ponderación , que refleja su importancia dentro del conjunto , y la suma de todos estos porcentajes deberá ser 100% . Esta forma de definir la media aritmética ponderada es equivalente a la anterior , pues , partiendo de la definición , podemos escribir :

X x x xp

i

i

i n

i

i

i nn

i

i

i n n1

1

12

1

2

1

Page 11: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

11

Si ahora se define : jj

i

i

i n jx

1

, entonces se tendrá a la media aritmética

ponderada como : X x x xp n n1 1 2 2 = j j

j

j n

x1

, en donde j

j

j n

1

= 1 ,

pues : j

j

j n

1

= ( )j

i

i

i nj

j n j

j

j n

i

i

i n

1

1

1

1

= 1 .

Lo usual es multiplicar a “ j ” por 100 , para expresarlo en porcentaje .

Ejemplo 5.8 : Un estudiante que cursa 3 asignaturas obtuvo las siguientes calificaciones : Asignatura A : 12 puntos , Asignatura B: 16 puntos , Asignatura C:11 puntos . a) Calcule la media aritmética simple de sus calificaciones . b) Calcule la media aritmética ponderada de sus calificaciones , tomando como factor de ponderación el número de unidades crédito que tiene cada asignatura , que son 3, 2 y 5 respectivamente . c) ¿ Cual es el porcentaje de ponderación que le corresponde a cada asignatura? Solución : a) Al calcular la media aritmética simple , no se hace distinción entre la dedicación que exige cada asignatura , y se supone todas son de igual grado de

dificultad . X12 16 11

313

b) Al calcular la media aritmética ponderada , se establece una discriminación entre las tres asignaturas , y se supone que cuantas más unidades crédito tenga ,

mas exigente es . Xp

12 3 16 2 11 5

3 2 5

( ) ( ) ( )= 12.30

c) Los porcentajes de ponderación correspondientes a cada asignatura son :

A

3

3 2 5100%=30 % ; B

2

3 2 5100%=20% ; C

5

3 2 5100%=50%

Nótese que la media aritmética ponderada también pudiera ser calculada aplicando sus porcentajes de ponderación a cada calificación.

Xp = (0,30) 12 + (0,20) 16 + (0,50) 11 = 12.30

Ejemplo 5.9 : Un comerciante le compró un mismo producto a tres proveedores distintos . Al primero le compró 300 unidades a un precio de Bs. 6 por unidad , al segundo 500 unidades a Bs. 5.80 cada una , y al tercero 1200 unidades a Bs. 5.00 cada una. ¿ Cual es el precio promedio al que este comerciante ha adquirido cada unidad del producto ? .

Page 12: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

12

Solución : El comerciante compró 300 + 500 + 1200 = 2000 unidades , y en total pagó por ellas : 300 ( 6.00) + 500 (5.80) + 1200 (5.00) = Bs. 10.700,00 . Un precio promedio debe interpretarse como un precio tal que si hubiese comprado todas las unidades a ese mismo precio , entonces hubiese tenido que pagar la misma cantidad de dinero que pagó a precio variable .

El precio promedio será entonces : Xp

10700

2000 = Bs. 5.35 por unidad .

Para el comerciante resulta indiferente comprar las 2000 unidades a Bs. 5,35 cada una , que comprar 300 a Bs. 6.00, 500 a Bs. 5.80 y 1200 a Bs. 5.00. es por ello que 5.35 representa el precio promedio de compra . Nótese que 5.35 es la media aritmética ponderada de los tres precios , tomando como factor de ponderación las respectivas cantidades que compró .

Xp

300 6 00 500 5 80 1200 5 00

300 500 1200

( . ) ( . ) ( . ) = 5.35 Bs./unidad

V.3. La media armónica : Dado un conjunto de datos { x1, x2, x3,…, xn}., todos

ellos diferentes de cero , se define como media armónica “H” , al inverso de la media aritmética de sus inversos ; es decir :

Hx x x

nn

F

H

GGG

I

K

JJJ

1 1 1

1 2

1

= n

x x xn

1 1 1

1 2

La media armónica es una medida de tendencia central poco utilizada en la práctica , que debe su nombre a las llamadas progresiones armónicas, las cuales tienen ciertas aplicaciones en geometría y en la teoría del sonido. Se dice que tres cantidades a, b y c están en progresión armónica , cuando:

a

c

a b

b c , como por ejemplo

3

4 ,

3

5 ,

1

2 ,

3

7 , ….. ..

Si se dan los números “a” y “c” , y se quiere hallar uno intermedio “b” , que forme progresión armónica con ellos , el resultado conduce a la media armónica . Este mismo concepto le da origen al nombre de media aritmética, pues si se tienen dos números “a” y “c” , y se quiere hallar uno entre ellos “b” , que forme

progresión aritmética , el resultado conduce a : b = a c

2 .

Cuando unas cantidades están en progresión armónica , sus inversos están en progresión aritmética . Cuando se le da diferente importancia a cada uno de los datos, se obtiene la media armónica ponderada “Hp” , que se define como :

H

x x x

pn

n

n

1 2

1

1

2

2

; donde i > 0

Page 13: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

13

Ejemplo 5.10 : Supongamos que una persona tiene un presupuesto de Bs. 10.000 mensuales para la compra de un cierto artículo , y que el precio unitario de ese artículo varía mensualmente. Supongamos que durante el primer mes el precio fue de Bs. 2 por unidad , en el segundo mes de Bs. 4 , el tercero de Bs.5 y el cuarto de Bs.8 . Calcule el precio promedio al que esta persona ha comprado el artículo . Solución : Debemos entender por precio promedio , aquel precio que de haberse mantenido constante durante el lapso de cuatro meses , le hubiese permitido comprar la misma cantidad de artículos. En número total de artículos comprados resultó ser :

10000

2+

10000

4+

10000

5+

10000

8 = 10.750

El total pagado fue : 10.000 x 4 = 40.000

El precio promedio es , en consecuencia : 40 000

10 750

.

.= 3,72 Bs./unidad.

Nótese que este precio promedio , corresponde a la media armónica de los

precios: H4

1

2

1

4

1

5

1

8

= 3,72

Ejercicio 5.11: Un móvil recorre una distancia de 600 Km., los primeros 100 Km., lo hace a una velocidad de 50 Km./hr., los siguientes 300 Km., a una velocidad de 150 Km./hr , y los últimos 200 Km. a 80 Km./hr. ¿ Cual ha sido la velocidad media durante todo el trayecto ? . Solución : La velocidad media es aquella que de haberse mantenido constante durante todo el trayecto , hubiese empleado el mismo tiempo .

El tiempo total empleado es : t100

50

300

150

200

80

La velocidad media resulta ser la media armónica ponderada de las velocidades

Hp

600

100

50

300

150

200

80

= 92,31 Km. /hr

Ejercicio 5.12: Encuentre la media armónica para los datos del Ejercicio 5.6 . En el caso de una distribución de frecuencias , la marca de clase representa a todos los datos que caen en el intervalo , y por lo tanto cada marca de clase se repite tantas veces como sea la frecuencia . La media armónica de los datos es en consecuencia , la media armónica ponderada de las marcas de clase , tomando como factor de ponderación a su

respectiva frecuencia : H

f

f

L

f

L

f

L

i

i

i k

k

k

1

1

1

2

2* * *

Page 14: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

14

H8 19 47 55 31 14 6

8

474 50

19

484 50

47

494 50

55

504 50

31

514 50

14

524 50

6

534 50. . . . . . .

= 502,36

V.4. La media geométrica : Dado un conjunto de datos { x1, x2, x3,…, xn}.,se

define como su media geométrica , a la raíz enésima de su producto.

G xnn x x1 2

El nombre de “geométrica” , le viene a este tipo de “media” , por las llamadas “progresiones geométricas” , pues si se tienen dos números “a” y “c” , y se quiere encontrar un número intermedio “b” , que forme una progresión geométrica con

ellos , se obtiene que “b” es ac , es decir la media geométrica entre ellos.

Una media geométrica ponderada se define por la siguiente expresión:

G x x xp nn

ii

i n

11

221

La media geométrica se utiliza principalmente para promediar en el tiempo , porcentajes de variación sobre un mismo elemento . Ejercicio 5.13: Un artículo ha experimentado diversos aumentos de precio a largo de un lapso de 4 años . Supongamos que durante el primer año sufrió un incremento del 30 % , durante el segundo año un descenso del 20% , durante el tercer año un aumento del 70% , y durante el cuarto año un incremento del 10% . ¿ Cual ha sido el porcentaje promedio de variación interanual experimentado por este producto ? . Solución : Un porcentaje promedio de variación interanual equivale a un porcentaje fijo que de aplicarse cada año, haría que el precio final del artículo fuese el mismo que a variaciones porcentuales distintas. Así por ejemplo, si el precio inicial de este artículo era P0 , al sufrir el primer incremento de 30 % durante el primer año , su precio será : P1 = P0 + 0,30 P0 = 1,30 P0

Al final del 2° año , su precio será : P2 =P1 - 0,20 P1 = 0,80 P1 = (0,80)(1,30) P0 Repitiendo este procedimiento , para los años 3 y 4 , se obtiene que el precio al final del año 4 será : P4 =(1,10) (1,70) (0,80)(1,30) P0 . Si se aplicara un porcentaje fijo del r % cada año , el precio después de cuatro

años sería : P0 ( )1100

4r.

Como lo que se busca es un porcentaje fijo que arroje el mismo precio final :

P0 ( )1100

4r = (1,10) (1,70) (0,80)(1,30) P0 1

100110 170 0 80 1304r

( , )( , )( , )( , )

de donde r = 18,09 % , que corresponde al porcentaje promedio de incremento interanual , pues si este producto hubiese incrementado su precio cada año en 18,09 % ; su precio final , al cabo de cuatro años , sería el mismo . Ejercicio N° 5.14: Calcule la media geométrica para los datos del Ejercicio 5.6 . En el caso de una distribución de frecuencias , se supone que cada dato es igual a la marca de clase del intervalo al que pertenece , y por ello al multiplicarlos para calcular la media geométrica , cada marca de clase resulta elevada a su

Page 15: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

15

frecuencia ; de allí que la media geométrica de la distribución de frecuencias es la media geométrica ponderada de las marcas de clase , tomando a sus frecuencias

como factor de ponderación ; es decir : G L L Lf f

kfn k( ) ( ) ( )* * *

1 21 2 .

Para los datos del Ejercicio 5.6 :

G ( . ) ( . ) ( . ) ( . ) ( . ) ( . ) ( . )474 50 484 50 494 50 504 50 514 50 524 50 534 508 19 47 55 31 14 6180 =

502.54 Relación entre las medias armónica , geométrica y aritmética : Cuando se

tiene n datos positivos , existe una propiedad según la cual : H G X . La demostración de esta propiedad para el caso general de un conjunto formado por “n” datos , requiere conocimientos avanzados en “Calculo diferencial con varias variables” para poder resolver un problema de máximos y mínimos condicionados , y se encuentra en el Apéndice de “Demostraciones Importantes”. Una demostración particular , para el caso n = 2 , es la siguiente : Supongamos una muestra formada por dos datos positivos x1 y x2 .

Como: (x1 - x2)2 0 x x x x1

21 2 2

22 0 x x x x12

22

1 22

Sumando 2 1 2x x a cada lado : x x x x x x12

1 2 22

1 22 4 ( )x x x x1 22

1 24

x x x x1 2 1 22 x x

x x1 21 2

2 X G .

Análogamente , como : 1 1

01 2

2

x x

FHG

IKJ

1 2 10

12

1 2 22x x x x

1 1 2

12

22

1 2x x x x

Sumando 2

1 2x x a cada lado :

1 2 1 4

12

1 2 22

1 2x x x x x x

1 1 4

1 2

2

1 2x x x x

FHG

IKJ

1 1 2

1 2 1 2x x x x

1 1

2

11 2

1 2

x x

x x

2

1 1

1 2

1 2

x x

x x H G

y como , ya se había demostrado que : X G , la conclusión es que : H G X . Las tres medias coinciden sólo cuando los datos son iguales .

V.4. Otros tipos de medias : Además de las medias ya mencionadas ,

existen algunas otras que pueden ser obtenidas a partir de fórmulas generales. Una de estas fórmulas generales , es la que se atribuye a los autores Foster y Jordan, que define como Media Ponderada General de orden “r” a Mpr dada por :

Mx x x

pr

r rn n

r

n

r 1 1 2 2

1 2

=

i ir

i

i n

i

i

i n

r

xF

H

GGGG

I

K

JJJJ1

1

1

Page 16: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

16

Esta expresión engloba a todas las medias ya analizadas , pues el lector puede fácilmente comprobar que el caso r=1 da la media aritmética ponderada , y si

además de r=1 , todos los i son iguales , se obtiene la media aritmética simple.

El caso r = -1 , da la media armónica ponderada , o la armónica simple cuando los

i son iguales .

Un caso especial lo constituye r= 0 , pues se presenta una indeterminación de la

forma 1 , la cual tiene que ser resuelta mediante el límite : limr 0

Mpr ,

obteniéndose como resultado la media geométrica ponderada , o la media

geométrica simple , según los i sean diferentes o iguales respectivamente .

El caso r=2 , da lugar a la media cuadrática , que tiene ciertas aplicaciones en Electricidad , y para r=3 , se denomina media cúbica, las cuales pueden ser

simples o ponderadas , según sean iguales o no , los i .

Propiedades de la media general de orden “r” La gráfica que muestra , el valor de la media general de orden “r” , para el caso de datos positivos , es la siguiente: a) En esta gráfica puede apreciarse que una propiedad que presenta la media general de orden “r” , es que para el caso de datos positivos , resulta ser creciente1 con los valores de “r”, y de allí se deduce entonces que la media armónica (r= -1) será igual o menor que la geométrica (r=0) ,y ésta a su vez , igual o menor que la aritmética (r=+1), la cual es menor o igual que la cuadrática (r=+2), y así sucesivamente . b) Otra propiedad que puede apreciarse en la gráfica , es que el valor de la media general de orden “r” para el caso de datos positivos , es que su valor siempre se encuentra comprendido entre los dos valores extremos de los datos , y es por ello que cualquier media , siempre será una medida de tendencia central .

1 La demostración matemática de esta propiedad puede encontrarse en :

Desigualdades ( Pag. 26 ) P.P Korovkin Lecciones populares de matemáticas. Editorial MIR . Moscú .

Page 17: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

17

c) El mínimo y el máximo valor de los datos , representan asíntotas para los valores de la media general de orden “r” , debido a que :

r

Mrlim = Mínimo valor de los datos ; r

Mrlim = Máximo valor de los datos .

Otra expresión de escaso interés práctico , pero muy curiosa y más general aun que la media ponderada general de orden “r” de Foster y Jordan , es la llamada

“media según la función “ o también “ -media” , la cual se define de la siguiente manera :

Si y = (x) es una función monótona creciente o decreciente dentro del intervalo

de variación de los datos { x1, x2, x3,…, xn} , y siendo 1(y) su función inversa ;

se define como media ponderada según la función , a Mp dada por :

Mx x x

pn n

n

FHG

IKJ

1 1 1 2 2

1 2

( ) ( ) ( )

, con i > 0

Nótese que la media ponderada general de orden “r” , es un caso particular de una

- media, cuando (x) = xr . La media cuadrática corresponde al caso particular

(x) = x2 , y la media cúbica a (x) = x3 .

Mediante la “ -media” se pueden definir medias mucho más generales como

por ejemplo , la media logarítmica simple , que vendría dada por : (x) = ln x , y de

allí: Mln = e

x x x

nnln ln ln1 2

, la cual , curiosamente coincide con la media

geométrica . Ejercicio 5.15 : Se tienen tres cuadrados , cuyos lados miden 3, 10 y 11 . ¿ Cual es lado del cuadrado , cuya área es igual a la media aritméticas de sus áreas ? .

Solución : Las áreas de los cuadrados dados son : 32 , 10

2 y 11

2 respectivamente.

La media aritmética de sus áreas es : A3 10 11

3

2 2 2

.

Por lo tanto ,el lado del cuadrado cuya área es igual a la media aritmética de las

áreas es : L3 10 11

3

2 2 2

= 8,756 ; que corresponde a la media cuadrática de

los lados .

V.4. La Mediana : Después de la media aritmética, la medida de tendencia

central más importante es la mediana , la cual se define de la siguiente manera : Dado un conjunto de “n” datos { x1, x2 , x3 ,

......, xn } , la mediana es aquel valor que supera

a la mitad de los datos a lo más , y que es superado por la mitad de los datos a lo más . En la definición anterior , el término “ a lo más” expresa un concepto muy importante , pues significa que dentro del conjunto de datos , no pueden existir más del 50 % de datos , que sean estrictamente menores que la mediana , ni más del 50 % de datos que sean estrictamente mayores que la mediana , y que por lo tanto , la mediana esta ubicada en una posición tal que por ninguno de los dos lados se excede este porcentaje del 50% .

Page 18: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

18

Cálculo de la mediana para datos sin agrupar : Para calcular la mediana de un conjunto de datos sin agrupar { x1, x2 , x3 ,

......, xn } , según la definición anterior , es necesario comenzar ordenándolos de menor a mayor . Los datos ordenados se designaran por {x x x x n( ) ( ) ( ) ( ), , , ,1 2 3 } , en donde x( )1

representa el menor valor dentro del conjunto de datos , el cual obviamente no tiene que coincidir con x1, que representa el valor de la primera observación ; x( )2

representa el segundo menor valor , y así sucesivamente hasta x n( ) que

representa el mayor valor . Una vez ordenados los datos , para calcular la mediana , hay que distinguir dos casos: Caso 1 : “n” es impar . En este caso , la mediana es el valor que ocupe la posición

n 1

2 , una vez ordenados de menor a mayor , es decir : Med x

n 1

2

.

Ejemplo 5.16 : Los pesos de once personas , expresados en kilos , fueron : 84 , 59 , 73 , 66 , 71 , 95 , 68 , 72 , 64 , 66 y 70 . Hallar la mediana . Solución : Se comienza ordenando los datos de menor a mayor . En caso de empate , el dato queda repetido tantas veces como aparezca . En este caso , al ordenar resulta : 59 , 64 ,66 , 66 , 68 , 70 , 71 , 72 , 73 , 84 y 95 . Al tener 11 datos , la mediana es el valor que ocupe la sexta posición , es decir 70, por ser el único que cumple con la definición . En efecto , por debajo de 70 encontramos 5 datos , lo que representa menos del 50% , y por encima de 70 encontramos también 5 datos , que es menos del 50 % . Al no excedernos del 50 % por ninguno de los dos lados , se cumple con la definición . Cualquier otro valor diferente de 70 , no cumpliría con la definición ; y así por ejemplo , un valor como 71 tendría por debajo de él a 6 datos, y un valor como 68 tendría por encima de él también a 6 datos , que representan más del 50 % . En este caso , la mediana es única , y su valor es 70 . Caso 2 : “n” es par . Antes de comenzar el análisis de este caso , es importante aclarar que el valor de una medida de tendencia central no tiene necesariamente que pertenecer al conjunto de datos , y así por ejemplo , cuando se calcula el valor de una media , el resultado puede no ser del conjunto. La única limitación que tiene una medida de tendencia central , es que debe estar entre los dos valores extremos , y así por ejemplo , cuando calculamos la media aritmética de los datos : 3 , 7 y 17 , el resultado es 9 , que un valor no perteneciente al conjunto de datos , pero si comprendido en el intervalo [3 ; 17] . Esta aclaratoria es importante hacerla , pues como se verá a continuación , en este caso , es posible , que la mediana no pertenezca al conjunto de datos. Cuando el número de datos es par , la mediana se determina mediante la

semisuma de los valores que ocupen las posiciones n

2 y

n

2+1 una vez ordenados

de menor a mayor ; es decir :

Page 19: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

19

Med

x xn n

2 21

2

Ejemplo 5.17 : Los siguientes datos representan el nivel de colesterol en sangre de catorce personas : 168 , 206, 125 , 270 , 150 , 191 , 312 , 153 , 142 , 237 , 254, 138 , 180 y 173 . Hallar la mediana . Solución : Se ordenan de menor a mayor , obteniendo : 125 , 138 , 142 , 150 , 153 , 168 , 173 , 180 , 191 , 206 , 237 , 254 , 270 y 312 . Como existen catorce datos , los dos centrales , son el séptimo y el octavo , que corresponden a los valores 173 y 180 respectivamente .

La mediana es entonces : Med173 180

2 = 176,50 .

La justificación del procedimiento anterior es la siguiente : Al aplicar la definición de mediana , se encuentra que el valor 173 la cumple , pues supera a 6 datos de 14 , y es superado por 7 datos de 14, no excediéndose así del 50 % por ninguno de los dos lados . Sin embargo , el valor 180 también cumple con la definición , pues supera a 7 de 14 y es superado por 6 de 14 . Además cualquier valor entre 173 y 180 , aunque no pertenezca al conjunto de datos , puede ser medida de tendencia central , y también cumple la definición ; ya que por ejemplo , un valor como 175 , supera a 7 datos de 14 , y es superado por 7 de 14 , no excediéndose del 50 % por ninguno de los dos lados . Lo anterior significa entonces , que en el caso “n” par , a menos que exista empate entre los dos valores centrales , existen infinitas medianas que son todos los valores comprendidos en el intervalo [x

n

2

,xn

21

] , y de allí entonces que se tome

como mediana al valor central de este intervalo:

x xn n

2 21

2

.

Cálculo de la mediana para datos agrupados : Cuando los datos están agrupados en una tabla de frecuencias , la determinación de la mediana es completamente diferente , y puede ser hecha por procedimientos gráficos o por procedimientos analíticos .

Page 20: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

20

Gráficamente , la mediana puede ser encontrada , entrando en la Ojiva de frecuencias relativas porcentuales , con el 50 % , y el valor correspondiente sobre el eje horizontal será la mediana , pues supera al 50 % de los datos , y es superado por el otro 50% , tal como se muestra en la figura : Este procedimiento gráfico puede resultar algo incómodo , pues obliga a construir la ojiva a escala . Para determinar exactamente el valor de la mediana , puede aplicarse la siguiente fórmula , la cual es obtenida por interpolación lineal sobre la Ojiva :

Mediana = L

nF

fci

i

i

1

12

Donde : Li-1 = Límite inferior del intervalo donde cae la mediana . Fi-1 = Frecuencia absoluta acumulada hasta el intervalo anterior . fi = Frecuencia absoluta del intervalo donde cae la mediana . c = Ancho de clase.

n = fii i

i k

= Número de datos .

Demostración de la fórmula : Supongamos que se tiene una tabla de frecuencias con “k” intervalos de igual amplitud , y que el 50 % de frecuencia relativa porcentual acumulada se alcanza en el intervalo “i” , cuyos límites de clase son [Li-1 ; Li) , tal como se muestra a continuación :

Page 21: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

21

Al hacer la interpolación lineal , se tiene por semejanza de triángulos que :

ADE ABC AD

AB

DE

BC AD

DE

BCAB

Pero : DE = 50% - Hi-1

BC = Hi - Hi-1 = hi ; pues la diferencia entre las frecuencias porcentuales acumuladas entre dos límites de clase consecutivos , es la frecuencia

relativa porcentual del intervalo.

AB = c = Ancho de clase . Sustituyendo se tiene entonces :

Mediana = Li-1 + AD = Li-1 + 50% 1H

hc

i

i

Al multiplicar el numerador y el denominador de la fracción por “n” , y teniendo en cuenta que una frecuencia relativa multiplicada por el número de datos , da como resultado la frecuencia absoluta , se obtiene :

Mediana = Li-1 + ( )50% 1H n

hnc

i

i

= L

nF

fci

i

i

1

12 ; que corresponde justamente a

la fórmula que se pretendía demostrar . En ocasiones , puede resultar más conveniente utilizar la expresión en función de las frecuencias relativas :

Mediana = Li-1 + 50% 1H

hc

i

i

Ejemplo 5.18 : Calcular la mediana de los datos del Ejercicio 5.6 . Solución : Para calcular la mediana , es necesario completar la tabla , con las frecuencias absolutas y relativas porcentuales acumuladas , tal como se muestra a continuación : Límites de clase Límites Reales fi Fi hi % Hi %

470 ; 479 469.50 ; 479.50 8 8 4,44 4,44

Page 22: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

22

480 ; 489 479.50 ; 489.50 19 27 10,56 15,00 490 ; 499 489,50 ; 499.50 47 74 26,11 41,11 500 ; 509 499.50 ; 509.50 55 129 30,56 71,67 510 ; 519 509.50 ; 519.50 31 160 17,22 88,89 520 ; 529 519.50 ; 529.50 14 174 7,78 96,67 530 ; 539 529.50 ; 539.50 6 180 3,33 100,00

180 100,00

Para identificar el intervalo donde cae la mediana , es preciso analizar la tabla de frecuencias relativas porcentuales acumuladas , y el intervalo en donde se alcance una frecuencia relativa porcentual acumulada del 50% , ese es el que contiene a la mediana. Nótese que el cuarto intervalo , cuyos límites reales son 499,50 y 509,50 es donde se ubica la mediana , pues por debajo del límite real inferior se encuentran el 41,11 % de los datos , y por debajo del límite real superior el 71,67 % . Para calcular exactamente el valor de la mediana , es necesario repetir el proceso de interpolación descrito en la demostración general , y aplicar cualquiera de las dos fórmulas obtenidas . Si se aplica la fórmula basada en las frecuencias relativas porcentuales acumuladas :

Mediana = Li-1 + 50% 1H

hc

i

i

= 499,50 + 50% 4111%

30 56%

,

, 10 = 502,41

Si se aplica la fórmula basada en las frecuencias absolutas acumuladas:

Mediana = L

nF

fci

i

i

1

12 = 499,50 +

180

274

55 10 = 502,41

Aunque estas dos expresiones son matemáticamente equivalentes , la segunda , basada en las frecuencias absolutas acumuladas , es desde el punto vista práctico , más cómoda de aplicar , pues no necesita calcular las frecuencias relativas . Cuando se aplica esta segunda fórmula , y no se calculan las frecuencias relativas porcentuales acumuladas , para identificar el intervalo donde cae la mediana , es necesario ubicar el intervalo donde se alcanza la mitad acumulada del número total de datos . En el ejemplo anterior , la mitad acumulada , es decir 90 , se alcanza en el 4° intervalo , pues hasta el 3° hay una frecuencia acumulada de 74 , y hasta el límite superior del 4° intervalo , la frecuencia acumulada es de 129 . Propiedades de la mediana 1°) La mediana es una medida de tendencia central que no se ve afectada por los valores extremos de los datos , pues solamente toma en cuenta al valor

Page 23: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

23

central ( n impar ) , o a los dos valores centrales ( n par ) , sin considerar para nada a los demás valores. Esta propiedad hace que la mediana sea un promedio muy recomendable en aquellas muestras en donde existen valores completamente atípicos , fuera de escala , que pueden desvirtuar el uso de la media aritmética como promedio. Así por ejemplo , si tenemos un grupo de cinco personas , cuyo nivel de ingresos mensuales es de $ 700 , $ 1.000 , $ 1.200 , $ 1.600 y $ 15.500 , tendríamos que

X = $ 4.000 mensuales , lo que sería un promedio poco representativo de los ingresos de estas cinco personas , pues cuatro de ellas , que representan un 80% de los datos , se encuentran por debajo de dicho valor . La mediana en cambio , cuyo valor en este caso es 1.200 , es un promedio mucho más representativo . 2°) En el caso de datos agrupado , la mediana representa geométricamente , la abscisa correspondiente a la recta vertical , que divide al histograma en dos partes

de igual área . 3°) La suma de las desviaciones absolutas de los datos es mínima , cuando estas desviaciones se calculan respecto de la mediana . Según esta propiedad , cuya demostración matemática se encuentra en el anexo ,

si se tiene un conjunto de datos { x1, x2 , x3 , ......, xn }, la suma : f(t) = x ti

i

i n

1

, es

mínima , cuando en valor de la variable “t “ coincide con la mediana . Ejemplo 5.19 : Sobre una carretera recta viven cinco personas . La primera persona vive en el kilómetro 5 de dicha carretera , la segunda en el kilometro 12 , la tercera en el kilómetro 15 , la cuarta en el kilometro 30 y la quinta en el kilometro 43 . ¿ Donde deben reunirse estas cinco personas , para que la suma de las distancias recorridas por ellas, sea lo menor posible ? . Solución : Si estas personas deciden reunirse en el kilometro “t” , la suma de las distancias recorridas por ellas va a ser una función de “t” , definida por :

f(t) = 5 -t + 12 - t + 15 -t + 30 -t + 43 -t Según la propiedad anterior , esta suma es mínima cuando “t” es la mediana entre los cinco valores , es decir cuando t = 15 . En conclusión , para minimizar la suma de las distancias recorridas por estas cinco personas , deben reunirse en el kilometro 15 , casa de la tercera persona .

Page 24: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

24

Cuando se reúnen en el kilometro 15 , la suma de las distancias recorridas por las cinco personas es :

f(15) = 5 -15 + 12 - 15 + 15 -15 + 30 -15 + 43 -15 = 56 kilómetros Si se reunieran en cualquier otro punto diferente del kilómetro 15 , como pudiera

ser , por ejemplo , la media aritmética de los kilómetros : X = 21 , la suma de las distancias recorridas sería mayor.

f(21) = 5 -21 + 12 - 21 + 15 -21 + 30 -21 + 43 -21 = 62 kilómetros

V.5. La Moda : La moda , o también llamado “modo” , es otra medida de

tendencia central , que para el caso de un conjunto de datos no agrupados { x1, x2 , x3 ,

......, xn } , se define como aquel valor que más se repite . La definición anterior significa , que si se tiene un conjunto de datos sin agrupar , para determinar su moda , es necesario contar cuantas veces se repite cada valor, y aquel que presente la mayor frecuencia , es por definición la moda . Ejemplo 5.20 : En un examen de Estadística , presentaron 60 alumnos , y sus calificaciones en una escala de 20 puntos fueron : 12 11 08 14 06 13 07 12 10 14 09 05 11 16 17 10 06 12 02 13 15 04 14 19 07 11 16 05 12 10 03 15 20 07 10 12 10 11 07 12 11 10 12 09 02 13 12 06 11 11 07 12 15 19 01 11 12 13 04 13 Hallar la moda . Solución : Hay que contar cuantas veces se repite cada calificación , y elaborar la correspondiente tabla de frecuencias sin agrupar . Calificación 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 19 20 Frecuencia 1 2 1 2 2 3 5 1 2 6 8 10 5 3 3 2 1 2 1 En la tabla puede apreciarse que la mayor frecuencia que es 10 , corresponde a la calificación de 12 puntos ; y por tanto la moda , Md = 12 . El uso de la moda como promedio , puede presentar el inconveniente de que ésta puede no ser única en caso de que se presenten empates en la mayor frecuencia. En estos casos , se dice que la distribución de frecuencias es “multimodal” , y puede resultar “bimodal” , “trimodal” , etc., según sea el número de valores , cuyas frecuencias resulten empatadas con la máxima frecuencia . En casos como el del Ejercicio 5.20 , en donde la moda es única , se dice que la distribución es “unimodal” . Cuando los datos están agrupados , el cálculo de la moda cambia radicalmente , y sólo puede ser obtenida de forma aproximada . Antes de analizar como se determina la moda en el caso de datos agrupados , es necesario revisar algunos conceptos previos , como son el de máximo relativo , y el de curva de frecuencias . Según el Cálculo Diferencial , cuando de tiene una función continua y = f(x) ,

definida en un intervalo a x b ; se dice que la función alcanza un máximo relativo en un punto x = x0 , cuando el valor de la función en xo , es siempre mayor que los valores de la función, para los puntos pertenecientes a un entorno de x0 . En la gráfica siguientes existen dos máximos relativos , que se alcanzan en las abscisas x = x1 y x = x2 .

Page 25: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

25

En el Capítulo IV , se explicó que los llamados “Polígonos de frecuencias” , a medida que se va reduciendo la amplitud del intervalo , dan lugar a una curva . Esta curva representa la posición límite del polígono de frecuencias , y recibe el nombre de “curva de frecuencias” , tal como se muestra en la figura :

Las formas más comunes de las curvas de frecuencia son :

En el caso de “curvas de frecuencias” , la moda representa la abscisa correspondiente a un punto de máximo relativo , y pueden existir varias , tal como se muestra en la siguiente figura:

Page 26: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

26

Se suele llamar “antimoda” , a las abscisas correspondientes a los mínimos

relativos . Para determinar las posibles modas que puede tener una curva de frecuencias , es necesario conocer su ecuación , para derivarla e igualar su primera derivada a cero . La “Estadística Matemática” , proporciona diferentes modelos teóricos para curvas de frecuencia , que reciben el nombre de “Curvas continuas de probabilidad “, en donde es posible determinar su moda por el procedimiento de derivación descrito anteriormente, y el cual escapa de los fines de la “Estadística Descriptiva” . Cuando los datos están agrupados en una tabla de frecuencias, lo que se tiene es el polígono , pero no la ecuación exacta de la curva de frecuencias , y por ello , los métodos para determinar la moda son aproximaciones que tienen como objetivo , la ubicación aproximada , o un pronóstico , de los puntos donde dicha curva alcanza sus máximos relativos. En el caso de tablas de frecuencias de igual amplitud , se define como “clase modal” , a aquel intervalo que tenga la máxima frecuencia . En el caso de tablas de frecuencias con diferente amplitud , la clase modal es aquella cuyo rectángulo en el histograma tenga la máxima altura , que corresponde a la clase con la mayor densidad de frecuencias . Evidentemente , la moda estará dentro de la clase modal, pero dado que pueden existir varias modas , además de la clase modal es necesario verificar en el histograma , si existen otros intervalos que tengan a su izquierda y a su derecha, intervalos de menor altura . Estos intervalos , si existen , se denominan “intervalos modales”, y en ellos también existen otras modas. En el caso de existir varias modas, algunos autores , hacen distinción entre “moda mayor , principal o valor dominante” que se refiere al punto donde la curva de frecuencias alcanza su máximo absoluto , y “modas menores o secundarias” , para señalar los puntos donde la curva de frecuencias alcanza sus otros máximo relativos . Generalmente cuando una distribución de frecuencias presenta varias modas , es porque los datos no han sido bien clasificados , y se están considerando en una misma tabla , datos provenientes de diferentes poblaciones . Evidentemente, la moda debe ser un punto dentro de la clase modal , pero el problema que se presenta es ¿ como ubicarlo ? .

Page 27: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

27

Algunos textos elementales de “Estadística Descriptiva” , resuelven el problema tomando como moda al punto medio de la clase modal , es decir a su marca de clase . Esta solución no es sin embargo la más exacta , pues al trazar la curva de frecuencias , la moda debe encontrarse más cerca del intervalo adyacente que tenga mayor altura.

En la gráfica puede apreciarse que si el intervalo a la derecha del intervalo modal tiene mayor altura que el de la izquierda , entonces la moda debe estar mas cerca del intervalo derecho que del izquierdo , y por lo tanto tomar como moda al punto medio del intervalo modal es una solución muy aproximada al problema . Para ubicar a la moda de una manera más precisa, existen dos métodos , ambos aproximados, y que se fundamentan en una interpolación. Método 1 : Dividir el intervalo modal en dos segmentos , que guarden relación directa con las diferencias entre la frecuencia del intervalo modal y las frecuencias de sus intervalos adyacentes . Según este método, la moda se determina por la expresión siguiente :

Moda = Md = Li

1

1 2

c

La deducción de esta fórmula aparece en el Anexo , y se demuestra que la moda corresponde al punto donde un arco de parábola que aproxima a la curva de frecuencias , alcanza su máximo .

En el caso de intervalos de diferente amplitud, 1 y 2 no representan diferencias de frecuencias , sino diferencias de alturas ; pero en este caso, ya no cabe la

Page 28: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

28

interpretación de la moda , como punto donde arco de parábola alcanza su máximo. Ejemplo 5.21 : Encontrar la moda de la siguiente distribución de frecuencias: Intervalo Frecuencia 10 - 19 4 20 - 29 12 30 - 39 20 40 - 49 10 50 - 59 8 Solución: Al construir histograma correspondiente a esta tabla de frecuencias , no hay que olvidar lo explicado en el Capítulo IV , de tomar en consideración los límites reales , pues de lo contrario quedarían espacios vacíos que interrumpen la continuidad de la curva de frecuencias .

En este caso , existe sólo un intervalo modal , que es el tercero , pues es el único intervalo interior que tiene a su izquierda y a su derecha intervalos de menor frecuencia . Este único intervalo modal es a su vez , la clase modal , por tener la máxima frecuencia. Al existir un único intervalo modal , la distribución de frecuencias es unimodal . c = Ancho de clase = Diferencia entre límite real superior e inferior = 10 Li = Límite real inferior del intervalo modal = 29.50

Page 29: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

29

1 = Diferencia de frecuencias a la izquierda del intervalo modal = 20 -12 = 8

2 = Diferencia de frecuencias a la derecha del intervalo modal = 20 -10 = 10

Md = 29 508

8 1010. = 33.94

Ejemplo 5.22 : En un parque de atracciones se midió la estatura de las personas concurrentes , sin discriminar entre niños y adultos , encontrándose la siguiente tabla de frecuencias : Estatura ( centímetros) Frecuencia 40 - 59 12 60 - 79 75 80 - 99 60 100 - 119 36 120 - 139 52 140 - 159 86 160 - 179 115 180 - 199 8 Determinar las modas . Solución : El histograma correspondiente es :

La clase modal es la séptima pues es la que presenta mayor frecuencia , pero existen dos intervalos modales , el segundo y el séptimo , pues la frecuencia de cada uno de ellos es mayor que la de sus adyacentes , y por lo tanto la distribución de frecuencias es bimodal . Para calcular la primera moda , que corresponde al punto donde se alcanza el máximo relativo ubicado en el segundo intervalo , se tiene :

c = 20 ; 1 = 75 -12 = 63 ; 2 = 75 -60 = 15 ; Li = 59.50

Md1 59 5063

63 1520. = 75.65

Page 30: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

30

Para calcular la segunda moda , que corresponde al punto donde se alcanza el máximo relativo ubicado en el séptimo intervalo , se tiene :

c = 20 ; 1 = 115 -86 = 29 ; 2 = 115 -8 = 107 ; Li = 159.50

Md2 159 5029

29 10720. = 163.76

En un caso como este , la presencia de dos modas indica que los datos no fueron debidamente clasificados , pues si se hubiesen tomado estaturas de niños por un lado , y de adultos por el otro , muy seguramente esta situación no se hubiese presentado, y cada grupo sería unimodal . Método 2 : Este otro método para determinar aproximadamente a la moda , consiste en dividir al intervalo modal en dos segmentos que estén en razón inversa a las alturas de las clases adyacentes .

El intervalo modal , cuya amplitud es “c” , queda dividido en dos segmentos de amplitudes “x” y “c - x” . Si la frecuencia del intervalo a la izquierda es menor que la del intervalo a la derecha , “x” deberá ser mayor que “c-x” , para que la moda quede más cerca del de la derecha , y viceversa . En consecuencia, “x” y “c-x” , deben guardar relación inversa con las alturas de las

clases adyacentes que son “fi-1” y “fi+1” x

c x

f

fi

i

1

1

Al despejar “x” se obtiene : x = f

f fc

i

i i

1

1 1

y por lo tanto la fórmula de cálculo para la moda , por este segundo método viene

dada por : Md = Li + x Md = Li + f

f fc

i

i i

1

1 1

En donde : Li = Límite inferior del intervalo modal .

Page 31: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

31

fi-1 = frecuencia del intervalo a la izquierda del intervalo modal fi+1 = frecuencia del intervalo a la derecha del intervalo modal c = Amplitud del intervalo modal . En el caso de que la tabla de frecuencias no tenga intervalos de igual amplitud ; las alturas de los rectángulos que conforman el histograma , ya no son las frecuencias , sino la densidad de frecuencias, y por lo tanto la clase modal ya no necesariamente es la de mayor frecuencia , sino la de mayor densidad de frecuencias , y los intervalos modales son aquellos intervalos que tengan como intervalos adyacentes , a intervalos de menor densidad de frecuencias que él . En el caso de intervalos de diferente amplitud , la expresión que permitirá calcular la moda será entonces :

Md = Li +

f

c

f

c

f

c

c

i

i

i

i

i

i

i

1

1

1

1

1

1

En donde : Li = Límite inferior del intervalo modal . fi-1 = frecuencia del intervalo a la izquierda del intervalo modal fi+1 = frecuencia del intervalo a la derecha del intervalo modal ci = Amplitud del intervalo modal . ci-1 = Amplitud del intervalo a la izquierda del intervalo modal ci+1 = Amplitud del intervalo a la derecha del intervalo modal Una crítica que se le suele hacer a este método es que no toma en cuenta a la altura de la clase modal , y quizás por esta razón , el otro método basado en las diferencias de altura, está más difundido . Ejemplo 5.23: Recalcular la moda del Ejercicio 5.21 por el Método 2 . Solución : En este ejemplo , la distribución es unimodal , y se tiene : Li = 29.50 ; fi-1= 12 ; fi+1= 10 ; c= 10

Md = 29.50 + 12

12 1010= 34.95

Los resultados obtenidos por ambos métodos no tienen porque coincidir , pues son aproximaciones obtenidas por diferentes criterios , al punto donde se alcanza el máximo relativo , en la curva de frecuencias . Ejemplo 5.24: Recalcular las modas del Ejercicio 5.22 , por el Método 2 . Solución : En este caso , la distribución es bimodal, y para la primera moda se tiene: Li = 59.50 ; fi-1= 12 ; fi+1= 60 ; c= 20

Md1 = 59.50 + 60

12 6020 = 76.17

mientras que para la segunda : Li = 159.50 ; fi-1= 86 ; fi+1= 8 ; c= 20

Page 32: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

32

Md2 = 159.50 + 8

86 820 = 161.20

Ejemplo 5.25: La siguiente tabla de frecuencias muestra la renta mensual en $ , para un conjunto de inmuebles :

Renta 100-300 300-500 500-1.000 1.000-1.500 1.500-2.000 2.000-3.000

Frecuencia 200 1.500 4.000 600 300 100

Calcular la moda de la distribución . Solución : Como se trata de una tabla de frecuencias con intervalos de diferente amplitud , la altura del rectángulo que representa a cada clase no es igual a su

frecuencia , sino a su densidad de frecuencias ,dada por : df

ci

i

i

Las correspondientes densidades de frecuencia son las siguientes : Renta 100-300 300-500 500-1.000 1.000-1.500 1.500-2.000 2.000-3.000

Densidad de frecuencia

1.00 7.50 8.00 1.20 0.6 0.1

El histograma correspondiente es :

Existe un solo intervalo modal , que es el tercero por tener la máxima altura , que corresponde a la mayor densidad de frecuencias . El cálculo de la moda debe tomar en consideración que las alturas de los rectángulos adyacentes no son sus frecuencias , sino sus densidades de frecuencia , y por lo tanto :

Md = 500 + 120

7 50 120500

.

. . = 568.97

La moda resulta más próxima al extremo izquierdo que al derecho , pues la altura del rectángulo izquierdo es mucho mayor que la del derecho ; que es justamente

Page 33: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

33

el criterio utilizado para deducir la fórmula para la moda , por cualquiera de los métodos. Relación empírica entre Moda , Mediana y Media : Para curvas de frecuencias unimodales , que tengan poca asimetría , se ha encontrado la siguiente relación empírica entre estas tres medidas de tendencia central :

Media - Moda 3 ( Media - Mediana ) Es de hacer notar , que para este tipo de distribuciones , la mediana es siempre un valor comprendido entre la media y la moda , lo que convierte a la mediana en un excelente promedio en esos casos .

Ejemplo 5.26 : Comprobar la relación empírica , para la distribución unimodal del Ejercicio 5.21 . Solución : En este ejercicio , ya se determino la moda que resulto ser 33.94 . Para determinar la media , tenemos :

X14 5 4 24 5 12 34 5 20 44 5 10 54 5 8

4 12 20 10 8

. . . . .= 35.61

y para determinar la mediana , es necesario acumular las frecuencias : Intervalo fi Fi 10 - 19 4 4 Al existir 54 datos , la mediana cae en el tercer intervalo 20 - 29 12 16 que es donde se alcanza la mitad acumulada 27 . 30 - 39 20 36 40 - 49 10 46 50 - 59 8 54

La mediana es entonces : Mediana =29.5 +

54

216

2010 = 35.00

Media - Mediana = 35.61 - 35.00 = 0.61

Page 34: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

34

Media - Moda = 35.61 - 33.94 = 1.67 3 (0.61) = 1.83

V. 6 El centro del recorrido: Una última medida de tendencia central , que

puede resultar útil en algunas aplicaciones prácticas es el llamado “Centro del recorrido” , y que se define como el punto medio entre el menor y el mayor valor de los datos . Para un conjunto de “n” datos sin agrupar { x1, x2 , x3 ,

......, xn } , para calcularlo hace falta primero determinar el menor valor x( )1 ,y el mayor valor x n( ) .

Centro del recorrido = Mc = x x n( ) ( )1

2

En el caso de datos agrupados en una tabla de frecuencias: Mc = L Lk0

2

Donde : L0 = Límite real inferior de la primera clase . Lk = Límite real superior de la última clase . Para distribuciones con curva de frecuencia acampanada , el centro del recorrido coincide con la media , con la mediana y con la moda , y como su cálculo es mucho más sencillo que el de cualquiera de ellos , su uso constituye una manera fácil y rápida de obtener una buena aproximación de cualquiera de estas medidas. En el caso de distribuciones que presenten en alguno sus extremos valores acentuadamente fuera de escala , el centro del recorrido resulta significativamente menor que la mediana en caso de que el valor atípico esté del lado izquierdo , o significativamente mayor que la mediana en el caso de que esté por la derecha . Ejemplo 5.27 : Calcular el centro del recorrido para la tabla de frecuencias del Ejercicio 5.21 Solución : Esta es una tabla agrupada de frecuencias , en donde : L0 = 9.50 , y

Lk=59.50 ; por lo tanto : Mc = 9 50 59 50

2

. . = 34.50 , que coincide

aproximadamente con los valores calculados para media , la mediana y la moda , en el Ejercicio 5.26 , por tratarse de una distribución de frecuencias acampanada.

V.7. Selección de un buen promedio. Frente a la diversidad de medidas

de tendencia central existentes, una pregunta obvia, es la de como elegir el promedio que represente mejor a los datos. Lamentablemente , no existe una respuesta clara a esta pregunta , pues cada situación puede presentar características diferentes. En general , la media , la mediana y la moda son consideradas las medidas de tendencia central más importante, y existe un proverbio de establece : “Cuando tengas duda acerca de que promedio utilizar , utiliza la media aritmética “ . Para decidir cual de las medidas de tendencia central es la más conveniente para representar a los datos , es indispensable analizar la forma de la curva de frecuencias .

Page 35: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

35

Cuando la forma de la curva es acampanada es prácticamente indiferente cual de las tres utilizar , pues coinciden ; pero cuando es asimétrica debido a que existen valores completamente atípicos y fuera de escala en alguno de los extremos, puede resultar más conveniente el uso de la mediana , pues este valor no se ve afectado por estas observaciones ocasionales que pueden dar lugar a una media aritmética poco representativa de los datos. En las distribuciones fuertemente asimétricas , como por ejemplo las que tienen forma de “J” , o forma de “L” , la mediana es también el promedio más conveniente . La mediana también tiene la ventaja de que puede ser calculada aún en distribuciones de frecuencia que tengan las clases extremas abiertas , en donde no sería posible calcular la media . Si lo que se quiere describir es la suma total de los datos , debe necesariamente utilizarse la media aritmética , pues si se reemplaza cada dato por ella , la suma no se altera ; y así por ejemplo , decir que la media aritmética en los ingresos mensuales de una persona es de $ 1.500 mensuales , equivale a decir que su ingreso total anual es de $ 18.000 . La moda debe utilizarse principalmente en el caso de distribuciones unimodales , cuando lo que se quiere describir es el valor que se repite la mayoría de las veces. Cuando la distribución presenta varias modas , no es conveniente su uso , pues puede dar lugar a confusión , y lo que el investigador debe preguntarse es si la recolección de la información fue correctamente clasificada , pues puede haber fundido dos poblaciones diferentes en una sola , y en consecuencia haber obtenido datos muy heterogéneos . En las distribuciones en forma de “U” , ninguno de los tres promedios representa adecuadamente a los datos , pues la media y la mediana se ubican en el centro, donde caen la minoría , y la moda o no existe , o es múltiple , lo que dificulta su interpretación. . Finalmente , cuando se quiere establecer algún tipo de discriminación entre los datos , por considerar que algunos de ellos revisten mayor importancia que otros , se hace necesario el uso de algún tipo de promedio ponderado .

EJERCICIOS RESUELTOS Ejemplo 5.28 : El ingreso per cápita de un país es de $ 2.600 al año .

El sector obrero representa el 59% de la población ,y percibe 1

5 del ingreso total

del país . Calcule el ingreso per capita del sector obrero, y el de los demás sectores Solución : Se llama ingreso “ingreso per cápita “ , al ingreso promedio por persona

; de manera que si “X1” representa el ingreso per cápita del sector obrero, y “X2 ” ,

el ingreso per cápita de los demás sectores , entonces el ingreso per cápita del

país “X” será el promedio ponderado entre los ingresos per cápita de los dos

sectores ; es decir : X X X0 59 0 411 2. .

Page 36: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

36

El ingreso total del país es nX ; siendo “n” el número de habitantes , mientras que

n X1 1 representa el ingreso total del sector obrero ; siendo n1 el número total de

obreros .

Se tiene n n1 0 59. , y además n X nX1 1

1

5 0 59

1

51. X X

Como se sabe que: X =2.600 ; se concluye que el ingreso per cápita del sector

obrero es : X1

1

5 0 592600

( . ) = 881.36 .

Una vez calculado el ingreso per cápita del sector obrero , el de los demás

sectores se obtiene despejando: X2

2600 0 59 88136

0 41

. ( . )

. = 5.073,17 .

Ejemplo 5.29 : En un examen de Estadística, las calificaciones fueron: Calificación : 12 08 05 14 10 07 16 15 19 11 Frecuencia : 6 5 4 3 7 4 3 4 1 3 Encuentre la media , la mediana , la moda y el centro del recorrido. Solución : Esta tabla de frecuencias presenta 40 datos sin agrupar , y por lo tanto la frecuencia le corresponde al valor exacto del dato ; es decir , el valor 12 se repite 6 veces , el valor 08 se repite 5 veces , y así sucesivamente .

Por tanto : Xx f

f

i i

i

= 12 6 8 5 5 4 11 3

6 5 4 3

= 10.80

Para hallar la mediana , es necesario ordenar los datos de menor a mayor , y como se trata de un número par de datos (40) , la mediana será el promedio aritmético entre los dos que ocupen las dos posiciones centrales , es decir la posición 20 y la 21 . Al ordenarlos , y construir la tabla de frecuencias acumuladas , se obtiene : Calificación : 05 07 08 10 11 12 14 15 16 19 Frecuencia : 4 4 5 7 3 6 3 4 3 1 Acumulada : 4 8 13 20 23 29 32 36 39 40 En la tabla de frecuencias acumuladas , puede apreciarse que el puesto N° 20 le corresponde al valor 10 , mientras que el puesto N° 21 al valor 11 , y por lo tanto:

Med = 10 11

2 = 10.5

Nótese que sería un error decir que se tienen 10 valores , y que los dos centrales son los que ocupan la 5° y la 6° posición , correspondiente a los valores 11 y 12 , pues tal afirmación estaría ignorando las frecuencias de cada valor . Tal razonamiento estaría correcto si estos 10 valores se presentara sólo una vez cada uno. La moda corresponde al valor que más se repite , en este caso 10 , que es el

presenta la máxima frecuencia Md = 10 . Para calcular el centro del recorrido , basta ubicar la menor y la mayor calificación,

que en este caso son 05 y 19 respectivamente. Mc

5 19

2= 12 .

Page 37: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

37

Ejemplo 5.30 : Si en una empresa, el sueldo promedio de todos los empleados es de Bs. 48.520, mientras que el de los hombres es de Bs. 56.000 , y el de las mujeres de Bs. 45.000 . ¿ Cual es el porcentaje de hombres y mujeres en esa empresa.? Solución : El sueldo promedio de los empleados de la empresa es el promedio ponderado entre el sueldo promedio de os hombres y el de las mujeres .

Si: = Proporción de hombres dentro de la empresa , entonces

1- = Proporción de mujeres dentro de la empresa

y el promedio ponderado es : X X X1 21( )

En este caso : X = 48.520 = Sueldo promedio de todo el personal .

X1 = 56.000 = Sueldo promedio de los hombres .

X2 = 45.000 = Sueldo promedio de las mujeres .

Al plantear la ecuación se tiene : 48.520 = 56.000 + ( 1- ) 45.000 , y al despejar

se obtiene : = 0.32 , lo que significa que en esta empresa el 32 % de los empleados son hombres , y el 68 % mujeres . Ejemplo 5.30 : La siguiente tabla muestra el contenido de refresco en unas latas: Contenido (cc) Frecuencia 280-290 24 290-300 37 300-310 44 310-320 31 320-330 14 Calcule la media por el método abreviado ,la moda , la mediana ,la media armónica, la media geométrica , y el centro del recorrido . Solución : Para calcular la media por el método abreviado , a una de las marcas de clase , preferiblemente la de la clase modal ,en este caso 305 le asignamos el valor cero ,a las anteriores -1 , -2 , etc. , y a las posteriores +1 , +2 , etc. y se le calcula a estos datos abreviados ( El método es aplicable solo para el caso de intervalos con

igual amplitud ) . U( ) ( ). ( ) ( ) ( )2 24 1 37 0 44 1 31 2 14

24 37 44 31 14= - 0.1733

La media de los datos originales es : X L c Uj

* = 305 + 10 (-0.1733) = 303.27

En cuanto a las moda , la distribución es unimodal , y la moda puede ser obtenida de manera aproximada , por cualquiera de los dos métodos . Si se aplica el primer método , de las diferencias de alturas con las clases adyacentes , se obtiene :

Md = Li

1

1 2

c= 300 + 44 37

44 37 44 3110

( ) ( ) = 303.50

Si se aplica el segundo método , de las alturas de las clases adyacentes :

Md = Li + f

f fc

i

i i

1

1 1

=300 + 31

37 3110 = 304.56

Page 38: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

38

Para hallar la mediana , es necesario previamente acumular las frecuencias , y se obtiene : Intervalo 280-290 290-300 300-310 310-320 320-330 Frecuencia acumulada 24 61 105 136 150 El 50% de frecuencia acumulada , que es 75 , se alcanza en el tercer intervalo .

Med = L

nF

fci

i

i

1

12 = 300 +

150

261

4410 = 303.18

En cuanto a la media armónica y a la geométrica , se tiene :

H

f

f

L

f

L

f

L

i

i

i k

k

k

1

1

1

2

2* * *

=

150

24

285

37

295

44

305

31

315

14

325

= 302.79

G L L Lf f

kfn k( ) ( ) ( )* * *

1 21 2 = 285 295 305 315 32524 37 44 31 14150 = 303.03

y el centro del recorrido : Mc = 280 330

2 = 305.00

Ejemplo 5.31 Complete la siguiente tabla puntual de frecuencias sabiendo que su

media es 5

3 Xi 3 0 2 1 4

fi 5 8 ? 7 4 Encuentre la mediana . Solución : Designando por “f” a la frecuencia del valor “2” , se tiene :

Xf

f

5

3

3 5 0 8 2 1 7 4 4

5 8 7 4

Al despejar “f” se obtiene: 5 ( 24 + f) = 3 ( 38 + 2f) 120 + 5f = 114 + 6f f = 6 Para encontrar la mediana , hay que ordenarlos de menor a mayor , y acumulas sus frecuencias : Xi 0 1 2 3 4 Fi 8 15 21 26 30 Al tener 30 datos , la mediana es la semisuma entre los valores que ocupen las posiciones 15 y 16 . Según la tabla acumulada de frecuencias , el valor que ocupa la posición 15 es 1 , y

el que ocupa la posición 16 es 2 Med = 1 2

2 = 1.5

Ejemplo 5.32 : La siguiente tabla de frecuencias , muestra la demanda mensual en toneladas , de un cierto producto agrícola . Demanda Frecuencia 500 - 1.000 10 1.000 - 2.000 40

Page 39: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

39

2.000 - 4.000 100 4.000 - 8.000 100 8.000 - 12.000 120 12.000 - 20.000 80 Encuentre la media , la mediana y la moda de la distribución . Solución : Se trata de una tabla de frecuencias con intervalos de diferente amplitud, lo que afecta solamente a la construcción del histograma , y al cálculo de la moda. El cálculo de la media no se ve afectado , pues se mantiene el supuesto de que dentro del intervalo los datos se distribuyen de manera uniforme , y que por lo tanto, la marca de clase los representa .

X750 10 1500 40 3 000 100 6 000 100 10 000 120 16 000 80

10 40 100 100 120 80

. . . . .=7.661,11

En cuanto a la mediana , el procedimiento para calcularla es idéntico al caso de intervalos de igual amplitud , con la única diferencia de que debido a que la interpolación se efectúa en intervalo que contiene a la mediana , entonces , la amplitud “c” , que aparece en la fórmula de la mediana para en caso de igual amplitud , se convierte en “ci” amplitud del intervalo que contiene a la mediana . La fórmula correspondiente para intervalos de diferente amplitud es :

Med L

nF

fci

i

i

i1

12

Para hallar la moda , es necesario determinar la densidad de frecuencias para cada intervalo , que representa la altura del rectángulo correspondiente. La siguiente tabla da el resultado de dichos cálculos : Demanda fi Fi di 500 - 1.000 10 10 0.020 1.000 - 2.000 40 50 0.040 2.000 - 4.000 100 150 0.050 Intervalo que contiene a la moda 4.000 - 8.000 100 250 0.025 Intervalo que contiene a la mediana

8.000 - 12.000 120 370 0.030 12.000 - 20.000 80 450 0.010

Med = 4.000 +

450

2150

1004000 = 7.000,00

Md = Li +

f

c

f

c

f

c

c

i

i

i

i

i

i

i

1

1

1

1

1

1

= 2.000 + 0 025

0 040 0 0252000

.

. .= 2.769,23

Page 40: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

40

Preguntas de Revisión 1°) Analice como se transforman la media geométrica y la media armónica , si cada uno de los datos de un conjunto { x1, x2 , x3 , ......, xn } es multiplicado por una constante , o transformado linealmente por : yi = a + bxi . 2°) Si se tienen dos conjuntos de datos disjuntos , ¿ es posible que la media aritmética de la unión de estos dos conjuntos , sea igual a la media aritmética de sus medias aritméticas ? . 3°) Si se tiene un conjunto de datos representados en un gráfico de “tallo y hoja “ , ¿ es posible calcular de manera exacta el valor de su media , mediana , moda y centro del recorrido ? . En caso de ser posible , explique el procedimiento . 4°) ¿ Cual es el fundamento teórico del método abreviado de cálculo para la media de un conjunto de datos agrupados ? .. ¿ Por qué se acostumbra tomar como referencia la marca de clase del intervalo de mayor frecuencia ? . ¿ Por qué el método no es aplicable cuando la amplitud de los intervalos no es la misma ? . 5°) Si durante un mismo lapso de tiempo , varios artículos sufren aumentos de precio en diferentes porcentajes . ¿ Qué tipo de promedio entre estos porcentajes sugeriría Ud., para expresar la inflación promedio durante ese lapso ? . 6°) Si en una distribución de frecuencias con intervalos de igual amplitud , existen dos intervalos interiores consecutivos con la máxima frecuencia . ¿ Existe la moda?. ¿ Es bimodal ? . Justifique su respuesta . 7°) En una distribución de frecuencias con intervalos de diferente amplitud , ¿ cual es la clase modal ? . 8°) Explique un procedimiento para obtener la media , la mediana y la moda , a partir de la ojiva de frecuencias relativas porcentuales .

9°) La función: (x) = ex se conoce como “función exponencial” . Proponga una

fórmula para calcular la “media exponencial ponderada ” de un conjunto de datos . 10°) En el caso de un número par de datos sin agrupar , ¿ por qué existen infinitas medianas ? . ¿ Cuando es única ? . 11°) En el caso de que una distribución de frecuencias con valores puntuales. ¿Cual de las medidas de tendencia central se puede garantizar que es igual a uno de los valores de la variable ? . 12°) Si en un conjunto de datos positivos sin agrupar , se encuentra que la media aritmética simple es igual a su media geométrica simple . ¿ Qué se puede afirmar del conjunto de datos ? .

Page 41: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

41

13°) Si en un conjunto de datos sin agrupar , todos los valores son diferentes entre sí , ¿ existe la moda ? . 14°) ¿ Cual es la diferencia entre clase modal e intervalo modal ? . 15°) ¿ Se puede garantizar que al agrupar un conjunto de datos , la moda de los datos sin agrupar caerá en la clase modal de los datos agrupados ? . 16°) Si un mismo producto sufre aumentos de precio en diferentes porcentajes , durante lapsos de tiempo de diferente duración . ¿ Qué tipo de promedio sugeriría Ud. , para calcular el porcentaje promedio de incremento por unidad de tiempo , durante todo el período ? . 17°) Si un conjunto de datos sin agrupar presenta dos modas . ¿ Se puede afirmar al agruparlos , la tabla de frecuencias será bimodal ? . 18°) ¿ Cuando es recomendable utilizar a la mediana como promedio ? . 19°) ¿ Cuando es indiferente utilizar a la media , a la mediana , a la moda o al centro del recorrido como promedio ? . 20°) ¿Qué medidas de tendencia central coinciden , en una distribución de frecuencias rectángular o uniforme ? .

Temas complementarios para investigar

1°) En el capitulo anterior se asignó como tema de investigación a las “Curvas de concentración “ . Investigue para este tipo de curvas el concepto de “MEDIALA” . 2°) Investigue el concepto de Mediana general de orden “r” . ¿ Cual es el valor de esta mediana general , cuando r=0 , cuando r=1 y cuando r=2 ? . 3°) Investigue la metodología utilizada por el “Banco Central” , para calcular el índice de inflación durante un año . Problemas Propuestos I. Nivel Elemental 5.33 ) Para los datos : 9 , 3 , 19 , 4 , 6 , 9 , 10 , 7 , 3 , 8 , 14 , 9 , 5 , 16 , 9 , 8 . Calcule la media , la mediana , la moda y el centro del recorrido .

Solución : X = 8.6875 ; Med = 8.50 ; Md = 9 ; Mc = 11

Page 42: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

42

5.34 ) Un profesor anuncia a sus estudiantes que la calificación final del curso será un promedio ponderado entre la calificación obtenida en los exámenes parciales, y en los trabajos de investigación . La calificación de los exámenes se pondera con un 60 % , y será el promedio ponderado de tres parciales , el primero de los cuales aporta un 20 % , el segundo 35 % , y el tercero 45 % . La calificación de los trabajos se pondera con un 40 % , y será el promedio aritmético de las calificaciones obtenidas en dos investigaciones. Sobre una escala de 100 puntos , un alumno obtuvo 48 , 60 y 72 en cada uno de los tres exámenes parciales respectivamente , y en los trabajos de investigación 84 y 90 . Calcule la calificación final del curso , redondeando al entero más cercano . Solución : 73 puntos . 5.35) Un país se divide en tres zonas igualmente pobladas . En la primera hay cinco habitantes por automóvil , en la segunda ocho habitantes por automóvil , y en la tercera, veinte habitantes por automóvil . ¿ Cual es para el país entero , el número de habitantes por automóvil ? . ¿ Qué nombre recibe el promedio utilizado ? . Solución : 8 habitantes por automóvil . 5.36 ) El peso en gramos de unas cajas de cereal , es como sigue : Peso 118-126 127-135 136-144 145-153 154-162 163-171 172-180 Frecuencia 3 5 9 12 5 4 2 Calcule la media por el método abreviado , la mediana , la moda , la media armónica , la media geométrica, y el centro del recorrido de la distribución .

Solución : X = 146.98 ; Med = 146.75 ; Md = 147.20 ;H = 145.70 ; G =146.34 ; Mc = 149 5.37 ) Se tienen tres números positivos , de los cuales se sabe que su suma es 13, su mediana es 3 , y su media geométrica es 3 . Determine esos tres números . Solución : 1 , 3 y 9 . 5.38) Se tienen dos soluciones de azúcar en agua . La primera tiene una concentración de 12 gramos / litro , y la segunda de 50 gramos / litro . Si se unen 3 litros de la primera y 1 litro de la segunda . ¿ Cual es la concentración de la solución resultante ? . ¿ Qué nombre recibe este tipo de promedio ? . Solución : 21.50 gramos / litro . 5.39) Hállense dos números positivos , cuya media aritmética exceda a su media

geométrica en 2 unidades , y cuya media armónica sea 1

5 del número mayor.

Solución : 1 y 9

Page 43: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

43

5.40) Una persona tiene un capital de Bs. 1.000.000 , de los cuales Bs. 300.000 están colocados al 20% de interés anual , Bs. 500.000 al 35% de interés anual y los Bs. 200.000 restantes al 40% de interés anual . ¿ Cual es el interés anual que esta persona obtiene sobre todo su capital ? . Solución: 31,50% . 5.41) Suponga que la tasa de inflación en un país ha sido del 50% para el primer año , del 38% para el segundo año , y del 60% para el tercer año. ¿ Cual ha sido la tasa promedio anual de inflación en este país durante los últimos tres años ? . Solución: 49.06% . 5.42) Suponga que un comerciante compra un mismo producto a tres proveedores. Al primero le compra Bs. 1000 al precio de Bs. 4 por unidad, al segundo le compra Bs. 2000 al precio de Bs. 5 por unidad, y al tercero le compra Bs. 3.000 al precio de Bs. 3 por unidad. Calcule el precio promedio al que el comerciante ha comprado cada unidad de este producto, y diga el nombre de este promedio. Solución: Bs. 3.64 5.43) Para una cierta fecha, el precio de un cierto producto era de 135 unidades monetarias , y cinco años después el precio de ese mismo producto es de 970 . ¿ Cual ha sido su porcentaje promedio de incremento ínter anual ? . Solución: 48.35% 5.44) Calcule la moda, la mediana , y las medias aritmética , armónica , geométrica y cuadrática , para la siguiente distribución de frecuencias: Límites de Clase Frecuencia Solución: 1.40 - 1.50 8 Md = 1.6294 ; Med = 1.6583

1.50 - 1.60 31 X = 1.6717 ; H = 1.6619 1.60 - 1.70 36 G= 1.6667 ; M2 = 1.6767 1.70 - 1.80 24 1.80 - 1.90 14 1.90 - 2.00 7 5.45) Un profesor anuncia a sus estudiantes que durante el curso hará dos exámenes parciales, y que la calificación final del curso será el promedio ponderado de las calificaciones obtenidas en esos dos exámenes . Sobre una escala de 100 puntos, un estudiante obtiene una calificación de 36 puntos en el primer parcial , de 96 puntos en el segundo, y su calificación final fue de 75 puntos . ¿ Cuales fueron los factores de ponderación utilizados por el profesor ? . Solución : 35% para el primer parcial y 65% para el segundo . 5.46) Suponga que se tienen tres círculos cuyos radios son 3 , 6 y 9 centímetros .

Page 44: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

44

¿ Cual es el radio del círculo cuya área es el promedio aritmético de las áreas de los tres círculos dados ? . ¿ Qué nombre recibe este tipo de media ? . Solución : 6.48 5.47 ) Durante 90 minutos , un móvil mantiene una velocidad constante de 60 Km./hr , y durante los 30 minutos siguientes , una velocidad constante de 100 Km./hr. ¿ Cual ha sido la velocidad media durante todo el trayecto ? . Solución : 70 km./hr .

5.48 ) Un primer pintor pinta a razón de 10 m2 por hora , un segundo pintor a razón

de 15 m2 por hora , y un tercero a 8 m

2 por hora .

Hay que pintar tres fachadas de 600 m2 cada una.

a) Si a cada pintor le asignan una fachada , ¿ cual es el tiempo medio en pintar cada fachada ? . b) Si estos pintores trabajan alternadamente por lapsos de una hora para pintar las tres fachadas , ¿ cuantos metros cuadrados en promedio pintaran cada hora ? . Solución : a ) 58.33 horas b) 11 . 5.49) Un país se divide en tres regiones . En la primera región reside el 45 % de la población , y existe un médico por cada mil habitantes , en la segunda reside un 35% de la población y existen dos médicos por cada cinco mil habitantes , mientras que en la tercera donde reside el 20% restante de la población , existen cinco médicos por cada dos mil habitantes . ¿ Cual es el número de médicos por cada mil habitantes para el país entero ? . Solución : 1.09 II. Nivel Intermedio 5.50) La media aritmética entre dos números es a la media geométrica como 5 es

a 4, y la diferencia entre sus medias geométrica y armónica es 4

5 .

Hállense los números. Solución : 2 y 8 . 5.51) Suponga que cuatro mecanógrafas deben pasar a máquina un trabajo , y que van a trabajar simultáneamente hasta terminarlo. Si primera mecanógrafa tarda 12 minutos en escribir una página , la segunda 6, la tercera 5 , y la cuarta 4. Calcule el tiempo promedio que tardaron en escribir una página . Solución: 5.7143 minutos por página . 5.52) Dado un conjunto de "n" datos positivos : x1 , x2 , …. , xn .

Si su media armónica es H, su media geométrica G , y su media aritmética X .

a) Demuestre que para n=2 ; G es también la media geométrica entre H y X .

b) ¿Es cierta esta propiedad para n 3 ? .

Page 45: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

45

5.53) Un productor de cerveza en latas vende su producto en todo el país a 100 unidades monetarias (u.m) la lata. Para producir la cerveza, tiene tres fábricas en diferentes partes del país. La producción de la fábrica "A" es el triple de la de la fábrica "B", y la de ésta 18% inferior a la de la fábrica "C". El costo de producir una lata de cerveza es diferente en cada fábrica; de 54 u.m en la "A", de 65 u.m en "B", y de 60 u.m en "C". Calcule la ganancia media por lata. Solución: 42,49 u.m 5.54) Dadas dos muestras disjuntas de tamaños n1 y n2 ,cuyas medias geométricas y armónicas son respectivamente G1 y H1 , G2 y H2 . Encuentre una fórmula que permita calcular la media geométrica y armónica, de la unión de esas muestras. 5.55) Complete la siguiente tabla de frecuencias , si sabe que su media es 2,10 . Xi 0 1 2 3 4 5 fi 2 ? 6 4 2 1 Halle también la mediana . Solución: f= 5 . Med = 2 5.56) Un objeto de peso desconocido "X" , es pesado en una balanza con brazos desiguales. Cuando el objeto se coloca en el platillo izquierdo , se necesita un peso P1 en el platillo derecho para equilibrarlo; y cuando el objeto se coloca en el platillo derecho, se necesita en el platillo izquierdo un peso P2 para equilibrarlo . ¿Como deben promediarse las pesadas P1 y P2, para obtener el peso "X" del objeto ? . Solución : Media geométrica entre P1 y P2 . 5.57) Dada la siguiente tabla de frecuencias: Valor de la variable 4 2 1 3 5 Frecuencia 5 x 25 2x 2 a) Determine el valor de "x" , si se sabe que la media es 2,06 . b) Determine la mediana . Solución : a) x=6 , b) Med = 1.5 5.58) La siguiente tabla expresa la antigüedad , en años cumplidos, de los empleados de una organización bancaria:

Antigüedad (años) Frecuencia

0 - 1 1200

1 - 3 1400

3 - 5 1000

5 -10 700

10 -15 500

15- 25 200

Page 46: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

46

TOTAL 5000 ( Los intervalos se suponen cerrados en el extremo inferior y abiertos en el superior ) a) Construya el histograma , y la Ojiva . b) Calcule la media , la mediana y la moda . Solución : b) 4.58 , 2.8571 y 0.7059 5.59 ) El sueldo promedio de los empleados de una empresa es de 134.400 unidades monetarias . El 30% del personal de la empresa son hombres , el 70 % restante mujeres , y se sabe que el sueldo promedio de los hombres es 40 % superior al de la mujeres . Determine el sueldo promedio de los hombres , y el de las mujeres . Solución : 168.000 y 120.000 respectivamente. 5.60) Demostrar que para dos números positivos , la media cuadrática es siempre mayor que la geométrica . 5.61) Encuentre dos números cuya media aritmética sea 7.5 , y cuya media geométrica sea 6 . Solución : 3 y 12

5.62) De tres números se sabe que su media cúbica es 6573 , su mediana es 6 , y su media aritmética es 7 . Hállense estos números . Solución : 3 , 6 y 12 . 5.63) En diez años , la población de una ciudad creció de 500.000 habitantes a 1.200.000 . Suponiendo un crecimiento geométrico , estime la población al final del séptimo año . Solución : 922.821 habitantes .

5.64) Si dos números positivos, tienen media aritmética ”X” , media geométrica “G” , y media cuadrática M2.

Demuestre que “X2” es la media aritmética entre G

2 y M2

2 .

5.65) Para un conjunto de “n” datos positivos { x1, x2, x3,…, xn}., determine el valor de “A” en cada uno de los siguientes casos :

a) ( )1

01 x

Aii

i n

; b) (ln )x Aii

i n

1

0

Solución : a) H-1

b) ln G . II. Nivel Avanzado

5.66 ) Dada la ecuación: X3+ 27 X

2 - 131X - 217 = 0. Sin resolverla, calcule las

medias aritmética, geométrica y armónica de sus raíces. Solución: -9 , 6,01 y -4,97 respectivamente.

Page 47: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

47

5.67 ) En la fórmula general para el cálculo de medias de Foster y Jordan , demuestre que :

a)r

Mrlim = Mínimo valor de los datos

b) r

Mrlim = Máximo valor de los datos .

c) limr 0

Mr = Media geométrica .

5.68 ) Siguiendo una carretera , se encuentran cinco poblados P1 , P2 , P3 , P4 y P5, en ese orden . Las distancias entre ellos son , 6 Km. de P1 a P2, 3 Km. de P2 a P3, 8 Km. de P3 a P4 , y 2 Km. de P4 a P5 . La población escolar esta repartida así : el 10 % vive en P1, el 20% en P2, el 15% en P3, el 25 % en P4 y el 30% en P5. Se quiere construir en algún punto a lo largo de la carretera una escuela a la que concurrirían todos los niños de la zona . Bajo cada uno de los siguientes criterios , determine el lugar óptimo donde debe ubicarse esta escuela : a) Se elige la ubicación de manera que se minimice la distancia total recorrida por los niños . b) Se elige la ubicación de manera que se minimicen los gastos totales de combustible , que según la experiencia , son proporcionales a los cuadrados de las distancias recorridas , y se supone que cada niño es transportado en un vehículo , por sus padres. c) Se establece un servicio de transporte colectivo a lo largo de la carretera , a un precio único de 2 unidades monetarias. Se supone que el viaje va a ser usado por todos los niños , y la escuela debe situarse de manera que se minimice el gasto total . Solución : a) En P4 . b) A 3.50 Km. de P3 en dirección hacia P4. c) En P5 .

5.69) Se tienen “n” datos en progresión geométrica : a , aq , aq2 ,…. , aq

n-1 .

a) Exprese el producto Mr . M-r ( medias generales de orden “r” y de orden “-r” ) ,

en función del primer término “a” , y de la razón “q” . b) Exprese la media geométrica “M0” , en función del primer término “a” y de la razón “q” . c) ¿ Qué relación algebraica existe entre Mr , M-r y M0 ? .

Solución : a) Mr . M-r = a

2 q

n-1 b) M aq

n

0

1

2 c) M M Mr r0

5.69) 5.70) Si “a” es la media aritmética entre “b” y “c” , y “b” la media geométrica entre “a” y “c” , demuéstrese que “c” será la media armónica entre “a” y “b” .

5.71) Supóngase que ”X” es la media de un conjunto de datos sin agrupar

Page 48: Medidas de Tendencia Central Arvelo

Medidas de Tendencia Central Angel Francisco Arvelo Luján

48

{ x1, x2, x3,…, xn} , y que al agruparlos en intervalos de igual amplitud “c”, su media

cambia a X* .

La diferencia absoluta X - X*

se define como “error de agrupamiento” , pues

representa el error cometido en el cálculo de la media , como consecuencia del agrupamiento.

Demuestre que este error de agrupamiento es a lo más c

2 .

5.72 ) Considere un conjunto de datos positivos sin agrupar { x1, x2, x3,…, xn} , y sea t > 0 un número real positivo cualquiera .

Sea m n , el número de datos que son mayores o iguales que el valor “t” .

El cociente p = m

n representa la proporción de datos que son mayores o iguales

que el valor dado “t” .

Demuestre que : p X

t ( Desigualdad de Markov ) .