LECCION CUATRO Medidas Tendencia Central

38
UNIDAD 4 UNIDAD 4 MEDIDAS DE TENDENCIA CENTRAL o MEDIDAS DE TENDENCIA CENTRAL o DE CENTRALIZACIÓN DE CENTRALIZACIÓN UNIVERSIDAD RAFAEL LANDÍVAR CARRERA: LICENCIATURA EN CIENCIAS AGRÍCOLAS CON ÉNFASIS EN CULTIVOS TROPICALES CURSO: ESTADÍSTICA I PLAN: FIN DE SEMANA CATEDRÁTICO: ING. OSCAR ROLANDO SALAZAR FECHA: 15 agosto 2015 I. Introducción Son mediciones alrededor de las cuales tienden a agruparse los datos. Nos proporcionan información de los datos que estamos analizando y a la vez, nos permiten conocer las características de series de datos. En el análisis exploratorio de los datos, generalmente se reconocen los siguientes tipos de medidas: Medidas de tendencia central, son aquellas que informan sobre el centro o promedio de las observaciones, entre ellas destacan, la media aritmética, la mediana y la moda. Medidas de posición, una vez ordenados los datos informan sobre la localización de estos; generalmente se les denomina cuantiles, entre ellas tenemos a los, deciles, quintiles, cuartiles y percentiles. Medidas de dispersión, son aquellas que determinan la separación de los datos, de ellas destacan, el rango intercuartílico, la desviación típica, la varianza, el coeficiente de variación. Medidas de forma, son las que proporcionan una idea de la simetría y apuntamiento de las distribuciones; tal es el caso del 1

description

Medidas de Tendencia Central

Transcript of LECCION CUATRO Medidas Tendencia Central

Page 1: LECCION CUATRO Medidas Tendencia Central

UNIDAD 4UNIDAD 4MEDIDAS DE TENDENCIA CENTRAL oMEDIDAS DE TENDENCIA CENTRAL o

DE CENTRALIZACIÓN DE CENTRALIZACIÓN

UNIVERSIDAD RAFAEL LANDÍVARCARRERA: LICENCIATURA EN CIENCIAS AGRÍCOLAS CON ÉNFASIS EN CULTIVOS TROPICALES

CURSO: ESTADÍSTICA IPLAN: FIN DE SEMANACATEDRÁTICO: ING. OSCAR ROLANDO SALAZARFECHA: 15 agosto 2015

I. Introducción

Son mediciones alrededor de las cuales tienden a agruparse los datos. Nos proporcionan información de los datos que estamos analizando y a la vez, nos permiten conocer las características de series de datos.

En el análisis exploratorio de los datos, generalmente se reconocen los siguientes tipos de medidas:

Medidas de tendencia central, son aquellas que informan sobre el centro o promedio de las observaciones, entre ellas destacan, la media aritmética, la mediana y la moda.

Medidas de posición, una vez ordenados los datos informan sobre la localización de estos; generalmente se les denomina cuantiles, entre ellas tenemos a los, deciles, quintiles, cuartiles y percentiles.

Medidas de dispersión, son aquellas que determinan la separación de los datos, de ellas destacan, el rango intercuartílico, la desviación típica, la varianza, el coeficiente de variación.

Medidas de forma, son las que proporcionan una idea de la simetría y apuntamiento de las distribuciones; tal es el caso del coeficiente de asimetría o sesgo y el coeficiente de apuntamiento o curtosis.

II. Medidas de tendencia central

Los fenómenos biológicos se caracterizan por la diversidad de información que proporciona, por lo que es necesario que junto a una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una medida que haga referencia a la variabilidad que refleje dicha fluctuación.II.1 OBJETIVOS ESPECÍFICOS

1

Page 2: LECCION CUATRO Medidas Tendencia Central

1. Conocer las principales medidas de posición central utilizadas comúnmente en al análisis de datos estadísticos.

2. Aplicar los conocimientos adquiridos de tales medidas para la búsqueda de la solución a estudios de casos.

3. Crear la metodología que facilite la comparación de datos entre grupos distintos con la misma variable o entre variables distintas.

4. Describir las medidas de tendencia central.

Características de los datos con respecto a estas medidas:

a. Tendencia a centrarse.

b. Dispersión o variación con respecto al centro

c. Variación de la posición.

d. La simetría de los datos.

e. La forma en que los datos se agrupan

Resulta valioso conocer los valores que marcan posiciones características de una distribución de frecuencias, así como, su simetría y forma.

Las principales medidas o estadísticos de posición central son:

II.2 La Media Aritmética

Es la suma de los valores de todas las observaciones dividida por el número de observaciones: X=

∑ x

n

2

Page 3: LECCION CUATRO Medidas Tendencia Central

Recibe también el nombre de media aritmética o promedio. Valores muy alejados del resto pueden modificar sustancialmente la media (en una situación así debe considerarse la utilización de la mediana, que no es sensible a los valores extremos).

Identificación:

Si se trata de la media de una muestra, el símbolo es:

Si se trata de la media de una población, su símbolo es: µ (mu)

Es el estadístico que nos permite conocer el valor central de un conjunto de datos. Existen varios procedimientos para obtenerla, la tecnología actual, nos facilita las operaciones mediante el uso de un computador o calculadoras programables o sencillamente utilizando las calculadoras científicas. Sin embargo, cuando se desea analizar gran cantidad de observaciones, estas pequeñas máquinas dejan de ser importantes. Por otro lado, resulta valioso conocer aspectos básicos del origen de la información.

Para el efecto pueden utilizarse datos brutos (los que provienes del campo) o los datos contenidos en una tabla de distribución de frecuencias tipo “A” o tipo “B”.

Obviamente, resulta engorroso y delicado analizar datos de campo si se cuenta con muchas observaciones, siendo necesario antes ordenarlos en una tabla de distribución de frecuencias.

III.1. Características de la media aritmética:

1. Fácil de calcular2. Toma en cuenta todos los valores3. Con valores extremos no es representativa4. No se puede calcular para caracteres cualitativos o intervalos no acotados.

III.2. Metodología

III.2.1 Primer caso: Utilizando los datos de campo.

Utilizaremos los datos de campo que corresponden a la edad de un grupo de 164 estudiantes de la sede de Escuintla de la Universidad Rafael Landivar:

Para el efecto utilizaremos el programa EXCEL:

3

X̄ =∑i=1

n

x i

n

Page 4: LECCION CUATRO Medidas Tendencia Central

EDAD25 19 21 22 28 17 22 25 19

20 22 21 23 21 16 20 18 21

22 22 24 20 21 18 20 21 25

22 23 25 25 19 19 22 22 19

20 20 27 20 20 20 22 19

21 21 23 24 22 20 24 21

21 30 22 24 20 20 22 19

19 20 20 25 21 20 28 35

20 21 32 24 19 19 21 19

25 21 20 21 21 20 26 20

22 21 28 23 23 18 21 22

20 21 23 24 21 23 25 23

20 21 25 18 21 18 19 21

22 21 23 20 17 23 21 21

19 20 23 27 18 18 21 20

21 23 19 22 19 19 31 22

19 20 21 23 19 21 23 25

22 26 25 20 20 20 20 27

21 19 21 21 19 19 20 31

23 23 35 22 18 19 36 23

Trasladamos esta base de datos a una hoja de EXCEL:

Seguidamente, ubicarse en cualquier celda vacía (por ejemplo A23):

Buscar la función (f):Click en fx:En la casilla: seleccionar una categoría, hacer click en su icono V; buscar “todas”Click en “todas”En la casilla: “seleccionar una función” buscar la función: “promedio” utilizando su icono “V”Una vez localizada la función “promedio”, hacer click en la casilla “aceptar” lo cual activará el cursor

4

Page 5: LECCION CUATRO Medidas Tendencia Central

Hacer click en la flecha roja de la casilla que dice: numero1Colocar el cursor en la primera casilla que contiene los datos, en nuestro caso es la A2, luego marcar todas las columnas que contienen la información, es decir, hasta J21:

Hacer click en la flecha roja de “argumentos de función”Hacer click en aceptar y como resultado tenemos: 21.8292… (recordemos que de preferencia deben utilizarse cuatro decimales)En la siguiente casilla escribimos el nombre del valor obtenido para no perdernos. El resultado lo observamos en la siguiente imagen:

5

Page 6: LECCION CUATRO Medidas Tendencia Central

Responder: el promedio de edad encontrado en los 164 estudiantes es de 21.8292 años.

Utilizando el mismo procedimiento podemos encontrar el promedio o media aritmética de cualquier cantidad de observaciones.

No ha sido necesario ordenar los datos en una tabla de distribución de frecuencias y mediante un procedimiento sencillo hemos obtenido la media aritmética de 164 observaciones y podemos responder con certeza que el promedio de altura de las treinta plantas de maíz es de 21.8292 años.

III.2.2 Segundo caso: Cálculo de la media utilizando una tabla de distribución de frecuencias.

Esta metodología se utiliza si deseamos obtener el promedio a partir de una tabla de distribución de frecuencias; se puede proceder de la siguiente manera:

6

Page 7: LECCION CUATRO Medidas Tendencia Central

Edad

7

Page 8: LECCION CUATRO Medidas Tendencia Central

Valor de la variable Frequency Percent Valid Percent Cumulative Percent

Valid 16 1 .6 .6 .6

17 2 1.2 1.2 1.8

18 8 4.9 4.9 6.7

19 22 13.4 13.4 20.1

20 30 18.3 18.3 38.4

21 33 20.1 20.1 58.5

22 19 11.6 11.6 70.1

23 17 10.4 10.4 80.5

24 6 3.7 3.7 84.1

25 11 6.7 6.7 90.9

26 2 1.2 1.2 92.1

27 3 1.8 1.8 93.9

28 3 1.8 1.8 95.7

30 1 .6 .6 96.3

31 2 1.2 1.2 97.6

32 1 .6 .6 98.2

35 2 1.2 1.2 99.4

36 1 .6 .6 100.0

Total 164 100.0 100.0

Utilizar la columna que contiene los valores encontrados de la variable y la columna que contiene las frecuencias absolutas simples (recordemos que este cuadro se obtuvo utilizando SPSS).

Se procede a multiplicar cada valor de variable por la correspondiente frecuencia absoluta simple, la que se suma a la siguiente clase operada de igual forma, en nuestro caso, llegaremos a obtener 18 multiplicaciones, según el número de clases; la sumatoria de estos valores se divide entre el numero de observaciones (N), como en el primer caso y utilizaremos la siguiente notación matemática:

X=( x1∗f 1 )+( x2∗f 2 )+. ..( xn∗f n )

NDe donde,

= (16*1)+(17*2)+(18*8)+ …+ (36*1)

164

= 21.8292

Podemos observar que el resultado es el mismo que al utilizar los datos de campo.

III.2.3 Tercer caso. Encontrar la media aritmética utilizando una tabla de distribución de frecuencias con datos agrupados en intervalos de clase.

Posiblemente los resultados no sean idénticos a los obtenidos anteriormente, porque en este caso utilizaremos la marca de clase de cada intervalo.

li ls Fas C

1 16.0000 18.3930 11 17.1965

8

Page 9: LECCION CUATRO Medidas Tendencia Central

2 18.3930 20.7860 52 19.5895

3 20.7860 23.1790 69 21.9825

4 23.1790 25.5720 17 24.3755

5 25.5720 27.9650 5 26.7685

6 27.9650 30.3580 4 29.1615

7 30.3580 32.7510 3 31.5545

8 32.7510 35.1440 2 33.9475

9 35.1440 37.5370 1 36.3405

164

La marca de clase (identificada como “c”) se ha obtenido sumando los límites de cada intervalo y dividiéndolos entre 2, por ejemplo, (16 + 18.3930)/2 = 17.1965 años

Se procede de igual forma al caso anterior, multiplicando cada marca de clase (c), por la correspondiente frecuencia absoluta simple y dividiendo el resultado total entre el número de observaciones, N.

X=(c1∗f 1 )+( c2∗f 2 )+ .. .(cn∗f n )

NDe donde,

= (17.1965*11)+(19.5895*52)+…+(36.3405*1)164

= 3588.3788/164 = 21.8803 años.

El resultado obtenido es satisfactorio, si se toma en cuenta lo expresado al iniciar el tercer caso.

III.3. Propiedades de la media aritmética

III.3.1 La suma algebraica de las desviaciones de un conjunto de números de su media aritmética es cero.

Con la siguiente serie de números demostrar la primera propiedad de la media aritmética: 6, 4, 8, 5, 2, 7.

Datos Media Operación Desviación6 5.0 6-5 = 1 14 5.0 4-5 = -1 -18 5.0 8-5 = 3 35 5.0 5-5 = 0 04 5.0 4-5 = -1 -13 5.0 3-5 = -2 -2

Total 30 Total 0Promedio = 5.0

III.3.2 La suma de los cuadrados de las desviaciones de un conjunto de números X de cualquier número “a” es mínima, solamente si “a” es =.

Datos Media Operación Desviación Cuadrado de las

9

Page 10: LECCION CUATRO Medidas Tendencia Central

desviaciones6 5.0 6-5 = 1 1 14 5.0 4-5 = -1 -1 18 5.0 8-5 = 3 3 95 5.0 5-5 = 0 0 04 5.0 4-5 = -1 -1 13 5.0 3-5 = -2 -2 4

Total 30 Total 0 Total 16Promedio = 5.0

III.3.3 Si f1 números tienen de media m1, f2 números tienen de media m2, … fk números tienen de media mk, entonces la media de todos los números es

X=( f 1∗m1 )+( f 2∗m2 )+. . .( f k∗mk)

f 1+ f 2+. . . f k

Es decir, una media aritmética ponderada de todas las medias

Por ejemplo, cuatro grupos de plantas, formados por 15, 20, 10 y 18 plantas registran una media de altura de 112, 118, 106 y 98 centímetros, respectivamente. Hallar el peso medio de todas las plantas.

Un procedimiento que puede facilitar las operaciones y comprensión es la preparación de la siguiente tabla:

Grupos de plantas(f)

Peso promedio por grupo (m)

(f) * (m)

15 112 168020 118 236010 106 106018 98 176463 6864

= (15 * 112) + (20 * 118) + (10 * 106) + (18 * 98) = 6864 15 + 20 + 10 + 18 63

= 108.95 libras

Esta media también se denomina media aritmética ponderada.

Ejemplo de media aritmética ponderada:

10

Page 11: LECCION CUATRO Medidas Tendencia Central

1. Una persona se somete a un examen de oposición para ocupar una plaza vacante en una empresa, el examen consta de tres pruebas:

a. Oral,b. Escrita,c. Curricular

Dicha persona obtiene las siguientes notas: 85,70 y 75, en cada una de las pruebas respectivamente.

a.1 Si para el departamento de selección de personal, las tres pruebas tienen el mismo valor, determina la media aritmética ponderada.a.2 Si para el departamento de selección de personal, la prueba escrita vale el doble de la oral y la prueba curricular vale el cuádruplo de la oral, determine la media aritmética ponderada.

X=w 1. x1+w 2 x2+. .. wn .xn

w1+w2+. . .+wn

2. Obtener la media ponderada de tres calificaciones de una prueba (85, 90, 75), donde la primera prueba cuenta el 20%, la segunda el 30% y la tercera el 50% de la calificación final.

X=20(85 )+30(90 )+50(75)20+30+50 = 81.5

IV. La Media Geométrica

Constituye otro importante estadístico en el análisis de la información bajo investigación. Es de importancia en los campos económicos, sociales, educativos, de salud y otros, para conocer tipos de interés anual, inflación, crecimiento poblacional, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores.

Según los datos que obtengamos y el estudio que se realice es conveniente analizar la posibilidad de utilizar, la media aritmética o la media geométrica.

La metodología a utilizar para encontrar la media geométrica dependerá de la información disponible, al igual que los casos para encontrar la media aritmética.

IV.1 Metodología

IV.1.1 Primer caso: Utilizando datos de campo.

Se extrae la raíz N de la multiplicación consecutiva de cada observación multiplicada por el número de observaciones. El procedimiento se facilita si no se dispone de muchos datos.

G=N√ x1∗x2∗. .. xn

También se denota por 11

Page 12: LECCION CUATRO Medidas Tendencia Central

X g=log x1+. .. log xn

N , es la media de los logaritmos de los valores de la variable.Fácilmente podemos obtener la media geométrica utilizando EXCEL. El procedimiento es similar al caso de la obtención del promedio. En este caso, buscamos la función MEDIA.GEOM

Y el resultado lo ubicamos en la celda siguiente después del promedio.Media geométrica: 21.6128…años

Ejemplo de media geométrica: la media geométrica suele utilizarse en negocios y economía para calcular las tasas de cambio promedio, las tasas de crecimiento promedio o tasas promedio. Dados n valor (todos positivos), la media geométrica es la n-ésima raíz de su producto.

12

Page 13: LECCION CUATRO Medidas Tendencia Central

Ejemplo: El factor de crecimiento promedio de dinero compuesto con tasas de interés anual del 10%, el 8%, el 9%, el 12% y el 7% se obtiene determinando la media geométrica de 1.10, 1.08, 1.09, 1.12, y 1.07. Calcule el factor de crecimiento promedio.

X g=5√1.10∗1.08∗1.09∗1.12∗1 .07= 1.091

La media geométrica (MG) de un conjunto de n números positivos se define como la raíz n-ésima del producto de los n valores. Su fórmula es:

  La media geométrica se usa para encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento.   Ejemplo   Las tasas de interés de tres bonos son 5%, 7% y 4%.

La media geométrica es = 5.192.   La media aritmética es (6 + 3 + 2)/3 = 5.333. La MG da una cifra de ganancia más conservadora porque no tiene una ponderación alta para la tasa de 7%.   Otra aplicación de la media geométrica es determinar el porcentaje promedio del incremento en ventas, producción u otros negocios o series económicas de un periodo a otro. La fórmula para este tipo de problema es:

  Ejemplo El número total de mujeres inscritas en colegios americanos aumentó de 755 000 en 1986 a 835 000 en 1995.

Aquí n = 10, así (n - 1) = 9.

Es decir, la media geométrica de la tasa de crecimiento es 1.27%.

V. La Media Armónica

Es una importante medida de centralización utilizada para conocer el comportamiento de grupos de individuos bajo estudio.

Se define como el recíproco de la media aritmética de los recíprocos, es decir,

1Xa

=

1x1

+ .. .+ 1xn

N

Por tanto,

V.1 Metodología

13

Page 14: LECCION CUATRO Medidas Tendencia Central

V.1.1 Primer caso: Utilizando los datos de campo.

Es decir, se obtiene dividiendo la totalidad de observaciones N entre la sumatoria de recíprocos de cada dato (1/x). Se le identifica con la letra H.

H = N . 1/x1 + 1/x2 + … 1/Xn

En nuestro caso, utilizaremos EXCEL, buscando la función MEDIA.ARMO, mediante los procedimientos ya conocidos y el resultado se expresa en la siguiente gráfica:

Respuesta: la media armónica encontrada en 164 estudiantes es de 21.4214 años.La media armónica, se utiliza a menudo como una medida de tendencia central para conjuntos de datos que consisten en tasas de cambios, como la velocidad. Para calcularla, se divide el número de valores n entre l suma de los reciprocos de todos los valores, de la siguiente forma:

n

∑ 1x

Ejemplo: cuatro estudiantes viajan desde Xela hasta la capital de Guatemala (220 kilómetros) a una velocidad de 60 km/h. Como necesitan llegar a tiempo a su clase de estadística, viajan de regreso a una velocidad de 100 km/h. ¿cuál es la velocidad promedio del viaje completo?

21

60+

1100 = 75 km/h

VI. La media cuadrática

Es la raíz cuadrada del cuadrado de la media (root main squart o RMS). Tiene utilidad cuando se analizan datos de carácter físico, tales como gases, líquidos, fuerzas, etc.14

Page 15: LECCION CUATRO Medidas Tendencia Central

Se obtiene extrayendo la raíz cuadrada de la sumatoria de cuadrados de los datos obtenidos y divididos entre su correspondiente totalidad de observaciones. Se le identifica como RMS.

RMS=√ X12+. . . X

n2

N

VI.1 Metodología

VI.1.1 Primer caso. Utilizando datos de campo.

Elevar al cuadrado cada observación,Sumar todos los cuadrados: resultado 79924Dividir la sumatoria entre las observaciones: 487.3415Obtener la raíz de la división anterior: 22.0758 añosRespuesta: la raíz cuadrática de los 164 estudiantes es de 22.0758 años

La media cuadrática suele utilizarse en aplicaciones físicas. Por ejemplo, en los sistemas de distribución de energía, los montajes y las corrientes suelen referirse en términos de sus valores de CMR. La media cuadrática de un conjunto de valores se obtiene elevando al cuadrado cada valor, sumando los resultados, dividiendo el número de valor n y después sacando la raíz cuadrada del resultado, el cual se expresa como

√∑ x2

n

Ejemplo: calcular el CMR de estas fuentes de poder (en volts): 110, 0, -60, 12

15

Page 16: LECCION CUATRO Medidas Tendencia Central

√1102+02+(−60)2+122

4 = 125.87 volts

VII. La mediana

La representaremos con el símbolo:

Es una medida de localización o tendencia central de los datos. Es el valor que divide al conjunto de datos en dos conjuntos de igual tamaño. Unos que son  menores o iguales que la mediana y otros que son mayores o iguales que la mediana. Es el valor de la serie de datos que se sitúa justamente en el centro (un 50% de valores son inferiores y otro 50% son superiores).

Para calcularla se procede primeramente a ordenar los datos, generalmente del menor al mayor valor; la mediana sólo depende de la posición que ocupa, no del valor particular observado.

En la mediana, los datos no presentan el problema de estar influidos por los valores extremos, pero en cambio no se utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).

VII.1 Características de la mediana:

Es útil si la media no se puede calcular o no es representativaNo toma en cuenta todas las observacionesDepende de la posición relativa de los datos, no de sus valores.

VII.2 Metodología

VII.2.1 Primer caso, utilizando datos de campo

Si tenemos los valores 2, 8, 3, 6, 4, 8, 3, 5, 6, primeramente procedemos a ordenarlos: 2, 3, 3, 4, 5, 6, 6, 8, 8. Observamos que contamos con nueve datos, es decir, son datos impares y el valor que se encuentra en la quinta posición dividirá el conjunto de datos en dos subconjuntos de 4 datos cada uno: 2, 3, 3, 4 5 6, 6, 8, 8, la mediana es, por lo tanto, el número 5.

Si ahora observamos los valores 1, 6, 5, 4, 3, 4, 5, 5, podemos darnos cuenta que son datos pares. El primer paso consiste en ordenar los datos: 1, 3, 4, 4, 5, 5, 5, 6. Como hay 8 datos, un valor que se encuentre entre la cuarta y la quinta posición dividirá el conjunto de datos en dos subconjuntos de 4 datos cada uno:    1, 3, 4, 4, x, 5, 5, 5, 6. En este caso, se procede tomando los dos números centrales y dividiéndolos entre 2, esto nos permite obtener el valor de la mediana, de este conjunto de datos que es (4 + 5)/2 = 4.5

La mediana puede obtenerse directamente utilizando EXCEL (función MEDIANA) o SPSS. Para ello hacemos uso de los procedimientos que antes se han explicado. La grafica siguiente muestra el valor de la mediana utilizando los datos de campo.

16

Page 17: LECCION CUATRO Medidas Tendencia Central

Respuesta: la mediana que corresponde a los 164 estudiantes es de 21 años

VII.2.2 Segundo caso, utilizando datos agrupados en una tabla de distribución de frecuencias con intervalos de clase

Para datos agrupados, la mediana se obtiene mediante interpolación lineal y viene dada por

Med=L1+{ N2

−(∑ f )1fmediana }c

Donde

L1 = límite real inferior de la clase mediana (es decir, la clase que contiene la mediana)N = Número total de datos, es decir, frecuencia total.(∑f)1 = Suma de las frecuencias de todas las clases por debajo de la clase medianaf mediana = frecuencia de la clase medianac = Tamaño del intervalo de la clase mediana

Utilizando la tabla de distribución de frecuencias por intervalos que nos ha ocupado, procederemos a calcular la mediana mediante la fórmula antes mencionada.

Primeramente conviene ubicar la clase mediana, y es aquella donde se encuentra el 50% de los datos, en la frecuencia porcentual acumulada.

17

Page 18: LECCION CUATRO Medidas Tendencia Central

li ls f Fa frs Frac fps fpac c

1 16.0000 18.3930 11 11 0.0671 0.0671 6.7073 6.7073 17.1965

2 18.3930 20.7860 52 63 0.3171 0.3841 31.7073 38.4146 19.5895

3 20.7860 23.1790 69 132 0.4207 0.8049 42.0732 80.4878

21.9825

4 23.1790 25.5720 17 149 0.1037 0.9085 10.3659 90.8537 24.3755

5 25.5720 27.9650 5 154 0.0305 0.9390 3.0488 93.9024 26.7685

6 27.9650 30.3580 4 158 0.0244 0.9634 2.4390 96.3415 29.1615

7 30.3580 32.7510 3 161 0.0183 0.9817 1.8293 98.1707 31.5545

8 32.7510 35.1440 2 163 0.0122 0.9939 1.2195 99.3902 33.9475

9 35.1440 37.5370 1 164 0.0061 1.0000 0.6098 100.0000 36.3405

164 1.0000 100.0000

En el presente caso, la clase mediana se ubica en el tercer intervalo, porque en este se encontró el 80.49% de los datos acumulados.

Med=L1+{ N2

−(∑ f )1fmediana }c

DondeL1 = límite real inferior de la clase mediana (es decir, la clase que contiene la mediana) = 20.7860N = Número total de datos, es decir, frecuencia total = 164(∑f)1 = Suma de las frecuencias acumuladas por debajo de la clase mediana = 63f mediana = frecuencia de la clase mediana = 69c = Tamaño del intervalo de la clase mediana = 2.3930

Med=20. 7860+{642

−(63 )

69 }2 .393

Med = 21.8611 años

VII.3 Propiedades de la medianaEntre las propiedades de la mediana, vamos a destacar las siguientes:

VII.3.1 Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado su uso en distribuciones asimétricas.

VII.3.2 Es de cálculo rápido y de interpretación sencilla.

VII.3.3 A diferencia de la media, la mediana de una variable discreta es siempre un valor de la variable que estudiamos (ej. La mediana de la variable número de hijos toma siempre valores enteros).

18

Page 19: LECCION CUATRO Medidas Tendencia Central

VII.3.4 Si una población está formada por dos subpoblaciones de medianas Med1 y Med2, sólo se puede afirmar que la mediana, Med, de la población está comprendida entre Med1 y Med2

VII.3.5 El mayor defecto de la mediana es que tiene unas propiedades matemáticas complicadas, lo que hace que sea muy difícil de utilizar en inferencia estadística.

VII.3.6 Es función de los intervalos escogidos.

VII.3.7 Puede ser calculada aunque el intervalo inferior o el superior no tengan límites.

VII.3.8 La suma de las diferencias de los valores absolutos de n puntuaciones respecto a su mediana es menor o igual que cualquier otro valor.

Ejemplo

Sea X, una variable discreta que ha presentado sobre una muestra las modalidades, 2, 5, 7, 9, 12, la mediana es 7.

Si cambiamos la última observación por otra anormalmente grande, esto no afecta a la mediana, pero si a la media: 2, 5, 7, 9, 125, la mediana seguirá siendo 7, pero la media ahora será 29.6.

En este caso la media no es un posible valor de la variable (discreta), y se ha visto muy afectada por la observación extrema. Este no ha sido el caso para la mediana.

VIII. La moda

Se representa por el símbolo:

También suele ser llamada modo. Es el valor que ocurre con mayor frecuencia, es decir, el valor más frecuente. La moda puede no existir, e incluso no ser única en caso de existir (ej. Multimodal).

En ciertas ocasiones la media aritmética, la mediana y la moda suelen coincidir, aunque generalmente no es así. Cada uno de ellos presenta ventajas e inconvenientes.

Una distribución que tiene una sola moda se llama unimodal.

Llamaremos moda a cualquier máximo relativo de la distribución de frecuencias, es decir, cualquier valor de la variable que posea una frecuencia mayor que su anterior y su posterior.   

En el caso de datos agrupados donde se ha construido una curva de frecuencia para ajustar los datos, la moda será el valor (o los valores) de X correspondientes al máximo (o máximos) de la curva.

Primer caso: Utilizando los datos de campo.

19

Page 20: LECCION CUATRO Medidas Tendencia Central

La moda puede obtenerse directamente utilizando EXCEL (función MODA) o SPSS. Para ello hacemos uso de los procedimientos que antes se han explicado. La grafica siguiente muestra el valor de la moda utilizando los datos de campo:

Segundo caso: Calcular la moda de una distribución de frecuencias o un histograma con datos agrupados, la moda suele obtenerse utilizando la fórmula:

mod a=L1+( Δ1

Δ1+ Δ2)c

DondeL1 = Límite real inferior de clase de la clase modal (es decir, la clase que contiene la moda)Δ1 = Exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferiorΔ2 = Exceso de la frecuencia modal sobre la frecuencia de la clase contigua superiorc = tamaño del intervalo de clase modal

Si tomamos la tabla que hemos venido analizando, podemos encontrar la moda aplicando la fórmula anterior,Li ls fas Faac frs frac fps fpac c

1 16.0000 18.3930 11 11 0.0671 0.0671 6.7073 6.7073 17.1965

2 18.3930 20.7860 52 63 0.3171 0.3841 31.7073 38.4146 19.5895

3 20.7860 23.1790 69 132 0.4207 0.8049 42.0732 80.4878

21.9825

4 23.1790 25.5720 17 149 0.1037 0.9085 10.3659 90.8537 24.3755

5 25.5720 27.9650 5 154 0.0305 0.9390 3.0488 93.9024 26.7685

6 27.9650 30.3580 4 158 0.0244 0.9634 2.4390 96.3415 29.1615

7 30.3580 32.7510 3 161 0.0183 0.9817 1.8293 98.1707 31.5545

8 32.7510 35.1440 2 163 0.0122 0.9939 1.2195 99.3902 33.9475

9 35.1440 37.5370 1 164 0.0061 1.0000 0.6098 100.0000 36.3405

164 1.0000 100.0000

20

Page 21: LECCION CUATRO Medidas Tendencia Central

Observando la frecuencia absoluta simple (fas), encontramos que la clase modal está constituida por el tercer intervalo.

L1 = 20.7860Δ1 = 69 – 52 = 17Δ2 = 69 – 17 = 52c = 2.3930

mod a=20 .7860+(1717+52 )2 .3930

Moda = 21.3756 años

VIII.3 Características de la moda:

1. Pueden existir varias modas, lo que da origen a distribuciones bimodales, trimodales, o multimodales.

2. No toma en cuenta todas las observaciones3. Es menos representativa que la media4. Se puede calcular para características cualitativas.5. Indica el valor más típico en la distribución.6. Puede localizarse con facilidad y tener una idea cruda del promedio.7. Es la medida de tendencia central más fácil de calcular.

VIII.4 Propiedades de la Moda:

De la moda destacamos las siguientes propiedades:

VIII.2.1 Es muy fácil de calcular.

VIII.2.2 Puede no ser única.

VIII.2.3 Es función de los intervalos elegidos a través de su amplitud, número y límites de los mismos.

VIII.2.4 Aunque el primero o el último de los intervalos no posean extremos inferior o superior respectivamente, la moda puede ser calculada.

X. Relación entre media, mediana y moda

En el caso de distribuciones unimodales, la mediana está con frecuencia comprendida entre la media y la moda (incluso más cerca de la media). En distribuciones que presentan cierta inclinación, es más aconsejable el uso de la mediana. Sin embargo en estudios relacionados con propósitos estadísticos y de inferencia suele ser más apta la media.

21

Page 22: LECCION CUATRO Medidas Tendencia Central

Para curvas de frecuencias unimodales que sean moderadamente sesgadas (asimétricas), se tiene la relación empírica

Media – moda = 3 (media – mediana)

En la siguiente figura se muestran las posiciones relativas de la media, mediana y moda para una curva de frecuencias que está sesgadas a la izquierda.

Para curvas simétricas, la media, moda y mediana coinciden.

ACTIVIDADES COMPLEMENTARIAS 22

Page 23: LECCION CUATRO Medidas Tendencia Central

A. Calcular las medidas de tendencia central utilizando el programa Stadis 1.05 ß

Recomendación: instalar el programa, bajándolo de internet.

1. Activar el programa utilizando el icono StadiS.exe. La respuesta la encontramos en la siguiente grafica:

2. Hacer click en nueva (cuando se desean ingresar nuevos datos) o abrir cuando se desea abrir una base de datos guardada. Supongamos que nuestro interés es ingresar nuevos datos, hacer click en nueva.

3. Seleccionar el tipo de variable a analizar: unidimensional o bidimensional. Si nuestro interés es analizar la variable EDAD, la consideraremos unidimensional discreta (hacer doble click en UNIDIMENSIONAL); luego seleccionar si se trata de una variable categórica, discreta o continua.

Las variables unidimensionales pueden clasificarse en categóricas, discretas o continuas (Variables unidimensionales: sólo

recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase. Variable categórica: Es la que clasifica o categoriza cada individuo en solo una de varias celdas o clases; estas celdas o clases son totalmente incluyentes y mutuamente excluyentes. Variable discreta: Es una variable que puede asumir un número contable de distintos valores. Es decir, la cantidad de valores que puede asumir una variable discreta puede contarse fácilmente (potencialmente, ya que puede que nunca se llegue al final); Ejemplos: números que se asignan a cada niño. Variable continua: Es una variable que puede adquirir valores en un conjunto no contable de objetos, tal como un intervalo o la recta numérica. Ejemplos: estatura, largo, peso, distancia, tiempo, volumen, etc., podría incluirse la edad.

Variables BIDIMENSIONALES: Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase); pueden clasificarse en variables discretas-discretas, discretas-continuas y, continuas-continuas.

4. Hacer click en discreta y click en “aceptar” y se activará la casilla DAT

23

Page 24: LECCION CUATRO Medidas Tendencia Central

5. Tomar en consideración que aparecerán dos columnas: la primera con Xi y la segunda ni; esto implica que el programa analizará datos agrupados en una tabla de distribución de frecuencias tipo “A”; en nuestro caso, contamos con la siguiente tabla:

EdadValor de la

variable Frequency Percent Valid Percent Cumulative PercentValid 16 1 .6 .6 .6

17 2 1.2 1.2 1.818 8 4.9 4.9 6.719 22 13.4 13.4 20.120 30 18.3 18.3 38.421 33 20.1 20.1 58.522 19 11.6 11.6 70.123 17 10.4 10.4 80.524 6 3.7 3.7 84.125 11 6.7 6.7 90.926 2 1.2 1.2 92.127 3 1.8 1.8 93.928 3 1.8 1.8 95.730 1 .6 .6 96.331 2 1.2 1.2 97.632 1 .6 .6 98.235 2 1.2 1.2 99.436 1 .6 .6 100.0Total 164 100.0 100.0

6. Ingresar en la columna Xi los valores de la variable “edad” y en ni el valor de la frecuencia simple, como puede observarse en la siguiente gráfica:

24

Page 25: LECCION CUATRO Medidas Tendencia Central

7. Pulsar NOT; hacer click en “▼” de la casilla en blanco. Hacer click en “medidas de tendencia central”, los resultados son los siguientes:

8. Grabar la información: en el icono “grabar”, el programa permite almacenar la información con el nombre que nos parezca con al extensión .mdb

9. Hacer click en el icono “seleccionar todo”; hacer click derecho sobre los datos marcados para transportar los resultados y pegarlos en WORD

25

Page 26: LECCION CUATRO Medidas Tendencia Central

10. “Pegar” la información en WORD

Los resultados son los siguientes.

=== MEDIDAS DE TENDENCIA CENTRAL (var. X) ===- Tamaño Muestral ............... 164- Media Aritmética .............. 21.829- Media Armónica ................ 21.421- Media Geométrica .............. 21.613- Media Cuadrática .............. 22.076- Mediana ....................... 21.0- Moda .......................... 21.0- Cuartil Q(1) ................. 20.0- Cuartil Q(3) ................. 23.0

Conclusiones:

a. Se le recomienda al alumno conocer información valiosa pulsando el icono: CAL, información que posteriormente será de importancia para el curso Estadística I.

b. Ingresar la tabla de distribución de frecuencias tipo “B” utilizando UNIDIMENSIONAL CONTINUA, ingresando en LiX los valores de los límites inferiores de cada intervalo y la columna LsX, los valores de los límites superiores de cada intervalo y, en la columna “ni”, ingresar las observaciones:

26

Page 27: LECCION CUATRO Medidas Tendencia Central

Al igual que el caso anterior, pulsar NOT y obtener los resultados de “medidas de tendencia central”

Resultados (utilizando una tabla de distribución de frecuencias tipo “B”)

=== MEDIDAS DE TENDENCIA CENTRAL (var. X) ===- Tamaño Muestral ............... 164- Media Aritmética .............. 21.88- Media Armónica ................ 21.478- Media Geométrica .............. 21.668- Media Cuadrática .............. 22.121- Mediana ....................... 21.445- Moda .......................... 21.376- Cuartil Q(1) ................. 19.774- Cuartil Q(3) ................. 22.867

27

Page 28: LECCION CUATRO Medidas Tendencia Central

B. CALCULAR LAS MEDIDAS DE TENDENCIA CENTRAL UTILIZANDO EL PROGRAMA SPSS

1. Instalar el programa SPSS

2. Reconocer el icono característico de SPSS.

3. Pulsar el icono de SPSS

Primera información del programa:

28

Page 29: LECCION CUATRO Medidas Tendencia Central

4. Reconocer las funciones principales del programa (en español o inglés): File, Edit, View, Data, Transform, Analyze, Graphs, Utilities, Adds-ons, Window, Help.

5. Debajo de la hoja encontramos las ventanas Data View y Variable View, que son de utilidad para cambiar las características de las variables.

6. En las columnas anotar los valores de las variables de forma descendente (no es posible trasladar la base de datos EXCEL que antes hemos utilizado, al menos que la base de datos se encuentre en forma descendente pueden transportarse los datos desde EXCEL: copiar, luego ubicarnos en la primera celda de SPSS, click derecho: paste); observar la siguiente gráfica luego que han sido transportados desde EXCEL los valores de las variables EDAD, ESTATURA Y PESO de los 164 estudiantes.

7. Identificar las variables según cada columna. Para ello, pulsar “Variable view” en la parte baja de la ventana, lo cual nos traslada a la grafica de abajo y en Name proceder a identificar las variables: Edad, Estatura y Peso (la información de cada variable la encontraremos en forma horizontal)

Y el resultado es el siguiente:

29

Page 30: LECCION CUATRO Medidas Tendencia Central

Existen otras características de las variables que pueden modificarse desde aquí y que será necesario hacerlo conforme avancemos con el curso.

8. Analizar los datos mediante el siguiente procedimiento: click Analyze + Estadística Descriptiva + 123 frequencies:

9. Trasladar las variables a la casilla “Variables (s)”, utilizando la flecha azul: click sobre el nombre la variable + click sobre la flecha.

30

Page 31: LECCION CUATRO Medidas Tendencia Central

10. Click sobre Statistic y luego marcar las medidas de tendencia central que nos interesan: la media, la mediana, la moda, la sumatoria, los valores mínimos y máximos.

11. Click en “continue”, click en “Ok” y los resultados los observaremos en la ventana “output” debajo de esta pantalla.

12. Copiar y pegar a WORD los resultados que se encontraran en varios cuadros:

Descriptive Statistics

N Minimum Maximum Mean Std. Deviation

Edad 164 16.00 36.00 21.8293 3.30014

Estatura 164 1.45 1.90 1.6929 .08023

Peso 164 95.00 286.00 151.2195 28.03833

Valid N (listwise) 164

31

Page 32: LECCION CUATRO Medidas Tendencia Central

Statistics

Edad Estatura Peso

N Valid 164 164 164

Missing 0 0 0

Mean 21.8293 1.6929 151.2195

Median 21.0000 1.7000 147.5000

Mode 21.00 1.70 160.00

Minimum 16.00 1.45 95.00

Maximum 36.00 1.90 286.00

Sum 3580.00 277.63 24800.00

Edad

Frequency Percent Valid Percent

Cumulative

Percent

Valid 16.00 1 .6 .6 .6

17.00 2 1.2 1.2 1.8

18.00 8 4.9 4.9 6.7

19.00 22 13.4 13.4 20.1

20.00 30 18.3 18.3 38.4

21.00 33 20.1 20.1 58.5

22.00 19 11.6 11.6 70.1

23.00 17 10.4 10.4 80.5

24.00 6 3.7 3.7 84.1

25.00 11 6.7 6.7 90.9

26.00 2 1.2 1.2 92.1

27.00 3 1.8 1.8 93.9

28.00 3 1.8 1.8 95.7

30.00 1 .6 .6 96.3

31.00 2 1.2 1.2 97.6

32.00 1 .6 .6 98.2

35.00 2 1.2 1.2 99.4

36.00 1 .6 .6 100.0

Total 164 100.0 100.0

32

Page 33: LECCION CUATRO Medidas Tendencia Central

Por razones de espacio no encontrará los cuadros de estatura y peso.

13. Análisis de la información:

Utilizando los cuadros anteriores describir los resultados.

33