Medidas de Posicion y Dispersion

39
Lidia C. Diblasi 66 CAPÍTULO III MEDIDAS DE POSICIÓN Y DISPERSIÓN I- MEDIDAS DE TENDENCIA CENTRAL Una medida de tendencia central es un número que indica el centro de una serie de datos, o de una distribución. Se llaman también medidas de localización. Si imaginamos los valores de un grupo de datos representados en un eje horizontal, las medidas de tendencia central y localización nos dicen donde está el “centro” de la distribución. A diario usamos, por ejemplo, la palabra promedio sin hacer ningún cálculo para referirnos al tiempo que demoramos “en promedio” para ir de nuestra casa al trabajo, para calcular la cantidad de dinero que gastamos en nafta en el mes; para ver cuánto estamos dispuestos a gastar “en promedio” para comprar una determinada prenda; etc. Si bien no hacemos ningún cálculo en el momento, la expresión tiene un significado muy útil para transmitir a otros una información. Lo que hacemos es una aproximación de la realidad, no significa que sea exactamente la realidad, pero sí será un valor parecido, cercano, un valor esperado por alguna causa. Esa causa generalmente está basada en la experiencia que tenemos como para poder dar un valor aproximado. Las medidas de tendencia Central son valores que pueden resumir los datos en un único valor. Representan una síntesis, no puede ser un valor menor al valor más pequeño de la distribución, ni tampoco un valor mayor a cualquiera de la distribución. Debe ser un valor que esté en el centro de la misma si los datos están ordenados. “Un valor semejante que representa todo un conjunto de datos, tiene que ser un valor central o de posición central a cuyo alrededor se distribuyen todos los datos del conjunto” (CHAO, Lincoln, 63). Son varias las medidas de tendencia central, nosotros nos dedicaremos especialmente a tres de ellas: la media aritmética, la mediana y el modo.

description

Medidas de Posicion y Dispersion

Transcript of Medidas de Posicion y Dispersion

Page 1: Medidas de Posicion y Dispersion

Lidia C. Diblasi

66

CAPÍTULO III

MEDIDAS DE POSICIÓN Y DISPERSIÓN I- MEDIDAS DE TENDENCIA CENTRAL

Una medida de tendencia central es un número que indica el centro de una

serie de datos, o de una distribución. Se llaman también medidas de localización.

Si imaginamos los valores de un grupo de datos representados en un eje

horizontal, las medidas de tendencia central y localización nos dicen donde está el

“centro” de la distribución.

A diario usamos, por ejemplo, la palabra promedio sin hacer ningún cálculo

para referirnos al tiempo que demoramos “en promedio” para ir de nuestra casa al

trabajo, para calcular la cantidad de dinero que gastamos en nafta en el mes; para

ver cuánto estamos dispuestos a gastar “en promedio” para comprar una

determinada prenda; etc. Si bien no hacemos ningún cálculo en el momento, la

expresión tiene un significado muy útil para transmitir a otros una información. Lo

que hacemos es una aproximación de la realidad, no significa que sea

exactamente la realidad, pero sí será un valor parecido, cercano, un valor

esperado por alguna causa. Esa causa generalmente está basada en la

experiencia que tenemos como para poder dar un valor aproximado.

Las medidas de tendencia Central son valores que pueden resumir los

datos en un único valor. Representan una síntesis, no puede ser un valor menor al

valor más pequeño de la distribución, ni tampoco un valor mayor a cualquiera de la

distribución. Debe ser un valor que esté en el centro de la misma si los datos están

ordenados. “Un valor semejante que representa todo un conjunto de datos, tiene

que ser un valor central o de posición central a cuyo alrededor se distribuyen todos

los datos del conjunto” (CHAO, Lincoln, 63).

Son varias las medidas de tendencia central, nosotros nos dedicaremos

especialmente a tres de ellas: la media aritmética, la mediana y el modo.

Page 2: Medidas de Posicion y Dispersion

Lidia C. Diblasi

67

La media aritmética: es la medida de tendencia central que se calcula más

frecuentemente; es la que en lenguaje común y corriente se denomina, como ya

vimos, promedio.

Dada una variable discreta, la media aritmética o simplemente la media de un

conjunto x1, x2, x3,...xn se denota por x y se define como:

N

x1+ x2+ x3+.....+.xn Σ xi

x = ________________ = __ i=1____

N N

N

Donde Σ i=1 indica que hay que sumar todas las x disponibles desde x1 hasta xn.

Los símbolos i= 1 y N que aparecen abajo y encima del signo ∑ se los conoce

como límites de la sumatoria. Cuando está claro en el contexto cuáles son estos

límites, pueden omitirse y escribir solamente ∑.

Veamos un ejemplo:

Si tenemos las siguientes notas resultado de cuatro parciales y queremos calcular

el promedio, sumamos las cuatro notas y dividimos el resultado por la cantidad de

notas:

Notas: 7; 6,50; 8; 10

Media aritmética o Promedio: 7+6,50+8+10= 31,50 /4 = 7,875

La diferencia entre las X mayúscula y la x minúscula se debe a que las

mayúsculas se refieren a la variable en estudio (como peso, estatura, etc.) y las

minúsculas, a cada uno de los valores de la variable X

Si los valores x1+ x2+ x3+......xn ocurren f1+ f2+ f3+......fn respectivamente (es decir

que ocurren con frecuencia f1+ f2+ f3+......fn) la media aritmética es:

N

x1 f1+ x2 f2+ x3 f3+......+xn fn Σ xi fi

x = _______________________ = ___i=1_____

N

f1+ f2+ f3+.....+ fn Σ fi

i=1

Page 3: Medidas de Posicion y Dispersion

Lidia C. Diblasi

68

N

Donde Σ fi = N es la frecuencia total, es decir el número total valores o de las i=1

unidades de análisis.

Cuando, como resultado de un estudio, tenemos un conjunto de datos sin

organización, estos prácticamente no tienen ninguna significación. Si los

organizamos teniendo en cuenta los valores observados, los ordenamos siguiendo

algún criterio, y tenemos en cuenta la frecuencia o cantidad de veces que se

repite cada uno de esos valores, ello nos permitirá analizarlos y trabajarlos para

conocer por ejemplo: cuál es el valor más repetido, cuál el menor valor, cuál el

mayor, si hay mucha concentración de los datos en pocos valores, o si por el

contrario están muy dispersos.

Si la cantidad de datos es pequeña y la vamos a trabajar manualmente nos

conviene ordenar los valores construyendo una tabla de frecuencias.

Veamos un ejemplo: Los siguientes datos hacen referencia a la nota obtenida en un parcial por una

muestra de 20 alumnos

5 8 7 9 6 8 8 9 5 9 2 4 6 9 7 8 7 6 10 8

El recorrido de esta variable (Rango) es desde 2 puntos, el valor más pequeño,

hasta 10 el mayor puntaje de notas de este grupo.

Realizamos los siguiente pasos para calcular la media:

1- ordenamos los valores de la variable: “nota de los alumnos”

2- calculamos la media o promedio teniendo en cuenta la cantidad de veces

que se repite cada valor de la variable (frecuencia absoluta).

Page 4: Medidas de Posicion y Dispersion

Lidia C. Diblasi

69

xi fi 2 1 4 1 5 1 6 3 7 4 8 5 9 4 10 1

Podemos calcular ahora la Media Aritmética teniendo ordenado los valores

con su correspondiente frecuencia. Como cada valor de la variable se repite, en

general, más de una vez, vamos a multiplicar cada valor de la variable por su

frecuencia, antes de sumar. Para ellos usamos la siguiente fórmula:

N

Σ xi fi

x = ___i=1___ N

Σ fi

i=1

Ahora podemos calcular la media

x = 20

143

x = 7,15 es la nota promedio que han obtenido en un

examen parcial los alumnos de ese grupo.

xi fi xi * fi 2 1 2 4 1 4 5 1 5 6 3 18 7 4 28 8 5 40 9 4 36 10 1 10

Page 5: Medidas de Posicion y Dispersion

Lidia C. Diblasi

70

Podemos tratar a la variable continua como si fuera discreta, dividiendo los

valores en intervalos de clase. En tal caso, se consideran los valores

comprendidos en el intervalo como si fuesen iguales al punto medio del intervalo

de clase.

Si se denomina xi a los puntos medios de los intervalos de clase y fi a las

frecuencias absolutas de los valores comprendidos en cada intervalo, la media

aritmética puede ser calculada de la misma forma que en el ejemplo anterior,

donde xi pasa a ser el punto medio del intervalo de clase:

Veamos un ejemplo: Los siguientes datos hacen referencia a la edad al contraer

matrimonio en una muestra de 50 mujeres

15 28 17 25 30 32 38 19 25 19

35 41 48 43 33 35 23 24 28 17

21 22 26 29 30 31 40 16 19 21

22 26 25 36 37 52 41 22 33 36

29 27 31 20 29 24 45 54 19 32

El recorrido de esta variable (Rango) es desde 15 años, el valor más pequeño,

hasta 54 años, la edad mayor de este grupo de mujeres en contraer matrimonio.

Realizamos los siguiente pasos:

1- calculamos los intervalos de clase.

2- calculamos los puntos medios de los intervalos, que pasan a ser los valores

representativos de la clase: xi.

3- buscamos la frecuencia absoluta de cada clase o intervalo de clase.

4- calculamos la media o promedio teniendo en cuenta la cantidad de veces

que se repite cada valor de la variable.

Page 6: Medidas de Posicion y Dispersion

Lidia C. Diblasi

71

Intervalo xi fi xi * fi 15 - 19 17 8 136

20 - 24 22 9 198

25 - 29 27 11 297

30 - 34 32 8 256

35 - 39 37 6 222

40 - 44 42 4 168

45 - 49 47 2 94

50 - 54 52 2 104 Ahora podemos calcular la media:

N

Σ xi fi

x = ___i=1___

N

Σ fi

i=1

x = 50

1475

x = 29,5 años es la edad promedio al casarse de éste grupo de mujeres. Algunas propiedades de la media aritmética: 1) La suma algebraica de los desvíos de un conjunto de valores en relación con su

media es cero.

Σ (xi - x) = 0 Veamos un ejemplo: Si tenemos los siguientes valores de una variable X: 1; 3; 5:7; 9 y calculamos la media de esos valores nos da: 5

Page 7: Medidas de Posicion y Dispersion

Lidia C. Diblasi

72

Luego si a cada valor de la variable le restamos la media:

x = 5

25 = 5

Podemos comprobar que la suma de éstos valores es igual a cero: Σ (xi - x ) = 0 De igual forma se comprueba cuando trabajamos con frecuencias:

Σ (xi - x ) fi = 0

Σ [ xi fi – x Σfi ] = 0

Σ xi fi

Σ [ xi fi - ______ Σfi ] = 0

Σfi

Σxi fi - Σ xi fi = 0

La razón de que la primera propiedad se verifique se debe a que cuando se

sustrae la media de cada uno de los datos, las diferencias resultantes, son tales

que las marcas negativas se equilibran exactamente con las positivas. Ello nos

está indicando que la media es el centro de gravedad de la distribución y que si

pudiéramos poner los valores de la variable sobre una barra en suspenso y la

levantáramos desde el punto donde se encuentra el valor de la media, la barra no

debería inclinarse, debería mantenerse horizontal.

xi xi - x

1 -4

3 -2

5 0

7 2

9 4

∑∑∑∑ = 25 = 25 = 25 = 25 ∑∑∑∑ = 0 = 0 = 0 = 0

Page 8: Medidas de Posicion y Dispersion

Lidia C. Diblasi

73

2) La suma de los cuadrados de los desvíos de un conjunto de valores xi respecto

a cualquier valor c es un mínimo si y solo si c = x.

Σ (xi - x ) 2 = es un mínimo

Veamos un ejemplo con los datos del ejercicio anterior:

Σ (xi - x ) 2 = 40

Supóngase que se calculan los desvíos con respecto a un punto cualquiera: c< x

ó c > x

c= 4

c= 8

Σ (xi - x) 2 = 45 Σ (i - x) 2 = 85

Como podemos observar calculando los desvíos respecto a un valor menor a la

media (4) y con un valor mayor a la media (8), vemos que la suma al cuadrado de

xi xi - x (xi – x )2

1 -4 16

3 -2 4

5 0 0

7 2 4

9 4 16

∑ = 25 ∑ = 0 40

xi xi - 8 (xi – 8)2 1 -7 49

3 -5 25

5 -3 9

7 -1 1

9 1 1

∑ = 25 ∑ (ξ,ι − ξ) 85

xi xi - 4 (xi – 4)2 1 -3 9

3 -1 1

5 1 1

7 3 9

9 5 25

∑ = 25 ∑ = 5 45

Page 9: Medidas de Posicion y Dispersion

Lidia C. Diblasi

74

los desvíos es mayor que cuando los desvíos se hacen respecto a la media. Esta

propiedad de la media nos permite el cálculo de medidas de dispersión.

De la misma forma se puede demostrar con una serie con frecuencia

Σ (xi – x )2 fi. = a un mínimo

3) Si f1 valores (ó n1 valores) tienen como media x 1; f2 valores (ó n2 valores)

tienen como media x 2; ....fk valores (ó nk valores) tienen como media x k,

entonces la media de todos los valores es:

x 1 f1+ x 2 f2+ x 3 f3+......+ x k fk

x = _______________________

f1+ f2+ f3+.....+fk

es decir la media aritmética de todas las medias, la llamamos también “Media

Ponderada”

Veamos un ejemplo: En el siguiente cuadro se muestran las edades promedios al ingresar de los alumnos

de las cuatro carreras de la facultad de Ciencias Políticas y Sociales: Sociología,

Ciencia Política y Administración Pública, Trabajo Social y Comunicación Social y la

cantidad de jóvenes entrevistados.

Para calcular la media general de todos los alumnos ingresantes en el año 2008 a la

facultad debemos usar la fórmula de la media ponderado o media de medias:

Carrera N (fi) X

Sociología 35 22.49 Ciencia Política 23 21.48 Trabajo Social 52 20.6 Comunicación Social 96 18.79

Page 10: Medidas de Posicion y Dispersion

Lidia C. Diblasi

75

22,49 *35 + 21,48 * 23 + 20,6 * 52 + 18,79 * 96 x = ________________________________________

35 + 23 + 52 + 96

x = 206

23,4156 x = 20,17

Más allá de las diferencias de medias de cada carrera, la edad promedio del

grupo que ingresó a la Facultad en el año 2008 es de 20,17 años. La Media

Ponderada nos permite dar un solo valor que refleje a todos los grupos involucrados.

La importancia de esta media de medias es que confirma la propiedad de la

media aritmética de ser el centro de gravedad de la distribución ya que tiene en

cuenta el peso que poseen las frecuencias de cada valor de media grupal. En nuestro

ejemplo la Carrera de Comunicación Social tiene una frecuencia que es muy superior

a la de las otras carreras.

Resumiendo podemos decir que la carrera de Comunicación Social tiene

mayor peso, al tener mayor cantidad de alumnos entrevistados y el más bajo

promedio en edad al ingresar a la facultad, por ser el grupo más homogéneo, o

con menor dispersión en esta variable.

Si los grupos tienen, en alguna característica, diferencias importantes es

bueno calcular la media ponderada, que nos da una visión de conjunto y, a su vez,

la media por grupos para mostrar o “revelar” las diferencias.

Podemos hacer el gráfico que nos muestra muy bien las diferencias entre

los grupos y que a su vez nos permite visualizar dónde se ubicaría la media de

medias o media ponderada de todos los subgrupos estudiados:

Page 11: Medidas de Posicion y Dispersion

Lidia C. Diblasi

76

Promedios de edad al ingreso de los estudiantes de Ciencias Políticas y Sociales

Carreras

Trabajo SocialComunic. SocialCiencia PolíticaSociología

Eda

d pr

omed

io a

l ing

reso

23

22

21

20

19

18

Fuente: elaboración propia con los datos obtenidos de una encuesta realizada para el

proyecto de investigación sobre los “Perfil de los alumnos ingresantes a la Fac….” Dir.

Diblasi, Lidia y colaboradores, SeCTyP, UNCuyo, 2007 – 2009.

La mediana: la mediana (Me) es el valor de la variable que divide el conjunto total

de valores, ordenados en forma creciente o decreciente, en dos partes

numéricamente iguales.

Dada una variable discreta y un número de unidades de análisis pequeño, la

mediana se calcula de la siguiente forma:

1- Se ordenan los valores de la variable estudiada correspondientes a cada una

de las unidades de análisis de menor a mayor (o viceversa) y se determina por

simple recuento el valor central que divide al conjunto total en dos partes

numéricamente iguales.

2- Si el número total es impar, la mediana es el valor central. Si el número total de

unidades es par, la mediana resulta de calcular la media aritmética de los dos

valores centrales.

Veamos un ejemplo:

Page 12: Medidas de Posicion y Dispersion

Lidia C. Diblasi

77

Si tenemos un conjunto de valores y los hemos ordenado:

Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29

El valor 11 es el que representa el centro de la distribución, dejando la misma

cantidad de valores menores y mayores que él.

Me = 11

Si ese conjunto de valores es par y no impar como el caso anterior debemos

buscar los dos valores centrales, sumarlos y dividirlos por 2 para obtener la

mediana

Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30

Me = 2

1511+ Me = 13

Cuando la variable está ordenada con frecuencias podemos obtener la Mediana

buscando en la frecuencia acumulada aquella que contenga la mitad de los casos

y ver a qué valor representa, ése será el valor de la mediana:

Veamos un ejemplo:

Si usamos los datos de la nota de los parciales que vimos anteriormente al

calcular la media, calculamos las frecuencia acumuladas (Fa), podemos observar

que de los 20 casos la mitad, 10, corresponde al valor 7. Ello significa que el valor

siete, con la serie ordenada es el que deja la misma cantidad de notas menores y

mayores que él.

Me = 7

xi fi Fa 2 1 1 4 1 2 5 1 3 6 3 6 7 4 10 8 5 15 9 4 19 10 1 20

Page 13: Medidas de Posicion y Dispersion

Lidia C. Diblasi

78

Cuando una variable ya sea discreta, o continua, está ordenada en forma de

intervalos de clase, la mediana se obtiene con la siguiente fórmula:

N/2 – Fa

Me = Li + __________ . ω fi

Donde:

Li: es el límite inferior del intervalo de clase que en frecuencia acumulada contiene

la mitad de las unidades de análisis.

Fa: es la frecuencia acumulada hasta el intervalo anterior a la frecuencia

acumulada que contiene la mitad de los valores.

fi: es la frecuencia absoluta correspondiente al intervalo que en frecuencia acumulada

contiene la mitad de las unidades de análisis.

ω: es el tamaño del intervalo de clase que en frecuencia acumulada contiene la mitad

de las unidades de análisis.

Veamos un ejemplo:

Intervalo xi fi Fa

15 - 19 17 8 8 20 - 24 22 9 17 25 - 29 27 11 28 30 - 34 32 8 36 35 - 39 37 6 42 40 - 44 42 4 46 45 - 49 47 2 48 50 - 54 52 2 50

Podemos observar en la tabla de datos agrupados que la mitad de los casos se

encuentra contenida en la frecuencia acumulada 28 (50/2 = 25), lo que nos está

indicando que en el intervalo de 25 a 29 años se encuentra la mediana, la cual

vamos a calcular siguiendo la fórmula.

25 – 17 Me = 25 + __________. 5

11

Page 14: Medidas de Posicion y Dispersion

Lidia C. Diblasi

79

Me = 25 + 3,64

Me = 28,64 Podemos decir que la edad mediana de las mujeres al contraer matrimonio es de

28,64 años. Esta edad divide a la distribución en dos partes iguales. El 50% de las

mujeres tiene menos de 28,64 años y el 50% tiene más de esa edad.

Comparación de la media aritmética y la mediana: Hay varias diferencias entre ellas:

1- La media aritmética utiliza más información que la mediana, ya que usa todos

los datos, mientras que la mediana solo toma la marca del o de los casos

medios. Si los valores superiores o inferiores a la mediana fueran marcas muy

elevadas o muy bajas (valores extremos), la mediana permanecería inalterable,

mientras que la media aumentaría o disminuiría considerablemente. Por lo

tanto, podemos decir que: la media resulta afectada por cambios de los valores

extremos, en tanto que la mediana permanece inalterada, a menos que cambie

el valor del caso medio.

2- La media es por lo regular una medida más estable que la mediana, en cuanto

varía menos de una muestra a otra. En la Estadística inductiva, el investigador

tendrá interés en generalizar acerca de la población, partiendo de una muestra.

Si bien, no puede tomar todas las muestras posibles de una población, es

importante que sepa, que las medias de las muestras variarán menos de una a

otra que las medianas.

3- Como la media se ve afectada por los valores extremos, el empleo de la

mediana es menos equívoco cuando estamos en presencia de una distribución

fuertemente asimétrica, o sea, siempre que haya más casos extremos en una

dirección que en otra. La media siempre se verá “empujada” en dirección a la

Page 15: Medidas de Posicion y Dispersion

Lidia C. Diblasi

80

asimetría, o sea, hacia una cola. Si la distribución es fuertemente simétrica,

media y mediana coincidirán. (Ver los gráficos de distribución al final del

capítulo)

Modo o moda: se denomina modo o moda al valor de la variable que más se

repite, el más común, el que se corresponde con la máxima frecuencia.

Dada una variable y un número de unidades de análisis pequeño, el modo se

encuentra directamente aplicando su definición.

Veamos un ejemplo

Xi: 1; 1; 5; 7; 7; 7; 8; 9; 9; 10

Mo = 7 Siete es el valor más común o más repetido de ésta serie de datos.

Cuando tenemos una serie de datos como la de las notas de un grupo de alumnos

en un examen parcial, la moda es siguiendo su definición el valor “más común”

xi fi 2 1 4 1 5 1 6 3 7 4 8 5 9 4 10 1

Mo = 8

En el ejemplo la nota más común es 8, por lo tanto la Moda o Modo es igual a 8. Cuando los valores de la variable, discreta o continua, se presentan en forma de

intervalos de clase, el modo se obtiene por interpolación utilizando la siguiente

fórmula:

∆1

Mo = Li + __________ . ω

∆1 + ∆2

Page 16: Medidas de Posicion y Dispersion

Lidia C. Diblasi

81

Donde:

Li: es el límite del intervalo de clase modal (es decir, del intervalo que cuenta con

la mayor frecuencia)

∆∆∆∆1: es la diferencia entre la frecuencia modal y la frecuencia anterior.

∆∆∆∆2: es la diferencia entre la frecuencia modal y la frecuencia posterior.

ω: es el tamaño del intervalo de clase modal.

Veamos el ejemplo usado para la media y la mediana: la edad en contraer

matrimonio de un grupo de mujeres.

Intervalo xi fi 15 - 19 17 8 20 - 24 22 9 25 - 29 27 11 30 - 34 32 8 35 - 39 37 6 40 - 44 42 4 45 - 49 47 2 50 - 54 52 2

La mayor frecuencia se encuentra en el intervalo 25 a 29 años, lo que significa que

en él encontraremos a la Moda. Sigamos la fórmula:

∆1 = 11-9

∆2 = 11-8

2

Mo = 25 + __________ . 5 2 + 3

Mo = 25 + 2 Mo = 27 En éste grupo la edad de las mujeres más común, al contraer matrimonio, de es

27 años

Page 17: Medidas de Posicion y Dispersion

Lidia C. Diblasi

82

En el ejemplo que hemos seguido para calcular la Media, la Mediana

y el Modo obtuvimos valores medios semejantes, ya que todos se ubican en el

intervalo de clase de 25 a 29 años ( x = 29,5; Me = 28,64; Mo = 27), lo cual nos

está diciendo que la distribución de la variable que estudiamos tiene una

distribución simétrica. Pero al no ser iguales las medidas de tendencia central

quiere decir que no hay una perfecta simetría, si no que hay una leve asimetría, en

éste caso, hacia la derecha y eso nos lo demuestra la media, que tiene el valor

más alto de las tres medidas y es la que se ve empujada por los valores extremos

Edad de un grupo de mujeres al contraer matrimonio, Mendoza, 2005

Me = 28.5 25%-75%

Var110

15

20

25

30

35

40

45

50

55

60

En el gráfico podemos observar la asimetría de la distribución ya que la caja

no se encuentra en el centro del recorrido de la variable. La patilla superior es

más larga que la inferior a la caja. La media (29.5) se ha alejado de la mediana

(28.6) por los valores más elevados (52 y 54) que marcan el alargamiento de la

variable hacia arriba del gráfico. El Mo (27) se encuentra en la caja debajo de la

mediana ya que el valor más común es 27, menor a la media y la mediana.

Page 18: Medidas de Posicion y Dispersion

Lidia C. Diblasi

83

MEDIA, MEDIANA Y MODA: ¿CUÁL MEDIDA ELEGIR?

“La moda es aplicable para cada una de las cuatro escalas de medición. Sólo la

moda tiene significado para variables categóricas como afiliación política, afiliación

religiosa, especialidad académica u ocupación. Sin embargo, para fines

inferenciales, la moda tiene una desventaja distintiva: la moda de una muestra no

es una estimación muy confiable de su moda de población a menos que el tamaño

de la muestra aleatoria sea extremadamente grande. La confiabilidad en

estadística representa la precisión con la cual la estadística estima el parámetro

de población correspondiente. Establecido de forma diferente, hay un gran error

de muestreo asociado con la moda de la muestra; el error de muestreo es la

diferencia entre el estadígrafo de la muestra y el parámetro de población

correspondiente. La mediana de la muestra es más confiable (es decir, tiene un

error de muestreo menor) que la moda de la muestra; la media de la muestra

tiene un error de muestreo menor que la moda o la mediana, lo cual es una razón

del porqué tiende a ser preferida para fines inferenciales” (Hopkins, K; Hopkins,B;

Glass, G. 1997; 44)

MEDIDAS DE POSICION

A semejanza de la Mediana que divide a la distribución de una variable en

dos partes iguales, los cuantiles son medidas de posición o localización porque

dividen a la distribución en partes iguales. Los más usados son los cuartiles: la

dividen en cuatro; los deciles, en diez y los percentiles en cien partes iguales.

Cuartiles: son valores de la variable que dividen al conjunto ordenado de datos

en cuatro partes que contienen la misma cantidad de casos.

El cuartil primero (Q1) es el valor de la variable que divide al conjunto ordenado de

valores en dos partes, dejando un 25% de valores menores que él y un 75% de

valores mayores.

Page 19: Medidas de Posicion y Dispersion

Lidia C. Diblasi

84

El cuartil segundo (Q2) es el valor de la variable que divide el conjunto ordenado

de valores en dos partes, dejando un 50% de los valores menores que aquel valor,

y un 50% de valores mayores que él. Por lo tanto, Q2 = Me.

El cuartil tercero (Q3) es el valor de la variable que divide el conjunto ordenado de

valores en dos partes, dejando un 75% de valores menores que él y un 25% de

valores, mayores.

Cómo calcularlo: se ordenan los valores correspondientes a todas las unidades de

análisis de menor a mayor (o viceversa) y se determina por simple recuento el

valor que divide al conjunto total en dos partes, de manera que:

� Para definir Q1 quede comprendida la cuarta parte de los valores menores.

� Para definir Q2 quede comprendida la mitad de los valores menores.

� Para definir Q3 queden comprendidas las tres cuartas partes de los valores

menores.

Veamos un ejemplo: Usemos el mismo ejemplo que para calcular la Mediana.

Si tenemos 12 datos y debemos dividirlos en cuatro partes iguales: 12/4 = 3 lo

que significa que para el primer cuarto (25 %) quedan los tres valores más

pequeños en el primer cuarto y nueve en el 75 % restante: por lo que el primer

cuartil se encuentra entre los valores 7 y 8:

Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30

Q1=7,5

Para el segundo cuartil (50 %) quedan seis datos más pequeños y seis más

grandes que el Q2 que es igual o coincide con la Me.

Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30

Q2 = 13 = Me

Y en el tercer cuartil quedan nueve datos menores a él y tres mayores:

Page 20: Medidas de Posicion y Dispersion

Lidia C. Diblasi

85

Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30

Q3 = 24

Si los datos representan la edad de un conjunto de personas, podemos resumir

diciendo que el 25 % de la distribución tiene hasta 7,5 años; que el 50% tiene

hasta 13 años y que el 75 % tienen hasta 24años.

Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30

↓ ↓ ↓

Q1=7,5 Q2 = 13 Q3 = 24

Si tenemos una serie de datos ordenados con su correspondiente frecuencia,

procedemos de la misma forma que para la mediana, calculando las frecuencias

acumuladas y buscando en ellas el valor que contiene al 25; 50 y 75 % de los

casos.

Veamos un ejemplo: Usamos el ejemplo de las notas en un parcial de alumnos. Tenemos 20 notas por

lo tanto si las dividimos en cuatro partes iguales, cada parte va a contener 5

valores numéricos o cinco notas: 20/4 = 5

El primer 25% = 5 lo buscamos en la primer frecuencia acumulada que lo

contenga; igual para el 50% y para el 75%

xi fi Fa 2 1 1 4 1 2 5 1 3 6 3 6 Q1 7 4 10 Q2 y Me 8 5 15 Q3 9 4 19 10 1 20

Page 21: Medidas de Posicion y Dispersion

Lidia C. Diblasi

86

La frecuencia acumulada seis contiene a las 5 primeras notas por lo que el Q1 es igual

al valor de la variable 6, que en éste caso coincide con el valor de la frecuencia

acumulada

Q1= 6 el 25 % de las notas más bajas de los parciales fue de hasta 6 puntos. La frecuencias acumulada diez contiene al 50 % de los casos, por lo que el valor del

Q2 = 7 El 50% de los alumnos obtuvo una nota de hasta 7 puntos.

Y por último el 75 % se encuentra en la frecuencia acumulada 15 que corresponde

al valor de la variable 8, por lo que podemos decir que

Q3 = 8 El 75% de los alumnos obtuvo una nota de hasta 8 puntos.

Trabajando con datos agrupados Si tenemos una variable, discreta o continua, donde los valores de la variable se

presentan en forma de intervalos de clase, los cuartiles se obtienen por

interpolación utilizando la siguiente fórmula:

i. N/4 – Fa

Qi = Li + __________ . w fi Donde:

Qi: indica el cuartil en estudio.

Fa: es la frecuencia acumulada hasta el intervalo anterior al que en frecuencia

acumulada contiene la i-ésima parte de las unidades de análisis.

fi: es la frecuencia absoluta correspondiente al intervalo que en frecuencia

acumulada contiene la i-ésima parte de las unidades de análisis.

w: es el tamaño del intervalo de clase que en frecuencia acumulada contiene la

i-ésima parte de las unidades de análisis.

Veamos un ejemplo

Seguimos con el ejemplo que usamos con las medidas de tendencia central: edad

al casarse un grupo de mujeres.

Si observamos la fórmula vemos que lo primero que tenemos que hacer es

localizar el intervalo donde se encuentra el cuartil, si calculamos el 1º :

Page 22: Medidas de Posicion y Dispersion

Lidia C. Diblasi

87

N/4*1= 50/4 = 12,5

Si buscamos en la frecuencia acumulada la que contienen al valor 12,5 en

ese intervalo de clase se ha de encontrar el primer cuartil o el primer cuarto de la

distribución.

Como 12,5 lo contiene la Fa 17 quiere decir que el intervalo e clase que lo

contiene es 20 a 24. Vamos a calcularlo:

Intervalo xi fi Fa 15 - 19 17 8 8 20 - 24 22 9 17 25 - 29 27 11 28 30 - 34 32 8 36 35 - 39 37 6 42 40 - 44 42 4 46 45 - 49 47 2 48 50 - 54 52 2 50

Qi = 20 + 9

85,12 − . 5

Qi = 20 + 2,5

Qi = 22,5 El 25 % de las mujeres tienen al momento de contraer

matrimonio hasta 22,5 años.

El gráfico de cajas nos da una visión de conjunto de la variable en estudio

ya que nos informa sobre las medidas de tendencia central, posición, dispersión y

forma de la distribución. Nos indica el lugar de la mediana, del primer cuartil o

25% de la distribución, del tercer cuartil o 75% de la distribución; del rango (valor

menor y valor mayor del recorrido) y la simetría o asimetría de la variable según la

caja se encuentre en el centro del recorrido (simétrica) o asimetría, cuando la caja

se “corre” hacia uno o el otro extremo de la variable.

Page 23: Medidas de Posicion y Dispersion

Lidia C. Diblasi

88

Veamos el gráfico de caja resultante de nuestro ejemplo de la edad de las

mujeres al contraer matrimonio.

Me = 28.5 25%-75%= (22, 35)

Rango = (15, 54)Edad

10

15

20

25

30

35

40

45

50

55

60

Deciles: por extensión de la idea de mediana es posible pensar en aquellos

valores que dividen al conjunto total en diez partes iguales.

Su definición y forma de cálculo son similares a los cuartiles.

i. N/10 – Fa

Di = Li + __________ . ω fi Por ejemplo para calcular el decil 4, debemos hacer N/10*4 = 20. Este valor se

encuentra contenido en la Fa = 28 que corresponde al intervalo 25-29

20 – 17

D4 = 25 + __________ . 5 11

Page 24: Medidas de Posicion y Dispersion

Lidia C. Diblasi

89

D4 = 25 + 1,36 D4 = 26,36 El 40% de las mujeres tiene hasta algo más de 26 años. Percentiles: de manera similar a los cuartiles y deciles es posible calcular valores

que dividan al conjunto total en cien partes. Su definición y forma de cálculo son

similares a los deciles.

Veamos un ejemplo:

Calculamos el percentil 65 que es aquel valor que deja por debajo suyo al 65% de

los datos que son menores e iguales que él y, por encima, al 35% de los valores

mayores que el percentil 65. Seguimos con los mismos datos de las mujeres:

i. N/100 – Fa

Pi = Li + __________ . ω fi 50/100*65 – 28

P65 = 30 + __________ . 5 8

50/100*65 – 28

P65 = 30 + __________ . 5 8

P65 = 30 + 2,81

P65 = 32,81 El 65 % de las mujeres tiene aproximadamente hasta 33 años

al contraer matrimonio.

MEDIDAS DE DISPERSION

Si estamos interesados en comparar medidas de tendencia central,

necesitamos saber algo acerca de cómo están dispersos o concentrados los

Page 25: Medidas de Posicion y Dispersion

Lidia C. Diblasi

90

valores en los grupos estudiados. Una medida de tendencia central sola no

proporciona generalmente una descripción satisfactoria de un conjunto de datos.

Es importante tener una medida de la forma en que los valores individuales

se desvían del promedio. A esta clase de medidas se las conoce como medidas

de variabilidad. El concepto de variabilidad tiene como sinónimo al de dispersión.

Si queremos dar una definición podemos decir que: las medidas de

dispersión son parámetros que miden la forma en la cual los valores tienden a

extenderse alrededor de un valor de tendencia central.

El rango: la medida más simple de variabilidad es el rango, que es la diferencia

entre el valor máximo y el mínimo de un conjunto de datos.

Tiene un valor limitado ya que solamente toma en cuenta los valores

extremos de un conjunto de datos y no da ningún indicio sobre la forma como

varían los valores en el interior del intervalo.

Como vimos en los capítulos anteriores, se calcula restando al valor mayor

de la variable el valor menor.

Veamos un ejemplo:

El rango de la variable “edad de las mujeres al contraer matrimonio”, donde el

valor más pequeño es 15 años y el más elevado es de 54 años es:

R = v. máximo – v. mínimo

R = 54 – 15

R = 39 El rango de la variable edad de las mujeres al contraer

matrimonio es 39

La varianza: es el promedio de las desviaciones elevadas al cuadrado, con

respecto de la media del conjunto de datos. Se obtiene restando a cada uno de los

valores de la variable la media del conjunto de datos, elevando al cuadrado cada

una de las diferencias resultantes sumándolas y dividiendo este resultado por el

número total de valores. Elevamos al cuadrado los desvíos de cada valor de la

variable respecto a la media para evitar que se anulen los datos ya que, como

vimos en las propiedades de la media, si sumamos los desvío nos da cero (0).

Page 26: Medidas de Posicion y Dispersion

Lidia C. Diblasi

91

Si reunimos esto en una fórmula tenemos:

N

Σ (xi – x )2 σ2= i=1 ______ N

Cuando trabajamos con una muestra usamos la siguiente fórmula:

n

Σ (xi – x )2 s2= i=1 ______ n – 1 El denominador n – 1 nos da una medida más útil para los propósitos inferenciales

como veremos más adelante.

Cuando trabajamos con series con frecuencia las fórmulas a usar serán:

N

Σ (xi – x )2. fi σσσσ2= _ i=1 _________ cuando trabajamos con la población N

Σ fi

i=1

n

Σ (xi – x )2. fi s2=

i=1 _ cuando trabajamos con la muestra

n

Σ fi

i=1

No vamos a dar un ejemplo de varianza ya que cuando sacamos la raíz cuadrada

de la varianza, para volver a la unidad de medida original de la variable,

obtenemos lo que conocemos con el nombre de desviación típica, con la cual sí

vamos a trabajar.

Page 27: Medidas de Posicion y Dispersion

Lidia C. Diblasi

92

La desviación típica o standard: es la raíz cuadrada positiva de la varianza se

denomina desviación típica y la podemos definir como la medida de dispersión que

nos proporciona un promedio de los desvíos de la variable respecto a la media

aritmética.

Su fórmula de cálculo es:

N

Σ (xi – x )2

σσσσ = √ i=1 _________ N

N

Σ (xi – x)2. fi

σσσσ = √ i=1 _________ N

Σ fi

i=1

Propiedades de la desviación típica:

1. De todas las desviaciones típicas, la mínima es aquella que se calcula con

respecto a media aritmética.

2. Para distribuciones normales resulta que:

a) el 68,26% de los valores están comprendidos en el intervalo definido por la

media aritmética menos una vez la desviación típica y la media aritmética

más una vez la desviación típica.

b) el 95,45% de los valores están comprendidos en el intervalo definido

x – 2σ y x + 2σ .

c) el 99,73% de los valores están comprendidos en el intervalo definido

x – 3σ y x + 3σ .

Page 28: Medidas de Posicion y Dispersion

Lidia C. Diblasi

93

3. Si dos conjuntos de N1 y N2 valores respectivamente tienen varianzas σ21 y

σ22 respectivamente y la misma x, entonces la varianza combinada de

ambas está dada por:

N1σ21 + N2σ2

2 σ2 = _____________ N1 + N2

Veamos un ejemplo: Si tenemos un conjunto de datos pequeño como:

Xi : 1; 3 ; 5; 7; 9

Seguimos los siguientes pasos para calcular la desviación típica:

1- se calcula la media o promedio de la distribución

2- se obtienen los desvíos de cada valor de la variable respecto a la media

3- se elevan los desvíos al cuadrado

4- se suman todos los resultados

5- se divide la suma por la cantidad de casos, y

6- se calcula la raíz cuadrada del resultado.

σ= 5

40 = 2,83

xi xi - x (xi – x)2 1 -4 16

3 -2 4

5 0 0

7 2 4

9 4 16

∑ = 25 ∑ = 0 40

Page 29: Medidas de Posicion y Dispersion

Lidia C. Diblasi

94

σ= 2,83 Si la variable que estamos trabajando fuese edad podríamos decir

que 2,83 años es lo que se desvían las edades de este grupo respecto al

promedio: 5 años.

Cuando trabajamos con más de un grupo es muy importante acompañar la

media con la desviación típica, ya que nos permite comparar la variabilidad que

hay en cada uno de los grupo.

Veamos un ejemplo:

Los datos que tenemos a continuación corresponden a alumnos ingresantes 2008

Carrera Media Desv. Típica

Sociología 22.49 8.11 Cia. Políticay Adm. Pública 21.48 7.56 Trabajo Social 20.60 6.57 Comunicación Social 18.79 1.59

Si analizamos los resultados del cuadro, podemos observar que, si bien los

promedios de edades de los alumnos al ingresar a la facultad de Ciencias Políticas

y Sociales, de la UNCuyo, no son muy diferentes, sin embargo las desviaciones

típicas si lo son. Las edades de los alumnos de Sociología están mucho más

dispersas respecto a la media que la de las otras carreras. En el otro extremo la

carrera de Comunicación Social es la más homogénea, en cuanto a las edades,

que cualquier otra carrera, ya que su dispersión es muy pequeña y no parece

haber valores extremos. En cambio Sociología tiene valores muy extremos que

“empujan” la media hacia las edades mayores y por eso su dispersión es muy

grande.

Como tenemos los datos sin agrupar y dispuestos en una serie simple

hemos usado, para el cálculo del desvío, la fórmula “serie simple”, sin frecuencia.

Cuando trabajamos con una “serie con frecuencia” o “datos agrupados” en

clases usamos la fórmula siguiente:

Page 30: Medidas de Posicion y Dispersion

Lidia C. Diblasi

95

N

Σ (xi – x )2. fi

σσσσ = √ i=1 _________ N

Σ fi

i=1

Vamos a calcular el desvío típico siguiendo con el ejemplo de la edad de las

mujeres al casarse.

Recordemos que los pasos que tenemos que seguir son:

1- Calcular los desvíos: restar la media a cada valor de la variable o punto

medio de cada intervalo de clase.

2- Elevar los desvío al cuadrado

3- Multiplicarlos por la frecuencia correspondiente a cada valor de la variable o

a cada clase

4- Sumar el resultado de las multiplicaciones,

5- Dividir el resultado de la suma por el total de las frecuencias

6- Sacar la raíz cuadrada.

Intervalo xi fi (xi - X) (xi - X)² (xi - X)² *fi 15 - 19 17 8 -12.5 156.25 1250 20 - 24 22 9 -7.5 56.25 506.25 25 - 29 27 11 -2.5 6.25 68.75 30 - 34 32 8 2.5 6.25 50 35 - 39 37 6 7.5 56.25 337.5 40 - 44 42 4 12.5 156.25 625 45 - 49 47 2 17.5 306.25 612.5 50 - 54 52 2 22.5 506.25 1012.5

Siguiendo la fórmula, calculamos σ² y σ (la x de este grupo es 29,5 años)

σ² = 4462.25

50

σσσσ² = 89.25

Page 31: Medidas de Posicion y Dispersion

Lidia C. Diblasi

96

σ = 25,89 σσσσ = 9.44 En promedio las edades de las mujeres al casarse se dispersa de

la media en 9,44 años.

Coeficiente de variación: es una medida de dispersión relativa. Generalmente se

da en porcentaje y nos dice que porcentaje de la media aritmética es un desvío

tipo.

σ

CV = ___ x

Observaciones para su uso:

1. Solo se puede utilizar con escalas de razón.

2. No tiene sentido cuando la media es cero.

Veamos el ejemplo de los promedios de edad de los alumnos ingresantes a la

facultad de Ciencias Políticas y Sociales de la UNCuyo en el año 2008,

Carrera Media Desv. Típica

Sociología 22.49 8.11 Cia. Políticay Adm. Pública 21.48 7.56 Trabajo Social 20.60 6.57 Comunicación Social 18.79 1.59

Vamos a calcular los coeficientes de variación para las cuatro carreras: σ 8.11 CV (Sociología) = ___ = ____ = 0.36 36% x 22.49

Page 32: Medidas de Posicion y Dispersion

Lidia C. Diblasi

97

σ 7.56 CV (Cia. Política) = ___ = ____ = 0.35 35% x 21.48 σ 6.57 CV (Trabajo Social) = ___ = ____ = 0.32 32% x 20.60 σ 1.59 CV (Comun. Social) = ___ = ____ = 0.085 8.5% x 18.79

Si bien ya habíamos visto la diferencia en la carrera de Comunicación

Social cuando analizamos las desviaciones típicas de las cuatro carreras, con el

Coeficiente de Variación se puede apreciar muy bien las diferencias entre las otras

tres carreras y la de Comunicación. Es indudable que el grupo de alumnos que

ingresó a ésta carrera en el año 2008 es muy homogéneo en cuanto a la edad.

Mientras que en las otras carreras la variabilidad es muy semejante. Ello significa

que las distribuciones son sesgadas a la derecha porque poseen ingresantes con

edades bastante mayores a la moda que es 18 a 19 años, edad en que

generalmente se concluyen los niveles medios de educación.

Medidas de las formas de la distribución

Repasemos nuevamente las formas de las distribuciones que ya vimos en

el capítulo I teniendo ahora eb cuenta las medidas de Tendencia Central ylas de

dispersión. Estas formas de la distribución hacen referencia a cómo están

distribuidos los valores de una variable a lo largo de su recorrido dando diversas

formas a la curva de frecuencias. Se las conoce con el nombre de asimetría o

sesgo, a unas y curtosis, a las otras.

Page 33: Medidas de Posicion y Dispersion

Lidia C. Diblasi

98

Asimetría o sesgo: Si la curva de frecuencias tiene una cola más larga que la

otra, se dice que la distribución es asimétrica o sesgada. Una distribución

simétrica es aquella donde los valores están distribuidos por igual a ambos lados

de la media. En cambio si la distribución tiene una cola más larga hacia la

derecha, es porque hay valores extremos elevados muy alejados a la media.

Supongamos que estamos en un cumpleaños de un niño que cumple 8 años,

están todos sus amigos, compañeros de escuela que tienen aproximadamente la

misma edad, pero también están sus padres y dos abuelos. Imaginemos que hay

20 niños entre 7 y 9 años, sus padres de 32 años y sus abuelos de 64 y 65 años.

Estamos en presencia de una distribución asimétrica positiva. La moda y

la mediana estarán entre los siete y nueve años. La media, en cambio, se corre

hacia el lado de los valores más elevados y se aproxima a los quince años. En

este caso la distribución es asimétrica positiva.

Si la curva tiene la cola de la izquierda más larga es porque hay valores

extremos más pequeños que la media, estamos en presencia de una asimetría

negativa. Pensemos por ejemplo, en el caso del cumpleaños de la abuela, 65

años, que está rodeada de sus amigas y llega una hija (35 años) con sus dos

pequeños nietos (2 y 7 años). La media se corre hacia la izquierda del centro por

estos valores extremos

Cuando el coeficiente de sesgo o asimetría es igual a cero, la distribución

es simétrica. Cuando la distribución es asimétrica positiva, su valor es mayor que

cero, y si es asimétrica negativa su valor es menor que cero.

Un valor superior a 0.8 (positivo o negativo) indica que la asimetría de la

variable es importante. (Cea D`Ancona, M.A. 2001; 330);

Page 34: Medidas de Posicion y Dispersion

Lidia C. Diblasi

99

Curtosis: Se refiere a las distribuciones simétricas y nos informa sobre la mayor o

menor concentración de valores alrededor de la media. Si los valores están muy

concentrados, la distribución será puntiaguda, respecto a la normal, es una

distribución leptocúrtica, como vimos en el capítulo I y ello significa que la media

es una medida muy representativa del conjunto de datos

Si los valores están muy dispersos respecto de la media, la distribución es

platocúrtica y la media no es una medida representativa del conjunto de los

valores.

Si los valores están distribuidos alrededor de la media, sin una gran

dispersión la curva será mesocúrtica, en éste caso la media es representativa del

grupo.

Cuando el coeficiente de curtosis es igual a cero, la distribución es

mesocúrtica. Cuando es mayor la curva es leptocúrtica y cuando es menor es

platocúrtica.

Page 35: Medidas de Posicion y Dispersion

Lidia C. Diblasi

100

Ejercicios propuestos 1- Con los datos que tiene a continuación que representan la cantidad de horas

de estudio mensuales de los alumnos que ingresan a la universidad, calcular: a- media b- desviación típica. y c- decil 70 Interpretar los resultados

Horas estudio

Fi

5 - 9 15 10 - 14 18 15 - 19 9 20 - 24 5 25 - 29 2

2- Con los datos que tiene a continuación que representan el crecimiento anual

de un grupo de niños de una determinada edad, calcular: a- Cuartil tres , b- Media y c - desviación típica.

Crecimiento en cm.

fi

3 - 4 5 5 - 6 8 7 - 8 10 9 - 10 15

11 - 12 12

Interpretar los resultados

3- En los siguientes casos: Dónde ubicaría la media aritmética, la mediana y el modo y qué tipo de asimetría tendrían estas distribuciones?.

a- Media = 0,20 Mediana = 0,80 y el Modo = 0,90 b- Media = 16; Mediana = 16,80 y Modo = 19,20 c- Media = 23,5 Mediana = 23,8 y Modo = 23,8

Dibújelas

Page 36: Medidas de Posicion y Dispersion

Lidia C. Diblasi

101

4- Un centro de juegos electrónicos del Gran Mendoza quiere estudiar la edad de los asistentes por día:

Edad

cantidad de personas

7 – 8 4 9 - 10 8 11 - 12 12

13 - 14 18 15 - 16 13

a- Calcular: a- Cuartil 1; b- Mediana, c- Percentil 75 b- Realice un gráfico de caja c- Interprete todos los resultados y diga cuáles son los límites del 50 % central de

la distribución . 5Los siguientes datos representan a tres grupos distintos de amigos cuyas edades son: Grupo I 24 – 23– 12 –19 - 29 – 20 - 23 Grupo II 34 – 33– 22 –19 - 19 – 20 - 23

Grupo III 42 – 34 –27 –37 – 32 – 34 -37

a- Calcule Media aritmética, Modo, Mediana y Desviación Típica b- Analice las diferencias entre ambos grupos usando el Coeficiente de Variación. c- Realice un diagrama de tallos y hojas para cada grupo. d- Qué comentarios puede hacer de los grupos con toda la información obtenida.

6- Con los datos que tiene a continuación que representan el peso de los niños al

nacer registrados durante un mes en un hospital público:, a- Calcular: a- media aritmética, b- mediana, c- Modo y d- Desviación típica b- Diga solamente cómo calcularía el 40 % central de esta distribución. c- Realice un gráfico apropiado. d- Haga alguna lectura interpretativa del gráfico.

Page 37: Medidas de Posicion y Dispersion

Lidia C. Diblasi

102

Peso en kg

Fi

0,000 – 0,800 8 0,800 - 1,600 22

1,600 – 2,400 9 2,400 – 3,200 6

3,200 – 4,000 4,000 - 4,800

4 1

7- Con los datos que tiene a continuación que representan los kilogramos

mensuales de pan consumidos por un grupo de familias calcular: a) Media, Mediana, Modo y Desviación típica. b) Explique solamente cómo calcularía el 60 % central de esta distribución.

Kg. Fi 5 - 9 2

10 - 14 7 15 - 19 15 20 - 24 16 25 - 29 6

9- En la siguiente serie que representa la cantidad de integrantes por familia de una comunidad barrial del Gran Mendoza, Calcular: a- dos cuartiles, b- dos deciles y c- dos percentiles Integrantes por flias. cantidad de flias.

1 5 2 12 3 19 4 38 5 45 6 27 7 12 8 4 9 1

10 3 10- Dos vendedores de un mismo producto tienen el siguiente promedio de venta:

Vendedor A: 800 productos mensuales con un desvío de 50. Vendedor B: 1.000 mensuales con un desvío de 150 ¿Cuál de los dos vendedores parece más constante en las ventas? ¿Porqué?

11- Si un grupo de estudiantes tiene un promedio de 6 puntos en un parcial con una desviación de 0.25 puntos, y otro grupo tiene un promedio de 7.5 puntos

Page 38: Medidas de Posicion y Dispersion

Lidia C. Diblasi

103

con una desviación de 0.25 puntos, ¿qué grupo de estudiantes tiene menor variabilidad? ¿Porqué?

12- En una unidad académica, hay mensualmente en promedio 20 docente con

licencias por distintos motivos, con un desvío de 3 docentes. En otra unidad académica, el promedio es de 12 docentes con un desvío de 6. ¿Qué grupo es más heterogéneo en sus ausencias? ¿Porqué

Page 39: Medidas de Posicion y Dispersion

Lidia C. Diblasi

104

Bibliografía consultada:

Ambrosi, Hugo Oscar, “La verdad de las Estadísticas. Aprender con los datos”

Lumiere, Buenos. Aires, 2008

Bancroft, Huldah, "Introducción a la Bioestadística", EUDEBA

Baranger, Denis, “Construcción y análisis de datos” Ed. Universitaria, UNM,

Posadas, 1999

Blanch, Nidia y Joekes, Silvia: “Estadística Aplicada a la Investigación” Nódulos 3

y 4- Curso de posgrado; Fac. de Ciencias económicas, Universidad Nacional de

Córdoba, 1994

Box, G.E.P.; Hunter, William; Stuart Hunter, J. “Estadística para investigadores.

Introducción al diseño de experimentos, análisis de datos y construcción de

modelos” Ed. Reverté, México, 2005

Cea D`Ancona, María Ángeles, “Metodología Cuantitativa. Estrategias y Técnicas

de Investigación Social” Ed. Síntesis Sociología, Madrid, 2001.

Daniel, Wayne: “Estadística con aplicaciones a las Ciencias Sociales y a la

Educación”, McGraw Hill latinoamericana, S.A. Bogotá, Colombia. 1981

García Ferrando, Manuel: Socioestadística. “Introducción a la estadística en

sociología”, Alianza Universidad Textos, Madrid, 1992

Hernandez Sampieri, R.; Fernandez Collado, C.; Baptista Lucio, P. “Metodología

de la Investigación” Mc Graw Hill, Colombia 1994

Hopkins, kenneth; Hopkins, B.R.; Glass, Gene: “Estadística básica para las

Ciencias Sociales y del Comportamiento” Prentice-Hall Hispanoamérica, S.A.,

México, 1997

Spiegel, Murray, " Estadística", Serie de Compendios Shaum, McGraw Hill

Interamericana de México S.A.,1994

Instituto Nacional de Estadísticas y Censos, Encuesta Permanente de Hogares,

Ministerio de Economía, Gran Buenos Aires Octubre de

1997.

Diblasi, Lidia y Romagnoli, Ricardo, "Medidas de tendencia central y de variación",

1991.Apuntes de cátedras. Mimeo.