Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia...

24
Colegio Ecológico Paine Profesora Marcia Garrido Vargas Departamento de Matemática Tercer año Medio Módulo de Aprendizaje de Estadística Descriptiva Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar e interpretar el valor de los indicadores de tendencia central en un conjunto de datos no agrupados y agrupados. I. Medidas Estadísticas Descriptivas Si queremos resumir la información de la muestra para poder analizarlos con más precisión y describir el comportamiento de estos valores en torno a un valor más específico, con el fin de lograr una comparación precisa de lo que se puede conseguir con tablas y gráficos, se deberá calcular una serie de datos mediante expresiones llamadas MEDIDAS ESTADÍSTICAS DESCRIPTIVAS. Es decir, Cuando se calculen estos valores a partir de una población se llaman PARÁMETROS y suelen estar representados con letras griegas (por ejemplo μ y σ), en cambio si es a partir de una muestra se llaman ESTADÍSTICOS y son representados por letras de nuestro alfabeto (por ejemplo, x ó s). Estas medidas estadísticas descriptivas se clasifican en: a. Medidas de Tendencia Central: Sirven para determinar los valores centrales o medios de la distribución. b. Medidas de Dispersión: Indican la variabilidad de los datos. c. Medidas de Localización: Indican el lugar donde se ubica un valor de la variable dentro de un conjunto ordenado de valores. Cada una de estas medidas poseen indicadores descriptivos, que permiten calcularlas con precisión los cuales trataremos con detalle más adelante. Pero, ¿De qué tipo deben ser estos valores a calcular? Como puedes intuir el tipo de variable que utilizaremos para realizar los cálculos de estas medidas debe ser cuantitativa, pues la cualitativa no permite realizar operaciones aritméticas. ¿Qué consideraciones debemos tener en cuenta en el procedimiento y resultado de una medida estadística descriptiva? Se deben tomar las siguientes consideraciones: 1. Utilizar todas las observaciones, de manera que si varía alguna observación, la medida considerada debe reflejar esta variación. Las medidas estadísticas descriptivas corresponden a valores numéricos calculados a partir de una muestra de una población en estudio que resumen la información contenida en ella.

Transcript of Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia...

Page 1: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

Colegio Ecológico Paine Profesora Marcia Garrido Vargas Departamento de Matemática Tercer año Medio

Módulo de Aprendizaje de Estadística Descriptiva

Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de

Moda, Mediana y Media Aritmética. Determinar e interpretar el valor de los

indicadores de tendencia central en un conjunto de datos no agrupados y agrupados.

I. Medidas Estadísticas Descriptivas

Si queremos resumir la información de la muestra para poder analizarlos con más precisión

y describir el comportamiento de estos valores en torno a un valor más específico, con el fin

de lograr una comparación precisa de lo que se puede conseguir con tablas y gráficos, se

deberá calcular una serie de datos mediante expresiones llamadas MEDIDAS

ESTADÍSTICAS DESCRIPTIVAS.

Es decir,

Cuando se calculen estos valores a partir de una población se llaman PARÁMETROS y

suelen estar representados con letras griegas (por ejemplo µ y σ), en cambio si es a partir

de una muestra se llaman ESTADÍSTICOS y son representados por letras de nuestro

alfabeto (por ejemplo, x ó s).

Estas medidas estadísticas descriptivas se clasifican en:

a. Medidas de Tendencia Central: Sirven para determinar los valores centrales o medios

de la distribución.

b. Medidas de Dispersión: Indican la variabilidad de los datos.

c. Medidas de Localización: Indican el lugar donde se ubica un valor de la variable dentro

de un conjunto ordenado de valores.

Cada una de estas medidas poseen indicadores descriptivos, que permiten calcularlas con

precisión los cuales trataremos con detalle más adelante.

Pero,

¿De qué tipo deben ser estos valores a calcular?

Como puedes intuir el tipo de variable que utilizaremos para realizar los cálculos de estas

medidas debe ser cuantitativa, pues la cualitativa no permite realizar operaciones

aritméticas.

¿Qué consideraciones debemos tener en cuenta en el procedimiento y resultado de una

medida estadística descriptiva?

Se deben tomar las siguientes consideraciones:

1. Utilizar todas las observaciones, de manera que si varía alguna observación, la medida

considerada debe reflejar esta variación.

Las medidas estadísticas descriptivas corresponden a valores numéricos calculados a

partir de una muestra de una población en estudio que resumen la información

contenida en ella.

Page 2: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

2

2. Ser sencilla de calcular.

3. Ser interpretable de forma inmediata y sencilla.

4. Debe definirse de manera objetiva, es decir, dos ó más observadores distintos deben

llegar al mismo resultado numérico para el mismo conjunto de datos.

ACTIVIDAD Nº 1

1. En la siguiente sopa de letras encuentra 7 palabras relacionadas con la página anterior.

2. Completa las siguientes oraciones con las palabras que faltan (Pista: las palabras

encontradas en la sopa, te ayudarán a completar algunas de las oraciones).

a) Las medidas estadísticas__________________ corresponden a valores

___________________ calculados a partir de una __________________ de una población

en estudio que __________________ la información contenida en ella.

b) En las medidas descriptivas se clasifican en: ______________________ , Localización y

________________ Central.

c) Se conoce como ____________________ a la medida descriptiva obtenida de una

población, en cambio si es partir de una muestra se llama________________________.

d) Para calcular las medidas descriptivas es indispensable utilizar los

____________________ descriptivos.

Page 3: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

3

A. Medidas De Tendencia Central

Hemos observado a través de la Historia que el hombre se ha desarrollado

gracias al trabajo colaborativo con sus demás pares, con el fin de lograr

satisfacer sus necesidades, y permitir desenvolverse en sociedad. A pesar

que han transcurrido los años, aún lo seguimos observando en nuestros días:

la junta de vecinos, colegios, empresas, etc. Es decir pertenecemos a alguna

identidad o asociación que nos identifica. Sin embargo, si se quiere tratar de

satisfacer o mejorar las necesidades que existen en cada una de estas

asociaciones (mejora en los servicios básicos salud, educación, transporte ó también

aumento de sueldos, condiciones de higiene laboral, etc.), se debe

decidir en conjunto, las posibles soluciones del entorno en el que

se desarrollan. Para eso escogemos a un líder que posee las

características y necesidades de este grupo a la que forma parte,

siendo así el representante que dará a conocer las demandas de su

entidad, como por ejemplo el presidente de la junta de vecinos,

director de un colegio municipal, etc.

Esta similitud ocurre con las muestras: cuando queremos precisar la información que los

datos arrojan, necesitamos que haya un “representante” dentro de este conjunto de valores

que los caracterice, con el fin de resumir e interpretar dicha información. Para esto

necesitaremos de las medidas de tendencia central también llamadas medidas de

centralización que permiten dar una idea general de qué valor sería el más representativo

en magnitud para el conjunto de datos.

En otras palabras diremos que:

Generalmente estos valores se ubican en la parte central del conjunto de datos.

Para lograr calcular estas medidas de tendencia central necesitaremos de indicadores

descriptivos por ser útiles herramientas de cálculos que trabajan con precisión, que

utilizaremos para definir el "centro" de las observaciones o representante en un conjunto de

datos. Estos son: MODA, MEDIANA y MEDIA ARITMÉTICA.

¿Qué está de moda?

Has estudiado los distintos tipos de frecuencia, ahora nos

detendremos nuevamente en la frecuencia absoluta pero para

estudiar uno de los indicadores de tendencia central que se

denomina MODA.

Observa los siguientes datos obtenidos de ocho personas que lanzaron 10 veces un balón de

básquetbol y se contabilizó las veces que encestaron:

2, 3, 3, 4, 4, 4, 5, 5

Las Medidas de Tendencia Central corresponden a los valores que caracterizan a una

muestra e indican la tendencia de los datos a concentrarse en torno a un valor central.

Sabes que…

Generalmente usas el concepto

MODA con el significado de

uso, modo o costumbre que está

en boga durante algún tiempo, o

en determinado país, con

especialidad en los trajes, telas y

adornos, principalmente los

recién introducidos.

Page 4: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

4

¿Cuál de los valores tiene mayor frecuencia absoluta?

Es rápido y fácil responder: el valor que tiene mayor frecuencia absoluta es el 4, pues hubo

tres personas que encestaron cuatro veces. De esta manera podemos decir que la MODA de

esta muestra es 4.

Definamos…

Pero, ¿qué sucede si hay dos o más valores que tengan la mayor frecuencia?

Hablaremos de una distribución BIMODAL de los datos cuando encontremos dos modas,

es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución

TRIMODAL de los datos es en la que encontramos tres modas. También podemos hablar

de distribución MULTIMODAL cuando se encuentran dos o más modas.

Ejemplo:

Se realizó el mismo experimento del lanzamiento del balón de básquetbol, pero esta vez

con 13 personas. Los resultados fueron:

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9

En éste caso tenemos tres valores que tienen la frecuencia mayor, por lo tanto:

Mo= 1, 5, 9

Y si todos los valores tienen la misma frecuencia ¿cuál es la moda?

Si TODOS los valores tienen la misma frecuencia diremos que no hay moda.

Por ejemplo:

Ocho personas realizaron el experimento aleatorio de lanzar un balón de básquetbol en diez

oportunidades y contar las veces que encestaban los resultados fueron:

2, 2, 3, 3, 6, 6, 9, 9

Como ves los cuatro valores de la variable tienen la misma frecuencia por lo tanto diremos

que esta colección de datos no tiene moda.

Observación: Se puede hallar la moda para variables cualitativas y cuantitativas.

Como has podido apreciar sólo se ha trabajado con datos no agrupados, es por esto que

ahora estudiarás como obtener el valor de la moda de un conjunto de datos agrupados.

La MODA es el valor que tiene mayor frecuencia absoluta. Se representa por Mo.

Page 5: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

5

Cálculo de la moda para conjunto de datos agrupados

Para empezar debes tener conocimiento de ciertos conceptos que describiremos a

continuación:

Clase modal (Ci): Corresponde a la clase que posee mayor frecuencia absoluta.

Límite inferior de la clase modal (Li): Es el menor valor del intervalo de la clase

modal.

Frecuencia absoluta de la clase modal (fi): valor de la frecuencia absoluta del

intervalo al cual pertenece la clase modal.

Frecuencia absoluta inmediatamente inferior a la clase modal (fi – 1):

corresponde a la frecuencia absoluta del intervalo anterior al perteneciente a la clase

modal.

Frecuencia absoluta inmediatamente posterior a la clase modal (fi + 1):

corresponde a la frecuencia absoluta del intervalo siguiente al perteneciente a la

clase modal.

Amplitud de la clase modal (ai): es el valor de la diferencia entre el límite superior

y el límite inferior del intervalo de la clase modal.

Te preguntarás para qué los conceptos, pues bien cada uno de ellos permite obtener un

valor que será reemplazado en la siguiente expresión para obtener la moda de un conjunto

de datos agrupados:

Parece complicado pero realicemos la siguiente actividad:

Se ha realizado una encuesta con el fin de conocer la cantidad de adultos mayores que

viven en un pueblo ubicado en el sur de chile. La Tabla N°1 muestra la cantidad de

personas por intervalo de edad:

Tabla N°1

Edad Cantidad de adultos mayores (fi)

[60, 63[ 5

[63, 66[ 18

[66, 69[ 42

[69, 72[ 27

[72, 75[ 8

Se ha oscurecido la fila que posee la clase modal (intervalo con mayor frecuencia absoluta)

pues es esencial para iniciar el reemplazo de los valores para obtener la moda, y su

amplitud es 3 pues es el valor de la diferencia entre 66 y 69.

𝑴𝒐 = 𝑳𝒊 + 𝒇𝒊 − 𝒇𝒊;𝟏

𝒇𝒊 − 𝒇𝒊;𝟏 + 𝒇𝒊 − 𝒇𝒊:𝟏 ∙ 𝒂𝒊

Límite inferior

de la clase modal

Frecuencia absoluta

de la clase modal

Frecuencia absoluta

inmediatamente inferior

a la clase modal

Frecuencia absoluta

inmediatamente posterior

a la clase modal

Page 6: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

6

De acuerdo a esta clase modal obtendremos los valores de los conceptos mencionados

antes, que ya hemos marcado en la tabla y ahora reemplazaremos en la expresión:

= + −

− + − ∙

= +

+ ∙

= +

= +

=

Una vez encontrado el valor podemos decir que la moda de la muestra es 67,846.

Observación: En el caso de un conjunto de datos agrupados, el valor de la moda es un

valor teórico que no necesariamente corresponde a una frecuencia absoluta como en el

caso de los datos no agrupados y que no se sabe si la edad 67,846 es la que más se repite

efectivamente.

ACTIVIDAD N°2

1. Determina la moda del experimento aleatorio cuyo fin era conocer los tipos de

hoteles en la Quinta Región según la cantidad de estrellas que los especialistas les

han asignado. Estos son los datos obtenidos:

3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1,

2, 2, 4, 1.

Respuesta:

2. Se ha aplicado un test de coeficiente intelectual a los empleados de

una fábrica, obteniéndose la siguiente tabla (Tabla N°2) con la

información obtenida.

La moda de este experimento aleatorio es:

Respuesta:

Tabla N°2

Puntaje fi

[38, 44[ 7

[44, 50[ 8

[50, 56[ 15

[56, 62[ 25

[62, 68[ 18

[68, 74[ 9

[74, 80[ 6

Page 7: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

7

3. Completa la siguiente oración:

“En un experimento aleatorio sobre el modelo de automóvil preferido, en el cual se

entrevistó a 30 personas la moda obtenida fue “Sedan” esto quiere decir que tal

modelo tuvo la _________________ frecuencia _________________”

Propiedades de la MODA

Cálculo sencillo.

Interpretación muy clara.

Al depender sólo de las frecuencias, puede calcularse para variables cualitativas. Es

por ello el parámetro más utilizado cuando al resumir una población no es posible

realizar otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las

características más frecuentes de determinado sector social.

Inconvenientes

1. Su valor es independiente de la mayor parte de los datos, lo que la hace muy

sensible a variaciones muestrales. Por otra parte, en variables agrupadas en

intervalos, su valor depende excesivamente del número de intervalos y de su

amplitud.

2. Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos

fuera de la moda, no afectan en modo alguno a su valor.

Ejemplo para 1 y 2:

A continuación se presentan las notas de Lenguaje de un curso de 30 estudiantes,

donde la moda es la nota 4,0.

1,0 - 2,0 - 2,5 - 3,0 - 3,0 - 3,5 - 3,8 - 4,0 - 4,0 - 4,0 - 4,0 - 4,0 - 6,0 - 6,0 - 6,1 - 6,1 -

6,2 - 6,2 - 6,3 - 6,4 - 6,5 - 6,6 - 6,6 - 6,6 - 6,7 - 6,8 - 6,9 - 7,0 - 7,0 - 7,0

Se puede observar que las notas superiores a la moda son 18 y la diferencia con

ésta es notable, sobre 2,0 puntos, pero ésta variación no afecta el valor de este

indicador, además sólo considera 5 datos de los 30 presentados.

3. No siempre se sitúa hacia el centro de la distribución.

Como ejemplo podemos tomar la situación anterior donde se tienen dos valores

centrales 6,0 y 6,1, pero no coinciden con el valor de la moda.

4. Puede haber más de una moda.

Ejemplo: Un grupo de 10 amigos tratan de decidir de qué color será un poleron que

quieren hacer. Tres de ellos lo prefieren negro, otros tres amarillo, tres más rojo y

uno blanco. Se puede apreciar que en definitiva existen 3 modas: negro, rojo y

amarillo, lo que hace difícil la elección.

Page 8: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

8

Mediana

Para estudiar los datos arrojados por un experimento aleatorio siempre

los organizamos y los ordenamos, lo que para el estudio de este

indicador de tendencia central es una medida imprescindible.

Para empezar definamos tal indicador:

Según la definición el conjunto de datos menores o iguales que la mediana representarán el

50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del

total de datos de la muestra.

Veamos cómo encontrar el valor de la mediana, primero en datos no agrupados.

Para empezar es importante saber el tamaño de la muestra pues de ella dependerá el

cómo determinar el valor de la mediana.

Pues bien:

Si el tamaño de la muestra es un número impar, el valor de la mediana será el

mismo del dato que se encuentra en el centro, una vez que estos hayan sido

ordenados de menor a mayor, por ejemplo:

Se han seleccionado 9 gatas que han tenido gatitos recientemente para conocer

cuál es la cantidad de hijos que éstas tuvieron, los datos obtenidos ordenados de

menor a mayor fueron los siguientes:

2, 3, 4, 4, 5, 5, 5, 6, 6

Valor del dato central

Como puedes observar el valor del dato central es 5, por lo cual ese es el valor de la

mediana. Por lo tanto = .

Si el tamaño de la muestra es un número par, el valor de la mediana será el

promedio de los dos valores de los datos centrales, una vez que estos hayan sido

ordenados de menor a mayor, por ejemplo:

Se han seleccionado 8 gatas que han tenido gatitos recientemente para conocer

cuál es la cantidad de hijos que éstas tuvieron, los datos obtenidos ordenados de

menor a mayor fueron los siguientes:

2, 3, 4, 4, 5, 5, 6, 6

Valores de los datos centrales

Ahora debemos calcular el promedio de estos valores:

+

=

Por lo tanto = .

La MEDIANA es el valor central de todos los datos cuando éstos están ordenados

de menor a mayor. Se representa por Me.

Page 9: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

9

Veamos ahora cómo encontrar el valor de la mediana en datos agrupados.

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la

mitad de la suma de las frecuencias absolutas, es decir debes buscar el intervalo en que

se encuentre la mitad del tamaño de la muestra (

).

Es esencial este intervalo pues a partir de él determinarás los valores de los siguientes

conceptos:

Límite inferior de la clase (intervalo) donde se encuentra la mediana (Li).

Frecuencia absoluta de la clase (intervalo) donde se encuentra la mediana (fi)

Frecuencia acumulada anterior a la clase (intervalo) de la mediana (Fi - 1).

Amplitud de la clase (intervalo) (ai).

Para reemplazarlos en la siguiente expresión, que permite conocer el valor de la mediana de

un experimento aleatorio de datos agrupados:

Lee con atención el siguiente ejemplo:

El entrenador de un equipo de básquetbol decidió medir la altura en centímetros de sus

jugadores y calcular la mediana de éstas, para ello confeccionó la siguiente tabla con los

datos obtenidos:

Tabla N°3

Altura [170, 175[ [175, 180[ [180, 185[ [185, 190[ [190, 195[ [195, 200]

fi 1 3 4 8 5 2

Fi 1 4 8 16 21 23

En la tabla se han marcado los datos necesarios para calcular la mediana que necesita el

entrenador del equipo:

= + (

) ∙

= + ( −

) ∙

= + (

) ∙

𝑴𝒆 = 𝑳𝒊 + (

𝑵𝟐 − 𝑭𝒊;𝟏

𝒇𝒊) ∙ 𝒂𝒊

Sabes que la última frecuencia

absoluta acumulada es igual al

tamaño de la muestra (N).

Este es el intervalo donde se encuentra la mediana pues: 𝑁

2=

23

2= 11 .

Su amplitud ai es 5, pues 190 – 185 = 5 y el límite inferior Li es 185.

Fi-1 fi

Page 10: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

10

= + ∙

= +

=

Luego la altura mediana de los jugadores de básquetbol es 187,1875 cm.

ACTIVIDAD N°3

1. Hay tres equipos de básquetbol y cada uno ha jugado cinco partidos. Tienes los

resultados de cada equipo de los partidos jugados.

Tabla N°4

Partido 1 Partido 2 Partido 3 Partido 4 Partido 5

Jaguares 67 87 54 99 78

Lobos 85 90 44 80 46

Leones 32 101 65 88 55

Usa la mediana de cada equipo para decidir a qué equipo te unirías.

Respuesta:

2. En una familia se encuestó a sus integrantes menores de 35 años

para saber cuántos de ellos según su edad usaban consola de

videojuegos, los resultados se muestran en la Tabla N°5.

¿Cuál es la edad mediana de este experimento?

Respuesta:

Como puedes haber notado la mediana se puede hallar solo en variables cuantitativas,

pues es difícil establecer, por ejemplo, entre tres colores cuál es el central ya que no se

pueden ordenar.

Propiedades de la Mediana

Es única, sólo existe una mediana para un conjunto de datos.

Su significado es sencillo y fácil de entender.

Su cálculo es rápido y fácil.

Es poco sensible a las fluctuaciones del muestreo.

Desventajas de la Mediana

El hecho de tener que ordenar los datos hace que se disponga de una cantidad de

tiempo directamente proporcional a la cantidad de datos que presente la muestra.

Tabla N°5

Edad fi Fi

[0, 5[ 1

[5, 10[ 1

[10, 15[ 3

[15, 20[ 3

[20, 25[ 4

[25, 30[ 6

[30, 35[ 7

Page 11: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

11

Media Aritmética

Es probable que hayas escuchado esta palabra

más de alguna vez en tu diario vivir, pero quizás,

la conoces coloquialmente como promedio o

simplemente media, la que a su vez conllevará a

distintas acepciones. Sin embargo, nosotros nos

importará aquellas que se relacionen con cálculos

matemáticos o estadísticos, por ejemplo, cuando

nos referimos a las temperaturas, cantidad de

precipitaciones caída ó humedad durante el día,

mes, año, etc. Como en cualquiera de estos casos, las magnitudes varían durante esos

períodos por lo que se hace necesario estimar o calcular un promedio de éstas, es decir,

hallar un valor representativo dentro del conjunto de datos.

Consideremos, por ejemplo Isla de Pascua, uno de los lugares menos contaminados de

nuestro país y entre los factores que influyen para que el aire sea limpio, están las

precipitaciones.

La tabla siguiente muestra las precipitaciones caídas durante el año 2010.

Tabla Nº6

Precipitaciones Isla de Pascua

Mes Cantidad (mm)

Enero 1021,8

Febrero 1022,2

Marzo 1019,3

Abril 1022,0

Mayo 1022,8

Junio 1026,9

Julio 1025,8

Agosto 1024,6

Septiembre 1022,2

Octubre 1024,6

Noviembre 1023,4

Diciembre 1025,7

Si queremos determinar de la cantidad promedio de precipitaciones en el primer trimestre

del 2010, es decir, entre los meses de Enero y Abril, debemos hacer lo siguiente:

Tomamos los datos entre los meses mencionados:

1021,8 ; 1022,2 ; 1019,3 ; 1022,0

Los sumamos y luego dividimos por la cantidad de los datos sumados, que en este caso es

4, o sea:

Promedio = 2 8 : 22 2 : 9 3 : 22

4=

4 85 3

4= 1 1

Por lo tanto el promedio de cantidad de precipitaciones caída entre Enero y Abril del 2010

es 1021,3 mm. (El resultado de la media lo aproximamos al primer decimal)

Page 12: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

12

Entonces cuando hablamos de promedio, nos estamos refiriendo a la MEDIA

ARITMÉTICA o MEDIA.

Es decir,

Nota: Utilizamos la notación cuando nos referimos a la media de una muestra y µ (mu) cuando es

a la media de una población. Para nuestro caso, utilizaremos preferentemente la primera notación.

Si retomamos el ejemplo de las precipitaciones de Isla de Pascua, el promedio del primer

trimestre del 2010 obtenido fue de 1021,3 mm, que es el valor medio de la serie de valores

de los datos 1021,8; 1022,2; 1019,3 y 1022,0 lo que corresponde a la media aritmética de

estos.

Además si te distes cuenta, el cálculo para obtener la media (promedio) fue sencillo. Ahora

lo formalizaremos.

Cálculo de la Media Aritmética para un conjunto de datos no agrupados

Para obtener el cálculo de la media para datos no agrupados se debe sumar todos los valores

de los datos y luego dividir el resultado obtenido por la cantidad total de datos.

Lo expresaremos en forma general de la siguiente manera:

Dónde:

: simboliza media aritmética.

2 3 4 : corresponde a cada uno de los valores de los datos.

n: cantidad total de datos.

n

i

ix1

: representa la sumatoria de los términos 2 3 4 .

El valor resultante de no necesariamente debe coincidir con algún dato.

La MEDIA ARITMÉTICA es el valor medio ponderado de una serie de valores de

datos. Este valor no tiene por qué ser siempre un dato. Se representa por �� .

𝒙 =𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + 𝒙𝟒 + ⋯+ 𝒙𝒏

𝒏=

Page 13: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

13

Observa que la variación de ambas fórmulas radica

en el tamaño de los datos (N identifica el tamaño

de la población, mientras que n el de la muestra).

Para conveniencia nuestra, utilizaremos la primera

expresión pues siempre nos referiremos a la

muestra.

¿Qué significa este signo ?

El símbolo es la letra griega “sigma” mayúscula que equivale a la letra S de nuestro

alfabeto. Este símbolo permite expresar de manera resumida la sumatoria de términos de

una sucesión de números reales. Esta símbolo o registro

n

i

ix1

, representa la sumatoria de

los términos, que parte de 1x hasta el nx , indicados por lo límites inferior y superior de la

sumatoria.

n

n

i

i xxxxx

.......321

1

Este símbolo de sumatoria lo utilizaremos para expresar en forma general la media

aritmética. NOTA: Para expresar la media aritmética de los datos ya sea de una población o muestra, se utiliza

dos formas para representarla, que son:

x

n

i

ix1

(Muestra)

N

i

ix1

(Población)

Ejemplo

Retomemos la tabla de las precipitaciones en Isla de Pascua y calculemos la media

aritmética de la cantidad de agua caída durante todo el año 2010.

Primero determinamos los datos:

1021,8 1022,2 1019,3 1022,0 1022,8 1026,9

1025,8 1024,6 1022,2 1024,6 1023,4 1025,7

Como el números de datos es 12, por lo tanto n=12

Límite superior ó término con el último subíndice de la sumatoria

Límite inferior ó término con el 1º subíndice de la sumatoria

Término general de la sucesión, donde i

es el índice de la sumatoria ( )

Page 14: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

14

Ahora podemos calcular la media aritmética reemplazando los datos anteriores:

x

12

1i

ix

2=

: : : : : : : : : : :

2

=1 1 + 1 + 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1

1

=1 1

1

x 1 1

Luego el promedio (media aritmética) de precipitaciones caídas en Isla de Pascua durante

todo el año 2010 fue de 1023,4 mm.

Si te fijas en este caso el valor de la media aritmética obtenido coincide coincidió por

casualidad con uno de los datos (generalmente esto no ocurre).

Pon atención… Ahora que sabes cómo calcular la media aritmética para datos no

agrupados, es necesario detenerse para examinar el resultado que obtienes. Por ejemplo si

consideramos el número de hijos de 6 familias con los siguientes resultados:

1, 2, 4, 5, 5, 6

La media aritmética del número de hijos es 3,8; ya que

8,36

23

6

655421

x

Si observas la media aritmética no coincide con ningún valor de los datos, pues

corresponden a números enteros positivos. Una posibilidad de expresar este resultado

salvando este inconveniente es decir: “el valor aproximado al entero de la media aritmética

es 4”, esto último es importante tenerlo presente cuando debamos contestar alguna pregunta

para que tenga sentido.

ACTIVIDAD Nº 4

1. Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Respuesta:

Page 15: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

15

2. Calcula la media aritmética de las veces que un grupo de 8 personas asiste al cine en

un mes, observando el siguiente gráfico de barras:

Respuesta:

En el colegio es seguramente donde más has escuchado y usado la palabra promedio, o

mejor dicho media aritmética. Los profesores de todas las asignaturas calculan la media de

su curso en cada evaluación y tú más de alguna vez has calculado tu promedio en las

diferentes asignaturas como una información objetiva de tus resultados de estudio.

Consideremos el siguiente ejemplo:

Se registraron en forma ordenada las notas de un curso en la última prueba de matemáticas,

que fueron las siguientes:

2 2 2 3 3 3 3 3 4 4

4 4 4 4 4 4 5 5 5 5

5 5 5 6 6 6 6 6 6 6

6 6 6 7 7 7 7

Se desea saber el promedio del curso. ¿Cómo lo harías?

Lo más probable es que lo resuelvas como ya lo hemos hecho anteriormente. Hagámoslo!!!

Tenemos en total 37 notas que sumar (n=37).

37

7777666666666655555554444444433333222 x

8,437

176x

El promedio o media aritmética del curso en la prueba de matemáticas fue 4,8.

Pero, ¿Qué desventaja encontraste para calcular la media aritmética?

012345678

Fre

cue

nci

as

Número de visitas al cine

Page 16: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

16

Si te habrás dado cuenta fueron varios los datos los que se debieron sumar, más aún varias

de estos estaban repetidos, lo que exige ser más cuidadoso en el momento de realizar las

operatorias involucradas en el cálculo de la media aritmética para evitar cometer errores en

el cálculo de la

Para estos casos, se recomienda ordenarlos en una tabla de frecuencias como se muestra a

continuación:

Tabla Nº7

Así se entiende entonces, que la nota 2 fue obtenida por 3 alumnos, la nota 3 por 5 alumnos,

la nota 4 por 8 alumnos, y así sucesivamente. Esto se puede expresar del siguiente modo:

37

4710675845332 x

37

28603532156 x

37

176x

8,4x

Hacerlo de esta forma salió simplificado y además se obtuvo el mismo resultado

Esta forma similar de hacerlo es muy recomendable para calcular la media en datos

agrupados y recibe el nombre de MEDIA ARITMÉTICA PONDERADA.

Cálculo de la Media Aritmética para un conjunto de datos agrupados

Para calcular la media aritmética para datos agrupados se calcula multiplicando la marca de

clase de cada intervalo por sus respectivas frecuencias absolutas, se suman los resultados

obtenidos y este total se divide por el número total de datos.

Es decir:

Donde

:ix marca de clase de cada intervalo (i= 1, 2, 3,….n.)

Notas Nº de alumnos

2 3

3 5

4 8

5 7

6 10

7 4

𝒙 =𝒙𝟏 ∙ 𝒇𝟏 + 𝒙𝟐 ∙ 𝒇𝟐 + 𝒙𝟑 ∙ 𝒇𝟑 + 𝒙𝟒 ∙ 𝒇𝟒 + ⋯+ 𝒙𝒌 ∙ 𝒇𝒌

𝒏=

Page 17: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

17

:if frecuencias absolutas de cada intervalo (i= 1, 2, 3,….n.)

n : número total de datos.

k: número total de intervalos.

i

k

i

i fx 1

: representa la sumatoria de la multiplicación de las marcas de clases con

sus respectivas frecuencias absolutas, es decir ∙ + 2 ∙ 2 + 3 ∙ 3 + 4 ∙ 4 +

⋯+ ∙ . Es decir, en estos casos las marcas de clases de cada intervalo son los

factores ó ponderadores de la frecuencia absoluta de los intervalos.

Ejemplo

1. En una prueba de Física realizada a un cuarto año medio , se obtuvieron los siguientes

resultados:

Tabla Nº8

Calculemos el puntaje promedio del curso.

En este caso n= 19, que resulta al sumar las frecuencias absolutas: 2+2+3+5+4+2+1=19,

que es el número total de los datos. Además k=7, ya que corresponde al número total de

intervalos que aparecen en la tabla.

Como tenemos la marca de clase de cada intervalo con su respectiva frecuencia absoluta

debemos multiplicar ambos, para eso anexaremos una columna.

Tabla Nº8.1

Nota: Recuerda que cuando hablamos de producto nos referimos a la operación multiplicación.

Puntaje

Marca de

Clase

(xi)

Frecuencia

Absoluta

(fi)

[0-10[ 5 2

[10-20[ 15 2

[20-30[ 25 3

[30-40[ 35 5

[40-50[ 45 4

[50-60[ 55 2

[60-70] 65 1

Puntaje

Marca de

Clase

(xi)

Frecuencia

Absoluta

(fi)

[0-10[ 5 2 ∙ = 1

[10-20[ 15 2 1 ∙ =

[20-30[ 25 3 ∙ =

[30-40[ 35 5 ∙ = 1

[40-50[ 45 4 ∙ = 1

[50-60[ 55 2 ∙ = 11

[60-70] 65 1 ∙ 1 =

n=19 645

Este es el total obtenido

luego de sumar todos

los resultados de los

productos ( 𝑥𝑖∙𝑓𝑖

Se multiplica

𝑥 ∙ 𝑓 → 5∙ = 1

𝑥2 ∙ 𝑓2 → 1 ∙ =

𝑥3 ∙ 𝑓3 → ∙ =

⋮ ⋮

Y así sucesivamente.

Recuerda que la Marca de Clase

corresponde al punto medio del

intervalo y se calcula con el

promedio entre los límites ó

extremos de este.

Page 18: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

18

Luego reemplazamos en

x

i

i

i fx

7

1

9=

5∙2 : 5∙2 : 25∙3 : 35∙5 : 45∙4 : 55∙2 :65∙

9

=1 + + + 1 + 1 + 11 +

1

=

1

=

Por lo tanto el puntaje promedio del cuarto año medio en la prueba de Física es 33,94

puntos (que no podemos saber, con la información que tenemos, si corresponde o no a uno

de los datos).

ACTIVIDAD Nº 5

1. Se realizo un estudio sobre los años de servicio a 16 trabajadores de un minimarket de la

capital donde los resultados se muestran en la tabla que aparece a continuación. Completa

esta tabla y luego calcula la media aritmética correspondiente a los años de servicio de estos

trabajadores.

Tabla Nº 9

Intervalos

(Años) xi fi ∙

[0-10[

5

2

[10-20[

15

2

[20-30[

25

3

[30-40[

35

5

[40-50[

45

4

[50-60[

55

2

Cálculo de la media (𝒙 )

Page 19: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

19

Respuesta: La media aritmética de los años de servicio estos trabajadores es

años.

2. La siguiente tabla de distribución muestra las alturas de un curso de enseñanza media de

cierto colegio.

Tabla Nº10

Alturas Marca de clase

(xi)

Nº de alumnos

(fi)

[150, 154[ 152 5

[154, 158[ 156 3

[158, 162[ 160 7

[162, 166[ 164 6

[166, 170[ 168 4

[170, 174[ 172 5

¿Cuál es la estatura media del curso?

Respuesta:

Propiedades de la media aritmética

Si xi son las variables de una muestra de tamaño n, y la media aritmética de

la muestra, entonces, la suma de las desviaciones de las variables con respecto a

la media es nula (ó cero), es decir:

∑ − =

<

Antes de comprender esta propiedad, es necesario que analices lo siguiente .El gráfico de

barras o el histograma nos permite calcular a priori la aproximación del valor con respecto

a la media aritmética de los datos representados. A su vez la media aritmética coincide con

el "punto de equilibrio" del gráfico es decir, está en la vertical que pasa por su centro de

gravedad. Es decir, imagina que el gráfico es un objeto con masa y necesitamos colocarlo

Page 20: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

20

en equilibrio sobre un punto del eje horizontal: el punto de apoyo ha de estar situado en la

media aritmética de los datos representados como aparece en el esquema siguiente, que

corresponde al triángulo que está debajo del gráfico de barras.

Esquema Nº1

Si ese punto de apoyo estuviera situado a la izquierda o a la derecha de la media, el gráfico

se iría hacia un lado o hacia el otro, o sea se desequilibraría. Basándonos en esto, podemos

hacer un cálculo aproximado de la media aritmética: observamos el gráfico y tratamos de

determinar donde está situado su centro de gravedad. La proyección de este punto sobre el

eje horizontal nos da el valor de la media.

Veamos la siguiente situación:

Consideremos las notas de matemática de un alumno que cursa segundo año medio:

6,5; 4,9; 5,0; 5,9; 6,2

Primero calculemos la media aritmética, siendo n=5.

= + + + +

=

=

Como ves, en la expresión matemática de la propiedad, debemos calcular cada una de las

diferencias entre el valor y la media respectiva. Esta diferencia se conoce con el nombre de

desviación. Estas se muestran en la siguiente tabla:

Tabla Nº 12

Gráficamente esta situación la podemos graficar:

Esquema Nº 2

Nº de nota Nota (xi) Desviación − 1 6,5 − =

2 4,9 − = −

3 5,0 − = −

4 5,9 − =

5 6,2 − =

Page 21: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

21

Como puedes ver, la media es el centro de gravedad de la distribución de las cinco notas de

matemática. Si apoyamos la barra en un punto tal que ésta quede equilibrada perfectamente,

es porque esa posición ha coincidido con la media. Entonces las medidas en toda muestra

están perfectamente equilibradas en torno a su media aritmética.

Cada puntuación de esta pequeña distribución posee un peso efectivo en proporción a su

distancia desde la media. Si te fijas en la tabla Nº 12, la tercera columna, están calculadas

estas distancias que se llaman desviaciones respecto de la media. La magnitud de cada

desviación indica el peso efectivo de cada observación y su signo algebraico dice en que

dirección está aplicado el peso. La suma algebraica de las desviaciones es cero, lo que

indica equilibrio perfecto. Por eso la propiedad esta anunciada como tal.

Ahora que ya tienes una idea del porqué de esta propiedad, ejemplificaremos dicha

propiedad, es decir que la suma de todas las desviaciones respecto a la media es igual a

cero.

Ejemplo:

Al lanzar un dado doce veces, los resultados fueron los siguientes:

Tabla Nº12

Verifiquemos la propiedad.

Primero calculamos la media aritmética que para este caso es = 2. Ahora anexamos a la

tabla anterior una columna en la cual calculamos cada diferencia entre el valor obtenido

(frecuencia) y la media aritmética.

Tabla Nº12.1

Al sumar los resultados obtenidos de las diferencias resulto ser igual a cero. Por lo tanto

la propiedad se cumple.

Número obtenido Frecuencias

1 2

2 0

3 1

4 3

5 4

6 2

Número obtenido Frecuencias −

1 2 − =

2 0 − = −

3 1 1 − = −1

4 3 − = 1

5 4 − =

6 2 − =

SUMA n=12 0

Este resultado corresponde a la suma de las

diferencias, es decir 𝑥𝑖 − ��

Page 22: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

22

Si a todos los valores de la variable se les suma un mismo número, la media

aritmética queda aumentada en dicho número.

Verifiquemos la propiedad con el ejemplo siguiente.

Se realizó un estudio a un grupo de 6 amigos, sobre el peso (kg) que posee cada uno de

ellos .

La siguiente tabla Nº13 muestra los resultados.

Si calculamos la media aritmética, sabiendo que n= 6 nos da:

= + + + + + 1

=

=

Por lo tanto = (valor que no corresponde a ninguno de los datos)

Sin embargo estos amigos se fueron al supermercado a comprar lo necesario para el asado

pues van a celebrar el triunfo de su equipo de fútbol favorito. Para que todos llevarán el

mismo peso de bolsas, se repartieron 6 kilos cada uno, para así equilibrar todo el peso de

las compras. Por lo tanto el peso de cada uno de ellos se vio afectado por este exceso de

peso de las bolsas, como se muestra en la tabla:

Tabla Nº13.1

Ahora si calculemos nuevamente la media aritmética para estos nuevos pesos, resulta:

=82:84:88:83:86:87

6=

5

6= Por lo tanto =85 kg.

Si comparamos los valores de las dos medias aritméticas obtenidas = y =85

difieren por 6 kilos, es decir que la primera media aritmética aumento en 6 kilos más,

debido al peso de las bolsas del supermercado. Este resultado muestra que la propiedad

funciona.

Amigos Peso (kg)

A 76

B 78

C 82

D 77

E 80

F 81

Amigos Peso (kg) Pesomás(kg)

A 76 76 + 6 = 82

B 78 78 + 6 = 84

C 82 82 + 6 = 88

D 77 77 + 6 = 83

E 80 80 + 6 = 86

F 81 81 + 6 = 87

Page 23: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

23

Si todos los valores de la variable se multiplican por un mismo número la

media aritmética queda multiplicada por dicho número.

Verifiquemos esta propiedad utilizando los datos de la tabla Nº12 y recordando que su

media aritmética es = en la siguiente situación:

En Física los conceptos de masa y peso son diferentes, pues el primero se relaciona con la

cantidad de materia de los cuerpos medida en kilógramos, y el segundo hace referencia

en que la masa de cada cuerpo es atraída por la fuerza de gravedad de la Tierra. Esa

fuerza de atracción hace que el cuerpo (la masa) tenga un peso, que se cuantifica con una

unidad diferente: el Newton (N). Para obtener el peso en Newton, se calcula con la

siguiente fórmula: donde : P= peso en Newton(N) , = masa (kg) y

= 9,8 siendo la constante gravitacional de la Tierra (kg. m/s).

Calculemos los pesos en Newton, utilizando los datos de la tabla Nº 12. (Para eso hacemos

la siguiente modificación en la tabla, en vez de “peso (kg)” anotamos “masa (kg)”) para

luego calcular la media aritmética y así compararlos con la media inicial, es decir, = .

Recuerda que cada valor (masa) de la tabla lo multiplicamos por 9,8, según la fórmula.

Tabla Nº13.2

Estos son los pesos obtenidos en Newton, ahora calculemos la media aritmética.

= + + + + +

=

=

Por lo tanto = 774,2 en Newton.

Con anterioridad la media de esta masas era de 79, ahora como sabemos que a cada masa

(kg) le multiplicamos la constante gravitacional 9,8 , obtuvimos una nueva media aritmética

que resulto ser 774,2. Si observas con atención esta última corresponde a 9,8 veces la

primera, es decir que si multiplicamos 79 por 8,9 nos da 774,2 que corresponde al peso

promedio del grupo de amigos. Este resultado muestra que la propiedad funciona.

Observaciones de la media aritmética

La media se puede hallar sólo para variables cuantitativas, pues estamos realizando

cálculos con operatorias aritméticas.

En su cálculo intervienen todos los valores de la distribución.

Es única, pues cuando la calculamos obtenemos sólo un valor que le corresponde.

Amigos Masa (kg) Peso(N)= ∙

A 76 76 ∙ 9,8 = 744,8

B 78 78 ∙ 9,8 = 764,4

C 82 82 ∙ 9,8 = 803,6

D 77 77 ∙ 9,8 = 754,6

E 80 80 ∙ 9,8 = 784

F 81 81 ∙ 9,8 = 793,8

𝑃 = 𝑚 ∙ 𝑔

Page 24: Módulo de Aprendizaje de Estadística Descriptiva · Objetivos: Reconocer las Medidas de Tendencia Central. Interpretar los conceptos de Moda, Mediana y Media Aritmética. Determinar

24

La media aritmética viene expresada en las mismas unidades que la variable, pero

no necesariamente coincide con alguno de los datos.

La media es un estadístico “sensible” a valores extremos. Basta que algún dato

dentro de la muestra sea muy alto o muy bajo, y la media se verá alterada.

Ejemplo: Si tenemos una distribución de 8 pesos (kg) que son:

72, 69, 72, 68, 75, 70, 71,71

Al calcular la media aritmética de estos valores obtenemos que es igual a 71 kg, que

corresponde al peso medio de la distribución.

Ahora si cambiamos unos de los valores, por ejemplo en vez de 71 kg. es 111 kg.

72, 69, 72, 68, 75, 70, 71, 111

La media resultante es 76 kg que corresponde al peso medio de esta nueva distribución,

notamos que la media cambia considerablemente, o sea aumento en 5 kilos y además este

valor no es representativo de todos los pesos.

Ahora si consideramos la distribución de pesos inicial y cambiamos 71 kg por 47 kg nos

queda

72,69, 72, 68, 75, 70, 71, 47

La media es 68 kg que corresponde al peso medio de esta nueva distribución, notamos que

la media cambia nuevamente, o sea disminuyó en 3 kilos y además este valor no es

representativo de todos los pesos.

Por lo tanto basta que un dato de la muestra sea muy alto o muy bajo para que afecte al

valor de la media aritmética.