Miss Yanira Castro Lizana
ESTADISTICA
Objetivo:
- Leer e interpretar información de tablas y gráficos
- Recopilar y comunicar información utilizando los procedimientos
más adecuados a la característica de lo que se va a informar.
0
10
20
30
40
50
60
70
80
90
1er trim. 2do trim. 3er trim. 4to trim.
Este
Oeste
Norte
Actividad Nº 1
“Información en la vida diaria”
Trabajar en grupo, analizando la lámina entregada
a) ¿Qué título tiene la información analizada?
b) ¿De qué se trata la información? Explique
c) Utiliza gráficos o tablas explicativas?
d) Si se utiliza gráficos, ¿Son los más adecuados para
representar la información o utilizaría otro? ¿Por qué?
e) ¿Considera que los gráficos o tablas son necesarios
en una información? ¿Por qué?
f) ¿En qué caso se utiliza un gráfico de barra, lineal o circular?
g) Diseñe nuevamente la información de la lámina, como a
a ustedes les gustaría que apareciera publicada.
¿Qué es Estadística?
Es la ciencia encargada de recoger, clasificar, describir y analizar
datos numéricos que sirvan para deducir conclusiones y tomar
decisiones a partir de estos análisis.
La Estadística se divide en dos grandes grupos:
Estadística descriptiva o deductiva:
Se ocupa de la recolección, organización y representación de
datos en forma coherente.
Estadística inductiva o inferencial:
Se ocupa de interpretar los datos recogidos y obtener
conclusiones a partir de ellas.
¿ Qué es una población?
Población o Universo: Es el conjunto de todos los individuos u
objetos que poseen alguna característica común observable.
Una población puede ser finita o infinita.
Ejemplo:
- La población consistente en la fabricación de refrigeradores, en
una empresa determinada, en un día determinado, es finita.
- La población formada por todos los posibles sucesos (caras o
sellos en tiradas sucesivas de una moneda es infinita.
- La población formada por los Números Naturales es infinito
- La población formada por el número de alumnos de un colegio
determinado, en un año determinado es finito.
¿Qué es una muestra?
Muestra es un subconjunto de la población. Es una parte de ella.
Se dice que una muestra es representativa de la población, cuando
corresponde más o menos al 20% de ella. Y se pueden deducir
importantes conclusiones acerca de ésta, a partir del análisis de
la misma.
Ejemplo:
Población: Padres de los alumnos de un colegio
Muestra: Padres de los alumnos de Octavo año
La muestra se puede elegir en forma aleatoria, estratificada o
mixta
¿Qué es una variable?
Una variable es la característica o atributo a observar.
El conjunto de valores asignados a la variable se llama dato o
dominio de la variable.
Las variables pueden ser continuas o discretas.
Variable continua es aquella que puede tomar cualquier valor
entre dos valores dados, es decir, en un rango determinado.
Ejemplo:
La estatura de los alumnos de un cuarto básico es continua,
porque pueden medir 1,40 m 1,42 m 1,408 m etc
Variables discreta son aquellas que toman un valor entero
Ejemplo:
El número de hijos de una familia es discreta, porque puede
haber 1, 2, 3, ....etc. hijos
Ejercicios
Decir de las variables siguientes cuáles representan datos
discretos o datos continuos.
Número de acciones vendidas cada día en un mercado de
valores.
Respt: Discreta
Temperaturas registradas cada media hora en un observatorio.
Respt: Continua
Período de duración de ampolletas producidos por una
empresa determinada
Respt: Continua
Censos anuales del colegio de profesores.
Respt: Discreta
Número de billetes de $10000 circulando en Chile
Respt: Discreta
Pulgadas de precipitación en una ciudad durante varios meses
del año.
Respt: Continua
Alumnos matriculados en la Universidad Andrés Bello, en
los últimos cinco años.
Respt: Discreta
Dar el dominio de cada una de las siguientes variables y decir
si son continuas o discretas.
Número de litros de agua en una máquina de lavar.
Dominio : cualquier valor de cero litros a la capacidad de la
máquina ( 12,3 12,005 12,0047 etc)
Variable : Continua
Número de libros en un estante de librería.
Dominio : 0, 1, 2, 3, ........ Hasta el mayor número de libros
que puedan entrar en el estante.
Variable : Discreta
Suma de puntos obtenidos en el lanzamiento de un par de
dados
Dominio : 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
Variable : Discreta
Tiempo de vuelo de un proyectil
Dominio : De cero en adelante ( 5 5,3 5.045 etc)
Variable : Continua
Estado civil de un individuo
Dominio : Casado, soltero, viudo
Variable : Discreta
Velocidad de un automóvil en kilómetros por hora.
Dominio : De 0 en adelante ( 120 120,8 120,04 etc)
Variable : Continua
Distribuciones de frecuencias
Toma de datos: Es la obtención de una colección de los mismos
que no han sido ordenados numéricamente.
Ejemplo: Conjunto de alturas de 100 estudiantes, sacados de una
lista alfabética de una Universidad.
Ordenación: Es una colocación de los datos numéricos tomados,
en orden creciente o decreciente de magnitud.
Ejemplo:
32 , 45, 100, 120 , 145, 186, 198, 200 ( ordenación creciente )
200, 198, 186, 145, 120, 100, 45, 32 ( ordenación decreciente)
Al recoger información se obtiene un gran número de datos,
que conviene presentar en forma resumida en una tabla llamada
distribución de frecuencias.
Frecuencia absoluta: es el número de veces que se repite un valor
de la variable.
Ejemplo:
Los siguientes datos son las calificaciones obtenidas, en la
asignatura de Matemática, por un grupo de 30 alumnos:
7 – 3 – 5 – 4 – 3 – 4 – 5 – 6 – 5 – 7 – 3 – 2 – 6 – 5 – 4 – 6 –
3 - 4 – 5 – 2 - 7 – 4 – 5 – 7 – 6 – 5 – 4 – 2 –3 - 1
Variable Estadística Frecuencia absoluta
Calificación Nº de alumnos
1 1
2 3
3 5
4 6
5 7
6 4
7 4
Frecuencia acumulada hasta un valor determinado: es el número
de observaciones menor o igual al valor considerado.
Se obtiene sumando sucesivamente las frecuencias absolutas.
Ejemplo:
3047
2646
2275
1564
953
432
111
-------------Nº de alumnosCalificación
Frecuencia acumuladaFrecuencia absolutaVariable estadística
Frecuencia relativa: es el cuociente entre la frecuencia absoluta
y el número total de individuos de la muestra
Variable estadística Frecuencia absoluta Frecuencia relativa
Calificación Nº de alumnos -----------
1 1 1 / 30
2 3 3 / 30
3 5 5 / 30
4 6 6 / 30
5 7 7 / 30
6 4 4 / 30
7 4 4 / 30
NOTA: La suma de las frecuencias relativas es igual a 1
Ej. 1 / 30 + 3 / 30 + 5 / 30 + 6 / 30 + 7 / 30 + 4 / 30 + 4 / 30 = 30 / 30
= 1
Frecuencia relativa porcentual: Es la frecuencia relativa
expresada en porcentajes.
Variable estadística Frecuencia absoluta Frecuencia relativa porcentual
Calificación Nº de alumnos -----------
1 1 ( 1 / 30 ) • 100
2 3 ( 3 / 30 ) • 100
3 5 ( 5 / 30 ) • 100
4 6 ( 6 / 30 ) • 100
5 7 ( 7 / 30 ) • 100
6 4 ( 4 / 30 ) • 100
7 4 ( 4 / 30 ) • 100
NOTA: La suma de las frecuencias relativas porcentuales es el
100%
Ejercicios
Los siguientes datos son las calificaciones de un grupo de 27
alumnos en la asignatura de matemática:
5 6 5 7 4 2 3 5 4 6 7 5 4 6 5 4 5 6
4 3 4 6 7 5 4 5 6
a) Construya una tabla de distribución de frecuencias
b) ¿Cuántos alumnos tienen nota inferior a 5?
c) ¿Qué porcentaje de alumnos tiene nota 4?
d) ¿Cuántos alumnos tiene nota 6?
e) ¿Qué porcentaje de alumnos tiene nota superior o igual a 4?
Respuesta
Calificación frecuencia Frecuencia
acumulada
Frecuencia
relativa
Frec. relat.
porcentual
2 1 1 1 / 27 = 0,037 3,7
3 2 3 2 / 27 = 0,074 7,4
4 7 10 7 / 27 = 0,259 25,9
5 8 18 8 / 27 = 0,296 29,6
6 6 24 6 / 27 = 0,222 22,2
7 3 27 3 / 27 = 0,111 11,1
b) 10 alumnos tienen nota inferior a 5,0
c) El 25,9% de los alumnos tiene nota 4,0
d) 6 alumnos tienen nota 6,0
e) El 88,8% de los alumnos tiene nota igual o superior a 4,0
Una encuesta realizada a alumnos de Cuarto Medio acerca
de su futura profesión, indica lo siguiente:
Variable
profesión
F. absoluta
Nº de alumnos
Ingeniería 10
Medicina 6
Economía 12
Periodismo 8
Derecho 5
Arquitectura 9
Otras 10
a) Completar la tabla con frecuencia
acumulada, relativa y relativa
porcentual.
b) ¿Cuántos alumnos fueron encuestados?
c) ¿Cuál es la profesión que tiene mayor
preferencia?
d) ¿Qué porcentaje de alumnos prefiere
arquitectura?
e) ¿Qué porcentaje de alumnos prefiere
medicina?
Respuesta
Profesión Frecuencia F. acumulada F. relativa F. relat. %
Ingeniería 10 10 10 / 60 = 0,166 16,6
Medicina 6 16 6 / 60 = 0,100 10,0
Economía 12 28 12 / 60 = 0,200 20,0
Periodismo 8 36 8 / 60 = 0,133 13,3
Derecho 5 41 5 / 60 = 0,083 8.3
Arquitectura 9 50 9 / 60 = 0,150 15,0
Otros 10 60 10 / 60 = 0,166 16,6
b) 60 alumnos fueron encuestados
c) Economía es la profesión con mayor frecuencia
d) El 15% de los alumnos prefiere Arquitectura
e) El 10% de los alumnos prefiere Medicina
En una muestra de 40 familias, el número de hijos se
distribuye según la tabla:
Variable F. absoluta
Nº de hijos Nº de familias
1 2
2 8
3 12
4 14
5 3
6 1
a) Completa la tabla con frecuencia
acumulada, relativa y relativa
porcentual.
b) ¿Cuántas familias tienen menos de
4 hijos?
c) ¿Cuántas familias tienen 5 hijos?
d) ¿Cuál es la frecuencia relativa de las
familias que tienen 2 hijos?
e) ¿Qué porcentaje de familias tiene 6
hijos?
f) ¿Qué fracción representan las familias
con 2 hijos?
g) ¿Qué fracción representan las familias
con 4 hijos?
Respuesta
Nº hijos Frecuencia F. acumulada F, relativa Frec. Relat. %
1 2 2 2 / 40 = 0,05 5
2 8 10 8 / 40 = 0,20 20
3 12 22 12 / 40 = 0,30 30
4 14 36 14 / 40 = 0,35 35
5 3 39 3 / 40 = 0,075 7,5
6 1 40 1 / 40 = 0,025 2,5
b) 22 familias tienen menos de 4 hijos
c) 3 familias tienen 5 hijos
d) La frecuencia relativa de familias con 2 hijos es de 0,20
e) El 2,5% de las familias tiene 6 hijos
f) 1 / 5 de las familias tienen 2 hijos
g) 7 / 20 de las familias tienen 4 hijos
Medidas de tendencia central en valores no agrupados.
Son valores representativos de la totalidad de los datos.
Su cálculo permite analizar los datos en torno a un valor central.
Los valores centrales más usados son:
Media aritmética.
Mediana
Moda.
Media aritmética ( X )
Media aritmética: corresponde al promedio de los valores.
Se simboliza por X
La media aritmética se obtiene sumando los valores de la variable
dividido por el número total de valores.
En forma General :
X = x1 + x2 + x3 +....xn
n
Ejemplo:
Determinar el promedio de notas de un alumno, en la asignatura
de Lenguaje y comunicación.
Las notas son: 3- 5 - 7 - 6 - 4 - 5 - 3 - 5 - 4 - 5 - 3 - 4
X = 3 + 5 + 7 + 6 + 4 +5 + 3 +5 + 4 + 5 + 3 + 4 = 54 = 4,5
12 12
Luego, el promedio de notas del alumno es 4,5
La media aritmética ponderada es otra forma de calcular el
promedio, utilizando la tabla de distribución de frecuencias.
Ejemplo:
Notas Frecuencias
3 3
4 3
5 4
6 1
7 1
Se debe multiplicar cada valor con su
frecuencia.
3 • 3 = 9 4 • 3 = 12 5 • 4 = 20
6 • 1 = 6 7 • 1 = 7
Se suman los productos:
9 + 12 + 20 + 6 + 7 = 54
La suma del producto se divide por el
total de datos:
54 : 12 = 4,5
Luego,
X = 4,5
Mediana ( Me )
Es el valor de la variable que deja igual número de valores antes y
después de él en una distribución de frecuencias
Según el número de valores de la variable se distinguen dos casos:
Si el número de valores es impar, la mediana coincide con el
valor central.
Ejemplo: 5 – 8 – 9 – 11 – 12 – 13 – 15
Luego, la mediana es el 11
NOTA: los valores deben estar ordenados. Puede ser en forma
creciente o decreciente
Si el número de valores es par, la mediana es el promedio
aritmético de los dos valores centrales.
Ejemplo:
2 – 3 – 5 – 6 – 8 – 9 – 11 – 12
El calculo sería: ( 6 + 8 ) : 2 = 14 : 2 = 7
Luego, la mediana es 7
Moda ( Mo )
Es el valor de la variable que tiene mayor frecuencia
Ejemplo:
Variable F. absoluta
Nº de hijos Nº de familias
1 2
2 8
3 12
4 14
5 3
6 1
La moda es 4 hijos, porque tiene
mayor frecuencia, que es del 14
familias.
Ejercicios
Las calificaciones de un estudiante de la USACH, en seis pruebas,
fueron 84, 91, 72, 68, 87 y 78. Hallar el promedio de sus notas.
Respuesta:
X = 84 + 91 + 72 + 68 + 87 + 78 = 480 = 80
6 6
Luego, el estudiante tiene promedio 80
Diez medidas de diámetro de un cilindro fueron registradas como:
3,88 4,09 3,92 3,97 4,02 3,95 4,03 3,92 3,98 y 4,06
Respuesta:
X = 3,88 + 4,09 + 3,92 + 3,97 + 4,02 + 3,95 + 4,03 + 3,92 +3,98 +4 ,06
10
= 39,82 = 3,98
10
Luego, la media aritmética es 3,98
Calcular el salario medio semanal de 65 empleados
Salario Frecuencia
$ 55.000 8
$ 65.000 10
$ 75.000 16
$ 85.000 14
$ 95.000 10
$ 105.000 7
Respuesta
Salario ( x) Frecuencia F • X
$ 55.000 8 $ 440.000
$ 65.000 10 $ 650.000
$ 75.000 16 $ 1.200.000
$ 85.000 14 $ 1.190.000
$ 95.000 10 $ 950.000
$ 105.000 7 $ 735.000
X = 440.000 + 650.000+ 1.200.000 + 1.190.000 + 950.000 + 735.000
65
= 5.165.000 = 79.461,538
65
Luego, el sueldo promedio es
$ 79.461,5
Las calificaciones de un estudiante de la USACH, en seis
pruebas, fueron 84, 91, 72, 68, 87 y 78. Hallar la mediana de
sus calificaciones
Respuesta:
Se deben ordenar las calificaciones: 68 72 78 84 87 91
Luego, la mediana es 78 + 84 = 162 = 81
2 2
Hallar la moda de los siguientes números: 3, 5, 2, 6, 5, 9, 5,
2, 8.
Respuesta:
La moda es el número 5, ya que su frecuencia es mayor
Representación gráfica de la información
Gráfico lineal o de segmentos:
Se utiliza especialmente para representar datos numéricos de
situaciones que ocurren en períodos sucesivos.
0
5
10
15
20
25
30
35
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
Tem
peratu
ra
gráfico de Barra : Permite hacer comparaciones mediante
barras paralelas colocadas en forma vertical u horizontal
entre dos ejes perpendiculares.
0
10
20
30
40
50
60
70
80
90
1er
trim.
2do
trim.
3er
trim.
4to
trim.
Matematica
Lenguaje
Gráfico circular: Consiste en un círculo dividido en sectores
que representan las frecuencias relativas porcentuales de una
distribución
Los 360 grados del círculo se dividen proporcionalmente al
porcentaje correspondiente de cada frecuencia.
1er trim.
13%
2do trim.
17%
3er trim.
57%
4to trim.
13%
Distribución de frecuencias con datos agrupados
Rango: Es la diferencia entre el mayor valor y el menor de ellos.
Ejemplo:
Si la estatura del alumno más alto de un curso es 1,92 m
y la del menor es 1,68 m, entonces el rango de estos datos es:
1,92 m – 1,68 m = 0,24 m = 24 cm.
Clases o intervalos : En la ordenación de datos muy numerosos,
es usual presentarlos agrupados y ordenados en clases o categorías.
Ejemplo:
En un grupo de 50 alumnos se registraron los siguientes
puntajes en una prueba:
61 76 66 77 70 83 88 63 77 67 68 72 82
78 74 84 63 76 84 78 75 72 75 83 80 73
62 83 75 67 72 83 83 84 84 67 71 87 80
77 64 77 82 83 85 79 72 83 83 87
Para ordenarlos y agruparlos, se establecen los intervalos
que se usarán, determinando el rango de los datos.
Dato mayor: 88 Dato menor: 61 Rango: 88 – 61 = 27
De acuerdo con el rango y teniendo en cuenta la cantidad de
datos, se forman los intervalos.
Si quisiéramos formar 6 intervalos, se tiene que dividir el rango
con la cantidad deseada.
27 : 6 = 4, 5 se aproxima a 5 ( amplitud aparente del intervalo)
Intervalo de puntajes Frecuencias
60 – 64 5
65 – 69 5
70 – 74 8
57 – 79 12
80 – 84 16
85 – 89 4
El intervalo 60 – 64 es un
símbolo para representar
a la clase respectiva
Los valores 60 y 64 son
los límites aparentes de
la clase.
Los límites reales de una clase se obtienen calculando el
promedio entre el límite aparente superior de una clase y el
límite aparente inferior de la clase siguiente.
Ejemplo: Calcular los límites reales de la clase 70 – 74
Lri = 2
7069=
2
139 = 69,5 Límite real inferior
Lrs = 2
7574=
2
149 = 74,5 Límite real superior
Tamaño o amplitud de una clase: Corresponde a la diferencia
entre su límite real superior y el límite real inferior.
Ejemplo:
75,5 – 69,5 = 5 Su amplitud es igual a 5
NOTA: Todas las clases tienen igual tamaño.
Marca de clase: Es el punto medio de un intervalo de
clase.
Ejemplo.
7270 – 74
6765 – 69
6260 – 64
Marca de claseIntervalo
Frecuencia total: Es la suma de las frecuencias absolutas de
todas las clases.
Ejemplo:
1011 -15
116 – 10
121 – 5
FrecuenciaIntervalo
Frecuencia total
12 + 11 + 10 = 33
Ejercicios
61 76 66 77 70 83 88 63 77 67 68 72 82
78 74 84 63 76 84 78 75 72 75 83 80 73
62 83 75 67 72 83 83 84 84 67 71 87 80
77 64 77 82 83 85 79 72 83 83 87
Dado los siguientes puntajes, determinar:
a) Determinar seis intervalos
b) Determinar el límite real superior e inferior de cada clase
c) Determinar la marca de clase de cada intervalo
d) Determinar la frecuencia absoluta
Respuesta
Se debe determinar el rango: Pje mayor – Pje menor:
88 – 61 = 27
Luego, 27 : 6 = 4,5 se aproxima a 5 la amplitud del intervalo
Intervalo Lri - Lrs Marca de clase Frecuencia
60 – 64 59,5 – 64,5 62 5
65 – 69 64,5 – 69,5 67 5
70 – 74 69,5 – 74,5 72 8
75 – 79 74,5 – 79,5 77 12
80 – 84 79,5 – 84,5 82 16
85 – 89 84,5 – 89,5 87 4
Ordena los siguientes datos de menor a mayor y calcula
su rango: 3,22 2,92 3,01 4,48 5,06 4,31 2,98 3,07
Respuesta:
Ordenado: 2,92 2,98 3,01 3,07 3,22 4,31 4,48 5,06
Rango: 5,06 – 2,92 = 2,14
La siguiente distribución de frecuencias corresponde a los
salarios de los empleados de una fábrica:
Salarios ( $ ) Frecuencia
50.000 – 54.999 7
55.000 – 59.999 18
60.000 – 64.999 32
65.000 – 69.999 45
70.000 – 74.999 52
75.000 – 79.999 28
80.000 – 84.999 16
85.000 – 89.999 8
a) Calcula los límites reales del tercer intervalo
Respuesta:
Lri = 59.999 + 60.000 = 59.999,5
2
Lrs = 64.999 + 65.000 = 64.999,5
2
b) Calcula el tamaño de los intervalos
Respuesta: Lrs – Lri = amplitud
64.999,5 - 59.999,5 = 5000
c) Determina el límite aparente inferior del séptimo intervalo
Respuesta:
[80.000 – 84.999] Límite aparente inferior: 80.000
d) Determina el límite real superior del segundo intervalo
Respuesta:
[55.000 – 59.999] Lrs = 59.999 + 60.000 = 59.999,5
2
e) Escribe en orden la marca de clase
Respuesta:
87.499,585.000 – 89.999
82.499,580.000 – 84.999
77.499,575.000 – 79.999
72.499,570.000 – 74.999
67.499,565.000 – 69.999
62.499,560.000 – 64.999
57.499,555.000 – 59.999
52.499,550.000 – 54.999
Marca de claseSalarios ( $ )
f) Determina la frecuencia acumulada.
20685.000 – 89.999
19880.000 – 84.999
18275.000 – 79.999
15470.000 – 74.999
10265.000 – 69.999
5760.000 – 64.999
2555.000 – 59.999
750.000 – 54.999
FrecuenciaSalarios ( $ )
Respuesta:
acum
g) Determinar la frecuencia relativa
8 / 206 = 0,03885.000 – 89.999
16 / 206 = 0,07780.000 – 84.999
28 / 206 = 0,13575.000 – 79.999
52 / 206 = 0,25270.000 – 74.999
45 / 206 = 0,21865.000 – 69.999
32 / 206 = 0,15560.000 – 64.999
18 / 206 = 0,08755.000 – 59.999
7 / 206 = 0,03350.000 – 54.999
Frecuencia relativaSalarios ( $ )
Respuesta:
h) Determinar la frecuencia relativa porcentual
3,885.000 – 89.999
7,780.000 – 84.999
13,575.000 – 79.999
25,270.000 – 74.999
21,865.000 – 69.999
15,560.000 – 64.999
8.755.000 – 59.999
3,350.000 – 54.999
Frecuencia relativaSalarios ( $ )
Respuesta:
%
Ejercicio
Después de medir las alturas de 40 alumnos de un curso,
resultaron los siguientes valores de la variable:
154 178 150 166 182 175 163 175 150 162
152 155 161 165 160 159 160 168 165 162
163 155 157 161 162 155 167 164 162 158
158 163 166 167 156 164 170 176 172 160
a) Determina el rango
Respuesta:
182 - 150 = 32
b) Determina 7 intervalos:
Respuesta: El rango es 32. Luego, 32 : 7= 4,5 (5 amplitud )
Intervalo
150 – 154
155 – 159
160 – 164
165 – 169
170 – 174
175 – 179
180 – 184
c) Determinar la frecuencia
Respuesta:
180 – 184
175 – 179
170 – 174
165 – 169
160 – 164
155 – 159
150 – 154
Intervalo
1
4
2
7
14
8
4
Frecuencia
d) Determinar la marca de clase de los intervalos
Respuesta:
180 – 184
175 – 179
170 – 174
165 – 169
160 – 164
155 – 159
150 – 154
Intervalo
182
177
172
167
162
157
152
M de Ce) Determinar el límite
real inferior del tercer
intervalo
Respuesta:
Lri = 159 + 160 = 159,5
2
f) Determinar el límite real superior del quinto intervalo
Respuesta:
Lrs = 174 + 175 = 174,5
2
g) Determinar la frecuencia acumulada
Respuesta:
180 – 184
175 – 179
170 – 174
165 – 169
160 – 164
155 – 159
150 – 154
Intervalo
40
39
35
33
26
12
4
F. acumh) Determinar la frecuencia
relativa porcentual
Respuesta:
180 – 184
175 – 179
170 – 174
165 – 169
160 – 164
155 – 159
150 – 154
Intervalo
2,5
10
5
17,5
35
20
10
F. Relat %
i) ¿Cuántos alumnos miden menos de 160 ?
Respuesta: 12 alumnos miden menos de 160
j) ¿Qué porcentaje de alumnos mide entre 170 y 174 ?
Respuesta: El 5% de los alumnos miden entre 170 y 174
k) ¿Qué porcentaje de alumnos mide entre 160 y 174 ?
Respuesta: El 57,5 % de los alumnos mide entre 160 y 174
l) ¿Cuál es la frecuencia total ?
Respuesta: n = 40
m) ¿Cuál es la amplitud del intervalo ?
Respuesta: c = Lrs – Lri = 159,5 - 154,5 = 5
Medidas de tendencia central en datos agrupados
Ejemplo:
85 – 89
80 – 84
75 – 79
70 – 74
65 – 69
60 – 64
Intervalo
4
16
12
8
5
5
Frecuencia Marca de clase
62
67
72
77
82
87
f • x
310
335
576
924
1312
348
X = 3805
50
X = 76,1
Media aritmética: Se suma el producto de la marca de clase con
la frecuencia y se divide por la frecuencia total.
En forma general : X = f • x
f
Mediana: Es calcular un valor que separa al conjunto en dos
grupos de igual cantidad.
Para calcular la mediana se ocupa la siguiente formula:
Me = L i m + (n/2 – f( acum. ant ) ) • c
f m
L i m = límite real inferior del intervalo mediano ( primer intervalo
cuya frecuencia acumulada es igual o mayor que n/2 )
n / 2 = mitad de la frecuencia total
f( acum. ant ) = frecuencia acumulada del intervalo anterior al
intervalo mediano
c = amplitud del intervalo
f m = frecuencia absoluta del intervalo mediano
Ejemplo
Hallar la mediana de los pesos de 40 estudiantes, dado en la
siguiente tabla de distribución
402172 – 180
384163 – 171
345154 – 162
2912145 – 153
179136 – 144
85127 – 135
33118 – 126
F acumFrecuenciaIntervalo
n = 40
n / 2 = 40 / 2 = 20
L i m = 144 + 145 = 144,5
2
f ( acum. ant ) = 17
c = 144,5 + 153,5 = 9
f m = 12
M e = 144,5 + ( 20 – 17 ) • 9 = 144,5 + 3 • 9 = 144,5 + 27 = 146,75
12 12 12
Ejemplo 2
Las edades de los obreros que trabajan en una empresa constructora,
se distribuyen como sigue:
Edad Frecuencia
18 – 22 15
23 – 27 26
28 – 32 30
33 – 37 38
38 – 42 32
43 – 47 20
48 – 52 12
53 – 57 7
n = 180
n / 2 = 180 / 2 = 90F acum
15
41
71
109
141
161
173
180
L i m = 32 + 33 = 32,5
2f( acum ant) = 71
c = 5
f m = 38
Me = L i m + (n/2 - f(acum ant)) • c
fm= 32,5 + ( 90 - 71) • 5
38= 32,5 + 19 • 5
38= 32,5 + 2,5
Me = 35
Moda
Cuando los datos están agrupados en intervalos, la moda
corresponde a la marca de clase del intervalo de mayor
frecuencia
Ejemplo: La tabla de distribución muestra el número de horas
que un grupo de jóvenes dedica a ver televisión diariamente.
Horas frecuencia
0 – 2 25
3 – 5 35
6 – 8 25
9 – 11 10
12 - 14 5
El intervalo modal es [3 - 5]
Luego, se dice que la moda es su marca
de clase.
M de C = 3 + 5 = 4 Mo = 4 horas
2
Representación gráfica en datos agrupados
Histograma: Es un gráfico de barras verticales que sirve para
representar los datos de una distribución de frecuencias
en la cual los valores de la variable están agrupados en
intervalos.
Las bases de las barras o rectángulos están sobre el eje horizontal y
su ancho ( longitud sobre el eje) es igual al tamaño de los intervalos
de clase.
El histograma tiene la siguiente característica:
Ejemplo:
Esta tabla de distribución de frecuencias indica las edades de los
alumnos que asisten a clases de Inglés.
Edad frecuencia
5 – 7 8
8 – 10 10
11 – 13 7
14 – 16 5
17 – 19 4
2
4
6
8
10
5- 7 8-10 11-13 14-16 17-19I
f
Eje x = intervalos
Eje y = frecuencia
Polígono de frecuencia
Es la modalidad de un gráfico de datos que se origina al unir
los puntos medios de los lados superiores de las barras de un
histograma.
6 9 12 15 18
2
4
6
8
10
x
f
•
•
•
••
El punto medio
de cada intervalo
es la marca de
clase
Ejercicio
Dada la tabla de distribución de edades de un grupo de padres
cuyos hijos están en primer año de universidad.
Hallar: a) media aritmética b) Mediana c) Moda
Edad frecuencia
45 – 48 2
49 – 52 5
53 – 56 12
57 – 60 8
61 – 64 5
a) Media aritmética
Edad f x f • x
45 – 48 2 46,5 93
49 – 52 5 50,5 252,5
53 – 56 12 54,5 654
57 – 60 8 58,5 468
61 – 64 5 62,5 312,5
X = f • x = 1780 = 55,625
n 32
¡ Puff……!
b) Mediana
32561 – 64
27857 – 60
191253 – 56
7549 – 52
2245 – 48
F acumfEdad
n = 32
n / 2 = 32 / 2 = 16
L i m = 52 + 53 = 52,5
2
f (acum ant) = 7
c = 56,5 - 52,5 = 4
f m = 12
Me = 52,5 + ( 16 – 7 ) • 4 = 52,5 + 9 • 4 = 55,5
12 12
:
El intervalo modal es [53 - 56] . Luego. La moda es su marca
de clase: 53 + 56 = 54,5
2
c) Moda:
* Construye una tabla de distribución de frecuencias de datos
agrupados en intervalos de clase. Considera como limite
inferior del primer intervalo = 10 y c = 10
El puntaje obtenido por 130 alumnos en una prueba de biología
es el siguiente:
12 45 53 85 23 91 34 56 65 70 72 74 86
95 32 45 56 58 33 49 55 70 66 62 64 55
83 26 34 72 60 64 72 80 58 98 50 20 35
76 68 90 99 56 48 56 68 82 40 92 38 56
84 66 78 74 25 15 48 50 66 49 53 83 91
42 64 72 54 89 92 28 34 40 56 64 68 63
35 56 66 38 82 78 74 90 85 66 70 72 58
66 80 80 95 96 99 94 40 42 58 65 67 81
90 50 48 52 62 70 80 93 45 36 49 81 73
56 38 51 23 90 84 96 75 38 28 36 83 29
Respuesta:
Intervalo
10 – 19
20 – 29
30 – 39
40 – 49
50 – 59
60 – 69
70 – 79
80 – 89
90 - 99
M. de Clase
14,5
24,5
34,5
44,5
54,5
64,5
74,5
84,5
94,5
frecuencia
2
8
13
14
22
20
17
17
17
F. acum.
2
10
23
37
59
79
96
113
130
F. Relat
0,015
0,061
0,100
0,107
0,169
0,153
0,130
0,130
0,130
F. Relat.%
1,5
6,1
10,0
10,7
16,9
15,3
13,0
13,0
13,0
De acuerdo con la tabla anterior, responder las siguientes
preguntas:
a) ¿Cuántos alumnos obtuvieron entre 30 y 49 puntos?
Respuesta: Hay 27 alumnos
b) ¿Cuántos alumnos obtuvieron entre 60 y 89 puntos?
Respuesta: Hay 54 alumnos
c) ¿Cuántos alumnos obtuvieron entre 40 y 99 puntos?
Respuesta: Hay 107 alumnos
d) ¿Qué porcentaje de alumnos obtuvieron entre 30 y 49 puntos?
Respuesta: El 20,7 % de los alumnos
e) ¿Qué porcentaje de alumnos obtuvo entre 50 y 59 puntos?
Respuesta: el 16,9 % de alumnos
f) ¿Cuántos alumnos obtuvieron menos de 60 puntos?
Respuesta: 59 alumnos
g) ¿Cuántos alumnos obtuvieron menos de 30 puntos?
Respuesta: 10 alumnos
h) ¿Cuántos alumnos obtuvieron 50 o más puntos?
Respuesta: 93 alumnos
i) ¿Cuántos alumnos obtuvieron 70 o más puntos?
Respuesta: 51 alumnos
j) ¿Qué porcentaje de alumnos obtuvo menos de 20 puntos?
Respuesta: 1,5 % de los alumnos
k) ¿Cuál es la marca de clase que representa al intervalo de
mayor frecuencia?
Respuesta: la marca de clase de mayor frecuencia es 54,5
l) ¿Cuál es el límite aparente superior del tercer intervalo?
Respuesta: 39
m) ¿Cuál es el límite real inferior del quinto intervalo?
Respuesta: 49,5
n) ¿Cuál es la amplitud del intervalo?
Respuesta: c = 10
n) Calcula la media aritmética:
Respuesta:
Intervalo
10 – 19
20 – 29
30 – 39
40 – 49
50 – 59
60 – 69
70 – 79
80 – 89
90 - 99
M. de Clase
14,5
24,5
34,5
44,5
54,5
64,5
74,5
84,5
94,5
f • x
29
196
448,5
623
1199
1290
1266,5
1436,5
1606,5
X = f • x
n
17
17
17
20
22
14
13
8
2
frecuencia
n = 130
X = 8095
130
X = 62,26
ñ) Calcula la mediana:
Respuesta:
Intervalo
10 – 19
20 – 29
30 – 39
40 – 49
50 – 59
60 – 69
70 – 79
80 – 89
90 - 99 17
17
17
20
22
14
13
8
2
frecuencia
n = 130
F. acum.
2
10
23
37
59
79
96
113
130
n / 2 = 130 / 2 = 65
L i m = 59,5 c = 10
f(acum. ant) = 59
f m = 20
Me = 59,5 + ( 65 – 59 ) • 10
20
Me = 59,5 + 6 • 10
20
Me = 59,5 + 3 = 62,5
o) Calcular el intervalo modal y la moda :
Respuesta:
El intervalo modal es [50 - 59] porque tiene la mayor
frecuencia , que es 22.
La moda corresponde a la marca de clase de ese intervalo.
Luego, Mo = 50 + 59 = 54,5
2
a + b = c
Ejercicios
Calcular el rango entre. 3,22 2,93 3.01 4,48 5,06 4.31
2,98 3,07
Repuesta: 5,06 - 2,98 = 2,08
El siguiente cuadro muestra el consumo anual en Chile de
kilogramos de carne de bovino per cápita.
Año 1984 1985 1986 1987 1988 1989 1990 1991 1992 1996
Consumo 17,0 15,0 14,7 14,0 15,6 17,3 18,5 18,1 17,6 20,0
a) Calcular el consumo promedio desde 1986 hasta 1992
Respuesta: X = 115,8 = 16,54
7
b) Calcular el consumo promedio de los 10 años?
Respuesta: X = 1678 = 16,78
10
La siguiente tabla representa las medidas de una pieza de
motores
Intervalo Frecuencia
100 – 109 4
110 – 119 17
120 – 129 29
130 – 139 18
140 – 149 10
150 – 159 5
160 – 169 2
Dibuja en un mismo gráfico el
histograma y el polígono de
frecuencias.
Respuesta:
f
104,5 114,5 124,5 134,5 144,5 154,5 164,5
4
18
29
10
•
•
•
•
••
•
Marca de clase
Dado las siguientes frecuencias, calcular la mediana,
la moda y la media aritmética
6 - 7 - 7 - 3 - 4 - 1 - 7 - 5
Respuesta:
Me : Para calcular la mediana se deben ordenar las frecuencias:
1 - 3 - 4 - 5 - 6 - 7 - 7 - 7
Luego, 5 + 6 = 11 = 5,5 Me = 5,5
2
Mo = La moda es 7 , porque es la frecuencia que más se repite
X = 6 + 7 + 7 + 3 + 4 + 1 + 7 + 5 = 40 = 5
8 8
Las notas obtenidas por 45 alumnos en una prueba de
Estadística son:
Notas Frecuencia
1 1
2 4
3 5
4 6
5 9
6 12
7 8
Determinar : Mo, Me y X
Respuesta:
X = 1•1 + 2 • 4 + 3 • 5 + 4 • 6 + 5 • 9 + 6 • 12 + 7 • 8 = 221 = 4,9
45 45
Me = Como n / 2 = 45 / 2 = 22,5
Luego. la mediana es 5 , pues es el primer
valor de la variable cuya f(acum.) es igual o
mayor que 22,5
Mo = La moda es 6 pues es el valor que tiene mayor frecuencia
absoluta
Percentiles, Deciles y Cuartiles
La mediana de un conjunto de datos ordenados, es el valor que
los separa en dos partes iguales.
Existen otros valores típicos que dividen a un conjunto de datos
numéricos en una cierta cantidad de partes iguales; éstos son:
Percentiles, Deciles y Cuartiles.
P50 = 52 % = Me
Percentiles
Los percentiles de una distribución de datos numéricos son
los 99 valores que la dividen en 100 partes iguales.
Los percentiles se designan por: P1 , P2 , P3 , .............P99
Se lee: P1 = percentil 1 P2 = percentil 2 ............etc.
0 P1 P2 P3 ........................................................P99.
Ejemplo:
•En la distribución de notas de un grupo de alumnos, el
P45 es una nota de referencia que permite afirmar que el
45 % de esos alumnos obtuvo esa nota o una menor.
El cálculo de percentiles se hace de la misma forma como se
obtiene la mediana, en una distribución.
Ejemplo: Considerar la distribución de frecuencias de los
212 puntajes de P:A:A: para calcular P45 .
Puntaje frecuencia Frec. Acum.
350 – 399 4 4
400 – 449 6 10
450 – 499 9 19
500 – 549 20 39
550 – 599 31 70
600 – 649 80 150
650 – 699 42 192
700 – 749 10 202
750 – 799 8 210
800 – 849 2 212
Respuesta:
Se calcula el 45% de 212:
212 = 100% x = 212 • 45
x 45 % 100
x = 95,4
La frecuencia acumulada 95,4 se
encuentra en la clase 600 - 649
L r i p = 599 + 600 = 599,5
2
f (acum. ant) = 70
c = 50 f p = 80
P45 = L r i p + [ % - f (acum. ant)] • c
f p
P45 = 599,5 + ( 95,4 – 70 ) • 50
80
= 599,5 + 15,875
= 615,375
Este valor significa que el 45 % de los alumnos obtuvo
puntajes menores o iguales a 615,3.
Considerar la misma distribución anterior para calcular
P8.
Respuesta:
Calcular el 8 % de 212: 212 = 100 % x = 212 • 8 = 16,96
x 8 % 100
Este valor de la frecuencia acumulada se encuentra en la clase
450 – 499
L r i p = 449 + 450 = 449,5
2
F(acum. ant) = 10 c = 50 f p = 9
P8 = 449,5 + ( 16,96 – 10) • 50
9= 449,5 + 38,66
= 488,16
Ejercicio de percentil
Puntaje frecuencia Frec. Acum.
350 – 399 4 4
400 – 449 6 10
450 – 499 9 19
500 – 549 20 39
550 – 599 31 70
600 – 649 80 150
650 – 699 42 192
700 – 749 10 202
750 – 799 8 210
800 – 849 2 212
Dada la tabla de distribución, determinar qué porcentaje de los
alumnos obtuvieron entre 400 y 600 puntos.
Respuesta:
400 puntos corresponde a un
percentil que se desconoce, por
lo que se simboliza por Px .
Además se sabe que corresponde
al segundo intervalo, y que su
L r i p = 399,5
El % buscado es: x •100
212F(acum. ant) = 4
f p = 6 c = 50
Px = 399,5 +6
4100
212.x
• 50
400 = 399,5 + 50.6
412,2 x
400 – 399,5 = 50.6
412,2 x
= 0,5 • 6
502,12 x – 4
0,06 + 4 = 2,12 x
4,06
2,12= x 1,9 % = x
600 puntos corresponde a un percentil desconocido, por lo
que se simboliza por Py
Además se sabe que está ubicado en el sexto intervalo, y que
su L r i p = 599,5 f(acum. ant) = 70 f p = 80 c = 50
El % buscado es x • 100
212
Entonces: Py = 599,5 + 50.80
70100
212.y
600 – 599,5 = 50.80
70100
212.y
0,5 • 80
50= 2,12 y - 70
0,8 + 70
2,12= y y = 33,3 %
La diferencia entre
ambos porcentajes
corresponde al
porcentaje pedido.
33,3 – 1,9 = 31,4 %
Calcular qué porcentaje de los 212 alumnos tuvieron
resultados entre 620 y 680 puntos.
Respuesta:
620 puntos corresponde a un percentil que se desconoce y se designa
por Px.
Entonces, Px = 599,5 +
80
70100
212.x
• 50
620 = 599,5 +
x = 48,4 %
620 – 599,5 = 50.80
7012,2 x
20,5 • 80
50
= 2,12x – 70
50.80
7012,2 x
680 puntos corresponde a un percentil que se desconoce y se
designa por Py.
Py = 649,5 +
680 = 649,5 +
x = 82,8 %( 680 – 649,5 ) • 42
50= 2,12y - 150
Así, la diferencia entre ambos porcentajes corresponde al porcentaje
de alumnos que tienen entre 620 y 680 puntos.
82,8 % - 48,4 % = 34,4 = 34,4 % de los alumnos
50.42
150100
212.y
50.42
15012,2 y
Deciles
Los deciles de una distribución de datos numéricos son los 9
valores que la dividen en 10 partes iguales.
Los deciles se designan por D1 , D2 , D3 , ...........D9
Se leen: Decil 1 , decil 2 .......decil 9
0 D1 D2 D3 D4 D5 D6 D7 D8 D9
Para calcular deciles, se hace de la misma forma que los
percentiles.
Ejemplo: Considerar la siguiente tabla de distribución para
calcular D3
Puntaje frecuencia Frec. Acum.
350 – 399 4 4
400 – 449 6 10
450 – 499 9 19
500 – 549 20 39
550 – 599 31 70
600 – 649 80 150
650 – 699 42 192
700 – 749 10 202
750 – 799 8 210
800 – 849 2 212
Para calcular el tercer decil (D3)
se tiene que tener en cuenta que
corresponde al 30 % inferior
de los datos de la distribución.
Se calcula el 30% de 212 212 = 100%
x 30% x = 63,6
Esta cantidad de datos corresponde a la clase 550 – 599
L r i = 549 + 550 = 549,5
2
f(acum. ante) = 39 c = 50
f d = 31
D3 = 549,5 + ( 63,6 – 39 ) • 50
31
= 549.5 + 39,6
= 589,1
El 30 % de los 212 alumnos tiene un puntaje igual o menor que
589,1 puntos.
Calcular el D7
Respuesta:
El 70% de 212 = 148,4
El límite real inferior de la clase 600 – 649 es 599,5
f(acum. ant) = 70 f d = 80 c = 50
D7 = 599,5 + 50.80
704,148
D7 = 599,5 + 49
D7 = 648,5 puntos
NOTA: Se ha calculado D3 y D7 , entonces se puede concluir que
el 40% de los 212 alumnos obtuvo entre 589,2 y 648,5
puntos.
Cuartiles
Los Cuartiles de una distribución de datos numéricos son los
tres valores que la dividen en 4 partes iguales
Los cuartiles se designan por: Q1 , Q2 y Q3
Q1 Q2 Q3
Q1 es el primer cuartil y corresponde al 25% inferior
Q2 es el segundo cuartil y corresponde al 50% inferior
Q3 es el tercer cuartil y corresponde al 75% inferior
Los cuartiles se calculan de la misma forma que los percentiles
y los deciles.
Calcular el tercer cuartil, de la siguiente distribución
Puntaje frecuencia Frec. Acum.
350 – 399 4 4
400 – 449 6 10
450 – 499 9 19
500 – 549 20 39
550 – 599 31 70
600 – 649 80 150
650 – 699 42 192
700 – 749 10 202
750 – 799 8 210
800 – 849 2 212
Respuesta:
El 75% de 212 = 159
L r i q = 649,5 c = 50
f(acum. ant) = 150 f q = 42
Q3 = 649,5 + 50.42
150159
Q3 = 649,5 + 10,7
Q3 = 660,2
El 75% de los alumnos tiene un puntaje igual o inferior a 660,2 puntos,
lo que significa que el 25% de ellos tiene un puntaje igual o superior
a 660,2
Un curso rindió una prueba de Matemática, ¿Qué se puede
decir del resultado, si se sabe que en la distribución de las
notas se obtuvo: Q2 = 5,8 y Q3 = 6,5 ?
Respuesta:
Es conveniente ver la situación en forma gráfica:
5,8 6,525%
50%
Se puede afirmar que:
* El 50% del curso obtuvo una calificación superior a 5,8
* El 25% mejor preparado logró notas superiores al 6,5
Medidas de dispersión
Al grado en que los datos numéricos tienden a extenderse
alrededor de un valor medio se le llama variación o dispersión
Las medidas de dispersión más utilizadas son:
* Rango
* Desviación media
* Desviación típica o estándar.
Rango
El rango de un conjunto de datos numéricos es la diferencia
entre el mayor y el menor de ellos.
Ejemplo:
Un alumno obtuvo las siguientes notas parciales en Matemática:
2 - 3,9 - 5 - 5,9 - 6,2
El rango es 4,2 ya que es la diferencia entre 6,2 y 2
¿Qué significado tiene el rango de notas 4,2 respecto de las
notas de otro alumno cuyo rango es 2,1?
En el primer caso las notas están más dispersas que en el
segundo. No se sabe en que caso son mejores; para
determinarlo es necesario más información.
Desviación Media
La desviación de un puntaje x con respecto a la media
aritmética x está dada por la diferencia d = x - x
Ejemplo:
Un alumno obtuvo las siguientes notas en la asignatura de
Biología: 3,9 - 2 - 5 - 6,2 - 5,9 Calcular la desviación
de ellas.
Respuesta:
Primero se debe calcular el promedio.
x = 3,9 + 2 + 5 + 6,2 +5,9 = 23 = 4,6
5 5
Ahora se calcula la diferencia de cada nota con el promedio
d = 3,9 – 4,6 = - 0,7 d = 2 – 4,6 = - 2,6
d = 5 – 4,6 = 0,4 d = 6,2 – 4,6 = 1,6
d = 5,9 – 4,6 = 1,3
NOTA: La suma de las desviaciones de todos los datos con
respecto a la media aritmética es igual a cero.
Ejemplo:
-0,7 + 0,4 + 1,3 + -2,6 + 1,6 = 0
La desviación media de n datos numéricos x1, x2, ......xn
es la media aritmética de los valores absolutos de las
desviaciones de todos los datos con respecto a su promedio.
Se designa por DM n = frecuencia total
DM = |x1 – x | + |x2 – x | +.........|xn – x |
n
Ejemplo:
DM = |-2,6 | + |-0,7 | + |0,4 | + |1,3 | + |1,6 | = 6,6 = 1,3
5 5
El valor 1,3 es la desviación media de todas las notas dadas.
Un alumno obtuvo las siguientes calificaciones en la
asignatura de Inglés: 3,2 - 6 - 6,8 - 4,3 - 2,9 - 5,7
Calcular la desviación media de las notas.
Respuesta:
x = 3,2 + 6 + 6,8 + 4,3 + 2,9 + 5,7 = 28,5 = 4,8
6 6
| 3,2 – 4,8 | = 1,6 | 6 – 4,8 | = 1,2 | 6,8 – 4,8 | = 2
| 4,3 – 4,8 | = 0,5 | 2,9 – 4,8 | = 1,9 | 5,7 – 4,8 | = 0,9
Luego, DM = 1,6 + 1,2 + 2 + 0,5 + 1,9 + 0,9 = 8,1 = 1,3
6 6
El valor 1,3 es la desviación media de todas las notas dadas.
Desviación media en datos agrupados
La siguiente tabla muestra los puntajes obtenidos en P.A.A.
con un promedio de 614 puntos. Calcular la desviación media.
Puntajes Frecuencia
350 – 399 4
400 – 449 6
450 – 499 9
500 – 549 20
550 – 599 31
600 – 649 80
650 – 699 42
700 – 749 10
750 – 799 8
800 – 849 2
•Primero se debe sacar
la marca de clase.x
374,5
424,5
474,5
524.5
574.5
624.5
674.5
724.5
774.5
824.5
•Se debe obtener la
desviación |x – x |
210.5
160.5
110.5
60.5
10.5
39.5
89.5
139.5
189.5
239.5
| x – x |
•Se realiza el producto de la
frecuencia con la desviación
•Se obtiene la sumatoria
del producto
12556*Considerar la frecuencia
total.212
421
1284
1105
2541
840
1224.5
1790
1255.5
1137
958
f • |x – x |
Con todos los datos se aplica la fórmula de la desviación media
DM = f • | x – x |
nDM = 12556 = 59,2 puntos
212
Se puede decir que los puntajes se desvían, en promedio, 59,2
puntos con respecto a la media.
Hay que considerar que algunos puntajes son inferiores a ella
y otros superiores.
Si los puntajes estuvieran más agrupados en torno al promedio,
es decir, menos dispersos, el valor de DM sería menor.
Calcular la DM de la siguiente distribución que representa
las horas diarias dedicadas al estudio de 20 alumnos
Horas Frecuencia
0 – 2 5
3 – 5 7
6 – 8 6
9 - 11 2
Respuesta:
a) Obtener la marca de clase
x
1
4
7
10
* Determinar el promedio
b) Multiplicar f • x
c) Obtener f • x
95
d) Frecuencia total
20
* Determinar | x – x |
f • x
5
28
42
20 5,3
2,3
0,7
3,7
| x – x |
* Determinar f • |x – x |
10,6
13,8
4,9
18,5
f • |x – x |
* Obtener f • | x – x |
47,8
* Finalmente se determina la DM
Las horas diarias se desvían en 2,3
puntos con respecto a la media.
DM = 47,8 = 2,3
20
e) x = 95 = 4,7
20
Calcula la desviación media de las medidas de una pieza
de motores, dada por la siguiente tabla:
x
104,5
114,5
124,5
134,5
144,5
154,5
164,5
*Se calcula | x – x |
2160 – 169
5150 – 159
10140 – 149
18130 – 139
29120 – 129
17110 – 119
4100 – 109
frecuenciaIntervalo
85
329
772,5
1445
2421
3610,5
1946,5
418
x • f
10942.5
Respuesta:
* Marca de clase (x)
* Se calcula f • | x – x |
923
* Sumatoria del producto
71,6
129
158
104,4
121,8
241,4
96,8
f • | x – x |
DM = 923 = 10,8
85
Las medidas se desvían
en promedio de 10,8
puntos con respecto a
la media.
35,8
25,8
15,8
5,8
4,2
14,2
24,2
| x – x |
* x = 10942,5 = 128,7
85
Desviación típica o estándar
La desviación típica o estándar expresa el grado de dispersión
de los datos con respecto al promedio y corresponde a la raíz
cuadrada de la media del cuadrado de las desviaciones de dichos
datos con respecto a su media aritmética.
La desviación típica se simboliza por la letra S
En forma general:
S =
n
x
nk
k
k x1
2)(
Ejercicios
Calcular la desviación típica de las siguientes notas de
Matemática: 2,0 - 3,9 - 5,0 - 5,9 - 6,2
Respuesta:
* Primero se debe obtener el promedio
x = 2,0 + 3,9 + 5,0 + 5,9 + 6,2 = 4,6
5* Se calcula la desviación típica
S =
5
)6,42,6()6,49,5()6,45()6,49,3()6,42(22222
S = 5
5,26,11,04,07,6
5
3,11=
2,2= = 1,4
Luego, la desviación típica de las notas es 1,4 con respecto
al promedio
Si de estas notas descartáramos el 2, la nota más alejada del
promedio, entonces la desviación típica sería S = 1,04 ; este
valor es menor que 1,4.
Las notas consideradas, sin la nota 2, tendrían una dispersión
menor, es decir, estarían más centradas.
Calcular la desviación típica de las siguientes notas:
5,2 - 4,9 - 5 - 5,1 - 5,2 - 5,3 - 4,9 - 5,2
Respuesta:
* Se obtiene el promedio x = 5,1
* S =
8
1,02,02,01,001,02,01,022222222
S = =
02,0S = = 0,1Este valor es considerablemente menor que el ejercicio anterior. Se
debe a que los datos son más homogéneos que en la otra distribución,
presentan escasa dispersión con respecto al promedio.
8
01,004,004,001,0001,004,001,0
8
16,0
Desviación típica en datos agrupados
Calcular la S de la siguiente distribución que representa
las horas diarias dedicadas al estudio de 20 alumnos, con un
promedio de 4,7
Horas Frecuencia
0 – 2 5
3 – 5 7
6 – 8 6
9 - 11 2
•Primero se debe sacar la marca de clase.
x
1
4
7
10
* Determinar las desviaciones
5,3
2,3
0,7
3,7
| x – x |
* Obtener la desviación al cuadrado
28,09
5,29
0,49
13,69
| x – x | 2
* Producto de la frecuencia con la desviación al cuadrado.
56,18
31,74
3,43
68,45
f •| x – x | 2* f •| x – x | 2
159,8
* Se calcula S
20
8,159S =
9,7S =
2,8S =
Puntajes Frecuencia
350 – 399 4
400 – 449 6
450 – 499 9
500 – 549 20
550 – 599 31
600 – 649 80
650 – 699 42
700 – 749 10
750 – 799 8
800 – 849 2
La siguiente tabla muestra los puntajes obtenidos en P.A.A.
con un promedio de 614 puntos. Calcular la desviación típica
* Calcular marca de clase
x
374.5
424.5
474.5
524.5
574.5
624.5
674.5
724.5
774.5
824.5
* Calcular las desviaciones
* Determinar las desviaciones al cuadrado
* determinar f • |x – x |2
44310.25
25760.25
12210.25
3660.25
110.25
1560.25
8010.25
19460.25
35910.25
57360.25
| x – x |2
88620.5
206082
122102.5
153730.5
8820
48367.75
160205
175142.25
215461.5
229441
f • | x – x |2
* Determinar la sumatoria del producto
1407973
S =
= 81,4
Entonces,
S = 81,4
210.5
160.5
110.5
60.5
10.5
39.5
89.5
139.5
189.5
239.5
| x – x |
212
1407973
3.6641=
La siguiente tabla muestra el número de brazadas dadas
por 100 nadadores en la prueba de 200 m crol. Calcular S
Brazadas frecuencia
200 – 204 8
205 – 209 12
210 – 214 15
215 – 219 18
220 – 224 16
225 – 229 14
230 – 234 10
235 – 239 7
Respuesta:
* Promedio
a) Marca de clase
x
202
207
212
217
222
227
232
237
b) f • x
f • x
1616
2484
3180
3906
3552
3178
2320
1659
c) f • x
21895
* Calcular las desviaciones
18.1
13.1
8.1
3.1
1.9
6.9
11.9
16.9
| x – x |
100
21895d) x = = 218.9
* Desviaciones al cuadrado
327.61
171.61
65.61
9.61
3.61
47.61
141.61
285.61
| x – x | 2
* f • | x – x |2* del producto
2293.27
1716.1
918.54
153.76
64.98
714.15
1699.32
2284.88
F •|x – x |2
9845
S =100
9845
S = 45,98
S = 9,9
Las brazadas
están a 9,9
puntos con
respecto al
promedio
Varianza
La varianza de un conjunto de datos se define como el cuadrado
de la desviación típica
Se simboliza por S2
S2 =
n
xx
nk
k 1
2)(
El cálculo de la varianza es similar a la desviación típica
Un alumno obtuvo las siguientes notas en la asignatura de
Biología: 3,9 - 2 - 5 - 6,2 - 5,9 Calcular la varianza
de ellas.
Respuesta:
Primero se debe calcular el promedio.
x = 3,9 + 2 + 5 + 6,2 +5,9 = 23 = 4,6
5 5
* Calcular las desviaciones
|3,9 – 4,6 | = 0,7 | 2 – 4.6 | = 2,6 | 5 – 4,6 | = 0,4
| 6,2 – 4,6 | = 1,6 | 5,9 – 4,6 | = 1,3
* Calcular las desviaciones al cuadrado
0,72 = 0,49 2,62 = 6,76 0,42 = 0,16 1,62 = 2,56 1,32 = 1,69
* Calcular S2
S2 = 0,49 + 6,76 + 0,16 + 2,56 + 1,69 = 11,66
5= 2,3
Calcular la Varianza de la siguiente distribución que representa
las horas diarias dedicadas al estudio de 20 alumnos, con un
promedio de 4,7
Horas Frecuencia
0 – 2 5
3 – 5 7
6 – 8 6
9 - 11 2
•Primero se debe sacar la marca de clase.
x
1
4
7
10
* Determinar las desviaciones
5,3
2,3
0,7
3,7
| x – x |
* Obtener la desviación al cuadrado
28,09
5,29
0,49
13,69
| x – x | 2
* Producto de la frecuencia con la desviación al cuadrado.
56,18
31,74
3,43
68,45
f •| x – x | 2 * f •| x – x | 2
159,8
* Se calcula S2
S2 = 20
8,159
S2 = 7,9
Luego, la varianza es
7,9