Variable Estadística -...

92
Variable Estadística U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 1 1.- Los aficionados al béisbol aprenden de memoria las estadísticas de este juego. Por ejemplo, ¿cuántos “home runs” (golpes que envían la pelota fuera del campo de juego) son necesarios para liderar la liga? La tabla contiene los líderes de la liga americana y el total de “home runs” entre 1972 y 1991: Año Jugador “Home runs” Año Jugador “Home runs” 1972 Dick Allen 37 1982 Thomas and Jackson 39 1973 Reggie Jackson 32 1983 Jim Rice 39 1974 Dick Allen 32 1984 Tony Armas 43 1975 Sccot and Jackson 36 1985 Darrell Evans 40 1976 Graig Nettles 32 1986 Jesse Barfield 40 1977 Jim Rice 39 1987 Mark McGwire 49 1978 Jim Rice 46 1988 Jose Canseco 42 1979 Gorman Thomas 45 1989 Fred McGriff 36 1980 Reggie Jackson 41 1990 Cecil Fielder 51 1981 Four players 22 1991 Canseco and Fielder 44 Se pide: a) construir el diagrama de barras. b) El polígono de frecuencias. c) Diagrama de frecuencias acumuladas. d) Moda y mediana. La media de golpes para los 167 jugadores de la liga americana que intentaron batear más de 200 veces en la temporada de 1980 viene representada en la siguiente tabla: CLASE FRECUENCIA CLASE FRECUENCIA CLASE FRECUENCIA 0,185-0,195 1 0,255-0,265 16 0,325-0,335 4 0,195-0,205 3 0,265-0,275 18 0,335-0,345 1 0,205-0,215 1 0,275-0,285 23 0,345-0,355 1 0,215-0,225 4 0,285-0,295 23 0,355-0,365 0 0,225-0,235 13 0,295-0,305 16 0,365-0,375 0 0,235-0,245 20 0,305-0,315 3 0,375-0,385 0 0,245-0,255 15 0,315-0,325 4 0,385-0,395 1 e) Dibujar el histograma, polígono de frecuencias y diagrama de frecuencias acumuladas. f) Calcular media, moda, mediana, varianza, desviación típica, coeficiente de variación, sesgo y curtosis. g) ¿Cuál es el percentil correspondiente a un jugador cuyo promedio es 0,315? h) Dibujar el diagrama de cajas.

Transcript of Variable Estadística -...

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 1

1.- Los aficionados al béisbol aprenden de memoria las estadísticas de este juego. Por

ejemplo, ¿cuántos “home runs” (golpes que envían la pelota fuera del campo de juego)

son necesarios para liderar la liga? La tabla contiene los líderes de la liga americana y el

total de “home runs” entre 1972 y 1991:

Año Jugador “Home

runs”

Año Jugador “Home

runs”

1972 Dick Allen 37 1982 Thomas and Jackson 39

1973 Reggie Jackson 32 1983 Jim Rice 39

1974 Dick Allen 32 1984 Tony Armas 43

1975 Sccot and Jackson 36 1985 Darrell Evans 40

1976 Graig Nettles 32 1986 Jesse Barfield 40

1977 Jim Rice 39 1987 Mark McGwire 49

1978 Jim Rice 46 1988 Jose Canseco 42

1979 Gorman Thomas 45 1989 Fred McGriff 36

1980 Reggie Jackson 41 1990 Cecil Fielder 51

1981 Four players 22 1991 Canseco and Fielder 44

Se pide: a) construir el diagrama de barras. b) El polígono de frecuencias.

c) Diagrama de frecuencias acumuladas. d) Moda y mediana.

La media de golpes para los 167 jugadores de la liga americana que intentaron

batear más de 200 veces en la temporada de 1980 viene representada en la siguiente

tabla:

CLASE FRECUENCIA CLASE FRECUENCIA CLASE FRECUENCIA

0,185-0,195 1 0,255-0,265 16 0,325-0,335 4

0,195-0,205 3 0,265-0,275 18 0,335-0,345 1

0,205-0,215 1 0,275-0,285 23 0,345-0,355 1

0,215-0,225 4 0,285-0,295 23 0,355-0,365 0

0,225-0,235 13 0,295-0,305 16 0,365-0,375 0

0,235-0,245 20 0,305-0,315 3 0,375-0,385 0

0,245-0,255 15 0,315-0,325 4 0,385-0,395 1

e) Dibujar el histograma, polígono de frecuencias y diagrama de frecuencias acumuladas. f) Calcular media, moda, mediana, varianza, desviación típica, coeficiente de variación, sesgo y curtosis. g) ¿Cuál es el percentil correspondiente a un jugador cuyo promedio es 0,315? h) Dibujar el diagrama de cajas.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 2

2.- De una variable estadística se conocen los siguientes valores 1, 1, 2, 2, 2, 2, 3 y 3; si consideramos otra variable estadística con valores 1, 2, 2, 3, 3, 4, 4 y 5. Determinar la media, la mediana, la moda y la varianza de cada variable. ¿Cuál es la media, la mediana, la moda y la varianza de la variable estadística que resulta de unir las dos anteriores? Conocidas dos muestras de una misma variable con distintas medias y distinto tamaño ¿cuál es la media del resultado de unir dichas muestras?

3.-De una variable estadística se sabe que los momentos respecto al origen son: m0=1, m1=1, m2=2, m3=4 y el primer cuartil Q1=0.7. Calcular, coeficiente de asimetría, varianza, media, mediana y tercer cuartil.

4.- Dada la gráfica correspondiente a un polígono de frecuencias relativas acumulativo de una variable estadística agrupada en intervalos de una muestra de tamaño n=20. A) Formar la tabla de distribución de frecuencias absolutas. B) Dibujar el histograma y el polígono de frecuencias. D) Encontrar la mediana, moda y media.

Fi

0.15

5.- El porcentaje de disco ocupado (en Mbytes) para distintos usuarios de una estación de trabajo está agrupados en las cuatro clases de igual longitud siguientes: Clases [25.0, 32.5) [32.5, 40.0) [40.0, 47.5) [47.5, 55.0] Frecuencia 3 5 8 4 Calcular:

a. El primer y tercer cuartil. b. Media, desviación típica y cuasivarianza.

6.- Dada la tabla de distribución de frecuencias:

xi 6 7 8 10 11 12 ni 1 2 7 6 3 1

a. Representar en el polígono de frecuencias absolutas. b. Calcular el valor de los cuartiles, media, mediana y varianza muestral

(cuasivarianza). c. Representar en el diagrama de caja. ¿Existen puntos atípicos en la muestra? ¿Por

qué? d. Un valor en la muestra de 4, ¿sería un valor atípico?, ¿por qué?

1 0.85 0.45 0.15

0 20 40 60 80 100

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 3

7.- Se tabulan los valores de los errores de cierre en nivelación obtenidos en 742

polígonos. Calcular: a) media, b) mediana, c) moda, d) coeficiente de variación.

Valor en dm del error Nº. de polígonos

0.255 - 0.285 6

0.285 - 0.315 38

0.315 - 0.345 66

0.345 - 0.375 131

0.375 - 0.405 240

0 405 - 0 435 162

0.435 - 0.465 84

0.465 - 0.495 15

8.- Al finalizar el curso de “Álgebra y Geometría” se realizó un examen de tipo test a los trescientos alumnos matriculados obteniéndose la siguiente tabla referente al número de preguntas acertadas: Nº de preguntas acertadas

0 – 10 10 – 25 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70

Nº de alumnos 10 20 60 100 70 30 10 Se pide:

a) Representa el histograma de la distribución de frecuencias anterior. b) Hallar la media y varianza muestral. c) ¿Cuál será el número P de preguntas acertadas tal que la mitad de los alumnos obtengan un número de preguntas acertadas mayor que P? d) ¿Cuál es número medio de preguntas acertadas y el número de preguntas acertadas que más se repite?

Para la concesión de unas becas se realiza una segunda parte de examen al que sólo se permite presentarse a los 60 alumnos con mejor nota en el test. Se pide:

e) Hallar el número de preguntas acertadas como mínimo que se ha exigido a un alumno para realizar la segunda parte del examen.

Una vez finalizada la segunda parte del examen se han obtenido las siguientes notas: Nota 4 5 5.5 6 6.5 8 Nº de alumnos

8 12 15 14 6 5

Se pide: f) ¿Por qué no se debe agrupar los datos en intervalos como se realizó con las notas del test? g) Hallar la mediana, la moda y el recorrido intercuartílico. h) De las dos distribuciones de notas en cuál de ellas la media es más representativa.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 4

i) ¿Que resulta más difícil, obtener 28 preguntas acertadas en el examen tipo test u obtener un 6,5 en la segunda parte del examen? j) Si se concede una beca a los 25 alumnos con mejor nota en la segunda parte del examen. ¿A partir de qué nota se concederán las becas?

9.- Se ha realizado una prueba de rendimiento a 20 alumnos elegidos al azar, los resultados obtenidos sobre el rendimiento se muestran en el siguiente gráfico:

a) A partir del gráfico calcular la mediana, los cuartiles y el rango de la variable. b) Formar la tabla de distribución de frecuencias absolutas c) Representar el diagrama de frecuencias absolutas. d) Calcular: Los cuartiles, la mediana, la moda, varianza muestral. e) Considerando los 20 alumnos

como la población calcular los coeficientes de asimetría y curtosis de Fisher.

10.- La siguiente tabla muestra una distribución de frecuencias de la duración de 400 componentes fabricados por una determinada marca. Determinar:

a) Frecuencia relativa de la sexta clase. b) Porcentaje de componentes cuya duración es menor que 600 horas. c) Porcentaje de componentes cuya duración es mayor o igual a 900 horas. d) Porcentaje de componentes cuya duración es al menos de 500 horas pero menor de 1000 horas. e) Estimar el porcentaje de componentes con duraciones de menos de 560 horas. f) Estimar el porcentaje de componentes con duraciones de 970 o más horas. g) ¿Qué número de horas duran el 95% de los componentes? h) Representar el histograma de frecuencias absolutas y el polígono de frecuencias relativas acumuladas. i) Calcular la media, moda, la desviación estándar de la muestra, Coeficiente de variación y el coeficiente de asimetría de Pearson. j) Suponiendo que los 400 componentes son la población total, calcular la varianza y los coeficientes de asimetría y curtosis de Fisher.

11.- En un taller de reparación de vehículos se recogen datos sobre los días que se tarda en reparar un vehículo, y se obtiene

Días en taller 0 1 2 3 4 5 8 10 15 Nº de coches 10 12 23 10 9 5 3 2 1

a) Representar el polígono de frecuencias absolutas. b) Calcular la moda, mediana, el primer y tercer cuartil, y El percentil 96.

Duración (horas)

Número de componentes

[300 , 400) 14 [400 , 500) 46 [500 , 600) 58 [600 , 700) 76 [700 , 800) 68 [800 , 900) 62 [900 , 1000) 48

[1000 , 1100) 22 [1100 , 1200) 6

0

5

10

15

20

25

0 2 4 6 8 10 12 14

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 5

c) Calcular los momentos respecto del origen de orden 1, 2, 3 y 4. d) Calcular los momentos respecto de la media de orden 1, 2, 3 y 4. e) Calcular la media, varianza, desviación estándar, Coeficiente de variación y el coeficiente de asimetría. f) Calcular la varianza y los coeficientes de asimetría y curtosis de Fisher de los días de estancia en el taller los 75 vehículos. g) ¿Existen reparaciones atípicas en cuanto a la duración en la reparación?

12.- En un aparcamiento cobran por cada minuto que está estacionado el vehículo 1,5 céntimos. El tiempo que los vehículos permanecen estacionados dentro un día cualquiera se muestra en el siguiente polígono de frecuencias:

Respecto del tiempo que un vehículo está en el aparcamiento calcular: a) Porcentaje de vehículos estacionados más de dos horas pero menos de cuatro horas. b) Estimar el porcentaje de vehículos que estacionan menos de 100 minutos. c) ¿Qué número de minutos está estacionado dentro el 90% de los vehículos. d) La moda, los cuartiles primero y tercero, y la mediana. e) La media, desviación estándar muestral y el coeficiente de asimetría de Pearson. f) Realizar el diagrama de caja. g) ¿A partir de cuántos minutos el tiempo considerado será atípico?

Respecto del pago (precio por minuto estacionado) calcular: h) El ingreso medio y el ingreso más frecuente por vehículo. i) La empresa arrendataria del servicio está estudiando modificar la tarifa existente de la siguiente manera: a todos los vehículos se les cobrará 50 céntimos de € por entrar y 1,4 céntimos de € por cada minuto que tengan su coche dentro del aparcamiento. Bajo esta suposición, y con los datos de que dispone, ¿qué alternativa da un ingreso medio mayor?

13.- Investigados los precios de ordenadores de 50 marcas distintas se han obtenido los siguientes resultados:

700 300 500 400 500 700 400 750 700 300 500 750 300 700 1000 1250 500 750 500 750 400 500 300 500 1000 300 400 500 400 500 300 400 700 400 700 500 400 700 1000 750 700 800 750 700 750 800 700 700 1200 800

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 6

a) Determinar la distribución de precios agrupados en frecuencias absolutas. b) Representar gráficamente el diagrama de barras y el polígono de frecuencias

acumuladas. c) Calcular el precio medio y el más frecuente. d) Calcular la varianza y el coeficiente de variación. e) Obtener el sesgo y la curtosis o apuntamiento. f) Si queremos un ordenador cuyo precio corresponda como mínimo al 10% de los

precios más caros, ¿cuál será el precio correspondiente? g) ¿Existen precios atípicos según el diagrama de caja?

14.- Si en una población de 120 personas el coeficiente intelectual tiene la siguiente distribución: Coef. Int.

60-70 70-80 80-90 90-100 100-110 110-120 120-130 130-140

ni 2 3 25 46 35 5 3 1 a) Representar el histograma de frecuencias. b) Representar el polígono de frecuencias acumuladas. c) Atendiendo al coeficiente intelectual, se consideran bien dotadas al 5% de las

personas con mayor coeficiente. ¿A partir de qué coeficiente intelectual mínimo se considerará como bien dotada a una persona de esta población?

d) ¿Qué proporción de la población es más inteligente que una persona con coeficiente intelectual 100?

e) ¿En qué percentil está situada una persona de coeficiente intelectual 90? f) Obtener la media, la moda, la mediana y la varianza de la población.

15.- Los siguientes datos corresponden a las cotas taquimétricas iniciales de un terreno en orden creciente:

VÉRTICES Cota inicial (xi) 1 102,3 2 101,98 3 101,37 4 101,22 5 101,98 6 101,8 7 101,48 8 101,22 9 101,87 10 100,78 11 101,3 12 101,03 13 100,42 14 100,42 15 100

A.- Construir un sumario estadístico que incluya las frecuencias: absolutas, relativas, absolutas acumuladas y relativas acumuladas. B- Representar los datos mediante un polígono de frecuencias absolutas acumuladas. C.- Calcular el valor y explica el método empleado de los siguientes estadísticos.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 7

Valor Fórmula empleada o método de cálculo

Percentil 10

Media

Varianza

Desviación típica

Coeficiente de variación

Coeficiente de asimetría de Fisher Coeficiente de apuntamiento

D.- Si se consideran el 10% de los vértices que tienen mayor cota. ¿Cuál es la cota mínima? E.- Representa un diagrama de cajas y efectúa el estudio de posibles puntos atípicos.

16.- Se ha tomado una fotografía aérea de una cierta escena; dentro de ella se ha seleccionado una parcela de la que se han tomado 28 muestras de los niveles de gris (pixeles) correspondientes a otros tantos puntos, obteniéndose los siguientes valores: 41, 39, 43, 40, 42, 44, 38, 42, 40, 46, 45, 44, 40, 43, 40, 42, 45, 45, 46, 39, 41, 39, 39, 43, 42, 47, 46, 40. Se quiere hacer un estudio de estos datos: agrupándolos en intervalos de amplitud dos: A.- Dibujar el histograma y el polígono de frecuencias absolutas: B.- Dibujar el polígono de frecuencias absolutas acumuladas. C.- Calcular el valor y explica el método empleado de los siguientes estadísticos. Valor Fórmula empleada o

método de cálculo

Mediana

Percentil Quinto

Coeficiente de variación

Coeficiente de asimetría de Fisher

Curtosis

17.- La siguiente tabla recoge los salarios anuales en miles de euros de 20 trabajadores: 20 60 19 10 40 16 16 16 10 19 19 20 20 40 19 16 10 16 70 16

Se pide: a) Polígono de frecuencias absolutas. b) Proporción de trabajadores que obtiene un salario superior o igual a 19000. c) ¿Qué percentil le corresponde a un trabajador con un salario de 20000? d) Coeficiente de Variación. e) Diagrama de caja. ¿Hay valores atípicos?

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 8

18.- Dada la distribución de frecuencias:

Intervalo ni 0-500 3

500-1000 3 1000-1500 8 1500-2000 5 2000-2500 4

Se pide: a) Polígono de frecuencias absolutas acumuladas. b) El primer cuartil. c) Coeficiente de apuntamiento o Curtosis. Interpretación

19.- Se toman 20 medidas a un grupo de 4 o más satélites en intervalos de 15 seg. En la tabla adjunta se reflejan las medidas de las variables GP:

4,7 4,7 4,8 4,9 5 5 5 5 5,1 5,1 5,1 5,1 5,1 5,2 5,2 5,2 5,3 5,3 5,3 5,3 Se pide: a) Polígono de frecuencias absolutas acumuladas. b) ¿Qué percentil le corresponde a un valor de GP de 5? d) La moda. e) La varianza muestral o cuasivarianza. f) Realizar el diagrama de cajas. ¿Hay valores atípicos?

20.- Las calificaciones obtenidas por alumnos de Matemáticas en un examen fueron las siguientes:

Nota 0 – 2 2 – 4 4 – 6 6 – 8 8 – 10 ni 10 7 69 41 3

a) Representar el polígono de frecuencias absolutas. b) ¿Cuál es el valor de la mediana? c) ¿En qué percentil está situada una persona con una calificación de 5? d) Interpretar el Coeficiente de asimetria de Fisher.

21.- La siguiente tabla recoge las calificaciones de una prueba tipo test de Cálculo:

4 2 5 5 7 4 8 4 5 5 6 9 5 2 4 7 7 4 2 7 5 1 6 5 5 3 1 6 4 1 5 0 5 7 5 9 6 2 4

Se pide:

a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6. b) El Percentil 90. c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8? d) La moda y los cuartiles. e) La media, desviación estándar o desviación típica. f) Realizar el diagrama de caja. g) ¿Hay valores atípicos?

Dada la distribución de frecuencias de la variable tiempo (segundos) utilizado en la realización del test:

Intervalo ni

400-500 3

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 9

500-600 3

600-700 8

700-800 5

800-900 4

900-1000 5

1000-1100 11

Se pide: h) El tiempo más frecuente. i) La mediana. j) Sesgo. k) Curtosis.

22.- Se desea estudiar la altura de un grupo de alumnos. Las alturas expresadas en centímetros fueron:

149 166 168 170 172 174 180 164 166 168 168 178 178 182 164 166 168 170 176 189

Construir un diagrama de caja. ¿Hay valores atípicos?

23.- Se ha medido dieciséis veces la longitud en metros que separa dos puntos, Los resultados obtenidos se muestran en la siguiente tabla:

13,404 13,443 13,445 13,447 13,449 13,450 13,453 13,455 13,457 13,460 13,460 13,465 13,455 13,453 13,445 13,455

Calcular la moda, la mediana, los cuartiles y el percentil 90. Representar el diagrama de caja y estudiar la existencia de puntos atípicos.

24.- Los siguientes valores corresponden a la temperatura máxima diaria (ºF) de 36 días, obtenidos a las 14 horas en una cierta estación meteorológica.

84, 49, 61, 40, 83, 67, 45, 66, 70, 69, 80, 58, 68, 60, 67, 72, 75, 76, 73, 70,

63, 70, 78, 52, 67, 53, 67, 75, 61, 70, 81, 76, 79, 58, 57, 21.

a) Calcular: media, desviación típica y el coeficiente de variación. b) Estudiar la existencia de datos atípicos. Si existe algún valor atípico omitir, dicho valor y calcular de nuevo el apartado a). c) Con los datos de los apartados a y b construir un gráfico con el diagrama de caja, de ambos apartados.

25.- Los valores de 50 mediciones realizadas con un distanciometro con apreciación en milímetros han sido agrupados en 6 intervalos según la tabla siguiente:

ei-1 – ei ni 21.150 – 21.155 4 21.155 – 21.160 6 21.160 – 21.165 11 21.165 – 21.170 13

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 10

21.170 – 21.175 9 21.175 – 21.180 7

Total 50 a) Porcentaje de mediciones cuya distancia es mayor o igual que 21.160. b) Representar el polígono de frecuencias absolutas acumuladas y el histograma de

frecuencias absolutas. c) Calcular, los cuartiles y la mediana. d) Estimar el porcentaje de mediciones cuya distancia sea menos de 21.1725. e) ¿Qué distancia tienen como máximo el 95% de las mediciones? f) Calcular la media, moda y varianza.

26.- Del conjunto de redes topográficas que intervienen en un trabajo topográfico estamos interesados en estudiar el número de vértices geodésicos que constituyen cada red topográfica. Para ello, seleccionamos 30 redes topográficas, obteniéndose la siguiente tabla:

Nº de vértices en las 30 redes

xi 1 2 3 4 5 6

Frecuencia absoluta ni 3 8 9 6 3 1

Respecto del número de vértices geodésicos que constituyen la red (característica a estudiar) Calcular: a) Representar el polígono de frecuencias absolutas y el polígono de frecuencias

acumuladas. b) Hallar los cuartiles, la mediana y los percentiles 5 y 10. c) ¿Qué número de vértices tienen el 80% de las redes? d) Calcular la media, moda y varianza. e) Representar el diagrama de caja.

27.- Se quiere analiza el resultado de una secuencia de cifras elegidas, al azar, 141592653589793238462433832795028841971693993751058209749445923078164062862089986280348253421170679, todas las cifras han sido elegidas al azar mediante extracciones de una urna con 10 bolas numeradas del 0 al 9. La siguiente tabla recoge la distribución de frecuencias absolutas: xi 0 1 2 3 4 5 6 7 8 9 ni 8 8 12 11 10 8 9 8 12 14 Se pide: a) Moda. b) Media. c) Diagrama de cajas, ¿hay valores atípicos? d) Coeficiente de asimetría.

28.- La variable estadística X toma los siguientes valores: 5 6 4 0 5 5 6 10 5 4 4

6 5 6 5 4 5 4 6 5 6 4 5 5 6 5 6 4 5 5 5 6 4 5 5 4 5 5 5 5. Se pide:

a) Construir la tabla de frecuencias de X.

b) Calcular e interpretar las medidas de posición, dispersión y asimetría de la

variable.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 11

c) Construir e interpretar el diagrama de caja de X. Localizar los datos atípicos.

d) Determinar qué medidas se ven afectadas al cambiar el valor 6 por 46. Construir e interpretar el diagrama de caja de la variable modificada. Localizar los datos atípicos.

29.- El gráfico adjunto representa el polígono de frecuencias acumuladas sobre las edades de 300 personas encuestadas en Madrid al azar en la Plaza de Colón entre las 3 y las 4 de la mañana.

Se pide:

(a) Determinar si esta muestra es representativa de las edades de los habitantes de Madrid.

(b) Aproximar la mediana, el tercer cuartil y el octavo decil, e interpretarlos en términos de la variable estudiada.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 12

1.- Los aficionados al béisbol aprenden de memoria las estadísticas de este juego. Por ejemplo, ¿cuántos “home runs” (golpes que envían la pelota fuera del campo de juego) son necesarios para liderar la liga? La tabla contiene los líderes de la liga

americana y el total de “home runs” entre 1972 y 1991: Año Jugador “Home runs” Año Jugador “Home runs”

1972 Dick Allen 37 1982 Thomas and Jackson 39

1973 Reggie Jackson 32 1983 Jim Rice 39

1974 Dick Allen 32 1984 Tony Armas 43

1975 Sccot & Jackson 36 1985 Darrell Evans 40

1976 Graig Nettles 32 1986 Jesse Barfield 40

1977 Jim Rice 39 1987 Mark McGwire 49

1978 Jim Rice 46 1988 Jose Canseco 42

1979 Gorman Thomas 45 1989 Fred McGriff 36

1980 Reggie Jackson 41 1990 Cecil Fielder 51

1981 Four players 22 1991 Canseco and Fielder 44

Se pide: a) construir el diagrama de barras. b) El polígono de frecuencias.

c) Diagrama de frecuencias acumuladas. d) Moda, y mediana

La media de golpes para los 167 jugadores de la liga americana que intentaron

batear más de 200 veces en la temporada de 1980 viene representada en la siguiente

tabla:

CLASE FRECUENCIA CLASE FRECUENCIA CLASE FRECUENCIA

0,185-0,195 1 0,255-0,265 16 0,325-0,335 4

0,195-0,205 3 0,265-0,275 18 0,335-0,345 1

0,205-0,215 1 0,275-0,285 23 0,345-0,355 1

0,215-0,225 4 0,285-0,295 23 0,355-0,365 0

0,225-0,235 13 0,295-0,305 16 0,365-0,375 0

0,235-0,245 20 0,305-0,315 3 0,375-0,385 0

0,245-0,255 15 0,315-0,325 4 0,385-0,395 1

e) Dibujar el histograma, polígono de frecuencias y diagrama de frecuencias acumuladas. f) Calcular media, moda, mediana, varianza, desviación típica, coeficiente de variación, sesgo y curtosis. g)¿Cuál es el percentil correspondiente a un jugador cuyo promedio es 0,315? h) Dibujar el diagrama de cajas.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 13

Solución: xi ni Ni

22 1 1

32 3 4

36 2 6

37 1 7

39 3 10

40 2 12

41 1 13

42 1 14

43 1 15

44 1 16

45 1 17

46 1 18

49 1 19

51 1 20

20

a) Construir el diagrama de barras.

b) El polígono de frecuencias.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 14

c) Diagrama de frecuencias acumuladas.

d) Moda, y mediana

Es bimodal 32 y 39 La mitad corresponde al intervalo mediano (39,40) y se toma el valor 39.5 CLASE ni Ni xi xini xi2ni xi3ni xi4ni 0,185-0,195 1 1 0,19 0,19 0,0361 0,006859 0,0013032 0,195-0,205 3 4 0,2 0,6 0,12 0,024 0,0048 0,205-0,215 1 5 0,21 0,21 0,0441 0,009261 0,0019448 0,215-0,225 4 9 0,22 0,88 0,1936 0,042592 0,0093702 0,225-0,235 13 22 0,23 2,99 0,6877 0,158171 0,0363793 0,235-0,245 20 42 0,24 4,8 1,152 0,27648 0,0663552 0,245-0,255 15 57 0,25 3,75 0,9375 0,234375 0,0585938 0,255-0,265 16 73 0,26 4,16 1,0816 0,281216 0,0731162 0,265-0,275 18 91 0,27 4,86 1,3122 0,354294 0,0956594 0,275-0,285 23 114 0,28 6,44 1,8032 0,504896 0,1413709 0,285-0,295 23 137 0,29 6,67 1,9343 0,560947 0,1626746 0,295-0,305 16 153 0,3 4,8 1,44 0,432 0,1296 0,305-0,315 3 156 0,31 0,93 0,2883 0,089373 0,0277056 0,315-0,325 4 160 0,32 1,28 0,4096 0,131072 0,041943 0,325-0,335 4 164 0,33 1,32 0,4356 0,143748 0,0474368 0,335-0,345 1 165 0,34 0,34 0,1156 0,039304 0,0133634 0,345-0,355 1 166 0,35 0,35 0,1225 0,042875 0,0150063 0,355-0,365 0 166 0,36 0 0 0 0 0,365-0,375 0 166 0,37 0 0 0 0 0,375-0,385 0 166 0,38 0 0 0 0 0,385-0,395 1 167 0,39 0,39 0,1521 0,059319 0,0231344 sumas 167 44,96 12,266 3,390782 0,9497571 momentos mi

0,2692 0,0734491 0,0203041 0,0056872

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 15

e) Dibujar el histograma.

Polígono de frecuencias

Diagrama de frecuencias acumuladas

f) Calcular media, moda, mediana, varianza, desviación típica, coeficiente de variación, sesgo y curtosis.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 16

Media

k k ki

i i i i ii 1 i 1 i 1

n 1 44,96X f x x n x

N N 167= = =

= = = = ≈∑ ∑ ∑ 0, 2692

La moda corresponde al intervalo de mayor frecuencia (0.275, 0.295) puesto que ambos tienen 23 por frecuencia. La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 167

83,52 2= = que no se corresponde con un valor de la columna de frecuencias absolutas

acumuladas y por tanto hay interpolar en el intervalo (0.265,0.275).

Por consiguiente la mediana es ( )j 1

j 1j

NN a

83,5 73 0,012M e 0,265

n 18

− − = + = + ≈ 0, 27083

Varianza

2k2 i i

i 1

(x X) n

N=

−σ = =∑

2i i

2 2i

x n12,2661

X 0,2692N 167

− = − ≈∑

0,0009689

Desviación típica

2 0,0009689σ = σ = ≈ 0,0311264

Coeficiente de variación

0,0311264CV

0,2692X

σ= = ≈ 0,1156

Sesgo

k3

3 06i i3 3 2 1 1i 1

1 3 3 3 3

(x X) fm 3m m 2m 8,3289 10

g0.0311264

−=

−µ − + ⋅

= = = = ≈σ σ σ

∑ 0.2761855580

Asimétrica por la derecha. Curtosis

1

k4

2 4 06i i4 3 1 2 1i 1 4

2 4 4 4 4

(x X) f m 4m m 6m m m 3,47576 10g 3 3 3 3

0,0311264

−=

− − + −µ ⋅= − = − = − = − ≈

σ σ σ

0,702820924 Más apuntada que la distribución Normal de la misma media y desviación típica. g) ¿Cuál es el percentil correspondiente a un jugador cuyo promedio es 0,315? El valor 0,315 está recogido en la tabla (y en el diagrama de frecuencias acumuladas) y corresponde exactamente a 156 del total 167, luego obtenemos aproximadamente el percentil 93

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 17

h) Dibujar el diagrama de cajas. Calculamos los 5 valores: Mínimo, Q1, M, Q3, Máximo Mínimo = 0,19

Q1 es el valor que deja a su izquierda el 25% de la población, es decir, N 167

41,754 4= = que

no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (0.235,0.245). Por consiguiente, es:

( )j 1

1 j 1j

NN a

41,75 22 0,014Q e 0,235 0,244875

n 20

− − = + = + ≈

M 0,27083≈

Q3 es el valor que deja a su izquierda el 75% de la población, es decir, N 167

3 3 125,254 4= =

que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (0.235,0.245). Por consiguiente, es:

( )j 1

3 j 1j

NN a

125,25 114 0,014Q e 0,285 0,2898913

n 23

− − = + = + ≈

Máximo = 0,39

0,20 0,25 0,30 0,35 0,40

diagrama de cajas

A A A A

Observando el rango intercuartílico IQR = Q3-Q1= 0,0450163, tenemos como límites Q1- 1,5 IQR= 0,1773505; quedando como límite inferior el mínimo 0,19. Q3+ 1,5 IQR= 0,3574158 siendo el límite superior y existen valores atípicos.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 18

2.- De una variable estadística se conocen los siguientes valores 1, 1, 2, 2, 2, 2, 3 y 3; si consideramos otra variable estadística con valores 1, 2, 2, 3, 3, 4, 4 y 5. Determinar la media, la mediana, la moda y la varianza de cada variable. ¿Cuál es la media, la mediana, la moda y la varianza de la variable estadística que resulta de unir las dos anteriores? Conocidas dos muestras de una misma variable con distintas medias y distinto tamaño ¿cuál es la media del resultado de unir dichas muestras? Solución: X= {1, 1, 2, 2, 2, 2, 3, 3}

xi ni xi ni x2i ni Ni

1 2 2 2 2 2 4 8 0 6 3 2 6 2 8

sumas 8 16 4 momentos

2 0,5

Media: k

i ii 1

1 16X n x =

n 8=

= =∑ 2

La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 8

42 2= =

que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto, es el siguiente M=2. La moda corresponde al valor de mayor frecuencia que es 2. Varianza:

2k2 i i

i 1

(x X) n

N=

−σ = =∑ 0,5

Y= {1, 2, 2, 3, 3, 4, 4, 5} yi ni yi ni y2

i ni Ni

1 1 1 4 1 2 2 4 2 3 3 2 6 0 5 4 2 8 2 7 5 1 5 4 8

sumas 8 24 12 momentos

3 1,5

Media: k

i ii 1

1 24Y n y =

N 8=

= =∑ 3

La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 8

42 2= =

que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto, es el siguiente M=3. La moda corresponde al valor de mayor frecuencia que son {2,3,4}.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 19

Varianza: 2k

2 i i

i 1

(y Y) n

N=

−σ = =∑ 1,5

Z= {1, 1, 2, 2, 2, 2, 3, 3, 1, 2, 2, 3, 3, 4, 4, 5} zi ni zi ni z2

i ni Ni

1 3 3 6,75 3 2 6 12 1,5 9 3 4 12 1 13 4 2 8 4,5 15 5 1 5 6,25 16

sumas 16 40 20 momentos

2,5 2,5

Media: k

i ii 1

1 40Z n z =

N 16=

= =∑ 2,5

La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 16

82 2= =

que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto, es el siguiente M=2. La moda corresponde al valor de mayor frecuencia que es 2. Varianza:

2k2 i i

i 1

(z Z) n

N=

−σ = =∑ 2,5

Consideramos dos distribuciones con distintas medias y distinto tamaño: N N N m

i i i ii 1 i 1 i 1 i 1

m m

i ii 1 i 1

1X x x NX x y

N NX mYX Y

N m N m1Y y y mY

m

= = = =

= =

= ⇒ = + +⇒ ∪ = = + += ⇒ =

∑ ∑ ∑ ∑

∑ ∑

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 20

3.-De una variable estadística se sabe que los momentos respecto al origen son: m0=1, m1=1, m2=2, m3=4 y el primer cuartil Q1=0,7. Calcular, coeficiente de asimetría, varianza, media, mediana y tercer cuartil. Solución: Sesgo

( )

k3

3i i3 3 2 1 1i 1

1 33 3 32

2 1

(x X) fm 3m m 2m 4 3 2 2

g1m m

=

−µ − + − ⋅ +

= = = = =σ σ −

∑ 0

La distribución no tiene sesgo es simétrica. Varianza

2k2 2 1i i

2 1i 1

(x X) nm m 2 1

N=

−σ = = − = − =∑ 1

Media k

i i 1i 1

1X n x m

N =

= = =∑ 1

Mediana Por ser simétrica coincide con la media e igual a 1. Tercer cuartil Por simetría con respecto a la mediana es 1,3.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 21

4.- Dada la gráfica correspondiente a un polígono de frecuencias relativas acumulativo de una variable estadística agrupada en intervalos de una muestra de tamaño n=20. A) Formar la tabla de distribución de frecuencias absolutas. B) Dibujar el histograma y el polígono de frecuencias. C) Encontrar la mediana, moda y media.

Fi

0.15

Solución: a)

CLASE fi Ni ni xi xini

0-20 0,15 3 3 10 30 20-40 0,45 9 6 30 180 40-60 0,85 17 8 50 400 60-80 0,85 17 0 70 0 80-100 1 20 3 90 270

sumas 20 880

momentos mi

44 b) Histograma

Poligono de frecuencias

1 0.85 0.45 0.15

0 20 40 60 80 100

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 22

Media k

i ii 1

1 880X n x =

N 20=

= =∑ 44

La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 20

102 2= =

que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (40, 60). Por consiguiente, la mediana es:

( )j 1

j 1j

NN a

10 9 202M e 40

n 8

− − = + = + = 42,5

La moda corresponde al intervalo de mayor frecuencia que es (40, 60).

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 23

5.- El porcentaje de disco ocupado (en Mbytes) para distintos usuarios de una estación de trabajo está agrupados en las cuatro clases de igual longitud siguientes:

Clases [25.0, 32.5) [32.5, 40.0) [40.0, 47.5) [47.5, 55.0] Frecuencia 3 5 8 4

Calcular: a)El primer y tercer cuartil. b) Media, desviación típica y cuasivarianza. Solución:

Clase ix in iN i

xni 2iixn

25 – 32,5 28,75 3 3 86,25 2479,6875 32,5 – 40 36,25 5 8 181,25 6570,3125 40 – 47,5 43,75 8 16 350 15312,5 47,5 – 55 51,25 4 20 205 10506,25

20 822,5 34868,75 ( )

5,355

5,7355,32Q1 =

−+=

( )56,46

8

5,781540Q3 ≈

−+=

125,4120

5,822X == 1718,52125,41

20

75,34868 22 =−=σ

5096,531718,5219

20S2 == 2230,71718,52 ==σ

Primer Cuartil

Segundo Cuartil Media

Desviación típica Cuasivarianza

35,5 46,56 41,125 7,2230 53,5096

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 24

6.- Dada la tabla de distribución de frecuencias:

xi 6 7 8 10 11 12

ni 1 2 7 6 3 1

a. Representar en el polígono de frecuencias absolutas. b. Calcular el valor de los cuartiles, media, mediana y varianza muestral.

(cuasivarianza). c. Representar en el diagrama de caja. ¿Existen puntos atípicos en la muestra? ¿Por

qué? d. Un valor en la muestra de 4, ¿sería un valor atípico?, ¿por qué?

Solución: a)

b) xi 6 7 8 10 11 12

ni 1 2 7 6 3 1

Ni 1 3 10 16 19 20

Q1 =8, Q3 =10, M = 9, media = 9.05, Varianza muestral o cuasivarianza 2.681.

IQR = 2 c)

d) Un valor de 4 sería atípico por ser menor que Q1 – 1.5 IQR = 5

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 25

7.- Se tabulan los valores de los errores de cierre en nivelación obtenidos en 742

polígonos. Calcular: a) media, b) mediana, c) moda, d) coeficiente de variación.

Solución: Valor en dm del

error

Nº. de

polígonos xi Ni ni ( )2

i ix x n−

0,255 – 0,285 6 0,27 6 0,62

0,08489288

0,285 – 0,315 38 0,3 44 1,4

0,3006517

0,315 – 0,345 66 0,33 110 1,78

0,22934733

0,345 – 0,375 131 0,36 241 7,16

0,10978223

0,375 – 0,405 240 0,39 481 3,6

0,00026521

0,405 – 0,435 162 0,42 643 8,04

0,15619681

0,435 – 0,465 84 0,45 727 7,8

0,31308905

0,465 – 0,495 15 0,48 742 0,2

0,12435485

Sumas 88,6

1,3185801

a) Media aritmética: k k

i i i ii 1 i 1

1 288,60X n x f x

N 742= =

= = = =∑ ∑ 0,38894879

b) Cálculo de la mediana M

i 1

i 1i

N 742N a 241 0,03

2 2M e 0,375

n 240

− − ⋅ = + = + = 0,39125

c) La moda corresponde al valor de mayor frecuencia que es el intervalo modal (0.375, 0.405) cuya marca de clase es 0,39

d) Varianza 2k

2 i i

i 1

(x X) n

N=

−σ = =∑ 0,0017771≈

Desviación típica 2 0,0017771 0,04215521σ = σ = ≈

Coeficiente de variación 0,04215521

CV0,38894879X

σ= = ≈ 0,10838243

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 26

8.- Al finalizar el curso de “Álgebra y Geometría” se realizó un examen de tipo test a los trescientos alumnos matriculados obteniéndose la siguiente tabla referente al número de preguntas acertadas: Nº de preguntas acertadas

0 – 10 10 – 25 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70

Nº de alumnos 10 20 60 100 70 30 10 Se pide:

a) Representa el histograma de la distribución de frecuencias anterior. b) Hallar la media y varianza muestral. c) ¿Cuál será el número P de preguntas acertadas tal que la mitad de los alumnos obtengan un número de preguntas acertadas mayor que P? d) ¿Cuál es número medio de preguntas acertadas y el número de preguntas acertadas que más se repite?

Para la concesión de unas becas se realiza una segunda parte de examen al que sólo se permite presentarse a los 60 alumnos con mejor nota en el test. Se pide:

e) Hallar el número de preguntas acertadas como mínimo que se ha exigido a un alumno para realizar la segunda parte del examen.

Una vez finalizada la segunda parte del examen se han obtenido las siguientes notas: Nota 4 5 5.5 6 6.5 8 Nº de alumnos

8 12 15 14 6 5

Se pide: f) ¿Por qué no se debe agrupar los datos en intervalos como se realizó con las notas del test? g) Hallar la mediana, la moda y el recorrido intercuartílico. h) De las dos distribuciones de notas en cuál de ellas la media es más representativa. i) ¿Que resulta más difícil, obtener 30 preguntas acertadas en el examen tipo test u obtener un 6,5 en la segunda parte del examen? j) Si se concede una beca a los 25 alumnos con mejor nota en la segunda parte del examen. ¿A partir de qué nota se concederán las becas?

Solución Nº de preguntas acertadas

Nº de alumnos

Marca de clase

(e0 -e1] ni xi nixi ni(xi-media)2 Ni 0 a 10 10 5 50 250 10 10 a 20 20 15 300 4500 30 20 a 30 60 25 1500 37500 90 30 a 40 100 35 3500 122500 190 40 a 50 70 45 3150 141750 260 50 a 60 30 55 1650 90750 290 60 a 70 10 65 650 42250 300 sumas 300

10800 439500

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 27

a) Histograma

b) k

i ii 1

1 10800X n x =36

N 300=

= = ⇒∑( )2

i i2n x X 50700

=N 300

−σ = =

∑169

c) Mediana M=30+(300/2-90)10/100=36

d) Media=36 y Moda=(30+40)/2=35 e) Debemos calcular la nota que deja por debajo a 300-60=240 ALUMNOS. Que sobre los 300 representa el 80%. Buscaremos el percentil 80:

80

(240 190)10P 40 =47,14

70

−= + .

Obviamente 48 preguntas.

Polígono de frecuencias absolutas acumuladas

Segundo examen

Notas Nº alumnos

xi ni NI nixi ni(xi-media)2

4 8 8 32 21,1

5 12 20 60 4,7

5,5 15 35 82,5 0,2

6 14 49 84 2,0

6,5 6 55 39 4,6

8 5 60 40 28,2

sumas 60

337,5 60,8

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 28

f) No es necesario, ya que sólo son 6 notas distintas. g) Mediana=5,5; Q1=5; Mo=5,5; Q3=6; IQR=Q3-Q1=6-5=1 h) La media es más representativa si tiene un coeficiente de variación menor.

13CV(1ª nota) 0,36

36X

σ= = ≈

k

i ii 1

1 337,5X n x =5,625

N 60=

= = ⇒∑( )2

i i2n x X 60,8

=1,01 1N 60

−σ = = ⇒ σ ≈

1CV(2ª nota) 0,18

5,625X

σ= = ≈ Es más representativa la segunda nota.

i) Acertar 30 o más preguntas en la primera parte es acertar 70%, ya que son 210 sobre 300. Obtener 5,5 o más en la 2ª parte es acertar el 66,6%, ya que son 40 sobre 60. j) Si se concede beca a las 25 mejores notas, se obtiene beca si la nota del alumno es igual o

superior a 5,75. k) Los valores mínimo y máximo de la variable son xmín=4 y xmáx=8, respectivamente. El rango intercuartílico es IQR=1 y el valor de 1,5 veces el rango intercuartílico es 1,5, por tanto las barreras son:

LI = máx [xmín, Q1-1.5*IQR] = máx [4, 3.5] = 4. LS = mín [xmáx, Q3+1.5*IQR] =mín [8, 7.5] = 7,5.

así pues, representamos la barrera superior 7,5 y la observación xmáx=8 que además es un valor atípico por ser mayor que el valor de la barrera.

Nº de preguntas acertadas

Nº de alumnos

Marca de clase

(e0 -e1] ni xi nixi ni(xi-media)2 Ni 0 a 10 10 5 50 250 10 10 a 20 20 15 300 4500 30 20 a 30 60 25 1500 37500 90 30 a 40 100 35 3500 122500 190 40 a 50 70 45 3150 141750 260 50 a 60 30 55 1650 90750 290 60 a 70 10 65 650 42250 300 sumas 300

10800 439500

j) Si se concede beca a las 25 mejores notas, se obtiene beca si la nota del alumno es igual o superior a 6.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 29

9.- Se ha realizado una prueba de rendimiento a 20 alumnos elegidos al azar, los

resultados obtenidos sobre el rendimiento se muestran en el siguiente gráfico: a) A partir del gráfico calcular la mediana, los cuartiles y el rango de la variable. b) Formar la tabla de distribución de frecuencias absolutas c) Representar el diagrama de frecuencias absolutas. d) Calcular: Los cuartiles, la mediana, la moda, varianza muestral.

e) Considerando los 20 alumnos como la población calcular los coeficientes de asimetría y curtosis de Fisher.

Solución: a) En este caso el tamaño de la muestra es N = 20. ¿Q1? N/4 = 5, observamos que la posición 5ª corresponde al

intervalo (4,6), por tanto, Q1 = 5. ¿Q3? 3N/4 = 15, observamos que la posición 15 corresponde a la

imagen x=8, por tanto, Q3 = 8. En el caso de la mediana N/2 = 10, observamos que la posición 10ª

corresponde al intervalo (6,8), podemos considerar: M = 7. b) La distribución de frecuencias absolutas es: c) Diagrama de barras

xi ni Ni 2 1 1 4 4 5 6 5 10 8 6 16 10 4 20 n = 20

0

5

10

15

20

25

0 2 4 6 8 10 12 14

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 30

d) En la tabla volvemos a observar que Q1 = 5; Q3 = 8; M = 7. En el gráfico y en la tabla podemos ver que el valor con mayor frecuencia es x = 8 luego la moda es M0 = 8.

xi ni Ni i in x

( )i in x x− ( )2

i in x x− ( )3

i in x x− ( )4

i in x x−

2 1 1 2 -4,800 23,040 -110,592 530,842

4 4 5 16 -11,200 31,360 -87,808 245,862

6 5 10 30 -4,000 3,200 -2,560 2,048

8 6 16 48 7,200 8,640 10,368 12,442

10 4 20 40 12,800 40,960 131,072 419,430

sumas 20

136 0 107,2 -59,52 1210,624

Varianza muestral 2 107.25.64

19= =S ;

a) Sesgo:

( )3

1 3

= =

∑ i in x x

Ngσ

3

59.5220

107,220

=

0.24−

Asimétrica por la izquierda.

b) Curtosis:

( )4

2 43

= − =

∑ i in x x

Ngσ

2

1210,62420 3

107,220

− =

0,89−

Menos apuntada que la distribución Normal de la misma media y desviación típica.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 31

10.- La siguiente tabla muestra una distribución de frecuencias de la duración de 400 componentes fabricados por una determinada marca. Determinar:

a) Frecuencia relativa de la sexta clase. b) Porcentaje de componentes cuya duración es menor que 600 horas. c) Porcentaje de componentes cuya duración es mayor o igual a 900 horas. d) Porcentaje de componentes cuya duración es al menos de 500 horas pero menor de 1000 horas. e) Estimar el porcentaje de componentes con duraciones de menos de 560 horas. f) Estimar el porcentaje de componentes con duraciones de 970 o más horas. g) ¿Qué número de horas duran el 95% de los componentes? h) Representar el histograma de frecuencias absolutas y el polígono de frecuencias relativas acumuladas i) Calcular la media, moda, la desviación estándar de la muestra, Coeficiente de variación y el coeficiente de asimetría de Pearson. j) Suponiendo que los 400 componentes son la población total, calcular la varianza y los coeficientes de asimetría y curtosis de Fisher.

Solución a) La frecuencia relativa de la sexta clase [800 , 900) es 0,155 componentes

b) El porcentaje de componentes cuya duración es menor que 600 horas es 29,5% componentes.

c) El porcentaje de componentes cuya duración es mayor o igual a 900 horas es 1-0,81=0,19, es decir el 19%.

d) El porcentaje de componentes cuya duración es al menos de 500 horas pero menor de 1000 horas es: 93% - 15%=78%.

e) Para el cálculo del porcentaje de componentes con duraciones de menos de 560 horas, utilizamos la fórmula del cálculo de los percentiles y se obtiene un resultado de α=0,237 y por tanto 23,7%

f) Para el cálculo del porcentaje de componentes con duración de 970 o más horas. Se realiza como en el caso anterior y se obtiene 10,6%.

g) Nos piden el número de horas que duran el 95% de los componentes. De modo análogo a los anteriores P95=1036.

Duración (horas)

Número de componentes

[300 , 400) 14

[400 , 500) 46

[500 , 600) 58

[600 , 700) 76

[700 , 800) 68

[800 , 900) 62

[900 , 1000) 48

[1000 , 1100) 22

[1100 , 1200) 6

Duración (horas)

Número de componentes

fi Fi

[300 , 400) 14 0,035 0,035

[400 , 500) 46 0,115 0,15

[500 , 600) 58 0,145 0,295

[600 , 700) 76 0,19 0,485

[700 , 800) 68 0,17 0,655

[800 , 900) 62 0,155 0,81

[900 , 1000) 48 0,12 0,93

[1000 , 1100) 22 0,055 0,985

[1100 , 1200) 6 0,015 1 Sumas 1

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 32

h) Histograma

Polígono de frecuencias relativas acumuladas

i) Media 1 286200

400= = =∑ i iX n x

N715,5

horas.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 33

El intervalo modal y la moda (su punto medio) se observa directamente de la tabla de datos. La distribución es unimodal, el intervalo modal es [600 a 700), siendo la moda 650 horas.

La desviación estándar de la muestra es ( )21 14463900

1 399= − = =

− ∑ i iS n x xN

190,4 .

190,4

715,5= = ≈

SCVX

0.26 .

El cálculo de −

=sX MoA

S

715,5 650

190,4

−= ≈ 0,34

es casi simétrica, un poco desviada a la

derecha respecto de la moda. j)

Varianza = ( )22 1 14463900

400= − = =∑ i in x x

Nσ 36159,75 .

El coeficiente de asimetría de Fisher es:

( )3

1 3 3

25943910400

190,16

= = =

∑ i in x x

Ngσ

0.09

Nos confirma la casi simetría. El coeficiente de apuntamiento o curtosis es:

( )4

2 4

29453549403 3

1307527520

= − = − ≈

∑ i in x x

Ngσ

0,74− , por tanto, un poco menos apuntada que

la normal de la misma media y desviación típica.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 34

11.- En un taller de reparación de vehículos se recogen datos sobre los días que se tarda en reparar un vehículo, y se obtiene

Días en taller 0 1 2 3 4 5 8 10 15

Nº de coches 10 12 23 10 9 5 3 2 1

a) Representar el polígono de frecuencias absolutas. b) Calcular la moda, mediana, el primer y tercer cuartil, y El percentil 96. c) Calcular los momentos respecto del origen de orden 1, 2, 3 y 4. d) Calcular los momentos respecto de la media de orden 1, 2, 3 y 4. e) Calcular la media varianza, desviación estándar, Coeficiente de variación y el coeficiente de asimetría. f) Calcular la varianza y los coeficientes de asimetría y curtosis de Fisher de los días de estancia en el taller los 75 vehículos. g) ¿Existen reparaciones atípicas en cuanto a la duración en la reparación? Solución a) Polígono de frecuencias absolutas.

Moda=Mo= 2

µ2 =σ2= varianza = 6,71

mediana=M= 2

S2 = varianza muestral = 6,80

Q1 = 1

S = desviación estandar muestral = 2,61

Q3 = 4

CV= Coeficiente de variación = 0,94

P96 = 9

As = Coeficiente de asimetría de Pearson = 0,30

media=m1 2,77

µ 3 = 37,23

m2 14,4

µ 4 = 412,04

m3 114,37

g1 =Sesgo= 2,14

m4 1193,76

g2 =Curtosis= 6,16 Más apuntada que la distribución Normal de la misma media y desviación típica. Asimétrica por la derecha.

En el último apartado, como Q1=1, Q3 = 4; 1.5*IQR=4.5 por tanto las barreras son: Q1-1,5 IQR= -3,5; quedando como límite inferior el mínimo 0, por tanto, no hay valores atípicos. Q3+ 1,5 IQR= 8,5 siendo el límite superior y existen valores atípicos. Los vehículos reparados en 10 días o más son atípicos.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: ESTADÍSTICA 35

12.- En un aparcamiento cobran por cada minuto que está estacionado el vehículo 1,5 céntimos. El tiempo que los vehículos permanecen estacionados dentro un día cualquiera se muestra en el siguiente polígono de frecuencias:

Respecto del tiempo que un vehículo está en el aparcamiento calcular: a) Porcentaje de vehículos estacionados más de dos horas pero menos de cuatro horas. b) Estimar el porcentaje de vehículos que estacionan menos de 100 minutos. c) ¿Qué número de minutos está estacionado dentro el 90% de los vehículos. d) La moda, los cuartiles primero y tercero, y la mediana. e) La media, desviación estándar muestral y el coeficiente de asimetría de Pearson. f) Realizar el diagrama de caja. g) ¿A partir de cuántos minutos el tiempo considerado será atípico? Respecto del pago (precio por minuto estacionado) calcular: h) El ingreso medio y el ingreso más frecuente por vehículo. i) La empresa arrendataria del servicio está estudiando modificar la tarifa existente de la siguiente manera: a todos los vehículos se les cobrará 50 céntimos de € por entrar y 1,4 céntimos de € por cada minuto que tengan su coche dentro del aparcamiento. Bajo esta suposición, y con los datos de que dispone, ¿qué alternativa da un ingreso medio mayor? Solución Del gráfico se obtiene la siguiente distribución de frecuencias:

a) El 81.33% de los vehículos están aparcados igual o menos que 4 horas. El 15.33%

de los vehículos están aparcados igual o menos de 2 horas, por tanto, el 66% de

los vehículos están entre 2 y 4 horas.

Tiempo de estacionamiento

nº de vehículos ni

Ni Fi · 100

0 - 60 40 40 2,67 60 - 120 190 230 15,33 120 - 180 450 680 45,33 180 - 240 540 1220 81,33 240 - 300 250 1470 98,00 300 - 360 30 1500 100

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: CÁLCULO Y ESTADÍSTICA 36

b) ( )1500 40 60

100 P 60190α

α −= = + ⇒ α = 11,1%

c) 90

901500 1220 60

100P 240

250

− = + = 271,2

d) El intervalo modal es (180, 240] minutos; moda = 210 minutos.

( )1

375 230 60Q 120

450

−= + ≈

139,3

minutos.

( )750 680 60

M 180540

−= + ≈ 187,7

minutos.

( )3

1125 680 60Q 180

540

−= + ≈

229,4

minutos.

e) El tiempo medio es; i i

1 276600X T n x

N 1500= = = =∑ 184,4

minutos.

( )2

i i

1 6000960S n x X

N 1 1499= − = ≈

− ∑ 63,27 minutos.

os

X MA

S

−= ≈ 0, 41 0− < existe asimetría por la izquierda respecto de la moda.

f) Diagrama de caja.

g) Es un estacionamiento atípico si supera:

Ls=Q3+1,5·(Q3-Q1)=364,61 minutos. Respecto del pago (precio por minuto estacionado) calcular:

h) Ingreso medio = 1,5 · tiempo medio =1,5·184,4= 276,6 céntimos

El ingreso más frecuente es 1,5 la moda del estacionamiento = 1,5 · 210 = 315 i) Sea g la nueva variable de cobro; g=50+1,4*tiempo:

g 50 1,4·X 50 1,4·184,4 = + = + = 308,16

La primera opción es más beneficiosa.

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: CÁLCULO Y ESTADÍSTICA 37

13.- Investigados los precios de ordenadores de 50 marcas distintas se han obtenido los siguientes resultados:

700 300 500 400 500 700 400 750 700 300

500 750 300 700 1000 1250 500 750 500 750

400 500 300 500 1000 300 400 500 400 500

300 400 700 400 700 500 400 700 1000 750

700 800 750 700 750 800 700 700 1200 800

a) Determinar la distribución de precios agrupados en frecuencias absolutas. b) Representar gráficamente el diagrama de barras y el polígono de frecuencias

acumuladas. c) Calcular el precio medio y el más frecuente. d) Calcular la varianza y el coeficiente de variación. e) Obtener el sesgo y la curtosis o apuntamiento. f) Si queremos un ordenador cuyo precio corresponda como mínimo al 10% de los

precios más caros, ¿cuál será el precio correspondiente? g) ¿Existen precios atípicos según el diagrama de caja?

Solución: a)

xi ni Ni

300 6 6 400 8 14 500 10 24 700 11 35 750 7 42 800 3 45 1000 3 48 1200 1 49 1250 1 50

∑ 50 b) Diagrama de barras

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: CÁLCULO Y ESTADÍSTICA 38

Polígono de frecuencias absolutas acumuladas

c) Media

k k ki

i i i i ii 1 i 1 i 1

n 1 32250X f x x n x

N N 50= = =

= = = = ≈∑ ∑ ∑ 645

Moda El valor que más repite Mo=700 d) Varianza

2k2 i i

i 1

(x X) n

N=

−σ = =∑ 2786250

50= 55725

Desviación típica

2 55725σ = σ = ≈ 236,0614327 Coeficiente de variación

236,0614327CV

645X

σ= = ≈ 0,365986717

e) Sesgo k

3i i

3i 11 3 3 3

(x X) f7783500

g236,0614327

=

−µ

= = = ≈σ σ

∑ 0,591697609

Asimétrica por la derecha. Curtosis

k4

i ii 1 4

2 4 4 4

(x X) f9502685625

g 3 3 3236,0614327

=

−µ

= − = − = − ≈σ σ

∑0,06017461

Más apuntada que la distribución Normal de la misma media y desviación típica muestral.

f) Percentil 90

El 90% de 50 es 45 que directamente según el polígono de frecuencias acumuladas es corresponde a los valores 800 y 1000 se toma el punto medio 900

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: CÁLCULO Y ESTADÍSTICA 39

g) Diagrama de caja. Calculamos los 5 valores: Mínimo, Q1, M, Q3, Máximo Mínimo = 300

Q1 es el valor que deja a su izquierda el 25% de la población, es decir, N 50

12,54 4= = que no

se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto es el siguiente 400. M 700= es el valor central.

Q3 es el valor que deja a su izquierda el 75% de la población, es decir, N 50

3 37,54 4= = que

no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto es el siguiente 750. Máximo = 1250 Observando el rango intercuartílico IQR = Q3-Q1= 350, tenemos como límites Q1- 1,5 IQ= -125; quedando como límite inferior el mínimo 300. Q3+ 1,5 IQ= 1275 quedando como límite superior el máximo 1250. No hay valores atípicos.

400,00 600,00 800,00 1000,00 1200,00

Precios

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: CÁLCULO Y ESTADÍSTICA 40

14.- Si en una población de 120 personas el coeficiente intelectual tiene la siguiente distribución:

Coef. Int. 60-70 70-80 80-90 90-100 100-110 110-120 120-130 130-140

ni 2 3 25 46 35 5 3 1

a) Representar el histograma de frecuencias. b) Representar el polígono de frecuencias acumuladas. c) Atendiendo al coeficiente intelectual, se consideran bien dotadas al 5% de las

personas con mayor coeficiente. ¿A partir de qué coeficiente intelectual mínimo se considerará como bien dotada a una persona de esta población?

d) ¿Qué proporción de la población es más inteligente que una persona con coeficiente intelectual 100?

e) ¿En qué percentil está situada una persona de coeficiente intelectual 90? f) Obtener la media, la moda, la mediana y la varianza de la población. Solución:

a) Histograma

c) Percentil 95 P95 es el valor que deja a su izquierda el 95% de la población, es decir,

b) Polígono de frecuencias acumuladas

N 12095 95 114

100 100= = que no se corresponde con un valor de la columna de

frecuencias absolutas acumuladas y por tanto hay que interpolar en el intervalo (110,120).

( ) ( )j 1

95 j 1j

0,95N N a 114 111 10P e 110

n 5−

− −= + = + = 116

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: CÁLCULO Y ESTADÍSTICA 41

d) Según la tabla de distribución de frecuencias acumuladas para 100 le corresponde 76 personas del total de 120, luego 44 de 120 es la proporción de personas con CI superior a 100: 36,67% e) Existen 30 personas con el CI menor o igual a 90 del total de 120, luego es la cuarta parte el percentil 25 o primer cuartil. f)

Intervalo ni Ni xini

60-70 2 3 130 2016,1250 70-80 3 5 225 1419,1875 80-90 25 30 2125 3451,5625 90-100 46 76 4370 140,8750 100-110 35 111 3675 2382,1875 110-120 5 116 575 1665,3125 120-130 3 119 375 2394,1875 130-140 1 120 135 1463,0625

∑ 120

11610 14932,5 Media

k k ki

i i i i ii 1 i 1 i 1

n 1 11610X f x x n x

N N 120= = =

= = = = =∑ ∑ ∑ 96,75

Moda El intervalo modal es (90, 100) se toma el valor 95 Mediana Cálculo de la mediana M

i 1

i 1i

N 120N a 30 10

2 2M e 90

n 46

− − ⋅ = + = + = 96,52

Varianza

2k2 i i

i 1

(x X) n

N=

−σ = =∑ 14932,5

120= 124,4375

2i in (x x)−

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: CÁLCULO Y ESTADÍSTICA 42

15.- Los siguientes datos corresponden a las cotas taquimétricas iniciales de un terreno en orden creciente:

VÉRTICES Cota inicial (xi)

1 102,3

2 101,98

3 101,37

4 101,22

5 101,98

6 101,8

7 101,48

8 101,22

9 101,87

10 100,78

11 101,3

12 101,03

13 100,42

14 100,42

15 100

A.- Construir un sumario estadístico que incluya las frecuencias: absolutas, relativas, absolutas acumuladas y relativas acumuladas. B.- Representar los datos mediante un polígono de frecuencias absolutas acumuladas. C.- Calcular el valor y explica el método empleado de los siguientes estadísticos.

Valor Fórmula empleada o método de cálculo

Percentil 10

Media

Varianza

Desviación típica

Coeficiente de variación

Coeficiente de asimetría de Fisher

Coeficiente de apuntamiento

D.- Si se consideran el 10% de los vértices que tienen mayor cota. ¿Cuál es la cota mínima? E.- Representa un diagrama de cajas y efectúa el estudio de posibles puntos atípicos. Solución:

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: CÁLCULO Y ESTADÍSTICA 43

A.- Construir un sumario estadístico que incluya las frecuencias: absolutas, relativas, absolutas acumuladas y relativas acumuladas.

xi ni fi Ni Fi

100 1 0,0667 1 0,0667

100,42 2 0,1333 3 0,2

100,78 1 0,0667 4 0,2667

101,03 1 0,0667 5 0,3333

101,22 2 0,1333 7 0,4667

101,3 1 0,0667 8 0,5333

101,37 1 0,0667 9 0,6 101,48 1 0,0667 10 0,6667

101,8 1 0,0667 11 0,7333

101,87 1 0,0667 12 0,8

101,98 2 0,1333 14 0,9333

102,3 1 0,0667 15 1

B- Representar los datos mediante un polígono de frecuencias absolutas acumuladas.

C.- Calcular el valor y explica el método empleado de los siguientes estadísticos. Valor Fórmula empleada o método de

cálculo

Percentil 10 100,42 10% de 15=1,5 <2=N2

Media 101,278

k

i ii 1

X f x=

=∑

Varianza 0,40830933

2k2 i i

i 1

(x X) n

N=

−σ =∑

Desviación típica 0,638990871

2σ = σ

Coeficiente de variación 0,006309276

CV

X

σ=

Coeficiente de asimetría de Fisher

-0,35048162

k3

i i3i 1

1 3 3

(x X) fg =

−µ

= =σ σ

Coeficiente de apuntamiento -0,76376054

k4

i ii 1 4

2 4 4

(x X) fg 3 3=

−µ

= − = −σ σ

Asimétrica por la izquierda. Menos apuntada que la distribución Normal de la misma media y desviación típica muestral.

D.- Si se consideran el 10% de los vértices que tienen mayor cota. ¿Cuál es la cota mínima? 90% de 15=13,5 <14=N11 que corresponde a 101,98

Variable Estadística

U. D. de Matemáticas de la ETSITGC Asignatura: CÁLCULO Y ESTADÍSTICA 44

E.- Representa un diagrama de cajas y efectúa el estudio de posibles puntos atípicos. Calculamos los 5 valores: Mínimo, Q1, M, Q3, Máximo Mínimo = 100

Q1 es el valor que deja a su izquierda el 25% de la población, es decir, N 15

3,754 4= = que no

se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto es el siguiente 100,78. M 101,3= es el valor central.

Q3 es el valor que deja a su izquierda el 75% de la población, es decir, N 15

3 11,254 4= = que

no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto es el siguiente 101,87. Máximo = 102,3 Observando el rango intercuartílico IQR = Q3-Q1= 1,09, tenemos como límites Q1- 1,5 IQR= 99,145; quedando como límite inferior el mínimo 100. Q3+ 1,5 IQR= 103,505 quedando como límite superior el máximo 102,3. No hay valores atípicos.

100,00 100,50 101,00 101,50 102,00

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 45

16.- Se ha tomado una fotografía aérea de una cierta escena; dentro de ella se ha seleccionado una parcela de la que se han tomado 28 muestras de los niveles de gris (pixeles) correspondientes a otros tantos puntos, obteniéndose los siguientes valores: 41, 39, 43, 40, 42, 44, 38, 42, 40, 46, 45, 44, 40, 43, 40, 42, 45, 45, 46, 39, 41, 39, 39, 43, 42, 47, 46, 40. Se quiere hacer un estudio de estos datos: agrupándolos en intervalos de amplitud dos: A.- Dibujar el histograma y el polígono de frecuencias absolutas: B.- Dibujar el polígono de frecuencias absolutas acumuladas. C.- Calcular el valor y explica el método empleado de los siguientes estadísticos.

Valor Fórmula empleada o método de cálculo

Mediana Percentil Quinto

Coeficiente de variación

Coeficiente de asimetría de Fisher

Curtosis Solución: A.- Dibujar el histograma:

y el polígono de frecuencias absolutas:

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 46

B.- Dibujar el polígono de frecuencias absolutas acumuladas.

C.- Calcular el valor y explica el método empleado de los siguientes estadísticos. Valor Fórmula empleada o método

de cálculo

Mediana 42,5714286

j 1

j 1j

NN a

2M e

n

− = +

Percentil Quinto 38,56

j 1

5 j 1j

N5 N a

100P e

n

− = +

Coeficiente de variación 0,06093936

CV

X

σ=

Coeficiente de asimetría de Fisher

0,16861377 Asimétrica por la derecha.

k3

i i3i 1

1 3 3

(x X) fg =

−µ

= =σ σ

Curtosis

-1,05661199 Menos apuntada que la distribución Normal de la misma media y desviación típica muestral.

k4

i ii 1 4

2 4 4

(x X) fg 3 3=

−µ

= − = −σ σ

La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 28

142 2= = que no se corresponde con un valor de la columna de frecuencias

absolutas acumuladas y por tanto hay interpolar en el intervalo [42, 44).

Por consiguiente la mediana es ( )j 1

j 1j

NN a

14 12 22M e 42

n 7

− − = + = + ≈

42,5714286 El percentil 5º es el valor que deja a su izquierda el 5% de la población, es decir,

N 28 75

100 20 5= = que no se corresponde con un valor de la columna de frecuencias

absolutas acumuladas y por tanto hay interpolar en el intervalo [42, 44).

Por consiguiente la mediana es ( )j 1

5 j 1j

NN a

1,4 0 220P e 38

n 5

− − = + = + ≈ 38,56

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 47

17.- La siguiente tabla recoge los salarios anuales en miles de euros de 20

trabajadores:

20 60 19 10 40 16 16 16 10 19 19 20 20 40 19 16 10 16 70 16

Se pide:

a) Polígono de frecuencias absolutas

b) Proporción de trabajadores que obtiene un salario superior o igual a 19000.

c) ¿Qué percentil le corresponde a un trabajador con un salario de 20000?

d) Coeficiente de Variación.

e) Diagrama de caja. ¿Hay valores atípicos?

Solución:

xi ni Ni

10 3 3

16 6 9

19 4 13

20 3 16

40 2 18

60 1 19

70 1 20

a)

b) Proporción de trabajadores que obtienen un salario superior o igual a 19.

4+3+2+1+1=11 sobre el total de 20, resulta 11/20

c) ¿Qué percentil le corresponde a un trabajador con un salario de 20 mil?

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 48

La frecuencia relativa correspondiente al valor 20 o menos es 16/20

aproximadamente 0,8, luego es el percentil 80

d) Media

Xi ni xini ( )2

i ix x n−

10 3 30 555 16 6 96 347 19 4 76 85 20 3 60 39 40 2 80 538 60 1 60 1325 70 1 70 2153

∑ 20 472 5041 k k k

ii i i i i

i 1 i 1 i 1

n 1 472X f x x n x

N N 20= = =

= = = = ≈∑ ∑ ∑ 23,6

Varianza 2k

2 i i

i 1

(x X) n

N=

−σ = =∑ 5041

20≈ 252,04

Desviación típica 2 252,04σ = σ = ≈ 15,8757677

Coeficiente de Variación 15,8757677

CV23,6X

σ= = ≈ 0,672702021

e) Diagrama de caja: Mínimo=10, Q1=16, M=19, Q3=20, Máximo=16

Observando el rango intercuartílico IQR = Q3-Q1= 20-16=4, tenemos como límites Q1- 1,5 IQR= 10; siendo el límite inferior y no existen valores atípicos. Q3+ 1,5 IQR= 24 siendo el límite superior y existen valores atípicos. ¿Hay valores atípicos? 40, 60 y 70.

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 49

18.- Dada la distribución de frecuencias:

Intervalo ni

0-500 3

500-1000 3

1000-1500 8

1500-2000 5

2000-2500 4

Se pide:

a) Polígono de frecuencias absolutas acumuladas.

b) El primer cuartil.

c) Coeficiente de apuntamiento o Curtosis. Interpretación.

Solución:

Intervalo xi ni Ni xini ( )2

i ix x n−

( )3

i ix x n−

0-500 250 3 3 750 3544423,440454 4187645841745,850000 500-1000 750 3 6 2250 1033553,875236 356077871005,321000 1000-1500 1250 8 14 10000 60491,493384 457402596,474428 1500-2000 1750 5 19 8750 853024,574669 145530184997,909000 2000-2500 2250 4 23 9000 3334593,572779 2779878573904,470000

∑ 23

30750 8826086,956522 7469589874250,020000 MOMENTOS

Media 1337 383742,9112 3,24765E+11

a) Polígono de frecuencias absolutas acumuladas.

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 50

b) El primer cuartil

Es el valor que deja a su izquierda el 25% de la población, es decir, N 23

5,754 4= = que

no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (500, 1000). Por consiguiente, la mediana es:

( )j 1

j 1j

NN a

5,75 3 5004M e 500

n 3

− − = + = + = 958,3

c) Curtosis

k4

-11i ii 1 4

2 4 4 2

(x X) f3,24765 10

g 3 3 3383742,9112

=

−µ ⋅

= − = − = − ≈σ σ

∑0− ,794595841

Es menos apuntada que la distribución Normal de la misma media y la misma

desviación típica muestral.

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 51

19.- Se toman 20 medidas a un grupo de 4 o más satélites en intervalos de 15 seg. En la tabla adjunta se reflejan las medidas de las variables GP:

4,7 4,7 4,8 4,9 5 5 5 5 5,1 5,1 5,1 5,1 5,1 5,2 5,2 5,2 5,3 5,3 5,3 5,3

Se pide:

a) Polígono de frecuencias absolutas acumuladas.

b) ¿Qué percentil le corresponde a un valor de GP de 5?

c) La moda.

d) La varianza muestral o cuasivarianza.

e) Realizar el diagrama de caja. ¿Hay valores atípicos?

Solución:

a) Polígono de frecuencias absolutas acumuladas.

xi ni Ni

4,7 2 2 4,8 1 3 4,9 1 4 5 4 8

5,1 5 13 5,2 3 16 5,3 4 20

b) La frecuencia relativa correspondiente al valor 5 o menos es 8/20

aproximadamente 0,4, luego es el percentil 40

c) La moda.

Moda es el valor que más se repite que es la calificación de 5,1.

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 52

d) La varianza muestral o cuasivarianza.

xi ni xini

4,7 2 9,4 0,2738 4,8 1 4,8 0,0729 4,9 1 4,9 0,0289 5 4 20 0,0196

5,1 5 25,5 0,0045 5,2 3 15,6 0,0507 5,3 4 21,2 0,2116

∑ 20 101,4 0,662 Momentos 5,07 0,0331

Media k k k

ii i i i i

i 1 i 1 i 1

n 1 101,4X f x x n x

N N 20= = =

= = = = ≈∑ ∑ ∑ 5,07

Varianza 2k

2 i i

i 1

(x X) nS

N 1=

−= =

−∑ 0,662

19≈ 0,034842105

e) Realizar el diagrama de caja.

Mínimo=4,7, Q1=5, M=5,1, Q3=5,2, Máximo=5,3 Primer cuartil igual a 5, el primer valor que excede al 0,25 de frecuencia relativa acumulada. Segundo cuartil o mediana igual a 5,1, el primer valor que excede al 0,5 de frecuencia relativa acumulada. Tercer cuartil igual a 5,2, el primer valor que excede al 0,75 de frecuencia relativa acumulada.

Observando el rango intercuartílico IQR = Q3-Q1= 5,2-5=0,2, tenemos como límites Q1- 1,5 IQR= 4,7; siendo el límite inferior y no existen valores atípicos. Q3+ 1,5 IQR= 5,5 no existen valores atípicos y siendo el límite superior 5,3

¿Hay valores atípicos? No hay.

4,80 5,00 5,20

GP

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 53

20.- Las calificaciones obtenidas por alumnos de Matemáticas en un examen fueron las siguientes:

Nota 0 – 2 2 – 4 4 – 6 6 – 8 8 – 10

ni 10 7 69 41 3

a) Representar el polígono de frecuencias absolutas.

b) ¿Cuál es el valor de la mediana?

c) ¿En qué percentil está situada una persona con una calificación de 5?

d) Interpretar el Coeficiente de asimetria de Fisher.

Solución:

a) Nota 0 – 2 2 – 4 4 – 6 6 – 8 8 – 10

ni 10 7 69 41 3 Ni 10 17 86 127 3

b) La mediana.

La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 130

652 2= = que no se corresponde con un valor de la columna de frecuencias

absolutas acumuladas y por tanto hay interpolar en el intervalo (4,6). Por consiguiente la mediana es:

( )j 1

j 1j

NN a

65 17 22M e 4

n 69

− − = + = + = 5,391304348

c) La frecuencia relativa correspondiente al valor 5 será (17+69/2)/130 aproximadamente, 0,39615, luego es aproximadamente el percentil 40

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 54

xi ni

xini

( )2

i ix x n− ( )3

i ix x n−

1 10 10 186 -799 3 7 21 37,27811 -86,02640 5 69 345 6,53254 -2,01001 7 41 287 117,42012 198,71097 9 3 27 40,89941 151,01320

Sumas 130 690 387,69231 -537,65680

Media k k k

ii i i i i

i 1 i 1 i 1

n 1 690X f x x n x

N N 130= = =

= = = = ≈∑ ∑ ∑ 5,308

Varianza 2k

2 i i

i 1

(x X) n

N=

−σ = =∑ 387,692308

130≈ 2,982248521

Sesgo

( )

3

3 11 33 3

537,656805( )130

2,982248521

=

−−= = = =

∑k

i ii

x X fg µ

σ σ0,803056398−

Asimétrica por la izquierda.

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 55

21.- La siguiente tabla recoge las calificaciones de una prueba tipo test de Cálculo:

4 2 5 5 7 4 8 4 5 5 6 9 5 2 4 7 7 4 2 7 5 1 6 5 5 3 1 6 4 1 5 0 5 7 5 9 6 2 4

Se pide:

a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6. b) El Percentil 90. c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8? d) La moda y los cuartiles. e) La media, desviación estándar o desviación típica. f) Realizar el diagrama de caja. g) ¿Hay valores atípicos? Dada la distribución de frecuencias de la variable tiempo (segundos) utilizado en la realización del test:

Intervalo ni

400-500 3

500-600 3

600-700 8

700-800 5

800-900 4

900-1000 5

1000-1100 11

Se pide: h) El tiempo más frecuente. i) La mediana. j) Sesgo. k) Curtosis

Solución:

xi ni Ni fi Fi

0 1 1 0,02564103 0,02564103

1 3 4 0,07692308 0,1025641

2 4 8 0,1025641 0,20512821

3 1 9 0,02564103 0,23076923

4 7 16 0,17948718 0,41025641

5 11 27 0,28205128 0,69230769

6 4 31 0,1025641 0,79487179

7 5 36 0,12820513 0,92307692

8 1 37 0,02564103 0,94871795

9 2 39 0,05128205 1

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 56

a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.

4+5+1+2=12 sobre el total de 39, resulta 12/39%

b) El Percentil 90.

El 90% de 39 es igual a 35,1 y en la columna de frecuencias absolutas acumuladas

el primer valor que lo excede es 36 que corresponde al 7 = P90

c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?

La frecuencia relativa correspondiente al valor 8 ó menos es 37/39

aproximadamente 0,94871, luego es el percentil 94,87

d) La moda y los cuartiles.

Moda es el valor que más se repite que es la calificación de 5.

Primer cuartil igual a 4, el primer valor que excede al 0,25 de frecuencia relativa

acumulada.

Segundo cuartil o mediana igual a 5, el primer valor que excede al 0,5 de

frecuencia relativa acumulada.

Tercer cuartil igual a 6, el primer valor que excede al 0,75 de frecuencia relativa

acumulada.

e) La media, desviación estándar o desviación típica.

xi ni xini xi2ni

0 1 0 0

1 3 3 3

2 4 8 16

3 1 3 9

4 7 28 112

5 11 55 275

6 4 24 144

7 5 35 245

8 1 8 64

9 2 18 162

182 1030

4,66666667 26,4102564

4,63247863

Media

k k ki

i i i i ii 1 i 1 i 1

n 1 182X f x x n x

N N 39= = =

= = = = ≈∑ ∑ ∑ 4,67

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 57

Varianza

2k2 i i

i 1

(x X) n

N=

−σ = =∑

2i i

2 2i

x n1030

X 4,666666667N 39

− = − ≈∑

4,63247863

Desviación típica 2 4,63247863σ = σ = ≈ 2,15231936

f) Realizar el diagrama de caja.

Mínimo=0, Q1=4, M=5, Q3=6, Máximo=9 Observando el rango intercuartílico IQR = Q3-Q1= 6-4=2, tenemos como límites Q1- 1,5 IQR= 1; siendo el límite inferior y existen valores atípicos. Q3+ 1,5 IQR= 9 siendo el límite superior y no existen valores atípicos.

g) ¿Hay valores atípicos? El cero.

0,00 2,00 4,00 6,00 8,00

notas test

A

Intervalo ni Ni xi xini ( )2

i ix x n−

400-500 3 3 450 1350 392130,2

500-600 3 6 550 1650 205207,1

600-700 8 14 650 5200 208757,4

700-800 5 19 750 3750 18934,91

800-900 4 23 850 3400 5917,16

900-1000 5 28 950 4750 95857,99

1000-1100 11 39 1050 11550 625503

31650 1552308

811,54 39802,76

h) El tiempo más frecuente.

La moda está en el intervalo (1000, 1100)

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 58

i) La mediana.

La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 39

19,52 2= = que no se corresponde con un valor de la columna de frecuencias

absolutas acumuladas y por tanto hay interpolar en el intervalo (800, 900). Por consiguiente, la mediana es:

( )j 1

j 1j

NN a

19,5 19 1002M e 800

n 4

− − = + = + = 812,5

j) Sesgo

xi ( )2

i ix x n− ( )3

i ix x n− ( )4

i ix x n−

450 392130,2 -141770141 5,126E+10

550 205207,1 -53669549,4 1,404E+10

650 208757,4 -33722348,7 5,447E+09

750 18934,91 -1165225,31 71706173

850 5917,16 227583,068 8753194,9

950 95857,99 13272644,5 1,838E+09

1050 625503 149158398 3,557E+10

1552308 -67668639,1 1,082E+11

39802,76 -1735093,31 2,775E+09

199,5063 -0,2185008 -1,2483737

k3

i i3 i 1

1 33 3

67668639,1(x X) f39g

155230839

=

−−µ

= = = =σ σ

∑-0,2185008

Ligeramente asimétrica por la izquierda.

k) Curtosis

k4

-11i ii 1 4

2 4 4 2

(x X) f1,082 10

g 3 3 339802,76

=

−µ ⋅

= − = − = − ≈σ σ

∑,−1 2483737

Menos apuntada que la distribución Normal de la misma media y misma deviación

típica muestral.

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 59

22.- Se desea estudiar la altura de un grupo de alumnos. Las alturas expresadas en centímetros fueron:

149 166 168 170 172 174 180 164 166 168

168 178 178 182 164 166 168 170 176 189

Construir un diagrama de caja. ¿Hay valores atípicos? Solución Primeramente, ordenamos los datos y observamos las frecuencias absolutas

xi ni Ni

149 1 1 164 2 3

166 3 6 168 4 10 170 2 12 172 1 13 174 1 14 176 1 15

178 2 17 180 1 18 182 1 19 189 1 20

Cuartiles ¿Q1? N/4 = 20/4=5 ⇒ Q1 = 166; Mediana ¿Q2 = M? N/2 =20/2=10 ⇒ Q2 = (168+17)/2=169; ¿Q3? 3N/4 = 15 ⇒ Q3 = (176+178)/2=177

El rango intercuartílico IQR=Q3-Q1=11 Límite inferior= Q1-1.5*IQR=149,5 Límite superior= Q3+1.5*IQR=193,5 El límite inferior es 149,5 y existen un valor menor que es 149 por lo tanto EXISTE UN VALOR ATIPICO.

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 60

23.- Se ha medido dieciséis veces la longitud en metros que separa dos puntos, Los resultados obtenidos se muestran en la siguiente tabla:

13,404 13,443 13,445 13,447 13,449 13,450 13,453 13,455

13,457 13,460 13,460 13,465 13,455 13,453 13,445 13,455

Calcular la moda, la mediana, los cuartiles y el percentil 90. Representar el diagrama de caja y estudiar la existencia de puntos atípicos. Solución: Para realizar este apartado, ordenamos los datos utilizando la tabla de distribución de frecuencias absolutas acumuladas. La moda es el valor de máxima frecuencia. La distancia 13,455 se repite tres veces y es

la distancia de mayor frecuencia, por tanto M0=13,455 metros s

La mediana (M) es el valor de la observación que ocupe el

lugar central N

82= , de modo que

M = 13,453 13,453

2

+=13,453 metros s

Ya que N

4 es un valor entero, el primer cuartil Q1 es el valor

medio de los valores situados entre el cuarto y el quinto dato, N

44= y

N1 5

4+ = , así pues,

Q1 = P25 = 13,445 13,447

2

+= 13,446 metros s

El 75 % del total de las observaciones es 12, el tercer cuartil Q3 estará entre los valores

que ocupan los lugares N

3 124= y

N3 1 13

4+ = , es decir,

Q3= P75 = 13,455 13,457

2

+= 13,456 metros s

Los nueve décimos de 16 es 14.4, por tanto, el percentil 90 ocupará el lugar 15, D9=P90 = 13,460 metros s

Calculamos los valores necesarios para la representación del diagrama. Los valores máximo y mínimo de la variable son xmáx=13,465 y xmín=13,404, respectivamente. El rango intercuartílico es IQR=13,456-13,446=0.01 y el valor de 1,5 veces el rango intercuartílico es 0,015, por tanto, las barreras son:

LI = máx [xmin, Q1-1,5*IQR] = máx [13,404, 13,431] = 13,431, así pues, representamos la barrera 13,431 y la observación xmin=13,404 que además es un valor atípico por ser menor que el valor de la barrera.

LS = mín [xmáx, Q3+1,5*IQR] =mín [13,465, 13,471] = 13,465. En este caso representamos el valor mínimo de la variable 13,465 por ser un valor menor que el de la barrera 13,471.

xi Ni 13,404 1 13,443 2 13,445 4 13,447 5 13,449 6 13,450 7 13,453 9 13,455 12 13,457 13 13,460 15 13,465 16

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 61

Con los valores anteriores representamos el diagrama de caja.

Una interpretación de este gráfico puede ser la siguiente: Observamos que las medidas de posición central media y mediana son muy similares, pero la media es menor que la mediana y, por tanto, existe asimetría negativa; hecho que también se evidencia por estar la mediana más próxima al lateral derecho de la caja que al borde izquierdo. La dispersión de los datos es pequeña como evidencia la anchura de la caja, pero el recorrido es elevado debido al dato 13,404 que representa un posible punto atípico.

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura CÁLCULO Y ESTADÍSTICA 62

24.- Los siguientes valores corresponden a la temperatura máxima diaria (ºF) de 36 días, obtenidos a las 14 horas en una cierta estación meteorológica.

84, 49, 61, 40, 83, 67, 45, 66, 70, 69, 80, 58, 68, 60, 67, 72, 75, 76,

73, 70, 63, 70, 78, 52, 67, 53, 67, 75, 61, 70, 81, 76, 79, 58, 57, 21.

a) Calcular: media, desviación típica y el coeficiente de variación. b) Estudiar la existencia de datos atípicos. Si existe algún valor atípico omitir, dicho valor y calcular de nuevo el apartado a). c) Con los datos de los apartados a y b construir un gráfico con el diagrama de caja, de ambos apartados.

Solución: a) Para el cálculo utilizaremos la tabla

Media: k

i ii 1

1X n x

N =

= =∑ 2361

3665,58≈

Varianza de la población:

2i i

22 i

x nX

Nσ = − =

∑ 160811

36

2X− ≈ 165,80

Desviación típica de la población:

2σ = σ = 165,8 12,88≈ Coeficiente de variación:

CVX

σ= =

12,88

65,58≈ 0,1964

Primer cuartil: N N

9 y 1=104 4= + ⇒

1

58 60Q 59

2

+= =

Tercer cuartil: 3 3

N 27 y N 1 284 4

= + = ⇒

3

75 75Q 75

2

+= =

Mediana: 2 2

N 18 y N 1 194 4

= + = ⇒

67 68M 67.5

2

+= = .

ix in iN in ix in 2

ix

21 1 1 21 441 40 1 2 40 1600 45 1 3 45 2025 49 1 4 49 2401 52 1 5 52 2704 53 1 6 53 2809 57 1 7 57 3249 58 2 9 116 6728 60 1 10 60 3600 61 2 12 122 7442 63 1 13 63 3969 66 1 14 66 4356 67 4 18 268 17956 68 1 19 68 4624 69 1 20 69 4761 70 4 24 280 19600 72 1 25 72 5184 73 1 26 73 5329 75 2 28 150 11250 76 2 30 152 11552 78 1 31 78 6084 79 1 32 79 6241 80 1 33 80 6400 81 1 34 81 6561 83 1 35 83 6889 84 1 36 84 7056 2361 160811

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura ESTADÍSTICA 63

b) El rango intercuatílico y las barreras del gráfico son: El valor x=21 ºF es una temperatura atípica del conjunto de datos. c) Si omitimos la observación 21ºF y procedemos de forma análoga al apartado a) se tiene:

Media: k

i ii 1

1X n x

N =

= =∑ 2340

3566,86=

Varianza de la población:

2i i

22 i

x nX

Nσ = − =

2160370X

35− 112,12=

Desviación típica de la población: 2 10,59σ = σ =

Coeficiente de variación: CVX

σ= =

10,59

66,86≈ 0,1584

Primer cuartil: N

8,75 4= ⇒ 1Q 60=

Tercer cuartil: 3

N 26,254

= ⇒ 3Q 75=

Mediana: 2

N 17,54

= ⇒ M 68=

Los valores del rango intercuartílco y de las barreras son: Rango intercuartílico: IQR=75-59=15. LI =máx[ xmin, Q1-1,5·16] = máx[40, 37.5]=40. LS =mín[ xmáx, Q3+1,5·15] = mín[84, 97.5] = 84.

Con los datos calculados anteriormente, obtenemos el diagrama de cajas de ambas series de datos. Realizado el diagrama de cajas en ambos casos, una lectura de este gráfico sería que la dispersión y la asimetría son mayores en el apartado a) que en el apartado b). En a) la caja es algo más ancha y, por tanto, mayor la dispersión. También observamos que en b) la media está más próxima a la mediana que en a) y por ello es más simétrica y más significativa en b) al ser menor la dispersión.

LS =mín[ xmáx, Q3+1,5·16]=mín[84, 99]=84. IQR=75-59=16

LI =máx[ xmín, Q1-1,5·16]=máx[21, 35]=35.

00,5

11,5

22,5

33,5

44,5

5

0 20 40 60 80 100

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura ESTADÍSTICA 64

25.- Los valores de 50 mediciones realizadas con un distanciometro con apreciación en milímetros han sido agrupados en 6 intervalos según la tabla siguiente:

ei-1 – ei ni

21,150 – 21,155 4

21,155 – 21,160 6

21,160 – 21,165 11

21,165 – 21,170 13

21,170 – 21,175 9

21,175 – 21,180 7

Total 50

a) Porcentaje de mediciones cuya distancia es mayor o igual que 21,160. b) Representar el polígono de frecuencias absolutas acumuladas y el histograma de

frecuencias absolutas. c) Calcular, los cuartiles y la mediana. d) Estimar el porcentaje de mediciones cuya distancia sea menos de 21,1725. e) ¿Qué distancia tienen como máximo el 95% de las mediciones? f) Calcular la media, moda y varianza.

Solución: a) Porcentaje de mediciones cuya distancia es mayor o igual que 21,160 mayor que

21,160 son 50-10 =40, por tanto 40*100/50 = 80% b) Polígono de frecuencias absolutas acumuladas

Histograma

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura ESTADÍSTICA 65

c) Cuartil primero: posición 50/4=12,5 Q1=21,16+(12,5-10)*0,005/11= 21,16113636 Mediana posición 50/2=25 M = Q2 =21,165+(25-21)*0,005/13= 21,16653846 Cuartil tercero: posición 3 50/4=37,5 Q3= =21,17+(37,5-34)*0,005/9= 21,1719 d) Por ser el problema inverso se puede plantear 21,1725=21,170+((a*50/100-34)*0,005)/9 despejando se obtiene a=77. Es decir, percentil 77. e) Percentil 95 posición 95*50/100=47,5 P95 =21,175+(47,5-43)*0,005/7= 21,1782143 f)

ei-1 ei ni xi Ni ni ·xi ni (xi-media)2

21,150

0

21,150 21,155 4 21,1525 4 84,61 0,00076176 21,155 21,160 6 21,1575 10 126,945 0,00046464 21,160 21,165 11 21,1625 21 232,7875 0,00015884 21,165 21,170 13 21,1675 34 275,1775 1,872E-05 21,170 21,175 9 21,1725 43 190,5525 0,00034596

21,175 21,18 7 21,1775 50 148,2425 0,00087808 Totales

50

1058,315 0,002628

Media

k k ki

i i i i ii 1 i 1 i 1

n 1 1058,315X f x x n x

N N 50= = =

= = = = ≈∑ ∑ ∑ 21,1663

El intervalo modal es de 21,165 a 21,170. Varianza

2k2 i i

i 1

(x X) n 0,002628

N 50=

−σ = = ≈∑ 5,256 10-5

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura ESTADÍSTICA 66

26.- Del conjunto de redes topográficas que intervienen en un trabajo topográfico estamos interesados en estudiar el número de vértices geodésicos que constituyen cada red topográfica. Para ello, seleccionamos 30 redes topográficas, obteniéndose la siguiente tabla:

Nº de vértices en las 30 redes

xi 1 2 3 4 5 6

Frecuencia absoluta ni 3 8 9 6 3 1

Respecto del número de vértices geodésicos que constituyen la red (característica a estudiar) Calcular: a) Representar el polígono de frecuencias absolutas y el polígono de frecuencias

acumuladas. b) Hallar los cuartiles, la mediana y los percentiles 5 y 10. c) ¿Qué número de vértices tienen el 80% de las redes? d) Calcular la media, moda y varianza. e) Representar el diagrama de caja.

Solución: a) Polígono de frecuencias absolutas

b) Cuartil primero: posición 30/4 = 7,5

Q1 =2 Mediana: posición 30/2 = 15 M = Q2 =3

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura ESTADÍSTICA 67

Cuartil tercero: posición 3*30/4 = 22,5 Q3 =4 Percentil 5 posición 5*30/100 = 1,5 P5 =1 Percentil 10 posición 10*30/100 = 3. Obsérvese que se corresponde con los valores 1 y 2 tomamos P10 =1,5

c) Percentil 80 posición 80*30/100 = 24 P80 =4

d)

xi ni Ni ni · xi ni (xi -media)2 1 3 3 3 12,40 2 8 11 16 8,54 3 9 20 27 0,01 4 6 26 24 5,61 5 3 29 15 11,60 6 1 30 6 8,80

sumatorio 30 91 46,97 Media

k k ki

i i i i ii 1 i 1 i 1

n 1 91X f x x n x

N N 30= = =

= = = = ≈∑ ∑ ∑ 3,03

La moda es 3. Varianza

2k2 i i

i 1

(x X) n 46,97

N 30=

−σ = = ≈∑ 1,57

e)

No hay valores atípicos

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura ESTADÍSTICA 68

27.- Se quiere analiza el resultado de una secuencia de cifras elegidas, al azar, 141592653589793238462433832795028841971693993751058209749445923078164062862089986280348253421170679, todas las cifras han sido elegidas al azar mediante extracciones de una urna con 10 bolas numeradas del 0 al 9. La siguiente tabla recoge la distribución de frecuencias absolutas:

xi 0 1 2 3 4 5 6 7 8 9

ni 8 8 12 11 10 8 9 8 12 14

Se pide: a) Moda. b) Media. c) Diagrama de caja, ¿hay valores atípicos? d) Coeficiente de asimetría Solución: a) La Moda es igual a 9 puesto que es el valor correspondiente a la máxima frecuencia 14 b) Media

k k ki

i i i i ii 1 i 1 i 1

n 1 477X f x x n x

N N 100= = =

= = = = ≈∑ ∑ ∑ 4,77

c) Dibujar el diagrama de caja. Calculamos los 5 valores: Mínimo, Q1, M, Q3, Máximo Mínimo = 0

xi ni Ni

0 8 8

1 8 16

2 12 28

3 11 39

4 10 49

5 8 57

6 9 66

7 8 74

8 12 86

9 14 100

Q1 es el valor que deja a su izquierda el 25% de la población, es decir, N 100

254 4= = que no

se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto Q1=2

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura ESTADÍSTICA 69

Q2=M es el valor que deja a su izquierda el 50% de la población, es decir, N 100

502 2= = que

no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto M=5

Q3 es el valor que deja a su izquierda el 75% de la población, es decir, 3N 300

754 4

= = que no

se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto Q3=8 Observando el rango intercuartílico IQR = Q3-Q1= 8-2=6, tenemos como límites LI=Q1- 1,5 IQR= -7; quedando como límite inferior el mínimo 0. LS=Q3+ 1,5 IQR= 17 quedando como límite superior el máximo 9 y no existen valores atípicos.

d) Coeficiente de asimetría o Sesgo:

( )( ) ( )

3

i i31 3 33

2

i i

x X f 0,479634g

2,92866864x X f

−µ −= = = =σ

∑0,019094103− Asimétrica por la izquierda.

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura ESTADÍSTICA 70

28.- La variable estadística X toma los siguientes valores: 5 6 4 0 5 5 6 10 5

4 4 6 5 6 5 4 5 4 6 5 6 4 5 5 6 5 6 4 5 5 5 6 4 5 5 4 5 5 5 5. Se

pide:

a) Construir la tabla de frecuencias de X.

b) Calcular e interpretar las medidas de posición, dispersión y asimetría de la

variable.

c) Construir e interpretar el diagrama de caja de X. Localizar los datos

atípicos.

d) Determinar que medidas se ven afectadas al cambiar el valor 6 por 46.

Construir e interpretar el diagrama de caja de la variable modificada.

Localizar los datos atípicos.

Solución: a) Tabla de frecuencias

Valor Frec. absoluta Frec. relativa Frec. Rel. Acumulada

Frec. Rel. Acumulada

0 1 0,025 1 0,025 4 9 0,225 10 0,25 5 20 0,5 30 0,75 6 9 0,225 39 0,975 10 1 0,025 40 1

b) • Número total de datos: N=40

xi ni xini xi2ni

0 1 0 0 4 9 36 144 5 20 100 500 6 9 54 324 10 1 10 100

sumatorio 40 200 1068

• Media k

i ii 1

1X n x

N =

= =∑ 5,0

• Mediana 5,0 el que ocupa el lugar central • Moda 5,0 el de mayor frecuencia

• Varianza

2i i

22 2i

x n1068

X 5N 40

σ = − = − =∑

1,70000

• Desviación típica 2σ = σ = 1,30384 • Primer cuartil Q1=4,5 • Tercer cuartil Q3=5,5 • Rango Intercuartílico IQR=Q3-Q1=1,0

• Coef. de asimetría ( )3

i i31 3 3

x X fg

−µ= =σ σ

∑0, por coincidir media, moda y

mediana

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura ESTADÍSTICA 71

• Coef. de variacion 1,30384

CV5X

σ= = ≈ 0,26

c) Menor valor no atípico: 4 Mayor valor no atípico: 6; IQR=1 LI =máx[ xmin, Q1-1,5·1] = máx[0, 3]=3. LS =mín[ xmáx, Q3+1,5·1] = mín[10, 6] = 6. Datos atípicos: 0 y 1

d) Medidas que se ven afectadas:

Media, varianza (cuasivarianza), desviación típica (cuasidesviación típica), máximo, rango, segundo cuartil, rango intercuartílico, coeficiente de asimetría y coeficiente de variación.

Medidas propuestas para detectar datos atípicos: El rango, los cuartiles, el rango intercuartílico

Variable Estadística

Unidad Docente de Matemáticas de la ETSITGC Asignatura ESTADÍSTICA 72

29.- El gráfico adjunto representa el polígono de frecuencias acumuladas sobre las edades de 300 personas encuestadas en Madrid al azar en la Plaza de Colón entre las 3 y las 4 de la mañana.

Se pide: (c) Determinar si esta muestra es representativa de las edades de los

habitantes de Madrid.

(d) Aproximarla mediana, el tercer cuartil y el octavo decil, e interpretarlos en términos de la variable estudiada.

Solución: a) Obviamente no. No interviene toda la población de Madrid b) Mediana= 24 es la antiimagen o imagen inversa de N/2=150; Q3=30 es la antiimagen o imagen inversa de 3N/4=175; D8=33 es la antiimagen o imagen inversa de 8N/10=240.

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 94

Histograma En un histograma se representan las frecuencias de una variable estadística mediante áreas. De tal forma que un histograma es un conjunto de rectángulos que tienen como base los intervalos de clase y cuya superficie son las frecuencias (absolutas o relativas). Por tanto, las alturas son proporcionales a las frecuencias, y será el cociente entre la frecuencia y la amplitud del intervalo.

Si algún intervalo es de distinta amplitud, el cálculo de su altura (hi) se efectuará hallando el cociente ni/ai o fi/ai, donde ai representa la amplitud del intervalo.

ni

ei-1 ei

niai

f i

ei-1 ei

f iai

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía

Polígono de frecuencias acumuladas

Para variables estadísticas sin agrupar en intervalos de clase.Representamos en el eje de abscisas los distintos valores de la variable

estadística. Levantamos sobre cada uno de ellos un perpendicular cuya longitud

será la frecuencia (absoluta, Ni, o relativa, Fi) acumulada correspondiente a ese

valor. De esta forma aparece un diagrama de barras creciente. Trazando

segmentos horizontales de cada extremo de barra a cortar la barra situada a su

derecha se obtiene el diagrama o polígono de frecuencias acumuladas.

0

5

10

15

20

25

30

35

40 N

xi

i

Para variables estadísticas agrupadas en intervalos de clase.En el eje de abscisas representamos los distintos intervalos de clase de una variable estadística que han de estar naturalmente solapados. Sobre el extremo superior de cada intervalo se levanta una línea vertical de longitud equivalente a la frecuencia (absoluta o relativa) acumulada del mismo. Se obtiene así un diagrama de barras creciente, que uniendo sus extremos da lugar al polígono de frecuencias acumuladas.

Alcanzará su máxima altura en el último intervalo, que tendrá de frecuencia N ó 1 según se trate de frecuencias acumuladas absolutas o relativas.

e e e e e0 1 i i+1 k

N i

N

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 143

Moda Moda es el valor de la variable que se presenta con más frecuencia dentro de la distribución. En las distribuciones sin agrupar se observa directamente el valor de mayor frecuencia. En las agrupadas, definimos la clase modal como la que tiene mayor frecuencia. NOTA: Algunas distribuciones pueden presentar varias modas. Cada moda corresponde a un máximo absoluto del diagrama de barras o histograma.

Para variables aleatorias La moda es el máximo de la función de densidad o de la función de probabilidad

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 136

Media aritmética La media de una variable estadística es la suma ponderada de los valores

posibles por sus respectivas frecuencias: X f xn

Nx

Nn xi

i

k

ii

i

k

i ii

k

i

1 1 1

1

xi = valores que toma la variable o marca de clase. fi = frecuencias relativas. ni = frecuencias absolutas. N = número total de la población o muestra. Relación entre las medias armónica, geométrica y aritmética: H G X La media o esperanza matemática de una variable aleatoria es: 1m E x

E = x P Xi ii

n

( )

1

para una variable discreta y finita.

E = x.f (x).dx

cuando la variable es continua con función de

densidad f(x). Media armónica

Medida de tendencia central de una variable estadística es el cociente entre el tamaño de la muestra y la suma de los cocientes de las frecuencias por los

valores de las correspondientes de la variable: ki

i 1 i

NH

n

x

xi = valores que toma la variable o marca de clase. fi = frecuencias relativas. ni = frecuencias absolutas. N = número total de la población o muestra. Relación entre las medias armónica, geométrica y aritmética: H G X

Media cuadrática

Medida de tendencia central de una variable estadística es la raíz cuadrada de la suma ponderada de los cuadrados de los posibles valores de la variable multiplicados por sus respectivas frecuencias:

k k2 2i

i i ii 1 i 1

nMC f x x

N

Media geométrica Medida de tendencia central de una variable estadística que resulta de la raíz n-ésima del producto de los valores posibles de la variable, elevados a a sus respectivas frecuencias: 1 2 kn n nN

1 2 kG x .x ...x

xi = valores que toma la variable o marca de clase. fi = frecuencias relativas. ni = frecuencias absolutas. N = número total de la población o muestra. Relación entre las medias armónica, geométrica y aritmética: H G X

Mediana

Mediana de un triángulo es el segmento que une un vértice con el punto medio del lado opuesto. Mediana de un triángulo esférico es el arco de circunferencia máxima que une un vértice con el punto medio del lado opuesto. En Estadística: La mediana es el valor de la variable que ocupa el lugar central, es decir, que la mitad de la población es menor y la otra mitad es mayor que él. La mediana es un valor M tal que F(M)=1/2, se define así como raíz de una ecuación.

Para las variables estadísticas se ordenan en forma creciente, dejando igual número de observaciones inferiores que superiores a ella.

a) En las distribuciones sin agrupar, en general, no tiene solución, puesto que la función F(x) varía por saltos: 1) Si ningún valor posible xi corresponde a F(xi )=1/2 se conviene en considerar

como mediana el valor xi tal que: F x F xi i( ) ( ) 1

1

2

2) Si uno de los valores xi corresponde a F xi( ) 1

2 (lo que ocurre solamente si el

total N de la población es par) la mediana está indeterminada entre los valores xi y xi+1. El

intervalo (xi, xi+1) se denomina mediano, o bien llamamos mediana al punto medio de

dicho intervalo. b) En las agrupadas pueden darse dos casos:

INTERVALO xi ni Ni

e0 -- e1 x1 n1 N1

e1 -- e2 x2 n2 N2

............ ... ... .... ej-2 – ej-1 xj-1 Nj-1 Nj-1

ej-1 -- ej xj nj Nj

............ ... ... ... ek-1 -- ek xk nk N

1) N

2 coincide con uno de los recogidos en la columna de frecuencias acumuladas,

por ejemplo Nj, en este caso la mediana es ej.

2) N

2 está entre N j1 y N j. La mediana se encontrará en el intervalo ( , )e ej j1 . La

mediana será M e hj 1 y por interpolación lineal se obtiene h.

Amplitud del intervalo: a = e ej j-1

j

j 1

n a

NN h

2

h

NN a

nM e

NN a

n

j

jj

j

j

( ) ( )2 21

1

1

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 207

Varianza Varianza o momento de segundo orden respecto de la media en una variable estadística es la media de los cuadrados de las desviaciones a la media:

22

1

( )x X n

Ni i

i

k

ix = valores de la variable o marcas de clase. La varianza de una variable aleatoria es el momento de segundo orden respecto a

la media: 22

2 E x x

V = n 2

i ii 1

x x P(X )

para una variable discreta y finita.

V = 22 x x .f (x).dx

cuando la variable es continua con función de

densidad f(x).

Varianza explicada

En la recta de regresión de la Y sobre X la varianza total de la variable Y puede descomponerse en dos partes una parte explicada por la regresión (la varianza de la regresión) y otra parte no explicada (la varianza residual). La varianza explicada, será la obtenida por el producto de la varianza de Y por el coeficiente de determinación R2.

Varianza muestral o cuasivarianza

La varianza muestral viene dada por:

SN

N2 2

1

, es decir: S N

N

x X

N

x X

N

ii

k

ii

k

2

2

1

2

1

1 1

( ) ( )

Nótese que para N suficientemente grande la diferencia entre 2 y S2 es muy pequeña.

Varianza residual

La varianza residual se define como la varianza de los errores o residuos

Varianza residual de una variable aleatoria X con respecto a otra Y es igual a la varianza de Y por (1-r2), siendo r el coeficiente de correlación lineal entre ambas variables.

La varianza residual o no explicada 2 2r i j ij

i, j

1(y * y ) n

n 2 2

y (1 r )

Siendo el valor ajustado o teórico= iy *

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 52

Desviación típica La desviación típica o desviación cuadrática media es la raíz cuadrada positiva de

la varianza: ( ) ( )2 2

1

x X fi ii

k

o bien, x f Xi ii

k2 2

1

Desviación típica muestral

La desviación típica muestral es la raíz cuadrada positiva de la varianza muestral.

Sx X n

N

N

Ni i

i

k

( )

( )

2

1 1 1

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 27

Coeficiente de variación de Pearson

Es el cociente de la desviación típica y la media. CVX

Es siempre positivo y no existe si la media vale cero. Es frecuente expresarlo en tanto por ciento.

Es independiente de la unidad que se utilice, pues no tiene unidades y por tanto nos permite comparar la dispersión de dos distribuciones que tengan unidades diferentes, o que tengan medias muy distintas.

Sesgo Para obtener una medida adimensional de la simetría de una variable estadística, se define el coeficiente de asimetría o sesgo

Coeficiente de Asimetría de Pearson: os

X MA

.

Mide la asimetría respecto de la moda.

Si As=0 es simétrica respecto de la moda. 0X M .

Si As>0 es asimétrica a la derecha de la moda. 0X M .

Si As<0 es asimétrica a la izquierda de la moda. 0X M .

Si la moda no es única, no está definido.

Coeficiente de Asimetría de Fisher:

k 3

i i3 i 1

1 3 3

n x X1

gn

Es un coeficiente adimensional y mide la asimetría respecto de la media.

Si g1=0 la distribución es simétrica o no sesgada.

Si g1<0 la distribución es asimétrica o sesgada a la izquierda y

e oX M M .

Si g1>0 la distribución es asimétrica o sesgada a la derecha y o eM M X .

El sesgo es la diferencia entre el valor esperado de un estimador y el verdadero valor del parámetro: E(θ*) - θ

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 42

Curtosis El coeficiente de Curtosis es el grado de apuntamiento de una distribución. Será mayor cuanto mayor sea la concentración de valores alrededor de la media. Se mide en relación a la distribución Normal, de la misma media y desviación típica.

El coeficiente de apuntamiento de Fisher, es: g244

3

De forma que es nulo para la distribución normal. Si el coeficiente es positivo la distribución está más apuntada que la distribución Normal (de la misma media y desviación típica), y se dice leptocúrtica. Si es menos apuntada el coeficiente es negativo y se dice platicúrtica. Mesocúrtica es cuando el coeficiente es nulo.

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 33

Cuantiles Cuantil de orden es un valor de la variable estadística que deja a su izquierda una parte de la población y a la derecha una parte 1- de la población. El Cuantil de orden (0 1) es x tal que F(x)=. Siendo F la función de distribución o la frecuencia relativa acumulada. Los más utilizados son los cuartiles Q1, Q2 y Q3 que dejan a su izquierda 1/4, 1/2 y 3/4 de la población respectivamente. Obsérvese que Q2 = M (Mediana). Los deciles D1, D2, ..... , D9 dejan a su izquierda 1/10, 2/10, ..., 9/10 de la población respectivamente. Los percentiles P1, P2, ........, P99 dejan a su izquierda 1/100, 2/100, ..... 99/100 de la población respectivamente. El cálculo de los mismos es similar al cálculo de la mediana.

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 56

Diagrama de cajas o Box-plot

Se construye sólo para variables cuantitativas. Pasos a seguir: •Se dibuja un rectángulo cuyos extremos son Q1 y Q3 y se indica la posición de la mediana mediante una línea vertical. También se indica la media mediante una cruz (+). •Se dibuja una línea desde cada extremo del rectángulo hasta el valor más alejado no atípico. •Se calculan los límites de admisión (barreras o bigotes)

LI =Q1 -1,5 (Q3- Q1) LS =Q3 +1,5 (Q3- Q1)

•Se marcan todos los datos considerados como atípicos (outliers) son los que quedan fuera de los límites de admisión se indican mediante un círculo. Existen otros valores atípicos más graves (atípicos extremos) que superen 3 veces el rango intercuartilíco y se representan por cruces (x). Si no hubiese ningún dato atípico las barreras llegarían hasta el valor mínimo y máximo.

Q1-1,5(Q3-Q1) Q3+1,5(Q3-Q1)

Q1 Q2 = M Q3

+

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 64

Distribución de frecuencias Distribución de frecuencias: es conjunto de modalidades con sus respectivas frecuencias. Según sean éstas (absolutas, relativas,....) así lo será la distribución correspondiente. Las distribuciones de frecuencias se representan mediante tablas estadísticas. Se clasifican en dos tipos: - Sin agrupar: aparecen los datos individualizados con sus respectivas frecuencias. Se utiliza cuando la variable toma pocos valores diferentes. - Agrupados en intervalos se divide el campo de la variable en intervalos llamados de clase, que tendrán como frecuencia el número de elementos que estén en el intervalo. Se utiliza cuando la variable toma muchos valores distintos entre sí. La distribución de frecuencias quedaría así:

Intervalo Marca de clase ix

Frecuencia absoluta

Frecuencia relativa

Frecuencia relativa

acumulada

Frecuencia absoluta

acumulada 0 1e ,e x1 n1 f1 F1 N1

1 2e ,e x2 n2 f2 F2 N2

........... ... ... ... ... ... i 1 i e , e xi ni fi Fi Ni

........... ... ... ... ... ... k 1 k e ,e xk nk fk Fk Nk

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 207

Varianza muestral o cuasivarianza La varianza muestral viene dada por:

SN

N2 2

1

, es decir: S N

N

x X

N

x X

N

ii

k

ii

k

2

2

1

2

1

1 1

( ) ( )

Nótese que para N suficientemente grande la diferencia entre 2 y S2 es muy pequeña.

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 170

Rango de un sistema de vectores

Rango de un sistema de vectores es igual al número máximo de vectores linealmente independientes que contiene.

Rango de una aplicación lineal

Rango de la aplicación lineal f es la dimensión del subespacio Imagen de f.

Rango de una matriz

Rango de la matriz A es el orden del menor de mayor orden no nulo de A. Lo denotaremos por r(A) o bien por rg(A).

En Estadística

Rango o recorrido de una variable estadística Es la diferencia entre el mayor y el menor valor de la variable estadística.

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 144

Momentos de una variable aleatoria

El momento de orden k respecto al origen se define como m E xkk en

el caso de variables discretas: m E xkk = x P xi

ki

i

n

. ( )

1

y si la variable es

continua: m E xkk = x f x).dxk . (

La media o esperanza matemática es: m E x x1

El momento de orden k respecto a la media, 1m , de la distribución se

define como k

kE x m 1 .

Entre estos tiene particular importancia la varianza que es el momento de segundo orden respecto a la media: 2

21

2 E x m

La raíz cuadrada positiva de la varianza se llama desviación típica

Momentos de una variable estadística Se llama momento de orden r respecto al valor "c" en una variable estadística,

a la cantidad: ( ) ( )x c f x cn

Nir

ii

k

ir i

i

k

1 1

, donde r es un entero positivo.

Según los valores de "c", se definen varias clases de momentos: Momentos no centrales o respecto al origen,

c mr

xir f

ii

kx

ir n

iN

i

k

0

1 1

Momentos centrales o respecto a la media

c X x X f x Xn

Nr ir

ii

k

ir

i

ki

( ) ( )

1 1

A los caracteres de una variable estadística bidimensional les vamos a

llamar x e y, cada uno de ellos presentará varias modalidades x xr1,....., e y ys1,....., respectivamente.

Momentos respecto al origen: mN

x y nh k ih

j

s

jk

i

r

ij, 1

11

Momentos respecto a la media: h k ih

jk

ijj

s

i

r

Nx X y Y n, ( ) ( )

1

11

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 171

Rango intercuartílico El rango intercuartílico es la diferencia entre los cuartiles Q

1 y Q3 de una variable estadística: 3 1IQR Q Q .

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 131

Polígono de frecuencias

Polígono de frecuencias de una variable discreta, sin agrupar: es una línea que se obtiene uniendo los extremos superiores de las barras en el diagrama de barras.

frecuencia (absoluta o relativa)

0

2

4

6

8

10

12

14

16

00,10,20,30,40,50,60,70,80,91

Para variables estadísticas agrupadas en intervalos de clase. El polígono de frecuencias es una línea que se obtiene uniendo los puntos medios de las bases superiores (los techos) de cada rectángulo en el histograma. De forma que empiece y acabe sobre el eje de abscisas, en el punto medio del que sería el intervalo anterior al primero y posterior al último.

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 116

Medidas de centralización

Nos dan una idea de los valores de la variable estadística alrededor de los que se agrupa la distribución.

Media aritmética, geométrica y armónica Mediana Moda Cuantiles

Medidas de dispersión

Las medidas de dispersión nos dan una idea de la mayor o menor concentración de los valores de la variable estadística alrededor de algún valor.

Rango o recorrido Recorrido semi-intercuartílico Varianza Varianza muestral o cuasivarianza. Desviación típica Desviación típica muestral. Coeficiente de variación de Pearson Momentos

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 47

Diagrama de barras Esta representación es válida para las frecuencias de una variable discreta, sin agrupar. Se colocan sobre el eje de las abscisas los distintos valores de la variable y sobre cada uno de ellos se levanta una línea o barra perpendicular, cuya altura es la frecuencia (absoluta, relativa) de dicho valor.