Materia Estadistica

15
Instituto Profesional La Araucana Técnico en Prevención de Riesgos pág. 1 ESTADÍSTICA DESCRIPTIVA. TEMA 1: PROCEDIMIENTO A SEGUIR EN UN ESTUDIO ESTADÍSTICO El proceso seguido en el estudio estadístico de una cierta característica o variable, puede subdividirse en tres pasos sucesivos: * Recogida de datos: Planteado el test o encuesta oportuna y recogidos los datos que correspondan, el primer análisis que realizaremos es el del tipo de variable que pretendemos estudiar (Cualitativa o Cuantitativa; Discreta o Continua). Esto condicionará en gran medida su posterior tratamiento. * Organización de los datos: Determinado el modo de agrupamiento de las observaciones, procedemos a su recuento, construyendo la tabla de frecuencias. Posteriormente podremos visualizar tales frecuencias de forma gráfica con el diagrama estadístico apropiado. * Análisis final: La obtención de muy diversas conclusiones respecto de la variable estudiada, se podrá realizar con auxilio de los diferentes parámetros estadísticos (de centralización, posición, dispersión , etc.) TEMA 2: TIPOS DE VARIABLES Variable: las variables son características que se distinguen por la variabilidad con que se manifiestan en los diversos individuos. Las variables cualitativas (CL) o atributos se miden por escalas nominales u ordinales según corresponda. Cuando sólo tienen dos modalidades se llaman dicotómicas. Ejemplos: cara-cruz, varón-hembra, vivo-muerto. Escalas nominales: se da un nombre a cada una de las modalidades, se asignan los individuos a ellas y se cuentan los individuos de cada modalidad (frecuencia). El orden en que se designan las modalidades es indiferente, por ejemplo alto y bajo o bajo y alto. Escalas ordinales: son escalas nominales en las que diversa modalidades guardan entre sí una relación de orden o jerarquía, que debe ser respetada, un ejemplo clásico son las notas académicas tradicionales: sobresaliente-notable-aprobado-reprobado. Las variables cuantitativas (CT) se miden por escalas de intervalo o de razón, según su naturaleza. Pueden ser continuas o discretas. Una variable CT es continua cuando puede tomar cualquier valor en su zona de variabilidad. Son continuas la talla, el peso, la tensión arterial, el contenido de un frasco, etc. (pueden ser valores decimales) Las variables CT discretas no pueden adoptar cualquier valor, sino solamente ciertos valores. Una familia puede tener 0, 1, 2, 3 hijos, pero no 3,1416 hijos. El nº de pacientes que ingresa en un hospital, etc. (deben ser números enteros)

description

es

Transcript of Materia Estadistica

Page 1: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 1

ESTADÍSTICA DESCRIPTIVA.

TEMA 1: PROCEDIMIENTO A SEGUIR EN UN ESTUDIO ESTADÍSTICO El proceso seguido en el estudio estadístico de una cierta característica o variable, puede subdividirse en tres pasos sucesivos: * Recogida de datos: Planteado el test o encuesta oportuna y recogidos los datos que correspondan, el primer análisis que realizaremos es el del tipo de variable que pretendemos estudiar (Cualitativa o Cuantitativa; Discreta o Continua). Esto condicionará en gran medida su posterior tratamiento. * Organización de los datos: Determinado el modo de agrupamiento de las observaciones, procedemos a su recuento, construyendo la tabla de frecuencias. Posteriormente podremos visualizar tales frecuencias de forma gráfica con el diagrama estadístico apropiado. * Análisis final: La obtención de muy diversas conclusiones respecto de la variable estudiada, se podrá realizar con auxilio de los diferentes parámetros estadísticos (de centralización, posición, dispersión , etc.) TEMA 2: TIPOS DE VARIABLES

• Variable: las variables son características que se distinguen por la variabilidad con que se manifiestan en los diversos individuos.

• Las variables cualitativas (CL) o atributos se miden por escalas nominales u ordinales según corresponda. Cuando sólo tienen dos modalidades se llaman dicotómicas. Ejemplos: cara-cruz, varón-hembra, vivo-muerto.

� Escalas nominales: se da un nombre a cada una de las modalidades, se asignan los individuos a ellas y se cuentan los individuos de cada modalidad (frecuencia). El orden en que se designan las modalidades es indiferente, por ejemplo alto y bajo o bajo y alto.

� Escalas ordinales: son escalas nominales en las que diversa modalidades guardan entre sí una relación de orden o jerarquía, que debe ser respetada, un ejemplo clásico son las notas académicas tradicionales: sobresaliente-notable-aprobado-reprobado.

• Las variables cuantitativas (CT) se miden por escalas de intervalo o de razón, según su naturaleza. Pueden ser continuas o discretas.

� Una variable CT es continua cuando puede tomar cualquier valor en su zona de variabilidad. Son continuas la talla, el peso, la tensión arterial, el contenido de un frasco, etc. (pueden ser valores decimales)

� Las variables CT discretas no pueden adoptar cualquier valor, sino solamente ciertos valores. Una familia puede tener 0, 1, 2, 3 hijos, pero no 3,1416 hijos. El nº de pacientes que ingresa en un hospital, etc. (deben ser números enteros)

Page 2: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 2

TEMA 3: POBLACION - MUESTRA

- Población: es el conjunto total de individuos, objetos o medidas que poseen algunas características comunes observables en un lugar y en un momento determinado. Cuando se vaya a llevar a cabo alguna investigación debe de tenerse en cuenta algunas características esenciales al seleccionarse la población bajo estudio.

- Muestra: es un subconjunto fielmente representativo de la población. Hay diferentes tipos de muestreo. El tipo de muestra que se seleccione dependerá de la calidad y cuán representativo se quiera sea el estudio de la población.

Bajo el término “Estadística Descriptiva” se engloban las técnicas que nos permitirán realizar un análisis elemental de las observaciones experimentales observadas. TEMA 4: TABLAS DE FRECUENCIA

Tabular los datos, consiste en presentar los datos estadísticos en forma de tablas o cuadros.

1) Tabla de datos (variables cualitativas): Situados en una tabla los valores de la variable (desde el mínimo al máximo) o los intervalos que los contienen, procedemos a contar las veces que se repiten.

• Ejemplo: Tabla1: Severidad de accidentes en temporeros del arándanos durante enero 2012.

Tipos de accidentes

�� � �� �� ��% ��%

leve 80 80 0,400 0,400 40% 40%

medio 95 175 0,475 0,875 47,5% 87,5%

grave 25 200 0,125 1 12,5% 100%

* Frecuencia Absoluta ���:

Es el número de veces

que se presenta cada

valor de la variable.

* Frecuencia Relativa ��: Cociente (división) entre

la frecuencia absoluta y el

número total de

observaciones (N).

* Frecuencia Relativa Porcentual ��% : Frecuencia relativa

multiplicada por 100 (es la

expresión de las

frecuencias en %).

*Frecuencias Acumuladas ���, �, �%: Para un cierto valor de la variable, la frecuencia acumulada se obtiene sumando las

frecuencias anteriores.

Page 3: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 3

2) Tabla de datos agrupados (variables cuantitativas):

Aparte de las frecuencias descritas con anterioridad, se debe calcular otros valores como: rango,

número de clase y amplitud de la misma, pudiendo seguir el siguiente orden:

a. Rango ��: corresponde a la diferencia entre el menor y el mayor valor tabulado. b. Número de intervalos o clases ���: se calcula en función del tamaño de la muestra (N), en

general son entre 4 y 20. Matemáticamente la mejor elección esta dada por �� = 1 + 3,32 ·

���� = 1 + 1,44 · ���. c. Amplitud de las clases: corresponde a la extensión general que poseen los intervalos, se calcula

mediante � = �

�� , se � no es número entero, se redondea al número entero superior.

d. Construir el esquema de la tabla, poniendo columnas de

• clases ó intervalos tabulados

• marca de clase (valor medio de cada intervalo) ��

• frecuencia absoluta (��)

• Frecuencia Acumulada (�)

• Frecuencia relativa (��)

• Frecuencia relativa Acumulada (��)

• Frecuencia relativa porcentual (��%)

• Frecuencia porcentual Acumulada (��%)

• Ejemplo:

TEMA 5: TIPOS DE GRAFICOS ESTADÍSTICOS

Los gráficos son una simplificación y un complemento de una tabla estadística. Son más sencillos, más llamativos y a menudo más inteligibles, aunque se pierde información. Deben tener un título que tenga relación a la información mostrada y alguna nota explicativa si es que fuese necesario. a. Diagramas de barras: para variables no agrupadas en intervalos.

* Construcción: Sobre un eje (normalmente el horizontal) marcamos los valores de la variable, dibujando sobre cada uno de ellos una barra cuya longitud sea proporcional a la frecuencia que se esté visualizando. . Todas las barras deben de tener la misma anchura y la distancia entre ellas debe de ser como máximo la anchura de las barras.

Tabla 2: Edades en una comunidad hippie – Santiago 2008.

Intervalos �� �� � �� �� ��% ��% 10,17 13,5 6 6 0,09 0,09 8,57 8,57

17,23 20 6 12 0,09 0,17 8,57 17,14

23,30 26,5 8 20 0,11 0,29 11,43 28,57

30,37 33,5 11 31 0,16 0,44 15,71 44,28

37,44 40,5 11 42 0,16 0,60 15,71 60,00

44,51 47,5 11 53 0,16 0,76 15,71 75,71

51,58 54,5 9 62 0,13 0,89 12,86 88,57

58,65& 61,5 8 70 0,11 1,00 11,43 100,00

Page 4: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 4

b. Histogramas: es propio de variables CT continuas agrupadas en clases. * Construcción: Sobre el eje horizontal marcamos los distintos intervalos, las barras están unas al lado de otras sin separación, a no ser que alguna clase tenga una frecuencia de 0. Cada barra empieza en el límite real inferior de la clase que representa y termina en el límite superior, que a su vez es el comienzo de la clase siguiente.

c. Polígonos de frecuencias: Representativo de las variables agrupadas en intervalos * Construcción: se obtiene uniendo los puntos medios de los techos de un hipotético histograma. La línea debe comenzar y terminar en el eje de abscisas, precisamente en el sitio que correspondería al punto medio de dos clases inexistentes, la que precedería a la primera y la que seguiría a la última.

d. Gráficos sectoriales: equivalen a un diagrama de barras y por tanto sirven para representar variables discretas. * Construcción: Dividimos el círculo en sectores circulares, de modo que la amplitud de cada sector, sea proporcional a la frecuencia. Para poder realizarlo se considera 100% → 360° lo que corresponde a una circunferencia completa.

e. Pictogramas: utilizable en todo tipo de variables, especialmente con las cualitativas. * Construcción: Es el mismo que se sigue para la construcción de los diagramas de barras y histogramas. La diferencia estriba en que, en lugar de dibujar una barra o un rectángulo, se dibuja una figura que hace referencia al problema objeto de estudio.

f. Diagramas de áreas: Representativo de las variables cuantitativas, equivale a la representación independiente de los polígonos de frecuencias (descritos en los diagramas de barras y histogramas). * Construcción: Indica la evolución de los valores de la variable, consistiendo en la visualización del área encerrada bajo el polígono de frecuencias. Para ello, se conecta dicho polígono con el eje de la variable (el horizontal en el gráfico), tanto a la izquierda del primer valor como a la derecha del último.

Page 5: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 5

TEMA 6: PARAMETROS O MEDIDAS DE TENDENCIA CENTRAL

• Moda: es el valor más frecuente. Puede ocurrir que no haya moda o que haya más de una (empates en el máximo). El símbolo es �(�.

_ Para datos no agrupados, se hace el recuento y se busca el valor más frecuente. Si hay empate, la moda es múltiple.

Para datos agrupados, se determina por

(� = )��*+ + , ��-.�*+��/.�*+ + ��-.�*+0 · �

)��*+: límite inferior de la clase modal ��/.�*+: frecuencia absoluta anterior a la clase modal ��-.�*+: frecuencia absoluta posterior a la clase modal �: Amplitud de intervalos.

• Media (promedio): es la suma de todos los valores dividida por el número de ellos.

_ Para datos no agrupados, se determina por:

1̅ = ∑ 1��

_ Para datos agrupados, se determina por:

1̅ = ∑�� · 4��

• Mediana: es el valor que ocupa el centro de la distribución una vez ordenados los datos (el valor del medio). El símbolo es �(5

_ Para datos no agrupados, que deben estar ordenados:

(5 = �2 , siNespar. (5 = � + 12 , siNesimpar

_ Para datos agrupados, se determina por:

(5 = )�(*?) + � · @�2 − ��/.(*?)��(*?) B

)�(*?): límite inferior de la clase mediana �C ��/.(*?): Frecuencia acumulada anterior a Me. ��(*?): frecuencia absoluta de la clase mediana �: Amplitud de intervalos.

TEMA 7: PARAMETROS O MEDIDAS DE POSICION • Cuartil: son los 3 valores que dividen la serie de datos en 4 partes iguales, cada una de las cuales

representa un 25% de distribución.

_ Para datos no agrupados, se determina por: �D = E · �4 �D: cuartil pedido E: número del decil pedido �: Total de datos.

_ Para datos agrupados, se determina por:

�D = )� + E · �4 − ��/.�� · � )�: límite inferior de la clase ��/.: Frecuencia acumulada anterior a la clase. ��: frecuencia absoluta de la clase �: Total de datos.

Page 6: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 6

• Quintil: son los 4 valores que dividen la serie de datos en 5 partes iguales, cada una de las cuales representa un 20% de distribución.

_ Para datos no agrupados, se determina por:

FD = E · �5 FD: quintil pedido E: número del quintil pedido �: Total de datos.

_ Para datos agrupados, se determina por:

FD = )� +E · �5 A ��/.�� · �

)�: límite inferior de la clase ��/.: Frecuencia acumulada anterior a la clase. ��: frecuencia absoluta de la clase �: Total de datos.

• Decil: son los 9 valores que dividen la serie de datos en 10 partes iguales, cada una de las cuales representa un 10% de distribución.

_ Para datos no agrupados, se determina por:

GD = E · �10 GD: decil pedido E: número del decil pedido �: Total de datos.

_ Para datos agrupados, se determina por:

GD = )� + E · �10 − ��/.�� · � )�: límite inferior de la clase ��/.: Frecuencia acumulada anterior a la clase. ��: frecuencia absoluta de la clase �: Total de datos.

• Percentil: son los 99 valores que dividen la serie de datos en 100 partes iguales, cada una de las cuales representa un 1% de distribución.

_ Para datos no agrupados, se determina por: HD = E · �100 HD: percentil pedido E: número del percentil pedido �: Total de datos.

_ Para datos agrupados, se determina por:

HD = )� + E · �100 − ��/.�� · � )�: límite inferior de la clase ��/.: Frecuencia acumulada anterior a la clase. ��: frecuencia absoluta de la clase �: Total de datos.

• Amplitud Semi-Intercuartílica : Esta medida de dispersión se basa en medidas de posición (Cuartiles). Su empleo tendrá sentido en el supuesto de imposibilidad de cálculo de la media. El no tomar en consideración a la totalidad de las observaciones, hace pensar que esta medida es poco representativa. Por ello se intenta definir las medidas de dispersión, de modo que sean el promedio de las separaciones de cada valor respecto de uno tomado como referencia (la

MEDIA). F = IJ/IKC

• Gráfico de variabilidad: Basado en los cuartiles, adopta la forma del gráfico de la derecha. En él se reflejan los cuartiles 1º y 3º y la mediana, junto a los extremos inferior y superior : L�MN = F. − 3F = F. − 3OFP − F.2 Q

LRST � FP � 3F � FP � 3OFP A F.2 Q

Se consideran observaciones atípicas aquellas que quedan fuera del intervalo UL�MN, LRSTV

Page 7: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 7

TEMA 8: PARAMETROS O MEDIDAS DE DISPERCION Los estadígrafos de dispersión nos indican si la distribución o conjunto de datos forma grupos

homogéneos o heterogéneos. Las medidas de dispersión a estudiar son: rango, desviación media,

varianza y desviación estándar.

• Rango��: como ya se vio, corresponde al valor máximo menos el valor mínimo, el rango mide "la dispersión total" del conjunto de datos. Aunque el rango es una medida de dispersión simple y que se calcula con facilidad, su debilidad preponderante es que no toma en consideración la

forma en que se distribuyen los da tos entre los valores más pequeños y los más grandes.

• Desviación Media: es la media aritmética de los valores absolutos de las desviaciones de todos los datos respecto a la media aritmética. Su símbolo es GW.

_Para datos agrupados en intervalos es:

GW:∑ |�� A 1̅| ∙ ���

Donde �� es la marca de clase y 1̅ la media aritmética.

Dos medidas de dispersión que se utilizan con frecuencia y que sí toman en consideración la forma en que se distribuyen los valores son la varianza y su raíz cuadrada, la desviación estándar. Estas medidas establecen la forma en que los valores fluctúan con respecto a la media.

• Varianza�[Có\C: se basa en las diferencias entre cada valor y la media de la distribución, es el promedio del cuadrado de las desviaciones respecto a la media de una distribución estadística.

_ Para datos agrupados, se determina por:

\C = ∑�]� A 1̅C · ��� ]�: media de clase de casa intervalo 1̅: media aritmética (promedio de datos) ��: frecuencia absoluta de cada clase �: Total de datos.

• Desviación típica �[ó\: es la raíz cuadrada de la varianza y por tanto es un número más manejable y de utilización más frecuente.

_ Para datos agrupados, se determina por:

\ = ^∑�]� A 1̅C · ���

]�: media de clase de casa intervalo 1̅: media aritmética (promedio de datos) ��: frecuencia absoluta de cada clase �: Total de datos.

Page 8: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 8

• Coeficiente de variación (4_: es un índice abstracto, que no tiene unidad de medida. Da igual que midamos la variable en cm, kg, etc., el coeficiente de variación se expresa siempre como

porcentaje. 4_ = a̅̀ · 100

TEMA 9: CRITERIO DE HOMOGENEIDAD

Una distribución se considera homogénea, si la desviación estándar se encuentra entre la quinta y la cuarta parte del rango. Si no es así, entonces se considera que la muestra es heterogénea. Observaciones:

� Cuanto más separados o dispersos estén los datos, es decir, para muestras heterogéneas, tanto mayores serán el rango, la varianza y la desviación estándar.

� Si los datos están más concentrados, es decir, para muestras homogéneas, tanto

menores serán el rango, la varianza y la desviación estándar.

� Si todas las observaciones son iguales (de manera que no haya variación en los datos), el rango, la varianza y la desviación estándar serán iguales a cero.

EJERCICIOS DE GRAFICAS Y TABLAS DE FRECUENCIA:

1) De un examen realizado a un grupo de alumnos, cuyas notas se han evaluado del 1 al 7, se ha obtenido el siguiente cuadro estadístico: Se pide: a) Acabar de rellenar la tabla estadística. b) Nº de alumnos que se han examinado. c) Nº de alumnos que han obtenido una nota superior a 3 d) % de alumnos que han sacado una nota igual a 6 e) % de alumnos que han obtenido una nota superior a 4 f) Nº de alumnos que han obtenido una nota superior a 2e

inferior a 5. 2) Los siguientes datos corresponden a las notas obtenidas por alumnos en un curso de

Estadística

90 82 77 55 62

87 65 33 70 47

54 57

100 68 57

82 66 69 70 86

93 25 77 65 25

47 70 88 70 66

40 85 63 84 40

53 36 20 52

100

88 61 42 60 32

58 34 55 54 39

100 84 33 98 57

83 85 55 51 93

64 62

100 47 98

72 80 47 58 95

85 65 55 64 95

67 23 85 65 33

60 96 68 60 70

42 30 53 45 51

65 45 82 75 60

100 76 52 75 83

a) Construya la correspondiente distribución de frecuencia. b) ¿En qué clase se concentra el mayor número de notas? c) ¿Cuál es la frecuencia absoluta del cuarto intervalo? Interprete el resultado. d) ¿Qué porcentaje de los alumnos tienen una nota inferior a 50? e) ¿Cuántos alumnos tienen una nota superior a 60?

]� �� �� �� �� 1 2 3 4 5 6 7

4 4

7 5

7

16

28 38 45

0,08 0,16 0,14 0,14

Page 9: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 9

f) Interprete la frecuencia acumulada del sexto intervalo. g) Interprete la frecuencia relativa acumulada del quinto intervalo.

3) Los siguientes datos corresponden al sueldo (en miles de pesos) de trabajadores de una

empresa

120 125 126 128 132

135 135 135 136 138

138 140 140 142 142

144 144 145 145 146

146 147 147 148 149

150 150 152 153 154

156 157 158 161 163

164 165 168 173 176

a) Construya la tabla de frecuencia con todos sus elementos. b) ¿En qué clase se encuentra el mayor número de trabajadores? c) ¿Qué porcentaje de trabajadores gana entre $ 136.000 y $ 168.000? d) ¿Cuántos trabajadores ganan a lo menos $ 160.000? e) ¿Cuántos trabajadores ganan a lo más $ 144.000?

4) Una fábrica empaqueta en lotes de 100 unidades los tornillos que produce. Se establece

un plan de inspección por muestreo consistente en examinar, de cada lote, 20 tornillos elegidos al azar y rechazar el lote si de los 20 aparecen más de 4 defectuosos; almacenar el lote como “revisable” si el número de defectuosos es menor que 5 pero mayor que 1, y aceptarlo en otro caso. Se inspeccionan 52 lotes y resulta el siguiente número de tornillos defectuosos de cada muestra:

1 2 4 3 2 0 9 2 0 2 0 0 4 3 0 2 0 1 6 5 2 0 0 1 0 3

2 0 7 1 4 3 0 2 1 0 4 3 0 7 1 0 0 3 2 0 1 0 5 2 0 1

a) Construye la tabla de frecuencias absolutas y relativas del resultado de la inspección b) Dibuja el diagrama de barras para los resultados de la inspección c) Dibuja el diagrama acumulativo de frecuencias d) Agrupa los resultados por lotes: Rechazados, revisables y aceptados y: e) Construye la tabla de frecuencias para los lotes f) Determina la proporción de lotes rechazados g) Representa la distribución de frecuencias mediante un histograma h) Dibuja el diagrama acumulativo de frecuencias i) Comenta las diferencias entre los resultados de los apartados c) y g)

5) En una industria es necesario realizar un estudio respecto al peso de engranajes de gran tamaño. Los siguientes datos corresponden al peso, en kilógramos, de 30 de estas piezas, que poseen las mismas dimensiones, pero distinta aleación.

59 35 42

52 45 38

50 55 40

52 42 46

40 42 45

50 52 45

38 50 55

52 45 42

50 42 45

45 38 40

a) ¿Cuántos engranajes pesan entre 46 y 55Kg? b) ¿Qué porcentaje representa a aquellos engranajes cuyo peso es inferior a 51 Kg? c) ¿Cuál es la frecuencia relativa para aquel intervalo cuya marca de clase es 49? d) ¿Qué porcentaje representa a aquellas piezas que pesan más de 43Kg?

Page 10: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 10

6) En una industria automotriz es necesario realizar un estudio debido a una partida

defectuosa de discos de embrague. Para ello se ha recopilado la siguiente información referente a la duración en horas de 50 de ellos.

287 293 304 308 321

300 289 329 307 324

288 292 295 304 323

302 289 307 291 316

313 308 297 288 292

314 326 302 297 289

289 303 294 316 299

292 287 301 322 294

321 293 287 317 328

327 322 313 308 296

a) ¿Cuántos discos duraron entre 293 y 299 horas? b) ¿Cuántos discos no alcanzaron a durar 300 horas? c) ¿Qué porcentaje representan los discos que duraron entre 311 y 317 horas? d) ¿Qué porcentaje representan los discos que duraron menos de 305 horas? e) ¿Cuántos discos duraron más de 311 horas? f) ¿Cuántos discos duraron menos de 305 horas? g) ¿Qué porcentaje representan los discos que duraron entre 287 y 299 horas? h) ¿Cuál es el intervalo de mayor frecuencia absoluta?

7) En un conjunto habitacional se pretende hacer un estudio del número de personas que

consumen productos enlatados. Los datos que han sido obtenidos de 50 bloques del conjunto habitacional son:

63 64 128 124 137

69 132 90 103 134

83 115 75 133 129

85 120 137 138 96

93 127 131 133 99

73 130 73 110 72

81 105 62 61 104

94 114 100 91 97

104 123 109 87 84

125 121 117 136 98

a) ¿Cuántas personas consumen entre 94 y 127 productos enlatados? b) ¿Qué porcentaje representa a las personas que consumen menos de 105 productos

enlatados? c) ¿Qué cantidad de personas consumen más de 83 productos enlatados?

8) Las ganancias por acción de 40 compañías de la industria de la construcción son:

4.6 1.3 6.0 9.2 4.2

0.3 2.1 0.8 3.7 2.1

1.1 2.1 1.9 5.1 0.9

5.7 1.4 2.1 1.9 5.1

0.1 7.3 3.2 4.9 3.7

1.3 5.4 0.2 2.3 1.1

2.5 3.5 7.1 1.8 0.5

1.6 1.9 2.8 0.4 1.9

a) ¿Cuál es la frecuencia absoluta del tercer intervalo? Interprete el resultado. b) ¿Qué porcentaje de las compañías tienen a lo más una ganancia de 6.6? c) ¿Cuántas compañías tienen una ganancia a lo menos de 4,0? d) Interprete la frecuencia acumulada del segundo intervalo. e) Interprete la frecuencia relativa acu mulada del cuarto intervalo.

Page 11: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 11

9) Según la Asociación de lucha contra la Bulimia y la Anorexia, las pautas culturales han

determinado que la delgadez sea sinónimo de éxito social. Muchos jóvenes luchan para conseguir el “físico ideal” motivados por modelos, artistas o por la publicidad comercial. Durante el mes de marzo del año 2006, en el colegio “Alcántara” de la ciudad de Talca, después de las vacaciones de verano, se observó con precaución a 27 alumnos con síntomas de anorexia, registrándose los siguientes signos visibles:

Dieta Severa Miedo a Engordar Hiperactividad

Uso de Ropa Holgada Dieta Severa Uso de Laxantes Miedo a Engordar Dieta Severa Uso de Ropa Holgada

Dieta Severa Uso de Ropa Holgada Dieta Severa Dieta Severa Dieta Severa Uso de Ropa Holgada Hiperactividad Uso de Laxantes Miedo a Engordar

Uso de Laxantes Dieta Severa Uso de Ropa Holgada

Uso de Laxantes Hiperactividad Uso de Laxantes Uso de Ropa Holgada Hiperactividad Dieta Severa

a) Resuma la información anterior en una tabla de distribución de frecuencias. b) Construya un gráfico adecuado para resumir la información anterior.

10) Dada la información referente a la ubicación de personas dentro de cuatro departamentos de una empresa, se pide:

M P A M

A CC P A

P M A CC

CC A M A

A M M A

CC CC A M

M P M P

P P A M

P M P M

M P M P

a) Tabular la información. b) Realizar gráfico circular. c) Indique frecuencias relativas porcentuales en cada grupo.

11) Los siguientes datos corresponden a la duración, en horas, de válvulas que fueron

sometidas a un cierto control. a) Complete la tabla dada. b) Grafique el polígono de frecuencia c) ¿Qué porcentaje de las válvulas duraron, en promedio 674,5 horas? d) ¿Qué porcentaje de las válvulas duraron entre 650 y 749 horas? e) ¿Cuántas válvulas duraron menos de 550 horas? f) ¿Qué porcentaje de las válvulas duraron más de 649 horas?

Tiempo �� �� �� �� �� ��% ��% 450-499 500-549 550-599 600-649 650-699 700-749 750-799

4 5

12 10 15 3 1

Page 12: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 12

12) Se realizó un número determinado de compras de materia prima. El volumen de la

materia prima viene dado en WP.Parte de la información se registra en la siguiente tabla

a) Complete la tabla dada. b) En un sólo gráfico, dibuje un histograma y un polígono de frecuencia. c) ¿Cuántas compras se realizaron entre 11 y 30? d) ¿Cuántas compras se realizaron entre 16 y 25? e) ¿Qué porcentaje de compras se realizaron entre 16 y 20? f) ¿Cuántas compras se realizaron en total?

13) Se realizaron dos experimentos referentes al peso, en Kg.,

aplicado sobre una cierta cantidad de tableros. a) Grafique el histograma del experimento A. b) Grafique un gráfico de torta del experimento B. c) Realice, en un mismo gráfico, los histogramas con sus

polígonos de frecuencia

MEDIDAS DE TENDENCIA CENTRAL

1) Un experto en estándares de trabajo observa el tiempo que se requiere para preparar una muestra de 10 cartas de negocios en una oficina y obtiene los siguientes resultados: 42, 5, 5, 9, 7, 5, 12, 13, 12 y 10 minutos. Se pide:

a) Determinar la media, la mediana y la moda de esos 10 tiempos b) ¿Cuál de las tres medidas de posición central calculadas te parece más representativa

en este caso? c) ¿Dirías que esas 10 observaciones son valores dispersos? ¿por qué?

2) El tratamiento de los niños con desórdenes de la conducta puede ser complejo. El tratamiento se puede proveer en una variedad de escenarios dependiendo de la severidad de los comportamientos. Además del reto que ofrece el tratamiento, se encuentran la falta de cooperación del niño/niña y el miedo y la falta de confianza de los adultos. Para poder diseñar un plan integral de tratamiento, el siquiatra de niños y adolescentes puede utilizar la información del niño, la familia, los profesores y de otros especialistas médicos para entender las causas del desorden. Para ello, un siquiatra local ha considerado una muestra aleatoria de 20 niños, anotando el tiempo necesario que requiere en cada niño para lograr un plan integral del tratamiento, obteniéndose lo siguiente (en horas):

6 7 7 8 8 8 8 9 9 9

Volumen �� �� �� �� �� ��% ��% 6-10 11-15 16-20 21-25 26-30

1

6

27

9 18 27

Peso (Kg) A B

15-19 20-24 25-29 30-34 35-39 40-44

7 3 2 11 10 7

3 6 8 8 12 3

Total 40 40

Page 13: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 13

9 9 9 9 10 10 10 10 10 11

a) Calcule las medidas de tendencia central y de dispersión de estos datos, indicando a qué tipo de medida pertenece.

b) Dibuje un diagrama de caja. Comente el resultado acerca de la distribución. c) Dibuje un diagrama de tallo y hoja. Comente el resultado acerca de la distribución.

3) Supongamos que desde hace 5 años una empresa gasta cada Navidad la cantidad total de

100.000 ptas. en regalar presentes a sus clientes. Si los precios de ese presente han sido durante los 5 años: 400; 500; 750; 800 y 1.000 ptas respectivamente, calcular el coste promedio por cliente para el periodo de 5 años.

4) El precio del pan sufrió los siguientes incrementos: del 7% de 1990 a 1991, del 6% de

1991 a 1992, del 4% de 1992 a 1993, del 3% de 1993 a 1994 y de 1994 a 1995. ¿Cuál es el incremento medio anual de 1990 a 1995?

5) Si invertimos 100.000 pesetas durante 10 años a los siguientes intereses: 3%, 5%, 6%,

9%, 8%, 5%, 5%, 4%, 3%, 3%. Calcular: a) El capital medio durante esos 10 años b) El interés medio durante esos 10 años

6) De un total de datos, 20 son 4, 40 son 5, 30 son 6 y el resto 7. Hallar la media y la

moda.

7) Cuatro grupos de estudiantes, consistentes en 15, 20, 10 y 18 individuos, dieron pesos de 60, 52, 55 y 65 kilos. Hallar el peso medio de los estudiantes.

8) Las notas de un estudiante en sus certámenes han sido84, 91, 72, 68, 87 y 78. Hallar la media, la mediana y la moda.

9) La siguiente tabla corresponde a la estatura de estudiantes de una determinada carrera. Hallar la media, mediana y moda de la estatura.

MEDIDAS DE POSICION

1) El tiempo de espera de 322 pacientes, para ser atendidos en cierto ambulatorio médico, es el que se muestra en la siguiente tabla: a) Calcula los cuartiles y los deciles 2 y 7 b) Si consideramos a los pacientes que esperan media hora

o más, ¿Qué porcentaje representan del total? c) ¿Cuántos pacientes esperan entre 7 y 23 minutos?, d) ¿Qué porcentaje representan del total?

Estatura �� 1.65-1.69 1.70-1.74 1.75-1.79 1.80-1.84 1.85-1.89 1.90-1.94

6 12 30 22 8 2

total 80

Tiempo de espera

(en minutos)

Número de

pacientes

[0, 5) 3

[5, 10) 35 [10, 15) 98 [15, 20) 63 [20, 25) 55 [25, 30) 44 [30, 35) 12

Page 14: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 14

2) Calcular la amplitud semi-intercuartílica de la distribución de las edades de 400 niños, representadas en el siguiente

gráfico

3) En una empresa trabajan 20000 productores, cuyos salarios, según categorías, son:

salarios (miles de ptas)

Nº de productores

10-20 12000

20-40 6000

40-50 1000

50-100 800

100-200 200

a) ¿Qué parte de la nómina recibe el 60% de los productores peor pagados? b) ¿Qué parte de la nómina recibe el 5% de los productores mejor pagados?

MEDIDAS DE DISPERCION

1) La distribución de las estaturas en centímetros de los alumnos de un centro, expresados en porcentajes, es la siguiente:

a) Siendo abiertos los intervalos primero y el último, ¿qué valores sería razonable considerar para los límites extremos de esos intervalos?

b) Si suponemos que en el Centro hay 1200 alumnos, ¿cuáles serían las frecuencias absolutas?

c) Calcular la estatura media y la desviación típica. d) ¿Entre qué estaturas se encuentra la quinta parte de

las estaturas centrales?

2) De un total de 100 datos, 20 son 4, 40 son 5, 30 son 6 y el resto 7. Hallar la desviación estándar.

3) Cuatro grupos de estudiantes, consistentes en 15, 20, 10 y 18 individuos, dieron pesos de 60, 52, 55 y 65 kilos. Hallar la varianza de los estudiantes.

EJERCICIOS COMPLETOS

1) En una industria dos operarios en siete días de trabajo, son capaces de producir, por día, y en forma individual la siguiente cantidad de árbol es para fresa de 250 mm de longitud por 300 mm de diámetro.

[35, 40) 6 [40, 45) 5 [45, 50] 1

Estaturas Porcentajes

[145 a 150 [ 0'3

[150 a 155[ 1'6

[155 a 160[ 9'4

[160 a 165[ 20'5

[165 a 170[ 31'5

[170 a 175[ 22'5

[175 a 180[ 10'7

[180 a 185 ] 3'5

Page 15: Materia Estadistica

Instituto Profesional La Araucana

Técnico en Prevención de Riesgos

pág. 15

Operario A 106 105 104 102 103 100 101

Operario B 103 102 107 101 105 102 103

Determine

a) Producción media de cada operario. b) Moda del operario A. c) Mediana del operario B. d) Rango del operario A y del operario B e) Varianza del operario A. f) Desviación estándar de ambos operarios. g) ¿Son las muestras homogéneas?

2) Partiendo de la siguiente distribución de frecuencias acumuladas, a) Determinar la media, mediana y moda de la siguiente distribución

de edades. Analice la relación entre ellas. b) Calcular Cuartiles c) Determinar Medidas de dispersión, Analice la relación entre ellas.

3) La oficina de Censo, proporcionó las edades de hombres y mujeres divorciados (en miles de personas de años de edad o más).-

a) Obtener las medidas de tendencia central

b) Medidas de dispersión.

4) En la tabla siguiente nos muestra el resultado de una encuesta entre alumnos de primer curso analizando el número de suspensiones anuales. Realizar un estudio estadístico completo.

Edad N

[10,12) 4 [12,14) 11 [14,16) 24 [16,18) 34 [18,20] 40

Edad hombre mujer

15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54

2 80 174 210 385 450 295 174

2 210 303 315 656 656 409 200

total 1770 2751

0 2 2 4 0 3 3 2 5 2 3 2 4 3 4

3 1 4 1 1 0 4 1 1 4 2 4 2 0 3

1 3 0 5 2 2 3 0 3 0 5 1 1 4 0

3 2 3 2 3 3 1 2 4 2 3 1 3 1 4