ASIGNATURA: ESTADISTICA APLICADA Curso Acad´emico ...

of 48/48
ASIGNATURA: ESTADISTICA APLICADA Titulaci´on:Ingenier´ ıa T´ ecnica Agr´ ıcola Curso Acad´ emico: 2006/2007 Profesora: Mar´ ıa del Carmen Bueso S´ anchez Programa de la asignatura Relaciones de problemas Formulario Ex´ amenes
  • date post

    22-Oct-2021
  • Category

    Documents

  • view

    2
  • download

    0

Embed Size (px)

Transcript of ASIGNATURA: ESTADISTICA APLICADA Curso Acad´emico ...

Curso Academico: 2006/2007 Profesora: Mara del Carmen Bueso Sanchez
• Programa de la asignatura
Generalidades.
Tema 2. Estadstica Descriptiva Bidimensional.
Concepto de variable estadstica bidimensional.
Distribuciones marginales y condicionadas.
Dependencia e independencia estadstica.
Planteamiento del problema de regresion. Criterio de mnimos cuadrados.
Regresion lineal mnimo-cuadratica.
Otros tipos de ajustes.
Tema 4. Fundamentos de la Probabilidad.
Concepto de probabilidad. Definicion axiomatica.
Probabilidad condicionada. Independencia de sucesos.
Teorema de la Probabilidad Total. Teorema de Bayes.
Tema 5. Variable Aleatoria.
Concepto de variable aleatoria.
Funcion de distribucion. Propiedades.
Tipos de variables aleatorias: variable aleatoria discreta y variable aleatoria continua.
Caractersticas de una variable aleatoria.
Variables aleatorias bidimensionales.
Distribucion uniforme discreta.
Distribucion de Poisson.
Distribucion uniforme.
Distribucion exponencial.
Distribucion normal.
Distribuciones asociadas a la distribucion normal: Distribucion χ2 de Pearson, distribucion t de Student y distribucion F de Snedecor.
BLOQUE III: INFERENCIA ESTADISTICA.
Introduccion a la Inferencia Estadstica.
Muestra aleatoria simple. Distribucion de la muestra.
Concepto de estadstico. Estudio de la media y la varianza muestrales.
Muestreo en poblaciones normales.
Estimacion puntual.
Tema 10. Contraste de Hipotesis.
Planteamiento general de un problema de contraste de hipotesis. Conceptos basicos.
Relacion entre contrastes de hipotesis y regiones de confianza.
Contrastes de hipotesis sobre los parametros de las distribuciones mas usuales.
PROGRAMA DE PRACTICAS DE ORDENADOR
Practica 1: Introduccion al programa Statistix. Manejo de ficheros de datos.
Practica 2: Estadsitica descriptiva. Tablas de frecuencias, representaciones graficas, medidas de centralizacion y dispersion.
Practica 3: Ajuste por mnimos cuadrados. Regresion lineal y no lineal.
Practica 4: Exploracion de datos con Statistix.
Practica 5: La distribucion Normal. Calculo de probabilidades.
Practica 6: Simulacin de variables aleatorias.
Practica 7: Muestreo. Estimacion puntual y por intervalos de confianza.
Practica 8: Contrastes de hipotesis parametricas.
Las practicas se realizaran en el aula de informatica asignada por la direccion de la Escuela.
BIBLIOGRAFIA
DeGroot, M. (1988). Probabilidad y Estadstica. Ed. Addison Wesley, 1988.
Guillamon, A., Franco, M., Navarro, J. (1998). Probabilidad y Estadstica. Problemas. Diego Marn.
Guillamon, A., Navarro, J. (1998). Probabilidad y Estadstica. Fundamentos. Diego Marn.
Martin-Pliego, Montero, J.M., Ruiz-Maya, L. (1998). Problemas de Probabilidad. Editorial AC, Madrid.
Martin-Pliego, Montero, J.M., Ruiz-Maya, L. (2005). Problemas de Inferencia Estadstica. Thomson-Paraninfo.
Martin-Pliego, Ruiz-Maya, L. (1998). Fundamentos de Probabilidad. Editorial AC, Madrid.
Martin-Pliego, Ruiz-Maya, L. (2005). Fundamentos de Inferencia Estadstica. Editorial AC, Madrid.
Montgomery, D.C., Runger, G.C. (1996). Probabilidad y Estadstica Aplicadas a la Ingeniera. McGraw-Hill, Mexico.
Pena Sanchez-Rivera, D. (1992). Estadstica. Modelos y Metodos I. Fundamentos. Alianza Editorial, Madrid.
CRITERIOS DE EVALUACION
En cada convocatoria, se realizara un examen final que constara de dos partes. La primera consistira en la resolucion de problemas y cuestiones teorico-practicas, con una puntuacion maxima de 8.5 puntos. En la segunda se resolveran problemas mediante el uso del ordenador, con una puntuacion maxima de 1.5 puntos.
Al principio del cuatrimestre se propondra, con caracter voluntario, la presentacion de los problemas propuestos en cada leccion, la resolucion de los problemas propuestos en practicas de ordenador, la realizacion de un trabajo teorico-practico sobre algun tema relacionado con la asignatura (este trabajo podra realizarse individualmente o en grupos pequenos y sera presentado y expuesto a final del curso), as como la realizacion de pruebas escritas despues de finalizar cada bloque tematico. En el caso en que el alumno opte por realizar estas actividades, la calificacion final de la asignatura se obtendra utilizando el siguiente criterio:
Presentacion de los problemas propuestos en cada leccion: 5 % de la calificacion final.
Resolucion de los problemas propuestos en practicas de ordenador: 5 % de la calificacion final.
Realizacion de un trabajo teorico-practico: 2 % de la calificacion final.
Nota media obtenida en las pruebas escritas: 18% de la calificacion final.
Examen final: 70% de la calificacion final.
En otro caso, la calificacion final de la asignatura correspondera con la puntuacion obtenida en el examen final.
La puntuacion mnima para superar la asignatura sera de 5 puntos sobre un maximo de 10.
HORARIO DE TUTORIAS
Da Hora Lugar
Martes 10:00-12:00 Despacho B015, Dpto. de Matematica Aplicada y Estadstica Planta Baja, Antiguo Hospital de Marina, Campus Muralla del Mar
Miercoles 10:00-12:00 Despacho B015, Dpto. de Matematica Aplicada y Estadstica Planta Baja, Antiguo Hospital de Marina, Campus Muralla del Mar
Jueves 10:00-11:00 Despacho de usos multiples, Dpto. de Matematica Aplicada y Estadstica 13:00-14:00 Planta Segunda, Edificio de Minas, Campus Alfonso XIII
Telefono: 968 33 89 06
Correo electronico: [email protected]
Relacion de problemas 1. Estadstica Descriptiva Unidimensional.
1. Los trabajadores de una empresa se clasifican atendiendo al cargo que desempenan de la siguiente forma:
Categora profesional Operarios Ayudantes Tecnicos Directivos Numero de trabajadores 745 127 45 15
Representar estos datos mediante un diagrama de rectangulos y un diagrama de sectores.
2. Las calificaciones obtenidas en un examen por 32 alunmos fueron las siguientes:
1 3 6 5 1 4 2 4 7 5 8 6 2 1 4 7 9 5 2 3 5 7 8 6 8 10 8 2 6 1 6 2
a) Agrupar los datos en una tabla estadstica representando las frecuencias absolutas y relativas.
b) Representar graficamente la distribucion de frecuencias mediante un diagrama de barras, polgono de frecuencias y curva acumulativa o de distribucion.
3. La suma de las notas de los ejercicios de practicas realizadas por 50 alumnos fueron las siguientes:
11 18 48 45 28 35 31 70 2 82 29 92 59 42 8 1 15 32 12 47 43 69 43 33 15 11 46 31 22 71 52 60 57 32 62 41 10 51 59 81 20 43 40 36 44 3 65 40 17 80
a) Construir una tabla estadstica agrupando los datos en intervalos de amplitud 10.
b) Representar graficamente la distribucion mediante un histograma, polgono de frecuencias y curva acumulativa o de distribucion.
4. Se ha medido la viscosidad de 20 fluidos y los resultados obtenidos se recogen en la siguiente tabla:
Viscosidad Numero de fluidos 0-2 7 2-4 8 4-7 5
Calcular:
c) La viscosidad mas frecuente. Representar el histograma de frecuencias.
d) ¿Que tanto por ciento de fluidos tienen una viscosidad superior a 5?
5. El salario medio anual pagado a todos los empleados de una compania fue de 5000$. Esta compania tiene 500 empleados de los cuales 400 son hombres. Si el salario medio anual pagado a los hombres fue de 5200$, ¿cual fue el salario medio de las mujeres?
6. En una determinada zona del interior terrestre y de interes geologico se han medido las temperaturas maximas por da durante 43 das, obteniendose los siguientes datos:
Temperatura (oC) ni
70-75 3 75-80 7 80-85 10 85-90 12 90-95 8 95-100 3
Calcular:
b) La temperatura media.
c) La temperatura tal que la mitad de los das tiene una temperatura superior a ella.
d) La temperatura maxima del 30 % de las temperaturas mas bajas.
e) La temperatura mnima del 40 % de las temperaturas mas elevadas.
f ) El intervalo donde se encuentra el 50 % de las temperaturas centrales.
g) El numero de das en que la temperatura es inferiror a 92oC.
h) El numero de das en que la temperatura es superior a 82oC.
i) El numero de das en que la temperatura oscila enttre 82oC y 92oC.
j) El numero de das en que la temperatura oscila enttre 79oC y 87oC.
k) La varianza, desviacion tpica y coeficiente de variacion.
Relacion de problemas 2. Estadstica Descriptiva Bidimensional.
1. En una cierta region se ha realizado una serie de sondeos a distintas profundidades y se ha estudiado el peso de los sedimentos de un determinado tipo extrados en ellos. La informacion obtenida se recoge en la siguiente tabla:
X/Y 0-20 20-50 50-100 100-130 2 5 4 1 0 3 2 6 5 2 4 0 2 10 8 5 0 0 10 15
donde X representa la profundidad del sondeo en metros e Y el peso del sedimento en gramos.
a) ¿Cual es el peso mas habitual de los sedimentos extrados? ¿Y el de los extrados solo a 2 metros?
b) ¿Cual es la profundidad media de los sondeos realizados? ¿Y la profundidad media de los sondeos en los que el peso de los sedimentos encontrados oscila entre 20 y 100 gramos?
c) ¿Cual es el porcentaje de sedimentos que extrados a mas de 3 metros pesan mas de 85 gramos? ¿Cual es la profundidad mnima a la que han sido extrados el 20 % de los sedimentos mas alejados de la superficie supuesto que su peso ha oscilado entre 50 y 100 gramos?
d) Determinar el grado de dispersion de la distribucion de las profundidades a las que han sido extrados los sedimentos cuyo peso oscila entre 20 y 50 gramos.
e) ¿Cual es la profundidad maxima del 50 % de los sondeos menos profundos?
2. En una encuesta realizada a 100 familias se han obtenido los siguientes datos sobre sus ingresos por nomina (X) y gastos de consumo del ultimo mes (Y ), ambos en euros:
X / Y (360-600] (600,900] (900,1200] (600,750] 11 4 0 (750,1000] 8 16 5 (1000,1200] 10 22 24
a) En las familias cuyos ingresos no superen los 750 euros, calcular la cantidad que se gasta con mayor frecuencia en bienes de consumo.
b) Una entidad bancaria pretende que el 40% central de las nominas sean domiciliadas en su oficina. Hallar la nomina mnima y maxima que pretenderan ser captadas.
c) La directiva de una empresa ubicada en la zona va a desarrollar una campana de promocion entre las familias que mas consumen, y se decide que sea dirigida a las que superen un consumo superior a 1000 euros. Calcular el % de familias que seran el objetivo de la campana.
3. Los siguientes datos muestran el tiempo de servicio y los gastos anuales de mantenimiento de un cierto tipo de maquinaria.
Maquina Anos de servicio Costo anual de reparacion A 1 25000 B 3 18750 C 4 31250 D 2 25000 E 5 37500 F 8 50000 G 9 50000 H 10 62500 I 13 100000 J 15 100000
Representar el diagrama de dispersion. ¿Existe relacion lineal entre los anos de servicio y el coste anual de reparacion? Justificar la respuesta.
4. Un analista informa, basandose en datos observados, que, a medida que crece la inversion extranjera, es menor el valor del ndice de la Bolsa. Si se consideran los siguientes datos:
Inversion extranjera Indice de Bolsa (miles de millones de dolares)
3000 110 3500 115 3700 117 3600 113 3400 120 3800 122 3900 121 3700 118
Determinar la validez del informe del analista.
5. Se ha observado el contenido en carbono (X) y el ndice de permeabilidad (Y ) de una serie de mezclas, obteniendose la siguiente informacion:
Y /X 3.0-4.0 4.0-4.5 4.5-5.5 14 0 2 1 18 2 5 4 22 3 3 3 26 2 1 4
donde los valores de Y representan las marcas de las clases (todas de igual amplitud).
a) Representar el histograma y la curva acumulativa de la variable X.
b) Obtener las medias y varianzas marginales. ¿Que distribucion marginal es mas homogenea con respecto a su media? Razonar la respuesta.
c) Calcular el ndice de permeabilidad medio para aquellas mezclas con un contenido en carbono superior a 4.
d) ¿Que porcentaje de mezclas tienen un contenido en carbono superior a 3.25?
e) ¿Cual es el contenido mnimo de carbono que contienen el 40 % de las mezclas con mayor concentracion en carbono?
Relacion de problemas 3. Regresion y Correlacion.
1. En la estimacion de un modelo de regresion lineal, se obtuvieron los siguientes datos:
x = 5, y = 8, Sxy = 15, σ2 y = 20, r2 = 0.9.
a) Calcular la varianza de X.
b) Obtener las rectas de regresion.
2. Supongamos una distribucion bidimensional con rectas de regresion
x + 4y = 1 y x + 5y = 2.
Calcular el coeficiente de correlacion lineal.
3. Se ha estimado la siguiente recta de regresion de Y /X: y = 5 + 3x.
a) Obtener la recta de X/Y sabiendo que r = 1. ¿ Y si r = 0.9 y x = 1?
b) ¿Sera posible que en este modelo el coeficiente de correlacion fuera negativo?
4. La siguiente tabla informa sobre los ndices (en %) de los compuestos A y B que presentan 6 muestras de aguas subterraneas recogidas en diferentes puntos. Se supone que el ndice que una muestra puede presentar de compuesto B depende del ndice de compuesto A, sin embargo, no se conoce una funcion que explique aceptablemente este tipo de dependencia.
X 5.5-6.5 6.5-7.5 7.5-8.5 8.5-11.5 11.5-18.5 18.5-23.5 Y 0.15-0.45 0.45-0.55 0.55-0.65 0.65-0.95 0.95-1.05 1.05-1.75
X: ndice de compuesto A, Y : ndice de compuesto B.
a) Explicar el comportamiento de la variable Y a partir de la variable X mediante una funcion:
1) Lineal.
2) Hiperbolica.
3) Exponencial.
4) Potencial.
b) ¿Que ajuste es mas adecuado?
5. Se cree que el numero de apagones en una ciudad depende exponencialmente del numero de tormentas electricas que se producen. Para estudiar este fenomeno, se recogen durante 6 meses los siguientes datos:
X (numero de tormentas) 3 7 10 6 5 2 Y (numero de apagones) 1 4 8 5 3 4
a) Ajustar una funcion del tipo y = abx.
b) Estudiar la bondad del ajuste.
6. En una determinada region se sabe que las precipitaciones cadas dependen de la cantidad de vegetacion en la zona. Se tienen los siguientes datos:
X Y 50 20 100 70 150 100 200 150 300 200
X: numero de arboles por Ha., Y : numero de l/m2 cados.
a) Ajustar a los datos una funcion del tipo y = axb.
b) Calcular la bondad del ajuste realizado. Compararlo con el ajuste lineal.
Relacion de problemas 4. Probabilidad.
1. Un sistema contiene dos componentes A y B, y se conecta de manera que este funciona si cualquiera de las dos componentes funciona. Se sabe que la probabilidad de que A funcione e 0.9, la de B es 0.8 y la de que ambos funcionen es 0.72. Determinar la probabilidad de que el sistema funcione.
2. A los habitantes de una gran ciudad se les hizo una encuesta con el proposito de determinar el numero de lectores de ABC y El Pas. Los resultados de la encuesta fueron los siguientes: el 20 % de los habitantes lee ABC, el 16% lee El Pas y un 1% leen ambos periodicos. Si se selecciona al azar a un lector de ABC, ¿cual es la probabilidad de que tambien lea El Pas?
3. Demostrar que se verifica la igualdad
P (A/B) + P (A/B) = 1
para sucesos A y B cualesquiera, con P (B) 6= 0.
4. Sean A y B sucesos del espacio muestral tales que P (A) 6= 0 y P (B) 6= 0. Si A y B son incompatibles, demostrar que no pueden ser independientes.
5. El 5 % de las unidades producidas en una fabrica se encuentran defectuosas cuando el proceso de fabricacion se encuentra fuera de control. Si el proceso se encuentra fuera de control, se produce un 30% de unidades defectuosas. La probabilidad marginal de que el proceso se encuentre bajo control es de 0.92. Si se selecciona aleatoriamente una unidad y se encuentra que es defectuosa, ¿cual es la probabilidad de que el proceso se encuentre fuera de control?
6. Se lanza una moneda con una probabilidad de 2/3 de que el resultado sea cara. Si aparece cara, se extrae una pelota aleatoriamente de una urna que contiene dos pelotas rojas y tres verdes. Si el resultado es cruz, se extrae una pelota de otra urna, que contiene dos pelotas rojas y dos pelotas verdes. ¿Cual es la probabilidad de extraer una pelota roja?
7. Una planta armadora recibe microcircuitos procedentes de tres distintos fabricantes B1, B2 y B3. El 50 % del total se compra a B1, mientras que a B2 y B3 se les compra un 25 % a cada uno. El porcentaje de circuitos defectuosos para B1, B2 y B3 es 5 %, 10 % y 12 %, respectivamente. Los circuitos se almacenan en la planta sin importar quien fue el proveedor.
a) Determinar la probabilidad de que una unidad armada en la planta contenga un circuito defectuoso.
b) Si un circuito no esta defectuoso, ¿cual es la probabilidad de que haya sido vendido por el proveedor B2?
8. En un proceso de tratamiento de cierto mineral se utilizan tres tecnicas T1, T2 y T3. Las probabilidades de cometer algun fallo en su aplicacion son 0.6, 0.3 y 0.1, respectivamente. Determinar la probabilidad de que el proceso no se realice de forma correcta.
9. Las probabilidades de que ciertas muestras de interes A y B no pierdan su ndice de humedad durante el periodo de observacion son respectivamente 3/5 y 2/3. Calcular la probabilidad de que:
a) Ambas muestras no pierdan el ndice de humedad.
b) Solo una de las muestras pierda su ndice de humedad.
c) Al menos una muestra conserve su ndice de humedad.
10. Los sucesos A y B verifican que P (A) = 1/2, P (B) = 1/3 y P (A ∩B) = 1/4.
a) Calcular P (A/B), P (B/A), P (A ∪B), P (A/B) y P (B/A).
b) Calcular las probabilidades anteriores considerando que P (A ∩B) = 1/6.
11. El 50 % de un grupo de muestras de rocas de interes presentan en su composicion la sustancia A, el 20 % la sustancia B y el 10% las sustancias A y B. Se selecciona una muestra al azar. Calcular la probabilidad de que:
a) La muestra presente la sustancia A si presenta la sustancia B.
b) La muestra presente la sustancia B si presenta la sustancia A.
c) La muestra presente las sustancias A o C si presenta la sustancia B.
Se sabe que el 25 % de las muestras presentan en su composicion la sustancia C, incompatible con A y el 3 % de las muestras, las sustancia B y C.
d) La muestra tenga un ndice medio de dureza o permeabilidad, si esta presenta la sustancia B en su composicion.
Se sabe que de entre las muestras que tienen la sustancia B, el 15 % presentan un ndice medio de dureza, el 20% un ndice medio de permeabilidad y el 10% un ndice medio de dureza y permeabilidad.
12. En una determinada zona, el 20 % de los das llueve, en el 40 % de los das la temperatura oscila alrededor de los 20 grados y en el 35 % de lo das en que llueve, la temperatura es aproximadamente de 20 grados centgrados. Calcular la probabilidad de que en un da seleccionado al azar:
a) Llueva o la temperatura oscile alrededor de los 20 grados.
b) Llueva y la temperatura oscile alrededor de los 20 grados.
c) Se presente solo una de las dos caractersticas senaladas.
13. En un proceso de control de calidad aplicado a tecnicas de refinamientos de hidrocarburos, las muestras escogidas aleatoriamente deben someterse a 5 pruebas selectivas. La probabilidad de que las muestras que provienen de una cierta planta industrial superen la primera prueba es de 1/6. La probabilidad de superar la i-esima prueba, habiendo pasado las anteriores, es de 1/(7 − i), para i = 2, 3, 4 y 5. Determinar la probabilidad de que la planta industrial pase positivamente el control de calidad.
14. Los tipos A y B de sedimentos se encuentran, respectivamente, en el 50 % y en el 20% de los suelos de una cierta region. Si el tipo A aparece en el 75% de los suelos en los que hay sedimentos de tipo B, calcular la probabilidad de no encontrar ninguno de esos dos tipos de sedimentos en un suelo de dicha region elegido al azar. ¿Es independiente la aparicion de sedimentos del tipo A con la de los del tipo B?
15. Basandose en varios estudios, un grupo de investigadores han clasificado las formaciones geologicas en tres tipos I, II y III, de acuerdo con la posibilidad de encontrar petroleo. Se sabe por experiencia que el petroleo se encuentra en un 40 % de las formaciones del tipo I, en un 20% de las del tipo II y en un 30% de las del tipo III. El grupo pretende perforar un pozo en una determinada zona donde el 35 % de su extension corresponde a formaciones del tipo I, el 40 % a las del tipo II y el 25 % a las del tipo III. Calcular la probabilidad de:
a) No encontrar petroleo.
b) Que se haya perforado en una formacion del tipo II, supuesto que se ha encontrado petroelo.
c) Que se descubra petroleo si se realiza la perforacion donde no existen formaciones del tipo II.
16. Se realizan una serie de sondeos a tres profundidades distintas P1, P2 y P3. Con la profundidad P1 se realizan 300 sondeos, con la profundidad P2 se realizan 600 sondeos y 100 con la profundidad P3. La probabilidad de que a la profundidad P1 se encuentren sedimentos del tipo A es de 0.2 y de 0.15 a la profundidad P2. Se desconoce cual es esta probabilidad a la profundidad P3. Se han establecido dos hipotesis sobre la probabilidad de que tomando un sedimento y siendo este del tipo A se hubiese extrado a una profundidad P3. Estas probabilidades son 0.5 y 0.3, respectivamente.
a) Determinar la hipotesis correcta.
b) Calcular la probabilidad de que elegido al azar uno de los sedimentos extrados en los sondeos, este no sea del tipo A.
Relacion de problemas 5. Variable aleatoria. Distribuciones de probabilidad.
1. Dada una variable con la siguiente distribucion de probabilidad:
i P [X = i] 1 1c 2 2c 3 3c 4 4c
a) Determinar el valor de c.
b) Obtener la funcion de distribucion y representarla graficamente.
c) Calcular la esperanza y la varianza de esta variable.
2. Dada la siguiente distribucion, correspondiente a una variable aleatoria discreta,
xi P [X = xi] 10 0.1 20 a 30 0.3 40 0.1
a) Obtener el valor de a.
b) Obtener la funcion de distribucion y representarla graficamente.
c) Calcular la esperanza y la varianza de esta variable.
3. Se sabe que en una determinada zona fluvial la probabilidad de encontrar sedimentos con la composicion A es 0.35. Obtener las siguientes probabilidades:
a) Encontrar 8 sedimentos con la composicion A en 10 examenes.
b) Encontrar como maximo 5 y como mnimo 2 sedimentos con la composicion A en 9 examenes.
c) Econtrar como mnimo 3 sedimentos con la composicion A en 7 examenes.
Si en otra zona la probabilidad de encontrar estos sedimentos es de 0.75, determinar la probabilidad de:
a) Encontrar en 6 examenes 4 sedimentos con la composicion A.
b) Encontrar en 7 examenes menos de 5 sedimentos con la composicion A.
4. Un club nacional de automovilistas comienza una campana telefonica con el proposito de aumentar el numero de miembros de su club. Por experiencias anteriores se sabe que una de cada 20 personas que reciben la llamada se unen al club. Si en un da 11 personas reciben la llamada telefonica,
a) ¿Cual es la probabilidad de que por lo menos dos de ellas se inscriban al club?
b) ¿Cual es el numero esperado de personas que se uniran al club?
c) ¿Cual es la probabilidad de que mas de tres se inscriban?
d) ¿Cual es la probabilidad de que exactamente dos se inscriban?
5. La probabilidad de que un nino de cierta familia herede una determinada enfermedad es 1/5. Si se sabe que al menos un nino de una familia que tiene 6 ha heredado la enfermedad, ¿cual es la probabilidad de que la hereden al menos tres ninos?
6. Una campana de seguros descubre que alrededor del 5 % de la poblacion tiene un cierto tipo de accidente cada ano. Si se seleccionan 8 asegurados al azar en la poblacion,
a) ¿Cual es la probabilidad de que no mas de 2 de ellos tengan un accidente de este tipo el proximo ano?
b) ¿Cual es la probabilidad de que no haya accidentes?
c) ¿Cual es la probabilidad de que haya mas de tres accidentes?
7. Estudiando la desintegracion de una sustancia radioactiva, se ha comprobado que el numero de partculas α que llegan a un contador es por termino medio de 10 partculas cada segundo. Calcular la probabilidad de que en un experimento con esta sustancia se obtengan en un segundo:
a) 4 partculas.
b) Menos de 4 partculas.
c) Mas de 3 partculas.
Obtener la desviacion tpica del numero de partculas α desintegradas por segundo.
8. La probabilidad de que un satelite, despues de colocarlo en orbita, funcione de manera adecuada es de 0.9. Supongase que cinco de estos se colocan en orbita.
a) ¿Cual es la probabilidad de que, por lo menos, el 80 % funcione adecuadamente?
b) ¿Cual es la probabilidad de que ninguno funcione?
c) Responder a las preguntas anteriores si el numero de satelites que se ponen en orbita es n = 10.
d) Responder a las preguntas anteriores si el numero de satelites que se ponen en orbita es n = 20.
9. Se sabe que, por termino medio, el numero de llamadas telefonicas a una centralita es de tres cada cinco minutos. Si se supone que el nuemro de llamadas es una variable aleatoria que sigue una distribucion de Poisson, calcular la probabilidad de que:
a) Se efectuen seis llamadas en cinco minutos.
b) Tres en diez minutos.
c) Dos en un minuto.
10. Un promedio de 4 personas acuden a una oficina de informacion de un supermercado cada hora. Obtener la probabilidad de que:
a) Exactamente 2 personas acudan durante una hora seleccionada al azar.
b) Menos de 3 acudan durante una hora seleccionada al azar.
c) Exactamente 4 personas acudan durante una hora seleccionada al azar.
11. Un cajero automatico es utilizado por un promedio de 6 personas cada hora. Calcular la probabilidad de que:
a) Exactamente 6 personas utilicen el cajero durante una hora seleccionada al azar.
b) Menos de 5 personas utilicen el cajero durante una hora elegida al azar.
c) Nadie utilice el cajero durante un intervalo de 10 minutos.
d) Nadie utilice el cajero durante un intervalo de 5 minutos.
12. Supongase que en un cruce transitado ocurren un promedio de dos accidentes por semana. Determinar la probabilidad de que:
a) Ocurra un accidente en una semana.
b) Ocurran tres accidentes en una semana.
13. Se sabe que el 1 % de los artculos fabricados por cierta empresa son defectuosos. Si se selecciona una muestra de 30 artculos, obtener la probabilidad de que dos o mas sean defectuosos.
14. Un grupo de investigadores sabe que la probabilidad de que los individuos afectados por un cierto virus fallezcan es de 0.035. Determinar, para una poblacion de 100 enfermos,
a) El numero esperado de fallecidos.
b) La probabilidad de que fallezcan mas de tres.
15. Una maquina automatica dedicada a la fabricacion de comprimidos produce defectuosos a razon del 1%. Si los comprimidos se colocan en tubos de 25 comprimidos, ¿cual es la probabilidad de que en un tubo todos los comprimidos sean buenos?
16. Se X una variable aleatoria con distribucion N (µ, σ2 = 4).
a) Obtener el valor de µ para que se cumpla que P [X > 3] = 0.8.
b) Obtenido el valor de µ, calcular el percentil 75.
17. Sea X una variable aleatoria normal con media 50 y varianza 100. Obtener el valor x0 tal que P [X < xo] = 0.95.
18. El salario anual (en miles de euros) de un grupo de trabajadores sigue una distribucion normal de media 15 y desviacion tpica 3.
a) Determinar la probabilidad de que el salario anual de un individuo elegido al azar sea superior a 18,000 euros.
b) ¿Cual es el salario mnimo que cobra el 45 % de los trabajadores mejor pagados?
19. Un grupo de cientficos interesados en la investigacion de restos antiguos estudian las dimensiones de una serie de craneos encontrados en cierta region. El ndice de longitud-anchura de los craneos se sabe que se distribuye segun una ley normal de media 76.2 y desviacion tpica 3. Los craneos son clasificados segun dicho ndice en dodicacefalos, cuando el nidice es menor que 75, mesocefalos, si esta comprendido entre 75 y 80, y branquicefalos si es superior a 80.
a) Calcular las probabilidades de que un craneo elegido al azar sea dodicacefalo, mesocefalo o bran- quicefalo.
b) Calcular la probabilidad de que, elegido aleatoriamente un craneo, su ndice difiera de la media en dos unidades como maximo.
c) ¿Cual es el valor mnimo del ndice longitud-anchura del 25 % de los craneos con mayor ndice?
20. Si se supone que la profundidad de la superficie oceanica (sin considerar el zocalo continental), se aproxima a una distribucion normal de media 4,000 metros y desviacion tpica 1,000 metros,
a) Calcular el porcentaje de extension oceanica que ocupan las areas cuya profundidad es como mnimo 3,500 metros.
b) Si la profundidad del talud continental puede oscilar entre 200 y 3,000 metros, calcular la probabilidad de que elegida aleatoriamente un area oceanica, esta pertenezca al talud.
c) Si los abismos oceanicos suponen el 1.7 % de la extension oceanica con mas profundidad, determinar la profundidad mnima de una zona para que sea considerada abismo.
d) Calcular la probabilidad de que la profundidad de un area oceanica arbitraria difiera de la media por lo menos en 1,500 metros, y por lo tanto pertenezca al fondo marino.
21. La media de las temperaturas obtenidas en una region durante un ano es de 250C y la desviacion tpica de 100C. Si las temperaturas obedecen a una ley normal, calcular:
a) La probabilidad de que en un da elegido aleatoriamente la temperatura oscile entre 20 y 320C.
b) La probabilidad de que en un da elegido aleatoriamente la temperatura difiera de la media en mas de 50C.
22. En una determinada zona fluvial se ha estudiado la composicion de cobre soluble de un conjunto de sedi- mentos elegidos aleatoriamente. Se ha obtenido que el logaritmo de la cantidad de cobre soluble, expresada en p.p.m., del 10 % de los sedimentos elegidos es inferior a -0.134 y el del 20 % superior a 0.502. Supuesto que el logaritmo de la cantidad de cobre soluble que forma parte de los sedimentos de dicha zona se ajusta a una ley normal:
a) Determinar los parametros de la distribucion.
b) Elegido al azar un sedimento, determinar con probabilidad 0.95 el valor maximo que puede diferir el logaritmo de la cantidad de cobre soluble, que forma parte de su composicion, de la media.
23. El peso medio de un grupo de personas es de 76.5 Kg. y el 95.05 % de la poblacion tiene un peso inferior a 80 Kg. Sabiendo que el peso sigue una distribucion normal, calcular:
a) La desviacion tpica de la distribucion.
b) El porcentaje de personas que tienen un peso inferior a 70 Kg.
c) El peso mnimo del 30 % de las personas con mayor peso.
d) El porcentaje de personas cuyo peso difiere del peso medio en 10 Kg. como mnimo.
e) El peso que verifica que entre este y 78 Kg. se encuentra el 15 % de la poblacion.
24. Un dado se lanza 720 veces. Sea X el numero de veces que sale el 6.
a) Determinar la distribucion de probabilidad de X.
b) Obtener la media y la varianza de la distribucion.
c) Calcular las siguientes probabilidades: P [X = 0], P [X = 130], P [X = 720], P [100 ≤ X ≤ 125] y P [X > 150].
25. Si el numero de piezas defectuosas en un proceso de fabricacion se distribuye segun una distribucion de Poisson y el numero medio de defectuosas es de 16, determinar:
a) La distribucion que sigue aproximadamente la variable aleatoria.
b) La media y la varianza de la distribucion.
c) La probabilidad de que el numero de piezas defectuosas sea 8.
d) La probabilidad de que el numero de piezas defectuosas oscile entre 24 y 28.
e) El numero de piezas defectuosas que como maximo se puede encontrar con probabilidad 0.9772.
f ) El numero de piezas defectuosas que como mninmo se puede encontrar con probabilidad 0.1588.
26. Un grupo de investigacion pretende introducir una nueva tecnica para el tratamiento de hidrocarburos. Estos afirman que utilizando los medios optimos, el 70 % de las aplicaciones dan resultados satisfactorios.
a) Si se realizan 10 experiencias, calcular:
1) El numero medio de estas que resultan positivas.
2) La probabilidad de que solo entre 4 y 6 experiencias sean positivas.
b) Si por la no utilizancion de determinados dispostivos, el porcentaje de resultados positivos disminuye al 8% y se realizan 50 experiencias, calcular:
1) La probabilidad de que el numero de resultados positivos sea como mnimo 5.
2) El numero maximo de experiencias positivas que pueden producirse con probabilidad 0.9489.
c) Si por introduccion de ciertas mejoras el porcentaje dado en el apartado anterior se eleva al 20 % y se realizan 100 pruebas, calcular:
1) La probabilidad de que como maximo sean 31 las experiencias satisfactorias.
2) El numero mnimo de resultados positivos que se pueden obtener con probabilidad 0.75.
27. En una determinada zona, se sabe que el 25 % de los das se registran movimientos ssmicos de intensidad baja y que el porcentaje de das en los que se producen movimientos ssmicos de intensidad media es del 10%. Calcular:
a) El numero medio de das durante una semana en que se producen movimientos ssmicos de poca intensidad.
b) La probabilidad de que en una semana el numero de das en que se producen movimientos ssmicos de intensidad baja sea superior a 2 y como maximo 4.
c) El numero maximo de das en un mes en que se registraran sesmos de intensidad media con probabilidad de al menos 0.98.
d) La probabilidad de que en un trimestre se presenten como mnimo 4 das con movimientos ssmicos de intensidad media.
Relacion de problemas 6. Distribuciones muestrales.
1. Se supone que la altura de los alumnos de una determinada universidad se distribuye normalmente con media 174 cm. y desviacion tpica 8 cm. Si se va a extraer una muestra de tamano 25,
a) Calcular el valor esperado y la desviacion tpica de la distribucion en el muestreo de la media de la muestra.
b) ¿En que porcentaje de muestras cabra esperar una altura media comprendida entre 172 y 175?
c) ¿En que porcentaje de muestras habra una altura media menor que 170?
2. La longitud de determinada poblacion de fosiles es una variable aleatoria que sigue una distribucion normal con media 185.6 mm. y desviacion tpica 12.7 mm. ¿Cual es la probabilidad de que una muestra aleatoria simple de tamano 20 de esa poblacion tenga media mayor que 190 mm.?
3. Se sabe que la concentracion de calcio de determinado mineral sigue una distribucion normal de desviacion tpica 2.
a) Calcular la probabilidad de que la media muestral de una muestra aleatoria simple de tamano 10 y la media poblacional difieran en mas de 0.5 unidades.
b) ¿De que tamano mnimo habra que seleccionar la muestra para poder afirmar, con probabilidad 0.9, que la media muestral diferira de la poblacional en menos de 0.1?
4. Sea X una variable aleatoria con ditribucion normal N (µ, σ2 = 16). Se selecciona una muestra aleatoria de tamano n. Obtener el valor de n tal que P (X > µ + 1) = 0.1.
5. La longitud en cm. de las piezas fabricadas por una maquina se distribuye segun una normal de media 10 y desviacion tpica 0.5. Para muestras de tamano 25, calcular:
a) P (9.68 < X < 10.1).
b) P (S2 < 0.45).
6. Se considera una muestra aleatoria de 100 empleados de una gran compana americana. La desviacion tpica de los salarios es de 1,500$.
a) ¿Cual es la probabilidad de que la media de la muestra no difiera en mas de 200$ de la verdadera media salarial?
b) ¿Que probabilidad hay de obtener una muestra de media mayor que 8,500$ si el promedio verdadero de la compana fuera de 8,200$?
7. Se toman muestras de tamano 11 de una poblacion N (100, 400). ¿A partir de que valor de la cuasivarianza muestral estan situados el 5 % de los valores mas altos de dicho estadstico?
8. Se va a seleccionar una muestra aleatoria de tamano n de una distribucion normal con media µ y desviacion tpica σ = 2. Determinar el mnimo valor de n tal que P (|X − µ| < 0.1) > 0.9.
9. Obtener la probabilidad que en 120 lanzamientos de una moneda la frecuencia muestral del suceso {salir cara}: a) Este comprendida entre 0.4 y 0.6.
b) Sea superior a 5/8.
10. Dos maquinas producen tornillos cuyas longitudes en mm. siguen distribuciones N (150, 10) y N (100, 5). Se toman muestras de tamano 10.
a) ¿Cual es la distribucion de la diferencia media de longitudes?
b) Calcular la probabilidad de que la longitud media de la muestra de la primera maquina no sea superior en mas de 45 mm. a la longitud media de la muestra de la segunda maquina.
c) Calcular la probabilidad de que la longitud media de la muestra de la primera maquina supere en 53 mm. a la longitud media de la muestra de la segunda maquina.
11. Las bombillas electricas de un fabricante A tienen una duracion media de 1,400 horas con una desviacion tpica de 200, mientras que las de otro fabricante B tienen una duracion media de 1,200 horas con una desviacion tpica de 100 horas. Si se toman muestras al azar de 125 bombillas de cada fabricante.
a) ¿Cual es la probabilidad de que las bombillas de A tengan una duracion media que sea al menos 160 horas superior a la duracion promedio de las de B?
b) ¿Cual es la probabilidad de que las bombillas de A tengan una duracion media que sea mayor que 250 horas la duracion promedio de las de B?
Relacion de problemas 7. Estimacion puntual. Intervalos de confianza.
1. En una encuesta de tamano 16 de una poblacion normal con varianza 100 se ha obtenido una media muestral de 12.
a) Obtener un intervalo de confianza al 90 % para la media poblacional.
b) Calcular el tamano muestral necesario para obtener un error de 5 en un intervalo de confianza al 95% para la media.
2. Se ha seleccionado una muestra aleatoria simple de una variable que sigue una distribucion normal, obte- niendose los siguientes datos:
5.46 5.1 1.9 2.12 3.25 5.35 7.46 6.63 0.44 5.93
a) Calcular una estimacion puntual de la media.
b) Construir un intervalo de confianza al nivel de confianza del 90 % para la media.
c) ¿Que nivel de confianza reduce la amplitud del intervalo a la mitad?
3. La longitud de determinados fosiles sigue una distribucion con desviacion tpica 0.075. Si en una muestra aleatoria simple de tamano 12 de dicha poblacion se obtuvo una media muestral x = 1.75, determinar un intervalo de confianza para µ a un nivel de confianza del 95 %. ¿Que tamano muestral sera necesario para que el intervalo de confianza del mismo nivel tuviese longitud menor que 0.01?
4. De un cierta poblacion se ha extrado una muestra de 64 individuos, cuyo valor medio ha resultado ser x = 1, 012. Se sabe por otras experiencias del mismo tipo, que la desviacion tpica vale 25. Obtener intervalos de confianza para el valor medio de la poblacion a los niveles de confianza de 0.90, 0.95 y 0.99.
5. Una encuesta de 100 votantes para conocer sus opiniones respecto a dos candidatos muestra que 55 apoyan a A y 45 a B. Se pide:
a) Calcular un intervalo de confianza para la proporcion de votos de cada candidato.
b) ¿Cual sera el tamano muestral necesario para que una fraccion 0.55 de partidarios de A permita asegurar que sera elegido al 99 %?
6. Una urna contiene una proporcion desconocida de bolas rojas y blancas. En una muestra al azar de 60 bolas extradas con remplazamiento de la urna se obtuvieron 42 bolas rojas. Hallar lmites de confianza al 95 % y 99 % para la proporcion real de bolas rojas en la urna.
7. Se selecciono una muestra de 300 tornillos fabricados en una cierta industria, para conocer la proporcion de tornillos con una longitud superior a 6 mm. De los 300 tornillos seleccionados solo 100 tenan un diametro superior a 6 mm. Construir a un nivel de confianza del 95% un intervalo confianza para la verdadera proporcion en la poblacion.
8. Se realizan por los laboratorios A y B determinaciones de nicotina en 4 unidades de tabaco, con los siguientes resultados:
Laboratorio A 16 14 13 17 Laboratorio B 18 21 18 19
Suponiendo que las dos poblaciones examinadas son normales independientes y con igual varianza, construir un intervalo de confianza al 95% para la diferencia del contenido medio en nicotina del tabaco.
9. Una muestra de tamano 10 de una N (µ1, 225) tiene como media x = 170.2 y una muestra de tamano 12 de una N (µ2, 256) tiene como media y = 176.7. Calcular un intervalo de confianza para µ1 − µ2 al nivel de confianza del 95 %.
10. Una compana contrata 10 tubos de filamentos del tipo A y 10 con filamentos del tipo B. Las duraciones de vida observadas han sido las siguientes:
Tipo A 1614 1094 1293 1643 1466 1270 1340 1380 1028 1497 Tipo B 1383 1138 1092 1143 1017 1061 1627 1021 1711 1065
Suponiendo que las duraciones de vida se comportan como variables normales independientes y con varianzas iguales, encontrar un intervalo de confianza para la diferencia de medias.
11. Se espera que dos operarios produzcan, en promedio, el mismo numero de unidades de un determinado producto, en el mismo tiempo. La siguiente tabla refleja los resultados obtenidos en cinco semanas:
Operario A 48 44 62 58 50 Operario B 56 66 66 60 55
Si se supone que el numero de unidades terminadas semanalmente por ambos operarios son variables normales independientes y con varianzas iguales, se pide:
a) Calcular un intervalo de confianza para la diferencia de medias al nivel de confianza del 90 %.
b) ¿Existen diferencias significativas entre la produccion media de los dos operarios?
Relacion de problemas 8. Contrastes de hipotesis.
1. Se considera una poblacion descrita por una variable N (µ, σ2 = 25), y el contraste H0 : µ = 12 frente a H1 : µ = 15. Con una muestra aleatoria simple de tamano 25 se determina una region crtica x > 14. Determinar la probabilidad de cometer un error tipo I, la probabilidad de cometer un error tipo II y la potencia del contraste.
2. Se espera que la dureza de cierto mineral que se extrae de un yacimiento se distribuya normalmente con media 220. Se toma una muestra de 9 elementos, obteniendose los siguientes valores:
203 229 215 220 223 233 208 228 209
Al nivel de significacion 0.05, contrastar la hipotesis de que la muestra proviene de una poblacion con media 220.
3. Un laboratorio farmaceutico sostiene que uno de sus productos tiene una efectividad del 90 % para reducir una alergia en ocho horas. En una muestra de 200 personas con esa alergia, el medicamento dio buen resultado en 160. Determinar si la afirmacion del laboratorio es legtima.
4. Se supone que los resultados de una cierta medicion fsica se distribuyen segun una ley normal. Dos personas realizan dicha medicion a una muestra de 9 elementos, con los siguientes resultados:
Primera persona 132 139 126 114 122 132 142 119 126 Segunda persona 124 141 118 116 114 132 145 123 121
Contrastar al nivel de significacion 0.01 si la media de las mediciones realizadas por la primera persona supera en al menos una unidad a la media de las realizadas por la segunda.
5. Con el fin de probar un fertilizante, se tomaron 24 parcelas de la misma area, de las que la mitad se trataron con dicho fertilizante y las otras no; por lo demas, las condiciones fueron identicas para todas ellas. La produccion media de trigo en las parcelas sin tratar fue de 4.8 bushels (bu.) con desviacion tpica de 0.40 bu., y en las tratadas fue de 5.1 bu. con desviacion tpica de 0.36 bu.¿Podemos concluir que se produjo mejora a causa del fertilizante al nivel de significacion del 0.01? ¿Y al nivel de significacion del 0.05?
6. En una empresa de fundicion se recibe periodicamente mineral de hierro procedente de dos yacimientos distintos A y B. Para estudiar la calidad del mineral recibido se extraen dos muestras y se analiza la riqueza en hierro, obteniendo los siguientes resultados en tanto por ciento:
A 43 45 42 35 37 38 33 38 41 43 B 39 36 35 37 40 39 40 38 35 39 38 34
Suponiendo normal la distribucion de la riqueza del mineral en ambos yacimientos, ¿se puede admitir que la diferencia, en lo que a calidad del mineral se refiere, es significativa al 0.05?
7. Dos sistemas de cultivo, aplicados a una serie de parcelas identicas, han producido los siguientes rendimien- tos, en toneladas:
Grupo I 50 85 7 0 0.6 -5 0 3 6 90 Grupo II 24 0 66 -3 43 13 425 30
Supuesto que los rendimientos obtenidos por uno u otro procedimiento siguen distribuciones normales con varianzas distintas, ¿puede inferirse que el segundo sistema es mas eficaz que el primero?
8. Para comparar dos programas OCR de digitalizacion de letra impresa, se sometio cada uno a 50 pruebas. El primero cometio 4 fallos y el segundo 6. ¿Puede afirmarse que el primero es significativamente mas fiable que el segundo.
9. Se desea averiguar si existe una diferencia significativa en la velocidad de una impresora al utilizar ficheros PLC o ficheros Post-Script. Para ello se imprimieron treinta documentos, primero con lenguaje PLC y luego con lenguaje Post-Script, obteniendose los siguientes tiempos en segundos:
Documento 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 PCL 2.4 12 3.5 4 2.5 9 6.7 3 3.5 7 6.6 9 69 55 60 Post-Script 3.2 25 3.5 4.2 2.5 9.2 6.6 3.1 3.8 8 6.6 10 70 56 60
Documento 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 PCL 6.5 9 2.5 5 5.7 7 6 6.4 5 8.1 5 5.5 34 120 2 Post-Script 7.5 9.1 2.5 4.8 6 7 6.2 6.4 5.2 9 5 6 40 200 2
¿Se aprecia un tiempo mayor de impresion con Post-Script?
FORMULARIO
Distribuciones discretas de probabilidad Funcion de probabilidad Esperanza Varianza
Distribucion de Bernoulli P [X = x] = px(1− p)1−x p p(1− p) X −→ B(p) x = 0, 1
Distribucion binomial P [X = x] = (
n x
Distribucion de Poisson P [X = x] = e−λ λx
x! λ λ X −→ P(λ) x = 0, 1, 2, . . .
Distribuciones continuas de probabilidad Funcion de densidad Esperanza Varianza
Distribucion uniforme f(x) = {
(b−a)2
0 en otro caso β β2
X −→ exp(β)
2π e−
, ∀x ∈ R µ σ2
X −→ N (µ, σ2)
Estadsticos muestrales mas usuales
Sea X1, X2, . . . , Xn una m.a.s. de una v.a. X, se define la media muestral X y la cuasivarianza muestral S2
como
i=1
(Xi −X)2
Distribuciones muestrales
Distribuciones muestrales asociadas a una poblacion normal. Sea X1, X2, . . . , Xn una m.a.s. de una v.a. X → N (µ, σ2), entonces
X − µ
Distribuciones muestrales asociadas a dos poblaciones normales independientes. Sea X1, X2, . . . , Xn1
una m.a.s. de una v.a. X → N (µ1, σ 2 1) y sea Y1, Y2, . . . , Yn2 una m.a.s. de una v.a. Y → N (µ2, σ
2 2). X e Y vv.
aa. independientes. Sea X y S2 1 la media y la cuasivarianza muestral de X, e Y y S2
2 la media y la cuasivarianza muestral de Y , respectivamente.
Si σ2 1 y σ2
2 conocidas, entonces
n1 + σ2
2 n2
(X − Y )− (µ1 − µ2)
2
1 n1
+ S2 2
−→ tk k = inf{n1 − 1, n2 − 1} (distribucion aproximada)
Distribuciones muestrales aproximadas asociadas a una poblacion con media y varianza finitas para muestras de tamano suficientemente grande (n > 30). Sea X1, X2, . . . , Xn una m.a.s. de una v.a. X con media µ y varianza σ2 finitas, entonces
X − µ
n −→ N (0, 1)
Caso particular: Sea X1, X2, . . . , Xn (n > 30) una m.a.s. de una v.a. X con distribucion de Bernoulli B(p), entonces
P − p√ p(1− p)/n
Distribuciones muestrales aproximadas asociadas a dos poblaciones independientes con medias y vari- anzas finitas para muestras de tamano suficientemente grande (n1 > 30 y n2 > 30). Sea X1, X2, . . . , Xn1
una m.a.s. de una v.a. X con media µ1 y varianza σ2 1 finitas y sea Y1, Y2, . . . , Yn2 una m.a.s. de una v.a. Y con
media µ2 y varianza σ2 2 finitas. X e Y vv. aa. independientes. Sea X y S2
1 la media y la cuasivarianza muestral de X, e Y y S2
2 la media y la cuasivarianza muestral de Y , respectivamente.
Si σ2 1 y σ2
2 conocidas, entonces
n1 + σ2
2 n2
2 desconocidas, entonces
1 n1
+ S2 2
−→ N (0, 1)
Caso particular: Sea X1, X2, . . . , Xn1 una m.a.s. de una v.a. X con distribucion de Bernoulli B(p1) y sea Y1, Y2, . . . , Yn2 una m.a.s. de una v.a. Y con distribucion de Bernoulli B(p2)(n1, n2 > 30). X e Y vv. aa.
independientes. Sean P1 = 1 n1
n1∑
n2∑
−→ N (0, 1)
Intervalos de confianza (1− α, nivel de confianza)
Intervalos de confianza para la media µ de una poblacion normal N (µ, σ2)
Si σ2 conocida, entonces
s√ n
)
Intervalos de confianza para la varianza σ2 de una poblacion normal N (µ, σ2)
Si µ conocida, entonces
)
Intervalos de confianza para la diferencia de medias µ1−µ2 de dos poblaciones normales independientes
Si σ2 1 y σ2
2 conocidas, entonces x− y − z1−α
2
√ σ2
1
n1 +
2
√ σ2
1
n1 +
( x− y − tn1+n2−2,1−α
2 sp
√ 1 n1
+ 1 n2
√ 1 n1
+ 1 n2
2 desconocidas y distintas, entonces x− y − tk,1−α
2
2
Intervalos de confianza para el cociente de varianzas σ2 1/σ2
2 de dos poblaciones normales independientes
Si µ1 y µ2 conocidas, entonces

s2 1
s2 2
2
2
)
Intervalo de confianza para la diferencia de medias µD = µ1 − µ2 de dos poblaciones normales no independientes (datos apareados)
( d− tn−1,1−α
sD√ n
donde di = xi − yi
Intervalo de confianza para la media µ de una poblacion con media y varianza finitas para muestras de tamano suficientemente grande (n > 30)
Si σ2 conocida, entonces ( x− z1−α
2
)
Caso particular: Intervalo de confianza para la proporcion p de una caracterstica
( p− z1−α
)
Intervalos de confianza para la diferencia de medias µ1 − µ2 de dos poblaciones independientes con medias y varianzas finitas para muestras de tamano suficientemente grande (n1 > 30 y n2 > 30)
Si σ2 1 y σ2
2 conocidas, entonces
2
√ σ2
1
n1 +
2 desconocidas, entonces
2
Caso particular: Intervalo de confianza aproximado para la diferencia de proporciones p1 − p2 para muestras de tamano suficientemente grande e independientes (n1 > 30 y n2 > 30)
p1 − p2 − z1−α
√ p1(1− p1)
Contrastes sobre los parametros de una poblacion normal
Hipotesis nula Hipotesis alternativa Estadstico de contraste Region crtica H1 : µ 6= µ0 |zexp| ≥ z1−α
2
H0 : µ = µ0 H1 : µ > µ0 zexp = x−µ0 σ/ √
n zexp ≥ z1−α
H1 : µ 6= µ0 |texp| ≥ tn−1,1−α 2
H0 : µ = µ0 H1 : µ > µ0 texp = x−µ0 s/ √
n texp ≥ tn−1,1−α
σ2 desconocida H1 : µ < µ0 texp ≤ tn−1,α
H1 : σ2 6= σ2 0

0 χ2 exp =
exp ≤ χ2 n,α

2
0 χ2 exp = (n−1)s2
σ2 0
exp ≤ χ2 n−1,α
Hipotesis nula Estadstico de contraste Hipotesis alternativa Region crtica H1 : µ1 − µ2 6= δ0 |zexp| ≥ z1−α
2
H0 : µ1 − µ2 = δ0 zexp = x−y−δ0√ σ2 1/n1+σ2
2/n2 H1 : µ1 − µ2 > δ0 zexp ≥ z1−α
σ2 1 y σ2
2 conocidas H1 : µ1 − µ2 < δ0 zexp ≤ zα
H1 : µ1 − µ2 6= δ0 |texp| ≥ tn1+n2−2,1−α 2
H0 : µ1 − µ2 = δ0 texp = x−y−δ0
sp
σ2 1 y σ2
2 desconocidas e iguales H1 : µ1 − µ2 < δ0 texp ≤ tn1+n2−2,α
H1 : µ1 − µ2 6= δ0 |texp| ≥ tk,1−α 2
H0 : µ1 − µ2 = δ0 texp = x−y−δ0√ s2 1/n1+s2
2/n2 H1 : µ1 − µ2 > δ0 texp ≥ tk,1−α
σ2 1 y σ2
2 desconocidas y distintas H1 : µ1 − µ2 < δ0 texp ≤ tk,α
H1 : σ2 1 6= σ2
2
2 fexp ≤ Fn1,n2,α
2
2
µ1 y µ2 desconocidas H1 : σ2 1 < σ2
2 fexp ≤ Fn1−1,n2−1,α
Contraste sobre la diferencia de medias µD = µ1 − µ2 de dos poblaciones normales no necesariamente independientes (datos apareados)
Hipotesis nula Hipotesis alternativa Estadstico de contraste Region crtica H1 : µD 6= δ0 |texp| ≥ tn−1,1−α
2
H0 : µD = δ0 H1 : µD > δ0 texp = d−δ0 sD/
√ n
Contrastes sobre la media de una poblacion cualquiera (n > 30)
Hipotesis nula Hipotesis alternativa Estadstico de contraste Region crtica H1 : µ 6= µ0 |zexp| ≥ z1−α
2
H0 : µ = µ0 H1 : µ > µ0 zexp = x−µ0 σ/ √
n zexp ≥ z1−α
H1 : µ 6= µ0 |zexp| ≥ z1−α 2
H0 : µ = µ0 H1 : µ > µ0 zexp = x−µ0 s/ √
n zexp ≥ z1−α
Caso particular: Contrastes sobre una proporcion p (n > 30)
Hipotesis nula Hipotesis alternativa Estadstico de contraste Region crtica H1 : p 6= p0 |zexp| ≥ z1−α
2
H0 : p = p0 H1 : p > p0 zexp = p−p0√ p0(1−p0)/n
zexp ≥ z1−α
H1 : p < p0 zexp ≤ zα
Contrastes sobre la diferencia de medias de dos poblaciones independientes (n1, n2 > 30)
Hipotesis nula Estadstico de contraste Hipotesis alternativa Region crtica H1 : µ1 − µ2 6= δ0 |zexp| ≥ z1−α
2
H0 : µ1 − µ2 = δ0 zexp = x−y−δ0√ σ2 1/n1+σ2
2/n2 H1 : µ1 − µ2 > δ0 zexp ≥ z1−α
σ2 1 y σ2
H1 : µ1 − µ2 6= δ0 |zexp| ≥ z1−α 2
H0 : µ1 − µ2 = δ0 zexp = x−y−δ0√ s2 1/n1+s2
2/n2 H1 : µ1 − µ2 > δ0 zexp ≥ z1−α
σ2 1 y σ2
2 desconocidas H1 : µ1 − µ2 < δ0 zexp ≤ zα
Caso particular: Contrastes sobre la diferencia de proporciones p1 − p2 (n1, n2 > 30)
Hipotesis nula Hipotesis alternativa Estadstico de contraste Region crtica H1 : p1 − p2 6= δ0 |zexp| ≥ z1−α
2
H0 : p1 − p2 = δ0 H1 : p1 − p2 > δ0 zexp = p1−p2−δ0√ p1(1−p1)/n1+p2(1−p2)/n2)
zexp ≥ z1−α
Para δ0 = 0 se utiliza como estadstico de contraste
P1 − P2√ P (1− P ) · (1/n1 + 1/n2)
donde P = n1P1 + n2P2
1. Responder razonadamente a las siguientes cuestiones:
a) ¿Que indica la mediana de una variable estadstica? ¿Puede superar el valor de la mediana al valor del tercer cuartil?
b) ¿Puede tener una variable estadstica mas de una moda?
c) ¿Pueden tener las pendientes de las rectas de regresion de una variable estadstica bidimensional signos opuestos?
d) ¿Cual es la probabilidad de la interseccion de dos sucesos incompatibles?
2. En la siguiente tabla estan representados los datos relativos a la produccion anual de naranjas en una determinada region durante 50 anos:
Produccion de naranjas Numero de anos (millones de toneladas)
4-5 8 5-6 12 6-8 25 8-10 5
a) Representar graficamente la variable mediante un histograma.
b) Calcular la produccion que se obtuvo con mayor frecuencia durante ese periodo de tiempo.
c) ¿En cuantos anos la produccion supero a los 6.5 millones de toneladas?
d) ¿Que cantidad de naranjas se obtuvo el 30 % de los anos mas productivos?
3. Una compana de productos qumicos desea estudiar los efectos que el tiempo de extraccion tiene en la eficiencia de una operacion de extraccion, obteniendo los siguientes resultados:
Eficiencia de extraccion Tiempo de extraccion (%) (minutos) 27 57 45 64 41 80 19 46 35 62 39 72 19 52 49 77 15 57 31 68
a) Calcular la eficiencia media de extraccion y el tiempo medio de extraccion. ¿En que distribucion es mas representativa la media?
b) Predecir mediante un ajuste lineal la eficiencia de extraccion para una operacion de extraccion de 75 minutos. ¿Es fiable la prediccion realizada?
4. En una determinada explotacion agraria dedicada al cultivo de cierta fruta tropical se utilizan tres metodos diferentes de riego por goteo: M1, M2 y M3. En el 20 % de la explotacion se utiliza el metodo M1, en el 30% el metodo M2 y en el resto el metodo M3. Se sabe que la probabilidad de que el metodo M1 funcione adecuadamente es 0.85, la probabilidad de que el metodo utilizado se M2 y que no funcione adecuadamente es 0.2 y la probabilidad de que el metodo M3 no funcione adecuadamente es 0.05.
a) Calcular la probabilidad de que cada metodo de goteo funcione adecuadamente.
b) Calcular la probabilidad de que el sistema de goteo funcione adecuadamente.
c) Si se sabe que el sistema de goteo no ha funcionado adecuadamente, ¿cual es la probabilidad de que el fallo en el goteo se haya producido por el metodo M2? ¿Y la de que se haya producido por el metodo M3?
5. Un investigador estudia las plantas de una determinada zona de un ro donde se sospecha que existen niveles de contaminacion elevados. Se considera que una planta esta contaminada si el nivel de sales supera el nivel 3.1. Se sabe que el nivel de sales se comporta segun una distribucion normal de media 4 y varianza 9.
a) Calcular la probabilidad de que una planta elegida al azar este contaminada.
b) Obtener el nivel de salinidad mnimo del 75 % de las plantas con mayor nivel de sales.
c) Si el investigador selecciona al azar una muestra formada por 8 plantas, ’cual es la probabilidad de encontrar al menos dos plantas contaminadas?
6. Dos laboratorios A y B analizan muestras de agua para estudiar el contenido de un determinado contami- nante. Los resultados obtenidos son los siguientes:
Laboratorio A 22.38 15.85 25.21 22.25 21.97 19.40 Laboratorio B 19.40 21.22 16.09 16.45
Suponiendo que las dos poblaciones examinadas son normales con varianzas 9 y 4, respectivamente, construir intervalos de confianza para la diferencia entre los contenidos medios de contaminante a los niveles de confianza del 90 % y 95%. Comparar las amplitudes de los intervalos obtenidos. ¿Que factores influyen en la amplitud de un intervalo de confianza?
Examen de septiembre de 2001.
1. La cantidad de fanegas de trigo recolectadas en 86 explotaciones agrcolas durante un determinado periodo de tiempo esta recogida en la siguiente tabla:
Fanegas de trigo Numero de explotaciones 0-100 22
100-150 18 150-250 34 250-300 12
a) Representar graficamente los datos mediante un histograma.
b) Obtener el numero medio de fanegas de trigo cosechadas.
c) ¿Que cantidad maxima de fanegas de trigo fue recogida por el 75 % de las explotaciones menos productivas?
d) ¿Que cantidad mnima de fanegas de trigo fue recolectada por el 20 % de las explotaciones mas productivas?
e) ¿Que porcentaje de explotaciones recolecto menos de 160 fanegas de trigo?
2. En la tabla adjunta se encuentran los valores experimentales de la presion P de una masa dada de gas correspondientes a diferentes valores de su volumen V . Segun los principios de Termodinamica existe una relacion entre las variables que tiene la forma PV a = b, donde a y b son constantes.
Volumen V Presion P (en pulgadas cubicas) (en libras por pulgada cuadrada)
54.3 61.2 61.8 49.5 72.4 37.6 88.7 28.4 118.6 19.2 194.0 10.1
a) Calcular los valores de a y b.
b) Estimar P cuando V = 100 pulgadas cubicas.
3. En una determinada region se encuentran tres tipos de formaciones geologicas diferentes I, II y III que dividen a la region en tres zonas. La empresa de aguas de la region pretende hacer diferentes pozos de agua que permitan abastecer a toda la region. Se sabe que la probabilidad de encontrar agua en la primera zona es 0.15, en la segunda 0.20 y en la tercera 0.05. El 20 % de la region tiene formaciones geologicas del tipo I, el 35% del tipo II y el 45 % del tipo III.
a) Obtener la probabilidad de encontrar agua en la region.
b) Si no se ha obtenido agua, ¿cual es la probabilidad de que el pozo se haya construido en la zona con formaciones geologicas del tipo I? ¿Y de que se haya construido en una zona con formaciones geologicas del tipo II o del tipo III?
c) ¿Cual es la probabilidad de que se obtenga agua y de que se haya realizado la perforacion en una zona con formaciones geologicas del tipo III?
4. Se observa una fuente radioactiva durante un intervalo de tiempo de 8 segundos de duracion. Las partculas son emitidas segun una ley de Poisson con una media de 0.5 partculas por segundo y registradas en un contador. Hallar la probabilidad de que
a) se cuenten 4 o mas partculas,
b) no se cuente ninguna partcula.
Responder a las preguntas anteriores si el contador es defectuoso y cada partcula tiene solo una probabilidad de ser registrada.
5. La Concejala de Medio Ambiente del Ayuntamiento de una gran ciudad europea mide el grado de conta- minacion de la ciudad por un parametro X. Despues de una serie de investigaciones se ha concluido que este parametro se comporta como una variable aleatoria normal. Para controlar el grado de contaminacion se toman medidas diarias, obteniendose los siguientes datos durante 10 das:
10.2 11.1 10.5 9.9 10.2 10.8 11.2 9.7 10.1 10.3
a) A partir de estos datos obtener estimaciones puntuales de la media y la varianza de la distribucion de X.
b) Construir un intervalo de confianza para el grado medio de contaminacion al nivel de confianza del 95%.
Examen de diciembre de 2001.
1. Un grupo de investigadores esta interesado en estudiar la tasa de germinacion de semillas. Para ello, se consideraron semillas de alfalfa y se colocaron en una camara de germinacion. Once horas despues, se examinaron las semillas y se registro el cambio de energa libre (una medida de la tasa de germinacion). En la tabla adjunta se presentan los resultados para semillas germinadas a diferentes temperaturas.
X/Y 5-7 7-10 10-12 20-25 5 5 3 25-35 2 4 6 35-40 1 4 4
X: temperatura en 0C, Y : cambio de energa libre.
a) ¿Que porcentaje de semillas fue germinado a una temperatura superior a 350C? ¿Y a 270C?
b) ¿Cual es la temperatura mas frecuente en la que las semillas germinaron? ¿Y la temperatura media?
c) Calcular el porcentaje de semillas que, germinadas a una temperatura superior a 250C, tienen un cambio de energa libre superior a 8 unidades.
d) ¿En que distribucion marginal el valor medio de las medidas observadas es mas representativo? Razonar la respuesta.
2. La hidrolisis de un cierto ester tiene lugar en medio acido segun un proceso cinetico de primer orden. Partiendo de una concentracion inicial desconocida del ester, se han medido las concentraciones del mismo a diferentes tiempos, obteniendose los siguientes resultados:
Tiempo en minutos 3 5 10 15 20 30 40 50 60 75 90 Concentracion (103m) 25.5 23.4 18.2 14.2 11 6.7 4.1 2.5 1.5 0.7 0.4
a) Representar graficamente estos datos mediante un diagrama de dispersion. ¿Que conclusiones se pueden extraer?
b) La teora cinetica de este tipo de reacciones indica que la evolucion de la concentracion del ester en funcion del tiempo se rige por Ct = C0e
−kt, donde C0 es la concentracion inicial y k la velocidad de desaparicion del ester. ¿Que transformacion de los datos conduce a un modelo lineal? Realizar esta transformacion y obtener los valores de C0 y k.
c) Obtener una prediccion de la concentracion del ester a los 45 minutos de empezar el proceso.
3. La produccion de una finca depende de la produccion de cuatro parcelas que la constituyen P1, P2, P3 y P4. Anualmente la produccion de cada parcela en Kg. es la siguiente: 600 para P1, 500 para P2, 350 para P3 y 250 para P4. Se sabe que en dichas producciones anuales, el 4% de los frutos estan en mal estado en P1, el 3.5% en P2, el 4.6% en P3 y el 2 % en P4.
a) Si la cosecha anual se recoge conjuntamente en las cuatro parcelas, ¿cual es la probabilidad de que al seleccionar un fruto al azar, este se encuentre en mal estado?
b) Si se han recogido frutos en mal estado, ¿cual es la probabilidad de que se hayan recogido en la parcela P2?
c) Obtener la probabilidad de que los frutos se encuentren en mal estado si no se han recogido en la parcela P2.
d) Si los frutos se han recogido en las parcelas P3 y P4, ¿cual es la probabilidad de que los frutos se encuentren en buen estado?
4. En un conjunto de invernaderos se ha observado el aumento en la produccion segun la cantidad de fertilizante empleada. Se sabe que la cantidad exacta de fertilizante que ha de utilizarse es de 20 unidades y se observa que en el 97.72 % de los invernaderos se han utilizado menos de 19 unidades y que en el 6.68% menos de 12 unidades. Se supone que la variable que mide la cantidad de fertilizante empleada se distribuye segun una distribucion normal.
a) Calcular la media y la varianza de dicha variable.
b) La produccion obtenida en un invernadero no rentabiliza la inversion si se utiliza una cantidad de fertilizante inferior a las 16.8 unidades. Calcular la probabilidad de que elegido un invernadero al azar, la produccion obtenida no sea rentable.
c) Si las parcelas estan divididas por sectores de 100 invernaderos cada uno. Calcular la probabilidad de que en una parcela haya al menos dos invernaderos no rentables.
5. Se desea construir un intervalo de confianza para la media poblacional de una distribucion normal con desviacion tpica σ conocida. Se fija un margen de error maximo permitido y se busca el tamano muestral necesario para garantizar este margen de error con una confianza del 95%. Para cada una de las afirmaciones siguientes, indicar cual es verdadera o falsa, razonando la respuesta.
a) El tamano muestral necesario aumentara si disminuye σ.
b) El tamano muestral necesario disminuira si se fija la confianza del 99%.
c) Si el margen de error permitido aumenta, el tamano muestral necesario disminuye.
6. Se realiza un estudio sobre el nivel de contaminacion en cierto espacio natural. Se sabe por experiencia que la variable que la determina es normal. Se ha extrado una muestra de tamano 10, obteniendose que la media es 2.216 y la desviacion tpica 0.63.
a) Obtener un intervalo de confianza para el nivel medio de contaminacion al 95 % de nivel de confianza.
b) Calcular el tamano muestral necesario para reducir a la mitad el error de muestreo del intervalo de confianza obtenido en el apartado anterior si la desviacion tpica poblacional es 1.5.
Examen de junio de 2002.
1. El volumen maximo de agua alcanzado en un embalse durante 30 anos hidrologicos se recoge en la siguiente tabla:
50 60 74 80 90 100 110 51 61 74 81 93 101 75 54 62 80 93 70 57 68 73 74 84 86 75 69 77 55 63
a) Agrupar los datos en intervalos de amplitud 10 y representar la distribucion de frecuencias en una tabla estadstica.
b) Representar graficamente la distribucion de frecuencias.
2. El grado de humedad que presenta cierta especie de algas tiene relacion con la profundidad a la que crecen las plantas. Se han recogido los siguientes datos:
X / Y 0.5-0.75 0.75-0.8 0.8-0.98 0-10 6 4 0 10-30 5 7 3 30-40 5 10 15
X: profundidad en metros, Y : grado de humedad.
a) ¿A que profundidad fueron encontradas la mayora de las algas que presentaron un grado de humedad menor que 0.8?
b) Esta especie de algas presenta propiedades curativas contra cierta enfermedad si el grado de humedad se encuentra entre 0.6 y 0.85. ¿Cuantas de las muestras recogidas no presentan estas propiedades curativas?
c) ¿En que distribucion marginal la media es mas representativa?
3. De un determinado gas se ha medido, bajo ciertas condiciones, el volumen ocupado al someterlo a distintas presiones, obteniendose la siguiente tabla:
Presion (P ) 0.5 1 1.5 2 2.5 3 Volumen (V ) 1.62 1 0.76 0.62 0.52 0.46
a) Representar los datos graficamente. ¿Existe relacion entre ellos?
b) Ajustar a estos datos una funcion del tipo V = aP b, donde a y b son constantes.
c) A partir de la funcion ajustada en el apartado anterior obtener una prediccion para el volumen ocupado por el gas cuando se le somete a una presion de 1.75.
4. Un problema tiene que ser resuelto por tres alumnos, A, B y C, separadamente. La probabilidad de que lo solucione A es 1/2, la de que lo solucione B es 1/3, y la de que lo haga C es 1/4.
a) ¿Cual es la probabilidad de que lo solucione uno cualquiera de los tres alumnos?
b) ¿Cual es la probabilidad de que el problema sea resuelto solamente por uno de los alumnos?
5. Una empresa de aguas contrata a dos ingenieros, A y B, para realizar diferentes estudios hidrogeologicos en una determinada zona. La probabilidad de que el ingeniero A entregue los estudios en la fecha impuesta por la empresa es 0.90 y 0.98 para el ingeniero B.
a) Si los honorarios exigidos por el ingeniero B duplican a los exigidos por A y la empresa desea reducir al maximo el coste de contratacion, ¿que tanto por ciento de estudios debe asignarle a cada uno de los ingenieros que piensa contratar para que la probabilidad de que la empresa disponga de los estudios en la fecha convenida sea como mnimo de 0.96?
b) Se selecciona al azar uno de los estudios contratados y se comprueba que no ha sido presentado en la fecha impuesta por la empresa, ¿cual es la probabilidad de que el ingenierio B estuviera contratado para realizar dicho estudio?
6. Un grupo de investigadores sabe por propia experiencia que la altura de cierta variedad de arbustos en una determinada zona se comporta como una variable normal con media 2.5m. y desviacion tpica 0.5m.
a) Calcular la probabilidad de encontrar arbustos en la zona con una altura superior a 3m.
b) Si se seleccionan aleatoriamente 9 arbustos de la zona, ¿cual es la probabilidad de encontrar como maximo 7 arbustos con altura superior a 3m.? ¿Cual sera el numero esperado de arbustos que se encontraran con una altura inferior o igual a 3m.?
c) Si se realiza una seleccion de 1000 arbustos, ¿que probabilidad existe de encontrar mas de la tercera parte con una altura inferior o igual a 3m.?
7. En una granja avcola se utilizan dos tipos de pienso, A y B. Se esta interesado en comparar la media de engorde de las aves con ambos piensos. Para ello se seleccionan 40 aves y se les alimenta durante cierto tiempo con el pienso A y se obtiene una ganancia media de peso por ave de 0.78Kg. con una desviacion tpica de 0.0186Kg. Simultaneamente a otras 40 aves se les alimenta con el pienso B y se obtiene un engorde medio de 0.79Kg. con una desviacion tpica de 0.0172Kg.
Construir intervalos de confianza para la diferencia entre las ganancias medias de peso para los dos tipos de pienso a los niveles de confianza del 95% y 99 %. ¿Que conclusiones pueden extraerse?
Examen de septiembre de 2002.
1. Se realizaron pruebas de laboratorio para el estudio de la tension de vapor de agua (ml de Hg) a distintas temperaturas (oC). Para ello se realizaron 20 medidas, obteniendose los siguientes resultados:
X / Y 0.5-1.5 1.5-2.5 2.5-5-5 1-15 4 1 0 15-25 1 4 2 25-30 0 3 5
X: temperatura e Y :tension de vapor de agua.
a) Construir e interpretar el diagrama de Box-Whisker para la variable Y .
b) Calcular el porcentaje de pruebas que, realizadas a una temperatura superior a 15oC, presentaron una tension de vapor de agua superior a 2ml de Hg.
c) ¿En que distribucion marginal el valor medio de las medidas observadas es mas representativo?
2. Una empresa vitivincola desea realizar un estudio sobre la influencia de las campanas publicitarias en sus cifras de ventas. Para ello dispone del gasto destinado a publicidad y de las ventas en los ultimos seis anos.
Anos Gastos en publicidad Ventas (en millones de pts.) (en millones de pts.)
1996 2.5 200 1997 2.8 221 1998 2.9 230 1999 3.1 239 2000 3.5 248 2001 3.9 256
a) Realizar un ajuste lineal mnimo-cuadratico que explique la evolucion de las ventas en funcion de los gastos en publicidad. Obtener una medida de la bondad del ajuste realizado.
b) Utilizando el modelo ajustado, predecir las ventas que habra para este ano si se tiene previsto invertir en publicidad 24,000 euros. ¿Es fiable la prediccion obtenida?
3. En una poblacion de moscas de fruta, el 25 % presentan mutacion en los ojos, el 50 % presentan mutacion en las alas y el 40% de las que presentan mutacion en los ojos presentan mutuacion en las alas.
a) Se selecciona al azar una mosca de la poblacion, ¿cual es la probabilidad de que presente simultanea- mente las dos mutaciones? ¿Y la probabilidad de que presente al menos una de las mutuaciones?
b) Obtener la probabilidad de que la mosca seleccionada presente mutuacion en los ojos pero no en las alas.
4. En una granja avcola se utilizan dos tipos de pienso, A y B, para alimentar a las aves. El 20 % de las aves se alimenta exclusivamente con el pienso del tipo A, el 35% exclusivamente con el pienso del tipo B y el resto de las aves con ambos tipos de pienso. Se sabe que la probabilidad de que el engorde de las aves sea superior a 1Kg. cuando se utiliza solamente el pienso A es de 0.86, cuando se utiliza solamente el pienso B es de 0.58 y cuando se utilizan ambos es de 0.95.
a) Si se selecciona aleatoriamente una de las aves de la granja, ¿cual es la probabilidad de que el engorde sea superior a 1Kg.?
b) Se selecciona al azar una de las aves de la granja y se comprueba que el engorde no ha superado a 1Kg., ¿cual es la probabilidad de que haya sido alimentada con los dos tipos de pienso?
c) ¿Cual es la probabilidad de que al seleccionar aleatoriamente una de las aves de la granja se haya alimentado con el pienso A exclusivamente y el engorde supere a 1Kg.?
5. Se estudian las plantas de una determinada zona en donde se sospecha que ha atacado un cierto virus. Se sabe que la probabilidad de que una planta este contaminada es 0.35.
a) ¿Cual es el numero medio de plantas contaminadas que se pueden esperar en 5 analisis? ¿Y en 150 analisis?
b) Calcular la probabilidad de encontrar 8 plantas contaminadas en 10 examenes de las plantas de la zona contaminada.
c) Calcular la probabilidad de encontrar entre 2 y 5 plantas contaminadas en 9 examenes.
d) Hallar la probabilidad de que en 250 analisis se encuentren entre 155 y 175 plantas no contaminadas.
6. Un grupo de investigadores sabe por propia experiencia que el contenido de celulosa en una determinada variedad de alfalfa tiene una distribucion normal con desviacion tpica de 12mg/g. En una muestra de 48 cortes de alfalfa se obtuvo que el contenido medio de celulosa era de 152mg/g.
a) Construir un intervalo de confianza al nivel de confianza del 99 % para el contenido medio de celulosa de toda la poblacion.
b) Un estudio afirma que el contenido medio de celulosa en la poblacion es de 150mg/g, ¿corroboran los datos muestrales esta impresion? Razonar la respuesta.
c) ¿Cuantos cortes de alfalfa se tendran que considerar como mnimo para conseguir un margen de error de 2mg/g en un intervalo de confianza al 98 % para el contenido medio de celulosa de la poblacion?
Examen de diciembre de 2002.
1. En una determinada region se sabe que las precipitaciones cadas dependen de la cantidad de vegetacion en la zona. Se dispone de los siguientes datos:
X Y 50 20 100 70 150 100 200 150 300 200
X: numero de arboles por Ha, Y : numero de litros cados por m2.
a) Ajustar a los datos una funcion del tipo y = abx.
b) Utilizando la funcion ajustada en el apartado anterior, predecir el volumen de agua cado cuando el numero de arboles por Ha. en la zona es 175.
2. La edad de un arbol se estudia atendiendo al numero de anillos en la seccion transversal del tronco. Se sabe por experiencias anteriores que la edad de cierta especie de conferas se distribuye segun una normal de media 20 y varianza 16.
a) Un arbol se considera anciano si el numero de anillos es superior a 30. Calcular la probabilidad de que un arbol elegido al azar sea considerado anciano.
b) Se toma una muestra de arboles de tamano 10. Calcular la probabilidad de que haya como mnimo 8 arboles ancianos.
c) ¿Cual es el numero medio de arboles no ancianos en un bosque con 1,375 arboles? Dar una medida de dispersion del numero de arboles no ancianos en el bosque.
3. La longitud de determinada poblacion de fosiles es una variable aleatoria que sigue una distribucion normal con desviacion tpica 13.2mm.
a) Se ha extrado una muestra de 15 fosiles, cuyo valor medio ha resultado ser 186.5mm. Construir un intervalo de confianza para la longitud media de los fosiles al nivel de confianza del 99 %.
b) ¿Que nivel de confianza reduce a la mitad la amplitud del intervalo anterior?
c) ¿De que tamano mnimo habra que seleccionar la muestra para obtener un margen de error de 3 en un intervalo de confianza al nivel de confianza del 98 %?
Examen de junio de 2003.
1. Un grupo de investigadores quiere estudiar la relacion existente entre el volumen de agua alcanzado en un embalse y la precipitacion cada en la zona durante 30 anos. Para ello dispone de los siguientes datos:
X \ Y 100-150 150-200 200-300 50-70 5 2 2 70-80 1 3 3 80-90 2 4 1 90-100 0 5 2
X: volumen de agua (en miles de l), Y : precipitacion (en l/m2).
a) Calcular el porcentaje de anos en los que el volumen de agua esta por encima del volumen medio.
b) Se considera un ano seco cuando el numero de litros por m2 cados es inferior a 155. ¿Cual es el porcentaje de anos en los que no hubo sequa?
c) De entre todos los anos en los que el numero de litros por m2 cados es superior a 150, ¿cual es el volumen de agua mas frecuente? Representar el histograma de dicha distribucion.
d) ¿En que distribucion marginal la media es mas representativa?
2. EL grado de humedad que presenta cierta especie de algas tiene relacion con la profundidad a la que crecen las plantas. Se dispone de los siguientes datos:
X 5 9 12 16 20 22 Y 0.54 0.65 0.67 0.75 0.81 0.78
X: profundidad en metros, Y : grado de humedad.
a) Realizar un ajuste lineal mnimo-cuadratico para predecir el grado de humedad en funcion de la pro- fundidad. Calcular una medida de la bondad del ajuste realizado.
b) Utilizando la recta ajustada en el apartado anterior, predecir el grado de humedad para plantas que crecen a 15 metros de profundidad. ¿Es fiable esta prediccion? Razonar la respuesta.
3. Una empresa contrata a tres ingenieros, A, B y C, para realizar diferentes estudios hidrologicos en una determinada zona. Se sabe que la probabilidad de que el ingeniero A entregue los estudios en la fecha impuesta por la empresa es 0.90, 0.85 para el ingeniero B y 0.95 para el ingeniero C.
a) Calcular la probabilidad de que la empresa disponga de todos los estudios contratados a los ingenieros en la fecha convenida.
b) ¿Cual es la probabilidad de que solamente uno de los ingenieros presente los estudios contratados en la fecha impuesta por la empresa?
c) Obtener la probabilidad de que alguno de los ingenieros presente los estudios contratados en la fecha estipulada por la empresa.
4. Se sabe que el 35 % de los alumnos que empiezan determinados estudios acaban.
a) Si en un curso se encuentran 10 alumnos, ¿cual es la probabilidad de que mas de tres finalicen?
b) ¿Cual sera el numero esperado de alumnos que acaben?
5. La Concejala de Medio Ambiente del Ayuntamiento de una gran ciudad mide el nivel de contaminacion de cada uno de los sectores en los que se encuentra dividida la ciudad. Se observa que en el 84.13% de los sectores el nivel de contaminacion es inferior a 2.5 y que en el 93.32% superior a 1.25.
Se sabe por experiencia que la variable que determina el nivel de contaminacion se comporta como una distribucion normal.
a) Determinar los parametros de la distribucion normal en estudio.
b) En aquellos sectores de la ciudad en los que se encuentre un nivel de contaminacion superior a 2.75 la Concejala desarrollara un plan de emergencia para prevenir los posibles efectos del elevado nivel de contaminacion. ¿Que porcentaje de sectores estaran afectados por el plan de emergencia?
6. Se pretende seleccionar una muestra de tamano n de una poblacion con varianza 25. Obtener el valor mnimo de n para poder afirmar, con probabilidad 0.95, que la media muestral diferira de la media poblacional en menos de 2 unidades.
7. Un grupo de investigadores esta interesado en estudiar si existe incremento en la produccion de una nueva variedad de maiz. Para ello planta 10 parcelas con la nueva variedad, obteniendose las siguientes cantidades cosechadas:
138 139 132 158 135 142 151 136 140 148
a) Bajo la hipotesis de normalidad de la poblacion en estudio, obtener estimaciones puntuales para la media y la varianza poblacionales.
b) Construir un intervalo de confianza al nivel de confianza del 90 % prara la produccion media por parcela. ¿Cual es el efecto del incremento del nivel de confianza sobre el intervalo de confianza?
Examen de septiembre de 2003.
1. El encargado de obra de cierta compana constructora esta interesado en estudiar si existe alguna relacion entre la edad de los obreros y los das de baja que solicitan al ano. Para ello, con los datos referentes a 100 de los trabajadores ha construido la siguiente tabla de doble entrada:
Edad / Das 0-5 5-10 10-20 18-30 28 2 0 30-40 26 13 1 40-50 6 12 2 50-60 0 3 7
a) Representar graficamente la distribucion de frecuencias de las variables en estudio. ¿Que conclusiones se pueden extraer de las variables?
b) ¿Cual es el porcentaje de trabajadores que solicitaron mas de 7 das de baja al ano?
c) Obtener la edad media de los trabajadores de la compana.
d) Calcular el numero de das de baja al ano que se solicitan con mayor frecuencia.
2. Se han estudiado en 5 probetas la dureza (X) y el desgaste por abrasion de cierto tipo de materiales, obteniendo los siguientes resultados:
X 2 2.5 3.25 4.5 5.75 Y 1.20 1 0.8 0.65 0.55
a) Ajustar a estos datos una funcion potencial del tipo Y = aXb, donde a y b son constantes.
b) Estimar mediante el ajuste anterior el desgaste que sufrira un material que posee una dureza de 3.
c) Se realizo otro tipo de ajuste a estos datos obteniendose una varianza residual de 0.00025. ¿Cual de los ajustes realizados se adapta mejor a los datos? Razonar la respuesta.
3. El 35 % de un grupo de muestras de rocas de interes presentan en su composicion la sustancia A, el 45 % la sustancia B y el 15 % las sustancias A y B. Se selecciona una muestra al azar.
a) Calcular la probabilidad de que la muestra presente la sustancia A si presenta la sustancia B.
b) Calcular la probabilidad de que la muestra presente la sustancia A si no presenta la sustancia B.
c) Se sabe que el 20 % de las muestras presentan en su composicon la sustancia C, incompatible con B y el 2% de las muestras las sustancias A y C. Calcular la probabilidad de que la muestra presente la sustancia B o C si presenta la sustancia A.
4. Una empresa de aguas contrata a 3 ingenieros, A, B y C, para realizar diferentes estudios hidrogeologicos en una determinada zona. El 25 % de los estudios son realizados por el ingeniero A, el 35 % por el ingeniero B y el resto por el ingeniero C. La probabilidad de que el ingeniero A presente los estudios en la fecha impuesta por la empresa es 0.9, la probabilidad de que el ingeniero B no realice los estudios en la fecha impuesta es 0.03 y la probabilidad de que el ingeniero C presente los estudios en la fecha estipulada es 0.95.
a) Se selecciona al azar uno de los estudios contratados. Calcular la probabilidad de que la empresa disponga del estudio seleccionado en la fecha impuesta.
b) Si se sabe que el estudio seleccionado no ha sido presentado en la fecha impuesta, ¿cual es la proba- bilidad de que el ingeniero A estuviera contratado para realizar dicho estudio?
c) El ingeniero C tiene mucho trabajo y decide contratar a dos ingenieros para realizar los estudios, C1 y C2. La probabilidad de que el ingeniero C1 entregue los estudios en la fecha convenida es 0.90 y 0.96 para el ingeniero C2. ¿Que tanto por ciento de estudios debe asignarle el ingeniero C a C1 y C2 para que la probabilidad de que el ingeniero C presente los estudios en la fecha impuesta por la empresa se mantenga en 0.95?
5. El diametro de cierto tipo de vigas en un proceso de fabricacion sigue una distribucion normal. En una determinada empresa se producen diariamente 2000 vigas. Se sabe que el 67 % de las vigas tienen un diametro superior a 199.12 mm. y el 95 % lo tienen inferior a 203.3 mm.
a) Obtener los parametros que determinan la distribucion de los diametros de las vigas.
b) Una empresa esta interesada en estudiar la calidad del suministro de las vigas. Para ello determina que el diametro mnimo admisible es de 194.36 mm. y decidira suspender su contrato si en la produccion diaria encuentra 10 o mas vigas no admisibles. Calcular la probabilidad de que se suspenda el contrato.
6. Una empresa conservera esta interesada en investigar si sus empleados cumplen el horario de descanso vespertino convenido, que es de 20 minutos. Para ello realiza un seguimiento a 50 empleados seleccionados aleatoriamente observando el tiempo en minutos que tardan los empleados en reincorporarse a su puesto de trabajo. Los datos obtenidos son los siguientes:
x = 20.483 s2 = 9.546
a) Construir un intervalo de confianza para el tiempo medio de descanso vespertino al nivel de confianza del 98%. ¿Que conclusion se puede extraer?
b) Calcular el tamano muestral necesario para reducir a la mitad el margen de error del intervalo de confianza obtenido en el apartado anterior si se supone que la varianza poblacional es de 9.
c) ¿Que factores influyen en la amplitud de un intervalo de confianza? ¿En que se traduce un aumento o una reduccion de la amplitud de un intervalo de confianza?
Examen de diciembre de 2003.
1. Un grupo de investigadores quiere estudiar la relacion existente entre el volumen de agua alcanzado en un embalse y la precipitacion cada en la zona durante 50 anos. Para ello dispone de los siguientes datos:
X \ Y 100-150 150-200 200