Estimación. Estimación Puntual Propiedades deseables de los estimadores Estimaciones puntuales...

download Estimación. Estimación Puntual Propiedades deseables de los estimadores Estimaciones puntuales (media, proporción, varianza) Estimación por intervalos.

If you can't read please download the document

Transcript of Estimación. Estimación Puntual Propiedades deseables de los estimadores Estimaciones puntuales...

  • Diapositiva 1
  • Estimacin. Estimacin Puntual Propiedades deseables de los estimadores Estimaciones puntuales (media, proporcin, varianza) Estimacin por intervalos Estimacin de la media y diferencias de medias Estimacin de la proporcin y diferencia de proporciones Estimacin de la varianza y cociente de varianzas Relacin entre ambas estimaciones Tamao de la muestra Ejercicios
  • Diapositiva 2
  • Introduccin Inferencia Estadstica, Estadstica Inductiva, Teora de Muestras Existe una de la que el investigador selecciona una que genera unos usados para evaluar unos que se usan para estimar que describen
  • Diapositiva 3
  • Estimacin puntual Una estimacin puntual de algn parmetro poblacional es un valor nico del estadstico. Por ejemplo, el valor de la estadstica calculado a partir de una muestra de tamao n, es una estimacin puntual del parmetro poblacional. El estadstico que se utiliza para obtener una estimacin puntual recibe el nombre de estimador o funcin de decisin. Generalmente muestras diferentes conducen a acciones o estimaciones diferentes. No se espera que un estimador obtenga sin error el valor del parmetro poblacional, sino que no se aleje mucho del valor real. Es posible definir muchas estadsticas para estimar un parmetro desconocido. Entonces, cmo seleccionar un buen estimador de ? Cales son los criterios para juzgar cundo un estimador de es "bueno" o "malo"?. Por ejemplo, pudo elegirse la mediana muestral o la moda para estimar el valor de la media poblacional, en qu nos basamos para elegir como estimador la media muestral?
  • Diapositiva 4
  • Estimacin puntual Propiedades Deseables de los Estimadores Puntuales: Bsicamente para que un estimador sea bueno, se desea que la varianza del estimador sea lo ms pequea posible, mientras que la distribucin de muestreo debe concentrarse alrededor del valor del parmetro. Estimadores Insesgados (Centrados): Se dice que la estadstica = H(X 1, X 2,..., X n ) es un estimador insesgado del parmetro, si. Es decir, si los valores del estimador se centran alrededor del parmetro en cuestin.
  • Diapositiva 5
  • Estimacin puntual Estimadores Consistentes: Es razonable esperar que un buen estimador de un parmetro, sea cada vez mejor conforme crece el tamao de la muestra y la informacin se vuelve ms completa. La distribucin de muestreo de un buen estimador se encuentra cada vez ms concentrada alrededor del parmetro. Si un estimador es consistente, converge en probabilidad al valor del parmetro que est intentando estimar conforme el tamao de la muestra crece. Esto implica que la varianza de un estimador consistente disminuye conforme n crece. Se dice que es un estimador consistente de si:
  • Diapositiva 6
  • Estimacin puntual Estimadores Eficientes (Insesgados de Varianza Mnima): El hecho de que un estimador sea centrado no garantiza que sus realizaciones caigan cerca del valor del parmetro, hace falta adems que tenga la varianza pequea. La varianza de un estimador insesgado es la cantidad ms importante para decidir qu tan bueno es el estimador para estimar el parmetro. Sean y cualesquiera dos estimadores insesgados de. Se dice que es un estimador ms eficiente de que, si, cumplindose la desigualdad en el sentido estricto para algn valor de. El cociente se llama eficiencia relativa de respecto a, y su valor est entre 0 y 1 (0 e 1). Si e est prximo a 0 es mejor que.
  • Diapositiva 7
  • Estimacin puntual
  • Diapositiva 8
  • Estimacin de la Media Poblacional: La media muestral es un estimador centrado y consistente de la media poblacional. Este resultado es vlido sin importar la distribucin de probabilidad de la poblacin de inters, siempre y cuando la varianza tenga un valor finito. en donde y 2 son la media y la varianza de la distribucin de la poblacin, a partir de la cual se obtuvo la muestra. Ntese que conforme el tamao de la muestra crece, la precisin de la media muestral para estimar la media poblacional aumenta (es un estimador consistente).
  • Diapositiva 9
  • Estimacin puntual
  • Diapositiva 10
  • Ejemplo: Los datos siguientes representan los pesos en gramos del contenido de 16 cajas de cereal que se seleccionaron al azar de un proceso de llenado con el propsito de verificar el peso promedio. 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 Calcular la estimacin puntual para el peso promedio. Solucin: gramos.
  • Diapositiva 11
  • Estimacin puntual Estimacin de la Varianza Poblacional: Cuando se desconoce la media poblacional, debemos sustituir este parmetro por su estimador muestral, y el estimador a usar para la varianza poblacional, que es centrado o insesgado sin importar cul sea la distribucin de la poblacin de inters, es la cuasivarianza muestral S 2. Demostracin:
  • Diapositiva 12
  • Estimacin puntual
  • Diapositiva 13
  • Si hubisemos utilizado como estimador, la varianza muestral (desconociendo la media poblacional), no sera una estimacin insesgada o centrada:
  • Diapositiva 14
  • Estimacin puntual Ejemplo: El cobre es un micronutriente requerido por la mayora de las plantas. Su concentracin en una planta se mide analizando las cenizas obtenidas al quemarla completamente. En un estudio de la variabilidad de la concentracin de cobre en las plantas de la cuenca del Jarama, se seleccion una muestra de 16 plantas. Se obtuvieron los siguientes datos (en partes por milln): 5 3 34 18 27 14 8 50 38 43 35 20 70 25 60 19 Calcular una estimacin puntual para la variabilidad de la concentracin. Solucin:
  • Diapositiva 15
  • Estimacin puntual Estimacin de la Proporcin: Tenemos una poblacin dividida en dos subconjuntos, en funcin de una caracterstica determinada, de forma que la proporcin de la poblacin que posee la caracterstica es p, y la de los que no la poseen es 1-p. Tratamos de estimar el valor de p. El estadstico dado por la expresin siguiente, es un estimador centrado y consistente de la proporcin poblacional. Demostracin:
  • Diapositiva 16
  • Estimacin puntual Ejemplo: Los huevos de la mosca azul producen infecciones al ser depositados en la sangre de un animal. Se efectu un experimento para controlar el crecimiento de la poblacin de este tipo de moscas. Las pupas fueron sometidas a radiacin al objeto de esterilizar al mayor nmero posible de machos. Cada hembra se emparej con un nico macho. Se estudiaron 500 emparejamientos, de los cuales 415 resultaron estriles. Calcular una estimacin puntual de la proporcin poblacional de machos estriles. Solucin:
  • Diapositiva 17
  • Estimacin por intervalos Una estimacin por intervalo de un parmetro poblacional es un intervalo de la forma L 1 < < L 2, donde L 1 y L 2 dependen del valor del estadstico para una muestra particular y tambin de la distribucin muestral de. Un intervalo de confianza al nivel de confianza (1- ) 100% (donde 0 < < 1) para el parmetro poblacional, a partir de una muestra seleccionada, es un intervalo aleatorio tal que: P (L 1 < < L 2 ) = 1 - El intervalo de estimacin indica, por su longitud, la precisin de la estimacin puntual. El intervalo L 1 < < L 2, que se calcula a partir de la muestra seleccionada, se denomina entonces intervalo de confianza del (1 - ) 100%, la fraccin (1- ) recibe el nombre de coeficiente de confianza o grado de confianza, y los puntos extremos L 1 y L 2, se llaman lmites de confianza inferior y superior. Ya que muestras distintas generalmente dan valores distintos de y, por tanto, de L 1 y L 2, estos puntos extremos del intervalo son los valores de las variables aleatorias correspondientes L 1 y L 2.
  • Diapositiva 18
  • Estimacin por intervalos A partir de la distribucin muestral de ser posible determinar L 1 y L 2 tales que P(L 1 < < L 2 ) sea igual para cualquier valor fraccional positivo que se desee especificar. Si, por ejemplo, se encuentran L 1 y L 2 tales que, P (L 1 < < L 2 ) = 1 - para 0 < < 1, entonces se tiene una probabilidad de (1- ) de seleccionar una muestra aleatoria que produzca un intervalo que contenga a. En trminos generales, la construccin de un intervalo de confianza para un parmetro desconocido consiste en encontrar un estadstico suficiente y relacionarlo con una v. a. X que involucre a, a, no contenga ningn otro valor desconocido, y cuya distribucin en el muestreo sea conocida. Entonces se seleccionan dos valores L 1 y L 2 tales que P(L 1 1.96) = 0.025. A partir de los datos muestrales, se obtiene que: gramos.
  • Diapositiva 22
  • Estimacin por intervalos Entonces, el intervalo de confianza al 95% para la media del proceso de llenado es: L 1 = = 503.75 - 1.96 * = 501.3 L 2 = = 503.75 + 1.96 * = 506.2 P(L 1 < < L 2 ) = 95%
  • Diapositiva 23
  • Estimacin por intervalos Estimacin de la Media Desconociendo la Varianza: La mayora de las veces no se conoce la varianza de la poblacin de la cual se seleccionan las muestras aleatorias. El valor de S 2 proporciona una buena estimacin de 2. Qu le ocurre entonces al estadstico correspondiente (2) si se reemplaza por S 2 ? Si la poblacin de partida era normal, (2) segua un distribucin normal independientemente del tamao de la muestra. Si ahora sustituimos 2 por S 2, aunque la poblacin de partida sea normal, la distribucin del estadstico (3) puede desviarse de la normalidad. En este caso, si la n 30 puede seguir suponindose que sigue una distribucin normal sin que por ello el error cometido sea muy grande.
  • Diapositiva 24
  • Estimacin por intervalos Sin embargo, si el tamao de la muestra es pequeo, los valores de S 2 fluctan considerablemente de muestra a muestra y la distribucin de la variable aleatoria (3) se desva en forma apreciable de la normal estndar, siguiendo entonces una distribucin t de Student con (n-1) grados de libertad. Al igual que habamos visto en el apartado anterior: donde t /2 es el valor t con (n-1) grados de libertad, sobre el cual se encuentra un rea de /2. Al multiplicar cada trmino de la desigualdad por y despus de restar y multiplicar por (-1), se obtiene:
  • Diapositiva 25
  • Estimacin por intervalos Si y S son la media y la cuadesviacin tpica de una muestra aleatoria de una poblacin aproximadamente normal con varianza desconocida 2 (aproximada por el valor de S 2 ), un intervalo de confianza del (1 - ) 100% para es: donde t /2 es el valor t con (n-1) grados de libertad, lo que deja un rea de /2 a la derecha.
  • Diapositiva 26
  • Estimacin por intervalos Ejemplo: Los contenidos de 7 recipientes similares de cido sulfrico son: 9.8, 10.2, 10.4, 9.8, 10, 10.2, 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los recipientes, suponiendo una distribucin aproximadamente normal. Solucin: La media muestral y su desviacin estndar para los datos que se dan son: = 10 S=0.283 t 0.025 = 2.447 para 6 grados de libertad. El intervalo de confianza para es: 10 - 2.447 * < < 10 + 2.447 * lo cual se reduce a: 9.74 < < 10.26
  • Diapositiva 27
  • Estimacin por intervalos Estimacin diferencia de medias Varianzas conocidas Varianzas desconocidas Muestras grandes Muestras pequeas Var. igualesVar. distintas Observaciones pareadas Estimacin de la Diferencia de Medias: Seleccionamos dos muestras aleatorias independientes de tamaos n 1 y n 2 de dos poblaciones normales con medias 1 y 2 y varianzas 2 1 y 2 2 respectivamente. El estimador puntual de 1 - 2 lo da el estadstico. Se puede esperar que la distribucin muestral de est distribuda aproximadamente en forma normal, con media y desviacin tpica
  • Diapositiva 28
  • Estimacin por intervalos Varianzas conocidas ( 1 2 Y 2 2 ) La variable normal estndar. caer entre -z /2 y z /2 con una probabilidad (1 - ). P(-z /2 < Z < z /2 ) = 1 - sustituyendo Z por la expresin anterior y siguiendo los mismos pasos que en casos anteriores, obtenemos: Si y son las medias de muestras aleatorias independientes de tamaos n 1 y n 2 de poblaciones aproximadamente normales, con varianzas conocidas 1 2 y 2 2 respectivamente, un intervalo de confianza de (1 - ) 100% para 1 - 2 es: donde z /2 es el valor de z que tiene un rea de /2 a la derecha. Si las poblaciones son normales, el grado de confianza es exacto. Para poblaciones que no son normales, el Teorema del Lmite Central proporciona una buena aproximacin para muestras de tamao razonable.
  • Diapositiva 29
  • Estimacin por intervalos Varianzas desconocidas y muestras grandes (n 1 + n 2 30 y n 1 n 2 ) Segn especialistas estadsticos se puede seguir utilizando la aproximacin normal, pero utilizando S 1 2 y S 2 2 en lugar de las varianzas correspondientes. Varianzas desconocidas pero iguales y muestras pequeas (n 1 + n 2 < 30) Aqu tenemos que pero se desconoce su valor. El estadstico a usar en este caso ser: donde S p es La estimacin muestral S p de la varianza poblacional debe ser un promediado de las estimaciones muestrales S 1 2 y S 2 2, porque aunque las varianzas poblacionales 1 2 y 2 2 se supongan iguales, sus estimaciones muestrales no tienen por qu serlo, ya que se obtendrn valores diferentes segn las muestras tomadas.
  • Diapositiva 30
  • Estimacin por intervalos Si y son las medias de muestras aleatorias independientes, de tamaos n 1 y n 2 respectivamente, de poblaciones aproximadamente normales, con varianzas iguales pero desconocidas, un intervalo de confianza de (1 - ) 100% para 1 - 2 es: donde y t /2 es el valor de t con (n 1 + n 2 -2) grados de libertad, con un rea /2 a la derecha.
  • Diapositiva 31
  • Estimacin por intervalos Ejemplo: Bilogos marinos estn estudiando dos especies de moluscos. Miden la longitud de las conchas para obtener informacin que les permita comparar las dos especies. Desconocen la variabilidad de la longitud de las conchas, pero tienen motivos para suponer que son iguales en ambas especies. La informacin de muestra da los resultados: n 1 = 10 n 2 =10 s 1 2 =1.611s 2 2 =1.533 Construya un intervalo de confianza al 95% para la diferencia media entre las longitudes de las conchas de las dos especies. Solucin: = 1.5722 S p = 1.2538 (1- )100% = 95% = 0.05 /2 = 0.025 t 0.025,18 = 2.101 = 6.71 - 4.72 = 1.99 Entonces, el intervalo de confianza al 95% para la diferencia de medias es:
  • Diapositiva 32
  • Estimacin por intervalos L 1 = = 1.99 - 2.101*0.5607= 0.812 L 2 = = 1.99 + 2.101*0.5607= 3.168 P(0.812 < ( 1 - 2 ) < 3.168) = 95%
  • Diapositiva 33
  • Estimacin por intervalos Varianzas desconocidas y distintas, muestras pequeas (n 1 + n 2 < 30) El estadstico que con ms frecuencia se utiliza en este caso es: que sigue aproximadamente una distribucin t con v grados de libertad donde Dado que v rara vez es un entero, se redondea al entero ms cercano.
  • Diapositiva 34
  • Estimacin por intervalos Si y y S 1 2 y S 2 2 son las medias y cuasivarianzas de muestras pequeas independientes de tamaos n 1 y n 2 respectivamente, de distribuciones aproximadamente normales con varianzas diferentes y desconocidas, un intervalo de confianza aproximado del (1 - ) 100% para 1 - 2 est dado por: donde t /2 es el valor t con grados de libertad, con un rea de /2 a la derecha.
  • Diapositiva 35
  • Estimacin por intervalos Ejemplo: Los siguientes datos representan los tiempos de duracin de las pelculas que producen dos compaas cinematogrficas: Calcule el intervalo de confianza del 90% para la diferencia entre los tiempos promedio de duracin de las pelculas que producen las dos compaas. Suponga que el tiempo de duracin tiene una distribucin aproximadamente normal. Solucin: n 1 = 5t 0.05,7 = 1.833 n 2 = 7= 98.4 - 110.7 = -12.31 (1- )100% = 90% = 0.10 /2 = 0.05 s 1 2 = (21.16+19.36+134.56+129.96+0.16)=76.3 s 2 2 = (188.08+824.51+151.94+350.22+4132.65+515.94+53.08)=1036.07 CompaaTiempo (min.) I103 94 110 87 98 II 97 82 123 92 175 88 118
  • Diapositiva 36
  • Estimacin por intervalos L 1 = = -12.314 - 1.833*12.78= -35.74 L 2 = = -12.314 + 1.833*12.78= 11.11 P(-35.74 < ( 1 - 2 ) < 11.11) = 90%
  • Diapositiva 37
  • Estimacin por intervalos Observaciones pareadas: En este caso se estima la diferencia de dos medias cuando las muestras no son independientes. Entonces, cada unidad experimental tiene un par de observaciones, una para cada poblacin. Consideramos las diferencias d 1, d 2,..., d n en las observaciones pareadas. Estas diferencias son los valores de una poblacin de diferencias que se asumir distribuida normalmente, con media d = 1 - 2 y varianza Se estima d 2 por S d 2, la varianza de las diferencias que constituyen la muestra. El estimador puntual de d lo representa, la media de las diferencias que constituyen la muestra. Una vez obtenidas las diferencias, su estudio se reduce al caso de estimacin de la media desconocida de una poblacin aproximadamente normal, desconocida su varianza (ya visto anteriormente).
  • Diapositiva 38
  • Estimacin por intervalos El estadstico a utilizar en esta ocasin es: que sigue una distribucin t con (n-1) grados de libertad. Obtener el intervalo de confianza es la rutina de siempre. Si y S d son la media y la desviacin tpica de las diferencias normalmente distribudas de n pares aleatorios de mediciones, un intervalo de confianza del (1 - ) 100% para d = 1 - 2 es : donde t /2 es el valor t con (n-1) grados de libertad, con un rea de /2 a la derecha.
  • Diapositiva 39
  • Estimacin por intervalos Ejemplo: Investigadores famosos han formulado la hiptesis de que el fuego puede cambiar los niveles de calcio presentes en la tierra y entonces afectar la cantidad de este mineral disponible para los venados. Se seleccion un rea grande de terreno para un incendio controlado. Se tomaron muestras de la tierra de 12 parcelas de la misma rea antes del incendio y despus de este para verificar su contenido en calcio. Se obtuvieron los resultados indicados en la tabla que sigue. Determine un intervalo de confianza al 95% para la diferencia promedio en el nivel de calcio presente en la tierra antes y despus del incendio. Asuma que la distribucin de la diferencia de los niveles de calcio es aproximadamente normal.
  • Diapositiva 40
  • Estimacin por intervalos Nivel de calcio ParcelaAntesDespusDiferencia 150941 2501832 3824537 4641846 5821864 673964 7773245 854945 923185 1045936 1136927 1254945
  • Diapositiva 41
  • Estimacin por intervalos Solucin: = 40.583 S 2 d = (0.173889 + 73.668 + 12.838 + 29.344 + 548.36 + 548.36 + 19.51 + 19.51 + 1266.15 + 21.004 + 184.5 + 19.51) = 249.357 S d =15.79 1- = 0.95 = 0.05 /2 = 0.025 t (n-1),0.025 = t 11, 0.025 = 2.201 L 1 = - t /2 = 40.583 - 2.201* = 30.5504 L 2 = + t /2 = 40.583 + 2.201* = 50.616
  • Diapositiva 42
  • Estimacin por intervalos Estimacin de la proporcin: Un estimador puntual de la proporcin p en un experimento binomial est dado por el estadstico = X/n donde X representa el n de xitos en n intentos y sigue una distribucin binomial de parmetros n y p. y es justo la media muestral de estos n valores. Por el Teorema del Lmite Central, para una n lo bastante grande, est distribuida aproximadamente en forma normal, con media: y varianza:
  • Diapositiva 43
  • Estimacin por intervalos Si p no es cercano a 0 ni a 1 y n grande, X N (np, npq) Se puede asegurar que: donde y z /2 es el valor de la curva normal estndar sobre la cual se encuentra un rea de /2. Sustituyendo z obtenemos:
  • Diapositiva 44
  • Estimacin por intervalos Multiplicando ambos trminos por y despus de restar X/n y multiplicar por (-1), se obtiene: Por tanto los extremos del intervalo de confianza que obtenemos, dependeran del parmetro desconocido. Cmo solucionarlo? Cuando n es grande, se introducen muy pocos errores al sustituir la p bajo el signo radical por su estimacin puntual =X/n. Entonces se puede escribir:
  • Diapositiva 45
  • Estimacin por intervalos Si es la proporcin de xitos en una muestra aleatoria de tamao n, un intervalo de confianza aproximado de (1- ) 100% para el parmetro binomial p es: donde z /2 es el valor z con un rea /2 a la derecha. Cuando n es pequeo y se cree que la proporcin desconocida p se acerca a 0 o a 1, el procedimiento establecido para el intervalo de confianza no es confiable y no debe ser utilizado. Para estos casos se han desarrollado diferentes mtodos grficos y analticos, en los que no vamos a entrar, para calcular el intervalo de confianza de p.
  • Diapositiva 46
  • Estimacin por intervalos Ejemplo: Los huevos de la mosca azul producen infecciones al ser depositados en la sangre de un animal. Se efectu un experimento para controlar el crecimiento de la poblacin de este tipo de moscas. Las pupas fueron sometidas a radiacin al objeto de esterilizar al mayor nmero posible de machos. Cada hembra se emparej con un nico macho. Se estudiaron 500 emparejamientos, de los cuales 415 resultaron estriles. Construir un intervalo de confianza al 95% para la proporcin poblacional de machos estriles. Solucin: 1- = 0.95 = 0.05 /2 = 0.025 z 0.025 = 1.96
  • Diapositiva 47
  • Estimacin por intervalos Estimacin de Diferencia de Proporciones: Deseamos estimar la diferencia entre dos parmetros binomiales p 1 y p 2. Para establecer un intervalo de confianza para p 1 -p 2 consideraremos la distribucin muestral de estn distribuidos cada uno en forma aproximadamente normal, con medias p 1 y p 2 y varianzas respectivamente. Al seleccionar muestras independientes de las dos poblaciones, las variables p 1 y p 2 sern independientes y entonces estar distribuida aproximadamente normal con media : y varianza:
  • Diapositiva 48
  • Estimacin por intervalos Por tanto se puede asegurar que donde Siguiendo todos los mismos pasos que en los dems casos, obtenemos: Si y son las proporciones de xitos en muestras aleatorias de tamaos n 1 y n 2 respectivamente, un intervalo aproximado de confianza del (1- ) 100% para la diferencia entre dos parmetros binomiales p 1 - p 2 es: donde z /2 es el valor de z con un rea de /2 a la derecha.
  • Diapositiva 49
  • Estimacin por intervalos Ejemplo: El departamento de trfico ha preparado dos exmenes para conductores. Se desea determinar la diferencia entre las proporciones de conductores que pasan el examen 1 y los que pasan el examen 2. Su estudio revela lo siguiente: n 1 =250n 2 =300 Construya un intervalo de confianza aproximado del 90% para la verdadera diferencia entre las proporciones de conductores que pasan los dos exmenes. Solucin: Con la informacin suministrada podemos calcular: Adems sabemos que 1- = 0.90 = 0.1 /2 = 0.05 z 0.05 = 1.645
  • Diapositiva 50
  • Estimacin por intervalos Estimacin de la Varianza: Si se toma una muestra de tamao n de una poblacin normal con varianza 2 y se calcula la cuasivarianza muestral S 2, esta varianza calculada se puede utilizar como estimacin puntual de 2. Para establecer una estimacin de intervalo de 2 se utiliza el estadstico que, como ya sabemos, sigue una distribucin 2 con (n-1) grados de libertad cuando las muestras se seleccionan de una poblacin normal. Siguiendo todos los mismos pasos que en casos anteriores, obtenemos:
  • Diapositiva 51
  • Estimacin por intervalos Si s 2 es la cuasivarianza de una muestra aleatoria de tamao n de una poblacin normal, un intervalo de confianza del (1- )100% para 2 es: donde 2 /2 y 2 1 - /2 son valores de una distribucin 2 con (n-1) grados de libertad, con reas de /2 y 1- /2 a la derecha, respectivamente. Un intervalo de confianza del (1- ) 100% para, se obtiene sacando la raz cuadrada de cada punto extremo del intervalo para 2
  • Diapositiva 52
  • Estimacin por intervalos Ejemplo: El cobre es un micronutriente requerido por la mayora de las plantas. Su concentracin en una planta se mide analizando las cenizas obtenidas al quemarla completamente. En un estudio de la variabilidad de la concentracin de cobre en las plantas de la cuenca del Jarama, se seleccion una muestra de 16 plantas. Se obtuvieron los siguientes datos (en partes por milln): 5 3 34 18 27 14 8 50 38 43 35 20 70 25 60 19 Calcular un intervalo de estimacin al 90% para la variabilidad de la concentracin. Solucin: 1 - = 0.9 = 0.1 /2 = 0.05 1 - /2 = 0.95 n = 16 El intervalo es (226.41, 779.43) para 2, o bien (15.05, 27.92) para
  • Diapositiva 53
  • Estimacin por intervalos Estimacin de la Razn de dos Varianzas: Una estimacin puntual del cociente de dos varianzas poblacionales 1 2 / 2 2 est dada por la razn S 1 2 /S 2 2 de las cuasivarianzas muestrales. Si 1 2 y 2 2 son las varianzas de poblaciones normales, se puede establecer un intervalo de estimacin de 1 2 / 2 2 utilizando el estadstico: donde S 1 2 y S 2 2 son las cuasivarianzas muestrales obtenidas de muestras aleatorias independientes de tamaos n 1 y n 2 que se sacan de las poblaciones normales con varianzas 1 2 y 2 2. En tal caso el estadstico F anterior, sigue una distribucin F de Snedecor con (n 1 -1) y (n 2 -1) grados de libertad.
  • Diapositiva 54
  • Estimacin por intervalos Si s 1 2 y s 2 2 son las cuasivarianzas de muestras independientes de tamaos n 1 y n 2 respectivamente de poblaciones normales, entonces un intervalo de confianza del (1- ) 100% para 1 2 / 2 2 es: donde f /2 (v1,v2) es el valor f con v 1 = (n 1 -1) y v 2 = (n 2 -1) grados de libertad con un rea de /2 a la derecha, y f /2 (v2,v1) es un valor similar f con v 2 = (n 2 -1) y v 1 =(n 1 - 1) grados de libertad. Un intervalo de confianza del (1- )100% para 1 / 2 se obtiene al sacar la raz cuadrada de cada punto extremo del intervalo para 1 2 / 2 2
  • Diapositiva 55
  • Estimacin por intervalos Ejemplo: Determine un intervalo de confianza del 90% para el cociente de varianzas en el ejercicio de las compaas cinematogrficas visto para la diferencia de medias. Se debi suponer entonces que las varianzas eran iguales al determinar el intervalo de confianza para la diferencia de medias? Solucin: n 1 = 5 n 2 = 7 1- = 0.90 = 0.1 /2 = 0.05 f 0.05 (6,4) = 6.16 S 1 2 = 76.3 S 2 2 = 1035.9 El 1 no cae en el intervalo, por tanto no podemos suponer que las varianzas sean iguales Bien hecho el problema de diferencia de medias
  • Diapositiva 56
  • Relacin entre ambas estimaciones Existe una distincin bastante clara entre los objetivos de las estimaciones puntuales y las estimaciones del intervalo de confianza. Los primeros proveen un nmero nico que se extrae a partir de un conjunto de datos experimentales, y los ltimos proporcionan intervalos, dados los datos experimentales, que son razonables para el parmetro, esto es, el 100 (1- )% de tales intervalos calculados "cubren" el parmetro. Sin embargo, a pesar de esta distincin clara, las dos aproximaciones a la estimacin se relacionan una con otra. El "hilo comn" es la distribucin muestral del estimador puntual. Habamos indicado que una medicin de la calidad de un estimador insesgado era su varianza, y el error estndar de un estimador es su desviacin tpica. El lmite de confianza lo podemos relacionar con la estimacin puntual, de la siguiente forma.
  • Diapositiva 57
  • Relacin entre ambas estimaciones Para el caso de la estimacin de la media concociendo tenemos: Estimador puntual: Distribucin del estimador puntual: Varianza del estimador puntual: 2 /n Desviacin Tpica del est. puntual: Luego, para el caso de X el lmite de confianza calculado sera: Si desconocemos y la reemplazamos por S obtenemos: Estimador puntual Distribucin del estimador puntual:t n-1 Varianza del estimador puntual:S 2 /n Desviacin tpica de X:
  • Diapositiva 58
  • Relacin entre ambas estimaciones El intervalo de confianza no es mejor (en trminos de anchura) que la calidad de la estimacin puntual. Esto significa que los anchos de los intervalos de confianza se hacen menores en la medida en que mejora la calidad de las correspondientes estimaciones puntuales. Se puede argumentar, en definitiva, que un intervalo de confianza es tan slo una ampliacin de la estimacin puntual para considerar la precisin de la misma.
  • Diapositiva 59
  • Tamao de la muestra Muchas veces estamos interesados en determinar el tamao de la muestra necesario para obtener, con una confianza del (1- ) 100%, una estimacin del parmetro poblacional, de tal manera que el error de estimacin no supere un determinado valor de error permitido. Hemos comentado que la anchura del intervalo de confianza, alrededor del estimador puntual del parmetro, nos da una medida de la precisin de este. Por tanto, para la determinacin del tamao muestral en cuestin basta coger la semilongitud del intervalo de confianza e igualarlo al error mximo permitido, despejando cul ser el valor de n que verifique esa igualdad. Si se utiliza como estimacin de, se puede tener una confianza del (1- ) 100% de que el error no exceder una cantidad especificada cuando el tamao de la muestra es:
  • Diapositiva 60
  • Tamao de la muestra Queremos que, es decir Con una confianza del (1- ) 100% sabemos que luego Despejando de esa expresin la n obtenemos: Los valores fraccionarios de n se redondean al entero superior.
  • Diapositiva 61
  • Tamao de la muestra En la estimacin de un intervalo de confianza para la proporcin, hemos visto que si se utiliza como una estimacin de p, se puede tener una confianza del (1- ) 100% de que el error cometido no exceder de Si deseamos determinar qu tan grande debe ser una muestra para asegurar que el error al estimar p ser menor que una cantidad especificada, tendremos que escoger una n, de tal forma que y ese valor de n es:
  • Diapositiva 62
  • Tamao de la muestra La expresin anterior puede resultar paradjica ya que para calcular ya debemos conocer n porque. Tenemos entonces dos opciones: a) Obtener una muestra con n 30 valores, a partir de la cual calcular la aproximacin y usar esta aproximacin para calcular cuantas observaciones seran necesarias para obtener la precisin deseada. b) Establecer un lmite superior para el valor de n observando que es como mximo , ya que cae entre 0 y 1. El valor mximo de n sera entonces: Al utilizar el mximo valor de, n aumenta ms de lo necesario para el nivel de confianza deseado, y por tanto aumenta tambin el nivel de confianza.
  • Diapositiva 63
  • Tamao de la muestra Ejemplo: Se estudia la efectividad de un nuevo medicamento en el tratamiento de cierta enfermedad. Se suministra el medicamento a 14 pacientes de los cuales 13 reaccionan positivamente. Dar el tamao de la muestra necesario para obtener una confianza del 99% de que el error de estimacin de p no exceder de 2 % (0.02) Solucin: Si suponemos que tenemos una buena estimacin previa de p:
  • Diapositiva 64
  • Tamao de la muestra Si lo hacemos sin considerar la estimacin previa de p, sino considerando el mximo: Como podemos apreciar es un tamao de muestra considerablemente superior al caso anterior.
  • Diapositiva 65
  • Ejercicios Ejercicio 6.1 Un fabricante de televisores est desarrollando un nuevo modelo de televisor en color, y para este fin se pueden utilizar dos tipos de esquemas transistorizados, cuyos tiempos de vida se suponen normalmente distribuidos. El fabricante selecciona una muestra de esquemas transistorizados del primer tipo de tamao 12, y otra del segundo tipo de tamao 11. Los datos muestrales respecto a la vida de cada esquema son los siguientes: Se pide: a) Construir un intervalo de confianza del 95% para la diferencia de vida media de cada tipo de esquema. b) Construir un intervalo de confianza del 90% para el cociente de varianzas de la vida de cada tipo de esquema.
  • Diapositiva 66
  • Ejercicios Ejercicio 6.2 Una agencia de alquiler de automviles necesita estimar el nmero medio de kilmetros diarios que realiza su flota de automviles; a tal fin, en varios das de la semana toma los recorridos de 100 vehculos de su flota y obtiene que la media muestral es de 165 Km/da, y la cuasidesviacin tpica muestral de 6 Km/da. Se pide: a) Bajo la hiptesis de normalidad de la caracterstica de estudio (n de km por da), construir un intervalo de confianza para la media de dicha distribucin a un nivel de confianza del 95%. b) Bajo la misma hiptesis de normalidad que en a), construir un intervalo de confianza del 90% para la varianza de dicha distribucin.
  • Diapositiva 67
  • Ejercicios Ejercicio 6.3 En un cruce de Melanogaster se han obtenido 60 moscas con alas vestigiales de un total de 300. Se pide: a) Encontrar un intervalo de confianza al 95% para la proporcin de moscas con alas vestigiales entre los individuos resultantes de un gran nmero de cruces como este. b) Qu nmero de cruces hay que realizar de modo que la proporcin de moscas con alas vestigiales entre los individuos resultantes de un gran nmero de cruces y la de la muestra difiera en valor absoluto en menos de 0.01 con una probabilidad del 95%?