3 3 Resumen IConfianza FMS 175

download 3 3 Resumen IConfianza FMS 175

of 11

Transcript of 3 3 Resumen IConfianza FMS 175

  • 8/18/2019 3 3 Resumen IConfianza FMS 175

    1/11

    Cecilia Larraín IC Página 1

    Estimación de parámetros

    Estimación puntual

    Los modelos probabilísticos como la distribución Normal, distribución

    Bernoulli, u otros representan simbólicamente a una población. Estos

    modelos están identificados por parámetros (constantes) que usualmente

    son desconocidos. El problema que se estudia es: como estimar los

    parámetros poblacionales a partir de la información que entrega la muestra.

    Lo natural es utilizar como estimadores algunas estadísticas ya estudiadas.

    Para estimar la proporción p de una población Bernoulli, es razonable

    utilizar el valor que en la muestra seleccionada presenta la estadística p .

    Ejemp lo de pro porción : Al probar una m.a. de 100 resistores que

    fabricó la compañía A se encuentran que 12 no cumplen con las

    especificaciones de tolerancia. La estimación puntual de la proporción real

    p de resistores que no cumplen con las especificaciones esˆ

    p = 0,12 Análogamente si X es una variable aleatoria de una población Normal con

    media µ y varianza σ 2 y ambos parámetros son desconocidos, entonces la

    media de la muestra x estima a la media poblacional µ y la varianza de la

    muestra 2n-1s estima a la varianza poblacional σ2.

    Las soluciones intuitivas mencionadas están respaldadas por ciertas

    propiedades que han sido demostradas en la teoría estadística (una delas propiedades importantes que debe cumplir un estimador puntual es

    insesgamiento)

    Las propiedades de los est imadores que vemos en este curso so n: Insesgamiento,

    Eficienc ia relativa (varianza men or) y Error cuadrático medi o.

  • 8/18/2019 3 3 Resumen IConfianza FMS 175

    2/11

    Cecilia Larraín IC Página 2

    Por otra parte, las estimaciones puntuales no toman en cuenta la

    variabilidad inherente al hecho de que cada estadística que se usa como

    estimador de un parámetro es una variable aleatoria y por lo tanto hay una

    dispersión inevitable que hay que incorporar a la estimación es decir, se ledebe dar calidad a la estimación indicando un intervalo que permita

    precisar la incertidumbre existente en la estimación.

    Estimación por intervalos

    Un intervalo de confianza para un parámetro con nivel o coeficiente de

    confianza 1 – α es una expresión del tipoK1 < parámetro < K 2

    donde los límites k 1 y k 2 dependen de la muestra y se calculan de

    manera de manera tal que si se construyen muchos intervalos, cada uno

    con distinta muestra de tamaño n, el 100(1 – α)% de ello s contendrán al

    verdadero valor del parámetro. Por ejemplo, un intervalo para la media de

    una población de nivel 0,95, tiene la propiedad de que el 95% de los

    intervalos construidos contienen el verdadero valor de la media.

    Fijado α (usualmente entre 0,01 y 0,10) los límites k 1 y k 2 se determinan a

    través de las distribuciones muestralesˆ

    g(θ,θ) vistas anteriormente de tal

    manera que:

    P(a <ˆ

    g(θ,θ) < b) = 1 – α

    se obtiene

    P(k 1 < θ < k 2) = 1 – α

    límite límite

    inferior superior

  • 8/18/2019 3 3 Resumen IConfianza FMS 175

    3/11

    Cecilia Larraín IC Página 3

    Intervalo de confianza para la media poblacional µ (IC(µ))

    (Población Normal, σ 2 varianza conocida)

    Sea (X 1, X2, …, Xn) una muestra aleatoria simple de la población con

    media µ y varianza σ 2 conocida.Ya sabemos que el estimador puntal es el promedio de la muestra x y

    n

    σμ-x

    Z es su distribución estandarizada N(0, 1). Por lo tanto, esta variable

    Z permite construir un intervalo de confianza. Se tiene

    1 / 2z valor de la normal estándar (percentil)

    1-α/2 1-α/2X -μP -z z = 1 - ασ n

    , se obtiene:

    1-α/2 1-α/2P -z · σ n X - μ z ·σ n = 1 - α

    1-α/2 1-α/2P X - z · σ n μ X + z ·σ n = 1 - α

    IC(µ) : 1-α/2x z ·σ n con (1- α)100% de confianza.

  • 8/18/2019 3 3 Resumen IConfianza FMS 175

    4/11

    Cecilia Larraín IC Página 4

    Ejemplo : Los siguientes datos corresponden al peso (X) en gramos de 10

    artículos seleccionados aleatoriamente:

    521, 742, 593, 635, 788, 717, 606, 639, 666, 624.

    Suponiendo que el peso se distribuye normal con σ = 80 grs., estimarcon 95% de confianza la magnitud media.

    1 – α = 0,95 α = 0,05 α/2 = 0,025 1 – α/2 = 0,975

    n

    1 / 2z

    Percentil 97,5 en Z

    x (media de la muestra)

    σ (Des. Estandar poblacional)

    10 1,96 653,1 80

    IC(µ) = 653,1 + 1,96 ·8010

    = 653,1 + 49,58

    IC(µ) = [603,52 ; 702,68] con 95% de confianza. (603,52 < µ < 702,68)

    La exactitud o precisión de la estimación por intervalo es 1-α/2z ·σ n

    también se llamados máximo error cometido en estimación ( e ).

    La expresión 1-α/2 1-α/2P -z · σ n X - μ z ·σ n = 1 - α

    1-α/2P |X - μ| z ·σ n = 1 - α

    indica que:

    El Error = 1-α/2|X - μ| es z ·σ n lo que significa que al emplear lamedia de la muestra x para estimar µ, el error que se comete es a lo más

    1-α/2z ·σ n .COMPLETE LA TABLAS SIGUIENTE

    Nivel de confianza1- α 1 / 2

    z 1-α/2z ·σ n IC(µ)

    0,90

    0,95 0,975z = 1,96 49,58 [603,52 ; 702,68]

    0,99

  • 8/18/2019 3 3 Resumen IConfianza FMS 175

    5/11

    Cecilia Larraín IC Página 5

    Determinación del tamaño mínimo de muestra (muestreo aleatorio simple)

    Tenemos e = 1-α/2z ·σ n se obtiene

    2α/2-1

    e·σz

    n

    Intervalos de confianzas más usuales

    Situación Parámetro EstimadorpuntualDistribución muestral

    Estadístico ICm.a. (n) de una

    poblaciónN(µ, σ 2) ;

    σ 2 conocido

    μ X nσ/

    μ-xZ N(0 , 1)

    n

    σ·zx α/2-1

    m.a.(n) de unapoblaciónN(µ, σ 2)

    σ 2 S2 (corregido)

    2

    2(n 1)S

    σ 2(n-1)

    es una distribución

    aproximada de S2

    (corregido)

    Asimetría positiva

    2 2

    2 2(n-1;1-α/2) (n-1;α/2)

    (n-1)s (n-1)s,

    m.a.(n) de unapoblaciónN(µ, σ 2) ;

    σ 2 desconocido

    μ X nS/

    μ-xT t(n - 1)

    Simétrica respecto a lamedia “0”

    (n-1;1- α/2)

    sx t ·

    n

    m.a. (n) de unapoblaciónBernoulli

    i 1 ; Éxito0 ;Fracasox =

    i = 1,2, .. ,n

    µ = p y

    σ 2 = pq

    p p n pq

    p- pˆ

    Z N(0 , 1)

    cuando n es grande nq

    ˆ

    ·z pˆ

    α/2-1

    Tamaño mínimo de muestra aleatoriasimple.Población Normal

    2α/2-1

    e·σz

    n

    Tamaño mínimo de muestra aleatoriasimple.Población Bernoulli

    2

    1-α/2z · pqne

  • 8/18/2019 3 3 Resumen IConfianza FMS 175

    6/11

    Cecilia Larraín IC Página 6

    Ap licaciones de IC

    1. La duración de un cierto componente sigue una distribución normal de mediaμ desconocida y desviación estándar σ = 100 horas. Se desea enviar unamuestra de dichos componentes al laboratorio para que realicen pruebas y

    estimen la duración media. Se quiere que la duración media muestral nodifiera de μ en más de 50 horas (e = 50), con una confianza de 1 – α = 0,95.Suponiendo válidos los supuestos necesarios:

    a) Hallar el tamaño de la muestra que para realizar la estimación.b) Se probaron los componentes (según 1.1) y se obtuvo una duración total

    n

    ii=1

    x = 15237 , estime con 95% de confianza la media real

    2. En un proyecto de construcción se midió la resistencia al esfuerzo cortante(X) de 50 probetas del terreno, observándose los siguientes totales:

    xi = 163.250,02

    ii x =543.656.250,0X = resistencia al esfuerzo cortante de una probeta

    n x (s)

    Suponiendo normalidad en la distribución de los datos (X~ N(µ ,σ 2 ) a) Estime 2 con 95% de confianza.b) Estime con 95% de confianza la resistencia media real.

    3. Al probar un a m.a. de 100 resistores que fabricó la compañía A seencuentran que 12 no cumplen con las especificaciones de tolerancia.a) Determinar un intervalo de confianza de 95% para la proporción verdadera

    de resistores que no cumplen con las especificaciones de tolerancia.

    i1 ; el resistor con las especificaciones

    x =0 ;el resistor cumple con las especificac

    no cumion

    plees

    p ˆ

    q 1-α/2z IC(p)

    b) Se desea estimar la proporción verdadera que no cumple con lasespecificaciones de tolerancia, con una amplitud de 0,08 (amplitud = 2e) yun coeficiente de confianza de 0.95. ¿Cuántos resistores se debenseleccionar? (utilice los datos de (3.a) como muestra piloto)

    4. Se estimó la varianza de las horas de trabajo por semana de todos losingenieros que trabajan en una fábrica, para ello se utilizó una m.a. de 21ingenieros y la estimación fue:

  • 8/18/2019 3 3 Resumen IConfianza FMS 175

    7/11

    Cecilia Larraín IC Página 7

    s = 7 horas, IC( 2σ ) = [31.20 , 90.32].Determine el nivel de confianza utilizado.

    5. Los valores sobre las longitudes en micras de 30 filamentos de la producciónde una máquina son los siguientes:

    102 98 93 100 98 105115 130 100 86 95 103116 118 89 102 128 99112 114 106 114 100 116120 106 110 100 106 117

    Suponiendo normalidad en la distribución de los datos

    a) Determine IC( 2 ). 1 - = 0.90.b) Estimar la longitud media de los filamentos de la producción con un 90% de

    confianza. ¿ = 100? Justifique.c) Estime la proporción de filamentos con longitud inferior a 100 micras .

    6. Una máquina produce las varillas de metal utilizadas en el sistema desuspensión de un automóvil. Se toma una muestra aleatoria de n = 15 varillasy se mide el diámetro y se obtiene la siguiente información:

    X = Diámetro en mm. de la varilla.

    x i = 123,51 2ii

    x = 1016,9903 x = s=

    IC( ) = [8,2200 ; 8,2480]

    Suponiendo válidos los supuestos necesarios:Determin e el nivel de co nfianza que se uti l izó para la estim ación d eldiám etro pro m edio de la varilla.

    7. La siguiente tabla corresponde a los resultados de una escala deresponsabilidad que fue aplicada a una muestra aleatoria de 115profesionales chilenos.

    Puntaje x i n i

    10 - 2020 - 3030 - 4040 - 5050 - 6060 - 7070 – 8080 - 90

    21215232818116

    > puntaje → mayor responsabilidad

    a) Estime μ con 95% de confianza .t0,975;114 gl = 1,981

    b) Se sabe que en Estados Unidos la media en esta

    escala es de 50 puntos. Compruebe si nuestrapoblación coincide con la norteamericana. = 0.05.c) Si se clasifica como "muy responsable" a toda

    persona con más de 60 puntos. Estime la proporciónde profesionales muy responsable con en la poblaciónchilena. 1 – α = 0,96

  • 8/18/2019 3 3 Resumen IConfianza FMS 175

    8/11

    Cecilia Larraín IC Página 8

    8. Los siguientes datos representan la resistencia a la explosión en psi de unamuestra de 100 botellas para bebidas gaseosas, no retornables, 2 un l, estasobservaciones se obtuvieron probando cada botella hasta que ocurriera lafalla

    265 197 346 280 265 200 221 265 261 278205 286 317 242 254 235 176 262 248 250263 274 242 260 281 246 248 271 260 265307 243 258 321 294 328 263 245 274 270220 231 276 228 223 296 231 301 337 298268 267 300 250 260 276 334 280 250 257260 281 208 299 308 264 280 274 278 210234 265 187 258 235 269 265 253 254 280299 214 264 267 283 235 272 287 274 269215 318 271 293 277 290 283 258 275 251

    R e s

    i s t e n c i a

    ( p s

    i )

    350

    300

    250

    200

    150

    337

    334

    176

    187

    346

    197

  • 8/18/2019 3 3 Resumen IConfianza FMS 175

    9/11

    Cecilia Larraín IC Página 9

    Suponiendo válidos los supuestos necesarios:Estime con 95% de confianza:

    i) la resistencia media a la explosión.ii) La proporción de valores atípicos

    9. Una conocida fábrica de muebles desea conocer la resistencia de las repisasde los modelos de estanterías que vende. Para ello, realizaron unexperimento que consistió en tomar 25 repisas e ir añadiendo peso en ellashas que se rompieran, anotando el peso que han soportado (en kg). Seobtuvo el siguiente resumen estadístico con los datos recogidos:

    X = peso máximo soportado por la respisan promedio Desv.

    estándar25 35,7 kg 4,2 kg

    Suponiendo normalidad en la distribución de los datos:a) Estime con 95% de confianza el peso promedio real. ¿Aconsejaría a la

    fábrica de muebles que en las especificaciones de la estantería pusieranque la carga máxima que soporta la repisa es de 38 kg?. Justifique surespuesta.

    b) Estime la varianza de la variable de interés. 1- α = 0,95

  • 8/18/2019 3 3 Resumen IConfianza FMS 175

    10/11

  • 8/18/2019 3 3 Resumen IConfianza FMS 175

    11/11

    Cecilia Larraín IC Página 11

    Taller d e estimaciónProblem a 1La siguiente información corresponde a resistencia a la flexión, en PMa, de unamuestra aleatoria de 30 vigas de concreto provenientes de la fábrica A.

    7,9 7,1 7,8 4,1 12,4 11,9 11,0 6,3 10,9 7,35,9 5,1 7,7 8,0 10,2 4,2 6,5 7,2 6,9 8,7

    9,0 4,8 11,2 10,7 13,2 7,5 8,3 7,7 8,1 7,7

    a. Estime con 95% de confianza la varianza de la resistencia a la flexiónb. Estime con 95% de confianza la resistencia media a la flexiónc. Estricta normas de seguridad exigen que la resistencia a la flexión de la viga debe

    ser entre 6 y 12 PMa, estime con 90% de confianza la proporción de vigas quecumplen con la norma de seguridad.

    Problem a 2En la fabricación de semiconductores, a menudo se utiliza una sustancia química paraquitar el silicio de la parte trasera de las obleas antes de la metalización. En esteproceso es importante la rapidez con la que actúa la sustancia. Se han comparado dossoluciones químicas, utilizando para ello dos muestras aleatorias de 10 obleas paracada solución. La rapidez de acción en segundos observada es la siguiente

    Prom sSolución 1 9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1 9,97 10,40 Solución 2 10,2 10,6 10,7 10,4 10,5 10,0 10,2 10,7 10,4 10,3 0,42177 0,23094

    (a) Estime con 90% de confianza la rapidez de acción promedio de cada solución eindique cual estimación es más precisa.

    (b) Determine el intervalo de confianza para la verdadera varianza de la solución 1.1- α = 0,90.

    (c) Si se desea estimar la rapidez promedio de acción de la solución 1 con 95% deconfianza, un error máximo de estimación de 0,2 segundos ¿Qué tamaño demuestra sería adecuado tomar, si se asume los datos de la tabla 1 como muestrapiloto?

    Problem a 3Para conocer la distribución de la duración (X) de cierto tipo de baterías para tractores,en faenas agrícolas, se selecciona una muestra aleatoria de 36 baterías para tractores

    que fueron utilizadas en este tipo de faenas, las duraciones se presentan acontinuación:

    Duración(meses) 24 - 28 28 - 32 32 - 36 36 - 40 40 -44 44 - 48

    n i 4 5 10 4 4 9

    Estime, con 95% de confianza, la proporción de baterías para tractores que tienenduración entre 2,5 y 3,2 años.