tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

download tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

of 113

Transcript of tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    1/113

    Unidad 5

    EL TEOREMA DEL LÍMITE CENTRAL

    5.1 Estadígrafos como estimadores de ar!metroso"#aciona#es

    Estadígrafos $ Estadísticos

    En este capítulo se tratarán funciones de las variables X 1 , X 2 , ... , X n observadas en una

    muestra aleatoria seleccionada de una población bajo estudio. Las variables sonindependientes y tienen una distribución común. Con mucha frecuencia se utilizanciertas funciones de v.a. observadas en una muestra para estimar o tomar decisiones conrespecto de parámetros poblacionales desconocidos. Por ejemplo supon!amos "ue se

    desea estimar la media de una población . #i obtenemos una muestra aleatoria de n

    observaciones  x1 , x2 , ... , xn resulta adecuado estimar a trav$s de la media de lamuestra%

    La bondad de la estimación del comportamiento de las v.a. X 1 , X 2 , ... , X n y el efecto de

    este comportamiento sobre . &ótese "ue la v.a. es unafunción de 'solamente( las v.a. X 1 , X 2 , ... , X n y el tama)o 'constante( n de la muestra.

    Por lo tanto la v.a. representa un estadí!rafo ó estadístico.

    *na definición más formal sería% +*n estadístico 'estadí!rafo( es una función de lasvariables "ue se pueden observar en una muestra y de las constantes conocidas. Los

    estadísticos se utilizan para hacer inferencias 'estimaciones o decisiones( con respecto a parámetros poblacionales desconocidos,.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    2/113

    Como el estadístico es una función de variables aleatorias observadas en una muestraaleatoria un estadístico en sí es una variable aleatoria.

    Por lo anteriormente e-puesto deduciremos su distribución de probabilidad la cual la

    llamamos Distribución Muestral  del estadístico.

    ebe "uedar claro "ue la forma de distribución muestral teórica de un estadísticodependerá de la distribución de las variables aleatorias observadas en la muestra.

    5.% M&estreo A#eatorio 'im#eLa teoría del muestreo tiene por objetivo el estudio de las relaciones e-istentes entre ladistribución de un carácter en dicha población y las distribuciones de dicho carácter entodas sus muestras.

    Las ventajas de estudiar una población a partir de sus muestras son principalmente%

    Coste red&cido( #i los datos "ue buscamos los podemos obtener a partir de una pe"ue)a parte deltotal de la población los !astos de reco!ida y tratamiento de los datos seránmenores. Por ejemplo cuando se realizan encuestas previas a una elección esmás barato pre!untar a /.000 personas su intención de voto "ue a 10.000.0002Ma)or raide*( Estamos acostumbrados a ver cómo con los resultados del escrutinio de las

     primeras mesas electorales se obtiene una apro-imación bastante buena delresultado final de unas elecciones muchas horas antes de "ue el recuento finalde votos haya finalizado2M!s osi"i#idades( Para hacer cierto tipo de estudios por ejemplo el de duración de cierto tipo de

     bombillas no es posible en la práctica destruirlas todas para conocer su vida

    media ya "ue no "uedaría nada "ue vender. Es mejor destruir sólo una pe"ue)a parte de ellas y sacar conclusiones sobre las demás.

    e este modo se ve "ue al hacer estadística inferencial debemos enfrentarnos con dos problemas%

      Elección de la muestra (muestreo) "ue es a lo "ue nos dedicaremos en estecapítulo.

      E-trapolación de las conclusiones obtenidas sobre la muestra al resto de la población (inferencia).

    El tipo de muestreo más importante es el muestreo aleatorio en el "ue todos loselementos de la población tienen la misma probabilidad de ser e-traídos.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    3/113

    M&estreo a#eatorio

    Consideremos una población finita de la "ue deseamos e-traer una muestra. Cuando el proceso de e-tracción es tal "ue !arantiza a cada uno de los elementos de la población la

    misma oportunidad de ser incluidos en dicha muestra denominamos al proceso deselección muestreo aleatorio.

    El muestreo aleatorio se puede plantear bajo dos puntos de vista%#in reposición de los elementos2Con reposición.

    M&estreo a#eatorio sin reosici$nConsideremos una población E  formada por N  elementos. #i observamos un elemento

     particular en un muestreo aleatorio sin reposición se da la si!uiente

    circunstancia%

    La probabilidad de "ue e sea ele!ido en primer lu!ar es 2

    #i no ha sido ele!ido en primer lu!ar 'lo "ue ocurre con una probabilidad de ( la

     probabilidad de "ue sea ele!ido en el se!undo intento es de . en el 'i34(5$simointento la población consta de N 5i elementos con lo cual si e no ha sido seleccionado

     previamente la probabilidad de "ue lo sea en este momento es de .

    #i consideramos una muestra de elementos donde el orden en la elección de losmismos tiene importancia la probabilidad de elección de una muestra

    cual"uiera es

    lo "ue corresponde en el sentido de la definición de probabilidad de Laplace a un caso posible entre las   N n posibles n5uplas de N  elementos de la población.#i el orden no inter!iene la probabilidad de "ue una muestra

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    4/113

    sea ele!ida es la suma de las probabilidades de ele!ir una cual"uiera de sus n5uplastantas veces como permutaciones en el orden de sus elementos sea posible es decir

    M&estreo a#eatorio con reosici$n#obre una población E  de tama)o N  podemos realizar e-tracciones de n elementos perode modo "ue cada vez el elemento e-traído es repuesto al total de la población. e estaforma un elemento puede ser e-traído varias veces. #i el orden en la e-tracción de lamuestra interviene la probabilidad de una cual"uiera de ellas formada por n elementoses%

    #i el orden no interviene la probabilidad de una muestra cual"uiera será la suma de laanterior repiti$ndola tantas veces como manera de combinar sus elementos sea posible.

    Es decirsea n4 el número de veces "ue se repite cierto elemento e4 en la muestra2sea n6 el número de veces "ue se repite cierto elemento e62

    sea n"  el número de veces "ue se repite cierto elemento e" 

    de modo "ue . Entonces la probabilidad de obtener la muestra

    es

    es decir

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    5/113

    M&estreo a#eatorio 'im#e

    El 7uestreo 8leatorio #imple es a"uel en "ue cada uno de los elementos de la población tiene la misma probabilidad de ser ele!ido y en las "ue la selección de unnuevo elemento no afecta las probabilidades de elección de cual"uier otro elemento. e

    forma más !eneral se puede considerar "ue una muestra aleatoria simple es a"uella enla "ue todas las posibles muestras e-traídas tienen la misma probabilidad de ser ele!idas.

    8demás todos las observaciones de la v.a. son independientes es decir

    5.+ E# teorema de# Límite Centra#

    #i se saca una muestra de una población "ue es normal tiene una distribuciónmuestral "ue es &ormal. 9Pero "ue podemos decir de la distribución de si los X i   noestán distribuidos normalmente:.

    El Teorema de# Límite Centra#  nos mostrará "ue tendrá una distribuciónapro-imadamente normal si el tama)o de la muestra es !rande.

    7atemáticamente lo podemos definir de la si!uiente manera%

    #ean X 1 ,X 2 , ... ,X n variables aleatorias independientes e id$nticamente distribuidas con

    E' X i( ; y ' ? n (

    en donde

    entonces la función de distribución # n conver!e a una función de distribución normalestándar cuando n@A.

    E-em#o

    Los tiempos de espera para los clientes "ue pasan por una caja re!istradora a la salida deuna tienda de menudeo son variables aleatorias independientes con una media de 4.Bminutos y una varianza de 4.0. 8pro-ime la probabilidad de "ue se pueda atender a 400

    clientes en menos de 6 horas.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    6/113

    'o#&ci$n

    #i X i denota el tiempo de espera para el i$%simo cliente entonces se desea calcular  

    P '  X i  460 ( ; P ' 460?400(; P ' 4.60(

    8sí la probabilidad de "ue se pueda atender a 400 clientes en menos de 6 horas esapro-imadamente 0.0041. Esta pe"ue)a probabilidad indica "ue es prácticamente

    imposible despachar a 400 clientes en menos de 6 horas.Desumiendo el eorema del Límite Central establece "ue cuando el tama)o de lamuestra se incrementa la distribución de muestreo de la media  'así como de otrasestadísticas muestrales( se apro-ima en cuanto a su forma a la distribución normalindependientemente de la distribución de la población de la que fue tomada la

    muestra.

    Para efectos prácticos puede suponerse "ue la distribución de muestreo de la mediatiene una distribución apro-imadamente normal incluso en las poblaciones o procesosmenos normales siempre "ue el tama)o de la muestra sea n 10.

    E-em#o

    *n auditor toma una muestra aleatoria de tama)o n ;1F de una población de 4000cuentas por cobrar. El valor medio de las cuentas por cobrar para la población es ;G6F0.00 con la desviación estándar de la población ; G/B.00. 9Cuál es la probabilidadde"ue la media muestral sea inferior a G6B0.00:

    'o#&ci$n

    ig&ra( En la fi!ura aparece la curva de probabilidad. La distribución de muestreoes descrita por la media y el error estándar.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    7/113

    E' ( ; ; 6F0.00 'como se estableció(H  ; ' H ?>n ( ; ' /B.0 ? >1F ( ; ' /B.0 ? F ( ; I.B0

    Por lo tanto

    P' = 6B0.0 J ; 6F0.0 H  ; I.B0 ( ; P' z = 54.11 (P' z = 54.11 ( ; 0.0K4 'valor tabulado(.

    5./ Le) de #os grandes n0meros

    Conver!encia en Probabilidad

    Decordemos "ue si M es una v.a. continua y  X 1 ,X 2 , ... , X n son v.a. independientes eid$nticamente distribuidas "ue tienen la misma probabilidad "ue M.

    ;N O ; Mi tiene

    y ; E y Q ; E Mi Q ; n

    z ; Mi ? n ;

    E z Q ;

    es una v.a.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    8/113

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    9/113

    y la desviación estándar 

    Por lo tanto

    - ; ' 1 3 6 3 4 3 / ( ? / ; 6.B errores

    H- ; 4.46 errores ' aplicando la fórmula anterior(

    #i se promediara la totalidad de las 4F medias muestrales obtenidas de las 4F posiblesmuestras '&n  ; /6 ; 4F( si se realizara muestreo con reposición la media de estos

    valores ' ( sería i!ual a 6.B "ue es la media de la población  x .

    Por otra parte si el muestreo se hubiera realizado sin reposición debería haber seismuestras posibles de dos mecanó!rafas%

     &X ? nX ' & Y n (X Q ; /X ? 6X Z 6X Q ; F

    8 continuación se presentan las posibles muestras

    4. otal 4F muestras de n ;6 y & ;/ muestreo con reposición

    7uestra 7ecanó!raf a

    Desultados dela muestra

    7ediamuestral i

    4 8 8 11 16 8 W 16 6.B1 8 C 14 6/ 8 1/ 1.BB W 8 61 6.BF W W 66 6

    I W C 64 4.B W 6/ 1K C 8 41 640 C W 46 4.B44 C C 44 446 C 4/ 6.B41 8 /1 1.B4/ W /6 14B C /4 6.B

    4F // /

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    10/113

    ;6.B;  x 6. otal F muestras posibles de n ;6 & ;/ muestreo sin reposición

    7uestra 7ecanó!raf a

    Desultados dela muestra

    7ediamuestral i

    4 C 4/ 6.B6 8 W 16 6.B1 8 C 14 6/ 8 1/ 1.BB W C 64 4.BF W 6/ 1

    ;6.B;  x 

    En este pe"ue)o ejemplo aun"ue se puede observar !ran fluctuación en la mediamuestral dependiendo de las mecanó!rafas "ue se seleccionaron no hay tantafluctuación como en la población real en sí. El hecho de "ue las medias muestrales seanmenos variables "ue los datos de población se deriva directamente de la Ley de losGrandes Números.

    5.5 Distri"&ciones m&estra#es "asados en norma#idad

    #e ha mencionado "ue muchos fenómenos observados en la realidad tienendistribuciones de frecuencias relativas "ue se pueden representar en forma adecuadamediante el modelo de una distribución de probabilidad normal. Es por esto "ue se

    establece la distribución muestral del estadístico

    #ea una muestra aleatoria de tama)o n de una distribución normal conmedia y varianza . entonces

    iene una distribución normal con media y varianza ? n es decir 

    ig&ra(  [unción de densidad de una v.a.  con respecto a una v.a.  X   "ue tiene

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    11/113

    función de densidad de probabilidad &ormal Estándar.

    E-em#o

    *na má"uina embotelladora puede re!ularse de tal manera "ue llene un promedio deonzas por botella. #e ha observado "ue la cantidad de contenido "ue suministra lamá"uina presenta una distribución normal con H ; 4.0 onza. e la producción de lamá"uina cierto día se obtiene una muestra aleatoria de n ; K botellas llenas 'todasfueron llenadas con las mismas posiciones de control operativo( y se miden las onzas

    del contenido de cada una. eterminar la probabilidad de la media real para tales posiciones del control.'o#&ci$n

    #i  X 1 , X 2 , ... , X &  representan las onzas de contenido a observarse se deduce "ue M i

     presenta una distribución normal con una media y una varianza ;4 para i ; 4

    6 ... K. por tanto tiene una distribución normal con media y  X  ; ?n ; 4?K.#e desea calcular 

     P ' J 5 J 0.1 ( ; P ' 50.1 ' 5 ( 0.1 (

    ya "ue ' 5 ( ? 'H ? >n ( representa una distribución normal estándar. 8plicando losvalores tabulados se tiene

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    12/113

    P ' 5 0.K R 0.K ( ; 4 Y 6 P' R N 0.K(; 4 Y 6 '0.4/4(; 0.F14

    Por tanto la probabilidad es solo de 0.F1 de "ue la media muestral diste a lo más en 0.1de onza de la población real.

    Distri"&ci$n 2i 3 C&adrado 4

    #ean una muestra aleatoria de tama)o n de una distribución normal

    con media y varianza . Entonces ' i ; ' X i 5 ( ? H son v.a. normales estándar eindependientes i ; 4 6 ...n y la suma de los cuadrados de variables aleatoriasnormales estándares e independientes tiene una distribución \i5cuadrado con n !rados de

    libertad.

    Wajo las condiciones anteriormente e-puestas para cuestiones más prácticas se sueletrabajar con la si!uiente fórmula%

    6 4 n 3 1  S 2 /

    E-em#o

    Continuando con el ejemplo anterior se supone "ue las onzas del contenido "ue vacía lamá"uina embotelladora tiene una distribución normal con ;4. #upón!ase "ue sedesea obtener una muestra aleatoria de 40 botellas y medir el contenido en cada botella.#i se utilizan estas 40 observaciones para calcular  S 2 podría ser útil especificar unintervalo de valores "ue incluyeran a  S 2  con una alta probabilidad. Encuentre losnúmeros b4 y b6 tales "ue

    P' b4   S 2  b6( ; 0.K0

    'o#&ci$n

    Oa "ue ; 4 en consecuencia 'n Y 4(  S 2 ? ; 'n Y 4(  S 2 tiene una distribucióncon 'n Y 4( !rados de libertad. Por tanto utilizando los valores tabulados de esta función

     podemos encontrar dos números a4 y a6 tales "ue

    P' a4  'n Y 4( S 2  a6( ; 0.K0

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    13/113

    *n m$todo para hacerlo es encontrar el valor a6 "ue limita un área de 0.0B de la coladerecha y un valor a4 "ue limita un área de 0.0B de la cola iz"uierda '0.KB de área a laderecha(. Oa "ue hay K !rados de libertad la tabla nos da a6 ; 4F.K4K y a4 ; 1.16B.

    8sí debemos tener 

    a4 ; 'n Y 4(b4 ? ; 'n Y 4(b4 ; K b4a6 ; 'n Y 4(b6 ? ; 'n Y 4(b6 ; K b6

     o sea

     b4 ; 1.16B ? K; 0.1FK y b6 ; 4F.K4K ? K ; 4.0

    de donde se deduce "ue si se desea tener un intervalo "ue incluya a  S 2  con una probabilidad de 0.K0 uno de tales intervalos es ' 0.1FK 4.0(. ]bs$rvese "ue esteintervalo es bastante !rande.

    Distri"&ci$n t de 't&dent 

    La distribución 5#tudent se construye como un cociente entre una normal y la raíz de

    una independientes. e modo preciso llamamos distribución t 5#tudent con n !rados

    de libertad a la de una v.a.  

    donde . Este tipo de distribuciones aparece cuando tenemos n34v.a. independientes

    y nos interesa la distribución de

    La función de densidad de es

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    14/113

      ig&ra(  [unción de densidad de una de#tudent

    La distribución de #tudent tiene propiedades parecidas a %

    Es de media cero y sim$trica con respecto a la misma2Es al!o más dispersa "ue la normal pero la varianza decrece hasta 4 cuando el númerode !rados de libertad aumenta2

    ig&ra(  Comparación entre las funciones

    de densidad de y .

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    15/113

    Para un número alto de !rados de libertad se puede apro-imar la distribución de #tudent por la normal es decir

    ig&ra(  Cuando aumentan los !rados delibertad la distribución de #tudent seapro-ima a la distribución normalestandarizada.

    Para calcular

    en lu!ar de considerar una primitiva de esa función y determinar la inte!ral definida

     buscaremos el resultado apro-imado en una tabla de la distribución . 

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    16/113

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    17/113

    Es claro "ue la distribución de #nedecor no es sim$trica pues sólo tienen densidad de probabilidad distinta de cero los punto de . ]tra propiedad interesante de ladistribución de #nedecor es%

    5.7 eneraci$n de N0meros 'e&do A#eatorios

    E-isten varios m$todos para la !eneración de números seudo aleatorios el más utilizadoes el 7$todo de 7ontecarlo tambi$n llamado 7$todo de la ransformada ^nversa elcual lo analizaremos a continuación.

    M8todo de Montecar#o

    El m8todo de Montecar#o es una t$cnica para obtener muestras aleatorias simples deuna v.a.  X  de la "ue conocemos su ley de probabilidad 'a partir de su función dedistribución   (. Con este m$todo el modo de ele!ir aleatoriamente un valor de  X si!uiendo usando su ley de probabilidad es%

    4. *sando una tabla de números aleatorios se toma un valor u  de una v.a.

    .6. #i X  es continua tomar como obser!ación  de  X  la cantidad x;  54'u(. En elcaso en "ue X  sea discreta se toma x como el percentil de X  es decir el

    valor más pe"ue)o "ue verifica "ue .

    Este proceso se debe repetir n veces para obtener una muestra de tama)o n.

    E-em#o

    #i "ueremos e-traer n ;40 muestras de una distribución podemos recurrir a unatabla de números aleatorios de " ;B cifras en las "ue observamos las cantidades 'por ejemplo(

    8 partir de ellas podemos obtener una muestra de usando una tabla de la

    distribución normal%

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    18/113

     &úmeros aleatorios 7uestra 7uestra

    t i  xi ;  54'ui(

    IF.6K1 0.IF 0.I414.IIF 0.16';450.F( 50./I

    B0.01 0.B4 0.01

    I4.4B1 0.I4 0.BB

    60.6I4 0.60';450.0( 50./

    11.I4I 0.1/';450.FF( 50./4

    4I.KIK 0.4';450.6( 50.K6

    B6.46B 0.B6 0.0B/4.110 0./4';450.BK( 50.61

    KB.4/4 0.KB 4.FB

    ]bs$rvese "ue como era de esperar las observaciones  xi tienden a a!ruparse alrededor 

    de la esperanza matemática de . Por otra parte esto no implica"ue el valor medio de la muestra sea necesariamente . #in embar!o sabemos "ue

    su dispersión con respecto al valor central es pe"ue)a lo "ue implica "ue probablemente el valor medio estará muy pró-imo a 0 como se puede calcular%

    ]bs$rvese "ue si el problema fuese el inverso donde únicamente conoci$semos lasobservaciones  xi  y "ue el mecanismo "ue !eneró esos datos hubiese sido unadistribución normal de parámetros desconocidos con obtenida hubi$semos tenido una

     buena apro-imación del **par+metro desconocido   .

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    19/113

    Unidad 7

    E'TIMACI9N :UNTUAL ; DE INTER

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    20/113

    Para muestras aleatorias de tama)o n;1

    un posible estimador del parámetro es

    #i al realizar un muestreo aleatorio simple obtenemos

    ^ntuitivamente las características "ue serían deseables para esta nueva variable aleatoria'"ue usaremos para estimar el parámetro desconocido( deben ser%

    Consistencia Cuando el tama)o de la muestra crece arbitrariamente el valor estimado se apro-ima al

     parámetro desconocido.

    El estimador n es un estimador consistente de si para cual"uier número positivo VLímn@A  P ' J n 5 J V ( ; 4

    _ su forma e"uivalente

    Límn@A  P ' J n 5 J N V ( ; 0

    La notación n  se utiliza por el hecho de e-presar "ue el estimador de se calculamediante una muestra de tama)o n. Por ejemplo 2  es el promedio de dosobservaciones mientras "ue !"" es el promedio de las 400 observaciones contenidasen una muestra de tama)o n ; 400.

    Insesgado 4Carencia de sesgoEl valor medio "ue se obtiene de la estimación para diferentes muestras debe ser elvalor del parámetro.

    #e dice "ue un estimador de un parámetro es insesgado si%

    Eficiencia

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    21/113

    8l estimador al ser v.a. no puede e-i!írsele "ue para una muestra cual"uiera se obten!acomo estimación el valor e-acto del parámetro. #in embar!o podemos pedirle "ue sudispersión con respecto al valor central 'varianza( sea tan pe"ue)a como sea posible.

    #ea es el estimador del parámetro de la población M la cual tiene función de

    densidad de probabilidad f(x),

    #i

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    22/113

     para todos los posibles valores del parámetro . El estimador má-imo

    verosímil del parámetro buscado esa"uel "ue ma-imiza su función de

    verosimilitud .

    Como es lo mismo ma-imizar una función "ue su lo!aritmo 'al ser este una funciónestrictamente creciente( este má-imo puede calcularse derivando con respecto a lafunción de verosimilitud ' bien su lo!aritmo( y tomando como estimador má-imoverosímil al "ue ha!a la derivada nula%

    e modo más preciso se define el estimador m!>imo ?erosími# como la v.a.

    Los estimadores de má-ima verosimilitud tienen ciertas propiedades en !eneral "ue acontinuación enunciamos%

    4. #on consistentes2

    6. #on invariantes frente a transformaciones biunívocas es decir si es el estimador 

    má-imo verosímil de y es una función biunívoca de entonces es el

    estimador má-imo verosímil de .

    1. #i es un estimador suficiente de su estimador má-imo verosímil es funciónde la muestra a trav$s de 2

    /. #on asintóticamente normales2

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    23/113

    B. #on asintóticamente eficientes es decir entre todos los estimadores consistentes deun parámetro los de má-ima verosimilitud son los de varianza mínima.

    F. &o siempre son inses!ados.

    Es decir la t$cnica llamada m$todo de m#xima posibilidad ó erosimilitud  seleccionacomo estimaciones a"uellos valores de los parámetros "ue ma-imizan la verosimilitud'función de probabilidad conjunta o la función de densidad conjunta( de la muestraobservada.

    E-em#o

    #ea -4-6 ... -n una muestra aleatoria de observaciones de una distribución uniformecon función de densidad de probabilidad  f(x) - 1 , / 0 x  0   i ; 4 6 ... n.etermine el estimador de má-ima verosimilitud de .

    En este caso la verosimilitud está dado por

      - f(x1 ,x2 , ... ,xn ) - f(x1 ) f(x2 ) ... f(xn )  - (1 )(1 ) ... (1 )  - (1 n )

     &ótese "ue    es una función monótona decreciente de y por lo tanto d d   no sehará i!ual a cero para nin!ún valor del intervalo 0 = = A. #in embar!o   crececuando decrece y "ue debe ser i!ual o mayor "ue el má-imo valor observado en elconjunto . Por lo tanto el valor de "ue ma-imiza   es la mayor observación en lamuestra. Es decir "ue

    ; M'n( ; má- 'M4 ... Mn(.

    A#g&nos estimadores f&ndamenta#es

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    24/113

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    25/113

    Es decir el estimador má-imo verosímil de la media poblacional coincide con lamedia muestral

    como "ueríamos demostrar% 

    ig&ra(  El estimador de má-ima verosimilitud de para una variable aleatoria &ormal es la mediamuestral.

     ig&ra(  La distribución del estimador 

    muestral del parámetro poblacional

    tiene por valor esperado al mismo'inses!ado( y su dispersión disminuye amedida "ue aumenta el número deobservaciones

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    26/113

    Estimador de #a ?arian*a

    8 la hora de ele!ir un estimador de podemos comenzar con elestimador más natural%

    Podemos comprobar "ue cuando el carácter "ue se estudia sobre la población es &ormal en realidad este es el estimador má-imo verosímil para la varianza. #inembar!o se comprueba tambi$n su falta de ses!o lo "ue hace mas adecuado "ue seutilice como estimador de la varianza al si!uiente concepto% cuasi arian$a muestral  

    Proposición%

    emostración% Decuperamos el lo!aritmo de la función de verosimilitud escrita en larelación anterior donde en esta ocasión el primer parámetro ya fue obtenido por elm$todo de má-ima verosimilitud 'y vimos "ue era la media muestral( y tratamos dema-imizarla con respecto al se!undo parámetro%

    erivando con respecto a e i!ualando a 0se obtiene el estimador má-imo verosímil%

    espejando de esta ecuación se obtiene "ue el estimador má-imo verosímil coincidecon la varianza muestral

    Proposición% El valor esperado del estimador

    no es y por tanto el estimador má-imo verosímil para la varianza no es inses!ado.

    7ás aún

    emostración

    Comenzamos escribiendo

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    27/113

    Por otro lado

    Lue!o

    C&asi?arian*a m&estra#

    Para tener un estimador inses!ado de la varianza introducimos la c&asi?arian*am&estra#  "ue se define como

    Es inmediato comprobar "ue realmente este estimador es inses!ado

    Esa esperanza puede ser calculada de un modo más directo ya "ue la distribución delestimador es conocida%

     

    lue!o

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    28/113

    Es consecuencia de las relaciones anteriores "ue la distribución de la cuasivarianzamuestral es tal "ue

    ig&ra(  [unción de densidad delestadístico "ue relaciona y los!rados de libertad de la muestra 'n54(. Lafalta de simetría del mismo hace "ue suvalor esperado 'n54( se desplace a laderecha de la moda 'asimetría positiva(.

    F.6 ^ntervalos de Confianza para proporciones medias varianzasy cocientes de varianzas.

    ^ntervalo para una proporción

    #ean . #i "ueremos estimar el parámetro  p la manera másnatural de hacerlo consiste en definir la suma de estas lo "ue nos proporciona unadistribución Winomial%

    y tomar como estimador suyo a la v.a.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    29/113

    Es decir tomamos como estimación de p  la proporción de $-itos obtenidos en las n

     pruebas .

    La distribución del número de $-itos es binomial y puede ser apro-imada a la normalcuando el tama)o de la muestra n es !rande y p no es una cantidad muy cercana a ceroo uno%

    El estimador no es más "ue un cambio de escala de X  por tanto

    Esta e-presión presenta dificultades para el cálculo siendo más cómodo sustituirla por la si!uiente apro-imación%

    Para encontrar el intervalo de confianza al nivel de si!nificación para p se considera

    el intervalo "ue hace "ue la distribución de deje la probabilidad fuera

    del mismo. Es decir se considera el intervalo cuyos e-tremos son los cuantiles y

    . 8sí se puede afirmar con una confianza de "ue%

    Esto se resume en la si!uiente e-presión%

    con una confianza de

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    30/113

    ig&ra(  ^ntervalo de confianza para una proporción.

    E-em#o

    #e "uiere estimar el resultado de un refer$ndum mediante un sondeo. Para ello serealiza un muestreo aleatorio simple con n;400 personas y se obtienen 1B` "ue votarána favor y FB` "ue votarán en contra 'suponemos "ue no hay indecisos para simplificar el problema(. Con un nivel de si!nificación del B` calcule un intervalo de confianza

     para el verdadero resultado de las elecciones.

    'o#&ci$n( 

    ada una persona cual"uiera 'i( de la población el resultado de su voto es una variableWernulli%

    El parámetro a estimar en un intervalo de confianza con es  p y tenemossobre una muestra de tama)o n ;400 la si!uiente estimación puntual de p%

    #abemos "ue

    En la práctica el error "ue se comete no es muy !rande si tomamos al!o más simplecomo

    8sí el intervalo de confianza buscado lo calculamos como se indica%

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    31/113

    Por tanto tenemos con esa muestra un error apro-imado de K1 puntos al nivel deconfianza del KB`.

    En la si!uiente [i!ura podemos observar !ráficamente la interpretación del cálculorealizado.

    ig&ra( De!ión a partir de la cual se realizauna estimación confidencial para una

     proporción con una confianza del KB`.

    ^ntervalo para la media si se conoce la varianza

    Este caso "ue planteamos es más a nivel teórico "ue práctico% difícilmente vamos a

     poder conocer con e-actitud mientras "ue es desconocido. #in embar!o nosapro-ima del modo más simple a la estimación confidencial de medias.

    Para estimar el estadístico "ue mejor nos va a ayudar es del "ue conocemos suley de distribución%

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    32/113

    Esa ley de distribución depende de 'desconocida(. Lo más conveniente es hacer "ue laley de distribución no dependa de nin!ún parámetro desconocido para elloestandarizamos%

    Este es el modo en "ue se hará siempre la estimación puntual%

     se buscar+ una relación en la ue inter!en3an el par+metro desconocido 4unto con suestimador 5 de modo ue estos se distribu5an se36n una le5 de probabilidad ue es bienconocida 5 a ser posible tabulada.

    e este modo fijado consideramos la v.a. y tomamos un

    intervalo "ue conten!a una masa de probabilidad de . Este intervalo lo "ueremostan pe"ue)o como sea posible. Por ello lo mejor es tomarlo sim$trico con respecto a lamedia '0( ya "ue allí es donde se acumula más masa.

    ig&ra( La distribución y el intervalo más pe"ue)o posible cuya

     probabilidad es . Por simetría los cuantiles y sólo

    difieren en el si!no.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    33/113

    8sí las dos colas de la distribución 'zonas más alejadas de la media( se repartirán a

     partes i!uales el resto de la masa de probabilidad .

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    34/113

    e este modo podemos afirmar "ue e-iste una probabilidad de de "ue al e-traer una muestra aleatoria de la variable en estudio ocurra%

    e este modo un intervalo de confianza al nivel para la esperanza de una normalde varianza conocida es el comprendido entre los valores

    La forma habitual de escribir este intervalo está inspirada en la [i!ura de abajo%

    Como se dijo anteriormente% lo "ue nos permite utilizar esta otraforma de e-presar el intervalo

    ig&ra( ^ntervalo de confianza para la media.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    35/113

     

    Inter?a#o ara #a media c&ando se desconoce #a ?arian*a de #a o"#aci$n

    Como hemos mencionado los casos anteriores se presentarán poco en la práctica ya"ue lo usual es "ue sobre una población "uizás podamos conocer si se distribuye

    normalmente pero el valor e-acto de los parámetros y no son conocidos. e ahínuestro inter$s en buscar intervalos de confianza para ellos.

    El problema "ue tenemos en este caso es más complicado "ue el anterior pues no es tansencillo eliminar los dos parámetros a la vez. Para ello nos vamos a ayudar de losi!uiente%

    Como se analizó en la *nidad B. El eorema del Límite Central en el tema B.Bistribuciones muestrales basados en la normalidad se tiene una variable t  con ! !radosde libertad.

    La única diferencia entre el intervalo de confianza para la media cuando no se conoce lavarianza es "ue se debe estimar este parámetro por medio de su estimador s.

    E-em#o

    #e "uiere estimar un intervalo de confianza al nivel de si!nificación para la

    altura media de los individuos de una ciudad. En principio sólo sabemos "ue ladistribución de las alturas es una v.a. X  de distribución normal. Para ello se toma unamuestra de n;6B personas y se obtiene

    'o#&ci$n( 

    En primer lu!ar en estadística inferencial los estadísticos para medir la dispersión másconvenientes son los inses!ados. Por ello vamos a dejar de lado la desviación típicamuestral para utilizar la cuasidesviación típica%

    #i "ueremos estimar un intervalo de confianza para es conveniente utilizar elestadístico

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    36/113

    y tomar como intervalo de confianza a"uella re!ión en la "ue

    es decir

    o dicho de forma más precisa% Con un nivel de confianza del podemos decir "ue lamedia poblacional está en el intervalo si!uiente%

    ig&ra( Cálculo del intervalo de confianza para la media usando para ello ladistribución t de #tudent y la función deverosimilitud asociada está tiene sumá-imo en ya "ue esta estimación

     puntual de es la m+ximo !erosímil .

    ^ntervalo de confianza para la varianza

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    37/113

    Para estimar un intervalo de confianza para la varianza nos ayudaremos de la si!uiente

     propiedad de la distribución %

    Consideremos dos cuantiles de esta distribución "ue nos dejen una probabilidaden la +zona central, de la distribución%

      ig&ra( Cuantiles de la distribución .

    Entonces un intervalo de confianza al nivel para la varianza de una distribuciónnormal 'cuyos parámetros desconocemos( lo obtenemos teniendo en cuenta "ue e-iste

    una probabilidad de "ue%

    Por tanto el intervalo "ue buscamos es

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    38/113

    E-em#o

    En un ejemplo anterior se estudiaba la altura de los individuos de una ciudadobteni$ndose en una muestra de tama)o 6B los si!uientes valores%

    Calcular un intervalo de confianza con para la varianza de la altura de losindividuos de la ciudad.

    'o#&ci$n( 

    Para estimar un intervalo de confianza para 'varianza poblacional( el estadístico "uenos resulta útil es%

    Entonces el intervalo de confianza "ue buscamos lo obtenemos mediante

    ig&ra( Percentiles del 6B` y del KIB`

     para la distribución .

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    39/113

    Por tanto para el valor poblacional de la desviación típica tenemos "ue

    con una confianza del KB` "ue por supuesto contiene a las estimaciones puntuales

     y calculados sobre la muestra.

    7.+ Inter?a#os de :redicci$n

    8 diferencia de lo "ue ocurre con un intervalo de confianza el cual tiene "ue ver con laestimación de un valor de la población un intervalo de predicción sirve para estimar unvalor individual y es por lo tanto un intervalo de probabilidad.

    aría la impresión "ue es posible elaborar un intervalo de predicción mediante el uso

    del error estándar del estimador. &o obstante tal intervalo estaría incompleto por"ue elerror estándar del estimador no incluye la incertidumbre asociada con el hecho de "ue

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    40/113

    la posición de "ue la línea de re!resión basada en datos muestrales incluye errores demuestreo y por lo !eneral no es id$ntica a la línea de re!resión de la población.

    El error estándar completo para un intervalo de predicción se llama error estándar de pronóstico e incluye la incertidumbre asociada con la dispersión vertical alrededor de

    la línea de re!resión más la incertidumbre asociada con la posición del mismo valor dela línea de re!resión.

    La fórmula básica para el error estándar del pronóstico es

    7 2 X1(si3uiente) - 7 2 X1 . X2 8 7 2 1 . X2

    La versión de cálculo de la fórmula del error estándar del pronóstico es

    [inalmente el intervalo de predicción para un valor individual de la variablesdependiente con n56 !rados de libertad es

    t 7  X(si3uiente)

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    41/113

    Unidad @

    :RUEA DE BI:9TE'I'

    I.4 ipótesis estadísticas simples y compuestas

    Pueden presentarse en la práctica situaciones en las "ue e-ista una teoría preconcebidarelativa a la característica de la población sometida a estudio. al sería el caso por ejemplo si pensamos "ue un tratamiento nuevo puede tener un porcentaje de mejoríamayor "ue otro estándar o cuando nos planteamos si los ni)os de las distintascomunidades espa)olas tienen la misma altura.

    Este tipo de circunstancias son las "ue nos llevan al estudio de la parcela de laEstadística ^nferencial "ue se reco!e bajo el título !en$rico de Contraste de Bi$tesis.^mplica en cual"uier investi!ación la e-istencia de dos teorías o hipótesis implícitas"ue denominaremos hipótesis nula e hipótesis alternativa "ue de al!una manerareflejarán esa idea a priori "ue tenemos y "ue pretendemos contrastar con la realidad.

    e la misma manera aparecen implícitamente diferentes tipos de errores "ue podemoscometer durante el procedimiento. &o podemos olvidar "ue habitualmente el estudio ylas conclusiones "ue obten!amos para una población cual"uiera se habrán apoyadoe-clusivamente en el análisis de sólo una parte de $sta. e la probabilidad con la "ueestemos dispuestos a asumir estos errores dependerá por ejemplo el tama)o de la

    muestra re"uerida.esarrollamos en este capítulo los contrastes de hipótesis para los parámetros másusuales "ue venimos estudiando en los capítulos anteriores% medias varianzas y

     proporciones para una o dos poblaciones. os contrastes desarrollados en este capítulo se apo5an en ue los datos de partida si3uen una distribución normal .

    Los contrastes de i$tesis se realizan% #uponiendo a priori "ue la ley de distribución de la población es conocida.

    #e e-trae una muestra aleatoria de dicha población.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    42/113

    #i la distribución de la muestra es +diferente, de la distribución de probabilidad"ue hemos asi!nado a priori a la población concluimos "ue probablemente seaerrónea la suposición inicial.

    E-em#o

    #upon!amos "ue debemos realizar un estudio sobre la altura media de los habitantes decierto pueblo de Ecuador. 8ntes de tomar una muestra lo ló!ico es hacer la si!uientesuposición a priori '%ipótesis que se desea contrastar y que denotamos & " (

    8l obtener una muestra de tama)o n ; podríamos encontrarnos ante uno de lossi!uientes casos%

    a. 7uestra ; 4B0 24B62 4/2 4BB2 4F02 4/K2 4BB2 4F1". 7uestra ; 4FB2 402 4I12 4B62 4IB2 4FB2 4IB2 4I

    ^ntuitivamente en el caso a sería ló!ico suponer "ue e-cepto "ue la muestra obtenidasobre los habitantes del pueblo sea muy poco representativa la hipótesis  9 0 debe ser rechazada. En el caso " tal vez no podamos afirmar con rotundidad "ue la hipótesis  9 0sea cierta sin embar!o no podríamos descartarla y la admitimos por una cuestión desimplicidad.

    Este ejemplo sirve como introducción de los si!uientes conceptos% En un contraste dehipótesis 'tambi$n denominado  prueba de :ipótesis  o ;ontraste de si3nificación( se

    decide si cierta hipótesis 9 0 "ue denominamos i$tesis na puede ser rechazada o noa la vista de los datos suministrados por una muestra de la población. Para realizar elcontraste es necesario establecer previamente una i$tesis a#ternati?a ' 9 4 ó  9a( "ueserá admitida cuando 9 0 sea rechazada. &ormalmente 9 4es la ne!ación de  9 0 aun"ueesto no es necesariamente así.

    La decisión de rechazar o no la hipótesis nula está al fin y al cabo basado en la elecciónde una muestra tomada al azar y por tanto es posible cometer decisiones erróneas. Loserrores "ue se pueden cometer se clasifican como si!ue%

    Error de tio ' ( 

     (s el error que consiste en rec%a$ar & " cuando es cierta. La probabilidad de cometer 

    este error es lo que se denomina niel de si)nificación. Se denota con la letra

    Error de tio '' ( 

     (s el error que consiste en no rec%a$ar & "  cuando es falsa. La probabilidad de

    cometer este error la denotamos con la letra

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    43/113

    E#ementos de &na r&e"a estadística(

       9ipótesis nula, 9 /   9ipótesis alterna 9 1   Estadístico de la prueba  

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    44/113

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    45/113

    I.1 Potencia de una prueba y curvas ]C

    :otencia de #a r&e"a

    Decuerde "ue la bondad de una prueba se mide por y las probabilidades de los

    errores de tipo ^ y ^^ en donde se fija de antemano para determinar la re!ión derechazo. *n concepto relacionado pero más útil para evaluar el funcionamiento de una prueba se denomina poder ' ó potencia( de la prueba. Wásicamente el poder de una prueba es la probabilidad de "ue la prueba rechace la hipótesis nula.

    #upon!amos "ue es un estadístico de la prueba y DD la re!ión de rechazo para la prueba de una hipótesis referente al valor de una parámetro θ. Entonces el poder denotado por U'θ( es la probabilidad de "ue la prueba rechace 0 cuando el valor realdel parámetro es θ. Es decir

    U'θ( ; P'de "ue est$ en DD cuando el valor del parámetro es θ (

    #upón!ase "ue se desea probar la hipótesis nula 0% θ  ; θ0  y "ue θ4  es un valor  particular de θ es co!ido para 4. El poder de la prueba para θ ; θ0 U'θ0( es i!ual a la probabilidad de rechazar 0 cuando es verdadera 0. Es decir

    U'θ0( ; la probabilidad de un error tipo ^.

    Para cual"uier valor de θ para 4 el poder de una prueba se mide su capacidad paradetectar "ue la hipótesis nula es falsa. Es decir para θ ; θ4

    U'θ4( ; P'rechazar 0 cuando θ ; θ4(

    ado "ue

    ; P'aceptar 0 cuando θ ; θ4(

    tenemos "ue el poder de la prueba para θ4 y la probabilidad de un error tipo ^^ serelaciona como si!ue%

    U'θ4( ; 4 5

    8 continuación ilustraremos dos ejemplos de curvas de poder o potencia

    ig&ra(  típica curva de poder o potencia para la prueba0% θ ; θ0 frente a la alternativa 4% θ ≠ θ0

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    46/113

    ig&ra( curva de poder ideal para la prueba0% θ ; θ0 frente a la alternativa 4% θ ≠ θ0

    C&r?as OC

    Cuando el nivel de si!nificancia y el tama)o de muestra se mantienen constantes la probabilidad de error tipo ^^ disminuye a medida "ue el valor alternativo específico de lamedia se aleja del valor de la hipótesis nula y aumenta a medida "ue

    *na curva característica ]C describe !ráficamente la probabilidad de aceptar lahipótesis nula dados diversos valores alternativos de la media de la población.

    La si!uiente curva ]C es aplicable a cual"uier prueba de cola inferior de una mediahipot$tica al nivel de si!nificancia de B` basada en el uso de la distribución normal de

     probabilidad.

    ig&ra( curva de poder ideal para la prueba0% θ ; θ0 frente a la alternativa 4% θ ≠ θ0

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    47/113

     &ótese "ue es aplicable a cual"uier prueba de este tipo por"ue los valores del ejehorizontal han sido enunciados en unidades del error estándar de la media. Paracuales"uiera valores a la iz"uierda de µ0 la probabilidad de aceptación indica la

     probabilidad del error tipo ^^. 8 la derecha de µ0 las probabilidades indican la

    aceptación correcta de la hipótesis nula. al como lo indican las líneas punteadascuando µ ; µ0 la probabilidad de aceptar la hipótesis nula es 4 5 o en este caso 4 Y 0.0B ; 0.KB.

    En los si!uientes temas desarrollaremos al!unos ejemplos de cómo aplicar las curvas]C y la potencia de la prueba.

    @./ :r&e"as de i$tesis re#ati?as a medias= ?arian*as=roorciones ) cocientes de dos ?arian*as

    en este tema se desarrollará un procedimiento para la prueba basada en el estimador "ue tiene apro-imadamente una distribución normal con media g y varianza H6g. 

    Los estimadores referidos en la unidad anterior como con muestras !randesutilizados para estimar una media poblacional y proporción poblacional prespectivamente satisfacen estos re"uerimientos.

    \unto con ellos tambi$n lo hacen los estimadores para la comparación de dos medias'4 Y 6( y la comparación de parámetros binomiales 'p4 Y p6(.

    entro del desarrollo de este tema se puede encontrar un resumen detallado de las pruebas de hipótesis para la media la varianza y las proporciones.

    Contrastes para la media

    Test de dos co#as con ?arian*a conocida

    #uponemos "ue donde es conocido y "ueremos contrastar si es

     posible "ue 'desconocida( sea en realidad cierto valor fijado. Esto es un supuestoteórico "ue nunca se dará en la realidad pero servirá para introducir la teoría sobrecontrastes.

    El test se escribe entonces como%

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    48/113

    Como hemos mencionado anteriormente la t$cnica para hacer el contraste consiste ensuponer "ue 9 0  es cierta y averi!uar con esta hipótesis "uien es la distribución delestadístico del contraste "ue este caso es ló!ico "ue deba estar muy relacionado con .

    #i al obtener una muestra concreta se tiene "ue es un valor muy alejado de se debe rechazar 9 0.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    49/113

    aceptando en consecuencia la hipótesis alternativa 

    ig&ra(  La re!ión de rechazo de lahipótesis nula es la sombreada. #e rechaza

     9 0 cuando el estadístico =exp toma un valor comprendido en la zona sombreada de la

    !ráfica pe"ue)a oe"uivalentemente cuando el estadísticotoma un valor en la zona roja de la !ráfica

    !rande .

    Test de &na co#a con ?arian*a conocida Consideremos un contraste de hipótesis donde ahora la hipótesis alternativa es

    compuesta%

     

    Wajo la hipótesis nula la distribución de la media muestral es

    y como re!ión crítica consideraremos a"uella formada por los valores e-tremadamente bajos de ' exp con probabilidad es decir

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    50/113

    Entonces la re!ión de aceptación o de modo más correcto de no rechazo de la hipótesis

    nula es

    ig&ra(  #e rechaza la hipótesis nulacuando uno de los estadístico '   o tomaun valor en la zona roja de sus !ráficasrespectivas.

    Es evidente "ue si en el contraste de si!nificación 'primer !ráfico( hubi$semos tomadocomo hipótesis alternativa su contraria es decir

     por simetría con respecto al caso anterior la re!ión donde no se rechaza la hipótesisnula es 'v$ase la fi!ura de abajo y contrástese con la anterior(%

    ig&ra( De!iones de aceptación y rechazo para el test unilateral contrario.

    Test de dos co#as con ?arian*a desconocida

    #ea donde ni ni son conocidos y "ueremos realizar el contraste

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    51/113

    8l no conocer va a ser necesario estimarlo a partir de su estimador inses!ado% lacuasivarianza muestral . Por ello la distribución del estimador del contraste será unade #tudent "ue ha perdido un !rado de libertad se!ún el teorema de Cochran 'no

    evaluado en el curso presente( y la definición de la distribución de #tudent%

    Consideramos como re!ión crítica a las observaciones de  exp e-tremas

    o sea

    O"ser?aci$n

    Para dar una forma homo!$nea a todos los contrastes de hipótesis es costumbredenominar al valor del estadístico del contraste calculado sobre la muestra como ?a#ore>erimenta# y a los e-tremos de la re!ión crítica como ?a#ores te$ricos. efiniendoentonces

    el resultado del contraste es el si!uiente%

     ig&ra( De!ión crítica para el contraste bilateral de unamedia.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    52/113

    tn1 t t T

    Tests de &na co#a con ?arian*a desconocido 

    #i realizamos el contraste

     por analo!ía con el contraste bilateral definiremos

    y el criterio para contrastar al nivel de si!nificación es% 

    ig&ra(  De!ión crítica para uno de los contrastesunilaterales de una media.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    53/113

    Para el contraste contrario

    definimos  exp y  teo como anteriormente y el criterio a aplicar es%

    ig&ra(  De!ión crítica para el contrastes

    unilateral de una media contrario alanterior.

    E-em#o

    Conocemos "ue las alturas X  de los individuos de una ciudad se distribuyen de modonormal. eseamos contrastar con un nivel de si!nificación de α ; 0.0B si la alturamedia es diferente de 4I/ cm. Para ello nos basamos en un estudio en el "ue con unamuestra de n;6B personas se obtuvo%

    'o#&ci$n( 

    El contraste "ue se plantea es%

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    54/113

    La t$cnica a utilizar consiste en suponer "ue 9 0 es cierta y ver si el valor "ue toma elestadístico

    es razonable o no bajo esta hipótesis para el nivel de si!nificación dado.8ceptaremos la hipótesis alternativa 'y en consecuencia se rechazará la hipótesis nula(si no lo es es decir si

    Para ello procedemos al cálculo de  exp%

    Lue!o aun"ue podamos pensar "ue ciertamente el verdadero valor de no es 4I/ no

    hay una evidencia suficiente para rechazar esta hipótesis al nivel de confianza del .Es decir no se rechaza 9 0.

    ig&ra( El valor de  exp no está en la re!ióncrítica 'aun"ue ha "uedado muy cerca( por tanto al no ser la evidencia en contra de 9 0suficientemente si!nificativa $sta hipótesisno se rechaza.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    55/113

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    56/113

    Decordamos "ue el valor de  exp obtenido fue de

     exp;54KBK= t 6/00B; 5t 6/0KB ; 54I4

    Por ello hemos de aceptar la hipótesis alternativa ig&ra( El valor te  exp  está en la re!ióncrítica por tanto e-iste una evidenciasi!nificativa en contra de 9 0 y a favor de

     9 4.

    Es importante observar este hecho curioso% 7ientras "ue en el ejemplo anterior no

    e-istía una evidencia si!nificativa para decir "ue cm el simple hecho de plantearnos un contraste "ue parece el mismo pero en versión unilateral nos conduce a

    rechazar de modo si!nificativo "ue y aceptamos "ue cm. Es por ello"ue podemos decir "ue no sólo 9 0 es rechazada sino tambi$n 9 0. Es en este sentido enel "ue los tests con 9 0 y 9 0 los consideramos e"uivalentes%

    Contrastes de &na roorci$n

    #upon!amos "ue poseemos una sucesión de observaciones independientes de modo"ue cada una de ellas se comporta como una distribución de Wernoulli de parámetro  p%

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    57/113

    La v.a. X  definida como el número de $-itos obtenidos en una muestra de tama)o n es por definición una v.a. de distribución binomial%

    La proporción muestral 'estimador del verdadero parámetro p a partir de la muestra( es

     &os interesamos en el contraste de si!nificación de

    frente a otras hipótesis alternativas. Para ello nos basamos en un estadístico 'decontraste( "ue ya fue considerado anteriormente en la construcción de intervalos deconfianza para proporciones y "ue si!ue una distribución apro-imadamente normal paratama)os muestrales suficientemente !randes%

    #i la hipótesis 9 0 es cierta se tiene

    Contraste "i#atera# o de dos co#as

    Para el contraste

    e-traemos una muestra y observamos el valor . Entonces se define

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    58/113

    siendo el criterio de nilateral o rechazo de la nilatera nula el "ue refleja la si!uientefi!ura%

    ig&ra(  Contraste bilateral de unanilateral.

    Contrastes Uni#atera#es o de &na co#a

    Consideremos un contraste del tipo

    La fi!ura si!uiente e-presa el criterio de aceptación o rechazo a se!uir%

    ig&ra(  Contraste unilateral cuando

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    59/113

    Para el test unilateral contrario se tiene la e-presión sim$trica%

    Lue!o

    ig&ra(  Contraste unilateral cuando se tiene

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    60/113

    Contrastes so"re #a diferencia de roorciones

    #upon!amos "ue tenemos dos muestras independientes tomadas sobre dos poblacionesen la "ue estudiamos una variable de tipo dicotómico 'Wernoulli(%

    #i X 4 y  X 6 contabilizan en cada caso el número de $-itos en cada muestra se tiene "uecada una de ellas se distribuye como una variable aleatoria binomial%

    de modo "ue los estimadores de las proporciones en cada población tienendistribuciones "ue de un modo apro-imado son normales 'cuando n4 y n6 son bastante!randes(

    El contraste "ue nos interesa realizar es el de si la diferencia entre las proporciones encada población es una cantidad conocida

    #i 9 0 fuese cierta se tendría "ue

    esafortunadamente ni  p4  ni  p6  son conocidos de antemano y utilizamos susestimadores lo "ue da lu!ar a un error "ue es pe"ue)o cuando los tama)os muestralesson importantes%

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    61/113

    Contraste "i#atera#

    El contraste bilateral sobre la diferencia de proporciones es

    Entonces se define

    y se rechaza la hipótesis nula si o si

    Contrastes &ni#atera#es

    En el contraste

    se rechazará 9 0 si . Para el test contrario

    se rechaza 9 0 si .

    Contrastes ara #a ?arian*a Consideremos "ue el carácter "ue estudiamos sobre la población sea una v.a. normalcuya media y varianza son desconocidas.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    62/113

    frente a otras hipótesis alternativas "ue podrán dar lu!ar a contrastes bilaterales ounilaterales. La t$cnica consiste en observar "ue el si!uiente estadístico e-perimental

    "ue utiliza el estimador inses!ado de la varianza posee una distribución con n54!rados de libertad%

    Entonces construimos las re!iones críticas "ue correspondan a las hipótesis alternativas

    "ue se formulen en cada caso atendiendo a la ley de distribución .Contraste "i#atera#

    Cuando el contraste a realizar es

    definimos

    y el criterio "ue suministra el contraste es el e-presado en la si!uiente fi!ura%

    ig&ra(  Contraste bilateral deuna varianza.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    63/113

    Contrastes &ni#atera#es

    Para un contraste de si!nificación al nivel del tipo

    se tiene "ue el resultado del mismo es el "ue refleja la si!uiente fi!ura%

    ig&ra(  Contraste unilateral del

    tipo .

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    64/113

    Para el contraste contrario tenemos la formulación análo!a%

    calculamos el e-tremo inferior de la re!ión crítica en una tabla de la distribución

    El !ráfico "ueda de la si!uiente manera% 

    ig&ra(  Contraste unilateral del tipo

    .

    Ta"#a( Estadísticos asociados a una muestra aleatoria simple procedente de una población normal.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    65/113

     

     X 4 X 6 ...

    Contrastes de la razón de varianzas

    Consideramos dos muestras independientes de dos poblaciones "ue se distribuyennormalmente 'cuyas medias y varianzas son desconocidas(.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    66/113

    la cual vamos a contrastar teniendo en cuenta "ue%

    Por tanto el estadístico del contraste "ue nos conviene tiene una distribución conocidacuando 9 0 es cierta 55v$ase la definición de la distribución de #nedecor%

    Contraste "i#atera#

    El contraste bilateral para el cociente de varianzas se escribe como%

    abida cuenta "ue la distribución de #nedecor no es sim$trica sino "ue sólo tomavalores positivos se rechazará la hipótesis nula cuando el el valor "ue tome elestadístico del contraste al aplicarlo sobre una muestra sea muy cercano a cero o bienmuy !rande. Es decir se define el estadístico e-perimental y los límites de la re!ióncrítica como%

    y el criterio de aceptación o rechazo es%

    *na cuestión "ue conviene observar es "ue

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    67/113

    dada la no simetría de  . 8 la hora de usar una tabla de la distribución podemos tal vez encontrar "ue no está tabulada para los valores pe"ue)os pero si

     para . *na re!la "ue es de bastante utilidad para estos casos es la si!uiente

    Contrastes &ni#atera#es

    El primer contraste unilateral "ue consideramos es%

     para el cual se tiene

    El tests unilateral opuesto es%

    y entonces

    E-em#o

    #e desea comparar la actividad motora espontánea de un !rupo de 6B ratas control yotro de 1F ratas desnutridas. #e midió el número de veces "ue pasaban delante de unac$lula fotoel$ctrica durante 6/ horas. Los datos obtenidos fueron los si!uientes%

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    68/113

    Datas de control n4;6B

    Datas desnutridas n6;1F

    9#e observan diferencias si!nificativas entre el !rupo control y el !rupo desnutrido:

    'o#&ci$n( 

    En primer lu!ar por tratarse de un problema de inferencia estadística nos serán másútiles las cuasivarianzas "ue las varianzas. Por ello calculamos%

    El contraste "ue debemos realizar está basado en el de la de #tudent para la diferenciade medias de dos poblaciones. Para ello conocemos dos estadísticos posibles se!ún "uelas varianzas poblacionales de ambos !rupos de ratas puedan ser supuestas i!uales'homocedasticidad( o distintas 'heterocedasticidad(. Para ello realizamos previamente elcontraste%

    #uponiendo 9 0 cierta tenemos "ue el estadístico del contraste conveniente es

    ya "ue así no es necesario calcular el e-tremo inferior para la re!ión donde no serechaza 9 0. En este caso%

    Como no podemos concluir 'al menos al nivel de si!nificación ("ue 9 0 deba ser rechazada.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    69/113

     ig&ra( &o hay evidencia si!nificativa

     para rechazar la homocedasticidad. Elestadístico del contraste ha sido ele!idode modo "ue el numerador de  exp  sea

    mayor "ue el denominador es decir  expN4.

    Por lo tanto no rechazamos la hipótesis de homocedasticidad '"ue las dos son i!uales(de ambas poblaciones y pasamos a contrastar la i!ualdad de las medias

    utilizando el estadístico más sencillo 'el "ue no necesita apro-imar los !rados delibertad mediante la fórmula de kelch(. Para ello calculamos en primer lu!ar lacuasivarianza muestral ponderada%

    y posteriormente

    Como concluimos "ue se ha de rechazar la hipótesis de i!ualdad de lasmedias y por tanto aceptamos "ue las medias son diferentes. 8demás como se aprecia

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    70/113

    en la fi!ura si!uiente la evidencia a favor de la hipótesis alternativa es muy alta y se puede afirmar "ue con !ran probabilidad la media poblacional de las ratas de control esmayor "ue la de las ratas desnutridas.

    ig&ra( ay una !ran evidencia en contrade la hipótesis de "ue ambas medias poblacionales coincidan y a favor de "ue lade la primera población es mayor "ue la dela se!unda.

    @.5 Contrastes ara #a diferencia de medias aareadas

    Las muestras apareadas aparecen como distintas observaciones realizadas sobre losmismos individuos. *n ejemplo de observaciones apareadas consiste en considerar a unconjunto de n personas a las "ue se le aplica un tratamiento m$dico y se mide por ejemplo el nivel de insulina en la san!re antes ' X ( y despu$s del mismo '> (

    Paciente  xi  5i d i

    4 4B0 460 106 40 410 B0

    ... ... ... ...

    n 4/0 K0 B0

     &o es posible considerar a X  e >  como variables independientes ya "ue va a e-istir unadependencia clara entre las dos variables. #i "ueremos contrastar el "ue los pacienteshan e-perimentado o no una mejoría con el tratamiento llamemos d i  a la diferenciaentre las observaciones antes y despu$s del tratamiento

    d i ; xi5 5i 

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    71/113

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    72/113

    entonces se rechaza 9 0 si . Para el test contrario

    se rechaza 9 0 si .

    O"ser?aci$n

     &o supone nin!una dificultad el haber realizado el contraste con conocida ya "ueentonces el estadístico del contraste es

    y el tratamiento sería análo!o.

    Prueba de si!no para un e-perimento aparejado

    :r&e"a de# signo ara comarar dos o"#aciones en &n e>erimento aare-ado 4ode Fi#co>on de rangos con signo

    ipótesis%0% Las distribuciones poblacionales para las M y las O son id$nticas4% Las dos distribuciones difieren en ubicación 'dos colas( o bien 4% la

    distribución de frecuencias relativas de la población para las M está desfasadahacia la derecha de la distribución de las O 'una cola(

    Estadístico de la prueba%4( Para una prueba de dos colas utilice ; mín'G  ( en donde G ; suma de los

    tran!os de las diferencias positivas y  ; suma de los ran!os de las diferenciasne!ativas.

    6( Para la prueba de una cola 'para detectar la alternativa de una cola dadaanteriormente( utilice la suma de los ran!os  de las diferencias ne!ativas.

    De!ión de rechazo%4( Para la prueba de dos colas rechace 0 si ≤ 0 en donde 0 es el valor crítico

    dado en la tabla de valores críticos de en la prueba de kilco-on.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    73/113

    6( Para la prueba de una cola rechace 0 si 5 ≤ 0

    O"ser?aci$n(

    Para detectar un desplazamiento de la distribución de las O hacia la derecha de ladistribución de las M utilice la suma de los ran!os 3 la suma de los ran!os de lasdiferencias positivas y rechace 0 si 3 ≤ 0.

    E-em#o

    Pruebe la hipótesis nula de "ue no hay diferencias entre las distribuciones poblacionalesde la densidad de los pasteles para un e-perimento de diferencias aparejadas. #e utilizanF pares de pasteles uno preparado con la mezcla 8 y el otro con la mezcla W. 9u$ se

     puede decir del nivel de si!nificancia alcanzado:

    'o#&ci$n

    Los datos ori!inales y las diferencias 'en onzas por pul!ada cúbica( para los seis paresde pasteles se muestran en la tabla si!uiente%

    8 W iferencia% 8 Y W Dan!o0.41B 0.46K 0.00F 10.406 0.460 50.04 B0.40 0.446 50.00/ 4.B0.4/4 0.4B6 50.044 /0.414 0.41B 50.00/ 4.B0.4// 0.4F1 50.04K F

    Como en el caso de otras pruebas no para m$tricas la hipótesis nula "ue debe probarsees "ue las distribuciones de frecuencias de las dos poblaciones de densidades de los

     pasteles son id$nticas. La hipótesis alternativa "ue implica una prueba de dos colas es"ue las distribuciones difieren en ubicación.

    Dealizaremos nuestra prueba utilizando α  ; 0.40 por"ue la cantidad de datos es pe"ue)a. e la tabla de valores críticos de en la prueba de kilco-on vemos "ue elvalor crítico de para una prueba de dos colas y α  ; 0.40 es 0  ; 6. por tanto

    rechazaremos 0 si ≤ 6.

    ado "ue hay solamente una diferencia positiva "ue tiene el ran!o 1 3 ; 1y 55 ; 4 y por lo tanto no hay evidencia suficiente para indicar una diferencia ente lasdistribuciones de frecuencias de las dos poblaciones de las densidades de las

     poblaciones de los pasteles. Oa "ue no es posible rechazar 0 para α ; 0.40 solamente podemos afirmar "ue el valor p N 0.40.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    74/113

    @.7 Ta"#as de Contingencia

    *n problema común en el análisis de datos enumerativo se refiere a la independencia dedos m$todos de clasificación de eventos observados. Por ejemplo podríamos clasificar una muestra de individuos se!ún el se-o y se!ún su opinión con respecto a una cuestión

     política para probar la hipótesis de "ue las opiniones con respecto a esta cuestión sonindependientes del se-o o podríamos clasificar a los pacientes "ue padecen ciertaenfermedad se!ún el tipo de medicamento y se!ún el porcentaje de recuperación paraver si el porcentaje de recuperación depende del tipo de medicamento. El cada uno deestos ejemplos "ueremos investi!ar la dependencia 'o contin3encia( entre dos criteriosde clasificación.

    #upón!ase "ue "ueremos clasificar los defectos encontrados en los muebles producidosen cierta planta manufacturera se!ún '4( el tipo de defecto y '6( el turno de producción.#e re!istró un número total de n ; 10K muebles defectuosos y se clasificaron los

    defectos como uno de cuatro tipos 8 W C o . 8l mismo tiempo se identificó cadamueble se!ún el turno de producción en el "ue se les fabricó. #e presentan estos datosen la si!uiente tabla conocida como 0abla de 1ontin)encia%

    T&rno de :rod&cci$n Tio de defecto Tota#A C D

    4 4B'66.B4( 64'60.KK( /B'1.K/( 41'44.BF( K/6 6F'66.KK( 14'64.//( 1/'1K.II( B'44.4( KF1 11'6.B0( 4I'6F.BI( /K'/K.6K( 60'4/.F1( 44K

    Tota# @/ 7H 1% + +H

    Los números ente par$ntesis son las estimaciones de las frecuencias esperadas de lasceldas. El objetivo es probar la hipótesis nula de "ue el tipo de defecto es independientedel turno de producción frente a la alternativa de "ue las dos cate!orías sondependientes. Es decir "ueremos probar 0% la clasificación por columnas esindependiente de la clasificación por ren!lones.

    #ea p ? i!ual a la probabilidad incondicional de "ue un efecto sea del tipo 8. 8simismose definen  p @ , p;  , 5 p D como las probabilidades de observar los otros tres tipos dedefectos. Entonces estas probabilidades "ue llamaremos probabilidades de columna dela tabla anterior satisfacen la condición% p8 3 pW 3 pC 3 p ; 4

    e i!ual manera sea pi 'i ; 46 o 1( i!ual a la probabilidad de ren!lón de "ue un defecto proven!a del turno i en donde p4 3 p6 3 p1 ; 4

    La hipótesis nula especifica solamente "ue la probabilidad cada celda será i!ual al producto de sus respectivas probabilidades de ren!lón y de columna lo "ue implica laindependencia de las dos clasificaciones.

    enemos "ue estimarlas probabilidades de columna y de ren!lón para poder estimar lasfrecuencias esperadas de las celdas.

    Como hemos observado se pueden utilizar las estimaciones de las frecuenciasesperadas de las celdas en lu!ar de los E'n i( en la e-presión de M6 y M6 todavía tendrá

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    75/113

    una distribución "ue se puede apro-imar por una distribución de probabilidad χ6 en unmuestreo repetitivo.

    #ea nij la frecuencia observada en el ren!lón i y la columna j de la tabla de contin!enciay sea pij la probabilidad de "ue una observación cai!a en esta celda.

     pij es simplemente la frecuencia relativa observada para esta celda es decir

    i4 ; nij ? n i ;4...r2 j ; 4...c

    8simismo al considerar el ren!lón i como una sola celda la probabilidad para elren!lón i está dada por pi  y por lo tanto

    i4 ; r i ? n

    donde r denota el número de observaciones en el ren!lón i( es el estimador de má-imaverosimilitud de pi.

    8nálo!amente la probabilidad para la columna es c j?n en donde c j denota el número deobservaciones en la columna j.

    El valor esperado de la frecuencia de celda observada n ij para una tabla de contin!enciaes i!ual al producto de sus respectivos totales de ren!lón y de columna dividido entre lafrecuencia total. Es decir

     ' nij ( ; r ij ? n

    [inalmente se construye el estadístico de la prueba por medio de las frecuenciasesperadas y observadas

     X 2 ; nij 5 'nij(Q6 ? 'nij(

    El único obstáculo restante es la determinación del número apropiado de !rados delibertad asociados con el estadístico de la prueba. Para ello se establece una re!la "uetrataremos de justificar.  os 3rados de libertad asociados con una tabla decontin3encia ue tiene r ren3lones 5 c columnas siempre son i3uales a (r A 1) (c A 1).

    Para el ejemplo planteado compararemos X 2 con el valor crítico de una χ6 con 'r54('c54(; '154('/54( ; F 3rados de libertad.

     X 2 ; nij 5 'nij(Q6 ? 'nij( ; '4B Y 66.B4(6? 66.B4 3 '6F Y 66.KK(6?66.KK 3 ...3 '60 5 4/.F1(6?4/.F1 ; 4K.4I

    Por lo tanto si utilizamos α ; 0.0B rechazaremos la hipótesis nula de "ue las dosclasificaciones son independientes si M6 N 46. BK6. ado "ue el valor del estadístico dela prueba M6 ; 4K.4I es mayor "ue el valor crítico de χ6 rechazamos la hipótesis nulaa nivel de si!nificancia de α ; 0.0B.El valor p asociado se da por valor p ; P'χ6  N4K.4I(.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    76/113

    *na tabla de contin!encia es un arre!lo rectan!ular en el "ue se e-presan los efectos deun factor horizontal 8 y un factor vertical W sobre los elementos de una misma

     población.

    8 tiene c niveles W tiene r niveles

    [actor 8[actor W  &ivel 4 6 ... c

    4 M44 M46 ... M4c M4.6 M64 M66 ... M6c M6.... ... ... ... ... ...r  Mr 4 Mr6 ... Mrc Mr .

    M.4 M.6 M.c n

    Mij es el número de elementos bajo el nivel i de 8 y la columna j de W

    La idea es verificar si el factor 8 y el W son independientes por medio de un contraste dehipótesis como se muestra en el ejemplo anterior.

    @.@ A-&ste de c&r?a( #a r&e"a no aram8trica J' ) #a r&e"a

    2ic&adrado

    El estadístico y su distribución

    #ea  X   una v.a. cuyo ran!o son los valores de modo "ue  pi  es la probabilidad de cada valor2

    Este tipo de v.a. puede corresponder a variables ya estudiadas como es el caso de ladistribución Winomial

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    77/113

     pero nosotros vamos a usarla para v.a. más !enerales. #upon!amos "ue el resultado de

    un e-perimento aleatorio es una clase c4 c6 . .. c" 'ci ( "ue puederepresentar valores cualitativos discretos o bien intervalos para variables continuas. #ea

     pi la probabilidad de "ue el resultado del e-perimento sea la clase ci.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    78/113

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    79/113

     ig&ra( De!ión crítica 'sombreada( para un

    contraste con el estadístico .

    es decir

    O"ser?aci$n

    8 pesar de "ue el contraste parece ser bilateral la forma de nos indica "ue elcontraste es unilateral% #ólo podemos saber si e-iste desajuste entre los esperado y loobservado pero no podemos contrastar hipótesis alternativas del tipo  pi mayor "uecierto valor.

    O"ser?aci$n

    ]bs$rvese "ue en realidad no es una variable aleatoria continua% Los posibles

    resultados de la muestra se resumen en las cantidades ... "ue 6nicamentetoman valores discretos. Lue!o las cantidades

    sólo puede tomar un número finito de valores distintos 'aun"ue sean cantidades condecimales(. Por tanto su distribución no es continua. Lue!o al realizar la apro-imación

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    80/113

    mencionada hay "ue precisar en K&8 condiciones e# error cometido es eK&eo. emodo apro-imado podemos enunciar el si!uiente criterio "ue recuerda al de laapro-imación binomial por la distribución normal%

    4. nN102

    6. para todo .

    #in embar!o esta re!la resulta demasiado estricta a la hora de aplicarla en la práctica. #eutiliza entonces una re!la más fle-ible y "ue no sacrifica demasiada precisión conrespecto a la anterior%

    4. Para nin!una clase ocurre "ue

    6. para casi todos los salvo a lo sumo un deellos.

    #i a pesar de todo estas condiciones no son verificadas es necesario a!rupar las clases"ue ten!an menos elementos con sus adyacentes.

    O"ser?aci$n

    El lector puede considerar los contrastes con el estadístico como una !eneralizacióndel contraste de proporciones. Para ello le invitamos a estudiar el si!uiente ejemplo.

    E-em#o

    #e desea saber si cierta enfermedad afecta del mismo modo a los hombres "ue a lasmujeres. Para ello se considera una muestra de n;F4 individuos "ue padecen laenfermedad y se observa "ue 1/4 son hombres y el resto son mujeres. 9u$conclusiones se obtiene de ello:

    'o#&ci$n( 

    El contraste a realizar se puede plantear de dos formas "ue despu$s veremos "ue sone"uivalentes%

    Contraste de &na roorci$n(  #i  p es el porcentaje de hombres en la población deenfermos podemos considerar el contraste%

    e la muestra obtenemos la si!uiente estimación puntual del porcentaje de enfermos dese-o masculino%

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    81/113

    Para ver si esto es un valor coherente con la hipótesis nula calculemos lasi!nificatividad del contraste%

    Por otro lado

    Como el contraste es de tipo bilateral la si!nificatividad del contraste es 'buscando enla tabla de la distribución normal(%

    Lo "ue nos indica "ue se ha de rechazar la hipótesis nula y aceptar la hipótesisalternativa es decir afirmamos "ue e-iste una evidencia si!nificativa a favor de lahipótesis de "ue la enfermedad no afecta por i!ual a hombres y mujeres.

    Contraste con e# estadístico ( En este caso planteamos el contraste%

    Para resolverlo escribimos en una tabla los frecuencias muestrales observadas dehombres y mujeres junto a los valores esperados en el caso de "ue la hipótesis nulafuese cierta%

    frecuencias frecuencias

    observadas esperadas diferencia

    ombres 1/4 K 166?10K

    7ujeres 6II 5K '516(6?10K

    F4 F4 0 FF1

    Consideremos entonces el estadístico

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    82/113

    donde%

    " ;6 es el número de modalidades posibles "ue toma la variable se-o% :ombres  ymu4eres2

     p ;0 es el número de parámetros estimados2: ;4 es el números de restricciones impuestas a los valores esperados. #ólo hay una'"ue es habitual( "ue consiste en "ue el número esperado de enfermos entre hombres ymujeres es F0.

    El estadístico calculado sobre la muestra ofrece el valor e-perimental%

    "ue es el percentil KK de la distribución . e nuevo se obtiene "ue la si!nificatividaddel contraste es del 4`=B`.

    En conclusión con los dos m$todos lle!amos a "ue hay una fuerte evidencia en contrade "ue hay el mismo porcentaje de hombres y mujeres "ue padecen la enfermedad. Laventaja de la última forma de plantear el contraste 'diferencia entre frecuenciasobservadas y esperadas( es "ue la t$cnica se puede aplicar a casos más !enerales "uevariables dicotómicas como se verá más adelante.

    O"ser?aci$n ay una fórmula alternativa para el cálculo de cuya e-presión es más fácil de utilizar cuando realizamos cálculos%

    Demostraci$n

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    83/113

    Distri"&ciones con ar!metros desconocidos

    #upon!amos "ue la distribución de  X  "ue "ueremos contrastar no especifica ciertosvalores de r  parámetros

    Estim$moslos a partir de la muestra y consideremos las cantidades

    Entonces el contraste consiste en

    Contraste de &na distri"&ci$n "inomia#

    ueremos contrastar

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    84/113

    Las cantidades pi son desconocidas aun"ue tienen una forma en la "ue sólo dependendel único parámetro "ue debe ser estimado a partir de la muestra 'r ;4(% Dealizando estaestimación

    tenemos todas las cantidades pi

    y la distribución del estadístico es apro-imadamente .

    Contraste de &na distri"&ci$n norma#

    #i "ueremos contrastar si una v.a. X  se distribuye normalmente

     podemos realizar el contraste correspondiente mediante la t$cnica del estadísticotomando una muestra estimando los parámetros mediante y y a!rupando lasobservaciones 'continuas( en un número finito "  de intervalos. &o rechazaremosentonces la normalidad de X  si las probabilidades esperadas de los intervalos no sonmuy diferentes de las obtenidas sobre la muestra es decir

    ^ntervalo

     

    5 e4

     

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    85/113

    e4 5 e6

     

    e6 5 e1

     

    ... ... ... ... ...

     

    Distri"&ciones de ar!metros conocidos

    eseamos contrastar si la v.a. X  si!ue una ley de distribución

    donde todos los  pi  están fijados 'hipótesis  9 0(. Entonces por lo mencionado

    anteriormente el contraste consiste en%

    En este contraste se comete cierto error de apro-imación y por tanto será tanto mejor cuanto mayor sea n.

    E-em#o

    adas dos parejas de !enes ?a  y  @b la descendencia del cruce efectuado se!ún lasleyes de 7endel debe estar compuesto del si!uiente modo%

    Leyes de 7endel

    [recuencias

    [enotipo relativas

     ?@ K?4F

     ?b 1?4F

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    86/113

    a@ 1?4F

    ab 4?4F

    Ele!idos 100 individuos al azar de cierta población se observa la si!uiente distribuciónde frecuencias%

    [recuencias

    [enotipo observadas

     ?@ 4FB

     ?b /I

    a@ FI

    ab 64otal 100

    9#e puede aceptar "ue se cumplen las leyes de 7endel sobre los individuos de dicha población:

    'o#&ci$n( 

    El contraste a realizar es%

    Para ello vamos a representar en una sola tabla las frecuencias observadas junto con las"ue serían de esperar en el caso de "ue 9 0 fuese cierta%

    [enotipo

     ?@ 4FB 4F411

     ?b /I /66I

    a@ FI BK4

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    87/113

    ab 64 61B6

    otal 100 100 +1+=+

    Wajo la hipótesis de "ue 9 0 sea cierta se tiene "ue%

    ya "ue / son los posibles fenotipos no se ha estimado nin!ún parámetro 'la distribuciónse!ún las leyes de 7endel es conocida( y sobre las cantidades E i e-iste solamente una

    restricción "ue es% .Por otro lado

    "ue se!ún la tabla de la distribución es apro-imadamente el percentil KKB de la

    distribución . Por tanto la si!nificatividad del contraste es del lo "uenos conduce a rechazar la hipótesis de "ue la población de la "ue la muestra ha sidoe-traída si!ue las leyes de 7endel.

    8l mismo resultado lle!amos sin calcular con precisión la si!nificatividad del contrastesino considerando "ue el valor teórico má-imo "ue admitimos para el estadístico

    e-perimental con un nivel de si!nificación del B` es el percentil KB de es decir

    y claramente ocurre "ue por lo "ue se rechaza la hipótesis nula.

    ]bs$rvese tambi$n "ue el "ue se haya rechazado la hipótesis nula si!nifica "ue haydiferencia estadísticamente significati?a  entre las frecuencias observadas y lasesperadas aun"ue a primera vista no lo hubi$semos percibido en el !ráfico de la [i!urasi!uiente%

     

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    88/113

    ig&ra(  8un"ue aparentan ser  apro-imadamente i!uales las frecuenciasobservadas y esperadas e-iste diferenciaestadísticamente si!nificativa entre ellas.

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    89/113

    Unidad

    RERE'I9N LINEAL ; ANLI'I' DE

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    90/113

    Es decir se postula "ue O ; β0  3 β4 x  3 ε  en donde ε  es una v.a. #i 0  y 4  sonestimadores de los parámetros β0  y β4 entonces ; 0  3 4 x  es obviamente unestimador de E'O(.

    El procedimiento de los mínimos cuadrados para ajustar una recta a trav$s de unconjunto de n puntos es similar al m$todo de "ue podríamos utilizar para ajustar unarecta a simple vista2 es decir se pretende "ue las desviaciones sean +pe"ue)as, en ciertosentido. *na manera conveniente de lo!rar esto es minimizar la suma de los cuadradosde las desviaciones verticales de la recta ajustada por lo tanto si

     C ; 0 3 4 x

    es el valor "ue se predice del i5$simo valor de 5 'cuando x ; xi( entonces la desviacióndel valor observado de 5 a partir de la recta C 'llamada a veces el error( es

     5i A Ci

    y la suma de los cuadrados de las desviaciones "ue deben minimizar es

    #CE ; ' 5i A Ci(6  ;  5i Y ' 0 3 4 x(Q6 

    La cantidad #CE se llama suma de los cuadrados de los errores por motivos "ue seránobvios en se!uida.

    #i se tiene un mínimo este ocurrirá para los valores de 0  y 4  "ue satisfa!an lasecuaciones

    ∂#CE ? ∂ 0 ; 0  Ecuaciones de∂#CE ? ∂ 4 ; 0  7ínimos Cuadrados

    8l obtener los valores de las derivadas parciales de #CE con respecto a 0  y4respectivamente y al i!ualarlas a cero se obtienen las ecuaciones

    ∂#CE ? ∂ 0 ; 5 6 '  5i 5 n 0 5 4  xi( ; 0

    ∂#CE ? ∂ 4 ; 5 6 '  xi 5i  5 0   xi  5 4  xi2( ; 0nótese "ue las ecuaciones de mínimos cuadrados son lineales en 0 y 4 y por lo tantose pueden resolver simultáneamente. Puede verificarse "ue las soluciones son

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    91/113

    8demás se puede demostrar "ue la resolución simultánea de las dos ecuaciones de losmínimos cuadrados produce valores de 0 y 4 "ue minimizan #CE.

    E-em#o

    8plicar el m$todo de los mínimos cuadrados para ajustar una línea recta a trav$s de losn;B datos contenidos en la si!uiente tabla%

     x 556 054 00 44 46 1

    'o#&ci$n  Empezaremos por construir la tabla para calcular los coeficientes de lasecuaciones de los mínimos cuadrados. Entonces se tiene%

     x i   yi   x i  yi   x i 256 0 0 /54 0 0 40 4 0 04 4 4 46 1 F /

     xi- 0  5i ; B  xi 5i ; I  xi2 ; 40

    e esta obtenemos los estimadores de 0 y 4

    y la recta ajustada es

     C ; 4 3 0.I x  5

    se muestran los cinco puntos y la recta ajustada en la si!uiente fi!ura

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-691524583.docx

    92/113

    ig&ra(  representación de los puntos y larecta de los mínimos cuadrados para elejemplo.

    .% La distri"&ci$n de# error de# mode#o

    Como lo habíamos notado en el anterior tema en el modelo de re!resión lineal cuandoeste es estimado por medio del m$todo de los mínimos cuadrados observamos una

    diferencia entre el valor observado de 5 y el valor obtenido por medio del modeloconstruido 'el "ue se predice( es decir 

    ε ; Error - 5i A CiEsta diferencia es denominada el error de# mode#o y se lo denota por ε.

    Estudiemos ahora las propiedades de este error en el muestreo repetitivo.Primero obs$rvese "ue tanto >   como    son variables aleatorias distribuidasnormalmente y "ue el error es función lineal de >  y  . Entonces concluimos "ue el error tiene una distribución normal por"ue es una función lineal de variables aleatoriasdistribuidas normalmente.

    8l aplicar fórmulas para encontrar el valor esperado y la varianza de una función linealde variables aleatorias obtenemos

    E'ε( ; E'>  5  ( ; E'O( Y E' (

    Como E'O( ; E' (

    E'ε( ; 0.

    ambi$n

  • 8/17/2019 tmp_32193-7.3 Apéndice 5 El curso de Estadística-6