Analitica Guia 2013

download Analitica Guia 2013

of 103

Transcript of Analitica Guia 2013

  • 7/29/2019 Analitica Guia 2013

    1/103

    Facultad de Ciencias

    Veterinarias

    U.B.A.

    rea Bioestadstica20131er. Cuatrimestre

    Estadstica Analtica

    Gua de Trabajos Prcticos

  • 7/29/2019 Analitica Guia 2013

    2/103

    II

    Cronograma 20131er. CuatrimestreSem lunes

    1 4/3

    Jueves: Revisin de conceptos relativos a inferencia. Intervalos de confianza y

    pruebas de hiptesis para la diferencia de medias de dos poblaciones.(hasta test t

    con varianzas desconocidas y distintas inclusive).

    211/3

    Martes: Revisin de conceptos relativos a inferencia. Intervalos de confianza y

    pruebas de hiptesis para la diferencia de medias de dos poblaciones.(hasta test t

    con varianzas desconocidas y distintas inclusive).

    Jueves: Continuacin con medias de dos poblaciones. Intervalos de confianza y

    pruebas de hiptesis para la media de las diferencias.

    3 18/3

    Martes: Continuacin con medias de dos poblaciones. Intervalos de confianza y

    pruebas de hiptesis para la media de las diferencias.

    Jueves: Intervalos de confianza y pruebas de hiptesis para la diferencia de pro-

    porciones de dos poblaciones. Distribucin F. Intervalos de confianza y pruebas

    de hiptesis para el cociente de varianzas de dos poblaciones.

    4 25/3

    Martes: Intervalos de confianza y pruebas de hiptesis para la diferencia de pro-

    porciones de dos poblaciones. Distribucin F. Intervalos de confianza y pruebas

    de hiptesis para el cociente de varianzas de dos poblaciones.

    5 1/4Diseo de Experimentos. Diseo Completamente Aleatorizado. Modelo param-

    trico.

    6 8/4Diseo Completamente Aleatorizado modelo paramtrico (continuacin) y Di-

    seo Completamente Aleatorizado no paramtrico.

    715/4

    Ejercitacin e integracin 1er. Parcial Sbado 20/4

    8 22/9Estadstico de Chi cuadrado para pruebas de bondad de ajuste. Pruebas de Prue-

    bas de Independencia.

    9 29/4Estadstico de Chi cuadrado para Pruebas de Homogeneidad

    Ejercitacin.

    10 6/5Regresin Lineal Simple. Supuestos del Modelo y Estimadores. Dcima de hip-

    tesis e intervalo de confianza utilizando la t de Student.

    11 13/5Regresin Lineal Simple. Intervalos de prediccin. Coeficiente de determina-

    cin. ANOVA en la regresin.

    12 20/5 Regresin Lineal Mltiple. Correlacin Lineal Simple paramtrica.

    13 27/5 Correlacin Simple no paramtrica. Ejercitacin.

    14 3/6Integracin. Revisin y consulta. 2do. Parcial Sbado 8/6 a las 11 hs

    15 10/6

    16 17/6

    17 24/6 Recuperatorio 25/6 a las 18 hs.

  • 7/29/2019 Analitica Guia 2013

    3/103

    III

    NOTA IMPORTANTE:

    La ctedra publica solamente laGUIA DE TRABAJ OS PRACTICOS

    y la GUIA DE FORMULAS Y TABLASpara la cursada de esta materia.Cualquier otra publicacin NO CUENTA

    CON LA APROBACION DE LA CATEDRA.

    Bibliografa

    Cantatore de Frank, Norma M.: Manual de Estadstica Aplicada. Ed. Hemis-

    ferio Sur. 1ra. Edicin. Buenos Aires. Captulos: 4, 5, 6, 7, 8, 12 y 13.

    Cappelletti, Carlos A.: Elementos de estadstica. Cesarini Hnos. Editores.2da. Edicin. Bs. As. Captulos 8, 9, 10, 11, 13 y 14.

    Daniel, Wayne W.: Bioestadstica. Base para el anlisis de las ciencias de la

    salud. 3ra. Edicin. Uteha, Noriega Editores. Mxico. Captulos: 5, 6, 8, y 10.

  • 7/29/2019 Analitica Guia 2013

    4/103

    IV

    Sistema de Evaluacin de Estadstica Analtica

    Se tomarn dos parciales, que sern calificados en una escala de 0 a 10, en for-ma global.Las condiciones de LIBRE, ASISTENCIA CUMPLIDA, REGULAR Y PROMO-CIN se obtienen si se cumplen las situaciones con respecto a calificacin yasistencia que abajo se detallan.

    ASISTENCIA: Concurrencia a las clases terico-prcticas en un porcentaje:LIBRE: inferior al 75%ASISTENCIA CUMPLIDA y REGULAR: mayor o igual al 75%PROMOCIN: mayor o igual al 80%

    CALIFICACIN:

    SEGUNDO PARCIAL

    1 2 3 4 5 6 7 8 9 10

    PRIMER

    PARCIAL

    1 LIBRE LIBRE LIBRE AC ACREC

    1P

    REC

    1P

    REC

    1P

    REC

    1P

    REC

    1P

    2 LIBRE LIBRE LIBRE AC ACREC

    1P

    REC

    1P

    REC

    1P

    REC

    1P

    REC

    1P

    3 LIBRE LIBRE LIBRE AC ACREC

    1P

    REC

    1P

    REC

    1P

    REC

    1P

    REC

    1P

    4 AC AC AC AC ACREC

    1P

    REC

    1P

    REC

    1P

    REC

    1PCOL

    5 AC AC AC AC ACREC

    1P

    REC

    1P

    REC

    1PCOL COL

    6REC

    2P

    REC

    2P

    REC

    2P

    REC

    2P

    REC

    2PREG REG PROM PROM PROM

    7

    REC

    2P

    REC

    2P

    REC

    2P

    REC

    2P

    REC

    2P REG PROM PROM PROM PROM

    8REC

    2P

    REC

    2P

    REC

    2P

    REC

    2P

    REC

    2PPROM PROM PROM PROM PROM

    9REC

    2P

    REC

    2P

    REC

    2P

    REC

    2PCOL PROM PROM PROM PROM PROM

    10REC

    2P

    REC

    2P

    REC

    2PCOL COL PROM PROM PROM PROM PROM

    Siendo:AC: asistencia cumplidaCOL: coloquioPROM: promocin

    REC 2P: recupera 2do. ParcialREC 1P: recupera 1er. ParcialREG: regular

    NOTA1. Los alumnos que estn ausentes a un parcial y presenten certificado oportu-namente en la ctedra lo rendirn en la fecha de recuperatorio y si posteriormen-te quedan en situacin de recuperar un parcial se les asignar una fecha.2. Los alumnos que recuperan algn parcial consiguen como mximo la condicinde REGULAR.3. Los coloquios se tomarn en forma oral sobre los contenidos que involucra el

    parcial de menor puntaje y definen la condicin del alumno.

  • 7/29/2019 Analitica Guia 2013

    5/103

    Unidad 1: INFERENCIA para DOS POBLACIONES

    Objetivos especficos:

    Comprender la importancia de disear experimentos.Analizar la adecuacin de cada diseo en funcin del contexto de la investigacin.

    Aplicar los conceptos de inferencia estadstica a la comparacin de dos poblaciones, utilizando comoprocedimientos la estimacin y la prueba de hiptesis.Seleccionar el procedimiento de inferencia adecuado en funcin del objetivo y del cumplimiento de lossupuestos.Resolver problemas e interpretar conclusiones aplicando los mtodos de anlisis sobre dospoblaciones.

    Contenidos temticos: Diseo de experimentos: necesidad, ventajas, propsitos, definiciones previas. Tipos de diseos yalcances. Revisin de conceptos relativos a la estimacin puntual y por intervalos. Intervalos de confianzapara la diferencia de medias y para la media de las diferencias. Estimaciones para la diferencia de dosproporciones, para el cociente de varianzas, y para el cociente de desvos estndar.

    Revisin de conceptos relacionados con las pruebas de hiptesis. Prueba de hiptesis para:diferencia de medias en base a dos muestras independientes: diferencia de medias, cociente devarianzas, diferencias de proporciones. Muestras apareadas: media de las diferencias. Relacin entre intervalo de confianza y prueba de hiptesis bilateral. Aplicaciones.

    Glosario:

    Diseo de experimentos: experimento, unidad experimental, tratamiento, factor, niveles de un factor,observacin, efecto. Repeticin, aleatorizacin, control local. Estudios observacionales, pre-experimentales, cuasiexperimentales y experimentales.Inferencia para dos poblaciones: Poblacin, muestra. Parmetro. Estimador. Estimacin. Estimadorpuntual. Intervalo. Intervalo de confianza. Nivel de confianza. Hiptesis de trabajo. Hiptesis estadstica.Hiptesis nula y alternativa. Error tipo I y tipo II. Nivel de significacin. Regin crtica. Regla de decisin.

    Distribucin F de Snedecor. Diferencia de medias y de proporciones, cociente de varianzas para muestrasindependientes. Muestras apareadas: media de las diferencias.

    El diseo de experimentos

    La ciencia, tiene entre sus objetivos la explicacin y comprensin de los acontencimientos. Un requisitofundamental en toda ciencia fctica es el contraste de las hiptesis planteadas, poniendo a prueba lasmismas mediante una confrontacin con la experiencia.

    El diseo experimental crea las condiciones para el contraste de la hiptesis y brinda la metodologa es-tadstica correspondiente para el anlisis de los datos.

    Es el proceso de planear un experimento para obtener datos apropiados que puedan ser analizadosmediante mtodos estadsticos, con objeto de producir conclusiones vlidas y objetivas. La metodolog-a estadstica es el nico enfoque objetivo para analizar un problema que involucre datos sujetos a

    errores experimentales. As es que hay dos aspectos en cualquier problema experimental: el diseo delexperimento y el anlisis estadstico de los datos.

    El propsito del diseo experimental es controlar la mxima cantidad de informacin pertinente al pro-blema bajo investigacin. Sin embargo tambin es importante que el diseo o plan sea tan simple co-mo sea posible, a fin de ahorrar tiempo, dinero, personal y material experimental.

    Para que la metodologa de diseo de experimentos sea eficaz es fundamental que el diseo sea el ade-cuado. Un experimento puede realizarse por alguno de los siguientes motivos:

    Determinar los factores principales que influyen sobre la variable respuesta. Encontrar las condiciones experimentales con las que se consigue un valor extremo en la variablede inters o respuesta. Comparar las respuestas en diferentes niveles de observacin de variables controladas.

    Obtener un modelo estadstico-matemtico que permita hacer predicciones de respuestas futuras.

  • 7/29/2019 Analitica Guia 2013

    6/103

    Para poder realizar un buen diseo experimental, es necesario previamente comprender el problemaque se desea estudiar, plantendose un conjunto de preguntas clsicas:

    1- Cules son las caractersticas de inters?2- Qu variables afectan a las caractersticas que se van a analizar?3- Cuntas veces debera repetirse el experimento?4- A partir de qu valor se considerar que el efecto es significativo?

    Lo cual conduce a elegir las variables ms apropiadas y sus niveles de medicin, elegir la o las res-puestas a evaluar y el modelo de diseo.

    Para responder estas preguntas es necesario definir claramente algunos trminos fundamentales:

    Experimento: es un ensayo o una observacin realizado bajo condiciones establecidas y contro-ladas por el experimentador, susceptible de repetirse bajo las mismas condiciones.

    Variable de inters o respuesta: es la variable que se desea estudiar.

    Unidad experimental: es la parte ms pequea de material experimental, entidad fsica o sujeto,en la que se aplica un tratamiento una sola vez. Tambin puede entenderse como cada una de lasreproducciones del experimento.

    Tamao del Experimento: es el nmero total de observaciones recogidas en la ejecucin del ex-

    perimento. Ejemplo: si se asignan 10 gallinas a cada una de tres dietas el tamao del experimento es30.

    Factor: es una variable que se sospecha que puede ejercer influencia sobre la variable respuestade inters.

    Factor controlado: se denomina as a una variable manipulada por el investigador o variable in-dependiente, a fin de estudiar su influencia sobre la variable de inters o dependiente. Algunos autoresla denominan variable de entrada al proceso. Ejemplo: si pensamos que la temperatura o la humedadpueden afectar a la conservacin de cierta propiedad de un alimento o medicamento, se puede contro-lar manteniendo dicho producto con tres valores distintos de temperatura.

    Niveles del factor: son cada una de las categoras, o valores, o formas especficas que adopta lavariable independiente o controlada. Ejemplo: en el caso de las tres dietas, el factor dieta tiene tresniveles; en el caso del rodeo, el factor tiene dos niveles.

    Tipos de factores: existen factores cuantitativos, cuyos niveles son cantidades numricas, y cuali-tativas, cuyos niveles son procedimientos o cualidades. Ejemplo de factor cuantitativo puede ser lacantidad de fertilizante adicionado a las parcelas de cultivo por hectrea con niveles: 10kg/ha 20kg/ha -30 kg/ha de fertilizante. Ejemplo de factor cualitativo puede ser el tipo de nutriente adicionado auna dieta con niveles: potasio, magnesio y calcio.

    Tratamiento: conjunto de condiciones experimentales o procedimientos creados para el experi-mento en funcin de la hiptesis de investigacin a las que se someter a las unidades experimentalesen un diseo elegido. Con varios factores es una de las combinaciones especficas de los niveles delos factores de estudio, y en un diseo unifactorial es uno de los distintos niveles del factor en el caso.Por ejemplo: si se asignan tres dietas distintas a las gallinas de un criadero, cada una de las dietas esun tratamiento. Si en un tambo se combinan tres raciones de alimentacin dos rodeos con vacas enordee (uno con vacas de alta produccin y el otro con las de baja produccin). Cada combinacin de

    rodeo y racin constituye un tratamiento (6 tratamientos). Observacin: valor que asume una variable, tambin denominada variable respuesta, en una de-terminada realizacin del experimento, es decir cada registro realizado en el contexto del experimentode la variable respuesta.

    Efecto: diferencia entre los valores medios de la variable respuesta en presencia y ausencia de unnivel del factor. Si la variable respuesta de inters es el engorde semanal medido en gramos de unagallina con cierta dieta enriquecida, el efecto es la diferencia entre el engorde medio con la dieta enri-quecida y el engorde medio con la dieta tradicional, ambos medidos en gramos.

    Diseo equilibrado o balanceado: es el diseo en el que todos los tratamientos son asignados aun nmero igual de unidades experimentales, en el cual se obtiene la misma cantidad de repeticionespor tratamiento. Por ejemplo hay cuatro vacas en cada combinacin de rodeo y nutriente para el agua.

    Principios Bsicos del diseo experimentalLos tres principios bsicos que caracterizan a un diseo experimental:

  • 7/29/2019 Analitica Guia 2013

    7/103

    Repeticin: cuando un tratamiento es aplicado a ms de una unidad experimental. Las observacio-nes repetidas con las mismas condiciones experimentales en el contexto de un experimento no coinci-den necesariamente, y por lo tanto una de las cuestiones fundamentales a la hora de disear un expe-rimento es la seleccin del tamao de muestra o nmero de repeticiones adecuado en cada contexto.

    Las razones por las cuales es deseable realizarrepeticiones del experimento son:a- Proporcionar una estimacin del error experimental (error generado por causas no controladas porel experimentador), que acta como unidad bsica de medida para indicar el significado de las di-ferencias.

    b- Obtener mayor precisin en la estimacin.c- Permitirnos extender el alcance de la inferencia relativa al experimento.

    El error experimental segn el contexto puede reflejar:errores de experimentacinerrores de observacinerrores de medicinvariacin del material experimental

    El error experimental puede reducirse generalmente adoptando una o ms de las tcnicas siguientes:usando material experimental tan homogneo como sea posible.utilizando informacin proporcionada por otras variables aleatoriasteniendo cuidado al dirigir el experimentousando un diseo experimental ms eficiente.

    Aleatorizacin: Todo procedimiento de prueba se basa en un conjunto de supuestos que debensatisfacerse para que la prueba resulte vlida. Una de las suposiciones ms frecuentes es que lasobservaciones, o los errores en ellas, son independientes. Dicho en otras palabras la aleatorizacinhace vlida la prueba.

    Control local: Se denomina de esta manera al conjunto de acciones que implementa el investiga-dor con el fin de reducir al mximo posible el error experimental mantenindolo en un rango de varia-cin manejable.Por ejemplo: seleccin de unidades experimentales homogneas, divisin en bloques, calibracin deinstrumentos, etc.

    Tipos de estudios de investigacin

    Los estudios observacionales son un conjunto de estudios en los que no hay intervencin por partedel investigador y este se limita a medir las variables que define en el estudio. Por ejemplo, los estu-dios epidemiolgicos.

    Ventajas de los estudios observacionales

    1. Son ms prcticos y factibles de realizar, ya que la cooperacin de los sujetos es menos necesa-ria.

    2. Sus resultados son ms generalizables a poblaciones, geogrfica o demogrficamente definidas.

    Inconvenientes de los estudios observacionales

    1. Escaso control de las influencias de los factores de confusin sobre los resultados del estudio.(Los factores de confusin son factores no tenidos en cuenta que pueden llegar a modificar los re-sultados de un anlisis).

    2. Debido a la falta de control por parte del investigador, cada estudio observacional tiende a ser ni-co, siendo muy difcil reproducir los resultados por otro investigador.

    Los estudios pre-experimentales se caracterizan por analizar una nica variable y prcticamente noexiste ningn tipo de control. No existe manipulacin de la variable independiente ni se utiliza el grupode control; por consiguiente son escasas las posibilidades de que este grupo sea representativo de losdems. Este tipo de diseo consiste en administrar un tratamiento o estmulo en la modalidad de solopre-prueba / posprueba.

  • 7/29/2019 Analitica Guia 2013

    8/103

    Un estudio de intervencin, tambin llamado estudio experimental, es un estudio caracterizado porla manipulacin artificial del factor de estudio por el investigador y por la aleatorizacin de los casos osujetos en dos grupos, llamados control y tratado.

    Cuando la caracterstica de la aleatorizacin en el estudio no se cumple, se dice que el estudio escuasiexperimental. La falta de aleatorizacin de los estudios cuasiexperimentales indica que no existemanera de asegurar la equivalencia inicial de los grupos denominados experimental y de control.

    Tambin es usual que, en un experimento, se utilicen controles histricos. El problema que presentaeste tipo de diseo es que el grupo actualmente en tratamiento puede presentar importantes diferen-cias relativas al tratamiento respecto al grupo de control histrico. Los trabajos con controles histricosestn generalmente sesgados a favor del tratamiento, mientras que los experimentos aleatorios evitaneste tipo de sesgo.

    PROBLEMAS RESUELTOS

    1) Mediante los estudios ecogrficos, los bebs pueden actualmente ser observados mientras estn enel seno materno. Sin embargo, gran cantidad de experimentos desarrollados en animales de laborato-rio dieron como resultado que la aplicacin de ultrasonidos poda ser la causa de que el peso al nacerfuese inferior al normal.

    Ante el temor de que esta conclusin fuese aplicable a los humanos, un grupo de especialistas delHospital John Hopkins de Baltimore puso en marcha un estudio para investigar el tema. En el mismose observ el peso al nacimiento de los bebs que estuvieron expuestos a controles ecogrficos (ultra-sonido) y de los que no estuvieron expuestos.

    Tambin en este caso los bebs expuestos al ultrasonido durante el embarazo pesaban en su ma-yora al nacer menos que aquellos que no lo haban estado, pero un dato a tener en cuenta es que losobstetras recomendaban el ultrasonido cuando sospechaban que el embarazo no se desarrollaba connormalidad.

    a) Se trata de un estudio observacional o experimental? Por qu?b) Puede concluirse que el ultrasonido influye sobre el peso del nacimiento?

    Solucin:

    a)Se trata de un estudio observacional, porque no hay intervencin del investigador.b)Los bebs expuestos al ultrasonido y los no expuestos presentaban diferencias que no tenan nadaque ver con el hecho de ser tratados o no. De modo tal que los investigadores tuvieron un conjunto defactores de confusin con el cual enfrentarse. La conclusin del estudio fue, por lo tanto, que las eco-grafas y el menor peso de los bebs tenan una causa comn: problemas durante el embarazo.

    2) Mediante la siguiente experiencia se quiere determinar si una droga reduce el nivel promedio de gluco-sa en sangre (glucemia) en una lnea de ratas diabticas.

    Se tomaron al azar 40 ratas de esta lnea y se les suministr la droga (grupo tratado). Al mismotiempo se tomaron otras 30 ratas de la misma lnea y se les suministr un placebo (grupo control).

    Los niveles sanguneos de glucosa (mg/ml) en las ratas fueron:

    Tratadas con droga Tratadas con placebo

    1,82 1,89 1,39 1,79 1,27 1,73 2,01 1,74 1,91 1,521,41 1,88 1,88 1,66 1,93 1,56 1,93 1,70 1,74 2,161,60 1,70 1,69 1,94 1,62 1,44 1,68 1,99 1,82 1,401,68 1,57 1,91 1,83 1,60 1,58 2,12 1,61 1,91 1,70

    2,15 1,91 1,93 2,22 2,18 1,75 1,93 2,032,37 1,65 2,09 1,75 2,00 2,23 2,10 1,952,18 1,95 1,92 2,01 2,48 1,67 2,23 1,961,87 2,06 2,00 2,26 1,94 1,89

  • 7/29/2019 Analitica Guia 2013

    9/103

    1,27 1,50 1,72 1,95 2,17

    Cuantiles de una Normal(1,7328,0,04161)

    1,27

    1,50

    1,72

    1,95

    2,17

    Cuantilesobservados(Droga)

    n= 40 r= 0,994 (Droga)

    Shapiro-Wilks (modificado)

    Variable n Media D.E. W* p(una cola)

    Droga 40 1,73 0,20 0,97 0,7640

    1,62 1,84 2,05 2,27 2,48

    Cuantiles de una Normal(2,022,0,038086)

    1,62

    1,84

    2,05

    2,27

    2,48

    Cuantilesobservados(Placebo)

    n= 30 r= 0,989 (Placebo)

    Shapiro-Wilks (modificado)

    Variable n Media D.E. W* p(una cola)

    Placebo 30 2,02 0,20 0,97 0,7499

    a) Es la droga efectiva para reducir el nivel promedio de glucosa en sangre, al 5%? Asuma que ladroga no modifica la varianza poblacional del nivel de glucosa en sangre, y que sta es conocida,simblicamente 2droga=

    2placebo =0,04 mg

    2/ml2

    b) Construya un intervalo de confianza del 95% para la diferencia entre la media poblacional de laglucemia de las ratas tratadas con droga y la media poblacional de la glucemia de las ratas tratadas conplacebo.

    Datos del problema:

    Variables en estudio

    X1: nivel de glucosa de una rata diabtica de la lnea, tratada con droga, en mg/ml

    X2: nivel de glucosa de una rata diabtica de la lnea, tratada con placebo, en mg/ml

    Tamaos de las muestras: n1= 40 y n2= 30

    Varianzas poblacionales: Conocidas e iguales. ( 21 =22 = 0,04 mg

    2/ml2)

    Nivel de significacin: =0,05

    Nivel de confianza: 1 - = 0,95

  • 7/29/2019 Analitica Guia 2013

    10/103

    Solucin:a)

    La hiptesis de trabajo que se desea poner a prueba es:El empleo de la droga disminuye el nivelmediode glucosa en sangre de ratas diabticas de la lnea

    Verificacin de supuestos: Para poder plantear las hiptesis estadsticas y llevar a cabo la prue-ba, hay que verificar los supuestos tericos necesarios. En este caso, los supuestos son que ambas

    variables (X1 y X2) sean independientes y se distribuyan normalmente. El supuesto de independenciase cumple por la forma en que se realiz el experimento: a un grupo de ratas se le suministr la drogay a otro grupo, tambin tomado al azar, se lo trat con placebo.

    Para X1: se realiz un grfico de cuantil-cuantil (qqplot) para estudiar la normalidad de la variable. En estegrfico se comparan dos distribuciones, la de los datos muestrales y la de una normal. Cuando los puntosestn perfectamente alineados, se infiere que la distribucin es exactamente normal, si los puntos estanmuy cercanos a la lnea, la distribucin es aproximadamente normal, grandes apartamientos de esta es-tructura indican falta de normalidad. Esto sin embargo no tiene la fuerza de un test estadstico es unatcnica exploratoria.

    Observando el grfico se puede ver que lospuntos no se alejan mucho de la recta, sinembargo, por ser un grfico, no se puedehacer inferencia sobre el comportamientodistribucional de la variable a nivelpoblacional. Para poder concluir a nivelpoblacional es necesario un test denormalidad. En Elementos de Estadstica seestudi la prueba Shapiro-Wilks, para verificarnormalidad, y cuyas hiptesis son:

    En todos los casos para esta prueba utilizaremos un nivel de significacin del 10%Al realizar el test, utilizando InfoStat, se obtuvieron los siguientes resultados:

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)X1 40 1.73 0.20 0.97 0,7640

    Como p-valor= 0,7731 y es mayor que =0,10, no se rechaza la hiptesis nula, por lo tanto, con unnivel de significacin del 10% se puede decir que la variable X1 (nivel de glucosa en sangre de una rata

    tratada con droga, en mg/ml) se distribuye normalmente.

    1.27 1.50 1.72 1.95 2.17

    Cuantiles de una Normal(1.7328,0.04161)

    1.27

    1.50

    1.72

    1.95

    2.17

    Cuantilesobservados(X1)

    Qqplot

  • 7/29/2019 Analitica Guia 2013

    11/103

    1.62 1.84 2.05 2.27 2.48

    Cuantiles de una Normal(2.022,0.038086)

    1.62

    1.84

    2.05

    2.27

    2.48

    Cuantilesobservados(X

    2)

    Qqplot

    Anlogamente se estudia la normalidad de la variable X2:

    2

    0 2 2 2

    2

    1 2 2 2

    : ~N ;

    : no se distribuye normalmente N ;

    H X

    H X

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)X2 30 2.02 0.20 0.97 0,7499

    Como p-valor= 0,7739 y es mayor que =0,10, no se rechaza la hiptesis nula, por lo tanto, con unnivel de significacin del 10% se puede decir que la variable X2 (nivel de glucosa en sangre de una ratatratada con placebo, en mg/ml) se distribuye normalmente.

    Una vez verificado el supuesto terico se puede seguir adelante con la prueba.

    Nota:este test no ser necesario si la informacin asegura distribucin normal de la variable.

    Hiptesis estadsticas.El inters del investigador es probar si la droga disminuye el nivel medio de glucosa en sangre,

    por lo tanto quiere saber si la media del nivel de glucosa en sangre de ratas tratadas con droga esmenor que la media del nivel de glucosa en sangre de las ratas tratadas con placebo.

    Simblicamente:1 2

    , esta expresin no lleva el signo igual, por lo tanto debe corresponder a

    la hiptesis alternativa. Es decir que las hiptesis estadsticas son:

    0 1 2

    1 1 2

    :

    :

    H

    HEquivalentemente podra escribirse

    0 1 2

    1 1 2

    : 0

    : 0

    H

    Ho tambin

    0 2 1

    1 2 1

    : 0

    : 0

    H

    H

    Cualquiera de estas formas expresan las mismas hiptesis estadsticas . Sin embargo hay queelegir una expresin para poder continuar con la prueba manteniendo la eleccin a lo largo de todo elanlisis y por sobre todo concluir para las hiptesis elegidas. Si esto no se mantiene deja de tener vali-dez la prueba o peor an, se podra estar concluyendo errneamente. En este caso se va a trabajar

    con:0 1 2

    1 1 2

    :

    :

    H

    H

    Nivel de significacin: =0,05

    Estadstico de prueba (o variable pivotal)

    Se est realizando un test de hiptesis para la diferencia de medias poblacionales, por lo cual secuenta con dos opciones al elegir la variable pivotal: Z o t de Student, dependiendo del conocimiento ono las varianzas poblacionales. En este caso las varianzas poblacionales son conocidas e iguales, porlo tanto se utiliza Z, la expresin de la variable pivotal es:

  • 7/29/2019 Analitica Guia 2013

    12/103

    Regin crtica:Observando la hiptesis alternativa (del par de hiptesis elegidas), se ve que la regin crtica es unila-

    teral izquierda. Por lo tanto el valor crtico es:0,05 1,64Z y la regin crtica es: 0 1,64HZ

    Regla de decisin:

    Rechazo H0 si0

    1,64HZ

    No rechazo H0 si0

    1,64HZ

    Clculo de ZHo:Hasta este momento no utilizamos los valores muestrales, excepto en la verificacin de supues-

    tos, sin embargo se podra haber hecho con muestras piloto y recin en esta instancia extraer lasmuestras para el anlisis. Antes de calcular el valor del estadstico de prueba hay que calcular las me-dias muestrales utilizando las frmulas dadas en la unidad de estadstica descriptiva de Elementos de

    Estadstica:1 21,73; 2,02X X . Hay que tener en cuenta que la prueba se est realizando bajo la

    hiptesis nula que contiene el caso en que las medias poblacionales son iguales, por lo tanto la dife-

    rencia de las medias poblacionales es cero, es decir que1 2 0. Reemplazando estos valores y

    el resto de la informacin en la frmula nos queda:

    Decisin: Se rechaza la hiptesis nula porqueoH

    =Z -6, 017 , es menor que 1,64, o sea que

    ZCALCULADO < ZCRITICO.

    Conclusin: Con un nivel de significacin de 5% tengo evidencia suficiente para rechazar la hip-

    tesis nula (0 1 2:H ), por lo tanto la media poblacional del nivel de glucosa en sangre de ratas

    diabticas tratadas con droga es menor que la media poblacional del nivel de glucosa en sangre deratas diabticas tratadas con placebo, en estas poblaciones de ratas diabticas en estudio. Por lo tanto

    puedo decir que la droga es efectiva.b) La frmula del intervalo del 95% que se est pidiendo se despeja de la variable pivotal y es:

    2 2 2 2

    1 2 1 2

    1 2 1 / 2 1 2 1 / 2

    1 2 1 2

    ( ) ;( )X X Z X X Zn n n n

    reemplazando se obtiene que

    Por lo el tanto intervalo de confianza para la diferencia de medias poblacionales 1 2 es:

    Conclusin: Con un nivel de confianza del 95%, se espera que el intervalo [-0,3839 mg/ml; -0,1961mg/ml] cubra o contenga a la diferencia entre la media poblacional del nivel de glucosa de las ratastratadas con droga y la media poblacional del nivel de glucosa de las ratas tratadas con placebo, enestas poblaciones de ratas diabticas en estudio.

    NOTA: Observemos que el 0 (cero) no est incluido en el intervalo de confianza, y que ambos lmitesson negativos, lo cual es indicador de que la diferencia es negativa. Sin embargo, hay que tener encuenta que el IC no es equivalente porque la prueba es unilateral.

  • 7/29/2019 Analitica Guia 2013

    13/103

    3) Se tom una muestra aleatoria de 21 cerdos Yorkshire del norte de la provincia de Buenos Aires. Losmismos tenan 3 meses de edad y pesos homogneos, y se los separ, aleatoriamente, en dos lotes. Allote 1 se le asign una racin estndar (A) y al lote 2 otra con distinta formulacin (B). La siguiente tablacontiene las ganancias de peso de cada animal, luego de 30 das de experiencia, expresadas en kg.

    Lote 1(A) 24 26 25 23 28 27 28 24 29 29Lote 2(B) 26 32 28 25 29 27 28 27 27 28 30

    Por estudios anteriores se sabe que ambas variables se distribuyen normalmente con varianzas igua-les, pero desconocidas.

    a) Se puede suponer, al 5%, que la ganancia media de peso de los animales alimentados con laracin B supera significativamente la ganancia media de peso de los animales alimentados con racinA?

    b) Construir un intervalo para la diferencia de medias al 95%. Qu puede concluir?

    Datos del problema:

    Variables en estudio:

    XA: ganancia de peso de un cerdo Yorkshire de 3 meses de edad del norte de la provincia de Bs. As.alimentado con la racin estndar A

    XB: ganancia de peso de un cerdo Yorkshire de 3 meses de edad del norte de la provincia de Bs. As.alimentado con la formulacin distinta B

    Tamaos de las muestras: nA=10 y nB=11

    Varianzas Poblacionales: A2 = B

    2 = 2 (desconocidas)

    Nivel de significacin: =0,05

    Nivel de confianza: 1 - = 0,95

    Solucin

    a)

    Hiptesis de trabajo: La ganancia media de peso de los animales alimentados con la racin B superala ganancia media de peso de los animales alimentados con racin A

    Verificacin de supuestos: En este caso, a diferencia del ejercicio anterior, en el enunciado seasegura la normalidad de ambas variables, por estudios anteriores. Por lo tanto no es necesaria laprueba de ShapiroWilks para verificarla. Por otro lado el supuesto de independencia tambin se cum-ple por la forma en que se realiz el experimento: a un grupo de cerdos, tomado al azar, se lo alimentacon la racin A y al otro grupo, tambin tomado al azar, se lo aliment con la racin B. Es decir que:XA N ( A,

    2) y XB N ( B,2) son variables aleatorias independientes. Observar que ambas va-

    riables tiene la misma varianza poblacional.

    Hiptesis estadsticas: La hiptesis de trabajo simblicamente nos lleva a la expresin:B A

    , por

    lo tanto esta corresponde a la hiptesis del investigador que ubicamos en la hiptesis alternativa.

    0

    1

    :

    :

    B A

    B A

    H

    H

    nuevamente, existen diversas formas de plantear la misma hiptesis, como por ejemplo:

    0

    1

    : 0

    : 0

    B A

    B A

    H

    H

    y otras ms. En este caso, se trabajar con la segunda expresin y se concluir para esta expresin:

    0

    1

    : 0

    : 0B A

    B A

    H

    H

  • 7/29/2019 Analitica Guia 2013

    14/103

    Nivel de significacin: =0,05

    Variable pivotal: En este caso, como en el ejercicio anterior, se est realizando un test para ladiferencia de medias poblacionales, por lo tanto hay dos opciones para la variable pivotal (Z o t-Student).Como las varianzas poblacionales son desconocidas no se puede utilizar la variable Z, por lo tanto seutilizar la variable pivotal t de Student, cuya frmula es:

    .

    Donde Sa es la raz cuadrada positiva de la varianza amalgamada, es decir que es un promedioponderado entre la varianza muestral de la variable XA y la varianza muestral de la variable XB y estima ala nica varianza poblacional que se desconoce, 2.

    Regin crtica: Observando la hiptesis alternativa planteada se deduce que la regin crtica esunilateral derecha (es decir que se rechaza la hiptesis nula a valores grandes de la variable pivotal). El

    valor crtico que se utiliza es2;1 10 11 2;0,95 19;0,95 1,729A Bn nt t t , por lo tanto la regin crtica es:

    1,729t . Grficamente:

    Regla de decisin: Rechazo H0 si0

    1,729Ht y no rechazo H0 si 0 1,729Ht

    Clculo: Para obtener el valor calculado del estadstico de prueba, hay que realizar ciertos clcu-

    los auxiliares ( 2A B aX ; X y S ) utilizando las frmulas habituales para las medias y las varianzas muestra-

    les, y la siguiente frmula para la varianza amalgamada:2 22 2( 1) ( 1)

    2A A B

    a

    A B

    n S n S S

    n n

    Se obtuvo: 2 226,3 ; 27,91 ; 4,90 ; 3,69A B A BX X S S y

    2 (9)4, 90 (10)3, 69 44,1 36, 9 4,2610 11- 2

    aS

    =19

    por lo tanto 2,06aS

    Reemplazando estos valores en la frmula de la variable pivotal queda:

    Como0

    1,78Ht y utilizando la regla de decisin se rechaza la hiptesis nula ya que 1,78 es mayor

    que 1.729.

    Conclusin: Con un nivel de significacin del 5% tengo evidencia suficiente para rechazar la hip-tesis nula (Ho: B - A 0), por lo tanto, la diferencia entre la media poblacional de la ganancia de pesode los cerdos alimentados con la racin B y la media poblacional de la ganancia de peso de los cerdosalimentados con la racin A es mayor a cero, en estas poblaciones de cerdos de 3 meses de raza

    Yorkshire del norte de la provincia de Buenos Aires.

  • 7/29/2019 Analitica Guia 2013

    15/103

    Respuesta: Se puede suponer, al 5%, que la ganancia media poblacional del peso de los cerdosalimentados con la racin B supera significativamente a la media poblacional del peso de los cerdosalimentados con la racin A.

    Para este problema, la salida de InfoStat correspondiente es:

    Prueba T para muestras IndependientesGr(1) Gr(2) n(1) n(2) media(1) media(2) p(Var.Hom.) T p prueba{A} {B} 10 11 26,30 27,91 0,6623 -1,78 0,0452 UnilatI

    Nota: InfoStat compara grupos en orden alfabtico, por lo cual la prueba es unilateral izquierda, o seaque utiliza H1: A- B

  • 7/29/2019 Analitica Guia 2013

    16/103

    -3,20 -2,48 -1,75 -1,02 -0,30

    Cuantiles de una Norm al(-1,79,0,70989)

    -3,20

    -2,48

    -1,75

    -1,02

    -0,30

    Cu

    antilesobservados(D)

    Qqplot

    Paciente 1 2 3 4 5 6 7 8 9 10

    Hemoglobina(mg%)

    Inicial(I) 12,2 11,3 14,7 11,4 11,5 12,7 12,3 13,0 12,7 13,0

    Despus de 3meses(F, o final)

    13,0 13,4 16,0 13,6 14,0 13,0 14,2 15,1 15,9 14,5

    Hay aumento significativo de hemoglobina despus del tratamiento al nivel del 5%?

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)D 10 -1,79 0,84 0,97 0,9425

    Datos del problema:

    Variable en estudio:D: diferencia entre la concentracin de hemoglobina en sangre (en mg%) al inicio del tratamiento

    con vitamina B12 y la concentracin de hemoglobina en sangre (en mg%) despus de tres meses deltratamiento con vitamina B12, de un paciente con anemia perniciosa.

    En smbolos: di = ii - fiEn la siguiente tabla estn calculados los valores correspondientes a la diferencia planteada:

    di -0,8 -2,1 -1,3 -2,2 -2,5 -0,3 -1,9 -2,1 -3,2 -1,5

    Nota: En este caso se utilizar: di = ii - fi, pero tambin se podra haber definido la variable como di =fi - i i . La definicin de esta variable debe quedar clara al comienzo de la resolucin del ejercicio y debemantenerse a lo largo del mismo.

    Nivel de significacin: =0,05

    Solucin:

    Hiptesis de trabajo: Hay aumento significativo del nivel de hemoglobina despus del tratamiento

    Antes de plantear las hiptesis estadsticas hay que analizar la situacin planteada, ya que no esigual a las anteriores, dado que no hay independencia entre las mediciones realizadas, ya que se realiza-ron dos veces sobre cada individuo, al inicio y al finalizar los 3 meses de aplicado el tratamiento con vita-mina B12. Por esta razn no se van a comparar las medias en los diferentes tiempos, sino que se va estu-diar la media de la variable diferencia.

    Verificacin de supuestos: En este caso, solamente hay que probar la normalidad de la variable D i. Elotro supuesto terico corresponde a la no independencia entre las mediciones, o sea, X 1 y X2 no son inde-pendientes.

  • 7/29/2019 Analitica Guia 2013

    17/103

    -3,20 -2,48 -1,75 -1,02 -0,30

    Cuantiles de una Norm al(-1,79,0,70989)

    -3,20

    -2,48

    -1,75

    -1,02

    -0,30

    Cuantilesobserv

    ados(D)

    Qqplot

    2

    0

    2

    1

    : se distribuye normal ( ; )

    : no se distribuye normal ( ; )

    D D

    D D

    H D

    H D

    Shapiro-Wilks (modificado)

    Variable n Media D.E. W* p (una cola)D 10 -1,79 0,84 0,97 0,9425

    Como 0,9425 es mayor que 0,10, no se rechaza la hiptesis nula. Entonces, con un nivel de significa-

    cin del 10% se puede concluir que la diferencia entre la concentracin de hemoglobina en sangre (mg%)al inicio del tratamiento con vitamina B12 y la concentracin de hemoglobina en sangre (mg%) luego de 3meses de tratamiento con vitamina B12 en pacientes con anemia perniciosa se distribuye normalmente.

    Simblicamente 2D D~ ( , )D N

    Hiptesis estadsticas: si el tratamiento produce un aumento en el nivel de hemoglobina ensangre, los niveles de hemoglobina medidos a los 3 meses deberan ser mayores que los medidos alinicio del tratamiento, es decir que la variable D = I F, tendra una media negativa. Simblicamente

    0D .

    La definicin de la hiptesis alternativa depende exclusivamente de la definicin de la variable enestudio, por esta razn debe quedar clara la forma en que se realiza la diferencia entre I i y Fi.

    Luego, las hiptesis estadsticas son:0

    1

    : 0: 0

    D

    D

    H

    H

    Variable pivotal: Por ser una prueba de medias apareadas la opcin ms usual para la variablepivotal es una t de Student (difcilmente se conocer la varianza de la variable diferencia) con la

    siguiente frmula: 1~d

    n

    d

    dt t

    s

    n

    . Observar que esta expresin es la misma que la utilizada en

    Elementos de Estadstica para estudiar una poblacin, la variable estudiada es D, su media muestral

    es d y su varianza muestral es 2DS .

    Regin crtica: Observando la hiptesis alternativa planteada, se ve que la regin crtica es unila-

    teral izquierda, con valor crtico:1;0,05 10 1;0,05 9;0,05 9;0,95 1,83nt t t t (los grados de libertad son

    10 - 1, porque hay 10 diferencias). Por lo tanto, la regin crtica queda definida como 1,83t .

    Grficamente:

    Regla de decisin: Rechazo H0 si0

    1,83Ht y no rechazo H0 si 0 1,83Ht

  • 7/29/2019 Analitica Guia 2013

    18/103

    Clculo: Para obtener el valor calculado del estadstico de prueba hay que realizar ciertos clculos

    auxiliares ( 2Dd y s ), utilizando las frmulas habituales para la media muestral y la varianza muestral,

    sobre las 10 diferencias.Utilizando los valores calculados para di (ver la tabla correspondiente al plantear la forma de realizar la

    misma), se obtuvo 21,79 0,71Dd y s , reemplazando en la frmula de la variable pivotal:

    0

    1,79 1,79 6,70,84 0,26

    10

    Ht .

    Como el valor observado6,7 es menor que1,83, vale decir pertenece a la regin crtica, se rechazala hiptesis nula.

    Conclusin: Con un nivel de significacin del 5% tengo evidencia suficiente para rechazar la

    hiptesis nula ( 0D ), por lo tanto la media poblacional de las diferencias entre la concentracin de

    hemoglobina en sangre (mg%) de pacientes con anemia perniciosa al inicio del tratamiento y laconcentracin de hemoglobina en sangre (mg%) de pacientes con anemia perniciosa despus de tresmeses de iniciado el tratamiento con vitamina B12 es menor que cero, en la poblacin de pacientes conanemia perniciosa. Por lo cual la hemoglobina aumenta significativamente luego del tratamiento con

    vitamina B12.

    A continuacin se da la salida del programa InfoStat para este problemaPrueba T para un parmetro Valor del parmetro probado: 0Variable n Media DE T p(Unilateral I)D 10 -1,79 0,84 -6,72

  • 7/29/2019 Analitica Guia 2013

    19/103

    cacin de la normalidad de las variables, ya que solamente hay que verificar que las variables cumplancon las condiciones de una variable binomial, es decir: Que cada repeticin del experimento tenga dos resultados posibles (xito y fracaso). Si lo aplica-

    mos al ejemplo veremos que las dos posibles respuestas que podemos obtener, al encuestar a unapersona, son: que le guste el programa del sbado a la noche y que no le guste el programa delsbado a la noche. Que los resultados (xito y fracaso) sean mutuamente excluyentes en una misma repeticin. Que los resultados (xito y fracaso) sean independientes de repeticin en repeticin. Que el nmero de repeticiones est prefijado de antemano y que la probabilidad de xito sea cons-

    tante a lo largo de todas las repeticiones del experimento aleatorio.

    En este caso ambas variables cumplen con estas condiciones.

    Estimacin puntual: Lo que se quiere estimar es:la diferencia entre las proporcionespoblacionales de adultos y adolescentes que ven el programa y les gusta, simblicamente: p1-p2. Porlo tanto la estimacin puntual de esta diferencia es la diferencia entre las proporciones estimadas,

    1 2 p p .

    1

    cantidad de adultos que ven el programa los sbados a la noche y les gusta 100 0,25

    cantidad total de adultos 400p

    2

    cantidad de adolescentes que ven el programa los sbados a la noche y les gusta 300 0,5

    cantidad total de adolescentes 600p

    Por lo tanto la estimacin puntual es:1 2 0,25 0,5 0,25p p

    Intervalo de confianza: La frmula del intervalo de confianza para la diferencia de proporciones sededuce de la nica variable pivotal posible, cuya frmula es:

    Por lo tanto la frmula del intervalo es:

    Reemplazando:

    Conclusin: Con un nivel de confianza del 95% se espera que el intervalo [-0,31;-0,19] cubra ocontenga a la diferencia entre la proporcin poblacional de adultos que ven el programa los sbados ala noche y les gusta y la proporcin poblacional de adolescentes que ven el programa los sbados a lanoche y les gusta.

    b) Las hiptesis estadsticas son: H0: p1-p2=0 versus H1:p1-p2 0

    El nivel de significacin es 5%, siendo el estadstico de contraste:

  • 7/29/2019 Analitica Guia 2013

    20/103

    La regin crtica es bilateral, y est formada por los valores de Z mayores o iguales a 1,96, y los meno-

    res o iguales a -1,96.

    La regla de decisin es: RECHAZO H0 si Zobs 1,96 o Zobs -1,96

    NO RECHAZO H0 si -1,96 < Zobs < 1,96

    1 2

    1 2

    100 300 0,4

    400 600

    x xp

    n n

    Como Zobs = -7,81 la decisin es

    ..............................................................................................................................

    En esta situacin (regin crtica bilateral) el p valor se grafica y se calcula de la siguiente forma:

    p valor= 2*(min { P(Z -7,81) P(Z -7,81) } ) = 2* P(Z -7,81)

    Con un nivel de significacin del 5%, hay/no hay (tache lo que no corresponda) evidencias suficientes

    para rechazar H0, por lo tanto ...................................................................................................................

    .....................................................................................................................................................................

    .....................................................................................................................................................................

    6) Basndose en el mismo texto y los mismos datos del problema 02, responda los siguientes tems:a.- Estimar el cociente entre las varianzas, puntualmente y con un nivel de confianza del 95%.b.- Los nutricionistas que desarrollaron la nueva racin (B) sostienen que adems esta genera mayoruniformidaden el crecimiento. Probar la hiptesis sugerida con un nivel de significacin del 5%.(Nota:Mayor uniformidad hace referencia a la obtencin de ganancias de peso parecidas dentro dellote, con baja dispersin, siendo esta una caracterstica deseada por los productores.)Solucin: Los datos son los mismos que los del problema 3 y los supuestos tericos tambin

    a)

    Estimacin puntual: se pide estimar puntualmente el cociente entre las varianzas, por ejemplo,

    simblicamente2

    2

    A

    B

    , cuyo estimador puntual es el cociente de las varianzas muestrales, es decir2

    2

    A

    B

    S

    S

  • 7/29/2019 Analitica Guia 2013

    21/103

    Utilizando la frmula de la varianza muestral se obtiene:

    Por lo tanto el estimador puntual del cociente entre SA2 y SB

    2 es:

    2

    2

    4,91,3279

    3,69

    A

    B

    S

    S

    (Nota: En este caso se estima el cociente entre la varianza poblacional de A sobre la varianza pobla-cional de B, pero tambin podramos resolver este ejercicio haciendo el cociente inverso, dado que enel enunciado no hay ninguna orientacin en especial para realizarlo.)

    Intervalo de confianza: La frmula del intervalo de confianza para el cociente de varianzas se de-duce de la variable pivotal que se utiliza para estudiar el cociente de varianzas, cuya frmula es:

    2 2

    2 2

    ( 1),( 1) ( 1),( 1)2 2

    2 2

    ~ o ~A B A B

    A A

    A B

    n n n n

    B A

    B B

    S S

    SF F F F

    S

    La distribucin se grafica de la siguiente manera:

    Donde: 1( 1),( 1);

    2A Bn n

    F F y 2( 1),( 1);1

    2A Bn n

    F F .

    Como en la tabla de F de Snedecor que se usa en elpresente curso el valor de F1 no est tabulado, para conocerlo es necesario hacer uso de la siguienteigualdad:

    ( 1),( 1);2

    ( 1),( 1);12

    1

    A B

    B A

    n n

    n n

    FF

    Por ejemplo, en el problema que estamos resolviendo:

    9,10;0,975 9,10;0,025 9,10;0,02510,9;0,975

    1 1

    3,78; ; 0,25.3,96F F FF

    El intervalo se construye basndose en las siguientes igualdades:

    2

    2

    2( 1),( 1); ( 1),( 1);1

    2 22

    1A B A B

    A

    B

    n n n nA

    B

    S

    SP F F

  • 7/29/2019 Analitica Guia 2013

    22/103

    2

    2

    2

    ( 1),( 1); ( 1),( 1);122 2

    1 11

    A B A B

    A

    B

    An n n n

    B

    PSF F

    S

    2

    2

    2

    ( 1),( 1);1 ( 1),( 1);22 2

    1 11

    A B A B

    A

    B

    An n n n

    B

    PSF F

    S

    2 2

    2 2 2

    2

    ( 1),( 1);1 ( 1),( 1);2 2

    1

    A B A B

    A A

    B A B

    Bn n n n

    S S

    S SP

    F F

    Entonces, en nuestro problema:2

    2

    1, 3279 1, 3279

    3,78 0, 25

    A

    B

    2

    20, 3513 5, 3116A

    B

    Conclusin: Con una confianza del 95% se espera que el intervalo [0,35136; 5,3116] cubra, ocontenga, al cociente entre la varianza poblacional de la ganancia de peso de los cerdos Yorkshire de 3meses de edad del norte de la provincia de Buenos Aires alimentados con la racin A durante 30 das, yla varianza poblacional de la ganancia de peso de los cerdos Yorkshire de 3 meses de edad del norte de la

    provincia de Buenos Aires alimentados con la racin B durante 30 das.

    b)

    Hiptesis de trabajo:la nueva racin genera mayor uniformidad en el crecimiento.

    Supuestos tericos: Ya fueron verificados en el ejercicio 3

    Hiptesis estadsticas: Si se quiere probar que la nueva formulacin es ms uniforme, se quiere

    probar que la nueva formulacin es menos variable que la racin A, simblicamente: 2 2A B

    , esta

    expresin no contiene el signo igual por lo que corresponde a la hiptesis alternativa. Entonces las

    hiptesis quedan:

    2 2

    0

    2 2

    1

    :

    :

    A B

    A B

    H

    H o equivalentemente

    2

    0 2

    2

    1 2

    : 1

    : 1

    A

    B

    A

    B

    H

    H

    al igual que en las dems pruebas se debe plantear solo un par de hiptesis y mantenerlas a lo largo de

    toda la prueba, en esta caso vamos a trabajar con

    2

    0 2

    2

    1 2

    : 1

    : 1

    A

    B

    A

    B

    H

    H

    Nivel de significacin: =0,05

    Variable pivotal: Existe una nica opcin al elegir la variable pivotal en esta prueba, la F de Snedecor,cuya frmula es:

  • 7/29/2019 Analitica Guia 2013

    23/103

    2 2

    2 2

    ( 1),( 1) ( 1),( 1)2 2

    2 2

    ~ o ~A B A B

    A A

    A Bn n n n

    B A

    B B

    S S

    SF F F F

    S

    Regin crtica: Observando la hiptesis alternativa, se ve que la regin crtica es unilateral derecha. El

    valor crtico que la determina, debe buscarse en la tabla de la distribucin de F de Snedecor y es:1, 1 ;1 10 1,9 1 ;1 0,05 9,10 ;0,95

    3,02A Bn n

    F F F , por lo tanto la regin crtica est determinada por

    3,02F

    Regla de decisin: Rechazo H0 si0

    3,02HF y no rechazo H0 si 0 3,02HF

    Clculo del estadstico de prueba: Todos los valores necesarios ya fueron calculados, por lo tanto,reemplazando en la frmula, se obtiene:

    Observar que el cociente de las varianzas poblacionales fuereemplazado por 1, porque el clculo se hace bajo la hiptesis nula queplantea la igualdad de las varianzas. Como 1,3279 es menor que 3,02,

    no se rechaza la hiptesis nula.

    Conclusin: Con un nivel de significacin del 5% no hay evidencia suficiente para rechazar H0

    (2

    0 2: 1A

    B

    H ). Esto significa que el cociente entre la varianza poblacional de la ganancia de peso de los

    cerdos Yorkshire del norte de la provincia de Buenos Aires de 3 meses de edad alimentados con laracin A y la varianza poblacional de la ganancia de peso de los cerdos Yorkshire del norte de laprovincia de Buenos Aires de 3 meses de edad alimentados con la racin B, es menor o igual a 1. Porlo tanto, al mismo nivel, no es cierta la hiptesis de los nutricionistas.

    Nota: a continuacin se da la salida del programa InfoStat para este problema. Observar que los

    resultados son los mismos que se obtuvieron anteriormente.

    Prueba F para igualdad de varianzasGrupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F p prueba

    1 2 10 11 4.900 3.691 1.328 0.3312 Unilat D

    7) Con el fin de comparar el rendimiento acadmico (en una escala de 0 a 10 puntos) entre estableci-mientos privados y estatales, se seleccionan aleatoriamente 15 personas que han realizado estudiossecundarios en establecimientos privados, y 15 personas que han realizado estudios secundarios enestablecimientos estatales. Los datos obtenidos son los siguientes:

    PRIVADO 7 6 4 7 5 5 4 9 9 8 4 5 5 7 5

    ESTATAL 9 6 5 6 5 4 4 4 4 4 6 3 3 5 4

    Podemos suponer que los rendimientos acadmicos difieren significativamente? ( =0,05)Shapiro-Wilks (modificado)Secundario Variable n Media D.E. W* p (una cola)Estatal Rendim 15 4,80 1,52 0,85 0,0330Privado Rendim 15 6,00 1,73 0,85 0,0253

    Como primer paso debemos verificar el supuesto de normalidad, por lo que realizamos el test de Sha-piro-Wilks:

    No se cumple el supuesto de normalidad para el rendimiento acadmico de las personas que provie-nen de establecimientos secundarios estatales y privados, por lo que no podemos realizar una prueba tpara muestras independientes, debemos realizar un anlisis no paramtrico, la prueba de Mann-Whitney.

    0

    2

    2

    2

    2

    4,9

    3,691,3279

    1

    A

    BH

    A

    B

    S

    SF

  • 7/29/2019 Analitica Guia 2013

    24/103

    Como podemos ver en el boxplot, las distribucio-nes de rendimiento acadmico de los individuosque provienen de establecimientos estatales yprivados, son similares.

    Ambas son asimtricas positivas, ya que prcti-camente coinciden el C2 con el C1. La falta denormalidad ya la habamos confirmado con laprueba de Shapiro Wilks.

    Las hiptesis a testear en este caso son:

    H0: E P = 0 vs H1: E P 0 (hiptesis bilateral)

    Se combinan ambas muestras en una nica muestra ordenada y luego asignamos a cada dato su ran-go (posicin) sin tener en cuenta de cul de las muestras proviene.

    3+4+5+6+7+8+9+10+11 63= = 7

    9 9

    Estadstico:

    T = Suma de rangos de una de las muestras

    El valor esperado del estadstico y la varianza del estadstico bajo H0son, respectivamente:

    T (estatal)= 1,5*2 + 7*6 + 15,5*3 + 21,5*3 + 29 = 185

    T

    nnnTE

    2

    )1()( 211

    15*(15 15 1)( ) 232,5

    2E T

    22121

    12

    )1(V(T) T

    nnnn

    15*15 *(15 15 1)V(T) 581,25

    12

    581,5 24,109T

    )1;0(V(T)

    E(T)-TZobs N

    185 232, 51,97

    24,109obsZ

    A un nivel de significacin del 5%, y para nuestra hiptesis, rechazamos H0 si Zobs< -1,96 o Zobs>1,96Puesto que -1,97 < -1,96, la decisin es rechazar Ho.

    Datos Secundario Orden Rango3 Estatal 1 1,53 Estatal 2 1,54 Estatal 3 74 Estatal 4 74 Estatal 5 74 Estatal 6 74 Estatal 7 74 Estatal 8 74 Privado 9 74 Privado 10 74 Privado 11 75 Estatal 12 15,55 Estatal 13 15,55 Estatal 14 15,55 Privado 15 15,55 Privado 16 15,55 Privado 17 15,55 Privado 18 15,5

    5 Privado 19 15,56 Estatal 20 21,56 Estatal 21 21,56 Estatal 22 21,56 Privado 23 21,57 Privado 24 257 Privado 25 257 Privado 26 258 Privado 27 279 Estatal 28 299 Privado 29 299 Privado 30 29

  • 7/29/2019 Analitica Guia 2013

    25/103

    Al nivel del 5%, existen evidencias suficientes para rechazar H0, por lo que la mediana poblacional delrendimiento acadmico de los individuos que han realizado estudios secundarios en establecimientosestatales es distinta a la mediana poblacional de los que han realizado sus estudios secundarios en esta-blecimientos privados.Como respuesta a la pregunta, podemos decir, que, al 5%, los rendimientos acadmicos difieren significa-tivamente entre los individuos que han realizado sus estudios secundarios, al comparar establecimientos

    estatales y privados.

    Utilizando InfoStat, tenemos que aplicar el test de Wilcoxon para muestras independientes, y obtenemos lasiguiente salida, en la que figuran medidas resumen, el estadstico correspondiente, y el p-valor de laprueba.

    Prueba de Wilcoxon para muestras independientes (Mann Whitney)Variab Gr1 Gr2 n1 n2 Me1 Me2 R-media1 R-media2 W p(2 colas)

    Rta ESTATAL PRIVADO 15 15 4,00 5,00 12,33 18,67 185,0 0,0433

    8) Los datos que se presentan a continuacin provienen de los pesos, en g, de 22 ratas hembras, de entre28 y 84 das de vida. Doce de ellas fueron alimentadas con una dieta alta en protenas, y 10 con una dietabaja en protenas.

    Alta en protena 120,2 120,57 119,78 120,29 118,62 120,69 120,27 119,13 118,04 120,29 117,46 119,7

    Baja en protena 102,13 105,3 103,39 104,73 98,00 95,89 98,65 98,73 95,2 102,47

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)Alta en protena 12 119.58 1.049 0.8715 0.1683

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)Baja en protena 10 100.45 3.62 0.9282 0.4305

    a) Se puede suponer, al 5%, que el peso medio de las ratas alimentadas con la dieta alta enprotenas es mayor que el peso medio las ratas alimentadas con la dieta baja en protenas?

    b) Construir un intervalo para la diferencia de medias al 95%. Qu puede concluir?

    Datos del problema:

    Variables en estudioX1: peso de una rata de entre 28 y 84 das de vida alimentada con una dieta alta en protenas. Medida

    en g.X2: peso de una rata de entre 28 y 84 das de vida alimentada con una dieta baja en protenas.

    Medida en g.

    Tamaos de las muestras: n1= 12 y n2= 10

    Varianzas poblacionales: Desconocidas

    Nivel de significacin: =0,05

    Nivel de confianza: 1- =0,95

    Solucin:a)

    La hiptesis de trabajo que se desea poner a prueba es:La dieta alta en protenas produce un peso medio mayor que la dieta baja en protenas

    Verificacin de supuestos: Para poder plantear las hiptesis estadsticas y poder llevar a cabo laprueba, hay que verificar los supuestos tericos necesarios. En este caso, los supuestos son que am-bas variables (X1 y X2) sean independientes y se distribuyan normalmente. El supuesto de indepen-

    dencia se cumple por la forma en que se realiz el experimento: a un grupo de ratas seleccionadoaleatoriamente se le suministr la dieta alta en protenas y a otro grupo, tambin tomado al azar, se lesuministro una dieta baja en protenas.

  • 7/29/2019 Analitica Guia 2013

    26/103

    Para X1: se realiz un test de Shapiro Wilks cuyas hiptesis son:

    Al realizar el test, utilizando InfoStat, se obtuvieron los siguientes resultados:

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)X1 12 119.58 1.049 0.8715 0.1683

    Como p-valor= 0,1683 y es mayor que =0,10, no se rechaza la hiptesis nula. por lo tanto, con un nivelde significacin del 10% se puede decir que la variable X1 (peso de una rata de entre 28 y 84 das de vidaalimentada con una dieta alta en protenas medido en g) se distribuye normalmente.

    Anlogamente se estudia la normalidad de la variable X2:

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)X2 10 100.45 3.62 0.9282 0.4305

    Como p-valor= 0,4305 y es mayor que =0,10, no se rechaza la hiptesis nula. Por lo tanto, con un nivelde significacin del 10%, se puede decir que la variable X2 (peso de una rata de entre 28 y 84 das de vidaalimentada con una dieta baja en protenas medida en g) se distribuye normalmente.

    En este caso, no hay informacin de las varianzas poblacionales, por lo tanto son desconocidas, y hay queprobar si son iguales. Para esto hay que realizar un test de homogeneidad de varianzas, cuyas hiptesisson:

    2

    2

    2

    11

    2

    2

    2

    10

    :

    :

    H

    H

    Prueba F para igualdad de varianzasVariable Grupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F p pruebaPeso {Alta} {Baja} 12 10 1,10 13,10 0,08 0,0009 Bilateral

    El resultado del estadstico es F= 0,08 y un p-valor de 0,0009, por lo tanto se rechaza la hiptesis dehomogeneidad de varianzas.Es decir que ambas variables se distribuyen normalmente con varianzas desconocidas y diferentes.

    Hiptesis estadsticas.Como el inters del investigador es probar si al alimentar a las ratas con una dieta con alta con-

    centracin de protenas produce un peso medio superior, simblicamente: 21 . Por lo que las

    hiptesis estadsticas son:

    211

    210

    :

    :

    H

    H

    Nivel de significacin: =0,05

    Estadstico de prueba (o variable pivotal)Se est realizando un test de hiptesis para la diferencia de medias poblacionales de variables

    con distribucin normal, por lo cual se cuenta con dos opciones al elegir la variable pivotal: Z o t deStudent, dependiendo del hecho de conocer o no las varianzas poblacionales. En este caso, las va-

  • 7/29/2019 Analitica Guia 2013

    27/103

    rianzas poblacionales son desconocidas y desiguales, por lo tanto se utiliza una t, con la siguiente ex-

    presin:wt

    n

    s

    n

    s

    XX

    2

    2

    2

    1

    2

    1

    21 0)(T con

    22 2

    1 2

    1 2

    2 22 2

    1 2

    1 2

    1 21 1

    s s

    n nw

    s s

    n n

    n n

    Regin crtica:

    Es unilateral derecha, dado que H1: 1- 2>0 , por lo tanto el valor crtico es: 95,0,wt , siendo w

    El valor crtico es 812,195,0,10t y la regin crtica queda determinada por: 812,1t

    Regla de decisin: Rechazo H0 si 812,10H

    t

    No rechazo H0 si 812,10H

    t

    Clculo de tHo:Hasta este momento no fueron necesarias las muestras, excepto en la verificacin de supuestos,

    sin embargo se podra haber hecho con muestras piloto y recin en esta instancia extraer las muestraspara el anlisis. Antes de calcular el valor del estadstico de prueba hay que calcular las medias mues-trales utilizando las frmulas dadas en la unidad de estadstica descriptiva de Elementos de Estadsti-

    ca: 45,10058,119 21 XX . Hay que tener en cuenta que la prueba se est realizando bajo lahiptesis nula que contiene el caso en que las medias poblacionales son iguales, por lo tanto la dife-

    rencia de las medias poblacionales es cero, es decir que 1 2 0. Reemplazando estos valores y

    el resto de la informacin en la frmula nos queda:

    0

    1 2H

    2 2

    1 2

    1 2

    ( ) 0 (119,58 100,45) 19,13 19,13 19,13T 16,162

    1,18361,1 13,1 0.091 1,31 1,40112 10

    X X

    s sn n

    Decisin: Se rechaza la hiptesis nula porque 162,160H

    t , es mayor que 1,812

    Conclusin: Con un nivel de significacin de 5% tengo evidencia suficiente para rechazar la hip-

    tesis nula ( 210 :H ), por lo tanto la media poblacional del peso de las ratas de entre 28 y 84 das

    de vida que reciben la dieta alta en protenas es mayor que la media poblacional de las ratas de entre28 y 84 das de vida que reciben la dieta baja en protenas, en estas poblaciones de ratas en estudio.

    b) La frmula del intervalo del 95% que se est pidiendo se despeja de la variable pivotal y es:

    2

    2

    2

    1

    2

    1

    21,21

    2

    2

    2

    1

    2

    1

    21,21

    )(;)(ns

    nstXX

    ns

    nstXX

    ww

  • 7/29/2019 Analitica Guia 2013

    28/103

    reemplazando se obtiene que

    10;0,975 10;0,975

    1,1 13,1 1,1 13,1(119,58 100, 45) ; (119,58 100, 45)

    12 10 12 10

    (19,13) 2,228 0,091 1,31; (19,13) 2,228 0,091 1,31

    (19,13) 2,228 1,401; (19,13) 2,228 1,401 (19,13) 2,228(1,1

    t t

    836); (19,13) 2,228(1,1836)

    (19,13) 2,637; (19,13) 2,637 16,493 g; 21,767 g

    0

    1 2H

    2 2

    1 2

    1 2

    ( ) 0 (119,58 100,45) 19,13 19,13 19,13T 16,162

    1,18361,1 13,1 0.091 1,31 1,401

    12 10

    X X

    s s

    n n

    Conclusin: Con un nivel de confianza del 95%, se espera que el intervalo (16,493 g; 21,767 g) cubrao contenga a la diferencia entre la media poblacional del peso de la ratas de entre 28 y 84 das de vida

    alimentadas con la dieta alta en protenas y la media poblacional de las ratas de entre 28 y 84 das devida alimentadas con la dieta baja en protenas, en estas poblaciones de ratas de entre 28 y 84 das devida.La correspondiente salida de Infostat es:Prueba T para muestras Independientes

    Variable:peso - Clasific:Variab - prueba:Unilateral

    Grupo 1 Grupo 2

    X1 X2

    n 12 10

    Media 119,59 100,45

    Varianza 1,10 1,10

    pHomVar 0,0003

    T 16,16p-valor

  • 7/29/2019 Analitica Guia 2013

    29/103

    3) Las personas que tienen el sndrome de Raynaud sufren un sbito deterioro en la circulacin sanguneade los dedos de las manos y de los pies. Para estudiar esta enfermedad, en un experimento se midi lageneracin de calor, mediante calorimetra, en cal/cm2/min, de un dedo ndice luego de haberlo sumergidoen agua a 19C. En este estudio, se cont con una muestra tomada al azar de 10 individuos con elsndrome y una muestra de 10 individuos sanos.

    Sanos (S) 2,43 1,83 2,43 2,70 1,88 1,96 1,53 2,08 1,85 2,44Sndrome de Raynaud (E) 0,81 0,70 0,74 0,36 0,75 0,56 0,65 0,87 0,40 0,31

    Asuma que las distribuciones de ambas variables son normales, y que E2 = S

    2.a) a.- Definir:

    Variables en estudio: ........................................................................................................................

    .............................................................................................................................................................

    .............................................................................................................................................................

    Parmetros: .....................................................................................................................................

    .............................................................................................................................................................

    .............................................................................................................................................................Poblaciones: ....................................................................................................................................

    .............................................................................................................................................................

    .............................................................................................................................................................

    b) b.- Estimar puntualmente y por intervalo de confianza la diferencia entre la generacin de calormedia de los individuos enfermos ( E) y la generacin de calor media de los individuos sanos ( S)(1- = 0,95).

    c) c.- Se cree que la generacin de calor por parte de los afectados por este sndrome es mshomognea. Probarlo con un nivel de significacin del 5%.

    4) De una poblacin de individuos afectados por una enfermedad, se tomaron dos muestras aleatorias eindependientes de 100 individuos cada una. A una de las mismas (que llamaremos grupo A), se leadministr un suero, al otro grupo (B, control) se le administr un placebo; en todo lo dems, los dosgrupos fueron tratados idnticamente. Se encontr que en los grupos A y B, 75 y 55 individuos,respectivamente, se haban recuperado luego de un mes de observacin. Probar la hiptesis de que elsuero ayuda a curar la enfermedad con un nivel de significacin del 5%.

    a) La hiptesis de trabajo es: .........................................................................................................

    .....................................................................................................................................................

    .....................................................................................................................................................

    b) La regin crtica es .....................................................

    c) El valor calculado del estadstico de prueba es:

    Frmula empleada Reemplazo numrico Resultado

    d) Conclusin a la que llega luego de la prueba: .......................................................................................

    .......................................................................................................................................................

    ..............................................................................................................................................................................................................................................................................................................

    .......................................................................................................................................................

  • 7/29/2019 Analitica Guia 2013

    30/103

    5) Un estudio llevado a cabo para probar si la aspirina afecta el tiempo de coagulacin, se tom unamuestra de 12 adultos varones. El tiempo de protrombina, que mide el tiempo en segundos entre elinicio de la reaccin de coagulacin y la formacin del cogulo, fue medido en cada uno de losindividuos antes y despus de 3 hs de haber ingerido dos tabletas de aspirina (500mg cada una).

    Antes 12,3 12,0 12,0 13,0 13,0 12,5 11,3 11,8 11,5 11,0 11,0 11,3Despus 12,0 12,3 12,5 12,0 13,0 12,5 10,3 11,3 11,5 11,5 11,0 11,5

    a) Probar si existe alguna diferencia en el tiempo de protrombina con un nivel de significacin del 5%,tener en cuenta la verificacin de supuestos, sin hacer clculos y utilizando la informacin que leproporciona alguna de las salidas de InfoStat que abajo se detallan. Comente brevemente por qu eligiesa salida y a qu decisin llega a partir de la informacin.

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)antes 12 11.89 0.71 0.89 0.2210

    despus 12 11.79 0.75 0.97 0.9213

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)

    Dif_AD 12 0,11 0,51 0,86 0,1172

    Prueba T para muestras IndependientesGrupo1 Grupo2 n1 n2 med1 med2 LI(95%) LS(95%) T p pruebaAntes Despus 12 12 11,89 11,78 -0,51 0,72 0,37 0,7186 Bilat

    Prueba T para un parmetroValor del parmetro probado: 0Variable n Media DE LI(95) LS(95) T p(Bilateral)Dif_AD 12 0,11 0,51 -0,21 0,43 0,74 0,4748

    .......................................................................................................................................................

    .......................................................................................................................................................

    b) El intervalo de confianza correspondiente tiene como lmites: .........................................................

    c) La conclusin para el intervalo de confianza es: ............................................................................

    .......................................................................................................................................................

    .......................................................................................................................................................

    .......................................................................................................................................................

    6) Las empresas que comercializan agua para beber, realizan controles de calidad diariamente. Una delas variables de inters es el pH, que mide el grado de acidez del agua contenida en los envases listapara su distribucin. Un pH menor a 7 es considerado cido, un pH mayor a 7 es considerado alcalinoy un pH igual a 7 es considerado neutro. Un investigador sospecha que el material de los nuevos en-vases modifica el pH del agua. Para estimar la diferencia entre los pH medios, extrae 20 muestras deagua con el envase viejo y 15 muestras de agua con el envase nuevo. Algunos datos obtenidos son:

    Media Desvo Shapiro-Wilks (p-valor)Envase viejo 8,366 0,54 0,6413Envase nuevo 6,318 3,73 0,9609

    Al hacer la prueba de homogeneidad de varianzas, result: F = 0,0209, p-value = 0

    Construir un intervalo para la diferencia de medias al 95%. Qu puede concluir?

    7) Alle y Bowen (1932) estudiaron el tiempo de supervivencia de la carpa dorada, en minutos, cuando secoloca en suspensiones de plata. Los investigadores realizaron varios experimentos, entre ellos el siguien-te: se asignan aleatoriamente 10 carpas a cada grupo. En uno de ellos se exponen a las carpas a unaconcentracin baja de nitrato de plata disuelto en el agua (Conc1, 50 g/l), y el otro grupo, a una concentra-cin mayor (Conc2, 80g/l). Al nivel del 5%, difieren los tiempos de supervivencia?

  • 7/29/2019 Analitica Guia 2013

    31/103

    Conc1 Conc2210 81180 75

    240 15660 18055 10275 20078 13582 85

    125 7883 87

    Shapiro-Wilks (modificado)Concentracin Variable n Media D.E. W* p (una cola)1 Sobrevida 10 118,80 67,11 0,81 0,02472 Sobrevida 10 117,90 46,46 0,82 0,0307

    Prueba de Wilcoxon para muestras independientes (Mann Whitney)Variable Gr1 Gr2 n1 n2 Me1 Me2 R-media1 R-media2 W p(2 colas)

    Sobrevida 1 2 10 10 82,50 94,50 9,75 11,25 97,50 0,5703

    CUESTIONARIO

    1.- Cul es el objeto de un diseo experimental? Qu beneficios trae?

    2.- De qu manera puede controlarse la confusin de factores en el estudio experimental?

    3.- Cul/es de las siguientes preguntas corresponde hacerse en un estudio observacional? Tache loque no corresponda.

    a) se aleatorizaron las asignaciones a tratamiento y control? S NO

    b) qu caracterstica determin la separacin entre los grupos? S NO

    c) existen factores que pueden confundirse con los tratamientos? S NO

    d) si existe posibilidad de confusin, puede controlarse? S NO

    4.-En los estudios observacionales pueden establecerse asociaciones, es decir poner de manifiestoque una cosa est relacionada con otra. Pueden estos estudios establecer causalidad?

    5.- Cmo diseara un experimento para estudiar si la hipertensin durante el embarazo provocabebs nacidos con menor peso? Qu factor podra confundirse y cmo lo controlara?6.- Segn un estudio observacional realizado en el Kaiser Permanente de Walmut Creek, California, sedaba un ndice ms elevado de cncer de cuello de matriz entre mujeres que usaban anticonceptivos ora-les que entre las que no usaban, independientemente de su edad, educacin, estado civil, religin y hbitode fumar. Los investigadores llegaron a la conclusin de que la pldora causaba el cncer del cuello dematriz. Es correcta esta afirmacin? Por qu?

    7.- Identifique en el ejemplo anterior los trminos: unidad experimental, tratamiento, factor, niveles del

    8.- En qu casos debe aplicarse el test de Welch?

    1 2

    Concentracin

    50

    100

    150

    200

    250

    Sobrevida

    Boxplot

  • 7/29/2019 Analitica Guia 2013

    32/103

    9.- Qu entiende por confianza en la estimacin de un intervalo?

    10.- Qu ocurre con la amplitud de un intervalo de confianza para la diferencia de mediaspoblacionales con varianzas desconocidas pero iguales si:

    a.- aumenta el tamao de las muestras (mantenindose la varianza muestral constante)

    b.- disminuye el nivel de confianza.

    c.- disminuye la variabilidad de las muestras.

    11.- Puede resultar negativo algn lmite de un intervalo de confianza para la diferencia de dosproporciones? Justifique su respuesta.

    12- En qu casos es recomendable aplicar un test de Mann Whitney? Explicite los supuestos y lashiptesis que se corresponden con los mismos.

    13.- Cundo le parece conveniente utilizar una prueba para la media de las diferencias apareadas?Cuntas son las variables en estudio?

    14.- Se tiene la sospecha de que la proporcin de individuos que no tienen enfermedades cardiovascu-lares en la poblacin A es mayor que en la poblacin B. Para poner a prueba esta hiptesis se tom

    una muestra aleatoria de individuos de la poblacin A y otra de la poblacin B y se observ el nmerode individuos sin esta afeccin en cada grupo.

    a) La hiptesis de trabajo es: ..........................................................................................................

    .......................................................................................................................................................

    .......................................................................................................................................................

    b) Interpretacin biolgica de parmetro/s en estudio: ......................................................................

    .......................................................................................................................................................

    .......................................................................................................................................................

    c) Las hiptesis estadsticas son: .....................................................................................................

    d) Los supuestos necesarios para la validez de la prueba estadstica son: .....................................

    .......................................................................................................................................................15.- En dos poblacin con 1 > 2 se realiz la dcima H0: 1 = 2 contra H1: 1 2 y resultsignificativa al 1%, es decir se rechaz H0. En qu situacin de las cuatro posibles ubica esteejemplo? Cul es la probabilidad asociada a esta situacin?

    16.- En qu caso o casos es conveniente utilizar una prueba de Mann Whitney? Indicar hiptesisestadsticas, variable pivotal y su distribucin.

  • 7/29/2019 Analitica Guia 2013

    33/103

    27

    Unidad 2: CONTRASTES de CHI-CUADRADO

    Objetivos especficosElegir las hiptesis adecuadas a cada problema planteado con datos categricos y seleccionar laprueba correspondiente.

    Aplicar correctamente los contrastes Chi Cuadrado para los ensayos de independencia, homogeneidad

    y bondad de ajuste.

    Contenidos temticosBondad de ajuste. Tablas de contingencia: Ensayos de Independencia. Contrastes Ji-cuadrado parahomogeneidad convarias poblaciones. Alcance de los ensayos.

    GlosarioDatos categorizados (cualitativos o atributos). Respuestas categricas y dicotmicas. Categorasmutuamente excluyentes. Categoras independientes. Frecuencia observada. Frecuencia esperada oterica. Frecuencia total o marginal. Tablas o criterios de clasificacin. Bondad de ajuste entre frecuenciasobservadas y frecuencias tericas. Hiptesis de independencia. Asociacin entre atributos. Hiptesis dehomogeneidad.

    PROBLEMAS RESUELTOS01.- Se realiz un estudio para saber si el grado de eficacia de un medicamento contra mastitis a partir delnivel de mejora est relacionado con el nivel de gravedad del cuadro clnico. Se tom una muestra de 642vacas lecheras con mastitis y se registr el nivel de gravedad. A todas se las trat con la misma dosis delmedicamento y luego de 10 das se las clasific en funcin del nivel de mejora. Los resultados seobservan en la siguiente tabla:

    Nivel de mejora

    Ninguna Ligera Notable

    Niveles de

    Infestacin

    Leve 8 7 12

    Intermedio 6 37 36Grave 37 148 351

    Es sustentable la hiptesis de que existe relacin entre la eficacia del medicamento y el nivel de mastitisdel animal al 5%? Justifique.

    Datos del problema:Variables en estudio:

    X1: Nivel de infestacin de un paciente, categorizada en leve, intermedio y graveX2: Nivel de mejora de un paciente, categorizada en ninguna, ligera y notable

    Cantidad y tamao de muestras: hay una nica poblacin de pacientes de la cual se extrajo una nicamuestra de tamao 642

    Nivel de significacin: = 0,05Se completa la tabla de frecuencias observadas (o ij) con los totales de filas y columnas (o i y o j ,

    respectivamente) y el total general (o = n)

    Nivel de mejoraNinguna Ligera Notable Total

    Niveles de

    Infestacin

    Leve 8 7 12 27

    Intermedio 6 37 36 79

    Grave 37 148 351 536

    Total 51 192 399 642=n

  • 7/29/2019 Analitica Guia 2013

    34/103

    28

    Solucin:Existen dos variables en estudio X1 y X2 ambas con tres categoras y una nica poblacin de

    vacas. Se quiere probar si las variables, o criterios de clasificacin, nivel de infestacin y nivel de mejora,son independientes en la poblacin. Entonces nuestras hiptesis estadsticas son:

    cumplesenoanterioresigualdadeslasdealguna:H

    3,2,1;3,2,1p*pp:H

    1

    jij0 jiparai

    En este caso H0 est expresando la independencia de las variables para todos los pares de sucesos ocategoras que las componen y H1 la falta de independencia o no independencia entre ellas.

    Donde:pij: es la probabilidad conjunta esperada de la interseccin de la fila i-sima y la columna j-sima de latabla.pi.: es la probabilidad total esperada de elementos de la fila i-sima.p.j: es la probabilidad total esperada de los elementos de la columna j-sima.

    El nivel de significacin, es la probabilidad de cometer error de tipo I, es del 5%.

    El estadstico de prueba a utilizar es:

    siendo f= N de filas y c= N de columnas.

    La regin crtica es unilateral derecha, debido a que el estadstico se construye a partir de loscuadrados de las diferencias entre observados y esperados que son valores positivos. Grandesdiscrepancias entre los valores observados y sus correspondientes valores esperados nos harnsospechar de la veracidad de la hiptesis planteada.

    El valor crtico es24;0,95 = 9,48, quedando como regin crtica:

    29,48.

    Recordemos que la regin crtica est formada por los valores del estadstico de prueba para los cualesse va a rechazar la hiptesis nula. Y la determinamos a partir de la distribucin del estadstico de prueba,el nivel de significacin, la hiptesis alternativa y, a veces, del tamao de la muestra.Grficamente:

    RECHAZO H0 si0

    2

    H 9,48

    La regla de decisin es

    NO RECHAZO H0 si0

    2

    H< 9,48

    Por ser un caso de independencia, multiplicando las probabilidades esperadas ( . .ij i jp p p ) por n

    (tamao de la nica muestra), se obtienen las frecuencias esperadas (. .* * *ij ij i je n p n p p ).

    Debido a que no tenemos las probabilidades esperadas las estimamos a partir de la muestra, es decir:

    * *

    ji

    ij i j

    oo

    p p p o o

    y luego obtenemos los valores esperados estimados como:

    2

    22

    ( -1)( -1)

    1 1

    ( - )

    f cij ij

    f c

    iji j

    o e

    e

  • 7/29/2019 Analitica Guia 2013

    35/103

    29

    * * *ij ij i je n p n p p

    Por ejemplo, para el elemento ubicado en la fila 1 y la columna 1 tenemos:

    11

    27 51642* * = 2,1448

    642 642

    e =

    Si efectuamos la misma operacin para todos los elementos de la tabla de contingencia, obtenemos latabla de frecuencias esperadas estimadas:

    Nivel de mejora

    Ninguna Ligera NotableTotal

    Nivel deinfestacin

    Leve 2,145 8,075 16,780 27

    Intermedio 6,276 23,626 49,098 79

    Grave 42,579 160,299 333,122 536

    Total 51 192 399 642 = n

    El valor del estadstico calculado se obtiene reemplazando estos valores ( ije ) en lugar de los ( ije ) sin

    modificar la distribucin y los correspondientes valores observados llegando a:

    Por lo tanto, el valor es

    0

    215,982 + 0,012 + 0,731 + 0,143 + 7,571 ++0,944 + 1,36 + 3,494 + 0,959 = 31,198=H

    Nota: Suele aportar informacin observar si las mayores magnitudes que forman este valor calculado (ej.:15,982; 7,571 y 3,494) provienen de una misma fila o de una misma columna.

    Conclusin: Al nivel de significacin del 5%, hay evidencias suficientes para rechazar la hiptesis nula(donde se plantea la independencia), es decir que las variables nivel de infestacin de mastitis,categorizada en Leve, Intermedio y Grave; y nivel de mejora, con niveles Ninguna, Ligera y Notable, noson independientes, por lo tanto, a este nivel de significacin es sustentable la hiptesis de que en estapoblacin existe relacin entre la eficacia del medicamento y el nivel de gravedad de mastitis en vacaslecheras.

    02.- Se espera que una determinada droga sea efectiva para la curacin del catarro comn en personas.En un experimento con 164 personas con catarro, la mitad de ellas recibi la droga y la otra mitad recibi

    pldoras azucaradas (grupo control). En la siguiente tabla se encuentran los resultados obtenidos luego deaplicar los tratamientos.

    ResultadoMejorados Efecto nulo Empeorados

    TratamientoDroga 50 22 10Pldoras azucaradas 40 28 14

    Probar la hiptesis de que la droga no produce efectos, con un nivel de significacin del 1%

    Datos del problema:

    Variable en estudio:X: Resultado de un paciente luego del tratamiento, categorizado en: mejorado, efecto nulo, empeorado.

    Cantidad y tamao de muestras: hay dos muestras, una de 82 de pacientes que tomaron droga y otrade 82 pacientes que tomaron pldora azucarada

  • 7/29/2019 Analitica Guia 2013

    36/103

    30

    Nivel de significacin: = 0,01

    Se completa la tabla de frecuencias observadas con los totales de las muestras y los totales de cadacategora:

    Solucin:Se cuenta con dos muestras de igual tamao, proveniente de dos poblaciones, y una variable ordinal con3 categoras.La hiptesis que interesa probar es que "la probabilidad de mejorar es la misma en las dos poblaciones depersonas con catarro: la poblacin de personas con catarro tratados con droga y la poblacin de personascon catarro tratados con las pldoras azucaradas. Es decir, que hay homogeneidad en los resultados deltratamiento con droga y pldoras. Entonces las hiptesis estadsticas son:

    H0: /dorga /azucm m mp p p (probabilidad de mejorar en la poblacin que recibe droga = probabilidad de

    mejorar en la poblacin que recibe pldora azucarada)

    /dorga /azucn n np p p (probabilidad de efecto nulo en la poblacin que recibe droga = probabilidad de

    efecto nulo en la poblacin que recibe pldora azucarada)

    /dorga /azuce e ep p p (probabilidad de empeorar en la poblacin que recibe droga = probabilidad de

    empeorar en la poblacin que recibe pldora azucarada)H1 : alguna igualdad de las anteriores no se cumple.

    Nivel de significacin = 0,01

    El estadstico de prueba a utilizar es:

    El valor crtico es

    Por lo tanto la regin crtica es2

    9,21

    RECHAZO H0 si0

    2

    H9,21

    La regla de decisin es:

    NO RECHAZO H0 si0

    2

    H< 9,21

    Informacin muestral: para calcular el valor del estadstico de prueba es necesario estimar las frecuencias

    esperadas, considerando que la hiptesis nula es verdadera. Previamente estimamosm

    p ;n

    p ye

    p .

    ResultadosMejorados

    (m)

    Efecto

    nulo (n)

    Empeorados

    (e) Total

    TratamientoDroga (d) 50 22 10 82Pldoras azucaradas (a) 40 28 14 82Total 90 50 24 164

    222

    ( -1)( -1)

    1 1

    = nmero de filas

    = nmero de columnas

    ( - )

    f cij ij

    f c

    i j ij

    f

    c

    o e

    e

    2

    (3-1)(2-1);0,999,21

  • 7/29/2019 Analitica Guia 2013

    37/103

    31

    En este caso las muestras estn representadas en las filas de la tabla y se estiman las proporciones

    correspondientes a las categoras de la variable resultados como31 2

    ; ;m n ep p p

    OO O

    O O O

    obteniendo:90 24 50

    164 164 164 ; ;m n ep p p

    A partir de aqu se calculan las frecuencias esperadas estimadas en cada clase o categora:

    2482 * 12

    164 *de d ee n p (donde ndes el tamao de la muestra de las personas tratadas con

    la droga).

    Efectuando la operacin equivalente en todas las celdas del cuerpo de la tabla de frecuencias observadas,se obtiene la tabla de frecuencias esperadas estimadas:

    Resultado

    Mejorados

    (m)

    Efecto nulo

    (n)

    Empeorados

    (e)

    Total

    TratamientoDroga (d) 45 25 12 82

    Pldoras (a) 45 25 12 82

    Total 90 50 24 164

    Por lo tanto el estadstico de prueba resulta

    0

    2 2 2 2 2 2

    2 (50 - 45 (40 - 45 (10 -12 (14 -12 (22 - 25 (28 - 25) ) ) ) ) )

    45 45 12 12 25 25H

    0

    2 25 25 4 4 9 91,111 0, 667 0, 720 2, 498

    45 45 12 12 25 25H

    y como 2,498 < 9,21 se decide no rechazar H0

    Conclusin: A un nivel de significacin del 1%, no hay evidencias suficientes para rechazar la hiptesis

    nula (/ droga / azucm m mp p p ; / droga / azucn n np p p ; / droga /azuce e ep p p ) entonces la probabilidad

    poblacional de personas con catarro comn mejorados sera la misma para los trata