Actividad2 Sanchez Campoy CM

download Actividad2 Sanchez Campoy CM

of 37

Transcript of Actividad2 Sanchez Campoy CM

  • AAccttiivviiddaadd 22 TTeemmaa22

    TRABAJO REALIZADO POR: CARMEN M SNCHEZ CAMPOY

    PROFESORES: RAMN GUTIRREZ SNCHEZ MARIA DOLORES RUIZ MEDINA

    CURSO: DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA

    - MASTER ESTADSTICA APLICADA -

  • A1. CUESTIONES TERICAS Resolver tres actividades tericas.

    1.- Deducir los valores esperado de las sumas de cuadrados medios entre tratamientos y dentro de cada tratamiento para el modelo de efectos fijos y efectos aleatorios.

    Est realizado para tamao muestrales iguales, de forma anloga se realizara para tamaos muestrales desiguales.

    La suma total de cuadrados,

    2..

    1 1( )

    k n

    iji j

    SCT y y= =

    =

    en la que hemos desglosado la variabilidad total de los datos, podemos expresarla en dos partes:

    - La suma de cuadrados de las desviaciones de las medias de los tratamientos respecto de la media general, denominada suma de cuadrados entre tratamientos o variabilidad explicada:

    2. ..

    1( )

    k

    r ii

    SCT n y y=

    =

    - La suma de cuadrados de las desviaciones de las observaciones de cada nivel respecto de su media, denominada suma de cuadrados dentro de los tratamientos, variabilidad no-explicada o residual:

    2.

    1 1( )

    k n

    ij ii j

    SCR y y= =

    =

    A partir de las sumas de cuadrados anteriores se pueden construir los denominados cuadrados medios, definidos como los cocientes entre dichas sumas de cuadrados y sus correspondientes grados de libertad.

    Cuadrado medio total:

    2..

    2 1 1( )

    1

    k n

    iji j

    T

    y yS

    N= =

    =

    Cuadrado medio entre tratamientos:

    2. ..2

    1( )

    1

    k

    ii

    Tr

    n y yS

    k=

    =

    Cuadrado medio residual:

    2.

    2 1 1( )

    k n

    ij ii j

    R

    y yS

    N k= =

    =

    MODELO DE EFECTOS FIJOS:

    Teniendo en cuenta que:

  • ij i ijy = + + . .i i iy n n = + + .. ..1

    k

    ii

    y N n =

    = + +

    .

    .

    iiiy = + + ..y = + 1

    0k

    i ii

    n=

    =

    Se tiene:

    2 2. ..

    . ..21 1

    ( ) ( ( ))1 1

    k k

    iiii i

    Tr

    n y y nS

    k k

    = =

    +

    = = =

    2 2. .. . ..

    1 1 1( ) 2 ( )

    1 1 1

    k k k

    i ii ii i i

    n n n

    k k k

    = = =

    = + +

    Tomando esperanzas:

    2 2. .. . ..

    21 1 1

    ( ) 2 ( )1 1 1

    k k k

    i ii ii i i

    Tr

    n n n

    E S E E Ek k k

    = = =

    = + +

    Ahora bien, puesto que:

    a) El modelo es de efectos fijos , [ ]i iE = entonces 2 2

    1 1

    1 1

    k k

    i ii i

    n n

    Ek k

    = =

    =

    b) Como 22 ( )

    i i iN nE E Var

    Nn

    = =

    y N kn= se tiene que:

    2 2. .. . .. 2

    1 1. ..

    1

    ( ) ( )( )

    1 1 1

    k k

    i i ki i

    iii

    n n EnE E y y

    k k k

    = =

    =

    = = =

    2 2 22

    21 1 1

    ( ) ( )1 1 1 1

    k k k

    i i ii i i

    n n n N n n k kn nE E Vark k k Nn k kn

    = = =

    = = = = =

    c) Como . .. 0iE = , entonces

  • . .. . ..

    21 1

    2 ( ) 2 ( )0

    1 1

    k k

    i ii ii i

    Tr

    n n EE E S

    k k

    = =

    = = =

    de donde: 2

    2 21

    1

    k

    ii

    Tr

    n

    E Sk

    = = +

    y [ ] 2 2

    1( 1)

    k

    r ii

    E SCT n k =

    = +

    Por otro lado como:

    2 2RE S = y

    2 2 2( 1) ( 1) ( )T Tr RN S k S N k S = +

    Se tiene que:

    2 2 2( 1) ( 1) ( )T Tr RN E S k E S N k E S = +

    2

    2 2 2 2 21

    1( 1) ( 1) ( ) ( 1)

    1

    k

    i ki

    T ii

    n

    N E S k N k n Nk

    =

    =

    = + + = +

    Luego:

    2

    2 21

    1

    k

    ii

    T

    n

    E SN

    = = +

    y [ ] 2 2

    1( 1)

    k

    ii

    E SCT n N =

    = +

    MODELO DE EFECTOS ALEATORIOS:

    Teniendo en cuenta que:

    ij i ijy = + + . .i i iy n n = + + .. ..1

    k

    ii

    y N n =

    = + +

    .

    .

    iiiy = + + ..1

    1 ki

    iy

    k

    =

    = + +

    Se tiene:

    2

    2. ..

    . ..2 1 11

    1 ( )( )1 1

    k kkii ti

    i tiTr

    nn y y kS

    k k

    = =

    =

    +

    = = =

    22

    . ... ..

    1 1 1 11

    1 12 ( )( )1 1 1

    k k k kkiii t i t

    i t i ti

    n nnk kk k k

    = = = ==

    = + +

  • Tomando esperanzas:

    22

    . ... ..

    2 1 1 1 11

    1 12 ( )( )1 1 1

    k k k kkiii t i t

    i t i tiTr

    n nnk kE S E E Ek k k

    = = = ==

    = + +

    Ahora bien, puesto que:

    a) Las variables aleatorias i son independientes con media cero, entonces,

    0i ti t

    E

    =

    adems, como 2 2iE = , se tiene que:

    2

    1

    k

    i tt

    E =

    =

    Entonces: 2 2

    2

    1 1 1 1 1

    1 1 12k k k k k

    i t i t i ti t i t t

    E n n Ek k k

    = = = = =

    = + =

    2 2 2 2 22

    1 1

    1 1 12k k

    i tn N

    k k k

    = =

    = + =

    b) 2

    2. ..

    1 1 1 1 1

    1 1( )k k n k n

    i ij thi i j t h

    E n nEn N

    = = = = =

    = =

    2 2

    2 21 1 1 1 1 1 1

    1 1 12k n k n n k n

    ij th ij thi j t h j t h

    nEn N Nn

    = = = = = = =

    = + =

    2 2 22 2

    1 1 1 1 1

    1 1 12k n k n n

    i j t h jn

    n N Nn

    = = = = =

    = + =

    ( )2 2 2 2 2 21 1

    1 1 12 1k k

    i ik

    k k k

    = =

    = + = =

    c) Puesto que Como i y ij son independientes entre s y tienen media cero entonces:

  • . ..

    1 1

    1 ( ) 0k k

    ii ti t

    E nk

    = =

    =

    Luego: 2 2

    2 2 22 2 2

    1

    ( 1) ( 1)TrN N nkE S

    k N k

    = + = +

    [ ]2 2 2

    2 ( 1)r

    N nE SCT kN

    = +

    Por otro lado como:

    2 2RE S = y

    2 2 2( 1) ( 1) ( )T Tr RN S k S N k S = +

    Se tiene que:

    2 2 2( 1) ( 1) ( )T Tr RN E S k E S N k E S = +

    2 2 2 2 2 22 2 2 2( 1) ( 1) ( ) ( 1)( 1)T

    N n N nN E S k N k NN k N

    = + + = +

    Luego:

    2 2 22 2

    ( 1)TN nE S

    N N

    = +

    [ ]2 2 2

    2( 1)N nE SCT NN

    = +

    2.- Cul de los cuatro mtodos estudiados para realizar comparaciones mltiples entre niveles medios de tratamientos por pares posee mejores propiedades. Razona la respuesta.

    En primer lugar comentamos cada mtodo razonando ciertas caractersticas para acabar comparando cada uno de ellos e indicando cuales son los ms apropiados en cada caso:

    Test LSD de Fisher (Least Significant Difference), este procedimiento fu sugerido por Fisher en 1935, dicho procedimiento consiste en una prueba de hiptesis por parejas basada en la distribucin t de student, es sencillo de utilizar; se puede aplicar tanto en modelos equilibrados como no-equilibrados. Adems proporciona tambin intervalos de confianza para diferencias de medias. Un problema que presenta la aplicacin de este procedimiento, para un nmero relativamente grande de tratamientos, es que el nmero de posibles falsos rechazos de la hiptesis nula puede ser elevado aunque no existan diferencias reales.

  • Es un test vlido para la comparacin planificada y tratamientos pareados, y ms apropiado an cuando el nmero de medias es pequeo. Especficamente, no es conveniente cuando tenemos ms de 3 medias, porque al aumentar el nmero de tratamientos el error de tipo I tambin se incrementa. Debe utilizarse solo para comparaciones independientes y comparaciones entre medias que estn adyacentes en el rango. Adems, cuando todas las medias se comparan entre s, el poder del test disminuye porque las comparaciones que se realizarn, no son independientes. Puede suceder que el mtodo LSD falle al aceptar que todas las parejas son iguales, a pesar de que el estadstico F del anlisis de la varianza resulte significativo; sto es debido a que la prueba F considera simultneamente todas las posibles comparaciones entre las medias de los tratamientos y no slo las comparaciones por parejas. Test HSD de Tukey, (Honestly-significant-difference). Utiliza la distribucin del rango estandarizado para fijar el valor crtico con el cual se comparan las diferencias entre las medias. El mtodo de Tukey se aplica generalmente a comparaciones por pares dando lugar a un valor crtico menor que otros mtodos. En este modelo se puede construir intervalos de confianza con coeficiente de confianza para todas las posibles comparaciones por parejas. Es apropiado para todas las comparaciones pareadas, compara todos los pares individuales de medias aplicando un test de ANOVA significativo. Asume igual nmero de observaciones por poblacin. Test MRT de Duncan. El contraste de Duncan utiliza, como el HSD de Tukey, la distribucin del recorrido estudentizado. Se diferencia de ese test en que su aplicacin es secuencial, en el sentido de no utilizar un nico valor crtico para todas las diferencias de medias, como el de Tukey, sino un valor crtico que depende del nmero de medias comprendido entre las dos medias que se comparan, habiendo ordenado previamente las medias en orden creciente. Test Newman-Keuls. Este contraste fu desarrollado por Newman en 1939 y ampliado por Keuls en 1952, es un procedimiento iterativo y similar al mtodo de Duncan. Es ms conservador que el de Duncan en el sentido de que el error de tipo I es menor, la potencia de la prueba de Newman-Keuls es menor que la del procedimiento de Duncan, es ms difcil declarar que dos medias son significativamente diferentes al utilizar la prueba de Newman-Keuls que cuando se usa el procedimiento de Duncan.

    Podemos encontrar muchos comentarios sobre las comparaciones entre los distintos mtodos, de los que podemos concluir los siguientes:

    Cuando slo se hacen comparaciones por parejas, el mtodo de Tukey conduce a lmites de confianza ms estrechos que los otros mtodos, por lo cual el mtodo de Tukey encontrar ms diferencias significativas, siendo en este caso el mtodo preferido. En cambio cuando los contrastes son ms complicados que la diferencia de medias, ser mejor opcin la eleccin de otro mtodo. Cuando el nmero de comparaciones por parejas es muy grande los tests de rangos mltiples como Tukey, Newman-Keuls y Duncan ofrecen una solucin de

  • compromiso entre la tasa de error global deseada y una tasa de error individual demasiado pequea y por tanto inaceptable. Estos mtodos son preferidos en el sentido de producir intervalos de confianza ms estrechos.

    El mtodo LSD de Fisher es el que proporciona ms diferencias significativas; a continuacin, le siguen los mtodos de Duncan y Tukey. Eligiremos uno u otro dependiendo del riesgo que estemos dispuestos a correr al aceptar ms o menos diferencias significativas. LSD es una prueba muy eficiente para detectar diferencias verdaderas entre las medias si se aplica despus que la prueba F del anlisis de la varianza result significativa. El procedimiento de intervalos mltiples de Duncan es un buen mtodo para detectar diferencias reales.

    El procedimiento de Tukey tiene un error tipo I menor que los correspondientes errores de los tests de Newman-Keuls y de Duncan; es decir, es un test ms conservador. En consecuencia, el procedimiento de Tukey tiene menos potencia que los procedimientos de Newman-Keuls o de Duncan.

    Si se desea controlar la tasa de error individual, los mtodos LSD de Fisher y de Duncan resultan apropiados. Facilitan ms proteccin de los errores de Tipo I que los otros mtodos y son menos conservadores que los procedimientos basados en la eleccin de la tasa de global.

    Si se desea controlar la tasa de error global, el mtodo ms til es el procedimiento de Tukey.

    3.- Cmo afecta la violacin de la hiptesis de normalidad a la prueba F en los modelos de efectos fijos y aleatorios. Incluye de forma distinta en diseos con tamaos muestrales fijos y variables. Para validar un modelo propuesto se estudia si las hiptesis bsicas del modelo estn o no en contradiccin con los datos observados. Es decir, si se satisfacen los supuestos del modelo: Normalidad, Independencia y Homocedasticidad. Para ello utilizamos procedimientos grficos y analticos. Para el estudio de la Normalidad, podemos utilizar como mtodos grficos el estudio de histogramas o un grfico probabilstico normal tambin denominado grfico gaussiano o representacin en papel probabilstico normal (Grficos Q-Q), diagrama de puntos, que nos darn una idea de si se cumple o no y en que medida la hiptesis de normalidad. Como mtodos analticos podemos aplicar el contraste de Kolmogorov-Smirnov de Shapiro-Wilk entre otros, que a un nivel de significacin rechazaremos o no la normalidad del modelo. En algunos casos, el supuesto de normalidad puede ser violado sin afectar la estimacin asociadas con la eleccin del modelo. En estas situaciones, con tamaos muestrales iguales y homogeneidad de varianza, el test-F utilizado en el ANOVA es bastante robusto a errores que no presenten distribucin normal. Para el modelo de efectos fijos, los contrastes resultantes son ms robustos, es decir, ms insensibles al incumplimiento de las hiptesis de normalidad. Las desviaciones moderadas de la normalidad en el anlisis de la varianza para el modelo de efectos fijos no son excesivamente importantes puesto que el test F de

  • comparacin (y los test de comparaciones mltiples) se ven poco afectados por dichas desviaciones. Sin embargo, es importante notar que esto no se cumple si se presentan colas empricas ms pesadas para los errores. Por otro lado, el modelo de efectos aleatorios se ve bastante ms afectado por la violacin de dicha hiptesis, especialmente en la estimacin por intervalos de confianza de las componentes de la varianza. Desafortunadamente, cuando las muestras son pequeas con frecuencia aparecen fluctuaciones considerables, por lo que la apariencia de no normalidad moderada no indica necesariamente la violacin de la hiptesis de normalidad. Cuando hay grandes desviaciones se debe hacer un anlisis ms profundo y si es posible, realizar algunas transformaciones para corregir dichas desviaciones. Frecuentemente la transformacin no slo estabiliza la varianza sino que normaliza los datos, cuando estos no se distribuyen como una normal. Las formas de discrepancias ms frecuentes que se observan sobre todo en los mtodos grficos ocurren cuando algunos residuos tienen un valor muy distanciado de los dems. Estos valores suelen corresponder a datos anmalos. La presencia de uno o ms residuos anmalos puede afectar gravemente el anlisis de la varianza, en tales circunstancias es recomendable realizar una investigacin minuciosa. Cuando aplicamos los mtodos descritos y obtenemos que no se cumple la hiptesis de normalidad podemos optar por la realizacin del Contraste de Kruskal-Wallis. Si establecemos una distincin entre los dos tipos de inferencias que se realizan sobre un modelo de anlisis de la varianza, tenemos que:

    a) Inferencias sobre las medias: presente en los modelos de efectos fijos y que concierne nicamente a los efectos del factor (estimacin puntual o por intervalos para medias, contraste de igualdad de medias, contrastes mltiples de medias, etc.) b) Inferencias sobre las varianzas: presente tanto en el modelo de efectos fijos como en el de efectos aleatorios y que incluye, entre otras, la estimacin puntual o por intervalos de la varianza o de componentes de la varianza e inferencia sobre cociente de varianzas.

    El efecto de la desviacin de la normalidad afecta de manera desigual a estos tipos de inferencias. En general, si la desviacin de la normalidad no es muy grave, es poco importante en la inferencia sobre medias y ms grave en la inferencia sobre varianzas. Adems, en ambos casos, las estimaciones puntuales continan siendo insesgadas y en los contrastes de hiptesis se alteran el error de tipo I y su potencia. Generalmente, dicho error es ligeramente mayor que el nominal y la potencia menor que la terica La no-normalidad tiene efecto pequeo en las inferencias sobre las medias pero efectos graves en las inferencias sobre varianzas.

  • A2. TRABAJO

    Elaborar un resumen sobre los mtodos no paramtricos usuales en el anlisis de la varianza:

    Contraste de Kruskal-Wallis Transformacin por rangos Mediciones repetidas

    Consultar los libros sealados en la gua docente de este curso expuesta en la Pgina Web del master.

    1.- CONTRASTE DE KRUSKAL-WALLIS

    Cuando no est justificado asumir normalidad, se puede utilizar la metodologa no paramtrica. El test de Kruskal-Wallis propone como hiptesis nula que los k tratamientos son iguales, frente a la hiptesis alternativa de que algunas observaciones son mayores que otras entre los tratamientos. Se puede considerar que este test es adecuado para contrastar la igualdad entre las medias. La prueba de Kruskal-Wallis es una alternativa no paramtrica del anlisis de varianza usual.

    Procedimiento. Se calculan rangos de cada una de las observaciones ijy de manera creciente y se reemplaza por su rango ijR , donde la menor observacin tendra el valor 1. En caso de empates, se asigna a todas las observaciones empatadas el valor medio de sus correspondientes rangos. Se denota como

    .iR la suma de los rangos del i-simo tratamiento de modo que el estadstico es:

    2 2.

    21

    1 ( 1)4

    ki

    i i

    R N NHS n

    =

    +=

    Se puede observar que S2 es simplemente la varianza de los rangos, que viene dado por:

    22 2

    1 1

    1 ( 1)1 4

    ink

    iji j

    N NS RN

    = =

    +=

    Si no hay empates, entonces 2( 1)12

    N NS += y el test se simplifica, quedando el

    estadstico: 2.

    1

    12 3( 1)( 1)k

    i

    i i

    RH NN N n

    =

    = ++

    Para valores ni > 5, H se distribuye aproximadamente como una chi cuadrado de k-1 grados de libertad si la hiptesis nula es cierta. Por tanto, si:

    21,kH > se rechaza la hiptesis nula a un nivel .

  • 2.- TRANSFORMACIN POR RANGOS

    La tcnica consiste en aplicar la prueba F a los rangos correspondientes a las observaciones, en lugar de aplicarlos a los datos originales, se obtiene un estadstico que es equivalente al usual de anlisis de varianza:

    0/ ( 1)

    ( 1 ) / ( )H kF

    N H N k

    =

    Siendo H el estadstico de Kruskal-Wallis, se observa que cuando H se incrementa o disminuye, F0, tambin aumenta o disminuye, por lo que la prueba de Kruskal-Wallis es equivalente a aplicar el anlisis de varianza comn a los rangos. Cuando existe preocupacin acerca del supuesto de normalidad o por el efecto de puntos atpicos o valores "absurdos", se recomienda que el anlisis de varianza comn se realice tanto en los datos originales como en los rangos. Cuando se obtienen resultados similares en ambos procedimientos, probablemente las suposiciones del anlisis de varianza se satisfacen razonablemente bien y el anlisis estndar resulta adecuado, si existen diferencias entre ambos resultados, se opta por el anlisis de rangos, ya que es menos posible que sea distorsionada por una condicin de no normalidad o la presencia de observaciones inusuales.

    1.- MEDICIONES REPETIDAS

    En los diseos de investigacin con medidas repetidas, denominados tambin intrasujetos, a diferencia de los diseos que se han visto, cada uno de los sujetos o participantes en la investigacin es sometido a todos los niveles de las variables independientes. Por tanto, cada sujeto tendr tantas puntuaciones como niveles tenga la variable independiente del estudio, en el caso de un diseo bsico o unifactorial, o como condiciones experimentales se hayan generado, en el caso de un diseo factorial. Es decir, tendremos ms puntuaciones que sujetos participantes en el estudio en cuestin. Cuando nos encontramos ante casos donde la variabilidad entre observaciones es muy alta, sta variabilidad puede llegar a ser parte del error experimental e incluso incrementar la media de cuadrados del error, dificultando la deteccin de diferencias reales entre los tratamientos. Para controlar la alta variabilidad entre unidades experimentales usando el diseo de mediciones repetidas, donde cada uno de los tratamientos se aplica a cada unidad experimental. El diseo del modelo es: ij i i ijY = + + + donde i es el i-simo tratamiento y es un parmetro asociado con el j-simo sujeto. Se supone que los tratamientos son fijos y que los sujetos empleados corresponden a una muestra aleatoria de una poblacin mayor de sujetos potenciales (efecto aleatorio). Se va a estudiar la no existencia de efectos de tratamientos, el contraste de hiptesis a probar es:

    0 1

    1

    : 0 : al menos un 0

    k

    i

    HH

    = = =

  • El estadstico del contraste es:

    0 / ( 1)tratamientos tratamientos

    error error

    SS MSFSS n MS

    = =

    Si los errores en el modelo estn distribuidos normalmente, entonces el estadstico Fo tiene distribucin Fk-1,(k-1)(n-1), si la hiptesis nula es verdadera. La hiptesis nula ser rechazada si: 0 ,( 1),( 1)( 1)k k nF F >

    A3. ANLISIS DE DATOS Para realizar los ejercicios voy a utilizar el software SPSS.

    Comenzamos con un estudio descriptivo de los datos:

  • En un primer momento a simple vista se puede observar que el valor medio de estos grupos es numricamente distinto, de hecho la media de la dosis 30 tiene un valor medio ms del doble de la media de la dosis 15. Por tanto, nuestra hiptesis se centra en comprobar si los niveles de toxicidad heptica es significativamente distinta en los cinco grupos. Para responder a esta hiptesis recurrimos al Anlisis de la Varianza de un factor y realizamos el contraste de igualdad de medias. Esto tambin se puede comprobar con un grfico de cajas:

    Modelo de efectos fijos:

    0 1 5

    1

    :

    : para algn i j

    HH i j

    = = =

    Aplicando el modelo en SPSS se obtiene la siguiente tabla de ANOVA

    Donde: Inter-grupos: Representa la Suma de cuadrados debida a los tratamientos (SCTr) Intra-grupos: Representa la suma de cuadrados residual (SCR) Total: Representa la suma de cuadrados total (SCT).

    Si el valor de F es mayor que uno quiere decir que hay un efecto positivo del factor DOSIS. Se observa que el P-valor (Sig.) tiene un valor de 0.000, que es menor que el nivel de significacin 0.05. Por lo tanto, hemos comprobado estadsticamente que estos cinco grupos son distintos. Es decir, no se puede rechazar la hiptesis

  • alternativa que dice que al menos dos grupos son diferentes, pero Cules son esos grupos? Los cinco grupos son distintos o slo alguno de ellos? Pregunta que resolveremos mediante los contrastes de comparaciones mltiples que tienen las siguientes salidas en SPSS:

    Esta salida nos muestra los intervalos de confianza simultneos construidos por el mtodo de Tukey. En la tabla se muestra un resumen de las comparaciones de cada tratamiento con los restantes. Es decir, aparecen comparadas dos a dos las cinco medias de los tratamientos. En el primer bloque de la tabla se muestran comparadas la media de la dosis 15 con la media de las otras cuatro dosis. En los siguientes bloques se muestran comparadas las restantes medias entre s. En la columna Diferencias de medias (I-J) se muestran las diferencias entre las medias que se comparan. En la columna Sig. aparecen los p-valores de los contrastes, que permiten conocer si la diferencia entre cada pareja de medias es significativa al nivel de significacin considerado (en este caso 0.05) y la ltima columna proporciona los intervalos de confianza al 95% para cada diferencia. As por ejemplo, si comparamos el nivel de toxicidad de la dosis 15 con la 20, tenemos una diferencia entre ambas medias de -5,6, un error tpico de 1,796 (igual en todas las comparaciones), que es un error tpico para la diferencia de estas medias, un P-valor (Sig.) de 0.039 significativo

  • con lo cual los niveles de toxicidad difiere significativamente en la dosis 15 a la 20 y un intervalo de confianza con lmites negativos. Podemos concluir que la media de la dosis 15 difiere significativamente con el resto de dosis salvo con la 35, la dosis 20 con todas salvo con la 25 y 35, y la 25 con la 30. Idoneidad del modelo:

    NORMALIDAD:

    Para estudiar la normalidad en SPSS, realizamos el contraste de Kolmogorov-Smirnov y el contraste de Shapiro-Wilk obtenindose los siguientes resultados:

    No todos los p-valores son mayores de 0.05 nivel de significacin pero si consideramos un nivel de significacin de 0.01 podemos aceptar que en todos los casos las muestras de las concentraciones se distribuyen de forma normal en cada dosis. Para analizar la hiptesis de normalidad de los residuos, se debe comenzar salvando los residuos, una vez hecho esto en SPSS, realizamos el estudio de la normalidad, para ello podemos realizar de forma analtica el contraste de Kolmogorov-Smirnov o grficamente el grfico Q-Q de normalidad, obtenindose lo siguiente:

  • Podemos apreciar en este grfico que los puntos aparecen prximos a la lnea diagonal. Esta grfica no muestra una desviacin marcada de la normalidad

    El valor del p-valor es mayor que el nivel de significacin 0.05, no rechazndose la hiptesis de normalidad.

    INDEPENDENCIA:

    Para comprobar que se satisface el supuesto de independencia entre los residuos analizamos el grfico de los residuos frente a los valores pronosticados o predichos por el modelo. El empleo de este grfico es til puesto que la presencia de alguna tendencia en el mismo puede ser indicio de una violacin de dicha hiptesis.

    En esta figura, interpretamos el grfico que aparece en la fila 3 columna 2, es decir aquel grfico que se representan los residuos en el eje de ordenadas y los valores pronosticados en el eje de abscisas. No observamos, en dicho grfico, ninguna

  • tendencia sistemtica que haga sospechar del incumplimiento de la suposicin de independencia. Luego podemos suponer su independencia.

    HOMOCEDASTICIDAD:

    Para comprobar que se satisface el supuesto de homocedasticidad, realizamos el test de Levene mediante SPSS:

    El p-valor es 0.637 por lo tanto no se puede rechazar la hiptesis de homogeneidad de las varianzas y se concluye que los cinco grupos tienen varianzas homogneas.

    Modelo de efectos aleatorios:

    20

    21

    : 0: 0

    HH

    =

    >

    Aplicando el modelo en SPSS se obtiene la siguiente tabla:

    Esta tabla muestra los resultados del contraste planteado. El valor del estadstico de contraste es igual a 14,757 que deja a la derecha un p-valor de 0.000, luego, no podemos afirmar la existencia de alguna variabilidad entre los niveles de toxicidad de las diferentes dosis. En el modelo de efectos aleatorios no se necesitan llevar a cabo ms contrastes incluso aunque la hiptesis nula sea rechazada. Es decir, en el caso de rechazar H0 no hay que realizar comparaciones mltiples para comprobar que medias son distintas, ya que el propsito del experimento es hacer un planteamiento general relativo a las poblaciones de las que se extraen las muestras. La tabla siguiente muestra la media cuadrtica esperada, de esta tabla se deducen las expresiones de las esperanzas de los cuadrados medios del factor y del error:

  • Por lo tanto, la varianza total (30,236) se descompone en una parte atribuible a la diferencia entre las dosis (22,176) y otra procedente de la variabilidad existente dentro de ellos (8,06). Comprobamos que en dicha varianza tiene mayor peso la variacin dentro de las dosis, en porcentaje un 73.34 % frente a la variacin entre fabricantes, que representa el 26.66 % del total.

    Luego:

    Despus de la realizacin de este estudio, podemos concluir que el anlisis de efectos fijos parece ser la aproximacin ms apropiada para el anlisis de varianza de los datos. Hemos rechazamos la hiptesis de igualdad de medias entre los tratamientos, por tanto, el tratamiento con diferentes dosis de paracetamol parece generar diferencias en el nivel medio de toxicidad heptica.

  • Comenzamos con un estudio descriptivo de los datos:

    En un primer momento a simple vista se puede observar que el valor medio de estos grupos es numricamente similar. Esto tambin se puede comprobar con un grfico de cajas:

  • Modelo de efectos fijos:

    0 1 3

    1

    :

    : para algn i j

    HH i j

    = = =

    Aplicando el modelo en SPSS se obtiene la siguiente tabla de ANOVA

    Donde: Inter-grupos: Representa la Suma de cuadrados debida a los tratamientos (SCTr) Intra-grupos: Representa la suma de cuadrados residual (SCR) Total: Representa la suma de cuadrados total (SCT).

    Si el valor de F es mayor que uno quiere decir que hay un efecto positivo del factor DOSIS. Se observa que el P-valor (Sig.) tiene un valor de 0.826, que es mayor que el nivel de significacin 0.05. Por lo tanto, no rechazamos la hiptesis nula de igualdad de medias. Realizamos un contrastes de comparaciones mltiples que tienen las siguientes salidas en SPSS:

    Esta salida nos muestra los intervalos de confianza simultneos construidos por el mtodo de Tukey. En la tabla se muestra un resumen de las comparaciones de cada tratamiento con los restantes. Es decir, aparecen comparadas dos a dos los tres procedimientos. Todos los P-valor (Sig.) son mayores de 0.05 con lo cual la calidad del producto no difiere significativamente entre los procedimientos A, B y C. Podemos concluir que la media de los procedimientos no difieren de uno a otro.

  • Idoneidad del modelo:

    NORMALIDAD:

    Para estudiar la normalidad en SPSS, realizamos el contraste de Kolmogorov-Smirnov y el contraste de Shapiro-Wilk obtenindose los siguientes resultados:

    Todos los p-valores son mayores de 0.05 nivel de significacin luego podemos aceptar que en todos los casos las muestras de las concentraciones se distribuyen de forma normal. Para analizar la hiptesis de normalidad de los residuos, se debe comenzar salvando los residuos, una vez hecho esto en SPSS, realizamos el estudio de la normalidad, para ello podemos realizar de forma analtica el contraste de Kolmogorov-Smirnov o grficamente el grfico Q-Q de normalidad, obtenindose lo siguiente:

    Podemos apreciar en este grfico que los puntos aparecen prximos a la lnea diagonal. Esta grfica no muestra una desviacin marcada de la normalidad

  • El valor del p-valor es mayor que el nivel de significacin 0.05, no rechazndose la hiptesis de normalidad.

    INDEPENDENCIA:

    Para comprobar que se satisface el supuesto de independencia entre los residuos analizamos el grfico de los residuos frente a los valores pronosticados o predichos por el modelo. El empleo de este grfico es til puesto que la presencia de alguna tendencia en el mismo puede ser indicio de una violacin de dicha hiptesis.

    En esta figura, interpretamos el grfico que aparece en la fila 3 columna 2, es decir aquel grfico que se representan los residuos en el eje de ordenadas y los valores pronosticados en el eje de abscisas. No observamos, en dicho grfico, ninguna tendencia sistemtica que haga sospechar del incumplimiento de la suposicin de independencia. Luego podemos suponer su independencia.

  • HOMOCEDASTICIDAD:

    Para comprobar que se satisface el supuesto de homocedasticidad, realizamos el test de Levene mediante SPSS:

    El p-valor es 0.6 por lo tanto no se puede rechazar la hiptesis de homogeneidad de las varianzas y se concluye que los tres grupos tienen varianzas homogneas.

    Comenzamos con un estudio descriptivo de los datos:

    En un primer momento a simple vista se puede observar pequeas diferencias en los valores medios, se necesita de un estudio estadstico que decida. Esto tambin se puede comprobar con un grfico de cajas:

  • Modelo de efectos fijos:

    0 1 3

    1

    :

    : para algn i j

    HH i j

    = = =

    Aplicando el modelo en SPSS se obtiene la siguiente tabla de ANOVA

    Donde: Inter-grupos: Representa la Suma de cuadrados debida a los tratamientos (SCTr) Intra-grupos: Representa la suma de cuadrados residual (SCR) Total: Representa la suma de cuadrados total (SCT).

    Si el valor de F es mayor que uno quiere decir que hay un efecto positivo del factor DOSIS. Se observa que el P-valor (Sig.) tiene un valor de 0.471, que es mayor que el nivel de significacin 0.05. Por lo tanto, no rechazamos la hiptesis nula de igualdad de medias. Realizamos un contrastes de comparaciones mltiples que tienen las siguientes salidas en SPSS:

  • Esta salida nos muestra los intervalos de confianza simultneos construidos por el mtodo de Tukey. En la tabla se muestra un resumen de las comparaciones de cada tratamiento con los restantes. Es decir, aparecen comparadas dos a dos los tres procedimientos. Todos los P-valor (Sig.) son mayores de 0.05 con lo cual la calidad del producto no difiere significativamente entre los procedimientos A, B y C. Podemos concluir que la media de los procedimientos no difieren de uno a otro.

    Idoneidad del modelo:

    NORMALIDAD:

    Para estudiar la normalidad en SPSS, realizamos el contraste de Kolmogorov-Smirnov y el contraste de Shapiro-Wilk obtenindose los siguientes resultados:

    Al tener un estacio muestral muy pequeo es normal estos resultados, aun asi podemos aceptar normalidad a un nivel de significacion de 0.01.

    Para analizar la hiptesis de normalidad de los residuos, se debe comenzar salvando los residuos, una vez hecho esto en SPSS, realizamos el estudio de la normalidad, para ello podemos realizar de forma analtica el contraste de Kolmogorov-Smirnov o grficamente el grfico Q-Q de normalidad, obtenindose lo siguiente:

  • Podemos apreciar en este grfico que los puntos aparecen prximos a la lnea diagonal. Esta grfica no muestra una desviacin marcada de la normalidad

    El valor del p-valor es mayor que el nivel de significacin 0.05, no rechazndose la hiptesis de normalidad.

    INDEPENDENCIA:

    Para comprobar que se satisface el supuesto de independencia entre los residuos analizamos el grfico de los residuos frente a los valores pronosticados o predichos por el modelo. El empleo de este grfico es til puesto que la presencia de alguna tendencia en el mismo puede ser indicio de una violacin de dicha hiptesis.

  • En esta figura, interpretamos el grfico que aparece en la fila 3 columna 2, es decir aquel grfico que se representan los residuos en el eje de ordenadas y los valores pronosticados en el eje de abscisas. No observamos, en dicho grfico, ninguna tendencia sistemtica que haga sospechar del incumplimiento de la suposicin de independencia. Luego podemos suponer su independencia.

    HOMOCEDASTICIDAD:

    Para comprobar que se satisface el supuesto de homocedasticidad, realizamos el test de Levene mediante SPSS:

    El p-valor es 0.013 por lo tanto no se puede rechazar la hiptesis de homogeneidad de las varianzas y se concluye que los tres grupos tienen varianzas homogneas.

  • Comenzamos con un estudio descriptivo de los datos:

    En un primer momento a simple vista se puede observar que el valor medio de estos grupos es numricamente diferente. Esto tambin se puede comprobar con un grfico de cajas:

  • Modelo de efectos fijos:

    0 1 4

    1

    :

    : para algn i j

    HH i j

    = = =

    Aplicando el modelo en SPSS se obtiene la siguiente tabla de ANOVA

    Donde: Inter-grupos: Representa la Suma de cuadrados debida a los tratamientos (SCTr) Intra-grupos: Representa la suma de cuadrados residual (SCR) Total: Representa la suma de cuadrados total (SCT).

    Si el valor de F es mayor que uno quiere decir que hay un efecto positivo del factor DOSIS. Se observa que el P-valor (Sig.) tiene un valor de 0.218, que es mayor que el nivel de significacin 0.05. Por lo tanto, no rechazamos la hiptesis nula de igualdad de medias. Realizamos un contrastes de comparaciones mltiples que tienen las siguientes salidas en SPSS:

    Esta salida nos muestra los intervalos de confianza simultneos construidos por el mtodo de Tukey. En la tabla se muestra un resumen de las comparaciones de cada tratamiento con los restantes. Es decir, aparecen comparadas dos a dos los tres

  • procedimientos. Todos los P-valor (Sig.) son mayores de 0.05 con lo cual la calidad del producto no difiere significativamente entre las empresas. Podemos concluir que la media de los procedimientos no difieren de uno a otro.

    Idoneidad del modelo:

    NORMALIDAD:

    Para estudiar la normalidad en SPSS, realizamos el contraste de Kolmogorov-Smirnov y el contraste de Shapiro-Wilk obtenindose los siguientes resultados:

    Todos los p-valores son mayores de 0.05 nivel de significacin luego podemos aceptar que en todos los casos las muestras de las concentraciones se distribuyen de forma normal. Para analizar la hiptesis de normalidad de los residuos, se debe comenzar salvando los residuos, una vez hecho esto en SPSS, realizamos el estudio de la normalidad, para ello podemos realizar de forma analtica el contraste de Kolmogorov-Smirnov o grficamente el grfico Q-Q de normalidad, obtenindose lo siguiente:

  • Podemos apreciar en este grfico que los puntos aparecen prximos a la lnea diagonal. Esta grfica no muestra una desviacin marcada de la normalidad

    El valor del p-valor es mayor que el nivel de significacin 0.05, no rechazndose la hiptesis de normalidad.

    INDEPENDENCIA:

    Para comprobar que se satisface el supuesto de independencia entre los residuos analizamos el grfico de los residuos frente a los valores pronosticados o predichos por el modelo. El empleo de este grfico es til puesto que la presencia de alguna tendencia en el mismo puede ser indicio de una violacin de dicha hiptesis.

    En esta figura, interpretamos el grfico que aparece en la fila 3 columna 2, es decir aquel grfico que se representan los residuos en el eje de ordenadas y los valores pronosticados en el eje de abscisas. No observamos, en dicho grfico, ninguna

  • tendencia sistemtica que haga sospechar del incumplimiento de la suposicin de independencia. Luego podemos suponer su independencia.

    HOMOCEDASTICIDAD:

    Para comprobar que se satisface el supuesto de homocedasticidad, realizamos el test de Levene mediante SPSS:

    El p-valor es 0.292 por lo tanto no se puede rechazar la hiptesis de homogeneidad de las varianzas y se concluye que los tres grupos tienen varianzas homogneas.

    Comenzamos con un estudio descriptivo de los datos:

  • En un primer momento a simple vista se puede observar que el valor medio de estos grupos es numricamente diferente. Esto tambin se puede comprobar con un grfico de cajas:

    Modelo de efectos fijos:

    0 1 4

    1

    :

    : para algn i j

    HH i j

    = = =

    Aplicando el modelo en SPSS se obtiene la siguiente tabla de ANOVA

    Donde: Inter-grupos: Representa la Suma de cuadrados debida a los tratamientos (SCTr) Intra-grupos: Representa la suma de cuadrados residual (SCR) Total: Representa la suma de cuadrados total (SCT).

  • Si el valor de F es mayor que uno quiere decir que hay un efecto positivo del factor DOSIS. Se observa que el P-valor (Sig.) tiene un valor de 0.000, que es menor que el nivel de significacin 0.05. Por lo tanto, hemos comprobado estadsticamente que estos cuatro grupos son distintos. Es decir, no se puede rechazar la hiptesis alternativa que dice que al menos dos grupos son diferentes, pero Cules son esos grupos? Pregunta que resolveremos mediante los contrastes de comparaciones mltiples que tienen las siguientes salidas en SPSS:

    En la tabla se muestra un resumen de las comparaciones de cada tratamiento con los restantes. Es decir, aparecen comparadas dos a dos los 4 telares. Podemos concluir:

    - El primer telar presenta diferencias de medias significativas con los telares tres y cuatro. - El segundo telar no presenta diferencias significativas con el resto de telares. - El tercer telar presenta diferencias significativas con el primer y cuarto telar. - Consecuentemente, el cuarto telar presenta diferencis significativas con el primer y tercer telar.

    Idoneidad del modelo:

    NORMALIDAD:

    Para estudiar la normalidad en SPSS, realizamos el contraste de Kolmogorov-Smirnov y el contraste de Shapiro-Wilk obtenindose los siguientes resultados:

  • Todos los p-valores son mayores de 0.05 nivel de significacin luego podemos aceptar que en todos los casos las muestras de las concentraciones se distribuyen de forma normal. Para analizar la hiptesis de normalidad de los residuos, se debe comenzar salvando los residuos, una vez hecho esto en SPSS, realizamos el estudio de la normalidad, para ello podemos realizar de forma analtica el contraste de Kolmogorov-Smirnov o grficamente el grfico Q-Q de normalidad, obtenindose lo siguiente:

    Podemos apreciar en este grfico que los puntos aparecen prximos a la lnea diagonal. Esta grfica no muestra una desviacin marcada de la normalidad

  • El valor del p-valor es mayor que el nivel de significacin 0.05, no rechazndose la hiptesis de normalidad.

    INDEPENDENCIA:

    Para comprobar que se satisface el supuesto de independencia entre los residuos analizamos el grfico de los residuos frente a los valores pronosticados o predichos por el modelo. El empleo de este grfico es til puesto que la presencia de alguna tendencia en el mismo puede ser indicio de una violacin de dicha hiptesis.

    En esta figura, interpretamos el grfico que aparece en la fila 3 columna 2, es decir aquel grfico que se representan los residuos en el eje de ordenadas y los valores pronosticados en el eje de abscisas. No observamos, en dicho grfico, ninguna tendencia sistemtica que haga sospechar del incumplimiento de la suposicin de independencia. Luego podemos suponer su independencia.

  • HOMOCEDASTICIDAD:

    Para comprobar que se satisface el supuesto de homocedasticidad, realizamos el test de Levene mediante SPSS:

    El p-valor es 0.303 por lo tanto no se puede rechazar la hiptesis de homogeneidad de las varianzas y se concluye que los tres grupos tienen varianzas homogneas.