Análisis de Varianza

5
Análisis de varianza Antes, en este capítulo, utilizamos la prueba ji-cuadrada para examinar las diferencias entre más de dos proporciones muestrales y para hacer inferencias acerca de si las muestras se tomaron de poblaciones que contenían la misma proporción. En esta sección, aprenderemos una tcnica conocida como análisis de varianza (a menudo abreviada ANOVA: analysis of variance), que permite probar la significancia de las diferencias entre más de dos medias muestrales. !sando el análisis de "arianza, podremos hacer inferencias acerca de si nuestras muestras se tomaron de poblaciones que tienen la misma media. El análisis de "arianza será #til en situaciones tales como la comparación del $ilometraje lo%rado por cinco clases diferentes de %asolina& la prueba de cuál de cuatro mtodos de capacitación produce el aprendizaje más rápido& o en la comparación de los in%resos del  primer a'o de los %raduados de una media docena de escuelas de administración. En cada caso, se pueden comparar las medias de más de dos muestras. (lanteamiento del problema En el problema del director de capacitación con que iniciamos el capítulo, se querían e"aluar tres mtodos de capacitación para determinar si había al%una diferencia en su efecti"idad. )espus de terminar el periodo de capacitación, los especialistas en estadística de la compa'ía tomaron *+ nue"os empleados asi%nados aleatoriamente a los tres mtodos de capacitación. ontando los resultados de la producción de estos *+ empleados, el personal de estadística resumió los datos y calculó su producción media. Ahora bien, si deseamos determinar la gran media o la media del %rupo completo de *+ empleados nue"os/,  podemos utilizar uno de dos mtodos0 Análisis de Varianza a una v a: !ise"o completamente aleatorizado 1ay "arias formas en las cuales puede dise'arse un experimento A234A . 5uizás el más com#n es el dise'o completamente aleatorizado a una "ía. El trmino pro"iene del hecho que "arios sujetos o unidades experimentales se asi%nan aleatoriamente a diferentes ni"eles de un solo factor. (or ejemplo0 "arios empleados unidades experimentales/ pueden seleccionarse aleatoriamente para participar en di"ersos tipos ni"eles diferentes/ de un pro%rama de capacitación el factor/. El análisis de "arianza se basa en una comparación de la cantidad de "ariación en cada uno de los tratamientos. 6i de un tratamiento al otro la "ariación es si%nificati"amente alta,  puede concluirse que los tratamientos tienen efectos diferentes en las poblaciones.

description

...

Transcript of Análisis de Varianza

7/21/2019 Análisis de Varianza

http://slidepdf.com/reader/full/analisis-de-varianza-56d83488db7b8 1/5

Análisis de varianzaAntes, en este capítulo, utilizamos la prueba ji-cuadrada para examinar las diferencias entremás de dos proporciones muestrales y para hacer inferencias acerca de si las muestras se

tomaron de poblaciones que contenían la misma proporción. En esta sección, aprenderemos

una tcnica conocida como análisis de varianza (a menudo abreviada ANOVA: analysis

of variance), que permite probar la significancia de las diferencias entre más de dosmedias muestrales. !sando el análisis de "arianza, podremos hacer inferencias acerca de

si nuestras muestras se tomaron de poblaciones que tienen la misma media.

El análisis de "arianza será #til en situaciones tales como la comparación del $ilometrajelo%rado por cinco clases diferentes de %asolina& la prueba de cuál de cuatro mtodos de

capacitación produce el aprendizaje más rápido& o en la comparación de los in%resos del

 primer a'o de los %raduados de una media docena de escuelas de administración. En cadacaso, se pueden comparar las medias de más de dos muestras.

(lanteamiento del problema

En el problema del director de capacitación con que iniciamos el capítulo, se querían

e"aluar tres mtodos de capacitación para determinar si había al%una diferencia en suefecti"idad.

)espus de terminar el periodo de capacitación, los especialistas en estadística de la

compa'ía tomaron *+ nue"os empleados asi%nados aleatoriamente a los tres mtodos decapacitación. ontando los resultados de la producción de estos *+ empleados, el personal

de estadística resumió los datos y calculó su producción media. Ahora bien, si deseamos

determinar la gran media o la media del %rupo completo de *+ empleados nue"os/, podemos utilizar uno de dos mtodos0

Análisis de Varianza a una va: !ise"o completamente aleatorizado1ay "arias formas en las cuales puede dise'arse un experimento A234A. 5uizás el más

com#n es el dise'o completamente aleatorizado a una "ía. El trmino pro"iene del hecho

que "arios sujetos o unidades experimentales se asi%nan aleatoriamente a diferentes ni"elesde un solo factor. (or ejemplo0 "arios empleados unidades experimentales/ pueden

seleccionarse aleatoriamente para participar en di"ersos tipos ni"eles diferentes/ deun pro%rama de capacitación el factor/.

El análisis de "arianza se basa en una comparación de la cantidad de "ariación en cada uno

de los tratamientos. 6i de un tratamiento al otro la "ariación es si%nificati"amente alta, puede concluirse que los tratamientos tienen efectos diferentes en las poblaciones.

7/21/2019 Análisis de Varianza

http://slidepdf.com/reader/full/analisis-de-varianza-56d83488db7b8 2/5

a. Esta "ariación entre el n#mero total de las *7 obser"aciones. Esto se

llama variaci#n total. b. Existe "ariación entre los diferentes tratamientos muestras/. Esto se

llama variaci#n entre muestras.

c. Existe "ariación dentro de un tratamiento dado muestra/. Esto se

denomina variaci#n dentro de la muestra.

El análisis de la "arianza o Ano"a0 Analysis of "ariance/ es un mtodo  para comparar dos o

más medias, que es necesario porque cuando se quiere comparar más de dos medias es

incorrecto utilizar repetidamente el contraste basado en la t de 6tudent. (or dos moti"os0

En primer lu%ar, y como se realizarían simultánea e independientemente "arios contrastesde hipótesis, la probabilidad de encontrar al%uno si%nificati"o por azar aumentaría. En cada

contraste se rechaza la 18 si la t supera el ni"el crítico, para lo que, en la hipó tesis nula, hay

una probabilidad. 6i se realizan m contrastes independientes, la probabilidad de que, en laahipótesis nula, nin%#n estadístico supere el "alor / a crítico es * - m, por lo tanto, la

 probabilidad de que al%uno lo /a supere es * - * - m, que para "alores m. !na primera

solución, a próximos a 8 es aproximadamente i%ual a a de denominada mtodo de9onferroni, consiste en bajar el "alor :m, aunque resulta un mtodo muy conser"ador.a ,

usando en su lu%ar a de

(or otro lado, en cada comparación la hipótesis nula es que las dos muestras pro"ienen dela misma población, por lo tanto, cuando se hayan realizado todas las comparaciones, la

hipótesis nula es que todas las muestras pro"ienen de la misma población y, sin embar%o,

 para cada comparación, la estimación de la "arianza necesaria para el contraste es distinta,

 pues se ha hecho en base a muestras distintas.El mtodo que resuel"e ambos  problemas es el ano"a, aunque es al%o más que esto0 es un

mtodo que permite comparar "arias medias en di"ersas situaciones& muy li%ado, por tanto,

al dise'o de experimentos y, de al%una manera, es la base del análisis multi"ariante.

ANA$%&%& !' VA%ANA !' !O& V*A& o !%'++%ON'&En este caso las fórmulas son parecidas a la del A234A de una "ía pero ahora a%re%ando elcálculo por ren%lones adicional al de columnas donde se incluye la "ariable de bloqueo.

6e trata de bloquear un factor externo que probablemente ten%a efecto en la respuesta pero

que no hay inters en probar su influencia, sólo se bloquea para mininizar la "ariabilidad de

este factor externo, e"itando que contamine la prueba de i%ualdad entre los tratamientos.;os tratamientos se asi%nan a las columnas y los bloques a los ren%lones. !n bloque indica

condiciones similares de los sujetos al experimentar con diferentes tratamientos. ;as

hipótesis son01o0 2o hay diferencia en las medias del factor de columna

1a0 Al menos una media del factor de columna es diferente

1o0 2o hay diferencia en las medias de la "ariable de ren%lón

1a0 Al menos una media de la "ariable de ren%lón es diferente

. '-emplos con cálculo manual'-emplo .6uponiendo que se quiere in"esti%ar si la producción de tres diferentes máquinas es i%ual,

tomando en cuenta la experiencia de los operadores a un ni"el de si%nificancia del <=.

7/21/2019 Análisis de Varianza

http://slidepdf.com/reader/full/analisis-de-varianza-56d83488db7b8 3/5

Experiencia >áquinas

de ops. 'n a"os /aq /aq /aq 0 1romedios

* ?@ ?* ?< ?7.

? * <

7? B

 

B 78

7 C 7* @ C.++++@

< 7< 7+ 7< 7<.

1romedios +.+ + +.? +.?+++@

DA9;A A234A

  66 ; > Fc Falfa

6DGH 8.B ? >DGH 8.7++++@ Ftr H 8.8B 7.7+

69;H @+7.B 7 >9;H *B*.?

Fbl H

@.?< .C7

6E H 7*.8+++@ C >EH <.*

6D H C8+.B *7 >DH <@.+C*

onclusión0 2o hay diferencia entre máquinas a pesar de la diferencia en experiencia de losoperadores.

'-emplo !na empresa de taxis intenta crear un sistema de rutas que minimice el tiempo que se pasamanejando a ciertas localidades. El tiempo que toma "iajar en cada ruta por los taxis se

muestra a continuación0

4ar.

9loqueo Factor - Guta

Daxista * ? 7

* *? *< *@ *

? *C *C *C *@ *8 ** *< B

7 * *? *? *<

< *C *7 *? *<

y si afecta el taxista.

4ar. Factor - Guta

7/21/2019 Análisis de Varianza

http://slidepdf.com/reader/full/analisis-de-varianza-56d83488db7b8 4/5

9loqueo

Daxista * ? 7

* *? *< *@ *

? *C *C *C *@

*8 ** *< B

7 * *? *? *<< *C *7 *? *<

*7.? *7 *7.C *.C

2 *7.?

A 7.C7 8.+7 @.C7 *.77

9 *7.77 *7.77 *7.77 @.C7

*@.+7 *8.?7 8.+7 [email protected]

) *.77 7.C7 7.C7 8.+7

E *7.77 8.87 7.C7 8.+7

6D *<.?

r < rjIj -I/J?

8 8.? *.C 8.C

&+3  ?.C

c 7c4(2i52)68.8* &+7$ B?.?

<8.7*

7.C*

<.@+

*.?*6E H 6D - 6DG - 69;

&+' <C.?

DA9;A A234A

7/21/2019 Análisis de Varianza

http://slidepdf.com/reader/full/analisis-de-varianza-56d83488db7b8 5/5

Fuente de4ariación

6 %.l. > F

olumnas ?.C 8.B 8.*B?7BB

Gen%lones B?.? 7 ?.8< 7.@<?<@@

Error <C.? *? 7.C<

Dotal *<.?

onclusión0 2o hay diferencia en la tiempo por las rutas a pesar de diferencias en taxistas

!/& 1rueba de 389'

Gen%lones < Alfa 8.8<=olumnas 7

n/ datos ?8

n-c *+>E 7.C<

3bteniendo q de tablas H 7.8<

  )iferencias 6i%nificati"as

x*-x? .< 2o

x*-x 2o

x*-x7 *.?< 2o

x*-x< 8.< 2o

x?-x +.< 6i%nificati"as

x?-x7 7.@< 6i%nificati"as

x?-x< 2o

x-x7 *.@< 2o

x-x< .< 2o

x7-x< *.@< 2o

F H )K6DG.F.K24alfa, %l. H*, %l. >E H*?/F H 7.@7@?

)>6 H ?.*7<B

onclusión0 >edias (oblacionales de taxistas diferentes

CME qT  cnc   −

=,,α