Distribucin F
Esta distribucin probabilstica se utiliza como
estadstico de prueba en varias situaciones. Sirve para
demostrar si dos varianzas muestrales provienen de la
misma poblacin o de poblaciones iguales, y tambin se
aplica cuando se desean comparar simultneamente tres o
ms medias poblacionales. Esta comparacin simultnea de
varias medias poblacionales se denomina Anlisis de
varianza (de anlisis of variance). En estos dos casos, las
poblaciones deben ser normales y los datos deben estar al
menos medidos en escala de intervalo.
Caractersticas de la distribucin F
1. Existe una familia de distribuciones F. Un elemento especfico de la familia est determinado por dos parmetros: los grados de libertad en el numerador y
los grados de libertad en el denominador.
2. El valor de F no puede ser negativo. 3. La distribucin F es una distribucin continua. 4. La curva que representa una distribucin F tiene un sesgo positivo. 5. Sus valores varan de 0 a . A medida que aumenta el valor de F, la curva se
aproxima al eje X, pero nunca lo toca.
Comparacin de dos varianzas poblacionales
La distribucin F se utiliza para demostrar la hiptesis de que la
varianza de una poblacin normal es igual a la varianza de otra
poblacional normal. As, la prueba es til para determinar si una
poblacin normal tiene o no ms variacin que otra. En los siguientes
ejemplo se muestra el uso de esta prueba:
Dos cizallas se ajustan para producir elementos de acero de la misma
longitud. Por tanto, los elementos tener la misma longitud. Se desea
estar seguro que adems de tener la misma longitud, tengan una
variacin similar.
La tasa media de rendimiento a la inversin de dos tipos de acciones
puede ser la mismo, pero hay ms variacin en el rendimiento de una
que de otra. Una muestra de 10 acciones de industria aeroespacial y 10
acciones de servicios podran mostrar la misma tasa media de
rendimiento, pero es probable que haya ms variacin en el rendimiento
de las acciones aeroespaciales.
Consideraciones de validacin
Al comparar las varianzas de dos poblaciones usaremos datos
reunidos de dos muestras aleatorias independientes, una de la
poblacin 1 y la otra de la poblacin 2. Las dos varianzas de las
muestras, 21s y 2
2s sern la base para hacer inferencias acerca de las
dos varianzas poblacionales 21 y 2
2 . Siempre que las dos varianzas
poblacionales sean iguales ( 21 =2
2 ), la distribucin de la relacin de
las dos varianzas de las muestras 21s /2
2s es la siguiente:
Distribucin muestral de 21s / 22s cuando 21 = 22
Siempre que se seleccionan muestras aleatorias simples de
tamao n1 y n2 a partir de poblaciones normales con
varianzas iguales, la distribucin de las muestras
2
2
2
1
s
s (9)
tiene distribucin F con n1 1 grados de libertad para el
numerador y n2 1 grados de libertad para el denominador; 2
1s es la varianza de la muestra de los n1 artculos
procedentes de la poblacin 1 y 22s es la de los n2 artculos
procedentes de la poblacin 2.
EJEMPLO
La Escuela bancaria va a renovar su contrato de servicio de
autobs escolar para el ao prximo, y debe seleccionar entre
las empresas Transportes rpidos, S.A. y Transportes eficaces,
S.A.. Usaremos la varianza de los tiempos de recepciones que
se tarda en recoger y entregar alumnos como medida principal
de la calidad del servicio. Los valores bajos de varianza indican
que el servicio es ms consistente y de mayor calidad. Si las
varianzas de los tiempos de llegada asociadas con los dos
servicios son iguales, los administradores de la Escuela
bancaria seleccionarn la empresa que ofrezca mejores
condiciones financieras. Sin embargo, si los datos de las
muestras de tiempos de llegada para las dos empresas indican
que hay una gran diferencia entre las varianzas, los
administradores tendrn muy en cuenta a la que tenga menor
varianza del servicio
Las hiptesis de prueba son las siguientes:
2
2
2
11
2
2
2
10
:
:
H
H
Si se puede rechazar 0H , es adecuada la conclusin
de distinta calidad en los servicios. En tal caso, se
preferir a la empresa con menor varianza de la
muestra.
Suponga que se har la prueba de hiptesis con =
0.10 y que se obtienen muestras de tiempos de
llegada con escuelas que actualmente usan los
servicios de los dos transportistas. Se obtiene una
muestra de 25 tiempos para los rpidos (poblacin
1) y una de 16 para los eficaces (poblacin 2). La
figura 3 es la grfica de la distribucin F con n1
1 = 24 grados de libertad en el numerador y n2 1
= 15 grados de libertad en el denominador.
Observe que la regin bilateral de rechazo se caracteriza por los valores crticos en 95.0F y 05.0F .
Fig. 3: Regin de rechazo para el ejemplo del autobs para la escuela bancaria con = 0.05
2
2
2
1
s
sF
0.05 0.05
F0.95 F0.05 Se rechaza H0 Se rechaza H0
Suponga que las dos muestras de tiempos de
llegada del autobs produjeron las varianzas 21s =
48 para los rpidos y 22s = 20 para los eficaces.
Qu conclusin es la adecuada? Se supone que
las dos poblaciones de tiempos de llegada tienen
distribuciones normales de probabilidad, y que 0H
es verdadera si 21 = 22 . Se puede aplicar la
distribucin F para llegar a una conclusin.
Especficamente, se calcula 2221 / ssF y se emplea la
regin de rechazo que vemos en la figura 3.
De este modo, llegamos a:
40.220
482
2
2
1 s
sF
Consultando la tabla, vemos que el valor crtico
unilateral superior (de la cola superior) con 24
grados de libertad en el numerador y 15 en el
denominador es 29.205.0 F . Aunque la tabla no
indica valores 95.0F observamos que no es necesaria
la determinacin de este valor crtico unilateral
inferior. Se puede observar que F = 2.40 es mayor
que 29.205.0 F . Entonces, con un nivel de
significancia de 0.10 se rechaza H0.
Este resultado conduce a la conclusin de que los
dos servicios de autobs son distintos en lo
concerniente a varianzas de tiempos de recepcin
y de llegada. Nuestra recomendacin es que los
administradores de la Escuela bancaria den
consideracin especial al mejor servicio, con
menor varianza, que ofrecen los Transportes
eficaces, S.A.
Tambin se puede usar el criterio del valor p
para una prueba de hiptesis acerca de dos
varianzas poblacionales. Se aplica la regla de
rechazo comn: rechazar H0 si el valor p < . Sin
embargo, al igual que con la distribucin ji
cuadrada, es difcil determinar el valor p
directamente de las tablas de la distribucin F.
Prueba bilateral de la varianza de dos
poblaciones
2
2
2
11
2
2
2
10
:
:
H
H
Se denota la poblacin que tiene la mayor
varianza de la muestra como poblacin 1.
Estadstico de prueba
2
2
2
1
s
sF
Regla de rechazo
Con el estadstico de prueba: Rechazar 0H si
2/FF
Con el valor p : Rechazar 0H si el
valor p< Donde el valor 2/F se basa en una distribucin F
con n1 1 grados de libertad en el numerador y n2 1 grados de libertad en el denominador.
Prueba unilateral sobre las varianzas de dos poblaciones
2
2
2
11
2
2
2
10
:
:
H
H
Se denota la poblacin que tiene la mayor varianza de la muestra como
poblacin 1.
Estadstico de prueba
2
2
2
1
s
sF
Regla de rechazo
Con el estadstico de prueba: Rechazar 0H si FF
Con el valor p : Rechazar 0H si el valor p<
Donde el valor F se basa en una distribucin F con n1 1 grados de
libertad en el numerador y n2 1 grados de libertad en el denominador.
Anova Nocin general
El segundo uso de la distribucin F comprende la tcnica
del anlisis de varianza, que se simboliza por ANOVA.
Bsicamente, en ese anlisis se emplea informacin muestral
para determinar si tres o ms tratamientos producen o no
resultados diferentes. El uso de la palabra tratamiento tiene su
origen en la investigacin agrcola. Se trataron campos con
distintos fertilizantes o fumigantes, para determinar si haba o no
una diferencia global en la productividad. Se probar si cinco
aditivos para la gasolina (los tratamientos) dan o no como
resultado una diferencia en el rendimiento en millas por galn.
Adems se explotar la siguiente pregunta: Los cuatros mtodos
de entrenamiento (los tratamientos) son igualmente efectivos?
Tratamiento: Causa o fuente especfica de
variacin en un conjunto de datos.
Consideraciones en que se basa la prueba
ANOVA
Antes de realizar una prueba utilizando la tcnica ANOVA se
examinarn las consideraciones en que se basa la prueba. Si no
pueden cumplirse las consideraciones siguientes, es posible
aplicar otra tcnica de anlisis de varianza (que desarrollaron
Kruskal y Wallis).
1.Las tres o ms poblaciones de inters estn distribuidas
normalmente.
2.Tales poblaciones tienen desviaciones estndar iguales.
3.Las muestras que se seleccionan de cada una de las
poblaciones son aleatorias e independientes, es decir, no estn
relacionadas entre s.
Ejemplo
Suponga que renunci el gerente de la sucursal de
Los Olivos de la cadena de tiendas comerciales Metro, y
se considera que tres vendedores pueden ocupar este
puesto. Los tres tienen la misma antigedad, educacin,
etc. Para tomar una decisin, el gerente de personal, sugiri
examinar los registros de ventas mensuales de cada uno.
En la siguiente tabla se muestran los resultados maestrales de las ventas por mes:
Ventas mensuales ($ 000)
Sr. Quiroz Sr. Huarote Sr. Martnez
15 15 19
10 10 12
9 12 16
5 11 16
16 12 17
Media muestral: 11 12 16
En este problema los vendedores son los tratamientos.
3210 : H La hiptesis nula expresa que no
hay diferencia significativa entre las ventas
medias de los tres vendedores.
:1H Plantea que al menos una media es diferente.
Se seleccion un nivel de significancia =
0.05.
El estadstico de prueba adecuado es la
distribucin F. Este procedimiento se basa en
varias consideraciones: 1) Los datos deben estar al
menos en nivel de intervalo; 2) La seleccin real
de las ventas debe hacerse utilizando un
procedimiento de tipo probabilstico; 3) La
distribucin de las venta mensuales para cada una
de las poblaciones es normal y 4) Las varianzas de
las tres poblaciones son iguales, es decir, 2
3
2
2
2
1 .
F es la razn de dos varianzas:
muestraslaseniacinlasegnestimadalpoblacionaVarianza
muestralesmediasentreiacinsegnestimadalpoblacionaVarianzaF
var
var
La terminologa comn para el numerador es
varianza entre muestras. Para el denominador
es varianza en las muestras. El numerador
tiene 1k grados de libertad. El denominador tiene
kN grados de libertad; donde k es el nmero de
tratamientos y N es el nmero de observaciones.
Para este problema relativo a un nuevo gerente de
almacn, hay tres tratamientos (vendedores), por lo que
se tiene k 1 = 3 1 = 2 g.l. en el numerado. Hay 15
observaciones (tres muestras de cinco cada una), por
tanto, hay N k = 15 3 = 12 g.l. en el denominador.
El valor crtico, esto es, el punto divisorio entre la regin de
aceptacin y la de rechazo, se obtiene consultando la
tabla correspondiente. Ese nmero es 3.89, y es el valor
crtico de F para el nivel 0.05.
Al utilizar el nivel predeterminado de 0.05, la regla de
decisin es aceptar la hiptesis nula si el valor calculado de
F es menor que o igual a 3.89; se rechaza la hiptesis nula
y se acepta la alternativa, si el valor calculado de F es
mayor que 3.89.
Para calcular F y tomar una decisin, el primer paso
es organizar una tabla ANOVA. Esta es slo una forma
conveniente de registrar la suma de cuadrados y otros
clculos. El formato general para un problema de anlisis
de varianza en un sentido se muestra en la siguiente tabla:
Fuente de Suma de Grados
de Cuadrados variacin cuadrados libertad medios
Entre tratamientos SST k - 1
SST/k-1= MSTR
Error (en los tratamientos) SSE N - k
SSE/N-k = MSE
Total Total SS
MSE
MSTR
kN
SSEk
SST
F
1
en donde:
MSTR: cuadrado medio entre tratamientos.
MSE : cuadrado medio debido al error. Tambin se denomina cuadrado
medio dentro de tratamiento.
SST : suma de cuadrados de tratamiento.
Se obtiene mediante la siguiente frmula:
N
X
n
TSST
c
c
22 )(
en donde:
2
cT : indica elevar al cuadrado el total de cada columna
(el subndice c se refiere a la columna)
cn : es el nmero de observaciones para cada
tratamiento respectivo (columna). Hay cinco cifras de
ventas para el Sr. Quiroz, cinco para el Sr. Huarote y
cinco para el Sr. Martnez.
X : es la suma de todas las observaciones (ventas). Es
$ 195.
k : es el nmero de tratamientos (vendedores). Hay
tres.
N : es el nmero total de observaciones. Hay 15.
Sr. Quiroz Sr. Huarote Sr. Martnez
1X 2
1X 2X 2
2X 3X 2
3X 15 225 15 225 19 361
10 100 10 100 12 144
9 81 12 144 16 256
5 25 11 121 16 256
16 256 12 144 17 289 Total
Totales de columna: 55 60 80 195
Tamao de muestra 5 5 5 15
Suma de cuadrados 687 734 1306 2727
Clculo de SST
70535,2605,215
)195(
5
)80(
5
)60(
5
)55()( 22222
N
X
n
TSST
c
c
Clculo de SSE
122605,2727,22
2
c
c
n
TXSSE
La variacin total (Total SS) es la suma de la variacin entre columnas y entre renglones; es decir,
Total SS = SST + SSE = 70 + 122 = 192.
Verificacin
192535,2727,215
)195(727,2
)( 222
N
XXSSTotal
Las tres sumas de cuadrados y los clculos necesarios para determinar F, se presentan en el
siguiente cuadro:
Fuente de Suma de Grados de Cuadrados
variacin cuadrados libertad medios
Entre tratamientos SST= 70 k 1=3-1=2 70/2=35 = MSTR
Error (en los tratamientos) SSE=122 N k=15-3=12 122/12 =10.17= MSE
Total SS Total SS=192
Clculo de F
44.317.10
351
MSE
MSTR
kN
SSEk
SST
F
La regla de decisin indica que si el valor calculado de F es
menor que o igual al valor crtico de 3.89, la hiptesis nula
se acepta. Si el valor de F es mayor que 3.89, la hiptesis
nula se rechaza y la hiptesis alternativa se acepta. Puesto
que 3.44 < 3.89, la hiptesis nula se acepta al nivel 0.05. En
otras palabras, las diferencias en las ventas medias
mensuales ($11,000, $12,000 y $16,000) se atribuyen al azar
(muestreo). Desde el punto de vista prctico, los niveles de
ventas de los tres vendedores que se consideran para el
puesto de gerente de almacn son iguales. No puede tomarse
una decisin respecto al puesto, con base en las ventas
mensuales
Ejemplo
Un profesor pidi a los estudiantes de un grupo grande del curso de
estadstica que evaluara su desempeo en el curso como 1 (excelente),
2 (bueno), 3 (aceptable) o 4 (deficiente). Un ayudante del profesor
recolect las evaluaciones y asegur a los estudiantes que el profesor
no las recibira hasta despus que las calificaciones del curso se
hubieran ingresado en la Direccin Acadmica. La evaluacin (el
tratamiento) que un estudiante asign al profesor se compar con su
calificacin final del curso. Lgicamente, se esperara que en general, el
grupo de estudiantes que pens que el profesor era excelente tuvieran
una calificacin promedio final del curso significativamente ms alta que
los alumnos que lo evaluaron como bueno, aceptable o regular, o
deficiente. Tambin se esperara que los alumnos que lo evaluaron
como deficiente tuvieran las calificaciones promedio ms bajas.
Se seleccionaron muestras de cada grupo de evaluacin. Los resultados son:
Excelente Bueno Regular Deficiente
94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65
La pregunta es si existe o no una diferencia estadstica entre la puntuacin media de los
cuatro grupos.
Se seleccion el nivel de significacin 0.01.
La regla de decisin es que la hiptesis nula, que plantea que no
hay diferencia entre las medias, no se rechazar si el valor
calculado de F es menor que el valor crtico. De otra manera, la
hiptesis nula se rechazar y se aceptar la hiptesis alternativa.
Recurdese que los grados de libertad en el numerador de la
razn F se obtienen por k 1, donde k es el nmero de
tratamientos (grupos de evaluacin del profesor). Hay cuatro
tratamientos, de manera que 4 1 = 3 g.l. Los grados de libertad
en el denominador son en total 18, que se obtienen mediante N
k, en donde N es el nmero total de estudiantes en la muestra.
Hay 22 estudiantes, por lo que 22 4 = 18 g.l.
Obsrvese que el valor crtico de F es 5.09, de acuerdo al
valor indicado en la tabla correspondiente. La regla de decisin
ser: acepte la hiptesis nula al nivel 0.01 si el valor calculado de
F es menor que o igual a 5.09, y rechace la hiptesis nula si el
valor calculado es mayor que 5.09.
Los clculos necesarios para determinar la razn F se muestran en la siguiente tabla:
Excelente Bueno Aceptable Deficiente
1X 2
1X 2X 2
2X 3X 2
3X 4X 2
4X
94 8836 75 5625 70 4900 68 4624
90 8100 68 4624 73 5329 70 4900
85 7225 77 5929 76 5776 72 5184
80 6400 83 6889 78 6084 65 4225
88 7744 80 6400 74 5476
68 4624 65 4225
65 4225
cT 349 391 510 414
cn 4 5 7 6
2X 30561 30811 37338 28634
Ntese que la suma de los totales por columna )( ix es 1 664; el total de los tamaos de muestras (N) es 22; y la suma de los cuadrados 127344.
Calculando SST, SSE y total SS, se obtiene:
68.89022
)1664(
6
)414(
7
)510(
5
)391(
4
)349()( 2222222
N
X
n
TSST
c
c
41.59459.1267491273442
2
c
c
n
TXSSE
Total SS = SST + SSE = 890.68 + 594.41 = 1485.09
Como verificacin:
09.14859.12585812734422
)1664(127344
)( 222
N
XXSSTotal
Estos valores se colocan en la tabla ANOVA:
Fuente de Suma de Grados de Cuadrados
variacin cuadrados libertad medios
Tratamiento (entre columnas) SST= 890.68 k 1=4-1=3 890.68/3=296.89 MSTR
Error (entre renglones) SSE=594.41 N k=22-4=18 594.41/18 =33.02= MSE
Total SS Total SS=1485.09
Introduciendo los cuadrados medios en la frmula de F, se obtiene:
99.802.33
89.296
MSE
MSTRF
La decisin: como el valor calculado de F de 8.99 es
mayor que el valor crtico de 5.09, la hiptesis nula de
que no existe diferencia entre las medias se rechaza al
nivel 0.01. Bsicamente esto indica que es muy
probable que las diferencias observadas entre las
medias no se deban al azar. Desde el punto de vista
prctica, se sugiere que las calificaciones que
obtuvieron los estudiantes en un curso estn
relacionadas con las opiniones que tienen de la
capacidad general y la forma como se conduce en clase
el profesor.
Inferencias acerca de las medias de
tratamiento
Supngase que al aplicar el procedimiento ANOVA,
se decide rechazar la hiptesis nula. Esto permite concluir
que todas las medias de tratamiento no son iguales. Algunas
veces esta conclusin puede considerarse satisfactoria, pero
en otros casos se desea saber cules medias de tratamiento
son diferentes.
En este ejemplo, la hiptesis nula se rechaz y la
alternativa se acept. Si las opiniones de los estudiantes
son en realidad diferentes, la pregunta es: Entre qu
grupos difieren las medias de tratamiento?
Existen varios procedimientos para responder esta
pregunta. Tal vez el ms sencillo es mediante el uso de
niveles de confianza.
La distribucin t se utiliza como base para esta prueba. Recurdese que una suposicin bsica de ANOVA es que las varianzas poblacionales son iguales para todos los tratamientos. Como se observ, este valor poblacional comn se denomina error cuadrado medio (MSE) que se obtiene mediante SSE/(N-k).
Un intervalo de confianza para la diferencia entre dos medias poblacionales
se logra mediante:
21
21
11)(
nnMSEtxx
1x : es la media del primer tratamiento.
2x : es la media del segundo tratamiento
t : se obtiene a partir del la tabla t. Los grados de libertad son N k.
MSE : es el error cuadrado medio que se obtiene a partir de la tabla
ANOVA.
1n : es el nmero de observaciones en el primer tratamiento.
2n : es el nmero de observaciones en el segundo tratamiento.
Si el intervalo de confianza incluye al 0, se
concluye que no hay diferencia en el par de medias de
tratamiento. Sin embargo, si ambos extremos del intervalo
de confianza tienen el mismo signo, esto indica que las
medias de tratamiento son diferentes.
Utilizando el ejemplo anterior acerca de las
opiniones de estudiantes y el nivel de confianza de 0.95,
los extremos del intervalo de confianza son 10.46 y 26.04,
que se obtienen por:
04.2646.10
79.725.18
6
1
4
10.33101.2)00.6925.87(
11)(
21
21
y
nnMSEtxx
Se conoce que el intervalo de confianza de 95% vara de 10.46 hasta 26.04. Ambos extremos
son positivos; en consecuencia, podemos concluir que estas medias de tratamiento difieren
significativamente. Es decir, los estudiantes que evaluaron al profesor como excelente tienen
calificaciones ms altas que los que lo evaluaron como malo.
Precaucin
La investigacin de diferencias de medias
de tratamiento es un proceso secuencial. El
paso inicial es realizar la prueba ANOVA.
Slo si se rechaza, la hiptesis nula de que
la medias de tratamiento son iguales, debe
intentarse llevar a cabo cualquier anlisis
de las medias de tratamiento
ANOVA en dos sentidos
Una compaa de autobuses, est ampliando el
servicio desde el centro de Lima al Aeropuerto por cuatro
rutas diferentes. La Empresa realiz recorridos de prueba
para determinar si hay diferencia significativa en los tiempos
medios del trayecto en las cuatro rutas. Los tiempos del
trayecto en minutos en cada una de las cuatro rutas se
muestran a continuacin:
Tiempo del recorrido del Centro al Aeropuerto
Da Ruta 1 Ruta 2 Ruta 3 Ruta 4
Lunes 18 20 20 22
Martes 21 22 24 24
Mircoles 20 23 25 23
Jueves 25 21 28 25
Viernes 26 24 28 25
Al nivel de significancia 0.05, puede concluirse que hay diferencia en las cuatro rutas?
Existe una diferencia dependiendo de qu da de la semana se trata?
En este caso, el da de la semana se denomina variable de bloque. En consecuencia, se tiene
variacin debida al tratamiento y debida a los bloques. La suma de cuadrados debida a los bloques
(SSB) se calcula como sigue:
N
x
k
BSSB r
22 )(
en donde Br se refiere al total del bloque, es decir, al total de cada rengln, y k es el nmero de
elementos en cada bloque.
El mismo formato que sirve para el caso de ANOVA en un sentido se utiliza para la tabla
ANOVA en dos sentidos. Los totales de SST y SS se calculan igual que antes. SSE se obtiene por
sustraccin (SSE = Total SS SST SSB). En la siguiente tabla se muestran los clculos necesarios:
Tiempo de viaje, por ruta (minutos)
Da Ruta 1 Ruta 2 Ruta 3 Ruta 4 Suma de
renglones Br
Lunes 18 20 20 22 80
Martes 21 22 24 24 91
Mircoles 20 23 25 23 91
Jueves 25 21 28 25 99
Viernes 26 24 28 25 103 Totales
Totales por columna, Tc 110 110 125 119 464
Suma de cuadrados 2446 2430 3169 2839 10904
Tamao de la muestra nc 5 5 5 5 20
Anlogo a la tabla ANOVA para un anlisis en un sentido, el formato general en dos sentidos
es:
Fuente de variacin Suma de cuadrados Grados libertad Cuadrado medio
Tratamientos SST k - 1 MSTR
k
SST
1
Bloque SSB n -1 MSB
n
SSB
1
Error SSE (k-1)(n-1) MSE
nk
SSE
)1)(1(
Total Total SS
Como antes, para calcular SST:
4.3220
)464(
5
)119(
5
)125(
5
)110(
5
)110()( 2222222
N
X
n
TSST
c
c
SSB se obtiene mediante:
2.7820
)464(
4
)103(
4
)99(
4
)91(
4
)91(
4
)80()( 22222222
N
x
k
BSSB r
Los dems trminos de suma de cuadrados son:
2.13920
)464(10904
)( 222
N
XXSSTotal
SSE = Total SS SST SSB=139.2 32.4 78.2 = 28.6
Los valores para los diferentes componentes de la tabla ANOVA se calculan de la siguiente manera:
Fuente de variacin Suma de cuadrados Grados libertad Cuadrado medio
Tratamientos 32.4 3 8.10
3
4.32
Bloque 78.2 4 55.19
4
2.78
Error 28.6 12 38.2
12
6.28
Total 139.0
1.- 43210 : H . Las medias de tratamiento son iguales.
:1H Las medias de tratamiento no son iguales.
2.- 543210 : H . Las medias de bloques son iguales.
1H : Las medias de bloques no son iguales.
Primero se demostrar la hiptesis sobre las medias de tratamiento. Hay k 1 = 4 1 = 3 grados de
libertad en el numerador y (k 1) (n 1) = (4 1) (5 1) = 12 grados de libertad en el
denominador. Al nivel de significancia 0.05, el valor crtico de F es 3.49. La hiptesis nula de que
los tiempos medios para las cuatro rutas son iguales se rechaza si la razn F es mayor que 3.49.
54.438.2
8.10
MSE
MSTRF
La hiptesis nula se rechaza y se acepta la hiptesis alternativa. Se concluye que el tiempo
promedio de trayecto no es igual para todas las rutas. La empresa desea efectuar algunas pruebas
para determinar qu medias de tratamiento difieren.
A continuacin, se hace una prueba para determinar si el tiempo del trayecto es igual para
diferentes das de la semana. Los grados de libertad en el numerador para bloques es n 1 = 5 1 =
4. Los grados de libertad en el denominador son igual que antes, es decir, 12. La hiptesis nula de
que las medias de bloques son iguales se rechaza si la razn F es mayor que 3.26.
21.838.2
55.19
MSE
MSBF
La hiptesis nula se rechaza, y la hiptesis alternativa se acepta. El tiempo promedio del
trayecto no es igual para los diferentes das de la semana.
En MINITAB los resultados son los siguientes:
Two-way Analysis of Variance Analysis of Variance for Tiempos
Source DF SS MS F P
rutas 3 32.40 10.80 4.53 0.024
dias 4 78.20 19.55 8.20 0.002
Error 12 28.60 2.38
Total 19 139.20
Individual 95% CI
rutas Mean ----+---------+---------+---------+-------
1 22.00 (---------*---------)
2 22.00 (---------*---------)
3 25.00 (---------*---------)
4 23.80 (---------*---------)
----+---------+---------+---------+-------
21.00 22.50 24.00 25.50
Individual 95% CI
dias Mean -------+---------+---------+---------+----
1 20.00 (------*------)
2 22.75 (------*------)
3 22.75 (------*------)
4 24.75 (------*------)
5 25.75 (------*------)
-------+---------+---------+---------+----
20.00 22.50 25.00 27.50
Estadstica para Administracin y Economa, Mason y Lind
Top Related