USO DEL “ANÁLISIS DE VARIANZA UNA-VÍA”,
PARA:
Contrastar la hipótesis sobre,
la diferencia de más de dos medias
poblacionales.
Guía Anova Una Vía: No.4: Formalización del
Modelo
(GAUV_04)
Caracas, Julio 2010Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
Formalización del Modelo Anova Una Vía. Planteamiento del Problema:
aleatoria cuyo tamaño puede ser igual o diferente, con lo que se tienen k muestras independientes con un determinado número de observaciones. Sea ; el número de elementos en la j-ésima muestra.
k ,,, 21 kH 210 :
:1H
, 1, 2, ,jn j k
Se tienen k poblaciones estadísticas, con medias ; y se trata
poblacionales, contra la hipótesis alternativa: por lo menos dos de las medias poblacionales son diferentes. Se toma de cada población una muestra
de contrastar la hipótesis nula: ; de igualdad de medias,
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
ijX
53X
Sea la i-ésima observación de la variable en la j-ésima muestra,
es la quinta observación de la variable en la tercera muestra.
La nomenclatura a ser utilizada será:
nknn
k
k
XXX
XXX
XXX
kMuestraMuestraMuestra
21
22221
11211
21
donde i=1,2,…,n ; j=1,2,…,k Así, por ejemplo:
Formalización del Modelo Anova Una Vía. PLANTEAMIENTO DEL PROBLEMA:
Nota: Con respecto al tamaño de las muestras, se pueden presentar dos situaciones: Caso 1: Muestras con igual tamaño; Caso 2: Muestras con al menos un tamaño distinto. Se sigue el análisis para cada uno de los casos.
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
1 21 1 1
1 21 1 1
1 2
2 21 1
2 2 21 11
2 21 1 1 1
2 2 21 11
( ) ( )ˆ ˆ ˆ
1 1
( ) ( )
n n n
i i iki i i
n n n
i i iki i i
j k
n n
i ik ki i
j k
n n
i ii i
j k
SUMAS X X X
X X XX X X X
n n n
X X X XS S S
n n
X X X XS S S
n n
GRAN MEDIA GLOBAL O MEDIA GLOBAL: 1 1 1
k n k
ij jj i j
X X
Xkn k
Formalización del Modelo Anova Una Vía. PLANTEAMIENTO DEL PROBLEMA:
Caso 1: Muestras con igual tamaño;
nnnn k 21
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
EJEMPLO:
En una industria se escogen 3 grupos de 5 obreros cada uno, y se les da entrenamiento con base a 3 diferentes métodos. Las productividades de los obreros después del entrenamiento fueron las siguientes:
METODO 1 METODO 2 METODO 3
20 25 16
25 26 18
23 20 15
18 29 20
19 30 21
Pr
1, 2,3, 4,5
1, 2,3
ijX oductividad del i ésimo obrero que
recibió el j ésimo método de entrenamiento
i
j
1 1 1 21 26 18 6521,67
3 3
Pr Pr 15
k n k
ij jj i j
X X
Xkn k
oductividad omedio de los obreros en la muestra
1. Unidades Experimentales: Obreros
2. Factor: Método de entrenamiento.
3. 3. Tratamiento: tipos de entrenamiento (1,2 y 3)-
4. Variable Respuesta: productividad del obrero.
nnnn k 21
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
11
1
21
2
21
3
20 25 23 18 1921 Pr Pr
5.1
26
18
n
ii
n
ii
n
ii
XX oductividad omedio de los obreros
nque recibieron el método de entrenamiento No
XX
n
XX
n
MEDIAS MUESTRALES
Formalización del Modelo Anova Una Vía
CUASIVARIANZAS MUESTRALES
2 21 1 1
2 1 11
2 22 2 2 2
2 1 12
2 23 3 3 3
2 1 13
( ) ( 21)34ˆ 8,5
1 4 4
( ) ( )62ˆ 15,5
1 1 4
( ) ( )26ˆ 6,5
1 1 4
n n
i ii i
n n
i ii i
n n
i ii i
X X XS
n
X X X XS
n n
X X X XS
n n
VARIANZAS MUESTRALES
21 1
2 11
22 2
2 112
23 3
2 13
( )34
6,85
( )62
12,45
( )26
5,25
n
ii
n
ii
n
ii
X XS
n
X XS
n
X XS
n
Caso 1: Muestras con igual tamaño;
nnnn k 21
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
Formalización del modelo ANOVA una vía. Descomposición de la Suma de Cuadrados (SCT)
Consideremos la variable, SCT= SUMA DE CUADRADOS TOTALES, donde
2
1 1
k n
ijj i
SCT X X
SCT, es la suma de los cuadrados de las diferencias entre todos los elementos de la muestra y la gran media. Es una medida de dispersión de todas las observaciones con respecto a la media global.
Operando convenientemente, se puede descomponer la Variación Total medida por la Suma de Cuadrados Totales en dos componentes. Esta partición de la SCT en dos partes es la relación básica en el método de Análisis de Varianza (ANOVA).
nnnn k 21
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
SCD= Suma de cuadrados dentro de las muestras (variabilidad o dispersión dentro de cada una de las muestras).
Se demuestra que SCT (Suma de cuadrados totales) puede ser expresada de la siguiente manera:
2 2
2
1 1 1 1 1
( )k n k n k
ij ij j jj i j i j
SCT X X X X n X X
La variación o dispersión total de los datos se ha dividido en dos componentes, cada una de las cuales refleja la variación debida a diferentes causas o fuentes de variación.
SCT = SCD + SCE
donde:
SCE= Suma de cuadrados entre las muestras (variabilidad o dispersión entre las muestras).
Formalización del modelo ANOVA una vía. Descomposición de la Suma de Cuadrados (SCT)
nnnn k 21
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
Medias
Método 1 Xij 21 Métodos Medias
1 20 2,78 1,00 1 21 0,44
2 25 11,11 16,00 2 26 18,78
3 23 1,78 4,00 3 18 13,44
4 18 13,44 9,00
5 19 7,11 4,00 163,33
Método 2 26
1 25 11,11 1,00
2 26 18,78 0,00
3 20 2,78 36,00
4 29 53,78 9,00
5 30 69,44 16,00
Método 3 18
1 16 32,11 4,00
2 18 13,44 0,00
3 15 44,44 9,00
4 20 2,78 4,00
5 21 0,44 9,00
325 285,33 122,00
21,67
Gran Media Global
Medias de los Grupos
Luego,SCT= 122+163,33= 285,33
METODO 1
METODO 2
METODO 3
20 25 16
25 26 18
23 20 15
18 29 20
19 30 21
Ejemplo 3: Ilustrando los cálculos utilizando Excel.
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
Formalización del Modelo Anova Una Vía
luego SCT= 122+163,33= 285,33
2
1 1
34 62 26 122k n
ij jj i
SCD X X
En nuestro ejemplo, tenemos que:
dispersión dentro de cada una de las muestras
22 2 2
1
( ) 5 21 21,67 (26 21,67) (18 21,67) 163,33k
jj
SCE n X X
dispersión entre las muestras
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
ESTADÍSTICO DE CONTRASTE
gdlFunacomodistribuyeseSCD
SCE
k
nk
nk
SCDk
SCE
F nkkc )1();1(1
)1(
)1(
1
Caso 1: Muestras con igual tamaño;
nnnn k 21
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
PROCEDIMIENTO DEL CONTRASTE
gdlFunacomodistribuyeseSCD
SCE
k
nk
nk
SCDk
SCE
F nkkc )1();1(1
)1(
)1(
1
2. Estadístico de contraste
kH 210 :
1 :H
1. Formulación de hipótesis:
Hipótesis alternativa al menos dos medias son diferentesHipótesis nula
3. Criterio de decisión:
Entonces Rechzar H0Si
A continuación se presenta un resumen de los elementos necesarios para realizar el contraste de hipótesis para la diferencia de mas de dos medias poblacionales:
nnnn k 21
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
kH 210 :
1 :H
1. Formulación de hipótesis:
al menos dos medias son diferentes
Ejemplo: Prueba de Hipótesis para el contraste de para la diferencia de mas de dos medias poblacionales
2. Cálculo del estadístico de contraste:
3 (15 -1) * 163,33
(3 -1) * 122= =
8,033
Para un alfa = 0.05; tenemos una
= 3,89F1-0.05; (3-1),(3(15-
1)
3. Criterio de decisión:
Entonces Rechzar H0Si
Como, 8,033 > 3,89 ; entonces rechazamos H0
Decisión:
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
Tabla de ANOVA : (ANOVA una-vía: un solo factor en múltiples niveles)
Presentando los cálculos e información en una Tabla Anova Una Vía
2
1
( ) 163,33k
jj
n X X
81,6671
SCE
k
CME
CMD
2
1 1
122k n
ij jj i
X X
10,167( 1)
SCD
k n
2
1 1
285,33k n
ijj i
X X
Fuente DeVariación
Suma DeCuadrados
GradosDe
Libertad
CuadradosMedios
RazónF
(Fc)
Entre Las Muestras
(Inter-Grupos)
K-1=2 8,033
Dentro De Las
Muestras(Intra-
Grupos)
K(N-1)=12
TotalKn-1=14
A continuación presentamos una
salida del SPSS (versión 11.0) ,
que muestra la tabla Anova.Compare ambas tablas y ubique en la Salida del SPSS los elementos del contraste de hipótesis para la diferencia de más de dos medias.
ANOVA
PRODUCTI
163,333 2 81,667 8,033 ,006
122,000 12 10,167
285,333 14
Inter-grupos
Intra-grupos
Total
Suma decuadrados gl
Mediacuadrática F Sig.
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
Gran Media Global o Media Global:
Formalización del Modelo Anova Una Vía. PLANTEAMIENTO DEL PROBLEMA:
Caso 2: Al menos una de las muestras es de tamaño diferente. En este caso, el procedimiento es análogo al caso anterior; solo que se producen algunas modificaciones en las expresiones utilizadas.
1 1 1
( )
jnk k
ij j jj i j
X n X
XN N
Media Ponderada
1
k
jj
N n
1 1,2, ,
n
iji
jj
XX j k
n
2
2 1
( )ˆ
1
jn
ij ji
jj
X XS
n
Medias muestrales
2
2 1
( )
1
jn
ij ji
jj
X XS
n
Varianzas muestrales
Cuasivarianzas muestrales
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
Fuente de Variación
Suma de Cuadrados
Grados De
Libertad
Cuadrados Medios
Razon F
(fc) Entre las muestras
(inter-grupos)
2
1
( )k
j jj
SCE n X X
K-1
1
SCECME
k
Dentro de las
muestras (intra-grupos)
2
1 1
jnk
ij jj i
SCD X X
N-k
SCDCMD
N k
CME
CMD
Total
2
1 1
k n
ijj i
SCT X X
N-1
Presentando los cálculos e información en una Tabla Anova
Caso 2: Al menos una de las muestras es de tamaño diferente. En este caso, el procedimiento es análogo al caso anterior; solo que se producen algunas modificaciones en las expresiones utilizadas.
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
PROCEDIMIENTO DEL CONTRASTE
kH 210 :
1 :H
1. Formulación de hipótesis:
Hipótesis alternativa al menos dos medias son diferentesHipótesis nula
A continuación se presenta un resumen de los elementos necesarios para realizar el contraste de hipótesis para la diferencia de mas de dos medias poblacionales:
Caso 2: Al menos una de las muestras es de distinto tamaño.
2. Estadístico de contraste
libertaddegradosFunacomodistribuyeseCMD
CMEF kNkc ;1
3. Criterio de decisión:
Entonces Rechzar H0Si
1 ; ( 1),c k N kF F grados de libertad
Amarilis García . Caracas, Julio 2010
UCV/FACES/EECA/Curso: Estadística II
Guía Anova Una Vía: Formalización del Modelo (GAUV_04)
Top Related