Análisis multivariado de varianza y covarianza

40
Análisis multivariado de varianza y covarianza I. MANOVA Al igual que ANOVA, el análisis de varianza multivariante (MANOVA) está diseñado para evaluar la importancia de las diferencias grupales. La única diferencia sustancial entre los dos procedimientos es que MANOVA puede incluir varias variables dependientes, mientras que ANOVA solo puede manejar una. A menudo, estas variables dependientes múltiples consisten en diferentes medidas de esencialmente lo mismo (Aron, Aron y Coups, 2006), pero no siempre es así. Como mínimo, los Variables Dependientes (VD) deberían tener algún grado de linealidad y compartir un significado conceptual común (Stevens, 2001). Deben tener sentido como un grupo de variables. Como verá pronto, la lógica básica detrás de un MANOVA es esencialmente la misma que en un análisis de varianza univariante. SUPUESTOS Y LIMITACIONES Debido a que estamos presentando nuestra primera técnica verdaderamente multivariada en este capítulo, tenemos un nuevo conjunto de supuestos estadísticos para discutir. Son nuevos porque se aplican a la situación multivariada; sin embargo, son bastante análogos a las suposiciones para el análisis de varianza univariante, que ya hemos examinado (ver Capítulo 4). Para el análisis de varianza multivariable, estas suposiciones son las siguientes: 1. Las observaciones dentro de cada muestra deben ser muestreadas al azar y deben ser independientes entre sí. 2. Las observaciones de todas las variables dependientes deben seguir una distribución normal multivariada en cada grupo. 3. Las matrices de covarianza de la población para las variables dependientes en cada grupo deben ser iguales (esta suposición a menudo se conoce como la homogeneidad de la suposición de matrices de covarianza o el supuesto de homocedasticidad). 4. Las relaciones entre todos los pares de DV para cada celda en la matriz de datos deben ser lineales. Recuerde que la suposición de independencia es principalmente un problema de diseño, no estadístico. Siempre que el investigador haya muestreado al azar y asignado participantes a los tratamientos, generalmente es seguro creer que esta suposición no ha sido violada. Centraremos nuestra atención en los supuestos de la normalidad multivariada, la homogeneidad de las matrices de covarianza y la linealidad. Métodos para probar suposiciones Como se discutió, la normalidad multivariado es una entidad difícil de describir e incluso más difícil de evaluar. El filtrado inicial para la normalidad multivariada consiste en evaluaciones de la normalidad univariante para todas las variables, así como exámenes de todos los diagramas de dispersión bivariados para comprobar que son aproximadamente elípticas (Stevens, 2001). Existen pruebas gráficas específicas para la normalidad

Transcript of Análisis multivariado de varianza y covarianza

Page 1: Análisis multivariado de varianza y covarianza

Análisis multivariado de varianza y

covarianza

I. MANOVA

Al igual que ANOVA, el análisis de varianza multivariante (MANOVA) está diseñado para evaluar la importancia de las diferencias grupales. La única diferencia sustancial entre los dos procedimientos es que MANOVA puede incluir varias variables dependientes, mientras que ANOVA solo puede manejar una. A menudo, estas variables dependientes múltiples consisten en diferentes medidas de esencialmente lo mismo (Aron, Aron y Coups, 2006), pero no siempre es así. Como mínimo, los Variables Dependientes (VD) deberían tener algún grado de linealidad y compartir un significado conceptual común (Stevens, 2001). Deben tener sentido como un grupo de variables. Como verá pronto, la lógica básica detrás de un MANOVA es esencialmente la misma que en un análisis de varianza univariante. SUPUESTOS Y LIMITACIONES Debido a que estamos presentando nuestra primera técnica verdaderamente multivariada en este capítulo, tenemos un nuevo conjunto de supuestos estadísticos para discutir. Son nuevos porque se aplican a la situación multivariada; sin embargo, son bastante análogos a las suposiciones para el análisis de varianza univariante, que ya hemos examinado (ver Capítulo 4). Para el análisis de varianza multivariable, estas suposiciones son las siguientes:

1. Las observaciones dentro de cada muestra deben ser muestreadas al azar y deben ser independientes entre sí.

2. Las observaciones de todas las variables dependientes deben seguir una distribución normal multivariada en cada grupo.

3. Las matrices de covarianza de la población para las variables dependientes en cada grupo deben ser iguales (esta suposición a menudo se conoce como la homogeneidad de la suposición de matrices de covarianza o el supuesto de homocedasticidad).

4. Las relaciones entre todos los pares de DV para cada celda en la matriz de datos deben ser lineales.

Recuerde que la suposición de independencia es principalmente un problema de diseño, no estadístico. Siempre que el investigador haya muestreado al azar y asignado participantes a los tratamientos, generalmente es seguro creer que esta suposición no ha sido violada. Centraremos nuestra atención en los supuestos de la normalidad multivariada, la homogeneidad de las matrices de covarianza y la linealidad. Métodos para probar suposiciones Como se discutió, la normalidad multivariado es una entidad difícil de describir e incluso más difícil de evaluar. El filtrado inicial para la normalidad multivariada consiste en evaluaciones de la normalidad univariante para todas las variables, así como exámenes de todos los diagramas de dispersión bivariados para comprobar que son aproximadamente elípticas (Stevens, 2001). Existen pruebas gráficas específicas para la normalidad

Page 2: Análisis multivariado de varianza y covarianza

multivariable, pero no están disponibles en los paquetes de software estadístico estándar (Stevens, 2001) y no se analizarán aquí. Probablemente sea más importante recordar que tanto ANOVA como MANOVA son robustos a violaciones moderadas de la normalidad, siempre que la violación sea creada por asimetría y no por valores atípicos (Tabachnick y Fidell, 2007). Con tamaños de muestras iguales o desiguales y solo unas pocas VD, un tamaño de muestra de aproximadamente 20 en la celda más pequeña debería ser suficiente para garantizar la solidez a las violaciones de la normalidad univariante y multivariante. Si se determina que los datos se han desviado sustancialmente de lo normal, se deben considerar las transformaciones de los datos originales. Recuerde que la suposición de matrices de covarianza iguales (es decir, homocedasticidad) es una condición necesaria para la normalidad multivariada (Tabachnick y Fidell, 2007). El fracaso de la relación entre dos variables para ser homoscedástico se debe a la no normalidad de una de las variables o al hecho de que una de las variables puede tener algún tipo de relación con la transformación de la otra variable. Por lo tanto, verificar la normalidad univariable y multivariable es un buen punto de partida para evaluar posibles violaciones de la homocedasticidad. Específicamente, las posibles violaciones de esta suposición se pueden evaluar mediante la interpretación de los resultados de la prueba de Box. Tenga en cuenta que una violación de la asunción de homocedasticidad, similar a una violación de la homogeneidad, no resultará fatal para un análisis (Tabachnick & Fidell, 2007; Kennedy & Bush, 1985). Sin embargo, los resultados mejorarán mucho si se identifica y corrige la heterocedasticidad (Tabachnick y Fidell, 2007) mediante transformaciones de datos. Por otro lado, si se viola la homogeneidad de la varianza-covarianza, se puede seleccionar una estadística de prueba multivariada más robusta, Pillai's Trace, al interpretar los resultados multivariantes. La linealidad se evalúa mejor mediante la inspección de diagramas de dispersión bivariados. Si ambas variables en el par se distribuyen normalmente y se relacionan linealmente, la forma del diagrama de dispersión será elíptica. Si una de las variables no se distribuye normalmente, la relación no será lineal y el diagrama de dispersión entre las dos variables no aparecerá en forma ovalada. Como se mencionó la evaluación de la linealidad por medio de diagramas de dispersión bivariados es un procedimiento extremadamente subjetivo. En situaciones donde la no linealidad entre las variables es evidente, los datos pueden transformarse una vez más para mejorar la relación lineal. Interpretación de resultados El procedimiento MANOVA genera varias estadísticas de prueba para evaluar las diferencias de grupo en la VD combinado: Pillai's Trace, Wilks 'Lambda, Hotelling's Trace y Roy's Largest Root. Cuando VI tiene solo dos categorías, la prueba F para Pillai's Trace, Wilks 'Lambda y Hotelling's Trace será idéntica. Cuando VI tiene tres o más categorías, la prueba F para estas tres estadísticas diferirá ligeramente, pero mantendrá una significancia consistente o no significativa. Aunque estas estadísticas de prueba pueden variar solo ligeramente, el Lambda de Wilks es la estadística MANOVA informada con más frecuencia. El rastro de Pillai se usa cuando la homogeneidad de la varianza-covarianza está en cuestión. Si se incluyen dos o más IV en el análisis, la interacción del factor debe evaluarse antes de los efectos principales. Además de las pruebas multivariantes, el resultado para MANOVA generalmente incluye la prueba de homogeneidad de varianza-covarianza (prueba de Box), ANOVAs univariables y pruebas post hoc univariadas. Debido a que la homogeneidad de la varianza-covarianza es

Page 3: Análisis multivariado de varianza y covarianza

una suposición de prueba para MANOVA y tiene implicaciones sobre cómo interpretar las pruebas multivariantes, primero se deben evaluar los resultados de la prueba de Box. Altamente sensible a la violación de la normalidad, la prueba de Box debe interpretarse con precaución. Típicamente, si la prueba de Box es significativa en p <.001 y los tamaños de muestra grupales son extremadamente desiguales, entonces no se puede asumir la solidez, debido a desigualdades desiguales entre los grupos (Tabachnick y Fidell, 2007). En tal situación, se usa una estadística de prueba MANOVA más robusta, Pillai's Trace, al interpretar los resultados de MANOVA. Si se asumen varianzas iguales, el Lambda de Wilks se usa comúnmente como la estadística de prueba MANOVA. Una vez que se ha determinado la estadística de la prueba, se debe evaluar la interacción del factor (relación F y valor p) si se incluyen dos o más VI en el análisis. Al igual que el ANOVA de dos vías, si la interacción es significativa, las inferencias extraídas de los efectos principales son limitadas. Si la interacción del factor no es significativa, entonces se debe proceder a examinar las proporciones F y p valores para cada efecto principal. Cuando se encuentra una significancia multivariada, los resultados de ANOVA univariados pueden indicar el grado en que los grupos difieren para cada VD. Se debe aplicar un nivel alfa más conservador usando el ajuste de Bonferroni. Los resultados post hoc pueden indicar qué grupos son significativamente diferentes para la VD si se encuentra una significancia univariante para esa VD en particular. En resumen, el primer paso para interpretar los resultados de MANOVA es evaluar la prueba de Box. Si se supone la homogeneidad de la varianza-covarianza, utilice el estadístico Lambda de Wilks al interpretar las pruebas multivariantes. Si se infringe la suposición de variaciones iguales, use Pillai's Trace. Una vez que se ha identificado la estadística de prueba multivariante, examine la significación (relaciones F y valores p) de la interacción factorial. Esto es necesario solo si se incluyen dos o más IV. Luego, evalúe las relaciones F y los valores p para el efecto principal de cada factor. Si se encuentra una significación multivariada, interprete los resultados de ANOVA univariados para determinar diferencias de grupo significativas para cada DV. Si se revela el significado univariado, examine los resultados post hoc para identificar qué grupos son significativamente diferentes para cada DV. Recordando el ejemplo1 que investiga las diferencias de categoría de edad (agecat4) en los ingresos de los encuestados (rincom91) y las horas trabajadas por semana (hrs1), los datos se seleccionaron para datos faltantes y valores atípicos y luego se examinaron para verificar los supuestos de prueba. La detección de datos condujo a la transformación de rincom91 en rincom2 para eliminar todos los casos con ingresos iguales a cero y casos iguales o superiores a 22. Hrs1 también se transformó en hrs2 como medio para reducir el número de valores atípicos. Aquellos menores o iguales a 16 fueron recodificados 17, y aquellos mayores o iguales a 80 fueron recodificados 79. Aunque la normalidad de estas variables transformadas todavía es cuestionable, los tamaños de muestra grupales son bastante grandes y bastante equivalentes. Por lo tanto, se asumirá la normalidad. Luego se probó la linealidad de los dos DV creando un diagrama de dispersión y calculando el coeficiente de correlación de Pearson. Los resultados indican una relación lineal. Aunque el coeficiente de correlación es estadísticamente significativo, todavía es bastante bajo (r = .253, p <.001). Las medias no ajustadas para el ingreso (rincom2) y las horas trabajadas (hrs2) por categoría de edad (agecat4) se analizaron utilizando el procedimiento multivariable (consulte la 1 El conjunto de datos de carreer-f contiene todas las variables crudas y transformadas utilizadas para crear las Figuras 6.1-6.4.

Page 4: Análisis multivariado de varianza y covarianza

Figura 6.1). La última suposición, la homogeneidad de varianza-varianza, se probará dentro de MANOVA. Por lo tanto, MANOVA se realizó utilizando el procedimiento multivariable. La prueba de Box (ver Figura 6.2) revela que se pueden suponer varianzas iguales, F (9, 2886561) = .766, p = .648. Por lo tanto, el Lambda de Wilks se usará como estadística de prueba. La Figura 6.3 presenta los resultados de MANOVA. El criterio Lambda de Wilks indica diferencias significativas de grupo en la categoría de edad con respecto a los ingresos y las horas trabajadas por semana, Wilks Λ = .909, F (6, 1360) = 11.04, p <.001, multivariado η2 = .046. Los resultados de ANOVA univariante (ver Figura 6.4) fueron interpretados usando un nivel alfa más conservador (α = .025). Los resultados revelan que la categoría de edad difiere significativamente solo para el ingreso [F (3, 681) = 21.00, p <.001, parcial η2 = .085] y no para las horas trabajadas por semana [F (3, 681) = .167, p = .919, parcial η2 = .001]. El examen de los resultados post hoc revela que los ingresos de los que tienen entre 18 y 29 años de edad difieren significativamente de todas las demás categorías de edad (véase la Figura 6.5). Además, los ingresos de las personas de 30 a 39 años difieren de los de 40 a 49 años.

Factores inter-sujetos

Etiqueta de valor N 4 categories of age 1 18-29 128

2 30-39 222 3 40-49 194 4 50+ 141

Figura 6.1. Medios no ajustados para ingresos y horas trabajadas por categoría de edad.

Estadísticos descriptivos

4 categories of age Media Desviación

estándar N rincom2 18-29 11,8672 4,14381 128

30-39 14,0315 3,88102 222 40-49 15,3247 3,86598 194 50+ 14,9574 4,41729 141 Total 14,1839 4,21547 685 30-39 47,0315 11,41817 222 40-49 46,4897 11,75450 194 50+ 46,3262 11,51489 141 Total 46,6000 11,31890 685

Page 5: Análisis multivariado de varianza y covarianza

18-29 46,3203 10,32002 128

Figura 6.2. Prueba de caja para la homogeneidad de varianza-covarianza.

La prueba de cuadro de la igualdad de matrices de

covarianzasa

M de Box 6,936 F ,766 df1 9 df2 2886560,794 Sig. ,648

Prueba la hipótesis nula que las matrices de covarianzas observadas de las variables dependientes son iguales entre los grupos. a. Diseño : Intersección + agecat4

Figura 6.3. Pruebas multivariadas de ingresos y horas trabajadas por categoría de edad.

Pruebas multivariantea

Efecto Valor F Gl de

hipótesis gl de error Sig.

Eta parcial al cuadrado

Intersección Traza de Pillai ,957 7507,272b 2,000 680,000 ,000 ,957 Lambda de Wilks ,043 7507,272b 2,000 680,000 ,000 ,957 Traza de Hotelling 22,080 7507,272b 2,000 680,000 ,000 ,957 Raíz mayor de Roy 22,080 7507,272b 2,000 680,000 ,000 ,957

agecat4 Traza de Pillai ,091 10,791 6,000 1362,000 ,000 ,045 Lambda de Wilks ,909 11,035b 6,000 1360,000 ,000 ,046 Traza de Hotelling ,100 11,279 6,000 1358,000 ,000 ,047 Raíz mayor de Roy ,099 22,457c 3,000 681,000 ,000 ,090

a. Diseño : Intersección + agecat4 b. Estadístico exacto c. El estadístico es un límite superior en F que genera un límite inferior en el nivel de significación.

Figura 6.4. Tabla de resumen de ANOVA univariante.

Pruebas de efectos inter-sujetos

Origen Variable dependiente

Tipo III de suma de

cuadrados gl Media

cuadrática F Sig. Eta parcial al cuadrado

Modelo corregido rincom2 1029,016a 3 343,005 20,995 ,000 ,085

hrs2 64,281b 3 21,427 ,167 ,919 ,001

Intersección rincom2 128493,515 1 128493,515 7864,965 ,000 ,920

hrs2 1410953,564 1 1410953,564 10972,708 ,000 ,942

agecat4 rincom2 1029,016 3 343,005 20,995 ,000 ,085

hrs2 64,281 3 21,427 ,167 ,919 ,001

Error rincom2 11125,807 681 16,337

hrs2 87568,119 681 128,588

Total rincom2 149966,000 685

hrs2 1575151,000 685

Total corregido rincom2 12154,823 684

hrs2 87632,400 684

a. R al cuadrado = ,085 (R al cuadrado ajustada = ,081) b. R al cuadrado = ,001 (R al cuadrado ajustada = -,004)

La prueba de Box no es significativa. Use los

criterios de Lambda de Wilks.

Indica que la categoría de edad difiere

significativamente para el DV combinado.

Indica que la categoría de edad afecta

significativamente los ingresos, pero NO las

horas trabajadas.

Page 6: Análisis multivariado de varianza y covarianza

Figura 6.5. Resultados post hoc para ingresos y horas trabajadas por categoría de edad.

Comparaciones múltiples Bonferroni

Variable dependiente (I) 4 categories of age

(J) 4 categories of age

Diferencia de medias (I-J)

Error estándar Sig.

Intervalo de confianza al 95%

Límite inferior

Límite superior

rincom2 18-29 30-39 -2,1643* ,44859 ,000 -3,3513 -,9774

40-49 -3,4576* ,46027 ,000 -4,6754 -2,2397

50+ -3,0903* ,49346 ,000 -4,3960 -1,7846

30-39 18-29 2,1643* ,44859 ,000 ,9774 3,3513

40-49 -1,2932* ,39725 ,007 -2,3443 -,2421

50+ -,9259 ,43527 ,203 -2,0776 ,2258

40-49 18-29 3,4576* ,46027 ,000 2,2397 4,6754

30-39 1,2932* ,39725 ,007 ,2421 2,3443

50+ ,3673 ,44731 1,000 -,8163 1,5509

50+ 18-29 3,0903* ,49346 ,000 1,7846 4,3960

30-39 ,9259 ,43527 ,203 -,2258 2,0776

40-49 -,3673 ,44731 1,000 -1,5509 ,8163

hrs2 18-29 30-39 -,7112 1,25850 1,000 -4,0412 2,6187

40-49 -,1694 1,29128 1,000 -3,5861 3,2473

50+ -,0059 1,38440 1,000 -3,6690 3,6572

30-39 18-29 ,7112 1,25850 1,000 -2,6187 4,0412

40-49 ,5418 1,11447 1,000 -2,4070 3,4907

50+ ,7053 1,22114 1,000 -2,5258 3,9364

40-49 18-29 ,1694 1,29128 1,000 -3,2473 3,5861

30-39 -,5418 1,11447 1,000 -3,4907 2,4070

50+ ,1634 1,25491 1,000 -3,1570 3,4839

50+ 18-29 ,0059 1,38440 1,000 -3,6572 3,6690

30-39 -,7053 1,22114 1,000 -3,9364 2,5258

40-49 -,1634 1,25491 1,000 -3,4839 3,1570

Se basa en las medias observadas. El término de error es la media cuadrática(Error) = 128,588. *. La diferencia de medias es significativa en el nivel ,05.

Escribir resultados Una vez más, cualquier transformación de datos utilizada para aumentar la probabilidad de cumplir con los supuestos de la prueba debe informarse en el resumen de resultados. El resumen debe informar los resultados de las pruebas multivariantes indicando primero la estadística de prueba utilizada y su valor respectivo y luego informando la relación F, los grados de libertad, el valor p y el tamaño del efecto para cada efecto principal IV. Si el análisis de seguimiento se realizó con ANOVA univariante, estos resultados se resumirán a continuación. Informe la relación F, los grados de libertad, el valor p y el tamaño del efecto para el efecto principal en cada DV. Utilice los resultados post hoc para indicar qué grupos fueron significativamente diferentes dentro de cada DV. Finalmente, es posible que desee crear una tabla de medias y desviaciones estándar para cada DV por categorías IV. En resumen, la descripción de los resultados de MANOVA debe abordar lo siguiente:

1. Eliminación de participantes y / o transformación de variables

Page 7: Análisis multivariado de varianza y covarianza

2. Resultados de MANOVA (estadística de prueba, relación F, grados de libertad, valor p y tamaño del efecto)

a. Efectos principales para cada IV en el DV combinado b. Efecto principal para la interacción entre IV

3. Resultados ANOVA univariados (relación F, grados de libertad, valor p y tamaño del efecto)

Efecto principal para cada IV y DV

Comparación de los medios para indicar qué grupos difieren en cada DV 4. Resultados post hoc (diferencias de medias y niveles de significancia)

Utilizando nuestro ejemplo anterior, la siguiente declaración aplica los resultados de las Figuras 6.1 a 6.5. Se realizó un análisis de varianza de una vía multivariada (MANOVA) para determinar las diferencias por categoría de edad en el ingreso y las horas trabajadas por semana. Antes de la prueba, las variables se transformaron para eliminar valores atípicos. Los casos con un ingreso igual a cero o igual o superior a 22 fueron eliminados. Las horas trabajadas por semana también se transformaron; aquellos que fueron menores o iguales a 16 fueron recodificados 17 y aquellos mayores o iguales a 80 fueron recodificados 79. Los resultados de MANOVA revelaron diferencias significativas entre las categorías de edad en las variables dependientes [Wilks ' Λ= .909, F (6, 1360) = 11.04, p <.001, multivariado η2 = .046]. El análisis de varianza (ANOVA) se realizó en cada variable dependiente como una prueba de seguimiento para MANOVA. Las diferencias de edad por categoría fueron significativas para el ingreso [F (3, 681) = 21.00, p <.001, parcial η2 = .085]. Las diferencias en horas trabajadas por semana no fueron significativas [F (3, 681) = .167, p = .919, parcial η2 = .001]. El análisis post hoc de Bonferroni reveló que los ingresos de los que tienen entre 18 y 29 años difieren significativamente de todas las demás categorías de edad. Además, los ingresos de las personas de entre 30 y 39 años difieren de los de 40 a 49 años. La Tabla 1 presenta los promedios y las desviaciones estándar para el ingreso y las horas trabajadas por semana por categoría de edad. tabla 1 Medios y desviaciones estándar de ingresos y horas trabajadas por semana por categoría de edad

EJEMPLO DE ESTUDIO Y ANÁLISIS DE MANOVA Esta sección proporciona un ejemplo completo que aplica todo el proceso de conducción de MANOVA: desarrollo de preguntas e hipótesis de investigación, métodos de detección de datos, métodos de prueba, interpretación de resultados y presentación de resultados. Se utiliza el conjunto de datos de SPSS career-f.sav. Nuestro ejemplo anterior demuestra un MANOVA unidireccional, mientras que este ejemplo presentará un MANOVA bidireccional. Problema

Page 8: Análisis multivariado de varianza y covarianza

Esta vez, estamos interesados en determinar el grado en que la satisfacción laboral y de género afecta el ingreso y los años de educación entre los empleados. Debido a que dos IV se prueban en este análisis, las preguntas también deben tener en cuenta la posible interacción entre los factores. Las siguientes preguntas de investigación y sus respectivas hipótesis nulas abordan los efectos principales multivariados para cada IV (satisfacción laboral y de género sobre el ingreso y las horas trabajadas) y la posible interacción entre los factores. Ambas IV son categóricas e incluyen sexo (sexo) y satisfacción en el trabajo (satjob). Se debe tener en cuenta que el trabajo en casa representa cuatro niveles: muy satisfecho, moderadamente satisfecho, un poco insatisfecho y muy insatisfecho. Los DV son los ingresos de los encuestados (rincom2) y años de educación (educ). Ambos son cuantitativos. La variable, rincom2, es una transformación de rincom91 del ejemplo anterior.

Preguntas de investigación Hipótesis nula

RQ1: ¿Los ingresos y años de educación difieren según el género entre los empleados?

H01: Ingresos y años de educación no serán diferentes por género entre los empleados.

RQ2: ¿Los ingresos y años de educación difieren según la satisfacción laboral entre los empleados?

H02: los ingresos y años de educación no diferirán en la satisfacción laboral entre los empleados.

RQ3: ¿El género y la satisfacción laboral interactúan en el efecto sobre los ingresos y los años de educación?

H03: El género y la satisfacción laboral no interactuarán en el efecto sobre los ingresos y los años de educación.

Métodos en SPSS En primer lugar, se deben examinar los datos en busca de datos faltantes, valores atípicos y cumplimiento de supuestos de prueba. El procedimiento Explorar se realizó para identificar valores atípicos y evaluar la normalidad. Los diagramas de caja indican valores extremos en educ. En consecuencia, educ se transformó en educ2 para eliminar a los participantes con 6 años de educación o menos. Explorar se realizó nuevamente para evaluar la normalidad. Las pruebas indican una anormalidad significativa para rincom2 y educ2 en muchas categorías (ver Figura). Debido a que MANOVA es bastante robusto a la anormalidad, no se realizarán más transformaciones. Sin embargo, la no normalidad significativa junto con los tamaños de muestra de grupo desiguales, como en este ejemplo, puede conducir a la violación de la homogeneidad de la varianza-covarianza. El siguiente paso para examinar los supuestos de prueba fue determinar la linealidad entre los DV. Se creó un diagrama de dispersión. Se calcularon los coeficientes de correlación de Pearson (ver Figura) al seleccionar lo siguiente:

Analizar Correlación

Bivariate ... Dentro del cuadro de diálogo Bivariate ... (no ilustrado), mueva las variables pertinentes (educ2 y rincom2) al cuadro Variables. Luego haz clic en OK, y la salida de correlación indican una relación lineal. Aunque el coeficiente de correlación es significativo, todavía es bastante débil (r = .337, p <.001).

Page 9: Análisis multivariado de varianza y covarianza

Resumen de procesamiento de casos

Respondent's Sex

Casos

Válido Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

educ Male 408 100,0% 0 0,0% 408 100,0%

Female 339 100,0% 0 0,0% 339 100,0%

Descriptivos

Respondent's Sex Estadístico Error estándar

educ Male Media 14,01 ,141

95% de intervalo de confianza para la media

Límite inferior 13,74

Límite superior 14,29

Media recortada al 5% 14,04

Mediana 14,00

Varianza 8,137

Desviación estándar 2,853

Mínimo 6

Máximo 20

Rango 14

Rango intercuartil 4

Asimetría ,015 ,121

Curtosis -,117 ,241

Female Media 14,06 ,136

95% de intervalo de confianza para la media

Límite inferior 13,80

Límite superior 14,33

Media recortada al 5% 14,05

Mediana 14,00

Varianza 6,298

Desviación estándar 2,509

Mínimo 0

Máximo 20

Rango 20

Rango intercuartil 4

Asimetría -,133 ,132

Curtosis 2,085 ,264

Pruebas de normalidad

Respondent's Sex

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

educ Male ,152 408 ,000 ,956 408 ,000

Female ,160 339 ,000 ,918 339 ,000

a. Corrección de significación de Lilliefors

Page 10: Análisis multivariado de varianza y covarianza

Resumen de procesamiento de casos

Job Satisfaction (satjob)

Casos

Válido Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

educ Very satisfied 327 100,0% 0 0,0% 327 100,0%

Mod satisfied 320 100,0% 0 0,0% 320 100,0%

A little dissatisfied 74 100,0% 0 0,0% 74 100,0%

Very dissatisfied 26 100,0% 0 0,0% 26 100,0%

Descriptivos

Job Satisfaction (satjob) Estadístico Error estándar

educ Very satisfied Media 14,25 ,155

95% de intervalo de confianza para la media

Límite inferior 13,95

Límite superior 14,55

Media recortada al 5% 14,28

Mediana 14,00

Varianza 7,808

Desviación estándar 2,794

Mínimo 0

Máximo 20

Rango 20

Rango intercuartil 4

Asimetría -,308 ,135

Curtosis 1,653 ,269

Mod satisfied Media 13,80 ,145

95% de intervalo de confianza para la media

Límite inferior 13,51

Límite superior 14,08

Media recortada al 5% 13,78

Mediana 13,00

Varianza 6,764

Page 11: Análisis multivariado de varianza y covarianza

Desviación estándar 2,601

Mínimo 6

Máximo 20

Rango 14

Rango intercuartil 4

Asimetría ,239 ,136

Curtosis -,304 ,272

A little dissatisfied Media 13,92 ,320

95% de intervalo de confianza para la media

Límite inferior 13,28

Límite superior 14,56

Media recortada al 5% 13,92

Mediana 14,00

Varianza 7,582

Desviación estándar 2,754

Mínimo 6

Máximo 20

Rango 14

Rango intercuartil 4

Asimetría ,075 ,279

Curtosis ,487 ,552

Very dissatisfied Media 14,65 ,464

95% de intervalo de confianza para la media

Límite inferior 13,70

Límite superior 15,61

Media recortada al 5% 14,63

Mediana 15,00

Varianza 5,595

Desviación estándar 2,365

Mínimo 11

Máximo 19

Rango 8

Rango intercuartil 4

Asimetría -,041 ,456

Curtosis -,959 ,887

Pruebas de normalidad

Job Satisfaction (satjob)

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

educ Very satisfied ,140 327 ,000 ,939 327 ,000

Mod satisfied ,193 320 ,000 ,940 320 ,000

A little dissatisfied ,175 74 ,000 ,946 74 ,003

Very dissatisfied ,177 26 ,035 ,930 26 ,078

a. Corrección de significación de Lilliefors

Page 12: Análisis multivariado de varianza y covarianza

Figura 6.6. Diagramas de caja para Años de Educación por (a) Género y (b) Satisfacción

laboral.

Page 13: Análisis multivariado de varianza y covarianza

Figura 6.7. Pruebas de normalidad de ingresos y años de educación por género y

satisfacción laboral.

Pruebas de normalidad

Respondent's Sex

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

rincom2 Male ,100 374 ,000 ,950 374 ,000

Female ,110 307 ,000 ,970 307 ,000

educ2 Male ,162 374 ,000 ,954 374 ,000

Female ,177 307 ,000 ,922 307 ,000

a. Corrección de significación de Lilliefors

Pruebas de normalidad

Job Satisfaction (satjob)

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

rincom2 Very satisfied ,123 299 ,000 ,956 299 ,000

Mod satisfied ,080 291 ,000 ,972 291 ,000

A little dissatisfied ,086 67 ,200* ,964 67 ,047

Very dissatisfied ,203 24 ,012 ,954 24 ,333

educ2 Very satisfied ,148 299 ,000 ,945 299 ,000

Mod satisfied ,197 291 ,000 ,935 291 ,000

A little dissatisfied ,167 67 ,000 ,936 67 ,002

Very dissatisfied ,193 24 ,021 ,925 24 ,074

*. Esto es un límite inferior de la significación verdadera. a. Corrección de significación de Lilliefors

Las distribuciones de género para el ingreso y la educación son significativamente no

normales.

Varias distribuciones de satisfacción laboral para el ingreso

y la educación son significativamente anormales.

Page 14: Análisis multivariado de varianza y covarianza

Figura 6.8. Coeficientes de correlación para ingresos y años de educación. Correlaciones

rincom2 educ2

rincom2 Correlación de Pearson 1 ,337**

Sig. (bilateral) ,000

N 686 681

educ2 Correlación de Pearson ,337** 1

Sig. (bilateral) ,000

N 681 742

**. La correlación es significativa en el nivel 0,01 (bilateral).

El supuesto de prueba final de homogeneidad de la varianza-covarianza se probará dentro de MANOVA utilizando el procedimiento multivariante. Para abrir el cuadro de diálogo Multivariante como se muestra en la Figura 6.9, seleccione lo siguiente:

Analizar Modelo linear general

Multivariado Cuadro de diálogo multivariante (ver Figura 6.9) Una vez en esta casilla, haga clic en los DV (rincom2 y educ2) y mueva cada uno al cuadro Variables dependientes. Haga clic en los IV (sexo oral y sexo) y muévalos al cuadro Factor (es) fijo (s). Luego haz clic en Opciones. Figura 6.9. Cuadro de diálogo de multivariable.

Multivariante: cuadro de diálogo Opciones (ver Figura 6.10) Mueva ambos IV a la casilla Mostrar medios para. Seleccione Estadísticas descriptivas, Estimaciones del tamaño del efecto y Pruebas de homogeneidad en Pantalla. Estas opciones se describen en el Capítulo 4. Haga clic en Continuar. De vuelta en el cuadro de diálogo de multivariante, haga clic en Post Hoc. Figura 6.10. Multivariante: cuadro de diálogo de opciones.

El coeficiente de correlación indica una relación bastante débil.

Page 15: Análisis multivariado de varianza y covarianza

Multivariante: cuadro de diálogo Comparaciones múltiples post hoc para medios observados (ver Figura 6.11) Debajo de Factor (s), seleccione IVs (satjob) y muévase a Pruebas post hoc para box. Para nuestro ejemplo, solo se seleccionó el trabajo en voz baja porque el género tiene solo dos categorías. Bajo Variaciones Iguales Asumidas, seleccione la prueba post hoc deseada. Seleccionamos Scheffé. Haga clic en Continuar y luego en Aceptar. Figura 6.11. Multivariante: comparaciones múltiples post hoc para el cuadro de diálogo de medios observados.

Salida e Interpretación de Resultados Las Figuras 6.12 a 6.17 presentan parte de la salida de MANOVA. La prueba de Box (ver Figura 6.12) no es significativa e indica que se cumple la homogeneidad de la varianza-covarianza [F (21, 20370) = 1.245, p = .201], por lo que la estadística de la prueba Lambda de Wilks se usará para interpretar el Resultados MANOVA. Las pruebas multivariantes se presentan en la figura 6.13. La interacción del factor fue luego examinada y reveló la falta de significación [F (6, 1344) = .749, p = .610, η2 = .003]. Los principales efectos de la satisfacción laboral [F (6, 1344) = 3.98, p = .001, η2 = .017] y sexo [F (2, 672) = 8.14, p <.001,

Page 16: Análisis multivariado de varianza y covarianza

η2 = .024] son ambos significativos. Sin embargo, los tamaños de efecto multivariante son muy pequeños. Antes de examinar los resultados de ANOVA univariante, el nivel alfa se ajustó a α = .025 porque se analizaron dos DV. Los resultados de ANOVA univariante (ver Figura 6.14) indican que el ingreso difiere significativamente para la satisfacción laboral [F (3, 673) = 7.17, p <.001, η2 = .031] y género [F (1, 673) = 16.14, p <.001, η2 = .023]. Los años de educación no difieren significativamente para la satisfacción laboral [F (3, 673) = 2.18, p = .089, η2 = .010] o género [F (1, 673) = 1.03, p = .310, η2 = .002]. Los resultados post hoc de Scheffé (ver Figura 6.15) para el ingreso y la satisfacción laboral indican que las personas muy satisfechas difieren significativamente de las que solo tienen una satisfacción moderada. Las Figuras 6.16 y 6.17 presentan los medios grupales no ajustados y ajustados para el ingreso y los años de educación.

Factores inter-sujetos Etiqueta de valor N Job Satisfaction (satjob) 1 Very satisfied 299

2 Mod satisfied 291 3 A little dissatisfied 67 4 Very dissatisfied 24

Respondent's Sex 1 Male 374 2 Female 307

Figura 6.12. Prueba de caja para la homogeneidad de varianza-covarianza.

La prueba de cuadro de la igualdad de matrices de

covarianzasa

M de Box 26,935 F 1,245 df1 21 df2 20370,100 Sig. ,201

Prueba la hipótesis nula que las matrices de covarianzas observadas de las variables dependientes son iguales entre los grupos. a. Diseño : Intersección + satjob + sex + satjob * sex

La prueba de Box no es significativa.

Use los criterios de Lambda de Wilks.

Page 17: Análisis multivariado de varianza y covarianza

Figura 6.13. Tabla resumen MANOVA.

Pruebas multivariantea

Efecto Valor F Gl de

hipótesis gl de error Sig.

Eta parcial

al cuadra

do

Intersección

Traza de Pillai ,923 4042,110b 2,000 672,000 ,000 ,923

Lambda de Wilks ,077 4042,110b 2,000 672,000 ,000 ,923

Traza de Hotelling 12,030 4042,110b 2,000 672,000 ,000 ,923

Raíz mayor de Roy 12,030 4042,110b 2,000 672,000 ,000 ,923

satjob Traza de Pillai ,035 3,967 6,000 1346,000 ,001 ,017

Lambda de Wilks ,965 3,984b 6,000 1344,000 ,001 ,017

Traza de Hotelling ,036 4,002 6,000 1342,000 ,001 ,018

Raíz mayor de Roy ,033 7,291c 3,000 673,000 ,000 ,031

sex Traza de Pillai ,024 8,135b 2,000 672,000 ,000 ,024

Lambda de Wilks ,976 8,135b 2,000 672,000 ,000 ,024

Traza de Hotelling ,024 8,135b 2,000 672,000 ,000 ,024

Raíz mayor de Roy ,024 8,135b 2,000 672,000 ,000 ,024

satjob * sex

Traza de Pillai ,007 ,750 6,000 1346,000 ,609 ,003

Lambda de Wilks ,993 ,749b 6,000 1344,000 ,610 ,003

Traza de Hotelling ,007 ,748 6,000 1342,000 ,611 ,003

Raíz mayor de Roy ,005 1,051c 3,000 673,000 ,370 ,005

a. Diseño : Intersección + satjob + sex + satjob * sex b. Estadístico exacto c. El estadístico es un límite superior en F que genera un límite inferior en el nivel de significación.

Figura 6.14. Tabla de resumen de ANOVA univariante.

Pruebas de efectos inter-sujetos

Origen

Variable dependiente

Tipo III de suma de

cuadrados gl Media

cuadrática F Sig.

Eta parcial al

cuadrado

Modelo corregido

rincom2 1101,382a 7 157,340 9,676 ,000 ,091

educ2 64,156b 7 9,165 1,358 ,220 ,014

Intersección rincom2 47955,386 1 47955,386 2949,195 ,000 ,814

educ2 49956,968 1 49956,968 7404,472 ,000 ,917

satjob rincom2 349,728 3 116,576 7,169 ,000 ,031

educ2 44,078 3 14,693 2,178 ,089 ,010

sex rincom2 262,463 1 262,463 16,141 ,000 ,023

educ2 6,952 1 6,952 1,030 ,310 ,002

satjob * sex rincom2 26,942 3 8,981 ,552 ,647 ,002

educ2 15,304 3 5,101 ,756 ,519 ,003

Error rincom2 10943,317 673 16,261

educ2 4540,639 673 6,747

Total rincom2 149640,000

681

educ2 139907,000

681

Total corregido rincom2 12044,699 680

educ2 4604,796 680

a. R al cuadrado = ,091 (R al cuadrado ajustada = ,082) b. R al cuadrado = ,014 (R al cuadrado ajustada = ,004)

Indica que la satisfacción laboral afecta significativamente el DV combinado.

Indica que el género afecta

significativamente el DV combinado.

Indica que el género afecta

significativamente los ingresos, pero

NO los años de educación.

Indica que la interacción de los factores NO está afectando significativamente al

DV combinado.

Indica que la satisfacción laboral afecta

significativamente los ingresos, pero

NO los años de educación.

Page 18: Análisis multivariado de varianza y covarianza

Figura 6.15. Exámenes post hoc de ingresos y años de educación por satisfacción laboral.

Comparaciones múltiples Scheffe

Variable dependiente

(I) Job Satisfaction (satjob)

(J) Job Satisfaction (satjob)

Diferencia de medias (I-J)

Error estándar Sig.

Intervalo de confianza al 95%

Límite inferior

Límite superior

rincom2 Very satisfied Mod satisfied 1,5045* ,33206 ,000 ,5739 2,4351

A little dissatisfied 1,2174 ,54505 ,174 -,3101 2,7450

Very dissatisfied 1,3151 ,85551 ,501 -1,0826 3,7127

Mod satisfied Very satisfied -1,5045* ,33206 ,000 -2,4351 -,5739

A little dissatisfied -,2871 ,54642 ,964 -1,8184 1,2443

Very dissatisfied -,1894 ,85639 ,997 -2,5895 2,2107

A little dissatisfied Very satisfied -1,2174 ,54505 ,174 -2,7450 ,3101

Mod satisfied ,2871 ,54642 ,964 -1,2443 1,8184

Very dissatisfied ,0976 ,95928 1,000 -2,5908 2,7861

Very dissatisfied Very satisfied -1,3151 ,85551 ,501 -3,7127 1,0826

Mod satisfied ,1894 ,85639 ,997 -2,2107 2,5895

A little dissatisfied -,0976 ,95928 1,000 -2,7861 2,5908

educ2 Very satisfied Mod satisfied ,4929 ,21389 ,152 -,1066 1,0923

A little dissatisfied ,3211 ,35109 ,841 -,6629 1,3050

Very dissatisfied -,4706 ,55108 ,866 -2,0150 1,0738

Mod satisfied Very satisfied -,4929 ,21389 ,152 -1,0923 ,1066

A little dissatisfied -,1718 ,35197 ,971 -1,1582 ,8146

Very dissatisfied -,9635 ,55164 ,385 -2,5095 ,5825

A little dissatisfied Very satisfied -,3211 ,35109 ,841 -1,3050 ,6629

Mod satisfied ,1718 ,35197 ,971 -,8146 1,1582

Very dissatisfied -,7917 ,61791 ,650 -2,5234 ,9401

Very dissatisfied Very satisfied ,4706 ,55108 ,866 -1,0738 2,0150

Mod satisfied ,9635 ,55164 ,385 -,5825 2,5095

A little dissatisfied ,7917 ,61791 ,650 -,9401 2,5234

Se basa en las medias observadas. El término de error es la media cuadrática(Error) = 6,747. *. La diferencia de medias es significativa en el nivel ,05.

Figura 6.16. Medios grupales no ajustados para ingresos y años de educación por satisfacción laboral y género.

Estadísticos descriptivos

Job Satisfaction (satjob) Respondent's Sex Media

Desviación estándar N

rincom2 Very satisfied Male 15,8193 3,73889 166

Female 14,0301 4,00934 133

Total 15,0234 3,95649 299

Mod satisfied Male 14,5157 4,32370 159

Female 12,3182 4,03670 132

Total 13,5189 4,32979 291

A little dissatisfied Male 15,2571 4,13978 35

Female 12,2187 3,75658 32

Total 13,8060 4,21843 67

Very dissatisfied Male 14,2143 5,05628 14

Female 13,0000 2,86744 10

Total 13,7083 4,24755 24

Total Male 15,1524 4,11833 374

Female 13,0717 4,03758 307

Total 14,2144 4,20866 681

Page 19: Análisis multivariado de varianza y covarianza

educ2 Very satisfied Male 14,2590 2,88556 166

Female 14,3985 2,20859 133

Total 14,3211 2,60303 299

Mod satisfied Male 13,7484 2,67659 159

Female 13,9242 2,47621 132

Total 13,8282 2,58471 291

A little dissatisfied Male 14,1429 2,78803 35

Female 13,8438 2,55405 32

Total 14,0000 2,66288 67

Very dissatisfied Male 15,3571 2,46848 14

Female 14,0000 2,16025 10

Total 14,7917 2,39527 24

Total Male 14,0722 2,78595 374

Female 14,1238 2,36346 307

Total 14,0954 2,60226 681

Figura 6.17. Medios grupales ajustados para ingresos y años de educación por satisfacción laboral y género.

1. Job Satisfaction (satjob)

Variable dependiente Job Satisfaction (satjob) Media Error estándar

Intervalo de confianza al 95%

Límite inferior Límite superior

rincom2 Very satisfied 14,925 ,235 14,464 15,385

Mod satisfied 13,417 ,237 12,951 13,883

A little dissatisfied 13,738 ,493 12,770 14,706

Very dissatisfied 13,607 ,835 11,968 15,246

educ2 Very satisfied 14,329 ,151 14,032 14,626

Mod satisfied 13,836 ,153 13,536 14,137

A little dissatisfied 13,993 ,318 13,370 14,617

Very dissatisfied 14,679 ,538 13,623 15,734

2. Respondent's Sex

Variable dependiente Respondent's Sex Media Error estándar

Intervalo de confianza al 95%

Límite inferior Límite superior

rincom2 Male 14,952 ,338 14,288 15,615

Female 12,892 ,386 12,135 13,649

educ2 Male 14,377 ,218 13,950 14,804

Female 14,042 ,248 13,554 14,529

Presentación de resultados La siguiente narración resume los resultados del ejemplo de MANOVA bidireccional. Se realizó un MANOVA bidireccional para determinar el efecto de la satisfacción laboral y el género en las dos variables dependientes de los ingresos de los encuestados y los años de educación. Los datos se transformaron primero para eliminar valores atípicos. Los ingresos de los encuestados se transformaron para eliminar los casos con ingresos iguales o superiores a 22. Los años de educación también se transformaron para eliminar los casos con 6 años o menos. Los resultados de MANOVA indican que la satisfacción laboral [Wilks 'Λ= .965, F (6, 1344) = 3.98, p= .001, η2 = .017] y el sexo [Wilks 'Λ. = .976, F (2, 672) = 8.14, p <.001, η2 = .024] afectan significativamente el DV combinado de ingresos y años de educación. Sin embargo, los tamaños de efecto multivariante son muy pequeños. Se realizaron pruebas ANOVA univariante y post hoc de Scheffé como pruebas de seguimiento. Los resultados de ANOVA indican que el ingreso difiere significativamente para la

Page 20: Análisis multivariado de varianza y covarianza

satisfacción en el trabajo [F (3, 673) = 7.17, p <.001, η2 = .031] y sexo [F (1, 673) = 16.14, p <.001, η2 = .023]. Los años de educación no difieren significativamente para la satisfacción laboral [F (3, 673) = 2.18, p = .089, η2 = .010] o género [F (1, 673) = 1.03, p = .310, η2 = .002]. Los resultados post hoc de Scheffé para el ingreso y la satisfacción laboral indican que las personas muy satisfechas difieren significativamente de aquellas con una satisfacción moderada. La Tabla 2 presenta los medios grupales ajustados y no ajustados para el ingreso y los años de educación por satisfacción laboral y género. Tabla 2 Grupo de Medios Ajustados y Sin Ajustar para Ingresos y Años de Educación por Género y Satisfacción Laboral

II. MANCOVA Al igual que con ANCOVA univariante, los investigadores a menudo desean controlar los efectos de las variables concomitantes en un diseño multivariado. La técnica de análisis apropiada para esta situación es un análisis multivariado de covarianza, o MANCOVA. El análisis multivariado de covarianza es esencialmente una combinación de MANOVA y ANCOVA. MANCOVA pregunta si existen diferencias de significancia estadísticamente significativas entre los grupos después de ajustar el DV recientemente creado (una combinación lineal de todos los DV originales) para las diferencias en una o más covariables. VISIÓN PRÁCTICA La principal ventaja de MANCOVA sobre MANOVA es el hecho de que el investigador puede incorporar una o más covariables en el análisis. Los efectos de estas covariables se eliminan del análisis, dejando al investigador una imagen más clara de los efectos reales de la IV(s) en los múltiples DV. Existen dos razones principales para incluir varias (es decir, más de una) covariables en el análisis (Stevens, 2001). En primer lugar, la inclusión de varias covariables dará como resultado una mayor reducción en la varianza del error que la que resultaría de la incorporación de una covariable. Recuerde que en ANCOVA, la razón principal para incluir una covariable es eliminar del término de error las fuentes de variabilidad no deseadas (varianza dentro de los grupos), lo que podría atribuirse a la covariable. Esto finalmente da como resultado una prueba F más sensible, lo que aumenta la probabilidad de rechazar la hipótesis nula. Al incluir más covariables en un análisis MANCOVA, podemos reducir este error no deseado en una cantidad aún mayor, lo que mejora las posibilidades de rechazar una hipótesis nula que es realmente falsa.

Page 21: Análisis multivariado de varianza y covarianza

Una segunda razón para incluir más de una covariable es que es posible hacer mejores ajustes para las diferencias iniciales en situaciones en las que el diseño de la investigación incluye el uso de grupos intactos (Stevens, 2001). El investigador tiene incluso más información sobre la cual basar el procedimiento de correspondencia estadística. En este caso, los medios de la combinación lineal de DV para cada grupo se ajustan a lo que serían si todos los grupos hubieran obtenido una puntuación igual en la combinación de covariables. Una vez más, el investigador debe conocer la elección de las covariables en un análisis multivariado. Debería existir una relación significativa entre el conjunto de DV y la covariable o conjunto de covariables (Stevens, 2001). Similar a ANCOVA, si se usa más de una covariable, debe haber intercorrelaciones relativamente bajas entre todas las covariables (aproximadamente < .40). En ANCOVA, la cantidad de reducción de error fue el resultado de la magnitud de la correlación entre el DV y la covariable. En MANCOVA, si se usan varias covariables, la cantidad de reducción de error está determinada por la magnitud de la correlación múltiple (R2) entre el DV recién creado y el conjunto de covariables (Stevens, 2001). Un valor más alto para R2 está directamente asociado con bajas intercorrelaciones entre las covariables, lo que significa un mayor grado de reducción de errores. La hipótesis nula que se prueba en MANCOVA es que los vectores medios ajustados de la población son iguales:

H0: µ1adj = µ2adj = µ3adj = ... = µkadj La Lambda de Wilks (Λ) es de nuevo la estadística de prueba más común utilizada en MANCOVA. El procedimiento que se utilizará para realizar los espejos MANCOVA que se usaron para realizar MANOVA. Siguiendo el ajuste estadístico de los puntajes DV recientemente creados, la hipótesis nula global multivariante se evalúa usando Wilks 'Λ. Si se retiene la hipótesis nula, la interpretación del análisis cesa en este punto. Sin embargo, si se rechaza la hipótesis nula general, el investigador luego examina los resultados de ANCOVAs univariables para descubrir qué DV están siendo afectados por la IV (s). Un ajuste de tipo Bonferroni para proteger del potencial de una tasa de error de tipo I inflado es de nuevo apropiado en este punto. Ejemplos de preguntas de investigación En el estudio de muestra presentado anteriormente en este capítulo, investigamos las diferencias en la productividad del trabajador (medidas por nivel de ingresos, DV1 y horas trabajadas, DV2) para individuos en diferentes categorías de edad (IV). Supongamos que la variable de años de educación se ha demostrado que se relaciona con ambos DV y queremos eliminar su efecto del análisis. En consecuencia, decidimos incluir años de educación como una covariante en nuestro análisis. El diseño que ahora tenemos es MANCOVA de una sola vía. En consecuencia, este estudio debe abordar las siguientes preguntas de investigación: 1. ¿Existen diferencias medias significativas en la productividad del trabajador (medida por la combinación de ingresos y horas trabajadas) para personas de diferentes edades, después de eliminar el efecto de los años de educación? 2. ¿Existen diferencias medias significativas en los niveles de ingresos para individuos de diferentes edades, después de eliminar el efecto de los años de educación?

2a. Si es así, ¿qué categorías de edad difieren? 3. ¿Existen diferencias medias significativas en las horas trabajadas para personas de diferentes edades, después de eliminar el efecto de los años de educación?

3a. Si es así, ¿qué categorías de edad difieren?

Page 22: Análisis multivariado de varianza y covarianza

Para nuestro segundo ejemplo de MANCOVA, agregaremos una covariable al diseño de dos factores presentado anteriormente. Este MANCOVA bidireccional investigará las diferencias en el DV combinado de nivel de ingresos (DV1) y años de educación (DV2) para individuos de diferente sexo (IV1) y de diferentes niveles de satisfacción en el trabajo (IV2), al tiempo que controlan por edad. De nuevo, uno debe notar que las siguientes preguntas de investigación abordan los análisis multivariados y univariados dentro de MANCOVA: 1.

a. ¿Existen diferencias medias significativas en el DV combinado de ingresos y años de educación entre hombres y mujeres, después de eliminar el efecto de la edad?

b. ¿Existen diferencias medias significativas en el DV combinado de ingresos y años de educación para diferentes niveles de satisfacción en el trabajo, después de eliminar el efecto de la edad? De ser así, ¿qué categorías de satisfacción laboral difieren?

c. ¿Existe una interacción significativa entre el sexo y la satisfacción laboral en el DV combinado de ingresos y años de educación, después de eliminar el efecto de la edad?

2. a. ¿Existen diferencias medias significativas en el ingreso entre hombres y

mujeres, después de eliminar el efecto de la edad? b. ¿Existen diferencias medias significativas en los ingresos entre los diferentes

niveles de satisfacción en el trabajo, después de eliminar el efecto de la edad? De ser así, ¿qué categorías de satisfacción laboral difieren?

c. ¿Existe una interacción significativa entre el sexo y la satisfacción laboral en el ingreso, después de eliminar el efecto de la edad?

3. a. ¿Hay diferencias medias significativas en los años de educación entre

hombres y mujeres, después de eliminar el efecto de la edad? b. ¿Existen diferencias medias significativas en los años de educación entre los

diferentes niveles de satisfacción laboral, después de eliminar el efecto de la edad? De ser así, ¿qué categorías de satisfacción laboral difieren?

c. ¿Existe una interacción significativa entre el género y la satisfacción laboral en los años de educación, después de eliminar el efecto de la edad?

SUPUESTOS Y LIMITACIONES El análisis multivariado de la covarianza se basa en los mismos supuestos básicos que el ANCOVA univariado. Sin embargo, las suposiciones para MANCOVA deben acomodar múltiples DVs. La siguiente lista presenta los supuestos para MANCOVA, con un asterisco que indica la modificación de los supuestos de ANCOVA. 1. Las observaciones dentro de cada muestra deben ser muestreadas al azar y deben ser independientes entre sí. 2. * Las distribuciones de puntajes en las variables dependientes deben ser normales en las poblaciones de las cuales se tomaron muestras de los datos. 3. * Las distribuciones de puntajes en las variables dependientes deben tener varianzas iguales. 4. * Deben existir relaciones lineales entre todos los pares de DV, todos los pares de covariables y todos los pares DV covariate en cada celda. 5. * Si se usan dos covariables, los planos de regresión para cada grupo deben ser homogéneos o paralelos. Si se usan más de dos covariables, los hiperplanos de regresión deben ser homogéneos.

Page 23: Análisis multivariado de varianza y covarianza

6. Las covariables son confiables y se miden sin error. Los supuestos primero y sexto esencialmente permanecen sin cambios. Las suposiciones 2 y 3 simplemente se modifican para incluir múltiples DV. La suposición 4 tiene una modificación sustancial en que ahora debemos asumir relaciones lineales no solo entre el DV y la covariable, sino también entre otros muchos pares de variables (Tabachnick y Fidell, 2007). También existe una modificación importante en el Supuesto 5. Recuerde que, si solo se incluye una covariable en el análisis, existe la suposición de que las pendientes de regresión covariable para cada grupo son homogéneas. Sin embargo, si el análisis de MANCOVA implica más de una covariable, la suposición análoga implica homogeneidad de los planos de regresión (para dos covariables) e hiperplanos (para tres o más covariables). Nuestra discusión sobre la evaluación de los supuestos de MANCOVA se centrará en los dos supuestos sustancialmente modificados (es decir, 4 y 5). Procedimientos similares, como se ha discutido anteriormente, se utilizan para probar las suposiciones restantes. Métodos para probar suposiciones La suposición de los DV distribuidos normalmente se evalúa de la manera habitual. La evaluación inicial de la normalidad se realiza a través de la inspección de histogramas, diagramas de caja y gráficas Q-Q normales. La evaluación estadística de la normalidad se lleva a cabo mediante el examen de los valores (y las pruebas de significación asociadas) para la asimetría y la curtosis y mediante el uso de la prueba de Kolmogorov-Smirnov. La asunción de la homocedasticidad se evalúa principalmente con la prueba de Box o usando una de las tres pruebas estadísticas diferentes que se analizan en los Capítulos 3 y 5, a saber, la prueba Fmax de Hartley, la prueba de Cochran o la prueba de Levene. La suposición de linealidad entre todos los pares de DV y covariables se evalúa crudamente mediante la inspección de las gráficas de dispersión bivariadas intracelulares entre todos los pares de DV, todos los pares de covariables y todos los pares de covariables DV. Este proceso es factible si el análisis incluye solo un pequeño número de variables. Sin embargo, el proceso se vuelve mucho más engorroso (y potencialmente inmanejable) con análisis que involucran al examen de numerosos DV y / o covariables. Una vez más, si se indican las relaciones curvilíneas, se pueden corregir transformando algunas o todas las variables. Tenga en cuenta que la transformación de las variables puede crear dificultades en las interpretaciones. Una posible solución podría ser eliminar la covariable que parece producir no linealidad, reemplazándola con otra covariable apropiada (Tabachnick y Fidell, 2007). Recuerde que una violación de la hipótesis de homogeneidad de las pendientes de regresión (así como los planos de regresión y los hiperplanos) es una indicación de que existe una interacción covariable por tratamiento (IV), lo que significa que la relación entre la covariable y el DV recién creado es diferente en diferentes niveles de IV (s). Se puede realizar una MANCOVA preliminar o personalizada para evaluar la hipótesis de homogeneidad de los planos de regresión (en el caso de dos covariables) o hiperplanos de regresión (en el caso de tres o más covariables). Si el análisis contiene más de una covariable, existe un efecto de interacción para cada covariable. Los efectos se agrupan y se prueban para determinar si las interacciones combinadas son significativas (Stevens, 2001). La hipótesis nula que se prueba en estos casos es que todos los planos / hiperplanos de regresión son iguales y paralelos. Rechazar esta hipótesis significa que existe una interacción

Page 24: Análisis multivariado de varianza y covarianza

significativa entre las covariables y las IV y que los planos / hiperplanos no son iguales. Si un investigador va a continuar utilizando el análisis multivariado de covarianza, esperaría no rechazar esta hipótesis nula particular. En SPSS, esto se determina al examinar los resultados de la prueba F para la interacción de la IV (s) por la (s) covariante (s). Interpretación de resultados La interpretación de los resultados de MANCOVA es bastante similar a la de MANOVA. Sin embargo, con la inclusión de covariables, la interpretación de un MANCOVA preliminar es necesaria para probar la hipótesis de homogeneidad de las pendientes de regresión. Esencialmente, este análisis prueba la interacción entre los factores (IV) y las covariables. Este MANCOVA preliminar o personalizado también evaluará la homogeneidad de varianza-covarianza (prueba de Box), que en realidad se interpreta primero porque ayuda a identificar la estadística de prueba apropiada que se utilizará para examinar la homogeneidad de la regresión y los resultados finales de MANCOVA. Si la prueba de la Caja es significativa en p <.001 y los tamaños de muestra grupales son extremadamente desiguales, entonces Pillai's Trace se utiliza al interpretar la homogeneidad de la prueba de regresión y los resultados de MANOVA. Si se asumen varianzas iguales, se debe usar la lambda de Wilks como la estadística de prueba multivariable. Una vez que se ha determinado la estadística de prueba, la homogeneidad de los resultados de pendientes o planos de regresión se interpreta examinando la relación F y el valor p para la interacción. Si la interacción factor-covariable es significativa, MANCOVA no es una técnica de análisis adecuada. Si la interacción no es significativa, entonces se puede proceder con la realización del análisis completo de MANCOVA. Utilizando la relación F y el valor de p para una estadística de prueba que se identificó en el análisis preliminar a través de la prueba de Box, se debe examinar la interacción del factor si se utilizan dos o más IV en el análisis. Si la interacción del factor es significativa, entonces los efectos principales para cada factor en el DV combinado no son un indicador válido del efecto. Si la interacción del factor no es significativa, los efectos principales para cada IV se pueden interpretar con precisión examinando la relación F, el valor p y el tamaño del efecto para la estadística de prueba adecuada. Cuando los efectos principales son significativos, los resultados de ANOVA univariados indican diferencias de grupo para cada DV. Debido a que MANCOVA no proporciona análisis post hoc, el examen de los medios del grupo (antes y después del ajuste de las covariables) para cada DV puede ayudar a determinar cómo los grupos difieren para cada DV. En resumen, el primer paso para interpretar los resultados de MANCOVA es evaluar los resultados preliminares de MANCOVA que incluyen la prueba de Box y la prueba de homogeneidad de las pendientes de regresión. Si la prueba de Box no es significativa, utilice el estadístico Lambda de Wilks al interpretar la homogeneidad de las pendientes de regresión y las pruebas multivariadas subsiguientes. Si la prueba de Box es significativa, use Pillai's Trace. Una vez que se ha identificado la estadística de prueba multivariable, examine la significación (relaciones F y valores p) de la interacción factor-covariable (homogeneidad de las pendientes de regresión). Si la interacción factor-covariable no es significativa, proceda con el MANCOVA completo. Para interpretar los resultados completos de MANCOVA, examine la significación (relaciones F y valores p) de la interacción factorial. Esto es necesario solo si se incluyen dos o más IV. A continuación, evalúe la relación F, el valor p y el tamaño del efecto para el efecto principal de cada factor.

Page 25: Análisis multivariado de varianza y covarianza

Si se encuentra una significación multivariada, interprete los resultados de ANOVA univariados para determinar diferencias de grupo significativas para cada DV. Para nuestro ejemplo2 que investiga la categoría de edad (agecat4), las diferencias en los ingresos de los encuestados (rincom91) y las horas trabajadas por semana (hrs1) al controlar el nivel educativo (educ), se utilizaron las variables previamente transformadas de rincom2, hrs2 y educ2 . La linealidad de los dos DV (rincom2, hrs2) y la covariable (educ2) se probó luego creando un diagrama de dispersión matricial y el cálculo de los coeficientes de correlación de Pearson. Los resultados indican relaciones lineales. Aunque los coeficientes de correlación son estadísticamente significativos, todos son bastante bajos. La última suposición, la homogeneidad de la varianza-covarianza, se probó dentro de un análisis preliminar de MANCOVA utilizando Multivariado (ver pasos para realizar un MANCOVA preliminar / personalizado). La prueba de Box (ver Figura) revela que se pueden suponer variaciones iguales [F (9, 2827520) = .634, p = .769]. Por lo tanto, el Lambda de Wilks Λ se usará como la estadística multivariable. La figura 6.19 presenta los resultados de MANCOVA para la homogeneidad de la prueba de regresión. La interacción entre agecat4 y educ2 no es significativa [Wilks 'Λ= .993, F (6, 1342) = .815, p = .558]. Luego se realizó un MANCOVA completo usando Multivariante (ver Figura 6.20). Los criterios Lambda de Wilks Λ indican diferencias grupales significativas en la categoría de edad con respecto al ingreso y las horas trabajadas por semana [Wilks 'Λ= .898, F (6, 1348) = 12.36, p <.001, multivariado η2 = .052].

2 Una vez más, se usa el conjunto de datos career-f.sav.

Page 26: Análisis multivariado de varianza y covarianza

Figura 6.18. Prueba de caja para la homogeneidad de varianza-covarianza.

La prueba de cuadro de la igualdad de matrices de

covarianzasa

M de Box 5,740 F ,634 df1 9 df2 2827520,026 Sig. ,769

Prueba la hipótesis nula que las matrices de covarianzas observadas de las variables dependientes son iguales entre los grupos. a. Diseño : Intersección + educ2 + agecat4

Figura 6.19. Tabla de resumen de MANCOVA: Prueba de homogeneidad de las pendientes de regresión.

Pruebas multivariantea

Efecto Valor F Gl de

hipótesis gl de error Sig.

Eta parcial al cuadrado

Intersección Traza de Pillai ,284 133,096b 2,000 671,000 ,000 ,284

Lambda de Wilks ,716 133,096b 2,000 671,000 ,000 ,284

Traza de Hotelling ,397 133,096b 2,000 671,000 ,000 ,284

Raíz mayor de Roy ,397 133,096b 2,000 671,000 ,000 ,284

agecat4 Traza de Pillai ,004 ,504 6,000 1344,000 ,805 ,002

Lambda de Wilks ,996 ,504b 6,000 1342,000 ,806 ,002

Traza de Hotelling ,005 ,503 6,000 1340,000 ,806 ,002

Raíz mayor de Roy ,004 ,833c 3,000 672,000 ,476 ,004

educ2 Traza de Pillai ,106 39,974b 2,000 671,000 ,000 ,106

Lambda de Wilks ,894 39,974b 2,000 671,000 ,000 ,106

Traza de Hotelling ,119 39,974b 2,000 671,000 ,000 ,106

Raíz mayor de Roy ,119 39,974b 2,000 671,000 ,000 ,106

agecat4 * educ2 Traza de Pillai ,007 ,816 6,000 1344,000 ,558 ,004

Lambda de Wilks ,993 ,815b 6,000 1342,000 ,558 ,004

Traza de Hotelling ,007 ,814 6,000 1340,000 ,559 ,004

Raíz mayor de Roy ,005 1,169c 3,000 672,000 ,321 ,005

a. Diseño : Intersección + agecat4 + educ2 + agecat4 * educ2 b. Estadístico exacto c. El estadístico es un límite superior en F que genera un límite inferior en el nivel de significación.

La prueba de Box no es significativa. Use los criterios de Lambda de Wilks.

Indica que la interacción factor-covariable no es significativa.

Page 27: Análisis multivariado de varianza y covarianza

Figura 6.20. Tabla resumen MANCOVA. (se desactiva el personalizado y se activa el factorial completo)

Pruebas multivariantea

Efecto Valor F

Gl de hipótesi

s gl de error Sig.

Eta parcial

al cuadra

do

Intersección

Traza de Pillai ,298 142,742b 2,000 674,000 ,000 ,298

Lambda de Wilks ,702 142,742b 2,000 674,000 ,000 ,298

Traza de Hotelling ,424 142,742b 2,000 674,000 ,000 ,298

Raíz mayor de Roy ,424 142,742b 2,000 674,000 ,000 ,298

educ2 Traza de Pillai ,126 48,428b 2,000 674,000 ,000 ,126

Lambda de Wilks ,874 48,428b 2,000 674,000 ,000 ,126

Traza de Hotelling ,144 48,428b 2,000 674,000 ,000 ,126

Raíz mayor de Roy ,144 48,428b 2,000 674,000 ,000 ,126

agecat4 Traza de Pillai ,102 12,037 6,000 1350,000 ,000 ,051

Lambda de Wilks ,898 12,356b 6,000 1348,000 ,000 ,052

Traza de Hotelling ,113 12,673 6,000 1346,000 ,000 ,053

Raíz mayor de Roy ,113 25,371c 3,000 675,000 ,000 ,101

a. Diseño : Intersección + educ2 + agecat4 b. Estadístico exacto c. El estadístico es un límite superior en F que genera un límite inferior en el nivel de significación.

Figura 6.21. Tabla de resumen de ANOVA univariante.

Pruebas de efectos inter-sujetos

Origen Variable dependiente

Tipo III de suma de

cuadrados gl Media

cuadrática F Sig.

Eta parcial

al cuadra

do

Modelo corregido rincom2 2411,930a 4 602,983 42,456 ,000 ,201

hrs2 1490,452b 4 372,613 2,948 ,020 ,017

Intersección rincom2 922,346 1 922,346 64,943 ,000 ,088

hrs2 33502,664 1 33502,664 265,018 ,000 ,282

educ2 rincom2 1355,655 1 1355,655 95,452 ,000 ,124

hrs2 1439,392 1 1439,392 11,386 ,001 ,017

agecat4 rincom2 1030,099 3 343,366 24,177 ,000 ,097

hrs2 19,820 3 6,607 ,052 ,984 ,000

Error rincom2 9586,657 675 14,202

hrs2 85331,025 675 126,416

Total rincom2 149199,000 680

hrs2 1567026,000 680

Total corregido rincom2 11998,587 679

hrs2 86821,476 679

a. R al cuadrado = ,201 (R al cuadrado ajustada = ,196) b. R al cuadrado = ,017 (R al cuadrado ajustada = ,011)

Figura 6.22. Medios no ajustados y ajustados para ingresos y horas trabajadas por semana por categoría de edad.

Indica que el nivel educativo afecta significativamente el DV combinado.

Indica que la satisfacción laboral afecta significativamente el DV combinado.

Indica que la categoría de edad afecta significativamente los

ingresos, pero NO las horas

trabajadas.

Page 28: Análisis multivariado de varianza y covarianza

Estadísticos descriptivos

4 categories of age Media

Desviación estándar N

rincom2 18-29 11,8672 4,14381 128

30-39 14,0315 3,88102 222

40-49 15,3333 3,88491 192

50+ 15,0797 4,31440 138

Total 14,2044 4,20368 680

hrs2 18-29 46,3203 10,32002 128

30-39 47,0315 11,41817 222

40-49 46,5052 11,80381 192

50+ 46,5725 11,40488 138

Total 46,6559 11,30782 680

4 categories of age

Variable dependiente 4 categories of age Media

Error estándar

Intervalo de confianza al 95%

Límite inferior

Límite superior

rincom2 18-29 11,993a ,333 11,339 12,648

30-39 13,887a ,253 13,389 14,384

40-49 15,356a ,272 14,822 15,890

50+ 15,165a ,321 14,535 15,795

hrs2 18-29 46,450a ,995 44,497 48,403

30-39 46,882a ,756 45,398 48,366

40-49 46,528a ,811 44,935 48,122

50+ 46,660a ,957 44,780 48,540

a. Las covariables que aparecen en el modelo se evalúan en los valores siguientes: educ2 = 14,0985.

Escribir resultados El proceso de resumir los resultados de MANCOVA es casi idéntico al de MANOVA. Sin embargo, los resultados de MANCOVA obviamente incluirán una declaración de cómo la covariable influyó en los DV. Se debe tener en cuenta que, aunque los resultados preliminares de MANCOVA son bastante importantes en el proceso de análisis, estos resultados no se informan porque se entiende que si se ha llevado a cabo una MANCOVA completa, tales suposiciones se han cumplido. En consecuencia, la descripción de los resultados de MANCOVA debe abordar lo siguiente: 1. Eliminación de participantes y / o transformación de variables 2. Resultados completos de MANCOVA (estadística de prueba, relación F, grados de libertad, valor p y tamaño del efecto)

a. Efectos principales para cada IV y covariable en el DV combinado b. Efecto principal para la interacción entre IV

3. Resultados ANOVA univariados (relación F, grados de libertad, valor p y tamaño del efecto)

a. Efecto principal para cada IV y DV b. Comparación de los medios para indicar qué grupos difieren en cada DV

A menudo, se crea una tabla que compara los medios de grupo ajustados y no ajustados para cada DV. Para nuestro ejemplo, la declaración de resultados incluye todos estos

Page 29: Análisis multivariado de varianza y covarianza

componentes, con la excepción de la interacción de factores porque solo se utiliza una IV. La siguiente narrativa de resultados aplica los resultados de las Figuras 6.18 a 6.22. El análisis multivariante de la covarianza (MANCOVA) se realizó para determinar el efecto de la categoría de edad en la productividad de los empleados, medida por el ingreso y las horas trabajadas por semana, al tiempo que controlaba los años de educación. Antes de la prueba, las variables se transformaron para eliminar valores atípicos. Los casos con ingresos iguales a cero e iguales o superiores a 22 fueron eliminados. Las horas trabajadas por semana se transformaron. Aquellos menores de o igual a 16 fueron recodificados 17, y aquellos mayores o iguales a 80 fueron recodificados 79. Años de educación también se transformaron para eliminar casos con 6 años o menos. Los resultados de MANCOVA revelaron diferencias significativas entre las categorías de edad en la variable dependiente combinada [Wilks 'Λ= .898, F (6, 1348) = 12.36, p <.001, multivariado η2 = .052]. La covariable (años de educación) influyó significativamente en la variable dependiente combinada [Wilks 'Λ= .874, F (2, 674) = 48.43, p <.001, multivariado η2 = .126]. El análisis de covarianza (ANCOVA) se realizó en cada variable dependiente como una prueba de seguimiento para MANCOVA. Las diferencias de edad por categoría fueron significativas para el ingreso [F (3, 675) = 24.18, p <.001, parcial η2 = .097], pero no horas trabajadas por semana [F (3, 675) = .052, p =. 984, parcial η2 = .000]. Una comparación de los medios ajustados reveló que los ingresos de los que tienen entre 18 y 29 años difieren en más de 3 puntos de los que tienen entre 40 y 49 años y los que tienen 50 años o más. La Tabla 3 presenta los medios ajustados y no ajustados de ingresos y horas trabajadas por semana por categoría de edad. Tabla 3 Medios ajustados y no ajustados para ingresos y horas trabajadas por semana por categoría de edad

EJEMPLO DE ESTUDIO Y ANÁLISIS Esta sección proporciona un ejemplo completo que aplica todo el proceso de conducción de MANCOVA: desarrollo de preguntas e hipótesis de investigación, métodos de detección de datos, métodos de prueba, interpretación de resultados y presentación de resultados. Se utiliza el conjunto de datos de SPSS career-f.sav. Nuestro ejemplo anterior demuestra un MANCOVA unidireccional, mientras que este ejemplo presentará un MANCOVA bidireccional. Problema Utilizando el ejemplo de MANOVA bidireccional presentado anteriormente, en el que examinamos el grado en que la satisfacción laboral y de género afecta el ingreso y los años de educación entre los empleados, ahora estamos interesados en agregar la covariable de edad. Debido a que dos IV se prueban en este análisis, las preguntas también deben tener en

Page 30: Análisis multivariado de varianza y covarianza

cuenta la posible interacción entre los factores. Las siguientes preguntas de investigación y sus respectivas hipótesis nulas abordan los efectos principales multivariantes para cada IV y la posible interacción entre los factores.

Preguntas de investigación

Hipótesis nula

RQ1: ¿Los ingresos y años de educación difieren según el género entre los empleados al controlar por edad?

H01: Ingresos y años de educación no serán diferentes por género entre los empleados cuando se controla por edad.

RQ2: ¿Los ingresos y años de educación difieren según la satisfacción laboral entre los empleados al controlar por la edad?

H02: los ingresos y años de educación no diferirán en la satisfacción laboral entre los empleados al controlar por edad.

RQ3: ¿El género y la satisfacción laboral interactúan en el efecto sobre los ingresos y los años de educación al controlar por la edad?

H03: El género y la satisfacción laboral no interactuarán en el efecto sobre el ingreso y los años de educación al controlar por edad.

Ambas IV son categóricas e incluyen sexo (sexo) y satisfacción en el trabajo (satjob). Los DV son los ingresos de los encuestados (rincom2) y los años de educación (educ2); ambos son cuantitativos. La covariable tiene años de edad (edad) y es cuantitativa. Tenga en cuenta que las variables rincom2 y educ2 son variables transformadas de rincom91 y educ, respectivamente. Las transformaciones de estas variables se describen en la Sección 6.3 de este capítulo. Método en SPSS Debido a que las variables se transformaron previamente para eliminar valores atípicos, la detección de datos está completa. Las suposiciones de prueba de MANCOVA ahora deben ser examinadas. La linealidad entre los DV y la covariable se evalúa primero mediante la creación de una matriz de diagrama de dispersión y el cálculo de los coeficientes de correlación de Pearson. Los diagramas de dispersión y los coeficientes de correlación indican relaciones lineales. Aunque tres de los cuatro coeficientes de correlación son significativos (p <.001), los coeficientes son aún bastante débiles. Los supuestos finales de prueba de homogeneidad de varianza-covarianza y homogeneidad de las pendientes de regresión se probarán en un MANCOVA preliminar utilizando Multivariante. Para abrir el cuadro de diálogo Multivariante, seleccione lo siguiente:

Correlaciones

rincom2 educ2 Age of

Respondent

rincom2 Correlación de Pearson 1 ,337** ,265**

Sig. (bilateral) ,000 ,000

N 686 681 685

educ2 Correlación de Pearson ,337** 1 -,013

Sig. (bilateral) ,000 ,734

N 681 742 739

Age of Respondent Correlación de Pearson ,265** -,013 1

Sig. (bilateral) ,000 ,734

N 685 739 744

Page 31: Análisis multivariado de varianza y covarianza

**. La correlación es significativa en el nivel 0,01 (bilateral).

Analizar

Modelo linear general Multivariado

Cuadro de diálogo multivariante (ver Figura 6.23) Una vez en este cuadro de diálogo, haga clic en cada DV (educ2 y rincom2) y muévalos al cuadro Variables dependientes. Haga clic en cada IV (sexo y satjob) y muévalos al cuadro Factor (es) fijo (s). Luego haga clic en cada covariable (edad) y muévala al cuadro de Covariables. Luego haz clic en Modelo. Figura 6.23.

Multivariante: cuadro de diálogo Modelo (ver Figura 6.24)

Page 32: Análisis multivariado de varianza y covarianza

En Especificar modelo, haga clic en Personalizar. Mueva cada IV y covariable al cuadro Modelo. A continuación, mantenga presionada la tecla Ctrl y resalte todas las IV y las covariables. Una vez resaltado, continúe presionando la tecla Ctrl y muévalos al cuadro Modelo. Esto debería crear la interacción entre todas las IV y las covariables (es decir, edad * sexo satjob *). Además, verifique que la Interacción esté especificada en el cuadro Construir término (s). Haga clic en Continuar De vuelta en el cuadro de diálogo Modelo de multivariante, haga clic en Opciones. Figura 6.24. Multivariante: cuadro de diálogo modelo.

Multivariante: cuadro de diálogo Opciones (ver Figura 6.25) En Medios de pantalla para, haga clic en Pruebas de homogeneidad. Haga clic en Continuar De vuelta en el cuadro de diálogo multivariante, haga clic en Aceptar. Figura 6.25. Multivariante: cuadro de diálogo de opciones.

Page 33: Análisis multivariado de varianza y covarianza

Estos pasos crearán el resultado para evaluar la homogeneidad de la varianza-covarianza y la homogeneidad de las pendientes de regresión (ver Figura 6.27). Si la interacción entre los factores y las covariables no es significativa, proceda con los siguientes pasos para realizar el MANCOVA completo. Para nuestro ejemplo, la prueba de Box (ver Figura 6.26) indica la homogeneidad de la varianza-covarianza [F (21, 20374) = 1.24, p = .204]. Por lo tanto, Wilks Lambda se utilizará como la estadística de prueba para todas las pruebas multivariadas. La Figura 6.27 revela que el factor y la interacción de covariables no son significativos [Wilks 'Λ= .976, F (14, 1332) = 1.143, p = .315]. MANCOVA completo se llevará a cabo utilizando Multivariante. Figura 6.26. Prueba de caja para la homogeneidad de varianza-covarianza.

La prueba de cuadro de la igualdad de matrices de

covarianzasa

M de Box 26,868 F 1,242 df1 21 df2 20374,494 Sig. ,204

Prueba la hipótesis nula que las matrices de covarianzas observadas de las variables dependientes son iguales entre los grupos. a. Diseño : Intersección + sex + satjob + age + sex * satjob * age

Figura 6.27. Tabla de resumen de MANCOVA: Prueba de homogeneidad de las pendientes de regresión.

Pruebas multivariantea

Efecto Valor F Gl de

hipótesis gl de error Sig.

Eta parcial al cuadrado

Intersección Traza de Pillai ,399 220,855b 2,000 666,000 ,000 ,399

Lambda de Wilks ,601 220,855b 2,000 666,000 ,000 ,399

Traza de Hotelling ,663 220,855b 2,000 666,000 ,000 ,399

Raíz mayor de Roy ,663 220,855b 2,000 666,000 ,000 ,399

sex Traza de Pillai ,001 ,173b 2,000 666,000 ,841 ,001

Lambda de Wilks ,999 ,173b 2,000 666,000 ,841 ,001

Traza de Hotelling ,001 ,173b 2,000 666,000 ,841 ,001

Raíz mayor de Roy ,001 ,173b 2,000 666,000 ,841 ,001

satjob Traza de Pillai ,010 1,100 6,000 1334,000 ,360 ,005

Lambda de Wilks ,990 1,100b 6,000 1332,000 ,360 ,005

Traza de Hotelling ,010 1,100 6,000 1330,000 ,360 ,005

Raíz mayor de Roy ,009 1,947c 3,000 667,000 ,121 ,009

age Traza de Pillai ,029 9,912b 2,000 666,000 ,000 ,029

Lambda de Wilks ,971 9,912b 2,000 666,000 ,000 ,029

Traza de Hotelling ,030 9,912b 2,000 666,000 ,000 ,029

Raíz mayor de Roy ,030 9,912b 2,000 666,000 ,000 ,029

sex * satjob * age Traza de Pillai ,024 1,143 14,000 1334,000 ,315 ,012

Lambda de Wilks ,976 1,143b 14,000 1332,000 ,315 ,012

Traza de Hotelling ,024 1,142 14,000 1330,000 ,315 ,012

Raíz mayor de Roy ,018 1,702c 7,000 667,000 ,105 ,018

a. Diseño : Intersección + sex + satjob + age + sex * satjob * age b. Estadístico exacto c. El estadístico es un límite superior en F que genera un límite inferior en el nivel de significación.

La prueba de Box no es significativa. Use los

criterios de Lambda de Wilks.

La interacción factor-covariable NO

es significativa.

Page 34: Análisis multivariado de varianza y covarianza

Para realizar el análisis multivariante completo, se abren los mismos cuadros de diálogo, pero se usarán diferentes comandos. Abra el cuadro de diálogo de multivariante seleccionando lo siguiente:

Analizar Modelo linear general

Multivariado Cuadro de diálogo multivariante (ver Figura 6.23) Si ha realizado el MANCOVA preliminar, las variables ya deberían estar identificadas. Si no, proceda con lo siguiente. Haga clic en cada DV (educ2 y rincom2) y mueva cada uno al cuadro Variables dependientes. Haga clic en cada IV (sexo y sexo) y mueva cada uno al cuadro Factor (es) fijo (s). A continuación, haga clic en la covariable (edad) y muévala al cuadro Covariables. Luego haz clic en Modelo. Multivariante: cuadro de diálogo Modelo (ver Figura 6.28) En Especificar modelo, ahora haremos clic en Factorial completo. Haga clic en Continuar De vuelta en el cuadro de diálogo Multivariante, haga clic en Opciones. Figura 6.28. Multivariante: cuadro de diálogo modelo.

Multivariante: cuadro de diálogo Opciones (ver Figura 6.29) En Factor (es) e Interacciones de factor, haga clic en IV y muévalos al cuadro Mostrar medios para. En Pantalla, haga clic en Estadísticas descriptivas y Estimaciones del tamaño del efecto. Haga clic en Continuar De vuelta en el cuadro de diálogo multivariante, haga clic en Aceptar. Figura 6.29. Multivariante: cuadro de diálogo de opciones.

Page 35: Análisis multivariado de varianza y covarianza

Salida e Interpretación de Resultados La Figura 6.30 presenta los medios de grupo no ajustados para cada DV, mientras que la Figura 6.31 muestra los medios de grupo ajustados. Los resultados de MANCOVA se presentan en la figura 6.32 e indican que no hay interacción significativa entre los dos factores de género y satisfacción laboral [Wilks 'Λ= .993, F (6, 1340) = .839, p = .539]. Los principales efectos del género [Wilks 'Λ= .974, F (2, 670) = 9.027, p <.001, multivariado η2 = .026] y la satisfacción laboral [Wilks'Λ. = .972, F (6, 1340 ) = 3.242, p = .004, multivariado η2 = .014] indican un efecto significativo en el DV combinado. Sin embargo, tenga en cuenta los tamaños de efecto extremadamente pequeños para cada IV. La covariable influyó significativamente en el DV combinado [Wilks 'Λ= .908, F (2, 670) = 33.912, p <.001, multivariado η2 = .092]. Los resultados del ANOVA univariante (ver Figura 6.33) indican que solo el VD del ingreso se vio significativamente afectado por los IV y la covariable. Figura 6.30. Grupo no ajustado significa años de educación e ingresos.

Estadísticos descriptivos

Respondent's Sex Job Satisfaction (satjob) Media

Desviación estándar N

educ2 Male Very satisfied 14,2590 2,88556 166

Mod satisfied 13,7484 2,67659 159

A little dissatisfied 14,1429 2,78803 35

Very dissatisfied 15,3571 2,46848 14

Total 14,0722 2,78595 374

Female Very satisfied 14,4167 2,20700 132

Mod satisfied 13,9242 2,47621 132

A little dissatisfied 13,8438 2,55405 32

Very dissatisfied 14,0000 2,16025 10

Total 14,1307 2,36419 306

Total Very satisfied 14,3289 2,60392 298

Mod satisfied 13,8282 2,58471 291

A little dissatisfied 14,0000 2,66288 67

Very dissatisfied 14,7917 2,39527 24

Page 36: Análisis multivariado de varianza y covarianza

Total 14,0985 2,60293 680

rincom2 Male Very satisfied 15,8193 3,73889 166

Mod satisfied 14,5157 4,32370 159

A little dissatisfied 15,2571 4,13978 35

Very dissatisfied 14,2143 5,05628 14

Total 15,1524 4,11833 374

Female Very satisfied 13,9773 3,97793 132

Mod satisfied 12,3182 4,03670 132

A little dissatisfied 12,2187 3,75658 32

Very dissatisfied 13,0000 2,86744 10

Total 13,0458 4,01855 306

Total Very satisfied 15,0034 3,94789 298

Mod satisfied 13,5189 4,32979 291

A little dissatisfied 13,8060 4,21843 67

Very dissatisfied 13,7083 4,24755 24

Total 14,2044 4,20368 680

Figura 6.31. Medios grupales ajustados para años de educación e ingreso por género y satisfacción laboral.

1. Respondent's Sex

Variable dependiente Respondent's Sex Media Error estándar

Intervalo de confianza al 95%

Límite inferior Límite superior

educ2 Male 14,374a ,218 13,946 14,802

Female 14,043a ,249 13,555 14,532

rincom2 Male 14,996a ,325 14,358 15,633

Female 12,921a ,371 12,193 13,649

a. Las covariables que aparecen en el modelo se evalúan en los valores siguientes: Age of Respondent = 40,34.

2. Job Satisfaction (satjob)

Variable dependiente Job Satisfaction (satjob) Media Error estándar

Intervalo de confianza al 95%

Límite inferior Límite superior

educ2 Very satisfied 14,345a ,152 14,046 14,643

Mod satisfied 13,830a ,153 13,530 14,131

A little dissatisfied 13,994a ,318 13,370 14,618

Very dissatisfied 14,666a ,538 13,609 15,723

rincom2 Very satisfied 14,798a ,226 14,353 15,242

Mod satisfied 13,507a ,229 13,058 13,955

A little dissatisfied 13,727a ,474 12,797 14,658

Very dissatisfied 13,801a ,803 12,225 15,378

a. Las covariables que aparecen en el modelo se evalúan en los valores siguientes: Age of Respondent = 40,34.

Page 37: Análisis multivariado de varianza y covarianza

Figura 6.32. Tabla resumen MANCOVA.

Pruebas multivariantea

Efecto Valor F Gl de

hipótesis gl de error Sig.

Eta parcial al cuadrado

Intersección Traza de Pillai ,670 679,424b 2,000 670,000 ,000 ,670

Lambda de Wilks ,330 679,424b 2,000 670,000 ,000 ,670

Traza de Hotelling 2,028 679,424b 2,000 670,000 ,000 ,670

Raíz mayor de Roy 2,028 679,424b 2,000 670,000 ,000 ,670

age Traza de Pillai ,092 33,912b 2,000 670,000 ,000 ,092

Lambda de Wilks ,908 33,912b 2,000 670,000 ,000 ,092

Traza de Hotelling ,101 33,912b 2,000 670,000 ,000 ,092

Raíz mayor de Roy ,101 33,912b 2,000 670,000 ,000 ,092

sex Traza de Pillai ,026 9,027b 2,000 670,000 ,000 ,026

Lambda de Wilks ,974 9,027b 2,000 670,000 ,000 ,026

Traza de Hotelling ,027 9,027b 2,000 670,000 ,000 ,026

Raíz mayor de Roy ,027 9,027b 2,000 670,000 ,000 ,026

satjob Traza de Pillai ,028 3,231 6,000 1342,000 ,004 ,014

Lambda de Wilks ,972 3,242b 6,000 1340,000 ,004 ,014

Traza de Hotelling ,029 3,252 6,000 1338,000 ,004 ,014

Raíz mayor de Roy ,026 5,894c 3,000 671,000 ,001 ,026

sex * satjob Traza de Pillai ,007 ,840 6,000 1342,000 ,539 ,004

Lambda de Wilks ,993 ,839b 6,000 1340,000 ,539 ,004

Traza de Hotelling ,008 ,838 6,000 1338,000 ,540 ,004

Raíz mayor de Roy ,005 1,189c 3,000 671,000 ,313 ,005

a. Diseño : Intersección + age + sex + satjob + sex * satjob b. Estadístico exacto c. El estadístico es un límite superior en F que genera un límite inferior en el nivel de significación.

Figura 6.33. Tabla de resumen de ANOVA univariante.

Pruebas de efectos inter-sujetos

Origen Variable dependiente

Tipo III de suma de

cuadrados gl

Media cuadrátic

a F Sig.

Eta parcial al cuadrado

Modelo corregido

educ2 69,142a 8 8,643 1,280 ,251 ,015

rincom2 1917,923b 8 239,740 15,958 ,000 ,160

Intersección educ2 9098,497 1 9098,497 1347,329 ,000 ,668

rincom2 4331,310 1 4331,310 288,305 ,000 ,301

age educ2 3,586 1 3,586 ,531 ,466 ,001

rincom2 813,705 1 813,705 54,163 ,000 ,075

sex educ2 6,758 1 6,758 1,001 ,317 ,001

rincom2 266,291 1 266,291 17,725 ,000 ,026

satjob educ2 46,615 3 15,538 2,301 ,076 ,010

rincom2 254,331 3 84,777 5,643 ,001 ,025

sex * satjob educ2 15,551 3 5,184 ,768 ,512 ,003

rincom2 29,773 3 9,924 ,661 ,577 ,003

Error educ2 4531,257 671 6,753

rincom2 10080,664 671 15,023

Total educ2 139763,000 680

rincom2 149199,000 680

Total corregido educ2 4600,399 679

rincom2 11998,587 679

a. R al cuadrado = ,015 (R al cuadrado ajustada = ,003) b. R al cuadrado = ,160 (R al cuadrado ajustada = ,150)

La covariable de la edad

influye significativamente

en el DV combinado.

La variable genero influye

significativamente en el

DV combinado.

La variable satisfacción

laboral influye significativamente en el

DV combinado.

La interacción del factor

NO es significativa.

El género afecta

significativamente los

ingresos, pero NO los años

de educación.

La satisfacción laboral afecta significativamente

los ingresos, pero NO los

años de educación.

Page 38: Análisis multivariado de varianza y covarianza

Presentación de resultados La siguiente narración resume los resultados de este ejemplo bidireccional de MANCOVA. Se realizó un MANCOVA bidireccional para determinar el efecto del género y la satisfacción en el trabajo sobre los ingresos y años de educación mientras se controla por los años de edad. Los datos se transformaron primero para eliminar valores atípicos. Los ingresos de los encuestados se transformaron para eliminar los casos con ingresos de cero e iguales o superiores a 22. Los años de educación también se transformaron para eliminar los casos con 6 años o menos. Los principales efectos del género [Wilks 'Λ= .974, F (2, 670) = 9.027, p <.001, multivariado η2 = .026] y la satisfacción laboral [Wilks 'Λ = .972, F (6, 1340) = 3.242, p = .004, multivariado η2 = .014] indican un efecto significativo en el DV combinado (Figura 6.32). La covariable influyó significativamente en el DV combinado [Wilks 'Λ= .908, F (2, 670) = 33.912, p <.001, multivariado η2 = .092]. Los resultados del ANOVA univariante (Figura 6.33) indican que solo el VD del ingreso se vio significativamente afectado por el sexo [F (1, 671) = 17.73, p <.001, parcial η2 = .026]; satisfacción laboral [F (3, 671) = 5.64, p = .001, parcial η2 = .025]; y la covariable de edad [F (1, 671) = 54.16, p <.001, parcial η2 = .075]. El cuadro 4 presenta los medios grupales ajustados y no ajustados para los ingresos y años de educación. La comparación de los ingresos ajustados significa que aquellos que están muy satisfechos tienen ingresos más altos que aquellos que están menos satisfechos. Tabla 4 Medios grupales ajustados y no ajustados para ingresos y años de educación

RESUMEN El análisis de varianza multivariante (MANOVA) permite al investigador examinar las diferencias de grupo dentro de un conjunto de variables dependientes. Factorial MANOVA probará el efecto principal para cada factor en el DV combinado, así como la interacción entre factores en el DV combinado. Por lo general, el seguimiento como ANOVA univariante y las pruebas post hoc se realizan dentro de MANOVA para determinar la especificidad de las diferencias grupales. Antes de realizar MANOVA, los datos deben analizarse para detectar datos faltantes y valores atípicos. Los datos también deben examinarse para verificar el cumplimiento de los supuestos de la prueba: normalidad, homogeneidad de varianza-covarianza y linealidad de DV. La prueba de Box para la homogeneidad de varianza-covarianza ayudará a determinar qué estadística de prueba (por ejemplo, Wilks Lambda, Pillai's Trace) utilizar cuando se interpretan las pruebas multivariadas. La tabla SPSS MANOVA proporciona cuatro estadísticas de prueba diferentes (Wilks Lambda,

Page 39: Análisis multivariado de varianza y covarianza

Pillai's Trace, Hotelling's Trace y Roy's Largest Root) con la relación F, el valor p y el tamaño del efecto que indican la importancia de los efectos principales y la interacción. El Lambda de Wilks es el criterio más utilizado. Si la interacción de los factores es significativa, las conclusiones sobre los efectos principales son limitadas. El ANOVA univariante y los resultados post hoc determinan las diferencias de grupo para cada DV. La Figura 6.34 proporciona una lista de verificación para realizar MANOVA. Figura 6.34. Lista de verificación para llevar a cabo MANOVA. I. Datos de pantalla

1. Datos perdidos? 2. Los valores atípicos

Los valores atípicos y la revisión diagramas de tallo y hojas y gráficos de caja dentro de explorar.

Eliminar o transformar valores atípicos si es necesario. 3. Normalidad?

Ejecuta gráficas de normalidad con pruebas dentro de Explore. Revise los diagramas de caja y los histogramas. Transforma los datos si es necesario.

4. Linealidad de DVs? Crea diagramas de dispersión. Calcule los coeficientes de correlación de Pearson. Transforma los datos si es necesario.

5. Homogeneidad de varianza-covarianza? Ejecute la prueba de Box en multivariante.

II. Correr MANOVA a. Ejecute MANOVA con prueba post hoc.

1. Analizar ... Modelo lineal general ... Multivariante. Mover el cuadro DVs a Variables Dependientes. Mover IV a la caja de Factor (es) Fijo (s). 2. Opciones. Mueva cada IV al cuadro Medios de visualización para. Verifique las estadísticas descriptivas, las estimaciones del tamaño del efecto y la prueba

de homogeneidad. Continuar. 3. Post hoc.

Mueva cada IV a la (s) prueba (s) posterior (es) de la casilla. Seleccione el método post hoc. Continuar.

4. OK. b. Homogeneidad de varianza-covarianza?

Examine la relación F y el valor p para la prueba de Box. Si es significativo a p <.001 con tamaños de muestra de grupo extremadamente desiguales,

use Pillai's Trace para la estadística de prueba. Si NO es significativo en p <.001 con tamaños de muestra de grupos bastante iguales, use

el Lambda de Wilks para la estadística de prueba. C. Interpreta la interacción de los factores.

Si la interacción de los factores es significativa, los efectos principales son erróneos. Si la interacción de los factores NO es significativa, interprete los efectos principales.

d. Interpreta los efectos principales para cada IV en el DV combinado. e. Interprete los resultados de ANOVA univariados. F. Interpreta resultados post hoc. III. Resumir resultados a. Describa cualquier eliminación o transformación de datos. b. Narrar los resultados completos de MANOVA.

Page 40: Análisis multivariado de varianza y covarianza

Efectos principales para cada IV en el DV combinado (estadística de prueba, relación F, valor p, tamaño del efecto).

Efecto principal para la interacción del factor (estadística de prueba, relación F, valor p, tamaño del efecto).

c. Narrar los resultados de ANOVA univariante. Efectos principales para cada IV y DV (relación F, valor p, tamaño del efecto).

d. Narrar los resultados post hoc. e. Sacar conclusiones.