1. INTRODUCCIÓN ANOVA

Post on 05-Dec-2014

59 views 2 download

Transcript of 1. INTRODUCCIÓN ANOVA

Introducción Análisis de Varianza ANOVA

Estadística III

2012

ANOVA

1. Revisión de lo básico: Análisis previo de los datos

2. Cómo funciona una ANOVA?

3. Supuestos de ANOVA

Análisis previo de los datos Antes del análisis estadístico…

Etapas

1. Qué quiero investigar? Antecedentes – Qué puedo hacer realísticamente?

2. Identificando la VI y VD ó Criterio y Predictora

“Las creencias de los niños y niñas acerca de un objeto témido cambia cuando se les da información sobre el objeto”

“La relajación modera el efecto del estrés en la salud física”

“Las personas que reportan apoyo social, seguridad financiera y actividad frecuente también reportan un bienestar subjetivo”

3. Cómo o voy a manipular la VI? Tipo de diseño (Experimental: medidas repetidas, diseño mixto, muti-factorial…Correlacional)

ANTES DEL ANÁLISIS ESTADÍSTICO…

4. Cómo voy a medir la VD? Cómo quiero analizar los datos?

Validez y Confiabilidad de la medida

Qué nivel de medida requieren los datos para ese modelo estadístico?

- Nominal?

- Ordinal?

- Intervalo?

- Razón?

Categórica (hombre/mujer, empleado/desempleado)

Rangos- datos con un orden no diferencia. Primer lugar, segundo lugar. Escala likert?

Escala con intervalos iguales (e.g. temperatura) presencia de un 0 NO significa ausencia

Presencia de una 0 absoluto. Altura, peso, masa. Tiempo de respuesta

Cuál estadístico se puede usar para cada nivel de medida?Paramétrico – No Paramétrico?

Recordando…

¿Qué son los grados de libertad?

• Número de observaciones que son libres de variar • Pueden tener cualquier valor • Distribución de probabilidad • Cuando se sostiene un parámetro constante los GL

son N-1 Ej= Equipo Futbol 11 gl=10

ANTES DEL ANÁLISIS ESTADÍSTICO…

Supuestos estadística paramétrica

1. Distribución normal de los datos 2. Homogeneidad de la varianza 3. Datos intervalar y de razón 4. Independencia de las puntuaciones

ANÁLISIS PREVIO DE LOS DATOS

1. Normalidad

Valores/datos ausentes (Missing data)

Casos atípicos (outliers)

REVISIÓN DE LO BÁSICO ANÁLISIS PREVIO DE LOS DATOS

Normalidad? Asimetría? Curtosis?

REVISIÓN DE LO BÁSICO ANÁLISIS PREVIO DE LOS DATOS

Normalidad? Asimetría? Curtosis?

ANÁLISIS PREVIO DE LOS DATOS

¿ Cómo se sí los datos son normales?

1. Histograma: Graficar los datos y exploración visual2. Análisis de los datos de curtosis y asimetria:

> Decriptivos > Curtosis y AsimetriaZ a = asimetria / error asimetria Z c = curtososis / error curtosis Normal si el resultado es < +/- 1.96

3. Uso de Kolmogorov-Smirnov test o Shapiro-Wilk: Se busca rechazar hipótesis nula p> 0,05.

ANÁLISIS PREVIO DE LOS DATOS

Valores/datos ausentes

Cómo se identifican?

Patrones? MCAR- MAR – NMAR

Qué hacer? Listwise (default) Sólo casos completos, Pairwise algunas variables, métodos de imputación (estimación)

Casos atípicos

Cómo se identifican? Box Plots – Distancia Malhalanobis X2

Qué hacer?

ANÁLISIS PREVIO DE LOS DATOS

2. Varianza

Varianza: Promedio estimado de la extensión (variabilidad) de los datos

Existen tres tipos de varianza ANOVA (Greene y D´oliveira, 2006): 1. Varianza esperada: Varianza entre condiciones,

pronosticada por el investigador. 2. Varianza de error: Debida a variables no previstas ni

controladas por el investigador. 3. Varianza total: Combinación Varianza esperada y

Varianza de error

ANOVAs

Supuestos para ANOVA

Supuestos para ANOVA

1. Independencia de las observaciones Todo est. 2. Datos Intervalo o razón Estadística 3. Distribución Normal Parametrica 4. Homogeneidad de la varianza5.Esfericidad ANOVA

(No MANOVA)

1. . Independencia de las observaciones Toda estadística

Presencia de Dependencia en las puntuaciones a factores que se debieron controlar – error en el diseño. Correlación.

Ejemplos: Un participante puede influenciar a otro?Presencia de ruido o distractores en uno de los grupos sin

que esto sea parte del diseño del estudio.

Supuestos para ANOVA

NO, si los participantes de diferentes grupos influencian las puntuaciones de los otros, el resultado no es valido

Se puede NO cumplir este supuesto?

2. Datos intervalo o de razón Parametrico

VD = Ingesta de comida. Incremento de 50g a 100g es el mismo incremento que de 150g a 200g (Razón).

VD = Puntuar gusto o disgusto en una escala. Un incremento de 1 a 2 es el mismo que de 2 a 3? No sabemos pero asumimos que si!

NO, si no se cumple use No Parametrica (Ej. Kruskal Wallis)

Se puede NO cumplir este supuesto?

Supuestos para ANOVA

3. Distribución Normal

Normal – Las puntuaciones están cerca de la media.

Muy bajas Muy altas

Númerode

Casos

Supuestos para ANOVA

Ejemplo: Altura de las mujeres en Colombia

País con mucha gente bajita

País con mucho jugadores de baloncesto …

Supuestos para ANOVA

Asimetría NegativaAsimetría Positiva

Comunmente las personas no revisan o los lectores asumimos que se cumple este supuesto.

A veces los investigadores transforman los datos ...NO ES LO IDEAL

3. Distribución Normal.

Supuestos para ANOVA

NO, Recuerde que estamos viendo diferencias de medias

Se puede NO cumplir este supuesto?

4. Homogeneidad en la varianza

Las varianzas de las medias para todos los grupos es aproximadamente igual.

Cuando el tamaño de los grupos es igual, es facil cumplir este supuesto (Glass, Peckham & Sanders, 1972; citado por Field (2009), p324).

Supuestos para ANOVA

Prueba de Levene: p> 0,05 ¿Cómo evaluarla?

5.Esfericidad ANOVA (No

MANOVA)

Similar a la homogeneidad de la varianza, pero para medidas repetidas

Supuestos para ANOVA

Posiblemente, Si se cumplen los otros supuestos, no cumplir este no es necesariamente un problema y es fácil de corregir

Se puede NO cumplir este supuesto?

PROBLEMA SOLUCIÓN EVALUACIÓN

No-independencia

No (No tener en cuenta casos problemáticos?).

Datos No intervalar

Ninguno – Usar no paramétrica

Anormalidad TransformaciónCalcular puntuaciones z y la simetria y curtosis para cada variable dividiendo la simetrria o curtosis por su error estandar , el resultado debe ser menor a 1.96 ignorando que sea + o -

Hetereo-geneidad varianza

Quitar casos atípicos o transformar

Levene y Box test debe ser no significativo > 0,05

No esfericidadVer Greenhouse-Geisser o Huynh-Feldto MANOVA(?)

Mauchly test debe ser no significativo > 0,05

Supuestos para ANOVA

ANOVA

Cómo funciona una ANOVA?

Generalidades ANOVA

La prueba t en ocasiones donde hay investigaciones que cuentan con más de una variable es inapropiada.

Por esta razón en diseños de investigación donde hay múltiples VI, se debe usar la técnica de análisis de varianza o ANOVA.

Esta técnica al poder analizar situaciones donde se presentan múltiples VI, nos dice como estas variables interactúan entre ellas, y que efectos estas interacciones tienen en la VD.

¿Cuándo usarla? Cuando hacemos estudios cuasi-experimentales o experimentales y contamos con tres o más condiciones (Grupos).

Cómo funciona una ANOVA?

Análisis de Varianza – Qué es esto?

A través de ANOVA se evalúan las siguientes hipótesis:

H0: Las medias de los grupos son igualesH1: No todas las medias son iguales

Es un paso más avanzado que una prueba t, en donde podemos evaluar múltiples grupos.

Nota: Es un test omnibus (global). No dice como o cuales son las medias que difieren. Por eso debe llevar a cabo un análisis Posthoc o múltiples comparaciones.

Cómo funciona una ANOVA?

Análisis de Varianza – Qué es esto?

Existen diferentes tipos de ANOVA:

• ANOVA Unifactorial: Solo una VI• ANOVA Bifactorial: Dos VI• ANOVA Multifactorial: Tres o más VI

… Estas pueden ser:

• ANOVA para muestras independientes• ANOVA para muestras relacionadas o medidas repetidas• ANOVA mixtas

*Nota: ANOVA siempre cuenta con solo UNA variable dependiente cuando hay múltiples VD es MANOVA

Análisis de Varianza – Qué es?

Gran Varianza: Es la cantidad de varianza en el estudio la cual se divide en:

(1) Varianza causada por el modelo (i.e. la manipulación experimental).

(2) Varianza causada por factores externos (ej. Diferencias Individuales).

Cómo funciona una ANOVA?

ANOVA mide dos fuentes de variación general de los datos y compara los tamaños relativos:

• Variación ENTRE grupos: Evalúa por cada dato o valor la diferencia entre su grupo y la media general.

• Variación DENTRO de los grupos: Evalúa la diferencia entre cada valor con la media del grupo al que corresponde.

El estadístico F es la proporción de la variación entre los grupos, dividida por la variación dentro del grupo

F = INTER Groupos/INTRA Groups

Cómo funciona una ANOVA?

Análisis de Varianza – Qué es?

Recordando… Gran Varianza: Es el total de varianza en el estudio

divida en:

(1) Varianza causada por el modelo(i.e. manipulación experimental).

(2) Varianza causada por factores externos (e.g. Diferencias Individuales).

Cómo funciona una ANOVA?

Ejemplo (ficticio) simple de un estudio: Una nueva píldora para subir de peso hace comer chocolate?

Diseño independiente de una vía (1 VI):

IV: Sujetos a quienes se les expuso a una condición de Píldora para subir de peso o placebo (control): Muestras independientes

DV: Cuántas barras de chocolate comen en una hora, cuando se les dan todas las barras de chocolate qué quieran?

Cómo funciona una ANOVA?

Píldora Control

4

4

6

65 2

2

4

4

3

4

5 3

Nota: Números pequeños = barras comidas por persona Números de colores = media de los grupos.

Número Grande = Media total o general

Control

4

4

6

652

2

4

4

3

5 3

Varianza Total= Diferencia entre cada puntuación y la Gran Media: Cada diferencia al cuadrado2 y se suman!

4Píldora

Entonces, hasta el momento tenemos la cantidad de varianza total del estudio. Ahora necesitamos dividirla en dos:

(1) Varianza causada por el modelo (manipulación experimental). En éste caso, píldora para subir de peso Vs Placebo...

(2) Varianza causada por factores extraños factores (ej. diferencias individuales). En éste caso, factores como a cuantas personas les gusta el chocolate, hambre etc...

Cómo funciona una ANOVA?

Control

4

4

6

652

2

4

4

3

5 3

Varianza causada por la manipulación = Diferencia entre la media de cada grupo y la media total: Cada diferencia al cuadrado2, multiplique cada una por el n de cada grupo y por último se suman esos valores.

4Píldora

… entonces qué tenemos hasta el momento?

1) La cantidad de varianza TOTAL en el estudio, 2) y la varianza causada por la manipulación.

Todo lo que necesitamos saber ahora entonces es: La cantidad de varianza que es causada por factores aleatorios o de error (ej. hambre, gusto por el chocolate, etc...)

Cuál es la manera más fácil de calcuar esto?

Cómo funciona una ANOVA?

Entonces para encontrar (c), obviamente se resta (b) de (a)

(c) Es la varianza que sobra “error” o “residual”); que no es explicada por la manipulación…

(a) Total cantidad de

varianza en el estudio

(b)Varianza

Causada por la manipulación

(c) Varianza

Causada porFactores extraños

= +

Cómo funciona una ANOVA?

Control

4

4

6

652

2

4

4

3

5 3

Varianza Residual = Diferencia entre cada puntuación y la media del GRUPO:Cada diferencia al

cuadrado2 por cada grupo y cada total2 y luego se suman

4Píldora

Gran Varianza: Es la cantidad de varianza total en el estudio, que se llama LA SUMA DE CUADRADOS TOTAL (SST)

(1) Varianza causada por el modelo (manipulación experimental). La SUMA DE CUADRADOS DEL TRATAMIENTO (SSM O

SSTR)

(2) Varianza causada factores extraños (ej. diferencias individuales). SUMA DE CUADRADOS RESIDUAL o DE ERROR (SSR)

Cómo funciona una ANOVA?

Por lo tanto tenemos:

(a) Varianza total en el estudio (Suma de Cuadrados Total - SST)

(b) Cantidad explicada por la manipulación (Suma de Cuadrados del Tto – SSM o SSTR)

(c) Cantidad explicada por otros factores - lo que “sobra” (Suma de Cuadrados Residual o de Error, SSR, o SSERROR)

Cómo funciona una ANOVA?

… Luego…

(b) Cantidad explicada por la manipulación (Suma de Cuadrados del Tto, SSM)

(b) es dividida por los grados de libertad del modelo: Número de grupos (k) – 1

(c) Cantidad explicada por otros factores - lo que “sobra” (Suma de Cuadrados Residual, SSR, o SSERROR)

(c) es dividida por el total de grados de libertad: N (No. total participantes) – k (número de grupos)

Cómo funciona una ANOVA?

¿POR QUÉ?

SStto fue calculada a través de la suma de dos números (no. de grupos) y SSERROr fue calculada con la suma de 10 números (uno por cada participante)

Cómo funciona una ANOVA?

Estos cálculos arrojan las Medias cuadradas

MSM (Media al cuadrado del Tto) = Cantidad de variación debida a la manipulación)

MSR (Media al cuadrado del residual o “error”) = Cantidad de variación debida al otros (o “error”)

F = MSM/MSR

Cómo funciona una ANOVA?

Por lo tanto, el valor de F (proporción) no es solo un número. ¡Significa algo!

Es la proporción entre la varianza debido a la manipulación y la varianza debida a factores extraños (“error”, “ruido)

Cómo funciona una ANOVA?

Entonces, si F<1 NUNCA podrá ser significativa (debido a que el “ruido” explica más la variación que la manipulación experimental).

F = MSM/MSR

Sí F es mayor a 1, se mira en la tabla para ver sí es significativa.

Cómo “sabe” la tabla si el resultado es o no significativo?

Busca que tan probable la proporción de ese valor de F en particular, ocurre por suerte o al azar, teniendo en cuenta el tamaño de la muestra

Sí nuestro proporción F es mayor que un valor de F, que dado el tamaño de la muestra, puede ocurrir al azar 1 vez en 20 (ej. 5%), entonces el resultado es significativamente diferente a la suerte o azar a p<0.05.

Cómo funciona una ANOVA?

… Pero, cómo hace la tabla para “saber” la probabilidad de un valor de F en particular según un tamaño en específico de una muestra?

Los Matemáticos amablemente solucionaron esto, usando eventos de los cuales conocemos las probabilidades

Ej: la probabilidad de adivinar correctamente si es cara o sello por cada moneda lanzada es … 0.5 cuando es solo una moneda (N=1), 0.25, cuando son dos monedas (N=2), 0.0125 cuando N=3 y así sucesivamente...

Cómo funciona una ANOVA?

Ej: Concurso donde se debe adivinar que hay detrás de tarjetas. Para 10 intentos se tendrá la oportunidad de acertar es:

0 correctas o más es 1 1 correctas o más es 0.9992 correctas o más es 0.9893 correctas o más es 0.9454 correctas o más es 0.8285 correctas o más es 0.6236 correctas o más es 0.3777 correctas o más es 0.1728 correctas o más es 0.0559 correctas o más es 0.01110 correctas o más es 0.001

Cómo funciona una ANOVA?

Ej., La probabilidad de tener un efecto de un tamaño 8/10 correctas es aproximadamente solo una en 20 (i.e., 0.05).

Acertar uno en 20 parece complicado, por lo tanto si tenemos un efecto de este tamaño decimos que es significativo.

Entonces, todos los valores de p indican que tan probable un efecto de ese tamaño (para ANOVA, la proporción F entre la varianza experimental y la varianza de error) ocurre por el azar...

Cómo funciona una ANOVA?

Si es complicado, no se precupen...

Cómo funciona una ANOVA?EN TRES DIAPÓSITIVAS!

Cómo funciona una ANOVA?

Control

4

4

6

652

2

4

4

3

5 3

Se calcula la varianza debida a la manipulación con la diferencia entre la

media de cada GRUPO y la media TOTAL.

4Píldora

Control

4

4

6

652

2

4

4

3

5 3

4

Se calcula la varianza que se debe a factores extraños (i.e., error) con la diferencia entre la

puntuación de cada participante y la media de su grupo

Píldora

Varianza debida a la manipulación (diferencia entre la media de cada GRUPO y la media TOTAL)

Varianza que se debe a factores extraños (i.e., error) (diferencia entre la puntuación de cada

participante y la media de su grupo)

F = proporción de la primera sobre la segunda!

Cómo funciona una ANOVA?

SIN EMBARGO: Esta explicación aplica solamente para ANOVAS independientes (diferentes participantes)

Para medidas repetidas o relacionadas ANOVAs son algo diferentes.

Cómo funciona una ANOVA?

Discusión por grupos

1. Cree un ejemplo de investigación en donde deberá usar ANOVA independiente de una vía para el análisis de los datos.

2. Sustente porque se debe usar ANOVA3. Indique cuales serían los supuestos

fundamentales para poder usar ANOVA4. Indique como comprobaría que los resultado

son significativos.

PRÓXIMA CLASE F 213

ANOVA para muestras relacionadas permite identifica runa varianza adicional, la cual es la varianza entre los resultados de cada participante.

ANOVA para muestras relacionadas:

1. Varianza esperada2. Varianza individual (diferencia entre los resultados de

los participantes)3. Varianza de error 4. Varianza Total

La varianza de error es divida en dos. Cuál diseño es mejor? Independiente o relacionado?

ANOVA MUESTRAS RELACIONADAS

La Suma de Cuadrados Residual o Error se calcula restando SSTTO NO de la suma de cuadrados total sino de la suma de cuadrados de las medidas repetidas

Es decir… calculando de la diferencia entre la puntuación de cada participante en la condición A y el mismo participante en la condición B.

…Un poco complicado para entrar en detalles!

ANOVA MEDIDAS REPETIDAS

La Suma de Cuadrados del Tto se calcula de la misma manera (comparando las medias de las condiciones individuales con la gran media del experimento).

Sin embargo, la Suma de Cuadrados de Error se calcula restando SSTTO NO de la suma de cuadrados total sino de la suma de cuadrados de las medidas repetidas

ANOVA MEDIDAS REPETIDAS

PERO, la suma de cuadrados de error SSError es mayor o menor en un diseño de medidas repetidas que en uno independiente?

Un diseño de de medidas repetidas controla las diferencias individuales (ej., gusto por el chocolate, hambre) por lo tanto reduce SSError

...reduciendo la varianza asociada al error tendremos un valor de F más grande y por lo tanto hay mayor probabilidad de que sea significativo.

Por lo tantoPor lo tanto

ANOVA MEDIDAS REPETIDAS

ANOVAs Complejas

Haciendo una ANOVA compleja

Tipos de ANOVAs: Cuáles son las complejas?

Diseños Factoriales de ANOVA

Cuando un experimento tiene dos o más VI, las cuales son llamadas comunmente factores.

1. Diseños factoriales independientes: Múltiples VI y cada una es medida usando diferentes participantes.

ClasesClases

ANOVAs: Diseños Factoriales

Tipos de ANOVAs: Cuáles son las complejas?

2. Diseños de Medidas Relacionadas: Múltiples VI las cuales han sido medidas con los mismos participantes en todas las condiciones. Ej: 20 participantes y a cada uno se le da a probar 5 bebidas y después califica cada una.

2. Diseños mixtos: Múltiples VI, las cuales algunas han sido medidas con los mismos participantes en todas las condiciones y otras con diferentes participantes.

Ejemplo: Efecto del alcohol en la percepción de belleza e interés en una persona, como las califican (GC Y 2GE) y las posibles diferencias entre géneros dentro de cada uno de los grupos.

ANOVAs: Diseños Factoriales

Cómo etiquetarlas?

ANOVA independiente de dos vías

Diseño diferentes participantes en las

condiciones

Dos VI

ANOVA de medidas repetidas de tres vías

Diseño: mismos participantes en todas las

condiciones

Tres VI

ANOVAs: Diseños Factoriales

Las Variables Independientes también se conocen como ‘factores’ – y podemos tener múltiples factores (ej. Tipo de droga y género).

Estos factores adicionalmente tienen diferentes niveles ‘niveles’ (ej. Tipo de droga puede tener 3 niveles: Antidepresivo, Anticonceptivo y Ninguno; mientras que Género tiene dos niveles: Hombre y Mujer ).

ANOVAs: Diseños Factoriales

Los diseños factoriales son referidos por el numero de VIs y el número de niveles de cada VI:

Ej: En nuestro ejemplo de dos factores: el diseño sería 3 x 2 (Niveles de tipo de droga y niveles de Género).

La ventaja de los diseños factoriales es que puede brindar información de como los factores al interactuar o combinarse tienen

un efecto en la VD = (Interacción)

Los efectos del tratamiento pueden ser de dos tipos:

1) Efecto principal: una diferencia en las medias de la población por un factor sobre los niveles de todos los otros factores del diseño

Ej: Diferencias generales.

2) Efecto de Interacción: cuando el efecto de un factor no es el mismo a los niveles de otro. Ej: No hay diferencias generales entre género, pero si cuando interactúan Género*Droga. Mujeres comen más en la condición de Antidepresivo.

Interacción: cuando un efecto de un factor depende de los niveles de otro factor.

ANOVAs: Diseños Factoriales

INTERPRETANDO LOS RESULTADOS

COMPARACIONES ENTRE CONDICIONES

INTERPRETANDO LOS RESULTADOS

Cuando los efectos principales fueron significativos (F con un p< 0,05)

Se hace una comparación entre condiciones, lo que se puede hacer de las siguientes maneras:

1. Gráficos de patrones de resultados medios: De qué manera las condiciones contribuyen a las diferencias significativas.

2. Comparaciones múltiples entre condiciones (Pair-wise Comparisons): comparan las diferentes combinaciones de los grupos.

3. SPSS ofrece alrededor de 18 procedimientos post-hoc.

Que se debe tener en cuenta para escoger el test post-hoc: 1) Controlar el error tipo I; 2) Controlar el error tipo II; y 3) Confiabilidad cuando algunos supuestos no se cumplen.

Recordemos: Error tipo I es rechazar Ho cuando es verdadera Error tipo II rechazar H1 cuando es verdadera

ANOVA: Post-Hoc Tests

ANOVA: Post-Hoc Tests

Field (2009) sugiere estos lineamientos:

Situación Test

Muestra de igual tamaño y homogeneidad de la varianza

REGWQ, Tukey, Bonferroni.

Leve diferencia en el tamaño de las muestras

Gabriel.

Tamaño muestra muy diferentes Hochberg’s GT2

Varianzas de la población diferentes

Games-Howell

Generalmente Bonferroni es una buena opción

ANOVA

Práctica en SPSS

Haciendo ANOVAS Unifactoriales de muestras

independientes y relacionadas