Post on 11-Apr-2015
METODOLOGÍA DE INVESTIGACIÓN
MÓDULO 5: ANÁLISIS ESTADÍSTICO DE RELACIONES Y GRADO DE ASOCIACIÓN ENTRE VARIABLES.
EL MODELO LAZARSFELD
SEMINARIO DE POSGRADO
2
ANÁLISIS DE TABLAS DE CONTINGENCIA
TEST DE SIGNIFICANCIA NO PARAMÉTRICOS
MEDIDAS DE ASOCIACIÓN
¿CÓMO ANALIZAR Y EVALUAR HIPÓTESIS CAUSALES O DE COVARIANZA ENTRE VARIABLES CUANDO LAS MISMAS ESTÁN MEDIDAS EN ESCALA ORDINAL O NOMINAL?
TIPO DE ANÁLISIS QUE PERMITE UNA TABLA DE CONTINGENCIA
ANÁLISIS DE PERFILES O CARACTERÍSTICAS POBLACIONALES
ANÁLISIS DESCRIPTIVO DE GRUPOS O SEGMENTOS DE POBLACIÓN
ANÁLISIS DE ASOCIACIÓN / INDEPENDENCIA DE PROBABILIDADES
ANÁLISIS DE TABLAS DE CONTINGENCIA
COMPONENTES DE UNA TABLA DE CONTINGENCIA
DISTRIBUCIONES MARGINALES
DISTRIBUCIONES CONDICIONALES
UN TOTAL POBLACIONAL O MUESTRAL
MEDIDAS DE ASOCIACIÓN ENTRE VARIABLES
UNA TABLA ES UNA DISTRIBUCIÓN EN FILAS Y COLUMNAS EN LA QUE LOS INDIVIDUOS DE UNA POBLACIÓN SE CLASIFICAN EN FUNCIÓN DE ALGUNAS VARIABLES.
La tabla de contingencia es un método de representar simultáneamente dos caracteres observados en una misma población, si son discretos o continuos reagrupados en clases. Los dos caracteres son x e y, el tamaño de la muestra es n. Las modalidades o clases de x se escribirán c1.. cr, y las de y, d1... ds. Estos valores en una tabla de doble entrada:
La idea de asociación, en general, se define en oposición a la de independencia. Por convención es definida como:
La idea de fuerza de la relación se define por
la lejanía con respecto a la independencia estadística.
“Las variables X e Y (sexo y condición de actividad) son estadísticamente independientes si el porcentaje de observaciones que poseen el atributo Y1 (activo) es el mismo entre X1 (hombres) que entre X2 (mujeres)
ASOCIACIÓN ESTADÍSTICA
6
Hipótesis de Trabajo:
– “Dentro de la población de 25 a 45 años los varones tendrán una tasa de actividad significativamente más alta que las mujeres”
Sexo: Varón (V) – Mujer (M)Condición de Actividad: Activo (A) – Inactivo (I)
V A
M I o A
UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA A MODO DE EJEMPLO
7
Hipótesis Nula de Independencia Estadística
“Dentro de la población de 25 a 45 años la tasa de actividad no presentará diferencias por sexo”
Sexo: Varón (V) – Mujer (M)Condición de Actividad: Activo (A) – Inactivo (I)
V I o A
M I o A
UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA A MODO DE EJEMPLO
Cuadro 1: Población total por Actividad según Sexo
Gran Buenos Aires 1995 / En porcentajes
Condición Sexo Total
de actividad Varón Mujer
Activo 95,0 60,7 77,2
Inactivo 5,0 39,3 22,8
Total 2266 2447 4713
100,0 100,0 100,0
Phi = 0,40808
Significancia = 0,00000 (Prob. de chi-cuadrado)
Fuente: Elaboración propia a partir de la EPH- INDEC.
Tablas de Contingencia / Análisis de Asociación
RELACIÓN ORIGINAL
9
PRUEBA DE HIPÓTESIS JI-CUADRADA
A MODO DE EJEMPLO
Chi-Square Tests
2029,509b 1 ,000
15109
Pearson Chi-Square
N of Valid Cases
Value dfAsymp. Sig.
(2-sided)
0 cells (,0%) have expected count less than 5. The minimum expected countis 1538,23.
b.
Hipótesis Multivariada
• “Entre las personas en edad de alta participación económica (de 25 a 45 años), la tasa de actividad significativamente más elevada entre los varones que entre las mujeres, se explica por la intervención de condiciones familiares”
ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MANERA DE EJEMPLO
EL PAPEL MÁS IMPORTANTE DEL ANÁLISIS MULTIVARIABLE ES PROPORCIONAR LOS SUSTITUTOS LÓGICOS DEL CONTROL EXPERIMENTAL Y PONER A PRUEBA HIPÓTESIS MÁS COMPLEJAS SOBRE EL ORDEN O EL CAMBIO SOCIAL.
ASOCIACIÓN ESTADÍSTICA MULTIVARIADA
DOS TIPOS DE PROBLEMAS ENFRENTA EL ANÁLISIS MULTIVARIADO
• Análisis de los datos: ¿cómo manipular la información, resumirla, identificar y evaluar las diferentes relaciones?
• Interpretación de los datos: ¿cómo diferenciar los efectos particulares de los de interacción y cómo evaluar de manera racional el sentido de las regularidades empíricas?
ASOCIACIÓN ESTADÍSTICA MULTIVARIADA
NECESIDAD DE UN MÉTODO QUE PERMITA
• Explicar una relación descubriendo las conexiones causales existente entre las variables.
• Identificar condiciones bajo las cuales una relación tiene lugar.
• Identificar factores o condiciones independientes que operan sobre una misma variable.
• Evaluar la existencia de relaciones espurias entre variables.
• Forma estadística– Por parciales– Por marginales
• Temporalidad– Antecedente– Interviniente
Antecedente Interviniente
Parcial PA PI
Marginal MA MI
Parcial anterior:
(condición / especificación)
X YT
Parcial interviniente:
(contingencia)
X Y
T
Marginal anterior:
(Espuriedad)
X YT
Marginal interviniente:
(interpretación)
X YT
ASOCIACIÓN ESTADÍSTICA MULTIVARIADAEL MODELO LAZARSFELD
Tablas de Contingencia / Análisis de Asociación
Hogares con niños de 5 años o menores
Condición Sexo Total
de actividad Varón Mujer
Activo 97,5 48,6 71,9
Inactivo 2,5 51,4 28,1
Total 795 873 1668
100% 100% 100%
Phi = 0,54343
Significancia = 0,00000 (Prob. chi cuadrado)
Hogares con niños de 6 a 14 años
Condición Sexo Total
de actividad Varón Mujer
Activo 97,7 59,7 76,5
Inactivo 2,3 40,3 23,5
Total 524 663 1187
100% 100% 100%
Phi = 0,44478
Significancia 0,00000 (Prob. de chi cuadrado)
Hogares sin menores de 15 años
Condición Sexo Total
de actividad Varón Mujer
Activo 91,3 73,0 82,3
Inactivo 8,7 27,0 17,7
Total 947 911 1858
100% 100% 100%
Phi = 0,24052
Significancia 0,00000 (Prob. de chi cuadrado)
PARCIALES
Tablas de Contingencia / Análisis de Asociación
Presencia de menores en el hogar según Sexo
Presencia de Sexo Total
niños menores Varón Mujer
Con niños de 5 ó < 35,1 35,7 35,4
Con niños de 6 a 14 23,1 27,1 25,2
Sin menores de 15 41,8 37,2 39,4
Total 2266 2447 4713
100% 100% 100%
Phi = 0,05390
Significancia = 0,00106 (Prob. de chi cuadrado)
Presencia de menores en el hogar según Actividad
Presencia de Condición de actividad Total
niños menores Activo I nactivo
Con niños de 5 ó < 33,0 43,6 35,4
Con niños de 6 a 14 25,0 25,9 25,2
Sin menores de 15 42,1 30,5 39,4
Total 3637 1076 4713
100% 100% 100%
Phi = 0,10806
Significancia = 0,00000 (Prob. de chi cuadrado)
MARGINALES
Ecuación de Covarianzas de Lazarsfeld
(XY) = (XY,t1) (XY,t⊕ 2) (XT) (YT)⊕ ⊗
RelaciónOriginal
RelacionesParciales
RelacionesMarginales
Siempre debe usarse el mismo coeficiente
“Existe relación causal entre dos variables si, para cualquier factor de prueba antecedente, la relación
entre esas variables no desaparece”
ASOCIACIÓN ESTADÍSTICA MULTIVARIADAEL MODELO LAZARSFELD
ECUACIÓN DE COVARIANZAS DE LAZARSFELD
(XY) = (XYt1) (XYt⊕ 2) (XT) (YT)⊕ ⊗
Hipótesis diagonal (PHI):
(XY) = (XYt1) (XYt⊕ 2) (XT) (YT)⊕ ⊗0,367 = 0,423 0,299 -0,086 -0,059⊕ ⊕ ⊗
Hipótesis rinconal (Gamma):
(XY) = (XY,t1) (XY,t⊕ 2) (XT) (YT)⊕ ⊗0,807 = 0,896 0,555 -0,161 -0,157⊕ ⊕ ⊗
ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MODO DE EJEMPLO