Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

download Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

of 180

Transcript of Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    1/180

    1

    RE-VISION DE ANLISIS DE TABLAS e INTRODUCCIN A

    MODELOS LOGLINEARES (2010, v3).

    MARCELO BOADO

    Prefacio

    Este no es un libro de estadstica o matemtica, sino un curso destinado a aprenderlasy aplicarlas a situaciones de investigacin. Como curso se ha basado en la bibliografainternacional sobre el tema disponible en las bibliotecas e internet, en general siempre eningls y en programas de anlisis de datos poco amistosos. Por ello partiendo de unsupuesto nivel bsico obtenido en el grado, desarrollamos muchos razonamientos yaplicaciones que no son muy frecuentes en espaol. Y por ello tambin desarrollamostodos los ejemplos de aplicaciones de algoritmos y modelos en SPSS y Excel, que son mspopulares entre los estudiantes y los profesionales. Pero asimismo muchos ejemplos son

    fcilmente traducibles y aplicables a STATA.

    El objetivo del trabajo es aclarar los procedimientos y su aproximacin a las hiptesisque se persiguen. En este sentido se adscribe a toda la reflexin que entiende que una vezque el experimento natural ha pasado (como en el 99,99% de nuestras investigaciones), latarea es abocarnos al DGP (Data Generation Process), procurando obtener aproximacionesverosmiles de nuestras hiptesis dados los datos que obtuvimos.En buen romance, el objetivo especfico es desarrollar habilidades y conocimientos para lassituaciones ms cotidianas de investigacin y trabajo profesional, cuando se debe analizartablas de varias categoras, o relacionar tres o ms variables, o resolver distribuciones quepresentan particularidades, o comparar muestras sucesivas sobre una misma poblacin.

    Este curso se ha beneficiado de las observaciones y comentarios de 3 generaciones dealumnos de la Maestra, y de 2 generaciones del Doctorado, del departamento deSociologa de FCS UDELAR en Uruguay, y de 1 generacin del doctorado de Sociologadel Instituto de Investigaciones Gino Germani de la UBA en Argentina, una generacin dela escuela de verano de CEE/Colmex/CEEY. Los defectos persistentes pertencen al autor.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    2/180

    2

    CLASE 1: NOTACIN, DEFINICIONES, y CONCEPTOS PRINCIPALES.

    El presente curso se dirige al uso y anlisis de datos generados por variables llamadasnominales, atributivas, discretas, segn ciertos autores cualitativas (ver Anexo 0).

    1.1.REPRESENTANDO NUESTROS DATOS EN UNA TABLA.

    1.1.1. DISTRIBUCIN DE FRECUENCIAS CONJUNTAS EN UNA TABLA

    Esta es una de las varias formas posibles de representar cmo estaran relacionadas dosvariables nominales.Es la combinacin de variables a travs de todas las categoras que las representan.

    VARIABLE

    FILA

    VARIABLE COLUMNA TOTAL

    VARFILAj=1 j=2 . . . . . . . . j=ci= 1 n11 n12 . . . . . . . n1c n1+

    i= 2 n21 n22 . . . . . . . n2c n2+

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    . . . . . . .

    . . . . . . .

    . . . . . . .

    . . . . . . .

    . . . . . . .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .i= l nl1 nl2 . . . . . . . nlc nl+

    TOTAL VARCOLUMNA

    n+1 n+2 . . . . . . . n+c n++

    ++= ==

    +==

    +==

    nl

    Nij

    nc

    Total

    jn

    l

    ijnColumnaMTotal

    c

    in

    ijnFilaMTotal

    11Casos

    1arginal

    1arginal

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    3/180

    3

    1.1.2. DISTRIBUCIN DE PROBABILIDADES CONJUNTAS EN UNA TABLA

    VARIABLEFILA

    VARIABLE COLUMNA ProbMarginal

    VAR FILAj=1 j=2 . . . . . . . . j=c

    i= 1 p11 p12 . . . . . . . p1c p1+

    i= 2 p21 p22 . . . . . . . p2c p2+

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    . . . . . . .

    . . . . . . .

    . . . . . . .

    . . . . . . .

    . . . . . . .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .i= l pl1 pl2 . . . . . . . plc pl+

    Prob MarginalVAR

    COLUMNA

    p+1 p+2 . . . . . . . p+c p++

    DEFINICIONES:

    PROBABILIDAD CONJUNTA: proporcin de casos en una celda ij en relacin al total decasos.

    PROBABILIDAD MARGINAL: Suma de las probabilidades conjuntas de una categora atravs de las categoras de la otra variable. Se representa como la proporcin de unacategora de la variable de inters (fila o columna) en el total de casos.

    PROBABILIDAD CONDICIONAL: es la probabilidad de que ser i dado que solointeresan los j. Se representa como la proporcin de casos de una celda respecto de su totalde categora fila (o columna).

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    4/180

    4

    jp

    ijpColumnalCondiciona

    ip

    ijpFilalCondiciona

    +=

    +=

    /)(.Pr

    /)(.Pr

    =+ ++ ==++

    +==

    +==

    =

    l

    jp

    c

    ip

    l

    ijp

    cp

    l

    jp

    l

    ijpColumnainalM

    c c

    ip

    ijpFilainalM

    Nij

    npConjunta ij

    11

    111.Pr

    11arg.Pr

    1 1arg.Pr

    /.Pr

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    5/180

    5

    1.1.3. OTRAS FORMAS DE TABLAS.

    Tabla mltiple distribucin condicional

    APOYO ALGOBIERNO

    PROPIEDAD DE MMPP

    TotalPROPIETARIOS NO PROPIETARIOSESTRATO SOCIAL ESTRATO SOCIALMEDIO BAJO MEDIO BAJO

    FAVOR 44 16 4 32 96CONTRA 36 4 16 48 104Total 80 20 20 80 200

    Tabla mltiple en forma de arbolito o matriz de conteos ej. en el excel.

    Prop MMPP Estr.Soc Apoyo Gob FrecsProp Medio Favor 44Prop Medio Contra 36Prop Bajo Favor 16Prop Bajo Contra 4No Prop Medio Favor 4No Prop Medio Contra 16

    No Prop Bajo Favor 32No Prop Bajo Contra 80

    La re-codifico y la exporto al SPSS, ponindoles 1 y 2 a cada categora.Es ms fcil exportar la planilla sin etiquetas ni labels, porque siempre las puedo ponerluego con doble clic en el cabezal de columna.As me quedar una base de datos con 4 columnas, 3 de categoras y una de frecuenciaso conteos. Siempre que use una base as debo indicar la variables que tenga lasfrecuencias en el comando ponderar del Spss.

    Prop MMPP Estr.Soc Apoyo Gob Frecs1 1 1 441 1 2 361 2 1 161 2 2 42 1 1 42 1 2 162 2 1 32

    2 2 2 80

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    6/180

    6

    1.2. ASOCIACIN E INDEPENDENCIA.

    Cuando se tienen 2 o mas variables nominales y se procede a examinar cmo estnrelacionadas estas variables por medio de tablas de contingencia, de cualquiera de los tiposque recin vimos, se ingresa dentro de lo que suele llamarse anlisis de asociacin.

    Todos los mtodos que veremos seguidamente nos ayudan en esta direccin, perosuele suceder, segn la escala y tipo de pregunta o hiptesis de nuestra investigacin, quetengamos varias alternativas. La particularidad de los mtodos que veremos en este cursopara el anlisis de asociacin es que no permiten distinguir entre variable explicada(response, o dependiente) y variable explicativa (o regresor, o independiente).

    Por ello las relaciones observadas en los datos van a indicar modalidades devariacin conjunta, pero no una direccin de antecedencia o causalidad. Si esta existe, seren todo caso producto de nuestra interpretacin de los datos, no una consecuencia de losmtodos aplicados.

    No obstante, en varios mtodos sofisticados que veremos, se usarn procedimientos o

    formulaciones analgicas con el modelo causal ms simple - que es el modelo linealgeneral, que vieron en cursos recientes-, pero con una finalidad enunciativa y comunicativa.

    Cuando se analiza la informacin que aportan las variables nominales de unaencuesta, o un registro, o un censo, o un conjunto de cualquiera de ellos, suelenpredominar dos preguntas: esas variables tienen relacin entre s?, o esas variables notienen relacin entre s?

    Estas preguntas reflejan un objetivo de la investigacin que es hallar evidenciaconfiable, plausible, a favor o en contra de una hiptesis. Suele simplificarse con demasa

    la cuestin a la oposicin entre Asociacin o Independencia estadstica, una dicotoma deltipo algo que ver vs nada que ver.

    En general veremos que nunca nuestra hiptesis estar perfectamente formulada, yque, en el mejor de los casos, ella es una aproximacin imperfecta a la distribucin quepresentan los datos que relevamos. Vamos a ver que podremos dar muchos pasos entre laasociacin y la independencia para encontrar un modelo que explique nuestros datos.

    Un modelo, es una hiptesis precisa, con condiciones y restricciones claras. Unmodelo es a la realidad lo mismo que una maqueta es a una casa... una forma de representarlo que pas, pasa, o pasara.

    Por qu tienen importancia los conceptos de asociacin e independencia? Porquesuelen indicar si es plausible sostener que dos atributos observados de una poblacinguardan algn grado de referencia recproca.

    En general, no hay hiptesis precisas para la asociacin de 2 o ms atributos. Lo ques hay son hiptesis precisas para la independencia de 2 o ms atributos, o para otrassituaciones. Es decir, condiciones y restricciones que permiten saber cual sera ladistribucin terica de la independencia. Porque muchas veces, al analizar la informacin,es tan necesario saber cundo algo esta asociado como cuando no lo est.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    7/180

    7

    1.3. CONCEPTO DE INDEPENDENCIA

    Dos variables nominales y aleatorias- son independientes s y slo si para cualquiervalor de una de las variables, la probabilidad condicional de la otra es igual a suprobabilidad marginal.

    O de otra forma, cuando la probabilidad conjunta es igual al producto de las probabilidadesmarginales respectivas.

    Dos variables -A y B- son independientes:Si la probabilidad de la categora i (de A) dada la categora j (de B) - que es la probabilidadconjunta de la celda ij dividida una probabilidad marginal de la categora j (de B) - iguala ala probabilidad marginal de la categora i (de A).

    P(i|j) = pij / p+j= pi+ (1)

    de donde es fcil advertir, y enunciar de manera genrica, que cuando:

    pij = pi+ * p+j (2)

    estamos ante un caso de independencia estadstica.

    Qu quiere decir esto?Que los valores que asume una variable no estn condicionados por los que asume la otra.

    O en otras palabras, los valores que se observan en las variables A y B en la muestra de esapoblacin no permiten inferir que estn asociados entre s, aunque las variables pueden serigualmente significativas en esa muestra, consideradas cada una por su lado.

    Precisamente la importancia de este concepto permite considerar para el anlisis a las

    variables que son independientes entre s, cada una por separado sin tener que sospechar oreferir condicionalidad recproca, porque como vimos la distribucin condicional es igual, ocasi igual, a la marginal.

    La frmula (2) constituye una derivacin de la anterior (1) para el clculo, pero ambaspermiten arribar al concepto de valor esperado, que no es otro que el de valor promediosin efecto o asociacin alguna.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    8/180

    8

    La suma por fila, o columna, de los valores observados (nij) permite estimar los totalesmarginales de cada fila (ni+), o columna (n+j).La proporcin de cada total fila, o columna, en relacin al total de casos (n++) como vimosnos da la probabilidad marginal (alternativamente pi+ o p+j).

    A partir de estos ltimos se puede estimar las probabilidades conjuntas esperadas y losvalores esperados.

    Dado que: pi+= ni+/N (3); y p+j= n+j/N (4)

    Entonces pij = pi+*p+j (2) sustituyendo es= (ni+/N ) (n+j/N)=(ni+ * n+j) / N

    2

    Y para las frecuencias o valores esperados la estimacin es

    Feij = N * (pi+* p+j) es claro que cuando sustituyo

    Feij = N * (ni+/N) * (n+j/N)= N * (ni+ * n+j) / N

    2

    = (ni+ * n+j)/ N (5)y cuando se cumple pij = pi+*p+j (2), entonces

    Feij = N * pi+ (6)

    Cuando 2 variables son independientes las frecuencias esperadas, o valores esperados,igualan (o se aproximan mucho), a las frecuencias observadas.

    Las frecuencias esperadas son la distribucin terica de las variables si ellas no estuvieranasociadas, y como vemos se estima a partir de las proporciones de las categoras en lamuestra (1).

    Las frecuencias esperadas de una tabla son una hiptesis sobre cual sera la distribucinde los datos si no hubiera una relacin asociativa... Por ello la llaman hiptesis nula.

    Como veremos ambos criterios no alcanzan para ir a fondo en el anlisis de los datos.

    1 Que como veremos y explicaremos mas adelante son llamados MLE, o Estimativas de Mxima Verosimilitud.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    9/180

    9

    1.4. APLICANDO EL OJO.

    Un primer paso, cuando tenemos dicotomas es el examen visual (ojmetro) a los datos,que nos permite una forma de estimar asociacin e independencia.

    Se trata de saber si las proporciones condicionales y marginales son homogneas osimilares. O en otras palabras, que tan lejos estn las probabilidades condicionalesobservadas de las probabilidades marginales observadas.

    Por un lado sabemos que las proporciones marginales son idnticas en los datos observadosy en los esperados. Y por otro lado, por la hiptesis de independencia, sabemos que lasprobabilidades condicionales esperadas deben ser iguales a sus probabilidades marginales.Entonces, un contraste visual en el que las probabilidades condicionales observadas no sealejen mucho de las marginales, ya nos brinda una idea de la situacin que enfrentamos.

    Otro procedimiento usual y popular son las diferencias entre las proporciones condicionalesde los pares de celdas. Cuando estas diferencias son 0 estamos en situacin deindependencia.Y slo cuando esta diferencia supera el 20% estamos ante una relacin asociativaconsiderable.

    Esta inspeccin visual se dificulta notoriamente cuando nos alejamos de las dicotomas o detablas de 2 x C categoras. Y no es aplicable cuando representamos los datos con una tablamltiple en la que estn presentes muchas variables.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    10/180

    10

    1.5 TEST DE INDEPENDENCIA CON DOS VARIABLES.

    En el sentido que se induce arriba queda claro que independencia y asociacin seoponen, y el procedimiento a seguir en una tabla bidimensional es estimar la distanciaentre el valor esperado y el observado.

    En las disciplinas observacionales este procedimiento es claro y notorio, porquecomo sugiere King (1998) el experimento ya pas (2), y las variables estn aleatorizadaspor el muestreo que aplicamos, mientras que en las disciplinas experimentales ello suponeuna estimacin necesaria de los casos y las combinaciones de los mismos como para poderponer a prueba la independencia como una de las hiptesis posibles (3).

    En realidad el procedimiento tiene la siguiente lgica:

    Dada la Hiptesis nula (H0) que seala los parmetros de independencia:Es posible rechazarla, y proponer una Hiptesis alternativa para explicar el resultado?

    Slo que en nuestro caso, el de las ciencias observacionales, habitualmente invertimos elproceder.De lo que se trata entonces es de una evaluacin global de la diferencia entre la H 0 y laHiptesis alternativa.

    En primer lugar a la diferencia entre valores observados (nij, o tambin fo) y esperados(Fij, o tambin Fe) se le llama residuo (fo-Fe). (Cualquier paquete convencional deestadsticas ofrece este y otros tipos de residuos que son de utilidad para el examen de lahiptesis nula).

    Que tipo de residuo debemos preferir?Como claramente se ve dado que la suma de los valores esperados iguala a los observadosen los marginales respectivos y en el total, es lgico esperar que la suma de los residuos-que tienen alternativamente signos positivos y negativos- sea 0.Por lo que los residuos puros en su conjunto no son preferibles para describir los datos.No obstante, como veremos seguidamente, su signo (- o +), que estar indicando sobre o

    sub representacin de los datos observados en relacin a la distribucin terica, s esimportante (4).

    2 Se trata de un experimento natural o cuasi-experimento; en el que slo se infieren resultado posteriores a la aplicacin de

    las variables independientes, pero no hay mediciones (informacin) previas. Ver tambin Shadish,Cook y Campbell (2001), o almenos Cambell y Stanley (1963)3 Otra prueba interesante es la de homogeneida de muestras, se ver mas adelante. En el fondo lo nico que importa es la bondadde ajuste, todos los ejemplos son formas derivadas de ella.4 Por razones de claridad y estrategia de procedimiento retomaremos el examen de los diferentes tipos de residuos mas adelante.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    11/180

    11

    1.5.1. Test de Bondad de ajuste.

    Hay dos propuestas de solucin que prueban si el conjunto de la informacin presente en latabla se aproxima a una distribucin conocida o imputable, que son llamados test debondad de ajuste, o, corrientemente e inconvenientemente- : test de independencia.

    Uno es el X2 de Pearson, usualmente nombrado como test ji cuadrado,

    y el otro es la Razn de verosimilitud,el G2 o L2 segn sea el libro.

    La solucin de Pearson, que conduce a la bondad de ajuste de la informacin que poseemosSI la independencia fuese verdadera, tiene la formula:

    Y, la solucin de la Razn de Verosimilitud, que es parecida, y su frmula es:

    Para ambos ejemplos:nij: valores observados en la celdaFij: valores esperados en la celda

    )7()F/)Fn((Xl

    1i

    c

    1jij

    2ijij

    2

    )8())F/nln(*n((2G ij

    l

    1i

    c

    1jijij

    2

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    12/180

    12

    Ambas frmulas son formas de contrastacin de la informacin en las celdas, y arrojan unvalor que sigue una distribucin similar a la distribucin Ji Cuadrado, dadas ciertasrestricciones. Y mantienen entre s una diferencia pequea de valores.(Ver Anexo 1, pp 7-10 Razn de Verosimilitud), (Ver Anexo2: Tabla de Ji cuadrado).

    La diferencia entre ambas pruebas no es menor en lo conceptual, aunque suele serlo en losvalores obtenidos. La prueba X2 de Pearson estandariza la diferencia cuadratizada entre elvalor observado y el valor terico de la probabilidad. De ese modo mide la distancia obrecha en base a una escala. Esta explicacin est sobradamente difundida en todos loslibros de texto corrientes.

    La prueba de la Razn de Verosimilitud, que ha ganado popularidad en los ltimos 30 aos,responde a un planteo algo mas complejo, que invitamos a seguirlo en el Anexo 2 de estemanual. Bsicamente la Razn de verosimilitud contrasta dos modelos de diferente nmerode parmetros. Modelos que estn anidados, que tienen los mismos trminos salvo uno.Por eso la Razn de verosmilitud es un contraste proporcional entre una hiptesis massimple y otra mas compleja. Esto la hace preferible a X2 para modelar hiptesis sobre losdatos.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    13/180

    13

    1.5.2. Aplicacin a un Ejemplo.

    Estimaremos a partir d elos datos observados probabilidad conjunta, frecuencias esperadas,probabilidad conjunta esperada, probabilidades condicionales, bondad de ajuste, ydisimiliaridad. Y lo pondremos en una tabla resumen, usando un formato de conteo en unexcel.

    VALORES OBSERVADOSVar fila Var col

    1 2 Total1 50 73 1232 43 21 643 80 19 99

    Total 173 113 286

    VALORES ESPERADOSVar fila Var col

    1 2 Total1 74,4 48,6 1232 38,8 25,2 643 59,8 39,2 99

    Total 173 113 286

    PROB CONJUNTAS OBSERVADASVar fila Var col

    1 2 Total1 0,175 0,255 0,4302 0,150 0,073 0,2233 0,280 0,066 0,346

    Total 0,605 0,395 1

    PROB CONJUNTAS ESPERADASVar fila Var col

    1 2 Total1 0,260 0,170 0,4302 0,136 0,088 0,2233 0,209 0,137 0,346

    Total 0,605 0,395 1

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    14/180

    14

    PROB CONDICIONALES OBSERVADASVar fila Var col

    1 2 Total1 0,289 0,646 0,4302 0,248 0,186 0,2233 0,462 0,168 0,346

    Total 1 1 1

    PROB CONDICIONALES ESPERADASVar fila Var col

    1 2 Total1 0,430 0,430 0,4302 0,223 0,223 0,2233 0,346 0,346 0,346

    Total 1 1 1

    Es posible volcar los datos anteriores para las estimaciones necesariasen la siguiente planilla (5).

    Celda

    nij

    Fo Fe pij peij Resid

    (fo-Fe)

    Disim(pij-peij)

    X2

    Pearson

    %P* Ln(fo/Fe) fo*Ln(fo/Fe)

    1,1 50 74,6 17,5 26,0 -24,6 -8,6 8,11 21 -0,400 -20,01,2 73 48,6 25,5 17,0 +24,3 +8,4 12,16 31,5 0,407 29,712,1 43 38,9 15 13,6 + 4,1 +1,4 0,43 1,1 0,100 4,32,2 21 25,4 7,3 8,9 -4,4 -1,6 0,76 2 -0,190 -3,993,1 80 59,8 28 20,9 +20,2 +7,1 6,82 17,7 0,291 23,283,2 19 39,1 6,6 13,6 -20,1 -7,1 10,33 26,7 -0,721 -13,71

    Total 286 286 100 100 0 0 38,61 100 2*19,59=39,18

    %P*: contribucin de la celda al X2Veros: fo*Ln(fo/Fe)Disim (pij-peij)

    Segn el presente ejemplo pretender explicar los datos con el modelo (hiptesis) deindependencia no es recomendable.

    5 Esta es una planilla o tabla de conteos o tabla tipo arbolito, veremos mas adelante que resulta de suma utilidad. Tengapresente, y ello se mostrar mas adelante que en tanto ella es una forma de representar la informacin tambin se volver un tipode base de datos, ingresable en los programas de clculo tal cual esta all, y las columnas de las estimaciones que ahoravemos tambin las podemos obtener de esos programas (excel o SPSS).

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    15/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    16/180

    16

    1.5.3. Disimilaridad.

    Un proceder semejante al de los residuos entre fo y Fe es examinar la brecha entre lasprobabilidades conjuntas observadas y esperadas, que no es ms que la discrepancia odisimilaridad entre los porcentajes que arrojan las fo (nij) y las Fe (Fij) en relacin al N encada caso.

    Para este proceder numerosos autores proponen un Indice de Disimilaridad paracomplementar el criterio de la bondad de ajuste. (7)

    Dos caminos para hacerlo: Sumar las diferencias absolutas - sin signo- entre las probabilidades observadas y

    las esperadas de todas las celdas, y dividir por 2.

    | pij peij | / 2

    Slo sumar las diferencias positivas entre las probabilidades observadas y lasesperadas. O si prefiere, o slo las negativas.

    Su resultado indica la discrepancia entre lo observado y lo esperado.

    Este resultado es la proporcin de casos que debera reclasificarse para llegar a la situacinde independencia desde la situacin observada.

    En nuestro ejemplo habra que reclasificar al 17,2% de los casos para lograr el modelo deindependencia, lo cual es indicativo de que ese modelo es una alternativa muy mala para loque observamos.

    La literatura mas recibida recomienda preferir un modelo segn el ndice de disimilaridadcuando su valor es inferior al 2%.

    7 Este es un ndice que ya vimos en otros cursos!! Y es una versin corregida de la diferencia porcentual entrecondicionales que vimos en 1.4.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    17/180

    17

    1.6. LAS CHANCES Y CHANCES RELATIVAS (odds y odds ratio).

    1.6.1. Generalidades.

    Una forma alternativa y equivalente a la fundada en las probabilidades estimadas yesperadas es la basada en las chances y chances relativas. Tambin se les denomina

    ventajas y ventajas relativas, o momios y razones de momios, u odds y odds ratio, en laliteratura convencional. Su estimacin es ms directa y como se ver mas adelante lospaquetes de clculo las prefieren.

    La chance es la ventaja de ser i dado j frente a ser j dado j. Es una razn que se estima entredos valores. Da una idea de competencia u oportunidad. Obviamente se deriva de unatradicin matemtica vinculada a los juegos de azar. Y a los efectos de los clculos, comose ver, permite muchas mas opciones que los procedimientos anteriores.

    Cuando se aplica a los valores marginales se denomina chance marginal.

    Cuando se aplica a los valores internos de la tabla se denomina chance condicional.

    Las chances condicionales son muy importantes, y sirven para estimar las ventajas de unresultado frente a otro. Por ejemplo ser Bi antes que Bj dado que se es Ai.

    Las chances o ventajas o momios u odds no son proporciones como vimos hasta ahora sinorazones.Las proporciones se estiman sobre el total fila, o columna, y sobre el total de la tabla.Y por ello son indicativas de los tipos de probabilidad que ya vimos (condicional yconjunta).Las chances u odds son razones que relacionan dos resultados (o probabilidades)observados.Chance y probabilidad implican conceptos diferentes, pero relacionados entre s:

    Uno, trata una ventaja de ocurrencia (o mejor dicho, de lo ocurrido);y el otro, la proporcin de los casos de una combinacin en el total de casos,o en el total de casos por fila o columna.

    As es fcil ver que: odd = probabilidad/(1 - probabilidad);y alternativamente: probabilidad = odd/(1 + odd). Haga esta prueba por su bien.

    Es usual que entre los diversos resultados que aporta una tabla, se relacione laschances que se observan.La nueva forma de comparacin que surge es una razn de chances, o sea una raznde las razones previamente observadas, y se la denomina chance relativa, o ventajarelativa, u odds ratio, o razn de momios.

    La chance relativa es idntica al producto cruzado de una ttrada de celdas, porrazones aritmticas claras.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    18/180

    18

    1.6.2. Qu comparo cuando leo una razn de chances, o chance relativa?

    La ventaja de ser Bi antes que Bj dado que se es Ai, frente a ser Bi antes que ser Bj dado

    que se es Aj.La razn de chances, u odds ratio, estima y mide una ventaja que nos interesa en relacin auna base de comparacin.

    Es propio de las apuestas complejas como se ve, pero tambin de la realidad compleja,como la de las CCSS y otras ciencias observacionales.

    Volvamos a nuestro ejemplo anterior, y pongamos sustancia:

    VALORES OBSERVADOS

    Var filaVoto

    Var col: generaciones1=Joven 2=Viejo Total

    1=Pcol 50 73 1232=Pnal 43 21 643=FA 80 19 99Total 173 113 286

    La chance de 1,1 frente a 1,2 , es decir de ser 1 antes que 2 dado que son ambos 1, o encategoras de ser joven y votar colorado respecto a ser viejo y votar colorado,es (50/73) = 0,68.

    La chance de ser joven y votar colorado es casi un tercio menor para los jvenes respectode los viejos.La chance de 3,1 frente a 3,2 , es decir de ser 1 antes que 2 dado que son ambos 3, o encategoras de ser joven y votar FA respecto a ser viejo y votar FA,es (80/19)=4,21.La chance de ser joven y votar FA es 4 veces mayor para los jvenes que para los viejos.

    La chance relativa u odds ratio es la razn de ambas razones. As:(50/73) / (80/19), que equivale a (50 x 19) / (80 x 73), da por resultado 0,16.

    Entonces la chance de votar colorado en los jvenes se reduce a 1/6, y por su parte lachance de votar FA en los viejos se reduce a 1/6.O, puesto de otra manera mas contundente: la chance relativa de votar FA antes quecolorado es casi 6 veces superior en los jvenes que en los viejos, y viceversa la chancerelativa de votar colorado antes que FA en los viejos es 6 veces mayor que en los jvenes.

    Esta forma de examinar los datos permite partir la tabla en aquellas regiones que nos seande inters, y localizar componentes asociativos de importancia.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    19/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    20/180

    20

    CLASE 2: PROPIEDADES DE JI CUADRADO YAPLICACIONES DE LA BONDAD DE AJUSTE.

    2. 1. RECUERDOS DE JI CUADRADO.

    La distribucin 2

    La distribucin 2

    es una distribucin terica de probabilidad como la distribucinnormal que toma sus parmetros de los grados de libertad.

    No es simtrica y comienza en 0. Cuanto mas grados de libertad mas se achata la distribucin y mas a la derecha se

    desplaza la distribucin.

    Las probabilidades son reas bajo la curva. Las reas bajo la curva corresponden ala probabilidad de que el valor caiga en el intervalo de importancia.

    Por ejemplo, el 50% de las veces una variable 2

    con 5 gr.l estar en un rango de0-4.35,

    pero el 99% de las veces el valor caer bajo 15.09, lo que significa que slo hay 1%

    de chance obtener al azar una variable 2

    con 5 gr.l por encima de este nivel.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    21/180

    21

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    22/180

    22

    2.2. PROPIEDADES DE 2

    .

    1. Una distribucin de 2 con v grados de libertad esta definida como:Ji cuadrado = sumatoria de v variables normales estandarizadas.

    2. El valor medio de una distribucin 2 con v grados de libertad es v.

    Y su desvo estndar es 2v. Por ello la distribucin 2

    se aproxima a la normal cuando ves grande; es decir mayor que 30.

    3. Otra propiedad derivada es que si G y H son variables aleatorias independientes, cadauna con distribuciones dy e, entonces la reunin de ambas en una nueva variable W tieneuna distribucin ji cuadrado igual a d+e.

    4. A partir de 1 y 3 es claro que cuando se tiene una distribucin 2 con v grados delibertad, ella puede descomponerse en un nmero v de elementos independientesque tambin se distribuyen como 2 con 1 grado de libertad.

    2v

    22

    21

    2v Z......ZZ

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    23/180

    23

    2.3. LOS GRADOS DE LIBERTAD.

    El nmero de celdas de la tabla (las combinaciones posibles de categoras) es el productodel nmero de celdas en las filas por el nmero de celdas en las columnas.

    Este nmero de celdas equivale a la suma de los grados de libertad (gr.l) y de lasrestricciones impuestas (o nmero de parmetros de clculo necesarios),y tiene la siguiente forma general:

    nmero de filas x nmero de columnas = nmero de celdasnmero de restricciones + grados de libertad = nmero de celdas

    lx c = 1+(l-1)+(c-1)+(l-1)(c-1) (9)

    Es fcil ver que los grados de libertad son la diferencia entre el nmero de celdas y elnmero de parmetros para una tabla bidimensional. En consecuencia para cualquier tablabidimensional los grados de libertad son:

    gr.l= (l x c) l c +1 = (l x c) (l +c 1) = (l-1) (c-1) (10)

    Vemos que la formula 10 corresponde a los grados de libertad necesariospara la testar la hiptesis de independencia estadstica.

    Ejemplo para una tabla lx c = 2 x 2

    2 x 2 = 1+ (l-1)+(c-1)+(l-1)(c-1) = 1+2-1+2-1+(2-1)(2-1)=1+1+1+1=4

    gr.l.

    (2-1) (2-1) = 2 x 2 [1+ (2-1)+(2-1)]= 1

    1 x 1 = 2 x 2 1 1 1 = 1.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    24/180

    24

    2.4. DESCOMPONIENDO TABLAS Y TEST DE BONDAD DE AJUSTE.

    2.4.1. Por qu descomponer la tabla y el test de ji cuadrado?

    Por varios motivos:

    1. El principal, es el de rastrillar dnde se encuentran los principales puntosde apoyo al resultado del test. Y, ello obviamente supone formas de evaluar esospuntos de apoyo.

    2. El segundo, es que si bien puedo rechazar a nivel global el test, en un ejemplodado cualquiera, puedo reconocer que a nivel de ciertas regiones de la tabla tengorelaciones entre las categoras de las dos variables en cuestin, que son apreciables.

    2.4.2. Como lo puedo hacer?: DE VARIAS MANERAS.A partir del siguiente ejemplo, donde se examina la relacin entre la Condicin

    de actividad econmica y el acuerdo o desacuerdo con la aplicacin de golpes a losnios para disciplinarlos (Lo trae SPSS!!!), veremos hasta dnde podemos llegar conlas estimaciones de probabilidades conjuntas y condicionales, y cmo los diferentestipos de residuos pueden ayudarnos a explorar nuestros datos.

    No es una teora, es slo un ejemplo forzoso de cmo recuperar la informacinuna vez que el experimento ya pas. Nuestro punto de partida es la siguientehiptesis:

    Existe una cierta asimetra en las preferencias de los adultos por el mtodo de

    disciplinamiento de los nios dada su condicin de actividad.

    De manera intuitiva esta hiptesis sostiene que cunto se est ms lejos de los nios se

    prefiere un mtodo disciplinario diferente a cunto ms cerca de ellos se est.

    O en palabras mundanas, quin est mas cerca de ellos en el hogar sera mas blando

    que quien trabajara todo el da fuera del hogar.

    2.4.2.a Arrancando con lo que sabemos...

    La tabla 1 tiene las frecuencias observadas, La tabla 2 estima las frecuencias esperadas. No se detenga en el test de bondad de ajuste ahora, haga como que no lo tiene. La tabla 3 acerca la probabilidad conjunta, cunto es la probabilidad conjunta

    esperada? Haga el ndice de disimilaridad Se aproximan los ejemplos a la independencia segn hiptesis?

    Siga adelante, si slo tuviera las tablas 4 y 5... qu observa respecto de lahiptesis de independencia?

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    25/180

    25

    UN EJEMPLO CONMOVEDOR:GOLPEAR A LOS NIOS PARA DISCIPLINARLOS POR CONDICION DEACTIVIDAD DEL ENTREVISTADO.

    TABLA 1: FRECUENCIAS OBSERVADAS

    Golpear a losnios paradisciplinarlos

    Condicin de actividadFulltime Part time Desocup Retirado Cuidado

    de hogarTotal

    Muy deacuerdo

    102 28 11 47 28 216

    DeAcuerdo

    254 55 29 75 71 484

    EnDesacuerdo

    100 28 11 25 26 190

    Muy en

    desacuerdo

    33 10 4 7 10 64

    Total 489 121 55 154 135 954

    Chi-Square TestsValue Df Asymp. Sig. (2-sided)

    Pearson Chi-Square 9,788 12 ,635Likelihood Ratio 9,568 12 ,654Linear-by-Linear Association 1,460 1 ,227N of Valid Cases 954a 1 cells (5,0%) have expected count less than 5. The minimum expected count is 3,69.

    TABLA 2: FRECUENCIAS ESPERADAS

    Golpear a losnios paradisciplinarlos

    Condicin de actividadFulltime Part time Desocup Retirado Cuidado

    de hogarTotal

    Muy deacuerdo

    110,7 27,4 12,5 34,9 30,6 216

    DeAcuerdo 248,1 61,4 27,9 78,1 68,5 484EnDesacuerdo

    97,4 24,1 10,9 30,7 26,9 190

    Muy endesacuerdo

    32,8 8,1 3,7 10,3 9,1 64

    Total 489 121 55 154 135 954

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    26/180

    26

    TABLA 3: PROBABILIDADES CONJUNTAS (% del Total )

    Golpear a losnios paradisciplinarlos

    Condicin de actividadFulltime Part time Desocup Retirado Cuidado

    de hogarTotal

    Muy de

    acuerdo

    10,7 2,9 1,2 4,9 2,9 22,6

    DeAcuerdo

    26,6 5,8 3,0 7,9 7,4 50,7

    EnDesacuerdo

    10,5 2,9 1,2 2,6 2,7 19,9

    Muy endesacuerdo

    3,5 1,0 ,4 ,7 1,0 6,7

    Total 51,3 12,7 5,8 16,1 14,2 100,0 %

    TABLA 3b : PROBABILIDADES CONJUNTAS ESPERADAS (% del Total )

    Golpear a losnios paradisciplinarlos

    Condicin de actividadFulltime Part time Desocup Retirado Cuidado

    de hogarTotal

    Muy deacuerdo

    11,6 2,9 1,3 3,7 3,2 22,6

    DeAcuerdo

    26,0 6,4 2,9 8,2 7,2 50,7

    EnDesacuerdo 10,2 2,5 1,1 3,2 2,8 19,9

    Muy endesacuerdo

    3,4 0,8 0,4 1,1 1,0 6,7

    Total51,3 12,7 5,8 16,1 14,2 100,0

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    27/180

    27

    PROBABILIDADES CONDICIONALES

    TABLA 4: % SEGN CONDICION DE ACTIVIDAD

    Golpear a los

    nios paradisciplinarlos

    Condicin de actividad

    Fulltime Part time Desocup Retirado Cuidadode hogar Total

    Muy deacuerdo

    20,9 23,1 20,0 30,5 20,7 22,6

    DeAcuerdo

    51,9 45,5 52,7 48,7 52,6 50,7

    EnDesacuerdo

    20,4 23,1 20,0 16,2 19,3 19,9

    Muy endesacuerdo

    6,7 8,3 7,3 4,5 7,4 6,7

    Total 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%

    TABLAS 5: % POR GOLPEAR A LOS NIOS PARA DISCIPLINARLOS

    Golpear a losnios paradisciplinarlos

    Condicin de actividadFulltime Part time Desocup Retirado Cuidado

    de hogarTotal

    Muy deacuerdo 47,2 13,0 5,1 21,8 13,0 100,0%

    DeAcuerdo

    52,5 11,4 6,0 15,5 14,7 100,0%

    EnDesacuerdo

    52,6 14,7 5,8 13,2 13,7 100,0%

    Muy endesacuerdo

    51,6 15,6 6,3 10,9 15,6 100,0%

    Total 51,3 12,7 5,8 16,1 14,2 100,0%

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    28/180

    28

    2.4.2.b Aplicando los diferentes tipos de RESIDUOS.

    Como en el anlisis de regresin - en el curso anterior- el anlisis de los residuos esimportante porque conduce a la inspeccin visual o grfica de cmo ajustan los datos

    a la hiptesis con la cual queremos representar la informacin.Las siguientes varias formas de proceder nos aportan la contribucin por celda a labondad de ajuste de la hiptesis que proponemos y los datos que obtuvimos en nuestramuestra.

    1) La forma mas elemental es el examen de los residuos no estandarizados. Comovimos ellos nos aportan un signo, que al indicar sobre o sub representacin en la celdaseala una direccin asociativa en ella. Pero no olvidemos que la suma de todos ellos esigual a 0. Este residuo nos la aporta el SPSS y podemos pedirle una tabla con ellos. Tabla6.

    TABLA 6: RESIDUOS NO STANDARIZADOS (fo-Fe)

    Golpear a losnios paradisciplinarlos

    Condicin de actividadFulltime Part time Desocup Retirado Cuidado de

    hogarMuy deacuerdo

    -8,7 ,6 -1,5 12,1 -2,6

    DeAcuerdo

    5,9 -6,4 1,1 -3,1 2,5

    EnDesacuerdo

    2,6 3,9 ,1 -5,7 -,9

    Muy endesacuerdo

    ,2 1,9 ,3 -3,3 ,9

    2) Una segunda forma es la estimacin porcentual de la contribucin de cadacelda al test de bondad de ajuste. En este caso tenemos los residuos cuadratizadosestandarizados por su valor esperado en el caso del test X2, Tabla 7 (o bien podramoshaber hecho el producto del valor observado por el Ln del cociente entre los valoresobservados y los esperados en el caso de G2) (Hgalo en casa con la frmula de la tablapp14!!). La Tabla 8 indica el peso en la contrinucin al test X2 de cada celda.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    29/180

    29

    TABLA 7: RESIDUOS CUADRATIZADOS: (fo-Fe)2 /Fe

    Golpear a losnios paradisciplinarlos

    Condicin de actividadFulltime Part time Desocup Retirado Cuidado dehogar

    Muy deacuerdo

    ,64 ,01 ,16 4,41 ,25

    DeAcuerdo

    ,16 ,64 ,04 ,16 ,09

    EnDesacuerdo

    ,09 ,64 ,009 1 ,04

    Muy endesacuerdo

    ,001 ,49 ,04 1 ,09

    TABLA 8: PROPORCIONES DE LOS RESIDUOS CUADRATIZADOS EN X2

    Golpear a losnios paradisciplinarlos

    Condicin de actividadFulltime Part time Desocup Retirado Cuidado de

    hogar

    Muy deacuerdo 0,06 0,00 0,02 0,44 0,03De

    Acuerdo 0,02 0,06 0,00 0,02 0,01EnDesacuerdo 0,01 0,06 0,00 0,10 0,00Muy endesacuerdo 0,00 0,05 0,00 0,10 0,01

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    30/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    31/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    32/180

    32

    2.5. APLICANDO LOS ODDS.

    Otra forma alternativa y muy usual -cuando puedo establecer qu variable es ladependiente (o explicada o resultado), y qu variable es la independiente (oexplicativa)- es el ejemplo de los odds, momios chances ventajas .

    Ya vimos que un odd, o chance, es una forma de estimacin de la ventaja proporcionalentre combinaciones de celdas que nos interesan.Podemos fijar un par de celdas que nos interesen como base de comparacin, es decir unodd o chance, y comparar todos los pares de celdas correspondientes de las mismascategoras a travs de las otras tantas categoras. Y extraer una conclusin.

    Ejemplo:Veamos la reproduccin con colores de la tabla 1 de esta seccin:El odd de preferir metodos duros de disciplinamiento (muy de acuerdo en golpear a losnios para disciplinarlos) frente a mtodos blandos (muy en desacuerdo en golpear a losnios para disciplinarlos) para quienes hacen los cuidados del hogar es 2,80 (28/10).Mientras que entre los activos full time es 3,09.Claramente podemos apreciar que los activos son algo ms duros en el disciplinamientoque quienes estn a cargo de los cuidados del hogar, y por ende ms cerca de los nios, sibien no puede negarse que ambos grupos de personas comparten la tendencia dura en eldisciplinamiento de los nios.El odds ratio, la razn de momios, o ventaja relativa, tomando como base decomparacin (baseline en la jerga) a quienes hacen los cuidados del hogar, es 1,10 = (3,09/ 2,80).En los hechos hicimos una sub-tabla dicotmica, que arroja un ndice de asociacin bienbajo y cercano a la independencia como ya vimos antes.

    FRECUENCIAS OBSERVADAS (tabla 1)Golpear a losnios paradisciplinarlos

    Condicin de actividadFulltime Part time Desocup Retirado Cuidado

    de hogarTotal

    Muy deacuerdo

    102 28 11 47 28 216

    Deacuerdo

    254 55 29 75 71 484

    EnDesacuerdo

    100 28 11 25 26 190

    Muy endesacuerdo

    33 10 4 7 10 64

    Total 489 121 55 154 135 954

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    33/180

    33

    Los datos indican que no puede esperarse que tenga lugar una sustancial diferencia detendencia en los mtodos disciplinarios entre quienes se dedicaban a los cuidados del hogary quienes estaban empleados todo el da fuera del hogar. Pero qu pasa con los retirados ylos desempleados? Entonces este ejemplo podemos generalizarlo para todas las categorasde condicin de actividad...Y vemos que:

    Las preferencias por los mtodos de los que trabajan part time respecto de las de quieneshacen los cuidados del hogar, arrojan una razn de momios igual a 1!! ([28/10] / [28/10]).

    Las preferencias de los desocupados respecto de las de quienes hacen los cuidados delhogar, arrojam una razn de momios 0,98 = ([11/4] / [28/10]), muy cercana a 1!!!

    Y finalmente, las preferencias de los retirados respecto de las de quienes hacen los cuidadosdel hogar, la razn de momios es 2,398 = ([47/7] / [28/10]) !!!!.

    Vemos que en la base de comparacin la asociacin de condicin de actividad y mtodosde disciplinamiento no hay sustanciales diferencias en la preferencia por los mtodos paralos que estn en el hogar y los que estn fuera de l, porque casi todas las razones demomios son iguales a 1 o estn cercanas.Slo vemos diferencias en el caso de los retirados, pero ello nos sugiere otras cosas y no lapresencia en el hogar como fundamento para la distincin de las preferencias.Claramente en cualquier caso que introduzcamos la celda de los retirados siempre ellosestarn, tal vez, por razones de otra formacin cultural, mas decididos aldisciplinamiento mas duro en comparacin con los dems grupos de condicin deactividad.

    Como vemos tuvimos 4 odds ratio, es decir 5-1 categoras de la tabla en este caso, si lohiciramos en el otro sentido tendramos 3 odds ratios, tambin 4-1.

    CONCLUSIN: SI SLO HUBIRAMOS VISTO LA BONDAD DE AJUSTE (ELTEMIBLE CHICUADRADO, Y/O SUS COEFICIENTES) HABRAMOSDESECHADO LA TABLA BUSCANDO SLO ASOCIACIN... PERO VEMOS QUE:

    EL MODELO DE INDEPENDENCIA AJUSTA A LOS DATOS. ES DECIR NO HAYMAYOR DIFERENCIA ENTRE ESTAR CERCA DE LOS NIOS Y LA CONDICINDE ACTIVIDAD, Y QUE LAS CELDAS QUE S REFLEJAN ASOCIACINAPORTAN UNA INFORMACIN SIGNIFICATIVA SUBYACENTE, OLOCALIZADA, EN UNA REGIN DE LA TABLA: LOS RETIRADOS: ELLOSTIENEN UNA VISIN DIFERENTE, QUE NO AJUSTA A LOS DATOS. SIN DUDATUVIERON OTRA FORMACIN O CULTURA Y SON CLARAMENTEPARTIDARIOS DE LOS METODOS DUROS.COMO VEMOS RASTRILLANDO ADECUADAMENTE PESE A NO PODER

    SOSTENER UNA TEORA COMO LA INICIAL, NO SE TIRA LA BAERA CON ELNIO DENTRO.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    34/180

    34

    En este ltimo ejemplo de anlisis usamos pares de odd ratios condicionales, sinnecesariamente fijarlos.Cuando los fijamos esos odds ratios se les llaman local odds ratios. Los modelosloglineares fijan los odds ratios.

    Los modelos de regresin logistica, como se ver mas adelante en otro curso, no lo hacen

    as, permitiendo la comparacin de todas las combinaciones a travs de las categoras de lavariable independiente que interese.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    35/180

    35

    2.6. DESCOMPONIENDO TABLAS.

    Aplicando LAS PROPIEDADES DE JI CUADRADO, cuando tenemos una tablacomo las siguientes, podemos descomponerlas en tantas subtablas como grados de libertadtengamos en la tabla original, con tal de que la suma de los grados de libertad de las sub-tablas igualen ese total de grados de libertad.

    ATENTI: El test G

    2

    tiene una particin exacta en las subtablas que podamos elaborar,mientras que X2 de Pearson no la tiene.

    3 principios deben ser respetados:

    a. Cada una de las frecuencias observadas en las celdas de la tabla original debeaparecer en una y solo una de las subtablas posibles.

    b. Y que, el total marginal de cada sub-tabla debe aparecer como frecuencia en laotra o debe haber sido el total marginal de la tabla original.

    c. La tcnica no debe se aplicada mecnicamente, por mas que varios autores handetallado procedimientos. Para que los componentes sean analticamente tiles debeprecisarse consideraciones tericas substantivas (Silva, 1990).

    Ejemplo 1 de Agresti y SPSS.

    SEXO IDENTIFICACIN POLITICA DE ELECTORES EN USADEMCRATAS INDEPENDIENTES REPUBLICANOS Total

    MUJERES 279 73 225 577

    HOMBRES 165 47 191 403

    Total 444 120 416 980

    El estadstico tiene G2 =7 con 2 gr.l, entonces esta tabla se puede partir en las siguientes 2sub-tablas A y B: cada una de ellas tiene 1 gr.l como indican las condiciones generales.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    36/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    37/180

    37

    Ejemplo 2 de Silva (1990).

    ORIGENSOCIAL

    POSICIN ACTUALRURAL MANUAL NO MANUAL Total

    RURAL 178 156 61 395

    MANUAL 7 80 40 127

    NOMANUAL

    12 40 75 127

    Total 197 276 176 649

    El estadstico tiene G2 =164,8 con 4 gr.l, entonces esta tabla se puede partir en lassiguientes 4 sub-tablas C, D, E, y F: cada una de ellas tiene 1 gr.l como indican las

    condiciones generales.

    POR QU?

    Silva (1990) asigna un significado explcito a cada una de ellas:

    Tabla C estima la significacin de la herencia intra-clase trabajadora; Tabla D estima la significacin de la movilidad ascendente; Tabla E estima la significacin de la movilidad descendente;

    Tabla F estima la significacin de la herencia interclases.

    TABLA C: HERENCIA INTRA CLASE TRABAJADORA

    ORIGENSOCIAL

    POSICIN ACTUALRURAL MANUAL Total

    RURAL 178 156 334

    MANUAL 7 80 87

    Total 197 276 421

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    38/180

    38

    TABLA D: MOVILIDAD ASCENDENTE

    ORIGENSOCIAL

    POSICIN ACTUALRURAL

    +MANUALNO MANUAL Total

    RURAL 334 61 395

    MANUAL 87 40 127

    Total 421 101 522

    TABLA: E MOVILIDAD DESCENDENTE

    ORIGENSOCIAL

    POSICIN ACTUALRURAL MANUAL Total

    RURAL+MANUAL

    185 236 421

    NOMANUAL

    12 40 52

    Total 197 276 473

    TABLA F: HERENCIA INTERCLASES

    ORIGENSOCIAL POSICIN ACTUALRURAL+MANUAL

    NO MANUAL Total

    RURAL+MANUAL

    421 101 552

    NOMANUAL

    52 75 127

    Total 473 176 649

    TABLA MODELO o COMPONENTE gr. L G2 %TotalC Herencia intra clase trabajadora 1 67* 40,7D Movilidad Ascendente 1 14,6* 8,8E Movilidad Descendente 1 9* 5,5F Herencia interclases 1 74,2* 45

    TOTAL 4 164,8* 100* pasa ,05

    Claramente no puede proponerse independencia o movilidad en las tablas C y F, es muysostenida la herencia en todas las clases; pero tampoco puede sostenerse la independencia

    para los ejemplos de movilidad D y E. En todo caso la movilidad a explorar no deja de estarafectada por la herencia de modo sustantivo.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    39/180

    39

    Lo que acabamos de ver puede entenderse, como muchos aspectos en la estadsticaaplicada, de dos formas por un lado hemos particionado el test de bondad de ajuste, peropor el otro hemos colapsado la tabla. En cada caso hemos claramente sacrificado gradosde libertad. Estos aspectos reunidos a las condiciones que observamos en esta seccin sonde utilidad para lo que veremos mas adelante en la elaboracin de modelos o hiptesis mscomplejas.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    40/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    41/180

    41

    ESQUEMA GENERAL DE TABLA MLTIPLE CON CONDICIONALES YMARGINALES

    FRECUENCIAS Y MARGINALES

    C (Nivel)k=1 k=2

    B (Columna) B

    j=1 j=2 St j=1 j=2 St

    A

    Fila

    i=1 n111 n121 n1+1 n112 n122 n1+2 n1++

    i=2 n211 n221 n2+1 n212 n222 n2+2 n2++

    St n+11 n+21 n++1 n+12 n+22 n++2N=n+++

    n+2+

    n11+ n+1+

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    42/180

    42

    PROBABILIDADES CONJUNTAS Y MARGINALES

    C

    k=1 k=2

    B B

    j=1 j=2 St j=1 j=2 St

    A i=1 p111 p121 p1+1 p112 p122 p1+2 p1++

    i=2 p211 p221 p2+1 p212 p222 p2+2 p2++

    St p+11 p+21 p++1 p+12 p+22 p++21= p+++

    p+2+

    p11+ p+1+

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    43/180

    43

    3.2. INDEPENDENCIA MUTUA.

    La definicin de independencia para dos variables puede fcilmente extrapolarse para elcaso de 3 variables:Sean A (filas), B (columnas), y C (nivel) 3 variables aleatorias nominales,

    cuyas probabilidades marginales genricas por categoras, son respectivamente:

    pi++, p+j+, y p++k

    Entonces de acuerdo a la hiptesis de independencia de la clase 1:la probabilidad conjunta esperada es igual al producto de las 3 probabilidades marginalescorrespondientes. Es en consecuencia nuestra hiptesis nula, y tiene la forma:

    H0 : pijk= pi++ * p+j+ * p++k (1)

    Cuando H0 es verdadera para todas las celdas de la tabla trivariada se dice que lasvariables A, B, y C, son mutuamente independientes. Se igualaron probabilidadesconjuntas observadas y esperadas, y las frecuencias observadas y esperadas, y obviamentesus respectivos saldos y residuos son nulos.Las Feijkse estiman en este caso tambin de forma anloga a la ya vista,

    y cuando H0 es verdadera, entonces:

    Feijk= N * pijk = N * {pi++ * p+j+ * p++k} (2)

    Con las estimativas MLE para

    pi++ = ni++ / N (3a); p+j+ = n+j+ / N (3b); y p++k= n++k/ N (3c)

    as sustituyendo en (2)

    Feijk = N * pijk

    = N * {pi++ * p+j+ * p++k}

    = N (ni++ / N) (n+j+ / N) (n++k/ N)= (ni++ * n+j+ * n++k) / N

    2 . (4)

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    44/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    45/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    46/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    47/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    48/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    49/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    50/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    51/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    52/180

    52

    Pero... los otros marginales bivariados estimados pueden variar libremente respectode los observados como es el caso de {^BC} respecto de {BC}.

    {^BC} = Fe+jk= Fe+11=50

    = Fe+21=50

    = Fe+12=50

    = Fe+22=50

    {BC} = n+jk = n+11=80

    = n+21=20= n+12=80

    = n+22=20

    En consecuencia entonces podemos sealar que el modelo correspondiente a la hiptesis deIndependencia Parcial, en este caso de variable nivel en relacin a lnea y columna noajusta a los datos. Y se escribe:

    {C} {AB}

    Nuevamente debemos re-iniciar nuestra bsqueda.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    53/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    54/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    55/180

    55

    FREC. ESPERADAS EN INDEPENDENCIA CONDICIONAL

    PROPIEDAD DE LOS MMPP {C}PROP NO PROP

    ESTRATO SOCIAL {B} ESTRATO SOCIAL {B}j=1 j=2 St j=1 j=2 St

    APOYOALGOBIERNO{A}

    i=1 48 12 60 7,2 28,8 36 96i=2 32 8 40 12,8 51,2 64 104St 80 20 100 20 80 100

    200100100

    Los clculos de la Bondad de ajuste son X2 =6,94 y G2 = 7,47, para 2 gr.l.Otra vez, aunque por menor margen, ambos test superan el valor crtico de 2 (5,99para 0,05), por lo que la H0 sobre Independencia Condicional no ajusta a los datos ydebe ser rechazada.

    La H0 de la independencia condicional en C supone fijar los marginales en las subtablas AC y BC - y consecuentemente en C que es fijo, pero advirtase que A y B

    tambin estn incluidos como C en los trminos de mayor orden.

    La tabla marginal {AC} estimada da:

    Ck=1 k=2

    A i=1 48 + 12 = 60 7,2 + 28,8 = 36 96i=2 32 + 8 = 40 12,8 + 51,2 = 64 104

    St 100 100 200

    Y no discrepa con la tabla marginal {AC} observada:

    Ck=1 k=2

    A i=1 44 + 16 = 60 4 + 32 = 36 96i=2 36 + 4 = 40 16 + 48 = 64 104St 100 100 200

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    56/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    57/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    58/180

    58

    3. Como se enunciara lo que hicimos hasta ahora?

    FORMATO DE TABLA Y NOTACIN CONVENCIONAL

    HIPOTESIS MODELO G2 p gr.l. ResultadoIndependencia Mutua {A}{B}{C} 96,22 ,00 4 Rechazo

    Independencia Parcial {AB}{C} 96,22 ,00 3 RechazoIndependencia Condicional {AC}{BC} 7,47 ,05 2 RechazoInteraccin ?????? ???? ??? 1 ?????

    4. Para solucionar esta dificultad de estimacin de las frecuencias esperadas en unmodelo que nos brindara mejor ajuste de las hiptesis y los datos, y para solucionar otrosproblemas como las paradojas de agregacin y nivel, existen los modelos Loglineares. Que

    resuelven las estimaciones necesarias, en base a la secuencia de hiptesis que vimos,aplicadas a algoritmos de clculo.

    Las paradojas de agregacin y nivel son viejas conocidas de la investigacin. Vimosdesde un inicio que no haba relacin, si sta se consideraba de manera unilateral entreestrato social y apoyo al gobierno, pero esa conclusin no resulta vlida una vez querechazamos la independencia mutua entre las 3 variables. No es lo nico que puede ocurrir.

    La conocida exploracin de la espureidad, en nuestra profesin es un ejemplo de

    ello cuando una relacin est disfrazada de asociacin.Pero tambin como lo ilustran Silva (1990) y Agresti (1996) puede ocurrir que lasagregaciones de subtablas sean inadecuadas -y como vimos los modelos las suponen-expresando asociaciones de sentido contrapuesto si se agregan o se desagregan los datos enfuncin de una u otra variable.

    IR A EJERCICIO 1 EN EXCEL!!

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    59/180

    59

    CLASE 4: APRENDIENDO A USAR UN ALGORITMO: IPFA (IterartiveProportional Fitting Algorithm) o Mtodo de Deming y Stephan.

    4.1. Presentacin.

    Como se seal en el ejemplo de la clase anterior no es posible obtener de modo directo el

    modelo de Interaccin Homognea, y por ello es necesario recurrir a un mtodo iterativo.Preferimos por sencillez el IPFA (Iterative Proportional Fitting Algorithm), tambinllamado por algunos IPFP o simplemente mtodo de Deming y Stephan (circa 1940) .Este mtodo es muy til para varios usos, en este captulo se mencionan slo algunos quedirectamente se vinculan con el objetivo del curso, pero hay otros varios.

    Cuando existen frmulas directas para estimar la hiptesis nula, como las 3 que vimos en elcaptulo pasado, deben preferirse al uso del IPFA, ya que como siempre cuando msclculos se hacen, si no se est muy entrenado, ms fcil es equivocarse. Por definicincuando hay frmulas directas la solucin se obtiene en 1 iteracin. Cuando no las hay esnecesario dar varios pasos de aproximacin.

    El IFPA (Algoritmo Iterativo de Ajuste Proporcional; o Iterative Proportional FittingAlgorithm). Es un mtodo iterativo de ajuste proporcional permite estimar lasprobabilidades o las frecuencias de las celdas de una tabla de contingencia cualquieradonde los marginales son conocidos y fijos.

    4.2. Aplicando IPFA a Tablas mltiples r*c*l.

    La solucin a nuestro problema anterior no tiene frmula que nos permita modelar laindependencia y entonces estimar el ajuste a los datos. Debemos aplicar IPFA y para ellodebemos definir una secuencia de pasos en las estimaciones de las frecuencias esperadas ylos marginales correspondientes.Ms adelante se presentan ejemplos de otros tipos, ms sencillos dada la cantidad devariables, pero en este caso para culminar con la expectativa enunciaremos la solucin.Como tenemos k (k=3) variables, y debemos reproducir todos los marginales de lassubtablas posibles debemos dar tantos pasos como variables tenemos. Cuando completamos

    los k pasos, cumplimos un ciclo, y reiniciamos el proceso. Nos detendremos cuandoalcancemos los valores previstos. Y cules son los valores previstos? Es necesario fijarse apriori un valor de convergencia para las celdas de la tabla y para los valores marginales,que segn sea el caso, son la suma de los anteriores, y que como ya vimos son los MLE. Osea que vamos a aproximarnos a los MLE y a reproducirlos. Las iteraciones se puedenreiterar ad infinitum, pero nos detendremos cuando los valores que obtengamos tengan unadiferencia mnima con los valores observados de celdas y marginales, por ejemplo 0,1 o0,01.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    60/180

    60

    La siguiente expresin sirve para proceder a estimar la hiptesis de interaccin homognea

    Fe(1)ijk= Fe(0)

    ijk [ n*ij+ / Fe

    (0)ij+ ]

    Fe(2)ijk= Fe(1)

    ijk [ n*i+k/ Fe

    (1)i+k]

    Fe(3)ijk= Fe(2)

    ijk [ n*+jk/ Fe

    (2)+jk]

    Fe(0)ijk=1;Fe(0)ij+>1;n*ij+, n

    *i+k, n

    *+jk,: son los marginales observados.

    Advierta que cada ciclo implica obtener las esperadas para una tabla marginal, comoen el ejemplo tenamos 3 variables, tendremos 3 tablas marginales.Como punto de partida iguala todas las frecuencias esperadas a 1 (Fe(0)ijk), y ponderapor el cociente entre el marginal observado correspondiente y el marginal

    correspondiente de frecuencia esperadaEn este primer ciclo del algoritmo ud. va a obtener 3 resultados que sucesivamente sereingresan al proceso de clculo. Repita hasta converger, es decir hasta que ladiferencia que espera para marginales de las tablas, o las Fe ijk de las celdas es inferioral lmite que se fij.

    Siga el ejemplo en ExcelIntroduzca la tabla del captulo anterior en forma arbolito una columna para cada variable,y la cuarta para las frecuencias. En las siguientes 3 columnas estime los marginales paracada una de las 3 tablas: fila y columna, colapsa nivel; fila y nivel, colapsa columna;columna y nivel, colapsa fila. Asgnelos a cada celda, recuerde que habr 2 iguales porcelda porque cada variable tiene 2 categoras. En la siguiente columna iguale (set) a 1 todaslas celdas. Los marginales de esa columna de esperadas sern todos iguales al nmero deceldas por fila, o por columna o por nivel. En este caso como las 3 variables tienen 2categoras (=2). Ahora estime nuevo el esperado como el producto de 1 por el cocienteentre el marginal fila columna y 2. Salve esa columna. Estime los nuevos marginales con lamisma regla que estim fila nivel. Estime el nuevo esperado reiterando el producto delestimado anterior y el cociente del marginal fila nivel observado y el fila nivel estimado.Salve el resultado. Estime los nuevos marginales con la misma regla que estim columna

    nivel. Estime el nuevo esperado reiterando el producto del estimado anterior y el cocientedel marginal columna nivel observado y el columna nivel estimado. Salve el resultado. Hacompleta un ciclo de 3 iteraciones. Reitere hasta converger al valor deseado.Luego estime la bondad de ajuste entre los valores obtenidos y el valor observado. Usecualquier test.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    61/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    62/180

    62

    Resultados.

    Para la primer hiptesis sabemos por teorema de independencia que laprobabilidad conjunta esperada es:

    (pij = pi+*p+j).

    T3 O-EProbabilidades conjuntas esperadas

    Origen Actual1 2 3 4 5 6 T

    1 0,208 0,104 0,154 0,120 0,041 0,023 0,6492 0,022 0,011 0,016 0,013 0,004 0,002 0,0693 0,030 0,015 0,022 0,017 0,006 0,003 0,0934 0,044 0,022 0,033 0,025 0,009 0,005 0,1385 0,010 0,005 0,007 0,006 0,002 0,001 0,0316 0,006 0,003 0,005 0,004 0,001 0,001 0,020T 0,3206 0,1606 0,2372 0,1843 0,0625 0,0348 1

    Para la segunda hiptesis se aplica IPFA para mostellerizar (ver seccinsiguiente), o sea igualar a todos los marginales entre s.La frmula para iterar es:

    pij1 = pij

    0 * (pi+& / p+j

    0),

    con la condicin que: pi+& = p+j

    & = 1;y el criterio de convergencia inferior a 0,001 para los marginales a estimar.

    T4 O-OProbabilidades conjuntas estandarizadas

    Origen Actual1 2 3 4 5 6 T

    1 0,0903 0,0339 0,0210 0,0140 0,0048 0,0027 0,1667

    2 0,0217 0,0531 0,0405 0,0252 0,0162 0,0099 0,16673 0,0118 0,0361 0,0573 0,0283 0,0206 0,0126 0,16674 0,0255 0,0225 0,0208 0,0422 0,0301 0,0256 0,16675 0,0118 0,0120 0,0156 0,0307 0,0554 0,0413 0,16676 0,0056 0,0090 0,0115 0,0264 0,0397 0,0746 0,1667T 0,1667 0,1667 0,1667 0,1667 0,1667 0,1667 1,0000

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    63/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    64/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    65/180

    65

    direccin de un marginal y luego el otro. Cada ajuste, en el sentido de la variable, sedenomina Paso. (Hay tantos pasos como variables en la tabla!) Se llama Ciclo a cada vezde dimos todos los pasos (ajuste) en c/u de las variables de la tabla.

    A cada ajuste de las frecuencias al marginal de una variable, desajustamos lasfrecuencias respecto del marginal de la otra variable, pero notaremos que cada desajuste esmenor que en el paso previo. Sucesivamente volveremos a ajustar los marginales para cada

    variable, reiterndose un nmero finito de veces los pasos y los ciclos hasta que seconverge a una distribucin en la tabla que satisface a los marginales que nos propusimos(en este caso 1).

    Como se trata de un mtodo iterativo, la convergencia no es igualacin exacta sinouna aproximacin confiable. Para esta convergencia en general se fija a priori un valorde convergencia o muy pequeo y menor a la unidad (0,001, por ejemplo). Laconvergencia es sobre una diferencia mnima y despreciable a nuestros fines. La prueba dela convergencia se encuentra en Fienberg (1970).

    4.4.2. Formalizacin:p*i+ y p

    *+j sern nuestros marginales fijos a priori.

    Entonces : p*i+ = p*

    +j = 1 (1)

    Y tenemos nij observaciones en la celda ij de manera que:

    nij = N.

    i jPartiremos de los valores iniciales de las frecuencias de la tabla que queremos estandarizarporcentualizndolas en relacin a N (es decir tomando la probabilidad conjunta) as:

    p(0)ij = nij / N ij (2)

    De manera genrica en el m-simo paso (m 1) se toma:

    p(m)

    ij = p(m-1)

    ij [ p*

    i+ / p(m-1)

    i+] ij (3)pero como p*i+ es fijo por restriccin y en este caso es igual a 1, entonces:

    p(m)ij = p(m-1)

    ij / p(m-1)

    i+ ij (4)

    La iteracin recomienza cada vez que se vuelve a (3) para cada conjunto deprobabilidades (condicionales) de cada variable, y finalizar cuando dos conjuntossucesivos de probabilidades en las celdas sean suficientemente semejantes. O sea, los

    valores p(k)

    ij obtenidos en la k-sima iteracin satisfagan los totales marginalesfijados a priori. (En nuestro caso igualen a 1, con 0,001 de diferencia).

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    66/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    67/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    68/180

    68

    Ciclo 3:Paso 5

    Tabla 4.7Voto a

    partido

    Tipo de Ciudad

    PocoIndustrial MuyIndustrial p*i+Izquierda 0,336 0,664 1Derecha 0,669 0,331 1

    p+ 1,005 0,995

    Paso 6Tabla 4.8

    Voto a

    partido

    Tipo de Ciudad

    PocoIndustrial MuyIndustrial pi+Izquierda 0,334 0,667 1,001Derecha 0,666 0,333 0,999

    p*+j 1 1

    Ciclo 4:Paso 7

    Tabla 4.9

    Voto apartido Tipo de CiudadPocoIndustrial

    MuyIndustrial

    p*i+

    Izquierda 0,334 0,666 1Derecha 0,666 0,334 1

    p+j 1 1

    Se detiene la iteracin porque obtuvimos la restriccin de partida p*i+ = p*+j = 1

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    69/180

    69

    4.4.4. Interpretando.

    Con los resultados obtenidos en el paso 7 alcanzamos la restriccin para comparar losdatos y con ello se obtiene el ncleo de la asociacin. Seguidamente se divide toda latabla entre 2 (que es el tamao de la variable de ms categoras), y, se obtiene: laestimacin de la probabilidad conjunta subyacente a los datos en condiciones de marginales

    equiprobables.

    Voto apartido

    Tipo de CiudadPoco

    IndustrialMuy

    Industrial

    pi+Izquierda 0,167 0,333 0,500Derecha 0,333 0,167 0,500

    p+j 0,500 0,500 1

    Esto permite reconstruir la tabla en trminos de los marginales equiprobables ya queFeij = pij

    (7) * N.

    Voto apartido

    Tipo de CiudadPoco

    IndustrialMuy

    IndustrialTotal

    Izquierda 9,5 19 28,5Derecha 19 9,5 28,5

    Total 28,5 28,5 57

    Qu vemos? Advertimos que todos los estadsticos utilizados basados en los marginales varan

    sustancialmente entre la tabla original y la estandarizada: Por ejemplo para la tablaestandarizada la X2: 6,333, el valor mximo que puede alcanzar en los datos;mientras que en los observados fue X2: 5,257.

    Atendiendo a la razn de ventajas relativas, las chances de votar a la izquierda es casi4 veces menor en ciudades poco industrializadas que en las muy industrializadas, y

    lo inverso es vlido para votar a la derecha. Y que la Mostellerizacin, o estandarizacin, mantuvo la razn de chancesvista en la tabla inicial 0,251.

    El algoritmo de estandarizacin descrito arriba tiene la importante propiedad de noalterar la relacin inherente a los datos. Por ello es un procedimiento fundamentalcuando se quiere comparar la asociacin en tablas provenientes de muestras de variospases y diferentes tamaos, o de una misma poblacin en diferentes pocas. Puedeser generalizado a tablas con cualquier nmero de filas y columnas, y tambin paratablas de cualquier nmero de variables.

    Importante: Los autores que sostienen esta posicin de invariancia marginal sonproclives a desarrollar enfoque basados en la chance relativa, o razn demomios.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    70/180

    70

    CLASE 5: INTRODUCCION AL ANALISIS LOGLINEAR.

    5.1. DEFINICION

    Es recomendable el Anlisis Loglinear cuando se desarrolla un estudio que usa ms de dos

    variables nominales que se supone estn relacionadas.La idea principal es encontrar un modelo que mejor represente nuestros datos.Esto quiere decir una frmula que permita explicar el conjunto de relaciones entre lasvariables en cuestin de la manera ms simple posible.

    5.1.1. Propsito.

    Cuando tenemos ms de dos variables no es sencillo explorar las asociaciones entre ellas.

    Es inconveniente pensar que slo con sostener asociacin frente a independencia en losdatos es suficiente. Y como vimos en la clase 4 es necesario explorar varios modelos dehiptesis sobre la independencia.Loglinear es una tcnica de estimacin de los parmetros de las variablesinvolucradas al mismo tiempo (sus efectos principales y las diversas interaccionesentre ellas) en funciones que predicen resultados. A partir de esos resultados seaplican las tradicionales pruebas de bondad-de-ajuste.

    El algoritmo usado (14) genera las frecuencias esperadas para las celdas de cada modelo ylas estadsticas de bondad de ajuste.La estadstica preferida por los programas, y la bibliografa mas recibida, es la Raznde Verosimilitud nombrada generalmente como G2 (aunque SPSS la nombra como L2).La estadstica X2 (tambin conocida como Ji cuadrado de Pearson), tambin se incluye enlos paquetes pero existen divergencias entre los autores en el aprecio de su virtudmultivariada, porque sealamos que ella no es particionable de manera proporcional para elconjunto de modelos posibles entre las 3 o ms variables que nos pueden interesar. Esteaspecto es importante como veremos mas adelante, pero de momento es slo necesariorecordar las propiedades de 2 para su descomposicin (ver clase 2).

    5.1.2 Ventajas de Usar LoglinearHay dos ventajas para usar el Anlisis Loglinear:

    proporciona una aproximacin sistemtica al anlisis de tablas multidimensionales ycomplejas;

    proporciona estimaciones de la magnitud de los efectos que nos interesan, porconsiguiente ello permite juzgar la importancia relativa de diferentes efectos encuestin.

    14Segn los paquetes estadsticos sern: elIPFA (Iterative Proportional Fitting, tambin llamado mtodo de Deming y Stephan), que yavimos como se aplica; elNewton-Raphson.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    71/180

    71

    5.2. BASE CONCEPTUAL

    5.2.1 La Idea Bsica:

    La tarea principal en Loglinear es buscar los modelos que mejor ajustan a los datos.Para esto se necesita especificar modelos, y luego compararlos entre s.

    El Anlisis de Loglinear consiste en un procedimiento anlogo al Anlisis de la Varianza(ANOVA) y al de Regresin Mltiple. A cada conjunto de variables que especifico parapredecir los datos se le denomina modelo, y no es ms que una hiptesis sobre estos.

    La idea inicial fue propuesta Goodman (1965) para una tabla bivariada, con ello queraenunciar una funcin de prediccin de las celdas, que le permitiera estimar las frecuenciasesperadas bajo ciertas condiciones. Procediendo de manera anloga a la formulacin delmodelo ANOVA.Sostuvo este autor que las Feij de cada celda en la tabla podran estimarse como la

    funcin linearizada- de un conjunto de parmetros indicativos de las variablesconsideradas y las relaciones entre ellas.Concretamente el producto de un conjunto de factores: el total de casos de la tabla, delefecto fila, del efecto columna, y del efecto de pertenecer a fila y columna.As, por ejemplo, tratndose de una tabla de dos variables habra 4 trminos eninvolucrados:

    Feij= N (f) (c) (fc)

    Que habitualmente se representan en su forma multiplicativa como:

    ij=G

    F

    C

    FC(1)

    con:

    G: la media geomtrica de casos en la tabla(

    15)

    F: Efecto filas

    C: Efecto columnas

    FC

    : Efecto filas y columnas (casos que pertenecen simultneamente a filas y columnas).

    Quienes gustan de desarrollar este anlisis dentro de la perspectiva multiplicativa,representan a los parmetros de los efectos por medio de las letras tau ().Pero, como el clculo multiplicativo es mas dificultoso de desarrollar manualmente, elproducto se transforma en una igualdad lineal de base logartmica, y lo anterior puedeformularse como una suma ta como propuso Goodman inicialmente:

    LnFe= Ln M + Ln (f)+ Ln (c)+Ln (fc) (2)

    15La media geomtrica es la raz ensima de un producto de n nmeros. Ejemplo en una tabla 2x2 el valor es la razcuarta del producto de las 4 frecuencias; en una tabla de 2x3 es la raz sexta del producto de las frecuencias de las 6 celdas.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    72/180

    72

    De ah su denominacin de log lineal: es una expresin no lineal vuelta lineal en suslogaritmos. No obstante, es posible reconocer en la bibliografa el uso alternativo de las dosdenominaciones al referirse a este procedimiento de anlisis: modelo Loglinear o modelomultiplicativo (16).

    Para simplificar la representacin de cada trmino del lado derecho de la funcin,sin tener que mencionar a los Ln cada vez, Goodman sugiri la letra lambda (), losndices (que no son potencias en este caso) para identificar cada variable, y lossubndices para identificar las categoras. (Es posible que en los diversos libros seprefieran otras letras a los lambdas por razones de practicidad). En nuestro ejemplobivariado:

    LnFeij= N

    + F+

    C+

    FC(3)

    N

    : Log natural de media geomtrica de N

    F: Log natural de parmetro de casos fila

    C: Log natural de parmetro de casos columna

    FC

    : Log natural de parmetro de casos que pertenecen simultneamente a A y B.

    Entonces se trata de desarrollar modelos que estimen de manera genrica las Feij delas celdas.Veremos que casi siempre hay un modelo de partida que suele ser llamado modelosaturado, que ajusta a los datos, porque usa todos los parmetros posibles. El anlisisloglineal procurar obtener de manera genrica una estimacin del valor de cadacelda utilizando menos parmetros que el modelo saturado.Muchas veces se llama a esto suavizar (smooth) los datos. Es una tcnica queprocura entonces resumir los efectos presentes y simplificar la interpretacin de unconjunto complejo de datos.

    OJO! La analoga con ANOVA y con la regresin NO conlleva a que los parmetrosque se estiman sean coeficientes que multiplican los valores de las vars como en laregresin.

    16 El Ln es el exponente al cual sera necesario elevar a la constante 2,718.... para obtener otro nmero cualquiera.

    Algunas propiedades de los logaritmos naturales o neperianos, permiten transformar una relacin multiplicativa en unaaditiva, o lineal:ln(ab) = ln(a) + ln(b)ln(a/b) = ln(a) - ln(b)Si x = ab/c, entonces ln (x) = ln(a) + ln(b) ln(c)

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    73/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    74/180

    74

    B. El segundo modelo: ln Feij = G+ F (5)

    Este modelo significa que el log de la frecuencia esperada es la suma del ln N y del ln delefecto principal de la variable A (Filas). En otras palabras, representa el efecto principalde variable A en la ij-sima celda. La notacin corriente escribe este modelo como: [A]o{A}.

    Y su H0: C= FC=0 (6)

    Es decir que el ln del efecto de la variable B, y el ln de la asociacin de A y B, son iguales a0. (Nuevamente, si lo expresramos en el formato multiplicativo los efectos nulos seraiguales a 1).En el ejemplo del suicidio, corresponde a la hiptesis que sostuviera que el nmero desuicidios diarios es diferente cada da de la semana, pero es igual en cualquier estacindel ao (!!). Vea como al igual que en el modelo lineal se trata de una desviacin

    respecto del promedio general, condicionada por el da de la semana.

    C. El tercer modelo: ln Feij = G+C (7)

    Este modelo representa una situacin similar a la anterior, pero que seala que el log de lafrecuencia esperada este caso se debe al ln de N y del efecto principal de la variable B(columnas) en la ij-sima celda. La notacin corriente lo escribe como: [B] {B}.

    Y su H0: F= FC=0 (8)

    Es decir que el ln del efecto de la variable A, y el ln de la asociacin de A y B, son igualesa 0.Nuevamente en el ejemplo del suicidio, corresponde a la hiptesis que sostuviera queel nmero de suicidios diarios es igual cada da de la semana pero diferente segn laestacin del ao (!!). Aqu se trata de una desviacin respecto del promedio general,condicionada por la estacin del ao.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    75/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    76/180

    76

    El modelo saturado: Incluye todos los parmetros posibles, y tiene una propiedad importante: los

    valores esperados son iguales a los observados. Como incluye todos los parmetros de efectos posibles... ajusta perfectamente a los

    datos. Pero la asociacin es tan compleja que no puede pensarse en un modelo explicativo

    para el conjunto de las celdas sino en una propia explicacin para cada una de ellas.Ello se opone al objetivo general de encontrar un modelo explicativo genrico paratodas las celdas.

    En este caso no hay grados de libertad y el nmero de parmetros iguala el nmerode celdas (l x c) (Esto quiere decir que los us todos y note que por ende no hay H0).

    Hay otros modelos para la tabla bidimensional ms complejos y sofisticados queveremos mas adelante. Sirva como adelanto que la formulacin de loglin surgi apartir de lo que hoy se considera un caso especial, que luego fue generalizado. Yque lo trataremos luego.

    5.2.3 Restricciones.

    Como cualquier tcnica de anlisis Loglinear tiene restricciones, las mismas tienen el finde permitir la operacin de estimacin tanto manual como computacional; son sencillas sepueden expresar en va aditiva o multiplicativa, y es bueno tenerlas presentes.

    Algunos autores las denominan restricciones de normalidad y su interpretacin es clara.Expresadas estas restricciones de los parmetros a estimar para cada celda enlogaritmos deben sumar 0; y alternativamente en versin multiplicativa deben darproducto 1.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    77/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    78/180

    78

    5.2.4 Ejemplo de estimacin de las frecuencias esperadas en un modelo saturado 2x2.

    Integra organizaciones polticas (columnas)Decisin votar

    (Filas)1= Si 2= No Total

    1=Vot 689 298 987

    2=No vot 232 254 486

    total 921 552 1473

    Recuerde que en el modelo saturado fo=Fe, entonces los ln de las celdas son:

    Integra organizaciones polticasDecisin votar

    1= Si 2= No Media marginal

    1=Vot LnFe11:6,535 LnFe12: 5,697(LnFe11+LnFe12)/2:(5,697+6,535)/2=

    6,116

    2=No vot LnFe21:5,447 LnFe21:5,537(LnFe21+LnFe22)/2:

    (5,447+5,537)/2=

    5,492

    Media marginal

    (LnFe11+LnFe21)/2:

    (6,535+5,447)/2=5,991

    (LnFe12+LnFe22)/2:

    (5,697+5,537)/2=5,617

    Gran media de logs de

    celdas

    (LnFe11+LnFe12+LnFe21

    +LnFe22) / 4:

    (5,697+6,535+5,447

    +5,537) / 4=

    5,804

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    79/180

    79

    Y la media de los logs de las celdas es el log de la media geomtrica: G

    Integra organizaciones polticasDecisin votar

    1= Si 2= No

    1=Vot Ln Fe11 =G +F1 +C1 +FC11 Ln Fe12 =G +F1 +C2 +FC12

    2=No vot Ln Fe11 =G +F2 +

    C1 +

    FC21 Ln Fe22 =

    G +F2 +C

    2 +FC

    22

    Los ln de los marginales fila o columna son las medias aritmticas de las celdas porfila o columna:

    Ln Fe1+ ={(G

    +F

    1 +C

    1 +FC

    11)+(G

    +F

    1 +C

    2 +FC

    12)} / 2 (15)

    Aplicando las restricciones 12, 13, y 14 es fcil sustituir ver que:

    Ln Fe1+ =2 G

    +2 F

    1 -C

    2 +C

    2 +FC

    12 -FC

    12 / 2 = 2(G

    + F

    1) / 2 =G

    + F

    1 (16)

    En consecuencia de manera general:

    )23(LnMLnFe

    )22(LnMLnM

    )21(LnMLnM

    :asi

    )19(cl/LnFeLnM

    )18(c/LnFeLnM

    )17(l/LnFeLnM

    Cj

    Fiij

    FCij

    jC

    j

    iFi

    l

    1i

    c

    1j

    ij

    c

    1j

    ijj

    l

    1i

    iji

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    80/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    81/180

    81

    Tambin puede expresarse la estimacin anterior en su versin multiplicativa apoyada enlos momios y razones de momios. Esta mayor simplicidad es preferida por muchos textosbsicos.

    Integra organizaciones polticas (Columnas)Decisin

    votar(Filas)

    1= Si 2= No

    1=Vot Fe11 =GF1

    C1

    FC11 Fe12 =

    GF1C

    2FC

    12

    2=No vot Fe21 =GF2

    C1

    FC21 Fe22 =

    GF2C

    2FC

    22

    G= (fo11 fo12 fo21 fo22)1/4 (24)

    F1 =1 /F

    2 = (fo11 fo12)1/2 /G= (fo11 fo12)

    1/2 / (fo11 fo12 fo21 fo22)1/4 (25)

    C1 =1 /C

    2 = (fo11 fo21)1/2 /G= (fo11 fo21)

    1/2 / (fo11 fo12 fo21 fo22)1/4 (26)

    FC

    11 = FC

    22 = 1 /FC

    12 = 1 /FC

    21 = (fo11 fo22/ fo12 fo21)1/4 (27)

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    82/180

    82

    )32(gm)xFexFexFeFe(finalmentey

    )31()()xFeFe/xFeFe(

    )30()()xFeFe/xFeFe(

    )29()()xFeFe/xFeFe(

    :as,esestimacion

    lastodasdeducenserelativaschanceslasdesdequelopor

    Fefosaturadoelomodelenpero

    )28()()xFeFe/xFeFe(

    quelopor

    /

    :dadosustituyenque

    xFeFe/xFeFe

    :esesperadarelativachanceLa.4

    4/122122111

    4/1B22122111

    4/1A22211211

    4/1AB21122211

    4/1AB21122211

    AB21

    AB12

    AB22

    AB11

    AB

    21122211

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    83/180

    83

    Clase 6: El Modelo Trivariado.

    6.1. Hiptesis y modelos.

    Consideremos ahora una tabla de contingencia con 3 variables: A (filas) B (columnas) y C

    (nivel). Para esta tabla tendramos mas modelos que en el caso anterior, a los cualescorresponden sus hiptesis formales o nulas. Recordando el desarrollo de la clase 4 vemosque tenemos la secuencia de hiptesis de: independencia mutua, independencia parcial,independencia condicional, interaccin homognea y modelo saturado.Nuevamente a cada modelo corresponde un tipo de formulacin (especificacin) de losefectos que estaran determinando el valor de la Feij , y consecuentemente, un tipo dehiptesis nula (H0).

    Sean :

    G: ln de la media geomtrica del nmero de casos.

    F.: ln del parmetro de efecto fila o variableA.

    C: ln del parmetro de efecto columna o variable B.

    R: ln del parmetro de efecto nivel o variable C.

    FC: ln del parmetro de efecto de asociacin fila (A) y columna (B).

    FR: ln del parmetro de efecto de asociacin fila (A) y nivel (C).

    CR

    .: ln del parmetro de efecto de asociacin columna (B) y nivel (C).

    FCR: ln del parmetro de efecto de asociacin fila (A), columna (B) y nivel (C).

    A. Modelo de Independencia Mutua:

    ln Feijk= G+ F+ C+R (1)

    y su H0: FC=CR=FR=FCR=0 (2)

    Este es el modelo sin asociacin entre las variables. Es decir que todos los efectosasociativos de las variables A B y C, son iguales a 0. (Si lo expresamos en el formatomultiplicativo los efectos nulos sera iguales a 1 ).Y se escribe {A}{B}{C}

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    84/180

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    85/180

    85

    E. El Modelo Saturado:

    ln Feijk= G+ F+ C+R+FR+CR+FC+FCR (10)

    El modelo de saturado incluye todos los efectos posibles. El modelo saturado incluye

    todos los parmetros posibles, y los valores esperados son iguales a los observados, por elloajusta perfectamente a los datos.

    Es un modelo que expresa asociaciones no homogneas de dos de las variables a travsde la tercera variable de inters.Pero la asociacin es tan compleja que no puede pensarse en un modelo explicativo para elconjunto de las celdas sino en una propia para cada una de ellas, lo cual se opone alobjetivo general de encontrar un modelo explicativo mas sencillo para todas las celdas.En este caso no hay grados de libertad y el nmero de parmetros iguala el nmero de

    celdas (l x c).

    6.2. RESTRICCIONES PARA EL MODELO TRIVARIADO.

    )13(0

    varint.3

    )12(0

    varint.2

    )11(0

    .1

    ===

    ======

    ===

    k

    FCL

    ijk

    j

    FCL

    ijk

    i

    FCL

    ijk

    k

    CL

    jk

    j

    CL

    jk

    k

    LF

    ik

    i

    LF

    ik

    j

    FC

    ij

    i

    FC

    ij

    L

    k

    C

    j

    F

    i

    iadatrieraccinlaPara

    iadasbieraccionesPara

    sprincipaleefectosPara

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    86/180

    86

    6.3. COMO SE HACE?

    6.3.1. La Jerarqua.

    Como puede verse, los modelos se construyen en relacin unos con otros, segn nuestrosobjetivos de investigacin, y al igual que en el ANOVA la inclusin de efectos de orden

    ms altos presuponen la inclusin de sus efectos del orden ms bajos correspondientes (lassucesivas interacciones incluyen a los efectos principales). Por eso aqu slohablaremos de modelos loglineares jerrquicos. Los modelos jerrquicos son unavariante completa de los modelos anidados.

    6.3.2 La Bondad de ajuste.

    Ajustado a los datos significa que un modelo es capaz de reproducir los datos

    observados con el menor nmero de parmetros que sea posible.Entonces lo que busca el Anlisis Loglinear es un modelo, que mejor reproduzca losdatos observados, con el menor nmero de parmetros que sea posible. Y ser aquelmodelo en el que las frecuencias esperadas igualen a las observadas, o la diferencia(residuo) entre ambas sea mnima y casi despreciable (17) .

    6.3.3 Suficiencia y Parsimonia.

    Cuando se evala el ajuste de los modelos a los datos, generalmente se usan 2 criterios:

    suficiencia y parsimonia (parsimony) (tambin llamada simplicidad).Usualmente un modelo es considerado adecuado si su nivel de significacin es superior a0,05, y se acepta la hiptesis nula. Alternativamente, tambin puede ser consideradoadecuado un modelo cuando su valor de G2 ( L2) es aproximadamente igual a sus gradosde libertad. Sin embargo, slo el modelo que considera ms efectos en los datos, y que almismo tiempo es el ms parsimonioso (simple), puede ser considerado como el modelomejor. En definitiva el modelo ms simple es el que tiene menor nmero de efectos ycombinaciones de stos.

    17En general uno puede fijar esta cantidad mnima de convergencia entre las fo y Fe en los comandos respectivos, en todos los paquetesestadsticos convencionales. No quiere decir que los residuos que uno acepte sern iguales en cada celda, sino que no sern en ningn

    caso superiores a dicha cantidad. El algoritmo opera hasta que todos los residuos sean inferiores a esa cantidad que se fija, o que est

    fijada por defecto en cada paquete.

  • 7/31/2019 Boado 2010 Mexico Loglin Todaslasclasesjuntas v3

    87/180

    87

    6.3.4 La Idea Bsica

    Es necesario comparar los diferentes modelos para determinar qu efectos son losresponsables de las diferencias entre las frecuencias observadas y esperadas. Es decirque siempre se tiene que comparar modelos que incluyen diferentes efectos, combinaciones de stos, para que se pueda determinar apropiadamente qu efecto

    tiene la mayor influencia.

    Como queda claro cada modelo es un hiptesis sobre cmo estn conformados los datos.

    Y el mismo modelo se aplica para la estimacin del LnFe de todas y cada una de las

    celdas, cada vez.

    La comparacin de los modelos estimados es sencilla: se hace tomando los modelos dea dos. Es decir se buscan las diferencias entre dos modelos.Cmo???Por un lado, se resta el valor de G2 ( L2) de uno del G2 ( L2) del otro; y por otro lado, seresta los grados de libertad de uno de los grados de libertad del otro. Entonces se evalanlas cantidades halladas (llamados, segn los autores G2, o residuos de G2, y de gr.l.)respecto de los valores crticos de la distribucin Ji Cuadrado.Si la diferencia no es significativa de acuerdo a la tabla Ji Cuadrado se siguen probandootros modelos hasta lograrla. Me detendr c