Memoria Francisco Javier Ros Castellón

download Memoria Francisco Javier Ros Castellón

of 106

Transcript of Memoria Francisco Javier Ros Castellón

  • UNIVERSIDAD DE GRANADA DEPARTAMENTO DE ESTADSTICA E INVESTIGACIN OPERATIVA

    Modelo Logit para el Estudio del Fracaso

    Escolar en ESO Mster en Estadstica Aplicada

    Francisco Javier Ros Castelln

    Granada, 2012

  • MODELO LOGIT PARA EL ESTUDIO DEL FRACASO ESCOLAR EN EDUCACIN SECUNDARIA

    OBLIGATORIA

    Trabajo Fin de Mster presentado por Francisco Javier Ros Castelln y

    realizado en el Departamento de Estadstica e Investigacin Operativa para

    optar al ttulo de Mster en Estadstica Aplicada.

    Granada, septiembre de 2012

    Francisco Javier Ros Castelln

    Profesor tutor

    Don Pedro Antonio Garca Lpez

  • TABLA DE CONTENIDOS

    INTRODUCCIN

    ALGO FALLA EN EL INSTITUTO .................................................................................................1

    OBJETIVOS DE ESTE TRABAJO FIN DE MSTER ............................................................................2

    ORGANIZACIN DE ESTA MEMORIA Y APORTACIONES...................................................................3

    PROBLEMAS ABIERTOS ..........................................................................................................4

    CAPTULO 1. FRACASO ESCOLAR EN EDUCACIN SECUNDARIA

    EL FRACASO ESCOLAR, UN ASUNTO PREOCUPANTE......................................................................6

    CUANTIFICACIN DEL FRACASO ESCOLAR ..................................................................................9

    CAPTULO 2. DESCRIPCIN DE LA BATERA BADyG-M RENOVADO Y LAS PRUEBAS DE

    EVALUACIN DE DIAGNSTICO (PED)

    SOBRE BADYG-M RENOVADO ............................................................................................. 13

    Descripcin de las pruebas ........................................................................................ 14

    Normas de correccin ............................................................................................... 19

    SOBRE LAS PRUEBAS DE EVALUACIN DE DIAGNSTICO (PED) .................................................... 22

    Competencias evaluadas ........................................................................................... 22

    Instrumentos utilizados ............................................................................................. 23

    CAPTULO 3. FUNDAMENTOS TERICOS

    MODELOS DE RESPUESTA DISCRETA ...................................................................................... 27

    Introduccin a los Modelos de Respuesta Binaria ...................................................... 28

    MODELOS LOGIT CON VARIABLES EXPLICATIVAS CUANTITATIVAS .................................................. 38

    Modelo de regresin logstica simple ........................................................................ 39

  • Modelo de regresin logstica mltiple ...................................................................... 41

    Modelos con interaccin ........................................................................................... 44

    Ajuste de modelos logit ............................................................................................. 46

    Inferencia en regresin logit ...................................................................................... 49

    Validacin y diagnosis de modelos logit ..................................................................... 56

    Seleccin de modelos logit ........................................................................................ 60

    CAPTULO 4. APLICACIN AL ESTUDIO DE LA PREDICCIN DE FRACASO ESCOLAR EN

    EDUCACIN SECUNDARIA OBLIGATORIA

    ESTUDIO DE LA CAPACIDAD PREDICTIVA DEL BADYG-M SOBRE EL FRACASO ESCOLAR ....................... 63

    Datos del estudio ...................................................................................................... 64

    Seleccin de variables y ajuste del modelo logit ........................................................ 70

    Parmetros del modelo ............................................................................................. 72

    Bondad de ajuste ...................................................................................................... 73

    Interpretacin del modelo ......................................................................................... 76

    Validacin y diagnosis ............................................................................................... 77

    Observaciones ........................................................................................................... 78

    ESTUDIO DE LA CAPACIDAD PREDICTIVA DE LAS PED SOBRE EL FRACASO ESCOLAR ............................ 79

    Datos del estudio ...................................................................................................... 80

    Seleccin de variables y ajuste del modelo ................................................................ 83

    Bondad del ajuste...................................................................................................... 84

    Observaciones ........................................................................................................... 86

    CONCLUSIONES FINALES ...................................................................................................... 86

    Anexo I

    Anexo II

    Bibliografa

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    1

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Introduccin

    ALGO FALLA EN EL INSTITUTO1

    ANDALUCA ARRASTRA UNA TASA DEL 34,7% DE ABANDONO EDUCATIVO TEMPRANO

    EL RETO ES MEJORAR EL RENDIMIENTO EN SECUNDARIA, QUE ES MS BAJO QUE EN LOS COLEGIOS

    MANUEL PLANELLES Sevilla 9 MAR 2012 - 14:24 CET

    Las seales estn ah, en las distintas evaluaciones a las que se somete el sistema

    andaluz de enseanza. El rendimiento de los estudiantes de los institutos es peor

    que el de los alumnos en los colegios. La ltima consecuencia de esta situacin

    lleva a que Andaluca sea la tercera comunidad autnoma con mayor tasa de

    abandono educativo temprano de todo el Estado. Este ndice es el porcentaje de

    poblacin de 18 a 24 aos que no ha completado la ESO y no sigue estudiando. La

    media espaola de abandono en 2010 el ao analizado por el ministerio era

    del 28,4. La de Andaluca estaba en el 34,7. El sistema funciona como una cadena:

    esos chicos que salen de las aulas sin titulacin son los que luego lo tienen ms

    complicado para encontrar un empleo al entrar en el mercado laboral.

    1 Artculo aparecido en ElPais.com el sbado 10 de marzo de 2012 Manuel Planelles. http://ccaa.elpais.com/ccaa/2012/03/09/andalucia/1331293691_414305.html

  • 2 UNIVERSIDAD DE GRANADA Objetivos de este Trabajo Fin de Mster

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Este artculo, aparecido en ElPais.com el pasado 9 de marzo de 2012, sirve para

    introducir la situacin actual en los centros de Educacin Secundaria y nos invita a

    reflexionar sobre lo que podemos aportar cada uno de nosotros para mejorar esta

    situacin.

    La Educacin es uno de los pilares bsicos de cualquier sociedad actual, por lo que el

    fracaso escolar es, sin lugar a dudas, un problema de primer orden, y muy

    especialmente en Espaa y ms concretamente en Andaluca. Adems, esta sensibilidad

    se ha visto favorecida por la aparicin de numerosos anlisis y estudios que intentan

    averiguar sus causas.

    Es por todo esto que, como docente en un instituto de Educacin Secundaria y alumno

    de este Mster en Estadstica Aplicada, he intentado aunar estos dos aspectos para

    intentar dar una propuesta de trabajo que pueda aportar un poco de luz sobre este

    problema. Qu podemos hacer para mejorar esta situacin en los institutos?

    Con este Trabajo Fin de Mster pretendemos ofrecer un mecanismo de deteccin precoz

    de alumnado con altas probabilidades de fracaso escolar para que los centros puedan

    articular mecanismos de actuacin preventivos que ayuden a paliarlo. Para ello nos

    basaremos, fundamentalmente, en una batera de test para medir las capacidades y

    habilidades acadmicas de los alumnos, conocida como BADyG-M Renovado; y en las

    Pruebas de Evaluacin de Diagnstico realizadas por la Consejera de Educacin de la

    Junta de Andaluca desde hace varios aos.

    OBJETIVOS DE ESTE TRABAJO FIN DE MSTER

    El objetivo principal de este trabajo es el estudio de la capacidad predictiva de la BATERA

    DE APTITUDES DIFERENCIALES Y GENERALES (BADYG-M RENOVADO) y las PRUEBAS DE

    EVALUACIN DE DIAGNSTICO (PED) sobre el fracaso escolar en alumnado de Educacin

    Secundaria Obligatoria. As, se pretende detectar, en base a estas pruebas, futuros casos

    de fracaso escolar, entendido ste como el abandono del sistema educativo sin la

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    3

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    consecucin del ttulo de Graduado en ESO, a fin de prevenirlo y establecer un plan de

    actuacin con el alumnado afectado.

    La prueba BADYG-M Renovado es uno de los instrumentos ms utilizados en Orientacin

    Escolar para medir las capacidades y habilidades acadmicas de los alumnos, numerosos

    trabajos dentro de la investigacin as lo corroboran.

    Respecto a las Pruebas de Evaluacin de Diagnstico, PED, decir que su realizacin

    responde al propsito de la Consejera de Educacin de conocer e informar acerca de los

    progresos conseguidos por el alumnado y los centros educativos de la Comunidad

    Autnoma de Andaluca. Estas pruebas proporcionan informacin relevante en la que

    basar las medidas necesarias para superar las diferencias existentes entre el nivel

    competencial que se espera que el alumnado desarrolle y el que realmente ha alcanzado

    en el momento de completar dicha prueba.

    Para finalizar destacaremos el hecho de que se pretende que el resultado de este

    trabajo sea eminentemente prctico para el profesorado de Educacin Secundaria de

    manera que aporte un procedimiento claro y asequible para la prediccin de futuros

    casos de fracaso escolar. Es por esto que nos centraremos nicamente en variables

    controlables desde los centros educativos mantenindonos al margen de aquellas no

    controlables tales como situacin familiar, entre otras.

    ORGANIZACIN DE ESTA MEMORIA Y APORTACIONES

    Este trabajo est organizado en 4 captulos estando el ltimo dedicado al objetivo

    fundamental de este trabajo, el estudio con datos reales de la capacidad predictiva de la

    batera BADyG-M Renovado y las Pruebas de Evaluacin de Diagnstico (PED) sobre el

    fracaso escolar en ESO.

  • 4 UNIVERSIDAD DE GRANADA Problemas abiertos

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    El Captulo 1, Fracaso Escolar en Educacin Secundaria, est dedicado al fracaso escolar,

    su problemtica, formulacin, incidencia en Espaa en general y en Andaluca en

    particular, y el problema de su cuantificacin.

    En el Captulo 2, Descripcin de la batera BADyG-M Renovado y las Pruebas de

    Evaluacin de Diagnstico, se ofrece una visin general de las distintas pruebas de

    diagnstico utilizadas en el estudio. En primer lugar se describe la BATERA DE APTITUDES

    DIFERENCIALES Y GENERALES, BADyG-M Renovado, a fin de conocer sus caractersticas,

    estructura y test y variables que la forman. A continuacin se procede igualmente con

    las PRUEBAS DE EVALUACIN DE DIAGNSTICO, PED.

    En el Captulo 3, Fundamentos tericos, se hace una recopilacin de las tcnicas

    estadsticas que se usarn en nuestro estudio, en nuestro caso se trata de la regresin

    logstica.

    En el Captulo 4, Aplicacin al estudio de la prediccin de fracaso escolar en Educacin

    Secundaria Obligatoria, se proceder al anlisis de los datos. En primer lugar

    realizaremos el estudio usando la batera BADyG-M Renovado, pasaremos despus al

    estudio de nuestro problema usando las PED. Concluiremos este captulo con el

    establecimiento de propuestas de ampliacin, entre las que destacaremos una

    propuesta de intervencin experimental.

    En cuanto a las aportaciones de este trabajo destacaremos dos. En primer lugar el uso

    de las pruebas BADyG-M Renovado y las PED como predictoras de fracaso escolar y, en

    segundo lugar, la disponibilidad de datos reales de seis promociones que pueden servir

    de base para estudios posteriores.

    PROBLEMAS ABIERTOS

    Una vez finalizado este trabajo quedan abiertos varios problemas.

    1. Confirmacin de los resultados obtenidos mediante la inclusin de nuevas

    promociones al estudio.

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    5

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    2. Una vez confirmada la validez del mtodo de diagnstico de futuros casos de

    fracaso escolar queda pendiente la elaboracin de un plan de actuacin con el

    alumnado para intentar evitar su fracaso efectivo.

    3. Seguimiento y evaluacin de la efectividad del plan de actuacin sobre

    alumnado en riesgo de fracaso escolar.

  • 6 UNIVERSIDAD DE GRANADA El Fracaso Escolar, un asunto preocupante

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Captulo 1

    Fracaso Escolar en Educacin Secundaria

    EL FRACASO ESCOLAR, UN ASUNTO PREOCUPANTE

    Est socialmente aceptado que la Educacin es uno de los pilares bsicos de cualquier

    sociedad actual, por lo que el fracaso escolar es considerado como un problema de

    primer orden llegando incluso a ser motivo de alarma social, y muy especialmente en

    Espaa donde sus tasas estn por encima de la media europea y de los pases de la

    OCDE2. Adems, esta sensibilidad se ha visto favorecida por la aparicin de numerosos

    anlisis y estudios que intentan averiguar sus causas.

    El fracaso escolar es un concepto vinculado a la extensin de la escolarizacin

    obligatoria. Si bien en Espaa, antes de 1970, no tena sentido hablar de fracaso escolar

    debido a que no exista una escolarizacin mnima para toda la poblacin es hacia el

    final de la dictadura, con la Ley General de Educacin (LGE) de 1973, cuando se modific

    2 Organizacin para la Cooperacin y el Desarrollo Econmicos.

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    7

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    esta situacin estableciendo la Educacin General Bsica (EGB) como el nivel educativo

    mnimo para toda la poblacin, que se poda obtener a los 14 aos. Al finalizar este nivel

    se obtena el Ttulo de Graduado Escolar y no obtener este ttulo era sinnimo de

    fracaso escolar. Con la Ley Orgnica de Ordenacin del Sistema Educativo (LOGSE) se

    prolonga la educacin obligatoria hasta los 16 aos, a partir de este momento el fracaso

    escolar es el resultado de no lograr el ttulo de Educacin Secundaria Obligatoria (ESO).

    Desde el punto de vista del individuo, tal como se expone en (Fernndez Enguita, et al.,

    2010),

    Las oportunidades sociales de las personas dependen cada vez ms de su

    cualificacin, de su capital humano, de su capacidad de obtener, manejar e

    interpretar la informacin, de emplear y adquirir el conocimiento. () Quienes

    obtengan el mximo de su formacin inicial accedern por ello mismo a empleos

    ms enriquecedores () y tendrn ms y mejores oportunidades de formacin

    ulterior, sea en el trabajo, volviendo a las aulas o con sus propios medios. En

    cambio, quienes desaprovechen esa formacin inicial o no logren beneficiarse de

    ella tendrn ms probabilidades de acabar en el desempleo o en puestos de

    trabajo poco cualificados, en los que hay poco que aprender y menos

    oportunidades de acceder a la formacin ulterior y de aprovecharla.

    Parece pues que se abre una brecha cada vez mayor entre el trabajo cualificado y el no

    cualificado, de manera que a quien comience bien continuar mejor, y viceversa.

    Adems, es un lema de las polticas europeas que, como tal, se recoge en la LOE as

    como en otras leyes educativas autonmicas (Andaluca, Cantabria, Catalua), lograr el

    xito educativo para todos, garantizando a todos la adquisicin de un conjunto de

    competencias consideradas imprescindibles para la integracin social (Bolvar Bota &

    Lpez Calvo, 2009).

    Dentro del Programa Educacin y Formacin 2010, la UE estableci cinco objetivos en

    materia de educacin que deberan alcanzarse como muy tarde en 2010: situar la tasa

    de abandono escolar por debajo del 10%; reducir a un 17% el porcentaje de alumnos

    con problemas de comprensin lectora; lograr que el 85% de los jvenes (a los 22 aos)

  • 8 UNIVERSIDAD DE GRANADA El Fracaso Escolar, un asunto preocupante

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    completen la Educacin Secundaria; aumentar en un 15% el nmero de diplomados en

    Matemticas, Ciencias y Tecnologas; y lograr que el 12.5% de la poblacin adulta

    participe en formacin continua. La situacin de Europa y Espaa en relacin con estos

    objetivos se recoge en la Tabla 1 (Bolvar Bota & Lpez Calvo, 2009). Como vemos,

    Espaa tiene un serio problema de abandono escolar sin titulacin en Educacin

    Secundaria Obligatoria, en torno al 30%, que junto con el bajo porcentaje de

    reincorporacin posterior al sistema educativo tiene graves consecuencias sociales y

    laborales para el alumnado que no ha alcanzado la formacin adecuada.

    TABLA 1. GRADO DE CONSECUCIN POR ESPAA DE LOS OBJETIVOS EUROPEOS (COMMISSION OF THE EUROPEAN

    COMMUNITIES, 2009)

    Objetivo UE 2010 Europa, 2009 Espaa, 2009

    Abandono escolar 10% 15% 31%

    Reducir el nmero de jvenes de 15 aos con dificultades para leer

    15.5% 19.8% 21.1%

    Titulados Secundaria 85% 76.7% 61.8%

    Aumentar Licenciados Matemticas, Ciencias y Tecnologas

    15% 27% 16%

    Formacin continua 12.5% 9.9% 5.1%

    Inversin pblica educativa - 5.2% 4.4%

    Por otra parte, en la comunicacin de la Comisin Europea al Parlamento Europeo, al

    Consejo, al Comit Econmico y Social Europeo y al Comit de las Regiones, de 31 de

    enero de 2011, sobre cmo abordar el abandono escolar prematuro3 (una contribucin

    clave a la agenda Europa 2020), se analiza su impacto en las personas, la sociedad y la

    economa, se resumen sus causas y se ofrece una descripcin general de las medidas

    actuales y futuras a escala de la UE para abordar esta cuestin (Comisin Europea, 2011)

    Como vemos existe una gran preocupacin por parte de diversas instituciones con

    responsabilidades en temas educativos por abordar este problema con grandes

    implicaciones sociales y econmicas.

    3 El trmino abandono escolar prematuro incluye todas las formas de abandono de la educacin y la formacin antes de concluir el segundo ciclo de enseanza secundaria o su equivalente en formacin profesional.

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    9

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    CUANTIFICACIN DEL FRACASO ESCOLAR

    A la hora de cuantificar el fracaso escolar surge el problema de cmo definirlo de

    manera que se elimine toda ambigedad sobre el mismo. Hasta ahora nos hemos

    referido al fracaso escolar como la no consecucin del ttulo educativo, que podemos

    definir como FRACASO ESCOLAR ADMINISTRATIVO. Marchesi (Marchesi, 2000) da una

    definicin concreta y fcil de cuantificar: porcentaje de alumnos que no obtiene la

    titulacin que acredita haber finalizado satisfactoriamente la educacin obligatoria.

    Si bien esta expresin del fracaso escolar es ampliamente aceptada, no se corresponde,

    en general, con la que se utiliza en los datos oficiales que, normalmente, hacen

    referencia a los alumnos que no titulan sobre el total de los evaluados en 4 de ESO, que

    denominaremos NDICE DE NO TITULACIN ( ). Reservamos el trmino NDICE DE FRACASO

    ESCOLAR ( ) para la proporcin de alumnos que abandona el sistema educativo sin

    obtener el ttulo de Graduado en Educacin Secundaria Obligatoria (ESO). As pues,

    tenemos que:

    Las tres posibles salidas del alumnado tras su evaluacin en 4 ESO son titular, repetir o

    abandonar el sistema educativo sin obtener el ttulo de Graduado en Educacin

    Secundaria. Solo estos ltimos estn incluidos en el ndice , mientras que incluye

    como a los alumnos que no titulan un ao pero que repiten y al siguiente pueden

    hacerlo. Observamos, por tanto, que es una estimacin por defecto del fracaso

    escolar (no incluye a los alumnos que repiten), mientras que lo es por exceso

    (incluye como fracaso a alumnos que repiten y an pueden titular). De donde se deduce

    que, si tomamos como referencia los alumnos de 4 ESO, .

  • 10 UNIVERSIDAD DE GRANADA Cuantificacin del Fracaso Escolar

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Pero nuestro sistema educativo es ms complejo ya que debemos tener en cuenta que

    existe un porcentaje de alumnos que no permanece en el sistema educativo hasta el

    final de la ESO, abandonando antes de llegar a ser evaluados en 4 ESO.

    TABLA 2. FLUJO DE ALUMNOS DE UNA COHORTE A LO LARGO DE LOS TRES LTIMOS CURSOS DE LA ESO

    En la Pero nuestro sistema educativo es ms complejo ya que debemos tener en cuenta

    que existe un porcentaje de alumnos que no permanece en el sistema educativo hasta el

    final de la ESO, abandonando antes de llegar a ser evaluados en 4 ESO.

    Tabla 2 se representa el flujo de alumnos de una cohorte a lo largo de los tres ltimos

    cursos de la ESO. Cada curso tiene tres entradas y tres salidas posibles. Las salidas son

    las mismas que hemos considerado antes, los alumnos pueden promocionar de curso

    Evaluados en 4 ESO

    Repiten

    Titulan Abandonan

    Curso 06-07 Curso 07-08 Curso 08-09 Curso 09-10

    2 ESO

    2 ESO

    A2 N3

    3 ESO

    3 ESO

    3 ESO

    A3 N4

    4 ESO

    4 ESO

    4 ESO

    A4

    N2

    Repiten

    Repiten

    Repiten

    Repiten

    Repiten

    Repiten

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    11

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    (en 4 ESO supone titular), pueden repetir de curso o abandonar el sistema educativo

    ( ). En cuanto a las entradas, los alumnos pueden proceder de la promocin desde el

    curso anterior, de la repeticin del mismo curso y de nueva matrcula ( ).

    A partir de este diagrama hay que incluir dentro de la suma de todos los abandonos

    ( ). Por otra parte, el nmero total de alumnos de esa cohorte, al que se

    deben referir los resultados del abandono ( ), es la suma de las entradas de los alumnos

    nuevos, que incluye los que entran en 2 ESO procedentes de 1 ESO ( ).

    De modo que, mientras la frmula de no cambia, la de queda en la forma:

    Destaquemos el hecho de que contina siendo una estimacin por defecto del

    fracaso escolar, por las mismas razones que antes, pero la relacin entre y se

    vuelve ms compleja.

    La diferencia entre ambos ndices nos proporciona informacin sobre el sistema de

    escolarizacin. Cuando es menor que ( ), el sistema favorece el

    abandono y dificulta la repeticin, y viceversa, cuando es mayor que (

    ), el sistema prima la permanencia del alumno, disminuyendo el abandono a

    expensas de una mayor repeticin.

    En lo que se refiere a los ndices utilizados para calcular el fracaso escolar, parece

    evidente que el ndice de no-titulacin ( ) no es un buen indicador del fracaso escolar.

    En primer lugar, premia, con un ndice artificialmente bajo, las estrategias que

    favorecen el abandono temprano del alumno (que no son contabilizadas como fracaso

    escolar), mientras que castiga aquellas que favorecen la permanencia del alumno.

    Paradjicamente, estas ltimas obtienen mejores resultados, tanto medidos mediante

    , como a travs de . En segundo lugar, no es un ndice por exceso del fracaso

    escolar, pero tampoco se puede asegurar que lo sea por defecto, de modo que, al

    utilizarlo, no se sabe ni la cuanta ni el signo del error cometido.

    Frente a , el ndice de fracaso-escolar que proponemos ( ) tiene la ventaja de ser

    un ndice por defecto, lo que nos permite, al menos, conocer el sentido del error

  • 12 UNIVERSIDAD DE GRANADA Cuantificacin del Fracaso Escolar

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    cometido. Por otro lado, su clculo resulta sencillo a partir de los datos de matrcula,

    repeticin y promocin.

    En nuestra opinin, es recomendable el clculo de ambos ndices y el de su diferencia

    ( ), lo que, permite distinguir dos tipos de sistemas de escolarizacin: los que

    priman la permanencia del alumno, a expensas de prolongar su vida escolar y los que

    favorecen el abandono del alumno sin llegar a titular.

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    13

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Captulo 2

    Descripcin de la batera BADyG-M Renovado y las Pruebas de

    Evaluacin de Diagnstico (PED)

    A continuacin se describen las pruebas usadas en nuestro estudio, su organizacin,

    caractersticas, test que las forman Para ello hemos usado los siguientes textos de

    referencia: para la Batera de Aptitudes Diferenciales y Generales BADyG-M Renovado,

    el manual tcnico de dicha batera (Yuste, et al., 2002); y para las Pruebas de Evaluacin

    de Diagnstico (PED) el ltimo informe de resultados publicado por la Agencia Andaluza

    de Evaluacin Educativa (Agencia Andaluza de Evaluacin Educativa, 2011).

    SOBRE BADYG-M RENOVADO

    La Batera de Aptitudes Diferenciales y Generales BADyG-M Renovado (Yuste &

    Martnez, 2003) ha sido durante aos el instrumento ms usado, tanto por los Equipos

    de Orientacin Educativa y Psicoeducativa (EOEPs) como por los Orientadores Escolares

  • 14 UNIVERSIDAD DE GRANADA Sobre BADyG-M Renovado

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    de los Institutos de Educacin Secundaria, para realizar evaluaciones psicopedaggicas

    (Monsalvo Dez & Carbonero Martn, 2009). Esta batera est formada por varias

    pruebas que pasamos a describir (Yuste, et al., 2002).

    DESCRIPCIN DE LAS PRUEBAS

    RELACIONES ANALGICAS,

    Se trata de encontrar relaciones analgicas entre conceptos. Una nos la dan completa y

    a la otra le falta un trmino que hay que buscar entre las cinco posibles respuestas

    numeradas con letras.

    Es una prueba especfica de Razonamiento y Comprensin verbal. Consta de 32

    elementos ordenados segn un ndice de dificultad, con cinco alternativas de respuesta.

    Las analogas se usan tradicionalmente como la mejor manera de medir la llamada

    Aptitud o Inteligencia Verbal. Se utilizan contenidos verbales, conceptos, y se pide

    reconocer relaciones analgicas entre parejas, lo que conlleva una operacin de

    reconocimiento de significados y relaciones de segundo orden entre ellos. Porque se

    trata no solamente de establecer relaciones semnticas (que podramos denominar de

    primer orden), sino de determinar la similitud o adecuacin de las relaciones

    establecidas.

    No es fundamentalmente una prueba de comprensin, de vocabulario, sino de

    Razonamiento Inductivo.

    La puntuacin de la prueba de Analogas, , indica la aptitud para inducir relaciones

    analgicas entre conceptos. Al mismo tiempo est presente un factor semntico de

    conocimiento de vocabulario.

    El reconocimiento de relaciones implica un pensamiento abstracto, ya que no se trata

    nicamente de establecer relaciones ms o menos concretas y observables, sino de

    identificar la similitud entre parejas de conceptos relacionados.

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    15

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    SERIES NUMRICAS,

    Se trata de completar cada serie numrica con el siguiente elemento. Los nmeros estn

    ordenados siguiendo una secuencia lgica que se debe descubrir.

    Es una prueba especfica de razonamiento serial numrico o aptitud para determinar

    regularidades lgicas en una secuencia de nmeros. Al mismo tiempo, al utilizar cdigos

    numricos, necesita una bsica capacidad para el clculo mental, puesto que las

    regularidades lgicas se refieren a operaciones (sumas, restas, multiplicacin, divisin)

    entre series lineales de nmeros. Consta de 32 elementos ordenados segn un ndice de

    dificultad, con cinco alternativas de respuesta.

    Con esta prueba se pretende medir, con contenidos numricos, la capacidad de

    Razonamiento consistente en detectar los periodos de repeticin o secuencias en que se

    ordenan series numricas lineales. El nmero, como contenido de informacin se presta

    especialmente bien a realizar complejas y variadas series, por representar a su vez una

    serie lineal de longitud infinita, de distancias iguales entre cada elemento serial.

    MATRICES LGICAS,

    Se trata de buscar en cada ejercicio el dibujo que debe ir donde est la interrogacin,

    teniendo en cuenta que estn ordenados siguiendo una lgica.

    El Razonamiento menos automatizado, menos trabajado culturalmente, se suele medir

    con contenidos figurativos, con series o matrices de figuras. Representan una modalidad

    de contenido que no se utiliza explcitamente en los programas educativos para ensear

    ninguna asignatura ni impartir conocimientos. Aunque el reconocimiento de las formas

    de las figuras geomtricas y sus propiedades s se ensea y se utiliza en geometra, en

    dibujo. La estricta ausencia de influjo cultural de este tipo de contenidos tambin la

    podemos, por tanto, cuestionar. Pero es indudable que no se utiliza en procesos que

    requieran Razonamiento lgico y por ello s podemos afirmar que estn ms libres que

    otros tipos de contenidos de influjo cultural. Consta de 32 elementos ordenados segn

    un ndice de dificultad, con cinco alternativas de respuesta.

  • 16 UNIVERSIDAD DE GRANADA Sobre BADyG-M Renovado

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Esta prueba mide la capacidad para el razonamiento inductivo, para relacionar

    lgicamente complejos conjuntos de datos codificados visualmente en forma de figuras

    geomtricas.

    COMPLETAR ORACIONES,

    Se trata de encontrar el concepto o palabra que complete o cierre mejor el sentido de

    una oracin.

    La prueba de Completar Oraciones consta de 32 elementos ordenados segn un ndice

    de dificultad, con cinco alternativas de respuesta.

    Requiere operaciones de reconocimiento de vocabulario y rememorar experiencias o

    conocimientos previos.

    Esta prueba mide un aspecto importante de la Inteligencia Verbal y requiere sobretodo

    reconocimiento integrado de situaciones sobre las que se deben tener algunos

    conocimientos previos.

    PROBLEMAS NUMRICOS,

    Se trata de comparar las cantidades resultantes de resolver problemas numricos para

    determinar cul es la mayor. Cuando las dos son iguales, la respuesta correcta ser la

    tercera alternativa.

    La prueba no mide nicamente rapidez de clculo, sino tambin razonamiento

    numrico, la aplicacin de operaciones numricas en problemas numrico/verbales.

    Consta de 32 elementos ordenados segn un ndice de dificultad, con tres alternativas

    de respuesta.

    No se pretende medir el nivel de conocimientos matemticos adquiridos, sino ms bien

    la correcta automatizacin de las operaciones matemticas bsicas junto a un

    reconocimiento de smbolos aritmticos bsicos. Las operaciones y problemas

    planteados en cada nivel suelen haberlas aprendido y practicado desde varios aos

    atrs, con mayor o menor complejidad.

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    17

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    En esta prueba, de manera ms acusada que en las dems (a excepcin de ,

    Discriminacin de Diferencias), est presente tambin una componente de rapidez, pues

    en la prctica los sujetos de mejor puntuacin suelen ser los que ms avanzan (a

    excepcin de los que responden al azar), y existe una diferencia mucho ms clara entre

    los que acaban y los que no lo hacen.

    Nunca se pretende medir nivel de conocimientos matemticos, sino asimilacin de los

    aprendidos con anterioridad (al menos dos aos antes ya se suelen trabajar en el

    currculum).

    La prueba de Resolucin de Problemas, , mide la rapidez y seguridad en el clculo, en

    la resolucin de sencillos problemas bsicos aritmtico/geomtricos y en la

    comprensin del planteamiento o comprensin de los elementos simblicos aritmticos

    con los que se plantea cada problema.

    ENCAJAR FIGURAS,

    Se trata de buscar la figura que complete perfectamente la parte que se ha recortado de

    una superficie.

    Consta de 32 elementos ordenados segn un ndice de dificultad, con cuatro alternativas

    de respuesta.

    Esta prueba se refiere a la facilidad para visualizar cambios de posicin de figuras

    macizas bidimensionales que no cambian de forma.

    Esta prueba, , mide la capacidad para realizar giros espaciales con figuras

    geomtricas, manteniendo sus relaciones de tamao, distancia y posicin relativas para

    comprobar la adecuacin de una figura con la superficie de la que se ha recortado.

    MEMORIA DE RELATO ORAL,

    Se trata de responder a una serie de preguntas acerca de un texto ledo.

    Consta de 32 elementos, con tres alternativas de respuesta.

  • 18 UNIVERSIDAD DE GRANADA Sobre BADyG-M Renovado

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Las preguntas se dirigen a comprobar la retencin de los detalles del relato, algunos

    numricos y la mayora verbales. No se trata de comprobar si los sujetos han entendido

    lo ledo, porque el relato es sumamente fcil de seguir, sino de comprobar si recuerdan

    detalles concretos.

    Esta prueba, , mide la capacidad para recordar a corto plazo datos de un relato

    verbal, datos la mayor parte relacionados, dentro del sentido global de la lectura que se

    ha escuchado. Es pues una memoria verbal y numrica por el tipo de contenidos a

    recordar, frente a otra posible memoria que llamaramos viso/espacial. Es memoria

    inmediata, por el corto tiempo en que se pide recuerden los datos, en contraposicin a

    la memoria a largo plazo y es auditiva, porque se escucha el relato a recordar, frente a

    otra posible modalidad de presentacin de los estmulos, a base de un relato escrito.

    MEMORIA VISUAL ORTOGRFICA,

    Se trata de buscar la palabra que est ortogrficamente mal escrita. Los acentos o tildes

    estn todos bien.

    Consta de 32 elementos ordenados segn un ndice de dificultad, con tres alternativas

    de respuesta.

    La prueba de Memoria Visual Ortogrfica, , mide la retencin en la memoria a largo

    plazo de la correcta escritura de las palabras que, aunque fonticamente se pronuncien

    igual, se escriben de distinta manera. No depende su reconocimiento de reglas claras

    que podran haberse memorizado. S depender su reconocimiento correcto de la mayor

    o menor frecuencia en la percepcin de esas palabras, es decir de si un sujeto, en sus

    lecturas, las ha observado ms o menos veces que otros sujetos.

    DISCRIMINACIN DE DIFERENCIAS,

    Se trata de buscar en cada grupo de tres dibujos el que tiene alguna diferencia pequea,

    con respecto a los otros dos.

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    19

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Discriminar con rapidez pequeas diferencias visuales es una operacin mental muy

    bsica relacionada con procesos atencionales de recepcin y comparacin de

    informacin visual.

    Los elementos de esta prueba tambin estn ordenados por un ndice de dificultad, pero

    tienen todos ndices bastante aproximados: al ser muy breve el tiempo concedido para

    la ejecucin, se convierte en test de rapidez perceptiva de diferencias. Consta de 32

    elementos ordenados segn un ndice de dificultad, con tres alternativas de respuesta.

    Esta prueba, , mide la rapidez perceptiva, la rapidez del sujeto en operaciones

    simples de comparacin de detalles entre figuras.

    NORMAS DE CORRECCIN

    NORMAS GENERALES

    Cada una de las pruebas tiene 32 aciertos como mximo posible.

    Todas las pruebas, excepto la de Problemas Numricos, , tienen como frmula de

    correccin el Nmero de Aciertos, .

    donde en caso de acierto del tem ( ) y en caso contrario.

    En la prueba de Problemas Numricos, , a los aciertos se le restan la mitad de los

    errores, .

    con si el tem es correcto y en otro caso; y en caso de error del

    tem y en caso contrario.

  • 20 UNIVERSIDAD DE GRANADA Sobre BADyG-M Renovado

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    OBTENCIN DE PUNTUACIONES GLOBALES

    INTELIGENCIA GENERAL, IG

    Se obtiene sumando los aciertos de las seis pruebas bsicas:

    1. Relaciones Analgicas,

    2. Series Numricas,

    3. Matrices Lgicas,

    4. Completar Oraciones,

    5. Problemas Numricos,

    6. Encajar Figuras,

    El mximo posible de aciertos es de 192.

    La puntuacin de Inteligencia General es una estimacin global teniendo en cuenta las

    seis pruebas bsicas de la batera: dos pruebas verbales, dos numricas y dos espaciales.

    RAZONAMIENTO LGICO,

    Se obtiene sumando los aciertos de las tres primeras pruebas:

    1. Relaciones Analgicas,

    2. Series Numricas,

    3. Matrices Lgicas,

    El mximo posible de aciertos es de 96.

    La puntuacin de Razonamiento no es ms que la suma de las tres pruebas que lo miden

    ms directamente, con tres tipos diferentes de contenidos: Analogas Verbales, ,

    Series Numricas, , y Matrices Lgicas, .

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    21

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    El significado de esta puntuacin global viene determinado por las tres pruebas que

    componen su puntuacin.

    OBTENCIN PUNTUACIONES DE RAPIDEZ Y EFICACIA

    RAPIDEZ

    La Rapidez se contabiliza sumando las respuestas emitidas en las seis pruebas bsicas.

    siendo , , el nmero de respuestas emitidas en cada prueba.

    EFICACIA

    La Eficacia se obtiene con la siguiente frmula:

    , siendo la puntuacin

    directa en Inteligencia General como suma de aciertos de las seis pruebas bsicas, y

    la puntuacin de Rapidez como suma de las respuestas emitidas en las seis pruebas

    bsicas4.

    En el BADyG-M Renovado se mide la Rapidez y Eficacia como datos que pueden ser

    tiles en una orientacin escolar individualizada. Es cierto que medir la Rapidez como

    nmero de elementos emitidos o contestados en las seis pruebas bsicas de la batera

    presenta varios problemas, e incluso puede ser totalmente artificiosa cuando el sujeto

    no realiza en realidad las operaciones que supuestamente debe realizar, por ejemplo

    cuando responde al azar alguna o muchas de las preguntas. Pero el significado de esta

    puntuacin de Rapidez puede tener significado ms interesante cuando se relaciona con

    la Eficacia o Porcentaje de Aciertos. De esta manera podemos catalogar a los sujetos que

    hacen las pruebas en cuatro categoras, con significados diferenciados: sujetos rpidos y

    eficaces, sujetos rpidos e ineficaces, sujetos lentos y eficaces, y sujetos lentos e

    ineficaces.

    4 Para obtener un porcentaje sin decimales se multiplica por 100 y se redondea la puntuacin al entero ms prximo.

  • 22 UNIVERSIDAD DE GRANADA Sobre las Pruebas de Evaluacin de Diagnstico (PED)

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    SOBRE LAS PRUEBAS DE EVALUACIN DE DIAGNSTICO (PED)

    La realizacin de estas pruebas responde al propsito de la Consejera de Educacin de

    conocer e informar acerca de los progresos conseguidos por el alumnado y los centros

    educativos de la Comunidad Autnoma de Andaluca. Estas pruebas proporcionan

    informacin relevante en la que basar las medidas necesarias para superar las

    diferencias existentes entre el nivel competencial que se espera que el alumnado

    desarrolle y el que realmente ha alcanzado en el momento de completar dicha prueba.

    Se contina con la generalizacin de la aplicacin de los cuestionarios de contexto

    (alumnado, familia, centro) a todos los grupos que realizan la prueba. La finalidad de

    estos cuestionarios es elaborar un ndice socioeconmico y cultural (ISC) de los centros

    (al igual que PISA y otras evaluaciones internacionales), que permita el anlisis de la

    relacin entre el rendimiento obtenido en las Pruebas de Evaluacin de Diagnstico y la

    situacin socioeconmica y cultural del alumnado y el centro. Este ndice abre

    importantes vas para la investigacin e innovacin educativas, que repercutirn en la

    mejora de la calidad de la enseanza.

    COMPETENCIAS EVALUADAS

    Tanto en Educacin Primaria como en Educacin Secundaria Obligatoria se han evaluado

    las siguientes competencias bsicas:

    Razonamiento Matemtico

    Comunicacin Lingstica (Lengua Espaola)

    Conocimiento e Interaccin con el Mundo Fsico y Natural, Comunicacin

    Lingstica en Lenguas Extranjeras (Ingls), Social y Ciudadana, Cultural y

    Artstica.

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    23

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Si bien las competencias en Razonamiento Matemtico y en Comunicacin Lingstica

    (Lengua Espaola) se evalan todos los cursos, las dems van rotando cada ao.

    Para cada competencia bsica se elabor un cuadernillo de 18 temes que se aplic en

    dos sesiones de 60 minutos de duracin, separadas por un periodo de descanso de 30

    minutos.

    INSTRUMENTOS UTILIZADOS

    INSTRUMENTOS DE EVALUACIN

    La evaluacin de competencias bsicas en el alumnado de Educacin Primaria y

    Educacin Secundaria Obligatoria requiere el empleo de instrumentos que incluyan

    temes adecuados al tipo de competencias que han sido consideradas, que tengan en

    cuenta los contextos o situaciones definidos para que el alumnado demuestre su

    dominio y aplicacin, y cuya administracin resulte viable en el marco de la evaluacin

    del sistema educativo.

    La Evaluacin de Diagnstico de Andaluca opta por la realizacin de pruebas escritas (de

    lpiz y papel) de carcter homologado, basadas en situaciones-problema y

    administradas colectivamente. Se trata de pruebas construidas a partir de casos que

    sirven como base para la interrogacin y que, en la medida de lo posible, remiten a

    situaciones similares a las que el alumnado puede encontrar en su vida escolar o

    extraescolar.

    Las cuestiones, por tanto, basndose en los contenidos curriculares, tratan de evaluar

    las capacidades del alumnado para la aplicacin de los mismos a situaciones escolares y,

    especialmente, a situaciones en las que habr de desenvolverse en la vida real.

    Las situaciones-problema se construyen sobre la base de uno o varios de los siguientes

    tipos de informacin:

    Textos escritos continuos o discontinuos en los que se recogen informaciones

    diversas: anuncios, textos extrados de los medios de comunicacin,

  • 24 UNIVERSIDAD DE GRANADA Sobre las Pruebas de Evaluacin de Diagnstico (PED)

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    instrucciones, carteles informativos, trascripcin de dilogos, narracin de

    hechos, descripcin de situaciones reales o simuladas, textos literarios, textos

    cientficos, etc.

    Textos orales breves para la competencia en Comunicacin lingstica (lengua

    espaola), que persiguen una finalidad comunicativa, proporcionados en

    soporte CD.

    Imgenes diversas, incluyendo fotografas, mapas, dibujos, esquemas o

    cualquier otra forma grfica de representacin de diferentes realidades.

    Las preguntas formuladas a partir de cada situacin-problema han ido dirigidas, en

    lneas generales, a comprobar el grado de dominio de las competencias objeto de la

    Evaluacin de Diagnstico, es decir, a la capacidad para transferir conocimientos y

    habilidades de diferentes mbitos curriculares aplicndolos a los problemas planteados

    en una diversidad de situaciones. Cada situacin o caso representa un estmulo a partir

    del cual se plantea un racimo de cuestiones que podrn encuadrarse en algunos de los

    siguientes formatos:

    Preguntas de respuesta cerrada, bajo el formato de eleccin mltiple. Se trata

    tanto de preguntas de respuesta dicotmica, como de preguntas con escala de

    respuesta graduada, de tal manera que cabe pensar en una respuesta correcta,

    una o ms respuestas parcialmente incorrectas y una respuesta totalmente

    errnea. La posibilidad de utilizar preguntas cerradas con respuestas en escala

    graduada posee el atractivo de adaptarse a las pretensiones de una evaluacin

    formativa, dado que permite aportar informacin no slo sobre si un alumno o

    alumna posee o no la competencia que se le demanda para responder, sino

    tambin en qu grado la ha desarrollado, aportando informacin relevante

    sobre la medida en que su competencia en el elemento en cuestin es

    deficitaria y sobre el tipo de apoyos o refuerzos que requiere.

    Preguntas que exigen el desarrollo de procedimientos y la obtencin de

    resultados. Este tipo de cuestiones contempla generalmente la necesidad de

    alcanzar un resultado nico, aunque podran describirse diferentes caminos para

    llegar al mismo. Tanto el procedimiento como el resultado son valorados,

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    25

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    posibilitando el establecimiento de diferentes niveles de respuesta en funcin

    del grado de desarrollo competencial.

    Preguntas abiertas que admiten respuestas diversas, las cuales, aun siendo

    correctas, pueden diferir de unos sujetos a otros. La elaboracin de criterios de

    correccin permite graduar las respuestas estableciendo, tambin en este caso,

    niveles de ejecucin intermedios entre las respuestas correcta e incorrecta.

    CUESTIONARIOS DE CONTEXTO

    Adems de los cuadernillos de las pruebas, existen unos Cuestionarios de Contexto para

    el alumnado, sus familias y los centros educativos, ya que los resultados en pruebas de

    rendimiento estn modulados por factores contextuales, de recursos y de procesos. La

    finalidad es extraer informacin sobre una serie de variables socioeconmicas y

    culturales que sirven de base para el clculo de los ndices correspondientes.

    Estos datos son de utilidad para contrastar los resultados obtenidos por el alumnado en

    las pruebas con su ndice Socioeconmico y Cultural. Con la misma finalidad, estas

    variables son utilizadas en Cuestionarios de contexto tanto de evaluaciones nacionales

    (Evaluacin General de Diagnstico del Instituto de Evaluacin) como internacionales

    (PISA, PIRLS, TIMSS).

    A continuacin, se recogen las variables que contienen cada uno de los Cuestionarios:

    VARIABLES DEL CUESTIONARIO DE FAMILIA

    Expectativas de la madre y del padre sobre los estudios del hijo o hija

    Hbitos lectores de la madre y del padre

    Nmero de libros en el hogar

    Recursos domsticos

    Nivel educativo de la madre y del padre

    Estatus ocupacional de la madre y del padre

    VARIABLES DEL CUESTIONARIO DE ALUMNADO

    Sexo

  • 26 UNIVERSIDAD DE GRANADA Sobre las Pruebas de Evaluacin de Diagnstico (PED)

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Fecha de nacimiento

    Hbitos lectores

    Tiempo dedicado a otras actividades: viendo TV, videojuegos, ordenador

    Si recibe ayuda para hacer tareas

    Seguimiento del estudio por parte de los padres

    Uso del ordenador (casa y colegio)

    Tipo de informacin que busca en Internet

    Expectativas de estudios

    Gusto por el estudio

    Autoconcepto como estudiante

    Cumplimiento de las normas del centro

    Relacin entre compaeros y compaeras

    VARIABLES DEL CUESTIONARIO DE CENTRO (AULA)

    Nmero de alumnos y de alumnas del grupo

    Nacionalidad y lengua verncula del alumnado

    Nmero de alumnos y alumnas con Adaptaciones Curriculares Individualizadas

    Porcentaje de hogares desfavorecidos/ acomodados

    Existencia de biblioteca de centro y de aula

    Reuniones del profesorado y temas que se tratan

    Trabajo en equipo

    Estrategias didcticas utilizadas

    Modelos de pruebas/ evaluacin del alumnado

    Satisfaccin con el centro/ alumnado/ familia

    Clima de clase

    21

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    27

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Captulo 3

    Fundamentos tericos

    En este captulo trataremos de manera genrica los modelos de respuesta discreta para

    pasar despus al estudio completo de los modelos de regresin logstica binaria, desde

    su formulacin, interpretacin, ajuste, contraste de bondad de ajuste, validacin hasta

    su diagnosis.

    MODELOS DE RESPUESTA DISCRETA

    Los modelos de regresin tienen como objetivo describir el efecto de una o ms

    variables (independientes) sobre una o ms variables de respuesta (dependientes).

    Cuando la variable respuesta es discreta, normalmente una variable categrica con dos

    o ms posibles clasificaciones o niveles de respuesta, la herramienta estadstica

    apropiada para modelizar su comportamiento a partir de un conjunto de variables

    independientes (predictoras), que pueden ser tanto discretas como continuas, sern los

    MODELOS DE RESPUESTA DISCRETA. Estos modelos son un caso particular de los Modelos

    Lineales Generalizados introducidos por Nelder y Wedderbum en 19725.

    5 Para mayor informacin sobre los mismos puede consultarse las referencias (McCullagh & Nelder, 1983) y (Agresti, 2002).

  • 28 UNIVERSIDAD DE GRANADA Modelos de Respuesta Discreta

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Existen distintos tipos de modelos de respuesta discreta que dependen, entre otros

    aspectos, del tipo de respuesta. En particular, si la variable dependiente es dicotmica

    se trata de MODELOS DE RESPUESTA BINARIA, mientras que si tiene ms de dos categoras

    de respuesta se trata de MODELOS DE RESPUESTA MLTIPLE. Segn la funcin utilizada

    para la estimacin de la probabilidad tenemos el modelo lineal, el modelo logit, modelo

    probit y modelo de valores extremos.

    En nuestro estudio, que se desarrollar en el ltimo captulo de este trabajo, la variable

    respuesta a estimar ser dicotmica, el fracaso escolar futuro de nuestro alumnado (que

    tomar el valor 1 si el alumno o alumna en cuestin presenta fracaso escolar y 0 en caso

    contrario) en base a determinadas variables dadas por las bateras pasadas a los mismos

    (BADyG-M Renovado y PED), por lo que se ajustar un modelo de respuesta binaria; en

    concreto, un modelo logit.

    INTRODUCCIN A LOS MODELOS DE RESPUESTA BINARIA

    Los modelos de regresin ms utilizados, en la mayora de los campos de aplicacin,

    para analizar este tipo de respuestas son los modelos de regresin logstica (logit), para

    los que las variables explicativas pueden ser tanto cuantitativas como cualitativas.

    Aunque la regresin logstica es la tcnica ms usual para el anlisis de datos de

    respuesta binaria, existen otros modelos alternativos, pertenecientes todos ellos a la

    familia de los modelos lineales generalizados que contiene tambin a otros modelos

    estndar de regresin como, por ejemplo, la regresin lineal y el anlisis de varianza

    para variables respuesta continuas.

    PLANTEAMIENTO DEL PROBLEMA

    El objetivo es construir un modelo estadstico para estimar una variable respuesta

    discreta binaria en funcin de una o varias variables explicativas que podran ser

    cuantitativas o cualitativas.

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    29

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Comenzaremos por el caso ms simple en el que se quiere explicar una variable

    aleatoria de respuesta binaria , con dos posibles categoras de respuesta en

    funcin de una variable no aleatoria cuantitativa .

    Si representamos a las dos categoras de por los valores y , la variable tiene

    distribucin de Bernoulli de esperanza

    Entonces la distribucin de en cada valor observado de es tambin Bernoulli de

    esperanza

    y varianza

    De este modo, representa la dependencia de la probabilidad de respuesta

    respecto de los valores de la variable explicativa.

    Si denotamos por a la distribucin de condicionada a , , el paso

    siguiente es construir un modelo adecuado para de la forma

    INVIABILIDAD DEL MODELO DE PROBABILIDAD LINEAL

    El modelo ms sencillo sera el modelo de regresin lineal

    donde los errores son variables aleatorias no observables, independientes, con

    esperanza cero, cuya distribucin tambin es Bernoulli con valores si

    , y si , a los que corresponden las mismas probabilidades

    y que la variable .

    Dado que tiene esperanza cero, se tiene

  • 30 UNIVERSIDAD DE GRANADA Modelos de Respuesta Discreta

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Por lo tanto, el modelo de regresin lineal es de la forma:

    (1.1)

    y recibe el nombre de MODELO DE PROBABILIDAD LINEAL.

    Este modelo presenta importantes defectos estructurales que lo hacen inviable para

    explicar el comportamiento de las probabilidades de respuesta, y se enumeran a

    continuacin:

    1. Las probabilidades son valores entre cero y uno, mientras que las funciones

    lineales de variables cuantitativas pueden tomar valores en toda la recta real.

    Por lo tanto, el modelo (1.1) puede predecir valores imposibles fuera del

    intervalo para valores de suficientemente pequeos o grandes. Esto se

    debe a que la esperanza de una variable dicotmica no puede estar explicada

    linealmente por una variable cuantitativa sobre un rango de valores no acotado.

    Por lo tanto, el modelo (1.1) slo podra ser vlido sobre un rango finito de

    valores de .

    2. No se satisface la condicin de homocedasticidad ya que la varianza de la

    variable respuesta, , no es constante sobre

    los valores observados de . Como consecuencia los estimadores de mnimos

    cuadrados ordinarios de los parmetros del modelo lineal seran insesgados

    pero no eficientes (no tendran varianza mnima dentro de la clase de los

    estimadores lineales insesgados). Para resolver este problema y obtener

    estimadores ms eficientes, se podran usar mnimos cuadrados ponderados.

    Cada observacin se ponderara por el inverso de la varianza condicionada

    tomando como valor inicial el estimador de mnimos cuadrados ordinario,

    y usando este procedimiento iterativamente. Esta aproximacin de mnimos

    cuadrados ponderados iterativamente converge a los estimadores de mxima

    verosimilitud (MV) pero continan las dificultades cuando se sale del

    intervalo .

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    31

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    3. Al no tener distribucin normal, no se pueden usar las distribuciones

    muestrales de los estimadores de mnimos cuadrados ordinarios para hacer

    inferencia sobre el modelo.

    4. El modelo lineal implica variaciones iguales de la probabilidad de respuesta

    frente a variaciones iguales de la variable explicativa. Esto no es ni mucho

    menos realista porque es de esperar que los cambios en tengan menos

    impacto sobre cuando la probabilidad de respuesta est prxima a cero o a

    uno que cuando est prxima a . Como ejemplo, supongamos que en un

    estudio epidemiolgico se quiere explicar la probabilidad de desarrollar cncer

    de hgado en funcin de la cantidad de alcohol ingerida. Lgicamente un

    aumento en tres cervezas en la consumicin diaria influir menos sobre esta

    probabilidad para un alcohlico que para una persona que se toma una cerveza

    diaria.

    Estos problemas presentados hacen que estos modelos no sean utilizados y, en su lugar,

    nos planteemos ajustar un modelo no lineal que implique una relacin entre y

    que sea curvilnea, montona, y acotada entre cero y uno. Las funciones de distribucin

    de variables continuas definidas sobre toda la recta real podran ser transformaciones

    adecuadas que cumplen estos objetivos. A continuacin estudiaremos que tomando la

    funcin de distribucin logstica se obtienen los MODELOS DE REGRESIN LOGSTICA, con la

    funcin de distribucin de una Normal se tienen los MODELOS PROBIT y con la funcin de

    distribucin de Gumbel los MODELOS DE VALORES EXTREMOS.

    MODELOS DE RESPUESTA BINARIA USUALES

    Teniendo en cuenta lo razonado anteriormente, buscamos un modelo de la forma

    con variables aleatorias independientes de esperanza cero, o equivalentemente,

    (1.2)

    donde es una funcin de distribucin estrictamente creciente, que a su vez puede

    expresarse en la forma

  • 32 UNIVERSIDAD DE GRANADA Modelos de Respuesta Discreta

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    MODELOS LOGIT

    El modelo de regresin logstica simple es de la forma

    (1.3)

    El modelo puede escribirse equivalentemente en la forma

    donde la transformacin recibe el nombre de logit y

    representa la ventaja de respuesta para el valor observado .

    CARACTERSTICAS DE LA CURVA DE RESPUESTA LOGSTICA

    1. La curva logstica representada por la ecuacin (1.3) implica una relacin

    estrictamente montona no necesariamente creciente entre la probabilidad de

    respuesta y la variable explicativa que tiene forma de S y con valores en el

    intervalo .

    2. Si , cuando y cuando

    Si , cuando y cuando

    Esto significa que las rectas e son asntotas horizontales de la curva

    logstica. Adems, implica que la curva es creciente y que es

    decreciente.

    3. La tasa de cambio (crecimiento o decrecimiento) en por cada unidad de

    cambio en n oes constante como en el caso de la regresin lineal.

    Efectivamente, la tasa de cambio es la pendiente de la recta tangente a la curva

    logstica en cada punto

    Observemos que esta funcin depende de y alcanza su valor mximo

    cuando , que corresponde al punto de inflexin de la

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    33

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    curva logstica . Esto quiere decir que la tasa de crecimiento o

    decrecimiento aumenta al aumentar y, adems, tiende a ser muy pequea

    para valores de prximos a cero o a uno.

    4. Cuando el modelo logit (1.3) se verifica con , la curva logstica se convierte

    en una lnea recta y la variable respuesta es independiente de .

    5. Para mayor intuicin debemos tener en cuenta que la curva logstica es la

    funcin de distribucin de una variable aleatoria con distribucin de

    probabilidad logstica. Para comprobarlo, recordemos que la funcin de

    distribucin de una variable aleatoria logstica con parmetro de localizacin y

    parmetro de escala es

    siendo una distribucin simtrica con media y desviacin estndar .

    Por lo tanto, se tiene lo siguiente:

    a) Si , la curva logstica (1.3) es la funcin de distribucin de una

    variable aleatoria logstica de parmetros y .

    b) Si , la curva es la funcin de

    distribucin de una variable aleatoria logstica de parmetros

    y .

    MODELOS PROBIT

    Sea la funcin de distribucin de una normal estndar (media cero y varianza uno)

    dada por

    El modelo probit simple es de la forma

    (1.4)

    y se obtiene tomando como funcin , en la ecuacin general (1.2) de un modelo de

    respuesta binaria, la funcin de distribucin .

  • 34 UNIVERSIDAD DE GRANADA Modelos de Respuesta Discreta

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Una forma equivalente para el modelo probit es

    (1.5)

    CARACTERSTICAS DE LA CURVA DE RESPUESTA PROBIT

    1. La curva del modelo probit (1.4) para conlleva una relacin estrictamente

    montona no necesariamente creciente entre la probabilidad de respuesta y la

    variable explicativa, con forma de S y valores en el intervalo .

    2. Si , cuando y cuando

    Si , cuando y cuando

    Por lo tanto, las rectas e son asntotas horizontales. Adems, se

    puede comprobar fcilmente que implica que la curva es creciente y

    que es decreciente.

    3. Igual que con la curva logstica, la tasa de cambio en por cada unidad de

    cambio en no es constante. En este caso se tiene

    siendo la funcin de densidad de una variable aleatoria con distribucin

    normal estndar. Observemos que la tasa de cambio alcanza su valor mximo

    en la media de la normal estndar , es decir, cuando

    y .

    4. Cuando el modelo probit se verifica con , la curva de respuesta (1.4) se

    convierte en una lnea recta y la variable respuesta es independiente de .

    5. Si , la curva de respuesta (1.4) del modelo probit es la funcin de

    distribucin de una variable aleatoria con distribucin normal de media y

    desviacin estndar .

    Si , la curva es la funcin de distribucin de

    una variable aleatoria normal de media y desviacin estndar .

    COMPARACIN DE LAS CURVAS DE RESPUESTA PARA LOS MODELOS LOGIT Y PROBIT

    Las curvas de respuesta de los modelos logit y probit son muy similares.

    La tasa de cambio mxima de ambas curvas de respuesta se alcanza en . Para

    el modelo logit este valor mximo es , mientras que para el modelo probit es,

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    35

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    aproximadamente, , de modo que coinciden cuando el parmetro del modelo

    logit es veces el del modelo probit.

    Por otro lado, las medias de las distribuciones de probabilidad asociadas a ambas curvas

    de respuesta son iguales. Para , la desviacin estndar de la distribucin logstica

    asociada al modelo logit es , mientras que la de la normal asociada al modelo

    probit es . De este modo, ambas desviaciones estndar coinciden cuando el

    parmetro del modelo logit es veces el del modelo probit.

    Como consecuencia, cuando tanto el modelo logit como el probit se ajustan bien, el

    estimador del parmetro del modelo logit es, aproximadamente, veces el

    del modelo probit. Finalmente, como las colas de la normal son ligeramente ms

    estrechas que las de la distribucin logstica, se aproxima ms rpidamente a y a

    con el modelo probit que con el modelo logit.

    Un caso particular de las curvas de respuesta logit y probit apareen representadas

    grficamente en la Figura 1.

    FIGURA 1. CURVAS LOGIT (LNEA CONTINUA) Y PROBIT (LNEA DISCONTINUA) CON Y

    MODELOS DE VALORES EXTREMOS

    Tanto con el modelo logit como con el modelo probit la curva de respuesta para es

    simtrica respecto de . Esto significa que el grado de aproximacin de a

    y a es el mismo. En este sentido, los modelos logit y probit no son apropiados para

  • 36 UNIVERSIDAD DE GRANADA Modelos de Respuesta Discreta

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    explicar probabilidades de respuesta que se alejen lentamente de cero y se aproximen

    rpidamente a uno, o viceversa.

    Esto justifica considerar curvas de respuesta de la forma

    que son asimtricas respecto de , y se alejan de ms bruscamente que se

    acercan a .

    La forma lineal equivalente a este modelo de respuesta binaria es

    (1.6)

    que recibe el nombre de modelo log-log complementario correspondiente a la

    transformacin del lado izquierdo de la ecuacin (1.6).

    El modelo alternativo en el que se aleja rpidamente de y se acerca lentamente a

    es:

    (1.7)

    O, equivalentemente, en forma lineal

    que recibe el nombre de modelo log-log de la transformacin del lado izquierdo de la

    ecuacin anterior.

    CARACTERSTICAS DE LA CURVA DE RESPUESTA DE LOS MODELOS DE VALORES EXTREMOS

    1. Tanto para el modelo log-log complementario como para el modelo log-log, e

    igual que para los modelos logit y probit, las curvas de respuesta para

    implican una relacin estrictamente montona entre la probabilidad de

    respuesta y la variable explicativa, con forma de S y valores en el intervalo .

    De nuevo, las rectas e son asntotas horizontales.

    2. Para el modelo log-log complementario se tiene lo siguiente:

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    37

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Si , cuando y cuando . En este caso la

    curva es estrictamente creciente.

    Si , cuando y cuando , y la curva de

    respuesta es estrictamente decreciente.

    3. Para el modelo log-log se verifica:

    Si , cuando , cuando , y la curva es

    estrictamente decreciente.

    Si , cuando , cuando , y la curva es

    estrictamente creciente.

    4. La tasa de cambio en para el modelo log-log complementario es

    que alcanza su valor mximo en el punto de inflexin de la curva

    al que corresponde .

    5. Anlogamente, la tasa de cambio en del modelo log-log es:

    que alcanza su valor mximo en el punto de inflexin de la curva

    , al que corresponde .

    6. De nuevo, convierte a los modelos de valores extremos en una recta e

    implica que la variable respuesta es independiente de la variable explicativa .

    7. Para justificar la nomenclatura de modelos de valores extremos, observemos

    que la curva de respuesta del modelo log-log dada por (1.7) es la funcin de

    distribucin de una variable aleatoria con distribucin de probabilidad de

    Gumbel o de valores extremos6.

    Un ejemplo de curvas de respuesta de modelos de valores extremos aparece en la

    Figura 2.

    6 Recordemos que una variable aleatoria con distribucin de Gumbel de parmetros y tiene funcin de distribucin

    con esperanza y desviacin estndar . Por lo tanto, la curva de respuesta del modelo log-log es la funcin de distribucin de una Gumbel de parmetros y si , o si .

  • 38 UNIVERSIDAD DE GRANADA Modelos Logit con variables explicativas cuantitativas

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    FIGURA 2. CURVA DE RESPUESTA LOGIT CON Y (TRAZO CONTINUO), CURVA LOG-LOG CON Y

    (TRAZO DISCONTINUO A RAYAS) Y MODELO LOG-LOG COMPLEMENTARIO CON Y (TRAZO

    DISCONTINUO PUNTEADO)

    MODELOS LOGIT CON VARIABLES EXPLICATIVAS CUANTITATIVAS

    Una vez introducidos los distintos modelos para explicar una variable de respuesta

    binaria a partir de un conjunto de variables explicativas, pasamos a continuacin al

    estudio detallado de los modelos de regresin logstica en el caso de variables

    explicativas cuantitativas7 observadas sin error.

    7 Si se tiene alguna variable independiente categrica, es necesario definir una serie de variables

    nuevas, artificiales, que servirn para poder pasar de una variable categrica con categoras a

    variables indicadoras de la presencia de cada categora, por separado. Dichas variables de

    diseo, tambin conocidas como variables ficticias o dummies, son introducidas en el modelo

    como variables continuas, tal y como se explica a continuacin.

    Para crear las variables de diseo asociadas a una variable con categoras podemos elegir

    entre dos posibles mtodos: el mtodo parcial y el mtodo marginal.

    El mtodo parcial consiste en elegir una categora de referencia dentro de las posibles y

    construir para cada una de las restantes una variable que valga 1 en la categora considerada y 0

    en el resto. Por ejemplo, si tenemos una variable con las categoras bajo, medio y alto,

    podramos elegir bajo como categora de referencia y crear dos variables de diseo: una que

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    39

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    Comenzamos por la formulacin del modelo e interpretacin de sus parmetros,

    despus abordaremos el problema de su estimacin y contrastes de bondad de ajuste, y

    finalizaremos con la validacin y seleccin del modelo ms apropiado.

    MODELO DE REGRESIN LOGSTICA SIMPLE

    Consideremos, en primer lugar, el caso de una variable explicativa cuantitativa .

    Recordemos que el modelo de regresin logstica para una variable aleatoria binaria

    es un modelo lineal para el logaritmo de la ventaja de respuesta en cada valor

    observado de la variable explicativa.

    (3.1)

    que, equivalentemente, se puede expresar de la siguiente forma en trminos de la

    probabilidad de respuesta en :

    Curva de respuesta que es estrictamente creciente si , y estrictamente decreciente

    para .

    valga 1 cuando se de la categora medio y 0 en los otros dos casos y una segunda variable que

    valga 1 cuando se de la categora alto y 0 en los otros dos casos. Estas dos variables son las que

    entran en el modelo.

    El mtodo marginal es similar en su concepto, salvo que en esta ocasin todas las dummies

    toman el valor -1 cuando se da la categora de referencia, en lugar de 0.

    Un caso especial es el de las variables ordinales, ya que adems de poder usar los mtodos

    anteriores, contamos con la posibilidad ordenar las categoras, asignar puntuaciones y tratarla

    como continua.

    Lo comn en epidemiologa es utilizar el mtodo parcial, que permite interpretar los parmetros

    en trminos de cocientes de ventajas de forma sencilla.

  • 40 UNIVERSIDAD DE GRANADA Modelos Logit con variables explicativas cuantitativas

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    La curva tiene forma de S y est acotada dentro del intervalo , siendo las rectas

    e asntotas horizontales. Su crecimiento es montono, pudiendo ser

    creciente, si , o decreciente, si . Por tanto, con la probabilidad de

    respuesta tender a 1 para y a 0 para . La situacin se invierte si .

    Si la curva es en realidad una recta e es independiente de .

    En este modelo el riesgo relativo de respuesta para dos valores distintos y

    del predictor se define como:

    y el cociente de ventajas de respuesta dados dos valores distintos y del

    predictor se define como:

    Ambos conceptos estn relacionados por la expresin:

    De esta forma, si la probabilidad de respuesta es cercana a 0, el riesgo relativo

    puede ser aproximado mediante el cociente de ventajas.

    INTERPRETACIN DE PARMETROS

    1. Si , entonces , que quiere decir que la variable es

    independiente de puesto que no depende de .

    2. El parmetro es el valor comn del logaritmo de las ventajas de respuesta

    frente a respuesta cuando ; es decir, cuando la respuesta es

    independiente de la variable explicativa. Su exponencial es, por tanto, la ventaja

    de respuesta .

    3. La frmula general del modelo logit simple (3.1) implica que por cada unidad de

    incremento en , el logit de respuesta aumenta aditivamente en unidades.

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    41

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    De la misma frmula se obtiene la siguiente expresin para la ventaja de la

    respuesta en cada observado:

    que significa que la ventaja de respuesta aumenta multiplicativamente por

    cada unidad de incremento en . De hecho,

    4. El cociente de ventajas de respuesta para dos valores diferentes y de

    es de la forma

    La ventaja o preferencia de la respuesta frente a la toma valores en el

    intervalo . Por lo tanto, el cociente de ventajas tiene el mismo

    rango de variacin y la siguiente interpretacin:

    si, y slo si,

    si, y slo si,

    En este caso la ventaja de respuesta es veces mayor para

    que para .

    si, y slo si,

    En este caso la ventaja de respuesta es veces mayor para

    que para .

    5. La exponencial del parmetro , , es el cociente de ventajas de respuesta

    para dos valores de que se diferencian en una unidad. Es decir,

    MODELO DE REGRESIN LOGSTICA MLTIPLE

    Consideremos ahora el caso de variables explicativas cuantitativas no aleatorias

    . Para cada combinacin de valores observados , ,,

    de las variables explicativas, la variable respuesta tiene distribucin de Bernoulli

  • 42 UNIVERSIDAD DE GRANADA Modelos Logit con variables explicativas cuantitativas

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    siendo

    El modelo de regresin logstica mltiple para la variable respuesta en trminos de

    valores observados de las variables explicativas es de la forma:

    donde son errores aleatorios que se consideran centrados e

    independientes, de modo que

    Denotando a partir de ahora , , y con

    , el modelo quedar resumido como:

    (3.2)

    donde es el vector columna de parmetros .

    Equivalentemente, el modelo de regresin logstica mltiple se puede ver como un

    modelo de regresin lineal mltiple para la transformacin logit,

    (3.3)

    A partir de los parmetros podemos calcular los cocientes de ventaja de respuesta

    como las exponenciales de dichos parmetros. Es lo que conocemos como ODDS

    RATIO (OR). La interpretacin de estos parmetros vara ligeramente segn la naturaleza

    de la variable que le acompaa. Si la variable es continua, el cociente de ventajas

    representa la variacin en la ventaja de respuesta por cada unidad de aumento

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    43

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    de la variable cuando el resto de variables permanece constante8. Al aumentar en una

    unidad dicha variable y dejar el resto fijas, la ventaja de respuesta queda

    multiplicada por la exponencial de (OR). Por lo tanto, si (equivalentemente,

    ), significa que dicha variable en concreto no afecta a la respuesta. Si

    ( ) se tiene que la ventaja de respuesta disminuye. En trminos

    epidemiolgicos se dice que esa variable es un factor protector. Si ( ), la

    ventaja aumenta y se tiene un factor de riesgo.

    INTERPRETACIN DE PARMETROS

    1. Si entonces , que quiere decir que la

    variable es independiente de las variables explicativas.

    2. El parmetro es el valor comn del logaritmo de las ventajas de respuesta

    frente a respuesta cuando la respuesta es independientes de las

    variables explicativas.

    Por otro lado, es el valor del logaritmo de la ventaja de respuesta para

    un individuo con .

    3. El cociente de ventajas de respuesta para dos combinaciones diferentes

    de valores de las variables explicativas, y

    , es de la forma

    Para dos valores y que se diferencien en una unidad, , para

    , se tendra

    8 Si la variable original es categrica y se han definido las dummies con el mtodo parcial, tenemos una OR para cada una de las variables de diseo (es decir, cada una de las categoras) y dicho valor representa la ventaja de respuesta de esa categora en concreto con respecto a la categora de referencia, cuando el resto de variables queda fijo. Los conceptos de factor protector y factor de riesgo siguen teniendo validez en este caso. Si las dummies han sido definidas mediante el mtodo marginal, la interpretacin de los parmetros es algo ms compleja. Cada parmetro es la desviacin del logit de la categora que lleva asociada con respecto a la media de todos los logit, por lo que la exponencial del parmetro es el cociente entre la ventaja de respuesta para su categora asociada y la media geomtrica de todas las ventajas de respuesta .

  • 44 UNIVERSIDAD DE GRANADA Modelos Logit con variables explicativas cuantitativas

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    4. Para dar una interpretacin ms intuitiva de los parmetros del modelo, vamos

    a calcular el cociente de ventajas de respuesta cuando una de las variables

    explicativas se incrementa en una unidad y las otras se controlan haciendo que

    tomen valores fijos.

    Como ejemplo, incrementamos en una unidad la variable y las restantes

    variables explicativas las mantenemos fijas. Entonces, sustituyendo por

    y , en la frmula obtenida anteriormente

    para el cociente de ventajas, se tiene

    Esto significa que al aumentar en una unidad una de las variables y controlar las

    dems, la ventaja de respuesta queda multiplicada por la exponencial del

    coeficiente de la variable incrementada.

    De este modo, si la exponencial de un parmetro es mayor que uno la

    probabilidad de respuesta aumenta cuando aumenta la variable

    correspondiente y se controlan las dems, mientras que si es menor que uno la

    relacin es inversa.

    MODELOS CON INTERACCIN

    Hasta ahora no se ha considerado la posibilidad de interaccin entre las variables

    explicativas de un modelo de regresin logstica mltiple.

    INTERACCIN Y CONFUSIN

    Observemos que en los modelos de regresin logstica mltiple considerados hasta

    ahora, los cocientes de ventajas que miden la asociacin entre la variable de respuesta y

    cada variable explicativa son independientes del valor fijo del resto de variables

    explicativas controladas. Esto significa que son modelos sin interaccin porque el grado

  • UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO

    45

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    de asociacin entre la variable de respuesta y cada una de las variables explicativas es el

    mismo en todas las combinaciones de niveles de las otras variables independientes.

    Se pueden considerar interacciones de distintos rdenes. Las ms simples son las de

    orden uno (entre dos variables explicativas) que representan el grado en que la

    asociacin entre la variable de respuesta y una variable depende de los valores de una

    tercera que interacciona con esta ltima. Las interacciones de orden dos involucran a

    tres variables y as sucesivamente. Por simplicidad no consideraremos interacciones de

    orden superior a uno que conllevaran productos entre tres o ms variables.

    En epidemiologa es usual distinguir entre el factor de riesgo que puede ser causa de una

    enfermedad y otras covariables de inters que hay que controlar en el estudio

    estadstico para analizar la asociacin entre el factor de riesgo y el padecimiento de la

    enfermedad. En este tipo de estudios es usual distinguir entre factores de confusin y

    factores modificadores del efecto del factor de riesgo sobre la enfermedad.

    Una variable es de confusin cuando est asociada con el factor de riesgo de modo que

    la asociacin marginal entre la variable de respuesta y el factor de riesgo cambia

    significativamente al incluirla en el anlisis estadstico.

    Una variable es modificadora del efecto cuando la asociacin entre la variable de

    respuesta y el factor de riesgo cambia en funcin de sus valores. Es decir, se trata de una

    variable que interacciona con el factor de riesgo.

    De lo anterior se deduce que los factores de confusin tienen que ser considerados

    forzosamente en el modelo, aunque puede que no interaccionen con el factor de riesgo.

    FORMULACIN DE MODELOS CON INTERACCIN

    La interaccin entre dos variables cuantitativas se incluye en el modelo de regresin

    logstica como producto de ambas variables. En general, el trmino de interaccin entre

    dos variables cuantitativas y es de la forma .

    Como consecuencia, el modelo de regresin logstica mltiple con interacciones entre

    cada par de covariables es de la forma

  • 46 UNIVERSIDAD DE GRANADA Modelos Logit con variables explicativas cuantitativas

    M

    st

    er

    en

    Es

    ta

    ds

    ti

    ca

    Ap

    lic

    ad

    a

    En este caso, el cociente de ventajas de respuesta cuando se incrementa en una

    unidad una variable y se controlan fijas las dems depende del valor de las variables

    controladas

    poniendo claramente en evidencia la interaccin de cada variable con el resto.

    AJUSTE DE MODELOS LOGIT

    A continuacin abordamos el problema de la estimacin de los parmetros de los

    modelos logit.

    Los datos estn constituidos por un