Modelos de elecci on discreta´ - ugr.esromansg/material/WebEco/Eco2-Discreta.pdf · El modelo...

Econometrıa II Modelos de eleccion discreta – 1 / 37

Modelos de eleccion discreta

Econometrıa II

Grado en Economıa

Universidad de Granada

18:28:36

Contenidos

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad

El modelo Logit y Probit

Inferencia en los

modelos de eleccion

discreta

Interpretacion de los

coeficientes

Bondad de ajuste

Contrastacion de

hipotesis

Modelos de alternativas

multiples


Introduccion

Modelos de eleccion binaria

Modelo Lineal de Probabilidad


Inferencia en los modelos de eleccion discreta

Interpretacion de los coeficientes

Bondad de ajuste

Contrastacion de hipotesis

Modelos de alternativas multiples

18:28:36

Introduccion

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


18:28:36

Introduccion

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


Hasta el momento se ha trabajado con variables cualitativas incluyendolas dentrodel grupo de variables independientes, pero ¿puede la variable dependiente serde naturaleza cualitativa? ¿que ocurre en tal caso? ¿sigue siendo valido elmodelo lineal y su estimacion por Mınimos Cuadrados?

En ocasiones, analizamos datos donde la variable dependiente de interes tomavalores discretos:

Variables dependientes binarias (ej: comprar o no comprar, conceder o no unprestamo, tener o no una enfermedad).Variables discretas sin ordenacion (ej: tren, autobus...).Variables discretas con orden (ej: calificacion o rating financiero).

Un modelo de regresion lineal puede no ser lo mas adecuado en estos casos porque:

los resultados son difıciles de interpretar: no se puede hablar de cambio continuo.

la variable dependiente solo admite valores discretos, y puede que solo no-negativos.podemos estar interesados en estimar la probabilidad de la ocurrencia de los dis-tintos valores de la variable dependiente y no tanto en el valor esperado predicho.

A continuacion analizaremos con algo mas de profundidad los problemas quesurgen al considerar un modelo de regresion lineal clasico en el que la variable de-pendiente es cualitativa (mas concretamente, binaria) y se plantearan las dos princi-pales alternativas que se tienen en este caso: los modelos logit y probit.

18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


De los ejemplos considerados anteriormente, este capıtulo se centra fundamental-mente en el caso en el que la variable dependdiente es una variable binaria (di-cotomica). Es decir, supondremos que la variable dependiente Y solo puede tomardos valores:

Y =

{1 , con probabilidad p0 , con probabilidad 1− p

, (1)

donde el valor 1 denota que el individuo ha tomado alguna accion. La variable Y , portanto, sigue una distribucion de Bernoulli:

Pr(Y = y) = py(1− p)1−y , (2)

E(Y ) = p,

V ar(Y ) = p(1− p).

En tal caso, se estara interesado en analizar cual es la probabilidad de que elindividuo i, dadas sus caracterısticas (es decir, valores de las variables independien-tes, Xi), tome una accion (es decir, Yi = 1).

18:28:36

Modelos de eleccion binaria: ejemplo

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


A lo largo del presente capıtulo desarrollaremos el siguiente ejemplo:

En numerosas ocasiones los docentes nos hemos preguntado por los factoresque influyen en que un estudiante apruebe o no las asignaturas que impartimos.Esta cuestion es aun mas interesante desde el punto de vista del alumno. Por tanto,serıa deseable poder proporcionar a los mismos una orientacion sobre factores queles puedan ayudar a obtener un mayor desempeno en la asignatura.

Para analizar que factores influyen (positiva o negativamente) en el desempeno(rendimiento) academico de los alumnos se propone realizar una regresion logısticadonde la variable dependiente es codificada como 1 para aquellos alumnos con unacalificacion final de 5 o superior y como 0 en caso contrario. Es decir, el desempenose mide como una variable binaria que considera los valores de aprobado (exito) osuspenso (fracaso). Por tanto, el modelo econometrico planteado estima la probabili-dad que tiene un alumno de superar la asignatura. Como variables independientes seconsideran la realizacion de ejercicios en pizarra, EP , en ordenador, EO, y exame-nes tipo test, TT , sobre cada tema.

18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad

❖Modelo Lineal de

Probabilidad

❖ Inconvenientes


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad

❖Modelo Lineal de

Probabilidad

❖ Inconvenientes


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


El Modelo Lineal de Probabilidad consiste simplemente en considerar un modelode regresion lineal en el que la variable dependiente es binaria, es decir:

Yi = β1 + β2X2i + · · ·+ βkXki + ui, i = 1, . . . , n, (3)

con u ∼ N(0, σ2) e Yi de la forma dada en (1). En este caso, dados los valoresx2, ..., xk de las variables independientes, se verifica que:

E(Yi|X = x) = Pr(Yi = 1|X = x) · 1 + Pr(Yi = 0|X = x) · 0= Pr(Yi = 1|X = x),

E(Yi|X = x) = E(β0 + β1X2i + · · ·+ βkXki + ui|X = x)

= β1 + β2x2i + · · ·+ βkxki.

Es decir, la parte derecha de la ecuacion (3) debe ser interpretada como la probabi-lidad de que la variable dependiente sea igual a la unidad:

pi = Pr(Yi = 1|X = x) = β1 + β2x2i + · · ·+ βkxki. (4)

Y, por tanto, βi es la variacion de la probabilidad de que Yi = 1 asociada con unavariacion unitaria en Xi, manteniendo constantes las otras variables explicativas(con i = 1, . . . , k).

Todo lo que conocido sobre el modelo de regresion lineal se puede aplicardirectamente: estimacion, contraste de hipotesis, interpretacion de los parametros,etc. Solo debemos recordar que la esperanza condicional es, en este caso, una pro-babilidad, por lo que 0 ≤ E(Yi|X = x) ≤ 1.

18:28:36

Inconvenientes del Modelo Lineal de Probabilidad

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad

❖Modelo Lineal de

Probabilidad

❖ Inconvenientes


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


La distribucion de la muestra en este tipo de modelos se caracteriza por una nube depuntos de tal manera que las observaciones muestrales se dividen en dos subgrupos:uno formado por las observaciones en las que ocurrio el acontecimiento objeto deestudio (Yi = 1), y otro, por los puntos muestrales en los que no ocurrio (Yi = 0).

−0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

40 45 50 55 60 65

Y

X

Y con respecto a X (con ajuste mínimo−cuadrático)

Y = −2.29 + 0.0544X

Por tanto, el coeficiente de determinacion R2 no es particularmente util porque noes posible que todos los datos se encuentren exactamente en la recta de regresion(R2 = 1).

18:28:36

Inconvenientes del Modelo Lineal de Probabilidad

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad

❖Modelo Lineal de

Probabilidad

❖ Inconvenientes


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


Otros inconvenientes importantes son:

Puesto que la variable dependiente solo toma valores 0 o 1, el supuesto de nor-malidad de las perturbaciones no se cumple ya que siguen la distribucion deBernoulli:

ei = Yi − Yi Probabilidad

Yi = 1 1 − β1 − β2X2i − · · · − βkXki p

Yi = 0 −β1 − β2X2i − · · · − βkXki 1 − p

Perturbaciones heteroscedasticas (incumplimiento de la hipotesis de homoce-dasticidad) ya que su varianza depende de las variables independientes:

V ar(ei) = E(ei − E(ei))2 = E(ei)

2

= (1− β1 − β2X2i − · · · − βkXki)2p

+ (−β1 − β2X2i − · · · − βkXki)2(1− p).

Las predicciones de la variable dependiente pueden estar fuera del rango [0, 1].El modelo lineal de probabilidad implica que el efecto marginal de cada una de lasvariables explicativas es constante. Este supuesto no es muy razonable ya quees esperable que las variaciones en la probabilidad sean distintos en los valorescentrales de las variables dependientes a las producidas en sus extremos.

18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


❖Modelo Logit

❖Modelo Probit

❖Comparacion modelos

Logit y Probit

Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


❖Modelo Logit

❖Modelo Probit


Logit y Probit

Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


Como se ha puesto de relevancia, el modelo lineal de probabilidad presenta impor-tantes inconvenientes que desaconsejan su uso ante variables dependientes binariasy crea la necesidad de recurrir a otros tipos de modelos.

Las regresiones Probit y Logit son modelos de regresion no lineales disenadosespecıficamente para variables dependientes binarias. Se trata de adoptar una for-mulacion no lineal que obligue a que los valores estimados esten entre 0 y 1 ya que,como hemos visto, la regresion con una variable binaria dependiente Y modeliza laprobabilidad de que Y = 1.

La regresion Logit utiliza una funcion de distribucion logıstica, mientras que laregresion Probit utiliza una funcion de distribucion normal estandar. Ambas funcio-nes de distribucion de probabilidad dan lugar a probabilidades ente 0 y 1, y presentanun crecimiento no lineal (con mayores incrementos en la parte central). De esta formase resuelven dos de los problemas anteriormente senalados.

−5 −4 −3 −2 −1 0 1 2 3 4 50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

−5 −4 −3 −2 −1 0 1 2 3 4 50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Figura 1: Representacion grafica de la funcion logıstica (izquierda) y de la

probabilidad acumulada de una normal (derecha)

18:28:36

Modelo Logit

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


❖Modelo Logit

❖Modelo Probit


Logit y Probit

Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


El modelo de regresion Logit se basa en la funcion logıstica:

f(z) =1

1 + e−z=

1

1 + 1ez

=ez

1 + ez,

la cual esta acotada entre 0 y 1 ya que:

lımz→−∞

f(z) = 0, lımz→∞

f(z) = 1,

y, como se muestra en la Figura 1, presenta una forma de S que se ajusta al creci-miento no lineal deseado (leves incrementos en los extremos y mayores en la partecentral).El modelo de regresion Logit sera de la forma:

Yi = f(Zi) + ui, ı = 1, . . . , n, (5)

donde Zi = β1+β2X2i+ · · ·+βkXki y, dados los valores de las variables indepen-dientes x2, ..., xk, las probabilidades de que la variable dependiente tome los valores1 y 0 son:

Pr(Y = 1|x2, ..., xk) = E(Yi|X = x) =ezi

1 + ezi,

Pr(Y = 0|x2, ..., xk) = 1− ezi

1 + ezi=

1

1 + ezi,

con zi = β1 + β2x2i + · · ·+ βkxki.

18:28:36

Modelo Probit

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


❖Modelo Logit

❖Modelo Probit


Logit y Probit

Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


El modelo de regresion Probit se basa en la distribucion de probabilidad acumuladade una normal tipificada:

Φ(z) = Pr(Z ≥ z) =1√2π

∫ z

−∞

e−s2

2 ds,

donde Z ∼ N(0, 1) y es tal que, dados los valores x2, ..., xk de las variables inde-pendientes, se verifica que:

Pr(Y = 1|x2, ..., xk) = Φ(zi),

con zi = β1 + β2x2i + · · ·+ βkxki tal que:

Y =

{1 si zi > 00 si zi < 0

.

18:28:36

Comparacion modelos Logit y Probit

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


❖Modelo Logit

❖Modelo Probit


Logit y Probit

Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


Los modelos logit y probit comparten practicamente las mismas carecterısticas: sonmodelos no lineales que son estimados por los metodos estudiados en el tema ante-rior (mınimos cuadrados no lineales o maxima verosimilitud), donde la interpretacionde los coeficientes no es tan inmediata como en el modelo lineal de probabilidad.Ademas, en ambos casos hay que buscar una medida alternativa al coeficiente dedeterminacion para medir la bondad del ajuste realizado.

La unica diferencia entre ambos modelos es que la funcion logıstica (curva azul)tiene colas mas anchas, por lo que la probabilidad de exito sera mayor en los extre-mos cuando se use el modelo logit.

−5 −4 −3 −2 −1 0 1 2 3 4 50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

18:28:36

Inferencia en los modelos de eleccion discreta

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta

❖Metodo de MV


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


18:28:36

Metodo de Maxima Verosimilitud

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta

❖Metodo de MV


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


Como la relacion entre la variable dependiente y las explicativas es no lineal no sepuede aplicar el metodo de MCO.

Si se usa el metodo de maxima verosimilitud, a partir de (2) y (4) se obtiene lafuncion de densidad conjunta:

L =

n∏

i=1

pyii (1− pi)

1−yi ,

la cual, al considerar logaritmos neperianos queda:

lnL =

n∑

i=1

(yi ln(pi) + (1− yi) ln(1− pi)

)

=

n∑

i=1

(yi ln(pi)− yi ln(1− pi) + ln(1− pi)

)

=

n∑

i=1

yi ln

(pi

1− pi

)+

n∑

i=1

ln(1− pi) =

n∑

i=1

yizi −n∑

i=1

ln(1 + ezi ),

donde se ha llamado zi = ln(

pi1−pi

).

18:28:36

Metodo de Maxima Verosimilitud

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta

❖Metodo de MV


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples


Teniendo en cuenta que pi = β1 + β2x2i + · · ·+ βkxki, derivar la expresion anteriorcon respecto a cada coeficiente conduce a:

∂ lnL

∂β1=

n∑

i=1

yi −n∑

i=1

(ezi

1 + ezi

),

∂ lnL

∂βj=

n∑

i=1

yixji −n∑

i=1

(ezi

1 + ezi

)xji, j = 2, . . . , k.

Al igualar a cero las derivadas anteriores se obtiene el siguiente sistema de ecua-ciones normales no lineal que tendra que ser resuelto mediante un algoritmo deoptimizacion:

n∑

i=1

yi −n∑

i=1

(ezi

1 + ezi

)= 0.

n∑

i=1

yixji −n∑

i=1

(ezi

1 + ezi

)xji = 0, j = 2, . . . , k.

Bajo supuestos generales, los estimadores ası obtenidos son consistentes, asintoti-camente eficientes y con distribucion asintotica normal.

Ademas, aplicando este metodo de estimacion se solventa el problema de hete-roscedasticidad anteriormente comentado.

18:28:36

Interpretacion de los coeficientes

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

❖Efecto marginal

❖Odd ratio

Bondad de ajuste

Contrastacion de

hipotesis


multiples


18:28:36

Efecto marginal

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

❖Efecto marginal

❖Odd ratio

Bondad de ajuste

Contrastacion de

hipotesis


multiples


En los modelos lineales (como el modelo lineal de probabilidad) la derivada parcialde la variable dependiente, Y , con respecto a cada una de las variables explicativas,Xj , j = 1, . . . , p, es la constante βj , y se interpreta como el cambio producido enY cuando Xj aumenta una unidad. Puesto que los modelos logit y probit son nolineales, esta interpretacion no es correcta.

En el modelo Logit, partiendo de (5), la derivada parcial anterior es:

∂Yi

∂Xji=

e−Zi

(1 + e−Zi )2· βj , j = 1, . . . , k,

mientras que en el probit

∂Yi

∂Xji= φ(zi)βj , j = 1, . . . , k,

siendo φ la funcion de densidad de la distrbucion normal tipificada.Por tanto, el efecto marginal en ambos modelos depende de los valores que

toman las variables explicativas (ya no es constante: uno de los objetivos persegui-dos por estos modelos). Pueden, por tanto, calcularse los efectos marginales paracada observacion de la muestra (alternativamente, los efectos marginales puedenevaluarse para el valor medio de las variables explicativas).

Puesto que la exponencial y la funcion de densidad φ son siempre positivas, quedaclaro que el signo de los coeficientes indica la direccion del efecto marginal.Es decir, un signo positivo indicara una relacion directa, mientras que uno negativoinversa.

18:28:36

Efecto marginal: ejemplo

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

❖Efecto marginal

❖Odd ratio

Bondad de ajuste

Contrastacion de

hipotesis


multiples


Para el ejemplo planteado, considerando un modelo de regresion logıstica de la for-ma dada en (5) con Zi = β1 + β2EPt + β3EOt + β4TTt, se obtiene la siguienteestimacion:

β1 = −3.3537, β2 = 0.1535, β3 = 0.2529, β4 = 4.6931.

Puesto que todas las estimaciones de los coeficientes de las variables inde-pendientes tienen signo positivo, se tiene que el efecto marginal de estas variablessera positivo. Es decir, incrementos en estas variables significaran (siempre que serechaze la hipotesis nula en los contrastes de significacion individual) un aumentoen la probabilidad de aprobar.

¿Cuanto aumenta la probabilidad de aprobar si, para la misma calificacion en losejercicios en la pizarra y mismo porcentaje de preguntas correctas en los tipo test,se pasa de obtener una calificacion de 3 en el examen de ordenador a 4?

Considerando, por ejemplo, fijos los valores EP = 5 y TT = 0.6, se tiene que:

Pr(Y = 1|EP = 5, EO = 3, TT = 0.6) = 0.7287639,

Pr(Y = 1|EP = 5, EO = 4, TT = 0.6) = 0.7757833,

es decir, el incremento de la probabilidad es 0.0470194.

¿Es este incremento constante?

18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

❖Efecto marginal

❖Odd ratio

Bondad de ajuste

Contrastacion de

hipotesis


multiples


EP EO TT Pr(Y = 1) Incremento

5 0 0.6 0.55716405 1 0.6 0.6183522 0.06118825 2 0.6 0.6760023 0.05765015 3 0.6 0.7287639 0.05276165 4 0.6 0.7757833 0.04701945 5 0.6 0.8167018 0.04091855 6 0.6 0.8515816 0.03487985 7 0.6 0.8807929 0.02921135 8 0.6 0.9048969 0.0241045 9 0.6 0.9245446 0.01964775 10 0.6 0.9404006 0.015856

Tal y como se observa en la tabla, para los valores constantes de calificacion enpizarra de 5 y de un 60% de preguntas correctas en los examenes tipo test, el cambioen la probabilidad de aprobar a medida que cambia la calificacion en el examen deordenador no es constante.

Cada una de las probabilidades anteriores se obtiene sustituyendo el correspon-diente valor de EP , EO y TT en la siguiente expresion:

eZi

1 + eZi

,

donde Zi = β1 + β2EPt + β3EOt + β4TTt.

18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

❖Efecto marginal

❖Odd ratio

Bondad de ajuste

Contrastacion de

hipotesis


multiples


Si se hubiese considerado un modelo Probit, las probabilidades de exito anterioresse hubiesen obtenido a partir de la siguiente expresion:

Pr(Y = 1|EP = ep, EO = eo, TT = tt) = Φ(zi) = Pr(Z ≤ zi),

donde zi = β1 + β2ep+ β3eo+ β4tt y Z ∼ N(0, 1).En el ejemplo que nos ocupa:

Pr(Y = 1|EP = 5, EO = 3, TT = 0.6) = Pr(Z ≤ 0.98836) ≃ 0.8389,

Pr(Y = 1|EP = 5, EO = 4, TT = 0.6) = Pr(Z ≤ 1.24126) ≃ 0.8925,

y entonces el incremento de la probabilidad es de 0.0536.

18:28:36

Odd ratio

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

❖Efecto marginal

❖Odd ratio

Bondad de ajuste

Contrastacion de

hipotesis


multiples


En la practica, en el modelo logit, lo que se suele hacer es calcular la razon entreambas probabilidades, cociente denominado odd-ratio, es decir:

pi

1− pi=

ezi1+ezi

11+ezi

= ezi ,

con zi = β1 + β2x2i + · · ·+ βkxki.

Por tanto, el odd ratio es el numero de veces que es mas probable que ocurra elfenomeno o suceso frente a que no ocurra.

El odd-ratio asociado a un cambio de xjh a xjl, h 6= l, h, l = 1, . . . , n en la va-riable Xj , j = 1, . . . , k, supuesto que el resto de variables permanecen constantes,viene dado por:

ezh

ezl= eβj(xjh−xjl).

En tal caso:

Si no existe relacion entre la variable dependiente y la variable en estudio el odd-ratio toma el valor uno.Si la variable dependiente incrementa la probabilidad sobre la variable explica-da el odd-ratio sera superior a uno tanto mayor cuanto mas elevada sea estarelacion.Si la variable dependiente disminuye la probabilidad de la variable explicada elodd-ratio sera menor que uno.

18:28:36

Odd ratio: ejemplo

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

❖Efecto marginal

❖Odd ratio

Bondad de ajuste

Contrastacion de

hipotesis


multiples


Los odd-ratios asociados a un cambio unitario en las variables del ejemplo conside-rado se recogen en la siguiente tabla:

Variables EP EO TT

Odd-ratio 1.1659 1.2878 109.1859

Adviertase que dichos valores se han obtenido a partir de la expresion eβj , conj = 2, 3, 4. Los odd-ratios asociados a un cambio de 5 unidades en cada una de las

variables serıa obtenido a partir de e5·βj .Ası, por ejemplo, para un alumno que tiene una calificacion en ordenador un

punto superior a otro es 1.2878 veces mas probable que apruebe. Un alumno quetiene una calificacion 5 veces superior a otro es 3.541322 veces mas probable queapruebe.

18:28:36

Bondad de ajuste

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

❖Coeficiente de

McFadden y proporcion

de aciertos

Contrastacion de

hipotesis


multiples


18:28:36

Coeficiente de McFadden y proporcion de aciertos

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

❖Coeficiente de


de aciertos

Contrastacion de

hipotesis


multiples


En los modelos logit y probit, debido a que el metodo de estimacion no es el de MCOsino el de MV, no podemos utilizar el coeficiente de determinacion clasico para medirla bondad del ajuste. Recordemos que este era uno de los problemas que surgıan enel modelo lineal de probabilidad. En su lugar, se utiliza el pseudo R2 de McFadden:

R2 = 1− lnL

lnLr,

donde lnL es el logaritmo neperiano de la funcion de verosimilitud del modelo sinrestricciones (el modelo con todas las variables explicativas) y lnLr es el logarit-mo neperiano de la funcion de verosimilitud del modelo restringido (solo incluye eltermino independiente del modelo).

Otra opcion para analizar la bondad del modelo es contabilizar el porcentaje deaciertos del modelo teniendo en cuenta que, por ejemplo, las probabilidades predi-chas por encima de 0.5 contabilizan como Yi = 1 y menores que 0.5 estiman Yi = 0:

Yi = 1 Yi = 0Yi = 1 A BYi = 0 C D

En los casos A y D se habra predicho correctamente el valor de Y , por tanto, la

proporcion de aciertos vendra dada por el cociente A+Dn

.

Si se desea ser exigente con el modelo (lo recomendado), en lugar de usar elumbral del 0.5 se debe usar la proporcion de exitos (de unos) que hay en la variabledependiente.

18:28:36

Proporcion de aciertos: ejemplo

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

❖Coeficiente de


de aciertos

Contrastacion de

hipotesis


multiples


Observados - Predichos Suspensos Aprobados Total Porcentaje

Suspensos 14 6 20 70%Aprobados 22 83 105 79.04%

Total 36 89 125 77.6%

En la tabla anterior se cruzan las observaciones disponibles sobre el numero de sus-pensos y aprobados con las predicciones realizadas por el modelo. Recordemos queel modelo logıstico proporciona la probabilidad de aprobar, por tanto, es necesarioestablecer un umbral para clasificar dicha probabilidad como aprobada o suspen-sa. En este caso, puesto que en la muestra se tiene un 84% de aprobados se hadecidido que una probabilidad por debajo de 0.84 sea clasificada como suspenso ypor encima como aprobado (se puede apreciar por tanto que se ha establecido unumbral bastante exigente).

Con esta premisa se tiene que de los 20 suspensos clasifica bien a 14 (un 70%),mientras que de los 105 aprobados clasifica correctamente a 83 (un 79.04%). Final-mente, el modelo ajustado clasifica adecuadamente un 77.6% de los datos (97 de125), una cifra mas que aceptable si se tiene en cuenta las exigencias establecidas.

18:28:36

Contrastacion de hipotesis

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis

❖Significacion individual

de los coeficientes

❖Significacion conjunta

de los coeficientes


multiples


18:28:36

Significacion individual de los coeficientes

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


de los coeficientes


de los coeficientes


multiples


Para realizar contrastes de significacion individual sobre los coeficientes:

H0 : βj = 0H1 : βj 6= 0

},

nos basaremos en que los estimadores siguen uns distribucion normal:

βj ∼ N(βj ,Var(βj)).

Por tanto, para tomar una decision en el contraste utilizamos la siguiente regla dedecision:

Se rechaza H0 si

∣∣∣∣∣βj√

Var(βj)

∣∣∣∣∣ ≥ Z1−α/2,

donde P [Z < Z1−α/2] = 1− α/2 con Z ∼ N(0, 1).

Adviertase que la obtencion de la matriz de varianzas-covarianzas de los coeficien-tes, βj , no es una tarea facil. Por suerte todos los programas informaticos lo realizanautomaticamente, por lo que se puede realizar inferencia en la forma habitual.

18:28:36

Significacion conjunta de los coeficientes

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


de los coeficientes


de los coeficientes


multiples


Para realizar contrastes de significacion conjunta sobre todos los coeficientes (o unsubconjunto), se puede utilizar el contraste de la razon de verosimilitudes:

H0 : β2 = β3 = ... = βk = 0H1 : en caso contrario

}.

El estadıstico de contraste es:

−2 lnL(βr)

L(β)∼ χ2

q,

donde L(βr) es la verosimilitud del modelo restringido, es decir, del modelo en el

que se impone la H0, L(β) es la verosimilitud del modelo sin restricciones y q es elnumero de restricciones.

18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples

❖Modelos de

alternativas multiples

❖Ejemplo


18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples

❖Modelos de


❖Ejemplo


Los modelos de alternativas multiples o multinomiales generalizan a los estudiadoshasta el momento para problemas donde la variable dependiente es nominal, esdecir, cuando existen mas de dos posibles resultados discretos.

Algunos ejemplos pueden ser:

Eleccion de la universidad en la que estudiar basandose en las calificaciones delestudiante, sus gustos, medios economicos, etc.Que candidato recibira el voto de una persona a partir de caracterısticas de-mograficas o socio-culturales.Posibles ocupaciones profesionales de una persona en funcion de los trabajosde los padres, nivel de educacion, etc.

18:28:36

Modelos de alternativas multiples: ejemplo

❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples

❖Modelos de


❖Ejemplo


Supongamos que disponemos de informacion sobre la demanda de un determinadoproducto fabricado por tres marcas: A, B y C. Queremos estudiar el efecto que tienela variable edad de cada individuo (xi) sobre la eleccion de cada marca. La variabledependiente yij mide la eleccion (yij = 1) o no (yij = 0) de la marca j-esimarealizada por el individuo i:

yiA =

{1 marca A,0 otra marca

yiB =

{1 marca B,0 otra marca

yiC =

{1 marca C,0 otra marca

El modelo quedarıa:

yij = β1 + β2xi + ǫij , i = 1, ..., n; j = A,B,C.

La probabilidad de que cada individuo elija una determinada marca es:

piA = β11 + β21xi,

piB = β12 + β22xi,

piC = β13 + β23xi,

donde se ha de cumplir que la suma de las probabilidades es igual a la unidad.

18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples

❖Modelos de


❖Ejemplo


En el caso del modelo logit multinomial, la probabilidad de escoger una de las alter-nativas es:

pij =eβ1j+β2jxi

∑3

j=1eβ1j+β2jxi

, i = 1, ..., n; j = A,B,C.

Una de las alternativas es la de referencia:

pi1 =eβ11+β21xi

∑3

j=1eβ1j+β2jxi

=1

1 +∑3

j=2eβ1j+β2jxi

y el resto:

pij =eβ1j+β2jxi

1 +∑3

j=2eβ1j+β2jxi

, j = B,C.

Los odds ratio se obtienen como el cociente entre probabilidades:

pij

pi1= eβ1j+β2jxi , j = B,C,

y el logaritmo del odd ratio:

ln

(pij

pi1

)= β1j + β2jxi, j = B,C.

18:28:36


❖Contenidos

Introduccion

Modelos de eleccion

binaria

Modelo Lineal de

Probabilidad


Inferencia en los

modelos de eleccion

discreta


coeficientes

Bondad de ajuste

Contrastacion de

hipotesis


multiples

❖Modelos de


❖Ejemplo


Tambien se pueden comparar entre las alternativas 2 y 3:

pi2

pi3=

β12 + β22xi

β13 + β23xi= eβ12−β13+(β22−β23)xi .

Para estimar los parametros, utilizaremos el metodo de maxima verosimilitud. Eneste ejemplo, la funcion de verosimilitud es:

L =

n∏

i=1

1

1 +∑3

j=2eβ1j+β2jxi

×n∏

i=1

eβ12+β22xi

1 +∑3

j=2eβ1j+β2jxi

×n∏

i=1

eβ13+β23xi

1 +∑3

j=2eβ1j+β2jxi

.

18:28:36

Modelos de elecci on discreta´ - ugr.esromansg/material/WebEco/Eco2-Discreta.pdf · El modelo...

Documents

Transcript of Modelos de elecci on discreta´ - ugr.esromansg/material/WebEco/Eco2-Discreta.pdf · El modelo...