TÉCNICAS DE MEDICIÓN ECONÓMICA · Según establezcamos el supuesto de que la perturbación...

33
UNIVERSIDAD NACIONAL DE PIURA FACULTAD DE ECONOMIA PATPRO– XXIX VERSIÓN . PIURA, JULIO 2012 TÉCNICAS DE MEDICIÓN ECONÓMICA Econ. M. Sc. Luis A. Rosales García

Transcript of TÉCNICAS DE MEDICIÓN ECONÓMICA · Según establezcamos el supuesto de que la perturbación...

UNIVERSIDAD NACIONAL DE PIURA

FACULTAD DE ECONOMIA

PATPRO– XXIX VERSIÓN

.

PIURA, JULIO 2012

TÉCNICAS DE MEDICIÓN ECONÓMICA

Econ. M. Sc. Luis A. Rosales García

2

PARTE I: MODELOS DE ELECCIÓN DISCRETA Y VARIABLE DEPENDIENTE LIMITADA

Introducción Tipos de Variables: 1º Variables binarias: Tienen dos categorías. Normalmente indican que ha ocurrido un suceso,

que alguna característica está presente o que se elige una opción. Ejemplos: trabajador en paro; compra de un producto; participación en las elecciones.

2º Variables ordinales: Tienen categorías que pueden ordenarse de menor a mayor. Ejemplos: en

las encuestas se pregunta sobre el nivel de acuerdo con respecto a alguna afirmación, permitiendo responder en una escala ordinal, por ejemplo: “completamente de acuerdo”, “de acuerdo”, “en desacuerdo”, “completamente en desacuerdo”; valoraciones sobre el nivel de satisfacción al consumir un bien o servicio (“muy satisfecho”,%, “muy insatisfecho”); nivel de educación alcanzado;%

3º Variables nominales: Cuando hay múltiples respuestas, que no pueden ordenarse. Ejemplos:

tipo de empleo, status matrimonial, elección política, preferencia de marcas.

4º Variables censuradas: Se dan cuando los valores de una variable se desconocen para algún

rango de la variable. Ejemplos: En información de renta personal o familiar, cuando se definen intervalos del tipo “más de” o “menos de”; en modelos de demanda, cuando no se realiza ninguna compra del bien.

5º Variables de conteo: Indican el número de veces que ha ocurrido algún suceso. Ejemplos:

Número de visitas al médico en un año; número de publicaciones de un científico; número de visitas a un lugar de ocio; número de hijos de una familia; años de educación.

El nivel de medida de una variable no siempre es único. Los años de estudios pueden ser una variable de conteo, pero el nivel de estudios puede plantearse como una variable ordinal o nominal. Si se considera un corte en el nivel de estudios (con o sin estudios universitarios) podría tratarse como dicotómica. I. Modelos de elección discreta.

Tipos de modelos:

3

1.1. Modelos de elección binaria.

La probabilidad es una función de la matriz de características X y de los parámetros a estimar β. La función es una combinación lineal de las características y de los parámetros. La Probabilidad de que ocurra un suceso (se tome una decisión):

[ ] )(),(,1 βββ iiii XGXGXyPP ′==== i

La Probabilidad de que no ocurra un suceso (no se tome una decisión):

[ ] )(1),(1,0 βββ iii XGXGXyP ′−=−== i

El valor esperado de la variable y, es:

[ ] [ ] [ ] [ ] )(,1,00,11 ββββ iiiiii XGyPyPyPyE ′====⋅+=⋅= iii xxxx

MODELO LINEAL DE PROBABILIDAD

La función de identidad es: ����

��� = 1, entonces la expresión formal es: .,......,2,1' NiuXy iii =∀+= β

[ ] ββ iii XyPP ′=== ,1 ix

Los problemas específicos que se encuentran son los siguientes: • Heterocedasticidad del término de perturbación. Por tanto, los estimadores MCO son

menos eficientes. • Las probabilidades predichas son inconsistentes, ya que no puede garantizarse que

estén acotadas entre 0 y 1. • Interpretación de los coeficientes βj. En el modelo se supone que el efecto de las

variables sobre la probabilidad es constante y lineal en todo el recorrido de las variables.

4 • No normalidad de la perturbación. Al tomar únicamente dos valores, la hipótesis de

normalidad del término de perturbación no es aceptable. Este problema no afecta la insesgadez de los estimadores puntuales, aunque el proceso de inferencia basado en una distribución normal de los estimadores sólo será válida si la muestra es lo suficientemente grande.

• El Coeficiente de determinación no es apropiado.

MODELO PROBIT La función de identidad es la función de distribución normal: ����

��� = ������, entonces la

expresión formal es:

[ ] )(,1 ββ iii XFyPP ′=== ix

MODELO LOGIT La función de identidad es la función de distribución logística, es decir: ����

��� = ������,

entonces la expresión formal es:

[ ])exp(1

1,1

ββ

i

iiX

yPP′−+

=== ix

La variable observada toma unos valores que responden al comportamiento de una variable índice (latente o inobservable). Si el índice supera un determinado nivel la variable toma el valor uno y, si no lo supera, toma el valor cero. La variable latente está relacionada con las características a través de un modelo estructural:

.,......,2,1'* NiuXy iii =∀+= β

Según establezcamos el supuesto de que la perturbación aleatoria se distribuya como una Normal o una Logística, el modelo generado será un probito un logit, respectivamente. Los valores de la variable observados se relacionan con los de la variable latente en la forma:

)0'(1)0*(1 >+=>= iiii uXyy β

La probabilidad asociada a la realización del suceso es:

[ ] [ ] [ ] [ ] )(00*,1 ββββ iiiiiiii XGXuPuXPyPXyPP ′=′<=>+′=>=== i

El hacer la varianza del modelo igual a uno es el resultado de un mero proceso de normalización, ya que el modelo no se altera porque se multiplique por cualquier cantidad. El umbral considerado a superar por el índice puede ser cero o cualquier otro valor. La función de verosimilitud de los modelos probit y logit es:

( ) ( )[ ]∏=

−′−′=N

i

y

i

y

iiiii XGXGXyL

1

11),/( βββ

( ) ( ) ( )[ ]∑ ∑= =

−−+=N

i

n

i

iiii XGyXGyL1 1

'1ln1'lnln ββ

5 Las condiciones de primer orden del problema de maximización requieren que las primeras derivadas respecto a β. Dada la no linealidad de los modelos, los estimadores máximo verosímiles se obtienen empleando métodos numéricos (Newton-Raphson, Berndt-Hall-Hall-Hausman). CONSTRUCCIÓN DE UN MODELO LOGIT O PROBIT

Los requisitos para la construcción de un modelo logit o probit son: 1º Contar con una muestra representativa de clientes cumplidos e incumplidos, cuyo

tamaño mínimo se establece vía criterios estadísticos. 2º Contar con suficiente información de los clientes contenida en sus solicitudes de

crédito o expedientes. 3º Seleccionar las posibles variables explicativas de la probabilidad de default de los

clientes, en base al conocimiento o experiencia previa y a procedimientos estadísticos (test de significancia individual).

4º Escoger el modelo más apropiado en base a tests estadísticos sobre la "bondad de ajuste" o "calidad predictiva" del modelo.

El procedimiento a seguir es: 1º El significado de las variables: VARIABLE DEFINICIÓN SIGNO

CATEGORÍA Dummy, toma valores de 1 si es mal pagador y 0 si es bueno.

HIPOTE Dummy, 1 si la garantía es la tierra y 0 si no lo es. - CULTIVO Dummy, 1 si es arroz y 0 si es otro cultivo. + / - EDU Años de educación del prestatario. - SEXO Dummy, 1 si es hombre y 0 si es mujer. + / - EDAD Años de edad + / - ANTIGUE Antigüedad de la relación crediticia (años) - PRESCOS2 Ratio Préstamo/Costo Total (%) - OTROSINGRE2 Ratio Otros Ingresos/Ingreso Total (%) + / - INDEU Índice de Endeudamiento = Préstamo/Patrimonio (%) + COSFINGAS Costo Financiero/Gasto Total (%) +

BENECOS1 Beneficio/Costo = (Ventas + Otros Ingresos) / (Costos Oper.+Costos Financ. + Otros Egresos) -

ROA Rentabilidad / Activos = (Ingresos – Egresos) / Activos

-

ROE Rentabilidad / Patrimonio = (Ingresos - Egresos) / Patrimonio -

2º Buscar el mejor modelo explicativo de la probabilidad de default (cumplimiento) de los

clientes, en base al siguiente procedimiento general: 2.1. Realización de regresiones bivariables y selección de variables explicativas se

requiere analizar: el signo correcto, la significancia de β (si es altamente significativo, significativo o relativamente significativo) y el R2 (debe estar entre 0.2 y 0.6).

. logit categoria antigue in 1/300

6 Iteration 0: log likelihood = -186.15007

Iteration 1: log likelihood = -184.58736

Iteration 2: log likelihood = -184.58477

Iteration 3: log likelihood = -184.58477

Logistic regression Number of obs = 297

LR chi2(1) = 3.13

Prob > chi2 = 0.0768

Log likelihood = -184.58477 Pseudo R2 = 0.0084

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

antigue | -.1164188 .0657459 -1.77 0.077 -.2452784 .0124407

_cons | -.3204573 .2712043 -1.18 0.237 -.852008 .2110934

------------------------------------------------------------------------------

. logit categoria benecos1 in 1/300

Iteration 0: log likelihood = -187.29939

Iteration 1: log likelihood = -131.45837

Iteration 2: log likelihood = -127.02717

Iteration 3: log likelihood = -126.9888

Iteration 4: log likelihood = -126.98878

Iteration 5: log likelihood = -126.98878

Logistic regression Number of obs = 300

LR chi2(1) = 120.62

Prob > chi2 = 0.0000

Log likelihood = -126.98878 Pseudo R2 = 0.3220

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

benecos1 | -4.720698 .5634537 -8.38 0.000 -5.825047 -3.616349

_cons | 3.182246 .4734967 6.72 0.000 2.25421 4.110283

------------------------------------------------------------------------------

. logit categoria cosfingas in 1/300

Iteration 0: log likelihood = -175.42307

Iteration 1: log likelihood = -175.40356

Iteration 2: log likelihood = -175.40356

Logistic regression Number of obs = 290

LR chi2(1) = 0.04

Prob > chi2 = 0.8434

Log likelihood = -175.40356 Pseudo R2 = 0.0001

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

cosfingas | .0070403 .0356407 0.20 0.843 -.0628141 .0768948

_cons | -.9565026 .4071264 -2.35 0.019 -1.754456 -.1585494

------------------------------------------------------------------------------

. logit categoria cultivo in 1/300

Iteration 0: log likelihood = -187.29939

Iteration 1: log likelihood = -185.16985

Iteration 2: log likelihood = -185.1588

Iteration 3: log likelihood = -185.1588

7

Logistic regression Number of obs = 300

LR chi2(1) = 4.28

Prob > chi2 = 0.0385

Log likelihood = -185.1588 Pseudo R2 = 0.0114

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

cultivo | -.640442 .3061966 -2.09 0.036 -1.240576 -.0403077

_cons | -.2559334 .271891 -0.94 0.347 -.78883 .2769632

------------------------------------------------------------------------------

. logit categoria edad in 1/300

Iteration 0: log likelihood = -182.69783

Iteration 1: log likelihood = -182.57854

Iteration 2: log likelihood = -182.57853

Logistic regression Number of obs = 294

LR chi2(1) = 0.24

Prob > chi2 = 0.6252

Log likelihood = -182.57853 Pseudo R2 = 0.0007

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

edad | -.0058799 .0120554 -0.49 0.626 -.0295081 .0177483

_cons | -.4722557 .6549807 -0.72 0.471 -1.755994 .811483

------------------------------------------------------------------------------

. logit categoria edu in 1/300

Iteration 0: log likelihood = -179.27271

Iteration 1: log likelihood = -178.03553

Iteration 2: log likelihood = -178.03365

Iteration 3: log likelihood = -178.03365

Logistic regression Number of obs = 287

LR chi2(1) = 2.48

Prob > chi2 = 0.1154

Log likelihood = -178.03365 Pseudo R2 = 0.0069

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

edu | .0702553 .0446234 1.57 0.115 -.017205 .1577156

_cons | -1.007019 .2016041 -5.00 0.000 -1.402156 -.6118824

------------------------------------------------------------------------------

. logit categoria hipote in 1/300

Iteration 0: log likelihood = -185.76767

Iteration 1: log likelihood = -179.59354

Iteration 2: log likelihood = -179.5915

Iteration 3: log likelihood = -179.5915

Logistic regression Number of obs = 298

LR chi2(1) = 12.35

Prob > chi2 = 0.0004

Log likelihood = -179.5915 Pseudo R2 = 0.0332

8 ------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hipote | -2.369694 .7923549 -2.99 0.003 -3.922681 -.8167066

_cons | 1.504077 .7817359 1.92 0.054 -.028097 3.036251

------------------------------------------------------------------------------

. logit categoria indeu in 1/300

Iteration 0: log likelihood = -177.86106

Iteration 1: log likelihood = -177.84748

Iteration 2: log likelihood = -177.84748

Logistic regression Number of obs = 292

LR chi2(1) = 0.03

Prob > chi2 = 0.8691

Log likelihood = -177.84748 Pseudo R2 = 0.0001

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

indeu | .0016329 .0099006 0.16 0.869 -.017772 .0210378

_cons | -.898321 .2812545 -3.19 0.001 -1.44957 -.3470722

------------------------------------------------------------------------------

. logit categoria otrosingre2 in 1/300

Iteration 0: log likelihood = -185.76767

Iteration 1: log likelihood = -158.8845

Iteration 2: log likelihood = -158.79739

Iteration 3: log likelihood = -158.79737

Iteration 4: log likelihood = -158.79737

Logistic regression Number of obs = 298

LR chi2(1) = 53.94

Prob > chi2 = 0.0000

Log likelihood = -158.79737 Pseudo R2 = 0.1452

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

otrosingre2 | .0600605 .0096386 6.23 0.000 .0411692 .0789519

_cons | -1.523472 .1800114 -8.46 0.000 -1.876288 -1.170656

------------------------------------------------------------------------------

. logit categoria prescos2 in 1/300

Iteration 0: log likelihood = -187.29939

Iteration 1: log likelihood = -187.27787

Iteration 2: log likelihood = -187.27787

Logistic regression Number of obs = 300

LR chi2(1) = 0.04

Prob > chi2 = 0.8356

Log likelihood = -187.27787 Pseudo R2 = 0.0001

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

prescos2 | -.0014107 .0068036 -0.21 0.836 -.0147455 .011924

_cons | -.694731 .3791261 -1.83 0.067 -1.437804 .0483426

------------------------------------------------------------------------------

9

. logit categoria roa in 1/300

Iteration 0: log likelihood = -187.29939

Iteration 1: log likelihood = -137.72137

Iteration 2: log likelihood = -135.87111

Iteration 3: log likelihood = -135.86816

Iteration 4: log likelihood = -135.86816

Logistic regression Number of obs = 300

LR chi2(1) = 102.86

Prob > chi2 = 0.0000

Log likelihood = -135.86816 Pseudo R2 = 0.2746

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

roa | -5.330005 .7267898 -7.33 0.000 -6.754487 -3.905523

_cons | -1.315723 .1702975 -7.73 0.000 -1.649499 -.9819457

------------------------------------------------------------------------------

. logit categoria roe in 1/300

Iteration 0: log likelihood = -187.29939

Iteration 1: log likelihood = -137.67305

Iteration 2: log likelihood = -135.88572

Iteration 3: log likelihood = -135.88325

Iteration 4: log likelihood = -135.88325

Logistic regression Number of obs = 300

LR chi2(1) = 102.83

Prob > chi2 = 0.0000

Log likelihood = -135.88325 Pseudo R2 = 0.2745

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

roe | -5.173637 .7026016 -7.36 0.000 -6.550711 -3.796563

_cons | -1.314811 .1698664 -7.74 0.000 -1.647744 -.9818793

------------------------------------------------------------------------------

. logit categoria sexo in 1/300

Iteration 0: log likelihood = -187.29939

Iteration 1: log likelihood = -187.29871

Iteration 2: log likelihood = -187.29871

Logistic regression Number of obs = 300

LR chi2(1) = 0.00

Prob > chi2 = 0.9706

Log likelihood = -187.29871 Pseudo R2 = 0.0000

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

sexo | .0204089 .5542336 0.04 0.971 -1.065869 1.106687

_cons | -.7884574 .5393599 -1.46 0.144 -1.845583 .2686686

------------------------------------------------------------------------------

SE SELECCIONAN: ANTIGUE, BENECOS1, CULTIVO, HIPOTE, OTROSINGRE2, ROA Y ROE

10 2.2. Comparación de correlaciones entre variables a fin de eliminar el problema de alto

grado de multicolinealidad. Las variables altamente correlacionadas (con coeficientes de correlación mayores a 0.5) resultan redundantes, es decir, basta con que me quede con una de ellas en el modelo, ya que si las incluyo todas sus significancias estadísticas individuales tienden a ser bajas (no se puede distinguir el impacto de cada una de ellas sobre la variable dependiente). El criterio práctico es eliminar las variables correlacionadas con menor significancia estadística individual en las regresiones bivariables, con menor R2 (Mc Fadden).

. cor antigue benecos1 cultivo hipote otrosingre2 roa roe in 1/300

(obs=293)

| antigue benecos1 cultivo hipote otrosi~2 roa roe

-------------+---------------------------------------------------------------

antigue | 1.0000

benecos1 | 0.0447 1.0000

cultivo | 0.2520 -0.1826 1.0000

hipote | -0.0113 0.0524 0.0962 1.0000

otrosingre2 | -0.0400 -0.3846 -0.0288 -0.2395 1.0000

roa | 0.0048 0.9035 -0.1604 0.0062 -0.3320 1.0000

roe | 0.0028 0.9016 -0.1562 0.0008 -0.3338 0.9981 1.0000

SE ELIMINAN: ROA Y ROE.

2.3. Construcción del modelo multivariable con las variables seleccionadas en los ítems

anteriores.

. logit categoria antigue benecos1 cultivo hipote otrosingre2 in 1/300

Iteration 0: log likelihood = -183.09535

Iteration 1: log likelihood = -107.90465

Iteration 2: log likelihood = -103.06257

Iteration 3: log likelihood = -102.86715

Iteration 4: log likelihood = -102.86682

Iteration 5: log likelihood = -102.86682

Logistic regression Number of obs = 293

LR chi2(5) = 160.46

Prob > chi2 = 0.0000

Log likelihood = -102.86682 Pseudo R2 = 0.4382

------------------------------------------------------------------------------

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

antigue | -.1308904 .099934 -1.31 0.190 -.3267575 .0649768

benecos1 | -5.102322 .672608 -7.59 0.000 -6.42061 -3.784035

cultivo | -1.45311 .4813152 -3.02 0.003 -2.39647 -.5097495

hipote | -2.182278 1.017386 -2.14 0.032 -4.176317 -.1882387

otrosingre2 | .0400263 .0139222 2.87 0.004 .0127392 .0673134

_cons | 6.862656 1.358595 5.05 0.000 4.199859 9.525453

------------------------------------------------------------------------------

. estimates store modlog

2.4. Evaluación del modelo en base a los siguientes criterios: 1.- Signo correcto de los coeficientes.

11 Todos tienen los signos correctos.

2.- Significancia estadística individual de los parámetros:

Los estimadores máximo verosímiles de β se distribuyen asintóticamente según una distribución normal. Por tanto, para tamaños muestrales relativamente grandes se tiene:

( )( )jjj N βββ ˆvar,ˆ ∼

Y, por tanto, puede contrastarse la hipótesis nula sobre la significación de una

variable, 0ˆ:0 =jH β , mediante el contraste:

j

jz

βσ

β

ˆˆ= ,

que si la hipótesis es cierta se distribuye asintóticamente como una ( )1,0N . ANTIGUE no es significativa, HIPOTE es significativa y BENECOS1, CULTIVO y OTROSINGRE2 son altamente significativas.

3.- Significancia conjunta del modelo:

El contraste de Wald puede emplearse para contrastar restricciones lineales en los parámetros, del tipo:

0rR

0rR

≠−

=−

β

β

:

:0

AH

H

La hipótesis puede contrastarse con el estadístico de Wald:

21 )ˆ())ˆ(()ˆ( qVarW χβββ ∼−′′−= − rRRRrR

Si las restricciones son ciertas, el estadístico se distribuye asintóticamente como una distribución chi-cuadrado con grados de libertad igual al número de restricciones.

El contraste de cociente de verosimilitudes también puede emplearse para contrastar restricciones del modelo. El estadístico se define como:

( ) 2lnln2)ln(ln2ln2 qRNRNRR

NR

R LLLLL

LRV χ ∼−=−−=

−=

Donde RL y NRL indican los valores de la función de verosimilitud de los modelos

restringido y no restringido, respectivamente. Bajo la hipótesis nula el estadístico RV se distribuye como una 2

qχ .

El modelo en conjunto es altamente significativo.

4.- Pseudo-R2: El coeficiente de determinación o R2 empleado en el modelo de regresión

como medida de bondad del ajuste no parece adecuado cuando la variable dependiente es binaria, mientras que la variable ajustada es continua en el intervalo 0,1. Se han propuesto diversas medidas de bondad del ajuste alternativas, denominadas Pseudo-R2. Entre ellas destacan:

Pseudo-R2 de McFadden. También conocido como “índice de cociente de verosimiludes”. Se define como:

12

R

NRMF

L

LR

ln

ln12 −=

Donde NRL indica la función de verosimilitud del modelo estimado y RL la de un

modelo restringido con coeficientes 0=jβ . Si en el modelo RNR LL = , todos los

coeficientes jβ estimados serían cero, y el 02 =MFR . El estadístico se acerca al valor 1

cuando la función de verosimilitud del modelo estimado (no restringido) se acerca a su valor máximo (igual a uno) y, por tanto, con un valor del logaritmo igual a cero. � = 0.4382. Es un coeficiente de bondad bueno.

Pseudo-R2 de Cox-Snell. Cox y Snell propusieron una medida que tenía en cuenta el tamaño de la muestra:

( ) ( )( )

−−−= RNRCS LLN

R lnln2

exp12

( ) 42168391.00953.18386682.102293

2exp12 =

−−−−−=CSR

Es un coeficiente de bondad

bueno.

5.- Porcentaje de Predicciones Correctas:

Una forma sencilla de valorar el ajuste de un modelo de elección binaria consiste en comparar las predicciones del modelo con las respuestas observadas en la muestra. Para cada observación se predice la probabilidad y se asigna la respuesta de ese

elemento a valores 1ˆ =iY o 0ˆ =iY , según la probabilidad supere o no un determinado

umbral. Normalmente, el criterio de asignación emplea como punto de corte una probabilidad igual a 0,5:

( )( )

=⇒<=

=⇒≥=

0ˆ5,01ˆ1ˆ5,01ˆ

iii

iii

YYP

YYP

x

x

Debe tenerse en cuenta que la elección de un valor igual a 0,5 es arbitraria y que puede modificarse en función del número de 1 y 0 que haya en la muestra.

Una vez obtenidos los valores de iY se genera un cuadro clasificatorio según el

siguiente esquema: . lstat

Logistic model for categoria

-------- True --------

Classified | D ~D | Total

-----------+--------------------------+-----------

+ | 68 13 | 81

- | 25 187 | 212

-----------+--------------------------+-----------

Total | 93 200 | 293

NNNNooootttteeee:::: NNNN====OOOObbbbssss uuuusssseeeedddd iiiinnnn ccccaaaallllccccuuuullllaaaattttiiiinnnngggg BBBBIIIICCCC;;;; sssseeeeeeee [[[[RRRR]]]] BBBBIIIICCCC nnnnooootttteeee .... 222299993333 ----111188883333....0000999955553333 ----111100002222....8888666666668888 6666 222211117777....7777333333336666 222233339999....8888111144447777 MMMMooooddddeeeellll OOOObbbbssss llllllll((((nnnnuuuullllllll)))) llllllll((((mmmmooooddddeeeellll)))) ddddffff AAAAIIIICCCC BBBBIIIICCCC

.... eeeessssttttaaaatttt iiiicccc

13

Classified + if predicted Pr(D) >= .5

True D defined as categoria != 0

--------------------------------------------------

Sensitivity Pr( +| D) 73.12%

Specificity Pr( -|~D) 93.50%

Positive predictive value Pr( D| +) 83.95%

Negative predictive value Pr(~D| -) 88.21%

--------------------------------------------------

False + rate for true ~D Pr( +|~D) 6.50%

False - rate for true D Pr( -| D) 26.88%

False + rate for classified + Pr(~D| +) 16.05%

False - rate for classified - Pr( D| -) 11.79%

--------------------------------------------------

Correctly classified 87.03%

--------------------------------------------------

D ocurrencia del evento de interés (esto es Y=1). En este caso, indica que es mal pagador. ~D No ocurrencia del evento (es decir y=0). En este caso, corresponde a buen pagador. + La probabilidad predicha por el modelo logístico es mayor o igual al punto de corte. Esto indica que el

modelo predice una probabilidad de 0.5 o más extrema de ser mal pagador. - La probabilidad predicha es menor que la del punto de corte. Indica que el modelo predice una

probabilidad media menor de 0.5 de ser mal pagador.

El 87.03 % de las predicciones totales son correctas, siendo el 73.12 % de predicciones correctas si es mal pagador y 93.50 % de predicciones correctas si es buen pagador.

6.- Contraste de Hosmer-Lemeshow:

La idea del contraste es comparar las predicciones de las probabilidades con los datos observados. Para calcular el estadístico se sigue la siguiente secuencia: 1º Se calculan las predicciones de las probabilidades a partir de la estimación del

modelo: ( ) iii PYP)

≡= x1ˆ .

2º Se ordenan los datos en función de las probabilidades estimadas, de menor a mayor.

3º Se dividen las observaciones en G grupos (normalmente 10) de igual tamaño (en cada uno de los grupos habrá aproximadamente el mismo número de observaciones). El primer grupo tendrá las 1n observaciones con los valores de probabilidad estimada menores.

CCCCoooorrrrrrrreeeeccccttttllllyyyy ccccllllaaaassssssssiiiiffffiiiieeeedddd 88887777....00003333%%%% FFFFaaaallllsssseeee ---- rrrraaaatttteeee ffffoooorrrr ccccllllaaaassssssssiiiiffffiiiieeeedddd ---- PPPPrrrr(((( DDDD|||| ----)))) 11111111....77779999%%%%FFFFaaaallllsssseeee ++++ rrrraaaatttteeee ffffoooorrrr ccccllllaaaassssssssiiiiffffiiiieeeedddd ++++ PPPPrrrr((((~~~~DDDD|||| ++++)))) 11116666....00005555%%%%FFFFaaaallllsssseeee ---- rrrraaaatttteeee ffffoooorrrr ttttrrrruuuueeee DDDD PPPPrrrr(((( ----|||| DDDD)))) 22226666....88888888%%%%FFFFaaaallllsssseeee ++++ rrrraaaatttteeee ffffoooorrrr ttttrrrruuuueeee ~~~~DDDD PPPPrrrr(((( ++++||||~~~~DDDD)))) 6666....55550000%%%% NNNNeeeeggggaaaattttiiiivvvveeee pppprrrreeeeddddiiiiccccttttiiiivvvveeee vvvvaaaalllluuuueeee PPPPrrrr((((~~~~DDDD|||| ----)))) 88888888....22221111%%%%PPPPoooossssiiiittttiiiivvvveeee pppprrrreeeeddddiiiiccccttttiiiivvvveeee vvvvaaaalllluuuueeee PPPPrrrr(((( DDDD|||| ++++)))) 88883333....99995555%%%%SSSSppppeeeecccciiiiffffiiiicccciiiittttyyyy PPPPrrrr(((( ----||||~~~~DDDD)))) 99993333....55550000%%%%SSSSeeeennnnssssiiiittttiiiivvvviiiittttyyyy PPPPrrrr(((( ++++|||| DDDD)))) 77773333....11112222%%%% TTTTrrrruuuueeee DDDD ddddeeeeffffiiiinnnneeeedddd aaaassss ccccaaaatttteeeeggggoooorrrriiiiaaaa !!!!==== 0000CCCCllllaaaassssssssiiiiffffiiiieeeedddd ++++ iiiiffff pppprrrreeeeddddiiiicccctttteeeedddd PPPPrrrr((((DDDD)))) >>>>==== ....5555

TTTToooottttaaaallll 99993333 222200000000 222299993333 ---- 22225555 111188887777 222211112222 ++++ 66668888 11113333 88881111 CCCCllllaaaassssssssiiiiffffiiiieeeedddd DDDD ~~~~DDDD TTTToooottttaaaallll TTTTrrrruuuueeee

LLLLooooggggiiiissssttttiiiicccc mmmmooooddddeeeellll ffffoooorrrr ccccaaaatttteeeeggggoooorrrriiiiaaaa

.... eeeessssttttaaaatttt ccccllllaaaassss

14

4º Dentro de cada grupo se calcula la media de la predicción de probabilidad gP)

y el porcentaje de observaciones con valor 1=iY , gy .

5º El estadístico HL se basa en los residuos de Pearson, definidos como la diferencia entre la frecuencia observada y frecuencia en la predicción, estandarizada por la desviación estándar de la predicción. El estadístico suma esa diferencia estandarizada para todos los grupos:

( )( )∑

= −

−=

G

gggg

gggg

PPn

PnynHL

1

2

1))

)

El estadístico HL de distribuye aproximadamente como una 2χ con 2−g de libertad, si el modelo es correcto.

Genera grupos basados en las probabilidades estimadas por el modelo, concretamente en sus percentiles. Proponen una estadística equivalente a la Χ de Pearson pero que se distribuye como ���

donde g es el número de grupos generados.

. lfit

Logistic model for categoria, goodness-of-fit test

number of observations = 293

number of covariate patterns = 283

Pearson chi2(277) = 3019.43

Prob > chi2 = 0.0000

Como J ≈ n, lo que sucede frecuentemente cuando se tienen covariables continuas, entonces los p-valores obtenidos son pocos confiables, por lo que se propone la prueba de Hosmer y Lemeshow.

. lfit, group(4)

Logistic model for categoria, goodness-of-fit test

(Table collapsed on quantiles of estimated probabilities)

number of observations = 293

number of groups = 4

Hosmer-Lemeshow chi2(2) = 0.53

Prob > chi2 = 0.7655

El contraste Hosmer-Lemeshow nos indica que el modelo se comporta y ajusta bien.

7.- Normalidad:

PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....0000000000000000 PPPPeeeeaaaarrrrssssoooonnnn cccchhhhiiii2222((((222277777777)))) ==== 3333000011119999....44443333 nnnnuuuummmmbbbbeeeerrrr ooooffff ccccoooovvvvaaaarrrriiiiaaaatttteeee ppppaaaatttttttteeeerrrrnnnnssss ==== 222288883333 nnnnuuuummmmbbbbeeeerrrr ooooffff oooobbbbsssseeeerrrrvvvvaaaattttiiiioooonnnnssss ==== 222299993333

LLLLooooggggiiiissssttttiiiicccc mmmmooooddddeeeellll ffffoooorrrr ccccaaaatttteeeeggggoooorrrriiiiaaaa,,,, ggggooooooooddddnnnneeeessssssss----ooooffff----ffffiiiitttt tttteeeesssstttt

.... eeeessssttttaaaatttt ggggooooffff

PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....7777666655555555 HHHHoooossssmmmmeeeerrrr----LLLLeeeemmmmeeeesssshhhhoooowwww cccchhhhiiii2222((((2222)))) ==== 0000....55553333 nnnnuuuummmmbbbbeeeerrrr ooooffff ggggrrrroooouuuuppppssss ==== 4444 nnnnuuuummmmbbbbeeeerrrr ooooffff oooobbbbsssseeeerrrrvvvvaaaattttiiiioooonnnnssss ==== 222299993333

((((TTTTaaaabbbblllleeee ccccoooollllllllaaaappppsssseeeedddd oooonnnn qqqquuuuaaaannnnttttiiiilllleeeessss ooooffff eeeessssttttiiiimmmmaaaatttteeeedddd pppprrrroooobbbbaaaabbbbiiiilllliiiittttiiiieeeessss))))

LLLLooooggggiiiissssttttiiiicccc mmmmooooddddeeeellll ffffoooorrrr ccccaaaatttteeeeggggoooorrrriiiiaaaa,,,, ggggooooooooddddnnnneeeessssssss----ooooffff----ffffiiiitttt tttteeeesssstttt

.... eeeessssttttaaaatttt ggggooooffff,,,, ggggrrrroooouuuupppp((((4444))))

15

. predict e, resid

(49 missing values generated)

. sktest e

Skewness/Kurtosis tests for Normality

------- joint ------

Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2

-------------+---------------------------------------------------------------

e | 293 0.0000 0.0000 . 0.0000

. swilk e

Shapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z

-------------+--------------------------------------------------

e | 293 0.17375 172.388 12.074 0.00000

Los residuos no se distribuyen normales. 8.- Hormocedasticidad:

. robvar e, by(categoria)

Dummy, toma |

valores de |

1 si es mal |

pagador y 0 | Summary of Pearson residual

si es bueno | Mean Std. Dev. Freq.

------------+------------------------------------

0 | -.45860215 .59585312 200

1 | 1.3662178 5.4554316 93

------------+------------------------------------

Total | .12060692 3.216036 293

W0 = 8.5646486 df(1, 291) Pr > F = 0.00369776

W50 = 4.7128262 df(1, 291) Pr > F = 0.0307466

W10 = 4.8494534 df(1, 291) Pr > F = 0.0284392

. sdtest e, by(categoria)

Variance ratio test

------------------------------------------------------------------------------

Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

---------+--------------------------------------------------------------------

0 | 200 -.4586021 .0421332 .5958531 -.5416869 -.3755174

1 | 93 1.366218 .5657019 5.455432 .242685 2.489751

---------+--------------------------------------------------------------------

combined | 293 .1206069 .1878828 3.216036 -.2491693 .4903831

------------------------------------------------------------------------------

ratio = sd(0) / sd(1) f = 0.0119

Ho: ratio = 1 degrees of freedom = 199, 92

Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1

Pr(F < f) = 0.0000 2*Pr(F < f) = 0.0000 Pr(F > f) = 1.0000

El test de Levene y Barlett nos dice que existe heterocedasticidad.

16

Por lo tanto, se corrige heterocedasticidad y nos da: . logit categoria antigue benecos1 cultivo hipote otrosingre2 in 1/300, vce(robust)

Iteration 0: log pseudolikelihood = -183.09535

Iteration 1: log pseudolikelihood = -107.90465

Iteration 2: log pseudolikelihood = -103.06257

Iteration 3: log pseudolikelihood = -102.86715

Iteration 4: log pseudolikelihood = -102.86682

Iteration 5: log pseudolikelihood = -102.86682

Logistic regression Number of obs = 293

Wald chi2(5) = 45.29

Prob > chi2 = 0.0000

Log pseudolikelihood = -102.86682 Pseudo R2 = 0.4382

------------------------------------------------------------------------------

| Robust

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

antigue | -.1308904 .0921009 -1.42 0.155 -.3114049 .0496241

benecos1 | -5.102322 .9091074 -5.61 0.000 -6.88414 -3.320505

cultivo | -1.45311 .583129 -2.49 0.013 -2.596022 -.310198

hipote | -2.182278 1.414062 -1.54 0.123 -4.953788 .5892322

otrosingre2 | .0400263 .0153278 2.61 0.009 .0099843 .0700683

_cons | 6.862656 1.846575 3.72 0.000 3.243435 10.48188

------------------------------------------------------------------------------

9.- Especificación:

Este contrate (Pregibon, 1980) consiste en que si la regresión está bien especificada, no se deberían encontrar variables independientes significativas. De esta forma, una clase de error consistirá en que la variable dependiente necesitase algún tipo de transformación en su relación con las variables dependientes, en lo que se conoce como una función de unión (LINK FUNCTION). El contraste consiste en la regresión:

� = �⋮�� + �� Donde �⋮ serán los parámentos estimados, entonces �� ⋮�� deberá ser significativo y ��� ⋮���

no. El modelo también se usa para especificación en transformaciones de las variables independientes, de esta forma, si en un modelo inicial Logit o Probit ��� ⋮���

da significativo entonces alguna variable independiente podría necesitar algún tipo de transformación, una vez realizada esta no deberá ser significativo.

____ccccoooonnnnssss ----....1111000099991111666677777777 ....222200001111666655551111 ----0000....55554444 0000....555588888888 ----....5555000044443333999966663333 ....2222888866660000666600009999 ____hhhhaaaattttssssqqqq ....0000666644448888555533332222 ....0000222299994444999944444444 2222....22220000 0000....000022228888 ....0000000077770000444455552222 ....1111222222226666666611112222 ____hhhhaaaatttt 1111....000099996666444433331111 ....1111444400003333222288888888 7777....88881111 0000....000000000000 ....8888222211113333999911114444 1111....33337777111144447777 ccccaaaatttteeeeggggoooorrrriiiiaaaa CCCCooooeeeeffff.... SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[99995555%%%% CCCCoooonnnnffff.... IIIInnnntttteeeerrrrvvvvaaaallll]]]]

LLLLoooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111100001111....88882222555577772222 PPPPsssseeeeuuuuddddoooo RRRR2222 ==== 0000....4444444433339999 PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....0000000000000000 LLLLRRRR cccchhhhiiii2222((((2222)))) ==== 111166662222....55554444LLLLooooggggiiiissssttttiiiicccc rrrreeeeggggrrrreeeessssssssiiiioooonnnn NNNNuuuummmmbbbbeeeerrrr ooooffff oooobbbbssss ==== 222299993333

IIIItttteeeerrrraaaattttiiiioooonnnn 4444:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111100001111....88882222555577772222 IIIItttteeeerrrraaaattttiiiioooonnnn 3333:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111100001111....88882222555577772222 IIIItttteeeerrrraaaattttiiiioooonnnn 2222:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111100001111....88883333000022229999 IIIItttteeeerrrraaaattttiiiioooonnnn 1111:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111100002222....77778888555544446666 IIIItttteeeerrrraaaattttiiiioooonnnn 0000:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111188883333....00009999555533335555

.... lllliiiinnnnkkkktttteeeesssstttt

17 La probabilidad es 0.028 menor a 0.05, entonces hay que transformar una de las variables independientes.

2.5. Comparación con el modelo probit

Para valorar el ajuste de modelos alternativos se emplean diversas medidas, conocidas como medidas de información. Usualmente se emplean el denominado Criterio de Información de Akaike (AIC) y el Criterio de Información Bayesiano (BIC).

El AIC se define como:

KLAIC 2ln2 +−=

Donde L es la verosimilitud del modelo estimado y K es el número de parámetros en el modelo. El valor de L será mayor cuanto mejor sea el ajuste, mientras que tendrá un valor más cercano a 0 cuando el ajuste sea malo. Por ello, cuanto menor sea el valor de AIC mejor será el ajuste del modelo.

El estadístico AIC penaliza el número de parámetros incluidos en el modelo, para compensar hecho de que incluir un mayor número de parámetros mejorará siempre el ajuste.

La medida BIC se define como:

)ln(ln2 NKLBIC +−= Cuando se comparan modelos, es preferible aquel que presenta un valor negativo mayor.

Se estima el modelo probit corregido de heterocedasticidad y nos da:

. probit categoria antigue benecos1 cultivo hipote otrosingre2 in 1/300,

vce(robust)

Iteration 0: log pseudolikelihood = -183.09535

Iteration 1: log pseudolikelihood = -108.73392

Iteration 2: log pseudolikelihood = -106.76039

Iteration 3: log pseudolikelihood = -106.75542

Iteration 4: log pseudolikelihood = -106.75542

Probit regression Number of obs = 293

Wald chi2(5) = 41.94

Prob > chi2 = 0.0000

Log pseudolikelihood = -106.75542 Pseudo R2 = 0.4169

------------------------------------------------------------------------------

| Robust

categoria | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

antigue | -.0558729 .0511351 -1.09 0.275 -.1560959 .0443501

benecos1 | -2.523001 .5707296 -4.42 0.000 -3.64161 -1.404391

cultivo | -.8775958 .2974603 -2.95 0.003 -1.460607 -.2945842

hipote | -1.111458 .64656 -1.72 0.086 -2.378693 .1557761

otrosingre2 | .022724 .0071473 3.18 0.001 .0087156 .0367323

_cons | 3.431646 .9383587 3.66 0.000 1.592497 5.270795

------------------------------------------------------------------------------

Note: 1 failure and 0 successes completely determined.

. estimates store modproc

. estat ic

18

-----------------------------------------------------------------------------

Model | Obs ll(null) ll(model) df AIC BIC

-------------+---------------------------------------------------------------

modproc | 293 -183.0953 -106.7554 6 225.5108 247.5919

-----------------------------------------------------------------------------

Note: N=Obs used in calculating BIC; see [R] BIC note

-----------------------------------------------------------------------------

Model | Obs ll(null) ll(model) df AIC BIC

-------------+---------------------------------------------------------------

modlogc | 293 -183.0953 -102.8668 6 217.7336 239.8147

-----------------------------------------------------------------------------

Note: N=Obs used in calculating BIC; see [R] BIC note

El mejor modelo es el modelo logit. 2.6. Curva ROC:

La curva ROC es una gráfica de la sensibilidad, es decir, grafica el número de casos positivos correctamente clasificados (predichos en el modelo) contra el número de no casos que fueron clasificados incorrectamente como casos, así como la clasificación del entrecruzamiento.

. lroc

Logistic model for categoria

number of observations = 293

area under ROC curve = 0.9153

El área bajo la curva se usa como medida del valor predictivo. Como regla general, un área de 0.5 implica ausencia de discriminación; entre 0.7 y 0.79 es una discriminación entre aceptable; entre 0.8 y 0.89 es excelente y 0.9 ó superior es una discriminación excepcional. El modelo tiene una discriminación excepcional porque tiene el 91.53 %.

2.7. Efectos Marginales:

El cálculo de los efectos marginales se emplea la fórmula general (válida para cualquier distribución):

0.0

00

.25

0.5

00

.75

1.0

0S

en

sitiv

ity

0.00 0.25 0.50 0.75 1.001 - Specificity

Area under ROC curve = 0.9153

19

[ ] ( )( )

( ) kk

iki

iif

F

x

yEβββ

ββ

''

'i

i xx

xx=

∂=

2.8. Predicción:

. estimates use N:\modlogc.ster

. predict catf

(option pr assumed; Pr(categoria))

(7 missing values generated)

. gen categoriaf=1 if catf>0.5

(231 missing values generated)

. replace categoriaf = 0 if catf<=0.5

(231 real changes made)

. tab categoria categoriaf in 301/342, cell

+-----------------+

| Key |

|-----------------|

| frequency |

| cell percentage |

+-----------------+

Dummy, |

toma |

valores de |

1 si es |

mal |

pagador y |

0 si es | categoriaf

bueno | 0 1 | Total

-----------+----------------------+----------

0 | 17 4 | 21

| 40.48 9.52 | 50.00

-----------+----------------------+----------

1 | 2 19 | 21

| 4.76 45.24 | 50.00

-----------+----------------------+----------

Total | 19 23 | 42

| 45.24 54.76 | 100.00

El modelo predice el 85.72 % correctamente.

((((****)))) ddddyyyy////ddddxxxx iiiissss ffffoooorrrr ddddiiiissssccccrrrreeeetttteeee cccchhhhaaaannnnggggeeee ooooffff dddduuuummmmmmmmyyyy vvvvaaaarrrriiiiaaaabbbblllleeee ffffrrrroooommmm 0000 ttttoooo 1111 oooottttrrrroooossssiiii~~~~2222 ....0000000066667777777700007777 ....00000000222288885555 2222....33338888 0000....000011118888 ....000000001111111188884444 ....000011112222333355557777 11111111....4444000066662222 hhhhiiiippppooootttteeee**** ----....4444888899998888111188888888 ....22229999888800009999 ----1111....66664444 0000....111100000000 ----1111....00007777444400006666 ....000099994444444411118888 ....999966662222444455557777 ccccuuuullllttttiiiivvvvoooo**** ----....3333000000008888111166667777 ....11114444000066665555 ----2222....11114444 0000....000033332222 ----....555577776666444488885555 ----....000022225555111144448888 ....888822222222555522226666bbbbeeeennnneeeeccccoooossss1111 ----....8888666633330000888833337777 ....11111111888866664444 ----7777....22227777 0000....000000000000 ----1111....00009999555566662222 ----....666633330000555544447777 ....999944444444000099996666 aaaannnnttttiiiigggguuuueeee ----....0000222222221111444400008888 ....00001111555522222222 ----1111....44445555 0000....111144446666 ----....000055551111999977775555 ....000000007777666699993333 3333....88880000222200005555 vvvvaaaarrrriiiiaaaabbbblllleeee ddddyyyy////ddddxxxx SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[ 99995555%%%% CCCC....IIII.... ]]]] XXXX ==== ....22221111555566666666777755556666 yyyy ==== PPPPrrrr((((ccccaaaatttteeeeggggoooorrrriiiiaaaa)))) ((((pppprrrreeeeddddiiiicccctttt))))MMMMaaaarrrrggggiiiinnnnaaaallll eeeeffffffffeeeeccccttttssss aaaafffftttteeeerrrr llllooooggggiiiitttt

.... mmmmffffxxxx

20

1.2. Modelos de elección múltiple. Existen varias formas en que se pueden analizar este problema: 1º Con datos no ordenados: se utiliza cuando las alternativas que presenta la variable

endógena no indican ningún orden. Pueden ser: 1.1. Multinomial, se utiliza cuando los regresores del modelo hacen referencia a las

observaciones muestrales, por lo que varían entre observaciones pero no entre alternativas.

1.2. Condicional, se utiliza cuando los regresores del modelo hacen referencia a las

alternativas, por lo que sus valores varían entre alternativas pudiendo hacerlo o no entre observaciones.

2º Con datos ordenados: se utiliza cuando las alternativas de la variable endógena

representan un orden entre ellas.

MODELO ORDENADO Cuando la variable dependiente es discreta, pero sus valores indican un orden, no es correcto realizar la estimación de la misma a través de los modelos presentados anteriormente, ya que la inclusión de la información que aporta el orden de las alternativas en la especificación del modelo permite obtener unos mejores resultados. Tampoco sería correcto el uso de un modelo de regresión clásico, ya que codificadas las posibles alternativas como 0, 1, 2, ...(j+1), ..., J, se estaría considerando la diferencia entre (j+1) y (j+2) como la existente entre 1 y 2, lo cual no tiene porque ser así ya que los números utilizados en la codificación solo representan un orden dentro de una clasificación. Sus características son: 1. Se modelizan tantas ecuaciones como alternativas tiene Y. 2. Se estima un parámetro para cada variable explicativa y tantos parámetros “límites”

como alternativas tiene Y menos una. El modelo sería:

. . . . . . . . . . . . . . . . . . . . .

1º Especificación:

VARIABLE DEFINICIÓN SIGNO

EDUC Dummy, toma valores de: 1 sin instrucción, 2 con primaria, 3 con secundaria, 4 con superior no universitaria y 5 con superior universitaria.

EXPER Años de experiencia. - SALARIO Nuevos soles. + SEXO Dummy, 1 si es hombre y 0 si es mujer. + / -

����� = ������� , �� ��!"� , ���"��

)'()0(Prikki XYob β−Λ==

)'()'()1(Pr 1 ikkiki kXXYob ββµ −Λ−−Λ==)'()'()2(Pr 12 kikkiki XXYob βµβµ −Λ−−Λ==

)'(1))1((Pr )2( ikkJi XJYob βµ −Λ−=−= −

21 2º Estimación:

3º Evaluación:

1.- Signo correcto de los coeficientes.

Todos tienen los signos correctos. 2.- Significancia estadística individual de los parámetros:

EXPER (|−17.89| > 2), SALARIO (20.06 > 2) y SEXO (|−6.28| > 2) son significativas.

3.- Significancia conjunta del modelo:

El modelo en conjunto es significativo (657.47 > 7.8147)

4.- Pseudo-R2:

� = 0.1540. Es un coeficiente de bondad bajo. 5.- Especificación:

////ccccuuuutttt4444 3333....555555556666777700006666 ....111199992222333366664444 3333....11117777999966668888 3333....999933333333777733333333 ////ccccuuuutttt3333 1111....999900004444444499994444 ....1111777711119999888899991111 1111....555566667777444400002222 2222....222244441111555588887777 ////ccccuuuutttt2222 ....1111333322225555000022229999 ....1111666677771111888866661111 ----....1111999955551111777755558888 ....4444666600001111888811116666 ////ccccuuuutttt1111 ----1111....88881111222222225555 ....111188888888777700004444 ----2222....111188882222111100003333 ----1111....444444442222333399997777 sssseeeexxxxoooo ----....6666555533335555888800007777 ....111100004444111133331111 ----6666....22228888 0000....000000000000 ----....8888555577776666777733337777 ----....4444444499994444888877778888 ssssaaaallllaaaarrrriiiioooo ....0000000088886666111100009999 ....0000000000004444222299993333 22220000....00006666 0000....000000000000 ....0000000077777777666699995555 ....0000000099994444555522222222 eeeexxxxppppeeeerrrr ----....1111000055550000555544445555 ....000000005555888877771111 ----11117777....88889999 0000....000000000000 ----....1111111166665555666611116666 ----....0000999933335555444477775555 eeeedddduuuucccc CCCCooooeeeeffff.... SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[99995555%%%% CCCCoooonnnnffff.... IIIInnnntttteeeerrrrvvvvaaaallll]]]]

LLLLoooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888800005555....4444777799998888 PPPPsssseeeeuuuuddddoooo RRRR2222 ==== 0000....1111555544440000 PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....0000000000000000 LLLLRRRR cccchhhhiiii2222((((3333)))) ==== 666655557777....44447777OOOOrrrrddddeeeerrrreeeedddd llllooooggggiiiissssttttiiiicccc rrrreeeeggggrrrreeeessssssssiiiioooonnnn NNNNuuuummmmbbbbeeeerrrr ooooffff oooobbbbssss ==== 1111444400000000

IIIItttteeeerrrraaaattttiiiioooonnnn 4444:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888800005555....4444777799998888 IIIItttteeeerrrraaaattttiiiioooonnnn 3333:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888800005555....4444777799998888 IIIItttteeeerrrraaaattttiiiioooonnnn 2222:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888800005555....4444888877771111 IIIItttteeeerrrraaaattttiiiioooonnnn 1111:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888811117777....0000111199995555 IIIItttteeeerrrraaaattttiiiioooonnnn 0000:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----2222111133334444....2222111133337777

.... oooollllooooggggiiiitttt eeeedddduuuucccc eeeexxxxppppeeeerrrr ssssaaaallllaaaarrrriiiioooo sssseeeexxxxoooo iiiinnnn 1111////1111444400000000

////ccccuuuutttt4444 3333....555566664444777711116666 ....1111222233339999222299993333 3333....333322221111888811119999 3333....888800007777666611113333 ////ccccuuuutttt3333 1111....99992222777755559999 ....0000999988881111555599999999 1111....7777333355552222 2222....11111111999999998888 ////ccccuuuutttt2222 ....1111444477775555666600006666 ....0000888844443333777733333333 ----....000011117777888800008888 ....3333111122229999222299991111 ////ccccuuuutttt1111 ----1111....888833331111666633332222 ....1111111155553333333377771111 ----2222....000055557777666688889999 ----1111....666600005555555577775555 ____hhhhaaaattttssssqqqq ----....0000222266664444333333332222 ....0000111177778888222277774444 ----1111....44448888 0000....111133338888 ----....0000666611113333777744442222 ....0000000088885555000077778888 ____hhhhaaaatttt 1111....000077779999666600009999 ....0000777711110000111155555555 11115555....22220000 0000....000000000000 ....999944440000444422221111 1111....222211118888777799997777 eeeedddduuuucccc CCCCooooeeeeffff.... SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[99995555%%%% CCCCoooonnnnffff.... IIIInnnntttteeeerrrrvvvvaaaallll]]]]

LLLLoooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888800004444....4444333333334444 PPPPsssseeeeuuuuddddoooo RRRR2222 ==== 0000....1111555544445555 PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....0000000000000000 LLLLRRRR cccchhhhiiii2222((((2222)))) ==== 666655559999....55556666OOOOrrrrddddeeeerrrreeeedddd llllooooggggiiiissssttttiiiicccc rrrreeeeggggrrrreeeessssssssiiiioooonnnn NNNNuuuummmmbbbbeeeerrrr ooooffff oooobbbbssss ==== 1111444400000000

IIIItttteeeerrrraaaattttiiiioooonnnn 4444:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888800004444....4444333333334444 IIIItttteeeerrrraaaattttiiiioooonnnn 3333:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888800004444....4444333333334444 IIIItttteeeerrrraaaattttiiiioooonnnn 2222:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888800004444....4444555544441111 IIIItttteeeerrrraaaattttiiiioooonnnn 1111:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888811116666....777711111111 IIIItttteeeerrrraaaattttiiiioooonnnn 0000:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----2222111133334444....2222111133337777

.... lllliiiinnnnkkkktttteeeesssstttt

22

La probabilidad es 0.138 mayor a 0.05, por lo tanto, no hay que realizar ninguna transformación a las variables independientes.

4º Comparación con el modelo Probit:

El modelo Logit es mejor porque presenta mayor Pseudo R2 y menores criterios de información (AIC y BIC).

5º Efectos marginales:

6º Predicción:

(*) dy/dx is for discrete change of dummy variable from 0 to 1

NNNNooootttteeee:::: NNNN====OOOObbbbssss uuuusssseeeedddd iiiinnnn ccccaaaallllccccuuuullllaaaattttiiiinnnngggg BBBBIIIICCCC;;;; sssseeeeeeee [[[[RRRR]]]] BBBBIIIICCCC nnnnooootttteeee .... 1111444400000000 ----2222111133334444....222211114444 ----1111888800005555....44448888 7777 3333666622224444....99996666 3333666666661111....666666669999 MMMMooooddddeeeellll OOOObbbbssss llllllll((((nnnnuuuullllllll)))) llllllll((((mmmmooooddddeeeellll)))) ddddffff AAAAIIIICCCC BBBBIIIICCCC

.... eeeessssttttaaaatttt iiiicccc

NNNNooootttteeee:::: NNNN====OOOObbbbssss uuuusssseeeedddd iiiinnnn ccccaaaallllccccuuuullllaaaattttiiiinnnngggg BBBBIIIICCCC;;;; sssseeeeeeee [[[[RRRR]]]] BBBBIIIICCCC nnnnooootttteeee .... 1111444400000000 ----2222111133334444....222211114444 ----1111888811112222....55559999 7777 3333666633339999....11118888 3333666677775555....88889999 MMMMooooddddeeeellll OOOObbbbssss llllllll((((nnnnuuuullllllll)))) llllllll((((mmmmooooddddeeeellll)))) ddddffff AAAAIIIICCCC BBBBIIIICCCC

.... eeeessssttttaaaatttt iiiicccc

////ccccuuuutttt4444 1111....999955551111333388881111 ....1111000022226666111122224444 1111....777755550000222266664444 2222....111155552222444499997777 ////ccccuuuutttt3333 1111....000000009999111155554444 ....0000999955556666222266669999 ....8888222211117777222299991111 1111....11119999666655558888 ////ccccuuuutttt2222 ----....0000333333332222111122225555 ....000099994444111177774444 ----....2222111177777777999900001111 ....111155551111333366665555 ////ccccuuuutttt1111 ----1111....111111115555999999995555 ....1111000033331111444455559999 ----1111....333311118888111155557777 ----....9999111133338888333322225555 sssseeeexxxxoooo ----....3333666600005555777744448888 ....0000666600006666444400008888 ----5555....99995555 0000....000000000000 ----....4444777799994444222288885555 ----....222244441111777722221111 ssssaaaallllaaaarrrriiiioooo ....0000000044446666888877772222 ....0000000000002222111199998888 22221111....33333333 0000....000000000000 ....0000000044442222555566665555 ....0000000055551111111177779999 eeeexxxxppppeeeerrrr ----....0000555599993333111144445555 ....0000000033332222333366668888 ----11118888....33332222 0000....000000000000 ----....0000666655556666555588886666 ----....0000555522229999777700005555 eeeedddduuuucccc CCCCooooeeeeffff.... SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[99995555%%%% CCCCoooonnnnffff.... IIIInnnntttteeeerrrrvvvvaaaallll]]]]

LLLLoooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888811112222....55559999 PPPPsssseeeeuuuuddddoooo RRRR2222 ==== 0000....1111555500007777 PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....0000000000000000 LLLLRRRR cccchhhhiiii2222((((3333)))) ==== 666644443333....22225555OOOOrrrrddddeeeerrrreeeedddd pppprrrroooobbbbiiiitttt rrrreeeeggggrrrreeeessssssssiiiioooonnnn NNNNuuuummmmbbbbeeeerrrr ooooffff oooobbbbssss ==== 1111444400000000

IIIItttteeeerrrraaaattttiiiioooonnnn 4444:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888811112222....55559999 IIIItttteeeerrrraaaattttiiiioooonnnn 3333:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888811112222....55559999 IIIItttteeeerrrraaaattttiiiioooonnnn 2222:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888811112222....5555999900008888 IIIItttteeeerrrraaaattttiiiioooonnnn 1111:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----1111888811114444....1111222299992222 IIIItttteeeerrrraaaattttiiiioooonnnn 0000:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----2222111133334444....2222111133337777

.... oooopppprrrroooobbbbiiiitttt eeeedddduuuucccc eeeexxxxppppeeeerrrr ssssaaaallllaaaarrrriiiioooo sssseeeexxxxoooo iiiinnnn 1111////1111444400000000

((((****)))) ddddyyyy////ddddxxxx iiiissss ffffoooorrrr ddddiiiissssccccrrrreeeetttteeee cccchhhhaaaannnnggggeeee ooooffff dddduuuummmmmmmmyyyy vvvvaaaarrrriiiiaaaabbbblllleeee ffffrrrroooommmm 0000 ttttoooo 1111 sssseeeexxxxoooo**** ....0000111199998888333333332222 ....0000000033336666 5555....55551111 0000....000000000000 ....000011112222777788884444 ....000022226666888888882222 ....666611117777888855557777 ssssaaaallllaaaarrrriiiioooo ----....0000000000002222777766668888 ....00000000000000003333 ----9999....33332222 0000....000000000000 ----....000000000000333333335555 ----....000000000000222211119999 444433339999....111133333333 eeeexxxxppppeeeerrrr ....0000000033333333777766669999 ....00000000000033337777 9999....11116666 0000....000000000000 ....000000002222666655554444 ....000000004444000099999999 11117777....3333222222229999 vvvvaaaarrrriiiiaaaabbbblllleeee ddddyyyy////ddddxxxx SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[ 99995555%%%% CCCC....IIII.... ]]]] XXXX ==== ....00003333333322224444999933333333 yyyy ==== PPPPrrrr((((eeeedddduuuucccc========1111)))) ((((pppprrrreeeeddddiiiicccctttt))))MMMMaaaarrrrggggiiiinnnnaaaallll eeeeffffffffeeeeccccttttssss aaaafffftttteeeerrrr oooollllooooggggiiiitttt

.... mmmmffffxxxx

((((1111444400000000 mmmmiiiissssssssiiiinnnngggg vvvvaaaalllluuuueeeessss ggggeeeennnneeeerrrraaaatttteeeedddd))))((((ooooppppttttiiiioooonnnn pppprrrr aaaassssssssuuuummmmeeeedddd;;;; pppprrrreeeeddddiiiicccctttteeeedddd pppprrrroooobbbbaaaabbbbiiiilllliiiittttiiiieeeessss)))).... pppprrrreeeeddddiiiicccctttt eeeedddduuuucccc1111ffff eeeedddduuuucccc2222ffff eeeedddduuuucccc3333ffff eeeedddduuuucccc4444ffff eeeedddduuuucccc5555ffff iiiinnnn 1111444400001111////1111444477776666

23

El modelo predice el 37.5 % correctamente MODELO MULTINOMIAL En este modelo los valores de las variables explicativas varían para cada individuo pero son constantes para cualquier alternativa, por lo que no se puede apreciar la influencia de la variable en cada alternativa a no ser que se introduzca una variable ficticia, multiplicada por los valores de Wi, que represente a cada alternativa. Para evitar problemas de singularidad, el número de variables ficticias a introducir en el modelo será igual al número de alternativas menos uno (J-1). Sus características son: 1. Se modelizan tantas ecuaciones como alternativas tiene Y. 2. Para cada variable se estiman tantos parámetros como alternativas de Y menos una. 3. Es necesario identificar una categoría de referencia. El modelo sería:

((((0000 rrrreeeeaaaallll cccchhhhaaaannnnggggeeeessss mmmmaaaaddddeeee)))).... rrrreeeeppppllllaaaacccceeee eeeedddduuuuccccffff ==== 1111 iiiiffff ((((eeeedddduuuucccc1111ffff >>>> eeeedddduuuucccc5555ffff &&&& eeeedddduuuucccc1111ffff >>>> eeeedddduuuucccc4444ffff &&&& eeeedddduuuucccc1111ffff >>>> eeeedddduuuucccc3333ffff &&&& eeeedddduuuucccc1111ffff>>>> eeeedddduuuucccc2222ffff))))

((((5555 rrrreeeeaaaallll cccchhhhaaaannnnggggeeeessss mmmmaaaaddddeeee)))).... rrrreeeeppppllllaaaacccceeee eeeedddduuuuccccffff ==== 2222 iiiiffff ((((eeeedddduuuucccc2222ffff >>>> eeeedddduuuucccc5555ffff &&&& eeeedddduuuucccc2222ffff >>>> eeeedddduuuucccc4444ffff &&&& eeeedddduuuucccc2222ffff >>>> eeeedddduuuucccc3333ffff &&&& eeeedddduuuucccc2222ffff>>>> eeeedddduuuucccc1111ffff))))

((((11115555 rrrreeeeaaaallll cccchhhhaaaannnnggggeeeessss mmmmaaaaddddeeee)))).... rrrreeeeppppllllaaaacccceeee eeeedddduuuuccccffff ==== 3333 iiiiffff ((((eeeedddduuuucccc3333ffff >>>> eeeedddduuuucccc5555ffff &&&& eeeedddduuuucccc3333ffff >>>> eeeedddduuuucccc4444ffff &&&& eeeedddduuuucccc3333ffff >>>> eeeedddduuuucccc2222ffff &&&& eeeedddduuuucccc3333ffff>>>> eeeedddduuuucccc1111ffff))))

((((22229999 rrrreeeeaaaallll cccchhhhaaaannnnggggeeeessss mmmmaaaaddddeeee)))).... rrrreeeeppppllllaaaacccceeee eeeedddduuuuccccffff ==== 4444 iiiiffff ((((eeeedddduuuucccc4444ffff >>>> eeeedddduuuucccc5555ffff &&&& eeeedddduuuucccc4444ffff >>>> eeeedddduuuucccc3333ffff &&&& eeeedddduuuucccc4444ffff >>>> eeeedddduuuucccc2222ffff &&&& eeeedddduuuucccc4444ffff>>>> eeeedddduuuucccc1111ffff))))

((((1111444444449999 mmmmiiiissssssssiiiinnnngggg vvvvaaaalllluuuueeeessss ggggeeeennnneeeerrrraaaatttteeeedddd)))).... ggggeeeennnn eeeedddduuuuccccffff ==== 5555 iiiiffff ((((eeeedddduuuucccc5555ffff >>>> eeeedddduuuucccc4444ffff &&&& eeeedddduuuucccc5555ffff >>>> eeeedddduuuucccc3333ffff &&&& eeeedddduuuucccc5555ffff >>>> eeeedddduuuucccc2222ffff &&&& eeeedddduuuucccc5555ffff>>>> eeeedddduuuucccc1111ffff))))

0 para 1

1)0(Pr

1

1

'=

+==

∑−

=

j

e

YobJ

j

Xi

kikjβ

)1( ..., ,2 ,1 para 1

)(Pr1

1

'

'

−=+

==

∑−

=

Jj

e

ejYob

J

j

X

X

i

kikj

kikj

β

β

4444....11117777 11118888....00006666 44440000....22228888 33337777....55550000 111100000000....00000000 TTTToooottttaaaallll 3333 11113333 22229999 22227777 77772222 4444....11117777 11118888....00006666 44440000....22228888 33337777....55550000 111100000000....00000000 5555 3333 11113333 22229999 22227777 77772222 EEEEDDDDUUUUCCCCAAAATTTTIIIIVVVVOOOO 2222 3333 4444 5555 TTTToooottttaaaallll NNNNIIIIVVVVEEEELLLL eeeedddduuuuccccffff

cccceeeellllllll ppppeeeerrrrcccceeeennnnttttaaaaggggeeee ffffrrrreeeeqqqquuuueeeennnnccccyyyy KKKKeeeeyyyy

.... ttttaaaabbbb eeeedddduuuucccc eeeedddduuuuccccffff,,,, cccceeeellllllll

TTTToooottttaaaallll 77772222 111100000000....00000000 3333 3333 4444....11117777 111100000000....00000000 2222 11113333 11118888....00006666 99995555....88883333 1111 22229999 44440000....22228888 77777777....77778888 0000 22227777 33337777....55550000 33337777....55550000 sssseeeessss FFFFrrrreeeeqqqq.... PPPPeeeerrrrcccceeeennnntttt CCCCuuuummmm....

.... ttttaaaabbbb sssseeeessss

((((1111444400004444 mmmmiiiissssssssiiiinnnngggg vvvvaaaalllluuuueeeessss ggggeeeennnneeeerrrraaaatttteeeedddd)))).... ggggeeeennnn sssseeeessss====eeeedddduuuucccc----eeeedddduuuuccccffff

24

Como la suma de las probabilidades es 1, sólo necesitamos J vectores de parámetros. Por ello podemos normalizar uno de ellos a cualquier valor. Lo más usual es normalizar �, = 0. 1º Especificación:

Los estudiantes de escuela secundaria que entran hacen opciones de programa entre programa general, programa profesional y programa académico. Su opción podría ser modelada usando su resultado de escritura y su situación económica social.

VARIABLE DEFINICIÓN

PROG Programa, toma valores de: 1 general, 2 académico y 3 profesional.

SES Situación económica y social, toma valores de: 1 bajo, 2 medio y 3 alto.

ESCRITURA Puntaje obtenido. SEXO Dummy, 1 si es mujer y 0 si es hombre.

��"�� = ����� , ����!.���� , ���"��

2º Estimación:

3º Evaluación:

1.- Significancia estadística individual de los parámetros:

En el programa académico: SES (0.065<0.10) y ESCRITURA (0.089<0.10) son significativas relativas. En el programa profesional: ESCRITURA (0.006<0.01) es altamente significativa.

2.- Significancia conjunta del modelo:

El modelo en conjunto es significativo (31.11 > 12.5916)

3.- Pseudo-R2:

____ccccoooonnnnssss 3333....111144445555999977778888 1111....333322222222111122225555 2222....33338888 0000....000011117777 ....5555555544446666666600009999 5555....777733337777222299996666 sssseeeexxxxoooo ....4444444433330000666633332222 ....4444777777774444444477774444 0000....99993333 0000....333355553333 ----....4444999922227777111166665555 1111....333377778888888844443333 eeeessssccccrrrriiiittttuuuurrrraaaa ----....0000777733338888999922221111 ....000022227777000033335555 ----2222....77773333 0000....000000006666 ----....1111222266668888777799998888 ----....0000222200009999000044445555 sssseeeessss ....1111666622221111444455556666 ....333322221111666666662222 0000....55550000 0000....666611114444 ----....4444666688883333000000003333 ....7777999922225555999911115555pppprrrrooooffffeeeessssiiiioooonnnnaaaallll ____ccccoooonnnnssss ----2222....555566664444000088884444 1111....333300001111666611115555 ----1111....99997777 0000....000044449999 ----5555....111111115555222200003333 ----....0000111122229999666644446666 sssseeeexxxxoooo ----....1111555500005555888888884444 ....4444111166668888777777776666 ----0000....33336666 0000....777711118888 ----....9999666677776666555533334444 ....6666666666664444777766666666 eeeessssccccrrrriiiittttuuuurrrraaaa ....0000444411116666000066663333 ....0000222244444444999966667777 1111....77770000 0000....000088889999 ----....0000000066664444000066663333 ....0000888899996666111188889999 sssseeeessss ....5555333322227777444499993333 ....2222888888888888999933333333 1111....88884444 0000....000066665555 ----....0000333333334444777711112222 1111....00009999888899997777aaaaccccaaaaddddeeeemmmmiiiiccccoooo ggggeeeennnneeeerrrraaaallll ((((bbbbaaaasssseeee oooouuuuttttccccoooommmmeeee)))) pppprrrroooogggg CCCCooooeeeeffff.... SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[99995555%%%% CCCCoooonnnnffff.... IIIInnnntttteeeerrrrvvvvaaaallll]]]]

LLLLoooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111166664444....7777999977771111 PPPPsssseeeeuuuuddddoooo RRRR2222 ==== 0000....0000888866662222 PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....0000000000000000 LLLLRRRR cccchhhhiiii2222((((6666)))) ==== 33331111....11111111MMMMuuuullllttttiiiinnnnoooommmmiiiiaaaallll llllooooggggiiiissssttttiiiicccc rrrreeeeggggrrrreeeessssssssiiiioooonnnn NNNNuuuummmmbbbbeeeerrrr ooooffff oooobbbbssss ==== 111177770000

IIIItttteeeerrrraaaattttiiiioooonnnn 4444:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111166664444....7777999977771111 IIIItttteeeerrrraaaattttiiiioooonnnn 3333:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111166664444....7777999977771111 IIIItttteeeerrrraaaattttiiiioooonnnn 2222:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111166664444....77779999777777773333 IIIItttteeeerrrraaaattttiiiioooonnnn 1111:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111166665555....11113333999966667777 IIIItttteeeerrrraaaattttiiiioooonnnn 0000:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111188880000....3333555500001111

.... mmmmllllooooggggiiiitttt pppprrrroooogggg sssseeeessss eeeessssccccrrrriiiittttuuuurrrraaaa sssseeeexxxxoooo iiiinnnn 1111////111177770000,,,, bbbbaaaasssseeee((((1111))))

25 � = 0.0862. Es un coeficiente de bondad bajo.

4º Comparación con el modelo Probit:

El modelo Probit es mejor porque presenta menores criterios de información (AIC y BIC).

5º Efectos marginales:

6º Predicción:

(*) dy/dx is for discrete change of dummy variable from 0 to 1

NNNNooootttteeee:::: NNNN====OOOObbbbssss uuuusssseeeedddd iiiinnnn ccccaaaallllccccuuuullllaaaattttiiiinnnngggg BBBBIIIICCCC;;;; sssseeeeeeee [[[[RRRR]]]] BBBBIIIICCCC nnnnooootttteeee .... 111177770000 ----111188880000....3333555500001111 ----111166664444....7777999977771111 8888 333344445555....5555999944442222 333377770000....6666888800006666 MMMMooooddddeeeellll OOOObbbbssss llllllll((((nnnnuuuullllllll)))) llllllll((((mmmmooooddddeeeellll)))) ddddffff AAAAIIIICCCC BBBBIIIICCCC

.... eeeessssttttaaaatttt iiiicccc

NNNNooootttteeee:::: NNNN====OOOObbbbssss uuuusssseeeedddd iiiinnnn ccccaaaallllccccuuuullllaaaattttiiiinnnngggg BBBBIIIICCCC;;;; sssseeeeeeee [[[[RRRR]]]] BBBBIIIICCCC nnnnooootttteeee .... 111177770000 .... ----111166664444....6666777733336666 8888 333344445555....3333444477773333 333377770000....4444333333337777 MMMMooooddddeeeellll OOOObbbbssss llllllll((((nnnnuuuullllllll)))) llllllll((((mmmmooooddddeeeellll)))) ddddffff AAAAIIIICCCC BBBBIIIICCCC

.... eeeessssttttaaaatttt iiiicccc

____ccccoooonnnnssss 2222....444499992222888800003333 ....999999997777333300009999 2222....55550000 0000....000011112222 ....5555333388881111111133335555 4444....444444447777444499993333 sssseeeexxxxoooo ....3333555566669999444411115555 ....3333555599997777000044449999 0000....99999999 0000....333322221111 ----....3333444488880000666677772222 1111....00006666111199995555 eeeessssccccrrrriiiittttuuuurrrraaaa ----....0000555577772222555533336666 ....0000111199998888333355554444 ----2222....88889999 0000....000000004444 ----....0000999966661111333300003333 ----....0000111188883333777766669999 sssseeeessss ....111100001111111111119999 ....2222444422221111888899999999 0000....44442222 0000....666677776666 ----....3333777733335555666644444444 ....5555777755558888000022224444pppprrrrooooffffeeeessssiiiioooonnnnaaaallll ____ccccoooonnnnssss ----2222....00004444555511117777 ....9999666611118888888822223333 ----2222....11113333 0000....000033333333 ----3333....999933330000444422225555 ----....1111555599999999111155555555 sssseeeexxxxoooo ----....1111111111113333555511119999 ....3333222244447777555500002222 ----0000....33334444 0000....777733332222 ----....7777444477778888555500005555 ....5555222255551111444466667777 eeeessssccccrrrriiiittttuuuurrrraaaa ....000033334444333366667777 ....0000111188883333222233333333 1111....88888888 0000....000066661111 ----....0000000011115555444466661111 ....0000777700002222888800001111 sssseeeessss ....3333999977775555000066661111 ....2222222211117777444444448888 1111....77779999 0000....000077773333 ----....0000333377771111000055557777 ....8888333322221111111177779999aaaaccccaaaaddddeeeemmmmiiiiccccoooo ggggeeeennnneeeerrrraaaallll ((((bbbbaaaasssseeee oooouuuuttttccccoooommmmeeee)))) pppprrrroooogggg CCCCooooeeeeffff.... SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[99995555%%%% CCCCoooonnnnffff.... IIIInnnntttteeeerrrrvvvvaaaallll]]]]

LLLLoooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111166664444....66667777333366664444 PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....0000000000001111 WWWWaaaalllldddd cccchhhhiiii2222((((6666)))) ==== 22228888....11115555MMMMuuuullllttttiiiinnnnoooommmmiiiiaaaallll pppprrrroooobbbbiiiitttt rrrreeeeggggrrrreeeessssssssiiiioooonnnn NNNNuuuummmmbbbbeeeerrrr ooooffff oooobbbbssss ==== 111177770000

IIIItttteeeerrrraaaattttiiiioooonnnn 2222:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111166664444....66667777333366664444 IIIItttteeeerrrraaaattttiiiioooonnnn 1111:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111166664444....66667777333366664444 IIIItttteeeerrrraaaattttiiiioooonnnn 0000:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----111166664444....6666999988887777

.... mmmmpppprrrroooobbbbiiiitttt pppprrrroooogggg sssseeeessss eeeessssccccrrrriiiittttuuuurrrraaaa sssseeeexxxxoooo iiiinnnn 1111////111177770000,,,, bbbbaaaasssseeee((((1111))))

((((****)))) ddddyyyy////ddddxxxx iiiissss ffffoooorrrr ddddiiiissssccccrrrreeeetttteeee cccchhhhaaaannnnggggeeee ooooffff dddduuuummmmmmmmyyyy vvvvaaaarrrriiiiaaaabbbblllleeee ffffrrrroooommmm 0000 ttttoooo 1111 sssseeeexxxxoooo**** ----....0000888877774444888844441111 ....00008888666633335555 ----1111....00001111 0000....333311111111 ----....22225555666677773333 ....000088881111777766662222 ....555544447777000055559999eeeessssccccrrrriiiitttt~~~~aaaa ....0000111199992222111188889999 ....00000000444499992222 3333....99990000 0000....000000000000 ....000000009999555566669999 ....000022228888888866669999 55551111....0000111177776666 sssseeeessss ....1111000066668888999944445555 ....00005555888899995555 1111....88881111 0000....000077770000 ----....000000008888666655552222 ....222222222222444444441111 2222 vvvvaaaarrrriiiiaaaabbbblllleeee ddddyyyy////ddddxxxx SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[ 99995555%%%% CCCC....IIII.... ]]]] XXXX ==== ....44446666999955550000000011114444 yyyy ==== PPPPrrrr((((pppprrrroooogggg========aaaaccccaaaaddddeeeemmmmiiiiccccoooo)))) ((((pppprrrreeeeddddiiiicccctttt))))MMMMaaaarrrrggggiiiinnnnaaaallll eeeeffffffffeeeeccccttttssss aaaafffftttteeeerrrr mmmmpppprrrroooobbbbiiiitttt

.... mmmmffffxxxx

((((ooooppppttttiiiioooonnnn pppprrrr aaaassssssssuuuummmmeeeedddd;;;; pppprrrreeeeddddiiiicccctttteeeedddd pppprrrroooobbbbaaaabbbbiiiilllliiiittttiiiieeeessss)))).... pppprrrreeeeddddiiiicccctttt pppprrrroooogggg1111ffff pppprrrroooogggg2222ffff pppprrrroooogggg3333ffff iiiinnnn 111177771111////222200000000

((((0000 rrrreeeeaaaallll cccchhhhaaaannnnggggeeeessss mmmmaaaaddddeeee)))).... rrrreeeeppppllllaaaacccceeee pppprrrrooooggggffff ==== 1111 iiiiffff ((((pppprrrroooogggg1111ffff >>>> pppprrrroooogggg3333ffff &&&& pppprrrroooogggg1111ffff>>>> pppprrrroooogggg2222ffff))))

((((33330000 rrrreeeeaaaallll cccchhhhaaaannnnggggeeeessss mmmmaaaaddddeeee)))).... rrrreeeeppppllllaaaacccceeee pppprrrrooooggggffff ==== 2222 iiiiffff ((((pppprrrroooogggg2222ffff >>>> pppprrrroooogggg3333ffff &&&& pppprrrroooogggg2222ffff>>>> pppprrrroooogggg1111ffff))))

((((222200000000 mmmmiiiissssssssiiiinnnngggg vvvvaaaalllluuuueeeessss ggggeeeennnneeeerrrraaaatttteeeedddd)))).... ggggeeeennnn pppprrrrooooggggffff ==== 3333 iiiiffff ((((pppprrrroooogggg3333ffff >>>> pppprrrroooogggg2222ffff &&&& pppprrrroooogggg3333ffff>>>> pppprrrroooogggg1111ffff))))

cccceeeellllllll ppppeeeerrrrcccceeeennnnttttaaaaggggeeee ffffrrrreeeeqqqquuuueeeennnnccccyyyy KKKKeeeeyyyy

.... ttttaaaabbbb pppprrrroooogggg pppprrrrooooggggffff,,,, cccceeeellllllll

II.

2.1.

El model

Modelos

Existe uacotadoscensura El efectouna pobestablecmismo. D Por otrolimitadossimilar a

2.1. Modelo

Si analizindividuoembargoobservadcorrespo

La censude demaetc.).

modelo predice

delos con vari

iste un gran núotados de algunnsura.

efecto de truncaa población de tablece un valosmo. De esta for

r otro lado, cenitados a priori pilar al proceso d

delo censurad

analizamos el ividuos de la mbargo, los dete

servados tanto rrespondiente re

censura no solo demanda con r

TTTToooottttaaaallll pppprrrrooooffffeeeessssiiiioooonnnnaaaallll aaaaccccaaaaddddeeeemmmmiiiiccccoooo ggggeeeennnneeeerrrraaaallll pppprrrrooooggggrrrraaaammmmaaaa TTTTiiiippppoooo ddddeeee

TTTToooottttaaaallll 1111 0000 ----1111 sssseeeessssggggoooo

.... ttttaaaabbbb sssseeeessssggggoooo

((((111177770000 mmmmiiiissssssssiiiinnnngggg .... ggggeeeennnn sssseeeessssggggoooo====pppp

edice el 86.67 %

variable depe

an número de alguna forma. E

truncamiento ocn de interés, p valor sobre elsta forma, algun

o, censurar es riori por el invesceso de truncam

surado.

s el gasto en la muestra que determinantes tanto para los nte regresión ce

o solo es comú con restriccione

111100000000....00000000 33330000 6666....66667777 2222 88886666....66667777 22226666 6666....66667777 2222 2222 pppprrrrooooggggffff

33330000 2222 22226666 2222 FFFFrrrreeeeqqqq....

vvvvaaaalllluuuueeeessss ggggeeeennnneeeerrrraaaattpppprrrroooogggg----pppprrrrooooggggffff

7 % correcta

dependiente li

o de datos cuyma. Este fenóm

nto ocurre cuandrés, por ejempbre el cual el i algunos individ

r es un procedl investigador; esuncamiento.

o en automóvil ra que efectivamantes del gastoa los que tieneión censurada p

común en estudcciones de capa

111100000000....00000000 33330000 6666....66667777 2222 88886666....66667777 22226666 6666....66667777 2222 TTTToooottttaaaallll

111100000000....00000000 6666....66667777 88886666....66667777 6666....66667777 PPPPeeeerrrrcccceeeennnntttt

aatttteeeedddd))))

rrectamente.

nte limitada.

s cuya observafenómeno lleva a

cuando la muesejemplo, cuandol el ingreso sedividuos podrán

rocedimiento endor; este proced

móvil (y), por ectivamente posgasto (ingreso, tienen auto crada podría escr

estudios de dem capacidad (bill

111100000000....00000000 99993333....33333333 6666....66667777 CCCCuuuummmm....

bservación nos lleva a dos tipos

muestra de datouando se estuso se encuentrodrán no ser te

nto en el cual rocedimiento pr

por ejemplo, ee posean un aureso, situación uto como paraa escribirse com

de demanda de d (billetes de av

nos muestra qs tipos de efecto

e datos es extra estudia el inguentra por encser tenidos en c

cual los rangosnto produce una

plo, este será pun auto y será ción familiar, e

para los que e como:

da de bienes sin de avión, entra

stra que estánefectos: el trunc

s extraída aleatoel ingreso y la r encima o por

s en cuenta.

angos de una ce una distorsión

será positivo pa será nulo para liar, etc.) serán, que no lo tien

es sino también entradas para u

están limitadosl truncamiento

aleatoriamente y la pobreza o por debajo d

una variable storsión estadísti

tivo para aquell para el resto.serán, en generlo tienen. Así,

mbién en estudipara un concier

26

itados o y la

ente de reza se bajo del

ble son tadística

aquellos sto. Sin general, Así, la

dios ncierto,

En este de capacy0 en cas La regre

SUPUES 1º Li

Laob Dm

Soid

2º No

Es

Pe

En

este caso el pro capacidad (y0

en caso contrari

regresión sobre

PUESTO:

Linealidad

La regla dobservable s Dado el sumanera equ

Solo la difeidentificada Normalidad

Estos supue

Permiten de

Entonces:

el problema tie0) y la deman

ntrario.

sobre la variable

idad.-

gla de observaable si y* > c.

el supuesto dea equivalente co

la diferencia βicada si el umbra

lidad y homoce

supuestos facilit

ten definir:

ma tiene tres eledemanda real o

ariable latente p

bservabilidad d

sto de linealidante como:

cia β− c está umbral de cens

mocedasticidad

facilitan la deriv

es elementos: lareal o consumo

ente podría escr

ad de los mo

ealidad, la ante

está identifica censura es cer

icidad.-

a derivación del

tos: la demandasumo efectivo (y

a escribirse com

s modelos ce

a anterior desig

ntificada. La cos cero (c = 0).

n del logaritmo

manda potenciativo (yi), siendo

e como:

s censurados

desigualdad s

La constante d.

ritmo de la funci

tencial del bieniendo yi = y*i si

ados establece

ad se puede

ante del model

función de vero

bien (y*i ), el nivsi yi < y0 e y

blece que y

ede expresar

modelo solo es

e verosimilitud

27

, el nivel e yi =

e y es

esar de

está

ilitud:

Poun

Ba

En

D

Es Lade

1º Es

Sidedepa

Por otro laduna expresió

Bajo los sup

En consecu

Donde:

Es la inversa La expresióde la distribu Especificaci

Si analizamode la muesdeterminantpara los que

tro lado, los suppresión para E

s supuestos en

nsecuencia:

nversa del ratio

resión (no lineaistribución, el es

ificación:

lizamos el gastomuestra que inante del gastos que no lo tien

s supuestos deara E (y|x):

tos enunciados:

l ratio de Mills (o

o lineal) obtenid, el estimador M

l gasto en automque efectivamenl gasto es el inglo tienen.

��

tos de Normalid

ados:

ills (o hazard fu

tenida para E (ador MCO no re

automóvil (GAvamente posea el ingreso, obse

��� = �!/�

rmalidad y hom

ard función) eva

ra E (y|x) sugier no resultara apr

GA), este será posean un auto, observado tant

!/���

homoscedastic

n) evaluada en x

sugiere que, dara apropiado pa

será positivo pa auto y será no tanto para los

dasticidad perm

a en xβ/σ.

e, dada la natudo para el mode

tivo para aquelloserá nulo para ra los que tiene

permiten deriv

a naturaleza mixl modelo Tobit.

quellos individupara el resto. tienen auto com

28

derivar

za mixta obit.

dividuos esto. El to como

29 2º Estimación:

3º Evaluación:

1.- Significancia estadística individual de los parámetros:

La variable: ING (0.0000 < 0.01) es altamente significativa.

2.- Significancia conjunta del modelo:

El modelo en conjunto es significativo (154.80 > 3.8414)

3.- Pseudo-R2:

� = 0.5356. Es un coeficiente de bondad es bueno.

4.- Especificación:

La probabilidad es 0.971 mayor a 0.05, por lo tanto, no hay que realizar ninguna transformación a las variables independientes.

5º Efectos marginales:

6º Predicción:

((((99990000 mmmmiiiissssssssiiiinnnngggg vvvvaaaalllluuuueeeessss ggggeeeennnneeeerrrraaaatttteeeedddd))))((((ooooppppttttiiiioooonnnn xxxxbbbb aaaassssssssuuuummmmeeeedddd;;;; ffffiiiitttttttteeeedddd vvvvaaaalllluuuueeeessss)))).... pppprrrreeeeddddiiiicccctttt ggggaaaaffff iiiinnnn 99991111////111100000000

0000 rrrriiiigggghhhhtttt----cccceeeennnnssssoooorrrreeeedddd oooobbbbsssseeeerrrrvvvvaaaattttiiiioooonnnnssss 44446666 uuuunnnncccceeeennnnssssoooorrrreeeedddd oooobbbbsssseeeerrrrvvvvaaaattttiiiioooonnnnssss OOOObbbbssss.... ssssuuuummmmmmmmaaaarrrryyyy:::: 44444444 lllleeeefffftttt----cccceeeennnnssssoooorrrreeeedddd oooobbbbsssseeeerrrrvvvvaaaattttiiiioooonnnnssss aaaatttt ggggaaaa<<<<====0000 ////ssssiiiiggggmmmmaaaa ....8888777722228888000066664444 ....0000999911113333333311112222 ....6666999911113333333333333333 1111....000055554444222277779999 ____ccccoooonnnnssss ----5555....111199999999333333335555 ....5555333377776666444444449999 ----9999....66667777 0000....000000000000 ----6666....222266667777666622224444 ----4444....111133331111000044446666 iiiinnnngggg 1111....000033337777444477774444 ....0000777755553333999911118888 11113333....77776666 0000....000000000000 ....8888888877776666777711118888 1111....111188887777222277776666 ggggaaaa CCCCooooeeeeffff.... SSSSttttdddd.... EEEErrrrrrrr.... tttt PPPP>>>>||||tttt|||| [[[[99995555%%%% CCCCoooonnnnffff.... IIIInnnntttteeeerrrrvvvvaaaallll]]]]

LLLLoooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----66667777....000099999999444488882222 PPPPsssseeeeuuuuddddoooo RRRR2222 ==== 0000....5555333355556666 PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....0000000000000000 LLLLRRRR cccchhhhiiii2222((((1111)))) ==== 111155554444....88880000TTTToooobbbbiiiitttt rrrreeeeggggrrrreeeessssssssiiiioooonnnn NNNNuuuummmmbbbbeeeerrrr ooooffff oooobbbbssss ==== 99990000

.... ttttoooobbbbiiiitttt ggggaaaa iiiinnnngggg iiiinnnn 1111////99990000,,,, llllllll((((0000))))

0000 rrrriiiigggghhhhtttt----cccceeeennnnssssoooorrrreeeedddd oooobbbbsssseeeerrrrvvvvaaaattttiiiioooonnnnssss 44446666 uuuunnnncccceeeennnnssssoooorrrreeeedddd oooobbbbsssseeeerrrrvvvvaaaattttiiiioooonnnnssss OOOObbbbssss.... ssssuuuummmmmmmmaaaarrrryyyy:::: 44444444 lllleeeefffftttt----cccceeeennnnssssoooorrrreeeedddd oooobbbbsssseeeerrrrvvvvaaaattttiiiioooonnnnssss aaaatttt ggggaaaa<<<<====0000 ////ssssiiiiggggmmmmaaaa ....8888777733334444777766669999 ....0000999933333333111144441111 ....6666888888880000333344447777 1111....000055558888999911119999 ____ccccoooonnnnssss ----....0000000000005555666644449999 ....1111999900004444555533337777 ----0000....00000000 0000....999999998888 ----....3333777799990000555511116666 ....3333777777779999222211118888 ____hhhhaaaattttssssqqqq ----....0000000011116666444400007777 ....0000444455555555555544441111 ----0000....00004444 0000....999977771111 ----....0000999922221111666699999999 ....0000888888888888888888884444 ____hhhhaaaatttt 1111....000000005555888800005555 ....1111777777770000666611113333 5555....66668888 0000....000000000000 ....6666555533339999333322227777 1111....333355557777666677777777 ggggaaaa CCCCooooeeeeffff.... SSSSttttdddd.... EEEErrrrrrrr.... tttt PPPP>>>>||||tttt|||| [[[[99995555%%%% CCCCoooonnnnffff.... IIIInnnntttteeeerrrrvvvvaaaallll]]]]

LLLLoooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----66667777....00009999888888883333 PPPPsssseeeeuuuuddddoooo RRRR2222 ==== 0000....5555333355556666 PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....0000000000000000 LLLLRRRR cccchhhhiiii2222((((2222)))) ==== 111155554444....88880000TTTToooobbbbiiiitttt rrrreeeeggggrrrreeeessssssssiiiioooonnnn NNNNuuuummmmbbbbeeeerrrr ooooffff oooobbbbssss ==== 99990000

.... lllliiiinnnnkkkktttteeeesssstttt,,,, llllllll((((0000))))

iiiinnnngggg 1111....000033337777444477774444 ....00007777555533339999 11113333....77776666 0000....000000000000 ....888888889999777700009999 1111....11118888555522224444 5555....00005555333355557777 vvvvaaaarrrriiiiaaaabbbblllleeee ddddyyyy////ddddxxxx SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[ 99995555%%%% CCCC....IIII.... ]]]] XXXX ==== ....0000444433336666111111113333 yyyy ==== LLLLiiiinnnneeeeaaaarrrr pppprrrreeeeddddiiiiccccttttiiiioooonnnn ((((pppprrrreeeeddddiiiicccctttt))))MMMMaaaarrrrggggiiiinnnnaaaallll eeeeffffffffeeeeccccttttssss aaaafffftttteeeerrrr ttttoooobbbbiiiitttt

.... mmmmffffxxxx

30 2.2. Modelo truncado.

En el caso de selección o truncamiento la muestra es un subconjunto de la población. Sólo algunos valores se incluyen en la muestra. Faltan los valores de la variable de respuesta y de las explicativas. Por ejemplo una muestra de características de individuos con estudios secundarios. La encuesta se generó mediante entrevistas a individuos que completaron el secundario. Esto es una muestra truncada con respecto a la población. Los individuos excluidos no tendrán seguramente las mismas características que los incluidos. Esto implica truncar la distribución de una variable aleatoria. El valor esperado se aleja del punto de truncamiento y la variancia se reduce. En el ejemplo el nivel medio de educación será mayor que en la población y la variancia será menor. No es posible usar esta muestra para hacer inferencia sobre la población. Aunque pareciera que es posible hacer inferencia sobre la subpoblación, tampoco es posible esto. Una regresión sobre la subpoblación genera coeficientes sesgados hacia cero o “atenuados” en la medida que la variancia del término de error está sesgada hacia abajo. Supongamos que estamos interesados en analizar los determinantes de los ingresos (y) a partir de la siguiente relación funcional:

y = f (educación, edad, experiencia, . . .) . Disponemos de una muestra de individuos cuyos ingresos son inferiores a un determinado umbral c. Esto significa que la variable dependiente esta “truncada por arriba” y las observaciones por encima del umbral no están incluidas en nuestra muestra. En particular, si tomamos como principal deteminante de los ingresos los años de educación (x), la ecuación de regresión será:

�� = �, + �0�� + �� ��/��~/�0, 3 �

Dado que sólo observamos yi cuando yi ≤ c:

�, + �0�� + �� ≤ 5

Entonces el término de error:

�� ≤ 5 − �, − �0�� En consecuencia la esperanza del término de error es:

����/�� ≤ 5 − �, − �0��� ≠ 0 Los residuos estarán correlacionados con la variable explicativa y los estimadores MCO serán inconsistentes. Dado que en el ejemplo es esperable que el β sea positivo y que la esperanza del término de error decrezca con xi, entonces el estimador MCO estará sesgado “hacia abajo”. Esto implica subvaluar el efecto de la educación sobre los ingresos. En presencia de truncamiento en la variable dependiente el par (yi, x) solo es observable cuando y > c, por lo que para obtener la distribución de probabilidad de la variable aleatoria

truncadasea igua La nueva

Y la func

1º Es

Su(edde

2º Es

3º Ev

1.- Sig Lasign

2.- Sig

El m

LLLL LLLLTTTT

IIIIIIIIIIII

FFFF

((((....

((((....

....

ncada es necesa igual a 1.

nueva función d

a función de ver

Especificaci

Supongamo(INGHOG) educativo (Nde la sierra

Estimación:

Evaluación:

Significancia

Las variablesignificativa

Significancia

El modelo en

////ssssiiiiggggmmmmaaaa ____ccccoooonnnnssss rrrreeeeggggiiiioooonnnn sssseeeexxxxoooo eeeeddddaaaadddd nnnniiiivvvveeeedddduuuucccc iiiinnnngggg

LLLLoooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd uuuuppppppppeeeerrrr LLLLiiiimmmmiiiitttt:::: lllloooowwwweeeerrrr TTTTrrrruuuunnnnccccaaaatttteeeedddd rrrreeeeggggrrrreeee

IIIItttteeeerrrraaaattttiiiioooonnnn 2222:::: IIIItttteeeerrrraaaattttiiiioooonnnn 1111:::: IIIItttteeeerrrraaaattttiiiioooonnnn 0000::::

FFFFiiiittttttttiiiinnnngggg ffffuuuullllllll mmmmoooo

((((nnnnooootttteeee:::: 1111999977778888 oooobbbbssss.... ttttrrrruuuunnnnccccrrrreeeegggg iiiinnnngggg

((((1111999933336666 rrrreeeeaaaallll cccchhhhaaaannnn.... rrrreeeeppppllllaaaacccceeee iiiinnnngggg====iiii

.... ggggeeeennnn iiiinnnngggg====0000

necesario norma

ción de densida

de verosimilitud:

ificación:

gamos que esta) menores

tivo (NIVEDUC)ierra y 0 si es d

!/�7"��

ción:

ción:

ancia estadística

iables: NIVEDUCtivas.

ancia conjunta d

lo en conjunto e

4444444466665555....999900006666 11111111000033337777....77777777 ----4444666677779999....333399998888 222222225555....222244446666 ----3333....666655554444666633331111 333366662222....0000111155554444 CCCCooooeeeeffff....

==== ----11118888666600001111....777722226666 ==== ++++iiiinnnnffff ==== 0000 eeeessssssssiiiioooonnnn

lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooo lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooo lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooo

ooooddddeeeellll::::

ssss.... ttttrrrruuuunnnnccccaaaatttteeeedddd)))) nnnniiiivvvveeeedddduuuucccc eeeeddddaaaadddd

nnnnggggeeeessss mmmmaaaaddddeeee))))iiiinnnngggghhhhoooogggg iiiiffff iiiinnnngggghhhh

normalizar la fu

nsidad es:

ilitud:

e estamos intereores o igual aDUC), edad, sei es de la costa)

= �/!8���

dística individua

EDUC (0.0000

unta del modelo

junto es significa

77776666....77773333555555553333 5555 444455559999....4444444444442222 2222 666699993333....1111999944444444 ---- 222211111111....5555444444449999 6666....333322224444444400002222 ---- 66660000....00002222777788886666 SSSSttttdddd.... EEEErrrrrrrr....

oooodddd ==== ----11118888666600001111....77772222oooodddd ==== ----11118888666600001111....77772222oooodddd ==== ----11118888666600002222....33333333

sssseeeexxxxoooo rrrreeeeggggiiiioooonnnn,,,,

hhhhoooogggg<<<<====22220000000000000000

r la función de d

interesados enual a 20000. Ead, sexo (1 si escosta), es decir

/!8����� , ����

ual de los pa

.0000 < 0.01) y R

odelo:

gnificativo (117

55558888....22220000 0000....000000000000 22224444....00002222 0000....000000000000 ----6666....77775555 0000....000000000000 1111....00006666 0000....222288887777 ----0000....55558888 0000....555566663333 6666....00003333 0000....000000000000 zzzz PPPP>>>>||||zzzz||||

22226666 22227777 33337777

llllllll((((0000))))

n de distribución

os en analizar lo00. El determi

1 si es hombre ydecir.

����� , ���"� ,

los parámetros

y REGION (0

17.40 > 9.49

4444333311115555....555500007777 11110000111133337777....22228888 ----6666000033338888....000033334444 ----111188889999....3333777744444444 ----11116666....00005555000022223333 222244444444....333366663333 [[[[99995555%%%% CCCCoooonnnnffff....

PPPPrrrroooobbbb >>>> cccchhhhiiii2222 WWWWaaaalllldddd cccchhhhiiii2222((((4444)))) NNNNuuuummmmbbbbeeeerrrr ooooffff oooobbbb

ución para que

lizar los determiterminante del

mbre y 0 si es m

, ���!"/��

etros:

ION (0.0000<0.0

9)

4444666611116666....333300004444 11111111999933338888....22227777 ----3333333322220000....777766662222 666633339999....8888666666664444 8888....77774444000099997777 444477779999....6666666677779999 .... IIIInnnntttteeeerrrrvvvvaaaallll]]]]

==== 0000....0000000000000000)))) ==== 111111117777....44440000bbbbssss ==== 1111888899997777

a que la probab

terminantes dedel ingreso

i es mujer) y re

00<0.01) son alt

robabilidad total

es de los ingresreso son el nivr) y región (1 si

altamente

31 d total

ingresos nivel

(1 si es

32 3.- Especificación:

La probabilidad es 0.839 mayor a 0.05, por lo tanto, no hay que realizar ninguna transformación a las variables independientes.

4º Efectos marginales:

((((****)))) ddddyyyy////ddddxxxx iiiissss ffffoooorrrr ddddiiiissssccccrrrreeeetttteeee cccchhhhaaaannnnggggeeee ooooffff dddduuuummmmmmmmyyyy vvvvaaaarrrriiiiaaaabbbblllleeee ffffrrrroooommmm 0000 ttttoooo 1111 rrrreeeeggggiiiioooonnnn**** ----4444666677779999....333399998888 666699993333....11119999 ----6666....77775555 0000....000000000000 ----6666000033338888....00003333 ----3333333322220000....77776666 ....00002222999955552222 sssseeeexxxxoooo**** 222222225555....222244446666 222211111111....55554444 1111....00006666 0000....222288887777 ----111188889999....333377774444 666633339999....888866666666 ....444455558888000099992222 eeeeddddaaaadddd ----3333....666655554444666633331111 6666....3333222244444444 ----0000....55558888 0000....555566663333 ----11116666....0000555500002222 8888....77774444000099997777 33338888....2222999933336666 nnnniiiivvvveeeedddduuuucccc 333366662222....0000111155554444 66660000....000022228888 6666....00003333 0000....000000000000 222244444444....333366663333 444477779999....666666668888 4444....66662222333300009999 vvvvaaaarrrriiiiaaaabbbblllleeee ddddyyyy////ddddxxxx SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[ 99995555%%%% CCCC....IIII.... ]]]] XXXX ==== 11112222555533336666....444499999999 yyyy ==== LLLLiiiinnnneeeeaaaarrrr pppprrrreeeeddddiiiiccccttttiiiioooonnnn ((((pppprrrreeeeddddiiiicccctttt))))MMMMaaaarrrrggggiiiinnnnaaaallll eeeeffffffffeeeeccccttttssss aaaafffftttteeeerrrr ttttrrrruuuunnnnccccrrrreeeegggg

.... mmmmffffxxxx

////ssssiiiiggggmmmmaaaa 4444444400005555....888811119999 77771111....55552222888811114444 66661111....66660000 0000....000000000000 4444222266665555....666622227777 4444555544446666....000011112222 ____ccccoooonnnnssss 111155552222....6666222255552222 3333666666668888....000011117777 0000....00004444 0000....999966667777 ----7777000033336666....555555557777 7777333344441111....888800007777 ____hhhhaaaattttssssqqqq ----6666....11113333eeee----00006666 ....0000000000000000333300003333 ----0000....22220000 0000....888833339999 ----....0000000000000000666655555555 ....0000000000000000555533332222 ____hhhhaaaatttt 1111....000066669999333333337777 ....6666666688882222666677771111 1111....66660000 0000....111111110000 ----....2222444400004444444422222222 2222....333377779999111111117777 iiiinnnngggg CCCCooooeeeeffff.... SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[99995555%%%% CCCCoooonnnnffff.... IIIInnnntttteeeerrrrvvvvaaaallll]]]]

LLLLoooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----11118888666600008888....888855552222 PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....0000000000000000 uuuuppppppppeeeerrrr ==== ++++iiiinnnnffff WWWWaaaalllldddd cccchhhhiiii2222((((2222)))) ==== 111122222222....44449999LLLLiiiimmmmiiiitttt:::: lllloooowwwweeeerrrr ==== ----iiiinnnnffff NNNNuuuummmmbbbbeeeerrrr ooooffff oooobbbbssss ==== 1111888899997777TTTTrrrruuuunnnnccccaaaatttteeeedddd rrrreeeeggggrrrreeeessssssssiiiioooonnnn

IIIItttteeeerrrraaaattttiiiioooonnnn 1111:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----11118888666600008888....888855552222 IIIItttteeeerrrraaaattttiiiioooonnnn 0000:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----11118888666600008888....888855553333

FFFFiiiittttttttiiiinnnngggg ffffuuuullllllll mmmmooooddddeeeellll::::

((((nnnnooootttteeee:::: 0000 oooobbbbssss.... ttttrrrruuuunnnnccccaaaatttteeeedddd)))).... lllliiiinnnnkkkktttteeeesssstttt

33

....

////ssssiiiiggggmmmmaaaa 5555888877773333....777755552222 222200007777....3333555533336666 22228888....33333333 0000....000000000000 5555444466667777....333344446666 6666222288880000....111155558888 ____ccccoooonnnnssss 11111111444477778888....55553333 777799998888....8888333388887777 11114444....33337777 0000....000000000000 9999999911112222....888833331111 11113333000044444444....22222222 rrrreeeeggggiiiioooonnnn ----6666666644447777....111177779999 1111111100007777....000000001111 ----6666....00000000 0000....000000000000 ----8888888811116666....888866662222 ----4444444477777777....444499997777 sssseeeexxxxoooo 333377774444....9999777755555555 333366668888....3333999944448888 1111....00002222 0000....333300009999 ----333344447777....000066665555 1111000099997777....000011116666 eeeeddddaaaadddd ----4444....666633334444444466661111 11110000....88883333888866667777 ----0000....44443333 0000....666666669999 ----22225555....88887777777788886666 11116666....66660000888899994444 nnnniiiivvvveeeedddduuuucccc 666633334444....666699999999 111100009999....8888666666667777 5555....77778888 0000....000000000000 444411119999....3333666644443333 888855550000....0000333333337777 iiiinnnngggghhhhoooogggg CCCCooooeeeeffff.... SSSSttttdddd.... EEEErrrrrrrr.... zzzz PPPP>>>>||||zzzz|||| [[[[99995555%%%% CCCCoooonnnnffff.... IIIInnnntttteeeerrrrvvvvaaaallll]]]]

LLLLoooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----11118888444433335555....444466667777 PPPPrrrroooobbbb >>>> cccchhhhiiii2222 ==== 0000....0000000000000000 uuuuppppppppeeeerrrr ==== 22220000000000000000 WWWWaaaalllldddd cccchhhhiiii2222((((4444)))) ==== 99990000....66662222LLLLiiiimmmmiiiitttt:::: lllloooowwwweeeerrrr ==== 0000 NNNNuuuummmmbbbbeeeerrrr ooooffff oooobbbbssss ==== 1111888899997777TTTTrrrruuuunnnnccccaaaatttteeeedddd rrrreeeeggggrrrreeeessssssssiiiioooonnnn

IIIItttteeeerrrraaaattttiiiioooonnnn 4444:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----11118888444433335555....444466667777 IIIItttteeeerrrraaaattttiiiioooonnnn 3333:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----11118888444433335555....444466667777 IIIItttteeeerrrraaaattttiiiioooonnnn 2222:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----11118888444433335555....444499996666 IIIItttteeeerrrraaaattttiiiioooonnnn 1111:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----11118888444433336666....000099994444 IIIItttteeeerrrraaaattttiiiioooonnnn 0000:::: lllloooogggg lllliiiikkkkeeeelllliiiihhhhoooooooodddd ==== ----11118888555500003333....222200004444

FFFFiiiittttttttiiiinnnngggg ffffuuuullllllll mmmmooooddddeeeellll::::

((((nnnnooootttteeee:::: 1111999977778888 oooobbbbssss.... ttttrrrruuuunnnnccccaaaatttteeeedddd)))).... ttttrrrruuuunnnnccccrrrreeeegggg iiiinnnngggghhhhoooogggg nnnniiiivvvveeeedddduuuucccc eeeeddddaaaadddd sssseeeexxxxoooo rrrreeeeggggiiiioooonnnn,,,, llllllll((((0000)))) uuuullll((((22220000000000000000))))