Rol de La Aleatoriedad

download Rol de La Aleatoriedad

of 34

Transcript of Rol de La Aleatoriedad

  • 8/17/2019 Rol de La Aleatoriedad

    1/34

    Evaluación de Impacto de Programas de Apoyo

    al Mejoramiento de la Seguridad PúblicaAspectos Metodológicos

    José Miguel Benavente.1

    1. Introducción

    El objetivo de este documento es entregar las bases metodológicas para eva-luar el impacto de programas de apoyo al mejoramiento de la seguridad pública.

    El marco de referencia para realizar esta labor descansa en lo que se conoce comoen la literatura especializada como "mecanismos de evaluación de impacto basa-do en experimentos". Con este fin, se discuten las principales técnicas existentespara la evaluación de programas. En concreto, la preocupación estará centrada enpoder determinar los efectos que tengan la implementación de determinados pro-gramas. A modo de ejemplo, considere un programa de capacitación laboral tipoChile Joven destinado a incrementar los niveles de habilidad de los individuos conel objeto de aumentar su capacidad generadora de ingresos. La implementaciónde dicho programa tiene un costo asociado, pero también se esperan beneficios,tanto directos como indirectos. La tarea consiste en poder cuantificar dichos be-neficios para poder pronunciarse respecto de la efectividad que tuvo la ejecución

    de dicho programa. A diferencia de otras ciencias, la ciencia económica no cuentacon experimentos controlados que permitan contrastar resultados provenientesde dos grupos de individuos, con tratamiento y sin tratamiento. De esta manera,cualquier evaluación que se quiera llevar adelante debe reconocer esta falencia, ypor lo tanto, deben desarrollarse técnicas complementarias que permitan acercaselo más posible a un resultado confiable. Este capítulo se organiza de la siguien-te manera. Luego de esta breve introducción la sección 2 presenta el rol de laaleatoriedad en la evaluación de programas. La sección 3 discute el enfoque cuasiexperimental. La sección 4 desarrolla los estimadores  matching . Finalmente, lasección 5 muestra algunas aplicaciones.

    1Centro de Análisis y Modelamiento de la Seguridad Pública CEAMOS y Departamento deEconomía de la Universidad de Chile. Este documento está basado en varios artículos desa-rrollados por el autor en conjunto con Rodrigo Montero y David Bravo, los que se citan en lasección de referencias.

  • 8/17/2019 Rol de La Aleatoriedad

    2/34

  • 8/17/2019 Rol de La Aleatoriedad

    3/34

    Además:

    E (Y i(1)) = E (Y i(1)/Z i  = 1)P (Z i = 1) + E (Y i(1)/Z i = 0)P (Z i = 0)   (5)

    E (Y i(0)) = E (Y i(0)/Z i  = 1)P (Z i = 1) + E (Y i(0)/Z i = 0)P (Z i = 0)   (6)

    El problema radica en que el segundo término del lado derecho de la ecuación(4) y el primer término del lado derecho de la ecuación (5) no son conocidos. Enefecto, a los individuos que no tomaron el programa no se les conoce el valor dela variable resultado bajo una situación de participación en el programa.

    Sólo si el programa fuese asignado aleatoriamente (al azar) sería posible cal-cular el impacto promedio (esperado) del programa. Si  Z i  es asignado aleatoria-mente:

    Z i⊥(Y i(0), Y i(1))   (7)Por lo tanto, se cumple que:

    E (Y i(1)/Z i = 1) = E (Y i(1)/Z i  = 0) = E (Y i(1))   (8)

    E (Y i(0)/Z i = 1) = E (Y i(0)/Z i  = 0) = E (Y i(0))   (9)

    De esta manera:

    E (αi) = E (Y i(1)/Z i  = 1) − E (Y i(0)/Z i = 0)   (10)El impacto puede ser estimado como:

    α̂ =  Ȳ Z i=1 −  Ȳ Z i=0   (11)el cual es un estimador insesgado del impacto del programa. Para que este enfoqueresulte y proporcione resultados sensatos es condición necesaria que la asignacióndel tratamiento sea aleatoria. Sin embargo, en la realidad esto no es posible,puesto que por lo general existen criterios de elegibilidad y los programas apuntana grupos de individuos muy específicos. Meyer (1994) discute otras estrategiaspara llevar a cabo la estimación de dichos impactos a través de los denominadosexperimentos naturales o cuasi experimentos.

    Una de las principales dificultades con que se debe lidiar en economía es laimposibilidad de realizar experimentos controlados, al menos a un costo razonable.Esto no ha sido impedimento para la evaluación de distintos experimentos que sesuscitan periódicamente en una economía cualquiera. A estos experimentos se lesdenomina  experimentos naturales . Un experimento natural surge, por ejemplo,a partir de un cambio en las disposiciones legales relativas a un determinadoaspecto de la economía. La confiabilidad de un buen experimento natural guardadirecta relación con la exogeneidad del cambio que ha ocurrido. Es por esto quebuenos ejemplos emanan directamente de los que se relacionan con disposicionesgubernamentales. A continuación se presentan algunos ejemplos:

  • 8/17/2019 Rol de La Aleatoriedad

    4/34

    Evaluar los efectos de programas de seguro social sobre la oferta de trabajo.

    Evaluar el impacto que tiene la introducción de un seguro de desempleo.

    Los efectos que tiene un incremento en el salario mínimo sobre el nivel deempleo de la economía.

    A continuación se describen aquellos aspectos que ponen en peligro la validezde las conclusiones extraídas de dichos experimentos naturales.

    2.0.1. Amenazas a la validez interna

    La validez interna  se refiere a si uno puede o no obtener inferencias confiables

    a partir de los resultados del estudio. Listamos los posibles problemas:1.  Variables omitidas: los efectos tener otro origen.

    2.   Tendencias en resultados: por ejemplo, la inflación.

    3.  Varianzas enormes.

    4.   Errores de medida.

    5.  Política económica: se refiere básicamente a la endogeneidad de los cambiosen la política económica.

    6.  Simultaneidad: esto es la endogeneidad de las variables explicativas.

    7.  Selección: no existe aleatoriedad en la asignación del experimento.

    8.   Problemas de respuesta.

    9.  Interacciones omitidas.

    2.0.2. Amenazas a la validez externa

    La   validez externa  consiste en determinar si los efectos encontrados puedenser generalizables diferentes individuos. Esto podría ocurrir por:

    1.  Interacción de selección y tratamiento: se refiere a la representatividad delgrupo de tratamiento.

    2.  Interacción del contexto y el tratamiento: el efecto del tratamiento podríadiferir entre distintos escenarios geográficos e institucionales.

    3.  Interacción de la historia y el tratamiento: el efecto del tratamiento podríadiferir entre distintos períodos de tiempo.

  • 8/17/2019 Rol de La Aleatoriedad

    5/34

    3. Enfoque Cuasi Experimental

    Los objetivos que se persiguen son tres:

    Encontrar variación en las variables explicativas relevantes, las que se asu-men exógenas.

    Encontrar grupos de comparación que sean comparables. El grupo de tra-tamiento es aquel que recibe la política. El grupo de control por otro lado,es aquel grupo al que no se le aplica dicho tratamiento.

    Someter a prueba los resultados.

    A continuación se describen los distintos análisis que se pueden llevar a cabo parala evaluación de los efectos de diversas políticas.

    3.1. El Estimador en Diferencia

    A este enfoque se le conoce como  diferencias  y lo más probable es que no nospermita obtener inferencias válidas. Este método es el que usualmente utilizanlas personas para referirse a la efectividad de cierto programa. Se calcula de lasiguiente manera:

    α =  Y E it − Y E it−1   (12)

    donde  α  podría ser la tasa de desempleo, y el tratamiento podría consistir en unaumento en el nivel del salario mínimo. Por ejemplo, si antes del aumento en elsalario mínimo la tasa de desempleo era de  18 % y luego del aumento el desempleosubió a un 18 %, entonces, el efecto de dicha política fue de:

    α = 18 % − 12 % = 6 %

    Este impacto puede obtenerse estimando la siguiente especificación:

    Y it =  β 0 + β 1DT it + µit   (13)

    donde Y it  es el resultado de interés para la unidad  i  en el período t  con  (t = 0, 1)

    e   i   = 1,....,N .   DT it   es una variable muda (dummy) que toma el valor si laobservación pertenece al período posterior a la implementación del programa y 0si no. De esta forma,  β 1  es el verdadero efecto del tratamiento sobre la variableresultado, en este caso, la tasa de desempleo. En efecto, para las observacionesque corresponden a un momento posterior al programa se tiene:

    Ȳ t =  β̂ 0 + β̂ 1 · 1

  • 8/17/2019 Rol de La Aleatoriedad

    6/34

    y para las observaciones que corresponden a un momento anterior a la ocurrencia

    del programa se tiene: Ȳ t =  β̂ 0

    Por lo tanto, el impacto del programa es:

    α =  Ȳ t −  Ȳ t−1 =  β̂ 1Bajo los supuestos típicos  β̂ 1   será un estimador consistente. Otra ventaja

    de obtener el impacto mediante la estimación de la especificación (12) es quepermite controlar por todos los otros factores que eventualmente podrían estarinfluenciando a la variable de resultado.

    Sin embargo, el mayor problema del enfoque anterior es que no considera la

    existencia de un grupo de control.1 En otras palabras, este enfoque no se hacecargo de la pregunta ¿qué hubiese ocurrido en ausencia del programa? El siguienteenfoque incorpora la existencia de un grupo de control.

    3.2. El Estimador de Diferencia en Diferencia

    El estimador de  diferencia en diferencia  estima la misma diferencia anteriorpero no sólo para el grupo que participa del programa sino también para otrogrupo que sea comparable. Esto es posible de llevar a cabo en la medida queexista un grupo que no reciba el tratamiento pero que experimente alguna o

    todas las consecuencias que afectan al grupo experimental. El estimador es elsiguiente:α = (Ȳ t −  Ȳ t−1)E − (Ȳ t −  Ȳ t−1)C  (14)

    Este estimador puede obtenerse a través de la estimación2 de la siguienteepecificación:

    Y it =  β 0 + β 1DT it + β 2DGit + β 3DT itDGit + µit   (15)

    donde:

    DT it

    1   después del programa,

    0   antes del programa.

    DGit

    1   grupo de tratamiento,

    0   grupo de control.

    1Situación que sí ocurre en cualquier experimento que se lleve a cabo al interior de unlaboratorio.

    2Mediante mínimos cuadrados ordinarios.

  • 8/17/2019 Rol de La Aleatoriedad

    7/34

    De esta forma,  β 3  es el efecto causal del tratamiento:

    α = [β̂ 0 +  β̂ 1 + β̂ 2 + β̂ 3   Ȳ  Et

    − β̂ 0 −  β̂ 2    Ȳ  Et−1

    ] − [β̂ 0 +  β̂ 1   Ŷ  C t

    −   β̂ 0  Ȳ  C t−1

    ] =  β̂ 3

    Nuevamente, si el impacto se estima por medio de la especificación anterior,será posible obtener un resultado más exacto puesto que el investigador serácapaz de controlar por una serie de factores (vector  X )3 que podrían influenciar lavariable de interés. Además, la obtención del impacto a través de esta técnica nospermite calcular un intervalo de confianza el cual permite analizar la significanciadel parámetro estimado.

    3.3. El Estimador de Diferencia en Diferencia en Diferencia

    El   estimador de diferencia en diferencia en diferencia  permite controlar porun factor adicional. En efecto, es posible que exista una tendencia a nivel globaldentro de la economía, que afecte tanto al grupo de tratamiento como al grupo econtrol, y que el investigador errónemanete le esté atribuyendo un efecto al pro-grama que no es tal. Para el caso de los Estados Unidos se tienen leyes particularesdentro de cada estado. De esta forma, se tiene variaciones entre estados. Por lotanto, diversos papers para analizar cuál ha sido el impacto de una determinadaley, comparan estados en que se ha pasado la ley, con otros en los cuales no se hapasado la ley en cuestión. El estimador se define como:

    α = [(Ȳ t −  Ȳ t−1)E − (Ȳ t −  Ȳ t−1)C ]E 1 − [(Ȳ t −  Ȳ t−1)E − (Ȳ t −  Ȳ t−1)C ]E 2 (16)

    donde   E  j   con   j   = 1, 2   denota el estado o la región. Al igual que en los casosanteriores, el estimador puede obtenerse a partir de la siguiente especificación:

    Y it =  β 0 + β 1DT it + β 2DGit + β 3DE it + β 4DTitDGit + β 5DT itDE it

    +β 6DE itDGit + β 7DE itDGitDT it + Xγ  + µit   (17)

    donde:

    DE it1   estado en que se pasó la ley,0   si no.De esta manera, β 7 corresponde al efecto causal del programa sobre la variable

    de resultado de interés.

    3Por ejemplo, considere que se está evaluando los efectos que tiene un programa de alimenta-ción sobre el peso de los recién nacidos. Otras variables que eventualmente podrían influenciar enel peso al nacer serían: entorno familiar, enfermedad de la madre durante la gestación, situacióneconómica del hogar en general, zona en dónde vive la madre (rural o urbana) etc.

  • 8/17/2019 Rol de La Aleatoriedad

    8/34

    4. Estimadores de Matching

    El principal problema que debe ser enfrentado al momento de llevar a cabo unaevaluación de un programa determinado es la falta de una asignación aleatoria alprograma en cuestión. En realidad existen criterios muy precisos de elegibilidadpara un determinado programa, y por ende, no es posible asumir que los indi-viduos fueron escogidos al azar. De esta forma, las técnicas desarrolladas en lasección anterior carecen de fundamento para señalar que el parámetro encontradocorresponde a un impacto causal del programa.

    4.1. Causalidad y el Rol de la Aleatorización

    El problema básico de estimar efectos causales es que sólo es posible observaral individuo con tratamiento o sin tratamiento, pero no en ambos estados. Laimportancia de la aleatorización es que esta permite estimar el efecto promediodel tratamiento.

    Sea Y i1  el valor de la variable de interés cuando el individuo  i  recibe el trata-miento, y Y i0 el valor de la variable cuando el individuo i no recibe el tratamiento.Además, se define la siguiente variable:

    T i

    1   si individuo participa en el programa,

    0   si no.

    De esta manera, el efecto del tratamiento para una unidad  i  se define como:

    ∆i  =  Y i1 − Y i0   (18)Por otro lado, el efecto promedio del tratamiento se define como:

    ∆ ≡ E (∆i)Es decir:

    ∆ = E (Y i1) − E (Y i0)

    Desarrollando la expresión:

    ∆ = E (Y i1|T i = 1) p(T i = 1) + E (Y i1|T i  = 0) p(T i  = 0)−E (Y i0|T i = 0) p(T i = 0) + E (Y i0|T i  = 1) p(T i  = 1)   (19)

    Sin embargo, sólo es posible estimar   E (Y i1|T i   = 1)   y   E (Y i0|T i   = 0), por lotanto:

    ∆e = E (Y i1|T i = 1) − E (Y i0|T i = 0)   (20)

  • 8/17/2019 Rol de La Aleatoriedad

    9/34

    De esta manera, lo más probable es que el efecto estimado esté sesgado. Con

    respecto a la aleatorización, esta asegura que:

    Y i1, Y i0⊥T i   (21)Por lo tanto, se cumple que:

    E (Y i1|T i  = 1) = E (Y i1|T i = 0)E (Y i0|T i  = 1) = E (Y i0|T i = 0)

    Con esto el impacto del programa puede estimarse mediante la expresión (20)

    4.2. El Propensity ScoreUna extensión natural de lo anterior es estimar el efecto del programa en un

    contexto no experimental, es decir, no aleatorizado. Para esto se sigue a Rubin(1974, 1977). La idea consiste básicamente en realizar  matches 4 entre individuosque sean comparables, y por lo tanto reducir el sesgo.

    En este contexto no experimental el efecto del tratamiento se define de lasiguiente manera:

    ∆|T =1 =  E (Y i1|T i = 1) − E (Y i0|T i = 1)   (22)El problema radica en poder identificar el segundo término dado que este

    nunca se observa. La clave para la identificación es la condición de asignación ig-norable condicional sobre los regresores . Esto queda establecido en la Proposición1:

    Proposición 1 (Rubin 1977): si para cada unidad se observa un vector de regresores  X i  y:

    Y i1, Y i0⊥T i|X i,   ∀ientonces:

    ∆|T =1 ≡ E (Y i1|T i = 1) − E (Y i0|T i = 1)∆|

    T =1 =  E X [E (Y i|X i, T i = 1)

    −E (Y i

    |X i, T i  = 0)

    |T i = 1]

    donde  Y i =  T iY i1 + (1 − T i)Y i0.

    Intuitivamente esta condición asume que condicional al vector  X , la asigna-ción del tratamiento  (T i)  puede ser considerada como aleatoria.

    En este enfoque el mecanismo de asignación debe estar explícitamente defini-do en función de ciertos condicionantes (X ).

    4Apareamientos.

  • 8/17/2019 Rol de La Aleatoriedad

    10/34

    La limitación de la Proposición 1 es que sólo se puede implementar si no hay

    un número elevado de variables condicionantes  X  (recuerde que el efecto del tra-tamiento se calcula como una esperanza sobre las variables  X ).Dada esta situación, Rosenbaum y Rubin (1983, 1985) sugieren utilizar el

    Propensity Score 5 para reducir el problema de dimensionalidad asociado a la es-trategia anterior. La Proposición formaliza el punto anterior:

    Proposición 2 (Rosenbaum y Rubin 1983):   sea   p(X i)   la probabilidad de que la unidad   i   reciba el tratamiento, que se define como   p(X i) ≡   P r(T i   =1|X i) =  E (T i|X i), donde  0 < p(X i) <  1, ∀i. Entonces:

    (Y i1, Y i0)⊥T i|X iimplica que:

    (Y i1, Y i0)⊥T i| p(X i)

    Corolario: ∆|T =1 =  E  p(X ){E (Y i|T i  = 1, p(X i))−E (Y i|T i  = 0, p(X i))|T i  = 1}.

    La ventaja del Propensity Score es que reduce la dimensionalidad del pro-blema para calcular el efecto promedio del tratamiento. Para estimar el efecto deltratamiento se requiere estimar las siguientes dos funciones:

    E (Y i1| p(X i)) = E (Y i1

    |T i  = 1, p(X i))   (23)

    E (Y i0| p(X i)) = E (Y i0|T i  = 1, p(X i))   (24)Note que no se requiere estimar la ecuación (23) pues es conocida.

    4.3. Efecto Promedio del Tratamiento (ATE)

    4.3.1. Estimación del Propensity Score

    Se estima un modelo  Logit   o Probit  utilizando como variable dependiente  T i.En otras palabras, se estima un modelo que contenga los determinantes de la par-ticipación al programa en cuestión, es decir, se está incorporando directamente elmecanismo de selección al programa.

    A continuación se discute muy brevemente la estimación de modelos de va-riable dependiente dicotómica. Se define lo siguiente:

    T i

    1   si individuo participa en el programa,

    0   si no.

    5Esto es, la probabilidad condicional de recibir un tratamiento dado un set de regresores.

  • 8/17/2019 Rol de La Aleatoriedad

    11/34

    Lo que se quiere es la estimación de los determinantes de la participación en

    el programa. Considere la siguiente especificación:T i =  X iβ  + i

    donde  X i  es un conjunto de variables se pìensa influyen en la participación delprograma y   β   es un vector de parámetros a estimar. El hecho que   T i   sea unavariable dicotómica provoca serios problemas de estimación. En efecto, si se aplicamínimos cuadrados ordinarios a la especificación anterior se obtiene el  modelo de probabilidad lineal (MPL). Es directo notar que este enfoque es más apropiadocuando la variable dependiente es continua. El MPL presenta dos problemas:

    1.  No garantiza predicciones dentro del rango para la variable dependiente, es

    decir, valores entre cero y uno.2.   Es heteroscedástico por definición.

    El punto 1 es directo de notar, para el ver el punto 2 considere lo siguiente.Los errores pueden tomar sólo dos posibles valores:

    i

    1 − X iβ    si individuo participa en el programa,−X iβ    si no.

    Por otro lado, se sabe que  P (T i  = 1) = X iβ , por ende,  P (Y i  = 0) = 1 − X iβ .De esta forma, la varianza del error será:

    var(i|X i) = P (T i  = 1)(1 − X iβ )2 + (1 − P (T i  = 1))(X iβ )2Reemplazando términos:

    var(i|X i) = (X iβ )(1 − X iβ )2 + (1 − X iβ )(−X iβ )2Agrupando términos se llega a la siguiente expresión para la varianza:

    var(i|X i) = X iβ (1 − X iβ )Por lo tanto, la varianza es heteroscedástica, pues esta depende del vector de

    características i  (X i).

    De esta manera, se requiere de una función que tenga como propiedad trans-formar los datos (X iβ ) en una probabilidad, es decir:

    P (T i  = 1) = F (X iβ )

    El candidato más idóneo es una función de distribución de probabilidad. Si  F es la distribución normal estándar, entonces:

    P (T i = 1) = Φ(X iβ ) =

       X iβ −∞

    1√ 2π

    exp−z22 dz 

  • 8/17/2019 Rol de La Aleatoriedad

    12/34

    Se cumple que:

    ĺımz→+∞Φ(z ) = 1

    ĺımz→−∞

    Φ(z ) = 0

    A este modelo se le conoce como  modelo probit .Por otro lado, si   F   es la distribución logística se tiene el   modelo logit . En

    efecto:

    P (T i = 1) = λ(X iβ ) =  exp(X iβ )

    1 + exp(X iβ )

    Considere la existencia de la siguiente variable latente que determina la par-ticipación en el programa:

    i   = X iβ  + εiNo es posible observar  T ∗i  pero sí se conoce la decisión de participación en el

    programa, esto es,  T i  de acuerdo a la siguiente regla:

    T i

    1   si  T ∗i   > 0,

    0   si no.

    Asuma que  εi ∼ N (0, σ2). Por lo tanto:P (T i = 1) =  P (T 

    ∗i   > 0) = P (X iβ  + ε > 0)

    Es decir:P (T i = 1) =  P (εi  > −X iβ ) = P 

    εiσ

      > −X i β σ

    Se sabe que  εi/σ  tiene una distribución normal estándar. Dado que la distri-

    bución es simétrica se tiene que:

    P (T i = 1) =  P 

    εiσ

      > −X i β σ

     =  P 

    εiσ

      < X iβ 

    σ

    con lo cual se llega a:

    P (T i = 1) = ΦX iβ 

    σPor lo tanto:

    P (T i  = 0) = 1 − P (T i  = 1) = 1 − Φ

    X iβ 

    σ

    La función de verosimilitud viene dada por:

    L = Πmi=1

    1 − Φ

    X i

    β 

    σ

    Πni=m+1Φ

    X i

    β 

    σ

  • 8/17/2019 Rol de La Aleatoriedad

    13/34

    La expresión anterior es equivalente a:

    L = Πni=1Φ

    X i

    β 

    σ

    T i 1 − Φ

    X i

    β 

    σ

    1−T iAplicando logaritmo:

    log(L) =   =

    i

    T iln

    Φ

    X i

    β 

    σ

    + (1 − T i)ln

    1 − Φ

    X i

    β 

    σ

    Esta función al no ser lineal no tiene una forma cerrada, por lo cual debe serresuelta mediante métodos numéricos. Sin embargo, dado que tanto la función deverosimilitud del modelo probit como del modelo logit son  globalmente cóncavas ,existe una solución y es única.6

    Es necesario hacer una aclaración adicional respecto a los efectos marginales decada una de las variables explicativas sobre la variable dependiente. A diferenciadel M P L, calcular el cambio en la probabilidad ante una variación de una variableindependiente (X k) no es tan simple. En efecto:

    ∂E (T )

    ∂X k= φ(XB)β k

    donde:

    φ(z ) =  1

    √ 2πexp−

    1

    2z 2

    es la función de densidad de la distribución normal estándar. Note que   en el modelo probit el efecto marginal de una variable ( X k) varía con el nivel de  X k   y las otras variables del modelo. Es decir, el efecto no es constante.. Por lo tanto, noresulta de mucha utilidad reportar los coeficientes estimados de un modelo probit,pues la magnitud del coeficiente dependerá del vector  X i. Aún así es de interésconocer el signo y la significancia del coeficiente. Habitualmente lo que se hace esreportar los coeficientes estimados evaluados en las características promedio dela muestra ( X̄ ).

    Con respecto al modelo logit se tiene lo siguiente:

    P (T i = 1) = λ(X iβ ) =  exp(X iβ )

    1 + exp(X iβ )

    La principal diferencia que existe entre la distribución normal y la distribuciónlogística es que esta última presenta colas más pesadas, es decir, kurtosis . Al igual

    6La implementación de métodos numéricos requiere que se establezca un punto de parti-da para la búsqueda, es decir, se requiere de una  semilla . El modelo de probabilidad linealconstituye un excelente punto de partida.

  • 8/17/2019 Rol de La Aleatoriedad

    14/34

    que en el caso anterior el efecto marginal no es constante:

    ∂E (T )

    ∂X k=

      exp(Xβ )

    (1 + exp(Xβ ))2β k

    Lo anterior puede escribirse como:

    ∂E (T )

    ∂X k= p(1 − p)

    donde:

     p =  exp(Xβ )

    1 + exp(Xβ )

    Para un análisis más detallado se sugiere ver W. Greene (1993).7

    Ahora que ya ha sido discutida la estimación de la probabilidad de participaren el programa se sigue con el análisis de la evaluación del impacto del programa.La Proposición 3 muestra una consecuencia directa del cálculo del propensityscore:

    Proposición 3 (Rosenbaum y Rubin 1983):

    X ⊥T | p(X )

    En palabras, la Proposición 3 establece que los individuos tendrán una distri-

    bución de características similares8 si es que tienen aproximadamente el mismopropensity score.9

    4.3.2. Estimando el Efecto del Tratamiento

    La manera más sencilla de estimar el impacto del tratamiento es incluir elpropensity score como una variable independiente:

    Y i  =  β 0 + δ  P̂ i + X iβ 1 + i   (25)

    Sin embargo, esta estrategia no explota los beneficios de la reducción de la

    dimensionalidad para resolver los aspectos referentes a las formas funcionales,interacciones y términos de mayor orden.

    Una manera alternativa de estimar el efecto del tratamiento es mediante laestratificación utilizando el propensity score. En primer lugar se deben definir

    7Econometrics Analysis , Capítulo 19.8Por ejemplo, edad, género, escolaridad, etc.9Lo anterior puede verificarse, una vez calculado el propensity score, mediante test de dife-

    rencia de medias.

  • 8/17/2019 Rol de La Aleatoriedad

    15/34

    bloques (para el grupo de tratamiento y el grupo de control). Luego, se estima el

    impacto promedio del tratamiento dentro de cada uno de estos bloques.Este procedimiento se puede resumir de la siguiente manera:

    E (Y i1| p(X i), T i = 1) ≈Q

    q=1

    hq1( p(X i))

    E (Y i0| p(X i), T i = 0) ≈Q

    q=1

    hq0( p(X i))

    donde   q   indica el bloque y   hq1( p(X i))   y   hq0( p(X i))   son las formas funcionales

    utilizadas para modelar las esperanzas condicionales dentro de cada bloque, tantopara los individuos tratados como para los no tratados.

    4.4. Matching sobre el Score

    Una estrategia alternativa consiste en hacer  matching  de individuos. La ideadel matching es emparejar a cada individuo tratado, es decir, que participa en elprograma, con un individuo del grupo de control que tenga el propensity score máscercano.10 Cabe mencionar que cada individuo de control puede ser pareja de másde un individuo experimental. El efecto del tratamiento se puede estimar tomandosimples diferencias. En la práctica lo que se hace, dado que es practicamente

    imposible encontrar a dos individuos con el mismo propensity score, es definiruna banda de tolerancia. Es decir, si se cumple que:

    |P E i   − P C  j | < ζ 

    entonces, el individuo de control   j   es el match del individuo   i   participante delprograma.

    4.5. Utilizando el Propensity Score como Ponderador

    Hasta el momento los propensity score sólo se han utilizado como un me-

    canismo de agrupamiento de las observaciones, es decir, el propensity score noha entrado directamente en la estimación del efecto del tratamiento. En efecto,sería posible utilizar el propensity score como un ponderador para la estimacióndel efecto promedio del tratamiento. Además, se puede demostrar que utilizan-do el propensity score como ponderador se obtiene un estimador consistente delimpacto del tratamiento.11

    10A este individuo se le conoce con el nombre del  vecino más cercano.11Para más detalles ver Dehejia y Wahba (1995).

  • 8/17/2019 Rol de La Aleatoriedad

    16/34

    4.6. Implementación del Método de Matching

    En esta sección se desarrollan los denominados estimadores matching paraevaluar los efectos de un determinado programa, comparando los resultados delas personas que han participado en el programa con aquellos individuos similarespero que no han tenido participación. El programa podría consistir en la parti-cipación de un determinado programa de capacitación. La principal ventaja deeste método radica en la forma en que se encuentra a las personas comparablesdel grupo de individuos de control. La idea básica consiste en comparar los re-sultados de aquellos individuos más comparables. En otras palabras, encontrar elclon de aquella persona que participó en el programa y comparar sus resultados.Luego, mediante una ponderación apropiada se obtiene el impacto promedio del

    programa.Se comienza con algo de notación:

    Sea Y 1  el salario de un individuo que participó en el programa de capacita-ción.

    Sea Y 0  el salario de un individuo que no participó en el programa de capa-citación.

    Sea T   = 1 si la persona participó en el programa de capacitación.

    Sea   X  un vector de características que se utilizarán como condicionantes

    que el individuo participe o no en el programa. Dentro de las característicaspodría estar la edad, género, años de escolaridad, si es jefe de hogar, etc.

    Sea  P (X ) =  P (T   = 1|X )  la probabilidad que el individuo en el programacondicional a su vector de características  X .

    Existe una gran variedad de estimadores matching, los cuales difieren bá-sicamente en los métodos utilizados para obtener los denominados  clones 12 deaquellas personas que sí recibieron el tratamiento. Existen dos tipos de estima-dores:

    1.  Estimadores matching de corte transversal (CS): compara el resultado delos grupos de control y de tratamiento medido en algún período de tiempoposterior a la implementación del programa.

    2.  Estimador matching de diferencias en diferencias (DID): compara el cambioen el resultado de los individuos pertenecientes al grupo de tratamiento con

    12Este término denota a un individuo que no ha participado en el programa, pero que presentacaracterísticas muy similares a algún individuo que sí participó. De esta manera, cada individuoque participa en el programa tiene al menos un clon.

  • 8/17/2019 Rol de La Aleatoriedad

    17/34

    el cambio en el resultado de los individuos del grupo de control, donde el

    cambio se mide en algún momento de tiempo posterior a la aplicación delprograma.

    A continuación se discuten tres tipos de estimadores:

    El CS del vecino más cercano.

    El DID del vecino más cercano.

    Las versiones Kernel de los estimadores enunciados arriba.

    El parámetro clave en la evaluación de programas es el impacto promedio del

    tratamiento sobre los tratados, el que además puede ser definido condicional a unvector de características:

    ∆T =1(X ) = E (Y 1 − Y 0|X, D = 1)   (26)

    4.6.1. El Estimador Matching de Corte Transversal

    Para la implementación de este estimador se debe asumir que:

    E (Y 0|P (X ), T  = 1) = E (Y 0|P (X ), T   = 0) (CS1)0 < P (T   = 1

    |X ) <  1  (CS2)

    Bajo estas condiciones es posible estimar el impacto promedio del programade la siguiente manera:

    ∆̂T =1 =  1

    N i=1T i=1

    [Y 1i(X i) −  Ê (Y 0i|P (X i), T i = 0)]   (27)

    donde  N  corresponde al número de individuos que participaron en el programa.El término:

    Ê (Y 0i|P (X i), T i = 0)debe ser estimado mediante técnicas no paramétricas, como por ejemplo, vecinomás cercano, kernel o regresiones lineales locales.

    4.6.2. El Estimador Matching de Diferencia en Diferencia (DID)

    Este estimador requiere un panel de datos con la información de los partici-pantes y no participantes al programa. Sea  t  y  t dos momentos del tiempo, antesy después del programa. Este estimador requiere las siguientes condiciones:

  • 8/17/2019 Rol de La Aleatoriedad

    18/34

    E (Y 0t − Y 0t|P (X ), D = 1) = E (Y 0t − Y 0t|P (X ), D = 0)  (DID1)0 < P (D = 1)|X ) <  1  (DID2)

    Bajo estas condiciones el estimador queda de la siguiente:

    ∆̂DI DT =1   =  1

    N t

    N ti=1T i=1

    [Y 0it(X i) −  Ê (Y 0it|P (X i), Di  = 0)] −

    1

    N t

    N tj=1T j=1

    [Y 0it(X  j) −  Ê (Y 0it|P (X  j), D j  = 0)]   (28)

    donde N t y  N t  corresponden al número de observaciones para el período posteriory anterior al programa, respectivamente.

    A continuación se discute la implementación de estos estimadores. El primerpaso consiste en la estimación de un modelo para la participación en el programa.La probabilidad condicional de participar en el programa (propensity score) esfundamental en la implementación de los estimadores. Esta probabilidad puedeser estimada mediante un modelo probit o un modelo logit. Esto a su vez per-mite reducir la dimensión del problema. Es decir, el problema consiste ahora enla estimación del término  E (Y 0|D   = 0, P (X ))  en lugar de  E (Y 0|D   = 0, X ). Laestimación del propensity score requiere la elección de un conjunto de variablescondicionantes. Es importante que se seleccionen aquellas variables que no sean

    influenciadas por el programa, de lo contrario se incurrirá en  sesgo de selección .El segundo paso consiste en la construcción de los resultados emparejados. Estepaso requiere la estimación de   E (Y 0t|P (X i), T i   = 0)  para el caso del estimadormatching de corte transversal y   E (Y 0it|P (X i), T i   = 0)  y   E (Y 0it|P (X i), T i   = 0)para el estimador matching de diferencia en diferencia. Existen diversos estima-dores no paramétricos para estimar estas medias condicionales. Uno de ellos es elestimador Kernel. En efecto, un estimador Kernel de:

    Ê (Y 0i|P (X i), Di  = 0)   (29)viene dado por:

    Ê (Y 0i|P (X i), Di  = 0) =j=1T j=1

    W  j(P (X  j ))Y 0 j   (30)

    Los pesos se definen de la siguiente manera:

    W  j(P (X i)) =K 

    P (X i)−P (X j)

    hn

    n0

    k=1(T i=0)

    P (X i)−P (X k)

    hn

      (31)

  • 8/17/2019 Rol de La Aleatoriedad

    19/34

    En esta expresión   K ()   es una   función kernel   y   hn   es un   ancho de banda   o

    parámetro de suavización . Los estimadores vecino más cercano, kernel y lineallocal, pueden ser escritos como una suma ponderada de los resultados de losgrupos de comparación. Los estimadores difieren solamente en la elección de lafunción ponderadora  W  j(P (X i)).

    El   estimador del promedio del promedio simple del vecino más cercano  es elmás fácil y directo de implementar. Primero se debe determinar cuántos vecinosse van a utilizar. Luego se seleccionan los vecinos de acuerdo a su proximidad algrupo de tratamiento, a través del propensity score  P (X i). Esto se puede realizarde la siguiente forma:

    1.   Construya |P (X i)−P (X  j )| para el individuo i que participó en el programacon respecto a cada uno de los individuos de control  j .

    2.  Ordene de menor a mayor los individuos de control en términos de |P (X i)−P (X  j)|.

    3.   Se define a   Ax   como el conjunto de   x   observaciones con los valores másbajos de |P (X i) − P (X  j )|. A este grupo de observaciones se le denominavecinos más cercanos .

    4.  Construya el resultado del clon como el promedio simple de todos los vecinosmás cercanos:

    ˆE (Y 0i|P (X i), T i  = 0) =

      1

    x

    xj=1

    (T j∈Ax

    Y 0 j

    La debilidad del enfoque anterior es que asigna la misma ponderación a todoslos clones (1/x), sin importar cuán lejos o cerca se encuentre del individuo detratamiento. El   estimador matching de regresión kernel   escoge los pesos de talforma que las observaciones que se encuentran más cerca del individuo del grupode tratamiento, en términos de la distancia euclidiana, reciben una mayor ponde-ración. La función kernel que se utiliza habitualmente es la kernel biponderada,la cual viene dada por:

    K (s)15

    16(s2 − 1)2   para |s|

  • 8/17/2019 Rol de La Aleatoriedad

    20/34

    La implementación de la función kernel requiere la elección de un ancho de

    banda  hn  que es análogo al problema de la elección del número de vecinos en elestimador del vecino más cercano. Los pesos que se le asignan a las observaciones

    con T  j  = 0  dependen del valor de  K 

    P (X i)−P (X j)

    hn

    .   13

    Finalmente se tiene el  estimador de regresión lineal local (LLR). La regresiónlineal local es una técnica de regresión no paramétrica que mejora al estimadorde regresión kernel tradicional en dos aspectos:

    1.  El sesgo del estimador de regresión lineal local no depende de la distribuciónde los datos, es decir de la densidad  f (P (X )).

    2.  El orden de convergencia del sesgo del estimador de regresión lineal local es

    el mismo en los puntos de borde que en los puntos interiores.

    El estimador de regresión lineal local difiere del estimador kernel en términosde los pesos que utilizan. Los pesos utilizados por este estimador vienen dadospor la siguiente expresión:

    W  j(P (X i)) = K ij

    n0k=1 K ik(P k − P i)2 − [K ij(P  j − P i)][

    n0k=1 K ik(P k − P i)]n0

     j=1 K ijn0

    k=1 K ik(P k − P i)2 − [n0

     j=1 K ij(P  j − P i)]2(32)

    donde:

    K ik =  K P (X i) − P (X k)

    hn Finalmente se debe hacer una observación respecto al dominio de  P (X ). Este

    viene determinado por la zona de traslape entre los valores del propensity score delos individuos de control y de tratamiento. De esta forma, en la implementacióndel estimador matching se debe definir primero los valores P (X ) que se encuentranen dicha zona de traslape. El impacto medio del programa sólo puede obtenersecon aquellas personas tratadas que pertenecen a la zona de traslape. Una maneramuy sencilla de determinar las observaciones que efectivamente se encuentran enesta zona es graficar el histograma de los valores  P (X i)  de los grupos de controly experimental, descartando aquellos individuos que no tengan clones cercanos.

    La Figura 1 muestra gráficamente este aspecto:

    13Con respecto a la elección del ancho de banda es recomendable realizar análisis de sensibi-lidad para distintos valores de  hn.

  • 8/17/2019 Rol de La Aleatoriedad

    21/34

    Figura 1: Determinación de la Zona de Traslape

    zona de traslape

    P(X)

    grupo de controlgrupo detratamiento

    5. Regresión Discontinua

    Uno de los mayores inconvenientes de los procedimientos anteriores es la ne-cesidad de contar con grupos de tratamiento y de control que sean comparablesentre sí. Existen situaciones donde no es posible cumplir con este requerimientopara lo cual se han diseñado herramientas alternativas. Una de ellas es la deno-minada Regresión Discontinua.

    El objetivo de la Regresión Discontinua (DR) es establecer la diferencia en lavariable de impacto justo en aquel valor para la cual se dividen ambos grupos.

    En términos formales, el producto o resultado del proceso que se desea evaluarY i, puede ser modelado como:

    Y i  =  αi + β RDDi   D(S i) + µi

    donde  αi  y β i  son parámetros a estimar y  D  es el indicador del tratamiento quees igual a 1 si el trabajador o comisaría   i  participa en el programa y 0 de otromodo. En este caso, el indicador  D  depende de  S i, el puntaje de selección.

    La literatura distingue entre dos diseños, el llamado Sharp Design y el FuzzyDesign. Para ilustrar el proceso, discutiremos el primer caso donde todos aquellostrabajadores o comisarías que obtuvieron un puntaje por encima de una fronteradada son elegidos. Denominaremos a esta frontera S ∗. De esa forma, todos aquellosque caen por debajo de  S ∗ pertenecen al grupo de control   (Di   = 0)  y aquellosque caen por encima son el grupo de tratados  (Di = 1).

    Definamos:

    Y + ≡   ĺımS ↓S ∗

    E (Y i|S i =  S ∗)Y − ≡   ĺımS ↑S ∗

    E (Y i|S i  =  S ∗)

    Además supongamos que :

    E (αi|S  = S ∗ − ε) ∼= E (αi|S  =  S ∗ + ε)

  • 8/17/2019 Rol de La Aleatoriedad

    22/34

    donde ε  es un número arbitrariamente pequeño y que la ecuación anterior es con-

    tinua en S  = S ∗

    . Puede demostrarse que para un efecto de tratamiento constante,el efecto promedio del tratamiento se puede obtener por:

    β RDD =  Y + − Y −D+ − D−

    En el caso del Sharp Design, por definición se tiene que  D+ = 1  y  D− = 0, deesta forma  β  está identificado por:

    β RDD = Y + − Y −

    En el caso menos restrictivo, el efecto es heterogéneo a través de los individuos,

    con lo cual, el  β RDD identifica el efecto del tratamiento promedio local (LATE)para el subgrupo de individuos alrededor del puntaje  S ∗.

    Para identificar el efecto del tratamiento necesitamos estimadores consistentesde  Y + e  Y −. Para estimar los límites podemos utilizar estimadores basados enkernels uniformes de un solo lado, dadas por las expresiones:

    Ŷ + =

    iξ Y iwi

    iξ wi

    donde   ξ   representa la submuestra tal que   S ∗ − h < S i   < S ∗ + h   y con   wi   =1(S ∗ < S i   < S 

    ∗ +  h)   y   h >   0   representa el ancho de banda. Como Hanhnet. al. (2001) demuestran, este estimador es numéricamente equivalente a unaestimación de variables instrumentales (IV) de  Y i  en  Di  donde se utiliza  wi  comoinstrumento, aplicado a la submuestra  ξ . Proponen además que una RegresiónLineal Local (LLR) posee mejores propiedades en el límite que los estimadoreskernel estándar. Así, el estimador lineal local de  Y +, por ejemplo, estaría dadopor:

    (â, b̂) ≡ arg ḿına,b

    ni

    (Y i − a − b(S i − S ∗))2K ( S − S ∗

    h  )1(S i  > S 

    ∗)

    Lo anterior se traduce, en consecuencia, en realizar una estimación por Kernel dela variable de impacto - en este caso el número de citas, en los límites anterior yposterior a la línea de corte del programa en cada año.

    6. Aplicaciones

    En la siguiente sección se presentan algunas aplicaciones de los estimadoresanteriormente discutidos. Se analizan trabajos que presentan evidencia a nivel

  • 8/17/2019 Rol de La Aleatoriedad

    23/34

    internacional, y también se muestran resultados para Chile. En concreto se revi-

    san dos artículos en los cuales se aplican las técnicas anteriormente analizadas.En primer lugar, Jonathan Gruber (1994)  The incidence of mandated maternity benefits  realiza una aplicación de los estimadores de diferencias en diferencias endiferencias (DDD) realiza una evaluación del impacto que tuvo la implementaciónde ciertos beneficios a mujeres embarazadas. Los impactos se midieron en térmi-nos de salarios y de empleo. por otro lado, David Bravo y Dante Contreras (2000)The impact of financial incentives to training providers: The case of Chile Joven realizan una aplicación de los estimadores  matching  para evaluar el impacto deun programa de capacitación.

    6.1. The Incidence of Mandated Maternity BenefitsEn este artículo se evalúan los efectos que tienen sobre el mercado laboral la

    imposición mayores beneficios para las mujeres, los cuales encarecen su contrata-ción. La eficiencia de estas políticas depende en gran medida de la internalizaciónque hagan las personas de este beneficio. El resultado básico de este trabajo esque se encuentra un traspaso significativo de estos beneficios hacia salarios, porlo tanto, existe una importante valorización de estos beneficios por parte de lasmujeres. Dado lo anterior, se encuentra un escaso impacto sobre el nivel de empleodel grupo beneficiario. En un contexto de escases de recursos y de necesidadesmúltiples resulta indispensable la provisión eficiente de políticas que beneficiena la población. Existen dos alternativas para financiar estas políticas. La prime-ra consiste en un aumento de impuestos. La segunda manera de financiar estosbeneficios es que el empleador los provea. De esta forma, si el trabajador valorael beneficio proporcionado que recibe, entonces, aceptará una disminución de susalario para contrarrestar el costo que asume el empleador. En consecuencia, siexiste una completa valoración del beneficio, no existirán costos en términos deeficiencia. No obstante lo anterior, este argumento de eficiencia podría no aplicara cierto tipo de beneficios que son dirigidos a grupos demográficos específicos. Porejemplo, para el caso de los beneficios a la maternidad, es probable que los sala-rios no puedan ajustarse libremente para reflejar en parte la valoración de dichapolítica dado que podrían existir barreras al libre ajuste de salarios relativos den-

    tro del lugar de trabajo. Por lo tanto, aunque exista una valoración por parte delgrupo afecto al beneficio, eventualmente podrían existir pérdidas de eficiencia. Lametodología empleada se basa en los denominados experimentos naturales. Estospermiten estimar la respuesta del mercado laboral a la imposición de beneficiosque van dirigidos hacia grupos específicos de la población. El experimento naturalsurge de las leyes de beneficios maternales que fueron promulgadas en determi-nados estados de Norteamérica durante los años setenta. Dichas leyes presentanlas siguientes ventajas para estudiar los efectos sobre el mercado laboral:

  • 8/17/2019 Rol de La Aleatoriedad

    24/34

    Afectaron a un grupo demográfico específico de la población, mujeres en

    edad de tener hijos y a sus respectivos maridos.Fueron igualmente costosas para todos los individuos afectos.

    No afectó a todos los estados.

    Summers (1989) argumenta a favor de este tipo de disposiciones (mandatos)en términos de su eficiencia. Básicamente, establece que frente a la imposiciónde estos beneficios los individuos aumentarán su oferta laboral en orden a apro-vecharlos. Por lo tanto, si el empleado valora el beneficio que está recibiendo,entonces, incrementará su oferta laboral, lo cual reducirá el incremento de loscostos laborales para el empleador. Note que si la valoración es completa no exis-

    tirán pérdidas de eficiencia. No obstante lo anterior, cabe mencionar que podríanexistir barreras al libre ajuste de salarios relativos, lo cual impediría que la va-loración del beneficio se manifestara mediante cambios salarios.14 De esta forma,tal como Gruber (1992) señala podrían existir costos en términos de eficiencia.Dado que el argumento de eficiencia descansa en el grado de valoración de losbeneficios por parte del grupo en cuestión y del traspaso a salarios, el trabajoempírico de Gruber se basa en el grado en que los salarios efectívamente se ajus-tan para reflejar la valoración de dichas disposiciones. Si no existiera variación ensalarios, esto se podría deber a que el grupo beneficiario no valora el programa,o bien, a que existen barreras al libre ajuste de salarios. La Figura 2 presenta los

    efectos de una política de este tipo:

    Figura 2: Valoración de Beneficios

    L

    W

    W*

    L*

    D

    O'

    O

    A

    B

    La implementación de la política de mayores beneficios maternales conduciríaa la economía a un punto como el B. Sin embargo, al existir una valoración dedicho beneficio por parte de las mujeres, estas estarían dispuestas a trabajar más,lo cual provocaría que economía se acerca al punto A, es decir, el punto de empleo

    14Por ejemplo, la existencia de sindicatos, de leyes de salarios mínimos, etc.

  • 8/17/2019 Rol de La Aleatoriedad

    25/34

    de equilibrio. De esta manera, los efectos negativos de la política en término de

    reducción de empleo se serían aminorados por la valoración de la política.

    6.1.1. Metodología

    Para realizar una correcta evaluación de los efectos de esta política se debecontrolar por todos aquellos factores que podrían eventualmente afectar al mo-mento de la implementación de este, puesto que de lo contrario podrían atribuirseal programa ciertos efectos que no corresponden. Por lo tanto, en las estimacionesse incorpora :

    Efecto año: se capturan tendencias a nivel nacional en los salarios del grupode tratamiento.

    Efecto estado: controla por diferencias en la evolución de los salarios en losdistintos estados de Norteamérica.

    Efecto estado-año: para controlar por shocks específicos al estado, los quepodrían estar correlacionados con la implementación de la ley.

    El supuesto que valida la implementaión del estimador de DDD es que noexistan shocks contemporáneos que afecten el resultado relativo del grupo expe-rimental en el mismo estado-año que la implementación de la ley. El grupo detratamiento (personas beneficiarias del programa) está compuesto por aquellas

    trabajadores que se encuentran en edad fértil, o trabajadores cuyos seguros desalud cubren a una mujer que está en edad fértil. El grupo de control está cons-tituido por aquellos individuos que no se vieron afectados por la ley. La fuentede información proviene de la  Current Population Survey (CPS), la cual para elperíodo bajo análisis no contiene información acerca de la cobertura de planes desalud, por lo tanto, no es posible identificar los costos asociados a este mandato.En el artículo este problema se aborda de dos maneras:

    1.   Se utiliza como grupo de tratamiento a las mujeres casadas entre 20 y 40años. Este grupo contiene a los individuos para los cuales el mandato fuemás costoso, es decir, mujeres casadas en edad de tener hijos. El grupo de

    control son todos los individuos sobre los 40 años y los hombres solteros deentre 20 y 40 años.

    2.   Se utilizan datos acerca de la cobertura del seguro desde otras fuentes dedatos para modelar la probabilidad de que el individuo esté cubierto porel seguro y qué tipo de cobertura recibe. De esta forma se asigna un costoindividual a cada persona debido al beneficio. La ventaja de esta opción esque utiliza la variación individual para identificar el impacto del programa.El problema es que impone una fuerte estructura paramétrica.

  • 8/17/2019 Rol de La Aleatoriedad

    26/34

    6.1.2. Resultados

    A continuación se presentan los resultados. Hubo una caída de un 3.4 %  enlos salarios reales de las mujeres en los estados experimentales en el período bajoestudio el que se contrasta con un aumento de un 2.8 %  en los salarios realesde las mujeres en los otros estados. De esta forma, hubo una disminución de un6.2 %  en los salarios reales de las mujeres en edad de tener hijos en los estadosen que se aplicó esta ley. Esta es la estimación de diferencia en diferencia (DD)de la ley. Cuando se lleva a cabo el mismo ejercicio para el grupo de control, esdecir, todos lo individuos de más de 40 años y hombres solteros de entre 20 y40 años, se obtienen los siguientes resultados. Para este grupo se encuentra unacaída en los salarios en los estados experimentales relativo a los otros estados de

    0.8 %. El efecto total es, por tanto, una caída de un 5.4 % en los salarios relativosde las mujeres casadas en los estados en que se aplicó la ley. Estos resultados sonestadísticamente significativos.

    En orden a obtener resultados más precisos el autor estima la siguiente ecua-ción:

    W ijt  =  α + β 1X ijt + β 2τ t + β 3δ  j + β 4(TREAT i) + β 5(δ  jτ t) +

    β 6(τ tTREAT i) + β 7(δ  jTREAT i) + β 8(δ  j τ tTREAT i)   (33)

    donde  i   indica individuo, j  indica estado (toma el valor 1 si es un estado experi-mental y un valor 0 si no) y  t  es el índice año (el valor 1 indica si la observación

    corresponde después de la ley y el valor 0 indica si es antes). Con respecto a lavariable resultado, W  es el logaritmo del salario por hora real,  X  es un vector decaracterísticas observables,  δ  j   es el efecto estado,  τ t  es el efecto año y   TREAT es una variable dummy para el grupo de tratamiento (toma el valor 1 si es trata-miento y el valor 0 si no). El conjunto de condicionantes comprende: educación,experiencia y su cuadrado, género, estado marital, interacción género y estadomarital, dummy raza no blanca, dummy sindicalización, dummies para las 15mayores industrias, y dummies para lo años 1974 y 1978. El coeficiente de interéses  β 8. El coeficiente estimado es de -4.3 %, estadísticamente significativo. Es unpoco más pequeño al encontrado en la sección anterior, pero su error estándares más pequeñ, es decir, es más eficiente. El Cuadro 1 muestra los principalesresultados. La primera columna muestra los impactos sobre el salario por hora.Las siguientes dos columnas presentan los efectos del programa sobre las horastrabajadas y sobre la probabilidad de estar empleado. Si el beneficio es valoradoen un 100 %, entonces, no debiese existir un cambio en la contratación del factortrabajo:

    Cuadro 1: Evaluación del impacto del programa

  • 8/17/2019 Rol de La Aleatoriedad

    27/34

    Grupo Logaritmo del Logaritmo de las Empleo   %  de cambio en

    salario por hora horas por semana (probit) el factor trabajoMujeres casadas de entre -0.043 0.049 -0.047 1.420 y 40 años (0.023) (0.022) (0.048)

    [-0.016]Mujeres solteras de entre -0.042 -0.014 -0.095 -5.95

    20 y 40 años (0.026) (0.024) (0.064)[-0.03]

    Hombres casados de entre -0.009 0.03 -0.139 -1.0820 y 40 años (0.018) (0.015) (0.072)

    [-0.038]Todos -0.023 0.027 -0.079 0.88

    (0.015) (0.014) (0.039)[-0.024]

    Notas:Errores estándar entre paréntesis

    Valores entre corchetes indican

    cambios marginales en probabilidad

    A pesar de lo anterior, es posible encontrar cambios en la composición del fac-tor trabajo dado que este mandato representa un incremento en los costos fijosde contratación, y por lo tanto, son más costosos los individuos con pocas horasde trabajo, es decir, los trabajadores  part time . Sin embargo, si los empleadoresson capaces de disminuir los salarios de los trabajadores en una suma fija igualal costo del mandato, no debería haber mayores efectos sobre el nivel de empleoni tampoco sobre las horas trabajadas.

    Como se puede apreciar, se confirma la conclusión de que hubo un totaltraspaso del beneficio hacia salarios. Sin embargo, se observan algunos cambioscomposicionales. En efecto, en la segunda columna se aprecia un aumento signi-ficativo de  4,9 %  en las horas trabajadas para las mujeres casadas de entre 20 y40 años de edad. Por otro lado, se observa una disminución (no estadísticamentesignificativa) de un  1,6 %  para la probabilidad de encontrar empleo para el mis-mo grupo experimental. Finalmente, se observa un aumento de un  1,4 %  en lashoras trabajadas semanales para el grupo de tratamiento. Resumiendo, es posibleseñalar que los efectos son: una disminución en salarios, un aumento de las horastrabajadas, y una caída en el nivel empleo. La variabilidad de los resultados entrelos distintos grupos demográficos puede deberse a la heterogeneidad del impactode esta ley, debido a la variabilidad en la cobertura y a los costos de extender los

    beneficios maternales. Para ahondar en este punto el autor realiza una estimaciónindividual de los costos asociados. Las principales conclusiones se mantienen.

    6.2. The Impact of Financial Incentives to Training Provi-ders: The Case of Chile Joven

    Las políticas gubernamentales a partir de 1990 han incentivado fuertemente lacapacitación de la fuerza laboral. De hecho, en 1990 alcanzó el 4.6 % mientras que

  • 8/17/2019 Rol de La Aleatoriedad

    28/34

    en 1999 esta cifra se empinó por sobre el 10 %. Si se consideran la capacitación

    privada la cifra llega al 20 %. El Programa Chile Joven  apunta a la capacitacióndel segmento más joven de la fuerza laboral. En este trabajo, los autores utilizanel enfoque de experiementos naturales para evaluar el impacto del programa ChileJoven.

    El programa tiene sus inicios en 1991 y estaba orientado a los jóvenes des-empleados de bajos ingresos de entre 15 y 24 años de edad. El principal objetivodel programa consiste en aumentar la probabilidad de estos jóvenes de encontrarempleo, principalmente a través de capacitación y experiencia laboral. A comien-zos de 1995 se implementó un incentivo financiero al subprograma   Capacitación y Experiencia Laboral en la Empresa   proporcionando un monto de dinero adi-cional a los organismos capacitadores cada vez que uno de los beneficiarios del

    programa finalizara su experiencia laboral (luego de la capacitación recibida) conun contrato en una empresa privada. Las principales conclusiones son:

    El experimento natural indica que el incentivo financiero significó un incre-mento en un 11 % en la probabilidad de encontrar empleo.

    Cuando se controla por las características de los beneficiarios, las caracte-rísticas de la capacitación recibida y por las condiciones macroeconómicasimperantes, el impacto llega a un 8 %.

    Cuando se estima a través del método de   efectos fijos   para controlar por

    características no observables, el impacto se reduce a un 6.7 %.Finalmente, cuando se utilizan las técnicas matching el impacto llega al13 %.

    6.2.1. El Programa Chile Joven

    La institución a cargo de la administración del programa Chile Joven es el Ser-vicio Nacional de Capacitación y Empleo (SENCE). El objetivo de este programaconsistía en aumentar la probabilidad de que tanto jóvenes desempleados prove-nientes de familias de bajos ingresos como jóvenes con dificultades de integraciónsocial y económica se insertaran en el mercado laboral a través de políticas decapacitación. Los beneficios consistían en:

    Curso de capacitación.

    Subsidio para transporte y comida.

    Experiencia laboral dentro de una firma.

    Seguro contra accidentes laborales.

  • 8/17/2019 Rol de La Aleatoriedad

    29/34

    El programa es completamente descentralizado y se basa en los incentivos que

    tiene el organismo proveedor de la capacitación para diseñar cursos y participaren licitaciones públicas coordinadas por el gobierno.El subprograma Capacitación y Experiencia Laboral en la Empresa está cons-

    tituido por dos fases. La primera fase consiste en clases de 200 horas cronológicas.La segunda fase corresponde a una experiencia laboral de tres meses en una em-presa determinada. El incentivo monetario se implementa en la segunda fase deaplicación del programa y se aplica toda vez que el beneficiario termine su prác-tica laboral con un contrato. De esta forma, la institución capacitadora recibe unmonto de dinero por cada estudiante que finaliza su experiencia laboral con uncontrato laboral. Así, el organismo capacitador recibe una cantidad total (T V )por la capacitación impartida, la cual se desglosa de la siguiente manera:

    T V   = T RV   + CS  + W E    (34)

    donde:

    T RV  es el costo de la capacitación e incluye a todos los costos directos eindirectos asociados a la capacitación.

    CS  es el subsidio por sala de clases, y son los costos de transporte asociadosa la primera fase.

    W E  es el costo asociado a la fase de experiencia laboral, y es la cantidad

    de dinero que reciben los organismos capacitadores por estudiante durantela fase de experiencia laboral.

    Por otro lado, si en la segunda fase el beneficiario consigue un contrato laboral,el subsidio  W E  pasa a ser directamente del proveedor de la capacitación.  CS   yW E  representan cerca del 30 %  del valor de  T V , y  W E   es aproximadamente lamitad de ese valor, por lo que el incentivo representa una apreciable cantidad derecursos.

    6.2.2. Metodología

    El universo de individuos considerados para la evaluación del impacto delprograma corresponde a todos los beneficiarios del programa Chile Joven. Lavariación exógena que da lugar al experimento natural proviene del shock ocurridoentre la fases I y II del programa. Constituye una variación exógena ya que loúnico que cambia entre ambas fases es la existencia de este incentivo. Dado queel principal objetivo del programa es aumentar la probabilidad del individuo definalizar su práctica laboral con un contrato, la variable de interés es el cambioen el status  laboral. Se define:

  • 8/17/2019 Rol de La Aleatoriedad

    30/34

    Di: variable dicotómica que es tomar el valor 1 si el beneficiario recibe el

    tratamiento, es decir, participa en el programa Chile Joven bajo la modali-dad de incentivos monetarios y es 0 si participa en el programa Chile Jovenpero sin incentivos monetarios.

    Y 0i: situación laboral del beneficiario  i  en el estado  D  = 0. Toma el valor 1si se encuentra empleado y 0 si no.

    Y 1i: situación laboral del beneficiario  i  en el estado  D  = 1. Toma el valor 1si se encuentra empleado y 0 si no.

    X i: vector de características de los beneficiarios.

    T i: variable dicotómica que toma el valor 1 si el individuo participa en elPrograma Chile Joven como un beneficiario y 0 si no.

    De esta forma, bajo los siguientes supuestos identificadores:

    E (Y 1|X, Di = 1, T  = 1) =  E (Y 1|X, Di = 0, T   = 1)   (35)

    E (Y 0|X, Di = 0, T  = 1) =  E (Y 0|X, Di = 1, T   = 1)   (36)sería posible estimar:

    E (αi) =  E (Y 1|X, Di  = 1, T   = 1) − E (Y 0|X, Di = 0, T   = 1)   (37)

    Hay una dimensión temporal que no está explícitamente incorporada en (36).Dado que la situación laboral de todos los participantes del programa Chile Jovenes   Y t−1   = 0   antes del programa, la variable   Y   en (36) (Y 0   o   Y 1) representa elcambio en la situación laboral entre el período   t − 1  (antes de la capacitación)y t (después de la capacitación). Así, la implementación de (36) es un estimadorsimple de la diferencia en la proporción de gente que consigue un contrato entrelas fases. El impacto se obtiene estimando la siguiente especificación:

    Y i  =  β 1 + β 2Di + X itγ  + δE  jt + µit   (38)

    donde  β 2  captura el efecto del programa,  X it  representa un conjunto de caracte-rísticas tanto del individuo como de la institución capacitadora, E  jt  representa latasa de desempleo de los hombres entre 34 y 51 años para el año  t  en la región j .Esta variable intenta capturar las condiciones macroeconómicas del año en queel beneficiario recibe el tratamiento. Dado que la variable dependiente es dico-tómica, se estima un modelo probit. Adicionalmente, se estima mediante efectofijo para capturar factores específicos del organismo capacitador. Finalmente, sedetermina el impacto mediante las técnicas de matching.

  • 8/17/2019 Rol de La Aleatoriedad

    31/34

    6.2.3. Resultados

    El Cuadro 2 muestra los principales resultados de las estimaciones parámetri-cas del impacto del programa:

    Cuadro 2: Impacto del programa: técnicas convencionales

    Método ImpactoModelo de probabilidad lineal sin controles 0.1129

    Probit sin controles 0.1129

    Modelo de probabilidad lineal con controles 0.0843

    Probit con controles 0.0841

    Efectos fijos: Modelo de probabilidad lineal 0.0676

    Nota: todos los coeficientes significativos al 95%

    Los resultados que se obtienen son robustos frente a distintas especificaciones.En efecto, el efecto de primer orden es siempre positivo. Los estimadores matchingse muestran en el Cuadro 3:

  • 8/17/2019 Rol de La Aleatoriedad

    32/34

    Cuadro 3: Impacto del programa: estimadores matching

    Ancho de banda Impacto del incentivo0.2 0.1333

    0.3 0.1332

    0.4 0.1307

    Como puede verse los resultados se encuentran en torno al 13 %, que muestraun impacto robusto frente al ancho de banda escogido.

  • 8/17/2019 Rol de La Aleatoriedad

    33/34

    Referencias

    [1]   Benavente, J.M. (2003)   Notas de clases Microeconometría Aplicada..Programa de Magister y Doctorado en Economía. Departamento deEconomía, Universidad de Chile.

    [2]   Benavente, J.M., Bravo, D., Montero, R. (2003).   Salarios y Uso del Computador en el Trabajo en Chile . Documento de Trabajo. Departa-mento de Economía.

    [3]   Benavente, J.M., Contreras, D., Melo, E., Montero, R. Programas Anti-delincuencia: Evaluando Comuna Segura . Documento de Trabajo N201.Departamento de Economía. Universidad de Chile.

    [4]   Bravo, D., Contreras, D. (2000).  The impact of financial incentives totraining providers: the case of Chile Joven .

    [5]   Bravo, D., Contreras, D. y Crespi, G. (2000).  Evaluating training pro-grams for small-scale entrepreneurs: a pilot study .

    [6]   Dehejia, R. y Wahba, S. (1995)   Causal effects in Non-experimental studies: re-evaluating the evaluation of training programs.

    [7]   Greene, W. (1993) Econometric Analysis.  Prentice Hall.

    [8]   Gruber (1994).   The incidence of mandated maternity benefits . Ameri-can Economic Review, Vol. 84, No 3.

    [9]   Heckman, J., Ichimura, H. y Todd, P. (1997) Matching as an Econo-metric Evaluation Estimator .

    [10]   Heckman, J., LaLonde, R. y Smith, J. (1999) The economics and eco-nometrics of active labor market programs.  Handbook of Labor Econo-mics, Volumen III, Orley Ashenfelter y David Card editores.

    [11]   Heckman, J., Smith, J. (1999) The Pre-Programme Earnings Dip and 

    The Determinants of Participation in a Social Programme. Implica-tions For Simple Programme Evaluation Strategies.

    [12]   Imbens, G., Angrist, J. (1994)  Identification and Estimation of Local Average Treatment Effects .

    [13]   Meyer, Viscusi, Durbin (1995). Workers compensation and injury dura-tion: evidence from a natural experiment . American Economic Review,Vol. 85 , No 3.

  • 8/17/2019 Rol de La Aleatoriedad

    34/34

    [14]   Rosenbaum, P. y Rubin, D. (1983) The central role of the propensity 

    score in observational studies for causal effects . Biometrika.[15]   Rubin, D. (1980) Bias reduction using Mahalanobis-Metric Matching.

    Biometrika.

    [16]   Sianesi, B. (2001) Implementing propensity score matching estimators with STATA.

    [17]   Todd, P. (1999)  A practical guide to implementing matching estimators.