Anexo 3: ¿Cuántos peruanos murieron?

download Anexo 3: ¿Cuántos peruanos murieron?

of 35

Transcript of Anexo 3: ¿Cuántos peruanos murieron?

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    1/35

    CUNTOS PERUANOS MURIERON?

    PGINA1

    ANEXO 3

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    2/35

    ANEXO 3

    PGINA2

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    3/35

    CUNTOS PERUANOS MURIERON?

    PGINA3

    CUNTOS PERUANOS MURIERON?

    Estimacin del total de vctimas causadas por el conflicto armado interno entre1980 y el 20001

    1. INTRODUCCIN

    Cuntas personas murieron o desaparecieron en el Per entre 1980 y el ao 2000 a consecuencia del conflicto armadointerno? A lo largo de este texto intentaremos responder a esta pregunta presentando los resultados del anlisis al quefueron sometidos los datos de tres tipos de fuentes de informacin con las que trabaj la CVR.2 Este anlisis aplic unprocedimiento estadstico utilizado en investigaciones similares para estimar el nmero de muertes causadas por la

    violencia poltica en los conflictos de Guatemala (1960-1996) y Kosovo (marzo-junio 1999).3Dada la informacin disponible, concluimos que el nmero total de muertos y desaparecidos causados por el

    conflicto armado interno peruano se puede estimar en 69,280 personas, dentro de un intervalo de confianza al 95%cuyos lmites superior e inferior son 61,007 y 77,552, respectivamente. Las proporciones relativas de las vctimassegn los principales actores del conflicto seran: 46% provocadas por el PCP-SL; 30% provocadas por agentes delEstado o fuerzas contrasubversivas (incluyendo comits de autodefensa y grupos paramilitares);4 y 24% provocadaspor otros agentes o circunstancias (MRTA, agentes no identificados o vctimas ocurridas en enfrentamientos o situacionesde combate armado).

    En este documento se analiza, en primer lugar, la relacin entre casos reportados y no reportados de muertes ydesapariciones a consecuencia del conflicto armado interno. En la segunda parte, se hace un resumen de los principaleshallazgos y conclusiones de este estudio. Seguidamente, se describe cmo fue organizada la informacin con la que se

    trabaj y los resultados del cruce de datos entre las fuentes analizadas. En la seccin final, detallamos los procedimientosy tcnicas utilizadas para calcular el estimado total de muertos y desaparecidos. En los anexos, se presentan los

    1 Informe del Grupo de Anlisis de Datos sobre Derechos Humanos de laAmerican Association for the Advancement of Science para la Comisin de laVerdad y Reconciliacin. Elaborado por Patrick Ball, Jana Asher, David Sulmont y Daniel Manrique. Los autores agradecen a Jana Dudukovich(consultora de la AAAS, EEUU) por preparar las tablas. Los comentarios y sugerencias de John Wilmoth (Profesor Asociado de Demografa de laUniversity of California-Berkeley), Fritz Scheuren (Vicepresidente de Estadsticas, National Opinion Research Center, EEUU) y Herbert F. Spirer(Profesor Emrito de la University of Connecticut) fueron de particular importancia para este trabajo. En el presente proyecto, el trabajo conjuntode la CVR y la AAAS fue apoyado por el Internacional Center for Transitional Justice y la John D. & Catherine T. MacArthur Foundation.2 Las fuentes en cuestin fueron: la base de datos de la CVR, la base de datos de la Defensora del Pueblo sobre denuncias de desaparicin forzadapresentadas ante el ministerio pblico y la base de datos de denuncias de violaciones de los derechos humanos registradas por organismos no

    gubernamentales. Estas fuentes se describen detalladamente en la seccin de descripcin de los datos del presente documento.3 Vase CEH 1999; Ball 2000; Ball, Betts, Scheuren, Dudukovich y Asher 2002.4 Vase la fe de errata al final del texto (nota de la Comisin de Entrega de la CVR, octubre 2003).

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    4/35

    ANEXO 3

    PGINA4

    resultados de las pruebas de verificacin a las que fueron sometidos los procedimientos para calcular los estimados yse comparan los resultados de la estimacin para el departamento de Ayacucho con proyecciones demogrficasrealizadas sobre la base de los censos de poblacin de 1981 y 1993.

    1.1. LASPREGUNTASQUEGUANELPRESENTEANLISIS

    A lo largo de su trabajo de investigacin y recoleccin de testimonios, la CVR recibi reportes acerca de aproximada-mente 24,000 personas muertas o desaparecidas5 a consecuencia del conflicto armado interno. De este total,18,397personas fueron identificadas especficamente con sus nombres completos (apellidos paterno y materno y nombre depila).6

    A pesar de la magnitud sin precedentes de la informacin recopilada, no todas las vctimas del conflicto armadointerno han sido reportadas a la CVR. Sabemos que existen aproximadamente 5,000 vctimas fatales que no fueronreportadas en los testimonios recogidos por la CVR, pero que s aparecen documentadas en las bases de datos de laDefensora del Pueblo (DP) o de las Organizaciones no Gubernamentales de Defensa de los Derechos Humanos(ODH). Existen, adems, muchas otras vctimas que nunca han sido documentadas por ningn proyecto o institucindebido a diversas razones: los testigos viven en zonas muy remotas del pas, algunos testigos pueden estar profun-damente traumatizados y seguir temiendo represalias si cuentan su experiencia, algunas vctimas fatales murieronsin que queden testigos vivos de los hechos, etc.

    Tomando esto en cuenta, una de las primeras preguntas que nos hacemos al emprender un anlisis cientfico de loshechos es, en total, cuntos muertos o desaparecidos dej el conflicto armado interno en el Per? Responder esta preguntaimplica sumar todas las vctimas que han sido reportadas en una o ms instituciones o proyectos de investigacin(CVR, DP, ODH), ms aqullas que nunca fueron reportadas ante institucin alguna.

    Otra pregunta importante es quines y en qu medida son responsables de esas muertes o desapariciones? Del total decasos reportados en los testimonios recogidos por la CVR, cerca de la mitad de las vctimas fatales han sido atribuidasal accionar del PCP-SL; aproximadamente un tercio seran responsabilidad del conjunto de las fuerzas del orden delEstado; el porcentaje faltante corresponde a las vctimas causadas por el resto de agentes o por agentes no identificados.Sin embargo, en los otros proyectos de sistematizacin de informacin, el PCP-SL y el conjunto de agentes no estataleso no identificados aparecen como responsables de una proporcin mucho menor de las vctimas documentadas (entre5 y 16%) que aqulla calculada a partir de la base de datos de la CVR. Frente a tales diferencias entre fuentes deinformacin, cmo podemos saber cules son las proporciones reales?

    Existe un mtodo estadstico que puede utilizar la informacin contenida en mltiples sistemas de documentacinindependientes (como los tres mencionados previamente) para calcular una estimacin del total. Este mtodo esconocido como Estimacin de Mltiples Sistemas (EMS).7 Para hacer ese clculo, la Estimacin de Mltiples Sistemasanaliza las relaciones entre los reportes de los mismos eventos que se superponen a lo largo de mltiples proyectos derecoleccin de informacin (por ejemplo A, B y C). La superposicin es el patrn que resulta del hecho de que algunaspersonas aparezcan reportadas slo en un proyecto de recoleccin de informacin (sea A, B o C), otras lo sean en losproyectos A y B, pero no en C; otros en A y C, pero no en B; otros en A, B y C; etc. Analizando el patrn desuperposiciones entre distintos proyectos (adems de tomar en cuenta algunos supuestos bsicos que describiremosms adelante), podemos hacer inferencias estadsticas acerca de cuntas personas no fueron documentadas en proyectoalguno y de esta forma calcular un estimado del universo total.

    El presente informe describe un procedimiento de estimacin que comienza utilizando la metodologa estndar dela EMS, pero que adems recurre a las herramientas de otras tcnicas estadsticas para responder a las preguntasarriba formuladas.

    5 De ahora en adelante, y para efectos del presente anlisis, nos referiremos a los muertos y desaparecidos como vctimas fatales. Sin embargo, losautores son concientes que se trata de categoras diferentes, tanto desde el punto de vista social como legal.6 El 78% de las vctimas fatales reportadas en los testimonios recopilados por la CVR y registradas en su base de datos tienen nombre completo(apellido paterno, materno y nombre de pila); 19% tienen slo nombre de pila y apellido paterno; 3% de las vctimas reportadas fueron registradas

    nicamente con apellido paterno, nombre de pila, seudnimo o alguna otra caracterstica que pudo individualizarla pero no identificarlacompletamente (funcin o cargo que ocupaba en su comunidad, edad, pertenencia a una familia, etc.).7 Del inglsMultiple Systems Estimation .

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    5/35

    CUNTOS PERUANOS MURIERON?

    PGINA5

    1.2. ANTECEDENTESDELUSODELAMETODOLOGADE EMS

    El mtodo de EMS fue originalmente desarrollado para calcular el tamao de poblaciones de animales silvestres(Petersen 1890) y, desde entonces, ha sido aplicado para varios problemas de estimacin en donde los mtodos demuestreo probabilstico resultan ser insuficientes o son impracticables.8 El uso ms destacado de la EMS ha sido paracorregir los censos de poblacin en los cuales se sabe que la enumeracin directa de personas excluye algunosindividuos del conteo final (Sekar y Deming 1949; Hogan 1993; y Anderson y Fienberg 2001),9 como por ejemplo loshabitantes de localidades muy remotas o aisladas.

    En experiencias ms relevantes para este estudio, la EMS ha sido empleada en dos ocasiones previas en Guatemalay en Kosovo10 para calcular el nmero total de muertes causadas por la violencia poltica.

    En Guatemala, los estimados se hicieron utilizando la informacin recolectada entre 1994 y 1998 por tres proyectosde investigacin independientes: el proyecto de Reconstruccin de la Memoria Histrica promovido por la IglesiaCatlica guatemalteca (proyecto REMHI); un segundo proyecto impulsado por una coalicin de organizaciones nogubernamentales de derechos humanos (proyecto CIIDH); y, finalmente, aqul conducido por la Comisin deEsclarecimiento Histrico (CEH), el equivalente en ese pas a la CVR peruana.

    Como resultado de ese anlisis, se estim que ms de 200,000 personas11 fueron asesinadas durante el conflictoarmado interno guatemalteco entre 1960 y 1996. Ese hallazgo fue asumido por la CEH como una de las conclusionescentrales de su informe final. Cuando se desagregaron los estimados segn el origen tnico de las vctimas, se establecique: a) en algunas regiones, entre 1981 y 1983 se asesin al 40% o ms de la poblacin indgena que viva 12 en esoslugares;y b) en seis de las regiones estudiadas, la tasa de asesinatos era de cinco a ocho veces mayor para las vctimasindgenas que para aqullas no indgenas. La combinacin de estos resultados constituy uno de los fundamentoscentrales que le permiti a la Comisin de Esclarecimiento Histrico de Guatemala afirmar que el ejrcito de ese pascometi actos de genocidio en contra de la poblacin maya (CEH 1999; Ball 2000a).

    En Kosovo, la EMS fue utilizada para calcular el nmero total de kosovares de origen albans que murieron comoconsecuencia del conflicto que contrapuso a la OTAN y Yugoslavia entre marzo y junio de 1999 (Ball, Betts, Scheuren,Dudukovich, y Asher 2002). El nmero total de personas muertas fue desagregado a lo largo del tiempo y segndiferentes regiones geogrficas. Ese estimado, as como los resultados de un anlisis de los patrones de migracin portiempo y lugar, fue contrastado con las diferentes hiptesis que se formularon sobre la violencia en Kosovo duranteese perodo. Las hiptesis que sostenan que la violencia y las vctimas fueron producto de las operaciones de laOTAN o de las acciones de la guerrilla del Ejrcito de Liberacin de Kosovo tuvieron que ser dejadas de lado puestoque no eran consistentes con la informacin analizada. Los resultados y las conclusiones de ese estudio fueronpresentados como testimonio de experto en el juicio que se sigue en contra de Slobodan Milosevic por crmenes deguerra y de lesa humanidad en el Tribunal Penal Internacional para Crmenes en la antigua Yugoslavia, con sede en laciudad de La Haya.

    2. RESUMENYPRINCIPALESCONCLUSIONESDELPRESENTEANLISIS

    En el caso peruano, hemos utilizado los datos de la CVR y de otras dos fuentes de informacin para estimar el nmerototal de vctimas fatales causadas por el conflicto armado interno, segn principales agentes responsables y segn grandesregiones geogrficas. En secciones posteriores presentaremos los resultados correspondientes a niveles inferiores dedesagregacin.

    8 Para una revisin del tema, vase: AAAS/ABA-CEELI 2000.9 Para una discusin reciente sobre el tema entre miembros de la American Political Science Association vase: .10 Dos de los responsables del presente estudio condujeron los proyectos de Kosovo (P. Ball y J. Asher) y Guatemala (P. Ball).

    11 Para llegar a ese nmero se aadi a la estimacin original, los datos correspondientes a las regiones y perodos que fueron omitidos en losclculos iniciales.12 Segn la comparacin realizada con la informacin sobre poblacin indgena registrada en el censo guatemalteco de 1981.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    6/35

    ANEXO 3

    PGINA6

    El nmero total de vctimas fatales por agente responsable se muestra en la tabla 1. El total suma 69,280. Esteestimado debe interpretarse dentro de un rango que va de 61,007 a 77,552 vctimas, que constituye el intervalo deconfianza al 95% de la estimacin.13 Esta tabla nos muestra tambin que el PCP-SL (SLU) sera responsable del 46% delas vctimas, los agentes del Estado y las fuerzas contrasubversivas (EST) del 30%, y el resto de agentes (OTR) del 24%.

    Tabla 1

    13 Este rango debe entenderse de la siguiente manera: existe un valor verdadero para el nmero de vctimas fatales que estamos estimando paracada perpetrador. Nuestro estimado es slo eso, un estimado. Puesto que los lmites superior e inferior del intervalo son determinados por laadicin o sustraccin de una cantidad de este estimado, son a su vez, estimados. El intervalo de confianza representa la probabilidad de que esos

    estimados (inferior y superior) contengan al verdadero nmero de vctimas. En este caso, hemos estructurado el intervalo de confianza de maneratal que exista una probabilidad del 95% de que los lmites inferior y superior del intervalo estn por debajo o por encima, respectivamente, delverdadero nmero de vctimas.

    En la tabla 2 se muestran los estimados para las diferencias entre el nmero de vctimas cuya responsabilidad esatribuida a cada grupo perpetrador. Por ejemplo, estimamos que la diferencia entre el nmero total de vctimas fatalesresponsabilidad del PCP-SL y aquellas atribuidas a los agentes del Estado y fuerzas contrasubversivas se sita entre5,104 y 16,641 (SLU-EST). Los resultados de la tabla 2 indican que el nmero total de vctimas estimadas para ungrupo perpetrador es significativamente distinto de los estimados para los otros dos grupos. En este contexto,hablamos de significancia para afirmar que la diferencia cuantitativa existente entre los grupos no es producto del azar.Utilizando un lenguaje estadstico formal, podemos rechazar la hiptesis de que el nmero de vctimas fatalescausadas por un grupo en particular es el mismo que el causado por cualquiera de los dos otros grupos. La principalconclusin de esta tabla es que, para el conjunto del pas y entre 1980 y el 2000, el PCP-SL es responsable de unnmero significativamente mayor de vctimas fatales que el conjunto de agentes involucrados en la lucha contra-subversiva o que del resto de actores del conflicto armado interno.

    Tabla 2

    24,823 17,023 11,858 61,007

    Estimado 31,331 20,458 15,967 69,280

    Lmite superior 37,840 23,893 20,076 77,552

    TOTAL(*)

    PER 1980 - 2000: ESTIMADOS Y LMITES DE LOS INTERVALOS DE CONFIANZA DELTOTAL DE VCTIMAS FATALES CAUSADAS POR EL CONFLICTO ARMADO INTERNO,SEGN AGENTES RESPONSABLES (Nivel de confiaza: 95%)

    (*) Los resultados de la columna "TOTAL" fueron directamente calculados con la EMS, no son la suma de los estimadosindividuales

    AGENTES RESPONSABLES

    ESTIMADOS

    Lmite inferior

    PCP-SENDEROLUMINOSO

    AGENTES DELESTADO

    OTROS

    EST-OTR SLU-OTR

    Lmite inferior 5,118 872 12,175

    Estimado 10,872 4,824 17,376

    Lmite superior 16,626 8,776 22,577

    PER 1980 - 2000: ESTIMADOS Y LMITES DE LOS INTERVALOS DE CONFIANZA DE LADIFERENCIA ENTRE LOS ESTIMADOS CALCULADOS DEL TOTAL DE VCTIMAS FATALESATRUIBUIDAS A LOS AGENTESRESPONSABLES (Nivel de confiaza: 95%)

    DIFERENCIAS ENTRE AGENTES RESPONSABLES

    ESTIMADOSSLU-EST

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    7/35

    CUNTOS PERUANOS MURIERON?

    PGINA7

    El grfico 1 da cuenta del total de vctimas estimadas por regiones14 y de sus respectivos intervalos de confianza al95% (lnea negra en la parte superior de las barras).

    Grfico 1

    Este grfico confirma que Ayacucho fue el departamento ms afectado por el conflicto armado interno, seguidopor la regiones central (Junn y Pasco) y nororiental (Hunuco, San Martn15 y Ucayali). Como se aprecia en el grfico,

    el tamao de los intervalos de confianza correspondientes a estas dos ltimas regiones sugiere que no es posibleafirmar estadsticamente que una de ellas tenga ms vctimas que la otra.

    Cabe aclarar que la divisin geogrfica mostrada en el grfico 1 no es exactamente la misma que la utilizada en loscaptulos sobre las historias regionales. Las diferencias radican en que la estratificacin geogrfica realizada para elclculo del estimado de vctimas se bas en las relaciones y patrones estadsticos detectados en el anlisis de la superposicinde fuentes de informacin y no necesariamente en la continuidad de las divisiones polticas que corresponden a losdepartamento (para obtener ms detalles, vase ms adelante la seccin donde se explica el proceso de estratificacin).

    Con el fin de corroborar la verosimilitud del estimado del total de vctimas, en el apndice 2 del presente documentocomparamos los clculos realizados para Ayacucho (26,259 vctimas) con un anlisis acerca de los patrones demogrficosde ese departamento entre 1981 y 1993. Mostramos que el nmero de personas perdidas resultante del anlisisdemogrfico es mayor que el nmero de muertos y desaparecidos calculados por la EMS. En el contexto de este

    anlisis demogrfico, concluimos que los estimados producto de la EMS pueden considerarse como un lmite inferiorrazonable del nmero de vctimas fatales en el departamento de Ayacucho.En los grficos 2 y 3 podemos comparar del nmero estimado de vctimas segn agentes responsables por

    regiones as como sus respectivos intervalos de confianza al 95%. Como se aprecia en el grfico 2, la distribucin devctimas de cada agente responsable segn regiones sigue el patrn general mostrado en el grfico 1. Cabe destacar laimportancia de los estimados calculados para la categora otros en las regiones de Ayacucho, centro y nororiente,especialmente si los comparamos con las dems regiones. Es justamente en esas zonas donde se registraron numerososcasos de muertes en combates y enfrentamientos entre grupos subversivos y comits de autodefensa (zona de losvalles del ro Apurmac y Ene entre Ayacucho y Junn; la provincia de Satipo en Junn), as como del MRTA (de-

    14 La regin centro est conformada por los departamentos de Junn y Pasco; la regin nororiente por los departamentos de Hunuco, Ucayali y casi

    todas las provincias de San Martn; la regin sur andina la conforman los departamentos de Cusco, Apurmac y Puno. Salvo el departamento deHuancavelica y las provincias de Lima y Callao, el resto de regiones del pas est en la categora otros.15 Con excepcin de las provincias de Rioja, Moyabamba, Lamas y San Jos de Sisa, que forman parte de la categora otros.

    0

    5,000

    10,000

    15,000

    20,000

    25,000

    30,000

    35,000

    Ayacucho Centro Nororiente Sur Andino Huancavelica Lima Callao Otras

    PER 1980-2000: ESTIMADOS E INTERVALOS DE CONFIANZA AL 95% DEL TOTALDE VCTIMAS FATALES DEL CONFLICTO ARMADO INTERNO, SEGN REGIN

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    8/35

    ANEXO 3

    PGINA8

    partamento de Junn, zona del Alto Huallaga y el departamento de San Martn). Por otro lado, no es de extraar queen las zonas donde el conflicto fue ms intenso, sea ms difcil identificar con seguridad a los agentes responsables delas muertes o desapariciones; esto tambin se refleja en el aumento del nmero de vctimas en la categora otros,que incluye a los casos cuyo perpetrador no ha podido ser claramente identificado.

    Grfico 2

    El grfico 3 nos permite apreciar con mayor precisin las diferencias entre los estimados calculados para cadagrupo perpetrador en cada regin. Cada barra representa la diferencia entre el nmero estimado de vctimas de un parde grupos perpetradores (SLU menos EST; EST menos OTR; SLU menos OTR), y al interior de cada barra se grafica la

    lnea que representa el intervalo de confianza al 95% para esa diferencia.16

    Grfico 3

    16 El grfico 3 debe leerse de la siguiente manera: si la barra cae en la regin derecha del grfico, significa que la diferencia estimada es positiva(SLU>EST, y as sucesivamente). Si por el contrario, la barra cae en la parte izquierda del grfico, la diferencia es negativa (SLU OTR

    PER 1980 - 2000: ESTIMADOS E INTERVALOS DE CONFIANZA PARA LAS DIFERENCIASENTRE EL NMERO DE VCTIMAS SEGN PERPETRADORES, POR REGIONES

    SLU > EST

    EST > OTR

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    9/35

    CUNTOS PERUANOS MURIERON?

    PGINA9

    Leyendo el grfico, concluimos que en Ayacucho, entre 1980 y el 2000, no es posible afirmar que el nmeroestimado de vctimas atribuidas al PCP-SL es significativamente mayor que aquel atribuido a los agentes del Estado ylas fuerzas contrsubversivas. En otras palabras, dada la informacin disponible, no podemos rechazar la hiptesis deque en esa localidad ambos actores han causado un nmero similar de vctimas fatales. Sin embargo, en el mismodepartamento, las otras diferencias s son estadsticamente significativas (EST>OTR; SLU>OTR).

    Con la excepcin de Ayacucho, Lima-Callao y la categora otras regiones, en el resto de regiones, los estimadoscalculados para el nmero de vctimas atribuidas al PCP-SL resultan ser significativamente mayores que las atribuidasa los dems grupos. nicamente en la regin Lima-Callao el resultado calculado para los agentes del Estado y fuerzascontrasubversivas es significativamente mayor que el correspondiente al PCP-SL.

    Otro elemento interesante del grfico 3 es el resultado para las diferencias en la regin Centro. Como se aprecia, tantoel clculo de vctimas causadas por el PCP-SL como el correspondiente a los otros agentes resultan ser significativamentemayores que el nmero estimado de vctimas atribuidas a los agentes del Estado. Asimismo, el estimado para el PCP-SLes significativamente mayor que el de los otros agentes. Estos datos son consistentes con las caractersticas del conflictoen la regin central. Las investigaciones llevadas a cabo por la CVR dan cuenta de la importancia los enfrentamientos ycombates armados entre las rondas campesinas y comits de autodefensa (especialmente los del pueblo ashninka) conlos miembros del PCP-SL, los cuales fueron particularmente cruentos en la zona de la selva central.

    En general, las tendencias y patrones de los estimados calculados para los actores del conflicto y para las regionesdonde ste tuvo lugar son consistentes con los hallazgos del conjunto de investigaciones realizadas por la CVR. Lamagnitud del estimado total de vctimas fatales 69,280 difiere considerablemente de las cifras manejadas comn-mente antes de la creacin de la CVR, que variaban entre 23 mil y 35 mil personas.17 Estas diferencias pueden parecersorprendentes para el sentido comn de la opinin pblica nacional, especialmente aqulla que se nutre funda-mentalmente de los debates e informaciones que provienen de los centros del poder social, econmico, poltico ycultural del pas. Sin embargo, como se ha dicho en captulos precedentes, ms all de los argumentos cientficos y dela rigurosidad de los mtodos utilizados en este anlisis estadstico, si consideramos dnde y a quines afect principal-mente el conflicto armado interno (las zonas rurales, campesinas, pobres y culturalmente ms distantes del mundooccidental peruano), no resulta inverosmil que tantos ciudadanos de ese Per hayan perecido ante la indiferenciao desconocimiento del pas oficial, moderno u occidental.

    3. DESCRIPCINDELOSDATOSYDELPROCEDIMIENTODECRUCEDEINFORMACIN

    La preparacin de la informacin sobre la que se bas el anlisis y el clculo de la EMS implic un trabajo de cruce de datosque contrast la informacin sobre vctimas identificadas de hechos fatales de crmenes y violaciones de los derechoshumanos (asesinatos, ejecuciones extrajudiciales y desaparicin forzada) procedente de seis diferentes bases de datos.El resultado de este cruce de informacin fue un registro unificado (base de datos de cruce intermuestral-BDCIM) en elque cada persona aparece registrada una sola vez, con la referencia de las bases de datos donde se encuentra.

    3.1. RELACINDEBASESDEDATOSUTILIZADASENELPRESENTEANLISIS

    En la siguiente tabla describimos brevemente las principales caractersticas de las bases de datos que fueron analizadaspara generar la BDCIM:

    17 Las fuentes que dan esas proyecciones son: Polica Nacional y Ministerio de Defensa: 22,854 vctimas (Bernales y otros 1989; INEI 1999);Cronologa de Desco 1980-2000: 25,753 vctimas (Desco 1989; y boletines mensuales de Desco entre 1989 y el 2000); Censo por la Paz del PAR: 34,489

    (PAR 2001). Sin embargo, ninguna de esas fuentes construy una lista de vctimas identificadas por sus nombres, sus proyecciones se calcularonsobre la base de reportes de acciones violentas (aparecidas en medios de comunicacin, registradas en partes militares o policiales, o recordadas porlderes comunales) y de la cantidad aproximada de vctimas que causaron.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    10/35

    ANEXO 3

    PGINA10

    Descripcin

    Contiene informacin sobre vctimas de crmenes y violaciones de losderechos humanos. La informacin proviene del anlisis de 16,886testimonios recopilados por la CVR en cumplimiento de sus funciones.Comprende el perodo entre 1980 al 2000 y todo el territorio del Per.

    Sistematiza los expedientes de casos de violaciones de los derechoshumanos asumidos por alguna de las varias instituciones que componenla Coordinadora Nacional de Derechos Humanos. Comprende el perodode 1983 al 2000 y todo el territorio peruano.

    Contiene una lista de vctimas de crmenes y violaciones de los derechoshumanos ocurridos en el distrito de Chungui, provincia de la Mar en eldepartamento de Ayacucho. La lista fue elaborada con informacin detestimonios tomados en el mismo distrito por la institucin, con lacolaboracin con la Municipalidad del distrito de Chungui. Comprendeel perodo 1980-2000.

    Es un registro de vctimas de desaparicin forzada cuyos casos fueronasumidos por dicha institucin. Comprende el perodo 1982 a 1996 y

    todo el territorio peruano, pero principalmente los departamentos deAyacucho, Apurmac y Huancavelica.

    Sistematiza los expedientes de denuncias relacionadas con desaparicinforzada de personas y ejecuciones extrajudiciales presentadas ante elministerio pblico entre los aos 1983 y 1996. Adicionalmente se incluyenregistros derivados por algunas ONG, diferencindolos de los primeros.

    Es una lista de personas cuyo paradero se desconoce y que habran sidovctimas de crmenes o violaciones de los derechos humanos. La listafue elaborada con informacin entregada por los familiares de lasvctimas a la CICR. No consigna informacin sobre el presunto autor dela desaparicin.

    Bases de Datos

    Comisin de la Verdad y

    Reconciliacin (CVR)

    Coordinadora Nacional de

    Derechos Humanos (CNDDHH)

    Centro de Desarrollo

    Agropecuario (CEDAP)

    Comisin de Derechos Humanos

    (COMISEDH)

    Defensora del Pueblo (DP)

    Comit Internacional de la Cruz

    Roja (CICR)

    3.2. PROCEDIMIENTOSEGUIDOPARAELCRUCEDEDATOS

    El procedimiento seguido para crear la BDCIM tuvo dos etapas:

    3.2.1. Seleccin y acondicionamiento de los registros base

    Se seleccionaron de las bases de datos originales aquellos registros de personas muertas o desaparecidas con nombrescompletos (apellido paterno, apellido materno y nombres de pila)18 y se cre un formato comn al que se adapt toda

    la informacin seleccionada para poder compararla. Este formato estndar comn inclua, adems de los nombres yapellidos, los siguientes campos: el lugar donde ocurri la muerte o desaparicin (departamento, provincia, distrito,centro poblado), el ao de ocurrencia de los hechos, el agente perpetrador, la fecha de nacimiento de la vctima y lasituacin de la vctima segn la fuente (muerta, desaparecida, viva). Asimismo, se crearon tablas de conversin entrelos cdigos de los campos con valores cerrados (cdigos geogrficos, de situacin de la persona, etc.) y los valoresestandarizados para estos campos.

    Para evitar problemas por diferencias en la escritura de ciertos nombres y apellidos, sobre todo en quechua u otrosidiomas nativos, se cre una tabla estandarizada de nombres y apellidos (tabla de nombres cannicos) 19 que se uspara ordenar el listado.

    18 Los registros que no incluan todos esos elementos de identificacin de las personas fueron excluidos puesto que no en todos los casos se dispona

    de informacin para distinguir entre homnimos, lo que hubiera sesgado el anlisis final.19 De esta forma, los registros de vctimas con apellidos como Llanque o Yanque; Curo, Kuro o Curi (que podan ser la misma persona) aparecan

    juntos en el listado ordenado alfabticamente.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    11/35

    CUNTOS PERUANOS MURIERON?

    PGINA11

    Finalmente, ms all de los formatos comunes que fueron estandarizados, se diseo un sistema de consulta de losexpedientes digitales de cada una de las bases de datos, con el objetivo de que los analistas puedan acceder a lainformacin completa de cada una de las fuentes para compararlas entre s y poder resolver las divergencias o losdatos poco claros.

    3.2.2. Cruce de informacin en serie

    Para determinar qu registros de cada base de datos correspondan a qu otros del resto de otra base de datos, sedispuso todos los registros estandarizados en una lista comn, la cual poda ordenarse bajo diferentes criterios20 a finde ubicar registros similares. La decisin sobre si dos o ms registros se referan a la misma persona fue tomada porlos miembros de un equipo de analistas del rea de Sistemas de Informacin de la CVR, quienes examinaron toda lainformacin disponible en todas las bases de datos.

    El trabajo de cruce de informacin en serie fue realizado por dos equipos en forma simultnea, cada uno de ellostrabaj sobre los mismos datos independientemente. Esto permiti que cada decisin sobre si dos o ms personaseran la misma fuera tomada por ms de un analista; de esa forma podamos controlar los posibles sesgos debidos aque un analista en particular usara criterios diferentes a otro para tomar sus decisiones. En fin, la tasa de acuerdo

    entre las decisiones de los equipos fue del 94%, lo que implica un nivel de confiabilidad muy alta para los estndaresde las ciencias sociales.

    3.3. AGRUPACINDELOSRESULTADOS

    Luego de finalizado el cruce de informacin y una vez creada la BDCIM, para efectos de la EMS, se identificaron losregistros base segn si provenan del trabajo de la CVR, de una ONG de defensa de los derechos humanos o delMinisterio Pblico. Para ello se crearon las siguientes variables dicotmicas:21

    s CVR: La persona est registrada en la base de datos de la CVR.s DP: La persona est en los registros de la base de datos de la Defensora del Pueblo que provienen de los

    expedientes del Ministerio Pblico.s ODH: La persona est registrada ya sea en la base de datos de la CNDDHH, CEDAP, COMISEDH, CICR, o

    forma parte del grupo de casos de la base de datos de la Defensora del Pueblo que no provienen de expedientesdel Ministerio Pblico y que le fueron proporcionados por alguna ONG.

    Los resultados finales se muestran en la tabla 3:

    Tabla 3

    20 Por ejemplo por apellidos y luego nombres de pila, por lugares de ocurrencia de los hechos y nombres, por nombres de pila y apellidos, etc. Cadauno de los posibles ordenamientos fue explorado con el fin de maximizar la deteccin de registros similares.21 Donde 1 indica que la persona est registrada en la fuente correspondiente y 0 que no est registrada.

    S 1,184 627 554 3,888No 1,140 2,532 1,639 ??S 23 105 59 8,768No 2 251 35 ??S 7 34 10 3,138No 76 571 49 ??

    24,692

    11,564

    9,243

    3,885

    TOTAL

    BASE DEDATOS CVR

    PER 1980 - 2000, MATRIZ DE CRUCE DE INFORMACIN: NMERO DE VCTIMAS FATALES REPORTADAS,SEGN AGENTE RESPONSABLE, POR PRESENCIA O AUSENCIA EN ALGUNA DE LAS FUENTES DEINFORMACIN ANALIZADAS

    BASE DEDATOS DP

    TOTAL DEVCTIMAS

    REPORTADAS

    BASE DEDATOS CVR

    BASE DEDATOS CVROTR

    SLU

    EST

    SS No No

    S NoBASES DE DATOS ODH

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    12/35

    ANEXO 3

    PGINA12

    El total de vctimas de todos los agentes que fueron reportadas en el conjunto de los tres sistemas asciende a24,692.

    Existen 1,184 vctimas fatales atribuidas a los agentes del Estado y fuerzas contrasubversivas que fueron reportadasen los tres sistemas (CVR, DP y ODH), y un total de 11,565 vctimas atribuidas a estos agentes reportadas en una o msbases de datos, lo que representa el 47% de vctimas documentadas en la fuentes analizadas.

    Es interesante resaltar que del total de vctimas documentadas atribuidas a los agentes del Estado y fuerzas contra-subversivas, 33% corresponden a registros que slo aparecen en la base de datos de la CVR. Por otro lado, el 95% y el80% de las vctimas documentadas que seran responsabilidad del PCP-SL o de otros agentes, respectivamente, aparecenexclusivamente en la base de datos de la CVR.

    Como se deduce de la tabla 3, en comparacin a los otros tipos de fuentes, la CVR es el proyecto de registro deinformacin que incorpora una mayor heterogeneidad en cuanto al tipo de perpetrador se refiere. La razn de esasdiferencias puede encontrarse en las caractersticas del mandato o de los objetivos institucionales que estn detrs decada proyecto o fuente de informacin. La CVR tena como mandato investigar todos los crmenes y violaciones de losderechos humanos cometidos entre 1980 y el 2000, independientemente del agente o responsable que los hayacometido. Los organismos de derechos humanos y el Ministerio Pblico, no tenan la posibilidad de realizar investiga-ciones a gran escala de los hechos,22 de tal forma que se constituyeron principalmente en receptores de denuncias, fun-

    damentalmente de vctimas o familiares de vctimas de la accin de los agentes estatales involucrados en la luchacontrasubversiva. Este nfasis particular se debe al hecho de que son los Estados y no los grupos subversivosquienes han firmado compromisos internacionales que los obligan a respetar los derechos humanos y sancionar suvulneracin.23

    4. PROCEDIMIENTOSDEESTIMACIN

    En esta seccin expondremos en detalle el procedimiento empleado para calcular los estimados del total de vctimascausadas por el conflicto armado interno. En primer lugar, presentaremos brevemente los fundamentos de la EMS,incluyendo los supuestos y las limitaciones de esta metodologa; asimismo veremos cmo, para este proyecto en

    particular, esas limitaciones y supuestos nos plantearon la necesidad de estratificar las diferentes divisiones polticasdel Per en forma creativa.

    En segundo lugar, describiremos cmo se definieron los modelos que sirvieron para el clculo de los estimados delos datos agregados de varias categoras de perpetradores. El objetivo de ese proceso fue definir modelos para elclculo de los estimados de forma tal que se aproveche al mximo la riqueza de la informacin disponible sobre lasvctimas fatales atribuidas a los agentes del Estado.24

    Seguidamente, discutiremos los procedimientos empleados para seleccionar los modelos ms apropiados para elclculo de las estimaciones.

    En cuarto lugar, presentaremos el mtodo que empleamos para estratificar las divisiones polticas del Per, con elfin de permitir una definicin de modelos ptima dentro de cada estrato.

    Luego, describiremos una tcnica de estimacin de la varianza llamada jackknifing y explicaremos su uso para

    calcular los intervalos de confianza de los estimados del nmero de vctimas atribuidas al PCP-SL y a los otrosagentes.

    Finalmente, en el apndice 1 del presente documento se revisarn varias tcnicas de verificacin de los estimadoscalculados, incluyendo la comparacin entre dos conjuntos distintos de estimaciones para cada grupo perpetrador,as como un anlisis de la distribucin de los diferentes tipos de modelos que resultaron seleccionados a lo largo delprocedimiento de estimacin.

    22 Algo muy difcil de hacer durante los momentos ms intensos del conflicto.23 Para una mayor discusin sobre el tema, vase el apartado correspondiente al Movimiento de derechos humanos en el tomo III de esteInforme.24 Como se ve en la tabla 3, las vctimas atribuidas a los agentes del Estado son las que aparecen documentadas en ms fuentes de informacin.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    13/35

    CUNTOS PERUANOS MURIERON?

    PGINA13

    4.1. TEORADELA EMS, LIMITACIONESYSUPUESTOS25

    Como se explic anteriormente, la EMS es una tcnica que utiliza varias listas incompletas de la poblacin, recolectadasen forma separada y que se superponen, con el objetivo de estimar un conteo de las unidades de la poblacin que nofueron capturadas por ninguna de esas listas.

    La forma ms bsica de esta tcnica es conocida como el procedimiento de captura yrecaptura, y se utiliza cuandoslo se dispone de dos listas. Un ejemplo sencillo de ello puede apreciarse en el diagrama de Venn de la ilustracin 1.

    Ilustracin 1

    Ejemplo de captura y recaptura con 2 listas

    El supuesto bsico utilizado para estimar el tamao de la poblacin con esta tcnica consiste en afirmar que raznentre el nmero de personas capturadas en ambas listas (lista 1 y lista 2) y el nmero de personas capturadas en la lista

    1, es proporcional a la razn entre el nmero de personas capturadas en la lista 2 y del nmero de personas en elconjunto de la poblacin. En este ejemplo, eso quiere decir que:

    25 Algunas partes de esta seccin aparecen en Ball y Asher (2002) y Ball (2000).

    26

    4N

    Donde N, el nmero total de personas en la poblacin, es una incgnita. El valor estimado de N es entoncestomado de la integral que ms se acerca a la solucin para Nen su igualdad,

    N = 4x 62

    12

    Lista 2

    Lista 1

    Nocapturados

    Capturados sloen la Lista 2

    Capturados sloen la Lista 1

    Nocapturados

    Capturados en lasListas 1 y 2

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    14/35

    ANEXO 3

    PGINA14

    Una explicacin ms tcnica de cmo el nmero de miembros no capturados de la poblacin es estimado consisteen decir lo siguiente: Consideremos el caso de dos proyectos, P1 (una lista de A individuos) y P2 (una lista de Bindividuos), cuyas bases de datos tienen una superposicin de tamaoM, en un universo total de tamao N. Nteseque si todos los miembros del universo tienen la misma probabilidad de aparecer en la lista 1, la probabilidad de quecualquier individuo sea reportado por P1 ser:

    AN

    Pr(captura en la lista 1)

    En forma similar, si todos los miembros del universo tienen la misma probabilidad de aparecer en la lista 2,entonces la probabilidad de que cualquier individuo sea capturado por P2 ser:

    B

    NPr(captura en la lista 2)

    Si esas dos probabilidades son independientes, entonces la probabilidad de que una persona sea capturada enambas bases de datos ser:

    N

    MPr(captura en lista 1 y lista 2)

    Por definicin, la probabilidad de un evento compuesto por dos eventos independientes es el producto de lasprobabilidades de estos ltimos, entonces tenemos que:

    Pr(captura en lista 1 y 2) = Pr(captura en lista 1) x Pr(captura en lista 2)

    Intercambiando los trminos, encontramos que:

    Pr(ca tura en lista 1 = Pr(ca tura en lista 1 2 / Pr(ca tura en lista 2

    Lo que se reduce a:

    Pr(captura en lista 1)N

    A

    Pr(captura en lista 1)N

    M

    B

    MB

    N

    Combinando la primera relacin:

    con los resultados previos, nos da:

    AN B

    N

    y por lo tanto:

    NM

    AB

    Hay muchos supuestos implcitos en esta simple solucin de razones. Por ejemplo, asumimos que una lista nuncatiene a un individuo reportados dos veces y que el cruce entre las listas es preciso. En este proyecto, los dos ltimos

    supuestos fueron controlados durante el proceso de organizacin de los datos y la fase de cruce de listas; se hicieronpruebas de consistencia tanto durante el proceso de depuracin de registros duplicados (dentro de cada lista) como alo largo de la fase de cruce de listas (a travs de las diferentes listas).

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    15/35

    CUNTOS PERUANOS MURIERON?

    PGINA15

    Otros supuestos inherentes al modelo de captura y recaptura implican que los individuos no estn entrando osaliendo del universo durante el proceso de creacin de las listas, y que stos han sido seleccionados de la poblacin alazar. En los proyectos relacionados a la problemtica de los derechos humanos, el primer supuesto es, a menudo,irrelevante, mientras que el segundo no se cumple y por lo tanto debe ser reemplazado por el supuesto que losresultados son robustos en relacin al proceso de muestreo.

    Otro supuesto claramente esbozado lneas arriba es que no hay dependencia entre las listas, en otras palabras, que laprobabilidad de que un individuo sea capturado en la lista 2 es independiente de que ese individuo sea capturado enla lista 1. El supuesto final es la homogeneidad: los individuos que componen el universo tienen la misma probabilidadde ser capturados en cualquier lista.

    Si cualquiera de estos supuestos es violado, la tcnica de captura y recaptura no permitir hacer un estimadoadecuado del tamao de la poblacin. Si existieran listas adicionales de miembros de la poblacin que se est estudian-do, los problemas arriba mencionados de dependencia o heterogeneidad podran resolverse mediante la elaboracinde modelos, que es justamente lo que hacemos ms adelante. Usando la poblacin del ejemplo sencillo descrito lneasarriba, aadimos una tercera lista al diagrama de Venn que presentamos a continuacin:

    Ilustracin 2

    Ejemplo de Estimacin de Mltiples Sistemas

    Lista 1 Lista 2

    Lista 3

    Capturados sloen la Lista 1 y 2

    Capturado porlas tres listas

    Capturados slo

    en la Lista 1

    Capturados sloen la Lista 1 y 3

    Capturados sloen la Lista 3

    No capturados

    Capturados sloen la Lista 2 y 3

    Capturados sloen la Lista 2

    En este caso, podemos crear modelos de las interdependencias entre las tres listas mediante el uso de modelos log-lineales (con restricciones) de la siguiente manera: 26

    26 En donde el subndice i (as comoj o k) para un conteo determinado ser igual a 0 (cero) si no incluye a individuos de la lista i (oj, o k). Por elcontrario si los incluyese, i sera igual a 1.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    16/35

    ANEXO 3

    PGINA16

    log(m ) =ijk u + u1(i) + u2(j) + u3(k) + u12(ij) + u13(ik) + u23(jk)

    Intercepcin Parmetro de lalista 2

    Interaccin entrelistas 1 y 2

    Interaccin entrelistas 2 y 3

    Conteo: por ejm.m = 1111

    Parmetro dela lista 1

    Parmetro dela lista 3

    Interaccin entrelistas 1 y 3

    Si presumimos que no existe dependencia entre las listas, utilizamos solo los cuatro primeros trminos a la derechade la frmula. Si creemos que slo hay dependencia entre la primera y la segunda lista, aadimos el primer trminode interaccin, y as sucesivamente. De esta forma, podemos elaborar un modelo reducido para calcular las estimaciones(uno que tenga pocos parmetros). Ajustando los datos de nuestro ejemplo a un modelo con un trmino de interaccinentre las listas 1 y 3, obtenemos como estimado para el tamao de la poblacin la cantidad de 12 personas.

    Existen otros modelos que dan cuenta de diferentes formas de heterogeneidad. Algunas otras transgresiones delos supuestos de las tcnicas de estimacin pueden enfrentarse mediante procedimientos de modelacin, mientras

    que en determinadas situaciones, las transgresiones son tan mnimas que podemos ignorarlas.Sin embargo, a menudo las transgresiones de los supuestos se vuelven demasiado complicadas como para que la

    estimacin de mltiples sistemas las pueda incorporar, especialmente si slo disponemos de tres listas. Por ejemplo,los patrones de heterogeneidad de capturas pueden ser tan complejos que no podran ser modelados mediante unsistema de tres listas. En esos casos, el resultado final ser un modelo que no representa o no se ajusta adecuadamentea los datos. El indicador de la bondad de ajuste de estos modelos es la probabilidad del valor de la estadstica de X2. Siesa probabilidad es muy baja, el modelo subrepresenta a los datos y no describe adecuadamente a la poblacinfaltante. Anlogamente, si la probabilidad de X2 es muy alta, el modelo est sobreajustado y no se puede utilizar.27

    Cuando ninguno de los modelos es apropiado, una opcin es estratificar a la poblacin, utilizando para elloalguna variable que sea capaz de reflejar las razones que se encuentran detrs de la heterogeneidad de las probabilidadesde que un determinado individuo sea capturado en alguna listas (vase, por ejemplo, Sekar y Deming 1949). En el

    caso de datos sobre crmenes y violaciones a los derechos humanos, si alguna informacin indica que los hechosocurridos en algunas regiones tienen mayores probabilidades de ser reportados que aquellos que sucedieron en otrasregiones, podemos adoptar la estrategia de hacer estimaciones de vctimas para esas regiones en forma separada. Sinembargo, si creamos demasiados estratos, las frecuencias observadas en las tablas resultantes podran estar muydiseminadas28 como para que la estimacin de mltiples sistemas pueda funcionar adecuadamente.

    27 El sobreajuste ocurre cuando el modelo tiene un ajuste muy cercano a los datos y por lo tanto representa a esos datos y slo a ellos. En la medidaque el nmero de parmetros utilizados para ajustar el modelo se aproxima al nmero de celdas de la tabla, toda la informacin disponible seutiliza para el ajuste del modelo y no queda nada de informacin para el estimado. El objetivo del anlisis es encontrar un modelo que tenga unajuste razonable pero no tan cercano como para provocar que el mismo modelo fracase en representar datos diferentes que describan el mismofenmeno.28 Las frecuencias en una tabla de EMS se consideran diseminadas si varias de las celdas de la tabla tienen frecuencias observadas iguales a cero. Si

    bien los modelos log-lineales pueden adaptarse a algn grado de diseminacin, existen pocos modelos que puedan tener un ajuste adecuado parauna tabla diseminada.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    17/35

    CUNTOS PERUANOS MURIERON?

    PGINA17

    Es difcil alcanzar un punto de estratificacin lo suficientemente apropiado como para mitigar el efecto de laheterogeneidad de los patrones de captura, sin que ello signifique sobreestratificar los datos y, por lo tanto, creartablas de estimacin demasiado diseminadas.

    En el caso de los datos sobre el Per entre 1980 y el 2000, lo que se busca son dos tipos de estratificacin: en primerlugar, una de carcter geogrfico, de tal manera que se pueda controlar el efecto de la heterogeneidad de captura de

    los reportes de vctimas; en segundo lugar, una estratificacin por tipo de agente perpetrador, con el fin de determinarla proporcin de vctimas imputables al PCP-SL, las fuerzas contrasubversivas y los otros agentes. Sin embargo, lainformacin disponible para las vctimas atribuibles al PCP-SL y los otros agentes est bastante diseminada (como sevio en la tabla 3, ms arriba). La solucin adoptada para enfrentar el problema de la diseminacin de la informacin,as como el procedimiento utilizado para estratificar geogrficamente los datos, se describen en las siguientes seccionessobre Seleccin de modelos y Diseo de los estratos geogrficos.

    4.2. SELECCINDE MODELOS

    El mtodo ideal para estimar el total de vctimas imputables a cada tipo de perpetrador consistira en estratificar losdatos utilizando simultneamente las variables geogrfica y de tipo de perpetrador, y, luego, escoger el modelo que seajuste mejor para cada perpetrador al interior de cada uno de los estratos. Ello no es posible debido al problema dediseminacin de los datos sobre las vctimas atribuidas al PCP-SL y los otros agentes, que mencionbamos ms arriba.Con el fin de reducir esta diseminacin y aprovechar las ventajas que ofrece disponer de mucha informacin en diferentesfuentes acerca de los casos atribuidos a los agentes del Estado, se crearon los siguientes conjuntos de agentes perpetradores:

    s Agentes del Estado y fuerzas contrasubversivas {EST}s Agentes del Estado y fuerzas contrasubversivas y PCP-SL {EST+SLU}s Agentes del Estado y fuerzas contrasubversivas y otros perpetradores {EST+OTR}s Todas las vctimas fatales documentadas {EST+SLU+OTR}

    {EST} representa las vctimas fatales atribuidas a los agentes del Estado y fuerzas contrasubversivas, {EST+SLU}representa las vctimas imputadas ya sea a los agentes del Estado o al PCP-SL, y as sucesivamente. El cuarto conjuntode la lista es utilizado nicamente para verificar la validez de nuestros modelos (vase el apndice 1), pero los tresprimeros sirven para calcular los estimados de cada estrato geogrfico de la siguiente manera:

    EST = {EST}SLU = {EST+SLU} - {EST}OTR = {EST+OTR} - {EST}

    Existen siete modelos posibles para cada estrato geogrfico y para cada uno de los cuatro conjuntos de gruposperpetradores: un modelo que asume que existe independencia entre las fuentes de informacin (CVR, DP, ODH),tres modelos que asumen interaccin entre slo dos de esas fuentes de informacin y tres modelos que asumen dos

    pares de interacciones. Esquemticamente, si decimos que CVR = a; DP = b; y ODH = c:

    Modelo Notacin Tipo

    Modelo 1 a + b + c Independencia de las fuentes

    Modelo 2 a + b + c + ab

    Modelo 3 a + b + c + ac

    Modelo 4 a + b + c + bc

    Modelo 5 a + b + c + ab + bc

    Modelo 6 a + b + c + ab + ac

    Modelo 7 a + b + c + ac + bc

    Dos pares de fuentes dependientes

    Dependencia entre dos fuentes

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    18/35

    ANEXO 3

    PGINA18

    Debemos entonces elegir cul de estos modelos es el mejor. Para ello, primero debemos descartar aquellos modeloscuyo ajuste, determinado por la estadstica de X2, es inadecuado. Eso significa que slo tomaremos en cuenta losmodelos que tienen un valor de X2 cuya probabilidad se encuentre entre 0.01 y 0.5. Posteriormente, escogemos elmodelo que minimiza la estadstica de X2 dividida entre los grados de libertad; esto nos permite equilibrar el dobleobjetivo de obtener un modelo con un ajuste razonable y que tambin pueda interpretarse de la manera ms simple

    posible.29

    4.3. DISEODELOS ESTRATOS GEOGRFICOS

    A lo largo del proceso de investigacin, se hizo lo posible por asignar los cdigos geogrficos ms precisos y detalladosposibles para localizar los hechos que causaron las vctimas fatales documentadas en este estudio. Para ello, se utilizla codificacin estndar de ubigeos del Instituto Nacional de Estadstica e Informtica,30 que nos permite llegar hastael nivel de centro poblado.31

    Sin embargo, dividir y distribuir los datos en demasiados pedazos (por ejemplo, un estrato por cada distrito

    donde se reportaron vctimas) tendra como resultado la configuracin de tablas con frecuencias muy diseminadasque seran difciles de ajustar en los modelos. Por otro lado, trabajar con divisiones geogrficas muy amplias (porejemplo, un estrato por departamento) implicara que los modelos resultantes tendran un pobre ajuste, debido a lamultitud de heterogeneidades e interdependencias que se fundiran indistintamente al estar comprendidas enestratos que conglomeran muchas localidades.

    Nuestro objetivo al estratificar geogrficamente los datos fue el de mantener unidades territoriales que tengansentido y, al mismo tiempo, evitar que la informacin se disemine demasiado; ello implicaba un proceso de modu-lacin de la estratificacin en diferentes etapas. Durante el proceso de divisin de la informacin, se dio prioridad ala formacin de estratos que mantuvieran una continuidad geogrfica (basada sobre las subdivisiones polticas delPer) y que pudieran ser modeladas adecuadamente. De esa forma, empezamos un nivel bastante general de divisingeogrfica, distribuyendo a los departamentos en tres grandes grupos:

    s La regin amaznica (Loreto, Ucayali, y Madre de Dios).s Los departamentos que se ubican a lo largo de la costa (Tumbes, Piura, Lambayeque, La Libertad, Ancash,

    Callao, Lima, Ica, Arequipa, Moquegua, Tacna).s Los departamentos que comprenden la regin de la sierra (Cajamarca, Amazonas, San Martn, Hunuco,

    Pasco, Junn, Huancavelica, Ayacucho, Apurmac, Cusco, Puno).

    Si un modelo tena un buen ajuste para la tabla resultante de esa agrupacin de departamentos, y si en cambio laaplicacin de subdivisiones adicionales hubiera producido tablas demasiado diseminadas, no bamos ms all. En casocontrario, probbamos separando los departamentos previamente agrupados. Si luego de esta etapa, los departamentoscontinuaban teniendo un nmero importante de vctimas reportadas, pasbamos a un segundo nivel de divisiones,intentando agrupar, esta vez, conjuntos de provincias y buscando siempre un buen ajuste de los modelos. En algunos

    casos (como el de San Martn), las provincias fueron divididas en ms grupos y, luego, agregadas a otros departamentosadyacentes (vanse los estratos 12, 13, 14 y 58 el mapa 1 correspondientes y la tabla del apndice 3).En otros casos, algunas provincias seguan teniendo un nmero importante de vctimas reportadas, por consiguiente,

    fueron a su vez subdivididas en grupos de distritos. Muchos distritos eran autorrepresentativos(especialmente enAyacucho); en esos casos se convirtieron directamente en estratos.

    Finalmente, en varios de los casos de vctimas documentadas faltaba la informacin sobre su ubicacin geogrficaprecisa. Esos casos fueron sustrados completamente del procedimiento de estimacin. Mientras se iba estratificando,aquellas vctimas documentadas que contaban con el cdigo geogrfico necesario para ser ubicadas en un estratoespecfico permanecan dentro del grupo de casos utilizados para hacer la estimacin. Pero cuando se detectaba que

    29 Para ms informacin sobre este mtodo de seleccin de modelos, vase: Ball, Betts, Scheuren, Dudukovich y Asher (2002).30 INEI. Vase: 31 Los niveles de demarcacin poltica que representan los ubigeos del INEI son: departamento, provincia, distrito, centro poblado.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    19/35

    CUNTOS PERUANOS MURIERON?

    PGINA19

    un caso en particular no contaba con el cdigo correspondiente para ser considerado en un estrato determinado, se loexclua del proceso. Por ejemplo para casi la totalidad de los casos, se conoca el departamento donde ocurrieron loshechos, sin embargo, cuando el proceso de estratificacin nos llevaba a fragmentar los datos de un departamento enestratos ms pequeos (provincias o distritos), los casos que no podan ser ubicados en esos niveles eran dejados delado en el clculo de la estimacin.

    La estratificacin final puede apreciarse en el mapa1 y la tabla completa en el apndice 3. Tmese nota de que lamayora de los departamentos que se ubican a lo largo de la costa forman parte de un estrato que no mantiene sucontinuidad geogrfica y que est partido en dos, con los estratos correspondientes a Ancash y a Lima en medio.

    La elaboracin de modelos y la estratificacin fueron procesos simultneos, pero nicamente se utiliz el ajuste delmodelo y no la magnitud del estimado para determinar si un estrato deba ser considerado como autorre-presentativo. Los estratos con datos muy diseminados y con un pobre ajuste del modelo fueron agregados a otrosestratos a lo largo del proceso; los estratos que no tenan datos diseminados fueron nuevamente desagregados enunidades ms pequeas. En dos casos encontramos modelos lmite (modelos en donde la probabilidad del valor de X2

    era ligeramente inferior a 0.01 o ligeramente mayor a 0.50) que fueron aceptados como vlidos para el clculo de{EST+SLU+OTR}; ya que este conjunto de perpetradores fue utilizado para el proceso de verificacin de modelos,ms no para hacer estimaciones de totales de vctimas.

    Cuando se logr culminar la configuracin del conjunto definitivo de estratos, se procedi a examinar los estimadoscalculados. Si en el transcurso de ese anlisis los estimados para {EST}, {EST+OTR}, {EST+SLU} y {EST+SLU+OTR}daban como resultado estimados negativos para SLU u OTR, y ms de un modelo tena una probabilidad entre 0.01 y0.5, se proceda entonces a utilizar el modelo que contaba con el menor valor para la estadstica de X2, dividida entrelos grados de libertad correspondientes. En un caso el estrato 9 no hubo ningn otro modelo con un ajusteaceptable, por lo que se adopt el estimado negativo. 32

    Respecto del mapa 1 es interesante anotar el gran nmero de estratos definidos para el departamento de Ayacucho.Ello se debe al hecho que muchos de los distritos de esa localidad se convirtieron directamente en estratosautorrepresentativos debido a la abundancia de informacin sobre vctimas documentadas.

    32 Hubieron dos situaciones con estimados negativos (la estimacin del total y del estimado para OTR en el estrato 9). En estos casos se equipararonlos estimados negativos al valor del nmero de vctimas fatales documentadas en los sistemas para ese estrato. Existen tambin cuatro estratos deperpetradores en los cuales se seleccion el segundo mejor modelo, como se describe en el texto.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    20/35

    ANEXO 3

    PGINA20

    Mapa 1

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    21/35

    CUNTOS PERUANOS MURIERON?

    PGINA21

    En el mapa 2 presentamos los estimados para el nmero de vctimas correspondiente a cada uno de los estratos.Como se aprecia, al igual que en el anlisis de las muertes y desapariciones documentadas, el nmero ms alto devctimas estimadas est concentrado en las regiones centrales de los andes peruanos.

    Mapa 2

    Leyenda

    N

    de vctimas

    PER: N DE VCTIMAS FATALES ESTIMADAS SEGN ESTRATOS DEFINIDOS PARA LA EMS

    51 - 500

    501 - 1000

    1001 - 2000

    2001 - 4000

    4001 - 9109

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    22/35

    ANEXO 3

    PGINA22

    4.4. CLCULODELOS INTERVALOSDE CONFIANZA

    Calcular estimados para el nmero total de vctimas fatales por cada categora de perpetradores EST, SLU y OTRno es suficiente para determinar si un grupo perpetrador es responsable de un nmero mayor de vctimas que otro.Para responder esta pregunta, es necesario calcular el error estndar y los intervalos de confianza correspondientes alos estimados de las vctimas atribuidas a los grupos perpetradores.33

    Bishop, Fienberg y Holland (1975) proporcionan un conjunto de frmulas para estimar el error estndar paraestimados derivados de cualquiera de los modelos log-lineales descritos previamente. Utilizando esas frmulas,podemos calcular los errores estndar y, por lo tanto, los intervalos de confianza para los estimados de EST. Sinembargo, hacerlo para SLU y OTR es ms complicado debido a que stos se derivan de la diferencia entre dosestimados.

    Si bien podemos calcular errores estndar para {EST}, {EST+OTR} y {EST+SLU} en forma separada, estos estimadospor s solos no pueden ser empleados para determinar el error estndar de sus diferencias, puesto que para ello esnecesario conocer cul es su covarianza y sta es desconocida.34 De la misma forma, los errores estndar de SLU-EST,EST-OTR y SLU-OTR, deben tomar en cuenta las covarianzas entre los estimados de los diferentes grupos deperpetradores. Se debe entonces emplear una tcnica de estimacin de la varianza para poder calcular valoresestimados para los errores estndar de SLU, OTR, SLUEST, ESTOTR y SLUOTR. Decidimos emplear la tcnicaconocida comojackknifing.

    Se crearon vectores de estimados denominado . Para ello se dej de lado de manera sucesiva cada observacink, calculando nuevamente el valor en cuestin. El vector fue transformado en pseudo valores de la siguiente manera:

    Para todos los k. El promedio de los pseudo valores es:

    Este promedio es utilizado para calcular el error estndar del estimado que nos interesa de la siguiente manera:

    Donde es el nmero de vctimas fatales estimadas por el mtodo de diferencias explicado en la seccin 4.2. Paramayor informacin sobre la tcnica dejackknifing, se puede consultar Ball (2000).

    Cuando se agregan estratos de nivel inferior (por ejemplo distritos) para obtener estimados de niveles superiores(g), ya sea provincias, departamentos o el conjunto del pas, el clculo de los errores estndar respectivos debe realizarsetomando en cuenta la raz cuadrada de la sumatoria al cuadrado de las varianzas de los estimados de los estratosoriginales:

    33 Para ello utilizamos la frmula estndar para el clculo de los intervalos de confianza al 95%: estimado 2 (Error Estndar).34 Para cualesquiera estimados de X e Y, la varianza de X-Y es igual a la varianza de X ms la varianza de Y, menos 2 veces la covarianza de X e Y. Ladesviacin estndar de X-Y es la raz cuadrada de este resultado.

    De esta forma fue posible calcular los intervalos de confianza para las siete regiones representadas en los grficos1, 2 y 3, as como los correspondientes a todo el pas. Si bien esta sumatoria deja de lado las covarianzas entre losestratos que se fundieron en uno solo, es lgico asumir que estas covarianzas son cero o, a lo sumo, mnimas.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    23/35

    CUNTOS PERUANOS MURIERON?

    PGINA23

    Datos totalmente diferentes se prepararon para los distintos modelos en cada uno de los estratos. Sin embargo,algunos de estos datos podan provenir de las mismas fuentes de informacin (por ejemplo, un declarante que reportavctimas diferentes en dos estratos distintos), por lo que podran estar potencialmente correlacionados. De existirrealmente estas correlaciones seran mnimas.

    Para los objetivos del presente estudio, la sobreestimacin sugiere la validez de una de las conclusiones que pre-

    sentamos en este documento: para el conjunto del pas y para el perodo comprendido entre 1980 y el 2000, el nmerode vctimas fatales atribuidas al PCP-SL es significativamente mayor que aqul atribuido a los agentes del Estado yfuerzas contrasubversivas o a los otros agentes.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    24/35

    ANEXO 3

    PGINA24

    APNDICE 1: VERIFICACINDELOSMODELOS

    Los procedimientos de verificacin de la validez de los modelos elaborados, constituyen una parte fundamental de todo anlisisestadstico que se considere riguroso. A continuacin presentamos los resultados de cuatro mtodos de verificacin utilizados eneste estudio: comparacin de conjuntos de estimados, comparacin de coeficientes de variacin; anlisis de patrones de seleccin

    de modelos; anlisis de la relacin entre casos documentados y no documentados.

    A. Comparacin de conjuntos de estimados

    La verificacin de los modelos empez desde el momento mismo de la seleccin de los modelos. Para el presente estudio, seescogieron los modelos que debamos emplear para calcular las estimaciones tratando de minimizar la estadstica de X2, divididaentre los grados de libertad. Esto se hizo con el fin de equilibrar los dos objetivos principales del anlisis: simplicidad interpretativadel modelo y calidad del ajuste.

    A pesar de ello, siempre es importante contar con algn mtodo de validacin externa para los estudios que desarrollanprocedimientos de estimacin. Como no contbamos con estimaciones externas acerca del nmero de vctimas fatales provocadas porcada agente perpetrador, tuvimos que disear la cantidad de modelos lo suficientemente necesaria como para crear dos estimadospara cada nmero de vctimas en cada estrato. Para llevar a cabo esta tarea, creamos cuatro conjuntos de estimados: un conjunto slopara EST, otro conjunto para EST+SLU, otro para EST+OTR y otro ms para EST+SLU+OTR = Total de vctimas. El resultado final

    fueron dos conjuntos de estimados para cada categora de agentes perpetradores, tal y como se muestra en la tabla 4:

    Tabla 4

    LISTA DE ESTIMACIONES DESARROLLADAS

    Desde el principio se asumi que utilizaramos el Estimado 1 como la estimacin directa del nmero de vctimas fatales y elEstimado 2 como un verificador de ese nmero. En tal sentido, pudimos comparar los dos conjuntos de estimaciones para cadacategora de perpetradores y de esa forma analizar qu tan cerca estaban uno del otro. Los tres primeros diagramas de caja delgrfico 4 nos presentan los pares de estimados log-lineales que corresponden a las tres categoras de agentes perpetradores. Comose ve, por lo general las distribuciones son muy parecidas.

    Adicionalmente, el cuarto diagrama de cajas muestra la distribucin de las diferencias relativas entre los pares de estimaciones.stas se calculan empleando la siguiente frmula:

    Diferencia relativa = (Estimado 1 Estimado 2) / Estimado 1

    En un mundo ideal, tales diferencias deberan ser iguales o muy cercanas a cero; la razn por la cual las dividimos por el valordel Estimador 1 es para estandarizar los estimados grandes y pequeos, ponindolos en una escala comn. La mayor parte de las

    diferencias relativas son bastante pequeas, slo uno de los valores atpicos35 se ubica alrededor de -4, pero la mayora de lasdiferencias relativas son menores a 1.

    35 Valores atpicos: valores que estn fuera de los lmites esperables del diagrama de caja. Estos lmites se representan mediante las lneas horizontales que estn porencima o por debajo de las cajas. Entre ambas lneas se espera que estn contenidos casi el 100% de los casos. Los valores atpicos se representan mediante las bolitas queestn ms all de las lneas horizontales superior e inferior.

    Categoras deAgentes

    PerpetradoresEstimado 1 Estimado 2

    EST {EST} {EST+OTR+SLU} {EST+OTR} {EST+SLU} + 2*{EST}

    SLU {EST+SLU} {EST} {EST+OTR+SLU} {EST+OTR}

    OTR {EST+OTR} {EST} {EST+OTR+SLU} {EST+SLU}

    ANEXO 3

    PGINA24

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    25/35

    CUNTOS PERUANOS MURIERON?

    PGINA25

    Grfico 4

    Distribucin de los Estimados Log-lineales para EST

    EST+SLU+OTR-EST+ORT-EST+SLU+2(EST)

    Distribucin de los Estimados Log-lineales para OTR

    Distribucin de los Estimados Log-lineales para SLU

    8

    6

    4

    2

    0

    0

    EST

    8

    6

    4

    2

    0

    0 0

    0

    EST+SLU-EST EST+SLU+OTR-EST+OTR

    8

    6

    4

    2

    EST+ORT-EST EST+SLU+OTR-EST+SLU

    2

    0

    2

    4

    0

    EST SLU OTR

    Diferencias relativas entre losEstimados

    B. Comparacin de coeficientes de variacin

    Otro mtodo de verificacin de los modelos empleados consiste en calcular los coeficientes de variacin (CV) de los estimados con lafinalidad de comparar el tamao de las desviaciones estndar en una escala comn. La frmula para el coeficiente de variacin es:

    Coeficiente de variacin = Desviacin estndar / Estimado

    En el grfico 5 presentamos la distribucin de los coeficientes de variacin para cada uno de los cuatro conjuntos de modelos.Como se ve, generalmente los coeficientes de variacin son pequeos, la mayora de ellos es menor a 0.4.

    CUNTOS PERUANOS MURIERON?

    PGINA25

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    26/35

    ANEXO 3

    PGINA26

    Grfico 5

    Coeficientes de Variacin de los Estimados

    0.

    2

    0.

    0

    0.

    4

    0.

    6

    0.

    8

    EST EST+SLU EST+ODS EST+SLU+ODS

    C. Anlisis de patrones de seleccin de modelos

    Un tipo distinto de verificacin nos llev a analizar los patrones de seleccin de modelos. Un lector escptico podra pensar que siel mismo modelo fue utilizado para calcular los cuatro estimados para un estrato en particular, los nmeros resultantes necesariamentetenderan ser complementarios. Por otro lado, si los cuatro estimados proviniesen del mismo modelo, significara que lasinterdependencias entre las tres fuentes de informacin son las mismas, lo que resulta inverosmil.

    Para proceder al anlisis, debemos determinar en cuntos estratos los cuatro estimados en juego se calcularon utilizando elmismo modelo (estimacin con modelos homogneos), y en cuntos se utilizaron por lo menos dos modelos (estimacin conmodelos heterogneos). Los resultados, mostrados en la tabla 5, sugieren que si bien existe una cierta tendencia a que los cuatroestimados sean calculados usando el mismo modelo, existe un nmero significativo de estratos en donde los clculos se hicieron atravs de por lo menos dos modelos distintos.

    Tabla 5

    NMERO DE ESTRATOS POR TIPO DEESTIMACI

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    27/35

    CUNTOS PERUANOS MURIERON?

    PGINA27

    Por otro lado, examinamos el nmero de veces que cada modelo fue seleccionado a travs de los estratos y los grupos deestimados para agentes perpetradores. Ello nos puede dar pistas adicionales acerca del tipo de relacin existente entre las tresfuentes de informacin empleadas (CVR, ODH y DP). La tabla 6 indica la frecuencia de seleccin de los modelos por estrato y portipo de estimado calculado:

    Tabla 6

    Independiente CVR+ODH+DP 2 1 0 0

    CVR*ODH 3 1 1 0CVR*DP 5 1 3 1ODH*DP 19 22 23 23

    CVR*ODH + ODH*DP 10 11 11 11CVR*ODH + CVR*DP 0 0 0 0CVR*DP + ODH*DP 18 21 19 22

    Dos interacciones

    MODELOS

    Una interaccin

    EST+OTR EST+SLU+OTREST+SLUEST

    ESTIMACIONES

    NMERO DE ESTRATOS SEGN MODELO ADOPTADO PARA LA ESTIMACIN, PORESTIMACIN

    Esta distribucin de modelos resulta interesante por varias razones: en primer lugar, los modelos seleccionados para estimarEST tienden a ser ms simples en comparacin a los otros estimados, puesto que en 29 estratos se escogi alguno de los cuatromodelos ms sencillos (el modelo independiente y los modelos con una interaccin).

    En segundo lugar, los modelos seleccionados con mayor frecuencia son aqullos en donde existe por lo menos una interaccinentre las listas de ODH y DP. Tal interdependencia resulta lgica si tomamos en cuenta que la mayora de casos para SLU y OTRprovienen del listado de la CVR. Ello es confirmado por la total ausencia de casos donde se haya utilizando el modelo CVR*ODH +CVR*DP. Este ltimo modelo representa la independencia de los datos entre ODH y DP, siempre y cuando se controle el efecto deCVR.

    En general, podemos decir que existe una fuerte relacin entre las listas que provienen de las organizaciones de derechoshumanos (ODH) y de la Defensora del Pueblo (DP),36 ello puede responder a que estas instituciones sistematizaron sobre todoinformacin acerca de vctimas atribuidas a los agentes del Estado y registraron relativamente pocos datos sobre las acciones delPCP-Sendero Luminoso y otros actores del conflicto armado interno. En tal sentido, las probabilidades de captura en alguna deestas dos listas cambian radicalmente si la vctima se le atribuye a EST, SLU u OTR, a diferencia de la lista de la CVR, donde esasprobabilidades son mucho ms homogneas.

    D. Relacin entre casos documentados y no documentados

    Finalmente, nos fijamos en la relacin entre los casos documentados y no documentados que resulta de los estimados calculados.Esta relacin se mide utilizando la siguiente frmula:

    Nmero estimado de casos no documentados / Nmero de casos documentados

    Si bien no esperbamos que esta ratio fuese consistente a travs de los estratos, tenamos inters en verificar la existencia decasos atpicos y determinar, para el conjunto del pas y de acuerdo con nuestros modelos, qu porcentaje del total de vctimasfatales no fue documentado por ninguna de las fuentes de informacin a las cuales tuvimos acceso.

    El grfico 6 nos muestra la distribucin de la proporcin del estimado de casos no documentados respecto de los casosdocumentados para cada uno de los grupos de perpetradores que hemos modelado. Si bien existen algunos casos atpicos,ninguno es lo suficientemente importante como para suscitar preocupacin. Como se ve, la mayora de las ratios estn alrededor opor debajo de 1. Las ratios ligeramente mayores para los grupos modelados que contienen datos de SLU o de OTR, dan cuenta delhecho que muchos de esos casos no pudieron ser documentados a lo largo de todos los proyectos de recoleccin de informacin.

    36 Recurdese que para elaborar la lista DP, slo se tomaron en cuenta aquellos casos de vctimas con denuncia ante el Ministerio Pblico. Los casos que estaban en la basede datos de la Defensora del Pueblo pero que provenan nicamente de organizaciones de derechos humanos fueron filtrados de esa lista.

    CUNTOS PERUANOS MURIERON?

    PGINA27

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    28/35

    ANEXO 3

    PGINA28

    ANEXO 3

    PGINA28

    Grfico 6

    Proporcin del estimado de casos no documentadosrespecto del total de casos documentados

    0

    2

    4

    6

    8

    10

    EST EST+SLU EST+ODS EST+SLU+ODS

    Conclusin de la verificacin de los modelosCreemos que los resultados de los procedimientos de verificacin son satisfactorios: al comparar los dos conjuntos de estimacionespara cada grupo perpetrador, obtenemos resultados similares (aunque no demasiado); los coeficientes de variacin de los estimadossiguen una distribucin suavizada; los modelos escogidos mediante el procedimiento de seleccin de modelos, sugieren que selogr captar adecuadamente las relaciones existentes entre las diferentes fuentes de informacin; y por ltimo, los estimados paralas celdas perdidas no varan mucho ni parecen ser demasiado uniformes.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    29/35

    CUNTOS PERUANOS MURIERON?

    PGINA29

    CUNTOS PERUANOS MURIERON?

    PGINA29

    APNDICE 2: ESTIMACINDEMLTIPLESSISTEMASYANLISISDEMOGRFICO

    En el perodo de los 20 aos que le correspondieron investigar a la CVR (1980-2000), se realizaron dos censos nacionales depoblacin, el de 1981 y el de 1993. La informacin de estos censos nos permite realizar un ejercicio destinado a verificar laverosimilitud de los estimados de vctimas fatales calculados con el mtodo de estimacin de mltiples sistemas.

    La informacin de los censos nos permite tener dos valores para la poblacin peruana en el ao 1993:s Poblacin esperada (P

    E): Calculamos la poblacin esperada para 1993 combinando la poblacin censada de 1981 con los

    estimados de las tasas de natalidad, mortalidad y saldos migratorios del perodo 1981- 1993.s Poblacin observada (P

    O): La poblacin observada es simplemente el nmero de personas que se censaron en 1993.

    Si ciertos lugares del pas tuvieron una cantidad de muertes significativamente mayor que aqulla prevista por las tasas brutasde mortalidad reportadas a nivel nacional, la poblacin esperada para esas localidades debera ser mayor que la poblacinobservada (P

    E> P

    O); de esta forma, la diferencia entre ambas sera un estimado aproximado de la mortalidad excesiva ocurrida

    en el perodo. El ejercicio que queremos desarrollar supone comparar la poblacin observada del departamento de Ayacucho en1993 con su respectiva poblacin esperada, e interpretar esos resultados a la luz del estimado de vctimas fatales causadas por elconflicto armado interno producto de la EMS.

    La poblacin esperada para el ao 1993 (PE) es igual al nmero de personas vivas en 1981 (P

    81), ms los nacimientos (N), menos

    las muertes (M), ms el saldo neto migratorio (S) del perodo 1981-1993:37

    PE = P81 + N - M + S

    Para aplicar esta frmula debemos tomar en cuenta que:

    s De acuerdo con el censo de 1981, ese ao vivan en Ayacucho 503,392 personas.s El censo de 1993 daba cuenta de 182,420 personas que tenan 12 aos o menos, estas personas nacieron entre 1981 y 1993. De ese

    grupo, ya se descontaron aquellos nios que nacieron luego del censo de 1981, pero que murieron antes del de 1993, por lo que lacantidad de 182,420 personas debe ser considerada como el total de nios que nacieron y sobrevivieron entre 1981 y 1993.

    s Muchos de los ayacuchanos registrados por el censo de 1981 murieron antes del censo de 1993. Entre 1981 y 1993, la tasabruta de mortalidad en el Per baj de 9.04 por mil para el perodo 1980-85, a 7.77 por mil para perodo 1985-90, y luego a6.93 por mil pra perodo 1990-95.38 Si exponemos a los 503,392 ayacuchanos vivos en 1981 a esas tasas de mortalidad,

    obtenemos como resultado un total de 47,136 muertos durante el perodo 1981-1993.s Segn el Instituto Nacional de Estadstica e Informtica, debido al proceso migratorio, Ayacucho experiment una prdidaneta de 23,147 personas entre 1976-1981. Posteriormente, entre 1988 y 1993, el saldo migratorio neto de este departamentofue de 46,443 personas menos.39 No existen datos sobre migracin para el perodo 1982-1987; pero si asumimos un saldomigratorio neto anual consistente con las proyecciones ms altas ( 9,500 personas menos por ao), la disminucin neta de lapoblacin de Ayacucho debido al proceso migratorio ascendera a 114,000 personas.

    Aplicando entonces la frmula PE

    = P81

    + N M + S, tenemos que:

    524,676 = 503,392 + 182,420 - 47,136 - 114,000

    El censo de 1993 registr 492,507 ayacuchanos, lo que nos deja unapoblacin perdida de 32,169 personas (PE

    - PO).

    De acuerdo con los patrones de ocurrencia de los hechos reportados a la CVR, estimamos que 92.3% de las vctimas fatales

    calculadas por la EMS para Ayacucho ocurrieron entre los aos 1981 y 1993. Puesto que el estimado calculado de vctimas en esedepartamento asciende a 26,259 personas, el 92.3% que ocurrieron entre 1981 y 1993 equivale a 24,237 vctimas. Como se ve, estenmero es inferior a los 32,169 ayacuchanos perdidos que resultan del anlisis de los datos censales.

    Una explicacin para el nmero de personas perdidas en Ayacucho consiste en afirmar que representa la mortalidad adicionalo excesiva por encima de aqulla sugerida por la tasa bruta de mortalidad para el conjunto del pas. Tericamente, estas tasas demortalidad deberan incluir todos los casos de muertes. Sin embargo, si aceptamos la hiptesis de que debido a la alta incidenciadel conflicto armado interno en esa regin, el patrn de mortalidad en Ayacucho tendra que ser sustancialmente distinto al delresto del pas, la poblacin esperada (P

    E) que calculamos para ese departamento bajo los supuestos antes mencionados no estara

    tomando en cuenta esa mortalidad excesiva. De hecho, los estimados calculados con la EMS para 1981-1993 no son sino otra formade estimar la mortalidad adicional provocada por el conflicto armado interno.

    37 Esto no incluye a los nios que nunca nacieron porque uno o sus dos padres fueron muertos o desaparecidos.38 Vase: ; Indicadores de mortalidad. Para los aos lmite (1985, 1995), utilizamos las tasas de mortalidad del perodo precedente. Porejemplo, para 1985 utilizamos la tasa reportada para el perodo 1980-85.39 Vase: .

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    30/35

    ANEXO 3

    PGINA30

    ANEXO 3

    PGINA30

    Hay varios aspectos acerca de la informacin censal que debemos tomar en cuenta. En la medida en que el fenmeno demigracin es uno de los ms complicados de estudiar desde el punto de vista demogrfico,40 las cifras reportadas en las estadsticasoficiales pueden no representar adecuadamente la migracin real y ms bien subestimarla. Hemos tratado de utilizar un estimadopara el saldo migratorio neto que sea razonablemente lo ms alto posible, sin embargo, no contamos con los elementos suficientespara evaluar qu tan precisas pueden ser las cifras oficiales de migracin.

    Podemos formular observaciones ms puntuales sobre el uso de las tasas brutas de mortalidad en este ejercicio. Las tasasbrutas de mortalidad anual incluyen a todos los muertos en todas las categoras de la poblacin peruana, pero para este anlisis lashemos utilizado nicamente para aquellas personas que estaban vivas en 1981. Conforme pasaban los aos, las edades de quienesconstituan el grupo de recin nacidos en 1981 iban aumentando hasta tener como mximo 12 aos en 1993. Ahora bien, la tasa demortalidad infantil resulta ser mucho ms alta que la del resto de grupos de edad. Los estimados para la mortalidad infantil en elPer entre 1981 y 1993 varan entre 100 nios por cada mil nacidos vivos hasta 200 por cada mil, es decir 10 a 20 veces ms altas quelas tasas brutas de mortalidad. Esto significa que si utilizamos las tasas brutas de mortalidad generales para hacer proyecciones,tenderemos a sobrestimar las tasas normales de mortalidad especficas para las personas mayores de 12 aos en 1993. Noolvidemos que, de acuerdo con los hallazgos de la CVR, las personas adultas tienen una probabilidad mucho mayor de servctimas del conflicto armado interno que los menores de edad, en consecuencia, la mortalidad excesiva calculada en este anlisispuede estar subestimada. Para obtener resultados muchos ms precisos sera necesario contar con informacin sobre tasas demortalidad especficas segn grupos de edad para el perodo que estamos estudiando.

    La conclusin de este anlisis demogrfico es que los estimados que hemos calculado con el mtodo de EMS pueden ser

    considerados como un lmite inferior razonable para el total de muertos y desaparecidos ocurridos en Ayacucho como consecuenciadel conflicto armado interno.

    40 Fundamentalmente debido a que se trata de tener la mayor precisin cuantitativa posible acerca de un conjunto de personas que tienen una movilidad residencialimportante. La mayora de mtodos basados en encuestas (como los censos) son fotografas de una situacin en un momento dado.

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    31/35

    CUNTOS PERUANOS MURIERON?

    PGINA31

    CUNTOS PERUANOS MURIERON?

    PGINA31

    APNDICE 3: LISTADEESTRATOSDEFINIDOSPARALA EMS

    Los estratos estn consignados en orden numrico, a excepcin del estrato 58, que se presenta junto con los dems estratos deldepartamento de San Martn. Para cada estrato se indica de qu unidades territoriales est conformado, sealando el departamento,con sus correspondientes provincias y distritos escritos entre parntesis y corchetes respectivamente.

    1 14 39

    2 58 40

    15 413

    16 42

    4317

    44

    4518

    46

    47

    4

    19

    48

    20

    49

    21 50

    5

    22 51

    Estrato Contenido del Estato Estrato EstratoContenido del Estato Contenido del Estato

    Loreto, Ucayali, Madrede Dios

    Callao

    Ancash (Orcos, Bolognesi)

    Ancash (Huaraz, Huaylas,Mariscal Luzuriaga,Pallasca, Santa, Sihuas,Pomabamba, Recuay,Asuncion, Carhuaz, Aija,Antonio Raymondi,Carlos F. Fitzcarrald,Huari, Huarmey, Casma,Corongo,Yungay)

    Arequipa, Moquegua,La Libertad,Lambayeque, Piura,Ica, Tacna, Tumbes

    Hunuco, San Martn(Mariscal Cceres,Tocache)

    San Martn (San Martn)

    Ayacucho (Parinacochas,Pucar del Sara Sara

    Ayacucho (Lucanas[Aucara, Chavipa.Chipao, Laramate,Carmen Salcedo,Cabanal])

    Pasco

    Ayacucho (Lucanas [San

    Pedro, Puquio, San Pedrode Palco, Santa Ana deHuaycahuacho, LeoncioPrado, San Juan,Lucanas])

    Ayacucho (Huanta[Ayahuanco,Huamanguilla,Llochegua])

    Ayacucho (Huanta[Huanta])

    Ayacucho (Huanta[Iguain])

    Ayacucho (Huanta[Luricocha])

    Ayacucho (Huamanga[Santiago de Pischa,Acocro])

    Ayacucho (Huamanga[Chiara])

    Ayacucho (Huamanga[Carmen Alto])

    Ayacucho (Huamanga[San Jos de Ticllas])

    Ayacucho (Huamanga[San Juan Bautista])

    Ayacucho (Huamanga[Socos])

    Huancavelica

    (Huancavelica, Tayacaja,Acobamba, Churcampa

    Ayacucho (Huamanga[Vinchos])

    Huancavelica (Huaytara,Angaraes)

    Ayacucho (Huamanga[Tambillo])

    Huancavelica(Castrovirreyna)

    Puno

    Junn (Junn, Tarma,Yauli,Chanchamayo)

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    32/35

    ANEXO 3

    PGINA32

    ANEXO 3

    PGINA32

    6 23 52

    7 24 53

    25 548

    26 55 Junn (Huancayo [ElTambo])

    27

    28

    29

    30

    31

    32

    33

    34

    9

    35

    56

    10 Lima (Caqete, Yauyos)

    Apurmac, Cusco11

    36 57

    12 37

    13 38

    Estrato Contenido del Estato Estrato EstratoContenido del Estato Contenido del Estato

    Lima (Oyn, Cajatambo)

    Ayacucho (Huanta [Sivia])

    Ayacucho (Huanta[Santullana])

    Junn (Jauja,Concepcin, Chupaca)

    Lima (Huaura, Huarochiri,Huaral, Canta, Barranca)

    Junn (Huancayo[Huancayo])

    Lima (Lima [Rmac,San Martn de Porres,Villa el Salvador,San Juan de Miraflores])

    Ayacucho (La Mar[Chungui, Luis Carranza])

    Junn (Huancayo [Chilca])

    Ayacucho (La Mar[San Miguel])

    Lima (Lima [Carabayllo,Miraflores, Magdalena

    Vieja, Magdalena delMar, Jess Mara,Comas, Independencia,El Agustino, Los Olivos,Lince, La Victoria, LaMolina, Puente Piedra,Surquillo, Santiago deSurco, Brea, Lima, Ate,Villa Mara del Triunfo,Santa Anita, San Juan deLurigancho, San Isidro,San Borja, San Miguel,San Luis, San Bartolo])

    Ayacucho (La Mar [Anco]) Junn (Huancayo[Chupuro, Huayucachi,

    Hualhuas, Huacrapuquio,Cullhuas, Huasicancha,Huancan, Colca, Sapo,Santo Domingo deAcobamba, Viques,Sapallanga, Sicaya,Chicche, Chongos Alto,Carhuacallanga, Ingenio,Pucara, Quichuay,Pariahuanca, SanAgustin,San Jernimo de Tunan,Chacapampa, Pilcomayo,Quilcas])

    Ayacucho (La Mar [Ayna])

    Ayacucho (La Mar[Chilcas])

    Ayacucho (La Mar [SantaRosa])

    Ayacucho (La Mar

    [Tambo])

    Ayacucho (Cangallo)

    Ayacucho (Huanca,Sancos)

    Ayacucho (Sucre)

    Ayacucho (Vctor Fajardo)

    Junn (Satipo)Ayacucho (Vilcashuamn)

    Ayacucho (Huamanga[Quinua, Ayacucho,Pacaycasa, JessNazareno, Orcos])

    Ayacucho (Huamanga[Acos Vinchos])

    Amazonas, Cajamarca,San Martn (Rioja, ElDorado, Moyobamba,Lamas, Huallaga)

    San Martn (Picota, Bellavista)

  • 8/7/2019 Anexo 3: Cuntos peruanos murieron?

    33/35

    CUNTOS PERUANOS MURIERON?

    PGINA33

    BIBLIOGRAFA

    ANDERSON, Margo y Stephen E. FIENBERG2001 Who Counts? Census-Taking in Contemporary America. Edicin revisada. Nueva York: Russell Sage Foundation.

    ASHER

    , Jana y Stephen FIENBERG

    2001 Statistical Variations on an Administrative Records Census. Proceedings of the Section on Government Statistics ofthe American Statistical Association.

    BALL, Patrick2000 The Guatemalan Commission for Historical Clarification: Intersample Analysis. Chapter 11. En Patrick Ball,

    Herbert Spirer, y Louise Spirer (eds.). Making the Case: Investigating Large Scale Human Rights Violations usingInformation Systems and Data Analysis. Washington, DC: American Association for the Advancement of Science.

    BALL, Patrick y Jana ASHER2002 Statistics and Slobodan: Using Data Analysis and Statistics in the War Crimes Trial of Former President

    Miloevi. Chance, vol 15, n. 4, pp. 17-24.

    BALL, Patrick, Wendy BETTS, Fritz SCHEUREN, Jana DUDUKOVICH y Jana ASHER2002 Killings and Refugee Flow in Kosovo, March-June 1999: A Report to the International Criminal Tribunal for the Former

    Yugoslavia. Washington, DC: AAAS/ABA-CEELI.

    BERNALES, Enrique y otros1989 Violencia y Pacificacin: Comisin especial del Senado sobre las causas de la violencia y alternativas de pacificacin en el

    Per. Lima: Desco y Comisin Andina de Juristas.

    BISHOP, Yvonne M. M.; Stephen E. FIENBERG, y Paul H. HOLLAND1975 Discrete Multivariate Analysis: Theory and Practice. Cambridge, MA: MIT Press.

    DESCO

    1989 Violencia poltica en el Per 1980-1988. Lima: Desco.

    COMISINDE ESCLARECIMIENTO HISTRICODE GUATELAMA (CEH)1999 Guatem