Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

34

description

Este documento describe una metodologia para detectar fraude electoral, atraves de la Ley de Benford dentro la CALIDAD DE INFORMACION

Transcript of Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

Page 1: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION
Page 2: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

PUNTOS A TRATAR

¢ Introducción.

¢ El Fenómeno del Primer Dígito.

¢ El Desarrollo de la teoría.¢ El Desarrollo de la teoría.

¢ La Ley de Benford.

� Supuestos de una distribución de tipo Benford.� Pruebas de Bondad de ajuste de una distribución

observada a la Ley de Benford.

¢ Aplicaciones de la Ley de Benford.

Page 3: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

INTRODUCCIÓN

Existirán números que siguen:

ü una estructura.ü un patrón. ?ü un patrón.ü un modelo. ?

Page 4: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

INTRODUCCIÓN

Conjunto de Datos(numéricos)

?Existirá algún

método?(numéricos)

Para saber si estos datos son los que realmente se

esperaban?

Ejemplos-SIMULACIÓN(números pseudoaleatorios)

-ELECCIONES PRESIDENCIALES(nº de votos que se espereraban, fraude electoral)

-EVALUACIÓN DE FUN. MAT.(0,1,1,2,3,5,8,….an= an-1+an-2 SUC. FIBO)

Page 5: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

INTRODUCCIÓN

Paquetes (Análisis de datos)

- Forensic Tool Kit.

- ACL.

- IDEA.SISISISI• EL COMO…

• EN QUE SE BASA

Principales controles parala detección de errores

CALIDAD DE LA INFORMACICALIDAD DE LA INFORMACIÓN ÓN ==>>((Gestión de DatosGestión de Datos))

• EN QUE SE BASA

• EL ALGORITMO

• RELACIONES LÓGICO-MATEMÁTICAS

• Y DEMÁS ASPECTOSDE ANÁLISIS INTERNODEL PAQUETE.

La Ley de Benford

Page 6: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

INTRODUCCIÓN

Observación.

En esta sesión no se pretende demostrar laLey de Benford

Lo que haremos será:- Dar el fundamento matemático a la Ley deBenford.

- Brindar algunas nociones de aplicabilidad ala Ley.

- Tomar la aplicación más llamativa de laLey, proponer una metodología para sudesarrollo.

Page 7: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

EL FENÓMENO DEL PRIMER DÍGITO

El primero en hacer notar que los primeros dígitosde los números no se distribuyen de maneraequiprobable.

Newcomb paso a la historia por sus trabajos tandistintos como:

- Sus teorías sobre el orígenes de losasteroides.

������������� �� �������������� �� �

((astrónomoastrónomo y y matemáticomatemático))������������� �� �������������� �� �

((astrónomoastrónomo y y matemáticomatemático))

asteroides.

- o por afirmar rotundamente que ningúnaeroplano podría volar.

Newcomb observó que las primeras páginas de loslibros tablas de logaritmos1 estabansistemáticamente más desgastadas que lasúltimas.

1 las tablas de logaritmos eran utilizadas para hacer productos, cocientes y raíces,facilitando así la tediosa operación manual [Nigrini, 2000]

Page 8: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

EL FENÓMENO DEL PRIMER DÍGITO

Newcomb observó que los números con mantisa 1 estaban máspresentes en la realidad que los que tenían mantisa 2, y éstos más quelos que tenían mantisa 3, etc.

Newcomb afirma (no dá explicación de éste fenómeno, nifundamentaciones matemáticas):

“La Ley de probabilidad de la ocurrencia de números es tal que las mantisas de sus logaritmos son equiprobables”que las mantisas de sus logaritmos son equiprobables”

rcxrx c

1010loglog10 +=⇔×=PROPIEDAD DE LA MANTISA

Page 9: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

EL FENÓMENO DEL PRIMER DÍGITO57 años más tarde Frank Benford publica:

“The Law of anomalous numbers”2

A diferencia del trabajo de Newcomb, Benfordno sólo formula la Ley que finalmentetomará su nombre, sino que se dedica a recogeruna cantidad ingente de observaciones (20229):

- Las áreas y longitudes de los ríos.

��������������������������

� ����� ����

(físico de General Electric)

��������������������������

� ����� ����

(físico de General Electric)

- Las áreas y longitudes de los ríos.

- Los pesos atómicos de los elementos de la T.P.

- Estadísticas de la liga Americana de béisbol.

Demuestra que en todas estas series los dígitos queaparecen en los primeros lugares lo hacen con unaprobabilidad desigual, siendo más probable la apariciónde dígitos pequeños que de dígitos grandes…

2 Sin haber conocido el trabajo de Newcomb, y a partir del mismo fenómeno.

Page 10: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

EL DESARROLLO DE LA TEORÍA

La repercusión del trabajo de Benford no es inmediata:

Durante los años 40 los trabajos son muy escasos y en su mayoríacríticos (Goudsmit y Furry, 1944; Furry y Hurwitz,1945)

En 1961, Pinkham publica una imprescindible aportación al trabajode Benford:

“Si hay una Ley que gobierna la distribución de los dígitos,

Sin embargo, en 1969 Raimi es quien demuestra finalmente laindependencia de la unidad de medida de la Ley de Benford.

“Si hay una Ley que gobierna la distribución de los dígitos, ésta debe ser necesariamente ESCALA INVARIANTE”

En los años 70 y 80 se inician aproximaciones pragmáticas ypublicaciones importantes al uso de la Ley de Benford.

Page 11: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

EL DESARROLLO DE LA TEORÍA

Hill (1996) demuestra algo ya sugerido por Boyle (1994): laLey de Benford o distribución logarítmica de los primerosdígitos:

“Es la distribución de todas las distribuciones3”

En cuanto a su uso:

Christian y Gupta (1993) pero especialmente Nigrini (1994,Christian y Gupta (1993) pero especialmente Nigrini (1994,1996 y 2000), aplica la Ley de Benford, así como lasdistribuciones de los segundos y sucesivos dígitos, paradetectar eventuales fraudes en la contabilidad, los cualesameritan un proceso de contraloría.

3 Esto es, que si tomamos una serie de distribuciones seleccionadas al azar de manerainsesgada, y de estas distribuciones extraemos valores, los primeros dígitos del conjuntode valores convergen a una distribución logarítmica.

Page 12: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

LA LEY DE BENFORD

La Ley de Benford, también llamada la Ley del DígitoSignificativo o Ley del Primer Dígito, es unadistribución de probabilidad en los dígitos significativos delos números reales.

La LeyLey dede BenfordBenford es la distribución de probabilidadlogarítmica dada por:

Page 13: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

LA LEY DE BENFORD

La LeyLey dede BenfordBenford para el primer dígito nos dará lasiguiente tabla de probabilidades para cada número:

Según esta ley:

El 30% de las veces, la primera cifrasignificativa será un 1, mientras que sóloun 5% de las veces será un 9.

Page 14: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

LA LEY DE BENFORD

Ejemplo de cálculo para el 2do, 3er y 4to dígitosignificativo.

American Mathematical Society,

Vol. 123, N° 3 (Mar. 1995), pág. 887-895

Theodore P. Hill:

La Ley de Ley de BenfordBenfordes de

BASE INVARIANTE

Page 15: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

LA LEY DE BENFORD

Para los k-ésimos dígitos significativos

Para el k-ésimo dígito significativo

Page 16: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

LA LEY DE BENFORD

A partir de la Ley generalizada puede calcularse laprobabilidad de dk condicionada4 a los valores de losdígitos anteriores.

4 Un resultado importante es que los dígitos significativos no son independientes ya que la presenciade un dígito modifica la probabilidad de aparición de los demás.

Page 17: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

QUÉ DATOS SATISFACEN LA LEY DE BENFORD?

Es evidente que la LeyLey dedeBenfordBenford no se verifica entodos los posibles conjuntos dedatos numéricos como:

Aquellos procedentes de distribuciones

- uniformes (números de lotería)

- normales (edades de personas).

Tampoco puede verificarse la ley cuando los datostienen limitado el valor del dígito inicial (precios deproductos)

Existe una fuerte dependencia en cuanto a lanaturaleza de los datos (núm. telefónicos, doc. deidentidad se asignan arbitrariamente)

Page 18: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

SUPUESTOS DE UNA DISTRIBUCIÓN DE TIPO BENFORD?

ü Sucesiones geométricas (requisitofundamental).

No tener un máximo, ni un mínimoteórico5.

ü Datos que contengan cuatro o más dígitos(dem. cantidad de dígitos importantes, "tres”).(dem. cantidad de dígitos importantes, "tres”).ü Datos que contienen valores similares parafenómenos similares.ü El conjunto de los datos no debecomponerse de números asignados.

5 La razón es que los dígitos que componen estos mínimos y máximos aparecen con unafrecuencia mucho mayor de la esperada por la distribución.

Page 19: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

PRUEBAS DE BONDAD DE AJUSTE DE UNA

DISTRIBUCIÓN OBSERVADA A LEY DE BENFORD

Para examinar la bondad de ajuste de los datosobservados a la distribución teórica de Benford sehan adaptado los tests clásicos:

- La prueba de estadístico Z- La prueba de estadístico Z

- La prueba de estadístico χ2 6

- La prueba de Kolmogorov-Smirnoff y- La desviación media absoluta [Nigrini, 2000, pág. 79].

6 Nigrini propone su uso paracalcular la bondad de ajuste de todoslos dígitos respecto a lo esperado porla Ley de Benford.

Page 20: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

APLICACIONES DE LA LEY DE BENFORD

Durante muchos años la Ley de Benford no ha sido másque una curiosidad estadística sin fundamentaciónmatemática ni aplicaciones reales.

Hoy la Ley está firmemente basada en la teoría de laprobabilidad, goza del interés del público general ypresenta importantes aplicaciones a la vista.presenta importantes aplicaciones a la vista.

APLICACIONESAPLICACIONES

•La Ley se ha propuesto como un posibletest de evaluación de los resultadosobtenidos, ya sea por medios analíticos ode simulación.

•La Ley de Benford en el estudio de lacomputación científica y la aritmética enpunto flotante.

Page 21: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

APLICACIONES DE LA LEY DE BENFORD

APLICACIONESAPLICACIONES

•Se ha utilizado la Ley en cuestionescomo el tiempo de ejecución dealgoritmos de aritmética en puntoflotante, los errores de redondeo y suminimización.

•Donald Knuth, la idea de Knuth es que•Donald Knuth, la idea de Knuth es queun ordenador tiene que manejar datosque probablemente sigan la Ley deBenford. Por tanto, podríamos diseñarordenadores que sean más rápidoscalculando o leyendo de discos duros ymemorias RAM los números queempiezan por 1.

•También se ha pensado en la posibleadecuación de la Ley de Benford a juegosde adivinación y similares. ?

Page 22: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

APLICACIONES DE LA LEY DE BENFORD

APLICACIONESAPLICACIONES

• Sin duda la aplicación más llamativa:

DETECCIÓN DE DATOS ERRÓNEOS O FRAUDULENTOS

Page 23: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

Coyuntura

Cómo Detectar Indicios de

Fraude Electoral?

Coyuntura (2009-2010)

Las técnicas de detección de fraudes técnicas de detección de fraudes (FRAUDITOR)

q AnálisisAnálisis EstadísticoEstadístico:: Análisis de regresión, análisis de correlación, análisisde dispersión, La Ley de Benford – Análisis de Frecuencia digital.q PatronesPatrones:: Secuencias, investigación de faltantes y duplicados, análisishistórico de tendencias, análisis de ratios.q TécnicasTécnicas dede análisisanálisis visualvisual:: Análisis de relaciones, análisis de líneas detiempo, gráficos de agrupamiento (clustering)q ProcedimientosProcedimientos analíticosanalíticos dede auditoriaauditoria:: Análisis vertical y horizontal delas cuentas de balance y de resultados; Análisis de índices/ratios históricos.

Page 24: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

Etapa de resolución delproblema

Etapa de

Análisis del problema

Diseño o Desarrollo delalgoritmo

Planteamiento del problema

Organización y clasificación de losdatos recogidos

Recolección de la información

Análisis e interpretación de losresultados

Construcción de tablas defrecuencias

Representación tabular o cuadrosestadísticos y gráfica

Técnica Divide y Vencerás

1.Dividir el problemas en k-subproblemas.2.Resolver independientemente los k-subproblemas.3.Combinar las soluciones obtenidas de pasoanterior, para resolver el problema original.

método

estadístico

PROPUESTA METODOLÓGICA

Análisis

Desarrollo

Implementación

ALGORITMO en elmarco de la Ley deBenford.

Etapa deimplementación en el

ordenador

anterior, para resolver el problema original.

Recolección y refinamiento de requisitos

Diseño rápido

* Cuestionario.

* DFD.

Construcción del prototipo

* Codificación del algoritmo y eldiseño del sistema en unprograma.

Evaluación del prototipo por el cliente

* Ejecución del programa.

Refinamiento del prototipo

* Comprobación del programa.

Producto final

paradigma

prototipación

Page 25: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?Determinación

de

Variables

Para una mejorinterpretación de losdatos observados sepuede tomar en cuenta losestadísticos:

•Mediana.•Error estándar.•Desviación estándar.•Curtosis.•Coeficiente de Asimetría.

Page 26: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

Page 27: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

DEFINICIONESDEFINICIONES

Page 28: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

DEFINICIONESDEFINICIONES

Page 29: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

DEFINICIONESDEFINICIONES

Page 30: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

ALGORITMOALGORITMO

Pruebas Pruebas del del Análisis Digital.Análisis Digital.

•Las pruebas básicas•Las pruebas avanzadas.•Las pruebas avanzadas.

•PD,•SD, P2D,•P3D,•DN,•U2D,•RN.

Page 31: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

CONJUNTO DE DATOS ANALIZADOSCONJUNTO DE DATOS ANALIZADOS

Elecciones 2002 - Bolivia

Elecciones 2009 - BoliviaElecciones 2009 - Bolivia

Números Pseudoaleatorios

Fraude Electoral, análisis forense Mexico 2006Ley de Benford

http://www.fisica.unam.mx/octavio/

Votación Electrónica

Page 32: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

jesus.larrazabal.salas @gmail.comBIBLIOGRAFÍABIBLIOGRAFÍA

Page 33: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION
Page 34: Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

GESTIÓN DE DATOS1) Definir la estructura de la base de datos;2) definir e implementar todas las protecciones posibles entre

los datos para detectar y eliminar el máximo número deincongruencias durante la recogida de la información;

3) garantizar que los datos que han sido registrados nocontienen inconsistencias;

4) preparar la matriz de datos para el análisis estadístico,creando las variables necesarias para contrastar lascreando las variables necesarias para contrastar lashipótesis empíricas;

5) emplear las técnicas de análisis estadístico adecuadas;6) evaluar la calidad de las estrategias utilizadas durante todo

el proceso de recogida y manejo de la información; y7) consensuar procedimientos de control para garantizar la

calidad de la gestión de datos que sean aplicables en futurasinvestigaciones, valorando en cada caso los costes de suimplementación.