Download Presentación
Transcript
La ley de Benford para el segundo dígito y los resultados electorales en México Luis Horacio Gutiérrez UAM-Iztapalapa Emiliano Calderón Facultad de Ciencias, UNAM Ley de Benford • Prueba estadística que permite descubrir números fabricados • Utilizada por administraciones tributarias para revisar declaraciones de impuestos • Recientemente se ha extendido su aplicación al análisis de resultados electorales • Se basa en un análisis de la frecuencia de utilización de cada dígito, del 0 al 9 • Todos suponemos que, en cualquier conjunto de números, cada dígito aparece con la misma frecuencia. Sin embargo, esto no es así Ley de Benford Distribución logarítmica del primer dígito de varias cantidades que ocurren naturalmente y que son resultado de operaciones aritméticas Hill, 1995 Ley de Benford Distribución logarítmica del segundo dígito de varias cantidades que ocurren naturalmente y que son resultado de operaciones aritméticas Hill, 1995 Distribución generalizada Hill, 1995 Probabilidades predichas por la ley de Benford para dígitos hasta de cuarto orden Diekmann, 2004 Distribución del primer dígito para datos no fabricados Diekmann, 2004 Distribución del segundo dígito para datos no fabricados Diekmann, 2004 Para resultados electorales: • La distribución del primer dígito no cumple con la ley de Benford. Esto se debe a que el número de candidatos es limitado y mucho menor que el número de votantes • La distribución de los dígitos de orden superior (segundo, tercero, etc.) sí tiene que cumplir con la ley de Benford. Estos números sólo se derivan de operaciones aritméticas comunes • El conteo del segundo dígito a nivel sección debe ajustarse a la distribución de Benford • La bondad del ajuste de los datos observados con respecto a la distribución esperada se determina mediante la función (ji^2, ji cuadrada) • Los valores observados serán confiables si ji cuadrada es menor que el valor crítico 16.91 Valores de ji^2 para el conteo de votos en las elecciones mexicanas de 2006 (Conteo de dígitos a nivel sección.) Los valores de ji^2 superiores a 16.91 son preocupantes Mebane, 2006a Valores de ji^2 para el conteo de votos en las elecciones mexicanas de 2006 (Conteo de dígitos a nivel casilla.) Los valores de ji^2 superiores a 16.91 son preocupantes Mebane, 2006a Valores de ji^2 para el conteo de votos por distrito Los valores de ji^2 superiores a 16.91 son preocupantes Distritos con alteraciones graves Distribución de dígitos para el distrito 2 de Chihuahua 8_2; N=895; chiB=39.32 200 180 160 Frecuencia 140 120 100 80 60 40 20 0 0 1 2 3 4 5 Segundo dígito IFE Benford 6 7 8 9 Distribución de dígitos para el distrito 2 de Chihuahua PAN;8_2; N=252, chiB=13.49 Frecuencia 50 40 30 20 10 0 0 1 2 3 4 5 Segundo dígito IFE Benford 6 7 8 9 Distribución de dígitos para el distrito 2 de Chihuahua APM; 8_2; N=251; chiB=18.68 Frecuencia 50 40 30 20 10 0 0 1 2 3 4 5 Segundo dígito IFE Benford 6 7 8 9 Distribución de dígitos para el distrito 2 de Chihuahua PBT; 8_2; N=252; chiB=4.94 50 Frecuencia 40 30 20 10 0 0 1 2 3 4 5 Segundo dígito IFE Benford 6 7 8 9 Distribución de dígitos para el distrito 2 de Chihuahua NA; 8_2; N=40; chiB=26.11 Frecuencia 50 40 30 20 10 0 0 1 2 3 4 5 Segundo dígito IFE Benford 6 7 8 9 Distribución de dígitos para el distrito 2 de Chihuahua ASCD; 8_2; N= 100; chiB=22.87 Frecuencia 50 40 30 20 10 0 0 1 2 3 4 5 Segundo dígito IFE Benford 6 7 8 9 La distribución del segundo dígito en numerosos distritos no se ajusta a la ley de Benford Número de anomalías Número de distritos 0 90 1 111 2 52 3 34 4 8 5 4 6 1 Total de distritos con anomalías 210 Diferencia porcentual Calderón-AMLO contra porcentaje de votos anulados Chihuahua 0.5 -0.5 0.0 P_P_per[state == "CHIHUAHUA"] 0.6 0.4 0.2 0.0 -0.2 P_P_per[state == "AGUASCALIENTES"] 0.8 Aguascalientes 0.00 0.05 0.10 0.15 Nulo[state == "AGUASCALIENTES"] 0.20 0.00 0.05 0.10 0.15 0.20 Nulo[state == "CHIHUAHUA"] Takahashi, 2006 0.5 -0.5 0.0 0.0 P_P_per[state == "GUANAJUATO"] 0.5 Guanajuato -0.5 P_P_per[state == "DISTRITO FEDERAL"] Distrito Federal 0.00 0.05 0.10 0.15 Nulo[state == "DISTRITO FEDERAL"] 0.20 0.00 0.05 0.10 0.15 0.20 Nulo[state == "GUANAJUATO"] Takahashi, 2006 Nuevo León 0.6 0.4 0.2 0.0 -0.4 -0.2 P_P_per[state == "NUEVO LEON"] 0.2 0.0 -0.2 -0.4 -0.6 -0.8 P_P_per[state == "MORELOS"] 0.4 0.8 Morelos 0.00 0.05 0.10 0.15 Nulo[state == "MORELOS"] 0.20 0.00 0.05 0.10 0.15 0.20 Nulo[state == "NUEVO LEON"] Takahashi, 2006 • En estados como Chihuahua, Guanajuato y Nuevo León, el porcentaje de votos nulos es mayor cuando la diferencia Calderón-AMLO es menor • El porcentaje de representantes de casillas de la coalición PBT era muy baja en los estados arriba mencionados • Es posible que en esos estados se haya anulado un porcentaje inusualmente elevado de votos correspondientes a PBT Agradecimientos • Universidad de Cornell: W. R. Mebane Y. Takahashi • Universidad de Berkeley: J. Sekhon Referencias • Diekmann, A. (2004) Not the First Digit! Using Benford’s Law to Detect Fraudulent Scientific Data • Hill, T. P. (1995) A Statistical Derivation of the SignificantDigit Law. Statistical Science 10 (4), 354-363 • Mebane, W. R. (2006a) Election Forensics: Vote Count and Benford’s Law. 2006 Summer Meeting of the Political Methodology Society • Mebane, W. R. (2006b) Comunicación personal • Takahashi, Y. (2006) Comunicación personal