El lunes 15 de enero, en la inauguración del «Congreso del Futuro» en Santiago, el presidente Gabriel Boric afirmó que la inteligencia artificial, tema de la 13ª edición de la conferencia, «jugará un papel importante en la búsqueda de nuestros desaparecidos». prisioneros.» .» El 30 de agosto de 2023, se refería a un plan de búsqueda para localizar a más de 1.000 víctimas de la dictadura de Augusto Pinochet (1973-1990) que su administración había puesto en marcha antes de su 50 aniversario el 11 de agosto. El presidente socialista Salvador depuso a Allende .
Se pretende que el plan se convierta en una política de Estado permanente bajo el liderazgo del Ministro de Justicia, Luis Cordero. Según datos judiciales, en Chile ha habido 1.469 desapariciones forzadas desde la dictadura, de las cuales 1.092 fueron presos, mientras que 377 fueron ejecutados. Hasta el momento sólo se han identificado 307 personas.
Cordero explica a EL PAÍS que está trabajando con dos fuentes principales para iniciar esta nueva búsqueda, que ya ha sido iniciada por los juzgados. Por un lado, hay millones de páginas de investigaciones judiciales. Por otro lado, registros administrativos de casos dispersos en instituciones estatales. Estos incluyen un proyecto de derechos humanos creado en 1997 bajo el Ministerio de Justicia, así como investigaciones previas en fiscalías militares (utilizadas para cerrar casos) y expedientes que sirvieron de base para la investigación de 1991. Informe de la Comisión Nacional para la Verdad y la ReconciliaciónDirigida por el expresidente Patricio Aylwin (1990-1994), es la primera vez que se dan relatos de las víctimas.
Documentos mecanografiados
Detrás del análisis técnico de la información está Ansholster, empresa especializada en análisis de datos, ciencia de datos y desarrollo de software, cuyo director general es el ingeniero de caminos Antonio Díaz-Araujo. El Programa de Derechos Humanos ya tiene información digitalizada, mientras que el Poder Judicial está digitalizado en un 80%. El proyecto fue adjudicado a la empresa en una licitación en el marco del proyecto de búsqueda, que se encarga de implementar la inteligencia artificial.
Es relevante para esta investigación que los expedientes judiciales caso por caso se procesaban en el antiguo sistema de justicia chileno (modificado en 2005), lo que significaba que las audiencias de los jueces se realizaban en papel, la mayoría de ellas con páginas cosidas. Escritos a mano en un cuaderno, a máquina de escribir, e incluso hay varias partes manuscritas. Estos incluyen informes, fotografías en blanco y negro, fotocopias, informes forenses e informes policiales antiguos.
Sin embargo, las investigaciones judiciales realizadas desde el año 2000 aportan información más actualizada e importante en el análisis. Desde entonces, cientos de casos archivados durante la dictadura han sido reabiertos por jueces con especial atención en casos de violaciones de derechos humanos con condena.
Cordero señala que «el gobierno tiene mucha información en sus manos que no tiene la capacidad humana para procesarla, porque tiene que estar interconectada. Por ejemplo, hay testimonios que aparecen en unos expedientes y en otros no». Y, además, dependiendo de los jueces, había líneas de investigación, entonces unas son útiles y otras no”. Por eso, el ministro de Justicia dice que la inteligencia artificial puede jugar un papel importante, porque en estos casos, cree que es importante cruzar la información.
«Toda esa información está en expedientes judiciales y administrativos, y la digitalización logra primero consolidarlos en un solo lugar. Luego, trabajar con inteligencia artificial, nos permite reducir las lagunas investigativas mediante algoritmos, que se verifican, por ejemplo, fechas. «En esos archivos se pueden leer nombres, lugares», afirmó. El ministro añade.
4,7 millones de páginas y contando
Unsholster se encuentra actualmente en fase de anteproyecto, antes de comenzar la programación, explicó Díaz-Araujo a EL PAÍS. «Pero ya hemos tocado la mayoría de los tipos de archivos con los que tenemos que lidiar», afirma. Los documentos que llegan son escaneados hoja a hoja, en carpetas, en formato PDF, por lo que se almacenan como imágenes y no siguen la lógica que permite buscar datos. Por este motivo, el primer paso es utilizar la tecnología OCR (Reconocimiento óptico de caracteres) para convertirlos en datos.
Ya cuentan con la información -sin incluir miles de expedientes del Poder Judicial hasta el momento- que suman 46.768 archivos PDF, que contienen más de 4,7 millones de páginas. “Si uno lee cada una de esas páginas en voz alta y no comprende ni relata los hechos, tendría que leer ocho horas diarias durante 27 años”, explica el ingeniero civil.
Una vez que esos archivos se mueven a páginas, dice Díaz-Araujo, «se crea un enorme árbol de clasificación que nos permite clasificar páginas que contienen imágenes, manuscritos, páginas mecanografiadas o archivos estilo Word. Luego comienzas a aplicar un mejor OCR a cada tipo. de página, porque añade «Qué material se trae a cada uno».
Otro paso, explica, es crear diferentes tipos de diccionarios y entidades que «se puedan aprender usando». Por ejemplo, apodos de personas, lugares, calles (muchos cambiaron de nombre después de la dictadura), sistemas de escritura y fechas.
Dice que esto se refiere a la creación de una topología de entidades en la lectura, utilizando tecnología para hacer que cada texto sea «capaz de relacionar rápidamente diferentes páginas, personas, lugares y fechas de una manera muy flexible». Pone un ejemplo: “Muchos de los delincuentes pueden tener seudónimos, muchos de ellos pueden estar escritos de diferentes maneras, pero eso no significa que no estarán conectados. Lo que estás haciendo es crear tecnología que sea capaz de sugerirle al analista otras interacciones que ocurren a lo largo del tiempo.
Entonces, explicó, “la inteligencia artificial participa en la clasificación de documentos; Hay más inteligencia en la conversión de documentos de una imagen a datos con capacidad de búsqueda, y luego, hay mucho más en la creación de entidades que conectan ciertos documentos con otros. Y, finalmente, lo más esencial en una plataforma es la posibilidad de que algoritmos compitan sobre estos datos, con o sin inteligencia artificial. Pero no debería estar ligado a una tecnología, porque el mayor problema es estar abierto a las nuevas tecnologías del futuro. Si se cierra, se convertirá en un callejón sin salida».
Y continúa: “Otra característica clave de esta plataforma es que se conservan los datos originales y los datos modificados. Pero además de eso podemos seguir generando otros datos. No existe una máquina del tiempo que inhabilite la capacidad de crear más algoritmos y más información en nuevas plataformas en el futuro.
Contreras y Krasnoff
Cinco meses después de que la tecnología se utilizara por primera vez en casi 47.000 documentos del Proyecto de Derechos Humanos de Ansholster, la implementación de OCR preliminar en documentos de identidad ya ha hecho posible localizar miles de referencias a al menos cuatro oficiales militares. La policía secreta de Pinochet, la temida DINA (Dirección de Inteligencia Nacional).
Su director general, Manuel Contreras, que fue condenado a 526 años de prisión en el momento de su muerte en 2015 por cientos de delitos, hizo 2.800 comparecencias; Pedro Espinoza y Miguel Krassnoff, ambos cumpliendo condena en la cárcel de Punta Peuco, citaron 2.079 y 2.954, respectivamente. Marcelo Morán Brito es el hombre que torturó 2.284 veces a la madre de la expresidenta socialista Michelle Bachelet, Ángela Jeria.
Por ahora son sólo pistas. Pero a partir de ahora, dice Díaz-Araujo, se pueden vincular y relacionar nombres, hechos, fechas y lugares.
Inscribirse Nuestro boletín semanal Para más noticias en inglés de la edición de EL PAÍS USA
«Lector típico. Especialista en música. Aficionado a la comida. Pionero de la televisión. Estudiante de toda la vida. Ávido amante de los zombis».
More Stories
Cyber Day: un carrusel de ofertas que no puedes dejar pasar
Colchones de 2 plazas: calidad y confort para tu sueño tranquilo
Las carpas adecuadas para cada tipo de aventura