IA al servicio de la memoria histórica: investigadores la usan para analizar archivos de la dictadura uruguaya

Mediante técnicas de inteligencia artificial, el proyecto busca procesar, transcribir y analizar millones de páginas de documentos para preservar la memoria histórica y facilitar el acceso público.

Secretaria de Derechos Humanos para el Pasado Reciente
Documentos en la Secretaría de Derechos Humanos para el Pasado Reciente.
Foto de Archivo.

En Uruguay, una gran parte de los archivos generados por organismos de seguridad durante y después de la dictadura cívico-militar (1973-1985) aún no ha sido revisada de forma sistemática. Estos documentos contienen información clave sobre la represión, la vigilancia y el control ejercidos en ese período, y constituyen una pieza fundamental para el trabajo de historiadores, investigadores y familiares de víctimas.

Con la intención de abrir estas páginas a la investigación histórica y al acceso ciudadano, en 2018 nació el proyecto Cruzar, una iniciativa interdisciplinaria impulsada por investigadores, docentes y estudiantes de la Universidad de la República (UdelaR), junto a organizaciones de derechos humanos como Madres y Familiares de Uruguayos Detenidos Desaparecidos.

El proyecto integra a la Facultad de Ingeniería (Fing), la Facultad de Información y Comunicación (FIC), la Facultad de Ciencias Sociales (FCS) y el Centro Interdisciplinario en Ciencia de Datos y Aprendizaje Automático (Cicada). Su propósito central es desarrollar herramientas informáticas capaces de buscar, analizar y combinar información contenida en los archivos disponibles, procesando, transcribiendo y analizando millones de páginas mediante técnicas de inteligencia artificial.

Restos humanos hallados en nuevas excavaciones por busqueda de desaparecidos durante la dictadura, en el predio del Batallon 14 - Ignacio Sánchez.jpg
Restos humanos hallados en nuevas excavaciones por búsqueda de desaparecidos durante la dictadura.
Foto: Ignacio Sánchez

Procesar la historia, página por página

Uno de los conjuntos documentales más significativos con los que han trabajado es el Archivo Berrutti, que reúne cerca de tres millones de páginas provenientes de microfilms de documentos originales, muchos de ellos deteriorados. Gracias a un convenio con la Institución Nacional de Derechos Humanos y Defensoría del Pueblo (Inddhh), el equipo también procesa materiales del Cuerpo de Fusileros Navales (Fusna) y de la ex Dirección Nacional de Información e Inteligencia, que incluyen recortes de prensa, fichas personales, fotografías, pasaportes y registros de afiliaciones políticas.

Lorena Etcheverry, docente de la FING e integrante del Grupo Coordinador de Cicada, explicó a El País que la tarea comienza siempre con las imágenes de los documentos: en algunos casos, son escaneos de hojas, y en otros, digitalizaciones de microfilmaciones de los originales. “Para poder extraer información tenemos que comenzar por obtener el texto de esas imágenes. Ese proceso, conocido como Optical Character Recognition (OCR), presenta desafíos cuando se trata de imágenes con mala calidad —manchas, borroneos— o cuando el texto está escrito a máquina”, detalló.

Para superar estas dificultades, el equipo ha experimentado desde redes neuronales hasta modelos multimodales de última generación, con el fin de reducir errores y mejorar la calidad del texto procesado. Una vez obtenida esa base textual, se aplican sistemas de extracción de información para identificar nombres de personas, lugares, fechas y organizaciones. “Esto también presenta dificultades: personas nombradas de forma diferente en distintos documentos, o mencionadas de manera indirecta”, explicó Etcheverry, señalando que el equipo ensaya tanto métodos tradicionales como técnicas recientes basadas en IA.

Marcha del Silencio 2025
Marcha del Silencio 2025.
Foto: Ignacio Sánchez.

Conexiones inéditas

Las herramientas desarrolladas ya han permitido apoyar investigaciones específicas. Etcheverry mencionó un proyecto interdisciplinario en el que participan la Facultad de Medicina y la FCS, liderado por Elina Gómez, que estudia la prevalencia de cáncer entre expresos políticos en Uruguay. “Gracias a las herramientas de búsqueda que desarrollamos se pudieron identificar listados de presos y ubicar sus historias clínicas para extraer esta información”, afirmó.

Otro desarrollo en curso busca reconstruir líneas temporales de personas a partir de menciones documentales vinculadas a lugares y momentos, lo que podría ayudar a descubrir conexiones hoy ocultas. Este trabajo aún está en fase preliminar y requiere financiamiento para su implementación completa.

Un repositorio abierto

Todo este acervo documental se encuentra disponible para la ciudadanía a través del Repositorio Luisa Cuesta (RLC), creado a partir de un acuerdo entre la Inddhh y la UdelaR. El servicio, inaugurado en agosto de 2023 en el campus Luisi Janicki, comenzó con una parte sustantiva del Archivo Berrutti y ofrece herramientas digitales —como Luz y Amalia— que permiten explorar documentos mediante búsquedas textuales y análisis de contenido.

El RLC está abierto a investigadores, familiares de víctimas y al público general. Ofrece acceso asistido, copias digitales de imágenes relevantes y la posibilidad de realizar investigaciones documentales en condiciones técnicas y éticas adecuadas.

Intervencion urbana por la Marcha del Silencio
Mosaico de margarita en vereda de la ciudad de Montevideo.
Foto: Estefanía Leal/Archivo El País.

Cooperación regional y desafíos futuros

El proyecto ha consolidado además una red regional de investigación en inteligencia artificial y derechos humanos, que incluye instituciones de Argentina, Chile y México, abriendo la puerta a colaboraciones y nuevos enfoques de análisis.

Pero no todo es avance: el equipo enfrenta serias limitaciones de recursos. “La mayoría de las tareas son llevadas adelante por investigadores y estudiantes en el marco de actividades curriculares o de extensión. Esto nos permite generar conocimiento y prototipos, pero no es suficiente para desarrollar herramientas maduras y sostenibles”, señaló Etcheverry.

Entre los desafíos destacan la necesidad de financiamiento estable para:

  • Incorporar nuevas colecciones documentales aún no integradas.
  • Mejorar las herramientas de consulta y análisis.
  • Desarrollar tecnologías avanzadas de procesamiento de texto, procesamiento de lenguaje natural (PLN) y grafos de conocimiento que permitan conectar información entre archivos diversos, enriqueciendo el análisis histórico y judicial.

Actualmente, gran parte del trabajo se sostiene con horas docentes y aportes honorarios de estudiantes, mientras el equipo postula a convocatorias concursables para buscar apoyo.

Un hito académico en noviembre

Como parte de su agenda, el Cicada celebrará su primer Congreso Regional sobre ciencia de datos, aprendizaje automático e inteligencia artificial del 5 al 7 de noviembre en la Facultad de Ingeniería.El evento contará con un llamado a pósters abierto hasta el 15 de agosto y pronto habilitará inscripciones generales.

¿Encontraste un error?

Reportar

Te puede interesar