Investigadores, docentes y estudiantes de la Universidad de la República trabajan en un proyecto que busca aplicar inteligencia artificial al análisis de archivos generados durante la dictadura uruguaya.

El proyecto se denomina Cruzar y está enfocado en facilitar el acceso y el análisis de documentos históricos mediante técnicas automatizadas de procesamiento.

La iniciativa involucra a la Facultad de Ingeniería, la Facultad de Información y Comunicación, la Facultad de Ciencias Sociales y al Centro Interdisciplinario en Ciencia de Datos y Aprendizaje Automático (CICADA).

También participan activamente integrantes de la organización Madres y Familiares de Uruguayos Detenidos Desaparecidos , aportando una dimensión social y de derechos humanos al trabajo técnico.

Uno de los archivos procesados es el Archivo Berrutti, que contiene alrededor de tres millones de páginas con documentos producidos por organismos de seguridad durante y después del régimen dictatorial.

Los documentos provienen de microfilms digitalizados, lo que genera dificultades técnicas debido a la baja calidad de muchas de las imágenes, que presentan manchas, desalineaciones o letras ilegibles.

Además del Archivo Berrutti, el proyecto trabaja con el Archivo Histórico de la ex Dirección Nacional de Información e Inteligencia y el del Cuerpo de Fusileros Navales, parcialmente digitalizados.

Los contenidos incluyen fichas personales, listas de personas, recortes de prensa, pasaportes, fotografías y registros de afiliaciones políticas, entre otros documentos vinculados al control estatal.

Para abordar este material, el equipo desarrolló un sistema escalonado que comienza con el procesamiento de imágenes, a fin de mejorar su calidad visual y preparar las transcripciones.

Las imágenes fueron recortadas y alineadas para facilitar la lectura automática mediante herramientas de reconocimiento óptico de caracteres (OCR), adaptadas específicamente para este tipo de fuentes.

Con este proceso, ya se han procesado más de 2,2 millones de imágenes, muchas de ellas complejas por su deterioro o por contener múltiples capas de información manuscrita y mecanografiada.

El sistema LUISA permite a la comunidad colaborar con transcripciones manuales, complementando el trabajo automatizado y validando resultados mediante supervisión humana.

Sistemas de búsqueda y extracción de información

Las transcripciones obtenidas se almacenan en el sistema LUZ, que organiza los textos y permite realizar búsquedas rápidas a través de grandes volúmenes de información procesada.

Se desarrolló además una herramienta llamada AMALIA, que permite realizar análisis cualitativos sobre los contenidos mediante procesamiento de lenguaje natural (PLN).

Esta herramienta permite identificar palabras clave, entidades nombradas y relaciones entre personas, instituciones o lugares mencionados en los documentos históricos.

Mediante estas técnicas se construyen grafos de conocimiento, estructuras que representan visualmente las conexiones entre datos y facilitan nuevas formas de exploración documental.

Lorena Etcheverry, docente de la Facultad de Ingeniería y coordinadora de CICADA, explicó que el proyecto comenzó con OCR basados en redes neuronales y hoy avanza con modelos multimodales y grandes modelos de lenguaje.

Etcheverry señaló que comenzaron a trabajar sobre fichas personales, documentos que contienen información sobre trayectorias individuales, vínculos sociales y pertenencia a organizaciones.

Con estos datos, se intenta reconstruir redes de relaciones, con el objetivo de revelar conexiones que permanecen invisibles en una lectura manual del archivo.

Las herramientas desarrolladas están disponibles en el Repositorio Luisa Cuesta, alojado en el Campus Luisi Janicki y gestionado por la UdelaR junto a la Institución Nacional de Derechos Humanos.

Todo el trabajo se inscribe dentro de una estrategia de preservación de la memoria histórica desde un enfoque técnico, pero con implicancias sociales y jurídicas.

En paralelo, se conformó una red regional de investigación en inteligencia artificial y derechos humanos, integrada por instituciones de Uruguay, Argentina, Chile y México.

Esta red busca expandir el uso de tecnologías de análisis documental para otros archivos históricos en la región, siempre bajo principios de ética, transparencia y validación humana.

El CICADA, centro impulsor del proyecto, organiza del 5 al 7 de noviembre su primer congreso regional, donde se presentarán avances en ciencia de datos, aprendizaje automático e inteligencia artificial.