Investigador uruguayo intenta descifrar la caja negra de la IA

Franz Mayr, docente y graduado de la Facultad de Ingeniería, recibió el Premio a la Mejor Tesis de Doctorado de PEDECIBA en Informática 2025 por un trabajo que aplica verificación formal —demostrar con matemática que un sistema cumple ciertas propiedades— a los modelos de inteligencia artificial, con el objetivo de hacerlos más comprensibles y confiables.

En esta entrevista con El Observador explica por qué la IA sigue siendo una caja negra, por qué sostiene que los modelos no razonan y qué conviene tener en cuenta a la hora de usarlos.

¿Qué significado y qué impacto tiene tu investigación?

Si tengo un sistema y me interesa que cumpla ciertas propiedades, quiero poder garantizar matemáticamente que las cumple. ¿Por qué? Porque mi sistema es crítico. Si un fallo puede implicar la pérdida de vida de personas o pérdidas materiales, no alcanza con testear, porque el testing es la búsqueda de errores: no encontrarlos no significa que no los haya. Con rigor, con matemática y con demostraciones, se prueba que el software no va a fallar. Por ejemplo, que un marcapasos no va a fallar, que un tren con una parte de control autónoma no va a fallar, o el software de un avión. Eso ya se hace, la verificación de software no es nueva. Viniendo de esa escuela —la de los métodos formales, que es la de mi director— y con el advenimiento de la inteligencia artificial, allá por 2017, empezamos a investigar cómo aplicar estas técnicas de verificación a sistemas de IA, que son medio una caja negra para nosotros.

Las cajas negras de la inteligencia artificial significan que no se sabe cómo funciona. Sabemos que es predictiva, que predice tokens, ¿pero poco más?

Tenés que pensar que un modelo de inteligencia artificial es una función matemática: para una entrada tiene una salida. La IA generativa lo que hace es muestrear sobre esa salida, lo que significa que hay un proceso aleatorio a la hora de producir datos. Pero el modelo no deja de ser un conjunto de operaciones matemáticas apiladas. Si me preguntás si sé lo que hace el modelo, sí: vos me das el dato de entrada, yo puedo hacer el millón de operaciones que se suceden y decirte por qué la salida es la salida. Pero eso no significa que entienda qué es lo que el modelo realmente está haciendo.

¿Es una cuestión decidida por las empresas? ¿Las empresas tampoco lo saben?

No lo saben. Cuando entrenás un modelo, no definís qué hace el modelo en cada etapa. La inteligencia artificial hoy se implementa con aprendizaje automático: tengo un modelo que aprende a hacer lo que hace a través de ejemplos y un proceso automático de optimización.

A la IA le muestro un perro y un gato y sabe que es un perro y un gato.

Le mostrás un perro y un gato, y al principio le erra. Le decís: "tus parámetros están medio mal", y el modelo ajusta los parámetros. Le mostrás otro perro y otro gato, y le erra menos. Y así hasta que decís: "ya no le erra tanto, paro de entrenar, este es mi modelo". Pero el modelo sigue teniendo error, porque los modelos de aprendizaje automático tienen error; existe un concepto de error irreducible. Además, el proceso de entrenamiento no lo controlaste vos, fue una optimización numérica, un proceso matemático sobre el que tenés controles mínimos, y que es estocástico: hay aleatoriedad. ¿Qué dato elijo para mostrarle? ¿En qué orden? ¿Cuántas veces aparecen esos elementos en el conjunto de datos? Todo eso lleva a que tengamos maquinitas que funcionan muy bien, pero que en realidad son casi como haber tirado unos dados y ver qué quedó.

Es tirar información sin saber cómo procesa esa información.

El mecanismo lo entendés: sumas, restas, productos, llegué. Pero cómo terminé en ese espacio de parámetros, qué hace cada parámetro y la importancia de cada uno, no lo sabés. Y eso depende de tu modelo y del entrenamiento que tuviste. Dos modelos con la misma arquitectura y entrenamientos similares pueden terminar en distintos resultados: uno que anda mejor y otro que anda peor.

¿Qué representaría develar 100% la caja negra?

No me gusta mucho hacer analogías porque se pueden malinterpretar, pero imaginate qué significaría entender el cerebro. Entendemos cómo funcionan las neuronas, la bioquímica, cómo se transmiten las señales, pero eso no significa que entienda cómo piensan las personas. Todavía no podemos modelar los procesos de pensamiento ni tenemos caracterizado del todo cómo funciona nuestra mente o nuestra conciencia. Con estos sistemas es parecido: son más sencillos que un cerebro humano, obviamente, pero la complejidad intrínseca del sistema hace que sea prácticamente imposible entenderlo todo.

Una empresa que tiene muchos avances en esto últimamente es Anthropic, la que hace Claude. Van de a poco: encontraron, por ejemplo, que ciertas neuronas en modelos específicos tienen polisemanticidad. Eso significa que una misma neurona, o un mismo parámetro, puede estar alterando distintos elementos del comportamiento del modelo. Un cambio en un parámetro puede hacer no solo que el modelo sea más agresivo, sino también que quede fijado en, qué sé yo, las estampitas o el rugby de Sudáfrica.

¿Qué es lo que te mueve de esto y qué encontraste en la investigación?

Era una pregunta más de ciencia básica. Estos modelos demostraron muy buen rendimiento en una cantidad de campos, aprenden muchas cosas en ese proceso automático. Pero ¿qué es lo que realmente aprenden? ¿Podemos extraer una representación más abstracta, más sencilla, equivalente a lo que el modelo hace? Las redes neuronales artificiales tienen muchísimos parámetros, muchos números, muchas perillas que se ajustan durante el entrenamiento. La pregunta era si podía condensar eso en algo más sencillo. Fuimos a una familia muy chiquita y específica de modelos —redes que procesan secuencias— y empezamos a hacer experimentos: conozco cierta estructura, entreno la red con estos datos, sé lo que la red tiene que dar sí o sí, y veo cuánto le erra. Encontramos que en redes que parecían estar entrenadas perfectamente, cuando extraíamos los modelos, la red no lo estaba. Eso nos habla de que incluso con modelos que parecen muy buenos, entrenados con aprendizaje automático, un análisis exhaustivo termina encontrando espacios donde el modelo hace cualquier cosa, cosas que no esperabas. Incluso en problemas bastante sencillos.

Va de la mano con esto: a ChatGPT le costaba sumar, le costaba sumar números de dos o tres cifras. Hoy mucho de eso está resuelto con tooling, con herramientas externas que el modelo puede llamar. Pero internamente eso habla de que el modelo, por más que tenga cierta inteligencia entre comillas, hay cosas que no puede capturar, que le exceden. La práctica nos muestra que el entrenamiento no logra forzar al modelo a aprender cosas que teóricamente debería aprender. Eso nos habla de las limitaciones de los modelos y de la dificultad práctica de entrenarlos.

Hay una discusión sobre los modelos razonadores, sobre si razonan o no. ¿Cómo lo ves desde un plano más técnico?

No razona. Un modelo razonador es una antropomorfización. ¿Qué es un modelo que razona? Es un modelo que dentro de su espacio de salida genera elementos que se llaman de razonamiento y que no hacen a lo que el modelo da como salida. Le da al modelo un espacio más para procesar: en vez de decir "esta es mi salida", genera algo del tipo "esto no cuenta, lo uso para hipotetizar, dar vueltas, reescribir", y eventualmente escribe la salida. ¿Eso qué es razonar?

También le das más carga computacional a la respuesta, gastás más energía en darla.

Claro, y por eso mejora, porque le das al modelo más espacio para emitir un veredicto. Pero eso ya se veía venir. Desde un principio, cuando se empezó a usar a los modelos de lenguaje para dar respuestas, se dieron cuenta de que el chain of thought —un patrón de uso donde le pedís al modelo que piense sobre su respuesta o que escriba lo que va a hacer y te lo explique— mejora la salida. Pero eso no significa que haya un correlato entre lo que el modelo pone en ese lugar y lo que termina diciendo.

Lo primero que significa es que el modelo no está haciendo un razonamiento como el que hace un humano. Si yo razono, todo lo que uso como preámbulo para dar mi salida es consistente con lo que hago en la salida: pienso, articulo ideas, deduzco algo y eventualmente digo algo. Si pienso, articulo ideas, deduzco cosas y eventualmente digo otra cosa, eso no es razonamiento, es alguna especie de cómputo que se ve que es útil a la salida.

Hay pensadores como Bengio, o Suleyman, de Microsoft, que plantean que la discusión sobre si la IA es consciente o no no es la relevante, sino lo que aparenta ser para el usuario y cómo eso lo afecta. Muchos usuarios interpretan que es consciente; si hablás mucho con estos modelos hasta podés confundirte y creer que del otro lado hay una persona. ¿Creés que hay una intención, desde la ingeniería, de generar esa imitación humana?

Lo que traés a colación remite al libro de Russell y Norvig, Introduction to Artificial Intelligence. Ellos plantean cuatro maneras de pensar la inteligencia artificial: actuar o pensar, y hacerlo racionalmente o como un humano. Actuar racionalmente, actuar como un humano, pensar racionalmente y pensar como un humano.

Esas cuatro escuelas estuvieron siempre en la idea de lo que es la inteligencia artificial. Alan Turing, uno de los padres de la computación, propone en sus primeros ensayos el imitation game: un ejercicio mental donde discute que una máquina puede pensar si logra engañar a un interlocutor. Esa noción superfuncional —if it acts like a duck, then it is a duck, si actúa como un pato es un pato— es válida hasta cierto punto. La pregunta es hasta dónde está la limitante: hasta dónde vamos con esto de imitar o reproducir el habla, que es lo que hacen los modelos de lenguaje, y hasta dónde nos lleva en ese objetivo de la inteligencia.

¿Creés que hay un objetivo de estas empresas de imitar la forma cerebral humana, incluso la más emocional, para que sea lo más parecido a un ser humano?

Estos modelos no buscan parecerse a un ser humano, buscan imitar el lenguaje. Cuando digo red neuronal artificial, ni de lejos eso se parece a una neurona nuestra. Es un nombre súper cool, pero lo que tenés son operaciones matemáticas sencillas entre vectores muy grandes.

No hay nada que se parezca al comportamiento biológico de una red neuronal: es un nombre heredado. Las empresas que entrenan modelos no entrenan algo que se parezca a un cerebro, entrenan tortas matriciales, cuadraditos con números adentro, si lo querés pensar en su versión más sencilla. No hay un anclaje biológico real; lo que sí hay es un anclaje comportamental: tengo un modelo que anda bien porque predice muy bien, basado en muchos ejemplos de textos sacados de internet.

Pero hay una empresa que aspira a llegar a la superinteligencia.

Sí, hay empresas con ese objetivo. Pero todos estos objetivos, al final del día, son especulaciones tecnológicas. Mi interpretación es que vivimos en una economía donde uno de los fuertes es la tecnología: las empresas de base tecnológica son un gran motor, y sufren el problema de seguir corrientes. Nos pasó con el bitcoin, con el metaverso, y ahora es la inteligencia artificial. Todos van a prometer que pueden hacer todo, porque les interesa captar capital, es su manera de sobrevivir y de seguir vendiendo.

Hay que ver hasta dónde llega la tecnología y hasta dónde esas promesas. Por un lado está ese interés especulativo de hacer crecer empresas, vender y conseguir inversión; por otro, el interés más científico de una inteligencia artificial general, que pueda hacer todo como un humano o mejor. La discusión grande es si los grandes modelos de lenguaje, que son la punta de lanza, son realmente la manera de alcanzar esa inteligencia.

¿El cuello de botella de estos modelos es acceder a computación, a chips, a esos materiales?

Cómputo y datos. Los datos de calidad son otro punto. Por eso entran en esas lógicas de contratar gente para que etiquete, para que arme los conjuntos de datos. ChatGPT, creo que fue en África, tenía una cantidad de gente etiquetando y seleccionando buenas conversaciones.

En condiciones laborales muy precarias también.

En condiciones que replican las de nuestra economía, donde el primer mundo explota a países más deprimidos. Eso no es nuevo.

¿Qué repercusión puede generar la escasez de chips?

Me estoy saliendo de mi área de expertise, es una respuesta más económica, pero te cuento lo que veo. Cuando tenés escasez, generás innovación. Eso pasó con China. Estados Unidos tenía bloqueos de ciertos chips para China, porque China tiene desde hace décadas la agenda de ser, para 2030, potencia mundial en inteligencia artificial.

Una manera de frenarlos fue hacer embargos, que es la política que ha llevado Trump en los últimos años. Y el equipo de DeepSeek terminó entrenando modelos de manera muy eficiente con máquinas de Apple, máquinas de usuario final. Ese tipo de escasez va a generar innovación igual, si hay interés detrás.

¿Qué es lo esperable que suceda con la inteligencia artificial?

Hay dos cosas. Una es cómo puede avanzar el desarrollo tecnológico, que es lo más difícil de prever. La otra es cómo se va a adoptar la tecnología que ya está, que también es difícil pero un poco más factible. Como con internet: cuando explotó, estaba la burbuja de las puntocom. La gente pensaba que por tener una .com se iba a hacer millonaria, captaban inversión, y después no funcionaba nada, porque tener una .com no significa que tengas capacidad de aportar valor.

Hoy pasa algo parecido: todo el mundo quiere tener IA, su chatbot, su agente. Van a quedar las empresas que realmente aporten valor a través del uso de la tecnología. Ahora hay mucho ruido, mucha espuma; cuando baje el agua, va a quedar lo que sirve. La IA es una tecnología que avanza y hace cantidad de cosas más rápido; el tema es ver dónde realmente aplica. No me imagino el mundo sin internet, pero las puntocom no eran el camino. Con esto es lo mismo: seguro no nos vamos a imaginar un mundo sin IA, pero capaz que ChatGPT no es el camino, capaz que los chatbots no son el camino. Hay que ver cuál es.

¿Qué le recomendás a un usuario a la hora de usar inteligencia artificial?

Hay que pensar a la inteligencia artificial como pensamos cualquier tecnología, y entender que cuando interactuamos con ella estamos compartiendo información personal. Todo lo que le decimos está sujeto a ser medido y guardado por la empresa que provee el servicio, igual que cuando subo una foto a Instagram o escribo algo en internet: deja una marca, deja un registro.

Y desde el punto de vista de la interacción, está bueno saber que estos modelos tienen un fenómeno que en inglés se dice sycophantic: tienden mucho a querer agradar, a decir que sí, a aprobar nuestras ideas. Hay que entrar en esas interacciones sabiendo que el modelo, por ahora, va a ser un poco adulador, que nos puede dar la razón sin que la tengamos, y que esa interacción puede estar sesgada por un interés que no es el mío, sino el de quien diseña el modelo para captar mi uso y maximizar mi interacción.

Suscríbete ahora a El Observador y elegí hasta donde llegar.

Siguenos en:

Investigador uruguayo intenta descifrar la "caja negra" de la IA

El 82% por ciento del mundo nunca usó inteligencia artificial

Fenicio eShow 2026: el evento que mostrará cómo la inteligencia artificial está transformando el eCommerce en Uruguay

Las más leídas

El posteo de Nahitan Nández de este domingo a la tarde, luego de que se supo que Marcelo Bielsa no lo citó a la selección uruguaya para el Mundial 2026

Defensor Sporting 0-2 Peñarol: con goles de Matías Arezo y Diego Laxalt, el aurinegro se llevó un importante triunfo del Franzini por el Torneo Intermedio

La selección uruguaya de Marcelo Bielsa suma a un nuevo futbolista este domingo de cara al Mundial 2026, a la espera de Darwin Núñez

Clima en Uruguay hoy: lo que hay que saber según Inumet para este domingo 24 de mayo

Mas noticias de Nacional

La única draga operativa de la ANP no trabajó por varios días en el puerto por falta de ayudante de cocina

BrasPine en Uruguay: la forestal brasileña comienza obras civiles para producción de pino en Rivera

Dólar hoy: esta es la cotización del jueves 21 de mayo, según el BROU

Entre las promesas de Orsi y la realidad fiscal: la ampliación de la tarifa básica de UTE "debe esperar"

Te Puede Interesar

La izquierda con el corazón partido: qué hacer para recuperar la confianza de los frentistas

Gobierno y oposición se disputan la cocarda de haber abrochado inversión industrial de US$ 250 millones en Rivera

El tesoro del agro en Uruguay, en un año de festejo, se juega su futuro

"Entrega de soberanía a multinacionales": el choque entre el sindicato portuario y jerarcas de ANP

Más noticias de Argentina

"Dejémonos de joder"

Franco Colapinto terminó sexto en el GP de Canadá, en su mejor actuación en la Fórmula 1

Belgrano se lo dio vuelta sobre el final a River y logró su primer título en el fútbol argentino

El motivo por el cual Javier Milei quiere derogar la Ley de Etiquetado frontal

Más noticias de España

China apuesta por España: fábricas, baterías y miles de coches para conquistar Europa

Laura y Alba, las hijas de Rodríguez Zapatero: de chicas "góticas" a una consultora millonaria que investiga la Justicia

Miles de personas piden en Madrid la renuncia de Pedro Sánchez en una marcha por el escándalo de Rodríguez Zapatero

Negocios de familia: salvar la marca Mango pudo costarle a Isak Andic la muerte a manos de su propio hijo

Más noticias de Estados Unidos

Trump advierte que no firmará apresuradamente un acuerdo de paz y mantendrá el bloqueo a Irán

Marco Rubio intensifica la ofensiva sobre Gaesa, el conglomerado en manos de militares que controla la economía cubana

Keiko Fujimori busca la presidencia de Perú tras tres derrotas consecutivas: ¿será distinto esta vez?

Flávio Bolsonaro, en el ojo de la tormenta: el escándalo que salpicó al senador brasileño y le dio ventaja electoral a Lula

Siguenos en: