El presidente de la Olimpiada Internacional de Matemáticas (OMI), Gregor Dolinar, confirmó que los concursantes humanos lograron superar a los modelos de Inteligencia Artificial (IA) en la reciente edición del concurso, celebrada en Queensland, Australia.
Aunque los modelos de IA desarrollados por Google y OpenAI lograron puntuaciones de nivel oro, ninguno alcanzó la puntuación perfecta, un logro reservado para los cinco jóvenes que destacaron en la competencia.
Resultados sobresalientes de los participantes humanos
Cinco jóvenes concursantes, todos menores de 20 años, alcanzaron la máxima calificación posible de 42 puntos en la OMI, lo que les permitió obtener la medalla de oro. A pesar de que los modelos de IA de Google y OpenAI lograron puntuaciones impresionantes, ninguno de ellos consiguió igualar la excelencia de estos jóvenes matemáticos, quienes fueron los únicos en obtener la puntuación perfecta.
Desempeño de Google DeepMind en la competencia
Uno de los modelos más avanzados de IA, Google DeepMind, alcanzó un puntaje de 35 sobre 42, obteniendo también una medalla de oro. El sistema chatbot Gemini de Google resolvió cinco de los seis problemas matemáticos planteados en la OMI. Según los evaluadores de la competencia, las soluciones presentadas por la IA fueron descritas como "sorprendentes", siendo claras, precisas y fáciles de seguir, lo que contribuyó a su alto puntaje. Sin embargo, no se pudo confirmar si Google utilizó recursos adicionales o si hubo intervención humana en la resolución de los problemas.
OpenAI y su modelo de razonamiento experimental
Por su parte, OpenAI también presentó un modelo experimental de razonamiento, que obtuvo un puntaje similar al de Google, alcanzando 35 puntos sobre 42 y logrando una medalla de oro. Alexander Wei, investigador de OpenAI, explicó a través de las redes sociales que el modelo había sido evaluado bajo las mismas condiciones que los concursantes humanos. Además, señaló que las respuestas generadas por el modelo fueron calificadas de forma independiente por tres ex medallistas de la OMI.
Transparencia en la evaluación de los modelos de IA
A pesar de los avances de los modelos de IA en esta competencia, los organizadores de la OMI no pudieron verificar si los modelos de inteligencia artificial utilizaron recursos informáticos adicionales o si hubo algún tipo de asistencia humana en la resolución de los problemas.
Esta incertidumbre ha generado preguntas sobre el impacto de la tecnología en este tipo de concursos académicos y la necesidad de una mayor transparencia en los procesos de evaluación de la inteligencia artificial en competencias de alto nivel.