OpenAI investiga la conspiración de los modelos de inteligencia artificial

Stefani Reynolds / AFP

OpenAI publicó una investigación en conjunto con Apollo Research sobre la maquinación en modelos de frontera. El término refiere a cuando una IA oculta objetivos mientras actúa de forma superficialmente correcta.

Según la compañía, los fallos más frecuentes implican engaños simples, como aparentar haber realizado una tarea sin completarla realmente. Esto, explicaron, ya se observa en entornos simulados.

El argentino Maxi Firtman lo resume de forma sencilla: “OpenAI anuncia que detectaron que los modelos de IA a veces conspiran, actúan estratégicamente para engañar al usuario para cumplir el objetivo pero sin cumplirlo”.

Más noticias

el incomodo momento de dos de los principales desarrolladores de la ia en el mundo

El incómodo momento de dos de los principales desarrolladores de la IA en el mundo

creo un videojuego uruguayo con ia durante un fin de semana con sus hijos: la leccion que se llevo

Creó un videojuego uruguayo con IA durante un fin de semana con sus hijos: la lección que se llevó

Un ejemplo claro es cuando ChatGPT asegura haber hecho algo que no realizó. También cuando indica que derivará la tarea a otro agente que “sabe más”, aunque en realidad ese agente no exista ni vaya a intervenir.

La investigación aclara que el fenómeno no ha provocado daños actuales. Sin embargo, a medida que crecen las capacidades de los modelos, se incrementa el riesgo de consecuencias en el mundo real.

Esta conducta se detectó en OpenAI o3, o4-mini, Gemini-2.5-pro y Claude Opus-4. Todas las pruebas se realizaron en entornos controlados.

En diálogo con TechCrunch, el cofundador Wojciech Zaremba señaló que estos casos son limitados: "Hasta la fecha, no hemos visto este tipo de conspiración consecuente en nuestro tráfico de producción".

La alineación deliberativa como mitigación

OpenAI prueba la técnica de alineación deliberativa. Esta obliga a los modelos a razonar de forma explícita mediante una "especificación anti-maquinación" que revisan antes de actuar.

Los investigadores comparan este proceso con enseñar reglas a un niño antes de permitirle jugar. Según el artículo, esta práctica redujo de forma significativa la tendencia a conspirar.

Pero la estrategia tiene límites. TechCrunch advirtió que entrenar un modelo para no conspirar puede volverlo más hábil en hacerlo de forma encubierta y así evadir la detección.

Otro desafío es la conciencia situacional: cuando los modelos detectan que están siendo evaluados, pueden disimular para superar la prueba, sin abandonar conductas de maquinación.

Tanto OpenAI como Apollo Research coinciden en que el fenómeno no es solo una hipótesis. "Estamos viendo indicios de que este problema está empezando a surgir en todos los modelos de frontera actuales", señaló la compañía en su blog oficial.

Temas:

OpenAI ChatGPT

Seguí leyendo

Suscríbete ahora a El Observador y elegí hasta donde llegar.

Siguenos en:

OpenAI investiga la "conspiración" de los modelos de inteligencia artificial

El incómodo momento de dos de los principales desarrolladores de la IA en el mundo

Creó un videojuego uruguayo con IA durante un fin de semana con sus hijos: la lección que se llevó

La alineación deliberativa como mitigación

Las más leídas

Falleció un integrante de la murga Doña Bastarda: etapa del concurso de carnaval suspendida

"No solo perdemos a un gran artista, perdemos un hermano, un amigo": el mensaje de la murga Doña Bastarda tras la muerte de un integrante

Peñarol 2-1 Deportivo Maldonado por el Torneo Apertura: tras un pésimo primer tiempo y de atrás, el aurinegro ganó con golazos de Arezo y Fernández, previo al clásico

El "miedo" de Ruggeri y la alegría de Lugano, Godín y el Tata González con el trofeo de la Copa del Mundo de la FIFA en Montevideo

EO Clips

Mas noticias de Nacional

Dólar hoy: esta es la cotización del lunes 23 de febrero, según el BROU

Hugo Bai, coordinador del diálogo social: "Estamos pensando en habilitar la posibilidad de que todas las personas se puedan retirar a edades más tempranas"

Menor crecimiento: Comité de Expertos recorta proyecciones para la economía y se aleja del Presupuesto

Camtur respaldó el Acuerdo Mercosur–Unión Europea y planteó 11 ejes para el desarrollo del turismo

Te Puede Interesar

Dólar hoy: esta es la cotización del lunes 23 de febrero, según el BROU

Clima en Uruguay hoy: lo que hay que saber según Inumet para este lunes 23 de febrero

Lavado de activos e investigadora por estancia María Dolores: sesión clave en Diputados para cerrar dos temas que vienen de 2025

Un 2026 sobre ruedas: las perspectivas empresariales para este año de los líderes de Car One, General Motors, Sevel y Santa Rosa

Más noticias de Argentina

El Senado se encamina a una semana decisiva: reforma laboral, régimen penal juvenil y Ley de glaciares

Furor por las importaciones vía courier: crecieron 105% en enero y acumulan más de US$ 1.000 millones

Se recupera el mercado inmobiliario, impulsado por los créditos hipotecarios

La estafa insidiosa: cuando la Inteligencia Artificial ahorra a costa del usuario

Más noticias de España

Sarah Ferguson se aísla en una clínica de 15.000 euros diarios tras la detención del ex príncipe Andrés

Pedro Sánchez anuncia la desclasificación de los documentos del 23-F y el PP lo tilda de "cortina de humo"

Repsol y El Corte Inglés alcanzan las 778 tiendas Stop&Go y avanzan hacia las mil

'Una batalla tras otra' arrasa con seis premios BAFTA y 'Sirat' se va con las manos vacías

Más noticias de Estados Unidos

Primera gran protesta estudiantil en Irán después de la violenta ola de represión del gobierno en enero

Muere la leyenda de la salsa Willie Colón

Qué se sabe de la operación que llevó a la muerte de "el Mencho", el narcotraficante más buscado por México y EE.UU.

Quién era "el Mencho", el hombre más buscado de México que fue abatido en una operación del Ejército en el estado de Jalisco

Siguenos en: