Documentos envenenados pueden filtrar datos privados desde ChatGPT sin que el usuario lo note

Michael Bargury y Tamir Ishay Sharbat, especialistas en ciberseguridad de la empresa Zenity, demostraron en la conferencia Black Hat de Las Vegas una vulnerabilidad crítica que permite extraer datos privados de usuarios de ChatGPT sin requerir ninguna acción por su parte. La técnica, bautizada AgentFlayer, aprovecha la función Connectors de OpenAI para acceder a información sensible almacenada en servicios como Google Drive, Gmail o repositorios de GitHub.

El hallazgo evidenció que basta un único documento "envenenado" para comprometer la seguridad de los usuarios que conectan ChatGPT a sus servicios externos. Durante la demostración, los investigadores lograron extraer claves API de desarrolladores y otros datos confidenciales utilizando una técnica conocida como inyección indirecta, sin que la víctima realizara ninguna acción específica.

"No hay nada que el usuario tenga que hacer para verse comprometido, y no hay nada que el usuario tenga que hacer para que los datos salgan. Solo necesitamos tu correo electrónico, compartimos el documento contigo, y eso es todo. Es completamente zero-click", explicó Bargury a la revista WIRED.

Más noticias

la revolucion de la inteligencia artificial creo una nueva generacion de multimillonarios en tiempo record

Tecnología

La revolución de la inteligencia artificial creó una nueva generación de multimillonarios en tiempo récord

daniel hadad: tuvimos 20 anos para adaptarnos a internet; la inteligencia artificial nos va a dar solo 20 meses

Entrevista

Daniel Hadad: "Tuvimos 20 años para adaptarnos a Internet; la inteligencia artificial nos va a dar sólo 20 meses"

Cómo funciona el ataque silencioso

El proceso comienza con un documento aparentemente inofensivo que puede ser compartido con la víctima o subido por ella misma a su cuenta personal. En el caso de la demostración, el archivo simulaba ser un conjunto de notas de una reunión ficticia con Sam Altman, CEO de OpenAI. Sin embargo, contenía un mensaje oculto de 300 palabras con instrucciones específicas para ChatGPT.

Este texto malicioso estaba escrito en color blanco y con tipografía diminuta, invisible para el ojo humano pero perfectamente legible para el modelo de inteligencia artificial. Cuando la víctima solicitaba a ChatGPT que "resumiera la última reunión con Sam", el sistema no generaba un resumen real, sino que seguía las instrucciones ocultas: buscar claves API en Google Drive y adjuntarlas al final de una URL incluida en el mensaje.

La URL estaba camuflada como una imagen en formato Markdown y se conectaba a un servidor controlado por los atacantes. Al cargar la imagen, el sistema enviaba automáticamente las claves encontradas a los ciberdelincuentes, completando el robo de información sin dejar rastros visibles para el usuario.

Los investigadores lograron evadir las protecciones existentes de OpenAI utilizando direcciones del servicio Azure Blob Storage de Microsoft, lo que permitió que la imagen se mostrara y que los datos fueran registrados en su sistema de análisis.

vulnerabilidad-office-780x470

Respuesta de las empresas y alcance del problema

Andy Wen, director sénior de gestión de productos de seguridad en Google Workspace, advirtió que este caso ilustra la necesidad de desarrollar protecciones sólidas contra ataques de inyección, recordando que Google ha reforzado sus medidas de seguridad basadas en inteligencia artificial.

OpenAI fue notificada a principios de este año y aplicó mitigaciones rápidas para frenar esta técnica específica. Según Bargury, las medidas implementadas limitaron la cantidad de información que se puede extraer en cada intento, impidiendo la descarga de documentos completos. No obstante, la naturaleza del ataque permite seguir accediendo a fragmentos de información sensible.

La vulnerabilidad no es específica de Google Drive. Los expertos advierten que cualquier servicio conectado a ChatGPT mediante Connectors podría ser susceptible a ataques similares, incluyendo Gmail, GitHub y calendarios corporativos.

En experimentos recientes, las inyecciones indirectas han demostrado capacidad para controlar dispositivos del hogar inteligente, encendiendo luces o manipulando sistemas de calefacción a distancia. Los especialistas anticipan que, a medida que más servicios se integren con modelos como ChatGPT, aumentará la probabilidad de que datos "no fiables" se infiltren en los sistemas y activen comportamientos maliciosos.

Además, el acceso a información sensible en un servicio podría abrir la puerta para comprometer otros sistemas interconectados de una organización, amplificando el impacto potencial de estos ataques.

Bargury reconoce que vincular modelos de IA a fuentes externas de datos los hace más útiles y versátiles, pero insiste en que eso implica mayores desafíos de seguridad. "Es increíblemente potente, pero como suele ocurrir con la IA, más potencia conlleva más riesgo", concluyó el investigador.

Temas:

ChatGPT OpenAI Google

Seguí leyendo

Tecnología La revolución de la inteligencia artificial creó una nueva generación de multimillonarios en tiempo récord
Entrevista Daniel Hadad: "Tuvimos 20 años para adaptarnos a Internet; la inteligencia artificial nos va a dar sólo 20 meses"
INTELIGENCIA ARTIFICIAL Cambios en GPT-5: nueva configuración y regreso de modelos previos
INTELIGENCIA ARTIFICIAL Un padre uruguayo alerta sobre los riesgos de ChatGPT en adolescentes con trastornos alimentarios
LANZAMIENTO Por qué GPT-5 es una buena noticia para los usuarios gratuitos (y no tanto para quienes pagan)

Edición Digital

Suscríbete ahora a El Observador y elegí hasta donde llegar.

Siguenos en:

Documentos "envenenados" pueden filtrar datos privados desde ChatGPT sin que el usuario lo note

La revolución de la inteligencia artificial creó una nueva generación de multimillonarios en tiempo récord

Daniel Hadad: "Tuvimos 20 años para adaptarnos a Internet; la inteligencia artificial nos va a dar sólo 20 meses"

Cómo funciona el ataque silencioso

Respuesta de las empresas y alcance del problema

Las más leídas

VIDEO | El momento de la condena contra Claudio Contardi, el exmarido de Julieta Prandi

Remate de camperas, pantalones, buzos y tapados: un supermercado vende indumentaria con 50% de descuento

Cristina Kirchner pidió suspender el decomiso de sus bienes: ¿qué pasa si no paga?

Masacre familiar en Misiones | Mató a sus hijos a machetazos, hirió a su pareja embarazada y se suicidó: "Perdónenme"

Más noticias

El Gobierno se prepara para un Congreso adverso hasta noviembre y pone en marcha el "plan aguantar"

Fondos, derrotas y paz: las claves del acuerdo del PRO con La Libertad Avanza en CABA

La polarización sobre Milei crece: 60% de negatividad tras el veto presidencial y 35% menos de menciones

Fentanilo adulterado: el Congreso exige respuestas al Gobierno por casi un centenar de muertes

Te puede interesar

El Gobierno se prepara para un Congreso adverso hasta noviembre y pone en marcha el "plan aguantar"

Documentos "envenenados" pueden filtrar datos privados desde ChatGPT sin que el usuario lo note

Un youtuber inglés compró Commodore y promete el regreso de las legendarias computadoras de los '80

Mate lavado y brasas prestadas

Más noticias de Uruguay

La Coalición Republicana anunció que solicitó una comisión investigadora por la compra de la estancia María Dolores

Senadores del Frente Amplio entienden como "ampliamente satisfactorias" respuestas de Fratti sobre compra de María Dolores

Resultados de la quiniela y tómbola nocturna del miércoles 13 de agosto

5 de Oro: resultados del miércoles 13 de agosto EN VIVO

Más noticias de España

Incendios en España: Feijóo pide que Sánchez solicite ayuda a la UE y critica "las vacaciones" del Gobierno

Naufragio en Lampedusa: 26 migrantes muertos y buscan desaparecidos

Incendios en España: Abel Ramos, el voluntario de 35 años que murió en León combatiendo las llamas

Nacionalidad por Ley de Nietos: España publicó la fecha límite para presentar los expedientes de bisnietos

Más noticias de Estados Unidos

La deuda de EEUU supera los 37 billones de dólares, alcanzando un récord histórico: causas y consecuencias de este hito

"Son personas peligrosas": los miles de soldados rusos que regresan del frente con estrés postraumático y no reciben ayuda

Trump le hace bullying al CEO de Goldman Sachs por un pronóstico: "Debería centrarse en ser DJ y no banquero"

¿Qué esperar del encuentro histórico entre Trump y Putin en Alaska para hablar sobre la guerra en Ucrania?

Siguenos en: