Para quienes les tapó la ola sobre esto, se los cuento acá: el modo agente de ChatGPT es una función que crea una suerte de escritorio virtual y ejecuta tareas por vos. Por ejemplo, si le pedís una lista de productos en la tienda del supermercado, entra a la web y ves el cursor de tu mouse yendo, solo, producto por producto, seleccionándolo y añadiéndolo al carrito.
ChatGPT y la compra del asado del fin de semana
Este modo es extremadamente fácil de usar, de ahí mi predicción sobre su poder masificador. Solo tenés que: apretar el botón “Herramientas”, activar el “Modo Agente” y listo. Por ahora, solo está para usuarios que pagan al menos US$ 20 por mes.
El primer caso de uso que te quiero compartir es el del pedido al supermercado. Hice un reel en mis redes sociales usando este pedido a la IA de OpenAI:
- "Voy a hacer un asado con mis amigos el fin de semana, comprá 5 kilos de asado, un 1k de pulpón, papas Lays grandes, una Coca, tres cervezas y un helado de tres litros de las marcas que quieras. Hacé el pedido en el Disco de Scosería en Montevideo, Uruguay."
Lo único que debí hacer fue "tomar el control" para poner mi usuario y luego mi tarjeta de crédito para concretar la compra, nada más. Entró al sitio, buscó cada producto, armó el carrito y me pidió solo iniciar sesión y confirmar los datos. En 6 minutos estaba todo pronto.
Pero este modo tiene algunos problemas con casos de uso más complejos.
Comprá entradas para el cine, reserva mesa en restaurante y agendaloAsí se ve cómo el modo agente de ChatGPT compra entradas de cine. Va desplegando menúes donde uno puede ver qué acción quiere ejecutar en ese momento.
Como vi que la compra del súper la cumplía más o menos bien, decidí exigirlo un poco más. Y le pedí que ejecutara, de manera autónoma, varias tareas a la vez. Entonces le escribí:
- Quiero que organices una salida con mi pareja este sábado por la noche en Montevideo. Buscá qué películas hay en cartelera en el Movie o Life Cinemas, elegí una que esté buena y que no sea muy tarde. Comprá dos entradas y agendalo en mi Google Calendar. Después, buscá un restaurante lindo cerca del cine (tipo comida rica, ambiente tranquilo), hacé la reserva y sumalo al calendario también. Mandame un resumen con todo lo que hiciste, y prepará un mensaje para que le reenvíe a mi pareja con los detalles de la noche. Acordate que estamos en Uruguay, usá lugares reales y hora local.
El trabajo le demandó más de 40 minutos. Probablemente, todo el proceso a un usuario humano le llevaría menos tiempo, pero la gracia de esto es desentenderse de la tarea y, mientras vos estás trabajando en otra pestaña de tu computadora, cuidando a tus hijos, bañándote o la actividad que se te ocurra, esto se ejecute sin mover nada.
¿Qué resultados concretó? Coordinó la compra de entradas para el cine, la reserva en un restaurante, la organización en Google Calendar y dejó todo listo para pagar y confirmar. Solo faltaba completar algunos datos personales para finalizar el proceso.
El Agente eligió la película Cómo entrenar a tu dragón en Movie Punta Carretas, seleccionó los asientos (fila 6, butacas 4 y 5) para la función del sábado a las 19:35, y dejó la compra pausada en la última pantalla del sitio web, esperando que yo ingresara mi C.I., nombre y mail para completar el pago de $1.005.
Después buscó un restaurante cercano y propuso Baco Vino y Bistro, un bistró mediterráneo con buena carta de vinos. Programó una reserva para las 21:45, justo después del cine, y también dejó lista la solicitud online a la espera de mis datos para enviarla.
Por último, armó dos eventos en Google Calendar, uno con los detalles del cine y otro para la cena, pero esperó mi confirmación antes de guardarlos.
En total, el agente coordinó cuatro tareas concretas que normalmente llevarían varios minutos y pestañas abiertas. Lo hizo en menos de 10 minutos, aunque dependió de mí para los últimos pasos. ¿Lo mejor? No tuve que buscar nada ni entrar a ningún sitio: solo pedí y el agente ejecutó.
Las limitaciones de este ejemplo
Una de las principales limitaciones del modo Agente de ChatGPT, detectada tanto por este periodista como por varios creadores de contenido especializados en inteligencia artificial, es que aún enfrenta obstáculos al momento de ejecutar ciertas tareas que, en teoría, deberían ser simples. Por ejemplo, al intentar reservar una mesa en un restaurante que solo acepta reservas por WhatsApp, el asistente no logra completar la acción. En lugar de adaptarse al canal disponible, el Agente prioriza buscar botones web de reserva directa y, si no los encuentra, falla en su intento. Este tipo de trabas no solo impide completar la tarea, sino que además genera demoras importantes en la ejecución general del pedido.
Pero también entiendo que si los usuarios empezamos a reservar mediante este modo de ChatGPT, es cuestión de tiempo que las empresas se alineen y faciliten que las reservas se hagan vía web.
Buscar apartamentos y crear presentacionesAsí actúa el modo agente de ChatGPT a la hora de buscar apartamentos.
Este ejemplo es más sencillo, y tal vez no tan útil a priori, pero mezclado con otra tarea puede resultarte interesante. Esto le pedí al modo agente:
- "Buscá 10 apartamentos en Pocitos, en Montevideo, Uruguay, que estén a la venta y cuesten menos de 250 mil dólares. Quiero que tengan dos dormitorios y garaje. Luego crea una presentación en PowerPoint y mandamela por mail a [email protected]."
El trabajo le demoró 11 minutos en todo el proceso (no pudo enviar el mail porque no tenía acceso a un servicio de correo, pero es cuestión de dárselo para que lo haga). Con darle ingresos una vez, ya los tiene guardados para siempre.
La presentación que armó es decente, aunque con algunas deficiencias: no tenía los links (tal vez se los tenía que haber pedido), los apartamentos no tenían fotos (algo sustancial para echar un primer vistazo para descartar si comprarlo o no) y no es muy atractiva visualmente (te dejo el link por acá). Seguro que, si como usuario uno le pide que mande mensajes a las inmobiliarias, podría hacerlo, aunque estoy seguro de que mostraría algunas dificultades.
El futuro
Más allá de los problemas, no hay que olvidar que esta herramienta recién se lanzó al mundo hace 10 días. Y, para ser el primer acercamiento, es brutal la capacidad que tiene. Por eso, no es de extrañar que no solo mejore la velocidad muy pronto, sino que también impacte en nuevos casos de uso que hoy desconocemos.
Quiero repetirles una reflexión que ya he manejado en esta newsletter, pero que esta vez siento que está cristalizada: el mundo que ya estamos experimentando (no el que viene, sino el de ahora) es el que conecte a nuestros agentes con los agentes de las empresas. Y esto permitirá enfocarnos en tareas mucho más relevantes. El tema será cuáles. ¿Qué pensás?
Hasta dentro de dos semanas.
¿Qué es esta newsletter?
Soy Juan Pablo De Marco, escribo de tecnología, y por cualquier comentario, inquietud o si tenés ganas de que hable sobre algún tema podés escribir a esta dirección.
En esta newsletter Nueva pestaña, que te llega jueves de por medio, te cuento todo sobre tecnología e inteligencia artificial. Pero tenemos más de una decena de opciones de newsletters de autor, que seguro te van a gustar. Si querés administrar qué newsletters recibir, lo podés hacer desde acá.