Los modelos razonadores: un empate
ChatGPT dio un paso adelante con el modelo 5, que permite acceder a niveles de razonamiento más altos en función de lo que el usuario pida. Y es gratis. Significa que la herramienta, según el tipo de solicitud, puede tomarse más tiempo para razonar y entregar una respuesta más profunda.
Si un usuario hace un prompt muy sofisticado y le pide al sistema que indague, analice o investigue, probablemente se active automáticamente un mecanismo que los expertos en IA llaman enrutador. Cuando fue lanzado, en agosto, no funcionaba del todo bien, pero con el tiempo se fue ajustando. Ese enrutador resulta útil porque los usuarios no siempre saben cuándo activarlo.
Gemini, en cambio, no cuenta con un enrutador automático. En su caso, el modelo de razonamiento debe activarse manualmente. Se puede hacer presionando el botón 2.5 Pro, ya que la versión estándar es Flash.
Gemini también se diferencia en la ventana de contexto, es decir, la cantidad de información que un modelo puede procesar y “recordar” al mismo tiempo en una conversación. “Si lo llevo a mi forma de trabajar en el día a día, muchas veces hago todo en un mismo chat y pienso: ‘así sabe bien de qué estamos hablando’. Pero no: eso es incorrecto”, señala un usuario.
Un chat, explica, funciona como una olla a la que se le agregan distintos ingredientes. Llega un momento en que se desborda. Así opera la ventana de contexto.
Según datos públicos, Gemini 2.5 Pro puede analizar hasta 750.000 palabras por interacción. La saga completa de Harry Potter tiene poco más de un millón, lo que significa que puede procesar más del 70 % de la obra. ChatGPT, en cambio, procesa hasta 100.000 palabras, unas 200 páginas. Gemini, por lo tanto, es más potente para analizar grandes volúmenes de texto.
Asistentes
ChatGPT presentó primero los llamados GPTs, una especie de “ChatGPTs” personalizados que los usuarios pueden configurar para que respondan con un estilo o propósito específico. Por ejemplo, se puede crear un GPT que redacte correos, publique en redes o elabore informes con un formato particular.
Para crear estos asistentes en ChatGPT hay que pagar. En Gemini se llaman Gems, y se pueden crear de forma gratuita. En ambos casos, pueden compartirse y usarse sin importar si el usuario es gratuito o pago.
Proyectos
Los proyectos están disponibles solo en ChatGPT, y desde hace poco también para usuarios gratuitos. Es una de las funciones más destacadas: permiten organizar los chats en carpetas y, además, actuar como un copiloto inteligente.
Dentro de un proyecto se pueden subir archivos de referencia, que la IA puede consultar. También es posible definir instrucciones fijas —como tono, estilo o formato— para no tener que repetirlas en cada interacción.
Por ejemplo, alguien que prepara una charla puede subir sus notas e ideas y dejar que ChatGPT mantenga memoria de ese contexto para acompañar todo el proceso.
Formatos de archivo e imágenes
En cuanto a formatos, Gemini tiene ventaja: permite subir archivos de audio y texto para procesar, algo que ChatGPT no admite por ahora. Esto convierte a Gemini en una buena opción para transcribir audios o grabaciones.
En el terreno de las imágenes, la ventaja pasa al otro lado. Durante el primer semestre del año, ChatGPT mostró un nivel de realismo nunca visto en generación de imágenes. Gemini quedó rezagado, aunque recientemente incorporó un modelo llamado Nano Banana, con gran consistencia entre imágenes.
¿Y videos?
Por ahora, tanto ChatGPT como Gemini exigen ser usuario pago para crear videos. Gemini lanzó el modelo Veo 3, que genera videos hiperrealistas de ocho segundos y que por un período se pudo usar gratis.
Hace poco, ChatGPT presentó Sora 2, que crea videos con sonido y alto realismo. Aunque es gratuito, requiere un código de invitación y por ahora solo está disponible en Estados Unidos. Algunos usuarios del exterior acceden mediante VPN.
Investigación profunda
El Deep Research o Investigación Profunda de Gemini funciona como un asistente de investigación que recopila información en la web y la organiza en un informe. Sirve para explorar temas complejos o comparar productos.
Tanto Gemini como ChatGPT ofrecen esta función a usuarios gratuitos, con un límite de cinco búsquedas mensuales. En los planes pagos, Gemini permite hasta 20 búsquedas diarias, mientras que ChatGPT ofrece 25 por mes. Los resultados, en ambos casos, son similares.
Otras funciones que tiene ChatGPT y que no tiene Gemini
Además de los proyectos, ChatGPT tiene ventajas adicionales. Una es la memoria mejorada, lanzada en abril de 2024. Permite al modelo recordar información relevante sin que el usuario deba repetirla. Por ejemplo, si se menciona una vez la edad de una hija, ChatGPT la tomará en cuenta en futuras conversaciones.
Otra es el modo agente, que realiza tareas autónomas combinando las funciones de Deep Research y Operator. Aunque todavía tiene margen de mejora, el potencial es grande: puede comprar productos o gestionar tareas sin intervención directa del usuario.
Jerónimo Pino, organizador de eventos, contó que usó ChatGPT en modo agente para automatizar la descarga de reels de Instagram. En pocos minutos, el sistema procesó los enlaces y devolvió los videos listos para publicar, una tarea que manualmente habría llevado horas.
Por último, ChatGPT lanzó la función “Aplicaciones”, que permite usar servicios como Booking o Spotify directamente desde el chat. Basta escribir la tecla “@” y el nombre de la app. Esta integración, disponible incluso para usuarios gratuitos, busca concentrar cada vez más tareas dentro del propio asistente y reducir la navegación web tradicional.
Además, ChatGPT incorporó recientemente un modo parental. Madres, padres y adolescentes pueden vincular cuentas, lo que ofrece a los adultos herramientas para ajustar ciertas funciones, establecer límites y añadir medidas de protección que se adapten a las necesidades de cada familia. Esta función apunta a brindar mayor seguridad y control sobre el uso del modelo por parte de menores de edad.