Avances Publicado el 18 de julio de 2025

OpenAI lanza ChatGPT Agent, su nuevo agente multitarea

Multiagente, integraciones y autonomía intelectual

El agente representa una convergencia de tecnologías avanzadas: aúna el motor de razonamiento profundo de “Deep research”, que facilita búsquedas complejas y extracción de insights a partir de múltiples fuentes, y la arquitectura de “Operator”, capaz de interactuar autónomamente con páginas web y servicios online. El resultado es una IA apta para asumir tareas compuestas, que requieren pasos secuenciales o paralelos, manteniendo una memoria contextual y un hilo conductor durante toda la sesión.

Por ejemplo, en la demo ofrecida por OpenAI, el agente resolvía en una única operación todos los aspectos logísticos de preparar la asistencia a un evento: desde la búsqueda y comparación de opciones de vestimenta según un código específico, hasta la reserva de alojamiento e incluso la sugerencia personalizada de regalos. Esta capacidad de coordinación implica una gestión masiva de datos externos y varios contextos en paralelo, con respuestas generadas en tiempos variables —entre 5 y 15 minutos para trabajos complejos—. Además, el agente puede integrarse con herramientas como Google Drive, Gmail o Google Calendar mediante APIs, accediendo a documentos, correos o recordatorios, e incluso manipulando esa información para generar informes o presentaciones enriquecidas gráficamente gracias a sus capacidades de generación de imágenes.

[EMBED:youtube:https://www.youtube.com/watch?v=2wzGS_WUZYQ]

Transparencia, interacción y control del flujo de trabajo

Uno de los avances más significativos es la transparencia operativa: los ingenieros de OpenAI han desarrollado una interfaz dinámica que permite al usuario monitorizar en tiempo real la actividad del agente. Esta función, comparable a un “live” de su razonamiento, muestra páginas consultadas, acciones tomadas y permite regresar a pasos anteriores, aportando o modificando datos sin interrumpir el proceso.

A nivel de interacción, el usuario puede redefinir tareas sobre la marcha, agregar instrucciones o precisar detalles, siendo el flujo reactivo y adaptativo a cada cambio introducido. Además, la arquitectura ha sido diseñada con un mecanismo de validación previa: ante acciones sensibles como el envío de emails o la publicación de documentos, el sistema siempre requerirá confirmación humana antes de actuar, reduciendo así los riesgos de acciones no deseadas.

Esta nueva función está disponible desde el apartado "Herramientas" de ChatGPT, tanto en la interfaz web como en la app móvil, reservada —al menos inicialmente— a las versiones Pro y Plus, mientras se espera confirmación sobre su lanzamiento en España y Latinoamérica.