OpenAI presentó formalmente su nueva línea de agentes autónomos, modelos de inteligencia artificial diseñados para ejecutar tareas en computadoras y navegadores web de forma independiente. Este desarrollo marcó el paso de los modelos generativos pasivos a sistemas de IA de acción que operan software de terceros sin supervisión constante del usuario.
Según el reporte técnico de la organización, la arquitectura permite que la herramienta mueva el cursor, haga clic en botones y complete formularios complejos para cumplir objetivos específicos. La capacidad técnica se basó en una comprensión visual y lógica de los elementos en pantalla, lo que permitió que el sistema procesara datos.
Solus- LR, el dron submarino que recorrió más de 2.000 kilómetros con sólo una carga de hidrógeno
La compañía buscó con este lanzamiento posicionarse frente a competidores como Anthropic y Google, quienes también iniciaron pruebas con funciones de "uso de computadora" en sus propios modelos.
El sistema demostró eficiencia en la planificación integral de viajes, donde el agente ingresó a sitios de reserva, comparó precios y completó el proceso de pago sin que el operador humano intervenga en cada paso.
La tecnología utilizó una capa de razonamiento que le permitió corregir errores en tiempo real si una página web demoraba en cargar o si un formulario presentaba campos obligatorios adicionales.
En el área de desarrollo de software, el modelo programó funciones básicas de código y las ejecutó dentro de entornos locales para verificar su funcionamiento. Esta autonomía representó una ruptura con los chatbots tradicionales que solo entregaban líneas de texto para que el usuario las copiara y pegara manualmente en sus herramientas de trabajo.
¿Qué funciones específicas pueden realizar los agentes de OpenAI?
Los nuevos agentes ejecutaron acciones como la redacción y envío de correos electrónicos en respuesta a hilos de conversación previos, basándose en la información contenida en archivos de Excel guardados en el disco duro.
La capacidad de saltar entre una planilla de cálculos y un cliente de correo electrónico sin comandos intermedios redujo el tiempo de procesamiento de tareas administrativas en un 70%.
Fenómeno argento: locura por Colapinto
El sistema también demostró competencia en la gestión de compras en línea y la organización de agendas complejas, cruzando datos de calendarios compartidos y preferencias de ubicación.
La automatización de procesos mediante agentes autónomos puso el foco sobre los empleos de entrada de datos y soporte técnico de nivel inicial. Al poder replicar las acciones físicas de un humano frente a una pantalla, la herramienta reemplazó la necesidad de intervención manual en tareas repetitivas de carga de información y seguimiento de trámites burocráticos.
La densidad informativa de estos modelos permitió que una sola instancia de la IA gestionara múltiples flujos de trabajo de forma simultánea, algo que anteriormente requería equipos enteros de coordinación humana.