Así es Operator, el agente de IA en ChatGPT que realiza tareas de forma autónoma

EA4339. BEIJING (CHINA), 23/05/2024.- Fotografía de archivo fechada el 9 de marzo de 2023 de una imagen ilustrativa mostrando la página de presentación de OpenAI, en su sitio web en Pekín, (China). News Corp, el coonglomerado de Ruppert Murdoch, suscribió un acuerdo con OpenAI por el que da "permiso" para nutrir sus productos de IA, como ChatGPT, con sus noticias y asesorarlo en materia periodística. EFE/EPA/WU HAO

Foto: EFE - WU HAO

OpenAI, la compañía responsable de ChatGPT, anunció el jueves 23 de enero el lanzamiento de una versión preliminar de investigación de Operator, su primer agente de inteligencia artificial de uso general que podrá tomar el control del navegador web y realizar algunas acciones de forma independiente. En la transmisión en vivo que realizó Sam Altman, CEO de la compañía, a través de X, inicialmente llegará primero a los usuarios de la suscripción Pro de Estados Unidos, la cual tiene un costo de USD $200. Del mismo modo, la compañía espera en un futuro ampliar esta herramienta a lo demás niveles de usuarios de pago.

Anteriormente, en una publicación en el blog empresarial, Altman compartió sus percepciones sobre las tendencias de la inteligencia artificial en este nuevo año. Uno de los puntos donde más hincapié realizó fueron los agentes de IA, herramientas que pueden automatizar y tomar acciones de manera autónoma en nombre de la persona.

Este nueva presentación es la primera apuesta real de OpenAI, empresa que ya fue pionera con los chatbots de IA generativa y la aparición disruptiva de ChatGPT en noviembre de 2022, pero que con relación a los agentes de IA, ha dado ventaja frente a otras compañías.

Vínculos relacionados

Estos son los precios de la nueva serie Galaxy S25 de Samsung

El impacto de la IA en el trabajo: tendencias y oportunidades según estudio

Tendencias digitales en Colombia: contenidos y redes que prefieren los usuarios

“Estará pronto en otros países”, dijo Altman, durante la transmisión en vivo del jueves. “Lamentablemente, en Europa tardará un poco”.

De acuerdo a la información de OpenAI, Operator promete automatizar tareas de los usuarios como compras en línea, reserva de hoteles o buscar tiquetes. Dentro de la plataforma, se dispondrán varias categorías de tareas que los usuarios podrán elegir en la interfaz de Operator, incluidas comparas, entregas, viajes y cenas, cada una con una forma diferente de automatización.

Le recomendamos leer: El buscador de ChatGPT está disponible para todos: útil, pero con riesgos ocultos

En el momento en el que los usuarios de ChatGPT activan el modo Operator, se despliega una ventana que muestra un navegador web especialmente diseñado para el agente, en el cual utiliza para completar las tareas. Las personas pueden seguir usando con naturalidad la pantalla y la navegación de internet mientras Operator realizar las instrucciones, debido a que utiliza su propio navegador especial.

En el siguiente ejemplo, un usuario de X, muestra un ejemplo claro de como funciona la nueva herramienta de OpenAI. A partir de una imagen y una receta, la persona le pidió a Operator los ingredientes para poder realizar la cena en casa. En el video se puede observar como el agente, de manera completamente autónoma, ingresa la página de un supermercado y comienza agregar al carrito de compra los ingredientes necesarios. Al finalizar le informa al usuario si existe alguna novedad, si quiere continuar con algún tipo de domicilio o si prefiere pedirlos para recogerlos.

No ad for you

La tecnología detrás de la nueva herramienta de OpenAI

La innovadora herramienta está impulsada por un modelo de agente denominado CUA (Computador Universal de Agente), una tecnología que combina las avanzadas capacidades de visión de GPT-4o con las habilidades de razonamiento de los modelos más sofisticados de OpenAI, esto permite que Operator interactúe directamente con la interfaz de los sitios web de manera intuitiva, sin necesidad de utilizar API orientadas a desarrolladores.

El CUA es capaz de operar en entornos web como lo haría un usuario humano: puede hacer clic en botones, navegar por menús y completar formularios de manera autónoma. Gracias a esta capacidad, empresas de domicilios, transporte, viajes, hoteles, supermercados y demás, están colaborando con OpenAI para garantizar que Operator opere dentro de los términos de servicio de sus plataformas.

No ad for you

Un aspecto clave es su enfoque en la seguridad y el control del usuario. El modelo está diseñado para solicitar confirmación antes de ejecutar tareas que puedan tener consecuencias externas, como enviar pedidos o correos electrónicos. Esto garantiza que los usuarios tengan la última palabra antes de que cualquier acción se haga efectiva. OpenAI insistió en que la meta es poder ampliar la confiabilidad a una gama más amplia de tareas en el futuro.

Limitaciones de Operator

A pesar de sus capacidades avanzadas, aún enfrenta limitaciones. OpenAI reconoce que el CUA no puede manejar de manera confiable tareas altamente complejas o especializadas, como la creación de presentaciones detalladas, la gestión de calendarios complejos o la interacción con interfaces web no estándar o altamente personalizadas.

No ad for you

Debido a razones de seguridad, ciertas tareas críticas, como las transacciones bancarias, requieren supervisión humana. Por ejemplo, los usuarios deben ingresar manualmente la información de sus tarjetas de crédito. OpenAI asegura que Operator no recopila ni almacena datos personales sensibles.

Además, en plataformas especialmente sensibles, como el correo electrónico, se requiere una supervisión activa del usuario para detectar y corregir posibles errores antes de que se realicen acciones críticas.

No ad for you

Implicaciones de seguridad

Cuando un sistema de IA puede realizar acciones en la web, abre la puerta a casos de uso mucho más peligrosos por parte de actores maliciosos. Se podrían automatizar agentes de IA para orquestar estafas de phishing o ataques DDoS, o hacer que consigan entradas para un concierto antes de que nadie más pueda hacerlo. Especialmente para una herramienta tan ampliamente utilizada como ChatGPT, es importante que OpenAI tome medidas para evitar ese tipo de ataques.

OpenAI parece pensar que Operator es lo suficientemente seguro como para lanzarlo en su forma actual, al menos como una vista previa de investigación.

No ad for you

“El operador emplea herramientas que buscan limitar la susceptibilidad del modelo a mensajes maliciosos, instrucciones ocultas e intentos de phishing”, explica OpenAI en su sitio web. “Un sistema de monitoreo detiene la ejecución si se detecta actividad sospechosa, mientras que los canales automatizados y revisados por humanos actualizan continuamente las medidas de seguridad”.

Operator es el intento más audaz de OpenAI hasta el momento de crear un agente de IA. La semana pasada, OpenAI lanzó Tasks, que le brinda a ChatGPT funciones de automatización simples, como la capacidad de establecer recordatorios y programar avisos para que se ejecuten a una hora determinada todos los días.

No ad for you

Le podría interesar: Así es Tasks, la nueva función de ChatGPT para gestionar tareas y recordatorios

Tasks proporcionó a los usuarios de ChatGPT algunas funciones familiares, pero necesarias, para que ChatGPT sea tan práctico de usar como Siri o Alexa. Sin embargo, Operator muestra capacidades que la generación anterior de asistentes virtuales nunca pudo ofrecer.

No ad for you

👽👽👽 ¿Ya está enterado de las últimas noticias de tecnología? Lo invitamos a visitar nuestra sección en El Espectador.

Así es Operator, el agente de IA en ChatGPT que realiza tareas de forma autónoma

La nueva herramienta de OpenAI promete automatizar tareas en navegación web para los usuarios como compras en línea, reserva de hoteles o la compra de tiquetes.

Vínculos relacionados

La tecnología detrás de la nueva herramienta de OpenAI

Limitaciones de Operator

Implicaciones de seguridad

Temas recomendados:

Estilo de Vida

Tecnología

OpenAI

ChatGPT

Operator

IA

Sam Altman

Chatbot