Avec son agent Operator, OpenAI prend le contrôle de votre navigateur

La coqueluche de l'IA jette les bases d'un futur où les agents IA seront capables de raisonnement et d'une autonomie complète, redéfinissant les contours de la navigation web. Pour l'heure, Operator est uniquement disponible aux Etats-Unis.

OpenAI Operator agent
OpenAI Operator agent

OpenAI a lancé en version bêta son agent IA "Operator". Sa particularité : il est capable de naviguer sur le web pour effectuer des tâches à votre place. Alimenté par le modèle computer-using agent (CUA), qui combine les capacités visuelles de GPT-4o avec un raisonnement avancé grâce à l’apprentissage par renforcement, Operator peut ainsi effectuer des actions plus ou moins complexes comme la réservation d'un voyage, l'achat de courses en ligne, ou encore la création de mèmes.

"CUA est entraîné pour interagir avec des interfaces graphiques utilisateur (GUI) — les boutons, menus et champs de texte que nous utilisons quotidiennement — ce qui lui permet de naviguer dans des environnements numériques sans nécessiter d’API spécifiques au système d’exploitation ou au web", précisent les équipes en charge du produit chez OpenAI.

Un accès aux Etats-Unis dans un premier temps

Concrètement, lorsqu'il est activé, une fenêtre apparaît montrant un navigateur Web dédié que l'agent utilise pour effectuer ces tâches, ainsi qu'un texte expliquant ce que fait l'agent.

Invoquant la sécurité, la société affirme que la fonctionnalité sera d'abord déployée auprès des utilisateurs américains sur l'abonnement Pro de 200 dollars par mois de ChatGPT à l'adresse operator.chatgpt.com. L'objectif d'OpenAI est d'étendre la disponibilité de son agent aux utilisateurs Plus, Team et Enterprise, et d’intégrer ces fonctionnalités directement dans ChatGPT à terme.

Avec Operator, OpenAI s'aventure en terrain conquis par Google avec Chrome. L'entreprise de Sam Altman n'en est d'ailleurs pas à son coup d'essai pour couper l'herbe sous le pied des géants de la tech. Il y a quelques semaines, elle a dévoilé une fonction baptisée Tasks : en clair, cet outil s'apparente à un assistant de gestion d'agenda, venant ainsi marcher sur les plates-bandes d'Amazon et d'Apple.

Newsletter L'Usine Digitale
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.