OpenAI ha annunciato il lancio di un nuovo strumento di intelligenza artificiale chiamato Operator, progettato per automatizzare compiti sul web interagendo con elementi come pulsanti, menu e campi di testo.

Si tratta di un agente IA in grado di gestire in autonomia un browser web ed eseguire azione senza intervento umano. Per il momento, Operator sarà disponibile soltanto per abbonati a ChatGPT Pro (il piano più costoso disponibile) residenti negli Stati Uniti, ma l’azienda ha dichiarato di voler estendere in seguito l’accesso anche agli utenti degli altri piani.

L’agente arriverà in altri Paesi nel corso delle prossime settimane, anche se per l’Europa ci sarà da attendere maggiormente a causa delle ristrettive leggi sulla privacy e del mercato digitale. Operator è alimentato da un modello denominato Computer-Using Agent (CUA), che combina le capacità di elaborazione visiva di GPT-4o con funzioni avanzate di ragionamento, ed è in grado di interagire direttamente con le interfacce web.

Come funziona e cosa permette di fare Operator

Operator è in grado di automatizzare diverse attività sul web come la prenotazione di viaggi e hotel, la ricerca di ristoranti o lo shopping online. Quando viene attivato, si apre una finestra dedicata con un browser specifico sviluppato da OpenAI, con un’interfaccia che consente all’utente di scegliere tra diverse categorie di operazioni come acquisti, consegne, prenotazioni o altro.

L’agente IA, sebbene sia automatizzato, non prende completamente controllo del browser web, lasciando la possibilità agli utenti di intervenire in qualsiasi momento e portare a termine l’operazione al posto di Operator. Grazie alla sua capacità di interagire direttamente con le interfacce dei siti web, il modello CUA può navigare autonomamente tra i menu, cliccare i pulsanti e compilare moduli come farebbe un utente umano.

OpenAI lancia Operator, un nuovo agente IA che automatizza l'attività sul web 1

OpenAI ha collaborato con colossi come eBay, DoorDash, Uber e StubHub per assicurarsi che Operator rispetti i loro termini di servizio, ma l’azienda riconosce comunque che questo modello di intelligenza artificiale non è infallibile. In certe situazioni, come ad esempio in presenza di compiti complessi come la gestione di calendari intricati o davanti ad un sito web con un’interfaccia molto elaborata, potrebbe non funzionare correttamente.

Per questo motivo è richiesta la supervisione degli utenti, che come già detto sono in grado di intervenire in qualunque momento, ed è richiesta la loro conferma prima di qualunque azione irreversibile, come la conferma di acquisto di un prodotto online. A tal proposito, inoltre, è richiesto l’intervento manuale dell’utente nella compilazione di dati di pagamento o sensibili, garantendo così la privacy ed evitando errori non richiesti di Operator.

Trattandosi di una versione in anteprima, dunque, è chiaro che Operator presenti ancora delle limitazioni nel suo utilizzo: OpenAI ha infatti impostato dei limiti giornalieri e dei vincoli in base alla complessità dell’attività richiesta, e allo stato attuale non è ancora possibile eseguire azioni come l’invio di email (sebbene il modello sia tecnicamente in grado di farlo) o la modifica di eventi nel calendario.

Operator è disponibile sul sito di OpenAI a questo indirizzo, ma come già detto in apertura è disponibile al momento esclusivamente negli Stati Uniti e per gli abbonati al piano più costoso di ChatGPT.