Si chiama “computer use” ed è l’ultima novità implementata in Claude AI (per chi non lo conoscesse, uno dei principali rivali di ChatGPT, e tal proposito i recenti ChatGPT Canvas sono ispirati agli Artifacts di Calude) che indubbiamente scuoterà il mondo dell’intelligenza artificiale. Si tratta di una funzionalità inedita che permette al modello di interagire con un computer proprio come farebbe una persona. Questa caratteristica, attualmente in fase di beta pubblica, consente a Claude di eseguire operazioni reali come osservare uno schermo, muovere il cursore, cliccare sui pulsanti e digitare testo, secondo quanto annunciato dalla stessa azienda.

Un assistente per le operazioni quotidiane di routine

La nuova funzione di Claude, denominata appunto “computer use”, promette di automatizzare compiti ripetitivi che spesso richiedono tempo, rendendo l’IA uno strumento ancora più utile per le persone. L’obiettivo è semplificare l’interazione con il computer, permettendo all’assistente virtuale di svolgere operazioni al posto dell’utente umano.

Prima di addentrarci nei dettagli chiariamo subito che non si tratta ancora di una funzione “consumer“, ovvero disponibile per tutti. Si tratta infatti di una API per sviluppatori interessati ad integrare una funzionalità di questo genere in un applicativo o funzionalità.

Anthropic, l’azienda a capo di Claude, ha pubblicato un paio di video su X che spiegano e mostrano meglio il meccanismo. “Computer use” può compilare form, navigare sul web, aprire file scaricati, eseguire comandi da terminale e non solo. Insomma può letteralmente impossessarsi di mouse e tastiera, ecco un paio di demo:

The new Claude 3.5 Sonnet is the first frontier AI model to offer computer use in public beta. While groundbreaking, computer use is still experimental—at times error-prone. We’re releasing it early for feedback from developers. pic.twitter.com/a5SZQMKvLj — Anthropic (@AnthropicAI) October 22, 2024

We’ve built an API that allows Claude to perceive and interact with computer interfaces. This API enables Claude to translate prompts into computer commands. Developers can use it to automate repetitive tasks, conduct testing and QA, and perform open-ended research. pic.twitter.com/eK0UCGEozm — Anthropic (@AnthropicAI) October 22, 2024

Come riconosciuto dalla stessa Anthropic in un post sul blog, questa tecnologia è ancora nelle fasi iniziali di sviluppo e, a detta loro, “piena di bug”. Durante i test interni, per esempio, Claude ha interrotto un compito di programmazione a metà, iniziando invece ad aprire immagini del Parco Nazionale di Yellowstone. Siamo però ormai abituati a vedere intelligenze artificiali acerbe e sarà sufficiente solo un po’ di tempo prima che queste raggiungano maturazione.

Nuove versioni del modello Claude

Oltre alla presentazione di “computer use”, Anthropic ha lanciato una versione aggiornata del modello Claude 3.5 Sonnet, accompagnata da un nuovo modello denominato Claude 3.5 Haiku, previsto per fine ottobre. Queste novità seguono l’annuncio fatto ad agosto, quando Anthropic ha comunicato la sua adesione, insieme a OpenAI, alla condivisione dei suoi sviluppi con il US AI Safety Institute, un passo importante verso una maggiore sicurezza e trasparenza nel campo dell’intelligenza artificiale.