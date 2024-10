Anthropic ha annunciato tre novità importanti per il suo modello linguistico basato su intelligenza artificiale, in particolare 2 nuove versioni del modello stesso e una funzionalità inedita (al momento in Beta).

La prima novità è l’aggiornamento di Claude 3.5 Sonnet, il modello più avanzato attualmente nelle mani di Anthropic. La seconda è il rilascio di un nuovo modello chiamato Claude 3.5 Haiku, che mira a diventare un riferimento negli applicativi consumer. La terza infine è la più succulenta: ovvero l’introduzione della funzionalità di utilizzo del computer, disponibile oggi in beta pubblica per gli sviluppatori. Questa capacità permette/permetterà a Claude di interagire con il computer come farebbe una persona reale, il che apre decisamente a nuovi scenari. Vediamo nel dettaglio le novità.

Il nome resta lo stesso ma Claude 3.5 Sonnet è tutto nuovo e, secondo alcuni benchmark di settore, si è affermato come leader nel campo del software engineering. In particolare, ha migliorato il proprio punteggio in SWE-bench Verified, una metrica per il coding, dal 33,4% al 49,0%, superando tutti i modelli disponibili, compresi quelli progettati per task di agentic coding come OpenAI o1-preview. Anche nel contesto del TAU-bench, dedicato all’uso di strumenti in ambito retail e aviation, Sonnet ha ottenuto risultati eccellenti.

I feedback dei primi utilizzatori indicano che Claude 3.5 Sonnet ha apportato un miglioramento rilevante per i task di DevSecOps, senza compromettere la velocità di esecuzione. GitLab, Cognition e The Browser Company sono solo alcune delle realtà che hanno testato il modello e riportato risultati superiori rispetto a qualsiasi altro modello provato finora.

Introducing an upgraded Claude 3.5 Sonnet, and a new model, Claude 3.5 Haiku. We’re also introducing a new capability in beta: computer use.

Developers can now direct Claude to use computers the way people do—by looking at a screen, moving a cursor, clicking, and typing text. pic.twitter.com/ZlywNPVIJP

— Anthropic (@AnthropicAI) October 22, 2024