Quando l'AI costruisce se stessa: il report di Anthropic sull'auto-miglioramento ricorsivo

C’è una frase, nel report che Anthropic ha pubblicato il 4 giugno 2026, che vale la pena leggere due volte: oggi gli ingegneri dell’azienda spediscono in media otto volte il codice che producevano tra il 2021 e il 2025. Non è un dato di marketing. È il sintomo, secondo Anthropic, di un fenomeno che ha un nome preciso e inquietante: recursive self-improvement, l’auto-miglioramento ricorsivo. Ovvero il momento in cui un sistema di intelligenza artificiale diventa capace di progettare e sviluppare in autonomia il proprio successore.

Il documento, intitolato “When AI builds itself” e pubblicato dall’Anthropic Institute, il braccio di ricerca dell’azienda, non sostiene che quel momento sia già arrivato. Anzi, lo ribadisce più volte: non ci siamo ancora, e l’auto-miglioramento ricorsivo non è inevitabile. Ma il messaggio di fondo è altrettanto chiaro: potrebbe arrivare prima di quanto la maggior parte delle istituzioni sia pronta a gestire. E questo, per chi segue il settore da anni, è il tipo di affermazione che merita attenzione, non per il sensazionalismo, ma per chi la pronuncia e per i dati che la accompagnano.

Segui TuttoTech.net su Google Discover

Pubblicità-27%

Amazon

Google Pixel 10a

399€~~549€~~

Vai all'offerta

Cosa dicono i dati interni di Anthropic

La parte più interessante del report non sono le proiezioni sul futuro, ma i numeri sul presente. Anthropic ha aperto i propri archivi interni, mostrando dati mai resi pubblici prima, e il quadro che emerge è quello di un’azienda che ha già delegato all’AI una fetta enorme del proprio lavoro di sviluppo.

Il dato più citato riguarda il codice. A maggio 2026, oltre l’80% del codice integrato nella codebase di Anthropic è stato scritto da Claude. Prima del lancio di Claude Code, a febbraio 2025, questa percentuale era nell’ordine delle singole cifre. Il salto è verticale, e si riflette anche nella produttività per singolo ingegnere: le righe di codice integrate per persona al giorno sono rimaste costanti per i primi quattro anni di vita dell’azienda, poi hanno iniziato a salire nel 2025, quando Claude ha cominciato a eseguire il codice invece di limitarsi a suggerirlo, e hanno accelerato ancora nel 2026, quando i modelli hanno iniziato a lavorare in autonomia su orizzonti temporali più lunghi.

Anthropic stessa avverte che le righe di codice sono una metrica imperfetta, perché misurano la quantità e non la qualità. Lo dichiara apertamente nel report, ed è un dettaglio che fa onore all’onestà intellettuale del documento. Ma il dato resta indicativo di un’accelerazione reale. In un sondaggio interno di marzo 2026 su 130 dipendenti dei team di ricerca, il rispondente mediano ha stimato di produrre circa quattro volte l’output che avrebbe generato senza accesso ad alcun modello AI. Anche scontando l’inevitabile sovrastima di queste autovalutazioni, il segnale rimane forte.

Un esempio concreto rende l’idea meglio di qualsiasi statistica. Ad aprile 2026, Claude ha spedito oltre 800 correzioni che hanno ridotto di un fattore mille una classe di errori API. L’ingegnere che supervisionava il lavoro ha stimato che un essere umano avrebbe impiegato quattro anni per completarlo. Risolvere i bug altrui è un lavoro lento e doloroso, e gli esseri umani faticano a tenere in testa così tanto contesto sconosciuto contemporaneamente. Claude no.

Ingegneria e ricerca: dove l’AI è già superumana e dove ancora arranca

Il report distingue con intelligenza tra due categorie di lavoro necessarie per costruire un modello di frontiera. Da una parte l’ingegneria: scrivere il codice, allestire l’infrastruttura, supervisionare l’addestramento. Dall’altra la ricerca: decidere quali esperimenti condurre, interpretare i risultati, capire quali idee provare dopo.

Su entrambi i fronti il quadro è coerente. Nell’ingegneria, Claude riesce a prendere un problema definito in modo vago e capire come risolverlo: gli umani forniscono l’obiettivo, ma non devono più fornire il metodo. Il tasso con cui il personale di Anthropic corregge o prende il controllo a metà di un compito è in calo costante da un anno, anche sui problemi più complessi e aperti. Sul compito più difficile, quello dei problemi senza specifiche chiare, il tasso di successo di Claude ha raggiunto il 76% a maggio 2026, in crescita di 50 punti percentuali in sei mesi.

C’è un dato che colpisce più di altri. Anthropic ha introdotto un revisore automatico basato su Claude che controlla ogni modifica al codice prima dell’integrazione. Un’analisi retrospettiva ha rivelato che questo revisore avrebbe intercettato circa un terzo dei bug responsabili di incidenti passati su claude.ai prima che raggiungessero la produzione. Gli ingegneri che hanno scritto quel codice sono tra i migliori al mondo. Claude sta trovando gli errori che a loro erano sfuggiti.

Nella ricerca, il quadro è più sfumato ma altrettanto significativo. Anthropic conduce un test fisso a ogni rilascio: dà a Claude del codice che addestra un piccolo modello e gli chiede di renderlo più veloce possibile mantenendo gli stessi controlli di correttezza. A maggio 2025, Claude Opus 4 otteneva in media un’accelerazione di circa 3 volte. Ad aprile 2026, Claude Mythos Preview arrivava a circa 52 volte. Per calibrare: un ricercatore umano esperto impiega dalle quattro alle otto ore per arrivare a 4 volte. In questa parte specifica del lavoro di ricerca, l’ottimizzazione di passaggi all’interno di un esperimento ben definito, Claude è passato da super utile a superumano in meno di un anno.

Resta però un divario, ed è qui che il report si fa più onesto. Quando si tratta di esercitare il giudizio nello scegliere gli obiettivi, sia in ingegneria sia in ricerca, le differenze tra umani e AI persistono. È il cosiddetto “research taste“, il gusto della ricerca: scegliere quali problemi contano, di quali risultati fidarsi, quando un approccio è un vicolo cieco. Per ora, è l’ultimo vantaggio comparativo degli esseri umani. Ma anche questo si sta erodendo: ad aprile 2026, Mythos Preview ha scelto un passo successivo migliore di quello umano nel 64% dei casi esaminati, contro il 51% di Opus 4.5 a novembre 2025.

Tre futuri possibili e una richiesta che fa discutere

La parte conclusiva del report delinea tre scenari. Nel primo, il trend si arresta: le curve esponenziali si rivelano curve a S, e ci stiamo avvicinando al punto in cui i rendimenti diminuiscono. Anthropic include questo scenario per completezza, ma dichiara di non ritenerlo probabile, perché finora nessuna delle curve misurate ha mostrato segni di flessione.

Nel secondo scenario, gli umani continuano a fissare le direzioni di ricerca mentre l’AI automatizza il resto. Aziende da 100 persone potrebbero fare il lavoro di organizzazioni da 10.000 o 100.000. È lo scenario che Anthropic ritiene più probabile, e che porta con sé tanto promesse quanto rischi: dalla rivoluzione del lavoro intellettuale alla sorveglianza autoritaria di intere popolazioni.

Nel terzo scenario, quello dell’auto-miglioramento ricorsivo pieno, i sistemi AI diventano capaci di progettare e raffinare se stessi. Il ritmo del progresso verrebbe determinato interamente dalla disponibilità di potenza di calcolo. Gli umani si sposterebbero quasi del tutto verso la supervisione e la verifica di un “laboratorio virtuale” gestito dall’AI. È lo scenario su cui Anthropic ammette di avere meno intuizioni, perché la nostra economia è oggi guidata dagli esseri umani e dagli strumenti che essi costruiscono.

Ed è qui che arriva la parte più sorprendente, e che ha fatto discutere. Anthropic afferma che, se fosse possibile rallentare efficacemente lo sviluppo di questa tecnologia per dare a società e ricerca sull’allineamento il tempo di adeguarsi, sarebbe probabilmente una cosa positiva. L’azienda dichiara che rallenterebbe o sospenderebbe temporaneamente lo sviluppo, a patto che gli altri sviluppatori vicini alla frontiera facessero lo stesso in modo verificabile. Una posizione che il report stesso riconosce difficile da realizzare: un addestramento è molto più facile da nascondere di un silo missilistico, e l’incentivo a perfezionare di nascosto è enorme, perché chi continua mentre gli altri si fermano eredita il vantaggio.

Come ha spiegato Jack Clark, co-autore del pezzo, in un’intervista ad Axios, l’approccio di Anthropic è quello di socializzare il concetto in anticipo, dare alle persone un’idea di cosa sta arrivando. Vale la pena notare il contesto: il report arriva pochi giorni dopo che Anthropic ha chiuso un round di finanziamento che valuta l’azienda 965 miliardi di dollari e ha depositato in via confidenziale i documenti per la quotazione in borsa. C’è chi leggerà questo tempismo con scetticismo, interpretando il documento come marketing travestito da preoccupazione per la sicurezza. È una critica legittima, e va tenuta presente.

Eppure, come ha osservato l’analista indipendente di Kingy AI, l’interpretazione più difendibile del report non è né il manifesto della singolarità né il marketing mascherato: Anthropic non sostiene che un singolo modello monolitico abbia iniziato a riscrivere se stesso. La forza del documento sta nella sua concretezza, nel decomporre il lavoro di costruzione di un modello in parti misurabili e nel mostrare, dati alla mano, dove l’automazione è già arrivata e dove ancora manca. È un report che invita all’attenzione, non al panico, e che ha il merito di rendere pubblici numeri che la maggior parte delle aziende del settore preferisce tenere nascosti.

La domanda vera, quella che il report lascia aperta, non è se l’AI costruirà se stessa. È cosa decideremo di fare se e quando lo farà, e se le istituzioni umane, lente per natura, riusciranno a stare al passo con un laboratorio che gira alla velocità della potenza di calcolo. Anthropic promette di organizzare nei prossimi mesi conversazioni con politici, ricercatori e società civile. La finestra per affrontare insieme queste domande, scrive l’azienda, è adesso. È difficile darle torto.

Seguici su:Instagram Google, come Fonte PreferitaFacebook Google Discover TikTok YouTube

I nostri contenuti da non perdere:

🔝 Importante: AMD Ryzen 7 9700X vs Ryzen 7 9850X3D: ecco quanto conta la cache 3D a parità di core
💰 Risparmia sulla tecnologia: segui Prezzi.Tech su Telegram, il miglior canale di offerte
🏡 Seguici anche sul canale Telegram Offerte.Casa per sconti su prodotti di largo consumo