OpenAI ha ufficialmente presentato GPT-5.3-Codex, un nuovo modello che segna un’evoluzione profonda per Codex e, più in generale, per il concetto stesso di agente di programmazione. Non si tratta infatti di un semplice aggiornamento incrementale, ma di un passaggio strutturale che porta Codex oltre la scrittura e la revisione del codice, trasformandolo in uno strumento capace di svolgere gran parte delle attività professionali al computer, dall’ingegneria del software fino al lavoro basato sulla conoscenza.

Come sottolineato dalla stessa OpenAI, GPT-5.3-Codex combina le prestazioni di programmazione avanzata di GPT-5.2-Codex con le capacità di ragionamento e conoscenza professionale di GPT-5.2, riunendo tutto in un unico modello, peraltro più veloce del 25% rispetto alla generazione precedente. Un aspetto tutt’altro che secondario, soprattutto quando si parla di task lunghi, complessi e iterativi.

Offerta

MacBook Air 13'', M4 (2025), 512GB

1199€ invece di 1399€
-14%

GPT-5.3-Codex è il primo modello che ha contribuito alla propria creazione

Uno degli elementi più curiosi e significativi di GPT-5.3-Codex riguarda il suo stesso sviluppo, il nuovo modello è infatti il primo ad aver contribuito in modo determinante alla propria realizzazione: il team di Codex ha utilizzato le prime versioni del modello per eseguire il debug dell’addestramento, gestire la distribuzione e analizzare i risultati di test e valutazioni.

Un approccio che, come ammesso dagli stessi sviluppatori, ha accelerato in modo sorprendente l’intero processo, dimostrando quanto Codex sia già oggi in grado di migliorare concretamente i flussi di lavoro di ricerca e ingegneria, anche all’interno di OpenAI.

Capacità agentiche avanzate e nuovi benchmark di riferimento

Dal punto di vista delle prestazioni, GPT-5.3-Codex stabilisce nuovi riferimenti di settore su diversi benchmark chiave utilizzati per valutare capacità di programmazione, utilizzo del computer e comportamento agentico in scenari reali.

In particolare, il modello eccelle su:

  • SWE-Bench Pro, una valutazione rigorosa dell’ingegneria del software in contesti reali e multi linguaggio
  • Terminal-Bench 2.0, che misura le competenze operative nel terminal richieste a un agente di coding
  • OSWorld e GDPval, focalizzati sull’uso del computer e sul lavoro professionale basato sulla conoscenza

Un dettaglio interessante è che GPT-5.3-Codex riesce a ottenere questi risultati utilizzando meno token di output rispetto ai modelli precedenti, consentendo di fare di più con una maggiore efficienza complessiva.

Dallo sviluppo software allo sviluppo web (e non solo)

Combinando capacità di coding avanzate, maggiore compattezza e miglioramenti estetici, GPT-5.3-Codex si dimostra particolarmente efficace anche nello sviluppo web. Secondo OpenAI, il modello è in grado di realizzare giochi e applicazioni complesse e altamente funzionali in pochi giorni, iterando autonomamente grazie a prompt di follow-up generici come fix the bug o improve the game.

Nei test interni, GPT-5.3-Codex ha sviluppato autonomamente due giochi completi, iterando su milioni di token e mostrando una capacità superiore di interpretare l’intento dell’utente rispetto a GPT-5.2-Codex; anche prompt semplici o poco specifici generano ora siti web più completi, con impostazioni sensate e pronti per l’uso in produzione, riducendo sensibilmente il lavoro di rifinitura manuale.

Oltre la programmazione, supporto a tutto il lavoro professionale

Uno dei messaggi chiave di questo annuncio è che Codex non è più solo per programmatori, GPT-5.3-Codex è progettato per supportare tutte le fasi del ciclo di vita del software, dal debugging alla distribuzione, dal monitoraggio alla redazione dei PRD, ma anche attività che vanno ben oltre il codice.

Parliamo, tanto per fare qualche esempio, di creazione di presentazioni, analisi dei dati in fogli di calcolo, documentazione formativa, ricerca e sintesi di informazioni.

Le prestazioni su GDPval, una valutazione che copre 44 professioni diverse, mostrano come il modello sia ormai perfettamente a suo agio nel lavoro professionale basato sulla concorrenza, eguagliando GPT-5.2 ma con capacità agentiche decisamente più mature.

Utilizzo del computer e interazione in tempo reale

Un altro aspetto centrale riguarda l’interazione, con GPT-5.3-Codex l’attenzione si sposta sempre di più da ciò che il modello sa fare a quanto sia semplice guidarlo e supervisionarlo. Nell’app Codex, il modello fornisce aggiornamenti frequenti sulle decisioni chiave e sui progressi, consentendo di intervenire in tempo reale, fare domande, discutere gli approcci e correggere la direzione mentre il lavoro è in corso.

Su OSWorld-Verified, benchmark che misura l’utilizzo dei computer in ambienti desktop visivi, GPT-5.3-Codex ottiene un netto miglioramento rispetto ai modelli precedenti, avvicinandosi sensibilmente al punteggio umano.

Sicurezza informatica

OpenAI dedica ampio spazio anche al tema della cybersicurezza, ambito in cui GPT-5.3-Codex viene classificato come modello a capacità elevata secondo il Preparedness Framework; è il primo modello addestrato direttamente per identificare vulnerabilità software e, proprio per questo, viene accompagnato da salvaguardie rafforzate, pensate per favorire l’uso difensivo e ridurre il rischio di abusi.

Tra le iniziative annunciate troviamo programmi di accesso affidabile, monitoraggio automatizzato, collaborazione con progetti open source e nuovi crediti API destinati alla difesa informatica.

Disponibilità e prossimi passi

GPT-5.3-Codex è già disponibile per gli utenti ChatGPT con piani a pagamento, ovunque sia possibile utilizzare Codex: app, web, CLI ed estensioni per IDE. OpenAI sta inoltre lavorando per rendere disponibile a breve un accesso sicuro alle API.

Con questo aggiornamento, Codex compie un salto evidente, da strumento focalizzato sulla scrittura di codice a collaboratore digitale general-purpose, capace di ragionare, costruire ed eseguire attività end-to-end lungo l’intero spettro del lavoro tecnico e professionale; un cambio di paradigma che, come sempre, apre scenari interessanti sul futuro del lavoro digitale e sul ruolo sempre più centrale degli agenti IA.