Nelle scorse ore OpenAI e Broadcom hanno svelato Jalapeño, il primo acceleratore per l’intelligenza artificiale progettato direttamente da OpenAI. Il chip è pensato specificamente per l’inferenza, ovvero il processo di esecuzione dei modelli AI in risposta alle richieste degli utenti, e segna un passo significativo nella strategia di OpenAI di costruire e controllare l’intera filiera tecnologica dietro i propri modelli.
La partnership con Broadcom era stata annunciata ufficialmente in ottobre, ma i piani di OpenAI per sviluppare chip proprietari circolavano da tempo. Come avevamo raccontato lo scorso febbraio, OpenAI stava lavorando a un acceleratore personalizzato da lanciare nel 2026 in collaborazione con Broadcom e TSMC.
La strategia risponde all’esigenza dell’azienda di ridurre la dipendenza dalle GPU NVIDIA, che oggi alimentano la quasi totalità dei carichi di lavoro di addestramento e inferenza di OpenAI. Google e Amazon si sono mossi in anticipo con soluzioni analoghe, e ora OpenAI completa il quadro dei colossi con chip proprietari.
Indice:
Segui TuttoTech.net su Google Discover
Un chip progettato da zero per i modelli linguistici
Jalapeño non è un acceleratore generico adattato da architetture precedenti ma in questo caso, fanno sapere le due aziende, l’architettura è stata pensata attorno alle specificità dell’inferenza per i modelli linguistici di grandi dimensioni (LLM), tenendo conto dei kernel, dei pattern di memoria, del networking e dei sistemi di serving che OpenAI utilizza ogni giorno per alimentare ChatGPT, Codex, le API e i futuri prodotti agentici. Il chip è già operativo in laboratorio a frequenza e potenza di produzione target, con carichi di lavoro che includono GPT-5.3-Codex-Spark.
“Abbiamo una profonda comprensione del carico di lavoro“, ha spiegato il presidente e co-fondatore di OpenAI Greg Brockman nel podcast interno dell’azienda. “Stavamo cercando specifici carichi di lavoro non adeguatamente serviti dall’hardware esistente, chiedendoci come costruire qualcosa in grado di accelerare ciò che è possibile.”
I test preliminari mostrano prestazioni per watt significativamente superiori allo stato dell’arte attuale, anche se OpenAI precisa che la misurazione definitiva delle performance verrà presentata in un rapporto tecnico dettagliato nei prossimi mesi. L’architettura riduce i movimenti di dati e bilancia risorse di calcolo, memoria e networking per avvicinarsi molto al picco teorico di utilizzo dell’hardware.
Badate bene che uno degli aspetti più interessanti di Jalapeño è la velocità con cui è stato sviluppato: dalla progettazione iniziale al tape-out di produzione sono bastati nove mesi, un ciclo che OpenAI definisce il più rapido mai raggiunto per semiconduttori avanzati ad alte prestazioni.
La velocità è stata possibile grazie alla stretta collaborazione tra i team di ingegneria di OpenAI e Broadcom, ma anche grazie all’utilizzo degli stessi modelli AI di OpenAI per accelerare parti del processo di progettazione e ottimizzazione. Possiamo dire che è stato uno cortocircuito virtuoso in cui gli stessi modelli serviti agli utenti contribuiscono a migliorare l’infrastruttura con cui vengono eseguiti i modelli futuri.
Una piattaforma multi-generazionale con Microsoft
Jalapeño è il primo passo di una piattaforma di calcolo multi-generazionale progettata per il rilascio entro la fine del 2026, con espansioni previste negli anni successivi. Il piano prevede la combinazione degli acceleratori progettati da OpenAI con le tecnologie di implementazione silicon, networking e connettività di Broadcom, e le competenze di board, rack e sistema di Celestica. I data center partner, tra cui Microsoft, ospiteranno la piattaforma a scala di gigawatt.
“La nostra collaborazione con OpenAI rappresenta un impegno fondamentale nel ridimensionare l’infrastruttura fisica necessaria per il prossimo decennio di AI“, ha dichiarato Hock Tan, presidente e CEO di Broadcom.
Detto questo, è lecito aspettarsi che i carichi di lavoro più intensivi come il pre-training continuino a dipendere dall’hardware NVIDIA, ma anche piccole riduzioni nei costi di inferenza potrebbero fare una differenza significativa nei conti di OpenAI, considerando la mole gigantesca di richieste con cui opera ChatGPT ogni giorno.
I nostri contenuti da non perdere:
- 🔝 Importante: GTA VI è disponibile in pre-ordine ORA: prezzi, edizioni e dove prenotarlo
- 💰 Risparmia sulla tecnologia: segui Prezzi.Tech su Telegram, il miglior canale di offerte
- 🏡 Seguici anche sul canale Telegram Offerte.Casa per sconti su prodotti di largo consumo

