OpenAI presenta Jalapeño, il suo primo chip per l'inferenza AI sviluppato con Broadcom

Nelle scorse ore OpenAI e Broadcom hanno svelato Jalapeño, il primo acceleratore per l’intelligenza artificiale progettato direttamente da OpenAI. Il chip è pensato specificamente per l’inferenza, ovvero il processo di esecuzione dei modelli AI in risposta alle richieste degli utenti, e segna un passo significativo nella strategia di OpenAI di costruire e controllare l’intera filiera tecnologica dietro i propri modelli.

La partnership con Broadcom era stata annunciata ufficialmente in ottobre, ma i piani di OpenAI per sviluppare chip proprietari circolavano da tempo. Come avevamo raccontato lo scorso febbraio, OpenAI stava lavorando a un acceleratore personalizzato da lanciare nel 2026 in collaborazione con Broadcom e TSMC.

La strategia risponde all’esigenza dell’azienda di ridurre la dipendenza dalle GPU NVIDIA, che oggi alimentano la quasi totalità dei carichi di lavoro di addestramento e inferenza di OpenAI. Google e Amazon si sono mossi in anticipo con soluzioni analoghe, e ora OpenAI completa il quadro dei colossi con chip proprietari.

Indice:

Un chip progettato da zero per i modelli linguistici
Una piattaforma multi-generazionale con Microsoft

Segui TuttoTech.net su Google Discover

⭐️ Amazon Prime Day è oggi ➡️

Offerta

-19%

Tineco Floor ONE S7 Stretch Ultra

299€ invece di 369.99€

Amazon

Offerta

Samsung Galaxy Watch Ultra, LTE

355,49 invece di 599€

Amazon

Offerta

-18%

ASUS Vivobook S16, OLED, 16GB/1TB

599€ invece di 730.47€

Amazon

Offerta

-38%

roborock Qrevo S Pro Set

Offerta + coupon: TTANDROID5

369.99€ invece di 599.99€

Amazon

Offerta

-31%

Apple AirPods 4

103€ invece di 149€

Amazon

Offerta

-28%

DREAME H15 Pro Heat

429€ invece di 599€

Amazon

Offerta

-20%

msi Modern 14, 16/512 GB

599€ invece di 749€

Amazon

Offerta

-25%

ECOVACS DEEBOT T90 PRO OMNI

599€ invece di 799€

Amazon

Offerta

-40%

Samsung Galaxy Buds4 Pro

Offerta + Coupon: BUDSLIVE

149€ invece di 249€

Amazon

Offerta

-11%

Apple iPhone 17, 256 GB

869€ invece di 979€

Amazon

Offerta

-21%

msi Modern 15, Ryzen 7 7730U

549€ invece di 699€

Amazon

Offerta

-42%

ECOVACS DEEBOT T50 PRO OMNI Gen3

349€ invece di 599€

Amazon

Offerta

-48%

roborock Qrevo Curv 2 Flow

Offerta + clicca su applica coupon di 50 euro + coupon: TTANDROID5

469€ invece di 899€

Amazon

Offerta

-6%

Acer Aspire 14 AI OLED

659€ invece di 699€

Amazon

Un chip progettato da zero per i modelli linguistici

Jalapeño non è un acceleratore generico adattato da architetture precedenti ma in questo caso, fanno sapere le due aziende, l’architettura è stata pensata attorno alle specificità dell’inferenza per i modelli linguistici di grandi dimensioni (LLM), tenendo conto dei kernel, dei pattern di memoria, del networking e dei sistemi di serving che OpenAI utilizza ogni giorno per alimentare ChatGPT, Codex, le API e i futuri prodotti agentici. Il chip è già operativo in laboratorio a frequenza e potenza di produzione target, con carichi di lavoro che includono GPT-5.3-Codex-Spark.

“Abbiamo una profonda comprensione del carico di lavoro“, ha spiegato il presidente e co-fondatore di OpenAI Greg Brockman nel podcast interno dell’azienda. “Stavamo cercando specifici carichi di lavoro non adeguatamente serviti dall’hardware esistente, chiedendoci come costruire qualcosa in grado di accelerare ciò che è possibile.”

I test preliminari mostrano prestazioni per watt significativamente superiori allo stato dell’arte attuale, anche se OpenAI precisa che la misurazione definitiva delle performance verrà presentata in un rapporto tecnico dettagliato nei prossimi mesi. L’architettura riduce i movimenti di dati e bilancia risorse di calcolo, memoria e networking per avvicinarsi molto al picco teorico di utilizzo dell’hardware.

Badate bene che uno degli aspetti più interessanti di Jalapeño è la velocità con cui è stato sviluppato: dalla progettazione iniziale al tape-out di produzione sono bastati nove mesi, un ciclo che OpenAI definisce il più rapido mai raggiunto per semiconduttori avanzati ad alte prestazioni.

La velocità è stata possibile grazie alla stretta collaborazione tra i team di ingegneria di OpenAI e Broadcom, ma anche grazie all’utilizzo degli stessi modelli AI di OpenAI per accelerare parti del processo di progettazione e ottimizzazione. Possiamo dire che è stato uno cortocircuito virtuoso in cui gli stessi modelli serviti agli utenti contribuiscono a migliorare l’infrastruttura con cui vengono eseguiti i modelli futuri.

Una piattaforma multi-generazionale con Microsoft

Jalapeño è il primo passo di una piattaforma di calcolo multi-generazionale progettata per il rilascio entro la fine del 2026, con espansioni previste negli anni successivi. Il piano prevede la combinazione degli acceleratori progettati da OpenAI con le tecnologie di implementazione silicon, networking e connettività di Broadcom, e le competenze di board, rack e sistema di Celestica. I data center partner, tra cui Microsoft, ospiteranno la piattaforma a scala di gigawatt.

“La nostra collaborazione con OpenAI rappresenta un impegno fondamentale nel ridimensionare l’infrastruttura fisica necessaria per il prossimo decennio di AI“, ha dichiarato Hock Tan, presidente e CEO di Broadcom.

Detto questo, è lecito aspettarsi che i carichi di lavoro più intensivi come il pre-training continuino a dipendere dall’hardware NVIDIA, ma anche piccole riduzioni nei costi di inferenza potrebbero fare una differenza significativa nei conti di OpenAI, considerando la mole gigantesca di richieste con cui opera ChatGPT ogni giorno.

Potrebbero interessarti:

Seguici su:Instagram TikTok Google Discover YouTube Facebook Google, come Fonte Preferita

I nostri contenuti da non perdere:

🔝 Importante: GTA VI è disponibile in pre-ordine ORA: prezzi, edizioni e dove prenotarlo
💰 Risparmia sulla tecnologia: segui Prezzi.Tech su Telegram, il miglior canale di offerte
🏡 Seguici anche sul canale Telegram Offerte.Casa per sconti su prodotti di largo consumo