L’annuncio era nell’aria, sapevamo quasi tutti che NVIDIA avrebbe calato l’asso in occasione della GTC 2025 di Washington e così è stato. Sul palco come da tradizione il CEO NVIDIA Jensen Huang, pronto a mostrare al mondo il primo esemplare di Vera Rubin Superchip, ovvero quello che di fatto sarà il nuovo punto di riferimento nel mondo AI Compute dei prossimi anni, e non solo per NVIDIA.

Il boss di NVIDIA ha svelato il prototipo di un sistema Vera Rubin, grande più o meno come una scheda madre, ma con hardware e capacità del tutto diversi dai comuni computer che siamo abituati a vedere sui nostri desktop. L’obiettivo di NVIDIA, ed è già risaputo, è quello di incrementare densità e prestazioni cercando di migliorare l’efficienza e di conseguenza la scalabilità nei sistemi server. Ma facciamo un riepilogo sulle specifiche e le informazioni condivise dal produttore che, tra le altre cose, ha anticipato che il debutto sul mercato è previsto per il 2026.

NVIDIA Vera Rubin Superchip: il nuovo riferimento per l’Intelligenza Artificiale

nvidia vera rubin superchip 2

Partiamo direttamente con i numeri crudi, che poi sono alla fine quelli che contano sia per quanto riguarda le prestazioni che per i costi. Il prototipo mostrato da Jensen Huang di Vera Rubin Superchip prevede una configurazione a due GPU Rubin abbinato a un processore Vera, mentre per il sottosistema memoria troviamo memorie LPDDR affiancate dalle velocissime HBM4.

La scheda tecnica è notevole. L’azienda ci dice che ogni GPU Rubin è capace di 50 PFLOPS nei calcoli FP4, “aiutata” da 288 GB di HBM4, quindi in questo caso un totale di 576 GB HBM4 (con larghezza di banda a 13 TB/s). Passando un attimo alla CPU Vera invece, si tratta di un chip Arm da 88 core e 176 thread con 2 TB di memoria veloce, il “collegamento” alle GPU avviene con NVLINK-C2C, un’interconnessione che garantisce una larghezza di banda fino a 1,8 TB/s.

Per l’occasione NVIDIA ha snocciolato anche qualche dato relativo ai nuovi sistemi che saranno basati sulla nuova piattaforma con Vera Rubin Superchip. Secondo l’azienda, il salto prestazionale rispetto all’attuale GB300 NVL72 sarà notevole; Vera Rubin Superchip riesce a essere infatti fino a 3,3 volte più veloce, garantendo un picco di 3,6 EXAFLOPS nell’inferenza FP4 e 1,2 EXAFLOPS nel training FP8. In questo contesto entrano in gioco anche NVLINK e CX9 (interfaccia di rete) che garantiscono un throughput a dir poco impressionante, rispettivamente 260 TB/s e 28,8 TB/s.

nvidia vera rubin superchip

Tanta carne al fuoco per NVIDIA che, al momento non ha condiviso molte notizie riguardo alla prossima generazione di GPU Feynmann, anticipando invece che nel 2027 arriverà Rubin Ultra NVL576, un sistema ancora più spinto rispetto al nuovo Vera Rubin Superchip, dotato di ben 4 GPU e 1 TB di memoria HBM4. Secondo le prime stime, un clusetr del genere punterà a raggiungere i 15 EXAFLOPS nei calcoli FP4 e 5 EXAFLOPS in quelli FP8; un vero mostro di potenza (non sappiamo neanche quanto in realtà), aiutato a quanto pare da un totale di 365 TB di memoria e una larghezza di banda di rete stratosferica, 1,5 PB/s.

Queste al momento le informazioni che abbiamo estrapolato dalla conferenza NVIDIA, altri dettagli arriveranno probabilmente nelle prossime ore, tuttavia il messaggio di NVIDIA sembra chiaro e almeno per i prossimi due anni non ci sarà molto da fare per la concorrenza, a meno di qualche asso nella manica da parte di AMD.

Caratteristiche tecniche NVIDIA Vera Rubin Superchip

  • 2x GPU Rubin da 50 PFLOPS (calcolo FP4)
  • 288 GB di memoria HBM4 (576 GB totali)
  • CPU Vera basata su architettura Arm
  • Configurazione CPU a 88 core /1 176 Thread
  • 2 TB di memoria (RAM) veloce
  • NVLINK C2C GPU/CPU a 1,8 TB/s