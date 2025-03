In occasione della GTC 2025 (GPU Technology Conference), che ricordiamo si chiude il prossimo 21 marzo, NVIDIA ha fatto il punto della situazione sul mercato GPU e in particolare sulle novità che vedremo da qui ai prossimi mesi nel segmento degli acceleratori per l’Intelligenza Artificiale.

Sul podio come al solito Jensen Huang, il CEO NVIDIA che ovviamente non ha perso tempo per snocciolare i dati da record relativi alle vendite delle attuali soluzioni Blackwell. L’azienda rende noto di aver venduto già 3,6 milioni di GPU Blackwell, un numero impressionante se consideriamo che siamo ancora a marzo (senza parlare del fatturato). In questo settore però non si può dormire sugli allori e NVIDIA lo sa molto bene, motivo che spiega l’annuncio delle prossime soluzioni Blackwell Ultra e Vera Rubin.

Ma vediamo tutti i dettagli, ribadendo che si parla di GPU pensate per il segmento server e supercomputer, quindi se cercate “novità” su prodotti da gaming mettetevi l’anima in pace.

NVIDIA Blackwell Ultra e Vera Rubin per mantenere il dominio nel mondo AI

Senza soffermarci ulteriormente sui numeri relativi agli introiti dell’azienda, parliamo subito delle prossime GPU NVIDIA per l’AI che arriveranno già a partire da quest’anno, possiamo dire quasi inaspettatamente. A partire dal secondo semestre 2025 infatti sono previsti i primi sample di Blackwell Ultra, un chip ovviamente potenziato rispetto all’attuale generazione che arriverà in due iterazioni, GB300 e B300.

NVIDIA non si è sbottonata più di tanto sulle specifiche tecniche del chip, limitandosi ad anticipare che l’architettura Blackwell Ultra sarà migliorata soprattutto per renderla più efficiente in precisi ambiti legati ai calcoli AI e all’inferenza. Stando a quanto riportato infatti, potremmo assistere a un notevole incremento delle prestazioni FP4; l’azienda parla di un boost del 50% rispetto alle vecchie soluzioni Hopper con picchi di ben 30 petaflops.

Non abbiamo molte altri dettagli, a quanto pare NVIDIA migliorerà nettamente il reparto memoria, portando il quantitativo di HBM3E sino a 288 GB, quasi 100 GB in più rispetto ai 192 GB delle configurazioni Blackwell attuali. Le nuove soluzioni Blackwell Ultra troveranno posto sui cluster HGX B300 NVL16 e soprattutto su GB300 NVL72, un vero mostro di potenza visto che integra un sistema di 36 schede equipaggiate a loro volta con due GPU Blackwell Ultra e due CPU NVIDIA Grace abbinati a 20 TB di memoria HBM3E e 40 TB di RAM LPDDR5X dedicati ai processori.

NVIDIA Blackwell Ultra e NVIDIA Rubin: prestazioni da primato

Per avere un’idea di quanto è potente un cluster del genere, NVIDIA ci dice che GB300 NVL72 offre prestazioni di inferenza 30 volte superiore rispetto a un sistema Hopper dello stesso livello. Se ancora non fosse chiaro, Blackwell Ultra è capace anche di far girare DeepSeek-R1 671B fornendo risposte in 10 secondi (contro i circa 90 secondi di Hopper H100), questo perché il nuovo chip NVIDIA può processare fino a 1.000 token al secondo.

Dopo Blackwell, protagonista del mercato AI di questo 2025, nel 2026 (H2) arriverà Vera Rubin che, sempre sulla carta, porterà un ulteriore rivoluzione sotto il punto di vista velocistico. Un singolo chip NVIDIA Rubin, dotato di 288 GB di HBM4 e abbinato a una GPU NVIDIA Vera da 88 core, offrirà ben 50 petaflops nei calcoli FP4, ma non è tutto; dopo sarà la volta di Rubin Ultra, una soluzione “multi-chip” che in pratica offrirà due GPU Rubin collegate tra loro con un quantitativo di memoria assurdo, oltre 1 terabyte di HBM4E.

Sempre nel 2026, la nuova generazione di GPU NVIDIA Rubin sarà integrata a sua volta su cluster come Rubin NVL144 e NVL576; quest’ultimo offrirà prestazioni a dir poco impensabili fino a qualche anno fa, migliorando nettamente nel calcolo FP4, ma anche e soprattutto in quello FP8 dove NVIDIA ci dice che può raggiungere i 5 exaflops.

Molta carne al fuoco per NVIDIA, attiva e attenta in quello che ormai è divenuto il mercato più importante, non solo per l’azienda californiana ma a livello globale. Il produttore ha chiuso infine con uno sguardo al 2028, assicurando di essere già a lavoro su un nuovo progetto, l’architettura GPU Feynman, della quale però non ha condiviso particolari dettagli.