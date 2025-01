Da alcuni giorni, più nello specifico dallo scorso 20 gennaio, data in cui DeepSeek ha rilasciato l’avanzato modello di intelligenza artificiale R1, negli Stati Uniti e nella Silicon Valley c’è una certa apprensione. Da alcune ore, il chatbot basato su quel modello, denominato DeepSeek come l’azienda cinese che lo sviluppa, è in cima alla classifica delle app gratuite più scaricate dall’App Store negli Stati Uniti, il che significa che ha detronizzato ChatGPT di OpenAI.

Di qui quell’apprensione, legata soprattutto al fatto che questo strumento sembra essere in grado di rivaleggiare con i più evoluti modelli occidentali, che per essere sviluppati costano molto di più e hanno a disposizione più risorse e strumenti rispetto a quelli che utilizza DeepSeek.

Cos’è DeepSeek, il chatbot cinese economico e avanzato

È passata quasi una settimana dall’annuncio di Stargate, progetto presentato dal presidente degli Stati Uniti d’America Donald Trump che, sostanzialmente, mira a garantire la leadership statunitense nel settore dell’intelligenza artificiale, con ingenti investimenti e un approccio nazionalistico. È una politica che, insieme ad altre iniziative promosse dalle precedenti amministrazioni statunitensi, ha (anche) l’obiettivo di limitare gli sviluppi tecnologici della Cina e delle sue aziende, come visto in passato con Huawei e poi con altre realtà.

Si colloca in questo contesto DeepSeek, un’azienda cinese specializzata nell’intelligenza artificiale, sotto le luci della ribalta in questi giorni proprio grazie alle capacità della sua più recente versione R1 basata sul modello LLM V3, particolarmente economico da sviluppare e più avanzato di Meta Lllama 3.1, più o meno al livello di GPT-4o di OpenAI e di Claude 3.5 Sonnet di Anthropic, secondo quanto dichiarato dall’azienda stessa.

Il chatbot che ne deriva, DeepSeek, è open source, gratuito e anche per questo molto attraente per gli utenti, che l’hanno l’hanno scaricato in massa dall’App Store statunitense, app gratuita che ha raggiunto la prima posizione in classifica superando anche ChatGPT, cosa che ha contribuito ulteriormente a destare preoccupazioni nella Silicon Valley.

It’s been 5 days since DeepSeek R1 launched. People are stunned by its power and intelligence—unlocking possibilities we’ve never seen before. Here are 12 incredible examples: pic.twitter.com/p8pg6voszL — Rishabh (@Rixhabh__) January 26, 2025

Le particolarità di DeepSeek

Fare di necessità virtù, si dice. Sembra essere stato questo il motto di DeepSeek che, a causa delle restrizioni commerciali volte a garantire il dominio statunitense sull’intelligenza artificiale e sulla tecnologia, si è dovuta ingegnare per fare tutto con poco. Sono probabilmente pesati da una parte l’accesso limitato alle tecnologie statunitensi, in primis i chip necessari per l’addestramento e lo sviluppo dei modelli su cui si basano le intelligenze artificiali, prodotti principalmente dalla statunitense NVIDIA; dall’altra i potenziali ostacoli interni legati al Partito Comunista Cinese, principalmente la censura sui contenuti in contrapposizione con il regime. Sono pesati, ma non troppo, a quanto pare.

Nonostante questi ostacoli, che limitano la disponibilità di risorse, fondamentali per un’azienda di questo tipo, infatti DeepSeek sembra essere già in grado di competere con i colossi tecnologici occidentali, anche grazie ad alcune soluzioni particolari ed efficienti, come l’utilizzo dell’architettura MoE (Mixture of Experts), che attivando solo i parametri necessari per ciascun compito specifico riduce di molto i costi di calcolo.

Oltre all’approccio open source, utile per sviluppatori indipendenti e piccole aziende per accedere a DeepSeek facilmente e a prezzi contenuti, un altro aspetto chiave che sta contribuendo al successo di questo nuovo strumento è legato, anche in questo caso, ai costi. Se OpenAI fa pagare un milione di token di output (unità) 60 dollari, con DeepSeek il prezzo scende a 2,19 dollari, una differenza sostanziale che potrebbe far crollare anche i prezzi delle altre aziende che operano nel settore.

C’è poi la questione legata al funzionamento in locale. DeepSeek, essendo un prodotto open source, è anche scaricabile ed eseguibile direttamente sui computer localmente, senza una connessione a internet e quindi senza dover scambiare dati con l’azienda. Per farlo, servono comunque computer molto potenti (fra i requisiti minimi una NVIDIA GeForce RTX 3090, 48 GB di RAM e 250 GB di spazio di archiviazione, per esempio).

Perché DeepSeek fa paura

Non tanto agli utenti, né a noi occidentali, ma DeepSeek fa paura alle più grandi aziende tecnologiche del settore dell’intelligenza artificiale e, più in generale, agli Stati Uniti soprattutto per il fatto che si tratta di un prodotto molto avanzato e apparentemente economico da sviluppare, che sembra capace tanto quanto le più evolute tecnologie del settore.

Come riporta il Wall Street Journal, pare siano bastati 5,6 milioni di dollari per sviluppare DeepSeek, cifra esponenzialmente inferiore rispetto ai costi necessari alle aziende occidentali, che viaggiano su cifre anche più di 100 volte superiori, in particolare per addestrare i nuovi modelli più avanzati. Per inciso, l’amministratore delegato di Anthropic, Dario Amodei, lo scorso maggio spiegò che per addestrare i modelli di intelligenza artificiale servono fra i 100 milioni e il miliardo di dollari; per quelli futuri sarebbero necessari fino a cento miliardi di dollari.

Per sviluppare il modello V3 su cui è basato DeepSeek l’azienda avrebbe inoltre utilizzato solo duemila chip di NVIDIA (le GPU H800, una sorta di versione castrata della più potente H100) a differenza degli oltre 16mila necessari per addestrare i più avanzati modelli utilizzati finora, secondo quanto riportato dal New York Times.

Non sono informazioni verificate, ma sia gli sviluppatori che gli investitori sembra stiano già mettendo in discussione l’approccio utilizzato dalle principali aziende del settore, come hanno dimostrato anche le prime aperture odierne delle borse, con i titoli in calo di NVIDIA e di altre società europee e americane legate al settore.

Deepseek R1 is AI’s Sputnik moment. — Marc Andreessen 🇺🇸 (@pmarca) January 26, 2025



Intanto, nella giornata di ieri, Marc Andreessen, il noto investitore della Silicon Valley, nonché consigliere di Donald Trump, ha condiviso quel post su X definendo il modello R1 di DeepSeek come il “momento Sputnik” dell’intelligenza artificiale, in riferimento al lancio del primo satellite artificiale mandato in orbita dall’ex Unione Sovietica che segnò l’inizio della corsa allo spazio alla fine degli anni Cinquanta, commento arrivato giusto pochi giorni dopo da un suo precedente post dai toni entusiastici: “DeepSeek R1 è una delle scoperte più sorprendenti e impressionanti che abbia mai visto e, in quanto open source, un profondo dono al mondo”.

Come per TikTok, c’è infine la questione legata alla possibile influenza del governo cinese, già sospettato di essere dietro agli sviluppi di DeepSeek. Potrebbero farlo pensare alcuni video che mostrano come il chatbot tentenni a rispondere a domande scomode, finendo poi per eluderle con messaggi simili a quelli usati da ChatGPT con alcuni nomi di persona. L’ipotesi che possa trattarsi di semplice censura necessaria, considerando che si tratta di un’azienda che opera in Cina, resta tuttavia plausibile.

DeepSeek sta limitando le nuove registrazioni a causa di “attacchi malevoli”

A poche ore di distanza dalla scalata ai vertici della classifica delle app più scaricate per iPhone negli Stati Uniti, poco dopo le 19 di oggi, 27 gennaio, DeepSeek ha limitato temporaneamente le registrazioni di nuovi utenti a causa di un problema che ha spiegato così:

A causa di attacchi malevoli su larga scala ai servizi di DeepSeek, stiamo temporaneamente limitando le registrazioni per garantire la continuità del servizio. Gli utenti esistenti possono accedere come al solito. Grazie per la comprensione e il supporto.

in sviluppo