Il mercato dell’intelligenza artificiale continua a muoversi a velocità impressionante e, spesso e volentieri, sono proprio le aziende cinesi a sparigliare le carte con strategie aggressive sul fronte dei costi. Nelle ultime ore è tornata sotto i riflettori DeepSeek, che ha deciso di rendere permanente il drastico taglio di prezzo applicato al proprio modello di punta V4 Pro, andando di fatto ad aumentare ulteriormente la pressione sui colossi occidentali come OpenAI e Anthropic.

La riduzione, inizialmente presentata come una promozione temporanea valida fino al 31 maggio 2026, diventa dunque il nuovo listino ufficiale del laboratorio di Hangzhou e porta il costo delle API del modello V4 Pro a livelli estremamente competitivi rispetto agli standard attuali del settore.

Segui TuttoTech.net su Google Discover

DeepSeek V4 Pro ora costa fino al 75% in meno

Entrando più nel dettaglio, DeepSeek ha abbassato il prezzo del proprio modello IA premium da 0,0145 a 0,003625 dollari per milione di token in alcune fasce di input, mentre l’output passa da 3,48 a 0,87 dollari per milione di token; si tratta di una riduzione molto importante, soprattutto se si considera che il modello era stato lanciato appena un mese fa, il 24 aprile 2026.

Alcuni di voi potrebbero ricordare che la famiglia V4 era stata introdotta con due varianti principali: V4 Pro e V4 Flash. La prima rappresenta la soluzione più avanzata della piattaforma, basata su un’architettura Mixture-of-Experts da 1,6 trilioni di parametri attivi durante l’inferenza; la seconda invece, punta a offrire costi ancora più bassi sacrificando parte delle prestazioni.

Entrambi i modelli supportano un contesto fino a 1 milione di token e possono generare fino a 384.000 token per singola richiesta, numeri che continuano a essere particolarmente rilevanti soprattutto per gli scenari enterprise e per gli agenti IA avanzati che lavorano su conversazioni molto lunghe o flussi documentali complessi.

HUAWEI potrebbe avere un ruolo chiave nella strategia di DeepSeek

Uno degli aspetti più interessanti della vicenda riguarda però il legame sempre più stretto tra DeepSeek e HUAWEI. Già al momento del lancio infatti, la società aveva lasciato intendere che i prezzi del modello Pro sarebbero scesi sensibilmente una volta aumentata la disponibilità dei supernode HUAWEI Ascend 950, attesi in volumi importanti nella seconda metà del 2026.

Secondo quanto emerso, la famiglia V4 sarebbe stata ottimizzata fin dal day one per l’hardware Ascend 950, una scelta che rappresenta anche un cambio di paradigma rispetto alla tradizione del settore. DeepSeek infatti, non avrebbe concesso accesso anticipato ai propri modelli a produttori occidentali come NVIDIA e AMD durante la fase di ottimizzazione pre-lancio.

Non è dunque chiaro quanto il nuovo taglio di prezzo sia direttamente collegato a una riduzione dei costi di inferenza resa possibile dall’ecosistema hardware cinese, ma è evidente che la strategia di integrazione verticale tra modelli IA e infrastruttura domestica stia diventando sempre più centrale per il mercato tecnologico del Paese.

Il confronto tra GPT-5 e Claude Opus 4.7 è impietoso

Con il nuovo listino, DeepSeek V4 Pro si posiziona nella fascia più aggressiva del mercato dei modelli IA di frontiera. Basti pensare che Anthropic propone Claude Opus 4.7 a 5 dollari per milione di token in input e 25 dollari in output, mentre OpenAI parte da 2,50 dollari in input e 10 dollari in output per GPT-5.

Questo significa che, almeno sul fronte dell’output, V4 Pro risulta circa 28 volte più economico rispetto a Claude Opus 4.7 e 11 volte più conveniente rispetto a GPT-5; il vantaggio aumenta ulteriormente nei workload con cache hit elevato, uno scenario tipico degli agenti IA che lavorano su prompt ripetitivi o sessioni prolungate.

Solo Google con Gemini 3.5 Flash riesce ancora a proporre prezzi inferiori in termini assoluti, pur trattandosi di un modello pensato per obbiettivi e livelli prestazionali differenti.

Prezzi più bassi, ma restano i dubbi geopolitici

Ovviamente il prezzo non è l’unico elemento che le aziende prendono in considerazione quando scelgono un provider IA. Se da un lato il risparmio economico potrebbe essere enorme, soprattutto per realtà enterprise che spendono centinaia di milioni di dollari all’anno in token, dall’altro continuano a pesare le questioni legate alla compliance, alla sicurezza dei dati e al contesto geopolitico.

Negli ultimi mesi inoltre, non sono mancate le polemiche: Anthropic aveva accusato DeepSeek di presunti distillation attack già nel febbraio scorso, alimentando ulteriormente la tensione tra le aziende IA occidentali e i nuovi protagonisti cinesi del settore.

La vera prova arriverà dunque nei prossimi trimestri, quando sarà possibile capire se DeepSeek riuscirà davvero a sostenere questi prezzi estremamente aggressivi anche su larga scala, soprattutto con l’arrivo in volumi dei supernode HUAWEI Ascend 950 previsto nella seconda metà del 2026.