La promessa di un’intelligenza artificiale capace di interpretare i dati del nostro corpo sembrava a portata di mano. Con il recente debutto di ChatGPT Health, OpenAI ha introdotto un’integrazione con Apple Health e altre piattaforme di monitoraggio fisico. In teoria, lo strumento dovrebbe consentire agli utenti di ricevere analisi personalizzate sui propri parametri vitali, trasformando milioni di dati raccolti dall’Apple Watch in consigli comprensibili.
Ma la realtà, almeno per ora, sembra ben diversa. Il giornalista tecnologico del Washington Post, Geoffrey A. Fowler, ha deciso di mettere alla prova il nuovo servizio, concedendo a ChatGPT Health l’accesso completo ai dati registrati dal suo Apple Watch in oltre dieci anni: 29 milioni di passi e 6 milioni di battiti cardiaci. Il risultato? Una valutazione del suo stato di salute con un impietoso “F”, equivalente a un fallimento totale.
Dati travisati e valutazioni discutibili
Convinto di essere improvvisamente a rischio cardiovascolare, Fowler ha condiviso il responso con il proprio medico, che ha rapidamente smentito la diagnosi dell’AI: i suoi valori reali indicavano un rischio estremamente basso. Il problema, racconta, risiedeva nella scarsa comprensione del contesto da parte del modello linguistico.
ChatGPT avrebbe infatti interpretato in modo errato diversi parametri provenienti da Apple Health. In particolare, l’algoritmo avrebbe dato un peso eccessivo al VO₂ max, un valore che Apple stessa etichetta come una stima indicativa più che una misura clinicamente precisa. Inoltre, il bot non avrebbe considerato variazioni dovute al cambio di modello di Apple Watch nel tempo, differenze tecniche nei sensori che ChatGPT ha letto come cambiamenti fisiologici del tutto inesistenti.

Queste imprecisioni rivelano uno dei limiti strutturali dell’attuale integrazione tra AI e dispositivi biometrici: i dati grezzi possono essere precisi, ma interpretarli correttamente richiede una comprensione medica, contestuale e individuale che l’intelligenza artificiale, almeno per ora, non possiede.
Risultati fluttuanti e memoria corta
Oltre alle valutazioni errate, Fowler ha notato una forte incoerenza nei risultati. Ripetendo lo stesso test più volte, ChatGPT Health ha modificato il punteggio di salute da F a B, passando per altre valutazioni intermedie come una C. Ogni conversazione sembrava ripartire da zero, dimenticando dettagli essenziali come età, sesso o parametri recenti.
In alcuni casi il chatbot ignorava persino i dati ematici più aggiornati, pur avendone accesso tramite l’app Salute. Questo comportamento mette in evidenza quanto la memoria conversazionale di ChatGPT , pensata per contesti generici, sia ancora poco affidabile per ambiti sensibili come la salute personale.
Segui l'Intelligenza Artificiale su Telegram, ricevi news e offerte per primo
Un problema di fiducia nell’intelligenza artificiale medica
Il test del giornalista americano evidenzia una questione più ampia: quanto possiamo realmente fidarci delle analisi AI in campo sanitario? ChatGPT Health rappresenta un passo ambizioso verso un futuro in cui l’intelligenza artificiale potrebbe supportare medici e pazienti nell’interpretazione dei dati biometrici. Tuttavia, mancano ancora le basi per considerarlo uno strumento diagnostico o anche solo di supporto clinico.

Gli algoritmi di AI generativa, infatti, non ragionano come un medico. Producono risposte in linguaggio naturale basandosi su correlazioni statistiche, non su competenze mediche certificate. Quando si tratta di salute, anche un piccolo errore di interpretazione può avere ripercussioni psicologiche e comportamentali significative, come dimostra la reazione iniziale di Fowler, che si è precipitato a correre dopo aver ricevuto un voto basso.
Il confronto con le mosse di Apple
In questo scenario, cresce la curiosità per le presunte novità di Apple Health+, il servizio AI in sviluppo a Cupertino e atteso, secondo i rumor, entro la fine del 2026. Se Apple riuscirà a offrire un sistema davvero coerente e validato da esperti, potrebbe colmare il divario tra il potenziale e la realtà delle analisi basate sull’intelligenza artificiale.
La sfida però è enorme: gestire miliardi di dati sensibili con rigore medico e garantire interpretazioni personalizzate, affidabili e prive di falsi allarmi sarà un traguardo difficile persino per Apple. Ma il fallimento momentaneo di ChatGPT Health dimostra anche quanto lo spazio per l’innovazione in questo campo sia ancora vasto.
I nostri contenuti da non perdere:
- 🔝 Importante: NVIDIA GeForce RTX 5060 Ti 16 GB vs RTX 5060 8 GB: gaming, consumi e prezzi
- 💰 Risparmia sulla tecnologia: segui Prezzi.Tech su Telegram, il miglior canale di offerte
- 🏡 Seguici anche sul canale Telegram Offerte.Casa per sconti su prodotti di largo consumo

