Usare l’intelligenza artificiale per la salute e dunque in ambito medico è sempre stato un obiettivo ma a quanto pare di polemiche ce ne sono sempre. A riaccendere il confronto è stata l’esperienza di Geoffrey Fowler, giornalista del Washington Post, che ha messo alla prova ChatGPT Salute con i propri dati clinici, ottenendo un risultato sorprendente.
Fowler ha fornito alla piattaforma dieci anni di misurazioni raccolte tramite Apple Watch e archiviate nell’app Salutedi Apple. L’analisi dell’AI, disponibile negli Stati Uniti in una fase di beta chiusa, ha assegnato alla sua salute cardiaca un giudizio F, equivalente a insufficiente. Un responso che ha generato preoccupazione e lo ha spinto a consultare un medico.
Il parere dell’AI contro quello del medico
La visita medica ha però ribaltato completamente il quadro. Secondo il professionista che lo ha esaminato, Fowler non presentava alcuna criticità, tanto che non sono stati prescritti ulteriori esami di approfondimento. Il rischio cardiacorisultava molto basso, in netto contrasto con l’allarme lanciato dall’AI.
Il caso solleva interrogativi importanti. In questo episodio si è trattato di un falso positivo, ma resta aperta la questione opposta: cosa accadrebbe se un sistema di AI fornisse una valutazione rassicurante a fronte di una condizione reale seria?
Errori interpretativi e dati fuori contesto
Analizzando il responso, emergono diversi problemi. ChatGPT ha attribuito valore clinico a parametri come VO2 Maxe HRV, che se stimati da uno smartwatch, anche avanzato, non possono essere considerati dati diagnostici certi. Inoltre, l’AI non ha tenuto conto in modo corretto di fattori fondamentali come età, genere e informazioni più recenti, pur avendo accesso completo allo storico.
Il cardiologo Eric Topol dello Scripps Research Institute ha definito l’analisi “priva di fondamento”, invitando a ignorare i consigli medici forniti dall’AI. A preoccupare è anche la variabilità dei risultati: ripetendo la stessa analisi, ChatGPT ha restituito valutazioni comprese tra B e F, mentre Claude ha assegnato una C agli stessi dati.
