Una nuova ricerca mostra che una sola notte di sonno può rivelare il rischio di oltre 100 malattie grazie a SleepFM, un modello di intelligenza artificiale che analizza in profondità i segnali fisiologici registrati durante il sonno. Un passo decisivo verso una medicina predittiva basata sui dati del sonno
Come l’intelligenza artificiale può prevedere oltre 100 malattie dal sonno.
Un sonno povero preannuncia un giorno successivo con gli occhi spenti, ma potrebbe anche suggerire malattie che si manifesteranno anni dopo. Un nuovo modello di intelligenza artificiale sviluppato dai ricercatori della Stanford Medicine e dai loro colleghi può utilizzare registrazioni fisiologiche raccolte durante una notte di sonno per predire il rischio di sviluppare più di 100 condizioni di salute.
Conosciuto come SleepFM, il modello è stato addestrato su quasi 600.000 ore di dati sul sonno raccolti da 65.000 partecipanti. I dati sul sonno derivano dalla polisonnografia, una valutazione completa del sonno che utilizza vari sensori per registrare attività cerebrale, attività cardiaca, segnali respiratori, movimenti degli arti, movimenti oculari e altro ancora.
La polisonnografia è lo standard di riferimento negli studi del sonno che monitorano i pazienti durante la notte in laboratorio. È anche, hanno realizzato i ricercatori, una miniera d’oro di dati fisiologici ancora inesplorata.
«Registriamo un numero sorprendente di segnali quando studiamo il sonno», ha detto il dottor Emmanuel Mignot, MD, PhD (1), professore Craig Reynolds di Medicina del sonno e co-senior autore del nuovo studio, che è stato pubblicato il 6 gennaio su Nature Medicine. «È una sorta di fisiologia generale che studiamo per otto ore su un soggetto completamente osservato. È molto ricca di dati».
Solo una frazione di quei dati è utilizzata nella ricerca sul sonno attuale e nella medicina del sonno. Con i progressi dell’intelligenza artificiale, ora è possibile dare senso a molto di più. Il nuovo studio è il primo a utilizzare l’IA per analizzare dati sul sonno di tale portata.
«Da una prospettiva IA, il sonno è relativamente poco studiato. C’è molto altro lavoro di IA che guarda a patologia o cardiologia, ma relativamente poco al sonno, nonostante il sonno sia una parte così importante della vita», ha detto il dottor James Zou, PhD (2), professore associato di scienza dei dati biomedici e co-senior autore dello studio.
Imparare il linguaggio del sonno
Per sfruttare il tesoro di dati sul sonno, i ricercatori hanno costruito un foundation model, un tipo di modello di intelligenza artificiale che può addestrarsi su enormi quantità di dati e applicare ciò che ha imparato a una vasta gamma di compiti. I grandi modelli linguistici come ChatGPT sono esempi di foundation model addestrati su enormi quantità di testo.
Le 585.000 ore di dati di polisonnografia su cui è stato addestrato SleepFM provenivano da pazienti che avevano avuto il loro sonno valutato in diverse cliniche del sonno. I dati sul sonno sono suddivisi in intervalli di cinque secondi, analoghi alle parole che i grandi modelli linguistici utilizzano per l’addestramento.
«SleepFM sta essenzialmente imparando il linguaggio del sonno», sostiene Zou. Il modello è stato in grado di incorporare più flussi di dati - per esempio, elettroencefalografia, elettrocardiografia, elettromiografia, lettura del polso e flusso dell’aria respiratoria - e di comprendere come essi si relazionano tra loro.
Per raggiungere questo obiettivo, i ricercatori hanno sviluppato una nuova tecnica di addestramento, chiamata leave-one-out contrastive learning, che in sostanza nasconde una modalità di dati e sfida il modello a ricostruire la parte mancante basandosi sugli altri segnali.
«Uno dei progressi tecnici che abbiamo compiuto in questo lavoro è stato capire come armonizzare tutte queste diverse modalità di dati affinché possano unirsi per apprendere lo stesso linguaggio», ha detto Zou.
Prevedere le malattie
Dopo la fase di addestramento, i ricercatori hanno potuto perfezionare il modello per diversi compiti.
Per prima cosa, hanno testato il modello su compiti standard di analisi del sonno, come la classificazione delle diverse fasi del sonno e la diagnosi della gravità dell’apnea notturna. SleepFM ha ottenuto prestazioni pari o superiori ai modelli all’avanguardia utilizzati oggi.
Successivamente, i ricercatori hanno affrontato un obiettivo più ambizioso: prevedere l’insorgenza futura di malattie a partire dai dati del sonno. Per identificare quali condizioni potevano essere previste, era necessario abbinare i dati di polisonnografia utilizzati per l’addestramento con gli esiti sanitari a lungo termine degli stessi partecipanti. Fortunatamente, avevano accesso a più di mezzo secolo di cartelle cliniche provenienti da una clinica del sonno.
Il Stanford Sleep Medicine Center fu fondato nel 1970 dal compianto William Dement, MD, PhD, ampiamente considerato il padre della medicina del sonno. Il più grande gruppo di pazienti utilizzato per addestrare SleepFM - circa 35.000 pazienti di età compresa tra 2 e 96 anni - ha avuto i propri dati di polisonnografia registrati presso la clinica tra il 1999 e il 2024. I ricercatori hanno abbinato i dati di polisonnografia di questi pazienti con le loro cartelle cliniche elettroniche, che fornivano per alcuni fino a 25 anni di follow-up.
Le registrazioni di polisonnografia della clinica risalgono a un’epoca ancora più lontana, ma solo su carta, sostiene il dottor Emmanuel Mignot, che ha diretto il centro del sonno dal 2010 al 2019.
SleepFM ha analizzato più di 1.000 categorie di malattie presenti nelle cartelle cliniche e ne ha trovate 130 che potevano essere previste con un’accuratezza ragionevole a partire dai dati del sonno di un paziente. Le previsioni del modello sono risultate particolarmente solide per tumori, complicanze della gravidanza, condizioni circolatorie e disturbi mentali, raggiungendo un indice C superiore a 0,8.
L’indice C, o indice di concordanza, è una misura comune delle prestazioni predittive di un modello, in particolare della sua capacità di prevedere quale dei due individui di un gruppo sperimenterà per primo un determinato evento.
«Per tutte le possibili coppie di individui, il modello fornisce una classifica di chi è più probabile che sperimenti un evento - ad esempio, un infarto - prima. Un indice C di 0,8 significa che l’80% delle volte la previsione del modello è concorde con ciò che è effettivamente accaduto», ha detto Zou.
SleepFM ha eccelso nel prevedere il morbo di Parkinson (indice C 0,89), la demenza (0,85), la cardiopatia ipertensiva (0,84), l’infarto (0,81), il cancro alla prostata (0,89), il cancro al seno (0,87) e la morte (0,84). «Siamo rimasti piacevolmente sorpresi dal fatto che, per un insieme piuttosto vario di condizioni, il modello sia in grado di fornire previsioni informative», ha detto Zou.
Modelli meno accurati, con indici C intorno a 0,7 - come quelli che prevedono la risposta di un paziente a diversi trattamenti contro il cancro - si sono già dimostrati utili in ambito clinico, ha aggiunto.
Interpretare il modello
Il team sta lavorando a modi per migliorare ulteriormente le previsioni di SleepFM, magari aggiungendo dati provenienti da dispositivi indossabili, e per comprendere esattamente ciò che il modello sta interpretando.
«Non ce lo spiega in inglese», ha detto Zou. «Ma abbiamo sviluppato diverse tecniche di interpretazione per capire cosa stia osservando il modello quando formula una previsione specifica di malattia».
I ricercatori notano che, anche se i segnali cardiaci pesano di più nelle previsioni relative alle malattie cardiache e i segnali cerebrali pesano di più nelle previsioni riguardanti la salute mentale, è stata la combinazione di tutte le modalità di dati a produrre le previsioni più accurate.
«Le informazioni più utili per prevedere le malattie le abbiamo ottenute confrontando i diversi canali», ha detto Mignot. I segni di disallineamento tra i costituenti del corpo - per esempio, un cervello che sembra dormire ma un cuore che sembra sveglio - sembravano indicare problemi.
Riferimenti:
(1) Emmanuel Mignot
(2) James Zou
Descrizione foto: Paziente. - Credit: IA.
Autore traduzione riassuntiva e adattamento linguistico: Edoardo Capuano / Articolo originale: New AI model predicts disease risk while you sleep