Un team di matematici guidato da Taeho Kim ha sviluppato il Maximum Agreement Linear Predictor (MALP), un metodo innovativo che rende le previsioni più accurate e coerenti in medicina, biologia ed economia
Previsioni più accurate grazie alla nuova scoperta dei matematici.
Un gruppo di matematici provenienti da diversi paesi, guidato dal dottor Taeho Kim (1), uno statistico della Lehigh University, ha messo a punto un nuovo sistema. Questo approccio, descritto su arXiv (2), potrebbe fare un grande passo avanti nella creazione di modelli predittivi per settori come la salute, la biologia e le scienze sociali.
L'idea principale di questo metodo e di produrre stime che combacino meglio con i risultati veri. I ricercatori lo hanno battezzato Maximum Agreement Linear Predictor, in breve MALP.
«Questa metrica tiene conto sia della precisione, ovvero di come i punti si raggruppano stretti, sia dell'accuratezza, che indica la vicinanza alla linea di riferimento. I metodi classici, tipo quello dei minimi quadrati, puntano soprattutto a ridurre l'errore medio. Funzionano bene in tanti casi, ma a volte non bastano se si vuole spingere al massimo l'accordo invece di una semplice approssimazione», dice Kim, che insegna matematica come assistente professore.
«A volte non ci basta avere stime vicine ai valori reali. Vogliamo che mostrino il massimo accordo con loro», spiega. «La cosa da capire e come definire in modo scientifico l'accordo tra due cose. Un approccio per farlo e vedere quanto i punti si allineano a una linea di 45 gradi in un grafico che mette a confronto valori previsti e quelli veri. Se il grafico mostra un allineamento forte con quella linea, allora c'è un buon accordo tra i due».
La concordanza non e proprio la stessa della correlazione
«Quando si parla di concordanza, in genere la gente pensa al coefficiente di correlazione di Pearson, che si impara presto nei corsi base di statistica. Quel coefficiente aiuta a capire la forza e il senso di un legame lineare tra variabili, ma non guarda in modo preciso all'allineamento su una linea di 45 gradi. Per esempio, può segnalare una correlazione forte pure se la linea ha una pendenza di 50 o 75 gradi», nota Kim.
«Nel nostro lavoro, ci interessa proprio quell'allineamento a 45 gradi. Per questo usiamo un'altra misura, il coefficiente di correlazione di concordanza, che Lin ha introdotto nel 1989. Questa si focalizza su quanto i dati si mettono in fila su quella linea diagonale. Quello che abbiamo creato e un predittore che punta a massimizzare la concordanza tra stime e realtà».
Come hanno provato il MALP con dati veri
Il gruppo ha messo alla prova il MALP sia con simulazioni al computer sia con informazioni reali, inclusi dati su scansioni degli occhi e sul grasso corporeo. Per mostrare quanto vale, hanno usato il metodo su uno studio di oftalmologia che metteva a confronto due apparecchi per tomografia a coerenza ottica, OCT. Uno era il vecchio Stratus OCT, l'altro il più recente Cirrus OCT. Le cliniche stanno passando al Cirrus, e i dottori hanno bisogno di un sistema sicuro per tradurre le misure e mantenere la continuità tra vecchi e nuovi dispositivi.
Hanno preso scansioni precise da 26 occhi sinistri e 30 destri. Poi hanno visto quanto il MALP riusciva a calcolare le letture dello Stratus partendo dai dati del Cirrus. Hanno confrontato i risultati con quelli dei minimi quadrati. Il MALP ha dato stime più vicine alle misure vere dello Stratus. Invece i minimi quadrati hanno tagliato un po' meglio l'errore medio. Questo mostra il trade-off tra accuratezza e concordanza.
Hanno provato il MALP anche su dati del grasso corporeo da 252 adulti. Includevano peso, circonferenza della pancia e altre misure del corpo. I modi diretti per misurare il grasso, come la pesata sott'acqua, sono precisi ma costano cari. Per questo i ricercatori usano spesso stime da misure facili. Hanno preso quelle per prevedere la percentuale di grasso. Poi hanno paragonato il MALP ai minimi quadrati standard. Il MALP ha prodotto stime più aderenti ai valori reali. I minimi quadrati hanno avuto errori medi un filo più bassi. Ancora una volta, emerge l'equilibrio tra concordanza e taglio dell'errore.
Usi più ampi e cosa viene dopo
Kim e il suo team hanno visto che il MALP spesso dava previsioni che si adattavano meglio ai dati veri rispetto ai modi tradizionali. Pero la decisione tra MALP e approcci classici dipende da cosa si vuole ottenere in un progetto specifico. Se conta ridurre l'errore, i metodi vecchi vanno ancora bene. Se invece serve il massimo accordo, il MALP e la via da seguire.
Questi risultati potrebbero cambiare le cose per gli strumenti di previsione in tanti ambiti. Dalla medicina e la salute pubblica, fino all'economia e all'ingegneria. Per chi lavora con i dati e i modelli predittivi, il MALP e uno strumento nuovo e utile. Soprattutto quando non si tratta solo di stare vicini ai valori reali, ma di accordarsi pienamente con la verità.
«Dobbiamo scavare di più», dice Kim. «Per ora ci siamo fermati ai predittori lineari. Questo copre un sacco di usi pratici in vari campi, ma matematicamente resta limitato. Vogliamo allargare l'idea alla classe generale. Togliendo la parte lineare, per farne il Maximum Agreement Predictor (MALP)».
Riferimenti:
(1) Taeho Kim
(2) Maximum Agreement Linear Predictors
Descrizione foto: Taeho Kim. - Credit: Christine Kreschollek.
Autore traduzione riassuntiva e adattamento linguistico: Edoardo Capuano / Articolo originale: New Statistical Tool Enhances Prediction Accuracy