Un supercomputer è diventato, inaspettatamente, una finestra sul funzionamento della vita. Alla University of Glasgow, il sistema di calcolo Tursa, parte dell’infrastruttura britannica DiRAC, è stato usato per addestrare un modello di intelligenza artificiale. Il quale è dedicato allo studio delle proteine. L’obiettivo è comprendere come tali molecole interagiscono e comunicano nelle cellule. Il progetto ha portato alla creazione di PLM-Interact. Un modello linguistico che traduce il comportamento delle proteine in termini comprensibili per un algoritmo. L’approccio sfrutta la potenza computazionale di Tursa per analizzare un’enorme mole di dati. Oltre 421.000 coppie di proteine umane sono servite ad addestrare una rete neurale. La quale è composta da 650 milioni di parametri. In tal modo, l’AI ha imparato a interpretare le sequenze proteiche come un sistema di regole e relazioni.

Supercomputer usati per comprendere il codice delle proteine

Il risultato ha superato le aspettative. PLM-Interact è riuscito a prevedere con una precisione superiore del 16-28% rispetto ai modelli più avanzati le modalità con cui le proteine si legano tra loro. Ed anche le conseguenze delle mutazioni genetiche su tali legami. Durante i test sperimentali, il sistema ha riconosciuto cinque interazioni fondamentali. Coinvolte in processi biologici cruciali, come la polimerizzazione dell’RNA e il trasporto intracellulare delle proteine. Laddove i modelli precedenti ne avevano individuata una sola.

Una caratteristica del nuovo strumento è la capacità di estendere le sue analisi. Arrivando anche alle malattie ereditarie e ai tumori. Ciò grazie alla possibilità di simulare l’effetto delle mutazioni sulle interazioni molecolari. Inoltre, il modello è stato addestrato su dati relativi a proteine umane e virali. In tal caso, ha dimostrato un’elevata efficacia nel prevedere i meccanismi con cui i virus si legano alle cellule ospiti.

Pubblicato su Nature Communications, lo studio non rappresenta solo un progresso nel campo della bioinformatica. Ma anche un segnale della crescente convergenza tra discipline scientifiche. Se confermati e ampliati, i risultati di PLM-Interact potrebbero ridefinire i tempi di sviluppo di farmaci e vaccini. Riducendo i costi della sperimentazione e aprendo la strada a una nuova era di medicina di precisione.