Sapienza ha realizzato un nuovo studio con l’Istituto italiano di tecnologia (IIT) e altri centri di ricerca internazionali sulla possibilità di predirre con metodi di apprendimento automatico le varianti genetiche associate a un alto rischio di malattia di Alzheimer. I risultati del lavoro sono stati pubblicati sulla rivista scientifica Alzheimer’s & Dementia: Diagnosis, Assessment & Disease Monitoring
L’Alzheimer fa parte di quelle malattie genetiche causate da mutazioni a livello di un singolo gene, ovvero in cui una variante a livello di singolo nucleotide (SNV Single-Nucleotide Variants) è sufficiente per causare la patologia genetica. Ad oggi si conoscono il gene e la mutazione coinvolti nell’insorgenza di solo la metà di queste malattie.
Diversi studi di larga scala (chiamati in inglese GWAS, Genome-wide association studies) hanno portato alla luce informazioni su singole varianti associate alla propensione di un paziente di contrarre l’Alzheimer, ma gli SNV non posso essere utilizzati efficacemente a scopo predittivo senza considerare le relazioni fra di essi e i potenziali rapporti con altri elementi del genoma.
Basti pensare che molti soggetti con una determinata variante genica associata all’Alzheimer (come per esempio la mutazione nel gene APOE), non sviluppano la patologia.
Per comprendere come ciò possa accadere, un team di ricercatori del Dipartimento di Biologia e biotecnologie Charles Darwin della Sapienza, insieme con l’Istituto italiano di tecnologia (IIT) e altri centri di ricerca internazionali, ha utilizzato un approccio di machine learning per analizzare l’intero profilo genomico di pazienti con malattia di Alzheimer e individuare le predisposizioni genetiche alla base dell’insorgenza della patologia. I risultati dello studio, condotto dalla giovane ricercatrice Magdalena Arnal nel laboratorio Sapienza di Gian Gaetano Tartaglia, sono stati pubblicati sulla rivista Alzheimer’s & Dementia: Diagnosis, Assessment & Disease Monitoring.
In particolare, per costruire i profili genomici, è stato utilizzato un subset di dati costruito a partire da due dei più grandi database esistenti: UK Biobank e ADNI.
“Le combinazioni ottenibili sono innumerevoli, abbiamo quindi sviluppato un approccio informatico di tipo machine learning per semplificare l’analisi – spiega Magdalena Arnal. “Senza questa svolta computazionale la nostra analisi non sarebbe stata possibile”.
In questo modo i ricercatori hanno identificato sei varianti SVN in una zona del genoma, il cromosoma 19, che permettono di identificare un gran numero di individui come potenziali casi di Alzheimer.
“Quello che abbiamo scoperto è definito epistasi, una forma di interazione genica per cui una variazione genica può mascherare o contribuire all’espressione fenotipica di altri geni – aggiunge Gian Gaetano Tartaglia. “Questa è la chiave per comprendere l’organizzazione del genoma: a seconda di come gli SNV si combinano, un individuo può sviluppare la malattia di Alzheimer o meno”.
Il prossimo step per i ricercatori sarà quello di identificare nuovi patterns coinvolti in altre malattie.
Riferimenti:
Machine learning methods applied to genotyping data capture interactions between single nucleotide variants in late onset Alzheimer’s disease – Alzheimer’s & Dementia: Diagnosis, Assessment & Disease Monitoring