Lo studio rivela l'algoritmo statistico novello per identificare i geni potenziali di malattia

Un nuovo studio, affiliato con UNIST recentemente ha presentato un algoritmo statistico novello, capace dell'identificazione dei geni potenziali di malattia in un modo più accurato e più redditizio. Questo algoritmo egualmente è stato considerato come nuovo approccio di promessa per l'identificazione dei geni di malattia del candidato, poichè funziona efficacemente con i dati meno genomica e cattura soltanto un minuto o due per ottenere i risultati.

Questa innovazione è stata condotta dal professor Dougu Nam ed il suo gruppo di ricerca nel banco delle scienze biologiche a UNIST. I loro risultati sono stati pubblicati nella ricerca degli acidi nucleici il 19 marzo 2018.

Nello studio, il gruppo di ricerca ha presentato il metodo ed il software novelli GSA-SNP2 per l'analisi di arricchimento in via dei dati del P-valore di GWAS. Secondo il gruppo di ricerca, GSA-SNP2 fornisce l'alto potere, il tipo rispettabile procedura di controllo errori di I ed il calcolo veloce incorporando il punteggio casuale del gene di regolato del modello e di SNP-conteggio dell'insieme.

“GSA-SNP2 è un potente e strumento efficiente per arricchimento in via ed analisi di rete dei dati sommari di studio (GWAS) genoma di ampiezza di associazione,„ dice il professor Nam. “Con questo algoritmo, possiamo identificare facilmente i nuovi obiettivi della droga, quindi approfondendo la nostra comprensione delle malattie ed aprire le nuove terapie per trattarla.„

Il genoma di ogni persona è una combinazione unica di sequenze del DNA che svolgono i ruoli principali nella determinazione dei chi siamo. Ciò rappresenta tutte le diverse differenze, compreso predisposizione per la malattia ed i diversi fenotipi. Tale variazione genetica fra gli esseri umani è conosciuta come singoli polimorfismi del nucleotide (SNPs). SNPs che correlano con le malattie specifiche potrebbe servire da biomarcatori premonitori aiutare lo sviluppo di nuove droghe. Con l'analisi statistica dei dati sommari di GWAS, è possibile identificare lo SNPs malattia-associato.

Malgrado le somme di denaro ed il tempo astronomici investiti nell'analisi statistica dei dati di SNP, le tecnologie convenzionali di rilevazione di SNP hanno non potute identificare tutto lo SNPs possibile. Ciò è perché la maggior parte dei metodi convenzionali per la rilevazione dello SNPs sono destinati per gestire rigorosamente i falsi positivi nei risultati. Di conseguenza, fra decine di migliaia di dati di genomica e di centinaia di migliaia di SNPs ha analizzato, il numero degli indicatori descritti presso un candidato il gene di malattia che raggiunge spesso i dieci del severl.

“Sebbene gestire il falso positivo SNPs sia necessario per l'interpretazione corretta dei risultati, troppa filtrazione può ostacolare la sua utilità per lo sviluppo della droga,„ dice il professor Nam. “Di conseguenza, la potenza statistica migliorata è essenziale agli algoritmi statistici pratici.„

Il gruppo ha mirato a sviluppare un algoritmo che migliora la prevedibilità statistica mentre mantiene il controllo accurato dei falsi positivi. Per fare questo, hanno applicato la curva monotona di tendenza della scanalatura cubica al punteggio del gene via l'analisi non Xerox di via per i dati di espressione genica.

In uno studio comparativo facendo uso dei dati simulati e reali di GWAS, GSA-SNP2 ha esibito l'alto potere e le vie positive prioritarie al meglio di sistema monetario aureo rispetto a sei a metodi basati a arricchimento esistenti ed a due metodi autonomi. Sulla base di questi risultati, la differenza fra gli approcci dell'analisi di via è stata studiata e gli effetti delle strutture di correlazione del gene sull'analisi di arricchimento in via egualmente sono stati discussi. Inoltre, GSA-SNP2 può prevedere le reti di interazione della proteina all'interno di ed attraverso le vie significative in moda da potere dare la priorità l'utente alle sottoreti di memoria per ulteriori studi.

Secondo il gruppo di ricerca, GSA-SNP2 fornisce un tipo notevolmente migliore procedura di controllo errori di I usando i punteggi del gene di regolato di SNP-conteggio, mentre tuttavia conservando l'alta potenza statistica. Egualmente fornisce sia le reti locali che globali di interazione della proteina nelle vie associate e può facilitare l'analisi integrata di rete e di via dei dati di GWAS.

Il gruppo di ricerca prevede che il loro GSA-SNP2 possa prevedere le reti di interazione della proteina all'interno di ed attraverso le vie significative in moda da potere dare la priorità l'utente alle sottoreti di memoria per ulteriori studi.

Sorgente: http://news.unist.ac.kr/new-method-for-finding-disease-susceptibility-genes/