I ricercatori di UW sviluppano il nuovo modello a più esattamente predicono le mutazioni genetiche nocive

Fra tutta la due genti, c'è probabile essere almeno 10 milione differenze nella sequenza genetica che compone il loro DNA.

La Maggior Parte di queste differenze non alterano il modo che le celle si comportino o che causino i problemi sanitari. Ma alcune variazioni genetiche notevolmente aumentano la probabilità che una persona svilupperà il cancro, il diabete, il colorblindness o una miriade di altre malattie.

Malgrado gli avanzamenti rapidi nella nostra capacità di mappare il genoma di una persona - la codifica precisa che compone i suoi geni - conosciamo molto di meno circa cui le mutazioni o le anomalie realmente causano la malattia.

Ora, un nuovo modello e pubblicamente - lo strumento disponibile di Web sviluppato dai ricercatori dell'Università di Washington inscatola esattamente e quantitativamente predice quali mutazioni genetiche cambiano significativamente come i geni impiombano e possono autorizzare l'attenzione aumentata dai ricercatori di malattia e dai rivelatori della droga.

Il modello - il primo per preparare un algoritmo di apprendimento automatico sui grandi importi dei dati genetici creati con le tecniche sintetiche di biologia - è descritto in un documento pubblicato nell'emissione del 22 ottobre della Cella.

“Qualche gente ha variazioni in un gene particolare, ma che cosa realmente volete conoscere siete se quelli importassero o non,„ ha detto l'autore principale Alexander Rosenberg, uno studente di laurea di ingegneria elettrica di UW. “Questo modello può aiutarvi a restringere l'universo - enorme - delle mutazioni che potrebbero essere più probabili da causare la malattia.„

In particolare, il modello predice come queste variazioni genetiche di sequenza pregiudicano lo splicing alternativo - un trattamento critico che permette ad un singolo gene di creare molti moduli differenti delle proteine includendo o escludendo i frammenti di RNA.

“Questo è un viale che è inesplorato in larga misura,„ ha detto Rosenberg. “È equo facile da esaminare come le mutazioni pregiudicano direttamente le proteine, ma la gente non ha potuta esaminare come le mutazioni pregiudicano le proteine con l'impionbatura.„

Per esempio, uno scienziato che studia i sostegni genetici del cancro polmonare o della depressione o un difetto di nascita particolare potrebbe digitare la sequenza il più comunemente comune del DNA in un gene particolare nello strumento di Web come pure le variazioni multiple. Il modello dirà allo scienziato quali mutazioni causano le differenze oversize in come il gene impiomba - in grado di essere un segno di difficoltà - e quale hanno poco o nessun effetto.

Il ricercatore ancora dovrebbe studiare se una sequenza genetica particolare causa i cambiamenti nocivi, ma lo strumento online può contribuire ad eliminare le molte variazioni che non sono probabili essere di interesse ai ricercatori di salubrità. Per convalidare le potenze premonirici del modello, il gruppo di UW lo ha provato su una manciata di mutazioni ben recepito come quelle nel gene BRCA2 che sono stati collegati al petto ed al cancro ovarico.

Confrontato ai modelli precedentemente pubblicati, l'approccio di UW è approssimativamente tre volte più accurato a predire le dimensioni a cui una mutazione indurrà il materiale genetico ad essere inclusa o a escludersi nel trattamento difabbricazione - che può cambiare come quelle proteine funzionano ed inducono i trattamenti biologici ad andare storto.

quello è perché il gruppo di UW ha usato un nuovo approccio che combina le tecniche sintetiche di apprendimento automatico e di biologia per creare il modello.

Algoritmi di Apprendimento automatico - che permettono ai computer di arguire le norme e “impari„ dai grandi importi dei dati - diventati più accurati più dati sono esposti a. Ma il genoma umano ha soltanto approssimativamente 25.000 geni che creano le proteine.

Facendo Uso delle tecniche comuni di biologia molecolare, il gruppo di UW ha creato una libreria oltre di 2 milione “mini-geni„ sintetici comprendendo le sequenze casuali del DNA. Poi hanno determinato come ogni elemento di sequenza casuale ha pregiudicato dove geni impiombati e che tipo RNA è stato prodotto - che infine determina quali proteine ottengono fatte.

Che la più grande libreria dei dati sintetici essenzialmente insegna al modello per diventare più astuto, ha detto l'autore principale Georg Seelig, un assistente universitario di UW di ingegneria elettrica e dell'informatica & dell'assistenza tecnica.

“Il Nostro algoritmo funziona il pozzo eccellente perché è stato preparato su questi gruppi di dati sintetici. E la ragione che funziona è così bene perché quel gruppo di dati sintetico è ordini di grandezza più grandi dell'addestramento vi ha impostato ottiene dal genoma umano reale,„ ha detto Seelig.

“È notevole che un modello preparato interamente sui dati sintetici può superare i modelli preparati direttamente sul genoma umano sul compito di predizione dell'impatto delle mutazioni nella gente,„ lui ha detto.

I punti Seguenti della ricerca comprendono l'ampliamento dell'approccio oltre splicing alternativo ad altri trattamenti che determinano come i geni sono espressi.

Nel frattempo, facendo lo strumento di Web liberamente e pubblicamente - disponibile, il gruppo spera che altri scienziati usino il loro modello di splicing alternativo - ed infine realizzare progressi nel restringersi che le variazioni genetiche naturali sono più significative quando si tratta di salubrità e della malattia.

“Altri gruppi di ricerca e società possono usare il nostro modello per allineare i centri di interesse a loro,„ Seelig ha detto. “Speriamo che l'altra gente catturi il questo più ulteriormente alle applicazioni più cliniche.„

Sorgente: Università di Washington

Source:

University of Washington