Facendo Uso dei supercomputer per paragonare le parti del genoma umano a quelle di altri mammiferi, i ricercatori a Cornell hanno scoperto circa 300 geni umani precedentemente non identificati ed hanno trovato le estensioni di diverse centinaia geni già conosciute.
La scoperta è basata sull'idea che mentre gli organismi si evolvono, sezioni del codice genetico che fanno qualche cosa di utile per il cambiamento dell'organismo nei modi diversi.
La ricerca è riferita dall'assistente universitario di Adam Siepel, di Cornell delle statistiche biologiche e della biologia di calcolo, dal ricercatore postdottorale Brona Brejova di Cornell e dai colleghi a parecchie altre istituzioni nella versione online della Ricerca del Genoma del giornale e comparirà nell'edizione della stampa di Dicembre.
Il genoma umano completo è stato ordinato parecchi anni fa, ma quello significa semplicemente che l'ordine dei 3 miliardo le unità circa chimiche, chiamate basi, che compongono il codice genetico è conosciuto. Che Cosa rimane è l'identificazione della posizione esatta di tutte le brevi sezioni che codificano per le proteine o eseguono regolatore o di altre funzioni.
Più Di 20.000 geni di proteina-codifica sono stati identificati, così il contributo di Cornell, mentre significativi, drammaticamente non cambia il numero dei geni conosciuti. Che Cosa è importante, i ricercatori dicono, è che le loro manifestazioni di scoperta là ancora potrebbero essere molti altri geni che sono stati mancati facendo uso dei metodi biologici correnti. Questi metodi sono molto efficaci a trovare i geni che ampiamente sono espressi ma possono mancare quelli che sono espressi soltanto in determinati tessuti o alle fasi iniziali di sviluppo embrionale, Siepel ha detto.
“Che Cosa è emozionante sta usando l'evoluzione per identificare questi geni,„ Siepel ha detto. “L'Evoluzione sta facendo questo esperimento per milioni di anni. Il computer è il nostro microscopio per osservare i risultati.„
Quattro basi differenti -- riferito a comunemente dalle lettere G, C, A e T -- componga il DNA. Tre basi su una riga possono codificare per un amminoacido (le particelle elementari delle proteine) e una serie di questi codici di tre lettere può essere un gene, codificante per una serie di amminoacidi che una cella può trasformare una proteina.
Siepel ed i colleghi hanno precisato per trovare i geni che “sono stati conservati„ -- quello è fondamentale a tutta la vita e quello ha restato lo stessi, o quasi così, sopra milioni di anni di evoluzione.
I ricercatori hanno cominciato con “gli allineamenti„ scoperti da altri lavoratori -- allunga lungamente fino a parecchie migliaia di basi che sono principalmente simili attraverso due o più specie. Facendo Uso dei cluster del computer su grande scala, compreso un cluster di 850 vertici al Centro di Cornell per la Computazione Avanzata, i ricercatori hanno eseguito tre progettazioni differenti di computazione o, di algoritmi -- uno di cui Siepel ha creato -- per confrontare questi allineamenti fra l'essere umano, il mouse, il ratto ed il pollo in varie combinazioni.
Sopra milioni di anni, le diverse basi possono essere cambiate -- C - G, T - A, per esempio -- danno o miscopying. Cambia che altera la struttura di una proteina può uccidere l'organismo o inviarlo giù un percorso evolutivo senza uscita. Ma i geni conservati contengono soltanto i cambiamenti secondari che lasciano la proteina capace di fare il suo processo. Il computer ha cercato le regioni con quegli ordinamenti dei cambiamenti creando un modello matematico di come il gene potrebbe cambiare, poi cercante abbina a questo modello.
Dopo l'eliminazione delle previsioni che hanno abbinato i geni già conosciuti, i ricercatori hanno verificato il resto in laboratorio, provante che molti dei geni potrebbero in effetti essere trovati in campioni del tessuto umano e potrebbero codificare per le proteine. I ricercatori potevano a volte identificare le proteine in confronto ai database delle proteine conosciute. I geni scoperti pricipalmente riguardano attività motoria, aderenza delle cellule, il tessuto connettivo e lo sviluppo di sistema nervoso centrale, funzioni che potrebbero essere prevedute per essere comuni a molte creature differenti.
L'intero progetto, da bene immobile e dalla prova i modelli matematici ad eseguire le prove di laboratorio definitive, ha richiesto circa tre anni, Siepel ha detto. Il lavoro è stato supportato dall'Istituto Nazionale contro il Cancro, da uno Sviluppo di Carriera Iniziale del National Science Foundation Grant e da un'amicizia della ricerca del laureato dell'Università di California.
http://www.cornell.edu/