Algoritmo Novo para arranjar em seqüência mais rápido do genoma humano

Published on July 11, 2012 at 12:52 AM · No Comments

Em 2001, o Projecto de Genoma Humano e a Genómica de Celera anunciaram que após 10 anos de trabalho a custo de uns $400 milhões, tinha terminado uma seqüência do esboço do genoma humano. Hoje, arranjar em seqüência um genoma humano é algo que um único pesquisador pode fazer em um par semanas para menos de $10.000.

Desde 2002, a taxa em que os genomas podem ser arranjados em seqüência tem dobrado cada quatro meses ou Assim, visto que a potência informática dobra somente cada 18 meses. Sem o advento de ferramentas analíticas novas, a capacidade dos biólogos para gerar dados genomic superará logo sua capacidade para fazer qualquer coisa útil com ela.

Na introdução a mais atrasada da Biotecnologia da Natureza, os pesquisadores do MIT e da Universidade de Harvard descrevem um algoritmo novo que reduza dràstica o tempo onde toma para encontrar uma seqüência particular do gene em uma base de dados dos genomas. Além Disso, mais genomas que está procurarando, maior a aceleração tem recursos para, assim que suas vantagens combinarão somente como mais dados são gerados.

Em algum sentido, este é um algoritmo da dados-compressão - como esse que permite que os usuários do computador comprimam ficheiros de dados em ficheiro zip menores. “Você tem todos estes dados, e claramente, se você quer os armazenar, que povos fariam naturalmente é comprimi-los,” diz Bonnie Berger, um professor de matemática aplicada e de informática no MIT e autor superior no papel. “O problema é que eventualmente você tem que o olhar, assim que você tem que descomprimir-lo para olhá-lo. Mas nossa introspecção é que se você comprime os dados na maneira direita, a seguir você pode fazer sua análise directamente nos dados comprimidos. E esse aumenta a velocidade ao manter a precisão das análises.”

Explorando a redundância

O esquema da compressão dos pesquisadores explora o facto de que a evolução é picante com bons projectos. Há muita sobreposição nos genomas de espécies estreitamente relacionadas, e alguns sobrepor mesmo nos genomas de espécies distante relacionadas: É por isso as experiências executadas em pilhas de fermento podem dizer-nos algo sobre reacções humanas da droga.

Berger; sua estudante licenciado anterior Michael Baym PhD '09, que é agora um erudito de visita no departamento da matemática do MIT e em um postdoc na biologia de sistemas na Faculdade de Medicina de Harvard; e sua estudante licenciado actual Po-Ru Loh desenvolveu uma maneira de representar matematicamente os genomas de espécies diferentes - ou de indivíduos diferentes dentro de uma espécie - tais que os dados de sobreposição estão armazenados somente uma vez. Uma busca de genomas múltiplos pode assim concentrar-se em suas diferenças, ganhando o tempo.

“Se Eu quero executar uma computação em meu genoma, toma uma determinada quantia do tempo,” Baym explica. “Se Eu quero então executar a mesma computação em seu genoma, o facto de que nós somos tão similares significa que Eu tenho feito já a maioria do trabalho.”

Read in | English | Español | Français | Deutsch | Português | Italiano | 日本語 | 한국어 | 简体中文 | 繁體中文 | Nederlands | Русский | Svenska | Polski