Os cientistas desembaraçam como a rede neural inteligente prevê as funções das proteínas

Os companheiros virtuais inteligentes gostam de Alexa, Siri, e o assistente de Google tem-se tornado por muito tempo integrado em nossas vidas quotidianas. E os programas computacionais inteligentes, algoritmos assim chamados, igualmente evoluíram como uma ferramenta integral na investigação científica.

As enormes quantidade dos dados gerados na pesquisa da ciência da vida podem eficientemente ser examinadas para testes padrões de retorno com o auxílio dos algoritmos. Determinados programas podem manchar estruturas de retorno em grandes moléculas de proteína e usar então esta informação para tirar conclusões sobre que tarefas celulares estas moléculas executam - por exemplo, se funcionam como interruptores do gene, os motores moleculars, ou as moléculas da sinalização. As previsões feitas por tais algoritmos com base nas seqüências da proteína - que consistem em uma série de blocos de apartamentos da proteína amarrados junto como uma colar da pérola - são agora incredibly precisas.

Contudo, uma desvantagem principal de técnicas precedentes é que os usuários estão mantidos completamente na obscuridade a respeito de porque o algoritmo atribui uma função particular a determinadas seqüências da proteína. O conhecimento preciso do computador sobre proteínas não está directamente disponível, apesar do facto de que tal conhecimento poderia provar inestimável em avançar a investigação e desenvolvimento de agentes novos.

Uma equipe do estudante, conduzida comum por Roland Eils e Irina Lehmann do instituto de Berlim da saúde (BIH) e o Charité - o Universitätsmedizin Berlim, em colaboração com Dominik Niopek do instituto da farmácia e da biotecnologia molecular (IPMB) na universidade de Heidelberg, grupo próprio o objetivo de destravar este conhecimento do computador. Começou a trabalhar neste assunto em 2017, e desenvolveu um algoritmo chamado “DeeProtein,” uma rede neural detalhada e inteligente que pudesse prever as funções das proteínas baseadas na seqüência de blocos de apartamentos individuais da proteína, os ácidos aminados. Como a maioria de algoritmos de aprendizagem, DeeProtein é uma “caixa negra,” que significa como trabalha permanece um mistério aos programadores assim como aos usuários. Mas os estudantes têm usado agora um “truque” para desembaraçar o segredo desta rede.

Os cientistas novos começados desenvolvendo uma maneira de olhar figurativa sobre o ombro do programa como faz seu trabalho.

Na análise de sensibilidade nós sucessivamente mascaramos cada posição na seqüência da proteína e deixamos DeeProtein calcular, ou prever um pouco, a função da proteína desta informação incompleta.”  

Zu Belzen de Julius Upmeier

É um estudante no programa do mestre na biotecnologia molecular no IPMB e no autor principal do papel, que foi publicado apenas na inteligência de máquina da natureza do jornal.

Em seguida nós damos a DeeProtein a informação completa da seqüência e comparamos os dois grupos de previsões. Desta maneira nós calculamos, para cada posição na seqüência da proteína, como importante esta posição é prevendo a função correcta. Isto significa que nós damos cada posição ou ácido aminado na corrente da proteína um valor da sensibilidade para a função da proteína.”

Zu Belzen de Julius Upmeier

Os cientistas usam então a técnica analítica nova para identificar as regiões das proteínas que são vitais a sua função. Esta técnica trabalha sinalizando as proteínas que jogam um papel durante a carcinogénese também para a ferramenta CRISPR-Cas9 deedição, que tem sido testada já em um grande número estudos pré-clínicos e clínicos. “A análise de sensibilidade permite-nos de identificar as regiões da proteína que toleram mudanças bem ou não tão bem,” diz Dominik Niopek. “Esta é uma primeira etapa importante se nós queremos fazer mudanças visadas às proteínas, para as equipar com as funções novas ou “para desligar” propriedades indesejáveis.”

Com este trabalho nós mostramos que não somente podem as previsões das redes neurais ser úteis, mas que nós podemos igualmente agora pela primeira vez usar este conhecimento implícito para extremidades práticas.

Roland Eils

Esta aproximação é relevante para muitas edições na biologia molecular e na medicina.

Se, por exemplo, nós queremos desenvolver drogas visadas ou as terapias genéticas, nós precisam de saber exactamente onde focalizar nossa atenção, DeeProtein pode agora ajudar-nos a fazer aquele.”

Roland Eils

Source:

Für Gesundheitsforschung de Institut do berlinês/instituto de Berlim da saúde

Referência do jornal:

2019) conhecimentos implícitos Leveraging de Eils, de R. e outros (em redes neurais para a dissecção funcional e planejamento das proteínas. Inteligência de máquina da natureza. doi.org/10.1038/s42256-019-0049-9.