Aviso: Esta página é uma tradução automática da página original em inglês. Por favor note uma vez que as traduções são geradas por máquinas, não tradução tudo será perfeita. Este site e suas páginas da Web destinam-se a ler em inglês. Qualquer tradução deste site e suas páginas da Web pode ser imprecisas e imprecisos no todo ou em parte. Esta tradução é fornecida como uma conveniência.

O LLNL conduz a colaboração multi-institucional em modelar as interacções da proteína ligadas ao cancro

Os cientistas, os biofísicos e os estatísticos computacionais do laboratório nacional de Lawrence Livermore (LLNL) e do laboratório nacional de Los Alamos (LANL) estão conduzindo uma colaboração multi-institucional maciça que desenvolvam uma simulação aprender-baseada máquina para os super-computadores da próxima geração capazes de modelar interacções da proteína e as mutações que jogam um papel em muitos formulários dos cancros.

As hastes da pesquisa de um projecto piloto no projecto comum de soluções de computação avançadas para o programa do cancro (JDACS4C), de uma colaboração entre o Ministério do escritório (DOE) da Energia da ciência, da administração nuclear nacional e (NNSA) do instituto nacional para o cancro da segurança (NCI) que é apoiado na parte pelo cancro Moonshot. O trabalho está sendo publicado pela conferência 2019 da supercomputação, guardarada os 17-22 de novembro em Denver, onde está entre os finalistas para a melhor concessão de papel da conferência.

O papel, que igualmente inclui contribuições do laboratório nacional de Oak Ridge (ORNL), do laboratório nacional de Frederick para a investigação do cancro (FNLCR) e do IBM, descreve uma aproximação com carácter de previsão e da multi-escala para modelar a dinâmica de proteínas de RAS -; uma família das proteínas cujas as mutações são ligadas a mais de 30 por cento de todos os cancros humanos -; e membranas do lipido, assim como a activação da sinalização oncogenic com a interacção com proteínas do RAF. O NCO estabeleceu a iniciativa de RAS em 2013 para explorar a biologia do mutante RAS (oncogenic) e para criar finalmente oportunidades terapêuticas novas para cancros RAS-relacionados.

O cientista de computador do LLNL e o autor principal Francesco Di Natale, que apresentarão o papel na conferência, disseram que a equipe tomou uma aproximação larga a modelar interacções da proteína de RAS. A equipe começou com um macro-modelo capaz de simular o impacto de uma membrana do lipido em proteínas de RAS em calendários longos e incorporou um algoritmo de aprendizagem da máquina para determinar que lipido “correcções de programa” eram interessante bastante modelar com maiores detalhes com um micromodel do molecular-nível. O resultado é um Multiscale que maciça paralelo a infra-estrutura de modelagem Máquina-Instruída (MuMMI) essa escala acima eficientemente em grande, máquinas de computação heterogêneas do elevado desempenho como a serra do LLNL e a cimeira de ORNL.

Quando o conceito de uma simulação do multiscale não for novo à dinâmica molecular, Di Natale disse, introduzindo a aprendizagem de máquina ao processo previamente manual de selecionar correcções de programa do interesse é tempo de um cálculo da aproximação nova, do salvamento e dinheiro nas simulações caras que podem ou para não fornecer a informação relevante.

“O modelo da aprendizagem de máquina deixa-nos remover o ser humano do laço ao ainda obter dados realmente relevantes da semente,” Di Natale disse. “O benefício a ter o processo automatizado é que nós começamos ver proteínas múltiplas de RAS em uma correcção de programa, e é algo que manualmente seria duro de fazer. De repente, nós podemos ver como afastadas as proteínas naturalmente oriente de RAS e fornecemos então resultados à comunidade mais exactamente ao modelo ele, porque nós temos todos estes dados. Você pode começar fazer perguntas sobre o que acontece realìstica um pouco do que supor em parâmetros válidos.”

O mecanismo e a dinâmica de como as proteínas de RAS interagem, como interagem com o RAF e promovem a sinalização oncogenic, e como a actividade da influência RAS da composição do lipido (os compostos orgânicos solúveis que ajudam a compo as membranas de pilha) não são bons compreendidos. Para este papel, a equipe simulou a interacção entre RAS e oito dos lipidos os mais relevantes para investigar a dinâmica e a interacção de RAS. Simularam uma 1 correcção de programa da membrana de by-1-micrometer com 300 proteínas diferentes de RAS para analisar as membranas a fim gerar estatìstica as observações relevantes que podem ser testadas experimental em FNLCR.

Nós decidimos que aquele em vez que faz o que foi feito tradicional com as simulações - tomando uma membrana modelo com um ou dois lipidos - essas dos nós tentaria a fazer realística e modelar uma membrana biològica relevante. O objetivo é caracterizar a agregação de RAS, as interacções da RAS-proteína e as interacções do RAS-lipido, observando que tipos de lipidos ditam o comportamento de RAS e o orientam na membrana. Nós queremos ver se nós podemos modular a actividade de RAS com tipos diferentes de lipidos ou algum tipo de farmacêutico, para não eliminar a actividade de RAS mas para modulá-la em maneiras diferentes, como a promoção dos estados inactivos.”

Helgi Ingólfsson, biólogo computacional do LLNL, chumbo técnico no projecto

Os cientistas de LANL encabeçaram os esforços em estabelecer uma bandeira de ouro para esta estrutura de MuMMI usando simulações atomísticas e conduziram a análise destas simulações em grande escala à compreensão mecanicista do extracto da biologia de RAS no contexto de uma membrana. A experiência de LANL na quantificação da incerteza era crítica para identificar estatìstica propriedades biofísicas significativas dentro da estrutura do multiscale.

No curso do projecto, a equipe encontrou que os conjuntos de RAS têm um ambiente preferido da membrana, e que usar a aprendizagem de máquina (ML) seleccionar automaticamente determinadas correcções de programa para umas simulações mais de alta resolução do molecular-nível tem vantagens distintas sobre a selecção randomized da correcção de programa, fornecendo uma cobertura mais larga do espaço de fase do ambiente do lipido de RAS.

“Explorar a incorporação do AI e o ML com simulação do elevado desempenho era um tema de integração para os três pilotos de DOE/NCI que compreendem JDACS4C,” disse Fred Streitz, co-chumbo piloto e cientista do chefe no escritório da inteligência artificial e da tecnologia no Ministério de Energia, que coordena projectos do AI através da empresa da GAMA. “Esta aplicação destaca realmente como poderoso as duas tecnologias podem ser, e quanto mais eficazes nós podemos ser, ao trabalhar dentro junto.”

O laboratório nacional de Frederick está executando o teste experimental para assegurar-se de que os modelos sejam representante de resultados biológicos reais. Os modelos ajudarão o NCO a realizar experiências para testar previsões e para gerar mais dados que alimentarão de novo no modelo da aprendizagem de máquina, criando um laço da validação que produza um modelo mais exacto, os pesquisadores disseram. A grande campanha da simulação reserva endereçar uma grande escala da pergunta científica sem a necessidade para simulações novas.

“Lá nós podemos realmente ver o potencial verdadeiro de ter tão muitos tipos diferentes de simulações, ambos em tão muitos ambientes diferentes e igualmente a quantidade completa, e fazemos quase toda a pergunta que nós quisermos,” Ingólfsson disse. “Agora nós podemos responder 2 aquelas perguntas após o facto porque nós temos bastante dados para o fazer.”

Para o modelo do microscale, a equipe usou um código da dinâmica molecular adotado para o modelo grosseiro-grained de Martini. Foi adaptado para GPUs à corrida na serra, fazendo lhe provavelmente o único código geral da dinâmica molecular para ser executado completamente em GPUs, os pesquisadores disseram. O trabalho esticou os limites da serra adiantada sistema do acesso, como cada “correcção de programa,” representando uma área de aproximadamente 30 por 30 nanômetros, contida aproximadamente 140.000 grânulos da grosseiro-grão e milhares de lipidos individuais.

Quando o sistema estava ainda em seu ambiente não classificado, a equipe executou quase 120.000 simulações na serra, tomando 5,6 milhão horas de GPU do tempo e da geração do cálculo 320 Terabyte maciços dos dados. O número de simulações “estava desconcertando,” os pesquisadores disseram, adicionando que o número o maior de simulações de Martini feitas ao mesmo tempo estava somente nos milhares antes deste projecto.

“Operar-se nesta escala demonstra muitos desafios que nós estamos indo ter que começar discutir,” Di Natale disse. “Você pode somente armazenar tão muitos discos rígidos antes que se torne espacial e financeira insustentável para controlar que muitos dados. Este é um saque em problemas potenciais da próxima geração. É a primeira evidência de onde o campo está começando ir, e aquele significa em si mais dores crescentes.”

A equipe está continuando o trabalho sistema não classificado no companheiro de Lassen, de serra e actualmente o sistemath o mais rápido da supercomputação 10 no mundo, de acordo com a lista Top500. Estão preparando-se para executar a próxima fase no super-computador o mais poderoso do mundo, a cimeira de Oak Ridge, no fim deste ano, refactoring o código e adicionando várias melhorias.