Advertencia: Esta página es una traducción de esta página originalmente en inglés. Tenga en cuenta ya que las traducciones son generadas por máquinas, no que todos traducción será perfecto. Este sitio Web y sus páginas están destinadas a leerse en inglés. Cualquier traducción de este sitio Web y su páginas Web puede ser imprecisa e inexacta en su totalidad o en parte. Esta traducción se proporciona como una conveniencia.

El LLNL lleva la colaboración multi-institucional en el modelado de las acciones recíprocas de la proteína conectadas al cáncer

Los científicos, los biofísicos y los estadísticos de cómputo del laboratorio nacional de Lorenzo Livermore (LLNL) y del laboratorio nacional de Los Alamos (LANL) están llevando una colaboración multi-institucional masiva que ha desarrollado una simulación aprender-basada máquina para los superordenadores de la siguiente-generación capaces de modelar acciones recíprocas de la proteína y las mutaciones que desempeñan un papel en muchas formas de cánceres.

La investigación proviene un proyecto piloto en el diseño común de soluciones que calculan avanzadas para el programa del cáncer (JDACS4C), de una colaboración entre el Ministerio de oficina (DOE) de la Energía de la ciencia, de la administración nuclear nacional y (NNSA) del Instituto Nacional del Cáncer de la seguridad (NCI) que es soportado en parte por el cáncer Moonshot. El trabajo está siendo publicado por la conferencia 2019 de la superinformática, llevada a cabo el 17-22 de noviembre en Denver, donde está entre los finalistas para la mejor recompensa de papel de la conferencia.

El papel, que también incluye contribuciones del laboratorio nacional de la Oak Ridge (ORNL), del laboratorio nacional de Frederick para la investigación de cáncer (FNLCR) y de IBM, describe una aproximación profética y de la multi-escala para modelar la dinámica de las proteínas de RAS -; una familia de proteínas cuyas mutaciones se conectan al más de 30 por ciento de todos los cánceres humanos -; y membranas del lípido, así como la activación de la transmisión de señales oncogénica con la acción recíproca con las proteínas de la Royal Air Force. El NCI estableció la iniciativa de RAS en 2013 para explorar la biología del mutante RAS (oncogénico) y para crear final las nuevas oportunidades terapéuticas para los cánceres RAS-relacionados.

El informático del LLNL y el autor importante Francisco Di Natale, que presentarán el papel en la conferencia, dijeron que las personas llevaron una aproximación amplia el modelado de acciones recíprocas de la proteína de RAS. Las personas comenzaron con un macromodelo capaz de simular el impacto de una membrana del lípido en las proteínas de RAS en los calendarios largos e incorporaron un algoritmo de aprendizaje de máquina para determinar qué lípido “remiendos” eran bastante interesante modelar más detalladamente con un micromodel del molecular-nivel. El resultado es un Multiscale masivo paralelo que la infraestructura de modelado Máquina-Docta (MuMMI) esa aumenta proporcionalmente eficientemente en grande, máquinas que calculan heterogéneas del alto rendimiento como Sierra del LLNL y la cumbre de ORNL.

Mientras que el concepto de una simulación del multiscale no es nuevo a la dinámica molecular, Di Natale dijo, introduciendo el aprendizaje de máquina al proceso previamente manual de seleccionar remiendos del interés es tiempo de un cálculo del nuevo enfoque, el salvar y dinero en las simulaciones costosas que pueden o no ofrecer la información relevante.

“El modelo del aprendizaje de máquina nos permite quitar al ser humano del rizo mientras que todavía consigue datos realmente relevantes de la semilla,” Di Natale dijo. “La ventaja a hacer el proceso automatizar es que comenzamos a ver las proteínas múltiples de RAS en un remiendo, y es algo que sería manualmente duro de hacer. Repentinamente, podemos ver hasta dónde aparte las proteínas de RAS naturalmente orientar y después ofrecer resultados a la comunidad más exacto al modelo él, porque tenemos todos estos datos. Usted puede comenzar a hacer preguntas acerca de qué suceso realista bastante que conjeturando en los parámetros válidos.”

El mecanismo y las dinámicas de cómo obran recíprocamente las proteínas de RAS, cómo obran recíprocamente con la Royal Air Force y ascienden la transmisión de señales oncogénica, y cómo la actividad de la influencia RAS de la composición del lípido (las composiciones orgánicas solubles que ayudan a componer las membranas celulares) no están bien entendidos. Para este papel, las personas simularon la acción recíproca entre RAS y ocho de los lípidos más relevantes para investigar dinámica y la acción recíproca de RAS. Simularon un 1 remiendo de la membrana de by-1-micrometer con 300 diversas proteínas de RAS para analizar las membranas para generar estadístico las observaciones relevantes que se pueden probar experimental en FNLCR.

Decidíamos que el en vez que hace qué se ha hecho tradicionalmente con las simulaciones - tomando una membrana modelo con uno o dos lípidos - esas de nosotros intentaría hacerla realista y modelar una membrana biológico relevante. La meta es caracterizar la agregación de RAS, acciones recíprocas de la RAS-proteína y acciones recíprocas del RAS-lípido, observando qué tipos de lípidos dictan comportamiento de RAS y lo orientan en la membrana. Queremos ver si podemos modular actividad de RAS con diversos tipos de lípidos o una cierta clase de farmacéutico, para no eliminar actividad de RAS sino para modularla en maneras diferentes, como ascender los estados inactivos.”

Helgi Ingólfsson, biólogo de cómputo del LLNL, guía técnico en el proyecto

Los científicos de LANL encabezaron los esfuerzos en el establecimiento de un oro-estándar para este marco de MuMMI usando simulaciones atomísticas y llevaron el análisis de estas simulaciones en grande a la comprensión mecánica del extracto de la biología de RAS en el contexto de una membrana. La experiencia de LANL en la cuantificación de la incertidumbre era crítica para determinar estadístico propiedades biofísicas importantes dentro del marco del multiscale.

A lo largo del proyecto, las personas encontraron que los montajes de RAS tienen un ambiente preferido de la membrana, y que usar el aprendizaje de máquina (ML) seleccionar automáticamente ciertos remiendos para simulaciones más de alta resolución del molecular-nivel tenga ventajas distintas sobre la selección seleccionada al azar del remiendo, ofreciendo un abrigo más amplio del espacio de fase del ambiente del lípido de RAS.

La “exploración de la incorporación del AI y del ml con la simulación del alto rendimiento era un tema de integración para los tres pilotos de DOE/NCI que comprenden JDACS4C,” dijo a Fred Streitz, co-guía experimental y científico del jefe en la oficina de la inteligencia artificial y de la tecnología en el Ministerio de Energía, que coordina proyectos del AI a través de la empresa de la GAMA. “Este uso destaca realmente cómo es potente las dos tecnologías pueden ser, y cuánto más efectivos podemos ser, al trabajar hacia adentro juntos.”

El laboratorio nacional de Frederick está realizando la prueba experimental para asegurarse que los modelos son representante de resultados biológicos reales. Los modelos ayudarán al NCI a realizar experimentos para probar predicciones y generar más datos que retroactuarán en el modelo del aprendizaje de máquina, creando un rizo de la validación que producirá un modelo más exacto, los investigadores dijeron. La campaña grande de la simulación permite el dirigir de una amplia gama de pregunta científica sin la necesidad de nuevas simulaciones.

“Allí podemos ver realmente el potencial verdadero del tener tan muchos diversos tipos de simulaciones, ambos en tan muchos diversos ambientes y también la cantidad escarpada, y hacemos casi cualquier pregunta que queramos,” Ingólfsson dijo. “Ahora podemos contestar a esas preguntas después del hecho porque tenemos suficiente datos para hacerlo.”

Para el modelo de la microescala, las personas utilizaron una clave de la dinámica molecular adoptada para el modelo de grano grueso de Martini. Fue adaptado para GPUs a la corrida en Sierra, haciéndole probablemente la única clave general de la dinámica molecular para ejecutarse totalmente en GPUs, los investigadores dijeron. El trabajo estiró los límites del sistema temprano de Sierra del acceso, como cada “remiendo,” representando un área de cerca de 30 por 30 nanómetros, contenida cerca de 140.000 molduras del basto-grano y millares de lípidos individuales.

Mientras que el sistema todavía estaba en su ambiente sin clasificar, las personas ejecutaron casi 120.000 simulaciones en Sierra, tardando 5,6 millones de horas de GPU de tiempo y de generar del cálculo los 320 Terabyte masivos de datos. El número de simulaciones “escalonaba,” los investigadores dijeron, agregando que el número más grande de simulaciones de Martini hechas al mismo tiempo estaba solamente en los millares antes de este proyecto.

El “operar en esta escala demuestra muchos los retos que vamos a tener que para comenzar a discutir,” Di Natale dijo. “Usted puede salvar solamente tan muchas impulsiones duras antes de que llegue a ser espacial y financieramente insostenible para manejar que muchos datos. Esto es un saqueo en problemas potenciales de la siguiente-generación. Es las primeras pruebas de donde el campo está comenzando a ir, y ése de por sí significa más dolores cada vez mayor.”

Las personas están continuando el trabajo en sistema sin clasificar del compañero de Lassen, de Sierra y actualmente el sistemath más rápido de la superinformática 10 del mundo, según el filete Top500. Se están preparando para funcionar con la fase próxima en el superordenador más potente del mundo, la cumbre de la Oak Ridge, refactoring la clave y agregando a finales de este año diversas mejorías.