Attenzione: questa pagina è una traduzione automatica di questa pagina originariamente in lingua inglese. Si prega di notare in quanto le traduzioni sono generate da macchine, non tutte le traduzioni saranno perfetti. Questo sito web e le sue pagine web sono destinati ad essere letto in inglese. Ogni traduzione del sito e le sue pagine web possono essere imprecise e inesatte, in tutto o in parte. Questa traduzione è fornita per comodità.

Il LLNL piombo la collaborazione multi-istituzionale nella modellistica delle interazioni della proteina collegate a cancro

Gli scienziati, i biofisici e gli statistici di calcolo dal laboratorio nazionale di Lawrence Livermore (LLNL) e dal laboratorio nazionale di Los Alamos (LANL) piombo una collaborazione multi-istituzionale massiccia che ha sviluppato ad una simulazione basata imparare a macchina per i supercomputer di prossima generazione capaci di modellistica delle interazioni della proteina e le mutazioni che svolgono un ruolo in molti moduli dei cancri.

La ricerca proviene da un progetto pilota nella progettazione unita delle soluzioni di calcolo avanzate per il programma del Cancro (JDACS4C), di una collaborazione fra il Dipartimento per l'energia l'ufficio (DOE) di scienza, dell'amministrazione nucleare nazionale e (NNSA) dell'istituto nazionale contro il cancro di obbligazione (NCI) che è supportato in parte dal Cancro Moonshot. L'opera sta pubblicanda dalla conferenza 2019 di supercomputing, tenuta 17-22 novembre a Denver, in cui è fra i finalisti per il migliore premio di carta della conferenza.

L'articolo, che egualmente comprende i contributi dal laboratorio nazionale di Oak Ridge (ORNL), dal laboratorio nazionale di Frederick per ricerca sul cancro (FNLCR) e da IBM, descrive un approccio del multi-disgaggio e premonitore per modellare la dinamica delle proteine di RAS -; una famiglia delle proteine di cui le mutazioni sono collegate a più di 30 per cento di tutti i cancri umani -; e membrane del lipido come pure l'attivazione della segnalazione oncogena con l'interazione con le proteine di RAF. Il NSC ha stabilito nel 2013 l'iniziativa di RAS per esplorare la biologia del mutante RAS (oncogeno) ed infine per creare le nuove opportunità terapeutiche per i cancri in relazione con RAS.

L'informatico del LLNL e l'autore principale Francesco Di Natale, che presenteranno il documento alla conferenza, hanno detto che il gruppo ha adottato un vasto approccio a modellare le interazioni della proteina di RAS. Il gruppo ha cominciato con un macromodello capace di simulazione dell'impatto di una membrana del lipido sulle proteine di RAS alle scale cronologiche lunghe ed ha compreso un algoritmo di apprendimento automatico per determinare quale lipido “toppe„ erano abbastanza interessante da modellare più dettagliatamente con di un micromodel livello molecolare. Il risultato è un Multiscale che in maniera massiccia parallelo l'infrastruttura modellante Commputer-Istruita (MuMMI) quella sottopone a operazioni di disgaggio efficientemente su su grande, commputer eterogenei di computer a alto rendimento come la sierra del LLNL e la sommità di ORNL.

Mentre il concetto di una simulazione del multiscale non è nuovo alla dinamica molecolare, Di Natale ha detto, presentando l'apprendimento automatico al trattamento precedentemente manuale di selezionare le toppe di interesse è tempo di un calcolo di risparmio, di approccio novello e moneta sulle simulazioni costose che possono o non fornire il dato valido.

“Il modello di apprendimento automatico ci lascia eliminare l'essere umano dal ciclo mentre ancora ottiene i dati realmente pertinenti del seme,„ Di Natale ha detto. “Il vantaggio per fare automatizzare il trattamento è che cominciamo vedere le proteine multiple di RAS in una toppa ed è qualcosa che sia stato manualmente duro da fare. Improvvisamente, possiamo vedere fin dove a parte le proteine di RAS naturalmente orientare più esattamente e poi fornire i risultati alla comunità al modello, perché abbiamo tutti questi dati. Potete cominciare fare le domande riguardo a che cosa accade realisticamente piuttosto che indovinando ai parametri validi.„

Il meccanismo e la dinamica di come le proteine di RAS interagiscono, come interagiscono con RAF e promuovono la segnalazione oncogena e come l'attività di influenza RAS della composizione nel lipido (composti organici solubili che contribuiscono a comporre le membrane cellulari) non sono buono capiti. Per questo documento, il gruppo ha simulato l'interazione fra RAS ed otto dei lipidi più pertinenti per studiare la dinamica e l'interazione di RAS. Hanno simulato una 1 toppa della membrana di by-1-micrometer con 300 proteine differenti di RAS per analizzare le membrane per generare statisticamente le osservazioni pertinenti che possono essere provate sperimentalmente a FNLCR.

Abbiamo deciso che quello invece che fa che cosa è stato fatto tradizionalmente con le simulazioni - catturando una membrana di modello con uno o due lipido - quelle dei noi proverebbe a renderlo realistica ed a modellare una membrana biologicamente pertinente. Lo scopo è di caratterizzare l'aggregazione di RAS, le interazioni della RAS-proteina e le interazioni del RAS-lipido, osservando che tipo di lipidi dettano il comportamento di RAS ed orientano sulla membrana. Vogliamo vedere se possiamo modulare l'attività di RAS con differenti tipi di lipidi o certo genere di farmaceutico, per non eliminare l'attività di RAS ma per modularla nei modi diversi, come la promozione degli stati inattivi.„

Helgi Ingólfsson, biologo di calcolo del LLNL, tecnico inganna il progetto

Scienziati da LANL condutto gli sforzi sull'instaurazione dello d'oro standard per questa struttura di MuMMI facendo uso delle simulazioni atomistiche e piombo l'analisi di queste simulazioni su grande scala per estrarre comprensione meccanicistica della biologia di RAS nel contesto di una membrana. La competenza di LANL nella quantificazione di incertezza era critica per l'identificazione statisticamente dei beni biofisici significativi nel quadro del multiscale.

Nel corso del progetto, il gruppo ha trovato che le installazioni di RAS hanno un ambiente preferito della membrana e quello facendo uso dell'apprendimento automatico (ML) per selezionare automaticamente determinate toppe per delle le simulazioni livelle molecolare più di alta risoluzione presenta i vantaggi distinti sopra la selezione ripartita con scelta casuale della toppa, fornente il più ampia copertura dello spazio di fase dell'ambiente del lipido di RAS.

“Esplorare l'incorporazione di AI ed il ml con simulazione di rendimento elevato era un tema d'integrazione per i tre piloti di DOE/NCI che comprendono JDACS4C,„ ha detto Fred Streitz, co-cavo pilota e scienziato del capo nell'ufficio della tecnologia e di intelligenza artificiale nel Dipartimento per l'energia, che coordina i progetti di AI attraverso l'impresa della DAINA. “Questa applicazione realmente evidenzia quanto potente le due tecnologie possono essere e quanto più efficace possiamo essere quando lavora dentro insieme.„

Il laboratorio nazionale di Frederick sta eseguendo la prova sperimentale per assicurare che i modelli siano rappresentante dei risultati biologici reali. I modelli aiuteranno il NSC ad effettuare gli esperimenti per verificare le previsioni e generare più dati che retroagiranno nel modello di apprendimento automatico, creanti un ciclo di convalida che produrrà un modello più accurato, i ricercatori hanno detto. La grande campagna di simulazione concede rivolgere una vasta gamma di domanda scientifica senza l'esigenza di nuove simulazioni.

“Là possiamo realmente vedere il potenziale vero di avere tanti tipi differenti di simulazioni, entrambi in tanti ambienti differenti ed anche l'importo puro e facciamo quasi tutta la domanda che vogliamo,„ Ingólfsson ha detto. “Ora possiamo rispondere a quelle domande dopo il fatto perché abbiamo abbastanza dati per farlo.„

Per il modello di microscala, il gruppo ha usato un codice di dinamica molecolare adottato per il modello a grana grossa di Martini. Si è adattato per GPUs all'esecuzione sulla sierra, rendendogli probabilmente il solo codice generale di dinamica molecolare per funzionare completamente su GPUs, i ricercatori hanno detto. Il lavoro ha allungato i limiti della sierra in anticipo sistema di accesso, come ogni “toppa,„ rappresentando un'area di circa 30 da 30 nanometri, contenuta circa 140.000 perle del grezzo-granulo e migliaia di diversi lipidi.

Mentre il sistema era ancora nel suo ambiente non classificato, il gruppo ha eseguito quasi 120.000 simulazioni sulla sierra, richiedente 5,6 milione ore di GPU di tempo e della generazione di calcolo 320 Terabyte massicci dei dati. Il numero delle simulazioni “stava vacillando,„ i ricercatori hanno detto, aggiungendo che il più grande numero delle simulazioni di Martini fatte contemporaneamente era soltanto in migliaia prima di questo progetto.

“Funzionare a questo disgaggio dimostra le molte sfide che stiamo andando dovere per cominciare discutere,„ Di Natale ha detto. “Potete memorizzare soltanto tanti dischi rigidi prima che diventi sia nello spazio che finanziariamente indifendibile per gestire che molti dati. Ciò è un'incursione nei problemi di prossima generazione potenziali. È la prima prova di dove il campo sta cominciando andare e quello di per sé significa più dolori crescenti.„

Il gruppo sta continuando il lavoro sistema non classificato sul tambuccio della sierra, di Lassen e corrente il sistemath di supercomputing più veloce 10 nel mondo, secondo la lista Top500. Stanno preparando eseguire la fase prossima sul supercomputer più potente del mondo, la sommità di Oak Ridge, alla fine di quest'anno, refactoring il codice ed aggiungente i vari miglioramenti.