Attenzione: questa pagina è una traduzione automatica di questa pagina originariamente in lingua inglese. Si prega di notare in quanto le traduzioni sono generate da macchine, non tutte le traduzioni saranno perfetti. Questo sito web e le sue pagine web sono destinati ad essere letto in inglese. Ogni traduzione del sito e le sue pagine web possono essere imprecise e inesatte, in tutto o in parte. Questa traduzione è fornita per comodità.

Gli algoritmi di apprendimento automatico accelerano il trattamento di assistenza tecnica della proteina

Le proteine sono i commputer molecolari di tutte le celle viventi e sono state sfruttate per uso in molte applicazioni, compreso i catalizzatori di industriale e di terapeutica. Per sormontare le limitazioni delle proteine naturali, l'assistenza tecnica della proteina è usata per migliorare le caratteristiche della proteina quali la stabilità e la funzionalità. In un nuovo studio, i ricercatori dimostrano un algoritmo di apprendimento automatico che accelera il trattamento di assistenza tecnica della proteina. Lo studio è riferito nelle comunicazioni della natura del giornale.

Gli algoritmi di apprendimento automatico assistono nell'assistenza tecnica della proteina diminuendo il carico sperimentale dei metodi quale evoluzione diretta, che comprende i giri multipli della selezione di alto-capacità di lavorazione e di mutagenesi. Funzionano simulando e predicendo la forma fisica di tutte le sequenze possibili della proteina bersaglio dopo la formazione sui database di sequenza della proteina.

Sebbene molti algoritmi di apprendimento automatico esistano, pochi di loro compresi la cronologia evolutiva della proteina bersaglio. Ciò è dove l'ECNET (rete neurale contesto-integrata evolutiva), un algoritmo d'apprendimento, entra.

“Con l'ECNET, possiamo esaminare la proteina bersaglio e tutti gli sui omologhi per vedere quali residui coppia insieme e sono quindi importanti per quella proteina particolare,„ ha detto professore di Steven L. Miller Chair di Huimin d'organizzazione chimico e biomolecolare Zhao (BSD leader/CABBI/CGD/GSE/MMG), anche Direttore (NSF) all'dell'istituto fondato a National Science Foundation del laboratorio del creatore della molecola. “Poi riuniamo quelle informazioni ed usiamo la struttura d'apprendimento profonda per capire che genere di mutazioni è importante per la funzione della proteina bersaglio.„

In uno studio del benchmark, i ricercatori hanno mostrato l'ECNET che supera i metodi correnti su parecchi gruppi di dati profondi di mutagenesi. Come seguito, l'ECNET è stata usata per costruire il β-lactamase TEM-1 -; un enzima che conferisce la resistenza agli antibiotici del β-lattame -; ed identifichi le varianti che avevano migliorato la forma fisica e quindi, erano più resistente ad ampicillina.

Ancora, l'ECNET ha dato la priorità ai mutanti più di ordine alto e novelli nell'analisi. Avendo uno strumento di calcolo che può predire con successo che le interazioni più di ordine alto possono diminuire gli sforzi sperimentali, ha detto Zhao.

Stiamo combinando tutte le proteine nel database con la cronologia evolutiva specifica della proteina bersaglio per migliorare il risparmio di temi di previsione. Possiamo poi usare i mutanti che generiamo dai nostri esperimenti più ulteriormente per migliorare e preparare il modello. Questo algoritmo è ancora un lavoro in corso, ma è un miglioramento globale su che cosa già è conosciuto nella letteratura.„

Huimin Zhao

Zhao ha detto che i ricercatori corrente stanno usando l'ECNET per sviluppare i catalizzatori degli enzimi con le selettività migliori.

Questo studio era uno sforzo comune con professore dell'informatica Jian Peng (CABBI). Altri autori dello studio includono Yunan Luo, Guangde Jiang, Tianhao Yu, Yang Liu, il Vo di fuga, Hantian Ding, Yufeng Unione Sovietica e Wesley Wei Qian.

Questo lavoro è stato supportato dal Dipartimento per l'energia di Stati Uniti ed il NSF.

Source:
Journal reference:

Luo, Y., et al. (2021) ECNet is an evolutionary context-integrated deep learning framework for protein engineering. Nature Communications. doi.org/10.1038/s41467-021-25976-8.