Les scientifiques se démêlent comment le réseau neuronal intelligent prévoit les fonctionnements des protéines

Les accouplements virtuels intelligents aiment Alexa, Siri, et l'assistant de Google sont longtemps devenus intégré dans nos vies quotidiennes. Et les programmes de calcul intelligents, soi-disant algorithmes, ont également évolué comme outil intégral dans la recherche scientifique.

Les montants considérables de caractéristiques produites dans la recherche en matière des sciences de la vie peuvent être efficacement examinés pour les configurations périodiques à l'aide des algorithmes. Certains programmes peuvent repérer les structures périodiques en grandes molécules de protéine et puis employer cette information pour tirer des conclusions au sujet de quelles tâches cellulaires ces molécules effectuent - par exemple, si elles fonctionnent comme contacts de gène, moteurs moléculaires, ou molécules de signalisation. Les prévisions effectuées par de tels algorithmes sur la base des séquences protéiques - qui se composent d'une suite de synthons de protéine câblés ensemble comme un collier de perle - sont maintenant incroyablement précises.

Cependant, un désavantage important des techniques précédentes est que des usagers sont maintenus complet dans l'obscurité pour pourquoi l'algorithme affecte un fonctionnement particulier à certaines séquences protéiques. La connaissance précise de l'ordinateur au sujet des protéines n'est pas directement procurable, malgré le fait que une telle connaissance pourrait prouver inestimable en avançant la recherche et développement des agents neufs.

Une équipe de stagiaire, commun aboutie par Roland Eils et Irina Lehmann à partir de l'institut de Berlin de la santé (BIH) et le Charité - l'Universitätsmedizin Berlin, en collaboration avec Dominik Niopek de l'institut de la pharmacie et de la biotechnologie moléculaire (IPMB) à l'université d'Heidelberg, jeu lui-même l'objectif de débloquer cette connaissance à partir de l'ordinateur. Il a commencé à travailler à ce sujet en 2017, et a développé un algorithme « DeeProtein appelé, » un réseau neuronal complet et intelligent qui peut prévoir les fonctionnements des protéines basées sur la séquence de différents synthons de protéine, les acides aminés. Comme la plupart des algorithmes apprenants, DeeProtein est « une boîte noire, » qui signifie comment elles fonctionnent reste un mystère aux programmeurs ainsi qu'aux usagers. Mais les stagiaires ont maintenant employé un « tour » pour se démêler le secret de ce réseau.

Les jeunes scientifiques commencés en développant une voie d'examiner figuratif au-dessus de l'épaulement du programme comme il effectue son travail.

Dans l'analyse de sensibilité nous successivement masquons chaque position dans la séquence protéique et laissons DeeProtein prévoir, ou prévoir plutôt, le fonctionnement de la protéine de ces informations incomplètes. »  

Zu Belzen de Jules Upmeier

Il est un stagiaire dans le programme du maître en biotechnologie moléculaire à l'IPMB et l'auteur important du papier, qui était simplement publié dans l'intelligence informatique de nature de tourillon.

Ensuite nous fournissons à DeeProtein l'information complète de séquence et comparons les deux ensembles de prévisions. De cette façon nous prévoyons, pour chaque position dans la séquence protéique, combien important cette position est pour prévoir le fonctionnement correct. Ceci signifie que nous donnons chaque position ou acide aminé dans le réseau de protéine une valeur de sensibilité pour le fonctionnement de protéine. »

Zu Belzen de Jules Upmeier

Les scientifiques emploient alors la technique analytique neuve pour recenser les régions des protéines qui sont indispensables à leur fonctionnement. Cette technique fonctionne pour la signalisation des protéines qui jouent un rôle pendant la carcinogenèse aussi bien pour l'outil de la gène-retouche CRISPR-Cas9, qui a été déjà vérifié dans un grand nombre de préclinique et d'études cliniques. « L'analyse de sensibilité nous permet de recenser les régions de protéine qui tolèrent des modifications bien ou pas aussi bien, » dit Dominik Niopek. « C'est une première étape importante si nous voulons apporter les modifications visées aux protéines, afin de les équiper des fonctionnements neufs ou « couper » les propriétés indésirables. »

Avec ce travail nous montrons qui non seulement peuvent les prévisions des réseaux neuronaux être utiles, mais qui nous pouvons également maintenant pour la première fois employer cette connaissance implicite pour les extrémités pratiques.

Roland Eils

Cette approche est appropriée pour beaucoup d'éditions en biologie moléculaire et médicament.

Si, par exemple, nous voulons développer les médicaments visés ou les thérapies géniques, nous doivent savoir exact où s'orienter notre attention, DeeProtein peut maintenant nous aider à faire cela. »

Roland Eils

Source :

Für berlinois Gesundheitsforschung d'Institut/institut de Berlin de la santé

Référence de tourillon :

Eils, R. et autres (2019) accroissant la connaissance implicite dans les réseaux neuronaux pour la dissection et concevoir fonctionnels des protéines. Intelligence informatique de nature. doi.org/10.1038/s42256-019-0049-9.