Avertissement : Cette page est une traduction automatique de cette page à l'origine en anglais. Veuillez noter puisque les traductions sont générées par des machines, pas tous les traduction sera parfaite. Ce site Web et ses pages Web sont destinés à être lus en anglais. Toute traduction de ce site et de ses pages Web peut être imprécis et inexacte, en tout ou en partie. Cette traduction est fournie dans une pratique.

Explorer la relation entre la spectrométrie de masse et l'informatique

Thought LeadersJohn R. Yates, III & Robin ParkThe Scripps Research Institute

La spectrométrie de masse a toujours eu une synergie puissante avec des ordinateurs. Les ordinateurs ont poussé la spectrométrie de masse en avant aux jointures principales dans son histoire de collecte des informations pour équiper le fonctionnement à l'analyse de caractéristiques. La protéomique a été activée par spectrométrie de masse tandem et informatique affecter rapidement des séquences des acides aminés aux spectres.

Pendant que l'instrumentation est devenue plus puissante les capacités informatiques ont devenu suivent des augmentations de production de caractéristiques et de types de caractéristiques. Des flux de travail sophistiqués sont employés pour traiter les expériences proteomic qui entourent la recherche, la quantitation, et le traitement statistique des caractéristiques. Pendant que neuf des caractéristiques sont ajoutées aux spectromètres de masse comme la mobilité d'ion ceci fournit la capacité complémentaire pour collecter des caractéristiques et des informations pour interpréter des peptides et des caractéristiques de peptide. IP2 est une plate-forme proteomic qui produit un flux de travail combinant la recherche actionnée par GPU, la quantitation flexible, et l'analyse statistique des caractéristiques.

Dites-s'il vous plaît nous au sujet de la relation en évolution entre la spectrométrie de masse et les ordinateurs ?

La spectrométrie de masse et les ordinateurs ont eu une relation intéressante au cours des années. Il y a un concept connu sous le nom de possible adjacent de `' (introduit par Stuart Kauffman en 2002) qui déclare que l'évolution et l'innovation tendent à se produire incrémentiel, dans le royaume des possibilités procurables à tout moment.

Cette idée a été extrêmement appropriée à la spectrométrie de masse. Si vous regardez l'histoire de la spectrométrie de masse, les beaucoup de les premiers travaux ont eu lieu aux institutions académiques où des ordinateurs également étaient développés.

Ceci a mené aux collaborations où des ordinateurs ont été utilisés dans projets variés tels que des calculs de masse complexes et précis pour des formules moléculaires. Éventuellement, la technologie s'est développée qui a permis à des ordinateurs de commencer à enregistrer la masse en arrière plutôt qu'utilisant la plaque photographique traditionnelle. À temps, les algorithmes d'ordinateur pouvaient commencer à traiter des caractéristiques plus efficacement, ainsi vous pourriez obtenir beaucoup plus hors de elle.

Combien important crowdsourcing et technologie actuelle ont-ils été dans le développement de la spectrométrie de masse ?

Incroyablement important. Vers la même époque car les avances en calculant cité précédemment, les gens se sont rendues compte qu'elles ne devraient pas devoir interpréter les spectres de masse plus d'une fois.

Ceci a mené à l'idée de produire des bibliothèques des spectres qui ont déjà été interprétés et partageants ces derniers, et cette pratique a ouvert réellement le concept de la recherche de bibliothèque. C'est un exemple tôt de crowdsourcing au sein de la communauté scientifique.

À ce moment-là, les ordinateurs n'ont pas eu un grand nombre d'espace de stockage ou de mémoire. Les algorithmes ont dû être très intelligents pour réduire la quantité d'informations et la technologie qui a été exigée pour faire la recherche de bibliothèque. L'acquisition de données commandée par ordinateur a mené à l'acquisition caractéristique-dépendante, et puis éventuellement à l'acquisition sans données, tenant compte de l'analyse de grande puissance des peptides.

Il était maintenant possible de traiter un éventail de masse tandem des peptides et des codes barre de séquence des acides aminés, utilisant ceci pour balayer par une base de données et pour recenser la séquence des acides aminés qui est représentée.

Cette approche a activé le débit élevé et les expériences de grande puissance qui pourraient faciliter les systèmes biologiques hautement complexes, des composés de protéine et les organelles aux cellules et aux tissus. Cependant, ceci a produit de plus de caractéristiques et de plus d'analyses, qui ont exigé davantage d'organisme.

Comment les développements en informatique ont-ils influencé le potentiel de la spectrométrie de masse ?

Les développements en spectrométrie de masse ont mis beaucoup de tension sur notre capacité de rassembler, analyser, dispenser, et interpréter des caractéristiques. C'est où l'informatique est devenue importante, avec des outils logiciels et scripts cette gamme d'extraction de caractéristiques, de moteurs de recherche, et d'analyse quantitative aux outils de validation, aux outils de rayure de confiance, et aux gisements de données devenant courants - ce dernier régulièrement utilisant Microsoft Excel comme support de stockage, bien que nous nous soyons éloignés de ceci car il n'est pas idéal.

Il est important que des caractéristiques puissent être employées dans le laboratoire, tellement ici chez Bruker, nous aient développé des outils d'analyse de structure des protéines et d'analyse d'enrichissement de gène dans cet esprit.

Pouvez-vous donner à nos lecteurs une synthèse de la plate-forme IP2 ?

Il y a quelques années, nous avons fait une comparaison parmi les outils d'extraction de caractéristiques procurables, et nous avons trouvé beaucoup de variabilité en termes de leurs capacités. C'est l'une des la plupart des étapes importantes du procédé, mais l'édition avec avoir tant d'outils logiciels procurables est qu'il peut être difficile réaliser compatibilité en travers d'un flux de travail entier.

Nous avons lancé des applications intégrées appelées d'une protéomique de compagnie, développant un échafaudage de flux de travail appelé le pipeline intégré de protéomique (IP2). L'idée derrière cet échafaudage est que nous pouvons les outils embrochables que nous avons développés dans le milieu universitaire (qui étaient librement procurables et open-source) en ce pipeline d'IP, de ce fait produisant un flux de travail profilé avec les outils d'analyse intégrés de caractéristiques.

L'IP2 est un programme moyen de couche, qui parvient des analyses, contrôle qualité spectral, couches de partie terminale, tiges pour opacifier et pour grouper calculer, stockage de données, et le recul.

Les usagers peuvent atteindre leurs caractéristiques ou voir le statut de procédés utilisant un ordinateur de bureau, un téléphone, ou une tablette. L'IP2 est également personnalisable par l'intermédiaire du nécessaire du révélateur IP2, la signification des usagers peut adapter la plate-forme au travail avec d'autres logiciel et applications.

L'IP2 peut fonctionner avec l'analyse de caractéristiques parallèle de grande puissance de protéomique, et nous avons pu intégrer notre plate-forme avec le nuage calculant par l'intermédiaire des services Web d'Amazone, le nuage de Google, et les outils de nuage de Microsoft. Nous tirons profit également de GPUs, dans notre système de laboratoire et basé sur nuage, pour augmenter la vitesse et le rendement de la plate-forme.

Comment l'utilisation du traitement de GPU affecte-t-elle le rendement de l'IP2 ?

L'IP2 permet l'utilisation d'un moteur de recherche de GPU, et cette utilisation des faisceaux de GPU plutôt que des cores du CPU le rend extrêmement rapide. Une carte de GPU aura des milliers de faisceaux de GPU, et vous pouvez ajouter bien plus de cartes de GPU pour améliorer la vitesse. Le faisceau de GPU permet la base de données recherchant incroyablement aux débits rapides, et la base de données recherchant des écailles avec calculer le pouvoir.

Nous avions regardé employants de doubles recherches pour améliorer la qualité des données, comportant cette caractéristique à l'IP2. Ici, vous passez les caractéristiques de DDA que vous avez recherchées à une base de données de séquence et puis employez cette caractéristique pour établir une bibliothèque. Vous pouvez alors rechercher vos caractéristiques de DDA une deuxième fois utilisant cette bibliothèque. Cette approche peut améliorer la reproductibilité de caractéristiques spectaculairement, et l'utilisation des faisceaux de GPU nous donne la puissance de traitement de réaliser ceci.

Est-ce que pouvez-vous vous également dire nos lecteurs au sujet de la plate-forme de timsTOF et comment ceci intègre avec l'IP2 ?

Le timsTOF de Bruker est un outil conçu pour mesurer la mobilité d'ion. C'est une prolonge puissante à la spectrométrie de masse qui nous fournit des informations sur la structure en trois dimensions d'un ion, nous aidant à la capacité maximale d'augmentation et à la confiance générale dans la caractérisation composée.

Nous avions optimisé nos plates-formes, outils, et moteur de recherche pour le timsTOF, particulièrement autour de la façon dont nous extrayons des caractéristiques à partir des fichiers bruts des timsTOF, qui sont grands et contiennent beaucoup d'information.

Le résultat de ce travail a été un programme robuste d'extraction : le timsTOFExtractor, le moteur de recherche de ProLuCID (qui emploie la technologie de la transformation de GPU que nous avons parlée plus tôt), la demande quantitative d'analyse de caractéristiques de dénombrement, et PaSER (moteur de recherche de base de données parallèle en temps réel) de timsTOF.

Quels sont les défis dans des outils se développants de moteur de recherche pour l'analyse de caractéristiques de metaproteomics et de microbiome ?

Fonctionner avec des caractéristiques de microbiome est extrêmement provocant à cause de sa grande base de données de séquence. C'est actuel environ 70 gigas dans la taille et continuant à se développer. La base de données d'index pour cette caractéristique est au-dessus d'un Terabyte dans la taille, signifiant qu'il est difficile de rechercher ceci utilisant des stratégies de recherche traditionnelles.

Pour adresser ceci, nous avons travaillé avec Dennis Wallen d'institut de recherches de Scripps pour développer le moteur de recherche de ProLuCID-ComPIL.

Les prétriages de ProLuCID-ComPIL et pré-analyse les caractéristiques utilisant NoSQL pour améliorer le temps de recherche. Ces algorithmes et procédés peuvent également être employés avec PTMs et variantes de séquence, avec ces derniers qui sont transférés dans une base de données d'index, qui est alors recherchée à la grande vitesse utilisant le GPU.

Nous avons également pu tourner notre attention à grâce de metabolomics à notre travail avec Yu Gao à UCSD et à son outil d'alignement spectral Dilu.

Pouvez-vous nous dire davantage au sujet du système de PaSER ?

Notre système de PaSER est un moteur de recherche de base de données parallèle qui peut fonctionner en temps réel. Beaucoup d'applications balayent extrêmement rapide, produisant d'un grand nombre de spectres, ainsi un des avantages clé de la recherche en temps réel est qu'il n'y a aucun besoin d'opération d'extraction de caractéristiques - vous prenez juste les caractéristiques directement du spectromètre de masse, et de la recherche immédiatement. Il n'y a aucun besoin de télécharger les caractéristiques.

Le système de PaSER est assez rapidement qu'il peut faciliter plusieurs instruments immédiatement, mais notre objectif avec la plate-forme de PaSER n'est pas simplement recherche en temps réel. Nous voulons continuer à relever les nombreux défis actuels en fournissant la fonctionnalité en temps réel efficace de recherche.

La vitesse du moteur de recherche est critique si elle est de suivre la vitesse de lecture rapide des instruments introduisant dans elle.

Comme la plate-forme IP2, le PaSER emploie des faisceaux de GPU au lieu des cores du CPU, assurant des améliorations de la vitesse considérables au-dessus de technologie traditionnelle de recherche. Ceci signifie qu'il est possible d'envoyer des caractéristiques d'un instrument dans un cadre d'IP2-GPU en temps réel et le résultat de la recherche de base de données sera procurable juste après que l'expérience est faite.

Comment avez-vous évalué les gains de vitesse de PaSER au-dessus des recherches hors ligne traditionnelles ?

Afin d'évaluer le PaSER, nous avons fait fonctionner quelques échantillons sur le timsTOF pro - à savoir hela à 200 nanogrammes. Nous avons fait fonctionner six répliques techniques. Le premier passage était une recherche en temps réel, suivie d'aucune recherche en temps réel. C'était répété dans le passage trois et quatre, avant de faire deux recherches en temps réel supplémentaires dans les passages cinq et six.

Les objectifs de cette expérience étaient de recenser tous les retards dans la vitesse de lecture et de vérifier si ou non le nombre d'identifications couronnées de succès a été influencé au moment en employant la recherche en temps réel.

L'expérience a constaté que l'utilisation de la recherche en temps réel n'a pas affecté le temps de lecture. Nous avons également trouvé cela combinaison, l'utilisation de la recherche en temps réel avons renvoyé le même nombre de résultats recensés qu'une recherche hors ligne normale.

Nous avons également évalué le temps de recherche hors ligne. Parfois, après une recherche en temps réel, les usagers peuvent vouloir rechercher de nouveau avec différents paramètres ou dans différentes bases de données. Dans ce scénario, il ne reste aucun besoin de convertir les données brutes parce que la recherche en temps réel initiale a déjà enregistré des spectres et les a transférés à la base de données. Dans notre exemple, cela a seulement pris trois mn pour chaque recherche utilisant le moteur de recherche d'IP2-GPU.

Comment l'outil intelligent de choix de précurseur améliore-t-il le procédé de recherche ?

L'outil intelligent de choix du précurseur de PaSER permet à PaSER de communiquer avec des instruments bidirectionnel. Ceci ouvrent beaucoup de possibilités créatives, selon l'objectif de votre projet.

Par exemple, nous pouvons utiliser cet outil pour mettre en application des listes d'exclusion. Cette idée a été autour pendant longtemps, mais elle n'est pas très populaire parce qu'il n'est pas très facile de mettre en application. Historiquement, les usagers ont dû manuellement rassembler des IDs de peptide des résultats de la recherche, alors ont entré la liste d'exclusion manuellement. Pendant que les idées se développaient, ce procédé a dû être répété qui, naturellement, n'est pas idéal.

PaSER nous permet d'établir la liste d'exclusion automatiquement, juste de la première expérience. PaSER réussira alors cette liste d'exclusion à la deuxième expérience, et ainsi de suite, raffinant la liste d'exclusion avec chaque itération. Cette approche permet à nos recherches et expériences de donner plus de résultats exacts au fil du temps.

Un autre exemple est le management dynamique du chassoir de masse dû aux changements de température ou aux éditions d'étalonnage. Utilisant la recherche en temps réel de PaSER, nous pouvons mesurer la masse de triangle entre les ions théoriques et expérimentaux de précurseur de peptide. Nous pouvons alors envoyer la masse de triangle de nouveau à l'instrument et l'instrument peut étalonner le chassoir de masse dynamiquement et en temps réel. Ceci signifie que si nous complétons dix passages ou cents passages, l'étalonnage de masse est toujours à jour.

Quand nous travaillons avec l'analyse quantitative de MS1-based avec le marquage, nous serons souvent présentés avec la lumière et les ions lourds pour le même peptide. Pour l'analyse quantitative, nous n'avons pas besoin d'employer les deux ions de précurseur - on est assez pour mesurer l'échantillon parce que nous connaissons déjà la différence de masse entre les ions légers et lourds.

Pendant la recherche en temps réel, nous pouvons vérifier si nous travaillons avec du peptide lourd ou léger, alors nous pouvons dynamiquement exclure l'autre des paires, ainsi nous ne devons pas produire des spectres redondants.

Nous pouvons également utiliser cet outil pour travailler avec des techniques de marquage de site-détail telles qu'AHA marquant ou le marquage de balise de TEV. Par exemple, le marquage d'AHA peut marquer la méthionine, alors que l'étiquetage de TEV peut marquer la cystéine. Selon la base de données d'UniProt, approximativement 65% de peptides ne contiennent pas la cystéine ou la méthionine. Avec cette caractéristique, nous pouvons exclure beaucoup de peptides en temps réel, balayant sélecteur ces derniers comme appropriés.

Comment PaSER facilite-t-il les spectres dynamiques de PASEF et la quantification en temps réel ?

PaSER peut employer PASEF, ou mettez en parallèle la fragmentation séquentielle d'accumulation en tant qu'élément de son fonctionnement. Dans chaque cycle de PASEF, nous combinons des bâtis pour établir une échographie de PASEF, mais selon l'abondance d'ions, un cycle de PASEF peut ne pas avoir assez d'ions pour produire un résultat.

Ici, la recherche en temps réel peut vérifier la rayure de recherche et évaluer les spectres. Si cette vérification indique que l'échographie passive exige plus de signe, plus de bâtis peuvent être ajoutés pour amplifier ceci.

Nous devons connaître la remarque d'apex pour pouvoir déclencher effectivement les spectres tandem, et nous pouvons faire ceci pendant la recherche en temps réel en évaluant un chromatogramme et en déclenchant seulement des précurseurs une fois que la remarque maximale d'apex a été déterminée. Nous pouvons également dynamiquement retirer l'ion du temps approprié de liste d'exclusion tout au plus.

Pour finir, nous travaillons également aux capacités en temps réel de quantité avec le timTOF. Au lieu d'une zone de crête typique de XYZ, nous pouvons prévoir le volume d'un peptide utilisant la mobilité d'ion.

Il est également possible de séparer les peptides Co-éludants avec l'identification de peptide de la recherche en temps réel, signifiant que nous pouvons effectuer l'analyse quantitative en parallèle. Si nous travaillons avec des expériences multiples, nous pouvons également établir une correspondance entre les passages pendant que nous déménageons par l'expérience.

Ce sont tous de bons exemples de l'utilisation créative des capacités bidirectionnelles de la transmission de PaSER.

En conclusion, où les autres plates-formes d'IP2 et de Bruker se reposent-elles dans l'industrie plus large de caractéristiques et de connaissance ?

Nous avons maintenant un large éventail d'outils qui nous permettent de cataloguer et recenser des caractéristiques de spectrométrie de masse. L'objectif général, naturellement, est de recenser les choses qui mènent aux découvertes biologiques.

À cet effet, notre tige d'applications aux outils d'analyse de caractéristiques aiment Reactome, on dont peut être librement consulté par l'intermédiaire de l'Internet. Il y a des outils procurables qui peuvent explorer la sortie d'ontologie de gène, par exemple en sélectionnant les vingt catégories les plus significatives principales, tout en mettant à jour l'information sur toutes les catégories dans le fichier brut produit de sorte qu'il puisse être examiné plus plus loin sans devoir le réanalyser.

Mathieu Lavallée-Adam et son équipe a développé un outil interne pour nous PSEA-Quantité appelée, qui est conçue pour l'analyse d'enrichissement d'ensemble de protéines. Cet outil a été basé sur d'autres développés pour l'analyse réglée d'enrichissement de gène, mais ceux-ci ont été optimisés pour des caractéristiques marque marque et marque marque de quantification de protéine.

De façon générale, compatibilité entre les plates-formes et outils est un centre important de notre travail.

Citations

Please use one of the following formats to cite this article in your essay, paper or report:

  • APA

    Bruker Daltonics. (2020, September 09). Explorer la relation entre la spectrométrie de masse et l'informatique. News-Medical. Retrieved on October 24, 2020 from https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx.

  • MLA

    Bruker Daltonics. "Explorer la relation entre la spectrométrie de masse et l'informatique". News-Medical. 24 October 2020. <https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx>.

  • Chicago

    Bruker Daltonics. "Explorer la relation entre la spectrométrie de masse et l'informatique". News-Medical. https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx. (accessed October 24, 2020).

  • Harvard

    Bruker Daltonics. 2020. Explorer la relation entre la spectrométrie de masse et l'informatique. News-Medical, viewed 24 October 2020, https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx.