Aviso: Esta página é uma tradução automática da página original em inglês. Por favor note uma vez que as traduções são geradas por máquinas, não tradução tudo será perfeita. Este site e suas páginas da Web destinam-se a ler em inglês. Qualquer tradução deste site e suas páginas da Web pode ser imprecisas e imprecisos no todo ou em parte. Esta tradução é fornecida como uma conveniência.

Explorando o relacionamento entre a espectrometria em massa e a informática

Thought LeadersJohn R. Yates, III & Robin ParkThe Scripps Research Institute

A espectrometria em massa teve sempre uma sinergia poderosa com computadores. Os computadores empurraram a espectrometria em massa para a frente nas articulação chaves em sua história do levantamento de dados para prover a operação à análise de dados. Proteomics foi permitido pela espectrometria em massa em tandem e pela informática de atribuir ràpida seqüências de ácido aminado aos espectros.

Enquanto a instrumentação se tornou mais poderosa as capacidades informatic vieram mantêm o ritmo com aumentos na produção dos dados e nos tipos de dados. Os trabalhos sofisticados são usados para processar as experiências proteomic que abrangem a busca, a quantificação, e o processamento estatístico dos dados. Enquanto novo as características estão adicionadas aos espectrómetros em massa como a mobilidade do íon isto fornece a capacidade adicional recolhendo dados e informação para interpretar peptides e características do peptide. IP2 é uma plataforma proteomic que crie uns trabalhos que combinam a busca posta GPU, a quantificação flexível, e a análise estatística dos dados.

Diga-nos por favor sobre o relacionamento em desenvolvimento entre a espectrometria em massa e os computadores?

A espectrometria em massa e os computadores tiveram um relacionamento interessante ao longo dos anos. Há um conceito conhecido como possível adjacente do `' (introduzido por Stuart Kauffman em 2002) que indica que a evolução e a inovação tendem a acontecer incremental, dentro do reino das possibilidades disponíveis em qualquer momento.

Esta ideia foi extremamente relevante à espectrometria em massa. Se você olha a história da espectrometria em massa, muitas primeiras obras ocorreram nas instituições académicos onde os computadores eram desenvolvidos igualmente.

Isto conduziu às colaborações onde os computadores foram usados em vários projectos tais como cálculos em massa complexos e exactos para fórmulas moleculars. Eventualmente, a tecnologia tornou-se que permitiu computadores de começar gravar a massa para trás um pouco do que usando a placa fotográfica tradicional. A tempo, os algoritmos do computador podiam começar processar dados mais eficientemente, assim que você poderia obter muito mais fora dela.

Como importante tecnologia crowdsourcing e actual estiveram na revelação da espectrometria em massa?

Incredibly importante. Em torno do mesmo tempo porque os avanços na computação mencionada mais cedo, povos realizaram que não devem precisar de interpretar mais de uma vez espectros em massa.

Isto conduziu à ideia de criar bibliotecas dos espectros que têm sido já interpretados e de partilhas estes, e esta prática abriu realmente o conceito da pesquisa da biblioteca. Este é um exemplo adiantado de crowdsourcing dentro da comunidade científica.

Naquele tempo, os computadores não tiveram grandes quantidades de espaço ou de memória de armazenamento. Os algoritmos tiveram que ser muito inteligentes reduzir a quantidade de informação e de tecnologia que foi exigida para fazer a busca da biblioteca. Por aquisição de dados controlado por computador levou à aquisição dados-dependente, e então eventualmente à aquisição sem dados, permitindo a análise em grande escala dos peptides.

Era agora possível tratar um espectro em massa em tandem dos peptides e dos códigos de barras da seqüência de ácido aminado, usando isto para fazer a varredura através de uma base de dados e para identificar a seqüência de ácido aminado que é representada.

Esta aproximação permitiu a produção alta e as experiências em grande escala que poderiam acomodar sistemas biológicos altamente complexos, dos complexos da proteína e os organelles às pilhas e aos tecidos. Contudo, isto gerou mais dados e mais análises, que exigiram uma organização mais adicional.

Como as revelações na informática impactaram o potencial da espectrometria em massa?

As revelações na espectrometria em massa colocaram muito esforço em nossa capacidade para recolher, analisar, organizar, e interpretar dados. Isto é o lugar onde a informática se tornou importante, com ferramentas e scripts de software que variam da extracção de dados, dos motores da busca, e da análise quantitativa completamente às ferramentas da validação, à confiança que marcam ferramentas, e aos repositórios de dados que se tornam comuns - os últimos que usam regularmente Microsoft Excel como um suporte de memória, embora nós nos temos movido longe deste porque não é ideal.

É importante que os dados podem ser usados dentro do laboratório, tão aqui em Bruker, nós têm desenvolvido ferramentas de análise de estrutura da proteína e de análise do enriquecimento do gene com isso em mente.

Pode você dar a nossos leitores uma vista geral da plataforma IP2?

Há alguns anos atrás, nós fizemos uma comparação entre as ferramentas da extracção de dados disponíveis, e nós encontramos muita variabilidade em termos de suas capacidades. Esta é uma das etapas as mais importantes do processo, mas a edição com ter tão muitas ferramentas de software disponíveis é que a compatibilidade pode ser difícil de conseguir através de uns trabalhos inteiros.

Nós lançamos uma empresa chamada as aplicações integradas de Proteomics, desenvolvendo um andaime dos trabalhos chamado o encanamento integrado de Proteomics (IP2). A ideia atrás deste andaime é que nós podemos as ferramentas de encaixe que nós desenvolvemos na academia (que eram livremente disponíveis e open source) neste encanamento do IP, assim criando uns trabalhos aerodinâmicos com as ferramentas de análise integradas dos dados.

O IP2 é um programa médio da camada, que controlem análises, controle espectral da qualidade, camadas do back-end, relações se nublar e aglomerar a computação, armazenamento de dados, e o apoio.

Os usuários podem alcançar seus dados ou ver o estado dos processos usando um computador de secretária, um telefone, ou uma tabuleta. O IP2 é igualmente customizável através do jogo do revelador IP2, significar usuários pode adaptar a plataforma ao trabalho com outros software e aplicações.

O IP2 pode trabalhar com análise de dados paralela em grande escala do proteomics, e nós pudemos integrar nossa plataforma com a nuvem que computa através dos serviços de Web das Amazonas, nuvem de Google, e Microsoft nubla-se ferramentas. Nós igualmente estamos aproveitando-nos de GPUs, dentro de nosso sistema de laboratório e nuvem-baseado, para aumentar a velocidade e a eficiência da plataforma.

Como o uso do processamento de GPU afecta o desempenho do IP2?

O IP2 permite o uso de um Search Engine de GPU, e esta utilização de núcleos de GPU um pouco do que núcleos do processador central fá-lo extremamente rápido. Um cartão de GPU terá milhares de núcleos de GPU, e você pode adicionar ainda mais cartões de GPU para melhorar a velocidade. O núcleo de GPU permite a base de dados que procuraram em taxas incredibly rápidas, e a base de dados que procurara escalas com potência informática.

Nós temos olhado de utilização buscas duplas para melhorar a qualidade dos dados, incorporando esta característica no IP2. Aqui, você passa os dados de DDA que você procurarou completamente a uma base de dados da seqüência e usa então estes dados para construir uma biblioteca. Você pode então procurarar seus dados de DDA uma segunda vez usando essa biblioteca. Esta aproximação pode melhorar a reprodutibilidade dos dados dramàtica, e o uso de núcleos de GPU dá-nos a potência de processamento conseguir este.

Pode você igualmente dizer nossos leitores sobre a plataforma do timsTOF e como isto integra com o IP2?

O timsTOF de Bruker é uma ferramenta projetada medir a mobilidade do íon. Esta é uma extensão poderosa à espectrometria em massa que nos dá a informação sobre a estrutura tridimensional de um íon, ajudando nos à capacidade máxima do aumento e à confiança total na caracterização composta.

Nós temos aperfeiçoado nossos plataformas, ferramentas, e Search Engine para o timsTOF, especificamente em torno de como nós extraímos dados das limas cruas dos timsTOF, que são grandes e contêm muita informação.

O resultado deste trabalho foi um programa robusto da extracção: o timsTOFExtractor, o Search Engine de ProLuCID (que usa a tecnologia que de processamento de GPU nós falamos aproximadamente mais cedo), o pedido quantitativo de análise de dados do recenseamento, e PaSER (Search Engine da base de dados paralela no tempo real) para o timsTOF.

Que são os desafios em ferramentas se tornando do Search Engine para a análise de dados do metaproteomics e do microbiome?

Trabalhar com dados do microbiome é extremamente desafiante devido a sua grande base de dados da seqüência. Esta é actualmente ao redor 70 gigas byte em tamanho e continuando a crescer. A base de dados de deslocamento predeterminado para estes dados está sobre um Terabyte em tamanho, significando que é difícil procurarar isto que usa estratégias de busca tradicionais.

Para endereçar isto, nós trabalhamos com Dennis Wallen do instituto de investigação de Scripps para desenvolver o Search Engine de ProLuCID-ComPIL.

Os pre-tipos de ProLuCID-ComPIL e pre-analisam os dados usando NoSQL para melhorar o tempo de busca. Estes algoritmos e processos podem igualmente ser usados com PTMs e variações da seqüência, com o estes que estão sendo transferidos em uma base de dados de deslocamento predeterminado, que seja procurarada então na alta velocidade usando o GPU.

Nós igualmente pudemos girar nossa atenção aos agradecimentos do metabolomics a nosso trabalho com o Yu Gao em UCSD e em sua ferramenta de alinhamento espectral Dilu.

Pode você dizer-nos mais sobre o sistema de PaSER?

Nosso sistema de PaSER é um Search Engine da base de dados paralela que possa trabalhar no tempo real. Muitas aplicações fazem a varredura de extremamente rápido, gerando um grande número espectros, assim que uma das vantagens chaves da pesquisa no tempo real é que não há nenhuma necessidade para a etapa da extracção de dados - você apenas toma os dados directamente do espectrómetro em massa, e da busca imediatamente. Não há nenhuma necessidade de transferir ficheiros pela rede os dados.

O sistema de PaSER é rapidamente bastante que pode acomodar diversos instrumentos imediatamente, mas nosso objetivo com a plataforma de PaSER não é apenas busca do tempo real. Nós queremos continuar a endereçar muitos desafios actuais em entregar a funcionalidade eficaz da busca do tempo real.

A velocidade do Search Engine é crítica se é manter o ritmo com a velocidade de exploração rápida dos instrumentos que alimentam nela.

Como a plataforma IP2, o PaSER usa núcleos de GPU em vez dos núcleos do processador central, assegurando melhorias consideráveis da velocidade sobre a tecnologia tradicional da busca. Isto significa que é possível enviar dados de um instrumento a uma caixa de IP2-GPU no tempo real e o resultado da pesquisa na base de dados estará disponível imediatamente depois que a experiência é feita.

Como você avaliou aumentos da velocidade de PaSER sobre buscas autónomas tradicionais?

A fim avaliar o PaSER, nós executamos algumas amostras no timsTOF pro - a saber HeLa em 200 nanograms. Nós executamos seis replicates técnicos. O estreio era uma busca do tempo real, seguida por nenhuma busca do tempo real. Isto foi repetido na corrida três e quatro, antes de fazer dois mais tempo real procuraram nas corridas cinco e seis.

Os objetivos desta experiência eram identificar todas as retardações na velocidade de exploração e verificar mesmo se o número de identificações bem sucedidas estivesse impactado em cima pelo uso da busca do tempo real.

A experiência encontrou que o uso da busca do tempo real não afectou o tempo da exploração. Nós igualmente encontramos aquele macacão, o uso da busca do tempo real retornamos o mesmo número de resultados identificados que uma busca autónoma padrão.

Nós igualmente avaliamos o tempo de busca autónomo. Às vezes, depois de uma busca do tempo real, os usuários podem querer procurarar outra vez com parâmetros diferentes ou em bases de dados diferentes. Nesta encenação, não há ainda nenhuma necessidade de converter os dados brutos porque a busca inicial do tempo real tem armazenado espectros e os tem transferido já à base de dados. Em nosso exemplo, tomou somente três minutos para cada busca usando o Search Engine de IP2-GPU.

Como a ferramenta esperta da selecção do precursor melhora o processo da busca?

A ferramenta esperta da selecção do precursor de PaSER permite que PaSER comunique-se com os instrumentos bidirecional. Isto abre muitas possibilidades criativas, segundo o objetivo de seu projecto.

Por exemplo, nós podemos usar esta ferramenta para executar lista da exclusão. Esta ideia estêve ao redor por muito tempo, mas não é muito popular porque não é muito fácil executar. Historicamente, os usuários tiveram que manualmente recolher IDs do peptide dos resultados da busca, entraram então a lista da exclusão manualmente. Enquanto as ideias se tornaram, este processo teve que ser repetido que, naturalmente, não é ideal.

PaSER permite que nós construam a lista da exclusão automaticamente, certo da primeira experiência. PaSER passará então esta lista da exclusão à segunda experiência, e assim por diante, refinando a lista da exclusão com cada iteração. Esta aproximação permite que nossas buscas e experiências rendam uns resultados mais exactos ao longo do tempo.

Um outro exemplo é a gestão dinâmica da tracção em massa devido às mudanças de temperatura ou às edições da calibração. Usando a busca do tempo real de PaSER, nós podemos medir a massa do delta entre íons teóricos e experimentais do precursor do peptide. Nós podemos então enviar a massa do delta de volta ao instrumento e o instrumento pode calibrar a tracção em massa dinâmicamente e no tempo real. Isto significa que se nós terminamos dez corridas ou cem corridas, a calibração em massa é sempre atualizado.

Quando nós estamos trabalhando com análise quantitativa de MS1-based com rotulagem, nós somos presentado com frequentemente a luz e íons pesados para o mesmo peptide. Para a análise quantitativa, nós não precisamos de usar ambos os íons do precursor - um é bastante para determinar a amostra porque nós já conhecemos a diferença em massa entre íons claros e pesados.

Durante a busca do tempo real, nós podemos verificar se nós estamos trabalhando com um peptide pesado ou claro, a seguir nós podemos dinâmicamente excluir os outro dos pares, assim que nós não temos que gerar espectros redundantes.

Nós podemos igualmente usar esta ferramenta para trabalhar com técnicas de rotulagem local-específicas tais como AHA que etiquetam ou rotulagem da etiqueta de TEV. Por exemplo, a rotulagem de AHA pode etiquetar a metionina, quando a colocação de etiquetas de TEV puder etiquetar o cysteine. De acordo com a base de dados de UniProt, aproximadamente 65% dos peptides não contêm o cysteine ou a metionina. Com estes dados, nós podemos excluir muitos peptides no tempo real, fazendo a varredura selectivamente destes como apropriados.

Como PaSER acomoda espectros de PASEF e a quantificação dinâmicos do tempo real?

PaSER pode usar PASEF, ou paralelize a fragmentação de série da acumulação como parte de sua operação. Em cada ciclo de PASEF, nós combinamos quadros para construir uma varredura de PASEF, mas segundo a abundância de íons, um ciclo de PASEF não pode ter bastante íons para produzir um resultado.

Aqui, a busca do tempo real pode verificar a contagem da busca e avaliar os espectros. Se esta verificação revela que a varredura passiva exige mais sinal, mais quadros podem ser adicionados para impulsionar este.

Nós precisamos de conhecer o ponto do vértice para poder provocar eficazmente espectros em tandem, e nós podemos fazer este durante a busca do tempo real avaliando um cromatograma e provocando somente precursores uma vez que o ponto máximo do vértice foi determinado. Nós podemos igualmente dinâmicamente remover o íon do tempo apropriado da lista da exclusão no máximo.

Última, nós igualmente estamos trabalhando em capacidades da quantidade do tempo real com o timTOF. Em vez de uma área máxima típica do XYZ, nós podemos calcular o volume de um peptide usando a mobilidade do íon.

É igualmente possível separar peptides co-iludindo com a identificação do peptide de dentro da busca do tempo real, significando que nós podemos executar a análise quantitativa paralelamente. Se nós estamos trabalhando com experiências múltiplas, nós podemos igualmente construir uma harmonia entre corridas enquanto nós nos movemos com a experiência.

Estes são tudo bons exemplos do uso criativo de capacidades bidireccionais de uma comunicação de PaSER.

Finalmente, onde as outras plataformas de IP2 e de Bruker sentam-se dentro da indústria mais larga dos dados e de conhecimento?

Nós temos agora uma vasta gama de ferramentas que permitem que nós cataloguem e identifiquem dados da espectrometria em massa. O objetivo total, naturalmente, é identificar as coisas que conduzem às descobertas biológicas.

Com isto em mente, nossa relação de aplicações às ferramentas de análise dos dados gosta de Reactome, muitos de que pode livremente ser alcançado através do Internet. Há as ferramentas disponíveis que podem explorar a saída da ontologia do gene, por exemplo escolhendo as vinte categorias as mais significativas superiores, ao manter a informação em todas as categorias na lima crua gerada de modo que possa ser examinada mais sem ter que re-o analisar.

Mathieu Lavallée-Adam e sua equipe desenvolveu uma ferramenta da em-casa para nós chamou PSEA-Quantidade, que é projectada para análise ajustada do enriquecimento da proteína. Esta ferramenta foi baseada em outro desenvolvida para análise ajustada do enriquecimento do gene, mas estes foram aperfeiçoados para dados etiqueta-livres e etiqueta-baseados da quantificação da proteína.

Total, compatibilidade entre plataformas e ferramentas é um foco principal de nosso trabalho.

Citations

Please use one of the following formats to cite this article in your essay, paper or report:

  • APA

    Bruker Daltonics. (2020, September 09). Explorando o relacionamento entre a espectrometria em massa e a informática. News-Medical. Retrieved on October 24, 2020 from https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx.

  • MLA

    Bruker Daltonics. "Explorando o relacionamento entre a espectrometria em massa e a informática". News-Medical. 24 October 2020. <https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx>.

  • Chicago

    Bruker Daltonics. "Explorando o relacionamento entre a espectrometria em massa e a informática". News-Medical. https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx. (accessed October 24, 2020).

  • Harvard

    Bruker Daltonics. 2020. Explorando o relacionamento entre a espectrometria em massa e a informática. News-Medical, viewed 24 October 2020, https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx.