Attenzione: questa pagina è una traduzione automatica di questa pagina originariamente in lingua inglese. Si prega di notare in quanto le traduzioni sono generate da macchine, non tutte le traduzioni saranno perfetti. Questo sito web e le sue pagine web sono destinati ad essere letto in inglese. Ogni traduzione del sito e le sue pagine web possono essere imprecise e inesatte, in tutto o in parte. Questa traduzione è fornita per comodità.

Esplorazione della relazione fra spettrometria di massa ed informatica

Thought LeadersJohn R. Yates, III & Robin ParkThe Scripps Research Institute

La spettrometria di massa ha avuta sempre una sinergia potente con i computer. I computer hanno fatto avanzare la spettrometria di massa alle giunture chiave in sua cronologia dalla raccolta di dati per strumentare l'operazione all'analisi di dati. Proteomics è stato permesso a sia da spettrometria di massa in tandem che dall'informatica di definire rapido le sequenze aminoacidiche agli spettri.

Mentre la strumentazione è diventato più potente le capacità informatiche sono diventato stanno al passo con gli aumenti nella produzione di dati e nei tipi di dati. I flussi di lavoro specializzati sono usati per elaborare gli esperimenti proteomic che comprendono la ricerca, la quantificazione ed il trattamento statistico dei dati. Mentre nuovo le funzionalità si aggiungono agli spettrometri di massa come la mobilità dello ione questo fornisce la capacità supplementare per la raccolta i dati e delle informazioni per l'interpretazione i peptidi e delle funzionalità del peptide. IP2 è una piattaforma proteomic che crea un flusso di lavoro che combina la ricerca alimentata GPU, la quantificazione flessibile e l'analisi statistica dei dati.

Prego dicaci circa la relazione evolventesi fra spettrometria di massa ed i computer?

La spettrometria di massa ed i computer hanno avuti una relazione interessante nel corso degli anni. C'è un concetto conosciuto come possibile adiacente del `' (presentato da Stuart Kauffman nel 2002) che specifica che sia l'evoluzione che l'innovazione tendono ad accadere incrementalmente, all'interno del regno delle possibilità disponibili in qualsiasi momento.

Questa idea è stata estremamente pertinente a spettrometria di massa. Se esaminate la cronologia di spettrometria di massa, il molto primo lavoro ha avuto luogo alle istituzioni accademiche in cui i computer egualmente stavano sviluppandi.

Ciò piombo alle collaborazioni dove i computer sono stati utilizzati nei vari progetti quali i calcoli di massa complessi ed accurati per le formule molecolari. Finalmente, la tecnologia si è sviluppata che ha permesso ai computer di cominciare registrare la massa indietro piuttosto che facendo uso della lastra grossa fotografica tradizionale. A tempo, gli algoritmi del computer potevano cominciare elaborare i dati più efficientemente, in modo da potreste ottenere molto più da.

Quanto importante la tecnologia crowdsourcing e corrente sono stati nello sviluppo di spettrometria di massa?

Incredibilmente importante. Intorno allo stesso tempo come gli avanzamenti nella computazione citata più presto, la gente hanno rend contoere che non dovrebbero avere bisogno di di interpretare più di una volta gli spettri di massa.

Ciò piombo all'idea di creazione delle librerie degli spettri che già sono stati interpretati e dividenti questi e questa pratica realmente ha aperto il concetto di ricerca delle biblioteche. Ciò è un esempio iniziale di crowdsourcing all'interno della comunità scientifica.

A quel tempo, i computer non hanno avuti un gran numero di spazio di memoria o di memoria. Gli algoritmi hanno dovuto essere molto abili diminuire la quantità di informazioni e di tecnologia che è stata richiesta per fare la ricerca delle biblioteche. Dell'acquisizione dei dati controllato da computer ha condotto finalmente all'acquisizione dato-dipendente e poi all'acquisizione dell'dato-indipendente, tenendo conto l'analisi su grande scala dei peptidi.

Ora era possibile trattare una gamma di massa in tandem di peptidi e codici a barre di sequenza aminoacidica, facendo uso di questa per scandire attraverso un database e per identificare la sequenza aminoacidica che è rappresentata.

Questo approccio ha permesso all'alta capacità di lavorazione ed agli esperimenti su grande scala che potrebbero accomodare i sistemi biologici altamente complessi, dai complessi della proteina ed agli organelli alle celle ed ai tessuti. Tuttavia, questo ha generato più dati e le più analisi, che hanno richiesto ulteriore organizzazione.

Come gli sviluppi in informatica hanno urtato il potenziale di spettrometria di massa?

Gli sviluppi in spettrometria di massa hanno collocato molto sforzo sulla nostra capacità di raccogliere, analizzare, organizzare ed interpretare i dati. Ciò è dove l'informatica è diventato importante, con i software tool e gli script che variano dall'estrazione di dati, dai motori di ricerca e dall'analisi quantitativa da parte a parte agli strumenti di convalida, agli strumenti di segnatura di fiducia ed agli archivi dati che diventano ordinari - gli ultimi regolarmente facendo uso di Microsoft Excel come supporto di memorizzazione, sebbene stiamo muovendo a partire da questo poichè non è ideale.

È importante che i dati possono essere usati all'interno del laboratorio, così qui a Bruker, noi stanno sviluppando gli strumenti di analisi strutturale della proteina e di analisi di arricchimento nel gene con quella in mente.

Potete fare ai nostri lettori una generalità della piattaforma IP2?

Alcuni anni fa, abbiamo fatto un confronto fra gli strumenti dell'estrazione di dati disponibili ed abbiamo trovato moltissima variabilità in termini di loro capacità. Ciò è uno dei punti più importanti del trattamento, ma l'emissione con avere tanti software tool disponibili è che la compatibilità può essere difficile da raggiungere attraverso un intero flusso di lavoro.

Abbiamo lanciato una società chiamata le applicazioni integrate di Proteomics, sviluppanti un'impalcatura di flusso di lavoro chiamata la conduttura integrata di Proteomics (IP2). L'idea dietro questa impalcatura è che possiamo strumenti alimentabili che abbiamo sviluppato nell'accademia (che erano liberamente disponibili e open source) in questa conduttura del IP, così creanti un flusso di lavoro aerodinamico con gli strumenti di analisi integrati di dati.

Il IP2 è un programma medio del livello, che riesce le analisi, il controllo di qualità spettrale, i livelli del back end, collegamenti per appannarsi e ragruppare la computazione, archiviazione di dati ed il backup.

Gli utenti possono accedere ai loro dati o osservare lo stato dei trattamenti facendo uso di un desktop computer, di un telefono, o di una compressa. Il IP2 è egualmente personalizzabile via il kit del rivelatore IP2, significare gli utenti può adattare la piattaforma a lavoro con altri software ed applicazioni.

Il IP2 può lavorare con l'analisi di dati parallela su grande scala di proteomics ed abbiamo potuti integrare la nostra piattaforma con la nuvola che computa via i web service di Amazon, nuvola di Google e Microsoft si appanna gli strumenti. Egualmente stiamo approfittando di GPUs, sia all'interno del nostro sistema di laboratorio che basato a nuvola, per aumentare la velocità ed il risparmio di temi della piattaforma.

Come l'uso di trattamento di GPU pregiudica la prestazione del IP2?

Il IP2 permette l'uso di un motore di ricerca di GPU e questa utilizzazione delle memorie di GPU piuttosto che le memorie del CPU lo rende estremamente veloce. Una scheda di GPU avrà migliaia di memorie di GPU e potete aggiungere ancor più schede di GPU per migliorare la velocità. La memoria di GPU permette il database che cercano alle tariffe incredibilmente veloci ed il database che cerca i disgaggi con potenza di calcolo.

Stiamo esaminando usando le ricerche doppie per migliorare la qualità di dati, comprendente questa funzionalità nel IP2. Qui, passate i dati di DDA che avete cercato da parte a parte ad un database di sequenza e poi usate questi dati per costruire una libreria. Potete poi cercare i vostri dati di DDA una seconda volta facendo uso di quella libreria. Questo approccio può migliorare drammaticamente la riproducibilità di dati e l'uso delle memorie di GPU ci dà la potenza di elaborazione raggiungere questo.

Potete anche dire i nostri lettori circa la piattaforma del timsTOF e come questo integrate con il IP2?

Il timsTOF di Bruker è uno strumento destinato per misurare la mobilità dello ione. Ciò è un'estensione potente a spettrometria di massa che ci fornisce le informazioni sulla struttura tridimensionale di uno ione, aiutante ci alla capacità di punta di aumento ed alla fiducia globale nella caratterizzazione composta.

Stiamo ottimizzando le nostri piattaforme, strumenti e motore di ricerca per il timsTOF, specificamente intorno a come estraiamo i dati dai file RAW dei timsTOF, che sono grandi e contengono molte informazioni.

Il risultato di questo lavoro è stato un programma robusto dell'estrazione: il timsTOFExtractor, il motore di ricerca di ProLuCID (che usa la tecnologia che della trasformazione di GPU abbiamo parlato di più presto), la domanda quantitativa di analisi di dati di censimento e PaSER (motore di ricerca del database parallelo in tempo reale) di timsTOF.

Che cosa sono le sfide in strumenti di sviluppo del motore di ricerca per l'analisi di dati del microbiome e di metaproteomics?

Lavorando con i dati del microbiome è estremamente provocatorio a causa del suo grande database di sequenza. Ciò è corrente di intorno 70 gigabyte nella dimensione e nella continuazione svilupparsi. Il database di indice analitico per questi dati è sopra un Terabyte nella dimensione, significante che è difficile da cercare questo facendo uso delle strategie di ricerca tradizionali.

Per indirizzare questo, abbiamo lavorato con Dennis Wallen dall'istituto di ricerca di Scripps per sviluppare il motore di ricerca di ProLuCID-ComPIL.

Gli pre-ordinamenti di ProLuCID-ComPIL e pre-analizza i dati facendo uso di NoSQL per migliorare il tempo di ricerca. Questi algoritmi e trattamenti possono anche essere usati con PTMs e le varianti di sequenza, con questi che sono trasferiti in un database di indice analitico, che poi è cercato all'alta velocità facendo uso del GPU.

Egualmente abbiamo potuti rivolgere la nostra attenzione a grazie di metabolomics al nostro lavoro con Yu Gao al UCSD ed al suo strumento di allineamento spettrale Dilu.

Potete dirci di più circa il sistema di PaSER?

Il nostro sistema di PaSER è un motore di ricerca del database parallelo che può funzionare in tempo reale. Molte applicazioni scandiscono estremamente veloce, generando tantissimi spettri, in modo da uno dei vantaggi chiave di ricerca in tempo reale è che non c'è esigenza del punto dell'estrazione di dati - catturate appena i dati direttamente dallo spettrometro di massa e dalla ricerca subito. Non c'è necessità di caricare i dati.

Il sistema di PaSER è abbastanza velocemente che può accomodare parecchi strumenti immediatamente, ma il nostro scopo con la piattaforma di PaSER non è appena ricerca in tempo reale. Vogliamo continuare ad indirizzare le molte sfide presenti nella consegna della funzionalità in tempo reale efficace di ricerca.

La velocità del motore di ricerca è critica se è di stare al passo con velocità la velocità di scansione rapida degli strumenti che inseriscono in.

Come la piattaforma IP2, il PaSER usa le memorie di GPU invece delle memorie del CPU, assicurando i considerevoli miglioramenti della velocità sopra la tecnologia tradizionale di ricerca. Ciò significa che è possibile inviare i dati da uno strumento ad una casella di IP2-GPU in tempo reale ed il risultato di ricerca di database sarà disponibile subito dopo che l'esperimento è fatto.

Come avete valutato gli aumenti della velocità di PaSER sopra le ricerche offline tradizionali?

Per valutare il PaSER, abbiamo eseguito alcuni campioni su HeLa pro- del timsTOF cioè a 200 nanograms. Abbiamo eseguito sei repliche tecniche. Il primo turno era una ricerca in tempo reale, seguita da nessuna ricerca in tempo reale. Ciò è stata ripetuta nelle esecuzioni tre e quattro, prima di fare due ricerche più in tempo reale nelle esecuzioni cinque e sei.

Gli scopi di questo esperimento erano di identificare tutti i ritardi nella velocità di scansione e di controllare indipendentemente da fatto che il numero di riuscite identificazioni è stato urtato su mediante l'uso della ricerca in tempo reale.

L'esperimento ha trovato che l'uso della ricerca in tempo reale non ha pregiudicato il tempo di scansione. Egualmente abbiamo trovato quello camice, l'uso della ricerca in tempo reale abbiamo restituito lo stesso numero dei risultati identificati come ricerca offline standard.

Egualmente abbiamo valutato il tempo di ricerca offline. A volte, seguendo una ricerca in tempo reale, gli utenti possono volere cercare ancora con differenti parametri o nei database differenti. In questo scenario, non c'è ancora necessità di convertire i dati grezzi perché la ricerca in tempo reale iniziale già ha memorizzato gli spettri e li ha trasferiti al database. Nel nostro esempio, ha richiesto soltanto tre minuti per ogni ricerca facendo uso del motore di ricerca di IP2-GPU.

Come lo strumento astuto di selezione del precursore migliora il trattamento di ricerca?

Lo strumento astuto di selezione del precursore di PaSER permette che PaSER comunichi con gli strumenti bidirezionale. Ciò apre molte possibilità creative, secondo lo scopo del vostro progetto.

Per esempio, possiamo utilizzare questo strumento per applicare le liste di esclusione. Questa idea è stata a lungo intorno, ma non è molto popolare perché non è molto facile da applicare. Storicamente, gli utenti hanno dovuto manualmente raccogliere l'ID del peptide dai risultati di ricerca, poi hanno introdotto la lista di esclusione manualmente. Mentre le idee si sono sviluppate, questo trattamento ha dovuto essere ripetuto che, naturalmente, non è ideale.

PaSER permette che noi sviluppiamo automaticamente la lista di esclusione, radrizza dal primo esperimento. PaSER poi passerà questa lista di esclusione al secondo esperimento, ecc, migliorante la lista di esclusione con ogni ripetizione. Questo approccio permette che le nostri ricerche ed esperimenti diano col passare del tempo i risultati più accurati.

Un altro esempio è la gestione dinamica di deriva di massa dovuto i mutamenti di temperatura o le emissioni di calibratura. Facendo uso della ricerca in tempo reale di PaSER, possiamo misurare la massa di delta fra gli ioni teorici e sperimentali del precursore del peptide. Possiamo poi inviare la massa di delta di nuovo allo strumento e lo strumento può calibrare la deriva di massa dinamicamente ed in tempo reale. Ciò significa che se completiamo dieci esecuzioni o cento esecuzioni, la calibratura di massa è sempre aggiornata.

Quando stiamo lavorando con l'analisi quantitativa di MS1-based con il contrassegno, saremo presentati spesso con sia indicatore luminoso che gli ioni pesanti per lo stesso peptide. Per l'analisi quantitativa, non dobbiamo usare entrambi gli ioni del precursore - uno è abbastanza per quantificare il campione perché già conosciamo la differenza di massa fra gli ioni leggeri e pesanti.

Durante la ricerca in tempo reale, possiamo accertare di se stiamo lavorando con un peptide pesante o leggero, quindi possiamo escludere dinamicamente l'altra delle paia, in modo da non dobbiamo generare gli spettri ridondanti.

Possiamo anche utilizzare questo strumento per lavorare con le tecniche di contrassegno sito-specifiche come AHA che contrassegna o contrassegno del tag di TEV. Per esempio, il contrassegno di AHA può contrassegnare la metionina, mentre l'etichettatura di TEV può contrassegnare la cisteina. Secondo il database di UniProt, circa 65% dei peptidi non contengono la cisteina o la metionina. Con questi dati, possiamo escludere molti peptidi in tempo reale, scandente selettivamente questi come appropriati.

Come PaSER accomoda gli spettri dinamici di PASEF e la quantificazione in tempo reale?

PaSER può usare PASEF, o parallelizzi la frammentazione seriale di capitalizzazione come componente della sua operazione. In ogni ciclo di PASEF, combiniamo i fotogrammi per sviluppare una scansione di PASEF, ma secondo l'abbondanza di ioni, un ciclo di PASEF non può avere abbastanza ioni per fornire un risultato.

Qui, la ricerca in tempo reale può controllare il punteggio di ricerca e valutare gli spettri. Se questo assegno rivela che la scansione passiva richiede più segnale, più fotogrammi possono aggiungersi per amplificare questo.

Dobbiamo conoscere il punto della punta per potere efficacemente avviare gli spettri in tandem e possiamo fare questo durante la ricerca in tempo reale valutando un cromatogramma ed avviando soltanto i precursori una volta che il punto di punta della punta è stato determinato. Possiamo anche eliminare dinamicamente lo ione a partire dal tempo appropriato della lista di esclusione al massimo.

Infine, egualmente stiamo lavorando alle capacità in tempo reale di quantità con il timTOF. Invece di un'area di picco tipica di XYZ, possiamo calcolare il volume di peptide facendo uso di mobilità dello ione.

È egualmente possibile separare i peptidi co-eludenti con l'identificazione del peptide dall'interno della ricerca in tempo reale, significante che possiamo eseguire l'analisi quantitativa parallelamente. Se stiamo lavorando con gli esperimenti multipli, possiamo anche sviluppare una corrispondenza fra le esecuzioni mentre ci muoviamo con l'esperimento.

Questi sono tutti i buoni esempi dell'uso creativo delle capacità bidirezionali della comunicazione di PaSER.

Per concludere, dove le altre piattaforme di Bruker e di IP2 si siedono all'interno di più ampia industria di conoscenza e di dati?

Ora abbiamo una vasta gamma di strumenti che permettono che noi cataloghiamo ed identifichiamo i dati di spettrometria di massa. Lo scopo globale, naturalmente, è di identificare le cose che piombo alle scoperte biologiche.

A tal fine, il nostro link applicativo agli strumenti di analisi di dati gradisce Reactome, molti di cui possono essere raggiunti liberamente via Internet. Ci sono strumenti disponibili che possono esplorare l'output di ontologia del gene, per esempio selezionando le venti categorie più significative principali, mentre tengono aggiornate le informazioni su tutte le categorie nel file RAW generato in moda da poterlo esaminare più ulteriormente senza dovere analizzarlo nuovamente.

Mathieu Lavallée-Adam ed il suo gruppo ha sviluppato uno strumento interno per noi ha chiamato PSEA-Quantità, che è progettata per l'analisi stabilita di arricchimento nella proteina. Questo strumento è stato basato su altri sviluppati per l'analisi stabilita di arricchimento nel gene, ma questi sono stati ottimizzati per sia i dati contrassegni contrassegno che contrassegni contrassegno di quantificazione della proteina.

In generale, la compatibilità fra le piattaforme e strumenti è un fuoco importante del nostro lavoro.

Citations

Please use one of the following formats to cite this article in your essay, paper or report:

  • APA

    Bruker Daltonics. (2020, September 09). Esplorazione della relazione fra spettrometria di massa ed informatica. News-Medical. Retrieved on October 24, 2020 from https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx.

  • MLA

    Bruker Daltonics. "Esplorazione della relazione fra spettrometria di massa ed informatica". News-Medical. 24 October 2020. <https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx>.

  • Chicago

    Bruker Daltonics. "Esplorazione della relazione fra spettrometria di massa ed informatica". News-Medical. https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx. (accessed October 24, 2020).

  • Harvard

    Bruker Daltonics. 2020. Esplorazione della relazione fra spettrometria di massa ed informatica. News-Medical, viewed 24 October 2020, https://www.news-medical.net/news/20200909/Exploring-the-Relationship-Between-Mass-Spectrometry-and-Informatics.aspx.