Analizzare i dati di Metabolomics

La disponibilità dei dati è il primo punto nell'analisi. Ci sono parecchi database metabolomic disponibili, ciascuno di loro che hanno uno scopo differente. Il loro scopo è di mettere i metaboliti in un certo ordine in modo che diventi facile affinchè i ricercatori macchi e da analizzare i dati.

Credito di immagine: toeytoey/Shutterstock
Credito di immagine: toeytoey/Shutterstock

Il database di Metabolome dell'essere umano (HMDB) ha oltre 40.000 entrate ed obiettivi del metabolita riconoscere tutti i metaboliti presenti in esseri umani. MassBank è un database spettrale che ha oltre 39.000 voci. Oltre 75.000 voci sia disponibile nel database di METLIN-a del database per i batteri, gli animali e le piante. I metaboliti del lipido e la strategia di vie (MAPPE del LIPIDO) è la più grande repository per le strutture molecolari del lipido. Il database del consorzio di metabolomics di Madison ha oltre 20.000 dati, una risorsa per spettrometria di massa ed alla la ricerca basata a risonanza magnetica nucleare di metabolomics. Le vie metaboliche sono contenute nell'enciclopedia di Kyoto dei geni e dei genoma (KEGG).

Tipi di tecniche di analisi di dati

I due fattori importanti da considerare mentre analizzano i dati sono la loro organizzazione e visualizzazione, di modo che i dati possono essere interpretati o le ipotesi possono essere inventate. Ci sono quattro tecniche importanti disponibili analizzare i dati di metabolomics. Sono:

  • Metodo d'apprendimento non supervisionato
  • Sorvegliato imparando i metodi
  • Metodi di analisi di via
  • Metodi di dati di corso di tempo

Metodo d'apprendimento non supervisionato

Durante la fase dell'analisi, possiamo volere ottenere un'idea della struttura di dati.

L'apprendimento non supervisionato contribuisce ad imparare circa i dati; più precisamente, contribuisce a scoprire la tendenza di dati. I dati non sono contrassegnati nell'ambito di alcuna classe ed il metodo d'apprendimento non supervisionato scoprirà i dati. Così il ricercatore ha pochi informazioni o presupposti circa i dati che sono nell'ambito dell'analisi. Essendo il primo punto nel trattamento dell'analisi, l'apprendimento non supervisionato assiste nel prevedere i dati. I seguenti quattro metodi sono il più delle volte usati per analizzare i metaboliti.

  • Analisi delle componenti principali (PCA) - quando il numero dei metaboliti è maggior, trovare poche combinazioni dei dati aiuta nella riduzione di dimensione. Nell'applicare l'algoritmo di APC nel gruppo di dati originale, la variazione totale può essere trovata. La maggior parte delle informazioni sul gruppo di dati sono conservate dalle componenti principali che realmente sostituiscono tutte le variabili correlate. Un tracciato del punteggio è usato trovare i gruppi, mentre un tracciato di caricamento è di scoprire le variabili che separano i gruppi l'uno dall'altro.
  • La tecnica di raggruppamento contribuisce a raggruppare i dati che sono simili, di modo che i dati in un cluster sono simili e relatable in paragone ai dati in un altro ragruppi. Le due tecniche di raggruppamento più ampiamente usate in metabolomics sono K-medie che ragruppano e raggruppamento gerarchico. Nelle k-medie che ragruppano, i dati sono divisi nei cluster del K che non si sovrappongono. A differenza delle K-medie che ragruppano, il raggruppamento gerarchico non si ferma a trovare i numeri specifici dei cluster, ma continua a spaccare tutti i dati fino a formare una gerarchia dei cluster. Si combina spesso con una mappa del calore per visualizzazione della matrice di dati.
  • La mappa ad organizzazione autonoma (SOM) è uno strumento di visualizzazione che assiste nella scoperta visiva dei cluster presenti nei dati.

Sorvegliato imparando mMethod

Ampiamente usato nella scoperta di biomarcatore, la categorizzazione e previsione, ha sorvegliato l'apprendimento che i metodi si occupano dei gruppi di dati che hanno variabili di risposta che sono continue o discrete. Questi metodi trovano l'associazione fra i covariates e le variabili di risposta e le previsioni accurate sono fatte.

Di minimi quadrati parziale (PLS) principalmente è utilizzato nella ricerca di metabolomics. PLS è ampiamente usato per l'identificazione dei biomarcatori e nella classificazione delle malattie, mentre il commputer di vettore di sostegno (SVM) è utilizzato nella ricerca sul cancro.

Metodi di analisi di via

Guide di analisi di via per trovare i meccanismi biologici nella lista dei metaboliti identificati. I due metodi più comuni sono 1) l'analisi di sovrarappresentazione (ORA) e 2) segnatura funzionale della classe (FCS).

ORA è il metodo più semplice, che sia eseguito quando le vie differiscono considerevolmente fra i due gruppi di studio. Alcune limitazioni di ORA sono indirizzate con il metodo di segnatura della classe (FCS) funzionale. Le singole statistiche del metabolita sono ottenute in primo luogo e queste sono cumulate per valutare di una statistica livella della via, monovariante o a più variabili. Il più spesso il punteggio, la media ed il meridiano di arricchimento sono usati per delle le statistiche livelle della via monovarianti. La statistica del T2 di Hotelling è ampiamente usata per le statistiche a più variabili

Metodi di dati di corso di tempo

La concentrazione nei metaboliti può variare con tempo, così una dimensione temporale è creata nel gruppo di dati. Dobbiamo comprendere una dimensione temporale e continuare a per mezzo dei metodi d'apprendimento non supervisionati e degli strumenti di visualizzazione quali APC ed il SOM. Ulteriormente, i grafici di profilo possono essere tracciati per controllare i profili dei metaboliti per vedere se c'è i vari cluster. Le tecniche statistiche quale l'analisi (ANOVA) ai dei modelli basati a varianza sono usate per confrontare i reticoli differenti del cambiamento dei metaboliti.

Durante il trattamento della ricerca di metabolomics, i ricercatori hanno osservato alcune differenze fra i metaboliti all'interno dello stesso cluster. Quando la variazione è maggior, il modello ripetuto (RM) delle misure è usato. Quando è richiesto di analizzare molti metaboliti parallelamente considerando la struttura della correlazione, un'analisi delle componenti ANOVA-simultanea chiamata ANOVA generalizzata (ASCA) è usata.

I metodi quale l'analisi di dati di serie cronologiche, a metodo basato a funzionale, lisciando scanala gli effetti misti modellano ed il modello lineare gerarchico egualmente è suggerito.

Sorgenti

[Ulteriore lettura: Metabolomics]

Last Updated: Aug 23, 2018

Afsaneh Khetrapal

Written by

Afsaneh Khetrapal

Afsaneh graduated from Warwick University with a First class honours degree in Biomedical science. During her time here her love for neuroscience and scientific journalism only grew and have now steered her into a career with the journal, Scientific Reports under Springer Nature. Of course, she isn’t always immersed in all things science and literary; her free time involves a lot of oil painting and beach-side walks too.

Citations

Please use one of the following formats to cite this article in your essay, paper or report:

  • APA

    Khetrapal, Afsaneh. (2018, August 23). Analizzare i dati di Metabolomics. News-Medical. Retrieved on May 19, 2019 from https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx.

  • MLA

    Khetrapal, Afsaneh. "Analizzare i dati di Metabolomics". News-Medical. 19 May 2019. <https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx>.

  • Chicago

    Khetrapal, Afsaneh. "Analizzare i dati di Metabolomics". News-Medical. https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx. (accessed May 19, 2019).

  • Harvard

    Khetrapal, Afsaneh. 2018. Analizzare i dati di Metabolomics. News-Medical, viewed 19 May 2019, https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx.

Comments

The opinions expressed here are the views of the writer and do not necessarily reflect the views and opinions of News-Medical.Net.
Post a new comment
Post