Analisando dados de Metabolomics

A disponibilidade dos dados é a primeira etapa na análise. Há diversas bases de dados metabolomic disponíveis, cada um deles que servem uma finalidade diferente. Seu objetivo é pôr os metabolitos em algum pedido de modo que se torne fácil para pesquisadores manchar e analisar os dados.

Crédito de imagem: toeytoey/Shutterstock
Crédito de imagem: toeytoey/Shutterstock

A base de dados de Metabolome do ser humano (HMDB) tem sobre 40.000 entradas e alvos do metabolito reconhecer todos os metabolitos actuais nos seres humanos. MassBank é uma base de dados espectral que tenha sobre 39.000 entradas. Sobre 75.000 entradas esteja disponível na base de dados de METLIN-a da base de dados para as bactérias, os animais, e as plantas. Os metabolitos do lipido e a estratégia dos caminhos (MAPAS do LIPIDO) são o repositório o maior para estruturas moleculars do lipido. A base de dados do consórcio do metabolomics de Madison tem sobre 20.000 dados, um recurso para a espectrometria em massa e a pesquisa ressonância-baseada magnética nuclear do metabolomics. Os caminhos metabólicos são contidos na enciclopédia de Kyoto dos genes e dos genomas (KEGG).

Tipos de técnicas da análise de dados

Os dois factores importantes a considerar ao analisar dados são seus organização e visualização, de modo que os dados possam ser interpretados ou as hipóteses possam ser planejadas. Há quatro técnicas principais disponíveis para analisar dados do metabolomics. São:

  • Método de aprendizagem Unsupervised
  • Supervisionado aprendendo métodos
  • Métodos de análise do caminho
  • Métodos dos dados do curso do tempo

Método de aprendizagem Unsupervised

Durante a fase da análise, nós podemos querer obter uma ideia da estrutura de dados.

A aprendizagem Unsupervised ajuda a aprender sobre os dados; mais precisamente, ajuda a descobrir a tendência dos dados. Os dados não são etiquetados sob nenhuma classe e o método de aprendizagem unsupervised descobrirá os dados. Assim o pesquisador tem poucas informação ou suposições sobre os dados que estão sob a análise. Sendo a primeira etapa no processo da análise, a aprendizagem unsupervised ajuda em visualizar os dados. Os seguintes quatro métodos são mais frequentemente usados analisando metabolitos.

  • Análise componente principal (PCA) - quando o número de metabolitos for maior, encontrar poucas combinações dos dados ajuda na redução da dimensão. Ao aplicar o algoritmo do APC no conjunto de dados original, a variação total pode ser encontrada. A maioria de informação sobre o conjunto de dados é retida pelos componentes principais que substituem realmente todas as variáveis correlacionadas. Um lote da contagem está usado encontrar os grupos, quando um lote da carga for descobrir as variáveis que separam os grupos de se.
  • A técnica de aglomeração ajuda a agrupar os dados que são similares, de modo que os dados em um conjunto sejam semelhantes e relatable quando comparados com os dados em um outro conjunto. As duas técnicas de aglomeração as mais amplamente utilizadas no metabolomics são k-meios que aglomeram-se e aglomeração hierárquica. Nos k-meios que aglomeram-se, os dados são divididos nos conjuntos de k que não sobrepor. Ao contrário dos k-meios que aglomeram-se, a aglomeração hierárquica não para em encontrar números específicos de conjuntos, mas continua a rachar todos os dados até que uma hierarquia dos conjuntos esteja formada. É combinada frequentemente com um mapa do calor para o visualização da matriz dos dados.
  • O mapa selforganizing (SOM) é uma ferramenta do visualização que ajude na descoberta visual dos conjuntos actuais nos dados.

Supervisionado aprendendo o mMethod

Amplamente utilizado na descoberta do biomarker, categorização, e previsão, supervisionou a aprendizagem que os métodos tratam os conjunto de dados que têm as variáveis da resposta que são contínuas ou discretas. Estes métodos encontram a associação entre covariates e variáveis da resposta, e as previsões exactas são feitas.

Os mínimo quadrados parciais (PLS) são usados na maior parte na pesquisa do metabolomics. PLS é amplamente utilizado para identificar biomarkers e em classificar doenças, quando a máquina do vector do apoio (SVM) for usada na investigação do cancro.

Métodos de análise do caminho

Ajudas da análise do caminho para encontrar os mecanismos biológicos na lista de metabolitos identificados. Os dois métodos os mais comuns são 1) análise da sobre-representação (ORA) e 2) marcar funcional da classe (FCS).

ORA é o método o mais simples, que é executado quando os caminhos diferem consideravelmente entre os dois grupos de estudo. Algumas limitações de ORA são endereçadas pela classe funcional que marca (FCS) o método. As únicas estatísticas do metabolito são obtidas primeiramente e estas são agregadas para avaliar uma estatística do caminho-nível, univariate ou múltipla. O mais frequentemente a contagem, o meio, e o meridiano do enriquecimento são usados para estatísticas univariate do caminho-nível. A estatística do T2 de Hotelling é amplamente utilizada para estatísticas múltiplas

Métodos dos dados do curso do tempo

A concentração dos metabolitos pode variar com tempo, assim uma dimensão do tempo é criada no conjunto de dados. Nós precisamos de incluir uma dimensão do tempo e de continuar a usar métodos de aprendizagem unsupervised e ferramentas do visualização tais como o APC e o SOM. Adicionalmente, os gráficos do perfil podem ser desenhados para verificar os perfis dos metabolitos para ver se há os vários conjuntos. As técnicas estatísticas tais como a análise (ANOVA) de modelos variação-baseados são usadas para comparar os testes padrões diferentes da mudança dos metabolitos.

Durante o processo da pesquisa do metabolomics, os pesquisadores observaram algumas diferenças entre metabolitos dentro do mesmo conjunto. Quando a variação é maior, o modelo repetido (RM) das medidas está usado. Quando é exigido analisar paralelamente muitos metabolitos considerando a estrutura da correlação, uma análise componente ANOVA-simultânea chamada ANOVA generalizada (ASCA) está usada.

Os métodos tais como a análise de dados da série cronolólica, método funcional-baseado, alisando ranhuram efeitos misturados modelam, e o modelo linear hierárquico é sugerido igualmente.

Fontes

Further Reading

Last Updated: Aug 23, 2018

Afsaneh Khetrapal

Written by

Afsaneh Khetrapal

Afsaneh graduated from Warwick University with a First class honours degree in Biomedical science. During her time here her love for neuroscience and scientific journalism only grew and have now steered her into a career with the journal, Scientific Reports under Springer Nature. Of course, she isn’t always immersed in all things science and literary; her free time involves a lot of oil painting and beach-side walks too.

Citations

Please use one of the following formats to cite this article in your essay, paper or report:

  • APA

    Khetrapal, Afsaneh. (2018, August 23). Analisando dados de Metabolomics. News-Medical. Retrieved on August 19, 2019 from https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx.

  • MLA

    Khetrapal, Afsaneh. "Analisando dados de Metabolomics". News-Medical. 19 August 2019. <https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx>.

  • Chicago

    Khetrapal, Afsaneh. "Analisando dados de Metabolomics". News-Medical. https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx. (accessed August 19, 2019).

  • Harvard

    Khetrapal, Afsaneh. 2018. Analisando dados de Metabolomics. News-Medical, viewed 19 August 2019, https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx.

Comments

The opinions expressed here are the views of the writer and do not necessarily reflect the views and opinions of News-Medical.Net.
Post a new comment
Post