Analizar los datos de Metabolomics

La disponibilidad de datos es el primer paso en análisis. Hay varias bases de datos metabolomic disponibles, cada uno de ellos que responden a un diverso propósito. Su meta es poner los metabilitos en una cierta orden de modo que llegue a ser fácil que los investigadores observar y analicen los datos.

Haber de imagen: toeytoey/Shutterstock
Haber de imagen: toeytoey/Shutterstock

La base de datos de Metabolome del ser humano (HMDB) tiene sobre 40.000 asientos y objetivos del metabilito reconocer todos los metabilitos presentes en seres humanos. MassBank es una base de datos espectral que tiene sobre 39.000 asientos. Sobre 75.000 asientos esté disponible en la base de datos de METLIN-a de la base de datos para las bacterias, los animales, y las instalaciones. Los metabilitos del lípido y la estrategia de los caminos (MAPAS del LÍPIDO) es el depósito más grande para las estructuras moleculares del lípido. La base de datos del consorcio del metabolomics de Madison tiene sobre 20.000 datos, un recurso para la espectrometría de masa y la investigación resonancia-basada magnética nuclear del metabolomics. Los caminos metabólicos se contienen en la enciclopedia de Kyoto de los genes y de los genomas (KEGG).

Tipos de técnicas del análisis de datos

Los dos factores importantes a considerar mientras que analizan datos son su organización y visualización, para poder interpretar los datos o las hipótesis puedan ser ideadas. Hay cuatro técnicas importantes disponibles analizar datos del metabolomics. Son:

  • Método de aprendizaje no supervisado
  • Vigilado aprendiendo métodos
  • Métodos de análisis del camino
  • Métodos de los datos del curso del tiempo

Método de aprendizaje no supervisado

Durante el escenario del análisis, podemos querer conseguir una idea de la estructura de datos.

El aprendizaje no supervisado ayuda a aprender sobre los datos; más exacto, ayuda a descubrir la tendencia de los datos. Los datos no etiqueta bajo ninguna clase y el método de aprendizaje no supervisado descubrirá los datos. Así el investigador tiene poca información o suposiciones sobre los datos que están bajo análisis. Siendo el primer paso en el proceso del análisis, el aprendizaje no supervisado ayuda a visualizar los datos. Los cuatro métodos siguientes son lo más frecuentemente usados para analizar los metabilitos.

  • Análisis componente principal (PCA) - cuando el número de metabilitos es mayor, encontrar pocas combinaciones de los datos ayuda en la reducción de la dimensión. Al aplicar el algoritmo del PCA en el grupo de datos original, la variación total puede ser encontrada. La mayoría de la información sobre el grupo de datos es conservada por los componentes principales que reemplazan real todas las variables correlacionadas. Se utiliza un gráfico de la muesca de encontrar a los grupos, mientras que un gráfico del cargamento es descubrir las variables que separan a los grupos de uno a.
  • La técnica de agrupamiento ayuda a agrupar los datos que son similares, de modo que los datos en un atado sean semejantes y relatable en comparación con los datos en otro atado. Las dos técnicas de agrupamiento más ampliamente utilizadas del metabolomics son k-medios que se agrupan y agrupamiento jerárquico. En los k-medios que se agrupan, los datos se dividen en los atados de k que no recubren. A diferencia de los k-medios que se agrupan, el agrupamiento jerárquico no para en encontrar números específicos de atados, sino continúa partir todos los datos hasta que una jerarquía de atados se forme. Se combina a menudo con un mapa del calor para la visualización de la matriz de los datos.
  • El mapa de auto-organización (SOM) es una herramienta de la visualización que ayuda al descubrimiento visual de los atados presentes en datos.

Vigilado aprendiendo el mMethod

Ampliamente utilizado en el descubrimiento del biomarker, clasificación, y predicción, vigiló el aprendizaje que los métodos se ocupan de los grupos de datos que tienen variables de la reacción que sean contínuas o discretas. Estos métodos encuentran la asociación entre los covariates y las variables de la reacción, y se hacen las predicciones exactas.

Los mínimos cuadráticos parciales (PLS) se utilizan sobre todo en la investigación del metabolomics. PLS es ampliamente utilizado para determinar biomarkers y en clasificar enfermedades, mientras que la máquina del vector del apoyo (SVM) se utiliza en la investigación de cáncer.

Métodos de análisis del camino

Ayudas del análisis del camino para encontrar los mecanismos biológicos en el filete de metabilitos determinados. Los dos métodos mas comunes son 1) análisis de la sobrerepresentación (ORA) y 2) rayado funcional de la clase (FCS).

ORA es el método más simple, se realiza que cuando los caminos difieren considerablemente entre los dos grupos de estudio. Algunas limitaciones de ORA son dirigidas por el método de rayado de la clase (FCS) funcional. Las únicas estadísticas del metabilito se obtienen primero y éstas se agregan para evaluar una estadística del camino-nivel, univariante o multivariante. Lo más a menudo posible la muesca, el medio, y el meridiano del enriquecimiento se utilizan para las estadísticas univariantes del camino-nivel. La estadística del T2 de Hotelling es ampliamente utilizada para las estadísticas multivariantes

Métodos de los datos del curso del tiempo

La concentración de los metabilitos puede variar con tiempo, así una dimensión del tiempo se crea en el grupo de datos. Necesitamos incluir una dimensión del tiempo y continuar el usar de métodos de aprendizaje no supervisados y de las herramientas de la visualización tales como PCA y SOM. Además, los gráficos del perfil se pueden drenar para verificar los perfiles de los metabilitos para saber si hay los diversos atados. Las técnicas estadísticas tales como análisis (ANOVA) de modelos variación-basados se utilizan para comparar las diversas configuraciones del cambio de los metabilitos.

Durante el proceso de la investigación del metabolomics, los investigadores observaron algunas diferencias entre los metabilitos dentro del mismo atado. Cuando la variación es mayor, se utiliza el modelo (RM) relanzado de las dimensiones. Cuando es requerido analizar muchos metabilitos paralelamente considerando la estructura de la correlación, se utiliza un análisis componente ANOVA-simultáneo llamado ANOVA (ASCA) generalizado.

Los métodos tales como análisis de datos de la serie de tiempo, método funcional-basado, alisando ranuran efectos mezclados modelan, y el modelo lineal jerárquico también se sugiere.

Fuentes

[Lectura adicional: Metabolomics]

Last Updated: Aug 23, 2018

Afsaneh Khetrapal

Written by

Afsaneh Khetrapal

Afsaneh graduated from Warwick University with a First class honours degree in Biomedical science. During her time here her love for neuroscience and scientific journalism only grew and have now steered her into a career with the journal, Scientific Reports under Springer Nature. Of course, she isn’t always immersed in all things science and literary; her free time involves a lot of oil painting and beach-side walks too.

Citations

Please use one of the following formats to cite this article in your essay, paper or report:

  • APA

    Khetrapal, Afsaneh. (2018, August 23). Analizar los datos de Metabolomics. News-Medical. Retrieved on May 24, 2019 from https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx.

  • MLA

    Khetrapal, Afsaneh. "Analizar los datos de Metabolomics". News-Medical. 24 May 2019. <https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx>.

  • Chicago

    Khetrapal, Afsaneh. "Analizar los datos de Metabolomics". News-Medical. https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx. (accessed May 24, 2019).

  • Harvard

    Khetrapal, Afsaneh. 2018. Analizar los datos de Metabolomics. News-Medical, viewed 24 May 2019, https://www.news-medical.net/life-sciences/Analyzing-Metabolomics-Data.aspx.

Comments

The opinions expressed here are the views of the writer and do not necessarily reflect the views and opinions of News-Medical.Net.
Post a new comment
Post