Advertencia: Esta página es una traducción de esta página originalmente en inglés. Tenga en cuenta ya que las traducciones son generadas por máquinas, no que todos traducción será perfecto. Este sitio Web y sus páginas están destinadas a leerse en inglés. Cualquier traducción de este sitio Web y su páginas Web puede ser imprecisa e inexacta en su totalidad o en parte. Esta traducción se proporciona como una conveniencia.

Los campos comunes Genomic de los datos ofrecen el recurso más grande de la genómica del cáncer

Los campos comunes Genomic de los datos del Instituto Nacional del Cáncer (GDC), puestos en marcha en 2016 por entonces-Vice presidente José Biden y recibidos en la Universidad de Chicago, tienen convertido de los recursos más grandes y más ampliamente utilizados en genómica del cáncer, con más de 3,3 petabytes de datos de más de 65 proyectos y sobre 84.000 casos pacientes anonymized, sirviendo a más de 50.000 utilizadores únicos cada mes.

En los nuevos papeles publicados el 22 de febrero en comunicaciones de la naturaleza y genética de la naturaleza, el equipo de investigación UChicago-basado comparte a los nuevos detalles sobre el GDC, que es financiado por el Instituto Nacional del Cáncer (NCI), vía subcontrato con el laboratorio nacional de Frederick para la investigación de cáncer, operado actualmente por Leidos Biomedical Research, Inc.

Uno de los papeles describe el diseño y la operación del GDC. El otro describe las tuberías usadas por el GDC para la armonización de los datos presentados al GDC y la generación de grupos de datos usados por la comunidad de investigación de GDC.

La meta del GDC es proveer de la comunidad de investigación de cáncer un depósito de datos de los datos clínicos genomic y asociados uniformemente tramitados que habilitan la distribución de datos y el análisis colaborativo en el apoyo del remedio de la precisión.

La producción de los datos para qué se convirtió en el GDC comenzó en junio de 2015 a usar una nube privada. Después apenas de un año, el GDC había analizado más de 50.000 entradas de datos de secuencia sin procesar. El GDC incluye datos genomic, transcriptomic, epigenomic, proteomic, clínicos, y de la proyección de imagen. Las tuberías de tramitación descritas en el papel de la naturaleza han producido más TB de 1.660 de datos sobre más de dos docena tipos de cánceres primarios. Estos datos se salvan dentro del portal de los datos de GDC, donde están disponibles para la visión y la transferencia.

Junto con el portal de los datos, el GDC también ofrece recursos adicionales del utilizador, incluyendo el análisis de datos de GDC, la visualización, y las herramientas de la exploración (DAVE) para la exploración interactiva de datos por variante genomic o el cambio específico; el portal de la presentación de los datos de GDC para presentar datos; la herramienta de la transferencia de datos de GDC (DTT) para transferir grupos de datos directamente genomic grandes; y el sistema de la armonización de los datos de GDC, que permite que los utilizadores funcionen con datos sometió al GDC a través de las tuberías de tramitación de la armonización.

Estos datos tienen un papel crítico a jugar. Pues los datos acumulan, las nuevas señales llegarán a ser más fáciles de determinar como objetivos importantes para la biología de comprensión del cáncer. Además, la infraestructura de dato-distribución puede servir informar a los estudios de la investigación, ofreciendo nuevo discernimiento en la variación genética entre los individuos y cómo puede afectar a resultados del enfermo de cáncer.”

Roberto Grossman, doctorado, investigador principal, campos comunes Genomic de los datos, director, centro para la ciencia de translación de los datos, Universidad de Chicago

Source:
Journal reference:

Zhang, Z., et al. (2021) Uniform genomic data analysis in the NCI Genomic Data Commons. Nature Communications. doi.org/10.1038/s41467-021-21254-9.