Aviso: Esta página é uma tradução automática da página original em inglês. Por favor note uma vez que as traduções são geradas por máquinas, não tradução tudo será perfeita. Este site e suas páginas da Web destinam-se a ler em inglês. Qualquer tradução deste site e suas páginas da Web pode ser imprecisas e imprecisos no todo ou em parte. Esta tradução é fornecida como uma conveniência.

As terras comuns Genomic dos dados oferecem o recurso o maior na genómica do cancro

As terras comuns Genomic dos dados do instituto nacional para o cancro (GDC), lançadas em 2016 pelo presidente Joseph Biden do então-Vício e hospedadas na Universidade de Chicago, têm tornado dos recursos os maiores e os mais amplamente utilizados na genómica do cancro, com os mais de 3,3 petabytes dos dados de mais de 65 projectos e sobre 84.000 casos pacientes anonymized, servindo mais de 50.000 usuários originais cada mês.

Nos papéis novos publicados o 22 de fevereiro em comunicações da natureza e na genética da natureza, a equipa de investigação UChicago-baseada compartilha de detalhes novos sobre o GDC, que é financiado pelo instituto nacional para o cancro (NCI), através da subempreitada com o laboratório nacional de Frederick para a investigação do cancro, operado actualmente por Leidos Biomedicável Pesquisa, Inc.

Um dos papéis descreve o projecto e a operação do GDC. O outro descreve os encanamentos usados pelo GDC para a harmonização dos dados submetidos ao GDC e a geração de conjunto de dados usados pela comunidade de pesquisa de GDC.

O objetivo do GDC é fornecer a comunidade de investigação do cancro um repositório de dados dos dados clínicos genomic e associados uniformemente processados que permitem a partilha de dados e a análise colaboradora no apoio da medicina da precisão.

A produção dos dados para o que se transformaria o GDC começou em junho de 2015 a usar uma nuvem privada. Após apenas um ano, o GDC tinha analisado mais de 50.000 entradas de dados arranjando em seqüência cruas. O GDC inclui dados genomic, transcriptomic, epigenomic, proteomic, clínicos, e da imagem lactente. Os encanamentos de processamento descritos no papel da natureza produziram mais TB de 1.660 dos dados em mais de dois dúzia tipos de cancros preliminares. Estes dados são armazenados dentro do portal dos dados de GDC, onde estão disponíveis para a visão e a transferência.

Junto com o portal dos dados, o GDC igualmente oferece os recursos adicionais do usuário, incluindo a análise de dados de GDC, o visualização, e as ferramentas da exploração (DAVE) para a exploração interactiva dos dados pela variação genomic ou pela alteração específica; o portal da submissão dos dados de GDC para submeter dados; a ferramenta de transferência de dados de GDC (DTT) para transferir grandes conjunto de dados genomic; e o sistema da harmonização dos dados de GDC, que permite que os usuários executem dados submeteu-se ao GDC através dos encanamentos de processamento da harmonização.

Estes dados têm um papel crítico a jogar. Porque os dados acumulam, os sinais novos tornar-se-ão mais fáceis de identificar como alvos importantes para a biologia compreensiva do cancro. Além, a infra-estrutura departilha pode servir para informar os estudos da pesquisa, fornecendo a introspecção nova na variação genética entre indivíduos e como pode afectar resultados da paciente que sofre de cancro.”

Robert Grossman, PhD, investigador principal, terras comuns Genomic dos dados, director, centro para a ciência Translational dos dados, Universidade de Chicago

Source:
Journal reference:

Zhang, Z., et al. (2021) Uniform genomic data analysis in the NCI Genomic Data Commons. Nature Communications. doi.org/10.1038/s41467-021-21254-9.