Attenzione: questa pagina è una traduzione automatica di questa pagina originariamente in lingua inglese. Si prega di notare in quanto le traduzioni sono generate da macchine, non tutte le traduzioni saranno perfetti. Questo sito web e le sue pagine web sono destinati ad essere letto in inglese. Ogni traduzione del sito e le sue pagine web possono essere imprecise e inesatte, in tutto o in parte. Questa traduzione è fornita per comodità.

I terreni comunali genomica di dati offre la più grande risorsa nella genomica del cancro

I terreni comunali genomica dei dati dell'istituto nazionale contro il cancro (GDC), lanciati nel 2016 da Presidente allora Vice Joseph Biden ed ospitati all'università di Chicago, ha quello diventato di più grandi e risorse più ampiamente usate nella genomica del cancro, con più di 3,3 petabytes dei dati dai più di 65 progetti ed oltre 84.000 casi pazienti anonymized, serventi a più di 50.000 utenti unici ogni mese.

In nuovi documenti pubblicati il 22 febbraio nelle comunicazioni della natura e nella genetica della natura, al il gruppo di ricerca basato UChicago divide i nuovi dettagli circa il GDC, che è costituito un fondo per dall'istituto nazionale contro il cancro (NCI), via il subappalto con il laboratorio nazionale di Frederick per ricerca sul cancro, corrente di gestione da Leidos Biomedical la Research, Inc.

Uno degli articoli descrive la progettazione e l'operazione del GDC. L'altro descrive le condutture usate dal GDC per l'armonizzazione dei dati presentati al GDC e la generazione di gruppi di dati usati dalla comunità di ricerca di GDC.

Lo scopo del GDC è di fornire alla comunità di ricerca sul cancro un archivio dati dei dati clinici genomica ed associati costante elaborati che permettono alla condivisione di dati ed all'analisi di collaborazione nel supporto della medicina di precisione.

La produzione di dati per che cosa si sarebbe trasformata nel GDC ha cominciato nel giugno 2015 a usando una nuvola privata. Dopo appena un anno, il GDC aveva analizzato più di 50.000 immissioni dei dati d'ordinamento crude. Il GDC comprende i dati genomica, transcriptomic, epigenomic, proteomic, clinici e della rappresentazione. Le condutture di trattamento descritte nel documento della natura hanno prodotto più della TB 1.660 dei dati su più di due dozzina tipi di cancri primari. Questi dati sono memorizzati all'interno del portale di dati di GDC, in cui sono disponibili per la visualizzazione ed il trasferimento dal sistema centrale verso i satelliti.

Con il portale di dati, il GDC egualmente offre le risorse supplementari dell'utente, compreso l'analisi di dati di GDC, la visualizzazione e gli strumenti di prospezione (DAVE) per prospezione interattiva dei dati tramite la variante genomica o l'alterazione specifica; il portale di osservazione di dati di GDC per la presentazione dei dati; lo strumento del trasferimento di dati di GDC (DTT) per scaricare i grandi gruppi di dati genomica; ed il sistema di armonizzazione di dati di GDC, che permette che gli utenti eseguano i dati ha presentato al GDC attraverso le condutture di trattamento di armonizzazione.

Questi dati hanno un ruolo critico. Poichè i dati si accumulano, i nuovi segnali diventeranno più facili da identificare come obiettivi importanti per biologia di comprensione del cancro. Inoltre, l'infrastruttura di condivisione di dati può servire ad informare gli studi della ricerca, fornenti la nuova comprensione nella variazione genetica fra le persone e come può pregiudicare i risultati del malato di cancro.„

Robert Grossman, PhD, ricercatore principale, terreni comunali genomica di dati, Direttore, centro per scienza di traduzione di dati, università di Chicago

Source:
Journal reference:

Zhang, Z., et al. (2021) Uniform genomic data analysis in the NCI Genomic Data Commons. Nature Communications. doi.org/10.1038/s41467-021-21254-9.