Gli scienziati sviluppano il software di Scanpy per analizzare i dati unicellulari enormi

Gli scienziati dal Helmholtz Zentrum München hanno sviluppato un programma che può contribuire a gestire i gruppi di dati enormi. Il software, nominato Scanpy, è un candidato per analizzare l'atlante della cellula umana e recentemente è stato pubblicato nella biologia del genoma del `'.

Visualizzazione dei reticoli di espressione genica delle cellule cerebrali murine generate con Scanpy.
© Helmholtz Zentrum München

“È circa analizzare i dati di espressione genica di tantissime diverse celle,„ spiega il lupo di Alex dell'autore principale dell'istituto di biologia di calcolo (offerta d'appello internazionale) a Helmholtz Zentrum München. Ha sviluppato Scanpy insieme al suo collega Philipp Angerer nel gruppo di apprendimento automatico di prof. il Dott. Fabian Theis. Oltre alla sua posizione a Helmholtz Zentrum, Theis è egualmente un professore di modellistica matematica dei sistemi biologici all'università di Monaco di Baviera tecnica. “I nuovi avanzamenti tecnici generano parecchi ordini di grandezza più dati con un contenuto di informazioni corrispondentemente maggior,„ Theis dice. “Tuttavia, l'infrastruttura storicamente mutevole del software per l'analisi di espressione genica non è stata destinata semplicemente per fare fronte alle nuove sfide. I nuovi metodi analitici quindi sono necessari.„

La corsa per l'atlante della cellula umana

Secondo Theis, un progetto di ricerca internazionale importante ha potuto anche trarre giovamento dal software. Un gruppo degli scienziati internazionali sta compilando un database di riferimento, chiamato l'atlante della cellula umana, che tiene i dati sull'attività di gene di tutti i tipi della cellula umana. “Per questo progetto ed in un numero crescente di altri progetti in cui i database si combinano, è importante avere software evolutivo,„ dice Theis. Non è quindi sorpresa che Scanpy è corrente un candidato affinchè contribuire analizzi l'atlante della cellula umana.

“La pubblicazione di Scanpy traccia il primo software che permette l'analisi completa di grandi gruppi di dati di espressione genica con una vasta gamma di apprendimento automatico e di metodi statistici,„ spiega il lupo, descrivente il risultato. “Il software già sta usando da una serie di gruppi intorno al mondo, considerevolmente al vasto istituto della Harvard University ed a Massachusetts Institute of Technology, MIT.„

Tecnologicamente, l'applicazione è uno sviluppo trailblazing: Considerando che i programmi della biostatistica sono scritti tradizionalmente nel linguaggio di programmazione R, Scanpy è basato sul linguaggio del pitone, il linguaggio dominante nella comunità di apprendimento automatico. Un'altra nuova funzionalità è che ad algoritmi basati a grafico si trovano al centro di Scanpy. A differenza dell'approccio usuale di considerazione delle celle come i punti in un sistema di riferimento all'interno dello spazio di espressione genica, gli algoritmi utilizzano un sistema di riferimento del tipo di grafico. Invece di caratterizzazione dell'unicellulare dal valore di espressione per le migliaia di geni, il sistema caratterizza semplicemente le celle dall'identificazione dei loro vicini più vicini - molto come le connessioni nelle reti sociali. Infatti, identificare i tipi delle cellule, Scanpy usa gli stessi algoritmi come Facebook fa per l'identificazione delle comunità.

Sorgente: https://www.helmholtz-muenchen.de/en/press-media/press-releases/all-press-releases/press-release/article/44101/index.html