Forskare framkallar Scanpy programvara för att analysera jättelika singel-cell data

Forskare från Helmholtzen Zentrum München har framkallat ett program som är kompetent att hjälpa att klara av jättelika datasets. Programvaran som namnges Scanpy, är en kandidat för analysering av människacellkartboken och har för en tid sedan publicerats i `-genombiologi'.

Visualization av genuttryckt mönstrar av murine hjärnceller som frambrings med Scanpy.
© Helmholtz Zentrum München

”Är den om att analysera gen-uttryck data av ett stort nummer av individceller,” förklarar den bly- författareAlex wolfen av institutet av Computational biologi (ICB) på Helmholtz Zentrum München. Han framkallade Scanpy samman med hans kollega Philipp Angerer i bearbeta med maskin som lärer gruppen av prof.en Dr. Fabian Theis. Förutom hans placera på Helmholtz Zentrum, Theis är också en professor av matematiskt modellera av biologiska system på den tekniska universitetar av Munich. ”Frambringar nya tekniska framflyttningar flera beställer av storlek mer data med en nöjd i motsvarande grad mer stor information,” Theis något att säga. ”Emellertid, planlades den historically evolved programvaruinfrastrukturen för gen-uttryck analys enkelt inte för att klara av med de nya utmaningarna. Nya analytic metoder behövs därför.”,

Racen för människacellkartboken

Enligt Theis projekterar en ha som huvudämnelandskampforskning kunde också gynna från programvaran. Ett lag av landskampforskare sammanställer en hänvisa tilldatabas som kallas människacellkartboken, som rymmer data på typerna för cellen för människan för genaktivitet allra. ”För detta projektera, och i en växande antal av annan projekterar i vilka databaser kombineras, det är viktigt att ha scalable programvara,” något att säga Theis. Det är därför ingen överrrakning att Scanpy är för närvarande en kandidat för att portionen ska analysera människacellkartboken.

”Markerar publikationen av Scanpy den första programvaran som låter omfattande analys av stora gen-uttryckt datasets med ett brett spänner av bearbeta med maskin-att lära, och statistiska metoder,” förklarar wolfen som beskriver prestationen. ”Ar programvaran redan använd av ett nummer av grupper runt om världen, notably på det breda institutet av Harvarduniversitetet och Massachusettset Institute of Technology, MIT.”,

Technologically är applikationen en trailblazing utveckling: Eftersom biostatisticsprogram är traditionellt skriftliga i det programmera språket R, baseras Scanpy på pytonormspråket, det framträdande språket i bearbeta med maskin som lärer gemenskapen. Ett annat nytt särdrag är att graf-baserade algoritmer ligger på hjärtan av Scanpy. I motsats till det vanligt att närma sig av att betrakta celler som pekar i ett koordinerat system inom gen-uttryck utrymme, algoritmerna använder ettnågot liknande koordinatsystem. I stället för att karakterisera en singelcell vid uttryckt, värdera för tusentals gener, systemet karakteriserar enkelt celler, genom att identifiera deras mest nära grann - gilla mycket anslutningarna i samkväm knyter kontakt. I faktum att identifiera celltyper använder Scanpy de samma algoritmerna som Facebook gör för att identifiera gemenskaper.

Källa: https://www.helmholtz-muenchen.de/en/press-media/press-releases/all-press-releases/press-release/article/44101/index.html