Научные работники начинают ПО Scanpy для того чтобы проанализировать преогромные одноячеистые данные

Научные работники от Helmholtz Zentrum München начинали программу которая могл помочь управлять преогромными наборами данных. Названное ПО, Scanpy, выбранный для анализировать атлас людской клетки, и недавно было опубликовано в биологии генома `'.

Визуализирование картин выражения гена murine клеток головного мозга произведенных с Scanpy.
© Helmholtz Zentrum München

«Оно о анализировать данные по Джин-выражения большое количество индивидуальных клеток,» объясняет волка Алекса ведущего автор института вычислительной биологии (ICB) на Helmholtz Zentrum München. Он начал Scanpy вместе с его коллегаом Philipp Angerer в группе в составе учить машины Prof. Др. Fabian Theis. В дополнение к его положению на Helmholtz Zentrum, Theis также профессор математически моделирования биологических систем на техническом университете Мюнхен. «Новые технические выдвижения производят несколько порядков величины больше данных с соответственно большим содержанием информации,» Theis говорит. «Однако, исторически эволюционированная инфраструктура ПО для анализа Джин-выражения просто не была конструирована для того чтобы справиться с новыми возможностями. Новые аналитически методы поэтому необходимы.»

Гонка для атласа людской клетки

Согласно Theis, главный международный научно-исследовательский проект смог также извлекал пользу ПО. Команда международных научных работников составляет вызванную базу данных справки, атласом людской клетки, который держит данные на деятельности при гена всех типов людской клетки. «Для этого проекта, и в возрастающем числе других проектов в которых базы данных совмещены, важно иметь масштабируемое ПО,» говорит Theis. Поэтому никакой сярприз что Scanpy в настоящее время выбранный для помогать проанализировать атлас людской клетки.

«Издание Scanpy маркирует первое ПО которое позволяет всестороннему анализу больших наборов данных Джин-выражения с обширным рядом машин-учить и статистически методов,» объясняет волка, описывая достижение. «ПО уже используется несколькими групп вокруг мира, заметно на обширном институте Гарвардского университета и Массачусетсского института, MIT.»

Технологически, применение trailblazing развитие: Тогда как программы биостатистики традиционно написаны в языке программирования r, Scanpy основано на языке питона, доминантном языке в общине учить машины. Другая новая характеристика что диаграмм-основанные алгоритмы лежат в основе Scanpy. Не похож на обычный подход считать клетки по мере того как пункты в системе координат внутри космос Джин-выражения, алгоритмы используют a диаграмм-как система координат. Вместо характеризовать single cell значением выражения для тысяч генов, система просто характеризует клетки путем определять их самых близких соседей - очень много как соединения в социальных сетях. В действительности, определить типы клетки, Scanpy использует такие же алгоритмы какие Facebook делает для определять общины.

Источник: https://www.helmholtz-muenchen.de/en/press-media/press-releases/all-press-releases/press-release/article/44101/index.html