La recherche neuve aboutie par Holger Heyn chez Centro Nacional de Análisis Genómico du centre pour le règlement génomique (CNAG-CRG), présents un cadre de calcul sophistiqué d'analyser l'expression du gène unicellulaire nivelle, évolutif pour traiter des millions de différentes cellules. Le travail, publié dans la question actuelle de la recherche de génome de tourillon scientifique, montre pour la première fois un outil capable d'analyser un tel grand ensemble de données unicellulaire de RNAseq. Ceci étend spectaculaire les limites de la recherche unicellulaire de génome.
Toutes les cellules à un corps humain partagent le même génome mais chaque cellule a le potentiel de devenir spécifique dans un tissu ou un organe dû à l'expression du gène. Les scientifiques mondiaux regardent ce qui différencie une cellule des des autres. Un des défis actuels de la recherche de génome est d'analyser beaucoup de différentes cellules afin de trouver et recenser ces différences. L'analyse de la cellule individuelle utilisant l'ordonnancement unicellulaire d'ARN a été essentielle de relever ce défi et a révolutionné notre compréhension de la complexité des tissus, des organes et des organismes. Regardant l'expression du gène d'une cellule à la fois, les scientifiques peuvent maintenant décrire l'hétérogénéité d'un échantillon à la définition sans précédent et sans connaissance préalable de sa composition.
En conséquence, projets unicellulaires de grande puissance menés à l'identification des types précédemment inconnus de cellules et au retrait des plans cellulaires complets des organismes. Dans le cadre du projet d'atlas de cellule humaine, les chercheurs visent à produire un atlas de tous les types de cellules qui composent un corps humain. Cependant, de telles études produisent des quantités massives d'ordonnancer des caractéristiques et en analysant de grands ensembles de données soyez un défi majeur.
Un groupe de scientifiques du CNAG-CRG, en collaboration avec des chercheurs de theUniversity Pompeu Fabra (UPF) et du consortium espagnol de recherche biomédicale sur les maladies rares (CIBERER), a maintenant développé un cadre de calcul efficace qui a activé le traitement, l'analyse et l'évaluation de tels des expériences unicellulaires de grand-écaille. Le groupe a illustré le pouvoir de leur stratégie en analysant une des plus grandes études unicellulaires avec 1,3 millions de différentes cellules du cerveau se développant de souris.
« BigSCale est extrêmement puissant en recensant les gènes spécifiques de type de cellules, qui aide grand dans l'évaluation en aval des expériences » dit Holger Heyn, le meneur d'équipe de CNAG-CRG et l'auteur supérieur de l'étude. La nouveauté de l'outil analytique nommé « BigSCale » se situe dans un modèle numérique qui détermine avec sensibilité des différences entre les cellules. Après avoir dressé une carte comment les différentes cellules diffèrent entre eux, elles peuvent être groupées ensemble dans des populations des cellules pour décrire la complexité cellulaire d'un tissu donné. Pendant que pratiquement tous les tissus se composent de différents types et sous-types de cellules, une telle analyse peut guider une caractérisation en profondeur impartiale sans premières hypothèses. Gènes différentiel exprimés de borne entre l'aide de sous-population le chercheur pour lier des cellules à la connaissance préalable au sujet de l'anatomie de tissu ou pour décrire les fonctionnements des types neuf découverts de cellules.
De plus, l'outil a été conçu pour aborder de futurs défis de grands ensembles de données. « Les coûts pour dériver des profils unicellulaires sont décroissants et nous voyons que les études des numéros croissants de cellules » ajoute M. Heyn. À cet égard, un module dans le flux de travail de BigSCale active l'analyse des millions de cellules par une stratégie dirigée de convolution. Ici, des transcriptomes unicellulaires des cellules assimilées sont fusionnés dans des cellules d'index, qui réduit grand la quantité de caractéristiques à traiter.
Avec l'outil neuf à disposition le groupe a analysé un du plus grand ensemble de données unicellulaire d'expression du gène de 1,3 millions de cellules, un moyen publiquement fourni par la génomique 10x. « BigSCale nous a permis d'examiner profondément les procédés de développement du cerveau de souris et pour caractériser même les types neuronaux rares de cellules » a commenté Giovanni Iacono, le premier auteur du travail. Particulièrement, le nombre élevé de cellules a permis au groupe de changer de plan dans les cellules appelées d'un Cajal-Retzius de petite population cellulaire passagère et décrire les sous-structures importantes a associé aux étapes distinctes de différenciation, à l'organisme spatial et à la fonction cellulaire. « Le cadre de BigSCale fournit une solution puissante pour pratiquement n'importe quelle substance et s'applique même en dehors de l'ARN ordonnançant le contexte » explique M. Heyn et nous ajoute « s'attendent à ce qu'il contribue à l'évaluation des études de grande puissance, telles que le projet d'atlas de cellule humaine ».