Avertissement : Cette page est une traduction automatique de cette page à l'origine en anglais. Veuillez noter puisque les traductions sont générées par des machines, pas tous les traduction sera parfaite. Ce site Web et ses pages Web sont destinés à être lus en anglais. Toute traduction de ce site et de ses pages Web peut être imprécis et inexacte, en tout ou en partie. Cette traduction est fournie dans une pratique.

Le superordinateur à usage intensif de données neuf peut aider à combattre l'écart du virus de Zika

Plus de 50 scientifiques de caractéristiques, techniciens, et stagiaires d'UT Austin se sont réunis dimanche 15 mai 2016 pour employer de grandes caractéristiques pour lutter l'écart de Zika pour « Austin Zika Hackathon » aux bureaux de Cloudera en centre ville.

Zika, une maladie transmise par les moustiques qui peut entraîner la fièvre et les anomalies congénitales, menace de s'écarter aux Etats-Unis. À partir de mi-mai 2016, le Mexique a eu des 272 cas rapportés de Zika, selon USA Today. Le problème s'est développé si grand que le Président Obama a invité $1,9 milliards pour arrêter l'écart de Zika. Les centres des États-Unis pour la lutte contre la maladie construit maintenant la collecte des données qui suit l'écart de Zika. Mais les grandes lacunes existent en joignant différents genres de caractéristiques, et cela le rend dur pour que les experts prévoient où il ira ensuite et ce qui à faire pour l'éviter.

Les participants de Zika Hackathon ont vérifié des voies de mettre ensemble différents ensembles de caractéristiques, telles que les états de manifestation, les sources d'eau stagnantes, les piscines et les étangs vides qui sont les endroits de reproduction potentiels de moustique, et les alimentations même de Facebook et de Twitter. Le Texas a avancé calculer des régimes (TACC) centraux pour enregistrer toutes les caractéristiques dans une place, un superordinateur à usage intensif de données neuf Wrangler appelé.

« Nous essayons de rassembler ces pièces disparates de caractéristiques, et il n'y a pas une bonne voie pour que les gens demandent à des questions à ce sujet des caractéristiques--c'est le grand problème, » a dit Ari Kahn, Coordinateur génomique de translation humain à TACC.

Ledit Kahn : Le « rôle de TACC fournit une infrastructure et consulte pour supporter ce projet. Le cowboy est un système à usage intensif de données spécialisé qui fait fonctionner une version optimisée de Cloudera, et elle accélère réellement le procédé. »

Cloudera est une grande compagnie de caractéristiques, selon son organisateur en chef Eddie Garcia d'architecte et de Zika Hackathon de garantie. « Ce qui nous faisons est rendent Apache Hadoop entreprise-disponible pour que les organismes fassent le grand analytique de caractéristiques et trouver des analyses neuves dans leurs ensembles de données, » Garcia a dit.

« Ce qui nous pouvons faire dans un hackathon d'une journée est se concentrer sur un problème de caractéristiques, par exemple, s'il y avait une manifestation -- là où nous nous la première fois enverrions le support et les nécessaires en communautés locales et dirigerions des programmes de conscience sur la prévention en enlevant l'eau stagnante ou l'emploi des produits répulsifs qui sont efficaces contre l'aedes, » Garcia a dit. « Le Zika Hackathon est au sujet de porter la conscience et d'établir une plate-forme qui est reproductible, pas simplement pour l'analyse de caractéristiques de virus de Zika. Quelqu'un peut fondamentalement prendre ce que nous avons fait ici aujourd'hui et s'applique l'à une autre manifestation inconnue ou à une autre analyse pour quelque chose encore meilleure que ce que nous faisons aujourd'hui. Il est réellement au sujet d'obtenir des gens ensemble, excité, de porter la conscience, et d'établir à l'extérieur une plate-forme qui est reproductible pour que d'autres collaborent, pour appliquent l'apprentissage automatique et pour exécuter l'analytique utilisant Apache Hadoop. »

« Il est simplement grand de voir une salle pleine de gens bourdonnant, parlant portant ces qualifications pour porter ou pour établir un ensemble de données consolidé, une peu de visualisation, ou même un peu d'outil, » a dit Jon Loyens, officier en chef de produit et co-fondateur de Data.World, une mise en train neuve d'Austin. « Chaque petit peu aide et chacun ici réalise cela. »

Le Zika Hackathon a rassemblé un genre apparaissant de scientifique, un scientifique de caractéristiques. Les scientifiques de caractéristiques se spécialisent en traduisant l'information de beaucoup de différentes sources dans les caractéristiques qui peuvent être employées ensemble et en employant les technologies neuves par lesquelles la connaissance peut être extraite des collectes des informations massives d'aujourd'hui.

Le scientifique Juliet Hougland de caractéristiques de Cloudera a décrit ce qu'est ce : « Il y a trois classes de travail qui obtiennent mises sous la protection de la science de caractéristiques. Frottement de caractéristiques -- obtenant des caractéristiques dans le bon format, dans la bonne place -- est une partie énorme de n'importe quelle fonction où vous allez faire quelque chose utile avec celle des caractéristiques. L'analytique investigateur regarde des caractéristiques historiques et faire l'analyse intéressante et utile là-dessus. L'analytique de fonctionnement supporte des engines de recommandation, des systèmes de dépistage de fraude, et plus. »

Les pirates informatiques de Zika ont constitué des groupes et ont travaillé à produire des projets de démo basés hors circuit de la CDC d'échantillon et d'autres caractéristiques procurables à cette tige. Un projet a développé un modèle de flux fonctionnant de tenseur qui a employé l'apprentissage automatique pour rechercher par des images aériennes pour des gisements de l'eau stagnante, endroit de reproduction potentiel pour les moustiques qui transportent Zika. Une autre équipe a développé un APP mobile avec node.js qui permettrait à des chercheurs d'enregistrer des cas se développants de la maladie transmise par les moustiques. On a expliqué une voie de tracer des cas de microcéphalie au Brésil utilisant des plans d'un R relient au tract. Des des autres ont transformé des progrès en préparer des caractéristiques de CDC à partir du Porto Rico à la couche avec des caractéristiques de livre de fait de CIA pour une compréhension plus riche de la façon dont Zika a progressé là.

Le maçonnage de David de programmateur de logiciel du groupe calculant à usage intensif de données de TACC a parlé de sa recherche actuelle extrayant des caractéristiques riches « de la littérature grise, » les dossiers officieux qui peuvent être des images à l'intérieur des fichiers PDF, un fléau des scientifiques de caractéristiques. Son travail emploie des techniques de traitement du langage naturel pour tracer des cas dans la littérature grise d'une substance donnée telle que des poissons à l'emplacement spécifique et aux dates. Le progrès sur ce problème traduirait bien à obtenir plus d'information pour des chercheurs au sujet de Zika.

« Si vous pouvez voir où toutes les sources d'eau sont et recouvrir alors comment les états des manifestations se produisent, puis vous pouvez produire un modèle pour la façon dont il écarte et la façon dont il écartera à l'avenir basé sur où les sources d'eau sont. Alors peut-être vous pouvez proposer quelques régimes pour compenser qu'ainsi la propagation ne se produit pas en tant que rapide ou ne se produit pas du tout, » Ari Kahn avez dit.

L'arme charitable de la compagnie d'analytique de caractéristiques, des soins de Cloudera, avec TACC et d'autres associés locaux planification pour retenir les hackathons trimestriels en tant qu'élément d'un plus grand projet planification pour employer de grandes caractéristiques pour lutter Zika et d'autres dangers. Les buts du projet de la faciliter pour que les chercheurs obtiennent des réponses et pour aident même à empêcher des manifestations de se produire.

Source:

University of Texas at Austin, Texas Advanced Computing Center