Aviso: Esta página é uma tradução automática da página original em inglês. Por favor note uma vez que as traduções são geradas por máquinas, não tradução tudo será perfeita. Este site e suas páginas da Web destinam-se a ler em inglês. Qualquer tradução deste site e suas páginas da Web pode ser imprecisas e imprecisos no todo ou em parte. Esta tradução é fornecida como uma conveniência.

O super-computador dados-intensivo novo pode ajudar a combater a propagação do vírus de Zika

Mais de 50 cientistas dos dados, coordenadores, e estudantes de UT Austin recolheram domingo 15 de maio de 2016 para usar dados grandes para lutar a propagação de Zika por “Austin Zika Hackathon” nos escritórios de Cloudera na cidade.

Zika, uma doença mosquito-carregada que possa causar a febre e os defeitos congénitos, ameaça espalhar aos Estados Unidos. Em meados de maio de 2016, México tinha relatado 272 casos de Zika, de acordo com USA Today. O problema cresceu tão grande que o presidente Obama pediu $1,9 bilhões para parar a propagação de Zika. Os centros dos E.U. para o controlo de enfermidades ramping agora acima a coleção de dados que seguem a propagação de Zika. Mas as diferenças grandes existem em ligar tipos diferentes dos dados, e aquela faz resistente para que os peritos prever aonde irá em seguida e que a fazer para o impedir.

Os participantes de Zika Hackathon investigaram maneiras de associar junto grupos de dados diferentes, tais como os relatórios da manifestação, os nascentes de água estagnantes, as piscinas e as lagoas vazias que são caldos de cultivo potenciais do mosquito, e as alimentações mesmo de Facebook e de Twitter. O centro de elaboração avançado Texas (TACC) planeia armazenar todos os dados em um lugar, um super-computador dados-intensivo novo chamado Wrangler.

“Nós estamos tentando recolher estas partes díspares de dados, e não há uma boa maneira para que os povos peçam a perguntas sobre aquele dados--aquele é o problema grande,” disse Ari Kahn, coordenador translational humano da genómica em TACC.

Kahn dito: De “o papel TACC está fornecendo uma infra-estrutura e está consultando-a para apoiar este projecto. O Wrangler é um sistema dados-intensivo especializado que execute uma versão aperfeiçoada de Cloudera, e acelera realmente o processo.”

Cloudera é uma empresa grande dos dados, de acordo com seu organizador principal Eddie García do arquiteto e do Zika Hackathon da segurança. “O que nós fazemos é fazem Apache Hadoop empresa-pronto para que as organizações façam a analítica grande dos dados e para encontrar introspecções novas dentro de suas séries de dados,” García disse.

“O que nós podemos fazer em um hackathon de um dia é se centrar sobre um problema dos dados, por exemplo, se havia uma manifestação -- onde nós nós primeiramente enviaríamos o apoio e os jogos às comunidades locais e dirigiríamos programas da consciência na prevenção removendo a água estagnante ou usando os repelentes de insectos que são eficazes contra o Aedes,” García disse. “O Zika Hackathon é sobre trazer a consciência e construir uma plataforma que seja repetível, não apenas para a análise de dados do vírus de Zika. Alguém pode basicamente tomar o que nós fizemos aqui hoje e aplica-o a alguma outra manifestação desconhecida ou a alguma outra análise para algo mesmo melhor do que o que nós estamos fazendo hoje. É realmente sobre a obtenção de povos junto, entusiasmado, trazer a consciência, e a construção para fora de uma plataforma que seja repetível para que outro colabore, aplique a aprendizagem de máquina e execute a analítica usando Apache Hadoop.”

“É apenas grande ver um quarto cheio dos povos que zumbem, falando sobre trazer estas habilidades para carregar ou construir uma série de dados consolidada, pouco visualização, ou mesmo uma ferramenta pequena,” disse Jon Loyens, oficial principal do produto e co-fundador de Data.World, uma partida nova de Austin. “Cada bit pequeno ajuda e todos aqui realiza aquele.”

O Zika Hackathon reuniu um tipo emergente do cientista, um cientista dos dados. Os cientistas dos dados especializam-se em traduzir a informação de muitas fontes diferentes nos dados que podem ser usados junto e em usar as novas tecnologias por que o conhecimento pode ser extraído dos levantamentos de dados maciços de hoje.

O cientista Juliet Hougland dos dados de Cloudera descreveu o que aquele é: “Há três classes de trabalho que obtêm postas sob o patrocínio da ciência dos dados. Esfrega dos dados -- obtendo dados no formato direito, no lugar direito -- é uma parte enorme de todo o trabalho aonde você está indo fazer algo útil com aquele dados. A analítica investigatório olha dados históricos e fazer análise interessante, útil nela. A analítica operacional apoia os motores da recomendação, os sistemas de detecção da fraude, e o mais.”

Os cabouqueiros de Zika formaram grupos e trabalharam em criar os projectos do programa demonstrativo baseados fora do CDC da amostra e dos outros dados disponíveis nesta relação. Um projecto desenvolveu um modelo de fluxo de trabalho que usasse a aprendizagem de máquina procurarar com as imagens aéreas para associações da água estagnante, caldo de cultivo potencial do tensor para os mosquitos que levam Zika. Uma outra equipe desenvolveu um app móvel com node.js que permitiria que os pesquisadores relatassem casos se tornando da doença mosquito-carregada. Um demonstrou uma maneira de traçar ocorrências da microcefalia em Brasil que usa mapas de um R conecta ao folheto. Outros fizeram o progresso em aprontar dados do CDC de Porto Rico à camada com dados do livro do facto do CIA para uma compreensão mais rica de como Zika progrediu lá.

A parede de David do programador de software do grupo de computação intensivo dos dados de TACC falou de sua pesquisa actual que extrai dados ricos “da literatura cinzenta,” os registros não oficiais que podem ser imagens dentro das limas do pdf, uma amargura de cientistas dos dados. Seu trabalho usa técnicas de processamento de linguagem natural para traçar ocorrências na literatura cinzenta de uma espécie dada tal como peixes em lugar e em tâmaras específicos. O progresso neste problema traduziria bem a obter mais informação para pesquisadores sobre Zika.

“Se você pode ver onde todos os nascentes de água estão e para overlay então como os relatórios das manifestações estão acontecendo, a seguir você pode criar um modelo para como está espalhando e como espalhará no futuro baseado em onde os nascentes de água estão. Então talvez você pode vir acima com alguns planos deslocar que assim o espalhamento não acontece como rápido nem não acontece de todo,” Ari Kahn disse.

O braço caritativo da empresa da analítica dos dados, dos cuidados de Cloudera, junto com TACC e outros sócios locais está planeando guardarar hackathons trimestrais como parte de um projecto de planeamento maior para usar dados grandes para lutar Zika e outras ameaças. Os alvos do projecto para facilitá-lo para que os pesquisadores obtenham respostas e ajudem-nas mesmo a impedir que as manifestações aconteçam.

Source:

University of Texas at Austin, Texas Advanced Computing Center