Attenzione: questa pagina è una traduzione automatica di questa pagina originariamente in lingua inglese. Si prega di notare in quanto le traduzioni sono generate da macchine, non tutte le traduzioni saranno perfetti. Questo sito web e le sue pagine web sono destinati ad essere letto in inglese. Ogni traduzione del sito e le sue pagine web possono essere imprecise e inesatte, in tutto o in parte. Questa traduzione è fornita per comodità.

Il nuovo supercomputer dato-intensivo può contribuire a combattere la diffusione del virus di Zika

Più di 50 scienziati di dati, ingegneri e studenti di UT Austin si sono riuniti domenica 15 maggio 2016 per usare i grandi dati per combattere la diffusione di Zika per “Austin Zika Hackathon„ agli uffici di Cloudera in città.

Zika, una malattia trasmessa dalle zanzare che può causare la febbre ed i difetti di nascita, minaccia di spargersi negli Stati Uniti. A metà maggio 2016, il Messico aveva riferito 272 casi di Zika, secondo USA Today. Il problema si è sviluppato così grande che Presidente Obama ha invitato $1,9 miliardo per fermare la diffusione di Zika. I centri degli Stati Uniti per controllo di malattie ora sta arrampicandosi la raccolta dei dati che tiene la carreggiata la diffusione di Zika. Ma le grandi lacune esistono nel collegamento dei generi differenti di dati e quella lo rende duro affinchè gli esperti predica dove andrà dopo e che cosa da fare per impedirlo.

I partecipanti di Zika Hackathon hanno studiato i modi riunire insieme gli insiemi dei dati differenti, quali i rapporti di scoppio, le fonti d'acqua stagnanti, le piscine e gli stagni vuoti che sono focolai potenziali della zanzara e le alimentazioni di Twitter e perfino di Facebook. Il centro di elaborazione avanzato il Texas (TACC) pianificazione memorizzare tutti i dati in un posto, un nuovo supercomputer dato-intensivo chiamato Wrangler.

“Stiamo provando a raccogliere questi pezzi disparati di dati e non c' è un buon modo affinchè la gente interrogi a domande a tale proposito i dati--quello è il grande problema,„ ha detto Ari Kahn, coordinatore di traduzione umano di genomica a TACC.

Kahn detto: “Il ruolo di TACC sta fornendo un'infrastruttura e sta consultandosi per supportare questo progetto. Il Wrangler è un sistema dato-intensivo specializzato che esegue una versione ottimizzata di Cloudera e realmente accelera il trattamento.„

Cloudera è una grande società di dati, secondo il suo organizzatore principale Eddie Garcia dell'architetto e di Zika Hackathon di obbligazione. “Che cosa facciamo è rendono Apache Hadoop impresa-pronto affinchè le organizzazioni facciano la grande analisi dei dati di dati e trovare le nuove comprensioni all'interno dei loro insiemi di dati,„ Garcia ha detto.

“Che cosa possiamo fare in un hackathon di un giorno è mettere a fuoco su un problema di dati, per esempio, se ci fosse uno scoppio -- dove noi in primo luogo invieremmo il supporto ed i kit in comunità locali e dirigeremmo i programmi di consapevolezza sulla prevenzione l'eliminazione dell'acqua stagnante o usando le cose repellenti che sono efficaci contro l'Aedes,„ Garcia ha detto. “Lo Zika Hackathon è circa portare la consapevolezza e lo sviluppo della piattaforma che è ripetibile, non appena per l'analisi di dati del virus di Zika. Qualcuno può catturare basicamente che cosa abbiamo fatto oggi qui e lo applica ad un certo altro scoppio sconosciuto o ad una certa altra analisi per qualcosa ancora migliore di che cosa stiamo facendo oggi. È realmente circa ottenere la gente insieme, eccitato, portare la consapevolezza e lo sviluppo fuori della piattaforma che è ripetibile affinchè altre collabori, applicare l'apprendimento automatico ed eseguire l'analisi dei dati facendo uso di Apache Hadoop.„

“È solo grande da vedere una stanza piena della gente che ronza, parlante portando queste abilità per sopportare o sviluppare un insieme di dati consolidato, una poca visualizzazione, o persino un piccolo strumento,„ ha detto Jon Loyens, l'ufficiale principale del prodotto ed il co-fondatore di Data.World, un nuovo avvio di Austin. “Ogni piccolo bit aiuta ed ognuno qui realizza quello.„

Lo Zika Hackathon ha riunito un genere emergente di scienziato, uno scienziato di dati. Gli scienziati di dati si specializzano sia nella traduzione delle informazioni da molte sorgenti differenti nei dati che possono essere usati insieme che nel usando le nuove tecnologie da cui la conoscenza può essere estratta dalle odierne raccolte di dati massicce.

Lo scienziato Juliet Hougland di dati di Cloudera ha descritto che cosa quello è: “Ci sono tre classi di lavoro che ottengono messe sotto l'egida di scienza di dati. Sfregatura di dati -- ottenendo i dati nel giusto formato, nel giusto posto -- è una parte enorme di tutto il processo dove state andando fare qualche cosa di utile con quello dati. L'analisi dei dati investigativa esamina i dati storici e fare l'analisi interessante e utile. L'analisi dei dati operativa supporta i motori di raccomandazione, i sistemi di rilevamento di frode e più.„

I pirati informatici di Zika hanno formato i gruppi ed hanno lavorato a creare i progetti della dimostrazione basati fuori del CDC del campione e di altri dati disponibili a questo collegamento. L'un progetto ha sviluppato un modello di flusso di lavoro del tensore che ha usato l'apprendimento automatico per cercare con le immagini aeree per i raggruppamenti dell'acqua stagnante, focolaio potenziale per le zanzare che portano Zika. Un altro gruppo ha sviluppato un cellulare app con node.js che avrebbe permesso che i ricercatori riferiscano i casi di sviluppo della malattia trasmessa dalle zanzare. Uno ha dimostrato un modo mappare gli avvenimenti di microcefalia nel Brasile facendo uso delle mappe di una R collega all'opuscolo. Un altro hanno trasformato il progresso readying i dati di CDC dal Porto Rico al livello con i dati del libro di fatto di CIA per la comprensione più ricca di come Zika ha progredito là.

Il muro di David degli sviluppatori di software del gruppo di calcolo intensivo dei dati di TACC ha parlato della sua ricerca corrente che estrae i dati ricchi “dalla letteratura grigia,„ registrazioni ufficiose che possono essere immagini dentro i file PDF, un veleno degli scienziati di dati. Il suo lavoro usa le tecniche di trattamento del linguaggio naturale per mappare gli avvenimenti nella letteratura grigia dell'specie date quale il pesce alle posizioni specifiche ed alle date. Il progresso su questo problema tradurrebbe bene a ottenere più informazioni per i ricercatori circa Zika.

“Se potete vedere dove tutte le fonti d'acqua sono e poi ricoprire come i rapporti degli scoppi stanno accadendo, quindi potete creare un modello per come sta spargendosi e come si spargerà in futuro basato su dove le fonti d'acqua sono. Poi forse potete fornire alcune pianificazioni stampare in offset che così la diffusione non accade come veloce o non accade affatto,„ Ari Kahn avete detto.

Il braccio caritatevole della società di analisi dei dati di dati, delle cure di Cloudera, con TACC ed altri partner locali pianificazione tenere i hackathons trimestrali come componente di più grande progetto previsto per usare i grandi dati per combattere Zika ed altre minacce. Gli obiettivi di progetto per renderlo più facile affinchè ricercatori ottengano le risposte e perfino contribuire ad impedire gli scoppi accadere.

Source:

University of Texas at Austin, Texas Advanced Computing Center