Attenzione: questa pagina è una traduzione automatica di questa pagina originariamente in lingua inglese. Si prega di notare in quanto le traduzioni sono generate da macchine, non tutte le traduzioni saranno perfetti. Questo sito web e le sue pagine web sono destinati ad essere letto in inglese. Ogni traduzione del sito e le sue pagine web possono essere imprecise e inesatte, in tutto o in parte. Questa traduzione è fornita per comodità.

I ricercatori sviluppano il nuovo motore di ricerca per studiare le sequenze virali in COVID-19

Dall'inizio del 2020, i laboratori tutt'intorno dal mondo stanno ordinando il materiale dalle prove positive della gente influenzata da COVID-19 e dalle sequenze poi di deposito principalmente a tre punti della raccolta: GenBank, COG-UK e GISAID.

Una prospezione veloce di questo gran quantità dei dati è importante per la comprensione come il genoma del virus sta cambiando.

Per permettere velocemente “a praticare il surfing„ sopra questi dati, il gruppo di ricerca dei Di Milano di Politecnico piombo da prof. Stefano Ceri ha sviluppato ViruSurf, un motore di ricerca che funziona sopra un database centralizzato memorizzato a Politecnico.

Il database periodicamente è ricaricato dalle tre sorgenti ed a partire dall'oggi contiene 200.516 sequenze di SARS-CoV-2, il virus che causano COVID-19 e 33.256 sequenze di altre specie virali anche associate alle epidemie che pregiudicano gli esseri umani, quali il SAR, MERS, Ebola e febbre rompiossa.

Ogni sequenza è descritta da quattro prospettive: le funzionalità biologiche del virus e del host, la tecnologia d'ordinamento, il progetto che ha redatto i dati originali, le mutazioni di intera sequenza dei nucleotidi e degli amminoacidi gene-specifici.

Il vantaggio fornito da ViruSurf è l'uso di un algoritmo per la computazione delle mutazioni virali in modo omogeneo attraverso le sorgenti, facendo uso della computazione della nuvola. Il database è ottimizzato per dare le risposte rapide ai surfisti del motore di ricerca.

Fra gli sviluppi futuri di ViruSurf, il più importante, costituito un fondo per da un progetto lungo sei mese da EIT Digital, è un servizio bio--informatico per l'ingestione delle sequenze virali nuove, che evidenzia la presenza di mutazioni virali connesse con la severità e la virulenza migliorate o diminuite mentre sono scoperte.

Utilizzato in cliniche, specialmente con le pandemie meno acute che si spargono, supporterà l'aggiunta di informazioni critiche alla cartella medica paziente; altri usi saranno possibili nel contesto dell'animale che coltiva o del ciclo alimentare.

Il sistema presto permetterà che il tracciato degli epitopi - sequenze aminoacidiche che sono utilizzati nella progettazione vaccino - per esempio, associ gli epitopi con le mutazioni del virus che potrebbe essere presente in paesi dati del mondo e che potrebbe pregiudicare il vaccino.

“Nel progetto GeCo, finanziato dal consiglio della ricerca europeo, già avevamo sviluppato un motore di ricerca per i gruppi di dati che descrivono il genoma umano, chiamato GenoSurf; all'inizio della pandemia, non c'era tale sistema per le sequenze virali.

Per capire meglio i sui requisiti, abbiamo intervistato circa venti virologi esperti da ogni parte del mondo. Il risultato è un sistema facile da usare: tutto il ricercatore può connettere a ed eseguire le query, per esempio, circa quando una mutazione virale iniziata e come si è sparso nel mondo.„

Stefano Ceri, professore e direttore di progetto, Di Milano di Politecnico

L'articolo è pubblicato su un alto giornale di pertinenza, la ricerca degli acidi nucleici, nell'emissione del database che ogni anno raccoglie le descrizioni dei database biologici più significativi.

Source:
Journal reference:

Canakoglu, A., et al. (2020) ViruSurf: an integrated database to investigate viral sequences. Nucleic Acid Research. doi.org/10.1093/nar/gkaa846.