Aviso: Esta página é uma tradução automática da página original em inglês. Por favor note uma vez que as traduções são geradas por máquinas, não tradução tudo será perfeita. Este site e suas páginas da Web destinam-se a ler em inglês. Qualquer tradução deste site e suas páginas da Web pode ser imprecisas e imprecisos no todo ou em parte. Esta tradução é fornecida como uma conveniência.

O ficheiro do banco de dados de proteína libera a estrutura nova do protease do coronavirus

O ficheiro do banco de dados de proteína, que contem mais de 160.000 estruturas 3D para as proteínas, ADN, e o RNA, este mês liberou uma estrutura nova do protease de Coronavirus que segue a manifestação recente do coronavirus, uma epidemia viral em curso que afeta primeiramente a China continental que ameaça agora espalhar às populações em outras partes do mundo.

A estrutura, o assunto da característica actual do mês do PDB “molécula”, é uma estrutura de cristal de alta resolução 2019-nCoV da hidrolase do coronavirus 3CL (Mpro) como determinada pela equipa de investigação de Zihe Rao e de Haitao Yang na universidade de ShanghaiTech. O lançamento público rápido desta estrutura do protease principal do vírus, conhecido dentro do ficheiro como PDB 6lu7, permitirá a pesquisa sobre este micróbio patogénico humano novo-reconhecido. Mais detalhes do PDB podem ser encontrados aqui.

O ficheiro do PDB é controlado comum pela parceria mundial do banco de dados de proteína, envolvendo centros de dados nos Estados Unidos, Europa e Ásia. As operações dos E.U. são conduzidas pelo banco de dados em Rutgers, o centro de proteína de RCSB do super-computador de San Diego (SDSC) em Uc San Diego, e em Uc San Francisco. Os dados do PDB fornecem um ponto de partida para a descoberta estrutura-guiada da droga.

Tais vírus transformaram-se cada vez mais um perigo à saúde do mundo, dada o aumento no curso global, de acordo com a liberação do PDB. Os formulários particularmente virulentos emergiram de seus anfitriões animais naturais e levantam uma ameaça às comunidades humanas. Em 2003, o vírus (SARS) da Síndrome Respiratória Aguda Grave emergiu em China das populações do bastão, movendo-se para almíscares e finalmente para seres humanos. Dez anos mais tarde, o vírus de MERS igualmente emergiu dos bastões, transferindo no Médio Oriente aos camelos do dromedário e então aos seres humanos.

Quando a entrada a mais atrasada for actualmente a única estrutura do public domain 3D deste coronavirus específico, o ficheiro do PDB igualmente contem estruturas da enzima correspondente de outros coronaviruses. A manifestação 2003 do vírus estreitamente relacionado do SARS conduzido às primeiras estruturas 3D, e hoje lá é mais de 200 estruturas do PDB de proteínas do SARS.

A função segue o formulário na biologia. O acesso aberto aos dados do PDB assegura-se de que o acesso rápido à informação rigorosa validada e perita curated da estrutura 3D contribua amplamente à pesquisa e à educação na biologia, na biomedicina, na bioenergia, e na biotecnologia fundamentais.”

Stephen K. Burley, médico-cientista e director do banco de dados e do membro da faculdade de proteína de RCSB na universidade de Rutgers e no UC San Diego-SDSC

A enzima da hidrolase do coronavirus 3CL (Mpro), igualmente conhecida como o protease principal, é essencial para a maturação proteolytic do vírus. É provavelmente um alvo prometedor para a descoberta das drogas da pequeno-molécula que inibiriam a segmentação do polyprotein viral e impediriam a propagação da infecção.

A comparação da seqüência da proteína 2019-nCoV da hidrolase do coronavirus 3CL (Mpro) contra o ficheiro do PDB identificou 95 proteínas do PDB com pelo menos identidade da seqüência de 90%.

Além disso, estas estruturas relacionadas da proteína contêm aproximadamente 30 inibidores pequenos distintos da molécula, que poderiam guiar a descoberta de drogas novas. Do significado particular para a descoberta da droga é a identidade muito alta da seqüência de ácido aminado (96%) entre 2019-nCoV a hidrolase do coronavirus 3CL (Mpro) e o protease principal do vírus do SARS (PDB 1q2w). Os dados sumários sobre estas estruturas estreitamente relacionadas do PDB estão disponíveis (CSV) para ajudar mais facilmente pesquisadores a encontrar esta informação.

Além, o PDB abriga dados da estrutura 3D para mais de 20 proteínas originais do SARS representadas em mais de 200 estruturas do PDB, incluindo um segundo protease viral, a polimerase de RNA, a proteína viral do ponto, um RNA viral, e outras proteínas (CSV).

De “os proteases principais Coronavirus representam alvos atractivos para a descoberta e a revelação da droga. a informação da estrutura 3D livremente disponível do PDB inclui os produtos químicos pequenos limitados firmemente ao local activo da enzima (a extremidade do negócio do protease principal), confirmando que são alvos druggable,” Burley explicado. “Algumas destas estruturas fornecem pontos de partida para a descoberta estrutura-guiada da droga de inibidores de protease droga-como as propriedades apropriadas para o teste pré-clínico. Nós esperamos que esta estrutura nova, e aquelas do SARS e do MERS, ajudarão pesquisadores e os clínicos endereçam a emergência global da saúde pública do coronavirus 2019-nCoV.”

Bioinformática estrutural reprodutível e evolutiva

Os cientistas enfrentam barreiras demoradas ao aplicar a análise estrutural da bioinformática, incluindo instalações complexas do software, formatos de dados não-interoperáveis, e falta da documentação, tudo que fazem difícil reproduzir resultados e reúso os encanamentos do software. Um desafio mais adicional é o tamanho evergrowing dos conjunto de dados que precisam de ser analisados.

Para endereçar estes desafios, o laboratório estrutural da bioinformática de SDSC, dirigido por Peter Rosa, está desenvolvendo uma série dos componentes de software reusáveis, evolutivos chamados MMTF-PySpark, usando três tecnologias chaves: sua estrutura paralela do tratamento distribuído fornece a computação evolutiva; o formato de transmissão macromolecular (MMTF), uma representação binária e comprimida nova de estruturas macromoleculares, que permita o processamento de capacidade elevada de estruturas do PDB.

“O uso de MMTF-PySpark poderia facilmente barbear fora de um ano de um aluno diplomado ou o trabalho dos postdoc na bioinformática estrutural,” disse Rosa. “Nós depositamos em contribuições da comunidade para desenvolver e compartilhar de um ecossistema de ferramentas interoperáveis.”