Advertencia: Esta página es una traducción de esta página originalmente en inglés. Tenga en cuenta ya que las traducciones son generadas por máquinas, no que todos traducción será perfecto. Este sitio Web y sus páginas están destinadas a leerse en inglés. Cualquier traducción de este sitio Web y su páginas Web puede ser imprecisa e inexacta en su totalidad o en parte. Esta traducción se proporciona como una conveniencia.

El archivo del banco de datos de proteína libera la nueva estructura de la proteasa del coronavirus

El archivo del banco de datos de proteína, que contiene más de 160.000 estructuras 3D para las proteínas, DNA, y ARN, este mes liberó una nueva estructura de la proteasa de Coronavirus que seguía el brote reciente del coronavirus, una epidemia viral en curso que afectaba sobre todo a China continental que ahora amenaza extenderse a las poblaciones en otras partes del mundo.

La estructura, el tema de la característica actual del mes del PDB “molécula”, es una estructura cristalina de alta resolución 2019-nCoV de la hidrolasa del coronavirus 3CL (Mpro) según lo determinado por equipo de investigación de Zihe Rao y de Haitao Yang en la universidad de ShanghaiTech. La baja pública rápida de esta estructura de la proteasa principal del virus, sabida dentro del archivo como PDB 6lu7, habilitará la investigación sobre esto patógeno humano nuevo-reconocido. Más detalles del PDB pueden ser encontrados aquí.

El archivo del PDB es manejado en común por la sociedad mundial del banco de datos de proteína, implicando centros de datos en los Estados Unidos, Europa y Asia. Las operaciones de los E.E.U.U. son llevadas por el banco de datos de proteína de RCSB en Rutgers, el centro del superordenador de San Diego (SDSC) en Uc San Diego, y Uc San Francisco. Los datos del PDB ofrecen un punto de partida para el descubrimiento estructura-conducido de la droga.

Tales virus se han convertido en cada vez más un peligro a la salud del mundo, dada el aumento en viaje global, según la baja del PDB. Determinado las formas virulentas han emergido de sus ordenadores principal animales naturales y plantean una amenaza para las comunidades humanas. En 2003, el virus (SARS) de la neumonía asiática emergió en China de poblaciones del palo, moviéndose a las civetas y finalmente a los seres humanos. Diez años más adelante, el virus de MERS también emergió de los palos, transfiriendo en el Oriente Medio a los camellos del dromedario y entonces a los seres humanos.

Mientras que el último asiento es actualmente la única estructura del public domain 3D de este coronavirus específico, el archivo del PDB también contiene las estructuras de la enzima correspondiente de otros coronaviruses. El brote 2003 del virus estrechamente vinculado del SARS llevado a las primeras estructuras 3D, y allí es hoy más de 200 estructuras del PDB de las proteínas del SARS.

La función sigue la forma en biología. El acceso abierto a los datos del PDB se asegura de que el acceso rápido a la información riguroso validada y experto curated de la estructura 3D contribuya ampliamente a la investigación y a la educación en biología, biomedecina, bioenergía, y biotecnología fundamentales.”

Stephen K. Burley, médico-científico y director del banco y del miembro del profesorado de datos de proteína de RCSB en la universidad de Rutgers y UC San Diego-SDSC

La enzima de la hidrolasa del coronavirus 3CL (Mpro), también conocida como la proteasa principal, es esencial para la maduración proteolítica del virus. Es probablemente un objetivo prometedor para el descubrimiento de las drogas de la pequeño-molécula que inhibirían la hendidura del polyprotein viral y prevendrían la extensión de la infección.

La comparación de la serie de la proteína 2019-nCoV de la hidrolasa del coronavirus 3CL (Mpro) contra el archivo del PDB determinó 95 proteínas del PDB con por lo menos identidad de la serie del 90%.

Además, estas estructuras relacionadas de la proteína contienen aproximadamente 30 pequeños inhibidores distintos de la molécula, que podrían conducir el descubrimiento de nuevas drogas. De la significación determinada para el descubrimiento de la droga es la identidad muy alta de la serie de aminoácido (el 96%) entre 2019-nCoV la hidrolasa del coronavirus 3CL (Mpro) y la proteasa principal del virus del SARS (PDB 1q2w). Los datos sumarios sobre estas estructuras estrechamente vinculadas del PDB están disponibles (CSV) para ayudar a investigadores más fácilmente a encontrar esta información.

Además, el PDB contiene los datos de la estructura 3D para más de 20 proteínas únicas del SARS representadas en más de 200 estructuras del PDB, incluyendo una segunda proteasa viral, la polimerasa de ARN, la proteína viral del pico, un ARN viral, y otras proteínas (CSV).

Las “proteasas principales de Coronavirus representan los objetivos atractivos para el descubrimiento y el revelado de la droga. la información de la estructura 3D disponible del PDB incluye libremente las pequeñas substancias químicas limitadas apretado al sitio de enzimas activas (el extremo del asunto de la proteasa principal), confirmando que son objetivos druggable,” Burley explicado. “Algunas de estas estructuras proveen de los puntos de partida para el descubrimiento estructura-conducido de la droga de los inhibidores de proteasa droga-como las propiedades convenientes para la prueba preclínica. Esperamos que esta nueva estructura, y ésas del SARS y de MERS, ayuden a investigadores y los clínicos dirigen la emergencia global de la salud pública del coronavirus 2019-nCoV.”

Bioinformática estructural reproductiva y escalable

Los científicos hacen frente a barreras que toma tiempo al aplicar análisis estructural de la bioinformática, incluyendo montajes complejos del software, formatos de datos no-interoperables, y la falta de documentación, toda que hagan difícil reproducir resultados y reutilizar tuberías del software. Otro reto es la talla cada vez mayor de los grupos de datos que necesitan ser analizados.

Para dirigir estos retos, el laboratorio estructural de la bioinformática de SDSC, dirigido por Peter Rose, está desarrollando un paquete de componentes de software reutilizables, escalables llamados MMTF-PySpark, usando tres tecnologías dominantes: su marco paralelo del procesamiento distribuido ofrece calcular escalable; el formato de transmisión macromolecular (MMTF), una nueva representación binaria y comprimida de estructuras macromoleculares, que habilita el tramitación de alto rendimiento de las estructuras del PDB.

“El uso de MMTF-PySpark podría afeitar fácilmente de un año de un estudiante de tercer ciclo o el trabajo de los postdoc en bioinformática estructural,” dijo a Rose. “Ejercemos la actividad bancaria en contribuciones de la comunidad para desarrollar y para compartir un ecosistema de herramientas interoperables.”