Advertencia: Esta página es una traducción de esta página originalmente en inglés. Tenga en cuenta ya que las traducciones son generadas por máquinas, no que todos traducción será perfecto. Este sitio Web y sus páginas están destinadas a leerse en inglés. Cualquier traducción de este sitio Web y su páginas Web puede ser imprecisa e inexacta en su totalidad o en parte. Esta traducción se proporciona como una conveniencia.

Los investigadores publican nuevos grupos de datos para mejorar los modelos del aprendizaje de máquina del tren para el descubrimiento de la droga

Los organismos polimorfos son las moléculas que tienen diversas ordenaciones moleculares del empaque a pesar de las composiciones químicas idénticas. En un papel reciente, los investigadores en GlaxoSmithKline (GSK) y el centro de datos cristalográfico de Cambridge (CCDC) combinaron su propietario (GSK) y publicaron los grupos de datos (CCDC) para mejorar modelos del aprendizaje de máquina (ML) del tren para predecir los organismos polimorfos estables para utilizar en nuevos candidatos de la droga.

¿Cuáles son las diferencias claves entre los grupos de datos de CCDC y de GSK?

Los coadjutores de CCDC y mantienen la base de datos estructural de Cambridge (CSD). Para el último siglo, los científicos por todo el mundo han contribuido las estructuras cristalinas publicadas, experimentales a la CDS, que ahora tiene sobre 1,1 millones de estructuras. Los autores del papel utilizaron un subconjunto de la droga de la CDS combinada con las estructuras de GSK. Las estructuras de GSK cerco en diversos escenarios de la tubería farmacéutica y no se limitan a los productos comercializados. Co-author al Dr. Jason Cole, profesor investigador mayor en las personas de la investigación y desarrollo de CCDC, explicadas porqué las estructuras recolectadas en diversos escenarios de la tubería del descubrimiento de la droga son tan importantes.

“En descubrimiento de la droga del temprano-escenario, una estructura cristalina puede ayudar a racionalizar efectos conformacionales, por ejemplo, o caracterice la química de una nueva entidad química donde otras técnicas han llevado a la ambigüedad,” Cole dijo. “Más adelante en el proceso, cuando una nueva entidad química se estudia como molécula del candidato, las estructuras cristalinas son críticas pues informan a la selección de la forma y pueden ayudar más adelante en vencer la formulación y hacer tabletas entregas.”

Esta información puede ayudar a investigadores a dar prioridad a sus esfuerzos; el tiempo del ahorro y potencialmente vive abajo del camino.

“Entendiendo un alcance de las estructuras cristalinas, científicos puede también fijar el riesgo de una forma dada el ser inestable a largo plazo,” Cole dijo. “Una caracterización completa del paisaje estructural lleva a la confianza en tomar una forma adelante.”

¿Cómo hacen ml modela en ciencia farmacéutica se beneficiaron de grupos de datos múltiples?

Los conjuntos de datos industriales reflejan más que apenas ciencia; reflejan opciones culturales dentro de una organización dada.

“Usted encontrará solamente co-cristales si usted busca co-cristales,” Cole dijo, como un ejemplo. “La mayoría de las compañías prefieren formular un libre, o desatado, droga. Uno puede asumir que los tipos de estructuras en un equipo industrial reflejan decisiones conscientes para explorar para las formas de tipos dados, mientras que menos saltos se ponen en los investigadores que contribuyen a la CDS.”

El ml modela la ventaja a partir de dos cosas dominantes: volumen de los datos y especificidad de los datos. Por eso acoplar el volumen y la variedad de datos en la CDS con los conjuntos de datos propietarios es tan útil.

“Una gran cantidad de datos llevan a predicciones más confiadas,” Cole dijo. Los “datos que son lo más directamente posible relevantes al problema llevan a predicciones más exactas. En las predicciones que utilizan software de CCDC, seleccionamos un subconjunto de los asientos más relevantes que sea bastante grande dar confianza. El equipo de GSK está limitado para tener composiciones altamente relevantes a otras composiciones en su cartera comercial. El software de la construcción de maquetas puede utilizar tan éstos.”

Los investigadores industriales que trabajan con datos altamente relevantes pueden ejecutarse en entregas cuando no tienen suficientes para generar modelos confiados.

“Considere que el software de la CDS escoge típicamente alrededor dos mil estructuras de los 1,1 millones en la CDS,” a Cole dijo. “El equipo industrial es minúsculo por la comparación, pero usted podría escoger, por ejemplo, 40 o 50 estructuras altamente relevantes. Usted tendría datos escasos para construir un buen modelo con eso solo, pero las composiciones adicionales de la CDS complementan el conjunto de datos. Esencialmente, incluyendo los equipos de GSK y de la CDS conseguimos el mejor de ambos mundos: todas las estructuras industriales altamente relevantes y un equipo de estructuras muy relevantes de la CDS junto para construir un modelo de alta calidad.”

¿Por qué los organismos polimorfos presentan un riesgo a la industria farmacéutica?

Las diversas ordenaciones del empaque significan que un organismo polimorfo se pudo adaptar más para el lanzamiento terapéutico, mientras que no pudo otra forma de la misma composición. Los investigadores utilizan bases de datos de la estructura cristalina para hacer predicciones basadas en el conocimiento sobre si una nueva droga potencial está comprendida de una forma buena, estable que los fabricantes puedan hacer, salvar, y entregar de una manera terapéutica. Los autores en GSK y CCDC terminaron un análisis robusto de las estructuras cristalinas de la pequeña molécula que contenían resultados de la difracción de radiografía de GSK y a sus compañías de la herencia por los últimos 40 años. Entonces combinaron esos resultados con un subconjunto de la droga de estructuras de la CDS de CCDC, que contiene sobre 1,1 millones de estructuras cristalinas orgánicas y metalorgánicas de la pequeño-molécula de investigadores por todo el mundo.

Source:
Journal reference:

Kalash, L.N., et al. (2021) First global analysis of the GSK database of small molecule crystal structures. CrystEngComm. doi.org/10.1039/D1CE00665G.