Attenzione: questa pagina è una traduzione automatica di questa pagina originariamente in lingua inglese. Si prega di notare in quanto le traduzioni sono generate da macchine, non tutte le traduzioni saranno perfetti. Questo sito web e le sue pagine web sono destinati ad essere letto in inglese. Ogni traduzione del sito e le sue pagine web possono essere imprecise e inesatte, in tutto o in parte. Questa traduzione è fornita per comodità.

I ricercatori pubblicano i nuovi gruppi di dati per migliorare i modelli di apprendimento automatico del treno per la scoperta della droga

I polimorfi sono molecole che hanno disposizioni molecolari differenti dell'imballaggio malgrado le composizioni chimiche identiche. In un documento recente, i ricercatori a GlaxoSmithKline (GSK) ed il centro dati cristallografico di Cambridge (CCDC) hanno combinato il loro proprietario (GSK) ed hanno pubblicato i gruppi di dati (CCDC) per migliorare i modelli di apprendimento automatico (ML) del treno per predire i polimorfi stabili per utilizzare nei nuovi candidati della droga.

Che cosa sono le differenze chiave fra i gruppi di dati di GSK e di CCDC?

I vicari di CCDC e mantiene il database strutturale di Cambridge (CSD). Per il secolo passato, gli scienziati dappertutto hanno contribuito i sistemi cristallini pubblicati e sperimentali alla CDD, che ora ha oltre 1,1 milione strutture. Gli autori del documento hanno usato un sottoinsieme della droga dalla CDD combinata con le strutture da GSK. Le strutture di GSK sono state raccolte nelle fasi differenti della conduttura farmaceutica e non sono limitate ai prodotti di marketing. Co-author il Dott. Jason Cole, ricercatore senior sul gruppo di ricerca e sviluppo di CCDC, spiegato perché le strutture riunite nelle fasi differenti della conduttura di scoperta della droga sono così importanti.

“Nella scoperta della droga della fase iniziale, un sistema cristallino può contribuire a razionalizzare gli effetti conformazionali, per esempio, o caratterizzi la chimica di nuova entità chimica in cui altre tecniche piombo ad ambiguità,„ Cole ha detto. “Più successivamente nel trattamento, quando una nuova entità chimica è studiata come molecola del candidato, i sistemi cristallini sono critici poichè informano la selezione del modulo e possono più successivamente aiutare nel superamento della formulazione e nel ridurre in pani le emissioni.„

Questi informazioni possono aiutare i ricercatori a dare la priorità ai loro sforzi; il tempo di risparmio e potenzialmente vive giù la strada.

“Capendo un intervallo dei sistemi cristallini, scienziati può anche valutare il rischio di modulo dato essere instabile a lungo termine,„ Cole hanno detto. “Una caratterizzazione completa del paesaggio strutturale piombo a fiducia nel prendere una forma in avanti.„

Come fanno ml modella nella scienza farmaceutica traggono giovamento dai gruppi di dati multipli?

Gli insiemi di dati industriali riflettono più appena la scienza; riflettono le scelte culturali all'interno di un'organizzazione data.

“Troverete soltanto i co-cristalli se cercate i co-cristalli,„ Cole avete detto, come esempio. “La maggior parte delle società preferiscono formulare un libero, o sciolto, droga. Si può supporre che i tipi di strutture in un insieme di industriale riflettono le decisioni coscienti per cercare i moduli dei tipi dati, mentre meno limiti sono collocati sui ricercatori che contribuiscono alla CDD.„

Il ml modella il vantaggio da due cose chiave: volume di dati e specificità di dati. Ecco perché coppia il volume e la varietà di dati nella CDD con gli insiemi di dati privati è così utile.

“Un gran numero di dati piombo alle previsioni più sicure,„ Cole hanno detto. “I dati che sono il più direttamente pertinenti al problema piombo alle previsioni più accurate. Nelle previsioni che usano il software di CCDC, selezioniamo un sottoinsieme delle entrate più pertinenti che è abbastanza grande dare la fiducia. L'insieme di GSK è limitato per avere composti altamente pertinenti ad altri composti nel loro portafoglio commerciale. Così il software del Modellismo può usare questi.„

I ricercatori industriali che lavorano con i dati altamente pertinenti possono imbattersi nelle emissioni quando non hanno abbastanza per generare i modelli sicuri.

“Consideri che il software di CDD selezioni tipicamente intorno due mila strutture dai 1,1 milioni nella CDD,„ Cole ha detto. “L'insieme di industriale è minuscolo tramite il confronto, ma potreste selezionare per esempio 40 o 50 strutture altamente pertinenti. Avreste dati insufficienti per sviluppare un buon modello con quello solo, ma i composti aggiunti dalla CDD completano l'insieme di dati. In pratica, comprendendo gli insiemi di CDD e di GSK otteniamo il meglio di entrambi i mondi: tutte le strutture industriali altamente pertinenti e un insieme delle strutture abbastanza pertinenti di CDD insieme per sviluppare un modello di alta qualità.„

Perché i polimorfi presentano un rischio all'industria farmaceutica?

Le disposizioni differenti dell'imballaggio significano che un polimorfo potrebbe di più essere adatto per la consegna terapeutica, mentre un altro modulo dello stesso composto non potrebbe. Database del sistema cristallino di uso dei ricercatori per fare le previsioni basate sulla conoscenza circa se una nuova droga potenziale è compresa un buon, modulo stabile che i produttori possono fare, memorizzare e consegnare in un modo terapeutico. Gli autori a GSK e a CCDC hanno completato un'analisi robusta di piccoli sistemi cristallini della molecola che contengono i risultati di diffrazione ai raggi X da GSK e le sue società di eredità per i 40 anni scorsi. Poi hanno combinato quei risultati con un sottoinsieme della droga delle strutture dalla CDD di CCDC, che contiene oltre 1,1 milione sistemi cristallini organici e metallorganici della piccolo-molecola dai ricercatori dappertutto.

Source:
Journal reference:

Kalash, L.N., et al. (2021) First global analysis of the GSK database of small molecule crystal structures. CrystEngComm. doi.org/10.1039/D1CE00665G.