Advertencia: Esta página es una traducción de esta página originalmente en inglés. Tenga en cuenta ya que las traducciones son generadas por máquinas, no que todos traducción será perfecto. Este sitio Web y sus páginas están destinadas a leerse en inglés. Cualquier traducción de este sitio Web y su páginas Web puede ser imprecisa e inexacta en su totalidad o en parte. Esta traducción se proporciona como una conveniencia.

Los investigadores determinan clave de la activación de la DNA usando la inteligencia artificial

Los científicos han sabido de largo que los genes humanos saltan en la acción con instrucciones entregados por la pedido exacta de nuestra DNA, dirigida por los cuatro diversos tipos de eslabones individuales, o “bases,” cifraron A, C, G y el T.

Los casi 25% de nuestros genes se saben extensamente para ser transcritos por las series que se asemejan a TATAAA, que se llama la “caja de TATA.” Cómo se gira, o se asciende el otro tres cuartos, ha seguido habiendo un misterio debido al número enorme de posibilidades de la serie baja de la DNA, que ha mantenido la información de la activación cubierta.

Ahora, con la ayuda de la inteligencia artificial, los investigadores en la Universidad de California San Diego han determinado una clave de la activación de la DNA que se utiliza por lo menos tan con frecuencia como la caja de TATA en seres humanos.

Su descubrimiento, que él llamó la región rio abajo del promotor de la base (DPR), se podría utilizar eventual para controlar la activación del gen en biotecnología y usos biomédicos. Describen a los detalles el 9 de septiembre en la naturaleza del gorrón.

La identificación del DPR revela un paso dominante en la activación alrededor de un cuarto a un tercero de nuestros genes. El DPR ha sido un enigma; ha sido polémico independientemente de si incluso existe en seres humanos. Afortunadamente, hemos podido resolver este rompecabezas usando el aprendizaje de máquina.”

James T. Kadonaga, estudia el autor mayor y al profesor distinguido, división de ciencias biológicas, Universidad de California - San Diego

En 1996, Kadonaga y sus colegas que trabajaban en moscas del vinagre determinaron una serie nueva de la activación del gen, llamada el DPE (que corresponde a una porción del DPR), que permite a genes ser girado en ausencia de la caja de TATA.

Entonces, en 1997, encontraron un único DPE-como serie en seres humanos. Sin embargo, desde entonces, descifrar los detalles y la incidencia del DPE humano ha sido evasivo. Lo más llamativo posible, ha habido solamente dos o el active tres DPE-como series encontró en decenas de miles de los genes humanos.

Para quebrar este caso después de más de 20 años, Kadonaga trabajó con el ngoc largo del Vo del autor importante y del escolar postdoctoral, Cassidy Yunjing Huang, Jack Cassidy, un informático jubilado que ayudaron a las personas a leverage las herramientas potentes de la inteligencia artificial, y Claudia Medrano.

En qué Kadonaga describe como “el cómputo bastante serio” aplicó en un problema biológico, los investigadores hechos un centro común de 500.000 versiones al azar de las series de la DNA y evaluó la actividad de DPR de cada uno. De allí, 200.000 versiones fueron utilizadas para crear un modelo del aprendizaje de máquina que podría predecir exacto actividad de DPR en la DNA humana.

Los resultados, como Kadonaga las describen, eran “absurdo buenos.” Tan bueno, de hecho, que crearon un modelo similar del aprendizaje de máquina como nueva manera de determinar series de la caja de TATA. Evaluaron los modelos nuevos con millares de casos de prueba en los cuales la caja de TATA y los resultados de DPR eran sabidos ya y encontraron que la capacidad profética era “increíble,” según Kadonaga.

Estos resultados revelaron sin obstrucción la existencia del adorno de DPR en genes humanos. Por otra parte, la frecuencia del acontecimiento del DPR aparece ser comparable a la de la caja de TATA. Además, observaron una dualidad intrigante entre el DPR y TATA. Los genes que se activan con series de la caja de TATA faltan series de DPR, y vice versa.

Kadonaga dice que encontrando las seis bases en la serie de la caja de TATA era directo. En 19 bases, quebrar la clave para DPR era mucho más desafiador.

“El DPR no se podría encontrar porque no tiene ninguna configuración sin obstrucción evidente de la serie,” dijo a Kadonaga. “Hay la información ocultada que se cifra en la serie de la DNA que le hace un elemento activo de DPR. El modelo del aprendizaje de máquina puede descifrar esa clave, pero los seres humanos no podemos.”

Yendo adelante, el uso posterior de la inteligencia artificial para analizar configuraciones de la serie de la DNA debe aumentar la capacidad de los investigadores de entender así como controlar la activación del gen en células humanas. Este conocimiento será probablemente útil en biotecnología y en las ciencias biomédicas, dijo a Kadonaga.

“Ese aprendizaje de máquina nos permitió de manera semejante determinar el DPR, él es probable que las aproximaciones relacionadas de la inteligencia artificial fueran útiles para estudiar otros adornos importantes de la serie de la DNA,” dijo a Kadonaga. “Muchas cosas que son inexplicadas podrían ahora ser explicables.”

Source:
Journal reference:

Vo ngoc, L., et al. Identification of the human DPR core promoter element using machine learning. Nature. doi.org/10.1038/s41586-020-2689-7.