L'apprendimento automatico e l'intelligenza artificiale mirano a sviluppare gli algoritmi del computer che migliorano con esperienza. Questi algoritmi possono essere usati per aiutare con l'analisi degli insiemi di dati enormi compreso i dati dall'ordinamento genomica.
Credito di immagine: Gorodenkoff/Shutterstock
Metodi di apprendimento automatico
I metodi di apprendimento automatico sono eseguiti in tre fasi. Un ricercatore d'apprendimento sviluppa un algoritmo che sospettano piombo al riuscito apprendimento.
In seguito, l'algoritmo è provveduto di grande raccolta dei dati. I dati comprendono sia i risultati negativi che positivi, in modo dall'algoritmo può imparare distinguere fra i due. I risultati sono conosciuti come contrassegno e l'algoritmo elabora questi e le memorizza come modello.
Infine, i nuovi dati adenoidi sono dati all'algoritmo ed usano il modello per predire i contrassegni per il nuovo insieme dei dati. Se l'apprendimento riuscisse, quindi i contrassegni preveduti per il nuovo insieme dei dati saranno corretti.
Questo metodo si riferisce a come apprendimento sorvegliato e può essere usato per vedere se l'algoritmo può imparare riconoscere un valore specifico da un insieme dei dati.
I metodi d'apprendimento non supervisionati non forniscono l'algoritmo gli esempi contrassegnati all'aiuto che impara ma danno i dati grezzi di algoritmo nella speranza che può trovare una struttura all'interno dell'insieme di dati.
Il ricercatore d'apprendimento deve usare che cosa già sanno circa i dati per sviluppare un modello premonitore e per applicare questa all'algoritmo.
Applicazioni dell'apprendimento automatico alla genetica
Gli algoritmi di apprendimento automatico possono essere usati per analizzare i grandi insiemi dei dati d'ordinamento genomica. Sorvegliato imparare i metodi per l'identificazione del gene richiede l'input delle sequenze contrassegnate del DNA che specificano le posizioni di conclusione e di inizio del gene.
L'algoritmo poi usa questo modello per imparare i beni generali dei geni quali i reticoli d'ordinamento e la posizione dei codoni di arresto.
Dopo questo addestramento, il modello può usare questi beni istruiti per identificare i geni supplementari dai nuovi insiemi di dati che somigliano ai geni nell'insieme di addestramento.
Affinchè gli algoritmi di apprendimento profondi lavorino con successo, le funzioni delle perdite (che indicano quanto accurato una previsione è) e le funzioni di rischio (che indicano la perdita media attraverso l'addestramento fissato) sono usate all'interno del modello per registrare per ottenere le previsioni false dell'algoritmo.
Quando i dati di formazione non sono disponibili, i metodi d'apprendimento non supervisionati sono usati. Un esempio di quando questo può essere necessario è durante l'interpretazione dei dati genomica eterogenei.
La modifica dell'istone, l'accessibilità della cromatina e l'associazione di fattore di trascrizione lungo il genoma possono fornire informazioni per quanto riguarda l'attività del genoma. Questi informazioni possono poi essere usate per creare un insieme dei contrassegni.
Entrambi i metodi possono essere usati per scoprire i geni di interesse e di altre informazioni su un genoma ordinato.
Avanzamenti recenti nella genetica facendo uso dell'apprendimento automatico
L'analisi delle componenti principali (PCA) è un esempio di non supervisionato imparando quale è usata per scoprire la resistenza delle relazioni sconosciute fra le persone.
L'APC cattura una miscela dei genotipi differenti (con dimensionalità molto alta) e produce un riassunto di basso-dimensione che rivela come i genotipi ragruppano.
L'APC precedentemente è stato usato per mostrare come le relazioni fra le persone europee rispecchiano la geografia.
I metodi sorvegliati di apprendimento automatico erano recentemente utilizzati discriminare fra le regioni genomiche che sperimentano depurando la selezione e quelli che non hanno avuti alcun vincolo selettivo. Ciò è stata scoperta facendo uso soltanto dei dati genomica della popolazione.
Questo studio ha scoperto le regioni del candidato del genoma che altamente sono state arricchite nei domini regolatori dei geni che sono importanti per lo sviluppo adeguato del sistema nervoso centrale.
La presenza delle regioni del candidato vicino ad un gene può predire i cambiamenti umano-specifici dell'espressione nel cervello.
Prospettive ed il futuro dell'apprendimento automatico nella genetica
In conclusione, l'apprendimento automatico è un argomento molto complesso e vasto. Gli algoritmi possono essere creati che tengono conto l'analisi molto più precisa dei dati che molti altri metodi che esistono.
Il metodo di apprendimento automatico che è usato dipenderà dalla natura dei dati che sono disponibili e che cosa i ricercatori stanno provando a scoprire.
Più ricerca sull'apprendimento automatico e sull'intelligenza artificiale fornirà i modi più accurati analizzare i dati genomica in futuro, che piombo a più scoperte.
Sorgenti:
Further Reading