Il AI nello spazio medico deve essere provato con attenzione a prestazione attraverso vasta gamma delle popolazioni

Gli strumenti di intelligenza (AI) artificiale preparati per individuare la polmonite sulla radiografia del torace hanno sofferto le diminuzioni significative nella prestazione una volta provati sui dati dai sistemi esterni di salubrità, secondo gli studi intrapresi alla scuola di medicina di Icahn al supporto e pubblicati in un numero speciale della medicina di PLOS sull'apprendimento automatico e sulla sanità. Questi risultati suggeriscono che l'intelligenza artificiale nello spazio medico debba essere provata con attenzione a prestazione attraverso una vasta gamma di popolazioni; altrimenti, i modelli d'apprendimento profondi non possono eseguire come esattamente come previsto.

Poichè l'interesse nell'uso delle strutture del sistema informatico ha chiamato le reti neurali dell'avvolgimento (CNN) per analizzare l'imaging biomedico e fornire una diagnosi assistita dall'elaboratore si sviluppa, gli studi recenti hanno suggerito che la classificazione di immagine di AI non potesse generalizzare ai nuovi dati come pure comunemente non ritraesse.

Ricercatori alla scuola di medicina di Icahn al monte Sinai valutato come il AI modella la polmonite identificata in 158.000 radiografie del torace attraverso tre istituti ospedalieri: gli istituti della sanità nazionali; L'ospedale di monte Sinai; ed ospedale di Indiana University. I ricercatori hanno scelto di studiare la diagnosi di polmonite sulla radiografia del torace per il sui avvenimento comune, significato clinico e prevalenza nella comunità di ricerca.

In tre su cinque confronti, la prestazione di CNNs nella diagnostica delle malattie sui raggi x dagli ospedali fuori della sua propria rete era significativamente più bassa di sui raggi x dal sistema originale di salubrità. Tuttavia, CNNs poteva individuare il sistema ospedaliero in cui i raggi x si sono acquistati con un alto livello di accuratezza e sono stati imbrogliati al loro compito premonitore basato sulla prevalenza di polmonite all'istituzione di addestramento. I ricercatori hanno trovato che la difficoltà di utilizzare i modelli in profondità d'apprendimento nella medicina è che usano un numero massiccio dei parametri, facente la che sfida per identificare le variabili specifiche che determinano le previsioni, quali i tipi di scanner di CT utilizzati ad un ospedale ed alla qualità di risoluzione della rappresentazione.

“I nostri risultati dovrebbero dare la pausa a quelle che considerano la distribuzione rapida delle piattaforme di intelligenza artificiale senza rigorosamente valutare la loro prestazione nelle impostazioni cliniche nell'ambiente riflettente di dove stanno spiegandi,„ dice l'autore Eric senior Oermann, il MD, istruttore in neurochirurgia alla scuola di medicina di Icahn al monte Sinai. “I modelli d'apprendimento profondi preparati per eseguire la diagnosi medica possono generalizzare bene, ma questo non può essere catturato per accordato poiché le popolazioni pazienti e le tecniche di rappresentazione differiscono significativamente attraverso le istituzioni.„

“Se i sistemi di CNN devono essere usati per la diagnosi medica, devono essere adattati per considerare con attenzione le domande cliniche, essere provati a vari scenari nell'ambiente ed essere valutati con attenzione per determinare come urtano la diagnosi accurata,„ dicono primo l'autore John Zech, uno studente di medicina alla scuola di medicina di Icahn al monte Sinai.

Configurazioni di questa ricerca sui documenti hanno pubblicato all'inizio di quest'anno nella medicina della radiologia e della natura delle pubblicazioni, che ha steso la struttura per l'applicazione il dispositivo ottico del computer e delle tecniche di apprendimento profonde, compreso gli algoritmi del linguaggio naturale di trattamento, per l'identificazione dei concetti clinici nei rapporti della radiologia per le scansioni di CT.

Sorgente: https://www.mountsinai.org/

Advertisement