L'AI dans l'espace médical doit être soigneusement vérifiée pour le rendement en travers de la large gamme de populations

Les outils (AI) d'artificial intelligence qualifiés pour trouver la pneumonie sur des radiographies thoraciques ont enregistré des diminutions significatives dans le rendement une fois vérifiés sur des caractéristiques des systèmes de santé extérieurs, selon une étude entreprise à l'École de Médecine d'Icahn à l'affût et publiée dans un numéro spécial de médicament de PLOS sur l'apprentissage automatique et la santé. Ces découvertes proposent que l'artificial intelligence dans l'espace médical doive être soigneusement vérifié pour le rendement en travers d'un large éventail de populations ; autrement, les modèles apprenants profonds peuvent ne pas exécuter aussi exactement que prévu.

Comme intérêt pour l'utilisation des réseaux neuronaux circonvolutionnaires appelés de cadres de système informatique (CNN) d'analyser l'imagerie médicale et de fournir un diagnostic assisté par ordinateur se développe, les études récentes ont proposé que la catégorie d'image d'AI puisse ne pas généraliser aux caractéristiques neuves ainsi que n'ait pas couramment dépeint.

Chercheurs à l'École de Médecine d'Icahn au mont Sinaï évalué comment l'AI modélise la pneumonie recensée dans 158.000 radiographies thoraciques en travers de trois institutions médicales : les instituts de la santé nationaux ; L'hôpital de mont Sinaï ; et centre hospitalier universitaire de l'Indiana. Les chercheurs ont choisi d'étudier le diagnostic de la pneumonie sur des radiographies thoraciques pour son cas courant, signification clinique, et prévalence dans la communauté de la recherche.

Dans trois sur cinq comparaisons, le rendement de CNNs en diagnostiquant les maladies sur des rayons X des hôpitaux à l'extérieur de son propre réseau était sensiblement inférieur que sur des rayons X du système de santé originel. Cependant, CNNs pouvaient trouver le système d'hôpital où un rayon X a été acquis avec un niveau élevé d'exactitude, et triché à leur tâche prévisionnelle basée sur la prévalence de la pneumonie à l'institution de formation. Les chercheurs ont constaté que la difficulté d'employer les modèles apprenants profondément en médicament est qu'ils emploient un numéro massif des paramètres, l'effectuant contestant pour recenser des variables spécifiques pilotant des prévisions, telles que les types de balayeurs de CT utilisés à un hôpital et à la qualité de définition de la représentation.

« Nos découvertes devraient donner la pause à ceux qui considèrent le déploiement rapide des plates-formes d'artificial intelligence sans évaluer rigoureusement leur rendement dans les réglages cliniques du monde réel réfléchi d'où elles sont déployées, » dit l'auteur Éric supérieur Oermann, DM, instructeur en neurochirurgie à l'École de Médecine d'Icahn au mont Sinaï. « Les modèles apprenants profonds qualifiés pour effectuer le diagnostic médical peuvent généraliser bien, mais ceci ne peut pas être pris pour accordé puisque les populations des patients et les techniques d'imagerie diffèrent de manière significative en travers des institutions. »

« Si des systèmes de CNN doivent être employés pour le diagnostic médical, ils doivent être réglés pour considérer soigneusement des questions médicales, être vérifiés pour un grand choix de scénarios du monde réel, et être soigneusement évalués pour déterminer comment ils influencent le diagnostic précis, » dit le premier l'auteur John Zech, un étudiant en médecine à l'École de Médecine d'Icahn au mont Sinaï.

Constructions de ces recherches sur des papiers publiés plus tôt cette année en radiologie de tourillons et médicament de nature, qui ont étendu le cadre pour appliquer la visibilité d'ordinateur et les méthodes d'apprentissage profondes, y compris des algorithmes de traitement du langage naturel, pour recenser des concepts cliniques dans des états de radiologie pour des échographies de CT.

Advertisement