必須為在大範圍的性能仔細測試在醫療空間的 AI 人口間

被培訓的 (AI)人工智能工具檢測在胸部 X光的肺炎在數據遭受在性能的重大的減少,當測試外部健康系統,根據在 PLOS 醫學的一個特別問題進行在 Icahn 醫學院在掛接和發布的研究在機器學習和醫療保健的。 這些發現建議必須為在各種各樣的人口間的性能仔細測試在這個醫療空間的人工智能; 否則,深刻的瞭解的設計可能不執行作為準確地正如所料。

因為興趣在使用計算機系統結構上叫旋繞神經網絡 (CNN)分析成像,并且提供一個計算機輔助診斷增長,最近研究建議 AI 圖像分類可能不概括到新的數據以及通常沒有刻畫。

研究員在 Icahn 醫學院在西奈山的估計了 AI 設計如何識別在 158,000 胸部 X光的肺炎在三個醫學機關間: 國家衛生研究所; 西奈山醫院; 并且印第安那大學醫院。 研究員選擇學習肺炎診斷在胸部 X光的其公用出現時間、臨床意義和流行的在研究團體。

在三出於五個比較,在診斷疾病的 CNNs 的性能在從外面醫院的 X-射線其自己的網絡顯著低比在從原始健康系統的 X-射線。 然而, CNNs 能檢測 X-射線獲取與高程度準確性,并且被欺詐在肺炎基礎上的流行的他們的預計任務在培訓機構的醫院系統。 研究員發現使用深深瞭解的設計困難在醫學是他們使用參數的一個大編號,做它挑戰識別驅動預測,例如 CT 掃描程序的種類的特定變量使用在醫院和想像的解決方法質量。

「我們的發現在神經外科學方面應該產生停留認為人工智能平臺的迅速配置的那些,无需嚴謹估計他們的在真實世界的臨床設置的性能反射性他們部署的地方」,說高級作者埃里克 Oermann, MD,講師在 Icahn 醫學院在西奈山的。 「被培訓的深刻的瞭解的設計執行醫療診斷可能很好概括,但是這不可能理當如此,因為患者人數和成像技術在機構間極大有所不同」。

「如果 CNN 系統将為醫療診斷使用,必須剪裁認真考慮臨床問題,為各種各樣真實世界的方案測試和仔細估計他們確定他們如何影響準確診斷」,說第一作者約翰 Zech,一個醫科學生在 Icahn 醫學院在西奈山的。

在文件的此研究編譯在日記帳放射學和本質醫學今年初發布了,放置適用的計算機視覺和深刻的瞭解的技術結構,包括自然語言處理算法,為了識別在放射學報表的臨床概念的 CT 瀏覽。

來源: https://www.mountsinai.org/

Advertisement