医学スペースの AI は広範囲人口を渡るパフォーマンスのために注意深くテストされなければなりません

胸部レントゲン (AI)の肺炎を検出するためにトレインした人工知能のツールは外の健康システムに、 Icahn の医科大学院で台紙で行なわれ、機械学習およびヘルスケアの PLOS の薬の特集号で出版された調査に従ってデータでテストされたときパフォーマンスの重要な減少に苦しみました。 これらの調査結果は医学スペースの人工知能が人口の広い範囲を渡るパフォーマンスのために注意深くテストされなければならないことを提案します; さもなければ、深い学習モデルは正確にとして期待どおりに行わないかもしれません。

医用画像処理を分析するために計算機システムフレームワークの使用中の興味が重畳 (CNN)ニューラルネットワークを呼出したおよび計算機援用診断を提供することは育つので、最近の調査は AI の画像の分類が新しいデータに一般化しないかもしれなかったり、また一般に描写しなかったことを提案しました。

シナイ山の Icahn の医科大学院の研究者は AI モデルが 3 人の医療機関を渡る 158,000 の胸部レントゲンの肺炎をどのように識別したか査定しました: 健康のある各国用協会; シナイ山の病院; そしてインディアナ大学システムの病院。 研究者はリサーチの共通発生、臨床重大さおよび流行のための胸部レントゲンの肺炎の診断を調査することを選択しました。

5 つの比較からの 3 つでは、自身のネットワークの外で病院からの X 線の病気の診断の CNNs のパフォーマンスは元の健康システムからの X 線でよりかなり低かったです。 ただし、 CNNs は X 線が正確さの高程度と得られ、トレーニングの施設の肺炎の流行に基づいて予言するタスクでごまかされた病院システムを検出できました。 研究者は薬で深く学習モデルを使用する難しさがイメージ投射の病院そして解像度の品質で使用される CT のスキャンナーの種類のような予言を、運転する特定の変数を識別するために挑戦するそれを作るパラメータの大きい番号を使用することであることが分りました。

「私達の調査結果厳格に実世界の臨床設定のパフォーマンスを査定しないで人工知能のプラットホームの急速な配置を考慮するそれらに」、は言います年長の著者エリック Oermann、 MD のシナイ山の Icahn の医科大学院の神経外科の教官を休止を与えるべきです反射とどこにの配置されているか。 「医学診断を行うためにトレインする深い学習モデルよく一般化できますが患者数および映像技術が施設を渡って」。はかなり異なるのでこれは当然と思うことができません

「CNN システムが医学診断に使用するべきなら注意深く臨床質問を合い、いろいろ実世界のシナリオのために考慮するためにテストされ」、言います最初著者ジョン Zech、シナイ山の Icahn の医科大学院の医学生を正確な診断にどのように影響を与えるか定めるために注意深く査定されなければなりません。

ペーパーのこの研究の造りは計算機視覚そして深い学習手法を、自然言語処理のアルゴリズムを含んで適用するためのフレームワークを置いた、なぜなら CT のための放射線学のレポートの臨床概念を識別することはスキャンしますジャーナル放射線学および性質の薬で今年初めに出版しました。

ソース: https://www.mountsinai.org/

Advertisement