特許7097350 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ キュア．エーアイ　テクノロジーズ　プライベート　リミテッドの特許一覧

特許7097350医用画像評価のためのディープラーニングの応用

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2-1
2-2
2-3
3

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-06-29

(45)【発行日】2022-07-07

(54)【発明の名称】医用画像評価のためのディープラーニングの応用

(51)【国際特許分類】

G06T 7/00 20170101AFI20220630BHJP

A61B 6/00 20060101ALI20220630BHJP

【ＦＩ】

G06T7/00 350C

A61B6/00 360Z

A61B6/00 350D

G06T7/00 614

【請求項の数】 13

(21)【出願番号】P 2019507912

(86)(22)【出願日】2019-01-15

(65)【公表番号】

(43)【公表日】2021-03-25

(86)【国際出願番号】 IB2019050317

(87)【国際公開番号】W WO2020099941

(87)【国際公開日】2020-05-22

【審査請求日】2019-05-10

(31)【優先権主張番号】201821042893

(32)【優先日】2018-11-14

(33)【優先権主張国・地域又は機関】IN

(73)【特許権者】

【識別番号】519045491

【氏名又は名称】キュア．エーアイテクノロジーズプライベートリミテッド

(74)【代理人】

【識別番号】100082072

【弁理士】

【氏名又は名称】清原義博

(72)【発明者】

【氏名】プタ，プリータム

(72)【発明者】

【氏名】タデパリ，マノイ

(72)【発明者】

【氏名】レディ，バルガバ

(72)【発明者】

【氏名】ニムマダ，タルン

(72)【発明者】

【氏名】ラオ，プージャ

(72)【発明者】

【氏名】ワリアー，プラシャント

【審査官】永田浩司

(56)【参考文献】

【文献】米国特許出願公開第２０１６／０３５０９１９（ＵＳ，Ａ１）

【文献】Preetham Putha et al.，Can Artificial Intelligence Reliably Report Chest X-Rays?，[online]，2018年07月19日，arXiv:1807.07455v1，https://arxiv.org/abs/1807.07455v1，［２０２１年２月１７日検索］

【文献】Xiaosong Wang et al.，ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases，IEEE Conference on Computer Vision and Pattern Recognition，2017年，No. CVPR，pp. 3462-3471

【文献】Hoo-Chang Shin et al.，Learning to Read Chest X-Rays: Recurrent Neural Cascade Model for Automated Image Annotation，IEEE Conference on Computer Vision and Pattern Recognition，2016年，No. CVPR，pp. 2497-2506

【文献】Mauro Annarumma et al.，Deep metric learning for multi-labelled radiographs，[online]，2017年12月11日，arXiv:1712.07682v1，https://arxiv.org/abs/1712.07682，［２０２１年２月１７日検索］

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ７／００

Ａ６１Ｂ６／００

(57)【特許請求の範囲】

【請求項1】

胸部Ｘ線スキャン画像における医学的異常を検出し、および位置を突き止めるためにディープラーニングシステムを開発する方法であって、該方法は：
自然言語処理（ＮＬＰ）アルゴリズムを使用して、特定の医学的異常に対応する医用スキャン画像を選択する工程；
サイズ変更とタグ固有のデータ拡張により、選択されたスキャン画像を前処理する工程であって、ここでデータ拡張はモデル訓練のためのタグを用いたデータのラベリングであり、タグは医学的異常の所見である、工程；
選択された医用スキャン画像を用いてディープラーニングアルゴリズムを訓練する工程；
多数のモデルの予測を組み合わせることによって、特定の種類の医学的異常の存在／不在を予測する工程であって、複数のモデルは、胸部X線画像を他の身体部分のX線画像から分離するタスクについて事前に訓練されている、工程；
医学的異常の存在が認識される確率に対応するスコアを生成し、および医学的異常の正確な位置と範囲を表すバウンディングボックスを出力する工程；
を含む、方法。

【請求項2】

ディープラーニングアルゴリズムは、畳み込みニューラルネットワークアーキテクチャを含む、請求項１に記載の方法。

【請求項3】

アーキテクチャは、他の身体部分のＸ線画像から胸部Ｘ線画像を選別するタスクによる前訓練によって修正される、請求項２に記載の方法。

【請求項4】

モデルは様々なヒューリスティックスを使用して選択される、請求項１に記載の方法。

【請求項5】

医学的異常は、肋骨横隔膜角の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水を含む、請求項１に記載の方法。

【請求項6】

医学的異常を検出するためのディープラーニングアルゴリズムの精度は、放射線科医の報告と比較することによって検証される、請求項１に記載の方法。

【請求項7】

ディープラーニングアルゴリズムを使用して胸部Ｘ線スキャン画像における医学的異常を検出し、および位置を突き止めるように構成されたシステムであって、システムは、：
自然言語処理（ＮＬＰ）アルゴリズムを使用して、特定の医学的異常に対応する医用スキャン画像を選択する工程；
サイズ変更とタグ固有のデータ拡張により、選択された医用スキャン画像を前処理する工程であって、ここでデータ拡張はモデル訓練のためのタグを用いたデータのラベリングであり、タグは医学的異常の所見である、工程；
選択された医用スキャン画像を用いてディープラーニングアルゴリズムを訓練する工程；
多数のモデルの予測を組み合わせることによって、特定の種類の医学的異常の存在／不在を予測する工程であって、複数のモデルは、胸部X線画像を他の身体部分のX線画像から分離するタスクによって事前に訓練されている、工程；および、
医学的異常の存在が認識される確率に対応するスコアを生成し、および医学的異常の正確な位置と範囲を表すバウンディングボックスを出力する工程；
によって開発される、システム。

【請求項8】

ディープラーニングアルゴリズムは畳み込みニューラルネットワークアーキテクチャを含む、請求項７に記載のシステム。

【請求項9】

アーキテクチャは、他の身体部分のＸ線画像から胸部Ｘ線画像を選別するタスクによる前訓練によって修正される、請求項８に記載のシステム。

【請求項10】

モデルは様々なヒューリスティックスを使用して選択される、請求項７に記載のシステム。

【請求項11】

医学的異常は、肋骨横隔膜角の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水を含む、請求項７に記載のシステム。

【請求項12】

医学的異常の検出に関するディープラーニングアルゴリズムの精度は、放射線科医の報告と比較することによって検証される、請求項７に記載のシステム。

【請求項13】

アルゴリズムは、異常なスキャンの検出に関して０．９３±０．０１のＡＵＣ、および、肋骨横隔膜角の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水それぞれの検出に関して、０．９４±０．０２、０．８８±０．０３、０．９７±０．０２、０．９３±０．０７、０．９３±０．０４、０．８８±０．０５、０．８９±０．０５、０．９３±０．０２、０．９８±０．０２のＡＵＣを達成する、請求項７に記載のシステム。

【発明の詳細な説明】

【技術分野】

【0001】

＜関連出願＞
本出願は、２０１８年１１月１４日に出願されたインド特許出願第２０１８２１０４２８９３号の優先権の利益を主張し、該出願はすべての目的のためにその全体が参照により本明細書に組み込まれる。

【0002】

本開示は概して、画像化または診断と評価のための他の医学的手順から得られた電子化データを処理するための方法とシステムに関する。いくつかの実施形態は、画像化および他の医療データにおける特定の特徴と条件のマシン認識を行なうディープラーニングアルゴリズムの開発のための方法に関する。

【背景技術】

【0003】

コンピュータ断層撮影（ＣＴ）およびＸ線像などの医用画像技術は、診断、臨床研究および治療計画において広く使用される。医用画像評価の有効性、精度およびコスト効果を改善するための自動化されたアプローチがますます求められるようになっている。

【0004】

胸部Ｘ線は、毎年世界的に行なわれる何百万ものスキャンを用いた、最も一般的な放射線医学診断検査の一つである。検査が頻繁に行なわれる一方で、胸部Ｘ線の解釈はより複雑な放射線医学タスクの一つであり、および高度に主観的であることが知られており、解釈者間の一致に関し、解釈者の経験値、検出される異常、および臨床設定に応じてκ値が０．２～０．７７の範囲で変動する。

【0005】

費用が手頃であるため、胸部Ｘ線は、放射線科医がほとんどまたは全くいない地域を含む、世界中で使用される。世界の多くの地域では、デジタル胸部Ｘ線機器のアベイラビリティは、この複雑なタスクを行なうのに十分な高度な訓練を受けた臨床医のアベイラビリティよりも急速に成長している。自動化された検出が、資源の限られた環境に疾患スクリーニングツールとして適用されるならば、人口の健康結果に対する利点は世界的に見て重要であり得る。胸部Ｘ線のそのように使用の一例は、結核スクリーニングであり、ここで専門の解釈者の手による胸部Ｘ線は、結核の早期発見に関して臨床症状よりもより高感度である。

【0006】

過去数年にわたって、医用画像における異常検出を助けるディープラーニングアルゴリズムの使用に対する関心が増してきた。これは、未加工の画像を解釈し、およびその中にある物体を検出するためのマシンの性能の急成長による自然な帰結である。特に胸部Ｘ線においては、様々な異常を検出するためのディープラーニングの使用を記載した一連の研究が存在する（Ｓｈｉｎ，ｅｔａｌ．，ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ，ｐａｇｅｓ２４９７－２５０６，２０１６；Ｒａｊｐｕｒｋａｒ，ｅｔａｌ，ａｒＸｉｖｐｒｅｐｒｉｎｔａｒＸｉｖ：１７１１．０５２２５，２０１７；Ｌｉ，ｅｔａｌ．，ａｒＸｉｖｐｒｅｐｒｉｎｔａｒＸｉｖ：１７１１．０６３７３，２０１７）。これらの大部分は、高品質の大きなデータセットのアベイラビリティの不足によって制限されており、公開された最も大きな研究は、１１２，１２０のＸ線で訓練されたアルゴリズムを記載し、比較的少数が、大部分の胸部Ｘ線を正常であり、かつ異常なＸ線はより珍しいと考えており、特定の異常はさらに稀である。

【発明の概要】

【0007】

本開示は、医用画像から異常を検出して位置を突き止めるように訓練される、完全に自動化されたディープラーニングシステムの開発と臨床的検証を記載する。

【0008】

特定の実施形態は、胸部Ｘ線異常を検出し、および位置を突き止めるための、ディープラーニングシステムの訓練と臨床的検証を提供する。システムは、１２０万のＸ線で訓練されており、および２０００の試験を含む独立したデータセットに対する３人の放射線科医のパネルの多数票に対してそれを試験した。胸部Ｘ線における異常は、非常に小さな病変から肺野の大部分を包含する広範な異常にまで及ぶ。最適なディープラーニングアルゴリズムアーキテクチャは、検出される異常によって異なる；従って、各異常に関して最大限のＡＵＣを有する個別のアルゴリズムを使用するシステムが提供される。

【0009】

特に、実施形態は、胸部Ｘ線スキャンにおける医学的異常を検出し、および位置を突き止めるためのディープラーニングシステムを開発する方法を提供し、該方法は以下を含む：自然言語処理（ＮＬＰ）アルゴリズムを使用して、医用画像スキャンを選択し、および医学的異常を抽出する工程；サイズ変更とタグ固有のデータ拡張により、選択された医用画像スキャンを前処理する工程；選択された医用画像スキャンを用いて、畳み込みニューラルネットワークアーキテクチャを含むディープラーニングアルゴリズムを訓練する工程であって、アーキテクチャは、他の身体部分のＸ線スキャンから胸部Ｘ線を選別するタスクの前訓練によって修正される、工程；多数のモデルの予測を組み合わさることによって特定の種類の医学的異常の存在／不在を予測する工程であって、該モデルは様々なヒューリスティックスを使用して選択される、工程；医学的異常の認識レベルに対応するスコアを生成し、および医学的異常の正確な位置と範囲を表すバウンディングボックスを出力する工程；および、放射線科医の報告と比較することによって、医学的異常の検出に関して、ディープラーニングアルゴリズムの精度を検証する工程。

【0010】

実施形態に従って、前述の医用画像スキャンは、限定されないがＣＴ、Ｘ線、核磁気共鳴映像法（ＭＲＩ）、および超音波処置を含む。胸部Ｘ線スキャンについては、前記医学的異常は、限定されないが、肋骨横隔膜角（ＣＰａｎｇｌｅ）の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水を含む。

【0011】

他の実施形態は、ディープラーニングアルゴリズムによって胸部Ｘ線スキャンにおける医学的異常を検出し、および位置を突き止めるように構成されたシステムを提供し、ディープラーニングアルゴリズムは以下の工程によって開発される：自然言語処理（ＮＬＰ）アルゴリズムを使用して、医用画像スキャンを選択し、および医学的異常を抽出する工程；サイズ変更とタグ固有のデータ拡張により、選択された医用画像スキャンを前処理する工程；選択された医用画像スキャンを用いて畳み込みニューラルネットワークアーキテクチャを含むディープラーニングアルゴリズムを訓練する工程であって、アーキテクチャは、他の身体部分のＸ線スキャンから胸部Ｘ線スキャンを選別するタスクの前訓練によって修正される、工程；多数のモデルの予測を組み合わさることによって特定の種類の医学的異常の存在／不在を予測する工程であって、該モデルは様々なヒューリスティックスを使用して選択される、工程；医学的異常の認識レベルに対応するスコアを生成し、および医学的異常の正確な位置と範囲を表すバウンディングボックスを出力する工程；および、放射線科医の報告と比較することによって、医学的異常の検出に関して、ディープラーニングアルゴリズムの精度を検証する工程。

【0012】

さらに、ディープラーニングアルゴリズムによって胸部Ｘ線スキャンにおける医学的異常を検出し、および位置を突き止めるように構成されたシステムであって、アルゴリズムは、異常なスキャンの検出のための０．９３±０．０１のＡＵＣ、および肋骨横隔膜角の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水をそれぞれ検出するための０．９４±０．０２、０．８８±０．０３、０．９７±０．０２、０．９３±０．０７、０．９３±０．０４、０．８８±０．０５、０．８９±０．０５、０．９３±０．０２、０．９８±０．０２のＡＵＣを達成する。

【0013】

＜本発明の有利な効果＞
胸部Ｘ線異常検出のためのディープラーニングに関する既に発表された研究は、「疾患」の診断と「異常な所見」の検出を区別していない。本発明は、異常な所見の検出、または病歴の予備的知識をもたない専門家によって視覚的に検出可能なＸ線における異常に焦点を置く。これは、異なる疾患有病率パターンと異なる疾患発現を有する地理的環境にわたってシステムを適用可能にする。

【図面の簡単な説明】

【0014】

【図1】胸部Ｘ線の異常を検出するディープラーニングシステムの放射線科医の検証のための研究設計。

【図2-1】全ての異常 vs ３人の放射線科医の多数派に関するＡＵＣ曲線、解釈者の性能がマークされている。

【図2-2】全ての異常 vs ３人の放射線科医の多数派に関するＡＵＣ曲線、解釈者の性能がマークされている。

【図2-3】全ての異常 vs ３人の放射線科医の多数派に関するＡＵＣ曲線、解釈者の性能がマークされている。

【図3】地区ＴＢセンターでの指針のための、ｑＸＲを使用したＴＢ検出のための提案されたワークフロー。

【発明を実施するための形態】

【0015】

本発明が、本明細書に記載される特定の方法、プロトコルおよびシステム等に限定されず、それゆえに変化し得ることを理解すべきである。本明細書に使用される用語は、特定の実施形態のみを記載するためにあり、本発明の範囲を限定するようには意図されておらず、請求項のみによって定義される。

【0016】

本明細書と添付される請求項において使用されるように、別の趣旨に規定されない限り、以下の用語は以下に示される意味を有する。

【0017】

「アーキテクチャ」は、コンピュータシステムの機能、構成および実装を記載する規則と方法のセットを指す。

【0018】

「畳み込みニューラルネットワーク（ＣＮＮ）」は、視覚像を分析するために最も一般的に応用される、ディープフォワード人工ニューラルネットワークのクラスを指す。ＣＮＮは、最小限の前処理を要するように設計された多層のパーセプトロンの一種を使用する。ＣＮＮは、入力層、出力層、および複数の隠れ層から成る。ＣＮＮの隠れ層は、典型的には、畳み込み層、プーリング層、全結合層、およびから正規化層から構成される。畳み込み層は、入力にコンボリューション操作を適用し、その結果を次の層に流す。局所または全体的なプーリング層は、ある層にあるニューロンクラスタの出力を、次の層の単一ニューロン内に結合する。全結合層は、ある層にあるすべてのニューロンを、他の層にあるすべてのニューロンへと連結する。ＣＮＮは、他の画像分類アルゴリズムと比較して、比較的少ない前処理を用いる。これは、従来のアルゴリズムでは手動で操作されていたフィルタをネットワークが学習することを意味する。このように、機能設計において予備知識と人的労力に依存しないことは、主要な利点である。

【0019】

「ヒューリスティックス」は、古典的方法が遅すぎる時に問題をより素早く解決するために、または古典的方法が正確な解を何ら見つけられない時に近似解を見つけるために、設計された技術を指す。これは、最適性、完全性、精度または正確さを速度と引き換えにして達成される。ある意味では、これはショートカットと見なされ得る。ヒューリスティック関数は、単にヒューリスティックとも呼ばれるが、どの分枝に従うかを決定するために有効な情報に基づいて、各分枝工程でサーチアルゴリズムにある選択肢を位する関数である。ヒューリスティックの目的は、手近にある問題を解くために十分適した適当な時間フレームにおいて解を生成することである。この解は、この問題へのすべての解のうち最高のものではないこともあり、または正確な解に近似しているだけの場合もある。

【0020】

「自然言語処理（ＮＬＰ）」は、賢く有用な手段でヒト言語から意味を分析し、理解し、かつ導き出すコンピュータのための手段を指す。ＮＬＰを利用することで、開発者は、自動要約、変換固有表現抽出（ｔｒａｎｓｌａｔｉｏｎｎａｍｅｄｅｎｔｉｔｙｒｅｃｏｇｎｉｔｉｏｎ）、関係抽出、感情分析、音声認識、およびトピックセグメンテーションなどのタスクを行なうために、知識を体系づけ、かつ構造化することができる。

【0021】

本開示は、データドリブン画像評価ワークフローにおける機械学習分析の統合と使用を可能にする様々な技術と構成を例示する。例えば、機械学習分析（特定の医学的状態の、訓練された画像検出モデルなど）は、医用画像研究の一部として生成された医用画像手順データ上で行なわれてもよい。医用画像手順データは、画像診断法によって捕らえられた画像データ、および命令データ（放射線像読み取りのリクエストを示すデータなど）を含んでもよく、それぞれのデータは医用画像評価（放射線科医によって行なわれる放射線解釈、または別の資格のある医学の専門家よる診断評価など）を促すために生成される。

【0022】

例えば、機械学習分析は、訓練した構造、条件、特定の試験の画像内の疾病を識別するために、医用画像手順データから画像を受信し、および処理してもよい。機械学習分析は、緊急または生命に関わる疾病、臨床的に重篤な異常、および他の重要な所見などの、画像内の特定の疾病の自動化検出、指示、または確認に帰結する場合もある。機械学習分析の結果に基づいて、画像に関する医学的評価および関連するイメージング手順を優先させてもよく、またはそうでなければ変更または修正してもよい。さらに、疾病の検出は、医用画像評価（またはそのような医用画像評価からの報告などのデータ項目の生成）の前またはそれと同時に、特定の評価者への医用画像データの割り当て、医用画像データに関する評価プロセス、または他の動作を実行することを助けるために使用されてもよい。

【0023】

さらに本明細書で論じられるように、機械学習分析は、限定されないが、特に人体解剖学の医用画像および解剖表現における特定の種類の疾病に関して画像認識タスクを行なうように訓練されたディープラーニングモデル（ディープマシンラーニング、または階層モデルとしても知られる）を含む、任意の数の機械学習アルゴリズムと訓練モデルのために提供されてもよい。本明細書において使用されるように、用語「機械学習」は、訓練された構造のマシンドリブン式（例えばコンピュータ支援の）識別を行なうことができる様々なクラスの人工知能アルゴリズムおよびアルゴリズムドリブンアプローチを指し、複数レベルの表現と抽象化を使用するそのような機械学習アルゴリズムの複数レベルの動作を指す用語「ディープラーニング」と共に使用される。しかしながら、本記載の医用画像評価に適用され、使用され、および構成される機械学習アルゴリズムの役割は、人工ニューラルネットワーク、学習可能アルゴリズム、訓練可能なオブジェクト分類、および他の人工知能処理技術の変化形体を含む、任意の数の他のアルゴリズムベースのアプローチによって補われ、または置き換えられてもよいことが明らかになるであろう。

【0024】

以下の例のいくつかにおいて、放射線医学医用画像手順（例えばコンピュータ断層撮影（ＣＴ）、核磁気共鳴映像法（ＭＲＩ）、超音波、およびＸ線処置等）と、免許および資格のある放射線科医によって画像評価（例えば放射線解釈）で行なわれるイメージング手順から生成された画像診断評価が参照される。本記載の技術とシステムの適用可能性は、従来の放射線画像診断法を含まないものをも包含する、様々な医学的処置および専門性によって生成された種々様々な画像化データ（および他のデータ表現）にまで拡大されることが理解されるだろう。そのような専門性として、限定されないが、病理学、医学写真術、脳波記録法（ＥＥＧ）および心電図記録法（ＥＫＧ）手順などの医療データ測定、心臓学データ、神経科学データ、前臨床イメージング、および遠隔医療、遠隔病理診断、遠隔診断に関して生じる他のデータ収集手順、および医学的処置と医科学の他の適用があげられる。したがって、本明細書に記載されるデータ認識とワークフロー修正技術の性能は、捕らえられた静止画像およびマルチイメージ（例えばビデオ）表現を含む、様々な医用画像情報のタイプ、設定、および使用事例に適用され得る。

【0025】

以下の記載および図面は特定の実施形態を、それらが当業者にとって実行可能であるように十分に例示する。他の実施形態は、構造的、論理的、電気的、プロセス、および他の変更を組み込み得る。いくつかの実施形態の部分および特徴は、他の実施形態のそれに含まれ、またはそれと取り替えられてもよい。

【実施例】

【0026】

＜実施例１．胸部Ｘ線異常を検出するディープラーニングシステムの放射線科医の検証確認＞

【0027】

１．１方法
１．１．１アルゴリズム開発
１，２００，０００のＸ線と、それらの対応する放射線医学報告が、異常を特定するための畳み込みニューラルネットワーク（ＣＮＮ）を訓練するために使用された。自然言語処理アルゴリズムは、非体系的な放射線医学報告を解析し、かつ胸部Ｘ線にある異常の存在についての情報を抽出するために開発された。抽出されたこれらの所見は、ＣＮＮを訓練する時に標識として使用された。個別ネットワークは、正常なＸ線と、「肋骨横隔膜角（ＣＰａｎｇｌｅ）の鈍化」、「石灰化」、「心臓肥大症」、「空洞形成」、「硬化」、「繊維症」、「肺門の拡張」、「混濁」および「胸水」の胸部Ｘ線所見を特定するために訓練された。表１は、報告から放射性所見を抽出する時に使用された定義を表記する。これらの所見はタグとして言及された。異常が手動で抽出された場合、タグ抽出の精度は１セットの報告に対して測定された。タグ抽出の精度は表２ａで報告される。

【0028】

【表1】

【0029】

【表2】

【0030】

１．１．１．１前処理とデータ拡張
全てのＸ線を、標準的なサイズにサイズ変更し、および１セットの標準正常化を、ソース依存の変形を縮小するために適用した。サイズ変更操作は、もとの画像のダウンサンプリングを含む。ダウンサンプリングは、価値のある可能性のある情報の損失を意味するが、次元の呪いを解消することによりモデルをよりよく訓練するのを助け、およびＡＩの現状によって保証される。付加的に、画像のサイズは、推論の速度に有意に影響を与える。

【0031】

Ｘ線は、ＣＴおよびＭＲＩ等の他の医用画像モダリティのようには標準化されていないという事実を考慮すると、取得、露出、ノイズに使用されるメーカー／モデルにおいて変動性に対してモデルをロバスト性にすることを目的とした多くのタグ固有のデータ拡張が、訓練中に使用される。

【0032】

１．１．１．２アーキテクチャおよび訓練
個々の異常を検出するシステム内の基本ブロックは、ＤｅｎｓｅＮｅｔ（Ｈｕａｎｇ，ｅｔａｌ．，ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥｃｏｎｆｅｒｅｎｃｅｏｎｃｏｍｐｕｔｅｒｖｉｓｉｏｎａｎｄｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎ，ｖｏｌｕｍｅ１，ｐａｇｅ３，２０１７）またはＲｅｓＮｅｔＨｅ，ｅｔａｌ．，ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥｃｏｎｆｅｒｅｎｃｅｏｎｃｏｍｐｕｔｅｒｖｉｓｉｏｎａｎｄｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎ，ｐａｇｅｓ７７０－７７８，２０１６）のいずれかの修正版である。個々の異常検出システムを構築するすべての分類モデルは、一般的なＩｍａｇｅＮｅｔ前訓練ではなく、他の身体部分のＸ線写真から胸部Ｘ線写真を選別するタスクで前訓練される。この工程は、すべてのＸ線から成るスーパーセットの使用を目的としている。ＩｍａｇｅＮｅｔ前訓練と比較すると、一般化性能におけるモデルコンバージェンスとインクリメンタル（増加）の改善が観察された。

【0033】

１．１．１．３モデル集団の使用
アンサンブルは、モデルのセットによって生成された予測を組み合わせることによって一般化性能を改善する単純な手法である。異なる初期条件、アーキテクチャ、およびサンプリング（訓練中に使用される異常の分布）を使用して、特定の異常を検出するために多数のモデルを生成する。これらのモデルのサブセットを様々なヒューリスティックスを使用して選択し、および多数派アンサンブルスキーム（ｍａｊｏｒｉｔｙｅｎｓｅｍｂｌｉｎｇｓｃｈｅｍｅ）を、特定の異常の存在／不在についての決定を行うためにこれらの選択されたモデルの予測を組み合わせるのに使用する。

【0034】

１．２研究設計
１．２．１サンプルサイズおよびＸ線の選択
南インドの２つのＣｏｌｕｍｂｉａＡｓｉａＨｏｓｐｉｔａｌセンターからの外来患者と入院患者の組み合わせを研究に使用した。全てのデータは、この研究での使用前に非特定化された。放射線科医の検証は、２相で行われ、各相につき１０００のＸ線の別個のセットを使用する。サンプルサイズ計算はセクション１．４．１で説明される。両センターからのすべての胸部Ｘ線は以下のようにフィルタリングされた。
１．放射線科医の報告が有効である全てのＰＡ像およびＡＰ像の胸部Ｘ線を選択した。
２．このセットのうち、小児科の患者（≦１４歳）のＸ線、仰臥位でとられたＸ線（病床／携帯用のＸ線）を除外した。

【0035】

１セットの１０００のＸ線（セット１）をこのプールから無作為に選択し、対象の異常を含むＸ線の富化はなかった。第２のセットの１０００のＸ線（セット２）を、同じプール（先に選択された１０００のＸ線を除く）からサンプリングし、そうすると、各異常の少なくとも８０の例が含まれ、可能であれば残りのＸ線は無作為に選択された。Ｘ線放射線医学報告を解析した自然言語処理ツールは、上記で表記された除外を実行し、かつ第２相のためのサンプリングを自動化するために使用された。研究設計は図１に例示される。

【0036】

１．２．２包含および除外基準
立位でとられた歩行可能な成人患者からのＰＡ像とＡＰ像の胸部Ｘ線を研究に含めた。病床または携帯用のＸ線機器からの、１４歳以下の患者からのＸ線、仰臥位でとられたＸ線を除外した。その結果、データセットは、目視可能な静脈内のライン、管、カテーテル、またはＥＣＧリードのあるＸ線、またはペースメーカーなどの医療機器を埋め込まれた患者からのＸ線を含んでいなかった。

【0037】

１．２．３異常の定義
審査を行う放射線科医とアルゴリズムが、異常を定義するための同じ評価基準系に基づいて動作していることを保証するために、以下の動作定義を「正常」および各異常に関して使用した。これらの定義は、アルゴリズム開発段階中に、報告からタグを抽出するために使用され、および検証段階中に放射線科医によって使用された。

【0038】

１．３放射線科医の検証とゴールドスタンダードの生成
１．３．１報告からの異常抽出
Ｘ線に対応するもともとの放射線科医の報告から関連する所見を抽出するために、カスタマイズされたＤｉｃｔｉｏｎａｒｙ－ｂａｓｅｄアプローチを自然言語処理アルゴリズムと組み合わせて使用した。自然言語処理アルゴリズムの精度は、各スキャンに対する一人の専門の解釈者の意見に対して、２０００のスキャンから構成される独立したデータセットに関する非体系的な放射線医学報告から胸部Ｘ線異常を抽出するために定量化された。専門家には、表１のタグ定義、もとの報告書、および胸部Ｘ線が提供され、アルゴリズム出力については盲検化された。

【0039】

１．３．２画像からの異常検出に関するディープラーニングアルゴリズム精度の確認
Ｘ線は、３～１５年間の放射線医学の専門技術を有する、委員会公認の６人の放射線科医（３組）に無作為に分配され、その結果、各Ｘ線は２人の放射線科医によって別個に解釈され、彼らのいずれも最初に報告されたそのＸ線を持っていなかった。第３の解釈は、Ｘ線に添付のもとの放射線医学報告の形態で利用可能であった。カスタムバリデーションポータルを、放射線科医の検証のために使用した。ＤＩＣＯＭファイルは、異常の存在を決定する間、放射線科医が使用するための完全なもとの解として利用可能であった。放射線科医は、個々の異常に関して「存在」または「不在」とマークすることができ、および冒されている領域をマークするためのペンツールを使用することができる。追加のテキストフィールドはフィードバックに有効であった。

【0040】

この研究用のゴールドスタンダードは、３人の放射線科医（遡及的評価のための検証ポータルを使用する２人の放射線科医、および放射線医学報告を使用する１人の放射線科医）の解釈間の、各異常の存在または不在に関する多数派意見であった。異常なＸ線検出、および個々の異常に関するアルゴリズム精度は、このゴールドスタンダードに対して報告される。アルゴリズム出力は、両方のデータセットで生成され、および放射線科医の検証が完了するまで、ロックされたデータベースに置かれた。放射線科医は、検証試験のためにＸ線を審査するときには、もとのＸ線報告とアルゴリズム出力を知らされていなかった。

【0041】

１．４統計的分析
１．４．１サンプルサイズ計算
９５％の信頼区間を用いて感度と特異度を正確に算出することは、集団から無作為にサンプリングされた富化されていないデータセット中のおよそ２０，０００のサンプルサイズを必要とする。セクション１．２．１に詳述されたエンリッチメント戦略を使用した。９０％の精度と９５％の信頼区間を有する８０％の感度を推定するのに必要なサンプルは、９５１である。したがって、２０００のＸ線が、正常／異常というＸ線の分類を評価するのに十分であろう。偽陰性は予備的診断の研究において偽陽性よりも重大であると考えられるため、このサンプルサイズ計算に関する感度を考慮する。

【0042】

異常は、典型的な外来患者の設定では、５％未満の有病率を有している。９５１のＸ線のサンプルサイズは、９５％の信頼区間で８０％の特異度に対し３％の精度を提供するだろう。上記に表記された各特定の疾病に関して有病率が１０％未満であることを考慮すると、各疾病につき少なくとも７７の真の事例が、１０％の精度と９５％の信頼区間を有する８０％の感度を提供するだろう。したがって、１つの疾病につき最低８０の真の事例をセット２に使用した。

【0043】

１．４．２アルゴリズム性能の測定ｖｓ放射線科医
特定の異常に関してＡＵＣを算出する場合、セット１の全体、およびセット２からの異常に関するすべてのＸ線陽性を使用した。
１．感度計算のために、十分に多い数の「異常陽性」事例を使用。
２．正常：異常の比率を自然分布に近い状態に保つ。両セットを組み合わせて使用するのに比べると、これは特異度のより明瞭な推定を可能にする。

【0044】

実際にこれは、各異常を別個に検出する精度を評価する独立した研究を行なうことに等しい。しかしながら、全データセット（ｎ＝２０００）を、異常なＸ線の検出に関するＡＵＣを算出する時に使用した。

【0045】

ＡＵＣ信頼区間は、ＨａｎｌｅｙａｎｄＭｃＮｅｉｌ（Ｒａｄｉｏｌｏｇｙ，１４３（１）：２９－３６，１９８２）によって記載された「分布に基づく」アプローチを使用して算出した。各所見に対するペアになった解釈者間の一致は、合意の割合とコーエンのκ係数を使用して測定された（ＦａｍＭｅｄ，３７（５）：３６０－３６３，２００５）。加えて、各所見に対する３人すべての解釈者（２人の放射線科医ともとの報告）間の一致は、フライスのκ係数を使用して測定された（Ｐｓｙｃｈｏｌｏｇｉｃａｌｂｕｌｌｅｔｉｎ，７６（５）：３７８，１９７１）。解釈者が３つのペアにグループ分けされたため、解釈者間の合意についての報告された各測定値は、３つの推定の平均である。

【0046】

１．３結果
基本的な人口統計、および各異常を含むスキャンの数は表３に概説される。２０００のＸ線のうち６５８のＸ線が、「混濁」、「心臓肥大症」および「石灰化」という、最も頻繁な異常を伴う異常であった。空洞形成の特定において、ディープラーニングシステムの精度を確信をもって算出するための、この異常を含む十分なスキャンはなかった。

【0047】

【表3】

【0048】

報告解析における高精度の達成は、ディープラーニングアルゴリズムを訓練するための多くのＸ線の使用を可能にする助けになった。放射線医学報告からの異常抽出精度と一人の解釈者による手動での抽出は、表２ａで概説される。アルゴリズムは、専門の解釈者に対して、０．９４の感度、１の特異度を有する正常なＸ線報告を検出することができた。報告からの個々の異常の検出については、感度は、胸水に関しては０．９３～、石灰化と空洞形成に関しては～１と異なっていた；特異度は混濁に関しては０．９２～、繊維症に関しては～０．９９であり、異なっていた。

【0049】

１．３．１放射線科医間の一致
解釈者間の一致は表２ｂに記載される。一致は、異常なＸ線の検出において最も高かった（解釈者間の一致は８５％、コーエンのκ０．６、フライスのκ０．５６）。

【0050】

１．３．２アルゴリズムの精度ｖｓ３人の放射線科医の多数派意見
１２の異常の各々を特定するディープラーニングシステムの精度は、表４に表記される。図２は、６人の放射線科医のプールから無作為に得た３人の放射線科医の多数派意見（２人の放射線科医の遡及的再解釈、およびもとの放射線医学報告）に対する、全データセット（ｎ＝２０００）にプロットされた各異常ごとのＡＵＣ曲線を示す。６人の放射線科医ごとの、個々の放射線科医の感度と特異度は各プロット上にマークされる。ほとんどの場合、個々の放射線科医の感度と特異度は、胸水、心臓肥大症および混濁を例外として、ＡＵＣ曲線をわずかに上回り、およびアルゴリズムの性能は、何人かの個体の性能（または放射線科医の感度と特異度）と等しかった。

【0051】

【表4】

【0052】

他のデータセット（Ｑｕｒｅ９０ｋ）は、もとの訓練データセットに寄与しなかったインドの４つのセンターで無作為にサンプリングされる。このデータセットに関する参照標準（グラウンドトゥルース）は、もとの放射線科医報告に自然言語処理（ＮＬＰ）を使用して設定される。１２の異常の各々を特定するディープラーニングシステムの精度は、表５に表記される。

【0053】

【表5】

【0054】

１．４結論
ディープラーニングシステムは、異常なスキャンの検出に関して０．９３（ＣＩ０．９２－０．９４）のＡＵＣ、および、肋骨横隔膜角の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水それぞれの検出に関して、０．９４（０．９２－０．９７）、０．８８（０．８５－０．９１）、０．９７（０．９５－０．９９）、０．９３（０．８５－１）、０．９３（０．８９－０．９６）、０．８８（０．８４－０．９３）、０．８９（０．８４－０．９４）、０．９３（０．９１－０．９５）、０．９８（０．９７－１）のＡＵＣ（ＣＩ）を実証した。

【0055】

この例は、大量の十分に標識されたデータで訓練されたディープラーニングアルゴリズムが、胸部Ｘ線の異常を正確に検出することができることを示す。これらのシステムがより正確になれば、胸部Ｘ線解釈の限界を広げ、およびその有効性を改善するためにそれらを使用する実現可能性が増す。

【0056】

＜実施例２．結核検出のためのディープラーニングソリューションｑＸＲ＞
Ｑｕｒｅ．ａｉｑＸＲは、異常な胸部Ｘ線をスクリーニングし、優先させるように設計されている。アルゴリズムは、１５の最も一般的な胸部Ｘ線異常を自動的に特定する。典型的または異型の肺結核を示唆するこれらの異常のサブセットを、プロダクト内の「結核スクリーニング」アルゴリズムを生成するために組み合わせる。結核スクリーニングアルゴリズムは、微生物学的確認の前に、結核を示唆する異常に関する放射線科医または内科医の胸部Ｘ線のスクリーニングを複製するように意図される。ｑＸＲは、ＣＥ認証された初のＡＩベースの胸部Ｘ線判断ソフトウェアである。ｑＸＲは、ベンダー中立統合過程（ＶｅｎｄｏｒＮｅｕｔｒａｌＩｎｔｅｇｒａｔｉｏｎＰｒｏｃｅｓｓ）により統合され、および任意のＸ線システム（ＣＲまたはＤＲ）から生成されたＸ線と共に機能する。ｑＸＲは結核をスクリーニングし、さらに１５の他の異常を特定し、その結果、患者は自身が患っているかもしれないＴＢではない疾病についての情報を得ることができる。

【0057】

ｑＸＲは、既存の放射線医学ワークフローに干渉せずに、シームレスにベンダー中立アーカイブ（ＶＮＡ）およびＰＡＣＳと統合する。以下を含む結果の表を送達するために、それはＨＩＰＡＡコンプライアントクラウドサーバで展開される：
ａ．各胸部Ｘ線に関して「正常」または「異常」
ｂ．対応する確率スコアを用いてアルゴリズムによって検出された全ての異常のリスト
ｃ．確率スコアを用いて、各Ｘ線に関して、「結核スクリーニング勧告」または「結核スクリーニング陰性」。

【0058】

標準的なイメージングプロトコルを使用して、ｑＸＲは、クライアントＰＡＣＳ／ＶＮＡから対象のＸ線（非特定化）を自動的にアップロードし、およびＨＬ７フォーマットを使用して結果のオーバーレイと対応する報告を返し、ユーザーがもとのＸ線の審査に先立って分析にアクセスできるようにする。この標準プロセスは、２週間にわたる咳などの症状を有する個体、糖尿病および他の免疫無防備の患者が、数秒以内に結核に関するスクリーニングを受け、微生物学的確認（ＮＡＡＴ）を参照し、および陽性であるとわかれば、同日に処置を開始することができる。図３は、地区ＴＢセンターでパイロット用のｑＸＲを使用したＴＢ検出のための提案されたワークフローを示す。

【0059】

展開のための労力には、ＡＰＩを介した現行のＸ線システムとの統合が含まれる。結果は、放射線医学ビューアと矛盾がなく、またはウェブベースのＱｕｒｅビューア上でホストされ得る。自動化された報告は、画像データにおける特定の疾病の特徴の認識レベルに対応するスコアで生成される。表６は自動化報告の例である。

【0060】

【表6】