(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-29
(45)【発行日】2022-07-07
(54)【発明の名称】医用画像評価のためのディープラーニングの応用
(51)【国際特許分類】
G06T 7/00 20170101AFI20220630BHJP
A61B 6/00 20060101ALI20220630BHJP
【FI】
G06T7/00 350C
A61B6/00 360Z
A61B6/00 350D
G06T7/00 614
(21)【出願番号】P 2019507912
(86)(22)【出願日】2019-01-15
(86)【国際出願番号】 IB2019050317
(87)【国際公開番号】W WO2020099941
(87)【国際公開日】2020-05-22
【審査請求日】2019-05-10
(31)【優先権主張番号】201821042893
(32)【優先日】2018-11-14
(33)【優先権主張国・地域又は機関】IN
(73)【特許権者】
【識別番号】519045491
【氏名又は名称】キュア.エーアイ テクノロジーズ プライベート リミテッド
(74)【代理人】
【識別番号】100082072
【氏名又は名称】清原 義博
(72)【発明者】
【氏名】プタ,プリータム
(72)【発明者】
【氏名】タデパリ,マノイ
(72)【発明者】
【氏名】レディ,バルガバ
(72)【発明者】
【氏名】ニムマダ,タルン
(72)【発明者】
【氏名】ラオ,プージャ
(72)【発明者】
【氏名】ワリアー,プラシャント
【審査官】永田 浩司
(56)【参考文献】
【文献】米国特許出願公開第2016/0350919(US,A1)
【文献】Preetham Putha et al.,Can Artificial Intelligence Reliably Report Chest X-Rays?,[online],2018年07月19日,arXiv:1807.07455v1,https://arxiv.org/abs/1807.07455v1,[2021年2月17日検索]
【文献】Xiaosong Wang et al.,ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases,IEEE Conference on Computer Vision and Pattern Recognition,2017年,No. CVPR,pp. 3462-3471
【文献】Hoo-Chang Shin et al.,Learning to Read Chest X-Rays: Recurrent Neural Cascade Model for Automated Image Annotation,IEEE Conference on Computer Vision and Pattern Recognition,2016年,No. CVPR,pp. 2497-2506
【文献】Mauro Annarumma et al.,Deep metric learning for multi-labelled radiographs,[online],2017年12月11日,arXiv:1712.07682v1,https://arxiv.org/abs/1712.07682,[2021年2月17日検索]
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
A61B 6/00
(57)【特許請求の範囲】
【請求項1】
胸部X線スキャン画像における医学的異常を検出し、および位置を突き止めるためにディープラーニングシステムを開発する方法であって、該方法は:
自然言語処理(NLP)アルゴリズムを使用して、
特定の医学的異常に対応する医用スキャン画像を選択する工程;
サイズ変更とタグ固有のデータ拡張により、選択されたスキャン画像を前処理する工程であって、ここでデータ拡張はモデル訓練のためのタグを用いたデータのラベリングであり、タグは医学的異常の所見である、工程;
選択された医用スキャン画像を用いてディープラーニングアルゴリズムを訓練する工程;
多数のモデルの予測を組み合わせることによって、特定の種類の医学的異常の存在/不在を予測する工程であって、複数のモデルは、胸部X線画像を他の身体部分のX線画像から分離するタスクについて事前に訓練されている、工程;
医学的異常の存在が認識される確率に対応するスコアを生成し、および医学的異常の正確な位置と範囲を表すバウンディングボックスを出力する工程;
を含む、方法。
【請求項2】
ディープラーニングアルゴリズムは、畳み込みニューラルネットワークアーキテクチャを含む、請求項1に記載の方法。
【請求項3】
アーキテクチャは、他の身体部分のX線画像から胸部X線画像を選別するタスクによる前訓練によって修正される、請求項2に記載の方法。
【請求項4】
モデルは様々なヒューリスティックスを使用して選択される、請求項1に記載の方法。
【請求項5】
医学的異常は、肋骨横隔膜角の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水を含む、請求項1に記載の方法。
【請求項6】
医学的異常を検出するためのディープラーニングアルゴリズムの精度は、放射線科医の報告と比較することによって検証される、請求項1に記載の方法。
【請求項7】
ディープラーニングアルゴリズムを使用して胸部X線スキャン画像における医学的異常を検出し、および位置を突き止めるように構成されたシステムであって、システムは、:
自然言語処理(NLP)アルゴリズムを使用して、
特定の医学的異常に対応する医用スキャン画像を選択する工程;
サイズ変更とタグ固有のデータ拡張により、選択された医用スキャン画像を前処理する工程であって、ここでデータ拡張はモデル訓練のためのタグを用いたデータのラベリングであり、タグは医学的異常の所見である、工程;
選択された医用スキャン画像を用いてディープラーニングアルゴリズムを訓練する工程;
多数のモデルの予測を組み合わせることによって、特定の種類の医学的異常の存在/不在を予測する工程であって、複数のモデルは、胸部X線画像を他の身体部分のX線画像から分離するタスクによって事前に訓練されている、工程;および、
医学的異常の存在が認識される確率に対応するスコアを生成し、および医学的異常の正確な位置と範囲を表すバウンディングボックスを出力する工程;
によって開発される、システム。
【請求項8】
ディープラーニングアルゴリズムは畳み込みニューラルネットワークアーキテクチャを含む、請求項7に記載のシステム。
【請求項9】
アーキテクチャは、他の身体部分のX線画像から胸部X線画像を選別するタスクによる前訓練によって修正される、請求項8に記載のシステム。
【請求項10】
モデルは様々なヒューリスティックスを使用して選択される、請求項7に記載のシステム。
【請求項11】
医学的異常は、肋骨横隔膜角の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水を含む、請求項7に記載のシステム。
【請求項12】
医学的異常の検出に関するディープラーニングアルゴリズムの精度は、放射線科医の報告と比較することによって検証される、請求項7に記載のシステム。
【請求項13】
アルゴリズムは、異常なスキャンの検出に関して0.93±0.01のAUC、および、肋骨横隔膜角の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水それぞれの検出に関して、0.94±0.02、0.88±0.03、0.97±0.02、0.93±0.07、0.93±0.04、0.88±0.05、0.89±0.05、0.93±0.02、0.98±0.02のAUCを達成する、請求項7に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
<関連出願>
本出願は、2018年11月14日に出願されたインド特許出願第201821042893号の優先権の利益を主張し、該出願はすべての目的のためにその全体が参照により本明細書に組み込まれる。
【0002】
本開示は概して、画像化または診断と評価のための他の医学的手順から得られた電子化データを処理するための方法とシステムに関する。いくつかの実施形態は、画像化および他の医療データにおける特定の特徴と条件のマシン認識を行なうディープラーニングアルゴリズムの開発のための方法に関する。
【背景技術】
【0003】
コンピュータ断層撮影(CT)およびX線像などの医用画像技術は、診断、臨床研究および治療計画において広く使用される。医用画像評価の有効性、精度およびコスト効果を改善するための自動化されたアプローチがますます求められるようになっている。
【0004】
胸部X線は、毎年世界的に行なわれる何百万ものスキャンを用いた、最も一般的な放射線医学診断検査の一つである。検査が頻繁に行なわれる一方で、胸部X線の解釈はより複雑な放射線医学タスクの一つであり、および高度に主観的であることが知られており、解釈者間の一致に関し、解釈者の経験値、検出される異常、および臨床設定に応じてκ値が0.2~0.77の範囲で変動する。
【0005】
費用が手頃であるため、胸部X線は、放射線科医がほとんどまたは全くいない地域を含む、世界中で使用される。世界の多くの地域では、デジタル胸部X線機器のアベイラビリティは、この複雑なタスクを行なうのに十分な高度な訓練を受けた臨床医のアベイラビリティよりも急速に成長している。自動化された検出が、資源の限られた環境に疾患スクリーニングツールとして適用されるならば、人口の健康結果に対する利点は世界的に見て重要であり得る。胸部X線のそのように使用の一例は、結核スクリーニングであり、ここで専門の解釈者の手による胸部X線は、結核の早期発見に関して臨床症状よりもより高感度である。
【0006】
過去数年にわたって、医用画像における異常検出を助けるディープラーニングアルゴリズムの使用に対する関心が増してきた。これは、未加工の画像を解釈し、およびその中にある物体を検出するためのマシンの性能の急成長による自然な帰結である。特に胸部X線においては、様々な異常を検出するためのディープラーニングの使用を記載した一連の研究が存在する(Shin,et al.,Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,pages2497-2506,2016;Rajpurkar,et al,arXiv preprint arXiv:1711.05225,2017;Li,et al.,arXiv preprint arXiv:1711.06373,2017)。これらの大部分は、高品質の大きなデータセットのアベイラビリティの不足によって制限されており、公開された最も大きな研究は、112,120のX線で訓練されたアルゴリズムを記載し、比較的少数が、大部分の胸部X線を正常であり、かつ異常なX線はより珍しいと考えており、特定の異常はさらに稀である。
【発明の概要】
【0007】
本開示は、医用画像から異常を検出して位置を突き止めるように訓練される、完全に自動化されたディープラーニングシステムの開発と臨床的検証を記載する。
【0008】
特定の実施形態は、胸部X線異常を検出し、および位置を突き止めるための、ディープラーニングシステムの訓練と臨床的検証を提供する。システムは、120万のX線で訓練されており、および2000の試験を含む独立したデータセットに対する3人の放射線科医のパネルの多数票に対してそれを試験した。胸部X線における異常は、非常に小さな病変から肺野の大部分を包含する広範な異常にまで及ぶ。最適なディープラーニングアルゴリズムアーキテクチャは、検出される異常によって異なる;従って、各異常に関して最大限のAUCを有する個別のアルゴリズムを使用するシステムが提供される。
【0009】
特に、実施形態は、胸部X線スキャンにおける医学的異常を検出し、および位置を突き止めるためのディープラーニングシステムを開発する方法を提供し、該方法は以下を含む:自然言語処理(NLP)アルゴリズムを使用して、医用画像スキャンを選択し、および医学的異常を抽出する工程;サイズ変更とタグ固有のデータ拡張により、選択された医用画像スキャンを前処理する工程;選択された医用画像スキャンを用いて、畳み込みニューラルネットワークアーキテクチャを含むディープラーニングアルゴリズムを訓練する工程であって、アーキテクチャは、他の身体部分のX線スキャンから胸部X線を選別するタスクの前訓練によって修正される、工程;多数のモデルの予測を組み合わさることによって特定の種類の医学的異常の存在/不在を予測する工程であって、該モデルは様々なヒューリスティックスを使用して選択される、工程;医学的異常の認識レベルに対応するスコアを生成し、および医学的異常の正確な位置と範囲を表すバウンディングボックスを出力する工程;および、放射線科医の報告と比較することによって、医学的異常の検出に関して、ディープラーニングアルゴリズムの精度を検証する工程。
【0010】
実施形態に従って、前述の医用画像スキャンは、限定されないがCT、X線、核磁気共鳴映像法(MRI)、および超音波処置を含む。胸部X線スキャンについては、前記医学的異常は、限定されないが、肋骨横隔膜角(CP angle)の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水を含む。
【0011】
他の実施形態は、ディープラーニングアルゴリズムによって胸部X線スキャンにおける医学的異常を検出し、および位置を突き止めるように構成されたシステムを提供し、ディープラーニングアルゴリズムは以下の工程によって開発される:自然言語処理(NLP)アルゴリズムを使用して、医用画像スキャンを選択し、および医学的異常を抽出する工程;サイズ変更とタグ固有のデータ拡張により、選択された医用画像スキャンを前処理する工程;選択された医用画像スキャンを用いて畳み込みニューラルネットワークアーキテクチャを含むディープラーニングアルゴリズムを訓練する工程であって、アーキテクチャは、他の身体部分のX線スキャンから胸部X線スキャンを選別するタスクの前訓練によって修正される、工程;多数のモデルの予測を組み合わさることによって特定の種類の医学的異常の存在/不在を予測する工程であって、該モデルは様々なヒューリスティックスを使用して選択される、工程;医学的異常の認識レベルに対応するスコアを生成し、および医学的異常の正確な位置と範囲を表すバウンディングボックスを出力する工程;および、放射線科医の報告と比較することによって、医学的異常の検出に関して、ディープラーニングアルゴリズムの精度を検証する工程。
【0012】
さらに、ディープラーニングアルゴリズムによって胸部X線スキャンにおける医学的異常を検出し、および位置を突き止めるように構成されたシステムであって、アルゴリズムは、異常なスキャンの検出のための0.93±0.01のAUC、および肋骨横隔膜角の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水をそれぞれ検出するための0.94±0.02、0.88±0.03、0.97±0.02、0.93±0.07、0.93±0.04、0.88±0.05、0.89±0.05、0.93±0.02、0.98±0.02のAUCを達成する。
【0013】
<本発明の有利な効果>
胸部X線異常検出のためのディープラーニングに関する既に発表された研究は、「疾患」の診断と「異常な所見」の検出を区別していない。本発明は、異常な所見の検出、または病歴の予備的知識をもたない専門家によって視覚的に検出可能なX線における異常に焦点を置く。これは、異なる疾患有病率パターンと異なる疾患発現を有する地理的環境にわたってシステムを適用可能にする。
【図面の簡単な説明】
【0014】
【
図1】胸部X線の異常を検出するディープラーニングシステムの放射線科医の検証のための研究設計。
【
図2-1】全ての異常 vs 3人の放射線科医の多数派に関するAUC曲線、解釈者の性能がマークされている。
【
図2-2】全ての異常 vs 3人の放射線科医の多数派に関するAUC曲線、解釈者の性能がマークされている。
【
図2-3】全ての異常 vs 3人の放射線科医の多数派に関するAUC曲線、解釈者の性能がマークされている。
【
図3】地区TBセンターでの指針のための、qXRを使用したTB検出のための提案されたワークフロー。
【発明を実施するための形態】
【0015】
本発明が、本明細書に記載される特定の方法、プロトコルおよびシステム等に限定されず、それゆえに変化し得ることを理解すべきである。本明細書に使用される用語は、特定の実施形態のみを記載するためにあり、本発明の範囲を限定するようには意図されておらず、請求項のみによって定義される。
【0016】
本明細書と添付される請求項において使用されるように、別の趣旨に規定されない限り、以下の用語は以下に示される意味を有する。
【0017】
「アーキテクチャ」は、コンピュータシステムの機能、構成および実装を記載する規則と方法のセットを指す。
【0018】
「畳み込みニューラルネットワーク(CNN)」は、視覚像を分析するために最も一般的に応用される、ディープフォワード人工ニューラルネットワークのクラスを指す。CNNは、最小限の前処理を要するように設計された多層のパーセプトロンの一種を使用する。CNNは、入力層、出力層、および複数の隠れ層から成る。CNNの隠れ層は、典型的には、畳み込み層、プーリング層、全結合層、およびから正規化層から構成される。畳み込み層は、入力にコンボリューション操作を適用し、その結果を次の層に流す。局所または全体的なプーリング層は、ある層にあるニューロンクラスタの出力を、次の層の単一ニューロン内に結合する。全結合層は、ある層にあるすべてのニューロンを、他の層にあるすべてのニューロンへと連結する。CNNは、他の画像分類アルゴリズムと比較して、比較的少ない前処理を用いる。これは、従来のアルゴリズムでは手動で操作されていたフィルタをネットワークが学習することを意味する。このように、機能設計において予備知識と人的労力に依存しないことは、主要な利点である。
【0019】
「ヒューリスティックス」は、古典的方法が遅すぎる時に問題をより素早く解決するために、または古典的方法が正確な解を何ら見つけられない時に近似解を見つけるために、設計された技術を指す。これは、最適性、完全性、精度または正確さを速度と引き換えにして達成される。ある意味では、これはショートカットと見なされ得る。ヒューリスティック関数は、単にヒューリスティックとも呼ばれるが、どの分枝に従うかを決定するために有効な情報に基づいて、各分枝工程でサーチアルゴリズムにある選択肢を位する関数である。ヒューリスティックの目的は、手近にある問題を解くために十分適した適当な時間フレームにおいて解を生成することである。この解は、この問題へのすべての解のうち最高のものではないこともあり、または正確な解に近似しているだけの場合もある。
【0020】
「自然言語処理(NLP)」は、賢く有用な手段でヒト言語から意味を分析し、理解し、かつ導き出すコンピュータのための手段を指す。NLPを利用することで、開発者は、自動要約、変換固有表現抽出(translation named entity recognition)、関係抽出、感情分析、音声認識、およびトピックセグメンテーションなどのタスクを行なうために、知識を体系づけ、かつ構造化することができる。
【0021】
本開示は、データドリブン画像評価ワークフローにおける機械学習分析の統合と使用を可能にする様々な技術と構成を例示する。例えば、機械学習分析(特定の医学的状態の、訓練された画像検出モデルなど)は、医用画像研究の一部として生成された医用画像手順データ上で行なわれてもよい。医用画像手順データは、画像診断法によって捕らえられた画像データ、および命令データ(放射線像読み取りのリクエストを示すデータなど)を含んでもよく、それぞれのデータは医用画像評価(放射線科医によって行なわれる放射線解釈、または別の資格のある医学の専門家よる診断評価など)を促すために生成される。
【0022】
例えば、機械学習分析は、訓練した構造、条件、特定の試験の画像内の疾病を識別するために、医用画像手順データから画像を受信し、および処理してもよい。機械学習分析は、緊急または生命に関わる疾病、臨床的に重篤な異常、および他の重要な所見などの、画像内の特定の疾病の自動化検出、指示、または確認に帰結する場合もある。機械学習分析の結果に基づいて、画像に関する医学的評価および関連するイメージング手順を優先させてもよく、またはそうでなければ変更または修正してもよい。さらに、疾病の検出は、医用画像評価(またはそのような医用画像評価からの報告などのデータ項目の生成)の前またはそれと同時に、特定の評価者への医用画像データの割り当て、医用画像データに関する評価プロセス、または他の動作を実行することを助けるために使用されてもよい。
【0023】
さらに本明細書で論じられるように、機械学習分析は、限定されないが、特に人体解剖学の医用画像および解剖表現における特定の種類の疾病に関して画像認識タスクを行なうように訓練されたディープラーニングモデル(ディープマシンラーニング、または階層モデルとしても知られる)を含む、任意の数の機械学習アルゴリズムと訓練モデルのために提供されてもよい。本明細書において使用されるように、用語「機械学習」は、訓練された構造のマシンドリブン式(例えばコンピュータ支援の)識別を行なうことができる様々なクラスの人工知能アルゴリズムおよびアルゴリズムドリブンアプローチを指し、複数レベルの表現と抽象化を使用するそのような機械学習アルゴリズムの複数レベルの動作を指す用語「ディープラーニング」と共に使用される。しかしながら、本記載の医用画像評価に適用され、使用され、および構成される機械学習アルゴリズムの役割は、人工ニューラルネットワーク、学習可能アルゴリズム、訓練可能なオブジェクト分類、および他の人工知能処理技術の変化形体を含む、任意の数の他のアルゴリズムベースのアプローチによって補われ、または置き換えられてもよいことが明らかになるであろう。
【0024】
以下の例のいくつかにおいて、放射線医学医用画像手順(例えばコンピュータ断層撮影(CT)、核磁気共鳴映像法(MRI)、超音波、およびX線処置等)と、免許および資格のある放射線科医によって画像評価(例えば放射線解釈)で行なわれるイメージング手順から生成された画像診断評価が参照される。本記載の技術とシステムの適用可能性は、従来の放射線画像診断法を含まないものをも包含する、様々な医学的処置および専門性によって生成された種々様々な画像化データ(および他のデータ表現)にまで拡大されることが理解されるだろう。そのような専門性として、限定されないが、病理学、医学写真術、脳波記録法(EEG)および心電図記録法(EKG)手順などの医療データ測定、心臓学データ、神経科学データ、前臨床イメージング、および遠隔医療、遠隔病理診断、遠隔診断に関して生じる他のデータ収集手順、および医学的処置と医科学の他の適用があげられる。したがって、本明細書に記載されるデータ認識とワークフロー修正技術の性能は、捕らえられた静止画像およびマルチイメージ(例えばビデオ)表現を含む、様々な医用画像情報のタイプ、設定、および使用事例に適用され得る。
【0025】
以下の記載および図面は特定の実施形態を、それらが当業者にとって実行可能であるように十分に例示する。他の実施形態は、構造的、論理的、電気的、プロセス、および他の変更を組み込み得る。いくつかの実施形態の部分および特徴は、他の実施形態のそれに含まれ、またはそれと取り替えられてもよい。
【実施例】
【0026】
<実施例1.胸部X線異常を検出するディープラーニングシステムの放射線科医の検証確認>
【0027】
1.1 方法
1.1.1 アルゴリズム開発
1,200,000のX線と、それらの対応する放射線医学報告が、異常を特定するための畳み込みニューラルネットワーク(CNN)を訓練するために使用された。自然言語処理アルゴリズムは、非体系的な放射線医学報告を解析し、かつ胸部X線にある異常の存在についての情報を抽出するために開発された。抽出されたこれらの所見は、CNNを訓練する時に標識として使用された。個別ネットワークは、正常なX線と、「肋骨横隔膜角(CP angle)の鈍化」、「石灰化」、「心臓肥大症」、「空洞形成」、「硬化」、「繊維症」、「肺門の拡張」、「混濁」および「胸水」の胸部X線所見を特定するために訓練された。表1は、報告から放射性所見を抽出する時に使用された定義を表記する。これらの所見はタグとして言及された。異常が手動で抽出された場合、タグ抽出の精度は1セットの報告に対して測定された。タグ抽出の精度は表2aで報告される。
【0028】
【0029】
【0030】
1.1.1.1 前処理とデータ拡張
全てのX線を、標準的なサイズにサイズ変更し、および1セットの標準正常化を、ソース依存の変形を縮小するために適用した。サイズ変更操作は、もとの画像のダウンサンプリングを含む。ダウンサンプリングは、価値のある可能性のある情報の損失を意味するが、次元の呪いを解消することによりモデルをよりよく訓練するのを助け、およびAIの現状によって保証される。付加的に、画像のサイズは、推論の速度に有意に影響を与える。
【0031】
X線は、CTおよびMRI等の他の医用画像モダリティのようには標準化されていないという事実を考慮すると、取得、露出、ノイズに使用されるメーカー/モデルにおいて変動性に対してモデルをロバスト性にすることを目的とした多くのタグ固有のデータ拡張が、訓練中に使用される。
【0032】
1.1.1.2 アーキテクチャおよび訓練
個々の異常を検出するシステム内の基本ブロックは、DenseNet(Huang,et al.,Proceedings of the IEEE conference on computer vision and pattern recognition,volume 1,page3,2017)またはResNetHe,et al.,Proceedings of the IEEE conference on computer vision and pattern recognition,pages770-778,2016)のいずれかの修正版である。個々の異常検出システムを構築するすべての分類モデルは、一般的なImageNet前訓練ではなく、他の身体部分のX線写真から胸部X線写真を選別するタスクで前訓練される。この工程は、すべてのX線から成るスーパーセットの使用を目的としている。ImageNet前訓練と比較すると、一般化性能におけるモデルコンバージェンスとインクリメンタル(増加)の改善が観察された。
【0033】
1.1.1.3 モデル集団の使用
アンサンブルは、モデルのセットによって生成された予測を組み合わせることによって一般化性能を改善する単純な手法である。異なる初期条件、アーキテクチャ、およびサンプリング(訓練中に使用される異常の分布)を使用して、特定の異常を検出するために多数のモデルを生成する。これらのモデルのサブセットを様々なヒューリスティックスを使用して選択し、および多数派アンサンブルスキーム(majority ensembling scheme)を、特定の異常の存在/不在についての決定を行うためにこれらの選択されたモデルの予測を組み合わせるのに使用する。
【0034】
1.2 研究設計
1.2.1 サンプルサイズおよびX線の選択
南インドの2つのColumbia Asia Hospitalセンターからの外来患者と入院患者の組み合わせを研究に使用した。全てのデータは、この研究での使用前に非特定化された。放射線科医の検証は、2相で行われ、各相につき1000のX線の別個のセットを使用する。サンプルサイズ計算はセクション1.4.1で説明される。両センターからのすべての胸部X線は以下のようにフィルタリングされた。
1.放射線科医の報告が有効である全てのPA像およびAP像の胸部X線を選択した。
2.このセットのうち、小児科の患者(≦14歳)のX線、仰臥位でとられたX線(病床/携帯用のX線)を除外した。
【0035】
1セットの1000のX線(セット1)をこのプールから無作為に選択し、対象の異常を含むX線の富化はなかった。第2のセットの1000のX線(セット2)を、同じプール(先に選択された1000のX線を除く)からサンプリングし、そうすると、各異常の少なくとも80の例が含まれ、可能であれば残りのX線は無作為に選択された。X線放射線医学報告を解析した自然言語処理ツールは、上記で表記された除外を実行し、かつ第2相のためのサンプリングを自動化するために使用された。研究設計は
図1に例示される。
【0036】
1.2.2 包含および除外基準
立位でとられた歩行可能な成人患者からのPA像とAP像の胸部X線を研究に含めた。病床または携帯用のX線機器からの、14歳以下の患者からのX線、仰臥位でとられたX線を除外した。その結果、データセットは、目視可能な静脈内のライン、管、カテーテル、またはECGリードのあるX線、またはペースメーカーなどの医療機器を埋め込まれた患者からのX線を含んでいなかった。
【0037】
1.2.3 異常の定義
審査を行う放射線科医とアルゴリズムが、異常を定義するための同じ評価基準系に基づいて動作していることを保証するために、以下の動作定義を「正常」および各異常に関して使用した。これらの定義は、アルゴリズム開発段階中に、報告からタグを抽出するために使用され、および検証段階中に放射線科医によって使用された。
【0038】
1.3 放射線科医の検証とゴールドスタンダードの生成
1.3.1 報告からの異常抽出
X線に対応するもともとの放射線科医の報告から関連する所見を抽出するために、カスタマイズされたDictionary-basedアプローチを自然言語処理アルゴリズムと組み合わせて使用した。自然言語処理アルゴリズムの精度は、各スキャンに対する一人の専門の解釈者の意見に対して、2000のスキャンから構成される独立したデータセットに関する非体系的な放射線医学報告から胸部X線異常を抽出するために定量化された。専門家には、表1のタグ定義、もとの報告書、および胸部X線が提供され、アルゴリズム出力については盲検化された。
【0039】
1.3.2 画像からの異常検出に関するディープラーニングアルゴリズム精度の確認
X線は、3~15年間の放射線医学の専門技術を有する、委員会公認の6人の放射線科医(3組)に無作為に分配され、その結果、各X線は2人の放射線科医によって別個に解釈され、彼らのいずれも最初に報告されたそのX線を持っていなかった。第3の解釈は、X線に添付のもとの放射線医学報告の形態で利用可能であった。カスタムバリデーションポータルを、放射線科医の検証のために使用した。DICOMファイルは、異常の存在を決定する間、放射線科医が使用するための完全なもとの解として利用可能であった。放射線科医は、個々の異常に関して「存在」または「不在」とマークすることができ、および冒されている領域をマークするためのペンツールを使用することができる。追加のテキストフィールドはフィードバックに有効であった。
【0040】
この研究用のゴールドスタンダードは、3人の放射線科医(遡及的評価のための検証ポータルを使用する2人の放射線科医、および放射線医学報告を使用する1人の放射線科医)の解釈間の、各異常の存在または不在に関する多数派意見であった。異常なX線検出、および個々の異常に関するアルゴリズム精度は、このゴールドスタンダードに対して報告される。アルゴリズム出力は、両方のデータセットで生成され、および放射線科医の検証が完了するまで、ロックされたデータベースに置かれた。放射線科医は、検証試験のためにX線を審査するときには、もとのX線報告とアルゴリズム出力を知らされていなかった。
【0041】
1.4 統計的分析
1.4.1 サンプルサイズ計算
95%の信頼区間を用いて感度と特異度を正確に算出することは、集団から無作為にサンプリングされた富化されていないデータセット中のおよそ20,000のサンプルサイズを必要とする。セクション1.2.1に詳述されたエンリッチメント戦略を使用した。90%の精度と95%の信頼区間を有する80%の感度を推定するのに必要なサンプルは、951である。したがって、2000のX線が、正常/異常というX線の分類を評価するのに十分であろう。偽陰性は予備的診断の研究において偽陽性よりも重大であると考えられるため、このサンプルサイズ計算に関する感度を考慮する。
【0042】
異常は、典型的な外来患者の設定では、5%未満の有病率を有している。951のX線のサンプルサイズは、95%の信頼区間で80%の特異度に対し3%の精度を提供するだろう。上記に表記された各特定の疾病に関して有病率が10%未満であることを考慮すると、各疾病につき少なくとも77の真の事例が、10%の精度と95%の信頼区間を有する80%の感度を提供するだろう。したがって、1つの疾病につき最低80の真の事例をセット2に使用した。
【0043】
1.4.2 アルゴリズム性能の測定 vs 放射線科医
特定の異常に関してAUCを算出する場合、セット1の全体、およびセット2からの異常に関するすべてのX線陽性を使用した。
1.感度計算のために、十分に多い数の「異常陽性」事例を使用。
2.正常:異常の比率を自然分布に近い状態に保つ。両セットを組み合わせて使用するのに比べると、これは特異度のより明瞭な推定を可能にする。
【0044】
実際にこれは、各異常を別個に検出する精度を評価する独立した研究を行なうことに等しい。しかしながら、全データセット(n=2000)を、異常なX線の検出に関するAUCを算出する時に使用した。
【0045】
AUC信頼区間は、Hanley and McNeil(Radiology,143(1):29-36,1982)によって記載された「分布に基づく」アプローチを使用して算出した。各所見に対するペアになった解釈者間の一致は、合意の割合とコーエンのκ係数を使用して測定された(Fam Med,37(5):360-363,2005)。加えて、各所見に対する3人すべての解釈者(2人の放射線科医ともとの報告)間の一致は、フライスのκ係数を使用して測定された(Psychological bulletin,76(5):378,1971)。解釈者が3つのペアにグループ分けされたため、解釈者間の合意についての報告された各測定値は、3つの推定の平均である。
【0046】
1.3 結果
基本的な人口統計、および各異常を含むスキャンの数は表3に概説される。2000のX線のうち658のX線が、「混濁」、「心臓肥大症」および「石灰化」という、最も頻繁な異常を伴う異常であった。空洞形成の特定において、ディープラーニングシステムの精度を確信をもって算出するための、この異常を含む十分なスキャンはなかった。
【0047】
【0048】
報告解析における高精度の達成は、ディープラーニングアルゴリズムを訓練するための多くのX線の使用を可能にする助けになった。放射線医学報告からの異常抽出精度と一人の解釈者による手動での抽出は、表2aで概説される。アルゴリズムは、専門の解釈者に対して、0.94の感度、1の特異度を有する正常なX線報告を検出することができた。報告からの個々の異常の検出については、感度は、胸水に関しては0.93~、石灰化と空洞形成に関しては~1と異なっていた;特異度は混濁に関しては0.92~、繊維症に関しては~0.99であり、異なっていた。
【0049】
1.3.1 放射線科医間の一致
解釈者間の一致は表2bに記載される。一致は、異常なX線の検出において最も高かった(解釈者間の一致は85%、コーエンのκ0.6、フライスのκ0.56)。
【0050】
1.3.2 アルゴリズムの精度 vs 3人の放射線科医の多数派意見
12の異常の各々を特定するディープラーニングシステムの精度は、表4に表記される。
図2は、6人の放射線科医のプールから無作為に得た3人の放射線科医の多数派意見(2人の放射線科医の遡及的再解釈、およびもとの放射線医学報告)に対する、全データセット(n=2000)にプロットされた各異常ごとのAUC曲線を示す。6人の放射線科医ごとの、個々の放射線科医の感度と特異度は各プロット上にマークされる。ほとんどの場合、個々の放射線科医の感度と特異度は、胸水、心臓肥大症および混濁を例外として、AUC曲線をわずかに上回り、およびアルゴリズムの性能は、何人かの個体の性能(または放射線科医の感度と特異度)と等しかった。
【0051】
【0052】
他のデータセット(Qure90k)は、もとの訓練データセットに寄与しなかったインドの4つのセンターで無作為にサンプリングされる。このデータセットに関する参照標準(グラウンドトゥルース)は、もとの放射線科医報告に自然言語処理(NLP)を使用して設定される。12の異常の各々を特定するディープラーニングシステムの精度は、表5に表記される。
【0053】
【0054】
1.4 結論
ディープラーニングシステムは、異常なスキャンの検出に関して0.93(CI 0.92-0.94)のAUC、および、肋骨横隔膜角の鈍化、石灰化、心臓肥大症、空洞形成、硬化、繊維症、肺門の拡張、混濁および胸水それぞれの検出に関して、0.94(0.92-0.97)、0.88(0.85-0.91)、0.97(0.95-0.99)、0.93(0.85-1)、0.93(0.89-0.96)、0.88(0.84-0.93)、0.89(0.84-0.94)、0.93(0.91-0.95)、0.98(0.97-1)のAUC(CI)を実証した。
【0055】
この例は、大量の十分に標識されたデータで訓練されたディープラーニングアルゴリズムが、胸部X線の異常を正確に検出することができることを示す。これらのシステムがより正確になれば、胸部X線解釈の限界を広げ、およびその有効性を改善するためにそれらを使用する実現可能性が増す。
【0056】
<実施例2.結核検出のためのディープラーニングソリューションqXR>
Qure.ai qXRは、異常な胸部X線をスクリーニングし、優先させるように設計されている。アルゴリズムは、15の最も一般的な胸部X線異常を自動的に特定する。典型的または異型の肺結核を示唆するこれらの異常のサブセットを、プロダクト内の「結核スクリーニング」アルゴリズムを生成するために組み合わせる。結核スクリーニングアルゴリズムは、微生物学的確認の前に、結核を示唆する異常に関する放射線科医または内科医の胸部X線のスクリーニングを複製するように意図される。qXRは、CE認証された初のAIベースの胸部X線判断ソフトウェアである。qXRは、ベンダー中立統合過程(Vendor Neutral Integration Process)により統合され、および任意のX線システム(CRまたはDR)から生成されたX線と共に機能する。qXRは結核をスクリーニングし、さらに15の他の異常を特定し、その結果、患者は自身が患っているかもしれないTBではない疾病についての情報を得ることができる。
【0057】
qXRは、既存の放射線医学ワークフローに干渉せずに、シームレスにベンダー中立アーカイブ(VNA)およびPACSと統合する。以下を含む結果の表を送達するために、それはHIPAAコンプライアントクラウドサーバで展開される:
a.各胸部X線に関して「正常」または「異常」
b.対応する確率スコアを用いてアルゴリズムによって検出された全ての異常のリスト
c.確率スコアを用いて、各X線に関して、「結核スクリーニング勧告」または「結核スクリーニング陰性」。
【0058】
標準的なイメージングプロトコルを使用して、qXRは、クライアントPACS/VNAから対象のX線(非特定化)を自動的にアップロードし、およびHL7フォーマットを使用して結果のオーバーレイと対応する報告を返し、ユーザーがもとのX線の審査に先立って分析にアクセスできるようにする。この標準プロセスは、2週間にわたる咳などの症状を有する個体、糖尿病および他の免疫無防備の患者が、数秒以内に結核に関するスクリーニングを受け、微生物学的確認(NAAT)を参照し、および陽性であるとわかれば、同日に処置を開始することができる。
図3は、地区TBセンターでパイロット用のqXRを使用したTB検出のための提案されたワークフローを示す。
【0059】
展開のための労力には、APIを介した現行のX線システムとの統合が含まれる。結果は、放射線医学ビューアと矛盾がなく、またはウェブベースのQureビューア上でホストされ得る。自動化された報告は、画像データにおける特定の疾病の特徴の認識レベルに対応するスコアで生成される。表6は自動化報告の例である。
【0060】