IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ マース インコーポレーテッドの特許一覧

特許7503213ペットの放射線医学画像を評価するためのシステム及び方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-11
(45)【発行日】2024-06-19
(54)【発明の名称】ペットの放射線医学画像を評価するためのシステム及び方法
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240612BHJP
   G06V 10/82 20220101ALI20240612BHJP
   G06N 3/0895 20230101ALI20240612BHJP
   G06N 3/096 20230101ALI20240612BHJP
   G06N 3/045 20230101ALI20240612BHJP
【FI】
G06T7/00 350C
G06V10/82
G06N3/0895
G06N3/096
G06N3/045
【請求項の数】 40
(21)【出願番号】P 2023534987
(86)(22)【出願日】2021-12-15
(65)【公表番号】
(43)【公表日】2023-12-20
(86)【国際出願番号】 US2021063609
(87)【国際公開番号】W WO2022132967
(87)【国際公開日】2022-06-23
【審査請求日】2023-08-21
(31)【優先権主張番号】63/215,769
(32)【優先日】2021-06-28
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/125,912
(32)【優先日】2020-12-15
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/274,482
(32)【優先日】2021-11-01
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】390037914
【氏名又は名称】マース インコーポレーテッド
【氏名又は名称原語表記】MARS INCORPORATED
(74)【代理人】
【識別番号】100073184
【弁理士】
【氏名又は名称】柳田 征史
(74)【代理人】
【識別番号】100175042
【弁理士】
【氏名又は名称】高橋 秀明
(74)【代理人】
【識別番号】100163050
【弁理士】
【氏名又は名称】小栗 眞由美
(74)【代理人】
【識別番号】100224775
【弁理士】
【氏名又は名称】南 毅
(72)【発明者】
【氏名】パーキンソン,マーク ジャスティン
(72)【発明者】
【氏名】フィツキー,ミヒャエル
(72)【発明者】
【氏名】スタック,ジョゼフ コンラッド
(72)【発明者】
【氏名】ダーソン,アンドレ
【審査官】秦野 孝一郎
(56)【参考文献】
【文献】米国特許出願公開第2019/0205478(US,A1)
【文献】特表2017-531255(JP,A)
【文献】米国特許出願公開第2016/0078339(US,A1)
【文献】Junpeng Wang;Liang Gou;Wei Zhang;Hao Yang;Han-Wei Shen,DeepVID: Deep Visual Interpretation and Diagnosis for Image Classifiers via Knowledge Distillation,IEEE Transactions on Visualization and Computer Graphics,米国,IEEE,2019年06月,Volume: 25, Issue: 6,pp.2168-2180,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8667661
【文献】高木 純平、服部 元信,自己蒸留によるDNNの蒸留の効率化,電子情報通信学会技術研究報告,日本,一般社団法人電子情報通信学会,2019年04月12日,第118巻,p.209-214
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06V 10/82
G06N 3/0895
G06N 3/096
G06N 3/045
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
第1の複数のデジタル保存された画像を含む第1のラベリング済み訓練データセットを受信するステップであって、前記第1の複数の画像の各画像はラベルのセットに関連付けられている、ステップ;
前記第1のラベリング済み訓練データセットで機械学習ニューラル教師モデルを訓練するステップ;
自然言語処理のために訓練された機械学習モデルを、第2の複数の画像の自然言語テキスト要約のデジタル電子表現を含む未ラベリングデータセットに適用することによって、前記第2の複数の画像を含む第2のラベリング済み訓練データセットを生成するステップ;
前記機械学習ニューラル教師モデルを用いて、前記第2の複数の画像の各画像に対して、対応するソフト擬似ラベルのセットを生成するステップ;
前記第2のラベリング済み訓練データセットの各画像のための派生ラベルのセットを、前記ソフト擬似ラベルを用いて生成するステップ;
1つ以上のプログラムされた機械学習ニューラル生徒モデルを、前記派生ラベルを用いて訓練するステップ;
標的画像を受信するステップ;及び
前記生徒モデルのうちの1つ以上のアンサンブルを適用して、前記標的画像の1つ以上の分類を出力するステップ
を含む、コンピュータ実装型の方法。
【請求項2】
前記1つ以上のプログラムされた機械学習ニューラル生徒モデルのうちの少なくとも1つを、Active Learningを用いて、プログラムに従ってアップデートするステップを更に含む、請求項1に記載のコンピュータ実装型の方法。
【請求項3】
1つ以上の機械学習モデル訓練ステップにおいてノイズを適用するステップを更に含む、請求項1に記載のコンピュータ実装型の方法。
【請求項4】
前記標的画像は、動物又はペットの放射線撮影画像である、請求項1に記載のコンピュータ実装型の方法。
【請求項5】
前記第1の複数の画像の各画像、及び前記第2の複数の画像の各画像は、動物又はペットの放射線撮影画像である、請求項1に記載のコンピュータ実装型の方法。
【請求項6】
前記自然言語テキスト要約は放射線医学レポートである、請求項1に記載のコンピュータ実装型の方法。
【請求項7】
前記標的画像は、Digital Imaging and Communications in Medicine(「DICOM」)画像としてフォーマットされる、請求項1に記載のコンピュータ実装型の方法。
【請求項8】
Dockerコンテナを用いて展開されるマイクロサービスを含むインフラストラクチャパイプラインを使用するステップを更に含む、請求項1に記載のコンピュータ実装型の方法。
【請求項9】
前記機械学習ニューラル生徒モデル又は前記機械学習ニューラル教師モデルのうちの少なくとも一方は、DenseNet‐121、ResNet‐152、ShuffleNet2、ResNext101、GhostNet、EfficientNet‐b5、SeNet‐154、Se‐ResNext‐101、又はInception‐v4のうちの少なくとも1つを含むアーキテクチャを含むようにプログラムされる、請求項1に記載のコンピュータ実装型の方法。
【請求項10】
前記機械学習ニューラル生徒モデル又は前記機械学習ニューラル教師モデルのうちの少なくとも一方は、畳み込みニューラルネットワークとしてプログラムされる、請求項1に記載のコンピュータ実装型の方法。
【請求項11】
前記標的画像の前記1つ以上の分類のうちの1つは、健康な又は異常な組織のうちの一方を示す、請求項1に記載のコンピュータ実装型の方法。
【請求項12】
前記標的画像の前記1つ以上の分類のうちの1つは異常な組織を示し;
示された前記異常な組織は、心血管、肺構造、縦隔構造、胸膜腔、又は胸腔外のうちの少なくとも1つとして更に分類される、請求項11に記載のコンピュータ実装型の方法。
【請求項13】
前記標的画像の前記1つ以上の分類のうちの少なくとも1つは下位分類である、請求項1に記載のコンピュータ実装型の方法。
【請求項14】
前記標的画像を前処理するステップを更に含み、前処理する前記ステップは、前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、訓練済み機械学習フィルタモデルを前記標的画像に適用するステップを含む、請求項1に記載のコンピュータ実装型の方法。
【請求項15】
前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、前記標的画像の正しい解剖学的配向を、プログラムに従って決定するステップを更に含む、請求項1に記載のコンピュータ実装型の方法。
【請求項16】
前記標的画像の前記正しい解剖学的配向を決定する前記ステップは、前記標的画像に関連付けられたDICOMメタデータ、又は前記標的画像に関連付けられた左右マーカーに依存することなく動作するようにプログラムされた、訓練済み機械学習モデルを実行するステップを含む、請求項15に記載のコンピュータ実装型の方法。
【請求項17】
前記訓練済み機械学習モデルは、拡張データ及び実際のデータで合同訓練されたものである、請求項16に記載のコンピュータ実装型の方法。
【請求項18】
前記標的画像の前記正しい解剖学的配向を決定する前記ステップは、第1のプログラム済みモデルを実行することによって、前記標的画像の正しい回転を決定するステップと、第2のプログラム済みモデルを実行することによって、前記標的画像の正しい反転を決定するステップとを含む、請求項15に記載のコンピュータ実装型の方法。
【請求項19】
前記標的画像の前記正しい解剖学的配向を決定する前記ステップの後、かつ前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、前記標的画像が正しい身体部分に対応することをプログラムに従って確認するステップを更に含む、請求項15に記載のコンピュータ実装型の方法。
【請求項20】
前記標的画像が前記正しい身体部分に対応することを確認する前記ステップは、訓練済み機械学習モデルを実行するステップを含む、請求項19に記載のコンピュータ実装型の方法。
【請求項21】
システムであって:
1つ以上のプロセッサと;
前記プロセッサのうちの1つ以上に結合され、前記プロセッサのうちの1つ以上によって実行されたときに、以下:
第1の複数のデジタル保存された画像を含む第1のラベリング済み訓練データセットを受信するステップであって、前記第1の複数の画像の各画像はラベルのセットに関連付けられている、ステップ;
前記第1のラベリング済み訓練データセットで機械学習ニューラル教師モデルを訓練するステップ;
自然言語処理のために訓練された機械学習モデルを、第2の複数の画像の自然言語テキスト要約のデジタル電子表現を含む未ラベリングデータセットに適用することによって、前記第2の複数の画像を含む第2のラベリング済み訓練データセットを生成するステップ;
前記機械学習ニューラル教師モデルを用いて、前記第2の複数の画像の各画像に対して、対応するソフト擬似ラベルのセットを生成するステップ;
前記第2のラベリング済み訓練データセットの各画像のための派生ラベルのセットを、前記ソフト擬似ラベルを用いて生成するステップ;
1つ以上のプログラムされた機械学習ニューラル生徒モデルを、前記派生ラベルを用いて訓練するステップ;
標的画像を受信するステップ;及び
前記生徒モデルのうちの1つ以上のアンサンブルを適用して、前記標的画像の1つ以上の分類を出力するステップ
を含む操作を前記システムに実行させるように動作する命令を含む、1つ以上のコンピュータ可読非一時的記憶媒体と
を備える、システム。
【請求項22】
前記命令は更に、実行されたときに、前記1つ以上のプログラムされた機械学習ニューラル生徒モデルのうちの少なくとも1つを、Active Learningを用いて、プログラムに従ってアップデートするステップを実施させるように動作する、請求項21に記載のシステム。
【請求項23】
前記命令は更に、実行されたときに、1つ以上の機械学習モデル訓練ステップにおいてノイズを適用するステップを実施させるように動作する、請求項21に記載のシステム。
【請求項24】
前記標的画像は、動物又はペットの放射線撮影画像である、請求項21に記載のシステム。
【請求項25】
前記第1の複数の画像の各画像、及び前記第2の複数の画像の各画像は、動物又はペットの放射線撮影画像である、請求項21に記載のシステム。
【請求項26】
前記自然言語テキスト要約は放射線医学レポートである、請求項21に記載のシステム。
【請求項27】
前記標的画像は、Digital Imaging and Communications in Medicine(「DICOM」)画像としてフォーマットされる、請求項21に記載のシステム。
【請求項28】
前記命令は更に、実行されたときに、Dockerコンテナを用いて展開されるマイクロサービスを含むインフラストラクチャパイプラインを使用するステップを実施させるように動作する、請求項21に記載のシステム。
【請求項29】
前記機械学習ニューラル生徒モデル又は前記機械学習ニューラル教師モデルのうちの少なくとも一方は、DenseNet‐121、ResNet‐152、ShuffleNet2、ResNext101、GhostNet、EfficientNet‐b5、SeNet‐154、Se‐ResNext‐101、又はInception‐v4のうちの少なくとも1つを含むアーキテクチャを含むようにプログラムされる、請求項21に記載のシステム。
【請求項30】
前記機械学習ニューラル生徒モデル又は前記機械学習ニューラル教師モデルのうちの少なくとも一方は、畳み込みニューラルネットワークとしてプログラムされる、請求項21に記載のシステム。
【請求項31】
前記標的画像の前記1つ以上の分類のうちの1つは、健康な又は異常な組織のうちの一方を示す、請求項21に記載のシステム。
【請求項32】
前記標的画像の前記1つ以上の分類のうちの1つは異常な組織を示し;
示された前記異常な組織は、心血管、肺構造、縦隔構造、胸膜腔、又は胸腔外のうちの少なくとも1つとして更に分類される、請求項31に記載のシステム。
【請求項33】
前記標的画像の前記1つ以上の分類のうちの少なくとも1つは下位分類である、請求項21に記載のシステム。
【請求項34】
前記命令は更に、実行されたときに、前記標的画像を前処理するステップを実施させるように動作し、前処理する前記ステップは、前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、訓練済み機械学習フィルタモデルを前記標的画像に適用するステップを含む、請求項21に記載のシステム。
【請求項35】
前記命令は更に、実行されたときに、前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、前記標的画像の正しい解剖学的配向を、プログラムに従って決定するステップを実施させるように動作する、請求項21に記載のシステム。
【請求項36】
前記命令は更に、実行されたときに、前記標的画像の前記正しい解剖学的配向を決定する前記ステップを、前記標的画像に関連付けられたDICOMメタデータ、又は前記標的画像に関連付けられた左右マーカーに依存することなく動作するようにプログラムされた、訓練済み機械学習モデルを実行するステップによって実施させるように動作する、請求項35に記載のシステム。
【請求項37】
前記訓練済み機械学習モデルは、拡張データ及び実際のデータで合同訓練されたものである、請求項36に記載のシステム。
【請求項38】
前記命令は更に、実行されたときに、前記標的画像の前記正しい解剖学的配向を決定する前記ステップを、第1のプログラム済みモデルを実行することによって、前記標的画像の正しい回転を決定するステップと、第2のプログラム済みモデルを実行することによって、前記標的画像の正しい反転を決定するステップとによって実施させるように動作する、請求項35に記載のシステム。
【請求項39】
前記命令は更に、実行されたときに、前記標的画像の前記正しい解剖学的配向を決定する前記ステップの後、かつ前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、前記標的画像が正しい身体部分に対応することをプログラムに従って確認するステップを実施させるように動作する、請求項35に記載のシステム。
【請求項40】
前記命令は更に、実行されたときに、前記標的画像が前記正しい身体部分に対応することを確認する前記ステップを、訓練済み機械学習モデルを実行するステップによって実施させるように動作する、請求項39に記載のシステム。
【発明の詳細な説明】
【優先権】
【0001】
本出願は、2021年11月1日出願の米国仮特許出願第63/274,482号、2021年6月28日出願の米国仮特許出願第63/215,769号、及び2020年12月15日出願の米国仮特許出願第63/125,912号の、米国特許法第119条の下での利益を主張するものであり、上記仮特許出願の全内容は、本明細書に完全に記載されているかのように、あらゆる目的のために参照によって本出願に援用される。
【技術分野】
【0002】
本開示は一般に、ペット又は動物の放射線医学画像(radiology image)を評価するための、1つ以上の機械学習モデル又はツールの使用に関する。
【背景技術】
【0003】
動物又はペットの健康問題の診断又は特定のために、X線等の画像ベースの診断技法を利用する獣医師が増えている。しかしながら、獣医師としての訓練を受けた放射線科医は世界に1100人未満しかいない。従って多くの獣医師は、画像ベースの診断技法によってもたらされる利点を活用できていない。放射線科で訓練を受けた獣医師であっても、医療用画像のレビューは時間がかかり、また面倒なものである場合がある。動物又はペットの放射線医学画像は、その配向が間違っている場合があり、及び/又は左右マーカーが欠落している、若しくは間違っている場合があり、これによってこれらの問題が悪化する。
【発明の概要】
【発明が解決しようとする課題】
【0004】
従って、診断用ペット画像の処理及び解釈を自動化でき、放射線科の訓練を受けた又は放射線科の訓練を受けていない獣医師に、臨床的に信頼できる結果を返すことができるシステムに対して、需要が存在する。
【課題を解決するための手段】
【0005】
特定の非限定的な実施形態では、本開示は、機械学習モデルを訓練して、上記機械学習モデルを用いて動物又はペットの放射線デジタル画像を処理、解釈、及び/又は分析するための、システム及び方法を提供する。画像は、Digital Imaging and Communications in Medicine(「DICOM」)といった、医学的状態の診断に使用されるデジタル画像保存フォーマット、及び画像の表示に使用される他のフォーマットのものであってよい。特定の実施形態では、放射線撮影画像(radiographic image)に、自動化された自然言語処理(natural language processing:「NLP」)ツールを用いてラベリングできる。コンピュータ実装型の一方法では、上記NLPツールは、放射線撮影画像の自然言語テキスト要約の表現を入力として受け入れ、上記放射線撮影画像を特徴付ける画像ラベル又はタグを出力する。一実施形態では、上記放射線撮影画像の上記自然言語テキスト要約は、放射線医学レポートである。一実施形態では、上記放射線撮影画像、及びNLPによって生成された対応するタグを、訓練データとして使用して、動物又はペットの放射線撮影画像を分類するように構成又はプログラムされた1つ以上の機械学習分類器モデルを訓練できる。他の非限定的な実施形態では、獣医放射線学の専門家が、様々な画像に手動でラベリングできる。特定の実施形態では、1つ以上の機械学習分類器モデルを、手動でラベリングされた訓練データ、例えば獣医放射線学の専門家又は別のタイプのヒトの領域に特化した専門家によってタグ付けされた医療用画像を用いて、訓練できる。本明細書中で更に説明されるように、いくつかの実施形態において実装される機械学習モデルは、NLPによって生成されたラベルを有する訓練データと、人間によって生成されたラベルを有する画像訓練データとの混合を、効果的に使用できる。
【0006】
一実施形態では、本開示は、動物又はペットの放射線撮影画像の自動化された分類のためのシステム及び方法を提供する。様々な実施形態において、キャプチャ、収集、及び/又は受信した1つ以上の画像の分析及び/又は分類を、1つ以上の機械学習モデル又はツールを用いて実施できる。いくつかの実施形態では、上記機械学習モデルは、畳み込みニューラルネットワーク(convolutional neural network:「CNN」)であってよいニューラルネットワークを含むことができる。上記機械学習モデルを用いて、画像を多様なタグ、ラベル、又は分類で分類できる。このような分類は例えば、健康な組織、又は異常の存在を示すことができる。一実施形態では、異常を有すると分類された画像を、例えば心血管、肺構造、縦隔構造、胸膜腔、及び/又は胸腔外として更に分類できる。本開示では、分類内でのこのような分類は、下位分類と呼ばれる場合がある。
【0007】
一実施形態では、本開示は、プログラムされた機械学習モデル(本文書中では、場合によっては「RapidReadNet」と呼ばれる)を訓練し、これを用いてペットの放射線医学画像を分類するための技法を提供し、ここでRapidReadNetは、本明細書中でより具体的に説明されるように、較正された個別のディープニューラルネットワーク生徒モデルのアンサンブルとすることができる。用語「RapidReadNet」、及びこれに類する本開示中の他の各用語又はラベルは、本開示において、簡明な説明を容易にするための便宜及び簡潔さのためにのみ使用され、他の実施形態が、用語「RapidReadNet」を使用せずに、機能的に同等のツール、システム、又は方法を実装する場合もある。一実施形態では、機械学習ニューラル教師モデルを、まず、人間がラベリングした第1の画像訓練データセットを用いて訓練できる。次にNLPモデルを用いて、自然言語テキスト要約に関連付けられた医療用画像を含む、より大きな未ラベリング画像訓練データセットにラベリングできる。例えばデータセットは、放射線医学レポートを含むことができる。続いて上記教師モデルを用いて、上記大きな画像データセットに対してソフト擬似ラベルを生成できる。最後に上記ソフト擬似ラベルを上記NLP派生ラベルと組み合わせて使用して、より多くの派生ラベルを更に生成でき、1つ以上の機械学習ニューラル生徒モデルを、これらの派生ラベルを用いて訓練できる。一実施形態では、RapidReadNetは、複数の上記生徒モデルのアンサンブルを含むことができる。
【0008】
一実施形態では、本開示は、DICOMメタデータ又は左右マーカーに依存しない、獣医用放射線写真(radiograph)における正しい解剖学的配向の自動化された決定のためのシステム及び方法を提供する。本開示の一方法は、2つの下位モデル(「RotationNet」及び「FlipNet」)を含む訓練された機械学習モデル(「AdjustNet」)の使用を含むことができる。いくつかの実施形態では、RotationNet及びFlipNetはそれぞれ、複数のCNNのアンサンブルとしてプログラムできる。一実施形態では、RotationNetモデルを用いて、動物又はペットの放射線撮影画像等の画像が正しく回転されているかどうかを判定できる。一実施形態では、FlipNetモデルを用いて、動物又はペットの放射線撮影画像等の画像を反転するべきかどうかを判定できる。一実施形態では、AdjustNet及び/又はRotationNet及び/又はFlipNetを、報告されている最新のシステムを上回る多数の技術的利点を有する、動物又はペットの放射線撮影画像の分類のためのエンドツーエンドシステム又はパイプラインに組み込むことができる。用語「AdjustNet」、「RotationNet」及び「FlipNet」、並びに本開示中の類似の他の用語又はラベルはそれぞれ、本開示において、簡明な説明を容易にするための便宜及び簡潔さのためにのみ使用され、他の実施形態が、AdjustNet、RotationNet、又はFlipNetを使用せずに、機能的に同等のツール、システム、又は方法を実装する場合もある。
【0009】
様々な実施形態において、RotationNet及びFlipNetはそれぞれ、複数の方法のうちのいずれかでプログラム及び/又は訓練できる。例えば各モデルは、シングルモデル又は2ステージモデルとすることができる。非限定的な実施形態では、複数の異なる重み初期化技法をモデルの開発に使用できる。例えば、転移学習アプローチを、(例えばImageNetで)事前訓練されたモデルの重みを用いて実施でき、又はモデルをランダムに初期化した後、拡張データで更に事前訓練できる。非限定的な実施形態では、1つ以上の異なる訓練パイプラインを、モデルの開発に使用することもできる。例えばRoationNet及びFlipNetそれぞれを、拡張データを用いて事前訓練した後、実際のデータを用いて微調整できる。他の実施形態では、一方又は両方のモデルを、拡張データ及び実際のデータで合同訓練できる。
【0010】
一実施形態では、本開示は、動物又はペットの放射線撮影画像の分類のためのエンドツーエンドシステム又はパイプラインを提供する。本明細書の文脈では、「エンドツーエンド(end‐to‐end)」は、システム又はパイプラインが、デジタル画像データを入力として受信して、分類データ又はラベルを出力するように構成されていることを意味することができる。本明細書中でより具体的に説明されるように、上記エンドツーエンドシステム又はパイプラインは、AdjustNetを用いて標的画像の正しい解剖学的配向を決定すること、及びRapidReadNetを用いて上記標的画像を分類することを含むことができる。一実施形態では、別の訓練されたモデルを用いて、上記標的画像の正しい解剖学的配向を(AdjustNetを用いて)決定した後、かつ上記標的画像の1つ以上の分類を(RapidReadNetを用いて)出力する前に、上記標的画像が正しい身体部分に対応していることを確認できる。一実施形態では、インフラストラクチャパイプラインは、ソフトウェアコンテナを使用して、Docker,Inc.のDocker又はGoogle,LLCのKUBERNETESといったライブラリを用いて展開でき、またRepresentational State Transferを使用するアプリケーションプログラミングインタフェース(ReSTful API)を用いて呼び出し可能な、マイクロサービスに依存するものとすることができる。一実施形態では、AIオーケストレーターコンテナを、AdjustNetモデル及びRapidReadNetモデルといった異なる複数のAIモジュールからの推論の実行を調整するようプログラムできる。本開示は、本開示によって提供される特定の方法又は技法を実装でき、ただし他の方法又は技法も可能である、新規の非限定的なシステムアーキテクチャの一例を提供する。
【0011】
本明細書で開示される実施形態は単なる例であり、本開示の範囲はこれらに限定されない。特定の非限定的な実施形態は、本明細書で開示される実施形態のコンポーネント、要素、特徴、機能、動作、又はステップを、全て含む場合も、一部だけ含む場合も、又は全く含まない場合もある。本発明による実施形態は特に、方法を対象とする添付の請求項において開示される。添付の請求項内での従属関係又は参照は、形式的な理由のみで選択される。しかしながら、以前の請求項を(特定の複数の依存関係で)意図的に参照した結果として生じる主題も同様に請求の対象とすることができるため、添付の請求項において選択されている依存関係にかかわらず、請求項及びその特徴の任意の組み合わせが開示され、それらを請求の対象とすることができる。請求の対象とすることができる主題は、添付の請求項に記載された特徴の組み合わせだけでなく、請求項中の特徴の他のいずれの組み合わせも含み、請求項中で言及されている各特徴は、請求項中の他のいずれの特徴又は他の特徴の組み合わせと組み合わせることができる。更に、本明細書に記載又は図示されている実施形態及び特徴はいずれも、別個の請求項において、及び/又は本明細書に記載若しくは図示されているいずれの実施形態若しくは特徴と、若しくは添付の請求項の特徴のうちのいずれかとの、いずれの組み合わせにおいて、請求の対象とすることができる。
【図面の簡単な説明】
【0012】
図1】特定の非限定的な実施形態による、1つ以上の機械学習モデル又はツールによる処理の前後の放射線写真画像
図2】特定の非限定的な実施形態による、画像のラベリング及びアノテーション付け
図3】機械学習システムを用いて動物及び/又はペット画像を評価するための例示的な方法
図4】動物又はペットの画像の分類及びラベリングを容易にするために使用される、例示的なコンピュータシステム又はデバイス
図5】画像配向タスクのための例示的なワークフロー
図6】ネコの頭蓋骨の、正しく配向されていない画像の例と、正しく配向された画像の例の、放射線写真画像
図7】特定の非限定的な実施形態による、アンサンブルによる例示的な2ステージモデル技法の図
図8】画像の配向に関するモデル決定に使用されるGradCAM変換の例示的な画像
図9】例示的なモデル展開ワークフローの図
図10】特定の非限定的な実施形態による、エラー分析に使用される例示的な画像
図11】一実施形態における、モデル化のために評価される画像のプール
図12】画像を臨床ワークフローの一部として収集できる、一実施形態のX線システムのインフラストラクチャ
図13A】心血管及び胸膜腔所見に関するROC曲線及びPR曲線の第1のセット
図13B】心血管及び胸膜腔所見に関するROC曲線及びPR曲線の第2のセット
図14A】肺所見に関するROC曲線及びPR曲線の第1のセット
図14B】肺所見に関するROC曲線及びPR曲線の第2のセット
図15A】縦隔所見に関するROC曲線及びPR曲線の第1のセット
図15B】縦隔所見に関するROC曲線及びPR曲線の第2のセット
図16A】胸腔外所見に関するROC曲線及びPR曲線の第1のセット
図16B】胸腔外所見に関するROC曲線及びPR曲線の第2のセット
図17A】胸腔外所見に関するROC曲線及びPR曲線の第3のセット
図17B】胸腔外所見に関するROC曲線及びPR曲線の第4のセット
図18】週ごとの再構築エラーの視覚化
図19】示されている組織の個数の関数としての、再構築エラーの分布
図20】機械学習ニューラルモデルを用いて、動物及び/又はペットの放射線医学画像といった放射線医学画像を分類するための、コンピュータ実装型の又はプログラムされた例示的な方法
【発明を実施するための形態】
【0013】
本明細書中で使用される用語は一般に、本開示の文脈、及び各用語が使用される特定の文脈において、当該技術分野における通常の意味を有する。本開示の構成物及び方法、並びにその作製及び使用方法の説明にあたって更なる指針を提供するために、特定の用語について、以下又は明細書中の他の箇所で議論する。
【0014】
実施形態は、以下の概要に従った複数のセクションで開示される:
1.0 概観
2.0 ペットの放射線医学画像の処理のための機械学習技法
2.1 分類のための、例示的なペットの放射線医学画像
2.2 ペットの放射線医学画像のためのラベル
2.3 一実施形態におけるペットの放射線医学画像の分類
3.0 AdjustNet:ペットの放射線医学画像の配向のための自動化された技法
3.1 入力データ及びワークフロー
3.2 モデルの開発
3.3 モデルの展開
3.4 ユーザフィードバック
4.0 RapidReadNetを用いたエンドツーエンドでのペットの放射線医学画像の処理
4.1 一実施形態における、RapidReadNetを訓練するための画像データセット
4.2 画像分類タスクのためのニューラルモデル訓練技法
4.3 ドリフト分析、実験結果、及び縦ドリフト分析
4.4 一実施形態におけるRapidReadNetのためのシステムアーキテクチャ及び方法
5.0 特定の実施形態の利点
5.1 AdjustNet及びRotationNetの技術的利点の例
5.2 RapidReadNet、及び一実施形態におけるペットの放射線医学画像の分類のための本開示のエンドツーエンドシステムの、技術的利点の例
6.0 実装例‐ハードウェアの概要
【0015】
1.0 概観
本明細書及び添付の特許請求の範囲で使用される場合、単数形「ある(a、an)」及び「上記、前記(the)」は、文脈によってそうでないことが明確に指示されていない限り、複数の指示対象を含む。
【0016】
本明細書中で使用される場合、用語「…を備える、含む(comprises)」、「…を備える、含む(comprising)」、又は他のいずれの変化形は、非排他的な包含をカバーすることを意図したものであり、従って、複数の要素のリストを含むプロセス、方法、物品、システム、又は装置は、これらの要素のみを含むのではなく、明示的に挙げられていない、又はこのようなプロセス、方法、物品、システム、若しくは装置に必然的に含まれる、他の要素を含む可能性がある。
【0017】
本明細書中で使用される場合、本開示に従って使用される用語「動物(animal)」又は「ペット(pet)」は、飼い犬、飼い猫、ウマ、ウシ、フェレット、ウサギ、ブタ、ラット、マウス、アレチネズミ、ハムスター、ヤギ等を含むがこれらに限定されない家畜動物を指す。飼い犬及び飼い猫が、ペットの特定の非限定的な例である。本開示に従って使用される用語「動物」又は「ペット」は更に、バイソン、ヘラジカ、シカ、鹿肉、アヒル、家禽、魚等を含むがこれらに限定されない野生動物を指す場合もある。
【0018】
本明細書中で使用される場合、画像又はスライドの「特徴(feature)」は、該画像又はスライドの1つ以上の測定可能な特性に基づいて決定できる。例えば特徴は、画像内のキズ、暗点、様々なサイズを有する組織、形状、又は光強度レベルであってよい。
【0019】
本明細書中の「発明を実施するための形態」において、「実施形態(embodiment)」、「ある実施形態(an embodiment)」、「一実施形態(one embodiment)」、「様々な実施形態(various embodiment)」、「特定の実施形態(certain embodiment)」、「いくつかの実施形態(some embodiment)」、「他の実施形態(other embodiment)」、「他の特定の実施形態(certain other embodiment)」等への言及は、説明される1つ以上の実施形態が、ある特定の特徴、構造、又は特性を含み得るものの、全ての実施形態がこの特定の特徴、構造、又は特性を必ずしも含むわけではないことを示す。更に、このような句は、必ずしも同一の実施形態に言及しているわけではない。更に、ある特定の特徴、構造、又は特性がある実施形態に関連して説明されている場合、明記されているかどうかにかかわらず、このような特定の特徴、構造、又は特性が他の実施形態に関連して実現されることは、当業者の知識の範囲内であることを申し添えておく。本説明を読めば、1つ以上の関連分野の当業者には、本開示を別の実施形態で実装する方法が明らかになるだろう。
【0020】
本明細書中で使用される場合、用語「デバイス(device)」は、コンピューティングシステム又は移動体デバイスを指す。例えば用語「デバイス」としては、スマートフォン、タブレットコンピュータ、又はラップトップコンピュータが挙げられる。特に、コンピューティングシステムは、GPS受信器、コンパス、ジャイロスコープ、又は加速度計といった、その位置、方向、又は配向を決定する機能を備えることができる。クライアントデバイスは、BLUETOOTH(登録商標)通信、近距離無線通信(near‐field communication:NFC)、若しくは赤外線(infrared:IR)通信、又は無線ローカルエリアネットワーク(wireless local area network:WLAN)若しくは携帯電話ネットワークとの通信といった、無線通信の機能も含むことができる。このようなデバイスは、1つ以上のカメラ、スキャナ、タッチスクリーン、マイクロフォン、又はスピーカーも含むことができる。クライアントデバイスは、ゲーム、ウェブブラウザ、又はソーシャルネットワーキングアプリケーションといったソフトウェアアプリケーションを実行することもできる。クライアントデバイスとしては例えば、ユーザ機器、スマートフォン、タブレットコンピュータ、ラップトップコンピュータ、デスクトップコンピュータ、又はスマートウォッチが挙げられる。
【0021】
例示的なプロセス及び実施形態は、コンピューティングシステム又はクライアントデバイスによって、モバイルアプリケーション及び関連するグラフィカルユーザインターフェース(「UX」又は「GUI」)を介して実行又は実施できる。特定の非限定的な実施形態では、上記コンピューティングシステム又はクライアントデバイスは例えば、スマートフォン、タブレットコンピュータ、又はラップトップコンピュータといった、モバイルコンピューティングシステムとすることができる。このモバイルコンピューティングシステムは、GPS受信器、コンパス、ジャイロスコープ、又は加速度計といった、その位置、方向、又は配向を決定する機能を備えることができる。このようなデバイスは、「BLUETOOTH」通信、近距離無線通信(NFC)、若しくは赤外線(IR)通信、又は無線ローカルエリアネットワーク(WLAN)、3G、4G、LTE、LTE‐A、5G、モノのインターネット、若しくは携帯電話ネットワークとの通信といった、無線通信の機能も含むことができる。このようなデバイスは、1つ以上のカメラ、スキャナ、タッチスクリーン、マイクロフォン、又はスピーカーも含むことができる。モバイルコンピューティングシステムは、ゲーム、ウェブブラウザ、又はソーシャルネットワーキングアプリケーションといったソフトウェアアプリケーションを実行することもできる。ソーシャルネットワーキングアプリケーションを用いて、ユーザは、自身のソーシャルネットワーク内の他のユーザに接続して通信し、情報を共有できる。
【0022】
本明細書中で使用される用語は一般に、本開示の文脈、及び各用語が使用される特定の文脈において、当該技術分野における通常の意味を有する。本開示の構成物及び方法、並びにその作製及び使用方法の説明にあたって更なる指針を提供するために、特定の用語について、以下又は明細書中の他の箇所で議論する。
【0023】
一実施形態では、本開示は:第1の複数の画像を含む第1のラベリング済み訓練データセットを受信するステップであって、上記第1の複数の画像の各画像はラベルのセットに関連付けられている、ステップ;上記第1のラベリング済み訓練データセットで機械学習ニューラル教師モデルをプログラムに従って訓練するステップ;自然言語処理のために訓練された機械学習モデルを、第2の複数の画像の自然言語テキスト要約のデジタル電子表現を含む未ラベリングデータセットに、プログラムに従って適用することによって、上記第2の複数の画像を含む第2のラベリング済み訓練データセットを生成するステップ;上記機械学習ニューラル教師モデルを用いて、上記第2の複数の画像の各画像に対して、対応するソフト擬似ラベルのセットをプログラムに従って生成するステップ;上記第2のラベリング済み訓練データセットの各画像のための派生ラベルのセットを、上記ソフト擬似ラベルを用いて、プログラムに従って生成するステップ;1つ以上のプログラムされた機械学習ニューラル生徒モデルを、上記派生ラベルを用いて訓練するステップ;標的画像を受信するステップ;及び上記生徒モデルのうちの1つ以上のアンサンブルを適用して、上記標的画像の1つ以上の分類を出力するステップを含む、コンピュータ実装型の方法を提供する。
【0024】
一実施形態は、上記1つ以上のプログラムされた機械学習ニューラル生徒モデルのうちの少なくとも1つを、Active Learningを用いて、プログラムに従ってアップデートするステップを更に含む。
【0025】
一実施形態は、1つ以上の機械学習モデル訓練ステップにおいてノイズを適用するステップを更に含む。
【0026】
一実施形態では、上記標的画像は、動物又はペットの放射線撮影画像である。
【0027】
一実施形態では、上記第1の複数の画像の各画像、及び上記第2の複数の画像の各画像は、動物又はペットの放射線撮影画像である。
【0028】
一実施形態では、上記自然言語テキスト要約は放射線医学レポートである。
【0029】
一実施形態では、上記標的画像は、Digital Imaging and Communications in Medicine(「DICOM」)画像としてフォーマットされる。
【0030】
一実施形態は、Dockerコンテナを用いて展開されるマイクロサービスを含むインフラストラクチャパイプラインを使用するステップを更に含む。
【0031】
一実施形態では、上記機械学習ニューラル生徒モデル又は上記機械学習ニューラル教師モデルのうちの少なくとも一方は、本明細書作成時に公知かつ利用可能である、DenseNet‐121、ResNet‐152、ShuffleNet2、ResNext101、GhostNet、EfficientNet‐b5、SeNet‐154、Se‐ResNext‐101、又はInception‐v4といったオープンソースライブラリのうちの少なくとも1つを含むアーキテクチャを含むようにプログラムされる。
【0032】
一実施形態では、上記機械学習ニューラル生徒モデル又は上記機械学習ニューラル教師モデルのうちの少なくとも一方は、畳み込みニューラルネットワークとしてプログラムされる。
【0033】
一実施形態では、上記標的画像の上記1つ以上の分類のうちの1つは、健康な又は異常な組織のうちの一方を示す。
【0034】
一実施形態では、上記標的画像の上記1つ以上の分類のうちの1つは異常な組織を示し、示された上記異常な組織は、心血管、肺構造、縦隔構造、胸膜腔、又は胸腔外のうちの少なくとも1つとして更に分類される。
【0035】
一実施形態では、上記標的画像の上記1つ以上の分類のうちの少なくとも1つは下位分類である。
【0036】
一実施形態は、上記標的画像を前処理するステップを更に含み、前処理する上記ステップは、上記標的画像の上記1つ以上の分類を出力する上記ステップの前に、訓練済み機械学習フィルタモデルを上記標的画像に適用するステップを含む。
【0037】
一実施形態は、上記標的画像の上記1つ以上の分類を出力する上記ステップの前に、上記標的画像の正しい解剖学的配向を、プログラムに従って決定するステップを更に含む。
【0038】
一実施形態では、上記標的画像の上記正しい解剖学的配向を決定する上記ステップは、上記標的画像に関連付けられたDICOMメタデータ、又は上記標的画像に関連付けられた左右マーカーに依存することなく動作するようにプログラムされた、訓練済み機械学習モデルを実行するステップを含む。
【0039】
一実施形態では、上記訓練済み機械学習モデルは、拡張データ及び実際のデータで合同訓練されたものである。
【0040】
一実施形態では、上記標的画像の上記正しい解剖学的配向を決定する上記ステップは、第1のプログラム済みモデルを実行することによって、上記標的画像の正しい回転を決定するステップと、第2のプログラム済みモデルを実行することによって、上記標的画像の正しい反転を決定するステップとを含む。
【0041】
一実施形態は、上記標的画像の上記正しい解剖学的配向を決定する上記ステップの後、かつ上記標的画像の上記1つ以上の分類を出力する上記ステップの前に、上記標的画像が正しい身体部分に対応することをプログラムに従って確認するステップを更に含む。
【0042】
一実施形態では、上記標的画像が上記正しい身体部分に対応することを確認する上記ステップは、訓練済み機械学習モデルを実行するステップを含む。
【0043】
様々な実施形態において、本開示は、1つ以上のプロセッサによって実行されたときに、本開示によって提供される方法のうちの1つ以上を実施するように動作可能な、1つ以上のコンピュータ可読非一時的記憶媒体を提供する。
【0044】
様々な実施形態において、本開示は、システムであって:1つ以上のプロセッサと;上記プロセッサのうちの1つ以上に結合され、上記プロセッサのうちの1つ以上によって実行されたときに、本開示によって提供される方法のうちの1つ以上を上記システムに実行させるように動作する命令を含む、1つ以上のコンピュータ可読非一時的記憶媒体とを備える、システムを提供する。
【0045】
2.0 ペットの放射線医学画像の処理のための機械学習技法
一実施形態では、本開示は、動物又はペットの放射線撮影画像を分類するための自動化された技法を提供する。1つ以上のデジタル保存された放射線撮影画像は、Digital Imaging and Communications in Medicine(「DICOM」)フォーマットとすることができる。上記画像を受信すると、畳み込みニューラルネットワークモデル又はトランスフォーマーベースモデルといった訓練済み機械学習モデル又はツールを用いて、上記画像をデジタルフィルタリングすることにより、非胸部画像等の特定の特徴を除去できる。他の例では、上記機械学習モデル又はツールは:K最近傍法(K‐nearest neighbor:KNN);ナイーブベイズ(naive Bayes:NB);決定木若しくはランダムフォレスト;サポートベクターマシン(support vector machine:SVM);CNN、領域ベースCNN(region‐based CNN:RCNN)、1次元(one‐dimensional:1‐D)CNN、リカレントニューラルネットワーク(recurrent neural network:RNN)といった深層学習モデル、又は他のいずれの機械学習モデル若しくは技法とすることができる。他の例示的実施形態では、画像の全体、又は胸部、骨盤、腹部、若しくは身体といった画像の一部を除去するために、更なるフィルタリングを実施できる。このフィルタリングは、DICOM身体部分タグ、及び1つ以上の視認位置に基づいて実施できる。このようなフィルタリングを実施するモデルを「フィルタモデル(filter model)」と呼ぶことができる。
【0046】
得られた機械学習モデルは、多様な臨床又は医療目的に使用できる。例えば、獣医師又は獣医師の助手が、ペットの放射線医学画像を撮影できる。続いて上記画像を、訓練済み機械学習モデルを用いて処理できる。処理中に上記画像を、正常又は異常として分類できる。異常である場合、上記画像を、心血管、肺構造、縦隔構造、胸膜腔、又は胸腔外のうちの少なくとも1つとして分類できる。いくつかの非限定的な実施形態では、上記画像を下位分類できる。例えば胸膜腔の下位分類としては、胸膜滲出液、気胸、及び/又は胸膜腫瘤が挙げられる。続いて、フィルタリング、セグメント化、アノテーション付与、マスキング、又はラベリングされていてよい上記画像を、決定された上記画像の分類及び下位分類と共に、コンピューティングデバイスのスクリーン等のディスプレイデバイスを用いてユーザに表示できる。
【0047】
一実施形態では、機械学習プロセス及び結果として得られる画像は:放射線科医にオンデマンドのセカンドオピニオンを提供するため;動物病院に放射線画像(radiologic image)の即時評価を提供するサービスの基礎を形成するため;並びに/又は放射線科医が画像ではなくペットそのものに集中できるようにすることによって効率及び生産性を向上させるために、使用できる。
【0048】
いくつかの非限定的な実施形態では、機械学習フレームワークは、動物又はペットの放射線撮影画像の収集された訓練データと、対応するグラウンドトゥルースデータ(例えば既知の又は決定されたラベル又はアノテーション)とから訓練される又は訓練された、畳み込みニューラルネットワーク(CNN)コンポーネントを含むことができる。上記収集された訓練データとしては例えば、クライアントデバイスがキャプチャした1つ以上の画像が挙げられる。CNNは、1つ以上の畳み込み層及びサブサンプリング層を1つ以上のノードと共に含む人工ニューラルネットワークの一種である。1つ以上の隠れ層を含む1つ以上の層を積層して、CNNアーキテクチャを形成できる。本開示のCNNは、大量のラベリング済みデータにさらされることによって、動物又はペットの放射線撮影画像の画像パラメータとその後の分類とを決定することを学習できる。一部の例では、ニューラルネットワークは、入出力ペアごとに学習した重みを訓練できるが、CNNは、訓練可能な固定長のカーネル又はフィルタを、その入力に沿って畳み込むことができる。換言すれば、CNNは、小さく原始的な特徴を学習し(低レベル)、それらを複雑な方法で組み合わせる(高レベル)ことができる。特定の実施形態では、CNNは、教師あり、半教師あり、又は教師なしであってよい。
【0049】
特定の非限定的な実施形態では、プーリング、パディング、及び/又はストライディングを用いて、畳み込みが実施される次元におけるCNNの出力のサイズを削減でき、これによって計算コストを削減でき、及び/又は過剰訓練の可能性を低減できる。ストライディングは、フィルタウィンドウがスライドするサイズ又はステップ数を記述でき、パディングは、ストライディングの前又は後にデータの一部のエリアをゼロで埋めてデータをバッファリングするステップを含むことができる。一実施形態では、例えばプーリングは、畳み込み層、又は他のいずれの層によって収集された情報を単純化するステップ、及び上記層内に含まれる上記情報の圧縮バージョンを生成するステップを含むことができる。
【0050】
いくつかの例では、領域ベースCNN(RCNN)又は1次元(1‐D)CNNを使用できる。RCNNは、選択的な探索を用いて、画像内の1つ以上の関心対象領域を特定するステップ、及び分類のために各領域から個別にCNN特徴を抽出するステップを含むことができる。1つ以上の実施形態で採用されるRCNNのタイプとしては、Fast RCNN、Faster RCNN、又はMask RCNNが挙げられる。他の例では、1‐D CNNは、スライディングウィンドウを用いて生成された固定長の時系列セグメントを処理できる。このような1‐D CNNは、プーリング及びストライディングを利用して最終的なCNN層の出力を連結する、多対1構成で実行できる。続いて、完全に接続された層を用いて、1つ以上のタイムステップで分類予測を生成できる。
【0051】
固定長カーネルを入力信号に沿って畳み込む1‐D CNNとは対照的に、リカレントニューラルネットワーク(RNN)は、各タイムステップを順次処理するため、RNN層の最終的な出力は、全ての先行するタイムステップの関数となる。特定の実施形態では、長短期記憶(long short‐term memory:LSTM)モデルとして知られるRNNの変形例を使用できる。LSTMは、長いシーケンスにおける時間依存性をモデル化するために、メモリセル及び/又は1つ以上の制御ゲートを含むことができる。いくつかの例では、LSTMモデルは一方向のものとすることができ、即ち上記モデルは時系列を、記録又は受信された順に処理する。別の例では、全ての入力シーケンスが利用可能である場合、2つの並列のLSTMモデルを、時間的に前方へ及び後方への両方で、反対方向に評価できる。2つの並列LSTMモデルの結果を連結して、双方向の時間依存性をモデル化できる双方向LSTM(bidirectional LSTM:bi‐LSTM)を形成できる。
【0052】
いくつかの実施形態では、1つ以上のCNNモデルと1つ以上のLSTMモデルとを組み合わせることができる。この組み合わせモデルは、4つのストライディングされていないCNN層の積層を含むことができ、これに2つのLSTM層及び1つのソフトマックス分類器が続くことができる。ソフトマックス分類器は、入力の指数関数に比例する多数の確率を含む確率分布を正規化できる。CNNへの入力信号は例えばパディングされないため、層がストライディングされていなくても、各CNN層は時系列を数サンプル分だけ短縮する。LSTM層は一方向のものであるため、最終的なLSTM出力に対応するソフトマックス分類は、訓練及び評価だけでなく、スライディングウィンドウセグメントからの出力時系列の再構築にも使用できる。ただし、この組み合わせモデルは多対1構成で動作できる。
【0053】
2.1 分類のための、例示的なペットの放射線医学画像
図1は、特定の実施形態による、1つ以上の機械学習モデル又はツールによる処理の前後の放射線写真画像を示す。図1の例では、処理前画像110はペットの心臓のX線画像を示す。従って処理前画像110は、1つ以上の機械学習モデル及び/又はツールによってまだ処理されていない。処理後画像120は心血管として分類され、心肥大として識別されるように下位分類又は更に分類されている。分類は、処理前画像110に含まれる1つ以上の特徴に基づくものである。具体的には、分類に使用される処理前画像110の1つ異常の特徴としては、ペットの心臓のサイズ及び形状、並びに/又はペットの胸郭若しくは別の身体部分といった他の身体部分に対する心臓の関係が挙げられる。
【0054】
2.2 ペットの放射線医学画像のためのラベル
図2は、訓練された獣医放射線科医又は他のいずれの獣医専門家によって、入力画像210への適用のために選択できる、ラベル220の例を示す。ラベル220は例えば、少なくとも5個の異なる分類、及び少なくとも33個の異なる下位分類又は更なる分類を含むことができ、その範囲は常に増大している。第1の分類は、心血管とすることができる。この心血管の分類に関連付けられた下位分類は、心肥大、胸骨心臓スコア(Vertebral Heart Score)、右心室拡大、左心室拡大、右心房拡大、左心房拡大、大動脈拡大、主肺動脈拡大とすることができる。第2の分類は、肺構造とすることができる。肺構造に関連付けられた下位分類としては、間質‐非構造性、間質‐結節、肺胞、気管支、血管、肺腫瘤が挙げられる。第3の分類は、縦隔構造とすることができる。縦隔構造に関連付けられた下位分類としては、食道拡張、気管虚脱、気管逸脱、リンパ節拡大、腫瘤が挙げられる。第4の分類は胸膜腔とすることができ、これは、胸膜滲出液、気胸、胸膜腫瘤といった下位分類に関連付けられていてよい。第5の分類は胸腔外とすることができ、これは、脊椎症、頸部気管虚脱/気管弛緩、変形性関節症、胃部膨満、腹水/細部の減少、椎間板疾患、脱臼/亜脱臼、進行性病変、肝腫大、胃内の異物、腫瘤/結節/脂肪腫といった下位分類に関連付けられていてよい。
【0055】
特に、特定の非限定的な実施形態によると、入力画像210は、アノテーション付与及び/又はラベリングされていてよい。ラベルを割り当てる方法の一例は、1つ以上の関連する放射線医学レポートからテキストを画像の本体に入力できる、自動化された自然言語処理(「NLP」)モデルの使用であってよい。別の例では、訓練された獣医放射線科医が、抽出された全画像に手動でラベルを適用できる。
【0056】
特定の非限定的な実施形態では、アノテーション又はラベル付き画像を用いて、機械学習モデル又はツールを訓練できる。換言すれば、決定される分類は、画像に含まれるアノテーション又はラベルに基づくものとすることができる。このモデルは、例えば2つの個別のステップを用いて訓練できる。第1のステップでは、NLPモデルを用いてラベリング又はアノテーション付与した画像を用いて、CNN等の機械学習モデルを訓練できる。第2のステップでは、訓練された獣医放射線科医(即ち専門家)によってラベリングされた、抽出された画像を用いて、訓練済みの上記機械学習モデルを更に訓練できる。例えば限定するものではないが、機械学習モデル又はツールのアーキテクチャは、DenseNet‐121、ResNet‐152、ShuffleNet2、ResNext101、GhostNet、EfficientNet‐b5、SeNet‐154、Se‐ResNext‐101、Inception‐v4、Visual transformer、SWIN transformer及び/又は他のいずれの訓練ツール若しくはモデルのうちの少なくとも1つによって、プログラム又は訓練できる。
【0057】
2.3 一実施形態におけるペットの放射線医学画像の分類
図3は、機械学習システムを用いて画像を分類及びラベリングするための例示的な方法を示す。図3の例では、方法300は第1のステップ310で始めることができ、ここで、デバイスにおいて画像を受信又はキャプチャできる。上記画像は1つ以上の特徴を含み得る。
【0058】
第2のステップ320では、上記システムは、上記1つ以上の画像それぞれについて、対応する分類を生成でき、上記分類は機械学習モデルによって生成され、また上記分類は上記1つ以上の特徴に関連付けられている。
【0059】
第3のステップ330では、上記システムは、上記対応する分類、及びラベリングされた特徴を、ネットワークに送信できる。
【0060】
第4のステップ340では、上記システムは、上記対応する分類を、上記ネットワーク上のクライアントデバイス又は別のコンピューティングデバイス上に表示できる。
【0061】
3.0 AdjustNet:ペットの放射線医学画像の配向のための自動化された技法
一実施形態では、本開示は、DICOMメタデータ又は左右マーカーに依存しない、獣医用放射線写真における正しい解剖学的配向の自動化された決定のための方法を提供する。本開示はとりわけ、DICOMメタデータ又は左右マーカーに依存せず、また大規模な遠隔放射線医学の実践において使用するための新規のリアルタイム展開能力を含むことができる、臨床解釈のために獣医用放射線写真における正しい解剖学的配向を決定するための1つ以上の深層学習モデルも提供する。本開示の主題は、品質管理、患者の安全、アーカイブの修正、及び放射線科医の効率の向上を含む多様な臨床撮像用途に、情報を提供できる。一実施形態では、獣医用放射線写真における正しい解剖学的配向の自動化された決定のためのモデルを、AdjustNetと呼ぶことができる。一実施形態では、AdjustNetは2つの下位モデルを含む。第1の下位モデルは、ペットの放射線撮影画像の正しい回転を決定するための、RotationNetと呼ばれる3つの訓練済み機械学習ニューラルモデルのアンサンブルを含む。第2の下位モデルは、ペットの放射線撮影画像を反転させるべきかどうかを決定するための、FlipNetと呼ばれる3つの訓練済み機械学習ニューラルモデルのアンサンブルを含む。一実施形態では、AdjustNet、RotationNet、及びFlipNetを、本開示の本セクションで詳述されるように構造化、訓練、及び使用できる。
【0062】
放射線写真撮影は、無数の重要な医学的状態の診断にとって重要である。最適な臨床解釈には正確な画像の配向が重要であるが、デジタル画像メタデータのエラーによって、手動での介入を必要とする不適切な表示がもたらされる場合があり、これは臨床ワークフローの品質及び効率の最大化のための取り組みを妨げるものである。
【0063】
更に、放射線写真撮影においては、露出設定、1つ以上の処理技法、及び解剖学的配向を含む、放射線科医による臨床解釈に影響を及ぼす複数の重要な考慮事項がワークフローに存在する。これらの考慮事項は、Digital Imaging and Communications in Medicine(DICOM)汎用画像ファイルフォーマットにテキストメタデータとして組み込まれて、DICOMビューワを用いた閲覧及び放射線医学的解釈のためのピクセルデータに付随する。標準化されたDICOM画像ファイルの規則にもかかわらず、特に画像の配向に関するメタデータ情報の不一致は一般的であり、これは医学的解釈のタスク中の実践ワークフローの非効率につながる。手動での画像の再配向が、解釈前に必要となる。更に、大半の放射線医学の実践では、患者の位置を示す左右マーカーを用いて放射線写真撮影が実施されるが、このような実践は不均一でエラーが発生しやすく、これもまた同様の画像配向エラーにつながる可能性がある。従って、正確なDICOMメタデータ又は左右マーカーに依存しない、適切なDICOM放射線撮影画像の配向のための自動化されたソリューションは、放射線科医のワークフローを大幅に改善し、解釈のエラーを削減し、品質の改善及び教育の取り組みに寄与し、遡及的な医療画像データのデータサイエンスキュレーションを促進する可能性がある。
【0064】
一実施形態では、本開示は、正確で自動化された放射線撮影画像の配向の検出を達成するための、様々なネットワークアーキテクチャを提供する。ある実験では、畳み込みニューラルネットワークアーキテクチャを、50,000個のアノテーション付き獣医学放射線画像のデータセットを用いて開発し、0、90、180、及び270°からの、正確で自動化された放射線撮影画像の配向の検出と、解剖領域及び臨床症状にわたる水平及び垂直方向の反転とを達成した。
【0065】
一実施形態では、正確に配向された画像のタスクのためにモデルを訓練できる。モデルは、シングルモデル又は2ステージモデルとすることができる。非限定的な実施形態では、複数の異なる重み初期化技法をモデルの開発に使用できる。例えば、転移学習アプローチを、(例えばImageNetで)事前訓練されたモデルの重みを用いて実施でき、又はモデルをランダムに初期化した後、拡張データで更に事前訓練できる。非限定的な実施形態では、1つ以上の様々な訓練パイプラインを、モデルの開発に使用できる。例えば上記モデルを、拡張データを用いて事前訓練した後、実際のデータを用いて微調整できる。上記モデルを、拡張データ及び実際のデータで合同訓練することもできる。特定の実施形態では、本開示の主題を、訓練済みニューラルネットワークの畳み込み層の特徴マップの加重和の計算に使用できる。
【0066】
本開示の以下のセクション3.1~3.4は、とりわけ、様々な実施形態におけるAdjustNet及びそのコンポーネントのデータキュレーション、データアノテーション、データ拡張、訓練、及びテストについて説明する。
【0067】
3.1 入力データ及びワークフロー
倫理審査委員会によって承認されたある研究では、DICOMフォーマットで50,000件の検査のデータセットが得られた。検査はランダムに選択された。検査量の分布を表1に列挙する。
【0068】
【表1】
【0069】
全てのDICOM画像を最初に高解像度のJPEG2000フォーマットに変換し、続いて512ピクセルという更に大きなサイズのPNGに変換した。画像を256×256ピクセルにリサイズした後、0.8の画像クロップ及びランダムズーム(100%~120%)を用いて、データ拡張に関して本明細書中で更に説明されているように、画像内の左右マーカーが最小となるように中央をクロップした。訓練セットは1550個の画像を含み、検証セットは350個の画像(及び拡張)を含んでいた。
【0070】
図5は、画像配向タスクのための例示的なワークフローを示す。
【0071】
図5に示されているように、14年の経験を持つ委員会認定の獣医放射線科医が、反復的なラベリングプロセスによって、画像検査にアノテーションを付した。251個の画像の初期データセットを人間の専門家がレビューした後、上記初期データセットを用いてモデル化を実施した(モデルの訓練に関して本明細書中で更に説明されているように、この後、訓練済みモデルを用いて、人間によるレビューのために新たな検査を選択し、人間の専門家によるレビューに基づくと不正確とされた画像に集中することにより、困難な検査に焦点を合わせたモデルの訓練のために更なるデータを提供した)。このプロセスを5回繰り返し、合計1550個の画像に、人間の専門家がアノテーションを付した。データセットの分類の不均衡を理由として、正しく配向された画像の回転及び反転によって、拡張を実施した。初期モデルが過去の研究と同様に、配向の決定のために左右マーカーの位置に依存することが判明したため、クロップも実施されたが、図6に関連して更に説明されるように、これは、専門家である人間のレビューの後のデータセット内の正確に配向されていないナイーブ画像の分析において信頼性が低かった。
【0072】
図6は、ネコの頭蓋骨の、正しく配向されていない画像の例と、正しく配向された画像の例の、放射線写真画像を示す。
【0073】
特に図6は、ネコの頭蓋骨の放射線写真の、正しく配向されていない画像の例(左)と、正しく配向された画像の例(右)とを示す。左右マーカーは画像内で目立つように表示されているが、このケースでは不正確に適用されていた。
【0074】
3.2 モデルの開発
まず、画像を正しく配向するタスク(回転及び反転の両方)のために、単一のモデルを訓練した。このマルチクラスモデルは、8個の出力ニューロン(0‐反転なし、90‐反転なし、180‐反転なし、270‐反転なし、0‐反転、90‐反転、180‐反転、270‐反転)を有していた。表2は、訓練セット、検証セット、及びテストセットにおける、ラベルごとの放射線写真研究数を示す。
【0075】
【表2】
【0076】
次に、2ステージの段階的アプローチを用いて、画像を正確に回転させるために1つのモデルを訓練した後、画像を正確に反転させるために第2のモデルを訓練することによって、画像の再配向を自動化した(図7を参照)。
【0077】
図7は、特定の非限定的な実施形態による、アンサンブルによる例示的な2ステージモデル技法の図を示す。
【0078】
特に図7は、各タスク(回転と、それに続く反転)のアンサンブルによる例示的な2ステージモデルのアプローチを示す。各ステップは、所与のタスクのために訓練された3つの異なるモデルアーキテクチャからなり、実際のヒューリスティックでは、画像の所与の再配向を実施する前に3つのモデル全てが一致する必要があった。Rotation Network (RotationNet)及びFlip Network(FlipNet)について、異なる複数のCNNアーキテクチャ(ResNet、Xception、及びDenseNet121)を訓練し、これらのパフォーマンスを比較した。以下の2つの異なる重み初期化技法を使用した:(1)ImageNetで事前に訓練されたモデルの重みを用いて、転移学習アプローチを実施し、(2)これらのモデルをランダムに初期化した後、拡張データで更に事前訓練した。また、以下の2つの異なる訓練パイプラインを使用した:(1)上記モデルを拡張データで事前訓練した後、実際のデータで微調整し、(2)上記モデルを拡張データ及び実際のデータで合同訓練した。一実施形態では、拡張データ及び実際のデータで合同訓練された、ランダムに初期化されたモデルは、本開示のデータ収集プロセスの複数回の反復における正確度の点で、他のアプローチより優位であった。従って一実施形態では、このアプローチを用いて最終的なモデルを訓練した。
【0079】
一実施形態では、訓練済みニューラルネットワークの最後の畳み込み層の特徴マップの加重和を計算することによって、Grad‐CAMを使用した。重みは、分類ラベルの勾配の合計を特徴マップの重みに対して正規化することによって決定された。これらの加重和を、入力画像の画像サイズにリサイズし、RGB画像に変換して、元の入力画像に重ね合わせた(図8を参照)。
【0080】
図8は、画像の配向に関するモデル決定に使用されるGradCAM変換の例示的な画像を示す。
【0081】
図8に示されているように、一実施形態では、結果として得られる画像を用いてモデルを批判し、拡張プロセスに情報を提供した。図8は、画像の配向に関するモデル決定に使用される画像のピクセルを示すGradCAM変換を示す。重要なこととして、一実施形態ではピクセルに左右マーカーが含まれない。心強いことに、展開にモデルを用いた場合に手動変換に必要となる研究の数は、モデルを使用しない場合に比べて50%減少した。
【0082】
全てのモデルは、2つのTesla V100グラフィックスプロセッシングユニット(graphics processing unit:GPU)上で訓練された。上記モデルはクロスエントロピー損失を最小限に抑えるように設計されており、Adamオプティマイザをデフォルトのパラメータ及び1×10-3の学習率で使用し、モデルが検証の正確度を約2エポックにわたって上昇させなかった場合には学習率を0.1倍だけ低下させた。正しく配向されていないのは全画像のわずか10%であるため、実稼働環境で有用となるためには高い精度が必要であった。従って、3つのネットワークが回転又は反転に関して満場一致で合意しなければならないアンサンブル戦略を利用した。
【0083】
3.3 モデルの展開
一実施形態では、Dockerコンテナ内でホストされ、ReSTful APIを介して呼び出すことができるマイクロサービスを用いて、2ステップモデルを一元的に展開でき、これにより、最適な推論速度のためにモデルをメモリ内に恒常的に常駐させることができる。そして、モデルの出力を、AIパイプライン全体の中で展開される追加のAIモデルの入力として使用できる。モデルの予測を伴う各画像は、最終的に中央リポジトリにアーカイブできる(図9を参照)。
【0084】
図9は、例示的なモデル展開ワークフローの図を示す。
【0085】
ある研究では、リアルタイムの予測影響について生成後のモデルの影響を定量化するために、生成モデルを24時間にわたってワークフローから除去し、ウェブユーザインタフェース(UI)ログを用いて、診察を行う放射線科医が研究時の解釈中に1つ以上の放射線写真の回転及び/又は反転といった手動変換を実施する必要がある例をキャプチャした。全研究期間からのデータを、研究の終点まで3時間ずつシフトされたスライディングウィンドウを用いて、重複する24時間のバッチにまとめた。関心対象の指標は、1つ以上の手動変換を伴う研究の割合であった。図9の赤色のセクションは、モデルがオフに切り替えられていた期間を示し、手動変換の増大におけるラグは、研究がシステムに受信される時点と放射線科医が研究用画像を評価する時点との間のラグタイムによるものである。
【0086】
3.4 ユーザフィードバック
ある研究では、解釈を行う放射線科医による、自動化されたRotationNetを用いた体験を決定するために、展開後の放射線科医ユーザの調査が行われた。リッカート尺度の回答オプションを用いて以下の4つの質問を実施した:(1)自動化された放射線写真配向モデル(RotationNet)の実装が、臨床作業効率にどの程度影響したか、(2)自身の進行中の臨床ワークフローにおいてRotationNetの使用を推奨するかどうか、(3)RotationNetを臨床的に使用するべきではない状況は存在するか、及び(4)コメント/懸念事項があれば記入する。調査は、遠隔放射線科医、研究者と遠隔放射線科医のハイブリッド、及び開業医と遠隔放射線科医のハイブリッドの混合である79人の放射線科医に送られ、20.2%が調査に回答した。臨床作業効率への影響に関して、回答者の88%が、臨床作業効率への影響を4又は5(「比較的良好」又は「極めて良好」)とランク付けした。2人の回答者は、臨床作業効率への影響を、3「悪くも良くもない」とランク付けした。臨床作業効率へのRotationNetの影響が悪いものであると感じた回答者はいなかった。回答者の94%は、RotationNetを自身の進行中の臨床ワークフローで使用することを推奨すると述べ、確信を持っていないのは1人だけだった。RotationNetを推奨しないと述べた回答者はいなかった。RotationNetを臨床的に使用するべきではない状況が存在するかどうかを尋ねたところ、69%が「ない」と述べたものの、残りは確信を持てなかった。確信がないという回答は全て、機械学習に関する個人的知識が不足していることによるものであった。自由回答形式のコメント(上記調査の質問4)の大半(コメントを残した者の80%)は、RotationNetが画像を適切に回転させられなかった場合、又は定期的なメンテナンス若しくはアップグレードによってRotationNetがオフラインとなった場合の、放射線科医の感度の向上を対象とするものであった。1人の回答者は、断面画像が個々の好みに合ったものとなることを楽しみにしているとコメントした。残りの回答者は前の回答を繰り返すか、又は自身の作業環境に関する概ね肯定的なコメントを述べた。
【0087】
表3A及び表3Bは、異なる複数のモデル化アプローチの正確度を示す。所与のタスクに関するモデルの精度(上)及びエラー(下)。回転タスク(行)及び反転タスク(列)の両方について、アンサンブルモデルが最も高いパフォーマンスを達成したことに留意されたい。
【0088】
【表3A】
【0089】
【表3B】
【0090】
放射線科医にとって、解釈前に画像を操作して適切に配向するために、時間的かつ認知的な労力を費やすことは一般的なことであり得る。放射線写真撮影法では、これは、最初に配向が正しいかどうかを判断するステップと、これに続く、画像内及び画像間で切り替え、反転、及び回転を複数回実施するステップとを含む。個々の研究については、この労力はさほどのものではないが、多数の放射線科医による多忙な実践の中でこれが集まると、単に不便というだけでなく、適切に配向されていない画像を手動で調整するこの非効率さが、エラー、治療の遅延、及び医師の疲労につながる恐れがある。ある研究の目的は、臨床解釈のために獣医用放射線写真における正しい解剖学的配向を決定するための、1つ以上の深層学習モデルの開発を調査して、大規模な遠隔放射線医学の実践における新規のリアルタイム展開体験を説明することであった。上記研究により、データ拡張技法によって全てのモデルが大幅に改善され、3つのモデルのアンサンブル(RotationNet)が最高のパフォーマンス(エラー率0.01未満)を達成し、関連する研究において報告されている最新技術を上回ったことが分かった。更に、24か国以上の4,600件を超える病院の、1か月に300,000件の受信DICOMファイルを処理する実際の運用環境において、RotationNetを展開することに成功したことにより、臨床放射線科医による手動介入が必要な研究の数が50%減少した。RotationNetを実際に使用した、医療画像の自動化されたDICOMの配向は、大規模な実稼働環境で、最先端の、又はそれよりも良好な、パフォーマンスが最適化された臨床画像解釈ワークフローを達成した。
【0091】
図10は、特定の非限定的な実施形態による、エラー分析に使用される例示的な画像を示す。
【0092】
エラー分析を偽陽性及び偽陰性に対して実施した。エラーの例を図10に示す。特に図10は、AdjustNetモデルの例示的なエラー分析画像を示す。図10は、イヌの前肢の放射線写真(左、「L」で標識)を示し、ここでは、モデルはこの画像が90°の回転を必要とすると誤って予測したが、この画像は元の状態において正しく配向されていた。図10は、イヌの放射線写真(右、「R」で標識)を示し、ここでは、モデルはこの画像が180°の反転を必要とすると誤って予測したが、この画像は元の状態において正しく配向されていた。
【0093】
一実施形態では、RotationNetは、DICOM又は左右データを用いずに多数の検査を遡及的に自動でエンコードするために使用でき、またこれは、誤った配向、DICOMメタデータのエラー、又は正しくない左右マーカーに関する診療所へのフィードバックといった、他のタスクにも有効となり得る。一実施形態では、RotationNetは、解釈の提出後ではなく即時かつ一貫したフィードバックの適用のために、放射線技師へのフィードバックとして診療現場で適用でき、これは、エラー(例えばフラッギングエラー)を削減するための認識及びベースライン機能を改善できる可能性を有している。
【0094】
4.0 RapidReadNetを用いたエンドツーエンドでのペットの放射線医学画像の処理
一実施形態では、本開示は、RapidReadNetと呼ばれる機械学習ニューラルモデルを提供する。一実施形態では、RapidReadNetは、ペット又は動物の放射線撮影画像において検出可能な様々な病理に対応する41の所見に関連付けられた、マルチラベル分類器としてプログラムできる。一実施形態では、RapidReadNetは、本開示の本セクションで詳述されるように構造化、訓練、及び使用できる。
【0095】
4.1 一実施形態における、RapidReadNetを訓練するための画像データセット
訓練データセットとして大規模な画像セットを使用して、プログラムされた学習ニューラルモデルを訓練することは、有益であり得る。様々な実施形態において、ラベリングされていない訓練データに、人間である本主題の専門家が、及び/又は既存の機械学習モデルがラベリングすることによって、1つ以上のラベリング済み訓練データセットを生成できる。
【0096】
図11は、一実施形態における、モデル化のために評価される画像のプールを示す。この例では、2007~2021年の390万枚を超える獣医用放射線写真を含むプールを評価した。様々な実施形態において、画像は、訓練データセットとして使用される前にダウンサンプリング又はその他の前処理を受ける場合がある。図11に示されている研究では、390万枚の放射線写真の大半は、1024ピクセル(px)の固定幅にダウンサンプリングされた非可逆(品質89)JPEG画像として過去にアーカイブされたものである(以下の表4の「セット1」)。残りの放射線写真の大半は、小さい方の寸法(幅又は高さ)が1024pxとなるようにダウンサンプリングされた(ロスレス)PNG画像として提供された(表4の「セット2」)。
【0097】
【表4】
【0098】
図12は、画像を臨床ワークフローの一部として収集できる、一実施形態のX線システムのインフラストラクチャを示す。画像の最終サブセットを、現在の臨床ワークフローの一部として収集した(図12)が、ここで提示されたDICOM画像は、512ピクセルの固定高さにダウンサンプリングされた後、PNG(表4の「シルバー」)に変換された。全ての場合において、ダウンサンプリングプロセスは元のアスペクト比を保持していた。この例では、全ての画像がメタデータとしての元のDICOMタグのサブセットと共に提供された。この例では、全ての画像/研究が、図11に示されているように、14年の期間の間に受け取った様々なクライアント病院及び診療所(N>3500)からの実際の臨床症例をカバーしている。
【0099】
特定の実施形態では、多数のフィルタリングステップをモデル化の前に適用できる。この例ではまず、ImageMagickを用いて、重複した複雑度の低い画像を除去した。この例では次に、この目的のために訓練されたCNNモデルを用いて、画像のアーティファクト、及び無関係なビュー又は身体部分をフィルタリングで除外した。10個を超える画像を用いた研究も除外された。390万枚の獣医用放射線写真のうち、725,000人を超える個別の患者を表すおよそ270万枚の画像が、フィルタリング後に残った。
【0100】
特定の実施形態では、モデル化の次のステップは、アノテーション及びラベリングを含むことができる。この例では、41の異なる放射線医学的観察結果(以下の表5を参照)の存在について、画像にアノテーションを付した。
【0101】
【表5】
【0102】
この例では、大部分の画像(2020年より前の研究)について、自動化された自然言語処理(NLP)ベースのアルゴリズムを用いて、対応する(研究ごとの)放射線医学レポートから、ラベルを抽出した。実施形態では、別の方法を用いて放射線医学レポートからラベルを抽出することもできる。実施形態では、この初期ラベリング済みデータは、いずれの機械学習モデルを用いずに、例えば人間の専門家を用いて、生成できる。この例では、放射線医学レポートは、ある特定の研究の全ての画像を要約したものであり、2000人を超える異なる委員会認定獣医放射線科医によって執筆された。この例では、直近の研究からの画像(2020~2021年;図4の「シルバー」)は、獣医放射線科医が該研究の評価を終了した直後に、該獣医放射線科医によって個別にラベリングされた。
【0103】
様々な方法を用いて、訓練済みモデルの正確度及びアノテーター間のばらつきを評価できる。この例では、12人の追加の放射線科医によってラベリングされる「シルバー」セットから、少数の画像(N=615)をランダムに選択した。これらのデータは訓練又は検証には使用されなかった。ROC及びPR分析のためのグラウンドトゥルースラベルを生成する1つの方法は、多数決投票によって各画像のラベルを集計することである。この例では、12人の放射線科医の過半数が、ある所見の存在を示した場合、この所見をグラウンドトゥルースラベルとして使用する。偽陽性率(False Positive Rate:FPR)及び感度の点推定値は、上記放射線科医のラベルを、他の11人の多数決投票と比較することによって計算された。
【0104】
この例では、放射線医学レポートの「所見」セクションからのラベルの自動化された抽出を、従来技術で公知の規則ベースラベリングソフトウェアの修正バージョンを用いて実施した。しかしながら、表5に示されているように、ラベルの個数は41に拡張された。
【0105】
この例では、レポートは、ある研究の全ての画像からの観察結果を含んでいたものの、これらの観察結果を特定の画像ファイルと明示的にリンクさせるものではない。従ってこの例では、あるレポートから抽出された研究ごとのラベルを、対応する研究の全ての画像にまず適用した後、専門家が提供する規則のセットを用いてマスキングした。このように規則を使用することによって、ラベルを、対応する身体部分を示す画像のみに、確実に適用できる(例えば「心肥大」ラベルを骨盤の画像から除去できる)。マスキングの詳細については、本明細書中で更に具体的に説明する。
【0106】
この例では、個別にラベリングされたデータのデータセット:
【0107】
を、獣医放射線医学レポートに適合したラベラーによってラベリングされたデータ
【0108】
と共に使用した。実施形態では、各所見
【0109】
を、0(陰性)、1(陽性)、又はu(不確定)として入力でき、個々の画像のレベルではなく放射線医学レポートのレベルで決定できる。従ってラベルノイズがデータセットに存在する可能性がある。
【0110】
4.2 画像分類タスクのためのニューラルモデル訓練技法
一実施形態では、1人以上の人間である本主題の専門家によってアノテーションを付された画像データセットと、訓練済み自然言語処理(NLP)モデルを用いてアノテーションを付された、更に大きい可能性があるデータセットとを、複数のラベルを使用するケースに適合された蒸留アプローチによって、組み合わせることができる。一実施形態では、教師モデルθ を、人間がアノテーションを付したデータセットを用いて訓練でき、訓練プロセスにノイズを加えることができる:
【0111】
【数1】
【0112】
続いて、教師モデルを用いて画像のソフト擬似ラベル
【0113】
を推論できる。推論ステップでは、ノイズは使用できない:
【0114】
【数2】
【0115】
一実施形態では、規則:
【0116】
【数3】
【0117】
を用いて、上記ソフト擬似ラベルをNLP派生ラベルと組み合わせることができる。
【0118】
一実施形態では、上記派生ラベルを用いて1つ以上の生徒モデルを訓練できる。例えば、同等以上の生徒モデルθ を、上記生徒にノイズを加えることによって訓練できる:
【0119】
【数4】
【0120】
特にいくつかの実施形態では、上記ソフト擬似ラベルを、NLP生成ラベルと組み合わせなくてもよい。
【0121】
一実施形態は、新規の訓練データがシステムにストリーミングされるか又は他の方法で取得されるときに、Active Learningプロセスを用いて上記生徒モデルのうちの1つ以上をアップデートできる。一実施形態では、上記生徒モデル(又は上記生徒モデルのアンサンブル)のうちの1つを、新たな教師として機能するようにプログラムでき、上記プロセスを、上記第1のステップを用いずに再実施できる。一実施形態では、上記Active Learningプロセスは、新たにラベリングされたデータをシステムが大量に受信するたびに開始されるように、プログラムに従ってトリガできる。
【0122】
特定の実施形態では、生徒モデル及び教師モデルは、多様な異なる複数の人工ニューラルネットワークアーキテクチャに従ってプログラムできる。各モデルについて、バッチサイズの決定のためにメモリに収められる画像の数を最大化できる。この例では、これによってバッチサイズが32~256となった。この例では、異なる複数の画像入力サイズ(224×224~456×456)が使用され、いずれも、元の画像を入力寸法へと再整形することによって、及び画像を正方形にゼロパディングしてから元の画像の比率をそのまま維持するようにリサイズすることによって、訓練された。訓練時には多数の画像拡張技法を実施できる。この例では、モデルを事前訓練し、最大30エポック訓練したが、バリデーションロスが2エポック連続で減少しなかった場合には早期に停止される。
【0123】
一実施形態では、各所見の確率を較正するために、区分的線形変換
【0124】
【数5】
【0125】
を全ての所見φに適用できる独立した検証セットでYoudenのJ統計を最適化するために、optφを設定できる。
【0126】
一実施形態では、動物及び/又はペットの放射線医学画像といった標的放射線医学画像の分類に使用される、最終的な訓練済み機械学習モデルは、個別の較正済みディープニューラルネットワーク生徒モデルのアンサンブルとすることができる。ある実施形態では、出力を平均することで、投票よりも良好な結果が得られる場合がある。この例では、検証セットに基づいて8個の最良のモデルを使用し、最良サブセット法を用いて最適なアンサンブルを決定した。驚くべきことに、最良のサブセットは、8個のモデルのフルセットであり、換言すれば、該アンサンブルの残りに対してパフォーマンスが劣るモデルを含んでいた。この例では、パフォーマンスが劣るこれらのモデルは、生徒モデルのアンサンブルに含まれている場合には依然として、全体的な予測に役立った。個別の較正済みディープニューラルネットワークのアンサンブルを含む最終的なモデルを、RapidReadNetと呼ぶことができる。
【0127】
4.3 ドリフト分析、実験結果、及び縦ドリフト分析
1つの例以外から得られた画像の差異を補償する必要性を評価するため、及び産業上での使用のために、ドリフト分析を実施できる。例えば、システムの開発時、画像X、…X及び画像ごとの所見Y、…Yは、同時分布Pdev(X、Y)から引き出されたものとして見ることができる。現実世界での応用においては、画像及び所見は分布Pprod(X、Y)から提示できる。この例の規模の獣医放射線学では、品種の変化、放射線医学設備の違い、又は異なる地域での臨床的実践の違いを含む複数の潜在的な要因が、これらの分布の間の差につながる可能性がある。共変量シフト、換言すれば周辺分布の変化
【0128】
【数6】
【0129】
を調査して、モデルのパフォーマンスに対するその影響を分析できる。共変量シフトの検出のために、Alibi‐Detectソフトウェアを用いてオートエンコーダを訓練できる。一実施形態では、オートエンコーダ
【0130】
は、Θに関して
【0131】
を最小化するように、開発時に訓練できる。続いて、訓練されたオートエンコーダを用いて、生成時に画像を再構築し、再構築エラーを分析できる。
【0132】
図13~17は、複数の放射線科医によってラベリングされた615個の画像のセットに関するROC分析及びPR分析の結果を示し、心血管/胸膜腔所見(図13A及び13B);肺所見(図14及び図14B);縦隔所見(図15A及び15B);並びに胸腔外所見(図16A及び16B)について、モデルの予測と放射線科医のラベルとを比較している。各図は、所見ごとのROC(上)及びPR(下)曲線、並びに各放射線科医のFPR、精度、及び再現率(感度)の点推定値を示す。陽性ラベルが5個未満の所見は分析しなかった。モデルの正確度は、個々の放射線科医の正確度に匹敵し得る。
【0133】
縦ドリフト分析も実施した。この例では、オートエンコーダを、アーカイブされた全ての画像(表4のセット1及び2を参照)を用いて訓練した後、その後の研究からの画像に適用して、それぞれのL2再構築エラーをチェックした。
【0134】
図18は、週ごとの再構築エラーを視覚化したものを示す。
【0135】
特に図18は、2020年11月から2021年6月までの週ごとにグループ化された、L2エラーの分布及び分位数を示す。図18の週次グラフに示されているように、分布間には差異がほとんど又は全く観察されなかった。これは、入力データが過去1年間にわたって一貫していたことを示しており、モデルが新たなクライアントからのデータに対してロバストであることを示唆している。知覚されるドリフトがないことは、部分的には、訓練データで示される組織及び動物の多様性が高いことに起因する可能性がある。
【0136】
図19は、示されている組織の個数の関数としての、再構築エラーの分布を示す。特に図19は、少数の組織(1、6、…、16個の組織)からのデータが、画像データの全体的な多様性を良好に表現していないように思われることを示している。
【0137】
特に、手作業でラベリングされたテストセットで、データサイズとモデルのパフォーマンスとの間に正の関係が観察された。Efficient‐Net‐b5を、サイズが異なるデータのサブセットで訓練し、結果として得られたモデルを同じテストセットで試験した。結果は表6で観察でき、この結果は、データのスケーリングによってパフォーマンスが更に向上する可能性を示唆している。表6は、1人の委員会認定放射線科医のグラウンドトゥルースに対する、30,477個の未確認のテストデータポイントに関するモデルのメトリクスを示す。全てのデータは、臨床生成環境でラベリングされた。
【0138】
【表6】
【0139】
表7(下記)は、各所見に関する研究ごとのROCの結果を示す。Npositiveの列は、(合計9,311件の研究のうち)少なくとも1つの陽性ラベルを有する研究の件数を列挙する。受信者操作特性曲線下面積(AUROC)、偽陽性率(False Positive Rate:FPR)、及び感度は、陽性例(Npositive)が10件未満の所見については計算されなかった。
【0140】
【表7】
【0141】
4.4 一実施形態におけるRapidReadNetのためのシステムアーキテクチャ及び方法
ある例示的なインフラストラクチャパイプラインは、Dockerコンテナを用いて展開されるマイクロサービス(Rest‐API)に依存し得る。各コンテナは、Sebastian RamirezのFastAPIフレームワークを用いてReST APIモジュールを展開でき、それぞれが一意の専門タスクを実行できる。一実施形態では、生成パイプラインは、毎日処理される大量の画像(例えば約15,000以上)に対応するために、メッセージブローカーを使用する非同期処理アプローチを含む。これは例えば、入ってくる各リクエストを保存するNoSQLデータベースの使用によって、及び保存された各リクエストを並列に消費するためのバックグラウンド処理機構であるRedis Queuerの使用によって、達成できる。
【0142】
モデルからの予測はJSONフォーマットで返すことができ、長期アーカイブ化の場合はMongoDBデータベースに、短期アーカイブ化の場合はRedis JSONストアに、直接保存できる。他の実施形態では、上記予測は、リレーショナルデータベース、クラウドストレージ、ローカルハードドライブ、データレイク、又は他の記憶媒体といった、別の種類のデジタルストレージに保存できる。非限定的な一実施形態では、(Redis JSON等の)短期ストレージを使用することにより、いくつかの文脈化の側面を含めた、研究レベルでの結果の集約を可能とすることができる。
【0143】
図12に最もよく示されているように、上記マイクロサービスは、以下のような機能要素で編成されたコードを実行できるDockerコンテナによって管理できる:(1)メッセージブローカー:今後のリクエストの事前処理、監視、及びディスパッチ;(2)モデルの供給:AIオーケストレーターモジュール、及び個別のモデルの供給、モデルはPytorchフレームワークを使用できる;(3)結果及びフィードバックループの保存:研究レベルでのモデルの結果の文脈化、結果の返送。
【0144】
メッセージブローカー層は、以下の5つのDockerコンテナを含むことができる:(i)Redisキューアー、(ii)Redisデータベース、(iii)Redis JSON、(iv)Redisキューワーカー、及び(v)Redisダッシュボード。入ってくる各画像は、(i)Redisキューアーモジュール(これは画像ファイルを、対応する研究全体のメタデータと共に、ディスク上に一時的にローカル保存する)を通して送られ、エントリを(ii)Redisデータベースのキューに追加する。ある実施形態では、Redisキューワーカーは、新たなリクエストについてRedisデータベースを検査して、上記リクエストをAIオーケストレーターに送るために、並行して実行される。このアーキテクチャは、1日に少なくとも15000以上の画像を処理できる。
【0145】
AIオーケストレーターコンテナは、他のセクションで説明されている様々なAIモジュールからの推論の実行を調整するようにプログラムできる。一実施形態では、予測が収集される最初のAIモデルは、AdjustNet(モデル1)である。一実施形態では、このモデル1は、放射線写真画像の配向をチェックする。次に、DxpassNet(モデル2)が、上記画像が、このアーキテクチャが所見の予測を実施している身体部位に対応しているかどうかを検証でき、上記予測は、RapidReadNet(様々な病理に対応する41個のラベルに関連付けられたマルチラベル分類器、表6を参照)からのタスクである。結果の文脈化は、サービスへの初期アップロード中に画像と共に提供された研究全体のメタデータを用いて実施できる。ある実施形態では、研究レベルでのこのような集約を達成するために、研究全体の画像の推論の全ての記録を、Redis JSONモジュールに一時的に保存でき、C言語統合型プロダクションシステム(C Language Integrated Production System:CLIPS)等の規則ベースのエキスパートシステムツールを、管理のために使用できる。規則ベースのエキスパートシステムツールを用いるある実施形態では、モデルの出力及び動物のメタデータに対して適用される規則を、放射線科医のレポートに関する文脈データの取得のために適用できる。ある実施形態では、PYTHON(登録商標)ライブラリがCツールと対話でき、規則は、新たなルールが定期的に作製される際の規則のダイナミズムをサポートするために、MongoDBデータベースを用いて保存される。他の実施形態は、異なるプログラミング言語、コードライブラリ、又はデータベースタイプを使用できる。更に、開示されている特定の機能を実装する他の実施形態は、より少数のAIモジュール、より多数のAIモジュール、又は異なるAIモジュールを備えることもできる。
【0146】
一実施形態は、フィードバックストレージループを備えることができる。一実施形態では、全ての記録は、(1)上で指定されているMongoDBデータベース等のデータベースにJSONフォーマットで保存でき、(2)埋め込まれた展開前及び展開後のインフラストラクチャを使用でき、(3)本開示のシステムを使用する診療所、放射線科医の数を指定するデータを含むことができ、(4)放射線科医がラベルに関するフィードバックを提供するためのワークフローを含むことができ、(5)半教師ありアプローチでデータが取得されるときに新たなラベルを追加するための方法を含むことができ、(6)プロセスのカナリア/シャドーによるパフォーマンスの記述を含む。
【0147】
図20は、機械学習ニューラルモデルを用いて、動物及び/又はペットの放射線医学画像といった放射線医学画像を分類するための、コンピュータ実装型の又はプログラムされた例示的な方法を示す。
【0148】
方法2000は、第1の複数の画像を含む第1のラベリング済み訓練データセットを受信することを含むステップ2002であって、上記第1の複数の画像の各画像はラベルのセットに関連付けられている、ステップ2002で開始されるようにプログラムできる。
【0149】
ある実施形態では、プログラム制御により、上記第1のラベリング済み訓練データセットで機械学習ニューラル教師モデルをプログラムに従って訓練することを含むステップ2004の実行を指示できる。
【0150】
ある実施形態では、プログラム制御により、NLPのために訓練された機械学習モデルを、第2の複数の画像の自然言語テキスト要約のデジタル電子表現を含む未ラベリングデータセットに、プログラムに従って適用することによって、上記第2の複数の画像を含む第2のラベリング済み訓練データセットを生成することを含むステップ2006の実行を指示できる。
【0151】
ある実施形態では、プログラム制御により、上記機械学習ニューラル教師モデルを用いて、上記第2の複数の画像の各画像に対して、対応するソフト擬似ラベルのセットをプログラムに従って生成することを含むステップ2008の実行を指示できる。
【0152】
ある実施形態では、プログラム制御により、上記第2のラベリング済み訓練データセットの各画像のための派生ラベルのセットを、上記ソフト擬似ラベルを用いて、プログラムに従って生成することを含むステップ2010の実行を指示できる。
【0153】
ある実施形態では、プログラム制御により、1つ以上のプログラムされた機械学習ニューラル生徒モデルを、上記派生ラベルを用いて訓練することを含むステップ2012の実行を指示できる。ある実施形態では、プログラム制御により、標的画像を受信することを含むステップ2014の実行を指示できる。
【0154】
ある実施形態では、プログラム制御により、上記生徒モデルのうちの1つ以上の線形アンサンブルを適用して、上記標的画像の1つ以上の分類を出力することを含むステップ2016の実行を指示できる。
【0155】
ある実施形態では、プログラム制御により、任意に、上記1つ以上のプログラムされた機械学習ニューラル生徒モデルのうちの1つ以上を、Active Learningによって、プログラムに従ってアップデートすることを含むステップ2018の実行を指示できる。
【0156】
本明細書で開示される実施形態は単なる例であり、本開示の範囲はこれらに限定されない。特定の非限定的な実施形態は、本明細書で開示される実施形態のコンポーネント、要素、特徴、機能、動作、又はステップを、全て含む場合も、一部だけ含む場合も、又は全く含まない場合もある。
【0157】
5.0 特定の実施形態の利点
5.1 RotationNetの技術的利点の例
特定の実施形態では、本開示のデータ拡張技法によって、獣医用放射線写真における正しい解剖学的配向の自動化された決定のための機械学習モデルが、大幅に改良された。実際、一実施形態では、RotationNetと呼ばれる3つの機械学習モデルのアンサンブルが優れたパフォーマンス(例えばエラー率0.01未満)を達成し、これは関連する研究において報告されている最新技術を上回った。更に、本開示の主題の展開に成功すると、臨床放射線科医の手動介入の必要を、少なくとも約10%、約20%、約30%、約40%、又は約50%削減できる。用語「約(about)」又は「およそ(approximately)」は、当業者によって決定された特定の値について許容可能な誤差範囲内であることを意味し、これは部分的には、上記値の測定又は決定方法、即ち測定システムの限界に依存することになる。例えば「約」は、当該技術分野の慣例に従って、3標準偏差以内、又は3を超える標準偏差以内を意味する場合がある。あるいは「約」は、所与の値の最大20%、好ましくは最大10%、より好ましくは最大5%、更に好ましくは最大1%の範囲を意味する場合がある。あるいは、特に生物学的システム又はプロセスに関して、この用語は、ある値の1桁以内、好ましくは5倍以内、より好ましくは2倍以内を意味する場合がある。
【0158】
ある例では、大規模な遠隔放射線医学的実践において、年間およそ300万枚の放射線写真が受信されて解釈され、そのうち最大20%は、適切にエンコードされた配向情報がDigital Imaging and Communications in Medicine(DICOM)メタデータ内に欠けているか、又は左右マーカーのエラーを有し、これは解釈時の画像の不正確な配向につながる。全体としてこれは、ビューワ内の画像を再配向するための、放射線科医の多大な労力につながり、下流の臨床上の意思決定における重大なエラーの可能性を高める。従来のシステムで報告されているパフォーマンス及び左右マーカーへの依存度は、臨床解釈には不十分であり、更にこれまでの研究では実際の実践ベースの展開データが実証されていないため、実践ベースのエビデンスを伴うDICOMメタデータに依存しない、自動化された画像配向のための新規の方法が必要である。一実施形態では、本開示はこのような新規のシステムを提供する。
【0159】
5.2 RapidReadNet、及び一実施形態におけるペットの放射線医学画像の分類のための本開示のエンドツーエンドシステムの、技術的利点の例
本開示の技術の実施形態は、自動化されたラベリングと蒸留とを組み合わせたデータ蒸留のためのモデリング及び方法を介して、イヌ及びネコにおける事前に定義された臨床所見の検出を可能にすることができ、自動化されたラベリングのみのアプローチに対してパフォーマンスの向上を示す。本開示では、データのスケーリング及びその様々なモデルとの相互作用が評価される。実施形態の経時的パフォーマンスを評価して、経時的な入力ドリフトと比較する。実施形態の展開プロセス、及びX線画像処理のためのより大きな深層学習ベースのプラットフォームの埋め込みについて、ここで説明する。本明細書に記載されているように、放射線科医のノイズの多い生徒を使用することにより、X線画像予測の堅牢性を高めることができる。高性能の深層学習診断システムを獣医分野の治療において大規模に適用することにより、人間用及び獣医分野の医療用撮像診断におけるこれらの有望な技術を臨床現場に導入する際のギャップに対処するために役立つことができる、重要な洞察を提供できる。
【0160】
本開示は、複数の重要な分野に革新をもたらす。一例では、ランダムに初期化されたネットワークは、ImageNetで事前訓練されたものよりも優れたものとなることができ、拡張データと実際のデータとを合同訓練すると、事前訓練・微調整パイプラインよりも優れたパフォーマンスを発揮できる。訓練中に、(データの拡張として回転及び反転を使用する)ImageNetによって事前訓練を行うと、画像の再配向に不変性が導入されて、医療用画像におけるこのタスクのモデル開発が制限される可能性がある。更に、拡張データの事前訓練は、合成的に配向された画像を示す特定の特徴に向けてネットワークにバイアスをかける可能性があるが、合同訓練は、これらのバイアスを回避するための正則化技法として機能できる。更に、AdjustNet及び/又はRotationNet及び/又はRapidReadNetニューラルモデルを含む実施形態の文脈で説明されたアプローチは、パフォーマンスの顕著な利点を示す。本開示はとりわけ、モデルの訓練のための個別の最適化及び標的を絞った拡張を可能にすることができる、タスクごとに特化されたネットワークアンサンブルアプローチを提供する。例えば本開示の技法は、24か国以上の4,600件を超える病院からの放射線写真のために良好に展開されて、手動画像操作の必要を50%超削減することが示され、実現可能性と、ワークフロー全体の効率に対する有意なプラスの影響との両方が実証された。
【0161】
より一般には、医療用撮像のための深層学習モデルの開発には、データのキュレーションに多大な労力が必要となる可能性があり、これは、アーカイブデータのDICOMヘッダが誤ってラベリングされていたり不完全であったりすることが多いため、かなり困難なものとなる場合がある。一実施形態では、本開示は、自動化された画像配向を実際に達成するための方法を提供する。他の実施形態では、本開示の技法を用いて、正しくない配向、DICOMメタデータのエラー、又は正しくない左右マーカーに関するフィードバックを診療所に提供できる。従って、AdjustNet及び/又はRotationNet及び/又はRapidReadNetを含む様々な実施形態は、DICOM又は左右データを用いずに多数の検査を遡及的に自動でエンコードするために使用でき、多様なタスクにとって有用となり得る。一例では、AdjustNet及び/又はRotationNet及び/又はRapidReadNetを含む実施形態は、解釈の提出後ではなく即時かつ一貫したフィードバックの適用のために、放射線技師へのフィードバックとして診療現場で適用でき、これは、エラー(例えばフラッギングエラー)を削減するための認識及びベースライン機能を改善できる可能性を有している。
【0162】
結論として、AdjustNet及び/又はRotationNet又はRapidReadNetを用いた、自動化された医療撮像DICOM配向は、0.01未満のエラー率を達成でき、画像の配向のための人間の専門家による介入を、平均50%削減できる。本開示の主題は、全ての画像が常に正しい配向で提示されるように放射線写真の配向を最適化するための、大規模の展開時の効率が大幅に向上した、新規のエンドツーエンド機械学習アプローチを含む。
【0163】
6.0 実装例‐ハードウェアの概要
図4は、いくつかの非限定的な実施形態による、機械学習ツールを用いてペット又は動物の放射線医学画像を評価するために使用される、例示的なコンピュータシステム400を示す。特定の非限定的な実施形態では、1つ以上のコンピュータシステム400は、本明細書に記載又は図示されている1つ以上の方法の1つ以上のステップを実施する。他の特定の非限定的な実施形態では、1つ以上のコンピュータシステム400は、本明細書に記載又は図示されている機能を提供する。特定の非限定的な実施形態では、1つ以上のコンピュータシステム400上で動作するソフトウェアは、本明細書に記載又は図示されている1つ以上の方法の1つ以上のステップを実施するか、あるいは本明細書に記載又は図示されている機能を提供する。いくつかの非限定的な実施形態は、1つ以上のコンピュータシステム400の1つ以上の部分を含む。本明細書において、コンピュータシステムに対する言及は、必要に応じてコンピューティングデバイスを包含し、またその逆も同様である。更に、コンピュータシステムに対する言及は、必要に応じて1つ以上のコンピュータシステムを包含する場合がある。
【0164】
本開示は、いずれの好適な個数のコンピュータシステム400を企図する。本開示は、いずれの好適な物理的形態を取るコンピュータシステム400を企図する。限定ではなく例として、コンピュータシステム400は、埋め込み型コンピュータシステム、システムオンチップ(system‐on‐chip:SOC)、シングルボードコンピュータシステム(single‐board computer system:SBC)(例えば、コンピュータオンモジュール(computer‐on‐module:COM)若しくはシステムオンモジュール(system‐on‐module:SOM)等)、デスクトップコンピュータシステム、ラップトップ若しくはノートブックコンピュータシステム、対話型キオスク、メインフレーム、コンピュータシステムのメッシュ、携帯電話、パーソナルデジタルアシスタント(personal digital assistant:PDA)、サーバ、タブレットコンピュータシステム、拡張現実/仮想現実デバイス、又はこれらのうちの2つ以上の組み合わせであってよい。必要に応じて、コンピュータシステム400は:1つ以上のコンピュータシステム400を含むことができ;一元型又は分散型とすることができ;複数の場所にまたがることができ;複数の機械にまたがることができ;複数のデータセンターにまたがることができ;又は1つ以上のネットワーク内に1つ以上のクラウドコンポーネントを含むことができるクラウド内に存在できる。必要に応じて、1つ以上のコンピュータシステム400は、本明細書に記載又は図示されている1つ以上の方法の1つ以上のステップを、空間的又は時間的制約が実質的に存在しない状態で、実施できる。限定ではなく例として、1つ以上のコンピュータシステム400は、本明細書に記載又は図示されている1つ以上の方法の1つ以上のステップを、リアルタイムで、又はバッチモードで実施できる。必要に応じて、1つ以上のコンピュータシステム400は、本明細書に記載又は図示されている1つ以上の方法の1つ以上のステップを、異なる時点又は異なる場所で実施できる。
【0165】
特定の非限定的な実施形態では、コンピュータシステム400は、プロセッサ402、メモリ404、ストレージ406、入力/出力(I/O)インタフェース408、通信インタフェース410、及びバス412を含む。本開示は、特定の個数の特定のコンポーネントを特定の構成で有する、特定のコンピュータシステムを説明及び図示しているが、本開示は、いずれの好適な個数のいずれの好適なコンポーネントをいずれの好適な構成で有する、いずれの好適なコンピュータシステムを企図している。
【0166】
いくつかの非限定的な実施形態では、プロセッサ402は、コンピュータプログラムを構成する命令等の命令を実行するためのハードウェアを含む。限定ではなく例として、命令を実行するために、プロセッサ402は:内部レジスタ、内部キャッシュ、メモリ404、又はストレージ406から命令を取得(又はフェッチ)でき;これらをデコード及び実行でき;続いて1つ以上の結果を、内部レジスタ、内部キャッシュ、メモリ404、又はストレージ406に書き込むことができる。特定の非限定的な実施形態では、プロセッサ402は、データ、命令、又はアドレスのための1つ以上の内部キャッシュを含むことができる。本開示は、必要に応じて、いずれの好適な個数のいずれの好適な内部キャッシュを含むプロセッサ402を企図している。限定ではなく例として、プロセッサ402は、1つ以上の命令キャッシュ、1つ以上のデータキャッシュ、及び1つ以上のトランスレーションルックアサイドバッファ(translation lookaside buffer:TLB)を含むことができる。命令キャッシュ内の命令は、メモリ404又はストレージ406内の命令のコピーとすることができ、命令キャッシュはプロセッサ402によるこれらの命令の取得を高速化できる。データキャッシュ内のデータは、プロセッサ402が動作するために実行される命令のためのメモリ404若しくはストレージ406内のデータ;プロセッサ402で実行される後続の命令がアクセスするための、又はメモリ404若しくはストレージ406への書き込みのための、プロセッサ402で実行された過去の命令の結果;あるいは他の好適なデータの、コピーとすることができる。データキャッシュは、プロセッサ402による読み込み又は書き込み動作を高速化できる。TLBは、プロセッサ402の仮想アドレス翻訳を高速化できる。いくつかの非限定的な実施形態では、プロセッサ402は、データ、命令、又はアドレスのための1つ以上の内部レジスタを含むことができる。本開示は、必要に応じて、いずれの好適な個数のいずれの好適な内部レジスタを含むプロセッサ402を企図している。必要に応じて、プロセッサ402は:1つ以上の算術論理演算装置(arithmetic logic unit:ALU)を含むことができ;マルチコアプロセッサとすることができ;又は1つ以上のプロセッサ402を含むことができる。本開示はある特定のプロセッサを説明及び図示しているが、本開示はいずれの好適なプロセッサを企図している。
【0167】
いくつかの非限定的な実施形態では、メモリ404は、プロセッサ402が実行するための命令、又はプロセッサ402が動作するためのデータを保存するための、メインメモリを含む。限定ではなく例として、コンピュータシステム400は、ストレージ406又は別のソース(例えば別のコンピュータシステム400等)からメモリ404に命令をロードできる。続いてプロセッサ402は、メモリ404から内部レジスタ又は内部キャッシュに命令をロードできる。命令を実行するために、プロセッサ402は内部レジスタ又は内部キャッシュから命令を取得して、これらをデコードできる。命令の実行中又は実行後、プロセッサ402は1つ以上の結果(中間結果であっても最終結果であってもよい)を、内部レジスタ又は内部キャッシュに書き込むことができる。続いてプロセッサ402は、これらの結果のうちの1つ以上をメモリ404に書き込むことができる。いくつかの非限定的な実施形態では、プロセッサ402は、(ストレージ406等の場所ではなく)1つ以上の内部レジスタ若しくは内部キャッシュ内、又はメモリ404内の命令のみを実行し、(ストレージ406ではなく)1つ以上の内部レジスタ若しくは内部キャッシュ内、又はメモリ404内のデータのみで動作する。(それぞれがアドレスバスとデータバスとを含むことができる)1つ以上のメモリバスは、プロセッサ402をメモリ404に結合できる。以下で説明されるように、バス412は1つ以上のメモリバスを含むことができる。特定の非限定的な実施形態では、1つ以上のメモリ管理ユニット(memory management unit:MMU)がプロセッサ402とメモリ404との間に存在し、プロセッサ402によってリクエストされたメモリ404へのアクセスを促進する。他の特定の非限定的な実施形態、メモリ404はランダムアクセスメモリ(random access memory:RAM)を含む。このRAMは、必要に応じて揮発性メモリとすることができる。必要に応じて、このRAMは動的RAM(dynamic RAM:DRAM)又は静的RAM(static RAM:SRAM)とすることができる。更に必要に応じて、このRAMは、シングルポートRAM又はマルチポートRAMとすることができる。本開示は、いずれの好適なRAMを企図している。メモリ404は、必要に応じて1つ以上のメモリ404を含むことができる。本開示はある特定のメモリコンポーネントを説明及び図示しているが、本開示はいずれの好適なメモリを企図している。
【0168】
いくつかの非限定的な実施形態では、ストレージ406は、データ又は命令のためのマスストレージを含む。限定ではなく例として、ストレージ406は、ハードディスクドライブ(hard disk drive:HDD)、フロッピーディスクドライブ、フラッシュメモリ、光学ディスク、光磁気ディスク、磁気テープ、若しくはユニバーサルシリアルバス(Universal Serial Bus:USB)ドライブ、又はこれらのうちの2つ以上の組み合わせを含むことができる。ストレージ406は、必要に応じてリムーバブル又は非リムーバブル(即ち固定)媒体とすることができる。ストレージ406は、必要に応じてコンピュータシステム400の内部又は外部とすることができる。特定の非限定的な実施形態では、ストレージ406は不揮発性ソリッドステートメモリである。いくつかの非限定的な実施形態では、ストレージ406は読み出し専用メモリ(read‐only memory:ROM)を含む。必要に応じて、このROMは、マスクROM、プログラマブルROM(programmable ROM:PROM)、消去可能PROM(erasable PROM:EPROM)、電気的消去可能PROM(electrically erasable PROM:EEPROM)、電気的に書き換え可能なROM(electrically alterable ROM:EAROM)、若しくはフラッシュメモリ、又はこれらのうちの2つ以上の組み合わせとすることができる。本開示は、いずれの好適な物理的形態を取るマスストレージ406を企図している。ストレージ406は必要に応じて、プロセッサ402とストレージ406との間の通信を容易にする、1つ以上のストレージ制御ユニットを含むことができる。必要に応じて、ストレージ406は1つ以上のストレージ406を含むことができる。本開示はある特定のストレージを説明及び図示しているが、本開示はいずれの好適なストレージを企図している。
【0169】
特定の非限定的な実施形態では、I/Oインタフェース408は、コンピュータシステム400と1つ以上のI/Oデバイスとの間の通信のための1つ以上のインタフェースを提供する、ハードウェア、ソフトウェア、又は両方を含む。コンピュータシステム400は必要に応じて、これらのI/Oデバイスのうちの1つ以上を含むことができる。これらのI/Oデバイスのうちの1つ以上は、人間とコンピュータシステム400との間の通信を可能とすることができる。限定ではなく例として、I/Oデバイスは、キーボード、キーパッド、マイクロフォン、モニタ、マウス、プリンタ、スキャナ、スピーカー、スチルカメラ、スタイラス、タブレット、タッチスクリーン、トラックボール、ビデオカメラ、別の好適なI/Oデバイス、又はこれらのうちの2つ以上の組み合わせを含むことができる。I/Oデバイスは、1つ以上のセンサを含むことができる。本開示は、いずれの好適なI/Oデバイスと、これらのためのいずれの好適なI/Oインタフェース408とを企図している。必要に応じて、I/Oインタフェース408は、プロセッサ402がこれらのI/Oデバイスのうちの1つ以上を駆動させることができるようにする、1つ以上のデバイス又はソフトウェアドライバを含むことができる。I/Oインタフェース408は、必要に応じて1つ以上のI/Oインタフェース408を含むことができる。本開示はある特定のI/Oインタフェースを説明及び図示しているが、本開示はいずれの好適なI/Oインタフェースを企図している。
【0170】
いくつかの非限定的な実施形態では、通信インタフェース410は、コンピュータシステム400と1つ以上の他のコンピュータシステム400又は1つ以上のネットワークとの間の通信(例えばパケットベースの通信等)のための1つ以上のインタフェースを提供する、ハードウェア、ソフトウェア、又はこれら両方を含む。限定ではなく例として、通信インタフェース410は、イーサネット又は他の有線ベースのネットワークとの通信のためのネットワークインタフェースコントローラ(network interface controller:NIC)又はネットワークアダプタ、あるいはWi‐Fiネットワーク等の無線ネットワークとの通信のための無線NIC(wireless NIC:WNIC)又は無線アダプタを含むことができる。本開示は、いずれの好適なネットワークと、そのためのいずれの好適な通信インタフェース410とを企図している。限定ではなく例として、コンピュータシステム400は、アドホックネットワーク、パーソナルエリアネットワーク(personal area network:PAN)、ローカルエリアネットワーク(local area network:LAN)、広域ネットワーク(wide area network:WAN)、メトロポリタンエリアネットワーク(metropolitan area network:MAN)、若しくはインターネットの1つ以上の部分、又はこれらのうちの2つ以上の組み合わせと通信できる。これらのネットワークのうちの1つ以上の、1つ以上の部分は、有線式又は無線式とすることができる。一例として、コンピュータシステム400は、無線PAN(wireless PAN:WPAN)(例えば「BLUETOOTH」 WPAN等)、WI‐FIネットワーク、WI‐MAXネットワーク、携帯電話ネットワーク(例えば汎欧州デジタルセルラーシステム(Global System for Mobile Communications:GSM)ネットワーク等)、若しくは他の好適な無線ネットワーク、又はこれらのうちの2つ以上の組み合わせと通信できる。コンピュータシステム400は必要に応じて、これらのネットワークのうちのいずれかのための、いずれの好適な通信インタフェース410を含むことができる。通信インタフェース410は、必要に応じて1つ以上の通信インタフェース410を含むことができる。本開示はある特定の通信インタフェースを説明及び図示しているが、本開示はいずれの好適な通信インタフェースを企図している。
【0171】
特定の非限定的な実施形態では、バス412は、コンピュータシステム400のコンポーネントを互いに結合するハードウェア、ソフトウェア、又はこれら両方を含む。限定ではなく例として、バス412は、Accelerated Graphics Port(AGP)若しくは他のグラフィックバス、Enhanced Industry Standard Architecture(EISA)バス、フロントサイドバス(front side bus:FSB)、HYPERTRANSPORT(HT)相互接続、Industry Standard Architecture(ISA)バス、INFINIBAND相互接続、Low Pin Count(LPC)バス、メモリバス、Micro Channel Architecture(MCA)バス、Peripheral Component Interconnect(PCI)バス、PCI‐Express(PCIe)バス、serial advanced technology attachment(SATA)バス、Video Electronics Standards Association local(VLB)バス、若しくは他の好適なバス、又はこれらのうちの2つ以上の組み合わせを含むことができる。バス412は必要に応じて、1つ以上のバス412を含むことができる。本開示はある特定のバスを説明及び図示しているが、本開示はいずれの好適なバス又は相互接続を企図している。
【0172】
本明細書では、1つ以上のコンピュータ可読非一時的記憶媒体は、1つ以上の半導体ベースの若しくは他の集積回路(integrated circuit:IC)(例えばフィールドプログラマブルゲートアレイ(field‐programmable gate array:FPGA)、若しくは特定用途向けIC(application‐specific IC:(ASIC))、ハードディスクドライブ(hard disk drive:HDD)、ハイブリッドハードドライブ(hybrid hard drive:HHD)、光学ディスク、光学ディスクドライブ(optical disc drive:ODD)、光磁気ディスク、光磁気ドライブ、フロッピーディスケット、フロッピーディスクドライブ(floppy disk drive:FDD)、磁気テープ、ソリッドステートドライブ(solid‐state drive:SSD)、RAMドライブ、セキュアデジタルカード若しくはドライブ、他のいずれの好適なコンピュータ可読非一時的記憶媒体、又はこれらのうちの2つ以上のいずれの好適な組み合わせを、必要に応じて含むことができる。コンピュータ可読非一時的記憶媒体は必要に応じて、揮発性、不揮発性、又は揮発性と不揮発性との組み合わせとすることができる。
【0173】
本明細書では、「又は(or)」は、そうでないことが明確に示されていない限り、又は文脈によってそうでないことが示されていない限り、包括的なものであり排他的なものではない。従って本明細書では、「A又はB(A or B)」は、そうでないことが明確に示されていない限り、又は文脈によってそうでないことが示されていない限り、「A、B、又は両方(A, B, or both)」を意味する。更に「及び(and)」は、そうでないことが明確に示されていない限り、又は文脈によってそうでないことが示されていない限り、連帯(joint)及びの個別(several)の両方である。従って本明細書では、「A及びB(A and B)」は、そうでないことが明確に示されていない限り、又は文脈によってそうでないことが示されていない限り、「A及びBをまとめて、又はA及びBそれぞれ((A and B, jointly or severally))を意味する。
【0174】
本開示の範囲は、本明細書に記載又は図示されている例示的実施形態に対する、当該技術分野の一般的な技能を有する者には理解されるあらゆる変化、置換、変形、変更、及び修正を包含する。本開示の範囲は、本明細書に記載又は図示されている例示的実施形態に限定されない。更に、本開示は、本明細書中の各実施形態を、特定のコンポーネント、要素、特徴、機能、動作、又はステップを含むものとして記載又は図示しているが、これらの実施形態はいずれも、本明細書のいずれかの箇所に記載又は図示されている上記コンポーネント、要素、特徴、機能、動作、又はステップの、当該技術分野の一般的な技能を有する者には理解されるあらゆる組み合わせ又は順列を含むことができる。更に、添付の特許請求の範囲における、装置若しくはシステム、又は装置若しくはシステムのコンポーネントが、ある特定の機能を実施するように適合される、実施するように配設される、実施することが可能である、実施するように構成される、実施するように有効化される、実施するように動作可能である、又は実施する効果があるという言及は、該装置、システム、コンポーネントを、これ又はその特定の機能が起動されているか、オンになっているか、又はロック解除されているかどうかに関係なく、該装置、システム、又はコンポーネントが、上述のように適合される、配設される、可能である、構成される、有効化される、動作可能である、効果がある限り、包含する。更に、本開示は、いくつかの非限定的な実施形態を、特定の利点を提供するものとして記載又は図示しているが、特定の非限定的な実施形態は、これらの利点を全く提供しない場合も、これらの利点の一部を提供する場合も、これらの利点を全て提供する場合もある。
【0175】
更に、本開示でフローチャートとして提示及び説明されている方法の実施形態は、技術のより完全な理解を提供するための例として提供されている。本開示の方法は、本明細書で提示されている操作及び論理フローに限定されない。様々な操作の順序が変更され、より大きな1つの操作の一部として説明されている複数の下位操作が独立して実施される、代替実施形態も企図される。
【0176】
本開示の目的のために様々な実施形態を説明したが、これらの実施形態は、本開示の教示をこれらの実施形態に限定するものとみなしてはならない。本開示に記載のシステム及びプロセスの範囲内にある結果を得るために、上述の要素及び操作に対して様々な変化及び修正を実施できる。
【0177】
本明細書で開示される実施形態は単なる例であり、本開示の範囲はこれらに限定されない。特定の非限定的な実施形態は、上で開示されている実施形態のコンポーネント、要素、特徴、機能、操作、又はステップを、全て含む場合も、一部含む場合も、全く含まない場合もある。実施形態は特に、方法、記憶媒体、システム、及びコンピュータプログラム製品を対象とする添付の特許請求の範囲において開示されており、ある請求カテゴリ、例えば方法のカテゴリにおいて言及されるいずれの特徴は、別の請求カテゴリ、例えばシステムのカテゴリでも同様に請求対象とすることができる。添付の特許請求の範囲における従属関係又は参照は、形式的な理由のみで選択されている。しかしながら、(特定の複数従属関係にある)前にあるいずれの請求項を意図的に参照した結果生じるいずれの主題も、同様に請求対象とすることができるため、添付の特許請求の範囲で選択されている従属関係にかかわらず、請求項及びその特徴のいずれの組み合わせも開示され、請求対象とすることができる。請求対象とすることができる主題は、添付の特許請求の範囲に記載されている特徴の組み合わせだけでなく、特許請求の範囲中の特徴の他のいずれの組み合わせも含み、ここで、特許請求の範囲で研究されている各特徴は、特許請求の範囲の他のいずれの特徴又は他の特徴の組み合わせと組み合わせることができる。更に、本明細書中で説明又は図示されている実施形態及び特徴はいずれも、別個の請求項において、並びに/又は本明細書中で説明若しくは図示されているいずれの実施形態若しくは特徴との、若しくは添付の特許請求の範囲の特徴のうちのいずれかとの、いずれの組み合わせにおいて、請求対象とすることができる。
【0178】
本明細書中で引用されている全ての特許、特許出願、刊行物、製品の説明、及びプロトコルは、参照によりその全体が本出願に援用される。用語法に矛盾が生じる場合、本開示が優先される。
【0179】
本明細書に記載の主題は、上述の利益及び利点を達成するために十分に計算されたものであることが明らかになるものの、ここで開示されている主題は、本明細書に記載の具体的実施形態によって範囲が限定されるものではない。本開示の主題は、その精神から逸脱することなく修正、変形、及び変化が可能であることが理解されるだろう。当業者であれば、本明細書に記載の具体的実施形態の多数の等価物を、通常の実験程度のものを用いて認識するか、又は確認できるだろう。このような等価物は、以下の特許請求の範囲に包含されることが意図されている。
【0180】
本文書には様々な参考文献が引用されており、これらは参照によりその全体が本出願に援用される。
以下、本発明の好ましい実施形態を項分け記載する。
実施形態1
第1の複数のデジタル保存された画像を含む第1のラベリング済み訓練データセットを受信するステップであって、前記第1の複数の画像の各画像はラベルのセットに関連付けられている、ステップ;
前記第1のラベリング済み訓練データセットで機械学習ニューラル教師モデルを訓練するステップ;
自然言語処理のために訓練された機械学習モデルを、第2の複数の画像の自然言語テキスト要約のデジタル電子表現を含む未ラベリングデータセットに適用することによって、前記第2の複数の画像を含む第2のラベリング済み訓練データセットを生成するステップ;
前記機械学習ニューラル教師モデルを用いて、前記第2の複数の画像の各画像に対して、対応するソフト擬似ラベルのセットを生成するステップ;
前記第2のラベリング済み訓練データセットの各画像のための派生ラベルのセットを、前記ソフト擬似ラベルを用いて生成するステップ;
1つ以上のプログラムされた機械学習ニューラル生徒モデルを、前記派生ラベルを用いて訓練するステップ;
標的画像を受信するステップ;及び
前記生徒モデルのうちの1つ以上のアンサンブルを適用して、前記標的画像の1つ以上の分類を出力するステップ
を含む、コンピュータ実装型の方法。
実施形態2
前記1つ以上のプログラムされた機械学習ニューラル生徒モデルのうちの少なくとも1つを、Active Learningを用いて、プログラムに従ってアップデートするステップを更に含む、実施形態1に記載のコンピュータ実装型の方法。
実施形態3
1つ以上の機械学習モデル訓練ステップにおいてノイズを適用するステップを更に含む、実施形態1に記載のコンピュータ実装型の方法。
実施形態4
前記標的画像は、動物又はペットの放射線撮影画像である、実施形態1に記載のコンピュータ実装型の方法。
実施形態5
前記第1の複数の画像の各画像、及び前記第2の複数の画像の各画像は、動物又はペットの放射線撮影画像である、実施形態1に記載のコンピュータ実装型の方法。
実施形態6
前記自然言語テキスト要約は放射線医学レポートである、実施形態1に記載のコンピュータ実装型の方法。
実施形態7
前記標的画像は、Digital Imaging and Communications in Medicine(「DICOM」)画像としてフォーマットされる、実施形態1に記載のコンピュータ実装型の方法。
実施形態8
Dockerコンテナを用いて展開されるマイクロサービスを含むインフラストラクチャパイプラインを使用するステップを更に含む、実施形態1に記載のコンピュータ実装型の方法。
実施形態9
前記機械学習ニューラル生徒モデル又は前記機械学習ニューラル教師モデルのうちの少なくとも一方は、DenseNet‐121、ResNet‐152、ShuffleNet2、ResNext101、GhostNet、EfficientNet‐b5、SeNet‐154、Se‐ResNext‐101、又はInception‐v4のうちの少なくとも1つを含むアーキテクチャを含むようにプログラムされる、実施形態1に記載のコンピュータ実装型の方法。
実施形態10
前記機械学習ニューラル生徒モデル又は前記機械学習ニューラル教師モデルのうちの少なくとも一方は、畳み込みニューラルネットワークとしてプログラムされる、実施形態1に記載のコンピュータ実装型の方法。
実施形態11
前記標的画像の前記1つ以上の分類のうちの1つは、健康な又は異常な組織のうちの一方を示す、実施形態1に記載のコンピュータ実装型の方法。
実施形態12
前記標的画像の前記1つ以上の分類のうちの1つは異常な組織を示し;
示された前記異常な組織は、心血管、肺構造、縦隔構造、胸膜腔、又は胸腔外のうちの少なくとも1つとして更に分類される、実施形態11に記載のコンピュータ実装型の方法。
実施形態13
前記標的画像の前記1つ以上の分類のうちの少なくとも1つは下位分類である、実施形態1に記載のコンピュータ実装型の方法。
実施形態14
前記標的画像を前処理するステップを更に含み、前処理する前記ステップは、前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、訓練済み機械学習フィルタモデルを前記標的画像に適用するステップを含む、実施形態1に記載のコンピュータ実装型の方法。
実施形態15
前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、前記標的画像の正しい解剖学的配向を、プログラムに従って決定するステップを更に含む、実施形態1に記載のコンピュータ実装型の方法。
実施形態16
前記標的画像の前記正しい解剖学的配向を決定する前記ステップは、前記標的画像に関連付けられたDICOMメタデータ、又は前記標的画像に関連付けられた左右マーカーに依存することなく動作するようにプログラムされた、訓練済み機械学習モデルを実行するステップを含む、実施形態15に記載のコンピュータ実装型の方法。
実施形態17
前記訓練済み機械学習モデルは、拡張データ及び実際のデータで合同訓練されたものである、実施形態16に記載のコンピュータ実装型の方法。
実施形態18
前記標的画像の前記正しい解剖学的配向を決定する前記ステップは、第1のプログラム済みモデルを実行することによって、前記標的画像の正しい回転を決定するステップと、第2のプログラム済みモデルを実行することによって、前記標的画像の正しい反転を決定するステップとを含む、実施形態15に記載のコンピュータ実装型の方法。
実施形態19
前記標的画像の前記正しい解剖学的配向を決定する前記ステップの後、かつ前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、前記標的画像が正しい身体部分に対応することをプログラムに従って確認するステップを更に含む、実施形態15に記載のコンピュータ実装型の方法。
実施形態20
前記標的画像が前記正しい身体部分に対応することを確認する前記ステップは、訓練済み機械学習モデルを実行するステップを含む、実施形態19に記載のコンピュータ実装型の方法。
実施形態21
システムであって:
1つ以上のプロセッサと;
前記プロセッサのうちの1つ以上に結合され、前記プロセッサのうちの1つ以上によって実行されたときに、以下:
第1の複数のデジタル保存された画像を含む第1のラベリング済み訓練データセットを受信するステップであって、前記第1の複数の画像の各画像はラベルのセットに関連付けられている、ステップ;
前記第1のラベリング済み訓練データセットで機械学習ニューラル教師モデルを訓練するステップ;
自然言語処理のために訓練された機械学習モデルを、第2の複数の画像の自然言語テキスト要約のデジタル電子表現を含む未ラベリングデータセットに適用することによって、前記第2の複数の画像を含む第2のラベリング済み訓練データセットを生成するステップ;
前記機械学習ニューラル教師モデルを用いて、前記第2の複数の画像の各画像に対して、対応するソフト擬似ラベルのセットを生成するステップ;
前記第2のラベリング済み訓練データセットの各画像のための派生ラベルのセットを、前記ソフト擬似ラベルを用いて生成するステップ;
1つ以上のプログラムされた機械学習ニューラル生徒モデルを、前記派生ラベルを用いて訓練するステップ;
標的画像を受信するステップ;及び
前記生徒モデルのうちの1つ以上のアンサンブルを適用して、前記標的画像の1つ以上の分類を出力するステップ
を含む操作を前記システムに実行させるように動作する命令を含む、1つ以上のコンピュータ可読非一時的記憶媒体と
を備える、システム。
実施形態22
前記命令は更に、実行されたときに、前記1つ以上のプログラムされた機械学習ニューラル生徒モデルのうちの少なくとも1つを、Active Learningを用いて、プログラムに従ってアップデートするステップを実施させるように動作する、実施形態21に記載のシステム。
実施形態23
前記命令は更に、実行されたときに、1つ以上の機械学習モデル訓練ステップにおいてノイズを適用するステップを実施させるように動作する、実施形態21に記載のシステム。
実施形態24
前記標的画像は、動物又はペットの放射線撮影画像である、実施形態21に記載のシステム。
実施形態25
前記第1の複数の画像の各画像、及び前記第2の複数の画像の各画像は、動物又はペットの放射線撮影画像である、実施形態21に記載のシステム。
実施形態26
前記自然言語テキスト要約は放射線医学レポートである、実施形態21に記載のシステム。
実施形態27
前記標的画像は、Digital Imaging and Communications in Medicine(「DICOM」)画像としてフォーマットされる、実施形態21に記載のシステム。
実施形態28
前記命令は更に、実行されたときに、Dockerコンテナを用いて展開されるマイクロサービスを含むインフラストラクチャパイプラインを使用するステップを実施させるように動作する、実施形態21に記載のシステム。
実施形態29
前記機械学習ニューラル生徒モデル又は前記機械学習ニューラル教師モデルのうちの少なくとも一方は、DenseNet‐121、ResNet‐152、ShuffleNet2、ResNext101、GhostNet、EfficientNet‐b5、SeNet‐154、Se‐ResNext‐101、又はInception‐v4のうちの少なくとも1つを含むアーキテクチャを含むようにプログラムされる、実施形態21に記載のシステム。
実施形態30
前記機械学習ニューラル生徒モデル又は前記機械学習ニューラル教師モデルのうちの少なくとも一方は、畳み込みニューラルネットワークとしてプログラムされる、実施形態21に記載のシステム。
実施形態31
前記標的画像の前記1つ以上の分類のうちの1つは、健康な又は異常な組織のうちの一方を示す、実施形態21に記載のシステム。
実施形態32
前記標的画像の前記1つ以上の分類のうちの1つは異常な組織を示し;
示された前記異常な組織は、心血管、肺構造、縦隔構造、胸膜腔、又は胸腔外のうちの少なくとも1つとして更に分類される、実施形態31に記載のシステム。
実施形態33
前記標的画像の前記1つ以上の分類のうちの少なくとも1つは下位分類である、実施形態21に記載のシステム。
実施形態34
前記命令は更に、実行されたときに、前記標的画像を前処理するステップを実施させるように動作し、前処理する前記ステップは、前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、訓練済み機械学習フィルタモデルを前記標的画像に適用するステップを含む、実施形態21に記載のシステム。
実施形態35
前記命令は更に、実行されたときに、前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、前記標的画像の正しい解剖学的配向を、プログラムに従って決定するステップを実施させるように動作する、実施形態21に記載のシステム。
実施形態36
前記命令は更に、実行されたときに、前記標的画像の前記正しい解剖学的配向を決定する前記ステップを、前記標的画像に関連付けられたDICOMメタデータ、又は前記標的画像に関連付けられた左右マーカーに依存することなく動作するようにプログラムされた、訓練済み機械学習モデルを実行するステップによって実施させるように動作する、実施形態35に記載のシステム。
実施形態37
前記訓練済み機械学習モデルは、拡張データ及び実際のデータで合同訓練されたものである、実施形態36に記載のシステム。
実施形態38
前記命令は更に、実行されたときに、前記標的画像の前記正しい解剖学的配向を決定する前記ステップを、第1のプログラム済みモデルを実行することによって、前記標的画像の正しい回転を決定するステップと、第2のプログラム済みモデルを実行することによって、前記標的画像の正しい反転を決定するステップとによって実施させるように動作する、実施形態35に記載のシステム。
実施形態39
前記命令は更に、実行されたときに、前記標的画像の前記正しい解剖学的配向を決定する前記ステップの後、かつ前記標的画像の前記1つ以上の分類を出力する前記ステップの前に、前記標的画像が正しい身体部分に対応することをプログラムに従って確認するステップを実施させるように動作する、実施形態35に記載のシステム。
実施形態40
前記命令は更に、実行されたときに、前記標的画像が前記正しい身体部分に対応することを確認する前記ステップを、訓練済み機械学習モデルを実行するステップによって実施させるように動作する、実施形態39に記載のシステム。
【符号の説明】
【0181】
400 コンピュータシステム
402 プロセッサ
404 メモリ
406 ストレージ
408 入力/出力(I/O)インタフェース
410 通信インタフェース
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13A
図13B
図14A
図14B
図15A
図15B
図16A
図16B
図17A
図17B
図18
図19
図20