(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024072818
(43)【公開日】2024-05-28
(54)【発明の名称】マルチラベル分類方法及びマルチラベル分類システム
(51)【国際特許分類】
G16H 30/00 20180101AFI20240521BHJP
A61B 5/055 20060101ALI20240521BHJP
A61B 6/00 20240101ALI20240521BHJP
G06T 7/00 20170101ALI20240521BHJP
G06V 10/82 20220101ALI20240521BHJP
G06T 7/60 20170101ALI20240521BHJP
【FI】
G16H30/00
A61B5/055 380
A61B6/00 550Z
G06T7/00 350C
G06V10/82
G06T7/00 612
G06T7/60 110
【審査請求】有
【請求項の数】10
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023195264
(22)【出願日】2023-11-16
(31)【優先権主張番号】63/383,918
(32)【優先日】2022-11-16
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】502160992
【氏名又は名称】宏達國際電子股▲ふん▼有限公司
(74)【代理人】
【識別番号】100206335
【弁理士】
【氏名又は名称】太田 和宏
(72)【発明者】
【氏名】リャオ チェ-ティン
(72)【発明者】
【氏名】彭 宇劭
【テーマコード(参考)】
4C093
4C096
5L096
5L099
【Fターム(参考)】
4C093AA22
4C093AA26
4C093CA18
4C093CA35
4C093DA04
4C093FF21
4C093FG18
4C096AA11
4C096AC01
4C096AD14
4C096DC22
4C096DD18
5L096BA06
5L096BA13
5L096GA34
5L096HA11
5L096KA04
5L096KA15
5L096MA07
5L099AA26
(57)【要約】 (修正有)
【課題】医療画像のマーキングラベルを生成するためのマルチラベル分類方法を提供する。
【解決手段】方法は、医療画像と医療画像における複数の異常特徴のうちのマーク済み部分をマークする局所入力ラベルとを含む初期データセットを取得するステップ、初期データセットを用いて第1マルチラベル分類モデルを訓練するステップ、第1マルチラベル分類モデルが生成した予測に基づいて初期データセットにおける医療画像の難易度レベルを推定するステップ、医療画像の難易度レベルによって初期データセットを異なるサブセットに分けるステップ、第2マルチラベル分類モデルを異なる複数のコース学習ラウンドにおいて難易度レベルが次第に逓増するサブセットによって訓練するステップ及び第2マルチラベル分類モデルに基づいて医療画像における複数の異常特徴のそれぞれをマークする予測ラベルを生成することで全ての異常特徴を完全にマークするステップを含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数の医療画像と、前記医療画像における複数の異常特徴のうちのマーク済み部分をマークする複数の局所入力ラベルとを含む初期データセットを取得するステップと、
前記初期データセットに基づいて第1マルチラベル分類モデルを訓練するステップと、
前記第1マルチラベル分類モデルが生成した予測に基づいて、前記初期データセットにおける前記医療画像の複数の難易度レベルを推定するステップと、
前記医療画像の前記難易度レベルによって、前記初期データセットを少なくとも第1サブセットと、前記第1サブセットに比べて難易度レベルが高い第2サブセットとに分けるステップと、
第1コース学習ラウンドにおいて、前記第1サブセットに基づいて第2マルチラベル分類モデルを訓練するステップと、
第2コース学習ラウンドにおいて、前記第1サブセット及び前記第2サブセットに基づいて前記第2マルチラベル分類モデルを訓練するステップと、
前記第2マルチラベル分類モデルを用いて、前記医療画像における前記異常特徴のそれぞれをマークする複数の予測ラベルを生成するステップと、
を含むマルチラベル分類方法。
【請求項2】
前記第1マルチラベル分類モデルを訓練する前に、前記マルチラベル分類方法は、
前記初期データセットにおける前記複数の医療画像に対して、画像背景除去、画像ウィンドウサンプリング及びシーケンス画像スタッキングのうちの少なくとも1つを含む画像前処理を行うステップを更に含む請求項1に記載のマルチラベル分類方法。
【請求項3】
前記医療画像にはそれぞれM種類の異常特徴が潜在的に存在し、前記局所入力ラベルには、N種類の異常特徴に関する順方向予測又は逆方向予測が示され、MとNは正の整数で、且つM>Nであり、前記初期データセットにおける前記医療画像に対応する前記異常特徴のうちの1つのマークなし部分は未知状態であり、前記第1マルチラベル分類モデルは畳み込みニューラルネットワークを含み、前記第1マルチラベル分類モデルは、前記局所入力ラベルによって、マスクされたバイナリクロスエントロピー損失関数に基づいて訓練し、且つ前記異常特徴のうちの前記マークなし部分を考慮しない請求項1に記載のマルチラベル分類方法。
【請求項4】
前記初期データセットにおける前記医療画像の複数の難易度レベルを推定するステップは、
前記第1マルチラベル分類モデルで前記医療画像における前記異常特徴のそれぞれの複数の確率値を生成するステップと、
前記確率値及び前記局所入力ラベルによって、難易度評価関数に従って前記難易度レベルを推定するステップと、を含む請求項1に記載のマルチラベル分類方法。
【請求項5】
前記第2マルチラベル分類モデルは、畳み込みニューラルネットワークを含み、前記第2マルチラベル分類モデルは、前記局所入力ラベルによって、マスクされたバイナリクロスエントロピー損失関数に基づいて訓練する請求項1に記載のマルチラベル分類方法。
【請求項6】
前記医療画像は、複数の頭部コンピュータ断層撮影画像を含み、前記異常特徴は、脳実質出血、脳室内出血、くも膜下腔出血、硬膜下頭蓋内出血、及び硬膜外出血を含む請求項1に記載のマルチラベル分類方法。
【請求項7】
前記第2マルチラベル分類モデルは、1枚の医療画像に対して、脳実質出血、脳室内出血、くも膜下腔出血、硬膜下頭蓋内出血、及び硬膜外出血に関する順方向予測又は逆方向予測の5つの予測ラベルを生成するために用いられる請求項6に記載のマルチラベル分類方法。
【請求項8】
前記第2マルチラベル分類モデルで前記予測ラベルに対応する複数の信頼値を生成するステップと、
前記信頼値及び前記局所入力ラベルに基づいて絶対誤差を計算するステップと、
前記予測ラベルを前記絶対誤差の順序に基づいて表示するステップと、
を更に含む請求項1に記載のマルチラベル分類方法。
【請求項9】
前記予測ラベルの修正に関する修正命令を収集するステップと、
前記修正命令によって複数の修正後の入力ラベルを取得するステップと、
複数のコース学習ラウンドにおいて前記修正後の入力ラベルを参照して第3マルチラベル分類モデルを訓練するステップと、
を更に含む請求項8に記載のマルチラベル分類方法。
【請求項10】
複数のコンピュータ実行可能命令を記憶するための記憶ユニットと、
前記記憶ユニットに結合され、前記コンピュータ実行可能命令を実行して第1マルチラベル分類モデル及び第2マルチラベル分類モデルを構築するための処理ユニットと、を備え、
前記処理ユニットは、
複数の医療画像と、前記医療画像における複数の異常特徴のうちのマーク済み部分をマークする複数の局所入力ラベルとを含む初期データセットを取得することと、
前記初期データセットに基づいて前記第1マルチラベル分類モデルを訓練することと、
前記第1マルチラベル分類モデルが生成した予測に基づいて、前記初期データセットにおける前記医療画像の複数の難易度レベルを推定することと、
前記医療画像の前記難易度レベルによって、前記初期データセットを少なくとも第1サブセットと、前記第1サブセットに比べて難易度レベルが高い第2サブセットとに分けることと、
第1コース学習ラウンドにおいて、前記第1サブセットに基づいて第2マルチラベル分類モデルを訓練することと、
第2コース学習ラウンドにおいて、前記第1サブセット及び前記第2サブセットに基づいて前記第2マルチラベル分類モデルを訓練することと、
前記第2マルチラベル分類モデルを用いて、前記医療画像における前記異常特徴のそれぞれをマークする複数の予測ラベルを生成すること、に用いられるマルチラベル分類システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、医療画像の分類方法に関し、特に、1枚の医療画像に対して複数のラベル付きマークを生成するための分類方法に関する。
【背景技術】
【0002】
X線スキャン、磁気共鳴画像、コンピュータ断層撮影スキャン等の医療画像検査は、患者の状況を評価するための重要なツールである。医療画像に現れる異常を正確に識別するには、通常、経験豊富な医療スタッフが必要である。したがって、医療画像検査の実行効率を向上させ、人件費を削減するために、医療画像における異常状況を検出や区分できる機械学習モデルの構築が望まれている。
【発明の概要】
【0003】
本開示の一態様は、マルチラベル分類方法であって、複数の医療画像と、前記医療画像における複数の異常特徴のうちのマーク済み部分をマークする複数の局所入力ラベルとを含む初期データセットを取得するステップと、前記初期データセットに基づいて第1マルチラベル分類モデルを訓練するステップと、前記第1マルチラベル分類モデルが生成した予測に基づいて、前記初期データセットにおける前記医療画像の複数の難易度レベルを推定するステップと、前記医療画像の前記難易度レベルによって、前記初期データセットを少なくとも第1サブセットと、前記第1サブセットに比べて難易度レベルが高い第2サブセットとに分けるステップと、第1コース学習ラウンドにおいて、前記第1サブセットに基づいて第2マルチラベル分類モデルを訓練するステップと、第2コース学習ラウンドにおいて、前記第1サブセット及び前記第2サブセットに基づいて前記第2マルチラベル分類モデルを訓練するステップと、前記第2マルチラベル分類モデルを用いて、前記医療画像における前記異常特徴のそれぞれをマークする複数の予測ラベルを生成するステップと、を含むマルチラベル分類方法を開示する。
【0004】
幾つかの実施例において、前記第1マルチラベル分類モデルを訓練する前に、前記マルチラベル分類方法は、前記初期データセットにおける前記複数の医療画像に対して、画像背景除去、画像ウィンドウサンプリング及びシーケンス画像スタッキングのうちの少なくとも1つを含む画像前処理を行うステップを更に含む。
【0005】
幾つかの実施例において、前記医療画像にはそれぞれM種類の異常特徴が潜在的に存在し、前記局所入力ラベルには、N種類の異常特徴に関する順方向予測又は逆方向予測が示され、MとNは正の整数で、且つM>Nであり、前記初期データセットにおける前記医療画像に対応する前記異常特徴のうちの1つのマークなし部分は未知状態であり、前記第1マルチラベル分類モデルは畳み込みニューラルネットワークを含み、前記第1マルチラベル分類モデルは、前記局所入力ラベルによって、マスクされたバイナリクロスエントロピー損失関数に基づいて訓練し、且つ前記異常特徴のうちの前記マークなし部分を考慮しない。
【0006】
幾つかの実施例において、前記初期データセットにおける前記医療画像の複数の難易度レベルを推定するステップは、前記第1マルチラベル分類モデルで前記医療画像における前記異常特徴のそれぞれの複数の確率値を生成するステップと、前記確率値及び前記局所入力ラベルによって、難易度評価関数に従って前記難易度レベルを推定するステップと、を含む。
【0007】
幾つかの実施例において、前記第2マルチラベル分類モデルは、畳み込みニューラルネットワークを含み、前記第2マルチラベル分類モデルは、前記局所入力ラベルによって、マスクされたバイナリクロスエントロピー損失関数に基づいて訓練する。
【0008】
幾つかの実施例において、前記医療画像は、複数の頭部コンピュータ断層撮影画像を含み、前記異常特徴は、脳実質出血、脳室内出血、くも膜下腔出血、硬膜下頭蓋内出血、及び硬膜外出血を含む。
【0009】
幾つかの実施例において、前記第2マルチラベル分類モデルは、1枚の医療画像に対して、脳実質出血、脳室内出血、くも膜下腔出血、硬膜下頭蓋内出血、及び硬膜外出血に関する順方向予測又は逆方向予測の5つの予測ラベルを生成するために用いられる。
【0010】
幾つかの実施例において、マルチラベル分類方法は、前記第2マルチラベル分類モデルで前記予測ラベルに対応する複数の信頼値を生成するステップと、前記信頼値及び前記局所入力ラベルに基づいて絶対誤差を計算するステップと、前記予測ラベルを前記絶対誤差の順序に基づいて表示するステップと、を更に含む。
【0011】
幾つかの実施例において、マルチラベル分類方法は、前記予測ラベルの修正に関する修正命令を収集するステップと、前記修正命令によって複数の修正後の入力ラベルを取得するステップと、複数のコース学習ラウンドにおいて前記修正後の入力ラベルを参照して第3マルチラベル分類モデルを訓練するステップと、を更に含む。
【0012】
本開示の別の態様は、マルチラベル分類システムであって、複数のコンピュータ実行可能命令を記憶するための記憶ユニットと、前記記憶ユニットに結合され、前記コンピュータ実行可能命令を実行して第1マルチラベル分類モデル及び第2マルチラベル分類モデルを構築するための処理ユニットと、を備え、前記処理ユニットは、複数の医療画像と、前記医療画像における複数の異常特徴のうちのマーク済み部分をマークする複数の局所入力ラベルとを含む初期データセットを取得することと、前記初期データセットに基づいて前記第1マルチラベル分類モデルを訓練することと、前記第1マルチラベル分類モデルが生成した予測に基づいて、前記初期データセットにおける前記医療画像の複数の難易度レベルを推定することと、前記医療画像の前記難易度レベルによって、前記初期データセットを少なくとも第1サブセットと、前記第1サブセットに比べて難易度レベルが高い第2サブセットとに分けることと、第1コース学習ラウンドにおいて、前記第1サブセットに基づいて第2マルチラベル分類モデルを訓練することと、第2コース学習ラウンドにおいて、前記第1サブセット及び前記第2サブセットに基づいて前記第2マルチラベル分類モデルを訓練することと、前記第2マルチラベル分類モデルを用いて、前記医療画像における前記異常特徴のそれぞれをマークする複数の予測ラベルを生成すること、に用いられる。
【0013】
これにより、第2マルチラベル分類モデルが生成した予測ラベルは、各医療画像における全ての異常特徴を完全にマークし、予測ラベルに欠落/未知ラベルがない。また、第2マルチラベル分類モデルが生成した予測ラベルが状況に該当しない場合、医療スタッフは、少ない時間と労力で検証と検査を完了することができる。この場合、マルチラベル分類方法は、比較的低コストで精度の高いマルチラベル分類モデルを効率的に得るために用いられる。
【0014】
なお、上記説明及び後続の詳細な説明は、実施例として本開示を例示的に説明するものであり、本開示が特許請求する発明の内容の解釈及び理解を補助するためのものである。
【図面の簡単な説明】
【0015】
本開示の上記及び他の目的、特徴及び実施例をより明確且つ理解しやすくするために、添付図面を以下に説明する。
【
図1】本開示の幾つかの実施例によるマルチラベル分類方法を示すフローチャートである。
【
図2】本開示の幾つかの実施例におけるマルチラベル分類システムを示す機能ブロック図である。
【
図3】オリジナル医療画像に対して画像背景除去ステップを行って前処理後の医療画像を生成する模式図である。
【
図4】オリジナル医療画像に対して画像ウィンドウサンプリングステップを行って前処理後の医療画像を生成する模式図である。
【
図5】一連のオリジナル医療画像に対してシーケンス画像スタッキングステップを行って前処理後の医療画像を生成する模式図である。
【
図6】
図1のマルチラベル分類方法を示す模式図である。
【
図7】本開示の幾つかの実施例による
図1に示すマルチラベル分類方法に更に含まれる後続のステップを示すフローチャートである。
【
図8】幾つかの実施例によるディスプレイに該当しない予測ラベルに関する関連情報を表示する模式図である。
【発明を実施するための形態】
【0016】
以下、本開示の様々な特徴を実施するための様々な実施例又は例を開示する。以下の説明では、特殊な例において本開示を簡略化するための部品や配置が以下の議論で使用される。議論されるいかなる例は解釈のためのものに過ぎず、本開示又は例の範囲及び意義をいかなる方式で限定するものではない。適切な状況では、図面の間及び対応する文字の記載において同じ又は類似の部品を表すために同じ参照番号が使用される。
【0017】
図1を参照されたい。それは本開示の幾つかの実施例によるマルチラベル分類方法100を示すフローチャートである。マルチラベル分類方法100は、各医療画像に対応して、画像に潜在的に現れる可能性のある複数の異常特徴の複数のラベルを生成するために用いられる。
【0018】
図2を併せて参照されたい。それは本開示の幾つかの実施例におけるマルチラベル分類システム200の機能ブロック図を示し、マルチラベル分類システム200は、
図1に示すマルチラベル分類方法100を実行するために用いられてよい。
図2に示すように、マルチラベル分類システム200は、入力インターフェース220、処理ユニット240、記憶ユニット260、及びディスプレイ280を含む。幾つかの実施例において、マルチラベル分類システム200は、コンピュータ、スマートフォン、タブレットコンピュータ、画像処理サーバ、データ記憶サーバ、テンソル演算サーバ、又は他の同等の演算装置であってよい。
【0019】
記憶ユニット260は、コンピュータ実行可能命令を記憶するために用いられる。処理ユニット240は、入力インターフェース220、記憶ユニット260、及びディスプレイ280に結合される。処理ユニット240は、コンピュータ実行可能命令を実行して後続の実施例に議論されるマルチラベル分類モデルを実現するために用いられる。
【0020】
図1及び
図2に示すように、マルチラベル分類システム200の入力インターフェース220は、データソース(図示せず)から初期データセットDiniを受信/取得するためのステップS110を実行する。幾つかの実施例において、データソースは、病院内のカルテレポートを記憶するデータサーバであってよい。幾つかの実施例において、初期データセットDiniは、複数の医療画像IMG及び複数の局所入力ラベルPLBを含む。
【0021】
入力インターフェース220は初期データセットDiniを受信するために用いられ、入力インターフェース220は、データ伝送インターフェース、無線通信回路、キーボード、マウス、マイクロフォン、又は任意の同等の入力機器を含んでよい。処理ユニット240は、入力インターフェース220、記憶ユニット260及びディスプレイ280に接続される。記憶ユニット260は、プログラムコードを記憶するために用いられる。記憶ユニット260に記憶されたプログラムコードは、処理ユニット240を
図1に示すマルチラベル分類方法100を実行するように駆動するために用いられる。幾つかの実施例において、処理ユニット240は、プロセッサ、グラフィックスプロセッサ、特定用途向け集積回路、又は任意の同等の処理回路であってよい。ディスプレイ280は、表示パネル、監視スクリーン、投影機、タッチパネル、又は任意の同等のディスプレイであってよい。
【0022】
幾つかの実施例において、複数の医療画像IMGは、頭蓋内出血を患っている患者を撮影して得られる頭部コンピュータ断層撮影画像を含む。実際の状況では、複数の医療画像IMGに異なる異常特徴が存在する可能性があり、それらはそれぞれ異なるタイプの頭蓋内出血、例えば脳実質出血、脳室内出血、くも膜下腔出血、硬膜下頭蓋内出血、及び硬膜外出血等に対応する。
【0023】
医療画像(例えば、コンピュータ断層撮影又は磁気造影撮影)において頭蓋内出血の異なる異常特徴を正確にマークするために、各タイプの頭蓋内出血の特性を詳細に分析して理解する必要がある。頭蓋内出血の5つのタイプの概要は以下の表1に示す。
【表1】
【0024】
頭蓋内出血の医療画像を正確にマークすることは、後続の治療及び予後にとって非常に重要であり、つまり、IPH、IVH、SAH、SDH及びEDH等の異なるタイプの頭蓋内出血を識別することは、後続の正確な治療計画を提供するために非常に重要である。各出血タイプには、その位置及び特徴に応じて、例えば手術、ドレナージ、又は保存治療等、異なる治療戦略を採用する必要がある。正確な診断は、医療スタッフが頭蓋内圧の上昇及び脳ヘルニア等の合併症を予防することを確保し、患者の進行の観察にも役立ち、必要に応じて治療手段を直ちに調整することを確保することができる。本質的に、正確な頭蓋内出血マークは、カスタマイズされた効果的な医療介護にとって非常に重要であり、患者の治療効果に大きな影響を与える可能性がある。幾つかの実施例において、マルチラベル分類方法100は、マルチラベル分類モデルを効率的に訓練する方法を提供し、それは異なるタイプの頭蓋内出血を識別して対応するラベルを生成することができる。
【0025】
幾つかの場合、マルチラベル分類モデルを訓練するために大量のマークデータが必要である。訓練データセットにおける各医療画像にIPH、IVH、SAH、SDH及びEDH等の様々な異常特徴を手動でマークするために、大量の医療人的資源及び大量の時間がかかる。マーク速度を速めるために、医療スタッフは、キーワードを用いて該当するカルテレポートを検索し、キーワードに該当するカルテレポートから関連する医療画像を取得することができる。例えば、「EDH」の特徴を有する医療画像を取得しようとする場合、医療スタッフは、「EDH」、「硬膜外出血」等のキーワードを入力し、対応するカルテレポートにおいてこれらのキーワードを有する医療画像を検索し、医療画像を「EDH」という異常特徴を有するものとして直接マークしたり、医療スタッフが更なる確認過程を行ってマークしたりすることができる。しかし、上記方法で行われる自動化処理による迅速なマークには、ある程度のデータの誤りや漏れが存在する可能性がある。
【0026】
まず、マークデータには一部のラベルが欠けており、例えば、1枚の頭蓋内出血の医療画像には、1つの異常特徴のラベル、例えば「EDH」がマークされているが、実際には、この頭蓋内出血の医療画像には、他のタイプの異常特徴(例えば、IPH、IVH、SAH又はSDH等の異常特徴)が更に存在する可能性があり、これらの他の異常特徴がカルテレポートに記録されていない場合、カルテレポートによって自動的に生成されたラベルは、これらの医療画像の実際のマーク情報を正確且つ完全に反映することができない。次に、カルテレポートによって自動的に生成されたラベルには、幾つかの誤った解釈が存在する可能性があり、例えば、カルテレポートに「検査結果にEDHがない」又は「患者にEDHがない」と記載されている場合、「EDH」の異常特徴に対応する正しいラベルは「負」であるべきである。場合によっては、キーワード「EDH」が検出され、且つコンテキスト解釈が考慮されていないため、自動的に生成されたラベルを誤って「正」とマークすることがある。
【0027】
幾つかの実施例において、初期データセットDiniにおける局所入力ラベルPLBは、医療レポートによって自動的に生成することができる(例えば、カルテレポートからのキーワード比較)。局所入力ラベルPLBには、医療画像IMGにおける複数の異常特徴のマーク済み部分がマークされている。表2を参照されたい。それは局所入力ラベルPLBのリストであり、1つの例示的な例において、初期データセットDiniにおける複数枚の医療画像IMG1~IMGkのうちのマーク済み部分を表示するために用いられる。
【表2】
【0028】
表2に示すように、第1医療画像IMG1に対応する局所入力ラベルPLBは、第1医療画像IMG1上の1番目の異常特徴IPHに対する「正」の入力ラベルと、3番目の異常特徴SAHに対する「負」の入力ラベルとを含む。つまり、局所入力ラベルPLBは、第1医療画像IMG1に第1異常特徴IPHが存在し、且つ第1医療画像IMG1に第3異常特徴SAHが存在しないことを表す。第1医療画像IMG1に関する局所入力ラベルPLBのうちの他の一部の異常特徴(IVH、SDH、EDHに対する)が現在マークされていないことに注意すべきである。第1医療画像IMG1にこれらのマークされていない異常特徴が存在するか否かは、局所入力ラベルPLBにとって未知である。つまり、初期データセットDiniの情報により、第1医療画像IMG1に異常特徴IVH、SDH、EDHが存在するか否かは確定されていない。この場合、第1医療画像IMG1に関する局所入力ラベルPLBは、2つの確認済みラベルを含む。
【0029】
同様に、表2に示すように、第2医療画像IMG2に対応する局所入力ラベルPLBは、第2医療画像IMG2における第2異常特徴IVHの「正」の入力ラベルと、第4異常特徴SDHに対する「負」の入力ラベルとを含む。つまり、第2医療画像IMG2に関する局所入力ラベルPLBのうちの一部に対する異常特徴(IPH、SAH、EDHに対する)はマークされていない。言い換えれば、初期データセットDiniの情報により、第2医療画像IMG2に以下の異常特徴IPH、SAH及びEDHが存在するか否かは確定されていない。
【0030】
言い換えれば、医療画像IMG1~IMGkのそれぞれには、M種類の異常特徴が潜在的に存在する可能性があり、局所入力ラベルPLBは、医療画像IMG1~IMGkのそれぞれに対して、N種類の異常特徴に関する順方向予測又は逆方向予測を示し、MとNは正の整数で、且つM>Nである。
【0031】
幾つかの実施例において、
図1及び
図2に示すように、処理ユニット240は、ステップS120を実行して、初期データセットDiniにおける各医療画像IMGに画像前処理を行う。幾つかの実施例において、画像前処理は、画像背景除去、画像ウィンドウサンプリング、及びシーケンス画像スタッキングのうちの少なくとも1種を含む。
【0032】
更に
図3を参照されたい。それはオリジナル医療画像IMGaに対して画像背景除去ステップS121を行って前処理後の医療画像IMGp1を生成する模式図である。
図3に示すように、画像背景除去ステップS121では、オリジナル医療画像IMGaの黒い背景から脳領域を切り取り、前処理で切り取った脳領域を医療画像IMGp1のサイズまで拡大する。この場合、画像背景除去ステップS121の後、脳領域の画像情報をできるだけ保留し、且つ医療画像IMGp1に拡大して表示してよく、それによりモデル訓練に役立つキー情報は、抽出されて前処理後の医療画像IMGp1に保留されてよい。
【0033】
更に
図4を参照されたい。それはオリジナル医療画像IMGaに対して画像ウィンドウサンプリングステップS122を行って前処理後の医療画像IMGp2及びIMGp3を生成する模式図である。
図4に示すように、画像ウィンドウサンプリングステップS122において、オリジナル医療画像IMGbの画素値にコントラスト画像調整を行う。この場合、オリジナル医療画像IMGbに硬膜下のウィンドウ範囲サンプリングを行って前処理後の医療画像IMGp2を生成し、且つオリジナル医療画像IMGbに骨格ウィンドウ数値範囲サンプリングを行って前処理後の別の医療画像IMGp3を生成する。この場合、前処理を経た医療画像IMGp2及びIMGp3における硬膜下(subdural)又は骨格に関する画像特徴はよりはっきりと見える。
【0034】
図5を併せて参照されたい。それは一連のオリジナル医療画像IMGc、IMGd、IMGe、IMGf及びIMGgに対してシーケンス画像スタッキングステップS123を行って前処理後の医療画像IMGp4を生成する模式図である。
図5に示すように、複数枚のオリジナル医療画像IMGc、IMGd、IMGe、IMGf及びIMGgは、患者の頭部コンピュータ断層撮影検査で撮影された一連のシーケンス画像であってよい。シーケンス画像スタッキングステップS123において、前後順で隣接する複数枚のオリジナル医療画像を前処理後の医療画像として統合/スタッキングしてよい。例えば、前処理後、隣接する3枚の医療画像IMGd、IMGe及びIMGfは、医療画像IMGp4にスタッキングされてよい。同様に、他の位置に隣接する複数枚の医療画像を同様な前処理医療画像としてスタッキングしてもよい。この場合、走査順序で隣接する複数の医療画像における特徴は、前処理を経た後、同一の医療画像IMGp4に記憶/統合されてよい。
【0035】
幾つかの実施例において、マルチラベル分類方法100の後続のステップS130~S170において、オリジナル医療画像の代わりに、これらの前処理後の医療画像を用いることができる。別の実施例において、画像前処理ステップS120をスキップし、マルチラベル分類方法100の後続のステップS130~S170においてオリジナル医療画像を直接採用してもよい。
【0036】
更に
図6を参照されたい。それは
図1のマルチラベル分類方法100を示す模式図である。
図1及び
図5に示すように、ステップS120によって初期データセットDiniにおける複数の医療画像IMGを前処理した後、初期データセットDiniは、前処理後の複数枚の医療画像IMGp及び複数の局所入力ラベルPLBを含む。
【0037】
幾つかの実施例において、
図1、
図2及び
図6に示すように、処理ユニット240はステップS130を実行し、初期データセットDiniに基づいて第1マルチラベル分類モデルMD1を訓練する。初期データセットDiniは、前処理後の医療画像IMGp及び局所入力ラベルPLBを含む。幾つかの実施例において、第1マルチラベル分類モデルMD1は、畳み込みニューラルネットワークを含む。この畳み込みニューラルネットワークは、分類するための畳み込み層、活性化層、プーリング層及び/又は全接続層を含んでよい。第1マルチラベル分類モデルMD1は、報酬ポリシーによって逆伝播アルゴリズムで訓練することができる。報酬ポリシーは、損失関数によって定義される。幾つかの実施例において、第1マルチラベル分類モデルMD1は、局所入力ラベルPLBによって、マスクされたバイナリクロスエントロピー損失関数に基づいて訓練し、この損失関数は、異常特徴のマークなし部分を考慮しない。
【0038】
ステップS130において、第1マルチラベル分類モデルMD1を用いて医療画像IMGpにおける様々な異常特徴に対応する予測を生成し、且つ各異常特徴の予測結果を局所入力ラベルPLBと比較して損失値を計算することで、第1マルチラベル分類モデルMD1の畳み込みニューラルネットワークにおける重み/パラメータを調整する。
【0039】
幾つかの実施例において、処理ユニット240がマスクされたバイナリクロスエントロピー損失関数を以下の式によって計算する。
【数1】
【0040】
上記式(1)において、y
iは、初期データセットDiniにおける医療画像の実際のラベル(局所入力ラベルPLBに基づく)であり、
【数2】
は、第1マルチラベル分類モデルMD1が生成した予測ラベルである。マスクされたバイナリクロスエントロピー損失関数によれば、y
iが初期データセットDiniにおける未知ラベルである場合、損失値の計算に影響を与えない。
【0041】
図1、
図2及び
図6に示すように、処理ユニット240は、ステップS140を実行して、第1マルチラベル分類モデルMD1が生成した予測に基づいて、初期データセットにおける各医療画像IMGpの難易度レベルを推定する。
【0042】
第1マルチラベル分類モデルMD1の訓練が完了した後、第1マルチラベル分類モデルMD1は、表3に示すように、各医療画像における各異常特徴に対応する確率値を生成することができる。
【表3】
【0043】
表3において、第1医療画像IMG1における異常特徴「IPH」に対応する確率値は「0.82」で、1に近く、これは、第1マルチラベル分類モデルMD1が第1医療画像IMG1に異常特徴「IPH」が存在する可能性がより高いと予測することを意味する。第1医療画像IMG1における異常特徴「IVH」に対応する確率値は「0.22」で、より0に近く、これは、第1マルチラベル分類モデルMD1が第1医療画像IMG1に異常特徴「IVH」が存在する可能性が低いと予測することを意味する。幾つかの実施例において、上記確率値は、第1マルチラベル分類モデルMD1における畳み込みニューラルネットワークによって生成されることができる。
【0044】
ステップS140において、処理ユニット240は、下記の難易度評価関数に従って各医療画像の難易度レベルを推定する。
【数3】
【0045】
式(2)では、yは、初期データセットDiniにおける医療画像(局所入力ラベルPLBに基づく)の1つの異常特徴に関する実際のラベルである。ラベルが「正」の場合、y=1である。ラベルが「負」の場合、y=0である。式(2)では、
【数4】
は、第1マルチラベル分類モデルMD1が生成した異常特徴に対応する確率値である。yと
【数5】
との差が大きいほど、第1マルチラベル分類モデルMD1による予測と実際のラベルとの差が大きいことを意味し、対応する医療画像をより予測しにくいことも示す。yと
【数6】
の間の差が小さい場合、第1マルチラベル分類モデルMD1による予測が実際のラベルにより近いことを意味し、対応する医療画像をより予測しやすいことも示す。
【0046】
幾つかの実施例において、ステップS140では、各医療画像IMGpに対応する5つの異常特徴はそれぞれ5つの難易度値を推定することができる。推定された5つの難易度値のうちの最大値は、この1枚の目標医療画像の難易度レベルと見なされる。更に表4を参照されたい。それは、難易度レベルのリストであり、例示的な例における各医療画像IMG1~IMGkの難易度レベルを示すために用いられる。
【表4】
【0047】
処理ユニット240は、ステップS150を実行し、上記各医療画像IMG1~IMGkのそれぞれから推定された難易度レベルによって、初期データセットDiniにおける(前処理を経た)医療画像IMG1~IMGkを異なるサブセットG1~G3に分ける。
【0048】
例えば、難易度レベルが最も低い医療画像IMG1及びIMG2は、第1サブセットG1に分けられてよく、難易度レベルが次に低い医療画像IMG3及びIMGkは、第2サブセットG2に分けられてよく、難易度レベルが高い医療画像IMG4は、第3サブセットG3に分けられてよい。
【0049】
幾つかの実施例において、医療画像IMG1~IMGkは、難易度レベルに基づいて10個の異なるサブセットに分けられてよい。本開示では、サブセットは特定の数に限定されず、実際の応用及びデータの特性に応じて、分けた後のサブセットの総数を調整してよい。
【0050】
図1及び
図2に示すように、処理ユニット240は、ステップS160を実行して、異なるコース学習ラウンドにおいて難易度が次第に逓増するサブセットG1~G3を用いて第2マルチラベル分類モデルMD2を訓練する。
【0051】
図6に示す例示的な例では、ステップS160の第1コース学習ラウンドR1において、まず、難易度レベルが最も低い第1サブセットG1(医療画像IMG1とIMG2及びそれに対応する局所入力ラベルPLBを含む)に基づいて、第2マルチラベル分類モデルMD2を訓練する。幾つかの実施例において、第1コース学習ラウンドR1の時間長さは、1つのエポック(epoch)計算時間に設定されてよい。
【0052】
その後、ステップS160の第2コース学習ラウンドR2において、第1サブセットG1及び第2サブセットG2(医療画像IMG3とIMGk及びそれに対応する局所入力ラベルPLBを含む)に基づいて、第2マルチラベル分類モデルMD2を再び訓練し、ここで、第2サブセットG2の難易度レベルは第1サブセットG1より高い。幾つかの実施例において、第2コース学習ラウンドR2の時間長さは、1つのエポック計算時間に設定されてよい。
【0053】
その後、ステップS160の第3コース学習ラウンドR3において、第1サブセットG1、第2サブセットG2及び第3サブセットG3(医療画像IMG4及びそれに対応する局所入力ラベルPLBを含む)に基づいて、第2マルチラベル分類モデルMD2を再び訓練する。ここで、第3サブセットG3の難易度レベルは、第1サブセットG1及び第2サブセットG2より高い。幾つかの実施例において、第3コース学習ラウンドR3の時間長さは、1つのエポック計算時間に設定されてよい。
【0054】
上記実施例に示すように、第2マルチラベル分類モデルMD2は、まず、難易度レベルが最も低い第1サブセットG1によって初回訓練し、それにより第2マルチラベル分類モデルMD2は、難易度が低い訓練データによって一定の予測正確度を予め確立することができる。次に、異なるコース学習ラウンドにおいて、難易度レベルが逓増する訓練データサブセットG1~G3によって第2マルチラベル分類モデルMD2を繰り返し訓練する。この場合、第2マルチラベル分類モデルMD2は、複数のコース学習ラウンドから難易度が逓増する訓練データの処理能力を順次取得することができる。
【0055】
図6に示す3つのコース学習ラウンドR1~R3は例として説明するものであり、本開示はそれに限定されない。幾つかの実施例において、初期データセットDiniにおける医療画像が2つのサブセットに分けられると、第2マルチラベル分類モデルMD2を順次訓練する2つのコース学習ラウンドがある。他の幾つかの実施例において、初期データセットDiniにおける医療画像が10個のサブセットに分けられると、第2マルチラベル分類モデルMD2を順次訓練するために10回のコース学習ラウンドを行う。
【0056】
幾つかの実施例において、第2マルチラベル分類モデルMD2は、畳み込みニューラルネットワーク(CNN)を含む。畳み込みニューラルネットワークは、分類するための畳み込み層、活性化層、プーリング層及び/又は全接続層を含んでよい。第2マルチラベル分類モデルMD2は、逆伝播アルゴリズムを用いて報酬ポリシーによって訓練することができる。報酬ポリシーは、損失関数によって定義される。幾つかの実施例において、第2マルチラベル分類モデルMD2は、マスクされたバイナリクロスエントロピー損失関数に基づいて、各コース学習ラウンドにおいて順次選択されたサブセット及び対応する局所入力ラベルPLBによって訓練する。
【0057】
図1及び
図2に示すように、処理ユニット240は、ステップS170を実行して、第2マルチラベル分類モデルMD2に基づいて各医療画像にマークされた予測ラベルFLBを生成する。予測ラベルFLBは、医療画像における全ての異常特徴のそれぞれをカバーする。
【0058】
例示的な例において、第2マルチラベル分類モデルMD2は、1枚の医療画像ごとに5つの予測ラベルを対応的に生成することができ、それらはそれぞれ5つの異常特徴IPH、IVH、SAH、SDH及びEDHに関する正又は負の予測ラベルである。表5に示すように、それは例示的な例において各医療画像に対応して全ての異常特徴をマークした予測ラベルFLBを生成するリストを示す。
【表5】
【0059】
表5に示すように、第2マルチラベル分類モデルMD2が生成した予測ラベルFLBは、各医療画像における全ての異常特徴IPH、IVH、SAH、SDH及びEDHに対して完全にマークする。この場合、予測ラベルFLBに欠落/未知ラベルは存在しない。
【0060】
第2マルチラベル分類モデルMD2が生成した完全な予測ラベルFLBは、医師又は医療スタッフの医療診断の支援又は補助的な参照として使用することができ、患者への効果的な治療の提供に役立つ。
図2に示すように、予測ラベルFLB(表5に示す)はディスプレイ280に表示することができる。幾つかの場合、医療スタッフ(又は患者)は、頭部コンピュータ断層撮影(CT)で患者を撮影した医療画像に様々な異常特徴IPH、IVH、SAH、SDH及びEDHが存在するか否かをこれにより迅速に知ることができる。それにより医療スタッフは、検出された異常特徴によって迅速且つ正確に対応できる(例えば、治療を行ったり、治療計画を提案したりする)。
【0061】
第2マルチラベル分類モデルMD2は、予測ラベルFLBを生成する過程において依然として誤って予測する可能性があるため、幾つかの実施例において、予測ラベルFLBは、依然として医師、医療スタッフ又は臨床科学者によって検査確認される必要がある可能性がある。
【0062】
更に
図7を参照されたい。それは本開示の幾つかの実施例による
図1に示すマルチラベル分類方法100に更に含まれる後続のステップを示すフローチャートである。
図7に示すように、マルチラベル分類方法100が上記実施例で説明したステップS110~S170を完了した後、マルチラベル分類方法100は、予測ラベルの検査及び修正のステップS181~S185を更に含む。
【0063】
図2及び
図7に示すように、処理ユニット240はステップS181を実行し、第2マルチラベル分類モデルMD2に基づいて、複数の予測ラベルFLBに対応する複数の信頼値を生成する。
【0064】
これらの信頼値は、第2マルチラベル分類モデルMD2の予測ラベルFLBに対する確信度である。幾つかの実施例において、信頼値は、第2マルチラベル分類モデルMD2における畳み込みニューラルネットワークによって生成されることができる。第2マルチラベル分類モデルMD2が目標予測ラベルに対して確信である場合、目標予測ラベルに関する信頼値はより1に近い。一方、第2マルチラベル分類モデルMD2が目標予測ラベルに対して確信でない場合、目標予測ラベルの信頼値はより0に近い。例えば、異常特徴「IPH」の信頼値が「0.82」で、より1に近い場合、第2マルチラベル分類モデルMD2は、この医療画像に異常特徴「IPH」が存在する可能性が高いと予測することを意味する。一方、医療画像において異常特徴「IVH」に対して計算した信頼値が「0.22」で、0に近い場合、第2マルチラベル分類モデルMD2がこの医療画像に異常特徴「IVH」が存在する可能性が低いと予測することを意味する。
【0065】
この場合、処理ユニット240は、予測ラベルFLBごとに信頼値を生成するために用いられる。処理ユニット240は、第2マルチラベル分類モデルMD2が生成した予測ラベルFLBを入力ラベル(初期データセットDiniにおける局所入力ラベルPLBに基づく)と比較するために用いられる。ここで、一部の予測ラベルFLBが入力ラベルと異なる機会があるかもしれない。予測ラベルFLBが入力ラベルに該当しない場合、ステップS182において、該当しない予測ラベルFLBは、信頼値と局所入力ラベルPLBの両方に基づいて絶対誤差を計算し、且つ該当しない予測ラベルFLBを絶対誤差の順序に従ってディスプレイ280に表示することができる。幾つかの実施例において、式(2)に示す難易度評価関数と同様に絶対誤差を計算してよく、つまり、信頼値及び局所入力ラベルPLBに基づいて絶対誤差を計算する。例えば、絶対誤差は、以下の式(3)によって計算する。
【数7】
【0066】
式(3)に示すように、yは、初期データセットDiniにおける医療画像の異常特徴に関する実際のラベル(局所入力ラベルPLBに基づく)である。入力ラベルが正の場合、y=1である。入力ラベルが負の場合、y=0である。式(3)では、
【数8】
は、第2マルチラベル分類モデルMD2が生成した異常特徴に対応する信頼値である。yと
【数9】
の間の差が大きいほど、第2マルチラベル分類モデルMD2による予測と実際のラベルとの差が大きいことを意味する。yと
【数10】
の間の差が小さい場合、第2マルチラベル分類モデルMD2による予測が実際のラベルにより近いことを示す。
【0067】
更に
図8を参照されたい。それは幾つかの実施例によるディスプレイ280に該当しない予測ラベルに関する関連情報INFOを表示する模式図である。
【0068】
第2医療画像IMG2の予測ラベルFLBが局所入力ラベルPLBに該当せず、且つ第2医療画像IMG2の絶対誤差の計算結果が「0.95」であると仮定する。これは、第2マルチラベル分類モデルMD2が生成した第2医療画像IMG2に関する予測ラベルFLBが局所入力ラベルPLBにおける初期ラベルと異なり、同時に第2マルチラベル分類モデルMD2自体がその予測に対して信頼値が高いことを意味する。このような状況を引き起こす潜在的な原因は2つあり、まず、第2医療画像IMG2に関する局所入力ラベルPLB自体が誤っているか、もしくは、予測ラベルFLBの予測結果が誤っている。この場合、医療スタッフは、第2医療画像IMG2にマークしたラベルが正しいか否かを時間を割り当てて注意し確認する必要がある。
図8に示すように、表示される情報INFOは、第2医療画像IMG2に関する完全な予測ラベルFLBを含み、且つ最優先順位の一番上に表示される。
【0069】
第4医療画像IMG4の予測ラベルFLBも局所入力ラベルPLBに該当せず、且つ第4医療画像IMG4の絶対誤差の計算結果が「0.77」であると仮定する。この場合も、医療スタッフは、第4医療画像IMG4にマークしたラベルが正しいか否かを時間を割り当てて注意し確認する必要がある。
図8に示すように、表示される情報INFOは、第4医療画像IMG4に関する完全な予測ラベルFLBを含み、且つ順序の二番目の位置に表示され、第2医療画像IMG2の完全な予測ラベルFLBの下に位置する。
【0070】
同様に、局所入力ラベルPLBに該当しない予測ラベルを有する医療画像がより多く存在する場合、それらの医療画像はそれぞれの絶対誤差の順序に従ってディスプレイ280に表示されることができる。
【0071】
この場合、医療スタッフ(例えば、医師、医療スタッフ、又は臨床科学者)は、絶対誤差の順序に従って該当しない予測ラベルを効率的に検査することができる。医療スタッフが予測ラベルFLBに誤りがあるのを発見した場合、医療スタッフは、入力インターフェース220を介して修正命令を入力することができる。この修正命令は、医療スタッフが予測ラベルFLBの入力に同意するか同意しないかを含んでよい。
【0072】
ステップS183において、入力インターフェース220は、各予測ラベルFLBを修正するための修正命令CMDを収集するために用いられる。修正命令CMDは、予測ラベルFLBに対して同意又は同意しないことを含む。
【0073】
ステップS184において、処理ユニット240は、修正命令CMDによって修正後の入力ラベルを取得し、局所入力ラベルPLBと修正命令CMDの両方を統合して修正後の入力ラベルを生成することができる。幾つかの実施例において、上記統合において、修正命令CMD(医療スタッフの手動入力に基づいて収集される)の優先度は、局所入力ラベルPLBよりも高い。
【0074】
ステップS185において、処理ユニット240は、修正後の入力ラベルによって複数のコース学習ラウンドで第3マルチラベル分類モデルを繰り返し訓練するために用いられる。この場合、修正後の入力ラベルは、医療スタッフの検査及び検証を経たため、カルテによって自動的に生成された局所入力ラベルPLBよりも信頼度が高い。これにより、修正後の入力ラベルを参照すれば、第3マルチラベル分類モデルは、複数のコース学習ラウンドを経て、第2マルチラベル分類モデルMD2よりも高い正確率に達することができる。ここで、ステップS185において修正後の入力ラベルによって複数のコース学習ラウンドで第3マルチラベル分類モデルを繰り返し訓練する実行の詳細は、ステップS160において局所入力ラベルPLBによって第2マルチラベル分類モデルMD2を繰り返し訓練するステップS160と同様であるため、ここでは再び説明しない。
【0075】
上記実施例に基づき、第2マルチラベル分類モデルMD2で生成された予測ラベルに該当しない状況が発生する場合、医療スタッフは、少ない時間と労力で検証と検査を完了することができる。また、マルチラベル分類方法100は、修正後の入力ラベルを自動的に生成し、且つ第3マルチラベル分類モデルを訓練することで、より高い正確率を達成することができる。この場合、マルチラベル分類方法100は、比較的低コストで精度の高いマルチラベル分類モデルを効率的に得るために用いられる。
【0076】
本開示の特定の実施例は、上記実施例を開示したが、これらの実施例は、本開示を限定することを意図するものではない。当業者は、本開示の原理及び精神から逸脱することなく、様々な代替や改良を本開示において実施することができる。したがって、本開示の保護範囲は、添付の特許請求の範囲によって決定される。
【符号の説明】
【0077】
100 マルチラベル分類方法
200 マルチラベル分類システム
220 入力インターフェース
240 処理ユニット
260 記憶ユニット
280 ディスプレイ
S110、S120、S130、S140 ステップ
S150、S160、S170 ステップ
S181、S182、S183、S184、S185 ステップ
Dini 初期データセット
IMG1、IMG2、IMG3、IMG4、IMGk 医療画像
IMG、IMGa、IMGb、IMGc、IMGd、IMGe 医療画像
IMGf、IMGg 医療画像
IMGp、IMGp1、IMGp2、IMGp3、IMGp4 医療画像
MD1 第1マルチラベル分類モデル
MD2 第2マルチラベル分類モデル
PLB 局所入力ラベル
FLB 予測ラベル
CMD 修正命令
G1、G2、G3 サブセット
R1 第1コース学習ラウンド
R2 第2コース学習ラウンド
R3 第3コース学習ラウンド
INFO 情報
【外国語明細書】