(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024174836
(43)【公開日】2024-12-17
(54)【発明の名称】医師意思決定パターン認識に基づくマルチラベル疾患診断支援システム
(51)【国際特許分類】
G06N 3/04 20230101AFI20241210BHJP
G16H 50/20 20180101ALI20241210BHJP
【FI】
G06N3/04
G16H50/20
【審査請求】有
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2024088063
(22)【出願日】2024-05-30
(11)【特許番号】
(45)【特許公報発行日】2024-08-21
(31)【優先権主張番号】202310655185.9
(32)【優先日】2023-06-05
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】521162399
【氏名又は名称】之江実験室
(74)【代理人】
【識別番号】100128347
【弁理士】
【氏名又は名称】西内 盛二
(72)【発明者】
【氏名】▲呉▼ 承▲凱▼
(72)【発明者】
【氏名】李 ▲勁▼松
(72)【発明者】
【氏名】▲蒋▼ 一帆
(72)【発明者】
【氏名】周 天舒
(72)【発明者】
【氏名】田 雨
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA04
(57)【要約】
【課題】本発明は医師意思決定パターン認識に基づくマルチラベル疾患診断支援システムを提供する。
【解決手段】
医師個体事例集構築モジュールと、医師個体意思決定パターンフィッティングモジュールと、共通成分抽出及び個体成分分離モジュールと、疾患診断支援モジュールとを含む、医師意思決定パターン認識に基づくマルチラベル疾患診断支援システムが開示されている。本発明は、個体意思決定パターン認識により、個体意思決定パターンから異なる意思決定パターンに共通して存在する共通成分を抽出し、医師の主観的な臨床経験に支配される個体成分をより多く分離することにより、疾患診断支援に対する主観的な臨床経験によって生じ得る悪影響を克服する。本発明は、医師の個体意思決定パターンを認識し、医師の面で共通成分、個体成分の分割を行うことにより、分野的な特徴を克服し、共通成分の利用により、より正確な疾患診断支援を達成することができる。
【選択図】
図1
【特許請求の範囲】
【請求項1】
医師意思決定パターン認識に基づくマルチラベル疾患診断支援システムであって、医師個体事例集構築モジュール、医師個体意思決定パターンフィッティングモジュール、共通成分抽出及び個体成分分離モジュール、及び疾患診断支援モジュールを含み、
前記医師個体事例集構築モジュールは、電子カルテにおける全体事例集を医師に応じて医師個体事例集に分割することに用いられ、前記全体事例集に係る医師の総数はKであり、各医師を
で識別し、
前記医師個体意思決定パターンフィッティングモジュールは、医師個体事例集に基づいて、1組又は単一の機械学習モデルMを構築し、機械学習モデル化により各医師の臨床過程における個体意思決定パターンをフィッティングすることに用いられ、
前記共通成分抽出及び個体成分分離モジュールは、機械学習モデル化により各医師意思決定パターンに共通して存在する客観的な医学知識を示す共性成分を抽出し、医師の主観的な臨床経験に支配される個体成分を分離し、医師の個体意思決定パターンにおける主観的な要因と客観的な要因との分離及び認識を実行することに用いられ、
前記共通成分抽出及び個体成分分離モジュールは、
機械学習モデルGの構築には2段階の分岐が含まれ、第1段階の分岐の場合に、機械学習モデルGの入力層が
及び
という2つの分岐に分けられ、
を共通成分分岐とし、第2段階の分岐の場合に、
分岐がK個のサブ分岐
に分けられてK個の個体成分分岐とされ、機械学習モデルGの入力層から
に対応する出力層までのマッピング関係をそれぞれ
と定義し、xは事例の入力ベクトルであり、共通成分のxに対するマッピングは、患者が実際に疾患に罹患する確率を示し、個体成分のxに対するマッピングは、患者が実際に疾患に罹患した場合に各医師
が罹患した疾患を診断できる確率を示し、分布類似度を計量する能力を有する分布類似度損失関数を用いてモデルトレーニングを行い、共通成分分岐の出力
と各個体成分分岐の出力
との積
と、機械学習モデルMを介して取得した各医師
の個体意思決定パターンの予測結果
との各分岐における分布の差異を最小化することと、
モデルトレーニングが完了した後、共通成分分岐マッピング関係によって全ての医師が決定パターンに共通する共通成分を反映し、各個体成分分岐マッピング関係によって各医師の特有の個体成分を反映することとを含み、
前記疾患診断支援モジュールは、構造、パラメータが前記共通成分抽出及び個体成分分離モジュールにおけるトレーニングされた機械学習モデルGと完全に一致する1つの定着モデルと、1つの共通予測確率出力インターフェースと、1つの医師診断確率出力インターフェースと、1つの医師推奨度インターフェースとを含み、
疾患診断支援サービスを呼び出すいずれか1つの事例の入力ベクトルxが前記疾患診断支援モジュールに入力された後、まず定着モデルを用いて、共通成分分岐のマッピング関係
により共通予測結果
を取得し、各個体成分分岐のマッピング関係
により各医師
の入力条件における個体疾患の有所見確率
を取得し、
次に、共通予測確率出力インターフェースによって診断支援における各疾患の参考用の罹患確率を直接的に提供するように
を共通予測結果として出力し、医師診断確率出力インターフェースによって各医師
の入力条件下における個体疾患の有所見確率
を出力し、医師推奨度インターフェースによって
に応じて降順にソートされた対応する医師のソート配列を出力して、適合医師推奨サービスを提供する
ことを特徴とする医師意思決定パターン認識に基づくマルチラベル疾患診断支援システム。
【請求項2】
前記医師個体事例集構築モジュールにおいて、電子カルテの事例データを取得して複数の事例を含む全体事例集にマトリックス化し、前記全体事例集からいずれか1名の医師のすべての事例を抽出し、当該医師に対応する医師個体事例集を構築し、前記医師個体事例集は、当該医師による診断事例の特徴マトリックスとラベルマトリックスを含む
ことを特徴とする請求項1に記載の医師意思決定パターン認識に基づくマルチラベル疾患診断支援システム。
【請求項3】
前記医師個体意思決定パターンフィッティングモジュールにおいて、1組の機械学習モデルを用いてフィッティングを行い、各モデルは、対応する医師個体事例集に基づいて、対応する医師の個体意思決定パターンを学習し、トレーニングが完了した後、事例の入力ベクトルの異なる医師個体意思決定パターンにおける予測結果からなる予測マトリックスを取得する
ことを特徴とする請求項1に記載の医師意思決定パターン認識に基づくマルチラベル疾患診断支援システム。
【請求項4】
前記医師個体意思決定パターンフィッティングモジュールにおいて、単一の機械学習モデルを用いてフィッティングを行い、モデルは多分岐ネットワーク構造を採用し、制御アセンブリを含み、トレーニング過程において、制御アセンブリにより、いずれか1つの分岐が対応する医師個体事例集のみに基づいて、対応する医師の個体意思決定パターンを学習することを保証し、トレーニングが完了した後、事例の入力ベクトルの異なる医師個体意思決定パターンにおける予測結果からなる予測マトリックスを取得する
ことを特徴とする請求項1に記載の医師意思決定パターン認識に基づくマルチラベル疾患診断支援システム。
【請求項5】
前記分布類似度損失関数は、KLダイバージェンス損失関数又はJSダイバージェンス損失関数を採用する
ことを特徴とする請求項1に記載の医師意思決定パターン認識に基づくマルチラベル疾患診断支援システム。
【請求項6】
前記分布類似度損失関数を基にして、疾患関係学習のマルチラベル損失関数成分を追加し、モデルトレーニングを共同で行う
ことを特徴とする請求項1に記載の医師意思決定パターン認識に基づくマルチラベル疾患診断支援システム。
【請求項7】
前記共通成分抽出及び個体成分分離モジュールにおいて、構築された機械学習モデルは複数の機械学習モデルに分割されて連合学習を行う
ことを特徴とする請求項1に記載の医師意思決定パターン認識に基づくマルチラベル疾患診断支援システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は医療健康情報技術分野に属し、特に医師意思決定パターン認識に基づくマルチラベル疾患診断支援システムに関する。
【背景技術】
【0002】
医療情報化における持続的な水準向上に伴い、電子カルテなどの医療情報システムに大量の患者診療と臨床意思決定データが蓄積されており、臨床ビッグデータと人工知能に基づいて臨床診断支援方法の研究を行い、高水準の疾患の予防及び制御を実現することを推進することは、分野内の研究の焦点となっている。研究者は、機械学習、深層学習などのモデル及び方法を利用して電子カルテデータを分析してマイニングすることにより、疾患診断意思決定サポートモデル、方法及びシステムを構築することが多い。
【0003】
現在の疾患診断支援方法とシステムは、一般的に全体の電子カルテデータを直接使用してモデル化し、モデル化効果は臨床意思決定過程における医師意思決定の異質性の問題の影響を受けている。電子カルテデータは臨床過程の記録であり、その中に記憶された臨床疾患診断データは医師の臨床意思決定に由来し、ゴールドスタンダードデータではない。臨床診断過程において、各医師の意思決定パターンは、客観的な医学知識に関するだけでなく、医師の主観的な判断に大きく依存し、医師の専門、過去の経験、得意な疾患、慎重さなどの影響を受けているため、意思決定ロジックとデータ完全性にいずれも極大な差異がある。
【0004】
研究により、医師の臨床意思決定ロジックの間に明らかな差異性と個体傾向性、即ち医師意思決定の異質性が存在することを発見した。例えば、文献
には、臨床多動症に対する研究において、医師の個体の要因によって28%の多動症診断及び管理方式の差異を引き起こすことが示された。文献
には、電子カルテデータを振り返りして分析したことによって、疾患-部門の不整合、対応する病種知識の欠如などの医師意思決定の要因により、指標異常が存在する慢性腎臓病の患者がタイムリーに診断を受けることが困難であり、未診断率が61.4%に達することを発見したことが示された。
【0005】
上記研究結果から明らかなように、臨床意思決定過程における医師意思決定の異質性を考慮せずに、臨床データを直接統合してモデル構築を行うと、疾患発見効果に極大な制約が生じる。電子カルテにおけるデータは、今回受診した医師によって与えられた診断の電子化記録を示すものだけであり、臨床過程における医師意思決定の異質性の影響を受け、最も直感的な表現と言えば、患者が電子カルテデータにおいてある疾患の診断記録を欠いていることは、患者が実際に疾患を患っていないことを意味しない。
【0006】
本発明に近い技術案は、以下のことを含む。
1)弱教師あり学習方法では、データ訂正の方式で正負の診断サンプルを同時に誤りを訂正することにより、直接的に不完全な診断データに基づいてモデル化し、
2)半教師あり学習方法では、少量のサンプルを精密にラベル付けすることにより、小部分の検証済みの全体医療データと大部分のラベル付けなしのサンプルを利用してモデル化し、
3)ポジティブサンプル-ラベルなし学習では、ネガティブサンプルをラベルなしのサンプルとみなし、ポジティブサンプルを精密サンプルとすることにより、偽陰性サンプルの認識又は最尤推定などの方式でモデル化する。
【0007】
上記従来技術は、弱教師あり、半教師あり、陽性-ラベルなしなどのデータを利用して臨床データに対して学習とモデル化を仮に行うことで、臨床データの不一致、不完全などの分野特性を意識し、直接の教師あり学習に対してより良い効果がある。しかしながら、上記技術は、汎用データに基づいて仮に展開され、一般的に存在する医師意思決定の異質性について検討することが少ない。
【0008】
医師の個体臨床意思決定パターンは、「主観的な要因と客観的な要因との混合」、「簡単なデータ統合によってトレーニングタスクにおいて互いに相殺できない」などの分野的な特徴を有し、医師意思決定パターンの違いによるデータ偏差を、データ統合トレーニングによって解消することが困難である。したがって、上記の汎用データに基づく仮定及び汎用機械学習方法に基づく技術では、医師意思決定の異質性での電子カルテデータに対する十分な分析とマイニングを実現することが困難であり、構築されたシステムの疾患診断支援能力が制限される。
【0009】
主観的な要因と客観的な要因との混合とは、すなわち、医師の個体臨床意思決定パターンは、客観的な医学知識と医師の主観的な臨床経験とが混合した結果であり、そのうちの主観的な臨床経験は疾患診断支援に影響を与える。本発明は、個体意思決定パターン認識により、個体意思決定パターンから異なる意思決定パターンに共通して存在する共通成分を抽出し、医師の主観的な臨床経験に支配される個体成分をより多く分離することにより、疾患診断支援に対する主観的な臨床経験によって生じ得る悪影響を克服する。
【0010】
簡単なデータ統合によってトレーニングタスクにおいて互いに相殺できないとは、すなわち、医師の主観的な臨床経験は医師の間に差が存在するが、これらの主観的な臨床経験もランダムに生じるものではないため、この差をビッグデータ統合によって相殺することはできない。本発明の従来の同類技術案は、データの不一致、不完全性を認めて、1)グローバル内でランダム分布を満たすこと、又は2)各ローカル内でランダム分布を満たすことであり、これにより、簡単なデータ統合の方式で疾患診断支援に対してモデル化する。上記同類技術案は実際に臨床データの実際の生成ロジックを満たさないため、効果が大きく制約される。本発明は、医師の個体意思決定パターンを認識し、医師の面で共通成分、個体成分の分けを行うことにより、当該分野的な特徴を克服し、共通成分の利用により、より効果的な疾患診断支援を達成することができる。
【0011】
全体として、本発明は、医師意思決定パターン認識に基づいて、臨床の実際に即して臨床データを分析し、モデル化することにより、医師個体意思決定パターンへのフィッティングを実現し、医師個体意思決定パターンにおける個体成分と共通成分を取得する。これにより、臨床データにおける医師意思決定の異質性の問題を克服し、共通成分によってより正確な疾患診断支援を実現する。
【発明の概要】
【発明が解決しようとする課題】
【0012】
本発明の目的は、従来技術の欠点に対して、医師意思決定パターン認識に基づくマルチラベル疾患診断支援システムを提供し、臨床データにおける医師意思決定の異質性の問題を克服し、より正確な疾患診断支援を実現することにある。
【課題を解決するための手段】
【0013】
本発明の目的は、以下の技術案により実現される。医師意思決定パターン認識に基づくマルチラベル疾患診断支援システムであって、医師個体事例集構築モジュール、医師個体意思決定パターンフィッティングモジュール、共通成分抽出及び個体成分分離モジュール、及び疾患診断支援モジュールを含み、
前記医師個体事例集構築モジュールは、電子カルテにおける全体事例集を医師に応じて医師個体事例集に分割することに用いられ、
前記医師個体意思決定パターンフィッティングモジュールは、医師個体事例集に基づいて、機械学習モデル化により各医師の臨床過程における個体意思決定パターンをフィッティングすることに用いられ、
前記共通成分抽出及び個体成分分離モジュールは、機械学習モデル化により各医師意思決定パターンにおける共通成分を抽出し、個体成分を分離することに用いられ、
前記医師個体意思決定パターンフィッティングモジュールは、
機械学習モデルを構築し、モデルから1つの共通成分分岐と複数の個体成分分岐とを分離し、全ての分岐の入力と出力のマッピング関係をそれぞれ定義し、分布類似度損失関数を用いてモデルトレーニングを行い、共通成分分岐の出力と各個体成分分岐の出力との積と個体意思決定パターンの予測結果の各分岐における分布の差異を最小化することと、
モデルトレーニングが完了した後、共通成分分岐マッピング関係によって全ての医師が決定パターンに共通する共通成分を反映し、各個体成分分岐マッピング関係によって各医師の特有の個体成分を反映することとを含み、
前記疾患診断支援モジュールは、トレーニングされたモデルに基づいて、事例の入力ベクトルに対応する共通成分及び個体成分を取得し、疾患診断支援を実現することに用いられる。
【0014】
さらに、前記医師個体事例集構築モジュールにおいて、電子カルテの事例データを取得して複数の事例を含む全体事例集にマトリックス化し、前記全体事例集からいずれか1名の医師のすべての事例を抽出し、当該医師に対応する医師個体事例集を構築し、前記医師個体事例集は、当該医師による診断事例の特徴マトリックスとラベルマトリックスを含む。
【0015】
さらに、前記医師個体意思決定パターンフィッティングモジュールにおいて、1組の機械学習モデルを用いてフィッティングを行い、各モデルは、対応する医師個体事例集に基づいて、対応する医師の個体意思決定パターンを学習し、トレーニングが完了した後、事例の入力ベクトルの異なる医師個体意思決定パターンにおける予測結果からなる予測マトリックスを取得する。
または、単一の機械学習モデルを用いてフィッティングを行い、モデルは多分岐ネットワーク構造を採用し、制御アセンブリを含み、トレーニング過程において、制御アセンブリにより、いずれか1つの分岐が対応する医師個体事例集のみに基づいて、対応する医師の個体意思決定パターンを学習することを保証し、トレーニングが完了した後、事例の入力ベクトルの異なる医師個体意思決定パターンにおける予測結果からなる予測マトリックスを取得する。
【0016】
さらに、前記共通成分抽出及び個体成分分離モジュールにおいて、機械学習モデルを構築し、モデルの入力層を2つの分岐に分け、一方の分岐を共通成分分岐とし、他方の分岐をさらに複数の個体成分分岐に分け、モデルの入力層から全ての分岐に対応する出力層までのマッピング関係をそれぞれ定義し、分布類似度損失関数を用いてモデルトレーニングを行う。
【0017】
さらに、前記分布類似度損失関数は、KLダイバージェンス損失関数又はJSダイバージェンス損失関数を採用する。
【0018】
さらに、前記分布類似度損失関数を基にして、疾患関係学習のマルチラベル損失関数成分を追加し、モデルトレーニングを共同で行う。
【0019】
さらに、前記共通成分抽出及び個体成分分離モジュールにおいて、構築された機械学習モデルは複数の機械学習モデルに分割されて連合学習を行う。
【0020】
さらに、前記疾患診断支援モジュールは、構造やパラメータが前記共通成分抽出及び個体成分分離モジュールにおいてトレーニングされた機械学習モデルと完全に一致する1つの定着モデルを含み、事例の入力ベクトルが定着モデルに入力され、共通成分分岐のマッピング関係により共通予測結果を取得し、各個体成分分岐のマッピング関係により各医師の入力条件における個体疾患の有所見確率を取得する。
【0021】
さらに、前記疾患診断支援モジュールは、以下のインターフェースを含み、
共通予測結果を出力し、診断支援における各疾患の参考用の罹患確率を提供することに用いられる共通予測確率出力インターフェースと、
各医師の入力条件における個体疾患の有所見確率を出力する医師診断確率出力インターフェースと、
各医師の入力条件における個体疾患の有所見確率に応じて降順にソートされた対応する医師のソート配列を出力し、適合医師推奨サービスを提供する医師推奨度インターフェースと、を含む。
【発明の効果】
【0022】
本発明の有益な効果は以下の通りである。
1.医師個体意思決定パターンの視点における革新的な医師意思決定パターン認識マルチラベル方法を構築することにより、医師意思決定の異質性を克服し、医師個体意思決定パターンにおける共通成分を抽出し、個体成分を分離し、医師個体意思決定パターンにおける主観的な要因と客観的な要因との分離及び認識を実行する。
2.意思決定パターン認識により、従来の同類方法の、簡単なデータ統合によるデータ利用における欠陥を克服し、医師意思決定パターンにおける共通成分のより客観的、効果的な抽出を実現し、抽出された共通成分を核心としてマルチラベル疾患診断支援システムを構築することで、より正確な疾患診断支援を達成する。
【図面の簡単な説明】
【0023】
【
図1】一例示的な実施例に示される医師意思決定パターン認識に基づくマルチラベル疾患診断支援システムの構成図である。
【
図2】一例示的な実施例に示される1組の機械学習モデルを用いて医師個体意思決定パターンのフィッティングを行うフレームワークである。
【
図3】一例示的な実施例に示される単一の機械学習モデルを用いて医師個体意思決定パターンのフィッティングを行うフレームワークである。
【
図4】一例示的な実施例に示される機械学習モデルGのアーキテクチャ図である。
【
図5】一例示的な実施例に示される疾患診断支援効果の比較図である。
【発明を実施するための形態】
【0024】
本願の技術案をよりよく理解するために、以下は、添付の図面を参照して本願の実施例を詳細に説明する。
【0025】
記述される実施例は、本願の一部の実施例に過ぎず、全ての実施例ではないことを明確にすべきである。本願における実施例に基づいて、当業者が進歩性に値する労働をせずに得られる全ての他の実施例は、いずれも本願の保護範囲に属する。
【0026】
本願の実施例において使用される用語は、特定の実施例を説明する目的だけであり、本願を制限することを意図するものではない。本願の実施例及び添付の特許請求の範囲に使用される単数の形式の「一種」、「前記」及び「当該」も、コンテキストが他の意味を明確に示さない限り、多数の形式を含むことを意図する。
【0027】
本発明の実施例は、医師意思決定パターン認識に基づくマルチラベル疾患診断支援システムを提供し、
図1に示すように、当該システムは、医師個体事例集構築モジュールと、医師個体意思決定パターンフィッティングモジュールと、共通成分抽出及び個体成分分離モジュールと、疾患診断支援モジュールとを含む。医師個体事例集構築モジュールは、電子カルテにおける全体事例集を医師に応じて医師個体事例集に分割することに用いられ、医師個体意思決定パターンフィッティングモジュールは、機械学習モデル化により各医師の個体意思決定パターンをフィッティングすることに用いられ、共通成分抽出及び個体成分分離モジュールは、機械学習モデル化により各医師意思決定パターンにおける共通成分を抽出し、個体成分を分離することに用いられ、疾患診断支援モジュールは、定着モデルに基いて入力ベクトルに対応する共通成分及び個体成分を取得することに用いられ、疾患診断支援サービスに用いられる。各モジュールの具体的な機能は以下の通りである。
【0028】
1)医師個体事例集構築モジュール
.csvファイル又はoracleなどのデータベースに記憶された電子カルテの事例データを抽出してシステムに取り込み、N個の事例を含む全体事例集
にマトリックス化し、各事例を
と記す。全体事例集Dは、特徴マトリックス
とラベルマトリックス
とを含み、特徴マトリックス
において、
は各事例の入力ベクトルであり、各入力ベクトル成分の取り得る値の範囲は実数
であり、特徴は、年齢、名前、BMI、血液通常指標、尿通常指標などを含み、Tは転置を示し、ラベルマトリックス
において、
は各事例の出力ベクトルであり、各出力ベクトル成分の取り得る値の範囲は
、0で当該事例に当該出力ベクトル成分に対応する疾患の診断が存在しないことを示し、1で当該事例に当該出力ベクトル成分に対応する疾患の診断が存在することを示す。全体事例集Dに係る医師の総数をKと定義し、各医師を
で識別する。全体事例集Dからいずれか1名の医師
の全ての事例を抽出すると、当該医師に対応する医師個体事例集
を構築することができ、
はそれぞれ医師
による診断事例の特徴マトリックスとラベルマトリックスである。
【0029】
2)医師個体意思決定パターンフィッティングモジュール
1組又は単一の機械学習モデルMを構築し、機械学習モデルとしてニューラルネットワークアーキテクチャ又は非ニューラルネットワークアーキテクチャが用いられ、医師個体事例集に基づいて医師の決定パターンを学習することにより、モデルMが医師の臨床過程における個体意思決定パターンをフィッティングできるようになる。
【0030】
1組の機械学習モデルを用いてフィッティングを行うと、
図2に示すように、
であり、各モデル
は、対応する医師個体事例集
に基づいて、形骸化されて
として示される過程によってトレーニングを完了させ、医師
の個体意思決定パターンをシミュレートした。トレーニングが完了した後、いずれか1つの事例の入力ベクトルxに対して、モデルMによって、異なる医師
の個体意思決定パターンにおけるxの予測結果
からなる予測マトリックス
を取得することができる。
【0031】
単一の機械学習モデルを用いてフィッティングを行うと、
図3に示すように、Mは多分岐ネットワーク構造を選択してもよく、K個の分岐
を含み、制御アセンブリGateも含み、全体事例集
に基づいて、形骸化されて
として示される過程によってトレーニングを完了させる。トレーニング過程において、複数種の選択可能な制御アセンブリGateは、いずれか1つの分岐
が医師
の個体意思決定パターンのみを学習することを保証することに用いられる。トレーニングが完了した後、いずれか1つの事例の入力ベクトルxに対して、モデルMによって、異なる医師
に対応する分岐
におけるxの予測結果
からなる予測マトリックス
を取得することができる。
【0032】
上記のいずれの方式でモデル化とトレーニングを行っても、
はモデルで予測する医師
が臨床過程において対応する疾患を診断した確率を示す。トレーニング過程において、
の出力確率値が区間(0,1)内に維持されるように、クロスエントロピー損失関数
を用いて最適化することを推奨する。
【0033】
3)共通成分抽出及び個体成分分離モジュール
本モジュールは、機械学習モデルGを構築してトレーニングすることにより、各医師
の個体意思決定パターンを、全ての医師のパターンにおける共通する共通成分fと、当該医師に特有の個体成分
との2つの成分に分離する。
【0034】
理論的には、いずれか1つの未知の入力ベクトルxに対して、1)共通成分のxに対するマッピング
は、患者が実際に疾患に罹患する確率を示し、2)個体成分のxに対するマッピング
は、患者が実際に疾患に罹患した場合に医師
が罹患した疾患を診断できる確率を示し、3)
はモデルで予測する医師
が臨床過程において対応する疾患を診断した確率を示す。同時に、医師が臨床過程において診断した疾患はすべて正確であると仮定すると、
となる。
【0035】
上記の定義と仮定に基づいて、ベイズの定理
を
に書き換えることができる。
【0036】
機械学習モデルGの構築には、論理的に2段階の分岐が含まれる。
図4に示すように、第1段階の分岐の場合に、モデルGの入力層が
及び
という2つの分岐に分けられ、第2段階の分岐の場合に、
分岐がさらにK個のサブ分岐
に分けられる。モデルGの入力層から
に対応する出力層までのマッピング関係をそれぞれ
と定義する。その後、分布類似度を計量する能力を有する分布類似度損失関数Lを用いてモデルトレーニングを行い、
とモデルMを介して取得した
との各分岐における分布の差異を最小化する。本実施例では、KLダイバージェンス損失関数を分布類似度損失関数として選択し、すなわち、
、ただし、
はKLダイバージェンス損失関数である。トレーニングが完了した後、モデルは、マッピング関係
によってすべての医師がパターンに共通する共通成分fを反映し、マッピング関係
によって医師
特有の個体成分
を反映した。
【0037】
本モジュールの特徴は、機械学習のトレーニング過程によって、マッピング関係
を用いて共通成分fを反映し、各マッピング関係
を用いて各個体成分
を反映するモデル構造を構築し、モデルは、ニューラルネットワークアーキテクチャ又は非ニューラルネットワークアーキテクチャを用いてもよく、ある分布類似度損失関数Lに基づいて、個体意思決定パターンのモデリング予測結果
と2つの成分の積
との分布の差異を最小化できることにある。
実際の操作において、本モジュールの上記分岐過程は同一のステップに統合される可能性があり、すなわち、モデルGから
が含まれるK+1個の分岐を直接的に分離する。機械学習モデルGは、複数の機械学習モデルに分割されて連合学習を行うことができ、各分岐のモデル構造は限定されず、選択可能なモデル構造は、多層ニューラルネットワーク(MLP)、動径基底関数ニューラルネットワーク(RBF)などを含むが、これらに限定されない。分布類似度損失関数Lの選択は限定されず、KLダイバージェンス(Kullback-Leibler divergence)、JSダイバージェンス(Jensen-Shannon divergence)などを含むが、これらに限定されず、これに加えて疾患関係学習のマルチラベル損失関数成分、例えばBP-MLL損失関数(Backpropagation for Multi-Label Learning)を追加する可能性もある。
【0038】
4)疾患診断支援モジュール
本モジュールは、構造、パラメータが機械学習モデルGと完全に一致する1つの定着モデルと、1つの共通予測確率出力インターフェースと、1つの医師診断確率出力インターフェースと、1つの医師推奨度インターフェースとを含む。
【0039】
疾患診断支援サービスを呼び出すいずれか1つの入力ベクトルxが前記本モジュールに入力された後、まず定着モデルを用いて、マッピング関係
により共通予測結果
を取得し、各マッピング関係
により各医師
の当該入力条件における個体疾患の有所見確率
を取得する。その後、共通予測確率出力インターフェースによって診断支援における各疾患の参考用の罹患確率を直接的に提供するように
を共通予測結果として出力し、医師診断確率出力インターフェースによって各医師
の当該入力条件下における個体疾患の有所見確率
を出力し、医師推奨度インターフェースによって
に応じて降順にソートされた対応する医師のソート配列を出力して、適合医師推奨サービスを提供する。
【0040】
一実施例において、被験者特徴曲線の下面積(Area Under Receiver Operating Characteristic Curve,AUC
ROC)によって、発明されたシステムの疾患診断支援効果と、共通成分抽出及び個体成分分離モジュールに処理されていない多層ニューラルネットワークMLP、動径基底関数ニューラルネットワークRBFの疾患診断支援効果とを比較し、
図5に示すように、比較結果は、本システムの疾患診断支援能力が比較用の2種類の汎用機械学習モデルより優れていることを示す。
【0041】
本発明は、医師を中心として、患者データを抽出することにより、異なる医師に対応する医師個体事例集を構築し、医師意思決定パターンという視点からマルチラベル疾患診断支援システムを構築し、本発明は、医師個体意思決定パターンフィッティングと、決定パターンにおける共通成分抽出及び個体成分分離との2つの過程により、共通成分、個体成分の明確及び利用を実現する。
【0042】
以上、本明細書の特定の実施例について説明した。その他の実施例は、添付の特許請求の範囲内にある。いくつかの場合、特許請求の範囲に記載の動作又はステップは実施例と異なる順序で実行することができ、かつ依然として所望の結果を実現することができる。また、添付の図に描画する過程は、所望の結果を実現するために、示された特定の順序又は連続的な順序を必ずしも必要としない。いくつかの実施形態において、マルチタスク処理及び並列処理も可能であるか又は有利である可能性がある。
【0043】
本明細書の1つまたは複数の実施例において使用される用語は、特定の実施例を説明する目的だけであり、本明細書の1つまたは複数の実施例を制限することを意図するものではない。本明細書の1つまたは複数の実施例及び添付の特許請求の範囲に使用される単数の形式の「一種」、「前記」及び「当該」も、コンテキストが他の意味を明確に示さない限り、多数の形式を含むことを意図する。本明細書において使用される「および/または」という用語は、1つまたは複数の関連する列挙された項目の任意またはすべての可能な組合わせを意味することは、理解されるべきである。