IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝メディカルシステムズ株式会社の特許一覧

特開2024-74287医用情報処理装置、方法及びプログラム
<>
  • 特開-医用情報処理装置、方法及びプログラム 図1
  • 特開-医用情報処理装置、方法及びプログラム 図2
  • 特開-医用情報処理装置、方法及びプログラム 図3
  • 特開-医用情報処理装置、方法及びプログラム 図4
  • 特開-医用情報処理装置、方法及びプログラム 図5
  • 特開-医用情報処理装置、方法及びプログラム 図6
  • 特開-医用情報処理装置、方法及びプログラム 図7
  • 特開-医用情報処理装置、方法及びプログラム 図8
  • 特開-医用情報処理装置、方法及びプログラム 図9
  • 特開-医用情報処理装置、方法及びプログラム 図10
  • 特開-医用情報処理装置、方法及びプログラム 図11
  • 特開-医用情報処理装置、方法及びプログラム 図12
  • 特開-医用情報処理装置、方法及びプログラム 図13
  • 特開-医用情報処理装置、方法及びプログラム 図14
  • 特開-医用情報処理装置、方法及びプログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024074287
(43)【公開日】2024-05-30
(54)【発明の名称】医用情報処理装置、方法及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240523BHJP
   G16H 50/50 20180101ALI20240523BHJP
【FI】
G06N20/00 130
G16H50/50
【審査請求】未請求
【請求項の数】18
【出願形態】OL
(21)【出願番号】P 2023196117
(22)【出願日】2023-11-17
(31)【優先権主張番号】P 2022185156
(32)【優先日】2022-11-18
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】594164542
【氏名又は名称】キヤノンメディカルシステムズ株式会社
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(72)【発明者】
【氏名】狩野 佑介
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA04
(57)【要約】
【課題】少量のサンプルからでも精度良く治療効果を推定すること。
【解決手段】 実施形態に係る医用情報処理装置は、第1取得部、第2取得部、付与部及び学習部を有する。第1取得部は、複数の訓練サンプルを取得する。複数の訓練サンプル各々は被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む。第2取得部は、複数の訓練サンプルから独立した知識ベースを取得する。付与部は、知識ベースに基づいて、複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する。学習部は、少なくとも知識ラベルが付与された少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論するモデルを訓練する。知識ラベルが付与された少なくとも一部の訓練サンプルは、特徴量、種別ラベル、効果ラベル及び知識ラベルを含む。
【選択図】 図1
【特許請求の範囲】
【請求項1】
複数の訓練サンプルを取得する部であって、前記複数の訓練サンプル各々は被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む、第1取得部と、
前記複数の訓練サンプルから独立した知識ベースを取得する第2取得部と、
前記知識ベースに基づいて、前記複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する付与部と、
少なくとも前記知識ラベルが付与された前記少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論するモデルを訓練する部であって、前記知識ラベルが付与された前記少なくとも一部の訓練サンプルは、前記特徴量、前記種別ラベル、前記効果ラベル及び前記知識ラベルを含む、学習部と、
を具備する医用情報処理装置。
【請求項2】
前記学習部は、前記知識ラベルの推定と前記イベントの効果値の推定とのマルチタスク学習により前記モデルを訓練する、請求項1記載の医用情報処理装置。
【請求項3】
前記知識ラベルは、イベントの推奨種別及び推奨度を有する、請求項1記載の医用情報処理装置。
【請求項4】
前記学習部は、損失関数により評価される損失を小さくするように前記モデルを訓練し、
前記損失関数は、前記イベントの種別毎の推定効果値と前記効果ラベルとの回帰誤差を表す第1の損失関数と、前記イベントの種別毎の推定推奨確率と前記知識ラベルとの交差エントロピー誤差を表す第2の損失関数と、を含む、
請求項3記載の医用情報処理装置。
【請求項5】
前記学習部は、前記イベントの種別毎の推定効果値を前記推定推奨確率に変換する、請求項4記載の医用情報処理装置。
【請求項6】
前記学習部は、前記知識ラベルに含まれる前記推奨度に応じて前記訓練サンプル毎の前記第1の損失関数に対する第1の重み及び前記第2の損失関数に対する第2の重みを変更する、請求項4記載の医用情報処理装置。
【請求項7】
前記損失関数は、
前記イベントの推定種別と前記種別ラベルとの分類誤差を表す第3の損失関数と、
前記推定種別に対応する潜在変数と前記推定効果値に対応する潜在変数との非直交性にペナルティを与える第4の損失関数と、を含む、
請求項4記載の医用情報処理装置。
【請求項8】
前記種別ラベルと前記知識ラベルとの統合ラベルを生成する統合部を更に備え、
前記学習部は、前記特徴量及び前記統合ラベルを含む統合サンプルに基づいて前記モデルを訓練する、
請求項1記載の医用情報処理装置。
【請求項9】
前記種別ラベルを有さない人工サンプルを生成する生成部を更に備え、
前記付与部は、前記人工サンプルに前記知識ラベルを付与し、
前記学習部は、前記知識ラベルが付与された前記少なくとも一部の訓練サンプル及び前記人工サンプルに基づいて前記モデルを訓練する、
請求項1記載の医用情報処理装置。
【請求項10】
前記生成部は、前記人工サンプルを、他施設から取得する又は疑似的に生成する、請求項9記載の医用情報処理装置。
【請求項11】
前記生成部は、前記人工サンプルと前記複数の訓練サンプルとの間のデータ空間内での距離に基づいて当該人工サンプルの採否を決定する、請求項9記載の医用情報処理装置。
【請求項12】
対象被検体に関する状態を表す対象特徴量を取得する第3取得部と、
前記対象特徴量と前記モデルとに基づいて前記対象被検体に対するイベントの種別毎の効果値を推論する推論部を更に備える、
請求項1記載の医用情報処理装置。
【請求項13】
前記推論部は、前記対象被検体に対するイベントの種別毎の前記効果値と前記対象被検体に対するイベントの推奨種別とを推論する、請求項12記載の医用情報処理装置。
【請求項14】
前記効果値を表示する表示部を更に備える、請求項10記載の医用情報処理装置。
【請求項15】
前記推奨種別は、未知クラスを含む、請求項3記載の医用情報処理装置。
【請求項16】
複数の訓練サンプルを取得する工程であって、前記複数の訓練サンプル各々は被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む、第1取得工程と、
前記複数の訓練サンプルから独立した知識ベースを取得する第2取得工程と、
前記知識ベースに基づいて、前記複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する付与工程と、
少なくとも前記知識ラベルが付与された前記少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論するモデルを訓練する工程であって、前記知識ラベルが付与された前記少なくとも一部の訓練サンプルは、前記特徴量、前記種別ラベル、前記効果ラベル及び前記知識ラベルを含む、学習工程と、
を具備する医用情報処理方法。
【請求項17】
コンピュータに、
複数の訓練サンプルを取得させる機能であって、前記複数の訓練サンプル各々は被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む、第1取得機能と、
前記複数の訓練サンプルから独立した知識ベースを取得させる第2取得機能と、
前記知識ベースに基づいて、前記複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与させる付与機能と、
少なくとも前記知識ラベルが付与された前記少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論するモデルを訓練させる機能であって、前記知識ラベルが付与された前記少なくとも一部の訓練サンプルは、前記特徴量、前記種別ラベル、前記効果ラベル及び前記知識ラベルを含む、学習機能と、
を実現させる医用情報処理プログラム。
【請求項18】
複数の訓練サンプルに基づいて訓練されたモデルを取得する部であって、前記複数の訓練サンプルの少なくとも一部は、被検体の状態を表す特徴量、当該被検体に施したイベントの種別ラベル、当該イベントの効果ラベル、前記複数の訓練サンプルから独立した知識ベースに基づく知識ラベルを含む、第4取得部と、
対象被検体に関する状態を表す対象特徴量を取得する第5取得部と、
前記対象特徴量と前記モデルとに基づいて前記対象被検体に対するイベントの種別毎の効果を推論する推論部を更に備える、
を具備する医用情報処理装置。

【発明の詳細な説明】
【技術分野】
【0001】
本明細書及び図面に開示の実施形態は、医用情報処理装置、方法及びプログラムに関する。
【背景技術】
【0002】
個別化医療では、因果関係を正しく考慮して治療効果を推定することが重要である。そこで、患者の状態を表す特徴量から当該患者に施すべき医療イベントの治療効果を推定する因果推論モデルの構築が試みられている。しかし、医療においては、機械学習のための大量の訓練サンプルを収集することが難しい場合がある。また、治療効果の推定の精度を向上するうえでは、訓練サンプルに基づく機械学習のみではなく、今までに獲得された既存の医療知識を活用することが望ましい。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-157602号公報
【特許文献2】特開2005-25659号公報
【非特許文献】
【0004】
【非特許文献1】Yiqin Yu等、“Dynamic Knowledge Distillation for Hypothesis Transfer Learning”、arXiv:2007.12355v2 [cs.LG]、2020年8月7日
【発明の概要】
【発明が解決しようとする課題】
【0005】
本明細書及び図面に開示の実施形態が解決しようとする課題の一つは、少量のサンプルからでも精度良く治療効果を推定することである。ただし、本明細書及び図面に開示の実施形態により解決しようとする課題は上記課題に限られない。後述する実施形態に示す各構成による各効果に対応する課題を他の課題として位置づけることもできる。
【課題を解決するための手段】
【0006】
実施形態に係る医用情報処理装置は、第1取得部、第2取得部、付与部及び学習部を有する。第1取得部は、複数の訓練サンプルを取得する。複数の訓練サンプル各々は被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む。第2取得部は、複数の訓練サンプルから独立した知識ベースを取得する。付与部は、知識ベースに基づいて、複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する。学習部は、少なくとも知識ラベルが付与された少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論するモデルを訓練する。知識ラベルが付与された少なくとも一部の訓練サンプルは、特徴量、種別ラベル、効果ラベル及び知識ラベルを含む。
【図面の簡単な説明】
【0007】
図1図1は、本実施形態に係る医用情報処理装置の構成例を示す図である。
図2図2は、医用情報処理(因果推論モデルの学習処理)の処理手順を示す図である。
図3図3は、図2に示す学習処理を模式的に示す図である。
図4図4は、知識ベースの取得例を模式的に示す図である。
図5図5は、知識ラベルの付与処理後の訓練データセットの具体例を示す図である。
図6図6は、因果推論モデルに対する学習処理の全体を模式的に示す図である。
図7図7は、第1の損失関数L及び第2の損失関数Lの詳細を模式的に示す図である。
図8図8は、応用例1に係る医用情報処理装置の構成例を示す図である。
図9図9は、応用例1に係る学習処理を模式的に示す図である。
図10図10は、応用例2に係る医用情報処理装置の構成例を示す図である
図11図11は、人工サンプルの生成処理を模式的に示す図である。
図12図12は、人工サンプルの採否の決定処理を模式的に示す図である。
図13図13は、応用例3に係る医用情報処理装置の構成例を示す図である。
図14図14は、応用例3に係る医用情報処理装置による推論処理の処理手順を示す図である。
図15図15は、応用例3に係る、治療効果値と推奨種別との表示画面の一例を示す図である。
【発明を実施するための形態】
【0008】
以下、図面を参照しながら、本実施形態に係る医用情報処理装置、方法及びプログラムについ説明する。
【0009】
図1は、本実施形態に係る医用情報処理装置1の構成例を示す図である。図1に示すように、医用情報処理装置1は、処理回路11、記憶装置12、入力機器13、通信機器14及び表示機器15を有するコンピュータ等の情報処理端末である。処理回路11、記憶装置12、入力機器13、通信機器14及び表示機器15はバス(Bus)を介して相互に信号を入出力可能に接続されている。
【0010】
処理回路11は、CPU(Central Processing Unit)及びGPU(Graphics Processing Unit)等のプロセッサを有する。処理回路11は、医用情報処理プログラムを実行することにより、サンプル取得機能111、知識ベース取得機能112、付与機能113、学習機能114及び表示制御機能115等を実現する。なお、各機能111~115は単一の処理回路で実現される場合に限らない。複数の独立したプロセッサを組合せて処理回路を構成し、各プロセッサがプログラムを実行することにより各機能111~115を実現するものとしても構わない。また、機能111~115は、それぞれ医用情報処理プログラムを構成するモジュール化されたプログラムであってもよい。これらプログラムは記憶装置12に記憶される。
【0011】
記憶装置12は、種々の情報を記憶するROM(Read Only Memory)やRAM(Random Access Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)、集積回路記憶装置等である。記憶装置12は、上記記憶装置以外にも、CD(Compact Disc)、DVD(Digital Versatile Disc)、フラッシュメモリ等の可搬型記録媒体や、半導体メモリ素子等との間で種々の情報を読み書きする駆動装置であってもよい。また、記憶装置12は、ネットワークを介して接続された他のコンピュータ内にあってもよい。
【0012】
入力機器13は、操作者からの各種の入力操作を受け付け、受け付けた入力操作を電気信号に変換して処理回路11に出力する。具体的には、入力機器13は、マウス、キーボード、トラックボール、スイッチ、ボタン、ジョイスティック、タッチパッド及びタッチパネルディスプレイ等の入力機器に接続されている。入力機器13は、当該入力機器への入力操作に応じた電気信号を処理回路11へ出力する。入力機器13として、音声入力装置が使用されてもよい。また、入力機器13は、ネットワーク等を介して接続された他のコンピュータに設けられた入力機器でもよい。
【0013】
通信機器14は、他のコンピュータとの間で種々の情報を送受信するためのインタフェースである。通信機器14による情報通信は、DICOM(Digital Imaging and Communications in Medicine)等の医療情報通信に適当な規格に従い行われる。
【0014】
表示機器15は、処理回路11の表示制御機能115により種々の情報を表示する。表示機器15としては、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)、CRT(Cathode Ray Tube)ディスプレイ、有機ELディスプレイ(OELD:Organic Electro Luminescence Display)、プラズマディスプレイ又は他の任意のディスプレイが適宜使用可能である。また、表示機器15としてプロジェクタが使用されてもよい。
【0015】
処理回路11は、サンプル取得機能111の実現により、複数の訓練サンプルを取得する。複数の訓練サンプル各々は、被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む。複数の訓練サンプル間において被検体は同一人物でもよいし異なる人物でもよい。「被検体」は必ずしも実在する人物である必要はなく、統計的に標準的な健常人や特定疾患罹患者、特定年齢人、特定性別人、特定人種等の統計演算により得られる架空人物でもよい。
【0016】
本実施形態に係る「特徴量」は、被検体の状態を表す数値や文章、記号等である。特徴量は、機械学習における入力データとして使用される情報である。1個の訓練サンプルに含まれる特徴量の種類の個数は、典型的には複数個である。ここで、特徴量の種類を特徴量種別と呼ぶ。詳細には、特徴量は、複数の特徴量種別にそれぞれ対応する複数の数値(要素)等の組合せを有するベクトル又は行列である。なお、本実施形態に係る特徴量の要素は1個でもよい。
【0017】
本実施形態に係る「イベント」は、当該被検体に対して医療従事者等が施す医療行為や当該被検体が自ら実施する行動を意味する。種々のイベントの種類を「イベント種別」と称する。本実施形態に係る「種別ラベル」は、当該訓練サンプルに関する被検体に対して実施されたイベントの種別を表す数値や文字、記号等であり、機械学習における正解データとして使用される情報を意味する。「効果ラベル」は、当該訓練サンプルに関する被検体に対して実施されたイベントの治療効果を表す数値や文字、記号等であり、機械学習における正解データとして使用される情報を意味する。治療効果を表す数値や文字、記号等を治療効果値と呼ぶ。治療効果値の種別は1種類でもよいし複数種類でもよい。治療効果値の種別を「治療効果種別」と呼ぶ。治療効果種別としては、1年生存率や6ヶ月生存率、主要心血管イベント(MACE:major adverse cardiac events)、心機能分類(NYHA:New York Heart Association classification)等の臨床的アウトカムの他、自覚症状や治療満足度等の患者報告アウトカム、医療費、医療リソース、在院日数等の経済的アウトカムでもよい。
【0018】
処理回路11は、知識ベース取得機能112により、サンプル取得機能111により取得される複数の訓練サンプルから独立した知識ベースを取得する。本実施形態に係る「知識ベース」は、既存の医療知識を体系的に集約したデータベースを意味する。知識ベースは、推奨イベントの種別、当該推奨イベントの推奨度及び当該推奨イベントが適用される人物の状態を表す特徴量を含んでいる。「独立した」とは、知識ベースが訓練サンプルに基づいて生成されていなこと又は訓練サンプルが知識ベースに基づいて生成されていないことを意味する。推奨イベントは、知識ベースにおいて推奨されるイベントを意味する。
【0019】
処理回路11は、付与機能113により、知識ベース取得機能112により取得された知識ベースに基づいて、サンプル取得機能111により取得された複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する。本実施形態に係る「知識ラベル」は、推奨イベントの種別及び当該推奨イベントの推奨度を有する。以下、推奨イベントの種別を「推奨種別」と呼ぶ。知識ラベルは、機械学習における正解データとして使用される。
【0020】
処理回路11は、学習機能114により、少なくとも知識ラベルが付与された少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論する因果推論モデルを訓練する。「知識ラベルが付与された少なくとも一部の訓練サンプル」は、特徴量、種別ラベル、効果ラベル及び知識ラベルを含む。なお、処理回路11は、「知識ラベルが付与された少なくとも一部の訓練サンプル」の他に、知識ラベルが付与されていない訓練サンプルに基づいて因果推論モデルを訓練してもよい。「知識ラベルが付与されていない訓練サンプル」は、特徴量、種別ラベル及び効果ラベルを含む。
【0021】
処理回路11は、表示制御機能115により、種々の情報を表示機器15に表示する。一例として、処理回路11は、因果推論モデルの訓練結果や訓練サンプル、知識ベース、知識ラベル等を表示する。
【0022】
以下、本実施形態に係る医用情報処理装置1の動作例について説明する。
【0023】
図2は、医用情報処理プログラムに従い処理回路11により行われる医用情報処理の処理手順を示す図である。図2に示す医用情報処理は、因果推論モデル23の学習処理を想定する。図3は、図2に示す学習処理を模式的に示す図である。
【0024】
図2に示すように、まず、処理回路11は、サンプル取得機能111により、複数の訓練サンプルを取得する(ステップSA1)。複数の訓練サンプルは、正解ラベルと特徴量とを有する。正解ラベルは、種別ラベルと治療効果値とを有する。複数の訓練サンプルの集合は訓練データセットと呼ばれる。処理回路11は、医療施設等に設置されたコンピュータから、通信機器14を介して訓練サンプルを取得する。別途、学習結果の検証のために使用するサンプルである検証サンプルが取得されてもよい。
【0025】
ステップSA1が行われると処理回路11は、知識ベース取得機能112により、知識ベース22を取得する(ステップSA2)。ステップSA2において処理回路11は、具体的には、診療ガイドライン21から知識ベース22を構築する。診療ガイドライン21は、対象疾患について典型的な特徴量に推奨(Recommendations)を示した既存の医療知識の文章データである。推奨は、患者の典型的な特徴量に当該患者に適又は不適な医療行為(推奨イベント)を提示する文章項目である。推奨には当該推奨イベントの推奨度が関連付けられている。処理回路11は、診療ガイドライン21に自然言語処理や統計的因果探索等を施して推奨イベントと特徴量との間の因果関係を評価し、因果関係を充足する推奨イベント及び特徴量、更に当該推奨イベントに対応する推奨度を対応付ける。これにより知識ベース22が構築される。なお、知識ベース22の構築は、他のアルゴリズムや人手により行われてもよい。また、予め知識ベース22が構築されている場合、処理回路11は、当該知識ベース22を取り込めばよい。
【0026】
ステップSA2が行われると処理回路11は、付与機能113により、訓練サンプルに知識ラベルを付与する(ステップSA3)。ステップSA3において処理回路11は、訓練サンプルに含まれる特徴量を知識ベース22に適用して当該特徴量に対応する推奨イベントと推奨度とを特定し、特定された推奨イベントと推奨度とを知識ラベルとして当該訓練サンプルに付与する。
【0027】
ここで、知識ベース22の取得(ステップSA2)と知識ラベルの付与(ステップSA3)とを具体例を示しながら説明する。下記実施例に係る診療ガイドライン21は、弁膜症を対象疾患とする弁膜症治療ガイドラインであるとする。
【0028】
図4は、知識ベース22の取得例を模式的に示す図である。図4に示すように、弁膜症治療ガイドラインは、推奨(Recommendations)項目とクラス(Class)項目とを有する。推奨項目は、推奨するイベントの種別(推奨種別)と当該推奨種別に適又は不適な特徴量との関係性を自然文で表現している。クラス項目は、推奨種別の推奨度を表している。
【0029】
一例として、図4の上段左図の一番目の事例では、推奨項目として、「兆候ありの患者(Symptomatic patients)であり、重症(severe)であり、大動脈弁狭窄に高い圧較差(high-gradient)(平均圧較差≧40mmHg又はピーク速度≧4.0m/s)が認められる場合、侵襲的処置(Intervention)の必要が示される」が記録されている。この場合、推奨イベントが「侵襲的処置」であり、侵襲的処置に適した特徴量が「兆候ありの患者(Symptomatic patients)であり、大動脈弁狭窄に高い圧較差(high-gradient)(平均圧較差≧40mmHg又はピーク速度≧4.0m/s)」である。当該事例の推奨項目には、クラス項目として推奨度「I」が関連付けられている。
【0030】
図4の上段右図に示すように、弁膜症治療ガイドラインでは、推奨度の定義がなされている。クラス「I」の定義は「推奨(Is recommended)又は必要的(Is indicated)」である。また、クラス「IIa」の定義は「考慮されるべき(Should be considered)」である。クラス「IIb」の定義は「考慮されてもよい(May be recommended considered)」である。クラス「III」の定義は「非推奨(Is not recommended)」である。
【0031】
処理回路11は、図4の中段に示すように、各事例の推奨項目及びクラス項目に自然言語処理や統計的因果探索等を施して当該事例の特徴量と推奨イベントとの因果関係を論理式で表現する。一例として、事例♯1では、IF{(Symptom=Symptomatic) AND (AS Severity = Severe) AND (Pressure Gradient=High-gradient)} THEN {TAVI OR SAVR} (Class I)のように論理式で表現される。すなわち、事例♯1は、『特徴量種別「兆候(Symptom)」の値が「兆候あり(Symptomatic)」であり、且つ特徴量種別「大動脈弁狭窄症重症度(AS Severity)」の値が「重症(Severe)」、且つ特徴量種別「圧較差(Pressure Gradient)」の値が「高い(High-gradient)」である場合、推奨種別は侵襲的処理である「TAVI」又は「SAVR」である。』という意味の論理式に変換される。なお、「TAVI」は経カテーテル大動脈弁留置術(Transcatheter aortic valve implantation)の略語であり、「SAVR」は外科的人工弁置換術(Surgical aortic valve replacement)の略語である。弁膜症治療ガイドラインに関する論理式は、知識ベース22の一例である。
【0032】
処理回路11は、図4の下段に示すように、特徴量と推奨イベントとの因果関係を表す論理式をデータベース(以下、ガイドラインデータベース)に変換する。ガイドラインデータベースは、特徴量項目と知識ラベル項目とを有する。特徴量項目は、兆候(Symptom)」や「大動脈弁狭窄症重症度(AS Severity)」、「圧較差(Pressure Gradient)」、「運動試験(Exercise test)」、「共存症(Comorbidities)」等を有する。知識ラベル項目は、知識ラベルである「推奨種別」や「推奨度」を有する。処理回路11は、論理式に含まれる各特徴量項目及び知識ラベル項目の値をガイドラインデータベースに割り当てることりにより、論理式をデータベース化する。弁膜症治療ガイドラインに関するガイドラインデータベースは、知識ベース22の一例である。以上により、弁膜症治療ガイドラインに関する知識ベース22が構築される。
【0033】
知識ベース22が構築されると処理回路11は、訓練データセットのうちの一部の訓練サンプルに知識ラベルを付与する。具体的には、処理回路11は、訓練データセットに含まれる各訓練サンプルの特徴量(ここで、サンプル特徴量)と知識ベース22に含まれる各事例の特徴量(ここで、知識特徴量)とを比較し、各事例の知識特徴量に当て嵌まるサンプル特徴量を有する訓練サンプルを特定する。そして処理回路11は、特定された訓練サンプルに、当該事例の知識ラベルを付け加える。知識ベース22に含まれる全ての事例の知識特徴量に当て嵌まらないサンプル特徴量を有する訓練サンプルには知識ラベルは付与されない。すなわち、訓練データセットに含まれる一部の訓練サンプルにのみ知識ラベルが付与されることとなる。これにより知識ラベルの付与処理が終了する。
【0034】
図5は、知識ラベルの付与処理後の訓練データセットの具体例を示す図である。図5に示すように、本具体例に係る訓練データセットには#1~672までの672個の訓練サンプルが含まれている。訓練データセットは、特徴量x1,x2,・・・,x25、種別ラベルt、治療効果値y(0),y(1)、知識ラベル(推奨種別kl、推奨度kc)の項目を含む。種別ラベルtには、当該訓練サンプルの患者に対して施されたイベント(医療行為)の種別が種別0であることを示す「0」又は種別1であることを示す「1」が割り当てられている。種別0が施された場合、治療効果値y(0)に当該種別0の治療効果値が割り当てられ、種別1が施された場合、治療効果値y(1)に当該種別1の治療効果値が割り当てられている。各患者に対して種別0の医療行為及び種別1の医療行為の何れか一方が施されるので、治療効果値y(0)及び治療効果値y(1)の何れか一方のみが値を有することとなる。各訓練サンプルのうち特徴量x1,x2,・・・,x25の数値が、知識ベース22の事例の特徴量の数値に合致している場合、当該事例の知識ラベルである推奨種別kl及び推奨度kcの数値が割り当てられている。
【0035】
一例として、訓練サンプル#1については、推奨種別kl「0」及び推奨度kc「I」が割り当てられている。訓練サンプル#1の種別ラベルtは「0」であり、推奨種別kl「0」と一致している。訓練サンプル#2については、推奨種別kl及び推奨度kcが割り当てられていない。訓練サンプル#4については、推奨種別kl「0」及び推奨度kc「II」が割り当てられているが、訓練サンプル#4の種別ラベルtは「0」であり、推奨種別kl「1」と一致していない。
【0036】
なお、図5の訓練データセットは一例にすぎず、訓練サンプルの個数や特徴量xの要素数(特徴量種別数)、種別ラベルtの取り得る値の個数、治療効果値yの個数(治療効果種別数)は任意に変更可能である。また、特徴量xや治療効果値yは数値に限定されず、文字や記号等でもよい。
【0037】
ステップSA3が行われると処理回路11は、学習機能114により、因果推論モデル23を訓練する(ステップSA4)。因果推論モデル23は、簡潔には、特徴量xを入力して治療効果値の推定値(推定効果値)yを出力する機械学習モデルである。この場合、因果推論モデル23は、簡易的にy=f(x)のように数式で表現され得る。処理回路11は、学習機能114により、因果推論モデル23を、知識ラベルの推定と推定効果値の推定とのマルチタスク学習により訓練する。
【0038】
しかしながら、因果推論モデル23は、推定効果値yの他に推定種別tを出力してもよい。推定種別tは、特徴量xを有する患者に対して実施されたイベントの種別ラベルの推定値を意味する。以下の実施例において因果推論モデル23は、特徴量xを入力して推定種別tと推定効果値yとを出力する機械学習モデルであるとする。この因果推論モデル23は、y=f(x)及びt=g(x)の2個の数式で表現され得る。因果推論モデル23の訓練過程では、損失関数L(y,t,k)により評価される損失を小さくするように因果推論モデル23の訓練パラメータが最適化される。訓練パラメータは、重みパラメータやバイアス等のパラメータに相当する。
【0039】
図6は、因果推論モデル23に対する学習処理の全体を模式的に示す図である。図6に示すように、推定種別tを出力する第1系列と推定効果値y(0),y(1)を出力する第2系列とを有する。
【0040】
第1系列に関し、因果推論モデル23は、潜在変数変換層231及び種別分類層232を有する。潜在変数変換層231は、特徴量x1~x25を入力して潜在変数htを出力するネットワーク層である。潜在変数htは、特徴量x1~x25の次元よりも低い次元を有するベクトルである。当該ネットワーク層は、畳み込み層、全結合層、プーリング層及び/又はその他の中間層を1層以上有している。種別分類層232は、潜在変数htを入力して推定種別tを出力するネットワーク層である。推定種別tは、予め定められた複数の分類クラスにそれぞれ対応する複数の分類確率の組合せを有するベクトルである。分類クラスは、機械学習におけるクラス分類におけるクラスを意味する。推定種別に関する分類クラスは、イベント種別における各種別に対応する。予め定められたイベント種別の分類確率が推定種別tとして計算されることとなる。イベント種別としては、「TAVI」や「SAVR」等に設定される。当該ネットワーク層は、畳み込み層、全結合層、プーリング層及び/又はその他の中間層を1層以上有している。
【0041】
第2系列に関し、因果推論モデル23は、潜在変数変換層233、分配層234、効果値計算層235,236及び推奨確率変換層237を有している。潜在変数変換層233は、特徴量x1~x25を入力して潜在変数hyを出力するネットワーク層である。潜在変数hyは、特徴量x1~x25の次元よりも低い次元を有するベクトルである。当該ネットワーク層は、畳み込み層、全結合層、プーリング層及び/又はその他の中間層を1層以上有している。
【0042】
分配層234は、潜在変数hyを、後続する効果値計算層235と効果値計算層236とに分配する。効果値計算層235は、潜在変数hyを入力して種別0の治療効果の推定値(推定効果値)y(0)を出力するネットワーク層である。効果値計算層236は、潜在変数hyを入力して種別1の治療効果の推定値(推定効果値)y(1)を出力するネットワーク層である。
【0043】
学習過程において分配層234は、潜在変数hyを効果値計算層235と効果値計算層236との双方に分配する。
【0044】
推奨確率変換層237は、推定効果値y(0)と推定効果値y(1)とを入力して推定推奨確率kを出力するネットワーク層である。推定推奨確率kは、予め定められた複数の分類クラスにそれぞれ対応する複数の推奨確率の推定値のベクトルである。推定推奨確率に関する分類クラスは、イベント種別に対応する。推奨確率変換層237は、全結合層と当該全結合層に後続する活性化層を有している。活性化層は、任意の活性化関数に応じた演算を行うネットワーク層である。推定効果値y(0)と推定効果値y(1)との2クラスの出力を行う場合、推奨確率変換層237は、下記(1)式に示すように、a(y(0)-y(1))+b)にシグモイド関数sigmoidを適用することにより推定推奨確率kを出力する。
【0045】
【数1】
【0046】
なお、マルチクラスの出力を行う場合、推奨確率変換層237は、一例として、下記(2)式に示すように、推定効果値行列yと重み行列Wとの積とバイアスbとの和にソフトマックス関数Softmaxを適用することにより推定推奨確率kを出力する。
【0047】
【数2】
【0048】
処理回路11は、知識ラベルk´が付与された訓練サンプルと知識ラベルk´が付与されていない訓練サンプルとに基づいて因果推論モデル23を訓練する。具体的には、処理回路11は、推定種別t、種別ラベルt´、潜在変数ht、潜在変数hy、推定効果値y(0)、推定効果値y(1)、効果ラベルy´、推定推奨確率k及び知識ラベルk´に基づいて損失関数Ltotalを計算する。損失関数Ltotalは、下記(3)式の通り、第1の損失関数L、第2の損失関数L、第3の損失関数L及び第4の損失関数Lorthの和により表される。処理回路11は、損失関数Ltotalにより評価される損失を最小化するように因果推論モデル23の訓練パラメータを訓練する。訓練パラメータは、具体的には、上記の潜在変数変換層231、種別分類層232、潜在変数変換層233、効果値計算層235、効果値計算層236及び推奨確率変換層237に含まれる重みパラメータやバイアス等のパラメータを意味する。
【0049】
【数3】
【0050】
第1の損失関数Lは、イベント種別毎の推定効果値y(0),y(1)と効果ラベルy´との回帰誤差を表す。第2の損失関数Lは、イベント種別毎の推定推奨確率kと知識ラベルk´との交差エントロピー誤差を表す。第3の損失関数Lは、推定種別tと種別ラベルt´との分類誤差を表す。第4の損失関数Lorthは、推定種別tに対応する潜在変数htと推定効果値y(0),y(1)に対応する潜在変数hyとの非直交性にペナルティを与える。
【0051】
図7は、第1の損失関数L及び第2の損失関数Lの詳細を模式的に示す図である。図7の上段に示すように、損失関数Ltotalは、第1の損失関数L及び第2の損失関数Lに着目すれば、下記(4)式のように表現することが可能である。損失関数Lothersは、(3)式の第3の損失関数Lと第4の損失関数Lorthとの和である。
【0052】
【数4】
【0053】
図7の中段に示すように、第1の損失関数Lは下記(5)式で表され、第2の損失関数Lは下記(6)式で表される。αは、訓練サンプルiの重みである。第1の損失関数Lは、訓練サンプルiの推定効果値yと効果ラベルy´との差分の2乗(y-y´と、重み(1-α)との積の、訓練サンプルiの個数Nでの加算平均により規定される。第2の損失関数Lは、訓練サンプルiの推奨確率の正解値(以下、正解推奨確率)k´(z)と推定推奨確率k(z)の自然対数logk(z)との積のイベント種別zでの総和と、重みαとの積の、訓練サンプルiの個数Nでの加算平均により規定される。
【0054】
【数5】
【0055】
重みαは、各訓練サンプルiに付与された知識ラベルのうちの推奨度kcに応じた値を有する。処理回路11は、学習処理において、推奨度kcに応じて、訓練サンプルi毎の第1の損失関数Lに対する重み(1-α)及び第2の損失関数Lに対する重みαを変更する。一例として、強い推奨を意味する推奨度「I」に対応する重みαは値「2/3」を有し、弱い推奨意味する推奨度「IIa」に対応する重みαは値「1/3」を有し、強い非推奨意味する推奨度「III」に対応する重みαは値「2/3」を有し、推奨なしを意味する推奨度「-」に対応する重みαは値「0」を有する。
【0056】
(6)式に関し、イベント種別zの正解推奨確率k´(z)は、訓練サンプルiに付与された知識ラベルのうちの推奨種別klと推奨度kcとの組合せに基づいて決定される。正解推奨確率k´(z)は、予め定められた複数のイベント種別z各々の推奨確率の組み合わせを有するベクトルで表現される。当該イベント種別zは、「TAVI」や「SAVR」、「Med」等に設定される。なお「Med」は、非侵襲的処置である薬剤治療を意味する。当該訓練サンプルiに対する推奨種別zが1個である場合、当該推奨種別zの推奨確率が「1」に設定され、他の推奨種別zの推奨確率が「0」に設定されればよい。
【0057】
イベント種別zの正解推奨確率k´(z)は、推定推奨確率を用いて決定されてもよい。具体的には、図7に示すように、1個の訓練サンプルiに対して複数個の推奨種別が選択的に推奨されている場合、当該推奨種別の正解推奨確率k´として、推定推奨確率kに基づく疑似ラベルが設定されるとよい。例えば、訓練サンプルiの推定推奨確率k(z)が下記(7)式で表される場合を考える。当該推定推奨確率に対して、知識ラベルの推奨種別「TAVI」又は「SAVR」且つ推奨度「I」の場合の正解推奨確率k´(z)は下記(8)式、知識ラベルの推奨種別「SAVR」且つ推奨度「IIa」の正解推奨確率k´(z)は下記(9)式、知識ラベルの推奨種別「TAVI」又は「SAVR」且つ推奨度「III」の正解推奨確率k´(z)は下記(10)式、知識ラベルの推奨種別「Unknown」且つ推奨度「-」の正解推奨確率k´(z)は下記(11)式で与えられる。
【0058】
【数6】
【0059】
(8)式について、種別「Med」は推奨されていないので正解推奨確率k´(Med)は「0」である。k´(TAVI)とk´(SAVR)とには、それぞれ(7)式に示すk(TAVI)に応じた値「3/7」とk(SAVR)に応じた「4/7」とが割り当てられる。各k´(z)には推奨度「I」に応じた重みα=「2/3」が乗じられる。(9)式について、1個の種別「SAVR」しか推奨されていないので、k´(SAVR)には、「1」が割り当てられ、k´(TAVI)及びk´(Med)には、「0」が割り当てられる。各k´(z)には推奨度「IIa」に応じた重みα=「1/3」が乗じられる。(10)式について、2個の種別「TAVI」及び「SAVR」が非推奨されているので、k´(TAVI)及びk´(SAVR)には「0」が割り当てられ、k´(Med)には「1」が割り当てられる。各k´(z)には推奨度「III」に応じた重みα=「2/3」が乗じられる。(11)式について、何れの種別についても推奨及び非推奨されていないので、k´(TAVI)、k´(SAVR)及びk´(Med)には均等に「1/3」が割り当てられる。各k´(z)には推奨度「-」に応じた重みα=「0」が乗じられる。
【0060】
処理回路11は、上記の通り定義される損失関数Ltotalにより評価される損失を最小化するように因果推論モデル23を訓練する。具体的には、処理回路11は、損失関数Ltotalの値である損失を算出し、算出された損失が小さくなるように、採用する最適化法に応じた更新幅で因果推論モデル23の各訓練パラメータを更新する。最適化法は、確率的勾配降下法やADAM、その他の任意の方法が採用されればよい。処理回路11は、更新終了条件が充足されるまで損失関数Ltotalの計算と訓練パラメータの更新とを繰り返す。更新終了条件は、一例として、更新回数が所定回数に到達したこと、因果推論モデル23の精度が所定値に到達したこと、損失が閾値未満に到達したこと等に設定されればよい。
【0061】
更新終了条件が充足された場合、充足時点の訓練パラメータが設定された因果推論モデル23を学習済みの因果推論モデル23として出力する。学習済みの因果推論モデル23の記憶装置12に記憶されてもよいし、他のコンピュータに転送されてもよい。
【0062】
以上により因果推論モデル23の学習処理が終了する。
【0063】
なお、上記の学習処理は一例であり、本実施形態はこれに限定されない。
【0064】
一例として、訓練サンプルの取得(ステップSA1)と知識ベースの取得(ステップSA2)との順番は逆又は同時でもよい。
【0065】
上記実施例では、因果推論モデルは、推定効果値と推定種別との双方を出力するものとした。しかしながら、因果推論モデルは、推定効果値を出力できればよく、推定種別を出力しなくてもよい。この場合、処理回路11は、第1の損失関数L及び第2の損失関数Lの和である損失関数Ltotalにより規定される損失を小さくするように因果推論モデルを訓練すればよい。因果推論モデルは、図6の潜在変数変換層231及び種別分類層232を有しない。訓練サンプルは、特徴量、効果ラベル及び知識ラベルを有すればよく、種別ラベルを有さなくてよい。
【0066】
上記の説明によれば、本実施形態に係る医用情報処理装置1は、処理回路11を有します。処理回路11は、サンプル取得機能111により、複数の訓練サンプルを取得します。複数の訓練サンプル各々は、被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む。処理回路11は、知識ベース取得機能112により、複数の訓練サンプルから独立した知識ベースを取得する。処理回路11は、付与機能113により、知識ベースに基づいて、複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する。処理回路11は、学習機能114により、少なくとも知識ラベルが付与された少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論する因果推論モデルを訓練する。ここで、知識ラベルが付与された少なくとも一部の訓練サンプルは、特徴量、種別ラベル、効果ラベル及び知識ラベルを含む。
【0067】
上記の構成によれば、訓練サンプルのみならず知識ベースをも加味してイベントの種別毎の効果を推論する因果推論モデルを生成することが可能になるので、訓練サンプルのみで訓練する場合に比して、訓練サンプルが少量であっても因果推論モデルの精度を向上させることが可能になる。
【0068】
(応用例1)
図8は、応用例1に係る医用情報処理装置1の構成例を示す図である。図8に示すように、応用例1に係る処理回路11は、サンプル取得機能111、知識ベース取得機能112、付与機能113、学習機能114及び表示制御機能115の他、統合機能116を実現する。処理回路11は、統合機能116により、種別ラベルと知識ラベルとの統合ラベルを生成する。学習機能114により、処理回路11は、特徴量及び統合ラベルを含む統合サンプルに基づいてモデルを訓練する。
【0069】
図9は、応用例1に係る学習処理を模式的に示す図である。図9に示すように、応用例1において処理回路11は、正解ラベルと知識ラベルとを統合して統合ラベルを生成し、統合ラベルを利用した教師有り学習により因果推論モデル23を訓練する。この際、処理回路11は、応用例1に係る損失関数により規定される損失が小さくなるように因果推論モデル23の訓練パラメータを訓練する。応用例1に係る第5の損失関数は、治療効果値と統合ラベルとを変数に有する関数であり、簡単にはL(y,c)のように数式で表現される。第5の損失関数は、上記第1の損失関数と第2の損失関数とを統合した損失関数に相当する。
【0070】
より詳細には、訓練サンプルiの治療効果値yと統合ラベルc´とに基づく、第5の損失関数L(y,c´)は、下記(12)式により表現される。
【0071】
【数7】
【0072】
一例として、正解ラベルt´が下記(13)式、知識ラベルk´のうちの推奨種別と推奨度との組合せが下記(14)式であり、知識ラベルの重みλ=0.5且つ推奨度重みα=1の場合、統合ラベルc´のうちの推奨種別と推奨度との組合せは下記(15)式で表現される。
【0073】
【数8】
【0074】
上記の通り、応用例1によれば、統合ラベルに基づき損失関数を計算することが可能になる。なお、推奨が複数ある場合、上記実施形態と同様、疑似ラベルやunknownラベルが追加されてもよい。
【0075】
(応用例2)
上記実施形態では訓練サンプルに種別ラベルが存在するものとした。この事は、訓練サンプルが実在するサンプルであることを意味する。因果推論モデルの推論精度を向上するためには、実在する訓練サンプルのみでなく、実在しないサンプル、すなわち、種別ラベルの存在しないサンプルを利用する必要がある。応用例2に係る処理回路は、種別ラベルが存在しないサンプル(以下、人工サンプル)を生成し、人工サンプルが知識ベースに従うように因果推論モデルを訓練する。
【0076】
図10は、応用例2に係る医用情報処理装置1の構成例を示す図である。図10に示すように、応用例2に係る処理回路11は、サンプル取得機能111、知識ベース取得機能112、付与機能113、学習機能114及び表示制御機能115の他、生成機能117を実現する。処理回路11は、生成機能117により、種別ラベルを有さない人工サンプルを生成する。処理回路11は、付与機能113により、人工サンプルに知識ラベルを付与する。そして処理回路11は、学習機能114により、知識ラベルが付与された訓練サンプル及び人工サンプルに基づいて因果推論モデルを訓練する。
【0077】
図11は、人工サンプルの生成処理を模式的に示す図である。図11に示すように、訓練データセットには複数の訓練サンプルが存在している。図11では、種別ラベル「SAVR」の訓練サンプルを黒丸で図示し、種別ラベル「TAVI」の訓練サンプルを×印付きの丸で図示している。種別ラベル無し、すなわち、種別ラベル「Unknown」の人工サンプルを白丸で図示している。なお、種別ラベル「Med」の訓練サンプルは、簡単のため図示していない。初期的には人工サンプルは存在していない。生成された人工サンプルに対しては、種別ラベル「Unknown」が付与され、上記実施形態と同様の方法により知識ラベルが付与される。図11の例では、#5の人工サンプルには、推奨種別「SAVR」、推奨度「IIa」の知識ラベルが付与される。
【0078】
人工サンプルは、例えば、下記方法により生成される。一例として、処理回路11は、訓練サンプルが生成された施設とは異なる他施設により生成されたサンプルを人工サンプルとして取得する。そして処理回路11は、当該人工サンプルと前記複数の訓練サンプルとの間のデータ空間内での距離に基づいて当該人工サンプルの採否を決定する。
【0079】
図12は、人工サンプルの採否の決定処理を模式的に示す図である。図12に示すように、訓練データセットのデータ空間D1には、図11と同様、種別ラベル「SAVR」の訓練サンプルと種別ラベル「TAVI」の訓練サンプルとが存在している。このデータ空間D1おいて、人工サンプルD11と人工サンプルD12とが生成されたものとする。処理回路11は、人工サンプルD11,D12を中心として所定の第1の半径を有する第1の判定空間D13,D14を設定する。処理回路11は、第1の判定空間D13,D14に訓練サンプルが存在しない場合、人工サンプルD11,D12を採用すると判定し、存在する場合、人工サンプルD11,D12を採用しないと判定する。具体的には、人工サンプルD11については、第1の判定空間D13内に訓練サンプルが存在するので、採用しない(NG)と判定される。人工サンプルD12については、第1の判定空間D14内に訓練サンプルが存在しないので、採用する(OK)と判定される。第1の判定空間D13,D14の第1の半径は、予め任意の値に設定されればよい。
【0080】
なお、データ空間D1に存在する訓練サンプルから過度に距離が離れた人工サンプルについては採用しない方がよい。この場合、処理回路11は、第1の半径に比して長い第2の半径に基づく人工サンプルの採否の決定を加えてもよい。具体的には、処理回路11は、上記の第1の半径に基づいて採用すると判定された人工サンプルについて、当該人工サンプルを中心とし第2の半径を有する第2の判定空間を設定する。そして処理回路11は、第2の判定空間に訓練サンプルが存在しない場合、当該人工サンプルを採用すると判定し、存在する場合、当該人工サンプルを採用しないと判定する。これにより既存の訓練サンプルに対して過度に距離が離れた人工サンプルの採用を却下することが可能になる。これにより、因果推論モデルの推論精度の劣化を回避することが可能になる。
【0081】
なお、人工サンプルの生成方法は、上記のみに限定されない。一例として、処理回路11は、乱数発生器を利用して人工サンプルを疑似的に生成してもよい。具体的には、乱数発生器により、特徴量に相当する数値がランダムに発生されるとよい。他の例として、処理回路11は、機械学習を利用して疑似的に人工サンプルを生成してもよい。当該機械学習としてはVAE(variational auto-encoder)やGAN(generative adversarial network)等が適当である。発生された特徴量には種別ラベル「Unknown」が付与される。これにより人工サンプルが生成される。これらの場合においても、上記第1の半径及び/又は第2の半径に基づいて人工サンプルの採否を決定してもよい。
【0082】
(応用例3)
上記実施形態に係る医用情報処理装置は、因果推論モデルの学習処理を行うものとした。しかしながら、本実施形態はこれに限定されない。応用例3に係る医用情報処理装置は、学習済みの因果推論モデルを利用してイベントの種別毎の治療効果値を推論する。
【0083】
図13は、応用例3に係る医用情報処理装置1の構成例を示す図である。図13に示すように、応用例3に係る処理回路11は、サンプル取得機能111、知識ベース取得機能112、付与機能113、学習機能114及び表示制御機能115の他、対象患者状態取得機能118及び推論機能119を実現する。処理回路11は、対象患者状態取得機能118により、対象被検体に関する状態を表す特徴量(以下、対象特徴量)を取得する。処理回路11は、推論機能119により、対象特徴量と学習済みの因果推論モデルとに基づいて対象被検体に対するイベントのイベント種別毎の治療効果値を推論する。
【0084】
以下、応用例3に係る医用情報処理装置1による医用情報処理について説明する。応用例3に係る医用情報処理装置1による医用情報処理は推論処理を想定する。
【0085】
図14は、応用例3に係る医用情報処理装置1による推論処理の処理手順を示す図である。図14に示すように、まず、処理回路11は、対象患者の対象特徴量を取得する(ステップSB1)。対象特徴量は、他のコンピュータから取得してもよいし、記憶装置12から取得してもよい。
【0086】
ステップSB1が行われると処理回路11は、推論機能119により、学習済みの因果推論モデルを取得する(ステップSB2)。学習済みの因果推論モデルは、他のコンピュータから取得してもよいし、記憶装置12から取得してもよい。学習済みの因果推論モデルは、特徴量を入力して治療効果値と推奨種別とを出力するように訓練された機械学習モデルである。
【0087】
ステップSB2が行われると処理回路11は、推論機能119により、ステップSB1において取得した対象特徴量とステップSB2において取得した因果推論モデルとに基づいて、複数の種別クラス各々の治療効果値と複数の種別クラスのうちの推奨種別とを推論する(ステップSB3)。ステップSB3において処理回路11は、対象特徴量を因果推論モデルに適用することにより当該対象特徴量に応じた治療効果値と推奨種別とを出力する。
【0088】
ステップSB3が行われると処理回路11は、表示制御機能115により、ステップSB3において推論された治療効果値と推奨種別とを表示する(ステップSB4)。ステップSB4において処理回路11は、治療効果値と推奨種別とを提示する表示画面を表示機器15に表示する。
【0089】
図15は、治療効果値と推奨種別との表示画面I1の一例を示す図である。図15に示すように、表示画面I1には臨床特性の表示欄I11、治療効果値の表示欄I12及び知識ベースによる結果表示欄I13が含まれる。表示欄I11には、対象患者の臨床特性である特徴量が表示される。図15においては、特徴量として「LVEF」や「STS/EuroScore」、「Severe comorbidity」、「Age」、「Previous cardiac surgery」が表示されている。
【0090】
表示欄I12にはイベント種別毎の治療効果値が表示される。図15においては、治療効果種別「1年生存率」、「6ヶ月生存率」、「MACE」及び「NYHA」がタブで設けられ、各治療効果種別についてイベント種別「SAVR」、「TAVI」及び「Medications」毎に治療効果値が表示される。治療効果値は数値と棒グラフとで示されている。また、表示欄I13において選択されたイベント種別が視覚的に強調される。タブは、入力機器13を介して任意に選択可能であり、ユーザは所望のタブを選択することにより、所望の治療効果種別の治療効果値を確認することができる。図15においてはイベント種別「TAVI」にチェックマークI121が付与されている。また、イベント種別のうち最も治療効果値の良い種別には、星マークI122が付されている。
【0091】
表示欄I13には治療効果値の種別の選択欄I14と訓練サンプルの分布図I15とが表示される。選択欄I14では選択可能なイベント種別がプルダウンメニュー形式で表示され、ユーザに関心のあるイベント種別が選択される。図15においてはイベント種別「TAVI」が選択されている。分布図I15では、選択欄I14で選択されたイベント種別についての、各訓練サンプルの推奨又は非推奨の推奨確率が推奨度毎に表示される。推奨度は各訓練サンプルに知識ラベルとして付与された推奨種別(すなわち、選択欄I14で選択されたイベント種別)の推奨度を意味する。推奨又は非推奨の推奨確率は、当該推奨種別の推奨確率又は非推奨確率を意味する。訓練サンプルが丸形のマークで表示される。対象患者の訓練サンプルI16は色や大きさ等で他の訓練サンプルとは視覚的に区別して表示される。分布図I15により、他患者の訓練サンプルに対する対象患者の訓練サンプルI16の位置関係を明瞭に把握することが可能である。
【0092】
ユーザは、入力機器13等を介して任意の訓練サンプルを分布図I15において選択可能である。訓練サンプルが選択された場合、当該訓練サンプルについての表示内容に、表示欄I11及びI12が更新される。
【0093】
以上により、応用例3に係る推論処理が終了する。
【0094】
上記の推論処理は一例であり、本実施形態はこれに限定されない。例えば、上記実施例では、治療効果値と推奨種別とを出力する因果推論モデルを使用するとした。しかしながら、本実施形態はこれに限定されない。例えば、治療効果値を出力する因果推論モデルが使用されてもよい。この変形例について簡単に説明する。
【0095】
対象患者状態取得機能118により、処理回路11は、対象患者の特徴量を取得する。次に処理回路11は、推論機能119により、特徴量を因果推論モデルに適用して複数の治療効果種別にそれぞれ対応する複数の治療効果値を推論する。次に処理回路11は、複数の治療効果種別にそれぞれ対応する複数の治療効果値に基づいて推奨種別を特定する。これにより因果推論モデルの後段で推奨種別を推論することが可能になる。
【0096】
上記実施例において対象特徴量には知識ラベルが付与されないとしたが、本実施形態はこれに限定されない。処理回路11は、付与機能113により、対象特徴量に合致する知識ラベルを対象特徴量に付与してもよい。付与処理は上記実施形態と同様の方法により行われればよい。対象特徴量に知識ラベルを付与することにより、推論結果の解釈性能の向上が期待される。例えば、処理回路11は、推論結果である推奨種別や治療効果値と共に知識ラベルを表示機器15に表示することが可能である。これによりユーザは、推論結果と知識ラベルとを比較して推論結果あるいは知識ラベルを解釈することが可能となる。
【0097】
上記実施例において医用情報処理装置1は、因果推論モデル23の学習処理と推論処理との双方を実施可能なように、処理回路11は、サンプル取得機能111、知識ベース取得機能112、付与機能113、学習機能114、表示制御機能115、対象患者状態取得機能118及び推論機能119を有するとした。しかしながら、推論処理を行う場合、処理回路11は、対象患者状態取得機能118及び推論機能119を有すればよく、学習処理を実施するためのサンプル取得機能111、知識ベース取得機能112、付与機能113及び学習機能114を有する必要はない。
【0098】
(応用例4)
上記実施形態において知識ラベルの推奨種別が「分からない」を意味する「Unknown」の場合、重みαには「0」が設定されるものとした。しかしながら、本実施形態はこれに限定されない。知識ラベルの推奨種別が「Unknown」の場合、重みαには、「1/3」等の「0」を上回る数値が設定されてもよい。この際、知識ラベルの推奨種別及び推定推奨確率に関する分類クラスに未知ラベルである「Unknown」が設けられるとよい。このようにして学習処理を行うことにより、因果推論モデルは、「Unknown」の推定結果を出力することも可能になる。
【0099】
上記で説明した種々の実施例は任意に適宜組み合わせが可能である。一例として、学習処理に使用された訓練サンプルの推定効果値及び/又は推定種別を、図15に示す表示画面で表示してもよい。
【0100】
以上説明した少なくとも1つの実施形態によれば、少量のサンプルからでも精度良く治療効果を推定することができる。
【0101】
上記説明において用いた「プロセッサ」という文言は、例えば、CPU、GPU、或いは、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、及びフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等の回路を意味する。プロセッサは記憶回路に保存されたプログラムを読み出し実行することで機能を実現する。なお、記憶回路にプログラムを保存する代わりに、プロセッサの回路内にプログラムを直接組み込むよう構成しても構わない。この場合、プロセッサは回路内に組み込まれたプログラムを読み出し実行することで機能を実現する。一方、プロセッサが例えばASICである場合、プログラムが記憶回路に保存される代わりに、当該機能がプロセッサの回路内に論理回路として直接組み込まれる。なお、本実施形態の各プロセッサは、プロセッサごとに単一の回路として構成される場合に限らず、複数の独立した回路を組み合わせて1つのプロセッサとして構成し、その機能を実現するようにしてもよい。さらに、図1図8図10及び図13における複数の構成要素を1つのプロセッサへ統合してその機能を実現するようにしてもよい。
【0102】
いくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更、実施形態同士の組み合わせを行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0103】
1 医用情報処理装置
11 処理回路
12 記憶装置
13 入力機器
14 通信機器
15 表示機器
111 サンプル取得機能
112 知識ベース取得機能
113 付与機能
114 学習機能
115 表示制御機能
116 統合機能
117 生成機能
118 対象患者状態取得機能
119 推論機能
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15