特開2024-74287 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝メディカルシステムズ株式会社の特許一覧

特開2024-74287医用情報処理装置、方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024074287

(43)【公開日】2024-05-30

(54)【発明の名称】医用情報処理装置、方法及びプログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20240523BHJP

G16H 50/50 20180101ALI20240523BHJP

【ＦＩ】

G06N20/00 130

G16H50/50

【審査請求】未請求

【請求項の数】18

【出願形態】ＯＬ

(21)【出願番号】P 2023196117

(22)【出願日】2023-11-17

(31)【優先権主張番号】P 2022185156

(32)【優先日】2022-11-18

(33)【優先権主張国・地域又は機関】JP

(71)【出願人】

【識別番号】594164542

【氏名又は名称】キヤノンメディカルシステムズ株式会社

(74)【代理人】

【識別番号】110003708

【氏名又は名称】弁理士法人鈴榮特許綜合事務所

(72)【発明者】

【氏名】狩野佑介

【テーマコード（参考）】

5L099

【Ｆターム（参考）】

5L099AA04

(57)【要約】

【課題】少量のサンプルからでも精度良く治療効果を推定すること。
【解決手段】実施形態に係る医用情報処理装置は、第１取得部、第２取得部、付与部及び学習部を有する。第１取得部は、複数の訓練サンプルを取得する。複数の訓練サンプル各々は被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む。第２取得部は、複数の訓練サンプルから独立した知識ベースを取得する。付与部は、知識ベースに基づいて、複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する。学習部は、少なくとも知識ラベルが付与された少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論するモデルを訓練する。知識ラベルが付与された少なくとも一部の訓練サンプルは、特徴量、種別ラベル、効果ラベル及び知識ラベルを含む。
【選択図】図１

【特許請求の範囲】

【請求項1】

複数の訓練サンプルを取得する部であって、前記複数の訓練サンプル各々は被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む、第１取得部と、
前記複数の訓練サンプルから独立した知識ベースを取得する第２取得部と、
前記知識ベースに基づいて、前記複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する付与部と、
少なくとも前記知識ラベルが付与された前記少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論するモデルを訓練する部であって、前記知識ラベルが付与された前記少なくとも一部の訓練サンプルは、前記特徴量、前記種別ラベル、前記効果ラベル及び前記知識ラベルを含む、学習部と、
を具備する医用情報処理装置。

【請求項2】

前記学習部は、前記知識ラベルの推定と前記イベントの効果値の推定とのマルチタスク学習により前記モデルを訓練する、請求項１記載の医用情報処理装置。

【請求項3】

前記知識ラベルは、イベントの推奨種別及び推奨度を有する、請求項１記載の医用情報処理装置。

【請求項4】

前記学習部は、損失関数により評価される損失を小さくするように前記モデルを訓練し、
前記損失関数は、前記イベントの種別毎の推定効果値と前記効果ラベルとの回帰誤差を表す第１の損失関数と、前記イベントの種別毎の推定推奨確率と前記知識ラベルとの交差エントロピー誤差を表す第２の損失関数と、を含む、
請求項３記載の医用情報処理装置。

【請求項5】

前記学習部は、前記イベントの種別毎の推定効果値を前記推定推奨確率に変換する、請求項４記載の医用情報処理装置。

【請求項6】

前記学習部は、前記知識ラベルに含まれる前記推奨度に応じて前記訓練サンプル毎の前記第１の損失関数に対する第１の重み及び前記第２の損失関数に対する第２の重みを変更する、請求項４記載の医用情報処理装置。

【請求項7】

前記損失関数は、
前記イベントの推定種別と前記種別ラベルとの分類誤差を表す第３の損失関数と、
前記推定種別に対応する潜在変数と前記推定効果値に対応する潜在変数との非直交性にペナルティを与える第４の損失関数と、を含む、
請求項４記載の医用情報処理装置。

【請求項8】

前記種別ラベルと前記知識ラベルとの統合ラベルを生成する統合部を更に備え、
前記学習部は、前記特徴量及び前記統合ラベルを含む統合サンプルに基づいて前記モデルを訓練する、
請求項１記載の医用情報処理装置。

【請求項9】

前記種別ラベルを有さない人工サンプルを生成する生成部を更に備え、
前記付与部は、前記人工サンプルに前記知識ラベルを付与し、
前記学習部は、前記知識ラベルが付与された前記少なくとも一部の訓練サンプル及び前記人工サンプルに基づいて前記モデルを訓練する、
請求項１記載の医用情報処理装置。

【請求項10】

前記生成部は、前記人工サンプルを、他施設から取得する又は疑似的に生成する、請求項９記載の医用情報処理装置。

【請求項11】

前記生成部は、前記人工サンプルと前記複数の訓練サンプルとの間のデータ空間内での距離に基づいて当該人工サンプルの採否を決定する、請求項９記載の医用情報処理装置。

【請求項12】

対象被検体に関する状態を表す対象特徴量を取得する第３取得部と、
前記対象特徴量と前記モデルとに基づいて前記対象被検体に対するイベントの種別毎の効果値を推論する推論部を更に備える、
請求項１記載の医用情報処理装置。

【請求項13】

前記推論部は、前記対象被検体に対するイベントの種別毎の前記効果値と前記対象被検体に対するイベントの推奨種別とを推論する、請求項１２記載の医用情報処理装置。

【請求項14】

前記効果値を表示する表示部を更に備える、請求項１０記載の医用情報処理装置。

【請求項15】

前記推奨種別は、未知クラスを含む、請求項３記載の医用情報処理装置。

【請求項16】

複数の訓練サンプルを取得する工程であって、前記複数の訓練サンプル各々は被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む、第１取得工程と、
前記複数の訓練サンプルから独立した知識ベースを取得する第２取得工程と、
前記知識ベースに基づいて、前記複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する付与工程と、
少なくとも前記知識ラベルが付与された前記少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論するモデルを訓練する工程であって、前記知識ラベルが付与された前記少なくとも一部の訓練サンプルは、前記特徴量、前記種別ラベル、前記効果ラベル及び前記知識ラベルを含む、学習工程と、
を具備する医用情報処理方法。

【請求項17】

コンピュータに、
複数の訓練サンプルを取得させる機能であって、前記複数の訓練サンプル各々は被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む、第１取得機能と、
前記複数の訓練サンプルから独立した知識ベースを取得させる第２取得機能と、
前記知識ベースに基づいて、前記複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与させる付与機能と、
少なくとも前記知識ラベルが付与された前記少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論するモデルを訓練させる機能であって、前記知識ラベルが付与された前記少なくとも一部の訓練サンプルは、前記特徴量、前記種別ラベル、前記効果ラベル及び前記知識ラベルを含む、学習機能と、
を実現させる医用情報処理プログラム。

【請求項18】

複数の訓練サンプルに基づいて訓練されたモデルを取得する部であって、前記複数の訓練サンプルの少なくとも一部は、被検体の状態を表す特徴量、当該被検体に施したイベントの種別ラベル、当該イベントの効果ラベル、前記複数の訓練サンプルから独立した知識ベースに基づく知識ラベルを含む、第４取得部と、
対象被検体に関する状態を表す対象特徴量を取得する第５取得部と、
前記対象特徴量と前記モデルとに基づいて前記対象被検体に対するイベントの種別毎の効果を推論する推論部を更に備える、
を具備する医用情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本明細書及び図面に開示の実施形態は、医用情報処理装置、方法及びプログラムに関する。

【背景技術】

【0002】

個別化医療では、因果関係を正しく考慮して治療効果を推定することが重要である。そこで、患者の状態を表す特徴量から当該患者に施すべき医療イベントの治療効果を推定する因果推論モデルの構築が試みられている。しかし、医療においては、機械学習のための大量の訓練サンプルを収集することが難しい場合がある。また、治療効果の推定の精度を向上するうえでは、訓練サンプルに基づく機械学習のみではなく、今までに獲得された既存の医療知識を活用することが望ましい。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２１－１５７６０２号公報

【特許文献2】特開２００５－２５６５９号公報

【非特許文献】

【0004】

【非特許文献1】Yiqin Yu等、“Dynamic Knowledge Distillation for Hypothesis Transfer Learning”、arXiv:2007.12355v2 [cs.LG]、2020年8月7日

【発明の概要】

【発明が解決しようとする課題】

【0005】

本明細書及び図面に開示の実施形態が解決しようとする課題の一つは、少量のサンプルからでも精度良く治療効果を推定することである。ただし、本明細書及び図面に開示の実施形態により解決しようとする課題は上記課題に限られない。後述する実施形態に示す各構成による各効果に対応する課題を他の課題として位置づけることもできる。

【課題を解決するための手段】

【0006】

実施形態に係る医用情報処理装置は、第１取得部、第２取得部、付与部及び学習部を有する。第１取得部は、複数の訓練サンプルを取得する。複数の訓練サンプル各々は被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む。第２取得部は、複数の訓練サンプルから独立した知識ベースを取得する。付与部は、知識ベースに基づいて、複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する。学習部は、少なくとも知識ラベルが付与された少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論するモデルを訓練する。知識ラベルが付与された少なくとも一部の訓練サンプルは、特徴量、種別ラベル、効果ラベル及び知識ラベルを含む。

【図面の簡単な説明】

【0007】

【図1】図１は、本実施形態に係る医用情報処理装置の構成例を示す図である。

【図2】図２は、医用情報処理（因果推論モデルの学習処理）の処理手順を示す図である。

【図3】図３は、図２に示す学習処理を模式的に示す図である。

【図4】図４は、知識ベースの取得例を模式的に示す図である。

【図5】図５は、知識ラベルの付与処理後の訓練データセットの具体例を示す図である。

【図6】図６は、因果推論モデルに対する学習処理の全体を模式的に示す図である。

【図7】図７は、第１の損失関数Ｌ_Ｙ及び第２の損失関数Ｌ_Ｋの詳細を模式的に示す図である。

【図8】図８は、応用例１に係る医用情報処理装置の構成例を示す図である。

【図9】図９は、応用例１に係る学習処理を模式的に示す図である。

【図10】図１０は、応用例２に係る医用情報処理装置の構成例を示す図である

【図11】図１１は、人工サンプルの生成処理を模式的に示す図である。

【図12】図１２は、人工サンプルの採否の決定処理を模式的に示す図である。

【図13】図１３は、応用例３に係る医用情報処理装置の構成例を示す図である。

【図14】図１４は、応用例３に係る医用情報処理装置による推論処理の処理手順を示す図である。

【図15】図１５は、応用例３に係る、治療効果値と推奨種別との表示画面の一例を示す図である。

【発明を実施するための形態】

【0008】

以下、図面を参照しながら、本実施形態に係る医用情報処理装置、方法及びプログラムについ説明する。

【0009】

図１は、本実施形態に係る医用情報処理装置１の構成例を示す図である。図１に示すように、医用情報処理装置１は、処理回路１１、記憶装置１２、入力機器１３、通信機器１４及び表示機器１５を有するコンピュータ等の情報処理端末である。処理回路１１、記憶装置１２、入力機器１３、通信機器１４及び表示機器１５はバス（Bus）を介して相互に信号を入出力可能に接続されている。

【0010】

処理回路１１は、ＣＰＵ（Central Processing Unit）及びＧＰＵ（Graphics Processing Unit）等のプロセッサを有する。処理回路１１は、医用情報処理プログラムを実行することにより、サンプル取得機能１１１、知識ベース取得機能１１２、付与機能１１３、学習機能１１４及び表示制御機能１１５等を実現する。なお、各機能１１１～１１５は単一の処理回路で実現される場合に限らない。複数の独立したプロセッサを組合せて処理回路を構成し、各プロセッサがプログラムを実行することにより各機能１１１～１１５を実現するものとしても構わない。また、機能１１１～１１５は、それぞれ医用情報処理プログラムを構成するモジュール化されたプログラムであってもよい。これらプログラムは記憶装置１２に記憶される。

【0011】

記憶装置１２は、種々の情報を記憶するＲＯＭ（Read Only Memory）やＲＡＭ（Random Access Memory）、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、集積回路記憶装置等である。記憶装置１２は、上記記憶装置以外にも、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）、フラッシュメモリ等の可搬型記録媒体や、半導体メモリ素子等との間で種々の情報を読み書きする駆動装置であってもよい。また、記憶装置１２は、ネットワークを介して接続された他のコンピュータ内にあってもよい。

【0012】

入力機器１３は、操作者からの各種の入力操作を受け付け、受け付けた入力操作を電気信号に変換して処理回路１１に出力する。具体的には、入力機器１３は、マウス、キーボード、トラックボール、スイッチ、ボタン、ジョイスティック、タッチパッド及びタッチパネルディスプレイ等の入力機器に接続されている。入力機器１３は、当該入力機器への入力操作に応じた電気信号を処理回路１１へ出力する。入力機器１３として、音声入力装置が使用されてもよい。また、入力機器１３は、ネットワーク等を介して接続された他のコンピュータに設けられた入力機器でもよい。

【0013】

通信機器１４は、他のコンピュータとの間で種々の情報を送受信するためのインタフェースである。通信機器１４による情報通信は、ＤＩＣＯＭ（Digital Imaging and Communications in Medicine）等の医療情報通信に適当な規格に従い行われる。

【0014】

表示機器１５は、処理回路１１の表示制御機能１１５により種々の情報を表示する。表示機器１５としては、例えば、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、ＣＲＴ（Cathode Ray Tube）ディスプレイ、有機ＥＬディスプレイ（ＯＥＬＤ：Organic Electro Luminescence Display）、プラズマディスプレイ又は他の任意のディスプレイが適宜使用可能である。また、表示機器１５としてプロジェクタが使用されてもよい。

【0015】

処理回路１１は、サンプル取得機能１１１の実現により、複数の訓練サンプルを取得する。複数の訓練サンプル各々は、被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む。複数の訓練サンプル間において被検体は同一人物でもよいし異なる人物でもよい。「被検体」は必ずしも実在する人物である必要はなく、統計的に標準的な健常人や特定疾患罹患者、特定年齢人、特定性別人、特定人種等の統計演算により得られる架空人物でもよい。

【0016】

本実施形態に係る「特徴量」は、被検体の状態を表す数値や文章、記号等である。特徴量は、機械学習における入力データとして使用される情報である。１個の訓練サンプルに含まれる特徴量の種類の個数は、典型的には複数個である。ここで、特徴量の種類を特徴量種別と呼ぶ。詳細には、特徴量は、複数の特徴量種別にそれぞれ対応する複数の数値（要素）等の組合せを有するベクトル又は行列である。なお、本実施形態に係る特徴量の要素は１個でもよい。

【0017】

本実施形態に係る「イベント」は、当該被検体に対して医療従事者等が施す医療行為や当該被検体が自ら実施する行動を意味する。種々のイベントの種類を「イベント種別」と称する。本実施形態に係る「種別ラベル」は、当該訓練サンプルに関する被検体に対して実施されたイベントの種別を表す数値や文字、記号等であり、機械学習における正解データとして使用される情報を意味する。「効果ラベル」は、当該訓練サンプルに関する被検体に対して実施されたイベントの治療効果を表す数値や文字、記号等であり、機械学習における正解データとして使用される情報を意味する。治療効果を表す数値や文字、記号等を治療効果値と呼ぶ。治療効果値の種別は１種類でもよいし複数種類でもよい。治療効果値の種別を「治療効果種別」と呼ぶ。治療効果種別としては、１年生存率や６ヶ月生存率、主要心血管イベント（ＭＡＣＥ：major adverse cardiac events）、心機能分類（ＮＹＨＡ：New York Heart Association classification）等の臨床的アウトカムの他、自覚症状や治療満足度等の患者報告アウトカム、医療費、医療リソース、在院日数等の経済的アウトカムでもよい。

【0018】

処理回路１１は、知識ベース取得機能１１２により、サンプル取得機能１１１により取得される複数の訓練サンプルから独立した知識ベースを取得する。本実施形態に係る「知識ベース」は、既存の医療知識を体系的に集約したデータベースを意味する。知識ベースは、推奨イベントの種別、当該推奨イベントの推奨度及び当該推奨イベントが適用される人物の状態を表す特徴量を含んでいる。「独立した」とは、知識ベースが訓練サンプルに基づいて生成されていなこと又は訓練サンプルが知識ベースに基づいて生成されていないことを意味する。推奨イベントは、知識ベースにおいて推奨されるイベントを意味する。

【0019】

処理回路１１は、付与機能１１３により、知識ベース取得機能１１２により取得された知識ベースに基づいて、サンプル取得機能１１１により取得された複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する。本実施形態に係る「知識ラベル」は、推奨イベントの種別及び当該推奨イベントの推奨度を有する。以下、推奨イベントの種別を「推奨種別」と呼ぶ。知識ラベルは、機械学習における正解データとして使用される。

【0020】

処理回路１１は、学習機能１１４により、少なくとも知識ラベルが付与された少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論する因果推論モデルを訓練する。「知識ラベルが付与された少なくとも一部の訓練サンプル」は、特徴量、種別ラベル、効果ラベル及び知識ラベルを含む。なお、処理回路１１は、「知識ラベルが付与された少なくとも一部の訓練サンプル」の他に、知識ラベルが付与されていない訓練サンプルに基づいて因果推論モデルを訓練してもよい。「知識ラベルが付与されていない訓練サンプル」は、特徴量、種別ラベル及び効果ラベルを含む。

【0021】

処理回路１１は、表示制御機能１１５により、種々の情報を表示機器１５に表示する。一例として、処理回路１１は、因果推論モデルの訓練結果や訓練サンプル、知識ベース、知識ラベル等を表示する。

【0022】

以下、本実施形態に係る医用情報処理装置１の動作例について説明する。

【0023】

図２は、医用情報処理プログラムに従い処理回路１１により行われる医用情報処理の処理手順を示す図である。図２に示す医用情報処理は、因果推論モデル２３の学習処理を想定する。図３は、図２に示す学習処理を模式的に示す図である。

【0024】

図２に示すように、まず、処理回路１１は、サンプル取得機能１１１により、複数の訓練サンプルを取得する（ステップＳＡ１）。複数の訓練サンプルは、正解ラベルと特徴量とを有する。正解ラベルは、種別ラベルと治療効果値とを有する。複数の訓練サンプルの集合は訓練データセットと呼ばれる。処理回路１１は、医療施設等に設置されたコンピュータから、通信機器１４を介して訓練サンプルを取得する。別途、学習結果の検証のために使用するサンプルである検証サンプルが取得されてもよい。

【0025】

ステップＳＡ１が行われると処理回路１１は、知識ベース取得機能１１２により、知識ベース２２を取得する（ステップＳＡ２）。ステップＳＡ２において処理回路１１は、具体的には、診療ガイドライン２１から知識ベース２２を構築する。診療ガイドライン２１は、対象疾患について典型的な特徴量に推奨（Recommendations）を示した既存の医療知識の文章データである。推奨は、患者の典型的な特徴量に当該患者に適又は不適な医療行為（推奨イベント）を提示する文章項目である。推奨には当該推奨イベントの推奨度が関連付けられている。処理回路１１は、診療ガイドライン２１に自然言語処理や統計的因果探索等を施して推奨イベントと特徴量との間の因果関係を評価し、因果関係を充足する推奨イベント及び特徴量、更に当該推奨イベントに対応する推奨度を対応付ける。これにより知識ベース２２が構築される。なお、知識ベース２２の構築は、他のアルゴリズムや人手により行われてもよい。また、予め知識ベース２２が構築されている場合、処理回路１１は、当該知識ベース２２を取り込めばよい。

【0026】

ステップＳＡ２が行われると処理回路１１は、付与機能１１３により、訓練サンプルに知識ラベルを付与する（ステップＳＡ３）。ステップＳＡ３において処理回路１１は、訓練サンプルに含まれる特徴量を知識ベース２２に適用して当該特徴量に対応する推奨イベントと推奨度とを特定し、特定された推奨イベントと推奨度とを知識ラベルとして当該訓練サンプルに付与する。

【0027】

ここで、知識ベース２２の取得（ステップＳＡ２）と知識ラベルの付与（ステップＳＡ３）とを具体例を示しながら説明する。下記実施例に係る診療ガイドライン２１は、弁膜症を対象疾患とする弁膜症治療ガイドラインであるとする。

【0028】

図４は、知識ベース２２の取得例を模式的に示す図である。図４に示すように、弁膜症治療ガイドラインは、推奨（Recommendations）項目とクラス（Class）項目とを有する。推奨項目は、推奨するイベントの種別（推奨種別）と当該推奨種別に適又は不適な特徴量との関係性を自然文で表現している。クラス項目は、推奨種別の推奨度を表している。

【0029】

一例として、図４の上段左図の一番目の事例では、推奨項目として、「兆候ありの患者（Symptomatic patients）であり、重症（severe）であり、大動脈弁狭窄に高い圧較差（high-gradient）（平均圧較差≧４０ｍｍＨｇ又はピーク速度≧４．０ｍ／ｓ）が認められる場合、侵襲的処置（Intervention）の必要が示される」が記録されている。この場合、推奨イベントが「侵襲的処置」であり、侵襲的処置に適した特徴量が「兆候ありの患者（Symptomatic patients）であり、大動脈弁狭窄に高い圧較差（high-gradient）（平均圧較差≧４０ｍｍＨｇ又はピーク速度≧４．０ｍ／ｓ）」である。当該事例の推奨項目には、クラス項目として推奨度「Ｉ」が関連付けられている。

【0030】

図４の上段右図に示すように、弁膜症治療ガイドラインでは、推奨度の定義がなされている。クラス「Ｉ」の定義は「推奨（Is recommended）又は必要的(Is indicated)」である。また、クラス「ＩＩａ」の定義は「考慮されるべき（Should be considered)」である。クラス「ＩＩｂ」の定義は「考慮されてもよい（May be recommended considered）」である。クラス「ＩＩＩ」の定義は「非推奨（Is not recommended）」である。

【0031】

処理回路１１は、図４の中段に示すように、各事例の推奨項目及びクラス項目に自然言語処理や統計的因果探索等を施して当該事例の特徴量と推奨イベントとの因果関係を論理式で表現する。一例として、事例♯１では、IF{(Symptom=Symptomatic) AND (AS Severity = Severe) AND (Pressure Gradient=High-gradient)} THEN {TAVI OR SAVR} (Class I)のように論理式で表現される。すなわち、事例♯１は、『特徴量種別「兆候（Symptom）」の値が「兆候あり（Symptomatic）」であり、且つ特徴量種別「大動脈弁狭窄症重症度（AS Severity）」の値が「重症（Severe）」、且つ特徴量種別「圧較差（Pressure Gradient）」の値が「高い（High-gradient）」である場合、推奨種別は侵襲的処理である「TAVI」又は「SAVR」である。』という意味の論理式に変換される。なお、「TAVI」は経カテーテル大動脈弁留置術（Transcatheter aortic valve implantation）の略語であり、「SAVR」は外科的人工弁置換術（Surgical aortic valve replacement）の略語である。弁膜症治療ガイドラインに関する論理式は、知識ベース２２の一例である。

【0032】

処理回路１１は、図４の下段に示すように、特徴量と推奨イベントとの因果関係を表す論理式をデータベース（以下、ガイドラインデータベース）に変換する。ガイドラインデータベースは、特徴量項目と知識ラベル項目とを有する。特徴量項目は、兆候（Symptom）」や「大動脈弁狭窄症重症度（AS Severity）」、「圧較差（Pressure Gradient）」、「運動試験（Exercise test）」、「共存症（Comorbidities）」等を有する。知識ラベル項目は、知識ラベルである「推奨種別」や「推奨度」を有する。処理回路１１は、論理式に含まれる各特徴量項目及び知識ラベル項目の値をガイドラインデータベースに割り当てることりにより、論理式をデータベース化する。弁膜症治療ガイドラインに関するガイドラインデータベースは、知識ベース２２の一例である。以上により、弁膜症治療ガイドラインに関する知識ベース２２が構築される。

【0033】

知識ベース２２が構築されると処理回路１１は、訓練データセットのうちの一部の訓練サンプルに知識ラベルを付与する。具体的には、処理回路１１は、訓練データセットに含まれる各訓練サンプルの特徴量（ここで、サンプル特徴量）と知識ベース２２に含まれる各事例の特徴量（ここで、知識特徴量）とを比較し、各事例の知識特徴量に当て嵌まるサンプル特徴量を有する訓練サンプルを特定する。そして処理回路１１は、特定された訓練サンプルに、当該事例の知識ラベルを付け加える。知識ベース２２に含まれる全ての事例の知識特徴量に当て嵌まらないサンプル特徴量を有する訓練サンプルには知識ラベルは付与されない。すなわち、訓練データセットに含まれる一部の訓練サンプルにのみ知識ラベルが付与されることとなる。これにより知識ラベルの付与処理が終了する。

【0034】

図５は、知識ラベルの付与処理後の訓練データセットの具体例を示す図である。図５に示すように、本具体例に係る訓練データセットには＃１～６７２までの６７２個の訓練サンプルが含まれている。訓練データセットは、特徴量ｘ１，ｘ２，・・・，ｘ２５、種別ラベルｔ、治療効果値ｙ（０），ｙ（１）、知識ラベル（推奨種別ｋｌ、推奨度ｋｃ）の項目を含む。種別ラベルｔには、当該訓練サンプルの患者に対して施されたイベント（医療行為）の種別が種別０であることを示す「０」又は種別１であることを示す「１」が割り当てられている。種別０が施された場合、治療効果値ｙ（０）に当該種別０の治療効果値が割り当てられ、種別１が施された場合、治療効果値ｙ（１）に当該種別１の治療効果値が割り当てられている。各患者に対して種別０の医療行為及び種別１の医療行為の何れか一方が施されるので、治療効果値ｙ（０）及び治療効果値ｙ（１）の何れか一方のみが値を有することとなる。各訓練サンプルのうち特徴量ｘ１，ｘ２，・・・，ｘ２５の数値が、知識ベース２２の事例の特徴量の数値に合致している場合、当該事例の知識ラベルである推奨種別ｋｌ及び推奨度ｋｃの数値が割り当てられている。

【0035】

一例として、訓練サンプル＃１については、推奨種別ｋｌ「０」及び推奨度ｋｃ「Ｉ」が割り当てられている。訓練サンプル＃１の種別ラベルｔは「０」であり、推奨種別ｋｌ「０」と一致している。訓練サンプル＃２については、推奨種別ｋｌ及び推奨度ｋｃが割り当てられていない。訓練サンプル＃４については、推奨種別ｋｌ「０」及び推奨度ｋｃ「ＩＩ」が割り当てられているが、訓練サンプル＃４の種別ラベルｔは「０」であり、推奨種別ｋｌ「１」と一致していない。

【0036】

なお、図５の訓練データセットは一例にすぎず、訓練サンプルの個数や特徴量ｘの要素数（特徴量種別数）、種別ラベルｔの取り得る値の個数、治療効果値ｙの個数（治療効果種別数）は任意に変更可能である。また、特徴量ｘや治療効果値ｙは数値に限定されず、文字や記号等でもよい。

【0037】

ステップＳＡ３が行われると処理回路１１は、学習機能１１４により、因果推論モデル２３を訓練する（ステップＳＡ４）。因果推論モデル２３は、簡潔には、特徴量ｘを入力して治療効果値の推定値（推定効果値）ｙを出力する機械学習モデルである。この場合、因果推論モデル２３は、簡易的にｙ＝ｆ（ｘ）のように数式で表現され得る。処理回路１１は、学習機能１１４により、因果推論モデル２３を、知識ラベルの推定と推定効果値の推定とのマルチタスク学習により訓練する。

【0038】

しかしながら、因果推論モデル２３は、推定効果値ｙの他に推定種別ｔを出力してもよい。推定種別ｔは、特徴量ｘを有する患者に対して実施されたイベントの種別ラベルの推定値を意味する。以下の実施例において因果推論モデル２３は、特徴量ｘを入力して推定種別ｔと推定効果値ｙとを出力する機械学習モデルであるとする。この因果推論モデル２３は、ｙ＝ｆ（ｘ）及びｔ＝ｇ（ｘ）の２個の数式で表現され得る。因果推論モデル２３の訓練過程では、損失関数Ｌ（ｙ，ｔ，ｋ）により評価される損失を小さくするように因果推論モデル２３の訓練パラメータが最適化される。訓練パラメータは、重みパラメータやバイアス等のパラメータに相当する。

【0039】

図６は、因果推論モデル２３に対する学習処理の全体を模式的に示す図である。図６に示すように、推定種別ｔを出力する第１系列と推定効果値ｙ（０），ｙ（１）を出力する第２系列とを有する。

【0040】

第１系列に関し、因果推論モデル２３は、潜在変数変換層２３１及び種別分類層２３２を有する。潜在変数変換層２３１は、特徴量ｘ１～ｘ２５を入力して潜在変数ｈｔを出力するネットワーク層である。潜在変数ｈｔは、特徴量ｘ１～ｘ２５の次元よりも低い次元を有するベクトルである。当該ネットワーク層は、畳み込み層、全結合層、プーリング層及び／又はその他の中間層を１層以上有している。種別分類層２３２は、潜在変数ｈｔを入力して推定種別ｔを出力するネットワーク層である。推定種別ｔは、予め定められた複数の分類クラスにそれぞれ対応する複数の分類確率の組合せを有するベクトルである。分類クラスは、機械学習におけるクラス分類におけるクラスを意味する。推定種別に関する分類クラスは、イベント種別における各種別に対応する。予め定められたイベント種別の分類確率が推定種別ｔとして計算されることとなる。イベント種別としては、「ＴＡＶＩ」や「ＳＡＶＲ」等に設定される。当該ネットワーク層は、畳み込み層、全結合層、プーリング層及び／又はその他の中間層を１層以上有している。

【0041】

第２系列に関し、因果推論モデル２３は、潜在変数変換層２３３、分配層２３４、効果値計算層２３５，２３６及び推奨確率変換層２３７を有している。潜在変数変換層２３３は、特徴量ｘ１～ｘ２５を入力して潜在変数ｈｙを出力するネットワーク層である。潜在変数ｈｙは、特徴量ｘ１～ｘ２５の次元よりも低い次元を有するベクトルである。当該ネットワーク層は、畳み込み層、全結合層、プーリング層及び／又はその他の中間層を１層以上有している。

【0042】

分配層２３４は、潜在変数ｈｙを、後続する効果値計算層２３５と効果値計算層２３６とに分配する。効果値計算層２３５は、潜在変数ｈｙを入力して種別０の治療効果の推定値（推定効果値）ｙ（０）を出力するネットワーク層である。効果値計算層２３６は、潜在変数ｈｙを入力して種別１の治療効果の推定値（推定効果値）ｙ（１）を出力するネットワーク層である。

【0043】

学習過程において分配層２３４は、潜在変数ｈｙを効果値計算層２３５と効果値計算層２３６との双方に分配する。

【0044】

推奨確率変換層２３７は、推定効果値ｙ（０）と推定効果値ｙ（１）とを入力して推定推奨確率ｋを出力するネットワーク層である。推定推奨確率ｋは、予め定められた複数の分類クラスにそれぞれ対応する複数の推奨確率の推定値のベクトルである。推定推奨確率に関する分類クラスは、イベント種別に対応する。推奨確率変換層２３７は、全結合層と当該全結合層に後続する活性化層を有している。活性化層は、任意の活性化関数に応じた演算を行うネットワーク層である。推定効果値ｙ（０）と推定効果値ｙ（１）との２クラスの出力を行う場合、推奨確率変換層２３７は、下記（１）式に示すように、ａ（ｙ（０）－ｙ（１））＋ｂ）にシグモイド関数sigmoidを適用することにより推定推奨確率ｋを出力する。

【0045】

【数1】

【0046】

なお、マルチクラスの出力を行う場合、推奨確率変換層２３７は、一例として、下記（２）式に示すように、推定効果値行列ｙと重み行列Ｗとの積とバイアスｂとの和にソフトマックス関数Softmaxを適用することにより推定推奨確率ｋを出力する。

【0047】

【数2】

【0048】

処理回路１１は、知識ラベルｋ´が付与された訓練サンプルと知識ラベルｋ´が付与されていない訓練サンプルとに基づいて因果推論モデル２３を訓練する。具体的には、処理回路１１は、推定種別ｔ、種別ラベルｔ´、潜在変数ｈｔ、潜在変数ｈｙ、推定効果値ｙ（０）、推定効果値ｙ（１）、効果ラベルｙ´、推定推奨確率ｋ及び知識ラベルｋ´に基づいて損失関数Ｌ_{ｔｏｔａｌ}を計算する。損失関数Ｌ_{ｔｏｔａｌ}は、下記（３）式の通り、第１の損失関数Ｌ_Ｙ、第２の損失関数Ｌ_Ｋ、第３の損失関数Ｌ_Ｔ及び第４の損失関数Ｌ_ｏｒｔｈの和により表される。処理回路１１は、損失関数Ｌ_{ｔｏｔａｌ}により評価される損失を最小化するように因果推論モデル２３の訓練パラメータを訓練する。訓練パラメータは、具体的には、上記の潜在変数変換層２３１、種別分類層２３２、潜在変数変換層２３３、効果値計算層２３５、効果値計算層２３６及び推奨確率変換層２３７に含まれる重みパラメータやバイアス等のパラメータを意味する。

【0049】

【数3】

【0050】

第１の損失関数Ｌ_Ｙは、イベント種別毎の推定効果値ｙ（０），ｙ（１）と効果ラベルｙ´との回帰誤差を表す。第２の損失関数Ｌ_Ｋは、イベント種別毎の推定推奨確率ｋと知識ラベルｋ´との交差エントロピー誤差を表す。第３の損失関数Ｌ_Ｔは、推定種別ｔと種別ラベルｔ´との分類誤差を表す。第４の損失関数Ｌ_ｏｒｔｈは、推定種別ｔに対応する潜在変数ｈｔと推定効果値ｙ（０），ｙ（１）に対応する潜在変数ｈｙとの非直交性にペナルティを与える。

【0051】

図７は、第１の損失関数Ｌ_Ｙ及び第２の損失関数Ｌ_Ｋの詳細を模式的に示す図である。図７の上段に示すように、損失関数Ｌ_{ｔｏｔａｌ}は、第１の損失関数Ｌ_Ｙ及び第２の損失関数Ｌ_Ｋに着目すれば、下記（４）式のように表現することが可能である。損失関数Ｌ_{ｏｔｈｅｒｓ}は、（３）式の第３の損失関数Ｌ_Ｔと第４の損失関数Ｌ_ｏｒｔｈとの和である。

【0052】

【数4】

【0053】

図７の中段に示すように、第１の損失関数Ｌ_Ｙは下記（５）式で表され、第２の損失関数Ｌ_Ｋは下記（６）式で表される。α_ｉは、訓練サンプルｉの重みである。第１の損失関数Ｌ_Ｙは、訓練サンプルｉの推定効果値ｙ_ｉと効果ラベルｙ´_ｉとの差分の２乗（ｙ_ｉ－ｙ´_ｉ）^２と、重み（１－α_ｉ）との積の、訓練サンプルｉの個数Ｎでの加算平均により規定される。第２の損失関数Ｌ_Ｋは、訓練サンプルｉの推奨確率の正解値（以下、正解推奨確率）ｋ´_ｉ（ｚ）と推定推奨確率ｋ_ｉ（ｚ）の自然対数ｌｏｇｋ_ｉ（ｚ）との積のイベント種別ｚでの総和と、重みα_ｉとの積の、訓練サンプルｉの個数Ｎでの加算平均により規定される。

【0054】

【数5】

【0055】

重みα_ｉは、各訓練サンプルｉに付与された知識ラベルのうちの推奨度ｋｃに応じた値を有する。処理回路１１は、学習処理において、推奨度ｋｃに応じて、訓練サンプルｉ毎の第１の損失関数Ｌ_Ｙに対する重み（１－α_ｉ）及び第２の損失関数Ｌ_Ｋに対する重みα_ｉを変更する。一例として、強い推奨を意味する推奨度「Ｉ」に対応する重みα_ｉは値「２／３」を有し、弱い推奨意味する推奨度「ＩＩａ」に対応する重みα_ｉは値「１／３」を有し、強い非推奨意味する推奨度「ＩＩＩ」に対応する重みα_ｉは値「２／３」を有し、推奨なしを意味する推奨度「－」に対応する重みα_ｉは値「０」を有する。

【0056】

（６）式に関し、イベント種別ｚの正解推奨確率ｋ´_ｉ（ｚ）は、訓練サンプルｉに付与された知識ラベルのうちの推奨種別ｋｌと推奨度ｋｃとの組合せに基づいて決定される。正解推奨確率ｋ´_ｉ（ｚ）は、予め定められた複数のイベント種別ｚ各々の推奨確率の組み合わせを有するベクトルで表現される。当該イベント種別ｚは、「ＴＡＶＩ」や「ＳＡＶＲ」、「Ｍｅｄ」等に設定される。なお「Ｍｅｄ」は、非侵襲的処置である薬剤治療を意味する。当該訓練サンプルｉに対する推奨種別ｚが１個である場合、当該推奨種別ｚの推奨確率が「１」に設定され、他の推奨種別ｚの推奨確率が「０」に設定されればよい。

【0057】

イベント種別ｚの正解推奨確率ｋ´_ｉ（ｚ）は、推定推奨確率を用いて決定されてもよい。具体的には、図７に示すように、１個の訓練サンプルｉに対して複数個の推奨種別が選択的に推奨されている場合、当該推奨種別の正解推奨確率ｋ´_ｉとして、推定推奨確率ｋ_ｉに基づく疑似ラベルが設定されるとよい。例えば、訓練サンプルｉの推定推奨確率ｋ_ｉ（ｚ）が下記（７）式で表される場合を考える。当該推定推奨確率に対して、知識ラベルの推奨種別「ＴＡＶＩ」又は「ＳＡＶＲ」且つ推奨度「Ｉ」の場合の正解推奨確率ｋ´_ｉ（ｚ）は下記（８）式、知識ラベルの推奨種別「ＳＡＶＲ」且つ推奨度「ＩＩａ」の正解推奨確率ｋ´_ｉ（ｚ）は下記（９）式、知識ラベルの推奨種別「ＴＡＶＩ」又は「ＳＡＶＲ」且つ推奨度「ＩＩＩ」の正解推奨確率ｋ´_ｉ（ｚ）は下記（１０）式、知識ラベルの推奨種別「Ｕｎｋｎｏｗｎ」且つ推奨度「－」の正解推奨確率ｋ´_ｉ（ｚ）は下記（１１）式で与えられる。

【0058】

【数6】

【0059】

（８）式について、種別「Ｍｅｄ」は推奨されていないので正解推奨確率ｋ´_ｉ（Ｍｅｄ）は「０」である。ｋ´_ｉ（ＴＡＶＩ）とｋ´_ｉ（ＳＡＶＲ）とには、それぞれ（７）式に示すｋ_ｉ（ＴＡＶＩ）に応じた値「３／７」とｋ_ｉ（ＳＡＶＲ）に応じた「４／７」とが割り当てられる。各ｋ´_ｉ（ｚ）には推奨度「Ｉ」に応じた重みα_ｉ＝「２／３」が乗じられる。（９）式について、１個の種別「ＳＡＶＲ」しか推奨されていないので、ｋ´_ｉ（ＳＡＶＲ）には、「１」が割り当てられ、ｋ´_ｉ（ＴＡＶＩ）及びｋ´_ｉ（Ｍｅｄ）には、「０」が割り当てられる。各ｋ´_ｉ（ｚ）には推奨度「ＩＩａ」に応じた重みα_ｉ＝「１／３」が乗じられる。（１０）式について、２個の種別「ＴＡＶＩ」及び「ＳＡＶＲ」が非推奨されているので、ｋ´_ｉ（ＴＡＶＩ）及びｋ´_ｉ（ＳＡＶＲ）には「０」が割り当てられ、ｋ´_ｉ（Ｍｅｄ）には「１」が割り当てられる。各ｋ´_ｉ（ｚ）には推奨度「ＩＩＩ」に応じた重みα_ｉ＝「２／３」が乗じられる。（１１）式について、何れの種別についても推奨及び非推奨されていないので、ｋ´_ｉ（ＴＡＶＩ）、ｋ´_ｉ（ＳＡＶＲ）及びｋ´_ｉ（Ｍｅｄ）には均等に「１／３」が割り当てられる。各ｋ´_ｉ（ｚ）には推奨度「－」に応じた重みα_ｉ＝「０」が乗じられる。

【0060】

処理回路１１は、上記の通り定義される損失関数Ｌ_{ｔｏｔａｌ}により評価される損失を最小化するように因果推論モデル２３を訓練する。具体的には、処理回路１１は、損失関数Ｌ_{ｔｏｔａｌ}の値である損失を算出し、算出された損失が小さくなるように、採用する最適化法に応じた更新幅で因果推論モデル２３の各訓練パラメータを更新する。最適化法は、確率的勾配降下法やＡＤＡＭ、その他の任意の方法が採用されればよい。処理回路１１は、更新終了条件が充足されるまで損失関数Ｌ_{ｔｏｔａｌ}の計算と訓練パラメータの更新とを繰り返す。更新終了条件は、一例として、更新回数が所定回数に到達したこと、因果推論モデル２３の精度が所定値に到達したこと、損失が閾値未満に到達したこと等に設定されればよい。

【0061】

更新終了条件が充足された場合、充足時点の訓練パラメータが設定された因果推論モデル２３を学習済みの因果推論モデル２３として出力する。学習済みの因果推論モデル２３の記憶装置１２に記憶されてもよいし、他のコンピュータに転送されてもよい。

【0062】

以上により因果推論モデル２３の学習処理が終了する。

【0063】

なお、上記の学習処理は一例であり、本実施形態はこれに限定されない。

【0064】

一例として、訓練サンプルの取得（ステップＳＡ１）と知識ベースの取得（ステップＳＡ２）との順番は逆又は同時でもよい。

【0065】

上記実施例では、因果推論モデルは、推定効果値と推定種別との双方を出力するものとした。しかしながら、因果推論モデルは、推定効果値を出力できればよく、推定種別を出力しなくてもよい。この場合、処理回路１１は、第１の損失関数Ｌ_Ｙ及び第２の損失関数Ｌ_Ｋの和である損失関数Ｌ_{ｔｏｔａｌ}により規定される損失を小さくするように因果推論モデルを訓練すればよい。因果推論モデルは、図６の潜在変数変換層２３１及び種別分類層２３２を有しない。訓練サンプルは、特徴量、効果ラベル及び知識ラベルを有すればよく、種別ラベルを有さなくてよい。

【0066】

上記の説明によれば、本実施形態に係る医用情報処理装置１は、処理回路１１を有します。処理回路１１は、サンプル取得機能１１１により、複数の訓練サンプルを取得します。複数の訓練サンプル各々は、被検体の状態を表す特徴量、当該被検体に対するイベントの種別ラベル及び当該イベントの効果ラベルを含む。処理回路１１は、知識ベース取得機能１１２により、複数の訓練サンプルから独立した知識ベースを取得する。処理回路１１は、付与機能１１３により、知識ベースに基づいて、複数の訓練サンプルのうちの少なくとも一部の訓練サンプルに対して知識ラベルを付与する。処理回路１１は、学習機能１１４により、少なくとも知識ラベルが付与された少なくとも一部の訓練サンプルに基づいて、イベントの種別毎の効果を推論する因果推論モデルを訓練する。ここで、知識ラベルが付与された少なくとも一部の訓練サンプルは、特徴量、種別ラベル、効果ラベル及び知識ラベルを含む。

【0067】

上記の構成によれば、訓練サンプルのみならず知識ベースをも加味してイベントの種別毎の効果を推論する因果推論モデルを生成することが可能になるので、訓練サンプルのみで訓練する場合に比して、訓練サンプルが少量であっても因果推論モデルの精度を向上させることが可能になる。

【0068】

（応用例１）
図８は、応用例１に係る医用情報処理装置１の構成例を示す図である。図８に示すように、応用例１に係る処理回路１１は、サンプル取得機能１１１、知識ベース取得機能１１２、付与機能１１３、学習機能１１４及び表示制御機能１１５の他、統合機能１１６を実現する。処理回路１１は、統合機能１１６により、種別ラベルと知識ラベルとの統合ラベルを生成する。学習機能１１４により、処理回路１１は、特徴量及び統合ラベルを含む統合サンプルに基づいてモデルを訓練する。

【0069】

図９は、応用例１に係る学習処理を模式的に示す図である。図９に示すように、応用例１において処理回路１１は、正解ラベルと知識ラベルとを統合して統合ラベルを生成し、統合ラベルを利用した教師有り学習により因果推論モデル２３を訓練する。この際、処理回路１１は、応用例１に係る損失関数により規定される損失が小さくなるように因果推論モデル２３の訓練パラメータを訓練する。応用例１に係る第５の損失関数は、治療効果値と統合ラベルとを変数に有する関数であり、簡単にはＬ（ｙ，ｃ）のように数式で表現される。第５の損失関数は、上記第１の損失関数と第２の損失関数とを統合した損失関数に相当する。

【0070】

より詳細には、訓練サンプルｉの治療効果値ｙ_ｉと統合ラベルｃ´_ｉとに基づく、第５の損失関数Ｌ（ｙ_ｉ，ｃ´_ｉ）は、下記（１２）式により表現される。

【0071】

【数7】

【0072】

一例として、正解ラベルｔ´_ｉが下記（１３）式、知識ラベルｋ´_ｉのうちの推奨種別と推奨度との組合せが下記（１４）式であり、知識ラベルの重みλ＝０．５且つ推奨度重みα_ｉ＝１の場合、統合ラベルｃ´_ｉのうちの推奨種別と推奨度との組合せは下記（１５）式で表現される。

【0073】

【数8】

【0074】

上記の通り、応用例１によれば、統合ラベルに基づき損失関数を計算することが可能になる。なお、推奨が複数ある場合、上記実施形態と同様、疑似ラベルやｕｎｋｎｏｗｎラベルが追加されてもよい。

【0075】

（応用例２）
上記実施形態では訓練サンプルに種別ラベルが存在するものとした。この事は、訓練サンプルが実在するサンプルであることを意味する。因果推論モデルの推論精度を向上するためには、実在する訓練サンプルのみでなく、実在しないサンプル、すなわち、種別ラベルの存在しないサンプルを利用する必要がある。応用例２に係る処理回路は、種別ラベルが存在しないサンプル（以下、人工サンプル）を生成し、人工サンプルが知識ベースに従うように因果推論モデルを訓練する。

【0076】

図１０は、応用例２に係る医用情報処理装置１の構成例を示す図である。図１０に示すように、応用例２に係る処理回路１１は、サンプル取得機能１１１、知識ベース取得機能１１２、付与機能１１３、学習機能１１４及び表示制御機能１１５の他、生成機能１１７を実現する。処理回路１１は、生成機能１１７により、種別ラベルを有さない人工サンプルを生成する。処理回路１１は、付与機能１１３により、人工サンプルに知識ラベルを付与する。そして処理回路１１は、学習機能１１４により、知識ラベルが付与された訓練サンプル及び人工サンプルに基づいて因果推論モデルを訓練する。

【0077】

図１１は、人工サンプルの生成処理を模式的に示す図である。図１１に示すように、訓練データセットには複数の訓練サンプルが存在している。図１１では、種別ラベル「ＳＡＶＲ」の訓練サンプルを黒丸で図示し、種別ラベル「ＴＡＶＩ」の訓練サンプルを×印付きの丸で図示している。種別ラベル無し、すなわち、種別ラベル「Ｕｎｋｎｏｗｎ」の人工サンプルを白丸で図示している。なお、種別ラベル「Ｍｅｄ」の訓練サンプルは、簡単のため図示していない。初期的には人工サンプルは存在していない。生成された人工サンプルに対しては、種別ラベル「Ｕｎｋｎｏｗｎ」が付与され、上記実施形態と同様の方法により知識ラベルが付与される。図１１の例では、＃５の人工サンプルには、推奨種別「ＳＡＶＲ」、推奨度「ＩＩａ」の知識ラベルが付与される。

【0078】

人工サンプルは、例えば、下記方法により生成される。一例として、処理回路１１は、訓練サンプルが生成された施設とは異なる他施設により生成されたサンプルを人工サンプルとして取得する。そして処理回路１１は、当該人工サンプルと前記複数の訓練サンプルとの間のデータ空間内での距離に基づいて当該人工サンプルの採否を決定する。

【0079】

図１２は、人工サンプルの採否の決定処理を模式的に示す図である。図１２に示すように、訓練データセットのデータ空間Ｄ１には、図１１と同様、種別ラベル「ＳＡＶＲ」の訓練サンプルと種別ラベル「ＴＡＶＩ」の訓練サンプルとが存在している。このデータ空間Ｄ１おいて、人工サンプルＤ１１と人工サンプルＤ１２とが生成されたものとする。処理回路１１は、人工サンプルＤ１１，Ｄ１２を中心として所定の第１の半径を有する第１の判定空間Ｄ１３，Ｄ１４を設定する。処理回路１１は、第１の判定空間Ｄ１３，Ｄ１４に訓練サンプルが存在しない場合、人工サンプルＤ１１，Ｄ１２を採用すると判定し、存在する場合、人工サンプルＤ１１，Ｄ１２を採用しないと判定する。具体的には、人工サンプルＤ１１については、第１の判定空間Ｄ１３内に訓練サンプルが存在するので、採用しない（ＮＧ）と判定される。人工サンプルＤ１２については、第１の判定空間Ｄ１４内に訓練サンプルが存在しないので、採用する（ＯＫ）と判定される。第１の判定空間Ｄ１３，Ｄ１４の第１の半径は、予め任意の値に設定されればよい。

【0080】

なお、データ空間Ｄ１に存在する訓練サンプルから過度に距離が離れた人工サンプルについては採用しない方がよい。この場合、処理回路１１は、第１の半径に比して長い第２の半径に基づく人工サンプルの採否の決定を加えてもよい。具体的には、処理回路１１は、上記の第１の半径に基づいて採用すると判定された人工サンプルについて、当該人工サンプルを中心とし第２の半径を有する第２の判定空間を設定する。そして処理回路１１は、第２の判定空間に訓練サンプルが存在しない場合、当該人工サンプルを採用すると判定し、存在する場合、当該人工サンプルを採用しないと判定する。これにより既存の訓練サンプルに対して過度に距離が離れた人工サンプルの採用を却下することが可能になる。これにより、因果推論モデルの推論精度の劣化を回避することが可能になる。

【0081】

なお、人工サンプルの生成方法は、上記のみに限定されない。一例として、処理回路１１は、乱数発生器を利用して人工サンプルを疑似的に生成してもよい。具体的には、乱数発生器により、特徴量に相当する数値がランダムに発生されるとよい。他の例として、処理回路１１は、機械学習を利用して疑似的に人工サンプルを生成してもよい。当該機械学習としてはＶＡＥ（variational auto-encoder）やＧＡＮ（generative adversarial network）等が適当である。発生された特徴量には種別ラベル「Ｕｎｋｎｏｗｎ」が付与される。これにより人工サンプルが生成される。これらの場合においても、上記第１の半径及び／又は第２の半径に基づいて人工サンプルの採否を決定してもよい。

【0082】

（応用例３）
上記実施形態に係る医用情報処理装置は、因果推論モデルの学習処理を行うものとした。しかしながら、本実施形態はこれに限定されない。応用例３に係る医用情報処理装置は、学習済みの因果推論モデルを利用してイベントの種別毎の治療効果値を推論する。

【0083】

図１３は、応用例３に係る医用情報処理装置１の構成例を示す図である。図１３に示すように、応用例３に係る処理回路１１は、サンプル取得機能１１１、知識ベース取得機能１１２、付与機能１１３、学習機能１１４及び表示制御機能１１５の他、対象患者状態取得機能１１８及び推論機能１１９を実現する。処理回路１１は、対象患者状態取得機能１１８により、対象被検体に関する状態を表す特徴量（以下、対象特徴量）を取得する。処理回路１１は、推論機能１１９により、対象特徴量と学習済みの因果推論モデルとに基づいて対象被検体に対するイベントのイベント種別毎の治療効果値を推論する。

【0084】

以下、応用例３に係る医用情報処理装置１による医用情報処理について説明する。応用例３に係る医用情報処理装置１による医用情報処理は推論処理を想定する。

【0085】

図１４は、応用例３に係る医用情報処理装置１による推論処理の処理手順を示す図である。図１４に示すように、まず、処理回路１１は、対象患者の対象特徴量を取得する（ステップＳＢ１）。対象特徴量は、他のコンピュータから取得してもよいし、記憶装置１２から取得してもよい。

【0086】

ステップＳＢ１が行われると処理回路１１は、推論機能１１９により、学習済みの因果推論モデルを取得する（ステップＳＢ２）。学習済みの因果推論モデルは、他のコンピュータから取得してもよいし、記憶装置１２から取得してもよい。学習済みの因果推論モデルは、特徴量を入力して治療効果値と推奨種別とを出力するように訓練された機械学習モデルである。

【0087】

ステップＳＢ２が行われると処理回路１１は、推論機能１１９により、ステップＳＢ１において取得した対象特徴量とステップＳＢ２において取得した因果推論モデルとに基づいて、複数の種別クラス各々の治療効果値と複数の種別クラスのうちの推奨種別とを推論する（ステップＳＢ３）。ステップＳＢ３において処理回路１１は、対象特徴量を因果推論モデルに適用することにより当該対象特徴量に応じた治療効果値と推奨種別とを出力する。

【0088】

ステップＳＢ３が行われると処理回路１１は、表示制御機能１１５により、ステップＳＢ３において推論された治療効果値と推奨種別とを表示する（ステップＳＢ４）。ステップＳＢ４において処理回路１１は、治療効果値と推奨種別とを提示する表示画面を表示機器１５に表示する。

【0089】

図１５は、治療効果値と推奨種別との表示画面Ｉ１の一例を示す図である。図１５に示すように、表示画面Ｉ１には臨床特性の表示欄Ｉ１１、治療効果値の表示欄Ｉ１２及び知識ベースによる結果表示欄Ｉ１３が含まれる。表示欄Ｉ１１には、対象患者の臨床特性である特徴量が表示される。図１５においては、特徴量として「ＬＶＥＦ」や「ＳＴＳ／ＥｕｒｏＳｃｏｒｅ」、「Ｓｅｖｅｒｅｃｏｍｏｒｂｉｄｉｔｙ」、「Ａｇｅ」、「Ｐｒｅｖｉｏｕｓｃａｒｄｉａｃｓｕｒｇｅｒｙ」が表示されている。

【0090】

表示欄Ｉ１２にはイベント種別毎の治療効果値が表示される。図１５においては、治療効果種別「１年生存率」、「６ヶ月生存率」、「ＭＡＣＥ」及び「ＮＹＨＡ」がタブで設けられ、各治療効果種別についてイベント種別「ＳＡＶＲ」、「ＴＡＶＩ」及び「Ｍｅｄｉｃａｔｉｏｎｓ」毎に治療効果値が表示される。治療効果値は数値と棒グラフとで示されている。また、表示欄Ｉ１３において選択されたイベント種別が視覚的に強調される。タブは、入力機器１３を介して任意に選択可能であり、ユーザは所望のタブを選択することにより、所望の治療効果種別の治療効果値を確認することができる。図１５においてはイベント種別「ＴＡＶＩ」にチェックマークＩ１２１が付与されている。また、イベント種別のうち最も治療効果値の良い種別には、星マークＩ１２２が付されている。

【0091】

表示欄Ｉ１３には治療効果値の種別の選択欄Ｉ１４と訓練サンプルの分布図Ｉ１５とが表示される。選択欄Ｉ１４では選択可能なイベント種別がプルダウンメニュー形式で表示され、ユーザに関心のあるイベント種別が選択される。図１５においてはイベント種別「ＴＡＶＩ」が選択されている。分布図Ｉ１５では、選択欄Ｉ１４で選択されたイベント種別についての、各訓練サンプルの推奨又は非推奨の推奨確率が推奨度毎に表示される。推奨度は各訓練サンプルに知識ラベルとして付与された推奨種別（すなわち、選択欄Ｉ１４で選択されたイベント種別）の推奨度を意味する。推奨又は非推奨の推奨確率は、当該推奨種別の推奨確率又は非推奨確率を意味する。訓練サンプルが丸形のマークで表示される。対象患者の訓練サンプルＩ１６は色や大きさ等で他の訓練サンプルとは視覚的に区別して表示される。分布図Ｉ１５により、他患者の訓練サンプルに対する対象患者の訓練サンプルＩ１６の位置関係を明瞭に把握することが可能である。

【0092】

ユーザは、入力機器１３等を介して任意の訓練サンプルを分布図Ｉ１５において選択可能である。訓練サンプルが選択された場合、当該訓練サンプルについての表示内容に、表示欄Ｉ１１及びＩ１２が更新される。

【0093】

以上により、応用例３に係る推論処理が終了する。

【0094】

上記の推論処理は一例であり、本実施形態はこれに限定されない。例えば、上記実施例では、治療効果値と推奨種別とを出力する因果推論モデルを使用するとした。しかしながら、本実施形態はこれに限定されない。例えば、治療効果値を出力する因果推論モデルが使用されてもよい。この変形例について簡単に説明する。

【0095】

対象患者状態取得機能１１８により、処理回路１１は、対象患者の特徴量を取得する。次に処理回路１１は、推論機能１１９により、特徴量を因果推論モデルに適用して複数の治療効果種別にそれぞれ対応する複数の治療効果値を推論する。次に処理回路１１は、複数の治療効果種別にそれぞれ対応する複数の治療効果値に基づいて推奨種別を特定する。これにより因果推論モデルの後段で推奨種別を推論することが可能になる。

【0096】

上記実施例において対象特徴量には知識ラベルが付与されないとしたが、本実施形態はこれに限定されない。処理回路１１は、付与機能１１３により、対象特徴量に合致する知識ラベルを対象特徴量に付与してもよい。付与処理は上記実施形態と同様の方法により行われればよい。対象特徴量に知識ラベルを付与することにより、推論結果の解釈性能の向上が期待される。例えば、処理回路１１は、推論結果である推奨種別や治療効果値と共に知識ラベルを表示機器１５に表示することが可能である。これによりユーザは、推論結果と知識ラベルとを比較して推論結果あるいは知識ラベルを解釈することが可能となる。

【0097】

上記実施例において医用情報処理装置１は、因果推論モデル２３の学習処理と推論処理との双方を実施可能なように、処理回路１１は、サンプル取得機能１１１、知識ベース取得機能１１２、付与機能１１３、学習機能１１４、表示制御機能１１５、対象患者状態取得機能１１８及び推論機能１１９を有するとした。しかしながら、推論処理を行う場合、処理回路１１は、対象患者状態取得機能１１８及び推論機能１１９を有すればよく、学習処理を実施するためのサンプル取得機能１１１、知識ベース取得機能１１２、付与機能１１３及び学習機能１１４を有する必要はない。

【0098】

（応用例４）
上記実施形態において知識ラベルの推奨種別が「分からない」を意味する「Ｕｎｋｎｏｗｎ」の場合、重みα_ｉには「０」が設定されるものとした。しかしながら、本実施形態はこれに限定されない。知識ラベルの推奨種別が「Ｕｎｋｎｏｗｎ」の場合、重みα_ｉには、「１／３」等の「０」を上回る数値が設定されてもよい。この際、知識ラベルの推奨種別及び推定推奨確率に関する分類クラスに未知ラベルである「Ｕｎｋｎｏｗｎ」が設けられるとよい。このようにして学習処理を行うことにより、因果推論モデルは、「Ｕｎｋｎｏｗｎ」の推定結果を出力することも可能になる。

【0099】

上記で説明した種々の実施例は任意に適宜組み合わせが可能である。一例として、学習処理に使用された訓練サンプルの推定効果値及び／又は推定種別を、図１５に示す表示画面で表示してもよい。

【0100】

以上説明した少なくとも１つの実施形態によれば、少量のサンプルからでも精度良く治療効果を推定することができる。

【0101】

上記説明において用いた「プロセッサ」という文言は、例えば、ＣＰＵ、ＧＰＵ、或いは、特定用途向け集積回路（Application Specific Integrated Circuit：ＡＳＩＣ）、プログラマブル論理デバイス（例えば、単純プログラマブル論理デバイス（Simple Programmable Logic Device：ＳＰＬＤ）、複合プログラマブル論理デバイス（Complex Programmable Logic Device：ＣＰＬＤ）、及びフィールドプログラマブルゲートアレイ（Field Programmable Gate Array：ＦＰＧＡ））等の回路を意味する。プロセッサは記憶回路に保存されたプログラムを読み出し実行することで機能を実現する。なお、記憶回路にプログラムを保存する代わりに、プロセッサの回路内にプログラムを直接組み込むよう構成しても構わない。この場合、プロセッサは回路内に組み込まれたプログラムを読み出し実行することで機能を実現する。一方、プロセッサが例えばＡＳＩＣである場合、プログラムが記憶回路に保存される代わりに、当該機能がプロセッサの回路内に論理回路として直接組み込まれる。なお、本実施形態の各プロセッサは、プロセッサごとに単一の回路として構成される場合に限らず、複数の独立した回路を組み合わせて１つのプロセッサとして構成し、その機能を実現するようにしてもよい。さらに、図１、図８、図１０及び図１３における複数の構成要素を１つのプロセッサへ統合してその機能を実現するようにしてもよい。

【0102】

いくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更、実施形態同士の組み合わせを行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

【符号の説明】

【0103】

１医用情報処理装置
１１処理回路
１２記憶装置
１３入力機器
１４通信機器
１５表示機器
１１１サンプル取得機能
１１２知識ベース取得機能
１１３付与機能
１１４学習機能
１１５表示制御機能
１１６統合機能
１１７生成機能
１１８対象患者状態取得機能
１１９推論機能

【図1】