特開2023-72458 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

特開2023-72458計算機システム及び介入効果予測方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023072458

(43)【公開日】2023-05-24

(54)【発明の名称】計算機システム及び介入効果予測方法

(51)【国際特許分類】

G16H 20/00 20180101AFI20230517BHJP

G06N 20/00 20190101ALI20230517BHJP

【ＦＩ】

G16H20/00

G06N20/00

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2021185031

(22)【出願日】2021-11-12

(71)【出願人】

【識別番号】000005108

【氏名又は名称】株式会社日立製作所

(74)【代理人】

【識別番号】110001678

【氏名又は名称】藤央弁理士法人

(72)【発明者】

【氏名】朱佩菲

(72)【発明者】

【氏名】荻野昌宏

(72)【発明者】

【氏名】黎子盛

【テーマコード（参考）】

5L099

【Ｆターム（参考）】

5L099AA15

(57)【要約】（修正有）

【課題】継続的に複数種類の介入を対象者に対して行う場合の介入効果を予測するシステム及び方法を提供する。
【解決手段】計算機１００は、人に行った介入に関する値を含む時系列データを用いて出力値を算出する第１モデルと、第１モデルの出力値を特徴量空間に写像することによって特徴量を算出する第２モデルと、特徴量から介入の効果の予測値を出力する第３モデルと、を管理する。時系列データは、介入が行われた時間、人の状態を表す複数の因子並びに介入の種別及び程度を含むデータ列を複数含む。計算機１００は、第１モデル、第２モデル及び第３モデルを用いて、時系列データに対応する連続的な介入の効果の予測値を算出する。第２モデルは、機械学習で用いる複数のデータ列の特徴量空間における分布の差異が小さくなるように、第１モデルの出力値を特徴量空間に写像する。
【選択図】図２

【特許請求の範囲】

【請求項1】

人への複数の介入の効果を予測する計算機システムであって、
プロセッサ及び前記プロセッサに接続される記憶装置を有する、少なくとも一つの計算機を備え、
人に行った介入に関する値を含む時系列データを用いて出力値を算出する第１モデルと、機械学習により生成され、前記第１モデルの出力値を特徴量空間に写像することによって特徴量を算出する第２モデルと、前記特徴量から前記人に対する介入の効果の予測値を出力する第３モデルと、を管理し、
前記時系列データは、前記人に対して前記介入が行われた時間、前記人の状態を表す複数の因子、並びに、前記人に対して行われた前記介入の種別及び程度を示す値を含むデータ列を複数含み、
前記プロセッサは、
前記データ列を前記第１モデルに入力することによって前記出力値を算出する処理と、
前記出力値を前記第２モデルに入力することによって前記特徴量を算出する処理と、
前記特徴量を前記第３モデルに入力することによって前記時系列データに対応する連続的な前記介入の効果の予測値を算出する処理と、
を含む予測処理を実行し、
前記第２モデルは、前記機械学習で用いる複数のデータ列の前記特徴量空間における分布の差異が小さくなるように、前記第１モデルの出力値を前記特徴量空間に写像することを特徴とする計算機システム。

【請求項2】

請求項１に記載の計算機システムであって、
前記特徴量から前記人に対して行われる前記介入の種別を識別する第４モデルと、前記第４モデルが出力した前記介入の予測種別、学習データに含まれる前記介入の種別、前記介入の効果の予測値、及び前記学習データに含まれる前記介入の効果値から定義される損失関数を管理し、
前記プロセッサは、
前記人の識別情報、前記人に対して前記介入が行われた時間、前記人の前記複数の因子の値、前記人が受けた前記介入の種別及び程度、並びに前記介入の効果値を含む、複数のデータ列を含む前記学習データを受け付ける処理と、
前記データ列を前記第１モデルに入力し、前記第１モデルから出力された前記出力値を前記第２モデルに入力する処理と、
前記第２モデルから出力された前記特徴量を前記第３モデルに入力することによって、前記介入の効果の予測値を算出する処理と、
前記第２モデルから出力された前記特徴量を前記第４モデルに入力することによって、前記介入の予測種別を算出する処理と、
前記複数のデータ列の各々の前記介入の種別及び前記介入の効果値と、前記複数のデータ列の各々から算出された前記介入の予測種別及び前記介入の効果の予測値と、を用いて、前記損失関数の値を算出する処理と、
前記損失関数の値を用いて、前記第２モデル、前記第３モデル、及び前記第４モデルを更新する処理と、
を含む前記機械学習を実行することを特徴とする計算機システム。

【請求項3】

請求項２に記載の計算機システムであって、
前記損失関数は、前記データ列に含まれる前記介入の効果値、及び前記データ列から算出された前記介入の効果の予測値の間の誤差の合計を評価する第１損失関数と、前記データ列に含まれる前記介入の種別、及び前記データ列から算出された前記介入の予測種別との間の誤差の合計を評価する第２損失関数と、から定義される関数であることを特徴とする計算機システム。

【請求項4】

請求項１に記載の計算機システムであって、
前記プロセッサは、
前記時系列データに含まれる少なくとも一つの前記データ列の前記介入の種別及び程度、並びに前記介入を行うタイミングを調整するための第１ユーザインタフェースを提示し、
前記第１ユーザインタフェースを介して入力されたデータ列を含む前記時系列データを用いて、前記予測処理を実行することを特徴とする計算機システム。

【請求項5】

請求項１に記載の計算機システムであって、
前記プロセッサは、
前記複数のデータ列の各々から算出された前記介入の効果の予測値を表示するための第２ユーザインタフェースを提示し、
前記第２ユーザインタフェースを介して前記介入の効果の予測値の修正内容を受け付け、
前記第２ユーザインタフェースを介して入力された前記介入の効果の予測値の修正内容が反映されたデータ列を含む前記時系列データを用いて、前記予測処理を実行することを特徴とする計算機システム。

【請求項6】

計算機システムが実行する人への複数の介入の効果を予測する介入効果予測方法であって、
前記計算機システムは、
プロセッサ及び前記プロセッサに接続される記憶装置を有する、少なくとも一つの計算機を含み、
人に行った介入に関する値を含む時系列データを用いて出力値を算出する第１モデルと、機械学習により生成され、前記第１モデルの出力値を特徴量空間に写像することによって特徴量を算出する第２モデルと、前記特徴量から前記人に対する介入の効果の予測値を出力する第３モデルと、を管理し、
前記時系列データは、前記人に対して前記介入が行われた時間、前記人の状態を表す複数の因子、並びに、前記人に対して行われた前記介入の種別及び程度を含むデータ列を複数含み、
前記介入効果予測方法は、
前記プロセッサが、前記データ列を前記第１モデルに入力することによって前記出力値を算出するステップと、
前記プロセッサが、前記出力値を前記第２モデルに入力することによって前記特徴量を算出するステップと、
前記プロセッサが、前記特徴量を前記第３モデルに入力することによって前記時系列データに対応する連続的な前記介入の効果の予測値を算出するステップと、
を含む予測処理を実行し、
前記第２モデルは、前記機械学習で用いる複数のデータ列の前記特徴量空間における分布の差異が小さくなるように、前記第１モデルの出力値を前記特徴量空間に写像することを特徴とする介入効果予測方法。

【請求項7】

請求項６に記載の介入効果予測方法であって、
前記特徴量から前記人に対して行われる前記介入の種別を識別する第４モデルと、前記第４モデルが出力した前記介入の予測種別、学習データに含まれる前記介入の種別、前記介入の効果の予測値、及び前記学習データに含まれる前記介入の効果値から定義される損失関数を管理し、
前記介入効果予測方法は、
前記プロセッサが、前記人の識別情報、前記人に対して前記介入が行われた時間、前記人の前記複数の因子の値、前記人が受けた前記介入の種別及び程度、並びに前記介入の効果値を含む、複数のデータ列を含む前記学習データを受け付けるステップと、
前記プロセッサが、前記データ列を前記第１モデルに入力し、前記第１モデルから出力された前記出力値を前記第２モデルに入力するステップと、
前記プロセッサが、前記第２モデルから出力された前記特徴量を前記第３モデルに入力することによって、前記介入の効果の予測値を算出するステップと、
前記プロセッサが、前記第２モデルから出力された前記特徴量を前記第４モデルに入力することによって、前記介入の予測種別を算出するステップと、
前記プロセッサが、前記複数のデータ列の各々の前記介入の種別及び前記介入の効果値と、前記複数のデータ列の各々から算出された前記介入の予測種別及び前記介入の効果の予測値と、を用いて、前記損失関数の値を算出するステップと、
前記プロセッサが、前記損失関数の値を用いて、前記第２モデル、前記第３モデル、及び前記第４モデルを更新するステップと、
を含む前記機械学習を実行することを特徴とする介入効果予測方法。

【請求項8】

請求項７に記載の介入効果予測方法であって、
前記損失関数は、前記データ列に含まれる前記介入の効果値、及び前記データ列から算出された前記介入の効果の予測値の間の誤差の合計を評価する第１損失関数と、前記データ列に含まれる前記介入の種別、及び前記データ列から算出された前記介入の予測種別との間の誤差の合計を評価する第２損失関数と、から定義される関数であることを特徴とする介入効果予測方法。

【請求項9】

請求項６に記載の介入効果予測方法であって、
前記プロセッサが、前記時系列データに含まれる少なくとも一つの前記データ列の前記介入の種別及び程度、並びに前記介入を行うタイミングを調整するための第１ユーザインタフェースを提示するステップと、
前記プロセッサが、前記第１ユーザインタフェースを介して入力されたデータ列を含む前記時系列データを用いて、前記予測処理を実行するステップと、を含むことを特徴とする介入効果予測方法。

【請求項10】

請求項６に記載の介入効果予測方法であって、
前記プロセッサが、前記複数のデータ列の各々から算出された前記介入の効果の予測値を表示するための第２ユーザインタフェースを提示するステップと、
前記プロセッサが、前記第２ユーザインタフェースを介して前記介入の効果の予測値の修正内容を受け付けるステップと、
前記プロセッサが、前記第２ユーザインタフェースを介して入力された前記介入の効果の予測値の修正内容が反映されたデータ列を含む前記時系列データを用いて、前記予測処理を実行するステップと、を含むことを特徴とする介入効果予測方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、人への介入の効果を予測するシステム及び方法に関する。

【背景技術】

【0002】

医療及びマーケティング等の様々な分野において、人に対して行った介入効果（投薬の効果及び運動の効果等）の予測が必要となっている。介入効果を予測する上で重要になってくるのが交絡因子である。交絡因子は、介入効果に影響を与え、かつ、要因に関連する因子である、観察されたデータに相関関係がみられる場合、それが因果関係によるものなのか又は交絡因子の影響によるものなのかを区別しなければならない。

【0003】

交絡因子の調整として、ランダム化比較試験という手法が知られている。この手法は無作為に対象者を選ぶことが必要のため、対象者の負担や実験コストが大きいという課題がある。そこで、既存のデータを用いて、因果推論を行う技術の開発が望まれている。これに対して、特許文献１に記載の技術が知られている。

【0004】

特許文献１には「介護介入の効果を適切に検証するため、複数の対象者の属性に基づいて、類似度によってクラスタリングをし、その結果を基に、さらに介入組と対照組に分割し、介入組と対照組の比較によって、介入効果を評価する」ことが記載されている。

【0005】

近年、継続的に複数種類の介入を対象者に対して行う場合の介入効果を予測する技術が求められている。特許文献１に記載の技術は、時系列データに対応していない。時系列データを用いた予測を行うシステムとして特許文献２に記載の技術が知られている。

【0006】

特許文献２には「対象者の健康状態を理想的な健康状態へ近づけるために、過去の複数日分の健康状態の計測値と目標値を学習して、次に推奨すべき健康状態の目標値と目標達成期待値が出力され、ユーザに提示する」ことが記載されている。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】特開２０１９－１９２０６５号公報

【特許文献2】特開２０２０－３５３６５号公報

【発明の概要】

【発明が解決しようとする課題】

【0008】

しかし、特許文献２に記載の技術は、交絡因子（性別及び年齢等の属性、並びに過去の介入結果）の影響を考慮されていない。

【0009】

本発明は、交絡因子の影響を考慮し、継続的に複数種類の介入を対象者に対して行う場合の介入効果を予測するシステム及び方法を提供する。

【課題を解決するための手段】

【0010】

本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、人への複数の介入の効果を予測する計算機システムであって、プロセッサ及び前記プロセッサに接続される記憶装置を有する、少なくとも一つの計算機を備え、人に行った介入に関する値を含む時系列データを用いて出力値を算出する第１モデルと、機械学習により生成され、前記第１モデルの出力値を特徴量空間に写像することによって特徴量を算出する第２モデルと、前記特徴量から前記人に対する介入の効果の予測値を出力する第３モデルと、を管理し、前記時系列データは、前記人に対して前記介入が行われた時間、前記人の状態を表す複数の因子、並びに前記人に対して行われた前記介入の種別及び程度を含むデータ列を複数含み、前記プロセッサは、前記データ列を前記第１モデルに入力することによって前記出力値を算出する処理と、前記出力値を前記第２モデルに入力することによって前記特徴量を算出する処理と、前記特徴量を前記第３モデルに入力することによって前記時系列データに対応する連続的な前記介入の効果の予測値を算出する処理と、を含む予測処理を実行し、前記第２モデルは、前記機械学習で用いる複数のデータ列の前記特徴量空間における分布の差異が小さくなるように、前記第１モデルの出力値を前記特徴量空間に写像する。

【発明の効果】

【0011】

本発明によれば、交絡因子の影響を考慮し、継続的に複数種類の介入を対象者に対して行う場合の介入効果を予測できる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

【図面の簡単な説明】

【0012】

【図1】実施例１のシステムの構成例を示す図である。

【図2】実施例１の計算機のソフトウェア構成の一例を示す図である。

【図3】実施例１の学習データＤＢの一例を示す図である。

【図4】実施例１の予測部の機能構成の一例を示す図である。

【図5】実施例１の学習部の機能構成の一例を示す図である。

【図6】実施例１の学習部が実行する学習処理の一例を説明するフローチャートである。

【図7】実施例１の予測部が実行する予測処理の一例を説明するフローチャートである。

【図8】実施例１の予測部が提示する画面の一例を示す図である。

【図9】実施例２の予測部が実行する予測処理の一例を説明するフローチャートである。

【図10】実施例２の予測部が提示する画面の一例を示す図である。

【発明を実施するための形態】

【0013】

以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施例の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。

【0014】

以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。

【0015】

本明細書等における「第１」、「第２」、「第３」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。

【0016】

図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。

【実施例0017】

図１は、実施例１のシステムの構成例を示す図である。

【0018】

システムは、計算機１００、情報端末１１０、及び外部記憶装置１１１から構成される。計算機１００、情報端末１１０、及び外部記憶装置１１１は、ネットワーク１０９を介して互いに接続される。ネットワーク１０９は、例えば、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）及びＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）等であり、接続方式は有線及び無線のいずれでもよい。

【0019】

計算機１００は、介入効果を予測するモデルを生成するための学習処理を実行し、また、当該モデルを用いてユーザデータ（入力データ）に対する介入効果を予測する。計算機１００は、ＣＰＵ１０１、主記憶装置１０２、副記憶装置１０３、ネットワークアダプタ１０４、入力装置１０５、及び出力装置１０６を有する。各ハードウェア要素は内部バス１０８を介して互いに接続される。

【0020】

ＣＰＵ１０１は、主記憶装置１０２に格納されるプログラムを実行する。ＣＰＵ１０１がプログラムにしたがって処理を実行することによって、特定の機能を実現する機能部（モジュール）として動作する。以下の説明では、機能部を主語に処理を説明する場合、ＣＰＵ１０１が当該機能部を実現するプログラムを実行していることを示す。

【0021】

主記憶装置１０２は、ＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）であり、ＣＰＵ１０１が実行するプログラム及びプログラムが使用するデータを格納する。主記憶装置１０２は、また、ワークエリアとしても使用される。

【0022】

副記憶装置１０３は、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）及びＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等であり、データを永続的に格納する。主記憶装置１０２に格納されるプログラム及びデータは、副記憶装置１０３に格納されてもよい。この場合、ＣＰＵ１０１が副記憶装置１０３からプログラム及び情報を読み出し、主記憶装置１０２にロードする。

【0023】

ネットワークアダプタ１０４は、ネットワーク１０９を介して外部装置と接続するためのインタフェースである。

【0024】

入力装置１０５は、キーボード、マウス、タッチパネル等であり、計算機１００に入力を行うための装置である。

【0025】

出力装置１０６は、ディスプレイ及びプリンタ等であり、計算機１００の処理結果等を出力するための装置である。

【0026】

なお、計算機１００のハードウェア構成は一例であってこれに限定されない。例えば、計算機１００は、入力装置１０５及び出力装置１０６を有していなくてもよい。

【0027】

情報端末１１０は、計算機１００に対する各種操作を行う端末である。例えば、情報端末１１０は、学習データの登録、モデルの登録、及びユーザデータの入力等を行う。情報端末１１０のハードウェア構成は計算機１００と同一である。

【0028】

外部記憶装置１１１は、各種情報を格納する。外部記憶装置１１１は、例えば、外付けのＨＤＤ又はストレージシステムである。

【0029】

図２は、実施例１の計算機１００のソフトウェア構成の一例を示す図である。

【0030】

計算機１００は、学習部２００及び予測部２０１を有し、また、学習データＤＢ２１０及びモデルＤＢ２１１を有する。なお、学習データＤＢ２１０及びモデルＤＢ２１１は、外部記憶装置１１１に格納されていてもよい。

【0031】

学習データＤＢ２１０は、学習処理に使用する学習データを格納するデータベースである。学習データＤＢ２１０については図３を用いて説明する。モデルＤＢ２１１は、各種モデルの情報を格納するデータベースである。

【0032】

学習部２００は、学習データＤＢ２１０に格納される学習データ及びモデルＤＢ２１１に格納されるモデルを用いて学習処理を実行する。予測部２０１は、モデルＤＢ２１１に格納されるモデルを用いて、ユーザデータ２２０に対する介入効果を予測し、予測介入結果２２１として出力する。なお、本実施例の学習データ及びユーザデータ２２０は時系列データである。

【0033】

図３は、実施例１の学習データＤＢ２１０の一例を示す図である。

【0034】

学習データＤＢ２１０は、ＩＤ３０１、要因３０２、日時３０３、介入内容３０４、及び効果３０５を含むエントリを格納する。一つのエントリが一つの学習データに対応する。なお、エントリに含まれるフィールドは前述したものに限定されない。前述したフィールドのいずれかを含まなくてもよいし、また、他のフィールドを含んでもよい。

【0035】

ＩＤ３０１は、学習データを一意に識別する識別情報を格納するフィールドである。本実施例のＩＤ３０１には識別番号が格納される。

【0036】

要因３０２は、介入を受ける人の状態及び特性等の要因の値を格納するフィールドである。要因は、例えば、年齢、性別、及び身長等である。本実施例では、要因３０２に含める要因の種類及び数に限定されない。

【0037】

本実施例の学習データは時系列データであり、一つの学習データには、日時３０３、介入内容３０４、及び効果３０５から構成されるデータ列が複数含まれる。

【0038】

日時３０３は、日時を格納するフィールドである。日時３０３には、介入効果が計測された日時又はデータ列が生成された日時が格納される。なお、本発明は、日時３０３に格納される日時の種類に限定されない。時系列の流れを把握できる日時であればよい。

【0039】

介入内容３０４は、人に対して行った介入の内容を示す情報を格納するフィールド群である。介入内容３０４は、フィールドとして種類及び量を含む。種類は介入の種別を格納するフィールドである。種類には、例えば、薬、治療、及び運動等の種類を示す値が格納される。量は、介入の程度を示す値を格納するフィールドである。例えば、薬の用量又は運動時間等を示す値が格納される。本実施例では、介入が行われていない場合、種類及び量の各々には０が格納される。

【0040】

効果３０５は、介入による効果を示す指標の値（効果予測値）を格納するフィールド群である。本実施例では、効果３０５に含める指標の種類及び数に限定されない。

【0041】

図４は、実施例１の予測部２０１の機能構成の一例を示す図である。

【0042】

予測部２０１は、時系列データ処理部４０１、交絡因子調整部４０２、及び予測器４０３を含む。

【0043】

時系列データ処理部４０１は、時系列データを用いて出力値を算出する。時系列データ処理部４０１は、例えば、ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ（ＲＮＮ）である。ＲＮＮは、ニューラルネットワークの一種であり、タイムステップごとに入出力が発生することが特徴である。なお、タイムステップの幅は任意に設定できる。ＲＮＮは、前のタイムステップの出力を新たな入力として用いることによって、時系列を考慮した出力を得ることができる。ただし、ＲＮＮの出力は交絡因子の影響を考慮されていない。

【0044】

本実施例の時系列データ処理部４０１は、タイムステップｔにおいて、タイムステップｔの介入内容及び要因と、タイムステップ（ｔ－１）の効果予測値とを入力として受け付ける。なお、ｔ＝０の場合、時系列データ処理部４０１は、ｔ＝０の介入内容及び要因のみが入力される。

【0045】

本明細書では、識別情報がｉである人のタイムステップｔの介入内容をＡ_ｔ ^ｉ、要因をＸ_ｔ ^ｉ、効果予測値をＹ＾_ｔ ^ｉと定義する。また、識別情報がｉである人を人（ｉ）と記載する。なお、Ａ＾及びＹ＾は数式及び図面のハット記号付きのＡ及びＹに対応する。

【0046】

時系列データ処理部４０１は、タイムステップｔにおいて、タイムステップｔの介入内容Ａ_ｔ ^ｉ、要因Ｘ_ｔ ^ｉ及びタイムステップ（ｔ－１）の効果予測値Ｙ＾_ｔ－１ ^ｉを用いて、出力値（特徴量）を算出する。本実施例の出力値はベクトルである。

【0047】

交絡因子調整部４０２は、より正確な介入効果の予測を実現するために、出力値に対して交絡因子の影響を削減する処理を行う。

【0048】

本実施例の交絡因子は、要因と過去に行った介入の効果の二種類がある。要因の影響に関しては、例えば、若い人は介入１を選択するケースが多いが、高齢者は介入２を選択するケースが多い場合、介入１と介入２に年齢の分布に偏りが存在するため、正確な効果を予測できない。なぜならば、得られた効果は介入によるものなのか、要因の偏りによるものなのかが分けられないためである。過去に行った介入の効果の影響に関しては、例えば、前回の介入で薬１が投薬された後、副作用が出た場合、薬１の選択確率は低くなる。そのため、次の介入において薬を選択する分布に偏りがあり、効果予測に影響を与える。

【0049】

交絡因子調整部４０２は、全ての介入を均等に選択できるように、分布の差異を小さくする処理を行い、分布のバランスを取れた特徴量を生成する。具体的には、交絡因子調整部４０２は、時系列データ処理部４０１が算出した出力値（ベクトル）を任意の次元の特徴量空間に写像することによって特徴量を算出する。

【0050】

予測器４０３は、交絡因子調整部４０２によって算出された特徴量を用いて、介入の効果予測値を算出する。予測器４０３は、例えば、ＮｅｕｒａｌＮｅｔｗｏｒｋ又は線形回帰モデルである。

【0051】

図５は、実施例１の学習部２００の機能構成の一例を示す図である。

【0052】

学習部２００は、時系列データ処理部４０１、交絡因子調整部４０２、予測器４０３、識別器５０１、演算器５０２、及び演算器５０３を含む。時系列データ処理部４０１、交絡因子調整部４０２、及び予測器４０３は、予測部２０１に含まれるものと同一である。学習部２００は、ＡｄｖｅｒｓａｒｉａｌＬｅａｒｎｉｎｇ等の手法を用いて、交絡因子調整部４０２、予測器４０３、及び識別器５０１を学習する。

【0053】

識別器５０１は、交絡因子調整部４０２によって算出された特徴量を入力として受け付け、次のタイムステップ（ｔ＋１）に人（ｉ）に行われる介入内容Ａ＾_ｔ＋１ ^ｉを予測する。識別器５０１は、ニューラルネットワーク等のモデルとして定義される。

【0054】

演算器５０３は、予測介入内容Ａ＾_ｔ＋１ ^ｉと、実際の介入内容Ａ_ｔ＋１ ^ｉとの誤差を評価するＩｍｂａｌａｎｃｅｌｏｓｓを算出する。Ｉｍｂａｌａｎｃｅｌｏｓｓを算出するためのＩｍｂａｌａｎｃｅｌｏｓｓ関数は式（１）で定義される。

【0055】

【数1】

【0056】

ここで、Ｇ_ｇは交絡因子調整部４０２の出力を表す関数であり、Ｇ_ｄは識別器５０１の出力を表す関数である。ｎは要因３０２のフィールド数（サンプル数）を表す。ＩＩは指示関数を表し、κは閾値を表し、εは誤差許容範囲を表し、Ｎはκを中心とした（Ａ_ｔ＋１ ^ｊ＋ε）範囲内のサンプル数を表す。

【0057】

複数種類の介入に対応するため、連続性を担保する必要がある。そこで、介入内容Ａ_ｔ＋１ ^ｉ及び介入内容Ａ_ｔ＋１ ^ｊの差が閾値κ以下又は閾値κ以上の場合、それぞれ異なる重みを介入内容予測誤差に乗算して、Ｉｍｂａｌａｎｃｅｌｏｓｓを算出する。ここで、介入内容予測誤差は、式（１）の対数の項を表す。

【0058】

学習部２００は、予測精度が高くなるように識別器５０１の学習を行い、一方、識別器５０１が識別できないように交絡因子調整部４０２の学習を行う。

【0059】

演算器５０２は、予測器４０３が算出した効果予測値Ｙ＾_ｔ－１ ^ｉと、実際の介入効果Ｙ_ｔ－１ ^ｉとの誤差を評価するＦａｃｔｕａｌｌｏｓｓを算出する。Ｆａｃｔｕａｌｌｏｓｓを算出するためのＦａｃｔｕａｌｌｏｓｓ関数は式（２）で定義される。

【0060】

【数2】

【0061】

ここで、Ｇ_ｙは予測器４０３の出力を表す関数である。

【0062】

学習部２００は、式（３）に示すように、全タイムステップのＩｍｂａｌａｎｃｅｌｏｓｓの総和及び全タイムステップのＦａｃｔｕａｌｌｏｓｓの総和から定義される損失関数が最小となるように各モデルの学習を行う。当該学習では、学習部２００は、特徴量に基づく介入内容の予測精度が高くなるように識別器５０１を更新し、識別器５０１の介入内容を予測できないように交絡因子調整部４０２を更新する。

【0063】

【数3】

【0064】

ここで、αはＦａｃｔｕａｌｌｏｓｓ及びＩｍｂａｌａｎｃｅｌｏｓｓを調整するパラメータである。

【0065】

損失関数を用いた学習によって、交絡因子調整部４０２が生成した特徴量の分布の差異を小さくすることができる。すなわち、交絡因子の影響を削減できる。これによって、介入効果を精度よく予測できる。

【0066】

図６は、実施例１の学習部２００が実行する学習処理の一例を説明するフローチャートである。

【0067】

学習部２００は、情報端末１１０又は入力装置１０５を介して学習実行指示を受け付けた場合、学習処理を実行する。

【0068】

学習部２００は、学習データＤＢ２１０から学習データを取得する（ステップＳ１０１）。ここでは、複数の学習データから構成される学習データセットが取得されるものとする。

【0069】

次に、学習部２００は、学習データに含まれるデータ列のループ処理を開始する（ステップＳ１０２）。学習部２００は、時系列順にデータ列を選択し、以下の処理を繰り返し実行する。

【0070】

学習部２００は、データ列を用いて特徴量を算出する（ステップＳ１０３）。具体的には、学習部２００は、データ列に対応する介入内容及び要因と、時系列が一つ前のデータ列を用いた効果予測値とを時系列データ処理部４０１に入力し、また、時系列データ処理部４０１によって算出された出力値を交絡因子調整部４０２に入力する。学習部２００は、時系列と対応づけて、特徴量をワークエリアに保存する。

【0071】

学習部２００は、特徴量を識別器５０１に入力し、識別器５０１から出力された予測介入内容Ａ＾_ｔ＋１ ^ｉと、時系列が一つ先のデータ列の介入内容Ａ_ｔ＋１ ^ｉとに基づいて、Ｉｍｂａｌａｎｃｅｌｏｓｓを算出する（ステップＳ１０４）。学習部２００は、時系列と対応づけてＩｍｂａｌａｎｃｅｌｏｓｓをワークエリアに保存する。

【0072】

学習部２００は、Ｉｍｂａｌａｎｃｅｌｏｓｓ関数を用いた逆誤差伝搬法等に基づいて識別器５０１及び交絡因子調整部４０２を更新し、更新した交絡因子調整部４０２を用いて特徴量を更新する（ステップＳ１０５）。

【0073】

学習部２００は、更新した特徴量を予測器４０３に入力し、予測器４０３から出力された介入の効果予測値Ｙ＾_ｔ ^ｉと、データ列の介入効果Ｙ_ｔ ^ｉとに基づいて、Ｆａｃｔｕａｌｌｏｓｓを算出する（ステップＳ１０６）。学習部２００は、時系列と対応づけてＦａｃｔｕａｌｌｏｓｓをワークエリアに保存する。

【0074】

学習部２００は、学習データに含まれる全てのデータ列について処理が完了したか否かを判定する（ステップＳ１０７）。

【0075】

学習データに含まれる全てのデータ列について処理が完了していない場合、学習部２００は、ステップＳ１０２に戻り、同様の処理を実行する。

【0076】

学習データに含まれる全てのデータ列について処理が完了した場合、学習部２００は、式（３）に示す損失関数の値を算出する（ステップＳ１０８）。

【0077】

学習部２００は、損失関数の値に基づいて、交絡因子調整部４０２、予測器４０３、及び識別器５０１を更新する（ステップＳ１０９）。

【0078】

学習部２００は、学習を終了するか否かを判定する（ステップＳ１１０）。例えば、学習データセットの全ての学習データについて処理が完了した場合、学習部２００は学習を終了する判定する。また、更新回数が閾値より大きい場合、学習部２００は学習を終了すると判定する。また、学習部２００は、評価用のユーザデータ２２０の介入効果の予測精度が閾値より高い場合、学習部２００は学習を終了すると判定する。

【0079】

学習を終了しないと判定された場合、学習部２００は、ステップＳ１０１に戻り、同様の処理を実行する。

【0080】

学習を終了すると判定された場合、学習部２００は処理を終了する。

【0081】

図７は、実施例１の予測部２０１が実行する予測処理の一例を説明するフローチャートである。

【0082】

予測部２０１は、情報端末１１０又は入力装置１０５を介して、ユーザデータ２２０を含む予測実行指示を受け付けた場合、予測処理を実行する。

【0083】

予測部２０１は、モデルＤＢ２１１から、時系列データ処理部４０１、交絡因子調整部４０２、及び予測器４０３のモデルを取得する（ステップＳ２０１）。

【0084】

予測部２０１は、ユーザデータ２２０に含まれるデータ列のループ処理を開始する（ステップＳ２０２）。予測部２０１は、時系列順にデータ列を選択し、以下の処理を繰り返し実行する。

【0085】

予測部２０１は、データ列を用いて特徴量を算出する（ステップＳ２０３）。具体的には、予測部２０１は、データ列に対応する介入内容及び要因と、時系列が一つ前のデータ列を用いた効果予測値とを時系列データ処理部４０１に入力し、また、時系列データ処理部４０１によって算出された出力値を交絡因子調整部４０２に入力する。予測部２０１は、時系列と対応づけて、特徴量をワークエリアに保存する。

【0086】

予測部２０１は、特徴量を予測器４０３に入力することによって介入効果予測値を算出する（ステップＳ２０４）。

【0087】

予測部２０１は、ユーザデータ２２０に含まれる全てのデータ列について処理が完了したか否かを判定する（ステップＳ２０５）。

【0088】

ユーザデータ２２０に含まれる全てのデータ列について処理が完了していない場合、予測部２０１は、ステップＳ２０２に戻り、同様の処理を実行する。

【0089】

ユーザデータ２２０に含まれる全てのデータ列について処理が完了した場合、予測部２０１は、各データ列に対応する介入効果予測値を含む予測介入結果２２１を生成し、出力する（ステップＳ２０６）。その後、予測部２０１は予測処理を終了する。

【0090】

ここで、予測部２０１が提示する画面について説明する。図８は、実施例１の予測部２０１が提示する画面の一例を示す図である。

【0091】

予測部２０１は、ユーザに対して画面８００を提示する。画面８００は、介入内容入力欄８０１及び介入効果表示欄８０２を含む。

【0092】

介入内容入力欄８０１には、介入パターンを入力するパターン設定欄８１０がタブ形式で表示される。パターン設定欄８１０は、設定テーブル８１１、追加ボタン８１２、及び予測ボタン８１３を含む。設定テーブル８１１は、介入内容を設定するためのテーブルであり、介入の種類、量、及びタイミングを含むエントリを格納する。追加ボタン８１２は、設定テーブル８１１にエントリを追加するための操作ボタンである。予測ボタン８１３は、予測処理の実行を指示するための操作ボタンである。予測ボタン８１３が操作された場合、現在までの時系列データと、設定テーブル８１１の情報とを含むユーザデータ２２０が予測部２０１に入力される。

【0093】

なお、図８のパターン設定欄８１０とは異なる形式で、介入内容を設定してもよい。例えば、プルダウン形式で介入の種類を表示し、量及びタイミングを調整するためのコントロールバーを表示する方法が考えられる。

【0094】

介入効果表示欄８０２は、現在から過去の効果の推移及び介入効果の推移を表示する欄である。介入効果表示欄８０２には介入効果の推移を示すグラフが、介入パターンごとに表示される。図８では、時刻ｔ_１に介入１を行う介入パターン１、現在及び時刻ｔ_２に介入２を行う介入パターン２、及び介入を行わない介入パターン３の各々の介入効果の推移が表示されている。

【0095】

実施例１のシステムは、交絡因子の影響が低減され、かつ、継続的に複数種類の介入を人に行う場合の効果を高い精度で予測できる。

【0096】

介入内容入力欄８０１の入力内容が更新された場合、介入効果表示欄８０２の表示内容も更新される。なお、特定の介入パターンの効果推移のみを表示するようにしてもよい。

【実施例0097】

実施例２のシステムは、介入効果予測値が修正された場合、再度、予測を行う。以下、実施例１との差異を中心に実施例２について説明する。

【0098】

実施例２のシステムの構成は実施例１と同一である。実施例２の学習部２００及び予測部２０１の機能構成は実施例１と同一である。実施例２の学習部２００が実行する処理は実施例１と同一である。

【0099】

実施例２では、予測部２０１が実行する予測処理が一部異なる。図９は、実施例２の予測部２０１が実行する予測処理の一例を説明するフローチャートである。図１０は、実施例２の予測部２０１が提示する画面の一例を示す図である。

【0100】

ステップＳ２０１からステップＳ２０６の処理は実施例１と同様である。ステップＳ２０６の処理の後、予測部２０１は、画面を提示して、ユーザからの操作を受け付ける（ステップＳ２５１）。ここで、図１０を用いて予測部２０１が提示する画面について説明する。

【0101】

予測部２０１は、ユーザに対して画面１０００を提示する。画面１０００は、修正欄１００１及び介入効果表示欄１００２を含む。介入効果表示欄１００２は、介入効果表示欄８０２と同様の欄である。

【0102】

修正欄１００１は、修正設定テーブル１０１１、追加ボタン１０１２、予測ボタン１０１３、及び終了ボタン１０１４を含む。修正設定テーブル１０１１は、介入効果予測値の修正内容を設定するためのテーブルであり、タイミング及び効果を含むエントリを格納する。追加ボタン１０１２は、修正設定テーブル１０１１にエントリを追加するための操作ボタンである。予測ボタン１０１３は、再度、予測処理の実行を指示するための操作ボタンである。予測ボタン１０１３が操作された場合、修正内容が予測部２０１に入力される。終了ボタン１０１４は、予測処理を終了するための操作ボタンである。

【0103】

なお、図１０の修正欄１００１とは異なる形式で、修正内容を設定してもよい。例えば、修正ボタンを表示し、修正ボタンが操作されて場合、介入効果表示欄１００２に表示されるグラフに、修正可能なポイントを表示する。ユーザは、グラフに表示されたポイントをマウス等で操作することによって介入効果予測値を修正する。

【0104】

以上が画面の説明である。図９の説明に戻る。

【0105】

予測部２０１は、画面１０００を介して受け付けた操作が、修正操作であるか否かを判定する。

【0106】

受け付けた操作が終了操作である場合、予測部２０１は予測処理を終了する。

【0107】

受け付けた操作が修正操作である場合、予測部２０１は、新たな予測に使用するデータ列を生成し（ステップＳ２５３）、その後ステップＳ２０２に戻る。例えば、予測部２０１は、修正された介入効果予測値を反映した、データ列を生成する。

【0108】

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。

【0109】

また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、光ディスク、光磁気ディスク、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどが用いられる。

【0110】

また、本発明に記載の機能を実現するプログラムコードは、例えば、アセンブラ、Ｃ／Ｃ＋＋、ｐｅｒｌ、Ｓｈｅｌｌ、ＰＨＰ、Ｐｙｔｈｏｎ、Ｊａｖａ（登録商標）等の広範囲のプログラム又はスクリプト言語で実装できる。

【0111】

さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はＣＤ－ＲＷ、ＣＤ－Ｒ等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。

【0112】

上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。

IP Force 特許公報掲載プロジェクト 2022.1.31 β版