IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

7634464介入効果分析システム、及び介入効果分析方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-02-13
(45)【発行日】2025-02-21
(54)【発明の名称】介入効果分析システム、及び介入効果分析方法
(51)【国際特許分類】
   G16H 20/00 20180101AFI20250214BHJP
   G16H 10/00 20180101ALI20250214BHJP
   G06Q 50/22 20240101ALI20250214BHJP
【FI】
G16H20/00
G16H10/00
G06Q50/22
【請求項の数】 9
(21)【出願番号】P 2021189264
(22)【出願日】2021-11-22
(65)【公開番号】P2023076082
(43)【公開日】2023-06-01
【審査請求日】2024-02-19
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110001678
【氏名又は名称】藤央弁理士法人
(72)【発明者】
【氏名】長谷川 泰隆
(72)【発明者】
【氏名】伴 秀行
(72)【発明者】
【氏名】森池 哲也
(72)【発明者】
【氏名】尾崎 隼一
(72)【発明者】
【氏名】堀江 智
【審査官】森田 充功
(56)【参考文献】
【文献】特開2014-225177(JP,A)
【文献】特開2021-135930(JP,A)
【文献】特開2019-192065(JP,A)
【文献】特開2021-082092(JP,A)
【文献】特開2004-341611(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00-80/00
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
複数の介入施策の効果を分析する介入効果分析システムであって、
所定の処理を実行する演算装置と、データが入力される入力部と、前記演算装置がアクセス可能な記憶装置とを備え、
前記入力部は、各々に前記介入施策の一つが実施された複数の介入群の介入データと、前記介入施策が実施されない非介入群の非介入データの入力を受け、
前記演算装置は、
複数の機械学習法を用いて、前記複数の介入データと前記非介入データのそれぞれに含まれる背景情報から、前記複数の介入データと前記非介入データのそれぞれで傾向スコアを計算し、
前記複数の介入データ又は前記非介入データの一つを基準介入群に設定し、
前記設定された基準介入群の個人のデータと、前記複数の介入データ及び非介入データから、前記計算された傾向スコアの差が小さい複数の個人のペアデータを生成し、
前記複数のペアデータの背景情報の差を示す標準化差を計算し、
前記基準介入群、他の介入群及び非介入群のデータの傾向スコアを複数の方法で計算し、
前記基準介入群のデータと傾向スコアが類似するデータを他の介入群及び非介入群から選択して、傾向スコアの計算方法毎にペアデータを作成し、
前記ペアデータの背景情報について計算された標準化差の代表値が最小のペアデータを選定して、前記選定されたペアデータから介入効果を計算して、前記複数の介入データ又は前記非介入データの二つと前記基準介入群との比較分析結果を出力することを特徴とする介入効果分析システム。
【請求項2】
請求項1に記載の介入効果分析システムであって、
前記演算装置は、予め定められたポリシーに従って、前記基準介入群を設定することを特徴とする介入効果分析システム。
【請求項3】
請求項2に記載の介入効果分析システムであって、
前記演算装置は、比較対象の群の中で他の群との傾向スコアの分布の重なりが最も大きい群を基準介入群として設定することを特徴とする介入効果分析システム。
【請求項4】
請求項1に記載の介入効果分析システムであって、
前記演算装置は、比較対象となり得る介入群及び非介入群の傾向スコアを比較可能に出力し、ユーザに基準介入群の選択を促すことを特徴とする介入効果分析システム。
【請求項5】
請求項1に記載の介入効果分析システムであって、
前記演算装置は、介入効果を評価する指標毎に、傾向スコアを用いない単純比較の標準化差と、特定の傾向スコアを用いた標準化差とを比較可能に出力することを特徴とする介入効果分析システム。
【請求項6】
請求項1に記載の介入効果分析システムであって、
前記演算装置は、表示したい介入効果指標を選択する介入効果指標選択領域と、介入群と非介入群の人数差を表示する人数表示領域と、介入効果をグラフで表示するグラフ表示領域と、介入効果を数値で表示する数値表示領域とを含む介入効果表示画面を表示するためのデータを生成することを特徴とする介入効果分析システム。
【請求項7】
請求項1に記載の介入効果分析システムであって、
前記演算装置は、前記背景情報をグループ分けして、前記グループ毎に介入効果を計算することを特徴とする介入効果分析システム。
【請求項8】
請求項1に記載の介入効果分析システムであって、
前記介入施策は、医療、健康診断又は介護に関する健康又は生活の質を向上するための行為であることを特徴とする介入効果分析システム。
【請求項9】
計算機が複数の介入施策の効果を分析する介入効果分析方法であって、
前記計算機は、所定の処理を実行する演算装置と、データが入力される入力部と、前記演算装置がアクセス可能な記憶装置とを有し、
前記方法は、
前記入力部が、各々に前記介入施策の一つが実施された複数の介入群の介入データと、前記介入施策が実施されない非介入群の非介入データの入力を受け、
前記演算装置が、複数の機械学習法を用いて、前記複数の介入データと前記非介入データのそれぞれに含まれる背景情報から、前記複数の介入データと前記非介入データのそれぞれで傾向スコアを計算し、
前記演算装置が、前記複数の介入データ又は前記非介入データの一つを基準介入群に設定し、
前記演算装置が、前記設定された基準介入群の個人のデータと、前記複数の介入データ及び非介入データから、前記計算された傾向スコアの差が小さい複数の個人のペアデータを生成し、
前記演算装置が、前記複数のペアデータの背景情報の差を示す標準化差を計算し、
前記演算装置が、前記計算された標準化差に基づいて、前記複数のペアデータから介入効果を計算して、前記複数の介入データ又は前記非介入データの二つと前記基準介入群との比較分析結果を出力することを特徴とする介入効果分析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、介入施策の効果を分析する介入効果分析システムに関する。
【背景技術】
【0002】
自治体では、住民の健康寿命の延伸や社会保障費の適正化のため、健診事業や保健事業や介護予防事業などの介入施策の効果を分析することが求められている。効果的かつ効率的な介入施策を実施するために、自治体に蓄積されたデータを利活用し、介入施策の有効/無効の判断や、有効な事業へ予算を重点的に配分し、持続可能な社会保障サービスの実現が重要である。
【0003】
本技術分野の背景技術として、以下の先行技術がある。特許文献1(特開2019-192065号公報)には、対象者に対する介護介入効果を検証するための装置であって、複数の対象者に関する過去のデータに基づいて、前記複数の対象者のうち類似する一部の対象者によって構成されるグループを生成する手段を備え、前記グループを構成する前記一部の対象者を、介護介入を行う第1のサブグループと、介護介入を行わない第2のサブグループとに分割する手段を備え、特定期間の経過後において、前記第1のサブグループ、及び、前記第2のサブグループそれぞれの所定の評価指標の値を含む検証用データを受け付ける手段を備え、前記第1のサブグループ及び第2のサブグループのそれぞれの前記所定の評価指標の値の比較結果に基づいて、介護介入の効果を判定する手段を備える介護介入効果検証装置が記載されている。
【0004】
特許文献2(特開2014-225177号公報)には、プログラムを実行するプロセッサと、前記プログラムを格納するメモリとを有し、前記プログラムを実行することによって保健事業の効果を分析する分析システムであって、加入者の医療費、介入サービスの提供の有無を示す介入情報、及び前記介入サービスの開始日が入力される入力部と、前記介入サービスの提供前の前記医療費と前記介入情報との関係を分析し、前記介入サービスの提供前の医療費から、前記介入サービスが提供されている確率を示す介入群の傾向スコアと、前記介入サービスが提供されていない確率を示す非介入群の傾向スコアとを算出する傾向スコア算出部と、前記介入群の傾向スコアの逆数を前記介入サービスの提供前及び提供後の前記介入群の医療費に乗じることによって、前記介入サービスの提供前及び提供後の前記介入群の調整医療費を算出し、前記非介入群の傾向スコアの逆数を前記介入サービスの提供前及び提供後の前記非介入群の医療費に乗じることによって、前記介入サービスの提供前及び提供後の前記非介入群の調整医療費を算出する調整医療費算出部と、を有することを特徴とする分析システムが記載されている。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2019-192065号公報
【文献】特開2014-225177号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
介入有無以外に年齢や医療機関への受診状況などの背景情報が異なる集団を比較しても、介入施策の効果の適正な評価が困難であり、傾向スコアを用いて集団の分布を等しくして、施策有無のみが異なる集団を作り、この集団を追跡して施策効果を適正な評価が求められている。
【0007】
特許文献1に記載された技術では、介護介入前の対象者の背景情報のばらつきが均等になるように、介護介入群と介護非介入群に分け、介入後の介護度、介護費などへの効果を検証している。しかし、特許文献1に記載された技術は、将来方向に介入群と非介入群を分けるものであり、介入実施済みの過去データへの適用は困難である。また、背景情報のばらつきを均等にする方法について特許文献1には具体的な記載がない。
【0008】
また、特許文献2に記載された技術では、介入の効果を分析する方法として、傾向スコアを用いて介入群と非介入群の背景情報(共変量)を調整し、比較し、分析している。ここで傾向スコアとは、背景情報を一つに纏めたスコアであり、背景情報から算出される介入確率である。しかし、特許文献2に記載された技術では、単一の傾向スコアを用いて背景情報を調整して介入効果を分析するが、安定的に背景情報を調整することは考慮されていない。
【0009】
さらに、前述した先行技術では、介入群と非介入群の2群間で背景情報を揃えることは考慮されているが、複数の介入群を含む3以上の群間で背景情報を揃えることは考慮されていない。
【0010】
本発明は、介護・医療・保健事業・介護予防データから、保健事業や介護予防事業などの介入効果を適正に分析することを目的とする。
【課題を解決するための手段】
【0011】
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、複数の介入施策の効果を分析する介入効果分析システムであって、所定の処理を実行する演算装置と、データが入力される入力部と、前記演算装置がアクセス可能な記憶装置とを備え、前記入力部は、各々に前記介入施策の一つが実施された複数の介入群の介入データと、前記介入施策が実施されない非介入群の非介入データの入力を受け、前記演算装置は、複数の機械学習法を用いて、前記複数の介入データと前記非介入データのそれぞれに含まれる背景情報から、前記複数の介入データと前記非介入データのそれぞれで傾向スコアを計算し、前記複数の介入データ又は前記非介入データの一つを基準介入群に設定し、前記設定された基準介入群の個人のデータと、前記複数の介入データ及び非介入データから、前記計算された傾向スコアの差が小さい複数の個人のペアデータを生成し、前記複数のペアデータの背景情報の差を示す標準化差を計算し、前記基準介入群、他の介入群及び非介入群のデータの傾向スコアを複数の方法で計算し、前記基準介入群のデータと傾向スコアが類似するデータを他の介入群及び非介入群から選択して、傾向スコアの計算方法毎にペアデータを作成し、前記ペアデータの背景情報について計算された標準化差の代表値が最小のペアデータを選定して、前記選定されたペアデータから介入効果を計算して、前記複数の介入データ又は前記非介入データの二つと前記基準介入群との比較分析結果を出力することを特徴とする。
【発明の効果】
【0012】
本発明の一態様によれば、介護・医療・保健事業・介護予防データから、保健事業や介護予防事業などの介入効果を適正に分析できる。特に、3以上群を比較できるので、介入施策の有効性や、複数の介入施策の優劣が分かる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。
【図面の簡単な説明】
【0013】
図1】本発明を適用した介入効果分析システムによる処理の概念を示す図である。
図2】実施例1の介入効果分析システムの構成を示すブロック図である。
図3】実施例1の介入データ記憶部の構成例を示す図である。
図4】実施例1の介入データ記憶部の構成例を示す図である。
図5】実施例1の非介入データ記憶部の構成例を示す図である。
図6A】実施例1の傾向スコア記憶部の構成例を示す図である。
図6B】実施例1の傾向スコア記憶部の構成例を示す図である。
図6C】実施例1の傾向スコア記憶部の構成例を示す図である。
図7】実施例1のマッチングデータ記憶部の構成例を示す図である。
図8】実施例1のマッチングデータ記憶部の構成例を示す図である。
図9】実施例1の標準化差の形式例を示す図である。
図10】実施例1のマッチングデータ抽出部による処理を示す図である。
図11】実施例1の介入効果分析処理のフローチャートである。
図12】実施例1の機械学習法設定画面の例を示す図である。
図13】実施例1の背景情報設定画面の例を示す図である。
図14】実施例1の基準介入設定画面の例を示す図である。
図15】実施例1の基準介入設定画面の別の例を示す図である。
図16】実施例1の介入効果指標設定画面の例を示す図である。
図17】実施例1の介入効果表示画面の例を示す図である。
図18】実施例2の介入効果分析システムの構成を示すブロック図である。
図19】実施例2の介入効果分析処理のフローチャートである。
図20】実施例2のペアデータ作成部による処理を示す図である。
図21】実施例2のペアデータ抽出部による処理を示す図である。
図22】実施例3の介入効果分析システムの構成を示すブロック図である。
図23】実施例3の背景情報グループ設定画面の例を示す図である。
図24】実施例3の介入効果表示画面の例を示す図である。
【発明を実施するための形態】
【0014】
図1は、本発明を適用した介入効果分析システムによる処理の概念を示す図である。
【0015】
介護・医療・保健事業を受けた人(例えば1000人)のデータから介入効果を分析するために、種類が違う介入1を受けた群と介入2を受けた群といずれの介入も受けていない非介入群を抽出する。抽出された介入1群、介入2群、非介入群は、背景情報(性別、年齢、医療・介護状況など)の背景情報の分布が異なっている。各群は、人数は異なってもよいが、背景情報が異なると、その後の変化が介入の効果なのか、背景情報が異なるからなのかが分からない。
【0016】
このため、介入1群、介入2群、非介入群から、傾向スコアマッチングデータを用いて、複数群(複数の介入群と非介入群)において背景情報が揃っている人を抽出して、介入効果が比較可能な群を作成する。そして、各群に含まれる人の健診結果(検査値)、診断結果(疾病発生の有無)、医療費、介護度、介護費などを追跡して、介入実施後の健康状態の変化を比較すると、複数の保健事業や介護予防事業などの介入の効果を正確に分析できる。
【0017】
<実施例1>
図2は、実施例1の介入効果分析システムの構成を示すブロック図である。
【0018】
実施例1の介入効果分析システムは、分析端末100及びデータベース130を有する。
【0019】
分析端末100は、入力部102、出力部103、プロセッサ(CPU)104、メモリ105及び記憶媒体106を有する計算機である。
【0020】
入力部102は、マウス、キーボードなどのヒューマンインターフェースであり、分析端末100への入力を受け付ける。出力部103は、分析端末100による演算結果を出力するディスプレイやプリンタである。入力部102及び出力部103は、記憶媒体やネットワークを介してデータを入出力するインターフェースを含んでもよい。記憶媒体106は、分析端末100による介入効果分析処理を実行する各種プログラム、及び介入効果分析処理の実行結果等を格納する記憶装置であり、例えば、不揮発性記憶媒体(磁気ディスクドライブ、不揮発性メモリ等)で構成される。
【0021】
メモリ105は、不揮発性の記憶素子であるROM及び揮発性の記憶素子であるRAMを含む。ROMは、不変のプログラム(例えば、BIOS)などを格納する。RAMは、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶素子であり、プロセッサ104が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。すなわち、メモリ105には、記憶媒体106に格納されているプログラムが展開される。
【0022】
プロセッサ104は、メモリ105にロードされたプログラムを実行する演算装置であり、例えば、CPU、GPUなどである。以下に説明する処理及び演算は、プロセッサ104が実行する。なお、プロセッサ104がプログラムを実行して行う処理の一部を、他の演算装置(例えば、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)などのハードウェア)で実行してもよい。
【0023】
プロセッサ104によって実行されるプログラムは、リムーバブルメディア(CD-ROM、フラッシュメモリなど)又はネットワークを介して分析端末100に提供され、非一時的記憶媒体である不揮発性記憶装置に格納される。このため、分析端末100は、リムーバブルメディアを読み込むインターフェースを有してもよい。
【0024】
本実施例の介入効果分析システムは、一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、同一の計算機上で別個のスレッドで動作してもよく、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。
【0025】
記憶媒体106は、機械学習法設定部111、背景情報設定部112、傾向スコア計算部113、マッチングデータ作成部114、標準化差計算部115、マッチングデータ抽出部116、介入効果指標設定部117、介入効果計算部118及び基準介入設定部119を実現するプログラムを格納する。
【0026】
機械学習法設定部111は、介入効果分析に使用する機械学習法を設定し、選択結果を機械学習法記憶部133に格納する。
【0027】
背景情報設定部112は、介入効果分析に使用する背景情報を設定し、選択された背景情報を背景情報記憶部134に格納する。背景情報は、介入有無に対する共変量となり得る情報であって、背景情報設定画面(図13)に選択肢として示されるように、対象者の基本情報(住民基本台帳の性別、年齢、住所など)、介護情報(要介護度、介護費など)、医療情報(疾病の有無、疾病別医療費など)、健診情報(検査値、問診結果など)である。
【0028】
傾向スコア計算部113は、機械学習法設定部111で選択された機械学習法による機械学習モデルを用いて傾向スコアを計算し、計算結果を傾向スコア記憶部135に格納する。傾向スコアは、背景情報から求められる介入有りの確率(介入確率)であり、背景情報を説明変数とし介入確率を目的変数とした機械学習モデルを用いて計算される。
【0029】
マッチングデータ作成部114は、傾向スコアを用いて背景情報が類似するデータが組み合わされたマッチングデータを作成し、マッチングデータ記憶部136に格納する。
【0030】
標準化差計算部115は、マッチング結果を評価して、標準化差を計算する。標準化差は、各マッチングデータにおける、ある介入群と他介入群(非介入群を含む)の背景情報の差を示す標準化された値である。標準化差は、標準化効果量とも呼ばれる。
【0031】
マッチングデータ抽出部116は、標準化差によるマッチングデータの評価結果によって、最も良い機械学習法を選択する。
【0032】
介入効果指標設定部117は、ユーザが選択した介入効果指標を介入効果表示画面(図17)に表示する介入効果指標に設定する。介入効果指標は、介入の効果を定量的に評価するための数値であって、疾病の有無、疾病発症率、疾病別の医療費、介護費、介護度、検査値、問診結果などを用いるとよい。
【0033】
介入効果計算部118は、マッチングデータの評価結果によって選択された機械学習法におけるマッチングデータから介入効果指標を計算し、介入効果表示画面(図17)の表示データを生成する。
【0034】
基準介入設定部119は、基本介入設定画面(図14図15)を表示して、ユーザが選択した基準介入を設定する。
【0035】
データベース130は、介入データ記憶部131、非介入データ記憶部132、機械学習法記憶部133、背景情報記憶部134、傾向スコア記憶部135及びマッチングデータ記憶部136から構成される。
【0036】
介入データ記憶部131は、複数の介入群の人の背景情報のデータを格納する。介入データ記憶部131は、図3図4に示すように、個人ID1311、対象者の基本情報1312、介護情報1313、医療情報1314、健診情報1315及び介入情報1316を含む。個人ID1311は、一人の住民を示す一意の識別子である。対象者の基本情報1312は、対象者の性別、年齢、住所などであり、住民基本台帳から取得できる。介護情報1313は、要介護度、介護費などの介護に関連する情報である。医療情報1314は、疾病の有無、疾病別医療費などの医療に関する情報である。健診情報1315は、検査値、問診結果などの健康診断の結果の情報である。介入情報1316は、介入の有無、すなわち、保健事業(健診・保健指導など)、介護予防活動や医療行為など、医療、健康診断又は介護に関する健康又は生活の質(QOL)を向上するための介入施策を受けたかの情報である。背景情報のうち、介護情報1313、医療情報1314及び健診情報1315は経時的に変化することから、年毎(T年度、T+1年度…)に記録される。
【0037】
非介入データ記憶部132は、非介入群の人の背景情報のデータを格納する。非介入データ記憶部132は、図5に示すように、介入データ記憶部131と同じ項目の、個人ID1321、対象者の基本情報1322(住民基本台帳の性別、年齢、住所など)、介護情報1323(要介護度、介護費など)、医療情報1324(疾病の有無、疾病別医療費など)、健診情報1325(検査値、問診結果など)及び介入情報1326(介入の有無)を含む。背景情報のうち、介護情報1323、医療情報1324及び健診情報1325は経時的に変化することから、年毎(T年度、T+1年度…)に記録される。
【0038】
傾向スコア記憶部135は、複数の機械学習法で計算された介入群と非介入群の傾向スコアを格納する。傾向スコア記憶部135は、図6A図6B図6Cに示すように、介入データ記憶部131及び非介入データ記憶部132と同じ項目の、個人ID1351、対象者の基本情報1352(住民基本台帳の性別、年齢、住所など)、介護情報1353(要介護度、介護費など)、医療情報1354(疾病の有無、疾病別医療費など)、健診情報1355(検査値、問診結果など)及び介入情報1356(介入の有無)を含む。さらに、傾向スコア記憶部135は、複数の機械学習法による機械学習モデルを用いて計算された介入群と非介入群の傾向スコア1357を含む。本実施例では、図6A図6B図6Cに示すように、ロジスティック回帰分析、ニューラルネットワークなどの方法を用いて傾向スコアを計算する。
【0039】
マッチングデータ記憶部136は、ある機械学習法によって計算された傾向スコアに基づくマッチングの結果を格納する。マッチングデータ記憶部136は、図7図8に示すように、傾向スコア記憶部135と同じ項目の、個人ID1361、対象者の基本情報1362(住民基本台帳の性別、年齢、住所など)、介護情報1363(要介護度、介護費など)、医療情報1364(疾病の有無、疾病別医療費など)、健診情報1365(検査値、問診結果など)、介入情報1366(介入の有無)及び傾向スコア1367を含む。さらに、マッチングデータ記憶部136は、傾向スコアが近い介入群のデータと非介入群のデータとの間のマッチング情報1368を含む。図では、マッチング情報1368をデータテーブルの行を関連付ける線で表したが、相手方の個人IDを記録するカラムを設けたり、介入群のデータと非介入群のデータとを関連付けるテーブルに記録してもよい。
【0040】
背景情報が同じでも、機械学習法毎によって傾向スコアが異なり、マッチングペアが異なる。このため、マッチングデータ記憶部136は、傾向スコアの計算方法毎(図7図8)に作成するとよい。
【0041】
図9は、標準化差計算部115によって計算される標準化差の形式例を示す図である。標準化差は、基準介入設定部119が設定した基準介入群(本実施例では介入1)と他介入群(介入2、介入3、…、非介入群)間の背景情報の標準化された差を示しており、図示するテーブル形式で、介入効果分析システムの内部変数としてメモリ105又は記憶媒体106に格納される。標準化差は、マッチングデータ記憶部136と同じ項目の、対象者の基本情報1402(住民基本台帳の性別、年齢、住所など)、介護情報1403(要介護度、介護費など)、医療情報1404(疾病の有無、疾病別医療費など)及び健診情報1405(検査値、問診結果など)などの指標毎に計算される。さらに、標準化差は、傾向スコアの計算方法1401、標準化差の代表値1406を含む。標準化差の代表値1406は、各傾向スコアの計算方法におけるデータペアの標準化差を統計処理した値である。標準化差の統計処理には、平均値、最大値、最小値、中央値など様々な統計値を採用できる。
【0042】
なお、図9に示す指標毎の標準化差を出力部103から出力し、画面に表示してもよい。例えば、指標毎に、傾向スコアを用いない単純比較の標準化差と、特定の傾向スコアを用いた標準化差とをグラフ形式で表示してもよい。このような画面表示によって、背景情報のバランスを確認できる。
【0043】
図11は、実施例1の介入効果分析処理のフローチャートである。
【0044】
まず、入力部102が介入データ及び非介入データの入力を受け、介入データ記憶部131及び非介入データ記憶部132に格納する(S101)。
【0045】
次に、機械学習法設定部111が、機械学習法設定画面(図12)を表示し、機械学習法設定画面において選択された機械学習法を介入効果分析に使用する機械学習法として設定し、選択結果を機械学習法記憶部133に格納する(S102)。
【0046】
次に、背景情報設定部112が、背景情報設定画面(図13)を表示し、背景情報設定画面において選択された背景情報を介入効果分析に使用する背景情報(共変量)として設定し、選択結果を背景情報記憶部134に格納する(S103)。
【0047】
次に、基準介入設定部119が、基本介入設定画面(図14図15)を表示して、ユーザが選択した基準介入を設定する(S104)。なお、基準介入設定部119は、基本介入設定画面示して、ユーザに基準介入の選択を求めることなく、予め定められたポリシーに従って、基準介入を選択してもよい。例えば、比較対象の群の中で傾向スコアの分布の他の群との重なり(図15に示す被包含率)が最も大きい群を基準介入として選択したり、評価対象の介入を実施している群を基準介入に選択したり、傾向スコアの分布が小さい群を基準介入に選択してもよい。
【0048】
次に、傾向スコア計算部113が、機械学習法設定部111で選択された機械学習法による機械学習モデルを用いて、背景情報から基準介入確率を示す傾向スコアを計算し、計算結果を傾向スコア記憶部135に格納する(S105)。ステップS102で複数の機械学習法が選択されていれば、選択された機械学習法の一つによる機械学習モデルを用いて傾向スコアが計算される。
【0049】
次に、マッチングデータ作成部114が、計算された傾向スコアに対する多群のマッチングデータを作成し、マッチングデータ記憶部136に格納する(S106)。例えば、介入群と非介入群とで傾向スコアが近いデータをマッチングしてデータペアを作成する。傾向スコアが複数計算されている場合、傾向スコア毎に異なるデータペアを含むマッチングデータが作成される。
【0050】
次に、標準化差計算部115が、マッチング結果を評価して、標準化差を計算し(S107)、計算された標準化差の代表値を計算する(S108)。例えば、標準化差計算部115は、マッチングされた基準介入群と他介入群のデータペアの間で年齢の差を計算し、計算された年齢差の平均値を年齢差の標準偏差で除して標準化差を計算する。標準化差によって、特定の背景情報(例えば年齢)の差の大きさを知ることができ、複数の背景情報を単位や値の大きさを考慮せずに比較できる。標準化差計算部115が計算した標準化差は、図9に示すテーブル形式で、介入効果分析システムの内部変数としてメモリ105又は記憶媒体106に格納される。そして、標準化差計算部115は、各傾向スコアの計算方法におけるデータペアの標準化差を統計処理して、標準化差の代表値を計算する。標準化差の統計処理には、平均値、最大値、最小値、中央値など様々な統計値を代表値として採用できる。傾向スコアが複数計算されている場合、傾向スコア毎に異なる標準化差及び標準化差の代表値が計算される。
【0051】
ステップS102で複数の機械学習法が選択されていれば、選択された機械学習法ごとにS105~S108の処理が繰り返し実行され、機械学習法ごと標準化差及び標準化差の代表値が計算される。
【0052】
次に、マッチングデータ抽出部116が、標準化差によるマッチングデータの評価結果によって、最も良い機械学習法を選択する。例えば、図10に示すように、いずれかの代表値が最小の傾向スコアの計算方法を選択し、当該計算方法で計算された傾向スコアによるマッチングデータを抽出する(S109)。
【0053】
次に、介入効果指標設定部117が、介入効果指標設定画面(図16)を表示し、介入効果指標設定画面において選択された介入効果指標を介入効果表示画面(図17)に表示する介入効果指標に設定する(S110)。介入効果指標は、図16に示すように、介護度、介護費、疾病有無、疾病別医療費、検査値、問診結果などがある。
【0054】
次に、介入効果計算部118が、マッチングデータの評価結果によって選択された機械学習法におけるマッチングデータから介入効果指標を計算し、介入効果表示画面(図17)の表示データを生成する(S111)。
【0055】
次に、介入効果計算部118が、ステップS109で計算された介入効果の有意確率を計算し、介入効果の計算値を検定する(S112)。
【0056】
図12は、機械学習法設定画面の例を示す図である。
【0057】
機械学習法設定画面では、予め準備された機械学習方法のリストと、各機械学習方法を選択するための選択欄を含む。機械学習法設定画面は、ステップS102において機械学習法設定部111によって表示され、介入効果分析に使用する機械学習法の選択をユーザに促す。ユーザは、1以上の機械学習法を選択欄において選択した後に「完了」ボタンを操作して、選択結果を機械学習法記憶部133に格納する。
【0058】
図13は、背景情報設定画面の例を示す図である。
【0059】
背景情報設定画面は、介入データ記憶部131及び非介入データ記憶部132に記録される介入データ及び非介入データの項目である背景情報のリストと、各背景情報を選択するための選択欄を含む。背景情報設定画面は、ステップS103において背景情報設定部112によって表示され、介入効果分析に使用する背景情報の選択をユーザに促す。ユーザは、1以上の背景情報を選択欄において選択した後に「完了」ボタンを操作して、選択結果を背景情報記憶部134に格納する。
【0060】
図14図15は、基準介入設定画面の例を示す図である。
【0061】
図14に示す基準介入設定画面では、介入方法(非介入も含む)が表示されており、チェックボックスによって比較する介入方法を選択できる。例えば、介入1と介入2を比較するなど、比較する介入方法が決まっている場合、図14に示す基準介入設定画面が有効である。
【0062】
図15に示す基準介入設定画面では、介入方法(非介入も含む)の傾向スコアの分布及び他の介入方法の傾向スコアに対する被包含率が表示されており、チェックボックスによって比較する介入方法を選択できる。被包含率は、他の介入方法に対してこの介入方法が包含される割り合いを示しており、100%であれば完全に包含されることを示し、包含率が高い方が正確に比較できる。なお、被包含率ではなく、傾向スコアの平均値、最小値などを用いてもよい。例えば、傾向スコア分布を見て、傾向スコアが類似する介入方法を比較する場合、図15に示す基準介入設定画面が有効である。
【0063】
図16は、介入効果指標設定画面の例を示す図である。
【0064】
介入効果指標設定画面は、介入効果分析の結果として計算される介入効果指標のリストと、各介入効果指標を選択するための選択欄と、介入効果を計算する期間の入力欄を含む。介入効果指標設定画面は、ステップS109において介入効果指標設定部117によって表示され、介入効果分析の結果として表示される介入効果指標の選択をユーザに促す。ユーザは、1以上の介入効果指標を選択欄において選択し、効果計算期間を入力した後に「完了」ボタンを操作して、選択結果を介入効果指標設定部117に送信する。また、介入効果指標設定画面に入力された効果計算期間に従って、介入効果計算部118が介入効果を計算する。
【0065】
図17は、実施例1の介入効果表示画面の例を示す図である。
【0066】
介入効果表示画面は、ユーザが表示したい介入効果指標を選択する介入効果指標選択領域と、単純比較とマッチングデータでの比較における複数の介入群と非介入群の人数差を表示する人数表示領域と、単純比較とマッチングデータによる比較とを介入効果をグラフで表示するグラフ表示領域と、介入効果を数値で表示する数値表示領域とを含む。
【0067】
ユーザは、介入効果指標設定画面(図16)で選択した介入効果指標を介入効果指標選択領域で選択して、グラフ表示領域と数値表示領域に表示する介入効果指標を切り替える。グラフ表示領域には、介入効果指標設定画面の効果計算期間に入力した期間の介入効果が複数の介入群と非介入群とを比較可能に表示される。数値表示領域には、介入効果指標設定画面の効果計算期間に入力した期間の介入効果における複数の介入群と非介入群の差の値と、介入効果の数値の有意確率が表示される。ユーザは、有意確率によって、介入効果の値の統計的な確からしさを確認できる。
【0068】
また、複数の介入群と非介入群を比較すると、単純比較では介入前の介入効果指標が異なっているが、マッチングデータでは介入前の介入効果指標が等しくなっているので、介入後の複数の介入群と非介入群の介入効果指標の差が分かり、正しい介入効果を分析できる。
【0069】
以上に説明した実施例1では、一つの介入群を基準として、他の介入群や非介入群との感で介入効果を比較する例を説明したが、比較対象に非介入群を含めずに、3以上の介入群の介入効果を比較してもよい。
【0070】
以上に説明したように、実施例1では、複数の介入群でマッチングデータを作成して背景効果が類似するマッチングデータを選択する。このため、介入施策の正しい効果を知ることができる。
【0071】
<実施例2>
本発明の実施例2では、複数の傾向スコアで抽出した各ペアデータの背景情報の標準化差を逐次評価し、標準化差を最小化するペアデータから多群間のマッチングデータを作成する。なお、実施例2において、実施例1との相違点を主に説明し、実施例1と同じ構成及び効果の説明は省略する。
【0072】
図18は、実施例2の介入効果分析システムの構成を示すブロック図である。
【0073】
実施例2の介入効果分析システムは、分析端末100及びデータベース130を有する。
【0074】
分析端末100は、入力部102、出力部103、プロセッサ(CPU)104、メモリ105及び記憶媒体106を有する計算機である。
【0075】
記憶媒体106は、機械学習法設定部111、背景情報設定部112、傾向スコア計算部113、標準化差計算部115、ペアデータ作成部120、ペアデータ抽出部121、介入効果指標設定部117、介入効果計算部118及び基準介入設定部119を実現するプログラムを格納する。
【0076】
ペアデータ作成部120は、基準介入データの個人データと各傾向スコアが近い個人データとのペアデータを作成する。ペアデータ抽出部121は、各ペアデータの背景情報の標準化差の代表値が最小のペアデータを選定する。
【0077】
図19は、実施例2の介入効果分析処理のフローチャートである。
【0078】
ステップS101からS104及びステップS110からS112は、前述した実施例1の介入効果分析処理(図11)と同じである。
【0079】
ステップS104で基準介入が設定された後、傾向スコア計算部113が、複数の機械学習法を用いて、背景情報から基準介入確率を示す傾向スコアを計算し、計算結果を傾向スコア記憶部135に格納する(S115)。
【0080】
次に、ペアデータ作成部120が、基準介入データから個人データを一つ抽出し(S116)、抽出された個人データと各傾向スコアが近い個人データを他のデータ群(比較対象の介入データや非介入データ)から選定し、選定された個人データとのペアデータを作成する(S117)。
【0081】
例えば、図20に示すように、基準介入群である介入データ1の個人データの傾向スコアを異なる計算方法で計算する。さらに、基準介入群と比較してペアデータを作成する他の介入群及び非介入群の個人データの傾向スコアを異なる計算方法で計算する。そして、基準介入群である介入データ1から個人データを一つ抽出し、他の群から傾向スコアが類似するデータを選択し、傾向スコアの計算方法毎にペアデータを作成する。このため、図示するように、傾向スコアの計算方法によって作成されるペアデータが異なる。
【0082】
次に、ペアデータ抽出部121が、各ペアデータの背景情報の標準化差の代表値を計算する。選定済みのペアデータがある場合は、当該選定済のペアデータも含めて標準化差を計算し、代表値を計算する。標準化差の統計処理には、平均値、最大値、最小値、中央値など様々な統計値を代表値として採用できる(S118)。さらに、ペアデータ抽出部121が、標準化差の代表値が最小のペアデータを選定する(S119)。
【0083】
例えば、図21に示すように、各ペアデータに対して背景情報の標準化差と、その代表値(例えば平均値)を計算し、標準化差の代表値が最小のペアデータを選定する。背景情報の標準化差の代表値が小さければ背景情報が類似しているので、傾向スコア1では介入1と介入2でペアデータを選定し、傾向スコア2では、介入1と介入3又は介入1と非介入でペアデータを選定する。このため、個人IDがK0001の人では、傾向スコア1が近いK0021の人とのペアが作成され、傾向スコア2が近いK0013の人とのペアが作成される。
【0084】
その後、ステップS110で介入効果指標を設定し、続けて、ステップS110以後の処理を実行する。
【0085】
以上に説明したように、本発明の実施例2によると、複数の傾向スコアを用いてマッチングするため、実施例1より背景情報の分布が精度よく揃った、多群マッチングデータを作成できる。このため、個別最適化と集団最適化を両立して、背景情報をより良く揃えた各群のデータを比較できる。
【0086】
<実施例3>
本発明の実施例3では、サブグループを解析する。なお、実施例3において、実施例1、2との相違点を主に説明し、実施例1、2と同じ構成及び効果の説明は省略する。
【0087】
図22は、実施例3の介入効果分析システムの構成を示すブロック図である。
【0088】
実施例3の介入効果分析システムは、分析端末100及びデータベース130を有する。
【0089】
分析端末100は、入力部102、出力部103、プロセッサ(CPU)104、メモリ105及び記憶媒体106を有する計算機である。
【0090】
記憶媒体106は、介入効果計算部118及び背景情報グループ設定部123を実現するプログラムを格納する。なお、記憶媒体106は、実施例1で説明した他の機能ブロック(機械学習法設定部111、背景情報設定部112、傾向スコア計算部113、マッチングデータ作成部114、標準化差計算部115、マッチングデータ抽出部116、介入効果指標設定部117、基準介入設定部119など)を実現するプログラムを格納してもよい。
【0091】
背景情報グループ設定部123は、背景情報グループ設定画面(図23)を表示し、背景情報グループ設定画面において選択された背景情報のグループを設定する。設定された背景情報のグループ毎に介入効果が計算される。
【0092】
データベース130は、介入データ記憶部131、非介入データ記憶部132、及びマッチングデータ記憶部136から構成される。データベース130は、実施例1で説明した他のデータ(機械学習法記憶部133、背景情報記憶部134、傾向スコア記憶部135など)を格納してもよい。
【0093】
図23は、実施例3の背景情報グループ設定画面の例を示す図である。
【0094】
背景情報グループ設定画面は、介入データ記憶部131及び非介入データ記憶部132に記録される介入データ及び非介入データの項目である背景情報のリストと、各背景情報を選択するための選択欄を含む。背景情報グループ設定画面は、背景情報グループ設定部123によって表示され、グループ毎に介入効果を分析する背景情報の選択をユーザに促す。ユーザは、1以上の背景情報を選択欄において選択した後に「完了」ボタンを操作して、選択結果を背景情報グループ設定部123に送信する。背景情報のグループは、背景情報毎に予め設定されていてもよいし(例えば、年齢では、60歳から79歳を10年ごとの3グループに分け、60歳代、70歳代、80歳代とする)、「完了」ボタン操作後に、グループの詳細を設定するサブ画面を表示して、ユーザにグループの範囲(60歳から79歳)と間隔(10年ごと)の入力を促してもよい。
【0095】
図24は、実施例3の介入効果表示画面の例を示す図である。
【0096】
実施例3の介入効果表示画面は、ユーザが表示したい介入効果指標を選択する介入効果指標選択領域と、単純比較の表示とマッチングデータの表示とを選択する効果計算方法選択領域と、単純比較とマッチングデータでの比較における複数の介入群と非介入群の背景情報のグループ毎の人数差を表示する人数表示領域と、単純比較とマッチングデータによる比較とを介入効果を背景情報のグループ毎のグラフで表示するグラフ表示領域と、背景情報のグループ毎の介入効果を数値で表示する数値表示領域とを含む。
【0097】
ユーザは、介入効果指標設定画面(図16)で選択した介入効果指標を介入効果指標選択領域で選択して、グラフ表示領域と数値表示領域に表示する介入効果指標を切り替える。また、単純比較かマッチングデータかを効果計算方法選択領域で選択して、グラフ表示領域と数値表示領域に表示するデータを切り替える。グラフ表示領域には、介入効果指標設定画面の効果計算期間に入力した期間の介入効果が複数の介入群と非介入群とを比較可能に背景情報のグループ毎に表示される。数値表示領域には、介入効果指標設定画面の効果計算期間に入力した期間の介入効果における複数の介入群と非介入群の差の値と、介入効果の数値の有意確率が背景情報のグループ毎に表示される。ユーザは、有意確率によって、介入効果の値の統計的な確からしさを確認できる。
【0098】
以上に説明したように、実施例3では、グループ毎に新たに背景情報を合わせなくても、全体として背景情報を合わせたデータのグループ分けによって、背景情報(例えば年齢)のグループ毎に介入施策効果を知ることができる。介入施策が適する層が分かる。
【0099】
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加・削除・置換をしてもよい。
【0100】
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
【0101】
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、ICカード、SDカード、DVD等の記録媒体に格納することができる。
【0102】
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。
【符号の説明】
【0103】
100 分析端末
102 入力部
103 出力部
104 プロセッサ
105 メモリ
106 記憶媒体
111 機械学習法設定部
112 背景情報設定部
113 傾向スコア計算部
114 マッチングデータ作成部
115 標準化差計算部
116 マッチングデータ抽出部
117 介入効果指標設定部
118 介入効果計算部
119 基準介入設定部
120 背景情報グループ設定部
130 データベース
131 介入データ記憶部
132 非介入データ記憶部
133 機械学習法記憶部
134 背景情報記憶部
135 傾向スコア記憶部
136 マッチングデータ記憶部
図1
図2
図3
図4
図5
図6A
図6B
図6C
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24