IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7533772予測モデル生成装置、予測モデル生成方法及びプログラム
<図1>
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図1
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図2
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図3
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図4
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図5A
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図5B
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図6
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図7
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図8A
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図8B
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図9
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図10A
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図10B
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図11
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図12
  • 特許-予測モデル生成装置、予測モデル生成方法及びプログラム 図13
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-05
(45)【発行日】2024-08-14
(54)【発明の名称】予測モデル生成装置、予測モデル生成方法及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240806BHJP
   G16H 50/00 20180101ALI20240806BHJP
【FI】
G06N20/00
G16H50/00
【請求項の数】 9
(21)【出願番号】P 2023512641
(86)(22)【出願日】2021-04-09
(86)【国際出願番号】 JP2021015089
(87)【国際公開番号】W WO2022215270
(87)【国際公開日】2022-10-13
【審査請求日】2023-10-02
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】荒木 賢志
(72)【発明者】
【氏名】西原 康介
(72)【発明者】
【氏名】小阪 勇気
【審査官】新井 則和
(56)【参考文献】
【文献】特開平09-073440(JP,A)
【文献】特開2012-208902(JP,A)
【文献】特開2019-101982(JP,A)
【文献】特開2016-091306(JP,A)
【文献】国際公開第2020/071540(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G16H 50/00
(57)【特許請求の範囲】
【請求項1】
目的変数を含む学習データについて、前記目的変数の性質に応じて、前記目的変数の確率分布が存在する領域を複数の小領域に分割する分割手段と、
前記小領域のそれぞれに前記目的変数が属する存在確率をそれぞれモデリングする存在確率モデリング手段と、
前記学習データを用いて、前記小領域毎に、前記目的変数が前記小領域に属するという条件下での、前記目的変数が前記小領域で取り得る値に関する確率分布をモデリングする確率分布モデリング手段と、
前記存在確率を用いて、モデリングされた前記確率分布を前記小領域毎に統合することで、前記目的変数の予測モデルを構築するモデル構築手段と、
を備える予測モデル生成装置。
【請求項2】
前記学習データは、前記目的変数の初期値を有し、
前記モデル構築手段は、前記初期値が取り得る値毎に前記目的変数の予測モデルを構築する、
請求項1に記載の予測モデル生成装置。
【請求項3】
予測対象となる目的変数の初期値を有する予測対象データが入力されたとき、前記モデル構築手段が構築した前記目的変数の予測モデルの中から、前記予測対象データに含まれる目的変数の初期値に対応する予測モデルを選択する選択手段と、
選択された前記予測モデルを用いて、前記予測対象データにおける前記目的変数を予測する予測手段と、をさらに備える
請求項2に記載の予測モデル生成装置。
【請求項4】
前記目的変数は、患者の退院時の回復度であり、
前記分割手段は、患者の入院時の回復度の値を境界にして、前記退院時の回復度が存在する領域を2分割する、
請求項1乃至3のいずれか1項に記載の予測モデル生成装置。
【請求項5】
前記学習データは、前記患者の患者情報を有し、
前記確率分布モデリング手段は、前記患者情報に依存するように前記確率分布をモデリングする、
請求項4に記載の予測モデル生成装置。
【請求項6】
前記確率分布モデリング手段は、一般化線形モデル化された前記確率分布をモデリングする、
請求項1乃至5のいずれか1項に記載の予測モデル生成装置。
【請求項7】
前記確率分布モデリング手段は、2項分布で表される前記確率分布をモデリングする、
請求項6に記載の予測モデル生成装置。
【請求項8】
目的変数を含む学習データについて、前記目的変数の性質に応じて、前記目的変数の確率分布が存在する領域を複数の小領域に分割し、
前記小領域のそれぞれに前記目的変数が属する存在確率をそれぞれモデリングし、
前記学習データを用いて、前記小領域毎に、前記目的変数が前記小領域に属するという条件下での、前記目的変数が前記小領域で取り得る値に関する確率分布をモデリングし、
前記存在確率を用いて、モデリングされた前記確率分布を前記小領域毎に統合することで、前記目的変数の予測モデルを構築する、
予測モデル生成装置が実行する予測モデル生成方法。
【請求項9】
目的変数を含む学習データについて、前記目的変数の性質に応じて、前記目的変数の確率分布が存在する領域を複数の小領域に分割し、
前記小領域のそれぞれに前記目的変数が属する存在確率をそれぞれモデリングし、
前記学習データを用いて、前記小領域毎に、前記目的変数が前記小領域に属するという条件下での、前記目的変数が前記小領域で取り得る値に関する確率分布をモデリングし、
前記存在確率を用いて、モデリングされた前記確率分布を前記小領域毎に統合することで、前記目的変数の予測モデルを構築する、
ことをコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この開示は予測モデル生成装置、予測モデル生成方法及び非一時的なコンピュータ可読媒体に関する。
【背景技術】
【0002】
患者が病院に入院したときに、その病気からの回復度を予測するシステムが、近年考えられている。例えば、特許文献1には、医療情報処理システムが、急性期医療施設の入院患者から得られる各患者の電子カルテ情報群を参照して、各患者の急性期医療施設からの転帰先を機械学習し、その学習結果に基づいて、対象患者の転帰先を予測する技術が記載されている。
【先行技術文献】
【特許文献】
【0003】
【文献】国際公開第2019/044620号
【発明の概要】
【発明が解決しようとする課題】
【0004】
この開示は、先行技術文献に開示された技術を改善することを目的とする。
【課題を解決するための手段】
【0005】
本実施形態にかかる一態様の予測モデル生成装置は、目的変数を含む学習データについて、目的変数の性質に応じて、目的変数の確率分布が存在する領域を複数の小領域に分割する分割手段と、小領域のそれぞれに目的変数が属する存在確率をそれぞれモデリングする存在確率モデリング手段と、学習データを用いて、小領域毎に、目的変数が小領域に属するという条件下での、目的変数が小領域で取り得る値に関する確率分布をモデリングする確率分布モデリング手段と、存在確率を用いて、モデリングされた確率分布を小領域毎に統合することで、目的変数の予測モデルを構築するモデル構築手段を備える。
【0006】
本実施形態にかかる一態様の予測モデル生成方法は、目的変数を含む学習データについて、目的変数の性質に応じて、目的変数の確率分布が存在する領域を複数の小領域に分割し、小領域のそれぞれに目的変数が属する存在確率をそれぞれモデリングし、学習データを用いて、小領域毎に、目的変数が小領域に属するという条件下での、目的変数が小領域で取り得る値に関する確率分布をモデリングし、存在確率を用いて、モデリングされた確率分布を小領域毎に統合することで、目的変数の予測モデルを構築することを予測モデル生成装置が実行するものである。
【0007】
本実施形態にかかる一態様の非一時的なコンピュータ可読媒体は、目的変数を含む学習データについて、目的変数の性質に応じて、目的変数の確率分布が存在する領域を複数の小領域に分割し、小領域のそれぞれに目的変数が属する存在確率をそれぞれモデリングし、学習データを用いて、小領域毎に、目的変数が小領域に属するという条件下での、目的変数が小領域で取り得る値に関する確率分布をモデリングし、存在確率を用いて、モデリングされた確率分布を小領域毎に統合することで、目的変数の予測モデルを構築することをコンピュータに実行させるプログラムが格納されたものである。
【図面の簡単な説明】
【0008】
図1】実施の形態1にかかる予測モデル生成装置の一例を示すブロック図である。
図2】実施の形態1にかかる確率分布モデリング部の一例を示すブロック図である。
図3】実施の形態1にかかる予測モデル生成装置の処理例を示すフローチャートである。
図4】実施の形態2にかかる予測システムの一例を示すブロック図である。
図5A】実施の形態2にかかる予測モデル生成部の一例を示すブロック図である。
図5B】実施の形態2にかかるモデリング部の一例を示すブロック図である。
図6】実施の形態2にかかる予測部の一例を示すブロック図である。
図7】実施の形態2にかかる予測システムの処理例を示すフローチャートである。
図8A】理論上の回復度の確率分布を示すグラフである。
図8B】実際の回復度の確率分布を示すグラフである。
図9】実施の形態3にかかる予測システムの一例を示すブロック図である。
図10A】実施の形態3にかかる予測モデル生成部の一例を示すブロック図である。
図10B】実施の形態3にかかるモデリング部の一例を示すブロック図である。
図11】実施の形態3にかかる予測部の一例を示すブロック図である。
図12】実施の形態3にかかる予測システムの処理例を示すフローチャートである。
図13】各実施の形態にかかる装置のハードウェア構成の一例を示すブロック図である。
【発明を実施するための形態】
【0009】
実施の形態1
以下、図面を参照して実施の形態1について説明する。実施の形態1は、この開示の技術に係る予測モデル生成装置を開示する。
【0010】
[構成の説明]
図1は、実施の形態1にかかる予測モデル生成装置の一例を示す。図1の予測モデル生成装置10は、分割部11、存在確率モデリング部12、確率分布モデリング部13及びモデル構築部14を備える。予測モデル生成装置10の各部(各手段)は、不図示の制御部(コントローラ)により制御される。以下、各部について説明する。
【0011】
分割部11は、目的変数を含む学習データについて、目的変数の性質に応じて、目的変数の確率分布が存在する領域を複数の小領域に分割する。目的変数の性質とは、例えば、目的変数がある閾値Th以上になる確率が、目的変数がその閾値Th未満になる確率よりも有意に大きい又は小さいことである。この場合、分割部11は、確率分布が存在する領域を、目的変数が閾値Th以上になる領域と、目的変数が閾値Th未満になる領域とに2分割する。
【0012】
上述の例の閾値Thは、予め定められた値であっても良いし、説明変数に依存する値であっても良い。例えば、ある説明変数の値をiとすると、分割後の小領域1として目的変数がi未満の領域、小領域2として目的変数がi以上の領域のように、分割部11は分割方法の規則を設定することができる。これは、説明変数が目的変数の初期値であり、目的変数が説明変数以上の値となる確率が有意に高い場合の、分割方法の設定である。分割部11は、例えば学習によるモデリングで、この分割方法の規則を設定することができる。この規則に基づいて、分割部11は、目的変数の確率分布が存在する領域を分割する。
【0013】
ただし、分割部11は、領域を3分割以上に分割しても良い。例えば、目的変数が第1の閾値Th1以上になる第1の確率と、目的変数が第1の閾値Th1未満かつ第2の閾値Th2以上(Th1>Th2)になる第2の確率と、目的変数が第2の閾値Th2未満になる第3の確率とを比較した場合に、3つの確率のうちいずれか1つが、少なくとも他の1つの確率よりも有意に大きい場合が考えられる。この場合、分割部11は、目的変数の確率分布が存在する領域を、目的変数が第1の閾値Th1以上になる小領域と、目的変数が第1の閾値Th1未満かつ第2の閾値Th2以上になる小領域と、目的変数が第2の閾値Th2未満になる小領域に3分割する。
【0014】
存在確率モデリング部12は、ある説明変数について、分割部11が分割した小領域のそれぞれに目的変数が属する存在確率を、それぞれモデリングする。例えば、分割部11が領域を2分割した場合に、存在確率モデリング部12は、目的変数が小領域1に属する確率と、目的変数が小領域2に属する確率を、それぞれモデリングすることで導出する。
【0015】
確率分布モデリング部13は、ある説明変数について、学習データを用いて、分割された小領域毎に、目的変数が小領域に属するという条件下での目的変数が小領域で取り得る値に関する確率分布をモデリングする。
【0016】
図2は、確率分布モデリング部13の一例を示すブロック図である。図2は、小領域が2つある場合の例を示しており、確率分布モデリング部13は、小領域1に対応する確率分布1モデリング部131と、小領域2に対応する確率分布2モデリング部132を有する。確率分布1モデリング部131は、目的変数が小領域1に属するという条件の下で、目的変数が小領域1において取り得る値に関する確率分布をモデリングする。このモデリングでは、目的変数が小領域2に属する範囲で、確率分布の値が0になるようにモデリングをする必要がある。
【0017】
また、確率分布2モデリング部132は、目的変数が小領域2に属するという条件の下で、目的変数が小領域2において取り得る値に関する確率分布をモデリングする。このモデリングでは、目的変数が小領域1に属する範囲で、確率分布の値が0になるようにモデリングをする必要がある。
【0018】
モデル構築部14は、ある説明変数について、存在確率モデリング部12がモデリングした存在確率を用いて、確率分布モデリング部13がモデリングした確率分布を小領域毎に統合することで、目的変数の予測モデルを構築する。具体的には、確率の基本法則(加法定理及び乗法定理)を用いて、確率分布が統合される。
【0019】
一例として、領域が2つの小領域に分割される場合に、目的変数をY、説明変数をX、目的変数が2つの小領域のうちのどちらの小領域に属するかを示す変数をZと表記する。モデル構築部14は、説明変数がXである条件下で目的変数がYとなる確率を、以下の式(1)にしたがって導出する。

【数1】
・・・(1)

式(1)の左辺は、導出対象となる目的変数Yの確率分布である。式(1)の右辺第1項であるP(Y|X,Z)は、説明変数がXである条件下であり、かつ、目的変数Yが小領域1または2のいずれかに属するという条件下での、目的変数の確率分布である。また、式(1)の右辺第2項であるP(Z|X)は、これらの2つの分布の結合の重みを与えるものであり、説明変数がXである条件下で、目的変数が小領域1または2のいずれに属するかを示す確率である。ここで、P(Y|X,Z)、P(Z|X)は、それぞれ確率分布モデリング部13、存在確率モデリング部12により導出される。ただし、ここでは簡単のため、モデリングに用いられる変数(モデルパラメータ)の記載は省略した。
【0020】
[処理の説明]
図3は、予測モデル生成装置10の代表的な処理の一例を示したフローチャートであり、このフローチャートによって、予測モデル生成装置10の処理が説明される。まず、予測モデル生成装置の分割部11は、目的変数を含む学習データについて、目的変数の性質に応じて、目的変数の確率分布が存在する領域を複数の小領域に分割する(ステップS11;分割ステップ)。存在確率モデリング部12は、分割された小領域のそれぞれに目的変数が属する存在確率をそれぞれモデリングする(ステップS12;存在確率モデリングステップ)。
【0021】
確率分布モデリング部13は、学習データを用いて、小領域毎に、目的変数が小領域に属するという条件下での、目的変数が小領域で取り得る値に関する確率分布をモデリングする(ステップS13;確率分布モデリングステップ)。モデル構築部14は、存在確率を用いて、モデリングされた確率分布を小領域毎に統合することで、目的変数の予測モデルを構築する(ステップS14;モデル構築ステップ)。なお、各ステップの詳細は上述の通りである。
【0022】
[効果の説明]
以上のようにして、予測モデル生成装置10は、ある説明変数について、目的変数の予測モデルを構築することができる。予測モデル生成装置10は、学習データにおいて取り得る説明変数が複数ある場合には、取り得る説明変数毎に上述の処理を実行することで、説明変数毎に目的変数の予測モデルを構築することができる。
【0023】
目的変数は、その性質に応じて、確率分布に偏りが生じる場合がある。このような場合に、例えば2項分布を仮定した一般化線形モデルをそのまま用いて学習データから予測モデルを構築すると、構築された予測モデルには、実際の確率分布の性質が反映されにくくなり、予測の精度が落ちてしまうことが考えられる。
【0024】
しかしながら、この開示にかかる予測モデル生成装置10では、分割部11が目的変数の性質に応じて、目的変数の確率分布が存在する領域を複数の小領域に分割し、存在確率モデリング部12及び確率分布モデリング部13は、その小領域に関するモデリングを実行している。そして、モデル構築部14は、存在確率モデリング部12及び確率分布モデリング部13がそれぞれ導出した結果に基づいて、予測モデルを構築する。そのため、構築された予測モデルには、実際の確率分布の性質が反映されやすくなり、予測の精度を向上することができる。
【0025】
実施の形態2
以下、図面を参照して実施の形態2について説明する。実施の形態2では、実施の形態1にて説明した予測モデル生成装置の機能を有する予測システムの具体例を開示する。
【0026】
[構成の説明]
図4は、実施の形態2にかかる予測システムの一例を示す。図4の予測システム20は、予測モデル生成部21及び予測部22を備える。予測モデル生成部21は、実施の形態1にかかる予測モデル生成装置10の機能を有し、学習データLを用いて予測モデルを生成するユニットである。
【0027】
学習データLは、複数の患者に関する機械学習用のデータであり、複数の各患者について、説明変数として入院時の回復度及び患者情報を有し、その説明変数に対応する目的変数として、退院時の回復度の情報を有する。回復度は、所定の病気に対して回復した度合いを示す定量化された値であり、医師等が検査により判定する。ここで、回復度が小さいほど病状が重く、回復度が大きいほど病状が軽いことを示す。入院時の回復度は、退院時の回復度の初期値である。患者情報は、入院時の回復度以外の情報であって、退院時の回復度に影響を及ぼす患者の情報であり、例えば、年齢、患者の体に関する所定のバイタル値が挙げられるが、これらに限られない。
【0028】
新規な入力データI(予測対象データ)は、予測システム20が予測対象とする患者(予測対象患者)の、入院時回復度と患者情報のセットを含む情報である。予測部22は、予測モデル生成部21が生成した予測モデルのうち1つを選択し、その予測モデルに入力データIを説明変数として入力することにより、目的変数である予測対象患者の退院時の回復度を、出力データOとして導出する。
【0029】
図5Aは、予測モデル生成部21の一例を示すブロック図である。予測モデル生成部21は、データ仕分け部211、モデリング部212、学習済分布統合部213及び記憶部214を有する。以下、各部の詳細について説明する。
【0030】
データ仕分け部211は、学習データLを取得し、説明変数である入院時の回復度の値に基づいて、学習データLを分ける。この例では、回復度の値が1~NのN個取り得るため、学習データLもN個に分けられることになる。分けられた学習データは、モデリング部212に入力される。
【0031】
モデリング部212は、入院時の回復度のそれぞれの値に関して、退院時の回復度(目的変数)の予測モデルを構築する。モデリング部212は、図5Bに示す通り、N通りの入院時の回復度の値に応じて、N個の学習部1~Nを有する。学習部i(iは1~Nのうちの任意の値)は、入院時回復度の値iによって区別されており、入院時回復度の値によってラベルされている。以降、学習部iについて、その実行する処理を説明する。
【0032】
学習部iでは、入院時回復度がiの場合の確率分布の学習を行う。よって、データ仕分け部211で分けられた学習データLのうち、入院時回復度がiである患者の学習データLが学習部iに入力される。入力される学習データLは、各患者について、患者情報と、目的変数である退院時回復度を含む。
【0033】
学習部iは、図1に示した分割部11、存在確率モデリング部12及び確率分布モデリング部13を有する。そして、学習部iでは、次の3種類の学習を行う。退院時回復度がiより上がるか下がるかの確率分布のパラメータの学習、退院時回復度がiより下がるという条件下での退院時回復度の確率分布のパラメータの学習、及び退院時回復度がiより上がるという条件下での退院時回復度の確率分布のパラメータの学習である。
【0034】
ここで、入院時回復度が退院時回復度と同じである状況については注意が必要であり、退院時回復度の確率分布が存在する領域を2分割する場合には、この状況は、退院時回復度が入院時回復度よりも上がるか、又は下がるかのいずれかの定義に含まれることになる。この例では、この状況を前者の定義に含めて、退院時回復度が入院時回復度以上の場合という再定義をする。また、退院時回復度が入院時回復度よりも下がる場合には、退院時回復度が入院時回復度未満であるという定義ができる。そのため、退院時回復度の確率分布が存在する領域は、入院時回復度の値を境界にして2分割される。そして、学習部iは、退院時回復度が入院時回復度以上か、又は未満かという2通りの各条件における退院時回復度の分布を、それぞれ2項分布を用いてモデリングする。
【0035】
この2項分布は、整数パラメータ(以後、試行回数と記載)と実数パラメータ(以後、成功確率と記載)の2つによって特徴づけられる。退院時回復度が入院時回復度未満であるという条件下では、退院時回復度として取り得る値は、1~i-1なので、学習部iは、試行回数がi-2となる2項分布を仮定する。一方、退院時回復度が入院時回復度以上であるという条件下では、退院時回復度として取り得る値は、i~Nなので、学習部iは、試行回数がN-iとなる2項分布を仮定する。このようにして、一般化線形モデル化された確率分布がモデリングされる。
【0036】
また、学習部iは、各確率分布の成功確率を、患者情報に依存するようにモデリングする。モデリングに用いられるリンク関数としては、ロジット関数を採用するのが一般的である。学習におけるモデルパラメータに対しては、点推定やベイズ推定等の処理がなされても良い。
【0037】
以上から、学習部iの各部は、以下のような処理を実行する。分割部11は、退院時回復度(目的変数)の性質に応じて、退院時回復度の確率分布が存在する領域を、退院時回復度が入院時回復度以上である小領域1と、退院時回復度が入院時回復度未満である小領域2に2分割する。存在確率モデリング部12は、入院時回復度(説明変数)がiの場合について、小領域1と2のそれぞれに退院時回復度が属する存在確率を、それぞれ学習してモデリングする。確率分布1モデリング部131は、退院時回復度が小領域1に属するという条件の下で、退院時回復度が小領域1において取り得る値(N~i)に関する確率分布を、学習してモデリングする。また、確率分布2モデリング部132は、退院時回復度が小領域2に属するという条件の下で、退院時回復度が小領域2において取り得る値(1~i-1)に関する確率分布を、学習してモデリングする。なお、各モデリング部は、上述の通り、モデリングにおいて2項分布を用いる。
【0038】
学習済分布統合部213は、図1に示したモデル構築部14を有し、入院時回復度(説明変数)がiの条件下の、退院時回復度(目的変数)の予測モデルを構築する。つまり、学習済分布統合部213は、確率の加法定理および乗法定理に従い、退院時回復度が入院時回復度以上か又は未満かを示す確率分布、退院時回復度が入院時回復度以上である条件下での退院時回復度の確率分布、及び退院時回復度が入院時回復度未満である条件下での退院時回復度の確率分布の3つを統合する。これにより、入院時回復度がiの場合の、退院時回復度の予測モデルを構築する。統合方法は、式(1)に関する説明において説明した通りである。
【0039】
学習済分布統合部213は、入院時回復度が取り得る全ての値1~Nについて、この処理を実行する。それにより、入院時回復度に対応した全部でN種類の予測モデルを構築する。なお、データ仕分け部211、モデリング部212及び学習済分布統合部213は、予測モデル生成部21が新たな学習データLを取得する度に、以上の機械学習に関する処理を実行しても良い。これにより、予測モデルを更新し、その精度を向上させることができる。
【0040】
記憶部214は、学習済分布統合部213が構築したN種類の予測モデルを格納する。N個の予測モデルは、入院時回復度の値に応じた識別情報が付されることにより、区別可能である。また、記憶部214は、後述の予測モデル選択部221によるアクセスを受け付ける。
【0041】
図6は、予測部22の一例を示すブロック図である。予測部22は、予測モデル選択部221及び出力値計算部222を有する。以下、各部の詳細について説明する。
【0042】
予測モデル選択部221は、入力データIの入院時回復度の値に応じて、記憶部214にアクセスし、そこに格納されたN種類の予測モデルの中から、適切な1つの予測モデルを選択する。例えば、入力データIの入院時回復度が3なら、入院時回復度が3となる予測モデルを選択する。予測モデル選択部221は、予測モデルに付された識別情報を参照することで、特定の予測モデルを選択することができる。
【0043】
出力値計算部222は、予測モデル選択部221が選択した予測モデルに、入力データIの患者情報を入力することによって、目的変数である退院時回復度の予測分布を取得する。出力値計算部222は、この予測分布の最頻値、平均値及び中央値のいずれかを退院時回復度の予測値として計算し、その値を出力データOとして出力する。ただし、予測値を計算する方法はこれに限られない。なお、出力データOは、例えば、予測システム20に設けられた表示部に表示されても良いし、プリンタによって印刷されることによって出力され手も良い。
【0044】
[処理の説明]
図7は、予測システム20の代表的な処理の一例を示したフローチャートであり、このフローチャートによって、予測システム20の処理が説明される。まず、予測システム20のデータ仕分け部211は、学習データLを取得する(ステップS21)。
【0045】
データ仕分け部211は、取得した学習データLを入院時の回復度の値に基づいて分割し、モデリング部212の各学習部1~Nに対して、分割した学習データLを割り当てる。学習部iは、入院時回復度がiの条件下でのモデリングを実行する。このモデリングの詳細は、上述の通りである。そして、学習済分布統合部213は、入院時回復度がiの条件下での、退院時回復度の予測モデルを構築する。学習済分布統合部213は、入院時回復度がi以外の値である場合にもこの処理を実行することで、全部でN種類の予測モデルを構築する(ステップS22)。構築された予測モデルは、記憶部214に格納される。
【0046】
次に、予測部22は、入力データIを取得する(ステップS23)。予測モデル選択部221は、入力データIの入院時回復度の値に応じた、学習済の予測モデルを1つ選択する。出力値計算部222は、選択された予測モデルに入力データIの患者情報を入力することによって、退院時回復度の予測分布を取得し、その予測分布に基づいて、退院時回復度の予測値を計算する。出力値計算部222は、その計算結果を出力データOとして出力する(ステップS24)。
【0047】
[効果の説明]
以上のようにして、予測システム20は、患者の回復度に関する学習データを用いて、患者の回復度の予測モデルを精度高く構築することができる。
【0048】
また、学習データは、退院時の回復度(目的変数)の初期値として、入院時の回復度(目的変数の初期値)を有しており、予測モデル生成部21(モデル構築手段)は、入院時の回復度が取り得る値毎に、目的変数の予測モデルを構築することができる。したがって、任意の入院時の回復度に対して、退院時の回復度の予測が可能となる。
【0049】
また、予測モデル選択部221(選択手段)は、入院時の回復度を有する入力データI(予測対象データ)が入力されたとき、構築された予測モデルの中から、入力データIに含まれる入院時の回復度に対応する予測モデルを選択する。出力値計算部222(予測手段)は、選択された予測モデルを用いて、入力データIにおける退院時の回復度を予測することができる。したがって、予測システム20は、任意の患者の入力データIについて、退院時回復度を精度高く予測することができる。
【0050】
また、学習データにおける目的変数は、患者の退院時の回復度であり、データ仕分け部211(分割手段)は、患者の入院時の回復度の値を境界にして、退院時の回復度が存在する領域を2分割することができる。したがって、予測モデルを、入院時から退院時における回復度の実際の変化を反映したものにすることができる。この点については、実施の形態3でさらに詳細に述べる。
【0051】
また、学習データは、患者の患者情報を有し、学習部i(確率分布モデリング手段)は、その患者情報に依存するように確率分布をモデリングすることができる。したがって、予測モデルを、患者情報を反映したものにすることができる。
【0052】
また、学習部iは、一般化線形モデル化された確率分布(特に、2項分布で表される確率分布)をモデリングすることができる。したがって、予測システム20は、統計的手法として特殊な手法ではない、一般的な手法を用いつつ、精度の高い予測モデルを生成することができる。
【0053】
実施の形態3
以下、図面を参照して実施の形態3について説明する。実施の形態3では、実施の形態2の更なる具体例として、回復度として、脳卒中患者のFIM(Functional Independence Measure)を適用した場合を説明する。
【0054】
脳卒中患者の回復期リハビリテーション病棟にとって、その病棟に入院時の患者情報を用いて、退院時の患者の回復度を患者個別に予測することは、患者のリハビリテーション計画の立案や目標の設定に重要である。一例として、非特許文献1(「入院時の患者情報からの退院時Functional Independence Measure予測」,著者:小阪勇気(NECデータサイエンス研),細井利憲(NECデータサイエンス研),久保雅洋(NECデータサイエンス研),亀田佳一(KNI),井上姫花(KNI),奥田明(KNI),久保文郁(KNI),伊藤美由貴(KNI),資料名:医療情報学連合大会論文集(CD-ROM),巻:39th,ページ:ROMBUNNO.3-B-2-03,発行年:2019年)には、退院時のFIMの予測問題に対し、退院時FIM分布をガウス分布と仮定する回帰手法が記載されている。
【0055】
FIMなどに代表される脳卒中患者の回復度を表す量は、離散値であり、かつ、上限と下限が存在する。このような定義域の性質を持つ量を回帰する手法としては、2項分布を仮定した一般化線形モデルが挙げられる。図8Aは、このモデルにおけるFIMの確率分布の一例を示したものである。図8Aの横軸はFIMであり、FIMは1~7で示される値である。つまり、実施の形態2におけるNは、ここでは7である。また、縦軸は分布強度である。FIMの中間値である4を境にして、FIMが大きく又は小さくなるに従い、そのFIMに対応する分布強度が減少する。この分布強度の減少の仕方は、図8Aに示されるように、比較的緩やかである。
【0056】
しかしながら、実際の退院時のFIMの分布は、入院時のFIMの値を境界にする第1の領域と第2の領域とにおいて、大きく変化し、両者の領域において分布にギャップが存在することが予測される。図8Bは、そのようなモデルにおけるFIMの確率分布の一例を示したものである。図8Aの横軸はFIM(1~7)であり、縦軸は分布強度である。また、図8Bにおいて、入院時のFIMは3である。
【0057】
図8Bにおいて、退院時FIMが入院時FIM未満の領域(領域A)の分布強度は極端に小さくなる一方、退院時FIMが入院時FIM以上である領域(領域B)の分布強度は極端に大きくなる。これは、入院中のリハビリテーションによって、FIMが悪化するという事象が頻度的にほとんど起こらないという事情によるものである。以上の理由より、2項分布を仮定した一般化線形モデルでは、このような実際の分布の性質を反映することができないため、FIM予測の精度が低下する可能性があった。
【0058】
以降に説明する実施の形態3に係る予測システムは、この課題を解決することができるものである。なお、実施の形態3にかかる予測システムは、実施の形態2と略同じ構成を備えるものであるため、実施の形態2と異なる点について特に説明し、それ以外の点については適宜説明を省略する。
【0059】
[構成の説明]
図9は、実施の形態3にかかる予測システムの一例を示す。予測システム30は、予測モデル生成部31及び予測部32を備える。予測モデル生成部31、予測部32は、それぞれ、実施の形態2の予測モデル生成部21、予測部22に対応する。
【0060】
学習データLは、複数の患者に関する機械学習用のデータであり、複数の各患者について、説明変数として入院時のFIM及び患者情報を有し、その説明変数に対応する目的変数として、退院時のFIMの情報を有する。FIMは、実施の形態2に示した回復度の一例であり、1~7までの値を取り得る。また、患者情報の詳細は、実施の形態2に示した通りである。
【0061】
新規な入力データIは、予測対象患者の、入院時のFIMと患者情報のセットを含む情報である。予測部32は、予測モデル生成部31が生成した予測モデルを1つ選択し、選択した予測モデルに入力データIを説明変数として入力することにより、目的変数である退院時のFIMを、出力データOとして導出する。
【0062】
図10Aは、予測モデル生成部31の一例を示すブロック図である。予測モデル生成部31は、データ仕分け部311、モデリング部312、学習済分布統合部313及び記憶部314を有する。データ仕分け部311~記憶部314は、それぞれ、実施の形態2のデータ仕分け部211~記憶部214に対応する。
【0063】
データ仕分け部311は、学習データLを取得し、入院時のFIMの値に基づいて、学習データLを7個に分ける。モデリング部312は、入院時のFIMのそれぞれの値に関して、退院時のFIMの予測モデルを構築する。モデリング部312は、図10Bに示す通り、7通りの入院時のFIMの値に応じて、7個の学習部1~7を有する。学習部i(iは1~7のうちの任意の値)では、実施の形態2に記載した学習部iと同様の処理を、回復度に代えて、FIMについて実行する。なお、退院時FIMが入院時FIM以上であるという条件下では、退院時FIMとして取り得る値は、i~7なので、学習部iは、試行回数が7-iとなる2項分布を仮定することになる。
【0064】
学習済分布統合部313は、退院時のFIMが入院時のFIM以上か又は未満かを示す確率分布、退院時のFIMが入院時のFIM以上である条件下での退院時のFIMの確率分布、及び退院時のFIMが入院時のFIM未満である条件下での退院時のFIMの確率分布の3つを統合する。これにより、入院時のFIMがiの場合の、退院時のFIMの予測モデルを構築する。また、学習済分布統合部313は、入院時のFIMが取り得る全ての値1~7について、この処理を実行することにより、入院時のFIMに対応した全部で7種類の予測モデルを構築する。記憶部314は、学習済分布統合部313が構築した7種類の予測モデルを格納する。
【0065】
図11は、予測部32の一例を示すブロック図である。予測部32は、予測モデル選択部321及び出力値計算部322を有する。予測モデル選択部321、出力値計算部322は、それぞれ、実施の形態2の予測モデル選択部221及び出力値計算部222に対応する。
【0066】
予測モデル選択部321は、入力データIの入院時FIMの値に応じて、記憶部314にアクセスし、そこに格納された7種類の予測モデルの中から、適切な1つの予測モデルを選択する。出力値計算部322は、予測モデル選択部321が選択した予測モデルに、入力データIの患者情報を入力することによって、目的変数である退院時FIMの予測分布を取得する。出力値計算部322は、その予測分布に基づいて、退院時FIMの予測値を計算する。
【0067】
[処理の説明]
図12は、予測システム30の代表的な処理の一例を示したフローチャートであり、このフローチャートによって、予測システム30の処理が説明される。まず、予測システム30のデータ仕分け部311は、学習データLを取得する(ステップS31)。
【0068】
データ仕分け部311は、取得した学習データLを入院時のFIMの値に基づいて分割し、モデリング部312の各学習部1~7に対して、分割した学習データLを割り当てる。学習部iは、入院時FIMがiの条件下でのモデリングを実行する。このモデリングの詳細は、上述の通りである。そして、学習済分布統合部313は、入院時FIMがiの条件下での、退院時FIMの予測モデルを構築する。学習済分布統合部313は、入院時FIMがi以外の値である場合にもこの処理を実行することで、全部で7種類の予測モデルを構築する(ステップS32)。構築された予測モデルは、記憶部314に格納される。
【0069】
次に、予測部32は、入力データIを取得する(ステップS33)。予測モデル選択部321は、入力データIの入院時FIMの値に応じた、学習済の予測モデルを1つ選択する。出力値計算部22は、選択された予測モデルに入力データIの患者情報を入力することによって、退院時FIMの予測分布を取得し、その予測分布に基づいて、退院時FIMの予測値を計算する。出力値計算部22は、その計算結果を出力データOとして出力する(ステップS34)。
【0070】
[効果の説明]
以上のようにして、予測システム30は、患者のFIMに関する学習データを用いて、患者のFIMの予測モデルを精度高く構築することができる。予測システム30は、退院時FIMが入院時FIM以上となる領域とそれ以外の領域の2つの領域で、分布のモデリングを実行している。そして、いずれかの領域に属するという条件下での確率分布をそれぞれモデリングした後、算出した確率分布を統合することで、予測モデルを構築している。これにより、構築された予測モデルは、実際の分布の形状をよく近似し得るため、予測精度の向上が期待できる。
【0071】
実施の形態4
以下、実施の形態4について説明する。実施の形態4では、実施の形態2の更なる具体例として、回復度として、脳卒中患者のSIAS(Stroke Impairment Assessment Set)を適用した場合を説明する。SIASに関しても、FIMと同様の理由により、退院時のSIASが入院時のSIAS以上の値となる場合が非常に多い。そのため、この開示に係る予測システムを適用することが効果的である。
【0072】
実施の形態4に係る処理は、実施の形態3(FIM予測)におけるFIMをSIASに代えることにより、実現できる。ただし、SIASの取り得る値は6種類又は4種類であるため、実施の形態3において、実施の形態2におけるNの値は6又は4となる。
【0073】
実施の形態5
以下、実施の形態5について説明する。実施の形態5では、実施の形態2の更なる具体例として、回復度として、バランス機能の評価であるBBS (Berg balance scale)を適用した場合を説明する。BBSに関しても、FIMと同様の理由により、退院時のBBSが、入院時のBBS以上の値となる場合が非常に多い。そのため、この開示に係る予測システムを適用することが効果的である。
【0074】
実施の形態5に係る処理は、実施の形態3(FIM予測)におけるFIMをBBSに代えることにより、実現できる。ただし、BBSの取り得る値は4種類であるため、実施の形態3において、実施の形態2におけるNの値は4となる。
【0075】
以上、実施の形態3~5に示した通り、この開示に係る予測システムは、様々な種類の回復度の予測に対して適用することができる。
【0076】
なお、この開示は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
【0077】
例えば、実施の形態2に係る出力値計算部222は、退院時回復度の予測分布をそのまま出力しても良いし、予測分布に基づいて、退院時回復度が取り得る値とその値になる確率を算出し、その算出された情報を出力しても良い。実施の形態2において、入院時回復度が退院時回復度と同じである状況を、退院時回復度が入院時回復度よりも下がる定義に含めても良い。また、分割における境界は、入院時回復度の値と同じ値に限られず、異なる値であっても良い。実施の形態2に限られず、実施の形態3~5でも、同様の変更が可能である。
【0078】
実施の形態1に係る予測モデル生成装置10は、単独のコンピュータで構成されている集中型の構成であっても良いし、複数のコンピュータが分割部11~モデル構築部14の処理を分担して実行する分散型の構成であっても良い。同様に、各実施の形態2~5に係る予測システムは、単独のコンピュータで構成されている集中型の構成であっても良いし、複数のコンピュータが各処理を分担して実行する分散型の構成であっても良い。例えば、予測システム20は、第1のコンピュータが予測モデル生成部21を備えてその処理を実行し、第2のコンピュータが予測部22を備えてその処理を実行することで構成されても良い。分散型の構成において、複数の機器は、例えばLAN(Local Area Network)、WAN(Wide Area Network)、インターネット等の通信ネットワークを介して接続されても良い。
【0079】
この開示に係る予測モデル生成装置又は予測システムは、回復度に限らず、初期値が既知である量(変数)の未来の値を予測する用途に広く適用可能である。特に、時間経過に伴う初期値からの増減がいずれか片方に偏るような現象の予測に対して効力を発揮する。例えば、この開示に係る予測モデル生成装置又は予測システムは、聴力、視力など、加齢とともに下がる傾向が明らかな量の将来の値を予測する用途にも適用することができる。この場合、現在の聴力又は視力の値が初期値として扱われ、将来の聴力又は視力の値が、予測対象の目的変数となる。
【0080】
以上に示した実施の形態では、この開示をハードウェアの構成として説明したが、この開示は、これに限定されるものではない。この開示は、上述の実施形態において説明された予測モデル生成装置又は予測システムの処理(ステップ)を、コンピュータ内のプロセッサにコンピュータプログラムを実行させることにより実現することも可能である。
【0081】
図13は、以上に示した各実施の形態の処理が実行される情報処理装置(信号処理装置)のハードウェア構成例を示すブロック図である。図13を参照すると、この情報処理装置90は、信号処理回路91、プロセッサ92及びメモリ93を含む。
【0082】
信号処理回路91は、プロセッサ92の制御に応じて、信号を処理するための回路である。なお、信号処理回路91は、信号の送信装置から信号を受信する通信回路を含んでいても良い。
【0083】
プロセッサ92は、メモリ93からソフトウェア(コンピュータプログラム)を読み出して実行することで、上述の実施形態において説明された装置の処理を行う。プロセッサ92の一例として、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、FPGA(Field-Programmable Gate Array)、DSP(Demand-Side Platform)、ASIC(Application Specific Integrated Circuit)のうち一つを用いてもよいし、そのうちの複数を並列で用いてもよい。
【0084】
メモリ93は、揮発性メモリや不揮発性メモリ、またはそれらの組み合わせで構成される。メモリ93は、1個に限られず、複数設けられてもよい。なお、揮発性メモリは、例えば、DRAM (Dynamic Random Access Memory)、SRAM (Static Random Access Memory)等のRAM (Random Access Memory)であってもよい。不揮発性メモリは、例えば、PROM (Programmable Random Only Memory)、EPROM (Erasable Programmable Read Only Memory) 等のROM (Random Only Memory)や、SSD(Solid State Drive)であってもよい。
【0085】
メモリ93は、1以上の命令を格納するために使用される。ここで、1以上の命令は、ソフトウェアモジュール群としてメモリ93に格納される。プロセッサ92は、これらのソフトウェアモジュール群をメモリ93から読み出して実行することで、上述の実施形態において説明された処理を行うことができる。
【0086】
なお、メモリ93は、プロセッサ92の外部に設けられるものに加えて、プロセッサ92に内蔵されているものを含んでもよい。また、メモリ93は、プロセッサ92を構成するプロセッサから離れて配置されたストレージを含んでもよい。この場合、プロセッサ92は、I/O(Input/Output)インタフェースを介してメモリ93にアクセスすることができる。
【0087】
以上に説明したように、上述の実施形態における各装置が有する1又は複数のプロセッサは、図面を用いて説明されたアルゴリズムをコンピュータに行わせるための命令群を含む1又は複数のプログラムを実行する。この処理により、各実施の形態に記載された信号処理方法が実現できる。
【0088】
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0089】
以上、実施の形態を参照してこの開示を説明したが、この開示は上記によって限定されるものではない。この開示の構成や詳細には、そのスコープ内で当業者が理解し得る様々な変更をすることができる。
【符号の説明】
【0090】
10 予測モデル生成装置
11 分割部 12 存在確率モデリング部
13 確率分布モデリング部 14 モデル構築部
20 予測システム
21 予測モデル生成部
211 データ仕分け部 212 モデリング部
213 学習済分布統合部 214 記憶部
22 予測部
221 予測モデル選択部 222 出力値計算部
30 予測システム
31 予測モデル生成部
311 データ仕分け部 312 モデリング部
313 学習済分布統合部 314 記憶部
32 予測部
321 予測モデル選択部 322 出力値計算部
図1
図2
図3
図4
図5A
図5B
図6
図7
図8A
図8B
図9
図10A
図10B
図11
図12
図13