(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-17
(45)【発行日】2023-11-28
(54)【発明の名称】情報処理装置、情報処理方法、及びプログラム
(51)【国際特許分類】
G16H 50/30 20180101AFI20231120BHJP
【FI】
G16H50/30
(21)【出願番号】P 2023533327
(86)(22)【出願日】2022-12-12
(86)【国際出願番号】 JP2022045710
(87)【国際公開番号】W WO2023106423
(87)【国際公開日】2023-06-15
【審査請求日】2023-05-31
(31)【優先権主張番号】PCT/JP2022/029350
(32)【優先日】2022-07-29
(33)【優先権主張国・地域又は機関】JP
(31)【優先権主張番号】P 2021200678
(32)【優先日】2021-12-10
(33)【優先権主張国・地域又は機関】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】501138622
【氏名又は名称】エムスリー株式会社
(74)【代理人】
【識別番号】100126000
【氏名又は名称】岩池 満
(74)【代理人】
【識別番号】100154748
【氏名又は名称】菅沼 和弘
(72)【発明者】
【氏名】谷村 格
【審査官】梅岡 信幸
(56)【参考文献】
【文献】特開2021-012603(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00-80/00
(57)【特許請求の範囲】
【請求項1】
第1母集団に属する複数の人の夫々についての健康関連情報と、当該第1母集団における寿命についての第1統計情報とを用いる学習により得られたモデルであって、対象人の前記健康関連情報を入力すると当該対象人の寿命に関する指標を出力するモデルを、全死亡モデルとして取得するモデル取得手段と、
前記対象人が属する第2母集団における前記第1統計情報を取得する統計情報取得手段と、
前記対象人の前記健康関連情報を取得する健康関連情報取得手段と、
取得された前記健康関連情報を前記全死亡モデルに入力した結果として出力される前記指標と、取得された前記第1統計情報とに基づいて、前記対象人の寿命に関する第1種スコアを算出する第1種スコア算出手段と、
を備える情報処理装置。
【請求項2】
前記健康関連情報は、背景情報、健康診断情報、リスク因子情報、生活習慣情報、家族歴情報のうち少なくとも1つを含む、
請求項1に記載の情報処理装置。
【請求項3】
前記第1統計情報は、寿命の生命表の情報を少なくとも含む、
請求項2に記載の情報処理装置。
【請求項4】
前記寿命に関する前記指標は、母集団の推定寿命の分布における前記対象人についての位置であり、
前記第1種スコア算出手段は、前記
第2母集団における前記生命表と、前記第2母集団における前記対象人の位置とに基づいて、前記対象人の寿命に関するスコアを前記第1種スコアとして算出する、
請求項3に記載の情報処理装置。
【請求項5】
前記第1種スコア算出手段は、前記
第2母集団における前記生命表と、前記第2母集団における前記対象人の位置とに基づいて、前記対象人の残存寿命を予測し、予測された前記対象人の残存寿命に対して、前記第2母集団における前記対象人と同年齢の平均寿命で除算した値を前記第1種スコアとして算出する、
請求項4に記載の情報処理装置。
【請求項6】
前記第1種スコアを含む情報を前記対象人の端末に提供する制御を実行する情報提供制御手段、
をさらに備える請求項1に記載の情報処理装置。
【請求項7】
前記モデル取得手段は、前記第1母集団に属する前記複数の人の夫々についての前記健康関連情報と、前記第1母集団における所定の健康状態についての第2統計情報とを用いる学習により得られたモデルであって、対象人の前記健康関連情報を入力すると当該対象人の前記所定の健康状態に関する指標を出力するモデルを、健康状態モデルとしてさらに取得し、
統計情報取得手段は、前記対象人が属する前記第2母集団における前記第2統計情報をさらに取得し、
前記健康関連情報取得手段により取得された前記対象人の前記健康関連情報を前記健康状態モデルに入力した結果として出力される前記指標と、取得された前記第2統計情報とに基づいて、前記対象人の前記所定の健康状態に関する第2種スコアを算出する第2種スコア算出手段と、
をさらに備え、
前記情報提供制御手段は、さらに前記第2種スコアを含む前記情報を前記対象人の前記端末に提供する制御を実行する、
請求項6に記載の情報処理装置。
【請求項8】
前記所定の健康状態は、疾患、コンセプト解釈及び複合概念のうち少なくとも1以上の健康状態であって、
前記第2種スコアは、前記1以上の健康状態の夫々に関するスコアを含む、
請求項7に記載の情報処理装置。
【請求項9】
前記全死亡モデル及び前記健康状態モデルの夫々の出力結果のうち少なくとも一部に基づいて、前記第1種スコアを改善するための前記対象人が行うべき活動を示す改善活動に関する情報を生成する改善活動情報生成手段、
をさらに備え、
前記情報提供制御手段は、さらに前記改善活動に関する情報を含む前記情報を前記対象人の前記端末に提供する制御を実行する、
請求項8に記載の情報処理装置。
【請求項10】
情報処理装置が実行する情報処理方法であって、
第1母集団に属する複数の人の夫々についての健康関連情報と、当該第1母集団における寿命についての第1統計情報とを用いる学習により得られたモデルであって、対象人の前記健康関連情報を入力すると当該対象人の寿命に関する指標を出力するモデルを、全死亡モデルとして取得するモデル取得ステップと、
前記対象人が属する第2母集団における前記第1統計情報を取得する統計情報取得ステップと、
前記対象人の前記健康関連情報を取得する健康関連情報取得ステップと、
取得された前記健康関連情報を前記全死亡モデルに入力した結果として出力される前記指標と、取得された前記第1統計情報とに基づいて、前記対象人の寿命に関する第1種スコアを算出する第1種スコア算出ステップと、
を含む情報処理方法。
【請求項11】
コンピュータに、
第1母集団に属する複数の人の夫々についての健康関連情報と、当該第1母集団における寿命についての第1統計情報とを用いる学習により得られたモデルであって、対象人の前記健康関連情報を入力すると当該対象人の寿命に関する指標を出力するモデルを、全死亡モデルとして取得するモデル取得ステップと、
前記対象人が属する第2母集団における前記第1統計情報を取得する統計情報取得ステップと、
前記対象人の前記健康関連情報を取得する健康関連情報取得ステップと、
取得された前記健康関連情報を前記全死亡モデルに入力した結果として出力される前記指標と、取得された前記第1統計情報とに基づいて、前記対象人の寿命に関する第1種スコアを算出する第1種スコア算出ステップと、
を含む制御処理を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
従来、ユーザの所定の疾患に対するリスクを提示する技術が存在した(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載の技術を含む従来技術では、分析対象となる所定の疾患を罹患した患者の情報等に基づいて、その所定の疾患を罹患するリスクの因子を抽出し、そのリスクの因子を有するユーザに対して、リスクが高い旨を通知するに過ぎなかった。
各種各様な健康に関するアウトカム(情報)の提示が望まれていた。即ち、総合的な健康に関する情報の提供が望まれていた。また例えば、近年、健康に関する情報の精度の向上も望まれていた。
【0005】
本発明は、健康に関する情報の提供における、精度や利便性を向上させることを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本発明の一態様の情報処理装置は、
第1母集団に属する複数の人の夫々についての健康関連情報と、当該第1母集団における寿命についての第1統計情報とを用いる学習により得られたモデルであって、対象人の前記健康関連情報を入力すると当該対象人の寿命に関する指標を出力するモデルを、全死亡モデルとして取得するモデル取得手段と、
前記対象人が属する第2母集団における前記第1統計情報を取得する統計情報取得手段と、
前記対象人の前記健康関連情報を取得する健康関連情報取得手段と、
取得された前記健康関連情報を前記全死亡モデルに入力した結果として出力される前記指標と、取得された前記第1統計情報とに基づいて、前記対象人の寿命に関する第1種スコアを算出する第1種スコア算出手段と、
を備える。
【0007】
本発明の一態様の情報処理方法及びプログラムの夫々は、上述の本発明の一態様の情報処理装置に対応する情報処理方法及びプログラムの夫々である。
【発明の効果】
【0008】
本発明によれば、健康に関する情報の提供における、精度や利便性を向上させることができる。
【図面の簡単な説明】
【0009】
【
図1】本発明の一実施形態に係る判定装置を含む情報処理システムが適用されるサービスの概要の一例を説明する模式図である。
【
図2】本発明の一実施形態にかかる判定装置を含む情報処理システムの構成の例を示す図である。
【
図3】
図2の情報処理システムのうち、本発明の情報処理装置の一実施形態に係る判定装置のハードウェア構成の一例を示すブロック図である。
【
図4】
図3の判定装置の機能的構成の一例を示す機能ブロック図である。
【
図5】
図4の機能的構成を有するサーバにより実行されるリクエスト推定処理の流れの一例を説明するフローチャートである。
【
図6】
図1の学習装置における学習のフローを示す概念図である。
【
図7】
図4の機能的構成を有する判定装置により提供されるスコアの種類を概念的に示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して、本発明の実施形態について説明する。
【0011】
図1は、本発明の一実施形態に係る判定装置を含む情報処理システムが適用されるサービス(以下「本サービス」と呼ぶ)の概要の一例を説明する模式図である。
【0012】
本サービスは、ユーザの健康状態に関する情報を提供するサービスである。
【0013】
具体的には、本サービスは、図示せぬサービス提供者により提供されて、ユーザやユーザにより当該ユーザの健康状態に関する情報の提供を許諾された者(例えば、ユーザの契約しようとしている保険会社や、雇用先等)により利用されるサービスである。以下、本サービスの利用者はユーザであるものとして説明する。
【0014】
ここで、図示せぬサービス提供者は、学習装置1や判定装置2を管理することにより、ユーザ端末3を利用するユーザに対してに本サービスを提供する。
【0015】
以下、
図1のステップST1乃至ST7に沿って、本サービスの流れの概要について説明する。
ステップST1において、学習装置1は、前処理を実行する。
ここで、学習装置1は、後述する全死亡モデル4及び個別モデル5を生成又は更新するべく、所定のアルゴリズムによる学習処理を実行する。
なお、所定のアルゴリズムとして、ヒューリスティックなモデル構築アルゴリズムが採用されるものとして説明するが、所定のアルゴリズムには、機械学習を用いたアルゴリズムやアンサンブルモデルのためのアルゴリズム等、任意のアルゴリズムが採用され得る。
【0016】
学習装置1は、学習処理において、以下のデータを用いる。
即ち、学習装置1は、第1国に属する複数の人の夫々の「健康関連パラメータ」を用いて学習処理を実行する。
ある人の「健康関連パラメータ」とは、その人の健康に関連すると考えられるパラメータである。具体的には例えば、「健康関連パラメータ」には、基本的な背景情報(性別・年齢含む)、年次健康診断データ、中核のリスク因子、生活習慣のデータ、家族歴等の項目が含まれてもよい。ただし、健康関連パラメータは、これらに限られない。特に、本サービスでは、論文等のエビデンスにおいて新たに健康に関連すると考えられるパラメータが発見又は削除された場合、柔軟に任意の項目を増減することができる。
また、健康関連パラメータは、対象となる人により、全項目の情報であってもよいし、一部の項目であってもよい。本サービスでは、健康関連パラメータの項目により、学習結果を用いた判定処理の結果の精度についての情報もユーザに提示することができる。
【0017】
また、学習装置1は、第1国における「統計データ」を用いて学習処理を実行する。
即ち、「統計データ」とは、所定の範囲に属する複数の人に対応する母集団の健康に関連する統計データである。
具体的には例えば、統計データには、寿命の統計データ(生命表)、死亡率ランク、分布(帯域幅)、予測値のバウンディング解析の項目が含まれてもよい。ただし、統計データはこれらに限られない。詳しくは後述するが、本サービスでは、寿命の統計データを用いて、寿命に関するスコアをユーザに提示することができるが、その他の健康状態に関連するスコアもユーザに提示することができる。統計データには、その他の健康状態のスコアの算出に用いられる各種各様な統計データも採用され得る。
また、バウンディング解析とは、分布関数の特定の形を仮定せずに、パラメータの不確実性を組み込む新しいアプローチをいう。後述する、全死亡モデルと、統計データを用いたアプローチは、バウンディング解析の具体例である。
【0018】
ここで、学習装置1は、第1国の統計データを用いていることを特徴としている。即ち、学習装置1は、第1国に属する複数の人の夫々の「健康関連パラメータ」を用いるとともに、第1国の統計データを用いることで、第1国に属する人に良く合致した学習処理を実行することができる。これにより、第1国に属する人に良く合致した推論処理を実行可能なモデルが生成又は更新されるのである。
なお、学習装置1は、学習処理において、「各種健康データ」も利用する。即ち、学習装置1が利用する統計データは第1国といった特定の国に限定されない統計データも各種健康データとして用いる。また例えば、学習装置1は、学習処理において世界中の公表論文や運動量、飲酒量、病気や検査値の寿命への影響度等に関する情報を、各種健康関連データとし手用いる。即ち、学習装置1は、第1国に限定されない統計データを、モデル生成におけるエビデンスとして利用して、より精度の高い学習処理を可能としているのである。
【0019】
学習装置1は、前処理において、データマッピング、データアライメント、データクリーニング、各データセットへの分割を行う。
ここで、データマッピングとは、生データを学習処理に合わせて調整する処理である。具体的には例えば、データベース間での統合が可能となるようにデータの基準を一致させる処理等をいう。
また、データアライメントとは、データアクセスの効率を向上させることを目的として装置内のデータを設計に合うように配置する等の処理をいう。
また、データクリーニングとは、ノイズデータの除去や名寄せの処理をいう。
また、各データセットへの分割とは、学習用、テスト用、バリデーションチェック用への分割等の処理をいう。
このように、前処理により、健康関連パラメータや統計データが処理され、効率的に学習処理が実行される。
【0020】
次にステップST2において、学習装置1は、前処理された健康関連パラメータのうちトレーニングデータおよびテストデータ、並びに、第1国の統計データ及び各種統計データに基づいて、モデル生成を行う。
具体的には、学習装置1は、少なくとも第1国に属する複数の人の夫々の健康関連パラメータ及び第1国における統計データを用いて、第1国に属する人の全死亡モデル4を生成する。
全死亡モデルとは、処理対象の人の健康関連パラメータに基づいて、母集団の寿命の分布における対象人の寿命についてのリスクの位置を示す情報を出力するモデルである。
具体的には例えば、全死亡モデルによれば、例えば、対象人が健康的であることを示す健康関連パラメータが入力された場合、第1国の母集団の寿命の分布における上位10%であるといった位置の情報が出力される。なお、位置の情報は、任意の形態をとることができる。具体的には例えば、位置の情報は、100人中における10位といった順位の情報であってもよい。
ヒューリスティックなモデル構築アルゴリズムにおいては、「経験則や先入観に基づく判断」が行われる。即ち、論文等に基づく一般的に考えられている傾向と矛盾しないデータが得られる否かにより、モデルの生成が行われる。例えば、「同じ健康状態なのに女性の方が男性より寿命が短い」、「平均寿命は年々、徐々に延びているにもかかわらず、若い世代の寿命の将来予測の方が高齢者より短い」、「飲酒量が多い方が寿命延長にプラスに働いている」、「検査値の異常の程度と臨床で報告されている疾患の程度などの情報」等の観点に齟齬が無いことが、確認されることにより、モデルが生成される。
【0021】
次に、ステップST3において、学習装置1は、前処理された健康関連パラメータのうちバリデーションデータに基づいて、生成された全死亡モデル4のバリデーションチェックを行う。これにより、全死亡モデル4の精度、結果の確からしさ(例えば、平均誤差)を算出することが可能となる。
バリデーションは、例えば、寿命が分かっている参加者データ(すでに死亡した第1国の人)の実際の寿命と、モデルから算出した予測値と比較することにより行われる。
【0022】
次に、ステップST4において、学習装置1は、全死亡モデル4のモデル更新を行う。即ち、健康関連パラメータや統計データのデータ量の増加や、新たな論文等に基づくモデルの更新等に際して、全死亡モデル4は更新され、精度の向上が行われる。
【0023】
図示は省略するが、上述のステップST1乃至ST4と同様の処理により、所定の「健康状態」について、個別モデル5が生成又は更新される。
ここで、「健康状態」とは、所定の「疾患」、「コンセプト解釈」、「複合概念」「その他健康アウトカム関連情報」のことをいう。
ここで、「コンセプト解釈」や「複合概念」とは、健康状態、健康意識などを比喩的に表現したスコアをいう。具体的には例えば、「心臓年齢」、「肌年齢」、「ライフスタイルスコア」などが含まれる。即ち、心臓年齢とは、心臓発作や脳卒中を起こすリスクの高さを示すものである。また、肌年齢とは、肌がどの年齢の水準にあるかを表した数値である。また、ライフスタイルスコアとは、飲酒、喫煙、運動などのスコアを合算したスコアである。このように、コンセプト解釈とは、所定のコンセプトにより解釈されたスコアである。また、複合概念とは、複数の要因を複合的にとらえたスコアである。
即ち、詳しくは後述するが、本サービスでは所定の疾患になるリスクに関する情報がユーザに提示される。また、コンセプト解釈や複合概念といった各種各様な健康アウトカム関連情報がユーザに提示される。
【0024】
次に、ステップST5において、判定装置2は、処理対象のユーザに対して提示されるヘルススコアのうち、寿命に関する判定処理を実行する。
ここで、「ヘルススコア」とは、長期的な健康アウトカムを改善するために健康を定量化し、短期的及び長期的な致死率、健康状態のリスクを予測するものである。ヘルススコアの具体例は、後述する。
【0025】
本サービスでは、処理対象のユーザは学習処理が行われた第1国とは異なる第2国に属するユーザに対して、ヘルススコアを提供することができる。ここで、第1国と第2国では、医療の提供状況や、基本的な平均寿命等、統計的に異なるデータとなるのが通常である。
判定装置2は、判定処理において、以下のデータを用いる。
判定装置2は、第2国に属するユーザの「健康関連パラメータ」を用いて判定処理を実行する。
また、判定装置2は、第2国における「統計データ」を用いて判定処理を実行する。
【0026】
これにより、判定処理において、第2国に属するユーザの健康関連情報と、第2国における統計データが用いられる。これにより、第1国に属する人の健康関連情報と第1国における統計データを用いて学習処理により生成又は更新された全死亡モデル4を第2国のユーザに適用可能となるのである。
寿命判定により、ユーザに対して提示されるヘルススコアのうち、メインとなる寿命に関する情報が生成される。
【0027】
また、ステップST6において、上述のステップST5と基本的に同様に、個別モデル5に基づいて、ユーザの所定の健康状態に関するスコアが判定される。
健康状態判定により、ユーザに対して提示されるヘルススコアのうち、サブとなる所定の疾患等についてのリスク(絶対、カテゴリカル、相対)、頻度を言葉で説明、コンセプト解釈や複合概念に関する情報が生成される。
【0028】
次に、ステップST7において、判定装置2は、ユーザの改善行動の情報を生成する。
即ち、ユーザの寿命や、各種スコアの算出結果や、算出過程の情報等に基づいて、そのユーザの寿命に影響する要素(例えば、疾患のリスク)を改善するための行動の情報が生成される。
そして、生成された改善行動の情報は、ユーザに提示される。
【0029】
このように、第2国に属するユーザのユーザ端末3には、主として寿命に関する情報を含み、所定の健康状態の情報を含むヘルススコアと、ヘルススコアを改善するための改善行動の情報が提示される。
【0030】
そして、本サービスでは、学習処理と判定処理において異なる国の人(ユーザ)の情報を用いて処理を行うことができる。これにより、以下のような効果を奏する。
即ち、学習処理においては、多量の信頼できる健康関連パラメータと、統計データがあることで、モデルの精度が向上する。そこで、第1国として、医療に関する論文調査がよくなされている国のデータを用いることができる。
しかしながら、上述したように、そのように生成されたモデルと、他の国(第2国)のユーザの健康関連パラメータを用いて判定処理を実行しても、精度の良い判定結果は得られない。そこで、本サービスでは、学習処理において第1国の統計データを用い、また、判定処理において第2国の統計データを用いることにより、第1国のモデルを第2国のユーザの判定に利用可能としているのである。
【0031】
ここで、学習処理において第1国の統計データを用い、また、判定処理において第2国の統計データを用いるにあたり、全死亡モデル4及び個別モデル5は、それぞれ、統計データの分布内における位置の指標を出力するモデルとしている。即ち、健康状態パラメータにより、その国の人(母集団)における位置が算出される。そして、その位置を前提として、第2国の分布を再現するためにはその位置のユーザは分布において具体的にどのようなスコア(寿命)となるのかが判定されるのである。
【0032】
図2は、本発明の一実施形態にかかる判定装置を含む情報処理システムの構成の例を示す図である。
図2に示す情報処理システムは、学習装置1と、判定装置2と、ユーザ端末3と、全死亡モデル4と、個別モデル5とを含むように構成される。
【0033】
学習装置1は、
図1のステップST1乃至ST4の処理を実行することにより、全死亡モデル4及び個別モデル5を生成又は更新する。
判定装置2は、学習装置1により学習された結果得られる(又は更新される)モデルを全死亡モデル4及び個別モデル5から取得して、ユーザの寿命や健康状態を判定する。判定装置2の機能的構成や処理の詳細については、
図4等を参照して後述する。
ユーザ端末3は、ユーザにより利用される情報処理装置であって、ユーザにより健康関連情報が入力又は判定装置2への提供の許可のための操作を受け付ける。
全死亡モデル4は、処理対象の人の健康関連パラメータに基づいて、母集団の寿命の分布における対象人の寿命についてのリスクの位置を示す情報を出力するモデルのデータが格納される。
個別モデル5は、所定の疾患やコンセプト解釈、複合概念などの健康アウトカム関連情報を出力するモデルのデータが格納される。
【0034】
図3は、
図2の情報処理システムのうち、本発明の情報処理装置の一実施形態に係る判定装置のハードウェア構成の一例を示すブロック図である。
【0035】
判定装置2は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、出力部16と、入力部17と、記憶部18と、通信部19と、ドライブ20とを備えている。
CPU11は、ROM12に記録されているプログラム、又は、記憶部18からRAM13にロードされたプログラムに従って各種の処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
【0036】
CPU11、ROM12及びRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。入出力インターフェース15には、入力部16、出力部17、記憶部18、通信部19、及びドライブ20が接続されている。
入力部16は、キーボードやマウス等で構成され、ユーザの指示操作に応じて各種情報を入力する。
出力部17は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
記憶部18は、ハードディスク等で構成され、各種情報のデータを記憶する。
【0037】
通信部19は、ネットワークを介して他の端末(例えば
図1のモデルDB2)との間で行う通信を制御する。
ドライブ20には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア31が適宜装着される。ドライブ20によってリムーバブルメディア31から読み出されたプログラムは、必要に応じて記憶部18にインストールされる。また、リムーバブルメディア31は、記憶部18に記憶されている各種データも、記憶部18と同様に記憶することができる。
【0038】
なお、図示はしないが、
図2の情報処理システムの学習装置1は
図4に示すハードウェア構成と基本的に同様の構成を有している。
また、
図2の情報処理システムのユーザ端末3は
図4に示すハードウェア構成と基本的に同様の構成を有している。ユーザ端末3には、入力部と出力部を兼ねるタッチパネル等が採用されていてもよい。
また、説明の便宜上、学習装置1は、判定装置2とは別途設けるものとしたが、特にこれに限定されず、学習装置1と、判定装置2との各機能を1台の情報処理装置に集約してもよい。
また、
図2において、全死亡モデル4及び個別モデル5は、学習装置1及び判定装置2とは別に設けられるものとしたが、例えば、判定装置2の記憶部18の一部の領域に設けられてもよい。
【0039】
図4は、
図3の判定装置の機能的構成の一例を示す機能ブロック図である。
【0040】
モデル取得部51は、第1国に属する複数の人の夫々についての健康関連情報と、少なくとも第1国における寿命についての第1統計情報とを用いる学習により得られたモデルであって、対象人の健康関連情報を入力すると対象人の寿命に関する指標を出力する全死亡モデル4の情報を取得する。なお、上述した通り、全死亡モデル4の学習処理時には、第1国以外の統計データも適宜用いられる。
また、モデル取得部51は、第1国に属する複数の人の夫々についての健康関連情報と、第1国における所定の健康状態についての第2統計情報とを用いる学習により得られたモデルであって、対象人の健康関連情報を入力すると当該対象人の所定の健康状態に関する指標を出力する個別モデル5をさらに取得する。
ここで、指標は、母集団における対象人についての位置である。具体的には例えば、寿命に関する指標は、母集団の推定寿命の分布における対象人についての位置であって、死亡リスクの順位に相当するものを採用することができる。
【0041】
統計情報取得部52は、対象人が属する第2国における寿命に関する第1統計情報を取得する。具体的には例えば、第1統計情報には、寿命の生命表の情報が含まれている。ここで、生命表とは、人口統計学における、特定の年齢層・性別に対して、死亡率や平均余命を示す表である。
また、統計情報取得部52は、対象人が属する第2国における所定の健康状態に関する第2統計情報をさらに取得する。
なお、統計情報は生命表に限定されず、政府発表、公表論文などの寿命、予後、疾患分布、罹患率、患者数等が含まれている。
【0042】
健康関連情報取得部53は、ユーザの健康関連情報を取得する。ここで健康関連情報には、背景情報、健康診断情報、リスク因子情報、生活習慣情報、家族歴情報、現在の健康状態、服薬状況、既往歴のうち少なくとも1つが含まれている。
【0043】
第1種スコア算出部54は、取得された健康関連情報を全死亡モデル4に入力した結果として出力される指標と、取得された第2国の第1統計情報とに基づいて、ユーザを対象人として、当該ユーザの寿命に関する第1種スコアを算出する。
第1種スコア算出部54は、第2国における生命表と、第2国における対象人の位置とに基づいて、対象人の寿命に関するスコアを第1種スコアとして算出する。
ここで、第1種スコアには、寿命そのものやEBHS(EVIDENCE-BASED HEALTH SCORE)スコアが含まれていてよい。EBHSスコアとは、予測された対象人の残存寿命に対して、第2国における対象人と同年齢の平均寿命で除算した値である。
即ち、第1種スコア算出部54は、第2国における生命表と、第2国における対象人の位置とに基づいて、対象人の残存寿命を予測し、予測された対象人の残存寿命に対して、第2国における対象人と同年齢の平均寿命で除算した値をEBHSスコアとして算出する。
EBHSスコアは、100の場合平均的、100より大きい場合平均より長生き、100より小さい場合平均より短命であることを意味する。
【0044】
第2種スコア算出部55は、健康関連情報取得部53により取得された対象人の健康関連情報を個別モデル5に入力した結果として出力される指標と、取得された第2統計情報とに基づいて、対象人の所定の健康状態に関する第2種スコアを算出する。
ここで、所定の健康状態は、疾患、コンセプト解釈及び複合概念のうち少なくとも1以上の健康状態である。即ち、第2種スコアは、1以上の健康状態の夫々に関するスコアを含む。
【0045】
改善活動生成部56は、全死亡モデル4及び個別モデル5の夫々の出力結果のうち少なくとも一部に基づいて、第1種スコアを改善するための対象人が行うべき活動を示す改善活動に関する情報を生成する。
【0046】
情報提供制御部57は、第1種スコアを含む情報をユーザ端末3に提供する制御を実行する。
情報提供制御部57は、さらに第2種スコアや改善行動に関する情報をユーザ端末2に提供する制御を実行することができる。
【0047】
図5は、
図4の機能的構成を有する判定装置におけるインプットとアウトプットの概要を説明する図である。
図5に示すように、インプットには健康関連パラメータが含まれる。健康関連パラメータには、2項目の人口動態と、47の年次健康診断結果と、1のその他のリスク因子と、3の生活様式のリスク因子と、7の家族歴とが含まれる。そして、インプットには、将来において精度向上に資するパラメータを追加因子として柔軟に対応することができる。
【0048】
このようなインプットを前提として、本サービスでは緻密なデータアプローチを行うことで、精度の高いアウトプットを得ることができる。即ち、ヘルススコアへの影響についての探索コンポーネントとして、ヒューリスティックなアプローチが用いられている。即ち、論文等に基づく一般的に考えられている傾向と矛盾しないデータが得られるか否かにより、モデルの生成が行われる。
これにより、上述の多数の項目からなる健康関連パラメータをインプットとして、当該インプットを用いてヒューリスティックな手法で妥当性のある全死亡モデル4や個別モデル5の構築が可能となる。
【0049】
そして、このように学習処理により生成された全死亡モデル4や個別モデル5を用いて、アウトプットの生成がなされる。
【0050】
ここで、全死亡モデル4や個別モデル5は、第1国の統計データや各種統計データといった総人年にして1億以上のデータに基づいて算出される。即ち、上述したように、十分なデータの蓄積のある第1国のデータに基づいて、学習処理が行われるため、学習モデル(全死亡モデル4や個別モデル5)の精度が向上するのである。
なお、ここでは説明を省略するが、
図1や
図4を用いて上述したように、本サービスの判定処理においては、第2国のユーザに対して適切にモデルを用いて判定を行うことができる。即ち、本サービスは、十分なデータの蓄積のない国のユーザに対しても適切に判定を行うことができるのである。
【0051】
そして、アウトプットにおいて、主要な項目として寿命に関するスコアがユーザに提供される。具体的には例えば、寿命に関するスコアとして、寿命そのもの(例えば、
図5の例においては90歳)、または、EBHSスコアが提示される。
また、アウトプットにおいて、サブスコアは構成自在となっている。即ち、ユーザは、ユーザ自身の望む所定の疾患やコンセプト解釈、複合概念、その他健康アウトカム関連情報をユーザ端末3に表示させることができる。また、その表示形式も自由に設定可能となっている。
これにより、ユーザは、寿命を前提として、その寿命に影響し得る疾患やコンセプト解釈、複合概念、その他健康アウトカム関連情報を把握することで、寿命を延ばすための活動に取り組むことができるようになるのである。
【0052】
図6は、
図1の学習装置における学習のフローを示す概念図である。
図6に示すように、まず、第1国の複数の人の健康パラメータが学習用データとして取得される。そして、モデル構築(生成又は更新)が行われる。このとき、ローデータの準備として、マッピング、アライメント、データクリーニング、各データセットへの分割が行われる。これにより、上述したように、全死亡モデル4が生成される。
【0053】
次に、全死亡モデル4を用いて、寿命のヒューリスティック分析が行われる。このとき、ヒューリスティックのためのチューニングや検証として、死亡率ランク、生命表、分布帯域幅、予測値のバウンディングの情報が用いられる。これにより、全死亡モデル4から寿命のヒューリスティックな分析が行われ、寿命の算出が可能となる。
【0054】
次に、バリデーションチェックが行われる。即ち、全死亡モデル4とヒューリスティックな寿命の検証結果が妥当であるかの検証が行われる。検証により、精度が低いと判断された場合、再度モデル構築が行われることで、繰り返し改善がなされる。また、精度が高いと判断された場合、その全死亡モデル4が採用される。ただし、精度の高い全死亡モデル4が得られた場合であっても、適宜、学習用データの更新、ユーザデータの増加等に伴い、モデルの再構築(更新、繰り返し改善)が行われる。
【0055】
図7は、
図4の機能的構成を有する判定装置により提供されるスコアの種類を概念的に示す図である。
図7に示すように、スコアの種類には、「寿命」、「絶対リスク」、「カテゴリカルリスク」、「相対リスク」、「頻度を言葉で説明」、「コンセプト概念や複合概念」が含まれ得る。
ここで、寿命は、最も重要な(鍵となる)スコアである。
即ち、寿命は、ありとあらゆる疾患や健康状態を反映するものである、寿命、あるいは、上述のEBHSスコアを改善することが、ユーザ自身の目指すべき目標となるものである。
そして、寿命のほかに提供される情報として、「絶対リスク」、「カテゴリカルリスク」、「相対リスク」は、所定の疾患等に罹患するリスクである。リスクは、絶対、カテゴリ、相対等各種各様な形態を採用することができる。
絶対、カテゴリ、相対の形態は、ユーザが選択することもできるし、疾患の種類や判定の精度により異ならせてもよい。
【0056】
また、頻度を言葉で説明とは、所定の行動の頻度を文章により説明するものである。具体的には例えば、「飲酒量が多い」や「飲酒量を半分にすべき」、「運動量が十分」や「毎日1時間あるくべき」といった説明は、頻度を言葉で説明の一例である。また例えば、単に、運動量について「グッジョブ」といった、称賛する言葉も、頻度を言葉で説明する一例である。なお、言葉の文字列のみならず、言葉に対応した絵文字やアイコンが用いられてもよい。
【0057】
以上本発明の一実施形態について説明したが、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での、変形、改良等は本発明に含まれるものである。
【0058】
例えば、改善行動生成部56は、以下のようにして改善行動を提示することが出来る。
即ち例えば、まず、改善行動生成部56は、対象人ごとに、健康関連情報の各因子が第1種スコア(寿命そのものやEBHS)与える影響値を算出する。
ここで、健康関連情報には、上述したように、因子とは、第1種スコア(寿命そのものやEBHS)を算出する際に用いる変数であり、背景情報、健康診断情報、リスク因子情報、生活習慣情報、家族歴情報等を含む。
【0059】
改善行動生成部56が、対象人ごとに、健康関連情報の各因子が第1種スコア(寿命そのものやEBHS)与える影響値を算出する方法には、任意の手法が用いられる。
具体的には例えば、改善行動生成部56は、第1の手法として、対象人自分以外のサンプルに注目し、対象人自身に近いk Nearest Neighborを取り出し全体と比較することで、影響値を算出することができる。
即ち、第1の手法は、各因子毎に、その印紙の値だけが自分に近い集団を抜き出し、その集団が全体に比べて寿命が大きく離れているものは自分にとって重要な因子であるとする手法である。
【0060】
また例えば、改善行動生成部56は、第2の手法として、全死亡モデル4自体に着目し、該当因子の値を少し変えた時の第1種スコアの変動を見ることで、当該因子の値による影響を算出することができる。
即ち、第2の手法は、寿命を算出するモデルそのものに着目することで、因子の値だけを変動させたときの寿命の変動が大きなものが、重要な因子であるとする手法である。
第2の手法においては、所定のLIME (local interpretable model-agnostic explanations)を用いることができる。
【0061】
また例えば、改善行動生成部56は、第3の手法として、全死亡モデル4の学習プロセスにおいて、該当因子に特徴があることでモデルの学習精度がどれだけ向上しているかに基づいて、当該因子の値による影響を算出することができる。
即ち、第3の手法は、全死亡モデル4の全体での重要度が定義され、その因子の値がなかった場合において、学習プロセスの性能が変動する大きさが大きい、学習プロセスにおける重要度が高いものを、当該因子の値による第1種スコアへの影響が大きいとして算出することができる。
第3の手法においては、Permutation Importance等を用いることが出来る。
【0062】
なお、上述したように、改善行動生成部56が、対象人ごとに、健康関連情報の各因子が第1種スコア(寿命そのものやEBHS)与える影響値を算出する方法には、任意の手法が用いられる。さらに言えば、改善行動生成部56は、複数の手法の結果に基づいて、健康関連情報の各因子が第1種スコア(寿命そのものやEBHS)与える影響値を算出することもできる。
【0063】
このようにして、改善行動生成部56は、対象人ごとに、健康関連情報の各因子が第1種スコア(寿命そのものやEBHS)与える影響値を算出する。
そして、改善行動生成部56は、影響値や影響値に基づいて生成された情報を、対象人に対して改善行動に関する情報として提示することが出来る。
具体的には例えば、Aさんという対象人に対して、EBHSが107.8、寿命が90.82歳、という第1種スコアに加えて、運動習慣の影響値が3.5、収縮期血圧の影響値が4.2、空腹時血糖の影響地が2.7、と、各因子の影響値を改善行動に関する情報として提示することが出来る。
これにより、Aさんは、自身の第1種スコアに対しての影響値の高い因子について、改善行動をとることで第1種スコアを改善することが出来ると把握することが可能となる。
【0064】
また、本サービスでは、第1種スコアや第2種スコア、改善行動の情報を、対象人の所属する組織の管理者(例えば、人事部の担当者や産業医等)に対して、提示することが出来る。即ち、管理者は、当該組織に属する各対象人の第1種スコアや第2種スコア、改善行動の情報を把握することが出来る。
具体的には例えば、組織の管理者には、その組織に所属する対象人という母集団を、他の母集団(例えば、自国という母集団)と比較した統計情報が提示される。
また例えば、組織の管理者には、その組織に所属する対象人の夫々の第1種スコアや第2種スコア、改善行動の情報が提示される。
これにより、組織の管理者は、組織内における対象人の管理に利用することで、その組織全体として、より良好な環境づくりが可能となるのである。
【0065】
上述の実施形態の説明において、寿命判定の学習処理時の第1国及び推論処理時の第2国は、寿命判定の学習処理時の第1国及び推論処理時の第2国と同一のものとして説明したが、特にこれに限定されない。
即ち例えば、全死亡モデル4の学習処理において(少なくとも)第1-1国の統計データが用いられ、個別モデル5の学習処理において(少なくとも)第1-1国とは異なる第1-2国の統計データが用いられてもよい。
【0066】
また、上述の実施形態の説明において個別モデル5は、学習処理によって生成又は更新されるものとしたが、特にこれに限定されない。個別モデル5は、本発明の情報処理システム(学習装置1や判定装置2)以外のシステムにより生成又は更新された所定のモデルが採用されてもよい。即ち、判定処理においては、学習処理によって生成又は更新されたある健康状態に関する個別モデル5のほか、他のシステムにより生成又は更新された別の健康状態に関する個別モデル5も採用され得る。これにより、本サービスのユーザたる対象者は、各種各様な健康状態に関する個別モデル5の推論結果をヘルススコアとして確認することができる。
【0067】
また、上述の実施形態の説明において、スコアや改善行動はユーザ端末3を介してユーザに提示されるものとしたが、特にこれに限定されない。即ち例えば、スコアや改善行動は、所定の媒体に記録されてユーザに提示されてもよい。具体的には例えば、サービス提供者は、判定装置2により判定されたスコアや改善行動を紙媒体に印刷してユーザに提供することで提示してもよい。
【0068】
例えば、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、
図4の機能的構成は例示に過ぎず、特に限定されない。
即ち、上述した一連の処理を全体として実行できる機能が情報処理システムに備えられていれば足り、この機能を実現するためにどのような機能ブロックやデータベースを用いるのかは特に
図4の例に限定されない。また、機能ブロックの存在場所も、
図4に特に限定されず、任意でよい。例えば、判定装置2の機能ブロックを学習装置1等に移譲させてもよい。また、学習装置1の機能ブロックを判定装置2等に移譲させてもよい。更に言えば、学習装置1と判定装置2は、同じハードウェアでもよい。
【0069】
また例えば、一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。
また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えばサーバの他汎用のスマートフォンやパーソナルコンピュータであってもよい。
【0070】
また例えば、このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図示せぬリムーバブルメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。
【0071】
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。
【0072】
以上を換言すると、本発明が適用される情報処理装置は、次のような構成を有する各種各様の実施形態を取ることができる。
【0073】
第1母集団(例えば、第1国)に属する複数の人の夫々についての健康関連情報と、当該第1母集団における寿命についての第1統計情報とを用いる学習により得られたモデルであって、対象人の前記健康関連情報を入力すると当該対象人の寿命に関する指標を出力するモデルを、全死亡モデル(例えば、
図4の全死亡モデル4)として取得するモデル取得手段(例えば、
図4のモデル取得部51)と、
前記対象人が属する第2母集団(例えば、第2国)における前記第1統計情報を取得する統計情報取得手段(例えば、統計情報取得部52)と、
前記対象人の前記健康関連情報を取得する健康関連情報取得手段(例えば、健康関連情報取得部53)と、
取得された前記健康関連情報を前記全死亡モデルに入力した結果として出力される前記指標と、取得された前記第1統計情報とに基づいて、前記対象人の寿命に関する第1種スコア(例えば、寿命)を算出する第1種スコア算出手段(例えば、第1種スコア算出部54)と、
を備えれば足りる。
これにより、第1国に属する人の健康関連情報及び第1国に関する統計情報に基づいてモデルを作成し、第2国に属する対象人の判定を精度よく行うことができる。
即ち例えば、高統計な健康関連情報のある第1国のデータに基づいて学習を行い、第1国とは異なる統計データを有する第2国の対象人の判定を精度よく行うことができる。
【0074】
前記健康関連情報は、背景情報、健康診断情報、リスク因子情報、生活習慣情報、家族歴情報、現在の健康状態、服薬状況、既往歴のうち少なくとも1つを含む、ことができる。
【0075】
前記第1統計情報は、寿命の生命表の情報を少なくとも含む、ことができる。
【0076】
前記寿命に関する前記指標は、母集団の推定寿命の分布における前記対象人についての位置であり、
前記第1種スコア算出手段は、前記2母集団における前記生命表と、前記第2母集団における前記対象人の位置とに基づいて、前記対象人の寿命に関するスコアを前記第1種スコアとして算出する、ことができる。
【0077】
前記第1種スコア算出手段は、前記2母集団における前記生命表と、前記第2母集団における前記対象人の位置とに基づいて、前記対象人の残存寿命を予測し、予測された前記対象人の残存寿命に対して、前記第2母集団における前記対象人と同年齢の平均寿命で除算した値を前記第1種スコアとして算出する、ことができる。
【0078】
前記第1種スコアを含む情報を前記対象人の端末に提供する制御を実行する情報提供制御手段(例えば、
図4の情報提供制御部57)、
をさらに備えることができる。
【0079】
前記モデル取得手段は、前記第1母集団に属する前記複数の人の夫々についての前記健康関連情報と、前記第1母集団における所定の健康状態についての第2統計情報とを用いる学習により得られたモデルであって、対象人の前記健康関連情報を入力すると当該対象人の前記所定の健康状態に関する指標を出力するモデルを、健康状態モデルとしてさらに取得し、
統計情報取得手段は、前記対象人が属する前記第2母集団における前記第2統計情報をさらに取得し、
前記健康関連情報取得手段により取得された前記対象人の前記健康関連情報を前記健康状態モデルに入力した結果として出力される前記指標と、取得された前記第2統計情報とに基づいて、前記対象人の前記所定の健康状態に関する第2種スコアを算出する第2種スコア算出手段と、
をさらに備え、
前記情報提供制御手段は、さらに前記第2種スコアを含む前記情報を前記対象人の前記端末に提供する制御を実行する、ことができる。
【0080】
前記所定の健康状態は、疾患、コンセプト解釈及び複合概念のうち少なくとも1以上の健康状態であって、
前記第2種スコアは、前記1以上の健康状態の夫々に関するスコアを含む、ことができる。
【0081】
前記全死亡モデル及び前記健康状態モデルの夫々の出力結果のうち少なくとも一部に基づいて、前記第1種スコアを改善するための前記対象人が行うべき活動を示す改善活動に関する情報を生成する改善活動情報生成手段(例えば、
図4の改善活動生成部56)、
をさらに備え、
前記情報提供制御手段は、さらに前記改善活動に関する情報を含む前記情報を前記対象人の前記端末に提供する制御を実行する、ことができる。
【符号の説明】
【0082】
1・・・学習装置、2・・・判定装置、3・・・ユーザ端末、4・・・全死亡モデル、5・・・個別モデル、6・・・統計情報DB、11・・・CPU、51・・・モデル取得部、52・・・統計情報取得部、53・・・健康関連情報取得部、54・・・第1種スコア算出部、55・・・第2種スコア算出部、56・・・改善活動生成部、57・・・情報提供制御