(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-04-05
(45)【発行日】2022-04-13
(54)【発明の名称】健康診断データ解析システム及び健康診断データ解析プログラム
(51)【国際特許分類】
G16H 50/30 20180101AFI20220406BHJP
G16H 10/00 20180101ALI20220406BHJP
【FI】
G16H50/30
G16H10/00
(21)【出願番号】P 2021073681
(22)【出願日】2021-04-23
【審査請求日】2021-05-13
【早期審査対象出願】
(73)【特許権者】
【識別番号】511219227
【氏名又は名称】株式会社エヌ・エイ・シー
(73)【特許権者】
【識別番号】515349467
【氏名又は名称】株式会社こどもみらい
(74)【代理人】
【識別番号】110000408
【氏名又は名称】特許業務法人高橋・林アンドパートナーズ
(72)【発明者】
【氏名】志村 哲祥
(72)【発明者】
【氏名】佐久田 誠
【審査官】池田 聡史
(56)【参考文献】
【文献】特開2020-003882(JP,A)
【文献】特開2020-047292(JP,A)
【文献】特開2006-301893(JP,A)
【文献】国際公開第2008/139856(WO,A1)
【文献】特開2010-113668(JP,A)
【文献】特開2009-273558(JP,A)
【文献】特開2014-135027(JP,A)
【文献】米国特許出願公開第2016/0180049(US,A1)
【文献】株式会社こどもみらい,“カラダスコープ 健康分析”,[online],2020年08月04日,[2021年12月2日検索], インターネット<URL:https://web.archive.org/web/20200804113729/https://cfltd.co.jp/karada>
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00-80/00
(57)【特許請求の範囲】
【請求項1】
分析しようとする集団及び/又は個人のアウトカムである医療費の額、及び/又は疾患を発症したか否かを示す病名の情報若しくは薬剤の投薬データ若しくは処置の情報、及び/又は疾患の発生のリスク要因となる可能性がある、健康診断結果の項目、肥満若しくは痩を示す体重の異常の有無若しくは体重値、BMI値、体脂肪率、内臓脂肪量、高血圧若しくは低血圧を示す血圧の異常の有無若しくは血圧値、脂質異常の有無若しくはLDLコレステロール値、HDLコレステロール値、中性脂肪値、総コレステロール値、LDL/HDL比、総コレステロール/HDL比、耐糖能異常の有無若しくは空腹時血糖、HbA1c値、腎機能障害の有無若しくはクレアチニン値、eGFR、肝機能障害の有無若しくはAST値、ALT値、γ-GT値、赤血球数、ヘマトクリット値、MCV、MCH、MCHCの値及び/又は分析対象年度とその以前の時点における差分のうち、少なくとも1つ以上から選択される目的変数と、
分析対象年度及び/又は分析対象年度以前の時点における問診票の項目及び/又は健康診断結果の項目から選択される前記アウトカムの医学的リスク要因となる可能性がある項目の説明変数と、を用い、
処理装置は、分析手法として前記目的変数が連続変数である場合には重回帰分析を選択し、前記目的変数が2個又は3個のカテゴリ変数である場合にはロジスティック回帰分析を選択し、又は前記目的変数の種類を問わない拡張型数量化1類分析若しくは機械学習を選択し、選択した前記分析手法により前記説明変数を用いてリスクの予測モデルを導出して、前記集団における1つ以上の
前記説明変数をリスク要因
として導出し、
前記集団における1つ以上のリスク要因にそれぞれ対応
し、前記説明変数が
前記目的変数に寄与する程度を示す係数を前記処理装置が
選択された前記分析手法により算出し、
前記集団における1つ以上のリスク要因を前記係数により重み付けし、
前記処理装置は、前記集団に対する報告書を出力する、健康診断データ解析システム。
【請求項2】
前記集団の複数の健康診断データ及び/又は複数の問診結果は、単年度データ又は時系列データである、請求項
1に記載の健康診断データ解析システム。
【請求項3】
前記集団の1つ以上のリスク要因を導出するために、診察データ及び/又は投薬データをさらに用いる、請求項
2に記載の健康診断データ解析システム。
【請求項4】
前記予測モデルを用いて、前記集団の医療費、前記集団の疾患の発症者数又は前記集団の指標の平均を推算する、請求項
1に記載の健康診断データ解析システム。
【請求項5】
前記集団の1つ以上のリスク要因に対応する前記集団の1つ以上の対策を、前記予測モデルに適用して、前記集団の医療費、前記集団の疾患の発症者数又は前記集団の指標の平均を推算する、請求項
4に記載の健康診断データ解析システム。
【請求項6】
前記集団の1つ以上のリスク要因に対応する1つ以上の対策を、前記予測モデルに適用して、
前記集団の複数の対策を重み付けする、請求項
4に記載の健康診断データ解析システム。
【請求項7】
前記集団の1つ以上の対策を重み付けして提示するために、前記複数のリスク要因を導出した集団のうち、前記集団の1つ以上のリスク要因の中の1つのリスク要因を有する1人以上のリスク保有者について、前記集団の1つ以上の対策の何れかを実施することが有効な前記リスク保有者の割合を前記処理装置が算出し、
前記集団の1つ以上の対策のそれぞれについて、前記割合と前記係数から改善効果の期待値を前記処理装置が算出する、請求項
6に記載の健康診断データ解析システム。
【請求項8】
前記処理装置は、前記集団の複数の健康診断データ及び/又は前記集団の少なくとも複数の問診結果に含まれる1つ以上の属性の指定を受け付け、
前記処理装置は、前記1つ以上の属性に基づいて、前記集団の複数の健康診断データ及び/又は前記集団の少なくとも複数の問診結果を構成する集団を2つ以上のセグメントに分割し、
前記処理装置は、指定された前記属性を含む1つのセグメントについて、前記セグメントの1つ以上のリスク要因を導出し、
前記処理装置は、前記セグメントの1つ以上のリスク要因にそれぞれ対応する係数を算出する、請求項1に記載の健康診断データ解析システム。
【請求項9】
前記処理装置は、複数の助言を格納するコラムデータベースを備え、
前記処理装置は、前記期待値に基づいて、又はコホート研究若しくはメタアナリシスの結果に基づいて、前記コラムデータベースから1つ以上の助言を抽出し、
前記1つ以上の助言を含む個人別の報告書を出力する、請求項
7に記載の健康診断データ解析システム。
【請求項10】
分析しようとする集団及び/又は個人のアウトカムである医療費の額、及び/又は疾患を発症したか否かを示す病名の情報若しくは薬剤の投薬データ若しくは処置の情報、及び/又は疾患の発生のリスク要因となる可能性がある、健康診断結果の項目、肥満若しくは痩を示す体重の異常の有無若しくは体重値、BMI値、体脂肪率、内臓脂肪量、高血圧若しくは低血圧を示す血圧の異常の有無若しくは血圧値、脂質異常の有無若しくはLDLコレステロール値、HDLコレステロール値、中性脂肪値、総コレステロール値、LDL/HDL比、総コレステロール/HDL比、耐糖能異常の有無若しくは空腹時血糖、HbA1c値、腎機能障害の有無若しくはクレアチニン値、eGFR、肝機能障害の有無若しくはAST値、ALT値、γ-GT値、赤血球数、ヘマトクリット値、MCV、MCH、MCHCの値及び/又は分析対象年度とその以前の時点における差分のうち、少なくとも1つ以上から選択される目的変数と、
分析対象年度及び/又は分析対象年度以前の時点における問診票の項目及び/又は健康診断結果の項目から選択される前記アウトカムの医学的リスク要因となる可能性がある項目の説明変数と、を用い、
分析手法として前記目的変数が連続変数である場合には重回帰分析を選択し、前記目的変数が2個又は3個のカテゴリ変数である場合にはロジスティック回帰分析を選択し、又は前記目的変数の種類を問わない拡張型数量化1類分析若しくは機械学習を処理装置に選択させ、選択した前記分析手法により前記説明変数を用いてリスクの予測モデルを前記処理装置に導出させて、前記集団における1つ以上の前記説明変数をリスク要因として前記処理装置に導出させ、
前記集団における1つ以上のリスク要因にそれぞれ対応し、前記説明変数が前記目的変数に寄与する程度を示す係数を、選択された前記分析手法により前記処理装置に算出させ、
前記処理装置に、前記集団における1つ以上のリスク要因を前記係数により重み付けさせ、
前記集団に対する報告書を前記処理装置に出力させる、健康診断データ解析プログラム。
【請求項11】
前記集団の複数の健康診断データ及び/又は複数の問診結果は、単年度データ又は時系列データである、請求項10に記載の健康診断データ解析プログラム。
【請求項12】
前記集団の1つ以上のリスク要因を前記処理装置に導出させるために、診察データ及び/又は投薬データをさらに用いる、請求項11に記載の健康診断データ解析プログラム。
【請求項13】
前記予測モデルを用いて、前記集団の医療費、前記集団の疾患の発症者数又は前記集団の指標の平均を前記処理装置に推算させる、請求項10に記載の健康診断データ解析プログラム。
【請求項14】
前記集団の1つ以上のリスク要因に対応する前記集団の1つ以上の対策を、前記予測モデルに適用して、前記集団の医療費、前記集団の疾患の発症者数又は前記集団の指標の平均を前記処理装置に推算させる、請求項13に記載の健康診断データ解析プログラム。
【請求項15】
前記集団の1つ以上のリスク要因に対応する1つ以上の対策を、前記予測モデルに適用して、
前記処理装置に、前記集団の複数の対策を重み付けさせる、請求項13に記載の健康診断データ解析プログラム。
【請求項16】
前記集団の1つ以上の対策を重み付けして提示するために、前記複数のリスク要因を導出した集団のうち、前記集団の1つ以上のリスク要因の中の1つのリスク要因を有する1人以上のリスク保有者について、前記集団の1つ以上の対策の何れかを実施することが有効な前記リスク保有者の割合を前記処理装置に算出させ、
前記集団の1つ以上の対策のそれぞれについて、前記割合と前記係数から改善効果の期待値を前記処理装置に算出させる、請求項15に記載の健康診断データ解析プログラム。
【請求項17】
前記集団の複数の健康診断データ及び/又は前記集団の少なくとも複数の問診結果に含まれる1つ以上の属性の指定を前記処理装置に受け付けさせ、
前記1つ以上の属性に基づいて、前記処理装置に、前記集団の複数の健康診断データ及び/又は前記集団の少なくとも複数の問診結果を構成する集団を2つ以上のセグメントに分割させ、
指定された前記属性を含む1つのセグメントについて、前記セグメントの1つ以上のリスク要因を前記処理装置に導出させ、
前記セグメントの1つ以上のリスク要因にそれぞれ対応する係数を前記処理装置に算出させる、請求項10に記載の健康診断データ解析プログラム。
【請求項18】
前記期待値に基づいて、又はコホート研究若しくはメタアナリシスの結果に基づいて、複数の助言を格納するコラムデータベースから1つ以上の助言を前記処理装置に抽出させ、
前記1つ以上の助言を含む個人別の報告書を前記処理装置に出力させる、請求項16に記載の健康診断データ解析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、健康診断データ解析システムに関する。
【背景技術】
【0002】
事業者はその従業員等に対して、また、地方自治体はその住民に対して、法令に基づき、毎年健康診断を実施している。健康診断は様々な異常や重篤な疾患を早期発見する二次予防の要となる。一方で、疾患や異常をそもそも生じさせない一次予防も重要性であるが、健康診断結果の結果をもとに一次予防につなげるための技術は乏しい。
【0003】
また、各種健康保険組合は、データヘルス計画の一貫として、医療費に関するレセプトデータを蓄積・保有しているが、これと健康診断結果とを組み合わせて分析し、さらなる疾患の一次予防や、将来医療費の推算や、医療費増加抑制の分析につなげるための技術はさらに乏しい。
【0004】
例えば、特許文献1には、保険者を対象とした疾病発症要因分析システムが記載されており、医療情報及び健診情報を含むヘルスケアデータからベイジアンネットワーク等の技術によりグラフィカルモデルを生成し、現状分布から将来分布を生成し、これらから算出される期待値等に基づき、将来の課題疾病、課題疾病の増加を抑制する要因となるデータ項目、リスク要因となる検査値項目と生活習慣項目の改善量を算出することが記載されている。
【0005】
また、特許文献2には、機械学習の予測モデルを用いる健康予測装置が記載されており、健康診断データ及び問診結果データを使用して学習された予測モデルを使用し、個人に対して、回帰モデルの偏回帰係数に基づき健康リスクへの影響が大きい生活習慣の順位付けや選別を行い提示することが記載されている。また、健康診断データ及び問診結果データの単年度データから複数年の予測が可能であることが記載されている。また、生活習慣を変更する事で健康リスクの予測値の変動を画面表示等で確認できることが記載されている。
【0006】
また、特許文献3には、個人または集団を標的とした健康状態推定装置が記載されており、健康診断結果を含む生体情報から回帰モデル等の予測モデルを用いて標的の将来の健康状態を推定し、発症確率等を出力することが記載されている。また、現在と異なる生体情報を入力し、予測モデルにより将来の仮定確率を推定し差分を生成し、出力することが記載されている。
【0007】
また、特許文献4には、医療費抑制効果に基づき、健康機関等の組織での保健指導プログラムの実施計画を策定する保健事業計画・改善システムが記載されており、健康診断情報や医療費支払い情報等に基づき、統計モデル等を使用し医療費予測モデルを作成すること、健康診断情報は、1年目の情報に対して翌年以降の情報を予測しモデルを構築することが記載されている。また、医療予測モデルに基づき、保健指導プログラムの参加時の個人別の予測医療費を算出し、各保険指導プログラムへの参加優先度を決定し、保険指導プログラムの実施計画を立案することが記載されている。
【先行技術文献】
【特許文献】
【0008】
【文献】国際公開第2015/173917号
【文献】国際公開第2020/040253号
【文献】特開2020-166441号公報
【文献】国際公開第2016/120986号
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかし、従来のシステムは、既存の健康診断データやレセプトデータの分析結果を、単に集計結果として示すのみであり、どのリスク要因が疾患の一次予防や、将来医療費の推算、及び医療費増加抑制の分析とどのように実際に関連しているのかを自動的に分析するシステムではない。さらに、集団単位での分析を行い組織においてどのような対策を優先的にとるべきなのかを示唆するシステムは存在せず、そのレポートを自動的に出力するシステムも存在しない。
【0010】
本発明の一実施形態は、上述した問題を解決するものであって、集団単位での分析を行い、事業者や健康保険組合の構成員に向けてどのような施策を行うことで、効果的に集団全体の疾患リスクを低下させ、将来医療費の低減を図ることができるのかを自動的に分析し、報告書を作成可能な健康診断データ解析システムを提供する。または、一実施形態において、健康診断を受けた個人については、集団単位での分析の結果に基づいて、どのような対策をとれば、将来疾患のリスクや医療費増加リスクを引き下げることができるのかを自動的に分析し、報告書を作成可能な健康診断データ解析システムを提供する。
【課題を解決するための手段】
【0011】
本発明の一実施形態によると、複数の健康診断データ及び/又は少なくとも複数の問診結果を有する集団の前記複数の健康診断データ及び/又は前記少なくとも複数の問診結果を用い、複数の健康診断データ及び/又は複数の問診結果から前記集団における1つ以上のリスク要因を処理装置が導出し、集団における1つ以上のリスク要因にそれぞれ対応する係数を前記処理装置が算出し、集団における1つ以上のリスク要因を係数により重み付けし、処理装置は、前記集団に対する報告書を出力する、健康診断データ解析システムが提供される。
【0012】
集団における1つ以上のリスク要因を導出するために、集団の複数の健康診断データ及び/又は複数の問診結果を用いた回帰分析又は機械学習により予測モデルを導出してもよい。
【0013】
集団の複数の健康診断データ及び/又は複数の問診結果は、単年度データ又は時系列データであってもよい。
【0014】
集団の1つ以上のリスク要因を導出するために、診察データ及び/又は投薬データをさらに用いてもよい。
【0015】
予測モデルを用いて、集団の医療費、集団の疾患の発症者数又は集団の指標の平均を推算してもよい。
【0016】
集団の1つ以上のリスク要因に対応する集団の1つ以上の対策を、予測モデルに適用して、集団の医療費、集団の疾患の発症者数又は集団の指標の平均を推算してもよい。
【0017】
集団の1つ以上のリスク要因に対応する1つ以上の対策を、予測モデルに適用して、集団の複数の対策を重み付けしてもよい。
【0018】
集団の1つ以上の対策を重み付けして提示するために、複数のリスク要因を導出した集団のうち、集団の1つ以上のリスク要因の中の1つのリスク要因を有する1人以上のリスク保有者について、集団の1つ以上の対策の何れかを実施することが有効なリスク保有者の割合を処理装置が算出し、集団の1つ以上の対策のそれぞれについて、割合と係数から改善効果の期待値を処理装置が算出してもよい。
【0019】
処理装置は、集団の複数の健康診断データ及び/又は集団の少なくとも複数の問診結果に含まれる1つ以上の属性の指定を受け付け、処理装置は、1つ以上の属性に基づいて、集団の複数の健康診断データ及び/又は集団の少なくとも複数の問診結果を構成する集団を2つ以上のセグメントに分割し、処理装置は、指定された前記属性を含む1つのセグメントについて、セグメントの1つ以上のリスク要因を導出し、処理装置は、セグメントの1つ以上のリスク要因にそれぞれ対応する係数を算出してもよい。
【0020】
処理装置は、複数の助言を格納するコラムデータベースを備え、処理装置は、期待値に基づいて、又はコホート研究若しくはメタアナリシスの結果に基づいて、コラムデータベースから1つ以上の助言を抽出し、1つ以上の助言を含む個人別の報告書を出力してもよい。
【発明の効果】
【0021】
本発明の一実施形態によると、集団単位での分析を行い、事業者や健康保険組合の構成員に向けてどのような施策を行うことで、効果的に集団全体の疾患リスクを低下させ、将来医療費の低減を図ることができるのかを自動的に分析し、報告書を作成可能な健康診断データ解析システムが提供される。または、一実施形態において、健康診断を受けた個人については、集団単位での分析の結果に基づいて、どのような対策をとれば、将来疾患のリスクや医療費増加リスクを引き下げることができるのかを自動的に分析し、報告書を作成可能な健康診断データ解析システムが提供される。
【図面の簡単な説明】
【0022】
【
図1】本発明の一実施形態に係る健康診断データ解析システム100を示す模式図である。
【
図2】本発明の一実施形態に係る情報処理装置110を示すブロック構成図である。
【
図3】本発明の一実施形態に係る分析用データセットの読み込みの処理を説明するフロー図である。
【
図4】本発明の一実施形態に係る集団に対するリスク要因の対策を提示するフロー図である。
【
図5】本発明の一実施形態に係る集団に対するリスク要因及び/又は対策についてアドバイス・コラムを関連付けて報告書を自動作成するためのフロー図である。
【
図6】本発明の一実施形態に係る集団に対する報告書の一部を示す模式図である。
【
図7】(a)及び(b)は、本発明の一実施形態に係る組織向けの改善を促す報告書の一例を示す模式図である。
【
図8】本発明の一実施形態に係る分析用データセットの読み込みの処理を説明するフロー図である。
【
図9】本発明の一実施形態に係る医療費の推算処理を示すフロー図である。
【
図10】本発明の一実施形態に係るリスク要因及び/又は対策についてアドバイス・コラムを関連付けて報告書を自動作成するためのフロー図である。
【
図11】本発明の一実施形態に係る個人向けのアウトカムの推算処理を示すフロー図である。
【
図12】本発明の一実施形態に係る要因及び/又は対策についてアドバイス・コラムを関連付けて報告書を自動作成するためのフロー図である。
【
図13】本発明の実施形態に係る個人別報告書の一例を示す模式図である。
【
図14】本発明の一実施例に係る個人別報告書の交付による受診行動の改善結果を示す図である。
【発明を実施するための形態】
【0023】
以下、図面を参照して本発明に係る健康診断データ解析システムについて説明する。本発明に係る健康診断データ解析システムは、以下に示す実施の形態の記載内容に限定して解釈されるものではない。なお、本実施の形態で参照する図面において、同一部分又は同様な機能を有する部分には同一の符号を付し、その繰り返しの説明は省略する。
【0024】
図1は、本発明の一実施形態に係る健康診断データ解析システム100を示す模式図である。健康診断データ解析システム100は、サーバ10又は端末(例えば、パーソナルコンピュータ)30から選択される情報処理装置を少なくとも含む。サーバ10と端末30は、ネットワーク150に接続する。ネットワーク150は、いわゆる直接接続される通信ケーブルや、あるいはインターネット、イントラネット等の有線通信又は無線通信を示し、サーバ10及び端末30と接続可能な通信網である。一実施形態において、健康診断データ解析システム100は、スマートフォンを含む携帯電話50又はタブレット70をさらに含んでもよい。
【0025】
図2は、本発明の一実施形態に係る情報処理装置110を示すブロック構成図である。情報処理装置110は、例えば、制御装置111、記憶装置113、通信装置115及び電源装置117を備える。制御装置111は、例えば、中央処理装置(CPU)、オペレーティングシステム(OS)、情報処理装置110を制御するアプリケーションプログラム又はモジュール等により構成される。記憶装置113は、例えば、ハードディスクやソリッドステートディスク(SSD)のような補助記憶装置で構成される。通信装置115は、例えば、ネットワークアダプタやオンボードの通信用チップ等により構成され、ネットワーク150を介した端末との通信可能である。電源装置117は、外部からの電力を情報処理装置110の各装置に供給する装置であって、特に限定されない。
【0026】
情報処理装置110は、入力装置118及び出力装置119をさらに備える。入力装置118は、例えば、キーボード、マウス、タッチパネル又はマイク等であって、公知の装置を任意に配置可能である。出力装置119は、表示装置やプリンタであって、公知の装置を任意に配置可能である。さらに、情報処理装置110は、その他に公知の情報処理装置が備える各種の電子機器を備えてもよい。
【0027】
一実施形態において、サーバ10が情報処理装置110を構成する場合、入力装置118として、サーバ10に接続する上述したキーボードやマウス等を用いることもできるが、ネットワーク150を介してサーバ10に接続する端末30を入力装置118として用いてもよい。また、出力装置119として、サーバ10に接続する上述した表示装置やプリンタ等を用いることもできるが、端末30に接続する表示装置やプリンタ等を出力装置119として用いてもよい。
【0028】
一実施形態において、制御装置111は、分析部112を含む。分析部112は、データの集計及び統計解析を行うアプリケーションプログラム又はモジュール等により構成される。分析部112は、例えば、記憶装置113に格納され、制御装置111で実行されるアプリケーションプログラム又はモジュール等であってもよい。分析部112でのデータ処理量及び統計解析の負荷を考慮すると、サーバ10が情報処理装置110を構成する場合、分析部112は、サーバ10の制御装置111で実行されるアプリケーションプログラム又はモジュール等であることが好ましい。一方、記憶装置113に格納されたアプリケーションプログラム又はモジュール等を、サーバ10から端末30へ提供して、端末30の制御装置111で分析部112を構成してもよい。
【0029】
一実施形態において、記憶装置113は、例えば、健康診断結果データベース114a、項目リスト114b、及びコラムデータベース114cを含む。健康診断結果データベース114aは、分析しようとする集団の各個人の、健康診断の結果及び健康診断に際して収集される問診票の回答結果が、単年度又は2年分以上格納されたデータベースである。ここで、「集団(又は母集団)」とは、企業や健康保険組合等の任意の組織単位に含まれる従業員若しくは被保険者又は被扶養者の集合、あるいは自治体に含まれるその住民の集合などを意図する。なお、一実施形態において、「集団(又は母集団)」は、従業員、被保険者、被扶養者又は住民の全体のみならず、全体から任意の条件で抽出された従業員、被保険者、被扶養者又は住民の集合であってもよい。一実施形態において、健康診断結果データベース114aは、医療機関から提供された健康診断の結果及び問診票の回答結果を格納したデータベースである。健康診断の結果及び問診票の回答結果は、例えば、医療機関の端末又はサーバ90から、ネットワーク150を介してサーバ10に提供されてもよく、紙媒体等の報告書91で提供された健康診断の結果及び問診票の回答結果を端末30から入力してデータ化したものであってもよい。
【0030】
項目リスト114bは、健康診断データ解析システムにより分析する、予防したい健康上の異常や疾病(以下、総称してアウトカムとも称する。)のそれぞれについて、医学的にリスク要因となる可能性がある項目の目的変数及び説明変数のリストが格納されたデータベースである。
【0031】
コラムデータベース114cは、出力され得る結果と紐付いた医学的根拠に基づく推奨される対策を記載した文章や図画などの記事(助言)、又は医学的に既知である、各種アウトカムに対するリスク係数が格納されたデータベースである。
【0032】
健康診断結果データベース114a、項目リスト114b、及びコラムデータベース114cは、そのデータの大きさ、及びセキュリティの観点から、サーバ10の記憶装置113に格納されることが好ましい。一方、端末30の制御装置111に分析部112が構築されている場合、データの大きさ及びセキュリティの問題が担保されている限り、これらのデータベースが端末30の記憶装置113に格納されてもよい。または、端末30の制御装置111に分析部112が構築されている場合に、サーバ10の記憶装置113に格納されたこれらのデータベースから、端末30の記憶装置113に必要なデータが提供されてもよい。
【0033】
[健康診断で測定するアウトカムの組織向け改善施策レポートの提示]
健康診断で測定する健康上のアウトカムには、体重の異常(肥満若しくは痩せ)、血圧の異常(高血圧若しくは低血圧)、脂質異常、耐糖能異常などが存在する。以下では、具体例として肥満を予防するための効果的な施策を提示する方法を示して、一実施形態に係る健康診断データ解析システム100について説明する。
【0034】
<分析用データセットの利用>
図3は、本発明の一実施形態に係る分析用データセットの読み込みの処理を説明するフロー図である。企業の人事担当者や健康保険組合の職員等のユーザーは、入力装置118(端末30)から、分析したいアウトカムを指定する(S101)。一実施形態において、アウトカムとして選択可能な項目が項目リスト114bに格納され、格納されたアウトカムを項目リスト114bから読み込んで、端末30の表示装置に表示させる。例えば、ユーザーは、表示されたアウトカムの中から、分析対象として、肥満を指定することができる。
【0035】
また、分析部112は、記憶装置113の項目リスト114bに格納された分析したいアウトカムに関連し得る要因である項目を読み込む(S103)。この項目には、医学的にリスク要因となる可能性がある項目の目的変数及び説明変数が含まれる。また、分析部112は、分析対象となる集団について、取得した項目に対応する健康診断結果(測定値)を健康診断結果データベース114aから読み込む(S105)。一実施形態において、これら2つの工程S103とS105は、健康診断結果データベース114aに格納された全ての測定値を取得して、項目リスト114bに格納された項目に対応する測定値のみが選択されるように構成してもよい。
【0036】
分析対象として、肥満を指定した場合、読み込んだ測定値には、目的変数として、分析対象年度のBMI値、分析対象年度とその以前の健康診断時点とのBMI値の差分、肥満であるか否かの1か0の情報、体重が増加したか否かの1か0かの情報が含まれてもよい。
【0037】
また、読み込んだ測定値には、説明変数として、分析対象年度の以前の時点における、性別、年齢、BMI、喫煙習慣、中強度以上の30分以上の運動習慣、歩行強度以上の1日1時間以上の運動習慣、歩く速さ、食べる速さ、就寝時2時間以内の夕食習慣、夕食後の間食習慣、朝食欠食、飲酒頻度、1回飲酒量、睡眠での休養確保が含まれてもよい。
【0038】
なお、これらの目的変数リストに含まれる項目は、本願出願時での法定健診項目から例示したに過ぎず、データがあれば、他に、体脂肪率、内臓脂肪量等を採用することもできる。
【0039】
また、これらの説明変数リストに含まれる項目は、厚生労働省の定める標準的な健康診断の問診票に挙げられる項目から例示したにすぎず、データがあれば、他に、婚姻状況、独居か否か、就労があるか否か、週の勤務時間、通勤時間、通勤手段、各食事の時刻とその規則性、間食習慣、野菜・海藻・きのこ類の摂取習慣、魚類の摂取習慣、その他のタンパク源の摂取習慣、糖質の摂取習慣、脂質の摂取習慣、外食の頻度、平日の睡眠スケジュール、休日の睡眠スケジュール、睡眠障害の有無、特定保健指導の実施有無等を採用することもできる。
【0040】
<リスク要因の分析>
分析部112は、読み込んだ目的変数に応じて分析手法を選択する(S111)。分析部112は、選択した分析手法に基づき、読み込んだ説明変数及び目的変数を用いて分析を行う。統計解析の手法としては、例えば、重回帰分析、ロジスティック回帰分析、拡張型数量化1類分析等の予測モデル及び機械学習等から選択することができるが、これらに限定されず、公知の手法を用いることができる。例えば、目的変数が最新のBMI値若しくはBMI値の差分などの連続変数である場合には(S111)、分析部112は多変量の重回帰分析を行う(S113)。または、目的変数が肥満か否かなどの2個若しくは3個程度のカテゴリ変数である場合には、分析部112は多変量のロジスティック回帰分析を行う(S115)。あるいは、目的変数の種類を問わない拡張型数量化1類分析や機械学習を実行させてもよい。いずれの分析を実行した場合でも、最終的には目的変数に対応した回帰係数、標準化係数、リスク比又はアイテムスコア等の、各項目(説明変数)がどの程度目的変数に寄与するのかを示す係数が出力される(S117)。また、1つ以上の説明変数がリスク要因として導出され、標準化係数(β)により重み付けをして分析対象とした集団におけるリスク要因を出力する(S119)。分析対象とした集団における重み付けされたリスク要因は、例えば、端末30の表示装置に表示させてもよく、報告書等の紙媒体として出力されてもよい。または、後述するように、各個人の携帯電話50又はタブレット70に分析対象とした集団に対する報告書が表示されるようにしてもよい。
【0041】
上記の分析に際して、集団に含まれる特定の属性を有する集団をセグメントとして指定し、セグメントを対象として分析を実行することもできる。分析部112は、健康診断結果データベース114aに含まれる属性を読み込んで、端末30の表示装置に表示させる(S201)。ユーザーは、表示された1つ以上の属性を指定して、分析対象とする集団をセグメントとして指定する(S203)。これにより、複数の健康診断データ及び/又は少なくとも複数の問診結果を構成する集団は、指定された1つ以上の属性に基づいて、2つ以上のセグメントに分割される。分析部112は、指定された属性を含む1つのセグメントについて、それに合致する属性を有する集団のデータのみを健康診断結果データベース114aから抽出し、上記の分析を実施することができる。
【0042】
例えば、現在の肥満者の対策のための情報を知りたい場合、集団の中から分析対象として肥満者のみのセグメントを指定することができる。または、分析対象を男性に限定したければ集団の中から男性のみのセグメントを指定し、分析対象を50歳以上に限定したければ集団の中から50歳以上のセグメントを指定することができる。
【0043】
例えば、5000名のサンプルが存在する組織に対して、BMI25以上の「肥満者」を対象としたセグメントで、1年間のBMIの増加幅を目的変数と指定し、1年前のプロファイルや生活習慣を説明変数として、統計解析の手法として重回帰分析を実施した結果は表1のとおりとなる。
【表1】
【0044】
例えば、この集団のセグメントにおいては、説明変数である「年齢」、「前年度のBMI」、「1日飲酒量」及び「歩く速度」が統計学的に有意(p<0.05)な、BMI変動と関連するリスク要因であることが分かる。即ち、分析対象としたセグメントにおけるこれらのリスク要因以外の項目は改善を行ったとしても、BMIに与える効果が統計学的には期待できないことが分かる。
【0045】
例えば、この集団のセグメントにおいては、60歳男性で現在のBMIが27.0、飲酒なし、歩く速度が早く、1日1時間以上の身体活動は行っていない者について、来年のBMIの変動値と、来年のBMIの値は以下と推測できる。
変動値=3.868-0.013*60-0.038-0.1*27-0.08*0-0.168=0.182
来年のBMI=27+0.182=27.182
【0046】
また、標準化係数(β)の絶対値は、生活習慣の項目の中では「歩く速度」の値が最も大きいことが分かる。この集団のセグメントにおいては、これらの項目内においては、「歩く速度」が単純な影響力として最も強いことが分かる。
【0047】
上記の分析により導出されたリスク要因について、改善可能余地を参照することにより、集団全体で改善をすることで最も改善効果が期待できる項目(対策)を導出することができる。
図4は、集団に対するリスク要因の対策を提示するフロー図を示す。分析部112は、集団に対するリスク要因に対応する項目を健康診断結果データベース114a又は項目リスト114bから読み込む(S301)。分析部112は、この集団において、リスク保有者のうちリスク要因に対応する項目に該当する人数を健康診断結果データベース114aから抽出する(S303)。抽出した人数と集団の全体数から、分析部112は、リスク要因に対応する項目に該当する人数割合を算出する(S305)。
【0048】
分析部112は、算出した人数割合を、その集団における対策の改善余地割合に変換する。改善余地割合は、集団全体を100%から人数割合を減じた割合である。分析部112は、改善余地割合に回帰係数(B)を乗じて、分析対象とした集団における改善期待効果(期待値)を算出する(S307)。分析部112は、各対策を算出した改善期待効果で重み付けして出力する。このとき、改善期待効果が大きい順に各対策を整列させて出力してもよい。重み付けされた対策は、例えば、端末30の表示装置に表示させてもよく、報告書等の紙媒体として出力されてもよい(S309)。または、後述するように、各個人の携帯電話50又はタブレット70に分析対象とした集団に対する報告書が表示されるようにしてもよい。
【0049】
例えば、表1に示した集団において、BMI増加に影響を与えていた各生活習慣(リスク要因)において、望ましい習慣を持つ者と持たない者との数は表2のとおりの分布となっている。
【表2】
【0050】
ここで、例えば、表2の変数の中では、この集団では「歩く速さが遅い」者を全て「早く」できた場合に、翌年の集団全体のBMIは平均-0.087低下することが期待でき、項目の中では最も大きいものとなる。
【0051】
このように、リスク要因への対策に重み付けをすることで、対策に意味のあると考えられる項目、ないと考えられる項目を明らかにすることができる。また、標準化係数(β)の絶対値の順、及び/又は改善可能余地に係数を乗じた数値を比較することで、その集団において改善によって効果を期待できる対策の優先度の順位付け、分析結果の出力における重み付けが可能となる。
【0052】
また、アウトカムの増減に対する各リスク要因の係数が明らかとなっているため、将来の任意の時点において、構成員において当該アウトカムがどのように分布するかも推算可能である。例えば、本実施形態においては、将来の時点での肥満者の割合を推算することができる。
【0053】
なお、健康診断結果データベース114aに単一時系列の結果しか存在しない場合には、以前のデータではなく、当該年度の説明変数を採用して上記の分析を行うことで、暫定値を算出し、参考としてレポートを出力することもできる。ただし、その場合は横断的分析(Cross sectional analysis)となり、2時点以上のデータを分析する縦断的分析に対して将来予測能は低下するため、その旨を出力装置119で付記する。
【0054】
<コラムデータベースの利用>
一実施形態において、コラムデータベース114cには、説明変数のリストに対応した医学的根拠に基づく推奨される対策の記事(アドバイス・コラム)、及びその項目に対する介入が可能かどうか、又は推奨されるかどうかのフラグが格納されている。
【0055】
図5は、一実施形態に係るリスク要因及び/又は対策についてアドバイス・コラムを関連付けて報告書を自動作成するためのフロー図を示す。分析部112は、分析対象とした集団について導出した対策を読み込む(S401)。分析部112は、読み込んだ対策に対応するアドバイス・コラムをコラムデータベース114cから読み込む(S403)。分析部112は、導出したリスク要因、及び/又は対策と、アドバイス・コラムを統合して、出力装置119から集団に対する報告書を出力する(S405)。集団に対する報告書においては、リスク要因、及び/又は対策が重み付けされ、リスク要因の重要度及び対策の効果が明確に示される。
【0056】
例えば、上記分析の中では、コラムデータベース114cに含まれる、早歩きが健康維持にいかに大切で脂肪の燃焼や筋力の維持に重要であるか、また、継続的な運動の重要性についての医学的アドバイス・コラムが呼び出される。
【0057】
一方で、「年齢」、「性別」及び「前年度のBMI」は、介入が不可能な項目であるため、当該項目に対応するコラムは存在せず、分析の結果を受けての改善の推奨の記事は出力されない。また、「1日飲酒量」は分析の上では有意(p<0.05)且つ負の係数を持ち、大量飲酒により体重が減少することを示しているが、大量飲酒は医学的に推奨されないため、「1日飲酒量」の増大の推奨に対応するコラムは存在せず、「1日飲酒量」に対応する記事は出力されない。
【0058】
出力装置119では、以上の分析の結果及びコラムデータベース114cで呼び出された記事を統合し、電磁的文書又は自動的に印刷された文書として、当該組織における集団に対しての改善を促す報告書を発行することができる。一例として、集団に対する報告書の一部を
図6に示す。
図6においては、導出した対策を実施した場合と実施しなかった場合での来年のBMIが25となる肥満者の割合の推移を視覚的に示した報告書例である。
【0059】
また、
図7(a)及び
図7(b)は、企業や健康保険組合等の組織向けの改善を促す報告書の一例を示す。
図7(a)は肥満を対象とした報告書例であり、
図7(b)は高血圧を対象とした報告書例である。それぞれの報告書において、リスク要因1と、年齢をセグメントに指定した対策3を示している。なお、
図6、
図7(a)及び
図7(b)は、報告書の一例であって、本発明に係る健康診断データ解析システム100が出力する集団に対する報告書はこれらに限定されず、分析結果に基づく、集団に対するリスク要因、その対策、アドバイス・コラムを任意のフォーマットで表示することができる。
【0060】
[医療費又は具体的疾患の発症リスクを低減させるための組織向け改善施策報告書の提示]
一実施形態において、健康診断データ解析システム100は、健康保険組合が有するレセプトデータを用いて分析対象とする集団の将来の医療費や具体的疾患の発症リスクや発症者数の変動又は指標の平均を予測することができる。一実施形態において、サーバ10の記憶装置113は、レセプトデータベース114dを含む。または、健康診断データ解析システム100は、レセプトデータを格納する他のサーバのレセプトデータベース114dを参照するように設定されてもよい。レセプトデータベース114dは、分析しようとする集団の各個人の、疾病罹患状況と医療費の状況が、単年度または2年分以上格納されたデータベースである。
【0061】
レセプトデータベース114dには、何らかの疾患を発症したか否かの病名の情報や、何らかの疾患の発症に用いられる薬剤の投薬データや処置が使用されたかどうかの情報(診察データ)が含まれる。例えば、「急性心筋梗塞」の病名が新たに付いた場合、それはその対象者が急性心筋梗塞を生じたことを意味し、「経皮的冠動脈形成術」という処置名が新たに存在した場合、それはその対象者が急性心筋梗塞あるいは狭心症に対してカテーテル治療を受けたことを意味する。
【0062】
また、レセプトデータベース114dには、医療費の情報も含まれている。また、医療費の情報は厚生労働省をはじめとする複数の機関においてセグメント化がなされており、「悪性新生物」、「感染症」、「脳血管疾患」及び「生活習慣病関連疾患」等の任意のエリアで集計することも可能である。
【0063】
本実施形態に係る健康診断データ解析システム100は、分析対象とした集団の過去の生活習慣や高血圧の存在等の基礎的疾患リスクを説明変数に、分析対象とした集団の将来の疾患発症や医療費の発生等を目的変数とした分析を行うことで、分析対象とした集団の将来の疾患リスク低減、又は医療費削減のための重み付けした対策の提示が可能である。
【0064】
<分析用データセットの利用>
図8は、本発明の一実施形態に係る分析用データセットの読み込みの処理を説明するフロー図である。企業の人事担当者や健康保険組合の職員等のユーザーは、入力装置118(端末30)から、分析したいアウトカムを指定する(S501)。一実施形態において、アウトカムとして選択可能な疾患の項目が項目リスト114bに格納され、格納されたアウトカムを項目リスト114bから読み込んで、端末30の表示装置に表示させる。例えば、ユーザーは、表示されたアウトカムの中から、分析対象として、生活習慣病関連医療費を指定することができる。
【0065】
また、分析部112は、記憶装置113の項目リスト114bに格納された分析したいアウトカムに関連し得る要因である項目を読み込む(S503)。この項目には、医学的にリスク要因となる可能性がある項目の目的変数及び説明変数が含まれる。また、分析部112は、取得した項目に対応する健康診断結果(測定値)を健康診断結果データベース114aから読み込み、その集団の医療費総計、分析対象年度とその以前の時点における医療費総計との差分、その疾患に関連した疾患の発症有無又は医療費小計等をレセプトデータベース114dから読み込む(S505)。
【0066】
上記のデータの読み込みに際して、集団に含まれる特定の属性を有する集団をセグメントとして指定し、セグメントを対象として分析を実行することもできる。分析部112は、健康診断結果データベース114a及び/又はレセプトデータベース114dに含まれる属性を読み込んで、端末30の表示装置に表示させる(S601)。ユーザーは、表示された1つ以上の属性を指定して、分析対象とする集団をセグメントとして指定する(S603)。これにより、複数の健康診断データ及び/又は少なくとも複数の問診結果及び/又はレセプトデータベース114dを構成する集団は、指定された1つ以上の属性に基づいて、2つ以上のセグメントに分割される。分析部112は、指定された属性を含む1つのセグメントについて、それに合致する属性を有する集団のデータのみを健康診断結果データベース114a及びレセプトデータベース114dから抽出し、下記の分析を実施することができる。また、端末30において分析対象のセグメントが指定されている場合、分析部112は、分析対象のセグメントに合致する属性のデータのみを抽出し、下記の分析を実行することができる。
【0067】
例えば、生活習慣病関連医療費の対策のための情報を知りたい場合、分析対象として生活習慣病のみのセグメントを指定することができる。または、分析対象を男性に限定したければ男性のみのセグメントを指定し、分析対象を50歳以上に限定したければ50歳以上のセグメントを指定することができる。
【0068】
分析対象として、生活習慣病関連医療費を指定した場合、目的変数として、生活習慣に関連するものとして、分析対象年度の生活習慣病関連医療費総計、分析対象年度とその以前の時点における生活習慣病関連医療費総計との差分、生活習慣病関連疾患に含まれる心血管疾患の発症有無又は医療費小計、より具体的には急性心筋梗塞の発症有無若しくはその医療費総計、又は他の具体的な疾患として、脳梗塞、糖尿病性腎症、非アルコール性肝炎、慢性閉塞性肺疾患等と、その関連医療費が含まれる。他にも、悪性新生物の発症有無やその関連医療費の総計、感染症の発症有無やその関連医療費の総計等を採用することができる。
【0069】
また、説明変数のうち基礎疾患リスクに該当するものとしては、高血圧の有無若しくは血圧値、脂質異常症の有無若しくはLDLコレステロール値、HDLコレステロール値、中性脂肪値、総コレステロール値、LDL/HDL比、総コレステロール/HDL比、糖尿病の有無若しくは空腹時血糖、HbA1c値、腎機能障害の有無若しくはクレアチニン値、eGFR、肝機能障害の有無若しくはAST値、ALT値、γ-GT値、赤血球数、ヘマトクリット値、MCV、MCH、MCHC、性別、年齢、及びBMI等が含まれてもよい。
【0070】
なお、説明変数のうち基礎疾患リスクに該当するものは、厚生労働省の定める標準的な健康診断に含まれる健康診断結果の項目から例示したものにすぎず、データがあれば、白血球数及びその分画割合、血清鉄やフェリチン値、CRP、血清亜鉛、脂肪酸分画、甲状腺機能、アルブミン値、血清総蛋白値、コリンエステラーゼ値、血清電解質、血小板数、Fib-4 index、又はがん検診の実施状況やその結果、各種予防接種の実施状況等を分析に含むこともできる。
【0071】
また、説明変数のうち生活習慣に該当するものとして、分析対象年度の以前の時点における、喫煙習慣、中強度以上の30分以上の運動習慣、歩行強度以上の1日1時間以上の運動習慣、歩く速さ、食べる速さ、就寝時2時間以内の夕食習慣、夕食後の間食習慣、朝食欠食、飲酒頻度、1回飲酒量、睡眠での休養確保等が含まれてもよい。
【0072】
なお、説明変数のうち生活習慣に該当するもののリストに含まれる項目は厚生労働省の定める標準的な健康診断の問診票に挙げられる項目から例示したにすぎず、データがあれば、他に、婚姻状況、独居か否か、就労があるか否か、週の勤務時間、通勤時間、通勤手段、各食事の時刻とその規則性、間食習慣、野菜・海藻・きのこ類の摂取習慣、魚類の摂取習慣、その他のタンパク源の摂取習慣、糖質の摂取習慣、脂質の摂取習慣、外食の頻度、平日の睡眠スケジュール、休日の睡眠スケジュール、睡眠障害の有無、特定保健指導の実施有無等を採用することもできる。
【0073】
<リスク要因の分析>
分析部112は、読み込んだ目的変数に応じて分析手法を選択する(S511)。分析部112は、選択した分析手法に基づき、読み込んだ説明変数及び目的変数を用いて分析を行う。統計解析の手法については上述したため、詳細な説明は省略する。例えば、目的変数が連続変数である場合には(S511)、分析部112は多変量の重回帰分析を行う(S513)。または、目的変数がカテゴリ変数である場合には、分析部112は多変量のロジスティック回帰分析を行う(S515)。あるいは、目的変数の種類を問わない拡張型数量化1類分析や機械学習を実行させてもよい。いずれの分析を実行した場合でも、最終的には目的変数に対応した回帰係数、標準化係数、リスク比又はアイテムスコア等の、各項目(説明変数)がどの程度目的変数に寄与するのかを示す係数が出力される(S517)。また、1つ以上の説明変数が分析対象とした集団のリスク要因として導出され、標準化係数(β)により重み付けをしてリスク要因を出力する(S519)。分析対象とした集団の重み付けされたリスク要因は、例えば、端末30の表示装置に表示させてもよく、報告書等の紙媒体として出力されてもよい。または、後述するように、各個人の携帯電話50又はタブレット70に集団に対する報告書が表示されるようにしてもよい。
【0074】
例えば、10,000名のサンプルが存在する組織に対して、1年間の1人あたり生活習慣病関連疾患の医療費の増加幅を目的変数と指定し、1年前のプロファイルや生活習慣を説明変数とし、統計解析の手法として重回帰分析を実施した結果は表3のとおりとなる。
【表3】
【0075】
例えば、この集団においては、説明変数である「特定健診の受診」、「性別」、「間食習慣」、「食事速度」、「飲酒頻度」及び「睡眠」が医療費の伸びに有意に影響することが分かる。特に標準化係数(β)を参照すると、「性別」、「間食習慣」、「睡眠」、「特定健診の受診」、「飲酒頻度」、「食事速度」の順に医療費の伸びに与える影響が大きいことが分かる。
【0076】
また、アウトカムの増減に対する各要因の係数が明らかとなっているため、将来の任意の時点において、分析した集団の構成員において当該アウトカムがどのように分布するかも推算可能である。例えば、本実施形態においては、将来時点での1人あたり生活習慣病関連疾患の医療費を推算することができる。
【0077】
図9は、本発明の一実施形態に係る医療費の推算処理を示すフロー図である。分析部112は、上記のリスク要因の分析により導出された項目(説明変数)、項目に対応した変動幅係数及び平均値(割合)を記憶装置113から読み込む(S701)。分析部112は、読み込んだパラメータを用いて、全体の1人あたりの生活習慣病関連疾患医療費を推算する(S703)。分析部112は、推算された1人あたりの生活習慣病関連疾患医療費を出力装置119から出力する(S705)。1人あたりの生活習慣病関連疾患医療費は、例えば、端末30の表示装置に表示させてもよく、報告書等の紙媒体として出力されてもよい。または、各個人の携帯電話50又はタブレット70に報告書が表示されるようにしてもよい。
【0078】
全体の1人あたりの生活習慣病関連疾患医療費は下記式により算出することができる。
Σ(各人の生活習慣病関連医療費:項目A×係数A+項目B×係数B+項目C×係数C・・・)/n=項目Aの平均値(割合)×係数A+項目Bの平均値(割合)×係数B+項目Cの平均値(割合)×係数C・・・・
【0079】
例えば、表4の通り、本集団の翌年の1人あたりの生活習慣病関連疾患医療費は、799円減少することが期待される。
【表4】
【0080】
なお、健康診断結果データベース114aに単一時系列の結果しか存在しない場合には、以前のデータではなく、当該年度の説明変数を採用して上記の分析を行うことで、暫定値を算出し、参考としてレポートを出力することもできる。ただし、その場合は横断的分析(Cross sectional analysis)となり、2時点以上のデータを分析する縦断的分析に対して将来予測能は低下するため、その旨を出力装置119で付記する。
【0081】
<コラムデータベースの利用>
図10は、一実施形態に係るリスク要因及び/又は対策についてアドバイス・コラムを関連付けて報告書を自動作成するためのフロー図を示す。分析部112は、集団に対して導出した対策を読み込む(S501)。分析部112は、読み込んだ対策に対応するアドバイス・コラムをコラムデータベース114cから読み込む(S503)。分析部112は、導出したリスク要因、及び/又は対策と、アドバイス・コラムを統合して、出力装置119から集団に対する報告書を出力する(S505)。集団に対する報告書においては、分析対象とした集団におけるリスク要因、及び/又は対策が重み付けされ、リスク要因の重要度及び対策の効果が明確に示される。
【0082】
例えば、上記分析の中では、コラムデータベース114cに含まれる、正しい間食の方法や、睡眠へのアドバイス、特定健診の重要さ、適正な飲酒のすすめ、ゆっくりよく噛んで食べることの重要さについての医学的アドバイス・コラムが呼び出される。
【0083】
一方で、「性別」は介入が不可能であるため、当該項目に関連付けされた改善のためのコラムはなく、分析の結果を受けての改善の推奨の記事は出力されない。
【0084】
出力装置119では、以上の分析の結果およびコラムデータベース114cで呼び出された項目を統合し、電磁的文書又は自動的に印刷された文書として、当該組織に対しての集団レベルでの医療費の伸びを抑制するための施策を促す報告書を発行する。
【0085】
また、上記分析の要領で、例えば、心血管疾患などの発症有無を目的変数として同様の分析を行うと、その疾患に関連する運動習慣などの生活習慣や高血圧などの基礎的なリスク要因を重要度で重み付けを行いながら導出することができる。これに基づいて、当該集団において疾患リスクを低減させるための施策を促す報告書を発行することができる。
【0086】
[健康診断のアウトカムの改善、具体的疾患の発症リスクの低減、将来医療費の低減のための個人向け改善推奨報告書の提示]
健康診断データ解析システム100は、上記の処理によって各種リスク要因が健康診断のアウトカムや具体的疾患の発症リスク、又は将来の医療費の増加に寄与する係数を算出る。
【0087】
分析した集団に含まれる個々人のそれらのリスク要因の有無や状況に応じて、算出した係数を乗じて加算又は加乗して統計的に処理することによって、個々人が任意の期間後の将来にどのような健康診断のアウトカムを持つか、各疾患の発症リスクはどの程度か、将来医療費はどの程度生じうるかを推算することができる。
【0088】
図11は、一実施形態に係る個人向けのアウトカムの推算処理を示すフロー図である。分析部112は、上記の処理により導出したリスク要因及び係数を読み込む(S901)。例えば、リスク要因及び係数は、上記の処理により導出したものを直接用いてもよく、記憶装置113に格納されたリスク要因及び係数を読み込んでもよい。
【0089】
分析部112は、リスク要因と係数を用いた統計処理を行い、アウトカムを推算する(S903)。たとえば、心筋梗塞の発症リスクを推算する際には、年齢、性別、血圧、脂質検査の結果値、喫煙の有無、耐糖能異常の有無等のそれぞれの項目に対して上記の処理で割り当てられたリスクの係数を乗じて各項目のリスクを乗じる、もしくはロジットモデルにおいて加算した上で最終的な罹患確率を算出するなどして、各人の今後任意の期間での心筋梗塞の発症確率をパーセンテージで可視化することができる。
【0090】
この時、当該集団に充分なデータ量が存在せず、有意水準に達する項目が乏しいような場合には、他の分析集団のデータが合算された拡大データセットでの分析を実施するか、又は、コホート研究やそれらのメタアナリシス等により医学的に明らかとなっているリスク要因の係数をコラムデータベース114cから呼び出し、推算を行うことができる。
【0091】
推算されたアウトカムは、例えば、端末30の表示装置に表示させてもよい。また、個人用に、報告書等の紙媒体として出力されてもよく、個人の携帯電話50又はタブレット70に報告書が表示されるようにしてもよい。
【0092】
図12は、一実施形態に係るリスク要因及び/又は対策についてアドバイス・コラムを関連付けて報告書を自動作成するためのフロー図を示す。分析部112は、導出した対策を読み込む(S1001)。分析部112は、読み込んだ対策に対応するアドバイス・コラムをコラムデータベース114cから読み込む(S1003)。分析部112は、分析の結果から明らかになった健康診断アウトカムの推算や、疾患の罹患確率、将来医療費の予測と、導出したリスク要因、及び/又は対策と、アドバイス・コラムとを統合して、電磁的文書あるいは自動的に印刷された文書として、出力装置119から報告書を出力する(S1005)。報告書においては、リスク要因、及び/又は対策が重み付けされ、リスク要因の重要度及び対策の効果が明確に示され、個人別に改善を促すことができる。
【0093】
図13は、個人別報告書の一例を示す。個人別報告書には、リスク要因1と、対策及びアドバイス・コラム5が示されている。
図13は、個人別報告書の一例であって、本発明に係る健康診断データ解析システム100が出力する個人別報告書はこれらに限定されず、分析結果に基づく、リスク要因、その対策、アドバイス・コラムを任意のフォーマットで表示することができる。
【0094】
重篤な疾患を発症するリスクを可視化し個人に伝えることは、健康診断結果を受けての二次検査や受診の勧奨を有効化することに役立つ。例えば、従業員約1000名の企業の集団において本実施形態に係る個人別報告書を利用した前後での、健康診断で「要受診」と判定された者が実際に受診行動に至った割合は、
図14に示したように、個人別報告書を交付することで3~4倍となった。
【0095】
上記のように、組織又は個人に対して、将来のリスクを予想し、かつ、改善効果が大きい項目を可視化し重み付けして提示することで、健康状態を改善させ、疾患を予防し、将来医療費を抑制していくことが本発明により可能となる。
【符号の説明】
【0096】
1 リスク要因、3 対策、5 アドバイス・コラム、10 サーバ、30 端末、50 携帯電話、70 タブレット、90 サーバ、91 報告書、100 健康診断データ解析システム、110 情報処理装置、111 制御装置、112 分析部、113 記憶装置、114a 健康診断結果データベース、114b 項目リスト、114c コラムデータベース、114d レセプトデータベース、115 通信装置、117 電源装置、118 入力装置、119 出力装置、150 ネットワーク
【要約】 (修正有)
【課題】集団単位での分析を行い、事業者や健康保険組合の構成員に向けてどのような施策を行うことで、効果的に集団全体の疾患リスクを低下させ、将来医療費の低減を図ることができるのかを自動的に分析し、報告書を作成可能な健康診断データ解析システムを提供する。
【解決手段】健康診断データ解析システム110は、複数の健康診断データ及び/又は少なくとも複数の問診結果を有する集団の複数の健康診断データ及び/又は少なくとも複数の問診結果を格納する記憶装置113と、複数の健康診断データ及び/又は複数の問診結果から集団における1つ以上のリスク要因を導出し、集団における1つ以上のリスク要因にそれぞれ対応する係数を算出し、集団における1つ以上のリスク要因を係数により重み付けする分析部112aと、集団に対する報告書を出力する出力装置119と、を備える。
【選択図】
図2