IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 学校法人慶應義塾の特許一覧

特許7502192うつ状態を推定する装置、方法及びそのためのプログラム
<>
  • 特許-うつ状態を推定する装置、方法及びそのためのプログラム 図1
  • 特許-うつ状態を推定する装置、方法及びそのためのプログラム 図2
  • 特許-うつ状態を推定する装置、方法及びそのためのプログラム 図3
  • 特許-うつ状態を推定する装置、方法及びそのためのプログラム 図4
  • 特許-うつ状態を推定する装置、方法及びそのためのプログラム 図5
  • 特許-うつ状態を推定する装置、方法及びそのためのプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-10
(45)【発行日】2024-06-18
(54)【発明の名称】うつ状態を推定する装置、方法及びそのためのプログラム
(51)【国際特許分類】
   A61B 10/00 20060101AFI20240611BHJP
   A61B 5/01 20060101ALI20240611BHJP
   A61B 5/16 20060101ALI20240611BHJP
   A61B 5/02 20060101ALI20240611BHJP
   G16H 50/20 20180101ALI20240611BHJP
【FI】
A61B10/00 H
A61B5/01 100
A61B5/16 130
A61B5/02 F
G16H50/20
【請求項の数】 16
(21)【出願番号】P 2020559336
(86)(22)【出願日】2019-12-13
(86)【国際出願番号】 JP2019048904
(87)【国際公開番号】W WO2020122227
(87)【国際公開日】2020-06-18
【審査請求日】2022-12-08
(31)【優先権主張番号】P 2018234966
(32)【優先日】2018-12-14
(33)【優先権主張国・地域又は機関】JP
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人日本医療研究開発機構「未来医療を実現する医療機器・システム研究開発事業ICTを活用した診療支援技術研究開発プロジェクト」「表情・音声・日常生活活動の定量化から精神症状の客観的評価をリアルタイムで届けるデバイスの開発」委託研究開発、産業技術力強化法第17条の適用を受ける特許出願
(73)【特許権者】
【識別番号】598121341
【氏名又は名称】慶應義塾
(74)【代理人】
【識別番号】100174078
【弁理士】
【氏名又は名称】大谷 寛
(72)【発明者】
【氏名】岸本 泰士郎
(72)【発明者】
【氏名】田澤 雄基
(72)【発明者】
【氏名】梁 國經
(72)【発明者】
【氏名】藤田 卓仙
(72)【発明者】
【氏名】吉村 道孝
(72)【発明者】
【氏名】北沢 桃子
(72)【発明者】
【氏名】三村 將
【審査官】藤原 伸二
(56)【参考文献】
【文献】米国特許出願公開第2017/0238858(US,A1)
【文献】特表2018-524137(JP,A)
【文献】特開2018-015327(JP,A)
【文献】特開2016-163698(JP,A)
【文献】中国特許出願公開第108888281(CN,A)
【文献】韓国登録特許第10-1911516(KR,B1)
(58)【調査した分野】(Int.Cl.,DB名)
A61B 10/00
A61B 5/00-5/0538
A61B 5/06-5/398
G16H 50/20
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
被験者が身に付けたウェアラブルデバイスにより計測された生体データに基づいて被験者のうつ状態を1又は複数のコンピュータが推定する方法であって、
前記1又は複数のコンピュータが、複数のデータタイプを含む生体データをデータタイプごとに、所定の時間単位の単位時間データに変換するステップと、
前記1又は複数のコンピュータが、前記単位時間データに基づいて1又は複数の特徴量を抽出するステップと、
前記1又は複数のコンピュータが、前記1又は複数の特徴量の少なくとも一部を入力として、機械学習により生成されたうつ状態の有無又は重症度を推定する推定モデルを用いてうつ状態を推定するステップと
を含み、
前記複数のデータタイプは、歩数、消費エネルギー、体動、心拍数、睡眠状態、肌温度及び紫外線レベルからなる群より選択される少なくとも1つを含み、
前記1又は複数の特徴量は、各データタイプの前記単位時間データの分位数及び複数のデータタイプの各組合せの相関係数を含むことを特徴とする方法。
【請求項2】
前記所定の時間単位は1時間単位であることを特徴とする請求項1に記載の方法。
【請求項3】
前記1又は複数の特徴量は、肌温度の分位数を含むことを特徴とする請求項に記載の方法。
【請求項4】
前記複数のデータタイプは、肌温度及び睡眠状態を含み、
前記1又は複数の特徴量は、肌温度と睡眠状態との相関係数を含むことを特徴とする請求項に記載の方法。
【請求項5】
前記1又は複数の特徴量は、各データタイプの前記単位時間データの標準偏差をさらに含むことを特徴とする請求項1からのいずれか一項に記載の方法。
【請求項6】
前記1又は複数の特徴量の前記少なくとも一部は、正則化によって選択することを特徴とする請求項1からのいずれか一項に記載の方法。
【請求項7】
前記重症度は、HAMDのスコアであることを特徴とする請求項に記載の方法。
【請求項8】
前記推定モデルは、機械学習により生成されたうつ状態の有無を推定する第1のモデル及び機械学習により生成されたうつ状態の重症度を推定する第2のモデルを含み、
前記第2のモデルは生成に用いる生体データは、前記第1のモデルの生成に用いる生体データよりも長期間計測されたものであることを特徴とする請求項に記載の方法。
【請求項9】
1又は複数のコンピュータに、被験者が身に付けたウェアラブルデバイスにより計測された生体データに基づいて被験者のうつ状態を推定する方法を実行させるためのプログラムであって、前記方法は、
複数のデータタイプを含む生体データをデータタイプごとに、所定の時間単位の単位時間データに変換するステップと、
前記単位時間データから1又は複数の特徴量を抽出するステップと、
前記1又は複数の特徴量の少なくとも一部を入力として、機械学習により生成されたうつ状態の有無又は重症度を推定する推定モデルを用いてうつ状態を推定するステップと
を含み、
前記複数のデータタイプは、歩数、消費エネルギー、体動、心拍数、睡眠状態、肌温度及び紫外線レベルからなる群より選択される少なくとも1つを含み、
前記1又は複数の特徴量は、各データタイプの前記単位時間データの分位数及び複数のデータタイプの各組合せの相関係数を含むことを特徴とするプログラム
【請求項10】
被験者が身に付けたウェアラブルデバイスにより計測された生体データに基づいて被験者のうつ状態を推定する装置であって、
複数のデータタイプを含む生体データをデータタイプごとに、所定の時間単位の単位時間データに変換し、
前記単位時間データから1又は複数の特徴量を抽出し、
前記1又は複数の特徴量の少なくとも一部を入力として、機械学習により生成されたうつ状態の有無又は重症度を推定する推定モデルを用いてうつ状態を推定し、
前記複数のデータタイプは、歩数、消費エネルギー、体動、心拍数、睡眠状態、肌温度及び紫外線レベルからなる群より選択される少なくとも1つを含み、
前記1又は複数の特徴量は、各データタイプの前記単位時間データの分位数及び複数のデータタイプの各組合せの相関係数を含むことを特徴とする装置。
【請求項11】
複数の被験者の生体データに基づいてうつ状態を推定するための推定モデルの生成方法であって、
1又は複数のコンピュータが、被験者ごとに、複数のデータタイプを含む各被験者が身に付けたウェアラブルデバイスにより計測された生体データをデータタイプごとに、所定の時間単位の時間単位データに変換するステップと、
前記1又は複数のコンピュータが、被験者ごとに、前記時間単位データから1又は複数の特徴量を抽出するステップと、
前記1又は複数のコンピュータが、各被験者の前記1又は複数の特徴量の少なくとも一部を入力ベクトルとし、各被験者についての専門家による診断結果をラベルとする教師データを用いた機械学習により、うつ状態の有無又は重症度を推定する推定モデルを生成するステップと
を含み、
前記複数のデータタイプは、歩数、消費エネルギー、体動、心拍数、睡眠状態、肌温度及び紫外線レベルからなる群より選択される少なくとも1つを含み、
前記1又は複数の特徴量は、各データタイプの前記単位時間データの分位数及び複数のデータタイプの各組合せの相関係数を含むことを特徴とする生成方法。
【請求項12】
前記機械学習は、アンサンブル学習であることを特徴とする請求項11に記載の方法。
【請求項13】
前記1又は複数の特徴量は、各データタイプの前記時間単位データの標準偏差をさらに含むことを特徴とする請求項11又は12に記載の方法。
【請求項14】
前記1又は複数の特徴量の前記少なくとも一部は、正則化によって選択することを特徴とする請求項11又は12に記載の方法。
【請求項15】
1又は複数のコンピュータに、複数の被験者の生体データに基づいてうつ状態を推定するための推定モデルの生成方法を実行させるためのプログラムであって、前記生成方法は、
被験者ごとに、複数のデータタイプを含む各被験者が身に付けたウェアラブルデバイスにより計測された生体データをデータタイプごとに、所定の時間単位の単位時間データに変換するステップと、
被験者ごとに、前記単位時間データから1又は複数の特徴量を抽出するステップと、
各被験者の前記1又は複数の特徴量の少なくとも一部を入力とし、各被験者についての専門家による診断結果をラベルとする教師データを用いた機械学習により、うつ状態の有無又は重症度を推定する推定モデルを生成するステップと
を含み、
前記複数のデータタイプは、歩数、消費エネルギー、体動、心拍数、睡眠状態、肌温度及び紫外線レベルからなる群より選択される少なくとも1つを含み、
前記1又は複数の特徴量は、各データタイプの前記単位時間データの分位数及び複数のデータタイプの各組合せの相関係数を含むことを特徴とするプログラム。
【請求項16】
複数の被験者の生体データに基づいてうつ状態を推定するための推定モデルを生成する装置であって、
被験者ごとに、複数のデータタイプを含む各被験者が身に付けたウェアラブルデバイスにより計測された生体データをデータタイプごとに、所定の時間単位の単位時間データに変換し、
被験者ごとに、前記単位時間データから1又は複数の特徴量を抽出し、
各被験者の前記1又は複数の特徴量の少なくとも一部を入力とし、各被験者についての専門家による診断結果をラベルとする教師データを用いた機械学習により、うつ状態の有無又は重症度を推定する推定モデルを生成し、
前記複数のデータタイプは、歩数、消費エネルギー、体動、心拍数、睡眠状態、肌温度及び紫外線レベルからなる群より選択される少なくとも1つを含み、
前記1又は複数の特徴量は、各データタイプの前記単位時間データの分位数及び複数のデータタイプの各組合せの相関係数を含むことを特徴とする装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、うつ状態(depressive state)を推定する装置、方法及びそのためのプログラムに関し、より詳細には、生体データに基づいてうつ病又は躁うつ病のうつ状態を推定する装置、方法及びそのためのプログラムに関する。
【背景技術】
【0002】
近年、先進国で精神疾患の有病者が増加しており、気分障害の一類型であるうつ病又は躁うつ病の患者数が特に多い。気分障害は、大きくうつ病エピソード(depressive episode)のみの「うつ病性障害」と「躁病エピソード」と呼ばれる症状を伴う「双極性障害」に大別される。
【0003】
うつ病又は躁うつ病によりうつ状態になると一般に気力が減退し、活動的でなくなることが言われており、特許文献1には、被験者の活動量と拍動間隔に基づいて所定の条件式が満たされる場合に双極性障害であると判定する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2018-33795号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
発明者らは、今後普及が見込まれるウェアラブルデバイスを活用することで、うつ状態の判定技術を改善可能であることを見出した。本発明の目的は、ウェアラブルデバイスを用いてうつ状態を推定するための新たな装置、方法及びそのためのプログラムを提供することにある。
【課題を解決するための手段】
【0006】
このような目的を達成するために、本発明の第1の態様は、生体データに基づいて被験者のうつ状態を推定する方法であって、複数のデータタイプを含む生体データをデータタイプごとに、所定の時間単位の単位時間データに変換するステップと、前記単位時間データに基づいて1又は複数の特徴量を抽出するステップと、前記1又は複数の特徴量の少なくとも一部を入力として、あらかじめ定めた推定モデルを用いてうつ状態を推定するステップとを含むことを特徴とする。
【0007】
また、本発明の第2の態様は、第1の態様において、前記生体データは、前記被験者が身に付けたウェアラブルデバイスにより計測されたデータ又はそれに対応するデータであることを特徴とする。
【0008】
また、本発明の第3の態様は、第1又は第2の態様において、前記生体データは、48時間以上の期間にわたり計測されたデータ又はそれに対応するデータであることを特徴とする。
【0009】
また、本発明の第4の態様は、第1から第3のいずれかの態様において、前記所定の時間は1時間であることを特徴とする。
【0010】
また、本発明の第5の態様は、第1から第4のいずれかの態様において、前記複数のデータタイプは、肌温度を含むことを特徴とする。
【0011】
また、本発明の第6の態様は、第5の態様において、前記複数のデータタイプは、歩数、消費エネルギー、体動、心拍数、睡眠状態及び紫外線レベルのうちの少なくともいずれかをさらに含むことを特徴とする。
【0012】
また、本発明の第7の態様は、第1から第6のいずれかの態様において、前記1又は複数の特徴量は、各データタイプの前記単位時間データの分位数、各データタイプの前記単位時間データの標準偏差、及び複数のデータタイプの各組合せの相関係数の少なくともいずれかを含むことを特徴とする。
【0013】
また、本発明の第8の態様は、第1から第7のいずれかの態様において、前記1又は複数の特徴量の前記少なくとも一部は、正則化によって選択することを特徴とする。
【0014】
また、本発明の第9の態様は、第1から第8のいずれかの態様において、前記推定モデルは、機械学習により生成されたうつ状態の有無を推定するモデルであることを特徴とする。
【0015】
また、本発明の第10の態様は、第1から第8のいずれかの態様において、前記推定モデルは、機械学習により生成されたうつ状態の重症度を推定するモデルであることを特徴とする。
【0016】
また、本発明の第11の態様は、第10の態様において、前記重症度は、HAMDのスコアであることを特徴とする。
【0017】
また、本発明の第12の態様は、第10又は第11の態様において、前記生体データは、72時間以上の期間にわたり計測されたデータ又はそれに対応するデータであることを特徴とする。
【0018】
また、本発明の第13の態様は、コンピュータに、生体データに基づいて被験者のうつ状態を推定する方法を実行させるためのプログラムであって、前記方法は、複数のデータタイプを含む生体データをデータタイプごとに、所定の時間単位の単位時間データに変換するステップと、前記単位時間データから1又は複数の特徴量を抽出するステップと、前記1又は複数の特徴量の少なくとも一部を入力として、あらかじめ定めた推定モデルを用いてうつ状態を推定するステップとを含むことを特徴とする。
【0019】
また、本発明の第14の態様は、生体データに基づいて被験者のうつ状態を推定する装置であって、複数のデータタイプを含む生体データをデータタイプごとに、所定の時間単位の単位時間データに変換し、前記単位時間データから1又は複数の特徴量を抽出し、前記1又は複数の特徴量の少なくとも一部を入力として、あらかじめ定めた推定モデルを用いてうつ状態を推定することを特徴とする。
【0020】
また、本発明の第15の態様は、複数の被験者の生体データに基づいてうつ状態を推定するための推定モデルの生成方法であって、被験者ごとに、複数のデータタイプを含む生体データをデータタイプごとに、所定の時間単位の単位時間データに変換するステップと、被験者ごとに、前記単位時間データから1又は複数の特徴量を抽出するステップと、各被験者の前記1又は複数の特徴量の少なくとも一部を入力ベクトルとし、各被験者についての専門家による診断結果をラベルとする教師データを用いた機械学習により、前記推定モデルを生成するステップとを含むことを特徴とする。
【0021】
また、本発明の第16の態様は、第15の態様において、前記機械学習は、アンサンブル学習であることを特徴とする。
【0022】
また、本発明の第17の態様は、第15又は第16の態様において、前記1又は複数の特徴量は、各データタイプの前記単位時間データの分位数、各データタイプの前記単位時間データの標準偏差、及び複数のデータタイプの各組合せの相関係数の少なくともいずれかを含むことを特徴とする。
【0023】
また、本発明の第18の態様は、第15から第17のいずれかの態様において、前記1又は複数の特徴量の前記少なくとも一部は、正則化によって選択することを特徴とする。
【0024】
また、本発明の第19の態様は、コンピュータに、複数の被験者の生体データに基づいてうつ状態を推定するための推定モデルの生成方法を実行させるためのプログラムであって、前記生成方法は、被験者ごとに、複数のデータタイプを含む生体データをデータタイプごとに、所定の時間単位の単位時間データに変換するステップと、被験者ごとに、前記単位時間データから1又は複数の特徴量を抽出するステップと、各被験者の前記1又は複数の特徴量の少なくとも一部を入力とし、各被験者についての専門家による診断結果をラベルとする教師データを用いた機械学習により、前記推定モデルを生成するステップとを含むことを特徴とする。
【0025】
また、本発明の第20の態様は、複数の被験者の生体データに基づいてうつ状態を推定するための推定モデルを生成する装置であって、被験者ごとに、複数のデータタイプを含む生体データをデータタイプごとに、所定の時間単位の単位時間データに変換し、被験者ごとに、前記単位時間データから1又は複数の特徴量を抽出し、各被験者の前記1又は複数の特徴量の少なくとも一部を入力とし、各被験者についての専門家による診断結果をラベルとする教師データを用いた機械学習により、前記推定モデルを生成することを特徴とする。
【発明の効果】
【0026】
本発明の一態様によれば、複数のデータタイプを含む生体データをウェアラブルデバイスを用いて取得し、当該生体データに基づく1又は複数の特徴量によりうつ状態を推定することによって、従来の推定技術を改善することができる。
【図面の簡単な説明】
【0027】
図1】本発明の第1の実施形態にかかる装置を示す図である。
図2】本発明の第1の実施形態にかかる推定モデルの生成プロセスを説明するための図である。
図3】本発明の第1の実施形態にかかる推定モデルを用いた推定プロセスを説明するための図である。
図4】本発明の実施例2-1の推定結果の精度を示す図である。
図5】本発明の実施例2-2の推定結果の精度を示す図である。
図6】本発明の実施例2-3の推定結果の精度を示す図である。
【発明を実施するための形態】
【0028】
以下、図面を参照して本発明の実施形態を詳細に説明する。
【0029】
(第1の実施形態)
本発明の第1の実施形態では、ウェアラブルデバイスとして、リストバンド型で加速度センサ、脈拍センサ、紫外線センサ及び温度センサを備えるSilmee(登録商標)W20という製品を用いた。加速度センサから歩数、消費エネルギー、体動及び睡眠状態に関する生体データが得られ、紫外線センサからは紫外線レベルが得られ、温度センサから肌温度に関する生体データが得られる。
【0030】
加速度センサから得られる睡眠状態(sleep state)に関する生体データは、より具体的には、アクチグラフィーとして知られる手法と同様に、三軸加速度センサの各軸の方向における加速度から算出される値が所定の閾値を超えていれば起きている状態と判定し、越えていなければ寝ている状態と判定することによって得ることができる。一例として、加速度センサの値が記録される各時刻又は各時点における睡眠状態を寝ている状態(sleeping state)であれば1、起きている状態(awake state)であれば0によって表現し、値が1である状態が連続する時間を睡眠時間として評価し、その開始時刻及び終了時刻を就寝時刻及び起床時刻とそれぞれ評価することが可能である。また、一例として、睡眠状態の評価において、加速度センサの値以外の心拍数等の値も反映させることが挙げられる。
【0031】
温度センサから得られる肌温度(skin temperature)に関する生体データは、より具体的には、ウェアラブルデバイス110が着用される手首等の部位の肌温度を測定することによって得ることができる。正確な体温は、中核体温(core temperature)と呼ばれ、直腸温、腋窩温等の測定により得られるが、本実施形態において測定する肌温度は、被験者における測定の負担が小さく、継続的なデータの取得を現実的に可能にする。
【0032】
図1に、本実施形態にかかる装置を示す。装置100は、ウェアラブルデバイス110と有線又は無線で接続され、ウェアラブルデバイス110により得られる生体データを受け取る。装置100は、図示のように直接的に生体データを受信するのではなく、ウェアラブルデバイス110がスマートフォンなどの携帯端末と接続され、当該携帯端末を介してデータを受信したり、ウェアラブルデバイス110がインターネットなどのIPネットワーク上のサーバと接続され、当該サーバを介してデータを受信したり、得られた生体データをUSBクレードルを通じて装置100に入力したりしてもよい。
【0033】
装置100は、プロセッサ、CPU等の処理部101と、メモリ、ハードディスク等の記憶装置又は記憶媒体を含む記憶部102と、有線又は無線で他のデバイスと通信するための通信インターフェースなどの通信部103とを備え、各処理を行うためのプログラムを処理部101において実行することによって構成することができる。装置100は、1又は複数の装置、コンピュータないしサーバを含むことがあり、また当該プログラムは、1又は複数のプログラムを含むことがあり、また、コンピュータ読み取り可能な記憶媒体に記録して非一過性のプログラムプロダクトとすることができる。
【0034】
本実施形態においては、まず、複数の被験者からウェアラブルデバイス110により得られる生体データを用いて、うつ状態の有無を推定するための推定モデルを機械学習によって生成する。そして、当該推定モデルを用いて新たな被験者のうつ状態の推定を行う。以下では、推定モデルの生成と推定モデルを用いた推定に分けて説明する。共に装置100における処理として説明するが、推定モデルの生成と推定モデルを用いた推定が異なるコンピュータにおいて行われ得ることが想定されている。本実施形態にかかる手法は、うつ状態のスクリーニングに有用であり、特に産業保健での健康診断などで活用可能である。
【0035】
推定モデルの生成
l人(lは正の整数)の被験者からのm日分(mは正の数)の生体データをデータタイプごとに、1時間等のあらかじめ定めた時間単位のデータ(以下「単位時間データ(unit time data)」と呼ぶ。)に変換する(S201)。生体データに含まれるデータタイプとして、歩数、消費エネルギー、体動、心拍数、睡眠状態、肌温度及び紫外線レベルが挙げられる。データタイプは、モダリティ(modality)とも呼ぶことがある。一例として、歩数、消費エネルギー、体動、及び睡眠状態、すなわち睡眠時間については、あらかじめ定めた時間にわたって積算した値、心拍数、肌温度及び紫外線レベルについては、あらかじめ定めた時間における平均値を単位時間データとすることができる。また、心拍数、肌温度及び紫外線レベルについて、あらかじめ定めた時間にわたって積算した値としてもよい。
【0036】
次に、被験者ごと、かつ、データタイプごとに、得られた24mのサンプルデータの分布のn個(nは正の整数)の分位数を定める(S202)。たとえばn=5として、第5百分位数、第25百分位数、第50百分位数、第75百分位数、第95百分位数の5個の分位数を記憶する。ここでは、単位時間データが1時間単位である場合を例としている。
【0037】
また、被験者ごと、かつ、データタイプごとに、得られた24mのサンプルデータの分布の標準偏差を算出する(S203)。
【0038】
そして、被験者ごとに、データタイプの各組合せについて、ピアソン相関係数等の相関係数を算出する(S204)。データタイプが上述の7個であれば21通りの組合せがある。ここでは分位数、標準偏差、そしてピアソン相関係数の順序で説明したが、これらは順不同で行うことができる。
【0039】
次いで、こうして各被験者の生体データから抽出された分位数、標準偏差及び相関係数という特徴量(feature)を入力ないし入力ベクトル、各被験者についての医師等の専門家によるうつ状態の有無(presence or absence)の評価をラベルとして、l-1人の結果を教師データとして用いた機械学習により、うつ状態か否かの分類問題の推定モデルを訓練する(S206)。生成された推定モデルは、当該推定モデルを用いた推定を行う装置100の記憶部102又は装置100からアクセス可能な記憶媒体又は記憶装置に記憶される。
【0040】
抽出した特徴量の一部であるサブセットをたとえば正則化の一手法であるL1正則化、L2正則化、これらを組み合わせたElastic Netなどによって選択して(S205)、これを入力ベクトルとしてもよい。また、機械学習は、勾配ブースティングの一手法であるXGBoostなどのアンサンブル学習によって行うことができる。
【0041】
教師データから除いた1人の結果を用いて、生成した推定モデルの交差検証(cross validation)を行う。推定モデルの妥当性の検証はこうしたleave-one-out交差検証(LOOCV)に必ずしも限るものではないことを付言する。具体例として、k分割交差検証(k-fold cross validation)が挙げられ、これは、教師データをk分割して分割されたいずれか1組のデータを用いる検証をk回繰り返す手法である。検証の手法は、学習に用いるデータに影響を与えるため、生成される推定モデルの精度にも影響を及ぼすところ、k分割交差検証は一般に、LOOCVと比較してオーバーフィッティングの問題を緩和する。
【0042】
推定モデルを用いた推定
うつ状態の有無の判定を行う被験者のm’日分(m’は正の数)の生体データをデータタイプごとに単位時間データに変換する(S301)。単位時間データへの変換は、ウェアラブルデバイス110が測定した生体データ又はそれに対してウェアラブルデバイス110若しくは装置100において処理を施した当該生体データに対応するデータを1分単位のデータに変換した後にさらに1時間単位のデータに変換して行うなど、さまざまな手法を用いることができる。この点は、予測モデルの生成時においても同様である。ただし、推定時の単位時間と生成時の単位時間は等しいことが望ましい。
【0043】
そして、データタイプごとに、特徴量を抽出して記憶する(S302)。必要に応じて特徴量のサブセットを選択し、特徴量又はそのサブセットを入力ないし入力ベクトルとして、あらかじめ生成された推定モデルを用いてうつ状態の有無を推定する(S303)。
【0044】
上述の説明では、特定の製品をウェアラブルデバイスの例として挙げたが、加速度センサ、脈拍センサ、紫外線センサ及び温度センサを備えるものであればよく、また、予測モデルの高精度に大きく寄与していると考えられる温度センサを少なくとも備えるウェアラブルデバイスとするのが好ましい。
【0045】
なお、「××のみに基づいて」、「××のみに応じて」、「××のみの場合」というように「のみ」との記載がなければ、本明細書においては、付加的な情報も考慮し得ることが想定されていることに留意されたい。また、一例として、「aの場合にbする」という記載は、明示した場合を除き、「aの場合に常にbする」ことを必ずしも意味しないことに留意されたい。
【0046】
また、念のため、なんらかの方法、プログラム、端末、装置、サーバ又はシステム(以下「方法等」)において、本明細書で記述された動作と異なる動作を行う側面があるとしても、本発明の各態様は、本明細書で記述された動作のいずれかと同一の動作を対象とするものであり、本明細書で記述された動作と異なる動作が存在することは、当該方法等を本発明の各態様の範囲外とするものではないことを付言する。
【0047】
実施例1-1
62人の被験者について2日分以上の生体データをSilmee W20を用いて取得し、本実施形態にかかる手法によって推定モデルを生成した。推定モデルの検証は、leave-one-out交差検証により行った。そして、当該推定モデルを用いたうつ状態の有無の推定結果と医師による診断結果と比較した結果が以下の表である。生体データは、診断日前の6日間のうちの2日分以上を用いており、Elastic Netによるサブセットの選択及びXGBoostによる機械学習がなされている。単位時間データは、1時間単位の値である。
【0048】
【表1】
【0049】
医師によるうつ病の診断は、うつ病の一般的な診断指標であるハミルトン評価尺度HAMDを用いており、本実施例においてはHAMD17のカットオフを7とし、スコアが7を超える場合にうつ病と判断した。正解率(accuracy)は0.854、感度(recall)は0.906、特異度(specificity)は0.800であった。
【0050】
本実施例によれば、高い精度でうつ状態の推定がなされており、健常者とうつ病患者とをスクリーニング可能であることが分かる。発明者らの知る限り従来うつ状態の推定に有益であると指摘された例のない肌温度を、これまで指摘されている心拍数などに組み合わせることが高い精度の実現に寄与しているものと考えられる。したがって、生体データとしては、肌温度と、歩数、エネルギー、体動、心拍数、睡眠状態及び紫外線レベルの少なくともいずれかとを含む2以上のデータタイプを含むことが好ましい。
【0051】
実施例1-2
実施例1-1と同様の条件下で、55人の被験者について診断日前の6日間のうちの3日分以上の生体データを取得し、本実施形態にかかる手法によって推定モデルの生成及びうつ状態の推定を行った結果が以下の表である。
【0052】
【表2】
【0053】
正解率は0.855、感度は0.862、特異度は0.846であった。
【0054】
本実施例によれば、高い精度でうつ状態の推定がなされていることが分かるが、2日分の生体データで行ったうつ状態の有無の推定と比較して顕著な精度向上はみられず、本実施形態にかかる手法が、2日分又は48時間分の生体データを用いれば十分に高い精度を得られるものであると言える。このことは、被験者がウェアラブルデバイス110を着用しなければならない期間の短縮につながり、着用時間が短く被験者の負担が小さいことは、うつ病早期発見のためのスクリーニングの普及を促す。
【0055】
実施例1-3
86人の被験者について3日分以上の生体データをSilmee W20を用いて取得し、本実施形態にかかる手法によって推定モデルを生成した。推定モデルの検証は、10-fold交差検証により行った。そして、当該推定モデルを用いたうつ状態の有無の推定結果と医師による診断結果と比較した結果が以下の表である。生体データは、86人について得られた228個のサンプルデータを10分割した。ここで、同一の被験者のデータは同一の組(fold)に収まるようにした。また、一部の被験者からは複数のデータセットを取得している。サブセットの選択は行わず、XGBoostによる機械学習がなされている。単位時間データは、1時間単位の値である。
【0056】
【表3】
【0057】
正解率は0.737、感度は0.661、特異度は0.807であった。検証手法をLOOCVから10-fold交差検証に変えたことによるオーバーフィッティングの緩和が正解率等の若干の低下を招いていると考えられるが、依然として高い精度での推定がなされている。
【0058】
生成された推定モデルにおいて、いずれの特徴量が推定結果に大きく寄与しているかを示す各特徴量の重要度(importance)を計算した結果が以下の表であり、具体的には、ある特徴量を変化させた時にどれくらいモデル精度が改善するかを計算することで特徴量ごとの重要度を推定しており、マイクロソフトが提供するサービス「Azure Machine Learning(商標)」を用いた。すべての特徴量について合計すると重要度は1となる。
【0059】
【表4】
【0060】
睡眠状態と肌温度との相関係数、肌温度の第50百分位数、そして体動の標準偏差が重要度の高い特徴量であることが分かり、肌温度の寄与が大きいことが確認された。また、肌温度と睡眠状態との相関係数の寄与も大きく、生体データとして、肌温度に加えて睡眠状態を含むことが好ましいと言える。
【0061】
(第2の実施形態)
本発明の第2の実施形態は、うつ状態の有無のみならず、あるいはうつ状態の有無に代替して、うつ状態の重症度(severity)を推定可能とする。まず、複数の被験者からウェアラブルデバイス110により得られる生体データを用いて、うつ状態の重症度を推定するための推定モデルを機械学習によって生成する。そして、当該推定モデルを用いて新たな被験者のうつ状態の重症度を推定する。
【0062】
本実施形態における推定モデルの生成は、第1の実施形態において図2を参照して説明したものと同様であり、機械学習の際に用いる医師の診断結果がうつ状態の有無ではなくうつ状態の重症度のスコアである点と、機械学習で用いるアルゴリズムが分類問題に適したアルゴリズムではなく回帰問題に適したアルゴリズムである点で異なる。
【0063】
また、本実施形態における推定モデルを用いた推定は、第1の実施形態において図3を参照して説明したものと同様であり、出力がうつ状態の有無ではなくうつ状態の重症度である点で異なる。
【0064】
うつ状態の重症度には、ハミルトン評価尺度HAMDを用いることができる。いくつかのバージョンがあり、HAMD17は、医師等の専門家が17項目を評価していき、各項目について3~5点まであり、たとえば、7点までが正常、8~13点が軽症、14~18点が中等症、19~22点は重症、23点以上は最重症のように診断が行われる。
【0065】
本実施形態の手法によれば、うつ状態の重症度を判定可能であるため、うつ状態の治療方針の判断、処方薬の変更など、治療上必要な緻密な判断にまで寄与することができ、精神科臨床における診断治療補助において有益性が高い。
【0066】
実施例2-1
62人の被験者について2日分以上の生体データをSilmee W20を用いて取得し、本実施形態にかかる手法によって推定モデルを生成した。推定モデルの検証は、leave-one-out交差検証により行った。そして、当該推定モデルを用いたうつ状態の有無の推定結果と医師による診断結果と比較した結果が図4である。生体データは、診断日前の6日間のうちの2日分以上を用いており、Elastic Netによるサブセットの選択及びXGBoostによる機械学習がなされている。単位時間データは、1時間単位の値である。
【0067】
平均絶対誤差(mean absolute error)は4.11で、相関係数(correlation coefficient)は0.604、p値は2.04×10-7という結果となった。R2は0.341である。
【0068】
実施例2-2
実施例2-1と同様の条件下で、55人の被験者について3日分以上の生体データを取得し、本実施形態にかかる手法によって推定モデルの生成及びうつ状態の重症度の推定を行った結果が図5である。
【0069】
平均絶対誤差は3.29で、相関係数は0.763、p値は1.22×10-11という結果となった。R2は0.570である。この結果は、実施例2-1と比較して高い相関係数を示しており、重症度推定においては、0.700を超える高い推定精度を得るには3日間又は72時間程度又は以上の着用が必要である可能性が高いということが分かる。このことは、実施例1-1及び1-2と対比すれば、うつ状態の重症度を推定するためのモデルは、うつ状態の有無を推定するためのモデルよりも長期間計測された生体データを用いて生成することが好ましいことを意味する。
【0070】
実施例2-3
86人の被験者について7日分以上の生体データをSilmee W20を用いて取得し、本実施形態にかかる手法によって推定モデルを生成した。推定モデルの検証は、10-fold交差検証により行った。そして、当該推定モデルを用いたうつ状態の有無の推定結果と医師による診断結果と比較した結果が図6である。生体データは、86人について得られた236個のサンプルデータを10分割した。ここで、同一の被験者のデータは同一の組(fold)に収まるようにした。また、一部の被験者からは複数のデータセットを取得している。サブセットの選択は行わず、XGBoostによる機械学習がなされている。単位時間データは、1時間単位の値である。
【0071】
平均絶対誤差は4.94で、相関係数は0.610、p値は2.20×10-16という結果となった。R2は0.372である。検証手法をLOOCVから10-fold交差検証に変えたことによるオーバーシューティングの緩和が相関係数等の若干の低下を招いていると考えられるが、依然として高い精度での推定がなされている。
【0072】
生成された推定モデルにおいて、いずれの特徴量が推定結果に大きく寄与しているかを示す各特徴量の重要度(importance)を計算した結果が以下の表であり、具体的にはマイクロソフトが提供するサービス「Azure Machine Learning(商標)」を用いた。すべての特徴量について合計すると重要度は1となる。
【0073】
【表5】
【0074】
肌温度の第95百分位数、睡眠状態と肌温度との相関係数、そして肌温度の第50百分位数が重要度の高い特徴量であることが分かり、実施例1-3と同様に、肌温度の寄与が大きいことが確認された。また、実施例1-3と同様に、肌温度と睡眠状態との相関係数の寄与も大きく、生体データとして、肌温度に加えて睡眠状態を含むことが好ましいと言える。
【符号の説明】
【0075】
100 装置
101 処理部
102 記憶部
103 通信部
110 ウェアラブルデバイス
図1
図2
図3
図4
図5
図6