(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-16
(45)【発行日】2024-07-24
(54)【発明の名称】情報処理装置、特徴量選択方法、教師データ生成方法、推定モデル生成方法、ストレス度の推定方法、およびプログラム
(51)【国際特許分類】
A61B 5/16 20060101AFI20240717BHJP
【FI】
A61B5/16 110
(21)【出願番号】P 2022576286
(86)(22)【出願日】2021-01-21
(86)【国際出願番号】 JP2021001945
(87)【国際公開番号】W WO2022157872
(87)【国際公開日】2022-07-28
【審査請求日】2023-07-18
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】中島 嘉樹
(72)【発明者】
【氏名】辻川 剛範
【審査官】鴨志田 健太
(56)【参考文献】
【文献】米国特許出願公開第2010/0332430(US,A1)
【文献】米国特許出願公開第2016/0320291(US,A1)
【文献】特開2017-213984(JP,A)
【文献】国際公開第2019/159252(WO,A1)
【文献】RASTGOO, Mohammad Naim et al.,A Critical Review of Proactive Detection of Driver Stress Levels Based on Multimodal Measurements,ACM Computing Surveys,2018年09月,Vol. 51, No. 5, Article 88
【文献】ALBERDI, Ane et al.,Towards an automatic early stress recognition system for office environments based on multimodal mea,Journal of Biomedical Informatics,2016年02月,Vol. 59,pp. 49-75
(58)【調査した分野】(Int.Cl.,DB名)
A61B 5/16
(57)【特許請求の範囲】
【請求項1】
ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する第1選択手段と、
前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択する第2選択手段と、を備え
、
前記第1選択手段は、有用性の評価と当該評価の結果に基づく特徴量の選択とを前記モダリティ毎に行うことにより前記特徴集合を生成する、情報処理装置。
【請求項2】
複数の前記モダリティには、被験者のストレス状態が反映された行動に関する測定データを用いて生成された特徴量が分類される行動的モダリティと、前記被験者のストレス状態が反映された生理現象に関する測定データを用いて生成された特徴量が分類される生理的モダリティとが含まれる、請求項
1に記載の情報処理装置。
【請求項3】
少なくとも1つのプロセッサが、
ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成することと、
前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択することと、を含
み、
前記少なくとも1つのプロセッサは、有用性の評価と当該評価の結果に基づく特徴量の選択とを前記モダリティ毎に行うことにより前記特徴集合を生成する、特徴量選択方法。
【請求項4】
少なくとも1つのプロセッサが、
請求項
3に記載の特徴量選択方法により選択された特徴量の組み合わせに対し、正解データとして被験者のストレス度を対応付けて、前記機械学習に用いる教師データを生成することを含む、教師データ生成方法。
【請求項5】
少なくとも1つのプロセッサが、
請求項
4に記載の教師データ生成方法により生成された前記教師データを用いた機械学習により前記推定モデルを生成することを含む、推定モデル生成方法。
【請求項6】
少なくとも1つのプロセッサが、
請求項
5に記載の推定モデル生成方法により生成された前記推定モデルを用いて被験者のストレス度を推定することを含む、ストレス度の推定方法。
【請求項7】
コンピュータを、
ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する第1選択手段、および
前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択する第2選択手段、として機能させ
、
前記第1選択手段は、有用性の評価と当該評価の結果に基づく特徴量の選択とを前記モダリティ毎に行うことにより前記特徴集合を生成する、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ストレス度の推定モデルの機械学習のための特徴量選択に関する。
【背景技術】
【0002】
近年、職業性ストレスにより従業員が抑うつなどのメンタル不調をきたし、離職したり休職したりするケースが増加している。また、これに伴い、従業員を維持・確保する企業の負担増も問題となっている。このような背景から、ストレスのモニタリングについての研究が進められている。例えば、被験者の体動データや生体データ等の測定データを用いてストレス度の推定モデルを生成し、生成した推定モデルを用いて被験者のストレス度を推定する技術の研究も進められている。
【0003】
ここで、ストレス推定については、生体信号等をもとに算出される多くの統計量がストレス推定に有効な特徴量であるとされているものの、そのどれが最適なのか、明確な知見はない。また、推定モデルを構築するためには、特徴量のデータに加え、その特徴量が計測されたときの被験者のストレス度を示すストレススコアについても収集する必要があり、これらのデータ収集に要するコストは高い。このため、得られるデータサンプルは特徴量の候補の数に対して少なくなることが多く、その場合、「次元の呪い」によって学習精度を高めることが難しくなる。
【0004】
ストレス推定のための技術を開示したものではないが、特徴量選択について開示された文献として、例えば下記の特許文献1が挙げられる。下記特許文献1には、推論モデルを用いてユーザの心理状態を判断する装置が開示されている。この装置では、様々なセンサで計測したセンサデータからユーザの心理状態分析のための特徴データを抽出し、抽出した特徴データから、種々の特徴量選択アルゴリズムを用いて、重要度が高い一部を選択している。具体的には、特許文献1の技術では、情報利得、カイ二乗分布、および相互情報アルゴリズム等の特徴量選択アルゴリズムを用いて特徴データの重要度を計算し、高い重要度を有する一部の特徴データを選択している。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、前記のような特徴量選択方法は、各種特徴量の性質を考慮しない一般的なものであり、前記のような特徴量選択方法をストレス度の推定モデルの機械学習に適用する場合には、改善の余地が生じる。本発明の一態様は、この点に鑑みてなされたものであり、その目的の一例は、ストレス度の推定モデルの機械学習のための特徴量選択方法を改善することができる情報処理装置等を提供することにある。
【課題を解決するための手段】
【0007】
本発明の一側面に係る情報処理装置は、ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する第1選択手段と、前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択する第2選択手段と、を備える。
【0008】
本発明の一側面に係る特徴量選択方法は、少なくとも1つのプロセッサが、ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成することと、前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択することと、を含む。
【0009】
本発明の一側面に係るプログラムは、コンピュータを、ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する第1選択手段、および前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択する第2選択手段、として機能させる。
【発明の効果】
【0010】
本発明の一態様によれば、ストレス度の推定モデルの機械学習のための特徴量選択法を改善することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の例示的実施形態1に係る情報処理装置の構成を示すブロック図である。
【
図2】本発明の例示的実施形態1に係る特徴量選択方法の流れを示すフロー図である。
【
図3】本発明の例示的実施形態2に係る情報処理装置が実行する処理の概要を示す図である。
【
図4】前記情報処理装置の構成を示すブロック図である。
【
図5】本発明の例示的実施形態2に係る推定モデル生成方法の流れを示すフロー図である。
【
図6】本発明の例示的実施形態2に係るストレス度の推定方法の流れを示すフロー図である。
【
図7】本発明の例示的実施形態3に係る情報処理装置が実行する処理の概要を示す図である。
【
図8】本発明の各例示的実施形態に係る特徴量選択方法の効果検証実験の結果を示す図である。
【
図9】本発明の各例示的実施形態に係る情報処理装置の各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
【0012】
〔例示的実施形態1〕
本発明の第1の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する例示的実施形態の基本となる形態である。
【0013】
(情報処理装置の構成)
本例示的実施形態に係る情報処理装置1の構成について、
図1を参照して説明する。
図1は、情報処理装置1の構成を示すブロック図である。図示のように、情報処理装置1は、第1選択部11と第2選択部12とを備えている。
【0014】
第1選択部11は、ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する。なお、特徴量の有用性とは、当該特徴量を機械学習に適用した際の有用性であり、有用性が高い特徴量を用いて機械学習を行うことにより、高精度な推定が可能な推定モデルを生成することができる。有用性の評価方法は、高精度な推定が可能な推定モデルの生成に寄与する可能性が高い特徴量と低い特徴量とを区分できるようなものであればよく、特に限定されない。
【0015】
第2選択部12は、前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択する。推定精度の検証方法は任意であり、特に限定されない。
【0016】
以上のように、本例示的実施形態に係る情報処理装置1においては、複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する。そして、生成した特徴集合に含まれる特徴量の各組み合わせを推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記推定モデルの機械学習に用いる特徴量の組み合わせを選択する、という構成が採用されている。
【0017】
前記の構成によれば、特徴量の各組み合わせを推定モデルの機械学習に適用して推定精度を検証する前に、複数の特徴量のそれぞれについての有用性の評価結果に基づいて特徴量を選択する。これにより、複数の特徴量のうち有用性が高いものを対象として推定精度の検証が行われるため、効率のよい検証が可能になると共に、機械学習に用いる特徴量の次元数が大き過ぎることによる「次元の呪い」の問題が生じる可能性を低減することができる。
【0018】
ただし、有用性の評価結果に基づく特徴量選択では、一部のモダリティに対応する特徴量が選択されない可能性がある。なお、特徴量のモダリティとは、特徴量の性質に応じて定められた分類である。どのような特徴量をどのようなモダリティに分類するかは予め定めておけばよい。例えば、“Physiological signal based work stress detection using unobtrusive sensors”(Anushaら, Biomed. Phys. Eng. Express, vol. 4, no. 6, p. 065001, Sep. 2018)では、ストレスの推定において、発汗と皮膚温度をそれぞれ別のモダリティに分類している。また、“Towards an automatic early stress recognition system for office environments based on multimodal measurements”(Alberdiら, Journal of Biomedical Informatics, vol. 59, pp. 49-75, Feb. 2016)には、ストレスの兆候はマルチモーダルに表れると記載されている。具体的には、ストレスの兆候は心理的(psychological)、生理的(physiological)、および行動的(behavioral)の3つのモダリティに表れると記載されている。
【0019】
そこで、前記の構成によれば、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成している。これにより、各モダリティに対応する特徴量が何れも選択される可能性を高めることができ、選択された特徴量を用いた機械学習により、頑健性の高い推定モデルを構築することができる。なお、頑健性の高い推定モデルとは、安定して高精度な推定を行うことができる推定モデルである。
【0020】
以上のように、本例示的実施形態に係る情報処理装置1によれば、ストレス度の推定モデルの機械学習のための特徴量選択法を改善することができるという効果が得られる。
【0021】
(特徴量選択方法の流れ)
本例示的実施形態に係る特徴量選択方法の流れについて、
図2を参照して説明する。
図2は、特徴量選択方法の流れを示すフロー図である。
【0022】
S11では、少なくとも1つのプロセッサが、ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する。
【0023】
S12では、少なくとも1つのプロセッサが、特徴集合に含まれる特徴量の各組み合わせを推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記推定モデルの機械学習に用いる特徴量の組み合わせを選択する。
【0024】
なお、1つのプロセッサにS11~S12の処理を実行させてもよいし、S11の処理とS12の処理をそれぞれ別のプロセッサに実行させてもよい。後者の場合、各プロセッサは、1つの情報処理装置(例えば
図1に示す情報処理装置1)が備えているものであってもよいし、それぞれ異なる情報処理装置が備えているものであってもよい。
【0025】
以上のように、本例示的実施形態に係る特徴量選択方法においては、少なくとも1つのプロセッサが、特徴集合に含まれる特徴量の各組み合わせを推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記推定モデルの機械学習に用いる特徴量の組み合わせを選択し、少なくとも1つのプロセッサが、特徴集合に含まれる特徴量の各組み合わせを推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記推定モデルの機械学習に用いる特徴量の組み合わせを選択する、という構成が採用されている。このため、本例示的実施形態に係る特徴量選択方法によれば、ストレス度の推定モデルの機械学習のための特徴量選択法を改善することができるという効果が得られる。
【0026】
上述の情報処理装置1の機能は、プログラムによって実現することもできる。本例示的実施形態に係る特徴量選択プログラムは、コンピュータを情報処理装置1として機能させるプログラムであって、前記コンピュータを、ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する第1選択手段、および、前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択する第2選択手段として機能させる、という構成が採用されている。このため、本例示的実施形態に係る特徴量選択プログラムによれば、ストレス度の推定モデルの機械学習のための特徴量選択法を改善することができるという効果が得られる。
【0027】
〔例示的実施形態2〕
(概要)
本例示的実施形態では、ストレス度の推定モデルを構築するための特徴量の選択から、選択した特徴量を用いた推定モデルの生成、そして生成した推定モデルを用いたストレス度の推定までの各処理を1つの情報処理装置で行う例を説明する。この情報処理装置を、情報処理装置4と呼ぶ。
【0028】
図3は、情報処理装置4が実行する処理の概要を示す図である。S21では、情報処理装置4は、被験者のストレスの度合いを示すストレス度に関連する測定データから特徴量を算出する。
【0029】
本例示的実施形態では、被験者が身に付けたウェアラブルデバイスにより、マルチモーダルな信号をセンシングする。具体的には、本例示的実施形態では、前記ウェアラブルデバイスにより、被験者の体動を示す体動データ(例えば加速度データ)、被験者の心拍数を示す心拍データ、および被験者の発汗を示す発汗データを前記測定データとして測定する例を説明する。無論、測定データは、被験者のストレス度に相関のあるものであればよく、前記の3種類に限られない。例えば、被験者の体温、脳波、または脈拍等を示す生体信号データを前記測定データとしてもよい。
【0030】
S21における特徴量の算出方法は、ストレス度と関連のある特徴量を算出できるようなものであればよく、任意である。例えば、測定データをそのまま特徴量としてもよいし、測定データからノイズ成分を除去して特徴量としてもよいし、測定データを時分割して特徴量としてもよいし、所定の数式に測定データを代入して特徴量を算出してもよい。また、S21では、情報処理装置4は、1種類の測定データから複数種類の特徴量を算出してもよい。これにより、例えば測定データが体動データと心拍データと発汗データの3種類であっても、数百~数千の特徴量を生成することができる。
【0031】
S22a~S22cでは、情報処理装置4は、1段階目の特徴量選択を行う。この1段階目の特徴量選択では、S21で算出された特徴量をモダリティごとに分けて、ラッパー法(Wrapper Method)以外の手法により特徴量選択を行う。以下では、各モダリティの特徴量の集合を、当該モダリティの特徴量セットと呼ぶ。
【0032】
なお、ラッパー法は、特徴量選択の手法の一つである。ラッパー法では、特徴量の各組み合わせを推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、機械学習に用いる特徴量の最適な組み合わせを選択する。一方、S22a~S22cにおけるラッパー法以外の手法による特徴量選択では、情報処理装置4は、複数の特徴量のそれぞれについての有用性を評価し、有用性が高い特徴量を選択する。つまり、S22a~S22cでは、情報処理装置4は、有用性の評価と当該評価の結果に基づく特徴量の選択とをモダリティ毎に行う。ラッパー法以外の手法は、評価に推定モデルを用いない点でラッパー法と相違している。ラッパー法以外の手法の具体例としては、例えばフィルタ法(Filter Method)や主成分分析等が挙げられる。
【0033】
図3の例では、A~Cの3種類のモダリティのそれぞれについて特徴量選択を行っている。例えば、特徴量算出の元になった測定データごとにモダリティを設定してもよい。この場合、例えば、体動データから算出された各種特徴量をモダリティAとし、心拍データから算出された各種特徴量をモダリティBとし、発汗データから算出された各種特徴量をモダリティCとしてもよい。また、例えば、脈波、発汗、体温等の被験者のストレス状態が反映された生理現象に関する生理信号から生成された特徴量を、生理的(physiological)モダリティに分類してもよい。そして、体動等の被験者のストレス状態が反映された行動に関する行動信号から生成された特徴量を、行動的(behavioral)モダリティに分類してもよい。
【0034】
S22a~S22cの処理を行う段階では、特徴量が十分に絞り込まれていない。このため、この段階においてラッパー法で特徴量選択をしたとすると、処理時間が長大化し、また、次元の呪いにより妥当な特徴量選択ができないことが危惧される。このため、S22a~S22cでは、ラッパー法以外の手法で特徴量選択する。これにより、ラッパー法と比べて少ない演算量で特徴量選択が可能であり、次元の呪いの問題も回避できる。
【0035】
S22aでは、情報処理装置4は、S21で算出した特徴量のうちモダリティAの特徴量からなる特徴量セットから特徴量選択を行う。これにより、モダリティAの特徴量からなり、S22aの処理によって有用でないものがふるい落とされた、モダリティAの特徴量部分セットが得られる。
【0036】
同様に、S22bでは、情報処理装置4は、S21で算出した特徴量のうちモダリティBの特徴量からなる特徴量セットから特徴量選択を行う。これにより、モダリティBの特徴量からなり、S22bの処理によって有用でないものがふるい落とされた、モダリティBの特徴量部分セットが得られる。
【0037】
同様に、S22cでは、情報処理装置4は、S21で算出した特徴量のうちモダリティCの特徴量からなる特徴量セットから特徴量選択を行う。これにより、モダリティCの特徴量からなり、S22cの処理によって有用でないものがふるい落とされた、モダリティCの特徴量部分セットが得られる。なお、S22a~S22cにおける特徴量選択の方法は同じであってもよいし、それぞれ異なっていてもよい。また、S22a~S22cで選択する特徴量の数も、同じであってもよいし、それぞれ異なっていてもよい。ただし、選択する特徴量の数が多すぎると、S23の処理時間の長大化や次元の呪いの問題が生じるので、S22a~S22cで選択する特徴量の総数はこのような問題が生じにくい範囲内とすることが望ましい。
【0038】
以上の処理により、モダリティA~Cのそれぞれに対応する特徴量を少なくとも1つ含む特徴集合が得られる。S23では、この特徴集合から2段階目の特徴量選択が行われる。2段階目の特徴量選択では、情報処理装置4は、前記特徴集合に含まれる特徴量の各組み合わせを推定モデルの機械学習に適用して推定精度を検証する。そして、情報処理装置4は、前記検証の結果に基づいて、機械学習に用いる特徴量の組み合わせを選択する。S23における特徴量選択には、例えばラッパー法を用いることができる。ラッパー法は、実際に推定モデルを使用して特徴量の組み合わせを評価する特徴量選択手法であるため、特徴量の好適な組み合わせの選択に極めて有効である。
【0039】
ただし、ラッパー法は、モデルベース学習であるため、多数の特徴量で学習させると次元の呪いにより学習効果が薄くなる可能性があり、また処理時間が長大化してしまう。このため、情報処理装置4は、上述のように、S22a~S22cの処理により特徴量の絞り込みを行っている。これにより、次元の呪いを回避しつつ、特徴量の好適な組み合わせを選択することができ、また処理時間の長大化も避けることができる。
【0040】
S24では、情報処理装置4は、S23で選択した特徴量の組み合わせを用いて機械学習を行い、ストレス度の推定モデルを生成する。より詳細には、S24では、情報処理装置4は、まず、S23で選択した特徴量の組み合わせに対し、正解データとして被験者のストレス度を対応付けて、機械学習に用いる教師データを生成する。そして、情報処理装置4は、生成した教師データを用いて機械学習を行い、ストレス度の推定モデルを生成する。
【0041】
S25では、情報処理装置4は、S24の機械学習により生成した推定モデルを用いて被験者のストレス度を推定する。より詳細には、S25では、情報処理装置4は、被験者の所定期間における測定データから、上述のS23で選択された組み合わせに係る特徴量を算出し、算出した特徴量をS24の機械学習により生成した推定モデルに入力する。そして、情報処理装置4は、推定モデルの出力値に基づいて被験者の前記所定期間におけるストレス度を推定する。
【0042】
以上のように、情報処理装置4は、測定データから算出された複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する(S22a~S22c)。そして、情報処理装置4は、生成した特徴集合に含まれる特徴量の各組み合わせを推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、機械学習に用いる特徴量の組み合わせを選択する(S23)。
【0043】
これにより、1段階目の特徴量選択(S22a~S22c)において、一部のモダリティの特徴量が欠落するということがない。そして、2段階目の特徴量選択(S23)において、特徴量の好適な組み合わせを選択する。したがって、S24では、各モダリティの特徴量を説明変数とする推定モデルが生成される可能性が高い。これにより、S25では、頑健性の高い推定が可能となる。
【0044】
なお、S23の処理もモダリティごとに行ってもよい。これにより、各モダリティの特徴量を確実に残すことができる。また、情報処理装置4が行う各処理を複数の情報処理装置で分担して実行するようにしてもよい。例えば、情報処理装置4が特徴量を選択し、選択された特徴量を用いて他の情報処理装置が教師データを生成し、生成された教師データを用いてさらに他の情報処理装置が推定モデルを生成してもよい。そして、生成された推定モデルを用いてさらに他の情報処理装置が被験者のストレス度を推定してもよい。また、例えば、情報処理装置4が特徴量の選択から推定モデルの生成までを行い、生成された推定モデルを用いて他の情報処理装置が被験者のストレス度を推定してもよい。
【0045】
また、S24で生成された推定モデルの推定精度が所定の基準を満たしていなかった場合には、情報処理装置4は、特徴量を選択し直してもよい。この場合、情報処理装置4は、2回目以降のS22a~S22cの処理において、前回とは異なる評価手法で各特徴量を選択し、前回とは異なる特徴集合を生成する。その後は、前述のように当該特徴集合から特徴量を選択し、選択した特徴量を用いて機械学習を行い、推定モデルを生成する(S23~S24)。このような処理を繰り返すことにより、所定の基準を満たす推定モデルを生成することができる。なお、生成された推定モデルの推定精度の評価には、交差検証等の手法を適用することができる。
【0046】
(情報処理装置4の構成)
情報処理装置4の構成を
図4に基づいて説明する。
図4は、情報処理装置4の構成を示すブロック図である。また、
図4には、測定データを測定する装置の一例としてウェアラブル端末7についてもあわせて図示している。
【0047】
ウェアラブル端末7は、3軸の加速度センサを備えており、この加速度センサの出力値を測定データとして情報処理装置4に送信する。ウェアラブル端末7を被験者が装着することにより、被験者の体動が加速度センサにより検出される。体動が被験者のストレス度と相関があることは分かっているから、加速度センサの出力値を測定データとしてストレス度の推定を行うことができる。なお、加速度センサは3軸のものに限られず、1軸や2軸のものであってもよい。
【0048】
また、ウェアラブル端末7は、装着者の心拍数を検出する機能と、装着者の発汗を検出する機能も備えている。よって、ウェアラブル端末7を被験者が装着することにより、前記の加速度データに加えて、心拍データおよび発汗データが生成され、それらのデータは被験者のストレス度に関連する測定データとして情報処理装置4に送信される。なお、ここでは簡単のため、必要な測定データの全てをウェアラブル端末7が情報処理装置4に送信する例を説明するが、情報処理装置4は各測定データをそれぞれ別の機器から取得してもよい。
【0049】
情報処理装置4は、情報処理装置4の各部を統括して制御する制御部40と、情報処理装置4が使用する各種データを記憶する記憶部41を備えている。また、情報処理装置4は、情報処理装置4に対するデータの入力を受け付ける入力部42、情報処理装置4がデータを出力するための出力部43、および情報処理装置4が他の装置(例えばウェアラブル端末7)と通信するための通信部44を備えている。
【0050】
制御部40には、測定データ取得部401、アンケートデータ取得部402、ストレス度計算部403、特徴量計算部404、第1選択部405、第2選択部406、教師データ生成部407、学習処理部408、および推定部409が含まれている。また、記憶部41には、測定データ411、アンケートデータ412、ストレス度データ413、特徴量データ414、教師データ415、推定モデル416、および推定結果データ417が記憶される。
【0051】
測定データ取得部401は、被験者のストレス度に関連する測定データを取得し、取得した測定データを記憶部41に記憶させる。記憶部41に記憶された測定データが測定データ411である。測定データ411には、教師データ415の生成に用いられるものと、ストレス度の推定に用いられるものとが含まれ得る。
【0052】
アンケートデータ取得部402は、測定データ411(教師データ415の生成用のもの)が測定された期間における被験者のストレス度に関連するアンケートの結果を取得し、取得した結果を示すアンケートデータ412を記憶部41に記憶させる。このアンケートは、被験者のストレス度を算出するために、当該被験者に対して行ったアンケートである。このアンケートは、被験者のストレス度が反映されるような内容のものであればよく、例えばPSS(Perceived Stress Scale)のストレスアンケートであってもよい。PSSのストレスアンケートは、対象期間において、被験者がどのように感じ、どのようにふるまったかについての複数の質問のそれぞれに対し、複数の選択肢から該当するものを選択させる形式のアンケートである。
【0053】
ストレス度計算部403は、アンケートデータ412を用いて被験者のストレス度を算出し、算出したストレス度を示すストレス度データ413を記憶部41に記憶させる。ストレス度の算出方法としては任意のものを適用可能である。例えば、アンケートデータ412がPSSのストレスアンケートの結果を示すデータである場合、ストレス度計算部403はPSSスコアを算出する。
【0054】
特徴量計算部404は、測定データ411から特徴量を算出し、算出した特徴量を記憶部41に記憶させる。特徴量計算部404が記憶部41に記憶させた、特徴量を示すデータが特徴量データ414である。特徴量データ414には、教師データ415の生成に用いられる特徴量が含まれ得る。以下では、教師データ415の生成に用いられる特徴量を学習用特徴量と呼ぶ。
【0055】
学習用特徴量は、ストレス度の推定モデルの機械学習に用いられる特徴量である。ただし、生成された学習用特徴量の全てが機械学習に用いられるのではなく、生成された複数の学習用特徴量の中から、第1選択部405および第2選択部406により選択された特徴量が教師データ415の生成に用いられる。学習用特徴量には、その特徴量のモダリティを示す情報が対応付けられている。例えば、モダリティを示す情報は、その特徴量の元になった測定データの種類(例えば、体動データ、心拍データ、発汗データ等)を示すものであってもよいし、生理的、行動的、あるいは心理的といった分類を示すものであってもよい。
【0056】
また、特徴量データ414には、ストレス度の推定に用いられる特徴量も含まれ得る。以下では、ストレス度の推定に用いられる特徴量を推定用特徴量と呼ぶ。推定用特徴量は、ストレス度の推定の対象となる被検者の所定期間(ストレス度を測定する対象の期間)の測定データから生成された特徴量である。
【0057】
第1選択部405は、複数の学習用特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の学習用特徴量の中から、複数のモダリティのそれぞれに対応する学習用特徴量を少なくとも1つ選択する。これにより、複数のモダリティのそれぞれに対応する学習用特徴量を少なくとも1つ含む特徴集合が生成される。
図3のS22a~S22cは、第1選択部405が実行する処理である。第1選択部405は、例えばフィルタ法等により、学習用特徴量の1つ1つについて有用性を評価してもよいし、例えば主成分分析等により複数の学習用特徴量の組み合わせについて有用性を評価してもよい。なお、第1選択部405は、フィルタ法を用いる場合、学習用特徴量の選択の際に、相関係数や相互情報量等の特徴量間の類似度を反映した指標に基づいて、類似度が高い学習用特徴量を排除してもよい。類似度が高い学習用特徴量は学習の支障となるからである。また、同じく類似する特徴量を排除する目的で、第1選択部405は、主成分分析、独立成分分析、その他、これらと同様の効果を持つ手法を用いてもよい。
【0058】
第2選択部406は、第1選択部405が生成した特徴集合に含まれる学習用特徴量の各組み合わせを推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、機械学習に用いる学習用特徴量の組み合わせを選択する。
図3のS23は、第2選択部406が実行する処理である。
【0059】
教師データ生成部407は、第2選択部406により選択された学習用特徴量の組み合わせに対して、ストレス度データ413に示されるストレス度を正解データとして対応付けて教師データを生成する。そして、教師データ生成部407は、生成した教師データを教師データ415として記憶部41に記憶させる。
【0060】
学習処理部408は、教師データ415を用いた学習により、第2選択部406により選択された学習用特徴量を説明変数とし、ストレス度を目的変数とする推定モデルを生成する。
図3のS24は、学習処理部408が実行する処理である。そして、学習処理部408は、生成した推定モデルを推定モデル416として記憶部41に記憶させる。
【0061】
推定部409は、被験者の測定データから生成された推定用特徴量を用いて当該被験者のストレス度を推定する。より詳細には、推定部409は、特徴量データ414に含まれる推定用特徴量を推定モデル416に入力することにより、ストレス度の推定値を算出する。
図3のS25は、推定部409が実行する処理である。そして、推定部409は、ストレス度の推定結果を示す推定結果データ417を記憶部41に記憶させる。
【0062】
(推定モデル生成方法の流れ)
図5は、本発明の例示的実施形態2に係る推定モデル生成方法の流れを示すフロー図である。なお、以下では、ウェアラブル端末7で測定した、被験者の3軸加速度データと、心拍データと、発汗データとを測定データとして推定モデルを生成する例を説明する。使用する測定データは、一人の被検者の測定データであってもよいし、複数の被検者の測定データであってもよいが、ストレス度の推定対象の被験者とストレスに対する応答性が近い被験者の測定データであることが好ましい。また、各被験者について、測定データを測定した期間におけるストレス度を算出するためのアンケートを実施済みであり、その結果がアンケートデータ412として記憶部41に記憶されているとする。また、
図5における特徴量は何れも上述の学習用特徴量であるから、
図5の説明においては単に特徴量と呼ぶ。
【0063】
S31では、測定データ取得部401が、推定モデルの生成に用いる測定データを取得する。上述のように、ここで取得する測定データは、ウェアラブル端末7で測定した被験者の3軸加速度データと、心拍データと、発汗データである。そして、測定データ取得部401は、取得した測定データを測定データ411として記憶部41に記憶させる。
【0064】
S32では、特徴量計算部404が、S31で記録された測定データ411から特徴量を算出する。具体的には、特徴量計算部404は、3軸加速度データと、心拍データと、発汗データのそれぞれから複数種類の特徴量を算出する。算出された特徴量は、特徴量データ414として記憶部41に記憶される。
【0065】
S33では、第1選択部405が、S32で算出された複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する。例えば、第1選択部405は、3軸加速度データから生成された特徴量のそれぞれについてフィルタ法により有用性を評価して、その評価結果が上位の所定数の特徴量を選択してもよい。この場合、第1選択部405は、心拍データから生成された特徴量と、発汗データから生成された特徴量のそれぞれについても、3軸加速度データから生成された特徴量の場合と同様に、評価結果が上位の所定数の特徴量を選択する。これにより、3軸加速度データ、心拍データ、および発汗データのそれぞれから生成された特徴量をそれぞれ所定数含む特徴集合が生成される。
【0066】
S34では、第2選択部406が、S33で生成された特徴集合に含まれる特徴量の各組み合わせを推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、機械学習に用いる特徴量の組み合わせを選択する。例えば、第2選択部406は、ラッパー法により特徴量の組み合わせを選択してもよい。
【0067】
S35では、ストレス度計算部403が、アンケートデータ412を用いて被験者のストレス度を算出する。そして、ストレス度計算部403は、算出したストレス度をストレス度データ413として記憶部41に記憶させる。なお、S35の処理はS36より先に行えばよく、S31より先に行ってもよいし、S31~S34と同時並行で行ってもよい。
【0068】
S36では、教師データ生成部407が、S34で選択された特徴量の組み合わせに対し、ストレス度データ413に示される、S35で算出されたストレス度を正解データとして対応付けて教師データを生成する。そして、教師データ生成部407は、生成した教師データを教師データ415として記憶部41に記憶させる。
【0069】
S37では、学習処理部408が、S36で生成された教師データを用いた機械学習によりストレス度の推定モデルを生成する。なお、S37には、複数の推定モデルを生成し、生成した各推定モデルの推定精度を評価し、その評価結果に基づいて最終的な推定モデルを選択する、という一連の処理が含まれていてもよい。そして、学習処理部408は、生成した推定モデルを推定モデル416として記憶部41に記憶させる。これにより、推定モデル生成方法は終了する。
【0070】
なお、以上の処理のうち、S33~S34が特徴量選択方法であり、S36が教師データ生成方法であり、S37が推定モデル生成方法である。これらの処理はプログラムにより実現することもできる。つまり、S33~S34の処理をコンピュータに実行させる特徴量選択プログラムも本例示的実施形態の範疇に含まれる。同様に、S34で選択された特徴量を用いて教師データを生成する処理(S36)をコンピュータに実行させる教師データ生成プログラムも本例示的実施形態の範疇に含まれる。そして、S36で生成された教師データを用いて推定モデルを生成する処理(S37)をコンピュータに実行させる推定モデル生成プログラムも本例示的実施形態の範疇に含まれる。
【0071】
(ストレス度の推定方法)
図6は、本発明の例示的実施形態2に係る、ストレス度の推定方法の流れを示すフロー図である。なお、以下では、ウェアラブル端末7で測定した1カ月分の3軸加速度データと心拍データと発汗データを測定データとして当該1カ月における被験者のストレス度を推定する例を説明するが、測定期間は1カ月未満であってもよいし、1カ月より長くてもよい。また、
図6に記載の「特徴量」は、何れも上述の推定用特徴量であるから、
図6の説明においては単に特徴量と呼ぶ。
【0072】
S41では、測定データ取得部401が測定データを取得する。上述のように、ここで取得する測定データは、ウェアラブル端末7で測定した被験者の1カ月分の3軸加速度データと心拍データと発汗データである。そして、測定データ取得部401は、取得した測定データを測定データ411として記憶部41に記憶させる。
【0073】
S42では、特徴量計算部404が測定データ411から特徴量を算出する。ここで算出される特徴量は、
図5のS34で選択されたものであり、特徴量データ414として記憶部41に記憶される。
【0074】
S43では、推定部409が被験者のストレス度を推定する。具体的には、推定部409は、特徴量データ414に示される、S42で算出された特徴量を、推定モデル416に入力する。この推定モデル416は、
図5のS37で生成されたものである。そして、推定部409は、推定モデル416の出力値を推定結果データ417として記憶部41に記憶させる。なお、推定部409は、推定したストレス度を出力部43に出力させてもよい。これにより、ストレス度の推定方法は終了する。
【0075】
なお、以上の処理はプログラムにより実現することもできる。つまり、上述したS41~S43の処理をコンピュータに実行させるストレス度の推定プログラムも本例示的実施形態の範疇に含まれる。
【0076】
以上のように、本例示的実施形態に係る情報処理装置4においては、第1選択部405が、有用性の評価と当該評価の結果に基づく特徴量の選択とをモダリティ毎に行うことにより特徴集合を生成する構成が採用されている。これにより、各モダリティの特徴量を少なくとも1つ含む特徴集合を生成することができる。
【0077】
また、本例示的実施形態に係る情報処理装置4においては、複数の前記モダリティには、被験者のストレス状態が反映された行動に関する測定データを用いて生成された特徴量が分類される行動的モダリティと、前記被験者のストレス状態が反映された生理現象に関する測定データを用いて生成された特徴量が分類される生理的モダリティとが含まれる、という構成が採用されている。
【0078】
前記の構成によれば、被験者の行動に関する特徴量と生理現象に関する特徴量の両方を含む教師データが生成されやすくなり、このような教師データを用いることにより、被験者の行動と生理現象の両方を考慮したストレス度の推定が可能になる。よって、本例示的実施形態に係る情報処理装置4によれば、例示的実施形態1に係る情報処理装置1の奏する効果に加えて、被験者の行動と生理現象の両方を考慮してストレス度を推定することが可能になるという効果が得られる。
【0079】
また、本例示的実施形態に係る教師データ生成方法は、
図5のS33~S34に示される特徴量選択方法により選択された特徴量の組み合わせに対し、正解データとして被験者のストレス度を対応付けて、機械学習に用いる教師データを生成することを含む(S36)。このため、本例示的実施形態に係る教師データ生成方法によれば、頑健性の高い推定モデルを生成することができる教師データを生成することができるという効果が得られる。なお、この教師データ生成方法の実行主体は、情報処理装置4が備えるプロセッサであってもよいし、他の装置が備えるプロセッサであってもよい。これは、以下で述べる推定モデル生成方法およびストレス度の推定方法についても同様である。
【0080】
本例示的実施形態に係る推定モデル生成方法は、前記教師データ生成方法により生成された教師データを用いた機械学習により推定モデルを生成することを含む。このため、本例示的実施形態に係る推定モデル生成方法によれば、頑健性の高い推定モデルを生成することができるという効果が得られる。
【0081】
また、本例示的実施形態に係るストレス度の推定方法は、前記推定モデル生成方法により生成された推定モデルを用いて被験者のストレス度を推定することを含む。このため、本例示的実施形態に係ストレス度の推定方法によれば、安定して高精度な推定を行うことができるという効果が得られる。
【0082】
〔例示的実施形態3〕
本発明の第3の例示的実施形態について、図面を参照して詳細に説明する。
図7は、本例示的実施形態に係る、特徴量選択方法、教師データ生成方法、推定モデル生成方法、およびストレス度の推定方法の概要を示す図である。例示的実施形態2との相違点は、1段階目の特徴量選択において、特徴量をモダリティで分類せずに一括して評価を行った後で、モダリティごとに高評価の特徴量を選択する点である。以下では、これらの各方法を、
図4に示した情報処理装置4に実行させる例を説明する。
【0083】
S51では、
図3のS21と同様に、特徴量計算部404が、被験者のストレスの度合いを示すストレス度に関連する測定データから特徴量を算出する。ここで算出される特徴量には、例示的実施形態2と同様に、複数のモダリティの特徴量が含まれている。
【0084】
S52では、第1選択部405が、S51で算出された複数の特徴量のそれぞれについて有用性を評価する。そして、S53では、第1選択部405は、S52の評価結果に基づいて、S51で算出された複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する。
【0085】
例えば、第1選択部405は、複数のモダリティのそれぞれについて、評価結果が上位の所定数の特徴量を選択してもよい。なお、各モダリティについて選択する特徴量の数は固定としてもよいし、評価結果に応じて変更してもよい。例えば、各モダリティについて選択すべき特徴量の下限数のみ定めておいてもよい。この場合、第1選択部405は、各モダリティについて下限数の特徴量を選択した後は、モダリティに関係なく、評価結果が上位の特徴量を選択すればよい。これにより、各モダリティの特徴量を残しつつ、より有用性の高い特徴量を選択することができる。
【0086】
以上のように、本例示的実施形態におけるS52~S53の処理(すなわち特徴量選択方法)によっても、例示的実施形態2と同様に、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ含む特徴集合を生成することができる。S54~S56の処理は、
図3のS23~S25の処理とそれぞれ同様であるから、ここでは説明を繰り返さない。なお、
図7のS55が教師データ生成方法と推定モデル生成方法に相当し、S56がストレス度の推定方法に相当する。
【0087】
〔効果の検証〕
本発明の例示的実施形態に係る特徴量選択方法の効果を検証するための実験を行った。その結果を
図8に示す。
図8は、本発明の各例示的実施形態に係る特徴量選択方法の効果検証実験の結果を示す図である。
【0088】
この実験では、被験者の脈波データから生成した936個の脈波特徴量と、被験者の3軸加速度データから生成した1356個の加速度特徴量からなる合計2292個の特徴量(学習用特徴量)を対象として、LOOCV(leave-one-out cross-validation:一個抜き交差検証)を行った。
【0089】
各ループでは、トレーニングデータから特徴量選択を行って推定モデルを生成し、生成した推定モデルの推定精度をテストデータで検証した。推定精度の検証は、誤差(Mean Absolute Error)と相関係数により行った。誤差が低いほど推定精度が高いといえる。また、相関係数が高いほど推定精度が高いといえる。
【0090】
正解データとなるストレススコアとしては、PSS10(Perceived Stress Scale 10項目版)のアンケート結果を用いた。この場合、スコアレンジは0から40までである。そのため、例えば、誤差が4であれば、全スコアレンジに対する割合は10%となる。
【0091】
特徴量選択方法は、比較例1(ラッパー法)、比較例2(フィルタ法)、比較例3(フィルタ法とラッパー法の組み合わせ)、および実施例(フィルタ法とラッパー法の組み合わせ)の4通りとした。比較例3におけるフィルタ法ではモダリティを考慮せずに40個の特徴量を選択し、その40個の特徴量を対象としてラッパー法を適用し、最適な特徴量の組み合わせを選択した。これに対し、実施例のフィルタ法では各モダリティ(脈波特徴量と加速度特徴量)につき20個(計40個)の特徴量を選択し、その40個の特徴量を対象としてラッパー法を適用し、最適な特徴量の組み合わせを選択した。
【0092】
各特徴量選択方法にて、最適条件を探るため、正則化パラメータを0.1から1.0まで0.1刻みで変え、また特徴量選択数は5から20まで5刻みで変えて実験を行い、各特徴量選択方法において、最もよい結果が出た場合を比較した。
【0093】
図8に示すように、モダリティごとに所定数の特徴量を選択した実施例が、誤差と相関係数の何れについても最も精度が高いという結果となった。この実験結果は、本発明の各例示的実施形態に係る特徴量選択方法により選択した特徴量を用いて生成された推定モデルを用いることにより、ストレス度を高精度に推定することができることを示している。
【0094】
〔ソフトウェアによる実現例〕
情報処理装置1、4の一部または全部の機能は、集積回路(ICチップ)等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。
【0095】
後者の場合、情報処理装置1、4は、例えば、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータによって実現される。このようなコンピュータの一例(以下、コンピュータCと記載する)を
図9に示す。コンピュータCは、少なくとも1つのプロセッサC1と、少なくとも1つのメモリC2と、を備えている。メモリC2には、コンピュータCを情報処理装置1、4として動作させるためのプログラムPが記録されている。コンピュータCにおいて、プロセッサC1は、プログラムPをメモリC2から読み取って実行することにより、情報処理装置1、4の各機能が実現される。
【0096】
プロセッサC1としては、例えば、CPU(Central Processing Unit)、GPU(Graphic Processing Unit)、DSP(Digital Signal Processor)、MPU(Micro Processing Unit)、FPU(Floating point number Processing Unit)、PPU(Physics Processing Unit)、マイクロコントローラ、または、これらの組み合わせなどを用いることができる。メモリC2としては、例えば、フラッシュメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)、または、これらの組み合わせなどを用いることができる。
【0097】
なお、コンピュータCは、プログラムPを実行時に展開したり、各種データを一時的に記憶したりするためのRAM(Random Access Memory)を更に備えていてもよい。また、コンピュータCは、他の装置との間でデータを送受信するための通信インタフェースを更に備えていてもよい。また、コンピュータCは、キーボードやマウス、ディスプレイやプリンタなどの入出力機器を接続するための入出力インタフェースを更に備えていてもよい。
【0098】
また、プログラムPは、コンピュータCが読み取り可能な、一時的でない有形の記録媒体Mに記録することができる。このような記録媒体Mとしては、例えば、テープ、ディスク、カード、半導体メモリ、またはプログラマブルな論理回路などを用いることができる。コンピュータCは、このような記録媒体Mを介してプログラムPを取得することができる。また、プログラムPは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、または放送波などを用いることができる。コンピュータCは、このような伝送媒体を介してプログラムPを取得することもできる。
【0099】
〔付記事項1〕
本発明は、上述した実施形態に限定されるものでなく、請求項に示した範囲で種々の変更が可能である。例えば、上述した実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。
【0100】
〔付記事項2〕
上述した実施形態の一部または全部は、以下のようにも記載され得る。ただし、本発明は、以下の記載する態様に限定されるものではない。
【0101】
態様1に係る情報処理装置は、ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する第1選択手段と、前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択する第2選択手段と、を備えている。この構成によれば、ストレス度の推定モデルの機械学習のための特徴量選択方法を改善することができる。
【0102】
態様2に係る情報処理装置においては、態様1の構成に加えて、前記第1選択手段は、有用性の評価と当該評価の結果に基づく特徴量の選択とを前記モダリティ毎に行うことにより前記特徴集合を生成するという構成が採用されている。この構成によれば、各モダリティの特徴量を少なくとも1つ含む特徴集合を生成することができる。
【0103】
態様3に係る情報処理装置においては、態様1または2の構成に加えて、複数の前記モダリティには、被験者のストレス状態が反映された行動に関する測定データを用いて生成された特徴量が分類される行動的モダリティと、前記被験者のストレス状態が反映された生理現象に関する測定データを用いて生成された特徴量が分類される生理的モダリティとが含まれるという構成が採用されている。この構成によれば、被験者の行動と生理現象の両方を考慮してストレス度を推定することが可能になる。
【0104】
態様4に係る特徴量選択方法は、少なくとも1つのプロセッサが、ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成することと、前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択することと、を含む。この構成によれば、ストレス度の推定モデルの機械学習のための特徴量選択方法を改善することができる。
【0105】
態様5に係る教師データ生成方法は、少なくとも1つのプロセッサが、態様4に記載の特徴選択方法により選択された特徴量の組み合わせに対し、正解データとして被験者のストレス度を対応付けて、前記機械学習に用いる教師データを生成することを含む。この構成によれば、頑健性の高い推定モデルを生成することができる教師データを生成することができる。
【0106】
態様6に係る推定モデル生成方法は、少なくとも1つのプロセッサが、態様5に記載の教師データ生成方法により生成された前記教師データを用いた機械学習により前記推定モデルを生成することを含む。この構成によれば、頑健性の高い推定モデルを生成することができる。
【0107】
態様7に係るストレス度の推定方法は、少なくとも1つのプロセッサが、態様6に記載の推定モデル生成方法により生成された前記推定モデルを用いて被験者のストレス度を推定することを含む。この構成によれば、安定して高精度な推定を行うことができる。
【0108】
態様8に係る特徴量選択プログラムは、コンピュータを、ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する第1選択手段、および前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択する第2選択手段、として機能させる。この構成によれば、ストレス度の推定モデルの機械学習のための特徴量選択方法を改善することができる。
【0109】
〔付記事項3〕
上述した実施形態の一部または全部は、さらに、以下のように表現することもできる。少なくとも1つのプロセッサを備え、前記プロセッサは、ストレス度の推定モデルの機械学習に用いることができる複数の特徴量のそれぞれについての有用性の評価結果に基づいて、当該複数の特徴量の中から、複数のモダリティのそれぞれに対応する特徴量を少なくとも1つ選択して特徴集合を生成する処理と、前記特徴集合に含まれる特徴量の各組み合わせを前記推定モデルの機械学習に適用して推定精度を検証した結果に基づいて、前記機械学習に用いる特徴量の組み合わせを選択する処理とを実行する情報処理装置。
【0110】
なお、この情報処理装置は、更にメモリを備えていてもよく、このメモリには、特徴集合を生成する前記処理と、機械学習に用いる特徴量の組み合わせを選択する前記処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。
【符号の説明】
【0111】
1 情報処理装置
11 第1選択部
12 第2選択部
4 情報処理装置
405 第1選択部
406 第2選択部