IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人九州工業大学の特許一覧

特許7239991ラベル付与装置、ラベル付与方法、及びプログラム
<>
  • 特許-ラベル付与装置、ラベル付与方法、及びプログラム 図1
  • 特許-ラベル付与装置、ラベル付与方法、及びプログラム 図2
  • 特許-ラベル付与装置、ラベル付与方法、及びプログラム 図3
  • 特許-ラベル付与装置、ラベル付与方法、及びプログラム 図4
  • 特許-ラベル付与装置、ラベル付与方法、及びプログラム 図5
  • 特許-ラベル付与装置、ラベル付与方法、及びプログラム 図6
  • 特許-ラベル付与装置、ラベル付与方法、及びプログラム 図7
  • 特許-ラベル付与装置、ラベル付与方法、及びプログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-07
(45)【発行日】2023-03-15
(54)【発明の名称】ラベル付与装置、ラベル付与方法、及びプログラム
(51)【国際特許分類】
   G06F 16/30 20190101AFI20230308BHJP
【FI】
G06F16/30
【請求項の数】 7
(21)【出願番号】P 2019563982
(86)(22)【出願日】2018-12-28
(86)【国際出願番号】 JP2018048551
(87)【国際公開番号】W WO2019135403
(87)【国際公開日】2019-07-11
【審査請求日】2021-10-19
(31)【優先権主張番号】P 2018000806
(32)【優先日】2018-01-05
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】504174135
【氏名又は名称】国立大学法人九州工業大学
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100188592
【弁理士】
【氏名又は名称】山口 洋
(74)【代理人】
【識別番号】100189348
【弁理士】
【氏名又は名称】古都 智
(72)【発明者】
【氏名】井上 創造
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】特開2013-254372(JP,A)
【文献】特開2013-246683(JP,A)
【文献】特開平10-275154(JP,A)
【文献】米国特許出願公開第2015/0318015(US,A1)
【文献】亀井 剛次 外5名,センサデータ解釈のための拡張可能な知識構築手法,情報処理学会研究報告,社団法人情報処理学会,2008年05月08日,第2008巻,第40号,p.47-54
【文献】村上 知子、外3名,トピックモデルによるセンサ情報からの看護業務の推定,一般社団法人人工知能学会 研究会 DOCMAS:データ指向構成マイニングとシミュレーション研究会 S,日本,一般社団法人人工知能学会,2017年10月18日
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 40/00-40/58
(57)【特許請求の範囲】
【請求項1】
センサが検出したデータから行動の時系列を推定するための機械学習の学習に用いられる教師データのラベル付与装置であって、
前記行動が自然言語テキスト形式で記録されたテキストデータに含まれる前記行動を示す行動キーワードを教師ラベルの候補である教師ラベル候補として抽出するキーワード抽出部と、
前記キーワード抽出部が抽出した前記教師ラベル候補の中から、前記行動が行われた時刻の候補を示す時刻情報に対応する前記教師ラベルを選択する選択部と、
を備えるラベル付与装置。
【請求項2】
前記キーワード抽出部は、前記テキストデータから前記時刻情報を抽出する
請求項1に記載のラベル付与装置。
【請求項3】
前記キーワード抽出部は、抽出した前記教師ラベル候補において、1つの前記行動に対して複数の前記教師ラベル候補があるときは、複数の前記教師ラベル候補よりも少ない個数の前記教師ラベル候補を抽出する
請求項1または請求項2に記載のラベル付与装置。
【請求項4】
前記キーワード抽出部は、形態素解析、係り受け解析、及び格フレーム解析のいずれかの手法を使って前記教師ラベル候補を抽出する
請求項3に記載のラベル付与装置。
【請求項5】
前記選択部は、前記キーワード抽出部が抽出した前記教師ラベル候補の中から前記教師ラベルを、教師あり学習を用いて選択する
請求項1から請求項4のいずれか一項に記載のラベル付与装置。
【請求項6】
センサが検出したデータから行動の時系列を推定するための機械学習の学習に用いられる教師データのラベル付与方法であって、
前記行動が自然言語テキスト形式で記録されたテキストデータに含まれる前記行動を示す行動キーワードを教師ラベルの候補である教師ラベル候補として抽出するキーワード抽出過程と、
前記キーワード抽出過程において抽出された前記教師ラベル候補の中から、前記行動が行われた時刻の候補を示す時刻情報に対応する前記教師ラベルを選択する選択過程と、
コンピュータが実行するラベル付与方法。
【請求項7】
センサが検出したデータから行動の時系列を推定するための機械学習の学習に用いられる教師データのラベル付与を行うコンピュータに、
前記行動が自然言語テキスト形式で記録されたテキストデータに含まれる前記行動を示す行動キーワードを教師ラベルの候補である教師ラベル候補として抽出するキーワード抽出ステップと、
前記キーワード抽出ステップにおいて抽出された前記教師ラベル候補の中から、前記行動が行われた時刻の候補を示す時刻情報に対応する前記教師ラベルを選択する選択ステップと、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ラベル付与装置、ラベル付与方法、及びプログラムに関する。
本願は、2018年1月5日に、日本に出願された特願2018-000806号に基づき優先権を主張し、その内容をここに援用する。
【背景技術】
【0002】
人間が身につけたセンサから取得されたデータ、あるいは環境を測定するセンサから取得されたセンサデータから、人間の行動を推定する行動認識の技術が知られている。行動認識の技術では、人間の行動を推定することにより、業務の自動記録や可視化、行動を振り返ることによる業務改善が可能となる。また、センサなどから取得されたデータと、業績等の他のデータとを組み合わせて業務改善に役立たせることが考えられる。
センサを始めとする時系列データを用いる行動認識には、機械学習の一分野である教師あり学習が使われる。教師あり学習では、教師データを用いて学習モデルを生成する。教師データとは、実際の行動を示す情報である教師ラベルと、センサから取得されたデータから抽出される特徴量とを組み合わせたデータである。教師あり学習では、生成された学習モデルに基づいて、センサから取得されたデータから抽出される特徴量から行動を示す教師ラベルを推定する。
【0003】
このような教師あり学習を用いて人間の行動を推定する技術として、例えば、位置センサやモーションセンサから取得した情報に基づいた行動パターン認識結果と、位置センサやモーションセンサから取得した情報以外の情報とを組み合わせ、情報を提供する情報処理装置が知られている(特許文献1)。特許文献1に記載の情報処理装置では、テキスト情報と、テキスト情報が入力された時刻情報とを取得し、取得したテキストを解析し、ユーザの体験に関する情報をテキスト情報から抽出する。特許文献1に記載の情報処理装置では、ユーザの体験に関する情報を得る場合、テキスト情報から種類特徴量を抽出し、抽出された種類特徴量に基づいて、学習モデルを利用して、入力された種類特徴量から体験の種類を判別する。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2013-250861号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の情報処理装置のような技術においては、機械学習アルゴリズムを用いているため、学習モデルを生成するために教師データを作成する必要がある。教師データを作成するには、センサから取得されたデータから特徴量を抽出し、抽出した特徴量に対応する教師ラベルを付与しなければならない。教師ラベルの付与(アノテーション)は人間が行うため、特徴量に対応する教師ラベルの選択に手間と時間がかかり負担が大きい。このため、教師データの十分な収集ができず、精度の高い行動認識を実施するのが困難であった。
【0006】
本発明は上記の点に鑑みてなされたものであり、機械学習の学習に用いられる教師データの教師ラベルの付与を簡便に行うことができるラベル付与装置、ラベル付与方法、及びプログラムを提供する。
【課題を解決するための手段】
【0007】
本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、センサが検出したデータから行動の時系列を推定するための機械学習の学習に用いられる教師データ(TD)のラベル付与装置(1)であって、前記行動が自然言語テキスト形式で記録されたテキストデータ(TX)に含まれる前記行動を示す行動キーワード(KA)を教師ラベルの候補である教師ラベル候補(LC)として抽出するキーワード抽出部(10)と、前記キーワード抽出部(10)が抽出した前記教師ラベル候補(LC)の中から、前記行動が行われた時刻の候補を示す時刻情報(TI)に対応する前記教師ラベル(LL)を選択する選択部(14)と、を備えるラベル付与装置である。
【0008】
また、本発明の一態様は、上記のラベル付与装置において、前記キーワード抽出部は、前記テキストデータから前記時刻情報を抽出する。
【0009】
また、本発明の一態様は、上記のラベル付与装置において、前記キーワード抽出部は、抽出した前記教師ラベル候補において、1つの前記行動に対して複数の前記教師ラベル候補があるときは、複数の前記教師ラベル候補よりも少ない個数の前記教師ラベル候補を抽出する。
【0010】
また、本発明の一態様は、上記のラベル付与装置において、前記キーワード抽出部は、形態素解析、係り受け解析、及び格フレーム解析のいずれかの手法を使って前記教師ラベル候補を抽出する。
【0011】
また、本発明の一態様は、上記のラベル付与装置において、前記選択部は、前記キーワード抽出部が抽出した前記教師ラベル候補の中から前記教師ラベルを、教師あり学習を用いて選択する。
【0012】
また、本発明の一態様は、センサが検出したデータから行動の時系列を推定するための機械学習の学習に用いられる教師データのラベル付与方法であって、前記行動が自然言語テキスト形式で記録されたテキストデータに含まれる前記行動を示す行動キーワードを教師ラベルの候補である教師ラベル候補として抽出するキーワード抽出過程と、前記キーワード抽出過程において抽出された前記教師ラベル候補の中から、前記行動が行われた時刻の候補を示す時刻情報に対応する前記教師ラベルを選択する選択過程と、をコンピュータが実行するラベル付与方法である。
【0013】
また、本発明の一態様は、コンピュータに、センサが検出したデータから行動の時系列を推定するための機械学習の学習に用いられる教師データのラベル付与を行うコンピュータに、前記行動が自然言語テキスト形式で記録されたテキストデータに含まれる前記行動を示す行動キーワードを教師ラベルの候補である教師ラベル候補として抽出するキーワード抽出ステップと、前記キーワード抽出ステップにおいて抽出された前記教師ラベル候補の中から、前記行動が行われた時刻の候補を示す時刻情報に対応する前記教師ラベルを選択する選択ステップと、を実行させるプログラムである。
【発明の効果】
【0014】
本発明によれば、機械学習の学習に用いられる教師データの教師ラベルの付与を簡便に行うことができる。
【図面の簡単な説明】
【0015】
図1】本発明の実施形態に係るラベル付与装置を用いた機械学習による行動認識の概要を示す図である。
図2】本発明の実施形態に係るラベル付与装置の構成の一例を示す図である。
図3】本発明の実施形態に係るラベル付与装置の学習処理の一例を示す図である
図4】本発明の実施形態に係るラベル付与装置の教師データの生成処理の一例を示す図である。
図5】本発明の実施形態に係るテキストデータの一例を示す図である。
図6】本発明の実施形態に係るセグメントの一例を示す図である。
図7】本発明の実施形態に係る選択部の教師ラベル候補の選択処理の概要の一例を示す図である。
図8】本発明の実施形態に係る行動推定装置の推定処理の一例を示す図である。
【発明を実施するための形態】
【0016】
(実施形態)
以下、図面を参照しながら本発明の実施形態について詳しく説明する。図1は、本実施形態に係るラベル付与装置1を用いた機械学習による行動認識の概要を示す図である。この機械学習による行動認識では、被験者の行動の時系列を推定する。ラベル付与装置1を用いた機械学習による行動認識には、学習フェーズと、推定フェーズとがある。
【0017】
学習フェーズでは、教師データTDが生成され、生成された教師データTDを用いた機械学習により学習モデルLMが生成される。本実施形態のラベル付与装置1は、この教師データTDを生成する。
【0018】
教師データTDは、センサデータSD1から抽出される特徴量ベクトルFVと、教師ラベルLLとの組である。ここで教師ラベルLLとは、被験者の行動を示すキーワードである。教師ラベルLLは、例えば、[食べた]、「トイレ」、「薬を飲んだ」、「錠剤を服用した」、「服用」、「散歩」、「走った」などの被験者の行動を示すキーワードである。センサデータSD1とは、被験者の動作や姿勢を測定するセンサが測定した値を、値が測定された時間の順に並べた時系列データである。
【0019】
センサとは、例えば、被験者の生体情報を取得するセンサや、被験者の体動を検知する加速度計などである。センサが測定した値とは、被験者の心拍数や、センサが取りつけられた身体の部位の加速度である。このセンサは、被験者の身体に設けられてもよいし、被験者の周囲に設置されてもよい。被験者の周囲に設置される場合、センサは、被験者の周囲に設置されたカメラが被験者を撮像した画像を画像解析することにより、被験者の動作や姿勢を測定してもよい。センサは、環境センサであってもよい。センサが環境センサである場合、被験者の周囲の明るさ、室温、気温、及び湿度などの環境データを測定してもよい。また、センサは、人感センサであってもよい。ただし、センサが被験者の周囲に設置される場合、センサは、測定するデータが被験者についてのデータであることを識別できる。例えば、センサは、被験者の動作や姿勢と被験者以外の人物の動作や姿勢とを区別できる。また、センサは、環境データを被験者の住居の環境データと、他の場所の環境データとを区別できる。
【0020】
教師ラベルLLは、自然言語テキスト形式を用いて被験者の行動が記録されたテキストデータTXから、自然言語処理により行動キーワードKAが、教師ラベル候補LCとして抽出され、抽出された教師ラベル候補LCから生成される。ここで行動キーワードKAとは、被験者の行動を示すキーワードである。教師ラベル候補LCとは、教師ラベルLLの候補である。つまり、被験者の行動を示すキーワードが、教師ラベルLLの候補として抽出される。テキストデータTXは、例えば、介護施設において被験者の介護の様子が記録された業務日誌として記述されたデータである。
【0021】
被験者の行動が記録されたテキストデータTXからは、教師ラベル候補LCとともに、被験者の行動が行われた時刻の候補を示す時刻情報TIが抽出される。ここで時刻情報TIには、開始時刻の候補を示す開始時刻情報BT、及び終了時刻の候補を示す終了時刻情報ETがある。教師ラベル候補LCと、被験者の行動の開始時刻情報BT及び終了時刻情報ETとからラベルセグメントLSが生成される。ここでラベルセグメントLSとは、教師ラベル候補LCと、開始時刻情報BT及び終了時刻情報ETとの組である。以下では、開始時刻情報BTが示す被験者の行動の開始時刻の候補から、終了時刻情報ETが示す被験者の行動の終了時刻の候補までの時間区間を、ラベルセグメントLSの時間区間INと呼ぶ。また、ラベルセグメントLSに含まれる開始時刻情報BTが示す行動の開始時刻を、ラベルセグメントLSの開始時刻などと呼ぶことがある。ラベルセグメントLSに含まれる終了時刻情報ETが示す行動の終了時刻を、ラベルセグメントLSの開始時刻などと呼ぶことがある。
【0022】
特徴量ベクトルFVとは、センサデータSD1から抽出される1以上の特徴量を並べたベクトルである。センサデータSD1の特徴量とは、ある時間間隔におけるデータの値の平均、標準偏差、最大値、最小値、増加率、及び1次微分の平均値などである。以下、時間間隔を、時間窓TWと呼ぶ。抽出された1以上の特徴量は、時間窓TWの中央値によって示される時刻における特徴量ベクトルFVを構成する。
時間窓TWのサイズは、秒数などに基づいて予め決められてもよいし、特徴量を抽出するのに適したサイズとして決められてもよい。時間窓TW同士の間隔は、秒数などを用いて予め決められてもよいし、特徴量を抽出するのに適した間隔として決められてもよい。
【0023】
図1に示す例においては、時間窓TW1における1以上の特徴量が、時間窓TW1の中央値によって示される時刻における特徴量ベクトルFV1として抽出されている。時間窓TW2における1以上の特徴量が、時間窓TW2の中央値によって示される時刻における特徴量ベクトルFV2として抽出されている。時間窓TW3における1以上の特徴量が、時間窓TW3の中央値によって示される時刻における特徴量ベクトルFV3として抽出されている。ただし、図1に示す例においては、時間窓TW1~時間窓TW3のみが図示されているが、時間窓TW1~時間窓TW3以外の時間窓に対応する特徴量ベクトルも抽出されている。
【0024】
図1に示す例では、センサデータSD1が示す時間に対応する被験者の行動が記録されたテキストデータTXから1以上のラベルセグメントLS1、ラベルセグメントLS2、…が生成されている。ただし、図1に示す例においては、ラベルセグメントLS1、ラベルセグメントLS2のみが図示されているが、ラベルセグメントLS1、ラベルセグメントLS2以外のラベルセグメントLSi(i=3、4、…)も生成されている。
【0025】
抽出された特徴量ベクトルFV1、特徴量ベクトルFV2、特徴量ベクトルFV3、…と、生成されたラベルセグメントLS1、ラベルセグメントLS2、…とから、教師あり学習を用いて、サンプルSM1、サンプルSM2、サンプルSM3、…が生成される。ここでサンプルとは、ある時刻における特徴量ベクトルFVと、この時刻における教師ラベルLLとの組である。例えば、サンプルSM1は、特徴量ベクトルFV1と教師ラベルLL1との組である。
【0026】
ここで、特徴量ベクトルFV1、特徴量ベクトルFV2、特徴量ベクトルFV3、…の数と、ラベルセグメントLS1、ラベルセグメントLS2、…の数とは一般に異なる。また、特徴量ベクトルFV1、特徴量ベクトルFV2、特徴量ベクトルFV3、…の各々に対応する時刻と、ラベルセグメントLS1の時間区間IN1、ラベルセグメントLS2の時間区間IN2、…とは対応しているとは限らない。特徴量ベクトルFV1、特徴量ベクトルFV2、特徴量ベクトルFV3、…と、ラベルセグメントLS1、ラベルセグメントLS2、…とから、教師あり学習により、特徴量ベクトルFV1、特徴量ベクトルFV2、特徴量ベクトルFV3、…の各々に対応する教師ラベルLL1、教師ラベルLL2、教師ラベルLL3、…が判定される。この教師あり学習の詳細については後述する。
【0027】
生成されたサンプルSM1、サンプルSM2、サンプルSM3、…は教師データTDとなる。教師データTDを用いた機械学習により学習モデルLMが生成される。学習モデルLMは、センサデータSD1から抽出されるある特徴量ベクトルFVjが入力されると、センサデータSD1が示す被験者の行動を示すキーワードを出力する関数である。
【0028】
推定フェーズでは、学習フェーズにおいて学習された学習モデルLMを用いて、センサデータSD2から被験者の行動が推定される。推定フェーズにおいては、学習フェーズと異なり、センサデータSD2が示す時間に対応する被験者の行動が記録されたテキストデータTXが用いられずに、学習モデルLMに基づいてセンサデータSD2から推定ラベルELが推定される。推定ラベルELとは、センサデータSD2が示す時間に対応する被験者の行動を示すキーワードである。
【0029】
センサデータSD2から、時間窓ETW1に対応する特徴量ベクトルEFV1が生成される。センサデータSD2から、時間窓ETW2に対応する特徴量ベクトルEFV2が生成される。センサデータSD2から、時間窓ETW3に対応する特徴量ベクトルEFV3が生成される。特徴量ベクトルEFV1、特徴量ベクトルEFV2、特徴量ベクトルEFV3、…から、学習モデルLMに基づいて推定ラベルEL1、推定ラベルEL2、推定ラベルEL3、…がそれぞれ推定される。
【0030】
(ラベル付与装置の構成)
次に図2を参照しラベル付与装置1の構成について説明する。図2は、本実施形態に係るラベル付与装置1の構成の一例を示す図である。
ラベル付与装置1は、センサデータSD1から抽出される特徴量ベクトルFVに教師ラベルLLを付与する。ラベル付与装置1は、特徴量ベクトルFVに教師ラベルLLを付与することにより教師データTDを生成する。ここでラベル付与装置1は、テキストデータ供給部2が供給するテキストデータTXと、第1センサデータ供給部3が供給するセンサデータSD1とから教師データTDを生成する。ラベル付与装置1は、生成した教師データTDを行動推定装置4に供給する。
ラベル付与装置1は、キーワード抽出部10と、前処理部11と、時間窓切り出し部12と、特徴量計算部13と、選択部14と、教師データ生成部15とを備える。
【0031】
キーワード抽出部10は、テキストデータ供給部2が供給するテキストデータTXを取得する。キーワード抽出部10は、取得したテキストデータTXから、行動キーワードKAを選択する。キーワード抽出部10は、選択した行動キーワードKAを教師ラベル候補LCとして抽出する。つまり、キーワード抽出部10は、被験者の行動が自然言語テキスト形式で記録されたテキストデータTXに含まれる被験者の行動を示すキーワード(行動キーワードKA)を教師ラベルの候補(教師ラベル候補LC)として抽出する。
【0032】
キーワード抽出部10は、抽出した教師ラベル候補LCにおいて、1つの行動に対して複数の教師ラベル候補LC1、教師ラベル候補LC2、…があるときは、複数の教師ラベル候補LC1、教師ラベル候補LC2、…よりも少ない個数の教師ラベル候補LCを抽出する。
【0033】
キーワード抽出部10は、例えば、抽出した教師ラベル候補LC1、教師ラベル候補LC2、…において、1つの行動に対して似た意味や関連をもつ教師ラベル候補LCi、教師ラベル候補LCj、教師ラベル候補LCkがあるときは、選択した行動キーワードKA1、行動キーワードKA2、…のうち、似た意味や関連をもつ行動キーワードKAi、行動キーワードKAj、行動キーワードKAkを1つの集約行動キーワードKAC1に集約する。キーワード抽出部10は、集約行動キーワードKAC1を教師ラベル候補LC1として抽出する。ここでキーワード抽出部10は、形態素解析、係り受け解析、格フレーム解析のいずれかの手法を使って選択した行動キーワードKA1、行動キーワードKA2、…を集約する。つまり、キーワード抽出部10は、形態素解析、係り受け解析、格フレーム解析のいずれかの手法を使って教師ラベル候補LC1を抽出する。
【0034】
キーワード抽出部10は、似た意味や関連をもつ行動キーワードKA1、行動キーワードKA1、…を1つの集約行動キーワードKAC1に集約する場合には、行動キーワードKA1、行動キーワードKA2、…を、例えば行動クラスと対応づけることにより集約してよい。行動クラスの具体例には、例えば、「睡眠」、「食事」、「トイレ」、「服用」、「運動」などがある。例えば、キーワード抽出部10は、行動キーワードKA1「薬を飲んだ」、行動キーワードKA2「錠剤を服用した」を、集約行動キーワードKAC1「服用」に集約する。
【0035】
なお、本実施形態では、キーワード抽出部10が、似た意味や関連をもつ行動キーワードKA1、行動キーワードKA2、…を1つの集約行動キーワードKAC1に集約する場合について説明するが、これに限らない。キーワード抽出部10は、似た意味や関連をもつ行動キーワードKA11、行動キーワードKA12、…を、各々そのまま教師ラベル候補LC1、教師ラベル候補LC1、…として抽出してもよい。
【0036】
また、本実施形態では、キーワード抽出部10が、似た意味や関連をもつ行動キーワードKA1、行動キーワードKA1、…を行動クラスと対応づけることにより集約する場合について説明するが、これに限らない。キーワード抽出部10は、似た意味や関連をもつ行動キーワードKA1、行動キーワードKA2、…の中から、例えば所定の順序に基づいて1つの集約行動キーワードKAC1を選択することにより行動キーワードKA1、行動キーワードKA2、…を集約してもよい。例えば、キーワード抽出部10は、行動キーワードKA1「薬を飲んだ」、行動キーワードKA2「錠剤を服用した」を、集約行動キーワードKAC1「薬を飲んだ」に集約する。
【0037】
キーワード抽出部10は、テキストデータTXから時刻キーワードTKを選択する。ここで時刻キーワードTKとは、時刻を示すキーワードである。キーワード抽出部10は、選択した時刻キーワードTKから、開始時刻キーワードBTKを選択する。さらにキーワード抽出部10は、選択した開始時刻キーワードBTKに対応する終了時刻キーワードETKを選択する。ここで開始時刻キーワードBTKとは、被験者の行動の開始時刻の候補を示すキーワードである。終了時刻キーワードETKとは、被験者の行動の終了時刻の候補を示すキーワードである。キーワード抽出部10は、選択した開始時刻キーワードBTKを開始時刻情報BTとして抽出する。キーワード抽出部10は、選択した終了時刻キーワードETKを終了時刻情報ETとして抽出する。つまり、キーワード抽出部10は、取得したテキストデータTXから行動が行われた時刻の候補を示す時刻情報TIを抽出する。
【0038】
キーワード抽出部10は、抽出した教師ラベル候補LCと、抽出した開始時刻情報BT、及び終了時刻情報ETとを組にしてラベルセグメントLSを生成する。キーワード抽出部10が生成するラベルセグメントLSの時間区間INは、複数のラベルセグメントLS1、ラベルセグメントLS2、…同士において重なっている場合がある。つまり、キーワード抽出部10が生成する複数のラベルセグメントLS1、ラベルセグメントLS2、…によれば、ある時刻に対して複数の教師ラベル候補LC1、教師ラベル候補LC2、…が対応してしまう場合がある。複数の教師ラベル候補LC1、教師ラベル候補LC2、…から1つの教師ラベルLLが選択部14によって選択される。キーワード抽出部10は、生成したラベルセグメントLSを選択部14に供給する。
【0039】
前処理部11は、第1センサデータ供給部3が供給するセンサデータSD1を取得する。前処理部11は、取得したセンサデータSD1に対して前処理を行い、前処理済みセンサデータPSD1を生成する。ここでセンサデータSD1に対して行われる前処理とは、特徴量を抽出するための解析ができる形式にセンサデータSD1を整形する処理である。前処理部11は、生成した前処理済みセンサデータPSD1を時間窓切り出し部12に供給する。
【0040】
時間窓切り出し部12は、前処理部11が供給する前処理済みセンサデータPSD1を取得する。時間窓切り出し部12は、取得した前処理済みセンサデータPSD1に時間窓(時間窓TW1~時間窓TW3)を割り当て、時間窓付きセンサデータWSD1を生成する。時間窓切り出し部12は、生成した時間窓付きセンサデータWSD1を特徴量計算部13に供給する。
【0041】
特徴量計算部13は、時間窓切り出し部12が供給する時間窓付きセンサデータWSD1から、割り当てられた時間窓毎に特徴量ベクトルFV(特徴量ベクトルFV1、特徴量ベクトルFV2、特徴量ベクトルFV3、…)を計算する。特徴量計算部13は、計算した特徴量ベクトルFVを、選択部14及び教師データ生成部15に供給する。
【0042】
選択部14は、複数の教師ラベル候補LC1、教師ラベル候補LC2、…から1つの教師ラベル候補LCiを教師ラベルLLとして選択する処理を行う。つまり、選択部14は、キーワード抽出部10が抽出した教師ラベル候補LCの中から、行動が行われた時刻の候補を示す時刻情報TIに対応する教師ラベルLLを選択する。ここで選択部14は、選択用学習ML14を用いて1つの教師ラベルLLを選択する。なお、選択用学習ML14は、教師あり学習であるが、学習モデルLMの生成に用いられる機械学習とは異なる。選択用学習ML14については後述する。
選択部14は、選択用教師データ生成部140と、複数ラベル学習選択部141と、時刻補正部142とを備える。
【0043】
選択用教師データ生成部140は、選択用教師データLTDを生成する。ここで選択用教師データLTDとは、選択用学習ML14において用いられる教師データである。選択用教師データLTDと、教師データ生成部15が生成する教師データTDとは異なる。選択用教師データ生成部140は、キーワード抽出部10が供給するラベルセグメントLSと、特徴量計算部13が供給する特徴量ベクトルFVとに基づいて、選択用教師データLTDを生成する。選択用教師データ生成部140は、生成した選択用教師データLTDを複数ラベル学習選択部141に供給する。
【0044】
複数ラベル学習選択部141は、複数の教師ラベル候補LCi(i=1、2、…)から1つの教師ラベル候補LCjを未補正教師ラベルULLとして選択する。ここで未補正教師ラベルULL1は、後述する時刻のずれを補正する処理を行う前の教師ラベルLLである。ここで複数ラベル学習選択部141は、選択用教師データ生成部140が供給する選択用教師データLTDと、選択用学習ML14とを用いて1つの教師ラベル候補LCjを選択する。つまり、選択部14は、キーワード抽出部10が抽出した教師ラベル候補LCi(i=1、2、…)の中から未補正教師ラベルULLを、教師あり学習を用いて選択する。
【0045】
複数ラベル学習選択部141は、選択した未補正教師ラベルULLと、この未補正教師ラベルULLが示す行動についての開始時刻及び終了時刻とを組にして未補正セグメントDSを生成する。複数ラベル学習選択部141は、生成した未補正セグメントDSを時刻補正部142に供給する。
【0046】
時刻補正部142は、複数ラベル学習選択部141が供給する未補正セグメントDSの開始時刻及び終了時刻を補正する。ここで未補正セグメントDS同士は、時間について断片化または重なっている場合があり、時間についての断片化または重なりを解消するために開始時刻及び終了時刻を補正する必要がある。時刻補正部142は、複数ラベル学習選択部141が供給する未補正セグメントDSと、キーワード抽出部10が供給するラベルセグメントLSとに基づいて未補正セグメントDSの開始時刻及び終了時刻を補正する。時刻補正部142は、時間のずれを補正した未補正セグメントDSに含まれる未補正教師ラベルULLを、この未補正セグメントDSの時間区間に含まれる各時刻における教師ラベルLLとして選択する。時刻補正部142は、選択した教師ラベルLLと、時間のずれを補正した未補正セグメントDSに含まれる行動の開始時刻及び終了時刻とを組にして補正セグメントCSを生成する。時刻補正部142は、生成した補正セグメントCSを教師データ生成部15に供給する。
【0047】
教師データ生成部15は、選択部14が供給する補正セグメントCSに基づいて、特徴量計算部13が供給する特徴量ベクトルFVと、教師ラベルLLとを組にしてサンプルSMを生成する。ここで教師データ生成部15は、補正セグメントCSの時間区間INが、特徴量ベクトルFVに対応する時刻を含む補正セグメントCSを選択する。教師データ生成部15は、選択した補正セグメントCSに含まれる教師ラベルLLを、特徴量ベクトルFVと組にする。
【0048】
テキストデータ供給部2は、自然言語テキスト形式を用いて行動が記録されたテキストデータTXをラベル付与装置1に供給する。テキストデータ供給部2は、例えば、テキストデータTXが記憶される記憶装置である。
第1センサデータ供給部3は、センサデータSD1をラベル付与装置1に供給する。第1センサデータ供給部3は、例えば、被験者の身体に取り付けられるセンサである。第1センサデータ供給部3は、センサデータSD1を記憶する記憶装置であってもよい。また、第1センサデータ供給部3が記憶装置である場合、第1センサデータ供給部3は、テキストデータ供給部2と一体となって構成されてもよい。第1センサデータ供給部3は、センサが測定したデータを加工する演算装置であってもよい。
【0049】
行動推定装置4は、学習部40と、推定部41とを備える。
学習部40は、ラベル付与装置1が供給する教師データTDを用いて機械学習を行う。学習部40は、機械学習により学習モデルLMを生成する。
推定部41は、学習部40が生成した学習モデルLMに基づいて、第2センサデータ供給部5が供給するセンサデータSD2から推定ラベルELを推定する。
なお、図2に示す例においては、行動推定装置4と、ラベル付与装置1とは独立して構成されているが、行動推定装置4とラベル付与装置1とは一体となって構成されてもよい。
第2センサデータ供給部5は、行動推定装置4にセンサデータSD2を供給する。
【0050】
(学習フェーズ)
ラベル付与装置1の処理について説明する。図3は、本実施形態に係るラベル付与装置1の学習処理の一例を示す図である。
前処理部11は、第1センサデータ供給部3が供給するセンサデータSD1を取得する(ステップS10)。前処理部11は、取得したセンサデータSD1に対して前処理を行う(ステップS20)。前処理部11は、センサデータSD1に対して前処理を行った結果、前処理済みセンサデータPSD1を生成する。前処理部11は生成した前処理済みセンサデータPSD1を時間窓切り出し部12に供給する。
【0051】
時間窓切り出し部12は、前処理部11が供給する前処理済みセンサデータPSD1を取得する。時間窓切り出し部12は、前処理部11が供給する前処理済みセンサデータPSD1に対して時間窓TW(時間窓TW1~時間窓TW3)を割り当て、時間窓付きセンサデータWSD1を生成する。(ステップS30)。時間窓切り出し部12は、生成した時間窓付きセンサデータWSD1を特徴量計算部13に供給する。
【0052】
特徴量計算部13は、時間窓切り出し部12が供給する時間窓付きセンサデータWSD1を取得する。特徴量計算部13は、取得した時間窓付きセンサデータWSD1から時間窓TW毎に1以上の特徴量を抽出する(ステップS40)。特徴量計算部13は、時間窓付きセンサデータWSD1から抽出した1以上の特徴量から特徴量ベクトルFVを生成する。
特徴量計算部13は、生成した特徴量ベクトルFVに対して次元削減の処理を行う(ステップS50)。ここで次元削減の処理とは、例えば、主成分分析により特徴量ベクトルFVの次元を減らす処理である。特徴量計算部13は、次元削減の処理をした特徴量ベクトルFVを、選択用教師データ生成部140及び教師データ生成部15に供給する。
【0053】
教師データ生成部15は、特徴量ベクトルFVと、補正セグメントCSとに基づいて教師データTDを生成する(ステップS60)。ラベル付与装置1が教師データTDを生成する処理の詳細については図4を参照し後述する。教師データ生成部15は、生成した教師データTDを行動推定装置4に供給する。
行動推定装置4の学習部40は、教師データ生成部15が供給する教師データTDに基づいて学習モデルLMを生成する(ステップS70)。
【0054】
図4は、本実施形態に係るラベル付与装置1の教師データTDの生成処理の一例を示す図である。
キーワード抽出部10は、テキストデータ供給部2が供給するテキストデータTXを取得する(ステップS600)。
キーワード抽出部10は、取得したテキストデータTXから行動キーワードKAを選択する(ステップS601)。キーワード抽出部10は、公知の自然言語処理の手法を使って行動キーワードKAを選択する。公知の自然言語処理とは、形態素解析、係り受け解析、及び格フレーム解析などである。キーワード抽出部10は、選択した行動キーワードKAのうち、似た意味や関連をもつ行動キーワードKAを1つの集約行動キーワードKACに集約する。キーワード抽出部10は、集約した集約行動キーワードKACを教師ラベル候補LCとして抽出する。
【0055】
なお、キーワード抽出部10は、形態素解析、係り受け解析、及び格フレーム解析に加えて、文脈解析を用いてもよい。キーワード抽出部10は、文脈解析として、例えば、照応解析を用いて、代名詞や指示詞などの指示対象を推定したり、省略された名詞句を補完したりしてもよい。
【0056】
ここで、図5及び図6を参照し、キーワード抽出部10がテキストデータTXから行動キーワードKAを選択する具体例について説明する。
図5は、本実施形態に係るテキストデータTXの一例を示す図である。図6は、本実施形態に係るラベル候補の一例を示す図である。テキストデータTXは、一例として、被験者である被介護者の、ある日の夕方から夜にかけての介護について記録した業務日誌の文章の抜粋である。
【0057】
キーワード抽出部10は、形態素解析を用いて、テキストデータTXを形態素に分解する。キーワード抽出部10は、分解した形態素から時刻キーワードTKを選択する。
例えば、キーワード抽出部10は、形態素解析を用いて、テキストデータTX「担当者:○○太郎、被介護者:△△次郎、介護した日付:20XX年10月XX日 17時半、夕食をとる。普段より食欲あり。18時に錠剤Aを服用した。19時にトイレに行こうとした際にスリッパを上手く履けず、ふらついて転びそうになった。スリッパの使用の可否について被介護者と相談した。20時すぎ就寝。」から、「17時半」、「18時」、「19時」、及び「20時」を時刻キーワードTKとして選択する。
【0058】
キーワード抽出部10は、選択した時刻キーワードTKから、開始時刻キーワードBTKを選択する例えば、キーワード抽出部10は、時刻キーワードTK「17時半」、「18時」、「19時」、及び「20時」から、開始時刻キーワードBTKとして「17時半」、「18時」、「19時」、及び「20時」を選択する。
【0059】
キーワード抽出部10は、選択した時刻キーワードTKから、選択した開始時刻キーワードBTKに対応する終了時刻キーワードETKを選択する。ここでキーワード抽出部10は、選択した開始時刻キーワードBTKに対応する終了時刻キーワードETKとして、選択した時刻キーワードTKのうち、この開始時刻キーワードBTKが示す時刻の次に新しい時刻を示す時刻キーワードTKを選択する。
図5に示す例では、キーワード抽出部10は、時刻キーワードTK「17時半」、「18時」、「19時」、及び「20時」から、選択した開始時刻キーワードBTK「17時半」、「18時」、及び「19時」のそれぞれに対応する終了時刻キーワードETKとして「18時」、「19時」、及び「20時」を選択する。ただし、図5に示すテキストデータTXからは開始時刻キーワードBTK「20時」に対応する終了時刻キーワードETKは選択されないため、キーワード抽出部10は、開始時刻キーワードBTK「20時」に対応する終了時刻キーワードETKとして「24時」を選択する。なお、開始時刻キーワードBTK「20時」に対応する終了時刻キーワードETKは、「24時」の代わりに、翌日以降のテキストデータTXから形態素解析を用いて抽出されてよい。
【0060】
キーワード抽出部10は、選択した開始時刻キーワードBTKを開始時刻情報BTとして抽出する。キーワード抽出部10は、選択した終了時刻キーワードETKを終了時刻情報ETとして抽出する。例えば、キーワード抽出部10は、開始時刻情報BT及び終了時刻情報ETとして、「開始時刻:17時半」及び「終了時刻:18時」と、「開始時刻:18時」及び「終了時刻:19時」と、「開始時刻:19時」及び「終了時刻:20時」と、「開始時刻:20時」及び「終了時刻:24時」とを抽出する。
【0061】
図5に示す例では、図6に示すように、キーワード抽出部10は、例えば、開始時刻情報BTとして「開始時刻:17時半」、終了時刻情報ETとして「終了時刻:18時」をもつラベルセグメントAを生成する。キーワード抽出部10は、ラベルセグメントB、ラベルセグメントC、及びラベルセグメントDについても同様に生成する。
【0062】
開始時刻情報BT、及び終了時刻情報ETは、テキストデータTXから選択された開始時刻キーワードBTK、及び終了時刻キーワードETKに基づいて生成されているため、教師データTDを生成するのに十分な精度をもたない場合がある。開始時刻情報BT、及び終了時刻情報ETが示す時刻の精度は、選択部14による選択用学習ML14により高められる。
【0063】
本実施形態では、キーワード抽出部10は、終了時刻キーワードETKとして、開始時刻キーワードBTKが示す時刻の次に新しい時刻を示す時刻キーワードTKを選択するため、時間について隣り合うラベルセグメントLS同士には時間の隙間がない。キーワード抽出部10は、開始時刻キーワードBTKが示す開始時刻から所定の時間が経過した時刻を、終了時刻情報ETとして抽出してもよい。開始時刻キーワードBTKが示す開始時刻から所定の時間が経過した時刻を終了時刻情報ETとして抽出される場合、時間軸上においてラベルセグメントLS同士が重なり合う部分があってもよい。
キーワード抽出部10は、教師ラベル候補LCが示す行動の典型的な所要時間を予め決めておき、この教師ラベル候補LCを含むラベルセグメントLSについて、開始時刻情報BTまたは終了時刻情報ETを補正してもよい。
【0064】
次にキーワード抽出部10は、テキストデータTXから教師ラベル候補LCを抽出する。
キーワード抽出部10は、開始時刻キーワードBTK及び終了時刻キーワードETKの選択に用いられたテキストの中から、行動キーワードKAを選択する。ここでキーワード抽出部10は、形態素解析、係り受け解析、及び格フレーム解析を用いて、行動キーワードKAを選択する。
【0065】
図5に示す例では、キーワード抽出部10は、ラベルセグメントAについて、開始時刻キーワードBTK及び終了時刻キーワードETKの選択に用いられたテキスト「17時半、夕食をとる。普段より食欲あり」の中から行動キーワードKAとして、「夕食」、及び「食欲」を選択する。
キーワード抽出部10は、ラベルセグメントBについて、開始時刻キーワードBTK及び終了時刻キーワードETKの選択に用いられたテキスト「18時に錠剤Aを服用した」の中から行動キーワードKAとして、「錠剤A」、及び「服用」を選択する。
キーワード抽出部10は、ラベルセグメントCについて、開始時刻キーワードBTK及び終了時刻キーワードETKの選択に用いられたテキスト「19時にトイレに行こうとした際にスリッパを上手く履けず、ふらついて転びそうになった。スリッパの使用の可否について被介護者と相談した」の中から行動キーワードKAとして、「トイレ」、「行こう」、「スリッパ」、「履けず」を選択する。
キーワード抽出部10は、ラベルセグメントDについて、開始時刻キーワードBTK及び終了時刻キーワードETKの選択に用いられたテキスト「20時すぎ就寝」の中から行動キーワードKAとして、「就寝」を選択する。
【0066】
行動キーワードKAを選択する処理において、キーワード抽出部10は、選択したテキストの中から、被験者の行動に関係する文や部分を選択する。例えば、キーワード抽出部10は、テキスト「19時にトイレに行こうとした際にスリッパを上手く履けず、ふらついて転びそうになった。スリッパの使用の可否について被介護者と相談した」の中から、被験者の行動に関する部分として「19時にトイレに行こうとした際にスリッパを上手く履けず、ふらついて転びそうになった」を選択する。
【0067】
キーワード抽出部10は、選択したテキストの中から被験者の行動に関係する文や部分を選択する際、不図示の辞書データベースを用いてよい。キーワード抽出部10は、選択したテキストの中から被験者の行動に関係する文や部分を選択する際、辞書データベースに予め登録されたキーワードと一致する行動キーワードKAまたは行動クラスに関連する行動キーワードKAを含む文や部分のみを選択の対象としてよい。また、キーワード抽出部10は、選択したテキストの中から被験者の行動に関係する文や部分を選択する際、辞書データベースに予め登録されたキーワードに関連する行動キーワードKAとして過去に選択したことのある行動キーワードKAを含む文や部分のみを選択の対象としてもよい。
【0068】
キーワード抽出部10は、ラベルセグメントLS毎に、選択した行動キーワードKAのうち似た意味や関連をもつ行動キーワードKAを集約行動キーワードKACに集約する。ここでキーワード抽出部10は、行動クラスに対応させ行動キーワードKAを集約する。行動クラスは、予め辞書データベースに登録されてよい。
図5に示す例では、キーワード抽出部10は、「夕食」、及び「食欲」を「食事」として集約する。キーワード抽出部10は、「錠剤A」、及び「服用」を「服用」として集約する。キーワード抽出部10は、「トイレ」、「行こう」、「スリッパ」、「履けず」、「ふらついて」、及び「転び」を「トイレ」として集約する。
【0069】
なお、キーワード抽出部10は、選択した行動キーワードKAに対応する行動クラスが存在しない場合、行動クラスを新たに生成し、選択した行動キーワードKAを生成した行動クラスに対応させることにより、行動キーワードKAを集約行動キーワードKACに集約してよい。
キーワード抽出部10は、上述の処理により選択した行動キーワードKAを教師ラベル候補LCとして抽出する。
【0070】
上述したように、キーワード抽出部10は、教師ラベル候補LCが示す各行動の典型的な所要時間を予め決めておき、各教師ラベル候補LCと組にする時刻情報TI(開始時刻情報BT、及び終了時刻情報ET)を補正してもよい。キーワード抽出部10が時刻情報TI(開始時刻情報BT、及び終了時刻情報ET)を補正する場合、キーワード抽出部10は、例えば、「服用」の所要時間を3分とした場合、キーワード抽出部10は、ラベルセグメントBの終了時刻情報ETが示す終了時刻を「19:00:00」から「18:03:00」と補正してよい。また、キーワード抽出部10は、「トイレ」の所要時間を5分とした場合、キーワード抽出部10は、ラベルセグメントCの終了時刻情報ETが示す終了時刻を「20:00:00」から「19:05:00」と補正してよい。
【0071】
本実施形態では、介護の業務日誌を例にとり、テキストデータTXには、時刻キーワードTKと、行動キーワードKAとが示されている場合について説明したが、テキストデータTXには、一日の業務の内容がまとめて記載されていてもよい。キーワード抽出部10は、時刻キーワードTKの代わりに、時刻を推定することができる名詞を抽出し、時刻情報TI(開始時刻情報BT、及び終了時刻情報ET)を生成してもよい。例えば、キーワード抽出部10は、「夕方」という名詞から開始時刻情報BT「開始時刻:17:00」を生成してもよい。
【0072】
図4に戻って、ラベル付与装置1の教師データTD生成処理の説明を続ける。
キーワード抽出部10は、生成したラベルセグメントLSを選択用教師データ生成部140及び時刻補正部142に供給する。選択用教師データ生成部140は、キーワード抽出部10が供給するラベルセグメントLSを取得する。選択用教師データ生成部140は、特徴量計算部13が供給する特徴量ベクトルFVを取得する。
【0073】
選択用教師データ生成部140は、選択用教師データLTDを、特徴量ベクトルFVと、ラベルセグメントLSとから生成する。選択用教師データ生成部140は、ある時刻における複数の教師ラベル候補LCi(i=1、2、…)を生成する(ステップS602)。選択用教師データ生成部140は、生成したある時刻における複数の教師ラベル候補LCi(i=1、2、…)の各々と、この時刻に対応する特徴量ベクトルFVとを組にすることにより選択用教師データLTDを生成する。つまり、選択用教師データLTDにおいては、ある時刻における複数の教師ラベル候補LCi(i=1、2、…)の各々に、この時刻に対応する1つの特徴量ベクトルFVが対応している。
【0074】
ここで複数の教師ラベル候補LCi(i=1、2、…)が示す行動は、ラベルセグメントLS1、ラベルセグメントLS2、…にそれぞれ含まれる教師ラベル候補LC1、教師ラベル候補LC2、…が示す行動のいずれかである。選択用教師データ生成部140は、生成する複数の教師ラベル候補LCi(i=1、2、…)の割合を、教師ラベル候補確率分布PAに基づいて決定する。つまり、選択用教師データ生成部140が生成する複数の教師ラベル候補LCi(i=1、2、…)は、ラベルセグメントLS1、ラベルセグメントLS2、…にそれぞれ含まれる教師ラベル候補LC1、教師ラベル候補LC2、…を教師ラベル候補確率分布PAに基づく割合において複製して得られる。ここで図7を参照し教師ラベル候補確率分布PAについて説明する。
【0075】
図7は、本実施形態に係る選択部14の教師ラベル候補LCの選択処理の概要の一例を示す図である。教師ラベル候補確率分布PAとは、教師ラベル候補LCが示す行動毎の教師ラベル候補LCの確率分布を、共通の行動について足しあげて得られる確率分布である。教師ラベル候補LCが示す行動毎の確率分布とは、例えば、ガウス分布である。このガウス分布の標準偏差は、ラベルセグメントLSの時間区間INの長さに比例する。このガウス分布の平均は、時間区間INの中央の時刻である。
【0076】
つまり、選択用教師データLTDに含まれる教師ラベル候補LCの割合は、キーワード抽出部10が抽出した時刻情報TI(開始時刻情報BT、及び終了時刻情報ET)から生成される確率分布である教師ラベル候補確率分布PAに基づいて決定される。ある時刻tにおいて、教師ラベル候補LCが示す行動毎の確率分布の割合が大きいほど、選択用教師データ生成部140が生成する複数の教師ラベル候補LCi(i=1、2、…)において、この教師ラベル候補LCの割合は大きくなる。
なお、教師ラベル候補確率分布PAは正規化される。
【0077】
図4に戻って、ラベル付与装置1の教師データTD生成処理の説明を続ける。
選択用教師データ生成部140は、生成した選択用教師データLTDを複数ラベル学習選択部141に供給する。
【0078】
複数ラベル学習選択部141は、選択用教師データ生成部140が供給する選択用教師データLTD(特徴量ベクトルFV、複数の教師ラベル候補LCi(i=1、2、…)から、教師ラベル候補LCを未補正教師ラベルULLとして選択する(ステップ0)。複数ラベル学習選択部141は、選択用教師データLTDから、未補正教師ラベルULLとともに、この未補正教師ラベルULLが示す行動についての開始時刻及び終了時刻とを、選択用学習ML14を用いて選択する。
【0079】
ここで選択用学習ML14とは、選択用教師データ生成部140が生成した選択用教師データLTDを用いた機械学習である。つまり、選択用学習ML14とは、被験者の行動に応じて変化する所定の量を検出するセンサが検出したデータから抽出される特徴量と、複数の教師ラベル候補LCi(i=1、2、…)とが、時刻毎に対応づけられたデータを教師データとして用いる学習である。
【0080】
複数ラベル学習選択部141は、選択用教師データLTDから、機械学習により第1確率分布を算出する。ここで第1確率分布とは、特徴量ベクトルFVが与えられたときに、この特徴量ベクトルFVに対応する時刻における教師ラベル候補LCjが示す行動がある行動である確率を示す確率分布である。
複数ラベル学習選択部141は、算出した第1確率分布に基づいて第2確率分布を算出する。ここで第2確率分布とは、選択用教師データLTDに含まれる特徴量ベクトルFVが与えられたときの、この特徴量ベクトルFVに対応する時刻における教師ラベル候補LCjが示す行動の確率分布である。
複数ラベル学習選択部141は、ある時刻における複数の教師ラベル候補LC2i(i=1、2、…)を生成する。ここで、複数ラベル学習選択部141は、生成した複数の教師ラベル候補LC2i(i=1、2、…)が示す行動の割合を、算出した第2確率分布に基づいて決定する。
複数ラベル学習選択部141は、生成したある時刻における複数の教師ラベル候補LC2i(i=1、2、…)の各々と、この時刻に対応する特徴量ベクトルFVとを組にすることにより第2選択用教師データLTD2を生成する。複数ラベル学習選択部141は、生成した第2選択用教師データLTD2を、選択用教師データLTDの代わりに用いて、第1確率分布を算出する。複数ラベル学習選択部141は、第2確率分布が収束するまで上記の処理を繰り返す。
【0081】
複数ラベル学習選択部141は、収束した第2確率分布に基づいて、特徴量ベクトルFVの各々に対して、教師ラベル候補LC2i(i=1、2、…)の中から、第2確率分布が最大となる教師ラベル候補LC2jを未補正教師ラベルULLとして時刻毎に選択する。ここで複数ラベル学習選択部141は、時刻毎に未補正教師ラベルULLを1つ選択する。
ここで、複数ラベル学習選択部141は、複数ラベル学習選択部141が選択した未補正教師ラベルULLは時刻毎に与えられている。複数ラベル学習選択部141は、未補正教師ラベルULLを時刻毎に並べたときに、互いに異なる行動を示す未補正教師ラベルULLが隣り合っている箇所を判定することにより、未補正教師ラベルULLが示す行動の開始時刻及び終了時刻を判定する。複数ラベル学習選択部141は、判定結果に基づいて行動の開始時刻及び終了時刻を選択する。
【0082】
複数ラベル学習選択部141は、選択した未補正教師ラベルULLと、判定した行動の開始時刻及び終了時刻とを組にして未補正セグメントDSを生成する。複数ラベル学習選択部141は、生成した未補正セグメントDSを時刻補正部142に供給する。
【0083】
時刻補正部142は、複数ラベル学習選択部141が供給する未補正セグメントDSを取得する。時刻補正部142は、キーワード抽出部10が供給するラベルセグメントLSを取得する。
【0084】
未補正セグメントDS同士は、1つの行動が持続していた時間について断片化し、実際の行動の開始時刻及び終了時刻からずれている場合がある。時刻補正部142は、未補正セグメントDSの時刻のずれを補正する(ステップS604)。ここで未補正セグメントDSの時刻のずれを補正するとは、未補正セグメントDSに含まれる開始時刻及び終了時刻を補正することである。
【0085】
ここで再び図7を参照し、時刻補正部142が、未補正セグメントDS1と、この未補正セグメントDS1と隣り合う未補正セグメントDS2との時刻のずれを補正する場合について説明する。
時刻補正部142は、ある時間間隔に対応する行動量を生成する。ここで、ある時間間隔に対応する行動量とは、ある時間間隔の各時刻における未補正教師ラベルULLを未補正教師ラベルULLが示す行動毎に数えた量である。時刻補正部142は、生成した行動量を尤度として用いる。ここで尤度とは、ある時間間隔が未補正セグメントDSの時間区間INの間に含まれる尤度である。
【0086】
時刻補正部142は、ラベルセグメントLS1の時間区間IN1の中点に対応する時刻C1から、ある時刻Tまでの時間間隔に対応する行動量を算出する。
時刻補正部142は、時刻Tを、時刻C1と、ラベルセグメントLS2の時間区間IN2の中点に対応する時刻C2との間の区間において変化させたときに、行動量が最大となる時刻Tを判定する。
【0087】
時刻補正部142は、時刻C1と時刻C2との時間軸上の順序によって、判定した時刻Tを未補正セグメントDS1の開始時刻とするか終了時刻とするかを判定する。時刻C2が時刻C1よりも時間軸上において後である場合、時刻補正部142は、判定した時刻Tを未補正セグメントDS1の終了時刻とする。一方、時刻C2が時刻C1よりも時間軸上において前である場合、時刻補正部142は、判定した時刻Tを未補正セグメントDS1の開始時刻とする。
【0088】
ここで未補正セグメントDS1の開始時刻は、未補正セグメントDS2の終了時刻よりも時間軸上において前であるとする。時刻補正部142は、時間軸上において未補正セグメントDS1と未補正セグメントDS2とが重なっている場合、重なっている時間区間の中点を、未補正セグメントDS1の終了時刻及び未補正セグメントDS2の開始時刻とする。時刻補正部142は、時間軸上において未補正セグメントDS1と未補正セグメントDS2との間に隙間がある場合、隙間の中点を、未補正セグメントDS1の終了時刻及び未補正セグメントDS2の開始時刻とする。
【0089】
図4に戻って、ラベル付与装置1の教師データTD生成処理の説明を続ける。
時刻補正部142は、時間のずれを補正した未補正セグメントDSに含まれる未補正教師ラベルULLを、この未補正セグメントDSの時間区間に含まれる各時刻における教師ラベルLLとして選択する。時刻補正部142は、選択した教師ラベルLLと、時間のずれを補正した未補正セグメントDSに含まれる行動の開始時刻及び終了時刻とを組にして補正セグメントCSを生成する。時刻補正部142は、生成した補正セグメントCSを教師データ生成部15に供給する。
【0090】
教師データ生成部15は、教師データを生成する(ステップS605)。教師データ生成部15は、時刻補正部142が供給する補正セグメントCSを取得する。教師データ生成部15は、特徴量計算部13が供給する特徴量ベクトルFVを取得する。教師データ生成部15は、取得した補正セグメントCSに基づいて、取得した特徴量ベクトルFVと、教師ラベルLLとを組にしてサンプルSMを生成する。ここで教師データ生成部15は、補正セグメントCSの時間区間INが、特徴量ベクトルFVに対応する時刻を含む補正セグメントCSを選択する。教師データ生成部15は、選択した補正セグメントCSに含まれる教師ラベルLLを、特徴量ベクトルFVと組にする。
教師データ生成部15は、時刻毎のサンプルSM1、サンプルSM2、…から教師データTDを生成する。教師データ生成部15は、生成した教師データTDを行動推定装置4に供給する。
【0091】
なお、本実施形態においては、時刻補正部142が未補正セグメントDSの時刻のずれを補正し教師ラベルLLを選択する場合について説明しているが、これに限らない。未補正セグメントDSの時刻のずれを補正する処理を省略し、複数ラベル学習選択部141が、生成した未補正セグメントDSに含まれる未補正教師ラベルULLを教師ラベルLLとして選択してもよい。複数ラベル学習選択部141が教師ラベルLLを選択する場合、複数ラベル学習選択部141は、未補正セグメントDSを補正セグメントCSとして教師データ生成部15に供給する。
【0092】
(推定フェーズ)
図7は、本実施形態に係る行動推定装置4の推定処理の一例を示す図である。図7に示す処理は、図3に示す処理により学習モデルLMが生成された後に実行される。
なお、ステップS110、ステップS120、ステップS130、ステップS140、及びステップS150の各処理は、図3におけるステップS10、ステップS20、ステップS30、ステップS40、及びステップS50の各処理と同様であるため、説明を省略する。
【0093】
推定部41は、学習部40が生成した学習モデルLMに基づいて、第2センサデータ供給部5が供給するセンサデータSD2から推定ラベルELを推定する(ステップS160)。推定部41は、推定した推定ラベルELを表示装置(不図示)に表示させたり、記憶装置(不図示)に記憶させたりする。
【0094】
(まとめ)
以上に説明したように、本実施形態に係るラベル付与装置1は、センサが検出したデータから行動の時系列を推定するための機械学習の学習に用いられる教師データのラベル付与装置であって、キーワード抽出部10と、選択部14とを備える。
キーワード抽出部10は、行動が自然言語テキスト形式で記録されたテキストデータTXに含まれる行動を示す行動キーワードKAを教師ラベルの候補である教師ラベル候補LCとして抽出する。
選択部14は、キーワード抽出部10が抽出した教師ラベル候補LCの中から、行動が行われた時刻の候補を示す時刻情報TIに対応する教師ラベルLLを選択する。
【0095】
この構成により、本実施形態に係るラベル付与装置1は、テキストデータTXから抽出された教師ラベル候補LCの中から教師ラベルLLを選択することができるため、機械学習の学習に用いられる教師データTDの教師ラベルLLの付与を簡便に行うことができる。
【0096】
また、キーワード抽出部10は、テキストデータTXから時刻情報TIを抽出する。
この構成により、本実施形態に係るラベル付与装置1は、教師ラベルLLが示す行動についての開始時刻または終了時刻の精度を高めることができるため、ラベル付与装置1が生成する教師データTDを用いて学習される学習モデルLMの予測精度を高めることができる。
【0097】
また、キーワード抽出部10は、抽出した教師ラベル候補LCにおいて、1つの行動に対して複数の教師ラベル候補(教師ラベル候補LC1、教師ラベル候補LC2、…)があるときは、複数の教師ラベル候補(教師ラベル候補LC1、教師ラベル候補LC2、…)よりも少ない個数の教師ラベル候補LCを抽出する。
この構成により、本実施形態に係るラベル付与装置1は、同義語を集約して教師ラベル候補LCを抽出することができるため、テキストデータTXから教師ラベル候補LC)を抽出する際の効率を、同義語を集約しない場合に比べて高めることができる。
【0098】
また、キーワード抽出部10は、形態素解析、係り受け解析、格フレーム解析のいずれかの手法を使って教師ラベル候補LCを抽出する。
この構成により、本実施形態に係るラベル付与装置1は、テキストデータTXから教師ラベル候補LCを抽出する際に、形態素解析、係り受け解析、格フレーム解析を用いることができるため、ラベル付与装置1が生成する教師データTDを用いて学習される学習モデルLMの予測精度を、形態素解析、係り受け解析、格フレーム解析のいずれかの手法を用いない場合に比べて高めることができる。
【0099】
また、選択部14は、キーワード抽出部10が抽出した教師ラベル候補LCの中から教師ラベルLLを、教師あり学習(選択用学習ML14)を用いて選択する。
この構成により、本実施形態に係るラベル付与装置1は、テキストデータTXから抽出される教師ラベル候補LCから教師ラベルLLを選択する精度を高めることができるため、ラベル付与装置1が生成する教師データTDを用いて学習される学習モデルLMの予測精度を高めることができる。
【0100】
本実施形態に係るラベル付与装置1は、病院における看護師または患者の行動認識に応用することができる。行動認識の結果は、看護の効率化や最適化、患者の容態予測などに役立てることができる。また、本実施形態に係るラベル付与装置1は、介護施設における介護士または被介護者の行動認識に応用されてもよい。行動認識の結果は、介護の効率化や最適化、被介護者の状態把握や容態予測などに役立てることができる。
【0101】
なお、上述した実施形態においては、キーワード抽出部10がテキストデータTXから被験者の行動の開始時刻の候補または終了時刻の候補を抽出する場合について説明したが、被験者の行動の開始時刻の候補または終了時刻の候補が抽出される方法はテキストデータTX以外から抽出されてもよい。例えば、被験者の行動の開始時刻の候補または終了時刻の候補は、テキストデータTXが作成された時刻の情報に基づいて抽出されてもよい。
【0102】
なお、上述した実施形態においては、前処理済みセンサデータPSD1からある時間間隔における特徴量ベクトルFVを計算する方法として、時間窓切り出し部12が前処理済みセンサデータPSD1に時間窓(時間窓TW1~時間窓TW3)を割り当て、時間窓付きセンサデータWSD1を生成する場合について説明したが、前処理済みセンサデータPSD1からある時間間隔における特徴量ベクトルFVを計算する方法はこれに限らない。前処理済みセンサデータPSD1からある時間間隔における特徴量ベクトルFVを計算する方法には、例えば、公知の変化点検出アルゴリズムや公知の隠れマルコフモデルが用いられてもよい。
【0103】
なお、上述した実施形態においては、選択部14が、キーワード抽出部10が抽出した教師ラベルの候補(教師ラベル候補LC)の中から教師あり学習(選択用学習ML14)を用いて、教師ラベルLLを選択する場合について説明したが、選択部14は、複数の教師ラベルの候補(教師ラベル候補LC1、教師ラベル候補LC2、…)の中から教師ラベルの候補(教師ラベル候補LC)を選択する処理において、行動が行われた時刻の候補を示す時刻情報TIに加えて、被験者の位置情報や個人IDを用いて教師ラベルを選択してもよい。
また、選択部14は、選択部14が教師ラベルの候補(教師ラベル候補LC)を選択する方法は実施形態において説明した教師あり学習(選択用学習ML14)以外の方法を用いてもよい。
例えば、選択部14は、キーワード抽出部10がテキストデータTXから抽出した教師ラベル候補LC1を、過去に教師ラベル候補LC1が抽出された頻度を示す履歴情報に基づいて選択してもよい。選択部14は、例えば、キーワード抽出部10が過去に抽出した教師ラベル候補LC1をデータベースに履歴情報として記憶させて、この履歴情報に基づいて教師ラベル候補LC1が抽出された頻度を算出する。ここでキーワード抽出部10が過去に抽出した教師ラベル候補LC1とは、キーワード抽出部10が教師ラベル候補LC1を抽出する処理を行うタイミングより以前に抽出された教師ラベル候補LC1である。また、選択部14は、データベースに記憶された履歴情報に基づく代わりに、テキストデータTXから抽出した教師ラベル候補LC1の中から、教師ラベル候補LC1が抽出された頻度を算出してもよい。
【0104】
なお、上述した実施形態におけるラベル付与装置1及び行動推定装置4の一部、例えば、キーワード抽出部10、前処理部11、時間窓切り出し部12、特徴量計算部13、選択部14、教師データ生成部15、学習部40、及び推定部41をコンピュータで実現するようにしてもよい。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、ラベル付与装置1及び行動推定装置4に内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
また、上述した実施形態におけるラベル付与装置1及び行動推定装置4の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。ラベル付与装置1及び行動推定装置4の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
【0105】
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【符号の説明】
【0106】
1…ラベル付与装置、2…テキストデータ供給部、3…第1センサデータ供給部、4…行動推定装置、40…学習部、41…推定部、5…第2センサデータ供給部、10…キーワード抽出部、11…前処理部、12…時間窓切り出し部、13…特徴量計算部、14…選択部、140…選択用教師データ生成部、141…複数ラベル学習選択部、142…時刻補正部、15…教師データ生成部、TX…テキストデータ、SD1、SD2…センサデータ、TD…教師データ、LS…ラベルセグメント、PSD1…前処理済みセンサデータ、WSD1…時間窓付きセンサデータ、FV…特徴量ベクトル、LTD…選択用教師データ、DS…未補正セグメント、CS…補正セグメント
図1
図2
図3
図4
図5
図6
図7
図8