IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7472658行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム
<>
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図1
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図2
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図3
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図4
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図5
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図6
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図7
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図8
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図9
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図10
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図11
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図12
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図13
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図14
  • 特許-行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-15
(45)【発行日】2024-04-23
(54)【発明の名称】行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラム
(51)【国際特許分類】
   G06N 7/01 20230101AFI20240416BHJP
   G06N 20/20 20190101ALI20240416BHJP
   G06F 18/214 20230101ALI20240416BHJP
【FI】
G06N7/01
G06N20/20
G06F18/214
【請求項の数】 6
(21)【出願番号】P 2020096207
(22)【出願日】2020-06-02
(65)【公開番号】P2021189892
(43)【公開日】2021-12-13
【審査請求日】2023-03-09
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】藤本 純也
(72)【発明者】
【氏名】中山 收文
【審査官】山本 俊介
(56)【参考文献】
【文献】特開2020-38440(JP,A)
【文献】国際公開第2018/047863(WO,A1)
【文献】特開2019-185483(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06F 18/214
(57)【特許請求の範囲】
【請求項1】
人の動作の種類を状態とする複数の第1隠れマルコフモデルの各々であって、かつ、複数の前記動作を組み合わせて定まる行動を状態とする第2隠れマルコフモデルを含む隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習する観測確率学習部と、
前記観測確率学習部にて学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習する遷移確率学習部と、
前記観測確率学習部で学習した前記観測確率及び前記遷移確率学習部で学習した前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する構築部と、
を含む行動区間推定モデル構築装置。
【請求項2】
前記遷移確率学習部は、前記第1教師ありデータにノイズを付加してオーバーサンプリングすることで生成したデータの各々に前記第1教師ありデータの教師情報を付加することで水増しをする、
請求項1に記載の行動区間推定モデル構築装置。
【請求項3】
前記ノイズはランダムノイズである、
請求項2に記載の行動区間推定モデル構築装置。
【請求項4】
前記ノイズは、前記複数の動作のサンプルの散らばりが大きいほど大きくばらつくノイズである、
請求項2に記載の行動区間推定モデル構築装置。
【請求項5】
コンピュータが、
人の動作の種類を状態とする複数の第1隠れマルコフモデルの各々であって、かつ、複数の前記動作を組み合わせて定まる行動を状態とする第2隠れマルコフモデルを含む隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習し、
学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習し、
学習した前記観測確率及び前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する、
行動区間推定モデル構築方法。
【請求項6】
人の動作の種類を状態とする複数の第1隠れマルコフモデルの各々であって、かつ、複数の前記動作を組み合わせて定まる行動を状態とする第2隠れマルコフモデルを含む隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習し、
学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習し、
学習した前記観測確率及び前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する、
処理をコンピュータに実行させる行動区間推定モデル構築プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、行動区間推定モデル構築装置、行動区間推定モデル構築方法及び行動区間推定モデル構築プログラムに関する。
【背景技術】
【0002】
ディープラーニング技術の発展により通常のRGBカメラで撮影した人の映像から姿勢を高精度に認識できるようになり、この認識情報を利用して人の行動を推定する様々な研究開発が行われている。当該状況下において、人の映像から検出した姿勢の時系列データから指定した行動が発生した時間区間を推定する取り組みが行われている。
【先行技術文献】
【非特許文献】
【0003】
【文献】山本龍一、酒向慎司、北村正、「隠れセミマルコフモデルと線形動的システムを組み合わせた音楽音響信号と楽譜の実時間アライメント手法」、研究報告音楽情報科学(MUS)、2012年
【文献】Shun-ZhengYu、「Hidden semi-Markov models」、Artificial Intelligence、Volume 174、Issue 2、2010年2月、215-243頁
【文献】若林啓、三浦孝夫、「階層型隠れマルコフモデルの高速パラメータ推定」、電子情報通信学会論文誌、2011年
【文献】”映像から人の様々な行動を認識するAI技術「行動分析技術 Actlyzer」を開発”、[online]、2019年11月25日、富士通株式会社、[2020年1月16日検索]、インターネット(URL:https://pr.fujitsu.com/jp/news/2019/11/25.html)
【発明の概要】
【発明が解決しようとする課題】
【0004】
行動の時間区間を推定するモデルを学習させる際の教師ありデータの教師情報を作成するコストが高い。
【0005】
本開示は、1つの側面として、行動区間推定モデルを効率的に構築することを目的とする。
【課題を解決するための手段】
【0006】
1つの実施形態では、隠れセミマルコフモデルは、人の動作の種類を状態とする複数の第1隠れマルコフモデルの各々であって、かつ、複数の動作を組み合わせて定まる行動を状態とする第2隠れマルコフモデルを含む。隠れセミマルコフモデルにおいて、複数の第1隠れマルコフモデルの動作の種類ごとの観測確率を教師なし学習で学習する。学習した観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、第1隠れマルコフモデルの動作の遷移確率を第2教師ありデータを使用した教師あり学習で学習する。学習した観測確率及び遷移確率を使用して行動の区間を推定するモデルである隠れセミマルコフモデルを構築する。
【発明の効果】
【0007】
本開示は、1つの側面として、行動区間推定モデルを効率的に構築することができる。
【図面の簡単な説明】
【0008】
図1】本実施形態の隠れセミマルコフモデルを例示する概念図である。
図2】本実施形態の機能構成を例示するブロック図である。
図3】本実施形態の第1隠れマルコフモデルの状態を例示する概念図である。
図4】教師ありデータの水増しを説明する概念図である。
図5】教師ありデータの水増しを説明する概念図である。
図6】教師ありデータの水増しを説明する概念図である。
図7】教師ありデータの水増しを説明する概念図である。
図8】本実施形態のハードウェア構成を例示するブロック図である。
図9】行動区間推定モデル構築処理の流れを例示するフローチャートである。
図10】特徴ベクトル抽出処理の流れを例示するフローチャートである。
図11】行動区間推定処理の流れを例示するフローチャートである。
図12】関連技術の行動を説明する概念図である。
図13】関連技術の階層型隠れマルコフモデルを例示する概念図である。
図14】関連技術の概要を例示する概念図である。
図15】本実施形態の概要を例示する概念図である。
【発明を実施するための形態】
【0009】
本実施形態では、人の行動が発生した時間区間を推定する行動区間推定モデルの一例として、図1に例示するような隠れセミマルコフモデル(以下、HSMM(Hidden semi-Markov model)という。)を構築する。HSMMは、隠れマルコフモデル(以下、HMM(Hidden Markov model)という。)のパラメータに加え、状態毎の継続時間の確率分布をパラメータとしてもつ。
【0010】
本実施形態のHSMMは、人の動作の各々を状態とする複数の第1HMMの各々であって、かつ、各々が複数の動作を組み合わせて定まる行動を状態とする第2HMMを含む。m1、m2、m3は動作の一例であり、a1、a2、a3は行動の一例である。行動は、複数の動作の組合せであり、動作は、複数の姿勢の組合せである。
【0011】
パラメータを設定することで構築されたHSMMに人の姿勢を検知することで生成された時系列センサデータが与えられると、HSMMは最適な行動の時間区間(以下、行動区間という。)を推定する。d1、d2、d3は行動区間の一例である。
【0012】
HMMのパラメータには、観測確率及び遷移確率が存在する。O1、…、O8は観測確率の一例であり、遷移確率は状態をつなぐ矢印に対応する確率である。観測確率とは、各状態において、ある特徴が観測される確率であり、遷移確率とは、ある状態から別の状態に遷移する確率である。遷移の順番が定まっている場合は、遷移確率は不要である。なお、動作の数、行動の数、即ち、第1HMMの数は例示であり、図1に例示される数に限定されない。
【0013】
図2は、本実施形態の行動区間推定モデル構築装置10の機能ブロック図の一例である。行動区間推定モデル構築装置10は、観測確率学習部11、遷移確率学習部12、構築部13を有する。観測確率学習部11は、以下に説明するように、教師なしデータで行動区間推定モデルの一例であるHSMMの観測確率を学習する。
【0014】
本実施形態では、ある作業目標を達成するための限定された行動を対象とする。このような行動は、例えば、工場のラインで行われる定型作業での行動であり、以下の性質を有する。
性質1:作業を構成する各行動の違いは、限定された複数の動作の組合せの違いである。
性質2:同じ作業を行う際に観測される複数の姿勢は類似している。
【0015】
本実施形態では、性質1に基づいて、全ての行動が1つの動作群に含まれる動作で構成される。図3に例示するように、動作群には、例えば、3つの動作m11、m12、m13が含まれている。
【0016】
例えば、動作m11は「腕を上げる」、動作m12は「腕を降ろす」、動作m13は「腕を前に伸ばす」であってよい。動作群に含まれる動作の数は図3の例に限定されない。また、各行動に含まれる動作の数も図3の例に限定されない。
【0017】
図3のHMMにおいて、破線矢印に対応する各動作の観測確率は行動には依存しないため、行動区間の教師なしデータで学習することができる。学習は、例えば、機械学習、ニューラルネットワーク、ディープラーニングなどを使用して行う。
【0018】
詳細には、観測確率の教師なし学習に使用するモデルは混合ガウス分布(以下、GMM(Gaussian Mixture Model)という。)であってよい。各観測は動作のうちの1つの動作が確率的に選択され、その動作についてのガウス分布により生成されると仮定する。これは、観測の時系列的な依存関係を使用しない教師あり学習とは異なる仮定である。学習したGMMの各ガウス分布のパラメータを各動作における観測確率の確率分布であるガウス分布に割り当てる。
【0019】
遷移確率学習部12は、以下に説明するように、教師情報をもつ学習データ(以下、教師ありデータという。)で、第1HMMの動作の遷移確率を学習する。教師情報は、姿勢の時系列データに対して各行動が発生している時間区間の正解を与える情報である。学習は、例えば、最尤推定やEMアルゴリズム(Expectation-Maximization algorithm)などを使用して行う(その他の機械学習、ニューラルネットワーク、ディープラーニングなどの方式を使用してもよい)。
【0020】
教師ありデータの生成には、時間及び労力がかかる。したがって、本実施形態では、観測確率学習部11で学習した観測確率を固定し、既存の教師ありデータから遷移確率を学習する。
【0021】
詳細には、図4に例示するように、第1教師ありデータの一例である既存の教師ありデータのデータを種データSDとし、種データSDにノイズを付加し、オーバーサンプリングすることでデータを水増しする。上記性質2によれば、同じ作業の姿勢は類似しているため、ノイズを付加することで、図5に例示するように実際の観測毎のばらつきに類似したばらつきをもつデータを生成することができる。ノイズは、例えば、ランダムノイズであってよい。
【0022】
種データSDの教師情報TIを、水増ししたデータの各々に共通に適用することで教師ありデータを水増しする。第2教師ありデータの一例である水増しした教師ありデータを使用して、第1HMMの複数の動作の遷移確率を教師あり学習で学習する。
【0023】
オーバーサンプリングでは、各時刻の観測サンプルに所定の範囲のノイズを生成して付加する。ノイズを生成する際に、当該観測サンプルを生成した確率が高い動作を特定し、当該動作のサンプル群と別の動作のサンプル群との特徴空間内での広がり方の関係を考慮して適切な大きさのノイズを生成して付加する。これにより、より適切な教師ありデータを生成することができる。
【0024】
例えば、特定した動作のサンプル群の共分散の定数倍の共分散の多変量ガウス分布から生成したノイズを付加してもよい。また、特定した動作のサンプル群から最も中心距離が近い動作のサンプル群までの中心距離dを算出し、特徴空間の各軸方向の標準偏差がdの定数倍となる等方性のガウス分布(共分散行列が対角行列である)から生成したノイズを付加してもよい。
【0025】
各動作のサンプル群に含まれるサンプルの散らばり、即ち、特徴空間内での広がりには差がある。即ち、散らばりが非常に小さい動作もあるし、非常に大きい動作もある。全ての動作について一律の範囲のランダムノイズを使用した場合、ある動作のサンプル群が散らばりの大きいサンプルを含むと、ランダムノイズによるばらつかせ方が相対的に小さい。一方、ある動作のサンプル群が散らばりの小さいサンプルを含むと、ランダムノイズによるばらつかせ方が相対的に大きい
【0026】
図6は、動作m31、動作m32、及び動作m33のサンプル群を例示する。図7は、動作m32のサンプル群にランダムノイズを付加した状態を例示する。図7では、ランダムノイズの範囲が大きいため、元の動作m32から離れているサンプルが多い。このような場合にも、上記したように、ある動作のサンプル群と別の動作のサンプル群との特徴空間内での広がり方の関係を考慮して適切な大きさのノイズを付加することで、より適切な教師ありデータを水増しすることができる。
【0027】
構築部13は、観測確率学習部11で学習した観測確率、及び遷移確率学習部12で学習した状態遷移確率を使用して、図1に例示するようなHSMMを構築する。O1、O2、…、O8は、観測確率学習部11で学習した観測確率を表し、行動a1、a2、a3の各々に含まれる動作m1、m2、及びm3間の矢印は、遷移確率学習部12で学習した状態遷移確率に対応する。d1、d2、d3は、各行動の継続時間を表し、継続時間の確率分布は、教師情報の行動の継続時間から決定される。例えば、継続時間の確率分布は、一定範囲の一様分布であってよい。構築したHSMMに、センサで人の姿勢を検知して生成したセンサデータを適用して、各行動の時間区間である行動区間を推定する。推定についての詳細は、後述する。
【0028】
本実施形態の行動区間推定モデル構築装置10は、以下の特徴を有する。
1.第1HMMの全行動で共通な動作の観測確率は教師なし学習で学習する。
2.第1HMMの動作間の遷移確率は、教師あり種データから水増しした教師ありデータを使用して、教師あり学習で学習する。
【0029】
行動区間推定モデル構築装置10は、一例として、図8に示すように、CPU(Central Processing Unit)51、一次記憶装置52、二次記憶装置53、及び、外部インターフェイス54を含む。CPU51は、ハードウェアであるプロセッサの一例である。CPU51、一次記憶装置52、二次記憶装置53、及び、外部インターフェイス54は、バス59を介して相互に接続されている。CPU51は、単一のプロセッサであってもよいし、複数のプロセッサであってもよい。また、CPU51に代えて、例えば、GPU(Graphics Processing Unit)が使用されてもよい。
【0030】
一次記憶装置52は、例えば、RAM(Random Access Memory)などの揮発性のメモリである。二次記憶装置53は、例えば、HDD(Hard Disk Drive)、又はSSD(Solid State Drive)などの不揮発性のメモリである。
【0031】
二次記憶装置53は、プログラム格納領域53A及びデータ格納領域53Bを含む。プログラム格納領域53Aは、一例として、行動区間推定モデル構築プログラムなどのプログラムを記憶している。データ格納領域53Bは、一例として、教師ありデータ、教師なしデータ、学習した観測確率、及び遷移確率などを記憶する。
【0032】
CPU51は、プログラム格納領域53Aから行動区間推定モデル構築プログラムを読み出して一次記憶装置52に展開する。CPU51は、行動区間推定モデル構築プログラムをロードして実行することで、図2の観測確率学習部11、遷移確率学習部12、及び、構築部13として動作する。
【0033】
なお、行動区間推定モデル構築プログラムなどのプログラムは、外部サーバに記憶され、ネットワークを介して、一次記憶装置52に展開されてもよい。また、行動区間推定モデル生成プログラムなどのプログラムは、DVD(Digital Versatile Disc)などの非一時的記録媒体に記憶され、記録媒体読込装置を介して、一次記憶装置52に展開されてもよい。
【0034】
外部インターフェイス54には外部装置が接続され、外部インターフェイス54は、外部装置とCPU51との間の各種情報の送受信を司る。図8では、外部インターフェイス54に、ディスプレイ55A及び外部記憶装置55Bが接続されている例を示している。外部記憶装置55Bには、例えば、教師ありデータ、教師なしデータ、及び、構築したHSMMなどを記憶する。ディスプレイ55Aは、例えば、構築したHSMMモデルを視認可能に表示する。
【0035】
行動区間推定モデル構築装置10は、例えば、パーソナルコンピュータ、サーバ、及び、クラウド上のコンピュータなどであってよい。
【0036】
図9に、行動区間推定モデル構築処理の流れを例示する。CPU51は、ステップ101で、後述するように、学習データから人の姿勢の連鎖である運動を表す特徴ベクトルを抽出する。CPU51は、ステップ102で、ステップ101で抽出した特徴ベクトルのクラスタリング(GMMのパラメータ推定)により、要素となる動作に分類し、各動作の観測確率を教師なし学習で学習する。
【0037】
CPU51は、ステップ103で、教師あり種データにノイズを付加し、オーバーサンプリングして生成したデータに教師あり種データの教師情報を付与することで、教師ありデータを水増しする。CPU51は、ステップ104で、教師ありデータについて、教師情報で与えられた各行動の時間区間毎に特徴ベクトルを振り分ける。
【0038】
CPU51は、ステップ105で、ステップ104で振り分けた時間区間内の特徴ベクトルの系列を観測データとして、ステップ103で水増しした教師ありデータを使用し、第1HMMの動作の遷移確率を教師あり学習で学習する。
【0039】
CPU51は、ステップ106で、各行動の継続時間の確率分布として、教師情報で与えられた各行動の継続時間に対して所定の範囲の一様分布を設定する。CPU51は、ステップ102で学習した観測確率及びステップ105で学習した遷移確率を使用して、HSMMを構築する。ステップ106の設定で一定時間継続後に教師情報で与えられた各行動の順番に第2HMMの行動が遷移するHSMMを構築する。構築したHSMMは、例えば、データ格納領域53Bに格納されてもよい。
【0040】
図10は、図9のステップ101の特徴ベクトル抽出処理の詳細を例示する。CPU51は、ステップ151で、学習に使用するデータから人を検出し、追跡することで、人の姿勢情報を取得する。CPU51は、ステップ152で、ステップ151で取得した姿勢情報が複数人の姿勢情報を含む場合、姿勢情報の時系列データから分析対象とする姿勢情報の時系列データを取得する。分析対象とする姿勢情報は、人を囲むバウンディングボックスの大きさ、及び時間などから選択する。
【0041】
CPU51は、ステップ153で、ステップ152で取得した姿勢情報の時系列データから身体の各部位についての運動情報の時系列データを取得する。運動情報の時系列とは、例えば、各部位の曲げの程度、曲げの速度などであってよい。各部位とは、例えば、肘、膝などであってよい。
【0042】
CPU51は、ステップ154で、スライディングタイムウィンドウにより一定の時間間隔毎にウィンドウ内のステップ153の運動情報を時間方向で平均化して特徴ベクトルを算出する。
【0043】
図11に、本実施形態で構築したHSMMを使用した行動区間推定処理の流れを例示する。図8の行動区間推定モデル構築装置10は、構築したHSMMをデータ格納領域53Bに格納することで行動区間推定装置として機能してもよい。
【0044】
CPU51は、ステップ201で、センサで人の姿勢を検知することにより生成されたセンサデータから特徴ベクトルを抽出する。センサは、人の姿勢を検知するデバイスであり、例えば、カメラ、赤外線センサ、モーションキャプチャデバイスなどであってよい。図11のステップ201は、図10のステップ101と同様であるため、詳細な説明は省略する。
【0045】
CPU51は、ステップ202で、ステップ201で抽出した特徴ベクトルの系列を観測データとして、行動区間推定モデル構築処理で構築したHSMMと照合して各行動状態の継続時間を推定する。CPU51は、ステップ203で、ステップ202で推定した各行動状態の継続時間から各行動の時間区間を推定する。
【0046】
例えば、映像を入力として、映像における特定の行動を認識するような技術では、基本動作認識、要素行動認識、及び上位行動認識を行う。映像における特定の行動とは、要素行動の組合せで、さらに複雑な上位行動であり、基本動作認識とは、フレーム毎の姿勢認識であり、要素行動認識とは、時間的空間的認識を行い、ある程度の時間長における単純行動を認識することである。上位行動認識とは、ある程度の時間長における複雑行動の認識である。当該技術において、本実施形態の行動区間推定モデル構築処理及び構築した行動区間推定モデルを適用し、行動区間を推定することができる。
【0047】
関連技術では、行動に含まれる動作が特に限定されないHSMMが使用され得る。当該関連技術では、図12に例示するように、例えば、以下の動作が存在すると仮定する。
(1)腕を上げる、(2)腕を降ろす、(3)腕を前に伸ばす、(4)両手を身体の前で近づける、(5)前に移動する、(6)横に移動する、(7)しゃがむ、(8)立つ
【0048】
行動の例は、例えば、以下の通りである。
行動a31:(1)腕を上げる→(3)腕を前に伸ばす→(1)腕を上げる→(4)両手を身体の前で近づける→(7)しゃがむ、
行動a32:(7)しゃがむ→(4)両手を身体の前で近づける→(8)立つ→(5)前に移動する→(3)腕を前に伸ばす、など
【0049】
上記のように、一般的な行動の動作、即ち、推定する行動が制限されない複数の動作をHMMが含む場合、動作の観測確率を1つの単純な確率分布で表すことは困難である。この問題に対処するために、階層型隠れマルコフモデルを使用する技術が存在する。階層型隠れマルコフモデルは、図13に例示するように、上位階層HMMが複数の下位階層HMMを状態として含む。行動a51、a52、及びa53は、下位階層HMMの例である。下位階層HMMの各々は、動作を状態として含み、m51、m52、m53、m61、m62、m63、m71、m72、及びm73は、動作の例である。
【0050】
階層型HMMでは、図14に例示するように、教師情報TILをもつ学習データLDを使用して、各行動の動作の観測確率及び遷移確率を教師あり学習で学習する。図14では、行動a51の観測確率p11、遷移確率p21、行動a52の観測確率p12、遷移確率p22、行動a53の観測確率p13、遷移確率p23を例示する。しかしながら、階層型HMMでは、パラメータの数が多く、パラメータの自由度が高いため、パラメータの学習のために教師ありデータを多数使用する。教師ありデータの教師情報を作成するには、時間及び労力を要する。
【0051】
一方、本開示では、図15に例示するように、HSMMの行動に対応する第1HMMの各々で共通の観測確率p1は教師なしデータLDNを使用して教師なし学習で学習する。学習した観測確率p1を固定して、第1HMMの各々の動作の遷移確率p21D、p22D、p23Dを教師ありデータを使用して教師あり学習で学習する。本開示では、既存の教師ありデータLDDにノイズを付加しオーバーサンプリングし生成したデータに、教師ありデータLDDの教師情報TILを付加することで、教師ありデータを水増しして教師あり学習に使用する。したがって、本実施形態では、既存の教師ありデータが少ない場合でも、行動区間推定モデルを効率的に構築することができる。
【0052】
本実施形態では、隠れセミマルコフモデルは、人の動作の種類を状態とする複数の第1隠れマルコフモデルの各々であって、かつ、複数の動作を組み合わせて定まる行動を状態とする第2隠れマルコフモデルを含む。隠れセミマルコフモデルにおいて、複数の第1隠れマルコフモデルの動作の種類ごとの観測確率を教師なし学習で学習する。学習した観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、第1隠れマルコフモデルの動作の遷移確率を第2教師ありデータを使用した教師あり学習で学習する。学習した観測確率及び遷移確率を使用して行動の区間を推定するモデルである隠れセミマルコフモデルを構築する。
【0053】
本開示によれば、行動区間推定モデルを効率的に構築することができる。即ち、例えば、工場での定型作業のように決まった順序で動作を行う複数の行動について、発生する順序に制約があるという条件の下で各行動の時間区間を正確に推定することができる。
【0054】
以上の各実施形態に関し、更に以下の付記を開示する。
(付記1)
人の動作の種類を状態とする複数の第1隠れマルコフモデルの各々であって、かつ、複数の前記動作を組み合わせて定まる行動を状態とする第2隠れマルコフモデルを含む隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習する観測確率学習部と、
前記観測確率学習部にて学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習する遷移確率学習部と、
前記観測確率学習部で学習した前記観測確率及び前記遷移確率学習部で学習した前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する構築部と、
を含む行動区間推定モデル構築装置。
(付記2)
前記遷移確率学習部は、前記第1教師ありデータにノイズを付加してオーバーサンプリングすることで生成したデータの各々に前記第1教師ありデータの教師情報を付加することで水増しをする、
付記1の行動区間推定モデル構築装置。
(付記3)
前記ノイズはランダムノイズである、
付記2の行動区間推定モデル構築装置。
(付記4)
前記ノイズは、前記複数の動作のサンプルの散らばりが大きいほど大きくばらつくノイズである、
付記2の行動区間推定モデル構築装置。
(付記5)
コンピュータが、
人の動作の種類を状態とする複数の第1隠れマルコフモデルの各々であって、かつ、複数の前記動作を組み合わせて定まる行動を状態とする第2隠れマルコフモデルを含む隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習し、
学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習し、
学習した前記観測確率及び前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する、
行動区間推定モデル構築方法。
(付記6)
前記第1教師ありデータにノイズを付加してオーバーサンプリングすることで生成したデータの各々に前記第1教師ありデータの教師情報を付加することで水増しをする、
付記5の行動区間推定モデル構築方法。
(付記7)
前記ノイズはランダムノイズである、
付記6の行動区間推定モデル構築方法。
(付記8)
前記ノイズは、前記複数の動作のサンプルの散らばりが大きいほど大きくばらつくノイズである、
付記6の行動区間推定モデル構築方法。
(付記9)
人の動作の種類を状態とする複数の第1隠れマルコフモデルの各々であって、かつ、複数の前記動作を組み合わせて定まる行動を状態とする第2隠れマルコフモデルを含む隠れセミマルコフモデルにおいて、前記複数の第1隠れマルコフモデルの前記動作の種類ごとの観測確率を教師なし学習で学習し、
学習した前記観測確率を固定し、入力された第1教師ありデータを水増しすることで第2教師ありデータとし、前記第1隠れマルコフモデルの前記動作の遷移確率を前記第2教師ありデータを使用した教師あり学習で学習し、
学習した前記観測確率及び前記遷移確率を使用して前記行動の区間を推定するモデルである前記隠れセミマルコフモデルを構築する、
処理をコンピュータに実行させる行動区間推定モデル構築プログラム。
(付記10)
前記第1教師ありデータにノイズを付加してオーバーサンプリングすることで生成したデータの各々に前記第1教師ありデータの教師情報を付加することで水増しをする、
付記9の行動区間推定モデル構築プログラム。
(付記11)
前記ノイズはランダムノイズである、
付記10の行動区間推定モデル構築プログラム。
(付記12)
前記ノイズは、前記複数の動作のサンプルの散らばりが大きいほど大きくばらつくノイズである、
付記10の行動区間推定モデル構築プログラム。
【符号の説明】
【0055】
10 行動区間推定モデル構築装置
11 観測確率学習部
12 遷移確率学習部
13 構築部
51 CPU
52 一次記憶装置
53 二次記憶装置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15