特許7602230 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 国立大学法人京都大学の特許一覧

特許7602230人物特徴抽出器学習装置、人物予測装置、学習方法、動作識別学習装置、動作識別装置、プログラム及び情報システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-12-10

(45)【発行日】2024-12-18

(54)【発明の名称】人物特徴抽出器学習装置、人物予測装置、学習方法、動作識別学習装置、動作識別装置、プログラム及び情報システム

(51)【国際特許分類】

G06N 3/0895 20230101AFI20241211BHJP

G06N 20/00 20190101ALI20241211BHJP

G06T 7/20 20170101ALI20241211BHJP

G06V 10/77 20220101ALI20241211BHJP

G06V 40/20 20220101ALI20241211BHJP

【ＦＩ】

G06N3/0895

G06N20/00

G06T7/20 300Z

G06V10/77

G06V40/20

【請求項の数】 13

(21)【出願番号】P 2021101780

(22)【出願日】2021-06-18

(65)【公開番号】P2023000773

(43)【公開日】2023-01-04

【審査請求日】2023-09-27

(73)【特許権者】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(73)【特許権者】

【識別番号】504132272

【氏名又は名称】国立大学法人京都大学

(74)【代理人】

【識別番号】110001634

【氏名又は名称】弁理士法人志賀国際特許事務所

(72)【発明者】

【氏名】三鼓悠

(72)【発明者】

【氏名】入江豪

(72)【発明者】

【氏名】木村昭悟

(72)【発明者】

【氏名】中澤篤志

(72)【発明者】

【氏名】鈴木乃依瑠

【審査官】多賀実

(56)【参考文献】

【文献】特開２０１９－０７４９４５（ＪＰ，Ａ）

【文献】特開２０２０－０６４５６８（ＪＰ，Ａ）

【文献】特開２０２０－０１６９３５（ＪＰ，Ａ）

【文献】齋藤光明、藤波香織，アンサンブル型ＮｏｖｅｌｔｙＤｅｔｅｃｔｉｏｎによる未知の携帯機器所持位置の検出，情報処理学会研究報告ユビキタスコンピューティングシステム（ＵＢＩ）２０１９－ＵＢＩ－０６２，日本，情報処理学会，2019年06月06日， pp 1-8

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／０８９５

Ｇ０６Ｎ２０／００

Ｇ０６Ｔ７／２０

Ｇ０６Ｖ１０／７７

Ｇ０６Ｖ４０／２０

(57)【特許請求の範囲】

【請求項1】

動作の時系列を記録したデータである動作データを入力として受け取ると、前記動作データに対して、動作を識別する情報を喪失させる処理を施すことで前処理済み動作データを生成する前処理部と、
前記動作データと、前記前処理済み動作データと、から第一の特徴量を抽出する人物特徴抽出器と、
一組の前記第一の特徴量が入力されたとき、前記一組の第一の特徴量が同一の動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が高いほど値が小さく、前記一組の第一の特徴量が互いに異なる動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が低いほど値が小さくなる対比損失評価値を出力する対比損失評価部と、
前記対比損失評価値が小さくなるように前記人物特徴抽出器のパラメータの学習を行う学習部と、
を備える人物特徴抽出器学習装置。

【請求項2】

前記前処理部が、動作データを入力として受け取ると、時系列についての平均を取得する、または時系列の順序に無作為化したものを取得する、または部分時系列を取得することによって前記前処理済み動作データを生成する請求項１に記載の人物特徴抽出器学習装置。

【請求項3】

動作の時系列を記録したデータである動作データを入力として受け取ると、前記動作データに対して、動作を識別する情報を喪失させる処理を施すことで前処理済み動作データを生成し、前記動作データと、前記前処理済み動作データと、から第一の特徴量を抽出し、一組の前記第一の特徴量が入力されたとき、前記一組の第一の特徴量が同一の動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が高いほど値が小さく、前記一組の第一の特徴量が互いに異なる動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が低いほど値が小さくなる対比損失評価値が小さくなるように学習されたパラメータを用いて、入力された動作データの人物を識別する情報だけを捉えた特徴を使って、入力された動作データの第一の特徴量を出力する人物特徴抽出器と、
前記第一の特徴量に基づき、前記動作データの人物を予測する人物予測器と、
を備える人物予測装置。

【請求項4】

動作の時系列を記録したデータである動作データを入力として受け取ると、前記動作データに対して、動作を識別する情報を喪失させる処理を施すことで前処理済み動作データを生成する前処理ステップと、
前記動作データと、前記前処理済み動作データと、に基づき、人物特徴抽出器が第一の特徴量を抽出する人物特徴抽出ステップと、
一組の前記第一の特徴量が入力されたとき、前記一組の第一の特徴量が同一の動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が高いほど値が小さくなり、前記一組の第一の特徴量が互いに異なる動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が低いほど値が小さくなる対比損失評価値を出力する評価ステップと、
前記対比損失評価値が小さくなるように、前記人物特徴抽出器のパラメータの学習を行う学習ステップと、
を有する学習方法。

【請求項5】

動作の時系列を記録したデータである動作データを入力として受け取ると、前記動作データから第二の特徴量を抽出する動作特徴抽出器と、
前記第二の特徴量に基づいて、一つ以上の動作クラスへの推定帰属確率を示す推定動作クラス帰属確率を求める動作クラス識別器と、
前記第二の特徴量に基づいて、一つ以上の人物クラスへの推定帰属確率を示す推定人物クラス帰属確率を求める人物クラス識別器と、
前記推定動作クラス帰属確率と、所与の教師動作クラス帰属確率との類似度が高いほど小さい値となる動作クラス識別損失評価値を求める動作クラス識別損失評価部と、
前記推定人物クラス帰属確率と、請求項３に記載の人物予測装置によって得られる人物予測結果に基づく教師人物クラス帰属確率との類似度が高いほど小さい値となる人物クラス識別損失評価値を求める人物クラス識別損失評価部と、
前記動作特徴抽出器は、前記動作クラス識別損失評価値を小さく、かつ、前記人物クラス識別損失評価値を大きくするように、前記動作クラス識別器は、前記動作クラス識別損失評価値を小さくするように、前記人物クラス識別器は、前記人物クラス識別損失評価値を小さくするように、それぞれ前記動作特徴抽出器、前記動作クラス識別器、前記人物クラス識別器の各パラメータの学習を行う学習部と、
を備える動作識別学習装置。

【請求項6】

前記動作クラス識別器は、前記学習部における反復学習の回数が所定回数以下である場合には、前記動作クラス識別器から取得する動作クラス帰属確率に基づき、未知動作クラスの判断をする、請求項５に記載の動作識別学習装置。

【請求項7】

前記動作クラス識別器は、前記学習部における反復学習の回数が所定回数より多い場合には、未知動作クラスの帰属確率をさらに取得し、
前記動作クラス識別損失評価部は、教師ラベルが付与されていないデータと、過去の動作識別結果と、前記未知動作クラスの帰属確率と、を用いて、前記過去の動作識別結果と、前記未知動作クラスの帰属確率との類似度が高いほど小さい値を示す動作識別損失評価値をさらに取得する、請求項５又は６に記載の動作識別学習装置。

【請求項8】

請求項５から７のいずれか一項に記載の動作識別学習装置によって得られたパラメータに基づいて、入力されたデータの人物を識別する情報を除きながら、動作を識別する情報だけを捉えた特徴を使って第二の特徴量を出力する動作特徴抽出器と、
前記動作識別学習装置によって得られたパラメータと前記第二の特徴量とに基づいて、前記データについて人物を識別する情報を除きながら、動作を識別する情報だけを捉えた特徴を使って前記データの既知動作クラスおよび未知動作クラスへの帰属確率を取得する動作クラス識別器と、
を備える動作識別装置。

【請求項9】

動作の時系列を記録したデータである動作データを入力として受け取ると、動作特徴抽出器が、前記動作データの第二の特徴量を出力する特徴抽出ステップと、
動作クラス識別器が、前記第二の特徴量に基づいて、前記動作データについて、一つ以上の動作クラスへの推定帰属確率を示す推定動作クラス帰属確率を求める動作クラス識別ステップと、
人物クラス識別器が、前記第二の特徴量に基づいて、前記動作データについて、一つ以上の人物クラスへの推定帰属確率を示す推定人物クラス帰属確率を求める人物クラス識別ステップと、
前記動作データに対して、前記推定動作クラス帰属確率と、所与の教師動作クラス帰属確率との類似度が高いほど小さいとなる動作クラス識別損失評価値を求める動作クラス識別損失評価ステップと、
前記動作データに対して、前記推定人物クラス帰属確率と、請求項３に記載の人物予測装置によって得られる人物予測結果に基づく教師人物クラス帰属確率との類似度が高いほど、小さい値となる人物クラス識別損失評価値を求める人物クラス識別損失評価ステップと、
前記動作クラス識別損失評価値及び前記人物クラス識別損失評価値について、前記動作特徴抽出器は前記動作クラス識別損失評価値を小さく、前記人物クラス識別損失評価値を大きくするように、前記動作クラス識別器は前記動作クラス識別損失評価値を小さく、前記人物クラス識別器は前記人物クラス識別損失評価値を小さくするように、それぞれ前記動作特徴抽出器、前記動作クラス識別器、前記人物クラス識別器の各パラメータの学習を行う学習ステップと、
を有する学習方法。

【請求項10】

請求項１又は請求項２に記載の人物特徴抽出器学習装置又は請求項５から請求項７のいずれか一項に記載の動作識別学習装置としてコンピューターを機能させるためのプログラム。

【請求項11】

人物特徴抽出器学習装置及び人物予測装置を含む情報システムであって、
前記人物特徴抽出器学習装置は、
動作の時系列を記録したデータである動作データを入力として受け取ると、前記動作データに対して、動作を識別する情報を喪失させる処理を施すことで前処理済み動作データを生成する前処理部と、
前記動作データと、前記前処理済み動作データと、から第一の特徴量を抽出する人物特徴抽出器と、
一組の前記第一の特徴量が入力されたとき、前記一組の第一の特徴量が同一の動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が高いほど値が小さく、前記一組の第一の特徴量が互いに異なる動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が低いほど値が小さくなる対比損失評価値を出力する対比損失評価部と、
前記対比損失評価値が小さくなるように前記人物特徴抽出器のパラメータの学習を行う学習部と、
を備え、
前記人物予測装置は、
動作データを入力として受け取ると、請求項１又は請求項２に記載の人物特徴抽出器学習装置によって得られたパラメータに基づいて、前記動作データの第一の特徴量を出力する人物特徴抽出器と、
前記第一の特徴量に基づき、前記動作データの人物を予測する人物予測器と、
を備える、情報システム。

【請求項12】

動作識別学習装置をさらに備え、
前記動作識別学習装置は、
動作の時系列を記録したデータである動作データを入力として受け取ると、前記動作データから第二の特徴量を抽出する動作特徴抽出器と、
前記第二の特徴量に基づいて、一つ以上の動作クラスへの推定帰属確率を示す推定動作クラス帰属確率を求める動作クラス識別器と、
前記第二の特徴量に基づいて、一つ以上の人物クラスへの推定帰属確率を示す推定人物クラス帰属確率を求める人物クラス識別器と、
前記推定動作クラス帰属確率と、所与の教師動作クラス帰属確率との類似度が高いほど小さい値となる動作クラス識別損失評価値を求める動作クラス識別損失評価部と、
前記推定人物クラス帰属確率と、前記人物予測装置によって得られる人物予測結果に基づく教師人物クラス帰属確率との類似度が高いほど小さい値となる人物クラス識別損失評価値を求める人物クラス識別損失評価部と、
前記動作特徴抽出器は、前記動作クラス識別損失評価値を小さく、かつ、前記人物クラス識別損失評価値を大きくするように、前記動作クラス識別器は、前記動作クラス識別損失評価値を小さくするように、前記人物クラス識別器は、前記人物クラス識別損失評価値を小さくするように、それぞれ前記動作特徴抽出器、前記動作クラス識別器、前記人物クラス識別器の各パラメータの学習を行う学習部と、
を備える、請求項１１に記載の情報システム。

【請求項13】

動作識別装置をさらに備え、
前記動作識別装置は、
前記動作識別学習装置によって得られたパラメータに基づいて、入力されたデータの第二の特徴量を出力する動作特徴抽出器と、
前記動作識別学習装置によって得られたパラメータと前記第二の特徴量とに基づいて、前記データについて既知動作クラスおよび未知動作クラスへの帰属確率を取得する動作クラス識別器と、
を備える、請求項１２に記載の情報システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、人物特徴抽出器学習装置、人物予測装置、学習方法、動作識別学習装置、動作識別装置及びプログラムに関する。

【背景技術】

【0002】

近年、モーションキャプチャー装置やウェアラブルデバイスなどのセンサ機器の普及や、画像認識技術の向上に伴って、人物の動作をセンシングすることが容易になってきた。センシングによって得られる動作データの一例として、ウェアラブルデバイスやスマートフォンに搭載された加速度センサで記録されたデータ、カメラ映像中の人物の姿勢データなどがあげられる。これらのデータを用いて人物の動作を認識することができる。このような認識処理は、人物認証やライフログアプリケーション、自動監視システムなどの様々なサービスに応用することが可能である。

【0003】

センシングされたデータを用いた人物の動作認識は、機械学習を用いた予測モデルにより実現されることが多い。この場合の問題として、学習に用いた人物以外のデータに対する動作認識精度が低くなる点が挙げられる。これは、各人物の動作には個性があるためである。例えば、歩くという動作を考えてみても、歩く速さや腕の振りの大きさ等において多様性があり、別の人物で訓練した予測モデルでは動作の認識精度が低下してしまうためである。

【0004】

このような問題を解決すべく、種々の技術が開示されている。例えば、非特許文献１には、対象人物のデータを用いて予測モデルを訓練する方法が開示されている。また、特許文献１には、蓄積された多数の人物の動作データの中で、対象人物に類似する人物を検出し、その人物の動作データを用いて予測モデルを訓練する方法が開示されている。さらに、非特許文献２及び非特許文献３には、能動学習や転移学習などを用いて、予測モデルを、学習事例に含まれる人物以外に対して適応させる方法が開示されている。

【先行技術文献】

【特許文献】

【0005】

【文献】特開２０１２―２４８０１７号公報

【非特許文献】

【0006】

【文献】Gary Mitchell Weiss and Jeffrey Lockhart. 2012. The impact of personalization on smartphone-based activity recognition. In Workshopsat the Twenty-Sixth AAAI Conference on Artificial Intelligence.

【文献】R. Fallahzadeh and H. Ghasemzadeh. 2017. Personalization without User Interruption: Boosting Activity Recognition in New Subjects Using Unlabeled Data. In 2017 ACM/IEEE 8th International Conference on Cyber-Physical Systems (ICCPS). 293-302.

【文献】Seyed Ali Rokni, Marjan Nourollahi, and Hassan Ghasemzadeh. 2018. Personalized Human Activity Recognition Using Convolutional Neural Networks. In Thirty-Second AAAI Conference on Artificial Intelligence.

【発明の概要】

【発明が解決しようとする課題】

【0007】

高精度な動作認識を実現するために、上記様々な技術が提案されてきたが、これらの技術には、活用するための訓練データセットを作成するコストが非常に大きいという問題が存在する。

【0008】

まず、非特許文献１、非特許文献２、非特許文献３に記載の方法では、対象人物からデータを取得し、さらに各データがどの行動に該当するのかを表すラベルを付与する必要がある。加えて、特定の人物で訓練したモデルは、他の人物には汎化しないため、対象人物が変わる場合は再度データの取得及びラベリングが必要になる。

【0009】

また、特許文献１に記載の、多数の人物の動作データの中から類似する人物のデータを用いる方法についても、各人物について認識したい全ての動作のデータとラベルを取得する必要があり、非常にコストがかかる。

【0010】

さらに、訓練データの作成に際して、プライバシー等の問題によって、各動作データがどの人物のものなのかを表す人物ラベルが得られない場合も存在する。このような場合、上記いずれの技術も人物が特定できることを前提とした技術構成となっているため、利用することができないという問題が存在する。

【0011】

以上概観した通り、プライバシーの問題等を考慮した現実的な条件下で、訓練データ作成コストを抑えつつ人物動作認識を実現する技術は提案されていないのが実情である。

【0012】

上記の事情を鑑み、本発明は、人物動作認識を実現するための理想的なデータセットが得られない場合においても、多様な人物に汎化するような動作認識モデルを学習することが可能な技術を提供することを目的としている。

【課題を解決するための手段】

【0013】

本発明の一態様は、動作の時系列を記録したデータである動作データを入力として受け取ると、前記動作データに対して、動作を識別する情報を喪失させる処理を施すことで前処理済み動作データを生成する前処理部と、前記動作データと、前記前処理済み動作データと、から第一の特徴量を抽出する人物特徴抽出器と、一組の前記第一の特徴量が入力されたとき、前記一組の第一の特徴量が同一の動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が高いほど値が小さく、前記一組の第一の特徴量が互いに異なる動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が低いほど値が小さくなる対比損失評価値を出力する対比損失評価部と、前記対比損失評価値が小さくなるように前記人物特徴抽出器のパラメータの学習を行う学習部と、を備える人物特徴抽出器学習装置である。

【0014】

本発明の一態様は、動作データを入力として受け取ると、上記の人物特徴抽出器学習装置によって得られたパラメータに基づいて、前記動作データの第一の特徴量を出力する人物特徴抽出器と、前記第一の特徴量に基づき、前記動作データの人物を予測する人物予測器と、を備える人物予測装置である。

【0015】

本発明の一態様は、動作の時系列を記録したデータである動作データを入力として受け取ると、前記動作データに対して、動作を識別する情報を喪失させる処理を施すことで前処理済み動作データを生成する前処理ステップと、前記動作データと、前記前処理済み動作データと、に基づき、人物特徴抽出器が第一の特徴量を抽出する人物特徴抽出ステップと、一組の前記第一の特徴量が入力されたとき、前記一組の第一の特徴量が同一の動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が高いほど値が小さくなり、前記一組の第一の特徴量が互いに異なる動作データから抽出されたものである場合には、前記一組の第一の特徴量の類似度が低いほど値が小さくなる対比損失評価値を出力する評価ステップと、前記対比損失評価値が小さくなるように、前記人物特徴抽出器のパラメータの学習を行う学習ステップと、を有する学習方法である。

【0016】

本発明の一態様は、動作の時系列を記録したデータである動作データを入力として受け取ると、前記動作データから第二の特徴量を抽出する動作特徴抽出器と、前記第二の特徴量に基づいて、一つ以上の動作クラスへの推定帰属確率を示す推定動作クラス帰属確率を求める動作クラス識別器と、前記第二の特徴量に基づいて、一つ以上の人物クラスへの推定帰属確率を示す推定人物クラス帰属確率を求める人物クラス識別器と、前記推定動作クラス帰属確率と、所与の教師動作クラス帰属確率との類似度が高いほど小さい値となる動作クラス識別損失評価値を求める動作クラス識別損失評価部と、前記推定人物クラス帰属確率と、上記の人物予測装置によって得られる人物予測結果に基づく教師人物クラス帰属確率との類似度が高いほど小さい値となる人物クラス識別損失評価値を求める人物クラス識別損失評価部と、前記動作特徴抽出器は、前記動作クラス識別損失評価値を小さく、かつ、前記人物クラス識別損失評価値を大きくするように、前記動作クラス識別器は、前記動作クラス識別損失評価値を小さくするように、前記人物クラス識別器は、前記人物クラス識別損失評価値を小さくするように、それぞれ前記動作特徴抽出器、前記動作クラス識別器、前記人物クラス識別器の各パラメータの学習を行う学習部と、を備える動作識別学習装置である。

【0017】

本発明の一態様は、上記の動作識別学習装置によって得られたパラメータに基づいて、入力されたデータの第二の特徴量を出力する動作特徴抽出器と、前記動作識別学習装置によって得られたパラメータと前記第二の特徴量とに基づいて、前記データについて既知動作クラスおよび未知動作クラスへの帰属確率を取得する動作クラス識別器と、を備える動作識別装置である。

【0018】

本発明の一態様は、動作の時系列を記録したデータである動作データを入力として受け取ると、動作特徴抽出器が、前記動作データの第二の特徴量を出力する特徴抽出ステップと、動作クラス識別器が、前記第二の特徴量に基づいて、前記動作データについて、一つ以上の動作クラスへの推定帰属確率を示す推定動作クラス帰属確率を求める動作クラス識別ステップと、人物クラス識別器が、前記第二の特徴量に基づいて、前記動作データについて、一つ以上の人物クラスへの推定帰属確率を示す推定人物クラス帰属確率を求める人物クラス識別ステップと、前記動作データに対して、前記推定動作クラス帰属確率と、所与の教師動作クラス帰属確率との類似度が高いほど小さいとなる動作クラス識別損失評価値を求める動作クラス識別損失評価ステップと、前記動作データに対して、前記推定人物クラス帰属確率と、請求項３に記載の人物予測装置によって得られる人物予測結果に基づく教師人物クラス帰属確率との類似度が高いほど、小さい値となる人物クラス識別損失評価値を求める人物クラス識別損失評価ステップと、前記動作クラス識別損失評価値及び前記人物クラス識別損失評価値について、前記動作特徴抽出器は前記動作クラス識別損失評価値を小さく、前記人物クラス識別損失評価値を大きくするように、前記動作クラス識別器は前記動作クラス識別損失評価値を小さく、前記人物クラス識別器は前記人物クラス識別損失評価値を小さくするように、それぞれ前記動作特徴抽出器、前記動作クラス識別器、前記人物クラス識別器の各パラメータの学習を行う学習ステップと、を有する学習方法である。

【0019】

本発明の一態様は、上記の人物特徴抽出器学習装置又は上記の動作識別学習装置としてコンピューターを機能させるためのプログラムである。

【発明の効果】

【0020】

本発明により、人物動作認識を実現するための理想的なデータセットが得られない場合においても、多様な人物に汎化するような動作認識モデルを学習することが可能となる。

【図面の簡単な説明】

【0021】

【図1】本実施形態にかかる人物特徴抽出器学習装置１００の一例を示す機能ブロック図である。

【図2】本実施形態にかかる人物予測装置２００の一例を表す機能ブロック図である。

【図3】本実施形態にかかる動作識別学習装置３００の一例を示す機能ブロック図である。

【図4】本実施形態に係る動作識別装置４００の一例を示す機能ブロック図である。

【図5】人物特徴抽出器学習装置１００の動作例を示すフローチャートである。

【図6】動作識別学習装置３００の動作例を示すフローチャートである。

【図7】各装置に共通するハードウェア構成を示す概略図である。

【発明を実施するための形態】

【0022】

＜概略＞
まず、本実施形態についての概略について説明する。
本実施形態は、利用可能な訓練データセットについて、以下に示すような三つの条件が満たされる状態においても、動作認識モデルを学習することが可能な技術を提供することを目的とする。
・動作データの人物ラベルが付与されていない
・各人物についてデータが欠損している動作クラスが存在している
・データセット中にラベル付きデータが存在する動作クラス（以下「既知動作クラス」という。）と、ラベル付きデータが一つもない未知の動作クラス（以下「未知動作クラス」という。）と、が含まれている

【0023】

以下の説明において、教師あり動作データは、正解となる動作クラスラベルが与えられている動作データである。教師なし動作データは、正解となる動作クラスラベルが与えられていない動作データである。訓練データは、教師あり動作データ及び教師なし動作データが含まれるデータである。本実施形態は、訓練データが与えられた時、以下のような問題のいずれか一つ又は複数が内在していたとしても、適切に動作する。第一の問題は、訓練データに人物ラベルが与えられていないという問題である。第二の問題は、各人物について動作データが欠損している動作クラスが存在している問題である。第三の問題は、訓練データ中に未知動作クラスの動作データが含まれている問題である。

【0024】

本実施形態は、第一の問題に対しては、訓練データ全体について人物ラベルを予測して特定することで対処する。本実施形態は、第二の問題及び第三の問題に対しては、予測した人物ラベルを用いて、人物非依存な識別学習を行うと共に、教師なし動作データの内の未知動作クラスの動作データに属するものを識別して特定することで対処する。

【0025】

＜人物特徴抽出器学習装置の構成例＞
図１は、本実施形態にかかる人物特徴抽出器学習装置１００の一例を示す機能ブロック図である。人物特徴抽出器学習装置１００は、例えばパーソナルコンピューターやサーバー装置等の情報処理装置を用いて構成される。人物特徴抽出器学習装置１００は、制御部９０、及び学習結果記憶部１２０を備える。制御部９０は、ＣＰＵ（Central Processing Unit）等のプロセッサーとメモリーを用いて構成される。制御部９０はプロセッサーがプログラムを実行することによって、前処理部１０１、人物特徴抽出器１０２、対比損失評価部１０３、及び学習部１０４として機能する。なお、制御部９０の各機能の全て又は一部は、ＡＳＩＣ（Application Specific Integrated Circuit）やＰＬＤ（Programmable Logic Device）やＦＰＧＡ（Field Programmable Gate Array）等のハードウェアを用いて実現されても良い。上記のプログラムは、コンピューター読み取り可能な記憶媒体に記録されても良い。コンピューター読み取り可能な記憶媒体とは、例えばフレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ、半導体記憶装置（例えばＳＳＤ:Solid State Drive）等の可搬媒体、コンピューターシステムに内蔵されるハードディスクや半導体記憶装置等の記憶装置である。上記プログラムは電気通信回線を介して送信されても良い。

【0026】

人物特徴抽出器学習装置１００とデータ記憶部１１０とは通信可能に接続される。データ記憶部１１０は磁気ハードディスク装置や半導体記憶装置等の記憶装置や、ＣＤ－ＲＯＭ等の記録媒体からデータを読み出すことができる装置を用いて構成される。

【0027】

前処理部１０１は、動作データ集合を受け取り、各動作データについて前処理を施し、前処理済み動作データを生成する。前処理部１０１は、生成した前処理済み動作データを人物特徴抽出器１０２に出力する。

【0028】

人物特徴抽出器１０２は、動作データまたは前処理済み動作データを入力として受け取り、第一の特徴量を出力する。人物特徴抽出器１０２は、このような第一の特徴量を出力可能なパラメータを持つ関数に基づき動作する。第一の特徴量は、動作データの取得元となる人物の特徴を数ベクトルで表したものであり、具体的には整数値ｎ１により定められるｎ１次元の要素を持つベクトルで表される。人物特徴抽出器１０２は、学習結果記憶部１２０に記憶されているパラメータを読み込み、入力された動作データの第一の特徴量を出力する。人物特徴抽出器１０２に適用される関数は、パラメータに対して微分可能なものであれば、任意ものを用いることができる。本実施形態ではニューラルネットワークが用いられる。

【0029】

対比損失評価部１０３は、人物特徴抽出器１０２により出力された一組の第一の特徴量を入力として受け取る。対比損失評価部１０３はこの一組の第一の特徴量の類似度を表す評価値（以下「対比損失評価値」という。）を出力する。評価値は、一組の第一の特徴量が同一の動作データから抽出された場合には類似度が高いほど、そうでない場合は類似度が低いほど、小さくなる損失値である。

【0030】

学習部１０４は、対比損失評価部１０３により得られた対比損失評価値を入力として受け取る。学習部１０４は入力された値について値が小さくなるように、人物特徴抽出器１０２のパラメータを学習する。学習部１０４は、学習により得られたパラメータを、学習結果記憶部１２０に記録する。

【0031】

＜人物予測装置の構成例＞
図２は、本実施形態にかかる人物予測装置２００の一例を表す機能ブロック図である。人物予測装置２００は、例えばパーソナルコンピューターやサーバー装置等の情報処理装置を用いて構成される。人物予測装置２００は、制御部９１、記憶部２３０及び人物予測結果記憶部２２０を備える。制御部９１はＣＰＵ等のプロセッサーとメモリーを用いて構成される。制御部９１はプロセッサーがプログラムを実行することによって、人物特徴抽出器２０１及び人物予測器２０２として機能する。制御部９１の各機能の全て又は一部は、ＡＳＩＣやＰＬＤやＦＰＧＡ等のハードウェアを用いて実現されても良い。上記のプログラムはコンピューター読み取り可能な記憶媒体に記録されてもよい。コンピューター読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ、半導体記憶装置（例えばＳＳＤ）等の可搬媒体、コンピューターシステムに内蔵されるハードディスクや反動台記憶装置等の記憶装置である。上記のプログラムは電気通信回線を介して送信されても良い。

【0032】

記憶部２３０及び人物予測結果記憶部２２０は、磁気ハードディスク装置や半導体記憶装置等の記憶装置を用いて構成される。記憶部２３０は、人物特徴抽出器学習装置等の記憶装置（例えば学習結果記憶部１２０）を用いて構成されてもよい。記憶部２３０は、人物特徴抽出器学習装置１００の学習部１０４の学習によって得られた学習結果としてのパラメータ（例えば学習結果記憶部１２０が記憶するデータ）を記憶する。

【0033】

人物特徴抽出器２０１は、処理対象の動作データ集合（予測対象の動作データ集合）を受け取ると、記憶部２３０からパラメータを読み出し、パラメータに基づき動作する。人物特徴抽出器２０１は、処理対象の動作データ集合について第一の特徴量の集合を出力する。人物予測器２０２は、人物特徴抽出器２０１によって得られた第一の特徴量の集合を入力として、処理対象の動作データ集合の各動作データについて、どの人物による動作データであるかを予測した結果の集合である人物予測結果を出力する。出力された人物予測結果は人物予測結果記憶部２２０に記録される。

【0034】

＜動作識別学習装置の構成例＞
図３は、本実施形態にかかる動作識別学習装置３００の一例を示す機能ブロック図である。動作識別学習装置３００は、例えばパーソナルコンピューターやサーバー装置等の情報処理装置を用いて構成される。動作識別学習装置３００は、制御部９２、動作識別結果記憶部３５０及び学習結果記憶部３４０を備える。制御部９２は、プロセッサーがプログラムを実行することによって、動作特徴抽出器３０１、動作クラス識別器３０２、人物クラス識別器３０３、動作クラス識別損失評価部３０４、人物クラス識別損失評価部３０５及び学習部３０６として機能する。なお、制御部９２の各機能の全てまたは一部は、ＡＳＩＣやＰＬＤやＦＰＧＡ等のハードウェアを用いて実現されても良い。上記のプログラムは、コンピューター読み取り可能な記録媒体に記録されても良い。コンピューター読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ、半導体記憶装置（例えばＳＳＤ）等の可搬媒体、コンピューターシステムに内蔵されるハードディスクや半導体記憶装置等の記憶装置である。上記のプログラムは、電気通信回線を介して送信されてもよい。

【0035】

動作識別学習装置３００は、教師あり動作データ記憶部３１０、教師なし動作データ記憶部３２０及び人物予測結果記憶部３３０からデータを取得して動作する。教師あり動作データ記憶部３１０は磁気ハードディスク装置や半導体記憶装置等の記憶装置や、ＣＤ－ＲＯＭ等の記録媒体から動作データを読み出すことのできる装置を用いて構成される。教師あり動作データ記憶部３１０は、教師あり動作データ集合を記憶する。教師あり動作データ集合は、所望の動作クラスラベルが付与された動作データの集合である。教師なし動作データ記憶部３２０は、磁気ハードディスク装置や半導体記憶装置等の記憶装置や、ＣＤ－ＲＯＭ等の記録媒体から動作データを読み出すことのできる装置を用いて構成される。教師なし動作データ記憶部３２０は、教師なし動作データ集合を記憶する。教師なし動作データ集合は、所望の動作クラスラベルが付与されていない動作データの集合である。

【0036】

動作特徴抽出器３０１は、教師あり動作データ集合及び教師なし動作データ集合を入力として受け取り、各動作データから第二の特徴量を抽出する。動作特徴抽出器３０１は、抽出された第二の特徴量を動作クラス識別器３０２及び人物クラス識別器３０３に出力する。第二の特徴量とは、必要な動作データの特徴をｎ２次元の要素を持つベクトルで表したものである。ｎ２は任意の整数である。なお、第二の特徴量は、便宜上ベクトルの形式を持つものとして説明するが、形式は本発明の要点とは無関係であり、任意の形式を取ることができる。動作特徴抽出器３０１は学習結果記憶部３４０に記憶されているパラメータを読み込み、第二の特徴量を出力する。

【0037】

動作クラス識別器３０２は、動作特徴抽出器３０１によって出力された第二の特徴量を入力として受け取る。動作クラス識別器３０２は入力された第二の特徴量に基づき、推定動作クラス帰属確率を出力する。推定動作クラス帰属確率は、動作データが各既知動作クラス及び未知動作クラスに帰属する確率である。動作クラス識別器３０２はこのような推定動作クラス帰属確率を出力することができるパラメータを持つ関数に基づいて動作する。動作クラス識別器３０２は、学習結果記憶部３４０に記憶されているパラメータを読み込んで推定動作クラス帰属確率を出力する。また、動作クラス識別器３０２は、推定動作クラス帰属確率から帰属動作クラスを識別し、識別結果を動作識別結果記憶部３５０に記録する。

【0038】

人物クラス識別器３０３は、動作特徴抽出器３０１によって出力された第二の特徴量を入力として受け取る。人物クラス識別器３０３は、第二の特徴量に基づき、推定人物クラス帰属確率を出力する。推定人物クラス帰属確率は、動作データがどの人物による動作であるかを表す確率である。人物クラス識別器３０３はこのような推定人物クラス帰属確率を出力することができるパラメータを持つ関数に基づいて動作する。人物クラス識別器３０３は、学習結果記憶部３４０に記憶されているパラメータを読み込んで推定人物クラス帰属確率を出力する。

【0039】

動作特徴抽出器３０１、動作クラス識別器３０２及び人物クラス識別器３０３に適用される関数は、パラメータに対して微分可能であれば、任意のものを用いることができる。本実施形態では、ニューラルネットワークが用いられる。

【0040】

動作クラス識別損失評価部３０４は、処理対象の動作データに対する動作クラス識別器３０２が出力した推定動作クラス帰属確率と、動作識別結果記憶部３５０に記憶される動作クラス識別結果をもとに生成した擬似教師動作クラス帰属確率と、所望の動作クラスへの帰属確率を表す教師動作クラス帰属確率と、を入力として受け取る。擬似教師動作クラス帰属確率とは、教師帰属動作クラスが与えられていない教師なし動作データに対して付与した、仮の教師動作クラス帰属確率である。動作クラス識別損失評価部３０４は、推定動作クラス帰属確率と擬似教師動作クラス帰属確率又は教師動作クラス帰属確率との差異を表す第一の損失評価関数である動作クラス識別損失関数の値（以下「動作クラス識別損失評価値」という。）を求める。

【0041】

人物クラス識別損失評価部３０５は、人物予測結果記憶部３３０に記憶される人物予測結果に基づく教師人物クラス帰属確率と、処理対象の動作データに対して人物クラス識別器３０３が出力した推定人物クラス帰属確率と、を入力として受け取る。人物クラス識別損失評価部３０５は、推定人物クラス帰属確率と教師人物クラス帰属確率との差異を表す第二損失関数である人物クラス識別損失関数の値（以下「人物クラス識別損失評価値」という。）を求める。

【0042】

学習部３０６は、動作クラス識別損失評価部３０４によって得られた動作クラス識別損失評価値と、人物クラス識別損失評価部３０５によって得られた人物クラス識別損失評価値と、を入力として受ける。学習部３０６は、入力された値を用いて、動作特徴抽出器３０１、動作クラス識別器３０２及び人物クラス識別器３０３のパラメータを学習する。学習部３０６は、学習によって得られた動作特徴抽出器３０１、動作クラス識別器３０２及び人物クラス識別器３０３のパラメータを、学習結果記憶部３４０に記録する。動作特徴抽出器３０１に関する学習は、動作クラス識別損失評価値を小さく、人物クラス識別損失評価値を大きくするように行われる。動作クラス識別器３０２に関する学習は、動作クラス識別損失評価値を小さくするように行われる。人物クラス識別器３０３は人物クラス識別損失評価値を小さくするように行われる。

【0043】

＜動作識別装置の構成例＞
図４は、本実施形態に係る動作識別装置４００の一例を示す機能ブロック図である。動作識別装置４００は、例えばパーソナルコンピューターやサーバー装置等の情報処理装置を用いて構成される。動作識別装置４００は、制御部９３及び記憶部４３０を備える。制御部９３は、ＣＰＵ等のプロセッサーとメモリーとを用いて構成される。制御部９３は、プロセッサーがプログラムを実行することによって、動作特徴抽出器４０１及び動作クラス識別器４０２として機能する。なお、制御部９３の各機能の全て又は一部は、ＡＳＩＣやＰＬＤやＦＰＧＡ等のハードウェアを用いて実現されても良い。上記のプログラムは、コンピューター読み取り可能な記録媒体に記録されても良い。コンピューター読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ、半導体記憶装置（例えばＳＳＤ）等の可搬媒体、コンピューターシステムに内蔵されるハードディスクや半導体記憶装置等の記憶装置である。上記のプログラムは、電気通信回線を介して送信されてもよい。

【0044】

記憶部４３０は、磁気ハードディスク装置や半導体記憶装置等の記憶装置を用いて構成される。記憶部４３０は、動作識別学習装置３００の学習部３０６によって行われた学習で得られた学習結果としてのパラメータ（例えば学習結果記憶部３４０が記憶する情報）を記憶する。

【0045】

動作特徴抽出器４０１は、処理対象の動作データ４１０（予測対象の動作データ）を受けると、記憶部４３０からパラメータを読み出し、パラメータに基づき動作する。動作特徴抽出器４０１は、処理対象の動作データ４１０について第二の特徴量を出力する。動作クラス識別器４０２は、記憶部４３０からパラメータを読み出し、パラメータに基づいて動作する。動作クラス識別器４０２は、動作特徴抽出器４０１によって得られた第二の特徴量に基づいて、処理対象の動作データ４１０について推定動作クラス帰属確率を求める。動作クラス識別器４０２の出力は、処理対象の動作データ４１０についての、各動作クラスに対する帰属確率そのものであってもよいし、どの動作クラスに属するかの推定結果を示す情報であってもよい。

【0046】

＜人物特徴抽出器学習装置の動作例＞
図５は、人物特徴抽出器学習装置１００の動作例を示すフローチャートである。次に人物特徴抽出器学習装置１００の動作例について説明する。人物特徴抽出器学習装置１００は、データ記憶部１１０から動作データ集合を受けて、図５に示される学習処理ルーチンを実行する。

【0047】

まず、人物特徴抽出器学習装置１００の制御部９０は、二つ以上の動作データ集合を読み込む（ステップＳ１０１）。次に制御部９０は入力された動作データ集合について各々の動作データに対して前処理を適用し、前処理済み動作データを生成する（ステップＳ１０２）。

【0048】

入力動作データ及びステップＳ１０２で生成した前処理済み動作データに対して、人物特徴抽出器１０２及び対比損失評価部１０３が処理を実行することによって、対比損失評価値が得られる（ステップＳ１０３）。

【0049】

ステップＳ１０３の処理が終わると、学習部１０４は、人物特徴抽出器１０２のパラメータの値（学習結果記憶部１２０に記録させる値）をそれぞれ更新する（ステップＳ１０４）。

【0050】

そして、制御部９０は、終了条件を満たすか否か判定する（ステップＳ１０５）。終了条件を満たしている場合（ステップＳ１０５－ＹＥＳ）、制御部９０は処理を終了する。一方、終了条件を満たしていない場合（ステップＳ１０５－ＮＯ）、制御部９０はステップＳ１０１に戻って処理を繰り返す。

【0051】

以上説明した反復学習により、人物特徴抽出器１０２のパラメータが学習される。人物特徴抽出器１０２は、対比損失評価値を用いて、対比損失評価値を小さくするように学習が行われる。

【0052】

［各処理の詳細］
次に人物特徴抽出器学習装置１００の各処理部の処理の詳細について説明する。
ステップＳ１０２における、動作データの前処理について詳細を説明する。

【0053】

人物特徴抽出器学習装置１００は、人物ラベルが与えられていない訓練データから、人物特徴抽出器１０２を学習することを目的としている。人物ラベルが与えられていないため、いわゆる一般的な教師あり学習の枠組みで人物特徴抽出器１０２を学習することは不可能である。一方、同一の動作データであれば、少なくともその一連の動作は同一の人物によってなされた動作であると考えてよい。したがって、本発明の実施形態では、各動作データに対して、何らかの前処理を施して動作データを複製し、元の動作データ並びに複製された動作データから抽出された特徴量を互いに近づけるように学習することによって、人物特徴を学習することを考える。

【0054】

ここで問題となるのは、動作データには、当然ながら人物に関する情報だけではなく動作に関する情報が含まれているため、ただ複製しただけでは、人物を識別する情報だけを捉えた特徴を学習できるとは限らないことである。そこで本発明の実施形態では、人物を識別する情報を保ちつつ、動作を識別する情報を喪失させるような前処理を導入することによって、この問題を解決する。

【0055】

このような要件を満たす前処理としては様々なものが考えられる。例えば、動作データ（あるいはその一部フレーム）に対し、時間方向への平均値を求めてもよい。仮に動作データが、モーションキャプチャデータのように、動作中における人物の各関節位置の時系列を記録したものであると仮定する。このとき、時間方向への平均値を取ることによって時系列情報が喪失する。そのため、動作そのものの情報（動作を識別する情報）は失われる。しかし、関節位置の時間平均値には、依然としてその人物の身長やプロポーションといった身体的特徴を表すような情報は残されている。そのため、先の要件を満たす。なお、平均値は、時間方向への次元を持たない。例えば、仮に、元の動作データが、各フレームd次元で表現される動作をTフレーム分記録したものであるとすると、平均値はd次元ベクトルになる。そのため、元の動作データとはもはや次元が合わず、直接的な比較は不可能になる。しかし、例えば、平均値を元の動作のフレーム数（Tフレーム）分時間方向に複製するなどの簡単な処理によって次元を合わせることにより、比較可能になる。

【0056】

別の例として、動作データの動作フレームの時系列順序をランダムに入れ替える処理がある。平均値をとる場合と同様、順序の入れ替えによって動作の時系列情報（動作を識別する情報）は喪失する。しかし、動作主体の身体的特徴は保持されうる。あるいは、動作データの動作フレームの一部をランダムに選び、抽出してもよい。この場合も同様の効果が得られる。これ以外にも、前処理の形態には様々なものがありえる。先の要件を満たす限り任意のものを前処理として用いることができる。

【0057】

人物特徴抽出器学習装置１００は、以上のような前処理を施した動作データ、あるいは、その元の動作データを用いて学習処理を行う。

【0058】

［対比損失評価部の処理］
人物特徴抽出器１０２は、動作データｘを入力として第一の特徴量であるベクトルｚを出力し、パラメータθ_ｚを持つような関数で実現される。

【0059】

ステップＳ１０１で読み込まれる動作データ集合のデータ数をＮとする。読み込んだ動作データ集合について、前処理部１０１及び人物特徴抽出器１０２を適用し、各動作データについて一組のベクトルを出力することで、２Ｎ個のベクトルが得られる。このベクトルの集合では、あるベクトルｚ_ｊに対して元動作データを共有するベクトルｚ_ｉが存在し、それ以外のベクトルは全て異なる動作データから生成されたベクトルｚ_ｋである。ベクトルｚ_ｋは２（Ｎ－１）個存在する。この対比学習では、同じ動作データから抽出されたベクトルは類似度を大きく、異なる動作データから生成されたベクトルは類似度を小さくするように学習することで、ベクトルｚの空間上で同じ人物の動作データ同士が近傍に位置するように学習が行われる。このような学習を実現する対比損失の一例として、ベクトル同士の類似度を計るｓｉｍ（ｕ、ｖ）を用いて下記式１のようなものが挙げられる。

【0060】

【数1】

【0061】

Eb[a]は、aの確率bに対する期待値である。なお本実施形態では式１は下記式２のようにＮ個の動作データに対する平均で近似的に置き換えられる。この時ｚ_ｉとｚ_ｉ＋１とは同一の動作データから抽出された第一の特徴量である。

【0062】

【数2】

【0063】

式２をθ_zについて小さくすることで、望ましい人物特徴抽出器１０２が得られる。このようなθ_zを求める方法は様々ある。単純には、人物特徴抽出器１０２を実現する関数がパラメータθ_zに対して微分可能である場合、局所最小化できることが知られている。そのため、本実施形態の一例においては、人物特徴抽出器１０２として以下の条件を満たす関数が選ばれても良い。

【0064】

人物特徴抽出器１０２の条件
・動作データxを入力された下でその動作データの特徴ベクトルｚを出力する関数であること
・θ_ｚについて微分可能であること

【0065】

［学習処理］
ステップＳ１０４に係る学習部１０４の学習処理について説明する。学習部１０４は、人物特徴抽出器１０２のパラメータについて、対比損失評価値L_ctrが小さくなるように学習処理を行う。

【0066】

［パラメータ格納処理］
学習部１０４は、パラメータ学習後、ステップＳ１０４に係る処理にて、パラメータθ_zを学習結果記憶部１２０に格納する。学習部１０４は、以上のステップＳ１０１からＳ１０４までの学習処理を、終了条件が満たされるまで繰り返す。終了条件については、任意の条件が用いられて良い。例えば、所定の回数を繰り返すことが終了条件であってもよいし、対比損失評価値が一定値以上変化しなくなることが終了条件であってもよい。

【0067】

＜人物予測装置の動作例＞
人物予測装置２００の動作例について説明する。まず、人物予測装置２００の制御部９１は、データ記憶部２１０から動作データを全て読み込む。制御部９１の人物特徴抽出器２０１は、人物特徴抽出器学習装置１００により記録された学習結果パラメータを記憶部２３０から読み込む。人物特徴抽出器２０１は、入力された動作データの集合について、学習結果のパラメータに基づいて処理を行い、各動作データに対して抽出した第一の特徴量の集合を得る。

【0068】

人物予測器２０２は、第一の特徴量に基づき、各動作データの人物予測結果を取得する。人物予測器２０２は、得られた人物予測結果を人物予測結果記憶部２２０に記録する。

【0069】

［人物予測処理の詳細］
人物特徴抽出器２０１は入力された各動作データの第一の特徴量を出力する。得られた第一の特徴量は、特徴量空間上で、同じ人物の動作データ特徴量同士が近傍に位置する。この特徴量の集合に対して、人物予測器２０２がクラスタリングアルゴリズムを実行することにより、人物予測結果を得ることができる。

【0070】

人物予測器２０２が実行するクラスタリングアルゴリズムには、任意の公知のクラスタリングアルゴリズムが用いられても良い。例えばScikit-learnなどのオープンソースソフトウェアで提供されるクラスタリングアルゴリズムを用いることができる。

【0071】

＜動作識別学習装置の動作例＞
図６は、動作識別学習装置３００の動作例を示すフローチャートである。次に動作識別学習装置３００の動作例について説明する。動作識別学習装置３００は、教師あり動作データ記憶部３１０、教師なし動作データ記憶部３２０及び人物予測結果記憶部３３０からそれぞれデータを読み出し、図６に示される学習処理を実行する。

【0072】

動作識別学習装置３００の制御部９２は、それぞれ一つ以上の教師あり動作データ集合、教師なし動作データ集合及び各動作データに対する人物予測結果集合を読み込む（ステップＳ２０１）。次に、制御部９２は、学習の反復回数が予定回数以下であれば（ステップＳ２０２－ＹＥＳ）、ステップＳ２０３の処理を実行する。一方、反復回数が予定回数より多ければ（ステップＳ２０２－ＮＯ）、ステップＳ２０４の処理が実行される。

【0073】

ここで、ステップＳ２０２における分岐処理の意義について説明する。分岐処理の目的は、教師ラベルの存在しない未知動作クラスの識別を動作クラス識別器３０２に学習させることである。動作クラス識別器３０２は、既知動作クラスＫ個と未知動作クラスを合わせた（Ｋ＋１）個の動作クラスを識別可能になることを目的として学習する。

【0074】

しかし、既知動作クラスに関しては、動作クラスラベルが付与された動作データが教師あり動作データ集合に存在するが、未知動作クラスには未知であることを表すラベルが付与された動作データが存在しない。そのため、所与の動作クラスラベルのみを用いて学習すると、既知動作クラスＫ個の識別は可能になるが、未知動作クラスの識別は可能とはならない。そこで、反復回数が予定の回数以下である場合には、教師なし動作データ集合に対して動作クラス識別器３０２の出力結果をもとに、未知動作クラスかの識別を行い、（Ｋ＋１）クラスの識別結果として識別履歴に記録する。

【0075】

その後、反復回数が予定回数より多い場合には、識別履歴に記録された動作クラス識別結果をもとに擬似的に生成した動作クラスラベルを生成し、（Ｋ＋１）クラスの識別ができるように動作クラス識別器３０２を学習する。動作クラス識別結果は、再び識別履歴に記録されることで、次の反復学習時の動作クラスラベルの生成に用いられる。

【0076】

反復回数が予定回数以下の場合に用いられた、動作クラス識別器３０２の出力結果に基づき、未知動作クラスの識別を行う方法により、形式上は未知動作クラスの識別が可能である。しかし、この方法のみでは誤りが多く含まれる問題がある。そこで、教師なし動作データに対して、未知動作クラスを含む擬似の教師動作クラスラベルを生成し、その後、動作クラス識別器３０２の学習と未知動作クラスラベルの生成を相互に行うことで、誤りの少ない未知動作クラス識別を実現する。

【0077】

ステップＳ２０３では、教師あり動作データ集合、教師なし動作データ集合、人物予測結果集合に対して動作特徴抽出器３０１、動作クラス識別器３０２及び人物クラス識別器３０３が処理を実行することで、動作クラス識別損失評価値、人物クラス識別損失評価値、動作クラス識別結果が得られる。

【0078】

ステップS２０４では、教師なし動作データ集合について動作識別結果記憶部３５０から動作クラス識別履歴を読み込む。そして、ステップS２０５において、教師あり動作データ集合、教師なし動作データ集合、人物予測結果集合、動作クラス識別履歴に対して、動作特徴抽出器３０１、動作クラス識別器３０２、及び人物クラス識別器３０３が処理を実行することで、動作クラス識別損失評価値、人物クラス識別損失評価値、動作クラス識別結果が得られる。

【0079】

ステップＳ２０３またはＳ２０５の処理が終わると、学習部３０６は動作クラス識別損失評価値及び人物クラス識別損失評価値に基づいて、動作特徴抽出器３０１、動作クラス識別器３０２及び人物クラス識別器３０３のパラメータの値（学習結果記憶部３４０に記録される値）をそれぞれ更新する（ステップＳ２０６）。学習部３０６は、動作特徴抽出器３０１、動作クラス識別器３０２、人物クラス識別器３０３のパラメータを学習結果記憶部３４０に格納する。次に動作クラス識別器３０２は、ステップＳ２０３又はＳ２０５で得られた動作クラス識別結果を動作識別結果記憶部３５０に記録する（ステップＳ２０７）。

【0080】

そして、制御部９２は、終了条件を満たすかを判定する（ステップＳ２０８）。終了条件を満たしている場合（ステップＳ２０８－ＹＥＳ）、制御部９２は処理を終了する。終了条件を満たしていない場合（ステップＳ２０８－ＮＯ）、制御部９２は、ステップＳ２０１に戻って処理を繰り返す。

【0081】

以上説明した反復学習により、動作特徴抽出器３０１、動作クラス識別器３０２及び人物クラス識別器３０３のパラメータが学習される。動作特徴抽出器３０１に関しては、動作クラス識別損失評価値を小さくするように、人物識別損失評価値を大きくするように学習が行われる。動作クラス識別損失関数は、動作クラス識別器３０２の出力した動作データの推定動作クラス帰属確率と、動作データの所与の教師動作クラス帰属確率または動作識別結果記憶部３５０に格納されているクラス識別履歴を用いて生成した擬似の教師動作クラス帰属確率と、の類似度が高いほど小さい値を出力する。人物クラス識別損失関数は、人物クラス識別器３０３の出力した動作データの推定人物動作クラスと、人物予測結果記憶部３３０に格納されている動作データの人物予測結果と、の類似度が高いほど小さい値を出力する。また動作クラス識別器３０２は動作クラス識別損失評価値を小さくするように学習し、人物クラス識別器３０３は人物クラス識別損失評価値を小さくするように学習する。

【0082】

［各処理の詳細］
次に動作識別学習装置３００の各処理部の処理の詳細について説明する。

【0083】

［反復回数が予定回数以下の場合］
ステップＳ２０２において、反復回数が予定回数以下の場合における動作クラス識別器３０２、動作クラス識別損失評価部３０４、人物クラス識別損失評価部３０５、の各処理について説明する。

【0084】

［動作識別損失評価部の処理］
動作特徴抽出器３０１は、動作データｘを入力として第二の特徴量を表すベクトルｆを出力しパラメータθ_ｅを持つような関数Ｆを用いることで実現される。動作クラス識別器３０２は、ベクトルｆを入力として推定帰属確率ｙを出力するパラメータθ_ｍを持つ関数として表現することができる。推定動作クラス帰属確率は動作特徴抽出器３０１を実現する関数Ｆを用いて、確率関数として下記式３のように表すことができる。

【0085】

【数3】

【0086】

式３はθ_ｅ、θ_ｍ、及びｘが与えられた下でのｙが出現する確率である。望ましい動作特徴抽出器３０１、動作クラス識別器３０２は、教師あり動作データ集合から動作データsが得られた時、各動作クラスへの教師動作クラス帰属確率ｔが出現するようなものである。すなわち、正解となる動作クラスが識別可能な帰属確率が求められる動作特徴抽出器３０１及び動作クラス識別器３０２である。動作データｓと対応する教師動作クラス帰属確率ｔの出現確率をｐ（ｓ、ｔ）とすると、学習は式４の値が小さくなるようにパラメータθ_ｅ、θ_ｍを決定できれば良い。

【0087】

【数4】

【0088】

本実施形態では、教師あり動作データは動作データと教師動作クラス帰属確率の組の集合の形で与えられる。そのため、期待値は下記式５のように総和の形で近似的に置き換えられる。

【0089】

【数5】

【0090】

なお、Ｓ、Ｔはそれぞれ１つ以上の動作データと、対応する教師動作クラス帰属確率の集合である。式５が本実施形態の一例における動作クラス識別損失関数であり、これを任意のＳ、Ｔに対して評価した値が識別損失関数値である。

【0091】

式５をθ_ｅ、θ_ｍについて小さくすることで、sに対してtを出力できるような望ましい動作特徴抽出器３０１、及び動作クラス識別器３０２を得ることができる。このようなθ_ｅ、θ_ｍを求める方法は様々ある。単純には、動作特徴抽出器３０１を実現する関数Fと動作クラス識別器３０２を表す確率関数とがそれぞれのパラメータθ_ｅ、θ_ｍに対して微分可能である場合、局所最小化することができることが知られている。そのため、本実施形態の一例においては、動作特徴抽出器３０１及び動作クラス識別器３０２として以下の条件を満たす関数が選ばれても良い。

【0092】

動作特徴抽出器３０１の条件
・動作データｘを入力された下でその動作データの特徴ベクトルｆを出力する関数であること
・θ_ｅについて微分可能であること

【0093】

動作クラス識別器３０２の条件
・特徴ベクトルfを入力として推定動作クラス帰属確率yを出力する関数であること
・θ_ｙに対して微分可能であること

【0094】

［人物クラス識別損失評価部の処理］
人物クラス識別器３０３は動作特徴抽出器３０１が出力した特徴ベクトルｆを入力として推定人物クラス帰属確率を出力するパラメータθ_cを持つ関数として表現することができる。推定ドメイン帰属確率は動作特徴抽出器３０１を実現する関数Fを用いて、確率関数として下記式６のように表すことができる。

【0095】

【数6】

【0096】

式６はθ_ｅ、θ_ｃ、及びｘが与えられた下でのｃが出現する確率である。望ましい人物クラス識別器３０３は、教師あり動作データ集合または教師なし動作データ集合から与えられた動作データｘに対して、その識別結果が人物予測結果集合から与えられる教師人物クラス帰属確率と一致することである。そのため、動作データｘと対応する教師人物クラス帰属確率cの出現確率をp（ｘ、ｃ）とすると、人物クラス識別器３０３の学習では下記式７が小さくなるようにパラメータθ_cを決定できれば良い。

【0097】

【数7】

【0098】

一方、動作特徴抽出器３０１は式７が大きくなるようにパラメータθ_eを決定するように学習を行う。

【0099】

人物クラス識別器３０３が式７の値を小さくするように学習するのに対して、動作特徴抽出器３０１が同じ式７の値を大きくするように学習する意義について説明する。本発明の動作特徴抽出器３０１は、人物について不変な特徴量を抽出することで、動作クラス識別器３０２での識別において、人物の差異の影響を受けにくくすることを目指す。式７に対して、人物クラス識別器３０３はそれを小さくするように学習することで、人物をより正確に識別するようになる。これに対して、動作特徴抽出器３０１はそれを大きくするように学習することで、出力される特徴は人物の識別がより困難になる。この学習を継続することで、動作特徴抽出器３０１は人物の差異の影響の小さい人物について不変な特徴量を抽出できるようになる。

【0100】

式７は本実施形態の場合は式４と同様に、下記式８のように総和の形で近似的に置き換えられる。

【0101】

【数8】

【0102】

なお、Ｘ、Ｃはそれぞれ１つ以上の動作データと、対応する教師人物クラス帰属確率の集合である。式８が本実施形態の一例における人物クラス識別損失関数であり、これを任意のＸ、Ｃに対して評価した値が識別損失関数値である。

【0103】

【0104】

人物クラス識別器３０３の条件
・特徴ベクトルｆを入力として推定人物クラス帰属確率ｙ＾を出力する関数であること
・θ_cに対して微分可能であること

【0105】

［クラス識別器のクラス識別処理］
動作データxに対してその動作データが既知クラスのいずれに帰属するかの確率は、動作クラス識別器３０２の出力する推定動作クラス帰属確率ｙであり、上述の式３を用いて表すことができる。動作クラス識別器３０２が出力する推定動作クラス帰属確率ｙについて、出力された推定動作クラス帰属確率ｙの曖昧性を示す情報エントロピーＨ（ｙ｜ｘ）は下記式９のように表される。

【0106】

【数9】

【0107】

教師なし動作データ集合の教師なし動作データｕが未知クラス動作データであるか否かを、式９の情報エントロピーの値が閾値σより大きいか否かによって識別する。情報エントロピーを元に未知クラスであると判別された動作データは未知クラスＫ＋１として識別し、そうでない動作データは動作クラス識別器３０２の推定動作クラス帰属確率ｙの最も大きいクラスとして識別する。すなわち、反復回数ｅ回目における教師なし動作データｕの動作クラス識別結果ｙ_ｕ、ｅは下記式１０のように表される。

【0108】

【数10】

【0109】

［反復回数が予定回数より大きい場合］
次に、ステップＳ２０４における処理について説明する。ステップＳ２０４の処理で、教師なし動作データ集合の各動作データに対してそれらの過去の識別結果を読み込み、過去の識別結果から教師なし動作データに対する擬似の教師動作クラス帰属確率を求める。教師なし動作データ集合の動作データｕについて、反復回数ｔの時の動作クラス識別結果は、後述のステップＳ２０７でｙ_ｕ、ｔとして動作識別結果記憶部３５０に格納されている。ステップＳ２０４では、過去Ｔ回の識別結果を動作識別結果記憶部３５０から読み出し、過去Ｔ回で最頻のクラスを擬似教師動作クラス帰属確率とする。すなわち、反復回数ｅにおいて教師なし動作データｕの擬似教師動作クラス確率ｙ_ｕは、最頻値を表すmode(・)を用いて式１１のように表される。

【0110】

【数11】

【0111】

次にステップＳ２０５に係る評価処理について説明する。動作クラス識別損失評価部３０４及び人物クラス識別損失評価部３０５の処理については、反復回数が一定以下の場合の処理であるステップＳ２０３とほぼ同様の処理を行う。

【0112】

［動作クラス識別損失評価部の処理］
動作クラス識別損失評価部３０４は、教師あり動作データとその教師動作クラス帰属確率の集合（Ｓ、Ｔ）と教師なし動作データとステップ２０４で求めた擬似教師動作クラス帰属確率の集合（Ｓ’、Ｔ’）の和集合について総和を取ることにより、動作クラス識別損失関数を求める。すなわち、動作クラス識別損失評価部３０４の評価値は下記式１２の形で表される。

【0113】

【数12】

【0114】

［人物クラス識別損失評価部の処理］
人物クラス識別損失評価部の処理はステップＳ２０３での人物クラス識別損失評価部３０５の処理と同一の処理を行う。

【0115】

［動作クラス識別器の動作クラス識別処理］
ステップＳ２０５では、動作クラス識別器３０２はＫ個の既知動作クラスと未知動作クラスを含めたＫ＋１クラスの推定動作クラス帰属確率を出力することができる。そこで、動作クラス識別器３０２の動作クラス識別結果はＫ＋１クラスの推定動作クラス帰属確率のうち、最も大きいクラスとなる。すなわち、反復回数ｅ回目における教師なし動作データｕの動作クラス識別ｙ_ｕ、ｅは下記式１３のように表される。

【0116】

【数13】

【0117】

［学習処理］
ステップＳ２０６にかかる学習部３０６の学習処理について説明する。動作特徴抽出器３０１については動作クラス識別損失評価値Ｌ_sが小さく、人物クラス識別損失評価値Ｌ_cの値が大きくなるように学習処理を行う。動作クラス識別器３０２は動作クラス識別損失評価値Ｌ_sが小さくなるように学習する。人物クラス識別器３０３は人物クラス識別損失評価値が小さくなるように学習する。具体的には式１４、式１５に示す問題を順次最適化するように行う。

【0118】

【数14】

【0119】

【数15】

【0120】

ここで、クラス識別損失評価値Ｌ_ｓとドメイン識別損失評価値Ｌ_ｃがパラメータθ_ｅ、θ_ｍ、θ_ｃについて微分可能であるように動作特徴抽出器３０１、動作クラス識別器３０２及び人物クラス識別器３０３の関数を選ぶため、誤差勾配降下法により学習することが可能である。

【0121】

［パラメータ格納処理］
パラメータ学習後、ステップＳ２０６に係る処理にて、パラメータθ_ｅ、θ_ｍ、θ_ｃを学習結果記憶部３４０に格納する。

【0122】

［学習結果格納処理］
ステップＳ２０７に係る処理にて、動作クラス識別結果ｙ_ｕ、ｅを動作識別結果記憶部３５０に格納する。

【0123】

以上のステップＳ２０１からＳ２０７までの学習処理を、終了条件が満たされるまで、繰り返せば良い。終了条件については、任意の情報が用いられて良い。例えば、所定の回数を繰り返すことが終了条件であってもよいし、目的関数の値が一定以上変換しなくなることが終了条件であってもよいし、訓練データとは別に用意した評価用データに対する精度が一定以上変化しなくなることが終了条件であってもよい。

【0124】

＜動作識別装置の動作＞
動作識別装置４００の動作例について説明する。
まず、動作識別装置４００の制御部９３は動作データ４１０を読み込む。次に、制御部９３の動作特徴抽出器４０１と動作クラス識別器４０２は動作識別学習装置３００により記録された学習結果パラメータを記憶部４３０から読み込む。パラメータを読み込んだ動作特徴抽出器４０１及び動作クラス識別器４０２は動作データ４１０に対して処理を行うことで識別結果４２０を得る。

【0125】

図７は、各装置に共通するハードウェア構成を示す概略図である。人物特徴抽出器学習装置１００、人物予測装置２００、動作識別学習装置３００及び動作識別装置４００のそれぞれは、図７に示されるような情報処理装置９００を用いて構成されてもよい。情報処理装置９００は、プロセッサー９０１、メモリー９０２及び補助記憶装置９０３を備える。プロセッサー９０１、メモリー９０２及び補助記憶装置９０３は、バス９０４を介して通信可能に接続されている。

【0126】

このように構成された本実施形態では、訓練データに人物ラベルが与えられていない場合にも人物予測装置２００によって動作データの人物を予測することで解決を図る。各人物について動作データが欠損している動作クラスが存在する問題や、訓練データ中に未知動作クラスの動作データが含まれている問題が内在しているような場合であっても、予測した人物ラベルを用いて人物に不変な特徴を学習し、教師ラベルの与えられていない動作データから未知の動作データを識別し特定することで問題の解決を図っている。

【0127】

データ記憶部１１０は、人物特徴抽出器学習装置１００に備えられてもよい。学習結果記憶部１２０は、人物特徴抽出器学習装置１００の外部に設けられてもよい。データ記憶部２１０及び人物予測結果記憶部２２０のいずれか一方又は双方は、人物予測装置２００に備えられてもよい。記憶部２３０は、人物予測装置２００の外部に設けられてもよい。教師あり動作データ記憶部３１０、教師なし動作データ記憶部３２０及び人物予測結果記憶部３３０のいずれか一つ又は複数は、動作識別学習装置３００に備えられてもよい。学習結果記憶部３４０及び動作識別結果記憶部３５０のいずれか一方又は双方は、動作識別学習装置３００の外部に設けられてもよい。記憶部４３０は、動作識別装置４００の外部に設けられてもよい。各記憶部が各装置の外部に設けられた場合には、例えばＴＣＰ／ＩＰ等の通信を行うことで動作データが取得されてもよい。

【0128】

人物特徴抽出器学習装置１００、人物予測装置２００、動作識別学習装置３００及び動作識別装置４００のそれぞれは、１台の情報処理装置を用いて実装されてもよいし、複数台の情報処理装置に分散して実装されてもよい。

【0129】

人物予測装置２００は、人物予測結果記憶部２２０を備えるのではなく、人物予測結果記憶部２２０として機能する記憶装置と通信可能に接続されてもよい。この場合、人物予測装置２００と人物予測結果記憶部２２０とは、有線通信や無線通信で通信可能に接続される。

【0130】

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

【符号の説明】

【0131】

１００…人物特徴抽出器学習装置、１０１…前処理部、１０２…人物特徴抽出器、１０３…対比損失評価部、１０４…学習部、１１０…データ記憶部、１２０…学習結果記憶部、２００…人物予測装置、２０１…人物特徴抽出器、２０２…人物予測器、２１０…データ記憶部、２２０…人物予測結果記憶部、２３０…記憶部、３００…動作識別学習装置、３０１…動作特徴抽出器、３０２…動作クラス識別器、３０３…人物クラス識別器、３０４…動作クラス識別損失評価部、３０５…人物クラス識別損失評価部、３０６…学習部、３１０…教師あり動作データ記憶部、３２０…教師なし動作データ記憶部、３３０…人物予測結果記憶部、３４０…学習結果記憶部、３５０…動作識別結果記憶部、４００…動作識別装置、４０１…動作特徴抽出器、４０２…動作クラス識別器、４１０…動作データ、４２０…識別結果、４３０…記憶部

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版