(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0018】
以下の実施の形態においては便宜上その必要があるときは、複数のセクションまたは実施の形態に分割して説明するが、特に明示した場合を除き、それらはお互いに無関係なものではなく、一方は他方の一部または全部の変形例、詳細、補足説明等の関係にある。
【0019】
また、以下の実施の形態において、要素の数等(個数、数値、量、範囲等を含む)に言及する場合、特に明示した場合および原理的に明らかに特定の数に限定される場合等を除き、その特定の数に限定されるものではなく、特定の数以上でも以下でもよい。
【0020】
さらに、以下の実施の形態において、その構成要素(要素ステップ等も含む)は、特に明示した場合および原理的に明らかに必須であると考えられる場合等を除き、必ずしも必須のものではないことは言うまでもない。
【0021】
同様に、以下の実施の形態において、構成要素等の形状、位置関係等に言及するときは特に明示した場合および原理的に明らかにそうではないと考えられる場合等を除き、実質的にその形状等に近似または類似するもの等を含むものとする。このことは、上記数値および範囲についても同様である。
【0022】
また、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。
【0024】
〈振る舞い検知システムの構成例〉
図1は、一実施の形態による振る舞い検知システム10における構成の一例を示す説明図である。
【0025】
振る舞い検知システム10は、認識対象である作業員の位置および要素動作を認識し、認識した要素動作の意味、および時刻などを対応付けして蓄積するシステムである。この振る舞い検知システム10は、
図1に示すように、映像撮影装置11、認識処理部12、および表示装置13を有する。
【0026】
撮影部である映像撮影装置11は、例えばカラー画像を撮影できるWebカメラや監視カメラ、撮影対象までの距離を撮影できる深度センサなどである。認識処理部12は、映像撮影装置11が撮影した撮影情報から人の動作に関する情報(以降、動作関連情報と称する)を抽出する。動作関連情報は、例えば、人の関節位置の時系列情報、もしくはそれを抽象化した情報である。
【0027】
カラー情報から人の関節位置の時系列情報を取得するには、Toshevらの方法(A. Toshev and C. Szegedy, “Deeppose: Human pose estimation via deep neural networks,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2014, pp. 1653-1660.)を用いればよいし、深度センサを用いた場合はShottonらの方法 (J. Shotton, T. Sharp, A. Kipman, A. Fitzgibbon, M. Finocchio, A. Blake, M. Cook, and R. Moore, “Real-time human pose recognition in parts from single depth images,” Communications of the ACM, vol. 56, no. 1, pp. 116-124, 2013.)を用いればよい。
【0028】
前述の抽象化した情報とは例えば、関節の動きの速さ、関節間の距離、関節の動きの速さを周波数で表現した情報、あるいはそれらの組み合わせの情報である。いずれも、数値情報として表現される。
【0029】
表示装置13は、例えば液晶モニタなどの表示ディスプレイなどからなり、認識処理部12の制御によって後述する認識情報などを表示する。
【0030】
認識処理部12は、位置認識部15、動作認識部16、および記憶部17を有する。位置認識部15は、映像撮影装置11が撮影した撮影情報から作業者の位置、すなわち作業者が作業場のどの場所にいるかを認識する。
【0031】
この位置認識は、例えば映像撮影装置11の画角および床との距離、床との角度を事前に与えておくことで可能となる。撮影装置が通常のカラーカメラであれば、画像上での被写体の大きさおよび位置から、作業場における位置を認識できる。深度カメラであれば、さらに奥行きの情報も利用できるため、精度よく位置を認識できる。動作認識部16は、映像撮影装置11の撮影情報から作業員の要素動作を認識する。
【0032】
記憶部17は、ハードディスク装置(HDD)あるいはフラッシュメモリのような不揮発性の記憶装置からなり、各種の情報を格納する。この記憶部17は、場所動作テーブル20、動作モデル蓄積部21、および認識情報蓄積部22を有する。
【0033】
作業位置動作テーブルとなる場所動作テーブル20は、位置とその位置にて行われる作業員の要素動作とを対応付けしたテーブルである。動作モデル蓄積部21は、検知すべき要素動作の動作モデルが蓄積されている。この動作モデルは、例えば作業員が標準的な作業動作を行った際の、一連の動作関連情報である。
【0034】
〈場所動作テーブルの構成例〉
図2は、
図1の記憶部17が有する場所動作テーブル20におけるデータ構成の一例を示す説明図である。
【0035】
場所動作テーブル20は、認識対象となる作業員の要素動作に対して、その要素動作が実行されうる領域および該領域における要素動作が示す動作の意味を格納したものである。場所動作テーブル20は、
図2に示すように、「場所」、「動作ID」、および「動作意味」のデータから構成されている。
【0036】
「場所」は、作業場のどの位置あるいは領域であるかを示すデータであり、例えば座標などによって表される。「動作ID」は、その「場所」において認識対象となる作業員の要素動作を特定するもので、
図2の例では、数字によって示されている。「動作意味」は、その場所における認識対象となる作業員の要素動作がどのような意味を持つのかを示すデータである。
【0037】
〈場所動作テーブルの他の構成例〉
図3は、
図2の場所動作テーブル20におけるデータ構成の他の例を示す説明図である。
【0038】
図2に示す場所動作テーブル20の場合、「場所」毎に「動作ID」と「動作意味」とがそれぞれ対応していたが、この
図3に示す場所動作テーブル20では、「動作ID」毎に「場所」と「動作意味」とがそれぞれ対応するテーブルとなっている。
【0039】
〈動作モデルの構成例〉
図4は、
図1の記憶部17が有する動作モデル蓄積部21に蓄積される動作モデルにおけるデータ構成の一例を示す説明図である。
【0040】
動作モデル蓄積部21に蓄積される動作モデルは、
図4に示すように、「動作ID」および「動作モデル」からなる。
【0041】
「動作モデル」は、前述のように、認識対象となる作業員の要素動作を数値化したものである。予め作業員が標準的な作業を行った際の一連の動作関連情報であり、1回撮影した動作関連情報をそのまま動作モデルとして用いてもよいし、複数回撮影した動作関連情報を動作モデルとして用いてもよい。後者の場合は、複数回撮影した動作関連情報をそのまま動作モデルとして用いてもよいし、平均を用いてもよい。
【0042】
認識情報蓄積部22は、動作認識部16が生成した認識情報を蓄積する。この認識情報蓄積部22に蓄積される認識情報は、例えば「時刻」、「場所」、「動作ID」、および「動作意味」からなる。
【0043】
「時刻」は、例えば作業者が作業を開始した時間である。あるいは作業を開始した時間から該作業を終了した時間までであってもよい。これは、例えば動作認識部16が作業員の要素動作を認識した際の時間である。
【0044】
「場所」は、作業者が作業している位置を示す。「動作ID」は、認識対象となる作業員の要素動作を特定するものである。「動作意味」は、その「動作ID」が該当「場所」においてどのような意味を持つ動作であるかを示す。
【0045】
〈振る舞い検知システムの動作例〉
続いて、振る舞い検知システム10の動作について説明する。
【0046】
図5は、
図1の振る舞い検知システム10における動作の一例を示すフローチャートである。この
図5では、振る舞い検知システム10による振る舞い認識処理について説明する。振る舞い認識処理は、作業員の作業位置および要素動作を認識して認識情報を生成し、該認識情報を格納する処理である。
【0047】
なお、
図5では、以下に説明する振る舞い認識処理を位置認識部15および動作認識部16などによるハードウェアによって実行する場合について説明するが、該振る舞い認識処理は、例えば、
図1の認識処理部12に設けられた図示しないプログラム格納メモリなどに記憶されているプログラム形式のソフトウェアに基づいて実行するようにしてもよい。
【0048】
ソフトウェアに基づいて実行される場合、該ソフトウェアは、例えば認識処理部12が有する図示しないCPU(Central Processing Unit)などによって実行されるものとする。
【0049】
まず、位置認識部15は、作業を開始した作業者の位置を、例えば上述の方法に基づいて認識する(ステップS101)。
【0050】
続いて、位置認識部15は、認識した作業者の位置を動作認識部16に出力する。動作認識部16は、
図2の場所動作テーブル20を参照して位置認識部15が認識した位置に対応する認識対象、すなわち作業者の要素動作を取得する(ステップS102)。
【0051】
例えば
図2の場所動作テーブル20において、位置認識部15が認識した位置が(1.0,2.0)の場合には、認識対象の要素動作の「動作ID」は’1’および’2’となる。
【0052】
そして、動作認識部16は、記憶部17の動作モデル蓄積部21からステップS102の処理にて取得した「動作ID」に対応するすべての動作モデルを読み出す(ステップS103)。
【0053】
続いて、動作認識部16は、映像撮影装置11が撮影した作業員の撮影情報から、動作関連情報を算出する(ステップS104)。そして、動作認識部16は、ステップS104の処理にて算出した動作関連情報に対して、ステップS103の処理にて読み出した動作モデルのうち、もっとも類似している動作モデルの「動作ID」を動作認識結果として取得する(ステップS105)。
【0054】
図4の動作モデル蓄積部21において、例えば作業情報に最も類似している動作モデルが(0.53、0.52、0.33)であった場合、該動作モデルに対応する「動作ID」は、’1’となる。よって、動作認識結果は、’1’となる。なお、一つの動作モデルに複数の動作関連情報が蓄積されている場合は、例えば、ステップS104の処理にて算出した動作関連情報と、該当動作モデル内のそれぞれとの動作関連情報を比較し、そのうち最も類似していた結果を、該当動作モデルとの比較結果として採用する。
【0055】
続いて、動作認識部16は、ステップS105の処理による認識結果に対応する動作意味を場所動作テーブル20から取得して(ステップS106)、認識情報を生成して記憶部17の認識情報蓄積部22に蓄積する(ステップS107)。
【0056】
例えばステップS101の処理にて位置認識部15が認識した位置が(1.0,2.0)であり、ステップS105の処理にて動作認識結果が’1’であった場合、
図2の場所動作テーブル20を参照すると、動作意味は「レバーを回す」となる。
【0057】
また、動作認識部16が生成する認識情報は、上述したように作業を開始した時刻、作業員の位置、動作認識結果、および動作意味を関連付けしたものである。
【0058】
以上により、振る舞い認識処理が終了となる。
【0059】
このように、作業員の要素動作だけでなく、作業員の位置を加味して動作認識を行うことにより、同じ要素動作であっても作業員の作業位置によって異なる動作意味があることを認識することができる。
【0060】
これにより、作業動作の認識精度を向上させることができる。
【0061】
また、上述したように、作業員の位置別に異なる動作意味を認識するので、動作認識部16の認識処理にかかる負荷を軽減することができる。その結果、認識処理の時間を短縮することができ、振る舞い検知システム10のパフォーマンスを向上させることができる。さらに、動作モデル蓄積部21に蓄積される動作モデルを増やすことによって、より作業動作の認識精度を向上させることができる。
【0062】
〈認識情報の表示例〉
ここで、認識情報蓄積部22に蓄積する認識情報は、表示装置13に表示するようにしてもよい。この表示は、例えば動作認識部16が認識情報蓄積部22の認識情報を読み出して表示装置13に表示させる。
【0063】
あるいは、振る舞い検知システム10が有する図示しないマウスやキーボードなどの入力部によって認識情報を表示する要求が入力された際に、動作認識部16が認識情報蓄積部22の認識情報を読み出して表示装置13に表示させるようにしてもよい。
【0064】
これにより、監督者が表示装置13に表示されている認識情報を閲覧することにより、作業者が予め定められた作業を行っているかなどを効率よく確認することができる。
【0065】
また、作業によっては、予め定められた時間帯に定められた作業(以下、規定作業という)を行うことが取り決めされているものがある。動作認識部16は、規定作業が行われているか否かを判定し、作業員による規定作業が行われていない場合には、表示装置13などにアラートを出力するようにしてもよい。
【0066】
この場合、記憶部17には、規定作業情報蓄積部が含まれ、該規定作業情報蓄積部には、予め規定作業を行う位置、時間帯、および動作意味を格納する。そして、動作認識部16は、認識情報蓄積部22に蓄積されている認識情報を検索して、規定作業情報に定められた位置にて、定められた動作意味に対応した動作が行われているか否か、一例としては作業の順番や作業の過不足を判定する。
【0067】
このとき、動作認識部16は、認識情報蓄積部22に蓄積されている認識情報である規定作業情報の時間帯を加味して、規定作業情報に定められた位置で、定められた動作意味に対応した動作が行われているか否かを判定するようにしてもよい。
【0068】
動作認識部16は、規定作業情報に類似する認識情報がない場合、規定作業が行われていないと判断して、表示装置13などに規定作業が行われていない旨のアラートを出力する。
【0069】
これにより、監督者は、作業員が規定作業を行ったか否かをより短時間で簡単に確認することができる。
【0070】
以上により、監督者による作業員の作業動作の確認を効率よく行うことができる。
【0071】
〈振る舞い検知システムの他の構成例〉
また、本実施の形態では、記憶部17に動作モデル蓄積部21を有する構成としたが、該動作モデル蓄積部21は、例えばインターネットなどを通じて接続される構成としてもよい。
【0072】
図6は、
図1の振る舞い検知システム10の他の構成例を示す説明図である。
【0073】
図6の振る舞い検知システム10が
図1の振る舞い検知システム10と異なるところは、動作モデル蓄積部21が例えばクラウド上のストレージ、いわゆるクラウドストレージからなる点である。この場合、動作モデル蓄積部21は、インターネットなどの通信回線30を通じて認識処理部12に接続される。
【0074】
例えば作業内容や作業場の構成などがほぼ同じであれば、通信回線30を通じて動作モデルを動作モデル蓄積部21にアップロードするだけでよく、各々の作業場において、個別に動作モデルを予め入力するなどの作業を不要とすることができる。これにより、振る舞い検知システム10を用いる際の工数を削減することができる。
【0075】
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
【0076】
なお、本発明は上記した実施の形態に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施の形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
【0077】
また、ある実施の形態の構成の一部を他の実施の形態の構成に置き換えることが可能であり、また、ある実施の形態の構成に他の実施の形態の構成を加えることも可能である。また、各実施の形態の構成の一部について、他の構成の追加、削除、置換をすることが可能である。