(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024098321
(43)【公開日】2024-07-23
(54)【発明の名称】動作学習装置、動作学習システム、動作学習方法及び動作学習プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20240716BHJP
【FI】
G06N20/00
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023001757
(22)【出願日】2023-01-10
(71)【出願人】
【識別番号】000002945
【氏名又は名称】オムロン株式会社
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】木焦 火炎
(72)【発明者】
【氏名】藤本 慎也
(57)【要約】
【課題】より容易に動作認識学習の精度を高める。
【解決手段】本動作学習装置は、作業エリア内で移動する作業者を撮影する第1カメラで撮影された第1動画像データを基に上記作業者の位置を認識する位置認識部と、上記作業者の上記位置を基に、上記作業エリア内の所定の作業場所において複数回行われた作業の夫々についての作業時間の統計値を算出する作業時間算出部と、上記作業エリア内の所定の作業場所における上記作業者の作業を撮影する第2カメラで撮影されて記憶部に蓄積された第2動画像データから、上記第2動画像データにおける上記作業の開始から終了までの時間と上記統計値との差が所定範囲内の学習データを抽出する抽出部と、上記学習データを用いて動作認識学習を実施する学習部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
作業エリア内で移動する作業者を撮影する第1カメラで撮影された第1動画像データを基に前記作業者の位置を認識する位置認識部と、
前記作業者の前記位置を基に、複数回行われた作業の夫々についての作業時間の統計値を算出する作業時間算出部と、
前記作業エリア内の所定の作業場所における前記作業者の作業を撮影する第2カメラで撮影されて記憶部に蓄積された第2動画像データから、前記第2動画像データにおける前記作業の開始から終了までの時間と前記統計値との差が所定範囲内である学習データを抽出する抽出部と、
前記学習データを用いて動作認識学習を実施する学習部と、を備える、
動作学習装置。
【請求項2】
前記統計値は、前記作業時間の最頻値を含み、
前記抽出部は、前記記憶部から、前記第2動画像データにおける前記作業の開始から終了までの時間と前記最頻値との差が前記所定範囲内の前記学習データを抽出する、
請求項1に記載の動作学習装置。
【請求項3】
前記作業エリア内では複数の前記作業者が前記作業を行っており、
前記作業時間算出部は、前記複数の前記作業者夫々について前記統計値を算出し、
前記抽出部は、前記複数の前記作業者夫々について前記統計値の標準偏差を算出し、前記標準偏差から所定範囲外の前記統計値が算出された前記作業者についての前記第2動画像データを前記学習データから除外する、
請求項1または2に記載の動作学習装置。
【請求項4】
作業エリア内で移動する作業者を撮影する第1カメラと、
前記作業エリア内の所定の作業場所における前記作業者の作業を撮影する第2カメラと、
前記第1カメラで撮影された第1動画像データを基に前記作業者の位置を認識する位置認識部と、
前記作業者の前記位置を基に、前記作業エリア内の所定の作業場所において複数回行われた作業の夫々についての作業時間の統計値を算出する作業時間算出部と、
前記第2カメラで撮影された第2動画像データを蓄積した記憶部から、前記第2動画像データにおける前記作業の開始から終了までの時間と前記統計値との差が所定範囲内の学習データを抽出する抽出部と、
前記学習データを用いて動作認識学習を実施する学習部と、を備える、
動作学習システム。
【請求項5】
コンピュータが、
作業エリア内で移動する作業者を撮影する第1カメラで撮影された第1動画像データを基に前記作業者の位置を認識する位置認識ステップと、
前記作業者の前記位置を基に、前記作業エリア内の所定の作業場所において複数回行われた作業の夫々についての作業時間の統計値を算出する作業時間算出ステップと、
前記所定の作業場所における前記作業者の前記作業を撮影する第2カメラで撮影されて記憶部に蓄積された第2動画像データから、前記第2動画像データにおける前記作業の開始から終了までの時間と前記統計値との差が所定範囲内の学習データを抽出する抽出ステップと、
前記学習データを用いて動作認識学習を実施する学習ステップと、を実行する、
動作学習方法。
【請求項6】
コンピュータに、
作業エリア内で移動する作業者を撮影する第1カメラで撮影された第1動画像データを基に前記作業者の位置を認識する位置認識ステップと、
前記作業者の前記位置を基に、前記作業エリア内の所定の作業場所において複数回行われた作業の夫々についての作業時間の統計値を算出する作業時間算出ステップと、
前記所定の作業場所における前記作業者の前記作業を撮影する第2カメラで撮影されて記憶部に蓄積された第2動画像データから、前記第2動画像データにおける前記作業の開始から終了までの時間と前記統計値との差が所定範囲内の学習データを抽出する抽出ステップと、
前記学習データを用いて動作認識学習を実施する学習ステップと、を実行させる、
動作学習プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動作学習装置、動作学習システム、動作学習方法及び動作学習プログラムに関する。
【背景技術】
【0002】
人を撮影した動画像データを学習データとして動作認識を行う学習モデルを構築することが行われている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Zhi Hou、他3名、“Visual Compositional Learning for Human-Object Interaction Detection”、[online]、[令和4年11月14日検索]、インターネット<URL: https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123600579.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0004】
工場等における作業者の作業を動作認識学習させた学習モデルを構築することが行われている。しかしながら、動作認識学習に用いる学習データの中に所定の作業以外の動作を含む動画像データが含まれていると、動作認識学習によって生成される学習モデルの精度が低下する。そのため、そのような所定の作業以外の動作を含む動画像データは、人手で学習データから除外されていた。しかしながら、このような動画像データを人手で除外するのは、極めて作業負担の大きいものあった。
【0005】
開示の技術の1つの側面は、より容易に動作認識学習の精度を高めることができる動作学習装置、動作学習システム、動作学習方法及び動作学習プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
開示の技術の1つの側面は、次のような動作学習装置によって例示される。本動作学習装置は、作業エリア内で移動する作業者を撮影する第1カメラで撮影された第1動画像データを基に上記作業者の位置を認識する位置認識部と、上記作業者の上記位置を基に、複数回行われた作業の夫々についての作業時間の統計値を算出する作業時間算出部と、上記作業エリア内の所定の作業場所における上記作業者の作業を撮影する第2カメラで撮影されて記憶部に蓄積された第2動画像データから、上記第2動画像データにおける上記作業の開始から終了までの時間と上記統計値との差が所定範囲内の学習データを抽出する抽出部と、上記学習データを用いて動作認識学習を実施する学習部と、を備える。
【0007】
上記所定の作業場所において同一の作業が行われる場合、作業時間は略一定になると考えられる。しかしながら、作業は作業者という人によって行われることから、所定の作業以外の動作によって作業時間が長くなる場合も考えられる。上記動作学習装置では、上記第1カメラで撮影された第1動画像データを基に複数回行われた上記作業についての作業時間の統計値が算出される。そして、上記作業者の作業を撮影する第2カメラによって撮影された第2動画像データのうち、上記第2動画像データにおける上記作業の開始から終了までの時間と上記統計値との差が所定範囲内の学習データが動作認識学習に用いられる。統計値が用いられることで所定の作業以外の動作による作業時間の変動の影響が抑制されるため、所定の作業以外の動作を可能な限り含まない第2動画像データが動作認識学習
の学習データとして用いられることになる。ひいては、本動作学習装置によれば、より容易に動作認識学習の精度を高めることができる。
【0008】
ここで、上記統計値として、最頻値が採用されてもよい。上記作業において所定の作業以外の動作が行われるのは、操作を誤った場合のようなイレギュラーな事象が発生した場合と考えられる。そのため、偶発的な動作を含まない標準的な作業時間として最頻値を採用できると考えられる。
【0009】
上記動作学習装置は、次の特徴を備えてもよい。上記作業エリア内では複数の上記作業者が上記作業を行っており、上記作業時間算出部は、上記複数の上記作業者夫々について上記統計値を算出し、上記抽出部は、上記複数の上記作業者夫々について上記統計値の標準偏差を算出し、上記標準偏差から所定範囲外の上記統計値が算出された上記作業者についての上記第2動画像データを上記学習データから除外する。
【0010】
動作認識学習においては、多数の上記作業者についての上記第2動画像データを用いて学習を行った方が、学習の精度は高くなると考えられる。一方で、極端に作業時間が他の作業者と異なる作業者についての第2動画像データをも動作認識学習に採用してしまうと、かえって動作認識学習の精度が低下する虞もある。そこで、上記動作学習装置では、上記標準偏差から所定範囲外の上記統計値が算出された上記作業者についての上記第2動画像データを上記学習データから除外することで、動作認識学習の精度低下が抑制される。
【0011】
上記動作学習装置は、動作学習システム、動作学習方法及び動作学習プログラムの側面から把握することも可能である。
【発明の効果】
【0012】
開示の技術によれば、より容易に動作認識学習の精度を高めることができる。
【図面の簡単な説明】
【0013】
【
図1】
図1は、実施形態に係る動作学習システムの一例を示す図である。
【
図2】
図2は、実施形態に動作学習装置のハードウェア構成の一例を示す図である。
【
図3】
図3は、実施形態に係る動作学習装置の処理ブロックの一例を示す図である。
【
図4】
図4は、ある作業台における作業時間の出現頻度の一例を示す図である。
【
図5】
図5は、作業撮影カメラによって撮影された第2動画像データの一例を示す図である。
【
図6】
図6は、実施形態に係る動作学習装置の処理フローの一例を示す図である。
【
図7】
図7は、ある作業台における3名の作業者の作業時間の出現頻度の一例を示す図である。
【
図8】
図8は、第1変形例に係る動作学習装置の処理ブロックの一例を示す図である。
【発明を実施するための形態】
【0014】
<適用例>
本発明の適用例について説明する。適用例に係る動作学習システム400は、例えば、工場500で作業する作業者H1の作業を動作学習装置100に学習させるシステムである。動作学習システム400は、俯瞰カメラ1、作業撮影カメラ2A、2B、2C、2D、2E、動作学習装置100及びネットワークN1を備える。俯瞰カメラ1、作業撮影カメラ2A、2B、2C、2D、2E及び動作学習装置100は、ネットワークN1によって相互に接続される。ネットワークN1は、情報処理装置を相互に接続するコンピュータ
ネットワークである。
【0015】
俯瞰カメラ1は、工場500内を俯瞰できる位置に配置されるカメラである。すなわち、俯瞰カメラ1は、工場500内に配置された作業台3A、3B、3C、3D、3E及び、工場500内で作業する作業者H1を撮影範囲に含む位置に配置される。俯瞰カメラ1によって撮影された動画像データは、ネットワークN1を介して動作学習装置100に出力される。
【0016】
作業撮影カメラ2A、2B、2C、2D、2Eは、作業台3A、3B、3C、3D、3Eの夫々における作業者H1の作業を撮影する。作業撮影カメラ2Aは、作業台3Aに撮影方向を向けて配置される。同様に、作業撮影カメラ2B、2C、2D、2Eは、作業台3B、3C、3D、3Eの夫々に撮影方向を向けて配置される。作業撮影カメラ2A、2B、2C、2D、2Eの夫々を区別しないときは、作業撮影カメラ2とも称する。また、作業台3A、3B、3C、3D、3Eの夫々を区別しないときは、作業台3とも称する。作業撮影カメラ2によって撮影された動画像データは、ネットワークN1を介して動作学習装置100に出力される。
【0017】
作業台3は、作業者H1による作業が行われるテーブルである。作業台3A、3B、3C、3Dの夫々では、工場500における一連の作業工程における各工程の作業が行われる。例えば、作業台3Aでは部品のケースへの嵌合が行われ、作業台3Bでは嵌合された部品のケースへのネジ締めが行われる。続いて、作業台3Cでは製品の外観検査が行われ、作業台3Dではケースへのラベル貼付が行われる。そして、作業台3Eでは、製品の梱包が行われる。作業者H1は、例えば、作業台3を移動しながら夫々の作業工程における作業を遂行する。すなわち、作業者H1がどの作業台3で作業しているかによって、作業者H1が行う作業を特定することができる。作業台3における作業者H1の作業の様子は、作業撮影カメラ2によって撮影される。
【0018】
動作学習装置100は、情報処理装置である。動作学習装置100は、俯瞰カメラ1によって撮影された第1動画像データ及び作業撮影カメラ2によって撮影された第2動画像データを記憶部(例えば、後述の補助記憶部103)に蓄積する。動作学習装置100は、俯瞰カメラ1によって撮影された第1動画像データについて、作業者H1の位置を認識する。動作学習装置100は、例えば、作業台3Aへと作業者H1が移動したことで作業台3Aにおける作業を作業者H1が開始したと判定し、作業台3Aから作業者H1が移動したことで作業台3Aにおける作業を作業者H1が終了したと判定する。動作学習装置100は、このような処理によって、作業台3における作業の開始から終了までの第1作業時間を算出する。各作業台3では繰り返し作業が実施されるため、動作学習装置100は、作業台3において繰り返し実施された作業の夫々について第1作業時間を算出し、算出した第1作業時間の統計値(例えば、最頻値)を算出する。
【0019】
動作学習装置100は、作業撮影カメラ2によって撮影された第2動画像データの夫々について、作業認識を行うことで作業台3の夫々における第2作業時間を算出する。そして、動作学習装置100は、作業撮影カメラ2によって撮影された第2動画像データから、上記統計値との作業時間の差が所定範囲内の第2動画像データを抽出する。動作学習装置100は、抽出した第2動画像データを学習データとして用い、動作認識学習を実行して学習モデルを構築する。
【0020】
作業台3の夫々で実施される作業工程が定められていることから、作業者H1によって作業台3の夫々で周期的な作業が行われ、ひいては、夫々の作業台3で行われる作業の作業時間は略一定になると考えられる。しかしながら、作業台3の夫々では人によって作業が実施されるため、予定された作業内容以外の非周期的な動作が行われることもあり、そ
のような非周期的な動作によって作業時間が想定より長くなることがある。非周期的な動作が行われた動画像データを基に動作認識学習が実行されると、構築される学習モデルの精度が低下する虞がある。
【0021】
本適用例では、俯瞰カメラ1によって撮影された動画像データを基に作業時間の統計値が算出される。そして、作業撮影カメラ2によって撮影された動画像データから、算出した統計値との作業時間の差が所定範囲内の動画像データが抽出され、抽出された動画像データが動作認識学習に用いられる。本適用例では、算出した統計値との作業時間の差が所定範囲外の動画像データを動作認識学習に用いる動画像データから除外することで、非周期的な動作が含まれる動画像データを動作認識学習の学習データから除外することができる。そのため、本適用例によれば、より容易に非周期的な動作を含む動画像データを学習データから除外できる。
【0022】
<実施形態>
以下、図面を参照して実施形態についてさらに説明する。
図1は、実施形態に係る動作学習システム400の一例を示す図である。動作学習システム400では、動作学習装置100は、適用例でも説明した通り、工場500内を俯瞰する位置に設けられた俯瞰カメラ1、作業台3の夫々における作業を撮影する作業撮影カメラ2、及び、動作認識学習を行う動作学習装置100を備える。
【0023】
俯瞰カメラ1及び作業撮影カメラ2は、例えば、ネットワークカメラである。また、俯瞰カメラ1及び作業撮影カメラ2は、例えば、Charge Coupled Device(CCD)イメージセンサーやComplementary Metal Oxide Semiconductor(CMOS)イメージセンサーを有するデジタルカメラである。デジタルビデオカメラである。俯瞰カメラ1は、例えば、魚眼レンズを備えることで広い撮影範囲をカバーしてもよい。
【0024】
俯瞰カメラ1は、上記の通り、工場500内に配置された作業台3A、3B、3C、3D、3E及び、工場500内で作業する作業者H1を撮影範囲に含む位置に配置される。そのため、動作学習装置100は、俯瞰カメラ1の第1動画像データによって作業者H1の作業動線を把握できる。また、作業撮影カメラ2は、上記の通り、作業台3の夫々に対応付けて配置される。そのため、動作学習装置100は、作業撮影カメラ2の第2動画像データによって作業台3の夫々における作業者H1による作業の詳細を把握できる。俯瞰カメラ1及び作業撮影カメラ2は、撮影した動画像データをネットワークN1を介して動作学習装置100に出力する。
【0025】
ネットワークN1は、例えば、Local Area Netowork(LAN)である。ネットワークN1は、有線であっても無線であってもよい。
【0026】
動作学習装置100は、Central Processing Unit(CPU)及び記憶部を有する情報処理装置である。動作学習装置100は、俯瞰カメラ1から取得した第1動画像データを基に作業者H1の位置を認識するとともに、作業台3における作業者H1による作業時間を算出する。また、動作学習装置100は、作業撮影カメラ2から取得した第2動画像データを基に、当該作業撮影カメラ2が撮影対象とする作業台3における作業時間を算出する。動作学習装置100は、作業撮影カメラ2によって撮影された動画像データのうち、第1動画像データを基に算出された作業時間との差が所定の範囲内の作業時間である第2動画像データを学習データとして抽出して、抽出した第2動画像データを用いて動作認識学習を行う。
【0027】
図2は、実施形態に動作学習装置100のハードウェア構成の一例を示す図である。動
作学習装置100は、CPU101、主記憶部102、補助記憶部103、通信部104及び接続バス105を備える。CPU101、主記憶部102、補助記憶部103及び通信部104は、接続バス105によって相互に接続される。
【0028】
CPU101は、マイクロプロセッサーユニット(MPU)、プロセッサーとも呼ばれる。CPU101は、単一のプロセッサーに限定される訳ではなく、マルチプロセッサー構成であってもよい。また、単一のソケットで接続される単一のCPU101がマルチコア構成を有していてもよい。CPU101が実行する処理のうち少なくとも一部は、CPU101以外のプロセッサー、例えば、Digital Signal Processor(DSP)、Graphics Processing Unit(GPU)、数値演算プロセッサー、ベクトルプロセッサー、画像処理プロセッサー等の専用プロセッサーで行われてもよい。また、CPU101が実行する処理のうち少なくとも一部は、集積回路(IC)、その他のデジタル回路によって実行されてもよい。また、CPU101の少なくとも一部にアナログ回路が含まれてもよい。集積回路は、Large Scale Integrated circuit(LSI)、Application Specific Integrated Circuit(ASIC)、プログラマブルロジックデバイス(PLD)を含む。PLDは、例えば、Field-Programmable Gate Array(FPGA)を含む。CPU101は、プロセッサーと集積回路との組み合わせであってもよい。組み合わせは、例えば、マイクロコントローラーユニット(MCU)、System-on-a-chip(SoC)、システムLSI、チップセットなどと呼ばれる。動作学習装置100では、CPU101が補助記憶部103に記憶されたプログラムを主記憶部102の作業領域に展開し、プログラムの実行を通じて周辺装置の制御を行う。これにより、動作学習装置100は、所定の目的に合致した処理を実行することができる。主記憶部102及び補助記憶部103は、CPU101が読み取り可能な記録媒体である。
【0029】
主記憶部102は、CPU101から直接アクセスされる記憶部として例示される。主記憶部102は、Random Access Memory(RAM)及びRead Only Memory(ROM)を含む。
【0030】
補助記憶部103は、各種のプログラム及び各種のデータを読み書き自在に記録媒体に格納する。補助記憶部103は外部記憶装置とも呼ばれる。補助記憶部103には、オペレーティングシステム(Operating System、OS)、各種プログラム、各種テーブル等が格納される。OSは、通信部104を介して接続される外部装置等とのデータの受け渡しを行う通信インターフェースプログラムを含む。外部装置等には、例えば、ネットワークN1によって接続された俯瞰カメラ1及び作業撮影カメラ2が含まれる。
【0031】
補助記憶部103は、例えば、Erasable Programmable ROM(EPROM)、ソリッドステートドライブ(Solid State Drive、SSD)、ハードディスクドライブ(Hard Disk Drive、HDD)等である。また、補助記憶部103は、例えば、Compact Disc(CD)ドライブ装置、Digital Versatile Disc(DVD)ドライブ装置、Blu-ray(登録商標) Disc(BD)ドライブ装置等である。
【0032】
通信部104は、例えば、ネットワークN1とのインターフェースである。通信部104は、ネットワークN1を介して俯瞰カメラ1及び作業撮影カメラ2と通信を行う。
【0033】
<動作学習装置100の処理ブロック>
図3は、実施形態に係る動作学習装置100の処理ブロックの一例を示す図である。動
作学習装置100は、受信部11、位置認識部12、作業時間算出部13、抽出部14及び学習部15を備える。動作学習装置100は、主記憶部102に実行可能に展開されたコンピュータープログラムをCPU101が実行することで、上記動作学習装置100の、受信部11、位置認識部12、作業時間算出部13、抽出部14及び学習部15等の各部としての処理を実行する。
【0034】
受信部11は、俯瞰カメラ1から受信した第1動画像データ及び作業撮影カメラ2から受信した第2動画像データを補助記憶部103に記憶させる。位置認識部12、作業時間算出部13、抽出部14及び学習部15は、補助記憶部103に記憶された動画像データを用いて各種処理を実行する。
【0035】
位置認識部12は、俯瞰カメラ1から取得され、補助記憶部103に記憶された第1動画像データを基に、作業者H1の位置を認識する。
【0036】
作業時間算出部13は、位置認識部12によって認識された作業者H1の位置を基に、作業者H1の作業時間を算出する。作業時間算出部13は、例えば、作業者H1が作業台3Dに移動したときに、作業台3Dにおける作業(例えば、ケースへのラベル貼付)を作業者H1が開始されたと認識する。また、作業時間算出部13は、例えば、作業者H1が作業台3Dから移動したときに、作業台3Dにおける作業を作業者H1が完了したと認識する。そして、作業時間算出部13は、作業を開始したと認識した時刻と作業を終了したと認識した時刻とを基に、作業者H1による作業台3Dにおける作業時間を算出する。
【0037】
作業時間算出部13は、俯瞰カメラ1から取得した第1動画像データを基に、作業台3の夫々における第1作業時間を算出する。作業台3の夫々では予め決められた作業が繰り返し行われるため、作業台3の夫々について複数の第1作業時間が算出される。また、作業台3における作業は人によって行われるため、ネジ締めやケースへの嵌合等の同じ作業を繰り返し実施する周期的な作業以外にも、非周期的な動作が含まれ得る。非周期的な動作としては、例えば、物を落とした、操作を誤った、摩耗した部材を交換した、等を挙げることができる。このような非周期的な動作が生じることにより、作業台3における第1作業時間が標準的な作業時間よりも長くなることがある。
【0038】
図4は、ある作業台3における作業時間の出現頻度の一例を示す図である。
図4の縦軸は作業時間の出現頻度を示し、横軸は作業時間を示す。
図4では、ある作業台3における作業者H1による作業の第1作業時間の出現頻度の分布を例示する。作業者H1は、夫々の作業台3において所定の周期的な作業を実行する。そして、非周期的な動作が作業者H1によって行われるのは、物を落とした場合のようにイレギュラーな事象が発生した場合と考えられる。そのため、非周期的な動作を含まない標準的な第1作業時間は、
図4において最も出現頻度の高い作業時間であると考えられる。そこで、作業時間算出部13は、例えば、最も高い出現頻度の作業時間T1(最頻値)を作業者H1の当該ある作業台3における作業時間とする。
【0039】
抽出部14は、学習部15による動作認識学習に用いる第2動画像データを抽出する。抽出部14は、作業撮影カメラ2によって撮影された第2動画像データから作業者H1の第2作業時間を算出する。
図5は、作業撮影カメラ2によって撮影された第2動画像データの一例を示す図である。作業撮影カメラ2によって撮影された第2動画像データには、作業者H1の作業台3上に配置された手H11、H12及び作業台3における作業対象となるワークW1が含まれる。なお、
図5では、第2動画像データのうち、手H11、H12、ワークW1及び作業台3以外の被写体の映像は省略される。
【0040】
抽出部14は、第2動画像データにおいて、手H11を認識するバウンディングボック
スB1、手H12を認識するバウンディングボックスB2及びワークW1を認識するバウンディングボックスB3を設定する。そして、抽出部14は、設定したバウンディングボックスB1、B2、B3を用いた作業認識を行って、作業台3における作業の開始時刻及び終了時刻を認識する。そして、抽出部14は、認識した開始時刻及び終了時刻を基に、作業時間(第2作業時間とも称する)を算出する。ここで、抽出部14は、例えば、手H11、H12がワークW1を把持した時刻を作業の開始時刻とし、手H11、H12がワークW1を離した時刻を作業の終了時刻としてもよい。
【0041】
抽出部14は、補助記憶部103に記憶された第2動画像データから、作業時間算出部13によって算出された第1作業時間の最頻値と抽出部14によって算出した第2作業時間との差が所定範囲内の第2動画像データを学習データとして抽出する。抽出部14は、例えば、作業撮影カメラ2Aによって撮影されて補助記憶部103に記憶された第2動画像データから、作業時間算出部13によって算出された作業台3Aにおける第1作業時間の最頻値と抽出部14によって算出した作業台3Aにおける第2作業時間との差が所定範囲内の動画像データを作業台3Aにおける作業についての学習データとして抽出する。抽出部14は、他の作業撮影カメラ2によって撮影された動画像データについても同様に、学習データとして用いる第2動画像データを抽出する。
【0042】
学習部15は、抽出部14によって抽出された動画像データを用いて動作認識学習を行い、学習モデルを構築する。学習部15は、例えば、構築した学習モデルを補助記憶部103に記憶させる。
【0043】
<処理フロー>
図6は、実施形態に係る動作学習装置100の処理フローの一例を示す図である。以下、
図6を参照して、動作学習装置100の処理フローの一例について説明する。
【0044】
ステップS1では、受信部11は、俯瞰カメラ1からの第1動画像データ及び作業撮影カメラ2からの第2動画像データを受信する。受信部11は、受信した第1動画像データ及び第2動画像データを補助記憶部103に記憶させる。
【0045】
ステップS2では、位置認識部12は、補助記憶部103に記憶された第1動画像データを基に、作業者H1の位置を認識する。作業時間算出部13は、位置認識部12によって認識された作業者H1の位置を基に、作業台3の夫々で行われた作業の第1作業時間の最頻値を算出する。
【0046】
ステップS3では、作業時間算出部13は、補助記憶部103に記憶された第2動画像データを基に、作業台3の夫々で作業が行われた第2作業時間を算出する。
【0047】
ステップS4では、抽出部14は、ステップS2で算出された第1作業時間の最頻値及びステップS3で算出された第2作業時間を基に、補助記憶部103に記憶された第2動画像データから動作認識学習に用いる第2動画像データを抽出する。
【0048】
ステップS5では、学習部15は、ステップS4で抽出された動画像データを用いて動作認識学習を行い、学習モデルを構築する。
【0049】
<実施形態の作用効果>
本実施形態では、作業時間算出部13が、俯瞰カメラ1によって撮影された第1動画像データを用いて作業台3の夫々で複数回行われた作業について第1作業時間を算出し、算出した第1作業時間の最頻値を算出する。抽出部14は、作業撮影カメラ2によって撮影された第2動画像データの夫々について第2作業時間を算出する。そして、抽出部14は
、作業時間算出部13によって算出された第1作業時間の最頻値と抽出部14によって算出した第2作業時間との差が所定範囲内の第2動画像データを学習データとして抽出する。本実施形態では、このような処理によって、第2動画像データのうち、非周期な動作が含まれない第2動画像データを動作認識学習の学習データとして採用することができる。ひいては、学習部15によって生成される学習モデルの精度をより高いものとすることができる。
【0050】
本実施形態では、作業台3の夫々で複数回行われた作業についての作業時間の最頻値を第1作業時間として採用する。そのため、作業台3の夫々で行われる作業は予め定められた周期的な作業であるため、非周期的な動作を含む作業の出現頻度は低いと考えられる。本実施形態では、最頻値を第1作業時間として採用することで、非周期的な作業が含まれない蓋然性の高い第1作業時間を算出することができる。なお、第1作業時間は、最頻値に限定されず、平均値等の他の統計値であってもよい。
【0051】
<第1変形例>
作業台3の夫々における作業時間は、作業を担当する作業者の熟練度や技能によっても差が生じ得る。そこで、第1変形例では、個々の作業者による作業時間の差を考慮して、第2動画像データを抽出する変形例について説明する。
【0052】
図7は、ある作業台3における3名の作業者の作業時間の出現頻度の一例を示す図である。
図7の縦軸は作業時間の出現頻度を示し、横軸は作業時間を示す。
図7では、ある作業台3における3人の作業者(作業者H1、H2、H3)夫々による作業の作業時間の出現頻度の分布を例示する。
図7に例示するように、作業者によって作業時間の出現頻度は異なる。そして、より多くの作業者についての動画像データを用いて動作認識学習を実行した方が、より精度の高い学習モデルを作成できると考えられる。一方で、極端に作業時間が異なる作業者についての第2動画像データも動作認識学習に用いると、学習モデルの精度はかえって低下するとも考えられる。
【0053】
図8は、第1変形例に係る動作学習装置100Aの処理ブロックの一例を示す図である。第1変形例に係る動作学習装置100Aは、位置認識部12、作業時間算出部13及び抽出部14に代えて、位置認識部12A、作業時間算出部13A及び抽出部14Aを備える点で、実施形態に係る動作学習装置100とは異なる。
【0054】
位置認識部12Aは、俯瞰カメラ1から取得した第1動画像データを基に、作業者の夫々の位置を認識する。すなわち、位置認識部12Aは、作業者H1、H2、H3と3名の作業者が工場500において作業する場合に、作業者H1、H2、H3の夫々の位置を認識する。位置認識部12Aによる作業者H1、H2、H3夫々の認識は、例えば、服装、体格の違いや顔認識を用いてもよい。また、作業者H1、H2、H3の夫々が作業を行う時間帯が異なる場合には、位置認識部12Aは位置を認識した時間帯を基に作業者H1、H2、H3を認識してもよい。
【0055】
作業時間算出部13Aは、俯瞰カメラ1から取得した第1動画像データを基に、夫々の作業台3における夫々の作業者H1、H2、H3の第1作業時間の最頻値を算出する。
【0056】
抽出部14Aは、作業者H1、H2、H3のうち、他の作業者と作業時間が大幅に異なる一部の作業者についての動画像データを動作認識学習から除外する。抽出部14は、例えば、作業者H1、H2、H3についての作業時間の標準偏差をσとして、作業時間が所定範囲(例えば、σ、2σまたは3σ)外の作業時間である作業者の第2動画像データを動作認識学習から除外してもよい。換言すれば、抽出部14は、作業時間が所定範囲(例えば、σ、2σまたは3σ)内の作業時間である作業者の第2動画像データを動作認識学
習用の学習データとして抽出する。
【0057】
第1変形例によれば、極端に作業時間が異なる作業者についての第2動画像データを動作認識学習用の学習データから除外することで、学習モデルの精度を可及的に高めることができる。
【0058】
以上で開示した実施形態や変形例はそれぞれ組み合わせることができる。
【0059】
<コンピューターが読み取り可能な記録媒体>
コンピューターその他の機械、装置(以下、コンピューター等)に上記いずれかの機能を実現させる情報処理プログラムをコンピューター等が読み取り可能な記録媒体に記録することができる。そして、コンピューター等に、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。
【0060】
ここで、コンピューター等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピューター等から読み取ることができる記録媒体をいう。このような記録媒体のうちコンピューター等から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、Compact Disc Read Only Memory(CD-ROM)、Compact Disc-Recordable(CD-R)、Compact Disc-ReWriterable(CD-RW)、Digital Versatile Disc(DVD)、ブルーレイディスク(BD)、Digital Audio Tape(DAT)、8mmテープ、フラッシュメモリー、外付け型のハードディスクドライブやSolid State Drive(SSD)等がある。また、コンピューター等に固定された記録媒体として内蔵型のハードディスクドライブ、SSDやROM等がある。
【0061】
<付記>
作業エリア(500)内で移動する作業者(H1)を撮影する第1カメラ(1)で撮影された第1動画像データを基に前記作業者(H1)の位置を認識する位置認識部(12)と、
前記作業者(H1)の前記位置を基に、複数回行われた前記作業の夫々についての作業時間の統計値を算出する作業時間算出部(13)と、
前記作業エリア(500)内の所定の作業場所(3)における前記作業者(H1)の作業を撮影する第2カメラ(2)で撮影されて記憶部(103)に蓄積された第2動画像データから、前記第2動画像データにおける前記作業の開始から終了までの時間と前記統計値との差が所定範囲内の学習データを抽出する抽出部(14)と、
前記学習データを用いて動作認識学習を実施する学習部(15)と、
を備える、
動作学習装置(100)。
【符号の説明】
【0062】
1・・俯瞰カメラ
11・・受信部
12・・位置認識部
12A・・位置認識部
13・・作業時間算出部
13A・・作業時間算出部
14・・抽出部
14A・・抽出部
15・・学習部
2・・作業撮影カメラ
2A・・作業撮影カメラ
2B・・作業撮影カメラ
2C・・作業撮影カメラ
2D・・作業撮影カメラ
2E・・作業撮影カメラ
3・・作業台
3A・・作業台
3B・・作業台
3C・・作業台
3D・・作業台
3E・・作業台
100・・動作学習装置
100A・・動作学習装置
101・・CPU
102・・主記憶部
103・・補助記憶部
104・・通信部
105・・接続バス
400・・動作学習システム
500・・工場
H1・・作業者
H2・・作業者
H3・・作業者
H11・・手
H12・・手
B1・・バウンディングボックス
B2・・バウンディングボックス
B3・・バウンディングボックス
W1・・ワーク
N1・・ネットワーク