IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日立GEニュークリア・エナジー株式会社の特許一覧

特許7422043作業シミュレーション装置および学習装置
<>
  • 特許-作業シミュレーション装置および学習装置 図1
  • 特許-作業シミュレーション装置および学習装置 図2
  • 特許-作業シミュレーション装置および学習装置 図3
  • 特許-作業シミュレーション装置および学習装置 図4
  • 特許-作業シミュレーション装置および学習装置 図5
  • 特許-作業シミュレーション装置および学習装置 図6
  • 特許-作業シミュレーション装置および学習装置 図7
  • 特許-作業シミュレーション装置および学習装置 図8
  • 特許-作業シミュレーション装置および学習装置 図9
  • 特許-作業シミュレーション装置および学習装置 図10
  • 特許-作業シミュレーション装置および学習装置 図11
  • 特許-作業シミュレーション装置および学習装置 図12
  • 特許-作業シミュレーション装置および学習装置 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-17
(45)【発行日】2024-01-25
(54)【発明の名称】作業シミュレーション装置および学習装置
(51)【国際特許分類】
   G09B 9/00 20060101AFI20240118BHJP
   B25J 9/22 20060101ALI20240118BHJP
   B25J 5/00 20060101ALI20240118BHJP
   G05D 1/00 20240101ALI20240118BHJP
   G21C 17/013 20060101ALI20240118BHJP
【FI】
G09B9/00 Z
B25J9/22 A
B25J5/00 B
G05D1/00 B
G21C17/013
【請求項の数】 10
(21)【出願番号】P 2020161163
(22)【出願日】2020-09-25
(65)【公開番号】P2022054138
(43)【公開日】2022-04-06
【審査請求日】2022-12-21
(73)【特許権者】
【識別番号】507250427
【氏名又は名称】日立GEニュークリア・エナジー株式会社
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】小林 亮介
(72)【発明者】
【氏名】黒澤 孝一
(72)【発明者】
【氏名】石塚 一平
(72)【発明者】
【氏名】守中 廉
(72)【発明者】
【氏名】平野 克彦
(72)【発明者】
【氏名】関 洋
(72)【発明者】
【氏名】長井 隆浩
【審査官】岸 智史
(56)【参考文献】
【文献】特開平07-182017(JP,A)
【文献】特開2018-060511(JP,A)
【文献】特開2016-203972(JP,A)
【文献】特開平10-011122(JP,A)
【文献】特開平03-145687(JP,A)
【文献】米国特許出願公開第2019/0337343(US,A1)
【文献】米国特許出願公開第2018/0165979(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G09B 9/00- 9/56
G21C 17/00-17/14
G21F 9/30
B25J 5/00
B25J 9/22
G05D 1/00
(57)【特許請求の範囲】
【請求項1】
付帯物を備えた作業装置の状態と、操作装置から入力された当該作業装置に対して移動を指示する操作情報とから、当該操作情報に対応する当該作業装置の移動後における当該作業装置の状態を推定する推定部を備え
前記作業装置は移動可能なロボットであり、
前記付帯物は、前記作業装置が牽引する被牽引物である
ことを特徴とする作業シミュレーション装置。
【請求項2】
前記推定部は、
前記作業装置の状態と前記操作情報とを入力データとして含み、当該操作情報に対応する当該作業装置の移動後における当該作業装置の状態を出力データとして含む教師データを用いて訓練された機械学習モデルを用いて推定する
ことを特徴とする請求項1に記載の作業シミュレーション装置。
【請求項3】
前記推定部が推定した前記作業装置の状態の画像を生成する画像合成部をさらに備える
ことを特徴とする請求項1に記載の作業シミュレーション装置。
【請求項4】
記付帯物は、前記作業装置に接続され、当該作業装置により牽引されるケーブルおよびホースのうち少なくとも1つであり、
前記作業装置の状態は、前記付帯物の所在を含み、
前記画像合成部は、前記付帯物の画像を生成する
ことを特徴とする請求項3に記載の作業シミュレーション装置。
【請求項5】
記付帯物は、前記作業装置に接続され、当該作業装置により牽引されるケーブルおよびホースのうち少なくとも1つであり、
前記作業装置の状態は、前記作業装置の所在を含み、
前記画像合成部は、前記作業装置の画像を生成する
ことを特徴とする請求項3に記載の作業シミュレーション装置。
【請求項6】
記作業装置の状態は、前記被牽引物の所在を含み、
前記画像合成部は、前記付帯物の画像を生成する
ことを特徴とする請求項3に記載の作業シミュレーション装置。
【請求項7】
操作情報送信部をさらに備え
記付帯物は、前記作業装置に接続され、当該作業装置により牽引されるケーブルおよびホースのうち少なくとも1つであり、
前記作業装置の状態は、前記作業装置の所在および前記付帯物の所在を含み、
前記操作情報送信部は、前記作業装置の所在に移動を指示する操作情報を前記作業装置に送り、
前記画像合成部は、撮影画像に含まれる当該作業装置に接続されているように見えるように前記付帯物の画像を生成する
ことを特徴とする請求項3に記載の作業シミュレーション装置。
【請求項8】
付帯物を備えた作業装置の状態と、操作装置から入力された当該作業装置に対して移動を指示する操作情報とを入力データとして含み、当該操作情報に対応する当該作業装置の移動後における当該作業装置の状態を出力データとして含む教師データを用いて機械学習モデルを訓練する学習部を備え
前記作業装置は移動可能なロボットであり、
前記付帯物は、前記作業装置が牽引する被牽引物である
ことを特徴とする学習装置。
【請求項9】
前記学習装置には、前記作業装置を撮像するカメラが接続され、
前記カメラが撮像した画像から前記作業装置の状態を検出する画像解析部と、
検出された前記作業装置の状態と前記操作情報とから前記教師データを生成する教師データ生成部とを、さらに備える
ことを特徴とする請求項8に記載の学習装置。
【請求項10】
指定された前記作業装置の移動先への移動経路を生成する移動経路生成部と、
前記移動経路に沿って前記作業装置が移動するように指示する前記操作情報を生成する操作信号生成部とを、さらに備え、
前記学習部は、当該操作情報を入力データとして含む教師データを用いて前記機械学習モデルを訓練する
ことを特徴とする請求項8に記載の学習装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、付帯物が備わる作業装置を模擬する作業シミュレーション装置および学習装置に関する。
【背景技術】
【0002】
プラントの現地工事への一般的な対応としては、事前取得できる作業環境の条件などから作業装置の仕様を設定し、作業装置の設計・製作、現地作業環境を模擬したモックアップ設備の準備、それら装置や設備を利用したトレーニングを経て現地作業を行う。
一方、原子力発電所の建設、改造、廃炉など工事は、数年、数十年にわたる長期、かつ複雑なプロジェクトである。このような工事には不確定要素の多い作業が含まれることが多い。周辺環境や作業対象物が不確定で変化する場合には、事前取得できる情報が限定的であり、現地の状況を全て反映したモックアップ設備を準備することは困難である。また、現地の作業進捗に応じて作業装置やモックアップ設備の更新や新規製作・準備が頻繁に発生すると予想される。
【0003】
このことから、作業に必要な現物を全て用意することなく、一部模擬データを仮想的に発生させることで現地作業と同等のトレーニング効果が期待されるシステムが、特許文献1に記載されている。特許文献1によれば、実機と同様の配管などを用いることなく実際の試験と同様の操作による超音波探傷試験を仮想的に行うことを目的として、「超音波探傷試験の適用対象を模擬するダミー試験体と、当該ダミー試験体を対象として仮想的に行われる超音波探傷試験の探触子として用いられる模擬探触子と、ダミー試験体の外表面上における模擬探触子の位置を特定するための位置情報を取得する位置計測装置と、ダミー試験体の外表面上の位置座標毎の探傷波形のデータが収録された探傷波形データベースと、位置計測装置によって取得された位置情報に基づく模擬探触子のダミー試験体の外表面上における位置に対応するものとして探傷波形データベースから読み込まれた探傷波形のデータに基づく探傷波形が表示される表示装置の表示部とを有することを特徴とする仮想超音波探傷試験システム」が提案されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2016-057104号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に開示の手法は、その分野において一定程度以上の効果を奏することができるものである。しかしながら、単に複雑、長期というだけではなく、作業自体に不確定要素が多い作業について、この手法のみでは対応が困難である。
例えば、過酷事故が発生した原子力発電所の廃炉作業においては、炉内構造物や燃料デブリの加工計画(加工作業)、加工した対象物の搬出計画(搬出作業)、搬出物の建屋間移送計画(移送作業)、現地作業者の配置計画(人による現地作業)を策定し、計画を遂行する。これらの計画に係る目的関数を最小化/最大化することで、作業全体を効率的に進めることが一般的に求められている。しかしながら、廃炉作業のケースでは不確定要素が多く、最適な計画/作業を決めるのが困難である。
【0006】
原子力発電所の廃炉作業では燃料デブリを取り出すことに関連して、業務を取り巻く環境が高線量、暗所、高湿度、かつ場所によっては数値が不定(例えば、測定が不可能)であり、対象原子炉によっても状況が異なる。このため、作業ごとに作業装置(ロボット、例えばアームを備えた移動体)やモックアップ設備を全て準備して作業装置の動作確認、性能確認、作業性確認を行うことや、事前に作業員のトレーニングを行うことは多くの時間と費用を要することが想定される。
【0007】
作業装置が遠隔操作される場合、無線ではなく有線で作業信号が送受信される場合がある。また、作業装置自体(クローラを備えた移動体)やアームなどのアクチュエータは、電気駆動に限らずエア駆動や水圧駆動である場合がある。このような場合、作業装置にはケーブルやホースが接続され、作業装置の移動にともないケーブルやホースが引きずられて移動することになる。
作業現場には、建物や設備などの構造物の他に崩れた構造物(瓦礫)などもあり、このような障害物によるケーブルやホースに対する影響を考慮した作業装置の動作確認、性能確認、作業性確認をしながら、作業員はレーニングを行う。ケーブルやホースに限らず、トレーラ・台車・荷車のような被牽引物を牽引する作業装置(トラクタ)においても、作業員は、同様に障害物による被牽引物(貨物部分)への影響を考慮する。
【0008】
このため、不確定要素が多い現場で利用される作業装置に対しては、作業装置に備わるケーブルやホース、被牽引物などの付帯物まで考慮した作業装置の動作確認、性能確認、作業性確認、および作業員のトレーニングを支援する作業支援システムが望まれる。
本発明は、このような背景を鑑みてなされたものであり、付帯物が備わる作業装置を模擬する作業シミュレーション装置および学習装置を提供することを課題とする。
【課題を解決するための手段】
【0009】
前記した課題を解決するため、作業シミュレーション装置は、付帯物を備えた作業装置の状態と、操作装置から入力された当該作業装置に対して移動を指示する操作情報とから、当該操作情報に対応する当該作業装置の移動後における当該作業装置の状態を推定する推定部を備え、前記作業装置は移動可能なロボットであり、前記付帯物は、前記作業装置が牽引する被牽引物である
【0010】
また、学習装置は、付帯物を備えた作業装置の状態と、操作装置から入力された当該作業装置に対して移動を指示する操作情報とを入力データとして含み、当該操作情報に対応する当該作業装置の移動後における当該作業装置の状態を出力データとして含む教師データを用いて機械学習モデルを訓練する学習部を備え、前記作業装置は移動可能なロボットであり、前記付帯物は、前記作業装置が牽引する被牽引物である
【発明の効果】
【0011】
本発明によれば、付帯物が備わる作業装置を模擬する作業シミュレーション装置および学習装置を提供することができる。
上記した以外の課題、構成および効果は、以下の実施形態の説明により明らかにされる。
【図面の簡単な説明】
【0012】
図1】作業現場での作業装置(ロボット)を利用した作業を説明するための図である。
図2】本実施形態に係る教師データ収集・学習システムの全体構成図である。
図3】本実施形態に係る特徴量収集・学習装置の機能ブロック図である。
図4】本実施形態に係る学習モデルと教師データとを説明するための図である。
図5】本実施形態に係るケーブル・ホース類の特徴点を説明するための図である。
図6】本実施形態に係る教師データの収集手順のフローチャートである。
図7】本実施形態に係る特徴量収集・学習装置が実行する学習処理のフローチャートである。
図8】本実施形態に係る訓練システムの全体構成図である。
図9】本実施形態に係る表示装置の機能ブロック図である。
図10】本実施形態に係る表示装置が実行する画像生成処理のフローチャートである。
図11】本実施形態の変形例に係る訓練システムの全体構成図である。
図12】本実施形態の変形例に係る表示装置が実行する画像生成処理のフローチャートである。
図13】本実施形態の変形例に係る特徴量収集・学習装置の機能ブロック図である。
【発明を実施するための形態】
【0013】
本発明を実施するための形態(実施形態)における教師データ収集・学習システム10(後記する図2参照)および訓練システム20(後記する図8参照)を説明する前に、作業装置の概要を説明する。
【0014】
≪作業現場・作業装置の概要≫
図1は、作業現場880での作業装置810(ロボット)を利用した作業を説明するための図である。作業現場880は、例えば事故が発生した原子力発電所の廃炉作業の現場であって、瓦礫888が散乱している。作業装置810は、クローラ811とアーム815を備えて移動可能であって、現地オペレーションセンタ885から遠隔操作される。作業装置810は、作業員の操作指示に従って瓦礫888の撤去や燃料デブリ(不図示)の取り出し・搬出などの現地での作業を行う。なお、ここでのクローラ811は、一対の無限軌道(クローラ)とこの無限軌道を自在に駆動させる駆動装置を内蔵した本体とを含んで構成される移動体部分(アーム815が載置される台車部分)を指している。
【0015】
現地オペレーションセンタ885は、カメラ操作・表示装置840、操作装置850、および制御装置855を備える。作業員は、カメラ操作・表示装置840に接続され、作業現場880に設置されたカメラ830を操作しながら、作業装置810を含め作業現場880をモニタする。なお、図1ではカメラ830は1台であるが、複数台であってもよい。また、三脚などによって定点に設置されたものでなくともよい。
【0016】
操作装置850は、作業員が作業装置810を操作するための装置であって、クローラ811の移動やアーム815の操作に係る指示を入力する装置である。操作装置850に入力された操作指示(操作内容、操作情報)は、制御装置855において制御信号に変換されてケーブル・ホース類820を介して作業装置810に送られる。クローラ811に対する操作指示の内容として、例えば、最大速度で前進や45度右回転などがある。また、制御信号に対して作業装置810からフィードバックが返る場合がある。例えば、50cm前進という制御信号に対して40cmしか進まなかったというフィードバックである。
【0017】
なお、クローラ811やアーム815は、電気駆動やエア駆動、水圧駆動などであり、電力やエア、水などもケーブル・ホース類820を通じて作業装置810に送られる。このような場合、ケーブル・ホース類820は、重く、曲がりにくくなり、移動するクローラ811に対する負荷が大きくなることがある。
【0018】
作業現場880にある作業装置810(クローラ811)が、操作装置850に入力された指示どおりに移動するとは限らない。作業現場880が濡れてクローラ811がスリップしたり、ケーブル・ホース類820が瓦礫888に引っかかってクローラ811の移動を妨げたりする場合がある。このため、作業員は、作業装置810の移動先への最短経路を通る移動の指示を出すのではなく、瓦礫888とケーブル・ホース類820とが干渉しないように、移動先への経路を決めて作業装置810を操作することが求められる。
従って、作業現場880で実際の作業を行う(作業装置810を操作する)前に、作業員は作業装置810の操作を訓練する。訓練時の瓦礫888の位置や大きさについては、作業予定時点での瓦礫888の位置や大きさに限らず、将来予想される位置や大きさを含めて、様々な位置や大きさを設定して訓練することが望ましい。
【0019】
≪訓練システム、教師データ収集・学習システムの概要≫
訓練システム20(後記する図8参照)は、作業装置810を操作する作業員が、作業装置810の操作訓練を行うためのシステムである。作業員は、訓練システム20が生成した仮想的な作業現場880Bの画像を見ながら、操作装置850Bを介して、仮想的な作業装置810Bを操作することで訓練を受ける。教師データ収集・学習システム10(後記する図2参照)は、仮想的なケーブル・ホース類820Bの画像を生成するための機械学習モデル(後記する図3および図9記載の学習モデル130参照)を生成するシステムである。以下、教師データ収集・学習システム10、訓練システム20の順に、詳細に説明する。
【0020】
≪教師データ収集・学習システムの全体構成≫
図2は、本実施形態に係る教師データ収集・学習システム10の全体構成図である。教師データ収集・学習システム10および訓練システム20の管理者は、瓦礫888の替わりとなる干渉物889を試験設備エリア880Aに配置して、試験設備エリア880Aで実機の作業装置810を操作する。この作業装置810の操作は、学習モデル130の教師データを収集する作業の一部である。
管理者が作業装置810を操作している間に、教師データ収集・学習システム10は、カメラ830が取得した干渉物889や作業装置810、ケーブル・ホース類820の位置や作業装置810の操作内容から特徴量を取得して教師データを生成する。続いて、教師データ収集・学習システム10は、生成した教師データを用いて学習モデル130(後記する図3および図9参照)を訓練して生成する。
【0021】
教師データ収集・学習システム10は、試験設備オペレーションセンタ885Aに設置され、特徴量収集・学習装置100、操作装置850A、および制御装置855Aを含んで構成される。操作装置850Aおよび制御装置855Aは、操作装置850および制御装置855(図1参照)とそれぞれ同様であって、試験設備エリア880Aにある作業装置810への操作指示を受け付けて、作業装置810に制御信号を送る。なお、操作装置850Aおよび制御装置855Aは、操作内容(操作信号)や制御内容(制御信号)を後記する特徴量収集・学習装置100に送信する。
【0022】
≪特徴量収集・学習装置の構成≫
図3は、本実施形態に係る特徴量収集・学習装置100の機能ブロック図である。特徴量収集・学習装置100は、コンピュータであって、制御部110、記憶部120、入出力部160、およびカメラ操作部170を備える。入出力部160は、カメラ830、操作装置850A、制御装置855Aとの信号を送受信する。また、入出力部160にはディスプレイ(不図示)が接続され、カメラ830の撮影画像が表示される。カメラ操作部170は、カメラ830に対する操作を受け付け、入出力部160を介して操作信号をカメラ830に送る。
【0023】
記憶部120は、ROM(Read Only Memory)やRAM(Random Access Memory)、SSD(Solid State Drive)などから構成される。記憶部120には、プログラム121、学習モデル130、および教師データ140が記憶される。プログラム121には、学習処理(後記する図7参照)を含む特徴量収集・学習装置100が実行する処理の手順が記述される。
【0024】
≪学習モデル・教師データ≫
図4は、本実施形態に係る学習モデル130と教師データ140とを説明するための図である。学習モデル130は、干渉物889(図2参照)の位置(所在とも記す)、クローラ811の操作内容、操作前のクローラ811の位置、および操作前のケーブル・ホース類820の位置を入力とする。学習モデル130は、当該入力から、操作後のクローラ811の位置、および操作後のケーブル・ホース類820の位置を推定する機械学習モデルである。
【0025】
なお、学習モデル130は、機械学習モデルであって、機械学習モデルを示すパラメータの集合体であるが、クローラ811(作業装置810)やケーブル・ホース類820の位置を推定するプログラム/機能部と見なすこともできる。このため、学習モデル130が、操作前のクローラ811やケーブル・ホース類820の位置から、操作後のクローラ811やケーブル・ホース類820の位置を推定すると記載する場合がある。
【0026】
学習モデル130に対する教師データ140の入力データ141は、干渉物889の位置、クローラ811の操作内容、操作前のクローラ811の位置、および操作前のケーブル・ホース類820の位置である。また、教師データ140の出力データ142(正解データ、推定結果)は、操作後のクローラ811の位置、および操作後のケーブル・ホース類820の位置となる。
干渉物889の位置とは、試験設備エリア880Aにおける干渉物889の位置である。例えば、干渉物889の位置は、試験設備エリア880Aをメッシュ状に領域へ分割し、干渉物889が占める領域を示す情報である。なお、以下で領域とは、特に断りがない場合には、メッシュ状に分割された試験設備エリア880A(後記する仮想的な作業現場880Bや訓練設備エリア880Cを含む)の領域のことである。
【0027】
操作前のクローラ811およびケーブル・ホース類820の位置とは、クローラ811を操作する前で、クローラ811が移動する前のクローラ811およびケーブル・ホース類820の位置のことである。この位置は、例えば、クローラ811やケーブル・ホース類820が占める領域を示す情報である。なお、クローラ811の位置には、クローラ811の向きを示す情報、例えば、クローラ811の前部の位置(前部がある領域を示す情報)が含まれる。
【0028】
クローラ811の操作内容(操作情報)は、クローラ811に対する移動指示の内容を示す情報である。例えば、操作内容は、クローラ811(クローラ811の前部)の移動後の領域や当該領域に到達するまでの時間などを示す情報である。また、操作内容は、クローラ811(クローラ811の前部)の回転後の領域や当該回転に要する時間などを示す情報であってもよい。クローラ811の移動方向や移動距離、移動速度、移動に要する時間を示す情報(例えば、30cm前進、低速で5秒前進)であってもよいし、回転の向きや角度、速度(例えば、30度右回転)であってもよい。
【0029】
操作後のケーブル・ホース類820およびクローラ881の位置は、クローラ811を操作した後で、クローラ811が移動した後のクローラ811およびケーブル・ホース類820の位置であって、例えば、領域を示す情報である。なお、クローラ811の位置には、クローラ811の向きを示す情報が含まれる。
なお、ケーブル・ホース類820の位置の例として、ケーブル・ホース類820が占める領域を示す情報があるが、ケーブル・ホース類820の特徴点の位置(特徴点が存在する領域を示す情報)であってもよい。
【0030】
図5は、本実施形態に係るケーブル・ホース類820の特徴点を説明するための図である。特徴点は、ケーブル・ホース類820の形状(曲がり具合)を示すために設けられたケーブル・ホース類820上の特定の点であり、例えば、所定間隔で並んだケーブル・ホース類820上の点である。図5に記載のケーブル・ホース類820上の白い円が、特徴点である。
【0031】
≪特徴量収集・学習装置の構成:制御部≫
図3に戻って、制御部110は、CPU(Central Processing Unit)を含んで構成され、制御信号解析部111、操作信号解析部112、画像解析部113、教師データ生成部114、および学習部115を備える。
制御信号解析部111は、制御装置855Aから入力された作業装置810への制御信号を解析して、制御内容を取得する。操作信号解析部112は、操作装置850Aから入力された操作信号を解析して、操作内容(操作情報)を取得する。画像解析部113は、カメラ830からの画像を解析して、干渉物889やクローラ811、ケーブル・ホース類820の位置(領域)を取得する。
【0032】
教師データ生成部114は、管理者による試験設備エリア880Aでの実機の作業装置810の操作によって取得された操作内容、干渉物889やクローラ811、ケーブル・ホース類820の位置から教師データ140を生成する。学習部115は、教師データ140(図4参照)を用いて学習モデル130を訓練して生成する。学習モデル130は、入力データ141から推定結果となる出力データ142を出力する機械学習モデルとなる。
【0033】
≪教師データの収集手順≫
図6は、本実施形態に係る教師データ140の収集手順のフローチャートである。図6を参照して、管理者が実行する教師データの収集手順を説明する。
ステップS11において管理者は、試験設備エリア880Aにある干渉物889の配置を変えながらステップS12~S14を繰り返す。
ステップS12において管理者は、試験設備エリア880A内のクローラ811(作業装置810)の移動先を変えながらステップS13~S14を繰り返す。
【0034】
ステップS13において管理者は、移動先への移動経路を変えながらステップS14を繰り返す。
ステップS14において管理者は、移動経路に沿ってクローラ811の操作を繰り返す。詳しくは、管理者はクローラ811が移動経路に沿って移動するように、20cm前進、30度右回転など、クローラ811の操作を繰り返す。
なお、教師データ収集後に管理者は、特徴量収集・学習装置100に対して学習モデル130を生成するように指示する。
【0035】
≪学習処理≫
図7は、本実施形態に係る特徴量収集・学習装置100が実行する学習処理のフローチャートである。図7を参照しながら、ステップS14(図6参照)のクローラ811の操作中に実行される教師データ140の生成処理を含めた学習処理を説明する。
ステップS21において制御部110は、クローラ811の操作ごとにステップS22~S27を繰り返す。この繰り返しは、管理者が教師データ140を収集する間(図6参照)繰り返される。
ステップS22において操作信号解析部112は、操作内容を取得する。
【0036】
ステップS23において画像解析部113は、干渉物889の位置(領域)、向きを含めたクローラ811(作業装置810)の位置、およびケーブル・ホース類820の位置を取得する。
ステップS24において制御部110は、クローラ811が停止するまでステップS25を繰り返す。詳しくは、操作指示に対する制御信号を受けてクローラ811が移動を開始して停止するまで制御部110は、所定のタイミング(例えば所定周期)でステップS25を繰り返す。
【0037】
ステップS25は、ステップS23と同様である。
ステップS26において教師データ生成部114は、ステップS25の繰り返し回数に応じて、ステップS22で取得した操作内容を分割する。操作内容が30cm前進であって、ステップS25の繰り返し回数が10だとすると、教師データ生成部114は、例えば、操作内容を3cm前進が10回に分割する。操作内容が低速で10秒前進であって、ステップS25の繰り返し回数が20だとすると、教師データ生成部114は、例えば、操作内容を低速で0.5秒前進が20回に分割する。繰り返し回数が5で、操作内容が5つ先(隣)の領域への移動だとすると、例えば、1つずつ先(隣)の領域への移動が5回に分割してもよいし、他の分割手法であってもよい。
【0038】
ステップS27において教師データ生成部114は、教師データ140を生成する。詳しくは、教師データ生成部114は、ステップS26で分割した操作内容ごとに、ステップS23,S25で取得した位置を加えて、繰り返し回数(分割数)分の教師データ140を生成する。
繰り返し回数が10だとする。1つ目の教師データ140の入力データ141(図4参照)は、ステップS23で取得された干渉物889、クローラ811、およびケーブル・ホース類820の位置および分割された操作内容である。出力データ142(正解ラベル)は、10回繰り返されるステップS25のうち1回目で取得されたクローラ811、およびケーブル・ホース類820の位置である。
【0039】
2つ目の教師データ140の入力データ141は、10回繰り返されるステップS25のうち1回目で取得された干渉物889、クローラ811、およびケーブル・ホース類820の位置および分割された操作内容である。出力データ142は、10回繰り返されるステップS25のうち2回目で取得されたクローラ811、およびケーブル・ホース類820の位置である。教師データ生成部114は、このようにして繰り返し回数分の教師データ140を生成する。
ステップS28において学習部115は、管理者の指示を受けて、ステップS27で生成された教師データ140を用いて学習モデル130を訓練して生成する。
【0040】
≪教師データ収集・学習システムの全体構成≫
図8は、本実施形態に係る訓練システム20の全体構成図である。作業員は、訓練システム20が生成した仮想的な作業現場880Bの画像を見ながら、操作装置850Bを介して、仮想的な作業装置810Bを操作することで訓練を受ける。作業現場880Bの画像には、仮想的な作業装置810Bに限らず、仮想的な瓦礫(仮想的な干渉物889B)や仮想的なケーブル・ホース類820Bが含まれる。なお、以下の説明では、混同が起きない場合には、「仮想的な」を省略する。例えば、仮想的な作業装置810Bや仮想的なケーブル・ホース類820Bを、単に作業装置810Bやケーブル・ホース類820Bと記す。ちなみに、符号の末尾のBは、訓練/仮想に係ることを示すものである。
【0041】
訓練システム20は、訓練設備オペレーションセンタ885Bに設置され、表示装置200、操作装置850B、および制御装置855Bを含んで構成される。操作装置850Bおよび制御装置855Bは、教師データ収集・学習システム10(図2参照)の操作装置850Aおよび制御装置855Aとそれぞれ同様である。なお、作業装置810Bは、仮想的な作業装置であって、制御装置855Bが生成した制御信号が送られることはない。操作装置850Bおよび制御装置855Bは、操作内容(操作信号)や制御内容(制御信号)を後記する表示装置200に送信する。
【0042】
≪表示装置の構成≫
図9は、本実施形態に係る表示装置200の機能ブロック図である。表示装置200は、コンピュータであって、制御部210、記憶部220、入出力部260、およびカメラ操作部270を備える。入出力部260は、操作装置850B、制御装置855Bとの信号を送受信する。また、入出力部260にはディスプレイ(不図示)が接続される。なお、ディスプレイは卓上型に限らずヘッドマウント型のディスプレイを含む。カメラ操作部270は、仮想的なカメラ830Bに対する操作を受け付ける。
【0043】
記憶部220は、ROMやRAM、SSDなどから構成される。記憶部220には、プログラム221、および学習モデル130が記憶される。プログラム221には、画像生成処理(後記する図10参照)を含む表示装置200が実行する処理の手順が記述される。学習モデル130は、特徴量収集・学習装置100(図3参照)が訓練して生成した学習モデル130である。記憶部220には、仮想的な干渉物889Bの位置(領域)の設定情報が記憶される。
【0044】
制御部210は、CPUなどから構成され、制御信号解析部211、操作信号解析部212、推定部213、および画像合成部214を備える。制御信号解析部211および操作信号解析部212は、特徴量収集・学習装置100(図3参照)の制御信号解析部111および操作信号解析部112とそれぞれ同様である。
推定部213は、学習モデル130を用いて操作後のクローラ(作業装置)やケーブル・ホース類の位置を推定する。詳しくは、推定部213は、学習モデル130に干渉物889Bの位置、クローラ811B(作業装置810B)に対する操作内容、操作前のクローラ811Bの位置、および操作前のケーブル・ホース類820Bの位置を入力する。続いて、推定部213は、学習モデル130から当該入力に対する出力データである操作後のクローラ811Bの位置、および操作後のケーブル・ホース類820Bの位置を推定結果として取得する。
【0045】
画像合成部214は、推定結果である操作後のクローラ811Bの位置、操作後のケーブル・ホース類820Bの位置、および設定情報である干渉物889Bの位置から、クローラ811B、ケーブル・ホース類820B、および干渉物889Bの画像を合成して、入出力部260に接続されたディスプレイ(不図示)に表示する。
【0046】
≪画像生成処理≫
図10は、本実施形態に係る表示装置200が実行する画像生成処理のフローチャートである。図10を参照しながら、作業装置810の操作訓練中における表示装置200の処理内容を説明する。なお、作業員は、入出力部260に接続されたディスプレイ(不図示)に表示される仮想的な作業現場880B(図8参照)の画像を見ながら、操作装置850Bを介して、仮想的な作業装置810Bを操作することで訓練を受ける。
【0047】
ステップS41において制御部210は、訓練開始時における干渉物889B、作業装置810B(クローラ811B)、ケーブル・ホース類820Bの位置を初期位置として設定する。制御部210は、初期位置を作業員に問い合わせて設定してもよいし、予め決められている複数の候補から選択して設定してもよい。
ステップS42において画像合成部214は、初期位置にある干渉物889B、作業装置810B、ケーブル・ホース類820Bの画像を合成し、当該画像を作業現場880Bの画像に重ねた画像を合成してディスプレイに出力する。
【0048】
ステップS43において制御部210は、作業員による作業装置810Bの操作ごとにステップS44~S49を繰り返す。この繰り返しは、作業員が訓練を受ける間、作業装置810Bを操作するたびに繰り返される。
ステップS44において操作信号解析部212は、操作内容を取得する。
ステップS45において操作信号解析部212は、ステップS44で取得した操作内容を分割する。分割の手法は、教師データ生成部114が行うステップS26(図7参照)における分割と同様である。なお、ステップS26においては、ステップS25の繰り返し回数に応じて分割しているが、操作信号解析部212は、分割単位の大きさに応じて分割する。詳しくは、ステップS26における分割単位の平均値に近くなるように、操作信号解析部212は、操作内容を分割する。
【0049】
例えば、前進操作についてステップS26における分割単位の平均値が3cmであったら、操作信号解析部212は、5cm前進という操作を3cm前進と2cm前進とに分割する。2.5cm前進を2回に分割してもよい。また、例えば、低速で前進操作についてステップS26における分割単位の平均値が0.5秒であったら、操作信号解析部212は、低速で3秒前進という操作を低速で0.5秒前進を6回に分割してもよい。また、5つ先(隣)の領域への移動であったら、操作信号解析部212は、1つ先(隣)の領域への移動を5回に分割してもよい。
【0050】
ステップS46において制御部210は、ステップS45で分割された操作内容ごとにステップS47~S49を繰り返す。
ステップS47において推定部213は、干渉物889B、作業装置810B、ケーブル・ホース類820Bの現在の位置(表示されている位置)を取得する。
ステップS48において推定部213は、ステップS47で取得した位置、および分割された操作内容から、学習モデル130を用いて操作後の作業装置810B、ケーブル・ホース類820Bの位置を推定する。
【0051】
ステップS49において画像合成部214は、初期位置にある干渉物889B、およびステップS48で推定された位置にある作業装置810B、ケーブル・ホース類820Bの画像を合成し、当該画像を作業現場880Bの画像に重ねた画像を合成してディスプレイに出力する。
【0052】
≪特徴量収集・学習装置と表示装置の特徴≫
表示装置200は、作業員が操作対象となる作業装置810Bだけではなく、作業装置810Bに接続されていて、作業装置810Bの移動にともない、引きずられて移動するケーブル・ホース類820Bを含めて画像を合成して表示する。作業装置810Bは、クローラ811Bを備え、直接の操作対象(移動指示を出す対象)であり、操作後の位置を特定しやすい。一方、ケーブル・ホース類820Bは、自力で移動するのではなく作業装置810Bに引きずられて移動する上に、変形(曲がり具合が変化)するために、クローラ811Bの移動後の、曲がり具合を含めたケーブル・ホース類820Bの位置は、予想が困難である。さらに、ケーブル・ホース類820Bは、干渉物889Bと干渉するため、さらに予想するのが困難となる。
【0053】
表示装置200は、操作前(移動前)の作業装置810Bおよびケーブル・ホース類820Bの位置と作業装置810Bの操作内容(移動指示の内容、操作情報)とから、機械学習技術を用いて、操作後の作業装置810Bおよびケーブル・ホース類820Bの位置(作業装置の状態)を推定し、画像を表示する。このように、表示装置200は、作業装置810Bだけではなく、一般には予想が困難であるケーブル・ホース類820Bの移動を含めた画像を表示することができるようになる。
【0054】
作業員は、作業現場880(図1参照)において、ケーブル・ホース類820が瓦礫888と干渉することなく、作業装置810がスムーズに移動するように操作することが求められている。学習モデル130は、瓦礫888の替わりに干渉物889(図2参照)が存在する試験設備エリア880Aにおけるケーブル・ホース類820が接続された作業装置810の操作に対する移動前後の作業装置810(クローラ811)およびケーブル・ホース類820の位置を教師データとしている。このため、学習モデル130は、瓦礫888のある作業現場880における、操作(移動指示)に対する作業装置810およびケーブル・ホース類820の移動を推定でき、画像が表示される。従って、表示装置200を用いることで、作業員は、作業現場880における作業装置810の操作の訓練(模擬操作、シミュレーション)が行えるようになる。
【0055】
≪変形例:訓練時に実物の作業装置≫
上記した実施形態では、表示装置200は、仮想的な作業現場880Bの画像に、仮想的な干渉物889B、作業装置810Bおよびケーブル・ホース類820Bを重ねた画像を合成して表示している。作業現場880Bと作業装置810Bとを実物に置き換えてもよい。
【0056】
図11は、本実施形態の変形例に係る訓練システム20の全体構成図である。図8と比較すると、仮想的な作業現場880B、作業装置810B、カメラ830Bが、それぞれ実物の訓練設備エリア880C、作業装置810、カメラ830に替わっている。また、作業装置810には実物のケーブル820Cが接続されており、後記する図12で説明するように表示装置200の指示する操作内容に従って制御装置855Bから対応する制御信号が送られる。操作装置850Bに入力された操作指示が、制御装置855Bを介して作業装置810に送られることはなく、操作指示は、表示装置200に送られる。
【0057】
実物の訓練設備エリア880Cで操作の訓練に使われる作業装置810は、作業現場880で作業をする場合と、異なる装置構成であっても良い。例えば、バッテリなどの駆動源を搭載していてもよい。この場合、ケーブル820Cは、操作内容を含む制御信号を送るためのケーブルであり、電力やエア、水など送るケーブル・ホース類820と比較して軽量で柔軟である。さらにケーブル820Cに干渉する実物の干渉物が訓練設備エリア880Cにはないので、作業装置810(クローラ811)がケーブル820Cを引きずる負荷は小さい。このため、同じ制御信号を送った場合、ケーブル820Cが接続された作業装置810とケーブル・ホース類820が接続された作業装置810とでは、移動量が異なる場合がある。例えば、低速で10秒前進と指示した場合に、ケーブル820Cが接続された作業装置810は、高速で10秒前進する場合がある。
【0058】
図12は、本実施形態の変形例に係る表示装置200が実行する画像生成処理のフローチャートである。
ステップS61~S68は、ステップS41~S48(図10参照)とそれぞれ同様である。但し、ステップS62において、作業装置810Bの画像は生成せず、画像合成部214は、干渉物889B、ケーブル・ホース類820Bの画像を合成し、当該画像をカメラ830が撮像した作業装置810を含む訓練設備エリア880Cの画像に重ねてディスプレイに出力する。なお、画像合成部214は、カメラ830が撮像した画像にケーブル820Cが含まれないように画像処理を行う。
【0059】
ステップS69において、操作情報送信部としての制御部210は、ステップS68で推定された作業装置810の位置に対応する制御信号を作業装置810に送る。詳しくは、制御部210は、ステップS68で推定された作業装置810の位置に移動を指示する操作内容を制御装置855Bに送信する。制御装置855Bは、対応する制御信号を作業装置810に送る。
ステップS70において画像合成部214は、干渉物889B、ケーブル・ホース類820Bの画像を合成し、カメラ830が撮像した訓練設備エリア880Cの画像からケーブル820Cを除いた画像に、合成した画像を重ねてディスプレイに出力する。なお、画像合成部214は、訓練設備エリア880Cの画像に含まれる作業装置810に接続されているように見えるようにケーブル・ホース類820Bの画像を合成する。
【0060】
上記した変形例では、作業装置を実物としたが干渉物(瓦礫)を実物としてもよいし、作業装置と干渉物とを実物としてもよい。また、ケーブル820Cに替わり無線で操作内容を作業装置に送るようにしてもよい。
【0061】
≪変形例:教師データ収集時の操作≫
上記した実施形態において、管理者が作業装置810を操作して教師データを収集している。この操作作業を特徴量収集・学習装置が行ってもよい。
図13は、本実施形態の変形例に係る特徴量収集・学習装置100Aの機能ブロック図である。特徴量収集・学習装置100(図3参照)と比較して、制御部110には、移動先取得部116、移動経路生成部117、および操作信号生成部118がさらに備わる。
【0062】
移動先取得部116は、作業装置810の移動先を取得する。移動先取得部116は、管理者に問い合わせて移動先を取得してもよいし、予め設定してある移動先から選択してもよいし、試験設備エリア880Aのなかで干渉物889が存在しない位置を移動先として選択してもよい。
移動経路生成部117は、移動先取得部116が取得した移動先まで作業装置810が移動する経路を生成する。
【0063】
操作信号生成部118は、移動経路生成部117が生成した経路に沿って作業装置810が移動する操作内容を生成して、操作内容に対応する操作信号を制御装置855A(図2参照)に送る。例えば、操作信号生成部118は、50cm前進、45度右回転、30cm前進といった操作内容(操作情報)を生成する。次に操作信号生成部118は、50cm前進に対応する操作信号を制御装置855に送る。続いて、操作信号生成部118は、カメラ830の画像から作業装置810が50cm前進して移動が完了したことを確認した後に、次の操作信号を送る。操作信号生成部118は、作業装置810が移動先に到達するまで、この処理を繰り返す。
【0064】
このような特徴量収集・学習装置100Aを利用することで、管理者は作業装置810を操作する手間を削減することができ、教師データを収集する作業を効率化することができる。延いては、管理者は、より多くの教師データ140を収集でき、推定精度が高い学習モデル130を生成することができるようになる。
【0065】
≪変形例:トラクタとしての作業装置≫
上記した実施形態では、作業装置810には付帯物としてケーブル・ホース類820が接続され、作業装置810はケーブル・ホース類820を引きずって移動する。ケーブル・ホース類820の替わりに1つ以上のトレーラ・台車・荷車のような被牽引物が接続され、作業装置810はトラクタとして被牽引物を牽引してもよい。ケーブル・ホース類820と同様に被牽引物は、自力で移動するのではなく作業装置810に引きずられて移動する上に、作業装置810と被牽引物、被牽引物間の接続は固定されていないので、作業装置810の移動後の、曲がり具合を含めた被牽引物の位置は、予想が困難である。
表示装置200は、一般には予想が困難である被牽引物の移動を含めた画像を表示することができ、作業装置810Bの操作の訓練(模擬操作、シミュレーション)が行えるようになる。
【0066】
≪変形例:床面情報≫
ケーブル・ホース類の移動や曲がり具合は、作業現場の状況(濡れや滑りやすさなど)やケーブル・ホース類の属性(ホース径、材質、弾性など)によって異なる。教師データ140の入力データ141として、これらの作業現場の状況やケーブル・ホース類の属性を加えて教師データを収集して、学習モデルを生成するようにしてもよい。訓練時には、設定情報として推定時(図10記載のステップS48参照)に学習モデルの入力データに加える。
【0067】
≪その他の変形例≫
以上、本発明のいくつかの実施形態について説明したが、これらの実施形態は、例示に過ぎず、本発明の技術的範囲を限定するものではない。例えば、上記した実施形態では、移動後の作業装置の状態として、作業装置およびケーブル・ホース類の位置を推定している。作業装置がバッテリ駆動の場合に、作業装置の状態として位置の他にバッテリ残量を推定するようにしてもよい。教師データに移動前後のバッテリ残量を加えることで、作業員は、訓練時において操作(移動)に伴うバッテリの減り具合を体感することができるようになる。
【0068】
上記した実施形態では、作業装置が移動した後のケーブル・ホース類の曲がり具合を含めた位置を、機械学習技術を用いて推定している。別の手法を用いてもよい。例えば、表示装置の推定部は、有限要素法や有限セグメントモデルなどの数値解析手法を用いて推定してもよい。
本発明はその他の様々な実施形態を取ることが可能であり、さらに、本発明の要旨を逸脱しない範囲で、省略や置換等種々の変更を行うことができる。これら実施形態やその変形は、本明細書等に記載された発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0069】
100,100A 特徴量収集・学習装置(学習装置)
110 制御部
113 画像解析部
114 教師データ生成部
115 学習部
116 移動先取得部
117 移動経路生成部
118 操作信号生成部
130 学習モデル(機械学習モデル)
140 教師データ
141 入力データ
142 出力データ(正解ラベル、推定結果)
200 表示装置(作業シミュレーション装置)
210 制御部(操作情報送信部)
213 推定部
214 画像合成部
810 作業装置(ロボット)
810B 作業装置(仮想的な作業装置、ロボット)
820 ケーブル・ホース類(付帯物)
820B ケーブル・ホース類(仮想的なケーブル・ホース類、付帯物)
889 干渉物
889B 干渉物(仮想的な干渉物)
850A,850B 操作装置
855A,855B 制御装置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13