(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-02
(45)【発行日】2024-09-10
(54)【発明の名称】クレーン位置決定装置、移動式クレーン、及びクレーン位置決定方法
(51)【国際特許分類】
B66C 15/00 20060101AFI20240903BHJP
B66C 23/00 20060101ALI20240903BHJP
【FI】
B66C15/00 A
B66C23/00 Z
(21)【出願番号】P 2022539465
(86)(22)【出願日】2021-07-27
(86)【国際出願番号】 JP2021027636
(87)【国際公開番号】W WO2022025023
(87)【国際公開日】2022-02-03
【審査請求日】2023-01-24
(31)【優先権主張番号】P 2020126487
(32)【優先日】2020-07-27
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000148759
【氏名又は名称】株式会社タダノ
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】亀茲 マルダン
【審査官】須山 直紀
(56)【参考文献】
【文献】特開2018-080053(JP,A)
【文献】特開2018-203469(JP,A)
【文献】特開2018-172208(JP,A)
【文献】特開2018-167939(JP,A)
【文献】米国特許出願公開第2020/62565(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
B66C 15/00
B66C 23/00
(57)【特許請求の範囲】
【請求項1】
移動式クレーンに搭載されるクレーン位置決定装置であって、
クレーン作業の作業条件の入力を受け付ける入力部と、
学習モデルを有し、前記学習モデルの出力に基づいて前記移動式クレーンの設置位置を決定する決定部と、
前記移動式クレーンの設置位置を報知する報知部と、を備え、
前記学習モデルは、
前記クレーン作業に関する少なくとも一つの評価関数を含む報酬関数に基づいて、前記作業条件に対する移動式クレーンの最適な設置位置に関する情報を出力するように学習したモデルである、
クレーン位置決定装置。
【請求項2】
前記評価関数は、
前記移動式クレーンの動作効率を評価するための動作効率評価関数、
荷物の運搬経路を評価するための経路評価関数、
作業領域に対する前記移動式クレーンの設置位置の適正を評価するための領域評価関数、及び
アウトリガの張出状態を考慮した前記移動式クレーンの設置位置の適正を評価するための安定評価関数
のうちの少なくとも一つを含む、請求項1に記載のクレーン位置決定装置。
【請求項3】
前記作業条件は、搬送元の位置に関する情報、搬送先の位置に関する情報、吊荷の荷重に関する情報、作業領域に関する情報、及び前記移動式クレーンの動作効率に関する情報を含む、請求項
1に記載のクレーン位置決定装置。
【請求項4】
前記動作効率は、旋回体の旋回効率、ブームの起伏効率、前記ブームの伸縮効率、及びウインチのウインチ効率に基づいて算出される、請求項3に記載のクレーン位置決定装置。
【請求項5】
前記作業条件は、前記作業領域の環境に関する情報、を更に含む、請求項
3に記載のクレーン位置決定装置。
【請求項6】
前記学習モデルは、前記作業条件に対するアウトリガの最適な設置位置に関する情報を出力し、
前記決定部は、前記学習モデルの出力に基づいて、前記アウトリガの設置位置を決定すし、
前記報知部は、前記移動式クレーンの設置位置とともに、前記アウトリガの設置位置を報知する、請求項
1に記載のクレーン位置決定装置。
【請求項7】
前記決定部は、決定した前記アウトリガの設置位置に基づいて、前記移動式クレーンの向き及び/又は前記アウトリガの張出幅を決定し、
前記報知部は、移動式クレーンの向き及び/又は前記アウトリガの張出幅を出力する、請求項6に記載のクレーン位置決定装置。
【請求項8】
請求項
1に記載のクレーン位置決定装置を備える、移動式クレーン。
【請求項9】
移動式クレーンに搭載されたコンピュータにより実行されるクレーン位置決定方法であって、
クレーン作業の作業条件の入力を受け付けるステップと、
前記クレーン作業に関する少なくとも一つの評価関数を含む報酬関数に基づいて、前記作業条件に対する最適な移動式クレーンの設置位置に関する情報を出力するように学習した学習モデルの出力に基づいて前記移動式クレーンの設置位置を決定するステップと、
前記移動式クレーンの設置位置を報知するステップと、を含む、
クレーン位置決定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、クレーン位置決定装置、移動式クレーン、及びクレーン位置決定方法に関する。
【背景技術】
【0002】
クレーン作業では、移動式クレーンを適切な位置に設置することが難しい。このため、移動式クレーンには、クレーン作業に適さない領域を作業者に警告する制御装置を備えるものがある。
【0003】
例えば、特許文献1には、測位衛星の信号を受信して現在位置を計測する測位装置と、測位装置が計測した現在位置の地盤情報を無線手段によって取得し、取得した地盤情報から作業領域が警報領域であると判定した場合に、警告を発する制御装置と、を備える移動式クレーンが開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
クレーン作業では、作業効率を高めるため、移動式クレーンを吊荷に対して適切な位置に設置することが望まれている。
【0006】
しかし、特許文献1に記載の移動式クレーンでは、移動式クレーンを地盤情報に基づく適切な位置に設置できるだけである。このため、この移動式クレーンでは、移動式クレーンをクレーン作業の効率が高い位置に設置することが難しい。その結果、作業者の技能及び経験に頼らざるを得ない。
【0007】
本発明は上記の課題を解決するためになされたもので、クレーン作業の効率が高い位置に移動式クレーンを設置することができるクレーン位置決定装置、移動式クレーン、及びクレーン位置決定方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明に係るクレーン位置決定装置の一態様は、
移動式クレーンに搭載されるクレーン位置決定装置であって、
クレーン作業の作業条件の入力を受け付ける入力部と、
学習モデルを有し、学習モデルの出力に基づいて移動式クレーンの設置位置を決定する決定部と、
移動式クレーンの設置位置を報知する報知部と、を備え、
学習モデルは、
クレーン作業に関する少なくとも一つの評価関数を含む報酬関数に基づいて、作業条件に対する最適な移動式クレーンの設置位置に関する情報を出力するように学習したモデルである。
【0009】
本発明に係るクレーンの一態様は、上述のクレーン位置決定装置を備える。
【0010】
本発明に係るクレーン位置決定方法の一態様は、
移動式クレーンに搭載されたコンピュータにより実行されるクレーン位置決定方法であって、
クレーン作業の作業条件の入力を受け付けるステップと、
クレーン作業に関する少なくとも一つの評価関数を含む報酬関数に基づいて、作業条件に対する最適な移動式クレーンの設置位置に関する情報を出力するように学習した学習モデルの出力に基づいて移動式クレーンの設置位置を決定するステップと、
移動式クレーンの設置位置を報知するステップと、を含む。
【発明の効果】
【0011】
本発明の構成によれば、クレーン作業の効率が高い位置に移動式クレーンを設置することができる。
【図面の簡単な説明】
【0012】
【
図1】
図1は、本発明の実施の形態に係る位置決定装置が装備されるラフテレーンクレーンの上面図である。
【
図2】
図2は、本発明の実施の形態に係る位置決定装置の機能ブロック図である。
【
図3】
図3は、本発明の実施の形態に係る位置決定装置が備える入力部に入力されるデータセットの概略図である。
【
図4】
図4は、本発明の実施の形態に係る位置決定装置が備える入力部に入力される作業領域の概念図である。
【
図5】
図5は、本発明の実施の形態に係る位置決定装置が備える決定部と学習部のハードウエア構成図である。
【
図6】
図6は、本発明の実施の形態に係る位置決定装置が備えるニューラルネットワーク部の概念図である。
【
図7】
図7は、本発明の実施の形態に係る位置決定装置が備える学習用データベースのデータセットの概略図である。
【
図8】
図8は、本発明の実施の形態に係る位置決定装置が実施する位置決定処理のフローチャートである。
【
図9】
図9は、本発明の実施の形態に係る位置決定装置が実施する学習処理のフローチャートである。
【
図10】
図10は、本発明の他の実施の形態に係る位置決定装置の機能ブロック図である。
【発明を実施するための形態】
【0013】
以下、本発明の実施の形態に係るクレーン位置決定装置、移動式クレーン、クレーン位置決定方法及びプログラムについて図面を参照して詳細に説明する。なお、図中、同一又は同等の部分には同一の符号を付す。
【0014】
実施の形態に係る移動式クレーンの位置決定装置は、吊荷を運搬する作業、すなわち、クレーン作業を開始するときに、移動式クレーンの走行体の設置位置(停車位置)とアウトリガの設置位置(張出位置)を決定する装置である。
【0015】
この位置決定装置では、走行体の停車位置の決定にニューラルネットワークで構築された学習済みモデルを用いている。また、学習済みモデルを用いてアウトリガの張出位置を決定し、その張出位置からアウトリガの張出幅を算出している。
【0016】
まず、
図1を参照して、位置決定装置が装備される移動式クレーンの構成について説明する。次に、
図2-
図7を参照して、位置決定装置の構成について、学習済みモデルとあわせて説明する。続いて、
図8及び
図9を参照して、位置決定装置が実施する位置決定処理について説明する。
【0017】
図1は、実施の形態に係る位置決定装置1が装備されるラフテレーンクレーン100の上面図である。なお、
図1では、理解を容易にするため、ラフテレーンクレーン100がアウトリガ130を張り出し、ブーム120を伸長させている。さらに、図示しないフックに吊荷200が取り付けられている。
【0018】
図1に示すように、ラフテレーンクレーン100は、走行体110と、クレーン作業をするためのブーム120と、クレーン作業時に走行体110を安定させるアウトリガ130と、を備えている。
【0019】
走行体110は、図示しないが、原動機によって回転駆動されるホイールを有する。また、走行体110には、
図1に示すブーム120が搭載されている。走行体110は、原動機がホイールを回転駆動することにより、所望の位置に移動する。そして、走行体110は、その所望の位置で、ブーム120を用いたクレーン作業を可能にする。
【0020】
一方、ブーム120は、テレスコピック(telescopic)式ブーム、すなわち、伸縮可能な筒状のブームで構成されている。その末端は、走行体110に設けられ、旋回モータによって旋回する旋回体111によって支持されている。また、ブーム120は、旋回体111に設けられた起伏シリンダによって起伏可能に支持されている。これにより、ブーム120は、走行体110に対して旋回すると共に、旋回した位置で起伏可能である。
【0021】
また、ブーム120の先端には、ブームヘッド121が設けられている。図示しないが、ブームヘッド121では、先端がフックに結びつけられたロープがシーブから垂下している。そして、旋回体111には、そのロープを巻き上げ及び巻き下げするウインチ112が設けられている。これにより、ブーム120は、吊荷200を吊り上げ及び吊り下げ可能である。
【0022】
アウトリガ130は、走行体110の前後左右に合計4つ、設けられている。そして、アウトリガ130それぞれは、左右方向に張出可能なビーム131と、上下方向に伸縮可能に設けられたジャッキ132と、ジャッキ132の下端に設けられたフロート133と、を有している。これにより、アウトリガ130それぞれは、ビーム131を張り出してジャッキ132を伸長して、フロート133を接地することが可能である。そして、4つのアウトリガ130は、フロート133を接地することにより、走行体110を安定させてラフテレーンクレーン100の転倒を防止する。
【0023】
ラフテレーンクレーン100では、次のようにクレーン作業を行う。まず、作業を始めるに当たって、吊荷200付近に走行体110を停車させる。そして、アウトリガ130のビーム131を張り出し、かつジャッキ132を伸長させてフロート133を接地させる。
【0024】
次に、ブーム120の起こし、伸長、旋回体111の旋回の各動作をさせて、吊荷200の上にブームヘッド121を移動させる。その後、フックに吊荷200を取り付けて、ウインチ112を巻き上げることにより、吊荷200を吊り上げる。
【0025】
続いて、旋回体111の旋回、ブーム120の伸縮、及び起伏によって、所望の位置に吊荷200を運搬して、吊荷200を吊り下げる。
【0026】
このようなクレーン作業では、走行体110と吊り上げ対象の吊荷200との距離に応じて、旋回体111の旋回量及びブーム120の伸長量等が変化してしまう。また、アウトリガ130のビーム131の張出幅(以下、単に、アウトリガ130の張出幅という)に応じて吊り上げ荷重及び最大作業半径が変化してしまう。このため、クレーン作業の効率を高めるには、ラフテレーンクレーン100のオペレータが適切な位置に走行体110を停車させ、適切な張出幅にアウトリガ130を張り出す必要がある。
【0027】
しかしながら、オペレータが走行体110を適切な設置位置に設置し、アウトリガ130を適切な設置位置に設置することは難しい。
【0028】
そこで、ラフテレーンクレーン100には、クレーン作業の効率を高めるために、走行体110の停車位置とアウトリガ130の設置位置(張出幅)を決定する位置決定装置1が装備されている。次に、
図2-
図7を参照して、位置決定装置1の構成について説明する。
【0029】
図2は、実施の形態に係る位置決定装置1の機能ブロック図である。
図3は、位置決定装置1が備える入力部10に入力されるデータセット11の概略図である。
図4は、入力部10に入力される作業領域Mの概念図である。
図5は、位置決定装置1が備える決定部20と学習部40のハードウエア構成図である。
図6は、位置決定装置1が備えるニューラルネットワーク部21の概念図である。
図7は、位置決定装置1が備える学習用データベース45のデータセット11の概略図である。
【0030】
図2に示すように、位置決定装置1は、クレーン作業の情報を入力する入力部10と、入力部10に入力された情報を処理するニューラルネットワーク部21を有し、走行体110の停車位置(設置位置)及びアウトリガ130の張出位置(設置位置)を決定する決定部20と、決定部20が決定した停車位置及び張出位置を出力する出力部30と、ニューラルネットワーク部21を学習させる学習部40と、を備えている。
【0031】
入力部10は、キーパッドを有する。入力部10には、ユーザーがキーパッドを用いて、
図3に示すデータセット11の入力を受け付ける。尚、入力部は、キーパッドに限定されない。入力部は、例えば記憶部(不図示)に記憶されたデータを入力情報として受け付けるように構成されてもよい。
【0032】
詳細には、入力部10は、ラフテレーンクレーン100により実施されるクレーン作業(搬送作業)の作業条件の入力を受け付ける。具体的には、作業条件は、予定されているクレーン作業の、
図4に示す開始地点P
s、終了地点P
eの座標、吊荷200の荷重m
r、クレーン作業を行う現場の作業領域M、及びラフテレーンクレーン100の動作効率(第一動作効率)を含む。又、ラフテレーンクレーン100の動作効率は、旋回体111の旋回効率P
r、ブーム120の起伏効率P
l、及び/又はウインチ効率P
wを含む。また、作業条件は、作業領域Mの気温T、風速W、及び風向V
XYZを含んでもよい。
【0033】
ここで、開始地点Psは、搬送元の位置に関する情報の一例に該当し、吊荷200を吊り上げることにより、運搬を開始する地点である。また、終了地点Peは、搬送先の位置に関する情報の一例に該当し、吊荷200を運搬後、その運搬を終了する地点である。一般には、地点の座標は、緯度経度座標系、平面直角座標系等で表されるが、開始地点Ps及び終了地点Peの平面直角座標系のX値、Y値、Z値で表される。地点の座標は、グローバル座標であってもよいし、ローカル座標であってもよい。
【0034】
また、吊荷200の荷重mrとは、吊荷の荷重に関する情報の一例に該当し、クレーン作業で運搬が予定されている吊荷200の荷重に、ラフテレーンクレーン100のフック、フックブロック等の吊り具の荷重を加えた総荷重を意味する。
【0035】
作業領域Mとは、作業領域に関する情報の一例に該当し、
図4に示すように、開始地点P
s、終了地点P
eを含むクレーン作業が予定されている現場の、作業可能な領域のことである。換言すると、作業領域Mとは、現場内のラフテレーンクレーン100が停車でき、かつアウトリガ130の張り出しをすることができる領域のことである。作業領域Mは、その外周上にある複数の地点の平面直角座標系のX値、Y値で表される。
【0036】
旋回効率Pr、起伏効率Pl、及びウインチ効率Pwとは、移動式クレーンの動作効率に関する情報の一例に該当し、旋回体111、ブーム120、及びウインチ112の動力源に供給されたエネルギーに対する、旋回体111、ブーム120、及びウインチ112の各動作による仕事量のことである。
【0037】
気温Tとは、予定しているクレーン作業を行う日時の作業領域M内の気温のことである。気温Tは、作業現場で測定された平均気温又は、天気予報から得た作業領域Mの平均気温で表される。
【0038】
風速Wとは、風の強さ及び向きをベクトルで表したときのスカラー値のことである。風向VXYZとは、そのベクトルの単位ベクトルのことである。これら風速W及び風向VXYZは、作業現場で測定された、或いは天気予報から得た、10分間の平均風速及び平均風向で表される。なお、風向VXYZは、上記平面直角座標系のX値及びY値で表される。
【0039】
入力部10は、このようなデータセット11が入力されると、そのデータセット11を
図2に示す決定部20に送信する。
【0040】
決定部20は、学習モデルを有し、学習モデルの出力に基づいて移動式クレーンの設置位置を決定する。入力部10から受け取ったデータセット11に基づいて走行体110の停車位置及びアウトリガ130の張出位置を決定するための情報を求めるニューラルネットワーク部21と、ニューラルネットワーク部21が求めた情報から走行体110の停車位置とアウトリガ130の張出位置を決定する演算部22と、を有する。
【0041】
位置決定装置1は、
図5に示すメモリ310、補助メモリ330及びCPU(Central Processing Unit)320を含むコンピュータを備える。ニューラルネットワーク部21は、メモリ310に格納されたニューラルネットワークプログラム311をCPU320が実行することで実現されている。
【0042】
ニューラルネットワーク部21は、学習モデルの一例に該当し、
図6に示すように、ニューロンと呼ばれる複数のノード211を有する。それらノード211は、入力層212、隠れ層213及び、出力層214を形成している。そして、ノード211とノード211は結合している。学習モデルは、クレーン作業に関する少なくとも一つの評価関数を含む報酬関数に基づいて、作業条件に対する最適な移動式クレーンの設置位置に関する情報を出力するように学習するモデルである。
【0043】
なお、
図6では、理解を容易にするため、ノード211を2つ有する出力層214を示しているが、出力層214のノード211は、走行体110を停車させる停車位置P
oの候補の数と4つのアウトリガ130それぞれを張り出す張出位置R
oの候補の数とをあわせた数だけ設けられている。
【0044】
ノード211間の結合強度には、重みθが付けられている。この重みθは、上述したニューラルネットワークプログラム311が、
図5に示す補助メモリ330に格納されたパラメータデータベース25を読み出すことにより、付けられている。これにより、
図6に示すニューラルネットワーク部21は、走行体110の停車位置P
oとアウトリガ130の張出位置R
oを決定する法則を学習した学習済みモデルを構築している。
【0045】
入力層212には、入力部10から受け取ったデータセット11が入力される。
【0046】
入力層212、隠れ層213、及び出力層214は、入力層212にデータセット11が入力されると、上述した学習済みモデルは、走行体110の停車位置Poとアウトリガ130の張出位置Roを決定するための情報処理を行う。入力層212、隠れ層213及び出力層214は、後述するように、強化学習の行動価値関数Qを近似している。このため、出力層214には、行動価値関数Qの行動価値が出力される。
【0047】
詳細には、出力層214は、走行体110の停車位置Poを特定の位置にしたときの行動価値を出力する。また、アウトリガ130の張出位置Roを特定の位置にしたときの行動価値を出力する。
【0048】
ここで、走行体110の設置位置(停車位置P
o)とは、
図1に示す旋回体111が有する旋回中心の位置のことである。
【0049】
また、アウトリガ130の設置位置(張出位置R
o)とは、
図4に示す、4つのアウトリガ130を張り出したときの、アウトリガ130それぞれのフロート133の平面視中心の位置r
1、r
2、r
3、r
4のことである。張出位置R
0は、絶対座標であってもよいし、走行体110の停車位置P
oを基準とした相対座標であっても良い。
【0050】
出力層214は、例えば、作業領域Mをマス目状の小領域に区切った場合、それら小領域それぞれに走行体110の停車位置Poにしたときの行動価値を出力する。また、出力層214は、それら小領域それぞれにアウトリガ130を張り出したときの行動価値を出力する。出力層214の出力は、演算部22に送信される。出力層214の出力である行動価値は、移動式クレーンの設置位置に関する情報の一例に該当する。又、出力層214の出力である行動価値は、アウトリガの設置位置に関する情報の一例に該当する。又、出力層214の出力のうち移動式クレーンの設置位置に関する最も価値が高い行動価値は、移動式クレーンの最適な設置位置に関する情報の一例に該当する。又、出力層214の出力のうちアウトリガの設置位置に関する最も価値が高い行動価値は、アウトリガの最適な設置位置に関する情報の一例に該当する。
【0051】
図2に戻って、演算部22は、
図5に示すメモリ310に格納された位置決定プログラム313をCPU320が実行することで実現されている。
【0052】
演算部22は、出力層214から受信した停車位置Po及び張出位置Roに関する行動価値のデータから、最も価値が高い停車位置Po及び張出位置Roを選択する。そして、演算部22は、選択した停車位置Po及び張出位置Roを、走行体110の停車位置Po及びアウトリガ130の張出位置Roとする。これにより、演算部22は、走行体110の停車位置Po及びアウトリガ130の張出位置Roを決定する。
【0053】
さらに、演算部22は、オペレータがラフテレーンクレーン100を操作しやすくするため、決定したアウトリガ130の張出位置Roから、決定した停車位置Poに対する走行体110の向きと、アウトリガ130の張出幅と、を算出する。演算部22は、決定した走行体110の停車位置Po、算出した走行体110の向き、及びアウトリガ130の張出幅のデータを出力部30に送信する。
【0054】
出力部30は、報知部の一例に該当し、液晶ディスプレイを備えている。出力部30は、演算部22から走行体110の停車位置Po、走行体110の向き、及びアウトリガ130の張出幅を受信すると、液晶ディスプレイに、受信した走行体110の停車位置Po、走行体110の向き、アウトリガ130の張出位置、及びアウトリガ130の張出幅を表示する。これにより、出力部30は、ラフテレーンクレーン100のオペレータに、望ましい走行体110の停車位置Po、走行体110の向き、アウトリガ130の張出位置、及びアウトリガ130の張出幅を報知する。その結果、位置決定装置1では、オペレータが走行体110を適切な位置に停車させ、アウトリガ130を適切な張出幅だけ張り出すことができる。
【0055】
上述したように、決定部20のニューラルネットワーク部21は、ニューラルネットワークプログラム311が、パラメータデータベース25に格納された重みθを読み出すことにより、走行体110の停車位置Po及びアウトリガ130の張出位置Roを決定する法則を学習した学習済みモデルを構築している。この学習済みモデルを作成するため、或いは、学習済みモデルによる停車位置Po及び張出位置Roの決定の精度を高めるため、位置決定装置1は、学習部40を備えている。
【0056】
学習部40は、位置決定装置1が備える
図5に示すメモリ310に格納された学習プログラム312をCPU320が実行することで実現されている。
【0057】
学習部40は、
図2に示すニューラルネットワーク部21を深層強化学習させて、走行体110の停車位置P
o及びアウトリガ130の張出位置R
oを決定する法則を学習した学習済みモデルを生成する。
【0058】
ここで、深層強化学習とは、Qラーニングと呼ばれる強化学習を、深層学習に組み合わせた学習のことである。ここで、強化学習は、時刻tの状態stで、取り得る行動atを選択して、状態st+1となったときの報酬を報酬関数R(st,at,st+1)、その行動の価値を行動価値関数Q(st,at)と定義する場合に、行動価値関数Q(st,at)を、報酬の累積値が最大となるように最適化する。一方、深層強化学習は、上述の強化学習の行動価値関数Q(st,at)を、深層学習を利用することにより、ニューラルネットワークで表すと共に、バックプロパゲーション、すなわち、誤差逆伝搬法によって最適化する学習手法である。なお、行動価値関数Q(st,at)は、以下、単に行動価値関数Qと称する。
【0059】
学習部40について詳細に説明すると、学習部40は、学習用データベース45を読み出す。
図5に示す補助メモリ330には、学習用データベース45が格納されている。その学習用データベース45には、BIM(Building Information Modeling)データ、ラフテレーンクレーン100の設計データ、及び気象データ等から作成され、データセット11と同様に、開始地点P
s、終了地点P
eの座標、吊荷200の荷重m
r、作業領域M、ラフテレーンクレーン100の動作効率(例えば、旋回効率P
r、起伏効率P
l、及びウインチ効率P
w)、気温T、風速W、及び風向V
XYZのデータで構成された、
図7に示すデータセット46が複数組、記憶されている。学習部40は、学習用データベース45を読み出して、学習用データベース45から複数組のデータセット46をサンプリングする。
【0060】
学習部40は、上述した状態s
tとして、サンプリングした複数組のデータセット46それぞれを
図6に示すニューラルネットワーク部21の入力層212に入力する。
【0061】
これに対して、入力層212、隠れ層213、及び出力層214は、上述したように、行動価値関数Qとして、走行体110の停車位置Po及びアウトリガ130の張出位置Roを決定する行動の行動価値関数を、ニューラルネットワークの結合形式で表している。その結果、出力層214は、入力層212に入力されたデータセット46それぞれについて、走行体110の停車位置Poを特定の位置にしたときの行動価値とアウトリガ130の張出位置Roを特定の位置にしたときの行動価値を出力する。
【0062】
学習部40は、入力層212に入力されたデータセット46の各データと、出力層214から出力された上記の行動価値のデータとを、以下に示す数式1-6で示される報酬関数J(・)に適用して報酬値を算出する。この報酬値の算出は、入力層212に入力されたデータセット46それぞれについて行う。
【0063】
ここで、報酬関数J(・)とは、動作効率評価関数をJ(Work)、経路評価関数をJ(Path)、領域評価関数をJ(Pos)、及び安定評価関数をJ(OR)としたときの、以下の数式1で表される関数のことである。動作効率評価関数J(Work)、経路評価関数J(Path)、領域評価関数J(Pos)、及び安定評価関数J(OR)はそれぞれ、クレーン作業に関する評価関数の一例に該当する。報酬関数J(・)は、動作効率評価関数J(Work)、経路評価関数J(Path)、領域評価関数J(Pos)、及び安定評価関数J(OR)のうち少なくとも一つの評価関数を含めばよい。
【0064】
【0065】
動作効率評価関数J(Work)は、移動式クレーンの動作効率を評価するための関数である。動作効率評価関数J(Work)は、旋回効率をPrとし、起伏効率をPlとし、ウインチ効率をPwとし、風と気温による旋回効率Pr、起伏効率Pl、及びウインチ効率Pwへの影響を環境係数Kr、Kl、Kwとする場合に、以下の数式2で表される評価関数である。なお、本明細書では、動作効率評価関数J(Work)のことをクレーン動作効率関数ともいう。
【0066】
【0067】
なお、環境係数Kr、Kl、Kwは、風速W、風向VXYZ、気温Tの逆数に比例する。例えば、風がほぼ無風状態のとき、旋回及び起伏等への風の影響が小さいので、環境係数Kr、Kl、Kwは数値1である。
【0068】
経路評価関数J(Path)は、荷物の運搬経路を評価するための関数である。経路評価関数J(Path)とは、開始地点P
sから終了地点P
eへの吊荷200を運搬するクレーン作業をするときの運搬経路を作業半径の変化率で評価する関数のことである。詳細には、経路評価関数J(Path)は、走行体110の停車位置P
oを中心点とし、かつ開始地点P
s又は終了地点P
eを通る円弧の、
図4に示す弦長をa、b(但し、a≧b)とする場合に、以下の数式3で表される。なお、本明細書では、経路評価関数J(Path)のことを、ブーム120の伸縮の効率を示すことから、ブーム伸縮効率関数ともいう。また、経路評価関数J(Path)と動作効率評価関数J(Work)をあわせて、クレーンの動作効率関数ともいう。
【0069】
【0070】
領域評価関数J(Pos)は、作業領域に対する移動式クレーンの設置位置の適正を評価するため関数である。領域評価関数J(Pos)とは、作業領域Mに対する走行体110の停車位置Poの適否を示す、数式4で表される評価関数である。
【0071】
【0072】
安定評価関数J(OR)は、アウトリガの張出状態を考慮した移動式クレーンの設置位置の適正を評価するための関数である。安定評価関数J(OR)とは、アウトリガ130の張出位置Roでの最大作業半径をRwとし、かつクレーン作業時の姿勢で吊ることができる定格総荷重をmとしたときの、以下の数式5で表される評価関数である。なお、本明細書では、張出位置Roでの最大作業半径Rwに対する停車位置Poの適否を表す関数ともいう。
【0073】
【0074】
学習部40は、報酬関数J(・)から求めた報酬値を用いて、データセット46それぞれについて、出力層214から出力されるべきターゲット値を算出する。例えば、行動価値関数Qの例で説明すると、学習部40は、以下の数式6を用いて、ターゲット値を算出する。そして、学習部40は、データセット46それぞれについての、ターゲット値と出力層214の出力との誤差から、ノード211間の結合強度の重みθを更新する。このとき、学習部40は、数式7に基づき、出力層214の重みθを更新する。さらに、誤差逆伝搬法によって、隠れ層213、入力層212の重みを更新する。これにより、学習部40は、ニューラルネットワーク部21を深層強化学習させる。
【0075】
【0076】
【0077】
ここで、数式6のtはターゲット値、γは割引率である。数式7のαは、学習率である。J(・)は、数式1の報酬関数である。
【0078】
学習部40は、学習用データベース45から全てのデータセット46のサンプリングが終わるまで、一連の処理を繰り返す。すなわち、学習用データベース45からのデータセット46のサンプリング、サンプリングしたデータセット46の入力層212へ入力、報酬値及びターゲット値の算出、及び誤差によるノード211間の結合強度の重みθの更新からなる一連の動作を繰り返す。
【0079】
学習部40は、全てのデータセット46のサンプリングが終わると、深層強化学習を停止させる。これにより、上述した、走行体110の停車位置Poとアウトリガ130の張出位置Roを決定する法則を学習した学習済みモデルが生成される。学習部40は、学習済みモデルが生成されると、ノード211間の結合強度の重みθをパラメータデータベース25に格納する。
【0080】
位置決定装置1では、学習部40が格納した重みθを、ニューラルネットワークプログラム311が読み出すことにより、ニューラルネットワーク部21に、走行体110の停車位置Po及びアウトリガ130の張出位置Roを決定する法則を学習した学習済みモデルが構築される。この学習済みモデル(学習モデル)は、作業条件に対する最適な移動式クレーンの設置位置に関する情報を出力する機能を有する。その結果、決定部20は、この学習済みモデルを用いて、入力部10に入力されたデータセット11から走行体110の停車位置Po及びアウトリガ130の張出位置Roを決定することができる。
【0081】
次に、
図8及び
図9を参照して、位置決定装置1が実施する位置決定処理について説明する。以下の説明では、位置決定装置1に図示しない電源ボタンが設けられ、その電源ボタンのオン、オフにより位置決定装置1に電源から電力が供給されるものとする。また、ラフテレーンクレーン100のオペレータは、位置決定装置1の使用前に、補助メモリ330に学習用データベース45を格納するか、或いは、パラメータデータベース25を格納するものとする。
【0082】
図8は、実施の形態に係る位置決定装置1が実施する位置決定処理のフローチャートである。
図9は、位置決定装置1が実施する学習処理のフローチャートである。
【0083】
まず、ラフテレーンクレーン100のオペレータは、位置決定装置1の電源ボタンを押して、位置決定装置1それ自体を起動させる。これにより、CPU320によって位置決定プログラム313が実行される。その結果、位置決定処理のフローが開始される。
【0084】
位置決定処理のフローが開始されると、決定部20は、まず、
図8に示すように、補助メモリ330にパラメータデータベース25が格納されているか否かを判定する(ステップS1)。
【0085】
決定部20は、パラメータデータベース25が格納されていないと判定した場合(ステップS1のNo)、学習プログラム312を起動して、学習処理を実施する(ステップS2)。
【0086】
学習処理のフローが開始されると、決定部20は、まず、
図9に示すように、補助メモリ330に学習用データベース45が格納されているか否かを判定する(ステップS21)。
【0087】
学習用データベース45が格納されていないと判定した場合(ステップS21のNo)、決定部20は、学習処理を終了させ、出力部30が備える液晶ディスプレイに、学習用データベース45が存在しない旨のエラーを表示させる。
【0088】
一方、学習用データベース45が格納されていると判定した場合(ステップS21のYes)、決定部20は、学習用データベース45から、複数のデータセット46をサンプリングする(ステップS22)。
【0089】
次に、決定部20は、サンプリングしたデータセット46をニューラルネットワーク部21の入力層212に入力する(ステップS23)。続いて、決定部20は、報酬関数J(・)を用いて、ターゲット値を算出する(ステップS24)。
【0090】
決定部20は、算出したターゲット値から出力層214との誤差を算出し、ノード211間の結合強度の重みθを更新する(ステップS25)。
【0091】
次に、決定部20は、学習用データベース45から、全てのデータセット46がサンプリングされたか否かを判定する(ステップS26)。
【0092】
決定部20は、全てのデータセット46がサンプリングされていないと判定した場合(ステップS26のNo)、ステップS22に戻り、ニューラルネットワーク部21の深層強化学習を続ける。
【0093】
一方、決定部20は、全てのデータセット46がサンプリングされていると判定した場合(ステップS26のYes)、パラメータデータベース25にノード211間の結合強度の重みθを記憶させる(ステップS27)。続いて、学習処理を終了させ、位置決定処理のフローに戻る。そして、位置決定処理のステップS3に進む。
【0094】
図8に示す位置決定処理のフローに戻って、ステップS1で、決定部20は、学習処理を実施しない場合、すなわち、パラメータデータベース25が格納されていると判定した場合(ステップS1のYes)、出力部30が備える液晶ディスプレイに、データセット11を入力するための入力画面の画像を表示させる(ステップS3)。これにより、ラフテレーンクレーン100のオペレータにデータセット11の入力を促す。
【0095】
このとき、入力を容易にするため、予め補助メモリ330に地図データを格納しておき、その地図データに基づく地図画像を出力部30の液晶ディスプレイに表示すると良い。そして、入力部10が備えるキーパッドによって、データセット11の作業領域Mを入力可能にすると良い。
【0096】
ラフテレーンクレーン100のオペレータは、入力部10のタッチパネルを用いて、データセット11の各データを入力する。
【0097】
決定部20は、入力画面の画像を出力部30の液晶ディスプレイに表示させた後、入力部10にデータセット11が入力されたか否かを判定する(ステップS4)。
【0098】
決定部20は、入力部10にデータセット11が入力されたと判定した場合(ステップS4のYes)、ニューラルネットワークプログラム311を起動して、ニューラルネットワーク処理を実施する(ステップS5)。このとき、決定部20は、パラメータデータベース25からノード211間の結合強度の重みθを読み出して、走行体110の停車位置Poとアウトリガ130の張出位置Roを決定する法則を学習した学習済みモデルを構築する。
【0099】
一方、入力部10にデータセット11が入力されていないと判定した場合(ステップS4のNo)、ステップS4に戻り、入力部10にデータセット11が入力されるまで待機する。
【0100】
ニューラルネットワーク処理が実施されると(ステップS5)、決定部20は、ニューラルネットワーク部21の入力層212にデータセット11の各データを入力する。その結果、ニューラルネットワーク部21の出力層214から、走行体110の停車位置Poを特定の位置にしたときの行動価値、及び、アウトリガ130の張出位置Roを特定の位置にしたときの行動価値が出力される。そして、その出力は、決定部20が備える演算部22に送信させる。
【0101】
演算部22は、ニューラルネットワーク部21の出力が送信されると、そのニューラルネットワーク部21の出力に基づいて、走行体110の停車位置Poとアウトリガ130の張出位置Roを決定する(ステップS6)。詳細には、演算部22は、ニューラルネットワーク部21の出力層214が出力する行動価値のうち、最も高い行動価値を示す走行体110の停車位置Poとアウトリガ130の張出位置Roを選択する。これにより、演算部22は、走行体110の停車位置Poとアウトリガ130の張出位置Roを決定する。
なお、本明細書では、ステップS5及びS6のことを決定ステップともいう。
【0102】
次に、演算部22は、決定したアウトリガ130の張出位置Roから、決定した停車位置Poに対する走行体110の向きと、アウトリガ130の張出幅と、を算出する(ステップS7)。
【0103】
続いて、演算部22は、決定した走行体110の停車位置Poと算出した走行体110の向き及びアウトリガ130の張出幅を出力部30の液晶ディスプレイに表示させる(ステップS8)。これにより、ラフテレーンクレーン100のオペレータは、走行体110を停車させる望ましい停車位置Poとその向きを知ることができる。また、その停車位置Poで、望ましい張出幅だけアウトリガ130を張り出すことができる。その結果、オペレータは、ラフテレーンクレーン100をクレーン作業の効率が高い位置に停車させると共に、アウトリガ130をクレーン作業の効率が高い張出幅だけ張り出すことができる。
なお、本明細書では、ステップS8のことを出力ステップともいう。
【0104】
以上のように、本実施の形態に係る位置決定装置1では、決定部20が学習済みモデルを用いて、走行体110の停車位置Poとアウトリガ130の張出位置Roを決定するところ、学習済みモデルは、停車位置Po及び張出位置Roで、吊荷200を開始地点Psから終了地点Peまで移動させるクレーン作業をしたときの、ラフテレーンクレーン100の動作効率と、停車位置Poの、開始地点Ps、終了地点Pe及び作業領域Mに対する適否と、から算出された報酬値に基づいて、データセット46に対する走行体の停車位置Poとアウトリガ130の張出位置Roを深層強化学習することにより生成されている。
【0105】
このため、決定部20は、クレーン作業の効率が高い、走行体110の停車位置Poを決定することができる。また、クレーン作業の効率が高い、アウトリガの張出位置Roを求めることができる。その結果、クレーン作業の効率が高い位置にラフテレーンクレーン100を設置することができる。
【0106】
以上、本発明の実施の形態を説明したが、本発明は上記の実施の形態に限定されるものではない。例えば、上記の実施の形態では、位置決定装置1が学習部40を備えている。しかし、本発明はこれに限定されない。位置決定装置1では、決定部20が、実施の形態で説明した学習済みモデルを用いて、走行体110の停車位置Po及びアウトリガ130の張出位置Roを決定できれば良い。
【0107】
図10は、他の実施の形態に係る位置決定装置2の機能ブロック図である。
【0108】
図10に示すように、位置決定装置2は、実施の形態で説明した入力部10、決定部20及び出力部30を備え、学習部40を備えていない。図示しないが、決定部20は、無線通信モジュールを有する。
【0109】
一方、学習部40は、決定部20の無線通信モジュールとネットワーク50を経由して接続されたサーバー3に設けられている。そして、学習部40は、無線通信モジュールを介して、決定部20のニューラルネットワーク部21を深層強化学習させて、実施の形態で説明した学習済みモデルを生成することが可能である。また、学習部40は、学習済みモデルの生成後、無線通信モジュールを介して、ノード211間の結合強度の重みθをパラメータデータベース25に格納することが可能である。
【0110】
このように、位置決定装置1、2は、学習部40を備えなくてもよい。そして、位置決定装置1、2が学習部40を備えない場合、パラメータデータベース25に重みθが格納されていれば良い。
【0111】
上記の実施の形態では、決定部20がニューラルネットワーク部21を有している。しかし、本発明はこれに限定されない。決定部20は、開始地点Ps、終了地点Pe、吊荷200の荷重mr、作業領域M及び、動作効率のデータに対する走行体110の停車位置Po及びアウトリガ130の張出位置Roを強化学習することにより生成された学習済みモデルを用いて、停車位置Po及び張出位置Roを決定すれば良い。学習済みモデルは、強化学習することにより生成されていれば良いので、決定部20がニューラルネットワーク部21を有する必要はない。学習済みモデルは、深層強化学習のほか、Qラーニング、サルサ(Sarsa)、モンテカルロ法で強化学習されても良い。
【0112】
上記の実施の形態では、入力部10に、作業領域Mの気温T、風速W、風向VXYZが入力され、さらに、学習部40が、これら気温T、風速W、風向VXYZをニューラルネットワーク部21の入力層212に入力して深層強化学習をしている。しかし、本発明はこれに限定されない。位置決定装置1、2では、気温T、風速W、風向VXYZのデータの有無は任意である。例えば、気温Tが常温で、風速Wが、ほぼ無風の結果、0.3m/秒未満の場合、クレーン作業での旋回体111の旋回効率Pr、ブーム120の起伏効率Pl、ウインチ112のウインチ効率Pwにほとんど影響がない。このため、常温かつ無風であることを前提にして、学習部40に学習済みモデルを生成させ、その学習済みモデルを用いて、決定部20が停車位置Poと張出位置Roを決定しても良い。この場合、数式2の環境係数Kr、Kl、Kwを数値1に固定して、動作効率評価関数J(Work)を求めると良い。
【0113】
なお、本明細書では、数式2の環境係数Kr、Kl、Kwを1の大きさの定数としたときの、動作効率評価関数J(Work)のことを第一動作効率の関数、数式2の環境係数Kr、Kl、Kwが変数であるときの動作効率評価関数J(Work)のことを第二動作効率の関数ともいう。
【0114】
上記の実施の形態では、位置決定装置1、2がラフテレーンクレーン100に装備されているが、位置決定装置1、2は、走行体110とアウトリガ130を備える移動式クレーン全般に適用可能である。例えば、位置決定装置1、2は、オールテレーンクレーン、トラッククレーンにも適用可能である。
【0115】
2020年7月27日出願の特願2020-126487の日本出願に含まれる明細書、図面、及び要約書の開示内容は、すべて本願に援用される。
【産業上の利用可能性】
【0116】
本発明に係る地切り制御装置は、ラフテレーンクレーンに限らず、種々の移動式クレーンに適用できる。
【符号の説明】
【0117】
1、2 位置決定装置
3 サーバー
10 入力部
11 データセット
20 決定部
21 ニューラルネットワーク部
22 演算部
25 パラメータデータベース
30 出力部
40 学習部
45 学習用データベース
46 データセット
50 ネットワーク
100 ラフテレーンクレーン
110 走行体
111 旋回体
112 ウインチ
120 ブーム
121 ブームヘッド
130 アウトリガ
131 ビーム
132 ジャッキ
133 フロート
200 吊荷
211 ノード
212 入力層
213 隠れ層
214 出力層
310 メモリ
311 ニューラルネットワークプログラム
312 学習プログラム
313 位置決定プログラム
320 CPU
330 補助メモリ
a、b 弦長
M 作業領域
T 気温
W 風速
VXYZ 風向
r1-r4 位置
Ps 開始地点
Pe 終了地点
Po 停車位置
Ro 張出位置