特許7419348 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社小松製作所の特許一覧

特許7419348作業機械を含むシステム、コンピュータによって実行される方法、および学習済みの姿勢推定モデルの製造方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-01-12

(45)【発行日】2024-01-22

(54)【発明の名称】作業機械を含むシステム、コンピュータによって実行される方法、および学習済みの姿勢推定モデルの製造方法

(51)【国際特許分類】

E02F 9/20 20060101AFI20240115BHJP

E02F 9/26 20060101ALI20240115BHJP

G06N 3/04 20230101ALI20240115BHJP

【ＦＩ】

E02F9/20 Q

E02F9/26 B

G06N3/04

【請求項の数】 11

(21)【出願番号】P 2021511888

(86)(22)【出願日】2020-03-26

(86)【国際出願番号】 JP2020013507

(87)【国際公開番号】W WO2020203596

(87)【国際公開日】2020-10-08

【審査請求日】2023-02-16

(31)【優先権主張番号】P 2019072225

(32)【優先日】2019-04-04

(33)【優先権主張国・地域又は機関】JP

(73)【特許権者】

【識別番号】000001236

【氏名又は名称】株式会社小松製作所

(74)【代理人】

【識別番号】110001195

【氏名又は名称】弁理士法人深見特許事務所

(72)【発明者】

【氏名】清水実

【審査官】柿原巧弥

(56)【参考文献】

【文献】特開２００１－１４２５０６（ＪＰ，Ａ）

【文献】国際公開第２０１７／０１０２１２（ＷＯ，Ａ１）

【文献】特開２０１８－１９０２４１（ＪＰ，Ａ）

【文献】特開２０１６－１５６１９３（ＪＰ，Ａ）

【文献】特開２０１５－０６３８６４（ＪＰ，Ａ）

【文献】国際公開第２０１５／１２９９３２（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｅ０２Ｆ９／２０

Ｅ０２Ｆ９／２６

Ｇ０６Ｎ３／０４

(57)【特許請求の範囲】

【請求項1】

作業機械本体と、
前記作業機械本体に取り付けられた作業機と、
コンピュータとを備え、
前記コンピュータは、作業中の前記作業機の目標姿勢を求めるための学習済み姿勢推定モデルを有し、
前記コンピュータは、前記作業機による作業開始からの経過時間と、前記作業機械本体および前記作業機の動作に関する機械データとを取得し、前記学習済み姿勢推定モデルを用いて前記経過時間および前記機械データから前記目標姿勢を推定した推定目標姿勢を出力する、作業機械を含むシステム。

【請求項2】

前記学習済み姿勢推定モデルは、前記経過時間および前記機械データが入力されると、前記経過時間および前記機械データから前記推定目標姿勢を出力するように、学習用データセットを用いた学習処理がなされている、請求項１に記載のシステム。

【請求項3】

前記学習済み姿勢推定モデルは、学習用データセットを用いた学習処理により生成され、前記学習用データセットは、前記経過時間および前記機械データに対して、前記作業機の姿勢データをラベル付けした学習用データを複数含む、請求項１に記載のシステム。

【請求項4】

前記作業機は、前記作業機械本体に連結されたブームと、前記ブームに連結されたアタッチメントとを含む、請求項１～３のいずれか１項に記載のシステム。

【請求項5】

前記推定目標姿勢は、前記作業機械本体に対する前記ブームの角度と、前記ブームに対する前記アタッチメントの角度とを含む、請求項４に記載のシステム。

【請求項6】

前記アタッチメントはバケットである、請求項４または５に記載のシステム。

【請求項7】

前記機械データは、前記作業機械本体の走行に関するデータを含む、請求項１～６のいずれか１項に記載のシステム。

【請求項8】

コンピュータによって実行される方法であって、
作業機械本体に取り付けられた作業機による作業開始からの経過時間と、前記作業機械本体および前記作業機の動作に関する機械データと、を取得する工程と、
作業中の前記作業機の目標姿勢を求めるための学習済み姿勢推定モデルを用いて、前記経過時間および前記機械データから前記目標姿勢を推定した推定目標姿勢を求める工程と、
を備える方法。

【請求項9】

学習済みの姿勢推定モデルの製造方法であって、
作業機械本体に取り付けられた作業機による作業開始からの経過時間と、前記作業機械本体および前記作業機の動作に関する機械データと、作業中の前記作業機の姿勢データと、を含む学習用データを取得することと、
前記経過時間および前記機械データを前記姿勢推定モデルに入力し、前記作業機の目標姿勢を推定した推定目標姿勢の出力値を得ることと、
前記推定目標姿勢と前記姿勢データとから、前記姿勢推定モデルを学習させることと、を備える、製造方法。

【請求項10】

前記学習させることは、
前記姿勢データに対する前記推定目標姿勢の誤差を検出することと、
前記誤差に基づいて前記姿勢推定モデルを更新することとを含む、請求項９に記載の製造方法。

【請求項11】

作業機械本体に取り付けられた作業機による作業開始からの経過時間と、前記作業機械本体および前記作業機の動作に関する機械データとを取得することと、
学習済みの第１の姿勢推定モデルを用いて、作業中の前記作業機の目標姿勢を前記経過時間および前記機械データから推定した推定目標姿勢を求めることと、
前記経過時間および前記機械データを第２の姿勢推定モデルに入力し、作業中の前記作業機の目標姿勢を示す推定目標姿勢の出力値を得ることと、
前記第２の姿勢推定モデルから出力された前記作業機の推定目標姿勢と前記第１の姿勢推定モデルから出力された前記作業機の推定目標姿勢とから、前記第２の姿勢推定モデルを学習させることと、を備える、学習済みの姿勢推定モデルの製造方法。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、作業機械を含むシステム、コンピュータによって実行される方法、および学習済みの姿勢推定モデルの製造方法に関する。

【背景技術】

【0002】

ホイールローダの掘削作業においては、車両を前進させることにより作業機を土砂の山に押し込むと共に、作業機を上昇させる。これにより、土砂が作業機上に掬い取られる。

【0003】

従来、効率的な掘削作業を実行するため、作業機の動作を自動制御する技術が提案されている（たとえば、特許文献１参照）。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１８－１３５６４９号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

上記文献には、掘削作業時に、オペレータのアクセル操作およびバケット操作から、自動的にブームを駆動制御する技術が開示されている。オペレータの足によるアクセル操作と右手によるレバー操作とが必要であり、円滑な操作のためにはオペレータの熟練が要求される。

【0006】

作業中の作業機の目標姿勢を求めて、その目標姿勢に合わせて作業機を自動制御することにより、作業機械による作業のさらなる自動化が可能になる。

【0007】

そこで本開示では、作業中の作業機の目標姿勢を求めるための、作業機械を含むシステム、コンピュータによって実行される方法、および学習済みの姿勢推定モデルの製造方法が提供される。

【課題を解決するための手段】

【0008】

本開示のある局面に従うと、作業機械本体と、作業機械本体に取り付けられた作業機と、コンピュータとを備える、作業機械を含むシステムが提供される。コンピュータは、作業中の作業機の目標姿勢を求めるための学習済み姿勢推定モデルを有している。コンピュータは、作業機による作業開始からの経過時間と、作業機械本体および作業機の動作に関する機械データとを取得し、学習済み姿勢推定モデルを用いて経過時間および機械データから目標姿勢を推定した推定目標姿勢を出力する。

【0009】

本開示のある局面に従うと、コンピュータによって実行される方法が提供される。当該方法は、以下の処理を備えている。第１の処理は、作業機械本体に取り付けられた作業機による作業開始からの経過時間と、作業機械本体および作業機の動作に関する機械データと、を取得することである。第２の処理は、作業中の作業機の目標姿勢を求めるための学習済み姿勢推定モデルを用いて、経過時間および機械データから目標姿勢を推定した推定目標姿勢を求めることである。

【0010】

本開示のある局面に従うと、学習済みの姿勢推定モデルの製造方法が提供される。製造方法は、以下の処理を含んでいる。第１の処理は、作業機械本体に取り付けられた作業機による作業開始からの経過時間と、作業機械本体および作業機の動作に関する機械データと、作業中の作業機の姿勢データと、を含む学習用データを取得することである。第２の処理は、学習用データにより姿勢推定モデルを学習させることである。

【0011】

本開示のある局面に従うと、作業機械本体に取り付けられた作業機の作業中の目標姿勢を求める姿勢推定モデルを学習させるための、学習用データが提供される。学習用データは、作業機による作業開始からの経過時間と、経過時間を計測した時点での作業機械本体および作業機の動作に関する機械データと、経過時間を計測した時点での作業機の姿勢を示す姿勢データとを備えている。

【0012】

本開示のある局面に従うと、学習済みの姿勢推定モデルの製造方法が提供される。製造方法は、以下の処理を含んでいる。第１の処理は、作業機械本体に取り付けられた作業機による作業開始からの経過時間と、作業機械本体および作業機の動作に関する機械データとを取得することである。第２の処理は、学習済みの第１の姿勢推定モデルを用いて、作業中の作業機の目標姿勢を経過時間および機械データから推定した推定目標姿勢を求めることである。第３の処理は、経過時間および機械データと、推定目標姿勢と、を含む学習用データにより、第２の姿勢推定モデルを学習させることである。

【発明の効果】

【0013】

本開示に従えば、作業中の作業機の目標姿勢を精度良く取得することができる。

【図面の簡単な説明】

【0014】

【図1】実施形態に基づく作業機械の一例としてのホイールローダの側面図である。

【図2】実施形態に基づくホイールローダの構成を示す概略ブロック図である。

【図3】実施形態に基づくホイールローダによる掘削作業を説明する図である。

【図4】作業機械を含むシステムに含まれる、コンピュータの構成を示す模式図である。

【図5】出荷前のホイールローダのシステム構成を示すブロック図である。

【図6】学習済みの目標姿勢推定モデルの製造方法を示すフローチャートである。

【図7】目標姿勢推定モデルを学習させるための処理を示す概略図である。

【図8】工場出荷されるホイールローダのシステム構成を示すブロック図である。

【図9】工場出荷後に作業機の目標姿勢を推定するためにコンピュータによって実行される処理を示すフローチャートである。

【図10】学習済みの目標姿勢推定モデルを用いた、推定目標姿勢を得る処理を示す模式図である。

【図11】目標姿勢推定モデルの学習に関する変形例を示す概略図である。

【図12】蒸留モデルを生成するための処理を示すフローチャートである。

【発明を実施するための形態】

【0015】

以下、実施の形態について図に基づいて説明する。以下の説明では、同一部品には、同一の符号を付している。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。

【0016】

＜全体構成＞
実施の形態においては、作業機械の一例としてホイールローダ１について説明する。図１は、実施形態に基づく作業機械の一例としてのホイールローダ１の側面図である。

【0017】

図１に示されるように、ホイールローダ１は、車体フレーム２と、作業機３と、走行装置４と、キャブ５とを備えている。車体フレーム２、キャブ５などからホイールローダ１の車体が構成されている。ホイールローダ１の車体には、作業機３および走行装置４が取り付けられている。

【0018】

走行装置４は、ホイールローダ１の車体を走行させるものであり、走行輪４ａ、４ｂを含んでいる。ホイールローダ１は、走行輪４ａ、４ｂが回転駆動されることにより自走可能であり、作業機３を用いて所望の作業を行うことができる。

【0019】

車体フレーム２は、前フレーム２ａと後フレーム２ｂとを含んでいる。前フレーム２ａと後フレーム２ｂとは、互いに左右方向に揺動可能に取り付けられている。前フレーム２ａと後フレーム２ｂとに亘って、一対のステアリングシリンダ１１が取り付けられている。ステアリングシリンダ１１は、油圧シリンダである。ステアリングシリンダ１１がステアリングポンプ１２（図２参照）からの作動油によって伸縮することによって、ホイールローダ１の進行方向が左右に変更される。

【0020】

本明細書中において、ホイールローダ１が直進走行する方向を、ホイールローダ１の前後方向という。ホイールローダ１の前後方向において、車体フレーム２に対して作業機３が配置されている側を前方向とし、前方向と反対側を後方向とする。ホイールローダ１の左右方向とは、平面視において前後方向と直交する方向である。前方向を見て左右方向の右側、左側が、それぞれ右方向、左方向である。ホイールローダ１の上下方向とは、前後方向および左右方向によって定められる平面に直交する方向である。上下方向において地面のある側が下側、空のある側が上側である。

【0021】

前フレーム２ａには、作業機３および一対の走行輪（前輪）４ａが取り付けられている。作業機３は、車体の前方に配設されている。作業機３は、作業機ポンプ１３（図２参照）からの作動油によって駆動される。作業機ポンプ１３は、エンジン２１により駆動され、吐出する作動油によって作業機３を作動させる油圧ポンプである。作業機３は、ブーム１４と、作業具であるバケット６とを含んでいる。バケット６は、作業機３の先端に配置されている。バケット６は、ブーム１４の先端に着脱可能に装着されたアタッチメントの一例である。作業の種類に応じて、アタッチメントが、グラップル、フォーク、またはプラウなどに付け替えられる。

【0022】

ブーム１４の基端部は、ブームピン９によって前フレーム２ａに回転自在に取付けられている。バケット６は、ブーム１４の先端に位置するバケットピン１７によって、回転自在にブーム１４に取付けられている。

【0023】

前フレーム２ａとブーム１４とは、一対のブームシリンダ１６により連結されている。ブームシリンダ１６は、油圧シリンダである。ブームシリンダ１６の基端は、前フレーム２ａに取り付けられている。ブームシリンダ１６の先端は、ブーム１４に取り付けられている。ブームシリンダ１６が作業機ポンプ１３（図２参照）からの作動油によって伸縮することによって、ブーム１４が昇降する。ブームシリンダ１６は、ブームピン９を中心としてブーム１４を上下に回転駆動する。

【0024】

作業機３は、ベルクランク１８と、バケットシリンダ１９と、リンク１５とをさらに含んでいる。ベルクランク１８は、ブーム１４のほぼ中央に位置する支持ピン１８ａによって、ブーム１４に回転自在に支持されている。バケットシリンダ１９は、ベルクランク１８と前フレーム２ａとを連結している。リンク１５は、ベルクランク１８の先端部に設けられた連結ピン１８ｃに連結されている。リンク１５は、ベルクランク１８とバケット６とを連結している。

【0025】

バケットシリンダ１９は、油圧シリンダであり作業具シリンダである。バケットシリンダ１９の基端は、前フレーム２ａに取り付けられている。バケットシリンダ１９の先端は、ベルクランク１８の基端部に設けられた連結ピン１８ｂに取り付けられている。バケットシリンダ１９が作業機ポンプ１３（図２参照）からの作動油によって伸縮することによって、バケット６が上下に回動する。バケットシリンダ１９は、バケットピン１７を中心としてバケット６を回転駆動する。

【0026】

後フレーム２ｂには、キャブ５および一対の走行輪（後輪）４ｂが取り付けられている。キャブ５は、ブーム１４の後方に配置されている。キャブ５は、車体フレーム２上に載置されている。キャブ５内には、オペレータが着座するシート、および後述する操作装置８などが配置されている。

【0027】

＜システム構成＞
図２は、実施形態に基づくホイールローダ１の構成を示す概略ブロック図である。図２に示されるように、ホイールローダ１は、駆動源としてのエンジン２１、走行装置４、作業機ポンプ１３、ステアリングポンプ１２、操作装置８、制御装置１０、表示器５０などを備えている。

【0028】

エンジン２１は、たとえばディーゼルエンジンである。駆動源として、エンジン２１に代えて、蓄電体により駆動するモータが用いられてもよく、またエンジンとモータとの双方が用いられてもよい。エンジン２１は燃料噴射ポンプ２４を有している。燃料噴射ポンプ２４には、電子ガバナ２５が設けられている。シリンダ内に噴射する燃料量を調整することにより、エンジン２１の出力が制御される。この調整は、電子ガバナ２５が制御装置１０によって制御されることで行われる。

【0029】

エンジン回転数は、エンジン回転数センサ９１によって検出される。エンジン回転数センサ９１の検出信号は、制御装置１０に入力される。

【0030】

走行装置４は、エンジン２１からの駆動力によりホイールローダ１を走行させる装置である。走行装置４は、トルクコンバータ装置２３、トランスミッション２６、ならびに上述した前輪４ａおよび後輪４ｂなどを有している。

【0031】

トルクコンバータ装置２３は、ロックアップクラッチ２７とトルクコンバータ２８とを有している。ロックアップクラッチ２７は、油圧作動式のクラッチである。ロックアップクラッチ２７への作動油の供給が、クラッチ制御弁３１を介して、制御装置１０によって制御される。これによりロックアップクラッチ２７は、連結状態と非連結状態とに切換可能である。ロックアップクラッチ２７が非連結状態である場合には、トルクコンバータ２８が、オイルを媒体としてエンジン２１からの駆動力を伝達する。ロックアップクラッチ２７が連結状態である場合には、トルクコンバータ２８の入力側と出力側とが直結される。

【0032】

トランスミッション２６は、前進走行段に対応する前進クラッチＣＦと、後進走行段に対応する後進クラッチＣＲとを有している。各クラッチＣＦ，ＣＲの連結状態・非連結状態が切り換えられることによって、車両の前進と後進とが切り換えられる。クラッチＣＦ，ＣＲが共に非連結状態のときは、車両は中立状態となる。

【0033】

トランスミッション２６は、複数の速度段に対応した複数の速度段クラッチＣ１－Ｃ４を有しており、減速比を複数段階に切り換えることができる。各速度段クラッチＣ１－Ｃ４は、油圧作動式の油圧クラッチである。図示しない油圧ポンプからクラッチ制御弁３１を介してクラッチＣ１－Ｃ４へ作動油が供給される。クラッチ制御弁３１が制御装置１０によって制御されて、クラッチＣ１－Ｃ４への作動油の供給が制御されることにより、各クラッチＣ１－Ｃ４の連結状態及び非連結状態が切り換えられる。

【0034】

トランスミッション２６の出力軸には、Ｔ／Ｍ出力回転数センサ９２が設けられている。Ｔ／Ｍ出力回転数センサ９２は、トランスミッション２６の出力軸の回転数を検出する。Ｔ／Ｍ出力回転数センサ９２からの検出信号は、制御装置１０に入力される。制御装置１０は、Ｔ／Ｍ出力回転数センサ９２の検出信号に基づいて車速を算出する。

【0035】

トランスミッション２６から出力された駆動力は、シャフト３２などを介して車輪４ａ，４ｂに伝達される。これにより、ホイールローダ１が走行する。エンジン２１からの駆動力の一部が走行装置４に伝達されて、ホイールローダ１が走行する。

【0036】

エンジン２１の駆動力の一部は、ＰＴＯ（Power Take Off）軸３３を介して、作業機ポンプ１３およびステアリングポンプ１２に伝達される。作業機ポンプ１３およびステアリングポンプ１２は、エンジン２１からの駆動力によって駆動される油圧ポンプである。作業機ポンプ１３から吐出された作動油は、作業機制御弁３４を介してブームシリンダ１６およびバケットシリンダ１９に供給される。ステアリングポンプ１２から吐出された作動油は、ステアリング制御弁３５を介してステアリングシリンダ１１に供給される。作業機３は、エンジン２１からの駆動力の一部によって駆動される。

【0037】

第１油圧検出器９５は、ブームシリンダ１６に取り付けられている。第１油圧検出器９５は、ブームシリンダ１６の油室内の作動油の圧力を検出する。第１油圧検出器９５の検出信号は、制御装置１０に入力される。

【0038】

第２油圧検出器９６は、バケットシリンダ１９に取り付けられている。第２油圧検出器９６は、バケットシリンダ１９の油室内の作動油の圧力を検出する。第２油圧検出器９６の検出信号は、制御装置１０に入力される。

【0039】

第１角度検出器２９は、たとえば、ブームピン９に取り付けられたポテンショメータである。第１角度検出器２９は、車体に対するブーム１４の持ち上がり角度（チルト角度）を表すブーム角度を検出する。第１角度検出器２９は、ブーム角度を示す検出信号を制御装置１０に出力する。

【0040】

具体的には、図１に示すように、ブーム基準線Ａは、ブームピン９の中心とバケットピン１７の中心とを通る直線である。ブーム角度θ１は、ブームピン９の中心から前方に延びる水平線Ｈと、ブーム基準線Ａとの成す角度である。ブーム基準線Ａが水平である場合をブーム角度θ１＝０°と定義する。ブーム基準線Ａが水平線Ｈよりも上方にある場合にブーム角度θ１を正とする。ブーム基準線Ａが水平線Ｈよりも下方にある場合にブーム角度θ１を負とする。

【0041】

なお第１角度検出器２９は、ブームシリンダ１６に配置されたストロークセンサであってもよい。

【0042】

第２角度検出器４８は、たとえば、支持ピン１８ａに取り付けられたポテンショメータである。第２角度検出器４８は、ブーム１４に対するバケット６のチルト角度を表すバケット角度を検出する。第２角度検出器４８は、バケット角度を示す検出信号を制御装置１０に出力する。

【0043】

具体的には、図１に示すように、バケット基準線Ｂは、バケットピン１７の中心とバケット６の刃先６ａとを通る直線である。バケット角度θ２は、ブーム基準線Ａとバケット基準線Ｂとの成す角度である。バケット６を接地した状態でバケット６の刃先６ａが地上において水平となる場合をバケット角度θ２＝０°と定義する。バケット６を掘削方向（上向き）に移動した場合にバケット角度θ２を正とする。バケット６をダンプ方向（下向き）に移動した場合にバケット角度θ２を負とする。

【0044】

第２角度検出器４８は、ブーム１４に対するベルクランク１８の角度（ベルクランク角度）を検出することにより、バケット角度θ２を検出してもよい。ベルクランク角度は、支持ピン１８ａの中心と連結ピン１８ｂの中心とを通る直線と、ブーム基準線Ａとの成す角度である。第２角度検出器４８は、バケットピン１７に取り付けられたポテンショメータまたは近接スイッチであってもよい。または第２角度検出器４８は、バケットシリンダ１９に配置されたストロークセンサであってもよい。

【0045】

操作装置８は、オペレータによって操作される。操作装置８は、アクセル操作部材８１ａ、アクセル操作検出部８１ｂ、ステアリング操作部材８２ａ、ステアリング操作検出部８２ｂ、ブーム操作部材８３ａ、ブーム操作検出部８３ｂ、バケット操作部材８４ａ、バケット操作検出部８４ｂ、変速操作部材８５ａ、変速操作検出部８５ｂ、ＦＲ操作部材８６ａ、および、ＦＲ操作検出部８６ｂなどを有している。

【0046】

アクセル操作部材８１ａは、エンジン２１の目標回転数を設定するために操作される。アクセル操作部材８１ａは、たとえばアクセルペダルである。アクセル操作部材８１ａの操作量（アクセルペダルの場合、踏み込み量）を増大すると、車体は加速する。アクセル操作部材８１ａの操作量を減少すると、車体は減速する。アクセル操作検出部８１ｂは、アクセル操作部材８１ａの操作量を検出する。アクセル操作部材８１ａの操作量を、アクセル操作量と称する。アクセル操作検出部８１ｂは、アクセル操作量を検出する。アクセル操作検出部８１ｂは、検出信号を制御装置１０へ出力する。

【0047】

ステアリング操作部材８２ａは、車両の移動方向を操作するために操作される。ステアリング操作部材８２ａは、たとえばステアリングハンドルである。ステアリング操作検出部８２ｂは、ステアリング操作部材８２ａの位置を検出し、検出信号を制御装置１０に出力する。制御装置１０は、ステアリング操作検出部８２ｂからの検出信号に基づいてステアリング制御弁３５を制御する。ステアリングシリンダ１１が伸縮して、車両の進行方向が変更される。

【0048】

ブーム操作部材８３ａは、ブーム１４を動作させるために操作される。ブーム操作部材８３ａは、たとえば操作レバーである。ブーム操作検出部８３ｂは、ブーム操作部材８３ａの位置を検出する。ブーム操作検出部８３ｂは、検出信号を制御装置１０に出力する。制御装置１０は、ブーム操作検出部８３ｂからの検出信号に基づいて、作業機制御弁３４を制御する。ブームシリンダ１６が伸縮して、ブーム１４が動作する。

【0049】

バケット操作部材８４ａは、バケット６を動作させるために操作される。バケット操作部材８４ａは、たとえば操作レバーである。バケット操作検出部８４ｂは、バケット操作部材８４ａの位置を検出する。バケット操作検出部８４ｂは、検出信号を制御装置１０に出力する。制御装置１０は、バケット操作検出部８４ｂからの検出信号に基づいて、作業機制御弁３４を制御する。バケットシリンダ１９が伸縮して、バケット６が動作する。

【0050】

変速操作部材８５ａは、トランスミッション２６の速度段を設定するために操作される。変速操作部材８５ａは、たとえばシフトレバーである。変速操作検出部８５ｂは、変速操作部材８５ａの位置を検出する。変速操作検出部８５ｂは、検出信号を制御装置１０に出力する。制御装置１０は、変速操作検出部８５ｂからの検出信号に基づいて、トランスミッション２６の変速を制御する。

【0051】

ＦＲ操作部材８６ａは、車両の前進と後進とを切り換えるために操作される。ＦＲ操作部材８６ａは、前進、中立および後進の各位置に切り換えられる。ＦＲ操作検出部８６ｂは、ＦＲ操作部材８６ａの位置を検出する。ＦＲ操作検出部８６ｂは、検出信号を制御装置１０に出力する。制御装置１０は、ＦＲ操作検出部８６ｂからの検出信号に基づいてクラッチ制御弁３１を制御する。前進クラッチＣＦおよび後進クラッチＣＲが制御され、車両の前進と後進と中立状態とが切り換えられる。

【0052】

表示器５０は、制御装置１０から指令信号の入力を受けて、各種情報を表示する。表示器５０に表示される各種情報は、たとえば、ホイールローダ１により実行される作業に関する情報、燃料残量、冷却水温度および作動油温度などの車体情報、ホイールローダ１の周辺を撮像した周辺画像などであってもよい。表示器５０はタッチパネルであってもよく、この場合、オペレータが表示器５０の一部に触れることにより生成される信号が、表示器５０から制御装置１０に出力される。

【0053】

制御装置１０は、一般的にＣＰＵ（Central Processing Unit）により各種のプログラムを読み込むことにより実現される。制御装置１０は、メモリ６０と接続されている。メモリ６０は、ワークメモリとして機能するとともに、ホイールローダの機能を実現するための各種のプログラムを格納する。

【0054】

制御装置１０は、アクセル操作部材８１ａの操作量に応じた目標回転数が得られるように、エンジン指令信号を電子ガバナ２５に送る。制御装置１０は、電子ガバナ２５の制御に従って変動するエンジン２１への燃料供給量に基づいて、エンジン２１の単位稼働時間あたりの燃料消費量、ホイールローダ１の単位走行距離あたりの燃料消費量、および、バケット６内の単位積載重量あたりの燃料消費量を、算出可能である。

【0055】

制御装置１０は、Ｔ／Ｍ出力回転数センサ９２の検出信号に基づいて、ホイールローダ１の車速を算出する。制御装置１０は、ホイールローダ１の車速と牽引力との関係を規定するマップをメモリ６０から読み出し、当該マップに基づいて、牽引力を算出する。

【0056】

制御装置１０は、エンジン回転数センサ９１から、エンジン回転数の検出信号の入力を受ける。制御装置１０は、エンジン回転数とエンジントルクとの関係を規定するマップをメモリ６０から読み出し、当該マップに基づいて、エンジントルクを算出する。

【0057】

牽引力およびエンジントルクは、マップの参照とは異なる形態で算出されてもよい。たとえば、テーブルの参照または数式による演算などによって、牽引力およびエンジントルクを算出してもよい。

【0058】

制御装置１０は、ブーム１４およびバケット６の動作を自動制御する。この自動制御の詳細については後述する。

【0059】

＜掘削作業＞
本実施形態のホイールローダ１は、土砂などの掘削対象物を掬い取る掘削作業を実行する。図３は、実施形態に基づくホイールローダ１による掘削作業を説明する図である。

【0060】

図３に示されるように、ホイールローダ１は、バケット６の刃先６ａを掘削対象物１００に食い込ませた後に、図３中の曲線矢印のように、バケット軌跡Ｌに沿ってバケット６を上昇させる。これにより、掘削対象物１００を掬い取る掘削作業が実行される。

【0061】

本実施形態のホイールローダ１は、掘削対象物１００をバケット６に掬い取る掘削動作と、バケット６内の荷（掘削対象物１００）をダンプトラックなどの運搬機械に積み込む積込動作とを実行する。

【0062】

より具体的には、ホイールローダ１は、次のような複数の作業工程を順次に行うことを繰り返して、掘削対象物１００を掘削し、ダンプトラックなどの運搬機械に掘削対象物１００を積み込む。

【0063】

第一の工程は、掘削対象物１００に向かって前進する空荷前進工程である。第二の工程は、バケット６の刃先６ａが掘削対象物１００に食い込むまでホイールローダ１を前進させる掘削（突込み）工程である。第三の工程は、ブームシリンダ１６を操作してバケット６を上昇させるとともにバケットシリンダ１９を操作してバケット６をチルトバックさせる掘削（掬込み）工程である。第四の工程は、バケット６に掘削対象物１００が掬い込まれた後にホイールローダ１を後進させる積荷後進工程である。

【0064】

第五の工程は、バケット６を上昇させた状態を維持しながら、またはバケット６を上昇させながら、ホイールローダ１を前進させてダンプトラックに接近させる、積荷前進工程である。第六の工程は、所定位置でバケット６をダンプして掘削対象物１００をダンプトラック荷台上に積み込む排土工程である。第七の工程は、ホイールローダ１を後進させながらブーム１４を下げ、バケット６を掘削姿勢に戻す、後進・ブーム下げ工程である。以上が、掘削積込作業の１サイクルをなす典型的な作業工程である。

【0065】

＜コンピュータ１０２Ａの詳細構成＞
図４は、作業機械を含むシステムに含まれる、コンピュータ１０２Ａの構成を示す模式図である。実施形態に係るシステムは、作業機械の作業中、典型的にはホイールローダ１による掘削作業中の、作業機械本体（図１を参照して説明した車体）に対するブーム１４の角度（ブーム角度θ１、図１）と、ブーム１４に対するバケット６の角度（バケット角度θ２、図１）との目標値を求めるためのシステムである。図４に示されるコンピュータ１０２Ａは、図２に示される制御装置１０の一部構成を成すものである。コンピュータ１０２Ａは、実施形態に係るシステム用に専用に設計されたものであってもよく、または汎用のＰＣ（Personal Computer）であってもよい。

【0066】

コンピュータ１０２Ａは、プロセッサ１０３と、記憶装置１０４と、通信インタフェース１０５と、Ｉ／Ｏインタフェース１０６とを有している。プロセッサ１０３は、たとえばＣＰＵである。

【0067】

記憶装置１０４は、記憶されたプログラムおよびデータなどの情報をプロセッサ１０３が読み取り可能なように記憶する媒体を含んでいる。記憶装置１０４は、ＲＡＭ（Random Access Memory）、またはＲＯＭ（Read Only Memory）などのシステムメモリと、補助記憶装置とを含んでいる。補助記憶装置は、たとえばハードディスクなどの磁気的記録媒体、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）などの光学的記録媒体、またはフラッシュメモリなどの半導体メモリであってもよい。記憶装置１０４は、コンピュータ１０２Ａに内蔵されてもよい。記憶装置１０４は、コンピュータ１０２Ａに着脱可能に接続される外部記録媒体１０９を含んでもよい。外部記録媒体１０９は、ＣＤ－ＲＯＭであってもよい。

【0068】

通信インタフェース１０５は、たとえば有線ＬＡＮ（Local Area Network）モジュール、または無線ＬＡＮモジュールなどであり、通信ネットワークを介した通信を行うためのインタフェースである。Ｉ／Ｏインタフェース１０６は、たとえばＵＳＢ（Universal Serial Bus）ポートなどであり、外部装置と接続するためのインタフェースである。

【0069】

コンピュータ１０２Ａは、Ｉ／Ｏインタフェース１０６を介して、入力装置１０７、および出力装置１０８と接続される。入力装置１０７は、ユーザがコンピュータ１０２Ａへの入力を行うための装置である。入力装置１０７は、たとえば、マウス、またはトラックボールなどのポインティングデバイスを含んでいる。入力装置１０７は、キーボードなどの文字入力のための装置を含んでもよい。出力装置１０８は、たとえば、ディスプレイ（表示器５０、図２）を含んでいる。

【0070】

図５は、出荷前のホイールローダ１のシステム構成を示すブロック図である。図５に示されるプロセッサ１０３および記憶装置１０４は、図４に示されるコンピュータ１０２Ａの一部構成をなすものである。プロセッサ１０３は、演算部１６１を有している。

【0071】

演算部１６１は、第１油圧検出器９５から、ブームシリンダ１６の油室内の作動油の圧力を検出した検出信号の入力を受ける。演算部１６１は、アクセル操作検出部８１ｂから、アクセル操作量を検出した検出信号の入力を受ける。演算部１６１は、Ｔ／Ｍ出力回転数センサ９２から、トランスミッション２６の出力軸の回転数を検出した検出信号の入力を受ける。演算部１６１は、Ｔ／Ｍ出力回転数センサ９２の検出信号に基づいて、ホイールローダ１の車速を演算する。

【0072】

演算部１６１は、エンジン回転数センサ９１から、エンジン回転数を検出した検出信号の入力を受ける。演算部１６１は、アクセル操作量に基づいてエンジン２１への燃料供給量を演算し、土砂などの掘削対象物１００のバケット６内への積込量をブームシリンダ１６の油室内の油圧に基づいて演算し、さらに燃料供給量当たりの掘削対象物の積込量（すなわち、燃料消費率）を演算する。

【0073】

演算部１６１は、ホイールローダ１の車速と牽引力との関係を規定するマップを参照して、ホイールローダ１の車速に基づいて、牽引力を演算する。演算部１６１は、エンジン回転数とエンジントルクとの関係を規定するマップを参照して、エンジン回転数に基づいて、エンジントルクを演算する。

【0074】

ブームシリンダ１６の油圧、アクセル操作量、車速、エンジン回転数、燃料消費率、牽引力、およびエンジントルクは、作業機械本体（車体）および作業機３の動作に関する機械データに含まれる。機械データは、アクセル操作量、車速、エンジン回転数、牽引力およびエンジントルクなどの、作業車両本体の走行に関するデータを含んでいる。

【0075】

プロセッサ１０３は、タイマ１６２を有している。演算部１６１は、タイマ１６２から現在時刻を読み出し、ホイールローダ１が掘削作業を実行しているときの、掘削作業開始からの経過時間を演算する。

【0076】

掘削作業が開始したこと、すなわちホイールローダ１の作業工程が空荷前進工程から掘削（突込み）工程へと移ったことは、バケット６の刃先６ａが掘削対象物１００に突っ込みバケット６に掘削対象物１００の負荷が作用し始めるときにブームシリンダ１６の油室内の油圧が増加することを検出すること、および作業機３が掘削作業を始める姿勢にあるかをブーム角度θ１とバケット角度θ２とにより確認することで、判定される。作業においてブームシリンダ１６が受ける負荷を基に、作業開始時点が判定されてもよい。作業開始は、ホイールローダ１の周辺を撮像装置で撮影した撮像データを基に判定してもよい。

【0077】

掘削作業が終了したこと、すなわちホイールローダ１の作業工程が掘削（掬込み）工程から積荷後進工程へと移ったことは、ホイールローダ１の走行する方向が前進方向から後進方向へと変化し、かつバケット６の動作が掘削対象物１００を掬い込むためのチルトバックから中立になったことを検出することで、判定される。

【0078】

プロセッサ１０３は、角度検出部１６３を有している。角度検出部１６３は、第１角度検出器２９からブーム角度θ１を検出した検出信号の入力を受ける。角度検出部１６３は、第２角度検出器４８からバケット角度θ２を検出した検出信号の入力を受ける。

【0079】

掘削作業中のある時刻に検出されたブーム角度θ１およびバケット角度θ２は、当該時刻における掘削作業開始からの経過時間と、当該時刻に取得された機械データとに割り当てられたものとされ、学習用データとして記憶装置１０４に格納される。記憶装置１０４には、目標姿勢推定モデル１８０を学習させるための学習用データセット１８８が保存されている。学習用データセット１８８は、掘削作業中のある時刻における掘削作業開始からの経過時間および機械データに対して、当該時刻における作業機３の姿勢（ブーム角度θ１およびバケット角度θ２）をラベル付けした学習用データを、複数含んでいる。

【0080】

プロセッサ１０３は、目標姿勢推定部１６５を有している。記憶装置１０４には、目標姿勢推定モデル１８０が保存されている。

【0081】

目標姿勢推定モデル１８０は、掘削作業中の作業機３の目標姿勢を求めるための人工知能モデルである。目標姿勢推定モデル１８０は、掘削作業開始からの経過時間および機械データから、掘削作業中の作業機３の目標姿勢を求めるように構成されている。コンピュータ１０２Ａは、人工知能の目標姿勢推定モデル１８０を用いることで、掘削作業中の作業機３の目標姿勢を推定する。目標姿勢推定部１６５は、目標姿勢推定モデル１８０を用いて、経過時間および機械データから作業機３の目標姿勢を推定した推定目標姿勢を求める。

【0082】

より具体的には、目標姿勢推定部１６５は、記憶装置１０４から目標姿勢推定モデル１８０を読み出し、演算部１６１で演算された作業開始からの経過時間および機械データを目標姿勢推定モデル１８０に入力することで、目標とすべきブーム角度θ１およびバケット角度θ２の推定結果の出力を得る。

【0083】

目標姿勢推定モデル１８０は、ニューラルネットワークを含んでいる。目標姿勢推定モデル１８０は、たとえば、畳み込みニューラルネットワーク（ＣＮＮ）などのディープニューラルネットワークを含んでいる。

【0084】

実施形態におけるモデルは、ハードウェア、ハードウェア上で実行可能なソフトウェア、ファームウェア、またそれらの組合せに実装されていてもよい。モデルは、プロセッサ１０３によって実行されるプログラム、アルゴリズム、およびデータを含んでもよい。モデルの機能は、単一のモジュールによって実行されてもよく、または複数のモジュールに分散して実行されてもよい。モデルは、複数のコンピュータに分散して配置されてもよい。

【0085】

プロセッサ１０３は、誤差算出部１６６と、目標姿勢推定モデル更新部１６７とを有している。

【0086】

誤差算出部１６６は、演算部１６１で演算された経過時間および機械データに対応する学習用データを選択する。誤差算出部１６６は、目標姿勢推定部１６５によって推定されたブーム角度θ１およびバケット角度θ２の推定結果と、選択された学習用データに含まれるブーム角度θ１およびバケット角度θ２とを比較する。誤差算出部１６６は、学習用データに含まれるブーム角度θ１およびバケット角度θ２の値に対する、目標姿勢推定部１６５で推定されたブーム角度θ１およびバケット角度θ２の推定結果の誤差を算出する。

【0087】

目標姿勢推定モデル更新部１６７は、誤差算出部１６６が算出したブーム角度θ１およびバケット角度θ２の誤差に基づいて、目標姿勢推定モデル１８０を更新する。このようにして、目標姿勢推定モデル１８０の学習が行なわれる。目標姿勢推定モデル１８０の学習は、ホイールローダ１の出荷前に、工場で行なわれる。

【0088】

＜学習済みの目標姿勢推定モデル１８０の製造方法＞
図６は、学習済みの目標姿勢推定モデル１８０の製造方法を示すフローチャートである。図７は、目標姿勢推定モデル１８０を学習させるための処理を示す概略図である。図５について説明した内容と一部重複もあるが、図６および図７を参照して、掘削作業中の作業機３の目標姿勢を推定する目標姿勢推定モデル１８０を学習させるための処理について、以下に説明する。

【0089】

図６に示されるように、まずステップＳ１０１において、経過時間および機械データを取得する。ステップＳ１０２において、作業機姿勢データを取得する。

【0090】

コンピュータ１０２Ａ、より詳しくは演算部１６１は、掘削作業中のある時刻における掘削作業開始からの経過時間を演算する。また演算部１６１は、第１油圧検出器９５、アクセル操作検出部８１ｂ、Ｔ／Ｍ出力回転数センサ９２およびエンジン回転数センサ９１を含む各種のセンサの検出結果に基づいて、当該時刻における機械データを演算する。角度検出部１６３は、第１角度検出器２９および第２角度検出器４８の検出結果に基づいて、当該時刻におけるブーム角度θ１およびバケット角度θ２を検出する。

【0091】

図７に示されるように、複数のオペレータによる実際の掘削作業、望ましくは数万回以上の掘削作業のうち、生産性の高い掘削が行なわれたときの、経過時間および機械データ（図７に示される説明変数）、ならびに作業機姿勢データ（図７に示される推定変数）が抽出される。実際の掘削作業のうち、掘削時間が短く掘削土量が多い掘削が行なわれたときの、経過時間および機械データと作業機姿勢データとを含む、学習用データ１８８Ａ，１８８Ｂ，１８８Ｃ，…，が作成される。

【0092】

学習用データは、オペレータが手入力で入力するデータ、掘削対象物１００の土質および傾斜の角度、ならびに、ホイールローダ１の周辺を撮像装置で撮像した撮像データなどをさらに含んでもよい。

【0093】

次にステップＳ１０３において、作業機３の目標姿勢を出力する。コンピュータ１０２Ａ、より詳しくは目標姿勢推定部１６５は、記憶装置１０４から目標姿勢推定モデル１８０を読み出す。目標姿勢推定モデル１８０は、図７に示すニューラルネットワークを含んでいる。ニューラルネットワークは、入力層１８１と、中間層（隠れ層）１８２と、出力層１８３とを含んでいる。中間層１８２は多層化されている。入力層１８１、中間層１８２および出力層１８３は、１または複数のユニット（ニューロン）を有している。入力層１８１、中間層１８２および出力層１８３のユニットの数は、適宜設定することができる。

【0094】

隣り合う層のユニット同士は結合されており、各結合には重みが設定されている。各ユニットにはバイアスが設定されている。各ユニットには閾値が設定されている。各ユニットへの入力値と重みとの積の総和にバイアスを加算した値が閾値を超えているか否かによって、各ユニットの出力値が決定される。

【0095】

目標姿勢推定モデル１８０は、作業開始からの経過時間および機械データから、作業中の作業機３の目標姿勢を求めるように学習される。学習によって得られた目標姿勢推定モデル１８０のパラメータは、記憶装置１０４に記憶されている。目標姿勢推定モデル１８０のパラメータは、たとえば、ニューラルネットワークの層数、各層におけるユニットの個数、ユニット同士の結合関係、各ユニット間の結合の重み、各ユニットに紐付けられているバイアス、および各ユニットの閾値を含んでいる。

【0096】

目標姿勢推定部１６５は、演算部１６１が演算した経過時間および機械データを、入力層１８１に入力する。出力層１８３から、作業機３の目標姿勢、具体的にはブーム角度θ１およびバケット角度θ２を示す出力値が出力される。たとえば、コンピュータ１０２Ａは、経過時間および機械データを入力層１８１の入力として用いて、目標姿勢推定モデル１８０のニューラルネットワークの順方向伝播の演算処理を行う。これにより、コンピュータ１０２Ａは、ニューラルネットワークの出力層１８３から出力される出力値として、作業機３の目標姿勢を推定した推定目標姿勢を得る。

【0097】

ステップＳ１０２の処理とステップＳ１０３の処理とは、ステップＳ１０２の処理の後にステップＳ１０３の処理が行われなくてもよい。ステップＳ１０２の処理とステップＳ１０３の処理とが同時に行われてもよく、ステップＳ１０３の処理の後にステップＳ１０２の処理が行われてもよい。

【0098】

次にステップＳ１０４において、ステップＳ１０３で出力された作業機３の目標姿勢と、ステップＳ１０２で取得された作業機姿勢データとの差を算出する。コンピュータ１０２Ａ、より詳しくは誤差算出部１６６は、目標姿勢推定モデル１８０の出力層１８３から出力された、作業機３の目標姿勢を推定した推定目標姿勢と、該当の学習用データに含まれる作業機３の姿勢とを比較して、作業機姿勢データに対する推定目標姿勢の誤差を算出する。

【0099】

コンピュータ１０２Ａは、掘削作業中のある時刻における作業開始からの経過時間と、当該時刻における機械データとを入力データとし、当該時刻における作業機３の姿勢を示す姿勢データ（ブーム角度θ１およびバケット角度θ２）を教師データとして、目標姿勢推定モデル１８０の学習を行う。コンピュータ１０２Ａは、算出した出力値の誤差から、バックプロパゲーションにより、各ユニット間の結合の重み、各ユニットのバイアス、および各ユニットの閾値のそれぞれの誤差を算出する。

【0100】

次にステップＳ１０５において、目標姿勢推定モデル１８０を更新する。コンピュータ１０２Ａ、より詳しくは目標姿勢推定モデル更新部１６７は、誤差算出部１６６で算出された、角度検出部１６３で得られた作業機３の姿勢に対する推定目標姿勢の誤差に基づいて、各ユニット間の結合の重み、各ユニットのバイアス、および各ユニットの閾値などの、目標姿勢推定モデル１８０のパラメータを更新する。そして、同じ経過時間および機械データが入力層１８１に入力されたならば、作業機３の姿勢を示す姿勢データにより近い出力値を出力できるようにする。更新された目標姿勢推定モデル１８０のパラメータは、記憶装置１０４に記憶される。

【0101】

次回に作業機３の目標姿勢を推定するときには、更新された目標姿勢推定モデル１８０に経過時間および機械データを入力して、作業機３の推定目標姿勢の出力を得る。コンピュータ１０２Ａは、目標姿勢推定モデル１８０が出力する作業機３の推定目標姿勢が、経過時間および機械データを取得した時点での作業機３の姿勢を示す姿勢データと一致するようになるまで、ステップＳ１０１からステップＳ１０５までの処理を繰り返す。このようにして、目標姿勢推定モデル１８０のパラメータが最適化され、目標姿勢推定モデル１８０の学習が行われる。

【0102】

目標姿勢推定モデル１８０が十分に学習を積み重ねた結果、十分に精度の高い推定目標姿勢が得られるようになると、コンピュータ１０２Ａは目標姿勢推定モデル１８０の学習を終える。このようにして、学習済みの目標姿勢推定モデル１８０が作成される。そして、処理を終了する（エンド）。

【0103】

なお、目標姿勢推定モデル１８０の各種のパラメータの初期値は、テンプレートにより与えられてもよい。またはパラメータの初期値は、人間の入力により手動で与えられてもよい。目標姿勢推定モデル１８０の再学習を行うときには、コンピュータ１０２Ａは、再学習を行う対象となる目標姿勢推定モデル１８０のパラメータとして記憶装置１０４に記憶されている値に基づいて、パラメータの初期値を用意してもよい。

【0104】

＜学習済みの目標姿勢推定モデル１８０を用いた作業機３の目標姿勢の推定＞
図８は、工場出荷されるホイールローダ１のシステム構成を示すブロック図である。工場出荷されるホイールローダ１は、図５に示されるコンピュータ１０２Ａに替えて、コンピュータ１０２Ｂを備えている。コンピュータ１０２Ｂは、プロセッサ１０３と記憶装置１０４とを有している。

【0105】

プロセッサ１０３は、図５と同様の、演算部１６１、タイマ１６２および目標姿勢推定部１６５を有している。プロセッサ１０３はまた、ブーム制御部１６８と、バケット制御部１６９とを有している。プロセッサ１０３は、図５に示される角度検出部１６３、誤差算出部１６６および目標姿勢推定モデル更新部１６７を有していない。記憶装置１０４は、学習済みの目標姿勢推定モデル１８０を有している。記憶装置１０４は、図５に示される学習用データセット１８８を有していない。

【0106】

図９は、工場出荷後に作業機３の目標姿勢を推定するためにコンピュータ１０２Ｂによって実行される処理を示すフローチャートである。図１０は、作業開始からの経過時間および機械データから作業機３の目標姿勢を求めるように学習済みの目標姿勢推定モデル１８０を用いた、推定目標姿勢を得る処理を示す模式図である。図８～１０を参照して、工場出荷後に掘削作業中の作業機３の目標姿勢を推定する処理について、以下に説明する。

【0107】

まずステップＳ２０１において、経過時間および機械データを取得する。コンピュータ１０２Ｂ、より詳しくは演算部１６１は、掘削作業中のある時刻における掘削作業開始からの経過時間を演算する。また演算部１６１は、第１油圧検出器９５、アクセル操作検出部８１ｂ、Ｔ／Ｍ出力回転数センサ９２およびエンジン回転数センサ９１を含む各種のセンサの検出結果に基づいて、当該時刻における機械データを演算する。図１０に示される入力データ１９１は、経過時間と、機械データとを含んでいる。

【0108】

次にステップＳ２０２において、作業機３の目標姿勢を推定する。コンピュータ１０２Ｂ、より詳しくは目標姿勢推定部１６５は、目標姿勢推定モデル１８０および学習済みのパラメータの最適値を記憶装置１０４から読み出すことで、学習済みの目標姿勢推定モデル１８０を取得する。目標姿勢推定部１６５は、演算部１６１で演算された経過時間および機械データを、目標姿勢推定モデル１８０への入力データ１９１として用いる。目標姿勢推定部１６５は、経過時間および機械データを、学習済みの目標姿勢推定モデル１８０の入力層１８１に含まれる各ユニットに入力する。学習済みの目標姿勢推定モデル１８０の出力層１８３から、掘削作業中の作業機３の目標姿勢を推定した推定目標姿勢、具体的にはブーム角度θ１およびバケット角度θ２を含む角度出力値１９７（図１０）が出力される。

【0109】

次にステップＳ２０３において、コンピュータ１０２Ｂは、推定目標姿勢に基づいて、作業機３を動作する。

【0110】

目標姿勢推定部１６５からブーム制御部１６８に、目標のブーム角度θ１が出力される。ブーム制御部１６８は、目標のブーム角度θ１に基づいて、ブームシリンダ１６に制御信号を出力する。制御信号を受けたブームシリンダ１６が伸びるまたは縮むことにより、ブーム角度θ１の実際の値が目標値に近づくように、ブーム１４を動作させる自動制御が行われる。

【0111】

目標姿勢推定部１６５からバケット制御部１６９に、目標のバケット角度θ２が出力される。バケット制御部１６９は、目標のバケット角度θ２に基づいて、バケットシリンダ１９に制御信号を出力する。制御信号を受けたバケットシリンダ１９が伸びるまたは縮むことにより、バケット角度θ２の実際の値が目標値に近づくように、バケット６を動作させる自動制御が行われる。

【0112】

最後に、ステップＳ２０４において、コンピュータ１０２Ｂは、作業機３の姿勢を含む管理データを生成する。コンピュータ１０２Ｂは、管理データを記憶装置１０４に記録する。そして、処理を終了する（エンド）。

【0113】

以上説明したように、実施形態に係るシステムでは、コンピュータ１０２Ｂは、掘削作業中の作業機３の目標姿勢を求めるための、学習済みの目標姿勢推定モデル１８０を有している。図８～１０に示されるように、コンピュータ１０２Ｂは、掘削作業中のある時刻における作業開始からの経過時間および機械データを取得し、学習済みの目標姿勢推定モデル１８０を用いて、経過時間および機械データから作業機３の目標姿勢を推定した推定目標姿勢を求めるようにプログラムされている。

【0114】

したがって、作業機３の目標姿勢の推定に適した人工知能の目標姿勢推定モデル１８０を利用して、掘削作業中の作業機３の目標姿勢を推定することができる。これにより、人工知能を用いて、作業機３の目標姿勢をコンピュータ１０２Ｂによって容易かつ精度よく求めることができる。

【0115】

図５に示されるように、コンピュータ１０２Ａは、目標姿勢推定モデル１８０を用いて作業開始からの経過時間および機械データから作業機３の目標姿勢を推定した推定目標姿勢と、学習用データに含まれる作業中の作業機３の目標姿勢との誤差に基づいて、目標姿勢推定モデル１８０が更新されるようにプログラムされている。このようにすることで、工場出荷前に目標姿勢推定モデル１８０を十分に学習させて、精度の高い目標姿勢推定モデル１８０を作成することができる。

【0116】

工場出荷後のホイールローダ１は、第１角度検出器２９、第２角度検出器４８および角度検出部１６３を備えていてもよい。この場合には、工場出荷後に目標姿勢推定モデル１８０を追加学習することも可能である。

【0117】

図１に示されるように、ホイールローダ１は、前フレーム２ａに連結されたブーム１４と、ブーム１４に連結されたバケット６とを有していてもよい。学習済みの目標姿勢推定モデル１８０を用いて、作業開始からの経過時間および機械データから、ブーム角度θ１およびバケット角度θ２の目標値を推定することができる。

【0118】

＜目標姿勢推定モデル１８０の学習に関する変形例＞
図１１は、目標姿勢推定モデル１８０の学習に関する変形例を示す概略図である。図５～７の説明においては、ホイールローダ１の工場出荷前に目標姿勢推定モデル１８０を学習させる例について説明した。目標姿勢推定モデル１８０を学習させるための学習用データは、複数のホイールローダ１から収集されてもよい。

【0119】

図１１に示される、第１のホイールローダ１（ホイールローダ１Ａ）と、第２のホイールローダ１（ホイールローダ１Ｂ）と、第３のホイールローダ１（ホイールローダ１Ｃ）と、第４のホイールローダ１（ホイールローダ１Ｄ）とは、同じ機種である。ホイールローダ１Ａ，１Ｂ，１Ｃは、工場出荷後であり、作業現場にある。

【0120】

コンピュータ１０２Ａは、各ホイールローダ１Ａ，１Ｂ，１Ｃから、掘削作業中のある時刻における作業開始からの経過時間と、当該時刻における機械データを取得する。コンピュータ１０２Ａはまた、各ホイールローダ１Ａ，１Ｂ，１Ｃから、当該時刻における作業機姿勢データ（ブーム角度θ１およびバケット角度θ２）を、経過時間および機械データに対応付けて取得する。コンピュータ１０２Ａは、各ホイールローダ１Ａ，１Ｂ，１Ｃによる複数の掘削作業のうち、生産性の高い掘削が行われたときの経過時間、機械データおよび作業機姿勢データを抽出して、学習用データとして収集する。これらの学習用データを用いて、コンピュータ１０２Ａは、経過時間および機械データから作業機３の目標姿勢を推定した推定目標姿勢を求めることができるように、目標姿勢推定モデル１８０を学習させる。

【0121】

コンピュータ１０２Ａは、通信インタフェース１０５（図４）を介して、各ホイールローダ１Ａ，１Ｂ，１Ｃから、経過時間、機械データおよび作業機姿勢データを取得してもよい。またはコンピュータ１０２Ａは、外部記録媒体１０９を介して、各ホイールローダ１Ａ，１Ｂ，１Ｃから、経過時間、機械データおよび作業機姿勢データを取得してもよい。

【0122】

コンピュータ１０２Ａは、ホイールローダ１Ａ，１Ｂ，１Ｃと同じ作業現場に配置されていてもよい。またはコンピュータ１０２Ａは、作業現場から離れた遠隔地、たとえば管理センターに配置されていてもよい。ホイールローダ１Ａ，１Ｂ，１Ｃは、同じ作業現場にあってもよく、別々の作業現場にあってもよい。

【0123】

学習済みの目標姿勢推定モデル１８０は、通信インタフェース１０５または外部記録媒体１０９などを介して、各ホイールローダ１Ａ，１Ｂ，１Ｃへ提供される。このようにして、各ホイールローダ１Ａ，１Ｂ，１Ｃは、学習済みの目標姿勢推定モデル１８０を備えるものとされる。

【0124】

各ホイールローダ１Ａ，１Ｂ，１Ｃに既に目標姿勢推定モデル１８０が保存されている場合には、保存されている目標姿勢推定モデル１８０が書き換えられる。上述した学習用データの収集と目標姿勢推定モデル１８０の学習とを定期的に実行することで、目標姿勢推定モデル１８０の書き換えが定期的に行なわれるようにしてもよい。目標姿勢推定モデル１８０のパラメータの最新の更新値は、記憶装置１０４にその都度記憶されている。

【0125】

学習済みの目標姿勢推定モデル１８０は、ホイールローダ１Ｄにも提供される。学習用データを提供するホイールローダ１Ａ，１Ｂ，１Ｃと、学習用データを提供しないホイールローダ１Ｄとの両方に、目標姿勢推定モデル１８０が提供される。ホイールローダ１Ｄは、ホイールローダ１Ａ，１Ｂ，１Ｃのいずれかと同じ作業現場にあってもよく、ホイールローダ１Ａ，１Ｂ，１Ｃとは異なる作業現場にあってもよい。ホイールローダ１Ｄは、工場出荷前であってもよい。

【0126】

＜蒸留モデルの製造方法＞
上述した目標姿勢推定モデル１８０は、学習用データ１８８Ａ，１８８Ｂ，１８８Ｃ，…，を用いて機械学習により学習したモデルに限られず、当該学習したモデルを利用して生成されたモデルであってもよい。たとえば目標姿勢推定モデル１８０は、学習済みモデルにデータの入出力を繰り返すことで得られる結果を基に学習させた別の学習済みモデル（蒸留モデル）であってもよい。図１２は、蒸留モデルを生成するための処理を示すフローチャートである。

【0127】

図１２に示されるように、まずステップＳ３０１において、経過時間および機械データを取得する。図６に示されるステップＳ１０１と同様に、演算部１６１は、掘削作業中のある時刻における掘削作業開始からの経過時間を演算するとともに、当該時刻における機械データを演算する。

【0128】

次にステップＳ３０２において、コンピュータ１０２Ａは、学習済みの第１の目標姿勢推定モデルを用いて、掘削作業中の作業機３の目標姿勢を推定した推定目標姿勢を求める。ステップＳ３０３において、コンピュータ１０２Ａは、推定された作業機３の目標姿勢を出力する。

【0129】

コンピュータ１０２Ａ、より詳しくは目標姿勢推定部１６５は、記憶装置１０４から学習済みの第１の目標姿勢推定モデルを読み出す。目標姿勢推定部１６５は、演算部１６１が演算した経過時間および機械データを、学習済みの第１の目標姿勢推定モデルの入力層１８１に入力する。学習済みの第１の目標姿勢推定モデルの出力層１８３から、掘削作業中の作業機３の目標姿勢、具体的にはブーム角度θ１およびバケット角度θ２を示す推定目標姿勢が出力される。

【0130】

次にステップＳ３０４において、コンピュータ１０２Ａは、ステップＳ３０１で取得した経過時間および機械データと、ステップＳ３０３で出力した作業機３の目標姿勢とを、学習データとして記憶装置１０４に保存する。

【0131】

次にステップＳ３０５において、コンピュータ１０２Ａは、学習モデルによって第２の目標姿勢推定モデルの学習を行う。コンピュータ１０２Ａは、経過時間および機械データを第２の目標姿勢推定モデルの入力層に入力する。コンピュータ１０２Ａは、第２の目標姿勢推定モデルの出力層から、掘削作業中の作業機３の目標姿勢、具体的にはブーム角度θ１およびバケット角度θ２の推定結果を示す出力値を出力する。第２の目標姿勢推定モデルから出力された作業機３の推定目標姿勢と、ステップＳ３０３で出力した、第１の目標姿勢推定モデルから出力された作業機３の推定目標姿勢との差を算出する。この差に基づいて、コンピュータ１０２Ａは、第２の目標姿勢推定モデルのパラメータを更新する。このようにして、第２の目標姿勢推定モデルの学習が行なわれる。

【0132】

最後にステップＳ３０６において、更新された第２の目標姿勢推定モデルのパラメータを学習済みパラメータとして記憶装置１０４に保存する。そして、処理を終了する（エンド）。

【0133】

以上のように、経過時間および機械データと、第１の目標姿勢推定モデルを用いて作業機３の目標姿勢を推定した推定目標姿勢と、を学習用データとして、第２の目標姿勢推定モデル（蒸留モデル）を学習させることで、コンピュータ１０２Ａは、第１の目標姿勢推定モデルよりもシンプルな第２の目標姿勢推定モデルを用いて、掘削作業中の作業機３の目標姿勢を推定することができる。これにより、作業機３の目標姿勢を推定するためのコンピュータ１０２Ａの負荷を軽減することができる。なおコンピュータ１０２Ａは、他のコンピュータによって生成された学習データによって、第２の目標姿勢推定モデルの学習を行なってもよい。

【0134】

上記実施形態では、目標姿勢推定モデル１８０はニューラルネットワークを含んでいる。これに限られず、目標姿勢推定モデル１８０は、たとえばサポートベクターマシン、決定木など、機械学習を用いて作業開始からの経過時間および機械データから作業中の作業機３の目標姿勢を精度よく推定できるモデルであってもよい。

【0135】

本開示の思想を適用可能な作業機械は、ホイールローダに限られず、油圧ショベルまたはブルドーザなどの、作業機を有する作業機械であってもよい。油圧ショベルの場合、目標姿勢推定モデルに入力される機械データは、ブームシリンダの油圧、アームシリンダの油圧、エンジントルク、エンジン回転数、油圧ポンプ容量などを含んでもよい。油圧ショベルの場合、目標姿勢推定モデルが出力する作業機の推定目標姿勢は、車体に対するブームの角度、ブームに対するアームの角度、およびアームに対するバケットの角度を含んでもよい。

【0136】

今回開示された実施形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

【符号の説明】

【0137】

１，１Ａ，１Ｂ，１Ｃ，１Ｄホイールローダ、２車体フレーム、２ａ前フレーム、３作業機、４走行装置、５キャブ、６バケット、６ａ刃先、８操作装置、９ブームピン、１０制御装置、１１ステアリングシリンダ、１４ブーム、１６ブームシリンダ、１７バケットピン、１８ベルクランク、１８ａ支持ピン、１８ｂ，１８ｃ連結ピン、１９バケットシリンダ、２１エンジン、２９第１角度検出器、４８第２角度検出器、８１ａアクセル操作部材、８１ｂアクセル操作検出部、８２ａステアリング操作部材、８２ｂステアリング操作検出部、８３ａブーム操作部材、８３ｂブーム操作検出部、８４ａバケット操作部材、８４ｂバケット操作検出部、８５ａ変速操作部材、８５ｂ変速操作検出部、８６ａＦＲ操作部材、８６ｂＦＲ操作検出部、９１エンジン回転数センサ、９２出力回転数センサ、９５第１油圧検出器、９６第２油圧検出器、１００掘削対象物、１０２Ａ，１０２Ｂコンピュータ、１０３プロセッサ、１０４記憶装置、１０５通信インタフェース、１０６Ｉ／Ｏインタフェース、１０７入力装置、１０８出力装置、１０９外部記録媒体、１６１演算部、１６２タイマ、１６３角度検出部、１６５目標姿勢推定部、１６６誤差算出部、１６７目標姿勢推定モデル更新部、１６８ブーム制御部、１６９バケット制御部、１８０目標姿勢推定モデル、１８１入力層、１８２中間層、１８３出力層、１８８学習用データセット、１８８Ａ，１８８Ｂ，１８８Ｃ学習用データ、１９１入力データ、１９７角度出力値、Ａブーム基準線、Ｂバケット基準線、Ｈ水平線、Ｌバケット軌跡。

【図1】