特開2022-187529 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人名古屋大学の特許一覧

特開2022-187529自律移動システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022187529

(43)【公開日】2022-12-20

(54)【発明の名称】自律移動システム

(51)【国際特許分類】

G05D 1/02 20200101AFI20221213BHJP

【ＦＩ】

G05D1/02 L

【審査請求】未請求

【請求項の数】1

【出願形態】ＯＬ

(21)【出願番号】P 2021095546

(22)【出願日】2021-06-08

(71)【出願人】

【識別番号】504139662

【氏名又は名称】国立大学法人東海国立大学機構

(74)【代理人】

【識別番号】110000659

【氏名又は名称】弁理士法人広江アソシエイツ特許事務所

(72)【発明者】

【氏名】加藤邦人

(72)【発明者】

【氏名】裏優斗

(72)【発明者】

【氏名】相澤宏旭

【テーマコード（参考）】

5H301

【Ｆターム（参考）】

5H301AA01

5H301AA10

5H301BB14

5H301CC03

5H301CC06

5H301CC10

5H301DD02

5H301DD06

5H301DD07

5H301DD15

5H301GG09

5H301HH01

5H301HH02

(57)【要約】

【課題】現在位置から目的地までの経路を生成するための環境地図や、自己位置推定のための手段を備えることなく自律移動できる自律移動システムを提供する。
【解決手段】
自律移動システムは、カメラと移動機構と制御手段とを備えている。自律移動システムの制御手段は、記憶手段と、マッチングモジュールと，データ選択アルゴリズムと、アクションモジュールとを備えている。記憶手段は、走行動作変更位置の基準画像と方向転換情報とを含む基準データのセットを記憶している。マッチングモジュールは、カメラからの入力画像と基準画像とを比較して、入力画像が基準画像と一致しているか否か判断する。データ選択アルゴリズムは、常時は直進の命令を出力し、入力画像が基準画像と一致したときに、方向転換命令を出力する。アクションモジュールは、方向転換命令に対応する学習済みの動作を、移動機構に実行させる。
【選択図】図１

【特許請求の範囲】

【請求項1】

カメラと移動機構と制御手段とを備えた自律移動システムであって、
前記制御手段が、
走行動作を変更すべき走行動作変更位置の基準画像と当該基準画像に対応する方向転換情報とを含む基準データのセットと、当該セットの順番とを記憶する記憶手段と、
前記カメラからの入力画像と前記基準画像とを比較して、前記入力画像が前記基準画像と一致しているか否かの判断を行うマッチングモジュールと、
常時は直進の命令を出力し、マッチングモジュールが一致したと判断したときに、所定時間の間、方向転換命令を出力するとともに、比較対象となる基準画像を、次の順番の基準データのセットの基準画像に変更するデータ選択アルゴリズムと、
前記方向転換命令に対応する学習済みの動作を、前記移動機構に実行させるアクションモジュールと、
を備えていることを特徴とする自律移動システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、自律移動システムに関する。特に、カメラで周辺の画像を撮影し、進路変更を行う場所の基準画像との対比を行うことで、適切な走行経路を選択することのできる自律移動システムに関する。

【背景技術】

【0002】

自律移動可能システムには、正しい目的地に到達することと、目的地までの移動中に障害物を避けて安全に走行することの二つの機能を有することが求められる。現在知られている自律移動可能システムは、正しい目的地に到達するために、移動範囲全体を含む環境地図を用いて、移動を開始する前にシステムの現在位置から目的地までの経路を生成する必要がある。これに加えて、移動時の制御には、ＧＰＳ等を用いた自己位置と進行方向の把握と、カメラによる周辺環境の確認が必要である。近年では、ＳＬＡＭ（ＳｉｍｕｌｔａｎｅｏｕｓＬｏｃａｌｉｚａｔｉｏｎａｎｄＭａｐｐｉｎｇ）という自己位置推定と環境地図作成の同時実行技術が実用化されているが、この技術を用いた場合であっても、目的地までの経路を生成するためには環境全体の地図が必要となる。また、環境地図と自己位置を用いた手法では、自己位置を見失ったときに再定位をするための、詳細な環境地図が必要であるが、詳細な環境地図の生成には費用がかかる。

【0003】

人間の場合は、詳細な環境地図を持たない場合でも、視覚情報のみを用いて、障害物を避けながら移動することができる。このような能力をエージェントに持たせるための模倣学習（ＩｍｉｔａｔｉｏｎＬｅａｒｎｉｎｇ）技術が開発されている。模倣学習は、人間の操作履歴から画像などの観測情報を入力し、そのときに人間が行った操作を教師信号として用いてモデルを学習する手法である。非特許文献１，非特許文献２，および非特許文献３には、模倣学習による自動運転技術が開示されている。

【0004】

模倣学習は、ロス関数Ｌを最小化することによって行う。ロボットから取得されたカメラ画像をｘ，そのときに人間が行った操作をａ_{ｔｅａｃｈｅｒ}，学習するモデルをパラメータθの関数Ｆ_ＩＬ（ｘ；θ）とすると、模倣学習は、以下の式のように表される。模倣学習を用いることで、エージェントは、カメラ画像xのみを用いて移動を行うことができる。

【0005】

【数1】

【0006】

しかしながら、模倣学習では、カメラ画像から推定することのできない行動の意図や、目的別の正しい行動の選択を学習することが難しい。たとえば、実際の移動に於いては、目的地の違いによって、交差点で直進しなければならない場合と、曲がらなければならない場合がある。しかし、交差点を直進する場合も曲がる場合もカメラから取得される画像は同じ画像であるため、カメラから取得される画像のみでは直進か曲がるかの判断を行うことはできない。さらに、同じ交差点の画像に対して、直進操作、右折操作、左折操作と、３種類の異なる教師信号が与えられるため、エージェントは交差点でどのように行動するべきかを学習することができない。

【0007】

この問題を解決するためにモデルに行動の目的を表すルートコマンドを追加で入力する、条件付き模倣学習（ＣｏｎｄｉｔｉｏｎａｌＩｍｉｔａｔｉｏｎＬｅａｎｉｎｇ）と呼ばれる手法が開発されている。非特許文献４には、条件付き模倣学習の手法を適用した自動運転技術が開示されている。ルートコマンドは交差点での直進、右折、左折といった道順の情報を表している。ルートコマンドを追加で入力することで、同じ交差点の画像に対して、直進するときの操作、右折するときの操作、左折するときの操作という三種類の異なる教師信号を分離して学習するための情報が与えられ、エージェントは交差点でどのように行動するべきかを学習することができる。

【0008】

条件付き模倣学習で学習するモデルをパラメータθの関数Ｆ_ＣＩＬ（ｘ，ｃ；θ）とすると，条件付きも方学習の内容は、以下の式のように表すことができる。

【0009】

【数2】

【0010】

条件付き模倣学習によって学習されたエージェントは、ルートコマンドをリアルタイムで入力することで自律的に経路を制御することができる。しかしながら、エージェントが自律的にルートコマンドを生成するには、従来と同様に、環境地図と自己位置推定が必要となる。

【先行技術文献】

【非特許文献】

【0011】

【非特許文献1】Ｄ．Ａ．Ｐｏｍｅｒｌｅａｕ著「ＡＬＶＩＮＮ，ａｎａｕｔｏｎｏｍｏｕｓｌａｎｄｖｅｈｉｃｌｅｉｎａｎｅｕｒａｌｎｅｔｗｏｒｋ．」Ｔｅｃｈｎｉｃａｌｒｅｐｏｒｔ，ＣａｒｎｅｇｉｅＭｅｌｌｏｎＵｎｉｖｅｒｓｉｔｙ、１９８９年

【非特許文献2】Ｍ．Ｂｏｊａｒｓｋｉ，Ｄ．Ｄ．Ｔｅｓｔａ，Ｄ．Ｄｗｏｒａｋｏｗｓｋｉ，Ｂ．Ｆｉｒｎｅｒ，Ｂ．Ｆｌｅｐｐ，Ｐ．Ｇｏｙａｌ，Ｌ．Ｄ．Ｊａｃｋｅｌ，Ｍ．Ｍｏｎｆｏｒｔ，Ｕ．Ｍｕｌｌｅｒ，Ｊ．Ｚｈａｎｇ，Ｘ．Ｚｈａｎｇ，Ｊ．ＺｈａｏａｎｄＫ．Ｚｉｅｂａ著「ＥｎｄｔｏＥｎｄＬｅａｒｎｉｎｇｆｏｒＳｅｌｆ－ＤｒｉｖｉｎｇＣａｒｓ」ａｒＸｉｖ：１６０４．０７３１６号、２０１６年

【非特許文献3】Ｈ．Ｘｕ，Ｙ．Ｇａｏ，Ｆ．Ｙｕ，Ｔ．Ｄａｒｒｅｌｌ著「Ｅｎｄ－ｔｏ－ｅｎｄＬｅａｒｎｉｎｇｏｆＤｒｉｖｉｎｇＭｏｄｅｌｓｆｒｏｍＬａｒｇｅ－ｓｃａｌｅＶｉｄｅｏＤａｔａｓｅｔｓ」ＰＶＣＲ，３５３０頁－３５３８頁、２０１７年

【非特許文献4】Ｆ．Ｃｏｄｅｖｉｌｌａ，Ｍ．Ｍuｌｌｅｒ，Ａ．Ｌoｐｅｚ，Ｖ．Ｋｏｌｔｕｎ、Ａ．Ｄｏｓｏｖｉｔｓｋｉｙ著「Ｅｎｄ－ｔｏ－ｅｎｄＤｒｉｖｉｎｇｖｉａＣｏｎｄｉｔｉｏｎａｌＩｍｉｔａｔｉｏｎＬｅａｒｎｉｎｇ」ＩＣＲＡ，４６９３頁－４７００頁、２０１８年

【発明の概要】

【発明が解決しようとする課題】

【0012】

従来の自律移動システムでは、移動開始の前に、現在位置から目的地までの経路を生成する必要があり、また自己位置推定を行いつつ移動する必要があった。条件付き模倣学習を行う改良された自律移動システムであっても、自律的に移動経路を設定するには、現在地から目的地までの全範囲を含む詳細な環境地図が必要であった。

【0013】

本発明は、このような現状に鑑みてなされたものであって、環境地図を用意できない場合であっても目的地に到達でき、しかも移動時の自己位置推定を必要としない、自律移動のための新たなシステムの提供を目的としてなされたものである。

【課題を解決するための手段】

【0014】

本発明は、カメラと移動機構と制御手段とを備えた自律移動システムに関する。本発明の自律移動システムの制御手段は、走行動作を変更すべき走行動作変更位置の基準画像と当該基準画像に対応する方向転換情報とを含む基準データのセットと、セットの順番とを記憶する記憶手段と、カメラからの入力画像と基準画像とを比較して、入力画像が基準画像と一致しているか否かの判断を行うマッチングモジュールと、常時は直進の命令を出力し、マッチングモジュールが一致したと判断したときに、所定時間の間、方向転換命令を出力するとともに、比較対象となる基準画像を、次の順番の基準データのセットの基準画像に変更するデータ選択アルゴリズムと、方向転換命令に対応する学習済みの動作を、移動機構に実行させるアクションモジュールと、を備えていることを特徴とする。

【発明の効果】

【0015】

本発明の自律移動システムは、走行動作を変更すべき位置を示している基準画像と、基準画像の示している位置でとるべき方向転換情報のセットに基づいて、移動を行う。そのため、現在地から目的地に至るまでの詳細かつ正確な環境地図を用意する必要がなく、環境地図作成に要する時間とコストを低減できる。

【0016】

本発明の自律移動システムは、撮影した画像と基準画像との比較によって走行動作を変更すべき位置に到達しているか否かを判断する。そのため、自己位置推定を行う必要がない。環境地図の作成と自己位置推定を同時に行う必要がないため、検知と測距のための装置を必要としない。この結果、より簡易な構成によって自律移動を可能とする。

【図面の簡単な説明】

【0017】

【図1】図１は、自律移動システムにおける制御手段の構成を概念的に示すブロック図である。

【図2】図２は、基準データのセットの構成を示す図である。

【図3】図３は、マッチングモジュールの構成を示すブロック図である。

【図4】図４は、アクションモジュールの構成を示すブロック図である。

【図5】図５は、実施例の走行領域を示す図である。

【図6】図６は、実施例における自律移動システムの入力データと出力データの例を示す図である。

【発明の実施の形態】

【0018】

以下、本発明の自律移動システムの好適な実施形態を説明する。本発明の自律移動システムは、カメラと、移動機構と、制御手段とを備えている。

【0019】

本実施形態の自律移動システムにおいて、カメラは、主に、移動する方向の前方を撮影する。撮影によって得られた画像は制御手段に入力され、走行動作変更位置を示す基準画像との比較に用いられる。比較の結果は、走行動作変更位置に到達しているがあるか否かの判断に用いられる。このため、カメラ自体やその画像が測距機能や測位機能に対応する必要はなく、撮影と通信機能のみを備えた単眼カメラを単独で適用することができる。

【0020】

本実施形態の移動機構は、２輪または４輪からなる車輪と、車輪を駆動するモータとを備えているロボットであることが好ましい。モータは制御手段によって制御される。移動機構は、制御手段の命令に応じて、直進、所定の角度の右旋回、所定の角度の左旋回、停止の動作を行うことができる。

【0021】

本実施形態にて用いられる制御手段は、記憶手段と、中央演算処理装置（ＣＰＵ）と、通信手段とを備えた一台のコンピュータで構成することができる。または、複数の記憶手段や複数の演算処理装置に、それぞれのモジュールの一部又は全部を分散して配置することができる。複数の記憶手段と演算処理装置を備えている場合は、ネットワークを介して自律移動に必要な一連の処理を行うことができる。

【0022】

制御手段の記憶手段には、走行動作を変更すべき走行動作変更位置の基準画像と、基準画像に対応する方向転換情報とがセットになって、動作を行う順に記憶されている。

【0023】

制御手段は、マッチングモジュールと、データ選択アルゴリズムと、アクションモジュールを備えている。マッチングモジュール、データ選択アルゴリズム、およびアクションモジュールは、それぞれの機能をコンピュータに実行させるプログラムの形態とすることができる。代替的には、マッチングモジュール、データ選択アルゴリズム、およびアクションモジュールのそれぞれを、マイクロコントローラ等の形態のハードウェアとすることができる。

【0024】

以下、図面を参照しつつ、走行動作をｎ回変更する場合の制御手段の構成と制御内容について説明する。図１に、自律移動システムにおける制御手段１の構成をブロック図として示す。

【0025】

記憶手段は、走行動作の変更に使用する基準データのセットＲＤを移動する道順に並べて、ｎ個の基準データのセットＲＤ_１，ＲＤ_２，・・・ＲＤ_ｎの配列を、シーケンシャルファイルとして記憶している。図２に、基準データのセットＲＤの構成を示す。基準データのセットＲＤには、走行動作を変更する必要のある走行動作変更位置を予め撮影した基準画像ｘ_ｒと、走行動作変更位置で取るべき動作の情報である方向転換情報ｉ_ｒとが記憶されている。方向転換情報ｉ_ｒには、右折、左折、停止が含まれる。基準データのセットは、データ選択アルゴリズムによって順次呼び出される。

【0026】

自律移動システムの動作時、図示されないカメラは、所定のフレームレートで画像ｘを撮影し、制御手段１に送信する。撮影された画像ｘは、制御手段１のマッチングモジュール２とアクションモジュール４に入力されて処理される。

【0027】

マッチングモジュール２は、カメラから入力された画像xと基準画像ｘ_ｒが同一の場所を撮影した画像であるか、違う場所を撮影した画像であるかを判定する。そして、画像xと基準画像ｘ_ｒ同一の場所を撮影した画像であると判定した場合、基準画像が撮影された場所、すなわち走行動作変更位置に到達したと判定する。

【0028】

図３に、マッチングモジュール２のネットワーク構造のブロック図を示す。本実施形態におけるマッチングモジュール２は、カメラから入力された画像xと基準画像ｘ_ｒとが同一であるか異なるかを判定する、学習済のニューラルネットワークである。マッチングモジュール２は、学習セットに存在しない基準画像ｘ_ｒについても判定の対象とすることができるように、基準画像とカメラ画像が同じクラスに属しているかを判定するワンショットクラシフィケーションシャムネットワーク（Ｏｎｅ－ＳｈｏｔｃｌａｓｓｉｆｉｃａｔｉｏｎＳｉａｍｅｓｅＮｅｔｗｏｒｋ）によって、画像ｘと基準画像ｘ_ｒの異同を判定する。

【0029】

学習の内容は、以下の通りである。マッチングモジュール２は、重みを共有した２つの畳み込みニューラルネットワークに、基準画像ｘ_ｒと、基準画像との比較を行う画像ｘとをそれぞれ入力する。ロス関数ＬＣＬとしての対照損失（ＣｏｎｔｒａｓｔｉｖｅＬｏｓｓ）を用い、２つの画像の間の特徴空間上の距離を算出する。ワンショットクラシフィケーション（Ｏｎｅ－Ｓｈｏｔｃｌａｓｓｉｆｉｃａｔｉｏｎ）の設定では、最終的な特徴空間への写像となる最終層をノード数１の全結合層とし，交差エントロピー誤差関数によって２つの画像が同じクラスか違うクラスかを判定している。

【0030】

学習時に、マッチングモジュール２は、２つの画像が同一のクラスに属しているときに画像の間の特徴空間上の距離を近づけ、異なるクラスに属しているときに距離を遠ざけるよう学習する。基準画像ｘ_ｒと同じ場所を撮影した画像を「同一（ｓａｍｅ）」をＹ＝１）、異なる位置を撮影した画像を「相違（Ｄｉｆｆｅｒｅｎｔ）」、Ｙ＝０として交差エントロピー誤差関数を用いて判定を行う。ロス関数ＬＣＬは、２つの画像が同一クラスのときにＹ＝１，異なるクラスのときにＹ＝０、異なるクラスをできる限り分離するためのマージンをＭとしたとき、以下の式（３）のように定義される。ここで、ｍａｘ関数は２入力のうち大きい数を出力する関数である。

【数3】

【0031】

マッチングモジュール２が判定に使用する基準画像Ｘ_ｒを管理するデータ選択アルゴリズム３について説明する。データ選択アルゴリズム３は、どの基準データのセットＲＤが判定に使用されたかを記憶しており、次にどの基準画像ｘ_ｒをマッチングモジュール２に提供するかを管理している。具体的には、データ選択アルゴリズム３は、基準データのセットＲＤの中で、マッチングモジュール２から基準画像ｘ_ｒに関する「同一」という判定が未だ入力されておらず、且つ列の先頭にある基準画像ｘ_ｒを、マッチングモジュール２に入力する。マッチングモジュール２が、カメラから入力された画像xと基準画像ｘ_ｒが同一の場所を撮影した画像であると判断した場合、データ選択アルゴリズム３は、所定時間の間、方向転換命令ｃを送信すると同時に、それまでマッチングモジュール２に提供していた基準データのセットＲＤに使用済のフラグをつける。そして、カメラからの入力画像ｘとの判定が行われていない基準データのセットＲＤの中で先頭となったセットを選択し、基準画像ｘ_ｒをマッチングモジュール２に送る。

【0032】

またデータ選択アルゴリズム３は、マッチングモジュール２から送られた判定の結果に基づいて、アクションモジュール４に送信する方向転換命令ｃを管理する。なお、方向転換命令ｃには、「直進する」という命令も含まれている。データ選択アルゴリズム３は、走行動作を変更しない期間は、直進の方向転換命令ｃをアクションモジュール４に継続して出力する。

【0033】

自律移動システムは、マッチングモジュール２が画像xと基準画像ｘ_ｒが同一の場所を撮影した画像であると判断した時点で、基準画像が撮影された場所、すなわち走行動作を変更すべき走行動作変更位置に到達したと見なすことができる。そこで、データ選択アルゴリズム３は、アクションモジュール４に対して、基準データのセットＲＤの中の基準画像ｘ_ｒの位置で取るべき動作の情報である方向転換情報ｉ_ｒを方向転換命令ｃとして、前記動作を行うのに必要な所定時間の間、送信する。

【0034】

方向転換情報には、右折、左折に加えて、停止の動作を行うための命令が含まれている。

【0035】

右左折は、移動方向を指定することで実現可能である。さらに、停止の動作は、原則、継続して実行される。

【0036】

アクションモジュール４は、カメラからの入力画像ｘと、データ選択アルゴリズム３からの方向転換命令cを入力して、実際の走行を制御する動作命令aを決定する。アクションモジュール４は、安全な走行のための動作命令ａを出力するための学習が行われた、ニューラルネットワークである。図４に、アクションモジュール４のネットワーク構造のブロック図を示す。

【0037】

アクションモジュール４は、人間が自律走行システムを操縦して走行させたときの、記録カメラによる入力画像と方向転換命令ｃを抽出して入力し、人間による動作指令を教師信号として学習を行っている。人間は障害物にぶつからないように運転を行うため、人間の運転を模倣したアクションモジュールも人間と同じように障害物にぶつからない行動を学習する。動作命令ａは離散値であるため、学習には交差エントロピー誤差関数を用いる。フレーム間で重みを共有した畳み込みニューラルネットワークを用いて特徴抽出をした後に畳み込み長期短期記憶（ＣｏｎｖｏｌｕｔｉｏｎａｌＬＳＴＭ）によって時系列情報を集約する。その後、畳み込み長期短期記憶の出力を全結合層で圧縮し、方向転換命令ｃと結合し、さらに３層全結合層によって動作命令ａを生成している。

【0038】

従来から知られている模倣学習においては、模倣対象である人間の行動をそのまま収集した場合、予測の誤りや外的要因によって経路から逸脱したときにどのように回復するかを学習することができない。そこで、データ収集時にノイズを付与することで逸脱した経路からの回復を学習させることができる。具体的には、人間による運転時に、短時間、「前進、左旋回、右旋回」のいずれかの動作指令をノイズとしてランダムに1つ付与し、この動作指令によって発生した動作を回復させる操作の内容を学習させる。

【0039】

教師あり学習を行ったアクションモジュール４を用いて生成した動作命令ａを移動機構に入力されることで、自律移動システムは障害物にぶつかることなく安全に走行することができる。たとえば、データ選択アルゴリズム３から直進の命令が入力されていても、カメラからの入力画像に障害物が映っている場合には、回避して前進することができる。

【実施例0040】

本発明の自律移動システムを具現化して自律移動を行った実施例を以下に示す。

【0041】

本実施例の自律移動システムは、移動機構として、ＤＣブラシモータを２つ用いた対軸二輪構造のＦａｂｏＪｅｔＢｏｔ（株式会社ＦａＢｏ）を使用した。カメラには、画角145°の広角カメラを1台使用した。制御手段として、シングルボードコンピュータであるＪｅｔｓｏｎＮａｎｏ（ＮＶＩＤＩＡ社）を使用した。カメラは、毎秒３フレームの画像を出力する。

【0042】

図６に、自律移動システムの入力データと出力データの例を示す。「基準画像ｘ_ｒ」と「方向転換情報ｉ_ｒ」との名称でそれぞれを示した画像と情報は、各フレームでデータ選択アルゴリズムに与えられている基準画像と方向転換情報である。図６に示した基準画像ｘ_ｒは、方向転換を行わない地点には与えられておらず、それまでと異なる方向に移動する位置についてのみ記憶されている。しかしながら、移動の精度を高めることを目的に、直進する交差点等に基準画像ｘ_ｒを与えることも可能である。基準画像Ｘ_ｒは、走行動作の変更が完了する毎に、順次、データ選択アルゴリズム３によって、マッチングモジュール２に入力される。

【0043】

図６において「カメラからの入力画像ｘ」として示した画像は、本実施例の広角カメラが毎秒３フレーム撮影して出力する画像である。

【0044】

図６において「マッチングモジュールの判断基準」として示したグラフは、マッチングモジュール２が、カメラからの入力画像ｘと基準画像ｘ_ｒの比較の結果として出力する類似度を時系列で示したグラフである。画像が完全に一致する場合には類似度＝１となり，画像が全く異なる場合が類似度＝０となる。類似度が閾値を超えたとき、マッチングモジュール２は、カメラからの入力画像ｘと基準画像ｘ_ｒが同一の走行動作変更位置を撮影していると判定して、「同一」との判定結果をデータ選択アルゴリズム３に出力する。

【0045】

図６において、「データ選択アルゴリズムの出力（方向転換命令ｃ）」として示した項目は、データ選択アルゴリズム３が出力する方向転換命令ｃを一定時間ごとに抽出した結果である。データ選択アルゴリズム３は、マッチングモジュールの「同一」との判定結果を受け取ったとき、走行動作の変更に必要な所定時間の間、基準画像ｘｒとセットの方向転換情報ｉ_ｒを、方向転換命令ｃとして出力する。データ選択アルゴリズム３は、所定時間を過ぎると、直進の方向転換命令ｃを出力する。

【0046】

図６において、「アクションモジュールの出力（動作命令ａ）」として示した項目は、アクションモジュール４が出力する動作命令ａである。アクションモジュールの動作命令ａは、教師あり学習を行ったアクションモジュール４を用いて生成されるものであるため、データ選択アルゴリズム３から入力される出力方向転換命令ｃとは必ずしも一致しない。

【0047】

図５に、本実施例で用いた２種類の自律移動コースの上面図を示す。図中白丸印の１番から9番は、テストコース１の交差点の通過順を示す番号であり、灰色の丸印１番から７番が、テストコース２の交差点の通過順を示す番号である。コースは傾斜のない平面上に設けられている。

【0048】

テストコースの走行のための学習用のデータセットとして、約２時間人間が運転したデータを収集した。マッチングモジュールの学習は、走行動作変更位置の基準画像と同じ場所を撮影した画像にラベル付けしたものを用いた。アクションモジュールの学習は、経路の逸脱を修正する方法を学習させるために、人間の運転時にノイズを付与して行った。

【0049】

実施例においては、データ選択アルゴリズム３が方向転換命令ｃをアクションモジュール４に出力する期間を７フレーム分（２．３秒）と１４フレーム分（４．７秒）の２段階設定し、成功率を比較した。ここで、７フレーム分の期間は、移動機構が右折または左折に要する時間の平均値に相当する。また、１４フレーム分の期間は、右折または左折に要する時間の最大値に相当する。さらに、比較例として、アクションモジュールに操作者がデータ選択アルゴリズム３の代わりに方向転換命令を直接入力してテストコースを走行させ、走行状態を観察した。

【0050】

テストコース１を自律移動システムが自律移動した試験結果を表１に示す。同様に、テストコース２を自律移動システムが自律移動した試験結果を表２に示し、テストコース１とテストコース２の両方の試験結果を合計した成功率を表３に示す。

【0051】

表１と表２のそれぞれの数値は、走行動作変更位置に到達した走行回数を分母にし、走行動作変更位置で移動に失敗した回数を分子とした数値である。

【0052】

【表1】

【0053】

【表2】

【0054】

【表3】

【0055】

実施例のテストコースをそれぞれ走行させた結果として、実施例の方法では、方向転換命令ｃを７フレーム分出力した場合で４９％の成功率で自律移動することが確認された。また、方向転換命令ｃを１４フレーム分出力した場合では６４％の成功率で自律移動することが確認された。また、アクションモジュール４に操作者が方向転換命令を直接入力した比較例では、７８％の成功率で自律移動することができた。

【0056】

実施例の自律移動システムは、走行動作を変更すべき走行動作変更位置の基準画像ｘ_ｒと、基準画像ｘ_ｒに対応する方向転換情報ｉｒからなる基準データのセットＲＤを用いることで、目的地までの自律移動が可能となることが確認された。また、方向転換命令ｃの出力時間を調整することにより、自律移動の成功率が高くなることが確認された。

【産業上の利用可能性】

【0057】

本発明の自律移動システムは、病院内や工場内等で、写真データと動作コマンドのセットで指定したルートを移動する搬送ロボットや、写真データと動作コマンドのセットを入力することにより、所望の目的地に移動するロボット玩具にも適用が可能である。

【符号の説明】

【0058】

１自律移動システム
２マッチングモジュール
３データ選択アルゴリズム
４アクションモジュール

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

IP Force 特許公報掲載プロジェクト 2022.1.31 β版