特許第6976484号(P6976484)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ シーメンス インダストリー ソフトウェア エヌヴェの特許一覧

特許6976484同一の所定の軌道を繰り返し追従する自動走行装置の制御方法とシステム
<>
  • 特許6976484-同一の所定の軌道を繰り返し追従する自動走行装置の制御方法とシステム 図000002
  • 特許6976484-同一の所定の軌道を繰り返し追従する自動走行装置の制御方法とシステム 図000003
  • 特許6976484-同一の所定の軌道を繰り返し追従する自動走行装置の制御方法とシステム 図000004
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6976484
(24)【登録日】2021年11月11日
(45)【発行日】2021年12月8日
(54)【発明の名称】同一の所定の軌道を繰り返し追従する自動走行装置の制御方法とシステム
(51)【国際特許分類】
   G08G 1/09 20060101AFI20211125BHJP
   G05D 1/03 20060101ALI20211125BHJP
   B60W 30/10 20060101ALI20211125BHJP
   G05D 1/02 20200101ALI20211125BHJP
   B62D 6/00 20060101ALI20211125BHJP
【FI】
   G08G1/09 D
   G05D1/03
   B60W30/10
   G05D1/02 H
   B62D6/00
【請求項の数】12
【全頁数】19
(21)【出願番号】特願2021-517108(P2021-517108)
(86)(22)【出願日】2018年5月30日
(65)【公表番号】特表2021-526480(P2021-526480A)
(43)【公表日】2021年10月7日
(86)【国際出願番号】EP2018064238
(87)【国際公開番号】WO2019228626
(87)【国際公開日】20191205
【審査請求日】2021年3月15日
【早期審査対象出願】
(73)【特許権者】
【識別番号】520467176
【氏名又は名称】シーメンス インダストリー ソフトウェア エヌヴェ
【氏名又は名称原語表記】SIEMENS INDUSTRY SOFTWARE NV
(74)【代理人】
【識別番号】110003317
【氏名又は名称】特許業務法人山口・竹本知的財産事務所
(74)【代理人】
【識別番号】100075166
【弁理士】
【氏名又は名称】山口 巖
(74)【代理人】
【識別番号】100133167
【弁理士】
【氏名又は名称】山本 浩
(74)【代理人】
【識別番号】100169627
【弁理士】
【氏名又は名称】竹本 美奈
(72)【発明者】
【氏名】トン,ソン
(72)【発明者】
【氏名】グエン,ヴァン ラン
【審査官】 田中 将一
(56)【参考文献】
【文献】 特開平06−127407(JP,A)
【文献】 特開2009−280097(JP,A)
【文献】 特開2015−217793(JP,A)
【文献】 特開平07−186990(JP,A)
【文献】 特開平09−252608(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G08G 1/00 − 99/00
G05D 1/00 − 1/12
B60W 10/00 − 10/30
B60W 30/00 − 60/00
B62D 6/00 − 6/10
B62D 101:00 − 137:00
(57)【特許請求の範囲】
【請求項1】
同一の所定の軌道を繰り返し追従するように自動走行装置を制御する方法であって、
a)所定の軌道を示す目標軌道信号(d)を受信するステップ(S10)と、
b)前記所定の軌道に沿って前記自動走行装置を操舵するのに適する制御信号(u)を生成するステップ(S20)と、
複数の反復の少なくとも1つについて、
c)前記自動走行装置に対して前記制御信号(u)を供給して、所定の軌道に沿って前記自動走行装置を操舵するステップ(S31)と、
d)前記制御信号(u)に従って操舵されることに応答して、前記自動走行装置によって追従される実際の軌道を測定するステップ(S32)と、
e)測定された前記実際の軌道を示す実際の軌道信号(y)を記録するステップ(S33)と、
f)反復学習制御装置(40)を用いて、少なくとも前記制御信号(u)と、前記実際の軌道信号(y)と、前記目標軌道信号(d)とに基づいて、変更された制御信号(uu)を決定するステップ(S40)と、
を含み、
前記反復学習制御装置(40)は、制御信号から、予測された軌道信号を生成するのに適する制御モデルを備え、
前記ステップf)は、
fl)前記制御信号と前記実際の軌跡信号とに基づいて前記制御モデルを変更することと、
f2)前記変更された制御モデルに基づいて前記制御信号を変更することと、を含み、
前記ステップfl)は、前記制御信号(u)から前記制御モデル(43)によって生成された、予測された軌道信号と、前記実際の軌道信号(y)と、の間の偏差を減少させるように、前記制御モデル(43)を変更することを含み、かつ
前記ステップf2)は、前記変更された制御信号(uu)から前記変更された制御モデル(43)によって生成された、前記予測された軌道信号と、前記目標軌道信号(d)との間の偏差を減少させるように、前記制御信号(u)を変更することを含む、
方法。
【請求項2】
前記ステップe)では、前記自動走行装置が操舵される間に、前記実際の軌道信号(y)を記憶装置(33)内に記録することを含み、かつ少なくとも前記ステップf)は、前記自動走行装置が前記ステップc)中で操舵された後に実行される、請求項1に記載の方法。
【請求項3】
さらに、
h) 前記制御信号(u)として、前記変更された制御信号(uu)を前記複数の反復に続く反復で使用する、請求項1または2に記載の方法。
【請求項4】
前記ステップfl)および/または前記ステップf2)で実施される前記変更は、前記自動走行装置に課される制約の下で実行される、請求項のうちのいずれか1項に記載の方法。
【請求項5】
前記ステップd)は、前記実際の軌道に関する実際のパラメータを決定することを含み、
前記制御モデル(43)は、前記予測された軌道に関する予測されたパラメータを生成するようにさらに適合され、
前記ステップfl)は、前記制御モデル(43)によって生成された前記予測されたパラメータと前記実際のパラメータとの間の偏差を減少させるように、前記制御モデル(43)を変更することを含み、および/または、
前記ステップf2)は、前記制御モデル(43)によって生成された前記予測されたパラメータと、所定のパラメータ目標との間の偏差を減少させるように、前記制御信号を変更することを含み、
それぞれの軌道に関するそれぞれのパラメータは、それぞれの軌道の物理的特性および/または前記自動走行装置および/または前記自動走行装置がそれぞれの軌道を追従するときの前記自動走行装置の挙動を示すパラメータである、請求項のうちのいずれか1項に記載の方法。
【請求項6】
前記予測された軌道に関する予測されたパラメータと、前記実際の軌道に関する実際のパラメータはそれぞれ、前記自動走行装置が、前記それぞれの軌道を追従する際に要する時間と、前記自動走行装置がそれぞれの軌道を追従する際に消費する燃料量のうちの少なくとも1つを示す、請求項に記載の方法。
【請求項7】
前記ステップfl)および/または前記ステップf2)において、前記制御モデル(43)および/または前記制御信号(u)が、前記複数の反復の中で変更される、請求項のうちのいずれか1項に記載の方法。
【請求項8】
前記自動走行装置が、自動走行型車両であることを特徴とする請求項のうちのいずれか1項に記載の方法。
【請求項9】
前記自動走行装置が、設計下の車両をシミュレートするように構成されたシミュレータ装置である、請求項のうちのいずれか1項に記載の方法。
【請求項10】
前記ステップb)が、前記自動走行装置を手動および/または自動で操舵することで得られる制御入力から前記制御信号(u)を生成することを含む、請求項1〜のうちのいずれか1項に記載の方法。
【請求項11】
コンピュータ・プログラム製品であって、
少なくとも1つのコンピュータ上で実行される場合、請求項1〜10のうちのいずれか1項に記載の方法を実行するプログラム・コードを備えることを特徴とするコンピュータ・プログラム製品。
【請求項12】
同一の所定の軌道を繰り返し追従するように自動走行装置を制御するシステム(1)であって、
a)所定の軌道を示す目標軌道信号(d)を受信するように構成された第1の装置(10)と、
b)所定の軌道に沿って前記自動走行装置を操舵するのに適した制御信号(u)を生成するように構成された第2の装置(20)と、
複数の反復の少なくとも1つについて、
c) 前記自動走行装置に対して制御信号(u)を供給することにより所定の軌道に沿って前記自動走行装置を操縦することと、
d) 前記制御信号(u)に従って操舵されることに応答して、前記自動走行装置によって追従される実際の軌道を測定することと、
e)測定された前記実際の軌道を示す実際の軌道信号(y)を記録することと、
について構成された前記第3の装置(30)と、
複数の反復の少なくとも1つについて、
f)反復学習制御を使用して、少なくとも、前記制御信号(u)と、前記実際の軌道信号(y)と、前記目標軌道信号(d)とに基づいて、更新された制御信号(uu)を決定するように構成された第4の装置(40)と、
を含み、
前記反復学習制御装置(40)は、制御信号から、予測された軌道信号を生成するのに適する制御モデルを備え、
前記ステップf)は、
fl)前記制御信号と前記実際の軌跡信号とに基づいて前記制御モデルを変更することと、
f2)前記変更された制御モデルに基づいて前記制御信号を変更することと、を含み、
前記ステップfl)は、前記制御信号(u)から前記制御モデル(43)によって生成された、予測された軌道信号と、前記実際の軌道信号(y)と、の間の偏差を減少させるように、前記制御モデル(43)を変更することを含み、かつ
前記ステップf2)は、前記変更された制御信号(uu)から前記変更された制御モデル(43)によって生成された、前記予測された軌道信号と、前記目標軌道信号(d)との間の偏差を減少させるように、前記制御信号(u)を変更することを含む、
システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、自動走行(自動運転)の分野に関し、より具体的には、同一の所定の軌道を繰り返し追従するように自動走行装置(自動運転装置)を制御する方法とシステムに関する。
【背景技術】
【0002】
自動走行車両(自動運転車両)を所望の軌道に追従させる制御を行うために、比例積分微分(PID:proportional integral derivative)制御、状態空間制御、フィードバック制御およびモデル予測制御(MPC:model predictive control)等の制御方法が用いられている。
【0003】
所定の駐車場所までのホーム駐車場若しくはバレット駐車場または自動走行ラップ(LAP)レース等では、自動走行車両は、指定された駐車スペースまでの軌道や、ラップ周りの軌道等の、同一の所定の軌道を追従するように繰り返し制御されている。
上記種類の方法は、2015年7月1日、米国自動制御会議(AMERICANAUTOMATIC CONTROL COUNCIL)、2015年度米国制御会議(ACC:AMERICAN CONTROL CONFERENCE)、カパニア・ニティンR(KAPANIANITIN R)等による『反復学習制御による高度動的自律走行軌道の経路追跡(Path tracking ofhighly dynamic autonomous vehicle trajectories via interative learning control)』、第2753頁−第2758頁、XP033185259、から知られている。
同様の開示内容が、2011年7月20日、IEEE(アイ・トリプル・イー)、2011年度国際会議、PACC(Process automation, control and computing)、マノハランPS(MANOHARAN PS)等による『反復学習制御を用いた軌道追跡(Trackingtrajectory using iterative learning control)』、第1頁−第5頁、XP031928422、から知られている(DOI: 10.1109/PACC.2011.5978963, ISBN:978-1-61284-765-8)。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の課題の一つは、同一の所定の軌道を繰り返し追従させるように自動走行車両を制御する場合の性能を向上させることである。
【課題を解決するための手段】
【0005】
本発明に係る第1の態様では、同一の所定の軌道を繰り返し追従するように自動走行装置を制御する方法を提供するが、この方法は、a)所定の軌道を示す目標軌道信号(ターゲット軌道信号)を受信するステップと、b)所定の軌道に沿って自動走行装置を操舵(操縦)するのに適した制御信号を生成するステップと、を含む。本方法は、さらに、複数の反復の少なくとも1つについて、c)制御信号を自動走行装置に供給することによって、所定の軌道に沿って自動走行装置を操舵するステップと、d)制御信号に従って操舵されることに応答して、自動走行装置によって追従される実際の軌道を測定するステップと、e)測定された実際の軌道を示す実際の軌道信号を記録するステップと、f)少なくとも制御信号と、実際の軌道信号と、目標軌道信号とに基づいて、変更された制御信号を決定するように、反復学習制御装置を使用するステップと、を含む。
【0006】
上記方法は、有利には、同一の所定の軌道に沿って自動走行装置を操舵する後続の反復中に、自動走行装置の追従性能(追跡性能)を向上するために、反復学習制御(ILC:Iterative Learning Control)を活用する。
【0007】
「追従性能」とは、例えば、所定の軌道と実際の軌道との間の追従のエラー(誤差)または偏差でもよく、そして、「追従性能を最適化すること」とは、追従のエラーを減少することを示し得る。
【0008】
自動走行装置は、実際の自動走行車両でもよい。または、自動走行装置は、車両(自動車)のシュミレーションモデルでもよい。本明細書で使用される「自動」とは、人間の介入なしに、自動走行装置が所定の軌道に追従することができる能力を示し得る。
【0009】
用語「信号(シグナル)」は、時系列の読み取りまたは値を示し得る。時系列とは、連続的であってもよく、または離散的であってもよい。離散的な時系列とは、等間隔であってもよく、または非等間隔であってもよい。制御信号において、値は、加速度および操舵角を含み得る。それぞれの軌道信号において、値は、2次元座標または3次元座標を含み得る。それぞれの信号は、さらに、各値についての時間を示すタイムコードを含み得る。
【0010】
所定の軌道は、車両が追従することが想定されている所望の経路または道(ルート)でもよい。所定の軌道の例としては、バレット駐車場(出発点)の入り口から所定の駐車場所(終点)までの軌道、またはレーシング場のラップのスタートライン(出発点)からフィニッシュライン(終点)までの軌道または周回の軌道が挙げられる。
【0011】
ステップa)では、所定の軌道は、例えば、駐車場制御装置および/またはレース場制御装置等の固設型の制御装置から、および/または、車載ナビゲーション制御装置等の自動走行車両の車載型制御装置から、および/または移動装置(携帯装置)から受信することができる。
【0012】
ステップb)では、所定の軌道に沿って自動走行装置を操舵するのに適した制御信号は、目標軌道信号を受信することに応答して、人間の運転者、PID制御装置または同様物等によって車両に与えられる加速度および操舵角等の時系列の制御入力を検出し、記録することによって生成されてもよい。あるいは、制御信号は、計算によって生成されてもよい。
【0013】
本明細書中の「所定の軌道に沿って自動走行装置を操舵する」という用語は、所定の軌道から、許容可能な追従のエラーで逸脱し得る実際の軌道に沿って、追従する、または移動する若しくは運転するように、自動走行装置を制御することを示し得る。
【0014】
「複数の反復」とは、1つまたは複数の数を示し得る。
【0015】
それぞれの反復とは、それぞれの制御信号に従って、所定の軌道の開始点から所定の軌道に沿った終点まで、自動走行装置を操舵する各場合(事例)を示し得る。具体的には、第1の反復において、ステップb)で生成された制御信号に応答して、ステップc)、d)、e)およびf)を実行してもよい。任意のさらなる反復において、ステップc)、d)、e)およびf)は、制御信号として、ステップf)で生成された、変更された制御信号に応答して実行されてもよい。
【0016】
ステップc)において自動走行装置に制御信号を送ることとは、複数の時間の場合の各々で、自動走行装置の操舵装置(ステアリング装置)等の、自動走行装置に対して、制御信号によって構成されるそれぞれの値を提供することを示し得る。
【0017】
同様に、ステップd)における測定およびステップe)における記録も、複数の時間の場合の少なくともいくつかについて繰り返し実施することができる。すなわち、ステップd)およびe)は、ステップc)と並行して、および/または、ステップc)と同期して、実行されてもよい。
【0018】
ステップd)の測定は、二次元座標値および/または三次元座標値を取得するために、所定の軌道または同様物等に沿って配置された標識ポスト(サインポスト)との無線通信を使用して、GPS受信装置等の位置特定装置(ロケーション装置)を使用することを示し得る。
【0019】
ステップe)では、記録することは、複数の時間の場合について、ステップd)で測定された複数の値から信号を形成することを示し得る。
【0020】
ステップf)において、反復学習制御装置は、現在の反復における制御信号および実際の軌道信号(記録された実際の軌道信号)に基づいて、後続の反復のために変更された(更新された、改善された、または最適化された)制御信号を提供するために、反復学習制御(ILC)を使用するように構成された装置でもよい。
【0021】
より具体的には、「制御信号および目標軌道信号に基づく」とは、「実際の軌道信号と目標軌道信号との間の追従のエラーを示す実際の追従のエラー信号に基づくこと」を意味し得る。実際の追従のエラー信号とは、目標軌道信号から実際の軌道信号を差し引くことによって得られてもよい。「追従のエラー」とは、それぞれの信号の間の平均または二乗平均平方根距離等の偏差を示し得る。
【0022】
「信号に基づく」とは、特に、「入力として信号を使用すること」を示し得る。
【0023】
さらに、より具体的には、反復学習制御装置は、追従性能を最適化する最適化制御信号を、反復の各々で繰り返し使用することによって、反復学習するように構成されることができる。特に、追従性能を最適化するとは、実際の追従のエラー信号(エネルギ内容、時間平均値、またはその二乗平均平方根)を減少または最小化することを示し得る。
【0024】
具体的には、「学習する」とは、パラメータ、オペレータまたは制御モデル等、反復学習制御装置内に記憶されたデータを繰り返し変更する(更新するまたは最適化する)ことを示し得る。
【0025】
ステップf)は、制御信号のそれぞれの値、実際の軌道信号の対応する値、および目標値信号の対応する値が、変更された制御信号の対応する値を決定するために使用されて、全ての値が同じ時間の事例に関する値である実施形態に限定されないことに留意されたい。
【0026】
むしろ、ステップf)は、全ての信号を使用して操作することが好ましい。即ち、複数の時間の事例の各々について変更された制御信号の各値は、制御信号、実際の軌道信号および目標値信号および/または実際の追従のエラー信号の各々の時系列の全ての時間の事例または時間のある範囲の事例に対応する一部に基づいて決定されてもよい。
【0027】
一実施形態によると、ステップe)は、自動走行装置が操舵される間に、実際の軌道信号を記憶装置内に記録することを含み、少なくともステップf)が、ステップc)で自動走行装置が操舵された後に、実行される。
【0028】
すなわち、反復学習制御装置は、オフラインで用いられてもよく、すなわち、所定の軌道に沿って自動走行装置を操舵する操作が完了した後に用いられて、所定の軌道に沿って自動走行装置を操舵する後続の反復に備えてもよい。
【0029】
時間が重要なオンラインの操作と比較して、反復学習制御装置のオフラインの操作は、反復学習制御装置内でより高度な制御アルゴリズム(より高度なパラメータ、オペレータ、またはより高度で計算集約的な制御モデル)を使用できるという利点を提供し得る。これにより、追従性能をさらに最適化することが可能になる。
【0030】
特に、実際の軌道信号は、実際の軌道が測定される複数の時間の事例のうちの少なくともいくつかのそれぞれについて、位置の値(座標値)が記憶装置(メモリデバイス)内に記憶することで記録されてもよい。
【0031】
記憶装置は、RAM、フラッシュメモリ、ハードディスクドライブまたは同様物等の揮発性または不揮発性メモリでもよい。
【0032】
さらなる実施形態によれば、本方法はさらに、複数の反復に続く反復について、制御信号として、変更された制御信号を使用することを含む。
【0033】
ステップc)からステップf)までの複数の反復に続く反復について、制御信号として、変更された制御信号を繰り返し使用することによって、複数の反復の後に、有利には、追従性能を最大化するために最適な制御信号を決定することができる。
【0034】
「後続の反復(続く反復)」とは、現在の反復の直後に続く次の反復を示すことができ、および/または、現在の反復より後の時点で実行される一つおいて次、または後続の任意のさらなる反復を示すことができる。
【0035】
複数の反復のステップは、部分的に重複可能なことに留意されたい。例えば、ラップ(LAP)レースにおいて、現在の反復の直後に、所定の軌道に沿って車両を操舵する後続の反復の場合、現在の反復の直後の次の反復では、現在の反復で使用されたものと同じ制御信号uを使用してもよく、そして、ステップf)で決定された、変更された制御信号uuが、次の反復で提供されずに、次の反復の後に続く後続の反復(一つおいて次の反復)で提供されてもよい。
【0036】
このようにステップf)とステップc)、d)、e)とを並列化することにより、ラップレースの場合でも高度なモデルを用いたオフラインの反復学習制御を有利に用いることができる。
【0037】
さらなる実施形態によれば、反復学習制御装置は、制御信号から、予測された軌道信号を生成するのに適した制御モデルを含み、そして、ステップf)は、fl)制御信号および実際の軌道信号に基づいて制御モデルを変更するステップと、f2)変更された制御モデルに基づいて制御信号を変更するステップと、を含む。
【0038】
すなわち、変更された出力信号は、制御信号、実際の軌道信号、目標軌道信号、および変更されたモデルに基づいて決定される。
【0039】
換言すると、本実施形態に係る制御方法は、フィードバック制御、モデルベース(model-based)制御、および学習制御(ラーニング・コントロール)の組合せとして説明することができる。この組合せは、追従性能をより最適化できるという点で有利であり得る。
【0040】
特に、ステップfl)では、制御モデルは、制御信号および実際の軌道信号から導出可能な、自動走行装置に関する情報に基づいて変更されてもよい。
【0041】
このように、ステップfl)は、制御モデルが自動走行装置に関する新しい情報を学習する学習ステップとして説明することができ、そして、ステップf2)は、学習した情報を適用する際に、変更された制御信号を決定するために、学習した情報が使用される適用ステップとして説明することができる。
【0042】
さらなる実施形態によれば、ステップfl)は、制御信号から、制御モデルによって生成された、予測された軌道信号と、実際の軌道信号との間の偏差を減少させるように、制御モデルを変更することを含む。
【0043】
それにより、有利には、反復学習制御装置により構成される制御モデルは、実際の軌道信号をより正確に予測するために最適化される。
【0044】
具体的には、ステップfl)は、最適化問題を解くことを含み得る。最適化問題は、上記偏差を減少または最小化する制御モジュールの変更されたパラメータを決定する際に構成されてもよい。最小化とは、局所的な最小化または広域的な最小化でもよい。
【0045】
さらなる実施形態によれば、ステップf2)は、変更された制御信号から、変更された制御モデルによって生成された、予測された軌道信号と、目標軌道信号との間の偏差を減少させるように、制御信号を変更することを含む。
【0046】
これにより、有利には、変更された制御信号を使用して実施される後続の反復の予測された追従のエラー(予測された軌道信号と目標軌道信号との間の偏差)が減少される。したがって、有利には、後続の反復の実際の追従のエラーも同様に減少され得る。
【0047】
具体的には、ステップf2)は、最適化問題を解くことを含み得る。最適化問題は、偏差を減少または最小化する、変更された制御信号を決定することでもよい。最小化は、局所的な最小化または広域的な最小化でもよい。
【0048】
さらなる実施形態によれば、ステップfl)および/またはステップf2)において実施される上記変更は、自動走行装置に課される制約の下で実施される。
【0049】
制約の例としては、最大舵角、最大加速度、および同様物等が挙げられる。この制約は、それぞれの最適化問題を解くときに適用され得る。
【0050】
それにより、有利には、変更された制御信号は、自動走行装置の所望の挙動および/または特性について調整されてもよい。
【0051】
さらなる実施形態によれば、ステップd)は、実際の軌道に関する実際のパラメータを決定することを含む。制御モデルは、さらに、予測された軌道に関する予測されたパラメータを生成するように適合される。ステップfl)は、制御モデルによって生成された、予測されたパラメータと、実際のパラメータとの間の偏差を減少させるように、制御モデルを変更することを含み;および/または、ステップf2)は、所定のパラメータ目標と、制御モデルによって生成された、予測されたパラメータとの間の偏差を減少させるように、制御信号を変更することを含む。それぞれの軌道に関するそれぞれのパラメータは、それぞれの軌道の物理的特性および/または自動走行装置および/またはそれぞれの軌道に追従するときの自動走行装置の挙動を示すパラメータである。
【0052】
従って、「追従性能の最適化」とは、所定の軌道の座標と実際の軌道の位置座標との間の追従のエラーまたは偏差を減少させることだけを単に指すのではない。むしろ、有利には、それぞれの軌道に関する任意の所望のパラメータ間の偏差を減少できる。所望のパラメータは、追従のエラー、燃料消費量、車両の一部の摩耗、総走行時間および同様物等のうちの1つでもよい。
【0053】
ステップf)が、最適化問題を解くことを含む実施形態では、可能な限り減少されることが望ましい偏差が、最適化問題の目的関数として設定されてもよく、一方、所定の最大限界を超えないことが望ましい偏差が、最適化問題を解くときの制約として設定されてもよいことに留意されたい。例えば、燃料消費量を目的関数として使用してもよく、かつ燃料消費量を最適化するための制約として、追従のエラーを使用してもよい。あるいは、燃費消費量を制約として使用してもよく、かつ追従の精度(正確さ)を最適化するための目的関数として、追従のエラーを使用してもよい。
【0054】
さらなる実施形態によれば、予測された軌道に関する予測されたパラメータおよび実際の軌道に関する実際のパラメータはそれぞれ、それぞれの軌道を追従する際に自動走行装置によって消費される燃料の量と、それぞれの軌道を追従するために自動走行装置が要する時間の少なくとも1つを示す。
【0055】
特に、それぞれのパラメータは、それぞれの軌道の所定の部分、例えば、その開始点からその終点までを追従するときに要する時間または燃料(量)を示すことができる。
【0056】
さらなる実施形態によれば、ステップfl)および/またはステップf2)では、制御モデルおよび/または制御信号は、複数の反復中に変更される。
【0057】
すなわち、ステップfl)および/またはステップf2)で解かれる最適化問題は、非解析的問題であり得る。非解析的最適化問題を解くことは、最適化問題を反復的に解くことを含み得る。反復的に解くことは、最急降下法および同様物等の使用を含み得る。反復は、それぞれの偏差が所定の閾値を下回るまで繰り返されてもよく、および/またはそれぞれの偏差が、連続する反復の間の所定の閾値よりも小さく変化するまで行われてもよく、および/または最急勾配が所定の閾値を下回るまで行われてもよい。換言すれば、広域的または局所的な最小化で収束が達成されるまで、反復を繰り返すことができる。
【0058】
従って、有利には、追従性能をさらに改善するために、解析的に解くことができず、かつ反復解法を必要とすることがある、高度な制御モデルが使用されてもよい。
【0059】
さらなる実施形態によれば、自動走行装置は、自動走行車両(自動車)である。
【0060】
ここで、「自動」とは、完全に自動化された車両、半自動化された車両、または運転補助機能が備えられた従来型の車両を示し得る。
【0061】
自動走行車両は、電気自動車、ハイブリッド自動車、内燃機関自動車および同様物等の自動車(車両)でもよい。
【0062】
本実施形態に係る制御方法は、同一の所定の軌道に沿って車両が操舵されるときは常に有利に実施されてもよい。例えば、車両には、ステップa)において、自動化された、駐車場またはレース場により、目標軌道信号が提供されてもよい。目標軌道信号に応答して、人間またはPID制御装置が、ステップb)において、目標軌道に沿って車両を操舵するための制御信号を生成してもよい。次いで、車両は、制御信号に従って目標軌道に沿って操舵されてもよく、その実際の軌道が、ステップc)、d)およびe)において記録される。その後、追従性能を向上させるために、ステップf)が実行されてもよい。次に、同一の目標軌道が車両に与えられた場合、その車両は、ステップc)〜e)を繰り返して、向上された追従性能で、目標軌道に沿って車両を自動的に操舵し、そして、追従性能をさらに向上させるためにステップf)が実施されてもよい。従って、経時的に、反復学習制御を用いて、所定の軌道に沿って車両を操舵するために要する時間および/または燃料消費量を最適化(減少)することができる。
【0063】
さらなる実施形態によれば、自動走行装置は、設計下の車両をシミュレートするように構成されたシミュレータ装置である。
【0064】
設計下の車両は、自動走行車両または従来型の車両でもよく、後者の場合、「自動走行装置」における「自動」とは、人間の介入なしに、シミュレータ装置(必ずしも最終的な車両である必要はない)が、自動的に操作され得ることを示し得る。
【0065】
シミュレータ装置は、ソフトウェアおよび/またはハードウエアによって実施することができる。特に、シミュレータ装置は、「Siemens Imagine. Lab Amesim」等のシミュレーション・ソフトウェアを用いて作成された、高性能の車両動的モデルでもよい。.
【0066】
エンジニア(技術者)は、本提案の制御方法を使用して、所定の軌道に沿ってシミュレートされた車両の操舵を繰り返しシミュレートして、上記操舵用に最適な制御入力を決定してもよい。これにより、エンジニアは、車両の動的モデルの最適性能を評価することができる。次に、エンジニアは、所望の特性を備えたモデルが得られるまで、シミュレータ装置を変えて(設計下の車両のモデルを変えて)、このプロセスを繰り返してもよい。
【0067】
従って、本提案の方法は、初期段階の車両開発の補助として、有利に使用され得る。
【0068】
さらなる実施形態によれば、ステップb)は、自動走行装置を手動および/または自動で操舵することで得られる制御入力から制御信号を生成することを含む。
【0069】
制御入力は、例えば、操舵角と加速度でもよい。
【0070】
「手動操舵」とは、人間の運転手による操舵を示し得る。
【0071】
「自律操舵」とは、ステップb)を参照する場合、比例積分微分(PID)制御、状態空間制御、フィードバック制御またはモデル予測制御(MPC)等の自動走行制御法(自動運転制御法)を用いた操舵を示し得る。
【0072】
第1の態様に係る任意の実施形態を、第1の態様に係る任意の実施形態と組み合わせることで、第1の態様に係る別の実施形態を得ることができる。
【0073】
本発明に係る第2の態様は、少なくとも1つのコンピュータ上で用いられる場合に、自動走行装置を制御するための、上記方法を実施するためのプログラム・コードを含む、コンピュータ・プログラム製品に関する。
【0074】
コンピュータ・プログラム手段等のコンピュータ・プログラム製品は、メモリ・カード、USBスティック、CD−ROM、DVD、またはネットワーク内のサーバからダウンロード可能なファイルとして実装できる。例えば、このようなファイルは、無線通信ネットワークから、コンピュータ・プログラム製品を含むファイルを転送することで提供されてもよい。
【0075】
本発明に係る第3の態様は、同一の所定の軌道を繰り返し追従するように自動走行装置を制御するシステムであって、
a)所定の軌道を示す目標軌道信号を受信するように構成された第1の装置と、
b)所定の軌道に沿って自動走行装置を操舵するのに適する制御信号を生成するように構成された第2の装置と、
複数の反復の少なくとも1つについて、
c)自動走行装置に対して制御信号を供給することによって所定の軌道に沿って自動走行装置を操縦することと、
d)制御信号に従って自動走行装置が操舵されることに応答して、自動走行装置によって追従される実際の軌道を測定することと、
e)測定された実際の軌道を示す実際の軌道信号を記録することと、
について構成された前記第3の装置(30)と、
f)複数の反復の少なくとも1つについて、反復学習制御を使用して、少なくとも制御信号と、実際の軌道信号と、目標軌道信号とに基づいて、更新された制御信号を決定するように構成された、第4の装置(40)と、
【0076】
第1の態様の方法を参照して説明した実施形態および特徴は、さらなる態様のシステムについて準用できる。第3の態様のシステムは、第1の態様の方法または第1の態様の実施形態の任意の方法を実行するために実装されてもよい。
【0077】
それぞれの装置、例えば、第1の装置、第2の装置、第3の装置および/または第4の装置は、ハードウェアおよび/またはソフトウェアで実施することができる。上記装置がハードウェアとして実施される場合、例えば、コンピュータとして、またはプロセッサとして、あるいはシステムの一部として、例えば、コンピュータシステムの一部としてとして実施されてもよい。上記装置がソフトウェアとして実施される場合、コンピュータ・プログラム製品として、機能(ファンクション)として、ルーチンとして、プログラム・コードとして、または実行可能オブジェクトとして実施されてもよい。
【0078】
本発明のさらなる可能な実装または代替の解決策は、実施形態に関して上述または後述される特徴の(本明細書では必ずしも明示的に言及されない)組合せを包含する。当業者であれば、本発明の最も基本的な形態に対して、個々のまたは別個の態様または特徴を追加できるであろう。
【0079】
本発明のさらなる実施形態、特徴および利点は、添付の図面を参照して、本発明に係る詳細な説明と特許請求の範囲の記載から明らかになる。
なお、図中、特定されない限り、同一の参照番号は、同一の構成要素または機能的に同等の構成要素を示している。
【図面の簡単な説明】
【0080】
図1図1は、第1の実施形態に係る方法を例示したフローチャートである。
図2図2は、第1の実施形態に係るシステムを例示したブロック図である。
図3図3は、第2の実施形態に係るシステムを例示したブロック図である。
【発明を実施するための形態】
【0081】
図1は、自動走行装置(自動運転装置)が同一の所定の軌道を繰り返し追従するように制御するための、本発明の第1の実施の形態に係る方法(以下、「制御方法」という)を例示したフローチャートである。図2は、第1の実施の形態に従って、自動走行装置が同一の所定の軌道を繰り返し追従するように制御するシステム1(以下、「制御システム」という)を例示したブロック図である。以下、図1図2を参照する。
【0082】
制御システム1は、軌道受信装置(第1の装置)10と、自動走行制御装置(第2の装置)20と、車両インターフェース・アセンブリ(第3の装置)30と、反復学習制御装置(第4の装置)40と、を備える。
【0083】
制御システム1は、自動走行車(以下、「車両」という。図示略)等の自動走行装置と関連付けられている(例えば、車両内に搭載されている、または車両と通信可能に接続されている)。
【0084】
制御方法のステップS10では、軌道受信装置10は、例えば、(バレット)駐車場(図示略)内に設置された送信機等の外部の物体またはエンティティ(図示略)から目標軌道信号dを受信する。目標軌道信号dは、車両が追従することが予定されている所定の軌道を示す。
【0085】
一例を示すと、所定の軌道は、(バレット)駐車場の入口から、(バレット)駐車場の所定の駐車スペースまで導く軌道でもよい。
【0086】
制御方法のステップS20では、自動走行制御装置20には、目標軌道信号dが提供される。なお、自動走行制御装置20は、本実施形態ではPID制御装置でもよい。説明を簡潔にするため、PID制御の詳細については省略する。目標軌道信号dが提供されることに応答して、自動走行制御装置は制御信号uを生成して、その制御信号uを車両インターフェース・アセンブリ30に供給する。
【0087】
制御信号uが提供されることに応答して、車両インターフェース・アセンブリ30は、次に3つのステップS31、S32、およびS33を実行する。
【0088】
ステップS31では、制御信号uが自動走行装置に供給されることにより、自動走行装置が所定の軌道に沿って操舵または操縦される。
【0089】
ステップS32では、制御信号uに従って操舵されることに応答して、自動走行装置によって追従される実際の軌道が測定される。
【0090】
ステップS33では、測定された実際の軌道を示す、実際の軌道信号yが記録される。
【0091】
車両インターフェース・アセンブリ30は、反復学習制御装置40に対して、実際の軌道信号yを供給する。同様に、制御信号uおよび目標軌道dについても、反復学習制御装置40に対して供給する。
【0092】
ステップS40では、反復学習制御装置40は、反復学習制御(ILC)を使用して、制御信号uと、実際の軌道信号yと、目標軌道信号dとに基づいて、変更された制御信号uuを決定する。
【0093】
ステップS31、S32、S33およびS40では、このように、ステップS31において、始点から終点まで所定の軌道に沿って車両が操舵された第1の反復を構成し、ステップS32において、実際の軌道が測定され、ステップS33において、実際の軌道信号yが記録され、そして、ステップS40において、実際の軌道信号yと、目標軌道信号dと、制御信号uとに基づいて、変更された制御信号uuが決定される。
【0094】
これにより、第1の反復中に、変更された制御信号uuが決定されるが、有利には、反復学習制御によって、自動化された車両の追従性能(トラッキング性能)が改善され得る。
【0095】
好適な変更実施例では、ステップS40の後、変更された制御信号uuを車両インターフェース・アセンブリ30にフィードバックして、ステップS31、S32、S33およびS40のうちの1つまたは複数の後続の反復中に、制御信号uとして使用されるようにしてもよい。
【0096】
図3は、第2の実施形態に係る制御システム1のブロック図を示す。以下の説明は、図3の制御システムと、図2の制御システム1との間の相違点に関する。以下、図1乃至図3を参照する。
【0097】
軌道受信装置10、自動走行制御装置20、車両インターフェース・アセンブリ30、および反復学習制御装置40に加えて、図3のシステム1はさらにデータベース50を備える。
【0098】
データベース50は、複数の制御信号および目標軌道信号を互いに関連付けて記憶するように構成されている。
【0099】
車両インターフェース・アセンブリ30は、操舵(ステアリング)装置31と、測定装置32と、記憶(メモリ)装置33と、消費量計(燃費メータ)34と、を備える。消費量計は、燃料ゲージを含むことができる。
【0100】
反復学習制御装置40は、減算装置41と、反復学習制御器(反復学習コントローラ)42と、を備える。反復学習制御器42は、制御モデル43を備える。
【0101】
第2の実施形態に係るシステム1は、以下の仕方で動作されてもよい。
ステップS10において、軌道受信装置10は、外部の物体から目標軌道信号dを受信する。目標軌道信号dは、一連の目標位置の値d(k)を含み、この際、k=l…Kであって、kは、離散化された時間等の離散化指標であり、かつKは、目標軌道信号dによって構成される値の総数である。軌道受信装置10は、目標軌道信号d(k)を、k=l…Kの様式で自動走行制御装置20に対して送信して、後述のように、制御信号uを生成するために使用されるようにし、またデータベース50に対して送信して、後述のように、変更された制御信号uuと関連してその中で記憶されるようにし、また反復学習制御装置40に対して送信して、予測された追従のエラー信号と、実際の追従のエラー信号eとを決定するために使用されるようにする。
【0102】
自動走行制御装置20は、ステップS20において、車両インターフェース・アセンブリ30に供給される制御信号uを、2つの仕方のいずれかで生成するように構成されてもよい。
【0103】
具体的には、自動走行制御装置20は、データベース50と通信可能に接続されている。自動走行制御装置20は、目標軌道信号dを受信すると、データベース50に問合わせて、目標軌道信号dと関連した制御信号(または、目標軌道信号dと同一の所定の軌道を示す目標軌道信号と関連して保存されている制御信号u)がデータベース50内に保存されているか否かを判定してもよい。
【0104】
データベース50が、目標軌道信号dと関連して記憶された制御信号uを含む場合には、自動走行制御装置20は、目標軌道信号dによって示される所定の軌道に沿って車両を操舵するための、継続する反復が所望であると知ることができる。この場合、記憶された制御信号は、軌道信号dによって示される所定の軌道に沿って車両を操舵するための変更された(更新された、改善された、または最適化された)制御信号uuであってもよい。このように、自動走行制御装置20は、制御信号uとして、目標軌道信号dと関連してデータベース50内に記憶されている制御信号uuを車両インターフェース・アセンブリ30に供給することで、制御信号uを生成してもよい。
【0105】
または、データベース50が、目標軌道信号dと関連して記憶された制御信号を含まない場合には、自動走行制御装置20は、PID制御または同様物を使用して制御信号uを生成して、その制御信号uを車両インターフェース・アセンブリ30に供給してもよい。
【0106】
車両用インターフェース・アセンブリ30では、制御信号uが供給されることに応答して、以下のステップが実行される。
【0107】
ステップS31で所定の軌道に沿って車両を操舵するために、離散化された時間k毎に、制御信号uの対応する値u(k)が操舵装置31に対して供給される。値u(k)は、加速度および操舵角を含むことができる。この値u(k)は、さらに、記憶装置33に対して供給されて、その内で記憶されるようにする。これにより、制御信号uが記憶装置33内で記録されてもよい。
【0108】
車両が所定の軌道に沿って操舵される間、離散化された時間k毎に、測定装置32は、車両が、ステップS32内で制御信号uに従って操舵されることに応答して、車両によって追従される実際の軌道の現在の座標を測定する。現在の座標は、記憶装置33に供給されて、そこで記憶される。これにより、実際の軌道信号yを記憶装置33内に記録してもよい(ステップS33、図1)。
【0109】
さらに、実際の軌道(実際の軌道に関連する実際のパラメータの一例)に追従しながら車両によって消費される燃料の量を示すパラメータpが記憶装置33内に記憶される。パラメータpは、燃料ゲージ34によって、例えば離散化された時間k毎等のように、一定の間隔で決定されて、更新される。
【0110】
所定の軌道に沿って車両を操縦する操作が完了した後、すなわち、離散化された時間Kに到達すると、記録された制御信号ur(k)(k=l...K)と、記録された実際の軌道信号yr(k)(k=l...K)と、記録された実際のパラメータprと、が反復学習制御装置40に対して供給される。
【0111】
より具体的には、記録された実際の軌道信号yrは、反復学習制御装置40の減算装置41に供給されてもよい。目標軌道信号dも減算装置41に供給されてもよい。減算装置41は、目標軌道信号d(k)から、記録された実際の軌道信号yr(k)を減算して、実際の追従のエラー信号e(k)を求めることができる。実際の追従のエラー信号e(k)(k=l...K)は、記録された制御信号ur(k)と、記録されたパラメータprとともに、反復学習制御装置42に供給されてもよい。
【0112】
反復学習制御装置42は、車両を含む制御システムの制御モデル43を備える。
【0113】
具体的には、ステップS40において、反復学習制御装置42は、学習関数(ラーニング関数)fを評価することで、制御モデル43を用いて、変更された制御信号uu(k)を決定することができる。学習関数fは、以下に示すように、実際の追従のエラーe(k)と、記録された実際の制御信号ur(k)と、記録されたパラメータ信号prとの関数でもよい。
【0114】
uu(k)=f[ur(k)、e(k)、pr](k=l...K)
【0115】
特に、関数fは非分析型関数(non-analytical function)でもよい。
【0116】
具体的には、関数fの評価は、学習処理(ラーニング・プロセス)を含むことができ、その際、実際の追従のエラー信号e(k)と、記録された実際のパラメータ信号pr(k)と、実際の制御信号ur(k)とから学習された知識に基づいて、制御モデル43が変更される。関数fの評価は、さらに、最適化処理を含むことができ、その際、学習処理において変更された、変更後の制御モデル43に基づいて、変更された制御信号uu(k)が決定される。
【0117】
最適化問題は、目的関数と制約とを含み得る。目的関数は、追従エラーを減少させることを目的としてもよく、かつ制約は、最大限に許容可能な燃料消費(量)でもよい。逆に、目的関数は、燃料消費(量)を減らすことを目的としてもよく、かつ制約は、最大限に許容可能な追従エラーでもよい。
【0118】
このようにして変更された制御信号uu(k)が決定されると、変更された制御信号uu(k)がデータベース50に提供されて、その中でターゲット軌道信号d(k)と関連付けられて記憶される。
【0119】
このように、変更された制御信号uu(k)は、軌道受信装置10が同一の目標軌道信号d(k)を受信する後続の反復の間に、自動走行制御装置20によって使用できるようになる。
【0120】
従って、同一の所定の軌道を追従するときに車両に用いられた、経験した追従エラー、燃料消費または時間等の追従性能は、後続の反復によって反復的に改善され得る。
【0121】
ここで、第2の実施形態に係る好適な変更例を用いて、ステップS40の好適な変更例についてより詳細に説明する。
【0122】
第2の実施形態に係る好適な変更例では、制御モデル43は、この制御モデル43に提供される制御信号に基づいて予測された軌道信号を生成するように構成され得る。制御モデル43は、さらに、制御信号に基づいて、予測されたパラメータを生成するように構成され得る。
【0123】
すなわち、好適な変更例では、反復学習制御装置42は、ステップS40において制御モデル43を用いて学習関数fを評価するために後続のステップを実行できる。
【0124】
上述した学習処理の一例として、第1のサブステップ(fl)では、反復学習制御装置42は、制御モデル43を複数の反復で変更してもよい。各反復中、反復学習制御装置42は、制御モデル43を使用して、記録された制御信号ur(k)に基づいて、予測された軌道信号yp(k)と予測されたパラメータppとを決定してもよい。
【0125】
ここで、予測されたパラメータppは、予測された軌道信号yp(k)によって示される予測された軌道に追従しながら、車両によって消費される、予測された燃料の量(一例を挙げると、予測された軌道と関連する予測されたパラメータ)でもよい。
【0126】
それぞれの反復中、反復学習制御装置42は、最急降下法等の反復最適化法に従って、制御モデル43を変更してもよい。最適化法の目的関数は、予測された軌道yp(k)と、記録された軌道yr(k)との間の偏差を減少または最小化すること、および/または、予測されたパラメータppと記録されたパラメータprとの間の偏差を減少または最小化することでもよい。
【0127】
本明細書では、予測された軌道信号yp(k)と記録された軌道信号yr(k)との間の偏差を減少させることは、予測された軌道信号yp(k)を目標軌道信号d(k)から差し引くことによって決定される予測された追従のエラー信号と、実際の追従のエラー信号e(k)との間の偏差を減少させることと機能的に同等であり得ることに留意されたい。減算装置41は、予測された追従のエラー信号を決定するために使用され得るが、図3には明示されていない。
【0128】
反復学習制御装置42は、その1つまたは複数のパラメータを変更することによって、制御モデル43を変更することができる。反復学習制御装置42は、局所的または広域的な最小値での偏差の収束が達成されるまで、制御モデル43を反復的に変更し続けることができる。
【0129】
換言すると、第1のサブステップ(fl)の学習処理では、反復学習制御装置42は、最適化問題を解くことで、制御モデル43によってモデル化された、車両を含む制御システムの観測された挙動と、制御モデル43とがより良く一致するようにしてもよい。この際、観測された挙動は、記録された制御信号ur(k)と、記録されたパラメータprと、記録された実際の軌道信号yr(k)(実際の追従のエラー信号e(k))とによって示され得る。
【0130】
ステップS40の第2のサブステップ(f2)では、反復学習制御装置42は、変更された制御信号uu(k)を反復的に決定してもよい。具体的には、反復学習制御装置42は、まず、変更された制御信号uu(k)として、記録された制御信号ur(k)を使用し、そして変更された制御信号uu(k)を複数の反復の中で反復的に変更してもよい。
【0131】
各反復中、反復学習制御装置42は、変更された制御モデル43を使用して、現在の変更された制御信号uu(k)に基づいて、予測された目標軌道yp(k)と予測されたパラメータppとを決定してもよい。
【0132】
それぞれの反復中、反復学習制御装置42は、最急降下法等の反復最適化法に従って、変更された制御信号uu(k)を変更してもよい。最適化法の目的関数は、予測された軌道yp(k)と所望の目標軌道d(k)との間の偏差(追従エラーを減少または最小化することとも呼ばれる)を減少または最小化すること、および/または、予測されたパラメータppと所定のパラメータ目標との間の偏差を減少または最小化することであり得る。具体的には、所定のパラメー目標は、許容可能な最大の総合的な燃料消費量でもよい。
【0133】
反復学習制御装置42は、局所的または広域的な最小値での偏差の収束が達成されるまで、制御モデル43を反復的に変更し続けることができる。
【0134】
ここで、最小化の対象の偏差が、予測された軌道yp(k)と目標軌道d(k)との間の偏差として選択される場合、反復学習制御装置42は、予測された追従エラー(一例を挙げれば、最適化の対象の予測された追従性能)を効果的に最適化する。最小化の対象の偏差が、予測されたパラメータppと所定のパラメータ目標との間の偏差として選択される場合、反復学習制御装置42は、予測された軌道に追従するときに、車両によって消費される燃料の予測量等の、予測された軌道と関連する予測されたパラメータを効果的に最適化する(予測された追従性能についての他の例)。
【0135】
予測された追従エラーを最適化する際、許容可能な最大の燃料消費量は、変更された制御信号uu(k)を変更するときの制約として考慮され得る。反対に、予測された燃料消費量を最適化する場合、許容可能な最大の追従エラーは、変更された制御信号uu(k)を変更するときの制約として考慮され得る。
【0136】
変更された制御信号uu(k)を変更する際に考慮されるさらなる制約は、許容可能な最大舵角や、許容可能な最大加速度等の、車両の特性によって課される制約でもよい。
【0137】
換言すると、第2のサブステップ(f2)の最適化処理において、反復学習制御装置42は、最適化問題を解くことによって、変更された制御モデル43によって生成された予測に基づいて、期待される変更された制御信号uu(k)を決定することで、所定の制約の組み合わせの下で、改善または最適化された追従性能(最小の追従エラーまたは最小の燃料消費量等)が得られるようにしてもよい。
【0138】
このようにして、ステップ(fl)において、受信された目標軌道信号d(k)によって示された所定の軌道に沿って車両が操舵された後に、ステップS40が実行されたとき、制御モデル43が学習によって変更されて、ステップ(f2)において、予測された追従性能を最適化することで制御信号が変更される。
【0139】
各反復(車両が同一の所定の軌道に沿って操舵される、すなわちステップS31、S32およびS33、図1に従って操舵される反復)中にステップS40を繰り返し実行することで、有利には、反復学習を通して、後続の反復で実際の追従性能を改善することができる。
【0140】
以上、好適な実施形態に従って本発明について説明したが、これら実施形態のすべてについて修正が可能なことは、当業者であれば自明であろう。
【0141】
上記実施形態は、主にバレット駐車場におけるシナリオを考慮して説明されたが、本開示内容は、ラップ(LAP) レーシングのシナリオ、ホーム駐車場のシナリオ、および自動走行装置が同一の所定の軌道に沿って繰り返し操舵される任意の他のシナリオに対しても同様に適用可能である。
【0142】
本実施形態は、自動走行装置の一例として、車両(自動車)等を用いた場合の自動走行車両を想定して説明した。しかしながら、本開示内容は、他、自動走行装置が設計下の自動車をシミュレートするように構成されたシミュレータ装置である発展形態のシナリオに対しても同様に適用可能である。
【0143】
軌道に関連するパラメータは、消費される燃料の量に限定されず、他、車両の一部における摩耗量や、所定の軌道のうちの始点から終点までの間で車両の操舵が完了するまでに要する時間や、同様物等を含み得る。
【0144】
なお、第2の実施形態によれば、複数のターゲット軌道信号と関連する変更された制御信号とをデータベース50に記憶できることに留意されたい。好ましくは、データベース50には、各々が目標軌道信号の1つに関連付けられた制御モデル43の複数の事例(インスタンス)を格納することができる。ここで、制御モデルの事例とは、例えば、一組のモデルパラメータでもよい。より正確には、ステップS40の実行毎に、反復学習制御装置42は、ステップS40の学習処理および最適化処理を実行する前に、現在の目標軌道信号に対応する制御モデル43の対応する事例を、反復学習制御装置42内に入れる(ロードする)ことができ、そして、ステップS40の完了時に、変更された制御モデル43(その事例)をデータベース50に書き戻すことができる。すなわち、制御モデル43の異なる事例は、異なる目標軌道信号(異なる運転シナリオ)に従って教示(変更)されてもよい。
【0145】
しかしながら、データベース50は、非限定的で選択的な特徴であって、後続のインターフェースのために車両インターフェース30に対して変更された制御信号uuを直接フィードバックすることも考慮されている。データベース50を含まない実施形態は、ラップ(LAP)レーシングのシナリオでは効果的に使用され得るが、その際、自動走行車両が同一のラップに沿って繰り返し格納されて、追従性能の最適化がレースを通じてなされる。レースの終了後、学習された情報は、もはや必要とされないため、そのような情報をデータベースに記憶する必要はない。
【0146】
ステップS31、S32、S33およびS40の一部または全ては、当業者の判断で並列化することができる。
【0147】
実際の軌道信号yおよび所望の信号d等の第2の実施形態で説明した様々な信号は、必ずしも同じ離散指標kを用いてパラメータ化される必要はなく、それぞれ異なる離散化を用いてパラメータ化されてもよい。
【符号の説明】
【0148】
1 制御システム
10 軌道受信装置(第1の装置)
20 自動走行(自動運転)制御装置(第2の装置)
30 車両インターフェース・アセンブリ(第3の装置)
40 反復学習制御装置(第4の装置)
50 データベース
図1
図2
図3