(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-04
(54)【発明の名称】車両のアンチスリップコントロールを自動式に適合化する方法
(51)【国際特許分類】
B60T 8/174 20060101AFI20240927BHJP
B60T 8/176 20060101ALI20240927BHJP
【FI】
B60T8/174 C
B60T8/176 Z
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024521118
(86)(22)【出願日】2022-09-20
(85)【翻訳文提出日】2024-04-08
(86)【国際出願番号】 EP2022076009
(87)【国際公開番号】W WO2023066581
(87)【国際公開日】2023-04-27
(31)【優先権主張番号】102021211740.6
(32)【優先日】2021-10-18
(33)【優先権主張国・地域又は機関】DE
(81)【指定国・地域】
(71)【出願人】
【識別番号】591245473
【氏名又は名称】ロベルト・ボッシュ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
(74)【代理人】
【識別番号】100177839
【氏名又は名称】大場 玲児
(74)【代理人】
【識別番号】100172340
【氏名又は名称】高橋 始
(74)【代理人】
【識別番号】100182626
【氏名又は名称】八島 剛
(72)【発明者】
【氏名】エルデン,ミヒャエル
(72)【発明者】
【氏名】シュトゥム,マルコ
(72)【発明者】
【氏名】シャルバク,ラミ
(72)【発明者】
【氏名】クラウス,ヨナス
【テーマコード(参考)】
3D246
【Fターム(参考)】
3D246BA02
3D246DA01
3D246EA05
3D246GA22
3D246GB01
3D246GC14
3D246HA03A
3D246HA13A
3D246HA44A
3D246HA67A
3D246HA72A
3D246HA86A
3D246HA95A
3D246JB10
3D246JB21
3D246LA02Z
3D246LA15Z
3D246LA16Z
(57)【要約】
本発明は、車両のアンチスリップコントロールを自動式に適合化する方法に関し、当該方法は、次の各ステップを含む:車両(F)の最新の状態をそれぞれ示唆する車両(F)の最新の状態変数(Z)が受信され;受信された最新の状態変数(Z)をベースとしてアンチスリップコントローラ(20)により制御動作(A)が決定され、制御動作(A)は制御量の引き上げ、維持、または引き下げを含み、制御量は車両(F)のモータのトルクおよび/または車両(F)のブレーキシリンダの圧力を含み;値マトリクス(M)を利用したうえで制御量の制御勾配(GT,GP)が決定され、値マトリクス(M)はそれぞれ車両(F)の最新の値マトリクス・状態変数に割り当てられる多数のパラメータ(P)を含み、制御勾配(GT,GP)は最新の値マトリクス・状態変数に依存して多数のパラメータ(P)から選択され、最新の状態変数(Z)は最新の値マトリクス・状態変数を含み;車両(F)のアンチスリップコントロールが実行され、決定された制御動作に応じて決定された制御勾配だけ制御量が適合化され;観察される時間にわたってアンチスリップコントロールの実行による最新の状態変数の変化(ΔS)が決定され;最新の状態変数の決定された変化(ΔS)に依存して、事前に規定されている少なくとも1つの学習規則(L)がトリガされることによって値マトリクス(M)の少なくとも1つのパラメータ(P)が適合化される。
【選択図】
図1
【特許請求の範囲】
【請求項1】
車両のアンチスリップコントロールを自動式に適合化する方法において、次の各ステップを含み、
前記車両(F)の最新の状態をそれぞれ示唆する前記車両(F)の最新の状態変数(Z)が受信され、
受信された最新の状態変数(Z)をベースとしてアンチスリップコントローラ(20)により制御動作(A)が決定され、前記制御動作(A)は制御量の引き上げ、維持、または引き下げを含み、制御量は前記車両(F)のモータのトルクおよび/または前記車両(F)のブレーキシリンダの圧力を含み、
値マトリクス(M)を利用したうえで制御量の制御勾配(GT,GP)が決定され、前記値マトリクス(M)はそれぞれ前記車両(F)の最新の値マトリクス・状態変数に割り当てられる多数のパラメータ(P)を含み、前記制御勾配(GT,GP)は最新の値マトリクス・状態変数に依存して多数の前記パラメータ(P)から選択され、前記最新の状態変数(Z)は最新の値マトリクス・状態変数を含み、
前記車両(F)のアンチスリップコントロールが実行され、決定された制御動作に応じて決定された制御勾配だけ制御量が適合化され、
観察される時間にわたってアンチスリップコントロールの実行による最新の状態変数の変化(ΔS)が決定され、
最新の状態変数の決定された変化(ΔS)に依存して、事前に規定されている少なくとも1つの学習規則(L)がトリガされることによって前記値マトリクス(M)の少なくとも1つのパラメータ(P)が適合化される、方法。
【請求項2】
前記車両(F)の最新の値マトリクス・状態変数は前記車両(F)のスリップ(S)とホイール加速度(Ya)とを含む、請求項1に記載の方法。
【請求項3】
少なくとも1つの学習規則(L)は観察される時間に最新の状態変数が事前に規定された限界値の分だけ特定の変化をすることによってトリガされ、前記学習規則(L)は学習値を決定し、この学習値の分だけ少なくとも1つの前記パラメータ(P)が適合化される、請求項1または2のいずれか1項に記載の方法。
【請求項4】
事前に規定される学習値が前記車両の前記ホイール加速度(Ya)に依存して適合化される、請求項2に記載の方法。
【請求項5】
学習規則は調整・学習規則(L_E)と制御・学習規則(L_R)とを含み、前記調整・学習規則(L_E)は前記スリップ(S)の調整段階(R_E)中に適用され、前記制御・学習規則(R_R)は前記スリップ(S)の前記調整段階(R_E)の後の制御中に適用される、請求項1から4のいずれか1項に記載の方法。
【請求項6】
少なくとも2つの学習規則(L1,L2)が事前に規定された相互の時間的間隔を下回っている場合に、時間的に連続する少なくとも2つの学習規則(L1,L2)がアービトレーションされることを含む、請求項1から5のいずれか1項に記載の方法。
【請求項7】
前記最新の状態変数の変化(ΔS)の評価(Ev)と、アンチスリップコントロールとの間の反応時間(t_R)が学習されることを含む、請求項1から6のいずれか1項に記載の方法。
【請求項8】
トリガされた学習規則(L)が前記最新の状態変数(Z)に依存して無視されることを含む、請求項1から7のいずれか1項に記載の方法。
【請求項9】
請求項1から8のいずれか1項に記載の方法を実施するためにセットアップされたコンピュータプログラム製品。
【請求項10】
請求項1から8のいずれか1項に記載の方法を実施するためにセットアップされた装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、車両のアンチスリップコントロールを自動式に適合化する方法、ならびにそのための装置に関する。
【背景技術】
【0002】
現代の車両は、エレクトロニックスタビリティプログラムESPシステムの機能モジュールとして、アンチスリップコントロールないし駆動スリップコントロールを含んでいる。「アンチスリップコントロール」という概念は、以下においては「駆動スリップコントロール」の概念と同義で使用し、この概念に置き換えることもできる。アンチスリップコントロールは、トラクションコントロールシステムTCSによって実行される。TCSの機能上の目的は、車両が前後方向へ発進するときに各ホイールが空転せず、そのようにして安定性、操舵性、トラクションに関わる車両要求事項を満たすことにある。従来式のコントローラストラテジーでは、物理的なベースに基づくアクチュエータ目標値(モータ/ブレーキ)に相当する走行状況を最善に調整できるようにすることが意図される。目標値決定のために、認識、見積り、モデルが必要となる。コントローラパラメータは、目標値へと理想的に近づけるための役目を果たし、アプリケーションエンジニアによって手動式に/手作業で決定されなければならない。
【0003】
しかしアプリケーションのためのTCSの最新のコントローラは、人間によって設計されている。このことは、比較的高い時間コストおよびこれに伴って高い経費と結びつく。しかも人間は、TCSのパフォーマンスに対して客観的ではない個人的影響力を持っている。さらに従来式のコントローラストラテジーは、それぞれ異なる操作/バックグラウンドについて目標が相反していると、最適解を見出すのが難しいことも示されている。最後に、車両の走行ダイナミクスは車両のバリエーションによって強い影響を受ける。そのため最善のアプリケーションには、どのような車両バリエーションにも適用できることが求められるであろう。
【0004】
したがって、自動式に適合化される車両のアンチスリップコントロールへの需要がある。
【発明の概要】
【0005】
本発明の1つの態様によると、車両のアンチスリップコントロールを自動式に適合化する方法は、次の各ステップを含む。1つのステップで、車両の最新の状態をそれぞれ示唆する車両の最新の状態変数が受信される。次のステップで、受信された最新の状態変数をベースとしてアンチスリップコントローラにより制御動作が決定され、制御動作は制御量の引き上げ、維持、または引き下げを含み、制御量は車両のモータのトルクおよび/または車両のブレーキシリンダの圧力を含む。次のステップで、値マトリクスを利用したうえで制御量の制御勾配が決定され、値マトリクスはそれぞれ車両の最新の値マトリクス・状態変数に割り当てられる多数のパラメータを含み、制御勾配は最新の値マトリクス・状態変数に依存して多数のパラメータから選択され、最新の状態変数は最新の値マトリクス・状態変数を含む。次のステップで、車両のアンチスリップコントロールが実行され、決定された制御動作に応じて決定された制御勾配だけ制御量が適合化される。次のステップで、観察される時間にわたってアンチスリップコントロールの実行による最新の状態変数の変化が決定される。次のステップで、最新の状態変数の決定された変化に依存して、事前に規定されている少なくとも1つの学習規則がトリガされることによって値マトリクスの少なくとも1つのパラメータが適合化される。
【0006】
ここで使用する「状態変数」という概念は、車両の状態に関する情報を含む変数を表す。状態変数は、車両のセンサから提供されるのが好ましい。状態変数は、スリップ、ホイール加速度、モータのトルク、ブレーキシリンダの圧力、ブレーキペダル位置ないし進んだペダルストローク、車両の操舵角、車両の左右方向加速度、および車両の速度を含むのが好ましい。
【0007】
ここで使用する「値マトリクス・状態変数」という概念は、値マトリクスによって反映される、車両の状態変数の集合を表す。換言すると、値マトリクス・状態変数は車両の状態変数を含んでいて、これらの状態変数に値マトリクスによってパラメータが割り当てられ、さらにこれらのパラメータをベースとして制御勾配が決定される。
【0008】
ここで使用される「制御勾配」という概念は、制御量に適用される勾配を表す。換言すると制御勾配は、アンチスリップコントロールによって制御量がどれだけの量だけ変更されるべきかを表す。
【0009】
ここで使用される「制御量」という概念は、アンチスリップコントロールによって制御されるべき量を表す。アンチスリップコントロールでは、車両のモータおよび/または車両のブレーキが制御されることによって、スリップを低減するよう試みられるのが好ましい。したがって制御量は、すなわち制御される量は、車両のモータのトルクおよび/または車両のブレーキシリンダの圧力であることが判明する。
【0010】
ここで使用される「学習規則」という概念は、車両の最新の状態変数をベースとしたうえで、値マトリクスの1つまたは複数のパラメータが、特にいわゆる学習値の大きさに関して、どのように変更されるべきかを定義する規則を表す。換言すると学習規則は、最新の状態変数と学習値との依存性を表す。
【0011】
ここで使用される「値マトリクス」という概念は、一般に、少なくとも1つの入力値への、少なくとも1つの出力値の割当を表す。このケースでは入力値は、ここでは値マトリクス・状態変数と呼ばれる車両の最新の状態変数である。換言すると値マトリクスは、入力値の各々の組み合せに少なくとも1つの出力値を割り当てる。このように値マトリクスは多数のパラメータを含み、各々のパラメータが車両の最新の状態変数の組み合せに割り当てられる。値マトリクスの多数のパラメータのうち、値マトリクスに入力として提供された最新の状態変数の組み合せに割り当てられたパラメータが、いわゆる制御勾配を表す。したがって制御勾配は値マトリクスの出力であり、すなわち、アンチスリップコントロールの際に制御量が変更されるベースとなるパラメータである。各々の制御動作について、独自の値マトリクスが設けられるのが好ましい。換言すると、制御量の引き上げについては、同一の制御量の引き下げとは別の値マトリクスが設けられる。
【0012】
このように、たとえば後輪駆動部を有する車両では6つの値マトリクスがインプリメントされる。具体的には、モータのモータトルクを引き上げるための第1の値マトリクス、モータのモータトルクを引き下げるための第2の値マトリクス、車両の第1の後輪のブレーキシリンダの圧力を引き上げるための第3の値マトリクス、車両の第1の後輪のブレーキシリンダの圧力を引き下げるための第4の値マトリクス、車両の第2の後輪のブレーキシリンダの圧力を引き上げるための第5の値マトリクス、および、車両の第2の後輪のブレーキシリンダの圧力を引き下げるための第6の値マトリクスである。
【0013】
万一、車両が複数のモータを有している場合、たとえばホイールハブモータの場合、モータコントローラについての値マトリクスの数が、すなわち各々のモータについてトルクを引き上げるための値マトリクスとトルクを引き下げるための値マトリクスが、相応に乗算される。
【0014】
同様のことは、駆動されるホイール/アクスルの数にも当てはまる。換言すると、ブレーキを有する各々のホイールに2つの値マトリクスが、すなわちブレーキトルクを引き上げるための値マトリクスとブレーキトルクを引き下げるための値マトリクスが、割り当てられる。
【0015】
相応のコントローラが最新のコントロールの強化を要求している場合、または最新のコントロールの緩和を要求している場合、それぞれ異なる値マトリクスが適用されるのが好ましい。たとえば、トルクが現在低下しているときにコントローラがトルクの上昇を要求しているケースについて、および、トルクが現在すでに上昇しているときにコントローラがトルクの上昇を要求しているケースについて、それぞれ2つの異なる値マトリクス(トルクの引き上げと引き下げ)が適用される。
【0016】
観察されるべき時間は、200msの時間を含むのが好ましい。アンチスリップコントロールの実行による最新の状態変数の変化が観察される、観察されるべき時間は、各々の学習規則について相違していてよい。
【0017】
たとえばアンチスリップコントローラは、まだテスト段階の間に大部分が最適化され、すなわち値マトリクスのパラメータが適合化される。すなわち、たとえば最適化の90%をまだ車両の納品前に行うことができ、残りの10%を車両の作動時に再最適化することができる。
【0018】
このようにして、自動式のアルゴリズムによってアンチスリップコントロールが学習規則をベースとして調節される。
【0019】
提案される方法は、アンチスリップコントロールを最適化するための客観的な規則を導入し、それによって人間の影響が最小化される。
【0020】
さらに、提案される方法は、さまざまな車両バリエーションに合わせたアンチスリップコントローラの迅速で個別的な適合化を可能にする。
【0021】
提案される方法を実施するアンチスリップコントローラにノウハウが主として含まれているので、アンチスリップコントロールを最適化するために、さほど高い能力を備えていない人員しか必要ない。
【0022】
最終的に、提案される方法は、比較的少ない時間コストでアンチスリップコントロールを最適化することを可能にする。
【0023】
好ましい実施形態では、車両の最新の値マトリクス・状態変数は車両のスリップとホイール加速度とを含む。
【0024】
値マトリクスは二次元の値マトリクスを含むのが好ましく、すなわち、2つの入力値の組み合せに1つのパラメータを割り当てる値マトリクスを含む。たとえば値マトリクスは、車両のスリップとホイール加速度との多数の組み合せに、特に制御勾配を表すそれぞれ1つのパラメータを割り当てる。
【0025】
原則として3次元または多次元の値マトリクスも考えられるが、2次元の値マトリクスでは、値マトリクスの複雑性と、アンチスリップコントロールに対するパフォーマンス影響とが好ましく調和する。
【0026】
好ましい実施形態では、少なくとも1つの学習規則は観察される時間に最新の状態変数が事前に規定された限界値の分だけ特定の変化をすることによってトリガされ、学習規則は学習値を決定し、この学習値の分だけ少なくとも1つのパラメータが適合化される。
【0027】
換言すると学習規則は、チェックされるべき各々の状態変数についての限界値を含み、特に、下側の限界値と上側の限界値とを含む。それぞれの状態変数についての限界値を上回ると、ないしは下回ると、学習規則が実行され、または換言するとトリガされる。学習規則は、学習規則によって定義される条件に応じて、値マトリクスの少なくとも1つのパラメータが変更されるべき学習値を出力する。
【0028】
ここで使用される「学習値」という概念は、その分だけ値マトリクスの少なくとも1つのパラメータが変更されるべき値を表す。学習値は10%の値に事前に規定されるのが好ましい。換言すると10%の学習値とは、値マトリクスの少なくとも1つのパラメータが、それぞれのパラメータの最新の値の10%だけ引き上げられ、ないしは引き下げられることを意味する。このとき学習値は、そのパラメータが指定された値だけ引き上げられるのか、それとも引き下げられるかの情報を含むのが好ましい。
【0029】
少なくとも1つの学習規則は機械学習モデルの一部であるのが好ましく、機械学習モデルは強化学習モデルを含み、最新の状況が観察されて、コントローラの以前の動作が評価される。機械学習モデルは、最新の状態変数の特定の変化に応じて少なくとも1つの学習規則を適合化するようにセットアップされるのが好ましい。特に、少なくとも1つの学習規則の適合化は、事前に規定された限界値および/または学習値の適合化を含む。
【0030】
好ましい実施形態では、事前に規定された学習値は、車両のホイール加速度に依存して適合化される。
【0031】
ホイール加速度は、ホイールダイナミクスまたはアクスルダイナミクスとも呼ばれる。
【0032】
学習値を適合化することができる学習値の範囲は5%から30%の間であるのが好ましい。小さすぎる学習値は、走行挙動に関する変更が小さくなるので、不必要に多い回数の反復が学習のために必要となることにつながり得る。大きすぎる学習値は、コントロールの最適化を正確に調節できないことにつながり得る。というのも当該パーセンテージで変更をすることが、それを妨げるからである。
【0033】
学習値が当初に10%に規定されると、アクスルダイナミクスに対する、および5~30%の学習値の可変の大きさに対する、学習値の依存性が、学習中のいっそう改善されたいっそう迅速な結果につながることが確認されている。
【0034】
たとえば1つの学習規則は、-2.75のアクスルダイナミクスのもとで、すなわちアクスルの中程度の強さの減速のもとで、20%の学習値によるパラメータの変更がトリガされることを意味する。
【0035】
たとえば別の学習規則は、1.5のアクスルダイナミクスのもとで、すなわちアクスルの軽微な加速度のもとで、-15%の学習値によるパラメータの変更がトリガされることを意味する。
【0036】
好ましい実施形態では、学習規則は調整・学習規則と制御・学習規則とを含み、調整・学習規則はスリップの調整段階中に適用され、制御・学習規則はスリップの調整段階後の制御中に適用される。
【0037】
調整・学習規則は、アンチスリップコントロールの調整挙動全体だけを観察するのが好ましい。あらゆるコントローラと同じくアンチスリップコントロールも、通常はコントローラの以後の制御挙動とは相違する調整挙動を有する。この理由により調整挙動については、特別な調整・学習規則が利用される。調整挙動は、制御されるべきスリップが第1の学習規則の適用後に目標スリップを突破するまでの、アンチスリップコントロールの時間領域として定義されるのが好ましい。その代替として調整挙動は、スリップが目標値の近傍で事前に規定された時間のあいだとどまるまでの時間領域として定義される。さらに代替として調整挙動は、目標値を中心とするスリップの振幅が事前に規定された限界値を下回っている時間領域として定義される。たとえば初期のアンチスリップコントロールによって、学習規則をトリガする目標スリップの最小の限界値よりもスリップが低下する。アンチスリップコントロールに基づいてスリップが目標スリップの最大の限界値を突破すると、ただちに調整段階が終了して本来のスリップの制御が開始される。
【0038】
調整・学習規則の1つの例は、アクスルが駆動スリップの状態ではなくなる、調整段階におけるいわゆる「OnRef」状況である。したがって、コントローラがスリップを強く低減しすぎている。したがって調整・学習規則は、モータトルクを引き下げるための値マトリクスと、ブレーキ圧を引き上げるための値マトリクスとを適合化して、値マトリクスのパラメータが10%だけ引き下げられるようにし、すなわち学習値は-10%である。パラメータ値の引き下げは、次回にこの状態のもとで低すぎるスリップを防止するためのものである。さらに学習規則は、モータトルクを引き上げるための値マトリクスと、ブレーキ圧を引き下げるための値マトリクスとを適合化して、値マトリクスのパラメータが10%だけ引き上げられるようにし、すなわち学習値は10%である。パラメータ値の引き上げは、次回にこの状態のもとで低すぎるスリップを防止するためのものである。
【0039】
調整・学習規則のさらに別の例は、ホイールダイナミクスが、すなわちホイール加速度が、定義された時間のあいだ、たとえば80msのあいだ、引き下げられてから、目標スリップに達することなく引き上げられる状況である。したがって調整・学習規則は、モータトルクを引き下げるための値マトリクスと、ブレーキ圧を引き上げるための値マトリクスとを適合化して、値マトリクスのパラメータが10%だけ引き上げられるようにし、すなわち学習値は10%である。パラメータ値の引き上げは、次回にこの状態のもとで恒常的に高すぎるスリップを防止するためのものである。さらに学習規則は、モータトルクを引き上げるための値マトリクスと、ブレーキ圧を引き下げるための値マトリクスとを適合化して、値マトリクスのパラメータが10%だけ引き下げられるようにし、すなわち学習値は-10%である。パラメータ値の引き下げは、次回にこの状態のもとで、発進時にいっそう低いスリップを実現することを可能にするためのものである。
【0040】
調整・学習規則のさらに別の例は、ホイールダイナミクスが、すなわちホイール加速度が、定義された時間のあいだ、たとえば200msのあいだ、引き下げられていない状況である。したがって調整・学習規則は、モータトルクを引き下げるための値マトリクスと、ブレーキ圧を引き上げるための値マトリクスとを適合化して、値マトリクスのパラメータが10%だけ引き上げられるようにし、すなわち学習値は10%である。パラメータ値の引き上げは、次回にこの状態のもとで恒常的に高すぎるスリップを防止するためのものである。
【0041】
調整段階でアンチスリップコントロールが実行されることによる最新の状態変数の変更は、調整段階全体を通じて決定され、そのようにして評価されるのが好ましい。そのようにして比較的長く続くコントロールでも、換言すると動作段階でも、観察して学習することができる。たとえば引き上げ段階は、モータが追随できない程非常に大規模である。したがって、その前に位置する引き下げ段階も適合化される。
【0042】
制御・学習規則の1つの例は、観察されるべき時間領域でスリップ目標の最小の限界値を下回っている状況、特に目標より3.5%を超えて低いスリップの状況である。したがって制御・学習規則は、モータトルクを引き上げるための値マトリクスと、ブレーキ圧を引き下げるための値マトリクスとを適合化して、値マトリクスのパラメータが10%だけ引き上げられるようにし、すなわち学習値は10%である。パラメータ値の引き上げは、次回にこの状態のもとで低すぎるスリップを防止するためのものであり、それは、直近の制御動作がスリップを引き上げるためのものである場合に、これがスリップを過度に弱く引き上げていたことに起因する。したがって、その代替として制御・学習規則は、モータトルクを引き下げるための値マトリクスと、ブレーキ圧を引き上げるための値マトリクスとを適合化して、値マトリクスのパラメータが10%だけ引き下げられるようにし、すなわち学習値は-10%である。パラメータ値の引き下げは、次回にこの状態のもとで低すぎるスリップを防止するためのものであり、それは、直近の制御動作がスリップを引き下げるためのものである場合に、これがスリップを強く引き下げすぎていたことに起因する。
【0043】
制御・学習規則のさらに別の例は、最大の限界値を上回っている状況であり、特に7%よりも高いスリップの状況である。したがって制御・学習規則は、モータトルクを引き上げるための値マトリクスと、ブレーキ圧を引き下げるための値マトリクスとを適合化して、値マトリクスのパラメータが10%だけ引き下げられるようにし、すなわち学習値は-10%である。パラメータ値の引き下げは、次回にこの状態のもとで高すぎるスリップを防止するためのものであり、それは、直近の制御動作がスリップを引き上げるためのものである場合に、これがスリップを強く引き上げすぎていたことに起因する。したがって、その代替として制御・学習規則は、モータトルクを引き下げるための値マトリクスと、ブレーキ圧を引き上げるための値マトリクスとを適合化して、値マトリクスのパラメータが10%だけ引き上げられるようにし、すなわち学習値は10%である。パラメータ値の引き上げは、次回にこの状態のもとで高すぎるスリップを防止するためのものであり、それは、直近の制御動作がスリップを引き下げるためのものである場合に、これがスリップを過度に弱く引き下げていたことに起因する。
【0044】
制御・学習規則のさらに別の例は、観察される時間で1つのスリップ状態が、すなわち目標スリップの最大の限界値よりも上の最新のスリップが、または目標スリップの最小の限界値よりも下の最新のスリップが、変わらずに保たれている状況である。このことは、コントローラの所望の動作の小さすぎる変化を、すなわちスリップの増大または低減を、示唆しており、そのために車両が良好に制御されていない。したがって制御・学習規則は、値マトリクスの相応のパラメータを引き上げる。
【0045】
制御・学習規則のさらに別の例は、たとえば1200rpmの低すぎる回転数のもとでのモータのストールを防止するという全般的な要請である。したがって制御・学習規則は状態変数「モータの回転数」をベースとして、モータトルクを引き下げるための値マトリクスと、ブレーキ圧を引き上げるための値マトリクスとを適合化して、値マトリクスのパラメータが10%だけ引き下げられるようにし、すなわち学習値は-10%である。パラメータ値の引き下げは、次回にこの状態のもとで低すぎる回転数を回避するためのものであり、それは、直近の制御動作が回転数を強く引き下げすぎていたことに起因する。その代替として、制御・学習規則が、モータトルクを引き上げるための値マトリクスと、ブレーキ圧を引き下げるための値マトリクスとを適合化して、値マトリクスのパラメータが10%だけ引き上げられるようにし、すなわち学習値は10%である。パラメータ値の引き上げは、次回にこの状態のもとで低すぎる回転数を回避するためのものであり、それは、直近制御動作が回転数を強く引き下げすぎていたことに起因する。
【0046】
好ましい実施形態では、本方法は次のステップを含む:少なくとも2つの学習規則が事前に規定された相互の時間的間隔を下回っている場合に、時間的に連続する少なくとも2つの学習規則がアービトレーションされる。
【0047】
パラメータが引き上げられ、引き続いて引き下げられることがしばしば行われ、またはこの逆が行われる。パラメータの引き上げと引き下げが時間的に非常に接近して、たとえば150ms以内に、相次いで生じると、第1の学習が第2の学習を阻害することになる。したがってこのようなシナリオについては、学習規則のアービトレーションが適用されなければならない。
【0048】
アービトレーションは、時間的に早いほうの学習規則が無視されることを含む。というのも、第2の学習規則のほうが、最新の情報および/または多くの情報を有しているからである。その代替としてアービトレーションは、両方の学習規則が無視されることを含む。その代替としてアービトレーションは、時間的に第2の学習規則のトリガから遠く離れて位置している領域に対してのみ、時間的に第1の学習規則が適用されることを含む。
【0049】
このようにアンチスリップコントロールのアービトレーションは、それぞれ異なる操作および/またはバックグラウンドに関わる要求事項を考慮することを可能にする。
【0050】
好ましい実施形態では、本方法は次のステップを含む:最新の状態変数の変化の評価と、アンチスリップコントロールとの間の反応時間が学習される。
【0051】
反応時間とは、観察されるべき時間における、判断すなわち最終的な学習規則のトリガと、それぞれの原因すなわち状態変数の変化との間の時間的な遅延を表す。車両および/またはモータバリエーションに応じて、最適化されたアンチスリップコントロールのための反応時間がそれぞれ相違する。
【0052】
反応時間は、比較的高い目標が設定され、当該目標が最新のモータによっていつ達成されるかを観察することによって決定されるのが好ましい。
【0053】
モータのそれぞれ異なる回転数のもとで、複数の反応時間が決定されるのがさらに好ましい。というのもモータ特性曲線が、それぞれ異なる挙動を引き起こし得るからである。
【0054】
好ましい実施形態では、本方法は次のステップを含む:トリガされた学習規則が最新の状態変数に依存して無視される。
【0055】
たとえば状態変数の目標ゾーンの、特に目標スリップまたは目標トルクを中心として20%の学習規則は無視される。
【0056】
本発明の別の態様では、ここで説明される方法を実施するためにセットアップされたコンピュータプログラム製品が提供される。
【0057】
本発明の別の態様では、ここで説明される方法を実施するためにセットアップされた装置が提供される。
【0058】
本発明を改良するその他の方策については、以下において本発明の好ましい実施例の説明とともに、図面を参照しながら詳しく説明する。
【図面の簡単な説明】
【0059】
【
図1】値マトリクスを用いるアンチスリップコントロールを示す模式図である。
【
図3】車両の多数の値マトリクスを示す模式図である。
【
図4】アンチスリップコントロールを適合化する方法を示す模式図である。
【
図5】アンチスリップコントロールにおける学習規則を示す模式図である。
【
図6】学習値のダイナミックな適合化を示す模式図である。
【
図7】それぞれの学習規則の間でのアービトレーションを示す模式図である。
【
図8】両方のアンチスリップコントロールの反応時間の学習を示す模式図である。
【発明を実施するための形態】
【0060】
図1は、値マトリクスを用いるアンチスリップコントローラ10の模式図である。アンチスリップコントローラは、制御量であるモータのトルクをモータ制御部CMによって、およびブレーキシリンダの圧力をブレーキ制御部CBによって、制御することで車両のスリップを制御する。アンチスリップコントローラ10は、第1の状態定義ユニット20aをモータ制御部CMに有するとともに、第2の状態定義ユニットをブレーキ制御部CB 20bに有し、これらはそれぞれ車両の最新の状態変数Zを提供する。状態変数Zは、たとえばスリップS、モータ回転数n、アクスルダイナミクスYa、モータの最新のトルク、および時間を含む。さらに制御相互動作ユニット30が、アンチスリップコントローラ10の最新のコントロールRを提供する。特にアンチスリップコントローラ10は、第1の制御動作決定ユニット40aをモータ制御部CMに有するとともに、第2の制御動作決定ユニット40bをブレーキ制御部CBに有する。第1の制御動作決定ユニット40aと第2の制御動作決定ユニット40bは、特に決定された状態変数Zおよび選択的に最新のコントロールRをベースとして制御動作Aを決定する。制御動作Aは、相応の制御量の引き上げ、維持、または引き下げのいずれかを含む。
【0061】
さらにアンチスリップコントローラ10は、値マトリクスMa,Mbをモータ制御部CMとブレーキ制御部CBに含んでいる。制御されるべき各々の部材について値マトリクスが意図される。たとえばモータについて値マトリクスが割り当てられ、後輪駆動の場合には両方の後輪の各々についてそれぞれ別個の値マトリクスがそれぞれのブレーキシリンダについて割り当てられる。このケースでは3つの値マトリクスが必要となる。
図1は、簡略化した形態で、モータ制御部Cmについての第1の値マトリクスMaと、ブレーキ制御部についての第2の値マトリクスMbだけを示している。最新の状態変数Zは、スリップSとホイール加速度Yaとを含む。これら両方の状態変数Zに、第1の値マトリクスMaと第2の値マトリクスMbがそれぞれ制御勾配GMおよびGPを割り当てる。特に、第1の値マトリクスMaはトルク制御勾配GMを決定し、第2の値マトリクスMbは圧力制御勾配GPを決定する。第1の値マトリクスMaと第2の値マトリクスMbは、それぞれ制御量の引き上げと制御量Aの引き下げのために利用される2つの値マトリクスをそれぞれ含んでいる。
【0062】
アンチスリップコントローラ10は、制御動作制御部50aをモータ制御部CMに含むとともに、第2の制御動作制御部50bをブレーキ制御部CBに含んでいる。第1の制御動作制御部50aは、決定された制御動作Aと決定されたトルク制御勾配GMをベースとして目標トルクMTを決定する。第2の制御動作制御部50bは、決定された制御動作Aと決定された圧力制御勾配GPをベースとして目標圧力PTを決定する。
【0063】
このようにしてアンチスリップコントローラ10は、値マトリクスMa,Mbを利用したうえで、目標スリップを実現するために車両のモータおよび/またはブレーキを制御する。
【0064】
図2は、二次元の値マトリクスMの模式図である。値マトリクスMは、車両の最新のホイール加速度Yaに対する車両の最新のスリップSを、事前に規定された離散的なステップで表現する。このケースでは値マトリクスMは100個のエントリを含み、10個の考えられる離散的なスリップ値Sと、10個の考えられる離散的なホイール加速度Yaが各々の組み合せで表示されている。したがって最新のスリップSが、値マトリクスの中でもっとも近くに位置するスリップのエントリの1つに割り当てられる。同様のことがホイール加速度Yaにも当てはまる。値マトリクスMのこれらの各々のエントリをパラメータPと呼ぶ。各々のパラメータPは、考えられる制御勾配に関する、すなわち少なくとも1つの制御量の変化に関する、情報を含んでいる。このケースでは、値マトリクスMはモータトルクの制御のために利用される。最新のスリップSと最新のホイール加速度Yaとからなる1つの組み合わせが、パラメータ33に割り当てられている。パラメータ33は、制御されるべきモータトルクの変化に関する情報を含んでおり、すなわち、換言するとトルク制御勾配GMを含んでいる。
【0065】
図3は、車両の多数の値マトリクスの模式図である。モータと後輪駆動部とを有する車両の一例が示されている。
【0066】
したがって、モータ制御部CMは第1の値マトリクスM_Mincを含んでおり、これはトルク引き上げが決定されたケースにおいて、スリップSすなわち車両の全体スリップを、およびホイール加速度Yaを、トルク制御勾配GMに割り当てる。さらにモータ制御部Cmは、第2の値マトリクスM_Mdecを含んでおり、これはトルク引き下げが決定されたケースにおいて、車両のスリップSを、およびホイール加速度Yaを、トルク制御勾配GMに割り当てる。
【0067】
後輪駆動部により、アンチスリップコントロールのためにそれぞれの後輪の両方のブレーキシリンダが制御される。すなわちブレーキ制御部CBは第3の値マトリクスM_P1incを含んでおり、これは圧力引き上げが決定されたケースにおいて、第1の後輪S1のスリップとホイール加速度Yaとを、第1の後輪についての第1の圧力制御勾配GP1に割り当てる。さらにブレーキ制御部CBは第4の値マトリクスM_P1decを含んでおり、これは圧力引き下げが決定されたケースにおいて、第1の後輪S1のスリップとホイール加速度Yaとを、第1の後輪についての第1の圧力制御勾配GP1に割り当てる。さらにブレーキ制御部CBは第5の値マトリクスM_P2incを含んでおり、これは圧力引き上げが決定されたケースにおいて、第2の後輪S2のスリップとホイール加速度Yaとを、第2の後輪についての第2の圧力制御勾配GP2に割り当てる。さらにブレーキ制御部CBは第6の値マトリクスM_P2decを含んでおり、これは圧力引き下げが決定されたケースにおいて、第2の後輪S2のスリップとホイール加速度Yaとを、第2の後輪についての第2の圧力制御勾配GP2に割り当てる。
【0068】
図4は、アンチスリップコントロールを適合化する方法の模式図である。このケースでは、モータトルクの制御によるアンチスリップコントロールが示されている。すでに説明したとおり、値マトリクスMを通じてトルク制御勾配GMが決定される。トルク制御勾配GMをベースとして制御動作制御部50は目標トルクを決定し、これに合わせてアンチスリップコントローラがモータトルクを制御する。このようにして車両Fのアンチスリップコントロールが実行され、このとき制御量は、このケースではモータトルクは、決定された制御動作に応じて、決定された制御勾配GMの分だけ適合化される。引き続きアンチスリップコントローラは車両Sの最新の状態変数Sを監視し、観察される時間にわたってアンチスリップコントロールが実行されることによる最新の状態変数の変化ΔSを決定する。挙動評価ユニット60が、最新の状態変数の変化ΔSを評価する。特に、挙動評価ユニット60は事前に決定された多数の学習規則を含んでいて、これらを最新の状態変数の変化ΔSに依存してトリガすることができる。個々の学習規則は、更新された値マトリクスM_uを得るために学習値ΔPを決定し、この分だけ値マトリクスMのパラメータPが適合化される。このようにして、ダイナミックに学習される値マトリクスを提供することができ、これをベースとして、アンチスリップコントローラが最適化されたアンチスリップコントロールを実行することができる。
【0069】
図5は、アンチスリップコントロールにおける学習規則の模式図である。特に
図5は、モータの目標トルクMT、制御動作A、スリップS、およびアンチスリップコントロールの時間にわたっての目標スリップSTを示している。
図5は、調整挙動およびこれに引き続いての通常の制御を示している。換言すると
図5は、調整段階R_Eと制御段階R_Rとを示している。調整段階R_Eについては、制御段階R_Rとは異なる、トリガすることができる学習規則が意図される。さらに、調整・学習規則L_Eと制御・学習規則L_Rが時間にわたって図示されている。調整段階R_Eでは、目標トルクMTを引き上げるために作用する第1の調整・学習規則L_E1がトリガされる。第2の調整・学習規則L_E2が、制御段階R_Rでトリガされる。ただしこの第2の調整・学習規則L_E2は、調整段階R_Eでのみ関与するので無視される。制御段階R_Rでは、制御・学習規則L_Rだけが斟酌される。たとえば第1の制御・学習規則L_R1が制御段階R_Rでトリガされて、目標トルクMTの引き下げのために作用する。
【0070】
図6は、学習値のダイナミックな適合化の模式図である。この例では第1の学習規則L1がトリガされ、時間的に遅れて第2の学習規則L2がトリガされる。第1の学習規則L1がトリガされる時点で、ホイール加速度Yaは-2.75の値を有しており、第2の学習規則L2がトリガされる時点で、ホイール加速度Yaは1.5の値を有している。-2.75のホイール加速度Yaは、アクスルの中程度の強さの減速を表す。それに応じて10%の学習値に代えて、20%の学習値が適用される。換言すると、ホイール加速度Yaに基づき、値マトリクスMのパラメータPの適合化にあたって、事前に規定された10%の値だけの適合化に代えて、20%の値がダイナミックに適用される。同様に、1.5のホイール加速度Yaはアクスルの軽微な加速を表し、したがって-10%の学習値に代えて、-15%の学習値が適用される。このようにして、ホイール加速度Yaに依存して学習値の大きさがダイナミックに適合化される。
【0071】
図7は、2つの学習規則の間での、このケースでは第3の学習規則L3と第4の学習規則L4との間での、アービトレーションの模式図である。図示されているのは、スリップSの推移、スリップSがアンチスリップコントロールによって理想的な場合にその中にあるべき最大の限界値STmaxおよび最小の限界値STminを有する目標スリップSTの推移である。このケースでは、たとえば150msの比較的短い時間で、互いに相反する2つの学習規則がトリガされる。第3の学習規則L3は、スリップが過度に強く増加しいるので、スリップの低減を強めようとする。第4の学習規則L4は、スリップが過度に強く低下しているので、スリップの低減を弱めようとする。
【0072】
その意味において、両方の学習規則L3、L4がアービトレーションされなければならない。アービトレーションは、時間的に早いほうの学習規則の無視を含む。というのも第2の学習規則のほうが、いっそう最新の情報および/またはいっそう多い情報を有するからである。その代替として、アービトレーションは両方の学習規則の無視を含む。その代替としてアービトレーションは、時間的に第2の学習規則のトリガから遠く離れて位置する領域についてのみ、時間的に第1の学習規則が適用されることを含む。このようにアンチスリップコントロールのアービトレーションは、操作および/またはバックグラウンドに関わるさまざまな要求事項を考慮することを可能にする。
【0073】
図8は、アンチスリップコントロールにおける反応時間t_Rの学習の模式図である。このグラフは、第5の学習規則L5、制御動作A、スリップS、ホイール加速度Ya、および目標トルクMTを時間に対して示している。学習規則をトリガする理由Cは、ここでは両方の状態量SおよびYaからもたらされる。その結果として生じる目標トルクの学習値領域が、黄色で囲まれている。
図8は、本来の理由Cと、学習規則L5による評価Evとの間の反応時間t_Rがどれくらい長いかが、著しい影響を及ぼし得ることを示すためのものである。その意味において、最適化されたアンチスリップコントロールのためには、状態変数の変化ΔSの評価に依存して、特に機械学習モジュールを用いて、反応時間t_Rが学習されると有益である。
【符号の説明】
【0074】
20 アンチスリップコントローラ
A 最新の制御動作
Ev 評価
F 車両
GT,GP 制御勾配
L 学習規則
L_E 調整・学習規則
L_R 制御・学習規則
M 値マトリクス
P パラメータ
R_E 調整段階
R_R 制御段階
S スリップ
ΔS 最新の状態変数の変化
t_R 反応時間
Ya ホイール加速度
Z 状態変数
【手続補正書】
【提出日】2024-04-08
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
車両のアンチスリップコントロールを自動式に適合化する方法において、次の各ステップを含み、
前記車両(F)の最新の状態をそれぞれ示唆する前記車両(F)の最新の状態変数(Z)が受信され、
受信された最新の状態変数(Z)をベースとしてアンチスリップコントローラ(20)により制御動作(A)が決定され、前記制御動作(A)は制御量の引き上げ、維持、または引き下げを含み、制御量は前記車両(F)のモータのトルクおよび/または前記車両(F)のブレーキシリンダの圧力を含み、
値マトリクス(M)を利用したうえで制御量の制御勾配(GT,GP)が決定され、前記値マトリクス(M)はそれぞれ前記車両(F)の最新の値マトリクス・状態変数に割り当てられる多数のパラメータ(P)を含み、前記制御勾配(GT,GP)は最新の値マトリクス・状態変数に依存して多数の前記パラメータ(P)から選択され、前記最新の状態変数(Z)は最新の値マトリクス・状態変数を含み、
前記車両(F)のアンチスリップコントロールが実行され、決定された制御動作に応じて決定された制御勾配だけ制御量が適合化され、
観察される時間にわたってアンチスリップコントロールの実行による最新の状態変数の変化(ΔS)が決定され、
最新の状態変数の決定された変化(ΔS)に依存して、事前に規定されている少なくとも1つの学習規則(L)がトリガされることによって前記値マトリクス(M)の少なくとも1つのパラメータ(P)が適合化される、方法。
【請求項2】
前記車両(F)の最新の値マトリクス・状態変数は前記車両(F)のスリップ(S)とホイール加速度(Ya)とを含む、請求項1に記載の方法。
【請求項3】
少なくとも1つの学習規則(L)は観察される時間に最新の状態変数が事前に規定された限界値の分だけ特定の変化をすることによってトリガされ、前記学習規則(L)は学習値を決定し、この学習値の分だけ少なくとも1つの前記パラメータ(P)が適合化される、請求項1または2のいずれか1項に記載の方法。
【請求項4】
事前に規定される学習値が前記車両の前記ホイール加速度(Ya)に依存して適合化される、請求項2に記載の方法。
【請求項5】
学習規則は調整・学習規則(L_E)と制御・学習規則(L_R)とを含み、前記調整・学習規則(L_E)は前記スリップ(S)の調整段階(R_E)中に適用され、前記制御・学習規則(
L_R)は前記スリップ(S)の前記調整段階(R_E)の後の制御中に適用される、請求項
2または4のいずれか1項に記載の方法。
【請求項6】
少なくとも2つの学習規則(L1,L2)が事前に規定された相互の時間的間隔を下回っている場合に、時間的に連続する少なくとも2つの学習規則(L1,L2)がアービトレーションされることを含む、請求項1
または2または4のいずれか1項に記載の方法。
【請求項7】
少なくとも2つの学習規則(L1,L2)が事前に規定された相互の時間的間隔を下回っている場合に、時間的に連続する少なくとも2つの学習規則(L1,L2)がアービトレーションされることを含む、請求項3に記載の方法。
【請求項8】
前記最新の状態変数の変化(ΔS)の評価(Ev)と、アンチスリップコントロールとの間の反応時間(t_R)が学習されることを含む、請求項1
または2または4のいずれか1項に記載の方法。
【請求項9】
前記最新の状態変数の変化(ΔS)の評価(Ev)と、アンチスリップコントロールとの間の反応時間(t_R)が学習されることを含む、請求項3に記載の方法。
【請求項10】
トリガされた学習規則(L)が前記最新の状態変数(Z)に依存して無視されることを含む、請求項1
または2または4のいずれか1項に記載の方法。
【請求項11】
トリガされた学習規則(L)が前記最新の状態変数(Z)に依存して無視されることを含む、請求項3に記載の方法。
【請求項12】
請求項1
または2または4のいずれか1項に記載の方法を実施するためにセットアップされたコンピュータプログラム製品。
【請求項13】
請求項3に記載の方法を実施するためにセットアップされたコンピュータプログラム製品。
【請求項14】
請求項1
または2または4のいずれか1項に記載の方法を実施するためにセットアップされた装置。
【請求項15】
請求項3に記載の方法を実施するためにセットアップされた装置。
【国際調査報告】