(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2026-04-14
(45)【発行日】2026-04-22
(54)【発明の名称】自エージェントのオペレータを支援するための方法、プログラム、記憶媒体、および支援システム
(51)【国際特許分類】
B60W 30/095 20120101AFI20260415BHJP
B60W 30/188 20120101ALI20260415BHJP
B60W 40/107 20120101ALI20260415BHJP
B60W 50/14 20200101ALI20260415BHJP
G08G 1/16 20060101ALI20260415BHJP
B60W 60/00 20200101ALN20260415BHJP
【FI】
B60W30/095
B60W30/188
B60W40/107
B60W50/14
G08G1/16 C
B60W60/00
【外国語出願】
(21)【出願番号】P 2024134049
(22)【出願日】2024-08-09
【審査請求日】2024-11-08
(32)【優先日】2023-09-27
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】000005326
【氏名又は名称】本田技研工業株式会社
(74)【代理人】
【識別番号】110001081
【氏名又は名称】弁理士法人クシブチ国際特許事務所
(72)【発明者】
【氏名】プファル,ティム
【審査官】戸田 耕太郎
(56)【参考文献】
【文献】特表2020-536317(JP,A)
【文献】特表2022-524376(JP,A)
【文献】米国特許出願公開第2022/0315047(US,A1)
【文献】特開2020-015489(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
B60W 30/095
B60W 30/188
B60W 40/107
B60W 50/14
G08G 1/16
B60W 60/00
(57)【特許請求の範囲】
【請求項1】
将来の状況におけるリスクを自エージェント(4)のオペレータに伝達することによって前記オペレータを支援するための方法であって、
前記自エージェント(4)のセンサから、前記自エージェント(4)の状態に関する情報を取得するステップと、
前記取得した情報から算出した少なくとも前記自エージェント(4)の予測軌道(1,2)から生成されたリスクマップ(3、10、11)を用いた行動計画アルゴリズムを適用し、前記行動計画アルゴリズムのコスト関数において少なくともパラメータ(α、β、γ)の第1の値および前記パラメータ(α、β、γ)の第2の値を使用して、前記自エージェント(4)の少なくとも第1および第2の計画された行動(12,13)を決定するステップと、
前記取得した情報を用いて、前記自エージェント(4)の現在の状態を特定して、前記自エージェント(4)の実際の行動を決定するステップと、
少なくとも前記第1および第2の計画された行動(12,13)と前記自エージェント(4)の前記実際の行動との関係に基づいて、前記コスト関数の前記パラメータ(α、β、γ)におけるパーソナライズされたパラメータ値(α
estimated)を推定するステップであって、前記パーソナライズされたパラメータ値(α
estimated)を推定することは、前記自エージェント(4)の少なくとも前記第1および第2の計画された行動(12,13)の加速度値と前記自エージェント(4)の前記実際の行動による加速度値とを比較することによって、前記実際の行動を少なくとも前記第1および第2の計画された行動(12,13)で補間することを含むステップと、
少なくとも前記パーソナライズされたパラメータ値および前記コスト関数の前記パラメータ(α、β、γ)における目標パラメータ値の間の差異と、補正係数とに基づいて、パラメータ補正値を決定するステップと、
前記パラメータ補正値を使用して、前記パーソナライズされたパラメータ値を補正することによって、前記コスト関数の前記パラメータ(α、β、γ)の適応されたパラメータ値(α
adapted)を生成するステップと、
前記適応されたパラメータ値(α
adapted)を前記行動計画アルゴリズムに適用し、前記行動計画アルゴリズムの前記適応されたパラメータ値(α
adapted)を用いてリスクマップを生成することにより、前記将来のリスクを推定するステップと、
推定された前記将来のリスクを前記オペレータに伝達するステップと
を含む、方法。
【請求項2】
前記補正係数の値が、前記パーソナライズされたパラメータ値(α
estimated)と、前記目標パラメータ値との間の差異に基づいて決定され、及び/又は前記補正係数の値が、
前記自エージェント(4)の前記オペレータの意識が低い状態、眠気状態、又はストレス状態に基づいて適応される請求項1に記載の方法。
【請求項3】
前記パーソナライズされたパラメータ値の前記推定が、前記自エージェント(4)の動作中に繰り返し実行される、請求項1に記載の方法。
【請求項4】
前記パーソナライズされたパラメータ値が、少なくとも前記第1および第2の計画された行動(12,13)と前記自エージェント(4)の前記実際の行動との前記関係に基づいて推定された複数の実際のパラメータ値に基づいて推定される、請求項1に記載の方法。
【請求項5】
前記自エージェント(4)の以前の動作中に推定された最後のパーソナライズされたパラメータ値が、現在の動作の前記将来のリスクを推定するための前記パーソナライズされたパラメータ値として使用される、請求項1に記載の方法。
【請求項6】
前記自エージェント(4)の以前の動作中に推定された最後のパーソナライズされたパラメータ値が、前記自エージェント(4)の前記現在の動作中に推定された前記パーソナライズされたパラメータ値で更新され、更新されたパーソナライズされたパラメータ値が、前記現在の動作の前記将来のリスクを推定するための前記パーソナライズされたパラメータ値として使用される、請求項1に記載の方法。
【請求項7】
実際のパラメータ値が、少なくとも前記第1および第2の計画された行動(12,13)と前記自エージェント(4)の実際の行動との前記関係に基づいて繰り返し推定され、最新の実際のパラメータ値について信頼度尺度が算出され、最新の実際のパラメータ値の信頼度尺度が信頼度閾値を超える場合、前記最新の実際のパラメータ値が、前記パーソナライズされたパラメータ値として引き継がれる、請求項1に記載の方法。
【請求項8】
前記パラメータ(α、β、γ)の値が、ある間隔内にあり、前記間隔の下限が前記パラメータ(α、β、γ)の前記第1の値として使用され、前記間隔の上限が前記パラメータ(α、β、γ)の前記第2の値として使用される、請求項1に記載の方法。
【請求項9】
前記コスト関数が、リスク要素に加えて、有用性要素および快適性要素のうちの少なくとも一方を含み、各要素が、専用のパラメータ(α、β、γ)で重み付けされる、請求項1に記載の方法。
【請求項10】
前記方法が、前記リスク要素に関して実行され、さらに前記有用性要素および前記快適性要素のうちの少なくとも一方に関して実行される、請求項
9に記載の方法。
【請求項11】
時間の経過に伴う前記パラメータ補正値の推移が評価され、前記評価の結果に関するフィードバックが前記オペレータに提供される、請求項1に記載の方法。
【請求項12】
コンピュータまたはデジタル信号プロセッサ上で実行されたときに、
将来の状況におけるリスクを自エージェント(4)のオペレータに伝達することによって前記オペレータを支援するための方法を実行するためのプログラムコード手段を含むプログラム
であって、前記方法が、
前記自エージェント(4)のセンサから、前記自エージェント(4)の状態に関する情報を取得するステップと、
前記取得した情報から算出した少なくとも前記自エージェント(4)の予測軌道(1,2)から生成されたリスクマップ(3、10、11)を用いた行動計画アルゴリズムを適用し、前記行動計画アルゴリズムのコスト関数において少なくともパラメータ(α、β、γ)の第1の値および前記パラメータ(α、β、γ)の第2の値を使用して、前記自エージェント(4)の少なくとも第1および第2の計画された行動(12,13)を決定するステップと、
前記取得した情報を用いて、前記自エージェント(4)の現在の状態を特定して、前記自エージェント(4)の実際の行動を決定するステップと、
少なくとも前記第1および第2の計画された行動(12,13)と前記自エージェント(4)の前記実際の行動との関係に基づいて、前記コスト関数の前記パラメータ(α、β、γ)におけるパーソナライズされたパラメータ値(α
estimated
)を推定するステップであって、前記パーソナライズされたパラメータ値(α
estimated
)を推定することは、前記自エージェント(4)の少なくとも前記第1および第2の計画された行動(12,13)の加速度値と前記自エージェント(4)の前記実際の行動による加速度値とを比較することによって、前記実際の行動を少なくとも前記第1および第2の計画された行動(12,13)で補間することを含むステップと、
少なくとも前記パーソナライズされたパラメータ値および前記コスト関数の前記パラメータ(α、β、γ)における目標パラメータ値の間の差異と、補正係数とに基づいて、パラメータ補正値を決定するステップと、
前記パラメータ補正値を使用して、前記パーソナライズされたパラメータ値を補正することによって、前記コスト関数の前記パラメータ(α、β、γ)の適応されたパラメータ値(α
adapted
)を生成するステップと、
前記適応されたパラメータ値(α
adapted
)を前記行動計画アルゴリズムに適用し、前記行動計画アルゴリズムの前記適応されたパラメータ値(α
adapted
)を用いてリスクマップを生成することにより、前記将来のリスクを推定するステップと、
推定された前記将来のリスクを前記オペレータに伝達するステップと
を含む、
プログラム。
【請求項13】
将来の状況におけるリスクを自エージェント(4)のオペレータに伝達することによって前記オペレータを支援するための方法をコンピュータまたはデジタル信号プロセッサに実行させるプログラムを記憶したコンピュータ可読記憶媒体
であって、前記方法が、
前記自エージェント(4)のセンサから、前記自エージェント(4)の状態に関する情報を取得するステップと、
前記取得した情報から算出した少なくとも前記自エージェント(4)の予測軌道(1,2)から生成されたリスクマップ(3、10、11)を用いた行動計画アルゴリズムを適用し、前記行動計画アルゴリズムのコスト関数において少なくともパラメータ(α、β、γ)の第1の値および前記パラメータ(α、β、γ)の第2の値を使用して、前記自エージェント(4)の少なくとも第1および第2の計画された行動(12,13)を決定するステップと、
前記取得した情報を用いて、前記自エージェント(4)の現在の状態を特定して、前記自エージェント(4)の実際の行動を決定するステップと、
少なくとも前記第1および第2の計画された行動(12,13)と前記自エージェント(4)の前記実際の行動との関係に基づいて、前記コスト関数の前記パラメータ(α、β、γ)におけるパーソナライズされたパラメータ値(α
estimated
)を推定するステップであって、前記パーソナライズされたパラメータ値(α
estimated
)を推定することは、前記自エージェント(4)の少なくとも前記第1および第2の計画された行動(12,13)の加速度値と前記自エージェント(4)の前記実際の行動による加速度値とを比較することによって、前記実際の行動を少なくとも前記第1および第2の計画された行動(12,13)で補間することを含むステップと、
少なくとも前記パーソナライズされたパラメータ値および前記コスト関数の前記パラメータ(α、β、γ)における目標パラメータ値の間の差異と、補正係数とに基づいて、パラメータ補正値を決定するステップと、
前記パラメータ補正値を使用して、前記パーソナライズされたパラメータ値を補正することによって、前記コスト関数の前記パラメータ(α、β、γ)の適応されたパラメータ値(α
adapted
)を生成するステップと、
前記適応されたパラメータ値(α
adapted
)を前記行動計画アルゴリズムに適用し、前記行動計画アルゴリズムの前記適応されたパラメータ値(α
adapted
)を用いてリスクマップを生成することにより、前記将来のリスクを推定するステップと、
推定された前記将来のリスクを前記オペレータに伝達するステップと
を含む、
コンピュータ可読記憶媒体。
【請求項14】
将来の状況におけるリスクを自エージェント(4)のオペレータに伝達することによって前記オペレータを支援するための支援システムであって、
前記支援システムは、プログラムを実行するプロセッサと、メモリと、ディスプレイまたはスピーカと、備え、
前記プログラムを実行するプロセッサは、
前記自エージェント(4)のセンサから、前記自エージェント(4)の状態に関する情報を取得し、
前記取得した情報から算出した少なくとも前記自エージェント(4)の予測軌道(1,2)から生成されたリスクマップ(3、10、11)を用いた行動計画アルゴリズムを適用し、前記行動計画アルゴリズムのコスト関数において少なくともパラメータ(α、β、γ)の第1の値および前記パラメータ(α、β、γ)の第2の値を使用して、前記自エージェント(4)の少なくとも第1および第2の計画された行動(12,13)を決定し、
前記取得した情報を用いて、前記自エージェント(4)の現在の状態を特定して、前記自エージェント(4)の実際の行動を決定し、
少なくとも前記第1および第2の計画された行動(12,13)と前記自エージェント(4)の前記実際の行動との関係に基づいて、前記コスト関数の前記パラメータ(α、β、γ)におけるパーソナライズされたパラメータ値(α
estimated)を推定し、前記パーソナライズされたパラメータ値(α
estimated)を推定することは、前記自エージェント(4)の少なくとも前記第1および第2の計画された行動(12,13)の加速度値と前記自エージェント(4)の前記実際の行動による加速度値とを比較することによって、前記実際の行動を少なくとも前記第1および第2の計画された行動(12,13)で補間することを含み、
少なくとも前記パーソナライズされたパラメータ値および前記コスト関数の前記パラメータ(α、β、γ)における目標パラメータ値の間の差異と、補正係数とに基づいて、パラメータ補正値を決定し、
前記パラメータ補正値を使用して、前記パーソナライズされたパラメータ値を補正することによって、前記コスト関数の前記パラメータ(α、β、γ)の適応されたパラメータ値(α
adapted)を生成し、
前記適応されたパラメータ値(α
adapted)を前記行動計画アルゴリズムに適用し、前記行動計画アルゴリズムの前記適応されたパラメータ値(α
adapted)を用いてリスクマップを生成することにより、前記将来のリスクを推定し、
前記ディスプレイまたは前記スピーカにより推定された前記将来のリスクを前記オペレータに伝達する
支援システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、自エージェントのオペレータを支援する分野に関する。詳細には、自エージェントのオペレータを支援するための方法、プログラムコードを含む対応するプログラム、対応する非一過性コンピュータ可読記憶媒体、および自エージェントのオペレータを支援するための支援システムが提案される。
【背景技術】
【0002】
人々が他のエージェントも存在する環境において自エージェントを動作させる場合、一般的にエージェント間の衝突のリスクがある。交通密度はここ数年で大幅に増加しており、エージェントのオペレータが、衝突が回避され得るように環境内の他のすべてのエージェントの行動に適時に反応するために他のすべてのエージェントを観察することは非常に困難である。さらに、車両の動作中に遭遇する他のリスク、例えば、カーブリスクまたは規制リスクが存在する。最新のプロセッサの性能、および自エージェントの環境に関する情報をプロセッサに提供するレーダセンサ、カメラ、LIDARセンサなどのセンサの可用性により、オペレータによる自エージェントの動作中に自エージェントのオペレータを支援することが可能である。しかしながら、自エージェントを動作させるスタイルはオペレータごとに大きく異なる。したがって、多くの状況において、支援システムは、オペレータの注意をそらすような方法で行動を提案するか、または(例えば、半自動運転の場合)オペレータによる制御動作を妨げることさえある。
【0003】
オペレータが煩わしさを感じないように、したがってシステムによって行われる支援の許容度が高まるように、システムを個々のオペレータの行動に適応させるように試みた手法がいくつか存在する。例えば、米国特許第9,623,878(B2)号は、運転者の習慣を学習してパーソナライズされた運転者支援システムを提案している。しかしながら、提案されたシステムは、制御パラメータ、例えばACC(適応的走行制御)の目標距離を運転者の特定の運転スタイルに合わせて調整する。残念ながら、このような手法は、個々の運転スタイルを反映するが運転者の行動には影響を与えない支援システムとなる。
【0004】
自動運転または部分的自動運転用の制御信号を生成するための様々な手法が多数開発されている。手法の1つは、米国特許第9,463,797(B2)号に記載されており、この手法では、自エージェントの将来の軌道が予測され、その予測から自エージェントの複数の軌道の代替案が生成される。さらに、別のエージェントの仮想的な将来の軌道が決定され、自エージェントの軌道と別のエージェントの軌道との少なくとも1つのペアに基づいて時間の経過に伴うリスク関数が、または自エージェントの算出された仮想的な軌道に沿って代替案が、算出される。次いで、これらのリスク関数はリスクマップに組み込まれ、リスクマップはその後、分析されて、制御信号が生成される。
【0005】
米国特許第10,627,812(B2)号は、知られている支援システムの別の問題に関する。正確な予測を行うには、予測アルゴリズムで使用される環境に関する情報が正確である必要がある。しかしながら、ほとんどの情報は1つまたは複数のセンサを使用して取得されるので、交通状況を正確に評価するために関連する環境内の特定の領域が遮蔽されることがある。米国特許第10,627,812(B2)号は、センサデータの信頼性が特定の閾値を下回る領域またはセンサデータがまったく利用できない領域において仮想交通エンティティを想定することによって、このような死角のリスクを軽減し、仮想交通エンティティが自エージェントの予測された行動と相互作用できるようにする。それぞれのリスク尺度が推定され、推定されたリスク尺度が自エージェントの制御アクションに考慮される。
【0006】
米国特許出願公開第2020/0231149(A1)号は、自エージェントと少なくとも1人の他の交通参加者との間の優先関係を考慮し、交通参加者のそれぞれの予測モデルを選択することによって、自エージェントの運転者をサポートする。したがって、予測モデルの選択は、関与するエージェント間の決定された優先関係を考慮に入れ、したがって、他のエージェントの将来の行動のより厳密な予測によって支援を改善する。
【0007】
EP4068153A1は、高度な運転者支援システムについて説明しており、このシステムでは、センサから受信した情報に基づいて環境の特徴が特定され、その特徴のリスクゾーンが推定される。次いで、特徴および特徴のリスクゾーンが、マップ内の車両の環境とともにディスプレイ上に表示される。
【先行技術文献】
【特許文献】
【0008】
【文献】米国特許第9,623,878(B2)号
【文献】米国特許第9,463,797(B2)号
【文献】米国特許第10,627,812(B2)号
【文献】米国特許出願公開第2020/0231149(A1)号
【文献】欧州特許出願公開第4068153(A1)号
【発明の概要】
【発明が解決しようとする課題】
【0009】
知られている支援システムの上記で提供された例が明らかに示しているように、リスクを推定してそのリスクに関する情報をエージェントのオペレータに提供するため、またはエージェントの制御をそのオペレータの習慣に適応させるためには、いくつかの異なる手法がある。しかしながら、交通状況におけるあるエージェントの1人のオペレータのスタイルが別のエージェントのスタイルと大幅に異なる可能性があるという問題が依然として存在する。これは、特定の状況の誤った解釈につながるおそれがあり、人間のオペレータだけでなく自動化システムにとっても困難である。したがって、依然として、交通状況に関与する複数のエージェントのオペレータの動作スタイルを調和させる方法を見出す必要がある。このような調和は、予測の品質およびその信頼性を大幅に高め、交通安全性を直接的に向上させる。
【課題を解決するための手段】
【0010】
本発明では、この問題は、個々のオペレータの習慣に基づいて将来のリスクの推定を適応させることによって解決されるが、先行技術から知られているものとは対照的に、オペレータの期待に応えようとするだけでなくオペレータのスタイルと目標スタイルとの間の差異をさらに考慮することによって解決される。これは、伝達される出力が最終的にオペレータ(運転者)を目標スタイルに向けて教育するものとなるように、将来のリスクの推定を適応させることによって達成される。この目標スタイルは、例えば、平均的な運転スタイルであり、エージェントのどのオペレータにとっても目標スタイルに沿った動作が達成される場合、異なるエージェント間の運転スタイルの危険な差異が軽減され得る。
【0011】
本発明によれば、これは、推定されたリスクをオペレータに伝達することによってオペレータを支援するための方法、対応するプログラム、コンピュータ可読記憶媒体、および支援システムによって達成され、リスクの推定は、オペレータの運転習慣の分析から開始して、自エージェントの動作に影響を与えるように適応され、前記自エージェント(4)のセンサから、前記自エージェント(4)の状態に関する情報を取得し、前記取得した情報から算出した少なくとも前記自エージェント(4)の予測軌道(1,2)から生成されたリスクマップ(3、10、11)を用いた行動計画アルゴリズムを適用し、前記行動計画アルゴリズムのコスト関数において少なくともパラメータ(α、β、γ)の第1の値および前記パラメータ(α、β、γ)の第2の値を使用して、前記自エージェント(4)の少なくとも第1および第2の計画された行動(12,13)を決定し、前記取得した情報を用いて、前記自エージェント(4)の現在の状態を特定して、前記自エージェント(4)の実際の行動を決定し、少なくとも前記第1および第2の計画された行動(12,13)と前記自エージェント(4)の前記実際の行動との関係に基づいて、前記コスト関数の前記パラメータ(α、β、γ)におけるパーソナライズされたパラメータ値(α
estimated
)を推定するステップであって、前記パーソナライズされたパラメータ値(α
estimated
)を推定することは、前記自エージェント(4)の少なくとも前記第1および第2の計画された行動(12,13)の加速度値と前記自エージェント(4)の前記実際の行動による加速度値とを比較することによって、前記実際の行動を少なくとも前記第1および第2の計画された行動(12,13)で補間することを含むステップと、
少なくとも前記パーソナライズされたパラメータ値および前記コスト関数の前記パラメータ(α、β、γ)における目標パラメータ値の間の差異と、補正係数とに基づいて、パラメータ補正値を決定し、前記パラメータ補正値を使用して、前記パーソナライズされたパラメータ値を補正することによって、前記コスト関数の前記パラメータ(α、β、γ)の適応されたパラメータ値(α
adapted
)を生成し、前記適応されたパラメータ値(α
adapted
)を前記行動計画アルゴリズムに適用し、前記行動計画アルゴリズムの前記適応されたパラメータ値(α
adapted
)を用いてリスクマップを生成することにより、前記将来のリスクを推定し、推定された前記将来のリスクを前記オペレータに伝達する。例えば、目標パラメータ値および個々のオペレータについて推定されたパーソナライズされたパラメータ値を知ることにより、パーソナライズされたパラメータ値を目標パラメータ値に向けてシフトすることが可能になり、それにより、パラメータ補正値を使用してパーソナライズされたパラメータ値を補正することによって、適応されたパラメータ値を生成することが可能になる。
【0012】
3つ以上のパラメータ値を使用して、3つ以上の計画された行動を決定することも可能である。したがって、これらの3つ以上の計画された行動を使用して、例えばより良好な補間によって、パーソナライズされたパラメータ値の改善された推定が行われ得る。
【0013】
次いで、この適応されたパラメータ値は行動計画アルゴリズムに適用され、リスクが推定される。このリスクは最終的にオペレータに伝達される。したがって、オペレータに伝達されるリスクは、平均的なスタイルを有するオペレータに伝達されるリスクに、より一層対応している。リスクの推定および伝達はオペレータのスタイルを厳密に反映しなくなるため、これにより、支援されたオペレータの訓練効果がもたらされ、最終的にすべての支援されたオペレータのスタイルが調和される。
【0014】
実施形態の説明では、添付の図を参照する。
【図面の簡単な説明】
【0015】
【
図1】行動計画に使用されるコスト関数の様々な要素を示す図である。
【
図3】リスクマップに基づく行動計画とコスト関数におけるパラメータ値との関係を示す図である。
【
図4】パーソナライズされたパラメータ値を推定するプロセスのブロック図である。
【
図5】適応されたパラメータ値に基づいてリスクを伝達する出力を作成するプロセスを示す図である。
【発明を実施するための形態】
【0016】
一実施形態によれば、パーソナライズされたパラメータ値は、実際の行動を第1および第2の計画された行動で補間することを使用して推定される。パーソナライズされたパラメータ値を推定するために補間を使用することは、推定をオンラインで、すなわち自エージェントの動作中に行うことができるという利点を有する。その結果、オペレータのスタイルが変化した場合でも、ガイダンスは有効に保たれる。
【0017】
さらに、パーソナライズされたパラメータ値は、実際の行動の加速度と第1および第2の計画された行動による加速度との比較を使用して推定され得る。加速度は、自エージェントにとって容易に感知可能であり、センサ値の事前処理は不要またはほとんど不要である。これにより、計算コストが削減され、例えば車両におけるリアルタイムでの適用が改善される。
【0018】
本発明の一実施形態によれば、パラメータ補正値が、目標パラメータ値とパーソナライズされたパラメータ値との間の差異および補正係数に基づいて算出される。これは、一方では、実際の行動が目標行動とどの程度異なるかが直接的に考慮され、その結果、より大きな差が認識された場合に、より大きな補正が行われるという利点を有する。他方では、補正値は、補正がどの程度の強さであるかに関するさらなる調整を可能にする。具体的には、パーソナライズされたパラメータ値と目標パラメータ値との差異の量、およびオペレータ条件のうちの少なくとも一方に基づいて補正係数の値を決定することが可能である。したがって、実際の行動と目標行動との間の差異、および一定の補正係数から開始して、さらに多くの態様を考慮に入れることができる。
【0019】
別の有利な実施形態によれば、パーソナライズされたパラメータ値の推定は、自エージェントの動作中に繰り返し実行される。パーソナライズされたパラメータ値を繰り返し推定することにより、自エージェントの動作中に変化し得る実際の行動に合わせて補正を調整することが可能になる。
【0020】
一方、第1および第2の計画された行動と自エージェントの実際の行動との関係に基づいて推定された複数の実際のパラメータ値に基づいて、パーソナライズされたパラメータ値を推定することが好ましい場合がある。複数の実際のパラメータ値を考慮することにより、推定された実際のパラメータ値が変化するたびにパーソナライズされたパラメータ値がこの変化に従うことが回避される。例えば、一定数の実際のパラメータ値から移動平均を算出することができ、またはヒステリシスを適用して、推定された実際のパラメータ値の小さな変化をフィルタリングすることができる。その場合、オペレータのスタイルの大幅な変化が認識された場合にのみ、パーソナライズされたパラメータ値が更新される。
【0021】
別の好ましい実施形態によれば、自エージェントの以前の動作中に推定された最後のパーソナライズされたパラメータ値が、現在の動作のリスク推定のためのパーソナライズされたパラメータ値として使用される。開始点が、自エージェントの以前の動作中に推定されたパーソナライズされたパラメータ値である場合、自車両の以前の動作中に推定された最後のパーソナライズされたパラメータ値を、自車両の現在の動作中に推定されたパーソナライズされたパラメータ値で更新し、次いで、更新されたパーソナライズされたパラメータ値を現在の動作のリスク推定のためのパーソナライズされたパラメータ値として使用することが特に好ましい。以前に推定されたパーソナライズされたパラメータ値をこのように使用できるようにするために、システムは、最新のパーソナライズされたパラメータ値が記憶される不揮発性メモリを備える。
【0022】
実際のパラメータ値は、第1および第2の計画された行動と自エージェントの実際の行動との関係に基づいて繰り返し推定され得、最新の実際のパラメータ値について信頼度尺度が算出され得る。この最後の実際のパラメータ値の信頼度尺度が信頼度閾値を超える場合、この最後の実際のパラメータ値は、パーソナライズされたパラメータ値として引き継がれる。信頼度閾値は、例えば、パーソナライズされたパラメータ値の変化の頻度を定量化する。
【0023】
パラメータ値は、ある間隔内にあり、第1および第2の計画された行動を決定するために、間隔の下限がパラメータの第1の値として使用され、間隔の上限がパラメータの第2の値として使用される。したがって、第1および第2の計画された行動を決定するために、間隔の限界によって定義される極値が使用される場合、補間を使用して、パーソナライズされたパラメータ値を高精度で推定することが容易に可能である。補間は、実際のパラメータ値を推定するために、ステップ関数、線形関数、2つの連結された線形関数、またはシグモイド関数を使用してもよい。
【0024】
パーソナライズされたパラメータを導出するために実際のパラメータ値の処理が行われない実施形態の場合、パーソナライズされたパラメータ値および実際のパラメータ値は交換可能に使用され得ることに留意されたい。パーソナライズされたパラメータ値の推定は、実際のパラメータ値の推定と同じである。しかしながら、実際のパラメータを処理してパーソナライズされたパラメータを決定する実施形態の説明では、「パーソナライズされた」と「実際の」とは区別される。
【0025】
好ましくは、コスト関数は、リスク要素に加えて、有用性要素および快適性要素のうちの少なくとも一方を含み、各要素は、専用のパラメータで重み付けされる。複数の異なる要素を含むこのようなコスト関数を有することにより、リスクの態様だけでなく有用性または快適性などの他の態様に関しても、自エージェントのオペレータを所望の行動に向けて導くことが可能になる。このような場合、方法は、リスク要素に関して実行され、さらに有用性要素および快適性要素のうちの少なくとも一方に関して実行される。
【0026】
さらに、時間の経過に伴う補正値の推移が評価され得、評価の結果に関するフィードバックがオペレータに提供される。次いで、補正値は不揮発性メモリに記憶され、所定の時間間隔の後、または(例えばオペレータからの)要求時に、時間の経過に伴う補正値の過程の評価が行われる。
【0027】
本発明は、飛行機、ボート、マイクロモビリティロボットを含むあらゆる種類の車両、さらには歩行者に対して適用され得ることに留意されたい。ほとんどの場合、自エージェントのオペレータは、自車両の運転者、飛行機のパイロットなどである。しかしながら、オペレータはさらに、遠隔地から自エージェントを制御してもよい。
【0028】
推定および決定のステップのすべてをより詳細に説明する前に、本発明の一般的な背景、およびオペレータを教育する効果について説明する。
【0029】
オペレータが自エージェントを動作させる際のオペレータの個々のスタイルは、行動計画で使用されるコスト関数における個々の要素に重み付けする係数を使用してモデル化され得る。コスト関数は、
cost=α*risk-β*utility+γ*comfort
として記述され得る。
【0030】
パラメータα、β、およびγは、全体的なコスト関数を調整し、下限から上限までの間隔からの値を有することができる。間隔はすべてのパラメータについて同じである必要はないことに留意されたい。
図1には、パラメータが取り得る値の影響が示されている。左側には、コスト関数の第1の要素が示されており、安全性の選好を説明している。
【0031】
図1の左側には、安全性の選好が示されている。第1のパラメータαが高い値を有する場合、結果として得られるコスト関数は、リスク低下のために前もってブレーキをかけることを伴う計画された行動につながる。したがって、第1のパラメータαは、計画された行動において受け入れられるリスクを考慮する。同様に、第2のパラメータβは有用性の選好を定義し、これは、例えば、第2のパラメータβの値が高く設定される場合、それぞれ計画された行動によって高速の追い越しが可能になることを意味する。最後に、
図1の右部に示すように、第3のパラメータγは、快適性の選好に関連し、第3のパラメータγが高い値に設定される場合、実際の行動を頻繁に変更しないようにどちらかと言えば待機する計画された行動をもたらすことになる。
【0032】
一方、コスト関数、および所与のパラメータを用いたコスト関数を使用して行動計画アルゴリズムが実行されたときの結果として得られる計画された行動により、オペレータの動作スタイルをモデル化することが可能になる。したがって、元々は3つのパラメータの値は、特定の状況における行動がどのように計画されるかを定義するが、自エージェントの観察された実際の行動から、オペレータの習慣およびスタイルを説明する対応するパラメータ値を決定することも可能である。例えば、第1のパラメータαは、オペレータ(自エージェント)が他のエージェントにどれだけ近くに接近しているか、またはオペレータが他のエージェントにどれだけ長く近づいているかを説明する。第2のパラメータβは、オペレータが目的地にどの程度の速さで到着したいか、またはオペレータがどの程度の頻度で車線を変更するかを説明する。最後に、第3のパラメータγは、オペレータがどの程度の頻度で加速もしくは減速しているか、または加速もしくは減速がどの程度の強さであるかを説明する。
【0033】
図2は、リスクマップが行動計画にどのように使用されるかの原理を示している。自エージェントおよび別のエージェントの予測される軌道1、2に基づいて、例えばセンサの不確実性から生じ得る空間および時間の不確実性に対するガウス分布ならびにポアソン分布を考慮すると、速度vが時間の経過とともに提示されたリスクマップ3が作成され得る。
図2の右側は、自エージェント4および別のエージェント5の交差している軌道1、2、ならびに自エージェント4および別のエージェント5の位置のそれぞれの分布を時間の経過とともに、すなわち軌道1、2に沿って示している。エージェント4、5の位置のこれらの時間の経過に伴う分布により、エージェント間の予測される衝突の領域6を決定することが可能になる。この予測される衝突は、
図2の左側に示すリスクマップ3に含まれており、リスクに加えて、自エージェント4のリスクの回避方法も含まれている。この図示では、自エージェントの減速7を実行することによって衝突が回避され得る。
【0034】
行動計画とは別に、リスクマップは、警告を作成し、特定されたリスクを自エージェントのオペレータに伝達するためにも使用されることに留意されたい。このようなリスクの伝達または警告の出力、およびリスクマップを用いた行動計画は、当技術分野で知られている。
【0035】
軌道は、エージェントによって搭載または携帯されたセンサから取得される車両状態に関する情報を使用して、知られている方式で算出される。この情報は、エージェント間情報によって強化され得る。取得された情報はプロセッサによって処理され、プロセッサは、上記で説明された計画のための計算ステップだけでなく、本発明に関しては、推定、補正、および以下で説明する他のすべての計算も実行する。
【0036】
以下の説明では、「リスク」という態様が主に説明に使用される。しかしながら、これらの説明は、「有用性」および/または「快適性」という要素のパーソナライズされたパラメータ値β、γを推定する場合にも同様に有効である。
【0037】
パーソナライズされたパラメータ値は、上記で説明したように行動プランナで使用されるリスクマップに基づいて、以下に与えられるコスト関数から推定され得る。
【0038】
前に説明したように、3つのパラメータの値によって、計画される行動は異なる。第1のパラメータαは、特に、別のエージェントが関与している場合の衝突のリスクに関するものである。
図3の上部に示すように、これはリスクゾーンのサイズの尺度として理解され得る。第1のパラメータαの値が小さいほど、リスクゾーンのサイズは小さくなり、その逆も同様である。
【0039】
図3の中央には、第2のパラメータβの値の影響が示されている。これは、第2のパラメータβの値が目標速度に影響を与えるので、自エージェント4が単独でいる状況に関するものである。同様に、第3のパラメータγの値は加速度に関するものである。3つのパラメータα、β、γの値の間のこれらの関係は、パーソナライズされたパラメータ値を推定するために利用される。以下の説明では、説明を簡潔にするために、第1のパラメータαのみを参照する。
【0040】
図4は、パーソナライズされた第1のパラメータの値を推定する手順を示す。最初に、実際の車両状態に基づいて、2つのリスクマップが作成される。第1のリスクマップ10は、第1のパラメータαの第1の値を使用して作成され、第2のリスクマップ11は、第1のパラメータαの第2の値を使用して作成される。使用されるパラメータ値は、第1のパラメータαの値の間隔の下限(例えば、α=0、初心運転者)および上限(例えば、α=1、信頼できる運転者)に対応することが好ましい。作成された両方のリスクマップ10、11に対して行動計画が実行され、その結果、
図4で「信頼できる行動」および「防御的な行動」と表記された2つの異なる計画された行動12、13がもたらされる。
【0041】
次いで、オペレータによって実行される実際の制御に対応する自エージェント4の現在の行動および結果として実際のパラメータ値を車両状態から導出するために、2つの計画された行動12、13および自エージェントの実際の行動に基づいて、計画された行動12、13の決定にも使用される現在の車両状態を使用して、補間14が実行される。推定値の処理がこれ以上行われない場合、実際のパラメータ値はパーソナライズされたパラメータ値と同じであることに留意されたい。この補間は、例えば、計画された行動の加速度値と実際の行動の加速度値とを比較することによって行われてもよい。
【0042】
図4の右下には、第1のパラメータαが取り得る値の間隔と、下限および上限をパラメータ値として使用する計画アルゴリズムから得られる計画された行動に対する、結果として得られるオペレータ(運転者)のパーソナライズされたパラメータ値とが示されている。
【0043】
パーソナライズされたパラメータ値が推定されると、適応されたパラメータ値を生成するために補正が実行され、適応されたパラメータ値は、適応的パラメータ値を使用してリスクマップを生成することによってリスクを推定するために使用される。このプロセスは
図5に示されている。15においてパーソナライズされたパラメータ値が決定された後、16においてパラメータ補正値が決定され、パーソナライズされたパラメータ値に適用される。15での推定は、上で説明したように、パーソナライズされたパラメータ値を決定するために実際のパラメータ値を処理することも含み得る。パーソナライズされたパラメータ値を補正することにより、適応されたパラメータ値が生成される。図ではα(k)で示されるこの適応されたパラメータ値は、リスクモデルに入力される。リスクモデルは、適応されたパラメータ値および車両状態に基づいて、オペレータに伝達される警告信号を生成する。この伝達は、ヒューマンマシンインターフェース上で警告を提供する、オペレータへの連続出力であるか、またはオペレータからの制御入力を半自律的に調整することによって行われてもよい。リスクマップの算出およびオペレータに伝達されるリスクの決定は、先行技術の手法と変わらない。しかしながら、本発明によれば、リスクモデルの適用またはリスクマップの生成のためのパラメータ値は、オペレータのスタイルに適応されるだけでなく、教育効果を達成するためにさらに補正される。伝達のために、システムは、警告またはリスク尺度が表示され得るディスプレイを備える。代替として、伝達は、スピーカーを使用するか、またはヘッドフォンもしくは同様の伝達用デバイスに供給されるオーディオ信号を使用することができる。
【0044】
図6には、第1のパラメータの第1の値および第1のパラメータの第2の値に加えて、パーソナライズされたパラメータ値、および補正値によるそのシフトが図示されている。図は、平均的な熟練オペレータに対応するように選択され得る目標値である、第1のパラメータの「正常値」も示している。この「正常値」は、説明した実施形態における目標値を構成する。しかしながら、この値がオペレータ全体の平均である必要はない。この値は、すべてのオペレータをその自エージェントのより安全な動作へと導くために設定され得る。
【0045】
適応されたパラメータ値は、
αadapted(k)=αestimated+(αnormal-αestimated)*k
として算出される。
【0046】
kは、パーソナライズされたパラメータ値αestimatedと目標値αnormalとの間の所与の差異に対して補正がどの程度の強さであるかを調整することを可能にする補正係数である。適応されたパラメータ値αadapted(k)の算出の基準は、推定パラメータ値αestimatedと正常パラメータ値αnormalとの偏差であり、kは、所望の効果に応じて、例えば0から1の間の間隔で自由に設定され得る。例えば、補正値k=0.1は、運転者をゆっくりと平均的な安全運転スタイルに導いてもよい。
【0047】
効果の強度を調整するために、補正係数は調整されてもよい。例えば、運転者の意識が低い、運転者が眠気を感じている、かつ/または運転者がストレスを感じていると認識された場合、より小さい補正値を提供することが望ましい場合がある。推定パラメータ値αestimatedと正常パラメータ値αnormalとの間の差異は依然として同じであるため、その場合、補正係数kは0へと調整される。一方、オペレータの意識が高く、オペレータが眠気もストレスも感じていない場合、より強い補正が望まれる可能性がある。係数を高く(k->1)調整することによって、この効果が達成され得る。
【0048】
補正係数kを適応させる別の方法は、推定パラメータ値αestimatedと正常パラメータ値αnormalとの偏差量を考慮することである。例えば、補正係数kは、差が小さい場合は増加され、差が大きい場合は低減され得る。差が大きい場合に補正係数kを低減することは、運転者が過度に緊張することを回避する。一方、差が小さい場合に補正係数kを増加することは、パラメータ値の適応が依然として効果を有することを保証する。それ以外の場合、オペレータのスタイルが正常なスタイルに近いほど、その差異は無視可能である。補正値と算出された差とを関連付けるテーブルが、メモリに記憶され、リスクを推定するために、上記で説明したすべての算出および決定を実行するプロセッサによって取得され得る。
【0049】
これまでに与えられた説明は、パーソナライズされたパラメータ値と、自エージェントの現在の行動に対する実際のパラメータ値とを区別していないことに留意されたい。これは、上記で説明したように例えば補間によって推定された実際のパラメータ値が、さらなる処理およびオペレータに伝達されるリスクの推定のためのパーソナライズされたパラメータ値として直接使用されることを意味する。しかしながら、複数の実際のパラメータ値を推定し、それに基づいてパーソナライズされたパラメータ値を決定することが好ましい場合がある。これは、実際のパラメータ値の変動がリスクの推定に直接影響することを回避する。