IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ドクター エンジニール ハー ツェー エフ ポルシェ アクチエンゲゼルシャフトの特許一覧

特開2022-95584自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法
<>
  • 特開-自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法 図1
  • 特開-自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法 図2
  • 特開-自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法 図3
  • 特開-自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法 図4
  • 特開-自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法 図5
  • 特開-自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法 図6
  • 特開-自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法 図7
  • 特開-自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022095584
(43)【公開日】2022-06-28
(54)【発明の名称】自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法
(51)【国際特許分類】
   G06F 30/15 20200101AFI20220621BHJP
   G06Q 50/04 20120101ALI20220621BHJP
   G06F 30/27 20200101ALI20220621BHJP
   G06F 30/20 20200101ALI20220621BHJP
   G01M 17/007 20060101ALN20220621BHJP
【FI】
G06F30/15
G06Q50/04
G06F30/27
G06F30/20
G01M17/007 Z
【審査請求】有
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021203230
(22)【出願日】2021-12-15
(31)【優先権主張番号】10 2020 133 654.3
(32)【優先日】2020-12-16
(33)【優先権主張国・地域又は機関】DE
(71)【出願人】
【識別番号】510238096
【氏名又は名称】ドクター エンジニール ハー ツェー エフ ポルシェ アクチエンゲゼルシャフト
【氏名又は名称原語表記】Dr. Ing. h.c. F. Porsche Aktiengesellschaft
【住所又は居所原語表記】Porscheplatz 1, D-70435 Stuttgart, Germany
(74)【代理人】
【識別番号】100202647
【弁理士】
【氏名又は名称】寺町 健司
(72)【発明者】
【氏名】マッテオ スカル
【テーマコード(参考)】
5B146
5L049
【Fターム(参考)】
5B146AA05
5B146DC03
5B146DJ02
5B146DJ11
5B146EA15
5L049CC03
(57)【要約】      (修正有)
【課題】自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法を提供する。
【解決手段】方法は、コンピュータ生成モデルの第一の事故の第一のコンピュータ生成シミュレーションを行うステップ302と、コンピュータ生成シミュレーションから第一のビデオを作成するステップと、第一のビデオのフレームの比較から第一の全変形量を計算するステップ303と、コンポーネントの少なくとも1つを変更するステップ301と、変更後のコンポーネントを用いたモデルの第二の事故の第二のコンピュータ生成シミュレーションから第二のビデオを作成するステップと、第二のビデオのフレームを相互に比較し、第二の全変形量を計算するステップ303と、第一の全変形量を第二の全変形量と比較するステップと、変更を第一の全変形量と第二の全変形量との比較に基づいてプラス又はマイナスと評価するステップ304と、を含む。
【選択図】図3
【特許請求の範囲】
【請求項1】
自動車のコンピュータ生成モデル(100)のコンポーネントを変更するためのコンピュータ実装方法であって、
- 前記コンピュータ生成モデル(100)の第一の事故の第一のコンピュータ生成シミュレーション(302)を行うステップであって、前記コンピュータ生成モデル(100)は複数のコンポーネントを含み、前記第一のコンピュータ生成シミュレーションの結果、前記モデルの前記コンポーネントの少なくとも幾つかが変形するステップと、
- 前記コンピュータ生成シミュレーションから第一のビデオを作成するステップであって、前記第一のビデオは前記モデルの前記第一のシミュレートされた事故を視覚的に表すステップと、
- 前記第一のビデオのフレームを相互に比較するステップと、
- 前記第一のビデオの前記フレームの前記比較から第一の全変形量を計算するステップ(303)であって、前記第一の全変形量は、前記第一のシミュレートされた事故中の前記コンポーネントの変形から計算されるステップと、
- 前記コンポーネントの少なくとも1つを変更するステップ(301)と、
- 少なくとも1つの変更後のコンポーネントを用いた前記モデルの第二の事故の第二のコンピュータ生成シミュレーション(302)を実行するステップであって、前記第二のコンピュータ生成シミュレーションの結果、全モデルのコンポーネントが変形するステップと、
- 前記第二のコンピュータ生成シミュレーションから第二のビデオを作成するステップであって、前記第二のビデオは前記モデルの前記第二のシミュレートされた事故を視覚的に表すステップと、
- 前記第二のビデオのフレームを相互に比較するステップと、
- 前記第二のビデオの前記フレームの前記比較から第二の全変形量を計算するステップ(303)であって、前記第二の全変形量は前記第二のシミュレートされた事故中のコンポーネントの変形から計算されるステップと、
- 前記第一の全変形量を前記第二の全変形量と比較するステップと、
- 前記変更を前記第一の全変形量と前記第二の全変形量との前記比較に基づいてプラス又はマイナスに評価するステップ(304)と、
を含むコンピュータ実装方法。
【請求項2】
前記少なくとも1つの変更されたコンポーネントを用いた前記モデルは、前記変更がプラスと評価された場合に再変更されることと、前記少なくとも1つの変更されたコンポーネントを用いた前記モデルは、前記変更がマイナスと評価された場合には拒絶されることを特徴とし、前記再変更の後に、前記再変更されたモデルの第三の事故の第三のコンピュータ生成シミュレーションが行われ、第三のビデオが前記第三のコンピュータ生成シミュレーションから作成され、前記第三のコンピュータ生成シミュレーションの結果として、前記モデルのコンポーネントが変形し、前記第三のビデオは、前記再変更されたモデルの前記第三のシミュレートされた事故を視覚的に表し、前記第三のビデオのフレームが相互に比較され、第三の全変形量が、前記第三のビデオの前記フレームの前記比較から計算され、前記第三の全変形量は、前記第三のシミュレートされた事故中の前記コンポーネントの変形から計算され、前記再変更は、前記第二の全変形量と前記第三の全変形量との比較に基づいてプラス又はマイナスに評価される、請求項1に記載の方法。
【請求項3】
前記ステップは、目標全変形量と前記全変形量の1つとの差が閾値未満となるまで繰り返されることを特徴とする、請求項1又は2の何れかに記載の方法。
【請求項4】
前記変更されたモデルは、前記第二の全変形量が前記第一の全変形量より小さい場合にプラスと評価されることを特徴とする、請求項2又は3の何れかに記載の方法。
【請求項5】
前記変更は報酬関数(703)によってプラス又はマイナスに評価されることを特徴とし、前記報酬関数(703)は自己学習の形態であり、前記変更を評価する前に、前記報酬関数(703)は前記コンピュータ生成モデルに対するユーザによる改変及び、前記ユーザが改変したモデルを用いた事故のシミュレーションのパフォーマンスから学習する、請求項1~4の何れか1項に記載の方法。
【請求項6】
前記学習により、前記ユーザ改変を行うユーザ(700)の挙動が一般化されることと、前記学習により、前記ユーザ改変がまとめて、前記コンピュータ生成モデルに対する他の改変よりプラスであると評価されることを特徴とする、請求項5に記載の方法。
【請求項7】
前記報酬関数(703)は各種の特徴の線形結合であることを特徴とし、前記特徴には異なる重みが付けられ、前記重み付けは前記学習中に調整される、請求項5又は6の何れかに記載の方法。
【請求項8】
それぞれの前記シミュレートされた事故中の前記コンポーネントのそれぞれの前記変形は、変形していない状態の前記コンポーネントの画素と変形した状態の前記コンポーネントの対応する画素との間の距離から計算されることを特徴とする、請求項1~7の何れか1項に記載の方法。
【請求項9】
前記全変形量、前記変更に関する、及び前記変更の前記評価に関する情報は、中央データメモリ(500)に保存されることを特徴とし、前記全変形量及び前記情報は、別のコンピュータ生成モデルを変更するために使用される、請求項1~8の何れか1項に記載の方法。
【請求項10】
他のコンピュータ生成モデルの変更のために取得された前記データメモリ(500)からのデータは、前記変更に使用されることを特徴とする、請求項9に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特許請求項1に記載されている、自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法に関する。コンピュータ実装方法とは、本明細書の文脈においては、特にこの方法がコンピュータにより実行されることを意味すると理解されたい。コンピュータは、例えばデジタルデータメモリとプロセッサを含むことができる。デジタルデータメモリには、プロセッサにより実行されると、プロセッサに対し、コンピュータ実装方法を実行するように促す命令が保存されてよい。
【背景技術】
【0002】
自動車のコンピュータ生成モデルは、先行技術において、自動車の様々なコンポーネント、例えば車体構造に対する事故の影響をシミュレートするために使用されている。事故のシミュレーションのビデオが作成されて、ユーザがそれをコンポーネントの変形に関して分析する。
【0003】
(特許文献1)には、ある部品のコンピュータ生成モデルの、その部品の具体的な特性に関するシミュレーションを実行し、この特性をコンピュータ実装方法によって改善する行為が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】国際公開第2008/052743 A1号パンフレット
【発明の概要】
【発明が解決しようとする課題】
【0005】
対照的に、本発明は、ユーザとの相互作用を必要とせずに、事故のコンピュータ生成シミュレーションから作成されたビデオを評価するという目的に基づく。
【課題を解決するための手段】
【0006】
この目的は、特許請求項1に記載されている方法により達成される。本発明の実施形態は従属項に明記されている。
【0007】
方法は、自動車のコンピュータ生成モデルのコンポーネントを変更するために使用される。これは、例えばCADモデルとすることができる。コンピュータ生成モデルは特に、ユーザによるコンピュータとの相互作用により生成されていてもよい。「コンピュータ生成」という用語は、本明細書の文脈において、特にそのモデルが実際の部品の形態ではなくデジタルデータの形態でのみ利用可能であることを意味すると理解されたい。
【0008】
まず、コンピュータ生成モデルの第一の事故の第一のコンピュータ生成シミュレーションが行われる。コンピュータ生成モデルは複数のコンポーネントを含み、そのうちの幾つかは第一のコンピュータ生成シミュレーション中に変形する。モデルの第一のシミュレートされた事故を視覚的に表す第一のビデオが、コンピュータ生成シミュレーションから作成される。第一のビデオのフレームが相互に比較される。特に2つのみのフレームを相互に比較することが可能である。これらは特に、モデルのコンポーネントが変形する場合、事故前のフレームと事故後のフレームとすることができる。また、3つ以上のフレームを相互に比較することもできる。
【0009】
第一の全変形量が、第一のビデオのフレームの比較から計算される。第一の全変形量は、第一のシミュレートされた事故中のコンポーネントの変形から計算される。第一の全変形量は、コンポーネントの全部又は幾つかのみの変形を使って計算できる。
【0010】
すると、コンポーネントの少なくとも1つが変更される。コンポーネントの複数のインスタンスを変更することが可能である。この変更は特に、ユーザとの相互作用を必要とせずに全自動で行うことができる。少なくとも1つの変更後のコンポーネントを用いたモデルの第二の事故の第二のコンピュータ生成シミュレーションが続いて実行される。これらのコンポーネントは第二のシミュレーションが実行される前は変形していない点に留意することが重要である。第二のシミュレーションの結果として、モデルのコンポーネントが変形する。モデルの第二のシミュレートされた事故を視覚的に表す第二のビデオが、第二のシミュレーションから作成される。第二のビデオのフレームが相互に比較される。特に2つのみのフレームを相互に比較することが可能である。これらは、モデルのコンポーネントが変形する場合、特に事故前のフレームと事故後のフレームとすることができる。また、3つ以上のフレームを相互に比較することも可能である。
【0011】
第二の全変形量は、第二のビデオのフレームの比較から計算される。第二の全変形量は、第二のシミュレートされた事故中のコンポーネントの変形から計算される。第二の全変形量は、第一の全変形量と比較される。この比較は、変更をプラス又はマイナスと評価するための根拠とされる。
【0012】
このことによって、コンピュータ生成モデルを事故の特性に関して改良することができる。コンピュータ生成モデルと事故のシミュレーションのどちらも非常に現実的であるため、プラスに評価された変更はまた、そのコンピュータ生成モデルが対応する実際の自動車の事故挙動に対してもプラスの影響を有すると想定することができる。
【0013】
変更のプラス又はマイナスの評価は特に、機械学習の一部の形態とすることができる。この場合、いわゆるエージェントが変更を行う。変更がプラスと評価された場合、これはエージェントにとって報酬である。エージェントは、できるだけ多くの報酬を得ようとするため、その結果、独立して学習し、モデルは繰り返し、特にうまく変更される。
【0014】
本発明の1つの実施形態によれば、少なくとも1つの変更されたコンポーネントを用いたモデルは、その変更がプラスと評価された場合、再変更できる。これは、本明細書の文脈においては、特にコンポーネントの1つ又は複数が変更されることを意味すると理解されたい。例えば、すでに変更されたコンポーネントは再変更でき、又はそれ以外のコンポーネントは初めて変更できる。それに対して、少なくとも1つの変更されたコンポーネントを用いたモデルは、変更がマイナスと評価された場合には拒絶できる。
【0015】
再変更が行われると、それに続いて、再変更されたモデルの第三の事故の第三のコンピュータ生成シミュレーションが行われ、第三のビデオが第三のコンピュータ生成シミュレーションから作成される。
【0016】
第三のコンピュータ生成シミュレーションの結果として、モデルのコンポーネントが変形する。第三のビデオは、再変更されたモデルの第三のシミュレートされた事故を視覚的に表す。第三のビデオのフレームが相互に比較される。第三の全変形量が、第三のビデオのフレームの比較から計算される。第三の全変形量は、第三のシミュレートされた事故中のコンポーネントの変形から計算される。再変更は、第二の全変形量と第三の全変形量との比較に基づいてプラス又はマイナスに評価される。このようにして、コンピュータ生成モデルは、シミュレートされた事故中のその特性に関してさらに最適化される。
【0017】
本発明の1つの実施形態によれば、方法のステップは、目標全変形量と全変形量の1つとの差が閾値未満となるまで繰り返すことができる。閾値は、例えば目標全変形量に比例的に依存することができる。例えば、閾値は、目標全変形量との5%の差とすることができる。
【0018】
この実施形態において、コンピュータ生成モデルは、目標全変形量に少なくともほぼ達するまでシミュレートされた事故中のその特性に関して改良される。方法はユーザとの相互作用を必要とせずに実行できるため、目標全変形量に少なくともほぼ達するまでにどれだけ時間がかかるかはあまり重要ではない。
【0019】
本発明の1つの実施形態によれば、変更されたモデルは、第二の全変形量が第一の全変形量より少なければプラスと評価できる。それと同じことが、第三の全変形量が第二の全変形量より少ない場合、再変更されたモデルにも当てはまる。
【0020】
本発明の1つの実施形態によれば、変更は報酬関数によってプラス又はマイナスに評価できる。これは特に、全ての変更の全ての評価に適用できる。報酬関数は、自己学習の形態とすることができる。変更を評価する前に、報酬関数をコンピュータ生成モデルに対するユーザによる改変及び、ユーザが改変したモデルを用いた事故のシミュレーションのパフォーマンスから学習できる。ユーザによる改変とは、本明細書の文脈において、ユーザによって生ぜしめられた変更を意味すると理解される。ユーザは当然、この場合、コンピュータを使用できる。例えば、ユーザは自動車の開発の専門家、特にエンジニアであり得る。
【0021】
この実施形態において、報酬関数はどのユーザ改変が事故中のモデルの挙動に対してプラス又はマイナスの影響を有するかを学習する。特に、報酬関数は、ユーザがユーザ改変から何の目標を目指しているかを学習できる。そのため、例えば特定のコンポーネントは事故中のモデルの安定性にとって特に重要であることがあり、他方で他のコンポーネントはそれにとってそれほど重要ではない。自己学習報酬関数はこのように、ユーザが目指す目標に鑑みて、変更をプラス又はマイナスと評価することができる。
【0022】
報酬関数の使用は、方法が変更のプラスの評価に対して報酬を受け取るエージェントを使用する機械学習として実行される場合、特に有利である。
【0023】
本発明の1つの実施形態によれば、学習により、ユーザ改変を行うユーザの挙動が一般化されるという結果を得ることができる。これは、本明細書の文脈において、特に、有限数のユーザ改変が行われるときに、ユーザの挙動から一般的アプローチが内挿されることを意味すると理解され、これは、その有限数よりはるかに多く行われたユーザ改変を、この一般的アプローチに基づく報酬関数の学習に使用できることを意味する。
【0024】
さらに、学習により、ユーザ改変がまとめて、コンピュータ生成モデルに対する他の改変よりプラスであると評価されるという結果を得ることができる。しかしながら、例えば他の改変は、ユーザが行ったのではない仮定の改変を意味すると理解できる。改変の異なる評価は、報酬関数が特に、シミュレートされた事故の間にモデルの挙動の最良の改善を実現するために、どの変更がプラス又はマイナスとして評価されると想定されるかを学習できることを意味する。この目的のために、特に報酬関数を学習中に、ユーザ改変ができるだけプラスに評価されるような方法で調整することが可能である。その結果は、ユーザの目標を達成するのに適しているとみなされる変更であってもできるだけプラスに評価される、というものである。
【0025】
本発明の1つの実施形態によれば、報酬関数は各種の特徴の線形結合とすることができる。特徴には異なる重みが付けられてよい。重み付けは学習中に調整できる。特徴は、例えばコスト及び/又は安全係数を含むことができ、安全係数は、事故中のコンポーネントの、又はモデルの挙動に依存する数値である。
【0026】
例えば、報酬関数Rは次式に従って定義できる:
R=w・f+w・f+…+w・f
ここで、各wは重み係数を表し、これは学習中に変更できる。各fは特徴を表す。
【0027】
本発明の1つの実施形態によれば、それぞれのシミュレートされた事故中のコンポーネントのそれぞれの変形を、変形していない状態のコンポーネントの画素と変形した状態のコンポーネントの対応する画素との間の距離から計算できる。変形していない状態とは、それぞれのシミュレートされた事故の前の状態を意味すると理解されたい。対応する画素は、変形していない状態の画素からの変位の結果として生じた画素とすることができる。すると、計算された変形を加算して、それぞれの全変形量を計算することができる。
【0028】
本発明の1つの実施形態によれば、変更に関する、及び変更の評価に関する情報は、中央データメモリに保存できる。中央データメモリは、例えばコンピュータ実装方法を実行するコンピュータから遠隔的に配置することができる。中央データメモリは、例えばクラウドデータメモリとすることができる。全変形量とその情報を使って、別のコンピュータ生成モデルを変更することもできる。別のコンピュータ生成メモリは、1つ又は複数のコンポーネントにおけるコンピュータ生成モデルとは違うものとすることができる。
【0029】
そのため、評価された変更は別のモデルの変更においても考慮に入れることができ、その結果、よりよい評価を与えることのできる変更は、すでに評価された変更が考慮されない場合より素早く見つけることができる場合があり得る。
【0030】
本発明の1つの実施形態によれば、その他のコンピュータ生成モデルの変更のために得られたデータメモリからのデータは、その変更のために使用できる。他のコンピュータ生成モデルは、1つ又は複数のコンポーネントにおけるコンピュータ生成モデルとは異なるものとするとができる。そのため、よりよい変更をより素早く見つけることができる場合があり得る。
【0031】
本発明のその他の特徴と利点は、下記の添付の図に関する以下の好ましい例示的な実施形態の説明から明らかになり、図中、同じ参照符号は同じ又は同様の特徴のため、及び同じ又は同様の機能を有する特徴のために用いられている。
【図面の簡単な説明】
【0032】
図1】自動車のコンピュータ生成モデルの詳細部の断面略図を示す。
図2】シミュレートされた事故の後の図1の詳細部の断面略図を示す。
図3】本発明のある実施形態による方法の一部の概略図を示す。
図4】本発明のある実施形態による反復的に実行される方法の概略的表現を示す。
図5】中央データメモリを用いる図3の方法の概略的表現を示す。
図6】複数のエージェントを用いてモデルを改良する方法の概略的表現を示す。
図7】報酬関数を改良する方法の概略的表現を示す。
図8】ユーザの戦略の一般化を例示する概略的グラフを示す。
【発明を実施するための形態】
【0033】
図1に示されるモデル100は、自動車の実際の部品に対応する複数のコンポーネントを含む。ある事故のシミュレーションの後、これらのコンポーネントは変形する。この状態が図2に示されている。シミュレーションからビデオが作成される。例えば、図1は事故前のこのビデオのフレームの詳細部を示すことができる。例えば、図2は、事故後のこのビデオのフレームの詳細部を示すことができる。
【0034】
図1の詳細部を図2の詳細部と比較することによって、コンポーネントの変形を特定できる。これらは、例えば画素の変位により示すことができる。それゆえ、変位の程度は、画素の変位を測定することによって計算できる。これは、例えばミリメートルの単位で行うことができる。個々の変位を加算して全変形量を得ることができる。全変形量が大きいほど、コンポーネントはより大きく変形している。
【0035】
それゆえ、例えば2つの全変形量を相互に比較することが可能である。例えばモデルの1つ又は複数のコンポーネントが変更され、続いて第二の事故がシミュレートされた場合、変更していない場合と変更した場合のモデルの全変形量を相互に比較することができる。すると、変更されたモデルの全変形量が変更していないモデルの全変形量より小さい場合、その変更はプラスと評価できる。
【0036】
図3は、エージェント300、変更301、シミュレーション302、全変形量の計算303、及び評価304を示す。これは、強化学習に基づく方法の動作を示している。本発明の1つの実施形態において、エージェント300はコンピュータ生成モデル100のコンポーネントの変更301を選択する。変更301は、エージェント300の動作と呼ぶこともできる。エージェント300は、それが従う戦略に従う。変更301はシミュレーション302に影響を与える。シミュレーション302はまた、エージェント300の動作により影響を受ける環境と呼ぶこともできる。
【0037】
計算303の結果、コンポーネントの変形が計算される。変形は、事故前のフレームを事故後のフレームと比較することによって計算される。これらの変形を加算して、全変形量を得る。
【0038】
変更301の評価304は、全変形量に基づいて行われる。全量が大きいほど、評価が低い。特に、変更301の評価304は、計算された全変形量が変更301前に計算された全変形量と比較されるように実行できる。変更301後に計算された全変形量が前記変更前に計算された全変形量より大きい場合、変更301はマイナスに評価される。それがより少なければ、変更301はプラスに評価される。評価304はまた、エージェント300にとっての報酬と呼ぶことができる。
【0039】
エージェント300の戦略は、評価304に適合させられる。例えば、変更301がマイナスに評価された場合、これはエージェント300の戦略に影響を与え、その結果、同様の方法での再変更が行われる可能性が低くなる。さらに、変更301は拒絶され、それは変更301が行われていないモデル100の方がよりよい事故特性を有したからである。すると、変更301が行われていないモデル100は、その後の変更の基礎とされる。
【0040】
変更301がプラスに評価されると、変更301が行われたモデルが再変更の基礎として選択され、これは、その変更によってモデルの事故挙動が改善されたからである。このプラスの評価はまた、エージェント300の戦略にも影響を与え、その結果、同様の方法での再変更が行われる可能性がより高くなる。
【0041】
エージェント300は、できるだけ多くのプラスの評価を得るようにプログラムされる。各種の変更についてエージェント300がより多くの評価を受けるほど、その戦略は、モデル100の事故挙動にプラスの影響を与える最良の可能な変更を選択するためによりよく適応する。
【0042】
評価304は、特に報酬関数を使って行うことができる。報酬関数は、重み付けされた特徴を含むことができる。例えば、特徴は、変更されたモデルに従って自動車を製造するためのコスト及び、目標全変形量と計算された全変形量との間の差を含むことができる。目標全変形量は例えば、望ましい程度に小さい全変形量とすることができる。重み付けは、エージェント300の動作がどのように評価されると想定されるかを規定できる。例えばコストが特に高く重み付けされた場合、より高いコストにつながる変更は、これらが全変形量にわずかなプラスの影響しか与えなければ、マイナスに評価される可能性が高い傾向にある。目標全変形量と計算された全変形量との間の差に特に高く重み付けされた場合、より高いコストにつながるものの、事故挙動への有意なプラスの影響を有する変更は、プラスに評価される可能性がより高い。エージェント300はその戦略を評価に合わせるため、エージェント300の戦略も間接的に影響を受ける。
【0043】
方法は、計算303の結果、閾値未満の全変形量が計算された場合に終了できる。閾値は、例えばミリメートルの単位で示される値とすることができる。
【0044】
したがって、図3に示される方法は、全変形量が十分に低いとみなされたために終了されるまで、繰り返し実行される反復的方法である。この目標を達成するために、方法の計画中に、ダイナミックプログラミング、戦略反復方法、及び/又は数値反復方法を使用できる。モデルを用いない制御では、モンテカルロアルゴリズム、時間的差分学習、Sarsa、Q学習、及び/又はダブルQ学習の使用を含むことができる。また、以下のタイプのアルゴリズムのうちの1つを使用することによって、モデルベースで方法を実行することも可能である:Dyna-Q、モンテカルロ木探索、時間的差分探索。さらに、強化学習のモデルベースの方法を使用でき、これは例えば、テーブルルックアップモデル、線形予測モデル、線形ガウスモデル、及び/又はDeep Belief Networkモデルである。
【0045】
図4の方法はまず、コンピュータ生成モデルの事故がシミュレートされ、第一の全変形量が計算されることを含む。次に、モデルのコンポーネントの1つ又は複数に対する第一の変更301が行われる。例えば、特定のパラメータが増大され、減少され、又は変化なしとされる。その後、第二の全変形量が計算され、3つ全ての第一の変更301の各々について、第一の全変形量と比較される。ステップ400では、第一の変更301のうちの1つが、その第二の全変形量が第一の全変形量より小さいため、プラスと評価される。ステップ401では、第一の変更301のうちの1つが、その第二の全変形量が第一の全変形量と同程度又は等しいため、中立と評価される。ステップ402では、第一の変更301のうちの1つは、その第二の全変形量が第一の全変形量より大きいため、マイナスと評価される。プラスと評価された変更301が第二の変更301の基礎として使用される。プラスと評価された変更301はそれゆえ、第二の変更301が加えられるモデルの一部として扱われる。
【0046】
第二の変更301の結果は、第一の変更301の結果と同様に評価される。第三の変更403の後、第三の変更403のうちの1つはステップ404でプラスと評価される。さらに、この第三の変更403により、全変形量は、それと目標全変形量との差が閾値、例えば5%未満であるという条件を満たす。これは、方法が成功裏に終了され、ステップ404でプラスと評価された第三の変更403が加えられたモデルが方法の目標に従って改良された事故挙動を有するモデルとみなされることにつながる。例えば、このモデルはすると、自動車の製造の基礎とされることができる。
【0047】
図5に示される方法は、図3の方法にほぼ基づいている。しかしながら、中央データメモリ500が追加されており、エージェント300はこれを使って、行われた変更301、得られた評価304、及びその戦略に関する情報を保存する。この情報はその後、その他のエージェントが他のコンピュータ生成モデルに対して同様の方法を実行するために使用でき、その結果、よりよい結果がより素早く実現されることがある。
【0048】
さらに、他のエージェントはまた、行われた変更、得られた評価、及び前記他のエージェントの戦略に関する情報を保存することもでき、その結果、エージェント300はこの情報にアクセスでき、その変更及び/又はそ戦略をよりよく適応させることができる。
【0049】
図6は、複数のエージェント300、600、及び601を示し、これらはすべて、図5に関して説明したように、中央データメモリ500に情報を保存し、他のエージェントの情報を中央データメモリ500から読み出す。エージェント300、600、及び601は何れも、同じコンピュータ生成モデル100を変更する。これによって、エージェント300、600、及び601は異なる変更及び戦略を選択することもある。中央データメモリ500を介して交換された情報に基づいて、エージェント300、600、及び601は各々、他のエージェントの情報から恩恵を受け、自己の変更と戦略を改良して、より多くのプラスの評価を得ることができる。特に、この方式により、個々のエージェント300、600、601が有し得る何れの欠点も少なくとも部分的に補償することが可能である。
【0050】
図7に示される方法は、全変形量の評価304に使用される報酬関数702を改良する。報酬関数702は、変更701を行うユーザ700の挙動を観察し、図3及び4に関して上述したように、その全変形量が評価される。報酬関数702は、特徴及び特徴の重み付けを含む。特徴の重み付けは、ユーザ700の戦略についてできるだけ多くのプラスの評価を得るために調整される。この調整の結果、改良された報酬関数703が得られる。
【0051】
図8は、ユーザ700の挙動がどのように一般化されるかを示す。ユーザが変更を行うと、モデル800は異なる全変形量を有する。Y軸は全変形量の測定値である。全変形量が小さいほど、Y軸上のモデル800のマークは高くなる。
【0052】
モデル800は一般化されたモデル801を生成するために使用され、これも同様に、ユーザ700の戦略に従うことによって実現できる。しかしながら、ユーザ700は無限の数の変更を行うことはできないため、これらはユーザ700にとって、現実には自分で作ることのできない、単に仮定上のモデル801である。
【0053】
モデル800及び801はすると、モデルに関する一般化された曲線802を生成するために使用され、その上にユーザ700の戦略に対応するモデルの全部又は少なくとも大部分が重なる。すると、これらのモデルができるだけプラスに評価されるように報酬関数702を調整できる。
【0054】
パラメータを適切に調整すれば、このコンピュータ実装方法は当然のことながら、車両冷房システムのための計算及び車両の流体力学的コンポーネントが流体力学的特性に与える影響に関するシミュレーション及び自動分析を行うこともできる。
【符号の説明】
【0055】
100 コンピュータ生成モデル
301 コンポーネントを変更するステップ
302 コンピュータ生成シミュレーションを行うステップ
303 全変形量を計算するステップ
304 変更を評価するステップ
500 中央データメモリ
700 ユーザ
703 報酬関数
図1
図2
図3
図4
図5
図6
図7
図8