特開2022-95584 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ドクター　エンジニール　ハー　ツェー　エフ　ポルシェ　アクチエンゲゼルシャフトの特許一覧

特開2022-95584自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022095584

(43)【公開日】2022-06-28

(54)【発明の名称】自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法

(51)【国際特許分類】

G06F 30/15 20200101AFI20220621BHJP

G06Q 50/04 20120101ALI20220621BHJP

G06F 30/27 20200101ALI20220621BHJP

G06F 30/20 20200101ALI20220621BHJP

G01M 17/007 20060101ALN20220621BHJP

【ＦＩ】

G06F30/15

G06Q50/04

G06F30/27

G06F30/20

G01M17/007 Z

【審査請求】有

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2021203230

(22)【出願日】2021-12-15

(31)【優先権主張番号】10 2020 133 654.3

(32)【優先日】2020-12-16

(33)【優先権主張国・地域又は機関】DE

(71)【出願人】

【識別番号】510238096

【氏名又は名称】ドクターエンジニールハーツェーエフポルシェアクチエンゲゼルシャフト

【氏名又は名称原語表記】Ｄｒ．Ｉｎｇ．ｈ．ｃ．Ｆ．ＰｏｒｓｃｈｅＡｋｔｉｅｎｇｅｓｅｌｌｓｃｈａｆｔ

【住所又は居所原語表記】Ｐｏｒｓｃｈｅｐｌａｔｚ１，Ｄ－７０４３５Ｓｔｕｔｔｇａｒｔ，Ｇｅｒｍａｎｙ

(74)【代理人】

【識別番号】100202647

【弁理士】

【氏名又は名称】寺町健司

(72)【発明者】

【氏名】マッテオスカル

【テーマコード（参考）】

5B146

5L049

【Ｆターム（参考）】

5B146AA05

5B146DC03

5B146DJ02

5B146DJ11

5B146EA15

5L049CC03

(57)【要約】（修正有）

【課題】自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法を提供する。
【解決手段】方法は、コンピュータ生成モデルの第一の事故の第一のコンピュータ生成シミュレーションを行うステップ３０２と、コンピュータ生成シミュレーションから第一のビデオを作成するステップと、第一のビデオのフレームの比較から第一の全変形量を計算するステップ３０３と、コンポーネントの少なくとも１つを変更するステップ３０１と、変更後のコンポーネントを用いたモデルの第二の事故の第二のコンピュータ生成シミュレーションから第二のビデオを作成するステップと、第二のビデオのフレームを相互に比較し、第二の全変形量を計算するステップ３０３と、第一の全変形量を第二の全変形量と比較するステップと、変更を第一の全変形量と第二の全変形量との比較に基づいてプラス又はマイナスと評価するステップ３０４と、を含む。
【選択図】図３

【特許請求の範囲】

【請求項1】

自動車のコンピュータ生成モデル（１００）のコンポーネントを変更するためのコンピュータ実装方法であって、
－前記コンピュータ生成モデル（１００）の第一の事故の第一のコンピュータ生成シミュレーション（３０２）を行うステップであって、前記コンピュータ生成モデル（１００）は複数のコンポーネントを含み、前記第一のコンピュータ生成シミュレーションの結果、前記モデルの前記コンポーネントの少なくとも幾つかが変形するステップと、
－前記コンピュータ生成シミュレーションから第一のビデオを作成するステップであって、前記第一のビデオは前記モデルの前記第一のシミュレートされた事故を視覚的に表すステップと、
－前記第一のビデオのフレームを相互に比較するステップと、
－前記第一のビデオの前記フレームの前記比較から第一の全変形量を計算するステップ（３０３）であって、前記第一の全変形量は、前記第一のシミュレートされた事故中の前記コンポーネントの変形から計算されるステップと、
－前記コンポーネントの少なくとも１つを変更するステップ（３０１）と、
－少なくとも１つの変更後のコンポーネントを用いた前記モデルの第二の事故の第二のコンピュータ生成シミュレーション（３０２）を実行するステップであって、前記第二のコンピュータ生成シミュレーションの結果、全モデルのコンポーネントが変形するステップと、
－前記第二のコンピュータ生成シミュレーションから第二のビデオを作成するステップであって、前記第二のビデオは前記モデルの前記第二のシミュレートされた事故を視覚的に表すステップと、
－前記第二のビデオのフレームを相互に比較するステップと、
－前記第二のビデオの前記フレームの前記比較から第二の全変形量を計算するステップ（３０３）であって、前記第二の全変形量は前記第二のシミュレートされた事故中のコンポーネントの変形から計算されるステップと、
－前記第一の全変形量を前記第二の全変形量と比較するステップと、
－前記変更を前記第一の全変形量と前記第二の全変形量との前記比較に基づいてプラス又はマイナスに評価するステップ（３０４）と、
を含むコンピュータ実装方法。

【請求項2】

前記少なくとも１つの変更されたコンポーネントを用いた前記モデルは、前記変更がプラスと評価された場合に再変更されることと、前記少なくとも１つの変更されたコンポーネントを用いた前記モデルは、前記変更がマイナスと評価された場合には拒絶されることを特徴とし、前記再変更の後に、前記再変更されたモデルの第三の事故の第三のコンピュータ生成シミュレーションが行われ、第三のビデオが前記第三のコンピュータ生成シミュレーションから作成され、前記第三のコンピュータ生成シミュレーションの結果として、前記モデルのコンポーネントが変形し、前記第三のビデオは、前記再変更されたモデルの前記第三のシミュレートされた事故を視覚的に表し、前記第三のビデオのフレームが相互に比較され、第三の全変形量が、前記第三のビデオの前記フレームの前記比較から計算され、前記第三の全変形量は、前記第三のシミュレートされた事故中の前記コンポーネントの変形から計算され、前記再変更は、前記第二の全変形量と前記第三の全変形量との比較に基づいてプラス又はマイナスに評価される、請求項１に記載の方法。

【請求項3】

前記ステップは、目標全変形量と前記全変形量の１つとの差が閾値未満となるまで繰り返されることを特徴とする、請求項１又は２の何れかに記載の方法。

【請求項4】

前記変更されたモデルは、前記第二の全変形量が前記第一の全変形量より小さい場合にプラスと評価されることを特徴とする、請求項２又は３の何れかに記載の方法。

【請求項5】

前記変更は報酬関数（７０３）によってプラス又はマイナスに評価されることを特徴とし、前記報酬関数（７０３）は自己学習の形態であり、前記変更を評価する前に、前記報酬関数（７０３）は前記コンピュータ生成モデルに対するユーザによる改変及び、前記ユーザが改変したモデルを用いた事故のシミュレーションのパフォーマンスから学習する、請求項１～４の何れか１項に記載の方法。

【請求項6】

前記学習により、前記ユーザ改変を行うユーザ（７００）の挙動が一般化されることと、前記学習により、前記ユーザ改変がまとめて、前記コンピュータ生成モデルに対する他の改変よりプラスであると評価されることを特徴とする、請求項５に記載の方法。

【請求項7】

前記報酬関数（７０３）は各種の特徴の線形結合であることを特徴とし、前記特徴には異なる重みが付けられ、前記重み付けは前記学習中に調整される、請求項５又は６の何れかに記載の方法。

【請求項8】

それぞれの前記シミュレートされた事故中の前記コンポーネントのそれぞれの前記変形は、変形していない状態の前記コンポーネントの画素と変形した状態の前記コンポーネントの対応する画素との間の距離から計算されることを特徴とする、請求項１～７の何れか１項に記載の方法。

【請求項9】

前記全変形量、前記変更に関する、及び前記変更の前記評価に関する情報は、中央データメモリ（５００）に保存されることを特徴とし、前記全変形量及び前記情報は、別のコンピュータ生成モデルを変更するために使用される、請求項１～８の何れか１項に記載の方法。

【請求項10】

他のコンピュータ生成モデルの変更のために取得された前記データメモリ（５００）からのデータは、前記変更に使用されることを特徴とする、請求項９に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、特許請求項１に記載されている、自動車のコンピュータ生成モデルのコンポーネントを変更するためのコンピュータ実装方法に関する。コンピュータ実装方法とは、本明細書の文脈においては、特にこの方法がコンピュータにより実行されることを意味すると理解されたい。コンピュータは、例えばデジタルデータメモリとプロセッサを含むことができる。デジタルデータメモリには、プロセッサにより実行されると、プロセッサに対し、コンピュータ実装方法を実行するように促す命令が保存されてよい。

【背景技術】

【0002】

自動車のコンピュータ生成モデルは、先行技術において、自動車の様々なコンポーネント、例えば車体構造に対する事故の影響をシミュレートするために使用されている。事故のシミュレーションのビデオが作成されて、ユーザがそれをコンポーネントの変形に関して分析する。

【0003】

（特許文献１）には、ある部品のコンピュータ生成モデルの、その部品の具体的な特性に関するシミュレーションを実行し、この特性をコンピュータ実装方法によって改善する行為が開示されている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】国際公開第２００８／０５２７４３Ａ１号パンフレット

【発明の概要】

【発明が解決しようとする課題】

【0005】

対照的に、本発明は、ユーザとの相互作用を必要とせずに、事故のコンピュータ生成シミュレーションから作成されたビデオを評価するという目的に基づく。

【課題を解決するための手段】

【0006】

この目的は、特許請求項１に記載されている方法により達成される。本発明の実施形態は従属項に明記されている。

【0007】

方法は、自動車のコンピュータ生成モデルのコンポーネントを変更するために使用される。これは、例えばＣＡＤモデルとすることができる。コンピュータ生成モデルは特に、ユーザによるコンピュータとの相互作用により生成されていてもよい。「コンピュータ生成」という用語は、本明細書の文脈において、特にそのモデルが実際の部品の形態ではなくデジタルデータの形態でのみ利用可能であることを意味すると理解されたい。

【0008】

まず、コンピュータ生成モデルの第一の事故の第一のコンピュータ生成シミュレーションが行われる。コンピュータ生成モデルは複数のコンポーネントを含み、そのうちの幾つかは第一のコンピュータ生成シミュレーション中に変形する。モデルの第一のシミュレートされた事故を視覚的に表す第一のビデオが、コンピュータ生成シミュレーションから作成される。第一のビデオのフレームが相互に比較される。特に２つのみのフレームを相互に比較することが可能である。これらは特に、モデルのコンポーネントが変形する場合、事故前のフレームと事故後のフレームとすることができる。また、３つ以上のフレームを相互に比較することもできる。

【0009】

第一の全変形量が、第一のビデオのフレームの比較から計算される。第一の全変形量は、第一のシミュレートされた事故中のコンポーネントの変形から計算される。第一の全変形量は、コンポーネントの全部又は幾つかのみの変形を使って計算できる。

【0010】

すると、コンポーネントの少なくとも１つが変更される。コンポーネントの複数のインスタンスを変更することが可能である。この変更は特に、ユーザとの相互作用を必要とせずに全自動で行うことができる。少なくとも１つの変更後のコンポーネントを用いたモデルの第二の事故の第二のコンピュータ生成シミュレーションが続いて実行される。これらのコンポーネントは第二のシミュレーションが実行される前は変形していない点に留意することが重要である。第二のシミュレーションの結果として、モデルのコンポーネントが変形する。モデルの第二のシミュレートされた事故を視覚的に表す第二のビデオが、第二のシミュレーションから作成される。第二のビデオのフレームが相互に比較される。特に２つのみのフレームを相互に比較することが可能である。これらは、モデルのコンポーネントが変形する場合、特に事故前のフレームと事故後のフレームとすることができる。また、３つ以上のフレームを相互に比較することも可能である。

【0011】

第二の全変形量は、第二のビデオのフレームの比較から計算される。第二の全変形量は、第二のシミュレートされた事故中のコンポーネントの変形から計算される。第二の全変形量は、第一の全変形量と比較される。この比較は、変更をプラス又はマイナスと評価するための根拠とされる。

【0012】

このことによって、コンピュータ生成モデルを事故の特性に関して改良することができる。コンピュータ生成モデルと事故のシミュレーションのどちらも非常に現実的であるため、プラスに評価された変更はまた、そのコンピュータ生成モデルが対応する実際の自動車の事故挙動に対してもプラスの影響を有すると想定することができる。

【0013】

変更のプラス又はマイナスの評価は特に、機械学習の一部の形態とすることができる。この場合、いわゆるエージェントが変更を行う。変更がプラスと評価された場合、これはエージェントにとって報酬である。エージェントは、できるだけ多くの報酬を得ようとするため、その結果、独立して学習し、モデルは繰り返し、特にうまく変更される。

【0014】

本発明の１つの実施形態によれば、少なくとも１つの変更されたコンポーネントを用いたモデルは、その変更がプラスと評価された場合、再変更できる。これは、本明細書の文脈においては、特にコンポーネントの１つ又は複数が変更されることを意味すると理解されたい。例えば、すでに変更されたコンポーネントは再変更でき、又はそれ以外のコンポーネントは初めて変更できる。それに対して、少なくとも１つの変更されたコンポーネントを用いたモデルは、変更がマイナスと評価された場合には拒絶できる。

【0015】

再変更が行われると、それに続いて、再変更されたモデルの第三の事故の第三のコンピュータ生成シミュレーションが行われ、第三のビデオが第三のコンピュータ生成シミュレーションから作成される。

【0016】

第三のコンピュータ生成シミュレーションの結果として、モデルのコンポーネントが変形する。第三のビデオは、再変更されたモデルの第三のシミュレートされた事故を視覚的に表す。第三のビデオのフレームが相互に比較される。第三の全変形量が、第三のビデオのフレームの比較から計算される。第三の全変形量は、第三のシミュレートされた事故中のコンポーネントの変形から計算される。再変更は、第二の全変形量と第三の全変形量との比較に基づいてプラス又はマイナスに評価される。このようにして、コンピュータ生成モデルは、シミュレートされた事故中のその特性に関してさらに最適化される。

【0017】

本発明の１つの実施形態によれば、方法のステップは、目標全変形量と全変形量の１つとの差が閾値未満となるまで繰り返すことができる。閾値は、例えば目標全変形量に比例的に依存することができる。例えば、閾値は、目標全変形量との５％の差とすることができる。

【0018】

この実施形態において、コンピュータ生成モデルは、目標全変形量に少なくともほぼ達するまでシミュレートされた事故中のその特性に関して改良される。方法はユーザとの相互作用を必要とせずに実行できるため、目標全変形量に少なくともほぼ達するまでにどれだけ時間がかかるかはあまり重要ではない。

【0019】

本発明の１つの実施形態によれば、変更されたモデルは、第二の全変形量が第一の全変形量より少なければプラスと評価できる。それと同じことが、第三の全変形量が第二の全変形量より少ない場合、再変更されたモデルにも当てはまる。

【0020】

本発明の１つの実施形態によれば、変更は報酬関数によってプラス又はマイナスに評価できる。これは特に、全ての変更の全ての評価に適用できる。報酬関数は、自己学習の形態とすることができる。変更を評価する前に、報酬関数をコンピュータ生成モデルに対するユーザによる改変及び、ユーザが改変したモデルを用いた事故のシミュレーションのパフォーマンスから学習できる。ユーザによる改変とは、本明細書の文脈において、ユーザによって生ぜしめられた変更を意味すると理解される。ユーザは当然、この場合、コンピュータを使用できる。例えば、ユーザは自動車の開発の専門家、特にエンジニアであり得る。

【0021】

この実施形態において、報酬関数はどのユーザ改変が事故中のモデルの挙動に対してプラス又はマイナスの影響を有するかを学習する。特に、報酬関数は、ユーザがユーザ改変から何の目標を目指しているかを学習できる。そのため、例えば特定のコンポーネントは事故中のモデルの安定性にとって特に重要であることがあり、他方で他のコンポーネントはそれにとってそれほど重要ではない。自己学習報酬関数はこのように、ユーザが目指す目標に鑑みて、変更をプラス又はマイナスと評価することができる。

【0022】

報酬関数の使用は、方法が変更のプラスの評価に対して報酬を受け取るエージェントを使用する機械学習として実行される場合、特に有利である。

【0023】

本発明の１つの実施形態によれば、学習により、ユーザ改変を行うユーザの挙動が一般化されるという結果を得ることができる。これは、本明細書の文脈において、特に、有限数のユーザ改変が行われるときに、ユーザの挙動から一般的アプローチが内挿されることを意味すると理解され、これは、その有限数よりはるかに多く行われたユーザ改変を、この一般的アプローチに基づく報酬関数の学習に使用できることを意味する。

【0024】

さらに、学習により、ユーザ改変がまとめて、コンピュータ生成モデルに対する他の改変よりプラスであると評価されるという結果を得ることができる。しかしながら、例えば他の改変は、ユーザが行ったのではない仮定の改変を意味すると理解できる。改変の異なる評価は、報酬関数が特に、シミュレートされた事故の間にモデルの挙動の最良の改善を実現するために、どの変更がプラス又はマイナスとして評価されると想定されるかを学習できることを意味する。この目的のために、特に報酬関数を学習中に、ユーザ改変ができるだけプラスに評価されるような方法で調整することが可能である。その結果は、ユーザの目標を達成するのに適しているとみなされる変更であってもできるだけプラスに評価される、というものである。

【0025】

本発明の１つの実施形態によれば、報酬関数は各種の特徴の線形結合とすることができる。特徴には異なる重みが付けられてよい。重み付けは学習中に調整できる。特徴は、例えばコスト及び／又は安全係数を含むことができ、安全係数は、事故中のコンポーネントの、又はモデルの挙動に依存する数値である。

【0026】

例えば、報酬関数Ｒは次式に従って定義できる：
Ｒ＝ｗ_１・ｆ_１＋ｗ_２・ｆ_２＋…＋ｗ_ｎ・ｆ_ｎ
ここで、各ｗ_ｉは重み係数を表し、これは学習中に変更できる。各ｆ_ｉは特徴を表す。

【0027】

本発明の１つの実施形態によれば、それぞれのシミュレートされた事故中のコンポーネントのそれぞれの変形を、変形していない状態のコンポーネントの画素と変形した状態のコンポーネントの対応する画素との間の距離から計算できる。変形していない状態とは、それぞれのシミュレートされた事故の前の状態を意味すると理解されたい。対応する画素は、変形していない状態の画素からの変位の結果として生じた画素とすることができる。すると、計算された変形を加算して、それぞれの全変形量を計算することができる。

【0028】

本発明の１つの実施形態によれば、変更に関する、及び変更の評価に関する情報は、中央データメモリに保存できる。中央データメモリは、例えばコンピュータ実装方法を実行するコンピュータから遠隔的に配置することができる。中央データメモリは、例えばクラウドデータメモリとすることができる。全変形量とその情報を使って、別のコンピュータ生成モデルを変更することもできる。別のコンピュータ生成メモリは、１つ又は複数のコンポーネントにおけるコンピュータ生成モデルとは違うものとすることができる。

【0029】

そのため、評価された変更は別のモデルの変更においても考慮に入れることができ、その結果、よりよい評価を与えることのできる変更は、すでに評価された変更が考慮されない場合より素早く見つけることができる場合があり得る。

【0030】

本発明の１つの実施形態によれば、その他のコンピュータ生成モデルの変更のために得られたデータメモリからのデータは、その変更のために使用できる。他のコンピュータ生成モデルは、１つ又は複数のコンポーネントにおけるコンピュータ生成モデルとは異なるものとするとができる。そのため、よりよい変更をより素早く見つけることができる場合があり得る。

【0031】

本発明のその他の特徴と利点は、下記の添付の図に関する以下の好ましい例示的な実施形態の説明から明らかになり、図中、同じ参照符号は同じ又は同様の特徴のため、及び同じ又は同様の機能を有する特徴のために用いられている。

【図面の簡単な説明】

【0032】

【図1】自動車のコンピュータ生成モデルの詳細部の断面略図を示す。

【図2】シミュレートされた事故の後の図１の詳細部の断面略図を示す。

【図3】本発明のある実施形態による方法の一部の概略図を示す。

【図4】本発明のある実施形態による反復的に実行される方法の概略的表現を示す。

【図5】中央データメモリを用いる図３の方法の概略的表現を示す。

【図6】複数のエージェントを用いてモデルを改良する方法の概略的表現を示す。

【図7】報酬関数を改良する方法の概略的表現を示す。

【図8】ユーザの戦略の一般化を例示する概略的グラフを示す。

【発明を実施するための形態】

【0033】

図１に示されるモデル１００は、自動車の実際の部品に対応する複数のコンポーネントを含む。ある事故のシミュレーションの後、これらのコンポーネントは変形する。この状態が図２に示されている。シミュレーションからビデオが作成される。例えば、図１は事故前のこのビデオのフレームの詳細部を示すことができる。例えば、図２は、事故後のこのビデオのフレームの詳細部を示すことができる。

【0034】

図１の詳細部を図２の詳細部と比較することによって、コンポーネントの変形を特定できる。これらは、例えば画素の変位により示すことができる。それゆえ、変位の程度は、画素の変位を測定することによって計算できる。これは、例えばミリメートルの単位で行うことができる。個々の変位を加算して全変形量を得ることができる。全変形量が大きいほど、コンポーネントはより大きく変形している。

【0035】

それゆえ、例えば２つの全変形量を相互に比較することが可能である。例えばモデルの１つ又は複数のコンポーネントが変更され、続いて第二の事故がシミュレートされた場合、変更していない場合と変更した場合のモデルの全変形量を相互に比較することができる。すると、変更されたモデルの全変形量が変更していないモデルの全変形量より小さい場合、その変更はプラスと評価できる。

【0036】

図３は、エージェント３００、変更３０１、シミュレーション３０２、全変形量の計算３０３、及び評価３０４を示す。これは、強化学習に基づく方法の動作を示している。本発明の１つの実施形態において、エージェント３００はコンピュータ生成モデル１００のコンポーネントの変更３０１を選択する。変更３０１は、エージェント３００の動作と呼ぶこともできる。エージェント３００は、それが従う戦略に従う。変更３０１はシミュレーション３０２に影響を与える。シミュレーション３０２はまた、エージェント３００の動作により影響を受ける環境と呼ぶこともできる。

【0037】

計算３０３の結果、コンポーネントの変形が計算される。変形は、事故前のフレームを事故後のフレームと比較することによって計算される。これらの変形を加算して、全変形量を得る。

【0038】

変更３０１の評価３０４は、全変形量に基づいて行われる。全量が大きいほど、評価が低い。特に、変更３０１の評価３０４は、計算された全変形量が変更３０１前に計算された全変形量と比較されるように実行できる。変更３０１後に計算された全変形量が前記変更前に計算された全変形量より大きい場合、変更３０１はマイナスに評価される。それがより少なければ、変更３０１はプラスに評価される。評価３０４はまた、エージェント３００にとっての報酬と呼ぶことができる。

【0039】

エージェント３００の戦略は、評価３０４に適合させられる。例えば、変更３０１がマイナスに評価された場合、これはエージェント３００の戦略に影響を与え、その結果、同様の方法での再変更が行われる可能性が低くなる。さらに、変更３０１は拒絶され、それは変更３０１が行われていないモデル１００の方がよりよい事故特性を有したからである。すると、変更３０１が行われていないモデル１００は、その後の変更の基礎とされる。

【0040】

変更３０１がプラスに評価されると、変更３０１が行われたモデルが再変更の基礎として選択され、これは、その変更によってモデルの事故挙動が改善されたからである。このプラスの評価はまた、エージェント３００の戦略にも影響を与え、その結果、同様の方法での再変更が行われる可能性がより高くなる。

【0041】

エージェント３００は、できるだけ多くのプラスの評価を得るようにプログラムされる。各種の変更についてエージェント３００がより多くの評価を受けるほど、その戦略は、モデル１００の事故挙動にプラスの影響を与える最良の可能な変更を選択するためによりよく適応する。

【0042】

評価３０４は、特に報酬関数を使って行うことができる。報酬関数は、重み付けされた特徴を含むことができる。例えば、特徴は、変更されたモデルに従って自動車を製造するためのコスト及び、目標全変形量と計算された全変形量との間の差を含むことができる。目標全変形量は例えば、望ましい程度に小さい全変形量とすることができる。重み付けは、エージェント３００の動作がどのように評価されると想定されるかを規定できる。例えばコストが特に高く重み付けされた場合、より高いコストにつながる変更は、これらが全変形量にわずかなプラスの影響しか与えなければ、マイナスに評価される可能性が高い傾向にある。目標全変形量と計算された全変形量との間の差に特に高く重み付けされた場合、より高いコストにつながるものの、事故挙動への有意なプラスの影響を有する変更は、プラスに評価される可能性がより高い。エージェント３００はその戦略を評価に合わせるため、エージェント３００の戦略も間接的に影響を受ける。

【0043】

方法は、計算３０３の結果、閾値未満の全変形量が計算された場合に終了できる。閾値は、例えばミリメートルの単位で示される値とすることができる。

【0044】

したがって、図３に示される方法は、全変形量が十分に低いとみなされたために終了されるまで、繰り返し実行される反復的方法である。この目標を達成するために、方法の計画中に、ダイナミックプログラミング、戦略反復方法、及び／又は数値反復方法を使用できる。モデルを用いない制御では、モンテカルロアルゴリズム、時間的差分学習、Ｓａｒｓａ、Ｑ学習、及び／又はダブルＱ学習の使用を含むことができる。また、以下のタイプのアルゴリズムのうちの１つを使用することによって、モデルベースで方法を実行することも可能である：Ｄｙｎａ－Ｑ、モンテカルロ木探索、時間的差分探索。さらに、強化学習のモデルベースの方法を使用でき、これは例えば、テーブルルックアップモデル、線形予測モデル、線形ガウスモデル、及び／又はＤｅｅｐＢｅｌｉｅｆＮｅｔｗｏｒｋモデルである。

【0045】

図４の方法はまず、コンピュータ生成モデルの事故がシミュレートされ、第一の全変形量が計算されることを含む。次に、モデルのコンポーネントの１つ又は複数に対する第一の変更３０１が行われる。例えば、特定のパラメータが増大され、減少され、又は変化なしとされる。その後、第二の全変形量が計算され、３つ全ての第一の変更３０１の各々について、第一の全変形量と比較される。ステップ４００では、第一の変更３０１のうちの１つが、その第二の全変形量が第一の全変形量より小さいため、プラスと評価される。ステップ４０１では、第一の変更３０１のうちの１つが、その第二の全変形量が第一の全変形量と同程度又は等しいため、中立と評価される。ステップ４０２では、第一の変更３０１のうちの１つは、その第二の全変形量が第一の全変形量より大きいため、マイナスと評価される。プラスと評価された変更３０１が第二の変更３０１の基礎として使用される。プラスと評価された変更３０１はそれゆえ、第二の変更３０１が加えられるモデルの一部として扱われる。

【0046】

第二の変更３０１の結果は、第一の変更３０１の結果と同様に評価される。第三の変更４０３の後、第三の変更４０３のうちの１つはステップ４０４でプラスと評価される。さらに、この第三の変更４０３により、全変形量は、それと目標全変形量との差が閾値、例えば５％未満であるという条件を満たす。これは、方法が成功裏に終了され、ステップ４０４でプラスと評価された第三の変更４０３が加えられたモデルが方法の目標に従って改良された事故挙動を有するモデルとみなされることにつながる。例えば、このモデルはすると、自動車の製造の基礎とされることができる。

【0047】

図５に示される方法は、図３の方法にほぼ基づいている。しかしながら、中央データメモリ５００が追加されており、エージェント３００はこれを使って、行われた変更３０１、得られた評価３０４、及びその戦略に関する情報を保存する。この情報はその後、その他のエージェントが他のコンピュータ生成モデルに対して同様の方法を実行するために使用でき、その結果、よりよい結果がより素早く実現されることがある。

【0048】

さらに、他のエージェントはまた、行われた変更、得られた評価、及び前記他のエージェントの戦略に関する情報を保存することもでき、その結果、エージェント３００はこの情報にアクセスでき、その変更及び／又はそ戦略をよりよく適応させることができる。

【0049】

図６は、複数のエージェント３００、６００、及び６０１を示し、これらはすべて、図５に関して説明したように、中央データメモリ５００に情報を保存し、他のエージェントの情報を中央データメモリ５００から読み出す。エージェント３００、６００、及び６０１は何れも、同じコンピュータ生成モデル１００を変更する。これによって、エージェント３００、６００、及び６０１は異なる変更及び戦略を選択することもある。中央データメモリ５００を介して交換された情報に基づいて、エージェント３００、６００、及び６０１は各々、他のエージェントの情報から恩恵を受け、自己の変更と戦略を改良して、より多くのプラスの評価を得ることができる。特に、この方式により、個々のエージェント３００、６００、６０１が有し得る何れの欠点も少なくとも部分的に補償することが可能である。

【0050】

図７に示される方法は、全変形量の評価３０４に使用される報酬関数７０２を改良する。報酬関数７０２は、変更７０１を行うユーザ７００の挙動を観察し、図３及び４に関して上述したように、その全変形量が評価される。報酬関数７０２は、特徴及び特徴の重み付けを含む。特徴の重み付けは、ユーザ７００の戦略についてできるだけ多くのプラスの評価を得るために調整される。この調整の結果、改良された報酬関数７０３が得られる。

【0051】

図８は、ユーザ７００の挙動がどのように一般化されるかを示す。ユーザが変更を行うと、モデル８００は異なる全変形量を有する。Ｙ軸は全変形量の測定値である。全変形量が小さいほど、Ｙ軸上のモデル８００のマークは高くなる。

【0052】

モデル８００は一般化されたモデル８０１を生成するために使用され、これも同様に、ユーザ７００の戦略に従うことによって実現できる。しかしながら、ユーザ７００は無限の数の変更を行うことはできないため、これらはユーザ７００にとって、現実には自分で作ることのできない、単に仮定上のモデル８０１である。

【0053】

モデル８００及び８０１はすると、モデルに関する一般化された曲線８０２を生成するために使用され、その上にユーザ７００の戦略に対応するモデルの全部又は少なくとも大部分が重なる。すると、これらのモデルができるだけプラスに評価されるように報酬関数７０２を調整できる。

【0054】

パラメータを適切に調整すれば、このコンピュータ実装方法は当然のことながら、車両冷房システムのための計算及び車両の流体力学的コンポーネントが流体力学的特性に与える影響に関するシミュレーション及び自動分析を行うこともできる。

【符号の説明】

【0055】

１００コンピュータ生成モデル
３０１コンポーネントを変更するステップ
３０２コンピュータ生成シミュレーションを行うステップ
３０３全変形量を計算するステップ
３０４変更を評価するステップ
５００中央データメモリ
７００ユーザ
７０３報酬関数

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版