特開2024-86148 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-86148構造解析プログラム、構造解析方法および情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024086148

(43)【公開日】2024-06-27

(54)【発明の名称】構造解析プログラム、構造解析方法および情報処理装置

(51)【国際特許分類】

G06F 30/23 20200101AFI20240620BHJP

G06F 30/27 20200101ALI20240620BHJP

G06N 3/04 20230101ALI20240620BHJP

G06F 111/10 20200101ALN20240620BHJP

G06F 119/14 20200101ALN20240620BHJP

【ＦＩ】

G06F30/23

G06F30/27

G06N3/04 100

G06F111:10

G06F119:14

【審査請求】未請求

【請求項の数】9

【出願形態】ＯＬ

(21)【出願番号】P 2022201127

(22)【出願日】2022-12-16

(71)【出願人】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110002918

【氏名又は名称】弁理士法人扶桑国際特許事務所

(72)【発明者】

【氏名】ハデルバシュアミル

【テーマコード（参考）】

5B146

【Ｆターム（参考）】

5B146DC03

5B146DJ02

5B146DJ07

(57)【要約】

【課題】構造解析シミュレーションの実行時間を短縮する。
【解決手段】情報処理装置１０は、メッシュデータの要素１４に含まれる節点１４ａ，１４ｂ，１４ｃそれぞれの特徴ベクトルを、当該節点の位置と、当該節点における弾性係数と、当該節点にかかる応力とに基づいて生成する。情報処理装置１０は、節点１４ａ，１４ｂ，１４ｃの特徴ベクトルを、訓練済みの機械学習モデル１３に入力することで、節点１４ａ，１４ｂ，１４ｃの間で特徴ベクトルの畳み込み演算を行い、畳み込み演算の結果に基づいて、要素１４の剛性を示す要素剛性マトリクス１６を推定する。
【選択図】図１

【特許請求の範囲】

【請求項1】

メッシュデータの要素に含まれる複数の節点それぞれの特徴ベクトルを、当該節点の位置と、当該節点における弾性係数と、当該節点にかかる応力とに基づいて生成し、
前記複数の節点の前記特徴ベクトルを、訓練済みの機械学習モデルに入力することで、前記複数の節点の間で前記特徴ベクトルの畳み込み演算を行い、前記畳み込み演算の結果に基づいて、前記要素の剛性を示す要素剛性マトリクスを推定する、
処理をコンピュータに実行させる構造解析プログラム。

【請求項2】

前記機械学習モデルは、グラフ畳み込みニューラルネットワークである、
請求項１記載の構造解析プログラム。

【請求項3】

前記推定は、ＧＰＵ（Graphics Processing Unit）を用いて、複数の要素に対応する複数の要素剛性マトリクスを並列に推定する処理を含む、
請求項１記載の構造解析プログラム。

【請求項4】

前記要素の中で前記複数の節点それぞれが他の全ての節点と隣接していることを示す隣接行列を生成する処理を、前記コンピュータに更に実行させ、
前記畳み込み演算は、前記隣接行列に基づいて行われる、
請求項１記載の構造解析プログラム。

【請求項5】

前記位置の情報は、前記節点の初期位置と、シミュレーション上の１つ前の時間ステップで算出された前記節点の変位量とを含む、
請求項１記載の構造解析プログラム。

【請求項6】

前記特徴ベクトルは、前記位置と前記弾性係数と前記応力とに加えて、前記節点と他の節点との間の補間関数の微分を示す形状微分行列に基づいて生成される、
請求項１記載の構造解析プログラム。

【請求項7】

他の要素に含まれる複数の他の節点それぞれに対して他の特徴ベクトルを生成し、有限要素法シミュレーションを行うことで、前記他の要素に対応する他の要素剛性マトリクスを生成し、前記他の特徴ベクトルと前記他の要素剛性マトリクスとを含む訓練データを用いて前記機械学習モデルを訓練する処理を、前記コンピュータに更に実行させる、
請求項１記載の構造解析プログラム。

【請求項8】

【請求項9】

訓練済みの機械学習モデルを記憶する記憶部と、
メッシュデータの要素に含まれる複数の節点それぞれの特徴ベクトルを、当該節点の位置と、当該節点における弾性係数と、当該節点にかかる応力とに基づいて生成し、前記複数の節点の前記特徴ベクトルを前記機械学習モデルに入力することで、前記複数の節点の間で前記特徴ベクトルの畳み込み演算を行い、前記畳み込み演算の結果に基づいて、前記要素の剛性を示す要素剛性マトリクスを推定する処理部と、
を有する情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は構造解析プログラム、構造解析方法および情報処理装置に関する。

【背景技術】

【0002】

コンピュータシミュレーションの１つに、構造解析シミュレーションがある。構造解析シミュレーションは、物体が外部から受ける力に応じて、物体内部に生じる応力や物体が変形する際の変位量などの力学的特性をコンピュータ上で算出する。構造解析シミュレーションは、数値解析法の１つである有限要素法を使用することがある。

【0003】

有限要素法は、物体の形状を複数の要素に分割する。各要素は、四面体や六面体などの小領域であり、複数の節点（ノード）と節点間を接続する複数の辺（エッジ）とを含む。有限要素法は、節点または辺に変数を割り当て、それら変数の間の関係を離散的に表現した連立一次方程式を生成する。有限要素法は、生成された連立一次方程式を解くことで、解析的に解くことが難しい方程式の近似解を算出する。

【0004】

構造解析シミュレーションにおける有限要素法は、剛性マトリクスを生成して連立一次方程式を規定することがある。剛性マトリクスは、外部から受ける力に対する物体の変形のしづらさである剛性を表す。構造解析シミュレーションは、シミュレーション目的に応じて、剛性マトリクスの生成と連立一次方程式の求解とを反復的に実行することがある。

【0005】

なお、正規化された有限要素を生成し、その有限要素に対する正解の歪みを算出し、変位量と歪みの関係を示すＢマトリクスを形状情報から推定するように深層学習ネットワークを訓練する深層学習システムが提案されている。

【先行技術文献】

【特許文献】

【0006】

【特許文献1】米国特許出願公開第２０２２／０１２９５２０号明細書

【発明の概要】

【発明が解決しようとする課題】

【0007】

構造解析シミュレーションは、実行時に特定されるパラメータ値から剛性マトリクスを生成することがある。しかし、構造解析シミュレーションの中で、剛性マトリクスを生成する負荷が相対的に高いことがある。そのため、剛性マトリクスの生成がボトルネックとなって、構造解析シミュレーションの実行時間が長くなることがある。そこで、１つの側面では、本発明は、構造解析シミュレーションの実行時間を短縮することを目的とする。

【課題を解決するための手段】

【0008】

１つの態様では、コンピュータに以下の処理を実行させる構造解析プログラムが提供される。メッシュデータの要素に含まれる複数の節点それぞれの特徴ベクトルを、当該節点の位置と、当該節点における弾性係数と、当該節点にかかる応力とに基づいて生成する。複数の節点の特徴ベクトルを、訓練済みの機械学習モデルに入力することで、複数の節点の間で特徴ベクトルの畳み込み演算を行い、畳み込み演算の結果に基づいて、要素の剛性を示す要素剛性マトリクスを推定する。

【0009】

また、１つの態様では、コンピュータが実行する構造解析方法が提供される。また、１つの態様では、記憶部と処理部とを有する情報処理装置が提供される。

【発明の効果】

【0010】

１つの側面では、構造解析シミュレーションの実行時間が短縮される。

【図面の簡単な説明】

【0011】

【図1】第１の実施の形態の情報処理装置を説明するための図である。

【図2】第２の実施の形態の情報処理装置のハードウェア例を示す図である。

【図3】要素剛性マトリクスの推定の手順例を示す図である。

【図4】特徴ベクトルの例を示す図である。

【図5】要素剛性マトリクスの例を示す図である。

【図6】隣接行列の例を示す図である。

【図7】要素剛性マトリクスの正規化例を示す図である。

【図8】グラフ畳み込み演算の例を示す図である。

【図9】機械学習モデルの構造例を示す図である。

【図10】機械学習モデルの構造例を示す図（続き）である。

【図11】情報処理装置の機能例を示すブロック図である。

【図12】機械学習の手順例を示すフローチャートである。

【図13】シミュレーションの手順例を示すフローチャートである。

【図14】要素剛性マトリクスの推定誤差の例を示すグラフである。

【図15】要素剛性マトリクス生成の実行時間の例を示すグラフである。

【発明を実施するための形態】

【0012】

以下、本実施の形態を図面を参照して説明する。
［第１の実施の形態］
第１の実施の形態を説明する。

【0013】

図１は、第１の実施の形態の情報処理装置を説明するための図である。
第１の実施の形態の情報処理装置１０は、訓練済みの機械学習モデルを用いて、構造解析シミュレーションに用いられる剛性マトリクスを生成する。情報処理装置１０は、生成された剛性マトリクスを用いて構造解析シミュレーションを行ってもよい。また、情報処理装置１０は、訓練データを用いて機械学習モデルを訓練してもよい。情報処理装置１０は、コンピュータ、構造解析装置または剛性マトリクス生成装置と呼ばれてもよい。情報処理装置１０は、クライアント装置でもよいしサーバ装置でもよい。

【0014】

情報処理装置１０は、記憶部１１および処理部１２を有する。記憶部１１は、ＲＡＭ（Random Access Memory）などの揮発性半導体メモリでもよいし、ＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの不揮発性ストレージでもよい。

【0015】

処理部１２は、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）などのプロセッサである。ただし、処理部１２が、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの電子回路を含んでもよい。プロセッサは、例えば、ＲＡＭなどのメモリ（記憶部１１でもよい）に記憶されたプログラムを実行する。プロセッサの集合が、マルチプロセッサまたは単に「プロセッサ」と呼ばれてもよい。

【0016】

記憶部１１は、訓練済みの機械学習モデル１３を記憶する。機械学習モデル１３は、他の情報処理装置によって訓練されてもよい。機械学習モデル１３は、入力された特徴量から推定値を算出する過程で、畳み込み演算を行う。畳み込み演算は、ある特徴量に、その特徴量と隣接関係をもつ他の特徴量の変換値を足し合わせる処理を含む。機械学習モデル１３の訓練は、例えば、特徴量の変換に用いられるパラメータ値を決定することを含む。機械学習モデル１３は、ニューラルネットワークでもよく、いわゆる畳み込みニューラルネットワークまたはグラフ畳み込みニューラルネットワークでもよい。

【0017】

処理部１２は、メッシュデータに含まれる要素１４を取得する。要素１４は、シミュレーション対象の物体の形状を細分化した小領域であり、二次元領域でもよいし三次元領域でもよい。要素１４は、例えば、ＣＡＤ（Computer Aided Design）ソフトウェアによって生成される。要素１４は、例えば、三角形、四角形、四面体または六面体である。

【0018】

要素１４は、複数の節点および節点間を接続する複数の辺を含む。これら複数の節点および複数の辺によって、要素１４の境界が規定される。節点数および辺数は、要素１４のトポロジに依存する。三角形の場合は節点数が３、四角形の場合は節点数が４、四面体の場合は節点数が４、六面体の場合は節点数が８である。例えば、要素１４は、節点１４ａ，１４ｂ，１４ｃ（節点＃０，＃１，＃２）を含む。

【0019】

処理部１２は、要素１４に含まれる複数の節点それぞれの特徴ベクトルを生成する。例えば、処理部１２は、節点１４ａ，１４ｂ，１４ｃに対応する特徴ベクトル１５ａ，１５ｂ，１５ｃを生成する。このとき、処理部１２は、ある節点の特徴ベクトルを、当該節点の位置と、当該節点における弾性係数と、当該節点にかかる応力とに基づいて生成する。処理部１２は、他の特徴量を更に用いてもよい。

【0020】

各特徴ベクトルは、位置を示す特徴量と、弾性係数を示す特徴量と、応力を示す特徴量とを含むベクトルであってもよい。節点の位置は、例えば、デカルト座標系の二次元座標または三次元座標によって表現される。節点における弾性係数は、例えば、物体の材質から算出される弾性マトリクスに含まれる係数である。節点にかかる応力は、例えば、三次元または六次元の応力ベクトルに含まれる係数である。節点にかかる応力は、シミュレーション上の１つ前の時間ステップで算出された応力であってもよい。

【0021】

処理部１２は、要素１４に含まれる複数の節点の特徴ベクトルを、機械学習モデル１３に入力する。機械学習モデル１３は、複数の節点の間で特徴ベクトルの畳み込み演算を行う。例えば、処理部１２は、特徴ベクトル１５ａ，１５ｂ，１５ｃを機械学習モデル１３に入力することで、特徴ベクトル１５ａ，１５ｂ，１５ｃの間で畳み込み演算を行う。

【0022】

このとき、処理部１２は、複数の節点の隣接関係を示す隣接行列を生成してもよく、機械学習モデル１３に更に隣接行列を入力してもよい。機械学習モデル１３は、隣接行列を参照して複数の特徴ベクトルの間で畳み込み演算を行ってもよい。ただし、この隣接行列は、辺の有無を示す通常の隣接行列よりも密な行列であってもよい。例えば、隣接行列は、要素１４に含まれる全ての節点が相互に隣接していることを示す。

【0023】

処理部１２は、畳み込み演算の結果に基づいて、要素１４の剛性を示す要素剛性マトリクス１６を推定する。剛性は、外部からの力に対する変位のしづらさを示す。例えば、機械学習モデル１３は、要素剛性マトリクス１６を推定値として出力する。このとき、処理部１２は、有限要素法ソフトウェアの通常の行列生成処理をスキップしてもよい。処理部１２は、ＧＰＵなどのハードウェアアクセラレータを利用して推定処理を行ってもよい。要素剛性マトリクス１６は、例えば、正方行列かつ対称行列である。要素剛性マトリクス１６の一辺の長さは、例えば、要素１４に含まれる複数の節点の自由度の合計である。

【0024】

処理部１２は、他の要素に対応する他の要素剛性マトリクスを推定してもよく、要素剛性マトリクス１６と他の要素剛性マトリクスとを並列に推定してもよい。処理部１２は、要素１４に対応する要素剛性マトリクス１６を用いて、複数の要素を含む物体形状全体に対応する全体剛性マトリクスを生成してもよい。例えば、処理部１２は、要素剛性マトリクス１６の中の２つの独立変数に対応する係数を、全体剛性マトリクスの中の当該２つの独立変数に対応する係数に足し合わせる。

【0025】

処理部１２は、要素剛性マトリクス１６または全体剛性マトリクスを用いて連立一次方程式を規定してもよく、線形ソルバを用いて連立一次方程式の解を算出してもよい。例えば、処理部１２は、Ａを全体剛性マトリクスとし、ｘを変位ベクトルとし、ｂを力ベクトルとして、変位ベクトルｘについてＡｘ＝ｂを解く。処理部１２は、算出された変位ベクトルｘに基づいて、変位後の各節点の位置を算出してもよい。また、処理部１２は、変位と歪みの関係を示す方程式と、歪みと応力の関係を示す方程式とを更に用いて、各節点にかかる応力を算出してもよい。

【0026】

処理部１２は、ニュートン・ラフソン法によって、非線形方程式の近似解を算出してもよい。この場合、要素剛性マトリクス１６の生成と連立一次方程式の求解とが反復的に行われ得る。また、処理部１２は、時間進行法によって、時刻を微小時間ずつ進めながら、各時刻における節点の変位や応力を算出してもよい。この場合、要素剛性マトリクス１６の生成と連立一次方程式の求解とが反復的に行われ得る。

【0027】

以上説明したように、第１の実施の形態の情報処理装置１０は、メッシュデータの要素１４に含まれる節点１４ａ，１４ｂ，１４ｃそれぞれの特徴ベクトルを、当該節点の位置と弾性係数と応力とに基づいて生成する。情報処理装置１０は、それら特徴ベクトルを機械学習モデル１３に入力することで、節点１４ａ，１４ｂ，１４ｃの間で特徴ベクトルの畳み込み演算を行い、要素１４の剛性を示す要素剛性マトリクス１６を推定する。

【0028】

これにより、情報処理装置１０は、有限要素ソフトウェアによる通常の行列生成処理と比べて、要素剛性マトリクス１６の生成を高速化できる。よって、情報処理装置１０は、構造解析シミュレーションの実行時間を短縮できる。また、機械学習モデル１３による推定処理は並列化が容易であると共に、並列度を大きくした際のオーバヘッドも比較的小さい。よって、複数の要素に対応する複数の要素剛性マトリクスの生成が高速化される。

【0029】

なお、機械学習モデル１３は、グラフ畳み込みニューラルネットワークであってもよい。これにより、機械学習モデル１３は、四面体や六面体などの様々なトポロジの要素に対して、要素剛性マトリクスを推定することが可能である。また、情報処理装置１０は、ＧＰＵを用いて、複数の要素の要素剛性マトリクスを並列に推定してもよい。これにより、複数の要素を含むメッシュデータの行列生成処理が高速化される。

【0030】

また、情報処理装置１０は、要素１４に含まれる複数の節点それぞれが他の全ての節点と隣接していることを示す隣接行列を生成してもよく、この隣接行列に基づいて畳み込み演算を行ってもよい。これにより、有限要素法ソフトウェアの行列生成処理に利用されているＦｂａｒ法の結果を精度よく再現でき、要素剛性マトリクス１６の精度が向上する。

【0031】

また、節点の位置の情報は、当該節点の初期位置と、シミュレーション上の１つ前の時間ステップで算出された当該節点の変位量とを含んでもよい。また、情報処理装置１０は、補間関数の微分を示す形状微分行列を更に用いて特徴ベクトルを生成してもよい。これにより、要素剛性マトリクス１６の推定精度が更に向上する。

【0032】

また、情報処理装置１０は、有限要素法シミュレーションを実行することで、特徴ベクトルと正解の要素剛性マトリクスとを含む訓練データを生成してもよく、この訓練データを用いて機械学習モデル１３を訓練してもよい。これにより、要素剛性マトリクス１６を精度よく推定できるような機械学習モデル１３が生成される。

【0033】

［第２の実施の形態］
次に、第２の実施の形態を説明する。
第２の実施の形態の情報処理装置１００は、構造解析シミュレーションを実行し、外力に応じた物体構造の時間的および空間的変化を解析する。また、情報処理装置１００は、要素剛性マトリクスを推定するための機械学習モデルを機械学習によって生成する。情報処理装置１００は、Ｆｂａｒ法の行列生成に代えて、訓練済みの機械学習モデルを用いて要素剛性マトリクスを推定する。ただし、機械学習と要素剛性マトリクスの推定とは、異なる情報処理装置によって実行されてもよい。

【0034】

情報処理装置１００は、自動車生産、材料開発、災害対策などに利用され得る。情報処理装置１００は、クライアント装置でもよいしサーバ装置でもよい。情報処理装置１００が、コンピュータ、シミュレーション装置、構造解析装置または機械学習装置と呼ばれてもよい。情報処理装置１００は、第１の実施の形態の情報処理装置１０に対応する。

【0035】

図２は、第２の実施の形態の情報処理装置のハードウェア例を示す図である。
情報処理装置１００は、バスに接続されたＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ１０３、ＧＰＵ１０４、入力インタフェース１０５、媒体リーダ１０６および通信インタフェース１０７を有する。ＣＰＵ１０１は、第１の実施の形態の処理部１２に対応する。ＲＡＭ１０２またはＨＤＤ１０３は、第１の実施の形態の記憶部１１に対応する。

【0036】

ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムおよびデータをＲＡＭ１０２にロードし、プログラムを実行する。情報処理装置１００は、複数のプロセッサを有してもよい。

【0037】

ＲＡＭ１０２は、ＣＰＵ１０１で実行されるプログラムおよびＣＰＵ１０１で演算に使用されるデータを一時的に記憶する揮発性半導体メモリである。情報処理装置１００は、ＲＡＭ以外の種類の揮発性メモリを有してもよい。

【0038】

ＨＤＤ１０３は、オペレーティングシステム（ＯＳ：Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラムと、データとを記憶する不揮発性ストレージである。情報処理装置１００は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の不揮発性ストレージを有してもよい。

【0039】

ＧＰＵ１０４は、ＣＰＵ１０１と連携して画像処理を行い、情報処理装置１００に接続された表示装置１１１に画像を出力する。表示装置１１１は、例えば、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイまたはプロジェクタである。情報処理装置１００に、プリンタなどの他の種類の出力デバイスが接続されてもよい。

【0040】

また、ＧＰＵ１０４は、ＧＰＧＰＵ（General Purpose Computing on Graphics Processing Unit）として使用されてもよい。ＧＰＵ１０４は、ＣＰＵ１０１からの指示に応じてプログラムを実行し得る。ＧＰＵ１０４は、複数のコアを含む。ＧＰＵ１０４は、数万以上の多数のコアを含むことがある。複数のコアは、異なるデータに対して同一のプログラムを並列に実行し得る。情報処理装置１００は、ＲＡＭ１０２以外の揮発性半導体メモリをＧＰＵメモリとして有してもよい。

【0041】

入力インタフェース１０５は、情報処理装置１００に接続された入力デバイス１１２から入力信号を受け付ける。入力デバイス１１２は、例えば、マウス、タッチパネルまたはキーボードである。情報処理装置１００に複数の入力デバイスが接続されてもよい。

【0042】

媒体リーダ１０６は、記録媒体１１３に記録されたプログラムおよびデータを読み取る読み取り装置である。記録媒体１１３は、例えば、磁気ディスク、光ディスクまたは半導体メモリである。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）およびＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）およびＤＶＤ（Digital Versatile Disc）が含まれる。媒体リーダ１０６は、記録媒体１１３から読み取られたプログラムおよびデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、ＣＰＵ１０１によって実行されることがある。

【0043】

記録媒体１１３は、可搬型記録媒体であってもよい。記録媒体１１３は、プログラムおよびデータの配布に用いられることがある。また、記録媒体１１３およびＨＤＤ１０３が、コンピュータ読み取り可能な記録媒体と呼ばれてもよい。

【0044】

通信インタフェース１０７は、ネットワーク１１４を介して他の情報処理装置と通信する。通信インタフェース１０７は、スイッチやルータなどの有線通信装置に接続される有線通信インタフェースでもよいし、基地局やアクセスポイントなどの無線通信装置に接続される無線通信インタフェースでもよい。

【0045】

次に、構造解析シミュレーションおよび剛性マトリクスについて説明する。情報処理装置１００は、有限要素法を用いて構造解析シミュレーションを行う。有限要素法は、物体の形状を、節点および辺を用いて複数の要素に分割する。有限要素法は、偏微分方程式の近似解を求めることで、各要素の位置や応力などの物理量を算出する。

【0046】

第２の実施の形態の構造解析シミュレーションは、時間進行法とニュートン・ラフソン法とを併用する。情報処理装置１００は、時間進行法により、離散的な複数の時間ステップそれぞれにおいて、各節点の位置や応力を算出する。また、情報処理装置１００は、ニュートン・ラフソン法により、各時間ステップにおいて、非線形問題を線形問題に近似し、線形ソルバを用いて線形問題を解いて近似解を更新する。

【0047】

まず、情報処理装置１００は、物体の全体形状を複数の領域に分割し、複数の領域を複数の計算ノードに割り振る。複数の領域の割り振りには、例えば、ＭＰＩ（Message Passing Interface）が用いられる。これにより、複数の領域の構造解析シミュレーションが並列に行われる。複数の計算ノードは、複数のＣＰＵコアまたは複数のＧＰＵコアでもよいし、複数のＣＰＵまたは複数のＧＰＵでもよいし、複数の情報処理装置でもよい。

【0048】

情報処理装置１００は、最初の時間ステップにおいて、複数の要素を含むメッシュデータと、物体の材質を示す材質データと、物体にかかる外力を示す力データとを取得する。情報処理装置１００は、非線形問題をＡｘ＝ｂという線形問題に近似する。このとき、情報処理装置１００は、全体剛性マトリクスを生成する。全体剛性マトリクスは、例えば、行列Ａとして使用される。全体剛性マトリクスは、変位ベクトルと力ベクトルとの間の関係を示す。情報処理装置１００は、線形ソルバを用いて連立一次方程式を解き、ベクトルｘの解に基づいて、各節点の位置や応力の近似解を更新する。

【0049】

情報処理装置１００は、線形問題を修正して連立一次方程式を解くことを繰り返す。同一の時間ステップ内での当該繰り返しは、非線形ループと呼ばれてもよい。情報処理装置１００は、近似解が収束したと判定すると、その時間ステップにおける各節点の位置や応力を確定し、次の時間ステップに進む。例えば、情報処理装置１００は、最新の近似解と１つ前のイテレーションの近似解との差が閾値未満である場合に、近似解が収束したと判定する。情報処理装置１００は、ユーザから指定された最後の時間ステップに到達すると、構造解析シミュレーションを終了する。

【0050】

このため、情報処理装置１００は、同一の時間ステップ内で、近似解が収束するまで全体剛性マトリクスを反復的に生成する。また、情報処理装置１００は、最初の時間ステップから最後の時間ステップに至るまで、全体剛性マトリクスを反復的に生成する。このように、全体剛性マトリクスの生成は、二重ループの中で行われる。

【0051】

ここで、有限要素法ソフトウェアにおいて、全体剛性マトリクスを生成する方法としてＦｂａｒ法がある。しかし、全体剛性マトリクスの生成は負荷が高く、有限要素法シミュレーションの実行時間の多くを占めることがある。また、並列度を上げても、計算ノード間の同期などのオーバヘッドが原因で、高速化には限界がある。また、Ｆｂａｒ法のアルゴリズムは、多数の小規模ループを含む、広範囲のメモリ領域にアクセスする、条件分岐が存在するなどの特徴をもつ。このため、Ｆｂａｒ法のアルゴリズムを、そのままＧＰＵ１０４に実行させることは容易でない。

【0052】

そこで、第２の実施の形態の情報処理装置１００は、各要素の要素剛性マトリクスを、機械学習モデルを用いて推定する。機械学習モデルは、Ｆｂａｒ法の計算結果を模倣するように訓練される。情報処理装置１００は、機械学習モデルによる推定を、ＧＰＵ１０４に実行させる。このとき、情報処理装置１００は、ＧＰＵ１０４に含まれる複数のコアを用いて、複数の要素の要素剛性マトリクスを並列に推定する。

【0053】

図３は、要素剛性マトリクスの推定の手順例を示す図である。
情報処理装置１００は、要素３１から隣接行列３２を生成する。要素３１は、８個の節点を含む六面体である。ただし、要素３１が、４個の節点を含む四面体であってもよい。

【0054】

隣接行列３２は、一辺の長さが８の正方行列である。１つの行は１つの節点に対応し、１つの列は１つの節点に対応する。隣接行列３２は、要素３１に含まれる８個の節点の間の隣接関係を示す。２つの節点に対応する係数は、例えば、当該２つの節点の間に辺が存在する場合は１であり、それ以外の場合は０である。ただし、後述するように第２の実施の形態では、情報処理装置１００は、要素３１を、全ての節点が相互に接続された完全グラフとみなして、隣接行列３２を生成することがある。

【0055】

また、情報処理装置１００は、有限要素法の実行時情報３３から特徴行列３４を生成する。実行時情報３３は、時間進行法やニュートン・ラフソン法のもとで、全体剛性マトリクスの生成時点で得られる各種の情報である。実行時情報３３は、最初の時間ステップでユーザから与えられる数値を含んでもよい。また、実行時情報３３は、１つ前の時間ステップで算出された数値を含んでもよい。また、実行時情報３３は、同一の時間ステップ内での１つ前のイテレーションで算出された数値を含んでもよい。

【0056】

特徴行列３４は、８行７５列の行列である。１つの行は１つの節点に対応し、１つの特徴ベクトルを表す。よって、特徴行列３４は、８個の節点に対応する８個の特徴ベクトルを含む。７５次元の特徴ベクトルの内訳については後述する。情報処理装置１００は、特徴行列３４に対して正規化３５を実行する。情報処理装置１００は、特徴行列３４に含まれる特徴量を次元毎に正規化する。正規化後の特徴量は、－１以上１以下である。

【0057】

情報処理装置１００は、隣接行列３２と正規化３５が行われた特徴行列３４とを、機械学習モデル３６に入力する。機械学習モデル３６は、グラフ畳み込みニューラルネットワークである。機械学習モデル３６は、８個の節点の間で特徴ベクトルの畳み込み演算を行うグラフ畳み込み層を含む。グラフ畳み込み層は、ある節点と隣接する他の節点の特徴ベクトルを、パラメータ値を用いて変換し、変換後の特徴ベクトルを当該節点の特徴ベクトルに足し合わせる。パラメータ値は、機械学習を通じて訓練される。グラフ畳み込み層は、隣接行列３２に基づいて、節点の間の隣接関係を判断する。ただし、前述のように、隣接行列３２が示す隣接関係は、要素３１での実際の辺の有無と一致しない可能性がある。

【0058】

機械学習モデル３６は、要素剛性マトリクス３７を出力する。要素剛性マトリクス３７は、要素３１の剛性を示す。要素剛性マトリクス３７の一辺の長さは、８個の節点における変位の自由度の合計である。要素３１に含まれる８個の節点はそれぞれ、ｘ方向、ｙ方向およびｚ方向の３つの独立変数をもつ。よって、要素剛性マトリクス３７は、一辺の長さが２４の正方行列である。

【0059】

情報処理装置１００は、複数の要素に対応する複数の要素剛性マトリクスを合成して、全体剛性マトリクスを生成する。まず、情報処理装置１００は、全体剛性マトリクスに含まれる全ての係数をゼロに初期化する。全体剛性マトリクスは、複数の要素を含むメッシュデータ全体の剛性を表す。全体剛性マトリクスの一辺の長さは、メッシュデータに含まれる複数の節点における変位の自由度の合計である。

【0060】

要素３１に対応する要素剛性マトリクス３７が生成されると、情報処理装置１００は、要素剛性マトリクス３７から１つの行および１つの列に対応する係数を読み出す。情報処理装置１００は、全体剛性マトリクスの中から、当該１つの行と同じ独立変数を表す行と、当該１つの列と同じ独立変数を表す列とを特定し、特定した行および特定した列に対応する係数に上記の読み出した係数を加算する。情報処理装置１００は、全ての要素に対応する全ての要素剛性マトリクスについて、上記の加算処理を行う。

【0061】

図４は、特徴ベクトルの例を示す図である。
情報処理装置１００は、７５次元の特徴ベクトル４１を節点毎に生成する。特徴ベクトル４１は、座標ベクトル、変位ベクトル、ＥＬＥＭ１ベクトル、形状微分行列、弾性マトリクスおよび応力ベクトルを合成したベクトルである。なお、図４に示した特徴ベクトル４１に含まれる特徴量の例は、正規化前の特徴量である。

【0062】

座標ベクトルは、シミュレーション開始時点、すなわち、最初の時間ステップの開始時点における節点の初期位置を示す。座標ベクトルは、デカルト座標系の座標であり、ｘ成分、ｙ成分およびｚ成分を含む。座標ベクトルの次元数は３である。

【0063】

変位ベクトルは、現在の時間ステップの開始時点における節点の初期変位量を示す。現在の時間ステップの初期変位量は、例えば、１つ前の時間ステップの初期変位量に、１つ前の時間ステップで算出された変位量増分を加えた数値である。変位ベクトルは、節点の変位量のｘ成分、ｙ成分およびｚ成分を含む。変位ベクトルの次元数は３である。

【0064】

ＥＬＥＭ１ベクトルは、現在の時間ステップの開始時点における節点の位置を示す。ＥＬＥＭ１ベクトルは、座標ベクトルに変位ベクトルを加算することで算出される。ＥＬＥＭ１ベクトルは、デカルト座標系の座標であり、ｘ成分、ｙ成分およびｚ成分を含む。ＥＬＥＭ１ベクトルの次元数は３である。なお、機械学習モデル３６の構造によっては、特徴ベクトル４１からＥＬＥＭ１ベクトルが省略されてもよい。

【0065】

形状微分行列は、有限要素法で使用される補間関数の導関数を表す。補間関数は、節点に割り当てられた物量量から、要素内部の任意の点の物理量を推定する関数であり、形状関数と呼ばれることがある。六面体要素では、各節点から見て８個の相手節点が存在する。２つの節点の間の補間関数の微分が、３次元で表現される。よって、形状微分行列は、８行３列の行列である。特徴ベクトル４１では、この８行３列の形状微分行列が直列化されることで、２４次元のベクトルとして表現される。

【0066】

弾性マトリクスは、節点における弾性係数を含む。弾性マトリクスは、弾性係数マトリクスと呼ばれることがある。弾性マトリクスは、物体の材料属性に基づいて算出される。歪みベクトルや応力ベクトルが６次元であるため、弾性マトリクスは、６行６列の行列である。特徴ベクトル４１では、この６行６列の弾性マトリクスが直列化されることで、３６次元のベクトルとして表現される。

【0067】

応力ベクトルは、現在の時間ステップの開始時点において節点にかかる初期応力を示す。現在の時間ステップの初期応力は、例えば、１つ前の時間ステップの初期応力に、１つ前の時間ステップで算出された応力増分を加えた数値である。応力ベクトルは、節点の応力のｘ成分σ_ｘ、ｙ成分σ_ｙ、ｚ成分σ_ｚ、ｘｙ成分σ_ｘｙ、ｙｚ成分σ_ｙｚおよびｚｘ成分σ_ｚｘを含む。応力ベクトルの次元数は６である。

【0068】

図５は、要素剛性マトリクスの例を示す図である。
要素剛性マトリクス４２は、機械学習モデル３６から出力される行列であり、前述の要素剛性マトリクス３７に対応する。要素剛性マトリクス４２は、２４行２４列の正方行列である。要素剛性マトリクス４２は、その物理的特性から、ｉ行ｊ列の係数とｊ行ｉ列の係数が同一となる対称行列である。また、要素剛性マトリクス４２は、対角線付近に大きい値が集まり、対角線から離れるほどゼロや小さい値が多くなる疎行列である。情報処理装置１００は、複数のＧＰＵコアを用いて複数の要素剛性マトリクスを並列に生成する。

【0069】

図６は、隣接行列の例を示す図である。
情報処理装置１００は、要素４３から隣接行列４４または隣接行列４５を生成する。要素４３は、前述の要素３１に対応する。隣接行列４４，４５は、前述の隣接行列３２に対応する。隣接行列４４，４５は、８行８列の正方行列である。

【0070】

隣接行列４４は、要素４３に含まれる８個の節点の間の隣接関係を、辺の有無に基づいて規定した疎行列である。一方の節点に対応する行と他方の節点に対応する列とによって特定される係数は、当該２つの節点を直接に接続する辺が存在すれば１であり、当該２つの節点を直接に接続する辺が存在しなければ０である。要素４３が六面体であるため、隣接行列４４の１つの行は３つの「１」を含む。ただし、対角線上の係数、すなわち、２つの節点が同一である場合の係数を「１」にしてもよい。

【0071】

一方、隣接行列４５は、要素４３に含まれる８個の節点が完全グラフを形成すると仮定して生成された密行列である。隣接行列４５に含まれる全ての係数は「１」である。隣接行列４５によれば、同一の要素に含まれる任意の２つの節点が隣接しているとみなされる。第２の実施の形態では、情報処理装置１００は、隣接行列として、隣接行列４４のような疎行列に代えて、隣接行列４５のような密行列を使用する。

【0072】

情報処理装置１００は、同一の要素の中では、同一の辺を共有する２つの節点の間だけでなく、同一の辺を共有しない２つの節点の間でも特徴量を伝播した方が、有限要素法のＦｂａｒ法を精度よく再現することができる。そのため、隣接行列４５のような密行列を使用することで、要素剛性マトリクスの精度が向上し得る。

【0073】

図７は、要素剛性マトリクスの正規化例を示す図である。
情報処理装置１００は、機械学習モデルの訓練時、機械学習モデルの入力である特徴行列と、機械学習モデルの出力である要素剛性マトリクスとを正規化する。また、情報処理装置１００は、要素剛性マトリクスの推定時、機械学習モデルに入力する特徴行列を正規化し、機械学習モデルが出力する要素剛性マトリクスを元のスケールに戻す。

【0074】

正規化には、例えば、Ｍｉｎ－Ｍａｘ法が用いられる。機械学習モデルの訓練時、情報処理装置１００は、特徴ベクトルに含まれる７５次元それぞれについて、最大値および最小値を特定し、最大値が＋１になり最小値が－１になるように変換方法を決定する。情報処理装置１００は、７５次元それぞれの変換方法を記録しておく。要素剛性マトリクスの推定時、情報処理装置１００は、特徴ベクトルに含まれる７５次元それぞれについて、記録しておいた変換方法に従って特徴量を正規化する。

【0075】

また、機械学習モデルの訓練時、情報処理装置１００は、要素剛性マトリクスに含まれる係数の最大値および最小値を特定し、最大値が＋１になり最小値が－１になるように変換方法を決定する。情報処理装置１００は、係数の変換方法を記録しておく。要素剛性マトリクスの推定時、情報処理装置１００は、機械学習モデルが出力する要素剛性マトリクスに含まれる正規化された係数を、記録しておいた変換方法に従って逆変換する。機械学習モデルの入出力を正規化することで、機械学習モデルの推定精度が向上する。

【0076】

正規化された値は、例えば、以下のように算出される。ｘを正規化前の値、ｘ’を正規化後の値、ｍａｘを最大値、ｍｉｎを最小値とする。ｘ’＝－１＋２（ｘ－ｍｉｎ）／（ｍａｘ－ｍｉｎ）と規定することで、正規化後の値域が［－１，＋１］になる。

【0077】

グラフ４６は、ある要素剛性マトリクスに含まれる係数のうち、係数の値と係数の個数との関係を示す。横軸が正規化前の係数の値を表し、縦軸が個数を表す。グラフ４７は、グラフ４６と同じ要素剛性マトリクスについて、係数の値と係数の個数との関係を示す。横軸が正規化後の係数の値を表し、縦軸が個数を表す。Ｍｉｎ－Ｍａｘ法によって線形変換することで、分布を維持したまま、係数の値域が－１以上＋１以下の範囲になる。

【0078】

次に、グラフ畳み込みニューラルネットワークについて説明する。グラフ畳み込みニューラルネットワークは、全結合層とグラフ畳み込み層とを含む。全結合層は、各節点の特徴ベクトルを、他の節点とは独立に変換する。一方、グラフ畳み込み層は、各節点の特徴ベクトルを、隣接行列が示す隣接節点の特徴ベクトルも参照して変換する。

【0079】

全結合層は、例えば、以下のように特徴ベクトルを変換する。ｘを変換前の特徴行列、ｙを変換後の特徴行列、Ｗを重み行列、ｂをオフセットベクトルとする。特徴行列ｘ，ｙの１つの行は１つの節点に対応する。全結合層は、ｙ＝ｘＷ＋ｂという行列計算を行う。重み行列Ｗとオフセットベクトルｂは、全ての節点に共通に使用されるものであり、機械学習を通じてその係数が決定される。重み行列Ｗのｊ列目は、特徴ベクトルのｊ番目の特徴量を変換するために使用される重みベクトルである。

【0080】

グラフ畳み込み層は、例えば、以下のように特徴ベクトルを変換する。Ａを隣接行列、ｚを変換後の特徴行列とする。グラフ畳み込み層は、ｚ＝Ａｙ＝Ａ（ｘＷ＋ｂ）という行列計算を行う。よって、グラフ畳み込み層は、全結合層と同様の行列計算を行った後に、追加的な行列計算を行う。特徴行列ｙのｊ列目の中の一部または全部の特徴量の線形和によって、特徴ベクトルのｊ番目の特徴量が算出される。

【0081】

図８は、グラフ畳み込み演算の例を示す図である。
特徴ベクトル５１は、着目する節点の特徴ベクトルである。特徴ベクトル５２，５３は、着目する節点と同一の要素に含まれ、かつ、着目する節点と隣接する節点の特徴ベクトルである。グラフ畳み込み層は、特徴ベクトル５１を、特徴ベクトル５１に含まれる特徴量を用いて特徴ベクトル５４に変換する。同様に、グラフ畳み込み層は、特徴ベクトル５２を、特徴ベクトル５２に含まれる特徴量を用いて特徴ベクトル５５に変換し、特徴ベクトル５３を、特徴ベクトル５３に含まれる特徴量を用いて特徴ベクトル５６に変換する。

【0082】

グラフ畳み込み層は、特徴ベクトル５４に特徴ベクトル５５，５６を加算して、特徴ベクトル５７を生成する。特徴ベクトル５７は、グラフ畳み込み演算によって特徴ベクトル５１から変換された、着目する節点の特徴ベクトルである。なお、前述のように密な隣接行列を使用する場合、各節点について隣接する他の節点は７個存在する。

【0083】

図９は、機械学習モデルの構造例を示す図である。
ここでは、第２の実施の形態で使用する機械学習モデルの一例を説明する。機械学習モデルは、全結合層１４０，１４１，１４２，１４４，１４５，１４６，１４７およびグラフ畳み込み層１４３，１４８を含む。

【0084】

全結合層１４０は、入力が２７次元、出力が５０次元の全結合層である。全結合層１４０は、８個の節点それぞれについて、３次元の座標ベクトルと２４次元の形状微分行列を受け付け、５０次元のベクトルを出力する。全結合層１４１は、入力が５３次元、出力が５０次元の全結合層である。全結合層１４１は、８個の節点それぞれについて、３次元の変位ベクトルと全結合層１４０の出力を受け付け、５０次元のベクトルを出力する。

【0085】

全結合層１４２は、入力が２７次元、出力が５０次元の全結合層である。全結合層１４２は、８個の節点それぞれについて、２４次元の形状微分行列と３次元のＥＬＥＭ１ベクトルを受け付け、５０次元のベクトルを出力する。グラフ畳み込み層１４３は、入力が１５０次元、出力が５０次元のグラフ畳み込み層である。グラフ畳み込み層１４３は、８個の節点分の全結合層１４０，１４１，１４２の出力を８行１５０列の行列として受け付け、８個の節点分の５０次元のベクトルを８行５０列の行列として出力する。

【0086】

全結合層１４４は、入力が１００次元、出力が５０次元の全結合層である。全結合層１４４は、８個の節点それぞれについて、全結合層１４１とグラフ畳み込み層１４３の出力とを受け付け、５０次元のベクトルを出力する。全結合層１４５は、入力が１００次元、出力が５０次元の全結合層である。全結合層１４５は、８個の節点それぞれについて、全結合層１４２，１４４の出力を受け付け、５０次元のベクトルを出力する。

【0087】

全結合層１４６は、入力が１０３次元、出力が５０次元の全結合層である。全結合層１４６は、８個の節点それぞれについて、３次元の変位ベクトルと全結合層１４０，１４４の出力を受け付け、５０次元のベクトルを出力する。全結合層１４７は、入力が１００次元、出力が５０次元の全結合層である。全結合層１４７は、８個の節点それぞれについて、全結合層１４５，１４６の出力を受け付け、５０次元のベクトルを出力する。

【0088】

グラフ畳み込み１４８は、入力が１３６次元、出力が７２次元のグラフ畳み込み層である。グラフ畳み込み層１４８は、８個の節点分の３６次元の弾性マトリクスと全結合層１４０，１４７の出力を８行１３６列の行列として受け付け、８個の節点分の７２次元のベクトルを８行７２列の行列として出力する。

【0089】

図１０は、機械学習モデルの構造例を示す図（続き）である。
機械学習モデルは、全結合層１４９，１５０，１５１，１５３，１５４，１５５，１５６，１５７，１５８，１６０およびグラフ畳み込み層１５２，１５９を更に含む。

【0090】

全結合層１４９は、入力が１００次元、出力が５０次元の全結合層である。全結合層１４９は、８個の節点それぞれについて、全結合層１４０，１４４の出力を受け付け、５０次元のベクトルを出力する。全結合層１５０は、入力が１００次元、出力が５０次元の全結合層である。全結合層１５０は、８個の節点それぞれについて、全結合層１４２，１４４の出力を受け付け、５０次元のベクトルを出力する。

【0091】

全結合層１５１は、入力が１５０次元、出力が５０次元の全結合層である。全結合層１５１は、８個の節点それぞれについて、全結合層１４６，１４９，１５０の出力を受け付け、５０次元のベクトルを出力する。グラフ畳み込み層１５２は、入力が１０６次元、出力が７２次元のグラフ畳み込み層である。グラフ畳み込み層１５２は、８個の節点分の６次元の固定値と全結合層１４０，１５１の出力を８行１０６列の行列として受け付け、８個の節点分の７２次元のベクトルを８行７２列の行列として出力する。

【0092】

全結合層１５３は、入力が５６次元、出力が５０次元の全結合層である。全結合層１５３は、８個の節点それぞれについて、６次元の応力ベクトルと全結合層１４６の出力を受け付け、５０次元のベクトルを出力する。全結合層１５４は、入力が１５０次元、出力が５０次元の全結合層である。全結合層１５４は、８個の節点それぞれについて、全結合層１４０，１４４，１５３の出力を受け付け、５０次元のベクトルを出力する。

【0093】

全結合層１５５は、入力が１００次元、出力が５０次元の全結合層である。全結合層１５５は、８個の節点それぞれについて、全結合層１５０，１５４の出力を受け付け、５０次元のベクトルを出力する。全結合層１５６は、入力が１００次元、出力が５０次元の全結合層である。全結合層１５６は、８個の節点それぞれについて、全結合層１４４，１５５の出力を受け付け、５０次元のベクトルを出力する。

【0094】

全結合層１５７は、入力が１００次元、出力が５０次元の全結合層である。全結合層１５７は、８個の節点それぞれについて、全結合層１４２，１５６の出力を受け付け、５０次元のベクトルを出力する。全結合層１５８は、入力が１００次元、出力が５０次元の全結合層である。全結合層１５８は、８個の節点それぞれについて、全結合層１５３，１５７の出力を受け付け、５０次元のベクトルを出力する。

【0095】

グラフ畳み込み層１５９は、入力が１５０次元、出力が７２次元のグラフ畳み込み層である。グラフ畳み込み層１５９は、８個の節点分の全結合層１４０，１５５，１５８の出力を８行１５０列の行列として受け付け、８個の節点分の７２次元のベクトルを８行７２列の行列として出力する。

【0096】

全結合層１６０は、入力が２１６次元、出力が７２次元の全結合層である。全結合層１６０は、８個の節点分のグラフ畳み込み層１４８，１５２，１５９の出力を８行２１６列の行列として受け付け、８行７２列の行列を出力する。情報処理装置１００は、この行列の係数を並べ替えることで、２４行２４列の要素剛性マトリクスを生成する。

【0097】

次に、機械学習モデルの訓練について説明する。情報処理装置１００は、既存の有限要素法ソフトウェアを実行することで、機械学習モデルを訓練するための訓練データを生成する。情報処理装置１００は、有限要素法ソフトウェアによる行列生成の直前時点をトラップし、その時点で保持されている実行時情報を抽出する。実行時情報は、行列生成に使用される入力データであってもよい。また、情報処理装置１００は、行列生成の直後時点をトラップし、生成された要素剛性マトリクスを抽出する。

【0098】

情報処理装置１００は、抽出された実行時情報を８行７５列の特徴行列に変換して、説明変数に相当する入力データとして訓練データに挿入する。また、情報処理装置１００は、要素から８行８列の隣接行列を生成し、説明変数に相当する入力データとして訓練データに挿入する。また、情報処理装置１００は、要素剛性マトリクスを、目的変数に相当する正解ラベルとして訓練データに挿入する。

【0099】

情報処理装置１００は、訓練データを用いて、誤差逆伝播法によって機械学習モデルを訓練する。情報処理装置１００は、隣接行列と特徴行列を機械学習モデルに入力し、機械学習モデルの出力と正解の要素剛性マトリクスとの間の誤差を算出する。情報処理装置１００は、誤差が小さくなるように、機械学習モデルに含まれるパラメータ値を更新する。

【0100】

ここで、１回の要素剛性マトリクスの生成は、１つの分割領域、１つの時間ステップ、１つの非線形イテレーションおよび１つの要素の組み合わせによって特定される。情報処理装置１００は、１回の要素剛性マトリクスの生成から、訓練データの１つのサンプルを生成することができる。この組み合わせの総数は膨大であるため、情報処理装置１００は、構造解析シミュレーション中に生成される全ての要素剛性マトリクスを抽出しなくてもよい。何れの時点の要素剛性マトリクスを抽出するかは、訓練データの精度に影響を与え、その結果として機械学習モデルの精度に影響を与える。

【0101】

一例として、情報処理装置１００は、２００万節点を含むメッシュデータに対して、２万時間ステップの三次元有限要素法を実行する。その途中で、情報処理装置１００は、ランク０のＭＰＩプロセス、第１時間ステップおよび第２非線形イテレーションにおける、１００個の要素の実行時情報および要素剛性マトリクスを抽出する。これにより、１００個のサンプルを含む訓練データが生成される。情報処理装置１００は、ミニバッチサイズを１として、１００イテレーション×２５０エポックで機械学習モデルを訓練する。

【0102】

次に、情報処理装置１００の機能および処理手順について説明する。
図１１は、情報処理装置の機能例を示すブロック図である。
情報処理装置１００は、メッシュデータ記憶部１２１およびモデル記憶部１２２を有する。これらの記憶部は、例えば、ＲＡＭ１０２またはＨＤＤ１０３を用いて実装される。また、情報処理装置１００は、領域分割部１３１、イテレーション制御部１３２、可視化部１３３、行列生成部１３４、線形ソルバ１３５、行列推定部１３６、訓練データ生成部１３７および機械学習部１３８を有する。これらの処理部は、例えば、ＣＰＵ１０１、ＧＰＵ１０４およびプログラムを用いて実装される。

【0103】

メッシュデータ記憶部１２１は、ＣＡＤソフトウェアを用いて生成されたメッシュデータを記憶する。メッシュデータは、複数の節点および複数の辺を含み、シミュレーション対象の物体の形状から分割された複数の要素を含む。また、メッシュデータ記憶部１２１は、物体の材質や外部から物体に働く力などの設定情報を記憶する。

【0104】

モデル記憶部１２２は、訓練済みの機械学習モデルを記憶する。機械学習モデルは、前述のようなグラフ畳み込みニューラルネットワークである。機械学習モデルは、他の情報処理装置によって訓練されてもよい。

【0105】

領域分割部１３１は、メッシュデータを複数の領域に分割する。領域分割部１３１は、分割領域１つにつきＭＰＩプロセスを１つ起動し、複数のＭＰＩプロセスを並列に実行させる。領域分割部１３１は、他の情報処理装置にＭＰＩプロセスを実行させてもよい。

【0106】

イテレーション制御部１３２は、時間進行法およびニュートン・ラフソン法によるイテレーションを制御する。イテレーション制御部１３２は、行列生成部１３４または行列推定部１３６を呼び出して全体剛性マトリクスを生成させる。イテレーション制御部１３２は、全体剛性マトリクスを用いて連立一次方程式を規定し、線形ソルバ１３５を呼び出して連立一次方程式の解を算出させる。イテレーション制御部１３２は、連立一次方程式の解を用いて、変位ベクトルや応力ベクトルなど、非線形問題の近似解を更新する。

【0107】

イテレーション制御部１３２は、近似解が収束したか判定する。近似解が収束していない場合、イテレーション制御部１３２は、近似解を更新するための次の線形問題を規定する。近似解が収束した場合、イテレーション制御部１３２は、次の時間ステップに進む。

【0108】

可視化部１３３は、イテレーション制御部１３２によって算出された複数の時間ステップの近似解を可視化する。例えば、可視化部１３３は、三次元物体の形状や応力の時間変化を可視化した画像を生成し、生成された画像を表示装置１１１に表示する。また、可視化部１３３は、シミュレーション結果をＨＤＤ１０３などの不揮発性ストレージに保存してもよいし、他の情報処理装置に送信してもよい。

【0109】

行列生成部１３４は、イテレーション制御部１３２からの要求に応じて、Ｆｂａｒ法によって全体剛性マトリクスを生成する。行列生成部１３４は、要素毎に要素剛性マトリクスを生成し、複数の要素の要素剛性マトリクスを合成して全体剛性マトリクスを生成する。行列生成部１３４は、ＣＰＵ１０１を用いて要素剛性マトリクスを生成する。

【0110】

線形ソルバ１３５は、イテレーション制御部１３２からの要求に応じて、連立一次方程式の解を算出する。例えば、線形ソルバ１３５は、共役勾配法（ＣＧ：Conjugate Gradient）などの反復法により、大規模連立一次方程式の解を算出する。

【0111】

行列推定部１３６は、イテレーション制御部１３２からの要求に応じて、全体剛性マトリクスを推定する。行列推定部１３６は、行列生成部１３４の代わりに使用される。行列推定部１３６は、要素毎に、実行時情報から特徴行列を生成して正規化する。行列推定部１３６は、正規化された特徴行列を、モデル記憶部１２２に記憶された機械学習モデルに入力することで、正規化された要素剛性マトリクスを推定する。行列推定部１３６は、正規化された要素剛性マトリクスを元のスケールに戻し、複数の要素の要素剛性マトリクスを合成して全体剛性マトリクスを生成する。

【0112】

行列推定部１３６は、ＧＰＵ１０４を用いて要素剛性マトリクスを推定する。行列推定部１３６は、複数の要素に対応する複数の特徴行列を生成し、一度に複数の特徴行列をＧＰＵ１０４に転送することで、ＧＰＵ１０４に複数の要素剛性マトリクスを並列に推定させる。並列処理される要素の個数を示すバッチサイズは、ＧＰＵ１０４のコア数に依存する。バッチサイズは、ユーザから指定されてもよい。

【0113】

訓練データ生成部１３７は、行列生成部１３４から実行時情報および要素剛性マトリクスを抽出する。訓練データ生成部１３７は、実行時情報を特徴行列に変換して正規化し、要素剛性マトリクスを正規化する。また、訓練データ生成部１３７は、要素から隣接行列を生成する。訓練データ生成部１３７は、隣接行列と正規化された特徴行列と正規化された要素剛性マトリクスとを含むサンプルを訓練データに挿入する。これにより、訓練データ生成部１３７は、複数のサンプルを含む訓練データを生成する。

【0114】

機械学習部１３８は、訓練データ生成部１３７によって生成された訓練データを用いて機械学習モデルを訓練し、訓練済みの機械学習モデルをモデル記憶部１２２に保存する。ただし、機械学習部１３８は、訓練された機械学習モデルを表示装置１１１に表示してもよいし、他の情報処理装置に送信してもよい。

【0115】

機械学習部１３８は、誤差逆伝播法によって機械学習モデルを訓練する。機械学習部１３８は、サンプルに含まれる隣接行列と正規化された特徴行列とを機械学習モデルに入力し、機械学習モデルの出力とサンプルに含まれる正規化された要素剛性マトリクスとの間の誤差を算出する。機械学習部１３８は、末尾の層から先頭の層に向かって順に、各層がもつパラメータ値の誤差勾配を算出し、誤差勾配を用いてパラメータ値を更新する。機械学習部１３８は、誤差の算出とパラメータ値の更新とを繰り返す。

【0116】

図１２は、機械学習の手順例を示すフローチャートである。
（Ｓ１０）領域分割部１３１は、メッシュデータを複数の領域に分割する。以下のステップＳ１１～Ｓ１９は、複数の領域に対して並列に実行され得る。

【0117】

（Ｓ１１）行列生成部１３４は、分割領域に含まれる要素のうち要素剛性マトリクスが未生成である１つの要素を選択する。訓練データ生成部１３７は、要素剛性マトリクスの生成に使用される入力データを行列生成部１３４から抽出する。ただし、訓練データ生成部１３７は、特定のイテレーションでのみ入力データを抽出してもよい。

【0118】

（Ｓ１２）行列生成部１３４は、Ｆｂａｒ法によって要素剛性マトリクスを生成する。訓練データ生成部１３７は、生成された要素剛性マトリクスを行列生成部１３４から抽出する。ただし、訓練データ生成部１３７は、特定のイテレーションでのみ要素剛性マトリクスを抽出してもよい。

【0119】

（Ｓ１３）行列生成部１３４は、ステップＳ１２で生成された要素剛性マトリクスを、分割領域に対応する全体剛性マトリクスに合成する。
（Ｓ１４）行列生成部１３４は、分割領域に含まれる全ての要素を処理したか判断する。全ての要素を処理した場合、ステップＳ１５に処理が進む。未処理の要素がある場合、ステップＳ１１に処理が戻り、未処理の要素が１つ選択される。

【0120】

（Ｓ１５）イテレーション制御部１３２は、全体剛性マトリクスを用いて連立一次方程式を規定する。線形ソルバ１３５は、連立一次方程式を解く。
（Ｓ１６）イテレーション制御部１３２は、ステップＳ１５で算出された連立一次方程式の解に基づいて、ニュートン・ラフソン法により非線形方程式の近似解を更新する。

【0121】

（Ｓ１７）イテレーション制御部１３２は、非線形方程式の近似解が収束したか判断する。近似解が収束した場合、ステップＳ１８に処理が進む。近似解が収束していない場合、ステップＳ１１に処理が戻り、ステップＳ１１～Ｓ１６が再度実行される。

【0122】

（Ｓ１８）イテレーション制御部１３２は、最後の時間ステップに到達したか判断する。現在の時間ステップが最後の時間ステップである場合、ステップＳ２０に処理が進む。現在の時間ステップが最後の時間ステップでない場合、ステップＳ１９に処理が進む。

【0123】

（Ｓ１９）イテレーション制御部１３２は、現在の時間ステップの変位ベクトルや応力ベクトルを確定し、時間ステップを１つ進める。そして、ステップＳ１１に処理が戻り、次の時間ステップについてステップＳ１１～Ｓ１７が実行される。

【0124】

（Ｓ２０）訓練データ生成部１３７は、ステップＳ１１で抽出された入力データから特徴行列を生成して正規化する。また、訓練データ生成部１３７は、ステップＳ１２で抽出された要素剛性マトリクスを正規化する。訓練データ生成部１３７は、正規化された特徴行列と正規化された要素剛性マトリクスとを対応付けて訓練データを生成する。

【0125】

（Ｓ２１）機械学習部１３８は、ステップＳ２０で生成された訓練データを用いて、機械学習モデルを訓練する。機械学習部１３８は、訓練された機械学習モデルを保存する。
図１３は、シミュレーションの手順例を示すフローチャートである。

【0126】

（Ｓ３０）領域分割部１３１は、メッシュデータを複数の領域に分割する。以下のステップＳ３１～Ｓ４１は、複数の領域に対して並列に実行され得る。
（Ｓ３１）行列推定部１３６は、分割領域に含まれる要素のうち特徴行列が未生成である１つの要素を選択する。行列推定部１３６は、要素の形状に応じた隣接行列を生成する。例えば、行列推定部１３６は、六面体要素から、全ての係数が「１」である８行８列の密行列を隣接行列として生成する。

【0127】

（Ｓ３２）行列推定部１３６は、実行時情報から特徴行列を生成して正規化する。
（Ｓ３３）行列推定部１３６は、隣接行列および特徴行列がＧＰＵ１０４に未転送である要素の数が、バッチサイズに達したか判断する。要素数がバッチサイズに達した場合、ステップＳ３４に処理が進む。要素数がバッチサイズに達していない場合、ステップＳ３１に処理が戻り、次の１つの要素が選択される。

【0128】

（Ｓ３４）行列推定部１３６は、バッチサイズに相当する個数の要素の隣接行列と特徴行列をＧＰＵ１０４に転送する。行列推定部１３６は、訓練済みの機械学習モデルを用いて、それら複数の要素の要素剛性マトリクスをＧＰＵ１０４に並列に推定させる。

【0129】

（Ｓ３５）行列推定部１３６は、ＧＰＵ１０４から、バッチサイズに相当する個数の要素の要素剛性マトリクスを読み出す。行列推定部１３６は、それら複数の要素の要素剛性マトリクスを、分割領域に対応する全体剛性マトリクスに合成する。

【0130】

（Ｓ３６）行列推定部１３６は、分割領域に含まれる全ての要素を処理したか判断する。全ての要素を処理した場合、ステップＳ３７に処理が進む。未処理の要素がある場合、ステップＳ３１に処理が戻り、ステップＳ３１～Ｓ３５が再度実行される。

【0131】

（Ｓ３７）イテレーション制御部１３２は、全体剛性マトリクスを用いて連立一次方程式を規定する。線形ソルバ１３５は、連立一次方程式を解く。
（Ｓ３８）イテレーション制御部１３２は、ステップＳ３７で算出された連立一次方程式の解に基づいて、ニュートン・ラフソン法により非線形方程式の近似解を更新する。

【0132】

（Ｓ３９）イテレーション制御部１３２は、非線形方程式の近似解が収束したか判断する。近似解が収束した場合、ステップＳ４０に処理が進む。近似解が収束していない場合、ステップＳ３１に処理が戻り、ステップＳ３１～Ｓ３８が再度実行される。

【0133】

（Ｓ４０）イテレーション制御部１３２は、最後の時間ステップに到達したか判断する。現在の時間ステップが最後の時間ステップである場合、シミュレーションが終了する。現在の時間ステップが最後の時間ステップでない場合、ステップＳ４１に処理が進む。

【0134】

（Ｓ４１）イテレーション制御部１３２は、現在の時間ステップの変位ベクトルや応力ベクトルを確定し、時間ステップを１つ進める。そして、ステップＳ３１に処理が戻り、次の時間ステップについてステップＳ３１～Ｓ３９が実行される。

【0135】

図１４は、要素剛性マトリクスの推定誤差の例を示すグラフである。
グラフ６１は、推定された要素剛性マトリクスについて、誤差と係数の個数との関係を示す。横軸は０以上１以下の誤差比率を表し、縦軸は要素剛性マトリクスに含まれる係数のうち特定の推定誤差をもつ係数の個数を表す。ある要素剛性マトリクスについて、最大誤差は０．００２５（０．２５％）であり、平均誤差は０．０００５８（０．０５８％）である。よって、機械学習モデルは、高い精度で要素剛性マトリクスを推定できる。なお、ここでは隣接行列として密行列が使用されている。

【0136】

図１５は、要素剛性マトリクス生成の実行時間の例を示すグラフである。
グラフ６２は、要素数と要素剛性マトリクス生成の実行時間との関係を示す。横軸は要素数を表し、縦軸は特定の要素数の要素剛性マトリクスを生成するためにかかる実行時間を表す。グラフ６２は、要素数として、１個、１０００個、２０００個、３０００個、４０００個、５０００個、１００００個および２００００個を挙げている。同じ要素数についての２つのバーのうち、左側のバーはＦｂａｒ法の実行時間を表し、右側のバーは機械学習モデルによる推定の実行時間を表す。

【0137】

Ｆｂａｒ法の実行時間は、ＣＰＵ１０１が特定の要素数の要素剛性マトリクスを逐次的に生成するためにかかる実行時間である。機械学習モデルによる推定の実行時間は、ＧＰＵ１０４が特定の要素数の要素剛性マトリクスを並列に推定するためにかかる実行時間である。この場合、特定の要素数は、前述のバッチサイズに相当する。

【0138】

ＣＰＵ１０１とＧＰＵ１０４との間に通信のオーバヘッドが存在し、また、ＧＰＵコア単体の演算性能はＣＰＵコアよりも低いことが多い。そのため、バッチサイズが大きいほど推定の高速化効果が大きい。グラフ６２の例では、要素数が２００００個の場合、実行時間が２．４４秒から１．１２秒に短縮しており、実行速度が２．１８倍になっている。ただし、バッチサイズの上限は、ＧＰＵ１０４のコア数などのハードウェア仕様に依存する。一例として、バッチサイズは、１００００個～６００００個程度が好ましい。

【0139】

なお、第２の実施の形態の行列推定は、熱伝導、流体動力学、物質移行、電磁ポテンシャルなどの各種の科学技術計算や各種のコンピュータシミュレーションに応用することが可能である。また、Ｆｂａｒ法は、行列式が負になるような歪んだ要素の要素剛性マトリクスを生成することが困難であるのに対し、機械学習モデルは、そのような歪んだ要素の要素剛性マトリクスも推定することが可能である。

【0140】

以上説明したように、第２の実施の形態の情報処理装置１００は、有限要素法による構造解析シミュレーションで使用される要素剛性マトリクスを、グラフ畳み込みニューラルネットワークを用いて推定する。これにより、情報処理装置１００は、Ｆｂａｒ法で要素剛性マトリクスを生成する場合と比べて、要素剛性マトリクスを生成する負荷を軽減でき、構造解析シミュレーションの実行時間を短縮できる。

【0141】

また、情報処理装置１００は、機械学習モデルによる推定をＧＰＵ１０４に実行させることができ、多数のＧＰＵコアを用いて多数の要素の要素剛性マトリクスを並列に推定することができる。よって、構造解析シミュレーションが高速化される。

【0142】

また、機械学習モデルがグラフ畳み込みニューラルネットワークであるため、情報処理装置１００は、隣接行列を変更することで、四面体や六面体などの様々なトポロジの要素を、同一の機械学習モデルを用いて処理することができる。また、情報処理装置１００は、同一の要素に含まれる複数の節点が完全グラフのように相互に隣接しているとみなして、密行列である隣接行列を生成し、グラフ畳み込み演算に使用する。これにより、機械学習モデルがＦｂａｒ法の計算を模倣して、要素剛性マトリクスを高精度に推定できる。

【0143】

また、情報処理装置１００は、座標ベクトル、変位ベクトル、ＥＬＥＭ１ベクトル、形状微分行列、弾性マトリクスおよび応力ベクトルを含む特徴ベクトルから、要素剛性マトリクスを推定する。これにより、機械学習モデルがＦｂａｒ法の計算を模倣して、要素剛性マトリクスを高精度に推定することができる。

【符号の説明】

【0144】

１０情報処理装置
１１記憶部
１２処理部
１３機械学習モデル
１４要素
１４ａ，１４ｂ，１４ｃ節点
１５ａ，１５ｂ，１５ｃ特徴ベクトル
１６要素剛性マトリクス

【図1】