(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-14
(45)【発行日】2023-04-24
(54)【発明の名称】数値計算方法および数値計算プログラム
(51)【国際特許分類】
G06F 30/23 20200101AFI20230417BHJP
G06F 30/28 20200101ALI20230417BHJP
【FI】
G06F30/23
G06F30/28
(21)【出願番号】P 2021501394
(86)(22)【出願日】2019-02-25
(86)【国際出願番号】 JP2019007071
(87)【国際公開番号】W WO2020174536
(87)【国際公開日】2020-09-03
【審査請求日】2022-01-14
【新規性喪失の例外の表示】特許法第30条第2項適用 平成31年1月28日、東京大学安田講堂(東京都文京区本郷7丁目3-1)にて開催された、平成30年度SIP「革新的燃焼技術」公開シンポジウム、及び、平成31年2月19日に公開された、当該シンポジウムの資料のウェブサイト(https://www.jst.go.jp/sip/dl/k01/sympoend/04s_13.pdf)にて発表。
【新規性喪失の例外の表示】特許法第30条第2項適用 平成30年7月12日、THE GRAND HALL(品川)(東京都港区港南2丁目16-4)にて開催された、JHPCN:学際大規模情報基盤共同利用・共同研究拠点(第10回シンポジウム)、及び、当該シンポジウムの資料のウェブサイト(https://jhpcn-kyoten.itc.u-tokyo.ac.jp/ja/sympo/10th/Intro/EX17320_Poster.pdf)にて発表。
【新規性喪失の例外の表示】特許法第30条第2項適用 平成30年8月27日発行の、東京大学情報基盤センター・スーパーコンピューティングニュース Vol.20,No.Special Issue 2、及び、そのオンライン版(https://www.cc.u-tokyo.ac.jp/public/VOL20/special2/02.201808SP-1_3.pdf)にて発表。
【新規性喪失の例外の表示】特許法第30条第2項適用 平成30年5月11日、九州大学情報基盤研究開発センター(福岡県福岡市西区元岡744)にて開催された、先駆的科学計算に関するフォーラム2018、及び、当該フォーラムの資料のウェブサイト(https://www.cc.kyushu-u.ac.jp/scp/doc/users/forum/forum20180511/fukagawa.pdf)にて発表。
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人科学技術振興機構、戦略的イノベーション創造プログラム事業「自動車用内燃機関摺動面潤滑モデルの確立および設計支援ソフトウェアへの展開」委託研究、産業技術力強化法第19条の適用を受ける特許出願
(73)【特許権者】
【識別番号】504145342
【氏名又は名称】国立大学法人九州大学
(74)【代理人】
【識別番号】100193378
【氏名又は名称】野口 明生
(72)【発明者】
【氏名】深川 宏樹
【審査官】松浦 功
(56)【参考文献】
【文献】特開2005-339492(JP,A)
【文献】向井信彦 外4名,粒子法による大動脈弁の開閉シミュレーション,日本バーチャルリアリティ学会論文誌,特定非営利活動法人日本バーチャルリアリティ学会,2013年,第18巻,第4号,pp. 447-453
(58)【調査した分野】(Int.Cl.,DB名)
G06F 30/00 -30/28
G16Z 99/00
Google Scholar
(57)【特許請求の範囲】
【請求項1】
複数の演算器と前記演算器が演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータを用いて、前記階層型の記憶装置に記憶されている第1時刻における流体および構造体の物理量から微小時間後の第2時刻における前記流体および前記構造体の物理量を連成解析する数値計算方法であって、
前記第1時刻のみにおける流体の物理量から前記第2時刻における前記流体の物理量を流体の支配方程式を用いて計算する処理と、
前記第1時刻のみにおける構造体の物理量から前記第2時刻における前記構造体の物理量を構造体の支配方程式を用いて計算する処理と、
前記第1時刻のみにおける流体の圧力と構造体の応力を対応させて、前記第2時刻における流体と構造体との境界面の位置を境界面の支配方程式を用いて計算する処理と、
を含むことを特徴とする数値計算方法。
【請求項2】
前記流体の支配方程式は、ナビエ・ストークス方程式および連続の方程式であることを特徴とする請求項1に記載の数値計算方法。
【請求項3】
前記構造体の支配方程式は、応力と歪の関係を表す構成方程式であることを特徴とする請求項1または請求項2に記載の数値計算方法。
【請求項4】
前記境界面の支配方程式は、速度場の時間微分と前記流体の圧力および前記構造体の応力の釣り合いとの関係を表す方程式であることを特徴とする請求項1から請求項3のいずれか1項に記載の数値計算方法。
【請求項5】
複数の演算器と前記演算器が演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータに対して、前記階層型の記憶装置に記憶されている第1時刻における流体および構造体の物理量から微小時間後の第2時刻における前記流体および前記構造体の物理量を連成解析する数値計算を指令する数値計算プログラムであって、
前記第1時刻のみにおける流体の物理量から前記第2時刻における前記流体の物理量を流体の支配方程式を用いて計算する処理と、
前記第1時刻のみにおける構造体の物理量から前記第2時刻における前記構造体の物理量を構造体の支配方程式を用いて計算する処理と、
前記第1時刻のみにおける流体の圧力と構造体の応力を対応させて、前記第2時刻における流体と構造体との境界面の位置を境界面の支配方程式を用いて計算する処理と、
を含むことを特徴とする数値計算プログラム。
【請求項6】
前記支配方程式の全てが、場の時間微分を、前記場および前記場の一階空間微分ならびに二階空間微分で表現したものであり、前記支配方程式の全てを時刻および位置で離散化した方程式を用いて処理をすることを特徴とする請求項5に記載の数値計算プログラム。
【請求項7】
前記離散化した方程式を前記複数の演算器に割り当てて並列処理することを特徴とする請求項6に記載の数値計算プログラム。
【請求項8】
前記離散化した方程式は、適切な関数Fを用いて下記式の形で表現されることを特徴とする請求項7に記載の数値計算プログラム。ただし、mは時刻の離散化のインデックスであり、lは位置の離散化のインデックスであり、j
(l)はインデックスlの位置の周辺の点に割り振られたインデックスとしたときに、φ(l,m)は、インデックスlの位置におけるインデックスmの時刻の場を表す。
【数1】
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、数値計算方法および数値計算プログラムに関する。
【背景技術】
【0002】
現在の製品設計ではCAD(Computer-Aided Design)が一般的に用いられている。さらに、製品設計で作成されるCADデータを研究・開発工程におけるエンジニアリングにも用いる、いわゆるCAE(Computer-Aided engineering)も実用化されてきた。CADデータを用いてシミュレーションを行うことで製品性能の事前検証ができれば研究・開発工程を高速化できるからである。
【0003】
工業製品の検証では流体構造連成解析が必要とされる。流体構造連成解析とは、流体の流動と構造体の変形の相互作用を考慮した解析であり、例えば軸受の事前検証では、潤滑油の流れで生じる力で軸受が変形する様子を解析する必要がある。この相互作用に関し、従来の流体構造連成解析では、流体と構造体で別個に方程式を解き、境界面を修正して解を収束させる反復法が用いられてきた(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、反復法を用いた流体構造連成解析で解を収束させるためには、流体と構造体の方程式を反復して計算する必要がある。一方、現在のコンピュータの主流は、複数の演算器(コア)と階層構造のメモリを採用しており、メモリバンド幅が演算性能に比べて低い(Byte/Flopが低い)。このような構成のコンピュータの演算性能を引き出すにはレジスタやキャッシュメモリを有効に使い、メモリにおけるデータ通信量を抑えることができる参照の局所性が高い計算方法を用いる必要がある。この観点からは、反復法を用いた流体構造連成解析は、別個に解いた方程式の解における誤差を比較する必要があり、現在の主流となっている計算機のアーキテクチャに適するものではない。
【0006】
本発明は、上記に鑑みてなされたものであり、その目的は、参照の局所性が高い流体構造連成解析の数値計算方法および数値計算プログラムを提供することである。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明の一態様にかかる数値計算方法は、複数の演算器と前記演算器が演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータを用いて、前記階層型の記憶装置に記憶されている第1時刻における流体および構造体の物理量から微小時間後の第2時刻における前記流体および前記構造体の物理量を連成解析する数値計算方法であって、前記第1時刻のみにおける流体の物理量から前記第2時刻における前記流体の物理量を流体の支配方程式を用いて計算する処理と、前記第1時刻のみにおける構造体の物理量から前記第2時刻における前記構造体の物理量を構造体の支配方程式を用いて計算する処理と、前記第1時刻のみにおける流体の圧力と構造体の応力を対応させて、前記第2時刻における流体と構造体との境界面の位置を境界面の支配方程式を用いて計算する処理と、を含むことを特徴とする。
【0008】
また、本発明の一態様にかかる数値計算プログラムは、複数の演算器と前記演算器が演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータに対して、前記階層型の記憶装置に記憶されている第1時刻における流体および構造体の物理量から微小時間後の第2時刻における前記流体および前記構造体の物理量を連成解析する数値計算を指令する数値計算プログラムであって、前記第1時刻のみにおける流体の物理量から前記第2時刻における前記流体の物理量を流体の支配方程式を用いて計算する処理と、前記第1時刻のみにおける構造体の物理量から前記第2時刻における前記構造体の物理量を構造体の支配方程式を用いて計算する処理と、前記第1時刻のみにおける流体の圧力と構造体の応力を対応させて、前記第2時刻における流体と構造体との境界面の位置を境界面の支配方程式を用いて計算する処理と、を含むことを特徴とする。
【発明の効果】
【0009】
本発明によれば、参照の局所性が高い流体構造連成解析の数値計算方法および数値計算プログラムを提供することができる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、共有メモリ型の階層構造の概念を示す図である。
【
図2】
図2は、分散メモリ型の階層構造の概念を示す図である。
【
図3】
図3は、参照の局所性が高い陽解法の概念を示す図である。
【
図4】
図4は、実施例に用いる流体軸受の模式図である。
【
図5】
図5は、自然座標系から空間座標系への座標変換を示す模式図である。
【
図6】
図6は、圧度分布の計算結果を示すグラフである。
【
図7】
図7は、密度分布の計算結果を示すグラフである。
【
図8】
図8は、圧力分布の計算結果の比較を示すグラフである。
【
図9】
図9は、計算結果の比較を示すグラフである。
【発明を実施するための形態】
【0011】
以下、図面を参照しながら、本発明の実施形態にかかる数値計算方法および数値計算プログラムを詳細に説明する。ただし、以下の説明で参照される図面は模式的なものであり、寸法またはその比率が実際のものとは異なる場合がある。
【0012】
〔装置構成〕
図1は、共有メモリ型の階層構造の概念を示す図であり、
図2は、分散メモリ型の階層構造の概念を示す図である。本発明の実施形態にかかる数値計算方法および数値計算プログラムは、複数の演算器とこれらが演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータにおいて好適に実施される。そこで、
図1および
図2を参照しながら、複数の演算器と階層構造の記憶装置を備えるコンピュータにおける計算処理について説明する。なお、複数の演算器を備えるコンピュータは並列計算機や並列コンピュータとも呼ばれ、この並列計算機上の計算処理は並列処理や並列コンピューティングとも呼ばれる。
【0013】
図1に示される概念図には、複数の演算器10
1~10
nとこれらが演算に用いるデータを記憶するための階層型の記憶装置11とを備える並列計算機100が記載されている。階層型の記憶装置11とは、各演算器10
1~10
nと主記憶装置12との間に階層化された記憶装置を配したものである。
図1に示される例では、演算器10
1~10
nから順に、レジスタ13
1~13
n、L1キャッシュメモリ14
1~14
n、L2キャッシュメモリ15
1~15
m、主記憶装置12の構成を有している。なお、
図1に示される構成は、一つの例であり、階層型の記憶装置11の構成はこれに限定されるものではなく、階層の程度としても、L2キャッシュメモリ15
1~15
mと主記憶装置12との間にL3キャッシュメモリを備えるなどの変形例がある。
【0014】
これらの記憶装置の処理速度は、主記憶装置12、L2キャッシュメモリ151~15m、L1キャッシュメモリ141~14n、レジスタ131~13nの順で高速であり、メモリのデータ転送能力であるメモリバンド幅は、演算器101~10nの演算性能に比べて低い(Byte/Flopが低い)。このような特性から、参照の局所性を高めることが演算性能を発揮させるために重要となる。
【0015】
なお、参照の局所性が高い状態とは、一度参照されたデータが再度参照されることや当該データに近いアドレスのデータが参照される可能性が高いという状態である。言い換えると、演算器101~10nがレジスタ131~13nまたはL1キャッシュメモリ141~14nもしくはL2キャッシュメモリ151~15mなど上位の記憶装置に記憶されているデータを用いて計算を行うことができる状態である。
【0016】
逆に言えば、演算器101~10nが主記憶装置12に記憶されているデータを用いなければいけない状況を少なくする戦略が必要である。例えば、そのような状況は、演算器101が計算した結果を用いて演算器10nが計算をしなければいけないときに起きる。また、演算器101が計算した結果を用いて演算器10nが計算をしなければいけない場合には、演算器101の計算が終わらなければ演算器10nの計算を開始することができず、待ち時間が発生してしまうという問題も発生してしまう。
【0017】
図2は、分散メモリ型の階層構造の概念を示す図であり、大型計算機システムなどで採用されている。
図2に示される並列計算機200では、各ノード16
1~16
nが複数の演算器とこれらが演算に用いるデータを記憶するための階層型の記憶装置とを備えており、さらに、各ノード16
1~16
nにおける主記憶装置12
1~12
nがネットワーク17を介して互いに共有されている。ここで、主記憶装置12
1~12
nの共有とは、主記憶装置12
1~12
nに単一のアドレスを付与することで、各ノード16
1~16
nの演算器が、主記憶装置12
1~12
nに記憶されているデータを相互に参照することができることをいう。
【0018】
上記のような構成のコンピュータでも、参照の局所性を高めることが演算性能を発揮させるために重要となる。特に、あるノード161~16mの演算器が、他のノード161~16mの主記憶装置121~12nに記憶されているデータを参照するような状況を可能な限り少なくすることが重要である。
【0019】
上記観点から、反復法を用いた流体構造連成解析は、現在の主流となっている計算機のアーキテクチャに適するものではない。反復法を用いた流体構造連成解析は、別個に解いた方程式の解における誤差を比較する必要があり、参照の局所性が低いからである。そこで、本発明の実施形態にかかる数値計算方法および数値計算プログラムは、陽解法を用いた流体構造連成解析を行う。以下、陽解法に関する説明を行う。
【0020】
〔陽解法〕
陽解法とは、第1時刻tにおける状態量のみから微小時間後の第2時刻t+Δtにおける位置xの状態量を計算する方法である。一方、陰解法は、第2時刻t+Δtにおける位置xの状態量を計算するために、第2時刻t+Δtにおける他の位置xiの状態量も用いる方法である。端的には、陰解法は、第2時刻t+Δtにおける位置xの状態量を計算するために、第2時刻t+Δtにおける他の位置xiの状態量も含んだ連立方程式を解く必要があり、陽解法では、このような連立方程式を解く必要がない。
【0021】
このように、陽解法では、連立方程式を解く必要がないので、時間ステップ当たりの計算量およびメモリ転送量が少ない。さらに、第2時刻t+Δtにおける位置xの状態量を計算するために、第1時刻tにおける位置xの近傍のみの状態量から計算するようにすれば、より一層、参照の局所性が高まる。そこで、以下で参照の局所性が高い陽解法を適用し得る条件について説明する。
【0022】
結論としては、ある領域の場φ(n,t)の時間発展が、以下の式(1)に示すように、場φ(n,t)と当該場の空間に関する一階微分φ′(n,t)と二階微分φ″(n,t)の関数fで表現することができればよい。なお、位置をn=(n1,n2,n3)とし、時刻をtとしている。
【0023】
【0024】
上記式(1)のように表現される場φ(n,t)を時刻および位置に関して離散化する。時刻tの離散化は、自然数mを用いてt(m+1)=t(m)+Δtとする。位置nの離散化は、自然数lから位置n=(n1,n2,n3)への関数n(l)とする。そして、自然数lに対応した位置n(l)の周辺の点を自然数の組(l,j)から自然数への関数k(l,j)を用いてn(k(l,j))と表す。
【0025】
すると、離散化された場の一階微分φ′(n(l),t(m))と二階微分φ″(n(l),t(m))は、位置n(l)の周辺の点における場φ(n(k(l,j)),t(m))の関数で近似できる。したがって、f(φ(n,t),φ′(n,t),φ″(n,t))を離散化したものは、F(φ(n(k(l,j)),t(m)))と近似できる。
【0026】
結果、上記式(1)は、以下のように離散化される。
【0027】
【0028】
また、上記式(2)における位置n(l)と時間t(m)を離散化に用いたインデックス(l,m)で同一すれば、以下のように表現される。なお、j(l)は、これはインデックスlの位置n(l)の周辺の点に割り振られたインデックスである。
【0029】
【0030】
上記式(3)から解るように、φ(l,m+1)がφ(l,m)とφ(j(l),m)で定まる。ここで重要なことは、式(3)の右辺には、m+1が含まれないことである。このことは、第1時刻t(m)における状態量のみから微小時間後の第2時刻t(m+1)における位置n(l)の状態量を計算することができることを意味している。
【0031】
また、式(3)の右辺には、j
(l)が含まれているが、これはインデックスlの位置n(l)の周辺の点に割り振られたインデックスとしたのだから、φ(j
(l),m)は、第1時刻t(m)における位置n(l)の周辺の点の場φの値である。
図3は、参照の局所性が高い陽解法の概念を示す図である。なお、
図3では、位置および時間をインデックスで同一視して表記している。上記式(3)に示される方程式は、
図3に示されるように、時刻m+1における位置lのφ(l,m+1)を求める際に、時刻mにおける位置lのφ(l,m)とその近傍の位置j-1
(l),j+1
(l)等におけるφ(j
(l),m)を用いるだけでよいことを意味している。インデックスlは、φの値をメモリに記憶する際のアドレスの近さに対応するので、φ(l,m+1)の計算に際し、φ(l,m)とφ(j
(l),m)という参照の局所性が高いデータを用いていることになる。
【0032】
以上の議論から解るように、上記式(1)のように表現できる場合、参照の局所性が高い陽解法を用いることができる。したがって、陽解法を用いた流体構造連成解析を行うためには、流体の支配方程式、構造体の支配方程式、および流体と構造体の境界面の支配方程式を上記式(1)のように表現することが次の目標となる。
【0033】
〔流体の支配方程式〕
流体の支配方程式には、連続の式とナビエ・ストークス方程式を用いる。連続の式は、下記式(4)のように表現され、ナビエ・ストークス方程式は下記式(5)のように表現される。
【0034】
【0035】
ここで、ρは流体内の質量密度であり、*ρは、その双対ホッジであり、要素内の総質量を表す。速度場u#に関するLie微分をLu#と書く。計量テンソルをg( , )とし、u:=g(u#, )と定める。圧力Pは質量密度ρの関数とする。なお、Δはホッジラプラシアンとし、すなわちΔ=d*d*-*d*dである。
【0036】
上記式(4)(5)と式(1)を比較すると解るように、式(4)(5)は、局所性が高い陽解法を適用し得る式(1)の形を有している。したがって、式(4)(5)に陽解法を適用し、*ρとuの時間発展を計算することができる。本発明の実施形態にかかる数値計算方法および数値計算プログラムは、第1時刻tにおける流体の物理量*ρおよびuから微小時間後の第2時刻t+Δtにおける流体の物理量*ρおよびuを上記(4)(5)を用いて計算する。
【0037】
〔構造体の支配方程式〕
構造体の時間発展を記述するためには、構造体の変形に伴う体積素片の位置を追跡する。このとき、初期時刻における体積素片の位置を示す座標値を用いて各体積素片をラベル付けすることができる。このように構造体の体積素片に固定された座標(t,n1,n2,n3)をラグランジュ座標もしくは自然座標という。一方、空間に固定された通常の空間座標(t,x1,x2,x3)はオイラー座標といわれる。ラグランジュ座標の各座標を時刻ごとにオイラー座標に変換する関数Xi(t,n)は、構造体の時間発展を一意に定める。
【0038】
ラグランジュ座標における計量をg=gijdni×dnjとすると、構造体の歪みの時間変化はラグランジュ座標における計量テンソルgijの時間変化を用いて下記式(6)で表すことができる。なお、構造体の応力テンソルki
jは、ei
j:=gjkekjの関数となる。
【0039】
【0040】
オイラー座標におけるMusical isomorphismをオイラー座標における計量δijdxi×dxjを用いて行う。すなわち、Xi:=δijXjである。
【0041】
構造体の支配方程式では、ナビエ・ストークス方程式に対応する速度場として下記式(7)を用いる。
【0042】
【0043】
この速度場に関する構造体の支配方程式は、下記式(8)のように表現される。ただし、下式におけるsは変位ベクトルsi=δij(Xj-nj)である。
【0044】
【0045】
ここで、上記式(8)における圧力Pは、構造体の歪みeを用いて以下のように計算できる。
【0046】
【0047】
ここで、ラメ定数λとμは、ヤング率Eとポアソン比νを用いて、それぞれ以下のように表すことができる。
【0048】
【0049】
なお、上記式(7)を座標表示した場合は下記式(11)のように表現される。
【0050】
【0051】
上記式(8)(11)と式(1)を比較すると解るように、式(8)(11)は、局所性が高い陽解法を適用し得る式(1)の形を有している。したがって、式(8)(11)に陽解法を適用し、速度場uの時間発展を計算することができる。本発明の実施形態にかかる数値計算方法および数値計算プログラムは、第1時刻tにおける構造体の物理量uから微小時間後の第2時刻t+Δtにおける構造体の物理量uを上記式(8)(11)を用いて計算する。
【0052】
〔境界面の支配方程式〕
流体と構造体の境界面では、境界面の位置の速度場uが下記式(13)に従うとする。
【0053】
【0054】
ただし、流体側のPは、流体の密度の関数としての流体の圧力を用い、構造体側のPは、先述の式(9)で表される歪みeの関数としての圧力を用いる。
【0055】
上記式(13)と式(1)を比較すると解るように、式(13)は、局所性が高い陽解法を適用し得る式の形(1)を有している。したがって、式(13)に陽解法を適用し、境界面の位置の速度場uの時間発展を計算することができる。本発明の実施形態にかかる数値計算方法および数値計算プログラムは、第1時刻tにおける流体の圧力と構造体の応力を対応させて、微小時間後の第2時刻t+Δtにおける流体と構造体との境界面の位置を境界面の位置を、上記式(13)を用いて計算する。
【0056】
以上説明したように、本発明の実施形態にかかる数値計算方法および数値計算プログラムが用いる、流体の支配方程式、構造体の支配方程式、および境界面の支配方程式は、局所性が高い陽解法を適用し得る式(1)の形を有している。したがって、複数の演算器と演算器が演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータを用いて、階層型の記憶装置に記憶されている第1時刻における流体および構造体の物理量から微小時間後の第2時刻における流体および構造体の物理量を連成解析する際に、
図3に示したような局所性が高い陽解法を適用し得る。
【0057】
また、本発明の実施形態にかかる数値計算方法および数値計算プログラムでは、流体の支配方程式、構造体の支配方程式、および境界面の支配方程式の全てが式(1)の形を有しているので、これらを時刻および位置で離散化した方程式は、式(3)の形をしている。したがって、並列計算機における演算器にとっては、流体の支配方程式と構造体の支配方程式と境界面の支配方程式とを区別することなく均等に処理することができる。例えば、MPIを使って並列計算する場合には、解析モデルを等分に領域分割することで、ロードバランスをよくできる。
【0058】
〔流体軸受の流体構造連成解析における実施例〕
以下、上記説明した数値計算方法を用いた流体軸受の流体構造連成解析の実施例について説明する。
【0059】
図4は、実施例に用いる流体軸受の模式図である。
図4に示されるように、流体軸受20は、中心に軸21を配し、軸21の外側に軸受22を配し、軸21と軸受22との隙間に潤滑油23を充填した構成を有する。当該構成を有ることにより流体軸受20は、潤滑油23の流動によって軸21と軸受22との関係が自在に回転可能となっている。
【0060】
本実施例に用いる流体軸受20の具体的な寸法は、軸21の半径が30mmであり、軸受22の厚さが30mmであり、軸方向の長さが10mmであり、軸21と軸受22との隙間が30μmである。また、軸21と軸受22との軸心の偏心量は、1.5μmであり、軸21と軸受22との隙間と偏心量との比である偏心率は0.95である。なお、
図4では、各構成の配置が見やすいように軸21と軸受22との隙間における潤滑油23の膜厚を実際の比率よりも大きく表示してある。
【0061】
軸21および軸受22における構造格子の個数は、円周方向に100個であり、軸方向に5個であり、径方向に5個である。潤滑油23における構造行使の個数は、径方向に1層であることの他、軸21および軸受22の場合と同じである。なお、計算精度を向上させるために、圧力変化が激しい隙間の最狭部では構造格子の大きさを小さくしている。
【0062】
潤滑油23の特性は、大気圧下での密度ρが1000kg/m3であり、粘度ηが10mPa・sである。軸21の回転数は1000rpmであり、軸21と潤滑油23との境界面の移動速度uは3.14m/sである。
【0063】
次に、上記のように設定された軸21と軸受22と潤滑油23の構造格子を、
図5に示すように座標変換する。
図5は、自然座標系から空間座標系への座標変換を示す模式図である。
【0064】
図5のように自然座標系(n
1,n
2,n
3)から空間座標系(x
1,x
2,x
3)への座標変換を考えると、各格子の自然座標nから空間座標xへの写像は、形状関数N
α(n)を用いてx
i(n)=x
i
αN
α(n)で与えられる。ここでx
i
αは、節点番号αの節点の空間座標におけるi成分の値である。
【0065】
6面体の2次要素では節点が20個ある。表1は要素の中心点を原点にした場合の節点番号と自然座標との対応を表している。
【0066】
【0067】
【0068】
ただし、上記表2に記載の関数l(r),m(r)は以下で与えられる。
【0069】
【0070】
構造格子の各要素の形状の情報は、自然座標上の計量テンソルgに集約される。この計量テンソルの成分をgijとすると、体積要素は以下のように計算できる。
【0071】
【0072】
一方、計量テンソルgijは、空間座標上の計量テンソルδklから以下のように計算できる。なお、空間座標がカルテシアン座標の場合にはδklがクロネッカーデルタになる。
【0073】
【0074】
上記計量テンソルgijを用いて、流体の支配方程式(式(4)(5))を表現すると以下のようになる。
【0075】
【0076】
〔第1の検証〕
以上のような設定の下、本発明の実施形態にかかる数値計算方法の検証を行う。第1の検証では、軸21および軸受22が剛体であると仮定し、潤滑油23の圧力分布と密度分布の計算を行う。
【0077】
時間刻みを0.1μsとし、自然座標系での空間刻みを2.0として、流体の支配方程式(式(4)(5)すなわち式(18)(19))を離散化して陽解法を適用して潤滑油23の圧力分布と密度分布の計算を行った。
図6は、圧度分布の計算結果を示すグラフであり、
図7は、密度分布の計算結果を示すグラフである。
【0078】
図6および
図7のいずれも、潤滑油23の軸方向中央部の値を記載している。また、横軸のθは、周方向の角度であり、隙間が最も狭くなる位置を0とし、最も広くなる位置を±πとしている。なお、潤滑油23は、θの正方向に流れているとして、周方向の境界条件を周期的境界条件としている。
【0079】
図6および
図7に示されるグラフから解るように、大気圧下では1000kg/m
3であった質量密度が低圧領域では300kg/m
3まで下がっている。これは、低圧領域では気泡が発生し、平均質量密度が大きく下がっていることを示している。
【0080】
この計算結果の精度を検証するために、本発明の実施形態にかかる数値計算方法の計算結果とレイノルズ方程式をガウス=ザイデル法の計算結果とを比較する。レイノルズ方程式とは、質量保存の式とナビエ・ストークス方程式から導出される式であり、次式で与えられる。
【0081】
【0082】
ここでhは潤滑油23の膜厚であり、umは潤滑油23を挟む境界面の移動速度の平均値である。潤滑油23内の圧力Pの分布はρ,h,umの分布から計算できる。ガウス=ザイデル法では、式(20)の質量密度ρを定数として圧力Pを計算する。そして、計算された圧力Pから質量密度ρを計算する。その後、計算された質量密度ρを式(20)に再代入して圧力Pを再計算する。この操作を解が収束するまで繰り返す。
【0083】
キャビテーションを含めるには圧力Pが負圧になるとゼロに置き換える操作をする。この方法ではキャビテーションが発生する箇所で連続の式が満たされないので、一般には正しい圧力分布が得られない。しかし、θ=±πでP=0となる境界条件下では、正しい圧力分布を得ることができることが知られている。
【0084】
このように圧力分布を計算した結果と本発明の実施形態にかかる数値計算方法で圧力分布を計算した結果とを比較する。
図8は、圧力分布の計算結果の比較を示すグラフである。
図8に示されるグラフから解るように、レイノルズ方程式にガウス=ザイデル法を用いて計算した圧力分布(-印)とナビエ・ストークス方程式に本発明の実施形態にかかる数値計算方法を用いて計算した圧力分布(+印)は一致している。
【0085】
〔第2の検証〕
次に、軸受22が弾性体であるとし、潤滑油23の圧力分布の計算を行う。上記第1の検証の結果でも解るように、流体軸受では、軸の回転時に潤滑油23の膜厚の狭小部では圧力が高くなる。結果、弾性体である軸受22も変形を受ける。しかも、軸受22の変形は潤滑油23の膜厚にも影響を与えるので、膜厚の狭小部における潤滑油23の圧力にも影響を与える。ここでは、軸受22が剛体であると仮定した場合と弾性体であるとした場合の計算結果を比較する。
【0086】
図9は、計算結果の比較を示すグラフである。
図9に示されるグラフには、軸受22が剛体であると仮定した場合の圧力分布が+印で記載され、軸受22が弾性体であるとした場合の圧力分布が-印で記載されている。また、
図9に示されるグラフには、軸受22の変形量が●印で併記されている。
【0087】
図9から解るように、軸受22が弾性体であるとした場合、潤滑油23の高圧領域では、軸受22が押し広げられるので、軸受22が剛体であると仮定した計算結果よりも潤滑油23の圧力が低くなっている。このことは、本発明の実施形態にかかる数値計算方法が流体と構造体の相互作用を正しく反映させて連成解析を行っていることを示している。
【0088】
〔並列計算機における性能検証〕
次に、本発明の実施形態にかかる数値計算方法を並列計算機に対する指令として実施した場合、すなわち本発明の実施形態にかかる数値計算プログラムの性能を検証する。
【0089】
既述したように、現在主流のコンピュータは、複数の演算器と階層構造のメモリを採用しており、メモリバンド幅が演算性能に比べて低い。このような構成のコンピュータの演算性能を引き出すにはレジスタやキャッシュメモリを有効に使い、メモリにおけるデータ通信量を抑えることができる参照の局所性が高い計算方法を用いる必要がある。
【0090】
本発明の実施形態にかかる数値計算プログラムは、複数の演算器と階層構造のメモリを採用している並列計算機に対して第1時刻における流体および構造体の物理量から微小時間後の第2時刻における流体および構造体の物理量を連成解析する数値計算の指令であって、第1時刻における流体および構造体の物理量のみから第2時刻における流体および構造体の物理量を計算する陽解法を利用している。したがって、他の演算器が第2時刻における流体および構造体の物理量を計算し終えることを待たずに複数の演算器の各々が第2時刻における流体および構造体の物理量を計算することができる。つまり、いわゆる待ち時間が発生しない。
【0091】
また、本発明の実施形態にかかる数値計算プログラムは、用いる支配方程式の各々は、場の時間微分を、前記場および前記場の一階空間微分ならびに二階空間微分で表現したものであるので、これらを時刻および位置で離散化した場合、先述の式(3)のような形で表現されるので、第1時刻における流体および構造体の物理量のみから第2時刻における流体および構造体の物理量を計算することができるのみならず、離散化した一致のインデックスがメモリのアドレスに対応するので、参照の局所性が高い。つまり、階層構造のメモリにおいて、レジスタやキャッシュを有効に活用することができる。
【0092】
さらに、本発明の実施形態にかかる数値計算プログラムは、離散化した支配方程式がすべて先述の式(3)のような形で表現されるので、並列度が高い。すなわち、離散化した支配方程式を複数の演算器に割り当てて並列処理することで、演算器の処理能力を余すことなく活用することができる。
【0093】
本発明の実施形態にかかる数値計算方法および数値計算プログラムの並列性能の検証では、上記特性が確認される。検証に用いた並列計算機は、九州大学情報基盤研究開発センターのPIMERGY CX400であり、先述の
図2に示される分散メモリ型の並列計算機である。
【0094】
このような分散メモリ型の並列計算機を用いて、本発明の実施形態にかかる数値計算プログラムで処理を行う数値計算問題を固定して、処理に用いる演算器の個数を増やしながら処理能力の測定を行う、いわゆる強スケーリングでの並列性能を測定する。
図10は、並列性能の検証結果を示すグラフである。
【0095】
図10に示されるグラフから解るように、本発明の実施形態にかかる数値計算方法および数値計算プログラムでは、演算器の個数に比例して処理能力が理想的に増加している。なお、本発明の実施形態にかかる数値計算方法および数値計算プログラムでは、23616並列を用いた場合に1600億自由度の計算をすることができる。
【0096】
したがって、本発明の実施形態にかかる数値計算プログラムは、
図2に示されるような分散メモリ型の並列計算機に対する指令として好適であり、本発明の実施形態にかかる数値計算方法は、
図2に示されるような分散メモリ型の並列計算機における処理として好適である。
【0097】
さらに、本発明の実施形態にかかる数値計算方法および数値計算プログラムのGPGPU(General-purpose computing on graphics processing units)への適合性を検証する。
【0098】
GPGPUとは、GPUは画像処理のための演算装置であるが、これを画像処理以外の目的にも応用する技術である。GPUは、単体では計算処理を行うことはできないが、別途のCPUからの指令によって数値計算をすることも可能である。このとき、GPUは、実質的に
図1に示されるような共有メモリ型の並列計算機として機能する。しかも、GPUは、CPUよりも演算器の個数が多く、メモリバンド幅も大きい。そこで、GPGPUが並列計算機の代替として活用されることも多い。
【0099】
本検証で使用するGPUはNVIDIA TESLA P100 for NVLink―Optimized Serversであり、Byte/Flopは0.138(B/F)=0.732(TByte/s)/5.3(TFlop/s)である。したがって、疎行列・ベクトル積(SpMV)が10(B/F)であることを考慮すると、GPU一枚あたりのSpMVの計算速度は、高々73.2(GFlop/s)=0.732(TByte)/10(Byte/Flop)にしかならない。
【0100】
一方、本発明の実施形態にかかる数値計算方法および数値計算プログラムを適用したGPGPUでは、計量テンソルgのGPU一枚あたりの計算速度は337(GFlop/s)である。このことは、以下のことを意味する。
【0101】
先述したように、本発明の実施形態にかかる数値計算方法および数値計算プログラムでは、連立方程式を解く必要がない。一方、比較的計算負荷が高い計量テンソルgの計算をする必要がある。連立方程式を共役勾配法(反復法)で解くと、SpMVが全体の計算における殆どを占める。SpMVは、上述したように、B/F値が高く、GPUの演算性能を活かせない。したがって、本発明の実施形態にかかる数値計算方法および数値計算プログラムを適用したGPGPUは、連立方程式を解く必要がある従来の処理よりもGPUの性能を有効活用することができ、計算速度が向上している。
【0102】
以上のように、本発明の実施形態にかかる数値計算プログラムは、
図1に示されるような共有メモリ型の並列計算機に対する指令として好適であり、本発明の実施形態にかかる数値計算方法は、
図1に示されるような共有メモリ型の並列計算機における処理として好適である。また、
図2に示されるような分散メモリ型の並列計算機における各ノードが共有メモリ型の並列計算機として構成されている、共有分散メモリ型の並列計算機に対しても、本発明の実施形態にかかる数値計算方法および数値計算プログラムが有効であることは言うまでもない。
【0103】
以上、図面を参照しながら本発明を実施形態に基づいて説明してきたが、本発明は上記の実施形態よって限定されるものではない。上記説明した数値計算方法は、適切に数値計算プログラムとして実装することができ、逆に上記説明した数値計算プログラムの実行は、数値計算方法の実施とみなし得る。また、上記説明した数値計算プログラムは、コンピュータが読み取り可能な媒体に記録された状態で生産等の実施を行うことができる。
【符号の説明】
【0104】
100,200 並列計算機
101~10n 演算器
11 階層型の記憶装置
12 主記憶装置
131~13n レジスタ
141~14n L1キャッシュメモリ
151~15m L2キャッシュメモリ
161~16n ノード
17 ネットワーク
20 流体軸受
21 軸
22 軸受
23 潤滑油