特許7122063 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ サウジ　アラビアン　オイル　カンパニーの特許一覧 ▶ マサチューセッツ　インスティテュート　オブ　テクノロジーの特許一覧

特許7122063レイテンシが短縮された並列プロセッサ・データ処理システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
4K
5
6
7
8A
8B
8C
8D
8E
8F

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-08-10

(45)【発行日】2022-08-19

(54)【発明の名称】レイテンシが短縮された並列プロセッサ・データ処理システム

(51)【国際特許分類】

G06F 17/13 20060101AFI20220812BHJP

G16Z 99/00 20190101ALI20220812BHJP

【ＦＩ】

G06F17/13

G16Z99/00

【請求項の数】 6

(21)【出願番号】P 2021527928

(86)(22)【出願日】2019-11-26

(65)【公表番号】

(43)【公表日】2022-02-09

(86)【国際出願番号】 IB2019060190

(87)【国際公開番号】W WO2020110002

(87)【国際公開日】2020-06-04

【審査請求日】2021-07-06

(31)【優先権主張番号】62/773,373

(32)【優先日】2018-11-30

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】16/695,504

(32)【優先日】2019-11-26

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】506018363

【氏名又は名称】サウジアラビアンオイルカンパニー

(73)【特許権者】

【識別番号】596060697

【氏名又は名称】マサチューセッツインスティテュートオブテクノロジー

(74)【代理人】

【識別番号】100088616

【弁理士】

【氏名又は名称】渡邉一平

(74)【代理人】

【識別番号】100154829

【弁理士】

【氏名又は名称】小池成

(74)【代理人】

【識別番号】100132403

【弁理士】

【氏名又は名称】永岡儀雄

(72)【発明者】

【氏名】アルフバイル，マイタムマッキ

(72)【発明者】

【氏名】ウィリアムズ，ジョンアール．

(72)【発明者】

【氏名】ワン，キキ

(72)【発明者】

【氏名】ドグル，アリ

(72)【発明者】

【氏名】ミッディア，ウスフ

【審査官】漆原孝治

(56)【参考文献】

【文献】特開２０１２－１２８７９３（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１２／０３１６７９２（ＵＳ，Ａ１）

【文献】特表２０１４－５２６０４４（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１７／１３

Ｇ１６Ｚ９９／００

(57)【特許請求の範囲】

【請求項1】

技術的物理的関係が生じているシミュレーション時間ステップのシーケンスにおける、時間の関数として離散化された格子データ点の３つの空間次元に存在する技術的物理的関係のパラメータの測定値の並列処理ネットワークとして数値解法を実行するデータ処理システムであって、前記データ処理システムが、少なくとも１つのマスタノードと複数の関連するプロセッサノードとを備えるクラスタコンピュータ・ネットワークを備え、前記データ処理システムが、シミュレーション時間ステップのシーケンス中にノード間のシミュレーションの処理結果の通信のレイテンシを短縮して数値シミュレーションを実行する、データ処理システムであって、
（ａ）入力データと、技術的プロセスの数値シミュレーションのための初期化および時間ステップ・パラメータと、前記時間ステップのシーケンスにおける現在の時間ステップにおいて前記技術的プロセスにおいて発生する物理的現象の入力測定値とを提供する、前記少なくとも１つのマスタノードと、
（ｂ）前記少なくとも１つのマスタノードは、前記数値シミュレーションによって処理されるべき複数のプロセッサノードの間で格子データ点を割り当て、割り当てられた格子データ点が、現在の時間ステップにおける技術的物理的関係のパラメータの測定値を表す、前記少なくとも１つのマスタノードと、
（ｃ）前記プロセッサノードは、以下のステップであって、
（１）前記マスタノードからの前記割り当てられた格子データ点を受信するステップと、
（２）以下のステップであって、
（ｉ）前記割り当てられた格子データ点に対してステンシル演算を実行することによって、前記割り当てられた格子データ点の外面に対するデータ点の３次元縮小立方体を形成するステップと、
（ｉｉ）形成された前記データ点の３次元縮小立方体を、３次元空間座標内の連続するデータ点を割り当てられたプロセッサノードに通信するステップと、
（ｉｉｉ）前記割り当てられた格子データ点に対してステンシル演算を行うことにより、離散化された格子データ点の３つの空間次元の各々に対してデータ点の３次元縮小ビームを形成するステップと、
（ｉｖ）形成された前記データ点の３次元縮小ビームを、３次元空間座標内の連続するデータ点を割り当てられたプロセッサノードに通信するステップと、
（ｖ）前記割り当てられた格子データ点に対してステンシル演算を行うことにより、離散化された格子データ点の３つの空間次元の各々に対するデータ点の３次元縮小コアを形成するステップと、
（ｖｉ）形成された前記データ点の３次元縮小コアを、３次元空間座標内の連続するデータ点を割り当てられたプロセッサノードに通信するステップと、
（ｖｉｉ）前記割り当てられた格子データ点に対してステンシル演算を行うことにより、離散化された格子データ点の３つの空間次元の各々についてデータ点の３次元伸長立方体を形成し、現在の時間ステップにおける割り当てられた格子データ点の３つの空間次元における技術的物理的関係のパラメータの測定値を形成するステップと、
を実行することによって、前記格子データを編成する、前記受信された割り当てられた格子データ点を処理するステップと、
を実行することによって、現在の時間ステップについて前記割り当てられた格子データ点の４次元計算領域として前記数値シミュレーションを実行する、前記プロセッサノードと、
（ｄ）前記少なくとも１つのマスタノードが、前記数値シミュレーションが前記シーケンスの前記時間ステップの各々が実行されたかどうかをさらに判定し、実行されていない場合、
（１）前記時間ステップを増分し、
（２）入力データと、技術的プロセスの数値シミュレーションのための初期化および時間ステップ・パラメータと、前記時間ステップのシーケンスにおける前記増分された時間ステップにおいて前記技術的プロセスで発生する前記物理的現象の入力測定値とを提供する、前記ステップに戻り、
（３）前記少なくとも１つのマスタノードは、前記数値シミュレーションによって処理されるべき格子データ点を前記複数のプロセッサノード間に割り当てる、
前記少なくとも１つのマスタノードと、
（ｅ）前記増分された時間ステップについて割り当てられた格子データ点の４次元計算領域として数値シミュレーションを実行する、前記複数のプロセッサノードと、
を備える、データ処理システム。

【請求項2】

前記少なくとも１つのマスタノードが、前記数値シミュレーションの前記シーケンスの前記時間ステップの各々が実行されたことを決定し、さらに、前記数値シミュレーションの前記時間ステップのシーケンスについて、前記割り当てられた格子データ点の前記３つの空間次元における技術的物理的関係のパラメータの前記測定値を記憶するステップを含む、請求項１に記載のデータ処理システム。

【請求項3】

前記少なくとも１つのマスタノードが、前記数値シミュレーションの前記シーケンスの前記時間ステップの各々が実行されたことを決定し、さらに、前記数値シミュレーションの前記時間ステップのシーケンスについて、前記割り当てられた格子データ点の前記３つの空間次元における技術的物理的関係のパラメータの前記測定値の出力表示を形成するステップを含む、請求項１に記載のデータ処理システム。

【請求項4】

前記技術的物理的関係が、３次元空間座標を経由する経時的な熱拡散を含む、請求項１に記載のデータ処理システム。

【請求項5】

前記技術的物理的関係が、地下炭化水素貯留層からの炭化水素生産中の流体状態の経時的な貯留層シミュレーションを含む、請求項１に記載のデータ処理システム。

【請求項6】

前記技術的物理的関係が、３次元空間座標を経由する経時的なエネルギー波の伝搬を含む、請求項１に記載のデータ処理システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、複雑な技術的特徴の物理的条件の決定中のレイテンシの短縮によって改良された性能で動作し、技術的問題を解決する、並列プロセッサを有するデータ処理システムに関する。データ処理システムは、偏微分方程式の数値解法によるシミュレーションと他の複雑な数値シミュレーションを実行することにより動作する。

【背景技術】

【0002】

多くの技術は、複雑な物理的関係によって支配される技術上のまたは技術的な問題を伴う。例としては、タービン翼の設計と建設に関わる熱拡散関係、地下炭化水素貯留層からの流体生産、地震探査中の３次元地下領域を通る機械的波動エネルギーの移動が挙げられる。これらの技術に含まれる測定値および条件の性能および相互関係は、偏微分方程式（ＰＤＥ）によって支配される。反復線形ソルバとして知られているものを使用して、測定値および条件の性能および相互関係をコンピュータで解くことができる場合にも、同様の状況が存在する。より多くの並列プロセッサを使用することによって、より時間のかからない方法で数値解法によってこれらの結果を決定することに対する強い要求は現在、小規模で長い非定常シミュレーションでは満たされていない。ＰＤＥが数百万（２００万以上）の格子点上で空間的に離散化されている場合、シミュレーションは小規模と考えられる。また、ＰＤＥが何百万もの時間ステップに対して時間積分する必要がある場合には、シミュレーションは長いと考えられる。小規模で長いシミュレーションは、多くの技術的プロセスおよび物理的関係、ならびに科学的研究から生じる。多くの産業では、小規模で長いシミュレーションに遭遇する。

【0003】

貯留層シミュレーションから生じる、熱拡散、波動方程式および線形システムは、並列プロセッサでの数値解法によるシミュレーションを含む技術プロセスおよび物理的関係の実施例である。例えば、ターボ機械部品の空熱設計では、タービン翼の後縁の設計において、小規模で長いシミュレーションが用いられてきた。上述した様々なタイプのこれらのシミュレーションの解法に要するコンピュータ処理時間は、しばしば新製品開発や技術革新に対するネックとなる。これらのシミュレーションは並列化するのが困難であり、多くの並列プロセッサにスケーリングするのがさらに困難である。

【0004】

平行なＰＤＥソルバまたは数値ソルバのスケーリングは、計算ノードが互いに通信し、データを交換する必要があるので、常に制限される。各時間ステップにおける各プロセッサノードの離散化された格子点におけるデータ値は、プロセッサノードにおいて処理されているデータ値のいくつかおよび隣接する格子点の処理に影響を及ぼすので、通信が必要とされる。さらに、離散化された格子点のうちのいくつかは、他のプロセッサノードで処理される格子点に隣接している。

【0005】

並列処理におけるプロセッサノード間の通信の必要性は、並列ＰＤＥソルバがより多くのノードに展開されるにつれて、より頻繁に発生する。これにより、潜在的なＰＤＥソルバの速度が低下する。さらに、プロセッサを追加しても、実行時間が短縮されなくなる。実行時間の短縮が得られない限界はスケーリング限界として知られており、並列ＰＤＥソルバがより多くのノードに展開されるにつれて必然的に遭遇する。ほとんどの場合、平行ＰＤＥソルバのスケーリング限界は、計算ノード間で通信するのに必要な時間である。計算ノード間でデータを送受信するのにかかる時間は、ネットワークレイテンシと呼ばれる。ノード間の通信時間は、スケーリング限界の基本的な原因である。

【発明の概要】

【0006】

簡単に述べると、本発明は、偏微分方程式の数値解法によるシミュレーションまたは同程度の複雑さと持続時間のシミュレーションを実行する並列プロセッサを備えた、新しい改良されたデータ処理システムを提供する。データ処理システムは、数値シミュレーション中に遭遇する頻繁なネットワークレイテンシを克服することによって、並列プロセッサソルバのスケーリング限界を拡張する。これは計算ノード間で、より少ないが、より大きなデータ・バッチを交換することによって達成される。データ処理システムは、シミュレーションのためのさらなる計算を実行するために他のノードと通信することが絶対的に必要となるまで、通信される必要があるデータをプロセッサノード内で連続的にアセンブルする。プロセッサノード間の通信が必要になると、アセンブルされたデータは、いくつかのより小さなデータ・バッチではなく、大きなバッチとして一度に通信される。

【0007】

本出願は、カラーで作成された図面を含む。本発明の利点および恩恵をより完全に理解するために、カラー図面が必要であることが提示される。上記参照した出願に開示されているように、本発明は複雑な技術的特徴の物理的状態の決定中のレイテンシの短縮によって改良された性能で動作し、技術的問題を解決する、並列プロセッサを有するデータ処理システムに関する。得られたカラー図面は、この短縮されたレイテンシがどのように得られるかを示す上で重要である。出願人は、本出願と共に提出された同封のカラー図が、本発明の特許請求された実施形態のこれらの特徴を例示するための唯一の実用的な媒体であることを提示している。

【図面の簡単な説明】

【0008】

【図1】本発明による数値解法によりシミュレーションを行う並列プロセッサを有するデータ処理システムの概略図である。

【0009】

【図2】本発明による数値解法によりシミュレーションを実行する図１の並列プロセッサを有するデータ処理システムのワークフローまたは動作の機能ブロック図である。

【0010】

【図3】本発明による数値解によりシミュレーションを行う図１のデータ処理システムの動作の機能性の概略図である。

【0011】

【図4】（Ａ）～（Ｊ）図２のワークフローの一部による図１のデータ処理システムの動作の一例を示す概略図である。

【図4K】図２のワークフローの一部による図１のデータ処理システムの動作の一例を示す概略図である。

【0012】

【図5】（Ａ）～（Ｌ）は図２のワークフローの別の部分による図１のデータ処理システムの動作の一例を示す概略図である。

【0013】

【図6】（Ａ）～（Ｌ）は図２のワークフローのさらなる部分による図１のデータ処理システムの動作の一例を示す概略図である。

【0014】

【図7】（Ａ）～（Ｈ）は図２のワークフローの別の部分による図１のデータ処理システムの動作の一例を示す概略図である。

【0015】

【図8A】図１のデータ処理システムの動作の出力結果の表示例である。

【図8B】図１のデータ処理システムの動作の出力結果の表示例である。

【図8C】図１のデータ処理システムの動作の出力結果の表示例である。

【図8D】図１のデータ処理システムの動作の出力結果の表示例である。

【図8E】図１のデータ処理システムの動作の出力結果の表示例である。

【図8F】図１のデータ処理システムの動作の出力結果の表示例である。

【発明を実施するための形態】

【0016】

本発明では、図１に概略的に示すように、本発明によるデータ処理システムＤが、ＣＰＵ１０２の複数のマスタノード１００と、偏微分方程式によって支配される技術的および物理的関係などの同時数値シミュレーションを実行するように構成されたネットワークとして動作するプロセッサまたはワーカノード１０４のグループとを含む。

【0017】

データ処理システムＤは、非定常シミュレーションの高性能計算（ＨＰＣ）のための処理プラットフォームとして提供される。データ処理システムＤは、１つ以上の中央処理装置またはＣＰＵ１０２を含む。ＣＰＵまたはＣＰＵ１０２は、実行されている数値シミュレーションによるタイプおよび性質の一般的な入力パラメータのためのメモリまたはデータベース１０６と関連付けられている。このデータベースは例えば、実行されるシミュレーションの初期条件を記憶する。貯留層シミュレーションにおいて、初期条件は、圧力分布、油井データ、油飽和データを含む。熱拡散シミュレーションでは、初期熱源と本体材料タイプが提供される。

【0018】

ＣＰＵ１０２と動作可能に接続されたユーザ・インターフェース１０８は、グラフィカル・イメージを表示するためのグラフィカル・ディスプレイ１１０、プリンタまたは他の適切なイメージ形成機構、および処理結果、データベース記録および他の情報の出力形態を操作、アクセス、および提供するためのユーザ・アクセスを提供するためのユーザ入力装置１１２を含む。

【0019】

メモリまたはデータベース１０６は、典型的には外部データ記憶サーバまたはコンピュータ１１８のメモリ１１４内にある。データベース１０６は、実行されている数値シミュレーションにおけるセルの構造、位置、および編成を含むデータ、データ一般入力パラメータ、ならびに以下に説明するように、数値シミュレーションのためにデータ処理システムＤによって処理されるデータを含む。

【0020】

データ処理システムＤのＣＰＵまたはコンピュータ１０２は、動作命令、制御情報を記憶し、必要に応じて記憶または転送バッファとして機能するために、マスタノード１００と、マスタノード１００に結合された内部メモリ１２０とを含む。データ処理システムＤは、メモリ１２０に記憶されたプログラムコード１２２を含む。本発明によるプログラムコード１２２は、データ処理システムＤに必要な数値シミュレーションを実行させるコンピュータ動作可能命令の形態である。プログラムコード１２２は図１に示すように、マスタノード１００および並列プロセッサノード１２４のそれぞれにも格納される。プログラムコード１２２は、マスタノード１００およびプロセッサノード１０４に、実行されている数値適合シミュレーションの間に、数値シミュレーションデータおよび制御命令を、互いを行き来するよう転送させる。

【0021】

プログラムコード１２２は、データ処理システムＤの機能を制御し、その動作を指示する、特定の順序付けられた動作のセットを提供するマイクロコード、プログラム、ルーチン、またはシンボリック・コンピュータ動作可能言語の形態であってもよいことに留意されたい。本出願の後続の部分に提示される表１～表９は、擬似コードで書かれた、そのような命令の一実施形態であり、任意の最新のコンピュータプログラミング言語で実装することができる。本発明の検証目的のために、完全に機能的なプロトタイプがＣ＋＋プログラミング言語で書かれた。

【0022】

プロセッサノード１０４は、本発明による探査および生産データの処理を実行するようにプログラムされた汎用のプログラム可能なデータ処理ユニットである。プロセッサノード１０４はマスタノード１００の制御の下で動作し、得られた処理結果はその後メモリ１１４内にアセンブルされ、そこでデータは、出力ディスプレイのユーザ・インターフェース１０８と共に形成するために提供され、分析および解釈のためのデータ記録を形成する。

【0023】

本発明は使用される特定のコンピュータ・ハードウェアから独立しているが、本発明の例示的な実施形態はクラウドベースまたは高ネットワークレイテンシ・クラスタコンピュータのマスタノード１００およびプロセッサノード１０４に基づくことが好ましい。しかし、他のコンピュータ・ハードウェアを使用することもでき、本発明は、最近開発された多数のタイプのコンピュータ・ネットワーキング・ハードウェアを装備したコンピュータ・クラスタにおいても有効であることを理解されたい。

【0024】

ネットワークレイテンシは、バンド幅または計算能力ではなく、偏微分方程式（ＰＤＥ）によって支配される複雑な物理的関係、または線形ソルバを使用してコンピュータで解く複雑な物理的関係を、並列処理によっていかに迅速に解くことができるかをしばしば制限する。本発明は、コンピュータ性能を改善し、非定常ＰＤＥおよび他の数値シミュレーションの並列時間積分の速度を上げるための、新しい、改良された方法論を提供する。この方法論は、時空間領域分解の掃引ルールと呼ばれる。コンピュータ・クラスタ内の計算ノード間のＰＤＥの計算領域を分解するとき、掃引ルールは時間を追加の次元とみなす。既存の空間のみの領域分解と比較して、掃引ルールは、同様の量のデータを通信するが、頻度は少なく、より大きなメッセージで通信する。

【0025】

図２は、マスタノード１００によって実行される、本発明によるデータ処理システムＤにおけるデータ処理ステップのセット２００の機能ブロック図である。処理ステップセット２００の制御下で本発明に従って動作するデータ処理システムＤは、コンピュータ性能を改善し、非定常ＰＤＥおよび他の数値シミュレーションの並列時間積分の速度を上げる。これは、影響の領域と依存性の領域を利用する方法で計算ノード間の空間と時間を分解することによって、いかなる冗長な計算を招くことなく達成され、多くの時間ステップごとに１回通信できるようにする。より少ない頻度で通信することによって、データ処理システムＤはレイテンシの障壁を克服し、並列プロセスコンピュータネットワークの往復レイテンシ当たり平均して２つ以上の時間ステップを進める。

【0026】

本発明は、上述した時間の測定および条件の性能および相互関係が複雑な物理的関係の数値シミュレーション中に遭遇する頻繁なネットワークレイテンシを克服することによって、並列ＰＤＥソルバのスケーリング限界を拡張する。

【0027】

したがって、本発明はネットワークレイテンシを短縮することにより、並列プロセッサコンピュータ・ネットワークのコンピュータ機能を改善する。本発明は特に、各プロセッサが少数の格子点を割り当てられるコンピュータ・クラスタの並列プロセッサ１０４の間で区分される離散化されたデータ点の数値解法によるシミュレーションを実行するように適合される。本発明はまた、並列コンピュータ・ネットワーク処理における技術的問題、すなわち、隣接する格子点間のデータ値の通信が、シミュレーションの目的のために使用することができる並列プロセッサノードの数に制限を課すネットワークレイテンシを解決する。

【0028】

本発明は、計算ノード間で、より少ないが、より大きなデータのバッチを交換することによって、スケーリング限界を拡張する。本発明は、さらなる計算を実行するためにそのデータを通信することが必要になるまで、個々のプロセッサノードにおいて、通信され、アセンブルされ、配置される必要があるデータを保持することによって、これらの条件におけるスケーリング限界を拡張する。この場合、アセンブルされ、組織化されたデータは、各々がいくつかのより小さなデータのバッチから構成される複数の中間通信のいくつかの代わりに、単一の大きなデータグループとして通信される。

【0029】

ステップ２０１（図２）に示すように、本発明によるデータ処理システムＤによる処理は、実行されるべき特定の複雑な数値シミュレーションのための初期化および時間ステップ関数またはパラメータを受信することから始まる。ステップ２０１中、シミュレーションされる物理的または技術的プロセスの初期条件および初期パラメータ値、シミュレーションのための初期シミュレーション時間ステップ条件、およびシミュレーションが実行されるべき特定の数のシミュレーション時間ステップもまた、データ処理システムＤ内で受信される。

【0030】

（３次元空間（３Ｄ）におけるアセンブルされたシミュレーションデータの構成要素の種類）
本発明による３次元空間（３Ｄ）におけるデータ処理システムＤの動作は、４つの主要な時空間構成要素を有する。これらの時空間構成要素のうちの２つは、３つの順列を有する。したがって、全体として、データ処理システムＤはｘ、ｙ、およびｚ軸のすべての可能な順列を含むように、アセンブルされたデータの８つの時空間成分を有する。動作は、個々のプロセッサノード１０４に分割された離散化されたデータ点の一例を概略的に表す、図４Ａに示すような立方体部分領域分域４００を形成するためのステップ２０２（図２）から始まる。立方体４００は、図４Ｉに４０２として示されるような小さな２×２×２立方体になるまで、掃引３Ｄ処理が時間的に進むにつれて縮小する。ステップ２０２中に形成されるアセンブルされたシミュレータ・データの第１の時空間構成要素は、縮小立方体と呼ばれる。ステップ２０４に示すように、マスタノード１００とプロセッサノード１０４との間の第１の通信は、ステップ２０２中に縮小立方体が形成された後に行われる。その後、ステップ２０６中に、縮小立方体４２０を形成する結果は、図４Ｋに示されるように、互いに適切に接続されて、ビームと呼ばれる別のタイプの構成要素を形成する。

【0031】

３つの空間軸で作業する方法論のために、ステップ２０６中に３つのビームが形成され、それらの方向によって、緯線方向ビーム、経線方向ビーム、および高度方向ビームとして識別される。図５は、経線方向ビームの形成に含まれるステップを示す。

【0032】

ステップ２０６中に緯線方向ビーム、経線方向ビーム、および高度方向ビームが形成された後、ステップ２０８中にデータ処理システムＤは、マスタノード１００とプロセッサノード１０４との間で第２の通信を実行する。図５Ｌに示すようにビームを形成した最終結果を通信する通信ステップ２０８の後、データ処理システムＤはステップ２１０中に、コアとして定義される立方体の形態の追加要素の内部伸長面を構築する。ここでも、ｘ、ｙ、およびｚ軸について働くことにより、ステップ２１０中に形成されるコアは、緯線方向コア、経線方向コア、および高度方向コアと呼ばれる。図６の図６Ｌは、底部高度方向コアを示す。ステップ２１０中にコアを構築した後、ステップ２１２中にデータ処理システムＤは、その第３の、マスタノード１００とプロセッサノード１０４との間の通信を実行する。

【0033】

ステップ２１４中に、データ処理システムＤは、数値シミュレーションのためにデータが集められた最後の時空間構成要素を形成する。この第４の構成要素は、図７の７Ｂに概略的に示されるように、２×２×２の立方体を生成することによって開始し、この立方体は図７の７Ｈに示されるように、処理が開始したサイズと同様のサイズにサイズが伸長する。

【0034】

ステップ２１６は、本シミュレーション時間ステップについて、ステップ２１４中に３Ｄ立方体を形成した後に実行される。ステップ２１６は、数値シミュレーションに必要な指定数のシミュレーション時間ステップが実行されたかどうかを決定する。ステップ２１６中に、数値シミュレーションについて指定数のシミュレーション時間ステップが実行されたことが示された場合、データ処理システムＤによる処理はステップ２２０に進む。

【0035】

ステップ２２０中、数値シミュレーションの結果は、メモリ１０６またはデータ処理システムＤの他のメモリ内の適切な記憶位置に記憶される。数値シミュレーションの結果はまた、検査、研究、および分析のために、ユーザ・インターフェース１０８のグラフィカル・ディスプレイ１１０を介して利用可能にされ得る。

【0036】

ステップ２１６の結果が、実行されている数値シミュレーションについて指定数のシミュレーション時間ステップがまだ発生していないことを示す場合、シミュレーション時間ステップは増分または進められ、処理はステップ２０１に戻る。

【0037】

図３は、図２による処理ワークフローシーケンス２００によるデータ処理システムＤの動作中の３次元空間構成要素の集合を概略的に示すダイアグラム３００であり、ダイアグラム３００の横方向に含まれる矢印は、処理シーケンス２００のステップ中の各時空間構成要素のｘ軸、ｙ軸、およびｚ軸の伸長および縮小挙動を示す。図３において斜め下向き矢印は、特定の軸がその特定の構成要素の形成中に次元数を減少させることを示す。したがって、ステップ２０４中の立方体の形成は、３次元立方体を縮小させる空間座標のｘ軸、ｙ軸、およびｚ軸のそれぞれに沿って次元数を減少させる。

【0038】

同様にダイアグラム３００は、ステップ２０６中、斜め上向き矢印が、３次元ビームの形成が１つの軸上の次元数を増加させることによって形成されるビームに依存して次元数を増加させることを示している。ステップ２０６中の次元数の減少は、３次元ビームの他の二つの空間座標軸に沿った斜め下向き矢印によって示される。

【0039】

ダイアグラム３００はさらに、ステップ２１０中の斜め上向き矢印が、３次元コアの形成が１つの軸上の次元数を増加させることによって形成されるコアに依存して、次元数を増加させることを示す。ステップ２１０中の次元数の減少は、３次元コアの他の２つの空間座標軸に沿った斜め下向き矢印によって示される。

【0040】

ステップ２１４中、ダイアグラム３００に示されるように、次元数は３次元コアの伸長中に、空間座標のｘ軸、ｙ軸、およびｚ軸のそれぞれに沿って増加される。

【0041】

その特定の時空間構成要素の形成中。システムの縮小立方体時空間構成要素のｘ、ｙ、ｚ軸は次元数を減少させることに留意されたい。以下のセクションでは、掃引３Ｄの各時空間構成要素について詳細に列挙する。

【0042】

（掃引３Ｄ縮小立方体）
４００（図４Ａ）に示されているような縮小立方体構成要素は、離散時空間では４次元である。３つの空間次元は、その３つの空間次元に対して（i、j、k）で表示された格子で離散化される。時間次元は、Ｌによって表示された処理時間ステップで離散化される。縮小立方体における最初の処理時間ステップは０として表され、最後の処理時間ステップは

として表される。ここで、ｎは立方体の６つの側面の３つの空間次元のいずれかに沿った格子の数である。初期立方体部分領域は、処理時間ステップ０において、ｎ×ｎ×ｎの格子点のサイズである。処理時間ステップが進むにつれて、立方体の６つの面は縮小し、立方体形状を維持しながら、その辺長は時間ステップごとに２つずつ減少する。最後の時間ステップでは、立方体サイズは２×２×２である。

【0043】

縮小立方体を構築することは、立方体が図４Ａの４００に示すような元の大きさから、図４Ｉの４０２に示すように２×２×２の立方体の大きさになるまで縮小するときに、各格子における格子データ点の値を計算する形態をとる。縮小立方体が完全に構築された後、図４Ｋの縮小面４０２上の時空間格子の各々における値は出力を形成し、これは、掃引３Ｄ処理方法論の他の構成要素への入力を提供する。縮小立方体の構築は入力としての初期の立方体の分割およびシミュレーション時間ステップ０における値から始まり、次に、各連続する時間ステップの

における時空間格子点にステンシル演算を適用する。

【0044】

例として図４Ａ～４Ｉを考えると、シミュレーションの８×８×８の３次元格子点の立方体部分領域が図示され、各格子点は以下の形式：

で説明されるように、ステンシル演算による数値シミュレーションの結果としての値を有する。説明と理解を容易にするために、シミュレーションが進行することにつれて処理されるデータの第４または時間次元は、処理時間ステップＬ＝０に対して青色、処理時間ステップＬ＝１に対して橙色、処理時間ステップＬ＝２に対して黄色、処理時間ステップＬ＝３に対して緑色、および処理時間ステップＬ＝４に対して赤色で色分けされる。この色分けは、本出願を通じて維持される。処理時間ステップは、図２に示すシミュレーション・ワークフロー・シーケンスに関連して言及したシミュレーション時間ステップではなく、データ処理システムの動作のものである。

【0045】

疑似コードで書かれた、掃引３Ｄ縮小立方体を構築するための方法論は、以下の表１に示される。

【0046】

上記の表１による処理において、および本発明により実行される方法論の後続の表の各々において、データ初期化関数Ｃおよび時間ステップステンシル演算関数Ｓｔは、処理ステップ２０１中に入力として提供されるユーザ定義入力変数である。データ初期化関数Ｃへの入力変数は、各空間点および３Ｄステンシルを表す空間点構造に対するグローバル（ｉ、ｊ、ｋ）インデックスである。

【0047】

以下の表は、初期化関数インタフェースの例示を擬似コード形式で含む。

【0048】

インタフェースにおける時間ステップ関数は、ＰＤＥ解が実行される間の処理動作である。時間ステップ関数への入力変数は、どの処理時間ステップまたはサブ時間ステップが実行されるべきかのインデックスであり、３次元の２７点ステンシル空間点構造である。以下の擬似コードは、このようなインタフェースの時間ステップ機能を示している。

【0049】

図２のステップ２０２による掃引３Ｄ縮小立方体を構築する例（図４Ａ）は、図４Ａに示すような時間Ｌ＝０におけるサイズ８×８×８のプロセッサノード１０４の１つに割り当てられた立方体部分領域分域を有する。縮小立方体方法論は、以下のように進行する。最初に、８×８×８立方体の６つの正方形面の各２つのレイヤーのコピーが作成される。図４Ｂは、時間レベルＬ＝０における一実施例の２×８×８面を示す。各立方体は東面、西面、北面、南面、頂面および底面を有し、図４Ｂに示される立方体と同様の形状の合計６個の立方体を生じる。図４Ｃは、表１で上述した処理による内部６×６×６の立方体に対するレベル０での後続のステンシル演算を示す。ステンシル演算は上述したように、ＰＤＥ解または他の形式の数値解が実行される処理操作である。

【0050】

次のレベルに進むと、立方体の６つの面の２つのレイヤーのコピーが作成される。図４Ｅは、時間レベルＬ＝１における立方体のサンプルの２×６×６面を示す。図４Ｆは、内部４×４×４の立方体に対するレベル１での後続のステンシル演算を示す。

【0051】

図４Ｇ～４Ｉは、ステンシル演算が内部２×２×２の立方体に対して行われる次のレベルのプロセスを示す。このレベルの後には、それ以上のステンシル演算を行うことはできない。図４Ｉの最後の２×２×２の立方体は、立方体の６つの面のすべてによって共有されることに留意されたい。したがって、本発明は立方体の６つの縮小面を適切に収め、それらを出力のために準備したことが分かる。図４Ｊは、本発明の縮小立方体方法論の出力の１つ、すなわち西面を示す。

【0052】

（掃引３Ｄ緯線方向ビーム、経線方向ビーム、および高度方向ビーム）
本発明によるデータ処理システムＤの動作のステップ２０６は、ステップ２０４中に隣接するプロセッサノードに通信された後、ステップ２０２中でプロセッサノード１０４の各々によって形成された縮小立方体の出力を一緒に接続して、ビームと呼ばれる３つの構成要素を形成する。ビームは、その向きのみが互いに異なる。３つの軸で動作する方法論のために、掃引３Ｄ方法論はそれらの向きまたは方向に対応するように命名される３つのそのようなビーム、すなわち、緯線方向ビーム、経線方向ビーム、および高度方向ビームを構築する。

【0053】

掃引３Ｄビームは、４次元の離散時空間の構造である。掃引３Ｄ縮小立方体と同様に、３つの空間次元は、その３つの空間次元に対して（ｉ、ｊ、ｋ）で表示された格子で離散化される。時間次元は、Ｌ＝０における第１の時間ステップによって表示された時間ステップによってまた離散化される。緯線方向掃引３Ｄビーム、経線方向掃引３Ｄビーム、および高度方向掃引３Ｄビームは、縮小立方体と同じタイムスパンを有する。

【0054】

４次元離散時空間次元を考えると、各掃引３Ｄビームはそれが完全に形成される時間までに、２個の隣接する２×２×２の立方体を接続する。本発明による掃引３Ｄビームの構築は、２個の隣接する２×２×２の立方体の間の空間における全ての可能な時空間値を２つの立方体によって計算することとして定義される。この処理は、２組の縮小立方体面、縮小立方体の２つの出力をリンクすることによって開始され、長さｎ＋２のビームで終わる。

【0055】

ビーム構造の出力は４つの４次元構造である。緯線方向ビームは東および西の立方体縮小面を必要として、南北頂部および底部側を生成する。経線方向ビームは北および南の立方体縮小面を必要として、東側、西側、頂部側および底部側を生成する。高度方向ビームは頂部および底部の立方体縮小面を必要として、北、南、東および西側を生成する。

【0056】

擬似コードで書かれた、緯線方向ビーム、経線方向ビーム、および高度方向ビームを構築するための方法論は、それぞれ、以下の表２、３、および４に記載されている。

【0057】

図５Ａ～５Ｋは、側面長さ８の立方体分割のための経線方向ビームを構築する一実施例を概略的に示す。入力は、図４の４Jで示されるような、縮小立方体によって生成される東および西の縮小面である。経線方向ビームを構築する第１のステップでは、８×８の東および西の立方体面の最初の２つのレイヤーをリンクすることによって開始する。これは、図５Ａに示されるように、時間レベルＬ＝０におけるサイズ４×８×８の領域分域を形成する。その後、処理は、北側、南側、頂部側および底部側のコピーを形成する。コピーされたレイヤーは、図５Ｂにおいて白色で示されている。このレベルについての最後の処理ステップは、図５Ｃに示すように、内部２×６×６分域に対してステンシル演算を実行して、それを時間レベルＬ＝１に移動させることである。

【0058】

次のレベルでは、東立方体面と西立方体面の両方からのサイズ６×６の次の２つのレイヤーが入力としてロードされ、前のレベルから生成され、図５Ｃに示される２×６×６領域分域の東および西に適切に配置される。これは、図５Ｄに示すように、時間レベルＬ＝１でサイズ６×６×６の分域を形成する。コピーは、図５Ｅに白色で示されるように、北側、南側、頂部側および底部側の、外側の２つのレイヤーから作られる。このレベルにおける作業は、図５Ｆに示すように、内側の４×４×４分域にステンシル演算を実行して、それを時間レベルＬ＝２に移動させることによって終了する。

【0059】

前の２つのレベルで行われたのと同様の操作を実行する際に次のレベルに進むと、次のレベルは時間レベルＬ＝３で、図５Ｉに示すように、６×２×２分域になる。図５Ｇ～５Ｉは、このレベルで行われた作業を要約している。処理は、東および西入力の最後の２つのレイヤーをロードし、それらを６×２×２の分域の隣に置いて、１０×２×２の分域を形成することで終了する。この共通の分域は、図５Ｊ～５Ｋに示すように、北側、南側、頂部側、および底部側にコピーされる。これにより、経線方向ビームと呼ばれる１０×２×２分域の形成が完了する。処理の４つの出力は、積み重ねられた北側、南側、頂部側および底部側である。図５Ｌは、頂部側のサンプル出力を示す。

【0060】

緯線方向ビームと高度方向ビームは、経線方向ビームの方法論に従って同等の方法で構成され、それぞれ表２、表３、表４に示す擬似コードに従って実行される。

【0061】

（掃引３Ｄ緯線方向、経線方向、高度方向コア）
第２の通信がステップ２０８中に行われた後、掃引３Ｄは、残りの掃引３Ｄ構成要素のコアとして使用される立方体の内部伸長面の構築を開始する。この理由から、掃引３Ｄの第３の時空間構成要素は「コア」として指定される。ここでも、ｘ軸、ｙ軸、およびｚ軸に作用することにより、掃引３Ｄは、緯線方向、経線方向、および高度方向のコアを構築する。３つの掃引３Ｄコア、つまり掃引３Ｄ緯線方向、経線方向、高度方向コアの構成要素は、方向のみが異なる。掃引３Ｄコアは４次元離散時空間構造である。前の掃引３Ｄ構成要素と同様に、３つの空間次元は（ｉ、ｊ、ｋ）でインデックスされた格子で離散化され、時間次元はＬでインデックスされた時間ステップで離散化される。

【0062】

掃引３Ｄコアは、縮小立方体およびビームと同じタイムスパンを有する。４次元離散時空間を考えると、コアは立方体の伸長面を表す。掃引３Ｄコアを構築することは、立方体伸長面における全ての考えられる時空間値を計算することを意味する。プロセスは、２対の側面、掃引３Ｄビームの４つの出力をリンクすることによって開始し、伸長する立方体面のセットで終了する。図６は、掃引３Ｄコア構成要素がどのように構築されるかを示す。

【0063】

ここでも、構築されたコアの向きに応じて、構築されたコアは、経線方向コア、緯線方向コア、または高度方向コアとして指定される。図３に示すように、経線方向コアは、ステップ２１４中にｙ軸とｚ軸において空間的に伸長することを思い起こされたい。緯線方向コアはｘ軸とｚ軸で伸長し、高度方向のコアはｘ軸とｙ軸で伸長する。

【0064】

コア構築の出力は二つの４次元構造である。経線方向コアは、北側、南側、頂部側および底部側を必要とし、東および西の伸長面を出力する。緯線方向コアは、東側、西側、頂部側、および底部側を必要とし、北および南の立方体の伸長面を出力する。高度方向コアは、東側、西側、北側、および南側を必要とし、頂部および底部の立方体伸長面を生成する。コアの向きと、その入力と、その出力との間の関係またはパターンに留意されたい。

【0065】

緯線方向コア、経線方向コア、および高度方向コアを構築するための方法論は、擬似コードで記述され、以下の表５、６、および７に記載される。

【0066】

ここで、辺長ｎの立方体分域の高度方向コアを構築する一実施例を考える。入力は、掃引３Ｄ緯線方向および経線方向ビームによって生成される、北側、南側、東側、および西側である。第１のレベルの第１のステップでは、北側、南側、東側、および西側の第１の２つのレイヤーがリンクされている。これは、図６Ａに示されるように、サイズ４×４×８および時間レベルＬ＝０の領域分域を形成する。その後、処理は、上側の２つのレイヤーが頂部伸長面として伸長し、下側の２つが底部伸長面として伸長する、４つのレイヤーのコピーを形成する。コピーされたレイヤーは、図６Ｂに白色で示されている。このレベルの処理の最終ステップは、図６Ｃに示すように、内部２×２×６分域に対してステンシル演算を実行して、それを時間レベルＬ＝１に移動させることである。

【0067】

次のレベルでは、次の２つのレイヤーが北、南、東および西の入力からロードされ、前のレベルから生成されたばかりの分域の北、南、東および西の隣に配置される。これは、図６Ｄに示すように、時間レベルＬ＝１でサイズ６×６×６の分域を形成する。次に、処理は、４つのレイヤーのコピーを作成する。再び、上側の２つのレイヤーは頂部伸長面となり、下側の２つのレイヤーは底部伸長面となる。図６Ｅは、コピーされる４つのレイヤーを示す。このレベルでの作業は、図６Ｆに示すように、内部４×４×４分域にステンシル演算を行い、それを時間レベルＬ＝２に移動させることによって終了する。

【0068】

次のレベルに進み、前の２つのレベルで行われたように同様の作業を行って、このレベルは、時間レベルＬ＝３で６×６×２分域で終了する。図６Ｇ～６Ｉは、このレベルで行われた作業を概略的に示す。ステップ２１０中に緯線方向、経線方向および高度方向コアを構築する処理は、入力の最後の２つのレイヤーをロードし、それらを６×６×２の分域の周りに適切に配置して、１０×１０×２の分域を形成し、この共通の分域を伸長面として頂部および底部にコピーすることによって完了する。図６Ｊ～図６Ｋは、この処理を実行した結果を示す。そして、アルゴリズムの２つの出力は、コアと呼ばれる積み重ねられた頂部および底部伸長面の形態である。図６Ｌは、底部伸長面のサンプル出力を示す。

【0069】

緯線方向および経線方向コアは、高度方向ビームの方法論に従った同等の方法で構築され、それぞれ表６および表７に示す擬似コードに従って実行される。

【0070】

（掃引３Ｄ伸長立方体）
掃引３Ｄの最後の時空間構成要素の構築は、ステップ２１２中の第３の通信が行われた後に行われる。この第４の構成要素は２×２×２の立方体で始まり、この立方体はその大きさが、処理操作の開始時における縮小を開始した立方体のｎ×ｎ×ｎの要素のサイズに等しくなるまで、時間が進むにつれて伸長する。この第４の構成要素は、掃引３Ｄ伸長立方体として指定される。これは、掃引３Ｄの最後の時空間構成要素である。掃引３Ｄコアは、４次元の離散時空環構造である。この構造では、三つの空間次元を（ｉ、ｊ、ｋ）でインデックスされた格子で再び離散化し、時間次元をＬでインデックスされた処理時間ステップで離散化する。

【0071】

掃引３Ｄ伸長立方体の形成は、本発明による掃引３Ｄの前の構成要素と比較して、伸長することにつれて追加レベルのステンシル演算を含む。４次元離散時空間を考慮すると、伸長立方体は、ｎ×ｎ×ｎのサイズになるまで時間と共に伸長する２×２×２サイズの小さな立方体を表す。掃引３Ｄ伸長立方体を構築することは、ｎ×ｎ×ｎの立方体領域全体が同じ時間レベルになるまで、立方体内のすべての時空間値を計算することを含む。このプロセスは、３対の伸長面、掃引３Ｄコアの６つの出力をリンクすることによって開始し、ｎ×ｎ×ｎの立方体で終了する。図７は、掃引３Ｄ伸長立方体構成要素が本発明に従ってどのように構築されるかを示す。

【0072】

なお、この時空間構成要素では、各レベル後に生成される分域がｘ軸、ｙ軸、およびｚ軸で伸長する。擬似コードで書かれた伸長立方体を構築するための方法論を表８に示す。

【0073】

図７Ａ～７Ｈは、サイズ８×８×８の立方体部分領域分域のための伸長立方体の形成の一実施例を概略的に示す。第１のレベルでは、北、南、東、西、頂部および底部伸長面の最初の２つのレイヤーが入力としてロードされ、４×４×４の分域を形成する。図７Ａに示すように、分域は時間レベルＬ＝０にあることに留意されたい。図７Ｂに示されるように、ステンシル演算はここで、内部２×２×２立方体に対して実行することができ、時間レベルＬ＝１に移動する。１つのレベルに対する作業はここで行われる。次のレベルは入力から次の伸長面をロードし、前のレベルから生成された２×２×２の立方体の周りにそれらを配置することによって開始する。これは、図７Ｃに示すように、時間レベルＬ＝１において６×６×６の分域を生成する。ステンシル演算は、図７Ｄに示されるように、内部４×４×４立方体に対して実行され、時間レベルＬ＝２に移動する。処理は、同様の方法で次のレベルを通って進み、アルゴリズムは、時間レベルＬ＝４においてサイズ８×８×８の立方体で終了する。図７Ｅ～７Ｈは、本発明による掃引３Ｄ立方体を伸長させた結果を概略的に示す。

【0074】

（掃引３Ｄの時空間構成要素の接続）
掃引３Ｄ時空間構成要素の形成後、ここでは、３Ｄにおける掃引ルールを構築するために、これらの構成要素が互いにどのように機能するかを説明する。図４Ａ～７Ｈに関連して説明した形成例から、計算処理に関与する各格子点は、隣接する完全な集合体によって囲まれていることが分かる。これらの隣接物は、３Ｄ数値離散化スキームにおける２７点３Ｄステンシルを表す。

【0075】

一実施例は、等しいサイズの８つの立方体部分領域に分解することができる、３周期境界条件を有する立方体計算領域の形態をとる。これらの各部分領域は、異なるプロセッサに割り当てられる。各プロセッサが明示的にＰＤＥを解き始めると、隣接するプロセスと通信する必要なしに、影響の領域に続いて依存性の領域が進行し、各プロセッサが縮小立方体を構築する。このステップの結果、図４Jに概略的に示すように、３対の縮小面が得られる。

【0076】

掃引３Ｄにおける次のステージは、経度方向、緯度方向、および高度方向ビームを構築することである。しかし、ビームを構築する前に、並列プロセッサ間のデータ交換が必要である。ビームを構築することを含むステージ１からステージ２に進むために、各プロセスはその隣接する３つにデータを送信し、他の隣接する３つからデータを受信する必要がある。より具体的には、各プロセスがステージ１で構築された縮小立方体から３つの縮小面を交換する。各縮小立方体は６つの縮小面を有し、それらの面は、北、南、東、西、頂部、および底部として指定される。緯度方向ビームを構築するために、各プロセスは、一組の北・南縮小面を必要とすることに留意されたい。他方、経度方向ビームを構築するために、各プロセスは、一組の東・西縮小面を必要とする。また、高度方向ビームの場合は、一組の頂部・底部面が必要である。このため、各プロセスは、その北、西、および頂部縮小面が、それぞれ北、西、および頂部の隣接物と通信する。また、各プロセスは、南、東、および底部の隣接物から、それぞれ、南、東、および底部の縮小面を受信する。このデータ交換の後、各プロセスは３つのビームを構築するために必要なものを有し、掃引３Ｄのステージ２を完了する。

【0077】

掃引３Ｄのステージ３に進み、掃引３Ｄコアが構築される。各掃引３Ｄステージの出力が入力として次のステージに供給されると、プロセッサ間の第２のデータ交換が掃引３Ｄのステージ３を開始するために必要とされる。図５および表２、３、４の掃引３Ｄビームに戻ると、各ビームの構築は、４つの数である側面と呼ばれるものの形成をもたらすことが分かる。そして、各プロセスが３つのビームを構築することにつれて、各プロセスは合計で１２の側面を有し、ここで、各２つは１つの方向に属する。これをさらに明確にするために、各プロセスは、２つの北側面の一組、２つの南側面の一組などを残りの方向についても有する。

【0078】

通信は、隣接するプロセスと６つの側面を交換することである。したがって、各プロセスは、２つの北側面、２つの西側面、２つの頂部側面を、それぞれの北、西、頂部の隣接物と通信する。また、各プロセスは、その南、東、および底部の隣接物からそれぞれ２つの南側面、２つの東側面、および２つの底部側面を受信する。データが適切に交換された後、各プロセスは進行し、３つのコアを構築できる。

【0079】

掃引３Ｄの最後の段階は、６組の伸長面を必要とする掃引３Ｄ伸長立方体を構築することである。これらの伸長面は、ステージ３で掃引３Ｄコアを構築した結果である。したがって、プロセッサ間の第３の通信は掃引３Ｄのこの最終段階で処理するために、プロセッサノード１０４間で伸長面を交換するように行われる。この時、各プロセスは、その北、西、頂部の伸長面を、それぞれ北、西、頂部の隣接物に通信する。また、各プロセッサノード１０４はそれぞれ、その南、東、および底部の隣接物から、南、東、および底部の伸長面を受信する。データが適切に交換された後、各プロセッサノード１０４は伸長立方体を構築することができる。

【0080】

このステージの最後では、計算領域全体が一貫した状態にある。これは、すべてのブロック、格子点、またはセルが同じ時間レベルにあることを意味する。しかし、初期に仮定した３周期境界条件によって生じるシフトの結果として、領域配置が変化した。上記は、半掃引３Ｄサイクルとして定義することができるものを表す。

【0081】

掃引３Ｄサイクルの残りの半分は、プロセッサノード１０４間のデータ交換が隣接する他の３つの間で行われることを除いて、同じ方法で実行することができる。例えば、縮小立方体の北、西、および頂部縮小面を北、西、および頂部隣接物に送る代わりに、縮小立方体の南、東、および底部縮小面が南、東、および底部隣接物に送られる。同じことが、残りの掃引３Ｄ構成要素にも適用可能である。掃引３Ｄサイクルの後半の終わりに、領域はその元の配置を有する。

【0082】

したがって、データ処理システムＤのステップ２０２～２１４の完全な掃引３Ｄ処理サイクルは、合計６つの通信が行われることを必要とする。３つの通信が、掃引３Ｄサイクルの各半分で起こる。時間レベル０の初期条件で開始し、１２×１２×１２の立方体部分領域で動作すると、完全な掃引３Ｄサイクルは、計算領域の１２の時間レベルを促進することが可能であり、しかもプロセッサノード１０４間の６つの通信のみを含むことに留意されたい。

【0083】

掃引３Ｄ構成要素を構築するための命令のプログラムリストは、それぞれ、上記の表１～８に記載されている。以下の表９は、掃引３Ｄ構成要素を一緒に接続し、掃引ルールを３次元空間座標で実施するための、擬似コードで書かれた方法論を表す。表９は、各掃引３Ｄ構成要素を構築するために実行されたステンシル演算の結果の必要な通信を示す。表９のプログラムリストでは、プロセッサノード１０４間で交換される構成要素は、方向の最初の文字によって大文字として省略される。さらに、θ→記号はプロセッサノード１０４への送信を示すために使用され、記号→θはプロセッサノード１０４からの受信を示すために使用される。

【0084】

【0085】

データ処理システムＤが所望の数の掃引３Ｄサイクルを実行した後、ステップ２２０中に、偏微分方程式であろうと他の複雑な数値シミュレーションであろうと、検査、研究および解析のためにユーザ・インターフェース１０８のグラフィカル・ディスプレイ１１０を通して、数値シミュレーションの結果を提供する。

【0086】

（３Ｄにおける掃引ルールの検証－３Ｄ熱方程式の解法）
掃引３Ｄアルゴリズムを検証し、実装が正しいことを確認するために、３次元熱拡散方程式を解くことによって実装を試験した。周期的境界条件を有する３次元体積および領域の中心に位置する初期熱源８００Ａへの３次元熱拡散のためのＰＤＥ構成。この解法の検証は、図８Ａ～８Ｆに示されている。図８Ａ～図８Ｆは、熱源８００Ａからの熱拡散方程式の解としての、そのような各図の中心点での実施例表示である。期待される挙動は、３次元空間への熱拡散のシミュレーションが時間的に進むにつれて、熱がその位置と状態から拡散することである。

【0087】

図８Ａ～８Ｆは、熱を、３次元ｘ、ｙ、およびｚ空間格子８０４内のカラーコードキー８０２に従って対数スケールの色によって表している。拡散が起こるときの格子８０４の特定の３次元ｘ、ｙ、ｚ座標での熱は、温度カラーキー８０２による色によって示される位置で決定され、表示される。図８Ａは、熱拡散の開始状態の一実施例における熱源８００Ａを示す。熱は、８００Ａで示されるように比較的コンパクトな体積内に閉じ込められ、比較的低い温度の外側のフリンジ８１０Ａのみを有する。図８Ｂ～８Ｆの連続したものにおいて、実際に加熱された３次元空間の体積は、時間の経過とともに、３次元空間において図８Ａに示される元の位置および状態から外方に膨張し、同時に、カラーキー８０２に従って色によって示されるように温度が低下する。また、それぞれ、図８Ｂ～８Ｆの８００Ｂ、８００Ｃ、８００Ｄ、８００Ｅ、および８００Ｆで示されるように、熱は、時間が経過することにつれて、３次元空間への拡散によって、より大きな体積へと外向きに膨張する。図８００Ｂ～８００Ｆにも示されるように、温度はカラーキー８０２に従って色によって示されるように、外側フリンジ領域８１０Ｂ、８１０Ｃ、８１０Ｄ、８１０Ｅ、および８１０Ｆによってそれぞれ境界付けられる面積において減少する。

【0088】

表示の図８Ａ～図８Ｆは、熱拡散部分拡散方程式またはＰＤＥの解が時間の経過とともに進むにつれて、領域の状態をシーケンシャル表示するものである。図８Ａ～８Ｆは、実装が正しいことを示す。本発明による並列ネットワーク処理のためのこの実施例は８つのプロセスで実行され、これは、異なるコンピュータ・プロセッサノード１０４が領域の一部のみを処理し、マスタノード１００が処理結果を提供したプロセッサノードからの結果を結合し、そのための正しい解が得られたことを意味する。従って、熱拡散部分拡散方程式の解に必要な部分領域の各々の間の通信は正しかった。その結果は、データ処理システムＤの異なる構成要素と、そのマスタノード１００と、シミュレーションに関与する並列動作コンピューティングプロセッサコア１０４との間のデータの流れが正しいことを検証した。

【0089】

実験は、それぞれ１６×１６×１６立方体を含む８つのＭＰＩプロセスを使用して８つの部分領域に分解された、サイズ３２×３２×３２の立方体領域において行われた。この実行の背後にある全体の目的は、掃引３Ｄアルゴリズムの設計を検証し、掃引３Ｄ構成要素間の通信が正しいことを確認することであった。得られた解における熱拡散の挙動は、掃引３Ｄの設計および実施の修正を証明する。

【0090】

掃引３Ｄ機能から短縮されたレイテンシを有する本発明によるデータ処理システムは、実際のアプリケーションに統合され、技術的特徴の問題に対処する。図８Ａ～８Ｆに関連して記載された試験実施において、接続タービン翼の設計および製造における、経時的な３次元座標を通る熱拡散は、そのような実際のアプリケーションの例示的な一例である。また、本発明によるデータ処理システムは、貯留層からの生産中に炭化水素貯留層内での経時的な３次元の流体流れの貯留層シミュレーションのための処理におけるレイテンシを短縮することによって、技術的な問題を解決する。また、本発明によるデータ処理システムは、地震探査の間、経時的な３次元の地下領域を通る機械的波エネルギーの処理移動におけるレイテンシを短縮することによって、技術的な問題を解決する。

【0091】

本発明によるデータ処理システムは、影響の領域および依存性の領域を利用する方法で計算ノード間の空間および時間を分解し、多数の時間ステップ当たり１回の通信を可能にすることによって、冗長な計算を招くことなく、これを達成する。より少ない頻度で通信することによって、掃引ルールはレイテンシの障壁を克服し、ネットワークの往復レイテンシ当たり平均して２つ以上の時間ステップを進める。

【0092】

本発明によるデータ処理システムは、ＰＤＥのような数値シミュレーションを解く際に、３次元空間問題に空間と時間を分解することによって、データ処理システムの実行および数値シミュレーションにおけるネットワークレイテンシの障壁の技術的問題を解決する。これらの数値シミュレーションを解く上での本発明によるデータ処理システムは、レイテンシの障壁を克服または打破し、メッセージが１つの計算ノードから別の計算ノードに移動するのに必要な時間の一部で各処理時間ステップを進める。

【0093】

本発明は並列プロセッサ・コンピュータシステムの分野における平均的な知識を有する人が本明細書で述べた結果を再現し、取得することができるように、十分に説明されてきた。それにもかかわらず、本明細書の本発明の主題である技術分野の当業者は、本明細書の要求に記載されていない修正を実行して、これらの修正を決定された構造および方法論に適用することができ、またはその使用および実施において、以下の特許請求の範囲に記載された事項を必要とし、そのような構造およびプロセスは、本発明の範囲内に包含されるものとする。

【0094】

添付の特許請求の範囲に記載される本発明の精神または範囲から逸脱することなく、上記に詳細に記載された本発明の改良および変更がなされ得ることに留意され、理解されたい。

【図1】