特開2024-21989 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-21989情報処理プログラム、情報処理方法、および情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024021989

(43)【公開日】2024-02-16

(54)【発明の名称】情報処理プログラム、情報処理方法、および情報処理装置

(51)【国際特許分類】

G06F 8/41 20180101AFI20240208BHJP

【ＦＩ】

G06F8/41 130

【審査請求】未請求

【請求項の数】7

【出願形態】ＯＬ

(21)【出願番号】P 2022125237

(22)【出願日】2022-08-05

(71)【出願人】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】100104190

【弁理士】

【氏名又は名称】酒井昭徳

(72)【発明者】

【氏名】津金佳祐

【テーマコード（参考）】

5B081

【Ｆターム（参考）】

5B081CC32

(57)【要約】

【課題】タスクのデッドロックを回避し易くすること。
【解決手段】情報処理装置は、同時通信可能な通信タスク数分の要素を含むバッファを設定する。情報処理装置は、ソースコードにおける、いずれかのタスクの記述が、通信を実施する通信タスクの記述である場合、当該いずれかのタスクの記述に、バッファを用いたデータ依存の記述を追加する。これにより、情報処理装置は、デッドロックを回避し易くすることができる。情報処理装置は、例えば、ＨＰＣの大規模演算処理を実施し易くすることができる。
【選択図】図１３

【特許請求の範囲】

【請求項1】

並列実行の対象となる複数のタスクの記述を含むソースコードを取得し、
取得した前記ソースコードに規定された前記複数のタスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出し、
取得した前記ソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する、
処理をコンピュータに実行させることを特徴とする情報処理プログラム。

【請求項2】

追加後の前記ソースコードをコンパイルし、ランタイムを用いて前記複数のタスクをスケジューリングし、２以上のスレッドを用いてスケジューリングした前記複数のタスクを並列実行する、
処理を前記コンピュータに実行させることを特徴とする請求項１に記載の情報処理プログラム。

【請求項3】

前記追加する処理は、
取得した前記ソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの記述順序に基づき決定される当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する、ことを特徴とする請求項１または２に記載の情報処理プログラム。

【請求項4】

同時に通信可能な通信タスクの上限数分の複数の要素データを設定し、
前記追加する処理は、
取得した前記ソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの記述順序に基づき決定される当該通信タスクの実行順序に応じて前記複数の要素データからサイクリックに選択したいずれかの要素データにアクセスすることにより他の通信タスクとのデータ依存を形成する記述を追加する、ことを特徴とする請求項３に記載の情報処理プログラム。

【請求項5】

前記取得する処理は、
並列実行の対象となる複数の第１タスクの記述を含むソースコードを取得し、
取得した前記ソースコードにおける、通信を制御し、かつ、演算を実施する第１タスクの記述を、当該通信を制御する通信タスクの記述と、当該演算を実施する演算タスクの記述とに分割することにより、取得した前記ソースコードを、並列実行の対象となる複数の第２タスクの記述を含む新たなソースコードに変換し、
前記検出する処理は、
変換した前記新たなソースコードに規定された前記複数の第２タスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出し、
前記追加する処理は、
変換した前記新たなソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する、ことを特徴とする請求項１または２に記載の情報処理プログラム。

【請求項6】

並列実行の対象となる複数のタスクの記述を含むソースコードを取得し、
取得した前記ソースコードに規定された前記複数のタスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出し、
取得した前記ソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する、
処理をコンピュータが実行することを特徴とする情報処理方法。

【請求項7】

並列実行の対象となる複数のタスクの記述を含むソースコードを取得し、
取得した前記ソースコードに規定された前記複数のタスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出し、
取得した前記ソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する、
制御部を有することを特徴とする情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理プログラム、情報処理方法、および情報処理装置に関する。

【背景技術】

【0002】

従来、各ノードにプロセスが割り当てられ、プロセス内で１以上のスレッドが生成され、それぞれのスレッド上でタスクが実行されるシステムがある。例えば、当該システムにおいて、それぞれ異なるノードに割り当てられた２つのプロセス間でデータをやり取りするために、通信を実行する通信タスクがそれぞれのプロセス内のスレッド上で実行されることがある。

【0003】

先行技術としては、例えば、ある処理単位より分岐される複数の処理単位を１つのプロセッサが単独で逐次実行するモードの処理単位に関してはコンテキストスイッチを実施しないようにするものがある。また、例えば、浮動スレッドの参照情報を高速メモリに格納する技術がある。また、例えば、コンテキストスイッチを、サブルーチンレベルでは実施しないようにする技術がある。また、例えば、プログラムの実行単位モジュールであるスレッドごとに使用するレジスタ数に応じて、汎用レジスタを割り当てるための命令コードオフセットデータを作成する技術がある。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開平６－０４４１９９号公報

【特許文献2】米国特許出願公開第２００５／００６６３０２号明細書

【特許文献3】米国特許出願公開第２００５／０１０２６５０号明細書

【特許文献4】特開２００５－１２９００１号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、従来技術では、通信タスクのデッドロックが発生してしまうことがある。例えば、一方のプロセス内のスレッドで第１データを送信するための通信タスクが実行された際、他方のプロセス内のスレッドで第２データを受信するための通信タスクが実行されると、いずれの通信タスクも完了せずにスレッドを占有してしまう。第２データは、第１データとは異なるデータである。これに対し、他方のプロセス内のスレッドに対して、実行するタスクを定期的に切り替えるコンテキストスイッチと呼ばれる技術を適用することが考えられるが、オーバーヘッドの増大化を招き、タスクの性能低下を招くという問題が発生してしまうことがある。

【0006】

１つの側面では、本発明は、タスクのデッドロックを回避し易くすることを目的とする。

【課題を解決するための手段】

【0007】

１つの実施態様によれば、並列実行の対象となる複数のタスクの記述を含むソースコードを取得し、取得した前記ソースコードに規定された前記複数のタスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出し、取得した前記ソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する情報処理プログラム、情報処理方法、および情報処理装置が提案される。

【発明の効果】

【0008】

一態様によれば、タスクのデッドロックを回避し易くすることが可能になる。

【図面の簡単な説明】

【0009】

【図1】図１は、実施の形態にかかる情報処理方法の一実施例を示す説明図である。

【図2】図２は、情報処理システム２００の一例を示す説明図である。

【図3】図３は、情報処理装置１００のハードウェア構成例を示すブロック図である。

【図4】図４は、情報処理装置１００の機能的構成例を示すブロック図である。

【図5】図５は、コンテキストスイッチ機能の一例を示す説明図である。

【図6】図６は、受信タスクの記述を含むソースコード６００を変換する一例を示す説明図（その１）である。

【図7】図７は、受信タスクの記述を含むソースコード６００を変換する一例を示す説明図（その２）である。

【図8】図８は、送信タスクの記述を含むソースコード８００を変換する一例を示す説明図（その１）である。

【図9】図９は、送信タスクの記述を含むソースコード８００を変換する一例を示す説明図（その２）である。

【図10】図１０は、タスク間のデータ依存関係の一例を示す説明図である。

【図11】図１１は、複数のタスクを並列実行する一例を示す説明図である。

【図12】図１２は、情報処理装置１００による効果の一例を示す説明図である。

【図13】図１３は、全体処理手順の一例を示すフローチャートである。

【発明を実施するための形態】

【0010】

以下に、図面を参照して、本発明にかかる情報処理プログラム、情報処理方法、および情報処理装置の実施の形態を詳細に説明する。

【0011】

（実施の形態にかかる情報処理方法の一実施例）
図１は、実施の形態にかかる情報処理方法の一実施例を示す説明図である。情報処理装置１００は、複数のタスクを並列実行する場合において、タスクのデッドロックを回避し易くするためのコンピュータである。情報処理装置１００は、例えば、サーバ、または、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）などである。

【0012】

例えば、各ノードにプロセスを割り当てて、プロセス内で１以上のスレッドを生成し、それぞれのスレッド上で異なるタスクを実行することにより、複数のタスクを並列実行するシステムがある。例えば、当該システムにおいて、それぞれ異なるノードに割り当てられた２つのプロセス間でデータをやり取りするために、通信を実行する通信タスクがそれぞれのプロセス内のスレッド上で実行されることがある。

【0013】

しかしながら、通信タスクのデッドロックが発生してしまうことがある。例えば、それぞれ異なるノードに割り当てられた２つのプロセスのうち、一方のプロセス内のスレッドで第１データを送信するための通信タスクが実行された際、他方のプロセス内のスレッドで第２データを受信するための通信タスクが実行される場合が考えられる。第２データは、第１データとは異なるデータであるとする。

【0014】

この場合、それぞれのプロセス内のスレッドが１つであれば、それぞれのプロセス内でいずれの通信タスクも完了せずにスレッドを占有することになる。例えば、一方のプロセス内のスレッドで、第１データを送信するための通信タスクが完了しなければ、第２データを送信するための通信タスクが開始されないため、他方のプロセス内のスレッドで、第２データを受信するための通信タスクが完了しない。同様に、例えば、他方のプロセス内のスレッドで、第２データを受信するための通信タスクが完了しなければ、第１データを受信するための通信タスクが開始されないため、一方のプロセス内のスレッドで、第１データを送信するための通信タスクが完了しない。

【0015】

このように、それぞれ異なるノードに割り当てられた２つのプロセスのそれぞれのプロセス内のスレッドで、通信タスクのデッドロックが発生してしまうことになる。従って、通信タスクのデッドロックを回避することが望まれる。

【0016】

これに対し、従来では、他方のプロセス内のスレッドに対して、実行するタスクを定期的に切り替えるコンテキストスイッチと呼ばれる技術を適用する手法が考えられる。この手法では、オーバーヘッドの増大化を招き、プロセス内のスレッドで実行するタスクの性能低下を招くという問題が発生してしまうことがある。

【0017】

例えば、プロセス内のスレッドで現在実行中のタスクを退避し、後に復元する際に作業負担の増大化を招き、オーバーヘッドの増大化を招く。例えば、プロセス内のスレッドで実行可能なタスクが複数存在すると、同一のタスクが再度実行されるまでにかかる所要時間の増大化を招き、オーバーヘッドの増大化を招く。このため、プロセス内のスレッドで実行するタスクの性能低下を招くことになる。

【0018】

そこで、本実施の形態では、タスクのデッドロックを回避し易くすることができる情報処理方法について説明する。

【0019】

図１において、（１－１）情報処理装置１００は、並列実行の対象となる複数のタスクの記述を含むソースコード１０１を取得する。情報処理装置１００は、例えば、それぞれ異なるノードに割り当てられた２つのプロセスのうち、一方のプロセス内で並列実行の対象となる複数のタスクの記述を含むソースコード１０１を取得する。

【0020】

例えば、１つのプロセス内で、２つのスレッドが存在するため、１つのプロセス内で、タスクを２つまで同時に実行可能であるとする。図１の例では、情報処理装置１００は、タスクＡ～Ｆの記述を含むソースコード１０１を取得する。いずれかのノードは、例えば、情報処理装置１００であってもよい。

【0021】

一方のプロセス内で並列実行の対象となる複数のタスクは、通信を制御する通信タスクを含む。当該通信タスクは、他方のプロセス内で並列実行の対象となる複数のタスクのうち、通信を制御するいずれかの通信タスクに対応する。ここで、それぞれのプロセス内で、互いに対応する通信タスク同士が、同タイミングで実行されれば、それぞれの通信タスクは正常に完了する。一方で、それぞれのプロセス内で、互いに対応する通信タスク同士が、同タイミングで実行されなければ、それぞれの通信タスクは完了しない。

【0022】

（１－２）情報処理装置１００は、取得したソースコード１０１に規定された複数のタスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出する。図１の例では、情報処理装置１００は、ソースコード１０１に記載されたタスクＡ～Ｆの記述のうち、通信タスクとなるタスクＡ～Ｄの記述を検出する。これにより、情報処理装置１００は、デッドロックを発生し得る通信タスクの記述を検出することができる。

【0023】

（１－３）情報処理装置１００は、取得したソースコード１０１における、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する。情報処理装置１００は、例えば、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの記述順序に基づき決定される当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する。

【0024】

図１の例では、情報処理装置１００は、ソースコード１０１において、タスクＡ～Ｄの記述順序に沿って、タスクＡ、タスクＢ、タスクＣ、タスクＤという実行順序を決定する。ここで、情報処理装置１００は、決定した実行順序に従って、プロセス内の各スレッドで、サイクリックにタスクＡ～Ｄを実行するよう、タスクＡ～Ｄの記述に、通信タスク間のデータ依存を形成する記述を追加する。

【0025】

情報処理装置１００は、例えば、一方のスレッドで、タスクＡを実行した後タスクＣを実行するよう、かつ、他方のスレッドで、タスクＢを実行した後タスクＤを実行するよう、タスクＡ～Ｄの記述に、通信タスク間のデータ依存を形成する記述を追加する。情報処理装置１００は、具体的には、タスクＡ～Ｄの記述に、タスクＡとタスクＣとのデータ依存を形成する記述と、タスクＢとタスクＤとのデータ依存を形成する記述とを追加する。

【0026】

これにより、情報処理装置１００は、プロセス内の各スレッドで、サイクリックにタスクＡ～Ｄを実行するよう、タスクＡ～Ｄの実行順序を制御および保証することができる。このため、情報処理装置１００は、それぞれ異なるノードに割り当てられた２つのプロセスのそれぞれのプロセス内で、互いに対応する通信タスク同士が、同タイミングで実行され易くすることができ、正常に完了し易くすることができる。

【0027】

従って、情報処理装置１００は、通信タスク間のデッドロックを回避し易くすることができる。情報処理装置１００は、同様に、それぞれ異なるノードに割り当てられた２つのプロセスのうち、他方のプロセス内で並列実行の対象となる複数のタスクの記述を含むソースコード１０１を取得し、通信タスク間にデータ依存を形成する記述を追加することができる。このため、情報処理装置１００は、通信タスク間のデッドロックをさらに回避し易くすることができる。

【0028】

ここでは、情報処理装置１００が、単独で動作する場合について説明したが、これに限らない。例えば、情報処理装置１００が、他のコンピュータと協働する場合があってもよい。例えば、複数のコンピュータが、情報処理装置１００としての機能を実現する場合があってもよい。具体的には、クラウド上に、情報処理装置１００としての機能が実現される場合があってもよい。

【0029】

（情報処理システム２００の一例）
次に、図２を用いて、図１に示した情報処理装置１００を適用した、情報処理システム２００の一例について説明する。

【0030】

図２は、情報処理システム２００の一例を示す説明図である。図２において、情報処理システム２００は、情報処理装置１００と、１以上のノード装置２０１と、１以上のクライアント装置２０２とを含む。

【0031】

情報処理システム２００において、情報処理装置１００とノード装置２０１とは、有線または無線のネットワーク２１０を介して接続される。ネットワーク２１０は、例えば、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、インターネットなどである。情報処理システム２００において、情報処理装置１００とクライアント装置２０２とは、有線または無線のネットワーク２１０を介して接続される。

【0032】

情報処理装置１００は、通信タスクのデッドロックを回避し易くするためのコンピュータである。情報処理装置１００は、それぞれ異なるノードに割り当てられた２つのプロセスのそれぞれのプロセスについて、当該プロセス内で並列実行の対象となる複数のタスクの記述を含むソースコードを、クライアント装置２０２から受信する。

【0033】

情報処理装置１００は、図１と同様に、それぞれのプロセスについて受信した、当該プロセス内で並列実行の対象となる複数のタスクの記述を含むソースコードに、通信タスク間のデータ依存を形成する記述を追加する。情報処理装置１００は、追加後のソースコードを、ノード装置２０１に送信することにより、追加後のソースコードを、それぞれ異なるノードで実行するよう制御する。情報処理装置１００は、追加後のソースコードを、それぞれ異なるノード装置２０１に送信してもよい。情報処理装置１００は、例えば、サーバ、または、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）などである。

【0034】

ノード装置２０１は、ソースコードを実行するノードを実現するコンピュータである。ノード装置２０１は、複数のコアを有していてもよく、コアごとに異なるノードを実現するコンピュータであってもよい。ノード装置２０１は、追加後のソースコードを、情報処理装置１００から受信する。ノード装置２０１は、プロセスを実行する。ノード装置２０１は、プロセス内で１以上のスレッドを生成する。ノード装置２０１は、受信した追加後のソースコードが規定する複数のタスクを、生成した１以上のスレッドで並列実行する。ノード装置２０１は、例えば、サーバ、または、ＰＣなどである。

【0035】

クライアント装置２０２は、システム利用者によって用いられるコンピュータである。クライアント装置２０２は、システム利用者の操作入力に基づき、それぞれ異なるノードに割り当てられた２つのプロセスのそれぞれのプロセスについて、当該プロセス内で並列実行の対象となる複数のタスクの記述を含むソースコードを生成する。クライアント装置２０２は、生成したソースコードを、情報処理装置１００に送信する。クライアント装置２０２は、例えば、ＰＣ、タブレット端末、または、スマートフォンなどである。

【0036】

ここでは、情報処理装置１００が、ノード装置２０１とは異なる装置である場合について説明したが、これに限らない。例えば、情報処理装置１００が、ノード装置２０１としての機能を有し、ノード装置２０１としても動作する場合があってもよい。ここでは、情報処理装置１００が、クライアント装置２０２とは異なる装置である場合について説明したが、これに限らない。例えば、情報処理装置１００が、クライアント装置２０２としての機能を有し、クライアント装置２０２としても動作する場合があってもよい。

【0037】

（情報処理システム２００の適用例）
情報処理システム２００は、例えば、スーパーコンピュータを用いてＨＰＣ（ｈｉｇｈ－ｐｅｒｆｏｒｍａｎｃｅｃｏｍｐｕｔｉｎｇ）の大規模演算処理を実施する場合に適用することが考えられる。この場合、スーパーコンピュータが、ノード装置２０１として動作する。大規模演算処理は、例えば、地震または天候などの予測処理、画像処理、物体または流体の解析処理、または、言語処理などである。

【0038】

（情報処理装置１００のハードウェア構成例）
次に、図３を用いて、情報処理装置１００のハードウェア構成例について説明する。

【0039】

図３は、情報処理装置１００のハードウェア構成例を示すブロック図である。図３において、情報処理装置１００は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）３０１と、メモリ３０２と、ネットワークＩ／Ｆ（Ｉｎｔｅｒｆａｃｅ）３０３と、記録媒体Ｉ／Ｆ３０４と、記録媒体３０５とを有する。また、各構成部は、バス３００によってそれぞれ接続される。

【0040】

ここで、ＣＰＵ３０１は、情報処理装置１００の全体の制御を司る。メモリ３０２は、例えば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）およびフラッシュＲＯＭなどを有する。具体的には、例えば、フラッシュＲＯＭやＲＯＭが各種プログラムを記憶し、ＲＡＭがＣＰＵ３０１のワークエリアとして使用される。メモリ３０２に記憶されるプログラムは、ＣＰＵ３０１にロードされることにより、コーディングされている処理をＣＰＵ３０１に実行させる。

【0041】

ネットワークＩ／Ｆ３０３は、通信回線を通じてネットワーク２１０に接続され、ネットワーク２１０を介して他のコンピュータに接続される。そして、ネットワークＩ／Ｆ３０３は、ネットワーク２１０と内部のインターフェースを司り、他のコンピュータからのデータの入出力を制御する。ネットワークＩ／Ｆ３０３は、例えば、モデムやＬＡＮアダプタなどである。

【0042】

記録媒体Ｉ／Ｆ３０４は、ＣＰＵ３０１の制御に従って記録媒体３０５に対するデータのリード／ライトを制御する。記録媒体Ｉ／Ｆ３０４は、例えば、ディスクドライブ、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）ポートなどである。記録媒体３０５は、記録媒体Ｉ／Ｆ３０４の制御で書き込まれたデータを記憶する不揮発メモリである。記録媒体３０５は、例えば、ディスク、半導体メモリ、ＵＳＢメモリなどである。記録媒体３０５は、情報処理装置１００から着脱可能であってもよい。

【0043】

情報処理装置１００は、上述した構成部の他、例えば、キーボード、マウス、ディスプレイ、プリンタ、スキャナ、マイク、スピーカーなどを有してもよい。また、情報処理装置１００は、記録媒体Ｉ／Ｆ３０４や記録媒体３０５を複数有していてもよい。また、情報処理装置１００は、記録媒体Ｉ／Ｆ３０４や記録媒体３０５を有していなくてもよい。

【0044】

（ノード装置２０１のハードウェア構成例）
ノード装置２０１のハードウェア構成例は、具体的には、図３に示した情報処理装置１００のハードウェア構成例と同様であるため、説明を省略する。

【0045】

（クライアント装置２０２のハードウェア構成例）
クライアント装置２０２のハードウェア構成例は、具体的には、図３に示した情報処理装置１００のハードウェア構成例と同様であるため、説明を省略する。

【0046】

（情報処理装置１００の機能的構成例）
次に、図４を用いて、情報処理装置１００の機能的構成例について説明する。

【0047】

図４は、情報処理装置１００の機能的構成例を示すブロック図である。情報処理装置１００は、記憶部４００と、取得部４０１と、検出部４０２と、加工部４０３と、実行部４０４と、出力部４０５とを含む。

【0048】

記憶部４００は、例えば、図３に示したメモリ３０２や記録媒体３０５などの記憶領域によって実現される。以下では、記憶部４００が、情報処理装置１００に含まれる場合について説明するが、これに限らない。例えば、記憶部４００が、情報処理装置１００とは異なる装置に含まれ、記憶部４００の記憶内容が情報処理装置１００から参照可能である場合があってもよい。

【0049】

取得部４０１～出力部４０５は、制御部の一例として機能する。取得部４０１～出力部４０５は、具体的には、例えば、図３に示したメモリ３０２や記録媒体３０５などの記憶領域に記憶されたプログラムをＣＰＵ３０１に実行させることにより、または、ネットワークＩ／Ｆ３０３により、その機能を実現する。各機能部の処理結果は、例えば、図３に示したメモリ３０２や記録媒体３０５などの記憶領域に記憶される。

【0050】

記憶部４００は、各機能部の処理において参照され、または更新される各種情報を記憶する。記憶部４００は、並列実行の対象となる複数の第１タスクの記述を含む第１ソースコードを記憶する。第１ソースコードは、例えば、取得部４０１によって取得される。

【0051】

取得部４０１は、各機能部の処理に用いられる各種情報を取得する。取得部４０１は、取得した各種情報を、記憶部４００に記憶し、または、各機能部に出力する。また、取得部４０１は、記憶部４００に記憶しておいた各種情報を、各機能部に出力してもよい。取得部４０１は、例えば、自装置利用者の操作入力に基づき、各種情報を取得する。取得部４０１は、例えば、情報処理装置１００とは異なる装置から、各種情報を受信してもよい。

【0052】

取得部４０１は、第１ソースコードを取得する。第１ソースコードは、複数存在していてもよい。取得部４０１は、例えば、それぞれ異なるノードに割り当てられた複数のプロセスのそれぞれのプロセスについて、当該プロセス内の１以上のスレッドで並列実行の対象となる複数の第１タスクの記述を含む第１ソースコードを取得する。

【0053】

取得部４０１は、具体的には、第１ソースコードを、他のコンピュータから受信することにより取得する。他のコンピュータは、例えば、クライアント装置２０２である。取得部４０１は、具体的には、自装置利用者の操作入力に基づき、第１ソースコードの入力を受け付けることにより、第１ソースコードを取得する。自装置利用者は、例えば、システム利用者である。

【0054】

取得部４０１は、いずれかの機能部の処理を開始する開始トリガーを受け付けてもよい。開始トリガーは、例えば、自装置利用者による所定の操作入力があったことである。開始トリガーは、例えば、他のコンピュータから、所定の情報を受信したことであってもよい。開始トリガーは、例えば、いずれかの機能部が所定の情報を出力したことであってもよい。取得部４０１は、具体的には、第１ソースコードを取得したことを、検出部４０２と加工部４０３と実行部４０４との処理を開始する開始トリガーとして受け付けてもよい。

【0055】

検出部４０２は、ソースコードに規定された複数のタスクの記述のうち、通信を制御する通信タスクの記述を検出する。検出部４０２は、例えば、取得した第１ソースコードを解析し、第１ソースコードに規定された複数の第１タスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出する。これにより、検出部４０２は、第１ソースコードのうち、デッドロックを発生する原因となり得る通信タスクの記述を検出することができ、加工部４０３で第１ソースコードを加工する基準を得ることができる。

【0056】

検出部４０２は、取得した第１ソースコードにおける、通信を制御し、かつ、演算を実施する第１タスクの記述を検出してもよい。検出部４０２は、検出した第１タスクの記述を、当該通信を制御する通信タスクの記述と、当該演算を実施する演算タスクの記述とに分割することにより、第１ソースコードを、第２ソースコードに変換してもよい。

【0057】

第２ソースコードは、並列実行の対象となる複数の第２タスクの記述を含む。複数の第２タスクは、例えば、第１タスクから記述が分割された通信タスクと、演算タスクとを包含する。複数の第２タスクは、例えば、複数の第１タスクのうち、記述が分割されなかった第１タスクをすべて包含する。これにより、検出部４０２は、第１タスクを形成する通信タスクと演算タスクとを分割することができ、当該通信タスクと独立して当該演算タスクを実行し易くすることができ、演算効率の効率化を図ることができる。

【0058】

検出部４０２は、変換した第２ソースコードに規定された複数の第２タスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出する。これにより、検出部４０２は、第２ソースコードのうち、デッドロックを発生する原因となり得る通信タスクの記述を検出することができ、加工部４０３で第２ソースコードを加工する基準を得ることができる。

【0059】

加工部４０３は、ソースコードを加工する。加工部４０３は、例えば、取得した第１ソースコードにおける、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する。異なる２つの通信タスク間のデータ依存は、例えば、異なる２つの通信タスクのそれぞれの通信タスクが、同一のデータにアクセスすることにより形成される。アクセスは、例えば、入力、または、出力である。アクセスは、例えば、出力であることが好ましい。

【0060】

加工部４０３は、例えば、取得した第１ソースコードにおける、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述順序に基づいて、当該通信タスクの実行順序を決定する。加工部４０３は、例えば、２以上の通信タスクのそれぞれの通信タスクの実行順序に応じて、通信タスク間にデータ依存を形成する通信タスクペアを特定する。加工部４０３は、例えば、取得した第１ソースコードにおける、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、特定した通信タスクペアの通信タスク間にデータ依存を形成する記述を追加する。

【0061】

加工部４０３は、具体的には、それぞれの通信タスクの記述順序を、当該通信タスクの実行順序として採用することにより、当該通信タスクの実行順序を決定する。加工部４０３は、具体的には、それぞれの通信タスクの記述順序の逆順を、当該通信タスクの実行順序として採用することにより、当該通信タスクの実行順序を決定してもよい。加工部４０３は、具体的には、所定の規則に従って、それぞれの通信タスクの記述順序を、当該通信タスクの実行順序に変換することにより、当該通信タスクの実行順序を決定してもよい。

【0062】

加工部４０３は、具体的には、定数Ｎを設定する。定数Ｎは、例えば、同時に通信可能な通信タスクの上限数以下であることが好ましい。定数Ｎは、例えば、同時に通信可能な通信タスクの上限数である。加工部４０３は、具体的には、実行順序ｎの通信タスクと、実行順序ｎ＋Ｎの通信タスクとを、通信タスク間にデータ依存を形成する通信タスクペアとして特定する。ｎは、正の整数＜Ｎである。加工部４０３は、具体的には、取得した第１ソースコードにおける、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、特定した通信タスクペアの通信タスク間にデータ依存を形成する記述を追加する。

【0063】

加工部４０３は、より具体的には、Ｎ個の複数の要素データを設定する。加工部４０３は、より具体的には、第１ソースコードにおける、２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて複数の要素データからサイクリックに選択したいずれかの要素データにアクセスする記述を追加する。これにより、加工部４０３は、プロセス内の各スレッドで、第１ソースコードに規定された複数の第１タスクをサイクリックに実行するよう、複数の第１タスクの実行順序を制御可能および保証可能にすることができる。

【0064】

加工部４０３は、例えば、取得した第２ソースコードにおける、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する。異なる２つの通信タスク間のデータ依存は、例えば、異なる２つの通信タスクのそれぞれの通信タスクが、同一のデータにアクセスすることにより形成される。アクセスは、例えば、入力、または、出力である。アクセスは、例えば、出力であることが好ましい。

【0065】

加工部４０３は、例えば、取得した第２ソースコードにおける、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述順序に基づいて、当該通信タスクの実行順序を決定する。加工部４０３は、例えば、２以上の通信タスクのそれぞれの通信タスクの実行順序に応じて、通信タスク間にデータ依存を形成する通信タスクペアを特定する。加工部４０３は、例えば、取得した第２ソースコードにおける、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、特定した通信タスクペアの通信タスク間にデータ依存を形成する記述を追加する。

【0066】

【0067】

加工部４０３は、具体的には、定数Ｎを設定する。定数Ｎは、例えば、同時に通信可能な通信タスクの上限数以下であることが好ましい。定数Ｎは、例えば、同時に通信可能な通信タスクの上限数である。加工部４０３は、具体的には、実行順序ｎの通信タスクと、実行順序ｎ＋Ｎの通信タスクとを、通信タスク間にデータ依存を形成する通信タスクペアとして特定する。ｎは、正の整数＜Ｎである。加工部４０３は、具体的には、取得した第２ソースコードにおける、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、特定した通信タスクペアの通信タスク間にデータ依存を形成する記述を追加する。

【0068】

加工部４０３は、より具体的には、Ｎ個の複数の要素データを設定する。加工部４０３は、より具体的には、第２ソースコードにおける、２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて複数の要素データからサイクリックに選択したいずれかの要素データにアクセスする記述を追加する。これにより、加工部４０３は、プロセス内の各スレッドで、第２ソースコードに規定された複数の第２タスクをサイクリックに実行するよう、複数の第２タスクの実行順序を制御可能および保証可能にすることができる。

【0069】

実行部４０４は、ソースコードをコンパイルし、ランタイムを用いてソースコードに規定された複数のタスクをスケジューリングし、２以上のスレッドを用いてスケジューリングした複数のタスクを並列実行する。実行主体は、例えば、情報処理装置１００、または、ノード装置２０１である。

【0070】

実行部４０４は、例えば、追加後の第１ソースコードをコンパイルし、ランタイムを用いて複数の第１タスクをスケジューリングし、２以上のスレッドを用いてスケジューリングした複数の第１タスクを並列実行する。実行部４０４は、具体的には、スケジューリングした結果に基づいて、ノード装置２０１が、２以上のスレッドを用いてスケジューリングした複数の第１タスクを並列実行するよう、ノード装置２０１を制御する。これにより、実行部４０４は、複数の第１タスクの実行順序を制御および保証することができる。

【0071】

実行部４０４は、例えば、追加後の第２ソースコードをコンパイルし、ランタイムを用いて複数の第２タスクをスケジューリングし、２以上のスレッドを用いてスケジューリングした複数の第２タスクを並列実行する。実行部４０４は、具体的には、スケジューリングした結果に基づいて、ノード装置２０１が、２以上のスレッドを用いてスケジューリングした複数の第２タスクを並列実行するよう、ノード装置２０１を制御する。これにより、実行部４０４は、複数の第２タスクの実行順序を制御および保証することができる。

【0072】

出力部４０５は、少なくともいずれかの機能部の処理結果を出力する。出力形式は、例えば、ディスプレイへの表示、プリンタへの印刷出力、ネットワークＩ／Ｆ３０３による外部装置への送信、または、メモリ３０２や記録媒体３０５などの記憶領域への記憶である。これにより、出力部４０５は、少なくともいずれかの機能部の処理結果を自装置利用者に通知可能にし、情報処理装置１００の利便性の向上を図ることができる。

【0073】

出力部４０５は、加工後の第１ソースコードを出力する。出力部４０５は、例えば、加工後の第１ソースコードを、ソースコードを実行する機能を有する他のコンピュータに送信する。他のコンピュータは、例えば、ノード装置２０１である。出力部４０５は、例えば、加工後の第１ソースコードを、システム利用者が参照可能に出力してもよい。これにより、出力部４０５は、外部で、加工後の第１ソースコードを実行可能にすることができる。

【0074】

出力部４０５は、加工後の第２ソースコードを出力する。出力部４０５は、例えば、加工後の第２ソースコードを、ソースコードを実行する機能を有する他のコンピュータに送信する。他のコンピュータは、例えば、ノード装置２０１である。出力部４０５は、例えば、加工後の第２ソースコードを、システム利用者が参照可能に出力してもよい。これにより、出力部４０５は、外部で、加工後の第２ソースコードを実行可能にすることができる。

【0075】

出力部４０５は、実行部４０４で複数の第１タスクを並列実行した結果を出力してもよい。これにより、出力部４０５は、第１ソースコードに規定された複数の第１タスクを並列実行した結果を利用可能にすることができる。

【0076】

出力部４０５は、実行部４０４で複数の第２タスクを並列実行した結果を出力してもよい。これにより、出力部４０５は、第２ソースコードに規定された複数の第２タスクを並列実行した結果を利用可能にすることができる。

【0077】

ここでは、情報処理装置１００が、取得部４０１と、検出部４０２と、加工部４０３と、実行部４０４と、出力部４０５とを含む場合について説明したが、これに限らない。例えば、情報処理装置１００が、いずれかの機能部を含まない場合があってもよい。具体的には、情報処理装置１００が、実行部４０４を含まない場合があってもよい。この場合、情報処理装置１００は、実行部４０４を含む他のコンピュータと通信可能であることが考えられる。情報処理装置１００は、他のコンピュータに、加工後の第１ソースコード、または、加工後の第２ソースコードを送信する。

【0078】

（情報処理システム２００の動作例）
次に、図５～図１２を用いて、情報処理システム２００の動作例について説明する。まず、図５を用いて、情報処理システム２００において、いずれかのノード装置２０１に対して実装されるコンテキストスイッチ機能の一例について説明する。

【0079】

図５は、コンテキストスイッチ機能の一例を示す説明図である。図５に示すように、ノード装置２０１は、コンテキストスイッチ機能が実装される。ノード装置２０１は、例えば、実行待ちタスクを管理するＦｉｒｓｔｉｎＦｉｒｓｔｏｕｔのキューを用意する。

【0080】

ノード装置２０１は、プロセス内のスレッドで、タスクを実行開始後一定時間経過しても、当該タスクが完了しない場合、当該タスクについてコンテキストスイッチ機能を実施する。コンテキストスイッチ機能は、実行中のタスクをキューに退避して実行待ちタスクとして管理すると共に、キューの先頭のタスクを取り出してプロセス内のスレッドで実行開始する機能である。

【0081】

図５の例では、ノード装置２０１は、プロセス内のスレッドで、データの受信を制御する受信タスクＲｅｃｖ５０１を実行中であるとする。ノード装置２０１は、データの演算を制御する演算タスクＣａｌｃ５０２と、データの送信を制御する送信タスクＳｅｎｄ５０３と、データの演算を制御する演算タスクＣａｌｃ５０４とを、実行待ちタスクとして順にキューに格納して管理中であるとする。

【0082】

図５の例では、ノード装置２０１は、プロセス内のスレッドで、受信タスクＲｅｃｖ５０１を実行開始後一定時間経過しても、受信タスクＲｅｃｖ５０１が完了しなければ、受信タスクＲｅｃｖ５０１をキューに退避して実行待ちタスクとして管理する。また、ノード装置２０１は、受信タスクＲｅｃｖ５０１に代わり、キューの先頭の演算タスクＣａｌｃ５０２を取り出して、プロセス内のスレッドで実行開始する。

【0083】

これにより、ノード装置２０１は、タスクがスレッドを占有しないようにすることができ、デッドロックを回避し易くすることができる。ノード装置２０１が、コンテキストスイッチを実施する回数が多くなるほど、オーバーヘッドの増大化を招き、プロセス内のスレッドで実行するタスクの性能低下を招くという問題が発生する。このため、ノード装置２０１が、コンテキストスイッチ機能を実施する回数の増大化を抑制することが望まれる。

【0084】

これに対し、情報処理装置１００は、複数のタスクの記述を含むソースコードを変換してから、ノード装置２０１に提供することにより、デッドロックを回避し易くすると共に、コンテキストスイッチを実施する回数を低減することを目的とする。

【0085】

ここで、図６～図９を用いて、情報処理装置１００が、ノード装置２０１で実行する受信タスクの記述を含むソースコード６００と、ノード装置２０１で実行する送信タスクの記述を含むソースコード８００とを変換する一例について説明する。まず、例えば、図６および図７を用いて、情報処理装置１００が、受信タスクの記述を含むソースコード６００を変換する一例について説明する。

【0086】

図６および図７は、受信タスクの記述を含むソースコード６００を変換する一例を示す説明図である。図６において、情報処理装置１００は、受信タスクの記述を含むソースコード６００を取得する。情報処理装置１００は、ノード装置２０１のプロセス内で同時に実行可能な通信タスク数Ｎ分の要素データを含むバッファｂｕｆを確保する。以下の説明では、バッファｂｕｆのｉ番目の要素データを「要素データｂｕｆ［ｉ－１］」と表記する場合がある。ｉは、１～Ｎの整数である。

【0087】

情報処理装置１００は、ソースコード６００を解析する。情報処理装置１００は、ソースコード６００を解析した結果に基づいて、ソースコード６００のうち、通信を制御し、かつ、演算を実施する複合タスクの記述を検索する。図６の例では、タスクＡは、Ｅ＝５の演算を実施し、かつ、ＭＰＩ＿Ｒｅｃｖ（）の受信を制御する複合タスクである。このため、情報処理装置１００は、検索した結果、ソースコード６００のうち、複合タスクとなるタスクＡの記述を検出する。

【0088】

そこで、情報処理装置１００は、ソースコード６００のうち、検出したタスクＡに、通信を制御する部分を残して、検出したタスクＡから、Ｅ＝５の演算を実施する部分を、タスクＧとして分離する。タスクＡは、ＭＰＩ＿Ｒｅｃｖ（）の受信を制御する通信タスクになる。これにより、情報処理装置１００は、タスクＡと独立してタスクＧを実行し易くすることができ、演算効率の効率化を図ることができる。

【0089】

情報処理装置１００は、ソースコード６００を解析した結果に基づいて、ソースコード６００のうち、通信タスクの記述を検索する。図６の例では、情報処理装置１００は、検索した結果、ソースコード６００のうち、それぞれ通信タスクとなるタスクＡの記述、タスクＢの記述、タスクＣの記述、タスクＤの記述、タスクＥの記述、および、タスクＦの記述を検出する。これにより、情報処理装置１００は、デッドロックの原因となり得る通信タスクの記述を検出することができ、ソースコード６００を変換する指針を得ることができる。ここで、図７の説明に移行する。

【0090】

図７において、情報処理装置１００は、ソースコード６００の先頭に、カウンタ用の変数の定義ｉｎｔｃｎｔ＝０；を挿入する。情報処理装置１００は、通信タスクの記述順序に従って、変数ｃｎｔを０以上Ｎ未満の範囲でサイクリックにインクリメントしながら、それぞれの通信タスクの記述に、要素データｂｕｆ［ｃｎｔ］を用いて他の通信タスクとデータ依存を形成する記述を追加する。データ依存を形成する記述は、例えば、＃ｐｒａｇｍａｏｍｐｔａｓｋｄｅｐｅｎｄ（ｏｕｔ：ｂｕｆ［ｃｎｔ］）である。

【0091】

図７の例では、情報処理装置１００は、タスクＡの記述に、要素データｂｕｆ［ｃｎｔ］を用いて他の通信タスクとデータ依存を形成する記述「＃ｐｒａｇｍａｏｍｐｔａｓｋｄｅｐｅｎｄ（ｏｕｔ：ｂｕｆ［ｃｎｔ］）」を追加する。また、情報処理装置１００は、タスクＡの記述に、変数ｃｎｔを０以上Ｎ未満の範囲でサイクリックにインクリメントするため、変数ｃｎｔをインクリメントする記述ｃｎｔ＋＋と、Ｎ以上になった変数ｃｎｔを初期化する記述とを追加する。初期化する記述は、例えば、ｉｆ（Ｎ＜＝ｃｎｔ）ｃｎｔ＝０である。

【0092】

これにより、情報処理装置１００は、ソースコード６００を、ソースコード７００に変換することができる。情報処理装置１００は、ソースコード７００により、タスクＡ、タスクＢ、タスクＣ、タスクＤ、タスクＥ、および、タスクＦの実行順序を制御および保証することができる。次に、例えば、図８および図９を用いて、情報処理装置１００が、送信タスクの記述を含むソースコード８００を変換する一例について説明する。

【0093】

図８および図９は、送信タスクの記述を含むソースコード８００を変換する一例を示す説明図である。図８において、情報処理装置１００は、送信タスクの記述を含むソースコード８００を取得する。情報処理装置１００は、ノード装置２０１のプロセス内で同時に実行可能な通信タスク数Ｎ分の要素データを含むバッファｂｕｆを確保する。

【0094】

情報処理装置１００は、ソースコード８００を解析する。情報処理装置１００は、ソースコード８００を解析した結果に基づいて、ソースコード８００のうち、通信を制御し、かつ、演算を実施する複合タスクの記述を検索する。図８の例では、タスクＡは、Ｅ＝４の演算を実施し、かつ、ＭＰＩ＿Ｓｅｎｄ（）の送信を制御する複合タスクである。このため、情報処理装置１００は、検索した結果、ソースコード８００のうち、複合タスクとなるタスクＡの記述を検出する。

【0095】

そこで、情報処理装置１００は、ソースコード８００のうち、検出したタスクＡに、通信を制御する部分を残して、検出したタスクＡから、Ｅ＝５の演算を実施する部分を、タスクＧとして分離する。タスクＡは、ＭＰＩ＿Ｓｅｎｄ（）の送信を制御する通信タスクになる。これにより、情報処理装置１００は、タスクＡと独立してタスクＧを実行し易くすることができ、演算効率の効率化を図ることができる。

【0096】

情報処理装置１００は、ソースコード８００を解析した結果に基づいて、ソースコード８００のうち、通信タスクの記述を検索する。図８の例では、情報処理装置１００は、検索した結果、ソースコード８００のうち、それぞれ通信タスクとなるタスクＡの記述、タスクＢの記述、タスクＣの記述、タスクＤの記述、タスクＥの記述、および、タスクＦの記述を検出する。これにより、情報処理装置１００は、デッドロックの原因となり得る通信タスクの記述を検出することができ、ソースコード８００を変換する指針を得ることができる。ここで、図９の説明に移行する。

【0097】

図９において、情報処理装置１００は、ソースコード８００の先頭に、カウンタ用の変数の定義ｉｎｔｃｎｔ＝０；を挿入する。情報処理装置１００は、通信タスクの記述順序に従って、変数ｃｎｔを０以上Ｎ未満の範囲でサイクリックにインクリメントしながら、それぞれの通信タスクの記述に、要素データｂｕｆ［ｃｎｔ］を用いて他の通信タスクとデータ依存を形成する記述を追加する。データ依存を形成する記述は、例えば、＃ｐｒａｇｍａｏｍｐｔａｓｋｄｅｐｅｎｄ（ｏｕｔ：ｂｕｆ［ｃｎｔ］）である。

【0098】

図９の例では、情報処理装置１００は、タスクＡの記述に、要素データｂｕｆ［ｃｎｔ］を用いて他の通信タスクとデータ依存を形成する記述「＃ｐｒａｇｍａｏｍｐｔａｓｋｄｅｐｅｎｄ（ｏｕｔ：ｂｕｆ［ｃｎｔ］）」を追加する。また、情報処理装置１００は、タスクＡの記述に、変数ｃｎｔを０以上Ｎ未満の範囲でサイクリックにインクリメントするため、変数ｃｎｔをインクリメントする記述ｃｎｔ＋＋と、Ｎ以上になった変数ｃｎｔを初期化する記述とを追加する。初期化する記述は、例えば、ｉｆ（Ｎ＜＝ｃｎｔ）ｃｎｔ＝０である。

【0099】

これにより、情報処理装置１００は、ソースコード８００を、ソースコード９００に変換することができる。情報処理装置１００は、ソースコード９００により、タスクＡ、タスクＢ、タスクＣ、タスクＤ、タスクＥ、および、タスクＦの実行順序を制御および保証することができる。ここで、図１０を用いて、情報処理装置１００が、Ｎ＝２として、ソースコード６００を、ソースコード７００に変換した場合における、タスク間のデータ依存関係の一例について説明する。

【0100】

図１０は、タスク間のデータ依存関係の一例を示す説明図である。図１０の符号１０００に示すように、変換前のソースコード６００では、タスクＡ、タスクＢ、タスクＣ、タスクＤ、タスクＥ、および、タスクＦは、データ依存の関係が存在しない。このため、プロセス内で、タスクＡ、タスクＢ、タスクＣ、タスクＤ、タスクＥ、および、タスクＦの実行順序は、不定であると考えられる。

【0101】

これに対し、符号１０１０に示すように、変換後のソースコード７００は、タスクＡ、タスクＢ、タスクＣ、タスクＤ、タスクＥ、および、タスクＦに、データ依存の関係を形成することができる。例えば、変換後のソースコード７００は、ｂｕｆ［０］に関して、タスクＡ、タスクＣ、および、タスクＥに、順にデータ依存の関係を形成することができる。このため、タスクＡ、タスクＣ、および、タスクＥの実行順序は、固定されると考えられる。

【0102】

例えば、変換後のソースコード７００は、ｂｕｆ［１］に関して、タスクＢ、タスクＤ、および、タスクＦに、順にデータ依存の関係を形成することができる。このため、タスクＢ、タスクＤ、および、タスクＦの実行順序は、固定されると考えられる。次に、図１１を用いて、プロセス内のスレッドで、ソースコード７００に規定された複数のタスクを並列実行する一例について説明する。

【0103】

図１１は、複数のタスクを並列実行する一例を示す説明図である。図１１において、情報処理装置１００は、ソースコード７００，９００を、１または複数のノード装置２０１に送信する。これにより、情報処理装置１００は、ソースコード７００に規定された複数のタスクと、ソースコード９００に規定された複数のタスクとが、それぞれ異なるプロセスで実行されるよう、１または複数のノード装置２０１を制御する。

【0104】

図１１の例では、ソースコード７００を受信した第１ノード装置２０１が、プロセス内の３つのスレッドで、ソースコード７００に規定された複数のタスクを並列実行するとする。符号１１１０に示すように、第１ノード装置２０１は、ソースコード７００に従って、通信タスク間のデータ依存を考慮して、スレッド０でタスクＡを実行し、スレッド１でタスクＢを実行し、スレッド２でタスクＧを実行する。

【0105】

第１ノード装置２０１は、スレッド０でタスクＡを完了してから、スレッド０でタスクＣを実行する。第１ノード装置２０１は、スレッド０でタスクＣを完了してから、スレッド０でタスクＥを実行する。第１ノード装置２０１は、スレッド１でタスクＢを完了してから、スレッド１でタスクＤを実行する。第１ノード装置２０１は、スレッド１でタスクＤを完了してから、スレッド１でタスクＦを実行する。これにより、第１ノード装置２０１は、タスクＡ、タスクＢ、タスクＣ、タスクＤ、タスクＥ、および、タスクＦを、固定の実行順序で実行することができる。

【0106】

同様に、ソースコード９００を受信した第２ノード装置２０１は、タスクＡ、タスクＢ、タスクＣ、タスクＤ、タスクＥ、および、タスクＦを、固定の実行順序で実行することができる。これにより、情報処理システム２００は、第１ノード装置２０１と第２ノード装置２０１とが、互いに対応する通信タスクを、同タイミングで実行し易くすることができる。従って、情報処理システム２００は、デッドロックを回避し易くすることができる。

【0107】

これに対し、第１ノード装置２０１が、変換前のソースコード６００に従って、タスクＡ、タスクＢ、タスクＣ、タスクＤ、タスクＥ、および、タスクＦを実行した場合を仮定する。この場合、第１ノード装置２０１は、タスクＡ、タスクＢ、タスクＣ、タスクＤ、タスクＥ、および、タスクＦを、固定の実行順序で実行するとは限らない。例えば、符号１１００に示すように、第１ノード装置２０１は、変換前のソースコード６００に従うと、スレッド０でタスクＢを実行し、スレッド１でタスクＦを実行し、スレッド２でタスクＡを実行することが考えられる。

【0108】

同様に、第２ノード装置２０１が、変換前のソースコード８００に従って、タスクＡ、タスクＢ、タスクＣ、タスクＤ、タスクＥ、および、タスクＦを実行した場合を仮定する。この場合、第２ノード装置２０１は、タスクＡ、タスクＢ、タスクＣ、タスクＤ、タスクＥ、および、タスクＦを、固定の実行順序で実行するとは限らない。第２ノード装置２０１は、変換前のソースコード８００に従うと、スレッド０でタスクＥを実行し、スレッド１でタスクＤを実行し、スレッド２でタスクＣを実行することが考えられる。

【0109】

このように、第１ノード装置２０１と、第２ノード装置２０１とが、互いに対応する通信タスクを、同タイミングで実行するとは限らない。このため、従来では、デッドロックを回避することが難しい場合がある。従って、従来では、第１ノード装置２０１と、第２ノード装置２０１とが、コンテキストスイッチを実施する回数を低減することができず、オーバーヘッドの増大化を招くことがある。次に、図１２を用いて、情報処理装置１００の効果の一例について説明する。具体的には、図１２を用いて、デッドロックを回避することについて説明する。

【0110】

図１２は、情報処理装置１００による効果の一例を示す説明図である。図１２の符号１２１０に示すように、従来では、第２ノード装置２０１のプロセス０において、スレッド０がＳｅｎｄ０の送信タスクを実行し、スレッド１がＳｅｎｄ１の送信タスクを実行することがある。Ｓｅｎｄ０の送信タスクは、Ｒｅｃｖ０の受信タスクに対応する。Ｓｅｎｄ１の送信タスクは、Ｒｅｃｖ１の受信タスクに対応する。

【0111】

同様に、図１２の符号１２１０に示すように、従来では、第１ノード装置２０１のプロセス１において、スレッド０がＲｅｃｖ２の受信タスクを実行し、スレッド１がＲｅｃｖ３の受信タスクを実行することがある。Ｒｅｃｖ２の受信タスクは、Ｓｅｎｄ２の送信タスクに対応する。Ｒｅｃｖ３の受信タスクは、Ｓｅｎｄ３の送信タスクに対応する。

【0112】

プロセス０において、Ｓｅｎｄ０の送信タスク、または、Ｓｅｎｄ１の送信タスクの少なくともいずれかが完了しなければ、Ｓｅｎｄ２の送信タスク、および、Ｓｅｎｄ３の送信タスクは、実行開始されない。プロセス１において、Ｒｅｃｖ２の受信タスク、または、Ｒｅｃｖ３の受信タスクの少なくともいずれかが完了しなければ、Ｒｅｃｖ０の受信タスク、および、Ｒｅｃｖ１の受信タスクは、実行開始されない。

【0113】

従って、プロセス０において、スレッド０，１をタスクが占有したまま完了せず、プロセス１において、スレッド０，１をタスクが占有したまま完了しなくなる。このため、従来では、プロセス０，１において、タスクのデッドロックが発生する確率が比較的高いと考えられる。そして、従来では、コンテキストスイッチを実施する回数を低減することが難しいと考えられる。

【0114】

これに対し、情報処理装置１００は、図１２の符号１２００に示すように、第２ノード装置２０１のプロセス０において、スレッド０がＳｅｎｄ０の送信タスクを実行し、スレッド１がＳｅｎｄ１の送信タスクを実行するよう制御することができる。

【0115】

同様に、情報処理装置１００は、図１２の符号１２００に示すように、第１ノード装置２０１のプロセス１において、スレッド０がＲｅｃｖ０の受信タスクを実行し、スレッド１がＲｅｃｖ１の受信タスクを実行するよう制御することができる。このため、情報処理装置１００は、デッドロックを回避することができる。情報処理装置１００は、コンテキストスイッチを実施する回数を低減することができる。

【0116】

ここでは、ノード装置２０１に対してコンテキストスイッチ機能が実装される場合について説明したが、これに限らない。例えば、ノード装置２０１に対してコンテキストスイッチ機能が実装されない場合があってもよい。

【0117】

（全体処理手順）
次に、図１３を用いて、情報処理装置１００が実行する、全体処理手順の一例について説明する。全体処理は、例えば、図３に示したＣＰＵ３０１と、メモリ３０２や記録媒体３０５などの記憶領域と、ネットワークＩ／Ｆ３０３とによって実現される。

【0118】

図１３は、全体処理手順の一例を示すフローチャートである。図１３において、情報処理装置１００は、同時通信可能な通信タスク数分の要素を含むバッファを設定する（ステップＳ１３０１）。

【0119】

次に、情報処理装置１００は、ソースコードを解析し、ソースコードにおける複数のタスクの記述を検出する（ステップＳ１３０２）。そして、情報処理装置１００は、ソースコードにおける、検出した複数のタスクの記述のうち、まだ選択していないいずれかのタスクの記述を選択する（ステップＳ１３０３）。

【0120】

次に、情報処理装置１００は、ソースコードにおける、選択したいずれかのタスクの記述が、通信と演算とを両方実施する複合タスクの記述であるか否かを判定する（ステップＳ１３０４）。ここで、複合タスクの記述ではない場合（ステップＳ１３０４：Ｎｏ）、情報処理装置１００は、ステップＳ１３０６の処理に移行する。一方で、複合タスクの記述である場合（ステップＳ１３０４：Ｙｅｓ）、情報処理装置１００は、ステップＳ１３０５の処理に移行する。

【0121】

ステップＳ１３０５では、情報処理装置１００は、ソースコードにおける、選択したいずれかのタスクの記述のうち、演算を実施する演算タスクの記述を分離する（ステップＳ１３０５）。そして、情報処理装置１００は、ステップＳ１３０６の処理に移行する。

【0122】

ステップＳ１３０６では、情報処理装置１００は、ソースコードにおける、選択したいずれかのタスクの記述が、通信を実施する通信タスクの記述であるか否かを判定する（ステップＳ１３０６）。ここで、通信タスクの記述ではない場合（ステップＳ１３０６：Ｎｏ）、情報処理装置１００は、ステップＳ１３０８の処理に移行する。一方で、通信タスクの記述である場合（ステップＳ１３０６：Ｙｅｓ）、情報処理装置１００は、ステップＳ１３０７の処理に移行する。

【0123】

ステップＳ１３０７では、情報処理装置１００は、ソースコードにおける、選択したいずれかのタスクの記述に、バッファを用いたデータ依存の記述を追加する（ステップＳ１３０７）。そして、情報処理装置１００は、ステップＳ１３０８の処理に移行する。

【0124】

ステップＳ１３０８では、情報処理装置１００は、すべてのタスクを選択したか否かを判定する（ステップＳ１３０８）。ここで、まだ選択していないタスクがある場合（ステップＳ１３０８：Ｎｏ）、情報処理装置１００は、ステップＳ１３０３の処理に戻る。一方で、すべてのタスクを選択した場合（ステップＳ１３０８：Ｙｅｓ）、情報処理装置１００は、全体処理を終了する。これにより、情報処理装置１００は、デッドロックを回避し易くすることができ、コンテキストスイッチを実施する回数を低減することができる。

【0125】

ここで、情報処理装置１００は、図１３の一部ステップの処理の順序を入れ替えて実行してもよい。また、情報処理装置１００は、図１３の一部ステップの処理を省略してもよい。例えば、ステップＳ１３０４，Ｓ１３０５の処理は省略可能である。

【0126】

以上説明したように、情報処理装置１００によれば、並列実行の対象となる複数のタスクの記述を含むソースコードを取得することができる。情報処理装置１００によれば、取得したソースコードに規定された複数のタスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出することができる。情報処理装置１００によれば、取得したソースコードにおける、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加することができる。これにより、情報処理装置１００は、デッドロックを回避し易くすることができる。

【0127】

情報処理装置１００によれば、追加後のソースコードをコンパイルし、ランタイムを用いて複数のタスクをスケジューリングし、２以上のスレッドを用いてスケジューリングした複数のタスクを並列実行することができる。これにより、情報処理装置１００は、デッドロックを回避しつつ複数のタスクを並列実行することができる。

【0128】

情報処理装置１００によれば、２以上の通信タスクのそれぞれの通信タスクの記述順序に基づいて、当該通信タスクの実行順序を決定することができる。情報処理装置１００によれば、取得したソースコードにおける、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加することができる。これにより、情報処理装置１００は、ソースコードの作成者の意図に沿って通信タスクの実行順序を決定し易くすることができ、複数のタスクの実行効率を向上し易くすることができる。

【0129】

情報処理装置１００によれば、同時に通信可能な通信タスクの上限数分の複数の要素データを設定することができる。情報処理装置１００によれば、２以上の通信タスクのそれぞれの通信タスクの記述順序に基づいて、当該通信タスクの実行順序を決定することができる。情報処理装置１００によれば、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて複数の要素データからサイクリックに選択したいずれかの要素データにアクセスする記述を追加することができる。これにより、情報処理装置１００は、要素データを用いて複数のタスクの正常動作を阻害しないよう、データ依存を形成することができる。

【0130】

情報処理装置１００によれば、アクセスとして、要素データの出力を採用することができる。これにより、情報処理装置１００は、それぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて複数の要素データからサイクリックに選択したいずれかの要素データにアクセスする記述を追加し易くすることができる。情報処理装置１００は、通信タスク間のデータ依存に、入力と出力とを使い分けずに済ませることができる。

【0131】

情報処理装置１００によれば、並列実行の対象となる複数の第１タスクの記述を含むソースコードを取得することができる。情報処理装置１００によれば、取得したソースコードにおける、通信を制御し、かつ、演算を実施する第１タスクの記述を検出することができる。情報処理装置１００によれば、検出した第１タスクの記述を、当該通信を制御する通信タスクの記述と、当該演算を実施する演算タスクの記述とに分割することにより、取得したソースコードを、新たなソースコードに変換することができる。情報処理装置１００によれば、変換した新たなソースコードに規定された複数の第２タスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出することができる。情報処理装置１００によれば、変換した第２ソースコードにおける、検出した２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加することができる。これにより、情報処理装置１００は、第１タスクを形成する通信タスクと演算タスクとを分割することができ、当該通信タスクと独立して当該演算タスクを実行し易くすることができ、演算効率の効率化を図ることができる。

【0132】

なお、本実施の形態で説明した情報処理方法は、予め用意されたプログラムをＰＣやワークステーションなどのコンピュータで実行することにより実現することができる。本実施の形態で説明した情報処理プログラムは、コンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。記録媒体は、ハードディスク、フレキシブルディスク、ＣＤ（ＣｏｍｐａｃｔＤｉｓｃ）－ＲＯＭ、ＭＯ（ＭａｇｎｅｔｏＯｐｔｉｃａｌｄｉｓｃ）、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）などである。また、本実施の形態で説明した情報処理プログラムは、インターネットなどのネットワークを介して配布してもよい。

【0133】

上述した実施の形態に関し、さらに以下の付記を開示する。

【0134】

（付記１）並列実行の対象となる複数のタスクの記述を含むソースコードを取得し、
取得した前記ソースコードに規定された前記複数のタスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出し、
取得した前記ソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する、
処理をコンピュータに実行させることを特徴とする情報処理プログラム。

【0135】

（付記２）追加後の前記ソースコードをコンパイルし、ランタイムを用いて前記複数のタスクをスケジューリングし、２以上のスレッドを用いてスケジューリングした前記複数のタスクを並列実行する、
処理を前記コンピュータに実行させることを特徴とする付記１に記載の情報処理プログラム。

【0136】

（付記３）前記追加する処理は、
取得した前記ソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの記述順序に基づき決定される当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する、ことを特徴とする付記１または２に記載の情報処理プログラム。

【0137】

（付記４）同時に通信可能な通信タスクの上限数分の複数の要素データを設定し、
前記追加する処理は、
取得した前記ソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの記述順序に基づき決定される当該通信タスクの実行順序に応じて前記複数の要素データからサイクリックに選択したいずれかの要素データにアクセスすることにより他の通信タスクとのデータ依存を形成する記述を追加する、ことを特徴とする付記３に記載の情報処理プログラム。

【0138】

（付記５）前記アクセスは、前記要素データの出力である、ことを特徴とする付記４に記載の情報処理プログラム。

【0139】

（付記６）前記取得する処理は、
並列実行の対象となる複数の第１タスクの記述を含むソースコードを取得し、
取得した前記ソースコードにおける、通信を制御し、かつ、演算を実施する第１タスクの記述を、当該通信を制御する通信タスクの記述と、当該演算を実施する演算タスクの記述とに分割することにより、取得した前記ソースコードを、並列実行の対象となる複数の第２タスクの記述を含む新たなソースコードに変換し、
前記検出する処理は、
変換した前記新たなソースコードに規定された前記複数の第２タスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出し、
前記追加する処理は、
変換した前記新たなソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する、ことを特徴とする付記１または２に記載の情報処理プログラム。

【0140】

（付記７）並列実行の対象となる複数のタスクの記述を含むソースコードを取得し、
取得した前記ソースコードに規定された前記複数のタスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出し、
取得した前記ソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する、
処理をコンピュータが実行することを特徴とする情報処理方法。

【0141】

（付記８）並列実行の対象となる複数のタスクの記述を含むソースコードを取得し、
取得した前記ソースコードに規定された前記複数のタスクの記述のうち、それぞれ通信を制御する２以上の通信タスクの記述を検出し、
取得した前記ソースコードにおける、検出した前記２以上の通信タスクの記述のそれぞれの通信タスクの記述に、当該通信タスクの実行順序に応じて特定される通信タスク間にデータ依存を形成する記述を追加する、
制御部を有することを特徴とする情報処理装置。

【符号の説明】

【0142】

１００情報処理装置
１０１，６００，７００，８００，９００ソースコード
２００情報処理システム
２０１ノード装置
２０２クライアント装置
２１０ネットワーク
３００バス
３０１ＣＰＵ
３０２メモリ
３０３ネットワークＩ／Ｆ
３０４記録媒体Ｉ／Ｆ
３０５記録媒体
４００記憶部
４０１取得部
４０２検出部
４０３加工部
４０４実行部
４０５出力部
５０１受信タスクＲｅｃｖ
５０２，５０４演算タスクＣａｌｃ
５０３送信タスクＳｅｎｄ
１０００，１０１０，１１１０，１２００，１２１０符号

【図1】