特許7239827 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7239827情報処理装置及びコンパイラプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-03-07

(45)【発行日】2023-03-15

(54)【発明の名称】情報処理装置及びコンパイラプログラム

(51)【国際特許分類】

G06F 8/41 20180101AFI20230308BHJP

【ＦＩ】

G06F8/41 130

【請求項の数】 11

(21)【出願番号】P 2019121513

(22)【出願日】2019-06-28

(65)【公開番号】P2021009443

(43)【公開日】2021-01-28

【審査請求日】2022-03-08

(73)【特許権者】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】100094525

【弁理士】

【氏名又は名称】土井健二

(74)【代理人】

【識別番号】100094514

【弁理士】

【氏名又は名称】林恒徳

(72)【発明者】

【氏名】谷村恭伸

(72)【発明者】

【氏名】山中栄次

(72)【発明者】

【氏名】鎌塚俊

【審査官】坂庭剛史

(56)【参考文献】

【文献】特開平４－２１１８３０（ＪＰ，Ａ）

【文献】特開２００１－３０６３３３（ＪＰ，Ａ）

【文献】米国特許第６６５１２４６（ＵＳ，Ｂ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ８／４１

(57)【特許請求の範囲】

【請求項1】

ソースコードから生成した中間言語のループに含まれる各命令間の依存関係を示す依存情報を生成し、生成した前記依存情報を行列に変換することによって第１行列を生成する情報生成部と、
生成した前記第１行列から算出した各命令間における依存度合いに基づいて、前記ループに含まれる各命令を複数のグループに振り分けるグループ振分部と、
振り分けた前記複数のグループごとに、前記ループの分割を行うループ分割部と、を有する、
ことを特徴とする情報処理装置。

【請求項2】

請求項１において、
前記情報生成部は、
前記ループに含まれる命令の組合せごとに、各組合せに含まれる命令間に依存関係があることを前記依存情報が示しているか否かを判定し、
前記命令の組合せのうち、各組合せに含まれる命令間に依存関係があることを前記依存情報が示している組合せに対応する要素を第１の値とし、前記命令の組合せのうち、各組合せに含まれる命令間に依存関係があることを前記依存情報が示していない組合せに対応する要素を第２の値とすることにより、前記第１行列の生成を行う、
ことを特徴とする情報処理装置。

【請求項3】

請求項１において、
前記グループ振分部は、異なるグループにそれぞれ含まれる命令間において存在する依存関係が少なくなるように、前記ループに含まれる各命令を複数のグループに振り分ける、
ことを特徴とする情報処理装置。

【請求項4】

請求項１において、
前記グループ振分部は、
前記第１行列から各命令間における依存度合いを示す第２行列を生成し、
生成した前記第２行列に基づいて、前記ループに含まれる各命令を前記複数のグループに振り分ける、
ことを特徴とする情報処理装置。

【請求項5】

請求項４において、
前記グループ振分部は、
前記ループに含まれる命令の組合せごとに、各組合せに含まれる命令間における依存度合いを算出し、
算出した前記依存度合いのそれぞれを要素とすることにより、前記第２行列を生成する、
ことを特徴とする情報処理装置。

【請求項6】

請求項５において、
前記グループ振分部は、Ｎｅｗｍａｎアルゴリズムを用いることにより、前記依存度合いを算出する、
ことを特徴とする情報処理装置。

【請求項7】

請求項５において、
前記グループ振分部は、
前記第２行列の要素の値のうち、最大の値に対応する複数の命令の振り分け先を同じグループに決定し、
前記第２行列における前記複数の命令に対応する複数の行を、前記複数の行における同一列ごとの要素の和を要素とする単一の行に変換し、かつ、前記第２行列における前記複数の命令に対応する複数の列を、前記複数の列における同一行ごとの要素の和を要素とする単一の列に変換することによって、前記第１行列を再生成し、
再生成した前記第１行列から前記第２行列を再生成し、
前記ループに含まれる各命令の振り分け先として決定したグループの数が所定数以下になるまで、前記決定する処理と前記第１行列を再生成する処理と前記第２行列を再生成する処理とを繰り返す、
ことを特徴とする情報処理装置。

【請求項8】

請求項２において、さらに、
近接する記憶領域に格納された各データに対してアクセスを行う複数の命令が前記ループに含まれているか否かを判定する近接判定部を有し、
前記情報生成部は、前記複数の命令が前記ループに含まれているか否かの判定結果に基づいて、前記第１行列の生成を行う、
ことを特徴とする情報処理装置。

【請求項9】

請求項８において、
前記情報生成部は、前記複数の命令が前記ループに含まれていると判定した場合、前記複数の命令間に対応する要素を前記第１の値よりも大きい第３の値とすることにより、前記第１行列の生成を行う、
ことを特徴とする情報処理装置。

【請求項10】

請求項８において、
前記近接する記憶領域に格納された各データは、同一の配列である、
ことを特徴とする情報処理装置。

【請求項11】

ソースコードから生成した中間言語のループに含まれる各命令間の依存関係を示す依存情報を生成し、
生成した前記依存情報を行列に変換することによって第１行列を生成し、
生成した前記第１行列から算出した各命令間における依存度合いに基づいて、前記ループに含まれる各命令を複数のグループに振り分け、
振り分けた前記複数のグループごとに、前記ループの分割を行う、
処理をコンピュータに実行させることを特徴とするコンパイラプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置及びコンパイラプログラムに関する。

【背景技術】

【0002】

例えば、ＨＰＣ（ＨｉｇｈＰｅｒｆｏｒｍａｎｃｅＣｏｎｐｕｔｉｎｇ）等に用いられるコンパイラプログラム（以下、単にコンパイラとも呼ぶ）は、ソースコードのコンパイルを行う際に、処理速度等の処理性能を向上させるための最適化処理を行う。具体的に、コンパイラは、例えば、ソースコードに含まれるループ（以下、分割対象のループとも呼ぶ）を複数のループに分割するループ分割を行う。

【0003】

これにより、コンパイラは、例えば、ハード資源不足等に起因する最適化阻害要因の発生を抑制することが可能になる。また、コンパイラは、例えば、キャッシュ効率の低下を抑制することが可能になる（例えば、特許文献１及び２参照）。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２００２－１２３５６３号公報

【文献】特開２００９－１０４４２２号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

ここで、上記のようなコンパイラは、例えば、分割対象のループに含まれる各命令間の依存関係をそれぞれ解析し、その解析結果に基づいて各命令を複数の分割ループにそれぞれ振り分けることにより、分析対象のループの分割を行う。

【0006】

しかしながら、依存関係を解析する必要がある命令の組合せ数は、分割対象のループに含まれる命令の数に従って多くなる。そのため、分割対象のループに含まれる命令の数が膨大である場合、コンパイラは、ループ分割に多くの時間を要することになり、ソースコードのコンパイルを効率的に行うことができなくなる。

【0007】

そこで、一つの側面では、本発明は、ソースコードに含まれるループの分割を高速に行うことを可能とする情報処理装置及びコンパイラプログラムを提供することを目的とする。

【課題を解決するための手段】

【0008】

実施の形態の一態様では、ソースコードから生成した中間言語のループに含まれる各命令間の依存関係を示す依存情報を生成し、生成した前記依存情報を行列に変換することによって第１行列を生成する情報生成部と、生成した前記第１行列から算出した各命令間における依存度合いに基づいて、前記ループに含まれる各命令を複数のグループに振り分けるグループ振分部と、振り分けた前記複数のグループごとに、前記ループの分割を行うループ分割部と、を有する。

【発明の効果】

【0009】

一つの側面によれば、ソースコードに含まれるループの分割を高速に行うことを可能とする。

【図面の簡単な説明】

【0010】

【図1】図１は、情報処理システム１０の構成について説明する図である。

【図2】図２は、情報処理装置１が行うコンパイル処理を説明するフローチャートである。

【図3】図３は、情報処理装置１のハードウエア構成を説明する図である。

【図4】図４は、情報処理装置１の機能のブロック図である。

【図5】図５は、Ｓ２の処理の概略について説明するフローチャートである。

【図6】図６は、Ｓ２の処理の詳細を説明するフローチャート図である。

【図7】図７は、Ｓ２の処理の詳細を説明するフローチャート図である。

【図8】図８は、Ｓ２の処理の詳細を説明するフローチャート図である。

【図9】図９は、中間言語２２の内容を説明する具体例である。

【図10】図１０は、依存情報１３１の具体例について説明する図である。

【図11】図１１は、依存グラフ１３１ａの具体例について説明する図である。

【図12】図１２は、第１行列１３２の具体例について説明する図である。

【図13】図１３は、第２行列１３３の具体例について説明する図である。

【図14】図１４は、依存情報１３１の具体例について説明する図である。

【図15】図１５は、第１行列１３２の具体例について説明する図である。

【図16】図１６は、第２行列１３３の具体例について説明する図である。

【図17】図１７は、依存情報１３１の具体例について説明する図である。

【図18】図１８は、第１行列１３２の具体例について説明する図である。

【図19】図１９は、依存グラフ１３１ａの具体例について説明する図である。

【図20】図２０は、分割ループの内容を説明する具体例である。

【図21】図２１は、第２の実施の形態におけるＳ２の処理を説明するフローチャート図である。

【図22】図２２は、第２の実施の形態におけるＳ２の処理を説明するフローチャート図である。

【図23】図２３は、第２の実施の形態におけるＳ２の処理を説明するフローチャート図である。

【図24】図２４は、依存情報１３１の具体例について説明する図である。

【図25】図２５は、第１行列１３２の具体例について説明する図である。

【図26】図２６は、第１行列１３２の具体例について説明する図である。

【図27】図２７は、依存グラフ１３１ａの具体例について説明する図である。

【図28】図２８は、分割ループの内容を説明する具体例である。

【発明を実施するための形態】

【0011】

［情報処理システムの構成］
初めに、情報処理システム１０の構成について説明を行う。図１は、情報処理システム１０の構成について説明する図である。

【0012】

図１に示すように、情報処理システム１０は、例えば、１台以上の物理マシンからなる情報処理装置１と、情報処理装置１の内部または外部に設けられる記憶部１３０と、操作端末５とを含む。操作端末５は、例えば、ソースコードのコンパイルを行う作業者が使用するＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）であり、ネットワークＮＷを介して情報処理装置１と接続する。

【0013】

情報処理装置１（情報処理装置１において動作するコンパイラ）は、コンパイルを開始するタイミング（以下、コンパイル開始タイミングとも呼ぶ）になった場合、例えば、記憶部１３０に記憶されたソースコード２１を取得し、取得したソースコード２１のコンパイルを行う処理（以下、コンパイル処理とも呼ぶ）を行うことによって中間言語２２を生成し、さらに、生成した中間言語２２からオブジェクトコード２３を生成する。コンパイル開始タイミングは、例えば、作業者が操作端末５を介してコンパイル処理を開始する旨の指示を行ったタイミングであってよい。

【0014】

また、情報処理装置１は、オブジェクトコード２３を実行するタイミング（以下、コード実行タイミングとも呼ぶ）になった場合、記憶部１３０に記憶されたオブジェクトコード２３を取得し、コンパイル処理によって生成されたオブジェクトコード２３を実行する処理（以下、コード実行処理とも呼ぶ）を行う。以下、情報処理装置１が行うコンパイル処理及びコード実行処理について説明を行う。

【0015】

［情報処理装置によるコンパイル処理］
初めに、情報処理装置１が行うコンパイル処理について説明を行う。図２は、情報処理装置１が行うコンパイル処理を説明するフローチャートである。

【0016】

情報処理装置１は、図２に示すように、ソースコード２１の字句解析及び構文解析を行うことにより、中間言語２２を生成する（Ｓ１）。そして、情報処理装置１は、例えば、生成した中間言語２２を情報格納領域１３０に記憶する。

【0017】

その後、情報処理装置１は、Ｓ１の処理において生成された中間言語２２の最適化を行う（Ｓ２）。具体的に、情報処理装置１は、中間言語２２に含まれるループのそれぞれに対して、ループ分割等の処理を行う。

【0018】

続いて、情報処理装置１は、例えば、Ｓ１で最適化を行った中間言語２２からオブジェクトコード２３の生成を行う（Ｓ３）。そして、情報処理装置１は、例えば、生成したオブジェクトコード２３を記憶部１３０に記憶する。

【0019】

ここで、図２で説明したＳ２の処理を行う場合、情報処理装置１は、例えば、ループに含まれる各命令間の依存関係をそれぞれ解析し、その解析結果に基づいて各命令を複数の分割ループにそれぞれ振り分けることにより、分析対象のループの分割を行う。

【0020】

しかしながら、依存関係を解析する必要がある命令の組合せ数は、分割対象のループに含まれる命令の数に従って多くなる。そのため、例えば、分割対象のループに含まれる命令の数が膨大である場合、情報処理装置１は、ループ分割に多くの時間を要することになり、ソースコードのコンパイルを効率的に行うことができなくなる。

【0021】

そこで、本実施の形態における情報処理装置１は、ソースコード２１から生成した中間言語２２のループに含まれる各命令間の依存関係を示す情報（以下、依存情報とも呼ぶ）を生成し、生成した依存情報を変換することによって行列（以下、第１行列とも呼ぶ）を生成する。

【0022】

そして、情報処理装置１は、生成した第１行列から算出した各命令間における依存度合いに基づいて、ループに含まれる各命令を複数のグループに振り分け、振り分けたグループごとにループの分割を行う。

【0023】

すなわち、本実施の形態における情報処理装置１は、依存情報から生成された第１行列を用いる演算を行うことで、分割対象のループに含まれる命令の組合せごとの依存関係の解析等を行うことなく、各命令の振り分け先を決定する。

【0024】

これにより、情報処理装置１は、ループ分割を効率的に行うことが可能になり、ソースコード２１のコンパイルに要する時間を短縮することが可能になる。

【0025】

また、情報処理装置１は、分割対象のループに含まれる各命令の振り分け先を計算によって決定することで、異なる分割ループに含まれる命令間の依存関係が最も疎になるループ分割の方法を特定することが可能になる。そのため、情報処理装置１は、特定した方法に従ってループの分割を行うことにより、ソースコード２１から生成されるオブジェクトコード２３の実行時間についても短縮させることが可能になる。

【0026】

［情報処理システムのハードウエア構成］
次に、情報処理システム１０のハードウエア構成について説明する。図３は、情報処理装置１のハードウエア構成を説明する図である。

【0027】

情報処理装置１は、図３に示すように、プロセッサであるＣＰＵ１０１と、メモリ１０２と、外部インターフェース（Ｉ／Ｏユニット）１０３と、記憶媒体１０４とを有する。各部は、バス１０５を介して互いに接続される。

【0028】

記憶媒体１０４は、例えば、コンパイル処理を行うためのプログラム１１０（コンパイラ）を記憶するプログラム格納領域（図示しない）を有する。また、記憶媒体１０４は、例えば、コンパイル処理を行う際に用いられる情報を記憶する記憶部１３０（以下、情報格納領域１３０とも呼ぶ）を有する。なお、記憶媒体１０４は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）やＳＳＤ（ＳｏｋｉｄＳｔａｔｅＤｒｉｖｅ）であってよい。

【0029】

ＣＰＵ１０１は、記憶媒体１０４からメモリ１０２にロードされたプログラム１１０を実行してコンパイル処理を行う。

【0030】

また、外部インターフェース１０３は、例えば、操作端末５と通信を行う。

【0031】

［情報処理システムの機能］
次に、情報処理システム１０の機能について説明を行う。図４は、情報処理装置１の機能のブロック図である。

【0032】

情報処理装置１は、図４に示すように、例えば、ＣＰＵ１０１やメモリ１０２等のハードウエアとプログラム１１０とが有機的に協働することにより、分割判定部１１１と、情報生成部１１２と、情報管理部１１３と、グループ振分部１１４と、ループ分割部１１５と、近接判定部１１６とを含む各種機能を実現する。

【0033】

また、情報処理装置１は、例えば、図４に示すように、依存情報１３１と、第１行列１３２と、第２行列１３３とを情報格納領域１３０に記憶する。

【0034】

分割判定部１１１は、例えば、ソースコード２１から生成した中間言語２２に含まれる各ループについてループ分割を行うか否かを判定する。具体的に、分割判定部１１１は、例えば、実行時に用いられるレジスタ数やストリーム数がＣＰＵ１０１のレジスタ数やストリーム数を超えるループが中間言語２２に含まれている場合、そのループについてループ分割を行う旨の判定を行う。

【0035】

情報生成部１１２は、分割対象のループに含まれる各命令間の依存関係を示す依存情報１３１を生成する。具体的に、情報生成部１１２は、分割判定部１１１がループ分割を行う旨の判定を行ったループが存在する場合、そのループに対応する依存情報１３１を生成する。また、情報生成部１１２は、生成した依存情報１３１を行列に変換することによって第１行列１３２を生成する。

【0036】

情報管理部１１３は、例えば、情報生成部１１２が生成した依存情報１３１や第１行列１３２を情報格納領域１３０に記憶する。

【0037】

グループ振分部１１４は、情報生成部１１２が生成した第１行列１３２から算出した各命令間における依存度合いに基づいて、分割対象のループに含まれる各命令を複数のグループに振り分ける。

【0038】

ループ分割部１１５は、グループ振分部１１４が振り分けたグループごとに、分割対象のループについてのループ分割を行う。

【0039】

近接判定部１１６は、例えば、メモリ１０２内において近接するアドレスに格納された各データに対してアクセスを行う複数の命令が分割対象のループに含まれているか否かを判定する。

【0040】

そして、例えば、メモリ１０２内において近接するアドレスに格納された各データに対してアクセスを行う複数の命令が分割対象のループに含まれていると近接判定部１１６が判定した場合、情報生成部１１２は、分割対象のループに含まれる各命令間の依存関係と、各命令がアクセスするデータのメモリ１０２内における位置関係とに対応する依存情報１３１を生成する。第２行列１３３の説明については後述する。

【0041】

［第１の実施の形態の概略］
次に、第１の実施の形態の概略について説明する。具体的に、図２で説明したＳ２の処理の概略について説明する。図５は、Ｓ２の処理の概略について説明するフローチャートである。

【0042】

情報処理装置１の情報生成部１１２は、ソースコード２１から生成した中間言語２２のループに含まれる各命令間の依存関係を示す依存情報１３１を生成する（Ｓ１１）。

【0043】

そして、情報生成部１１２は、Ｓ１１の処理で生成した依存情報１３１を行列に変換することによって第１行列１３２を生成する（Ｓ１２）。

【0044】

続いて、情報処理装置１のグループ振分部１１４は、Ｓ１２の処理で生成した第１行列１３２から算出した各命令間の依存度合いに基づいて、分割対象のループに含まれる各命令を複数のグループに振り分ける（Ｓ１３）。

【0045】

その後、情報処理装置のループ分割部１１５は、Ｓ１３の処理で振り分けたグループごとに、分割対象のループの分割を行う（Ｓ１４）。

【0046】

【0047】

【0048】

［第１の実施の形態の詳細］
次に、第１の実施の形態の詳細について説明する。図６から図９は、図２で説明したＳ２の処理の詳細を説明するフローチャート図である。また、図９から図２０は、Ｓ２の処理の詳細を説明する図である。

【0049】

情報処理装置１の分割判定部１１１は、図６に示すように、情報格納領域１３０に記憶された中間言語２２に、分割対象のループが含まれているか否かを判定する（Ｓ２１）。以下、中間言語２２の具体例について説明を行う。

【0050】

［中間言語の具体例］
図９は、中間言語２２の内容を説明する具体例である。具体的に、図９は、ソースコード２１をアセンブラ命令相当で表現した場合の中間言語２２を説明する具体例である。

【0051】

図９に示す中間言語２２は、変数ｒｅｇ＿ｉに初期値として１を設定することを示す命令である「ｍｏｖｒｅｇ＿ｉ，１」と、ループの開始位置を示すラベルである「ＬＡＢＥＬ１：」とを含む。

【0052】

また、図９に示す中間言語２２は、配列Ａのｒｅｇ＿ｉ番目に格納されている値を変数ｒｅｇ１に設定することを示す命令である「ｌｏａｄｒｅｇ１，ｍｅｍ“Ａ（ｒｅｇ＿ｉ）”」と、配列Ｂのｒｅｇ＿ｉ番目に格納されている値を変数ｒｅｇ２に設定することを示す命令である「ｌｏａｄｒｅｇ２，ｍｅｍ“Ｂ（ｒｅｇ＿ｉ）”」とを含む。

【0053】

また、図９に示す中間言語２２は、変数ｒｅｇ１に設定されている値と変数ｒｅｇ２に設定されている値とを加算することによって算出した値を、変数ｒｅｇ３に設定することを示す命令である「ａｄｄｒｅｇ３，ｒｅｇ１，ｒｅｇ２」と、配列Ｃのｒｅｇ＿ｉ番目に格納されている値を変数ｒｅｇ４に設定することを示す命令である「ｌｏａｄｒｅｇ４，ｍｅｍ“Ｃ（ｒｅｇ＿ｉ）”」とを含む。

【0054】

また、図９に示す中間言語２２は、配列Ｄのｒｅｇ＿ｉ番目に格納されている値を変数ｒｅｇ５に設定することを示す命令である「ｌｏａｄｒｅｇ５，ｍｅｍ“Ｄ（ｒｅｇ＿ｉ）”」と、配列Ｃのｒｅｇ＿ｉ＋１０番目に格納されているデータを変数ｒｅｇ６に設定することを示す命令である「ｌｏａｄｒｅｇ６，ｍｅｍ“Ｃ（ｒｅｇ＿ｉ＋１０）”」とを含む。

【0055】

また、配列Ｅのｒｅｇ＿ｉ番目に格納されている値を変数ｒｅｇ７に設定することを示す命令である「ｌｏａｄｒｅｇ７，ｍｅｍ“Ｅ（ｒｅｇ＿ｉ）”」と、変数ｒｅｇ３に設定されている値と変数ｒｅｇ４に設定されている値とを加算することによって算出した値を、変数ｒｅｇ８に設定することを示す命令である「ａｄｄｒｅｇ８，ｒｅｇ３，ｒｅｇ４」とを含む。

【0056】

また、図９に示す中間言語２２は、変数ｒｅｇ４に設定されている値と変数ｒｅｇ８に設定されている値とを加算することによって算出した値を、変数ｒｅｇ９に設定することを示す命令である「ａｄｄｒｅｇ９，ｒｅｇ４，ｒｅｇ８」と、変数ｒｅｇ３に設定されている値と変数ｒｅｇ５に設定されている値とを乗算することによって算出した値に、変数ｒｅｇ９に設定されている値を加算することによって算出した値を、変数ｒｅｇ１０に設定に設定することを示す命令である「ｍａｄｄｒｅｇ１０，ｒｅｇ３，ｒｅｇ５，ｒｅｇ９」とを含む。

【0057】

また、図９に示す中間言語２２は、変数ｒｅｇ５に設定されている値と変数ｒｅｇ６に設定されている値とを乗算することによって算出した値に、変数ｒｅｇ１０に設定されている値を加算することによって算出した値を、変数ｒｅｇ１１に設定することを示す命令である「ｍａｄｄｒｅｇ１１，ｒｅｇ５，ｒｅｇ６，ｒｅｇ１０」と、変数ｒｅｇ７に設定されている値と変数ｒｅｇ１１に設定されている値とを加算することによって算出した値を、変数ｒｅｇ１２に設定することを示す命令である「ａｄｄｒｅｇ１２，ｒｅｇ７，ｒｅｇ１１」とを含む。

【0058】

また、図９に示す中間言語２２は、変数ｒｅｇ１２に設定されている値を配列Ｆのｒｅｇ＿ｉ番目に格納することを示す命令である「ｓｔｏｒｅｍｅｍ“Ｆ（ｒｅｇ＿ｉ）”，ｒｅｇ１２」と、変数ｒｅｇ＿ｉに設定されている値に１を加算することによって算出した値を、変数ｒｅｇ＿ｉに設定することを示す命令である「ａｄｄｒｅｇ＿ｉ，ｒｅｇ＿ｉ，１」とを含む。

【0059】

さらに、図９に示す中間言語２２は、変数ｒｅｇ＿ｉに設定されている値と１００とを比較することを示す命令である「ｃｍｐｒｅｇ＿ｉ，１００」と、変数ｒｅｇ＿ｉに設定されている値が１００以下である場合、ループの開始位置を示す「ＬＡＢＥＬ１：」に分岐し、変数ｒｅｇ＿ｉに設定されている値が１００を上回る場合、ループを終了することを示す命令である「ｂｌｅｉｃｃ，ＬＡＢＡＬ１」とを含む。

【0060】

なお、以下、図９に示す中間言語２２において各命令の左端に記載されている番号を、各命令の命令番号とも呼ぶ。また、以下、命令番号が「１」から「１３」である命令のそれぞれを命令１から命令１３とも呼ぶ。

【0061】

図６に戻り、情報格納領域１３０に記憶された中間言語２２に、分割対象のループが含まれている場合（Ｓ２２のＹＥＳ）、情報処理装置１の情報生成部１１２は、Ｓ２１の処理で分割対象のループであると判定したループに含まれる各命令間の依存関係を示す依存情報１３１を生成する（Ｓ２３）。以下、依存情報１３１の具体例について説明を行う。

【0062】

［依存情報の具体例］
図１０は、依存情報１３１の具体例について説明する図である。

【0063】

図１０に示す依存情報１３１は、中間言語２２に含まれる各命令の命令番号が記憶される「命令番号」と、各命令と依存関係にある命令の命令番号についてのリストである「データ依存リスト」と、各命令が含まれるグループ（分割ループ）の名称が記憶される「グループ名」とを項目として有する。

【0064】

具体的に、図９で説明した中間言語２２において、命令１で値が設定された変数ｒｅｇ１は、命令３のみにおいて参照されている。そのため、情報生成部１１２は、例えば、図１０に示すように、「命令番号」が「１」である情報の「データ依存リスト」に「３」を記憶する。

【0065】

また、図９で説明した中間言語２２において、命令２で値が設定された変数ｒｅｇ２は、命令３のみにおいて参照されている。そのため、情報生成部１１２は、例えば、図１０に示すように、「命令番号」が「２」である情報の「データ依存リスト」に「３」を記憶する。

【0066】

さらに、図９で説明した中間言語２２において、命令３は、命令１で値が設定された変数ｒｅｇ１と命令２で値が設定された変数ｒｅｇ２とを参照している。また、図９で説明した中間言語２２において、命令３で値が設定された変数ｒｅｇ３は、命令８及び命令１０において参照されている。そのため、情報生成部１１２は、例えば、図１０に示すように、「命令番号」が「３」である情報の「データ依存リスト」に「１」、「２」、「８」及び「１０」を記憶する。

【0067】

また、情報生成部１１２は、例えば、図１０に示すように、各命令に対応する「グループ名」の初期値として各命令の命令番号を記憶する。図１０に含まれる他の情報についての説明は省略する。

【0068】

なお、情報生成部１１２は、Ｓ２３の処理において、依存情報１３１に含まれる内容に対応する依存グラフ１３１ａを生成するものであってもよい。以下、依存グラフ１３１ａの具体例について説明を行う。

【0069】

［依存グラフの具体例（１）］
図１１は、依存グラフ１３１ａの具体例について説明する図である。以下、双方向の関係を示すエッジを双方向エッジとも呼び、単方向の関係を示すエッジを単方向エッジとも呼ぶ。

【0070】

具体的に、図１１に示す依存グラフ１３１ａでは、命令１に対応するノードと命令３に対応するノードとの間、命令２に対応するノードと命令３に対応するノードとの間、命令３に対応するノードと命令８に対応するノードとの間、命令３に対応するノードと命令１０に対応するノードとの間、及び、命令４に対応するノードと命令８に対応するノードとの間のそれぞれに双方向エッジが設定されている。また、図１１に示す依存グラフ１３１ａでは、命令４に対応するノードと命令９に対応するノードとの間、命令５に対応するノードと命令１０に対応するノードとの間、命令５に対応するノードと命令１１に対応するノードとの間、命令６に対応するノードと命令１１に対応するノードとの間、及び、命令７に対応するノードと命令１２に対応するノードとの間のそれぞれに双方向エッジが設定されている。さらに、図１１に示す依存グラフ１３１ａでは、命令８に対応するノードと命令９に対応するノードとの間、命令９に対応するノードと命令１０に対応するノードとの間、命令１０に対応するノードと命令１１に対応するノードとの間、命令１１に対応するノードと命令１２に対応するノードとの間、及び、命令１２に対応するノードと命令１３に対応するノードとの間のそれぞれに双方向エッジが設定されている。すなわち、図１１に示す依存グラフ１３１ａには、１５本の双方向エッジが設定されている。

【0071】

図１０で説明した依存情報１３１において、例えば、「命令番号」が「１」である情報の「データ依存リスト」には、「３」が記憶されており、「命令番号」が「３」である情報の「データ依存リスト」には、「１」が記憶されている。そのため、情報生成部１１２は、例えば、図１１に示すように、命令１に対応するノードと命令３に対応するノードとの間に双方向エッジを設定する。

【0072】

また、図１０で説明した依存情報１３１において、例えば、「命令番号」が「２」である情報の「データ依存リスト」には、「３」が記憶されており、「命令番号」が「３」である情報の「データ依存リスト」には、「２」が記憶されている。そのため、情報生成部１１２は、例えば、図１１に示すように、命令２に対応するノードと命令３に対応するノードとの間に双方向エッジを設定する。

【0073】

さらに、図１０で説明した依存情報１３１において、例えば、「命令番号」が「３」である情報の「データ依存リスト」には、「８」が記憶されており、「命令番号」が「８」である情報の「データ依存リスト」には、「３」が記憶されている。そのため、情報生成部１１２は、例えば、図１１に示すように、命令３に対応するノードと命令８に対応するノードとの間に双方向エッジを設定する。図１１に含まれる他の情報についての説明は省略する。

【0074】

図６に戻り、情報生成部１１２は、Ｓ２３の処理で生成した依存情報１３１を行列に変換することによって第１行列１３２を生成する（Ｓ２４）。以下、第１行列１３２の具体例について説明を行う。

【0075】

［第１行列の具体例］
図１２は、第１行列１３２の具体例について説明する図である。

【0076】

図１２に示す第１行列１３２において、「１」から「１３」のそれぞれに対応する行は、命令１から命令１３のそれぞれに対応する行であり、「１」から「１３」のそれぞれに対応する列は、命令１から命令１３のそれぞれに対応する列である。また、図１２に示す第１行列１３２の各要素（各欄）には、行に対応する命令と列に対応する命令との間に依存関係が存在することを示す値である「１」、または、行に対応する命令と列に対応する命令との間に依存関係が存在しないことを示す値である「０」が記憶される。

【0077】

具体的に、図１０に示す依存情報１３１において、「命令番号」が「１」である情報の「データ依存リスト」には、「３」が記憶されている。そのため、情報生成部１１２は、図１２に示すように、例えば、命令１に対応する行に含まれる欄のうち、命令３に対応する列に含まれる欄に「１」を記憶する。

【0078】

また、図１０に示す依存情報１３１において、「命令番号」が「２」である情報の「データ依存リスト」には、「３」が記憶されている。そのため、情報生成部１１２は、図１２に示すように、例えば、命令２に対応する行に含まれる欄のうち、命令３に対応する列に含まれる欄に「１」を記憶する。

【0079】

さらに、図１０に示す依存情報１３１において、「命令番号」が「３」である情報の「データ依存リスト」には、「１」、「２」、「８」及び「１０」が記憶されている。そのため、情報生成部１１２は、図１２に示すように、例えば、命令３に対応する行に含まれる欄のうち、命令１に対応する列に含まれる欄と、命令２に対応する列に含まれる欄と、命令８に対応する列に含まれる欄と、命令１０に対応する列に含まれる欄とのそれぞれに「１」を記憶する。図１２に含まれる他の情報についての説明は省略する。

【0080】

図６に戻り、情報処理装置１のグループ振分部１１４は、Ｓ２４の処理で生成した第１行列１３２から、各命令間における依存度合いを示す第２行列１３３を生成する（Ｓ２５）。以下、第２行列の具体例について説明を行う。

【0081】

［第２行列の具体例］
図１３は、第２行列１３３の具体例について説明する図である。

【0082】

図１３に示す第２行列１３３において、「１」から「１３」のそれぞれに対応する行は、命令１から命令１３のそれぞれに対応する行であり、「１」から「１３」のそれぞれに対応する列は、命令１から命令１３のそれぞれに対応する列である。また、図１３に示す第２行列１３３の各要素（各欄）には、行に対応する命令と列に対応する命令との間の依存度合いが記憶される。

【0083】

ここで、各命令間の依存度合いは、例えば、Ｎｅｗｍａｎアルゴリズムによって算出されるクラスタリング指標値であってよい。この場合、グループ振分部１１４は、例えば、以下の式１を用いることによってクラスタリング指標値ΔＱを算出する。

【0084】

ΔＱ＝ｅ_ｉｊ＋ｅ_ｊｉ－２ａ_ｉａ_ｊ＝２（ｅ_ｉｊ－ａ_ｉａ_ｊ）（式１）

【0085】

上記の式１において、変数ａ_ｉは、図１１で説明した依存グラフ１３１ａに含まれる単方向エッジのうち、命令ｉに対応するノードと他の命令に対するノードとの間における単方向エッジの数の割合を示し、変数ａ_ｊは、図１１で説明した依存グラフ１３１ａに含まれる単方向エッジのうち、命令ｊに対応するノードと他の命令に対するノードとの間における単方向エッジの数の割合を示す。また、式１において、変数ｅ_ｉｊは、図１１で説明した依存グラフ１３１ａに含まれる単方向エッジのうち、命令ｉに対応するノードと命令ｊに対応するノードとの間における単方向エッジの数の割合を示す。

【0086】

具体的に、図１１で説明した依存グラフ１３１ａが示す状態は、双方向エッジが１５本含まれている状態であり、単方向エッジが３０本含まれている場合と同じ状態である。また、図１１で説明した依存グラフ１３１ａにおいて、命令１２に対応するノードと他のノードとの間における単方向エッジの数、命令１３に対応するノードと他のノードとの間における単方向エッジの数及び命令１２に対応するノードと命令１３に対応するノードとの間における単方向エッジの数は、それぞれ３本、１本及び１本である。そのため、グループ振分部１１４は、例えば、命令ｉが命令１２であって命令ｊが命令１３である場合、以下の式（２）のように、クラスタリング指標値ΔＱとして「０．０６０」を算出する。

【0087】

２＊（（１／３０）－（３／３０）＊（１／３０））＝０．０６・・・（式２）

【0088】

そのため、グループ振分部１１４は、図１３に示すように、例えば、命令１２に対応する行に含まれる欄のうち、命令１３に対応する列に含まれる欄に「０．０６０」を記憶する。

【0089】

なお、命令ｉが命令１３であって命令ｊが１２である場合のクラスタリング指標値ΔＱは、命令ｉが命令１２であって命令ｊが１３である場合のクラスタリング指標値ΔＱと同じ値になる。そのため、グループ振分部１１４は、例えば、命令ｉが命令１２であって命令ｊが１３である場合のクラスタリング指標値ΔＱについての算出を行った場合、命令ｉが命令１３であって命令ｊが１２である場合のクラスタリング指標値ΔＱについての算出を行わないものであってもよい。そして、グループ振分部１１４は、この場合、図１３に示すように、命令１３に対応する行に含まれる欄のうち、命令１２に対応する列に含まれる欄に、クラスタリング指標値ΔＱの算出を行っていないことを示す値である「０．０００」を記憶するものであってよい。図１３に含まれる他の情報についての説明は省略する。

【0090】

図７に戻り、グループ振分部１１４は、Ｓ２５の処理で生成した第２行列１３３の要素の値のうち、最大の値に対応する各命令の振り分け先を同じグループに決定する（Ｓ３１）。

【0091】

具体的に、図１３で説明した第２行列１３３において、命令１２に対応する行に含まれる欄のうち、命令１３に対応する列に含まれる欄と、命令７に対応する行に含まれる欄のうち、命令１２に対応する列に含まれる欄とのそれぞれには、最大の値である「０．０６０」が設定されている。そのため、グループ振分部１１４は、図１３で説明した第２行列１３３の各要素に対応する命令の組合せのうち、命令１２及び命令１３の組合せまたは命令７及び命令１２の組合せを特定する。そして、グループ振分部１１４は、例えば、命令１２及び命令１３の組合せを特定した場合、命令１２と命令１３とを同じグループに振り分ける旨の決定を行う。

【0092】

そして、グループ振分部１１４は、Ｓ２５の処理で生成した第２行列１３３またはＳ３３の処理（後述する処理）で再生成した第２行列１３３における行のうち、Ｓ３１の処理で振り分け先を決定した各命令に対応する複数の行を、その複数の行における同一列ごとの要素の和を要素とする単一の行に変換し、Ｓ２５の処理で生成した第２行列１３３またはＳ３３の処理で再生成した第２行列１３３における列のうち、Ｓ３１の処理で振り分け先を決定した各命令に対応する複数の列を、その複数の列における同一行ごとの要素の和を要素とする単一の列に変換することにより、第１行列１３２を再生成する（Ｓ３２）。

【0093】

具体的に、グループ振分部１１４は、例えば、Ｓ３１の処理における決定結果に基づいて依存情報１３１を更新する。そして、グループ振分部１１４は、例えば、更新した依存情報１３１を参照することによって第１行列１３２の再生成を行う。以下、Ｓ３２の処理の具体例について説明を行う。

【0094】

［Ｓ３２の処理の具体例］
図１４及び図１５は、Ｓ３２の処理の具体例を説明する図である。

【0095】

例えば、Ｓ３１の処理で同じグループに振り分けることを決定した各命令が命令１２及び命令１３である場合、グループ振分部１１４は、図１４に示すように、「命令番号」が「１３」である情報の「グループ名」に記憶された値を、「命令番号」が「１２」である情報の「グループ名」に記憶された値である「１２」に更新するように、依存情報１３１を更新する。

【0096】

その後、グループ振分部１１４は、例えば、図１５に示すように、命令１２に対応する行に含まれる欄に、命令１２に対応する行に含まれる欄に設定されている値と、命令１３に対応する行に含まれる欄に設定されている値とを同一列ごとに加算することによって算出した値をそれぞれ記憶する。また、グループ振分部１１４は、例えば、図１５に示すように、命令１２に対応する列に含まれる欄に、命令１２に対応する列に含まれる欄に設定されている値と、命令１３に対応する列に含まれる欄に設定されている値とを同一行ごとに加算することによって算出した値をそれぞれ記憶する。

【0097】

具体的に、図１２で説明した第１行列１３２において、例えば、命令１２に対応する行に含まれる欄のうち、命令７に対応する列に含まれる欄には、「１」が記憶されており、命令１３に対応する行に含まれる欄のうち、命令７に対応する列に含まれる欄には、「０」が記憶されている。そのため、グループ振分部１１４は、図１５に示すように、例えば、命令１２に対応する行に含まれる欄のうち、命令７に対応する列に含まれる欄に、「１」及び「０」の和である「１」を記憶する。

【0098】

また、図１２で説明した第１行列１３２において、例えば、命令１１に対応する行に含まれる欄のうち、命令１２に対応する列に含まれる欄には、「１」が記憶されており、命令１１に対応する行に含まれる欄のうち、命令１３に対応する列に含まれる欄には、「０」が記憶されている。そのため、グループ振分部１１４は、図１５に示すように、例えば、命令１１に対応する行に含まれる欄のうち、命令１２に対応する列に含まれる欄に、「１」及び「０」の和である「１」を記憶する。

【0099】

さらに、図１２で説明した第１行列１３２において、例えば、命令１２に対応する行に含まれる欄のうち、命令１２に対応する列に含まれる欄には、「０」が記憶されており、命令１２に対応する行に含まれる欄のうち、命令１３に対応する列に含まれる欄には、「１」が記憶されており、命令１３に対応する行に含まれる欄のうち、命令１２に対応する列に含まれる欄には、「１」が記憶されており、命令１３に対応する行に含まれる欄のうち、命令１３に対応する列に含まれる欄には、「０」が記憶されている。そのため、グループ振分部１１４は、図１５に示すように、例えば、命令１２に対応する行に含まれる欄のうち、命令１２に対応する列に含まれる欄に、「０」、「１」、「１」及び「０」の和である「２」を記憶する。図１５に含まれる他の情報についての説明は省略する。

【0100】

図７に戻り、グループ振分部１１４は、Ｓ３２の処理で再生成した第１行列１３２から第２行列１３３を再生成する（Ｓ３３）。

【0101】

具体的に、グループ振分部１１４は、例えば、図１５で説明した第１行列１３２に対してＳ２５の処理と同じ処理を行うことにより、図１６に示す第２行列１３３を生成（再生成）する。

【0102】

そして、グループ振分部１１４は、Ｓ２１の処理で分割対象であると判定したループに含まれる各命令の振り分け先のグループの数が所定数以下に到達したか否かを判定する（Ｓ３４）。

【0103】

具体的に、図１４で説明した依存情報１３１の「グループ名」には、「１」から「１２」までの値（１２種類の値）が記憶されている。そのため、グループ振分部１１４は、この場合、Ｓ２１の処理で分割対象であると判定したループに含まれる各命令の振り分け先のグループの数として「１２」を特定する。そして、例えば、Ｓ３４の処理における所定数が「２」である場合、グループ振分部１１４は、Ｓ２１の処理で分割対象であると判定したループに含まれる各命令の振り分け先のグループの数が所定数以下に到達していないと判定する。

【0104】

一方、図１７に示す依存情報１３１の「グループ名」には、「１」及び「５」のみ（２種類の値）が記憶されている。そのため、グループ振分部１１４は、この場合、Ｓ２１の処理で分割対象であると判定したループに含まれる各命令の振り分け先のグループの数として「２」を特定する。そして、例えば、Ｓ３４の処理における所定数が「２」である場合、グループ振分部１１４は、Ｓ２１の処理で分割対象であると判定したループに含まれる各命令の振り分け先のグループの数が所定数以下に到達したと判定する。

【0105】

なお、グループ振分部１１４は、図１７に示す依存情報１３１を生成したことに応じて、例えば、図１８に示す第１行列１３２の生成を行う。また、グループ振分部１１４は、図１７に示す依存情報１３１を生成したことに応じて、例えば、図１９に示す依存グラフ１３１ａを生成する。以下、図１９に示す依存グラフ１３１ａの具体例について説明を行う。

【0106】

［依存グラフの具体例（２）］
図１９に示す依存グラフ１３１ａにおいて、命令１、命令２、命令３、命令４、命令８及び命令９のそれぞれに対応するノード群と、命令５、命令６、命令７、命令１０、命令１１、命令１２及び命令１３のそれぞれに対応するノード群とは、それぞれ異なるグループに含まれている。

【0107】

そして、図１９に示す依存グラフ１３１ａにおいて、命令１に対応するノードを含むグループと、命令５に対応するノードを含むグループとの間には、命令３に対応するノードと命令１０に対応するノードとの間のエッジと、命令９に対応するノードと命令１０に対応するノードとの間のエッジとが設定されている。

【0108】

すなわち、図１９に示す依存グラフ１３１ａは、命令１、命令２、命令３、命令４、命令８及び命令９が一方の分割ループに含まれ、かつ、命令５、命令６、命令７、命令１０、命令１１、命令１２及び命令１３が他方の分割ループに含まれるようにループ分割を行った場合、異なる分割ループのそれぞれに含まれる命令間におけるエッジの数を２本に抑えることが可能になることを示している。

【0109】

図９に戻り、Ｓ２１の処理で分割対象であると判定したループに含まれる各命令の振り分け先のグループの数が所定数以下に到達したと判定した場合（Ｓ４１のＹＥＳ）、情報処理装置１のループ分割部１１５は、Ｓ３３の処理で生成された第２行列１３３の内容に従って、Ｓ２１の処理で分割対象であると判定したループのループ分割を行う（Ｓ４２）。

【0110】

その後、情報処理装置１は、Ｓ２の処理を終了する。なお、情報処理装置１は、情報格納領域１３０に記憶された中間言語２２に、分割対象のループが含まれていないと判定した場合も同様に（Ｓ２２のＮＯ）、Ｓ２の処理を終了する。

【0111】

一方、Ｓ２１の処理で分割対象であると判定したループに含まれる各命令の振り分け先のグループの数が所定数以下に到達していないと判定した場合（Ｓ４１のＮＯ）、グループ振分部１１４は、Ｓ３２以降の処理を再度行う。以下、ループ分割を行った後の分割ループの具体例について説明を行う。

【0112】

［分割ループの具体例］
図２０は、分割ループの内容を説明する具体例である。図２０（Ａ）は、分割ループのうちの一方を説明する具体例であり、図２０（Ｂ）は、分割ループのうちの他方を説明する具体例である。

【0113】

図２０（Ａ）に示す分割ループには、図９で説明した中間言語のうち、命令１、命令２、命令３、命令４、命令８及び命令９が含まれている。

【0114】

そして、図２０（Ａ）に示す分割ループは、命令１等の後に、変数ｒｅｇ３に設定された値を、配列ｔｍｐ＿ａｒｒａｙ１のｒｅｇ＿ｉ番目に格納することを示す命令である「ｓｔｏｒｅｔｍｐ＿ａｒｒａｙ１（ｒｅｇ＿ｉ），ｒｅｇ３」と、変数ｒｅｇ９に設定された値を、配列ｔｍｐ＿ａｒｒａｙ２のｒｅｇ＿ｉ番目に格納することを示す命令である「ｓｔｏｒｅｔｍｐ＿ａｒｒａｙ２（ｒｅｇ＿ｉ），ｒｅｇ９」とを含む。

【0115】

一方、図２０（Ｂ）に示す分割ループには、図９で説明した中間言語のうち、命令５、命令６、命令７、命令１０、命令１１、命令１２及び命令１３が含まれている。

【0116】

そして、図２０（Ｂ）に示す分割ループは、命令５等の前に、配列ｔｍｐ＿ａｒｒａｙ１のｒｅｇ＿ｉ番目に格納されている値を変数ｒｅｇ３に設定することを示す命令である「ｌｏａｄｒｅｇ３，ｔｍｐ＿ａｒｒａｙ１（ｒｅｇ＿ｉ）」と、配列ｔｍｐ＿ａｒｒａｙ２のｒｅｇ＿ｉ番目に格納されている値を変数ｒｅｇ９に設定することを示す命令である「ｌｏａｄｒｅｇ９，ｔｍｐ＿ａｒｒａｙ２（ｒｅｇ＿ｉ）」とを含む。

【0117】

すなわち、図１９で説明したように、変数ｒｅｇ３に設定された値（命令３に対応する値）、及び、変数ｒｅｇ９に設定された値（命令９に対応する値）は、図２０（Ｂ）に示す分割ループに含まれる命令１０において参照される。そのため、図２０（Ａ）に示す分割ループには、変数ｒｅｇ３に設定された値及び変数ｒｅｇ９に設定された値を一時配列に格納する命令が含まれている。また、図２０（Ｂ）に示す分割ループには、一時配列に格納されている値を取り出す命令が含まれている。

【0118】

このように、本実施の形態における情報処理装置１は、ソースコード２１から生成した中間言語２２のループに含まれる各命令間の依存関係を示す依存情報１３１を生成し、生成した依存情報１３１を行列に変換することによって第１行列１３２を生成する。

【0119】

そして、情報処理装置１は、生成した第１行列１３２から算出した各命令間における依存度合いに基づいて、ループに含まれる各命令を複数のグループに振り分け、振り分けたグループごとにループの分割を行う。

【0120】

すなわち、本実施の形態における情報処理装置１は、依存情報１３１から生成された第１行列１３２を用いた演算を行うことで、分割対象のループに含まれる命令の組合せごとの依存関係の解析等を行うことなく、各命令の振り分け先を決定する。

【0121】

【0122】

【0123】

なお、情報処理装置１は、Ｓ２１及びＳ２２の処理において、情報格納領域１３０に記憶された中間言語２２に分割対象のループが複数含まれていると判定した場合、Ｓ２３以降の処理を分割対象のループごとに行うものであってよい。

【0124】

また、情報処理装置１は、Ｓ２５に処理においてクラスタリング指標値を算出する場合、Ｎｅｗｍａｎアルゴリズム以外のアルゴリズム（例えば、ラベル伝搬法やＫ－ｍｅａｎｓ法等のアルゴリズム）を用いるものであってもよい。

【0125】

［第２の実施の形態］
次に、第２の実施の形態の詳細について説明する。図２１から図２３は、第２の実施の形態におけるＳ２の処理を説明するフローチャート図である。また、図２４から図２８は、第２の実施の形態におけるＳ２の処理の詳細を説明する図である。

【0126】

第２の実施の形態におけるコンパイル処理は、第１の実施の形態におけるコンパイル処理と異なり、各命令がアクセスするデータのメモリ１０２内における位置関係についても参照してループの分割を行う。

【0127】

分割判定部１１１は、図２１に示すように、情報格納領域１３０に記憶された中間言語２２に、分割対象のループが含まれるか否かを判定する（Ｓ５１）。

【0128】

そして、情報格納領域１３０に記憶された中間言語２２に、分割対象のループが含まれていると判定した場合（Ｓ５２のＹＥＳ）、情報処理装置１の近接判定部１１６は、例えば、メモリ１０２内において近接するアドレスに格納された各データに対してアクセスを行う複数の命令が分割対象のループに含まれているか否かを判定する（Ｓ５３）。

【0129】

具体的に、近接判定部１１６は、例えば、同一の配列に格納された各データに対してアクセスを行う複数の命令が同一の分割対象のループに含まれているか否かを判定する。

【0130】

すなわち、オブジェクトコード２３の実行時において、例えば、第１命令の実行に伴って第１配列の第１データに対するアクセスが発生する場合、ＣＰＵ１０１は、メモリ１０２に格納されている第１配列の各データを含む所定サイズのデータをキャッシュメモリ（図示しない）に一時的に格納し、キャッシュメモリに格納した第１データに対してアクセスを行う。

【0131】

そして、例えば、第１命令と異なる第２命令の実行に伴って第１配列の第２データに対するアクセスが発生する場合、ＣＰＵ１０１は、第１配列の各データがキャッシュメモリにまだ格納されていれば、キャッシュメモリに格納されている第２データに対してアクセスを行う。一方、他のデータに対するアクセスの発生等に伴って第１配列の各データがキャッシュメモリから既に追い出されている場合、ＣＰＵ１０１は、メモリ１０２に格納されている第１配列の各データを含む所定サイズのデータをキャッシュメモリに再度に格納し、キャッシュメモリに格納した第２データに対してアクセスを行う。

【0132】

そのため、情報処理装置１は、例えば、上記のような第１命令及び第２命令が分割対象のループに含まれている場合、第１命令と第２命令が同じ分割ループに含まれるようにループ分割を行い、第１命令の実行タイミングと第２命令の実行タイミングとを近接させる。

【0133】

これにより、情報処理装置１は、分割対象のループの実行中に第１データがキャッシュメモリから追い出される確率を抑えることが可能になる。そのため、情報処理装置１は、第１データをキャッシュメモリに再格納する処理の発生頻度を抑えることが可能になり、オブジェクトコード２３の実行時間を短縮させることが可能になる。

【0134】

したがって、近接判定部１１６は、Ｓ５３の処理において、例えば、分割対象のループに含まれる命令から、同一の配列に含まれる各データに対してアクセスを行う複数の命令の特定を行う。

【0135】

なお、近接判定部１１６は、例えば、ある配列に含まれるデータのうち、所定の回転数に対応する範囲内のデータに対してアクセスを行う複数の命令の特定を行うものであってもよい。

【0136】

図２１に戻り、情報生成部１１２は、Ｓ５１の処理で分割対象であると判定したループに含まれる各命令間の依存関係と、各命令がアクセスするデータのメモリ１０２内における位置関係とを示す依存情報１３１を生成する（Ｓ５４）。

【0137】

［依存情報の具体例］
図２４は、依存情報１３１の具体例について説明する図である。

【0138】

図２４に示す依存情報１３１は、図１０で説明した依存情報１３１が有する項目に加え、メモリ１０２内における近接したアドレスに格納された各データに対してアクセスを行う複数の命令の命令番号についてのリストである「キャッシュ共有依存リスト」を項目として有する。

【0139】

具体的に、図９で説明した中間言語２２において、配列Ｃに格納されているデータは、命令４及び命令６のそれぞれにおいて参照されている。そのため、情報生成部１１２は、例えば、図２４に示すように、「命令番号」が「４」である情報の「キャッシュ共有依存リスト」に「６」を記憶し、「命令番号」が「６」である情報の「キャッシュ共有依存リスト」に「４」を記憶する。また、情報生成部１１２は、この場合、例えば、図２４に示すように、「命令番号」が「４」及び「６」以外である情報の「キャッシュ共有依存リスト」に、情報が存在しないことを示す「－」を記憶する。

【0140】

図２１に戻り、情報生成部１１２は、Ｓ５４の処理で生成した依存情報１３１を行列に変換することによって第１行列１３２を生成する（Ｓ５５）。以下、第１行列１３２の具体例について説明を行う。

【0141】

［第１行列の具体例］
図２５は、第１行列１３２の具体例について説明する図である。

【0142】

図２５に示す第１行列１３２の各要素（各欄）には、行に対応する命令と列に対応する命令との間に依存関係が存在することを示す値である「１」、行に対応する命令及び列に対応する命令のそれぞれがアクセスするデータのメモリ１０２内における位置が近接していることを示す値である「５」、または、行に対応する命令と列に対応する命令との間に依存関係がせず、かつ、行に対応する命令及び列に対応する命令のそれぞれがアクセスするデータのメモリ１０２内における位置が近接していないことを示す値である「０」が記憶される。

【0143】

具体的に、図２４で説明した依存情報１３１において、「命令番号」が「４」である情報の「キャッシュ共有依存リスト」には、「６」が記憶されており、「命令番号」が「６」である情報の「キャッシュ共有依存リスト」には、「４」が記憶されている。そのため、情報生成部１１２は、図２５に示すように、例えば、命令４に対応する行に含まれる欄のうち、命令６に対応する列に含まれる欄に「５」を記憶する。また、情報生成部１１２は、図２５に示すように、例えば、命令６に対応する行に含まれる欄のうち、命令４に対応する列に含まれる欄に「５」を記憶する。

【0144】

すなわち、依存関係にある複数の命令が異なる分割ループに含まれることによるオブジェクトコード２３の実行時間に対する影響よりも、キャッシュミスの発生回数が増加することによるオブジェクトコード２３の実行時間に対する影響の方が大きいと判断できる。そのため、情報生成部１１２は、図２５に示すように、例えば、各命令がアクセスするデータのメモリ１０２内における位置が近接していることを示す値が、各命令間に依存関係が存在することを示す値よりも大きくなるように、第１行列１３２の生成を行う。

【0145】

図２１に戻り、グループ振分部１１４は、Ｓ５５の処理で生成した第１行列１３２から、各命令間における依存度合いを示す第２行列１３３を生成する（Ｓ５６）。

【0146】

そして、グループ振分部１１４は、図２２に示すように、Ｓ５６の処理で生成した第２行列１３３の要素の値のうち、最大の値に対応する複数の命令の振り分け先を同じグループに決定する（Ｓ６１）。

【0147】

続いて、グループ振分部１１４は、Ｓ５６の処理で生成した第２行列１３３またはＳ６３の処理で再生成した第２行列１３３における行のうち、Ｓ６１の処理で振り分け先を決定した各命令に対応する複数の行を、その複数の行における同一列ごとの要素の和を要素とする単一の行に変換し、Ｓ５６の処理で生成した第２行列１３３またはＳ６３の処理で再生成した第２行列１３３における列のうち、Ｓ６１の処理で振り分け先を決定した各命令に対応する複数の列を、その複数の列における同一行ごとの要素の和を要素とする単一の列に変換することにより、第１行列１３２を再生成する（Ｓ６２）。

【0148】

さらに、グループ振分部１１４は、Ｓ６２の処理で再生成した第１行列１３２から第２行列１３３を再生成する（Ｓ６３）。

【0149】

その後、グループ振分部１１４は、Ｓ５１の処理で分割対象であると判定したループに含まれる各命令の振り分け先のグループの数が所定数以下に到達したか否かを判定する（Ｓ６４）。

【0150】

具体的に、例えば、Ｓ６４の処理における所定数が「２」である場合において、図２６に示す第１行列１３２が生成されている場合、グループ振分部１１４は、Ｓ５１の処理で分割対象であると判定したループに含まれる各命令の振り分け先のグループの数が所定数以下に到達したと判定する。

【0151】

なお、図２７に示すように、図２６に示す第１行列１３２に対応する依存グラフ１３１ａでは、同じ配列に格納された各データを参照する各命令（命令４及び命令６）が同じグループに振り分けられている。

【0152】

続いて、Ｓ５１の処理で分割対象であると判定したループに含まれる各命令の振り分け先のグループの数が所定数以下に到達したと判定した場合（Ｓ７１のＹＥＳ）、ループ分割部１１５は、Ｓ６３の処理で生成された第２行列１３３の内容に従って、Ｓ５１の処理で分割対象であると判定したループのループ分割を行う（Ｓ７２）。

【0153】

そして、情報処理装置１は、Ｓ２の処理を終了する。なお、情報処理装置１は、情報格納領域１３０に記憶された中間言語２２に、分割対象のループが含まれていないと判定した場合も同様に（Ｓ５２のＮＯ）、Ｓ２の処理を終了する。

【0154】

一方、Ｓ５１の処理で分割対象であると判定したループに含まれる各命令の振り分け先のグループの数が所定数以下に到達していないと判定した場合（Ｓ７１のＮＯ）、グループ振分部１１４は、Ｓ６２以降の処理を再度行う。以下、ループ分割を行った後の分割ループの具体例について説明を行う。

【0155】

［分割ループの具体例］
図２８は、分割ループの内容を説明する具体例である。図２８（Ａ）は、分割ループのうちの一方を説明する具体例であり、図２８（Ｂ）は、分割ループのうちの他方を説明する具体例である。

【0156】

図２８（Ａ）に示す分割ループには、図９で説明した中間言語のうち、命令１、命令２、命令３、命令４、命令６、命令８及び命令９が含まれている。

【0157】

また、図２８（Ａ）に示す分割ループは、命令１等の後に、変数ｒｅｇ３に設定された値を、配列ｔｍｐ＿ａｒｒａｙ１のｒｅｇ＿ｉ番目に格納することを示す命令である「ｓｔｏｒｅｔｍｐ＿ａｒｒａｙ１（ｒｅｇ＿ｉ），ｒｅｇ３」と、変数ｒｅｇ６に設定された値を、配列ｔｍｐ＿ａｒｒａｙ２のｒｅｇ＿ｉ番目に格納することを示す命令である「ｓｔｏｒｅｔｍｐ＿ａｒｒａｙ２（ｒｅｇ＿ｉ），ｒｅｇ６」と、変数ｒｅｇ９に設定された値を、配列ｔｍｐ＿ａｒｒａｙ３のｒｅｇ＿ｉ番目に格納することを示す命令である「ｓｔｏｒｅｔｍｐ＿ａｒｒａｙ３（ｒｅｇ＿ｉ），ｒｅｇ９」とを含む。

【0158】

一方、図２８（Ｂ）に示す分割ループには、図９で説明した中間言語のうち、命令５、命令７、命令１０、命令１１、命令１２及び命令１３が含まれている。

【0159】

また、図２８（Ｂ）に示す分割ループは、命令５等の前に、配列ｔｍｐ＿ａｒｒａｙ１のｒｅｇ＿ｉ番目に格納されている値を変数ｒｅｇ３に設定することを示す命令である「ｌｏａｄｒｅｇ３，ｔｍｐ＿ａｒｒａｙ１（ｒｅｇ＿ｉ）」と、配列ｔｍｐ＿ａｒｒａｙ２のｒｅｇ＿ｉ番目に格納されている値を変数ｒｅｇ６に設定することを示す命令である「ｌｏａｄｒｅｇ６，ｔｍｐ＿ａｒｒａｙ２（ｒｅｇ＿ｉ）」と、配列ｔｍｐ＿ａｒｒａｙ３のｒｅｇ＿ｉ番目に格納されている値を変数ｒｅｇ９に設定することを示す命令である「ｌｏａｄｒｅｇ９，ｔｍｐ＿ａｒｒａｙ３（ｒｅｇ＿ｉ）」とを含む。

【0160】

すなわち、図２８に示す分割ループは、図２０で説明した分割ループよりも一時配列の数が増加している。しかしながら、図２８に示す分割ループでは、同じ配列に格納された各データを参照する各命令（命令４及び命令６）が同じ分割ループに含まれている。

【0161】

これにより、情報処理装置１は、オブジェクトコード２３の実行時間をより短縮させることが可能になる。

【0162】

以上の実施の形態をまとめると、以下の付記のとおりである。

【0163】

（付記１）
ソースコードから生成した中間言語のループに含まれる各命令間の依存関係を示す依存情報を生成し、生成した前記依存情報を行列に変換することによって第１行列を生成する情報生成部と、
生成した前記第１行列から算出した各命令間における依存度合いに基づいて、前記ループに含まれる各命令を複数のグループに振り分けるグループ振分部と、
振り分けた前記複数のグループごとに、前記ループの分割を行うループ分割部と、を有する、
ことを特徴とする情報処理装置。

【0164】

（付記２）
付記１において、
前記情報生成部は、
前記ループに含まれる命令の組合せごとに、各組合せに含まれる命令間に依存関係があることを前記依存情報が示しているか否かを判定し、
前記命令の組合せのうち、各組合せに含まれる命令間に依存関係があることを前記依存情報が示している組合せに対応する要素を第１の値とし、前記命令の組合せのうち、各組合せに含まれる命令間に依存関係があることを前記依存情報が示していない組合せに対応する要素を第２の値とすることにより、前記第１行列の生成を行う、
ことを特徴とする情報処理装置。

【0165】

（付記３）
付記１において、
前記グループ振分部は、異なるグループにそれぞれ含まれる命令間において存在する依存関係が少なくなるように、前記ループに含まれる各命令を複数のグループに振り分ける、
ことを特徴とする情報処理装置。

【0166】

（付記４）
付記１において、
前記グループ振分部は、
前記第１行列から各命令間における依存度合いを示す第２行列を生成し、
生成した前記第２行列に基づいて、前記ループに含まれる各命令を前記複数のグループに振り分ける、
ことを特徴とする情報処理装置。

【0167】

（付記５）
付記４において、
前記グループ振分部は、
前記ループに含まれる命令の組合せごとに、各組合せに含まれる命令間における依存度合いを算出し、
算出した前記依存度合いのそれぞれを要素とすることにより、前記第２行列を生成する、
ことを特徴とする情報処理装置。

【0168】

（付記６）
付記５において、
前記グループ振分部は、Ｎｅｗｍａｎアルゴリズムを用いることにより、前記依存度合いを算出する、
ことを特徴とする情報処理装置。

【0169】

（付記７）
付記５において、
前記グループ振分部は、
前記第２行列の要素の値のうち、最大の値に対応する複数の命令の振り分け先を同じグループに決定し、
前記第２行列における前記複数の命令に対応する複数の行を、前記複数の行における同一列ごとの要素の和を要素とする単一の行に変換し、かつ、前記第２行列における前記複数の命令に対応する複数の列を、前記複数の列における同一行ごとの要素の和を要素とする単一の列に変換することによって、前記第１行列を再生成し、
再生成した前記第１行列から前記第２行列を再生成し、
前記ループに含まれる各命令の振り分け先として決定したグループの数が所定数以下になるまで、前記決定する処理と前記第１行列を再生成する処理と前記第２行列を再生成する処理とを繰り返す、
ことを特徴とする情報処理装置。

【0170】

（付記８）
付記２において、さらに、
近接する記憶領域に格納された各データに対してアクセスを行う複数の命令が前記ループに含まれているか否かを判定する近接判定部を有し、
前記情報生成部は、前記複数の命令が前記ループに含まれているか否かの判定結果に基づいて、前記第１行列の生成を行う、
ことを特徴とする情報処理装置。

【0171】

（付記９）
付記８において、
前記情報生成部は、前記複数の命令が前記ループに含まれていると判定した場合、前記複数の命令間に対応する要素を前記第１の値よりも大きい第３の値とすることにより、前記第１行列の生成を行う、
ことを特徴とする情報処理装置。

【0172】

（付記１０）
付記８において、
前記近接する記憶領域に格納された各データは、同一の配列である、
ことを特徴とする情報処理装置。

【0173】

（付記１１）
ソースコードから生成した中間言語のループに含まれる各命令間の依存関係を示す依存情報を生成し、
生成した前記依存情報を行列に変換することによって第１行列を生成し、
生成した前記第１行列から算出した各命令間における依存度合いに基づいて、前記ループに含まれる各命令を複数のグループに振り分け、
振り分けた前記複数のグループごとに、前記ループの分割を行う、
処理をコンピュータに実行させることを特徴とするコンパイラプログラム。

【0174】

（付記１２）
付記１１において、
前記第１行列を生成する処理では、
前記ループに含まれる命令の組合せごとに、各組合せに含まれる命令間に依存関係があることを前記依存情報が示しているか否かを判定し、
前記命令の組合せのうち、各組合せに含まれる命令間に依存関係があることを前記依存情報が示している組合せに対応する要素を第１の値とし、前記命令の組合せのうち、各組合せに含まれる命令間に依存関係があることを前記依存情報が示していない組合せに対応する要素を第２の値とすることにより、前記第１行列の生成を行う、
ことを特徴とするコンパイラプログラム。

【0175】

（付記１３）
付記１１において、
前記複数のグループに振り分ける処理では、異なるグループにそれぞれ含まれる命令間において存在する依存関係が少なくなるように、前記ループに含まれる各命令を複数のグループに振り分ける、
ことを特徴とするコンパイラプログラム。

【0176】

（付記１４）
付記１１において、
前記複数のグループに振り分ける処理では、
前記第１行列から各命令間における依存度合いを示す第２行列を生成し、
生成した前記第２行列に基づいて、前記ループに含まれる各命令を前記複数のグループに振り分ける、
ことを特徴とするコンパイラプログラム。

【符号の説明】

【0177】

１：情報処理装置５：操作端末
２１：ソースコード２２：中間言語
２３：オブジェクトコード１３０：記憶部
ＮＷ：ネットワーク

【図1】