特許7615660 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7615660コンパイル装置、コンパイル方法、及びコンパイルプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4A
4B
5
6
7
8
9
10
11
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2025-01-08

(45)【発行日】2025-01-17

(54)【発明の名称】コンパイル装置、コンパイル方法、及びコンパイルプログラム

(51)【国際特許分類】

G06F 8/41 20180101AFI20250109BHJP

G06F 17/16 20060101ALI20250109BHJP

【ＦＩ】

G06F8/41 170

G06F17/16 G

【請求項の数】 8

(21)【出願番号】P 2020212156

(22)【出願日】2020-12-22

(65)【公開番号】P2022098645

(43)【公開日】2022-07-04

【審査請求日】2023-11-15

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100109313

【弁理士】

【氏名又は名称】机昌彦

(74)【代理人】

【識別番号】100149618

【弁理士】

【氏名又は名称】北嶋啓至

(72)【発明者】

【氏名】西村佳晃

【審査官】今川悟

(56)【参考文献】

【文献】特開平０９－０６２６５４（ＪＰ，Ａ）

【文献】特開平１１－０６６０４６（ＪＰ，Ａ）

【文献】特開平０９－２５９１１３（ＪＰ，Ａ）

【文献】特開２００５－０３８１８５（ＪＰ，Ａ）

【文献】特表２０１４－５１３３４０（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ８／４１

Ｇ０６Ｆ１７／１６

(57)【特許請求の範囲】

【請求項1】

ソースプログラムに、成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるかどうかを判定するコード解析部と、
前記成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるときに、ベクトルギャザー命令、ベクトル論理積命令、及びベクトルシフト命令を生成するベクトル命令生成部と、を含み、
前記構造型の配列は、前記成分として第１の変数及び第２の変数が４バイト毎に交互にメモリに配列されており、
前記ベクトルギャザー命令は、８バイトベクトルギャザー命令であり、第１のベクトルレジスタの各要素に格納されたアドレスにある幅８バイトの値を、前記メモリから第２のベクトルレジスタへロードするものであり、
前記ベクトル論理積命令は、前記第２のベクトルレジスタの各要素の上位４バイトのみを第３のベクトルレジスタに取り出すものであり、
前記ベクトルシフト命令は、前記第２のベクトルレジスタの各要素を４バイト左シフトした値を第４のベクトルレジスタに取り出すものである、
コンパイル装置。

【請求項2】

前記成分として第１の変数及び第２の変数を持つ構造型の配列は、実部、虚部が４バイト毎に交互に配置された、単精度複素数型の配列である、請求項１に記載のコンパイル装置。

【請求項3】

前記成分として第１の変数及び第２の変数を持つ構造型の配列は、要素が４バイト毎に交互に配置された、２行Ｎ列の単精度浮動小数点数型の配列である、請求項１に記載のコンパイル装置。

【請求項4】

前記成分として第１の変数及び第２の変数を持つ構造型の配列は、第１の単精度変数、第２の単精度変数が４バイト毎に交互に配置された、２行Ｎ列の単精度浮動小数点数型の配列である、請求項１に記載のコンパイル装置。

【請求項5】

ソースプログラムに、成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるかどうかをコード解析部が判定し、
前記成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるときに、ベクトルギャザー命令、ベクトル論理積命令、及びベクトルシフト命令をベクトル命令生成部が生成し、
前記構造型の配列は、前記成分として第１の変数及び第２の変数が４バイト毎に交互にメモリに配列されており、
前記ベクトルギャザー命令は、８バイトベクトルギャザー命令であり、第１のベクトルレジスタの各要素に格納されたアドレスにある幅８バイトの値を、前記メモリから第２のベクトルレジスタへロードするものであり、
前記ベクトル論理積命令は、前記第２のベクトルレジスタの各要素の上位４バイトのみを第３のベクトルレジスタに取り出すものであり、
前記ベクトルシフト命令は、前記第２のベクトルレジスタの各要素を４バイト左シフトした値を第４のベクトルレジスタに取り出すものである、
コンパイル方法。

【請求項6】

前記成分として第１の変数及び第２の変数を持つ構造型の配列は、実部、虚部が４バイト毎に交互に配置された、単精度複素数型の配列である、請求項５に記載のコンパイル方法。

【請求項7】

前記成分として第１の変数及び第２の変数を持つ構造型の配列は、要素が４バイト毎に交互に配置された、２行Ｎ列の単精度浮動小数点数型の配列である、請求項５に記載のコンパイル方法。

【請求項8】

コンピュータを、
ソースプログラムに、成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるかどうかを判定するコード解析手段と、
前記成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるときに、ベクトルギャザー命令、ベクトル論理積命令、及びベクトルシフト命令を生成するベクトル命令生成手段と、して機能させ、
前記構造型の配列は、前記成分として第１の変数及び第２の変数が４バイト毎に交互にメモリに配列されており、
前記ベクトルギャザー命令は、８バイトベクトルギャザー命令であり、第１のベクトルレジスタの各要素に格納されたアドレスにある幅８バイトの値を、前記メモリから第２のベクトルレジスタへロードするものであり、
前記ベクトル論理積命令は、前記第２のベクトルレジスタの各要素の上位４バイトのみを第３のベクトルレジスタに取り出すものであり、
前記ベクトルシフト命令は、前記第２のベクトルレジスタの各要素を４バイト左シフトした値を第４のベクトルレジスタに取り出すものである、
コンパイルプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、コンパイル装置、コンパイル方法、及びコンパイルプログラムに関し、特にプログラムの高速化に関する。

【背景技術】

【0002】

計算機の演算装置からメインメモリへのアクセス時間は、演算装置の演算時間と比べると大きく、メインメモリと演算装置との間のデータ転送性能は不足している。この広がる性能差を埋めるために、一般にスカラ計算機では、演算装置とメインメモリ間に高速なキャッシュメモリを設けることにより、メインメモリへのアクセス時間を短縮している。一方、ベクトル計算機では、ベクトル命令により一度に多くのデータをまとめて転送することにより、メインメモリへのアクセス時間を短縮している。データ１個あたりのメモリアクセス時間は、同時に転送されたデータの個数分の１とみなすことができる。この個数の最大値はベクトル計算機のベクトル長で決まり、ベクトル長の値が２５６の場合は、メモリアクセス時間は２５６分の１と、小さい値になる。

【0003】

またベクトル計算機では、メインメモリに配置されているデータをベクトルレジスタ上にロードしてそのベクトルレジスタを介して、高速な演算を実現している。このため、メインメモリ上のデータをいかに効率良くレジスタ上に持ってくるかということが、高速化のために重要である。

【0004】

特許文献１は、情報処理装置に関するものであり、複素数データのベクトル演算を高速化することが提案されている。

【0005】

特許文献２は、計算機で用いられるコンパイル方法に関するものであり、ソースプログラムにおける配列を抽出し、アクセス回数に応じてメインメモリ又は一時記憶装置に割り当てることが提案されている。

【0006】

ここで、図１に示されるソースプログラムのコンパイル方法について検討する。図１のソースプログラムは、間接参照を含み、間接参照を含む演算はリスト演算と呼ばれる。図１のソースプログラムはＦｏｒｔｒａｎ言語で記したもので、その内容は、単精度複素数型の配列ＡのＩＸ（Ｉ）番目の要素の実部、虚部を取り出して、その加算結果を配列Ｂに代入するものである。

【0007】

配列ＩＸはリストと呼ばれ、Ｉ番目のＩＸの配列要素のとき、参照すべきＡの配列要素が何番目の要素であるかの値が格納されている。このときＡの配列要素は、配列ＩＸの要素を使ってアクセスされるため、「間接参照される」と呼ばれる。なおここで図１のソースプログラムにおいては、配列ＡのＩＸ（Ｉ）番目の要素の実部を参照する式をreal(A(IX(I)))と記述しており、配列ＡのＩＸ（Ｉ）番目の要素の虚部を参照する式をaimag(A(IX(I)))と記述している。

【0008】

背景技術のコンパイル方法では図１のソースプログラムを、図１１に示すアセンブラの命令列に翻訳する。図１１の命令列では、まずベクトルロード命令（VLD命令）で、配列ＩＸの値をベクトルレジスタVR1にロードする。次に、ベクトル論理シフト命令（VSLL命令）で、ベクトルレジスタVR1の各要素を３ビット左論理シフトした値を、ベクトルレジスタVR2に設定する。これは、配列Ａの一要素のサイズ、つまり、単精度複素数型のサイズである８をベクトルレジスタVR1の各要素に乗じた値を、ベクトルレジスタVR2に設定することに等しい。こうして求めた値は、配列Ａの先頭からの相対オフセット値である。

【0009】

次に、ベクトル加算命令（VADD命令）で、ベクトルレジスタVR2の各要素（上記相対オフセット値）と配列Ａの先頭アドレスを加算した結果を、ベクトルレジスタVR3に設定する。このVADD命令の結果を、図１２の「VR3」に示す。単精度複素数型の配列のメモリ配置は図１２の「Ａ（メモリ）」に示すように、実部、虚部が４バイト毎に交互に配置されているため、結果としてベクトルレジスタVR3にはＡ（ＩＸ（Ｉ））の各要素の実部のアドレスが設定されることとなる。

【0010】

次に、４バイトベクトルギャザー命令（VGT4命令）で、ベクトルレジスタVR3の各要素に格納されたアドレスにある、幅４バイトの値をメモリからベクトルレジスタVR4へ図１２の「VR4（Ａの実部）」のとおりロード（ギャザー）する。

【0011】

次に、ベクトル加算命令（VADD命令）で、ベクトルレジスタVR5の各要素にベクトルレジスタVR2の各要素と４を加算したものを設定する。これは図１２の「Ａ（メモリ）」に示すように、単精度複素数の実部、虚部が４バイト毎に交互に配置されているためで、虚部のアドレスを取得する際に配列Ａの各要素のアドレスの４バイト先をロード（ギャザー）する必要があるためである。この結果、ベクトルレジスタVR5にはＡ（ＩＸ（Ｉ））の各要素の虚部のアドレスが設定される。

【0012】

次に、４バイトベクトルギャザー命令（VGT4命令）で、このベクトルレジスタVR5の各要素に格納されたアドレスにある４バイトの値をメモリからベクトルレジスタVR6へ図１２の「VR6（Ａの虚部）」のとおりロード（ギャザー）する。単精度複素数のメモリ配置は図１２の「Ａ（メモリ）」に示すように実部、虚部が４バイト毎に交互に配置されているため、配列Ａの要素のＡ（ＩＸ（Ｉ））のアドレスに４を加算したアドレスにある４バイトの値をロード（ギャザー）することは、単精度複素数型の配列Ａの一要素の虚部の値をロード（ギャザー）することと等しい。

【0013】

最後にベクトル加算命令（VADD命令）で、ベクトルレジスタVR7にベクトルレジスタVR4とベクトルレジスタVR6とを加算したものを設定し、ベクトルストア命令（VST命令）でベクトルレジスタVR7の値を、配列Ｂに格納する。

【0014】

リスト演算は、科学技術分野における数値解析で高い頻度で利用されている。これらの解析処理では、複雑に変化する現象をシミュレーションするために膨大な計算時間を要しており、中でもリスト演算の計算コストが極めて大きく、その処理の高速化が望まれている。

【先行技術文献】

【特許文献】

【0015】

【文献】国際公開第２０２０／０６６３７５号

【文献】特開２０１３－１８２２９３号公報

【発明の概要】

【発明が解決しようとする課題】

【0016】

しかしながら、図１１、図１２を参照して説明した、背景技術のコンパイル方法には、以下のような課題がある。

【0017】

図１１に示す命令列の４バイトベクトルギャザー命令（VGT4命令）でベクトルレジスタにロード（ギャザー）する値は、メモリ上に連続して並んでおらず、また、そのメモリ上の並び方は等間隔でもないため、配列内に広くアクセスする必要がある。配列内に広くアクセスする場合、ロード（ギャザー）する値がメモリキャッシュに載っている確率は低く、ベクトルギャザー命令の実行時間は他の命令に比べて著しく長くなる。

【0018】

４バイトベクトルギャザー命令（VGT4命令）は、８バイト幅のベクトルレジスタの上位４バイトに値をロード（ギャザー）しているため、図１２の「VR4（Ａの実部）」や「VR6（Ａの虚部）」に示すように、ベクトルレジスタVR4、ベクトルレジスタVR6の各要素の下位４バイトには有意な値を格納しておらず、空いている状態（empty）である。また実行時間が長いベクトルギャザー命令を２回発行し、さらにこれらの命令がループの繰り返しごとに実行されることとなるため、リスト演算自体の実行時間が長くなってしまうという課題がある。

【0019】

なお、この課題は、単精度複素数型の配列を対象としたリスト演算に限られず、成分として第１の変数及び第２の変数を持つ構造型の配列を対象としたリスト演算で生じうる。

【0020】

本発明の目的は、成分として第１の変数及び第２の変数を持つ構造型の配列を対象としたリスト演算を高速化することができる、コンパイル装置、コンパイル方法、及びコンパイルプログラムを提供することにある。

【課題を解決するための手段】

【0021】

前記目的を達成するため、本発明に係るコンパイル装置は、
ソースプログラムに、成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるかどうかを判定するコード解析部と、
上記成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるときに、ベクトルギャザー命令、ベクトル論理積命令、及びベクトルシフト命令を生成するベクトル命令生成部と、を含む。

【0022】

本発明に係るコンパイル方法は、
ソースプログラムに、成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるかどうかをコード解析部が判定し、
上記成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるときに、ベクトルギャザー命令、ベクトル論理積命令、及びベクトルシフト命令をベクトル命令が生成する。

【0023】

本発明に係るコンパイルプログラムは、
コンピュータを、
ソースプログラムに、成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるかどうかを判定するコード解析手段と、
上記成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるときに、ベクトルギャザー命令、ベクトル論理積命令、及びベクトルシフト命令を生成するベクトル命令生成手段と、して機能させる。

【発明の効果】

【0024】

本発明によれば、成分として第１の変数及び第２の変数を持つ構造型の配列を対象としたリスト演算を高速化することができる。

【図面の簡単な説明】

【0025】

【図1】本発明の実施形態が対象とするソースプログラムの一例である。

【図2】本発明の第１実施形態によるコンパイル方法を説明するためのフローチャートである。

【図3】本発明の第１実施形態により生成される命令列である。

【図4A】本発明の第１実施形態によるコンパイラを説明するためのブロック図である。

【図4B】本発明の実施形態のコンパイル装置、コンパイル方法、及びコンパイルプログラムに関して、目的プログラムを実行する計算機の構成を説明するためのブロック図である。

【図5】本発明の第１実施形態によるコンパイル方法のうち、ベクトルレジスタに対する操作を説明するための概念図である。

【図6】本発明の第１実施形態によるコンパイル方法のうち、ベクトルレジスタに対する操作動作を説明するための概念図である。

【図7】本発明の第１実施形態によるコンパイル方法のうち、ベクトルレジスタに対する操作を説明するための概念図である。

【図8】（ａ）は背景技術による生成される命令列であり、（ｂ）は本発明の実施形態により生成される命令列である。

【図9】（ａ）は本発明の第２実施形態が対象とするソースプログラムの一例であり、（ｂ）は本発明の第２実施形態で用いられるメモリ配列を説明するための概念図である。

【図10】（ａ）は本発明の第３実施形態が対象とするソースプログラムの一例であり、（ｂ）は本発明の第３実施形態で用いられるメモリ配列を説明するための概念図である。

【図11】背景技術により生成される命令列である。

【図12】背景技術によるコンパイル方法のうち、ベクトル演算の動作を説明するための概念図である。

【発明を実施するための形態】

【0026】

本発明の具体的な実施形態について説明する前に、実施形態の概要について説明する。

【0027】

本発明の実施形態のコンパイル装置、コンパイル方法、及びコンパイルプログラムは、成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算に用いられ、その一例として複素数型の配列を対象とするリスト演算に用いられる。本発明の実施形態では、配列の一例としての複素数型配列の実部と虚部の値を同一ベクトルレジスタに格納するために、単精度の値をロード（ギャザー）するベクトルギャザー命令を２回発行するのではなく、倍精度の値をロード（ギャザー）するベクトルギャザー命令を１回発行する。これにより、メモリアクセスの回数を削減して、リスト演算を高速化するコンパイラを提供する。

【0028】

本発明の実施形態のコンパイル装置、コンパイル方法、及びコンパイルプログラムは、目的プログラム（オブジェクトプログラム）を実行する計算機に用いられる。このような計算機は、図４Ｂに示される計算機１５０であり、演算装置１５１、メインメモリ１５２、及び一時記憶装置１５３を含んで構成される。計算機１５０はコンピュータであり、ベクトル演算が可能なベクトル計算機である。このような構成の計算機は、特許文献２で提案されている。

【0029】

図４Ｂの演算装置１５１は、プログラムに基づいて計算機１５０が演算を実行するための装置である。演算装置１５１は、具体的には計算機のＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）といったプロセッサ内の演算装置であり、例えばＣＰＵにおけるＡＬＵ（Arithmetic Logic Unit）により構成される。演算装置１５１は、メインメモリ１５２又は一時記憶装置１５３からデータを取得し、それに応じて演算を実行する。

【0030】

図４Ｂのメインメモリ１５２は、計算機１５０において演算装置１５１がアクセス可能な主記憶装置である。メインメモリ１５２は、演算装置１５１が演算を実行するために必要なデータ及び演算を実行した結果のデータを保持することができる。

【0031】

図４Ｂの一時記憶装置１５３は、演算装置１５１がメインメモリ１５２よりも高速にアクセス可能な記憶装置であり、例えばレジスタが該当する。例えば、演算装置１５１及び一時記憶装置１５３がＣＰＵを構成する場合には、演算装置１５１はＣＰＵ内のＡＬＵ、一時記憶装置１５３はＣＰＵ内のレジスタである。

【0032】

本発明の実施形態のコンパイル装置は、上記計算機１５０が実行する目的プログラムを、原始プログラム（ソースプログラム）に基づいて生成するコンパイラである。コンパイラは、ソースプログラムをコンパイルすることにより、オブジェクトコードを生成し、目的プログラム（オブジェクトプログラム）を生成する。以下、本発明の具体的な実施形態について、図面を参照しながら詳細に説明する。

【0033】

〔第１実施形態〕
初めに、本発明の第１実施形態によるコンパイル装置、コンパイル方法、及びコンパイルプログラムについて、説明する。

【0034】

（実施形態の構成）
図４Ａは、本実施形態によるコンパイル装置を説明するためのブロック図である。図４Ａのコンパイル装置は、ソースプログラムをコンパイルしてオブジェクトコードを生成するコンパイラ１００である。図４Ａのコンパイラ１００は、プログラムとしてのソースプログラムを解析するコード解析部１０、及びコード解析部１０での解析結果に基づいて命令を生成する命令生成部２０を含む。本実施形態によるコンパイル装置は、上述した計算機に用いられ、コンパイラに組み込まれる一機能である。

【0035】

コード解析部１０は、ソースプログラムのリスト演算がベクトル化可能な形式であるかを解析するリスト演算構文解析手段１１を含む。

【0036】

命令生成部２０は、コード解析部１０での解析結果に基づいて、ベクトル化コードを生成するベクトル命令生成部を含む。命令生成部２０のベクトル命令生成部は、リスト演算判定部２１、ベクトルロード命令生成手段２２、ベクトル論理シフト命令生成手段２３、ベクトル加算命令生成手段２４、８バイトベクトルギャザー命令生成手段２５、ベクトル論理積命令生成手段２６、及びベクトルストア命令生成手段２７を含む。

【0037】

ベクトル命令生成部は、リスト演算が含まれるか否かをリスト演算判定部２１が判定し、リスト演算が含まれるときにはそのリスト演算が単精度複素数型の配列に対する演算であるかどうかを判定する。リスト演算が単精度複素数型の配列に対する演算であるときには、８バイトベクトルギャザー命令（VGT8命令）、ベクトル論理積命令（VAND命令）、ベクトル論理シフト命令（VSLL命令）を生成し、これによって配列の実部、虚部の値をロード（ギャザー）する命令を生成する。

【0038】

（実施形態の動作）
次に、図を用いて動作について説明する。図２は、本発明の第１実施形態によるコンパイル方法を説明するためのフローチャートである。図１は、本発明の第１実施形態が対象とするソースプログラムの一例である。本実施形態のコンパイル装置、コンパイル方法、及びコンパイルプログラムは、図１に示されるソースプログラムをコンパイルしてオブジェクトコードを生成する。図１のソースプログラムは間接参照を含んでおり、ソースプログラムの内容は、単精度複素数型の配列ＡのＩＸ（Ｉ）番目の要素の実部、虚部を取り出して、その加算結果を配列Ｂに代入するものである。

【0039】

まず、コード解析部１０のリスト演算構文解析手段１１が、対象のソースプログラムのリスト演算構文を解析する（ステップＳ１）。リスト演算かどうかを判定し、リスト演算でないときには通常のベクトル命令を生成（ステップ６）した後、目的プログラムを生成（ステップＳ８）して終了する。

【0040】

リスト演算であるときには、ステップＳ３に進む。ステップＳ３では命令生成部２０のリスト演算判定部２１が、リスト演算の対象が単精度複素数型の配列であるかどうかを判定する。ここでは、コード解析部１０の情報に基づき、ある配列の定義、参照の際の添字式に配列参照が含まれ、さらにその配列の添字式がループの繰り返し毎に一定の割合で増加、減少するときリスト演算だと判定し、リスト演算生成処理に入る。リスト演算の対象が単精度複素数型の配列でないとき（ステップＳ３のＮＯ）には、背景技術と同様のリスト演算命令を生成（ステップＳ７）した後、目的プログラムを生成（ステップＳ８）して終了する。

【0041】

リスト演算の対象が単精度複素数型の配列であるときには、ステップＳ４に進む。図１のソースプログラムの場合、配列参照Ａ（ＩＸ（Ｉ））の添字式には配列ＩＸ（Ｉ）の参照が含まれ、配列参照ＩＸ（Ｉ）の添字式Ｉはループの繰り返し毎に１増加するので、リスト演算と判定される。

【0042】

リスト演算において同一の配列要素の実部、虚部へのアクセスが存在するかどうかを判定する（ステップＳ４）。リスト演算において同一の配列要素の実部、虚部へのアクセスが存在するとき（ステップＳ４のＹＥＳ）は、本実施形態によるベクトル命令を生成（ステップＳ５）した後、目的プログラムを生成（ステップＳ８）して終了する。このステップＳ５で生成されるベクトル命令は、上述した８バイトベクトルギャザー命令（VGT8命令）、ベクトル論理積命令（VAND命令）、ベクトル論理シフト命令（VSLL命令）を含んで構成される。

【0043】

以下、本実施形態により生成されるベクトル命令について、説明する。図３は、本発明の第１実施形態により生成される命令列である。図５乃至図７は、本発明の第１実施形態によるコンパイル方法のうち、ベクトルレジスタに対する操作を説明するための概念図である。図３の命令列では、まずベクトルロード命令（VLD命令）で、配列ＩＸの値をベクトルレジスタVR1にロードする。次に、ベクトル論理シフト命令（VSLL命令）で、ベクトルレジスタVR1の各要素を３ビット左論理シフトした値を、ベクトルレジスタVR2に設定する。これは、配列Ａの一要素のサイズ、つまり、単精度複素数型のサイズである８をベクトルレジスタVR1の各要素に乗じた値を、ベクトルレジスタVR2に設定することに等しい。こうして求めた値は、配列Ａの先頭からの相対オフセット値である。

【0044】

次に、ベクトル加算命令（VADD命令）で、ベクトルレジスタVR2の各要素（上記相対オフセット値）と配列Ａの先頭アドレスを加算した結果を、ベクトルレジスタVR3に設定する。このVADD命令の結果を、図５の「VR3」に示す。単精度複素数型の配列のメモリ配置は図５の「Ａ（メモリ）」に示すように、実部、虚部が４バイト毎に交互に配置されているため、結果としてベクトルレジスタVR3にはＡ（ＩＸ（Ｉ））の各要素の実部のアドレスが設定されることとなる。

【0045】

次に、８バイトベクトルギャザー命令（VGT8命令）で、ベクトルレジスタVR3の各要素に格納されたアドレスにある幅８バイトの値を、メモリからベクトルレジスタVR4へ図５の「VR４（Ａの実部、虚部）」のとおりロード（ギャザー）する。単精度複素数型の配列Ａのメモリ配置は、図５の「Ａ（メモリ）」のとおり実部、虚部が４バイト毎に交互に配置されているため、配列Ａの要素であるＡ（ＩＸ（Ｉ））のアドレスにある幅８バイトをロード（ギャザー）することは単精度複素数型の配列Ａの一要素の実部と虚部の値を同時にロード（ギャザー）することと等しい。

【0046】

次に、ベクトル論理積命令（VAND命令）で、ベクトルレジスタVR5にベクトルレジスタVR4の各要素の上位４バイトのみを論理積で図６の「VR5（Ａの実部）」のとおり取り出す。ベクトルレジスタVR4には、単精度複素数型の配列Ａの実部と虚部が格納されているので、上位４バイトのみを取り出した値は単精度複素数型の配列Ａの実部の値と等しい。

【0047】

次に、ベクトル論理シフト命令（VSLL命令）で、ベクトルレジスタVR6にベクトルレジスタVR4の各要素を４バイト左論理シフトした値を図７の「VR6（Ａの虚部）」のとおり設定する。ベクトルレジスタVR4には、単精度複素数型の配列Ａの実部と虚部が格納されているため、４バイト左論理シフトした値は単精度複素数型の配列Ａの虚部の値と等しい。

【0048】

最後にベクトル加算命令（VADD命令）で、ベクトルレジスタVR7にベクトルレジスタVR5とベクトルレジスタVR6とを加算したものを設定し、ベクトルストア命令（VST命令）でベクトルレジスタVR7の値を、配列Ｂに格納する。

【0049】

（実施形態の効果）
本実施形態のコンパイル装置、コンパイル方法、及びコンパイルプログラムによれば、単精度複素数型の配列を対象としたリスト演算を高速化することができる。

【0050】

図８の（ａ）は背景技術のコンパイル方法により生成された命令列であり、（ｂ）は本発明の実施形態のコンパイル方法により生成された命令列である。背景技術では２つの４バイトベクトルギャザー命令（VGT4命令）を生成していたのに対して、本発明の実施形態のコンパイル方法では８バイトベクトルギャザー命令（VGT8命令）、ベクトル論理積命令（VAND命令）、ベクトル論理シフト命令（VSLL命令）を生成している。本実施形態では、実行時間が長いベクトルギャザー命令の実行数を削減することでメモリへのアクセスを減らすことができる。ベクトルギャザー命令の実行数を削減することでメモリへのアクセスを減らすことができ、プログラムを高速化できる。

【0051】

〔第２実施形態〕
次に、本発明の第２実施形態によるコンパイル装置、コンパイル方法、及びコンパイルプログラムについて、説明する。本実施形態によるコンパイル装置、コンパイル方法、及びコンパイルプログラムについて、上述した第１実施形態と同様な内容についてはその詳細な説明を省略して、相違点について説明する。

【0052】

上述した第１実施形態では、単精度複素数型の配列を対象としたリスト演算を含むプログラムを例に説明したが、本発明はこれに限られない。例えば、２行Ｎ列の単精度浮動小数点数型の配列を対象としたリスト演算を含むプログラムにおいても適用できる。

【0053】

図９の（ａ）は２行Ｎ列の単精度浮動小数点数型の配列Ｃを対象としたリスト演算を含むソースプログラムであり、図９の（ｂ）は２行Ｎ列の単精度浮動小数点数型の配列Ｃのメモリ配列を示す概念図である。図９の（ａ）のソースプログラムの内容は、２行Ｎ列の単精度浮動小数点数型の配列ＣのＩＸ（Ｉ）番目の要素のＣ（１，ＩＸ（Ｉ））、Ｃ（２，ＩＸ（Ｉ））を取り出して、その加算結果を配列Ｂに代入するものである。

【0054】

図９の（ｂ）に示すように、２行Ｎ列の単精度浮動小数点数型の配列Ｃでは、Ｃ（１，１）、Ｃ（２，１）～Ｃ（１，Ｎ）、Ｃ（２，Ｎ）が４バイト毎に交互に配置されている。

【0055】

このような２行Ｎ列の単精度浮動小数点数型の配列Ｃを対象としたリスト演算においても、上述した第１実施形態と同様に、８バイトベクトルギャザー命令（VGT8命令）、ベクトル論理積命令（VAND命令）、ベクトル論理シフト命令（VSLL命令）を生成し、これによって配列ＣのＣ（１，ＩＸ（Ｉ））、Ｃ（２，ＩＸ（Ｉ））の値をロード（ギャザー）する命令を生成する。

【0056】

本実施形態では、第１実施形態の図２のステップＳ３の代わりに、命令生成部２０が、リスト演算の対象が２行Ｎ列の単精度浮動小数点数型の配列であるかどうかを判定する。さらに本実施形態では、第１実施形態の図２のステップＳ４の代わりに、リスト演算において２行Ｎ列の単精度浮動小数点数型の配列の同一行のＣ（１，ＩＸ（Ｉ））、Ｃ（２，ＩＸ（Ｉ））へのアクセスが存在するかどうかを判定する。これらに該当するときには、本実施形態のベクトル命令を生成する。

【0057】

（実施形態の効果）
本実施形態のコンパイル装置、コンパイル方法、及びコンパイルプログラムによれば、第１実施形態と同様に、８バイトベクトルギャザー命令（VGT8命令）、ベクトル論理積命令（VAND命令）、ベクトル論理シフト命令（VSLL命令）を生成することにより、リスト演算を高速化することができる。

【0058】

本実施形態では、実行時間が長いベクトルギャザー命令の実行数を削減することでメモリへのアクセスを減らすことができる。ベクトルギャザー命令の実行数を削減することでメモリへのアクセスを減らすことができ、プログラムを高速化することができる。

【0059】

さらに本実施形態によれば、２行Ｎ列の単精度浮動小数点数型の配列を対象としたリスト演算を高速化することができ、高速化が可能な対象プログラムの範囲を拡げることができる。

【0060】

〔第３実施形態〕
次に、本発明の第３実施形態によるコンパイル装置、コンパイル方法、及びコンパイルプログラムについて、説明する。本実施形態によるコンパイル装置、コンパイル方法、及びコンパイルプログラムについて、上述した第１実施形態と同様な内容についてはその詳細な説明を省略して、相違点について説明する。第１実施形態では、単精度複素数型の配列を対象としたリスト演算を含むプログラムを例に説明し、第２実施形態では、２行Ｎ列の単精度浮動小数点数型の配列を対象としたリスト演算を含むプログラムを例に説明したが、本発明はこれに限られない。例えば、成分として単精度浮動小数点数を２つ持つ構造型の配列を対象としたリスト演算を含むプログラムにおいても適用できる。

【0061】

図１０の（ａ）は成分として単精度変数ａａ、ｂｂを持つ構造型の配列Ｄを対象としたリスト演算を含むソースプログラムであり、図１０の（ｂ）は成分として単精度変数ａａ、ｂｂを持つ構造型の配列Ｄのメモリ配列を示す概念図である。図１０の（ａ）のソースプログラムの内容は、成分として単精度変数ａａ、ｂｂを持つ構造型の配列ＤのＩＸ（Ｉ）番目の要素の単精度変数ａａ、単精度変数ｂｂを取り出して、その加算結果を配列Ｂに代入するものである。

【0062】

図１０の（ｂ）に示すように、成分として単精度変数ａａ、ｂｂを持つ構造型の配列Ｄでは、Ｄ（１）％ａａ、Ｄ（１）％ｂｂ、Ｄ（２）％ａａ、Ｄ（２）％ｂｂ～Ｄ（Ｎ）％ａａ、Ｄ（Ｎ）％ｂｂが４バイト毎に交互に配置されている。

【0063】

このような成分として単精度変数ａａ、ｂｂを持つ構造型の配列Ｄを対象としたリスト演算においても、上述した第１実施形態と同様に、８バイトベクトルギャザー命令（VGT8命令）、ベクトル論理積命令（VAND命令）、ベクトル論理シフト命令（VSLL命令）を生成し、これによって配列Ｄの単精度変数ａａ、単精度変数ｂｂの値をロード（ギャザー）する命令を生成する。

【0064】

本実施形態では、第１実施形態の図２のステップＳ３の代わりに、命令生成部２０が、リスト演算の対象が成分として単精度変数ａａ、ｂｂを持つ構造型の配列であるかどうかを判定する。さらに本実施形態では、第１実施形態の図２のステップＳ４の代わりに、リスト演算において同一の配列要素の単精度変数ａａ、単精度変数ｂｂへのアクセスが存在するかどうかを判定する。これらに該当するときには、本実施形態のベクトル命令を生成する。

【0065】

【0066】

【0067】

さらに本実施形態によれば、成分として単精度変数ａａ、ｂｂを持つ構造型の配列を対象としたリスト演算を高速化することができ、高速化が可能な対象プログラムの範囲を拡げることができる。

【0068】

以上、本発明の好ましい実施形態を説明したが、本発明はこれに限定されるものではない。例えば、上述した第１乃至第３実施形態で言及した具体的な配列の名称に限られず、成分として第１の変数及び第２の変数を持つ構造型の配列を対象としたリスト演算を含むソースプログラムにも、本発明は適用可能である。特許請求の範囲に記載した発明の範囲内で、種々の変形が可能であり、それらも本発明の範囲に含まれることはいうまでもない。

【0069】

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
（付記１）ソースプログラムに、成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるかどうかを判定するコード解析部と、
前記成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるときに、ベクトルギャザー命令、ベクトル論理積命令、及びベクトルシフト命令を生成するベクトル命令生成部と、を含む、
コンパイル装置。
（付記２）前記構造型の配列は、前記成分として第１の変数及び第２の変数が４バイト毎に交互にメモリに配列されており、
前記ベクトルギャザー命令は、８バイトベクトルギャザー命令であり、第１のベクトルレジスタの各要素に格納されたアドレスにある幅８バイトの値を、前記メモリから第２のベクトルレジスタへロードするものであり、
前記ベクトル論理積命令は、前記第２のベクトルレジスタの各要素の上位４バイトのみを第３のベクトルレジスタに取り出すものであり、
前記ベクトルシフト命令は、前記第２のベクトルレジスタの各要素を４バイト左シフトした値を第４のベクトルレジスタに取り出すものである、
付記１に記載のコンパイル装置。
（付記３）前記成分として第１の変数及び第２の変数を持つ構造型の配列は、実部、虚部が４バイト毎に交互に配置された、単精度複素数型の配列である、
付記２に記載のコンパイル装置。
（付記４）前記成分として第１の変数及び第２の変数を持つ構造型の配列は、要素が４バイト毎に交互に配置された、２行Ｎ列の単精度浮動小数点数型の配列である、
付記２に記載のコンパイル装置。
（付記５）前記成分として第１の変数及び第２の変数を持つ構造型の配列は、第１の単精度変数、第２の単精度変数が４バイト毎に交互に配置された、２行Ｎ列の単精度浮動小数点数型の配列である、
付記２に記載のコンパイル装置。
（付記６）ソースプログラムに、成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるかどうかをコード解析部が判定し、
前記成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるときに、ベクトルギャザー命令、ベクトル論理積命令、及びベクトルシフト命令をベクトル命令が生成する、
コンパイル方法。
（付記７）前記構造型の配列は、前記成分として第１の変数及び第２の変数が４バイト毎に交互にメモリに配列されており、
前記ベクトルギャザー命令は、８バイトベクトルギャザー命令であり、第１のベクトルレジスタの各要素に格納されたアドレスにある幅８バイトの値を、前記メモリから第２のベクトルレジスタへロードするものであり、
前記ベクトル論理積命令は、前記第２のベクトルレジスタの各要素の上位４バイトのみを第３のベクトルレジスタに取り出すものであり、
前記ベクトルシフト命令は、前記第２のベクトルレジスタの各要素を４バイト左シフトした値を第４のベクトルレジスタに取り出すものである、
付記６に記載のコンパイル方法。
（付記８）前記成分として第１の変数及び第２の変数を持つ構造型の配列は、実部、虚部が４バイト毎に交互に配置された、単精度複素数型の配列である、
付記７に記載のコンパイル方法。
（付記９）前記成分として第１の変数及び第２の変数を持つ構造型の配列は、要素が４バイト毎に交互に配置された、２行Ｎ列の単精度浮動小数点数型の配列である、
付記７に記載のコンパイル方法。
（付記１０）前記成分として第１の変数及び第２の変数を持つ構造型の配列は、第１の単精度変数、第２の単精度変数が４バイト毎に交互に配置された、２行Ｎ列の単精度浮動小数点数型の配列である、
付記７に記載のコンパイル方法。
（付記１１）コンピュータを、
ソースプログラムに、成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるかどうかを判定するコード解析手段と、
前記成分として第１の変数及び第２の変数を持つ構造型の配列を対象とするリスト演算が含まれるときに、ベクトルギャザー命令、ベクトル論理積命令、及びベクトルシフト命令を生成するベクトル命令生成手段と、して機能させる、
コンパイルプログラム。
（付記１２）前記構造型の配列は、前記成分として第１の変数及び第２の変数が４バイト毎に交互にメモリに配列されており、
前記ベクトルギャザー命令は、８バイトベクトルギャザー命令であり、第１のベクトルレジスタの各要素に格納されたアドレスにある幅８バイトの値を、前記メモリから第２のベクトルレジスタへロードするものであり、
前記ベクトル論理積命令は、前記第２のベクトルレジスタの各要素の上位４バイトのみを第３のベクトルレジスタに取り出すものであり、
前記ベクトルシフト命令は、前記第２のベクトルレジスタの各要素を４バイト左シフトした値を第４のベクトルレジスタに取り出すものである、
付記１１に記載のコンパイルプログラム。
（付記１３）前記成分として第１の変数及び第２の変数を持つ構造型の配列は、実部、虚部が４バイト毎に交互に配置された、単精度複素数型の配列である、
付記１２に記載のコンパイルプログラム。
（付記１４）前記成分として第１の変数及び第２の変数を持つ構造型の配列は、要素が４バイト毎に交互に配置された、２行Ｎ列の単精度浮動小数点数型の配列である、
付記１２に記載のコンパイルプログラム。
（付記１５）前記成分として第１の変数及び第２の変数を持つ構造型の配列は、第１の単精度変数、第２の単精度変数が４バイト毎に交互に配置された、２行Ｎ列の単精度浮動小数点数型の配列である、
付記１２に記載のコンパイルプログラム。

【符号の説明】

【0070】

１０コード解析部
１１リスト演算構文解析手段
２０命令生成部
２１リスト演算判定部
２２ベクトルロード命令生成手段
２３ベクトル論理シフト命令生成手段
２４ベクトル加算命令生成手段
２５８バイトベクトルギャザー命令生成手段
２６ベクトル論理積命令生成手段
２７ベクトルストア命令生成手段
１００コンパイラ

【図1】