特開2024-30013 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社デンソーの特許一覧 ▶ トヨタ自動車株式会社の特許一覧 ▶ 株式会社ミライズテクノロジーズの特許一覧

特開2024-30013分岐予測器

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024030013

(43)【公開日】2024-03-07

(54)【発明の名称】分岐予測器

(51)【国際特許分類】

G06F 9/38 20180101AFI20240229BHJP

【ＦＩ】

G06F9/38 330B

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2022132535

(22)【出願日】2022-08-23

(71)【出願人】

【識別番号】000004260

【氏名又は名称】株式会社デンソー

(71)【出願人】

【識別番号】000003207

【氏名又は名称】トヨタ自動車株式会社

(71)【出願人】

【識別番号】520124752

【氏名又は名称】株式会社ミライズテクノロジーズ

(74)【代理人】

【識別番号】110000028

【氏名又は名称】弁理士法人明成国際特許事務所

(72)【発明者】

【氏名】岩城隆雄

【テーマコード（参考）】

5B013

【Ｆターム（参考）】

5B013BB02

(57)【要約】

【課題】パーセプトロン分岐予測器において、予測精度の低下を抑制しながら、積和演算の回数を少なくする。
【解決手段】パーセプトロン分岐予測器１００は、過去における分岐命令の分岐結果を記憶する分岐結果記憶部１と、分岐結果のそれぞれに対応する重みを記憶する重み記憶部２と、分岐結果記憶部に記憶された分岐結果のうちの一部の複数の分岐結果である部分分岐結果と、部分分岐結果を構成する複数の分岐結果のそれぞれに対応する重みと、を積和演算することで、分岐命令の分岐方向を予測する分岐予測部３と、分岐結果を元に、重みを更新する重み更新部４と、を備える。
【選択図】図１

【特許請求の範囲】

【請求項1】

過去における分岐命令の分岐結果が時系列に記録された分岐履歴を用いて、分岐命令の分岐方向を予測するパーセプトロン分岐予測器（１００）であって、
前記過去における分岐命令の分岐結果を記憶する分岐結果記憶部（１）と、
前記分岐結果のそれぞれに対応する重みを記憶する重み記憶部（２）と、
前記分岐結果記憶部に記憶された分岐結果のうちの一部の複数の分岐結果である部分分岐結果と、前記部分分岐結果を構成する複数の分岐結果のそれぞれに対応する前記重みと、を積和演算することで、前記分岐命令の前記分岐方向を予測する分岐予測部（３）と、
前記分岐結果を元に、前記重みを更新する重み更新部（４）と、
を備える、分岐予測器。

【請求項2】

請求項１に記載の分岐予測器であって、
前記分岐結果記憶部には、時系列に沿って新しい分岐結果から古い分岐結果への順に、分岐結果Ｘ_１，Ｘ_２，…，Ｘ_ｎ（ｎは自然数である項番号）が記憶され、
前記分岐結果は、分岐が成立した場合に＋１が、分岐が不成立の場合－１が、それぞれ設定され、
前記重み記憶部には、時系列に沿って新しい分岐結果に対応する重みから古い分岐結果に対応する重みへの順に、重みＷ_１，Ｗ_２，…，Ｗ_ｎ（ｎは自然数である項番号）が記憶され、
前記部分分岐結果は、

【数3】

（ｋは０以上の自然数）であり、
前記部分分岐結果に対応する重みは、

【数4】

（ｋは０以上の自然数）であり、
前記分岐予測部は、

【数5】

前記式（４）を演算し、算出されたＹが０以上のとき前記分岐命令は分岐成立すると予測し、算出されたＹが０未満のとき前記分岐命令は分岐不成立であると予測し、
前記式（４）において、ｌは自然数であり、１≦２^ｌ≦ｎであり、
前記重み更新部は、前記分岐予測部による前記分岐方向の予測後に、
Ｗ_n＝Ｗ_n-1＋ｔＸ_n-1…（５）
前記式（５）を演算し、前記重みを更新し、
前記式（５）において、ｎは自然数であり、前記分岐が成立のときｔ＝＋１、前記分岐が不成立のときｔ＝－１である、
分岐予測器。

【請求項3】

請求項１に記載の分岐予測器であって、
前記分岐結果記憶部に記憶される複数の前記分岐結果は、連続する複数の項番号の前記分岐結果からなる複数の分岐結果グループと、前記複数の分岐結果グループに含まれない連続する複数の項番号の前記分岐結果からなる１つ以上の除外グループであって、それぞれが２つの前記分岐結果グループに挟まれる１つ以上の除外グループと、に分けられ、
前記複数の分岐結果グループのそれぞれに含まれる前記分岐結果の項数は、前記分岐結果グループに含まれる最小項番号が大きくなるほど多くなり、
前記１つ以上の除外グループのそれぞれに含まれる前記分岐結果の数は、前記除外グループに含まれる最小項番号が大きくなるほど多くなり、
前記部分分岐結果は、前記複数の分岐結果グループに含まれる前記分岐結果である、
分岐予測器。

【請求項4】

請求項３に記載の分岐予測器であって、前記分岐結果グループのそれぞれに含まれる前記分岐結果の項数は、前記分岐結果グループに含まれる前記最小項番号の順序で並べると等比数列となる、分岐予測器。

【請求項5】

請求項３に記載の分岐予測器であって、前記除外グループのそれぞれに含まれる前記分岐結果の項数は、前記除外グループに含まれる前記最小項番号の順序で並べると、等比数列となる、分岐予測器。

【請求項6】

請求項３に記載の分岐予測器であって、
前記分岐結果グループのそれぞれに含まれる前記分岐結果の項数は、前記分岐結果グループに含まれる前記最小項番号の順序で並べると等比数列となり、かつ
前記除外グループのそれぞれに含まれる前記分岐結果の項数は、前記除外グループに含まれる前記最小項番号の順序で並べると、等比数列となる、分岐予測器。

【請求項7】

請求項１～６のいずれか１項に記載の分岐予測器であって、前記部分分岐結果に含まれる前記分岐結果のうちで最大の項番号は、前記分岐命令を含むアルゴリズムにおける最大の繰り返し分岐命令数より大きい数である、分岐予測器。

【請求項8】

請求項１～６のいずれか１項に記載の分岐予測器であって、前記部分分岐結果に含まれる前記分岐結果のうちで最大の項番号は、前記分岐命令を含むアルゴリズムにおける最大の繰り返し分岐命令数と一致した数である、分岐予測器。

【請求項9】

請求項１～６のいずれか１項に記載の分岐予測器であって、前記部分分岐結果に含まれる前記分岐結果のうちで最大の項番号は、前記分岐命令を含むアルゴリズムにおける繰り返し分岐命令数のうちで、最も頻度の高い繰り返し分岐命令数より大きい数である、分岐予測器。

【請求項10】

請求項１～６のいずれか１項に記載の分岐予測器であって、前記部分分岐結果に含まれる前記分岐結果のうちで最大の項番号は、前記分岐命令を含むアルゴリズムにおける繰り返し分岐命令数のうちで、最も頻度の高い繰り返し分岐命令数と一致した数である、分岐予測器。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、分岐予測器に関する。

【背景技術】

【0002】

パイプライン処理を実行可能なプロセッサには、分岐命令の分岐方向、即ち分岐が成立するか否かを予測する分岐予測器が搭載されている。例えば非特許文献１には、ニューラルネットワークを応用したパーセプトロン分岐予測器が開示されている。パーセプトロン分岐予測器は、過去における分岐命令の分岐結果と、分岐結果のそれぞれに対応する重みと、を積和演算し、積和演算の結果が負である場合は分岐が不成立であると予測し、積和演算の結果が非負である場合は分岐が成立すると予測する。

【先行技術文献】

【非特許文献】

【0003】

【非特許文献1】Daniel A. Jimenez and Calvin Lin, “Dynamic Branch Prediction with Perceptrons”, Proceedings HPCA Seventh International Symposium on High-Performance Computer Architecture, 2001.

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかし、パーセプトロン分岐予測器において、予測精度を向上させるために記憶する分岐結果数を大きくし分岐履歴長を長くすると、分岐結果と重みとの積和演算の回数が増加する。積和演算の回数が増加すると、演算に要する時間が増加するだけでなく、プロセッサの消費電力も増加する。そこで、予測精度の低下を抑制しながら、積和演算の回数を減らすことができるパーセプトロン分岐予測器が求められている。

【課題を解決するための手段】

【0005】

本開示は、以下の形態として実現することが可能である。

【0006】

本開示の一形態によれば、過去における分岐命令の分岐結果が時系列に記録された分岐履歴を用いて、分岐命令の分岐方向を予測するパーセプトロン分岐予測器（１００）が提供される。この分岐予測器は、前記過去における分岐命令の分岐結果を記憶する分岐結果記憶部（１）と、前記分岐結果のそれぞれに対応する重みを記憶する重み記憶部（２）と、前記分岐結果記憶部に記憶された分岐結果のうちの一部の複数の分岐結果である部分分岐結果と、前記部分分岐結果を構成する複数の分岐結果のそれぞれに対応する前記重みと、を積和演算することで、前記分岐命令の前記分岐方向を予測する分岐予測部（３）と、分岐結果を元に、前記重みを更新する重み更新部（４）と、を備える。

【0007】

この形態の分岐予測器によれば、分岐予測部が、分岐結果記憶部に記憶されている分岐結果の全てではなく、分岐結果の一部である部分分岐結果を用いて分岐予測を行うので、予測精度の低下を抑制しながら、分岐予測に要する積和演算の回数を減らすことができる。

【図面の簡単な説明】

【0008】

【図1】本開示の一実施形態としての分岐予測器の構成を模式的に示すブロック図である。

【図2】式（２）を展開した説明図である。

【図3】分岐予測の処理の一例を示すフローチャートである。

【図4】比較例および実施例の分岐予測器によるシミュレーションの結果を示すグラフである。

【図5】第２実施形態にかかる分岐結果のグループ分けを説明する図である。

【図6】第３実施形態にかかる分岐結果のグループ分けを説明する図である。

【図7】第４実施形態にかかる分岐結果のグループ分けを説明する図である。

【発明を実施するための形態】

【0009】

Ａ．第１実施形態：
Ａ１．装置構成：
図１に示す分岐予測器１００は、バイプライン処理を実行可能なプロセッサに搭載されて用いられる。プロセッサは、例えばＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）またはＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）である。プロセッサにおいて、一つの命令に対する実行処理は、複数のステージにより構成される。具体的には、実行処理は、命令を読み出すフェッチステージ、フェッチされた命令をデコードするデコードステージ、数値の演算等を実行する実行ステージ、演算結果をメモリに戻すライトバックステージ等で構成される。分岐予測器１００は、フェッチステージにおいて、時系列順に並べられた過去の分岐命令の分岐結果と、分岐結果のそれぞれと対応する重みとを積和演算することで、分岐が成立するか否かを予測する。プロセッサは、分岐予測器１００の分岐予測に従って、命令をフェッチする。

【0010】

分岐予測器１００は、分岐結果記憶部１と、重み記憶部２と、分岐予測部３と、重み更新部４と、を備える。

【0011】

分岐結果記憶部１は、過去の分岐命令の分岐結果を時系列順に記憶する。記憶される分岐結果は、直近の分岐結果から順番に分岐結果Ｘ_１，Ｘ_２，…Ｘ_ｎである。ここで、ｎは自然数である。本開示において、分岐結果のそれぞれを項と呼び、下付きの数字を「項番号」と呼ぶ。新しい分岐結果ほど小さい項番号で表され、古い分岐結果ほど大きい項番号で表される。即ち分岐結果Ｘ_１は、分岐結果記憶部１に記憶されている分岐結果のうちで最新の分岐結果であり、分岐結果Ｘ_ｎは、分岐結果記憶部１に記憶されている分岐結果のうちで最も古い分岐結果である。分岐結果Ｘ_１，Ｘ_２，…Ｘ_ｎのそれぞれは、分岐が成立した場合＋１であり、分岐が不成立であった場合－１である。本開示において、分岐結果記憶部１が記憶している分岐結果の項の総数のことを「分岐履歴長Ｌ」と呼ぶ。以下、分岐履歴長Ｌが１６である例について説明するが、本開示はこれに制限されない。

【0012】

重み記憶部２は、後述する分岐予測の積和演算に用いられる重みを記憶する。記憶されている重みは、分岐結果記憶部１に記憶されている分岐結果Ｘ_１，Ｘ_２，…Ｘ_ｎのそれぞれに対応しており、直近の分岐結果に対応する重みから順番に重みＷ_１，Ｗ_２，…Ｗ_ｎである。なお、ｎは上述の通り自然数である。また、重み記憶部２は、バイアスとしてＷ_０を記憶している。バイアスは、後述する分岐予測部３における分岐予測の演算に用いられる。本開示において、バイアスＷ_０は、＋１である。

【0013】

分岐予測部３は、分岐結果記憶部１に記憶された過去の分岐命令の分岐結果と、重み記憶部２に記憶された重みと、を用いて分岐命令の分岐方向の予測を行う。最初に、従来知られているパーセプトロン分岐予測器における分岐予測について説明する。従来のパーセプトロン分岐予測器は、記憶されている分岐結果全てについて重みとの積和演算を実行し、演算結果が負のときは分岐が不成立と予測し、演算結果が非負のときは分岐が成立と予測する。具体的には、従来のパーセプトロン分岐予測器は、下記式（１）の演算を実行し、Ｙが負のときは分岐不成立と予測し、Ｙが非負のときは分岐成立と予測する。

【0014】

【数1】

【0015】

他方で、本開示における分岐予測部３は、分岐結果記憶部１に記憶されている一部の分岐結果のみを用いて分岐予測を行う。本開示において、分岐結果記憶部１に記憶されている分岐結果のうちで、分岐予測に用いる分岐結果のことを「部分分岐結果」と呼ぶ。本実施形態における部分分岐結果は、初項１公比２の等比数列で表される項番号の複数の分岐結果である。したがって、分岐予測部３は、分岐履歴長Ｌが１６の場合において、分岐結果記憶部１に記憶されている分岐結果のうちで、分岐結果Ｘ_１，Ｘ_２，Ｘ_４，Ｘ_８，Ｘ_１６の項番号の分岐結果を用いて分岐予測を行う。具体的には、分岐予測部３は、下記式（２）の演算を実行する。

【0016】

【数2】

【0017】

図２に示すように、上記式（２）を展開すると、Ｙは、バイアスと、重みおよび分岐結果の積和演算と、の和であることがわかる。分岐予測部３は、上記式（２）の演算を実行した結果、Ｙが負のときは分岐不成立と予測し、Ｙが非負のときは分岐成立と予測する。

【0018】

重み更新部４は、分岐予測部３による分岐予測の後に、重みの更新を行う。重みの更新は、分岐結果を元に、行われる。具体的には、重み更新部４は、下記式（３）の演算を実行し、重み記憶部２に記憶されている重みの更新を行う。
Ｗ_ｉ＝Ｗ_ｉ-1＋ｔＸ_ｉ-1…（３）
（ここで、ｉ＝２，３，…，ｎであり、分岐成立のときｔ＝＋１、分岐不成立のときｔ＝－１である。）

【0019】

Ａ２．分岐予測処理：
図３に示す分岐予測処理は、プロセッサにおける分岐命令の分岐が成立するか否かを予測するために実行される。プロセッサにおいて分岐命令を含む命令がフェッチされると、分岐予測処理が実行される。

【0020】

分岐予測部３は、重みを取得する（ステップＳ１０５）。分岐予測部３は、プロセッサが分岐を含む命令をフェッチすると、かかる命令のアドレスのハッシュ値によって、重み記憶部２に記憶されている重みを参照し、取得する。本開示において、取得される重みは、重みＷ_１，Ｗ_２，Ｗ_４，Ｗ_８，およびＷ_１６である。

【0021】

分岐予測部３は、部分分岐結果を取得する（ステップＳ１１０）。本開示において、分岐結果記憶部１は、過去１６回における分岐結果、即ち分岐結果Ｘ_１，Ｘ_２，…，Ｘ_１６を記憶している。分岐予測部３は、部分分岐結果である分岐結果Ｘ_１，Ｘ_２，Ｘ_４，Ｘ_８，およびＸ_１６を分岐結果記憶部１から取得する。

【0022】

分岐予測部３は、部分分岐結果と重みとを用いて積和演算を実行する（ステップＳ１１５）。分岐予測部３は、ステップＳ１０５で取得した重みと、ステップＳ１１０で取得した分岐結果とを用いて、上述した式（２）の演算を実行する。

【0023】

分岐予測部３は、積和演算の演算結果Ｙが非負であるか否かを判定する（ステップＳ１２０）。分岐予測部３は、非負であると判定した場合、即ちＹ≧０と判定した場合（ステップＳ１２０：ＹＥＳ）、分岐が成立すると予測する（ステップＳ１２５）。

【0024】

分岐予測部３は、非負ではない、即ちＹ＜０と判定した場合（ステップＳ１２０：ＮＯ）、分岐が不成立と予測する（ステップＳ１３０）。

【0025】

重み更新部４は、分岐結果を元に、重みを更新する（ステップＳ１３５）。重み更新部４は、上述した式（３）を演算し、重みの更新を行う。更新された重みは、重み記憶部２に記憶される。

【0026】

図４に示すように、２３種類のテストパターンを準備し、従来のパーセプトロン分岐予測器と本開示の分岐予測器１００とを用いた分岐予測のシミュレーションを実行した。実施例に用いた分岐予測器１００の分岐履歴長Ｌは、１６である。実施例では、部分分岐結果として初項１公比２の等比数列で表される項番号の分岐結果と、部分分岐結果に対応する重みと、を用いて分岐予測を実行した。比較例として、分岐履歴長Ｌが２，４，８，および１６のパーセプトロン分岐予測器を用いてシミュレーションを行った。比較例では、記憶されている分岐結果全てを用いて分岐予測を行った。シミュレーションは、各テストパターンについて１２０回連続で分岐予測を行った。テストパターンは、分岐が成立（Ｔ）と不成立（Ｎ）とを様々な順序で並べたものである。図４に示すテストパターンのＴとＮに続く数字は、ＴまたはＮが何回連続するかを示すものである。例えば、図４に示すＮ４Ｔ１のテストパターンは、不成立（Ｎ）が連続して４回、次いで成立（Ｔ）が１回のテストパターンであることを意味する。分岐予測部３は、テストパターンを一巡すると、再度そのテストパターンの最初から分岐予測を実行する。即ち、Ｎ４Ｔ１のテストパターンの場合、分岐予測部３は、Ｎ，Ｎ，Ｎ，Ｎ，Ｔ，Ｎ，Ｎ，Ｎ，Ｎ，Ｔ…のように１種類のテストパターンについて繰り返し分岐予測を実行する。

【0027】

図４に示すグラフの縦軸は、予測１２０回目における累積予測成功率を示す。予測回数は、１つの分岐に対する予測を１回とする。具体的には、Ｎ４Ｔ１のテストパターンの場合、分岐予測部３は、テストパターンを一巡する間に５回の分岐予測を実行する。累積予測成功率は、予測成功回数を予測回数で除した値の百分率である。具体的には、予測回数１２０回における累積予測成功率は、１２０回の予測回数のうちで実際の分岐方向と分岐予測の結果とが一致した回数を１２０で除して、１００倍することで求められる。

【0028】

下記表１は、各比較例および実施例について、２３種類のテストパターンについての予測１２０回目における累積予測成功率の平均値を示す。

【0029】

【表1】

【0030】

表１の「積和演算回数」は、１回の分岐予測で行われる積和演算回数を示している。各比較例において、記憶された分岐結果全てを用いて分岐予測が実行されているため、分岐履歴長Ｌと積和演算回数が一致している。他方、実施例において、分岐履歴長Ｌは１６であるが、分岐予測部３は、記憶されている分岐結果の一部、即ち部分分岐結果のみを用いて積和演算を行うので、積和演算回数は５である。

【0031】

表１の「累積予測成功率の平均値」は、２３種類のテストパターンについて分岐予測を１２０回行ったときの累積予測成功率の平均値を示している。具体的には、図４に示す２３種類のテストパターンそれぞれについて１２０回の分岐予測を行い、累積予測成功率を算出した後、それらの総和を２３で除して求めた値である。各比較例の成功率が示すように、分岐履歴長Ｌが増加し積和演算の回数が増加するほど、予測成功率も増加する。他方、実施例の予測成功率は、積和演算の回数が僅か５回にも関わらず、良好な結果を示している。

【0032】

以上説明した第１実施形態の分岐予測器１００によれば、分岐予測部３が、分岐結果記憶部１に記憶された分岐結果のうちの一部の複数の分岐結果である部分分岐結果と、部分分岐結果を構成する複数の分岐結果のそれぞれに対応する重みと、を積和演算することで分岐予測を実行するので、分岐結果記憶部１に記憶された分岐結果を全て用いて分岐予測する構成と比較して、予測精度の低下を抑制しながら、積和演算の回数を減らすことができる。

【0033】

Ｂ．第２実施形態：
第１実施形態において、部分分岐結果として初項１公比２の等比数列で表される項番号の分岐結果を用いる例について説明したが、本開示はこれに制限されない。第２実施形態にかかる分岐予測器１００では、分岐結果記憶部１に記憶される複数の分岐結果が、複数の分岐結果グループと、１つ以上の除外グループと、に分けられ、分岐予測部３は、複数の分岐結果グループを構成する分岐結果を部分分岐結果として分岐予測に用いる。具体的には、分岐結果グループのそれぞれは、連続する項番号の分岐結果からなる。各分岐結果グループに含まれる分岐結果の項数は、各分岐結果グループに含まれる最小項番号が大きくなるほど多くなる。また、除外グループは、連続する複数の項番号の分岐結果からなる。各除外グループに含まれる分岐結果の項数は、各除外グループに含まれる最小項番号が大きくなるほど多くなる。例えば、図５に示すように、分岐結果グループに含まれる最小項番号の小さい方から順番に、第１分岐結果グループ、第２分岐結果グループ…とすると、分岐結果グループに含まれる項数は、１、３、５…と、分岐結果グループに含まれる最小項番号の増加とともに多くなる。また、除外グループは、２つの分岐結果グループに挟まれている。除外グループに含まれる最小項番号の小さい方から順番に、第１除外グループ、第２除外グループ…とすると、除外グループに含まれる項数は、１、２、３…と、除外グループに含まれる最小項番号の増加とともに多くなる。なお、第２実施形態の分岐予測器１００のその他の構成は、第１実施形態の分岐予測器１００と同じであるので、その詳細な説明を省略する。

【0034】

分岐予測部３は、上述のように２つのグループに分けられた分岐結果のうちで、分岐結果グループに含まれる分岐結果だけを用いて分岐予測を実行する。分岐予測に用いられる重みは、分岐結果の項番号に対応する重みが使用される。

【0035】

以上説明した第２実施形態の分岐予測器１００によれば、分岐結果を分岐結果グループと除外グループとに分け、分岐結果グループに含まれる分岐結果だけを用いて分岐予測を行うので、分岐結果記憶部１に記憶された分岐結果数が多い場合、即ち分岐履歴長Ｌが長い場合であっても、記憶された分岐結果を効率的に分岐予測に利用することができる。具体的には、分岐履歴長Ｌが１２８の場合、分岐予測に用いる部分分岐結果として初項１公比２の等比数列で表される項番号の分岐結果を用いると、分岐結果Ｘ_１，Ｘ_２，Ｘ_４，Ｘ_８，Ｘ_１６，Ｘ_３２，Ｘ_６４，およびＸ_１２８が、分岐予測に用いられる。ここで、大きい項番号間、例えばＸ_６４とＸ_１２８の間では分岐履歴に利用されない分岐結果の項が多い。そこで、第２実施形態では、各分岐結果グループに含まれる最小項番号が大きくなるほど各分岐結果グループに含まれる項数が多くすることで、分岐履歴長Ｌが長い場合であっても、分岐結果を効率的に利用することができる。第２実施形態にかかる分岐予測器１００によっても、分岐結果記憶部１に記憶された分岐結果の全てではなく一部を用いて分岐予測を行うので、予測精度の低下を抑制しながら、積和演算の回数を減らすことができる。

【0036】

Ｃ．第３実施形態：
第２実施形態で説明した分岐予測器１００において、複数の分岐結果グループのそれぞれに含まれる分岐結果の項数は、分岐結果グループに含まれる最小項番号の順序で並べると等比数列となっていてもよい。例えば、図６に示すように、複数の分岐結果グループのそれぞれに含まれる分岐結果の項数が、分岐結果グループに含まれる最小項番号の順序で並べると公比２の等比数列になっていてもよい。具体的には、分岐結果グループに含まれる最小項番号の小さい方から順番に、第１分岐結果グループ、第２分岐結果グループ…とすると、各分岐結果グループに含まれる分岐結果の項数は、１，２，４，…となっていてもよい。なお、第３実施形態の分岐予測器１００のその他の構成は、第１実施形態の分岐予測器１００と同じであるので、その詳細な説明を省略する。

【0037】

以上説明した第３実施形態の分岐予測器１００によれば、第２実施形態の分岐予測器１００と同様の効果を得ることができる。なお、公比は２に限らず、任意の３以上の自然数であってもよい。

【0038】

Ｄ．第４実施形態：
第２実施形態で説明した分岐予測器１００において、１つ以上の除外グループのそれぞれに含まれる分岐結果の項数は、除外グループに含まれる最小項番号の順序で並べると等比数列となっていてもよい。例えば、図７に示すように、複数の除外グループのそれぞれに含まれる分岐結果の項数が、除外グループに含まれる最小項番号の順序で並べると公比２の等比数列になっていてもよい。具体的には、除外グループに含まれる最小項番号の小さい方から順番に、第１除外グループ、第２除外グループ…とすると、各除外グループに含まれる分岐結果の項数は、１，２，４，…となっていてもよい。なお、第４実施形態の分岐予測器１００のその他の構成は、第１実施形態の分岐予測器１００と同じであるので、その詳細な説明を省略する。

【0039】

以上説明した第４実施形態の分岐予測器１００によれば、第２実施形態の分岐予測器１００と同様の効果を得ることができる。なお、公比は２に限らず、任意の３以上の自然数であってもよい。また、本実施形態で説明した分岐予測器１００は、上述した第３実施形態の分岐予測器１００と組み合わせて用いてもよい。即ち、複数の分岐結果グループのそれぞれに含まれる分岐結果の項数は、分岐結果グループに含まれる最小項番号の順序で並べると等比数列となっており、かつ、１つ以上の除外グループのそれぞれに含まれる分岐結果の項数は、除外グループに含まれる最小項番号の順序で並べると等比数列となっていてもよい。

【0040】

Ｅ．第５実施形態：
第５実施形態の分岐予測器１００は、部分分岐結果に含まれる分岐結果のうちで最大の項番号が、分岐命令を含むアルゴリズムにおける最大の繰り返し分岐命令数を超えているまたは一致している点において、第１実施形態の分岐予測器１００と異なる。第５実施形態の分岐予測器１００のその他の構成は、第１実施形態の分岐予測器１００と同じであるので、その詳細な説明を省略する。本開示において、繰り返し分岐命令数とは、分岐命令が繰り返し実行される数をいう。具体的には、ｉｆ文等の分岐命令を含むｗｈｉｌｅ文、ｆｏｒ文等により、繰り返し実行される分岐命令の数をいう。プロセッサは、アルゴリズム中に出現する複数の繰り返し分岐命令数によって演算時間の大部分が占められている。従って、これらの繰り返し分岐命令を全てカバーできるように最大の項番号を設定することが好ましい。そこで、部分分岐結果に含まれる最大の項番号が、アルゴリズム中の最大の繰り返し分岐命令数を上回るまたは一致するように、最大の項番号を設定することで、効率的に予測演算を実行することができる。具体的には、例えばアルゴリズム中の最大繰り返し分岐命令数が７の場合、部分分岐結果のうちで最大の項番号を７以上とすることで、繰り返し分岐命令の周期性を利用して予測演算を実行できる。即ち、繰り返し分岐命令のうちで最後の分岐命令の分岐結果は、部分分岐結果として必ず分岐予測に用いられる。これにより、予測精度の低下を抑制できる。特に、最大の繰り返し分岐命令数と最大の項番号とを一致させるのが最も効率的であるため、好ましい。他方、最大の繰り返し分岐命令数が７の場合に、部分分岐結果のうちで最大の項番号として５等の最大の繰り返し分岐命令数より小さい数の項番号を設定してしまうと、繰り返し分岐命令の周期性を利用できない。

【0041】

以上説明した第５実施形態の分岐予測器１００によれば、部分分岐結果に含まれる分岐結果の最大の項番号が、プロセッサにより実行されるアルゴリズム中に出現する分岐命令を含む繰り返し分岐命令数のうちで最大の繰り返し分岐命令数を、上回るまたは一致しているので、分岐予測器１００の予測精度の低下を抑制しながら積和演算回数を減らすことができる。

【0042】

Ｆ．第６実施形態：
第６実施形態の分岐予測器１００は、部分分岐結果に含まれる分岐結果のうちで最大の項番号が、分岐命令を含むアルゴリズムにおける繰り返し分岐命令数のうちで、最も頻度の高い繰り返し分岐命令数と一致している点で、第１実施形態の分岐予測器１００と異なる。第６実施形態の分岐予測器１００のその他の構成は、第１実施形態の分岐予測器１００と同じであるので、その詳細な説明を省略する。第５実施形態で説明したように、部分分岐結果に含まれる分岐結果の最大の項番号が、アルゴリズム中の分岐を含む繰り返し分岐命令数を上回るまたは一致するように最大の項番号を設定することで、かかる処理の分岐予測の予測精度の低下を抑制しながら、積和演算回数を減らすことができる。そこで、本実施形態の分岐予測器１００のように、部分分岐結果に含まれる分岐結果の最大の項番号が、アルゴリズム中に出現する複数の繰り返し分岐命令数のうちで、最も出現する頻度の高い繰り返し分岐命令数を、上回るまたは一致するように最大の項番号を設定することで、アルゴリズム全体における予測精度の低下を抑制することができる。特に、最も頻度の高い繰り返し分岐命令数と最大の項番号とを一致させるのが最も効率的であるため、好ましい。なお、本実施形態の分岐予測器１００は、第５実施形態の分岐予測器１００と比べて、最大の項番号が小さくなることが多い点でより効率的である。一方で、本実施形態の分岐予測器１００は、全ての繰り返し分岐命令をカバーできていない場合が多い。しかし、本実施形態の分岐予測器１００は、最も頻度の高い繰り返し分岐命令数をカバーできているので、第５実施形態の分岐予測器１００からの分岐予測精度の劣化はあったとしてもごくわずかなものとなる。

【0043】

以上説明した第６実施形態の分岐予測器１００によれば、部分分岐結果に含まれる分岐結果の最大の項番号が、プロセッサにより実行されるアルゴリズム中に出現する分岐命令を含む繰り返し分岐命令数のうちで最も頻度の高い繰り返し分岐命令数を上回るまたは一致しているので、分岐予測器１００の予測精度の低下を抑制しながら積和演算回数を減らすことができる。

【0044】

Ｇ．他の実施形態：
（Ｇ１）上記第１実施形態において、部分分岐結果として初項１公比２の等比数列で表される項番号の分岐結果を用いたが、本開示はこれに制限されない。部分分岐結果として、例えば奇数の項番号の分岐結果、偶数の項番号の分岐結果、任意の３以上の自然数ｍを公比とする等比数列で表される項番号の分岐結果等を用いてもよい。

【0045】

（Ｇ２）各実施形態において、分岐予測部３は、式の演算を実行した結果、Ｙが負のときは分岐不成立と予測し、Ｙが非負のときは分岐成立と予測していたが、この構成に代えて、分岐予測部３は、Ｙが正のときは分岐成立と予測し、Ｙが非正のときは分岐不成立と予測してもよい。

【0046】

本開示に記載の制御部及びその手法は、コンピュータプログラムにより具体化された一つ乃至は複数の機能を実行するようにプログラムされたプロセッサ及びメモリを構成することによって提供された専用コンピュータにより、実現されてもよい。あるいは、本開示に記載の制御部及びその手法は、一つ以上の専用ハードウエア論理回路によってプロセッサを構成することによって提供された専用コンピュータにより、実現されてもよい。もしくは、本開示に記載の制御部及びその手法は、一つ乃至は複数の機能を実行するようにプログラムされたプロセッサ及びメモリと一つ以上のハードウエア論理回路によって構成されたプロセッサとの組み合わせにより構成された一つ以上の専用コンピュータにより、実現されてもよい。また、コンピュータプログラムは、コンピュータにより実行されるインストラクションとして、コンピュータ読み取り可能な非遷移有形記録媒体に記憶されていてもよい。

【0047】

本開示は、上述の各実施形態に限られるものではなく、その趣旨を逸脱しない範囲において種々の構成で実現することができる。例えば、発明の概要の欄に記載した形態中の技術的特徴に対応する各実施形態中の技術的特徴は、上述の課題の一部又は全部を解決するために、あるいは、上述の効果の一部又は全部を達成するために、適宜、差し替えや、組み合わせを行うことが可能である。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することが可能である。

【符号の説明】

【0048】

１…分岐結果記憶部、２…重み記憶部、３…分岐予測部、４…重み更新部、１００…分岐予測器

【図1】