特許7554602 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ アーム・リミテッドの特許一覧

特許7554602スプリット・モード及びロック・モードを有する処理クラスタにおける効率的なメモリ利用

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
3
4A
4B
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-09-11

(45)【発行日】2024-09-20

(54)【発明の名称】スプリット・モード及びロック・モードを有する処理クラスタにおける効率的なメモリ利用

(51)【国際特許分類】

G06F 11/16 20060101AFI20240912BHJP

G06F 15/177 20060101ALI20240912BHJP

G06F 15/173 20060101ALI20240912BHJP

【ＦＩ】

G06F11/16 641

G06F15/177 A

G06F15/173 681

G06F11/16 654

【請求項の数】 18

【外国語出願】

(21)【出願番号】P 2020142185

(22)【出願日】2020-08-26

(65)【公開番号】P2021051733

(43)【公開日】2021-04-01

【審査請求日】2023-08-18

(31)【優先権主張番号】16/580,045

(32)【優先日】2019-09-24

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】500395107

【氏名又は名称】アーム・リミテッド

(74)【代理人】

【識別番号】110000855

【氏名又は名称】弁理士法人浅村特許事務所

(72)【発明者】

【氏名】カウザーヤコブジョハール

(72)【発明者】

【氏名】ロイクピエロン

【審査官】田中幸雄

(56)【参考文献】

【文献】特開２０１９－９５８９３（ＪＰ，Ａ）

【文献】特開２０１９－６６９８３（ＪＰ，Ａ）

【文献】特表２００２－５１８７３９（ＪＰ，Ａ）

【文献】特表２０１７－５３２６７１（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１１／１６

Ｇ０６Ｆ１５／１７７

Ｇ０６Ｆ１５／１７３

(57)【特許請求の範囲】

【請求項1】

処理要素のクラスタであって、前記処理要素が独立処理ワークロードを処理するように構成されるスプリット・モードと、前記処理要素が、少なくとも１つの１次処理要素及び少なくとも１つの冗長処理要素を備え、各冗長処理要素が、前記１次処理要素によって実行される１次処理ワークロードの正当性を検査するための冗長処理ワークロードを実行するように構成されるロック・モードとを有し、
各処理要素が、複数のメモリ・ロケーションを備える関連付けられたローカル・メモリを有する、
処理要素のクラスタと、
前記ロック・モード中に、前記少なくとも１つの１次処理要素が、前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリ内のメモリ・ロケーションにアクセスすることを可能にするように構成されたローカル・メモリ・アクセス制御機構と
を備える装置。

【請求項2】

前記ロック・モード中に、前記１次処理ワークロードを実行するときに前記少なくとも１つの１次処理要素によって発行されたメモリ・アクセス要求に応答して、メモリへのアクセスが実行され、前記冗長処理ワークロードを実行するときに前記少なくとも１つの冗長処理要素によって発行された対応するメモリ・アクセス要求が、メモリへのアクセスを引き起こすことを防止される、請求項１に記載の装置。

【請求項3】

前記ロック・モード中に、前記冗長処理ワークロードを実行するときに前記少なくとも１つの冗長処理要素によって発行された前記対応するメモリ・アクセス要求が、前記１次処理ワークロードの正当性を検査するときに使用される、請求項２に記載の装置。

【請求項4】

前記ロック・モード中に、前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリの前記メモリ・ロケーションの少なくともサブセットが、前記１次処理ワークロードを実行するときに前記少なくとも１つの１次処理要素によって使用するための許容できるメモリ・アドレスを識別するメモリ・アドレス空間内に含まれる、請求項１に記載の装置。

【請求項5】

前記ローカル・アクセス制御機構が、
前記クラスタ中の各処理要素に関連付けられた、前記処理要素の前記関連付けられたローカル・メモリへのアクセスを制御するためのローカル・メモリ・アクセス制御ユニットと、
前記少なくとも１つの１次処理要素に関連付けられた前記ローカル・メモリ・アクセス制御ユニットの出力を、前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリの入力に結合する相互接続信号経路と
を備え、
前記ロック・モード中に、前記少なくとも１つの１次処理要素に関連付けられた前記メモリ・アクセス制御ユニットは、前記１次処理ワークロードを実行するときに前記少なくとも１つの１次処理要素によって発行されたメモリ・アクセス要求が、前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリ内のメモリ・ロケーションにアクセスすることを求めていることを検出すると、前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリにアクセスするために前記相互接続信号経路を採用するように構成される、請求項１に記載の装置。

【請求項6】

前記ロック・モード中に、前記１次処理ワークロードを実行するときに前記少なくとも１つの１次処理要素によって発行された前記メモリ・アクセス要求を処理した結果として生成された結果が、前記少なくとも１つの１次処理要素と前記少なくとも１つの冗長処理要素との両方に伝搬される、請求項２に記載の装置。

【請求項7】

前記少なくとも１つの１次処理要素の各々が、メモリ・アクセス要求を発行するための１次要求チャネルと２次要求チャネルとを有し、
前記ロック・モード中に、前記少なくとも１つの１次処理要素が、自身の関連付けられたローカル・メモリ内のメモリ・ロケーションへのアクセスが必要とされると決定したことに応答して、前記メモリ・ロケーションを識別する前記１次要求チャネル上でメモリ・アクセス要求を発行するように構成され、
前記ロック・モード中に、前記少なくとも１つの１次処理要素が、前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリ内のメモリ・ロケーションへのアクセスが必要とされると決定したことに応答して、前記メモリ・ロケーションを識別する前記２次要求チャネル上でメモリ・アクセス要求を発行するように構成される、請求項１に記載の装置。

【請求項8】

前記ローカル・アクセス制御機構が、
前記クラスタ中の各処理要素に関連付けられた、前記処理要素の前記関連付けられたローカル・メモリへのアクセスを制御するためのローカル・メモリ・アクセス制御ユニットと、
前記少なくとも１つの１次処理要素に関連付けられた前記ローカル・メモリ・アクセス制御ユニットの出力を、前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリの入力に結合する相互接続信号経路と
を備え、
前記ロック・モード中に、前記少なくとも１つの１次処理要素に関連付けられた前記ローカル・メモリ・アクセス制御ユニットは、前記２次要求チャネルを介して前記少なくとも１つの１次処理要素によって発行されたメモリ・アクセス要求の受信を検出すると、前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリにアクセスするために前記相互接続信号経路を採用するように構成される、請求項７に記載の装置。

【請求項9】

前記クラスタの前記ローカル・メモリに関連付けられた共通アクセス・ポートであって、前記共通アクセス・ポートが、前記ローカル・メモリにメモリ・アクセス要求を伝搬するための１次要求チャネルと２次要求チャネルとを有する、共通アクセス・ポート
をさらに備え、
前記ロック・モード中に、前記少なくとも１つの１次処理要素が、前記１次処理ワークロードを実行するときに前記共通アクセス・ポートを介してメモリ・アクセス要求を発行するように構成され、
前記共通アクセス・ポートは、前記メモリ・アクセス要求が前記少なくとも１つの１次処理要素の関連付けられたローカル・メモリ内のメモリ・ロケーションにアクセスすることを求めていることを決定したことに応答して、前記１次要求チャネル上で前記メモリ・アクセス要求を伝搬するように構成され、
前記共通アクセス・ポートは、前記メモリ・アクセス要求が前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリ内のメモリ・ロケーションにアクセスすることを求めていることを決定したことに応答して、前記２次要求チャネル上で前記メモリ・アクセス要求を伝搬するように構成された、
請求項１に記載の装置。

【請求項10】

前記ローカル・アクセス制御機構が、
前記クラスタ中の各処理要素に関連付けられた、前記処理要素の前記関連付けられたローカル・メモリへのアクセスを制御するためのローカル・メモリ・アクセス制御ユニットと、
前記少なくとも１つの１次処理要素に関連付けられた前記ローカル・メモリ・アクセス制御ユニットの出力を、前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリの入力に結合する相互接続信号経路と
を備え、
前記ロック・モード中に、前記少なくとも１つの１次処理要素に関連付けられた前記メモリ・アクセス制御ユニットは、前記２次要求チャネル上で前記共通アクセス・ポートを介して発行されたメモリ・アクセス要求の受信を検出すると、前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリにアクセスするために前記相互接続信号経路を採用するように構成される、請求項９に記載の装置。

【請求項11】

前記ローカル・メモリの各々が関連付けられたプライベート・アクセス・ポートを有し、各プライベート・アクセス・ポートが前記１次要求チャネルと前記２次要求チャネルの両方に結合され、前記共通アクセス・ポートが、前記少なくとも１つの１次処理要素の前記プライベート・アクセス・ポートと前記少なくとも１つの冗長処理要素の前記プライベート・アクセス・ポートの両方に、前記１次要求チャネル及び前記２次要求チャネルのうちの選択された１つで前記メモリ・アクセス要求をブロードキャストするように構成された、請求項９に記載の装置。

【請求項12】

前記共通アクセス・ポートが、処理要素の前記クラスタの外部のデバイスによる前記ローカル・メモリへのアクセスを与えるように構成される、請求項９に記載の装置。

【請求項13】

前記関連付けられたローカル・メモリがスクラッチパッド・メモリである、請求項１に記載の装置。

【請求項14】

各ローカル・メモリが、前記関連付けられた処理要素により実行するための命令と、前記命令を実行するときに前記関連付けられた処理要素によって操作されるデータと、のうちの少なくとも１つを記憶するために使用される、請求項１に記載の装置。

【請求項15】

前記ロック・モード中に、前記１次処理ワークロードを実行するときに前記少なくとも１つの１次処理要素によって発行されたメモリ・アクセス要求を、前記１次処理ワークロードの前記正当性を確立するために、前記冗長処理ワークロードを実行するときに前記少なくとも１つの冗長処理要素によって発行された対応するメモリ・アクセス要求と比較するために採用される比較回路をさらに備える、請求項１に記載の装置。

【請求項16】

前記比較回路が、前記１次処理ワークロードを実行するときに前記少なくとも１つの１次処理要素によって発行された前記メモリ・アクセス要求と、前記冗長処理ワークロードを実行するときに前記少なくとも１つの冗長処理要素によって発行された前記対応するメモリ要求との間の不整合を検出したとき、前記比較回路が、エラー信号を発行するように構成される、請求項１５に記載の装置。

【請求項17】

処理要素のクラスタを備えるデータ処理装置を動作させるための方法であって、
前記クラスタをスプリット・モードで動作させるとき、前記クラスタの前記処理要素上で独立処理ワークロードを処理することと、
前記クラスタをロック・モードで動作させるとき、少なくとも１つの１次処理要素及び少なくとも１つの冗長処理要素を備えるように前記処理要素を構成し、前記少なくとも１つの１次処理要素上で１次処理ワークロードを実行し、前記少なくとも１つの冗長処理要素上で、前記１次処理要素によって実行される前記１次処理ワークロードの正当性を検査するための冗長処理ワークロードを実行することと、
各処理要素に、複数のメモリ・ロケーションを備える関連付けられたローカル・メモリを与えることと、
前記ロック・モード中に、前記ついに１つの１次処理要素が、前記少なくとも１つの冗長処理要素に関連付けられた前記ローカル・メモリ内のメモリ・ロケーションにアクセスすることを可能にするために、ローカル・メモリ・アクセス制御機構を採用することと
を含む、データ処理装置を動作させるための方法。

【請求項18】

処理手段のクラスタであって、前記処理手段が独立処理ワークロードを処理するように構成されるスプリット・モードと、前記処理手段が少なくとも１つの１次処理手段及び少なくとも１つの冗長処理手段を備え、前記１次処理手段によって実行される１次処理ワークロードの正当性を検査するための冗長処理ワークロードを実行するための各冗長処理手段、ロック・モードとを有し、
各処理手段が、複数のメモリ・ロケーションを備える関連付けられたローカル・メモリ手段を有する、処理手段のクラスタと、
前記ロック・モード中に、前記ついに１つの１次処理手段が前記少なくとも１つの冗長処理手段に関連付けられた前記ローカル・メモリ内のメモリ・ロケーションにアクセスすることを可能にするためのローカル・メモリ・アクセス制御手段と
を備える装置。

【発明の詳細な説明】

【技術分野】

【0001】

本技法はデータ処理の分野に関する。

【背景技術】

【0002】

いくつかの分野において、あるレベルの機能安全の保証を与える処理ハードウェアを提供することは重要であり得る。たとえば、これは、車両における制動又はステアリング・システムを制御するためのプロセッサなど、自動車分野で使用するために設計された処理システムに有用であり得る。機能安全を与えるための１つの技法は、エラーを検出するために結果が比較され得るように、冗長処理要素が、１次（（primary）“プライマリ”ともいう）処理要素によって実行されているのと同じ処理ワークロードを複製し得る、ロック・モードを与えることであり得る。

【0003】

処理要素のクラスタ（たとえば中央処理ユニット（ＣＰＵ）のクラスタ）を設計するとき、処理要素がどのように使用されるかについてのフレキシビリティを与えるためにスプリット・ロック構成が採用され得る。次いで、処理要素がそれら自体のタスクを実行することを可能にする、処理要素が真に独立し得るスプリット・モードにおいて、又は冗長処理要素が１次処理要素と同じタスクを実行している上述のロック・モード（ロックステップ・モードと呼ばれることもある）において、クラスタを動作させるべきかどうかに関する決定が（たとえば積分時間において）行われ得る。

【0004】

プロセッサ・クラスタが、スプリット・ロック設計に従って構築され、次いで、ターゲット・アプリケーションに応じて、スプリットのみのクラスタ又はロックステップのみのクラスタのいずれかに変えられる、「１シリコン複数使用（one silicon multiple use）」モデルを有することは、シリコン・プロバイダにとって成長しつつあるトレンドである。これがしばしば該当するのは、個々の処理要素が、たとえばキャッシュ構造又は密結合メモリ（スクラッチパッド・メモリとも呼ばれる）を実装するために、処理要素自体のローカル・ストレージ・リソース（たとえばランダム・アクセス・メモリ（ＲＡＭ：ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）構造）を与えられるような設計である。これらのローカル・ストレージ・リソースは、スプリット・モード（各処理要素がそれ自体のローカル・ストレージ・リソースを単独で使用することができる）で動作しているとき、効率的に利用され得るが、ロック・モードで動作しているとき、１次処理要素及び冗長処理要素は、同じワークロードを実行しており、同じローカル・ストレージ・リソースを共有する。これは、一般に、ロック・モードにあるとき、１次処理要素のローカル・ストレージ・リソースは使用されるが、冗長処理要素のローカル・ストレージ・リソースは使用されないことを意味する。

【発明の概要】

【課題を解決するための手段】

【0005】

少なくともいくつかの実例は、
処理要素が独立処理ワークロードを処理するように構成されるスプリット・モードと、処理要素が、少なくとも１つの１次処理要素及び少なくとも１つの冗長処理要素を備え、各冗長処理要素が、１次処理要素によって実行される１次処理ワークロードの正当性を検査するための冗長処理ワークロードを実行するように構成されるロック・モードとを有し、
各処理要素が、複数のメモリ・ロケーションを備える関連付けられたローカル・メモリを有する、
処理要素のクラスタと、
ロック・モード中に、少なくとも１つの１次処理要素が、少なくとも１つの冗長処理要素に関連付けられたローカル・メモリ内のメモリ・ロケーションにアクセスすることを可能にするように構成されたローカル・メモリ・アクセス制御機構と
を備える装置を提供する。

【0006】

少なくともいくつかの実例は、
処理要素のクラスタを備えるデータ処理装置を動作させるための方法であって、
クラスタをスプリット・モードで動作させるとき、クラスタの処理要素上で独立処理ワークロードを処理することと、
クラスタをロック・モードで動作させるとき、少なくとも１つの１次処理要素及び少なくとも１つの冗長処理要素を備えるように処理要素を構成し、少なくとも１つの１次処理要素上で１次処理ワークロードを実行し、少なくとも１つの冗長処理要素上で、１次処理要素によって実行される１次処理ワークロードの正当性を検査するための冗長処理ワークロードを実行することと、
各処理要素に、複数のメモリ・ロケーションを備える関連付けられたローカル・メモリを与えることと、
ロック・モード中に、ついに１つの１次処理要素が、少なくとも１つの冗長処理要素に関連付けられたローカル・メモリ内のメモリ・ロケーションにアクセスすることを可能にするために、ローカル・メモリ・アクセス制御機構を採用することと
を含む、データ処理装置を動作させるための方法を提供する。

【0007】

他の実例によれば、
処理手段のクラスタであって、処理手段が独立処理ワークロードを処理するように構成されるスプリット・モードと、処理手段が少なくとも１つの１次処理手段及び少なくとも１つの冗長処理手段を備え、１次処理手段によって実行される１次処理ワークロードの正当性を検査するための冗長処理ワークロードを実行するための各冗長処理手段、ロック・モードとを有し、
各処理手段が、複数のメモリ・ロケーションを備える関連付けられたローカル・メモリ手段を有する、処理手段のクラスタと、
ロック・モード中に、ついに１つの１次処理手段が少なくとも１つの冗長処理手段に関連付けられたローカル・メモリ内のメモリ・ロケーションにアクセスすることを可能にするためのローカル・メモリ・アクセス制御手段と
を備える装置が提供される。

【0008】

本技法のさらなる態様、特徴及び利点は、添付の図面とともに読まれるべき、実例の以下の説明から明らかになろう。

【0009】

本技法について、添付の図面に示されているその実例に関して、単に例として、さらに説明する。

【図面の簡単な説明】

【0010】

【図1】例示的な実装形態による、処理クラスタを概略的に示す図である。

【図2A】例示的な実装形態による、スプリット・モードで動作しているときの図１の処理クラスタを概略的に示す図である。

【図2B】例示的な実装形態による、ロック・モードで動作しているときの図１の処理クラスタを概略的に示す図である。

【図3】代替の例示的な実装形態に従って動作する処理クラスタを概略的に示す図である。

【図4A】例示的な実装形態による、スプリット・モードで動作しているときの図３の処理クラスタを概略的に示す図である。

【図4B】例示的な実装形態による、ロック・モードで動作しているときの図３の処理クラスタを概略的に示す図である。

【図5】１つの例示的な実装形態による、処理クラスタがロック・モードで動作しているときに、密結合メモリ（ＴＣＭ）にアクセスするための方法におけるステップを示す流れ図である。

【図6】１つの例示的な実装形態において採用されるチャネルベース・アクセス機構による、処理クラスタがロック・モードで動作しているときに、ＴＣＭにアクセスするための方法におけるステップを示す流れ図である。

【図7】１つの例示的な実装形態による、ＴＣＭアクセス要求のチャネルを決定するための方法におけるステップを示す流れ図である。

【図8】別の例示的な実装形態による、ＴＣＭアクセス要求のチャネルを決定するための方法におけるステップを示す流れ図である。

【発明を実施するための形態】

【0011】

以下でいくつかの具体的な実例について説明する。本発明はこれらの実例に限定されないことが諒解されよう。

【0012】

前に説明したように、いくつかのシステムは、処理要素のクラスタがアプリケーションに応じてスプリット・モード又はロック・モードで動作させられ得る、スプリット・ロック構成を与え得る。スプリット・モードでは、各プロセッサは独立したワークロードを実行するが、ロック・モードでは、プロセッサのうちの１つが１次プロセッサとして働き、少なくとも１つが冗長プロセッサとして働く。ロック・モードでは、両方のプロセッサが、１次プロセッサの演算の正当性を検査するために使用されている冗長プロセッサによって生成される情報（たとえば演算の結果）を用いて、１次処理ワークロードを実行する。

【0013】

クラスタ中の各プロセッサは、関連付けられたローカル・メモリを与えられ得る。１つの例示的な実装形態では、この関連付けられたローカル・メモリは、スクラッチパッド・メモリとも呼ばれる、密結合メモリ（ＴＣＭ）である。ＴＣＭは、一般に、アクセス時間を改善するために関連付けられたプロセッサの近くに与えられ、関連付けられたプロセッサによって発行されたアクセス要求によってアドレス指定可能なメモリ・アドレス空間内のメモリ・ロケーションを与える。それ自体のアドレス空間を有するメモリはゴールデン・メモリと呼ばれることがあり、したがって、ＴＣＭはゴールデン・メモリの一形態であることが理解されよう。ゴールデン・メモリはキャッシュではなく、メイン・メモリ中に保持されるデータのコピーを記憶しないが、代わりに、メイン・メモリにアクセスするときに使用されるアドレスとは別個のメモリ・アドレス空間内のアドレスのそれ自体の領域を割り振られる。スプリット・モードでは、各コアは、それ自体のＴＣＭを利用することが可能である。いくつかのシステムにおいて、ロック・モードで動作しているとき、１次プロセッサと冗長プロセッサの両方は同じワークロードを実行し、そのワークロードは１次プロセッサのメモリ・アドレス空間内で動作する。結果として、１次プロセッサのＴＣＭのみが（任意のメイン・メモリ・リソースに加えて）使用するために利用可能であり、冗長プロセッサのＴＣＭは使用されない。本技術は、ロック・モードのときに１次処理コア及び冗長処理コアに関連付けられた両方のＴＣＭがアクセスされ得る方法を与える。本明細書で与えられる実例はＴＣＭに焦点を当てるが、本明細書で説明する技法は、ローカル・キャッシュなど、他のローカル・ストレージ・デバイスに関連して使用されるように適応され得、したがって、ロック・モードのときに有効なキャッシュ容量を増加させることが可能になる。

【0014】

以下の実例では、ロック・モードで動作している処理クラスタは１次処理要素と冗長処理要素とを含む。しかしながら、本技法は、２つ以上の１次処理要素及び／又は２つ以上の冗長処理要素をもつ処理クラスタに適用され得ることが諒解されよう。

【0015】

本技術の装置は、処理要素が独立処理ワークロードを処理するように構成されたスプリット・モードを有する、処理要素のクラスタを含む。スプリット・モードでは、そうでなければコア又は単にプロセッサと呼ばれることがある処理要素は、異なる命令シーケンスを実行し、それら自体の定義されたメモリ・アドレス空間にアクセスすることができる。それらの個々のメモリ・アドレス空間は、それらのローカルＴＣＭにマッピングする領域を含むことができる。

【0016】

ロック・モードでは、処理要素は、少なくとも１つの１次処理要素及び少なくとも１つの冗長処理要素を備える。各冗長処理要素は、１次処理要素によって実行される１次処理ワークロードの正当性を検査するために冗長処理ワークロードを実行するように構成される。ワークロードに応じて、スプリット・モードで動作するか又はロック・モードで動作するかに関する決定が行われ得る。たとえば、正確さのために処理の速度が犠牲にされ得るとき、エラーの確率を最小にするために、安全重視のワークロードがロック・モードで実行され得る。これらは、たとえば、ハード回路障害、素粒子衝突又は電磁放射によるエラー原因であることがある。反対に、重要でない処理の場合には、エラーが許容され得るスプリット・モードが、ワークロードをより速く処理するために採用され得る。

【0017】

各処理要素は、複数のメモリ・ロケーションを備える関連付けられたローカル・メモリを有し得る。このローカル・メモリは、密結合メモリ（ＴＣＭ）、又は処理要素に対してローカルな任意の他のメモリであり得、たとえば、ランダム・アクセス・メモリ（ＲＡＭ）として構築され得る。

【0018】

本技法によれば、ロック・モード中に、少なくとも１つの１次処理要素が、少なくとも１つの冗長処理要素に関連付けられたローカル・メモリ内のメモリ・ロケーションにアクセスすることを可能にするように構成されたローカル・メモリ・アクセス制御機構が与えられる。すなわち、ロック・モード中に、１次処理要素は、メイン・メモリ・ロケーションと、１次プロセッサのＴＣＭに関連付けられたローカル・メモリ・ロケーションと、冗長プロセッサのＴＣＭに関連付けられたローカル・メモリ・ロケーションとにアクセスする能力を有する。結果として、ロック・モードを実行しているときに、１次処理要素にアクセス可能なアドレス空間内に冗長プロセッサのＴＣＭを組み込むことによって、有効なローカル・メモリ容量が増加させられる。

【0019】

本技法の少なくとも１つの実例では、ロック・モード中に、１次処理ワークロードを実行するときに１次処理要素によって発行されたメモリ・アクセス要求に応答して、メモリへのアクセスが実行される。冗長処理ワークロードを実行するときに冗長処理要素によって発行された対応するメモリ・アクセス要求は、メモリへのアクセスを引き起こすことを防止される。ロック・モードで動作しているとき、冗長プロセッサは、１次プロセッサによって実行される処理が正当であることを検査するために使用される。したがって、メモリ・アクセスが実行されるとき、１次プロセッサからの要求が適切なメモリに伝搬され、アクセスが実行される。これは読取り又は書込みアクセスであり得る。冗長処理要素は、エラーが起こらないとき、冗長処理要素は同じ命令を処理しているので、対応する要求を発行する。この要求は、両方のプロセッサが同じメモリ・ロケーションへの同じ種類のアクセスを試みていることの検査として、１次処理要素からの対応する要求と比較される。冗長プロセッサからの要求は、これは同じメモリ・ロケーションに同時にアクセスするための２つの要求につながるので、メモリに伝搬されない。むしろ、１次プロセッサからの要求は、メモリ・ロケーションへのアクセスを伝搬し、完了することが可能にされ、アクセスの結果は１次プロセッサと冗長プロセッサの両方に伝搬される。ロック・モード中に、冗長処理要素によって発行された対応するメモリ・アクセス要求は、したがって、１次処理ワークロードの正当性を検査するために使用され得る。

【0020】

ロック・モード中、少なくとも１つの冗長処理要素に関連付けられたローカル・メモリのメモリ・ロケーションの少なくともサブセットが、１次処理要素によって使用するための許容できるメモリ・アドレスを識別するメモリ・アドレス空間内に含まれる。すなわち、ロック・モードで動作しているとき、１次処理ワークロードを実行しているときに、１次処理要素に関連付けられたローカル・メモリと冗長処理要素の両方を１次処理要素にアクセス可能にするメモリ・マップが与えられる。

【0021】

少なくともいくつかの実例では、ローカル・メモリ・アクセス制御機構は、クラスタ中の各処理要素に関連付けられたローカル・メモリ・アクセス制御ユニットを備える。制御ユニットは、その処理要素の関連付けられたローカル・メモリへのアクセスを制御する。また、１次処理要素に関連付けられたローカル・メモリ・アクセス制御ユニットの出力を、冗長処理要素に関連付けられたローカル・メモリの入力に結合するために、相互接続信号経路が与えられ得る。これは、ロック・モード中に、１次処理要素に関連付けられたメモリ・アクセス制御ユニットが、少なくとも１つの１次処理要素によって発行されたメモリ・アクセス要求が、冗長処理要素に関連付けられたローカル・メモリ内のメモリ・ロケーションにアクセスすることを求めていることを検出すると、冗長処理要素に関連付けられたローカル・メモリにアクセスするために相互接続信号経路を採用するように構成され得ることを意味する。制御ユニットは、したがって、１次プロセッサによって発行されたアクセス要求を、専用信号経路を介して冗長プロセッサのローカル・メモリにルーティングすることが可能である。

【0022】

ロック・モード中に、１次処理要素によって発行されたメモリ・アクセス要求の結果として生成された結果が、少なくとも１つの１次処理要素と少なくとも１つの冗長処理要素の両方に伝搬される。これにより、メモリ・アクセスの結果が同じになり、冗長プロセッサと１次プロセッサの両方に与えられることが保証される。この結果はさらなる処理動作において使用され得、したがって、冗長プロセッサと１次プロセッサの両方に同じ情報が与えられることが、エラー検査の比較のために重要である。読取り要求の場合、結果は、ローカル・メモリから読み取られた値であり得る。書込み要求の場合、結果は、単に、書込み動作が完了したことの確認であり得る。

【0023】

少なくともいくつかの実例では、１次処理要素は、メモリ・アクセス要求を発行するための１次要求チャネルと２次（（secondary）“セカンダリ”ともいう）要求チャネルとを有する。ロック・モード中に、１次処理要素は、自身の関連付けられたローカル・メモリ内のメモリ・ロケーションへのアクセスが必要とされることを決定したことに応答して、そのメモリ・ロケーションを識別する１次要求チャネル上でメモリ・アクセス要求を発行するように構成される。すなわち、１次処理要素に関連付けられたローカル・メモリにおいてターゲットにされるメモリ要求は、１次要求チャネルを介して発行される。

【0024】

少なくとも１つの１次処理要素はさらに、少なくとも１つの冗長処理要素に関連付けられたローカル・メモリ内のメモリ・ロケーションへのアクセスが必要とされることを決定したことに応答して、そのメモリ・ロケーションを識別する２次要求チャネル上でメモリ・アクセス要求を発行するように構成される。したがって、メモリ・アクセス要求が、冗長処理要素に関連付けられたローカル・メモリをターゲットにしている場合、メモリ・アクセス要求は２次チャネルを介して発行される。

【0025】

処理要素の各々は、例示的な一実装形態では同等に構築され得、したがって、ロック・モードで冗長処理要素として使用される処理要素も１次要求チャネルと２次要求チャネルとを有し得ることに留意されたい。

【0026】

前に述べた相互接続信号経路を採用する実装形態では、次いでロック・モード中に、１次処理要素に関連付けられたローカル・メモリ・アクセス制御ユニットは、２次要求チャネルを介してメモリ・アクセス要求の受信を検出すると、冗長処理要素に関連付けられたローカル・メモリにアクセスするために相互接続信号経路を採用するように構成され得る。これは、アクセスの意図された宛先の明示的決定がローカル・メモリ・アクセス制御ユニットによって行われる必要がなく（その決定は１次処理要素によってすでに行われている）、ローカル・メモリ・アクセス制御ユニットは、要求がそれを介して受信されたチャネルに応じて、要求を宛先ローカル・メモリに正しくルーティングすることが可能であることを意味する。

【0027】

代替実装形態では、処理要素は、アクセス要求をそれらの関連付けられたローカル・メモリ・アクセス制御ユニットに直接発行しないことがある。代わりに、処理クラスタは、クラスタのローカル・メモリに関連付けられた共通アクセス・ポートをさらに備え得、共通アクセス・ポートは、メモリ・アクセス要求をローカル・メモリに伝搬するための１次要求チャネルと２次要求チャネルとを有する。ロック・モード中に、１次処理要素は、１次処理ワークロードを実行するときに共通アクセス・ポートを介してメモリ・アクセス要求を発行するように構成され得る。これは、メモリ・アクセス要求が１次処理要素の関連付けられたローカル・メモリ内のメモリ・ロケーションにアクセスすることを求めていることを決定したことに応答して、共通アクセス・ポートは、１次要求チャネル上でメモリ・アクセス要求を伝搬するように構成されることを意味する。反対に、共通アクセス・ポートは、メモリ・アクセス要求が少なくとも１つの冗長処理要素に関連付けられたローカル・メモリ内のメモリ・ロケーションにアクセスすることを求めていることを決定したことに応答して、２次要求チャネル上でメモリ・アクセス要求を伝搬するように構成される。そのような手法によって、１次処理要素が、どのローカル・メモリがアクセスされることを求めているかを解明する必要がもはやなくなり、代わりに、そのタスクが共通アクセス・ポートに移譲され、したがって１次処理要素の動作の効率が改善され得る。

【0028】

共通アクセス・ポートは、共通アクセス・ポートが、要求がどのローカル・メモリをターゲットにしているかを決定することを可能にする、決定論理及び又はメモリ・マップへのアクセスを有し得る。要求が１次処理要素のローカル・メモリをターゲットにしている場合、要求は１次チャネルを介して適切なローカル・メモリに向けて伝搬される。同様に、要求が冗長処理要素のローカル・メモリをターゲットにしていることが決定された場合、要求は２次要求チャネルを介して伝搬される。１次処理要素がこの決定を行った前の実例と同様に、これは、メモリ・アクセス制御ユニットは、アクセスの宛先に関するアクティブな決定を行う必要がなく、むしろ、それは、要求が受信されるチャネルから推論されることを意味する。

【0029】

上記で説明した共通アクセス・ポートを採用する少なくとも１つの実例では、クラスタは依然として、各処理要素に関連付けられたローカル・メモリ・アクセス制御ユニットと、１次処理要素に関連付けられたローカル・メモリ・アクセス制御ユニットの出力を、冗長処理要素に関連付けられたローカル・メモリの入力に結合する相互接続信号経路とを含む。ロック・モード中に、少なくとも１つの１次処理要素に関連付けられたメモリ・アクセス制御ユニットは、２次要求チャネル上で共通アクセス・ポートを介して発行されたメモリ・アクセス要求の受信を検出すると、少なくとも１つの冗長処理要素に関連付けられたローカル・メモリにアクセスするために相互接続信号経路を採用するように構成され得る。

【0030】

いくつかの実例では、ローカル・メモリの各々は関連付けられたプライベート・アクセス・ポートを有し、各プライベート・アクセス・ポートは、１次要求チャネルと２次要求チャネルの両方に結合される。共通アクセス・ポートは、次いで、１次処理要素のプライベート・アクセス・ポートと冗長処理要素のプライベート・アクセス・ポートの両方に、選択されたチャネル上でメモリ・アクセス要求をブロードキャストするように構成される。このようにして、ローカル・アクセス制御ユニットの両方は、アクセスが冗長処理要素又は１次処理要素に関連付けられたローカル・メモリにおいてターゲットにされるか否かにかかわらず、適切なチャネル上で、プライベート・アクセス・ポートを介して要求を受信する。これは、この例示的な実装形態では、ローカル・アクセス制御ユニットは、それらの関連付けられた処理要素から直接要求を受信していないという事実にもかかわらず、適切な検査が依然として実行され得ることを保証することによって、１次処理ワークロードの正当性を検査することを支援する。

【0031】

例示的な一実装形態では、共通アクセス・ポートは、処理要素のクラスタの外部のデバイスによるローカル・メモリへのアクセスを与えるように構成され得る。したがって、処理クラスタの外側の別のデバイスは、共通アクセス・ポートを介して処理要素に関連付けられたローカル・メモリにアクセスすることが可能であり得る。たとえば、始動中に、関連付けられたプロセッサによる使用のためのＴＣＭの初期状態を定義するために、命令及び／又はデータがそのような外部デバイスによってＴＣＭ中にロードされ得る。データは、この処理中に、メイン・メモリからローカル・メモリに移動され得るが、前に説明したように、ＴＣＭは、メイン・メモリに関連付けられたアドレスとは別個のメモリ・アドレス空間中にそれ自体のアドレス範囲を有するので、データは、その場合、それ自体の別個のアドレス空間中に存在する（すなわち、そのようなデータは、単にメイン・メモリ中のキャッシュされたデータのコピーではなく、代わりにＴＣＭ中にロードされた後は、メイン・メモリ中のデータとはまったく別個に処理される）。

【0032】

各ローカル・メモリは、関連付けられた処理要素により実行するための命令を記憶するために使用され得る。一実例では、したがって、ローカル・メモリは、メイン・メモリ・アドレス空間とは別個のそれ自体のアドレス空間をもつ、命令ＴＣＭの形態を取り得る。そのようなローカル命令メモリの形態は、命令キャッシュも与えられるか否かとは無関係に存在し得、命令キャッシュが与えられる場合、それはローカル命令ＴＣＭに対して別個に与えられる。

【0033】

ローカル・メモリは、代替的に、又は追加的に、命令を実行するときに関連付けられた処理要素によって操作されるデータを記憶するために使用され得る。本発明による、データをローカル・メモリに記憶させることは、データがメイン・メモリに記憶されるデータよりも迅速に容易に取出し可能であることを意味し得る。ローカル・メモリに記憶されるデータは、たとえば、定期的にアクセスされる必要がある値であり得る。したがって、一実例では、ローカル・メモリはデータＴＣＭであり得、上記で説明した命令ＴＣＭと同様に、与えられる任意のデータ・キャッシュに別個の構造として与えられ得る（キャッシュとは異なり、データＴＣＭは、メイン・メモリ中のデータのコピーをキャッシュするのではなく、代わりにメイン・メモリに関連付けられたアドレスの範囲とは別個のメモリ・アドレス空間中にアドレスのそれ自体の範囲を有する）。

【0034】

比較回路は、ロック・モード中に、１次処理要素によって発行されたメモリ・アクセス要求を、１次処理ワークロードの正当性を確立するために冗長処理によって発行された対応するメモリ・アクセス要求と比較するために採用され得る。ロック・モードで動作しているとき、両方の処理要素は、同じタイミングで同じワークロードを処理するように構成され得る。したがって、エラーが発生していないことを検査するために、生成されたメモリ・アクセス要求を含む、２つの処理要素の出力間で比較が行われる。これは、１次処理要素によって発行されたメモリ・アクセス要求のタイプ（読取り／書込み）及びターゲット・アドレスが、冗長処理要素によって発行された対応する要求と同じであることを検査するために与えられる、簡単な比較器を含むことができる。

【0035】

比較回路が、１次処理要素によって発行されたメモリ・アクセス要求と冗長処理要素によって発行された対応するメモリ要求との間の不整合を検出したとき、比較回路は、エラー信号を発行するように構成され得る。エラー信号は、たとえばアクセスの発生を防ぐために、すぐにアサートされ得るか、又は、代わりに、エラーのログを形成するために使用され得るが、１次処理要素によって発行された要求に従って、メモリ要求が伝搬することを可能にされ、メモリ・アクセスが完了する。

【0036】

次に、図を参照しながら特定の実例について説明する。

【0037】

図１は、例示的な一実装形態による処理クラスタの実例を概略的に示す。処理クラスタ１は、コア０２００とコア０’ ４００とを含む処理コアを含む。各コア２００、４００は、処理要素２０１、４０１（処理パイプラインとも呼ばれる）と、ＴＣＭラッパー２１０、４１０の内側の関連付けられた密結合メモリ（ＴＣＭ）２１２、４１２とを含む。処理パイプライン２０１、４０１は、直接ＴＣＭラッパー２１０、４１０にＴＣＭ２１２、４１２にアクセスするための要求を発行し得る。ＴＣＭコントローラ２１１、４１１は、次いで、処理パイプライン２０１、４０１からの要求のパフォーマンスを管理する。通信の２つのチャネル（本明細書ではｐ（１次）チャネル及びｒ（冗長）チャネルと呼ぶことがある）が、図に示されているように、それらの構成要素間の各方向の矢印のペアによって示されるように、処理パイプラインと関連付けられたＴＣＭラッパーとの間に与えられる。

【0038】

以下の説明では、コア０’ ４００を、コア０’ ４００がコア０から独立したワークロードを処理しているときにスプリット・モードで動作しているときにコア１と呼ぶこともある。ロック・モードで動作しているときは、コア０’ ４００を、冗長ワークロードを処理しているときにコア０’と呼ぶことがあり、それはコア０の別のインスタンスと考えられ得る。

【0039】

図２Ａは、例示的な一実装形態による、スプリット・モードで動作しているときの図１の処理クラスタを概略的に示す。点線は、スプリット・モードで使用されない機能を示す。スプリット・モードでは、処理パイプライン２０１、４０１の各々は、それら自体の処理ワークロードを単独で実行するように動作することができ、対応するＴＣＭラッパー２１０、４１０にＴＣＭアクセス要求を発行し得、これは、要求がＰチャネルを介して発行されることを示す実線の下向き矢印によって図に示されている。適切なＴＣＭコントローラ２１１、４１１は、次いで、Ｒｅｑ－Ｐチャネルを介して要求を同じコアのＴＣＭ２１２、４１２に伝搬する。アクセスはＴＣＭ２１２、４１２において完了され、結果は、Ｒｅｓｐ－応答チャネルによって示されるように、ＴＣＭコントローラ２１１、４１１に伝搬される。この応答は、次いで、各ＴＣＭラッパー２１０、４１０と関連付けられたパイプライン２０１、４０１との間の実線の上向き矢印によって示されているように、ＴＣＭコントローラ２１１、４１１から処理パイプライン２０１、４０１に伝搬される。この方式では、コア２００、４００間の相互接続経路は使用されないことに留意されたい。コア０’ ４００のマルチプレクサ４１４及び４１６は、スプリット・モード中に１次チャネル上で受信された要求（及び対応する応答）をコア０’ ４００のＴＣＭ４１２（及びＴＣＭコントローラ４１１）にルーティングする。ロック・モードでは、冗長チャネル上で受信された要求（及び応答）はコア０’ ４００のＴＣＭ４１２（及びＴＣＭコントローラ４１１）にルーティングされる。

【0040】

図２Ｂは、例示的な一実装形態による、ロック・モードで動作しているときの図１の処理クラスタを概略的に示す。処理パイプライン２０１をもつコア２００と処理パイプライン４０１をもつ４００の両方は、ロック・モードで動作しているときに同じワークロードを処理し、コア０２００は１次コアとして働き、コア０’ ４００は冗長コアとして働く。処理パイプライン２０１、４０１によって発行された要求は、それのターゲット・アドレスがコア０２００のＴＣＭ２１２であるかコア０’ ４００のＴＣＭ４１２であるかに応じて、チャネルを介して伝搬される。したがって、２つのチャネルがパイプライン２０１、４０１からＴＣＭラッパー２１０、４１０への下向き矢印として示されている。要求は、次いで、コア０２００のＴＣＭ２１２をターゲットにする要求のためのＲｅｑ－Ｐチャネル上のＴＣＭコントローラ２１１と、コア０’ ４００のＴＣＭ４１２をターゲットにする要求のためのＲｅｑ－Ｒチャネル上のＴＣＭコントローラ４１１とから伝搬される。

【0041】

Ｒｅｑ－Ｐチャネル上のコア０２００のＴＣＭコントローラ２１１から発行された要求は、比較器３００によって、Ｒｅｑ－Ｐチャネル上のコア０’ ４１１のＴＣＭコントローラからの対応する要求と比較される。しかしながら、コア０’からの要求はそれ以上伝搬されない。代わりに、コア０２００のＴＣＭコントローラ２１１からの要求が、（それがＲｅｑ－Ｐチャネル上にあると仮定して）コア０２００のＴＣＭ２１２に伝搬される。要求に対する応答は、ＴＣＭ２１２からＴＣＭコントローラ２１１、４１１の両方に送られ、そこでＰチャネル入力において受信される。コントローラは、次いで、この場合も、応答がコア０２００のＴＣＭ２１２から来たことを示すためにｐチャネルを利用して、その結果を各自のパイプライン２０１、４０１に転送して戻す。

【0042】

Ｒｅｑ－Ｒチャネル上でコア０２００のＴＣＭコントローラ２１１から発行された要求は、比較器３１０によって、コア０’ ４００のＴＣＭコントローラ４１１からの対応する要求と比較される。コア０２００からの要求は、２つのコアの間を通る相互接続信号経路３０５を組み込んだＲｅｑ－Ｒチャネルを介してコア０’ ４００（冗長コア）のＴＣＭ４１２に伝搬され、アクセスはＴＣＭ４１２において完了する。応答は、コア０２００のＴＣＭコントローラ２１１とコア０’ ４００のＴＣＭコントローラ４１１とに伝搬され、そこでｒ－チャネル入力において受信される。結果は、次いで、この場合も、コア０’ ４００のＴＣＭ４１２から応答が来たことを示すためにｒチャネルを利用して、ＴＣＭラッパー２１０、４１０から各自のパイプライン２０１、４０１に転送されて戻される。

【0043】

ロック・モード中に、冗長処理パイプライン４０１によって発行された要求がターゲットＴＣＭ２１２、４１２に伝搬することが可能にされないことは、図及びそれの説明から明らかである。代わりに、それらは、１次処理パイプライン２０１によって発行された要求と比較するために使用される。結果は、両方のパイプライン２０１、４０１に同じ結果が与えられることを保証するように、両方のコア２００、４００に伝搬される。

【0044】

この構成では、処理パイプラインは、メイン・メモリのためのアドレス範囲だけでなく、各ＴＣＭのための別個のアドレス範囲をも含むメモリ・マップを有することが諒解されよう。各処理パイプラインは、次いで、アクセス要求を生成するときに、ＴＣＭがアクセスされているかどうかを、したがって、要求が、関連付けられたＴＣＭラッパーに発行されるべきであるかどうかを決定することができる。さらに、各処理パイプラインは、どのＴＣＭがターゲット・メモリ・アドレスを含んでいるかを決定すること、したがって、どのチャネル上で要求を出力するか（すなわち、ターゲットにされているＴＣＭに対応するチャネル）を決定することができる。

【0045】

図３は、アクセス要求がＴＣＭへのアクセスである場合でも、各パイプラインは、システム相互接続を介してアクセス要求を発行するように構成される（図１、図２Ａ及び図２Ｂの例示的な実装形態では、パイプラインは、アクセスがメイン・メモリへのアクセスであった場合は、それのみを行ない得、前に説明したように、アクセスがＴＣＭアクセスであった場合は、要求をそれのローカルＴＣＭラッパーに直接ルーティングする）、代替の例示的な実装形態による処理クラスタ・システムの実例を概略的に示す。処理クラスタ１は、上記の図１に関して説明した要素と同様の要素を含んでいる。さらに、共有されたスレーブ・ポート２、４に要求をルーティングすることができるシステム相互接続３が与えられる。共有されたスレーブ・ポート４は、ロック・モードのとき、共有されたスレーブ・ポート２によって実行される演算の検査を可能にするための冗長のために与えられる。共有されたスレーブ・ポート２から、要求がプライベート・スレーブ・ポート２２０を介してコア０２００に伝搬され、プライベート・スレーブ・ポート４２０を介してコア０’に伝搬され得る。

【0046】

図４Ａは、例示的な実装形態による、スプリット・モードで動作しているときの図３の処理クラスタ・システムを概略的に示す。処理パイプライン２０１、４０１は、スプリット・モードで動作しているとき、独立したワークロードを処理する。メイン・メモリとＴＣＭ２１２、４１２の両方へのアクセスは処理パイプラインによってシステム相互接続３に発行される。システム相互接続３は、要求のターゲット・アドレスがメイン・メモリ中にあるか、ＴＣＭ２１２、４１２のうちの１つにあるかを決定することが可能である。ＴＣＭにアクセスするための要求は、ＴＣＭ２１２４１２のうちのどちらがターゲットにされているかを決定することが可能である、共有されたスレーブ・ポート２にルーティングされる。コア０２００のＴＣＭ２１２のための要求は、Ｒｅｑ－Ｐチャネルを介して、コア０２００に関連付けられたプライベート・スレーブ・ポート２２０にルーティングされ、ＴＣＭコントローラ２１１は、次いで、前に図２Ａで説明したのと同様に、ＴＣＭ２１２へのアクセスを制御し、この要求からの結果はＰチャネルを介してＴＣＭラッパー２１０からパイプライン２０１に伝搬される。

【0047】

コア０’ ４００に関連付けられたＴＣＭ４１２をターゲットにした要求は、共有されたスレーブ・ポート２によって、Ｒｅｑ－Ｐ－コア１チャネルを介して、コア０’ ４００に関連付けられたプライベート・スレーブ・ポート４２０にルーティングされる。スレーブ・ポート４２０は、要求をＴＣＭラッパー４１０に転送し、そこで要求はサービスされ、結果がパイプライン４０１に伝搬されて戻され、ＴＣＭラッパー４１０は前に図２Ａで説明したように動作する。したがって、図２Ａの実例のように、各処理パイプライン２０１、４０１は、それのそれぞれのＴＣＭ２１２、４１２にアクセスすることができる。

【0048】

図４Ｂは、例示的な実装形態による、ロック・モードで動作しているときの図３の処理クラスタ・システムを概略的に示す。ロック・モードでは、コア０２００は１次プロセッサとして働き、コア０’ ４００は冗長プロセッサとして働く。コア０’ ４００の冗長パイプライン４０１からの要求はシステム相互接続３に発行されず、代わりに、それらは、不一致の場合にエラーがシグナリングされ得るように、比較器３２０によってコア０２００の１次処理パイプライン２０１からの対応する要求と比較される。１次処理パイプライン２０１からのこの要求は、要求がメイン・メモリをターゲットにしているのか、ＴＣＭをターゲットにしているのかを決定することが可能である、システム相互接続３によって受信される。後者が当てはまる場合、要求は、共有されたスレーブ・ポート２と共有されたスレーブ・ポート４の両方に伝搬される。これらの共有されたスレーブ・ポートは、要求がＴＣＭのうちのどれをターゲットにしているかを単独で決定し、適切なチャネル上で要求を送る。ＴＣＭ２１２のための要求は、共有されたスレーブ・ポート２、４の各々からＲｅｑ－Ｐチャネルによって伝搬される。これらは、不一致の場合にエラーがシグナリングされ得るように、比較器３３０によって比較され、共有されたスレーブ・ポート２からの要求は、Ｐチャネルを介して、コア２００のスレーブ・ポート２２０とコア４００のスレーブ・ポート４２０の両方に伝搬される。要求は、次いで、Ｐチャネルを介して、ＴＣＭコントローラ２１１、４１１に伝搬され、そこでそれらは、次いで、図２Ｂを参照しながら上記で説明したのと同様に処理される。

【0049】

同様に、ＴＣＭ４１２のための要求は、スレーブ・ポート２、４の各々からＲｅｑ－Ｒチャネルを介して伝搬される。共有されたスレーブ・ポート’４からの要求は、比較器３４０によって、共有されたスレーブ・ポート２からの要求と比較され、スレーブ共有されたスレーブ・ポート２からの要求は、ｒ－チャネル上でプライベート・スレーブ・ポート２２０とプライベート・スレーブ・ポート４２０の両方に伝搬される。要求は、次いで、ｒ－チャネルを介して、ＴＣＭコントローラ２１１、４１１に伝搬され、そこでそれらは、次いで、図２Ｂを参照しながら上記で説明したのと同様に処理される。

【0050】

両方の共有されたスレーブ・ポート２、４を使用するプロセス、及び比較器３３０、３４０を使用した比較は、どのＴＣＭがアクセスされているかに関する決定が正しく実行されたことと、各スレーブ・ポート２、４によって生成された要求コンテンツが同等であることとを保証する。前の例示的な実装形態と同様に、冗長プロセッサの要求は、１次処理ワークロードの正当性を決定するために使用され、ＴＣＭ自体には伝搬されない。

【0051】

図２Ｂを参照しながら説明した手法ではなく、図４Ｂを参照しながら説明したような手法を使用することによって、どのＴＣＭがアクセスされているのかをパイプラインが解明する必要がもはやなくなり、代わりに、そのタスクは、共有されたスレーブ・ポート２、４（本明細書で共通アクセス・ポートとも呼ぶ）に移譲され、したがってパイプラインの動作の効率が改善され得る。

【0052】

図５は、１つの例示的な実装形態による、処理クラスタをロック・モードで動作しているときにＴＣＭにアクセスするための方法におけるステップを示す流れ図を示す。ステップＳ１０１において、メモリ・アクセスはＴＣＭコントローラによって受信され、次いで、ステップＳ１０２において、メモリ・アクセス要求がどのＴＣＭをターゲットにしているのかに関する決定が行われる。ＴＣＭはステップＳ１０３においてアクセスされるが、メモリ要求が冗長プロセッサから来た場合、それは、メモリ・アクセスを実際に実行しているときに使用される１次プロセッサからの対応する要求であり得る。次いで、メモリ・アクセスの結果がステップＳ１０４において受信され、これは、たとえば、読取り要求、又は書込み要求が行われたことの確認によってアクセスされる値であり得る。ステップＳ１０５において、結果は１次パイプラインと冗長処理パイプラインの両方に伝搬される。

【0053】

図６は、前に説明した別個のチャネルを利用する１つの特定の例示的な実装形態による、処理クラスタがロック・モードで動作しているときにＴＣＭにアクセスするための方法におけるステップを示す流れ図を示す。ステップＳ２０１において、メモリ要求は２つのチャネルのうちの１つで受信される。ステップＳ２０２において、要求が２つのチャネルのうちのどちらの上で受信されたかに関する決定が行われる。Ｐチャネル上で受信された場合、アクセスは１次プロセッサのＴＣＭをターゲットにしていると決定され、このＴＣＭはステップＳ２０３ａにおいてアクセスされる。要求がＲチャネル上で受信された場合、アクセスは冗長プロセッサに関連付けられたＴＣＭをターゲットにしていると決定され、このＴＣＭはステップＳ２０３ｂにおいてアクセスされる。どちらの場合にも、ステップＳ２０４においてメモリ・アクセスの結果が受信され、Ｓ２０５において１次プロセッサと冗長プロセッサとに伝搬される。

【0054】

図７は、決定が処理パイプラインによって行われる１つの例示的な実装形態による、ＴＣＭアクセス要求のチャネルを決定するための方法におけるステップを示す流れ図を示す。ステップＳ３０１において、処理パイプラインは、メモリ・アクセスを含む命令を実行する。ステップＳ３０２において、これはがＴＣＭアクセスであるか否かが決定される。それがＴＣＭアクセスでない場合、ステップＳ３０３において、ターゲットがメイン・メモリ中にあることが仮定され、要求は通常のメイン・メモリ・アクセス・プロトコルの通りに進行することが可能になる。ステップＳ３０２において、それがＴＣＭアクセスであると決定された場合、ステップＳ３０４において、要求のアドレスが１次ＴＣＭに関連付けられているかどうかに関する別の決定が行われる。アドレスが１次ＴＣＭに関連付けられている場合、ステップＳ３０５において、要求はＰチャネルを介して発行され、メモリ・アクセスは図５又は図６のうちの１つについて説明した方法の通りに継続する。ステップＳ３０４において、アドレスが１次ＴＣＭに関連付けられていない場合、それはステップＳ３０６において冗長ＴＣＭに関連付けられていると仮定される。要求は、次いで、ステップＳ３０７において、Ｒチャネルを介して発行され、プロセスは、この場合も前に説明した方法のうちの１つに進む。

【0055】

図８は、別の例示的な実装形態による、ＴＣＭのチャネルを決定するための方法におけるステップを示す流れ図を示し、決定は共有されたスレーブ・ポートによって行われる。ステップＳ４１０において、処理パイプラインは、ステップＳ４０２においてシステム相互接続によって受信されるメモリ・アクセス要求を発行する。システム相互接続は、ステップＳ４０３において、要求がＴＣＭアクセスであるかどうかを決定する。要求がＴＣＭ要求でない場合、要求はステップＳ４０４において「通常の」メイン・メモリ要求として処理される。要求がＴＣＭ要求である場合、ステップＳ４０５において、要求は共有されたスレーブ・ポートに伝搬される。ステップＳ４０６において、共有されたスレーブ・ポートは、要求が１次コアのＴＣＭに関連付けられたアドレスをターゲットにしているかどうかを決定する。要求が１次コアのＴＣＭに関連付けられたアドレスをターゲットにしている場合、ステップＳ４０７において、要求は、Ｐチャネル上の冗長コアと１次コアの両方のプライベート・スレーブ・ポートに発行され、方法は、次いで、図５及び図６において説明した例示的な実装形態のうちの１つに進む。ステップＳ４０６において、アドレス空間が１次ＴＣＭに関連付けられていないと決定された場合、ステップＳ４０８において、アドレス空間は冗長ＴＣＭに関連付けられていると仮定される。ステップＳ４０９において、要求は、したがって、プライベート・スレーブ・ポートを介してＲチャネルの１次コアと冗長コアの両方に伝搬され、方法は、次いで、図５及び図６において説明した例示的な実装形態のうちの１つに進む。

【0056】

本明細書で説明する技法を使用することによって、処理クラスタのスプリット・ロック構成が採用され得るが、ロック・モードで冗長コアとして使用されるコアのローカル・メモリ・リソースが使用されなくなることはない。したがって、設計の効率が改善され得る。特に、ロック・モードのとき、一般にロック・モードでは利用不可能であろうメモリ・リソースの使用を促進することによって、設計にさらなるメモリを加えることなしに、ローカル・メモリの容量が著しく増加し得る。

【0057】

本出願では、「～に構成された」という単語は、装置の要素が、定義された動作を実行することが可能な構成を有することを意味するために使用される。このコンテキストにおいて、「構成」は、ハードウェア又はソフトウェアの相互接続の配置又は様式を意味する。たとえば、装置は、定義された動作を与える専用のハードウェアを有し得るか、又はプロセッサ若しくは他の処理デバイスが機能を実行するようにプログラムされ得る。「～に構成された」は、定義された動作を与えるために装置要素が何らかの方法で変更される必要があることを暗示しない。

【0058】

添付の図面を参照しながら、本明細書で本発明の例示的な実装形態について詳細に説明したが、本発明は、それらの正確な例示的な実装形態に限定されないこと、並びに様々な変更及び改変が、添付の特許請求の範囲によって定義されているように、本発明の範囲及び趣旨から逸脱することなく、当業者によってその中で実施され得ることを理解されたい。

【図1】