(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-19
(45)【発行日】2024-03-28
(54)【発明の名称】システムオンチップ上の相互接続ファブリック内でソースベースルーティングを実施するための手順
(51)【国際特許分類】
G06F 13/362 20060101AFI20240321BHJP
G06F 13/12 20060101ALI20240321BHJP
【FI】
G06F13/362
G06F13/12 310Z
(21)【出願番号】P 2020552300
(86)(22)【出願日】2019-03-19
(86)【国際出願番号】 US2019023001
(87)【国際公開番号】W WO2019190827
(87)【国際公開日】2019-10-03
【審査請求日】2021-12-23
(32)【優先日】2018-03-30
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-02-04
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】502208397
【氏名又は名称】グーグル エルエルシー
【氏名又は名称原語表記】Google LLC
【住所又は居所原語表記】1600 Amphitheatre Parkway 94043 Mountain View, CA U.S.A.
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】デサイ・シャイレンドラ
(72)【発明者】
【氏名】ピアース・マーク
(72)【発明者】
【氏名】ジェイン・アミト
(72)【発明者】
【氏名】バット・ルトゥル
(72)【発明者】
【氏名】トッテ・ロバート
(72)【発明者】
【氏名】シエラ・ジュアン
(72)【発明者】
【氏名】ガイクワド・パリマル
【審査官】田名網 忠雄
(56)【参考文献】
【文献】国際公開第2010/137572(WO,A1)
【文献】米国特許出願公開第2013/0083794(US,A1)
【文献】米国特許出願公開第2017/0289064(US,A1)
【文献】特開2014-209764(JP,A)
【文献】国際公開第2010/022767(WO,A1)
【文献】特開2007-115252(JP,A)
【文献】特表2017-502421(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 13/20-13/378
G06F 13/10-14
(57)【特許請求の範囲】
【請求項1】
システムオンチップ(SoC)であって、
相互接続ファブリックと、
前記相互接続ファブリックによって相互接続されている複数のIPエージェントであって、前記IPエージェントの間で前記相互接続ファブリックを介して伝送されるトランザクショントラフィックの送信元および宛先になるよう構成されている、複数のIPエージェントと、
を備え、
第1IPエージェントは、前記SoC上の前記複数のIPエージェントの中の1以上の宛先IPエージェントを特定するソースベースルーティング(SBR)トランザクションを生成して送信するよう構成されており、
前記相互接続ファブリックは、前記SoC上の前記複数のIPエージェントの中の前記1以上の宛先IPエージェントへ前記相互接続ファブリックを介して前記SBRトランザクションをどのようにルーティングして配信するかについてルーティング決定を行うよう構成され
、
前記SBRトランザクションは、アドレスを前記トランザクションのヘッダ内に提供することによって、前記1以上の宛先IPエージェントを特定し、前記アドレスは、前記SoC上の2以上の宛先IPエージェントを識別するために、前記相互接続ファブリックによって解決される、SoC。
【請求項2】
システムオンチップ(SoC)であって、
相互接続ファブリックと、
前記相互接続ファブリックによって相互接続されている複数のIPエージェントであって、前記IPエージェントの間で前記相互接続ファブリックを介して伝送されるトランザクショントラフィックの送信元および宛先になるよう構成されている、複数のIPエージェントと、
を備え、
第1IPエージェントは、前記SoC上の前記複数のIPエージェントの中の1以上の宛先IPエージェントを特定するソースベースルーティング(SBR)トランザクションを生成して送信するよう構成されており、
前記相互接続ファブリックは、前記SoC上の前記複数のIPエージェントの中の前記1以上の宛先IPエージェントへ前記相互接続ファブリックを介して前記SBRトランザクションをどのようにルーティングして配信するかについてルーティング決定を行うよう構成され
、
前記相互接続ファブリックは、前記相互接続ファブリックの2つのノードの間で共有相互接続を介して前記SBRトランザクションの1つのインスタンス化を統合して送信することによって、前記相互接続ファブリックを介して送信されるトランザクショントラフィックを削減するように、前記ルーティング決定を行うよう構成されており、前記共有相互接続は、配信パスに沿って2以上の宛先IPエージェントに至る、SoC。
【請求項3】
システムオンチップ(SoC)であって、
相互接続ファブリックと、
前記相互接続ファブリックによって相互接続されている複数のIPエージェントであって、前記IPエージェントの間で前記相互接続ファブリックを介して伝送されるトランザクショントラフィックの送信元および宛先になるよう構成されている、複数のIPエージェントと、
を備え、
第1IPエージェントは、前記SoC上の前記複数のIPエージェントの中の1以上の宛先IPエージェントを特定するソースベースルーティング(SBR)トランザクションを生成して送信するよう構成されており、
前記相互接続ファブリックは、前記SoC上の前記複数のIPエージェントの中の前記1以上の宛先IPエージェントへ前記相互接続ファブリックを介して前記SBRトランザクションをどのようにルーティングして配信するかについてルーティング決定を行うよう構成され
、
前記相互接続ファブリックは、前記SBRトランザクションに応答して生成された複数の受信済みの応答トランザクションを統合して、前記相互接続ファブリックのノードの間で共有相互接続を介して前記応答トランザクションの1つのインスタンス化を転送することによって、前記相互接続ファブリックを介して送信されるトランザクショントラフィックを削減するように、前記ルーティング決定を行うよう構成されており、前記共有相互接続は、応答配信パスに沿って前記応答トランザクションの目標に至る、SoC。
【請求項4】
システムオンチップ(SoC)であって、
相互接続ファブリックと、
前記相互接続ファブリックによって相互接続されている複数のIPエージェントであって、前記IPエージェントの間で前記相互接続ファブリックを介して伝送されるトランザクショントラフィックの送信元および宛先になるよう構成されている、複数のIPエージェントと、
を備え、
第1IPエージェントは、前記SoC上の前記複数のIPエージェントの中の1以上の宛先IPエージェントを特定するソースベースルーティング(SBR)トランザクションを生成して送信するよう構成されており、
前記相互接続ファブリックは、前記SoC上の前記複数のIPエージェントの中の前記1以上の宛先IPエージェントへ前記相互接続ファブリックを介して前記SBRトランザクションをどのようにルーティングして配信するかについてルーティング決定を行うよう構成され
、
前記相互接続ファブリックは、さらに、共有相互接続に関連付けられている複数のストリーム上で複数のトランザクションの伝送をインターリーブするように、前記ルーティング決定を行うよう構成されており、(a)前記複数のストリームの各々は、仮想チャネルおよびトランザクションタイプの一意的な組み合わせによって規定され、(b)同じトランザクションの1以上の部分が、同じストリームを介して伝送される、SoC。
【請求項5】
システムオンチップ(SoC)であって、
相互接続ファブリックと、
前記相互接続ファブリックによって相互接続されている複数のIPエージェントであって、前記IPエージェントの間で前記相互接続ファブリックを介して伝送されるトランザクショントラフィックの送信元および宛先になるよう構成されている、複数のIPエージェントと、
を備え、
第1IPエージェントは、前記SoC上の前記複数のIPエージェントの中の1以上の宛先IPエージェントを特定するソースベースルーティング(SBR)トランザクションを生成して送信するよう構成されており、
前記相互接続ファブリックは、前記SoC上の前記複数のIPエージェントの中の前記1以上の宛先IPエージェントへ前記相互接続ファブリックを介して前記SBRトランザクションをどのようにルーティングして配信するかについてルーティング決定を行うよう構成され
、
前記相互接続ファブリックは、さらに、共有相互接続に関連付けられている複数のストリームの中の同じストリームを介して2以上の独立したトランザクションをルーティングするように、前記ルーティング決定を行うよう構成されており、前記複数のストリームの各々は、仮想チャネルおよびトランザクションタイプの一意的な組み合わせによって規定される、SoC。
【請求項6】
システムオンチップ(SoC)であって、
相互接続ファブリックと、
前記相互接続ファブリックによって相互接続されている複数のIPエージェントであって、前記IPエージェントの間で前記相互接続ファブリックを介して伝送されるトランザクショントラフィックの送信元および宛先になるよう構成されている、複数のIPエージェントと、
を備え、
第1IPエージェントは、前記SoC上の前記複数のIPエージェントの中の1以上の宛先IPエージェントを特定するソースベースルーティング(SBR)トランザクションを生成して送信するよう構成されており、
前記相互接続ファブリックは、前記SoC上の前記複数のIPエージェントの中の前記1以上の宛先IPエージェントへ前記相互接続ファブリックを介して前記SBRトランザクションをどのようにルーティングして配信するかについてルーティング決定を行うよう構成され
、
前記相互接続ファブリックは、共通の論理識別子を共有する重複物理リソースを備え、前記ルーティング決定は、(a)前記重複物理リソースの1つを選択すること、(b)前記重複物理リソースの前記選択された1つを用いて前記トランザクションをルーティングすること、とを含む、SoC。
【請求項7】
請求項
6に記載のSoCであって、前記ルーティング決定は、
(a)前記重複物理リソースの利用可能性、
(b)前記重複物理リソースの間の相対的な混在状態、
(c)前記重複物理リソースの間の負荷バランシング、
(d)前記重複物理リソースの間のランダム選択、
(e)前記重複物理リソースの間の最長時間未使用選択、
(f)前記重複物理リソースの間の相対的な電力消費、
(g)前記重複物理リソースの間で選択を行うためのハッシュ関数の利用、または、
(h)(a)~(g)の任意の組み合わせ、の内の1つに基づく、SoC。
【請求項8】
システムオンチップ(SoC)であって、
相互接続ファブリックと、
前記相互接続ファブリックによって相互接続されている複数のIPエージェントであって、前記IPエージェントの間で前記相互接続ファブリックを介して伝送されるトランザクショントラフィックの送信元および宛先になるよう構成されている、複数のIPエージェントと、
を備え、
第1IPエージェントは、前記SoC上の前記複数のIPエージェントの中の1以上の宛先IPエージェントを特定するソースベースルーティング(SBR)トランザクションを生成して送信するよう構成されており、
前記相互接続ファブリックは、前記SoC上の前記複数のIPエージェントの中の前記1以上の宛先IPエージェントへ前記相互接続ファブリックを介して前記SBRトランザクションをどのようにルーティングして配信するかについてルーティング決定を行うよう構成され
、
前記相互接続ファブリックは、さらに、2以上の独立したトランザクションを同じストリームを介してル-ティングするように、前記ルーティング決定を行うよう構成されており、前記2以上の独立したトランザクションは各々、前記2以上の独立したトランザクションが前記同じストリームを介してルーティングされうるように、前記2以上の独立したトランザクションの各々のビートを前記相互接続ファブリックが追跡することを可能にする一意的なトランザクション識別子を割り当てられる、SoC。
【請求項9】
請求項
8に記載のSoCであって、前記同じストリームを介してルーティングされた前記2以上の独立したトランザクションは、前記同じストリームを指定する共通の制御情報を共有するが、前記2以上の独立したトランザクションの各々の前記トランザクション識別子は一意的である、SoC。
【請求項10】
請求項1
から9のいずれか一項に記載のSoCであって、前記SBRトランザクションは、前記SoC上の前記1以上の宛先IPエージェントを論理的に識別する識別子を前記トランザクションのヘッダ内に提供することによって、前記1以上の宛先IPエージェントを特定する、SoC。
【請求項11】
請求項1
から10のいずれか一項に記載のSoCであって、前記SBRトランザクションは、一意的なコードを前記トランザクションのヘッダ内に提供することによって、前記1以上の宛先IPエージェントを特定し、前記一意的なコードは、前記SoC上の前記1以上の宛先IPエージェントを識別するために、前記相互接続ファブリック内で解決される、SoC。
【請求項12】
請求項1から
11のいずれか一項に記載のSoCであって、前記相互接続ファブリックは、複数のノードを備え、前記複数のノードの各々は、前記SBRトランザクション内で指定された1以上のアドレスを前記1以上の宛先IPエージェントの1以上の論理識別子に解決するためのルックアップテーブルを備える、SoC。
【請求項13】
請求項1から
12のいずれか一項に記載のSoCであって、前記相互接続ファブリックは、複数のノードを備え、前記複数のノードの各々は、前記1以上の宛先IPエージェントの論理識別子を、前記トランザクションをルーティングするために用いられる1以上のポート識別子に変換するためのテーブルを備える、SoC。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本願は、2018年3月30日出願の米国仮特許出願第62/650,589 (PRTIP001P)号および2019年2月4日出願の米国仮出願第62/800,897 (PRT1P003P)号に基づく優先権を主張する。これら優先権主張基礎出願の各々は、すべての目的のためにその全体が参照によって本明細書に組み込まれる。
【0002】
本願は、共有リソースへのアクセスをアービトレートすることに関し、特に、複数のトランザクションの部分の間でアービトレートして、クロックサイクルごとに相互接続に関連付けられている複数の仮想チャネルの1つを介して勝利部分を送信することに関する。
【背景技術】
【0003】
システムオンチップ(「SoC」)は、複数のサブシステムを備える集積回路であり、しばしば、知的財産(「IP」)エージェントまたはコアと呼ばれる。IPエージェントは、典型的には、特定の機能を実装または実行するように設計された回路の「再利用可能な」ブロックである。SoCの開発者は、典型的には、複数のIPエージェントが互いに通信するように、チップ上にそれらのIPエージェントをレイアウトして相互接続する。IPエージェントを用いることにより、複雑なSoCを開発する時間およびコストを大幅に削減できる。
【0004】
SoCの開発者が直面する課題の1つは、様々なIPエージェントが相互に動作するように、それらをチップ上で相互接続することである。この問題に対処するために、半導体業界では、相互接続規格を適応させてきた。
【0005】
1つのかかる規格は、英国ケンブリッジにあるARM社によって開発および普及されたアドバンスト・マイクロコントローラ・バス・アーキテクチャ(AMBA)である。AMBAは、SoC上の機能IPエージェントの接続および管理のために幅広く利用されているバス相互接続規格である。
【0006】
AMBAでは、トランザクションが、要求を定義し、別個の応答トランザクションを要求する。書き込みトランザクションでは、送信元が、リモート宛先にデータを書き込むことを要求する。書き込み動作が実行されると、宛先は、確認応答トランザクションを送信元に送り返す。書き込み動作は、応答トランザクションが送信元によって受信された時にのみ完了したと見なされる。読み出しトランザクションでは、送信元が、リモートロケーションを読み出すためにアクセスを要求する。読み出しトランザクションは、応答トランザクション(すなわち、アクセスされたコンテンツ)が送信元に返された時にのみ完了する。
【0007】
AMBAでは、アービトレーション処理が、複数の競合トランザクションの間の相互接続バスへのアクセスを許可するために用いられる。所与のアービトレーションサイクル中に、競合トランザクションの1つが、勝者として選択される。次いで、相互接続バスは、勝利トランザクションのデータ部の持続期間にわたって制御される。次のアービトレーションサイクルは、現在のトランザクションのためのデータすべてが完了した後にのみ開始する。この処理は、相互接続へのアクセスを巡って競合する複数の未処理のトランザクションがあるという条件で、連続的に繰り返される。
【0008】
AMBA規格の1つの問題は、待ち時間である。バス相互接続は、トランザクションごとにアービトレートされる。トランザクションの任意の部分の間に、トランザクションが読み出し、書き込み、または、応答のいずれであるかに関わらず、バスは、トランザクション全体に対して制御される。トランザクションが開始すると、中断できない。例えば、トランザクションのデータ部が4サイクル長である場合、別のトランザクションがバスへアクセスできる前に、すべての4サイクルが完了する必要がある。結果として、(1)トランザクションは、クロックサイクルごとにはアービトレートできず、(2)すべての非勝利競合トランザクションは、現在のトランザクションのデータ部が完了するまで待機する必要がある。これらの要因の両方が、相互接続の効率およびSoCの全体パフォーマンスを下げる傾向がある。
【発明の概要】
【0009】
システムオンチップすなわちSoC上の複数のサブシステムの間で共有相互接続へのアクセスをアービトレートするためのアービトレーションシステムおよび方法が開示されている。アービトレーションシステムおよび方法は、クロックサイクルごとに、(1)複数のサブシステムによって生成された複数のトランザクションの部分の間でアービトレートし、(2)複数のトランザクションの部分の中から勝利部分を選択し、(3)相互接続に関連付けられている複数の仮想チャネルの1つを介して勝利部分を伝送するよう構成されているアービトレーション要素を備える。
【0010】
(1)~(3)を繰り返し実行することにより、複数の勝利部分が、それぞれ、複数のクロックサイクルにわたってインターリーブされて複数の仮想チャネルを介して伝送される。クロックサイクルごとに複数の仮想チャネルを介して複数のトランザクション部分のアービトレーションを行うことで、待ち時間の削減、ならびに、相互接続の効率および利用率の上昇など、多くの利点が得られる。これらの属性により、本明細書に開示されたアービトレーションシステムおよび方法は、システムオンチップ(SoC)上での相互接続へのアクセスをアービトレートするのに非常に適切になる。
【図面の簡単な説明】
【0011】
本願およびその利点については、添付の図面に関連して行う以下の説明を参照することによって最も良く理解できる。
【0012】
【
図1】非排他的実施形態に従って、システムオンチップ(SoC)のための共有相互接続を示すブロック図。
【0013】
【
図2】非排他的実施形態に従って、トランザクションのパケットの例を示す図。
【0014】
【
図3A】第1非排他的実施形態に従って、アービトレーション要素を示す論理図。
【0015】
【
図3B】第2非排他的実施形態に従って、アービトレーション要素を示す論理図。
【0016】
【
図4】非排他的実施形態に従って、共有相互接続の仮想チャネルを介してトランザクションの部分をアービトレーションして送信するための動作工程を示すフローチャート。
【0017】
【
図5】非排他的実施形態に従って、共有相互接続の仮想チャネルを介して異なるトランザクションの部分の伝送をインターリーブする第1例を示す図。
【0018】
【
図6】非排他的実施形態に従って、共有相互接続の仮想チャネルを介して異なるトランザクションの部分の伝送をインターリーブする第2例を示す図。
【0019】
【
図7】本発明の別の非排他的実施形態に従って、二方向にトラフィックを扱うための2つの共有相互接続を示すブロック図。
【0020】
【
図8】本発明の非排他的実施形態に従って、SoCの相互接続ファブリックの例を示すブロック図。
【0021】
【
図9A】本発明の非排他的実施形態に従って、物理アドレスおよびソースベースルーティング(SBR)アドレスの両方を1以上のIPポートに解決するために用いられるルックアップテーブル(LUT)を示す図。
【0022】
【
図9B】本発明の非排他的実施形態に従って、利用できるハッシュ関数を示す図。
【0023】
【
図10A】本発明の非排他的実施形態に従って、SoCの相互接続ファブリックを介して送信されるトランザクションの拡大および統合を示す図。
【
図10B】本発明の非排他的実施形態に従って、SoCの相互接続ファブリックを介して送信されるトランザクションの拡大および統合を示す図。
【0024】
【
図11A】本発明の非排他的実施形態に従って、トランキングリンクと、トランキングリンクの中からの物理リンクの選択とを示す図。
【
図11B】本発明の非排他的実施形態に従って、トランキングリンクと、トランキングリンクの中からの物理リンクの選択とを示す図。
【0025】
図面において、同様の構造要素を指定するために、同様の符号が用いられることがある。また、図中の描写は、図式的なものであり、必ずしも縮尺通りではないことを理解されたい。
【発明を実施するための形態】
【0026】
以下では、添付図面に例示された、いくつかの非排他的な実施形態を参照しつつ、本願の詳細な説明を行う。以下の説明では、本開示の完全な理解を促すために、数多くの具体的な詳細事項が示されている。しかしながら、当業者にとって明らかなように、本開示は、これらの具体的な詳細事項の一部または全てがなくとも実施することが可能である。また、本開示が不必要に不明瞭となるのを避けるため、周知の処理工程および/または構造については、詳細な説明を省略した。
【0027】
現在開発中の集積回路の多くは、非常に複雑である。結果として、多くのチップ設計者は、システムオンチップすなわち「SoC」アプローチを用いて、単一のシリコン上に複数のサブシステムまたはIPエージェントを相互接続してきた。消費者デバイス(例えば、ハンドヘルド、携帯電話、タブレットコンピュータ、ラップトップおよびデスクトップコンピュータ、メデイア処理など)、仮想または拡張現実(例えば、ロボット工学、自律走行車、航空機など)、医療機器(例えば、イメージングなど)、工業、ホームオートメーション、工業(例えば、スマート家電、家庭用監視機器、など)およびデータセンター用途(例えば、ネットワークスイッチ、接続型ストレージデバイス、など)など、様々な用途のためのSoCが、現在利用可能であるかまたは開発されている。
【0028】
本願は、共有リソースへのアクセスをアービトレートするためのアービトレーションシステムおよび方法をおおむね対象にしている。かかる共有リソースは、例えば、バス相互接続、メモリリソース、処理リソース、または、複数の競争パーティの間で共有されたほぼ任意のその他のリソースでありうる。説明の便宜上、以下で詳述する共有リソースは、システムオンチップすなわち「SoC」上の複数のサブシステムによって共有される相互接続であるとする。
【0029】
SoCでは、後に詳述するように、トランザクションの形態で互いにトラフィックをやり取りする複数のサブシステムがあり、共有リソースは、物理的な相互接続であり、様々なトランザクションまたはその部分が、共有相互接続に関連する複数の仮想チャネルを介して伝送され、複数の異なるアービトレーションスキームおよび/または優先度の1つが、サブファンクションの間のトランザクションの伝送に向けた共有相互接続へのアクセスをアービトレートするために用いられてよい。
【0030】
トランザクションクラス
SoCに用いられる上述の共有相互接続内には、Posted(P)、Non-posted(NP)、および、Completion(C)を含む少なくとも3つのタイプまたはクラスのトランザクションが存在する。各々の簡単な定義を以下の表1に提供する。
【表1】
【0031】
Postedトランザクション(書き込みなど)は、応答トランザクションを求めない。送信元がデータを指定された宛先に書き込むと、トランザクションが終了する。Non-postedトランザクション(読み出しまたは書き出しのいずれかなど)では、応答が求められる。しかしながら、応答は、別個のCompletionトランザクションとして分岐される。換言すると、読み出しでは、最初のトランザクションが読み出し動作のために用いられ、別個であるが関連するCompletionトランザクションが読み出しコンテンツを返すために用いられる。Non-posted書き込みでは、最初のトランザクションが書き込みのために用いられ、一方、書き込みが完了すると、第2関連Completionトランザクションが確認のために求められる。
【0032】
トランザクションは、タイプに関わらず、1以上のパケットによって表すことができる。いくつかの状況では、トランザクションは、単一のパケットによって表されうる。別の状況においては、複数のパケットが、トランザクション全体を表すために必要とされうる。
【0033】
ビートは、クロックサイクルあたりに共有相互接続を介して伝送できるデータの量である。例えば、共有相互接続が物理的に128ビット幅である場合、128ビットが、各ビートまたはクロックサイクルに伝送されうる。
【0034】
いくつかの状況において、トランザクションは、伝送のために複数の部分に分割される必要がありうる。512ビット(64バイト)であるペイロードを有する単一のパケットを有するトランザクションを考える。共有相互接続が128ビット幅(16バイト)のみである場合、トランザクションは、4つの部分(例えば、4×128=512)に分割され、4つのクロックサイクルまたはビートで伝送される必要がある。一方、トランザクションが128ビット幅未満である単一パケットのみである場合、トランザクション全体が、1つのクロックサイクルまたはビートで送信されうる。同じトランザクションがさらなるパケットをたまたま含む場合、さらなるクロックサイクルまたはビートが必要とされうる。
【0035】
したがって、トランザクションの「部分」という用語は、所与のクロックサイクルまたはビート中に共有相互接続を介して転送できるデータの量である。部分のサイズは、共有相互接続の物理的な幅に応じて変わりうる。例えば、共有相互接続が物理的に64データビット幅である場合、任意の1サイクルまたはビート中に転送できる最大ビット数は64ビットである。所与のトランザクションが64ビット以下のペイロードを有する場合、トランザクション全体が、単一部分で共有相互接続を介して送信されうる。一方、ペイロードがより大きい場合、パケットは、複数の部分で共有相互接続を介して送信されなければならない。128、256、または、512ビットのペイロードを有するトランザクションは、それぞれ、2、4、および、8の部分を必要とする。このように、「部分」という用語は、任意の所与のクロックサイクルまたはビート中に共有相互接続を介して送信されうるトランザクションの一部または全体のいずれかを意味すると広く解釈されるべきである。
【0036】
ストリーム
ストリームは、仮想チャネルおよびトランザクションクラスのペアリングとして定義される。例えば、4つの仮想チャネル(例えば、VC0、VC1、VC2、および、VC3)、ならびに、3つのトランザクションクラス(P、NP、C)があった場合、最大で12の異なる可能なストリームがある。仮想チャネルおよびトランザクションクラスの様々な組み合わせを、以下の表2で詳述する。
【表2】
【0037】
上述したトランザクションクラスの数は、単に例示であり、限定として解釈すべきではないことに注意されたい。逆に、任意の数の仮想チャネルおよび/またはトランザクションクラスが用いられてよい。
【0038】
共有相互接続の仮想チャネルでのアービトレーション
図1を参照すると、アービトレーションシステム10のブロック図が示されている。非排他的実施形態において、アービトレーションシステムは、アップストリームサブファンクション14(すなわち、IP4、IP5、および、IP6)へトランザクションを送信しようと試みる複数のサブファンクション14(すなわち、IP1、IP2、および、IP3)による共有相互接続12へのアクセスをアービトレートするために用いられる。
【0039】
共有相互接続12は、Nデータビット幅でありM個の制御ビットを含む物理的な相互接続である。また、共有相互接続12は一方向性であり、これは、送信元(すなわち、IP1、IP2、および、IP3)から宛先(すなわち、IP4、IP5、および、IP6)への方向にのみトラフィックを扱うことを意味する。
【0040】
様々な代替例において、Nデータビットの数は、任意の整数であってよいが、典型的には、それぞれ、2のべき乗のビット幅である(例えば、21、22、23、24、25、26、27、28、29など)または(2、4、6、8、16、32、64、128、256など)。最も現実的な応用例では、Nビットの数は、32、64、128、256、または、512のいずれかである。ただし、これらの幅は、単に例示であり、どのようにも限定するものとして解釈すべきではないことを理解されたい。
【0041】
制御ビットの数Mも、様々であり、任意の数であってよい。
【0042】
1以上の論理チャネル(図示せず)(以降、「仮想チャネル」すなわち「VC」と呼ぶ)が、共有相互接続12に関連付けられている。各仮想チャネルは、独立している。各仮想チャネルは、複数の独立ストリームに関連付けられてよい。仮想チャネルの数は、広く変化してよい。例えば、32以上の数までの仮想チャネルが、規定されるか、または、共有相互接続12に関連付けられてよい。
【0043】
様々な代替実施形態において、各仮想チャネルは、異なる優先度を割り当てられてよい。1以上の仮想チャネルに、より高い優先度が割り当てられてよく、一方、1以上のその他の仮想チャネルに、より低い優先度が割り当てられてよい。高い優先度のチャネルは、低い優先度の仮想チャネルよりも高い共有相互接続12へのアクセス権を与えられるまたはアービトレートされる。別の実施形態では、仮想チャネルの各々に、同じ優先度が与えられてもよく、その場合、共有相互接続12へのアクセス権を与えるまたはアービトレートする時に、或る仮想チャネルを別の仮想チャネルより優先することがない。さらに別の実施形態において、仮想チャネルの内の1以上に割り当てられた優先度は、動的に変化してもよい。例えば、第1セットの状況において、仮想チャネルすべてに、同じ優先度が割り当てられてよいが、第2セットの状況において、特定の仮想チャネルに、その他の仮想チャネルよりも高い優先度が割り当てられてもよい。したがって、状況が変化するにつれて、仮想チャネルの間で用いられる優先度スキームは、現在の動作条件に最もよく合うように変更されうる。
【0044】
サブシステム14の各々は、典型的には、「再利用可能な」回路またはロジックのブロックであり、一般に、IPコアまたはエージェントと呼ばれる。ほとんどのIPエージェントは、特定の機能を実行するよう設計され、例えば、イーサネットポート、ディスプレイドライバ、SDRAMインターフェース、USBポートなどの周辺デバイスのためのコントローラである。かかるIPエージェントは、一般に、特定用途向け集積回路(ASIC)またはフィールドプログラマブルゲートアレイ(FPGA)などの集積回路(IC)上に提供された複雑なシステムの設計全体の中で必要なサブシステム機能を提供する「ビルディングブロック(構成要素)」として用いられる。利用可能なIPエージェントのライブラリを用いることにより、チップ設計者は、より複雑な集積回路の設計において様々なロジック機能を容易に「ボルト締め」することができるので、設計時間を削減すると共に開発コストを節約することができる。サブシステムエージェント14は、専用IPコアに関して上述したが、これは、必要条件ではないことを理解されたい。逆に、サブシステム14は、単一のポート20に接続されたまたはそれを共有するIP機能のコレクションであってもよい。したがって、「エージェント」という用語は、サブシステムが単一の機能を実行するか、複数の機能を実行するかに関わらず、ポート20に接続された任意のタイプのサブシステムとして広く解釈されるべきである。
【0045】
一対のスイッチ16および18が、それぞれ、専用アクセスポート20を介してサブシステムエージェント14の各々と共有相互接続12との間のアクセスを提供する。図の例示的実施形態では、
(1)サブシステムエージェントIP1、IP2、および、IP3は、それぞれ、アクセスPort0、Port1、および、Port2を介してスイッチ16と接続する。
(2)サブシステムエージェントIP4、IP5、および、IP6は、それぞれ、Port3、Port4、および、Port5を介してスイッチ18と接続する。
(3)さらに、アクセスポート22が、相互接続12を介して、全体としてスイッチ16へのサブシステムエージェントIP4、IP5、および、IP6のアクセスを提供する。
【0046】
スイッチ16および18は、多重化および逆多重化機能を実行する。スイッチ16は、サブシステムエージェントIP1、IP2、および/または、IP3によって生成されたアップストリームトラフィックを選択し、共有相互接続12を介してトラフィックをダウンストリームに送信する。スイッチ18では、逆多重化動作が実行され、トラフィックは、目標サブシステムエージェント(すなわち、IP4、IP5、または、IP6のいずれか)へ提供される。
【0047】
各アクセスポート20は、一意ポート識別子(ID)を有しており、各サブシステムエージェント14の専用アクセスをスイッチ16または18のいずれかへ提供する。例えば、サブシステムエージェントIP1、IP2、および、IP3は、それぞれ、アクセスポートPort0、Port1、および、Port2に割り当てられる。同様に、サブシステムエージェントIP4、IP5、および、IP6は、それぞれ、アクセスポートPort3、Port4、および、Port5に割り当てられる。
【0048】
スイッチ16、18への/からの入口ポイントおよび出口ポイントを提供するのに加えて、一意ポートID20は、サブシステムエージェント14の間のトラフィックをアドレッシングするために用いられる。各ポート20は、システムメモリ24内に、特定の量の割り当てられたアドレス可能空間を有する。
【0049】
いくつかの非排他的な実施形態において、アクセスポート20の全部または一部に、一意ポートIDだけでなく、「グローバル」ポート識別子が割り当てられてもよい。トランザクションおよびその他のトラフィックが、グローバルポート識別子に割り当てられたアクセスポートの全部または一部に送信されうる。したがって、グローバル識別子を用いれば、トランザクションおよびその他のトラフィックが、アクセスポート20の全部または一部へ広く発信またはブロードキャストすることができ、一意識別子を用いて各アクセスポート20へ個別にアドレッシングする必要性を排除できる。
【0050】
スイッチ16は、さらに、アービトレーション要素26、アドレス解決ロジック(ARL)28、および、アドレス解決ルックアップテーブル(LUT)30を備える。
【0051】
動作中、サブシステムエージェントIP1、IP2、および、IP3は、トランザクションを生成する。各トランザクションが生成されると、送信側サブシステム14によってパケット化され、次いで、パケット化されたトランザクションは、対応するポート20を介してローカルスイッチ16へ投入される。例えば、IP1、IP2、および、IP3によって生成されたトランザクションの部分は、それぞれ、Port0、Port1、および、Port2を介してスイッチ16に提供される。
【0052】
ポート20は各々、相互接続チャネル12に関連付けられている仮想チャネルの各々に対して、複数の先入れ先出しバッファ(図示せず)を備える。非排他的実施形態において、4つの仮想チャネルが存在する。その場合、各仮想チャネルに対して1つで、各ポート20は、4つのバッファを備える。再び、ポート20に含まれる仮想チャネルおよびバッファの数は、様々であってよく、4に限定されないことを理解されたい。逆に、仮想チャネルおよびバッファの数は、4より多くても少なくてもよい。
【0053】
所与のトランザクションが2つ(以上)の部分で表される場合、それらの部分は、同じバッファ内に維持される。例えば、相互接続12が128データビット幅であり、トランザクションが512ビットのペイロードを含むパケットによって表される場合、トランザクションは、4クロックサイクルまたはビートで伝送される4つの部分に分割される必要がある。一方、トランザクションが64ビットのペイロードを有する単一パケットによって表されうる場合、単一の部分は、1クロックサイクルまたはビートで伝送されうる。所与のトランザクションのすべての部分を同じバッファ内に維持することにより、仮想チャネルは、論理的に独立したままになる。換言すると、所与のトランザクションに関連するトラフィックすべてが、常に、ストリームと同じ仮想チャネルで送信され、複数の仮想チャネルを介して分岐されることがない。
【0054】
アービトレーション要素26は、様々なアクセスポート20によって維持されたトランザクションの競合するバッファされた部分の間でアービトレートすることを担う。非排他的実施形態において、複数の競合トランザクションが利用可能であれば、アービトレーション要素26は、クロックサイクルごとにアービトレーションを実行する。サイクルごとのアービトレーション勝者は、相互接続12へのアクセスが認められて相互接続12を介して伝送されるトランザクションの部分を、サブシステムIP1、IP2、および、IP3の内の1つから生成する。
【0055】
トランザクションを生成する時、送信元サブシステムIP1、IP2、および、IP3は、通常、可能な宛先サブシステムエージェントIP4、IP5、および、IP6についてアドレス空間内のアドレスを知っているが、宛先にトランザクションをルーティングするために必要な情報(例えば、ポートID20および/または22)を知らない。一実施形態において、ローカルアドレス解決ロジック(ARL)28は、既知の宛先アドレスを必要なルーティング情報に解決するために用いられる。換言すると、送信元サブエージェント14は、システムメモリ24内の所与のアドレスにアクセスしたいことを単に知りうる。したがって、ARL28は、LUT30へアクセスするタスクを課せられ、指定されたアドレスに対応する最終的な宛先への配信パスに沿ってポート20/22のアドレスルックアップを実行する。ポート20/22が知られると、この情報は、トランザクションのパケット内の宛先フィールドに挿入される。結果として、パケットは、配信パスに沿ってポート20/22へ配信される。原則として、要求された配信情報がすでに知られており、パケットの宛先フィールドに含まれているので、配信パスに沿ったダウンストリームノードが、さらなるルックアップを実行する必要はない。後に詳述するようにソースベースルーティング(SBR)と呼ばれる他のタイプのトランザクションで、送信元Pエージェントは、宛先ポートアドレスを知る。結果として、ARL28によって実行されるルックアップは、典型的には、実行される必要がない。
【0056】
代替実施形態において、相互接続内のすべてのノードがARL28およびLUT30を必要とするわけではない。これらの要素を持たないノードについては、必要なルーティング情報のないトランザクションが、デフォルトノードへ転送されうる。デフォルトノードでは、ARL28およびLUT30がアクセスされ、次いで、必要なルーティング情報が、トランザクションのパケットのヘッダに挿入されうる。デフォルトノードは、典型的には、ARL28およびLUT30を持たないノードよりアップストリームにある。ただし、これは、決して必須ではない。1または複数のデフォルトノードは、SoC上のどこに配置されてもよい。ARL28およびLUT30をいくつかのノードから排除することにより、ノードの複雑さを低減できる。
【0057】
ARL28は、トランザクションの勝利部分のための転送先のデコードに加えて、各仮想チャネル内のトランザクションの勝利部分のための順序を規定するので、「順序付けポイント」と呼ばれてもよい。各アービトレーションが解決されると、ARL28がアドレスポートルックアップを実行するために用いられるか否かに関わらず、トランザクションの勝利部分が各仮想チャネルに提供される先入れ先出しキューに挿入される。次いで、トランザクションの勝利部分は、バッファ内で相互接続12を介した伝送の順番を待つ。
【0058】
また、ARL28は、「アップストリーム」および「ダウンストリーム」トラフィックを規定するために用いられる。換言すると、スイッチ16に関連付けられているIPエージェント14(すなわち、IP1、IP2、および、IP3)によって生成された任意のトランザクションは、ARL28に対してアップストリームにあると見なされる。ARL28後の(すなわち、IP4、IP5、および、IP6に伝送される)すべてのトランザクションが、ダウンストリームトラフィックと見なされる。
【0059】
スイッチ16に関連付けられているIPエージェント14(すなわち、IP1、IP2、および、IP3)は、直接的または間接的のいずれかで、互いに通信してトランザクションを互いに送信してよい。直接的な通信(しばしば、ソースベースルーティング(SBR)と呼ばれる)により、IPエージェント14は、ピアツーピアモデルで互いにトランザクションを送信できる。このモデルでは、送信元IPエージェトは、そのピアIPエージェント14の一意ポートIDが知っており、LUT30にアクセスするためにARL28を用いる必要性を無くす。あるいは、スイッチ16に関連付けられているIPエージェントの間のトランザクションは、ARL28を用いてルーティングされてもよい。このモデルでは、上述したのと同様に、送信元IPエージェントは、宛先IPエージェント14のアドレスのみを知り、ルーティングに必要な情報は知らない。次いで、ARL28は、LUT30にアクセスし、対応するポートIDを見つけるために用いられ、その後、ポートIDは、トランザクションのパケットの宛先フィールドに挿入される。
【0060】
パケットフォーマット
IPエージェント14は、トランザクションを生成して、相互接続12に関連付けられている仮想チャネルを通じて処理する。各トランザクションは、典型的には、1以上のパケットで構成される。各パケットは、典型的には、固定ヘッダサイズおよびフォーマットを有する。いくつかの例において、各パケットは、固定サイズペイロードを有してよい。別の例において、パケットペイロードは、大から小まで様々なサイズであってよく、または、ペイロードが全く無くてもよい。
【0061】
図2を参照すると、パケットの例32が示されている。パケット32は、ヘッダ34およびペイロード36を備える。この特定の実施形態において、ヘッダ34は、16バイトのサイズである。このサイズは例示であり、より大きいサイズ(例えば、より多いバイト数)または小さいサイズ(例えば、より少ないバイト数)のパケットが用いられてもよいことを理解されたい。パケット32のヘッダ34は、必ずしもすべてが同じサイズである必要がないことも理解されたい。代替実施形態において、SoCにおけるパケットヘッダのサイズは、可変であってもよい。
【0062】
ヘッダ34は、宛先識別子(DST_ID)、送信元識別子(SRC_ID)、ペイロードサイズインジケータ(PLD_SZ)、予備フィールド(RSVD)、コマンドフィールド(CMD)、TAGフィールド、ステータス(STS)、トランザクションIDフィールド(TAG)、アドレスすなわちADDRフィールド、USDR/コンパクトペイロードフィールド、トランザクションクラスすなわちTCフィールド、フォーマットFMTフィールド、および、バイトイネーブル(BE)フィールドなど、複数のフィールドを含む。ヘッダ34の様々なフィールドについて、以下の表3で簡単に説明する。
【表3】
【0063】
ペイロード36は、パケットのコンテンツを含む。ペイロードのサイズは、様々であってよい。いくつかの例において、ペイロードは大きくてよい。その他の例において、ペイロードは小さくてもよい。さらに別の例において、コンテンツが非常に小さいすなわち「コンパクト」である場合、ヘッダ34のUSRDフィールド内で運ぶことができる。
【0064】
トランザクションのタイプは、しばしば、トランザクションを表すために用いられる1以上のパケットがペイロードを持つか否かを示す。例えば、PostedまたはNon-posted読み出しのどちらでも、パケットは、アクセスされるロケーションアドレスを指定するが、典型的には、ペイロードを持たない。しかしながら、関連するCompletionトランザクションのパケットは、読み出しコンテンツを含むペイロードを含む。PostedおよびNon-posted書き込みトランザクションの両方で、パケットは、宛先に書き込まれるデータを含むペイロードを含む。Non-postedバージョンの書き込みでは、Completionトランザクションのパケットは、通常、ペイロードを定義しない。しかしながら、一部の状況では、Completionトランザクションが、ペイロードを規定する。
【0065】
パケットの例および上述の説明は、パケットに含まれうる基本的なフィールドの多くを網羅している。さらなるフィールドが削除または追加されてもよいことを理解されたい。例えば、送信元および宛先がプライベートメッセージを共有できるように、プライベートシグナリングフィールドが用いられてもよい。
【0066】
アービトレーション
図3Aを参照すると、ペリフェラルコンポーネントインターコネクト(PCI)順位付けでアービトレーション要素26によって実行されるアービトレーションロジックを示す論理図が示されている。
【0067】
PCI順位付けでは、各ポート20は、各仮想チャネルおよびトランザクションクラス(P、NP、および、C)の組み合わせのための別個のバッファを備える。例えば、4つの仮想チャネル(VC0、VC01、VC2、および、VC3)がある場合、Port0、Port1、および、Port2は各々、12の先入れ先出しバッファを有する。換言すると、各ポート20について、バッファが、各トランザクションクラス(P、NP、および、C)ならびに仮想チャネル(VC0、VC1、VC2、および、VC30)の組み合わせに対して提供される。
【0068】
各IPエージェント14(例えば、IP1、IP2、および、IP3)がトランザクションを生成すると、結果として得られるパケットが、それぞれ、対応するポート(例えば、ポート0、ポート1、および、ポート2)内で、トランザクションタイプに基づいて、適切なバッファに配置される。例えば、IP1によって生成されたPosted(P)、Non-posted(NP)、および、Completion(C)トランザクションが、それぞれ、ポート0内で、割り当てられた仮想チャネルのためのPosted、Non-posted、および、Completionバッファに配置される。IP2およびIP3によって生成されたトランザクションは、同様の方法でポート1およびポート2内で、割り当てられた仮想チャネルのためのPosted、Non-posted、および、Completionバッファに同様に配置される。
【0069】
所与のトランザクションが複数のパケットによって表される場合、そのトランザクションのパケットすべてが、同じバッファ内に挿入される。結果として、トランザクションのパケットすべてが、最終的に同じ仮想チャネルを介して伝送される。このポリシーでは、仮想チャネルは独立したままであり、これは、同じトランザクションに関連する複数のパケットの伝送には、異なる仮想チャネルが用いられないことを意味する。
【0070】
各ポート20内で、多くの異なる方法で所与の仮想チャネルにパケットを割り当てることができる。例えば、割り当ては、無作為であってよい。あるいは、割り当ては、各仮想チャネルに対する作業負荷と未処理のトラフィックの量とに基づいてもよい。或るチャネルが非常にビジーであり、その他のチャネルがビジーではない場合、ポート20は、しばしば、負荷のバランスを取ろうと試み、新たに生成されたトランザクショントラフィックを利用率の低い仮想チャネルに割り当てる。結果として、ルーティング効率が改善される。さらに別の代替例において、トランザクショントラフィックは、緊急性、セキュリティ、または、それら両方の組み合わせに基づいて、特定の仮想チャネルに割り当てられてもよい。特定の仮想チャネルが、他の仮想チャネルよりも高い優先度および/またはセキュリティを与えられた場合、高い優先度および/または安全なトラフィックが、より高い優先度の仮想チャネルに割り当てられる。さらに別の実施形態において、ポート20は、ハードコードされてもよく、これは、ポート20が、1つだけの仮想チャネルを有し、ポート20によって生成されたすべてのトラフィックが、その1つの仮想チャネルを介して伝送されることを意味する。
【0071】
さらに別の実施形態において、仮想チャネルの割り当ては、送信元IPエージェント14によって、単独で、または、それに対応するポート20と連携して、実施されてもよい。例えば、送信元IPエージェント14が、対応するポート20への制御信号を生成して、所与のトランザクションのパケットが特定の仮想チャネルに割り当てられることを要求することができる。IPエージェント14も、上述のように、無作為である、ハードコードされる、または、すべての仮想チャネルにわたってバランスの取れた利用、セキュリティ、緊急性などに基づいた割り当て決定をなすことができる。
【0072】
アービトレーション勝者の選択において、アービトレーション要素26は、サイクルごとに複数のアービトレーション工程を実行する。これらのアービトレーション工程は、以下を含む。
(1)ポートを選択する工程、
(2)仮想チャネルを選択する工程、および
(3)トランザクションクラスを選択する工程。
【0073】
上述の順序(1)、(2)、および、(3)は、固定ではない。逆に、上述の3つの工程は、任意の順序で完了されてよい。どの順序が用いられるかに関わらず、単一のアービトレーション勝者が各サイクルで選択される。次いで、勝利トランザクションは、相互接続12に関連付けられている対応する仮想チャネルを介して伝送される。
【0074】
アービトレーション要素26によって実行される各アービトレーション(1)、(2)、および、(3)のために、複数のアービトレーションスキームまたはルールセットが用いられてよい。かかるアービトレーションスキームは、厳密または絶対優先度、4つの仮想チャネルの各々が特定の割合のトランザクショントラフックを割り当てられる重み付き優先度、もしくは、トランザクションが所定の順序で仮想チャネルに割り当てられるラウンドロビンスキーム、を含みうる。さらなる実施形態において、その他の優先度スキームが用いられてもよい。また、アービトレーション要素26は、異なるアービトレーションスキームの間で時々動的に切り替えを行ってもよい、および/または、(1)、(2)、および、(3)アービトレーションの各々に対して同じまたは異なるアービトレーションスキームをそれぞれ用いてもよいことを理解されたい。
【0075】
任意選択的な実施形態において、所与のアービトレーションサイクル中に考慮された未処理のトランザクションによって定義された宛先ポート20の利用可能性が考慮される。宛先ポート20に内のバッファが、所与のトランザクションを処理するために利用可能なリソースを持たない場合、対応する仮想チャネルは利用可能ではない。結果として、当該トランザクションは、アービトレーションで競合せず、むしろ、目標リソースが利用可能になる後続のアービトレーションサイクルまで待機する。一方、目標リソースが利用可能である場合、対応するトランザクションは、アービトレートされ、相互接続12へのアクセスのために競合する。
【0076】
宛先ポート20の利用可能性は、上述した複数のアービトレーション工程(1)、(2)、および、(3)に関して、異なる時にチェックされてよい。例えば、利用可能性チェックは、アービトレーションサイクルの前に(すなわち、工程(1)、(2)、および、(3)のいずれかの完了の前に)実行できる。結果として、利用可能な宛先リソースを規定するトランザクションのみが、後続のアービトレーション中に考慮される。あるいは、アービトレーションチェックは、アービトレーション工程が実行される順序に関わらず、3つのアービトレーション工程(1)、(2)、および、(3)のいずれかの間に実行されてもよい。
【0077】
アービトレーション処理中の早くまたは遅くに、宛先リソース利用可能性チェックを実行することには利点および不利点がある。早くチェックを実行することにより、トランザクションの競合の可能性のある部分は、それらの宛先が利用可能でない場合に競合から潜在的に排除されうる。しかしながら、利用可能性を早く知ることは、システムリソースへのかなりの量のオーバーヘッドを生み出しうる。結果として、状況に応じて、所与のアービトレーションサイクル中に利用可能性チェックをより遅く実行するのが、より実際的でありうる。
【0078】
トランザクションクラスの選択を含むアービトレーション工程に対して、複数のルールが、N、NP、および、Cトランザクションの競合部分の間でアービトレートするために規定される。これらのルールは、以下を含む。
Posted(P)トランザクションに対して、
-Postedトランザクション部分は、別のPostedトランザクション部分を追い越しえない。
-Postedトランザクション部分は、デッドロックを避けるためにNon-postedトランザクション部分を追い越すことができなければならない。
-Postedトランザクション部分は、両方が強順序(strong order)モードにある場合には、Completionを追い越すことができなければならない。換言すると、強モードでは、トランザクションは、ルールに従って厳密に実行される必要があり、ルールは緩めることができない。
-Posted要求は、任意のトランザクション部分がそれの緩和順序(Relaxed Order:RO)ビットセットを有する場合には、Completionを追い越すことを許されるが、追い越しは必須ではない。緩和順序では、一般にルールが守られるが、例外が認められうる。
Non-posted(NP)トランザクションに対して、
-Non-postedトランザクション部分は、Postedトランザクション部分を追い越してはならない。
-Non-postedトランザクション部分は、別のNon-postedトランザクション部分を追い越してはならない。
-Non-postedトランザクション部分は、両方が強順序モードにある場合には、Completionを追い越してはならない。
-Non-postedトランザクション部分は、任意のトランザクション部分がそれのROビットセットを有する場合には、Completionを追い越すことを許されるが、必須でない。
Completion(C)トランザクションに対して、
-Completionは、両方が強順序モードにある場合には、Postedトランザクション部分を追い越してはならない。
-Completionは、任意のトランザクション部分がそれのROビットセットを有する場合には、Postedトランザクション部分を追い越すことを許可されるが、必須ではない。
-Completionは、両方が強順序モードにある場合には、Non-postedトランザクション部分を追い越してはならない。
-Completionは、任意のトランザクション部分がそれのROビットセットを有する場合には、Non-postedトランザクション部分を追い越すことを許可されるが、必須ではない。
-Completionは、別のCompletionを追い越すことを許可されない。
【0079】
以下の表4は、PCI順序付けルールの概要を提供する。(a)および(b)の選択肢のないボックスでは、厳密順序付けルールが従われる必要はない。(a)および(b)の選択肢を有する表のボックスでは、ROビットがリセットされるか設定されるかに依存して、それぞれ、厳密順序(a)ルールまたは緩和順序(b)ルールのいずれかが適用されてよい。様々な代替実施形態において、ROビットは、グローバルに、または、パケットレベルで個々に、設定または再設定されうる。
【表4】
【0080】
アービトレーション要素26は、特定の順序なしに、それぞれ、競合ポート20、仮想チャネル、および、トランザクションクラスのアービトレーションを実行することによって、最終的な勝利トランザクション部分を選択する。サイクルあたりの勝利部分は、共有相互接続12にアクセスし、対応する仮想チャネルを介して伝送される。
【0081】
図3Bを参照すると、デバイス順位付けでアービトレーション要素26によって実行されるアービトレーションロジックを示す論理図が示されている。アービトレーション処理、および、おそらくは利用可能な宛先リソースの考慮は、2つの違いを除けは、上述したのと基本的に同じである。
【0082】
第1に、デバイス順序付けでは、(a)すべての要求に対する応答が求められるNon-posted読み出しまたは書き込みトランザクションと、(b)要求された応答を規定したCompletionトランザクションとを含め、2つトランザクションクラスだけが定義される。トランザクションクラスが2つだけなので、各ポート20において仮想チャネルごとに2つのバッファだけがある。例えば、4つの仮想チャネル(VC0、VC1、VC2、および、VC3)がある場合、各ポート20(例えば、Port0、Port1、および、Port2)は、合計で8つのバッファを有する。
【0083】
第2に、デバイス順序付けのトランザクションを選択するためのルールも、PCI順序付けとは異なる。デバイス順序付けでは、オーバークラスを超える1つのクラスの選択に適用される厳密なルールは存在しない。逆に、いずれかのトランザクションクラスが任意に選択されうる。しかしながら、一般的な方法では、典型的には、Completionトランザクションが解決するまで利用可能になりえないリソースを解放するように、好都合なCompletionトランザクションに要求する。
【0084】
それ以外の点では、デバイス順序付けのためのアービトレーション処理は、基本的に上述したものと同じである。換言すると、各アービトレーションサイクルに対して、アービトレーション勝者を選択するために、アービトレーション工程(1)、(2)、および、(3)が、任意の特定の順で実行される。トランザクションクラスアービトレーションが実行される時、PCI順序ルールよりはむしろデバイス順序が利用される。さらに、宛先リソースおよび/または仮想チャネルの利用可能性が、アービトレーション工程(1)、(2)、および、(3)のいずれかの前または間に考慮されてもよい。
【0085】
動作フローチャート
先述したように、上述のアービトレーションスキームは、任意の共有リソースへのアクセスを共有するために利用されてよく、共有相互接続との利用だけに限定されない。かかる他の共有リソースは、ARL28、処理リソース、メモリリソース(LUT30など)、または、アクセスをめぐって競い合う複数のパーティの間で共有されるほぼ任意のその他のタイプのリソースを含みうる。
【0086】
図4を参照すると、共有リソースへのアクセスをアービトレートするための動作工程を示すフローチャート40が示されている。
【0087】
工程42において、様々な送信元サブシステムエージェント14が、トランザクションを生成する。トランザクションは、Posted(P)、Non-posted(NP)、および、Completion(C)を含む3つのクラスのいずれかでありうる。
【0088】
工程44において、送信元サブシステムエージェント14によって生成されたトランザクションの各々は、パケット化される。先述したように、所与のトランザクションのパケット化は、1以上のパケットをもたらしうる。パケットは、サイズが様々であってよく、一部のパケットは大きいペイロードを持ち、他のパケットは小さいペイロードを持つかまたは全く持たない。トランザクションが、相互接続12の幅よりも小さいデータペイロード36を有する単一のパケットによって表される状況では、トランザクションは、単一の部分によって表されうる。トランザクションが、共有リソースのアクセス幅よりも大きいデータペイロード36を備えた複数のパケットまたは単一のパケットによって表される状況では、複数の部分が、トランザクションを表すために必要とされる。
【0089】
工程46において、サブシステムエージェント14の各々によって生成されたパケット化トランザクションの部分は、対応するポート20を介してローカルスイッチ16に投入される。ポート20内で、各トランザクションのパケットは、仮想チャネルに割り当てられる。先述したように、割り当ては、無作為であるか、ハードコードされるか、または、すべての仮想チャネルにわたってバランスの取れた利用、セキュリティ、緊急性などに基づいてよい。
【0090】
工程48において、サブシステムエージェント14の各々によって生成されたパケット化トランザクションの部分は、それぞれ、両方のトランザクションクラスによっておよびそれらに割り当てられた仮想チャネル(例えば、VC0、VC1、VC2、および、VC3)によって、適切な先入れ先出しバッファに格納される。先に述べたように、仮想チャネルは、厳密または絶対優先度、ラウンドロビン、重み付き優先度、最長時間未サービス(least recently serviced)など、多くの異なる優先度スキームの1つによって割り当てられてよい。所与のトランザクションが複数の部分を有する場合、各部分は、同じバッファ内に格納される。結果として、所与のトランザクションの複数の部分は、相互接続12に関連付けられている同じ仮想チャネルで伝送される。トランザクション部分が投入されると、各バッファ内のコンテンツアイテム数を追跡するための対応するカウンタがデクリメントされる。特定のバッファが満たされた場合、そのカウンタはゼロにデクリメントされ、これは、バッファがさらなるコンテンツをもはや受け入れることができないことを意味する。
【0091】
工程50、52、および、54において、第1、第2、および、第3レベルアービトレーションが実行される。先述したように、ポート20、仮想チャネル、および、トランザクションクラスの選択は、任意の順序で実行されてよい。
【0092】
要素56が、第1、第2、および、第3レベルのアービトレーションの実行に用いられるルールを維持するために用いられてよい。各ケースにおいて、要素56は、アービトレーションレベルの各々を解決するのに必要に応じて用いられる。例えば、要素56は、PCIおよび/またはデバイス順序付けルールを維持してよい。要素56は、いくつかの優先度スキーム(厳密または絶対優先度、重み付き優先度、ラウンドロビンなど)を実行するためのルールと、所与のアービトレーションサイクルでどれを用いるかを決定するためのロジックまたはインテリジェンスと、を備えてもよい。
【0093】
工程58において、アービトレーションの勝者が決定される。工程60において、勝利部分は、共有リソースにアクセスするために用いられるバッファ内に配置され、バッファに関連付けられているカウンタがデクリメントされる。
【0094】
工程62において、勝利部分に関連するバッファは、勝利部分がもはやバッファ内にはないのでインクリメントされる。
【0095】
工程64において、勝利部分は、共有リソースへアクセスする。アクセスが完了すると、共有リソースのためのバッファがインクリメントされる。
【0096】
工程42~64は、それぞれ、連続するクロックサイクル中に連続的に繰り返される。異なる勝利部分として、各々が共有リソースへアクセスする。
【0097】
インターリービング-例1
トランザクションは、いくつかのモードの内の1つで相互接続12を介して伝送されうる。
【0098】
「ヘッダインライン(header in-line)」モードと呼ばれる1つのモードでは、トランザクションのパケット32のヘッダ34は、常に、それぞれ、別個の部分またはビートでペイロード36の前に最初に伝送される。ヘッダインラインモードは、相互接続12のデータビット数Nに対するヘッダ34および/またはペイロード36の相対サイズに応じて、相互接続12で利用可能なビットを浪費する場合としない場合がある。例えば、512ビット幅(N=512)である相互接続12と、128ビットのヘッダおよび256ビットのペイロードを有するパケットと、を考える。このシナリオでは、128ビットのヘッダが第1部分またはビートで伝送され、相互接続12の残りの384ビットの帯域幅は利用されない。第2部分またはビートでは、256ビットのペイロード36が伝送され、相互接続12の残りの256ビットは利用されない。この例では、相互接続の帯域幅のかなりの割合が、2つのビート中に利用されない。一方、トランザクションのパケットのほとんどが相互接続以上のサイズである場合、浪費される帯域幅の程度は、削減されるかあるいは解消される。例えば、384または512ビットであるヘッダおよび/またはペイロードでは、浪費の量は、大幅に削減されるか(例えば、384ビット)または全く解消される(例えば、512ビット)。
【0099】
「ヘッダオンサイドバンド(header on side-band)」と呼ばれる別のモードでは、パケットのヘッダ34は、データの「サイドで」伝送され、これは、ペイロード36が相互接続12のNデータビットで伝送される間に、制御ビットMを利用することを意味する。ヘッダオンサイドバンドモードでは、パケット32のペイロード36のビット数またはサイズは、所与の相互接続12でパケットを伝送するのに必要なビート数を決定する。例えば、64、128、256、または、512ビットのペイロード36を有するパケット32、ならびに、128データビット(N=128)を有する相互接続12の場合、パケットは、それぞれ、1、1、2、および、4ビートを必要とする。ビートの各々の伝送では、ヘッダ情報は、相互接続12のNデータビットでペイロードのデータと共にまたはその「サイドで」制御ビットMで伝送される。
【0100】
さらに別のモードにおいて、パケット32のヘッダ34は、ペイロードと同じように伝送されるが、ヘッダ34およびペイロード36が別個の部分またはビートで伝送されなければならない要件はない。パケット32が、128ビットのヘッダ34および128ビットのペイロード36を有する場合、合計サイズは、256ビット(128+128)である。相互接続12のNデータビットが、64、128、256、および、512ビット幅である場合、256ビットのパケットは、それぞれ、4、2、1、および、1ビートで伝送される。別の例において、パケット32は、128ビットのヘッダおよび256ビットのペイロード36、すなわち、384ビット(128+256)の合計パケットサイズを有する。64、128、256、または、512幅のNデータビットの同じ相互接続12では、パケットは、それぞれ、6、3、2,または、1ビートで伝送される。このモードは、常に、上述のヘッダインラインモードと少なくとも同等以上の効率である。
【0101】
図5を参照すると、複数の仮想チャネル上での異なるトランザクションの部分のインターリービングの第1例が図示されている。この例では、簡単のために、2つのトランザクションのみが示されている。2つのトランザクションは、この例では、128データビット幅(N=128)である共有相互接続12へのアクセスをめぐって競合している。2つのトランザクションの詳細は、以下を含む。
(1)トランザクション1(T1):時刻T1に生成され、仮想チャネルVC2に割り当てられている。T1のサイズは、4ビートであり、それらのビートは、T1A、T1B、T1C、および、T1Dとして指定されている。
(2)トランザクション2(T2):時刻T2(時刻T1の後)に生成され、仮想チャネルVC0に割り当てられている。T2のサイズは、単一の部分またはビートである。
【0102】
この例では、VCOに絶対または厳密優先度が割り当てられている。複数のサイクルにわたって、2つのトランザクションT1およびT2の部分が、以下に従って、
図5に示すように、共有相互接続で伝送される。
サイクル1:T1のビートT1Aは、唯一の利用可能なトランザクションであるので、VC2で伝送される。
サイクル2:T1のビートT1BおよびT2の単一部分は、相互接続12へのアクセスをめぐって競合する。VCOは厳密優先度を有するので、T2が自動的に勝利する。したがって、T2のビートは、VC0で伝送される。
サイクル3:競合するトランザクションがないので、T1のビートT1BがVC2で伝送される。
サイクル4:競合するトランザクションがないので、T1のビートT1CがVC2で伝送される。
サイクル5:競合するトランザクションがないので、T1のビートT1DがVC2で伝送される。
【0103】
この例は、以下を示す。(1)絶対優先度を有する仮想チャネルでは、他のトラフィックが先に待っていたか否かに関わらず、トラフィックが利用可能になればいつでも、共有相互接続12へのアクセス権が即座に与えられること、ならびに、(2)異なるトランザクションの勝利部分またはビートは、相互接続12に関連付けられている異なる仮想チャネルでインターリーブされて伝送されること。この例において、仮想チャネルVCOは、絶対優先度を与えられている。絶対または厳密優先度スキームでは、仮想チャネルのいずれかが、最高優先度を割り当てられてよいことを理解されたい。
【0104】
インターリービング-例2
図6を参照すると、複数の仮想チャネル上での異なるトランザクションの部分のインターリービングの第2例が図示されている。
【0105】
この例において、相互接続12へのアクセスのための優先度スキームは重み付けされており、これは、VCOが(40%)の確率でアクセス権を与えられ、VC1~VC3が各々(20%)の確率でアクセス権を与えられることを意味する。また、相互接続は、128ビット幅である。
【0106】
さらに、この例においては、4つの競合するトランザクションT1、T2、T3、および、T4が存在する。
-T1は、VC0に割り当てられ、4つの部分またはビートT1A、T1B、T1C、および、T1Dを含む。
-T2は、VC1に割り当てられ、2つの部分またはビートT2AおよびT2Bを含む。
-T3は、VC2に割り当てられ、2つの部分またはビートT3AおよびT3Bを含む。
-T4は、VC3に割り当てられ、2つの部分またはビートT4AおよびT4Bを含む。
【0107】
この例では、優先度スキームは重み付けされる。結果として、各仮想チャネルは、その重みの比率に従って勝利する。換言すると、10サイクルの間に、VC0は、4回勝利し、VC1、VC2、および、VC3は各々、2回勝利する。例えば、
図6に示すように、
-T1の4つの部分またはビートT1A、T1B、T1C、および、T1Dは、10サイクルのうちの4サイクル(40%)(すなわち、サイクル1、4、7、および、10)でVCOを介して伝送され、
-T2の2つの部分またはビートT2AおよびT2Bは、10サイクルのうちの2サイクル(20%)(すなわち、サイクル2およびサイクル6)でVC1を介して伝送され、
-T3の2つの部分またはビートT3AおよびT3Bは、10サイクルのうちの2サイクル(20%)(すなわち、サイクル5およびサイクル9)でVC2を介して伝送され、
-T4の2つの部分またはビートT4AおよびT4Bは、10サイクルのうちの2サイクル(20%)(すなわち、サイクル3およびサイクル8)でVC3を介して伝送される。
【0108】
したがって、この例は、以下を示す。(1)各仮想チャネルが所定の比率に基づいて相互接続12へのアクセス権を与えられる重み付き優先度スキーム、ならびに、(2)異なるトランザクションの勝利部分が相互接続12に関連付けられている異なる仮想チャネルでインターリーブされて伝送される別の例。
【0109】
この重み付けの例では、重み付け比率に従って様々な仮想チャネルにトランザクションの部分を割り当てられるのに十分なトラフィックがあることを理解されたい。その一方でトラフィックの量が不十分である場合、重み付け比率は、厳密に実施できる場合も厳密に実施できない場合もある。例えば、仮想チャネルVC3に大きいトラフィックがあり、その他の仮想チャネルVC0、VC1、および、VC2ではトラフィックが限られているか全くない場合、VC3は、重み付け比率が厳密に実施されれば、トラフィックの全部または大部分を運ぶことになる。しかしながら、結果として、すべてのクロックサイクルまたはビートでトランザクションの部分を送信できるわけではないので、相互接続12は、十分に利用されえない。一方、重み付け比率が厳密に実施されない場合、相互接続の利用率をあげるために、トランザクショントラフィックを再割り当てすることが可能である(例えば、トラフィックが、より多い数のサイクルまたはビートで送信される)。
【0110】
上記の2つの例は、上述した伝送モードのどれが利用されるかに関わらず適用可能である。トランザクションが部分またはビートに分割されると、それらは、本明細書で規定したアービトレーションスキームのいずれかを用いて共有相互接続12でインターリーブされて伝送されうる。
【0111】
上述したアービトレーションスキームは、ほんの数例である。その他の例では、低ジッタ、重み付け、厳密、ラウンドロビン、または、ほぼ任意のその他のアービトレーションスキームが用いられてもよい。したがって、本明細書に列挙または記載されたアービトレーションスキームは、例示であり、どのようにも限定と見なされるべきではない。
【0112】
複数の同時アービトレーション
ここまで、簡単のために、単一のアービトレーションのみを記載していた。しかしながら、現実的な応用例(SoC上など)では、複数のアービトレーションが同時に行われうることを理解されたい。
【0113】
図7を参照すると、スイッチ16、18の間において2方向でトラフィックを処理するための2つの共有相互接続12および12Zのブロック図が示されている。上述したように、スイッチ16は、共有相互接続12を介して送信元サブファンクション14(すなわち、IP1、IP2、および、IP3)から宛先サブファンクション14(すなわち、IP4、IP5、および、IP6)へトランザクショントラフィックを方向付ける。逆方向のトランザクショントラフィックを扱うために、スイッチ18は、アービトレーション要素26Zと、任意選択的にARL28Zと、を備える。動作中、要素26ZおよびARL28Zは、上述した動作と相補的に動作し、これは、送信元IPエージェント14(すなわち、IP4、IP5、および、IP6)によって生成されたトランザクショントラフィックがアービトレートされて、共有相互接続12Zを介して宛先IPエージェント(すなわち、IP1、IP2、および、IP3)へ送信されることを意味する。あるいは、アービトレーションは、ARL28Zなしに実行されてもよく、これは、アービトレーションが、単に競合ポート20(例えば、Port3、Port3またはPort5)の間で決定を行い、勝利ポートに関連するトランザクションの部分が、その部分の最終的な宛先に関わらず、相互接続12で伝送されることを意味する。要素12Z、26Z、および、28Zについては、すでに記載したので、簡単のために詳細な説明は、ここでは提供しない。
【0114】
SoCには、複数レベルのサブファンクション14および複数の共有相互接続12が存在しうる。各々で、上述のアービトレーションスキームを用いて、様々なサブファンクションの間で相互接続12を介して送信されるトランザクションの間のアービトレーションを同時に行うことができる。
【0115】
相互接続ファブリック
図8を参照すると、SoCの例100が示されている。SoC100は、複数のIPエージェント14(IP1、IP2、IP3、...IPN)を備える。各IPエージェント14は、いくつかのノード102の内の1つに接続されている。共有相互接続12、12Zは、逆方向であり、様々なノード102の間に提供されている。この構成では、トランザクションが、例えば、
図7に関して上述したように、ノード102の各ペアの間で両方向に流れうる。
【0116】
非排他的な実施形態において、各ノード102は、様々なスイッチ16、18と、ローカルIPエージェント14に接続するためのアクセスポート20と、共有相互接続12、12Zに接続するためのアクセスポート22と、アービトレーション要素26と、任意選択的なARL28と、任意選択的なLUT30と、を備える。代替実施形態において、ノードは、アービトレーション要素26および/またはARL28を備えなくてもよい。これらの要素を持たないノード102については、必要なルーティング情報のないトランザクションが、上述のようにデフォルトノードへ転送されうる。これらの要素の各々については、
図1に関して上述したので、簡単のために詳細な説明は、ここでは提供しない。
【0117】
集合的に、様々なノード102および双方向相互接続12、12Zは、SoC100のための相互接続ファブリック106を規定する。図に示した相互接続ファブリック106は、簡潔にするために比較的単純である。実際の実施形態においては、SoC100上の相互接続ファブリックは、数百または数千ものIPエージェント14、複数レベルのノード102を備え、それらすべてが多数の相互接続12、12Zによって相互接続され、非常に複雑でありうることを理解されたい。
【0118】
ブロードキャスト、マルチキャスト、および、エニーキャスト
機械学習または人工知能など、いくつかの応用例では、1つのIPエージェント14によって生成されたトランザクションが、SoC100上の複数のIPエージェント14に広く発信されるのが普通である。複数のIPエージェント14へ広く発信されるトランザクションは、ブロードキャスト、マルチキャスト、または、エニーキャストによって実施されうる。所与のSoC100上で、ブロードキャスト、マルチキャスト、および/または、エニーキャストが各々、独自に実施されてもよいし、一緒に実施されてもよい。これらのタイプのトランザクションの各々の簡単な定義を以下に提供する。
・ブロードキャストは、SoC100上のすべてのIPエージェントに送信されるトランザクションである。例えば、
図8に示したSoC100において、IP1によってブロードキャストが送信された結果として、IP2~IPNが各々、トランザクションを受信することになる。
・マルチキャストは、SoC上のIPエージェントの内の2以上(潜在的には全部を含む)へ送信されるトランザクションである。例えば、IP1がIP5、IP7、および、IP9を指定するマルチキャストトランザクションを生成した場合、これらのエージェント14はトランザクションを受信するが、SoC100上の残りのIPエージェント14は受信しない。マルチキャストがIPエージェント14すべてに送信された場合、基本的にはブロードキャストと同じである。
・読み出し応答マルチキャストは、上述したマルチキャストトランザクションの変形例である。読み出し応答マルチキャストでは、単一のIPエージェント14が、メモリロケーションのコンテンツを読み出してよい。開始IPエージェント14だけがコンテンツを受信するのではなく、多数の宛先IPエージェント14がコンテンツを受信する。読み出し結果を受信するIPエージェント14は、2以上のIPエージェント14からSoC100上のすべてのIPエージェント14までの範囲であってよい。
・エニーキャストは、IPエージェント14によって生成されるトランザクションである。しかしながら、送信側IPエージェント14は、目標IPエージェント14を全く指定しない。その代わり、相互接続ファブリック106(すなわち、ノード102の内の1以上)が、受信側IPエージェント14を決定する。例えば、IP1がエニーキャストトランザクションを生成した場合、ノード102の内の1以上のノードが、他のエージェントIP2~IPNのどれがトランザクションを受信するかを決定する。エニーキャストトランザクションの様々な実施例において、SoC上のIPエージェント14の内の1つ、複数、または、全部が、エニーキャストトランザクションを受信してよい。
【0119】
所与のトランザクションが、いくつかの方法で、ブロードキャスト、読み出し応答マルチキャストを含むマルチキャスト、または、エニーキャストとして開始されうる。簡単のために、以下では、これらのトランザクションを集合的に「BMA」トランザクションと呼ぶこととし、これは、ブロードキャスト、マルチキャスト(読み出し応答マルチキャストを含む)、または、エニーキャストトランザクションを意味する。
【0120】
一実施形態において、IPエージェント14は、トランザクションを表すパケット32のヘッダ34のコマンドフィールドCMDに挿入されたコード化されたコマンドを用いて、BMAトランザクションを開始してよい。コード化されたコマンドにより、SoC100の相互接続ファブリック106は、トランザクションが、1つの送信元および1つの宛先IPエージェント14を指定する通常のトランザクションではなく、BMAトランザクションであることを認識または理解する。例えば、ビットの独自の組み合せが、それぞれ、ブロードキャスト、マルチキャスト、読み出し応答マルチキャスト、または、エニーキャストのいずれかとして、所与のトランザクションを規定しうる。
【0121】
別の実施形態において、BMAトランザクションは、トランザクションを表すパケット32のヘッダ34のADDRフィールドに規定されたBMAアドレスを有する読み出しまたは書き込みしトランザクションを発行することによって実施されうる。BMAアドレスは、ブロードキャスト、マルチキャスト、または、エニーキャストトランザクションの内の1つを示すものとして、SoC100のシステム内で指定される。結果として、BMAアドレスは、相互接続ファブリック106によって認識され、トランザクションは、ブロードキャスト、マルチキャスト、または、エニーキャストとして扱われる。
【0122】
さらに別の実施形態において、コマンドおよびBMAアドレスは両方とも、ブロードキャスト、マルチキャスト、または、エニーキャストトランザクションを指定するために利用できる。
【0123】
エニーキャストは、典型的には、送信元IPエージェント14が複数の宛先にトランザクションを送信したいが、1以上の好ましいまたは理想的な宛先IPエージェント14を選択するのに役立つ要素に気づかない状況で用いられる。例えば、送信元IPエージェント14は、各々がアクセラレータ機能を実装する複数のIPエージェントにトランザクションを送信しようとしうる。そのトランザクションをエニーキャストとして指定することにより、ノード102の内の1以上が、宛先IPエージェント14の選択に関与する。様々な実施形態において、選択基準は、幅広く変化してよく、混雑状態(ビジーであるIPエージェント対アイドル状態すなわちビジーではないIPエージェント)、ランダム選択関数、ハードワイヤロジック関数、ハッシュ関数、最長時間未使用の関数、電力消費の考慮、もしくは、任意のその他の決定関数または基準に基づいてよい。したがって、宛先IPエージェント14を選択する責任は、ノード102にシフトされ、ノード102は、送信元エージェント14よりも良好なルーティング決定を行うために、より多くの情報を有しうる。
【0124】
図9Aを参照すると、BMAアドレッシングをサポートするためのノード102のロジックを示す
図90が示されている。ロジック90は、LUT30と、相互接続ファブリックID(IFID)テーブル124と、任意選択的な物理リンクセレクタ126と、を備える。任意選択的な物理リンクセレクタ126は、後に詳述する単一の論理識別子を共有する2つ(以上)の重複物理リソースがある場合(トランキング状況など)に用いられる。
【0125】
IFIDテーブルは、各IPエージェント14について、(a)SoC100内の各IPエージェント14を論理的に識別するための対応する論理IP IDと、(b)対応するIPエージェント14がノード102にローカルである場合のポート20もしくは(c)対応するIPエージェント14への配信パスに沿って次のノード102につながる適切な相互接続12または12Zへのアクセスポート22のいずれかと、を含む。この構成では、各ノードは、SoC100内の各IPエージェント14へトランザクションを配信するのに必要な物理ポート20および/または22のアイデンティティにアクセスできる。
【0126】
ファブリック106内の各ノード102のためのIFIDテーブル124は、相対的(すなわち、一意的)である。換言すると、各IFIDテーブル124は、(1)そのローカルIPエージェント14または(2)ノード120へローカルに接続されていないSoC内の他のIPエージェント14への配信パスに沿った他のノード102への共有相互接続12、12Z、のいずれかへトランザクションを配信するために必要なポート20および/または22のリストだけを含む。この構成では、各ノード102は、(1)宛先として指定されたそのローカルIPエージェント14へトランザクションを配信するか、または、(2)別のノード102へ相互接続12、12Zを介してトランザクションを転送するか、のいずれかである。次のノードで、上述の処理が繰り返される。各ノード102でトランザクションをローカルに配信するかまたは転送することにより、最終的に、所与のトランザクションが、SoC100のための相互接続ファブリック106内の指定された宛先IPエージェント14すべてに配信される。
【0127】
LUT30は、従来のトランザクション(すなわち、単一の宛先IPエージェント14に送信されるトランザクション)のルーティングに用いられる第1部分120である。従来のトランザクションが生成されると、送信元IPエージェント14は、トランザクションを表すパケットヘッダのADDRフィールド内にシステムメモリ24内の宛先アドレスを規定する。次いで、トランザクションは、ルーティングのためにローカルノード102へ提供される。それに応じて、ARL28は、LUT30の第1部分120にアクセスして、宛先アドレスに対応する論理IP IDを見つける。次いで、IFIDテーブル124は、(a)宛先IPエージェント14がノード102にローカルである場合のポート20もしくは(b)宛先IPエージェント14への配信パスに沿って次のノード102につながる適切な相互接続12または12Zへのアクセスポート22、のいずれかを規定するために、アクセスされる。IP IDは、適切なポート20または22に沿って送信される前に、パケット32のヘッダ34のDSTフィールドに配置される。
【0128】
ブロードキャスト、マルチキャスト、または、エニーキャストトランザクションについて、LUT30の第2部分122は、複数のBMAアドレス(例えば、BMA 1~BMA N、ここで、Nは、必要に応じてまたは適切に選択されうる任意の数)と、各BMAアドレスに対応する情報と、を含む。様々な実施形態において、対応する情報は、以下でありうる。
(1)1以上の固有IP ID(例えば、BMAアドレス1に対してIP4およびIP7、BMAアドレス2に対してIP5、IP12、および、IP24)。
(2)一意的なコード(例えば、BMAアドレス10および11に対してコード1およびコード2)。
(3)ビットベクトル(例えば、BMAアドレス20および21のためのビットベクトル)。
【0129】
各コードは、宛先IPエージェントの異なるセットを一意的に識別する。例えば、第1コードは、宛先IPエージェントの第1セット(例えば、IP1、IP13、および、IP21)を指定するために利用でき、第2コードは、宛先エージェントの別のセット(例えば、IP4、IP9、および、IP17)を指定するために利用できる。
【0130】
ビットベクトルでは、各ビット位置が、SoC100上のIPエージェント14に対応する。所与のビット位置が設定されたか再設定されたかに応じて、対応するIPエージェント14は、それぞれ、宛先であるとしてまたは宛先ではないとして指定される。例として、(101011...1)のビットベクトルは、対応するIPエージェント14(IP1、IP3、IP5、IP6、および、IPN)が設定され、残りが再設定されることを示す。
【0131】
上述の実施形態の各々では、1以上の論理IP IDが、所与のトランザクションの宛先IPエージェントとして識別される。IFIDテーブル124は、論理識別子IP ID値を、トランザクションをそれらの宛先にルーティングするのに必要な物理アクセスポート20および/または22に変換するために用いられる。BMAアドレスの場合、正しい物理アクセスポート20および/または22が必要とされることを決定するために、一意的なコードまたはビットベクトルが、IP ID値の代わりに用いられてよい。
【0132】
コードおよびビットベクトルは両方とも、多数の宛先IPエージェント14を指定するために利用できる。ビットベクトルは、トランザクションを表すパケット32のヘッダ34の宛先フィールドDSTの幅によっておそらくは制限されうる。例えば、宛先フィールドDSTが、32,64、128、または、258ビット幅である場合、IPエージェント14の最大数は、それぞれ、32、64、128、および、256に制限される。所与のSoC上のIPエージェント14の数が、宛先フィールドDSTの幅によって特定されうる可能なIPエージェントの数をたまたま超えた場合、ヘッダ34内のその他のフィールドが場合によっては用いられてよく、もしくは、DSTフィールドが拡張されてもよい。しかしながら、非常に複雑なSoC100では、IPエージェント14の数は、ビットベクトル内で実際的に利用できる利用可能ビット数を超える場合がある。コードでは、任意の数の宛先IPエージェントが指定されてよいので、この問題は回避される。
【0133】
図9Aに関して提供された例は、本質的に例示であり、どのようにも限定を意図しないことを理解されたい。実際の実施形態において、SoC100で利用できるBMAアドレスの数は、1から多数まで幅広く変化してよい。
【0134】
ソースベースルーティング(SBR)
ソースベースルーティング(SBR)は、以下の点で従来のルーティングとは異なる。
(1)送信元IPエージェント14は、トランザクションの発行時に、相互接続ファブリック106に与える何らかの知識または指示を有する。例えば、送信元IPエージェント14は、それがトランザクションを送信したい宛先IPエージェント14のIP IDを知っている。
(2)送信元IPエージェント14は、トランザクションのパケット32のパケットヘッダ34のADDRフィールドに通常は提供されるシステムメモリ24内のアドレスに関心がないおよび/またはそれを知らない。
(3)相互接続ファブリック106内のノード102は、パケットのヘッダ34のADDRフィールド内のアドレスを単一の宛先IPエージェントのための単一のIP IDへ単に変換することとは異なる何かを実行することを知っている。
【0135】
ブロードキャストおよびマルチキャストは両方とも、おそらくSBRトランザクションでありうるが必ずしもそうではないトランザクションの例である。送信元が、トランザクションのパケット32のヘッダ34内で(a)ブロードキャストおよび/またはマルチキャストコードおよび(b)宛先IPエージェント14のいずれかを指定するブロードキャストまたはマルチキャストを発行する場合、トランザクションは、送信元IPエージェントが宛先IPエージェントを指定しているので、ソースベースであると見なされる。一方、送信元が、宛先の具体的な知識を全く持たずにBMAアドレスを用いてブロードキャストまたはマルチキャストトランザクションを開始する場合、トランザクションは、非ソースベースであると見なされる。エニーキャストトランザクションは、宛先IPエージェント14を規定しないので、ソースベースとは見なされない。
【0136】
ハッシング
ハッシングでは、ハッシュ関数が、宛先または宛先までのルートを規定するために用いられる。いくつかの実施例において、ハッシング関数が、複数の宛先および/または複数の宛先までの複数のルートを丁寧に規定してよい。
【0137】
図9Bを参照すると、ルーティング決定を実施するためのハッシュ関数の利用を説明する
図140が示されている。この実施形態において、ハッシュ値142が、トランザクションを表すパケット32のヘッダ34の任意の数のフィールド内に提供される。例えば、アドレスビット、コマンド、送信元エージェントIP、または、ヘッダ34に含まれる情報またはデータの任意の可能な組合せのサブセットが、ハッシュ値を規定するために用いられてよい。対応するローカルノード102内またはSoC100上のどこかで、ハッシュ関数144が、ハッシュ値142に適用される。ハッシュ関数144に応答して、ルーティング決定がなされうる。例えば、宛先エージェント14の1以上のIP IDが規定されてよい。異なるハッシュ値を提供することにより、異なるルーティング決定が規定されてよい。ハッシングは、SoC内での多くの他の用途に用いられてもよいことを理解されたい。1つのかかる用途は、トランキングのためのハッシュ関数の利用である。トランキングでは、単一の論理識別子を共有する2つ(以上)の重複物理リソースが存在する。後に詳述するように、ハッシュ関数は、重複物理リソースの中から選択するために利用できる。
【0138】
トランザクショントラフィックの最適化
機械学習、人工知能、データセンターなど、SoCのいくつかの応用例は、トランザクション集約的でありうる。これらのタイプの応用例は、ブロードキャスト、マルチキャスト、および、エニーキャストに依存する傾向にあり、それにより、トランザクショントラフィックをさらに増大させうる。
【0139】
ブロードキャストトランザクションは、相互接続ファブリック106を介して送信されるトラフィックの量を著しく増大させうる。
【0140】
ボトルネックの発生を低減するために、トランザクショントラフィックを削減する多くの手順が提案されている。かかる手順は、(1)SoC100の相互接続ファブリック106のノード102でトランザクションを拡大し、応答を統合すること、(2)それぞれ、ペアになった仮想チャネルトランザクションクラスの組み合せによって規定されるストリームで2以上のトランザクションをストリーム内でインターリービングすること、(3)ならびに、共通の論理リンクを共有するIPエージェントの間の2以上の物理リンクまたは共通の論理アドレスを共有する2以上の同一のIPエージェントを「トランキング」すること、を含む。
【0141】
トランザクションの拡大および応答の統合
ブロードキャスティング、マルチキャスティング、読み出し応答マルチキャスティング、および、エニーキャスティングは各々、SoC100上のIPエージェント14の間のトランザクショントラフィックの量を著しく増大させうる。
【0142】
SoC100が25のIPエージェントを有し、IPエージェントの1つがブロードキャストトランザクションを生成する場合、最高24までの個々のトランザクションが、典型的には、その他のIPエージェント14へ相互接続ファブリックを介して送信される。Non-posted(NP)トランザクションは、Completion(C)トランザクションの形態の応答を求める。24のIPエージェントへブロードキャストされるトランザクションがNon-postedである場合、別の24のCompletion(C)トランザクションが同様に生成される。この簡単な例で示すように、ブロードキャストは、相互接続ファブリック106で伝送されるトラフィックの量を急速に増大させうる。
【0143】
マルチキャストおよびエニーキャストトランザクションも、トラフィックの量を急速に拡大しうる。これらのトランザクションタイプの各々では、複数の受信側が指定されてよく、これは、複数のトランザクションが送信され、おそらくは、複数の完了応答トランザクションが相互接続ファブリック106を介して受信されることを意味する。読み出し応答マルチキャストトランザクションでも、読み出されたコンテンツは、複数の宛先IPエージェント14に送信されうる。結果として、トランザクション量は、これらのタイプのトランザクションでも著しく増大しうる。
【0144】
相互接続ファブリック106をより効果的に動作させるために、ノード102でのトランザクションを拡大して統合する技術を用いて、トラフィックの量を削減する。
【0145】
図10Aおよび
図10Bを参照すると、SoCの一例を説明する図が示されている。この例において、SoCは、5個の相互接続されたノード102A~102Eおよび10個のIPエージェント14(IP1~IP10)を備えた相互接続ファブリック106を備える。
【0146】
図10Aを参照すると、IP1は、Non-posted書き込みトランザクションをその他のIPエージェントIP2~IP10へブロードキャストする。拡大を用いることにより、単一のトランザクションだけが、各共有相互接続12で送信される。各ダウンストリームノード102B~102Eでは、ノードは、(1)トランザクションを任意のローカルIPエージェント14へ提供し、(2)トランザクションを任意のアップストリームノード102へ転送する。したがって、この例では、
・ノード102Bは、トランザクションをIP2に提供し、トランザクションの単一のインスタンス化をそれぞれノード102Cおよび102Dへ転送する。
・ノード102Cでは、トランザクションは、ローカルエージェントIP3、IP4、および、IP5へ提供される。
・ノード102Dは、トランザクションをIP7へ提供する。さらに、ノード102Dも、トランザクションの単一のインスタンス化をノード102Eへ転送する。
・ノード102Eで、トランザクションは、IP8、IP9、および、IP10へ提供される。
【0147】
上記の例では、単一のトランザクションだけが、送信側IPエージェント14の下流にあるIPエージェント1の数に関わらず、各共有相互接続12で送信される。
【0148】
図10Bを参照して、応答トランザクションの統合について説明する。ブロードキャストトランザクションは、Non-posted書き込みであったので、各宛先エージェントIP2~IP10は、完了トランザクションを返す必要がある。統合では、各ノード102B~102Eは、そのローカルIPエージェント14から受信した完了トランザクションを統合し、その後、ノード102Aへ向かって上流へ単一の完了トランザクションのみを送信する。換言すると、
・ノード102Eは、IP8~IP10から受信した完了トランザクションを統合し、単一の完了トランザクションをノード102Dへ返す。
・ノード102Dでは、IP7およびノード102Eから受信した完了トランザクションが統合され、1つの完了トランザクションがノード102Bへ返される。
・同様に、ノード102Cは、IP3、IP4、および、IP5について単一の統合されたトランザクションを返す。
・最後に、ノード102Bは、ノード102C、102D、および、IP2から受信した完了トランザクションを統合し、単一の完了トランザクションをノード102AおよびIP1へ返す。
【0149】
上記の例は、拡大および統合の効率を説明する。拡大がなければ、9個の別個のトランザクション(エージェントIP2~IP10の各々に対して1つずつ)が、相互接続ファブリック106を介して伝送される必要がある。しかし、拡大を用いることにより、様々な共有相互接続12を介して伝送されるトランザクションの数は、4まで削減される。合計9の完了トランザクションも、4つに統合される。
【0150】
時々、エラーが発生する可能性があり、完了トランザクションが、受信側IPエージェントIP2~IP10の1以上によって生成されない。エラーは、多くの異なる方法で対処することができる。例えば、成功した完了だけを統合することができ、一方、エラー応答を組み合わせるおよび/または別個に送信することができる。さらに別の代替例において、成功した完了およびエラー完了の両方が統合されてもよいが、成功応答または失敗応答のいずれかを示すように、各々にフラグが付される。
【0151】
上記の記載はブロードキャストの文脈で提供されているが、トランザクションの拡大および統合は、マルチキャスティング、読み出し応答マルチキャスティング、および/または、エニーキャスティングで実施されてもよいことを理解されたい。
【0152】
ブロードキャスト、マルチキャスト、および、エニーキャストトランザクションが一般的である機械学習、人工知能、データセンターなどのトランザクション集約的な応用例において、拡大および統合することができれば、相互接続ファブリック106上のトランザクショントラフィックの量を大幅に削減して、ボトルネックを排除または低減すると共にシステム効率およびパフォーマンスを改善することができる。
【0153】
トランキング
SoC100の相互接続ファブリック106は、典型的には、各方向に対して、(a)IPエージェント14とローカルノード102との間、および、(b)複数のノード102の間に、単一の物理リンクを備える。単一のリンクのみがある場合、物理リンクと、その物理リンクのためのアクセスポート20または22との間には、一対一の対応関係がある。同様に、ほとんどの相互接続ファブリック106で、物理IPエージェント14と、そのIPエージェント14にアクセスするために用いられる論理IP IDとの間にも、一対一の対応関係がある。
【0154】
高パフォーマンスの応用例においては、トランキングと呼ばれる技術を用いることが有利でありうる。トランキングでは、単一の論理識別子を共有する2つ(以上)の重複物理リソースが存在する。物理リソースを重複させることにより、ボトルネックを回避することができ、システムの効率およびパフォーマスを向上させることができる。例えば、1つの物理リソースが、ビジーであるか、電源オフであるか、または、利用不可能である場合、重複リソースの1つが利用されうる。トランキングは、信頼性も改善できる。1つの物理リソース(例えば、相互接続またはIPエージェントなど)がダウンし、利用不可能になるか、または、何らかの理由で利用できない場合、その他の物理リソースが利用されうる。同じ論理識別子を用いて重複リソースをアドレッシングすることにより、SoC100上で利用される論理アドレッシングシステムを変更する必要なしに、重複物理リソースの利点を実現させることができる。しかしながら、重複物理リソースの内のどれを利用するのかを選択して追跡するのかが課題である。
【0155】
図11Aを参照すると、いくつかのトランキングの例を含むSoC100の相互接続ファブリック106が示されている。この例において、相互接続ファブリック106は、3つのノード102A、102B、および、102Cを備える。ノード102Aは、2つのIPエージェント14
iおよび14
2を備える。ノード102Bは、2つのIPエージェント14
3および14
4を備える。ノード102Cは、1つのIPエージェント14sを備える。相互接続ファブリック106は、以下のトランキングの例を含む。
・ノード102AとIPエージェント14
2との間の物理的な「トランク」ラインのペア。
・ノード102Aから102Cの同方向の物理的な「トランク」相互接続12
(1)および12
(2)のペア。
・同一のIPエージェント14sのペア。
【0156】
これらの例の各々では、論理識別子と物理リソースとの間に一対一の対応関係はない。逆に、2つの利用可能な物理リソースがあるので、どちらの物理リソースを利用するか選択を行う必要がある。
【0157】
図11Bを参照すると、(
図9Aの)任意選択的な物理リンクセレクタ126を示す図が示されている。上述のように、トランキングでは、単一の論理識別子を共有する2つ(以上)の重複物理リソースが存在する。IFIDテーブル124が、トランキング状況などで、重複物理リソースを有する論理IP IDを識別した時はいつでも、任意選択的な物理リンクセレクタ126が、選択を行うために用いられる。物理リンクセレクタ126は、物理リソースの利用可能性(またはその欠如)、混雑状態、負荷バランシング、ハッシュ関数、ランダム選択、最長時間未使用の選択、電力条件など、1以上の決定要素を用いて、その選択を行ってよい。例えば、或る物理リソースがビジーである、混雑している、および/または、利用不可能である場合、他の物理リソースが選択される。あるいは、或るリソースが電力消費を削減するために電源オフされている場合、他のリソースが選択されてよい。どのようになされるかに関わらず、選択は、選択された物理リソースにアクセスするために用いられる物理ポート20または22の識別につながる。
【0158】
非排他的実施形態において、物理リソースの選択は、動作が完了するまで利用されることが好ましい。一連の関連トランザクションが、送信元IPエージェント14と、宛先IPエージェントの重複ペア(例えば、
図11Aの2つのIPエージェントIP5)との間で送信される場合、すべてのトランザクションが、動作の完了まで同じ宛先IPエージェントに送信される。そうでなければ、データの破損またはその他の問題が発生しうる。重複物理リソースが相互接続である場合、典型的には、同様のアプローチが好ましい。応答(読み出しなど)を求めるトランザクションでは、読み出し要求トランザクションおよび結果応答の両方が、同じ相互接続を介して送信されることが好ましい。さらに、トランザクションのパケットの破損を避けるために、トランザクション全体、および、トランザクションのパケットが、同じパスで同じ宛先へルーティングされることが好ましい。パケットは、リンクを通るために数ビートを必要とし、おそらくは、他の仮想チャネルとインターリーブされうるので、パケットの終了までポートまたはリンクを変えないことが重要である。そうでなければ、パケットの複数のビートは、パケットの部分がシステムを通して移動する時に順序がばらばらになりうるので、それにより情報が破損しうる。要求と同じパスを介して応答をルーティングすることが通常は望ましいが、必須ではない。
【0159】
いくつかの非排他的実施形態において、各ビートと共に送信された順序付け情報を用いて、順不同でまたは異なるリソースから受信されたトランザクションのビートを再順序付けする機能を、宛先IPエージェントに提供することが有利でありうる。例えば、制御ビットMは、パケットの各ビートに対する固有の「ビートカウント数」を特定するために用いられてよい。次いで、パケットのビートは、各ビートと共に送信された固有のビートカウント数を用いて、正確な番号順で宛先IPエージェントによって組み立てられうる。各ビートと共に送信されるビートカウント数を提供することにより、破損に関する上述の問題の多くが解決されうる。
【0160】
ストリーム内インターリービング
前述したように、ストリームは、仮想チャネルおよびトランザクションクラスのペアリングとして定義される。4つの仮想チャネル(例えば、VC0、VC1、VC2、および、VC3)、ならびに、3つのトランザクションクラス(P、NP、C)があった場合、最大で12の異なる可能なストリームがある。12のストリームは、完全に独立している。ストリームは、独立しているので、例えば、相互接続ワイヤ12および12Zなどの共有リソース上でインターリーブされうる。各アービトレーション工程で、仮想チャネルのストリームが選択され、対応するポート22は、そのトランザクションの残りに対してそのトランザクションにロックされる。別の仮想チャネルを選択して、トランザクションの伝送の完了前に同じポート上でインターリーブすることもできるが、トランザクションが完了するまでは、同じ仮想チャネルの別のストリームを選択することはできない。
【0161】
ストリーム内インターリービングは、2つのトランザクションが互いに独立しているという条件では、同じストリームを共有する2以上のトランザクションのインターリービングである。独立したトランザクションの例は、(1)2つの異なるIPエージェント14が、同じストリームを共有するトランザクションを生成すること、および、(2)同じIPエージェント14が、同じストリームを共有する2つのトランザクションを生成するが、生成するIPエージェント14が2つのトランザクションを独立するものとしてマークすること、を含む。トランザクションを独立するものとしてマークすることにより、トランザクションを再順序付けして、インターリービングを用いて配信できることを意味する。ストリーム内インターリービングによれば、トランザクションが完了するまで仮想チャネルのストリームをポートにロックする上述の制約を緩和または排除することができる。ストリーム内インターリービングによれば、(1)2以上の独立したトランザクションをストリーム上でインターリーブすることができ、(2)同じ仮想チャネルに関連する異なるストリームもインターリーブできる。
【0162】
ストリーム内インターリービングでは、同じストリーム上でインターリーブされうる2つ(以上)の独立したトランザクションを示すために、さらなる情報が必要である。様々な実施形態において、これは、多くの異なる方法で達成されてよい。一実施形態において、独立したトランザクションのパケットのヘッダ34は、一意的なトランザクション識別子すなわちIDを割り当てられる。一意的なトランザクション識別子を用いることにより、各トランザクションの各ビートは、独立するものとしてフラグを付される。各トランザクションに対する一意的なトランザクションIDを用いることにより、様々なノード102は、同じストリーム上でインターリーブされる複数の独立したトランザクションのビートを追跡する。
【0163】
インターリーブされたトランザクションの所与のペアについて、仮想チャネルおよびトランザクションクラスを指定するビットは同じであるが、各々のためのトランザクションIDを表すビットは異なる。
【0164】
したがって、制御ビットMに含まれるさらなるトランザクションID情報は、送信元および宛先IPエージェント14の両方および相互接続ファブリック106が、同じストリーム上でインターリーブされた時に、或るトランザクションを他のトランザクションに対して認識または区別することを可能にする。
【0165】
同期配信対非同期配信
ブロードキャスティング、マルチキャスティング、読み出し応答マルチキャスティング、および、エニーキャスティングでは、同じトランザクションの複数のインスタンス化が、相互接続ファブリック106で伝送されてよい。目標となる宛先およびそれらの宛先までのパスの各々が利用可能である場合、各宛先IPエージェント14は、ネットワーク上で通常の待ち時間だけ遅延して、やがてトランザクションを受信する。一方、パスまたは宛先のいずれかが利用できない(例えば、リソースバッファが満杯である)場合、1以上の利用可能な宛先が、利用できない宛先の前にトランザクションを受信してよい。かかる状況下での異なる到達時間は、2つの異なる実施例の可能性を提起する。
【0166】
第1同期または「ブロッキング」実施形態においては、各宛先がほぼ同時にトランザクションを受信することを保証する努力がなされる。換言すると、利用不可能なリソースが利用可能になるまで、利用可能なリソースへのトランザクションの配信が、遅延すなわち「ブロック」されてよい。結果として、指定された受信側の各々によるトランザクションの受信が同期される。この実施形態は、ほぼ同時にトランザクションを受信することが受信側にとって重要である応用例で用いられてよい。
【0167】
第2非同期的または非ブロッキング実施形態においては、利用可能な宛先へのトランザクションの配信を遅延させるためのブロッキングの努力がなされない。その代わり、トランザクションの各インスタンス化が、利用可能性に基づいて配信され、これは、利用可能なリソースがトランザクションをすぐに受信する一方で、利用不可能なリソースは、利用可能になった時にトランザクションを受信することを意味する。結果として、非同期的すなわち異なる時間に配信が起こりうる。このアプローチの利点は、利用可能な宛先IPエージェント14が、すぐにトランザクションを処理でき、他のIPエージェントと同期するのを待ってブロックされることがないことである。結果として、遅延が回避される。
【0168】
いくつかの実施形態についてのみ詳細に説明したが、ここに提供した本開示の精神や範囲を逸脱することなしに多くの他の形態で本願を実施できることを理解されたい。したがって、これらの実施形態は、例示的なものであって、限定的なものではないとみなされ、本明細書に示した詳細に限定されず、添付の特許請求の範囲および等価物の範囲内で変形されてもよい。