IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧 ▶ クンルンシン テクノロジー (ベイジン) カンパニー リミテッドの特許一覧

特許7149987データ伝送装置、データ処理システム、データ処理方法及び媒体
<>
  • 特許-データ伝送装置、データ処理システム、データ処理方法及び媒体 図1
  • 特許-データ伝送装置、データ処理システム、データ処理方法及び媒体 図2
  • 特許-データ伝送装置、データ処理システム、データ処理方法及び媒体 図3
  • 特許-データ伝送装置、データ処理システム、データ処理方法及び媒体 図4
  • 特許-データ伝送装置、データ処理システム、データ処理方法及び媒体 図5
  • 特許-データ伝送装置、データ処理システム、データ処理方法及び媒体 図6
  • 特許-データ伝送装置、データ処理システム、データ処理方法及び媒体 図7
  • 特許-データ伝送装置、データ処理システム、データ処理方法及び媒体 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-09-29
(45)【発行日】2022-10-07
(54)【発明の名称】データ伝送装置、データ処理システム、データ処理方法及び媒体
(51)【国際特許分類】
   G06F 12/06 20060101AFI20220930BHJP
   G06F 13/16 20060101ALI20220930BHJP
   G06F 15/173 20060101ALI20220930BHJP
【FI】
G06F12/06 540A
G06F13/16 510A
G06F15/173 685M
【請求項の数】 10
(21)【出願番号】P 2020108977
(22)【出願日】2020-06-24
(65)【公開番号】P2021005380
(43)【公開日】2021-01-14
【審査請求日】2020-06-24
(31)【優先権主張番号】201910559188.6
(32)【優先日】2019-06-26
(33)【優先権主張国・地域又は機関】CN
【前置審査】
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(73)【特許権者】
【識別番号】521457387
【氏名又は名称】クンルンシン テクノロジー (ベイジン) カンパニー リミテッド
【氏名又は名称原語表記】Kunlunxin Technology (Beijing) Company Limited
【住所又は居所原語表記】CW Section, F/4, Building 1, No.10, Shangdi 10th Street, Haidian District, 100101, Beijing, China
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】ラン,シャンルン
(72)【発明者】
【氏名】シュー,ニンイー
(72)【発明者】
【氏名】ヤン,イー
(72)【発明者】
【氏名】チウ,ジャンズー
(72)【発明者】
【氏名】チィー,ウェイ
【審査官】酒井 恭信
(56)【参考文献】
【文献】特表2015-537317(JP,A)
【文献】米国特許出願公開第2014/0164720(US,A1)
【文献】中国特許出願公開第104854572(CN,A)
【文献】国際公開第2018/004902(WO,A1)
【文献】米国特許出願公開第2017/0371812(US,A1)
【文献】中国特許出願公開第109313609(CN,A)
【文献】特開平11-338768(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 12/06
G06F 13/16
G06F 15/173
(57)【特許請求の範囲】
【請求項1】
データ伝送装置(100)であって、
処理ユニットに結合される複数の第1のポート(101)と、
複数のメモリ(200)に結合される複数の第2のポート(102)と、
前記処理ユニットと前記複数のメモリ(200)との間でデータを伝送するように、前記第1のポート(101)と前記第2のポート(102)との間に配置されて複数の層を有するインターリーブネットワークを形成する複数のデータチャンネル(103)であって、前記インターリーブネットワークの各層が少なくとも1つのサブインターリーブネットワーク(1031)を含む複数のデータチャンネル(103)と、を含み、
前記インターリーブネットワークの前記複数の層内のサブインターリーブネットワーク(1031)の数は、前記第1のポート(101)から前記第2のポート(102)へ順次に増加するかまたは減少し、
前記第2のポート(102)がメモリコントローラ(201)を介して前記複数のメモリ(200)に結合され
ことを特徴とするデータ伝送装置(100)。
【請求項2】
前記複数のデータチャンネル(103)は、前記インターリーブネットワークの前記複数の層内の隣接する層を相互に接続するように、インターリーブチャンネルを含む、
ことを特徴とする請求項1に記載のデータ伝送装置(100)。
【請求項3】
前記第1のポート(101)により提供される総帯域幅は、前記第2のポート(102)により提供される総帯域幅以上である、
ことを特徴とする請求項1に記載のデータ伝送装置(100)。
【請求項4】
コンピュータにより実行されるデータ処理方法であって、
複数のメモリ(200)のうちの少なくとも1つのメモリ(200)におけるデータに対する読み取り要求が受信されたことに応答して、請求項1~のいずれかに記載のデータ伝送装置(100)を介して、前記読み取り要求の対象となる前記少なくとも1つのメモリ(200)から前記データを取得するステップ、を含む、
ことを特徴とするデータ処理方法。
【請求項5】
コンピュータにより実行されるデータ処理方法であって
複数のメモリ(200)のうちの少なくとも1つのメモリ(200)にデータを書き込む書き込み要求が受信されたことに応答して、請求項1~のいずれかに記載のデータ伝送装置(100)を介して、前記少なくとも1つのメモリ(200)に前記データを書き込むステップ、を含む、
ことを特徴とするデータ処理方法。
【請求項6】
データ処理システム(300)であって、
処理ユニットと、
請求項1~のいずれかに記載のデータ伝送装置(100)と、
1つまたは複数のプログラムが記憶されている記憶装置と、を含み、
前記1つまたは複数のプログラムが前記処理ユニットにより実行される場合、前記処理ユニットが、インターフェースに由来する要求に応じて請求項またはに記載の方法を実現する、
ことを特徴とするデータ処理システム(300)。
【請求項7】
前記データ伝送装置(100)が、前記処理ユニットに集積される、
ことを特徴とする請求項に記載のデータ処理システム(300)。
【請求項8】
前記データ処理システムの周りの任意の位置に複数のメモリ(200)が配置される、
ことを特徴とする請求項に記載のデータ処理システム(300)。
【請求項9】
コンピュータ読み取り可能な命令が記憶されているコンピュータ読み取り可能な記憶媒体であって、コンピュータ読み取り可能な命令が実行される場合、インターフェースに由来する要求に応じて、機器に請求項またはに記載のデータ処理方法を実行させる、
ことを特徴とするコンピュータ読み取り可能な記憶媒体。
【請求項10】
コンピュータ上で動作する際、インターフェースに由来する要求に応じて、前記コンピュータに請求項またはに記載のデータ処理方法を実行させる、
ことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施例は、主にデータ伝送の技術分野に関し、より具体的には、データ伝送装置、データ処理システム及び方法に関する。
【背景技術】
【0002】
現在、人工知能(AI)テクノロジーが広く利用されているにつれて、グラフィックス処理ユニット(GPU)またはAI専用チップの計算能力は増加している。これにより、メモリアクセスの帯域幅に対する要求がますます高くなり、512GB/s~1TB/sは非常に一般的であり、一部のチップさえ1TB/sを超えている。しかし、SoCの周波数とバス幅は、プロセスとタイミングに限られて絶えず増加させることができない。現在、ありふれたAXIインターフェイスは、一般的には、周波数は約1GHzで、データビット幅が1024ビット以下であり、一般的には、512ビットで、帯域幅は64GB/s(=1GHz*512ビット/8)であり、シングルチャンネルGDDR、HBMなどのストレージが提供する帯域幅に相当である。既存のメモリマルチチャンネルインターリーブ技術では通常、最大16(=1TB/64GB)のAXIインターフェイスを使い、十分なメモリ帯域幅を提供することにより、メモリアクセスの帯域幅要件を満たせる。
【0003】
しかし、メモリのマルチチャンネルインターリーブ、特に8チャンネル以上のインターリーブは大きな課題となる。一方、このような複数のチャンネルはSoCチップの片側に拡散するのが難しく、チップの両側または周囲に配置する必要がある。これにより、平面配置とチップの物理的な実現に大きな困難をもたらす。一方、マルチチャンネルはSoCのオンチップインターコネクト(NoC)とシステムパフォーマンスに挑戦し、如何にインターリーブをサポートしないモジュールをシステムに導入するかを含むだけでなく、様々な状況でパフォーマンス帯域幅はシステム要件などを満たすかどうかを慎重に評価する必要もある。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示の例示的な実施例により、データ伝送装置の解決策を提供し、上記の問題及び/または他の潜在的な問題を解決、または少なくとも部分的に解決する。
【課題を解決するための手段】
【0005】
本開示の第1の態様により、データ伝送装置を提供する。データ伝送装置は、処理ユニットに結合される複数の第1のポートと、複数のメモリに結合される複数の第2のポートと、前記処理ユニットと前記複数のメモリとの間でデータを伝送するように、第1のポートと第2のポートとの間に配置されて複数の層を有するインターリーブネットワークを形成するための複数のデータチャンネルであって、前記インターリーブネットワークの各層が少なくとも1つのサブインターリーブネットワークを含む複数のデータチャンネルと、を含む。
【0006】
複数のチャンネル、階層化メモリインターリーブ技術を採用することにより、ハードウェアに由来するコストを削減させ、拡張性と柔軟性を向上する。少なくとも1層を分散するように設置され、即ち複数のサブインターリーブネットワークに画分されるため、長いパスを必要とするデータチャンネルが大幅に削減される。これにより、消費電力、データ伝送の遅延及び安定性の点では有利である。また、階層化インターリーブネットワークのデータ伝送技術により、対称構造の配置を実現しやすくなり、データ処理システムにおける様々なモジュールを配置しやすくなる。
【0007】
いくつかの実施例では、複数のデータチャンネルは、インターリーブネットワークの複数の層内の隣接する層を相互に接続するように、インターリーブチャンネルを含む。これにより、データ伝送の効率と拡張性をさらに向上する。
【0008】
いくつかの実施例では、インターリーブネットワークの複数の層内のサブインターリーブネットワークの数は、第1のポートから第2のポートへ順次に増加するかまたは減少する。各層の間のサブインターリーブネットワークの様々な組み合わせを適用することにより、拡張性と柔軟性をさらに向上する。
【0009】
いくつかの実施例では、第1のポートにより提供される総帯域幅は、第2のポートにより提供される総帯域幅以上である。
【0010】
一部の実施例では、第2のポートはメモリコントローラを介して複数のメモリに結合される。
【0011】
本開示の第2の態様により、データ処理方法を提供する。データ処理方法は、複数のメモリのうちの少なくとも1つのメモリにおけるデータに対する読み取り要求が受信されたことに応答して、本開示の第1の態様のデータ伝送装置を介して、読み取り要求の対象となる少なくとも1つのメモリからデータを取得するステップを含む。
【0012】
本開示の第3の態様により、データ処理方法を提供する。データ処理方法は、複数のメモリのうちの少なくとも1つのメモリにデータを書き込む書き込み要求が受信されたことに応答して、本開示の第1の態様のデータ伝送装置を介して、少なくとも1つのメモリにデータを書き込むステップを含む。
【0013】
本開示の第4の態様により、データ処理システムを提供する。データ処理システムは、処理ユニットと、本開示の第1の態様のデータ伝送装置と、1つまたは複数のプログラムが記憶されている記憶装置とを含み、1つまたは複数のプログラムが前記処理ユニットにより実行される場合、前記処理ユニットが本開示の第2の態様または第3の態様の方法を実現する。
【0014】
いくつかの実施例では、データ伝送装置は処理ユニットに集積される。
【0015】
いくつかの実施例では、前記データ処理システムの周りに任意の位置に複数のメモリが配置される。
【0016】
本開示の第5の態様により、コンピュータ読み取り可能な命令が記憶されているコンピュータ読み取り可能な記憶媒体を提供する。コンピュータ読み取り可能な命令が実行される場合、機器に本開示の第2の態様または第3の態様の方法を実現させる。
【0017】
発明の概要で説明される発明の内容は、本開示の実施例の鍵または重要な特徴を限定することを意図していない。本開示の他の特徴は、以下の説明により容易に理解される。
【図面の簡単な説明】
【0018】
図面に併せて説明を参照することにより、本開示の各実施例の上記と他の特徴、利点及び態様はより明らかになる。図面において、同じまたは類似の参照番号は、同じまたは類似の要素を示す。
図1】従来技術におけるメモリインターリーブ技術を採用するデータ伝送を示す概略図である。
図2】本開示のいくつかの実施例に係るマルチチャンネル、階層化メモリインターリーブ技術を採用するデータ伝送を示す概略図である。
図3】本開示のいくつかの実施例に係るマルチチャンネル、階層化メモリインターリーブ技術を採用する物理的な実現を示す概略図である。
図4】本開示の他の実施例に係るマルチチャンネル、階層化メモリインターリーブ技術を採用するデータ伝送を示す概略図である。
図5】本開示の他の実施例に係るマルチチャンネル、階層化メモリインターリーブ技術を採用するデータ伝送を示す概略図である。
図6】本開示の例示的な実施例に係るデータ処理方法のフロー図である。
図7】本開示の例示的な実施例に係るデータ処理方法のフロー図である。
図8】本開示の各実施例を実施できるコンピューティング機器のブロック図である。
【発明を実施するための形態】
【0019】
本開示の実施例は、以下に図面を参照してより詳細に説明する。本開示のある実施例が図面に示されているが、本発明は様々な形態で具現化され、本明細書に記載される実施例に限られるものではなく、逆に本開示をより明確かつ完全に理解されるように実施例を提供する。本開示の図面及び実施例は単に例示とし、本開示の範囲を限定するものではない。
【0020】
本開示の実施例の説明において、用語「含む」などは、「含むが、これに限定されない」と理解されるべきである。「に基づいて」という用語は、「少なくとも部分的に基づいて」と理解されるべきである。「一実施例」または「実施例」という用語は、「少なくとも1つの実施例」を理解されるべきである。「第1」、「第2」などの用語は、異なるまたは同一のオブジェクトを指せる。以下に他の明示的及び暗黙的な定義も含まれる場合がある。
【0021】
メモリインターリーブ技術は、メモリ性能を改善するための技術であり、より多くの伝送チャンネルとより高いメモリ帯域幅を提供でき、メモリが複数の書き込み/読み取り操作を同時に実行させ、システムのパフォーマンスを効果的に改善する。図1は、従来技術におけるメモリインターリーブ技術を採用するデータ伝送を示す図である。図1に示すように、システムオンチップ(SoC)を例として、複数のチャンネル(特に8チャンネル以上)のメモリインターリーブである場合は、制御側とメモリ側は、一般的に、N×Nクロスバー(crossbar)により相互に接続される。
【0022】
SoCシステムの処理ユニット101’は、通常、インターリーブデータチャンネル103’、メモリコントローラ及び物理層(PHY)を介して、メモリ200’と相互に接続される。SoCシステムチップ配置のニーズに応じて、メモリコントローラーと物理層をSoCシステムの両側またはより多くの側に分布する必要がある場合、通常の500mmのAIチップにとっては、マルチチャンネルクロスバーの実現は非常に困難である。
【0023】
特に、このようなサイズのチップは通常対称構造により実現され、複数のブロック(block)に画分される場合、モジュール画分及び対称構造の実装は困難である。発明者の検討により、従来技術ではマルチチャンネルインターリーブネットワークの層は1つしかないことに由来することが判明した。
【0024】
発明者は上記の発見に基づいて、上記及び/または他の潜在的な問題を解決または少なくとも部分的に解決するために、マルチチャンネルの階層化インターリーブネットワークに基づくデータ伝送技術を提案した。データ伝送技術は、データ伝送装置として具現化することができる。本明細書のデータ伝送装置は、SoCなどの任意の適切な環境に適用されるモジュールであってもよい。
【0025】
図2は、本開示のいくつかの実施例に係るマルチチャンネル、階層化メモリインターリーブ技術を採用するデータ伝送を示す図である。図2に示すように、データ伝送装置は、処理ユニット(例えば、SoCシステムの処理ユニット)に結合される複数の第1のポート101と、複数のメモリ(200)に結合される複数の第2のポート102と、複数のデータチャンネル103と含む。複数のデータチャンネル103は、第1のポート101と第2のポート102との間に配置され、処理ユニットと複数のメモリ102との間のデータを伝送する。
【0026】
第2のポート102は、メモリコントローラ及び物理層を介して複数のメモリに結合することができる。第1のポート101と第2のポート102の数は同一でもよいし、同一でなくてもよく、一般的に、第1のポート101により提供される総帯域幅は、第2のポート102により提供される総帯域幅以上である。例えば、いくつかの実施例では、ビット幅が同じである場合、第1のポート101の数は第2のポート102の数と異なってもよい。以下は、同数の第1のポート101と第2のポート102の数と同じである場合を例として(例えば、N×N)、本開示の実施例による改善を説明する。
【0027】
従来のメモリインターリーブ技術を採用するデータチャンネルとは異なり、本開示の実施例に係る複数のデータチャンネルは、階層化メモリインターリーブ方式を採用する。データチャンネルのインターリーブネットワークの各層には、少なくとも1つのサブインターリーブネットワーク1031が含まれる。すなわち、複数のデータチャンネルは階層化インターリーブネットワークを採用する。例えば、図2に示すように、複数のデータチャンネルは2層構造に画分され、第1層に1つのサブインターリーブネットワークがあり、第2層に2つのサブインターリーブネットワークがある。
【0028】
この場合、第1層のサブインターリーブネットワークはN×2インターリーブを採用するだけで、第2層の各サブインターリーブネットワークは(N/2)×(N/2)インターリーブを採用するだけでよい。まず、階層化技術を採用するため、ハードウェアに由来するコストは非常に少なくなることは明らかである。具体的には、単層のN×Nインターリーブネットワークの場合、図2に示す例のN×2+2×(N/2)×(N/2)インターリーブネットワークに由来するコストよりもはるかに多い。次に、少なくとも1つの層が分散されるように設置され、すなわち複数のサブインターリーブネットワークに画分されるため、長い経路のデータ経路は大幅に削減される。これにより、消費電力、データ伝送の遅延及び安定性の点では有利である。
【0029】
階層化メモリインターリーブ技術により、各層は単独または他の既存のモジュールとともに新しいモジュールを形成できるため、各サブインターリーブネットワークはいずれも大きな面積を利用せず、より柔軟に配置できる。図3に示すように、図2に示す階層化インターリーブネットワークを採用するデータ伝送技術は、対称構造の配置をより容易に実現することができる。
【0030】
いくつかの実施例では、物理的に実現される時に、図2に示す第2層、必要なメモリコントローラ及び物理層は、人工知能(AI)演算モジュールに組み込むことにより実現され得る。このようにして、モジュール画分と対称構造をより適切に実現できるため、階層化技術の拡張性を向上する。例えば、合理的なモジュール画分と対称構造により、チャンネル数を8チャンネルから16チャンネル、さらには32チャンネル以上に簡単に拡張できる。これにより、メモリアクセス帯域幅に対する高い要求を簡単に実現できる。
【0031】
いくつかの実施例では、インターリーブネットワークの複数の層のうちの少なくとも隣接するサブインターリーブネットワーク間で、インターリーブデータチャンネルを採用して相互に接続する。各隣接する層の間ではAXIインターフェイスなどのデータ伝送プロトコルを採用してデータを伝送する。これにより、データ伝送の効率と拡張性をさらに向上する。
【0032】
さらに、図2には本開示のいくつかの実施例に係るマルチチャンネルの階層化メモリインターリーブ技術を採用するデータ伝送の概略図だけが示されている。勿論、これは単なる例示であり、本開示の範囲を限定することを意図していない。本開示の実施例に係る階層化内部インターリーブを採用するデータ伝送装置は、様々なモジュール及び/またはサブインターリーブネットワークをより柔軟に調整できる。
【0033】
例えば、図4に示されるように、いくつかの実施例では、複数のデータチャンネル103も2つの層を形成するインターリーブネットワークである。図2に示す実施例とは異なり、第1層インターリーブネットワークには1つのサブインターリーブネットワーク1031があり、第2層インターリーブネットワークには4つのサブインターリーブネットワークがある。このように、第1層のサブインターリーブネットワークはN×4インターリーブを採用でき、第2層の各サブインターリーブネットワークは(N/4)×(N/4)インターリーブを採用できる。これにより、ハードウェアに由来するコストをさらに削減できるとともに、様々なモジュール画分方法もできる。また、この配置により、メモリをSoCチップの周りに対称的に配置することもできる。
【0034】
図2及び図4は、データチャンネルをインターリーブネットワークの2つの層に画分できる場合を示している。図2及び図4の実施例の説明から、各層のサブインターリーブネットワークの数は、実際の状況に応じて柔軟に調整できる。いくつかの実施例では、複数の層内のサブインターリーブネットワークの数は、第1のポート102から第2のポートへ順次に増加するかまたは減少する。各層の間でのサブインターリーブネットワークを様々に組み合わせることにより、データ伝送の拡張性と柔軟性をさらに向上する。
【0035】
サブインターリーブネットワークの様々な組み合わせ方式は、各層のサブインターリーブネットワークの数を実際のニーズに応じて柔軟に調整できる以外、インターリーブネットワークの層数も調整できる。チャンネルの数が多いほど、考慮できる層の数も多くなる。例えば、いくつかの実施例では、図5に示されるように、3つの層を有する16チャンネルのインターリーブネットワークが示されている。第1層は1つのサブインターリーブネットワーク1031を有し、第2層は2つのサブインターリーブネットワーク1031を有し、第3層は4つのサブインターリーブネットワーク1031を有する。
【0036】
この場合、第1層のサブインターリーブネットワーク1031はN×2インターリーブを採用することができ、第2層の各サブインターリーブネットワークは(N/2)×(N/4)インターリーブを採用することができ、第3層のサブインターリーブネットワークは(N/4)×(N/4)インターリーブ方式を採用できる。この多層構造により、サブインターリーブネットワークがさらに細分化されるため、モジュールの画分と対称配置がより容易になり、柔軟性と拡張性をさらに向上する。
【0037】
上記の層の数及び各層のサブインターリーブネットワークの数は柔軟に調整することができる以外、面積をさらに最適化するために、第1のポート101または第2のポート102のいずれかのビット幅を増加させることにより、インターフェイスの数を減少しても良い。
【0038】
例えば、いくつかの実施例では、第1のポート101のビット幅は、第2のポートのビット幅の2倍であってもよい。これにより、第1のポート101の数は、第2のポート102の数の半分であっても良い。2層構造のインターリーブネットワークを採用する場合、一方、第1層のサブインターリーブネットワークは(N/2)×2のインターリーブ方法を採用できる。これにより、第1層の面積とルーティングを大幅に削減できる。一方、ルーティングの削減によって、より友好的な物理的な実現をもたらす。例えば、チャンネルが16である場合、8つの第1のポート101のみが必要になる。
【0039】
上記は、データチャンネルが2つ以上の層を有することができ、かつ各層が異なる数のサブインターリーブネットワークを有するマルチチャンネルインターリーブ方式を説明している。このマルチチャンネルインターリーブ方式は、データチャンネルの複数の配置モードを実現し、高い拡張性とマルチチャンネル及び階層化のメモリインターリーブ方式が物理的に実現される。
【0040】
本開示の実施例により、読み取りデータ処理方法600を提供する。読み取りデータ処理方法600は、データ処理システム内の処理ユニットにより実行されることができる。図6は、本開示の例示的な実施例に係るデータ処理方法のフロー図である。図面に示されるように、610では、複数のメモリ200のうちの少なくとも1つのメモリ200におけるデータに対する読み取り要求が受信されたか否やかを判定する。読み取り要求が受信された場合、方法600は620で上記データ伝送装置を介して、読み取り要求の対象となる少なくとも1つのメモリ200からデータを取得する。
【0041】
例えば、ユーザがメモリまたは他の記憶装置に保存されているデータを処理しようとする場合、ユーザは適切なインターフェースを介してデータに対する読み取り要求を処理ユニットに伝送することができる。データが他のストレージ機器に保存されている場合、適切な操作を介してデータがメモリにダンプできる。読み取り要求には、メモリ内のデータのアドレスを含んでも良い。これらのデータに対する読み取り要求が受信された場合、処理部はアドレス情報に基づいてメモリ200からデータを取得できる。データを取得した後、相応的に処理し、インターフェイスを介してユーザに指定されたモジュールに伝送し、さらなる処理を行うことができる。例えば、データは処理ユニットで読み取って処理した後、メモリ200に書き込み、さらなる処理を行うことができる。
【0042】
本開示の実施例により、書き込みデータ処理方法700を提供する。書き込みデータ処理方法700は、データ処理システム内の処理ユニットにより実行されることができる。図7は、本開示の例示的な実施例に係るデータ処理方法のフロー図である。図面に示されるように、710では、複数のメモリ200のうちの少なくとも1つのメモリ200にデータを書き込む書き込み要求が受信されたか否やかを判定する。書き込み要求が受信された場合、方法700は720で上記のデータ伝送装置を介して、少なくとも1つのメモリにデータを書き込む。
【0043】
例えば、処理ユニットはデータの処理を終了し、処理されたデータをメモリ200に書き込む要求が受信された場合、上記のデータ伝送装置を介して、メモリ200に書き込み、さらなる処理を行うことができる。
【0044】
上記の方法はマルチチャンネル、階層化のメモリインターリーブ方法を採用することにより、ロングパスデータチャンネルの数を効果的に削減し、データの伝送効率と安定性を向上する。
【0045】
本開示の実施例により、図3に示すように、データ処理システム300を提供する。データ処理システムは、処理ユニットと、記憶装置と、上記データ伝送装置100とを含む。データ処理システム300は、いくつかの実施例ではシステムオンチップSoCであってもよい。ストレージ機器は、少なくとも1つのプログラムを記憶している。当該少なくとも1つのプログラムは、処理ユニットにより実行される場合、処理ユニットが上記の方法を実現することができる。上記のデータ伝送装置100を採用するデータ処理システム300の配置は、もっと合理的でより大きな拡張性を有し、電力消費はより少ない。
【0046】
いくつかの実施例では、データ伝送装置100は処理ユニットに集積することができる。すなわち、いくつかの実施例では、システムオンチップSoCは少なくとも1つの処理ユニットを含み、データ伝送装置100はシステムオンチップ処理ユニットに集積されるデータチャンネルであってもよい。いくつかの実施例では、複数のメモリ200はデータ処理システム(例えば、システムオンチップSoC)の任意の位置に、例えば対称的に両側または周囲に配置されることができる。上記の構成を採用するデータ処理ユニットは、より簡単に物理的に実現されることができる。
【0047】
図8は、本開示の各実施例を実施できるコンピューティング機器のブロック図である。装置800は図7及び図8に示される方法の実施に採用することができる。図面に示されるように、機器800は、読み取り専用メモリ(ROM)802に記憶されているコンピュータプログラム命令または記憶装置808からランダムアクセスメモリ(RAM)803にロードされたコンピュータプログラム命令に従って、適切な各アクションとプロセスを実行する中央処理装置(CPU)801を含む。RAM803には、機器800の動作に必要な様々なプログラム及びデータも記憶することができる。CPU801、ROM802、及びRAM803は、バス804を介して相互に接続される。入力/出力(I/O)インターフェース805もバス804に接続される。
【0048】
キーボード、マウスなどの入力ユニット806と、様々なタイプのディスプレイ、スピーカーなどの出力ユニット807と、ハードディスク、光ディスクなどの記憶装置808と、ネットワークカード、モデム、無線通信トランシーバなどの通信ユニット809と、を含む機器800内の複数の部材は、I/Oインターフェース805に接続される。通信ユニット809により、機器800がインターネット及び/または様々な電気通信ネットワークなどのコンピュータネットワークを介して、他の機器と情報/データを交換することができる。
【0049】
処理ユニット801は、プロセス600及び700などの上記の様々な方法及びプロセスを実行する。例えば、いくつかの実施例では、プロセス600及び700はコンピュータプログラムとして実装し、記憶装置808などのコンピュータ読み取り可能な媒体に具現的に含まれる。いくつかの実施例では、コンピュータプログラムの一部またはすべてを、ROM602及び/または通信ユニット809を介して機器800にロード及び/またはインストールすることができる。コンピュータプログラムがRAM803にロードされ、CPU801により実行される場合、上記のステップ600及び700の1つまたは複数のステップを実行することができる。また他の実施例では、CPU801は任意の他の適切な手段(例えば、ファームウェアに依存する)により、プロセス600及び700を実行するように構成され得る。
【0050】
本明細書で上記の機能は少なくとも部分的に、1つまたは複数のハードウェア論理ユニットにより実行することができる。例えば、制限なく、使用できるハードウェア論理ユニットの典型的なタイプは、現場でプログラム可能なゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、プログラマブルロジック機器(CPLD)などを含む。
【0051】
本開示の方法を実施するためのプログラムコードは、1つまたは複数のプログラミング言語の任意の組み合わせでコーディングすることができる。プログラムコードは、汎用コンピューター、専用コンピューター、または他のプログラム可能なデータ処理装置のプロセッサーまたはコントローラーに提供され、プログラムコードがプロセッサーまたはコントローラーにより実行される場合、フロー図及び/またはブロック図に特定される機能/操作が実行される。プログラムコードは、完全にマシン上で、一部はマシン上で、スタンドアロンソフトウェアパッケージの一部としてマシン上で、一部はリモートマシン上で、あるいは完全にリモートマシンまたはサーバー上で実行され得る。
【0052】
本開示の文脈において、機械読み取り可能な媒体は有形の媒体で、命令実行システム、装置または機器により使用、あるいは命令実行システム、装置または機器に結合するためのプログラムを含むまたは記憶することができる。機械読み取り可能な媒体は、機械読み取り可能な信号媒体または機械読み取り可能な記憶媒体であり得る。機械読み取り可能な媒体は電子、磁気、光学、電磁気、赤外線、または半導体システム、装置、または機器、または上記の任意の適切な組み合わせを含めるが、それらに限定されない。機械読み取り可能な記憶媒体のより具体的な例には、1つまたは1つ上のワイヤによる電気接続、ポータブルコンピューターディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能なプログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバー、コンパクトコンパクトディスク読み取り専用メモリ(CD-ROM)、光学記憶装置、磁気記憶装置、または上記の任意の適切な組み合わせを含む。
【0053】
さらに、操作は特定の順序で示されているが、これは、そのような操作により特定の順序を示すまたは順序で実行されるため、または示されたすべての操作を実行して望ましい結果を得るためである。特定の状況では、マルチタスクと並列処理は有利になる。同様に、いくつかの特定の実現の詳細が上記の説明に含まれているが、これらは開示の範囲を限定するものとして解釈されるべきではない。単独の実施例の文脈で説明された一部の特徴は、単一の実現に組み合わせて実現することもできる。逆に、単一の実現の文脈で説明された様々な特徴は、単一または任意の適切なサブ組み合わせる方式で複数の実現に実現できる。
【0054】
本開示の上記の詳細な実施例は、単に本開示の原理を例示または説明することにより、本開示を限定することを意図していない。したがって、本開示の旨及び範囲内で行われた修正、同等の置換及び改善は、本開示の範囲内に含まれるべきである。また、添付の請求項は、請求項の範囲と限定の同等の代替の範囲と限定以内のすべての変更及び修正を含むことを意図している。
図1
図2
図3
図4
図5
図6
図7
図8