(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-19
(54)【発明の名称】データファブリッククロックスイッチング
(51)【国際特許分類】
G06F 12/00 20060101AFI20240312BHJP
【FI】
G06F12/00 550E
G06F12/00 564C
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023560432
(86)(22)【出願日】2022-03-17
(85)【翻訳文提出日】2023-11-07
(86)【国際出願番号】 US2022020694
(87)【国際公開番号】W WO2022212074
(87)【国際公開日】2022-10-06
(32)【優先日】2021-03-31
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】591016172
【氏名又は名称】アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド
【氏名又は名称原語表記】ADVANCED MICRO DEVICES INCORPORATED
(74)【代理人】
【識別番号】100108833
【氏名又は名称】早川 裕司
(74)【代理人】
【識別番号】100111615
【氏名又は名称】佐野 良太
(74)【代理人】
【識別番号】100162156
【氏名又は名称】村雨 圭介
(72)【発明者】
【氏名】ジェームズ アール. マグロ
(72)【発明者】
【氏名】クリストファー ウィーバー
(72)【発明者】
【氏名】アビシェク クマール ヴェルマ
【テーマコード(参考)】
5B160
【Fターム(参考)】
5B160CC03
(57)【要約】
メモリコントローラは、データファブリッククロックドメインと、物理層インターフェース回路PHYクロックドメインと、に結合する。第1のインターフェース回路は、データファブリッククロックドメイン(FCLK)とメモリコントローラクロックドメインとの間の転送を適合させ、第2のインターフェース回路は、メモリコントローラをPHYクロックドメインに結合する。パワーコントローラは、メモリシステムのパラメータを変更し、複数の電力状態のうち選択された電力状態に従ってメモリコントローラのタイミングパラメータのセットを更新するために、第2のインターフェース回路にコマンドを送信することによって電力状態変更要求に応答する。パワーコントローラは、メモリシステムのタイミングパラメータのセット又は選択された電力状態を変更することなくクロックインターフェース回路のタイミングパラメータのセットを変更することによって、FCLKドメインの新しい周波数と同期する要求に応答する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
メモリコントローラであって、
第1のクロックドメインにおいて動作するデータファブリックに結合するように適合された第1のインターフェース回路と、第3のクロックドメインにおいて動作する物理レイヤインターフェース回路(PHY)に結合するように適合された第2のインターフェース回路と、を有するメモリチャネルコントローラであって、前記メモリチャネルコントローラは、タイミングパラメータのセットに従って第2のクロックドメインにおいて動作し、前記第1のインターフェース回路は、前記第1のクロックドメインと前記第2のクロックドメインとの間の転送を適合させるためのクロックインターフェース回路を含む、メモリチャネルコントローラと、
前記メモリチャネルコントローラに結合されたパワーコントローラであって、電力状態変更要求に応じて、メモリシステムのパラメータを変更するためのコマンドを前記第2のインターフェース回路に送信し、複数の電力状態のうち選択された電力状態に従って前記メモリチャネルコントローラのタイミングパラメータのセットを更新するパワーコントローラと、を備え、
前記パワーコントローラは、前記メモリシステムのタイミングパラメータのセット又は前記選択された電力状態を変更することなく前記クロックインターフェース回路のタイミングパラメータのセットを変更するために、前記第1のインターフェース回路を前記第1のクロックドメインの第1のクロック信号のみの新しい周波数と同期させる要求に応答する、
メモリコントローラ。
【請求項2】
前記第1のクロックドメインの第1のクロック信号のみの新しい周波数と同期する要求は、電力状態オーバーライド信号と、後続の電力状態コマンドと、を含み、前記電力状態オーバーライド信号は、前記パワーコントローラに、前記第1のクロックドメインの変更に関連付けられた後続の電力状態コマンドに応答する場合に、選択されたメモリコントローラクロックドメイン状態変更回路及びメモリクロックドメイン状態変更回路を無効化させる、
請求項1のメモリコントローラ。
【請求項3】
前記パワーコントローラは、
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応答する場合に、前記メモリコントローラの動作パラメータを含む前記メモリコントローラの電力状態制御レジスタのいくつかのセットの中から電力状態制御レジスタの新しいセットを選択し、
前の電力状態コマンドオーバーライド信号を伴う電力状態コマンドに応答する場合に、電力状態制御レジスタの新しいセットを選択しないように動作可能である、
請求項2のメモリコントローラ。
【請求項4】
前記パワーコントローラは、
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応答する場合に、前記PHYの動作パラメータを含む前記PHYの電力状態制御レジスタのいくつかのセットの中から前記PHYの電力状態制御レジスタの新しいセットを選択し、
前の電力状態コマンドオーバーライド信号を伴う電力状態コマンドに応答する場合に、前記PHYの電力状態制御レジスタの新しいセットを選択しないように動作可能である、
請求項2のメモリコントローラ。
【請求項5】
前記PHYの電力状態制御レジスタのセットの各々は、前記PHYに接続され、前記メモリコントローラに関連付けられたダイナミックランダムアクセスメモリ(DRAM)のサポートされた電力状態に対応する、
請求項4のメモリコントローラ。
【請求項6】
前記第2のクロックドメインにクロック信号を供給し、前記パワーコントローラに結合された位相ロックループ(PLL)を備える、
請求項1のメモリコントローラ。
【請求項7】
メモリコントローラにおいて電力状態コマンドを受信することと、メモリコントローラクロックドメイン及びメモリクロックドメインのうち少なくとも1つの動作周波数を変更することに応じて、メモリコントローラバスインターフェースをデータファブリッククロックドメインと再同期させ、物理レイヤインターフェース(PHY)を前記メモリコントローラと再同期させることと、
前記メモリコントローラを前記データファブリッククロックドメインの第1のクロック信号のみの周波数と再同期させる要求を受信し、これに応じて、前記PHYを前記メモリコントローラと再同期させることなく、前記データファブリッククロックドメインと前記メモリコントローラクロックドメインとの間のクロックインターフェース回路のタイミングパラメータのセットを変更し、メモリ又は前記メモリコントローラのタイミングパラメータのセットを変更することと、を含む、
方法。
【請求項8】
前記メモリコントローラを再同期させる要求は、電力状態オーバーライド信号と、後続の電力状態コマンドと、を含み、
前記方法は、前記データファブリッククロックドメインの変更に関連付けられた後続の電力状態コマンドに応答する場合に、選択されたメモリコントローラクロックドメイン状態変更回路及びメモリクロックドメイン状態変更回路を無効化することを含む、
請求項7の方法。
【請求項9】
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応答する場合に、前記メモリコントローラの動作パラメータを含む前記メモリコントローラの電力状態制御レジスタのいくつかのセットの中から電力状態制御レジスタの新しいセットを選択することと、
前の電力状態コマンドオーバーライド信号を伴う電力状態コマンドに応答する場合に、電力状態制御レジスタの新しいセットを選択しないことと、を含む、
請求項7の方法。
【請求項10】
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応答する場合に、前記PHYの動作パラメータを含む前記PHYの電力状態制御レジスタのいくつかのセットの中から前記PHYの電力状態制御レジスタの新しいセットを選択することと、
前の電力状態コマンドオーバーライド信号を伴う電力状態コマンドに応答する場合に、前記PHYの電力状態制御レジスタの新しいセットを選択しないことと、を含む、
請求項7の方法。
【請求項11】
前記PHYの電力状態制御レジスタのセットの各々は、前記PHYに接続され、前記メモリコントローラに関連付けられたダイナミックランダムアクセスメモリ(DRAM)のサポートされた電力状態に対応する、
請求項10の方法。
【請求項12】
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応じて、前記メモリコントローラクロックドメインのクロック信号を供給する位相ロックループ(PLL)を調整することを含む、
請求項7の方法。
【請求項13】
システム管理ユニットコントローラにおいて、前記データファブリッククロックドメインがその動作周波数を変更すべきであることを決定し、その後、前記電力状態コマンドオーバーライド信号を前記メモリコントローラに送信して、前記データファブリッククロックドメインにその動作周波数を変更させ、前記後続の電力状態コマンドを前記メモリコントローラに送信することを含む、
請求項7の方法。
【請求項14】
前記後続の電力状態コマンドは、現在のメモリコントローラクロックドメイン動作周波数と、現在のメモリクロックドメイン動作周波数と、調整されたデータファブリッククロックドメイン動作周波数と、を示す電力状態データを含む、
請求項13の方法。
【請求項15】
データ処理システムであって、
データファブリッククロックドメインで動作するデータファブリックと、
DRAMメモリに結合するためのメモリクロックドメインで動作する物理レイヤインターフェース(PHY)を含むメモリチャネルと、
前記データファブリックに結合するように適合された第1のインターフェース回路と、前記PHYに結合するように適合された第2のインターフェース回路と、を含むメモリチャネルコントローラであって、前記メモリチャネルコントローラは、タイミングパラメータのセットに従ってメモリチャネルクロックドメインにおいて動作し、前記第1のインターフェース回路は、前記データファブリッククロックドメインと前記メモリチャネルクロックドメインとの間の転送を適合させるためのクロックインターフェース回路を含む、メモリチャネルコントローラと、
前記メモリチャネルコントローラに結合されたパワーコントローラであって、電力状態変更要求に応じて、メモリシステムのパラメータを変更するためのコマンドを前記第2のインターフェース回路に送信し、複数の電力状態のうち選択された電力状態に従って前記メモリチャネルコントローラのタイミングパラメータのセットを更新するパワーコントローラと、を備え、
前記パワーコントローラは、前記メモリシステムのタイミングパラメータのセット又は前記選択された電力状態を変更することなく前記クロックインターフェース回路のタイミングパラメータのセットを変更するために、前記クロックインターフェース回路を前記データファブリッククロックドメインの第1のクロック信号のみの新しい周波数と同期させる要求に応答する、
データ処理システム。
【請求項16】
前記クロックインターフェース回路を前記データファブリッククロックドメインの第1のクロック信号のみの新しい周波数と同期させる要求は、電力状態オーバーライド信号と、後続の電力状態コマンドと、を含み、前記電力状態オーバーライド信号は、前記パワーコントローラに、前記データファブリッククロックドメインの変更に関連付けられた後続の電力状態コマンドに応答する場合に、選択されたメモリコントローラクロックドメイン状態変更回路及びメモリクロックドメイン状態変更回路を無効化させる、
請求項15のデータ処理システム。
【請求項17】
前記パワーコントローラは、
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応答する場合に、前記メモリコントローラの動作パラメータを含む前記メモリコントローラの限られた数の電力状態制御レジスタのセットの中から電力状態制御レジスタの新しいセットを選択し、
前の電力状態コマンドオーバーライド信号を伴う電力状態コマンドに応答する場合に、電力状態制御レジスタの新しいセットを選択しないように動作可能である、
請求項16のデータ処理システム。
【請求項18】
前記パワーコントローラは、
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応答する場合に、前記PHYの動作パラメータを含む前記PHYの電力状態制御レジスタのセットの中から前記PHYの電力状態制御レジスタの新しいセットを選択し、
前の電力状態コマンドオーバーライド信号を伴う電力状態コマンドに応答する場合に、前記PHYの電力状態制御レジスタの新しいセットを選択しないように動作可能である、
請求項16のデータ処理システム。
【請求項19】
前記PHYの電力状態制御レジスタのセットの各々は、前記PHYに接続され、前記メモリコントローラに関連付けられたダイナミックランダムアクセスメモリ(DRAM)のサポートされた電力状態に対応する、
請求項18のデータ処理システム。
【請求項20】
前記メモリコントローラクロックドメインにクロック信号を供給し、前記パワーコントローラに結合された位相ロックループ(PLL)を備える、
請求項15のデータ処理システム。
【請求項21】
前記データファブリックに結合され、前記電力状態コマンド及び前記電力状態コマンドオーバーライド信号を前記メモリコントローラに送信するように動作可能なシステム管理ユニットを備える、
請求項15のデータ処理システム。
【請求項22】
前記システム管理ユニットは、前記データファブリッククロックドメインの動作周波数を制御するように動作可能である、
請求項21のデータ処理システム。
【発明の詳細な説明】
【背景技術】
【0001】
コンピュータシステムは、一般に、メインメモリ用の安価で高密度のダイナミックランダムアクセスメモリ(DRAM)チップを使用する。今日販売されている殆どのDRAMチップは、Joint Electron Devices Engineering Council(JEDEC)によって広められた様々なダブルデータ速度(DDR)DRAM規格と適合する。
【0002】
メモリコントローラは、メモリバスを介してDRAMに出入りするデータの流れを管理するデジタル回路である。既知のメモリコントローラは、ホストシステムからメモリアクセス要求を受信し、それらをキューに記憶し、アービタによって選択された順序でそれらをDRAMにディスパッチする。メモリコントローラは、典型的には、可能な限り電力を節約しながらコンピュータシステムのメモリ使用要求を満たすために、定義された電力状態のグループに従ってそれらの電力状態を変更するように指示される。多くの場合、電力状態は、パーソナルコンピュータ(PC)及びサーバ等のコンピュータのための電力管理及び構成標準であるAdvanced Configuration and Power Interface(ACPI)仕様等の仕様に従って制御される。ACPIは、コンピュータオペレーティングシステムが、異なる動作周波数、異なる供給電圧及び異なる動作モードを含み得るモードの限られたセットの中からデバイスの動作モードを変更することによって、様々なデバイスにおいて消費される電力を管理することを可能にする。
【図面の簡単な説明】
【0003】
【
図1】先行技術で知られている加速処理ユニット(accelerated processing unit、APU)及びメモリシステムのブロック図である。
【
図2】いくつかの実施形態に係る、
図1と同様のAPUで用いるのに適したメモリコントローラのブロック図である。
【
図3】メモリチャネルコントローラにおいてクロックドメイン信号及びクロックドメインにわたる同期を提供するためのAPUのいくつかの要素のブロック図である。
【
図4】いくつかの実施形態に係る、メモリコントローラにおいて電力状態を変更するためのプロセスのフローチャートである。
【
図5】いくつかの実施形態に係る、電力状態コマンドに応答するためのプロセスのフローチャートである。
【発明を実施するための形態】
【0004】
以下の説明において、異なる図面における同一の符号の使用は、同様の又は同一のアイテムを示す。別段言及されなければ、「結合される」という単語及びその関連する動詞形は、当技術分野で知られている手段による直接接続及び間接電気接続の両方を含み、また、別段言及されなければ、直接接続の任意の記述は、好適な形態の間接電気接続を使用する代替の実施形態も意味する。
【0005】
メモリコントローラは、メモリチャネルコントローラ及びパワーコントローラを含む。メモリチャネルコントローラは、第1のクロックドメインで動作するデータファブリックに接続するように適合された第1のインターフェース回路と、第3のクロックドメインで動作する物理層インターフェース回路(PHY)に接続するように適合された第2のインターフェース回路と、を有する。メモリチャネルコントローラは、タイミングパラメータのセットに従って第2のクロックドメインにおいて動作する。第1のインターフェース回路は、第1のクロックドメインと第2のクロックドメインとの間の転送を適合させるためのクロックインターフェース回路を含む。パワーコントローラは、メモリチャネルコントローラに結合され、電力状態変更要求に応じて、メモリシステムのパラメータを変更するためのコマンドを第2のインターフェース回路に送信し、複数の電力状態のうち選択された電力状態に従ってメモリチャネルコントローラのタイミングパラメータのセットを更新する。更に、パワーコントローラは、メモリシステムのタイミングパラメータのセット又は選択された電力状態を変更することなく、クロックインターフェース回路のタイミングパラメータのセットを変更するために、第1のインターフェース回路を第1のクロックドメインの第1のクロック信号のみの新しい周波数と同期させる要求に応答する。
【0006】
方法は、メモリコントローラにおいて電力状態コマンドを受信し、メモリコントローラクロックドメイン及びメモリクロックドメインのうち少なくとも1つの動作周波数を変更することに応じて、メモリコントローラバスインターフェースをデータファブリッククロックドメインと再同期させ、PHYをメモリコントローラと再同期させることを含む。方法は、メモリコントローラをデータファブリッククロックドメインの第1のクロック信号のみの周波数と再同期させる要求を受信し、それに応じて、PHYをメモリコントローラと再同期させることなく、データファブリッククロックドメインとメモリコントローラクロックドメインとの間のクロックインターフェース回路のタイミングパラメータのセットを変更し、メモリ又はメモリコントローラのタイミングパラメータのセットを変更することを含む。
【0007】
データ処理システムは、データファブリック、メモリチャネル、メモリチャネルコントローラ、及び、パワーコントローラを含む。データファブリックは、データファブリッククロックで動作する。メモリチャネルは、DRAMメモリに結合するためのメモリクロックドメイン上で動作するPHYを含む。また、メモリチャネルコントローラは、データファブリックに接続するように適合された第1のインターフェース回路と、PHYに接続するように適合された第2のインターフェース回路と、を含む。メモリチャネルコントローラは、タイミングパラメータのセットに従って第2のクロックドメインにおいて動作する。第1のインターフェース回路は、第1のクロックドメインと第2のクロックドメインとの間の転送を適合させるためのクロックインターフェース回路を含む。パワーコントローラは、メモリチャネルコントローラに接続され、電力状態変更要求に応じて、メモリシステムのパラメータを変更するためのコマンドを第2のインターフェース回路に送信し、複数の電力状態のうち選択された電力状態に従ってメモリチャネルコントローラのタイミングパラメータのセットを更新する。更に、パワーコントローラは、メモリシステムのタイミングパラメータのセット又は選択された電力状態を変更することなく、クロックインターフェース回路のタイミングパラメータのセットを変更するために、インターフェース回路をデータファブリッククロックドメイン(FCLK)の第1のクロック信号のみの新しい周波数と同期させる要求に応答する。
【0008】
図1は、従来技術において知られている加速処理ユニット(APU)100及びメモリシステム130のブロック図である。APU100は、ホストデータ処理システムにおけるプロセッサとして用いるのに適した集積回路であり、概して、中央処理ユニット(central processing unit、CPU)コア複合体110と、グラフィックスコア120と、ディスプレイエンジン122のセットと、データファブリック125と、メモリ管理ハブ140と、周辺コントローラ160のセットと、周辺バスコントローラ170のセットと、システム管理ユニット(system management unit、SMU)180と、を含む。
【0009】
CPUコア複合体110は、CPUコア112及びCPUコア114を含む。この例では、CPUコア複合体110が2つのCPUコアを含むが、他の実施形態では、CPUコア複合体110が任意の数のCPUコアを含むことができる。CPUコア112及び114の各々は、制御ファブリックを形成するシステム管理ネットワーク(system management network、SMN)及びデータファブリック125に双方向に接続されており、データファブリック125にメモリアクセス要求を提供することができる。CPUコア112及び114の各々は、単体のコアであってもよく、又は、キャッシュ等の特定のリソースを共有する2つ以上の単体のコアを有するコア複合体であってもよい。
【0010】
グラフィックスコア120は、頂点処理、フラグメント処理、シェーディング、テクスチャブレンディング等のグラフィックス処理を高度に統合された並列方式で実行することができる高性能グラフィックス処理ユニット(graphics processing unit、GPU)である。グラフィックスコア120は、SMN及びデータファブリック125に双方向に接続されており、メモリアクセス要求をデータファブリック125に提供することができる。これに関して、APU100は、CPUコア複合体110とグラフィックスコア120とが同じメモリ空間を共有する統合メモリアーキテクチャ、又は、CPUコア複合体110とグラフィックスコア120とがメモリ空間の一部を共有する一方でグラフィックスコア120がCPUコア複合体110によりアクセスできないプライベートグラフィックスメモリも使用するメモリアーキテクチャの何れかをサポートすることができる。
【0011】
ディスプレイエンジン122は、モニタ上に表示するためにグラフィックスコア120によって生成されたオブジェクトをレンダリングしてラスタライズする。グラフィックスコア120及びディスプレイエンジン122は、メモリシステム130内の適切なアドレスへの一様な変換のために、データファブリック125を介して共通メモリ管理ハブ140に双方向に接続される。
【0012】
データファブリック125は、任意のメモリアクセスエージェントとメモリ管理ハブ140との間でメモリアクセス要求及びメモリ応答をルーティングするためのクロスバースイッチを含む。また、データファブリックは、システム構成に基づいてメモリアクセスの送信先を決定するために、基本入力/出力システム(basic input/output system、BIOS)によって規定されるシステムメモリマップ、並びに、各仮想接続のためのバッファも含む。
【0013】
周辺コントローラ160は、ユニバーサルシリアルバス(universal serial bus、USB)コントローラ162及びシリアルアドバンストテクノロジーアタッチメント(Serial Advanced Technology Attachment、SATA)インターフェースコントローラ164を含み、これらのそれぞれは、システムハブ166及びSMNバスに対して双方向で接続される。これらの2つのコントローラは、APU100で使用され得る周辺コントローラの単なる典型例である。
【0014】
周辺バスコントローラ170は、システムコントローラ又は「サウスブリッジ」(Southbridge、SB)172と、周辺構成要素相互接続エクスプレス(Peripheral Component Interconnect Express、PCIe)コントローラ174と、を含み、これらのそれぞれは、入力/出力(input/output、I/O)ハブ176及びSMNバスに対して双方向で接続される。また、I/Oハブ176は、システムハブ166及びデータファブリック125に対して双方向で接続される。したがって、例えば、CPUコアは、データファブリック125がI/Oハブ176を介してルーティングするアクセスにより、USBコントローラ162、SATAインターフェースコントローラ164、SB172、又は、PCIeコントローラ174内のレジスタをプログラムすることができる。APU100のためのソフトウェア及びファームウェアは、リードオンリーメモリ(read-only memory、ROM)、フラッシュ電気的消去可能プログラマブルROM(electrically erasable programmable ROM、EEPROM)等の様々な不揮発性メモリタイプの何れかであり得るシステムデータドライブ又はシステムBIOSメモリ(図示せず)に記憶される。一般に、BIOSメモリはPCIeバスを介してアクセスされ、システムデータドライブはSATAインターフェースを介してアクセスされる。
【0015】
SMU180は、APU100上のリソースの動作を制御してそれらの間の通信を同期させるローカルコントローラである。SMU180は、APU100上の様々なプロセッサのパワーアップシーケンシングを管理し、リセット、イネーブル及び他の信号を介して複数のオフチップデバイスを制御する。SMU180は、APU100の構成要素のそれぞれにクロック信号を与えるために、位相ロックループ(phase locked loop、PLL)等の1つ以上のクロックソース(図示せず)を含む。また、SMU180は、様々なプロセッサ及び他の機能ブロックのための電力を管理し、適切な電力状態を判定するためにCPUコア112、114及びグラフィックスコア120から測定された電力消費値を受信することができる。
【0016】
メモリ管理ハブ140及びその関連する物理インターフェース(physical interface、PHY)151、152は、この実施形態ではAPU100と統合される。メモリ管理ハブ140は、メモリチャネル141、142とパワーエンジン149とを含む。メモリチャネル141は、ホストインターフェース145、メモリチャネルコントローラ143、及び、物理インターフェース147を含む。ホストインターフェース145は、メモリチャネルコントローラ143を、シリアル存在検出リンク(serial presence detect、SDP)を介してデータファブリック125に対して双方向で接続する。物理インターフェース147は、メモリチャネルコントローラ143をPHY151に対して双方向で接続し、DDR PHYインターフェース(DDR PHY Interface、DFI)仕様に準拠する。メモリチャネル142は、ホストインターフェース146、メモリチャネルコントローラ144、及び、物理インターフェース148を含む。ホストインターフェース146は、他のSDPを介してメモリチャネルコントローラ144をデータファブリック125に対して双方向で接続する。物理インターフェース148は、メモリチャネルコントローラ144をPHY152に対して双方向で接続し、DFI仕様に準拠する。パワーエンジン149は、SMNバスを介してSMU180に対して、アドバンスト周辺バス(APB)インターフェース254を介してPHY151、152に対して双方向で接続されるとともに、メモリチャネルコントローラ143、144に対して双方向で接続される。PHY151は、メモリチャネル131への双方向接続を有する。PHY152は双方向接続メモリチャネル133を有する。
【0017】
メモリ管理ハブ140は、2つのメモリチャネルコントローラを有するメモリコントローラのインスタンス化であり、共有パワーエンジン149を使用して、以下で更に説明する態様でメモリチャネルコントローラ143及びメモリチャネルコントローラ144の両方の動作を制御する。メモリチャネル141、142のそれぞれは、DDRバージョン5(DDR5)、DDRバージョン4(DDR4)、低電力DDR4(LPDDR4)、グラフィックスDDRバージョン5(GDDR5)、及び、高帯域幅メモリ(HBM)等の最先端DDRメモリに接続することができ、将来のメモリ技術に適合され得る。これらのメモリは、高いバス帯域幅及び高速動作をもたらす。同時に、それらのメモリは、ラップトップコンピュータ等のバッテリ駆動用途のための電力を節約するための低電力モードを与えるとともに、内蔵熱監視も行う。
【0018】
メモリシステム130は、メモリチャネル131及びメモリチャネル133を含む。メモリチャネル131は、DDRxバス132に接続されるデュアルインラインメモリモジュール(dual inline memory module、DIMM)のセットを含み、これには、本実施例では個別のランクに対応する代表的なDIMM134、136、138が含まれる。同様に、メモリチャネル133は、代表的なDIMM135、137、139を含む、DDRxバス129に接続されるDIMMのセットを含む。
【0019】
APU100は、ホストデータ処理システムの中央処理ユニット(CPU)として動作し、最新のコンピュータシステムにおいて有用な様々なバス及びインターフェースを与える。これらのインターフェースは、2つのダブルデータレート(double data rate、DDRx)メモリチャネル、PCIeリンクへの接続のためのPCIeルート複合体、USBネットワークへの接続のためのUSBコントローラ、及び、SATA大容量記憶デバイスへのインターフェースを含む。
【0020】
また、APU100は、様々なシステム監視機能及び節電機能も実装する。特に、1つのシステム監視機能は熱監視である。例えば、APU100が高温になる場合、SMU180は、CPUコア112、114及び/又はグラフィックスコア120の周波数及び電圧を低減することができる。APU100が高温になり過ぎる場合、SMUを完全にシャットダウンすることができる。SMNバスを介してSMU180によって外部センサから熱事象を受けることもでき、SMU180は、それに応じてクロック周波数及び/又は電源電圧を低減することができる。
【0021】
図2は、
図1のようなAPUで用いるのに適したメモリコントローラ200のブロック図である。メモリコントローラ200は、概して、メモリチャネルコントローラ210及びパワーコントローラ250を含む。メモリチャネルコントローラ210は、概して、インターフェース212と、メモリインターフェースキュー214と、コマンドキュー220と、アドレス生成器222と、コンテントアドレッサブルメモリ(CAM)224と、リプレイキュー230を含むリプレイ制御ロジック231と、リフレッシュ制御ロジックブロック232と、タイミングブロック234と、ページテーブル236と、アービタ238と、誤り訂正符号(ECC)チェック回路242と、ECC生成ブロック244と、データバッファ246と、リフレッシュ制御ロジック232と、を含む。
【0022】
インターフェース212は、外部バスを介したデータファブリックに対する第1の双方向接続を有し、出力を有する。メモリコントローラ200において、この外部バスは、「AXI4」として知られている英国ケンブリッジのARM Holdings,PLCによって指定された高度拡張可能インターフェースバージョン4と適合するが、他の実施形態では他のタイプのインターフェースとなり得る。インターフェース212は、メモリアクセス要求を、「FCLK」ドメインとして知られている第1のクロックドメインから、「UCLK」ドメインとして知られているメモリコントローラ200の内部の第2のクロックドメインに変換する。同様に、メモリインターフェースキュー214は、UCLKドメインからDFIインターフェースに関連付けられる「DFICLK」ドメインへのメモリアクセスを与える。
【0023】
アドレス生成器222は、AXI4バスを介してデータファブリックから受信されるメモリアクセス要求のアドレスを復号する。メモリアクセス要求は、正規化フォーマットで表された物理アドレス空間内のアクセスアドレスを含む。アドレス生成器222は、正規化されたアドレスを、メモリシステム130内の実際のメモリデバイスをアドレス指定するために及び関連するアクセスを効率的にスケジュールするために使用され得るフォーマットに変換する。このフォーマットは、メモリアクセス要求を特定のランク、行アドレス、列アドレス、バンクアドレス、及び、バンクグループと関連付ける領域識別子を含む。起動時に、システムBIOSは、メモリシステム130内のメモリデバイスに問い合わせてそれらのサイズ及び構成を決定し、アドレス生成器222に関連付けられた構成レジスタのセットをプログラムする。アドレス生成器222は、構成レジスタに記憶された構成を使用して、正規化されたアドレスを適切なフォーマットに変換する。コマンドキュー220は、CPUコア112、114及びグラフィックスコア120等のAPU100内のメモリアクセスエージェントから受信されるメモリアクセス要求のキューである。コマンドキュー220は、アドレス生成器222によって復号されたアドレスフィールド、並びに、アービタ238がアクセスタイプ及びサービス品質(quality of service、QoS)識別子を含むメモリアクセスを効率的に選択できるようにする他のアドレス情報を記憶する。CAM224は、書き込み後の書き込み(write after write、WAW)及び書き込み後の読み取り(read after write、RAW)順序規則等の順序規則を実施するための情報を含む。
【0024】
エラー訂正コード(ECC)生成ブロック244は、メモリに送られる書き込みデータのECCを決定する。次いで、このECCデータは、データバッファ246内の書き込みデータに追加される。ECCチェック回路242は、受信されたECCを着信ECCと照合してチェックする。
【0025】
リプレイキュー230は、アドレス及びコマンドパリティ応答等の応答を待っているアービタ238によって選択されたメモリアクセスを記憶するための一時的なキューである。リプレイ制御ロジック231は、ECCチェック回路242にアクセスして、戻されたECCが正しいか又はエラーを示すかを決定する。再生制御ロジック231は、これらのサイクルのうち何れかのパリティ又はECCエラーの場合にアクセスが再生される再生シーケンスを開始して制御する。リプレイされたコマンドは、メモリインターフェースキュー214に配置される。
【0026】
リフレッシュ制御ロジック232は、メモリアクセスエージェントから受信した通常の読み取り及び書き込みメモリアクセス要求とは別に生成される様々な電源断、リフレッシュ及び終端抵抗(ZQ)較正サイクルのためのステートマシンを含む。例えば、メモリランクがプリチャージパワーダウンにある場合、リフレッシュ制御ロジックは、リフレッシュサイクルを実行するために定期的に起動されなければならない。リフレッシュ制御ロジック232は、DRAMチップ内のメモリセルの蓄積キャパシタからの電荷の漏れによって引き起こされるデータエラーを防止するために、定期的に、定められた条件に応じて、リフレッシュコマンドを生成する。リフレッシュ制御ロジック232はアクティブ化カウンタ248を含み、この実施形態において、アクティブ化カウンタ248は、メモリチャネルを介してメモリ領域に送信されるアクティブ化コマンドのローリング数をカウントするカウンタをメモリ領域ごとに有する。メモリ領域は、以下で更に説明するように、いくつかの実施形態ではメモリバンクであり、他の実施形態ではメモリサブバンクである。更に、リフレッシュ制御ロジック232は、システム内の熱変化に起因するオンダイ終端抵抗の不一致を防止するためにZQを定期的に較正する。
【0027】
アービタ238は、コマンドキュー220に双方向に接続され、メモリチャネルコントローラ210の心臓部であり、メモリバスの使用を改善するためにアクセスのインテリジェントスケジューリングを実行する。この実施形態では、アービタ238は、いくつかの最近発行された書き込みコマンドのバンクグループ番号を追跡し、以下で更に説明するように、ある条件下で指定された時間期間の間、それらのバンクグループへのコマンドのディスパッチを防止することによってそれらを「マスク」するためのバンクグループ追跡回路235を含む。アービタ238は、タイミングブロック234を使用して、コマンドキュー220内の特定のアクセスがDRAMタイミングパラメータに基づいて発行に適格であるかどうかを判定することによって、適切なタイミング関係を実施する。例えば、各DRAMは、「tRC」として知られるアクティブ化コマンド間の最小指定時間を有する。タイミングブロック234は、JEDEC仕様で定められたこのタイミングパラメータ及び他のタイミングパラメータに基づいて適格性を決定するカウンタのセットを維持し、リプレイキュー230に対して双方向で接続される。ページテーブル236は、アービタ238のためのメモリチャネルの各バンク及びランクにおけるアクティブページに関する状態情報を維持し、リプレイキュー230に対して双方向で接続される。
【0028】
ECC生成ブロック244は、インターフェース212から受信した書き込みメモリアクセス要求に応じて、書き込みデータに従ってECCを計算する。データバッファ246は、受信したメモリアクセス要求に関する書き込みデータ及びECCを記憶する。データバッファは、アービタ238がメモリチャネルへのディスパッチのために対応する書き込みアクセスを選択すると、組み合わされた書き込みデータ/ECCをメモリインターフェースキュー214に出力する。
【0029】
メモリチャネルコントローラ210は、関連するメモリチャネルへのディスパッチのためのメモリアクセスを選択することを可能にする回路を含む。所望のアービトレーション決定を行うために、アドレス生成器222は、アドレス情報を、メモリシステム内のランク、行アドレス、列アドレス、バンクアドレス、及び、バンクグループを含むプリデコードされた情報に復号し、コマンドキュー220がプリデコードされた情報を記憶する。構成レジスタ262は、アドレス生成器222が受信したアドレス情報をどのように復号するかを決定するための構成情報を記憶する。アービタ238は、復号されたアドレス情報、タイミングブロック234によって示されるタイミング適格性情報、及び、ページテーブル236によって示されるアクティブページ情報を使用して、サービス品質(QoS)要件等の他の基準を遵守しながら、メモリアクセスを効率的にスケジュールする。例えば、アービタ238は、メモリページを変更するために必要なプリチャージコマンド及びアクティブ化コマンドのオーバーヘッドを回避するために、オープンページへのアクセスの優先度を実装し、あるバンクへのオーバーヘッドアクセスを別のバンクへの読み取り及び書き込みアクセスとインターリーブすることによって隠す。特に、通常動作中、アービタ238は、通常、ページを、これらのページが異なるページを選択する前にプリチャージされる必要があるまで、異なるバンクで開いたままにする。アービタ238は、いくつかの実施形態では、それぞれのコマンドの標的メモリ領域に関するアクティブ化カウンタ248の少なくともそれぞれの値に基づいてコマンド選択の適格性を決定する。
【0030】
パワーコントローラ250は、概して、アドバンスト拡張可能インターフェース、バージョン1(AXI)へのインターフェース252、アドバンスト周辺バス(advanced peripheral bus、APB)インターフェース254、パワーエンジン260、及び、電力状態制御論理ブロック270のセットを含む。インターフェース252は、SMNへの第1の双方向接続と、出力と、を有する。APBインターフェース254は、インターフェース252の出力に接続された入力と、APBを介してPHYに接続するための出力と、を有する。
【0031】
パワーエンジン260は、インターフェース252の出力に接続された入力と、メモリインターフェースキュー214の入力に接続された出力と、を有する。パワーエンジン260は、構成レジスタ262のセットと、マイクロコントローラ(μC)264と、セルフリフレッシュコントローラ(SLFREF/PE)266と、信頼性のある読み取り/書き込みタイミングエンジン(RRW/TE)268と、UCLK制御論理ブロック272、DFICLK同期論理ブロック274及びFCLK同期論理ブロック276を含むメモリコントローラクロックドメイン状態変更回路(「CLKARB」)271と、を含む。構成レジスタ262は、AXIバスを介してプログラムされ、電力状態制御論理ブロック270を介して4つの異なる電力状態のうち選択された電力状態においてメモリコントローラ200内の様々なブロックの動作を制御するための構成情報を記憶する。したがって、電力状態制御論理ブロック270は、
図2に詳細に示されていないメモリコントローラ200内の様々なブロックに接続された出力を有する。SLFREF/PE266は、リフレッシュ制御ロジック232によるリフレッシュの自動生成に加えて、リフレッシュの手動生成を可能にするエンジンである。信頼性のある読み取り/書き込みタイミングエンジン268は、DDRインターフェース最大読み取りレイテンシ(maximum read latency、MRL)トレーニング及びループバック試験のような目的のために、メモリ又はI/Oデバイスへ連続的なメモリアクセスストリームを与える。
【0032】
動作中、パワーコントローラ250は、データファブリックの電力管理制御インターフェースを介してSMU180(
図1)から電力状態コマンドを受信し、それに応じて、通常はDFICLKドメイン及びUCLKドメインのための異なるクロック速度を含む新しい電力状態に入るように、メモリコントローラ200及び取り付けられたDRAMの電力状態を変更する。電力状態制御論理ブロック270の各々は、構成レジスタ262に設定された構成値に従ってそれぞれの電力状態に従って動作するようにメモリコントローラ200の様々なブロックを制御することによって、それぞれの電力状態を実装する。構成値は、各電力状態で動作するようにメモリチャネルコントローラを構成するためのタイミングパラメータ及び他の構成パラメータのセットを含む。
【0033】
メモリコントローラ200の電力状態が変更されると、UCLK制御論理ブロック272は、SMU180からの電力状態コマンドで指定された新しい電力状態に変更する際に、メモリチャネルコントローラ210の様々なブロックを制御し調整するために必要な信号を送信する。UCLK制御論理ブロック272は、メモリチャネルコントローラ210内の様々な論理ブロックの動作を休止し、必要な場合にUCLK周波数を変更することを調整し、それぞれの電力状態制御論理ブロック270を介して新しい構成レジスタ値に対して動作するようにメモリチャネルコントローラ210を変更することを調整する回路を含む。
【0034】
DFICLK同期論理ブロック274は、UCLK又はDFICLKの何れかに変更がある毎に使用される。これは、メモリインターフェースキュー214内のこれら2つのクロックドメイン間の同期を制御するための回路を含み、これは、通常、インターフェースを休止すること、新しいクロック周波数を適用すること、及び、新しいクロック周波数にわたって同期するようにインターフェースに命令することを含む。いくつかの実施形態では、メモリインターフェースキュー214又はその中の様々なキューの内容は、同期を完了するためにローカルRAMに一時的に保存される。DFICLK同期論理ブロック274は、以下で更に説明されるように、FCLK変更のみに関係する本明細書で提供されるものを除いて、各電力状態変更に対してμC264によってアクティブ化される。
【0035】
FCLK同期論理ブロック276は、UCLK又はFCLK周波数に変更があるたびに使用される。FCLK同期論理ブロック276は、インターフェース212内のこれら2つのクロックドメイン間の同期を制御する回路を含む。同期プロセスは、典型的には、インターフェース212を休止することと、SMU180がデータファブリック125のFCLKクロックドメインにおけるFCLKの周波数を調整することを可能にすることと、インターフェース212に新しいクロック周波数にわたって同期するように命令することと、次いでデータファブリックへの接続を再確立することと、を含む。
【0036】
図3は、メモリチャネルコントローラ210においてクロックドメイン信号及びクロックドメインにわたる同期を提供するためのAPU300のいくつかの要素のブロック図である。この実施形態におけるAPU300は、
図2のものと同様のメモリコントローラ200を含むが、関連する要素のみが示されている。APU300は、データファブリック125、SMU180、メモリコントローラ200、FCLK PLL302、UCLK PLL304、及び、PHY320を含む。
【0037】
SMU180は、FCLK PLL302に接続された出力、データファブリック125への双方向接続、及び、SMNへの双方向接続を有する。SMU180は、概して、オペレーティングシステムカーネルからの電力状態制御決定を実装し、いくつかの実施形態では、APU300全体にわたる様々な条件に基づいて、APU300の様々な部分がどの電力状態にあるべきかに関する追加の決定を行う。SMUは、パーソナルコンピュータ(PC)及びサーバ等のコンピュータのための電力管理及び構成仕様であるAdvanced Configuration and Power Interface(ACPI)等のシステム電力状態仕様において定義された電力状態制御をAPU300オペレーティングシステムに公開する。ACPIは、コンピュータオペレーティングシステムが、異なる動作周波数、異なる供給電圧、及び、他の差異を含み得る電力状態の限られたセットの中からデバイス動作モードを変更することによって、様々なデバイスにおいて消費される電力を管理することを可能にする。特に、SMU180は、関連するDRAMメモリと共に、データファブリック125、メモリコントローラ200、及び、PHY320の電力状態を選択する。他の電力状態調整も、他のシステム要素によって行うことができる。
【0038】
データファブリック125は、
図1に関して説明したように、システム処理コアを様々なサブシステムに接続するスケーラブルなデータファブリックであり、SMU180への双方向接続、メモリコントローラ200への双方向接続、及び、FCLK PLL302の出力に接続された入力を有する。データファブリック125は、FCLK PLL302によって提供されるFCLK信号に基づいて、FCLKクロックドメインで動作する。
【0039】
メモリコントローラ200は、
図2に関して説明したように、メモリチャネルコントローラ210及びパワーコントローラ250を含む。パワーコントローラ250は、その様々な部分を制御するためにメモリチャネルコントローラに接続され、UCLK PLL304に接続された出力、AXIインターフェースを介したSMNへの双方向接続、及び、PHY320への双方向接続を有する。メモリチャネルコントローラは、データファブリック125に接続するためのインターフェース212、PHY320に接続するためのメモリインターフェースキュー214、及び、UCLK PLL304からUCLK信号を受信する入力を含む。
図2に関して説明したように、メモリチャネルコントローラ210は、UCLKクロックドメインで動作し、インターフェース212を介してFCLKドメインにインターフェースし、メモリインターフェースキュー214及びその関連するPHYインターフェースを介してPHY320のDFICLKドメインにインターフェースする。
図3には、FCLKクロックドメインとUCLKクロックドメインとの間を接続する、メモリチャネルコントローラ210のインターフェース212内の電圧ドメインクロッシングインターフェース(VDCI)310が示されている。
【0040】
PHY320は、パワーコントローラ250への双方向性接続と、メモリチャネルコントローラ210への双方向性接続と、メモリチャネルコントローラ210に接続され、典型的にはFCLK/2を有するDFICLKクロック信号を受信するための入力と、を有する。DFICLKとUCLKは、UCLKがFCLK/2に設定されている場合に等しくなり、DFICLKは、UCLKがFCLKに等しく設定されている場合にUCLKの半分の周波数である。PHY320は、メモリバス上でシグナリングを行うためのクロック信号を生成するためのメモリクロックPLL322を含む。PLL322は基準としてDFICLKを使用する。PHY320は、その様々なサポートされたモード及び電力状態においてDDRxメモリとインターフェースするために必要とされる多くの構成値を保持するための構成レジスタ324のグループを含む。また、PHY320は、4つのサポートされた電力状態を実装するようにPHY回路を制御するために、各々が構成レジスタ324のそれぞれのセットに接続された4つの電力状態制御論理ブロック326のセットを含む。いくつかの実施形態では4つより多くの電力状態がサポートされるが、ACPIインターフェースによって定義される4つの電力状態が通常使用される。より多くの電力状態を追加することは、典型的には、追加の電力状態を実装するために、関連する電力状態制御論理を有するより多くの構成レジスタを追加することを必要とする。構成値は、各電力状態で動作するようにPHYを構成するためのタイミングパラメータ及び他の構成パラメータを含む。構成レジスタ324は、パワーコントローラ250を介してSMN上で構成可能である。
【0041】
APU300は、FCLKドメイン上で動作するデータファブリックが、メモリコントローラクロックドメイン及びDFICLKクロックドメインに対する典型的な1:1又は1:2の関係とは異なる周波数で動作することを可能にする。VDCI310は、非同期先入れ先出し(FIFO)バッファを含む非同期クロックインターフェース回路を提供し、データファブリックがUCLKより低い周波数(例えば、低トラフィック動作中のシグナリングにおける電力を節約するため)、UCLKより高い周波数(例えば、データファブリックが他のシステム構成要素間で高いトラフィック負荷を有する場合)で動作することを可能にする。FCLKがUCLK未満である設定をサポートするために、メモリコントローラ200は、読み取り応答を抑制し、データファブリックへの転送をバッファして、より遅いFCLKインターフェースのオーバーフローを防止する。
【0042】
メモリコントローラ200は、例えば
図4のプロセスに従って電力状態を変更する場合に通常行われるように、UFCLKをメモリインターフェースキュー214のインターフェースに再同期させること、又は、PHYをリセットし、PHYに関連するキューをフラッシュすることを必要としない効率的な方法で、FCLKドメイン周波数の変更をサポートする。
【0043】
動作において、パワーコントローラ250は、メモリチャネルコントローラのタイミングパラメータのセットを更新し、メモリインターフェースキュー214のDFIインターフェース回路にコマンドを送信して、メモリシステムのパラメータをサポートされた電力状態の中から選択されたメモリ電力状態に変更し、回路を起動してメモリコントローラ200における調整を達成することによって、電力状態変更要求に応答する。このプロセスの例は、
図4に関して説明される。更に、パワーコントローラ250は、VDCI310のタイミングパラメータのセットを変更し、タイミングパラメータのセット又はメモリチャネルコントローラ210及びPHY320が動作している選択された電力状態を変更することなく、FCLK及びUCLKドメインにわたってVDCIを再同期させることによって、本明細書ではFクロックのみの電力状態変更として知られる、FCLKクロックドメインのFCLK信号のみの新しい周波数にメモリコントローラを同期させる要求に応答する。このプロセスの例は、
図5に関して説明される。
【0044】
図4は、いくつかの実施形態に係る、メモリコントローラにおいて電力状態を変更するためのプロセスのフローチャート400を示す。このプロセスは、
図2及び
図3のメモリコントローラ、並びに、電力状態の調整を変更するためのデータファブリック同期回路及びPHY同期回路を含む他のメモリコントローラと共に使用するのに適している。このプロセスは、メモリコントローラの両方のインターフェースを再同期させることを含む完全な電力状態遷移の一例である。電力状態コマンドは、通常、メモリシステムのために定義された別のACPI露出電力状態に変更するコマンドであり、UCLK、DFICLK及びFCLKの任意の組合せに対する変更を含むことができる。このプロセスは、電力状態遷移を実行する複雑さ及びレイテンシの例を提供するために説明される。
【0045】
プロセスはブロック402で開始し、電力状態コマンドがパワーコントローラ250で受信される。通常、電力状態コマンドは、SMU180等のシステム管理コントローラから受信される。ブロック404において、パワーコントローラ250は、メモリコントローラ200へのメモリアクセス要求を一時停止するようにデータファブリックに信号を送る。この信号は、典型的には、データファブリック上のコヒーレントスレーブコントローラに進むが、他の実施形態では、信号は、メモリコントローラ200へのメモリアクセス要求を停止するようにデータファブリックに命令するSMU180等の別のシステム要素に進むことができる。
【0046】
ブロック406において、パワーコントローラは、メモリコントローラに対して、その様々なキューをフラッシュし、PHYを構成モードにするように命令する。PHYはパワーダウンされないので、このフラッシュステップはオプションである。ブロック408において、パワーコントローラ250は、メモリコントローラ200及びその関連するDRAMをセルフリフレッシュモードにし、メモリコントローラ200へのUCLK信号のクロックゲーティングをオフにする。
図2の実施形態では、ブロック406及び408は、UCLK制御論理ブロック272を使用して実行される。他の実施形態では、他の適切なメモリクロックドメイン制御回路が使用される。
【0047】
ブロック410において、パワーコントローラ250は、通常は指定された制御レジスタに書き込むことによって、UCLK及び/又はDFICLK PLLの周波数を、電力状態コマンドによって指定された必要な周波数に調整する。このブロックは、PLL周波数がそれらの新しい動作周波数にランプアップ又はランプダウンするための期間を含む。次にブロック412において、パワーコントローラは、メモリコントローラ200へのUCLK信号のクロックゲーティングをオンにし、新しい電力状態における動作を制御するために、構成レジスタ262内の電力状態制御レジスタのセットを選択する。このブロックは、メモリコントローラ200内の論理ブロックが初期化する時間を含む。
【0048】
ブロック414において、パワーコントローラ250は、PHYを構成モードから出し、メモリコントローラ200をPHYと再同期させる。
図2の実施形態では、ブロック414は、メモリインターフェースキュー214のDFIインターフェースをPHYと再同期させるためにDFICLK同期論理ブロック274を使用して達成される。他の実施形態では、他の適切なメモリクロックドメイン状態変更回路が使用される。
【0049】
ブロック416において、パワーコントローラ250は、FCLKとUCLKとの間の新しい周波数関係でメモリコントローラインターフェースをデータファブリックと再同期させる。
図2の実施形態では、ブロック416は、FCLK同期論理ブロック274を使用して達成されるが、他の実施形態では、他のクロック同期回路が使用される。
【0050】
理解され得るように、電力状態変更プロセスは、概して、数マイクロ秒程度の動作遅延を引き起こし、また、様々なキューの内容がアンロード又はフラッシュされ、電力状態変更後に再ロードされることを必要とする。したがって、メモリ電力状態変更要求は、電力状態変更中に生成される任意の新しいメモリアクセス要求に対して非常に長いレイテンシを引き起こす可能性がある。
【0051】
図5は、いくつかの実施形態に係る、電力状態コマンドに応答するためのプロセスのフローチャート500を示す。示されるプロセスは、メモリコントローラをデータファブリックに再同期させるために、メモリコントローラにおいて実装される電力状態コマンドと組み合わせて、データファブリックの周波数を調整することを可能にする。このプロセスは、
図4のプロセスによって示されるメモリコントローラ動作を中断することなく、メモリコントローラ電力状態における特定の調整をサポートするという利点を有する。また、このプロセスは、データファブリッククロックを調整する際に、ACPI電力状態コマンドによって提供されるよりも多くの可変性をサポートするという利点を有する。
【0052】
プロセスはブロック502で開始し、電力状態コマンドオーバーライド信号がパワーコントローラ250で受信される。電力状態オーバーライドコマンドは、後続の又は付随する電力状態コマンドがUCLKクロック周波数又はDFICLKクロック周波数を変更しないことをパワーコントローラに示す。図示した実施形態では、電力状態オーバーライドコマンドは、SMU180からパワーコントローラ250に送信される。電力状態オーバーライドコマンド及びFCLKのみの電力状態コマンドを送信する決定は、いくつかの実施形態では、オペレーティングシステムカーネルによって行われ、SMU180へのコマンドによって実施される。いくつかの他の実施形態では、SMU180は、この機能をオペレーティングシステムに公開せず、代わりにそれ自体で決定を行うことができる。更なる実施形態は、SMU180又はオペレーティングシステムカーネルの何れかがこの機能を制御することを可能にし得る。この決定は、概して、データファブリックの電力効率を改善する一方で、メモリチャネルスループット及びレイテンシに対する影響を最小限に抑えながら、データファブリックがその作業負荷需要を処理することを可能にするように行われる。そのような変更を達成するために電力状態コマンドを使用することは、ACPI電力状態の既存のフレームワークを利用する一方で、そのフレームワーク内で拡張された能力を提供するという利点を有する。
【0053】
ブロック504において、パワーコントローラ250は、ブロック502において受信された電力状態コマンドオーバーライド信号に続くか又はそれに付随するFCLKのみの電力状態コマンドを受信する。いくつかの実施形態では、コマンドオーバーライド信号は電力状態コマンドに含まれてもよく、他の実施形態では、コマンドオーバーライド信号は別であり、単一の後続の電力状態コマンドがオーバーライド条件の対象となることを示す。
【0054】
ブロック506において、プロセスは、この実施形態ではUCLK制御論理ブロック272であるメモリコントローラクロックドメイン状態変更回路、及び、この実施形態ではDFICLK同期論理ブロック274であるメモリクロックドメイン状態変更回路を無効化又は非アクティブ化することによって、オーバーライドを実施する。回路は、状態変更回路がメモリコントローラクロックドメイン(UCLK)及びメモリクロックドメイン(DFICLK)を変更することを防止し、メモリコントローラインターフェースをPHYに再同期させることを防止するために無効化される。これは、データファブリッククロック周波数変更のみに関する電力状態コマンドに応答する場合に、
図4のブロック406、408、410、412、414を実行することを回避する。これらのブロックを実行するための回路は、好ましくは、電力状態オーバーライドコマンドに応じて制御ビットを設定するか又は制御ゲートをアクティブ化することによって、無効化又は非アクティブ化される。この設定は、ブロック502で電力状態オーバーライド信号を受信した直後に実行されてもよく、その結果、ブロック504で電力状態コマンドが受信されると、関連する回路が無効化される。このようにして、ACPIによってサポートされる限られた数の電力状態間で変更するために使用されるのと同じ回路が、データファブリッククロックドメインクロック周波数を切り替える際の拡張機能をサポートするために使用される。この方式は、メモリコントローラ及びPHY内の制御レジスタによってサポートされる限られた数の電力状態において利用可能にされるよりも多くのデータファブリッククロックドメイン周波数の値をサポートするという利点を有する。
【0055】
ブロック508において、パワーコントローラ250は、メモリアクセス要求を一時停止するようにデータファブリックに信号を送る。
図4に関して説明したように、他の実施形態では、これは、SMUがデータファブリックを介したメモリコントローラへのメモリアクセス要求の停止を要求するようにSMUに信号を送ることによって達成される。
【0056】
ブロック520において、SMU180は、FCLK PLL302(
図3)を調整することによって、データファブリッククロック(FCLK)周波数を新しい所望の動作周波数に調整させる。新しい動作周波数は、パワーコントローラ250が利用できるように、ブロック504において電力状態コマンドで指定されることが好ましい。この実施形態では、SMU180がFCLK PLL302を制御するが、他の実施形態は、データファブリッククロック周波数を調整するために他の制御方式を使用することができる。新しいデータファブリッククロック周波数は、電力状態制御論理ブロック270(
図2)において提供される限られた数の電力状態のうち何れかにおいて指定される周波数から選択することができ、それらの電力状態において指定されない周波数から選択することができる。新しいデータファブリッククロック周波数は、メモリコントローラクロックドメイン(UCLK)周波数より高くても低くてもよい。
【0057】
データファブリッククロック周波数が、新しい値に傾斜又は遷移し、安定すると、メモリコントローラは、ブロック512において、そのインターフェースをデータファブリックに再同期させる。この実施形態では、パワーコントローラ250は、FCLK同期論理ブロック276をアクティブ化することによって再同期を制御する。これは、インターフェース212内のVDCI310(
図3)を制御して、非同期FIFOアーキテクチャを介してデータファブリックと再同期させる。この時点で、電力状態の変更が達成されており、パワーコントローラは、データファブリックがメモリコントローラ200へのメモリアクセス要求の送信を再開するように信号を送ることができる。
【0058】
理解され得るように、Fクロックのみの電力状態コマンドの使用は、電力状態コマンドフレームワークが、メモリコントローラにおける電力状態切替えの速度を改善する修正と共に、FCLK変更の追加の能力のために使用されることを可能にする。別の利点は、定義された電力状態内で指定されたものを超えるFCLK変更が、出願時にサポートされる典型的な数である4等のような限られた数の電力状態のみをサポートするシステムにおいて行われ得ることである。データファブリックは、電力状態の定義されたセットにおいて指定されたクロック周波数よりも遅いクロック周波数、又は、より速いクロック周波数で実行され得る。これは、Fクロックのみの電力状態コマンドの対象である特定のメモリコントローラ(単数又は複数)に無関係であり得る作業負荷需要を処理するために、データファブリックに対する効率調整を可能にする。Fクロックのみの電力状態コマンドがオペレーティングシステムに公開されない実施形態では、
図5のプロセスは、オペレーティングシステムカーネル電力状態制御プロセスが現在の電力状態をFCLK変更なしの場合と同様に扱うことができ、オペレーティングシステムがデータファブリッククロックドメインの新しい動作周波数でデータファブリックを使用することができるように、オペレーティングシステムに透過的であることが好ましい。
【0059】
図2のメモリコントローラ200又はパワーコントローラ250及びFCLK同期論理ブロック274等のその任意の部分は、プログラムによって読み取られ、集積回路を製造するために直接的又は間接的に使用され得るデータベース又は他のデータ構造の形態のコンピュータアクセス可能データ構造によって記述又は表現され得る。例えば、このデータ構造は、Verilog又はVHDL等の高レベル設計言語(high level design language、HDL)におけるハードウェア機能の挙動レベル記述又はレジスタ転送レベル(register-transfer level、RTL)記述であってもよい。記述は、合成ライブラリからゲートのリストを含むネットリストを生成するために記述を合成することができる合成ツールによって読み取られ得る。ネットリストは、集積回路を含むハードウェアの機能も表すゲートのセットを含む。ネットリストは、次いで、マスクに適用される幾何学的形状を記述するデータセットを生成するために配置され、ルーティングされ得る。次いで、マスクを様々な半導体製造工程で使用して、集積回路を製造することができる。代替的に、コンピュータアクセス可能格納媒体上のデータベースは、所望に応じて、ネットリスト(合成ライブラリの有無にかかわらず)若しくはデータセット、又は、グラフィックデータシステム(Graphic Data System、GDS)IIデータであり得る。
【0060】
特定の実施形態を説明してきたが、これらの実施形態に対する様々な修正が当業者には明らかである。例えば、メモリチャネルコントローラ210及び/又はパワーコントローラ250の内部アーキテクチャは、異なる実施形態において異なり得る。メモリコントローラ200は、高帯域幅メモリ(HBM)、RAMbus DRAM(RAMbus DRAM、RDRAM)等のように、DDRx以外の他のタイプのメモリとインターフェースすることができる。図示した実施形態は、個別のDIMM又はSIMMに対応するメモリの各ランクを示したが、他の実施形態では、各モジュールは複数のランクをサポートすることができる。更に他の実施形態は、ホストマザーボードに取り付けられたDRAM等のように、特定のモジュールに含まれていない他のタイプのDRAMモジュール又はDRAMを含むことができる。したがって、添付の特許請求の範囲は、開示された実施形態の範囲内に含まれる開示された実施形態の全ての変更を網羅することを意図している。
【手続補正書】
【提出日】2023-12-01
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
メモリコントローラであって、
第1のクロックドメインにおいて動作するデータファブリックに結合するように適合された第1のインターフェース回路と、第3のクロックドメインにおいて動作する物理レイヤインターフェース回路(PHY)に結合するように適合された第2のインターフェース回路と、を有するメモリチャネルコントローラであって、前記メモリチャネルコントローラは、タイミングパラメータのセットに従って第2のクロックドメインにおいて動作し、前記第1のインターフェース回路は、前記第1のクロックドメインと前記第2のクロックドメインとの間の転送を適合させるためのクロックインターフェース回路を含む、メモリチャネルコントローラと、
前記メモリチャネルコントローラに結合されたパワーコントローラであって、電力状態変更要求に応じて、
メモリチャネル及びメモリを含むメモリシステムのパラメータを変更するためのコマンドを前記第2のインターフェース回路に送信し、複数の電力状態のうち選択された電力状態に従って前記メモリチャネルコントローラのタイミングパラメータのセットを更新するパワーコントローラと、を備え、
前記パワーコントローラは、前記メモリシステムのタイミングパラメータのセット又は前記選択された電力状態を変更することなく前記クロックインターフェース回路のタイミングパラメータのセットを変更するために、前記第1のインターフェース回路を前記第1のクロックドメインの第1のクロック信号のみの新しい周波数と同期させる要求に応答する、
メモリコントローラ。
【請求項2】
前記第1のクロックドメインの第1のクロック信号のみの新しい周波数と同期する要求は、電力状態オーバーライド信号と、後続の電力状態コマンドと、を含み、前記電力状態オーバーライド信号は、前記パワーコントローラに、前記第1のクロックドメインの変更に関連付けられた後続の電力状態コマンドに応答する場合に、選択されたメモリコントローラクロックドメイン状態変更回路及びメモリクロックドメイン状態変更回路を無効化させる、
請求項1のメモリコントローラ。
【請求項3】
前記パワーコントローラは、
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応答する場合に、前記メモリコントローラの動作パラメータを含む前記メモリコントローラの電力状態制御レジスタのいくつかのセットの中から電力状態制御レジスタの新しいセットを選択し、
前の電力状態コマンドオーバーライド信号を伴う電力状態コマンドに応答する場合に、電力状態制御レジスタの新しいセットを選択しないように動作可能である、
請求項2のメモリコントローラ。
【請求項4】
前記パワーコントローラは、
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応答する場合に、前記PHYの動作パラメータを含む前記PHYの電力状態制御レジスタのいくつかのセットの中から前記PHYの電力状態制御レジスタの新しいセットを選択し、
前の電力状態コマンドオーバーライド信号を伴う電力状態コマンドに応答する場合に、前記PHYの電力状態制御レジスタの新しいセットを選択しないように動作可能である、
請求項2のメモリコントローラ。
【請求項5】
前記PHYの電力状態制御レジスタのセットの各々は、前記PHYに接続され、前記メモリコントローラに関連付けられたダイナミックランダムアクセスメモリ(DRAM)のサポートされた電力状態に対応する、
請求項4のメモリコントローラ。
【請求項6】
前記第2のクロックドメインにクロック信号を供給し、前記パワーコントローラに結合された位相ロックループ(PLL)を備える、
請求項1のメモリコントローラ。
【請求項7】
前記メモリコントローラは、前記第1のクロックドメインにおいて動作する前記データファブリックと、DRAMメモリに結合するためのクロックドメインにおいて動作するメモリチャネルと、を含むデータ処理システムにおいて具現化されている、
請求項1~6の何れかのメモリコントローラ。
【請求項8】
メモリコントローラにおいて電力状態コマンドを受信することと、メモリコントローラクロックドメイン及びメモリクロックドメインのうち少なくとも1つの動作周波数を変更することに応じて、メモリコントローラバスインターフェースをデータファブリッククロックドメインと再同期させ、物理レイヤインターフェース(PHY)を前記メモリコントローラと再同期させることと、
前記メモリコントローラを前記データファブリッククロックドメインの第1のクロック信号のみの周波数と再同期させる要求を受信し、これに応じて、前記PHYを前記メモリコントローラと再同期させることなく、前記データファブリッククロックドメインと前記メモリコントローラクロックドメインとの間のクロックインターフェース回路のタイミングパラメータのセットを変更し、
前記クロックインターフェース回路のタイミングパラメータの他に、メモリ又は前記メモリコントローラのタイミングパラメータのセットを変更することと、を含む、
方法。
【請求項9】
前記メモリコントローラを再同期させる要求は、電力状態オーバーライド信号と、後続の電力状態コマンドと、を含み、
前記方法は、前記データファブリッククロックドメインの変更に関連付けられた後続の電力状態コマンドに応答する場合に、選択されたメモリコントローラクロックドメイン状態変更回路及びメモリクロックドメイン状態変更回路を無効化することを含む、
請求項
8の方法。
【請求項10】
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応答する場合に、前記メモリコントローラの動作パラメータを含む前記メモリコントローラの電力状態制御レジスタのいくつかのセットの中から電力状態制御レジスタの新しいセットを選択することと、
前の電力状態コマンドオーバーライド信号を伴う電力状態コマンドに応答する場合に、電力状態制御レジスタの新しいセットを選択しないことと、を含む、
請求項
8の方法。
【請求項11】
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応答する場合に、前記PHYの動作パラメータを含む前記PHYの電力状態制御レジスタのいくつかのセットの中から前記PHYの電力状態制御レジスタの新しいセットを選択することと、
前の電力状態コマンドオーバーライド信号を伴う電力状態コマンドに応答する場合に、前記PHYの電力状態制御レジスタの新しいセットを選択しないことと、を含む、
請求項
8の方法。
【請求項12】
前記PHYの電力状態制御レジスタのセットの各々は、前記PHYに接続され、前記メモリコントローラに関連付けられたダイナミックランダムアクセスメモリ(DRAM)のサポートされた電力状態に対応する、
請求項
11の方法。
【請求項13】
前の電力状態コマンドオーバーライド信号を伴わない電力状態コマンドに応じて、前記メモリコントローラクロックドメインのクロック信号を供給する位相ロックループ(PLL)を調整することを含む、
請求項
8の方法。
【請求項14】
システム管理ユニットコントローラにおいて、前記データファブリッククロックドメインがその動作周波数を変更すべきであることを決定し、その後、前記電力状態コマンドオーバーライド信号を前記メモリコントローラに送信して、前記データファブリッククロックドメインにその動作周波数を変更させ、前記後続の電力状態コマンドを前記メモリコントローラに送信することを含む、
請求項
8の方法。
【請求項15】
前記後続の電力状態コマンドは、現在のメモリコントローラクロックドメイン動作周波数と、現在のメモリクロックドメイン動作周波数と、調整されたデータファブリッククロックドメイン動作周波数と、を示す電力状態データを含む、
請求項
14の方法。
【国際調査報告】