特表2024-546867 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ アドバンスト・マイクロ・ディバイシズ・インコーポレイテッドの特許一覧

特表2024-546867ＩＯＭＭＵにコロケート（ｃｏｌｌｏｃａｔｅｄ）されたリソースマネージャ

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-12-26

(54)【発明の名称】ＩＯＭＭＵにコロケート（ｃｏｌｌｏｃａｔｅｄ）されたリソースマネージャ

(51)【国際特許分類】

G06F 12/06 20060101AFI20241219BHJP

G06F 12/1081 20160101ALI20241219BHJP

【ＦＩ】

G06F12/06 515J

G06F12/1081

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2024535500

(86)(22)【出願日】2022-11-18

(85)【翻訳文提出日】2024-07-09

(86)【国際出願番号】 US2022050488

(87)【国際公開番号】W WO2023129300

(87)【国際公開日】2023-07-06

(31)【優先権主張番号】17/565,336

(32)【優先日】2021-12-29

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】591016172

【氏名又は名称】アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド

【氏名又は名称原語表記】ＡＤＶＡＮＣＥＤＭＩＣＲＯＤＥＶＩＣＥＳＩＮＣＯＲＰＯＲＡＴＥＤ

(74)【代理人】

【識別番号】100108833

【弁理士】

【氏名又は名称】早川裕司

(74)【代理人】

【識別番号】100111615

【弁理士】

【氏名又は名称】佐野良太

(74)【代理人】

【識別番号】100162156

【弁理士】

【氏名又は名称】村雨圭介

(72)【発明者】

【氏名】セルゲイブラゴドゥロフ

(72)【発明者】

【氏名】マサブアーマッド

【テーマコード（参考）】

5B160

5B205

【Ｆターム（参考）】

5B160AA14

5B160MM03

5B205KK14

5B205MM03

5B205RR01

(57)【要約】

コンピューティングデバイス内のリソースを管理するためのデバイス、方法及びシステムが提供される。リソースの使用量に関する情報が取得される。情報に基づいて、プロセッサによるリソースの使用量が今後の期間中に閾値を超えるという予測が生成される。予測に基づいて、プロセッサの動作パラメータが調整される。いくつかの実施形態では、メモリ帯域幅に関する情報が取得される。情報に基づいて、第１のメモリデバイスに記憶されたメモリ領域が今後の期間中にメモリ集約型命令によってアドレス指定されるという予測が生成される。予測に基づいて、メモリ領域に記憶されたデータが第２のメモリデバイスに移動される。
【選択図】図３

【特許請求の範囲】

【請求項1】

リソースマネジメントデバイスであって、
メモリ帯域幅の利用率に関する情報を取得するように構成された回路と、
前記情報に基づいて、第１のメモリデバイスに記憶されたメモリ領域が今後の期間中にメモリ集約型命令によってアドレス指定されるという予測を生成するように構成された回路と、
前記予測に基づいて、前記メモリ領域に記憶されたデータを第２のメモリデバイスに移動するように構成された回路と、を備える、
リソースマネジメントデバイス。

【請求項2】

前記リソースマネジメントデバイスは、入出力メモリマネジメントユニット（ＩＯＭＭＵ）、ＩＯＭＭＵと通信するプロセッサ、及び／又は、ＩＯＭＭＵと統合されたプロセッサを備える、
請求項１のリソースマネジメントデバイス。

【請求項3】

前記情報は、以前に実行された命令が、メモリ集約型命令であるかどうかを示す、
請求項１のリソースマネジメントデバイス。

【請求項4】

前記情報は、以前に実行された命令が、指定された命令であるかどうかを示す、
請求項１のリソースマネジメントデバイス。

【請求項5】

前記情報は、以前に実行された命令が、特定のタイプの命令であるか否かを示す、
請求項１のリソースマネジメントデバイス。

【請求項6】

前記情報に自己相関関数（ＡＣＦ）を適用することによって前記予測を生成するように構成された回路を備える、
請求項１のリソースマネジメントデバイス。

【請求項7】

前記情報に人工ニューラルネットワーク（ＡＮＮ）を適用することによって前記予測を生成するように構成された回路を備える、
請求項１のリソースマネジメントデバイス。

【請求項8】

前記第１のメモリデバイスは、相対的により低い帯域幅のメモリを備え、前記第２のメモリデバイスは、相対的により高い帯域幅のメモリを備える、
請求項１のリソースマネジメントデバイス。

【請求項9】

前記第１のメモリデバイスは、シンクロナスダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）、ダブルデータレート（ＤＤＲ）ＳＤＲＡＭ、及び／又は、低電力ダブルデータレート（ＬＰＤＤＲ）ＳＤＲＡＭを備える、
請求項１のリソースマネジメントデバイス。

【請求項10】

前記第２のメモリデバイスは、高帯域幅メモリ（ＨＢＭ）及び／又はキャッシュメモリを備える、
請求項１のリソースマネジメントデバイス。

【請求項11】

リソース管理デバイスであって、
リソースの使用量に関する情報を取得するように構成された回路と、
前記情報に基づいて、プロセッサによるリソースの使用量が今後の期間中に閾値を超えるという予測を生成するように構成された回路と、
前記予測に基づいて、前記プロセッサの動作パラメータを調整するように構成された回路と、を備える、
リソース管理デバイス。

【請求項12】

前記リソースは、電力を含む、
請求項１１のリソース管理デバイス。

【請求項13】

前記リソースは、サーマルバジェットを含む、
請求項１１のリソース管理デバイス。

【請求項14】

前記動作パラメータは、電圧又は電流を含む、
請求項１１のリソース管理デバイス。

【請求項15】

前記動作パラメータは、クロック周波数を含む、
請求項１１のリソース管理デバイス。

【請求項16】

前記動作パラメータは、前記プロセッサの一部に対して調整される、
請求項１１のリソース管理デバイス。

【請求項17】

前記リソース管理デバイスは、入出力メモリマネジメントユニット（ＩＯＭＭＵ）、ＩＯＭＭＵと通信するプロセッサ、及び／又は、ＩＯＭＭＵと統合されたプロセッサを備える、
請求項１１のリソース管理デバイス。

【請求項18】

前記情報は、前記プロセッサによるリソースの使用量が以前の期間中に前記閾値を超えているかどうかを示す、
請求項１１のリソース管理デバイス。

【請求項19】

前記予測は、前記情報に自己相関関数（ＡＣＦ）を適用することによって生成される、
請求項１１のリソース管理デバイス。

【請求項20】

前記予測は、前記情報に人工ニューラルネットワーク（ＡＮＮ）を適用することによって生成される、
請求項１１のリソース管理デバイス。

【請求項21】

リソースマネジメントデバイスにおいて実施される方法であって、
メモリ帯域幅に関する情報を取得することと、
前記情報に基づいて、第１のメモリデバイスに記憶されたメモリ領域が今後の期間中にメモリ集約型命令によってアドレス指定されるという予測を生成することと、
前記予測に基づいて、前記メモリ領域に記憶されたデータを第２のメモリデバイスに移動することと、を含む、
方法。

【請求項22】

前記リソースマネジメントデバイスは、入出力メモリマネジメントユニット（ＩＯＭＭＵ）、ＩＯＭＭＵと通信するプロセッサ、及び／又は、ＩＯＭＭＵと統合されたプロセッサを備える、
請求項２１の方法。

【請求項23】

前記情報は、以前に実行された命令が、メモリ集約型命令であるかどうかを示す、
請求項２１の方法。

【請求項24】

前記情報は、以前に実行された命令が、指定された命令であるかどうかを示す、
請求項２１の方法。

【請求項25】

前記情報は、以前に実行された命令が、特定のタイプの命令であるかどうかを示す、
請求項２１の方法。

【請求項26】

前記予測は、前記情報に自己相関関数（ＡＣＦ）を適用することによって生成される、
請求項２１の方法。

【請求項27】

前記予測は、前記情報に人工ニューラルネットワーク（ＡＮＮ）を適用することによって生成される、
請求項２１の方法。

【請求項28】

前記第１のメモリデバイスは、相対的により低い帯域幅のメモリを備え、前記第２のメモリデバイスは、相対的により高い帯域幅のメモリを備える、
請求項２１の方法。

【請求項29】

前記第１のメモリデバイスは、シンクロナスダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）、ダブルデータレート（ＤＤＲ）ＳＤＲＡＭ、及び／又は、低電力ダブルデータレート（ＬＰＤＤＲ）ＳＤＲＡＭを備える、
請求項２１の方法。

【請求項30】

前記第２のメモリデバイスは、高帯域幅メモリ（ＨＢＭ）及び／又はキャッシュメモリを備える、
請求項２１の方法。

【請求項31】

リソース管理デバイスにおいて実施される方法であって、
リソースの使用量に関する情報を取得することと、
前記情報に基づいて、プロセッサによるリソースの使用量が今後の期間中に閾値を超えるという予測を生成することと、
前記予測に基づいて、前記プロセッサの動作パラメータを調整することと、を含む、
方法。

【請求項32】

前記リソースは、電力を含む、
請求項３１の方法。

【請求項33】

前記リソースは、サーマルバジェットを含む、
請求項３１の方法。

【請求項34】

前記動作パラメータは、電圧又は電流を含む、
請求項３１の方法。

【請求項35】

前記動作パラメータは、クロック周波数を含む、
請求項３１の方法。

【請求項36】

前記動作パラメータは、前記プロセッサの一部に対して調整される、
請求項３１の方法。

【請求項37】

前記リソース管理デバイスは、入出力メモリマネジメントユニット（ＩＯＭＭＵ）、ＩＯＭＭＵと通信するプロセッサ、及び／又は、ＩＯＭＭＵと統合されたプロセッサを備える、
請求項３１の方法。

【請求項38】

前記情報は、前記プロセッサによるリソースの使用量が以前の期間中に前記閾値を超えているかどうかを示す、
請求項３１の方法。

【請求項39】

前記予測は、前記情報に自己相関関数（ＡＣＦ）を適用することによって生成される、
請求項３１の方法。

【請求項40】

前記予測は、前記情報に人工ニューラルネットワーク（ＡＮＮ）を適用することによって生成される、
請求項３１の方法。

【発明の詳細な説明】

【技術分野】

【0001】

（関連出願の相互参照）
本願は、２０２１年１２月２９日に出願された米国特許出願第１７／５６５，３３６号の利益を主張するものであり、その内容は、参照により本明細書に組み込まれる。

【背景技術】

【0002】

現代のコンピューティングシステムは、典型的に、２つ以上のタイプのプロセッサを含む。例えば、パーソナルコンピュータは、ＣＰＵとＧＰＵの両方を含むことが一般的である。また、そのようなシステムは、典型的に、２つ以上の種類のメモリも含む。例えば、パーソナルコンピュータは、メインメモリを含み、且つ、グラフィックスメモリを含み得る。パーソナルコンピュータのメインメモリは、典型的に、相対的に大きい容量と相対的により低い帯域幅とを提供するダイナミックランダムアクセスメモリ（dynamic random-access memory、ＤＲＡＭ）から構成され、グラフィックスメモリは、典型的に、相対的により小さい容量を有する高帯域幅メモリ（high bandwidth memory、ＨＢＭ）から構成される。

【0003】

典型的には、ＣＰＵは、メインメモリに記憶されたデータに対して計算を行い、ＧＰＵは、グラフィックスメモリに記憶されたデータに対して計算を行う。しかしながら、ほとんどの場合、ＣＰＵは、グラフィックスメモリにアクセスすることもできる。更に、メモリバス速度によって許容できない量の帯域幅を失うことなく、ＣＰＵがグラフィックスメモリのより高いメモリ帯域幅を活用することができるようなメモリバス速度がより一般的になってきている。同様に、ＧＰＵは、場合によっては、計算のためにメインメモリにアクセスすることができる。このようにして、コンピュータシステム内の様々なタイプのメモリは、プロセッサ（例えば、ＣＰＵ及びＧＰＵ）間で共有されるリソースとみなすことができる。メモリに加えて、電力及びサーマルバジェット等の他のタイプのリソースも、プロセッサ間で共有されるリソースとみなすことができる。

【0004】

添付の図面と共に例として与えられる以下の説明から、より詳細な理解を得ることができる。

【図面の簡単な説明】

【0005】

【図1】本開示の１つ以上の特徴を実装することができる、例示的なデバイスのブロック図である。

【図2】追加の詳細を示す図１のデバイスのブロック図である。

【図3】本開示の１つ以上の特徴を実装することができる、例示的なデバイスを示すブロック図である。

【図4】図３に関して示され説明されたコンピューティングデバイス等のコンピューティングデバイス内のメモリ帯域幅を管理するための例示的な方法を示すフローチャートである。

【図5】特定の時間期間中の帯域幅集約型命令（bandwidth intensive instruction）によるメモリの領域へのアクセスを予測するための例示的な方法を示すブロック図である。

【図6】特定の時間期間中の帯域幅集約型命令によるメモリの領域へのアクセスを予測するための自己相関関数の適用を示す線グラフである。

【図7】図３に関して示され説明されたコンピューティングデバイス等のコンピューティングデバイス内のエネルギー消費を管理するための例示的な方法を示すフローチャートである。

【図8】図３に関して示され説明されたコンピューティングデバイス等のコンピューティングデバイス内の温度を管理するための例示的な方法を示すフローチャートである。

【発明を実施するための形態】

【0006】

いくつかの実施形態は、コンピューティングデバイス内のリソースを管理するためのデバイス、方法及びシステムを提供する。メモリ帯域幅利用率に関する情報が取り込まれる。情報に基づいて、第１のメモリデバイスに記憶されたメモリ領域が今後の時間期間中にメモリ集約型命令によってアドレス指定されるという予測が生成される。予測に基づいて、メモリ領域に記憶されたデータが第２のメモリデバイスに移動される。

【0007】

いくつかの実施形態では、方法は、リソース管理デバイスにおいて実施される。いくつかの実施形態では、リソース管理デバイスは、入出力メモリマネジメントユニット（input output memory management unit、ＩＯＭＭＵ）、ＩＯＭＭＵと通信するプロセッサ、及び／又は、ＩＯＭＭＵと統合されたプロセッサを備える。いくつかの実施形態では、情報は、以前に実行された命令がメモリ集約型命令であるかどうか、以前に実行された命令が指定された命令であるかどうか、及び／又は、以前に実行された命令が特定のタイプの命令であるかどうかを示す。いくつかの実施形態では、予測は、情報に自己相関関数（autocorrelation function、ＡＣＦ）及び／又は人工ニューラルネットワーク（artificial neural network、ＡＮＮ）を適用することによって生成される。

【0008】

いくつかの実施形態では、第１のメモリデバイスは、相対的により低い帯域幅のメモリを備え、第２のメモリデバイスは、相対的により高い帯域幅のメモリを備える。いくつかの実施形態では、第１のメモリデバイスは、シンクロナスダイナミックランダムアクセスメモリ（synchronous dynamic random-access memory、ＳＤＲＡＭ）、ダブルデータレート（double data rate、ＤＤＲ）ＳＤＲＡＭ、及び／又は、低電力ダブルデータレート（low power DDR、ＬＰＤＤＲ）ＳＤＲＡＭを備える。いくつかの実施形態では、第２のメモリは、高帯域幅メモリ（ＨＢＭ）及び／又はキャッシュメモリを備える。

【0009】

いくつかの実施形態は、コンピューティングデバイス内のリソースを管理するための更なるデバイス、方法及びシステムを提供する。リソース使用量に関する情報が取り込まれる。情報に基づいて、プロセッサによるリソース使用量が今後の時間の間に閾値を超えるという予測が生成される。予測に基づいて、プロセッサの動作パラメータが調整される。

【0010】

いくつかの実施形態では、リソース管理デバイスは、入出力メモリマネジメントユニット（ＩＯＭＭＵ）、ＩＯＭＭＵと通信するプロセッサ、及び／又は、ＩＯＭＭＵと統合されたプロセッサを備える。いくつかの実施形態では、リソースは、電力及び／又はサーマルバジェットを含む。いくつかの実施形態では、動作パラメータは、電圧、電流及び／又はクロック周波数を含む。いくつかの実施形態では、動作パラメータは、プロセッサの一部に対して調整される。

【0011】

いくつかの実施形態では、情報は、プロセッサによるリソース使用量が以前の時間期間中に閾値を超えているかどうかを示す。いくつかの実施形態では、予測は、情報に自己相関関数（ＡＣＦ）及び／又は人工ニューラルネットワーク（ＡＮＮ）を適用することによって生成される。

【0012】

図１は、本開示の１つ以上の特徴を実装することができる例示的なデバイス１００のブロック図である。デバイス１００は、コンピュータ、ゲームデバイス、ハンドヘルドデバイス、セットトップボックス、テレビ、携帯電話、サーバ、タブレットコンピュータ、又は、他のタイプのコンピューティングデバイス等を含むことができる。デバイス１００は、プロセッサ１０２、メモリ１０４、ストレージ１０６、１つ以上の入力デバイス１０８、及び、１つ以上の出力デバイス１１０を含む。また、デバイス１００は、入力経路１１２と出力経路１１４とを含み得る。入力経路及び出力経路の態様は、限定しないが、ダイ内又はダイ間の回路及び電気接続、並びに、ドライバ等のソフトウェア構成要素を含み得る。デバイス１００は、図１に示されていない追加の構成要素を含むことができることを理解されたい。

【0013】

様々な代替例では、プロセッサ１０２は、中央処理ユニット（central processing unit、ＣＰＵ）、グラフィックス処理ユニット（graphics processing unit、ＧＰＵ）、同じダイ上に位置するＣＰＵ及びＧＰＵ、又は、１つ以上のプロセッサコアを含み、各プロセッサコアは、ＣＰＵ又はＧＰＵとすることができる。様々な代替例では、メモリ１０４は、プロセッサ１０２と同じダイ上に位置するか、又は、プロセッサ１０２とは別に位置する。メモリ１０４は、揮発性又は不揮発性メモリ（例えば、ランダムアクセスメモリ（random access memory、ＲＡＭ）、ダイナミックＲＡＭ、キャッシュ）を含む。

【0014】

ストレージ１０６は、固定又はリムーバブル記憶装置（例えば、ハードディスクドライブ、ソリッドステートドライブ、光ディスク、フラッシュドライブ）を含む。入力デバイス１０８は、キーボード、キーパッド、タッチスクリーン、タッチパッド、検出器、マイクロフォン、加速度計、ジャイロスコープ、生体認証スキャナ、又は、ネットワーク接続（例えば、無線ＩＥＥＥ８０２シグナルの送信及び／又は受信のための無線ローカルエリアネットワークカード）を含むが、これらに限定されない。出力デバイス１１０は、ディスプレイ、スピーカ、プリンタ、触覚フィードバックデバイス、１つ以上の光、アンテナ、又は、ネットワーク接続（例えば、無線ＩＥＥＥ８０２シグナルの送信及び／又は受信のための無線ローカルエリアネットワークカード）を含むが、これらに限定されない。

【0015】

入力経路１１２は、プロセッサ１０２と入力デバイス１０８とを接続し、プロセッサ１０２が入力デバイス１０８から入力を受信することを可能にする。出力経路１１４は、プロセッサ１０２及び出力デバイス１１０と通信し、プロセッサ１０２が出力デバイス１１０に出力を送信することを可能にする。出力経路１１６は、表示デバイス１１８に結合された加速処理デバイス（accelerated processing device、ＡＰＤ）１１６を含む。ＡＰＤは、プロセッサ１０２から計算コマンド及びグラフィックスレンダリングコマンドを受け入れて、それらの計算コマンド及びグラフィックスレンダリングコマンドを処理し、表示のためにピクセル出力を表示デバイス１１８に提供する。以下で更に詳細に説明するように、ＡＰＤ１１６は、単一命令複数データ（single-instruction-multiple-data、ＳＩＭＤ）パラダイムに従って計算を行う１つ以上の並列処理ユニットを含む。したがって、様々な機能は、本明細書では、ＡＰＤ１１６によって又はＡＰＤ１１６と連動して行われるものとして説明されているが、様々な代替例では、ＡＰＤ１１６によって行われるものとして説明される機能は、追加的又は代替的に、ホストプロセッサ（例えば、プロセッサ１０２）によってドライブされず、表示デバイス１１８にグラフィック出力も提供しない、同様の能力を有する他のコンピューティングデバイスによって行われる。例えば、ＳＩＭＤパラダイムに従って処理タスクを行う任意の処理システムが、本明細書に説明される機能を行い得ることが企図される。代替的に、ＳＩＭＤパラダイムに従って処理タスクを行わないコンピューティングシステムが、本明細書に説明される機能を行い得ることが企図される。

【0016】

図２は、ＡＰＤ１１６上の処理タスクの実行に関する追加の詳細を示すデバイス１００のブロック図である。プロセッサ１０２は、システムメモリ１０４内で、プロセッサ１０２による実行のための１つ以上の制御論理モジュールを維持する。制御論理モジュールは、オペレーティングシステム１２０、カーネルモードドライバ１２２、及び、アプリケーション１２６を含む。これらの制御論理モジュールは、プロセッサ１０２及びＡＰＤ１１６の動作の様々な特徴を制御する。例えば、オペレーティングシステム１２０は、ハードウェアと直接通信し、プロセッサ１０２上で実行される他のソフトウェアのためのハードウェアへのインターフェースを提供する。カーネルモードドライバ１２２は、例えば、プロセッサ１０２上で実行されるソフトウェア（例えば、アプリケーション１２６）にアプリケーションプログラミングインターフェース（application programming interface、ＡＰＩ）を提供して、ＡＰＤ１１６の様々な機能にアクセスすることによって、ＡＰＤ１１６の動作を制御する。また、カーネルモードドライバ１２２は、ＡＰＤ１１６の処理構成要素（以下で更に詳細に説明されるＳＩＭＤユニット１３８等）によって実行するためのプログラムをコンパイルするジャストインタイムコンパイラを含んでもよい。

【0017】

ＡＰＤ１１６は、並列処理に適しているか、又は、並列処理に適し得るグラフィックス動作及び非グラフィックス動作等の選択された機能のためのコマンド及びプログラムを実行する。ＡＰＤ１１６は、プロセッサ１０２から受信したコマンドに基づいて、ピクセル動作、幾何学計算、及び、表示デバイス１１８への画像のレンダリング等のグラフィックスパイプライン動作を実行するために使用することができる。また、ＡＰＤ１１６は、プロセッサ１０２から受信したコマンドに基づいて、ビデオ、物理シミュレーション、計算流体力学、又は、他のタスクに関連する動作等のように、グラフィックス動作に直接関連しない計算処理動作を実行する。

【0018】

ＡＰＤ１１６は、プロセッサ１０２の要求で、ＳＩＭＤパラダイムに従って並列の方式で動作を行う１つ以上のＳＩＭＤユニット１３８を含む計算ユニット１３２を含む。ＳＩＭＤパラダイムは、複数の処理要素が単一のプログラム制御フローユニット及びプログラムカウンタを共有し、したがって同じプログラムを実行するが、そのプログラムを異なるデータで、又は異なるデータ使用して実行することができるものである。一例では、各ＳＩＭＤユニット１３８は、１６個のレーンを含み、各レーンは、ＳＩＭＤユニット１３８内の他のレーンと同時に同じ命令を実行するが、その命令を異なるデータで実行することができる。レーンは、全てのレーンが所定の命令を実行する必要がない場合、予測でオフに切り替えることができる。また、予測は、分岐制御フローを有するプログラムを実行するために使用することができる。より具体的には、制御フローが個々のレーンによって行われる計算に基づいている条件付き分岐又は他の命令を有するプログラムについては、現在実行されていない制御フローパスに対応するレーンの予測及び異なる制御フローパスのシリアル実行が、任意の制御フローを可能にする。

【0019】

計算ユニット１３２内の実行の基本的単位は、ワークアイテムである。各ワークアイテムは、特定のレーンにおいて並列で実行されるプログラムの単一のインスタンス化を表す。ワークアイテムは、単一のＳＩＭＤ処理ユニット１３８上の「ウェーブフロント（wavefront）」として同時に実行することができる。１つ以上のウェーブフロントが「ワークグループ」に含まれ、これは、同じプログラムを実行するように指定されたワークアイテムの集合体を含む。ワークグループは、ワークグループを構成するウェーブフロントの各々を実行することによって実行され得る。代替例では、ウェーブフロントは、単一のＳＩＭＤユニット１３８上で連続して、又は、異なるＳＩＭＤユニット１３８上で部分的に若しくは完全に並列で実行される。ウェーブフロントは、単一のＳＩＭＤユニット１３８上で同時に実行され得るワークアイテムの最大集合体と考えることができる。したがって、プロセッサ１０２から受信されたコマンドが、プログラムは単一のＳＩＭＤユニット１３８上で同時に実行させることができない程度に特定のプログラムが並列化されるべきであることを示す場合、そのプログラムは、２つ以上のＳＩＭＤユニット１３８上に並列化されるか、又は、同じＳＩＭＤユニット１３８上で直列化される（又は必要に応じて並列化及び直列化の両方）ウェーブフロントに分けられる。スケジューラ１３６は、異なる計算ユニット１３２及びＳＩＭＤユニット１３８上の様々なウェーブフロントのスケジューリングに関連する動作を行う。

【0020】

計算ユニット１３２によって与えられる並列処理は、ピクセル値計算、頂点変換及び他のグラフィックス動作等のグラフィックス関連動作に好適である。したがって、場合によっては、プロセッサ１０２からのグラフィックス処理コマンドを受け入れるグラフィックスパイプライン１３４は、並列で実行するために計算タスクを計算ユニット１３２に提供する。

【0021】

また、計算ユニット１３２は、グラフィックに関連しないか、又は、グラフィックスパイプライン１３４の「通常の」動作の一部（例えば、グラフィックスパイプライン１３４の動作に対して行われる処理を補足するために行われるカスタム動作）として行われない計算タスクを行うために使用される。プロセッサ１０２上で実行されるアプリケーション１２６又は他のソフトウェアは、そのような計算タスクを定義するプログラムを、実行のためにＡＰＤ１１６に送信する。

【0022】

図３は、本開示の１つ以上の特徴を実装することができる例示的なデバイス３００のブロック図である。デバイス３００は、コンピュータ、ゲームデバイス、ハンドヘルドデバイス、セットトップボックス、テレビ、携帯電話、サーバ、タブレットコンピュータ、又は、他のタイプのコンピューティングデバイス等を含むことができる。いくつかの実施形態では、デバイス３００は、図１に関して示され説明されたデバイス１００の態様の一部又は全部を使用して実装される。

【0023】

デバイス３００は、ＣＰＵ３０２、ＧＰＵ３０４、メインメモリ３０６、グラフィックスメモリ３０８、メモリマネジメントユニット（memory management unit、ＭＭＵ）３１０、入力／出力メモリマネジメントユニット（ＩＯＭＭＵ）３１２、バス３１４、及び、リソースマネージャ３１６を含む。この例では、リソースマネージャ３１６は、メモリ帯域幅を管理する。

【0024】

ＣＰＵ３０２は、任意の好適な処理デバイスを含む。いくつかの実施形態では、ＣＰＵ３０２は、図１に関して示され説明されたように、プロセッサ１０２を使用して実装される。ＧＰＵ３０４は、任意の好適なグラフィックス処理デバイスを含む。いくつかの実施形態では、ＧＰＵ３０４は、図１に関して示され説明されたように、ＡＰＤ１１６を使用して実装される。

【0025】

メインメモリ３０６は、任意の好適なメモリデバイスを含む。いくつかの実施形態では、メインメモリ３０６は、図１に関して示され説明されたように、メモリ１０４を使用して実装される。この例では、メインメモリ３０６は、ＬＰＤＤＲ又はグラフィックスメモリと比較して相対的に大量のストレージを提供し、且つ、グラフィックスメモリと比較して相対的に低速な任意の他の好適なメモリを使用して実装される。

【0026】

グラフィックスメモリ３０８は、任意の好適なグラフィックスメモリデバイスを含む。いくつかの実施形態では、グラフィックスメモリ３０８は、図１に関して示され説明されたように、メモリ１０４を使用して実装される。この例では、メインメモリ３０６は、ＨＢＭ又はメインメモリと比較して相対的に高速であり、且つ、メインメモリと比較して相対的に少量のストレージを提供する任意の他の好適なメモリを使用して実装される。

【0027】

ＭＭＵ３１０は、メインメモリ３０６へのアクセスを管理する。例えば、メインメモリ３０６から読み取るか又はメインメモリ３０６に書き込むためのＣＰＵ３０２又は他のデバイスからの要求は、ＭＭＵ３１０によって管理されている。ＩＯＭＭＵ３１２は、ＧＰＵ３０４及びグラフィックスメモリ３０８へのアクセスを管理する。例えば、グラフィックスメモリ３０８から読み取るか又はグラフィックスメモリ３０８に書き込むためのＧＰＵ３０４（若しくはＣＰＵ３０２、又は、いくつかの実施形態では他のデバイス）からの要求は、ＩＯＭＭＵ３１２によって管理されている。また、ＩＯＭＭＵ３１２は、ＣＰＵ３０２、ＧＰＵ３０４、（及びいくつかの実施形態では、他の加速器デバイス）、メインメモリ３０６、及び、グラフィックスメモリ３０８をカバーする仮想アドレス空間を管理する（すなわち、仮想メモリアドレスと物理メモリアドレスとの間で変換する）。ＩＯＭＭＵ３１２は、ＣＰＵ３０２とＧＰＵ３０４（及びいくつかの実施形態では、他の加速器デバイス）との「間に」位置決めされるが、ＩＯＭＭＵ３１２には２つ以上のアクセラレータが接続されてもよいことに留意されたい。ＩＯＭＭＵ３１２は、ＧＰＵ３０４（若しくはＣＰＵ３０２、又は、いくつかの実施形態では他のデバイス）からのアドレストランザクション要求を扱う。

【0028】

バス３１４は、デバイス３００の構成要素間の通信のための好適な通信インフラストラクチャを含む。いくつかの実施形態では、バス３１４は、周辺構成要素相互接続（Peripheral Component Interconnect、ＰＣＩ）バス、ＰＣＩ拡張（PCI enhanced、ＰＣＩｅ）バス、アドバンストマイクロコントローラバスアーキテクチャ（Advanced Microcontroller Bus Architecture、ＡＭＢＡ）バス、加速グラフィックスポート（Accelerated Graphics Port、ＡＧＰ）バス、又は、他の好適な通信インフラストラクチャのうち１つ以上を含む。ＣＰＵ３０２は、ＭＭＵ３１０を介してバス３１４を通じてメインメモリ３０６と通信し、ＩＯＭＭＵ３１２を介してバス３１４を通じてＧＰＵ３０４と通信する。ＣＰＵ３０２及びＧＰＵ３０４の各々は、バス３１４を介してメインメモリ３０６及びグラフィックスメモリ３０８へのアクセスを有する。

【0029】

ＣＰＵ３０２は、メモリに記憶されたデータにアクセスする様々な命令を実行する。異なる命令を実行するには、他の命令よりも多くのメモリ帯域幅を必要とすることに留意されたい。例えば以下の命令ファミリは、高められたＢＷ要件を提示する場合がある。すなわち、ストリーミングＳＩＭＤ拡張（Streaming SIMD Extensions、ＳＳＥ）、アドバンストベクトル拡張（Advanced Vector Extensions、ＡＶＸ）、ＡＶＸ２、ＡＶＸ－５１２、及び、ＡＶＸ－５１２ＢＷは、帯域幅要件を変化させる結果となる場合がある。ＳＳＥは、ｘ８６アーキテクチャへの単一命令複数データ（single instruction, multiple data、ＳＩＭＤ）命令セット拡張である。ＡＶＸは、マイクロプロセッサ用のｘ８６命令セットアーキテクチャの拡張である。ＡＶＸ２は、ほとんどの整数コマンドを２５６ビットに拡張し、融合された乗算累算（multiply-accumulate、ＦＭＡ）演算を導入する。ＡＶＸ－５１２は、ＥＶＥＸプレフィックス符号化を使用してＡＶＸを５１２ビットサポートに拡張する。ＡＶＸ－５１２ＢＷ等のＡＶＸ拡張は、ベクトルアクセスをマスクして、間隔にわたるデータ依存アクセスパターンとＶＧＡＴＨＥＲＤＰＤ／ＶＳＣＡＴＴＥＲＤＰＤ等の収集／分散命令とをもたらす。これらは、実行中に他の命令よりも大幅に多くのメモリ帯域幅（例えば、所望の閾値を上回るより多くのメモリ帯域幅）を占有し得る命令の例にすぎない。そのような命令は、本明細書では「帯域幅集約型」命令と呼ばれる。

【0030】

リソースマネージャ３１６は、ＧＰＵ３０４（又はＡＰＤ３０４）からの作業負荷によって発行された要求のためのメモリ帯域幅を管理する処理要素である。いくつかの実施形態では、リソースマネージャ３１６は、ＩＯＭＭＵ３１２の追加の実行経路であり、専用ＦＰＧＡ若しくはＡＳＩＣ処理要素、又は、他の好適なハードウェアを用いて実装されてもよい。いくつかの実施形態では、リソースマネージャ３１６は、代替的又は追加的にＭＭＵ３１０と通信するデバイスである。いくつかの実施形態では、リソースマネージャ３１６の態様は、オペレーティングシステムソフトウェアにおいて実装され得る。

【0031】

リソースマネージャ３１６は、ＣＰＵ命令のデータ配置を決定する。例えば、いくつかの実施形態では、リソースマネージャ３１６は、今後の時間間隔（例えば、次の１分）において実行されるＣＰＵ命令に対応するデータを何処に配置するかを決定する。いくつかの実施形態では、リソースマネージャ３１６は、ＢＷ集約型命令から特定のサイズの複数の物理領域の各々へのアクセス数Ａの時系列プロファイルを入力として取る。これは、図４に関してより詳細に説明される。概して、リソースマネージャ３１６は、時系列プロファイルに基づいて行われた予測を考慮して、今後の時間期間に記憶される共有アドレス空間の特定の領域に記憶されたデータに適したタイプのメモリを決定する。

【0032】

現在の例では、システム３００は、ＬＰＤＤＲ（低帯域幅メモリ）を使用して実装されるメインメモリ３０６を含み、且つ、ＨＢＭ（高帯域幅メモリ）を使用して実装されるグラフィックスメモリ３０８を含む。したがって、リソースマネージャ３１６は、共有アドレス空間の特定の領域に記憶されたデータが今後の時間期間に低帯域幅メモリに記憶されるべきか又は高帯域幅メモリに記憶されるべきかを、今後の時間期間中に帯域幅集約型命令がその領域にアクセスするかどうか、及び／又は、いくつの帯域幅集約型命令がアクセスするかの予測を考慮して決定する。この決定に応じて、リソースマネージャ３１６は、例えばオペレーティングシステムコマンドを使用して、好適なメモリ帯域幅能力を有する新しい物理メモリロケーションにデータを移動する。

【0033】

デバイス３００は、図３に示されていない追加の構成要素を含むことができることを理解されたい。

【0034】

図４は、図３に関して示され説明されたデバイス３００等のコンピューティングデバイス内のメモリ帯域幅を管理するための例示的な方法４００を示すフローチャートである。いくつかの実施形態では、方法４００は、図３に関して示され説明されたリソースマネージャ３１６等のリソースマネージャによって実装される。

【0035】

ステップ４０２において、リソースマネージャは、ある時間期間（サンプル長さ）Ｙにわたって、システム内の仮想メモリのＸサイズの領域にアクセスする命令に関する情報を取り込む。例えば、いくつかの実施形態では、リソースマネージャ３１６は、１分（minute、ｍｉｎ）の時間期間にわたって、メモリ３０６及び３０８の１ギガバイト（gigabyte、ＧＢ）領域にアクセスする命令に関する情報を取り込む。ここで、値Ｘ＝１ＧＢ、Ｙ＝１ｍｉｎは例示であり、他の実施形態では、Ｘ及びＹの他の値が使用可能であり、並びに／又は、これらの値は動的に可変であり及び／若しくはユーザ構成可能である。

【0036】

この例では、各メモリ領域について、リソースマネージャは、その時間期間中にその領域が帯域幅集約型命令によってアクセスされるかどうか、及び／又は、アクセスされる回数Ａを記録する。また、リソースマネージャは、Ｚ個の時間期間のサンプルサイズにわたって、後続の時間期間中に帯域幅集約型命令によって各領域がアクセスされるかどうか、及び／又は、アクセス回数Ａを記録し、したがって、帯域幅集約型命令が各メモリ領域にアクセスする頻度を反映する時系列のデータを蓄積する。

【0037】

リソースマネージャは、蓄積された時系列の情報に基づいて、メモリ領域ごとに、次の（又は後の）時間期間中に帯域幅集約型命令によってアクセスされる可能性が高いかどうかを予測する。予測は、時系列データに自己相関関数（ＡＣＦ）又は人工ニューラルネットワーク（ＡＮＮ）を適用すること等による、任意の好適な方法で行われる。

【0038】

各メモリ領域について、メモリ領域内のアドレスが帯域幅集約型命令によってアクセスされる（又は少なくとも閾値数の帯域幅集約型命令によってアクセスされる）ことが予測されるという条件４０４で、リソースマネージャは、仮想メモリ領域内のデータが未だＨＢＭ内にない場合、そのデータをＨＢＭ（すなわち、この例ではグラフィックスメモリ３０８）に移動する。メモリ領域内のアドレスが帯域幅集約型命令によってアクセスされない（又は閾値数より少ない帯域幅集約型命令によってアクセスされる）ことが予測されるという条件４０４で、リソースマネージャは、仮想メモリ領域内のデータが未だＬＢＭ内にない場合、そのデータをＬＢＭ（すなわち、この例ではメインメモリ３０６）に移動する。これらの特定のタイプのメモリは、例示にすぎない。いくつかの実施形態では、他の種類のメモリが使用され、３つ以上の異なるタイプのメモリが帯域幅集約性によって区別されてもよいことに留意されたい。

【0039】

リソースマネージャは、任意の好適な方法で、仮想メモリ領域内のデータを１つの物理メモリから別の物理メモリに移動する。例えば、いくつかの実施形態では、リソースマネージャは、データを移動するためにオペレーティングシステム（operating system、ＯＳ）を呼び出す。いくつかの実施形態では、リソースマネージャは、システム上で実行中のアプリケーションに対してデータを透過的に移動するために、ＭＰＯＬ＿ＭＦ＿ＭＯＶＥフラグを有するＬｉｎｕｘ（登録商標）ｍｏｖｅ＿ｐａｇｅｓ（）又はｍｂｉｎｄ（）等の標準ＯＳコールを起動して、仮想アドレスの物理アドレスへのマッピングを変更する。いくつかの実施形態では、これは、アプリケーションのソースコードを変更する必要なくデータを移動させるという利点を有する。

【0040】

方法４００は、図３に関して示され説明されたようなリソースマネージャ３１６と同様に置かれた（例えば、ＩＯＭＭＵ３１２内にある、又は、ＩＯＭＭＵ３１２と通信している）リソースマネージャを使用して実装されるものとして説明されているが、方法４００は、帯域幅集約型命令による複数のメモリ領域（例えば、異種メモリタイプをカバーする統一アドレス空間にわたる）へのアクセスを追跡することが可能な任意の好適なハードウェアを使用して実装可能であることに留意されたい。

【0041】

図５は、特定の時間期間中に仮想メモリの領域が帯域幅集約型命令によってアクセスされる可能性が高いかどうか、及び／又は、何回アクセスされるかを予測するための例示的な方法５００を示すブロック図である。予測は、自己相関関数（ＡＣＦ）又は人工ニューラルネットワーク（ＡＮＮ）を使用する等の任意の好適な方法で行われる。いくつかの実施形態では、方法５００は、リソースマネージャ３１６又は任意の他の好適なハードウェアにおいて実施される。

【0042】

この例では、長さＹを有する時間期間ｉ中に、複数のメモリ領域（この例ではｎ、ｍ）の各々内のアドレスが帯域幅集約型命令によってアクセスされるかどうか、及び／又は、アクセスされる回数Ａが決定される。この情報は、予測への入力データとして使用するために記憶される。

【0043】

同様に長さＹを有する後続の時間期間ｉ＋１中に、メモリ領域ｎ、ｍ内のアドレスが帯域幅集約型命令によってアクセスされるかどうか、及び／又は、アクセスされる回数Ａが再び決定される。この情報も同様に、予測への入力データとして使用するために記憶される。

【0044】

メモリ領域への帯域幅命令アクセスに関する（サンプル数Ｚについての）好適な量の履歴データが蓄積された後、各メモリ領域内のアドレスが帯域幅集約型命令によってアクセスされるかどうか、及び／又は、アクセスされる回数に関する予測が生成される。示されている例では、時間期間ｉ中及び時間期間ｉ＋１中（この例ではＺ＝２）に収集されたデータに基づいて、メモリ領域ｍが時間期間ｉ＋２中にｙ個の帯域幅集約型命令によってアクセスされるという予測が行われる。

【0045】

予測は、収集されたデータにＡＣＦを適用することによって、又は、適切にトレーニングされたＡＮＮに収集されたデータを入力することによって等の任意の好適な手法に基づいて行われる。予測に基づいて、リソースマネージャは、領域ｍ内の仮想アドレスに記憶されたデータを、今後の時間期間中に予想されるｙ個の帯域幅集約型命令と一致する異なるタイプの物理メモリに移動し得る。

【0046】

異なる変数が、ユーザ選択可能であり、及び／又は、動的に制御可能であることに留意されたい。例えば、領域サイズＸ、サンプル長さＹ及びサンプルサイズＺの全ては、例えば、ユーザによって、又は、動的機構によって調整可能である。いくつかの実施形態では、動的制御は、作業負荷特性が実行時に変化する場合に有利である。例えば、特定の作業負荷は、より小さい若しくはより大きいサンプル長さＹ、又は、より小さい若しくはより大きいサンプルサイズＺを必要とする場合がある。マルチプログラムされた作業負荷が使用される場合等のいくつかの実施形態では、これらの変数は、例えば、実行時に各プロセスのためのリソース割り当てを調整するＯＳに起因して、動的に調整される。いくつかの実施形態では、そのような動的機構は、１つ以上の作業負荷の特性（例えば、帯域幅要件又はアクセス粒度）を入力し、これらの入力変数を出力変数（Ｘ、Ｙ、Ｚ）と相関させる。いくつかの実施形態では、相関は、回帰に基づいて、又は、別の他の相関機構によって生成される。

【0047】

図６は、収集されたデータに基づいて、帯域幅集約型命令が今後の時間期間中にメモリ領域にアクセスするかどうか、及び／又は、いくつの帯域幅集約型命令がアクセスするかを予測するための、収集されたデータへの自己相関関数の適用を示す線グラフを示している。

【0048】

自己相関は、ラグと呼ばれる遅延の関数として、信号とそれ自体の遅延コピーとの相関を測定する時系列分析のための方法である。自己相関の分析は、ノイズによって覆い隠された周期的信号の存在等の繰り返しパターンを見つけるための数学的ツールである。ラグによる時系列の自己相関のプロットは、自己相関関数（ＡＣＦ）と呼ばれる。

【0049】

上のグラフは、メモリ領域内のアドレスが帯域幅集約型命令によってアクセスされる回数Ａの１００個のサンプルに対するピアソンの相関係数のプロットである。ピアソンの相関係数は、負又は正の相関をそれぞれ記述する－１と１の間の数である。０の値は相関がないことを示す。この例では、一連の１００個のサンプルは正弦関数を隠している。

【0050】

データがある傾向に従う場合、時間的に近い観測値もサイズが近いので、小さいラグに対する自己相関は大きく正である傾向がある。したがって、傾向付けられた時系列のＡＣＦは、ラグが増加するにつれてゆっくりと減少する正の値を有する傾向がある。データが周期的である場合、自己相関は、他のラグよりも（周期的周波数の倍数での）季節的ラグ（seasonal lags）の方が大きくなる。

【0051】

この例では、１分（Ｙ）時間間隔ごとに、ＣＰＵリソースマネージャは、１ＧＢ（Ｘ）のメモリ領域ごとに最新の１００個（Ｚ）の間隔で測定されたＡの１００個の値についてＡＣＦ関数を生成する。

【0052】

下のグラフは、１００個の時間間隔にわたって測定されたＡの１００個の値についてのＡＣＦ関数のプロットである。いくつかの実施形態では、リソースマネージャは、ＡＣＦを分析して、次の間隔（すなわち、Ｚ＝１００であるこの例では、１０１番目の間隔）におけるＡの値を予測する。

【0053】

ラグが減少するにつれてＡＣＦが増加することは、継続する可能性が高い傾向を示す。上記の例の観点から、これは、ＡＣＦ上の隣接するラグ間のデルタ（すなわち、変化）を測定することによって、リソースマネージャによって検出される。

【0054】

デルタが特定の範囲内にある（例えば、デフォルトでＡＣＦ上の｜０．１｜等のように、リソースマネージャのメモリマップドレジスタを介して構成可能である）場合、漸進的な変化（したがって、傾向）が検出される。この例では、Ａの現在の値が低い（例えば、発行されたＣＰＵ命令からの現在のＢＷが低い、例えば、ＢＷが閾値ＢＷを下回る）場合、リソースマネージャは、（この傾向が続くことを予想して）次の間隔のために領域をＬＰＤＤＲに移動する。現在のＡが高い場合、領域はＨＢＭに移動される。これらのメモリタイプは単なる例であり、領域は、予測に基づいて、任意の好適なメモリタイプに移動される（又はそこに保持される）。

【0055】

ＡＣＦの「スカロップ状（scalloped）」又は周期的形状は、季節性（seasonality）を示す。いくつかの実施形態では、スカロップ状又は周期的形状は、スパイク（すなわち、いくつかの実施形態で構成可能である閾値を上回る値）を識別し、スパイク間の間隔を測定することによって識別される。間隔が、隣接するスパイクに対して一貫している場合（例えば、スパイク１と２との間が４、スパイク２と３との間も４、且つ、スパイク３と４との間の間隔も４である場合）、スカロップ状又は周期的形状が存在する。いくつかの実施形態では、リソースマネージャは周期的間隔を検出する。ここで、間隔は、相関における周期的なスパイク間の距離である。スパイクは、閾値（例えば、デフォルトでＡＣＦ上の｜０．５｜等のように、リソースマネージャのメモリマップドレジスタを介して構成可能である）に基づいて検出される。

【0056】

いくつかの実施形態では、リソースマネージャは、次のスパイクが発生する前に、領域を好適なメモリに（例えば、Ａが低い（例えば、閾値Ａを下回る）場合はＬＰＤＤＲに、及び／又は、Ａが高い（例えば、閾値Ａを下回る）場合はＨＢＭに）プロアクティブに移動する。これらのメモリタイプは単なる例であり、領域は、予測に基づいて、任意の好適なメモリタイプに移動される（又はそこに保持される）。

【0057】

自己相関は、領域が特定の時間期間中に帯域幅集約型命令によってアクセスされる可能性が高いかどうかを予測するための例示的な技術にすぎないことに留意されたい。例えば、いくつかの実施形態では、履歴データはＡＮＮに入力され、ＡＮＮは、領域が特定の時間期間中に帯域幅集約型命令によってアクセスされる可能性が高い確率を推論として出力する。

【0058】

いくつかの実施形態では、本明細書で説明される技術は、共有メモリ以外のリソースに適用可能である。例えば、いくつかの実施形態では、リソースマネージャは、メモリ帯域幅を管理するための方法４００と同様に、コンピューティングデバイス内の電力消費を管理するか、又は、コンピューティングデバイスのサーマルバジェットを管理する。いくつかの実装では、任意の好適なリソース（例えば、ＣＰＵ及びＧＰＵの両方によって、又は、２つ以上のプロセッサによって共有若しくは影響されるリソース）が、リソースマネージャによって管理可能である。

【0059】

図７は、図３に関して示され説明されたデバイス３００等のコンピューティングデバイス内のエネルギー消費を管理するための例示的な方法７００を示すフローチャートである。いくつかの実施形態では、方法７００は、図３に関して示され説明されたリソースマネージャ３１６と同様に置かれたリソースマネージャによって実装される。

【0060】

ステップ７０２において、リソースマネージャは、時間期間Ｙにわたって、ＣＰＵ３０２及びＧＰＵ３０４による電力消費に関するデータを取り込む。例えば、いくつかの実施形態では、リソースマネージャ３１６と同様に置かれたリソースマネージャは、１分（ｍｉｎ）の時間期間にわたって、ＣＰＵ３０２及びＧＰＵ３０４による電力消費を取り込む。ここで、値Ｙ＝１ｍｉｎは例示であり、他の実施形態では、Ｙの他の値が使用可能であり、並びに／又は、これらの値は動的に可変であり及び／若しくはユーザ構成可能である。

【0061】

各プロセッサ（例えば、ＣＰＵ３０２、ＧＰＵ３０４）について、リソースマネージャは、時間期間中の電力消費（例えば、平均、累積等）を記録する。また、リソースマネージャは、後続の時間期間中の各プロセッサの電力消費を記録し、したがって、各プロセッサの電力消費を反映する時系列のデータを蓄積する。

【0062】

蓄積された時系列のデータに基づいて、リソースマネージャは、各プロセッサについて、次の（又は後の）時間期間中に見込まれる電力消費を予測する。予測は、自己相関関数（ＡＣＦ）又は人工ニューラルネットワーク（ＡＮＮ）を使用する等の任意の好適な方法で行われる。

【0063】

プロセッサの総電力消費が閾値を超えることが予測されるという条件７０４で、リソースマネージャは、ステップ７０６において、供給電力が現在最小電力を上回っている場合、予測された時間期間の間、システムに供給される電力を低減する（例えば、電圧を下げる）。

【0064】

プロセッサの総電力消費が閾値を超えないことが予測されるという条件７０４で、リソースマネージャは、ステップ７０８において、供給電力が現在最大電力を下回っている場合、予測された時間期間の間、システムに供給される電力を増加させる（例えば、電圧を上げる）。

【0065】

これらの特定の電力介入（すなわち、例えば、システム全体、ＣＰＵ及び／若しくはＧＰＵ、ＣＰＵ及びＣＰＵの個々のコア若しくは計算ユニット等を電力ゲーティング又はスケーリングすること）は、例示にすぎない。いくつかの実施形態では、他の種類の介入（例えば、クロック周波数の増加及び低減）が使用され、並びに／又は、周波数スケーリング及び／若しくは電力ゲーティング／スケーリングの３つ以上の異なるレベルが使用されてもよいことに留意されたい。

【0066】

方法７００は、図３に関して示され説明されたようなリソースマネージャ３１６と同様に置かれた（例えば、ＩＯＭＭＵ３１２内にある、又はＩＯＭＭＵ３１２と通信している）リソースマネージャを使用して実施されるものとして説明されているが、方法７００は、複数のプロセッサの電力を追跡することが可能な任意の好適なハードウェアを使用して実施可能であることに留意されたい。

【0067】

別の例において、図８は、図３に関して示され説明されたデバイス３００等のコンピューティングデバイス内の温度を管理するための例示的な方法８００を示すフローチャートである。いくつかの実施形態では、方法８００は、図３に関して示され説明されたリソースマネージャ３１６と同様に置かれた（例えば、ＩＯＭＭＵ３１２内にある、又は、ＩＯＭＭＵ３１２と通信している）リソースマネージャによって実施される。

【0068】

ステップ８０２において、リソースマネージャは、時間期間Ｙにわたって、ＣＰＵ３０２及びＧＰＵ３０４の温度に関するデータを取り込む。例えば、いくつかの実施形態では、リソースマネージャ３１６と同様に置かれたリソースマネージャは、１分（ｍｉｎ）の時間期間にわたって、ＣＰＵ３０２及びＧＰＵ３０４の温度を取り込む。ここで、値Ｙ＝１ｍｉｎは例示であり、他の実施形態では、Ｙの他の値が使用可能であり、並びに／又は、これらの値は動的に可変であり及び／若しくはユーザ構成可能である。

【0069】

各プロセッサ（例えば、ＣＰＵ３０２、ＧＰＵ３０４）について、リソースマネージャは、時間期間中の温度（例えば、平均、累積等）を記録する。また、リソースマネージャは、後続の時間期間中の各プロセッサの温度を記録し、したがって、各プロセッサの温度を反映する時系列のデータを蓄積する。

【0070】

蓄積された時系列のデータに基づいて、リソースマネージャは、各プロセッサについて、次の（又は後の）時間期間中に見込まれる温度を予測する。予測は、自己相関関数（ＡＣＦ）又は人工ニューラルネットワーク（ＡＮＮ）を使用する等の任意の好適な方法で行われる。

【0071】

プロセッサの平均温度が閾値を超えることが予測されるという条件８０４で、リソースマネージャは、ステップ８０６において、システムのクロック周波数が現在最小周波数を上回っている場合、予測された時間期間の間、システムのクロック周波数を低減する。

【0072】

プロセッサの平均温度が閾値を超えないことが予測されるという条件８０４で、リソースマネージャは、ステップ８０８において、システムのクロック周波数が最大周波数を下回っている場合、予測された時間期間の間、システムのクロック周波数を増加させる。

【0073】

これらの特定の熱介入（すなわち、クロック周波数の増加及び低減）は、例示にすぎない。いくつかの実施形態では、他の種類の介入（例えば、システム全体、ＣＰＵ及び／若しくはＧＰＵ、ＣＰＵ及びＣＰＵの個々のコア若しくは計算ユニット等を電力ゲーティング又はスケーリングすること）が使用され、並びに／又は、周波数スケーリング及び／若しくは電力ゲーティング／スケーリングの３つ以上の異なるレベルが使用されてもよいことに留意されたい。

【0074】

方法８００は、図３に関して示され説明されたようなリソースマネージャ３１６と同様に置かれた（例えば、ＩＯＭＭＵ３１２内にある、又は、ＩＯＭＭＵ３１２と通信している）リソースマネージャを使用して実施されるものとして説明されているが、方法８００は、複数のプロセッサの温度を追跡することが可能な任意の好適なハードウェアを使用して実施可能であることに留意されたい。

【0075】

本明細書の開示に基づいて、多くの変形が可能であることを理解されたい。特徴及び要素が特定の組み合わせで上述されているが、各特徴又は要素は、他の特徴及び要素を用いずに単独で、又は、他の特徴及び要素を用いて若しくは用いずに様々な組み合わせで使用することができる。

【0076】

プロセッサ１０２、入力経路１１２、入力デバイス１０８、出力経路１１４、出力デバイス１１０、加速処理デバイス１１６、スケジューラ１３６、グラフィックス処理パイプライン１３４、計算ユニット１３２、ＳＩＭＤユニット１３８を含むが、これらに限定されない、図において示され及び／又は本明細書に記載される様々な機能ユニットは、汎用コンピュータ、プロセッサ若しくはプロセッサコアとして、又は、汎用コンピュータ、プロセッサ若しくはプロセッサコアによって実行可能な非一時的なコンピュータ可読記憶媒体若しくは別の媒体に記憶されているプログラム、ソフトウェア若しくはファームウェアとして実装され得る。提供される方法は、汎用コンピュータ、プロセッサ又はプロセッサコアにおいて実施することができる。好適なプロセッサとしては、例として、汎用プロセッサ、専用プロセッサ、従来型プロセッサ、デジタルシグナルプロセッサ（digital signal processor、ＤＳＰ）、複数のマイクロプロセッサ、ＤＳＰコアに関連する１つ以上のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路（Application Specific Integrated Circuit、ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（Field Programmable Gate Array、ＦＰＧＡ）回路、任意の他のタイプの集積回路（integrated circuit、ＩＣ）、及び／又は、状態マシンが挙げられる。そのようなプロセッサは、処理されたハードウェア記述言語（hardware description language、ＨＤＬ）命令及びネットリストを含む他の中間データ（コンピュータ可読媒体に記憶させることが可能な命令）の結果を使用して製造プロセスを構成することによって製造することができる。そのような処理の結果はマスクワークとすることができ、このマスクワークをその後の半導体製造プロセスにおいて使用して、本開示の特徴を実装するプロセッサを製造する。

【0077】

本明細書に提供される方法又はフローチャートは、汎用コンピュータ又はプロセッサによる実行のために非一時的なコンピュータ可読記憶媒体に組み込まれるコンピュータプログラム、ソフトウェア又はファームウェアにおいて実施することができる。非一時的なコンピュータ可読記憶媒体の例としては、読み取り専用メモリ（read only memory、ＲＯＭ）、ランダムアクセスメモリ（random access memory、ＲＡＭ）、レジスタ、キャッシュメモリ、半導体メモリデバイス、内蔵ハードディスク及びリムーバブルディスク等の磁気媒体、磁気光学媒体、並びに、ＣＤ－ＲＯＭディスク及びデジタル多用途ディスク（digital versatile disk、ＤＶＤ）等の光学媒体が挙げられる。

【図1】