特開2024-42193 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社デンソーの特許一覧 ▶ トヨタ自動車株式会社の特許一覧 ▶ 株式会社ミライズテクノロジーズの特許一覧

特開2024-42193半導体装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024042193

(43)【公開日】2024-03-28

(54)【発明の名称】半導体装置

(51)【国際特許分類】

G06N 3/063 20230101AFI20240321BHJP

【ＦＩ】

G06N3/063

【審査請求】未請求

【請求項の数】7

【出願形態】ＯＬ

(21)【出願番号】P 2022146736

(22)【出願日】2022-09-15

(71)【出願人】

【識別番号】000004260

【氏名又は名称】株式会社デンソー

(71)【出願人】

【識別番号】000003207

【氏名又は名称】トヨタ自動車株式会社

(71)【出願人】

【識別番号】520124752

【氏名又は名称】株式会社ミライズテクノロジーズ

(74)【代理人】

【識別番号】110000028

【氏名又は名称】弁理士法人明成国際特許事務所

(72)【発明者】

【氏名】関直樹

(57)【要約】

【課題】電力の消費効率を向上する。
【解決手段】半導体装置（１）は、複数の積和演算回路（１１）を含み、ニューラルネットワークを用いた処理に使用されるハードウェアアクセラレータと、アクティブにする積和演算回路の割合を示す目標値が、ニューラルネットワークのモデルごとに、設定された目標テーブル（５１）と、目標テーブルを参照し、実行対象となるニューラルネットワークのモデルについて設定されている目標値に応じて、複数の積和演算回路への電力の供給または電力供給の停止を個別に制御する電源制御部（５０）と、半導体装置において処理が実行されているときに、複数の積和演算回路の実使用率を観測するモニタ部（３０）と、半導体装置において処理が実行されているときに、目標値の更新が必要である場合、実使用率に基づいて新たな目標値を設定し、新たな目標値で目標テーブルを更新するテーブル更新部（５４）と、を備える。
【選択図】図１

【特許請求の範囲】

【請求項1】

半導体装置（１）であって、
複数の積和演算回路（１１）を含み、ニューラルネットワークを用いた処理に使用されるハードウェアアクセラレータと、
前記複数の積和演算回路のうちアクティブにする積和演算回路の割合を示す目標値が、ニューラルネットワークのモデルごとに、設定された目標テーブル（５１）と、
前記目標テーブルを参照し、前記半導体装置における実行対象となるニューラルネットワークのモデルについて設定されている前記目標値に応じて、前記複数の積和演算回路への電力の供給または電力供給の停止を個別に制御する電源制御部（５０）と、
前記半導体装置において処理が実行されているときに、前記複数の積和演算回路の実使用率を観測するモニタ部（３０）と、
前記半導体装置において処理が実行されているときに、前記目標値の更新が必要である場合、前記実使用率に基づいて新たな前記目標値を設定し、新たな前記目標値で前記目標テーブルを更新するテーブル更新部（５４）と、
を備える半導体装置。

【請求項2】

請求項１に記載の半導体装置であって、
前記複数の積和演算回路は、同じ構成を備え、
前記目標値は、前記複数の積和演算回路のうち、電力供給の対象である前記積和演算回路の数を示し、
前記電源制御部は、前記複数の積和演算回路のうち、前記目標値が示す前記数の前記積和演算回路へ電力を供給し、残りの前記積和演算回路へ電力を供給しない、
半導体装置。

【請求項3】

請求項２に記載の半導体装置であって、
前記テーブル更新部は、
前記複数の積和演算回路のうちの電力供給の対象である前記積和演算回路の割合と、前記実使用率と、の差が、あらかじめ設定された値以上であるときを、前記目標値の更新が必要である場合として、
あらかじめ決められた期間に観測された前記実使用率の最大値に、あらかじめ決められた係数を乗じることにより得られる第１値に基づいて、前記目標値を設定する、
半導体装置。

【請求項4】

請求項２に記載の半導体装置であって、
前記テーブル更新部は、
前記複数の積和演算回路のうちの電力供給の対象である前記積和演算回路の割合と、前記実使用率と、の差が、あらかじめ設定された値以上であるときを、前記目標値の更新が必要である場合として、
あらかじめ決められた期間に観測された前記実使用率の平均値に基づいて、前記目標値を設定する、
半導体装置。

【請求項5】

請求項２に記載の半導体装置であって、
前記テーブル更新部は、
前記複数の積和演算回路のうちの電力供給の対象である前記積和演算回路の割合と、前記実使用率と、の差が、あらかじめ設定された値以上であるときを、前記目標値の更新が必要である場合として、
機械学習により生成され、前記実使用率を予測する機械学習モデルを用いて予測された前記実使用率の予測値に基づいて、前記目標値を更新する、
半導体装置。

【請求項6】

請求項２に記載の半導体装置であって、
前記実使用率と前記目標値とを対応付けた目標値特定テーブルをさらに備え、
前記テーブル更新部は、
前記複数の積和演算回路のうちの電力供給の対象である前記積和演算回路の割合と、前記実使用率と、の差が、あらかじめ設定された値以上であるときを、前記目標値の更新が必要である場合として、
前記目標値特定テーブルを参照し、あらかじめ決められた期間に観測された前記実使用率の最大値、または、あらかじめ決められた期間に観測された前記実使用率の平均値、に応じた、前記目標値を設定する、
半導体装置。

【請求項7】

請求項３から６のいずれか１項に記載の半導体装置であって、
前記モニタ部は、あらかじめ設定された時間間隔ごとに、前記実使用率を観測し、
前記テーブル更新部は、前記モニタ部から観測結果を受け、前記目標値の更新が必要である場合、前記目標値を更新し、
今回の前記差が、以前の前記差より、大きいことを含むあらかじめ決められた期間変更条件が満たされている場合、前記モニタ部は、前記実使用率を観測する前記時間間隔を短縮する、
半導体装置。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、半導体装置に関する。

【背景技術】

【0002】

特許文献１には、半導体集積回路の消費電力を削減するための技術が記載されている。特許文献１に記載された技術においては、半導体集積回路の温度に対応するリーク電流を求め、リーク電流の大きさに応じて、パワーゲーティング手法、または、ＤＶＦＳ(Dynamic Voltage Frequency Scaling)手法を採用することにより、消費電力を削減する。

【0003】

また、深層学習が普及したことにより、半導体集積回路のうちには、ニューラルネットワークを用いた処理を実行するのに特化したニューラルネットワーク用の半導体集積回路が存在する。ニューラルネットワーク用の半導体集積回路においては、処理の高速化のため、処理の一部または全部が専用のハードウェアにより実行されることがある（以下、専用のハードウェアを「ハードウェアアクセラレータ」という）。ニューラルネットワークにおいては、積和演算を主な演算とする。このため、ニューラルネットワーク用の半導体集積回路が備えるハードウェアアクセラレータは、複数の積和演算回路を含む。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】国際公開第２００９／０７８０８１号

【発明の概要】

【発明が解決しようとする課題】

【0005】

実行の対象となるニューラルネットワークのモデルによっては、ハードウェアアクセラレータに含まれる複数の積和演算回路のうち、一部しか使用されないこともある。このような場合であっても、すべての積和演算回路へ電力の供給が行われていると、電力が不必要に消費される。よって、電力の消費効率の向上が望まれていた。

【課題を解決するための手段】

【0006】

本開示の一形態によれば、半導体装置が提供される。この半導体装置（１）は、複数の積和演算回路（１１）を含み、ニューラルネットワークを用いた処理に使用されるハードウェアアクセラレータと、前記複数の積和演算回路のうちアクティブにする積和演算回路の割合を示す目標値が、ニューラルネットワークのモデルごとに、設定された目標テーブル（５１）と、前記目標テーブルを参照し、前記半導体装置における実行対象となるニューラルネットワークのモデルについて設定されている前記目標値に応じて、前記複数の積和演算回路への電力の供給または電力供給の停止を個別に制御する電源制御部（５０）と、前記半導体装置において処理が実行されているときに、前記複数の積和演算回路の実使用率を観測するモニタ部（３０）と、前記半導体装置において処理が実行されているときに、前記目標値の更新が必要である場合、前記実使用率に基づいて新たな前記目標値を設定し、新たな前記目標値で前記目標テーブルを更新するテーブル更新部（５４）と、を備える。

【0007】

このような態様によれば、実行対象となるニューラルネットワークのモデルごとに設定されている目標値に応じて、複数の積和演算回路の電力の供給または電力供給の停止を個別に制御するので、すべての積和演算回路への電力の供給およびクロック信号の供給を行う態様に比べて、電力が不必要に消費されることがない。また、目標値は、実行対象となるニューラルネットワークのモデルに応じて設定されるので、ニューラルネットワークを用いた処理のパフォーマンスを低下させることなく、積和演算回路への電力供給の制御を行うことができる。このようにして、電力の消費効率を向上させることができる。
さらに、半導体装置において処理が実行されているときに、実使用率に基づいて目標値を更新するので、積和演算回路の実際の使用状況に応じて、目標値を更新することができる。よって、電力の消費効率を向上させることができる。

【図面の簡単な説明】

【0008】

【図1】半導体装置の構成を表すブロック図である。

【図2】目標テーブルを示す図である。

【図3】パワーゲーティング処理のフローチャートである。

【図4】目標値の更新処理のフローチャートである。

【図5】目標値特定テーブルを示す図である。

【発明を実施するための形態】

【0009】

Ａ．実施形態
図１に示すように、実施形態にかかる半導体装置１は、ニューラルネットワークを用いた処理を実行する。例えば、半導体装置１は、自動車に搭載されている制御ユニットに備えられている。この制御ユニットには、ＡＤＡＳ（Advanced Driving Assistant System: 先進運転システム）用ＥＣＵ(Electrical Control Unit)も備えられている。半導体装置１は、ＡＤＡＳ用ＥＣＵが自動車の周囲の状況を把握する処理を行う際に、自動車に装備されているカメラが撮影した画像データに基づいて、画像認識に関する処理を実行する。半導体装置１は、ＮＰＵ（Neural Processing Unit/Neural network Processing Unit）１０と、ＮＰＵモニタ３０と、電源制御部５０と、バス９０とを備える。

【0010】

ＮＰＵ１０は、ニューラルネットワークを用いた処理を実行する。本明細書において、ニューラルネットワークは、３層構造のニューラルネットワークだけではなく、４層以上のＤＮＮ（Deep Neural Network）、畳み込み層とプーリング層とを有するＣＮＮ（Convolutional Neural Network）等を含むものとする。ＮＰＵ１０は、Ｎ個（Ｎは１以上の整数）のＮＮアクセラレータ１１と、プロセッサ１２と、メモリ１３と、ＤＭＡＣ（Direct Memory Access Controller）１４とを備える。

【0011】

Ｎ個のＮＮアクセラレータ１１（１１１～１１Ｎ）は、ＮＰＵ１０におけるニューラルネットワークを用いた処理に使用されるハードウェアアクセラレータとして機能する。専用のハードウェアを使用することで特定の処理の実行速度を高速化することを、ハードウェアアクセラレーションという。ハードウェアアクセラレータは、ハードウェアアクセラレーションのための専用のハードウェアである。

【0012】

ＮＮアクセラレータ１１は、ＭＡＣ（Multiply accumulation）ユニット１１０と、切替部１２０と、プロセッサ１３０と、ＤＭＡＣ１４０と、メモリ１５０と、を備える。ＮＮアクセラレータ１１１～１１Ｎは、同じ構成を備える。ＮＮアクセラレータ１１を積和演算回路ともよぶ。

【0013】

ＭＡＣユニット１１０は、複数の積和演算器を含み、積和演算を実行する。例えば、ＭＡＣユニット１１０は、１Ｋ（１０２４）個の積和演算器を含む。切替部１２０は、ＮＮアクセラレータ１１の給電ラインに設けられたスイッチと、クロックゲーティング回路とを含む。電源制御部５０から供給される制御信号によりスイッチがオンすることにより、ＮＮアクセラレータ１１へ電力が供給される。電源制御部５０から供給される制御信号によりスイッチがオフすることにより、ＮＮアクセラレータ１１への電力の供給が停止される。また、電源制御部５０からクロックゲーティング回路にイネーブル信号が供給されると、ＮＮアクセラレータ１１へクロック信号が供給される。電源制御部５０からクロックゲーティング回路にディセーブル信号が供給されると、ＮＮアクセラレータ１１へのクロック信号の供給が停止される。

【0014】

プロセッサ１３０は、ＮＮアクセラレータ１１の制御を行うプロセッサである。ＤＭＡＣ１４０は、プロセッサ１２または他のＮＮアクセラレータ１１からのメモリ１５０のデータの読み出し要求に応答して、メモリ１５０のデータ転送を行う。メモリ１５０は、ＮＮアクセラレータ１１のローカルメモリである。

【0015】

プロセッサ１２は、ＮＰＵ１０の全体制御を行うプロセッサである。また、プロセッサ１２は、積和演算以外の演算処理を実行する。メモリ１３は、共有メモリである。メモリ１３は、例えば、ＡＤＡＳ用ＣＰＵと、ＮＰＵ１０との間における、画像データ、ＤＮＮモデル、重みデータの授受のために使用される。ＤＭＡＣ１４は、ＮＰＵ１０のＮＮアクセラレータ１１１～１１Ｎからのメモリ１３のデータの読み出し要求に応答して、メモリ１３のデータ転送を行う。

【0016】

ＮＰＵモニタ３０は、ＮＰＵ１０が処理を行っているときに、それぞれのＮＮアクセラレータ１１の使用率を決められた時間間隔ごとに観測する。ＮＮアクセラレータ１１の使用率とは、使用されているＮＮアクセラレータ１１の数の、全体数に対する割合である。使用率を実使用率ともよぶ。決められた時間間隔は、例えば、１秒間である。ＮＰＵモニタ３０をモニタ部ともよぶ。

【0017】

ＮＰＵモニタ３０は、観測結果を、バス９０を介して電源制御部５０の判別部５２に送信する。なお、ＮＰＵモニタ３０は、半導体装置１へ電力の供給が開始されると、使用率の観測を開始する。例えば、車両のエンジンが始動されたときに、半導体装置１への電力の供給が開始される。また、車両のエンジンが停止したときに、半導体装置１への電力の供給が停止される。

【0018】

電源制御部５０は、Ｎ個のＮＮアクセラレータ１１への電力の供給または電力供給の停止を個別に制御する。電源制御部５０は、目標テーブル５１と、判別部５２と、切替部５３と、テーブル更新部５４とを備える。

【0019】

図２に示すように、目標テーブル５１には、ニューラルネットワークのモデルごとに、Ｎ個のＮＮアクセラレータ１１のうちアクティブにするＮＮアクセラレータ１１の数が、目標値として、設定されている。目標テーブル５１の当初の目標値は、例えば、シミュレーション等によりあらかじめ求められた値である。

【0020】

図１に示す判別部５２は、Ｎ個のＮＮアクセラレータ１１のうち、目標テーブル５１に設定されている目標値が示す数のＮＮアクセラレータ１１をアクティブにし、残りのＮＮアクセラレータ１１を非アクティブにする指示を表す信号を切替部５３に出力する。ここで、ＮＮアクセラレータ１１をアクティブにするとは、ＮＮアクセラレータ１１が動作可能となるように、ＮＮアクセラレータ１１に電力およびクロック信号の供給を行うことをいう。

【0021】

また、判別部５２は、目標値の更新が必要である場合、目標テーブル５１を更新する指示を表す信号をテーブル更新部５４に出力する。

【0022】

切替部５３は、判別部５２からの指示に応じて、Ｎ個のＮＮアクセラレータ１１への電力およびクロック信号の供給を個別に切り替える。

【0023】

テーブル更新部５４は、ＮＰＵ１０において処理が実行されているときであって、目標テーブル５１を更新する指示を表す信号を判別部５２から受けると、観測された使用率に基づいて新たな目標値を設定し、新たな目標値で目標テーブル５１を更新する。新たな目標値の求め方については後述する。

【0024】

電源制御部５０は、ＮＰＵ１０が処理を実行するタイミングで、より具体的には、ＮＰＵ１０による画像認識の処理の開始に先立って、パワーゲーティング処理を実行する。ＮＰＵ１０は、ＡＤＡＳ用ＣＰＵにより実行指示がプロセッサ１２に伝達されるたび、画像認識の処理を実行するものとする。

【0025】

図３に示すように、ステップＳ１０１において、電源制御部５０の判別部５２は、実行対象となるニューラルネットワークのモデルについて設定されている目標値を目標テーブル５１から読み出す。なお、判別部５２は、実行されるニューラルネットワークのモデルの情報をあらかじめ有しているものとする。

【0026】

ステップＳ１０３において、判別部５２は、目標値に基づいて切り替えの指示を切替部５３に通知する。具体的には、判別部５２は、Ｎ個のＮＮアクセラレータ１１のうち、目標値が示す数のＮＮアクセラレータ１１をアクティブにし、残りのＮＮアクセラレータ１１を非アクティブにする指示を表す切替信号を切替部５３に出力する。

【0027】

ステップＳ１０５において、切替部５３は、判別部５２から切替信号を受けると、Ｎ個のＮＮアクセラレータ１１への電力およびクロック信号の供給を個別に切り替える。

【0028】

ＮＮアクセラレータ１１への電力およびクロック信号の供給の切替は、例えば、以下のように行われる。切替部５３は、アクティブにするＮＮアクセラレータ１１の切替部１２０に含まれているスイッチングをオンする制御信号を出力する。これによりＮＮアクセラレータ１１への電力の供給が開始される。併せて、切替部５３は、アクティブにするＮＮアクセラレータ１１の切替部１２０に含まれているクロックゲーティング回路にイネーブル信号を出力する。これにより、ＮＮアクセラレータ１１へのクロック信号の供給が開始される。

【0029】

また、切替部５３は、非アクティブにするＮＮアクセラレータ１１の切替部１２０に含まれるスイッチをオフする制御信号を出力する。これによりＮＮアクセラレータ１１への電力の供給が停止される。併せて、切替部５３は、非アクティブにするＮＮアクセラレータ１１の切替部１２０に含まれるクロックゲーティング回路にディセーブル信号を出力する。これにより、ＮＮアクセラレータ１１へのクロック信号の供給が停止される。

【0030】

例えば、切替部５３は、Ｎ個のＮＮアクセラレータ１１のうち、番号が最も小さいＮＮアクセラレータ１１１から順に、指定された数のＮＮアクセラレータ１１をアクティブにする。５つのＮＮアクセラレータ１１をアクティブにすることが指示された場合、ＮＮアクセラレータ１１１～１１５がアクティブにされる。以上が、パワーゲーティング処理の一連の流れである。

【0031】

このように、目標値が示す数のＮＮアクセラレータ１１にだけ電力を供給することにより、電力の消費効率を向上させることができる。

【0032】

また、電源制御部５０は、半導体装置１へ電力の供給が開始されると、目標値の更新処理を開始する。また、ＮＰＵ１０は、例えば、ＡＤＡＳ用ＣＰＵからの指示に応答して、ニューラルネットワークのモデルが実装されている画像認識処理用のプログラムの実行を開始する。目標値の更新処理は、前述のパワーゲーティング処理と並行して実行される。また、技術の理解を容易にするため、実施形態においては、ＮＰＵ１０において、同時に複数のニューラルネットワークのモデルが実行されないことを前提とする。例えば、複数のニューラルネットワークのモデルが並行して実行される必要があるときは、ＮＰＵ１０は、ＡＤＡＳ用ＣＰＵからの指示に応答して、時分割で複数のニューラルモデルを実行する。

【0033】

図４に示すように、ステップＳ３０１において、判別部５２は、ＮＰＵモニタ３０から観測結果を受信したか否かを判別する。判別部５２は、ＮＰＵモニタ３０から観測結果を受信した場合（ステップＳ３０１；ＹＥＳ）、ステップＳ３０３の処理を実行する。判別部５２は、ＮＰＵモニタ３０から観測結果を受信していない場合（ステップＳ３０１；ＮＯ）、待機する。

【0034】

ステップＳ３０３において、判別部５２は、目標値の更新が必要であるか否かを判別する。目標値の更新が必要である場合は、現在アクティブであるＮＮアクセラレータ１１の全体に対する割合と、使用率との差が、あらかじめ設定された値以上であるときである。ステップＳ３０３において、目標値の更新が必要である場合（ステップＳ３０３；ＹＥＳ）、判別部５２は、目標テーブル５１を更新する指示を表す信号をテーブル更新部５４に出力する。その後、ステップＳ３０５の処理が実行される。一方、ステップＳ３０３において、目標値の更新が必要でない場合（ステップＳ３０３；ＹＥＳ）、ステップＳ３０７の処理が実行される。

【0035】

ステップＳ３０５において、テーブル更新部５４は、目標値を更新する。まず、テーブル更新部５４は、あらかじめ決められた期間に観測された使用率の最大値に、あらかじめ決められた係数を乗じる。あらかじめ決められた係数は、１より大きく、１．５より小さいことが望ましい。例えば、あらかじめ決められた係数は、１．２である。得られた値を第１値ともよぶ。テーブル更新部５４は、得られた第１値に、ＮＮアクセラレータ１１の総数であるＮを乗じる。テーブル更新部５４は、得られた値を切り上げにより整数値にする。この整数値が新たな目標値である。テーブル更新部５４は、目標テーブル５１における、対象となるニューラルネットワークのモデルについての目標値を、新たな目標値で更新する。なお、テーブル更新部５４は、実行されているニューラルネットワークのモデルの情報をあらかじめ有しているものとする。その後、テーブル更新部５４は、目標値を更新したことを示す信号を判別部５２に出力する。

【0036】

ステップＳ３０７において、判別部５２は、更新処理を終了できるか否かを判別する。更新処理の終了条件は、画像認識処理用のプログラムの実行が終了されることである。ＮＰＵ１０は、ＡＤＡＳ用ＣＰＵからの指示に応答して、画像認識処理用のプログラムの実行を終了する。更新処理の終了条件が満たされている場合（ステップＳ３０７；ＹＥＳ）、更新処理が終了される。更新処理の終了条件が満たされていない場合（ステップＳ３０７；ＮＯ）、ステップＳ３０１の処理が再び実行される。

【0037】

実施形態においては、あらかじめ決められた期間に観測された使用率の最大値にあらかじめ決められた係数を乗じることにより得られた値に、Ｎ個のＮＮアクセラレータ１１のうちの電力が供給されるＮＮアクセラレータ１１の割合を、近づけるように目標値を設定する。このように、あらかじめ決められた期間に観測された使用率の最大値にあらかじめ決められた係数を乗じることにより得られた値に基づいて目標値を設定することによって、ＮＮアクセラレータ１１の実際の使用状況に適応させた目標値を設定することができる。

【0038】

また、ＮＰＵ１０において処理が実行されているときに、Ｎ個のＮＮアクセラレータ１１のうち電力が供給されているＮＮアクセラレータ１１の割合と、使用率と、の差が、あらかじめ設定された値以上となる場合に、目標値を更新する。よって、ＮＮアクセラレータ１１の実際の使用状況に応じて、目標値を更新することができる。よって、電力の消費効率を向上させることができる。

【0039】

例えば、１個のＮＮアクセラレータ１１の処理能力が、１０ＴＯＰＳ（Tera Operations Per Second）であるとする。また、ＮＰＵ１０が１０個のＮＮアクセラレータ１１を備えているとする。この場合、１０個のＮＮアクセラレータ１１の処理能力は、１００ＴＯＰＳである。例えば、実行される画像認識処理に要求される処理能力が、８ＴＯＰＳである場合、１個のＮＮアクセラレータ１１だけが動作していれば問題ないといえる。このような場合、実施形態にかかる構成においては、残りの９個のＮＮアクセラレータへの電力およびクロック信号の供給を停止する。これにより、すべてのＮＮアクセラレータ１１への電力の供給およびクロック信号の供給を行う態様に比べて、電力が不必要に消費されることがない。

【0040】

また、目標値は、実行対象となるニューラルネットワークのモデルに応じて設定される。ニューラルネットワークのモデルには、多数のＮＮアクセラレータ１１を並列で使用するものもある一方で、多数のＮＮアクセラレータ１１を並列で使用しないものもある。実行対象となるニューラルネットワークのモデルごとに設定されている目標値に応じて、Ｎ個のＮＮアクセラレータ１１の電力の供給または電力供給の停止が個別に制御される。よって、すべてのＮＮアクセラレータ１１への電力の供給およびクロック信号の供給を行う態様に比べて、電力が不必要に消費されることがない。また、ニューラルネットワークを用いた処理のパフォーマンスを低下させることがなく、電力の消費効率を向上させることができる。

【0041】

また、特に、ＤＮＮのモデルのうちには、例えば、３層構造のニューラルネットワークに比べて、実行時におけるＮ個のＮＮアクセラレータ１１の使用率が低いものが多い。このため、実施形態にかかる構成は、ＤＮＮを用いた処理の実行時の電力の消費効率の向上にとりわけ有効であるといえる。

【0042】

Ｂ１．他の実施形態１
実施形態においては、テーブル更新部５４は、あらかじめ決められた期間に観測された使用率の最大値に、あらかじめ決められた係数を乗じることにより、新たな目標値を算出した。しかしながら、新たな目標値の算出方法は、これに限られない。

【0043】

テーブル更新部５４は、目標値の更新が必要である場合、すなわち、目標テーブル５１を更新する指示を表す信号を判別部５２から受けた場合、あらかじめ決められた期間に観測された使用率の平均値を算出する。テーブル更新部５４は平均値に、ＮＮアクセラレータ１１の総数であるＮを乗じる。テーブル更新部５４は、得られた値を切り上げにより整数値にする。この整数値が新たな目標値である。テーブル更新部５４は、目標テーブル５１における、対象となるニューラルネットワークのモデルについての目標値を、新たな目標値で更新する。

【0044】

このように、あらかじめ決められた期間に観測された使用率の平均値に、Ｎ個のＮＮアクセラレータ１１のうちの電力供給の対象であるＮＮアクセラレータ１１の割合を、近づけるように目標値を設定する。このように、あらかじめ決められた期間に観測された使用率の平均値に基づいて目標値を設定することによって、ＮＮアクセラレータ１１の実際の使用状況に適応させた目標値を設定することができる。

【0045】

また、他の実施形態１においても、Ｎ個のＮＮアクセラレータ１１のうち電力が供給されているＮＮアクセラレータ１１の割合と、使用率と、の差が、あらかじめ設定された値以上となる場合に、目標値を更新する。よって、ＮＮアクセラレータ１１の実際の使用状況に応じたタイミングで目標値を更新することができる。

【0046】

Ｂ２．他の実施形態２
また、あるいは、テーブル更新部５４は、機械学習により生成された機械学習モデルを用いて、目標値を更新してもよい。テーブル更新部５４は、機械学習済みの機械学習モデルを有するものとする。この機械学習モデルは、例えば、ニューラルネットワークのモデルごとに、過去にそのモデルを実行しているときに観測された使用率のデータであって、１万回分の使用率のデータを教師データとして使用して機械学習がされたものである。この機械学習モデルは、対象となるニューラルネットワークのモデルを実行しているときの、あらかじめ決められた期間に観測された使用率のデータが入力されると、例えば、１秒後の使用率の予測値を出力する。テーブル更新部５４は、使用率の予測値に、ＮＮアクセラレータ１１の総数であるＮを乗じる。テーブル更新部５４は、得られた値を切り上げにより整数値にする。この整数値が新たな目標値である。テーブル更新部５４は、目標テーブル５１における、対象となるニューラルネットワークのモデルについての目標値を、新たな目標値で更新する。

【0047】

このように、機械学習により生成された機械学習モデルを用いて、目標値を更新するので、ＮＮアクセラレータ１１の実際の使用状況に適応させた目標値を設定することができる。また、Ｎ個のＮＮアクセラレータ１１のうち電力が供給されているＮＮアクセラレータ１１の割合と、使用率と、の差が、あらかじめ設定された値以上となる場合に、目標値を更新する。よって、ＮＮアクセラレータ１１の実際の使用状況に応じたタイミングで目標値を更新することができる。

【0048】

また、機械学習モデルにより出力された使用率の予測値に基づいて、プロセッサ１３０は、ＮＮアクセラレータ１１の負荷を分散させるような制御を行ってもよい。

【0049】

Ｂ３．他の実施形態３
また、あるいは、テーブル更新部５４は、以下の方法で目標値を更新してもよい。図５に示すように、テーブル更新部５４は、ニューラルネットワークのモデルごとに、使用率と目標値とを対応付けた目標値特定テーブル５４１を備える。目標値特定テーブルにおける目標値は、シミュレーションにより求められた値である。テーブル更新部５４は、目標値の更新が必要である場合、すなわち、目標テーブル５１を更新する指示を表す信号を判別部５２から受けた場合、目標値特定テーブル５４１を参照し、あらかじめ決められた期間に観測された使用率の最大値に応じた、目標値を設定する。あるいは、テーブル更新部５４は、目標値の更新が必要な場合、目標値特定テーブル５４１を参照し、あらかじめ決められた期間に観測された使用率の平均値に応じた、目標値を設定する。

【0050】

このように、使用率と目標値とを対応付けた目標値特定テーブル５４１を用いて目標値を設定するので、ＮＮアクセラレータ１１の実際の使用状況に適応させた目標値を設定することができる。また、他の実施形態３においても、Ｎ個のＮＮアクセラレータ１１のうち電力が供給されているＮＮアクセラレータ１１の割合と、使用率と、の差が、あらかじめ設定された値以上となる場合に、目標値を更新する。よって、ＮＮアクセラレータ１１の実際の使用状況に応じたタイミングで目標値を更新することができる。

【0051】

Ｂ４．他の実施形態４
実施形態においては、目標値が、Ｎ個のＮＮアクセラレータ１１のうち、電力供給の対象であるＮＮアクセラレータ１１の数を示す例を説明した。しかしながら、目標値は、電力供給の対象であるＮＮアクセラレータ１１の数の全体に対する割合であってもよい。

【0052】

Ｂ５．他の実施形態５
実施形態においては、ＮＰＵモニタ３０が、それぞれのＮＮアクセラレータ１１の使用率を観測する時間間隔が固定されている例を説明した。しかしながら、ＮＰＵモニタ３０が観測を行う時間間隔は、以下のように変更されてもよい。

【0053】

例えば、ＮＰＵモニタ３０は、１秒間隔で実使用率を観測しているとする。判別部５２は、ＮＰＵモニタ３０から受信した観測結果に基づいて、まず、目標値の更新が必要であるか否かを判別する。判別部５２が目標値の更新が必要であると判別すると、テーブル更新部５４は、目標値を更新する。

【0054】

その後、判別部５２は、期間変更条件が満たされている場合、ＮＰＵモニタ３０が実使用率を観測する時間間隔の変更が必要であると判別する。期間変更条件は、今回の電力供給の対象であるＮＮアクセラレータ１１の全体に対する割合と今回の実使用率と、の差を示す第２値が、前回の電力供給の対象であるＮＮアクセラレータ１１の全体に対する割合と前回の実使用率と、の差を示す第３値より大きい場合、満たされる。

【0055】

ここで、今回の電力供給の対象であるＮＮアクセラレータ１１の全体に対する割合は、テーブル更新部５４により更新された更新後の目標値に基づいて求められる。今回の実使用率とは、ＮＰＵモニタ３０から今回受信した観測結果が示す実使用率である。前回の電力供給の対象であるＮＮアクセラレータ１１の全体に対する割合は、更新される前の目標値に基づいて求められる。今回の実使用率とは、ＮＰＵモニタ３０から今回受信した観測結果が示す実使用率である。

【0056】

期間変更条件が満たされている場合、前回の目標値の更新による電力供給の制御の効果が十分に表れていないと考えられる。よって、期間変更条件が満たされている場合、判別部５２は、実使用率を観測する時間間隔を短縮するよう、ＮＰＵモニタ３０に通知する。よって、ＮＰＵモニタ３０は、実使用率を観測する時間間隔を、例えば、１秒間から０．５秒間に変更する。

【0057】

このように、前回の目標値の更新による電力供給の制御の効果が十分に表れていない場合に、実使用率を観測する時間間隔が短縮され、目標値の更新の頻度が上げられる。よって、電力供給の制御の効果を出すため、より細やかな電力供給の制御を行うことができる。

【0058】

また、期間変更条件には、第２値は、第３値より、決められた値以上大きいという条件がさらに含まれていてもよい。期間変更条件には、今回と前回との時間差が、決められた値以下であるという条件がさらに含まれていてもよい。

【0059】

Ｂ６．他の実施形態６
実施形態においては、ＮＰＵ１０において、同時に複数のニューラルネットワークのモデルが実行されないことを前提とした例を説明した。しかしながら、ＮＰＵ１０において、同時に複数のニューラルネットワークのモデルが実行されてもよい。この場合、パワーゲーティング処理において、電源制御部５０は、実行対象となる複数のニューラルネットワークのモデルについて設定されている目標値をそれぞれ読み出し、複数の目標値の総和に基づいて、ＮＮアクセラレータ１１への電力およびクロック信号の供給を個別に切り替えればよい。

【0060】

Ｂ７．他の実施形態７
実施形態においては、判別部５２が、Ｎ個のＮＮアクセラレータ１１のうち電力が供給されているＮＮアクセラレータ１１の割合と、使用率と、の差が、あらかじめ設定された値以上となる場合に、目標値の更新が必要であると判定する例を説明した。あるいは、判別部５２は、ＮＰＵモニタ３０の観測結果に基づいてＮ個のＮＮアクセラレータ１１のうち電力が供給されているＮＮアクセラレータ１１の数と、使用されているＮＮアクセラレータ１１の数と、の差が、あらかじめ設定された値以上となる場合に、目標値の更新が必要であると判定してもよい。ＮＰＵモニタ３０は、Ｎ個のＮＮアクセラレータ１１のうちいずれのＮＮアクセラレータ１１が使用されているかを観測する機能を備えるものとする。

【0061】

また、実施形態においては、Ｎ個のＮＮアクセラレータ１１が、同じ構成を備える例を説明したが、Ｎ個のＮＮアクセラレータ１１は、異なる構成を備えてもよい。

【0062】

本開示は、上述の実施形態に限られるものではなく、その趣旨を逸脱しない範囲において種々の構成で実現することができる。例えば、発明の概要の欄に記載した各形態中の技術的特徴に対応する実施形態中の技術的特徴は、上述の課題の一部又は全部を解決するために、あるいは、上述の効果の一部又は全部を達成するために、適宜、差し替えや、組み合わせを行うことが可能である。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することが可能である。

【符号の説明】

【0063】

１…半導体装置、１１…ＮＮアクセラレータ、１２…プロセッサ、１３…メモリ、１４…ＤＭＡＣ、３０…ＮＰＵモニタ、５０…電源制御部、５１…目標テーブル、５２…判別部、５３…切替部、５４…テーブル更新部、９０…バス、１１０…ＭＡＣユニット、１２０…切替部、１３０…プロセッサ、１４０…ＤＭＡＣ、１５０…メモリ

【図1】

【図2】

【図3】

【図4】

【図5】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版