特開2023-179078 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社デンソーの特許一覧 ▶ トヨタ自動車株式会社の特許一覧 ▶ 株式会社ミライズテクノロジーズの特許一覧

特開2023-179078演算装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023179078

(43)【公開日】2023-12-19

(54)【発明の名称】演算装置

(51)【国際特許分類】

G06N 3/063 20230101AFI20231212BHJP

G06G 7/60 20060101ALI20231212BHJP

【ＦＩ】

G06N3/063

G06G7/60

【審査請求】未請求

【請求項の数】8

【出願形態】ＯＬ

(21)【出願番号】P 2022092138

(22)【出願日】2022-06-07

(71)【出願人】

【識別番号】000004260

【氏名又は名称】株式会社デンソー

(71)【出願人】

【識別番号】000003207

【氏名又は名称】トヨタ自動車株式会社

(71)【出願人】

【識別番号】520124752

【氏名又は名称】株式会社ミライズテクノロジーズ

(74)【代理人】

【識別番号】110000028

【氏名又は名称】弁理士法人明成国際特許事務所

(72)【発明者】

【氏名】向井文哉

(57)【要約】

【課題】消費電力等が増大した場合に演算にかかる時間が増加することを抑制しつつ消費電力を抑制できる技術を提供する。
【解決手段】演算装置１００、１００Ｂ、１００Ｃ、１００Ｄは、ニューラルネットワークモデルを実行して演算処理を行う演算部１０と、演算装置の消費電力と演算装置の温度と演算部の稼働率とのいずれか一つ以上を判定値として取得する取得部２０と、演算処理において用いられるニューラルネットワークモデルの重みを、高ビット重みと、高ビット重みよりも低いビット数である低ビット重みとで切り替え可能な切替部３０、３０Ｂと、を備える。切替部は、判定値が予め定められた第１閾値以上の場合に、重みを高ビット重みから低ビット重みに切り替える。
【選択図】図１

【特許請求の範囲】

【請求項1】

演算装置（１００、１００Ｂ、１００Ｃ、１００Ｄ）であって、
ニューラルネットワークモデルを実行して演算処理を行う演算部（１０）と、
前記演算装置の消費電力と前記演算装置の温度と前記演算部の稼働率とのいずれか一つ以上を判定値として取得する取得部（２０）と、
前記演算処理において用いられる前記ニューラルネットワークモデルの重みを、高ビット重みと、前記高ビット重みよりも低いビット数である低ビット重みとで切り替え可能な切替部（３０、３０Ｂ）と、を備え、
前記切替部は、前記判定値が予め定められた第１閾値以上の場合に、前記重みを前記高ビット重みから前記低ビット重みに切り替える、演算装置。

【請求項2】

請求項１に記載の演算装置であって、更に、
前記高ビット重みと前記低ビット重みを予め記憶する記憶部（４０）を備える、演算装置。

【請求項3】

請求項１に記載の演算装置であって、更に、
前記高ビット重みを記憶する記憶部を備え、
前記切替部は、前記高ビット重みに対して量子化を実行して前記低ビット重みに切り替える、演算装置。

【請求項4】

請求項３に記載の演算装置であって、
前記切替部は、前記判定値に応じて、前記低ビット重みのビット数を決定する、演算装置。

【請求項5】

請求項２または請求項３に記載の演算装置であって、更に、
前記判定値が前記第１閾値よりも小さい値である第２閾値以上の上昇した場合に、前記値が前記第２閾値未満の場合よりも前記演算装置の電圧とクロック周波数とのうち少なくともいずれか一方を大きくするよう制御する制御部（５０）を備える、演算装置。

【請求項6】

請求項１または請求項２に記載の演算装置であって、更に、
前記演算処理における演算量を推定する推定部（６０）を備え、
前記切替部は、前記演算量が予め定められた閾値以上の場合に、前記重みを前記高ビット重みから前記低ビット重みに切り替える、演算装置。

【請求項7】

請求項１または請求項２に記載の演算装置であって、
演算部１０は、前記高ビット重みの第１ニューラルネットワークモデルを実行する第１演算処理と、前記低ビット重みの第２ニューラルネットワークモデルを実行する第２演算処理とを並行して行い、
前記切替部は、前記第１ニューラルネットワークモデルの前記重みを前記高ビット重みから前記低ビット重みに切り替える、演算装置。

【請求項8】

請求項１または請求項２に記載の演算装置であって、
前記切替部は、前記判定値が前記第１閾値よりも低い予め定められた第３閾値以下の場合に、前記重みを前記低ビット重みから前記高ビット重みに切り替える、演算装置。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、演算装置に関する。

【背景技術】

【0002】

ニューラルネットワークモデルを実行する演算処理を行う演算装置として、演算負荷がかかると、消費電力が増加することが知られている。電圧やクロック周波数を制御することで消費電力を抑制するＤＶＦＳ（ＤｙｎａｍｉｃＶｏｌｔａｇｅａｎｄＦｒｅｑｕｅｎｃｙＳｃａｌｉｎｇ）制御が知られている。また、特許文献１には、浮動小数点によって表される１６～３２ビットである高ビット重みパラメータを用いて演算を行う構造のニューラルネットワークモデルを実行した際の消費電力よりも、１ビットである低ビット重みパラメータを用いて演算を行う構造のニューラルネットワークモデルを実行した際の消費電力の方が低いことが開示されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２１－１０３４４１号公報

【特許文献2】特開２０２０－７４０９９号公報

【特許文献3】特開２０２２－５０７７０４号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

ＤＶＦＳ制御を用いて消費電力を抑制する場合、ニューラルネットワークモデルの演算にかかる時間が大きく増加する場合がある。低ビット重みパラメータを用いるニューラルネットワークモデルは、演算にかかる時間が増加することを抑制しつつ消費電力を抑制できるものの、ニューラルネットワークモデルの構造がハードウェアの構成を決定付けるため、容易にニューラルネットワークモデルを切り替える事ができない、という課題があった。

【課題を解決するための手段】

【0005】

本開示の一形態によれば、演算装置（１００、１００Ｂ、１００Ｃ、１００Ｄ）が提供される。演算装置は、ニューラルネットワークモデルを実行して演算処理を行う演算部（１０）と、前記演算装置の消費電力と前記演算装置の温度と前記演算部の稼働率とのいずれか一つ以上を判定値として取得する取得部（２０）と、前記演算処理において用いられる前記ニューラルネットワークモデルの重みを、高ビット重みと、前記高ビット重みよりも低いビット数である低ビット重みとで切り替え可能な切替部（３０、３０Ｂ）と、を備える。前記切替部は、前記判定値が予め定められた第１閾値以上の場合に、前記重みを前記高ビット重みから前記低ビット重みに切り替える。

【0006】

この形態の演算装置によれば、切替部は、消費電力等に応じて、ニューラルネットワークモデルの重みを高ビット重みと低ビット重みとで切り替えることができる。そのため、通常は所望の精度で演算をすることができ、消費電力等が増大した場合には、演算にかかる時間が増加することを抑制しつつ消費電力を抑制できる。

【図面の簡単な説明】

【0007】

【図1】演算装置の構成の概要を示す説明図である。

【図2】ニューラルネットワークモデルによる演算処理についての説明図である。

【図3】演算処理の一例を示したフローチャートである。

【図4】第２実施形態における演算装置の構成の概要を示す説明図である。

【図5】第２実施形態における演算処理の一例を示したフローチャートである。

【図6】第３実施形態における演算装置の構成の概要を示す説明図である。

【図7】第４実施形態における演算装置の構成の概要を示す説明図である。

【発明を実施するための形態】

【0008】

Ａ．第１実施形態：
図１に示すように、演算装置１００は、演算部１０と、取得部２０と、切替部３０と、記憶部４０と、を備える。演算装置１００は、ニューラルネットワークモデルを実行して演算処理を行う装置である。演算装置１００は、中央処理装置（ＣＰＵ）や、ＲＡＭ、ＲＯＭにより構成されたマイクロコンピュータ等からなり、予めインストールされたプログラムをマイクロコンピュータが実行することによって、これらの各部の機能を実現する。本実施形態において、演算装置１００は、ＳｏＣ（ＳｙｓｔｅｍＯｎａＣｈｉｐ）である。演算装置１００は、例えば、車両に搭載され、画像解析のための演算処理を行う。演算装置１００は、クラウド上に実装されていてもよい。

【0009】

演算部１０は、ニューラルネットワークモデルを実行して演算処理を行う。図２に示すように、ニューラルネットワークは、入力層Ｌ１と、複数の中間層Ｌ２と、出力層Ｌ３とを備える。中間層Ｌ２の数は任意に定める事ができる。入力層Ｌ１は、情報が入力される層である。中間層Ｌ２は、入力層Ｌ１から伝達される情報に基づいて特徴量の算出を行う層である。出力層Ｌ３は、中間層Ｌ２から伝達される情報に基づいて結果を出力する層である。各層には、複数のノードが含まれる。隣接する層のノードとノードとを繋ぐエッジは、重み付けされている。演算部１０は、例えば、ノードＮ１に重みＷ１１を掛け合わせ、ノードＮ２に重みＷ１２を掛け合わせ、ノードＮ３に重みＷ１３を掛け合わせ、これらを足し合わせてノードＮ４の値を求める積和演算を含む演算を行う。

【0010】

記憶部４０（図１参照）は、ニューラルネットワークモデルにおける、ノードに入力される値に乗算される重みを記憶する。本実施形態において、記憶部４０は、予め定められた高ビット重みＷｈと、高ビット重みＷｈのビット数よりも低いビット数である、予め定められた低ビット重みＷｌとを記憶する。本実施形態において、記憶部４０は、高ビット重みＷｈとして、最適化された３２ｂｉｔの浮動小数点型のデータを記憶し、低ビット重みＷｌとして４ｂｉｔの整数型のデータを記憶する。また、高ビット重みＷｈと低ビット重みＷｌとは、それぞれ、最適化されている。

【0011】

取得部２０は、演算装置１００の消費電力に関する判定値を取得する。本実施形態において、取得部２０は、演算装置１００の温度の値を判定値としてセンサ２００から取得する。取得部２０は、演算装置１００の温度が高いほど、演算装置１００の消費電力が高いと推定できる。

【0012】

切替部３０は、演算処理において用いられるニューラルネットワークモデルの重みを切り替える。切替部３０は、ニューラルネットワークモデルの重みを高ビット重みＷｈと、低ビット重みＷｌとで切り替え可能である。

【0013】

図３に示す切替処理は、切替部３０がニューラルネットワークモデルの重みを切り替える処理である。この処理は、演算部１０が演算処理を実行する際に繰り返し実行される。ステップＳ１００において、取得部２０は、判定値を取得する。

【0014】

ステップＳ１１０において、切替部３０は、ステップＳ１００で取得した判定値が第１閾値以上か否かを判定する。判定値が第１閾値以上の場合、切替部３０は、ステップＳ１２０の処理に進み、重みを高ビット重みＷｈから低ビット重みＷｌに切り替える。一方、判定値が第１閾値未満の場合、切替部３０は、重みを切り替えずに、演算処理を終了する。

【0015】

以上で説明した本実施形態の演算装置１００によれば、切替部３０は、消費電力等に応じて、ニューラルネットワークモデルの重みを高ビット重みＷｈと低ビット重みＷｌとで切り替えることができる。そのため、通常は所望の精度で演算をすることができ、消費電力等が増大した場合には、演算にかかる時間が増加することを抑制しつつ消費電力を抑制できる。

【0016】

また、切替部３０は、既に最適化された低ビット重みＷｌに切り替えるため、最適化されていない低ビット重みＷｌに切り替える場合に比べて、低ビット重みＷｌを用いた演算の精度を高くできる。

【0017】

Ｂ．第２実施形態：
図４に示す第２実施形態の演算装置１００Ｂは、記憶部４０が、高ビット重みＷｈのみを記憶する点が、第１実施形態と異なり、他の構成は同一である。図５に示す第２実施形態における切り替え処理は、ステップＳ１２５において切替部３０Ｂが、高ビット重みＷｈに対して事後量子化を実行して低ビット重みに切り替える点が、第１実施形態と異なり、ステップＳ１００およびステップＳ１１０の工程は同一である。

【0018】

切替部３０Ｂは、ステップＳ１２５で高ビット重みＷｈに対して事後量子化を実行して低ビット重みに切り替える。より具体的には、切替部３０Ｂは、３２ｂｉｔの高ビット重みＷｈのうちの２３ｂｉｔで表される仮数部のビット数を、７ｂｉｔに減らして、１６ｂｉｔの浮動小数点データの低ビット重みに切り替える。

【0019】

以上で説明した第２実施形態の演算装置１００によれば、切替部３０Ｂは、高ビット重みＷｈに対して事後量子化を実行して低ビット重みに切り替えるため、低ビット重のビット数を任意に定めることができる。

【0020】

Ｃ．第３実施形態：
図６に示す第３実施形態の演算装置１００Ｃは、制御部５０を備えている点が、第１実施形態と異なり、他の構成は同一である。第３実施形態は、制御部５０が、演算装置１００の電圧とクロック周波数とを制御する点が第１実施形態と異なる。

【0021】

制御部５０は、判定値が予め定められた第２閾値以上に上昇した場合に、判定値が第２閾値未満の場合よりも演算装置１００の電圧とクロック周波数とを大きくするよう制御する。第２閾値は、第１閾値よりも小さい値である。すなわち、制御部５０は、ＤＶＦＳ制御を実行する。

【0022】

以上で説明した第３実施形態の演算装置１００Ｃによれば、制御部５０が、判定値が第２閾値以上の上昇した場合に、判定値が第２閾値未満の場合よりも演算装置１００の電圧とクロック周波数とを大きくするよう制御するため、消費電力を抑制することができる。

【0023】

Ｄ．第４実施形態：
図７に示す第４実施形態の演算装置１００Ｄは、推定部６０を備えている点が、第１実施形態と異なり、他の構成は同一である。第４実施形態は、切替部３０が、推定部６０が推定した演算量が予め定められた閾値以上である場合にも、重みを高ビット重みＷｈから低ビット重みＷｌに切り替える点が第１実施形態と異なる。

【0024】

推定部６０は、要求された演算処理における演算量を推定する。

【0025】

本実施形態において、切替部３０は、演算量が予め定められた閾値以上である場合に、ニューラルネットワークモデルの重みを高ビット重みＷｈから低ビット重みＷｌに切り替える。なお、判定値が第１閾値以上であり、既にニューラルネットワークモデルの重みを高ビット重みＷｈから低ビット重みＷｌに切り替えている場合には、切替部３０は、更にビット数の低い重みに切り替えてもよい。

【0026】

以上で説明した第４実施形態の演算装置１００Ｄによれば、高演算量が必要な演算処理を実行する際に、消費電力を抑制することができる。

【0027】

Ｅ．第５実施形態：
第５実施形態は、演算部１０が、複数のニューラルネットワークモデルを実行して並行して演算処理を行う点が、第１実施形態と異なる。第５実施形態の演算装置１００の構成は、第２実施形態の演算装置１００の構成と同一であるため、演算装置１００の構成の説明は省略する。この第５実施形態も、第２実施形態とほぼ同様の効果を有する。

【0028】

演算部１０は、高ビット重みＷｈの第１ニューラルネットワークモデルを実行する第１演算処理と、低ビット重みＷｌの第２ニューラルネットワークモデルを実行する第２演算処理とを並列して行う。すなわち、演算部１０は、冗長化構成を有する。演算装置１００は、通常、演算部１０が第１ニューラルネットワークモデルを実行して求めた演算結果を、演算部１０の演算結果として用いる。

【0029】

本実施形態において、切替部３０は、判定値が第１閾値以上の場合に、ステップＳ１２０（図３参照）において、主幹である第１ニューラルネットワークモデルの重みを高ビット重みＷｈから低ビット重みＷｌに切り替える。

【0030】

Ｆ．他の実施形態：
（Ｆ１）上述した実施形態において、取得部２０は、判定値として演算装置１００の温度を取得している。これに限らず、取得部２０は、判定値として、演算装置１００の消費電力と演算装置１００の温度と演算部１０の稼働率とのいずれか一つ以上を取得してもよい。演算部１０の稼働率とは、例えば、演算部１０の積和演算(ｍｕｌｔｉｐｌｙ－ａｃｃｕｍｕｌａｔｅ（ＭＡＣ）)によるメモリの使用率である。判定値として複数の種類の値を取得する場合、第１閾値は判定値の種類毎に設定される。

【0031】

（Ｆ２）上述した実施形態において、切替部３０は、判定値が第１閾値以下に下降した場合に、重みを低ビット重みＷｌから高ビット重みＷｈに切り替えてもよい。また、切替部３０は、判定値が第１閾値よりも低い予め定められた第３閾値以下の場合に、重みを低ビット重みＷｌから高ビット重みＷｈに切り替えてもよい。この形態によれば、切替部３０は、判定値が第１閾値付近を上昇・下降する場合において、判定値が第１閾値に下降した場合に重みを低ビット重みＷｌから高ビット重みＷｈに切り替える場合に比べて、頻繁に重みを切り替えることを回避できる。

【0032】

（Ｆ３）上述した実施形態において、記憶部４０は、演算装置１００に備えられている。これに限らず、記憶部４０は、外部の記憶領域であってもよい。

【0033】

（Ｆ４）上述した第２実施形態において、切替部３０Ｂは、判定値に応じて、低ビット重みのビット数を決定してもよい。より具体的には、切替部３０Ｂは、あらかじめ用意したテーブルや関数を用いて、低ビット重みのビット数を決定する。切替部３０は、例えば、判定値が大きいほど、低ビット重みのビット数を低くする。

【0034】

（Ｆ５）上述した第２実施形態において、切替部３０Ｂは、３２ｂｉｔの高ビット重みＷｈの仮数部のビット数を減らして１６ｂｉｔの低ビット重みに切り替えている。これに限らず、切替部３０Ｂは、例えば、高ビット重みＷｈのヒストグラムを用いて、事後量子化を行ってもよい。この場合、記憶部４０が高ビット重みＷｈのヒストグラムを保持している。より具体的には、切替部３０Ｂは、次の式（１）で求められるヒストグラムの区間の幅を用いて、事後量子化を行う。なお、切替部３０Ｂの事後量子化にかかる時間は、数ミリ秒程度であり、演算部１０の演算処理にかかる時間に大きな影響は与えない。

【0035】

Ｓ＝Ａ／２^{（ｎ－１）}…（１）
ここで、Ｓはヒストグラムの区間の幅であり、Ａはヒストグラムの最小値と最大値との差であり、ｎは低ビットのビット数である。ｎは任意に定めることができる。

【0036】

（Ｆ６）上述した第３実施形態において、推定部６０は、演算装置１００の電圧とクロック周波数とを制御している。これに限らず、推定部６０は、演算装置１００の電圧とクロック周波数とのうち少なくともいずれか一方を制御すればよい。

【0037】

（Ｆ７）上述した第４実施形態において、切替部３０は、演算量が閾値以上であって、かつ、制御部５０がＤＶＦＳ制御を実行できない場合に、ニューラルネットワークモデルの重みを高ビット重みＷｈから低ビット重みＷｌに切り替えてもよい。この場合、演算装置１００Ｄは、制御部５０を備えており、制御部５０は、演算量が閾値以上である場合に、ＤＶＦＳ制御を実行する。

【0038】

本開示は、上述の実施形態に限られるものではなく、その趣旨を逸脱しない範囲において種々の構成で実現することができる。例えば発明の概要の欄に記載した各形態中の技術的特徴に対応する実施形態中の技術的特徴は、上述した課題を解決するために、あるいは上述の効果の一部又は全部を達成するために、適宜、差し替えや組み合わせを行うことが可能である。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜削除することが可能である。

【符号の説明】

【0039】

１０…演算部、２０…取得部、３０、３０Ｂ…切替部、４０…記憶部、５０…制御部、６０…推定部、１００、１００Ｂ、１００Ｃ、１００Ｄ…演算装置、２００…センサ

【図1】