特表2024-517688 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ インターナショナル・ビジネス・マシーンズ・コーポレーションの特許一覧

特表2024-517688行列の固有値計算のためのハードウェアアクセラレーション

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4A
4B
5A
5B
6A
6B
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-04-23

(54)【発明の名称】行列の固有値計算のためのハードウェアアクセラレーション

(51)【国際特許分類】

G06G 7/16 20060101AFI20240416BHJP

G06N 3/063 20230101ALI20240416BHJP

G06G 7/60 20060101ALI20240416BHJP

【ＦＩ】

G06G7/16

G06N3/063

G06G7/60

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2023565483

(86)(22)【出願日】2022-04-12

(85)【翻訳文提出日】2023-10-25

(86)【国際出願番号】 EP2022059708

(87)【国際公開番号】W WO2022228883

(87)【国際公開日】2022-11-03

(31)【優先権主張番号】17/245,801

(32)【優先日】2021-04-30

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】390009531

【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション

【氏名又は名称原語表記】ＩＮＴＥＲＮＡＴＩＯＮＡＬＢＵＳＩＮＥＳＳＭＡＣＨＩＮＥＳＣＯＲＰＯＲＡＴＩＯＮ

【住所又は居所原語表記】ＮｅｗＯｒｃｈａｒｄＲｏａｄ，Ａｒｍｏｎｋ，ＮｅｗＹｏｒｋ１０５０４，ＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】100112690

【弁理士】

【氏名又は名称】太佐種一

(74)【代理人】

【識別番号】100120710

【弁理士】

【氏名又は名称】片岡忠彦

(74)【復代理人】

【識別番号】100104880

【弁理士】

【氏名又は名称】古部次郎

(74)【復代理人】

【識別番号】100118108

【弁理士】

【氏名又は名称】久保洋之

(72)【発明者】

【氏名】ノウィッキ、トマシュ

(72)【発明者】

【氏名】オネン、オグザン、ムラト

(72)【発明者】

【氏名】ゴクメン、タイフン

(72)【発明者】

【氏名】カランツィス、ヴァシリオス

(72)【発明者】

【氏名】ウー、チャイ、ワー

(72)【発明者】

【氏名】スクイランテ、マーク

(72)【発明者】

【氏名】ラッシュ、マルテ、ヨハネス

(72)【発明者】

【氏名】ヘンシュ、ウィルフリード

(72)【発明者】

【氏名】ホレシュ、リオル

(57)【要約】

行列の固有対のハードウェアアクセラレーションコンピューティングを実施するための技術が提供される。例えば、システムは、プロセッサと、プロセッサに結合された抵抗処理ユニットと、を備える。抵抗処理ユニットは、セルの配列を含み、セルはそれぞれ抵抗デバイスを含み、抵抗デバイスの少なくとも一部は、セルの配列に保存された所定の行列の値を符号化するように調整可能である。所定の行列がセルの配列に記憶されている場合、プロセッサは、初期ベクトルを記憶された行列の固有ベクトルの推定値に収束させるために、記憶された行列に対してアナログ行列－ベクトル乗算演算を実行することを含む処理を実行することによって、記憶された行列の固有ベクトルを判定するように構成される。

【特許請求の範囲】

【請求項1】

システムであって、
プロセッサと、
前記プロセッサに結合された抵抗処理ユニットであって、前記抵抗処理ユニットは、セルの配列を含み、前記セルはそれぞれ抵抗デバイスを含み、前記抵抗デバイスの少なくとも一部は、前記セルの配列に記憶可能な所定の行列の値を符号化するように調整可能である、抵抗処理ユニットと、を備え、
前記所定の行列が前記セルの配列に記憶されている場合、前記プロセッサは、前記記憶された行列の固有ベクトルの推定値に初期ベクトルを収束させるために、前記記憶された行列に対してアナログ行列－ベクトル乗算演算を実行することを含む処理を実行することによって、前記記憶された行列の前記固有ベクトルを判定するように構成される、
システム。

【請求項2】

前記処理を実行する際に、前記プロセッサはさらに、
前記推定された固有ベクトルに関連する固有値を推定することと、
前記処理の結果として、前記記憶された行列の少なくとも１つの固有対を返すことであって、前記記憶された行列の前記少なくとも１つの固有対は、前記推定された固有ベクトルおよび前記推定された固有ベクトルに関連する前記推定された固有値を含む、返すことと、
を行うように構成される、請求項１に記載のシステム。

【請求項3】

前記処理を実行する際に、前記プロセッサは、前記記憶された行列の支配的固有ベクトルを推定し、前記推定された支配的固有ベクトルに関連する支配的固有値を推定するために、べき乗反復処理を実行するように構成される、請求項１に記載のシステム。

【請求項4】

前記処理を実行する際に、前記プロセッサは、
前記所定の行列の逆行列を推定することと、
前記推定された逆行列を前記セルの配列に記憶することと、
前記推定された逆行列の支配的固有ベクトルを推定し、前記推定された逆行列の前記推定された支配的固有ベクトルに関連する支配的固有値を推定するために、逆べき乗反復処理を実行することと、
を行うように構成される、請求項１に記載のシステム。

【請求項5】

前記処理を実行する際に、前記プロセッサは、
第１の反復を実行することであって、前記第１の反復は、
前記セルの配列に前記初期ベクトルを入力することと、
前記セルの配列から出力される第１の出力ベクトルを生成するために、前記セルの配列内の前記記憶された行列と前記初期ベクトルを乗算することによって、第１の行列－ベクトル乗算演算を実行する前記抵抗処理ユニットを使用することと、
前記第１の出力ベクトルを正規化し、それによって第１の正規化ベクトルを生成する正規化処理を実行することと、を含む、実行することと、
少なくとも第２の反復を実行することであって、前記第２の反復は、
前記第１の正規化ベクトルを前記セルの配列に入力することと、
前記セルの配列から出力される第２の出力ベクトルを生成するために、前記セルの配列内の前記記憶された行列と前記第１の正規化ベクトルを乗算することによって、第２の行列－ベクトル乗算演算を実行する前記抵抗処理ユニットを使用することと、
前記第２の出力ベクトルを正規化し、それによって第２の正規化ベクトルを生成する正規化処理を実行することと、を含む、実行することと、
を行うように構成される、請求項１に記載のシステム。

【請求項6】

前記初期ベクトルは、ランダムベクトルおよび前記記憶された行列のターゲット固有ベクトルの推定値のうちの１つを含む、請求項５に記載のシステム。

【請求項7】

前記処理の複数の反復を完了すると、前記プロセッサは、
前記複数の反復のうち最後に完了した反復から生成された最後の出力ベクトルが、前記記憶された行列のターゲット固有ベクトルに収束したかどうかを判定することと、
前記最後の出力ベクトルが前記記憶された行列のターゲット固有ベクトルに収束したと判定したことに応答して、前記最後の出力ベクトルを前記記憶された行列の前記推定された固有ベクトルとして設定することと、
を行うように構成される、請求項５に記載のシステム。

【請求項8】

前記処理を実行する際に、前記プロセッサはさらに、
前記セルの配列内の前記記憶された行列の行列値を更新するために前記抵抗処理ユニットを利用し、それによって、前記所定の行列の前記推定された固有値がゼロに設定された更新された行列を生成することと、
前記所定の行列の第２の固有ベクトルを推定するために、前記セルの配列に記憶された前記更新された行列に対して処理を繰り返すことと、
前記推定された第２の固有ベクトルに関連する第２の固有値を推定することと、
を行うように構成される、請求項１に記載のシステム。

【請求項9】

前記セルの配列内の前記記憶された行列の行列値を更新するために前記抵抗処理ユニットを利用する際に、前記プロセッサは、前記記憶された行列に対して第１のベクトルと第２のベクトルの外積演算を実行するように構成され、
前記第１のベクトルは、前記関連する推定された固有値によってスケーリングされた前記推定された固有ベクトルを含み、
前記第２のベクトルは、前記推定された固有ベクトルの転置を含む、
請求項８に記載のシステム。

【請求項10】

コンピュータプログラム製品であって、
１または複数のコンピュータ可読記憶媒体と、前記１または複数のコンピュータ可読記憶媒体に集合的に記憶されたプログラム命令であって、前記プログラム命令は、
アプリケーションから所定の行列を受信するプログラム命令と、
抵抗処理ユニットのセルの配列に行列を記憶するプログラム命令であって、前記記憶された行列が前記所定の行列と関連付けられている、プログラム命令と、
前記所定の行列の固有ベクトルを判定する処理を実行するプログラム命令であって、前記処理を実行する前記プログラム命令は、前記記憶された行列の前記固有ベクトルの推定値に初期ベクトルを収束させるために、前記記憶された行列に対してアナログ行列－ベクトル乗算演算を実行するプログラム命令を含む、プログラム命令と、
を含む、コンピュータプログラム製品。

【請求項11】

前記処理を実行する前記プログラム命令は、
前記推定された固有ベクトルに関連する固有値を推定するプログラム命令と、
前記所定の行列の少なくとも１つの固有対を前記アプリケーションに返すプログラム命令であって、前記少なくとも１つの固有対は、前記推定された固有ベクトルおよび前記推定された固有ベクトルに関連する前記推定された固有値を含む、プログラム命令と、
をさらに含む、請求項１０に記載のコンピュータプログラム製品。

【請求項12】

前記処理を実行するプログラム命令は、前記記憶された行列の支配的固有ベクトルを推定し、前記推定された支配的固有ベクトルに関連する支配的固有値を推定するために、べき乗反復処理を実行するプログラム命令を含む、請求項１０に記載のコンピュータプログラム製品。

【請求項13】

前記抵抗処理ユニットの前記セルの配列に前記行列を記憶する前記プログラム命令は、前記所定の行列の逆行列を推定し、前記所定の行列の前記推定された逆行列を前記抵抗処理ユニットの前記セルの配列に記憶するプログラム命令と、
前記推定された逆行列の支配的固有ベクトルを推定し、前記推定された逆行列の前記推定された支配的固有ベクトルに関連する支配的固有値を推定するために、逆べき乗反復処理を実行するプログラム命令を含む前記処理を実行する前記プログラム命令と、を含む、
請求項１０に記載のコンピュータプログラム製品。

【請求項14】

前記処理を実行する前記プログラム命令は、
第１の反復を実行するプログラム命令であって、前記第１の反復は、
前記セルの配列に前記初期ベクトルを入力することと、
前記セルの配列から出力される第１の出力ベクトルを生成するために、前記セルの配列内の前記記憶された行列と前記初期ベクトルを乗算することによって、第１の行列－ベクトル乗算演算を実行することと、
前記第１の出力ベクトルを正規化し、それによって第１の正規化ベクトルを生成する正規化処理を実行することと、を含む、プログラム命令と、
少なくとも第２の反復を実行するプログラム命令であって、前記第２の反復は、
前記第１の正規化ベクトルを前記セルの配列に入力することと、
前記セルの配列から出力される第２の出力ベクトルを生成するために、前記セルの配列内の前記記憶された行列と前記第１の正規化ベクトルを乗算することによって、第２の行列－ベクトル乗算演算を実行することと、
前記第２の出力ベクトルを正規化し、それによって第２の正規化ベクトルを生成する前記正規化処理を実行することと、を含む、プログラム命令と、
を含む、請求項１０に記載のコンピュータプログラム製品。

【請求項15】

前記処理を実行する前記プログラム命令は、
前記処理の複数の反復を完了すると、前記複数の反復のうち最後に完了した反復から生成された最後の出力ベクトルが、前記記憶された行列のターゲット固有ベクトルに収束したかどうかを判定するプログラム命令と、
前記最後の出力ベクトルが前記記憶された行列の前記ターゲット固有ベクトルに収束したと判定したことに応答して、前記最後の出力ベクトルを前記記憶された行列の前記推定された固有ベクトルとして設定するプログラム命令と、
をさらに含む、請求項１４に記載のコンピュータプログラム製品。

【請求項16】

前記セルの配列内の前記記憶された行列の行列値を更新するために前記抵抗処理ユニットを利用し、それによって、前記所定の行列の前記推定された固有値がゼロに設定された更新された行列を生成するプログラム命令と、
前記所定の行列の第２の固有ベクトルを推定するために、前記セルの配列に記憶された前記更新された行列に対して前記処理を繰り返すプログラム命令と、
前記推定された第２の固有ベクトルに関連する第２の固有値を判定するプログラム命令と、
を含む、請求項１０に記載のコンピュータプログラム製品。

【請求項17】

前記セルの配列内の前記記憶された行列の行列値を更新するために前記抵抗処理ユニットを利用する前記プログラム命令は、
前記記憶された行列に対して第１のベクトルと第２のベクトルの外積演算を実行するプログラム命令を含み、
前記第１のベクトルは、前記関連する固有値によってスケーリングされた前記推定された固有ベクトルを含み、
前記第２のベクトルは、前記推定された固有ベクトルの転置を含む、
請求項１６に記載のコンピュータプログラム製品。

【請求項18】

アプリケーションから所定の行列を受信することと、
抵抗処理ユニットのセルの配列に行列を記憶することであって、前記記憶された行列が前記所定の行列と関連付けられている、記憶することと、
前記所定の行列の固有ベクトルを判定する処理を実行することであって、前記処理を実行することは、前記記憶された行列の前記固有ベクトルの推定値に初期ベクトルを収束させるために、前記記憶された行列に対してアナログ行列－ベクトル乗算演算を実行することを含む、実行することと、
を含む、方法。

【請求項19】

前記処理を実行することは、
前記推定された固有ベクトルに関連する固有値を推定することと、
前記所定の行列の少なくとも１つの固有対を前記アプリケーションに返すことであって、前記少なくとも１つの固有対は、前記推定された固有ベクトルおよび前記推定された固有ベクトルに関連する前記推定された固有値を含む、返すことと、
をさらに含む、請求項１８に記載の方法。

【請求項20】

前記処理を実行することは、
前記推定された固有ベクトルに関連する固有値を推定することと、
前記セルの配列内の前記記憶された行列の行列値を更新するために前記抵抗処理ユニットを利用し、それによって、前記所定の行列の前記推定された固有値がゼロに設定された更新された行列を生成することと、
前記所定の行列の第２の固有ベクトルを推定するために、前記セルの配列に記憶された前記更新された行列に対して前記処理を繰り返すことと、
前記推定された第２の固有ベクトルに関連する第２の固有値を推定することと、をさらに含み、
前記セルの配列内の前記記憶された行列の行列値を更新するために前記抵抗処理ユニットシステムを利用することは、前記記憶された行列に対して第１のベクトルと第２のベクトルの外積演算を実行することを含み、
前記第１のベクトルは、前記関連する固有値によってスケーリングされた前記推定された固有ベクトルを含み、
前記第２のベクトルは、前記推定された固有ベクトルの転置を含む、
請求項１８に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、一般に、ニューロモーフィックコンピューティングのためのアナログ抵抗処理システム、およびアナログ抵抗処理システムを用いてハードウェアアクセラレーション数値コンピューティングタスクを実行するための技術に関するものである。

【背景技術】

【0002】

ニューロモーフィックコンピューティングシステムや人工ニューラルネットワークシステムなどの情報処理システムは、認知認識やコンピューティングのための機械学習や推論処理などの様々なアプリケーションで活用されている。かかるシステムは、一般に、並列に動作して様々な種類の計算を行う多数の高度に相互接続された処理要素（「人工ニューロン」と呼ばれる）を含む、ハードウェアベースのシステムである。人工ニューロン（例えば、プレシナプティックニューロンとポストシナプティックニューロン）は、人工ニューロン間の接続強度を表すシナプス重みを提供する人工シナプスデバイスを用いて接続される。シナプス重みは、調整可能な抵抗性メモリデバイス（例えば、調整可能なコンダクタンス）を有する抵抗処理ユニット（ＲＰＵ）セルの配列を使用して実装することができ、ＲＰＵセルのコンダクタンス状態は、シナプス重みに符号化またはマッピングされる。

【発明の概要】

【0003】

本発明の態様は、添付の特許請求の範囲に定義されるように、行列の固有対のハードウェアアクセラレーションコンピューティングを実装するシステム、コンピュータプログラム製品、および方法を含む。例示的な実施形態では、システムであって、プロセッサと、プロセッサに結合された抵抗処理ユニットと、を備える。抵抗処理ユニットは、セルの配列を含み、セルはそれぞれ抵抗デバイスを含み、抵抗デバイスの少なくとも一部は、セルの配列に保存された所定の行列の値を符号化するように調整可能である。所定の行列がセルの配列に記憶されている場合、プロセッサは、初期ベクトルを記憶された行列の固有ベクトルの推定値に収束させるために、記憶された行列に対してアナログ行列－ベクトル乗算演算を実行することを含む処理を実行することによって、記憶された行列の固有ベクトルを判定するように構成される。

【0004】

他の実施形態は、添付の図と合わせて読まれる例示的な実施形態の以下の詳細な説明で説明されるであろう。

【図面の簡単な説明】

【0005】

【図1】本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを実装するコンピューティングシステムを概略的に示している。

【図2】本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを提供するために、図１のシステムに実装され得るＲＰＵコンピューティングシステムを概略的に示している。

【図3】本開示の例示的な実施形態による、固有対コンピューティング処理を実行するための方法を示す図である。

【図4A】本開示の例示的な実施形態による、固有対コンピューティング処理を実行するための方法を示す図である。

【図4B】本開示の例示的な実施形態による、固有対コンピューティング処理を実行するための方法を示す図である。

【図5A】本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを実装するためのＲＰＵセルの配列を含むＲＰＵコンピューティングシステムによって、アナログ行列－ベクトル乗算演算を実行するための方法を概略的に示している。

【図5B】本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを実装するためのＲＰＵセルの配列を含むＲＰＵコンピューティングシステムによってアナログ外積演算を行うための方法を概略的に示している。

【図6A】本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを実装するための行列－ベクトル演算を実行するためのＲＰＵセルの配列を含むＲＰＵコンピューティングシステムを構成するための方法を概略的に示している。

【図6B】本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを実装するためにアナログ外積演算を実行するＲＰＵセルの配列を含むＲＰＵコンピューティングシステムを構成するための方法を概略的に示す図である。

【図7】本開示の例示的な実施形態による、符号付き行列値を用いた固有対コンピューティング処理のための行列－ベクトル演算を実行するために、ＲＰＵセルの複数の配列を含むＲＰＵコンピューティングシステムを構成するための方法を概略的に示す図である。

【図8】本開示の例示的な実施形態による、固有対コンピューティング処理を実行するように構成されたシステムをホストすることができるコンピューティングノードの例示的なアーキテクチャを概略的に示す図である。

【図9】本開示の例示的な実施形態による、クラウドコンピューティング環境を示す図である。

【図10】本開示の例示的な実施形態による抽象化モデルレイヤを示す図である。

【発明を実施するための形態】

【0006】

本発明の実施形態は、次に、行列の固有対のハードウェアアクセラレーションコンピューティングを提供するためのシステムおよび方法に関してさらに詳細に説明される。添付の図面に示された様々な特徴は、縮尺通りに描かれていない概略図であることを理解されたい。さらに、同一または類似の参照番号は、同一または類似の特徴、要素、または構造を示すために図面全体を通して使用され、したがって、同一または類似の特徴、要素、または構造についての詳細な説明は、図面のそれぞれについて繰り返されることはない。さらに、「例示的」という用語は、本明細書では「例、実例、または例示として機能すること」を意味するために使用される。本明細書で「例示的」として説明される任意の実施形態または設計は、必ずしも他の実施形態または設計よりも好ましいまたは有利であると解釈されるべきではない。

【0007】

さらに、回路、構造、要素、コンポーネントなどと共に使用される、１または複数の機能を実行するか、さもなければ何らかの機能性を提供する「ように構成される」という表現は、回路、構造、要素、コンポーネントなどが、ハードウェア、ソフトウェア、および／またはそれらの組み合わせで実装され、ハードウェアを備える実装では、ハードウェアが離散回路素子（例えば、トランジスタ、インバータなど）、プログラマブル素子（ＡＳＩＣ、ＦＰＧＡなど）、処理デバイス（ＣＰＵ、ＧＰＵなど）、１または複数の集積回路、および／またはそれらの組合せを備え得る実施形態を包含することを意図していることを理解されたい。したがって、例示に過ぎないが、回路、構造、要素、コンポーネントなどが特定の機能を提供するように構成されていると定義される場合、回路、構造、要素、コンポーネントなどが動作状態にあるときに特定の機能を実行することを可能にする要素、処理デバイス、もしくは集積回路、またはその組み合わせで構成されている実施形態（例えば、システム内に接続されているか、そうでなければ配備されている、電源が入っている、入力を受信する、もしくは出力を生成する、またはその組み合わせ。）ならびに、回路、構造、要素、コンポーネントなどが非動作状態（例えば、接続されていない、システム内に配置されていない、電源が入っていない、入力を受信していない、もしくは出力を生成していない、またはその組み合わせ）または部分的に動作状態にある場合のカバー実施形態をカバーすることを意図している。

【0008】

図１は、本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを実装するコンピューティングシステムを概略的に示している。特に、図１は、アプリケーション１１０、デジタル処理システム１２０、およびニューロモーフィックコンピューティングシステム１３０を備えるコンピューティングシステム１００を概略的に示す。デジタル処理システム１２０は、複数のプロセッサコア１２２を備える。ニューロモーフィックコンピューティングシステム１３０は、複数のニューラルコア１３２を備える。いくつかの実施形態では、ニューロモーフィックコンピューティングシステム１３０は、各ニューラルコア１３２が１または複数のアナログ抵抗処理ユニット配列（例えば、アナログＲＰＵクロスバー配列ハードウェア）を備える抵抗処理ユニット（ＲＰＵ）システムを備える。ニューラルコア１３２は、ＲＰＵ配列１３４上で実行されるベクトル－行列乗算、行列－ベクトル乗算、ベクトル－ベクトル乗算、もしくは行列乗算演算などの数値演算のハードウェアアクセラレーションをサポートするために、アナログ領域で積和（ＭＡＣ）演算を実行することによって、行列の固有対の計算などの行列分解演算を行うためのハードウェアアクセラレーションをサポートするように構成される。

【0009】

いくつかの実施形態では、デジタル処理システム１２０は、アプリケーション１１０によって提供される所定の行列Ａの固有対を計算するために実行される固有対計算処理１４０のような行列分解処理の実行を制御する。固有対計算処理１４０は、行列の固有対の計算を可能にするために、様々な処理および最適化ソルバー手法を実装する。例えば、いくつかの実施形態では、固有対計算処理１４０は、固有対判定制御処理１４２と、行列反転処理１４４とを実装し、これらは、固有対計算処理１４０によって利用され、所定の行列Ａの１または複数の固有対を計算する。いくつかの実施形態では、固有対判定制御処理１４２および行列反転処理１４４は、デジタル処理システム１２０のプロセッサコア１２２によって実行されて固有対計算処理１４０を実行するソフトウェアモジュールである。以下にさらに詳細に説明するように、固有対計算処理１４０は、ニューロモーフィックコンピューティングシステム１３０を利用して、図１に概略的に示されるように、ＲＰＵ配列１３４の１または複数に記憶される所定の行列（例えば、元の行列Ａまたは近似（推定）逆行列Ａ^－１）に対して、行列－ベクトル演算およびベクトル－ベクトル積演算などの様々なインメモリ計算を通じてアナログ領域でハードウェアアクセラレーション積和（ＭＡＣ）演算（例えば、外積演算）を実行する。

【0010】

アプリケーション１１０は、数値演算を実行し、線形方程式を解き、他の計算を実行するための計算対象として行列および逆行列を利用する任意のタイプの計算アプリケーション（例えば、科学計算アプリケーション、工学アプリケーション、グラフィックスレンダリングアプリケーション、信号処理アプリケーション、顔認識アプリケーション、行列対角化アプリケーション、無線通信用のＭＩＭＯ（多重入力、多重出力）システム、暗号化など）を含んでよい。数学的には、線形システム（または線形方程式系）とは、同じ変数セットを持つ１または複数の線形方程式の集まりであり、線形システムの解は、（線形システムの）すべての線形方程式が同時に満たされるように変数に値を割り当てることを含む。数学的には、線形システムの理論は数値線形代数の基礎であり、基本的な部分である。数値線形代数は、ベクトルや行列の特性や関連するベクトル／行列演算を利用して、効率的かつ正確な方法で線形システムを解くコンピュータアルゴリズムを実装する。数値線形代数の一般的な問題には、特異値分解、固有ベクトル分解、行列対角化などの行列分解を取得することを含み、これを利用して所定の行列の固有値や固有ベクトルを判定し、それによって線形連立方程式の解法など、線形代数学の一般的な問題を解決することができる。

【0011】

例えば、定数係数の線形方程式系は、行列Ａを用いて線形変換を表し、反復処理を利用して行列の固有値および固有ベクトルを判定する代数的方法を用いて解くことができ、行列Ａの固有値および固有ベクトルは線形方程式の解を表す。より具体的には、線形方程式系は、以下の固有値方程式の形で表すことができる。
Ａｘ＝λｘ（式１）
ここで、Ａは実数または複素数のｎ×ｎ行列（またはより詳細には対角化可能な行列）であり、ここでλはスカラー数（実数または複素数）であり、行列Ａの固有値であり、ｘは次元ｎの非ゼロベクトル（場合によっては複素数）であり、行列Ａの固有ベクトルとなる。より具体的には、式（１）において、ｎ×ｎの行列Ａは線形変換を表すことができ、固有ベクトルはｎ×１の行列である。固有値方程式（式１）は、線形変換Ａの作用の下で、ベクトルｘが共線ベクトルλｘに変換されることを意味する。この性質を持つベクトルは線形変換Ａの固有ベクトルとみなされ、関連するスカラーλは固有値とみなされる。本明細書で使用する「固有対」という用語は、固有ベクトルとそれに関連する固有値の数学的な対を示すものである。多くの用途において、所定の行列Ａの固有対（λ_ｉ，ｘ_ｉ）を求めることが望ましく、ここでλ_ｉは固有値、ｘ_ｉは対応する固有ベクトルである。

【0012】

本来、行列Ａの線形変換の固有ベクトルｘは、固有ベクトルｘにＡを適用しても方向が変わらない非ゼロベクトルである。線形変換Ａの固有ベクトルｘへの適用は、固有ベクトルｘを固有値λでのみスケーリングする。固有ベクトルは、線形変換が単に所定の方向に伸びるか縮むか、あるいは方向が反転したりする作用の方向を示し、固有値は所定の方向への変化の大きさを示す。言い換えると、固有ベクトルは、線形変換Ａが単に伸びるか縮むか、あるいは方向を反転させるベクトルであり、固有ベクトルが伸びる／縮む／方向を反転させる量は、固有値に基づくものである。これに関して、固有値λは、任意のスカラー値（またはゼロまたは複素数）であってよく、固有値λは、負であってもよく、この場合、固有ベクトルは、スケーリングの一部として方向を反転する。

【0013】

正方形のｎ×ｎ行列Ａは、Ａ＝ＸΛＸ^－１（一方、対称行列は定義により対角化可能である）を満たすような反転行列Ｘおよび対角行列Λが存在する場合に対角化可能である。いくつかの実施形態では、行列Ａを対角化する、すなわち、Ａ＝ＸΛＸ^－１を満たす行列ＸおよびΛを判定することにより、処理が実施される。所定の行列Ａは、行列Ａがｎ個の線形独立固有ベクトルを有する場合、対角化可能である。言い換えると、実数ｎ×ｎ行列Ａが、ｎ個の固有対（λ_１，ｘ_１），（λ_２，ｘ_２），．．．，（λ_ｎ，ｘ_ｎ）を持ち、固有ベクトルｘ_１，ｘ_２，．．．，ｘ_ｎが線形独立である場合、Ａ=ＸΛＸ^－１となり、ここでＸは列がベクトルｘ_１，ｘ_２，．．．，ｘ_ｎすなわちＸ＝（ｘ_１，ｘ_２，．．．，ｘ_ｎ）である反転可能なｎ×ｎ行列であり、Λはｎ×ｎ行列であり、以下が成り立つ。

【0014】

この例では、Ｘの列ベクトルは行列Ａの固有ベクトルの基底を形成し、Ｘのｉ番目の列はＡの固有ベクトルｘ_ｉであり、Λは対角行列であり、ｉ番目の対角要素λ_ｉが対応する固有値である。この点における対角化可能行列Ａの固有分解演算は固有ベクトルの基本性質に基づいており、ここで、Ｘ^－１ＡＸ＝ΛはＡＸ＝ＸΛと書き換えることができ、さらにＡｘ_ｉ＝λ_ｉｘ_ｉと書き換えることができ、ここで、Ｘの列ベクトルｘ_ｉはＡの右固有ベクトル、対応する対角エントリは対応する固有値、Ｘ^－１の行ベクトルはＡの左固有ベクトルとする。行列Ａを対角化する処理は、固有ベクトルが基底を形成する場合に、行列の固有値と固有ベクトルを求めるのと同じ処理である。なお、対角化は、Ａ^ｋ＝ＸΛ^ｋＸ^－１のように、行列のべき乗を効率的に計算するために用いることができることに留意されたい。

【0015】

さらに、Ｘは、Ｘの列を対称行列Ａのｎ個の線形独立な固有ベクトルの対称ｎ×ｎ行列とすると、Ｘは転置ＸがＸの逆行列に等しい直交行列、すなわち、Ｘ^Ｔ＝Ｘ^－１である。この点から、固有値方程式（式１）はＡＸ＝ＸΛと書くことができ、ここで、Λは対角ｎ×ｎ行列で、その要素はＡの固有値をＸの列と順に対応させている。Ｘ^Ｔ＝Ｘ^Ｔ－１に基づいて、方程式ＡＸ＝ＸΛはＡ＝ＸΛＸ^Ｔと書き換えられる場合があり、さらにＸ^ＴＡＸ＝Λと書き換えられることができる。

【0016】

いくつかの実施形態では、固有対計算処理１４０は、所定の対角化可能な行列の固有値および固有ベクトルを判定するための固有分解処理を実装し、固有分解は、例えば、反復数値メソッドに基づく。一般に、小さなｎ×ｎ行列Ａについて、行列Ａの固有値は、特性多項式を使用して記号的に判定することができる。具体的には、Ａｘ＝λｘの固有値方程式（式１）から、右辺にｎ×ｎの単位行列Ｉを掛けるとＡｘ＝λＩｘとなり、これはＡｘ－λＩｘ＝０または（Ａ－λＩ）ｘ＝０に書き換えることができる。ｘが０でないと仮定すると、特性多項式の式ｐ（λ）＝ｄｅｔ（Ａ－λＩ）＝０を用いて固有値を計算することができ、計算された固有値に基づいて対応する固有ベクトルｘを式（Ａ－λＩ）ｘ＝０を用いて計算することができる。ｎ×ｎの行列Ａに対して、多項式ｐ（λ）は、λにおけるｎ番目の次数であり、ｎ個の平方根λ_１，λ_２，．．．，λ_ｎを持ち、これらの平方根は行列Ａの固有値である。行列Ａの各固有値λ_ｉに対し、（式１）の対応する非ゼロ解ｘ_ｉが存在する。実際には、計算にはコストがかかり、高次多項式の正確な（記号的な）平方根を計算することは困難な場合があるため、大きな行列の固有値は特性多項式を使用して計算されない。そのため、固有ベクトルと固有値の推定値を計算するために、反復数値計算アルゴリズムが利用される。

【0017】

いくつかの実施形態において、固有対計算処理１４０は、「べき乗反復法」として知られる反復数値法を用いて固有分解処理を実行する。より具体的には、いくつかの実施形態では、固有対判定制御処理１４２は、行列Ａの１または複数の固有対を計算するために、対称行列Ａに対してべき乗反復処理を実行するように構成された方法を実施する。対称（したがって対角化可能）な行列Ａが与えられると、べき乗反復処理を実行して、固有値方程式を満たす、行列Ａの最大固有値λ（例えば、絶対値で支配的固有値λ）、および支配的固有値λに対応する対応する支配的（非ゼロ）固有ベクトルｖを判定する：Ａｘ＝λｘ。例示的なべき乗反復処理は、図４Ａおよび４Ｂの例示的なフロー図を参照して、以下でさらに詳細に説明される。

【0018】

一般に、べき乗反復法は、支配的固有ベクトルの近似値であってもよいし、ランダムベクトルであってもよい初期ベクトルから始まる。初期ベクトルは、各反復後に支配的固有ベクトルの現在の推定値を表す正規化ベクトル（または単位ベクトル）のシーケンスを計算する反復処理で利用され、シーケンスが支配的固有値または主固有値に対応する固有ベクトルに収束することが期待される。各反復において、結果のベクトルｘは行列Ａを掛け合わされる。行列Ａが、行列Ａの他の固有値よりも絶対的な大きさが厳密に大きい固有値を有し、初期ベクトルが支配的固有値に関連する固有ベクトルの方向に非ゼロ成分を有すると仮定すると、計算されたシーケンスベクトルは、支配的固有値に関連する固有ベクトルに収束するだろう。本開示の例示的な実施形態に従って、ハードウェアアクセラレーションコンピューティングは、べき乗反復処理の各反復のための乗算演算（Ａｘ）を実行するためにべき乗反復処理の間に（例えば、ＲＰＵコンピューティングシステムを介して）利用される。べき乗反復処理は、支配的固有ベクトルの推定値を計算し、対応する支配的固有値は、例えば、固有ベクトルのレイリー商によって判定され得る。

【0019】

【0020】

さらに、いくつかの実施形態では、固有対判定制御処理１４２は、所定の対角化可能な行列Ａの追加の固有対を計算するために、べき乗反復処理と連携して行列デフレーション処理を実施する。上述のように、べき乗反復処理は、支配的固有ベクトルｘ_１の推定値を計算するために利用され、これにより、固有対判定制御処理１４２は、レイリー商などの任意の適切な処理を介して、対応する支配的固有値λ_１の推定値を計算することができる。行列Ａの他の固有対を判定する必要がない場合、べき乗反復処理は、行列Ａの支配的固有対（λ_１，ｘ_１）の計算で終了する。一方、ｎ×ｎ行列Ａの１または複数の１つの付加的な固有対（例えば、（λ_２，ｘ_２），（λ_３，ｘ_３），．．．，（λ_ｎ，ｘ_ｎ））を判定する場合、固有対判定制御処理１４２は、行列デフレーション処理を実施してデフレーション行列を計算し、デフレーション行列の支配的固有対の計算を可能にし、べき乗反復処理を用いて行列Ａの次の支配的固有対（例えば、（λ_２，ｘ_２））に対応する。例示的な行列デフレーション処理は、例示的なフロー図４Ｂを参照して、以下でさらに詳細に議論される。

【0021】

支配的固有ベクトルｘ_１（例えば、正規化固有ベクトルｘ_１）および行列Ａの対応する支配的固有値λ_１が、べき乗反復処理によって判定されたとする。いくつかの実施形態では、行列デフレ処理は、行列λ_１ｘ_１ｘ_１ ^Ｔを計算し、それを行列Ａから減算してデフレーション行列Ｄ、すなわちＤ＝Ａ－λ_１ｘ_１ｘ_１ ^Ｔを生成することによって行われる。デフレーション行列Ｄは、行列Ａと同じ固有ベクトルを持ち、同じ固有値を持つが、先に計算されたＡの支配的固有値がデフレーション行列Ｄでゼロにマッピングされるという違いがある。この点で、行列Ａの次の下位固有値は、デフレーション行列Ｄの支配的固有値となり、べき乗反復法の別の反復によって判定することができる。

【0022】

【0023】

【0024】

【0025】

【0026】

図１に模式的に示されるように、行列反転処理１４４は、アプリケーション１１０によって提供される行列Ａの推定逆行列Ａ^－１を計算し、推定された逆行列Ａ^－１をＲＰＵ配列１３４に記憶するように構成される方法を実施する。固有対判定制御処理１４２は、逆べき乗反復処理の第１の反復において、行列Ａの最小の固有対を計算するために、推定された逆行列Ａ^－１に対して動作することになる。いくつかの実施形態では、行列反転処理は、行列Ａの逆行列Ａ^－１の推定値を計算するために、任意の適切な処理を使用してデジタル領域で実行される。例えば、いくつかの実施形態では、行列反転処理１４４は、逆行列Ａ^－１の近似値を計算するために、ノイマン級数処理もしくはニュートン反復処理またはその両方を使用して実装され、その例示的な方法は、当業者に知られており、その詳細は、本明細書に記載される例示的な固有対計算技術を理解するために必要ではない。

【0027】

いくつかの実施形態では、行列反転処理１４４は、２０２０年１２月２９日に出願された米国特許出願シリアル番号１７／１３４，８１４、タイトル：Matrix Inversion Using Analog Resistive Crossbar Array hardwareに開示されているようなハードウェアアクセラレーションコンピューティング技術を実装し、これは共通譲渡されて、参照によって完全に本書に組み込まれる。米国特許出願シリアル番号１７／１３４，８１４は、例えば、（ｉ）所定の行列Ａの第１の推定された逆行列をＲＰＵ配列１３４の１または複数に記憶することと、（ｉｉ）第１の推定された逆行列を所定の行列の第２の推定された逆行列に収束するためにＲＰＵセルの配列に記憶された第１の推定された逆行列に第１の反復処理を実行することと、を含む行列反転処理を行う技術を開示する。いくつかの実施形態において、第１の反復処理は、ＲＰＵセルの配列に記憶された第１の推定された逆行列を訓練するために訓練データとして所定の行列Ａの行ベクトルを利用し、同一行列の行列値に基づいて判定される誤差ベクトルを利用することによってＲＰＵセルの配列に記憶される第１の推定された逆行列の行列値を更新することを含む確率勾配降下最適化処理素含む。行列逆処理フローの更なる詳細は、米国特許出願シリアル番号１７／１３４，８１４に記載されており、これは参照により本明細書に組み込まれる。

【0028】

図１に概略的に示すように、アプリケーション１１０の実行中、アプリケーション１１０は、固有対計算処理１４０を呼び出して、行列反転処理１４０に提供される所定の行列Ａの１または複数の固有対を計算することができる。いくつかの実施形態では、行列Ａは、対称行列または対称正定値（ＳＰＤ）行列を含む。対称行列は、その転置に等しい正方行列である。ＳＰＤ行列は、行列のすべての固有値が実数かつ正であり、ｎ個の固有ベクトルの正規直交セット（ここで、対称行列の異なる固有値に対応する固有ベクトルは互いに直交する）を有する正方対称な行列である。ＳＰＤ行列は、計算を実行するためにＳＰＤ行列の固有分解が必要とされる多くの物理的および数学的文脈で生じる。例示の目的のために、本開示の例示的な実施形態は、対称行列およびＳＰＤ行列の文脈で本明細書に記載されるが、本明細書に議論される例示的な技術は、非対称行列に容易に適用され得る。

【0029】

いくつかの実施形態では、デジタル処理システム１２０は、固有対計算処理１４０の実行を制御する。初期段階として、所定の行列Ａの固有対を計算する要求とともにアプリケーション１１０から行列Ａを受け取ると、固有対計算処理１４０は、固有対計算処理のためのハードウェアアクセラレーションサポートを提供するために、ニューロモーフィックコンピューティングシステム１３０の１または複数のニューラルコア１３２および関連するＲＰＵ配列１３４を構成する。さらに、固有対計算処理１４０は、ニューラルコア１３２の１または複数のＲＰＵ配列１３４に行列Ａを記憶するために、ニューロモーフィックコンピューティングシステム１３０と通信することになる。いくつかの実施形態では、逆行列Ａ^－１が計算に必要な場合、固有対計算処理１４０は、行列反転処理１４４を呼び出して、受信した行列Ａの近似逆行列Ａ^－１を計算し、逆行列Ａ^－１を固有対計算処理をサポートするように構成されている１または複数のニューラルコア１３２のＲＰＵ配列１３４のうちの１または複数に記憶する。その後、固有対判定制御処理１４２は、行列Ａの１または複数の固有対を計算するために、必要に応じて、例えば、べき乗反復処理、逆べき乗反復処理、もしくは行列デフレーション処理、またはその組み合わせ等を含む数値反復処理を実行する。固有対計算方法の例示的な実施形態の詳細については、以下でさらに詳細に説明する。

【0030】

図２は、本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを提供するために、図１のシステムに実装され得るＲＰＵコンピューティングシステムを概略的に図示する。例えば、図２は、図１のニューロモーフィックコンピューティングシステム１３０のニューラルコア１３２および関連するＲＰＵ配列１３４の例示的な実施形態を概略的に示す。より詳細には、図２は、複数の行Ｒ１，Ｒ２，Ｒ３，．．．，Ｒｍ、および複数の列Ｃ１，Ｃ２，Ｃ３，．．．，Ｃｎに配置されたＲＰＵセル２１０の２次元（２Ｄ）クロスバー配列を備えるＲＰＵシステム２００（例えば、ニューロモーフィックコンピューティングシステム）を概略的に示している。各行Ｒ１，Ｒ２，Ｒ３，．．．，ＲｍのＲＰＵセル２１０は、それぞれの行制御線ＲＬ１，ＲＬ２，ＲＬ３，．．．，ＲＬｍ（まとめて、行制御線ＲＬ）に共通接続される。各列Ｃ１，Ｃ２，Ｃ３，．．．，ＣｎのＲＰＵセル２１０は、それぞれの列制御線ＣＬ１，ＣＬ２，ＣＬ３，．．．，ＣＬｎ（まとめて列制御線ＣＬ）と共通に接続されている。各ＲＰＵセル２１０は、行制御線および列制御線のそれぞれの１つのクロスポイント（または交差点）において（およびその間に）接続されている。例示的な実施形態では、行の数（ｍ）および列の数（ｎ）は同じである（すなわち、ｎ＝ｍ）。例えば、いくつかの実施形態では、コンピューティングシステム２００は、ＲＰＵセル２１０の４，０９６×４，０９６の配列を備える。

【0031】

コンピューティングシステム２００は、行制御線ＲＬ１，ＲＬ２，ＲＬ３，...，ＲＬｍに接続された周辺回路２２０と、列制御線ＣＬ１，ＣＬ２，ＣＬ３，...，ＣＬｎに接続された周辺回路２３０とをさらに備えている。さらに、周辺回路２２０は、データ入力／出力（Ｉ／Ｏ）インターフェースブロック２２５に接続され、周辺回路２３０は、データＩ／Ｏインターフェースブロック２３５に接続される。コンピューティングシステム２００は、コンピューティングシステム２００の周辺回路２２０および２３０の動作のための電力分配および制御信号およびクロッキング信号を提供するための電力、クロック、バイアスおよびタイミング回路などの様々な種類の回路ブロックを備える制御信号回路２４０をさらに備える。

【0032】

いくつかの実施形態では、コンピューティングシステム２００の各ＲＰＵセル２１０は、調整可能なコンダクタンス値を有する抵抗素子を含む。動作中、コンピューティングシステム２００のＲＰＵセル２１０の一部または全部は、ＲＰＵセル２１０の配列に記憶されている、受信した所定の行列Ａまたは近似逆行列Ａ^－１のそれぞれの数値行列値にマッピングされるそれぞれのコンダクタンス値を含む。いくつかの実施形態では、ＲＰＵセル２１０の抵抗素子は、抵抗スイッチングデバイス（界面またはフィラメントスイッチングデバイス）、ＲｅＲＡＭ、メモリスタデバイス、相変化メモリ（ＰＣＭ）デバイスなど）およびＲＰＵセル２１０の重量を調整するために複数の異なるコンダクタンスレベルの範囲内でプログラム的に調整できる、可変コンダクタンス（または可変抵抗レベル）を有する他の種類のデバイスなどの抵抗素子を用いて実装される。いくつかの実施形態では、ＲＰＵセル２１０の可変コンダクタンス素子は、強誘電体電界効果トランジスタデバイスなどの強誘電体デバイスを使用して実装することができる。さらに、いくつかの実施形態では、ＲＰＵセル２１０は、各ＲＰＵセル２１０がキャパシタおよび読み出しトランジスタを備えるアナログＣＭＯＳベースのフレームワークを使用して実装することができる。アナログＣＭＯＳベースのフレームワークでは、キャパシタは、ＲＰＵセル２１０のメモリ素子として機能し、キャパシタ電圧の形態で重み値を記憶し、キャパシタ電圧は、キャパシタ電圧のレベルに基づいて読み出しトランジスタのチャネル抵抗を変調するために読み出しトランジスタのゲート端子に印加され、読み出しトランジスタのチャネル抵抗は、ＲＰＵセルのコンダクタンスを表し、チャネル抵抗に基づいて発生する読み込み電流のレベルと相関する。

【0033】

行制御線ＲＬおよび列制御線ＣＬはそれぞれ、図示を容易にするために図２に単一の線として示されているが、各行および列制御線は、実装およびＲＰＵセル２１０の特定のアーキテクチャに応じて、それぞれの行および列のＲＰＵセル２１０に接続された２以上の制御線を含み得ることが理解されよう。例えば、いくつかの実施形態では、各行制御線ＲＬは、所定のＲＰＵセル２１０に対するワード線の相補的な対を含むことができる。さらに、各列制御線ＣＬは、例えば、１または複数のソース線（ＳＬ）および１または複数のビット線（ＢＬ）を含む複数の制御線を備える場合がある。

【0034】

周辺回路２２０および２３０は、ＲＰＵセル２１０の２Ｄ配列におけるそれぞれの行および列に接続され、本開示の例示的な実施形態に従って、所定の行列Ａの固有対のハードウェアアクセラレーションコンピューティングを提供するために、ベクトル－行列乗算関数、行列－ベクトル乗算関数および外積更新演算などの様々なアナログ、インメモリ計算操作を実行するように構成された様々な回路ブロックを備える。例えば、いくつかの実施形態では、ＲＰＵセルの読み取り／感知動作（例えば、所定のＲＰＵセル２１０の重み値を読み取る）をサポートするために、周辺回路２２０および２３０は、パルス幅変調（ＰＷＭ）回路および読み取りパルス駆動回路を備え、これらは、異なる動作中に受け取ったデジタル入力ベクトル値（読み取り入力値）に応じてＰＷＭ読み取りパルスを生成してＲＰＵセル２１０に加えるよう構成される。より具体的には、いくつかの実施形態では、周辺回路２２０および２３０は、（行または列に適用される）デジタル入力ベクトルを受け取り、デジタル入力ベクトルの要素を、パルス幅が変化する入力電圧によって表されるアナログ入力ベクトル値に変換するように構成されるデジタル－アナログ（Ｄ／Ａ）変換回路を備える。いくつかの実施形態では、入力ベクトルが、調整可能な持続時間（例えば、パルス持続時間は１ｎｓの倍数であり、入力ベクトルの値に比例する）を有する固定振幅Ｖｉｎ＝１Ｖパルスによって表されるときに、時間符号化方式が使用される。行（または列）に印加される入力電圧は、出力電流によって表される出力ベクトル値を生成し、ＲＰＵセル２１０の記憶された重み／値は、出力電流を測定することによって実質的に読み出される。

【0035】

周辺回路２２０および２３０は、接続されたＲＰＵセル２１０から出力され蓄積される読み出し電流（Ｉ_ＲＥＡＤ）を積分し、積分された電流をその後の計算のためにデジタル値（読み出し出力値）に変換する電流積分回路およびアナログ／デジタル（Ａ／Ｄ）変換回路をさらに備える。具体的には、ＲＰＵセル２１０で発生した電流を列（または行）単位で合計し、その合計した電流を周辺回路２２０、２３０の電流読み出し回路で測定時間ｔｍｅａｓにわたって積分する。電流読み出し回路は、電流積分器とアナログ／デジタル（Ａ／Ｄ）変換器とを備える。いくつかの実施形態では、各電流積分器は、キャパシタ上の所定の列（または行）からの電流出力（または負および正の重みを実装するＲＰＵセルの組からの差分電流）を積分するオペアンプを備え、アナログ／デジタル（Ａ／Ｄ）変換器は、統合電流（例えば、アナログ値）をデジタル値に変換する。

【0036】

データＩ／Ｏインターフェース２２５および２３５は、デジタル処理コアとインターフェースするように構成されており、デジタル処理コアは、ＲＰＵシステム２００（例えば、ニューラルコア）への入力／出力を処理し、異なるＲＰＵ配列間でデータをルーティングするように構成されている。データＩ／Ｏインターフェース２２５および２３５は、（ｉ）デジタル処理コアから外部制御信号およびデータを受け取り、受け取った制御信号およびデータを周辺回路２２０および２３０に提供し、（ｉｉ）周辺回路２２０および２３０からデジタル読み取り出力値を受け取り、デジタル読み取り出力値を処理のためにデジタル処理コアに送るように構成される。

【0037】

図３、４Ａ、および４Ｂは、本開示の例示的な実施形態による、固有対計算処理を実行するための方法を示す図である。特に、図３は、いくつかの実施形態において、図１のコンピューティングシステム１００によって実装される、固有対を計算するためのハイレベルの処理フローを図示する。所定のアプリケーションのランタイム実行中、アプリケーションは、例えば、所定の行列Ａの固有分解を必要とするいくつかの計算を実行する必要がある場合がある。コンピューティングシステム１００は、所定のアプリケーションから、所定の行列Ａの１または複数の固有対を判定する要求を受け取る（ブロック３００）。要求は、行列Ａの値を含むことになる。いくつかの実施形態では、行列Ａは、対称行列、例えば、ｎ行およびｎ列を有するｎ×ｎ行列を含み、ｎは比較的大きく（例えば、１００以上）することができる。いくつかの実施形態において、対称行列Ａは、ＳＰＤ行列を備える。コンピューティングシステム１００は、所定の行列Ａの固有対を計算するために、固有対計算処理（例えば、図１の処理１４０）を呼び出す。

【0038】

いくつかの実施形態では、固有対計算処理の呼び出しは、固有対計算処理を実行するために必要となるハードウェアアクセラレーションコンピューティング動作を実行するためにニューロモーフィックコンピューティングシステム１３０（例えば、ＲＰＵシステム）を構成する初期処理を備える（ブロック３０１）。例えば、いくつかの実施形態では、デジタル信号処理システム１２０は、ニューロモーフィックコンピューティングシステム１３０のプログラミングインターフェースと通信して、１または複数のニューロンおよびニューロモーフィックコンピューティングシステム１３０のルーティングシステムを構成し、以下でより詳しく議論するように、（ｉ）所定の行列Ａまたは推定された逆行列Ａ^－１の行列値を記憶するための１または複数の相互接続ＲＰＵ配列を実装し、（ｉｉ）記憶された行列Ａまたは推定された逆行列Ａ^－１を使用して、インメモリ計算（行列－ベクトル計算、外積計算など）を実行する１または複数のニューラルコアを割り当ておよび構成する。

【0039】

いくつかの実施形態では、割り当てられ相互接続されるＲＰＵ配列の数は、行列ＡのサイズおよびＲＰＵ配列のサイズに依存して変化する。例えば、各ＲＰＵ配列が４０９６×４０９６のサイズを有する場合、１つのＲＰＵ配列は、所定のｎ×ｎ行列Ａ、または所定の行列Ａの推定された逆行列Ａ^－１（ｎは４０９６以下）の値を記憶するように構成され得る。いくつかの実施形態では、所定のｎ×ｎ行列Ａが、ｎ×ｎ行列Ａが記憶される物理的ＲＰＵよりも小さいとき、任意の未使用ＲＰＵセルがゼロに設定され得る、もしくはＲＰＵ配列への未使用入力が「ゼロ」電圧によってパディングされ得る、またはその両方である。いくつかの実施形態では、所定のｎ×ｎ行列Ａのサイズが単一のＲＰＵ配列のサイズよりも大きい場合、複数のＲＰＵ配列を動作的に相互接続して、所定のｎ×ｎ行列Ａの値、または所定のｎ×ｎ行列Ａの推定された逆行列Ａ^－１を記憶するのに十分に大きいＲＰＵ配列を形成できる。

【0040】

次に、所定の行列Ａの逆行列Ａ^－１が固有対計算処理に必要であるか否かの判定が行われる（ブロック３０２）。例えば、上述したように、所定の行列Ａの支配的固有対を判定するために固有対計算処理（例えば、べき乗反復処理）を行う場合、所定の行列Ａを用いて固有対計算処理を行うことになる。一方、所定の行列Ａの最小の固有対を判定するために固有対計算処理（例えば、逆べき乗反復処理）を行う場合、固有対計算処理は、所定の行列Ａの逆行列Ａ^－１を使用して行われることが好ましい。したがって、所定の行列Ａの逆行列Ａ^－１が固有対計算処理に必要でないと判定された場合（ブロック３０２における否定的判定）、デジタル信号処理システム１２０は、ニューロモーフィックコンピューティングシステム１３０との通信に進み、構成されたニューラルコアの割り当てられたＲＰＵ配列に所定の行列Ａを記憶することになる（ブロック３０３）。

【0041】

一方、所定の行列Ａの逆行列Ａ^－１が固有対計算処理に必要であると判定された場合（ブロック３０２の肯定的判定）、いくつかの実施形態では、デジタル信号処理システム１２０は、所定の行列Ａの近似逆行列Ａ^－１を判定するために行列反転処理を進め（ブロック３０４）、近似逆行列Ａ^－１を構成済みニューラルコアの割当てＲＰＵ配列に記憶することになる（ブロック３０３）。上述のように、近似逆行列Ａ^－１は、行列反転処理１４４（図１）の動作によって判定される。いくつかの実施形態では、行列反転処理１４４は、逆行列Ａ^－１を推定するために、デジタル領域でノイマン級数反転処理を実行する。いくつかの実施形態では、行列反転処理１４４は、米国特許出願第１７／１３４，８１４号に開示されているようなハードウェアアクセラレーション行列反転コンピューティング技術を利用する。

【0042】

行列Ａまたは推定された逆行列Ａ^－１がＲＰＵ配列に記憶されると、記憶された行列の固有対を計算するために固有対計算処理が実行され（ブロック３０５）、固有対計算処理は、ＲＰＵシステムを利用して、例えば、固有ベクトルを計算する行列－ベクトル計算、および記憶された行列の値を更新する外積計算などの記憶された行列に対する種々のハードウェア計算を行うことを含む。いくつかの実施形態において、固有対計算処理（ブロック３０５）は、図４Ａ、４Ｂ、５Ａ、５Ｂ、６Ａ、６Ｂ、および７と関連して以下でさらに詳細に議論されるような例示的な処理フローおよび計算を使用して実装される。固有対計算処理が完了すると、コンピューティングシステムは、判定された固有対を要求アプリケーションに返す（ブロック３０６）。

【0043】

ここで、図４Ａおよび４Ｂを参照し、本開示の例示的な実施形態による、行列の固有対を計算するためにべき乗反復処理および行列デフレーション処理が利用される、例示的な固有対計算処理を示すものである。特に、図４Ａは、所定の行列Ａの支配的固有対を計算するためのべき乗反復処理を示し、図４Ｂは、図４Ａのべき乗反復処理と併せて利用され、デフレーション行列を計算して、デフレーション行列の支配的固有対の計算を可能にする行列デフレーション処理を示す。説明のために、図４Ａおよび４Ｂの処理フローは、ＲＰＵ配列に記憶された逆行列Ａ^１に適用される逆べき乗反復処理とは対照的に、所定の行列ＡがＲＰＵ配列に記憶されている状況下でべき乗反復処理を実行するという文脈で議論されるであろう。

【0044】

【0045】

次に、初期列ベクトルｘ^(０)がＲＰＵシステムに入力され（ブロック４０１）、支配的固有値に対応する支配的固有ベクトルを推定するための反復固有ベクトル計算処理が実行される。最初の反復では、ＲＰＵシステムは、行列－ベクトル乗算演算の積として（ｎ×１列ベクトルである）結果ベクトルを生成するために、初期ベクトルｘ^(０)とＲＰＵ配列に記憶された行列Ａを掛け合わせることによってアナログ行列－ベクトル乗算処理を実行する（ブロック４０２）。特に、ｊ番目の反復では、（ブロック４０２の）行列－ベクトル演算は、以下のように計算される：ｘ^(ｊ＋１)＝Ａｘ^(ｊ)。初期の反復について、反復インデックスｊは、ゼロに等しく設定される（すなわち、ｊ＝０）ように、初期の反復について、結果ベクトルｘ^(１)は、ｘ^(１)＝Ａｘ^(０)として計算される。ｊ番目の反復に続く、ｘ^(ｊ＋１)は支配的固有ベクトルｘ_１の近似値を表す。

【0046】

【0047】

次に、システムが支配的固有ベクトルへの収束をチェックすべきかどうかについての判定がなされる（ブロック４０４）。いくつかの実施形態では、判定は、以前の収束チェック操作に続いて実行されたべき乗反復処理の反復回数に基づいて行われる。例えば、いくつかの実施形態では、収束チェック操作は、べき乗反復処理のｐ回の反復ごとに実行することができ、ここでｐは、１、２、３、４、５等であってよい。いくつかの実施形態では、第１のｐ回の反復（例えば、ｐ＝５）に続いて初期の収束チェック操作が実行されてよく、収束チェック操作は、その後、収束基準が満たされるまで、べき乗反復処理の各反復の後に実行される。

【0048】

所定の反復に対して収束チェック操作を実行しないと判定された場合（ブロック４０４における否定的判定）、処理フローは、現在の正規化ベクトルをＲＰＵシステムに入力し（ブロック４０１）、現在の正規化ベクトルをＲＰＵ配列に記憶された行列Ａと乗算して行列－ベクトル乗算演算の積として結果の更新ベクトルを生成することによってアナログ行列－ベクトル乗算処理を行うことによって次の反復に続く（ブロック４０２）。例えば、結果ベクトルｘ^(１)が計算された初期の反復（ｊ＝０）に続いて、次の反復（ｊ＝ｊ＋１＝１）には、行列－ベクトル演算ｘ^(ｊ＋１)＝Ａｘ^(ｊ)を含み（ブロック４０２）、ｘ^(２)を以下のように計算する：ｘ^(２)＝Ａｘ^(１)。結果ベクトルｘ^(２)は、次にＲＰＵシステムから出力され、デジタル領域で正規化される（ブロック４０３）。再び、収束基準が満たされるまで、反復処理が継続される。

【0049】

【0050】

【0051】

判定された誤差値（ｅｒｒ）の値は、誤差が誤差閾値εを超えるかどうかを判定するために（ｅｒｒ≦εであるかどうかを判定するために）誤差閾値εと比較される。いくつかの実施形態では、誤差閾値εの１×１０^－４またはそれよりも小さい値オーダーの値に設定される。誤差閾値εは、アプリケーションに応じて任意の所望の値となるように選択することができる。例えば、誤差閾値εは、支配的固有ベクトルの現在の推定値が、実際の支配的固有ベクトルの小数点以下３桁、４桁、５桁、６桁まで正確であるような値に設定することができる。

【0052】

【0053】

【0054】

べき乗反復処理の最終ステップ（ブロック４０７および４０８）は、行列Ａの支配的固有対（λ_１，ｘ_１）の推定値をもたらす。行列Ａの他の固有対を判定する必要がない場合（ブロック４０９における否定的判定）、べき乗反復処理は終了し、行列Ａの支配的固有対（λ_１，ｘ_１）を要求元のアプリケーションに返すことができる（例えば、図３のブロック３０６）。一方、ｎ×ｎ行列Ａの１または複数の１つの付加的な固有対（例えば、（λ_２，ｘ_２），（λ_３，ｘ_３）,．．．,（λ_ｎ，ｘ_ｎ））が判定される場合（ブロック４０９の肯定的判定）、処理フローは、図４Ｂの、ブロック４１０に進む。上述のように、図４Ｂは、行列Ａの次の支配的固有対（例えば、（λ_２，ｘ_２）に対応する、デフレーション行列の支配的固有対の計算を可能にするデフレーション行列を計算するために、図４Ａのべき乗反復処理と組み合わせて利用される行列デフレーション処理を示している。

【0055】

【0056】

【0057】

【0058】

【0059】

図５Ａ、５Ｂ、６Ａおよび６Ｂは、ブロック４０１および４０２（図４Ａ）ならびにブロック４１２および４１３（図４Ｂ）の処理を実施するために、ＲＰＵセルの配列に記憶された行列を使用してＲＰＵシステムによって実行されるアナログ行列－ベクトル乗算および外積（更新）計算を概略的に示す図である。より具体的には、図５Ａは、本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを実装するために、ＲＰＵセルの配列を含むＲＰＵコンピューティングシステムによってアナログ行列－ベクトル乗算演算を行うための方法を概略的に示すものである。いくつかの実施形態において、図５Ａは、図２のコンピューティングシステム２００のＲＰＵセル２１０の配列上に記憶される行列の行列値に対して実行される行列－ベクトル乗算演算（例えば、Ａｘ^(ｊ)）を概略的に示す。ＲＰＵセル２１０のコンダクタンス値は、ＲＰＵセル２１０の配列に記憶されている行列（例えば、行列Ａ）のそれぞれの行列要素２１２にマッピングされ、ＲＰＵセル２１０に記憶されている行列要素２１２は、ＲＰＵセル２１０のそれぞれのコンダクタンス値により符号化される。

【0060】

【0061】

【0062】

【0063】

いくつかの実施形態では、増分更新処理のための第１および第２のベクトルＵおよびＶの積を判定するために、周辺回路２２０および２３０内の確率的トランスレータ回路が、入力ベクトルＵおよびＶを表す確率的ビットストリームを生成するのに利用され得る。ベクトルＵおよびＶのための確率的ビットストリームは、ＲＰＵセル２１０の２Ｄクロスバー配列の行および列に適用され、所定のＲＰＵセル２１０のコンダクタンス値（したがって、対応する行列値）は、所定のＲＰＵセル２１０に入力されるＵおよびＶ確率的パルスストリームの一致に依存して変化するだろう。更新演算のためのベクトルクロス積演算は、実数を表す確率的ストリームの一致検出（ＡＮＤ論理ゲート演算を使用）が乗算演算と同等であるという既知の概念に基づいて実施される。

【0064】

図６Ａは、本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを実施するための行列－ベクトル演算を実行するためのＲＰＵセルの配列を含むＲＰＵコンピューティングシステムを構成するための方法を概略的に示すものである。特に、図６Ａは、ＲＰＵセル６０５のクロスバー配列（またはＲＰＵ配列６０５）を含むＲＰＵ計算システム６００を概略的に示しており、ＲＰＵ配列６０５の各ＲＰＵセル６１０が、各行（Ｒ１，Ｒ２，．．．，Ｒｎ）および列（Ｃ１，Ｃ２，．．．，Ｃｎ）の交差部にアナログ不揮発性抵抗素子（調整可能コンダクタンスＧを有する可変抵抗器として表現）を含む。図６Ａに描写されるように、ＲＰＵセル６０５の配列は、それぞれのＲＰＵセル６１０のコンダクタンス値Ｇｉｊ（ここで、ｉは行インデックス、ｊは列インデックスを表す）によって符号化される行列Ａまたは推定された逆行列Ａ^－１の行列値にマッピングされたコンダクタンス値Ｇｉｊの行列を提供する。例示的な実施形態では、行列Ａは、ＲＰＵ配列６０５に記憶され、ＲＰＵセルのｉ番目の行は行列Ａのｉ番目の行を表し、ＲＰＵセルのｊ番目の列は行列Ａのｊ番目の列を表す。

【0065】

べき乗反復処理のための行列－ベクトル乗算処理を実行するために（例えば、図４Ａのブロック４０２）、コンピューティングシステム６００の周辺回路内のマルチプレクサは、列線ドライバ回路６２０を列線Ｃ１，Ｃ２，．．．，Ｃｎに選択的に接続するように起動される。列線ドライバ回路６２０は、それぞれの列線Ｃ１，Ｃ２，．．．，Ｃｎに接続される複数のデジタル－アナログ（ＤＡＣ）回路ブロック６２２－１，６２２－２，．．．，６２２－ｎ（集合的にＤＡＣ回路ブロック６２２）を含む。さらに、コンピューティングシステム６００の周辺回路のマルチプレクサは、読み出し回路６３０を行線Ｒ１，Ｒ２，．．．，Ｒｎに選択的に接続するように起動される。読み出し回路６３０は、それぞれの行線Ｒ１，Ｒ２，．．．，Ｒｎに接続される複数の読み出し回路ブロック６３０－１，６３０－２，．．．，６３０－ｎを含む。読み出し回路ブロック６３０－１，６３０－２，．．．，６３０－ｎは、それぞれの電流積分回路６３２－１，６３２－２，．．．，６３２－ｎと、それぞれのアナログ－デジタル（ＡＤＣ）回路６３４－１，６３４－２，．．．，６３４－ｎを含む。電流積分回路は、電流積分回路ブロックを含み、各電流積分器は、負の容量性フィードバックを有するオペレーショナルトランスコンダクタンス増幅器（ＯＴＡ）を含み、入力電流（集合列電流）を電流積分回路の出力ノード上の出力電圧に変換し、積分期間の終了時に、各ＡＤＣ回路は、それぞれの電流積分回路の出力ノードで生成された出力電圧をラッチし、出力電圧を量子化してデジタル出力信号を生成する。

【0066】

【0067】

より具体的には、いくつかの実施形態では、ＤＡＣ回路ブロック６２２－１，６２２－２，．．．，６２２－ｎは、入力ベクトルが調整可能な持続時間を有する固定振幅パルス（例えば、Ｖ＝１Ｖ）によって表される時間符号化方式を用いてデジタル－アナログ変換処理を実行するように構成され、パルス持続時間は予め規定された時間周期（例えば、１ナノ秒）の倍数であって、入力ベクトルの値に比例する。例えば、所定のデジタル入力値０．５は４ｎｓの電圧パルスで表すことができ、デジタル入力値１は８０ｎｓの電圧パルスで表すことができる（例えば、デジタル入力値１は、積分時間Ｔ_ｍｅａｓに等しいパルス持続時間を有するアナログ電圧パルスに符号化することができる）。図６Ａに示すように、結果アナログ入力電圧Ｖ_１，Ｖ_２，．．．，Ｖ_ｎ（例えば、読み出しパルス）は、列線Ｃ１，Ｃ２，．．．，Ｃｎを介してＲＰＵセル６０５の配列に適用される。

【0068】

【0069】

【0070】

図６Ａの例示的な実施形態は、（ｉ）ＲＰＵセルのｉ番目の行が行列Ａのｉ番目の行を表し、ＲＰＵセルのｊ番目の列が行列Ａのｊ番目の列を表すように行列ＡがＲＰＵ配列６０５に記憶され、（ｉｉ）列にはベクトルｘが入力され、（ｉｉｉ）列の出力には結果ベクトルが生成される、行列－ベクトル乗算演算（Ａｘ）を行う処理を概略的に示している。他の実施形態では、同じ行列－ベクトル乗算演算（Ａｘ）は、（ｉ）行列Ａのｉ番目の行が転置行列Ａ^Ｔのｊ番目の列としてＲＰＵ配列６０５に記憶されるように行列Ａの転置行列Ａ^ＴをＲＰＵ配列６０５に記憶し、（ｉｉ）入力ベクトルｘを行に適用し、（ｉｉｉ）結果ベクトルを列の出力で読み取ることによって実行できる。

【0071】

図６Ｂは、本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを実施するためのアナログ外積演算を実行するために、ＲＰＵセルの配列を含むＲＰＵコンピューティングシステムを構成するための方法を概略的に示している。より具体的には、図６Ｂは、ベクトル－ベクトル外積更新演算（例えば、図４Ｂのブロック４１０～４１３）を実行し、ＲＰＵ配列６０５に記憶されるデフレーション行列を生成するためにＲＰＵコンピューティングシステム６００を構成するための方法を概略的に示す。図６Ｂは、コンピューティングシステム６００の周辺回路内のマルチプレクサが、行線ドライバ回路６４０を行線Ｒ１，Ｒ２，．．．，Ｒｎに選択的に接続するために起動される、ＲＰＵ演算システム６００の構成を概略的に示す図である。行線ドライバ回路６４０は、それぞれの行線Ｒ１，Ｒ２，．．．，Ｒｎに接続される複数のＤＡＣ回路ブロック６４２－１，６４２－２，．．．，６４２－ｎ（総称してＤＡＣ回路ブロック６４２）を含む。さらに図６Ｂに示すように、更新動作のために、ＤＡＣ回路ブロック６２２－１，６２２－２，．．．，６２２－ｎは、それぞれの列線Ｃ１，Ｃ２，．．．，Ｃｎに接続される。ＤＡＣ回路ブロック６４２は、上述したＤＡＣ回路ブロック６２２と同様の機能を果たす。

【0072】

【0073】

【0074】

外積更新処理は、ベクトルＵおよびＶを表す電圧パルスを行および列に同時に印加して、各クロスポイント（ＲＰＵセル６１０）でローカル乗算演算および増分重み更新を行い、それによってＲＰＵ配列６０５にデフレーション行列を生成することによってＲＰＵ配列６０５上で行われる。ここでも、アナログ電圧パルス（例えば、確率パルス）を生成し、アナログ領域でベクトル－ベクトル外積更新処理を実施するために、当業者に知られている様々な方法を使用することができる。

【0075】

図６Ａは、アナログ領域で実行される行列－ベクトル乗算演算のための集約された行電流を生成するための例示的な方法を概略的に示しているが、「符号付き行列値」を可能にする差分電流技術を使用して集約された電流を生成するための他の技術を実装することができる。例えば、図７は、本開示の例示的な実施形態による、符号付き行列値を使用して固有対計算処理の行列－ベクトル演算を実行するためにＲＰＵセルの複数の配列を含むＲＰＵコンピューティングシステムを構成するための方法を概略的に示している。特に、図７は、２つの別個のＲＰＵ配列６１０および７１０の対応する列Ｃ１^＋およびＣｌ^－からの異なる列電流Ｉ_１ ^＋およびＩ_１ ^－を使用して集約された列電流Ｉ_ＣＯＬ１を生成するための方法を概略的に示し、ここでコンダクタンスは（Ｇ^＋－Ｇ^－）として判定される。例示の目的で、図７は、上述のような行列－ベクトル演算Ａｘを実行するためのスキームを示し、転置行列Ａ^ＴがＲＰＵ配列に記憶されていると仮定し、入力ベクトルｘをＲＰＵ配列の行に適用し、結果ベクトルを列から出力させる。図７は、読み出し回路ブロック６３０－１に入力される列電流Ｉ_ＣＯＬ１をＩ_ＣＯＬ１＝Ｉ_１ ^＋－Ｉ_１ ^－として判定される差分読み出し方式を概略的に示している。この差分方式では、Ｉ_ＣＯＬ１の大きさが所定の行列値に対応し、行列値の符号は、Ｉ_１がＩ_１ ^－より大きいか、等しいか、小さいかどうかに依存する。正の符号（Ｉ_ＣＯＬ１＞０）は、Ｉ_１＞Ｉ_１ ^－のときに得られる。ゼロ値（Ｉ_ＣＯＬ１＝０）は、Ｉ_１＝Ｉ_１ ^－のときに得られる。負の符号（Ｉ_ＣＯＬ１＜０）は、Ｉ_１＜Ｉ_１ ^－のときに得られる。

【0076】

より具体的には、図７の例示的な実施形態では、図６Ａのコンピューティングシステム６００の各ＲＰＵセル６１０は、それぞれのコンダクタンス値Ｇ_ｉｊ ^＋およびＧ_ｉｊ ^－を有する２つの単位ＲＰＵセル６１０－１および６１０－２を含み、所定のＲＰＵセル６１０のコンダクタンス値はそれぞれのコンダクタンス値の差、すなわちＧ_ｉｊ＝Ｇ_ｉｊ ^＋－Ｇ_ｉｊ ^－として判定され、ｉおよびｊはＲＰＵ配列６０５内のインデックスとなる。このように、負および正の重みは、正のみのコンダクタンス値を用いて容易に符号化することができる。言い換えれば、ＲＰＵセルの抵抗デバイスのコンダクタンス値は正のみであることができるので、図７の差分方式は、正（Ｇ_ｉｊ ^＋）と負（Ｇ_ｉｊ ^－）の行列値を符号化するために、一対の同一のＲＰＵデバイス配列を実装しており、所定のＲＰＵセルの行列値（Ｇ_ｉｊ）は、一対のＲＰＵ配列６１０および７１０の同一位置に位置する２つの対応デバイス（Ｇ_ｉｊ ^＋－Ｇ_ｉｊ ^－）に記憶される２つのコンダクタンス値の差分に比例する（ここで、２つのＲＰＵ配列６１０および７１０はチップのバックエンドのメタライゼーション構造において互いに積層することができる）。この例では、単一のＲＰＵタイルは、３つのサイクルすべてにおける配列の並列動作をサポートする周辺回路を有するＲＰＵ配列の対とみなされる。

【0077】

図７に示すように、正負の逆行列値を符号化するために使用される同一のＲＰＵ配列６１０および７１０の対応する行のＲＰＵセル６１０－１および６１０－２に、正の電圧パルス（Ｖ_１，Ｖ_２，．．．，Ｖ_ｎ）と対応する負の電圧パルス（－Ｖ_１,－Ｖ_２，．．．，－Ｖ_ｎ）が個別に供給される。それぞれのＲＰＵ配列６１０および７１０の対応する第１の列Ｃ１^＋およびＣ１^－から出力される集約された列電流Ｉ_１ ^＋およびＩ_１ ^－は合成されて差分集約電流Ｉ_ＣＯＬ１を生成し、対応する第１の列Ｃ１^＋およびＣ１^－に接続されている読み出し回路ブロック６３０－１に入力される。

【0078】

【0079】

所定の計算のために行列Ａとその転置（例えば、Ａ^Ｔ）の両方が必要とされる他の固有分解演算または線形システム計算が、本明細書で論じるようなハードウェアアクセラレーション方法を用いて容易に実装されることをさらに理解されたい。例えば、上述したように、所定の行列ＡがＲＰＵセルの配列に記憶されていると仮定すると、ベクトルｘをＲＰＵ配列の列線に適用し、結果出力ベクトルをＲＰＵ配列の行線から読み出すことによって、行列－ベクトル演算Ａｘを実行することができる。同時に、ＲＰＵ配列に記憶された行列Ａを用い、ＲＰＵ配列の行線にベクトルｘを適用し、ＲＰＵ配列の列線から出力ベクトルを読み出すことにより、行列－ベクトル演算Ａ^Ｔｘを実行することができる。この点で、行列Ａとその転置行列Ａ^Ｔを異なるＲＰＵ配列に記憶する必要はない。

【0080】

他の実施形態では、所定の対称行列Ａの特異値σ_１，σ_２，．．．，σ_ｎを判定するために、例えば図４Ａおよび４Ｂと関連して上記に示され説明されたものと同じまたは類似の処理フローが使用され、特異値分解（ＳＶＤ）処理を実行する。一般に、所定の行列ＡのＳＶＤを計算するための処理は、ＡＡ^ＴおよびＡ^ＴＡの固有値および固有ベクトルを判定することを含む。所定の行列Ａが対称なｎ×ｎ行列（ただし、ＳＰＤ行列ではない）であると仮定すると、特異値σ_１，σ_２，．．．，σ_ｎは、行列ＡＡ^Ｔまたは行列Ａ^ＴＡの固有値の平方根を計算することによって判定される。一方、所定の行列ＡがＳＰＤ行列である場合、特異値σ_１，σ_２，．．．，σ_ｎは、行列ＡＡ^Ｔまたは行列Ａ^ＴＡの固有値に等しい。

【0081】

【0082】

他の実施形態では、所定の対称ｎ×ｎ行列Ａに対するＳＶＤ処理は、ｎ×ｎ行列Ｂ＝ＡＡ^ＴまたはＢ＝Ａ^ＴＡの固有値λ_１,λ_２,．．．,λ_ｎを判定するために、行列ＡをＲＰＵ配列に記憶し、次に、図４Ａおよび４Ｂの処理フローの修正版を含む反復処理を実行することによって行われる。かかる実施形態は、ＲＰＵ配列が当然、行列Ａだけでなくその転置Ａ^Ｔも記憶するという事実に基づいている。例えば、図６Ａの例示的な実施形態を参照すると、ＲＰＵ配列６０５がｎ×ｎ行列Ａを記憶し、ここでＲＰＵ配列６０５の行Ｒ１，Ｒ２，．．．，Ｒｎがｎ×ｎ行列Ａの行を表しており、ＲＰＵ配列６０５の列Ｃ１，Ｃ２，．．．，Ｃｎがｎ×ｎ行列Ａの列を表しているとする。同時に、ＲＰＵ配列６０５の列を行として見る観点と、ＲＰＵ配列６０５の行を列として見る観点とから、ＲＰＵ配列６０５の列は行列Ａの転置（Ａ^Ｔ）の行を表し、ＲＰＵ配列６０５の行は行列Ａの転置（Ａ^Ｔ）の列を表していることが分かる。すなわち、ＲＰＵ配列６０５に記憶されたｎ×ｎ行列Ａのｉ番目の行は、実質的にＲＰＵ配列６０５に記憶された行列Ａのｎ×ｎ転置行列（Ａ^Ｔ）のｉ番目の列となることが分かる。

【0083】

以上のことから、ＲＰＵ配列に記憶されている対称ｎ×ｎ行列ＡのＳＶＤを計算する例示的な処理は、例えばＡＡ^Ｔの固有値を計算する反復処理に基づいており、例示的な処理は、図４Ａのブロック４０１、４０２、４０３の処理フローの変形を使用して、ＡＡ^Ｔｘ^(ｊ)＝Ａ（Ａ^Ｔｘ^(ｊ)）＝Ａｙ^(ｊ)＝ｘ^(ｊ＋１)（ｊ＝０，１，．．．）を計算することを含む。特に、ブロック４００において、初期ベクトルｘ^(０)（ｎ×１列ベクトル）は、上述したように生成される。次に、初期デジタルベクトルｘ^(０)は、ＲＰＵシステムに入力され、初期ベクトルｘ^(０)とＲＰＵ配列に記憶された行列Ａの転置Ａ^Ｔを乗算することによって、（ブロック４０２において）アナログ行列－ベクトル乗算処理（すなわち、Ａ^Ｔｘ^(０)＝ｙ^(０)）を実行し、結果ベクトルｙ^(０)を生成する。いくつかの実施形態では、行列－ベクトル乗算処理Ａ^Ｔｘ^(０)は、初期ベクトルｘ^(０)をＲＰＵ配列６０５（図６Ａ）の行に入力することによって実行され、この場合、行線への入力は、ＤＡＣ回路（例えば、図６ＢのＤＡＣ回路６４０）に選択的に接続され、結果ベクトルｙ^(０)がＲＰＵ配列の列から出力され、この場合、列線は読み出し回路（例えば、図６Ａの読み出し回路６３０）に選択的に接続され、結果デジタルベクトルｙ^(０)を生成して出力する。

【0084】

次に、結果ベクトルｙ^(０)は、ＲＰＵ配列６０５に再入力され、アナログ行列－ベクトル乗算処理Ａｙ^(０)を実行し、それによってＡｙ^(０)＝ｘ^(１)を計算することになる。この処理では、ベクトルｙ^(０)は、ＲＰＵ配列６０５の列に入力され、この場合、列線への入力は、ＤＡＣ回路（例えば、図６ＡのＤＡＣ回路６２０）に選択的に接続され、その結果、ベクトルｘ^(１)は、ＲＰＵ配列６０５の行から出力され、その場合、行線は、読み出し回路（例えば、図６Ａの読み出し回路６３０）に選択的に接続され、結果デジタルベクトルｘ^(１)を生成して出力するだろう。

【0085】

結果デジタルベクトルｘ^(１)は、次に、デジタルコンピューティングシステムに出力され、正規化されるであろう（例えば、図４Ａのブロック４０３）。次に、正規化されたベクトルｘ^(１)は、ＲＰＵシステムに再入力され、上述したように２つの行列乗算演算を実行することによって（次の反復のために、ｊ＝１）ＡＡ^Ｔｘ^(１)＝Ａ（Ａ^Ｔｘ^(１)）＝Ａｙ^(１)＝ｘ^(２)を計算することになるであろう。図４Ａおよび図４Ｂの処理フローと同様に、反復処理は、収束基準が満たされるまで（例えば、図４Ａのブロック４０６）継続し、この場合、ｊ番目のの反復に続いて、ベクトルｘ^(ｊ＋１)は、行列Ｂ＝ＡＡ^Ｔに対する支配的固有ベクトルｘ_１の近似値を表す。

【0086】

例示的なＳＶＤ処理については、固有ベクトルｘ_１,ｘ_２,．．．,ｘ_ｎおよびｎ×ｎ行列Ｂ＝ＡＡ^Ｔの対応する固有値λ_１,λ_２,．．．,λ_ｎ（図４Ａのブロック４０８を介して）の一部または全部を計算するために、図４Ａおよび図４Ｂの反復処理フロー（上述したようにブロック４０１、４０２、および４０３の変更を伴う）が実行され得る。行列Ｂの固有値λ_１,λ_２,．．．,λ_ｎの計算の後に、ＳＶＤ処理の特異値は、行列Ｂの計算された固有値λ_１,λ_２,．．．,λ_ｎに等しくなる（行列ＡがＳＰＤ行列であると仮定して）。それ以外の場合、デジタル領域では、ＳＶＤ処理の特異値は、ｎ×ｎ行列Ｂのそれぞれの固有値λ_１,λ_２,．．．,λ_ｎの平方根を取ることによって計算される。対称行列Ａについて、代替的な実施形態では、まずＡｘ^(ｊ)を計算するためにＲＰＵ配列の行にｘ^(ｊ)が入力され、Ａ^Ｔｙ^(ｊ)＝ｘ^(ｊ＋１)を計算するために結果ベクトルｙ^(ｊ)が列に入力される場合、図４Ａおよび４Ｂの処理フローがＢ＝Ａ^ＴＡの固有値を計算するために実行され得ることに留意されたい。

【0087】

本発明の例示的な実施形態は、任意の可能な技術詳細レベルで統合されたシステム、方法もしくはコンピュータプログラム製品またはそれらの組み合せとすることができる。コンピュータプログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を記憶したコンピュータ可読記憶媒体を含んでよい。

【0088】

コンピュータ可読記憶媒体は、命令実行装置によって使用される命令を保持し、記憶することができる有形の装置とすることができる。コンピュータ可読記憶媒体は、一例として、電子記憶装置、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置またはこれらの適切な組み合わせであってよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な一例としては、ポータブルコンピュータディスケット、ハードディスク、ＲＡＭ、ＲＯＭ、ＥＰＲＯＭ（またはフラッシュメモリ）、ＳＲＡＭ、ＣＤ－ＲＯＭ、ＤＶＤ、メモリスティック、フロッピーディスク、パンチカードまたは溝内の隆起構造などに命令を記録した機械的に符号化された装置、およびこれらの適切な組み合せが挙げられる。本明細書で使用されるコンピュータ可読記憶媒体は、電波もしくは他の自由に伝播する電磁波、導波管もしくは他の伝送媒体を介して伝播する電磁波（例えば、光ファイバケーブルを通過する光パルス）、またはワイヤを介して送信される電気信号のような、一過性の信号それ自体として解釈されるべきではない。

【0089】

本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング／処理装置に、または、ネットワーク（例えば、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、もしくはワイヤレスネットワークまたはその組み合わせ）を介して外部コンピュータまたは外部記憶装置にダウンロードすることができる。ネットワークは、銅線伝送ケーブル、光伝送ファイバー、無線伝送、ルーター、ファイアウォール、スイッチ、ゲートウェイコンピュータ、もしくはエッジサーバーまたはその組み合わせで構成される。各コンピューティング／処理装置のネットワークアダプタカードまたはネットワークインターフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、それぞれのコンピューティング／処理装置内のコンピュータ可読記憶媒体に格納するためにコンピュータ可読プログラム命令を転送する。

【0090】

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ（ＩＳＡ）命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、統合回路のための構成データ、またはＳｍａｌｌｔａｌｋ、Ｃ＋＋などのオブジェクト指向プログラミング言語と「Ｃ」プログラミング言語や類似のプログラミング言語などの手続き型プログラミング言語を含む、１つ以上のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかであってよい。コンピュータ可読プログラム命令は、スタンドアロンソフトウェアパッケージとして、完全にユーザのコンピュータ上で、または部分的にユーザのコンピュータ上で実行可能である。あるいは、部分的にユーザのコンピュータ上でかつ部分的にリモートコンピュータ上で、または完全にリモートコンピュータまたはサーバ上で実行可能である。後者のシナリオでは、リモートコンピュータは、ローカルエリアネットワーク（ＬＡＮ）またはワイドエリアネットワーク（ＷＡＮ）を含む任意のタイプのネットワークを介してユーザのコンピュータに接続され、または（例えば、インターネットサービスプロバイダーを使用したインターネット経由で）外部コンピュータに接続されてよい。いくつかの実施形態では、例えば、プログラマブルロジック回路、フィールドプログラマブルゲート配列（ＦＰＧＡ）、またはプログラマブルロジック配列（ＰＬＡ）を含む電子回路は、本発明の態様を実行するために、コンピュータ可読プログラム命令の状態情報を利用してパーソナライズすることにより、コンピュータ可読プログラム命令を実行することができる。

【0091】

本発明の態様は、本発明の実施形態による方法、装置（システム）、およびコンピュータプログラム製品のフローチャート図もしくはブロック図またはその両方を参照して本明細書に記載されている。フローチャート図もしくはブロック図またはその両方の各ブロック、およびフローチャート図もしくはブロック図またはその両方のブロックの組み合わせは、コンピュータ可読プログラム命令によって実装できることが理解されよう。

【0092】

これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令がフローチャートもしくはブロック図またはその両方の１つまたは複数のブロックで指定された機能／動作を実装するための手段を生成するように、機械を生成するためにコンピュータのプロセッサまたは他のプログラム可能なデータ処理装置に提供されることができる。これらのコンピュータ可読プログラム命令はまた、フローチャートもしくはブロック図またはその両方の１つまたは複数のブロックで指定された機能／行為の態様を実装する命令を含む生成品の１つを命令が記憶されたコンピュータ可読記憶媒体が構成するように、コンピュータ、プログラム可能なデータ処理装置、もしくは特定の方法で機能する他のデバイスまたはその組み合わせに接続可能なコンピュータ可読記憶媒体の中に記憶されることができる。

【0093】

コンピュータ、他のプログラム可能な装置、または他のデバイス上でフローチャートもしくはブロック図またはその両方の１つまたは複数のブロックで指定された機能／行為を実行する命令のように、コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラム可能なデータ処理装置、または他のデバイスにロードされ、コンピュータ、他のプログラム可能な装置、または他のデバイス上で一連の操作ステップを実行し、コンピュータ実装された過程を生成することができる。

【0094】

図中のフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータプログラム製品が実行可能な実装の構成、機能、および動作を示している。これに関して、フローチャートまたはブロック図の各ブロックは、モジュール、セグメント、または命令の一部を表してよく、これは、指定された論理機能を実装するための１つまたは複数の実行可能命令を構成する。いくつかの代替の実施形態では、ブロックに示されている機能は、図に示されている順序とは異なる場合がある。例えば、連続して示される２つのブロックは、実際には、１つのステップとして達成される場合があり、同時に、実質的に同時に、部分的または全体的に時間的に重複する方法で実行されるか、またはブロックは、関係する機能に応じて逆の順序で実行される場合がある。ブロック図もしくはフローチャート図またはその両方の各ブロック、およびブロック図もしくはフローチャート図またはその両方のブロックの組み合わせは、指定された機能または動作を実行する、または特別な目的のハードウェアとコンピュータ命令の組み合わせを実行する特別な目的のハードウェアベースのシステムによって実装できることにも留意されたい。

【0095】

これらの概念は、本開示の例示的な実施形態による、固有対計算処理を実行するように構成されるシステムをホストすることができるコンピューティングノードの例示的なアーキテクチャを概略的に示す、図８を参照して説明される。図８は、多数の他の汎用または特殊目的のコンピューティングシステム環境または構成で動作可能な、コンピュータシステム／サーバ８１２を備えるコンピューティングノード８００を図示する。コンピュータシステム／サーバ８１２と共に使用するのに適し得る周知のコンピューティングシステム、環境、もしくは構成、またはその組み合わせの例としては、パーソナルコンピュータシステム、サーバコンピュータシステム、シンクライアント、シッククライアント、ハンドヘルドまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースシステム、セットトップボックス、プログラム可能家電、ネットワークＰＣ、ミニコンピュータシステム、メインフレームコンピュータシステム、上記の任意のシステムまたはデバイスなどを含む分散クラウドコンピューティング環境などが挙げられるが、それらに限らない。

【0096】

コンピュータシステム／サーバ８１２は、プログラムモジュールなどのコンピュータシステム実行可能命令がコンピュータシステムによって実行されるという一般的な文脈で説明される場合がある。一般に、プログラムモジュールは、特定のタスクを実行する、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、論理、データ構造などを含むことができる。コンピュータシステム／サーバ８１２は、通信ネットワークを介してリンクされるリモート処理デバイスによってタスクが実行される分散型クラウドコンピューティング環境において実施され得る。分散型クラウドコンピューティング環境では、プログラムモジュールは、メモリ記憶装置を含むローカルおよびリモートコンピュータシステム記憶媒体の両方に配置され得る。

【0097】

図８において、コンピューティングノード８００のコンピュータシステム／サーバ８１２は、汎用コンピューティングデバイスの形態で示されている。コンピュータシステム／サーバ８１２の構成要素は、１または複数のプロセッサまたは処理ユニット８１６、システムメモリ８２８、およびシステムメモリ８２８を含む様々なシステム構成要素をプロセッサ８１６に結合するバス８１８を含むことができるが、これらに限定されるものではない。

【0098】

バス８１８は、メモリバスまたはメモリコントローラ、周辺機器バス、アクセラレーテッドグラフィックスポート、および様々なバスアーキテクチャのいずれかを使用するプロセッサまたはローカルバスを含む、いくつかのタイプのバス構造のうちのいずれか１つまたは複数を表す。例として、限定ではなく、そのようなアーキテクチャには、インダストリスタンダードアーキテクチャ（ＩＳＡ）バス、マイクロチャネルアーキテクチャ（ＭＣＡ）バス、拡張ＩＳＡ（ＥＩＳＡ）バス、ビデオエレクトロニクススタンダーズアソシエーション（ＶＥＳＡ）ローカルバスおよびペリフェラルコンポーネントインターコネクト（ＰＣＩ）バスがある。

【0099】

コンピュータシステム／サーバ８１２は、典型的には、様々なコンピュータシステム可読媒体を含む。かかる媒体は、コンピュータシステム／サーバ８１２によってアクセス可能な任意の利用可能な媒体であってもよく、揮発性媒体と不揮発性媒体、取り外し可能媒体と取り外し不可能媒体の両方が含まれる。

【0100】

システムメモリ８２８は、ランダムアクセスメモリ（ＲＡＭ）８３０もしくはキャッシュメモリ８３２またはその両方など、揮発性メモリとしてのコンピュータシステム可読媒体を含むことができる。コンピュータシステム／サーバ８１２はさらに、他の取り外し可能／取り外し不能コンピュータシステム可読媒体および揮発性／不揮発性コンピュータシステム可読媒体を含んでもよい。一例として、ストレージシステム８３４は、取り外し不能な不揮発性磁気媒体（不図示。一般に「ハードドライブ」と呼ばれる）への読み書きのために設けることができる。また、図示は省略するが、取り外し可能な不揮発性磁気ディスク（例えば、フロッピーディスク）への読み書きのための磁気ディスクドライブ、および取り外し可能な不揮発性光学ディスク（ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭや他の光学媒体など）への読み書きのための光学ディスクドライブを設けることができる。これらの例において、それぞれを、１つ以上のデータ媒体インタフェースによってバス８１８に接続することができる。以下でさらに図示および説明するように、メモリ８２８は、本発明の実施形態の機能を実行するように構成されたプログラムモジュールのセット（例えば、少なくとも１つ）を有する少なくとも１つのプログラム製品を含むことができる。

【0101】

一例として、プログラムモジュール８４２のセット（少なくとも１つ）を有するプログラム／ユーティリティ８４０は、オペレーティングシステム、１つ以上のアプリケーションプログラム、他のプログラムモジュール、およびプログラムデータと同様に、メモリ８２８に記憶することができる。オペレーティングシステム、１つ以上のアプリケーションプログラム、他のプログラムモジュール、およびプログラムデータ、またはそれらのいくつかの組み合わせの各々は、ネットワーク環境の実装形態を含むことができる。プログラムモジュール８４２は一般に、本明細書に記載の本開示の実施形態の機能もしくは方法またはその両方を実行する。

【0102】

コンピュータシステム／サーバ８１２は、キーボード、ポインティングデバイス、ディスプレイ８２４などの１つ以上の外部装置８１４、ユーザとコンピュータシステム／サーバ８１２との対話を可能にする１つ以上の装置、もしくはコンピュータシステム／サーバ８１２と１つ以上の他のコンピュータ装置との通信を可能にする任意の装置（例えば、ネットワークカードやモデムなど）またはこれらの組み合わせと通信することができる。かかる通信は、入力／出力（Ｉ／Ｏ）インタフェース８２２を介して行うことができる。さらに、コンピュータシステム８１２は、ネットワークアダプタ８２０を介して１つ以上のネットワーク（ローカルエリアネットワーク（ＬＡＮ）、汎用広域ネットワーク（ＷＡＮ）、もしくはパブリックネットワーク（例えばインターネット）またはこれらの組み合わせなど）と通信することができる。図示するように、ネットワークアダプタ８２０は、バス８１８を介してコンピュータシステム／サーバ８１２の他のコンポーネントと通信することができる。なお、図示は省略するが、他のハードウェアコンポーネントもしくはソフトウェアコンポーネントまたはその両方を、コンピュータシステム／サーバ８１２と併用することができることを理解されたい。それらの一例としては、マイクロコード、デバイスドライバ、冗長化処理ユニット、外付けディスクドライブアレイ、ＲＡＩＤシステム、ＳＳＤドライブ、データアーカイブストレージシステムなどがある。

【0103】

本開示はクラウドコンピューティングに関する詳細な説明を含むが、本明細書に記載した教示の実装形態はクラウドコンピューティング環境に限定されない。むしろ、本発明の実施形態は、現在公知のまたは将来開発される他の任意の種類のコンピュータ環境と共に実施することができる。

【0104】

クラウドコンピューティングは、設定可能なコンピューティングリソースの共有プール（例えばネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、記憶装置、アプリケーション、仮想マシンおよびサービス）へ、簡便かつオンデマンドのネットワークアクセスを可能にするためのサービス提供のモデルであり、リソースは、最小限の管理労力または最小限のサービスプロバイダとのやり取りによって速やかに準備（provision）およびリリースできるものである。このクラウドモデルは、少なくとも５つの特性、少なくとも３つのサービスモデル、および少なくとも４つの実装モデルを含むことがある。

【0105】

特性は以下の通りである。

【0106】

オンデマンド・セルフサービス：クラウドの消費者は、サービスプロバイダとの人的な対話を必要することなく、必要に応じて自動的に、サーバ時間やネットワークストレージなどのコンピューティング能力を一方的に準備することができる。

【0107】

ブロード・ネットワークアクセス：コンピューティング能力はネットワーク経由で利用可能であり、また、標準的なメカニズムを介してアクセスできる。それにより、異種のシンまたはシッククライアントプラットフォーム（例えば、携帯電話、ラップトップ、ＰＤＡ）による利用が促進される。

【0108】

リソースプーリング：プロバイダのコンピューティングリソースはプールされ、マルチテナントモデルを利用して複数の消費者に提供される。様々な物理リソースおよび仮想リソースが、需要に応じて動的に割り当ておよび再割り当てされる。一般に消費者は、提供されたリソースの正確な位置を管理または把握していないため、位置非依存（location independence）の感覚がある。ただし消費者は、より高い抽象レベル（例えば、国、州、データセンタ）では場所を特定可能な場合がある。

【0109】

迅速な柔軟性（elasticity）：コンピューティング能力は、迅速かつ柔軟に準備することができるため、場合によっては自動的に、直ちにスケールアウトし、また、速やかにリリースされて直ちにスケールインすることができる。消費者にとって、準備に利用可能なコンピューティング能力は無制限に見える場合が多く、任意の時間に任意の数量で購入することができる。

【0110】

測定されるサービス：クラウドシステムは、サービスの種類（例えば、ストレージ、処理、帯域幅、アクティブユーザアカウント）に適したある程度の抽象化レベルでの測定機能を活用して、リソースの使用を自動的に制御し最適化する。リソース使用量を監視、制御、および報告して、利用されるサービスのプロバイダおよび消費者の両方に透明性を提供することができる。

【0111】

サービスモデルは以下の通りである。

【0112】

サービスとしてのソフトウェア（ＳａａＳ）：消費者に提供される機能は、クラウドインフラストラクチャ上で動作するプロバイダのアプリケーションを利用できることである。当該そのアプリケーションは、ウェブブラウザ（例えばウェブメール）などのシンクライアントインタフェースを介して、各種のクライアント装置からアクセスできる。消費者は、ネットワーク、サーバ、オペレーティングシステム、ストレージや、個別のアプリケーション機能さえも含めて、基礎となるクラウドインフラストラクチャの管理や制御は行わない。ただし、ユーザ固有の限られたアプリケーション構成の設定はその限りではない。

【0113】

サービスとしてのプラットフォーム（ＰａａＳ）：消費者に提供される機能は、プロバイダによってサポートされるプログラム言語およびツールを用いて、消費者が作成または取得したアプリケーションを、クラウドインフラストラクチャに展開（deploy）することである。消費者は、ネットワーク、サーバ、オペレーティングシステム、ストレージを含む、基礎となるクラウドインフラストラクチャの管理や制御は行わないが、展開されたアプリケーションを制御でき、かつ場合によってはそのホスティング環境の構成も制御できる。

【0114】

サービスとしてのインフラストラクチャ（ＩａａＳ）：消費者に提供される機能は、オペレーティングシステムやアプリケーションを含み得る任意のソフトウェアを消費者が展開および実行可能な、プロセッサ、ストレージ、ネットワーク、および他の基本的なコンピューティングリソースを準備することである。消費者は、基礎となるクラウドインフラストラクチャの管理や制御は行わないが、オペレーティングシステム、ストレージ、および展開されたアプリケーションを制御でき、かつ場合によっては一部のネットワークコンポーネント（例えばホストファイアウォール）を部分的に制御できる。

【0115】

展開モデルは以下の通りである。

【0116】

プライベートクラウド：このクラウドインフラストラクチャは、特定の組織専用で運用される。このクラウドインフラストラクチャは、当該組織または第三者によって管理することができ、オンプレミスまたはオフプレミスで存在することができる。

【0117】

コミュニティクラウド：このクラウドインフラストラクチャは、複数の組織によって共有され、共通の関心事（例えば、ミッション、セキュリティ要件、ポリシー、およびコンプライアンス）を持つ特定のコミュニティをサポートする。このクラウドインフラストラクチャは、当該組織または第三者によって管理することができ、オンプレミスまたはオフプレミスで存在することができる。

【0118】

パブリッククラウド：このクラウドインフラストラクチャは、不特定多数の人々や大規模な業界団体に提供され、クラウドサービスを販売する組織によって所有される。

【0119】

ハイブリッドクラウド：このクラウドインフラストラクチャは、２つ以上のクラウドモデル（プライベート、コミュニティまたはパブリック）を組み合わせたものとなる。それぞれのモデル固有の実体は保持するが、標準または個別の技術によってバインドされ、データとアプリケーションの可搬性（例えば、クラウド間の負荷分散のためのクラウドバースティング）を実現する。

【0120】

クラウドコンピューティング環境は、ステートレス性（statelessness）、低結合性（low coupling）、モジュール性（modularity）および意味論的相互運用性（semantic interoperability）に重点を置いたサービス指向型環境である。クラウドコンピューティングの中核にあるのは、相互接続されたノードのネットワークを含むインフラストラクチャである。

【0121】

図９を参照すると、例示的なクラウドコンピューティング環境９００が示されている。図示するように、クラウドコンピューティング環境９００は１つまたは複数のクラウドコンピューティングノード９５０を含む。これらに対して、クラウド消費者が使用するローカルコンピュータ装置（例えば、パーソナルデジタルアシスタント（ＰＤＡ）もしくは携帯電話９５４Ａ、デスクトップコンピュータ９５４Ｂ、ラップトップコンピュータ９５４Ｃ、もしくは自動車コンピュータシステム９５４Ｎまたはこれらの組み合わせなど）は通信を行うことができる。ノード９５０は互いに通信することができる。ノード９５０は、例えば、上述のプライベート、コミュニティ、パブリックもしくはハイブリッドクラウドまたはこれらの組み合わせなど、１つまたは複数のネットワークにおいて、物理的または仮想的にグループ化（不図示）することができる。これにより、クラウドコンピューティング環境９００は、サービスとしてのインフラストラクチャ、プラットフォームもしくはソフトウェアまたはこれらの組み合わせを提供することができ、クラウド消費者はこれらについて、ローカルコンピュータ装置上にリソースを維持する必要がない。なお、図９に示すコンピュータ装置９５４Ａ～Ｎの種類は例示に過ぎず、コンピューティングノード９５０およびクラウドコンピューティング環境９００は、任意の種類のネットワークもしくはネットワークアドレス指定可能接続（例えば、ウェブブラウザの使用）またはその両方を介して、任意の種類の電子装置と通信可能であることを理解されたい。

【0122】

図１０を参照すると、クラウドコンピューティング環境９００（図９）によって提供される機能的抽象化レイヤのセットが示されている。なお、図１０に示すコンポーネント、レイヤおよび機能は例示に過ぎず、本発明の実施形態はこれらに限定されないことをあらかじめ理解されたい。図示するように、以下のレイヤおよび対応する機能が提供される。

【0123】

ハードウェアおよびソフトウェアレイヤ１０６０は、ハードウェアコンポーネントおよびソフトウェアコンポーネントを含む。ハードウェアコンポーネントの例には、メインフレーム１０６１、縮小命令セットコンピュータ（ＲＩＳＣ）アーキテクチャベースのサーバ１０６２、サーバ１０６３、ブレードサーバ１０６４、記憶装置１０６５、ならびにネットワークおよびネットワークコンポーネント１０６６が含まれる。いくつかの実施形態において、ソフトウェアコンポーネントは、ネットワークアプリケーションサーバソフトウェア１０６７およびデータベースソフトウェア１０６８を含む。

【0124】

仮想化レイヤ１０７０は、抽象化レイヤを提供する。当該レイヤから、例えば以下の仮想エンティティを提供することができる：仮想サーバ１０７１、仮想ストレージ１０７２、仮想プライベートネットワークを含む仮想ネットワーク１０７３、仮想アプリケーションおよびオペレーティングシステム１０７４、ならびに仮想クライアント１０７５。

【0125】

一例として、管理レイヤ１０８０は以下の機能を提供することができる。リソース準備１０８１は、クラウドコンピューティング環境内でタスクを実行するために利用されるコンピューティングリソースおよび他のリソースの動的な調達を可能にする。計量および価格設定１０８２は、クラウドコンピューティング環境内でリソースが利用される際のコスト追跡、およびこれらのリソースの消費に対する請求またはインボイス送付を可能にする。一例として、これらのリソースはアプリケーションソフトウェアのライセンスを含んでよい。セキュリティは、データおよび他のリソースに対する保護のみならず、クラウドコンシューマおよびタスクの識別確認を可能にする。ユーザポータル１０８３は、コンシューマおよびシステム管理者にクラウドコンピューティング環境へのアクセスを提供する。サービスレベル管理１０８４は、要求されたサービスレベルが満たされるように、クラウドコンピューティングリソースの割り当ておよび管理を可能にする。サービス品質保証（ＳＬＡ）の計画および履行１０８５は、ＳＬＡに従って将来必要になると予想されるクラウドコンピューティングリソースの事前手配および調達を可能にする。

【0126】

ワークロードレイヤ１０９０は、クラウドコンピューティング環境が利用可能な機能の例を提供する。このレイヤから提供可能なワークロードおよび機能の例には、マッピングおよびナビゲーション１０９１、ソフトウェア開発およびライフサイクル管理１０９２、仮想教室教育の配信１０９３、データ分析処理１０９４、取引処理１０９５、ならびに、ハードウェアアクセラレーションコンピューティングおよびアナログインメモリ計算を提供するために、例えば、図３、４Ａおよび４Ｂと関連して上述した例示的な方法および機能に基づいて、ＲＰＵ配列を有するＲＰＵシステムを使用して、行列の固有対の計算、行列演算の実行、行列対角化、特異値分解などの固有分解演算を実行するなどの演算を実行するための種々の機能１０９６が挙げられる。さらに、いくつかの実施形態では、ハードウェアおよびソフトウェアレイヤ１０６０は、かかるハードウェアアクセラレーションコンピューティングおよびアナログインメモリ計算を実行するための様々なワークロードおよび機能１０９６を実装またはサポートするために、図１のコンピューティングシステム１００を含むであろう。

【0127】

本開示の様々な実施形態の説明は、例示の目的で提示されているが、網羅的であることを意図するものではなく、開示される実施形態に限定されることを意図するものでもない。記載される実施形態の範囲から逸脱することなく、多くの修正および変更が可能であることは当業者には明らかであろう。本明細書で使用される用語は、実施形態の原理、市場で見られる技術に対する実際の適用または技術的改善を最もよく説明するため、または当業者が本明細書に記載の実施形態を理解できるようにするために選択された。

【図1】

【図2】

【図3】

【図4A】

【図4B】

【図5A】

【図5B】

【図6A】

【図6B】

【図7】

【図8】

【図9】

【図10】

【手続補正書】

【提出日】2024-01-17

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

【請求項2】

【請求項3】

【請求項4】

【請求項5】

【請求項6】

【請求項7】

【請求項8】

【請求項9】

【請求項10】

【請求項11】

【請求項12】

【請求項13】

【請求項14】

【請求項15】

【請求項16】

【請求項17】

【請求項18】

【請求項19】

【請求項20】

前記処理を実行することは、
前記推定された固有ベクトルに関連する固有値を推定することと、
前記セルの配列内の前記記憶された行列の行列値を更新するために前記抵抗処理ユニットを利用し、それによって、前記所定の行列の前記推定された固有値がゼロに設定された更新された行列を生成することと、
前記所定の行列の第２の固有ベクトルを推定するために、前記セルの配列に記憶された前記更新された行列に対して前記処理を繰り返すことと、
前記推定された第２の固有ベクトルに関連する第２の固有値を推定することと、をさらに含み、
前記セルの配列内の前記記憶された行列の行列値を更新するために前記抵抗処理ユニットを利用することは、前記記憶された行列に対して第１のベクトルと第２のベクトルの外積演算を実行することを含み、
前記第１のベクトルは、前記関連する固有値によってスケーリングされた前記推定された固有ベクトルを含み、
前記第２のベクトルは、前記推定された固有ベクトルの転置を含む、
請求項１８に記載の方法。

【手続補正2】

【補正対象書類名】明細書

【補正対象項目名】００４６

【補正方法】変更

【補正の内容】

【0046】

【手続補正3】

【補正対象書類名】明細書

【補正対象項目名】００７１

【補正方法】変更

【補正の内容】

【0071】

図６Ｂは、本開示の例示的な実施形態による、行列の固有対のハードウェアアクセラレーションコンピューティングを実施するためのアナログ外積演算を実行するために、ＲＰＵセルの配列を含むＲＰＵコンピューティングシステムを構成するための方法を概略的に示している。より具体的には、図６Ｂは、ベクトル－ベクトル外積更新演算（例えば、図４Ｂのブロック４１０～４１３）を実行し、ＲＰＵ配列６０５に記憶されるデフレーション行列を生成するためにＲＰＵコンピューティングシステム６００を構成するための方法を概略的に示す。図６Ｂは、コンピューティングシステム６００の周辺回路内のマルチプレクサが、行線ドライバ回路６４０を行線Ｒ１，Ｒ２，．．．，Ｒｎに選択的に接続するために起動される、ＲＰＵ演算システム６００の構成を概略的に示す図である。行線ドライバ回路６２０は、それぞれの行線Ｒ１，Ｒ２，．．．，Ｒｎに接続される複数のＤＡＣ回路ブロック６２２－１，６２２－２，．．．，６２２－ｎ（総称してＤＡＣ回路ブロック６２２）を含む。さらに図６Ｂに示すように、更新動作のために、ＤＡＣ回路ブロック６４２－１，６４２－２，．．．，６４２－ｎは、それぞれの列線Ｃ１，Ｃ２，．．．，Ｃｎに接続される。ＤＡＣ回路ブロック６４２は、上述したＤＡＣ回路ブロック６２２と同様の機能を果たす。

【手続補正4】

【補正対象書類名】明細書

【補正対象項目名】００８３

【補正方法】変更

【補正の内容】

【0083】

以上のことから、ＲＰＵ配列に記憶されている対称ｎ×ｎ行列ＡのＳＶＤを計算する例示的な処理は、例えばＡＡ^Ｔの固有値を計算する反復処理に基づいており、例示的な処理は、図４Ａのブロック４０１、４０２、４０３の処理フローの変形を使用して、ＡＡ^Ｔｘ^(ｊ)＝Ａ（Ａ^Ｔｘ^(ｊ)）＝Ａｙ^(ｊ)＝ｘ^(ｊ＋１)（ｊ＝０，１，．．．）を計算することを含む。特に、ブロック４００において、初期ベクトルｘ^(０)（ｎ×１列ベクトル）は、上述したように生成される。次に、初期デジタルベクトルｘ^(０)は、ＲＰＵシステムに入力され、初期ベクトルｘ^(０)とＲＰＵ配列に記憶された行列Ａの転置Ａ^Ｔを乗算することによって、（ブロック４０２において）アナログ行列－ベクトル乗算処理（すなわち、Ａ^Ｔｘ^(０)＝ｙ^(０)）を実行し、結果ベクトルｙ^(０)を生成する。いくつかの実施形態では、行列－ベクトル乗算処理Ａ^Ｔｘ^(０)は、初期ベクトルｘ^(０)をＲＰＵ配列６０５（図６Ａ）の行に入力することによって実行され、この場合、行線への入力は、ＤＡＣ回路（例えば、図６ＢのＤＡＣ回路６２０）に選択的に接続され、結果ベクトルｙ^(０)がＲＰＵ配列の列から出力され、この場合、列線は読み出し回路（例えば、図６Ａの読み出し回路６３０）に選択的に接続され、結果デジタルベクトルｙ^(０)を生成して出力する。

【国際調査報告】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版