特開2023-68601 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ エヌビディア　コーポレーションの特許一覧

特開2023-68601データ経路回路を設計するための装置、システム、及び方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9A
9B
10A
10B
11
12
13
14
15
16
17
18A
18B

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023068601

(43)【公開日】2023-05-17

(54)【発明の名称】データ経路回路を設計するための装置、システム、及び方法

(51)【国際特許分類】

G06F 30/327 20200101AFI20230510BHJP

G06N 20/00 20190101ALI20230510BHJP

G06F 30/27 20200101ALI20230510BHJP

G06F 30/337 20200101ALI20230510BHJP

【ＦＩ】

G06F30/327

G06N20/00

G06F30/27

G06F30/337

【審査請求】未請求

【請求項の数】20

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2021197583

(22)【出願日】2021-12-06

(31)【優先権主張番号】17/517,612

(32)【優先日】2021-11-02

(33)【優先権主張国・地域又は機関】US

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＢＬＵＥＴＯＯＴＨ

(71)【出願人】

【識別番号】501450960

【氏名又は名称】エヌビディアコーポレーション

(74)【代理人】

【識別番号】110000855

【氏名又は名称】弁理士法人浅村特許事務所

(72)【発明者】

【氏名】ロイラジョーシ

(72)【発明者】

【氏名】サードゴディル

(72)【発明者】

【氏名】ジョナサンライマン

(72)【発明者】

【氏名】ニールカント

(72)【発明者】

【氏名】イルヤスエルキン

(72)【発明者】

【氏名】マイケルシュウ

(72)【発明者】

【氏名】ロバートカービィ

(72)【発明者】

【氏名】スチュアートオーベルマン

(72)【発明者】

【氏名】ブライアンカタンザーロ

【テーマコード（参考）】

5B146

【Ｆターム（参考）】

5B146AA22

5B146DC03

5B146GA03

5B146GA06

5B146GC03

(57)【要約】

【課題】強化学習を用いて並列プレフィックス回路などのデータ経路回路を設計するための装置、システム、及び技法を提供する。
【解決手段】方法は、データ経路回路の第１の設計状態を受信するステップと、データ経路回路の第１の設計状態を機械学習モデルに入力するステップと、データ経路回路の最終設計状態を出力するために機械学習モデルを使用して強化学習を実施するステップであって、データ経路回路の最終設計状態が、従来設計されたデータ経路回路と比較して減少された面積、電力消費及び／又は遅延を有する、ステップとを含むことができる。
【選択図】図９Ａ

【特許請求の範囲】

【請求項1】

処理デバイスを使用して、データ経路回路の第１の設計状態を受信するステップと、
前記データ経路回路の前記第１の設計状態を機械学習モデルへの入力として提供するステップと、
前記機械学習モデルに前記データ経路回路の最終設計状態を出力させるために、前記機械学習モデルを使用して１つ又は複数の強化学習技法を実施するステップであって、前記データ経路回路の前記最終設計状態が、前記第１の設計状態に関連付けられた第１のパラメータ値よりもターゲットにより近い最終パラメータ値に関連付けられる、ステップと
を含む、方法。

【請求項2】

前記１つ又は複数の強化学習技法を実施するステップは、
前記機械学習モデルを使用して前記データ経路回路の前記第１の設計状態を処理するステップであって、前記機械学習モデルが、前記第１の設計状態の修正である前記データ経路回路の第２の設計状態を出力する、ステップと、
前記第１の設計状態についての前記第１のパラメータ値と前記第２の設計状態についての第２のパラメータ値とを決定するステップと、
前記第１のパラメータ値と前記第２のパラメータ値との比較に基づいて前記機械学習モデルを更新するステップと、
前記更新された機械学習モデルを使用して前記データ経路回路の前記第１の設計状態又は前記第２の設計状態を処理するステップであって、前記更新された機械学習モデルが、前記第１の設計状態又は前記第２の設計状態の修正である前記データ経路回路の第３の設計状態を出力する、ステップと
を含む、請求項１に記載の方法。

【請求項3】

第２のモデルを使用して前記第１の設計状態を処理するステップであって、前記第２のモデルが、前記第１の設計状態に関連付けられた前記第１のパラメータ値を出力する、ステップと、
前記第２のモデルを使用して前記第２の設計状態を処理するステップであって、前記第２のモデルが、前記第２の設計状態に関連付けられた前記第２のパラメータ値を出力する、ステップと、
前記第１のパラメータ値と前記第２のパラメータ値とのうちのどちらが前記ターゲットにより近いかを決定するために前記第２のパラメータ値と前記第１のパラメータ値との間の前記比較を行うステップと
をさらに含む、請求項２に記載の方法。

【請求項4】

前記機械学習モデルが、前記第１の設計状態の第１のグラフのグリッド表現を入力として受信し、前記第２の設計状態の第２のグラフのグリッド表現を出力し、
前記第２のモデルが、前記第１の設計状態の前記第１のグラフの前記グリッド表現を第１の入力として受信し、前記第２の設計状態の前記第２のグラフの前記グリッド表現を第２の入力として受信するメトリック予測器モデルである、
請求項３に記載の方法。

【請求項5】

前記機械学習モデルが、前記第１の設計状態の第１のグラフのグリッド表現を入力として受信し、前記第２の設計状態の第２のグラフの前記グリッド表現を生成するためのアクションを出力し、前記方法が、
前記第２の設計状態の前記第２のグラフの前記グリッド表現を前記第２の設計状態の回路実装形態にコンバートするステップ
をさらに含み、
前記第２のモデルが、前記第１の設計状態の回路実装形態を第１の入力として受信し、前記第２の設計状態の前記回路実装形態を第２の入力として受信する、請求項３に記載の方法。

【請求項6】

前記第２のパラメータ値と前記第１のパラメータ値との間の差を決定するステップであって、前記機械学習モデルが前記差に基づいて更新される、ステップ
をさらに含む、請求項２に記載の方法。

【請求項7】

回路合成ツールを使用して前記第１の設計状態を処理するステップであって、前記回路合成ツールが、前記第１の設計状態に関連付けられた前記第１のパラメータ値を出力する、ステップと、
前記回路合成ツールを使用して前記第２の設計状態を処理するステップであって、前記回路合成ツールが、前記第２の設計状態に関連付けられた前記第２のパラメータ値を出力する、ステップと、
前記第１のパラメータ値と前記第２のパラメータ値とのうちのどちらが前記ターゲットにより近いかを決定するために前記第２のパラメータ値と前記第１のパラメータ値との間の前記比較を行うステップと
をさらに含む、請求項２に記載の方法。

【請求項8】

前記回路合成ツールは、前記機械学習モデルが前記データ経路回路の前記第２の設計状態を生成するためのアクションを出力することと少なくとも部分的に同時に、前記第１の設計状態を処理する、請求項７に記載の方法。

【請求項9】

前記第２のパラメータ値を決定する前に、前記第２の設計状態が無効状態であると決定するステップと、
有効である更新された第２の設計状態を作り出すために前記データ経路回路の前記第２の設計状態を修正するステップであって、前記第２のパラメータ値が、前記更新された第２の設計状態から決定される、ステップと
をさらに含む、請求項２に記載の方法。

【請求項10】

前記第１の設計状態を表す第１の並列プレフィックス・グラフを生成するステップと、
前記第１の並列プレフィックス・グラフのグリッド表現を生成するステップであって、前記第１の並列プレフィックス・グラフの前記グリッド表現が前記機械学習モデルへの入力として提供され、前記機械学習モデルが、前記最終設計状態を表す最終並列プレフィックス・グラフのグリッド表現を構築するための１つ又は複数のアクションを出力する、ステップと
をさらに含む、請求項２に記載の方法。

【請求項11】

前記データ経路回路は、並列プレフィックス回路、又は追加の回路論理がその入力又は出力に接続された並列プレフィックス回路を備える、請求項１に記載の方法。

【請求項12】

前記第１のパラメータ値及び前記最終パラメータ値が、各々、前記データ経路回路に関連付けられた面積、前記データ経路回路に関連付けられた遅延、前記データ経路回路に関連付けられた電力消費の予測、又はそれらの任意の組合せのうちの少なくとも１つを表す、請求項１に記載の方法。

【請求項13】

前記第１のパラメータ値及び前記最終パラメータ値が、各々、前記データ経路回路に関連付けられた前記面積、前記データ経路回路に関連付けられた前記遅延、又は前記データ経路回路に関連付けられた前記電力消費の重み付けされた値の予測のうちの少なくとも１つを表す、請求項１２に記載の方法。

【請求項14】

前記機械学習モデルが、前記データ経路回路の設計状態を前記第１の設計状態から前記最終設計状態に反復的に修正し、各反復が、前記データ経路回路のグラフのノードを除去すること又は追加することのうちの少なくとも１つを含み、前記グラフの各ノードが、前記データ経路回路の１つ又は複数の構成要素に関連付けられる、請求項１に記載の方法。

【請求項15】

データ経路回路の第１の設計状態を受信することと、
機械学習モデルを使用して前記データ経路回路の前記第１の設計状態を処理することであって、前記機械学習モデルが、前記第１の設計状態の修正である前記データ経路回路の第２の設計状態を含む出力を生成することになる、処理することと
を行うことになる第１の処理デバイスと、
前記第１の設計状態についての第１のパラメータ値と前記第２の設計状態についての第２のパラメータ値とを決定することと、
前記第１のパラメータ値と前記第２のパラメータ値との比較に基づいて前記出力に関連付けられた報酬を決定することと
を行うように構成された第２の処理デバイスと
を備えるシステムであって、
前記第１の処理デバイスが、さらに、前記報酬に基づいて前記機械学習モデルを更新することになり、
前記機械学習モデルに対する１つ又は複数の更新の後に、前記機械学習モデルが、前記データ経路回路の最終設計状態を出力することになり、前記データ経路回路の前記最終設計状態が、前記第１の設計状態に関連付けられた第１のパラメータ値よりもターゲットにより近い最終パラメータ値に関連付けられる、システム。

【請求項16】

前記第１の処理デバイスが、さらに、
前記更新された機械学習モデルを使用して前記データ経路回路の前記第１の設計状態又は前記第２の設計状態を処理することと、
前記第１の設計状態又は前記第２の設計状態の修正である前記データ経路回路の第３の設計状態を出力することと
を行うことになる、請求項１５に記載のシステム。

【請求項17】

前記第２の処理デバイスは、さらに、
第２のモデルを使用して前記第１の設計状態を処理することであって、前記第２のモデルが、前記第１の設計状態に関連付けられた前記第１のパラメータ値を出力する、処理することと、
前記第２のモデルを使用して前記第２の設計状態を処理することであって、前記第２のモデルが、前記第１の設計状態に関連付けられた前記第２のパラメータ値を出力する、処理することと、
前記第１のパラメータ値と前記第２のパラメータ値とのうちのどちらが前記ターゲットにより近いかを決定するために前記第２のパラメータ値と前記第１のパラメータ値とを比較することと
を行うことになる、請求項１５に記載のシステム。

【請求項18】

前記第２の処理デバイス又は第３の処理デバイスのうちの少なくとも１つは、さらに、
回路合成ツールを使用して前記第１の設計状態を処理することであって、前記回路合成ツールが、前記第１の設計状態に関連付けられた前記第１のパラメータ値を出力する、処理することと、
前記回路合成ツールを使用して前記第２の設計状態を処理することであって、前記回路合成ツールが、前記第１の設計状態に関連付けられた前記第２のパラメータ値を出力する、処理することと、
前記第１のパラメータ値と前記第２のパラメータ値とのうちのどちらが前記ターゲットにより近いかを決定するために前記第２のパラメータ値と前記第１のパラメータ値とを比較することと
を行うように構成された、請求項１５に記載のシステム。

【請求項19】

前記第１の処理デバイスがグラフィカル処理ユニット（ＧＰＵ）を備え、前記第２の処理デバイスが中央処理ユニット（ＣＰＵ）を備える、請求項１５に記載のシステム。

【請求項20】

命令をその上に記憶する非一時的コンピュータ可読媒体であって、前記命令は、処理デバイスによって実行されたとき、前記処理デバイスに、
データ経路回路の第１の設計状態を受信することと、
前記データ経路回路の前記第１の設計状態を機械学習モデルへの入力として提供することと、
前記機械学習モデルに前記データ経路回路の最終設計状態を出力させるために、前記機械学習モデルを使用して１つ又は複数の強化学習技法を適用することであって、前記データ経路回路の前記最終設計状態が、前記第１の設計状態に関連付けられた第１のパラメータ値よりもターゲットにより近い最終パラメータ値に関連付けられる、適用することと
を行わせる、非一時的コンピュータ可読媒体。

【発明の詳細な説明】

【技術分野】

【0001】

少なくとも１つの実施例が、回路設計を実施し、容易にするための機械学習の使用に関する。たとえば、少なくとも１つの実施例は、本明細書で説明される様々な新規の技法による、強化学習を利用するデータ経路回路設計のための技術に関する。

【背景技術】

【0002】

多くのタイプの回路は、データ経路又はデータ経路回路、たとえば、データ処理演算を実施することができる算術論理ユニット又は乗算器を含むことができる。たとえば、データ経路回路は、データ経路上でデータを処理又は合成する並列プレフィックス回路（たとえば、グレー・バイナリ・コンバータ（ｇｒａｙｔｏｂｉｎａｒｙｃｏｎｖｅｒｔｅｒ）、加算器、デクリメンタ、インクリメンタ、優先度エンコーダなど）を含むことができる。プレフィックス算出は、画像処理、暗号、プロセッサ割振り、生物学的配列比較、バイナリ加算、シリコン・コンパイラの設計、ジョブ・スケジューリング、ループ並列化、多項式評価、及びソートなど、様々な用途において使用される極めて有用で基本的な演算である。

【0003】

データ経路回路の設計は、遅延（たとえば、データ経路回路が入力を与えられると値を出力するために要する時間の量）及び面積（たとえば、データ経路回路が要する空間の量）を減少させる一方、回路の電力消費の増加を回避することを目指す。データ経路回路の遅延が減少されるにつれて、データ経路回路の面積及び電力消費は影響を及ぼされ得、たとえば、データ経路回路の遅延が減少するにつれて、データ経路回路の面積は増加することがある。したがって、データ経路回路の設計は、データ経路回路の遅延、面積及び電力消費を最適化することを目指す。

【0004】

プレフィックス回路の最適化は、プレフィックス回路の大きい設計空間が入力長さとともに指数関数的に増大し、計数するのがやっかいであるので、難しい。その結果、全数探索手法が、小さい入力長さを越えてスケーリングしない。論理レベル、最大ファンアウト及び配線トラックのトレード・オフを図るいくつかの通常のプレフィックス回路構造が提案されてきた。アルゴリズムの別のセットは、プレフィックス回路サイズ及びレベル・プロパティを最適化する。しかしながら、プレフィックス回路レベル及び最大ファンアウト・プロパティは、容量性ローディング及び輻輳などの物理的設計複雑さにより、回路面積、電力、及び遅延にマッピングしない。データ経路回路設計のための従来の方法は、データ経路回路の遅延、面積及び電力消費を十分に最適化するとは限らない。

【発明の概要】

【課題を解決するための手段】

【0005】

本開示による様々な実施例が、図面を参照しながら説明される。

【図面の簡単な説明】

【0006】

【図1】少なくともいくつかの実施例による、例示的なシステム・アーキテクチャの図である。

【図2】少なくともいくつかの実施例による、強化学習のための例示的なシステム・アーキテクチャを示す図である。

【図3】少なくともいくつかの実施例による、例示的なプレフィックス・グラフ修正を示す図である。

【図4】少なくともいくつかの実施例による、並列プレフィックス・グラフの例示的なグリッド表現を示す図である。

【図5】少なくともいくつかの実施例による、例示的なデータ経路回路設計計算を示す図である。

【図6】少なくともいくつかの実施例による、データ経路回路設計についての例示的な制約を示す図である。

【図7】少なくともいくつかの実施例による、強化学習を用いたデータ経路回路設計のための例示的な方法の図である。

【図8】少なくともいくつかの実施例による、例示的なシステム・アーキテクチャを示す図である。

【図9A】少なくともいくつかの実施例による、強化学習を用いたデータ経路回路設計のための例示的な方法のフロー図である。

【図9B】少なくともいくつかの実施例による、強化学習を用いたデータ経路回路設計のための例示的な方法のフロー図である。

【図10A】少なくともいくつかの実施例による、推論及び／又は訓練論理（ｔｒａｉｎｉｎｇｌｏｇｉｃ）を示す図である。

【図10B】少なくともいくつかの実施例による、推論及び／又は訓練論理を示す図である。

【図11】少なくともいくつかの実施例による、例示的なデータ・センタ・システムを示す図である。

【図12】少なくともいくつかの実施例による、コンピュータ・システムを示す図である。

【図13】少なくともいくつかの実施例による、コンピュータ・システムを示す図である。

【図14】少なくともいくつかの実施例による、グラフィックス・プロセッサの少なくとも部分を示す図である。

【図15】少なくともいくつかの実施例による、グラフィック・プロセッサの少なくとも部分を示す図である。

【図16】少なくともいくつかの実施例による、先進コンピューティング・パイプラインのための例示的なデータ・フロー図である。

【図17】少なくともいくつかの実施例による、先進コンピューティング・パイプラインにおいて機械学習モデルを訓練し、適応させ、インスタンス化し、導入するための例示的なシステムのためのシステム図である。

【図18A】少なくともいくつかの実施例による、機械学習モデルを訓練するためのプロセスのためのデータ・フロー図である。

【図18B】少なくともいくつかの実施例による、事前訓練されたアノテーション・モデルを用いてアノテーション・ツールを拡張するためのクライアントサーバ・アーキテクチャを示す図である。

【発明を実施するための形態】

【0007】

加算器、優先度エンコーダ、インクリメンタ、デクリメンタ及びグレー・バイナリ・コード・コンバータなどのいくつかの基礎デジタル設計ビルディング・ブロックが、プレフィックス和算出に低減され、プレフィックス回路（たとえば、並列プレフィックス回路）などのデータ経路回路として実装され得る。面積、遅延及び電力についてのプレフィックス回路などのデータ経路回路の最適化は、デジタル・ハードウェア設計において重要であり得る。本明細書で説明される実施例は、強化学習を使用して面積、電力及び／又は遅延について最適化されるデータ経路回路（たとえば、並列プレフィックス回路）を設計するためのシステム及び方法を提供する。

【0008】

いくつかのメモリ・システムは、たとえば、ホスト・システムのためのデータを記憶又は通信する。メモリ・システムは、メモリ・システムのある構成要素からメモリ・システムの別の構成要素にデータを通信するデータ経路を含むことができる。いくつかの実施例では、メモリ・システムは、データ経路回路においてデータを処理又は合成することができる。たとえば、メモリ・システムは、データを処理及び合成するためのプレフィックス回路、たとえば、加算器、デクリメンタ、インクリメンタ、グレー・バイナリ・コンバータ、優先度エンコーダなどを含むことができる。たとえば、加算器は、メモリ・システムのプロセスのためにアドレス又はテーブル・インデックスを計算するために利用され得る。一実例では、プレフィックス回路は、たとえば、並列プレフィックス回路として、プレフィックス算出を実施するための時間を低減するために並列構成において利用され得る。

【0009】

各データ経路回路は、関連する面積（たとえば、メモリ・システムにおけるデータ経路回路のサイズ）と、電力消費（たとえば、動作中にデータ経路回路によって消費される電力量）と、遅延（たとえば、所与の数の入力から出力を生成するための時間の量）とを有することができる。（たとえば、メモリ・システムについての）回路の性能を増加させるために、データ経路回路は、面積、電力消費及び／又は遅延を低減するように設計され得る。とはいえ、いくつかの実例では、データ経路回路のあるプロパティを低減することは、データ経路回路の別のプロパティに影響を及ぼすことがあり、たとえば、データ経路回路の遅延を低減することは、データ経路回路の面積がより大きくなることを引き起こすか、又はデータ経路回路がより多くの電力を消費することを引き起こすことがある。したがって、実施例では、データ経路回路は、低減された面積、電力消費及び／又は遅延の間のトレード・オフを図るように設計され、たとえば、それぞれの遅延又は電力消費のために面積の最も小さい量のために設計又は最適化され得る。

【0010】

いくつかの実例では、データ経路回路の設計のための従来の方法は、最適化されたデータ経路回路を設計することにおいて効果的でない。たとえば、いくつかの従来の方法は、論理レベル、最大ファンアウト、及び配線トラックを最適化するプレフィックス回路構造を提案する。しかしながら、論理レベル、ファンアウト、及び配線トラックを最適化することは、プレフィックス構造の物理的設計の複雑さにより、たとえば、容量性ローディング又は輻輳により、面積、遅延、及び／又は電力のために最適化することに失敗することがある。データ経路回路設計のためのいくつかの従来の方法は、回路設計についての物理的メトリックを予測することを試みること、又は回路設計へのランダム修正を実施することのいずれかを行う、回路設計のためのヒューリスティック・ルールを利用することを含むことができる。そのようなヒューリスティックを使用して生成される回路設計は、不正確な解析モデルを使用して評価（ｅｖａｌｕａｔｅ）され得る。これらの解析モデル及びヒューリスティック・ルールは、それらが、手作りのヒューリスティックに依拠するか、又は解析評価メトリックによって制限されるので、最適回路を作り出すことにおいて効果的でないことがある。たとえば、解析評価メトリックを使用して設計されたプレフィックス回路は、プレフィックス回路が物理的合成を受けるとき、たとえば、解析モデルが、シミュレーションを経て、予測された物理モデルにコンバートされるとき、品質が劣化する（たとえば、遅延、面積、又は電力消費の増加を経験する）。物理的合成が解析評価よりも強いので、従来の方法は、概して、物理的合成のためにスケーリングされないことがある。したがって、データ経路回路のための従来の回路設計技法は、最適化されておらず、これらのデータ経路回路（たとえば、メモリ・システム）を使用するシステムの性能を低減する。

【0011】

本開示の態様は、機械学習モデルを用いた強化学習を使用してデータ経路回路（たとえば、並列プレフィックス回路）を設計することによって、上記及び他の欠陥に対処する。たとえば、（たとえば、エージェントを実行する）第１の処理デバイスが、機械学習モデルにデータ経路回路の初期設計を与えることができる。機械学習モデルは、データ経路回路のための第２の設計を生成するために設計を修正することができる。いくつかの実例では、設計を修正することは、データ経路回路に関連付けられたプレフィックス・グラフを修正すること、たとえば、データ経路回路を表すプレフィックス・グラフのノードを修正することを含むことができ、各ノードは、データ経路回路の１つ又は複数の構成要素を表す。たとえば、機械学習モデルは、第２の設計を表す第２のプレフィックス・グラフを生成するためにノードを追加又は除去することによって、初期設計によって表されるプレフィックス・グラフを修正することができる。修正の後に、第１の処理デバイス又は第２の処理デバイスは、第１の設計と第２の設計とを処理して、それぞれの設計に関連付けられた１つ又は複数のメトリックを決定することができる。たとえば、第１又は第２の処理デバイスは、機械学習モデルによって生成された初期設計と第２の設計とに関連付けられた面積、電力、及び／又は遅延を決定することができる。いくつかの実施例では、第２の機械学習モデルは、初期回路設計と第２の回路設計とに関連付けられた面積、電力及び／又は遅延を予測するために使用される。いくつかの実施例では、回路合成ツール（ｃｉｒｃｕｉｔｓｙｎｔｈｅｓｉｓｔｏｏｌ）は、初期回路設計と第２の回路設計との面積、電力、及び／又は遅延を予測するために使用される。

【0012】

第１又は第２の処理デバイスは、初期設計から第２の設計に遷移することに基づいて面積、遅延、及び／又は電力の純変化を示す報酬（たとえば、パラメータ）を生成することができる。報酬は、機械学習モデルの訓練を更新するために使用され得、たとえば、機械学習モデルは、受信された報酬に基づいて強化学習を受けることができる。たとえば、機械学習モデルは、報酬を受信し、前の変化が、データ経路回路の面積、遅延、及び／又は電力の減少を引き起こしたと決定し、機械学習モデルの１つ又は複数のノードの重みを更新することができる。更新された機械学習モデルは、次いで、第３のデータ経路回路を生成するためにデータ経路回路の第２の設計を修正し得る。このプロセスは繰り返され得、機械学習モデルを使用するデータ経路回路設計の強化学習は、さらなる改善が出力されていない（たとえば、データ経路回路の遅延、面積、及び／又は電力を低減する、設計への追加の修正がない）という決定が行われるまで、或いはデータ経路回路の遅延、面積、及び／又は電力が、データ経路回路についてのターゲット遅延、面積、及び／又は電力を満たすという決定が行われるまで、たとえば、データ経路回路設計が、それぞれの遅延、面積、及び／又は電力制約のために最適化されるまで続くことができる。

【0013】

実施例は、従来の回路設計技法において適用される手作りのヒューリスティック（たとえば、プルーニングのためのヒューリスティックなど）の使用を回避する。実施例では、機械学習モデルは、本明細書で説明されるように、強化学習技法を介してデータ経路回路のための回路設計を実施するように訓練され得る。すなわち、機械学習モデルは、データ経路回路の現在の設計を最適化するやり方でデータ経路回路を修正すること、たとえば、データ経路回路の面積、電力消費及び／又は遅延を低減するためにデータ経路回路を修正することを学習する。たとえば、機械学習モデルは、１つ又は複数の改善された又は減少された回路設計最適化メトリック値を示す報酬を受信したことと、データ経路回路設計の前の修正が改善された又は減少された回路設計最適化メトリック値を生じたかどうかを決定することと、次いで、その報酬に基づいて機械学習モデルのノードを調節することとに基づいて訓練され得る。いくつかの実例では、機械学習モデルは、モデル（ベース／なし）、値／ポリシーベース、又はオン／オフ・ポリシー強化学習技法を使用して訓練され得る。他の実施例では、機械学習モデルは、深層ニューラル・ネットワーク（たとえば、畳み込みニューラル・ネットワーク、変換器、グラフ・ニューラル・ネットワークなど）及び／又は判定ツリーを利用することができる。強化学習を利用することによって、データ経路回路の設計は、他のソリューションと比較してそれよりも完全により最適化され得、たとえば、データ経路回路の遅延、面積、及び／又は電力は、旧来の手法を使用して設計されたデータ経路回路と比較して低減され得る。実施例は、データ経路回路の回路設計における前の手法と比較して、所与の遅延についてより小さい面積及び電力を有し、所与の面積及び電力についてより小さい遅延を有する回路設計を作り出す。したがって、メモリ・システムなどのシステムの全体的性能は、設計されたデータ経路回路が、旧来設計されたデータ経路回路と比較して、より少ない電力を消費し、遅延がより少なくなり、及び／又はより小さい面積を消費することができるので、本開示の実施例により、増加することができる。

【0014】

図１は、少なくとも１つの実施例による、コンピュータ・システム１００を示す。少なくとも１つの実施例では、コンピュータ・システム１００は、相互接続されたデバイス及び構成要素をもつシステム、ＳＯＣ、又はそれらの何らかの組合せであり得る。少なくとも１つの実施例では、コンピュータ・システム１００は、命令を実行するための実行ユニットを含み得るプロセッサ１０２とともに形成される。少なくとも１つの実施例では、コンピュータ・システム１００は、限定はしないが、データを処理するためのアルゴリズムを実施するための論理を含む実行ユニットを採用するための、プロセッサ１０２などの構成要素を含み得る。少なくとも１つの実施例では、コンピュータ・システム１００は、カリフォルニア州サンタクララのＩｎｔｅｌＣｏｒｐｏｒａｔｉｏｎから入手可能なＰＥＮＴＩＵＭ（登録商標）プロセッサ・ファミリー、Ｘｅｏｎ（商標）、Ｉｔａｎｉｕｍ（登録商標）、ＸＳｃａｌｅ（商標）及び／又はＳｔｒｏｎｇＡＲＭ（商標）、Ｉｎｔｅｌ（登録商標）Ｃｏｒｅ（商標）、又はＩｎｔｅｌ（登録商標）Ｎｅｒｖａｎａ（商標）マイクロプロセッサなどのプロセッサを含み得るが、（他のマイクロプロセッサ、エンジニアリング・ワークステーション、セット・トップ・ボックスなどを有するＰＣを含む）他のシステムも使用され得る。

【0015】

少なくとも１つの実施例では、コンピュータ・システム８００は、ハンドヘルド・デバイス及び組み込みアプリケーションなど、他のデバイスにおいて使用され得る。ハンドヘルド・デバイスのいくつかの実例は、セルラー・フォン、インターネット・プロトコル・デバイス、デジタル・カメラ、パーソナル・デジタル・アシスタント（「ＰＤＡ」：ｐｅｒｓｏｎａｌｄｉｇｉｔａｌａｓｓｉｓｔａｎｔ）、及びハンドヘルドＰＣを含む。少なくとも１つの実施例では、組み込みアプリケーションは、マイクロコントローラ、デジタル信号プロセッサ（ＤＳＰ：ｄｉｇｉｔａｌｓｉｇｎａｌｐｒｏｃｅｓｓｏｒ）、ＳｏＣ、ネットワーク・コンピュータ（「ＮｅｔＰＣ」：ｎｅｔｗｏｒｋｃｏｍｐｕｔｅｒ）、セット・トップ・ボックス、ネットワーク・ハブ、ワイド・エリア・ネットワーク（「ＷＡＮ」：ｗｉｄｅａｒｅａｎｅｔｗｏｒｋ）スイッチ、又は１つ又は複数の命令を実施し得る任意の他のシステムを含み得る。一実施例では、コンピュータ・システム１００は、グラフィックス処理ユニット（ＧＰＵ：ｇｒａｐｈｉｃｓｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）、ネットワーク・アダプタ、中央処理ユニットなどのデバイス、及びスイッチ（たとえば、ＮＶＩＤＩＡＧＨ１００ＮＶＬＩＮＫ又はＮＶＩＤＩＡＱｕａｎｔｕｍ２６４ＰｏｒｔｓＩｎｆｉｎｉＢａｎｄＮＤＲＳｗｉｔｃｈなどの高速直接ＧＰＵ間相互接続（ｈｉｇｈ－ｓｐｅｅｄｄｉｒｅｃｔＧＰＵ－ｔｏ－ＧＰＵｉｎｔｅｒｃｏｎｎｅｃｔ））などのネットワーク・デバイスにおいて使用され得る。

【0016】

少なくとも１つの実施例では、コンピュータ・システム１００は、限定はしないが、プロセッサ１０２を含み得、プロセッサ１０２は、限定はしないが、コンピュート・ユニファイド・デバイス・アーキテクチャ（「ＣＵＤＡ」：ＣｏｍｐｕｔｅＵｎｉｆｉｅｄＤｅｖｉｃｅＡｒｃｈｉｔｅｃｔｕｒｅ）（ＣＵＤＡ（登録商標）は、カリフォルニア州サンタクララのＮＶＩＤＩＡＣｏｒｐｏｒａｔｉｏｎによって開発される）プログラムを実行するように構成され得る、１つ又は複数の実行ユニット１０７を含み得る。少なくとも１つの実施例では、ＣＵＤＡプログラムは、ＣＵＤＡプログラミング言語で書かれたソフトウェア・アプリケーションの少なくとも一部分である。少なくとも１つの実施例では、コンピュータ・システム１００は、シングル・プロセッサ・デスクトップ又はサーバ・システムである。少なくとも１つの実施例では、コンピュータ・システム１００は、マルチプロセッサ・システムであり得る。少なくとも１つの実施例では、プロセッサ１０２は、限定はしないが、ＣＩＳＣマイクロプロセッサ、ＲＩＳＣマイクロプロセッサ、ＶＬＩＷマイクロプロセッサ、命令セットの組合せを実装するプロセッサ、又は、たとえばデジタル信号プロセッサなど、任意の他のプロセッサ・デバイスを含み得る。少なくとも１つの実施例では、プロセッサ１０２は、プロセッサ・バス１１０に結合され得、プロセッサ・バス１１０は、プロセッサ１０２とコンピュータ・システム１００中の他の構成要素との間でデータ信号を送信し得る。

【0017】

少なくとも１つの実施例では、プロセッサ１０２は、限定はしないが、レベル１（「Ｌ１」）の内部キャッシュ・メモリ（「キャッシュ」）１０４を含み得る。少なくとも１つの実施例では、プロセッサ１０２は、単一の内部キャッシュ又は複数のレベルの内部キャッシュを有し得る。少なくとも１つの実施例では、キャッシュ・メモリは、プロセッサ１０２の外部に存在し得る。少なくとも１つの実施例では、プロセッサ１０２は、内部キャッシュと外部キャッシュの両方の組合せをも含み得る。少なくとも１つの実施例では、レジスタ・ファイル１０６は、限定はしないが、整数レジスタ、浮動小数点レジスタ、ステータス・レジスタ、及び命令ポインタ・レジスタを含む様々なレジスタに、異なるタイプのデータを記憶し得る。

【0018】

少なくとも１つの実施例では、プロセッサ１０２はデータ経路回路１０８を含むことができる。いくつかの実例では、データ経路回路１０８は並列プレフィックス回路の実例であり得る。たとえば、データ経路回路１０８は、場合によっては接続された論理を含む、加算器、インクリメンタ、デクリメンタ、優先度エンコーダ、及び／又はグレー・バイナリ・コンバータであり得る。いくつかの実例では、データ経路回路１０８はまた、コンピュータ・システム１００の他の構成要素中に位置することがある。いくつかの実施例では、データ経路回路１０８は、電力を消費し、それぞれの面積を占め、それぞれの遅延を有することがある。いくつかの実施例では、データ経路回路１０８の遅延は、コンピュータ・システム１０８の構成要素のクロック周波数と逆関係にあり得、たとえば、データ経路回路１０８の遅延は、コンピュータ・システム１０８の構成要素についてのクロック周波数を設定するために利用され得る。いくつかの実施例では、データ経路回路１０８の設計は、データ経路回路１０８の面積、電力消費、及び／又は遅延を低減又は最適化するために、経時的に訓練される機械学習モデルを使用する強化学習を介して実施され得る。たとえば、データ・パッチ回路１０８の設計中に、機械学習モデルは、データ経路回路１０８の設計を修正し、その修正が所与のデータ経路回路１０８の面積、電力、又は遅延の低減を生じたかどうかを決定することができる。コンピュータ・システム１００は、強化学習を使用して設計された最適化されたデータ経路回路から恩恵を受けることができる。すなわち、機械学習モデルは、データ経路回路の設計への生じた修正がデータ経路回路１０８の面積、遅延、及び／又は電力の低減を生じたかどうかに基づいて更新され得る。いくつかの反復にわたって、機械学習モデルは、データ経路回路の面積、電力消費、及び／又は遅延の最も良好な低減を生じる修正を選定するように訓練され得る。いくつかの実施例では、機械学習モデルは、データ経路回路１０８の面積、電力消費、及び／又は遅延がターゲット・メトリックを満たすまで、たとえば、データ経路回路１０８の面積、電力消費、及び／又は遅延がターゲット面積、電力消費、及び／又は遅延を満たすまで使用され得る。データ経路回路１０８を設計するために強化学習を利用することによって、データ経路回路１０８の設計は最適化され得、コンピュータ・システム１００の性能は改善され得る。

【0019】

少なくとも１つの実施例では、限定はしないが、整数演算及び浮動小数点演算を実施するための論理を含む実行ユニット１０７も、プロセッサ１０２中に存在し得る。プロセッサ１０２は、いくつかのマクロ命令のためのマイクロコードを記憶するマイクロコード（「ｕコード」）読取り専用メモリ（「ＲＯＭ」：ｒｅａｄｏｎｌｙｍｅｍｏｒｙ）をも含み得る。少なくとも１つの実施例では、実行ユニット１０２は、パック命令セット１０９に対処するための論理を含み得る。少なくとも１つの実施例では、パック命令セット１０９を、命令を実行するための関連する回路要素とともに汎用プロセッサ１０２の命令セットに含めることによって、多くのマルチメディア・アプリケーションによって使用される演算が、汎用プロセッサ１０２中のパック・データを使用して実施され得る。少なくとも１つの実施例では、多くのマルチメディア・アプリケーションが、パック・データの演算を実施するためにプロセッサのデータ・バスの全幅を使用することによって加速され、より効率的に実行され得、これは、一度に１つのデータ要素ずつ１つ又は複数の演算を実施するために、プロセッサのデータ・バスにわたってより小さい単位のデータを転送する必要をなくし得る。

【0020】

少なくとも１つの実施例では、実行ユニットはまた、マイクロコントローラ、組み込みプロセッサ、グラフィックス・デバイス、ＤＳＰ、及び他のタイプの論理回路において使用され得る。少なくとも１つの実施例では、コンピュータ・システム１００は、限定はしないが、メモリ１２０を含み得る。少なくとも１つの実施例では、メモリ１２０は、ＤＲＡＭデバイス、ＳＲＡＭデバイス、フラッシュ・メモリ・デバイス、又は他のメモリ・デバイスとして実装され得る。メモリ１２０は、プロセッサ１０２によって実行され得るデータ信号によって表される（１つ又は複数の）命令１１９及び／又はデータ１２１を記憶し得る。

【0021】

少なくとも１つの実施例では、システム論理チップが、プロセッサ・バス１１０及びメモリ１２０に結合され得る。少なくとも１つの実施例では、システム論理チップは、限定はしないが、メモリ・コントローラ・ハブ（「ＭＣＨ」：ｍｅｍｏｒｙｃｏｎｔｒｏｌｌｅｒｈｕｂ）１１６を含み得、プロセッサ１０２は、プロセッサ・バス１１０を介してＭＣＨ１１６と通信し得る。少なくとも１つの実施例では、ＭＣＨ１１６は、命令及びデータ・ストレージのための、並びにグラフィックス・コマンド、データ及びテクスチャのストレージのための、高帯域幅メモリ経路１１８をメモリ１２０に提供し得る。少なくとも１つの実施例では、ＭＣＨ１１６は、プロセッサ１０２と、メモリ１２０と、コンピュータ・システム１００中の他の構成要素との間でデータ信号をダイレクトし、プロセッサ・バス１１０と、メモリ１２０と、システムＩ／Ｏ１２２との間でデータ信号をブリッジし得る。少なくとも１つの実施例では、システム論理チップは、グラフィックス・コントローラに結合するためのグラフィックス・ポートを提供し得る。少なくとも１つの実施例では、ＭＣＨ１１６は、高帯域幅メモリ経路１１８を通してメモリ１２０に結合され得、グラフィックス／ビデオ・カード１１２は、アクセラレーテッド・グラフィックス・ポート（「ＡＧＰ」：ＡｃｃｅｌｅｒａｔｅｄＧｒａｐｈｉｃｓＰｏｒｔ）相互接続１１４を介してＭＣＨ１１６に結合され得る。

【0022】

少なくとも１つの実施例では、コンピュータ・システム１００は、ＭＣＨ１１６をＩ／Ｏコントローラ・ハブ（「ＩＣＨ」：Ｉ／Ｏｃｏｎｔｒｏｌｌｅｒｈｕｂ）１３０に結合するためのプロプライエタリ・ハブ・インターフェース・バスである、システムＩ／Ｏ１２２を使用し得る。少なくとも１つの実施例では、ＩＣＨ１３０は、ローカルＩ／Ｏバスを介していくつかのＩ／Ｏデバイスに直接接続を提供し得る。少なくとも１つの実施例では、ローカルＩ／Ｏバスは、限定はしないが、周辺機器をメモリ１２０、チップセット、及びプロセッサ１０２に接続するための高速Ｉ／Ｏバスを含み得る。実例は、限定はしないが、オーディオ・コントローラ１２９と、ファームウェア・ハブ（「フラッシュＢＩＯＳ」）１２８と、ワイヤレス・トランシーバ１２６と、データ・ストレージ１２４と、ユーザ入力インターフェース１２５及びキーボード・インターフェースを含んでいるレガシーＩ／Ｏコントローラ１２３と、ＵＳＢなどのシリアル拡張ポート１２７と、ネットワーク・コントローラ１３４とを含み得る。データ・ストレージ１２４は、ハード・ディスク・ドライブ、フロッピー・ディスク・ドライブ、ＣＤ－ＲＯＭデバイス、フラッシュ・メモリ・デバイス、又は他の大容量ストレージ・デバイスを備え得る。

【0023】

図２は、少なくとも１つの実施例による、データ経路回路の改善された設計を生成するために強化学習を実施するための例示的なシステム２００を示す。いくつかの実施例では、システムはＱネットワークであるか、又はＱネットワークを含む。いくつかの実施例では、システム２００は深層Ｑネットワークであるか、又は深層Ｑネットワークを含む。

【0024】

強化学習（ＲＬ：ｒｅｉｎｆｏｒｃｅｍｅｎｔｌｅａｒｎｉｎｇ）は、逐次意思決定（ｓｅｑｕｅｎｔｉａｌｄｅｃｉｓｉｏｎｍａｋｉｎｇ）タスクに適用可能なアルゴリズムのクラスである。ＲＬは、エージェント２０２がそれの環境２０４における関数を最適化することを試みるマルコフ決定過程（ＭＤＰ：ＭａｒｋｏｖＤｅｃｉｓｉｏｎＰｒｏｃｅｓｓ）形式論を利用する。ＭＤＰは、（状態ｓ∈Ｓをもつ）状態空間Ｓと、アクション（ａｃｔｉｏｎ）空間Ａ（ａ∈Ａ）と、遷移関数Ｔ：Ｓ×Ａ→Ｓと、報酬関数

【数1】

とによって完全に記述され得る。
ＭＤＰにおいて、エピソードが離散時間ステップｔ＝０，１，２，．．．，ｎにわたって発展し、ここで、エージェント２０２は、状態ｓ_ｔ（２０６）を観測し、ポリシーπ（ａ_ｔ│ｓ_ｔ）を使用してアクションａ_ｔ（２１０）で応答する。環境２０４は、エージェント２０２に、次の状態ｓ_ｔ＋１～Ｔ（ｓ_ｔ，ａ_ｔ）２１２と報酬ｒ_ｔ＝Ｒ（ｓ_ｔ，ａ_ｔ）２１４とを提供する。エージェント２０２は、最適ポリシーπ^＊を学習することによって利得（累積的な将来の報酬）を最大にするというタスクを与えられる。

【0025】

Ｑネットワークは、Ｑ学習と呼ばれるプロセスを介して訓練され得る。Ｑ学習は、モデルが、最終的に、最大総報酬を生成することになるアクションのシーケンスを実施することを引き起こす強化学習プロセスである。この総報酬はＱ値とも呼ばれる。Ｑ値を算出するための関数は、以下の通りであり得る。
Ｑ（ｓ_ｔ，ａ_ｔ）←ｒ_ｔ＋γｍａｘ_ａＱ（ｓ_ｔ＋１，ａ）

【0026】

上式は、状態ｓ_ｔ（２０６）にあることと、アクションａ_ｔ（２１０）を実施することとからもたらされるＱ値が、即時報酬ｒ（ｓ_ｔ，ａ_ｔ）（２１４）＋次の状態ｓ_ｔ＋１（２１２）からの状態の可能な最高Ｑ値であることを示し、ここで、γは、さらに将来における報酬の寄与を制御する割引係数（ｄｉｓｃｏｕｎｔｆａｃｔｏｒ）である。Ｑ関数の再帰的定義は、Ｑ（ｓ_ｔ＋１，ａ_ｔ＋１）の式が、以下のように、将来の状態に広げられることを可能にする。
Ｑ（ｓ_ｔ，ａ_ｔ）＝ｒ_ｔ＋γｒ_ｔ＋１＋・・・＋γ^ｎ－１ｒ_{ｔ＋ｎ－１}＋γ^ｎＱ（ｓ_ｔ＋ｎ，ａ_ｔ＋ｎ）
エージェント２０２の機械学習モデル２４０は、以下の更新ステップを実施することによってＱ（ｓ_ｔ，ａ_ｔ）を予測することを学習する。

【数2】

ここで、αは、新たに獲得された情報が古い情報をどの程度までオーバーライドするかを制御する、学習レート又はステップ・サイズを表す。

【0027】

実施例では、ポリシーπの下での状態アクション・ペア（ｓ_ｔ，ａ_ｔ）のＱ値は、以下に記載されるように、状態ｓ_ｔ２０６においてアクションａ_ｔ２１０がとられ、ポリシーπを使用して将来のアクションがとられる場合、予想される利得になるように定義される。

【数3】

【0028】

実施例では、割引係数γ∈［０，１］は、短期報酬と長期報酬とを平衡させる。Ｑ学習アルゴリズムは、ランダム・ポリシーでエージェント２０２を開始し得、環境（ｓ_ｔ，ａ_ｔ，ｒ_ｔ，ｓ_ｔ＋１）２０４とのそれの対話中に集められた経験を使用して、学習レートα∈［０，１］でＱを更新することによって最適ポリシーに向けて反復する。

【数4】

【0029】

Ｑ学習エージェント２０２のためのポリシーは、π（・│ｓ_ｔ）＝ａｒｇｍａｘＱ（ｓ_ｔ，ａ）として表され得る。一実施例では、状態空間における探査（ｅｘｐｌｏｒａｔｉｏｎ）を増加させるための確率∈をもつランダム・アクションａが選定される、ａ∈グリーディ・ポリシー（ａ ∈－ｇｒｅｅｄｙｐｏｌｉｃｙ）が使用される。一実施例では、∈は、訓練の最中に０にアニールされ、評価を実施するときに０である。一実施例では、複数の探査が、ある範囲の∈値で並列に行われ得る。

【0030】

深層Ｑ学習は、基本的に上述のＱ値を近似するためにニューラル・ネットワークなどの１つ又は複数の機械学習モデル（たとえば、機械学習モデル２４０）を実装するＱ学習の拡張である。深層Ｑ学習では、上述のＱ値関数を近似するために、１つ又は複数の人工ニューラル・ネットワーク（たとえば、機械学習モデル２４０）が使用され得る。人工ニューラル・ネットワークは、概して、特徴を所望の出力空間にマッピングする分類器又は回帰層をもつ特徴表現構成要素を含む。畳み込みニューラル・ネットワーク（ＣＮＮ：ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ）は、たとえば、畳み込みフィルタの複数の層をホストする。下位層において、プーリングが実施され、非線形性が対処され得、その上に多層パーセプトロンが通常付加され、畳み込み層によって抽出された最上層特徴を判定（たとえば、プレフィックス回路の設計状態への修正）にマッピングする。深層学習は、特徴抽出及び変換のために非線形処理ユニットの複数の層のカスケードを使用する機械学習アルゴリズムのクラスである。各連続層が、前の層からの出力を入力として使用する。深層ニューラル・ネットワークは、教師あり（ｓｕｐｅｒｖｉｓｅｄ）（たとえば、分類）様式で、及び／又は教師なし（ｕｎｓｕｐｅｒｖｉｓｅｄ）（たとえば、パターン解析）様式で学習し得る。深層ニューラル・ネットワークは層の階層を含み、ここで、異なる層は、異なる抽象レベルに対応する異なる表現レベルを学習する。深層学習では、各レベルは、それの入力データをわずかにより抽象的な及び複合的な表現に変換することを学習する。特に、深層学習プロセスは、単独でどの特徴をどのレベルに最適に配置すべきかを学習することができる。「深層学習」における「深層」は、データが変換される層の数を指す。より正確には、深層学習システムは、実質的なクレジット割当て経路（ＣＡＰ：ｃｒｅｄｉｔａｓｓｉｇｎｍｅｎｔｐａｔｈ）深度を有する。ＣＡＰは、入力から出力への変換のチェーンである。ＣＡＰは、入力と出力との間の潜在的因果関係を説明する。フィードフォワード・ニューラル・ネットワークの場合、ＣＡＰの深度は、ネットワークの深度であり得、隠れ層の数＋１であり得る。信号が２回以上層を通って伝搬し得る、リカレント・ニューラル・ネットワークの場合、ＣＡＰ深度は潜在的に無制限である。

【0031】

実施例では、深層Ｑネットワーク（ＤＱＮ：ｄｅｅｐＱ－ｎｅｔｗｏｒｋ）は、（ｓ_ｔ＋１，ａ’）のＱ値を推定するために第２のターゲット・ネットワークを使用して訓練を安定させ得る。第２のターゲット・ネットワークは、第１のネットワークよりも低い頻度で更新され得る。実施例では、ＤＱＮは、経験再生バッファをサンプリングし得る。一実施例では、第１の機械学習モデルが、予測を決定するために使用され、第２のニューラル・ネットワークが、ターゲットを決定するために使用される。第２のニューラル・ネットワークは、実施例では、第１のニューラル・ネットワークと同じアーキテクチャを有し得る。しかしながら、一実施例では、第２のニューラル・ネットワークは、凍結パラメータを有し得るが、第１のニューラル・ネットワークは、可変パラメータを有し得る。一実施例では、第２のニューラル・ネットワークは、第１のニューラル・ネットワークよりも低い頻度で更新される。一実施例では、ダブルＤＱＮアルゴリズムが使用され、これは、さらに、ＤＱＮにおける過大推定を低減することによって訓練を改善し得る。

【0032】

いくつかの実施例では、システム２００は、エージェント（たとえば、アクター、回路修正器など）２０２と、環境（たとえば、シミュレーション環境、回路シンセサイザなど）２０４とを含むことができる。いくつかの実施例では、エージェント２０２は、１つ又は複数の機械学習モデル２４０を含むことができる。機械学習モデル２４０は、たとえば、深層ニューラル・ネットワーク（たとえば、畳み込みニューラル・ネットワーク、変換器、グラフ・ニューラル・ネットワークなど）又は判定ツリーであり得る。たとえば、機械学習モデル２４０は、深層Ｑネットワークのニューラル・ネットワークであり得る。

【0033】

いくつかの実例では、システム２００は、図１を参照しながら説明されたようにデータ経路回路１０８を設計するために利用され得る。実施例では、データ経路回路（たとえば、プレフィックス回路）の最適化は、それらの構築のためのＭＤＰを作成することによってＲＬタスクとしてフレーム化される。たとえば、ＲＬシステム２００は、（たとえば、可能な接続された論理が含まれる加算器の面積遅延最小化パレート・フロンティア（ａｒｅａ－ｄｅｌａｙｍｉｎｉｍｉｚｅｄｐａｒｅｔｏｆｒｏｎｔｉｅｒ）を設計するために）並列プレフィックス加算器のための設計を選択するように訓練され得る。いくつかの実施例では、エージェント２０２は、データ経路回路の設計を修正し、その修正に基づいて機械学習モデル２４０を訓練するように構成される。いくつかの実施例では、エージェント２０２は、グラフィカル処理ユニット（ＧＰＵ）又は中央処理ユニット（ＣＰＵ：ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）などの処理デバイス上で実行することができる。いくつかの実施例では、システム２００は、並列に動作し、学習を共有し得る、複数のエージェント２０２を含むことができる。各エージェント２０２は、同じ又は異なる処理デバイス、及び／或いは処理デバイスの同じ又は異なるコア上で実行し得る。各エージェントは、データ経路回路の修正を並列に実施し得、たとえば、複数のエージェント２０２は、データ経路回路を同時に修正し得る。これは、ターゲット又は最適データ経路回路設計を見つけるためにかかる時間の量を減少させ得る。いくつかの実施例では、（１つ又は複数の）エージェント２０２は、データ経路回路の設計状態２０６を受信することができる。設計状態２０６を受信すると、（１つ又は複数の）エージェント２０２は、アクション２１０を介して設計状態２０６を修正することができる。各エージェント２０２は、実施例では、異なるアクション２１０を出力し得る。いくつかの実施例では、アクション２１０は、機械学習モデル２４０（たとえば、深層ニューラル・ネットワークなど）によってエージェント２０２のために決定され得る。エージェント２０２はまた、データ経路回路の修正された状態を環境２０４に出力するように構成され得る。

【0034】

実施例では、データ経路回路１０８（たとえば、並列プレフィックス加算器などのプレフィックス回路）の設計は、プレフィックス・グラフを使用して表され得る。プレフィックス・グラフは、エッジが信号又は信号対を表し得、ノードが論理演算子を表し得る、有向非巡回グラフ（ＤＡＧ：ｄｉｒｅｃｔｅｄａｃｙｃｌｉｃｇｒａｐｈ）である。たとえば、並列プレフィックス算出が、有向非巡回並列プレフィックス・グラフとして表され得、ここで、あらゆる算出ユニットｚ_ｉ：ｊが、２つの入力に対して単一の演算を実施するグラフ・ノードであり、すなわち、ｚ_ｉ：ｊ＝ｚ_ｉ：ｋ°ｚ_{ｋ－１：ｊ}であり、ここで、°は、和演算、キャリー演算、差演算などの演算を表す。

【0035】

したがって、エージェント２０２は、データ経路回路の初期設計状態２０６を表すプレフィックス・グラフを受信することができる。エージェント２０２は、次いで、（たとえば、機械学習モデル２４０を使用して）プレフィックス・グラフを修正し、アクション２１０を介してデータ経路回路の修正された状態を表す新しいプレフィックス・グラフを出力し得る。実施例では、プレフィックス・グラフを修正することは、プレフィックス・グラフにおいて、ノードを追加すること、ノードを除去すること、又はノードを移動することを含み得る。

【0036】

図３は、少なくともいくつかの実施例による、例示的なプレフィックス・グラフ修正を示す。データ経路回路が、プレフィックス・グラフ３０５、３１０によって表され得、ここで、プレフィックス・グラフ３０５は、データ経路回路（たとえば、加算器など）のための回路設計の初期状態を表し、プレフィックス・グラフ３１０は、データ経路回路の修正又は更新された状態を表す。プレフィックス問題では、ｎ個の入力ｘ_ｎ－１，ｘ_ｎ－２，．．．ｘ_０、及び任意の結合演算子（ａｓｓｏｃｉａｔｉｖｅｏｐｅｒａｔｏｒ）°が、ｎ個の出力ｙ_ｉ＝ｘ_ｉ°ｘ_ｉ－１°．．．°ｘ_０、ｉ＝０，．．．，ｎ－１を算出するために使用される。したがって、各出力ｙ_ｉは、同じ又はより低いインデックス（ｊ≦ｉ）のすべての入力ｘ_ｊに依存する。

【0037】

一実例では、Ｎ入力プレフィックス和算出が、演算子の結合性により、いくつかのやり方で実施され得る。たとえば、４入力プレフィックス和が算出され得るやり方のうちの２つは、以下の通りである。
ｙ_０＝ｘ_０，ｙ_１＝ｘ_１°ｙ_０，ｙ_２＝ｘ_２°ｙ_１，ｙ_３＝ｘ_３°ｙ_２
ｙ_０＝ｘ_０，ｙ_１＝ｘ_１°ｙ_０，ｙ_２＝ｘ_２°ｙ_１，ｚ_３：２＝ｘ_３°ｘ_２，ｙ_３＝ｚ_３：２°ｙ_１

【0038】

この実例では、追加の項ｚ_３：２を導入することは、ｙ_２に対するｙ_３の依存性を壊し、それがｙ_２と並列に算出されることを可能にし、したがって、この項を並列プレフィックスにする。実施例は、ｘ_ｉ°ｘ_ｉ－１°．．．°ｘ_ｊを表すためにｚ_ｉ：ｊを示す。次いで、出力ｙ_ｉは、ｚ_ｉ：０として書き直され得、入力ｘ_ｉは、ｚ_ｉ：ｉとして書き直され得る。ｙ_０とｘ_０とが両方ともｚ_０：０に対応し得ることに留意されたい。

【0039】

並列プレフィックス算出が、有向非巡回並列プレフィックス・グラフとして表され得、ここで、あらゆる算出ユニットｚ_ｉ：ｊが、２つの入力に対して単一の演算を実施するグラフ・ノードであり、すなわち、ｚ_ｉ：ｊ＝ｚ_ｉ：ｋ°ｚ_{ｋ－１：ｊ}である。実施例では、算出ノードｚ_ｉ：ｊの最上位ビット及び最下位ビット（ＭＳＢ，ＬＳＢ）は、（ｉ，ｊ）であり得る。この記法を使用すると、ノード（ｉ，ｋ）は（ｉ，ｊ）の上位親であり得、ノード（ｋ－１；ｊ）は（ｉ，ｊ）の下位親であり得る。上記の実例の４入力プレフィックス和算出に対応するプレフィックス・グラフは、プレフィックス・グラフ３０５及びプレフィックス・グラフ３１０として図４に示されている。両方のグラフでは、ノード（２，０）の上位親及び下位親は、（２，２）及び（１，０）である。

【0040】

少なくとも１つの実施例では、あらゆる有効Ｎ入力プレフィックス・グラフが、１≦ｉ≦Ｎ－１について入力ノード（ｉ，ｉ）、出力ノード（ｉ，０）を有し、入力／出力ノード（０，０）を有する。さらに、少なくとも１つの実施例では、あらゆる非入力ノードは、正確に１つの上位親（ｕｐ）と１つの下位親（ｌｐ）とを有し、したがって、以下のようになる。
ＬＳＢ（ｎｏｄｅ）＝ＬＳＢ（ｌｐ（ｎｏｄｅ））
ＬＳＢ（ｌｐ（ｎｏｄｅ））≦ＭＳＢ（ｌｐ（ｎｏｄｅ））
ＭＳＢ（ｌｐ（ｎｏｄｅ））＝ＬＳＢ（ｕｐ（ｎｏｄｅ））－１
ＬＳＢ（ｕｐ（ｎｏｄｅ））≦ＭＳＢ（ｕｐ（ｎｏｄｅ））
ＭＳＢ（ｕｐ（ｎｏｄｅ））＝ＭＳＢ（ｎｏｄｅ）

【0041】

一実例では、データ経路回路は、入力３１５－ａ～３１５－ｄを受信し、出力３２５－ａ～３２５－ｄを作り出すことができる。いくつかの実例では、各入力３１５及び出力３２５は、データ経路回路によって受信されるか又は作り出される信号、或いはデータ経路回路に来るワイヤを表すことができる。いくつかの実例では、各入力３１５は、データ経路回路が合成するように構成された要素（又は何らかのデータ）を表すことができる。たとえば、データ経路回路がバイナリ加算器である実施例では、各入力は、加算器回路が算出和を実施するための入力のビットを表すことができ、たとえば、入力３１５－ａは、０番目のビット又は１の場所を表すことができ、入力３１５－ｄは、加算器回路がそれの和を見つけることになる数の第３のビット又は８の場所を表すことができる。したがって、各出力３２５は、データ経路回路によってそれの動作中に生成される値又はビットを表すことができる。いくつかの実施例では、各出力３２５は各前の入力から生成され得、たとえば、出力３２５－ｃは入力３１５－ａ～３１５－ｃから生成され得、出力３２５－ｄは入力３１５－ａ～３１５－ｄから生成され得る。

【0042】

いくつかの実施例では、各プレフィックス・グラフはまた、１つ又は複数のノードを含むことができる。たとえば、プレフィックス・グラフ３０５はノード３２０－ａ～３２０－ｃを含むことができる。いくつかの実施例では、各ノードは、１つ又は複数の演算を実施するデータ経路回路の１つ又は複数の構成要素を表すか、又はその構成要素に関連付けられる。たとえば、ノード３２０－ａは、データ経路回路１０８の１つ又は複数の論理ゲート（たとえば、ＡＮＤゲート、ＮＯＲゲート、ＸＯＲゲートなど）を表すことができる。いくつかの実施例では、ノード３２０はまた、バッファ又は他のタイプのゲートを表すことができる。

【0043】

いくつかの実施例では、データ経路回路の面積は、データ経路回路を表すプレフィックス・グラフ中のノード３２０の数に関係することがあり、たとえば、ノード３２０の数が大きいほど、データ経路回路に関連付けられた面積は大きくなる。たとえば、プレフィックス・グラフ３０５によって表されるデータ経路回路の面積は、プレフィックス・グラフ３１０によって表されるデータ経路回路の面積よりも小さくなり得、たとえば、プレフィックス・グラフ３０５ではノード３２０がより少ない。いくつかの実施例では、プレフィックス・グラフはまた、データ経路回路に関連付けられた遅延を示すことができる。たとえば、データ経路回路の遅延は、入力３１５が出力３２５として生成されるために要する最長経路に関係することがある。たとえば、入力３１５－ａは、プレフィックス・グラフ３０５において出力３２５－ｄを生成することにおいて利用される前に３つのノード３２０を通過するが、プレフィックス・グラフ３１０の各入力３１５は、せいぜい２つのノード３２０を通過する。そのような実施例では、プレフィックス・グラフ３１０に関連付けられたデータ経路回路の遅延は、プレフィックス・グラフ３０５に関連付けられたデータ経路回路１０８の遅延よりも少なくなり得る。

【0044】

図２及び図３を参照すると、いくつかの実例では、データ経路回路の各設計状態２０６は、固有のプレフィックス・グラフによって表され得る。そのような実施例では、エージェント２０２は、データ経路回路１０８の現在の設計状態２０６を表すプレフィックス・グラフを受信することができる。いくつかの実施例では、以下に詳細に記載されているように、及び図４を参照すると、プレフィックス・グラフのグリッド表現が受信される。一実例では、プレフィックス・グラフ３０５がデータ経路回路の初期設計状態２０６を表す場合、エージェント２０２は、それへの修正を実施する前に環境２０４からプレフィックス・グラフ３０５（又はプレフィックス・グラフのグリッド表現）を受信することができる。

【0045】

いくつかの実施例では、エージェント２０２は、データ経路回路の現在の設計状態２０６を表すプレフィックス・グラフのノード３２０を修正するアクション２１０をとるように構成され得る。少なくとも１つの実施例では、エージェント２０２は、ノード３２０を追加するか、又はデータ経路回路の現在の設計状態２０６を表すプレフィックス・グラフからノード３２０を除去することができる。たとえば、エージェント２０２は、ノード３２０－ｄをプレフィックス・グラフ３０５に追加することができる。いくつかの実施例では、機械学習モデル２４０は、どのノード３２０を除去すべきかを決定するか、又はどこでノード３２０をプレフィックス・グラフに追加すべきかを決定することができる。いくつかの実施例では、機械学習モデル２４０は、プレフィックス・グラフの入力グリッド表現を受信し、ノードが追加又は除去された、修正されたプレフィックス・グラフのグリッド表現を出力する。

【0046】

いくつかの実施例では、エージェント２０２は、グラフ有効性決定器２４４を含む。代替的に、グラフ有効性決定器２４４は環境２０４中に含まれ得る。グラフ有効性決定器２４４は、（たとえば、機械学習モデル２４０によって出力される）更新されたプレフィックス・グラフの有効性を査定（ａｓｓｅｓｓ）し得る。更新されたプレフィックス・グラフが無効である場合、グラフ有効性決定器２４４は、プレフィックス・グラフへの１つ又は複数のさらなる修正を実施して、それが有効になることを引き起こす。そのような修正は、１つ又は複数のノードの、プレフィックス・グラフへの追加又はプレフィックス・グラフからの除去であり得る。いくつかの実施例では、グラフ有効性決定器２４４が、アクション２１０が無効状態（たとえば、無効プレフィックス・グラフ）を生じると決定した場合、グラフ有効性決定器２４４は、再び設計状態２０６を修正することができる。すなわち、グラフ有効性決定器２４４は、アクションに続いて更新された状態を検証することができる。いくつかの実施例では、グラフ有効性決定器２４４は、無効ノードを追加又は除去すること、及び／或いは各ノードが以下で指定されているルールに従うことを確認することによって、状態を検証することができる。

【0047】

実施例では、上記で説明されたように、有効Ｎ入力プレフィックス・グラフが、１≦ｉ≦Ｎ－１について入力ノード（ｉ，ｉ）、出力ノード（ｉ，０）を有し、入力／出力ノード（０，０）を有する。たとえば、プレフィックス・グラフ３１０において、入力ノード（１，１）～（３，３）が、インデックス１～３における入力３１５－ｂ～３１５－ｄに対応し、出力ノード（１，０）～（３，０）が、ノード３２０－ａ～３２０－ｃに対応し、ノード３２０－ａ～３２０－ｃはインデックス１～３における出力３２５－ｂ～３２５－ｄを供給し、入力／出力ノード（０，０）がインデックス０における入力３１５－ａに対応し、入力３１５－ａは同じくインデックス０における出力３２５－ａを供給する。

【0048】

いくつかの実施例では、有効プレフィックス・グラフは、各非入力ノード（たとえば、（０，０）、（１，１）、（２，２）などでない各ノード）が、各非入力ノードがそこから値を直接受信する正確に２つの親、すなわち、上位親と下位親とを有するものであり得る。これらの親は、別の非入力ノード３２０又は入力３１５であり得る。すなわち、非入力ノード３２０が１つの親又は３つ以上の親を有するプレフィックス・グラフは無効である。いくつかの実施例では、有効プレフィックス・グラフはまた、各ノード３２０がそこから値を直接又は間接的に受信する入力インデックスの逐次連続範囲を有する各ノード３２０を有する。たとえば、ノード３２０－ｂはインデックス０、１及び２における入力から値を受信するように、範囲（２，０）をもつ有効ノードである。ノードについての（ＭＳＢ、ＬＳＢ）記法では、最上位ビット（ＭＳＢ：ｍｏｓｔ－ｓｉｇｎｉｆｉｃａｎｔｂｉｔ）が、ノードの範囲の上端又は第１の要素を表し、最下位ビット（ＬＳＢ：ｌｅａｓｔ－ｓｉｇｎｉｆｉｃａｎｔｂｉｔ）が、ノードの範囲の下端又は第２の要素を表す。範囲（０，２）をもつノード３２０は、その範囲がＭＳＢからＬＳＢに増加するので、無効になる。いくつかの実施例では、範囲（６，３）を有するが、インデックス５において入力から値を受信しないノード３２０をもつプレフィックス・グラフは無効であり、たとえば、その範囲は、ノード３２０がインデックス３、４、及び６において入力を受信するが、５において受信しないので、連続でない。

【0049】

さらに、各非入力ノードは、連続である正確に１つの上位親と１つの下位親とから値を直接受信することができる。たとえば、ノード３２０が範囲（３，１）を有し、範囲（３，３）を有する上位親を有する場合、ノード３２０はまた、範囲（２，１）を有する下位親を有しなければならない。すなわち、ノード３２０の上位親の範囲は、ノード３２０の範囲としてのＭＳＢ（たとえば、３）を有しなければならず、ノード３２０の下位親の範囲は、ノード３２０の範囲と同じＬＳＢ（たとえば、１）を有しなければならず、同時に、同じく連続であり、たとえば、インデックス２における入力を含む。したがって、プレフィックス・グラフは、上位親と下位親とに関する上記のルールに従うことができる。

【0050】

実施例では、Ｎ入力プレフィックス・グラフについてのアクション空間Ａは、任意の非入力／出力ノードについての２つのアクション（追加又は削除）からなり、たとえば、ここで、ＬＳＢ∈［１，Ｎ－２］であり、ＭＳＢ∈［ＬＳＢ＋１，Ｎ－１］である。したがって、｜Ａ｜＝（Ｎ－１）×（Ｎ－２）／２である。Ｔを通した環境発展は、１）有効性を維持するために追加のノードを追加又は削除し得るアクションの後に（たとえば、グラフ有効性決定器２４４によって実施される）検証プロシージャを適用すること、及び２）検証プロシージャによって元に戻されることになる冗長アクションを禁止することによって、有効プレフィックス・グラフを維持し得る。

【0051】

一実施例では、検証中に、ノードの上位親、ｕｐ（ｎｏｄｅ）は、同じＭＳＢと次に高いＬＳＢとをもつ既存のノードである。一実施例では、ノードの下位親、ｌｐ（ｎｏｄｅ）は、以下に従って、ノードとそれの上位親とを使用して算出される。
（ＭＳＢ_{ｌｐ（ｎｏｄｅ）}，ＬＳＢ_{ｌｐ（ｎｏｄｅ）}）＝（ＬＳＢ_{ｕｐ（ｎｏｄｅ）}－１，ＬＳＢ_ｎｏｄｅ）

【0052】

一実施例では、ノードの下位親が存在しないとき、無効条件が起こる。そのような条件では、グラフ有効性決定器２４４は、消失した下位親ノードを追加するために検証プロシージャを実施する。

【0053】

一実施例では、システム２００（たとえば、環境２０４又はエージェント２０２）は、有効プレフィックス・グラフにおけるすべてのノードのリストｎｏｄｅｌｉｓｔを維持する。一実施例では、ｎｏｄｅｌｉｓｔ中にすでに存在するノードを追加するアクションは冗長であり、禁止される。一実施例では、システム２００（たとえば、環境２０４又はエージェント２０２）は、他のノードの下位親でない、ｎｏｄｅｌｉｓｔからのノードの最小リストｍｉｎｌｉｓｔを維持する。一実施例では、ノードを削除するアクションは、ｍｉｎｌｉｓｔ中のノードに限定され、場合によっては、存在しないか又は別のノードの下位親であるかのいずれかであるノードは削除され得る。そのような修正のために、削除されたノードは、検証中に再追加され得る。

【0054】

環境２０４は、アクション２１０（たとえば、プレフィックス・グラフ更新）を受信し、現在の設計状態２０６に対するアクション２１０に関連付けられた次の設計状態２１２と報酬２１４とを決定する。環境２０４は初期状態Ｓ_０で開始し得、初期状態Ｓ_０は、いくつかの実施例ではランダムに選定され得る。いくつかの実例では、環境２０４は、ＣＰＵ又はＧＰＵなど、１つ又は複数の処理デバイス上で実行することができる。いくつかの実施例では、システム２００は複数の環境２０４を含むことができ、それらの各々は、異なるアクション（たとえば、データ経路回路の異なる修正された状態）を受信し得る。一実例では、複数の環境２０４は、ターゲット・データ経路回路設計を見つけるための時間の量を減少させるために異なるエージェント２０２によって出力されるデータ経路回路の修正された状態を同時に受信し得る。少なくとも１つの実施例では、環境２０４は、機械学習モデル２４０によって選定されたアクション２１０に基づいて設計状態２０６を更新又は修正することができる。一実施例では、環境２０４は、アクション２１０の後の状態２１２についてのプレフィックス・グラフを生成することができ、たとえば、環境は、アクション２１０が、値（３，２）をもつノード３２０をプレフィックス・グラフ３０５に追加することを指定したとき、プレフィックス・グラフ３１０を生成することができる。いくつかの実施例では、エージェント２０２は、修正された状態に関連付けられたプレフィックス・グラフを受信することができ、たとえば、エージェント２０２は、プレフィックス・グラフ３１０、又はプレフィックス・グラフのグリッド表現を受信することができる。

【0055】

あらゆるアクション２１０について（たとえば、データ経路回路のあらゆる設計状態について）、環境２０４のプレフィックス・グラフ・アセッサ（ａｓｓｅｓｓｏｒ）２４２が、データ経路回路の１つ又は複数のパラメータを推定し得る。そのような推定されたパラメータは、たとえば、データ経路回路の面積、データ経路回路の電力消費、及び／又はデータ経路回路の遅延を含み得る。プレフィックス・グラフ・アセッサ２４２は、次いで、決定されたパラメータを、データ経路回路についての１つ又は複数の目標及び／又は制約と比較し得る。さらに、プレフィックス・グラフ・アセッサ２４２は、データ経路回路の前の状態（たとえば、設計状態２０６）についての同様のパラメータを推定し得る（又は前に推定していることがある）。プレフィックス・グラフ・アセッサ２４２は、さらに、データ経路回路の前の状態についてのパラメータを、制約及び／又は目標と比較し得る。プレフィックス・グラフ・アセッサ２４２は、初期設計状態２０６のパラメータ、及び／又はパラメータと目標との間の距離を、更新された設計状態２１２のパラメータ、及び／又はパラメータと目標との間の距離と比較し得る。そのような比較に基づいて、プレフィックス・グラフ・アセッサ２４２は報酬２１４を出力し得る。たとえば、更新された設計状態に関連付けられたパラメータが、前の設計状態に関連付けられたパラメータよりも目標に近い場合、正の報酬２１４が出力され得る。一方、更新された設計状態に関連付けられたパラメータが、前の設計状態に関連付けられたパラメータよりも目標から遠い場合、負の報酬２１４が出力され得る。環境２０４はまた、エージェント２０２に入力されるべき次の設計状態２１２を出力し得る。

【0056】

環境２０４が、現在の設計状態２０６を修正するためのアクション２１０に続いて次の設計状態２１２が有効であると決定するか、又は修正された設計状態を検証した場合、環境は、次の報酬２１４を計算することができる。いくつかの実施例では、報酬２１４は、アクション２１０の結果としてデータ経路回路１０８の面積、電力消費及び／又は遅延の純変化を予測する。すなわち、環境２０４は、初期状態（又は現在の設計状態２０６）についての遅延、面積、及び電力と、次の設計状態２１２についての遅延、面積、及び電力とを計算し、次の報酬２１４を計算するためにそれらの２つの間の差を決定することができる。一実施例では、環境２０４は、図８を参照しながら説明されるように報酬を決定することができる。いくつかの実施例では、環境２０４は、図７を参照しながら説明されるように第２の機械学習モデルを介して報酬を決定することができる。すなわち、環境２０４は、アクション２１０に続いてデータ経路回路の面積、遅延、及び電力の変化を予測する第２の機械学習モデルを含むことができる。いくつかの実例では、環境２０４は、図５を参照しながら説明されるように報酬２０８（又は次の報酬２１４）を決定することができる。

【0057】

たとえば、環境２０４は、プレフィックス・グラフ３０５によって表される設計を有するデータ経路回路１０８によって消費される面積、遅延、及び／又は電力を決定することができる。いくつかの実例では、環境２０４のプレフィックス・グラフ・アセッサ２４２は、プレフィックス・グラフ（たとえば、プレフィックス・グラフ３０５）が与えられれば、物理的データ経路回路の面積、遅延、及び／又は電力を算出する合成ツール５０５を利用することができる。いくつかの実例では、合成ツール５０５は、使用すべき論理ゲートのタイプを決定すること、使用すべき論理ゲートのサイズを決定すること、論理ゲートの接続性を決定すること、バッファ又は他の構成要素がプレフィックス・グラフを最適化することになるかどうかを決定することなどを行うことができる。いくつかの実例では、合成ツール５０５を介してプレフィックス・グラフから潜在的物理的データ経路回路を生成することは、データ経路回路の面積、遅延、又は電力消費を増加又は減少させることができる。すなわち、潜在的な物理的データ経路回路を生成することは、物理的制約及び製造制約によるプレフィックス・グラフからの特定の回路実装形態への変更及び修正を引き起こすことができる。たとえば、プレフィックス・グラフのノードが４つの他のノードへの入力であった（たとえば、４つの他のノードがそのノードから値を受信する）場合、合成ツール５０５は、潜在的な物理的データ経路回路を生成するときにバッファを挿入し、面積の増加を引き起こすことができる。

【0058】

いくつかの実施例では、環境２０４のプレフィックス・グラフ・アセッサ２４２はまた、エージェント２０２によって出力された（たとえば、入力プレフィックス・グラフの修正及び検証の結果である）プレフィックス・グラフ（たとえば、プレフィックス・グラフ３１０）によって表される設計を有するデータ経路回路によって消費される面積、遅延、及び／又は電力を決定することができる。データ経路回路の面積、遅延、及び／又は電力を決定するために、環境は、プレフィックス・グラフから、予測された物理的データ経路回路を生成するために合成ツール５０５を使用することができる。各計算について（たとえば、プレフィックス回路３０５などの初期プレフィックス回路の計算、及びプレフィックス回路３１０などの修正又は更新されたプレフィックス回路の計算について）、プレフィックス・グラフ・アセッサ２４２は、グラフ５１０についての面積／遅延曲線を決定することができる。すなわち、環境２０４は、それぞれの面積についての初期プレフィックス・グラフ（たとえば、プレフィックス・グラフ３０５）に関連付けられたデータ経路回路の遅延を表す曲線５１５を決定することができる。同様に、環境２０４は、それぞれの面積についての更新されたプレフィックス・グラフ（たとえば、プレフィックス・グラフ３１０）に関連付けられたデータ経路回路の遅延を表す曲線５２０を決定することができる。

【0059】

いくつかの実施例では、環境は、図６を参照しながら説明される重み制約に基づいて遅延及び面積の差を決定することによって、アクション２１０の報酬を計算することができる。たとえば、重みが１である場合、報酬は、たとえば、図６を参照しながら説明される重み曲線に基づいて、ポイント５３０とポイント５３５との間の差をとることによって計算され得る。この実施例では、アクション２１０を介したプレフィックス・グラフ３０５からプレフィックス・グラフ３１０への修正は、面積及び遅延を低減した。したがって、環境２０４は、アクション２１０を介して低減された面積の量と低減された遅延の量とを示す次の報酬２１４を計算することができる。他の実施例では、環境２０４は、増加された面積、減少された面積、増加された遅延、減少された遅延、又はそれらの組合せを示す次の報酬２１４を計算することができる。面積対遅延が図５に示されているが、環境２０４は、次の報酬２１４を計算するときに、面積、電力、遅延、又はそれらの任意の組合せの差を決定することができる。いくつかの実施例では、環境２０４は、次の報酬をエージェント２０２に、たとえば、機械学習モデル２４０に送出することができる。

【0060】

エージェント２０２は、次の報酬２１４を受信するように構成され得る。いくつかの実施例では、エージェント２０２は、とられたアクション２１０がデータ経路回路を最適化したかどうか、たとえば、アクション２１０がデータ経路回路の面積、電力、及び／又は遅延の低減を引き起こしたかどうかを決定することができる。いくつかの実施例では、エージェント２０２は、機械学習モデル２４０を訓練するために強化学習を使用することができる。すなわち、エージェント２０２は、受信された次の報酬２１４に基づいて機械学習モデル２４０を訓練することができる。一実施例では、エージェント２０２は、報酬２１４と前に出力されたアクション２１０とに基づいて（１つ又は複数の）機械学習モデル２４０を訓練する。訓練は、（たとえば、アクション及び報酬に基づいて）誤差を定義することと、誤差が最小限に抑えられるようにネットワークの重みをすべてのそれの層及びノードにわたって調整するために確率勾配降下及び逆伝搬などの技法を使用することとによって実施され得る。

【0061】

一実例では、次の報酬２１４が面積、電力、又は遅延の低減を示す場合、機械学習モデル２４０は、低減を生じたアクションと同様のアクション２１０をとり続けることができる。次の報酬２１４が面積、電力又は遅延の増加を示す場合、機械学習モデル２４０は、機械学習モデルにおけるノードの重みを調節することによって他のアクション２１０をとるように訓練され得る。いくつかの実施例では、機械学習モデルは、モデル（ベース／なし）、値／ポリシーベース、又はオン／オフ・ポリシー強化学習技法を使用して訓練され得る。

【0062】

上記で説明されたように、機械学習モデル２４０が深層Ｑネットワークの構成要素として使用される実施例では、機械学習モデル２４０は、設計状態２０６の入力を受信し、アクション２１０についての面積及び遅延低減を予測し得る。たとえば、機械学習モデル２４０は、状態ｓ_ｔ２０６を入力として受信し、以下を予測し得る。
∀ａ∈Ａ：［Ｑ_ａｒｅａ（ｓ_ｔ，ａ），Ｑ_{ｄｅｌａｙ}（ｓ_ｔ，ａ）］

【0063】

機械学習モデルへの入力は、Ｎ×Ｎ×４テンソルであり得、ここで、４つのチャネルは、以下のようにノード特徴を符号化する。
１）ｎｏｄｅｌｉｓｔ中のノード（ＭＳＢ，ＬＳＢ）の場合１であり、他の場合０である、
２）ｍｉｎｌｉｓｔ中のノード（ＭＳＢ，ＬＳＢ）の場合１であり、他の場合０である、
３）ｎｏｄｅｌｉｓｔ中のノード（ＭＳＢ，ＬＳＢ）のレベルであり、他の場合０である、
４）ｎｏｄｅｌｉｓｔ中のノード（ＭＳＢ，ＬＳＢ）のファンアウトであり、他の場合０である、
ここで、ｎｏｄｅｌｉｓｔは、有効プレフィックス・グラフ中のすべてのノード３２０であり、ｍｉｎｌｉｓｔは、他のノードの下位親でないｎｏｄｅｌｉｓｔ中のすべてのノード３２０であり、ノードのレベルは、プレフィックス・グラフ中の入力ノードからのトポロジー深度（たとえば、それとそれぞれの入力３１５との間のノード３２０の数）であり、ノードのファンアウトは、それに従属するノード３２０の数を指す。経時的に、強化学習技法を介した機械学習モデル２４０は、データ経路回路１０８の設計を最も最適化する、たとえば、データ経路回路１０８の面積、電力及び／又は遅延を低減するアクション２１０をとるように訓練される。

【0064】

いくつかの実施例では、エージェント２０２は、エージェント２０２が最適化することになる各固有の回路について機械学習モデル２４０の異なるインスタンスを別個に訓練するように構成され得る。たとえば、エージェント２０２が、３２ビット加算器回路について機械学習モデル２４０を訓練し、６４ビット加算器回路について機械学習モデル２４０の別のインスタンスを別個に訓練することができる。いくつかの実施例では、機械学習モデル２４０の異なるインスタンスは、各それぞれのプロパティについて訓練され、たとえば、できる限り面積を低減するようにデータ経路回路の各ターゲット遅延時間について訓練され得る。機械学習モデルとともに強化学習を利用することによって、データ経路回路の設計は、他のソリューションと比較してそれよりも最適化され得、たとえば、データ経路回路の遅延、面積、及び／又は電力は低減され得る。したがって、データ経路回路がより少ない電力を消費し、遅延がより少なくなり、メモリ・システムにおいてより少ない面積を占めるので、データ経路回路を組み込む任意のシステム（たとえば、メモリ・システム）の全体的性能は増加することができる。

【0065】

いくつかの実例では、エージェント２０２及び／又は環境２０４は、本明細書で説明されるように、データ経路回路１０８の面積、遅延、及び／又は電力を最適化するアクション２１０をとるように機械学習モデル２４０を訓練するために強化学習を使用することができる。いくつかの実施例では、機械学習モデル２４０は、プログラムされた制約又は値に基づいてノード３２０を追加すべきであるのか除去すべきであるのかを決定することができる。たとえば、機械学習モデル２４０は、データ経路回路の最大回路幅、最大到着時間、面積と遅延との間の重み（又は面積と電力との間の重み、電力と遅延との間の重み、電力と面積との間の重み、或いはそれらの任意の組合せ）、技術ライブラリ、合成ツール、回路生成器オプション、及び／又はデータ経路回路についての他のターゲット・パラメータによって制約され得る。そのような制約は、実施例では、環境２０４によって提供され、報酬２１４を決定するために使用され得る。

【0066】

一実例では、機械学習モデル２４０は、データ経路回路の遅延が最大回路遅延を超えることを引き起こさないノードを追加又は除去しないように訓練され得る。いくつかの実施例では、機械学習モデル２４０は、データ経路回路の入力３１５の到着時間、たとえば、データ経路回路自体に関連付けられた遅延ではなく、入力３１５を受信することに関連付けられた何らかの遅延によって制約され得る。いくつかの実施例では、機械学習モデル２４０は、ターゲット・パラメータによって制約され得る。たとえば、機械学習モデル２４０は、データ経路回路が所与の面積、電力消費及び／又は遅延に達するまで、データ経路回路を修正する（たとえば、設計する）ように訓練され得る。別の実例では、機械学習モデル２４０は、重みパラメータを使用して、面積目的での改善と、電力消費目的での改善と、遅延目的での改善との間の重み付けされた平衡のために最適化するためにデータ経路回路を修正する（たとえば、設計する）ように訓練され得る。他の実施例では、機械学習モデル２４０は、所与の面積、所与の電力消費、及び／又は所与の遅延についてデータ経路回路を修正するように訓練され得る。

【0067】

いくつかの実施例では、機械学習モデル２４０は、回路生成器オプションによって制約され得る。すなわち、同じ並列プレフィックス・グラフについてデータ経路回路を生成するための異なるやり方があり得、たとえば、データ経路回路の予測された物理的実装形態は、物理的実装形態を予測するためにどのオプションが選択されるかに基づいて変化することができる。たとえば、加算器データ経路回路について、プレフィックス加算器回路は、概して、以下の関数を実施する。
Ｏ（ｎ＋１）＝Ａ（ｎ）＋Ｂ（ｎ）＋Ｃ（１）
ここで、「Ｏ」は、長さｎ＋１ビットを有する出力であり、「Ａ」及び「Ｂ」は、長さ「ｎ」ビットを有するバイナリ入力であり、「Ｃ」は、長さ１ビットを有する入力である。いくつかの実施例では、回路生成器は、異なる関数及び結果を引き起こす異なるオプションができる。たとえば、以下の関数が可能である。
１）キャリーインを有しない（たとえば、「Ｃ」値がない）：Ｏ（ｎ＋１）＝Ａ（ｎ）＋Ｂ（ｎ）、
２）キャリーアウトを有しない：Ｏ（ｎ）＝Ａ（ｎ）＋Ｂ（ｎ）＋Ｃ（１）、
３）キャリーイン又はキャリーアウトを有しない：Ｏ（ｎ）＝Ａ（ｎ）＋Ｂ（ｎ）、
４）入力「Ａ／Ｂ／Ｃ」の１つ又は複数のビットが値１及び０において固定されるとき。
いくつかの実施例では、システム２００は、上記に記載したオプションのいずれかの間で選択することができる。そのような実例では、エージェント２０２又は環境２０４は、どのオプションが選択されるかに基づいて同じ並列プレフィックス・グラフから、異なるタイプの回路を生成することができ、たとえば、同じプレフィックス・グラフは、回路生成器についての選択された設定に基づいて異なる面積、遅延、電力消費、又はそれらの任意の組合せを生じることができる。したがって、エージェント２０２は、データ経路回路について選択された特定の設定及びオプションに基づいて訓練される。いくつかの実施例では、プレフィックス加算器生成はまた、再現（ｒｅｃｕｒｒｅｎｃｅ）の選定（たとえば、ワインバーガー又はリング）又はビット単位キャリー伝搬論理の選定（ＸＯＲ又はＯＲ）によって影響を及ぼされ得る。いくつかの実施例では、上記に記載した回路生成器についての様々なオプションは、加算器回路に適用され得、たとえば、優先度符号器回路などの他のデータ経路回路に適用され得ない。

【0068】

いくつかの実施例では、システム２００は、データ経路回路１０８中に、接続された論理を含めることを選定することができる。たとえば、環境２０４は、プレフィックス回路の入力及び／又は出力に接続された追加の回路論理とともに、プレフィックス・グラフに対応するプレフィックス回路を生成する回路生成器を使用することができる。そのような実例では、エージェント２０２は、プレフィックス回路に接続された特定の追加の回路論理に基づいて訓練される。そのような実例では、プレフィックス・グラフ・アセッサ２４２は、プレフィックス回路及び組み合わせられた追加の回路論理の面積、電力消費及び／又は遅延を査定し得る。

【0069】

他の実施例では、機械学習モデル２４０は、面積を最適化すること、電力消費を最適化すること、及び／又は遅延を最適化することの間の重み付けされた平衡によって制約され得る。たとえば、プレフィックス・グラフ・アセッサは、報酬２１４を算出するときに、推定された面積、電力消費及び／又は遅延の間の重み付けされた平衡を使用し得る。すなわち、上記で説明されたように、データ経路回路に関連付けられた面積、又は電力、又は遅延を低減するためにデータ経路回路を修正することは、データ経路回路の異なるプロパティが増加することを引き起こすことがあり、たとえば、遅延を低減することは、データ経路回路の面積が増加することを引き起こすことがある。たとえば、プレフィックス・グラフ３１０を生成するためにプレフィックス・グラフ３０５を修正することは、データ経路回路の遅延が減少することを引き起こすが、データ経路回路の面積が増加することを引き起こすことがある。したがって、機械学習モデル２４０は、遅延及び面積に割り当てられたそれぞれの重みに従ってデータ経路回路を最適化するように訓練され得る。

【0070】

一実例では、図６は、データ経路回路についての遅延と面積との間の曲線上の可能な重み付けされた値を示す。いくつかの実施例では、重み付けされた値６１０は１の重み値を表す。そのような実施例では、機械学習モデル２４０が遅延だけを最適化しようとする（最小限に抑えようとする）ことを引き起こす報酬が決定され得、たとえば、強化学習は、データ経路回路の面積の得られた減少又は増加を顧慮せずに遅延を低減するアクション２１０をとるように機械学習モデル２４０を訓練する。いくつかの実施例では、重み付けされた値６０２は０の重み値を表す。そのような実施例では、機械学習モデル２４０は、データ経路回路の面積だけを最適化する（最小限に抑える）ように訓練され、たとえば、強化学習は、データ経路回路の遅延の得られた減少又は増加を顧慮せずに面積を低減するアクション２１０をとるように機械学習モデル２４０を訓練する。重み付けされた値６０８は、面積についてよりも遅延についてより最適化することを表すことができ、重み付けされた値６０４は、遅延についてよりも面積についてより最適化することを表すことができる。いくつかの実施例では、重み付けされた値６０６は、遅延と面積とについて等しく最適化することを表すことができる。

【0071】

いくつかの実施例では、機械学習モデル２４０及び／又は環境２０４は、遅延と面積との間でどのくらい最適化すべきかを決定するために、以下の式を使用することができる。

【数5】

ここにおいて、Ｑａｒｅａは、データ経路回路の面積を最適化することに関連付けられ、Ｑｄｅｌａｙは、データ経路回路の遅延を最適化することに関連付けられ、ｓ_ｔ＋１は次の設計状態２１２を示し、「ａ」は、とられたアクション（たとえば、どのノード３２０が追加されたか又はプレフィックス・グラフから除去されたか）を示し、「ｗ」は所定の重みを表す。そのような実施例では、重み「ｗ」は、０と１との間の値を有することができる。重み付けされた平衡を利用することによって、機械学習モデル２４０は、遅延、又は面積、又は電力、又はそれらの任意の組合せについて最適化するように訓練され得る。すなわち、環境２０４は、データ経路回路についての遅延が同じであるが、面積が低減されるように、又はその逆も同様であるようにデータ経路回路についての設計を修正するように機械学習モデル２４０を訓練するために更新され得る。図６は、遅延を最適化することと面積を最適化することとの間の平衡を示すが、面積と電力との間の重み付けされた平衡、又は遅延と電力との間の重み付けされた平衡も可能である。いくつかの実施例では、面積と遅延と電力との間の重み付けされた平衡も可能であり、たとえば、グラフ６００は、機械学習モデル２４０及び／又は環境２０４が電力と遅延と面積との間で最適化することにどのくらい重みを加えるべきかを表す３次元グラフであり得る。

【0072】

いくつかの実施例では、グリッド表現は、図４に示されているように、プレフィックス・グラフを表すために使用される。プレフィックス・グラフのグリッド表現の使用は、プレフィックス・グラフが機械学習モデルによって処理されることを可能にする。グリッド表現は、グリッドでの（たとえば、２次元グリッドでの）プレフィックス・グラフの簡潔な表現である。プレフィックス・グラフのグリッド表現の各行と各列とはプレフィックス・グラフの異なる入力に関連付けられ得、行と列との各交点はプレフィックス・グラフのノードに関連付けられ得る。一実施例では、システム２００の状態空間Ｓは、すべての有効Ｎ入力プレフィックス・グラフからなる。Ｎ入力グラフは、ＭＳＢを表す行とＬＳＢを表す列とをもつＮ×Ｎグリッドで表され得る。実施例では、入力ノード（ＭＳＢ＝ＬＳＢ）が対角線上にあり、出力ノードが第１の列上にあることになり（ＬＳＢ＝０）、対角線の上方のロケーション（ＬＳＢ＞ＭＳＢ）がノードを含んでいないことがあることに留意されたい。実施例では、非入力／出力ノードが存在することもしないこともある残りの（Ｎ－１）（Ｎ－２）／２個のロケーションは、Ｎ入力プレフィックス・グラフの

【数6】

状態空間を定義する。たとえば、３２入力グラフが、｜Ｓ｜＝Ｏ（２^４６５）の状態空間を有し得、ここで、厳密な値は、ノードの可能な組合せのうちのいくつかが有効でないことにより、より低い。

【0073】

図３～図４を参照すると、グリッドの各値は、プレフィックス・グラフ３０５上の入力３１５（たとえば、入力ノード）又は潜在的ノード３２０を表すことができる。そのような実施例では、各ノード３２０は、プレフィックス・グラフ３０５上のそれのロケーションに対応するグリッド４０５上の範囲（たとえば、位置）を有することができる。各範囲は、行インデックスをそれの第１の要素として含み、列インデックスをそれの第２の要素として含むことができる。たとえば、ノード３２０－ａは、範囲４２０－ａ（１，０）によって表され得、たとえば、ノード３２０－ａは、第１の入力（たとえば、１又は３１５－ｂ）及び第２の入力（たとえば、０又は３１５－ａ）を受信する。

【0074】

図３を参照しながら説明されるように、プレフィックス・グラフの各出力３２５は、直接又は間接的にあらゆる前の入力３１５から値を受信する。有効プレフィックス・グラフは、連続範囲、たとえば、（２，０）又は（３，１）に関連付けられたノード３２０を有することになり、ここで、ノード３２０は、それぞれインデックス０～２又は１～３において入力を受信する。そのような実施例では、第１の要素が第２の要素よりも小さい範囲は可能でなく、たとえば、（０，３）は、ノードについての可能な範囲でない。

【0075】

いくつかの実施例では、機械学習モデル２４０は、データ経路回路の初期状態のグリッド表現を受信することができ、追加、又はプレフィックス・グラフからの除去のためにノード３２０を選択し得る。機械学習モデル２４０は、次いで、追加又は除去のためにノードのグリッド表現を出力し得る。たとえば、Ｑネットワークのための機械学習モデル２４０は、出力グリッド表現をあらゆるノード位置におけるＱ値でポピュレートし得る。任意の位置におけるＱ値は、その位置に対応するノード３２０についての、（ノードが存在しない場合）追加アクション又は（ノードが存在する場合）除去アクションについてのＱ値に対応することになる。いくつかの実施例では、機械学習モデル２４０は、同じ次元の複数のグリッド表現を出力し得る。たとえば、機械学習モデル２４０が、データ経路回路１０８の面積及び遅延について最適化しているＱネットワークである場合、機械学習モデル２４０は、Ｑ_ａｒｅａについてのグリッド表現とＱ_{ｄｅｌａｙ}についてのグリッド表現とを出力し得る。そのような実例では、最高に重み付けされたＱ値をもつアクションが、ノード３２０を追加するか、又はプレフィックス・グラフからノード３２０を除去するために選定されることになる。

【0076】

いくつかの実施例では、機械学習モデル２４０は、現在の設計状態２０６のグリッド表現を受信することができる。たとえば、機械学習モデル２４０は、現在の設計状態２０６がプレフィックス・グラフ３０５によって表されるとき、生成されたグリッド４０５を受信することができる。いくつかの実施例では、機械学習モデル２４０は、追加すべき、又はグリッド４０５から除去すべきノードを選択することによって、プレフィックス・グラフ３０５を修正することができる。一実施例では、機械学習モデル２４０は、グリッド４１０を生成するために、ノード４２０－ｄ（たとえば、（３，２））をグリッド４０５に追加することを選択することができる。少なくともいくつかの実施例では、グリッド４１０は、プレフィックス・グラフ３０５への修正を表すことができる。たとえば、範囲４２０－ｄをプレフィックス・グラフについてのグリッドに追加することによって、プレフィックス・グラフ３０５は、追加のノード３２０－ｄをもつプレフィックス・グラフ３１０についてのグリッドを生成するために修正され得る。

【0077】

実施例では、エージェント２０２（たとえば、エージェント２０２の機械学習モデル２４０）は、アクションを出力することができる。出力されたアクションは、プレフィックス・グラフを更新するためのアクション（たとえば、追加すべき新しいノード、又は削除すべき既存のノード）であり得る。一実例では、（３，２）においてノードが追加されるべきグリッド表現が出力される。環境２０４は、出力されたアクション２１０（たとえば、グリッド表現におけるノード・ロケーション（３，２）とともに追加アクション）を受信する。環境は、プレフィックス・グラフ上で、プレフィックス・グラフのグリッド表現上で、又はプレフィックス・グラフの他の表現上で動作するように構成され得る。いくつかの実施例では、環境２０４は、プレフィックス・グラフのグリッド表現上のノード・ロケーション（たとえば、（３，２））を受信し、前の状態のグリッド（たとえば、グリッド４０５）からグリッド（たとえば、グリッド４１０）に更新した後にプレフィックス・グラフ３１０を生成する。

【0078】

本開示中の他の場所で説明されるように、機械学習モデル２４０は、とられるアクション２１０が、面積、電力消費及び／又は遅延についてデータ経路回路を最適化するように、強化学習を使用して訓練され得る。すなわち、機械学習モデル２４０が、たとえば、データ経路回路に関連付けられた１つ又は複数のプロパティを最適化するために範囲（３，２）を有するノード３２０－ｄを追加することを決定するように、たとえば、それが、重み付けされた制約に従って遅延、面積、電力、及び／又はそれらの任意の組合せを低減するように、機械学習モデル２４０は訓練され得る。他の場所で説明されるように、いくつかの実施例では、割引係数など、強化学習アルゴリズムにおけるいくつかのパラメータは、データ経路回路１０８に関連付けられた１つ又は複数のプロパティを経時的に最適化するアクションのシーケンスを選定するように訓練される機械学習モデル２４０を訓練するように構成され得る。

【0079】

図７は、少なくとも１つの実施例による、強化及び機械学習を使用するデータ経路回路設計の例示的な図７００を示す。図７００に示されている強化学習は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せを備える処理論理によって実施され得る。少なくとも１つの実施例では、図７００に示されている動作は、図２を参照しながら説明されたようにエージェント２０２、機械学習モデル２４０、及び／又は環境２０４によって実施される動作を含む。特定のシーケンス又は順序で示されているが、別段に規定されていない限り、プロセスの順序は修正され得る。したがって、図示の実施例は実例としてのみ理解されるべきであり、図示されたプロセスは、異なる順序で実施され得、いくつかのプロセスは並列に実施され得る。さらに、１つ又は複数のプロセスは、様々な実施例で省略され得る。したがって、すべてのプロセスがあらゆる実施例において必要とされるとは限らない。

【0080】

動作７０５において、エージェント２０２は、データ経路回路の現在の設計状態２０６を受信することができる。いくつかの実例では、エージェント２０２は、データ経路回路の現在の設計状態２０６に対応するプレフィックス・グラフを受信することができる。少なくとも１つの実施例では、エージェント２０２は、図４を参照しながら説明されたようにプレフィックス・グラフのグリッド表現を受信又は生成することができる。いくつかの実施例では、エージェント２０２は、現在の設計状態２０６のグリッド表現を機械学習モデル２４０に送出することができる。いくつかの実施例では、エージェント２０２はまた、報酬（たとえば、図２を参照しながら説明された報酬２０８）を受信することができる。そのような実施例では、エージェント２０２は、受信された報酬に基づいて強化技法を用いて機械学習モデル２４０を訓練することができる。たとえば、機械学習モデル２４０によってとられた前のアクションが、データ経路回路に関連付けられた面積、遅延、又は電力の低減を生じたことを報酬が示す場合、エージェントは、同様のアクションをとり続けるように機械学習モデル２４０を訓練することができる。

【0081】

動作７１０において、機械学習モデル２４０は、並列プレフィックス回路のグリッド表現を受信することができる。いくつかの実施例では、機械学習モデル２４０は、プレフィックス・グラフのグリッド表現を修正するためのアクションを選択することができる。いくつかの実施例では、機械学習モデル２４０は、ノードを追加する、又はプレフィックス・グラフからノードを除去するアクションを選択することができ、たとえば、機械学習モデルは、図２及び図４を参照しながら説明されたように、プレフィックス・グラフ上でノードを追加又は除去することに対応する、グリッド表現上の範囲を選択することができる。

【0082】

動作７１５において、エージェント２０２は、アクション（たとえば、（３，２）においてノードを追加すること）を環境２０４に送信することができる。

【0083】

動作７２０において、環境２０４は、プレフィックス・グラフのグリッド表現への修正に基づいて次の報酬２１４を計算することができ、たとえば、環境２０４は、エージェント２０２から受信されたアクションに基づいてグリッド表現を修正し、次いで、それに応じてプレフィックス・グラフを修正することができる。いくつかの実施例では、環境２０４は、最初に、図２を参照しながら説明されたように、受信されたアクションが、設計状態２０６が有効になることを引き起こすのか無効になることを引き起こすのかを決定することができる。いくつかの実施例では、環境２０４が、状態が無効になることをアクションが引き起こすと決定した場合、環境２０４は、プレフィックス・グラフに無効ノードを追加すること、又はプレフィックス・グラフから無効ノードを除去することによって状態を検証することができる。いくつかの実施例では、環境２０４は、エージェント２０２から受信されたアクションを適用した後の修正された状態が有効であると決定した後に、又はエージェント２０２から受信されたアクションを適用した後の修正された状態を検証した後に、次の設計状態２１２を表すプレフィックス・グラフを生成することができる。いくつかの実施例では、環境２０４は、次の設計状態２１２を表すプレフィックス・グラフを生成した後に、現在の設計状態２０６及び修正された次の設計状態２１２についての面積、遅延、及び／又は電力を計算することができる。一実施例では、環境２０４は、設計状態２０６及び次の設計状態２１２の各々に対して回路合成を実施することによって、次の報酬２１４を計算することができる。そのような実施例では、環境２０４は、設計状態２０６についての及び次の設計状態２１２についての面積、遅延、及び／又は電力を決定し、その２つの間の差を決定して、図５を参照しながら説明されたように次の報酬２１４を決定することができる。

【0084】

いくつかの実施例では、環境２０４は、次の報酬２１４を計算するためのメトリック予測器モデル（ｍｅｔｒｉｃｓｐｒｅｄｉｃｔｏｒｍｏｄｅｌ）（たとえば、第２の機械学習モデル又は第２のモデル）を含むことができる。そのような実施例では、メトリック予測器モデルは、データ経路回路の各状態についての、たとえば、設計状態２０６についての及び次の設計状態２１２についての遅延、面積、及び／又は電力を予測するように訓練され得る。たとえば、最初に、環境２０４は、回路合成を使用することによって修正されたデータ経路回路の面積、電力、及び／又は遅延を決定することができる。データベースが、環境によって生成された各状態と、それぞれの状態に関連付けられた面積、電力、及び／又は遅延メトリックとを記憶することができる。たとえば、データベースは、設計状態２０６と、次の設計状態２１２と、設計状態２０６及び次の設計状態２１２についての面積、電力、及び／又は遅延とを記憶することができる。メトリック予測器モデルは、データベースにおいて記憶されたデータを処理し、それぞれの状態についての面積、電力、及び遅延を予測するように訓練され得る。すなわち、メトリック予測器モデルは、状態を入力として受信し、データベースにおいて記憶されたデータを処理することに基づいて、たとえば、前の状態とそれらのそれぞれの遅延、面積、及び電力とを処理することに基づいて、状態に関連付けられた面積、遅延、及び／又は電力を予測するように訓練され得る。メトリック予測器モデルは、実施例においてプレフィックス・グラフのグリッド表現を入力として受信するように訓練され得る。したがって、メトリック予測器モデルが訓練されるとき、環境は、所与の状態に関連付けられたプレフィックス・グラフ（又はグリッド表現）をメトリック予測器モデルに送出することができる。そのような実施例では、メトリック予測器モデルは、それぞれの状態についての遅延、面積、及び／又は電力を予測することができる。報酬を計算するために、環境２０４は、メトリック予測器モデルによって出力された予測された遅延、面積及び／又は電力間の差を見つけることができる。たとえば、環境２０４は、設計状態２０６及び次の設計状態２１２をメトリック予測器モデルに提供することができる。そのような実施例では、メトリック予測器モデルは、設計状態２０６についての及び次の設計状態２１２についての遅延、面積、及び／又は電力を予測することができる。環境２０４は、次いで、次の報酬２１４を決定するために、次の設計状態２１２についての遅延、面積及び／又は電力と、設計状態２０６の遅延、面積及び／又は電力との間の差を見つけることができる。いくつかの実施例では、環境２０４は、次いで、報酬２１４をエージェント２０２に返送することができる。そのような実施例では、エージェント２０２は、本明細書で説明されるように強化学習技法を介して機械学習モデル２４０を訓練するために次の報酬２１４を利用することができる。いくつかの実施例では、面積、遅延、及び電力を予測するために機械学習を使用することは、回路合成を実施することよりも、少ないリソースを要し、少ない時間を消費することができる。

【0085】

図８は、少なくとも１つの実施例による、機械学習モデル２４０を使用して強化学習を実施する例示的なシステム８００を示す。いくつかの実施例では、システム８００は、図２を参照しながら説明されたように、エージェント（たとえば、アクター、回路修正器など）２０２と、環境（たとえば、シミュレーション環境、回路シンセサイザなど）２０４とを含むことができる。いくつかの実施例では、システム８００は、並列回路合成８１０と、データベース８１０と、オプティマイザ８２５とを含むことができる。いくつかの実施例では、エージェント２０２は、図２を参照しながら説明されたように機械学習モデル２４０を含むことができる。いくつかの実例では、オプティマイザ８２５は、エージェント２０２中に含まれ得る。少なくとも１つの実施例では、システム２００は、図１を参照しながら説明されたようにデータ経路回路１０８を設計するために利用され得る。

【0086】

図２を参照しながら説明されたように、エージェント２０２は、データ経路回路の状態を修正するためのアクションを選択するように構成され得る。いくつかの実施例では、環境２０４は、修正を適用し、必要な場合、修正された状態を検証し、次の状態（たとえば、新しい状態８０５）をエージェント２０２に返すように構成され得る。いくつかの実例では、環境２０４はまた、エージェント２０２によってとられるアクション２１０を適用した後に生成される状態をプレフィックス・グラフにコンバートし、たとえば、図４を参照しながら説明されたように、エージェント２０２からのアクションを適用することによって生成されるグリッドをプレフィックス・グラフにコンバートすることができる。いくつかの実施例では、システム８００は、図２を参照しながら説明されたようにデータ経路回路の設計が最適化されるまで、このプロセスを続けることができる。いくつかの実施例では、システム８００は、プロセスを実施するための複数のエージェント２０２と複数の環境２０４とを含むことができる。

【0087】

少なくとも１つの実施例では、システム８００は、エージェント２０２からのアクション８０５を適用することとは別個に、初期状態８０５から新しい状態８０５への遷移のための報酬を計算することができる。すなわち、システム８００は、図２及び図７に示された方法と比較して、データ経路回路１０８を設計するために強化学習を利用するための代替方法を示す。

【0088】

たとえば、一実施例では、エージェント２０２は、とられるアクション（たとえば、ノードを追加又は除去すること）を環境２０４とデータベース８２０の両方に送出することができる。同様に、環境２０４は、現在状態をエージェント２０２に、同様にデータベース８２０に、及び並列回路合成８１０に送出することができる。そのような実施例では、環境２０４及びエージェント２０２は、報酬を決定するためにプレフィックス・グラフを予測された物理的データ経路回路にコンバートするために、回路合成８１０を待つことなしにアクション及び状態を循環することができ、たとえば、エージェント２０２及び環境２０４は、より短い持続時間において状態及びアクションを循環することができる。

【0089】

いくつかの実施例では、並列回路合成８１０は、プレフィックス・グラフを予測された物理的データ経路回路に合成する１つ又は複数のＣＰＵを含むことができる。そのような実施例では、並列回路合成８１０はまた、環境２０４から受信された各状態８０５についての、たとえば、それぞれの状態８０５に関連付けられた各プレフィックス・グラフについての報酬を計算することができる。すなわち、並列回路合成８１０は、環境２０４から受信された各プレフィックス・グラフ及び状態８０５についての面積、電力、及び遅延を決定することができる。いくつかの実施例では、並列回路合成８１０は、複数の報酬８１５を計算し、同時に複数のプレフィックス・グラフを合成することができ、たとえば、並列回路合成８１０中に含まれる各ＣＰＵは、異なる状態８０５についての報酬８１５を計算することができる。いくつかの実例では、並列回路合成８１０を利用することは、各状態８０５についての報酬８１５を計算するための時間を低減することができる。いくつかの実施例では、並列回路合成８１０は、各状態８０５についての計算された報酬８１５をデータベース８２０に送出することができる。

【0090】

いくつかの実施例では、データベース８２０は、状態８０５と、アクション２１０と、報酬８１５、たとえば、第１の状態８０５から第２の状態８０５への遷移上でとられる各アクション２１０についての報酬８１５とを記憶するように構成され得る。いくつかの実施例では、データベースは、状態８０５とアクション２１０と報酬８１５とをデータベースに送出し、たとえば、第１の状態８０５と、第２の状態８０５と、第１の状態８０５から第２の状態８０５に進むために使用されたそれぞれのアクション２１０と、修正のために計算された報酬とを送出することができる。いくつかの実施例では、オプティマイザ８２５は、状態８０５と、アクション２１０と、報酬８１５とについてデータベースにアクセスすることができる。

【0091】

いくつかの実施例では、オプティマイザ８２５は、データベースから状態８０５と、アクション２１０と、報酬８１５とを受信することができる。たとえば、オプティマイザ８２５は、第１の状態８０５と、第２の状態８０５と、第１の状態８０５から第２の状態８０５に進むために使用されたそれぞれのアクション２１０と、修正のために計算された報酬８１５とを受信することができる。オプティマイザ８２５は、とられたアクション２１０がデータ経路回路の面積、遅延、又は電力の減少を生じたかどうかを決定することができる。いくつかの実例では、オプティマイザ８２５は、とられたアクション２１０がデータ経路回路１０８の面積、電力、及び／又は遅延を低減したかどうかを決定したことに応答して、機械学習モデル２４０を訓練することができる。たとえば、オプティマイザ８２５が、アクション２１０がデータ経路回路の面積、遅延、及び／又は電力を低減することができなかったと決定した場合、オプティマイザ８２５は、そのようなアクション２１０を再びとることを回避するように機械学習モデル２４０を更新又は訓練することができる。したがって、機械学習モデル２４０は、強化学習を使用して訓練され得る。そのような実施例では、更新された機械学習モデル２４０は、異なるアクション２１０をとり、たとえば、エージェント２０２が、訓練又は更新されたことに応答して異なるアクション２１０をとることを引き起こすことができる。それにおいて、最初に、エージェント２０２は、初期機械学習アルゴリズムを使用して複数のアクション８０２をとることができる。エージェント２０２が複数のアクションを循環する間、並列回路合成８１０は、とられた各アクション２１０についての報酬８１５を同時に計算することができる。合成が、アクション２１０を実施することよりも長くかかるので、エージェント２０２は、任意の報酬８１５が計算される前にいくつかのアクション２１０を循環させ続けることができる。いくつかの実施例では、報酬８１５が計算されたとき、データベースは、情報をオプティマイザ８２５に送出することができる。したがって、機械学習モデル２４０は、更新され、エージェントが、更新された機械学習アルゴリズムを使用してアクション２１０をとることを引き起こすことができる。エージェント２０２は、次いで、追加の報酬８１５が、機械学習アルゴリズムを２回目に更新するために、オプティマイザ８２５によって計算され、使用されるまで、更新された機械学習アルゴリズムを使用してアクション２１０を循環することができる。システム８００は、本方法を使用すること、たとえば、データ経路回路１０８についての最適ターゲット・パラメータが満たされるまで、機械学習モデル２４０を周期的に更新しながら、アクション２１０が循環する、エージェント２０２及び環境２０４とは無関係に報酬を計算することを続けることができる。

【0092】

図９Ａは、強化学習を用いてデータ経路回路を設計するための方法９００のフロー図を示す。方法９００は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せを備える処理論理によって実施され得る。少なくとも１つの実施例では、方法９００は、図２を参照しながら説明されたようにシステム２００によって実施される。特定のシーケンス又は順序で示されているが、別段に規定されていない限り、プロセスの順序は修正され得る。したがって、図示の実施例は実例としてのみ理解されるべきであり、図示されたプロセスは、異なる順序で実施され得、いくつかのプロセスは並列に実施され得る。さらに、１つ又は複数のプロセスは、様々な実施例で省略され得る。したがって、すべてのプロセスがあらゆる実施例において必要とされるとは限らない。データ経路回路を設計するための方法を示す他の図が可能である。

【0093】

動作９０５において、処理論理は、データ経路回路の第１の設計状態を受信することができる。一実施例では、データ経路回路は並列プレフィックス回路を備えることができる。少なくとも１つの実施例では、処理論理は、第１の設計状態を受信したことに応答して第１の設計状態を表す第１の並列プレフィックス・グラフを生成することができる。すなわち、処理論理は、第１の並列プレフィックス・グラフを利用して並列プレフィックス回路の第１の設計状態を表すことができる。少なくとも１つの実施例では、処理論理は、第１の並列プレフィックス・グラフのグリッド表現を生成することができる。

【0094】

動作９１０において、処理論理は、データ経路回路の第１の設計状態を機械学習モデルに入力することができる。少なくとも１つの実施例では、処理論理は、第１の並列プレフィックス・グラフのグリッド表現を生成した後に、そのグリッド表現を機械学習モデルに入力する。

【0095】

動作９１５において、処理論理は、機械学習モデルにデータ経路回路の最終設計状態を出力させるために、機械学習モデルを使用して強化学習を実施する。最終設計状態は、強化学習の複数の反復の後に達成され得、ここで、各反復について、異なる設計状態が生成及び査定され、ここで、各反復について、機械学習モデルは、前の設計状態よりも改善された新しい設計状態を作り出すように訓練される。いくつかの実施例では、データ・パッチ回路の最終設計状態は、第１の設計状態に関連付けられたターゲット・パラメータ値により近い最終パラメータ値に関連付けられる。すなわち、処理論理は、図２を参照しながら説明されたようにデータ経路回路の設計を最適化するために強化学習を使用することができる。いくつかの実施例では、第１のパラメータ値及び最終パラメータ値は、データ経路回路に関連付けられた面積、データ経路回路に関連付けられた遅延、データ経路回路に関連付けられた電力消費の予測、又はそれらの任意の組合せを表すことができる。したがって、データ・パッチ回路の最終設計状態は、第１のパラメータ値よりも小さい、面積、遅延、又は電力消費を有する最終パラメータ値に関連付けられる。いくつかの実施例では、第１のパラメータ値及び第２のパラメータ値は、重み付けされた値、たとえば、図６を参照しながら説明されたように重み付けされた値の予測を表すことができる。いくつかの実施例では、機械学習モデルは、処理論理が、最終設計状態を表す最終プレフィックス・グラフのグリッド表現を構築することを引き起こすアクションを出力する。すなわち、機械学習モデルはアクションを出力することができ、処理論理は、アクションを利用して、グリッド表現を生成し、グリッド表現を、最終設計状態を表すプレフィックス・グラフにコンバートすることができる。いくつかの実施例では、機械学習モデルは、データ経路回路の設計状態を第１の設計状態から最終設計状態に反復的に修正することができ、ここで、各反復中に、機械学習モデルは、データ経路回路のグラフのノードを除去又は追加し、グラフの各ノードは、データ経路回路の１つ又は複数の構成要素に、たとえば、データ経路回路の１つ又は複数の論理ゲートに関連付けられる。

【0096】

図９Ｂは、強化学習を用いてデータ経路回路を設計するための方法９０２のフロー図を示す。方法９０２は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せを備える処理論理によって実施され得る。少なくとも１つの実施例では、方法９０２は、図２を参照しながら説明されたようにシステム２００によって実施される。特定のシーケンス又は順序で示されているが、別段に規定されていない限り、プロセスの順序は修正され得る。したがって、図示の実施例は実例としてのみ理解されるべきであり、図示されたプロセスは、異なる順序で実施され得、いくつかのプロセスは並列に実施され得る。さらに、１つ又は複数のプロセスは、様々な実施例で省略され得る。したがって、すべてのプロセスがあらゆる実施例において必要とされるとは限らない。データ経路回路を設計するための方法を示す他の図が可能である。

【0097】

方法９０２の動作９２０において、処理論理は、データ経路回路の設計状態を受信することができる。いくつかの実施例では、処理論理は、データ経路回路の第１の設計状態を受信することができる。いくつかの実施例では、処理論理は、設計状態を表す並列プレフィックス・グラフ、たとえば、第１の設計状態を表す第１の並列プレフィックス・グラフを生成することができる。いくつかの実施例では、処理論理は、並列プレフィックス・グラフのグリッド表現、たとえば、第１の並列プレフィックス・グラフの第１のグリッド表現を生成することができる。いくつかの実施例では、処理論理は、グリッド表現を機械学習モデルに入力することができる。

【0098】

動作９２５において、処理論理は、次の設計状態、たとえば、第２の設計状態を生成するために機械学習モデルを使用してデータ経路回路の設計状態を処理することができる。いくつかの実施例では、機械学習モデルは、環境が、第２の設計状態、たとえば、修正された設計状態を生成するためにデータ経路回路の設計状態に適用するアクションを出力する。いくつかの実施例では、機械学習モデルは、第２の設計状態を生成するために、第１の設計状態に追加すべき、又は第１の設計状態から削除すべきグリッド表現中のノードを出力することができる。すなわち、機械学習モデルは、処理論理が、第２の設計状態に関連付けられた第２のグラフのグリッド表現、たとえば、次の設計状態に関連付けられた第２の並列プレフィックス・グラフの第２のグリッド表現を構築するために利用することができるアクションを出力することができる。いくつかの実施例では、処理論理は、グラフの第２のグリッド表現を第２の並列プレフィックス・グラフにコンバートすることができる。

【0099】

動作９２８において、処理論理は、第２の設計状態が有効であるかどうかを決定することができる。第２の設計状態が無効である場合、本方法は動作９２９に進む。第２の設計状態が有効であると決定された場合、本方法は動作９３０に進む。動作９２９において、処理論理は、有効である更新された第２の設計状態を作り出すためにデータ経路回路の第２の設計状態を修正し、たとえば、追加のノードを追加及び／又は除去することによって、並列プレフィックス・グラフを検証する。いくつかの実施例では、処理論理は、第１及び第２の設計状態をデータ経路回路実装形態にコンバートすることができる。本方法は、次いで動作９３０に進む。

【0100】

動作９３０において、処理論理は、第１の設計状態についての第１のパラメータ値を決定し、第２の設計状態についての第２のパラメータ値を決定し、たとえば、第１の設計状態についての第１のパラメータ値を決定し、第２の設計状態についての第２のパラメータ値を決定することができる。いくつかの実施例では、処理論理は、設計状態と次の設計状態とに関連付けられた面積、遅延、及び電力を決定することができ、たとえば、第１のパラメータ値及び第２のパラメータ値は、面積、遅延、及び電力を表すことができる。処理論理は、次いで、第１のエリア、遅延及び／又は電力に基づいて（たとえば、これらの値の第１の重み付けされた組合せに基づいて）第１のパラメータ値を決定し、第２の面積、遅延及び／又は電力に基づいて（たとえば、これらの値の第１の重み付けされた組合せに基づいて）第２のパラメータ値を決定することができる。

【0101】

いくつかの実施例では、処理論理は、第２のモデル（たとえば、第２の機械学習モデル又はメトリック予測器モデル）を使用して第１の設計状態を処理することができ、ここで、第２のモデルは、第１の設計状態に関連付けられた第１のパラメータ値を出力する。同様に、処理論理は、第２のモデルを使用して第２の設計状態を処理することができ、ここで、第２のモデルは、第２の設計状態に関連付けられた第２のパラメータ値を出力し、たとえば、メトリック予測器モデルは、第１のパラメータ値と第２のパラメータ値とを出力するために第１の設計状態と第２の設計状態とを処理することができる。そのような実施例では、処理デバイスは、第１のパラメータ値を受信するために、第１の設計状態の第１のグラフのグリッド表現を第１の入力として第２のモデルに送出し、第２のパラメータ値を受信するために、第２の設計状態の第２のグラフのグリッド表現を第２の入力として第２のモデルに送出することができ、たとえば、メトリック予測器モデルは、第１のグラフのグリッドと第２のグラフのグリッド表現とを受信したことに基づいて第１のパラメータ値と第２のパラメータ値とを出力することができる。いくつかの実施例では、第２のモデルは、第１のパラメータ値を決定するために、第１の設計状態の回路実装形態を第１の入力として受信し、第２のパラメータ値を決定するために、第２の設計状態の回路実装形態を第２の入力として受信することができ、たとえば、メトリック予測器モデルは、第１の並列プレフィックス・グラフと第２の並列プレフィックス・グラフとを受信することができる。いくつかの実施例では、処理論理は、回路合成ツールを使用して第１の設計状態と第２の設計像とを処理することができる。そのような実施例では、回路合成ツールは、第１のパラメータ値と第２のパラメータ値とを出力することができる。そのような実施例では、回路合成ツールは、機械学習モデルがデータ経路回路の第２の設計状態を出力することと同時に、第１の設計状態を処理することができる。

【0102】

動作９３５において、処理論理は、たとえば、機械学習モデルによって選択された修正がデータ経路回路に関連付けられた面積、遅延、電力消費、又はそれらの任意の組合せを低減したのか増加させたのかに基づいて、機械学習モデルを更新することができる。機械学習モデルを更新した後に、動作９３８において、処理論理は、１つ又は複数の停止基準が満たされたかどうかを決定することができる。たとえば、設計状態のしきい値数の反復の後に、（たとえば、面積、電力及び／又は遅延についての）１つ又は複数のターゲット目標が満たされた後に、（１つ又は複数の）パラメータ値に対するさらなる改善なしに、しきい値数回の設計状態反復が実施された後になど、停止基準が満たされ得る。停止基準が満たされた場合、本方法は動作９４５に進み得、動作９４５において、データ経路回路についての最終設計状態が選択され得る。最終設計状態は、たとえば、直近の設計状態、或いは最良のデータ経路回路メトリック（たとえば、最良の面積、遅延、電力消費、又はそれらの任意の組合せ）又はターゲットに最も近いパラメータを取得した反復中に遭遇した設計状態であり得る。停止基準が満たされなかった場合、動作９４０において、処理論理は、機械学習モデルに入力されるべき次の設計状態を選択し得る。次の設計状態は、たとえば、直近の設計状態、又は反復中に遭遇した別の設計状態であり得る。本方法は動作９２５に戻り得、動作９２５において、次の設計状態は、機械学習モデルを使用して処理される。処理論理は、更新された機械学習モデルを利用することができる。たとえば、処理論理は、更新された機械学習モデルを使用して設計状態又は次の設計状態を処理することができ、たとえば、処理論理は、機械学習モデルを使用して第１の設計状態又は第２の設計状態を処理することができる。いくつかの実施例では、更新された機械学習モデルは、第１の設計状態又は第２の設計状態の修正であるデータ経路回路の第３の設計状態を出力する。少なくとも１つの実施例では、処理論理は、第３の設計状態に関連付けられた第３のパラメータ値を決定することができ、第３のパラメータ値は、第１のパラメータ値又は第２のパラメータ値よりもターゲットに近い。プロセスは、停止基準が満たされるまで、第４、第５、及びそれ以上の設計状態について繰り返すことができる。

【0103】

図１０Ａは、１つ又は複数の実施例に関連付けられた推論及び／又は訓練動作を実施するために使用される推論及び／又は訓練論理１０１５を示す。推論及び／又は訓練論理１０１５に関する詳細は、図１０Ａ及び／又は図１０Ｂと併せて以下で提供される。

【0104】

少なくとも１つの実施例では、推論及び／又は訓練論理１０１５は、限定はしないが、１つ又は複数の実施例の態様において推論するために訓練及び／又は使用されるニューラル・ネットワークのニューロン又は層を構成するための順方向及び／若しくは出力の重み及び／又は入力／出力データ、並びに／或いは他のパラメータを記憶するためのコード及び／又はデータ・ストレージ１００１を含み得る。少なくとも１つの実施例では、訓練論理１０１５は、タイミング及び／又は順序を制御するためのグラフ・コード又は他のソフトウェアを記憶するためのコード及び／又はデータ・ストレージ１００１を含むか、又はそれに結合され得、コード及び／又はデータ・ストレージ１００１において、整数及び／又は浮動小数点ユニット（総称して、算術論理ユニット（ＡＬＵ：ａｒｉｔｈｍｅｔｉｃｌｏｇｉｃｕｎｉｔ））を含む論理を構成するために、重み及び／又は他のパラメータ情報がロードされるべきである。少なくとも１つの実施例では、グラフ・コードなどのコードは、コードが対応するニューラル・ネットワークのアーキテクチャに基づいて、重み又は他のパラメータ情報をプロセッサＡＬＵにロードする。少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００１は、１つ又は複数の実施例の態様を使用する訓練及び／又は推論中の入力／出力データ及び／又は重みパラメータの順方向伝搬中に１つ又は複数の実施例と併せて訓練又は使用されるニューラル・ネットワークの各層の重みパラメータ及び／又は入力／出力データを記憶する。少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００１の任意の部分は、プロセッサのＬ１、Ｌ２、又はＬ３キャッシュ或いはシステム・メモリを含む、他のオンチップ又はオフチップ・データ・ストレージとともに含められ得る。

【0105】

少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００１の任意の部分は、１つ又は複数のプロセッサ或いは他のハードウェア論理デバイス又は回路の内部又は外部にあり得る。少なくとも１つの実施例では、コード及び／又はコード及び／又はデータ・ストレージ１００１は、キャッシュ・メモリ、動的なランダムにアドレス指定可能なメモリ（「ＤＲＡＭ」：ｄｙｎａｍｉｃｒａｎｄｏｍｌｙａｄｄｒｅｓｓａｂｌｅｍｅｍｏｒｙ）、静的なランダムにアドレス指定可能なメモリ（「ＳＲＡＭ」：ｓｔａｔｉｃｒａｎｄｏｍｌｙａｄｄｒｅｓｓａｂｌｅｍｅｍｏｒｙ）、不揮発性メモリ（たとえば、フラッシュ・メモリ）、又は他のストレージであり得る。少なくとも１つの実施例では、コード及び／又はコード及び／又はデータ・ストレージ１００１が、たとえばプロセッサの内部にあるのか外部にあるのか、或いは、ＤＲＡＭ、ＳＲＡＭ、フラッシュ又は何らか他のストレージ・タイプからなるかどうかの選定が、利用可能なストレージ、オンチップ対オフチップ、実施されている訓練及び／又は推論機能のレイテンシ要件、ニューラル・ネットワークの推論及び／又は訓練において使用されるデータのバッチ・サイズ、或いはこれらのファクタの何らかの組合せに依存し得る。

【0106】

少なくとも１つの実施例では、推論及び／又は訓練論理１０１５は、限定はしないが、１つ又は複数の実施例の態様において推論するために訓練及び／又は使用されるニューラル・ネットワークのニューロン又は層に対応する逆方向及び／若しくは出力の重み及び／又は入力／出力データを記憶するためのコード及び／又はデータ・ストレージ１００５を含み得る。少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００５は、１つ又は複数の実施例の態様を使用する訓練及び／又は推論中の入力／出力データ及び／又は重みパラメータの逆方向伝搬中に１つ又は複数の実施例と併せて訓練又は使用されるニューラル・ネットワークの各層の重みパラメータ及び／又は入力／出力データを記憶する。少なくとも１つの実施例では、訓練論理１０１５は、タイミング及び／又は順序を制御するためのグラフ・コード又は他のソフトウェアを記憶するためのコード及び／又はデータ・ストレージ１００５を含むか、又はそれに結合され得、コード及び／又はデータ・ストレージ１００５において、整数及び／又は浮動小数点ユニット（総称して、算術論理ユニット（ＡＬＵ））を含む論理を構成するために、重み及び／又は他のパラメータ情報がロードされるべきである。少なくとも１つの実施例では、グラフ・コードなどのコードは、コードが対応するニューラル・ネットワークのアーキテクチャに基づいて、重み又は他のパラメータ情報をプロセッサＡＬＵにロードする。少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００５の任意の部分は、プロセッサのＬ１、Ｌ２、又はＬ３キャッシュ或いはシステム・メモリを含む、他のオンチップ又はオフチップ・データ・ストレージとともに含められ得る。少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００５の任意の部分は、１つ又は複数のプロセッサ或いは他のハードウェア論理デバイス又は回路の内部又は外部にあり得る。少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００５は、キャッシュ・メモリ、ＤＲＡＭ、ＳＲＡＭ、不揮発性メモリ（たとえば、フラッシュ・メモリ）、又は他のストレージであり得る。少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００５が、たとえばプロセッサの内部にあるのか外部にあるのか、或いは、ＤＲＡＭ、ＳＲＡＭ、フラッシュ又は何らか他のストレージ・タイプからなるかどうかの選定が、利用可能なストレージ、オンチップ対オフチップ、実施されている訓練及び／又は推論機能のレイテンシ要件、ニューラル・ネットワークの推論及び／又は訓練において使用されるデータのバッチ・サイズ、或いはこれらのファクタの何らかの組合せに依存し得る。

【0107】

少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００１と、コード及び／又はデータ・ストレージ１００５とは、別個のストレージ構造であり得る。少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００１と、コード及び／又はデータ・ストレージ１００５とは、同じストレージ構造であり得る。少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００１と、コード及び／又はデータ・ストレージ１００５とは、部分的に同じストレージ構造であり、部分的に別個のストレージ構造であり得る。少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００１コード及び／又はデータ・ストレージ１００５の任意の部分は、プロセッサのＬ１、Ｌ２、又はＬ３キャッシュ或いはシステム・メモリを含む、他のオンチップ又はオフチップ・データ・ストレージとともに含められ得る。

【0108】

少なくとも１つの実施例では、推論及び／又は訓練論理１０１５は、限定はしないが、訓練及び／又は推論コード（たとえば、グラフ・コード）に少なくとも部分的に基づく、又はそれによって示される論理演算及び／又は数学演算を実施するための、整数及び／又は浮動小数点ユニットを含む、１つ又は複数の算術論理ユニット（「ＡＬＵ」）１０１０を含み得、その結果が、アクティブ化ストレージ１０２０に記憶されるアクティブ化（たとえば、ニューラル・ネットワーク内の層又はニューロンからの出力値）を作り出し得、これらのアクティブ化は、コード及び／又はデータ・ストレージ１００１並びに／或いはコード及び／又はデータ・ストレージ１００５に記憶される入力／出力及び／又は重みパラメータ・データの関数である。少なくとも１つの実施例では、アクティブ化ストレージ１０２０に記憶されるアクティブ化は、命令又は他のコードを実施したことに応答して（１つ又は複数の）ＡＬＵ１０１０によって実施される線形代数及び又は行列ベースの数学に従って生成され、コード及び／又はデータ・ストレージ１００５並びに／或いはコード及び／又はデータ・ストレージ１００１に記憶された重み値は、バイアス値、勾配情報、運動量値などの他の値、或いは他のパラメータ又はハイパーパラメータとともにオペランドとして使用され、これらのいずれか又はすべてが、コード及び／若しくはデータ・ストレージ１００５又はコード及び／若しくはデータ・ストレージ１００１、或いはオンチップ又はオフチップの別のストレージに記憶され得る。

【0109】

少なくとも１つの実施例では、（１つ又は複数の）ＡＬＵ１０１０は、１つ又は複数のプロセッサ或いは他のハードウェア論理デバイス又は回路内に含まれるが、別の実施例では、（１つ又は複数の）ＡＬＵ１０１０は、それらを使用するプロセッサ或いは他のハードウェア論理デバイス又は回路（たとえば、コプロセッサ）の外部にあり得る。少なくとも１つの実施例では、ＡＬＵ１０１０は、プロセッサの実行ユニット内に含まれるか、或いはさもなければ、同じプロセッサ内にあるか又は異なるタイプの異なるプロセッサ（たとえば、中央処理ユニット、グラフィックス処理ユニット、固定機能ユニットなど）間で分散されているかのいずれかであるプロセッサの実行ユニットによってアクセス可能なＡＬＵのバンク内に含まれ得る。少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００１と、コード及び／又はデータ・ストレージ１００５と、アクティブ化ストレージ１０２０とは、同じプロセッサ或いは他のハードウェア論理デバイス又は回路上にあり得るが、別の実施例では、それらは、異なるプロセッサ又は他のハードウェア論理デバイス若しくは回路中にあるか、或いは、同じプロセッサ又は他のハードウェア論理デバイス若しくは回路と、異なるプロセッサ又は他のハードウェア論理デバイス若しくは回路との何らかの組合せ中にあり得る。少なくとも１つの実施例では、アクティブ化ストレージ１０２０の任意の部分は、プロセッサのＬ１、Ｌ２、又はＬ３キャッシュ或いはシステム・メモリを含む、他のオンチップ又はオフチップ・データ・ストレージとともに含められ得る。さらに、推論及び／又は訓練コードが、プロセッサ或いは他のハードウェア論理又は回路にアクセス可能な他のコードとともに記憶され、プロセッサのフェッチ、復号、スケジューリング、実行、退去（ｒｅｔｉｒｅｍｅｎｔ）及び／又は他の論理回路を使用してフェッチ及び／又は処理され得る。

【0110】

少なくとも１つの実施例では、アクティブ化ストレージ１０２０は、キャッシュ・メモリ、ＤＲＡＭ、ＳＲＡＭ、不揮発性メモリ（たとえば、フラッシュ・メモリ）、又は他のストレージであり得る。少なくとも１つの実施例では、アクティブ化ストレージ１０２０は、完全に又は部分的に、１つ又は複数のプロセッサ又は他の論理回路内にあるか、又はその外部にあり得る。少なくとも１つの実施例では、アクティブ化ストレージ１０２０が、たとえばプロセッサの内部にあるのか外部にあるのか、或いは、ＤＲＡＭ、ＳＲＡＭ、フラッシュ又は何らか他のストレージ・タイプからなるかどうかの選定が、利用可能なストレージ、オンチップ対オフチップ、実施されている訓練及び／又は推論機能のレイテンシ要件、ニューラル・ネットワークの推論及び／又は訓練において使用されるデータのバッチ・サイズ、或いはこれらのファクタの何らかの組合せに依存し得る。少なくとも１つの実施例では、図１０Ａに示されている推論及び／又は訓練論理１０１５は、ＧｏｏｇｌｅからのＴｅｎｓｏｒｆｌｏｗ（登録商標）処理ユニット、Ｇｒａｐｈｃｏｒｅ（商標）からの推論処理ユニット（ＩＰＵ：ｉｎｆｅｒｅｎｃｅｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）、又はＩｎｔｅｌＣｏｒｐからのＮｅｒｖａｎａ（登録商標）（たとえば、「ＬａｋｅＣｒｅｓｔ」）プロセッサなど、特定用途向け集積回路（「ＡＳＩＣ」：ａｐｐｌｉｃａｔｉｏｎ－ｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）と併せて使用され得る。少なくとも１つの実施例では、図１０Ａに示されている推論及び／又は訓練論理１０１５は、中央処理ユニット（「ＣＰＵ」）ハードウェア、グラフィックス処理ユニット（「ＧＰＵ」）ハードウェア、或いは、データ処理ユニット（「ＤＰＵ」：ｄａｔａｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）ハードウェア、又はフィールド・プログラマブル・ゲート・アレイ（「ＦＰＧＡ」：ｆｉｅｌｄｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙ）などの他のハードウェアと併せて使用され得る。

【0111】

図１０Ｂは、少なくとも１つ又は複数の実施例による、推論及び／又は訓練論理１０１５を示す。少なくとも１つの実施例では、推論及び／又は訓練論理１０１５は、限定はしないが、ハードウェア論理を含み得、このハードウェア論理において、算出リソース（ｃｏｍｐｕｔａｔｉｏｎａｌｒｅｓｏｕｒｃｅ）が専用であるか、或いはさもなければ、ニューラル・ネットワーク内のニューロンの１つ又は複数の層に対応する重み値又は他の情報と併せてのみ使用される。少なくとも１つの実施例では、図１０Ｂに示されている推論及び／又は訓練論理１０１５は、ＧｏｏｇｌｅからのＴｅｎｓｏｒｆｌｏｗ（登録商標）処理ユニット、Ｇｒａｐｈｃｏｒｅ（商標）からの推論処理ユニット（ＩＰＵ）、又はＩｎｔｅｌＣｏｒｐからのＮｅｒｖａｎａ（登録商標）（たとえば、「ＬａｋｅＣｒｅｓｔ」）プロセッサなど、特定用途向け集積回路（ＡＳＩＣ）と併せて使用され得る。少なくとも１つの実施例では、図１０Ｂに示されている推論及び／又は訓練論理１０１５は、中央処理ユニット（ＣＰＵ）ハードウェア、グラフィックス処理ユニット（ＧＰＵ）ハードウェア、或いは、データ処理ユニット（「ＤＰＵ」）ハードウェア、又はフィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）などの他のハードウェアと併せて使用され得る。少なくとも１つの実施例では、推論及び／又は訓練論理１０１５は、限定はしないが、コード及び／又はデータ・ストレージ１００１とコード及び／又はデータ・ストレージ１００５とを含み、それらは、コード（たとえば、グラフ・コード）、重み値、並びに／或いは、バイアス値、勾配情報、運動量値、及び／又は他のパラメータ若しくはハイパーパラメータ情報を含む他の情報を記憶するために使用され得る。図１０Ｂに示されている少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００１並びにコード及び／又はデータ・ストレージ１００５の各々は、それぞれ、算出ハードウェア１００２及び算出ハードウェア１００６など、専用算出リソースに関連付けられる。少なくとも１つの実施例では、算出ハードウェア１００２及び算出ハードウェア１００６の各々は、線形代数関数などの数学関数を、それぞれコード及び／又はデータ・ストレージ１００１並びにコード及び／又はデータ・ストレージ１００５に記憶された情報に対してのみ実施する１つ又は複数のＡＬＵを備え、その結果が、アクティブ化ストレージ１０２０に記憶される。

【0112】

少なくとも１つの実施例では、コード及び／又はデータ・ストレージ１００１及び１００５の各々と、対応する算出ハードウェア１００２及び１００６とは、それぞれ、ニューラル・ネットワークの異なる層に対応し、それにより、コード及び／又はデータ・ストレージ１００１と算出ハードウェア１００２との１つの「ストレージ／算出ペア１００１／１００２」から生じたアクティブ化は、ニューラル・ネットワークの概念的組織化をミラーリングするために、コード及び／又はデータ・ストレージ１００５と算出ハードウェア１００６との「ストレージ／算出ペア１００５／１００６」への入力として提供される。少なくとも１つの実施例では、ストレージ／算出ペア１００１／１００２及び１００５／１００６は、２つ以上のニューラル・ネットワーク層に対応し得る。少なくとも１つの実施例では、ストレージ算出ペア１００１／１００２及び１００５／１００６の後に、又はそれらと並列に、追加のストレージ／算出ペア（図示せず）が、推論及び／又は訓練論理１０１５中に含められ得る。

【0113】

図１１は、少なくとも１つの実施例が使用され得る例示的なデータ・センタ１１００を示す。少なくとも１つの実施例では、データ・センタ１１００は、データ・センタ・インフラストラクチャ層１１１０と、フレームワーク層１１２０と、ソフトウェア層１１３０と、アプリケーション層１２４０とを含む。

【0114】

少なくとも１つの実施例では、図１１に示されているように、データ・センタ・インフラストラクチャ層１１１０は、リソース・オーケストレータ１１１２と、グループ化されたコンピューティング・リソース１１１４と、ノード・コンピューティング・リソース（「ノードＣ．Ｒ．」：ｎｏｄｅｃｏｍｐｕｔｉｎｇｒｅｓｏｕｒｃｅ）１１１６（１）～１１１６（Ｎ）とを含み得、ここで、「Ｎ」は、任意のすべての正の整数を表す。少なくとも１つの実施例では、ノードＣ．Ｒ．１１１６（１）～１１１６（Ｎ）は、限定はしないが、任意の数の中央処理ユニット（「ＣＰＵ」）又は（アクセラレータ、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、データ処理ユニット、グラフィックス・プロセッサなどを含む）他のプロセッサ、メモリ・デバイス（たとえば、動的読取り専用メモリ）、ストレージ・デバイス（たとえば、ソリッド・ステート又はディスク・ドライブ）、ネットワーク入力／出力（「ＮＷＩ／Ｏ」：ｎｅｔｗｏｒｋｉｎｐｕｔ／ｏｕｔｐｕｔ）デバイス、ネットワーク・スイッチ、仮想機械（「ＶＭ」：ｖｉｒｔｕａｌｍａｃｈｉｎｅ）、電力モジュール、及び冷却モジュールなどを含み得る。少なくとも１つの実施例では、ノードＣ．Ｒ．１１１６（１）～１１１６（Ｎ）の中からの１つ又は複数のノードＣ．Ｒ．は、上述のコンピューティング・リソースのうちの１つ又は複数を有するサーバであり得る。

【0115】

少なくとも１つの実施例では、グループ化されたコンピューティング・リソース１１１４は、１つ又は複数のラック（図示せず）内に格納されたノードＣ．Ｒ．の別個のグループ化、又は様々な地理的ロケーション（同じく図示せず）においてデータ・センタ中に格納された多くのラックを含み得る。グループ化されたコンピューティング・リソース１１１４内のノードＣ．Ｒ．の別個のグループ化は、１つ又は複数のワークロードをサポートするように構成されるか又は割り振られ得る、グループ化されたコンピュート・リソース、ネットワーク・リソース、メモリ・リソース、又はストレージ・リソースを含み得る。少なくとも１つの実施例では、ＣＰＵ又はプロセッサを含むいくつかのノードＣ．Ｒ．は、１つ又は複数のワークロードをサポートするためのコンピュート・リソースを提供するために１つ又は複数のラック内でグループ化され得る。少なくとも１つの実施例では、１つ又は複数のラックはまた、任意の数の電力モジュール、冷却モジュール、及びネットワーク・スイッチを、任意の組合せで含み得る。

【0116】

少なくとも１つの実施例では、リソース・オーケストレータ１１１２は、１つ又は複数のノードＣ．Ｒ．１１１６（１）～１１１６（Ｎ）及び／又はグループ化されたコンピューティング・リソース１１１４を構成するか、又はさもなければ、制御し得る。少なくとも１つの実施例では、リソース・オーケストレータ１１１２は、データ・センタ１１００のためのソフトウェア設計インフラストラクチャ（「ＳＤＩ」：ｓｏｆｔｗａｒｅｄｅｓｉｇｎｉｎｆｒａｓｔｒｕｃｔｕｒｅ）管理エンティティを含み得る。少なくとも１つの実施例では、リソース・オーケストレータは、ハードウェア、ソフトウェア、又はそれらの何らかの組合せを含み得る。

【0117】

少なくとも１つの実施例では、図１１に示されているように、フレームワーク層１１２０は、ジョブ・スケジューラ１１２２と、構成マネージャ１１２４と、リソース・マネージャ１１２６と、分散型ファイル・システム１１２８とを含む。少なくとも１つの実施例では、フレームワーク層１１２０は、ソフトウェア層１１３０のソフトウェア１１３２、及び／又はアプリケーション層１１４０の１つ又は複数のアプリケーション１１４２をサポートするためのフレームワークを含み得る。少なくとも１つの実施例では、ソフトウェア１１３２又は（１つ又は複数の）アプリケーション１１４２は、それぞれ、アマゾン・ウェブ・サービス、ＧｏｏｇｌｅＣｌｏｕｄ、及びＭｉｃｒｏｓｏｆｔＡｚｕｒｅによって提供されるものなど、ウェブ・ベースのサービス・ソフトウェア又はアプリケーションを含み得る。少なくとも１つの実施例では、フレームワーク層１１２０は、限定はしないが、大規模データ処理（たとえば、「ビック・データ」）のために分散型ファイル・システム１１２８を利用し得るＡｐａｃｈｅＳｐａｒｋ（商標）（以下「Ｓｐａｒｋ」）など、無料でオープンソースのソフトウェア・ウェブ・アプリケーション・フレームワークのタイプであり得る。少なくとも１つの実施例では、ジョブ・スケジューラ１１２２は、データ・センタ１１００の様々な層によってサポートされるワークロードのスケジューリングを容易にするために、Ｓｐａｒｋドライバを含み得る。少なくとも１つの実施例では、構成マネージャ１１２４は、ソフトウェア層１１３０、並びに大規模データ処理をサポートするためのＳｐａｒｋ及び分散型ファイル・システム１１２８を含むフレームワーク層１１２０など、異なる層を構成することが可能であり得る。少なくとも１つの実施例では、リソース・マネージャ１１２６は、分散型ファイル・システム１１２８及びジョブ・スケジューラ１１２２をサポートするようにマッピングされたか又は割り振られた、クラスタ化された又はグループ化されたコンピューティング・リソースを管理することが可能であり得る。少なくとも１つの実施例では、クラスタ化された又はグループ化されたコンピューティング・リソースは、データ・センタ・インフラストラクチャ層１１１０において、グループ化されたコンピューティング・リソース１１１４を含み得る。少なくとも１つの実施例では、リソース・マネージャ１１２６は、リソース・オーケストレータ１１１２と協調して、これらのマッピングされた又は割り振られたコンピューティング・リソースを管理し得る。

【0118】

少なくとも１つの実施例では、ソフトウェア層１１３０中に含まれるソフトウェア１１３２は、ノードＣ．Ｒ．１１１６（１）～１１１６（Ｎ）、グループ化されたコンピューティング・リソース１１１４、及び／又はフレームワーク層１１２０の分散型ファイル・システム１１２８の少なくとも部分によって使用されるソフトウェアを含み得る。１つ又は複数のタイプのソフトウェアは、限定はしないが、インターネット・ウェブ・ページ検索ソフトウェアと、電子メール・ウイルス・スキャン・ソフトウェアと、データベース・ソフトウェアと、ストリーミング・ビデオ・コンテンツ・ソフトウェアとを含み得る。

【0119】

少なくとも１つの実施例では、アプリケーション層１１４０中に含まれる（１つ又は複数の）アプリケーション１１４２は、ノードＣ．Ｒ．１１１６（１）～１１１６（Ｎ）、グループ化されたコンピューティング・リソース１１１４、及び／又はフレームワーク層１１２０の分散型ファイル・システム１１２８の少なくとも部分によって使用される１つ又は複数のタイプのアプリケーションを含み得る。１つ又は複数のタイプのアプリケーションは、限定はしないが、任意の数のゲノミクス・アプリケーション、コグニティブ・コンピュート、及び、訓練又は推論ソフトウェア、機械学習フレームワーク・ソフトウェア（たとえば、ＰｙＴｏｒｃｈ、ＴｅｎｓｏｒＦｌｏｗ、Ｃａｆｆｅなど）を含む、機械学習アプリケーション、又は、１つ又は複数の実施例と併せて使用される他の機械学習アプリケーションを含み得る。

【0120】

少なくとも１つの実施例では、構成マネージャ１１２４、リソース・マネージャ１１２６、及びリソース・オーケストレータ１１１２のいずれかが、任意の技術的に実現可能な様式で獲得された任意の量及びタイプのデータに基づいて、任意の数及びタイプの自己修正アクションを実装し得る。少なくとも１つの実施例では、自己修正アクションは、データ・センタ１１００のデータ・センタ・オペレータを、不良の恐れのある構成を判定し、十分に利用されていない及び／又は性能の低いデータ・センタの部分を場合によっては回避することから解放し得る。

【0121】

少なくとも１つの実施例では、データ・センタ１１００は、１つ又は複数の機械学習モデルを訓練するか、或いは、本明細書で説明される１つ又は複数の実施例による１つ又は複数の機械学習モデルを使用して情報を予測又は推論するためのツール、サービス、ソフトウェア又は他のリソースを含み得る。たとえば、少なくとも１つの実施例では、機械学習モデルは、データ・センタ１１００に関して上記で説明されたソフトウェア及びコンピューティング・リソースを使用して、ニューラル・ネットワーク・アーキテクチャに従って重みパラメータを計算することによって、訓練され得る。少なくとも１つの実施例では、１つ又は複数のニューラル・ネットワークに対応する訓練された機械学習モデルは、本明細書で説明される１つ又は複数の訓練技法を通して計算された重みパラメータを使用することによって、データ・センタ１１００に関して上記で説明されたリソースを使用して、情報を推論又は予測するために使用され得る。

【0122】

少なくとも１つの実施例では、データ・センタは、上記で説明されたリソースを使用して訓練及び／又は推論を実施するために、ＣＰＵ、特定用途向け集積回路（ＡＳＩＣ）、ＧＰＵ、ＤＰＵ、ＦＰＧＡ、又は他のハードウェアを使用し得る。その上、上記で説明された１つ又は複数のソフトウェア及び／又はハードウェア・リソースは、画像認識、音声認識、又は他の人工知能サービスなど、ユーザが、情報を訓練するか又は情報の推論を実施することを可能にするためのサービスとして構成され得る。

【0123】

１つ又は複数の実施例に関連付けられた推論及び／又は訓練動作を実施するために、推論及び／又は訓練論理１０１５が使用される。推論及び／又は訓練論理１０１５に関する詳細は、図１０Ａ及び／又は図１０Ｂと併せて以下で提供される。少なくとも１つの実施例では、推論及び／又は訓練論理１０１５は、本明細書で説明されるニューラル・ネットワーク訓練動作、ニューラル・ネットワーク機能及び／又はアーキテクチャ、或いはニューラル・ネットワーク使用事例を使用して計算された重みパラメータに少なくとも部分的に基づいて、推論又は予測動作のために図１１のシステムにおいて使用され得る。

【0124】

そのような構成要素は、ネットワーク訓練プロセスにおける障害事例を模倣する合成データを生成するために使用され得、これは、過剰適合（ｏｖｅｒｆｉｔｔｉｎｇ）を回避するために合成データの量を制限しながらネットワークの性能を改善するのを助け得る。

【0125】

図１２は、例示的なコンピュータ・システムを示すブロック図であり、例示的なコンピュータ・システムは、少なくとも１つの実施例による、命令を実行するための実行ユニットを含み得るプロセッサとともに形成された、相互接続されたデバイス及び構成要素、システム・オン・チップ（ＳＯＣ：ｓｙｓｔｅｍ－ｏｎ－ａ－ｃｈｉｐ）又はそれらの何らかの組合せをもつシステム１２００であり得る。少なくとも１つの実施例では、コンピュータ・システム１２００は、限定はしないが、本明細書で説明される実施例などにおいて、本開示による、プロセス・データのためのアルゴリズムを実施するための論理を含む実行ユニットを採用するための、プロセッサ１２０２などの構成要素を含み得る。少なくとも１つの実施例では、コンピュータ・システム１２００は、カリフォルニア州サンタクララのＩｎｔｅｌＣｏｒｐｏｒａｔｉｏｎから入手可能なＰＥＮＴＩＵＭ（登録商標）プロセッサ・ファミリー、Ｘｅｏｎ（商標）、Ｉｔａｎｉｕｍ（登録商標）、ＸＳｃａｌｅ（商標）及び／又はＳｔｒｏｎｇＡＲＭ（商標）、Ｉｎｔｅｌ（登録商標）Ｃｏｒｅ（商標）、又はＩｎｔｅｌ（登録商標）Ｎｅｒｖａｎａ（商標）マイクロプロセッサなどのプロセッサを含み得るが、（他のマイクロプロセッサ、エンジニアリング・ワークステーション、セット・トップ・ボックスなどを有するＰＣを含む）他のシステムも使用され得る。少なくとも１つの実施例では、コンピュータ・システム１２００は、ワシントン州レドモンドのＭｉｃｒｏｓｏｆｔＣｏｒｐｏｒａｔｉｏｎから入手可能なＷＩＮＤＯＷＳ（登録商標）オペレーティング・システムのあるバージョンを実行し得るが、他のオペレーティング・システム（たとえば、ＵＮＩＸ（登録商標）及びＬｉｎｕｘ（登録商標））、組み込みソフトウェア、及び／又はグラフィカル・ユーザ・インターフェースも使用され得る。

【0126】

実施例は、ハンドヘルド・デバイス及び組み込みアプリケーションなど、他のデバイスにおいて使用され得る。ハンドヘルド・デバイスのいくつかの実例は、セルラー・フォン、インターネット・プロトコル・デバイス、デジタル・カメラ、パーソナル・デジタル・アシスタント（「ＰＤＡ」）、及びハンドヘルドＰＣを含む。少なくとも１つの実施例では、組み込みアプリケーションは、マイクロコントローラ、デジタル信号プロセッサ（「ＤＳＰ」）、システム・オン・チップ、ネットワーク・コンピュータ（「ＮｅｔＰＣ」）、セット・トップ・ボックス、ネットワーク・ハブ、ワイド・エリア・ネットワーク（「ＷＡＮ」）スイッチ、エッジ・デバイス、モノのインターネット（「ＩｏＴ」：Ｉｎｔｅｒｎｅｔ－ｏｆ－Ｔｈｉｎｇｓ）デバイス、又は少なくとも１つの実施例による１つ又は複数の命令を実施し得る任意の他のシステムを含み得る。

【0127】

少なくとも１つの実施例では、コンピュータ・システム１２００は、限定はしないが、プロセッサ１２０２を含み得、プロセッサ１２０２は、限定はしないが、本明細書で説明される技法による機械学習モデル訓練及び／又は推論を実施するための１つ又は複数の実行ユニット１２０８を含み得る。少なくとも１つの実施例では、コンピュータ・システム１２００は、シングル・プロセッサ・デスクトップ又はサーバ・システムであるが、別の実施例では、コンピュータ・システム１２００は、マルチプロセッサ・システムであり得る。少なくとも１つの実施例では、プロセッサ１２０２は、限定はしないが、複合命令セット・コンピュータ（「ＣＩＳＣ」：ｃｏｍｐｌｅｘｉｎｓｔｒｕｃｔｉｏｎｓｅｔｃｏｍｐｕｔｅｒ）マイクロプロセッサ、縮小命令セット・コンピューティング（「ＲＩＳＣ」：ｒｅｄｕｃｅｄｉｎｓｔｒｕｃｔｉｏｎｓｅｔｃｏｍｐｕｔｉｎｇ）マイクロプロセッサ、超長命令語（「ＶＬＩＷ」：ｖｅｒｙｌｏｎｇｉｎｓｔｒｕｃｔｉｏｎｗｏｒｄ）マイクロプロセッサ、命令セットの組合せを実装するプロセッサ、又は、たとえばデジタル信号プロセッサなど、任意の他のプロセッサ・デバイスを含み得る。少なくとも１つの実施例では、プロセッサ１２０２は、プロセッサ・バス１２１０に結合され得、プロセッサ・バス１２１０は、プロセッサ１２０２とコンピュータ・システム１２００中の他の構成要素との間でデータ信号を送信し得る。

【0128】

少なくとも１つの実施例では、プロセッサ１２０２は、限定はしないが、レベル１（「Ｌ１」）の内部キャッシュ・メモリ（「キャッシュ」）１２０４を含み得る。少なくとも１つの実施例では、プロセッサ１２０２は、単一の内部キャッシュ又は複数のレベルの内部キャッシュを有し得る。少なくとも１つの実施例では、キャッシュ・メモリは、プロセッサ１２０２の外部に存在し得る。他の実施例は、特定の実装形態及び必要性に応じて、内部キャッシュと外部キャッシュの両方の組合せをも含み得る。少なくとも１つの実施例では、レジスタ・ファイル１２０６は、限定はしないが、整数レジスタ、浮動小数点レジスタ、ステータス・レジスタ、及び命令ポインタ・レジスタを含む様々なレジスタに、異なるタイプのデータを記憶し得る。

【0129】

少なくとも１つの実施例では、限定はしないが、整数演算及び浮動小数点演算を実施するための論理を含む実行ユニット１２０８も、プロセッサ１２０２中に存在し得る。少なくとも１つの実施例では、プロセッサ１２０２は、いくつかのマクロ命令のためのマイクロコードを記憶するマイクロコード（「ｕコード」）読取り専用メモリ（「ＲＯＭ」）をも含み得る。少なくとも１つの実施例では、実行ユニット１２０８は、パック命令セット１２０９に対処するための論理を含み得る。少なくとも１つの実施例では、パック命令セット１２０９を、命令を実行するための関連する回路要素とともに汎用プロセッサ１２０２の命令セットに含めることによって、多くのマルチメディア・アプリケーションによって使用される演算が、汎用プロセッサ１２０２中のパック・データを使用して実施され得る。１つ又は複数の実施例では、多くのマルチメディア・アプリケーションが、パック・データの演算を実施するためにプロセッサのデータ・バスの全幅を使用することによって加速され、より効率的に実行され得、これは、一度に１つのデータ要素ずつ１つ又は複数の演算を実施するために、プロセッサのデータ・バスにわたってより小さい単位のデータを転送する必要をなくし得る。

【0130】

少なくとも１つの実施例では、実行ユニット１２０８はまた、マイクロコントローラ、組み込みプロセッサ、グラフィックス・デバイス、ＤＳＰ、及び他のタイプの論理回路において使用され得る。少なくとも１つの実施例では、コンピュータ・システム１２００は、限定はしないが、メモリ１２２０を含み得る。少なくとも１つの実施例では、メモリ１２２０は、ダイナミック・ランダム・アクセス・メモリ（「ＤＲＡＭ」）デバイス、スタティック・ランダム・アクセス・メモリ（「ＳＲＡＭ」）デバイス、フラッシュ・メモリ・デバイス、又は他のメモリ・デバイスとして実装され得る。少なくとも１つの実施例では、メモリ１２２０は、プロセッサ１２０２によって実行され得るデータ信号によって表される（１つ又は複数の）命令１２１９及び／又はデータ１２２１を記憶し得る。

【0131】

少なくとも１つの実施例では、システム論理チップが、プロセッサ・バス１２１０及びメモリ１２２０に結合され得る。少なくとも１つの実施例では、システム論理チップは、限定はしないが、メモリ・コントローラ・ハブ（「ＭＣＨ」）１２１６を含み得、プロセッサ１２０２は、プロセッサ・バス１２１０を介してＭＣＨ１２１６と通信し得る。少なくとも１つの実施例では、ＭＣＨ１２１６は、命令及びデータ・ストレージのための、並びにグラフィックス・コマンド、データ及びテクスチャのストレージのための、高帯域幅メモリ経路１２１８をメモリ１２２０に提供し得る。少なくとも１つの実施例では、ＭＣＨ１２１６は、プロセッサ１２０２と、メモリ１２２０と、コンピュータ・システム１２００中の他の構成要素との間でデータ信号をダイレクトし、プロセッサ・バス１２１０と、メモリ１２２０と、システムＩ／Ｏ１２２２との間でデータ信号をブリッジし得る。少なくとも１つの実施例では、システム論理チップは、グラフィックス・コントローラに結合するためのグラフィックス・ポートを提供し得る。少なくとも１つの実施例では、ＭＣＨ１２１６は、高帯域幅メモリ経路１２１８を通してメモリ１２２０に結合され得、グラフィックス／ビデオ・カード１２１２は、アクセラレーテッド・グラフィックス・ポート（「ＡＧＰ」）相互接続１２１４を介してＭＣＨ１２１６に結合され得る。

【0132】

少なくとも１つの実施例では、コンピュータ・システム１２００は、ＭＣＨ１２１６をＩ／Ｏコントローラ・ハブ（「ＩＣＨ」）１２３０に結合するためのプロプライエタリ・ハブ・インターフェース・バスである、システムＩ／Ｏ１２２２を使用し得る。少なくとも１つの実施例では、ＩＣＨ１２３０は、ローカルＩ／Ｏバスを介していくつかのＩ／Ｏデバイスに直接接続を提供し得る。少なくとも１つの実施例では、ローカルＩ／Ｏバスは、限定はしないが、周辺機器をメモリ１２２０、チップセット、及びプロセッサ１２０２に接続するための高速Ｉ／Ｏバスを含み得る。実例は、限定はしないが、オーディオ・コントローラ１２２９と、ファームウェア・ハブ（「フラッシュＢＩＯＳ」）１２２８と、ワイヤレス・トランシーバ１２２６と、データ・ストレージ１２２４と、ユーザ入力及びキーボード・インターフェース１２２５を含んでいるレガシーＩ／Ｏコントローラ１２２３と、ユニバーサル・シリアル・バス（「ＵＳＢ」：ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）などのシリアル拡張ポート１２２７と、いくつかの実施例では、データ処理ユニットを含み得るネットワーク・コントローラ１２３４とを含み得る。データ・ストレージ１２２４は、ハード・ディスク・ドライブ、フロッピー・ディスク・ドライブ、ＣＤ－ＲＯＭデバイス、フラッシュ・メモリ・デバイス、又は他の大容量ストレージ・デバイスを備え得る。

【0133】

少なくとも１つの実施例では、図１２は、相互接続されたハードウェア・デバイス又は「チップ」を含むシステムを示すが、他の実施例では、図１２は、例示的なシステム・オン・チップ（「ＳｏＣ」）を示し得る。少なくとも１つの実施例では、デバイスは、プロプライエタリ相互接続、標準相互接続（たとえば、ＰＣＩｅ）又はそれらの何らかの組合せで相互接続され得る。少なくとも１つの実施例では、コンピュータ・システム１２００の１つ又は複数の構成要素は、コンピュート・エクスプレス・リンク（ＣＸＬ：ｃｏｍｐｕｔｅｅｘｐｒｅｓｓｌｉｎｋ）相互接続を使用して相互接続される。

【0134】

【0135】

そのような構成要素は、ネットワーク訓練プロセスにおける障害事例を模倣する合成データを生成するために使用され得、これは、過剰適合を回避するために合成データの量を制限しながらネットワークの性能を改善するのを助け得る。

【0136】

図１３は、少なくとも１つの実施例による、プロセッサ１３１０を利用するための電子デバイス１３００を示すブロック図である。少なくとも１つの実施例では、電子デバイス１３００は、たとえば、限定はしないが、ノートブック、タワー・サーバ、ラック・サーバ、ブレード・サーバ、ラップトップ、デスクトップ、タブレット、モバイル・デバイス、電話、組み込みコンピュータ、エッジ・デバイス、ＩｏＴデバイス、又は任意の他の好適な電子デバイスであり得る。

【0137】

少なくとも１つの実施例では、システム１３００は、限定はしないが、任意の好適な数又は種類の構成要素、周辺機器、モジュール、又はデバイスに通信可能に結合されたプロセッサ１３１０を含み得る。少なくとも１つの実施例では、プロセッサ１３１０は、１℃バス、システム管理バス（「ＳＭＢｕｓ」：ＳｙｓｔｅｍＭａｎａｇｅｍｅｎｔＢｕｓ）、ロー・ピン・カウント（ＬＰＣ：ＬｏｗＰｉｎＣｏｕｎｔ）バス、シリアル周辺インターフェース（「ＳＰＩ」：ＳｅｒｉａｌＰｅｒｉｐｈｅｒａｌＩｎｔｅｒｆａｃｅ）、高精細度オーディオ（「ＨＤＡ」：ＨｉｇｈＤｅｆｉｎｉｔｉｏｎＡｕｄｉｏ）バス、シリアル・アドバンス・テクノロジー・アタッチメント（「ＳＡＴＡ」：ＳｅｒｉａｌＡｄｖａｎｃｅＴｅｃｈｎｏｌｏｇｙＡｔｔａｃｈｍｅｎｔ）バス、ユニバーサル・シリアル・バス（「ＵＳＢ」）（バージョン１、２、３）、又はユニバーサル非同期受信機／送信機（「ＵＡＲＴ」：ＵｎｉｖｅｒｓａｌＡｓｙｎｃｈｒｏｎｏｕｓＲｅｃｅｉｖｅｒ／Ｔｒａｎｓｍｉｔｔｅｒ）バスなど、バス又はインターフェースを使用して結合した。少なくとも１つの実施例では、図１３は、相互接続されたハードウェア・デバイス又は「チップ」を含むシステムを示すが、他の実施例では、図１３は、例示的なシステム・オン・チップ（「ＳｏＣ」）を示し得る。少なくとも１つの実施例では、図１３に示されているデバイスは、プロプライエタリ相互接続、標準相互接続（たとえば、ＰＣＩｅ）又はそれらの何らかの組合せで相互接続され得る。少なくとも１つの実施例では、図１３の１つ又は複数の構成要素は、コンピュート・エクスプレス・リンク（ＣＸＬ）相互接続を使用して相互接続される。

【0138】

少なくとも１つの実施例では、図１３は、ディスプレイ１３２４、タッチ・スクリーン１３２５、タッチ・パッド１３３０、ニア・フィールド通信ユニット（「ＮＦＣ」：ＮｅａｒＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎ）１３４５、センサ・ハブ１３４０、熱センサ１３４６、エクスプレス・チップセット（「ＥＣ」：ＥｘｐｒｅｓｓＣｈｉｐｓｅｔ）１３３５、トラステッド・プラットフォーム・モジュール（「ＴＰＭ」：ＴｒｕｓｔｅｄＰｌａｔｆｏｒｍＭｏｄｕｌｅ）１３３８、ＢＩＯＳ／ファームウェア／フラッシュ・メモリ（「ＢＩＯＳ、ＦＷフラッシュ」：ＢＩＯＳ／ｆｉｒｍｗａｒｅ／ｆｌａｓｈｍｅｍｏｒｙ）１３２２、ＤＳＰ１３６０、ソリッド・ステート・ディスク（「ＳＳＤ」：ＳｏｌｉｄＳｔａｔｅＤｉｓｋ）又はハード・ディスク・ドライブ（「ＨＤＤ」：ＨａｒｄＤｉｓｋＤｒｉｖｅ）などのドライブ１３２０、ワイヤレス・ローカル・エリア・ネットワーク・ユニット（「ＷＬＡＮ」：ｗｉｒｅｌｅｓｓｌｏｃａｌａｒｅａｎｅｔｗｏｒｋ）１３５０、Ｂｌｕｅｔｏｏｔｈユニット１３５２、ワイヤレス・ワイド・エリア・ネットワーク・ユニット（「ＷＷＡＮ」：ＷｉｒｅｌｅｓｓＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）１３５６、全地球測位システム（ＧＰＳ：ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）１３５５、ＵＳＢ３．０カメラなどのカメラ（「ＵＳＢ３．０カメラ」）１３５４、及び／或いは、たとえばＬＰＤＤＲ３規格において実装された低電力ダブル・データ・レート（「ＬＰＤＤＲ」：ＬｏｗＰｏｗｅｒＤｏｕｂｌｅＤａｔａＲａｔｅ）メモリ・ユニット（「ＬＰＤＤＲ３」）１３１５を含み得る。これらの構成要素は、各々、任意の好適な様式で実装され得る。

【0139】

少なくとも１つの実施例では、上記で説明された構成要素を通して、他の構成要素がプロセッサ１３１０に通信可能に結合され得る。少なくとも１つの実施例では、加速度計１３４１と、周囲光センサ（「ＡＬＳ」：ＡｍｂｉｅｎｔＬｉｇｈｔＳｅｎｓｏｒ）１３４２と、コンパス１３４３と、ジャイロスコープ１３４４とが、センサ・ハブ１３４０に通信可能に結合され得る。少なくとも１つの実施例では、熱センサ１３３９と、ファン１３３７と、キーボード１３３６と、タッチ・パッド１３３０とが、ＥＣ１３３５に通信可能に結合され得る。少なくとも１つの実施例では、スピーカー１３６３と、ヘッドフォン１３６４と、マイクロフォン（「ｍｉｃ」）１３６５とが、オーディオ・ユニット（「オーディオ・コーデック及びクラスｄアンプ」）１３６２に通信可能に結合され得、オーディオ・ユニット１３６２は、ＤＳＰ１３６０に通信可能に結合され得る。少なくとも１つの実施例では、オーディオ・ユニット１３６４は、たとえば、限定はしないが、オーディオ・コーダ／デコーダ（「コーデック」）及びクラスＤ増幅器を含み得る。少なくとも１つの実施例では、ＳＩＭカード（「ＳＩＭ」）１３５７は、ＷＷＡＮユニット１３５６に通信可能に結合され得る。少なくとも１つの実施例では、ＷＬＡＮユニット１３５０及びＢｌｕｅｔｏｏｔｈユニット１３５２などの構成要素、並びにＷＷＡＮユニット１３５６は、次世代フォーム・ファクタ（「ＮＧＦＦ」：ＮｅｘｔＧｅｎｅｒａｔｉｏｎＦｏｒｍＦａｃｔｏｒ）において実装され得る。

【0140】

【0141】

【0142】

図１４は、少なくとも１つの実施例による、処理システムのブロック図である。少なくとも１つの実施例では、システム１４００は、１つ又は複数のプロセッサ１４０２と１つ又は複数のグラフィックス・プロセッサ１４０８とを含み、単一プロセッサ・デスクトップ・システム、マルチプロセッサ・ワークステーション・システム、或いは多数のプロセッサ１４０２又はプロセッサ・コア１４０７を有するサーバ・システムであり得る。少なくとも１つの実施例では、システム１４００は、モバイル・デバイス、ハンドヘルド・デバイス、エッジ・デバイス、又は組み込みデバイスにおいて使用するためのシステム・オン・チップ（ＳｏＣ）集積回路内に組み込まれた処理プラットフォームである。

【0143】

少なくとも１つの実施例では、システム１４００は、サーバ・ベースのゲーミング・プラットフォーム、ゲーム及びメディア・コンソールを含むゲーム・コンソール、モバイル・ゲーミング・コンソール、ハンドヘルド・ゲーム・コンソール、又はオンライン・ゲーム・コンソールを含み得るか、或いはそれらの内部に組み込まれ得る。少なくとも１つの実施例では、システム１４００は、モバイル・フォン、スマート・フォン、タブレット・コンピューティング・デバイス又はモバイル・インターネット・デバイスである。少なくとも１つの実施例では、処理システム１４００はまた、スマート・ウォッチ・ウェアラブル・デバイス、スマート・アイウェア・デバイス、拡張現実デバイス、又は仮想現実デバイスなどのウェアラブル・デバイスを含み得るか、それらと結合し得るか、又はそれらの内部に組み込まれ得る。少なくとも１つの実施例では、処理システム１４００は、１つ又は複数のプロセッサ１４０２と、１つ又は複数のグラフィックス・プロセッサ１４０８によって生成されるグラフィカル・インターフェースとを有するテレビ又はセット・トップ・ボックス・デバイスである。

【0144】

少なくとも１つの実施例では、１つ又は複数のプロセッサ１４０２は、各々、実行されたときにシステム及びユーザ・ソフトウェアのための動作を実施する命令を処理するための１つ又は複数のプロセッサ・コア１４０７を含む。少なくとも１つの実施例では、１つ又は複数のプロセッサ・コア１４０７の各々は、特定の命令セット１４０９を処理するように構成される。少なくとも１つの実施例では、命令セット１４０９は、複合命令セット・コンピューティング（ＣＩＳＣ）、縮小命令セット・コンピューティング（ＲＩＳＣ）、又は超長命令語（ＶＬＩＷ）を介したコンピューティングを容易にし得る。少なくとも１つの実施例では、プロセッサ・コア１４０７は、各々、異なる命令セット１４０９を処理し得、命令セット１４０９は、他の命令セットのエミュレーションを容易にするための命令を含み得る。少なくとも１つの実施例では、プロセッサ・コア１４０７はまた、デジタル信号プロセッサ（ＤＳＰ）などの他の処理デバイスを含み得る。

【0145】

少なくとも１つの実施例では、プロセッサ１４０２はキャッシュ・メモリ１４０４を含む。少なくとも１つの実施例では、プロセッサ１４０２は、単一の内部キャッシュ又は複数のレベルの内部キャッシュを有し得る。少なくとも１つの実施例では、キャッシュ・メモリは、プロセッサ１４０２の様々な構成要素の間で共有される。少なくとも１つの実施例では、プロセッサ１４０２はまた、外部キャッシュ（たとえば、レベル３（Ｌ３）キャッシュ又はラスト・レベル・キャッシュ（ＬＬＣ：ＬａｓｔＬｅｖｅｌＣａｃｈｅ））（図示せず）を使用し、外部キャッシュは、知られているキャッシュ・コヒーレンシ技法を使用してプロセッサ・コア１４０７の間で共有され得る。少なくとも１つの実施例では、追加として、レジスタ・ファイル１４０６がプロセッサ１４０２中に含まれ、レジスタ・ファイル１４０６は、異なるタイプのデータを記憶するための異なるタイプのレジスタ（たとえば、整数レジスタ、浮動小数点レジスタ、ステータス・レジスタ、及び命令ポインタ・レジスタ）を含み得る。少なくとも１つの実施例では、レジスタ・ファイル１４０６は、汎用レジスタ又は他のレジスタを含み得る。

【0146】

少なくとも１つの実施例では、１つ又は複数のプロセッサ１４０２は、アドレス、データ、又は制御信号などの通信信号を、プロセッサ１４０２とシステム１４００中の他の構成要素との間で送信するために、１つ又は複数のインターフェース・バス１４１０と結合される。少なくとも１つの実施例では、１つの実施例におけるインターフェース・バス１４１０は、ダイレクト・メディア・インターフェース（ＤＭＩ：ＤｉｒｅｃｔＭｅｄｉａＩｎｔｅｒｆａｃｅ）バスのバージョンなどのプロセッサ・バスであり得る。少なくとも１つの実施例では、インターフェース１４１０は、ＤＭＩバスに限定されず、１つ又は複数の周辺構成要素相互接続バス（たとえば、ＰＣＩ、ＰＣＩＥｘｐｒｅｓｓ）、メモリ・バス、又は他のタイプのインターフェース・バスを含み得る。少なくとも１つの実施例では、（１つ又は複数の）プロセッサ１４０２は、統合されたメモリ・コントローラ１４１６と、プラットフォーム・コントローラ・ハブ１４３０とを含む。少なくとも１つの実施例では、メモリ・コントローラ１４１６は、メモリ・デバイスとシステム１４００の他の構成要素との間の通信を容易にし、プラットフォーム・コントローラ・ハブ（ＰＣＨ：ｐｌａｔｆｏｒｍｃｏｎｔｒｏｌｌｅｒｈｕｂ）１４３０は、ローカルＩ／Ｏバスを介してＩ／Ｏデバイスへの接続を提供する。

【0147】

少なくとも１つの実施例では、メモリ・デバイス１４２０は、ダイナミック・ランダム・アクセス・メモリ（ＤＲＡＭ）デバイス、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ）デバイス、フラッシュ・メモリ・デバイス、相変化メモリ・デバイス、又はプロセス・メモリとして働くのに好適な性能を有する何らかの他のメモリ・デバイスであり得る。少なくとも１つの実施例では、メモリ・デバイス１４２０は、１つ又は複数のプロセッサ１４０２がアプリケーション又はプロセスを実行するときの使用のためのデータ１４２２及び命令１４２１を記憶するために、システム１４００のためのシステム・メモリとして動作し得る。少なくとも１つの実施例では、メモリ・コントローラ１４１６はまた、随意の外部グラフィックス・プロセッサ１４１２と結合し、外部グラフィックス・プロセッサ１４１２は、グラフィックス動作及びメディア動作を実施するために、プロセッサ１４０２中の１つ又は複数のグラフィックス・プロセッサ１４０８と通信し得る。少なくとも１つの実施例では、ディスプレイ・デバイス１４１１は、（１つ又は複数の）プロセッサ１４０２に接続し得る。少なくとも１つの実施例では、ディスプレイ・デバイス１４１１は、モバイル電子デバイス又はラップトップ・デバイスの場合のような内部ディスプレイ・デバイス、或いは、ディスプレイ・インターフェース（たとえば、ＤｉｓｐｌａｙＰｏｒｔなど）を介して取り付けられた外部ディスプレイ・デバイスのうちの１つ又は複数を含み得る。少なくとも１つの実施例では、ディスプレイ・デバイス１４１１は、仮想現実（ＶＲ：ｖｉｒｔｕａｌｒｅａｌｉｔｙ）アプリケーション又は拡張現実（ＡＲ：ａｕｇｍｅｎｔｅｄｒｅａｌｉｔｙ）アプリケーションにおいて使用するための立体ディスプレイ・デバイスなどの頭部装着型ディスプレイ（ＨＭＤ：ｈｅａｄｍｏｕｎｔｅｄｄｉｓｐｌａｙ）を含み得る。

【0148】

少なくとも１つの実施例では、プラットフォーム・コントローラ・ハブ１４３０は、周辺機器が高速Ｉ／Ｏバスを介してメモリ・デバイス１４２０及びプロセッサ１４０２に接続することを可能にする。少なくとも１つの実施例では、Ｉ／Ｏ周辺機器は、限定はしないが、オーディオ・コントローラ１４４６と、ネットワーク・コントローラ１４３４と、ファームウェア・インターフェース１４２８と、ワイヤレス・トランシーバ１４２６と、タッチ・センサ１４２５と、データ・ストレージ・デバイス１４２４（たとえば、ハード・ディスク・ドライブ、フラッシュ・メモリなど）とを含む。少なくとも１つの実施例では、データ・ストレージ・デバイス１４２４は、ストレージ・インターフェース（たとえば、ＳＡＴＡ）を介して、又は周辺構成要素相互接続バス（たとえば、ＰＣＩ、ＰＣＩＥｘｐｒｅｓｓ）などの周辺バスを介して、接続し得る。少なくとも１つの実施例では、タッチ・センサ１４２５は、タッチ・スクリーン・センサ、圧力センサ、又は指紋センサを含み得る。少なくとも１つの実施例では、ワイヤレス・トランシーバ１４２６は、Ｗｉ－Ｆｉトランシーバ、Ｂｌｕｅｔｏｏｔｈトランシーバ、或いは３Ｇ、４Ｇ、又はロング・ターム・エボリューション（ＬＴＥ：ＬｏｎｇＴｅｒｍＥｖｏｌｕｔｉｏｎ）トランシーバなどのモバイル・ネットワーク・トランシーバであり得る。少なくとも１つの実施例では、ファームウェア・インターフェース１４２８は、システム・ファームウェアとの通信を可能にし、たとえば、ユニファイド・エクステンシブル・ファームウェア・インターフェース（ＵＥＦＩ：ｕｎｉｆｉｅｄｅｘｔｅｎｓｉｂｌｅｆｉｒｍｗａｒｅｉｎｔｅｒｆａｃｅ）であり得る。少なくとも１つの実施例では、ネットワーク・コントローラ１４３４は、ワイヤード・ネットワークへのネットワーク接続を可能にし得る。少なくとも１つの実施例では、高性能ネットワーク・コントローラ（図示せず）は、インターフェース・バス１４１０と結合する。少なくとも１つの実施例では、オーディオ・コントローラ１４４６は、マルチチャネル高精細度オーディオ・コントローラである。少なくとも１つの実施例では、システム１４００は、レガシー（たとえば、パーソナル・システム２（ＰＳ／２：ＰｅｒｓｏｎａｌＳｙｓｔｅｍ２））デバイスをシステムに結合するための随意のレガシーＩ／Ｏコントローラ１４４０を含む。少なくとも１つの実施例では、プラットフォーム・コントローラ・ハブ１４３０は、キーボードとマウス１４４３との組合せ、カメラ１４４４、又は他のＵＳＢ入力デバイスなど、１つ又は複数のユニバーサル・シリアル・バス（ＵＳＢ）コントローラ１４４２接続入力デバイスにも接続し得る。

【0149】

少なくとも１つの実施例では、メモリ・コントローラ１４１６及びプラットフォーム・コントローラ・ハブ１４３０のインスタンスが、外部グラフィックス・プロセッサ１４１１などの慎重な外部グラフィックス・プロセッサに組み込まれ得る。少なくとも１つの実施例では、プラットフォーム・コントローラ・ハブ１４３０及び／又はメモリ・コントローラ１４１６は、１つ又は複数のプロセッサ１４０２の外部にあり得る。たとえば、少なくとも１つの実施例では、システム１４００は、外部のメモリ・コントローラ１４１６とプラットフォーム・コントローラ・ハブ１４３０とを含み得、それらは、（１つ又は複数の）プロセッサ１４０２と通信しているシステム・チップセット内のメモリ・コントローラ・ハブ及び周辺コントローラ・ハブとして構成され得る。

【0150】

１つ又は複数の実施例に関連付けられた推論及び／又は訓練動作を実施するために、推論及び／又は訓練論理１０１５が使用される。推論及び／又は訓練論理１０１５に関する詳細は、図１０Ａ及び／又は図１０Ｂと併せて以下で提供される。少なくとも１つの実施例では、推論及び／又は訓練論理１０１５の部分又はすべてが、グラフィックス・プロセッサ１４０８に組み込まれ得る。たとえば、少なくとも１つの実施例では、本明細書で説明される訓練及び／又は推論技法は、グラフィックス・プロセッサにおいて具体化されたＡＬＵのうちの１つ又は複数を使用し得る。その上、少なくとも１つの実施例では、本明細書で説明される推論及び／又は訓練動作は、図１０Ａ又は図１０Ｂに示されている論理以外の論理を使用して行われ得る。少なくとも１つの実施例では、重みパラメータは、本明細書で説明される１つ又は複数の機械学習アルゴリズム、ニューラル・ネットワーク・アーキテクチャ、使用事例、又は訓練技法を実施するためのグラフィックス・プロセッサのＡＬＵを構成する（示されている又は示されていない）オンチップ又はオフチップ・メモリ及び／又はレジスタに記憶され得る。

【0151】

【0152】

図１５は、少なくとも１つの実施例による、１つ又は複数のプロセッサ・コア１５０２Ａ～１５０２Ｎと、統合されたメモリ・コントローラ１５１３と、統合されたグラフィックス・プロセッサ１５０８とを有するプロセッサ１５００のブロック図である。少なくとも１つの実施例では、プロセッサ１５００は、破線ボックスによって表される追加コア１５０２Ｎまでの追加コアを含み得る。少なくとも１つの実施例では、プロセッサ・コア１５０２Ａ～１５０２Ｎの各々は、１つ又は複数の内部キャッシュ・ユニット１５０４Ａ～１５０４Ｎを含む。少なくとも１つの実施例では、各プロセッサ・コアはまた、１つ又は複数の共有キャッシュ・ユニット１５０６へのアクセスを有する。

【0153】

少なくとも１つの実施例では、内部キャッシュ・ユニット１５０４Ａ～１５０４Ｎと共有キャッシュ・ユニット１５０６とは、プロセッサ１５００内のキャッシュ・メモリ階層を表す。少なくとも１つの実施例では、キャッシュ・メモリ・ユニット１５０４Ａ～１５０４Ｎは、各プロセッサ・コア内の命令及びデータ・キャッシュの少なくとも１つのレベル、及びレベル２（Ｌ２）、レベル３（Ｌ３）、レベル４（Ｌ４）などの共有中間レベル・キャッシュの１つ又は複数のレベル、又はキャッシュの他のレベルを含み得、ここで、外部メモリの前の最高レベルのキャッシュは、ＬＬＣとして分類される。少なくとも１つの実施例では、キャッシュ・コヒーレンシ論理は、様々なキャッシュ・ユニット１５０６及び１５０４Ａ～１５０４Ｎ間でコヒーレンシを維持する。

【0154】

少なくとも１つの実施例では、プロセッサ１５００は、１つ又は複数のバス・コントローラ・ユニット１５１６とシステム・エージェント・コア１５１０とのセットをも含み得る。少なくとも１つの実施例では、１つ又は複数のバス・コントローラ・ユニット１５１６は、１つ又は複数のＰＣＩ又はＰＣＩエクスプレス・バスなどの周辺バスのセットを管理する。少なくとも１つの実施例では、システム・エージェント・コア１５１０は、様々なプロセッサ構成要素のための管理機能性を提供する。少なくとも１つの実施例では、システム・エージェント・コア１５１０は、様々な外部メモリ・デバイス（図示せず）へのアクセスを管理するための１つ又は複数の統合されたメモリ・コントローラ１５１３を含む。

【0155】

少なくとも１つの実施例では、プロセッサ・コア１５０２Ａ～１５０２Ｎのうちの１つ又は複数は、同時マルチスレッディングのサポートを含む。少なくとも１つの実施例では、システム・エージェント・コア１５１０は、マルチスレッド処理中にコア１５０２Ａ～１５０２Ｎを協調させ、動作させるための構成要素を含む。少なくとも１つの実施例では、システム・エージェント・コア１５１０は、追加として、電力制御ユニット（ＰＣＵ：ｐｏｗｅｒｃｏｎｔｒｏｌｕｎｉｔ）を含み得、ＰＣＵは、プロセッサ・コア１５０２Ａ～１５０２Ｎ及びグラフィックス・プロセッサ１５０８の１つ又は複数の電力状態を調節するための論理及び構成要素を含む。

【0156】

少なくとも１つの実施例では、プロセッサ１５００は、追加として、グラフィックス処理動作を実行するためのグラフィックス・プロセッサ１５０８を含む。少なくとも１つの実施例では、グラフィックス・プロセッサ１５０８は、共有キャッシュ・ユニット１５０６、及び１つ又は複数の統合されたメモリ・コントローラ１５１３を含むシステム・エージェント・コア１５１０と結合する。少なくとも１つの実施例では、システム・エージェント・コア１５１０は、１つ又は複数の結合されたディスプレイへのグラフィックス・プロセッサ出力を駆動するためのディスプレイ・コントローラ１５１１をも含む。少なくとも１つの実施例では、ディスプレイ・コントローラ１５１１はまた、少なくとも１つの相互接続を介してグラフィックス・プロセッサ１５０８と結合された別個のモジュールであり得るか、又はグラフィックス・プロセッサ１５０８内に組み込まれ得る。

【0157】

少なくとも１つの実施例では、プロセッサ１５００の内部構成要素を結合するために、リング・ベースの相互接続ユニット１５１２が使用される。少なくとも１つの実施例では、ポイントツーポイント相互接続、切替え相互接続、又は他の技法などの代替相互接続ユニットが使用され得る。少なくとも１つの実施例では、グラフィックス・プロセッサ１５０８は、Ｉ／Ｏリンク１５１３を介してリング相互接続１５１２と結合する。

【0158】

少なくとも１つの実施例では、Ｉ／Ｏリンク１５１３は、様々なプロセッサ構成要素と、ｅＤＲＡＭモジュールなどの高性能組み込みメモリ・モジュール１５１８との間の通信を容易にするオン・パッケージＩ／Ｏ相互接続を含む、複数の種類のＩ／Ｏ相互接続のうちの少なくとも１つを表す。少なくとも１つの実施例では、プロセッサ・コア１５０２Ａ～１５０２Ｎの各々と、グラフィックス・プロセッサ１５０８とは、共有ラスト・レベル・キャッシュとして組み込みメモリ・モジュール１５１８を使用する。

【0159】

少なくとも１つの実施例では、プロセッサ・コア１５０２Ａ～１５０２Ｎは、共通の命令セット・アーキテクチャを実行する同種のコアである。少なくとも１つの実施例では、プロセッサ・コア１５０２Ａ～１５０２Ｎは、命令セット・アーキテクチャ（ＩＳＡ：ｉｎｓｔｒｕｃｔｉｏｎｓｅｔａｒｃｈｉｔｅｃｔｕｒｅ）という観点から異種であり、ここで、プロセッサ・コア１５０２Ａ～１５０２Ｎのうちの１つ又は複数は、共通の命令セットを実行し、プロセッサ・コア１５０２Ａ～１５０２Ｎのうちの１つ又は複数の他のコアは、共通の命令セットのサブセット、又は異なる命令セットを実行する。少なくとも１つの実施例では、プロセッサ・コア１５０２Ａ～１５０２Ｎは、マイクロアーキテクチャという観点から異種であり、ここで、電力消費量が比較的高い１つ又は複数のコアは、電力消費量がより低い１つ又は複数の電力コアと結合する。少なくとも１つの実施例では、プロセッサ１５００は、１つ又は複数のチップ上に、又はＳｏＣ集積回路として実装され得る。

【0160】

１つ又は複数の実施例に関連付けられた推論及び／又は訓練動作を実施するために、推論及び／又は訓練論理１０１５が使用される。推論及び／又は訓練論理１０１５に関する詳細は、図１０Ａ及び／又は図１０Ｂと併せて以下で提供される。少なくとも１つの実施例では、推論及び／又は訓練論理１０１５の部分又はすべてが、プロセッサ１５００に組み込まれ得る。たとえば、少なくとも１つの実施例では、本明細書で説明される訓練及び／又は推論技法は、グラフィックス・プロセッサ１５０８、（１つ又は複数の）グラフィックス・コア１５０２Ａ～１５０２Ｎ、又は図１５中の他の構成要素において具体化されたＡＬＵのうちの１つ又は複数を使用し得る。その上、少なくとも１つの実施例では、本明細書で説明される推論及び／又は訓練動作は、図１０Ａ又は図１０Ｂに示されている論理以外の論理を使用して行われ得る。少なくとも１つの実施例では、重みパラメータは、本明細書で説明される１つ又は複数の機械学習アルゴリズム、ニューラル・ネットワーク・アーキテクチャ、使用事例、又は訓練技法を実施するためのグラフィックス・プロセッサ１５００のＡＬＵを構成する（示されている又は示されていない）オンチップ又はオフチップ・メモリ及び／又はレジスタに記憶され得る。

【0161】

【0162】

図１６は、少なくとも１つの実施例による、画像処理及び推論パイプラインを生成及び導入するプロセス１６００のための例示的なデータ・フロー図である。少なくとも１つの実施例では、プロセス１６００は、１つ又は複数の施設１６０２において、撮像デバイス、処理デバイス、及び／又は他のデバイス・タイプとともに使用するために導入され得る。プロセス１６００は、訓練システム１６０４及び／又は導入システム１６０６内で実行され得る。少なくとも１つの実施例では、訓練システム１６０４は、導入システム１６０６における使用のための機械学習モデル（たとえば、ニューラル・ネットワーク、物体検出アルゴリズム、コンピュータ・ビジョン・アルゴリズムなど）の訓練、導入、及び実装を実施するために使用され得る。少なくとも１つの実施例では、導入システム１６０６は、施設１６０２におけるインフラストラクチャ要件を低減するために、処理及びコンピュート・リソースを分散型コンピューティング環境の間でオフロードするように構成され得る。少なくとも１つの実施例では、パイプライン中の１つ又は複数のアプリケーションは、アプリケーションの実行中に導入システム１６０６のサービス（たとえば、推論、視覚化、コンピュート、ＡＩなど）を使用するか、又はコールし得る。

【0163】

少なくとも１つの実施例では、先進処理及び推論パイプラインにおいて使用されるアプリケーションのいくつかは、１つ又は複数の処理ステップを実施するために機械学習モデル又は他のＡＩを使用し得る。少なくとも１つの実施例では、機械学習モデルは、施設１６０２において生成された（及び、施設１６０２において１つ又は複数のピクチャ・アーカイブ及び通信システム（ＰＡＣＳ：ｐｉｃｔｕｒｅａｒｃｈｉｖｉｎｇａｎｄｃｏｍｍｕｎｉｃａｔｉｏｎｓｙｓｔｅｍ）サーバに記憶された）（撮像データなどの）データ１６０８を使用して、施設１６０２において訓練され得るか、１つ又は複数の別の施設からの撮像又はシーケンシング・データ１６０８を使用して訓練され得るか、或いはそれらの組合せであり得る。少なくとも１つの実施例では、訓練システム１６０４は、導入システム１６０６のための実用的で導入可能な機械学習モデルを生成するためのアプリケーション、サービス、及び／又は他のリソースを提供するために使用され得る。

【0164】

少なくとも１つの実施例では、モデル・レジストリ１６２４は、バージョン管理及び物体メタデータをサポートし得る物体ストレージによってバックアップされ得る。少なくとも１つの実施例では、物体ストレージは、たとえば、クラウド・プラットフォーム内から、クラウド・ストレージ（たとえば、図１７のクラウド１７２６）互換アプリケーション・プログラミング・インターフェース（ＡＰＩ：ａｐｐｌｉｃａｔｉｏｎｐｒｏｇｒａｍｍｉｎｇｉｎｔｅｒｆａｃｅ）を通してアクセス可能であり得る。少なくとも１つの実施例では、モデル・レジストリ１６２４内の機械学習モデルは、システムの開発者又はパートナーがＡＰＩと対話することによって、アップロード、リスト化、修正、又は削除され得る。少なくとも１つの実施例では、ＡＰＩは、適切な資格をもつユーザがモデルをアプリケーションに関連付けることを可能にする方法へのアクセスを提供し得、それにより、モデルは、アプリケーションのコンテナ化されたインスタンス化の実行の一部として実行され得る。

【0165】

少なくとも１つの実施例では、訓練パイプライン１７０４（図１７）は、施設１６０２がそれ自体の機械学習モデルを訓練しているか、或いは、最適化又は更新される必要がある既存の機械学習モデルを有するシナリオを含み得る。少なくとも１つの実施例では、（１つ又は複数の）撮像デバイス、シーケンシング・デバイス、及び／又は他のデバイス・タイプによって生成された撮像データ１６０８が受信され得る。少なくとも１つの実施例では、撮像データ１６０８が受信されると、機械学習モデルについてのグランド・トゥルース・データとして使用されるべき撮像データ１６０８に対応するアノテーションを生成するのを補助するために、ＡＩ支援アノテーション１６１０が使用され得る。少なくとも１つの実施例では、ＡＩ支援アノテーション１６１０は、１つ又は複数の機械学習モデル（たとえば、畳み込みニューラル・ネットワーク（ＣＮＮ））を含み得、１つ又は複数の機械学習モデルは、（たとえば、いくつかのデバイスからの）いくつかのタイプの撮像データ１６０８に対応するアノテーションを生成するように訓練され得る。少なくとも１つの実施例では、次いで、ＡＩ支援アノテーション１６１０は、グランド・トゥルース・データを生成するために、直接使用され得るか、或いは、アノテーション・ツールを使用して調整又は微調整され得る。少なくとも１つの実施例では、ＡＩ支援アノテーション１６１０、ラベル付きクリニック・データ１６１２、又はそれらの組合せが、機械学習モデルを訓練するためのグランド・トゥルース・データとして使用され得る。少なくとも１つの実施例では、訓練された機械学習モデルは出力モデル１６１６と呼ばれることがあり、本明細書で説明されるように、導入システム１６０６によって使用され得る。

【0166】

少なくとも１つの実施例では、訓練パイプライン１７０４（図１７）は、施設１６０２が、導入システム１６０６中の１つ又は複数のアプリケーションのための１つ又は複数の処理タスクを実施する際に使用するための機械学習モデルを必要とするが、施設１６０２は現在そのような機械学習モデルを有しないことがある（或いは、そのような目的のために最適化された、効率的な、又は有効なモデルを有しないことがある）シナリオを含み得る。少なくとも１つの実施例では、既存の機械学習モデルが、モデル・レジストリ１６２４から選択され得る。少なくとも１つの実施例では、モデル・レジストリ１６２４は、撮像データに対して様々な異なる推論タスクを実施するように訓練された機械学習モデルを含み得る。少なくとも１つの実施例では、モデル・レジストリ１６２４中の機械学習モデルは、施設１６０２とは異なる施設（たとえば、離れた場所にある施設）からの撮像データに関して訓練されていることがある。少なくとも１つの実施例では、機械学習モデルは、１つのロケーション、２つのロケーション、又は任意の数のロケーションからの撮像データに関して訓練されていることがある。少なくとも１つの実施例では、特定のロケーションからの撮像データに関して訓練されているとき、訓練は、そのロケーションにおいて行われ得るか、或いは少なくとも、撮像データの機密性を保護するか又は撮像データが構外へ転送されるのを制限する様式で、行われ得る。少なくとも１つの実施例では、１つのロケーションにおいてモデルが訓練されると、又は部分的に訓練されると、機械学習モデルはモデル・レジストリ１６２４に追加され得る。少なくとも１つの実施例では、次いで、機械学習モデルは、任意の数の他の施設において再訓練又は更新され得、再訓練又は更新されたモデルが、モデル・レジストリ１６２４において利用可能にされ得る。少なくとも１つの実施例では、次いで、機械学習モデルは、モデル・レジストリ１６２４から選択され得、出力モデル１６１６と呼ばれることがあり、導入システムの１つ又は複数のアプリケーションのための１つ又は複数の処理タスクを実施するために導入システム１６０６において使用され得る。

【0167】

少なくとも１つの実施例では、訓練パイプライン１７０４（図１７）、シナリオは、施設１６０２が、導入システム１６０６中の１つ又は複数のアプリケーションのための１つ又は複数の処理タスクを実施する際に使用するための機械学習モデルを必要とすることを含み得るが、施設１６０２は現在そのような機械学習モデルを有しないことがある（或いは、そのような目的のために最適化された、効率的な、又は有効なモデルを有しないことがある）。少なくとも１つの実施例では、モデル・レジストリ１６２４から選択された機械学習モデルは、母集団、機械学習モデルを訓練するために使用される訓練データの頑健性、訓練データの異常の多様性、及び／又は訓練データに伴う他の問題における差異のために、施設１６０２において生成される撮像データ１６０８のために微調整又は最適化されないことがある。少なくとも１つの実施例では、機械学習モデルを再訓練又は更新するためのグランド・トゥルース・データとして使用されるべき撮像データ１６０８に対応するアノテーションを生成するのを補助するために、ＡＩ支援アノテーション１６１０が使用され得る。少なくとも１つの実施例では、ラベル付きデータ１６１２が、機械学習モデルを訓練するためのグランド・トゥルース・データとして使用され得る。少なくとも１つの実施例では、機械学習モデルを再訓練又は更新することは、モデル訓練１６１４と呼ばれることがある。少なくとも１つの実施例では、モデル訓練１６１４、たとえばＡＩ支援アノテーション１６１０、ラベル付きクリニック・データ１６１２、又はそれらの組合せは、機械学習モデルを再訓練又は更新するためのグランド・トゥルース・データとして使用され得る。少なくとも１つの実施例では、訓練された機械学習モデルは出力モデル１６１６と呼ばれることがあり、本明細書で説明されるように、導入システム１６０６によって使用され得る。

【0168】

少なくとも１つの実施例では、導入システム１６０６は、ソフトウェア１６１８、サービス１６２０、ハードウェア１６２２、並びに／又は他の構成要素、特徴、及び機能性を含み得る。少なくとも１つの実施例では、導入システム１６０６は、ソフトウェア「スタック」を含み得、それにより、ソフトウェア１６１８は、サービス１６２０の上に築かれ得、サービス１６２０を使用して処理タスクのいくつか又はすべてを実施し得、サービス１６２０及びソフトウェア１６１８は、ハードウェア１６２２の上に築かれ、ハードウェア１６２２を使用して、導入システム１６０６の処理、ストレージ、及び／又は他のコンピュート・タスクを実行し得る。少なくとも１つの実施例では、ソフトウェア１６１８は、任意の数の異なるコンテナを含み得、各コンテナは、アプリケーションのインスタンス化を実行し得る。少なくとも１つの実施例では、各アプリケーションは、先進処理及び推論パイプライン中の１つ又は複数の処理タスク（たとえば、推論、物体検出、特徴検出、セグメント化、画像強調、キャリブレーションなど）を実施し得る。少なくとも１つの実施例では、先進処理及び推論パイプラインは、（たとえば、使用可能なデータ・タイプに出力をコンバートするために）パイプラインを通して処理した後に、各コンテナによる使用及び／又は施設１６０２による使用のための撮像データを受信及び構成するコンテナに加えて、撮像データ１６０８を処理するために所望されるか又は必要とされる異なるコンテナの選択に基づいて、定義され得る。少なくとも１つの実施例では、（たとえば、パイプラインを作り上げる）ソフトウェア１６１８内のコンテナの組合せは、（本明細書でより詳細に説明されるように）仮想機器と呼ばれることがあり、仮想機器は、サービス１６２０及びハードウェア１６２２を活用して、コンテナにおいてインスタンス化されたアプリケーションのいくつか又はすべての処理タスクを実行し得る。

【0169】

少なくとも１つの実施例では、データ処理パイプラインは、推論要求（たとえば、導入システム１６０６のユーザからの要求）に応答して、特定のフォーマットで入力データ（たとえば、撮像データ１６０８）を受信し得る。少なくとも１つの実施例では、入力データは、１つ又は複数の撮像デバイスによって生成される１つ又は複数の画像、ビデオ、及び／又は他のデータ表現を表し得る。少なくとも１つの実施例では、データは、１つ又は複数のアプリケーションによる処理のためにデータを準備するために、データ処理パイプラインの一部としての事前処理を受け得る。少なくとも１つの実施例では、次のアプリケーションのための出力データを準備するために、並びに／或いは、（たとえば、推論要求への応答としての）ユーザによる送信及び／又は使用のための出力データを準備するために、パイプラインの１つ又は複数の推論タスク又は他の処理タスクの出力に対して後処理が実施され得る。少なくとも１つの実施例では、推論タスクは、訓練システム１６０４の出力モデル１６１６を含み得る、訓練された又は導入されたニューラル・ネットワークなど、１つ又は複数の機械学習モデルによって実施され得る。

【0170】

少なくとも１つの実施例では、データ処理パイプラインのタスクは、（１つ又は複数の）コンテナ中にカプセル化され得、（１つ又は複数の）コンテナは、各々、アプリケーションの個別の完全に機能的なインスタンス化と、機械学習モデルを参照することが可能である仮想化コンピューティング環境とを表す。少なくとも１つの実施例では、コンテナ又はアプリケーションは、（本明細書でより詳細に説明される）コンテナ・レジストリのプライベート（たとえば、アクセスの制限された）エリアに公開され得、訓練された又は導入されたモデルは、モデル・レジストリ１６２４に記憶され、１つ又は複数のアプリケーションに関連付けられ得る。少なくとも１つの実施例では、アプリケーションの画像（たとえば、コンテナ画像）は、コンテナ・レジストリにおいて利用可能であり得、パイプラインにおける導入のためにユーザによってコンテナ・レジストリから選択されると、画像は、ユーザのシステムによる使用のためのアプリケーションのインスタンス化のためのコンテナを生成するために使用され得る。

【0171】

少なくとも１つの実施例では、開発者（たとえば、ソフトウェア開発者、臨床医、医師など）は、供給されたデータに対して画像処理及び／又は推論を実施するためのアプリケーションを（たとえばコンテナとして）開発、公開、及び記憶し得る。少なくとも１つの実施例では、開発、公開、及び／又は記憶は、（たとえば、開発されたアプリケーション及び／又はコンテナがシステムに準拠するか又はシステムと互換性があることを確実にするために）システムに関連付けられたソフトウェア開発キット（ＳＤＫ：ｓｏｆｔｗａｒｅｄｅｖｅｌｏｐｍｅｎｔｋｉｔ）を使用して実施され得る。少なくとも１つの実施例では、開発されたアプリケーションは、システム（たとえば、図１７のシステム１７００）としてサービス１６２０のうちの少なくともいくつかをサポートし得るＳＤＫを用いて、ローカルに（たとえば、第１の施設において、第１の施設からのデータに対して）テストされ得る。少なくとも１つの実施例では、ＤＩＣＯＭ物体は、１つから数百個の画像又は他のデータ・タイプをどこにでも含んでいることがあるので、及びデータの変動により、開発者は、入って来るデータの抽出及び準備を管理すること（たとえば、アプリケーションのための構築物を設定すること、事前処理をアプリケーションに組み込むことなど）について責任を負うことがある。少なくとも１つの実施例では、システム１７００によって（たとえば、精度について）検証されると、アプリケーションは、ユーザの施設（たとえば、第２の施設）におけるデータに対して１つ又は複数の処理タスクを実施するために、ユーザによる選択及び／又は実装のためにコンテナ・レジストリにおいて利用可能になり得る。

【0172】

少なくとも１つの実施例では、次いで、開発者は、アプリケーション又はコンテナを、システム（たとえば、図１７のシステム１７００）のユーザによるアクセス及び使用のためにネットワークを通して共有し得る。少なくとも１つの実施例では、完成した及び検証されたアプリケーション又はコンテナは、コンテナ・レジストリに記憶され得、関連する機械学習モデルは、モデル・レジストリ１６２４に記憶され得る。少なくとも１つの実施例では、推論又は画像処理要求を提供する要求元エンティティは、アプリケーション、コンテナ、データセット、機械学習モデルなどについてコンテナ・レジストリ及び／又はモデル・レジストリ１６２４をブラウズし、データ処理パイプライン中に含めるための要素の所望の組合せを選択し、撮像処理要求をサブミットし得る。少なくとも１つの実施例では、要求は、要求を実施するために必要である入力データ（及び、いくつかの実例では、関連する患者データ）を含み得、並びに／或いは、要求を処理する際に実行されるべき（１つ又は複数の）アプリケーション及び／又は機械学習モデルの選択を含み得る。少なくとも１つの実施例では、次いで、要求は、データ処理パイプラインの処理を実施するために導入システム１６０６（たとえば、クラウド）の１つ又は複数の構成要素に渡され得る。少なくとも１つの実施例では、導入システム１６０６による処理は、コンテナ・レジストリ及び／又はモデル・レジストリ１６２４からの選択された要素（たとえば、アプリケーション、コンテナ、モデルなど）を参照することを含み得る。少なくとも１つの実施例では、パイプラインによって結果が生成されると、結果は、参照のために（たとえば、ローカルの、構内のワークステーション又は端末上で実行している視聴アプリケーション・スイートにおいて視聴するために）ユーザに返され得る。

【0173】

少なくとも１つの実施例では、パイプラインにおけるアプリケーション又はコンテナの処理又は実行を補助するために、サービス１６２０が活用され得る。少なくとも１つの実施例では、サービス１６２０は、コンピュート・サービス、人工知能（ＡＩ：ａｒｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅ）サービス、視覚化サービス、及び／又は他のサービス・タイプを含み得る。少なくとも１つの実施例では、サービス１６２０は、ソフトウェア１６１８中の１つ又は複数のアプリケーションに共通である機能性を提供し得、したがって、機能性は、アプリケーションによってコール又は活用され得るサービスに対して抽象化され得る。少なくとも１つの実施例では、サービス１６２０によって提供される機能性は、動的に及びより効率的に稼働し得、また、（たとえば、並列コンピューティング・プラットフォーム１７３０（図１７）を使用して）アプリケーションが並列にデータを処理することを可能にすることによって、良好にスケーリングし得る。少なくとも１つの実施例では、サービス１６２０によって与えられる同じ機能性を共有する各アプリケーションが、サービス１６２０のそれぞれのインスタンスを有することを必要とされるのではなく、サービス１６２０は、様々なアプリケーション間で及びそれらの間で共有され得る。少なくとも１つの実施例では、サービスは、非限定的な実例として、検出又はセグメント化タスクを実行するために使用され得る推論サーバ又はエンジンを含み得る。少なくとも１つの実施例では、機械学習モデル訓練及び／又は再訓練能力（ｃａｐａｂｉｌｉｔｙ）を提供し得るモデル訓練サービスが含まれ得る。少なくとも１つの実施例では、ＧＰＵ加速データ（たとえば、ＤＩＣＯＭ、ＲＩＳ、ＣＩＳ、ＲＥＳＴ準拠、ＲＰＣ、生など）抽出、リサイジング、スケーリング、及び／又は他の拡張を提供し得るデータ拡張サービスがさらに含まれ得る。少なくとも１つの実施例では、２次元（２Ｄ）及び／又は３次元（３Ｄ）のモデルにリアル感を追加するために、レイ・トレーシング、ラスタ化、ノイズ除去、鮮鋭化などの画像レンダリング効果を追加し得る視覚化サービスが使用され得る。少なくとも１つの実施例では、仮想機器のパイプライン内の他のアプリケーションについてビーム形成、セグメント化、推論、撮像、及び／又はサポートを提供する仮想機器サービスが含まれ得る。

【0174】

少なくとも１つの実施例では、サービス１６２０がＡＩサービス（たとえば、推論サービス）を含む場合、１つ又は複数の機械学習モデルは、（１つ又は複数の）機械学習モデル、又はその処理を、アプリケーション実行の一部として実行するように推論サービス（たとえば、推論サーバ）を（たとえば、ＡＰＩコールとして）コールすることによって、実行され得る。少なくとも１つの実施例では、セグメント化タスクのための１つ又は複数の機械学習モデルを別のアプリケーションが含む場合、アプリケーションは、セグメント化タスクに関連付けられた処理動作のうちの１つ又は複数を実施するための機械学習モデルを実行するように、推論サービスをコールし得る。少なくとも１つの実施例では、セグメント化アプリケーションと異常検出アプリケーションとを含む先進処理及び推論パイプラインを実装するソフトウェア１６１８は、１つ又は複数の推論タスクを実施するために各アプリケーションが同じ推論サービスをコールし得るので、合理化され得る。

【0175】

少なくとも１つの実施例では、ハードウェア１６２２は、ＧＰＵ、ＣＰＵ、ＤＰＵ、グラフィックス・カード、ＡＩ／深層学習システム（たとえば、ＮＶＩＤＩＡのＤＧＸなどのＡＩスーパーコンピュータ）、クラウド・プラットフォーム、又はそれらの組合せを含み得る。少なくとも１つの実施例では、異なるタイプのハードウェア１６２２が、導入システム１６０６中のソフトウェア１６１８及びサービス１６２０の効率的で専用のサポートを提供するために使用され得る。少なくとも１つの実施例では、画像処理及び生成の効率、精度、及び有効性を改善するために、ＡＩ／深層学習システム内、クラウド・システム中、及び／又は導入システム１６０６の他の処理構成要素中で、ローカルで（たとえば、施設１６０２において）処理するためのＧＰＵ処理の使用が実装され得る。少なくとも１つの実施例では、ソフトウェア１６１８及び／又はサービス１６２０は、非限定的な実例として、深層学習、機械学習、及び／又は高性能コンピューティングに関するＧＰＵ処理のために最適化され得る。少なくとも１つの実施例では、導入システム１６０６及び／又は訓練システム１６０４のコンピューティング環境の少なくとも一部は、データセンタの１つ又は複数のスーパーコンピュータ又は高性能コンピューティング・システムにおいて、ＧＰＵ最適化ソフトウェア（たとえば、ＮＶＩＤＩＡのＤＧＸシステムのハードウェアとソフトウェアとの組合せ）を用いて実行され得る。少なくとも１つの実施例では、ハードウェア１６２２は、任意の数のＧＰＵを含み得、それらのＧＰＵは、本明細書で説明されるように、データの並列処理を実施するためにコールされ得る。少なくとも１つの実施例では、クラウド・プラットフォームは、深層学習タスク、機械学習タスク、又は他のコンピューティング・タスクのＧＰＵ最適化実行のためのＧＰＵ処理をさらに含み得る。少なくとも１つの実施例では、クラウド・プラットフォームは、ネットワークを介して、及び／或いはネットワーク・コントローラ又は他のネットワーク・インターフェースを通して受信されたデータを直接１つ又は複数のＧＰＵ（たとえば、それのメモリ）に送信するためのＤＰＵ処理をさらに含み得る。少なくとも１つの実施例では、クラウド・プラットフォーム（たとえば、ＮＶＩＤＩＡのＮＧＣ）は、（たとえば、ＮＶＩＤＩＡのＤＧＸシステム上で提供される）（１つ又は複数の）ＡＩ／深層学習スーパーコンピュータ及び／又はＧＰＵ最適化ソフトウェアを、ハードウェア抽象化及びスケーリング・プラットフォームとして使用して、実行され得る。少なくとも１つの実施例では、クラウド・プラットフォームは、シームレスなスケーリング及びロード・バランシングを可能にするために、複数のＧＰＵに対するアプリケーション・コンテナ・クラスタリング・システム又はオーケストレーション・システム（たとえば、ＫＵＢＥＲＮＥＴＥＳ）を統合し得る。

【0176】

図１７は、少なくとも１つの実施例による、撮像導入パイプラインを生成及び導入するための例示的なシステム１７００のためのシステム図である。少なくとも１つの実施例では、システム１７００は、図１６のプロセス１６００、並びに／又は先進処理及び推論パイプラインを含む他のプロセスを実装するために使用され得る。少なくとも１つの実施例では、システム１７００は、訓練システム１６０４と導入システム１６０６とを含み得る。少なくとも１つの実施例では、訓練システム１６０４及び導入システム１６０６は、本明細書で説明されるように、ソフトウェア１６１８、サービス１６２０、及び／又はハードウェア１６２２を使用して実装され得る。

【0177】

少なくとも１つの実施例では、システム１７００（たとえば、訓練システム１６０４及び／又は導入システム１６０６）は、（たとえば、クラウド１７２６を使用する）クラウド・コンピューティング環境において実装され得る。少なくとも１つの実施例では、システム１７００は、ヘルスケア・サービス施設に関してローカルに、又はクラウド・コンピューティング・リソースとローカル・コンピューティング・リソースの両方の組合せとして、実装され得る。少なくとも１つの実施例では、クラウド１７２６中のＡＰＩへのアクセスは、制定されたセキュリティ対策又はプロトコルを通して、許可されたユーザに限定され得る。少なくとも１つの実施例では、セキュリティ・プロトコルはウェブ・トークンを含み得、ウェブ・トークンは、認証（たとえば、ＡｕｔｈＮ、ＡｕｔｈＺ、Ｇｌｕｅｃｏｎなど）サービスによって署名され得、適切な許可を持ち得る。少なくとも１つの実施例では、（本明細書で説明される）仮想機器のＡＰＩ、又はシステム１７００の他のインスタンス化は、対話について検査又は許可されたパブリックＩＰのセットに限定され得る。

【0178】

少なくとも１つの実施例では、システム１７００の様々な構成要素は、ワイヤード及び／又はワイヤレス通信プロトコルを介して、限定はしないがローカル・エリア・ネットワーク（ＬＡＮ）及び／又はワイド・エリア・ネットワーク（ＷＡＮ）を含む様々な異なるネットワーク・タイプのいずれかを使用して、互いの間で通信し得る。少なくとも１つの実施例では、（たとえば、推論要求を送信するための、推論要求の結果を受信するためのなど）施設とシステム１７００の構成要素との間の通信は、（１つ又は複数の）データ・バス、ワイヤレス・データ・プロトコル（Ｗｉ－Ｆｉ）、ワイヤード・データ・プロトコル（たとえば、イーサネット）などを介して通信され得る。

【0179】

少なくとも１つの実施例では、訓練システム１６０４は、図１６に関して本明細書で説明されたものと同様の訓練パイプライン１７０４を実行し得る。少なくとも１つの実施例では、１つ又は複数の機械学習モデルが導入システム１６０６によって導入パイプライン１７１０において使用されるべきである場合、訓練パイプライン１７０４は、１つ又は複数の（たとえば、事前訓練された）モデルを訓練又は再訓練し、並びに／或いは、事前訓練されたモデル１７０６のうちの１つ又は複数を（たとえば、再訓練又は更新の必要なしに）実装するために、使用され得る。少なくとも１つの実施例では、訓練パイプライン１７０４の結果として、（１つ又は複数の）出力モデル１６１６が生成され得る。少なくとも１つの実施例では、訓練パイプライン１７０４は、限定はしないが、撮像データ（又は他の入力データ）コンバージョン又は適応など、任意の数の処理ステップを含み得る。少なくとも１つの実施例では、導入システム１６０６によって使用される異なる機械学習モデルについて、異なる訓練パイプライン１７０４が使用され得る。少なくとも１つの実施例では、図１６に関して説明された第１の実例と同様の訓練パイプライン１７０４は、第１の機械学習モデルのために使用され得、図１６に関して説明された第２の実例と同様の訓練パイプライン１７０４は、第２の機械学習モデルのために使用され得、図１６に関して説明された第３の実例と同様の訓練パイプライン１７０４は、第３の機械学習モデルのために使用され得る。少なくとも１つの実施例では、各それぞれの機械学習モデルについて何が必要とされるかに応じて、訓練システム１６０４内のタスクの任意の組合せが使用され得る。少なくとも１つの実施例では、機械学習モデルのうちの１つ又は複数は、すでに訓練され、導入の準備ができていることがあり、したがって、機械学習モデルは、訓練システム１６０４によるいかなる処理をも受けないことがあり、導入システム１６０６によって実装され得る。

【0180】

少なくとも１つの実施例では、（１つ又は複数の）出力モデル１６１６及び／又は（１つ又は複数の）事前訓練されたモデル１７０６は、実装形態又は実施例に応じて任意のタイプの機械学習モデルを含み得る。少なくとも１つの実施例では、及び限定はしないが、システム１７００によって使用される機械学習モデルは、線形回帰、ロジスティック回帰、判定ツリー、サポート・ベクター・マシン（ＳＶＭ）、単純ベイズ、ｋ近傍法（Ｋｎｎ：ｋ－ｎｅａｒｅｓｔｎｅｉｇｈｂｏｒ）、ｋ平均クラスタリング、ランダム・フォレスト、次元低減アルゴリズム、勾配ブースティング・アルゴリズム、ニューラル・ネットワーク（たとえば、オート・エンコーダ、畳み込み、リカレント、パーセプトロン、長／短期メモリ（ＬＳＴＭ：Ｌｏｎｇ／ＳｈｏｒｔＴｅｒｍＭｅｍｏｒｙ）、ホップフィールド、ボルツマン、深層信念、逆畳み込み、敵対的生成、液体状態機械など）を使用する（１つ又は複数の）機械学習モデル、及び／又は他のタイプの機械学習モデルを含み得る。

【0181】

少なくとも１つの実施例では、訓練パイプライン１７０４は、少なくとも図１６Ｂに関して本明細書でより詳細に説明されるように、ＡＩ支援アノテーションを含み得る。少なくとも１つの実施例では、ラベル付きデータ１６１２（たとえば、従来のアノテーション）は、任意の数の技法によって生成され得る。少なくとも１つの実施例では、ラベル又は他のアノテーションは、描画プログラム（たとえば、アノテーション・プログラム）、コンピュータ支援設計（ＣＡＤ：ｃｏｍｐｕｔｅｒａｉｄｅｄｄｅｓｉｇｎ）プログラム、ラベル付けプログラム、グランド・トゥルースのためのアノテーション又はラベルを生成するのに好適な別のタイプのプログラム内で生成され得、及び／或いは、いくつかの実例では、手書きされ得る。少なくとも１つの実施例では、グランド・トゥルース・データは、合成的に作り出され（たとえば、コンピュータ・モデル又はレンダリングから生成され）、現実的に作り出され（たとえば、実世界のデータから設計され、作り出され）、（たとえば、データから特徴を抽出し、次いでラベルを生成するために、特徴分析及び学習を使用して）機械自動化され、人間によりアノテーション付けされ（たとえば、ラベラ、又はアノテーション専門家が、ラベルのロケーションを定義し）、及び／又はそれらの組合せであり得る。少なくとも１つの実施例では、撮像データ１６０８の各インスタンス（又は機械学習モデルによって使用される他のデータ・タイプ）について、訓練システム１６０４によって生成される対応するグランド・トゥルース・データがあり得る。少なくとも１つの実施例では、訓練パイプライン１７０４中に含まれるＡＩ支援アノテーションに加えて、又はその代わりにのいずれかで、導入パイプライン１７１０の一部としてＡＩ支援アノテーションが実施され得る。少なくとも１つの実施例では、システム１７００は多層プラットフォームを含み得、多層プラットフォームは、１つ又は複数の医療撮像及び診断機能を実施し得る診断アプリケーション（又は他のアプリケーション・タイプ）のソフトウェア層（たとえば、ソフトウェア１６１８）を含み得る。少なくとも１つの実施例では、システム１７００は、１つ又は複数の施設のＰＡＣＳサーバ・ネットワークに、（たとえば、暗号化リンクを介して）通信可能に結合され得る。少なくとも１つの実施例では、システム１７００は、機械学習モデルを訓練すること、機械学習モデルを導入すること、画像処理、推論、及び／又は他の動作などの動作を実施するために、ＰＡＣＳサーバからのデータにアクセスし、それを参照するように構成され得る。

【0182】

少なくとも１つの実施例では、ソフトウェア層は、セキュアな、暗号化された、及び／又は認証されたＡＰＩとして実装され得、このＡＰＩを通して、アプリケーション又はコンテナが、（１つ又は複数の）外部環境（たとえば、施設１６０２）から呼び出され（たとえば、コールされ）得る。少なくとも１つの実施例では、次いで、アプリケーションは、それぞれのアプリケーションに関連付けられたコンピュート、ＡＩ、又は視覚化タスクを実施するために１つ又は複数のサービス１６２０をコール又は実行し得、ソフトウェア１６１８及び／又はサービス１６２０は、ハードウェア１６２２を活用して、処理タスクを有効で効率的な様式で実施し得る。

【0183】

少なくとも１つの実施例では、導入システム１６０６は、導入パイプライン１７１０を実行し得る。少なくとも１つの実施例では、導入パイプライン１７１０は任意の数のアプリケーションを含み得、それらのアプリケーションは、上記で説明されたように、ＡＩ支援アノテーションを含む、撮像デバイス、シーケンシング・デバイス、ゲノミクス・デバイスなどによって生成された撮像データ（及び／又は他のデータ・タイプ）に連続的に、非連続的に、又は他のやり方で適用され得る。少なくとも１つの実施例では、本明細書で説明されるように、個々のデバイスのための導入パイプライン１７１０は、デバイスのための仮想機器（たとえば、仮想超音波機器、仮想ＣＴスキャン機器、仮想シーケンシング機器など）と呼ばれることがある。少なくとも１つの実施例では、デバイスによって生成されるデータから所望される情報に応じて、単一のデバイスについて、２つ以上の導入パイプライン１７１０があり得る。少なくとも１つの実施例では、異常の検出がＭＲＩマシンから所望される場合、第１の導入パイプライン１７１０があり得、画像強調がＭＲＩマシンの出力から所望される場合、第２の導入パイプライン１７１０があり得る。

【0184】

少なくとも１つの実施例では、画像生成アプリケーションは、機械学習モデルの使用を含む処理タスクを含み得る。少なくとも１つの実施例では、ユーザは、ユーザ自身の機械学習モデルを使用すること、又はモデル・レジストリ１６２４から機械学習モデルを選択することを所望し得る。少なくとも１つの実施例では、ユーザは、処理タスクを実施するために、ユーザ自身の機械学習モデルを実装するか、又はアプリケーション中に含めるための機械学習モデルを選択し得る。少なくとも１つの実施例では、アプリケーションは選択可能及びカスタマイズ可能であり得、アプリケーションの構築を定義することによって、特定のユーザのためのアプリケーションの導入及び実装が、よりシームレスなユーザ・エクスペリエンスとして提示される。少なくとも１つの実施例では、サービス１６２０及びハードウェア１６２２など、システム１７００の他の特徴を活用することによって、導入パイプライン１７１０は、なお一層ユーザ・フレンドリになり、より容易な統合を提供し、より正確で、効率的で、タイムリーな結果を作り出し得る。

【0185】

少なくとも１つの実施例では、導入システム１６０６はユーザ・インターフェース１７１４（たとえば、グラフィカル・ユーザ・インターフェース、ウェブ・インターフェースなど）を含み得、ユーザ・インターフェース１７１４は、（１つ又は複数の）導入パイプライン１７１０中に含めるためのアプリケーションを選択し、アプリケーションを配置し、アプリケーション又はそのパラメータ若しくは構築を修正又は変更し、セットアップ及び／又は導入中に（１つ又は複数の）導入パイプライン１７１０を使用し、それと対話し、並びに／或いは他のやり方で導入システム１６０６と対話するために使用され得る。少なくとも１つの実施例では、訓練システム１６０４に関して示されていないが、ユーザ・インターフェース１７１４（又は異なるユーザ・インターフェース）は、導入システム１６０６における使用のためのモデルを選択するために、訓練システム１６０４において訓練又は再訓練するためのモデルを選択するために、及び／或いは訓練システム１６０４と他のやり方で対話するために使用され得る。

【0186】

少なくとも１つの実施例では、（１つ又は複数の）導入パイプライン１７１０のアプリケーション又はコンテナと、サービス１６２０及び／又はハードウェア１６２２との間で対話を管理するために、アプリケーション・オーケストレーション・システム１７２８に加えてパイプライン・マネージャ１７１２が使用され得る。少なくとも１つの実施例では、パイプライン・マネージャ１７１２は、アプリケーションからアプリケーションへの対話、アプリケーションからサービス１６２０への対話、及び／或いはアプリケーション又はサービスからハードウェア１６２２への対話を容易にするように構成され得る。少なくとも１つの実施例では、ソフトウェア１６１８中に含まれるように示されているが、これは限定を意図しておらず、（たとえば、図１５に示されている）いくつかの実例では、パイプライン・マネージャ１７１２は、サービス１６２０中に含まれ得る。少なくとも１つの実施例では、アプリケーション・オーケストレーション・システム１７２８（たとえば、Ｋｕｂｅｒｎｅｔｅｓ、ＤＯＣＫＥＲなど）は、コンテナ・オーケストレーション・システムを含み得、コンテナ・オーケストレーション・システムは、アプリケーションを、協調、管理、スケーリング、及び導入のための論理ユニットとして、コンテナにグループ化し得る。少なくとも１つの実施例では、（１つ又は複数の）導入パイプライン１７１０からのアプリケーション（たとえば、再構築アプリケーション、セグメント化アプリケーションなど）を個々のコンテナに関連付けることよって、各アプリケーションは、自己完結型環境（たとえば、カーネル・レベル）において実行して、スピード及び効率を向上させ得る。

【0187】

少なくとも１つの実施例では、各アプリケーション及び／又はコンテナ（又はその画像）は、個々に開発、修正、及び導入され得（たとえば、第１のユーザ又は開発者が、第１のアプリケーションを開発、修正、及び導入し得、第２のユーザ又は開発者が、第１のユーザ又は開発者とは別に第２のアプリケーションを開発、修正、及び導入し得）、これは、（１つ又は複数の）別のアプリケーション又は（１つ又は複数の）コンテナのタスクに邪魔されることなしに単一のアプリケーション及び／又は（１つ又は複数の）コンテナのタスクに集中し、注意を払うことを可能にする。少なくとも１つの実施例では、異なるコンテナ間又はアプリケーション間の通信、及び協調が、パイプライン・マネージャ１７１２及びアプリケーション・オーケストレーション・システム１７２８によって補助され得る。少なくとも１つの実施例では、各コンテナ又はアプリケーションの予想される入力及び／又は出力が、（たとえば、アプリケーション又はコンテナの構築に基づいて）システムによって知られている限り、アプリケーション・オーケストレーション・システム１７２８及び／又はパイプライン・マネージャ１７１２は、アプリケーション又はコンテナの各々の間の通信、及びそれらの間のリソースの共有を容易にし得る。少なくとも１つの実施例では、（１つ又は複数の）導入パイプライン１７１０中のアプリケーション又はコンテナのうちの１つ又は複数は、同じサービス及びリソースを共有し得るので、アプリケーション・オーケストレーション・システム１７２８は、様々なアプリケーション又はコンテナの間でサービス又はリソースをオーケストレートし、ロード・バランシングを行い、共有を決定し得る。少なくとも１つの実施例では、アプリケーション又はコンテナのリソース要件、これらのリソースの現在の使用量又は計画された使用量、及びリソースの利用可能性を追跡するために、スケジューラが使用され得る。少なくとも１つの実施例では、したがって、スケジューラは、異なるアプリケーションにリソースを割り振り、システムの要件及び利用可能性を考慮してアプリケーションの間でリソースを分散させ得る。いくつかの実例では、スケジューラ（及び／又はアプリケーション・オーケストレーション・システム１７２８の他の構成要素）は、サービス品質（ＱｏＳ：ｑｕａｌｉｔｙｏｆｓｅｒｖｉｃｅ）、（たとえば、リアルタイム処理を実行すべきか遅延処理を実行すべきかを決定するための）データ出力を必要とする緊急度など、システムに課される制約（たとえば、ユーザ制約）に基づいて、リソースの利用可能性及び分散を決定し得る。

【0188】

少なくとも１つの実施例では、導入システム１６０６中のアプリケーション又はコンテナによって活用及び共有されるサービス１６２０は、コンピュート・サービス１７１６、ＡＩサービス１７１８、視覚化サービス１７２０、及び／又は他のサービス・タイプを含み得る。少なくとも１つの実施例では、アプリケーションは、サービス１６２０のうちの１つ又は複数をコール（たとえば、実行）して、アプリケーションのための処理動作を実施し得る。少なくとも１つの実施例では、コンピュート・サービス１７１６は、スーパーコンピューティング又は他の高性能コンピューティング（ＨＰＣ：ｈｉｇｈ－ｐｅｒｆｏｒｍａｎｃｅｃｏｍｐｕｔｉｎｇ）タスクを実施するために、アプリケーションによって活用され得る。少なくとも１つの実施例では、アプリケーションのうちの１つ又は複数を通してデータを、及び／又は単一のアプリケーションの１つ又は複数のタスクを実質的に同時に処理するための（たとえば、並列コンピューティング・プラットフォーム１７３０を使用する）並列処理を実施するために、（１つ又は複数の）コンピュート・サービス１７１６が活用され得る。少なくとも１つの実施例では、並列コンピューティング・プラットフォーム１７３０（たとえば、ＮＶＩＤＩＡのＣＵＤＡ）は、ＧＰＵ（たとえば、ＧＰＵ１７２２）上での汎用コンピューティング（ＧＰＧＰＵ）を可能にし得る。少なくとも１つの実施例では、並列コンピューティング・プラットフォーム１７３０のソフトウェア層は、コンピュート・カーネルの実行のために、仮想命令セット及びＧＰＵの並列算出要素へのアクセスを提供し得る。少なくとも１つの実施例では、並列コンピューティング・プラットフォーム１７３０はメモリを含み得、いくつかの実施例では、メモリは、複数のコンテナの間で、及び／又は１つのコンテナ内の異なる処理タスクの間で共有され得る。少なくとも１つの実施例では、（たとえば、アプリケーションの複数の異なる段階又は複数のアプリケーションが同じ情報を処理している場合）並列コンピューティング・プラットフォーム１７３０のメモリの共有セグメントからの同じデータを使用するために、複数のコンテナについて及び／又はコンテナ内の複数のプロセスについて、プロセス間通信（ＩＰＣ：ｉｎｔｅｒ－ｐｒｏｃｅｓｓｃｏｍｍｕｎｉｃａｔｉｏｎ）コールが生成され得る。少なくとも１つの実施例では、データのコピーをとり、データをメモリ中の異なるロケーションに移動すること（たとえば、読取り／書込み動作）ではなく、メモリの同じロケーション中の同じデータが、任意の数の処理タスクのために（たとえば、同じ時間、異なる時間などに）使用され得る。少なくとも１つの実施例では、データが使用されて、処理の結果として新しいデータが生成されるとき、データの新しいロケーションのこの情報は、様々なアプリケーション間で記憶及び共有され得る。少なくとも１つの実施例では、データのロケーションと、更新された又は修正されたデータのロケーションとは、コンテナ内でペイロードがどのように理解されるかの定義の一部であり得る。

【0189】

少なくとも１つの実施例では、ＡＩサービス１７１８は、アプリケーションに関連付けられた（たとえば、アプリケーションの１つ又は複数の処理タスクを実施する役割を課された）（１つ又は複数の）機械学習モデルを実行するための推論サービスを実施するために活用され得る。少なくとも１つの実施例では、ＡＩサービス１７１８は、ＡＩシステム１７２４を活用して、セグメント化、再構築、物体検出、特徴検出、分類、及び／又は他の推論タスクのための（１つ又は複数の）機械学習モデル（たとえば、ＣＮＮなどのニューラル・ネットワーク）を実行し得る。少なくとも１つの実施例では、（１つ又は複数の）導入パイプライン１７１０のアプリケーションは、訓練システム１６０４からの出力モデル１６１６及び／又はアプリケーションの他のモデルのうちの１つ又は複数を使用して、撮像データに関して推論を実施し得る。少なくとも１つの実施例では、アプリケーション・オーケストレーション・システム１７２８（たとえば、スケジューラ）を使用する推論の２つ又はそれ以上の実例が利用可能であり得る。少なくとも１つの実施例では、第１のカテゴリは、緊急時の至急の要求に関して推論を実施するための、又は診断時の放射線医のためのなど、より高いサービス・レベルの合意を達成し得る高優先度／低レイテンシ経路を含み得る。少なくとも１つの実施例では、第２のカテゴリは、至急でないことがある要求のために、又は分析が後で実施され得る場合に使用され得る標準優先度経路を含み得る。少なくとも１つの実施例では、アプリケーション・オーケストレーション・システム１７２８は、ＡＩサービス１７１８の異なる推論タスクのための優先度経路に基づいて、リソース（たとえば、サービス１６２０及び／又はハードウェア１６２２）を分散させ得る。

【0190】

少なくとも１つの実施例では、共有ストレージが、システム１７００内でＡＩサービス１７１８に取り付けられ得る。少なくとも１つの実施例では、共有ストレージは、キャッシュ（又は他のストレージ・デバイス・タイプ）として動作し得、アプリケーションからの推論要求を処理するために使用され得る。少なくとも１つの実施例では、推論要求がサブミットされたとき、要求は、導入システム１６０６のＡＰＩインスタンスのセットによって受信され得、要求を処理するために、１つ又は複数のインスタンスが（たとえば、最良な適合のために、ロード・バランシングのためになど）選択され得る。少なくとも１つの実施例では、要求を処理するために、要求がデータベースに入れられ得、機械学習モデルは、まだキャッシュにない場合、モデル・レジストリ１６２４から位置特定され得、検証ステップは、適切な機械学習モデルがキャッシュ（たとえば、共有ストレージ）にロードされ、及び／又はモデルのコピーがキャッシュに保存され得ることを確実にし得る。少なくとも１つの実施例では、アプリケーションがまだ稼働していない場合又はアプリケーションの十分なインスタンスがない場合、（たとえば、パイプライン・マネージャ１７１２の）スケジューラが、要求において参照されたアプリケーションを起動するために使用され得る。少なくとも１つの実施例では、モデルを実行するための推論サーバがまだ起動されていない場合、推論サーバが起動され得る。任意の数の推論サーバがモデルごとに起動され得る。少なくとも１つの実施例では、推論サーバがクラスタ化されたプル・モデルにおいて、ロード・バランシングが有利であるときはいつでもモデルがキャッシュされ得る。少なくとも１つの実施例では、推論サーバは、対応する分散型サーバに静的にロードされ得る。

【0191】

少なくとも１つの実施例では、推論は、コンテナ中で稼働する推論サーバを使用して実施され得る。少なくとも１つの実施例では、推論サーバのインスタンスは、モデル（随意に、モデルの複数のバージョン）に関連付けられ得る。少なくとも１つの実施例では、モデルに対して推論を実施するための要求が受信されたとき、推論サーバのインスタンスが存在しない場合、新しいインスタンスがロードされ得る。少なくとも１つの実施例では、推論サーバを開始するとき、モデルが推論サーバに渡され得、それにより、推論サーバが異なるインスタンスとして稼働している限り、異なるモデルにサービスするために同じコンテナが使用され得る。

【0192】

少なくとも１つの実施例では、アプリケーション実行中、所与のアプリケーションについての推論要求が受信され得、（たとえば、推論サーバのインスタンスをホストする）コンテナが（まだロードされていない場合）ロードされ得、開始プロシージャがコールされ得る。少なくとも１つの実施例では、コンテナ中の前処理論理が、（たとえば、（１つ又は複数の）ＣＰＵ及び／又は（１つ又は複数の）ＧＰＵ及び／又は（１つ又は複数の）ＤＰＵを使用して）入って来るデータに対する任意の追加の前処理をロード、復号、及び／又は実施し得る。少なくとも１つの実施例では、推論のためにデータが準備されると、コンテナは、必要に応じてデータに関して推論を実施し得る。少なくとも１つの実施例では、これは、１つの画像（たとえば、手のＸ線）に対する単一の推論コールを含み得るか、又は何百もの画像（たとえば、胸のＣＴ）に関する推論を必要とし得る。少なくとも１つの実施例では、アプリケーションは、完了する前に結果を要約し得、これは、限定はしないが、単一の信頼性スコア、ピクセル・レベル・セグメント化、ボクセル・レベル・セグメント化、視覚化を生成すること、又は所見を要約するためにテキストを生成することを含み得る。少なくとも１つの実施例では、異なるモデル又はアプリケーションは、異なる優先度を割り当てられ得る。たとえば、リアルタイム（ＴＡＴ＜１分）の優先度を有するモデルもあれば、低優先度（たとえば、ＴＡＴ＜１２分）を有するモデルもある。少なくとも１つの実施例では、モデル実行時間は、要求元の機関又はエンティティから測定され得、パートナー・ネットワーク・トラバーサル時間、並びに推論サービスに対する実行を含み得る。

【0193】

少なくとも１つの実施例では、サービス１６２０と推論アプリケーションとの間での要求の転送は、ソフトウェア開発キット（ＳＤＫ）の後ろに隠され得、キューを通してロバストなトランスポートが提供され得る。少なくとも１つの実施例では、個々のアプリケーション／テナントＩＤの組合せについて、要求がＡＰＩを介してキューに入れられ、ＳＤＫは、キューから要求を引き出し、要求をアプリケーションに与える。少なくとも１つの実施例では、ＳＤＫが要求をピックアップする環境において、キューの名称が提供され得る。少なくとも１つの実施例では、キューを通した非同期通信は、その通信が、ワークが利用可能になったときに、アプリケーションの任意のインスタンスがそのワークをピックアップすることを可能にし得るので、有用であり得る。結果は、データが失われないことを確実にするために、キューを通して返送され得る。少なくとも１つの実施例では、最高優先度のワークは、アプリケーションのほとんどのインスタンスがキューに接続された、キューに進み得、一方で、最低優先度のワークは、単一のインスタンスがキューに接続された、受信された順番にタスクを処理するキューに進み得るので、キューは、ワークをセグメント化するアビリティをも提供し得る。少なくとも１つの実施例では、アプリケーションは、クラウド１７２６において生成されたＧＰＵ加速インスタンス上で稼働し得、推論サービスは、ＧＰＵ上で推論を実施し得る。

【0194】

少なくとも１つの実施例では、視覚化サービス１７２０が、アプリケーション及び／又は（１つ又は複数の）導入パイプライン１７１０の出力を見るための視覚化を生成するために活用され得る。少なくとも１つの実施例では、視覚化を生成するために視覚化サービス１７２０によってＧＰＵ１７２２が活用され得る。少なくとも１つの実施例では、レイ・トレーシングなどのレンダリング効果が、より高品質の視覚化を生成するために視覚化サービス１７２０によって実装され得る。少なくとも１つの実施例では、視覚化は、限定はしないが、２Ｄ画像レンダリング、３Ｄボリューム・レンダリング、３Ｄボリューム再構築、２Ｄトモグラフィ・スライス、仮想現実表示、拡張現実表示などを含み得る。少なくとも１つの実施例では、仮想化された環境が、システムのユーザ（たとえば、医師、看護師、放射線医など）による対話のための仮想インタラクティブ表示又は環境（たとえば、仮想環境）を生成するために使用され得る。少なくとも１つの実施例では、視覚化サービス１７２０は、内部ビジュアライザ、シネマティクス、及び／或いは他のレンダリング又は画像処理能力又は機能性（たとえば、レイ・トレーシング、ラスタ化、内部光学など）を含み得る。

【0195】

少なくとも１つの実施例では、ハードウェア１６２２は、ＧＰＵ１７２２、ＡＩシステム１７２４、クラウド１７２６、並びに／或いは訓練システム１６０４及び／又は導入システム１６０６を実行するために使用される任意の他のハードウェアを含み得る。少なくとも１つの実施例では、ＧＰＵ１７２２（たとえば、ＮＶＩＤＩＡのＴＥＳＬＡ及び／又はＱＵＡＤＲＯＧＰＵ）は、任意の数のＧＰＵを含み得、任意の数のＧＰＵは、コンピュート・サービス１７１６、ＡＩサービス１７１８、視覚化サービス１７２０、他のサービス、及び／或いはソフトウェア１６１８の特徴又は機能性のいずれかの処理タスクを実行するために使用され得る。たとえば、ＡＩサービス１７１８に関して、ＧＰＵ１７２２が、撮像データ（又は機械学習モデルによって使用される他のデータ・タイプ）に対する前処理、機械学習モデルの出力に対する後処理を実施するために、及び／又は推論を実施するために（たとえば、機械学習モデルを実行するために）使用され得る。少なくとも１つの実施例では、クラウド１７２６、ＡＩシステム１７２４、及び／又はシステム１７００の他の構成要素は、ＧＰＵ１７２２を使用し得る。少なくとも１つの実施例では、クラウド１７２６は、深層学習タスクのためのＧＰＵ最適化プラットフォームを含み得る。少なくとも１つの実施例では、ＡＩシステム１７２４は、ＧＰＵを使用し得、クラウド１７２６、或いは深層学習又は推論の役割を課された少なくとも一部分は、１つ又は複数のＡＩシステム１７２４を使用して実行され得る。したがって、ハードウェア１６２２は個別構成要素として示されているが、これは、限定を意図しておらず、ハードウェア１６２２の任意の構成要素が、ハードウェア１６２２の任意の他の構成要素と組み合わせられ、それらによって活用され得る。

【0196】

少なくとも１つの実施例では、ＡＩシステム１７２４は、推論、深層学習、機械学習、及び／又は他の人工知能タスクのために構成された専用のコンピューティング・システム（たとえば、スーパーコンピュータ又はＨＰＣ）を含み得る。少なくとも１つの実施例では、ＡＩシステム１７２４（たとえば、ＮＶＩＤＩＡのＤＧＸ）は、ＧＰＵ最適化ソフトウェア（たとえば、ソフトウェア・スタック）を含み得、ＧＰＵ最適化ソフトウェアは、ＤＰＵ、ＣＰＵ、ＲＡＭ、ストレージ、及び／又は他の構成要素、特徴、又は機能性に加えて、複数のＧＰＵ１７２２を使用して実行され得る。少なくとも１つの実施例では、１つ又は複数のＡＩシステム１７２４は、システム１７００のＡＩベースの処理タスクのいくつか又はすべてを実施するために、（たとえば、データ・センタにおいて）クラウド１７２６において実装され得る。

【0197】

少なくとも１つの実施例では、クラウド１７２６は、ＧＰＵ加速インフラストラクチャ（たとえば、ＮＶＩＤＩＡのＮＧＣ）を含み得、ＧＰＵ加速インフラストラクチャは、システム１７００の処理タスクを実行するためのＧＰＵ最適化プラットフォームを提供し得る。少なくとも１つの実施例では、クラウド１７２６は、システム１７００のＡＩベースのタスクのうちの１つ又は複数を実施するための（１つ又は複数の）ＡＩシステム１７２４を（たとえば、ハードウェア抽象化及びスケーリング・プラットフォームとして）含み得る。少なくとも１つの実施例では、クラウド１７２６は、アプリケーションとサービス１６２０との間でシームレスなスケーリング及びロード・バランシングを可能にするために、複数のＧＰＵを活用してアプリケーション・オーケストレーション・システム１７２８と統合し得る。少なくとも１つの実施例では、クラウド１７２６は、本明細書で説明されるように、コンピュート・サービス１７１６、ＡＩサービス１７１８、及び／又は視覚化サービス１７２０を含む、システム１７００のサービス１６２０の少なくともいくつかを実行する役割を課され得る。少なくとも１つの実施例では、クラウド１７２６は、大小のバッチ推論（たとえば、ＮＶＩＤＩＡのＴＥＮＳＯＲＲＴを実行すること）を実施し、加速並列コンピューティングＡＰＩ及びプラットフォーム１７３０（たとえば、ＮＶＩＤＩＡのＣＵＤＡ）を提供し、アプリケーション・オーケストレーション・システム１７２８（たとえば、ＫＵＢＥＲＮＥＴＥＳ）を実行し、（たとえば、より高品質のシネマティクスを作り出すためのレイ・トレーシング、２Ｄグラフィックス、３Ｄグラフィックス、及び／又は他のレンダリング技法のための）グラフィックス・レンダリングＡＰＩ及びプラットフォームを提供し得、及び／又はシステム１７００のための他の機能性を提供し得る。

【0198】

図１８Ａは、少なくとも１つの実施例による、機械学習モデルを訓練、再訓練、又は更新するためのプロセス１８００のデータ・フロー図を示す。少なくとも１つの実施例では、プロセス１８００は、図１７のシステム１７００を非限定的な実例として使用して、実行され得る。少なくとも１つの実施例では、プロセス１８００は、本明細書で説明されるように、システム１７００のサービス１６２０及び／又はハードウェア１６２２を活用し得る。少なくとも１つの実施例では、プロセス１８００によって生成される改良されたモデル１８１２は、導入パイプライン１７１０中の１つ又は複数のコンテナ化アプリケーションのために、導入システム１６０６によって実行され得る。

【0199】

少なくとも１つの実施例では、モデル訓練１６１４は、新しい訓練データ（たとえば、顧客データセット１８０６、及び／又は入力データに関連付けられた新しいグランド・トゥルース・データなどの新しい入力データ）を使用して、初期モデル１８０４（たとえば、事前訓練されたモデル）を再訓練又は更新することを含み得る。少なくとも１つの実施例では、初期モデル１８０４を再訓練又は更新するために、初期モデル１８０４の（１つ又は複数の）出力又は損失層がリセット又は削除され得、及び／或いは、（１つ又は複数の）更新された又は新しい出力又は損失層と置き換えられ得る。少なくとも１つの実施例では、初期モデル１８０４は、前に微調整された、前の訓練から残っているパラメータ（たとえば、重み及び／又はバイアス）を有し得、したがって、訓練又は再訓練１６１４は、最初からモデルを訓練するほど長い時間がかからないか、又は多くの処理を必要としないことがある。少なくとも１つの実施例では、モデル訓練１６１４中に、初期モデル１８０４の（１つ又は複数の）リセットされた又は置き換えられた出力又は損失層を有することによって、パラメータは、新しい顧客データセット１８０６（たとえば、図１６の画像データ１６０８）に関して予測を生成する際の（１つ又は複数の）出力又は損失層の精度に関連付けられた損失計算に基づいて、新しいデータ・セットのために更新又は再調整され得る。

【0200】

少なくとも１つの実施例では、事前訓練されたモデル１７０６は、データ・ストア又はレジストリ（たとえば、図１６のモデル・レジストリ１６２４）に記憶され得る。少なくとも１つの実施例では、事前訓練されたモデル１７０６は、少なくとも部分的に、プロセス１８００を実行する施設以外の１つ又は複数の施設において訓練されていることがある。少なくとも１つの実施例では、異なる施設の患者、対象者、顧客のプライバシー及び権利を保護するために、事前訓練されたモデル１７０６は、構内で生成された顧客又は患者データを使用して、構内で訓練されていることがある。少なくとも１つの実施例では、事前訓練されたモデル１７０６は、クラウド１７２６及び／又は他のハードウェア１６２２を使用して訓練され得るが、プライバシー保護された機密の患者データは、クラウド１７２６（又は他の構外のハードウェア）の任意の構成要素に転送されないか、それらの構成要素によって使用されないか、又はそれらの構成要素にとってアクセス不可能であり得る。少なくとも１つの実施例では、事前訓練されたモデル１７０６が２つ以上の施設からの患者データを使用して訓練される場合、事前訓練されたモデル１７０６は、各施設について個々に訓練されてから、別の施設からの患者又は顧客データに関して訓練され得る。少なくとも１つの実施例では、顧客又は患者データが（たとえば、権利放棄によって、実験での使用のために、など）プライバシー問題から解放された場合、或いは、顧客又は患者データがパブリック・データ・セット中に含まれる場合など、任意の数の施設からの顧客又は患者データが、データセンタ又は他のクラウド・コンピューティング・インフラストラクチャなど、構内及び／又は構外で事前訓練されたモデル１７０６を訓練するために使用され得る。

【0201】

少なくとも１つの実施例では、導入パイプライン１７１０における使用のためのアプリケーションを選択するとき、ユーザは、特定のアプリケーションのために使用されるべき機械学習モデルをも選択し得る。少なくとも１つの実施例では、ユーザは、使用のためのモデルを有しないことがあり、したがって、ユーザは、アプリケーションとともに使用するために事前訓練されたモデル１７０６を選択し得る。少なくとも１つの実施例では、事前訓練されたモデル１７０６は、（たとえば、患者の多様性、人口統計、使用される医療撮像デバイスのタイプなどに基づいて）ユーザの施設の顧客データセット１８０６に関して正確な結果を生成するために最適化されないことがある。少なくとも１つの実施例では、事前訓練されたモデル１７０６を、（１つ又は複数の）アプリケーションとともに使用するために導入パイプライン１７１０に導入する前に、事前訓練されたモデル１７０６は、それぞれの施設において使用するために更新、再訓練、及び／又は微調整され得る。

【0202】

少なくとも１つの実施例では、ユーザは、更新、再訓練、及び／又は微調整されるべきである事前訓練されたモデル１７０６を選択し得、事前訓練されたモデル１７０６は、プロセス１８００内の訓練システム１６０４のための初期モデル１８０４と呼ばれることがある。少なくとも１つの実施例では、顧客データセット１８０６（たとえば、施設におけるデバイスによって生成された撮像データ、ゲノミクス・データ、シーケンシング・データ、又は他のデータ・タイプ）が、初期モデル１８０４に関して（限定はしないが、転移学習（ｔｒａｎｓｆｅｒｌｅａｒｎｉｎｇ）を含み得る）モデル訓練１６１４を実施して、改良されたモデル１８１２を生成するために、使用され得る。少なくとも１つの実施例では、顧客データセット１８０６に対応するグランド・トゥルース・データが、訓練システム１６０４によって生成され得る。少なくとも１つの実施例では、グランド・トゥルース・データは、（たとえば、図１６のラベル付きクリニック・データ１６１２として）施設において臨床医、科学者、医師、開業医によって、少なくとも部分的に生成され得る。

【0203】

少なくとも１つの実施例では、グランド・トゥルース・データを生成するために、ＡＩ支援アノテーション１６１０がいくつかの実例において使用され得る。少なくとも１つの実施例では、（たとえば、ＡＩ支援アノテーションＳＤＫを使用して実装された）ＡＩ支援アノテーション１６１０は、機械学習モデル（たとえば、ニューラル・ネットワーク）を活用して、顧客データセットについて示唆又は予測されるグランド・トゥルース・データを生成し得る。少なくとも１つの実施例では、ユーザ１８１０は、コンピューティング・デバイス１８０８上のユーザ・インターフェース（グラフィカル・ユーザ・インターフェース（ＧＵＩ：ｇｒａｐｈｉｃａｌｕｓｅｒｉｎｔｅｒｆａｃｅ））内でアノテーション・ツールを使用し得る。

【0204】

少なくとも１つの実施例では、ユーザ１８１０は、コンピューティング・デバイス１８０８を介してＧＵＩと対話して、（自動）アノテーションを編集又は微調整し得る。少なくとも１つの実施例では、ポリゴン編集特徴が、ポリゴンの頂点をより正確なロケーション又は微調整されたロケーションに移動するために使用され得る。

【0205】

少なくとも１つの実施例では、顧客データセット１８０６が、関連するグランド・トゥルース・データを有すると、（たとえば、ＡＩ支援アノテーション、手動ラベル付けなどからの）グランド・トゥルース・データが、改良されたモデル１８１２を生成するために、モデル訓練１６１４中によって使用され得る。少なくとも１つの実施例では、顧客データセット１８０６は、初期モデル１８０４に任意の回数適用され得、グランド・トゥルース・データは、改良されたモデル１８１２について、許容可能なレベルの精度が達成されるまで、初期モデル１８０４のパラメータを更新するために使用され得る。少なくとも１つの実施例では、改良されたモデル１８１２が生成されると、改良されたモデル１８１２は、医療撮像データに対して１つ又は複数の処理タスクを実施するために、施設において１つ又は複数の導入パイプライン１７１０内で導入され得る。

【0206】

少なくとも１つの実施例では、改良されたモデル１８１２は、別の施設によって選択されるべきモデル・レジストリ１６２４において事前訓練されたモデル１７０６にアップロードされ得る。少なくとも１つの実施例では、彼のプロセスは任意の数の施設において完了され得、それにより、改良されたモデル１８１２は、より普遍的なモデルを生成するように新しいデータセットに関して任意の回数さらに改良され得る。

【0207】

図１８Ｂは、少なくとも１つの実施例による、事前訓練されたアノテーション・モデルを用いてアノテーション・ツールを拡張するためのクライアントサーバ・アーキテクチャ１８３２の例示的な図である。少なくとも１つの実施例では、ＡＩ支援アノテーション・ツール１８３６は、クライアントサーバ・アーキテクチャ１８３２に基づいてインスタンス化され得る。少なくとも１つの実施例では、撮像アプリケーション中のアノテーション・ツール１８３６は、放射線医が、たとえば、器官及び異常を識別するのを補助し得る。少なくとも１つの実施例では、撮像アプリケーションは、非限定的な実例として、（たとえば、３ＤＭＲＩ又はＣＴスキャンにおける）生画像１８３４において、関心のある特定の器官上の数個の極値点をユーザ１８１０が識別するのを助け、特定の器官のすべての２Ｄスライスについて自動アノテーション付けされた結果を受信する、ソフトウェア・ツールを含み得る。少なくとも１つの実施例では、結果は、訓練データ１８３８としてデータ・ストアに記憶され、（たとえば、限定はしないが）訓練のためのグランド・トゥルース・データとして使用され得る。少なくとも１つの実施例では、コンピューティング・デバイス１８０８が、ＡＩ支援アノテーション１６１０のために極値点を送出するとき、たとえば、深層学習モデルがこのデータを入力として受信し、セグメント化された器官又は異常の推論結果を返し得る。少なくとも１つの実施例では、図１８Ｂ中のＡＩ支援アノテーション・ツール１８３６Ｂなどの事前インスタンス化されたアノテーション・ツールは、たとえばアノテーション・モデル・レジストリに記憶された、事前訓練されたモデル１８４２のセットを含み得るアノテーション支援サーバ１８４０などのサーバに、ＡＰＩコール（たとえば、ＡＰＩコール１８４４）を行うことによって、拡張され得る。少なくとも１つの実施例では、アノテーション・モデル・レジストリは、特定の器官又は異常に対してＡＩ支援アノテーションを実施するように事前訓練された、事前訓練されたモデル１８４２（たとえば、深層学習モデルなどの機械学習モデル）を記憶し得る。これらのモデルは、訓練パイプライン１７０４を使用することによって、さらに更新され得る。少なくとも１つの実施例では、事前インストールされたアノテーション・ツールは、新しいラベル付きクリニック・データ１６１２が追加されるにつれて、経時的に改善され得る。

【0208】

【0209】

他の変形形態は、本開示の範囲内にある。したがって、開示される技法は、様々な修正及び代替構築が可能であるが、それらのいくつかの例示的な実施例が図面に示され、上記で詳細に説明された。しかしながら、特定の１つ又は複数の開示された形態に本開示を限定する意図はなく、その反対に、添付の特許請求の範囲において定義されるように、開示の趣旨及び範囲に入るすべての修正形態、代替構築、及び等価物を網羅することを意図している。

【0210】

開示される実施例を説明する文脈において（特に、以下の特許請求の範囲の文脈において）「ａ」及び「ａｎ」及び「ｔｈｅ」という用語、並びに同様の指示語を使用することは、本明細書に別段の記載のない限り、又は文脈によって明らかに否定されない限り、単数と複数の両方を網羅すると解釈されるべきであり、用語の定義であると解釈されるべきではない。「含む、備える（ｃｏｍｐｒｉｓｉｎｇ）」、「有する（ｈａｖｉｎｇ）」、「含む（ｉｎｃｌｕｄｉｎｇ）」、「含んでいる（ｃｏｎｔａｉｎｉｎｇ）」という用語は、別段の記載のない限り、オープンエンドの用語（「限定はしないが、～を含む（ｉｎｃｌｕｄｉｎｇ，ｂｕｔｎｏｔｌｉｍｉｔｅｄｔｏ，）」を意味する）と解釈されるべきである。「接続される」は、修飾されず、物理的接続を指しているとき、何か介在するものがある場合でも、部分的に又は完全に中に含まれているか、取り付けられるか、又は互いに接合されるものとして解釈されるべきである。本明細書で値の範囲を詳述することは、本明細書に別段の記載のない限り、及び各別個の値が、本明細書に個々に詳述されているかのように明細書に組み込まれていない限り、範囲内に入る各別個の値を個々に参照する簡潔な方法として働くことを単に意図しているにすぎない。少なくとも１つの実施例では、「セット」（たとえば、「項目のセット」）又は「サブセット」という用語の使用は、文脈によって別段の記載がないか又は否定されない限り、１つ又は複数の部材を備える空ではない集合として解釈されるべきである。さらに、文脈によって別段の記載がないか又は否定されない限り、対応するセットの「サブセット」という用語は、対応するセットの厳密なサブセットを必ずしも指すとは限らず、サブセットと、対応するセットとは、等しくなり得る。

【0211】

「Ａ、Ｂ、及びＣのうちの少なくとも１つ」又は「Ａ、Ｂ及びＣのうちの少なくとも１つ」という形態の言い回しなどの結合語は、別段の具体的な記載がないか又はさもなければ文脈によって明確に否定されない限り、別様に、項目、用語などが、Ａ又はＢ又はＣのいずれか、或いはＡとＢとＣとのセットの任意の空でないサブセットであり得ることを提示するために一般に使用される文脈で、理解される。たとえば、３つの部材を有するセットの説明的な実例では、「Ａ、Ｂ、及びＣのうちの少なくとも１つ」並びに「Ａ、Ｂ及びＣのうちの少なくとも１つ」という結合句は、次のセットのうちのいずれかを指す：｛Ａ｝、｛Ｂ｝、｛Ｃ｝、｛Ａ、Ｂ｝、｛Ａ、Ｃ｝、｛Ｂ、Ｃ｝、｛Ａ、Ｂ、Ｃ｝。したがって、そのような結合語は、いくつかの実施例が、Ａのうちの少なくとも１つ、Ｂのうちの少なくとも１つ、及びＣのうちの少なくとも１つの各々が存在することを必要とすることを全体的に暗示するものではない。さらに、別段の記載がないか又は文脈によって否定されない限り、「複数（ｐｌｕｒａｌｉｔｙ）」という用語は、複数である状態を示す（たとえば、「複数の項目（ａｐｌｕｒａｌｉｔｙｏｆｉｔｅｍｓ）」は複数の項目（ｍｕｌｔｉｐｌｅｉｔｅｍｓ）を示す）。少なくとも１つの実施例では、複数（ｐｌｕｒａｌｉｔｙ）における項目の数は、少なくとも２つであるが、明示的に、又は文脈によってのいずれかでそのように示されているとき、それよりも多いことがある。さらに、別段の記載がないか又はさもなければ文脈から明らかでない限り、「～に基づいて」という言い回しは、「少なくとも部分的に～に基づいて」を意味し、「～のみに基づいて」を意味しない。

【0212】

本明細書で説明されるプロセスの動作は、本明細書に別段の記載がないか又はさもなければ文脈によって明確に否定されない限り、任意の好適な順序で実施され得る。少なくとも１つの実施例では、本明細書で説明されるプロセス（又はその変形及び／又は組合せ）などのプロセスは、実行可能命令で構成された１つ又は複数のコンピュータ・システムの制御下で実施され、１つ又は複数のプロセッサ上で、ハードウェアによって、又はそれらの組合せによって集合的に実行するコード（たとえば、実行可能命令、１つ又は複数のコンピュータ・プログラム、又は１つ又は複数のアプリケーション）として実装される。少なくとも１つの実施例では、コードは、たとえば、１つ又は複数のプロセッサによって実行可能な複数の命令を備えるコンピュータ・プログラムの形態で、コンピュータ可読記憶媒体に記憶される。少なくとも１つの実施例では、コンピュータ可読記憶媒体は、一時的信号（たとえば、伝搬する一時的な電気又は電磁送信）を除外するが、一時的信号のトランシーバ内の非一時的データ・ストレージ回路要素（たとえば、バッファ、キャッシュ、及びキュー）を含む非一時的コンピュータ可読記憶媒体である。少なくとも１つの実施例では、コード（たとえば、実行可能コード又はソース・コード）は、１つ又は複数の非一時的コンピュータ可読記憶媒体のセットに記憶され、この記憶媒体は、コンピュータ・システムの１つ又は複数のプロセッサによって実行されたときに（すなわち、実行された結果として）、コンピュータ・システムに本明細書で説明される動作を実施させる実行可能命令を記憶している（又は、実行可能命令を記憶するための他のメモリを有する）。少なくとも１つの実施例では、非一時的コンピュータ可読記憶媒体のセットは、複数の非一時的コンピュータ可読記憶媒体を備え、複数の非一時的コンピュータ可読記憶媒体の個々の非一時的記憶媒体のうちの１つ又は複数は、コードのすべてがないが、複数の非一時的コンピュータ可読記憶媒体は、集合的にコードのすべてを記憶している。少なくとも１つの実施例では、実行可能命令は、異なる命令が異なるプロセッサによって実行されるように実行される。

【0213】

したがって、少なくとも１つの実施例では、コンピュータ・システムは、本明細書で説明されるプロセスの動作を単独で又は集合的に実施する１つ又は複数のサービスを実装するように構成され、そのようなコンピュータ・システムは、動作の実施を可能にする適用可能なハードウェア及び／又はソフトウェアで構成される。さらに、本開示の少なくとも１つの実施例を実装するコンピュータ・システムは、単一のデバイスであり、別の実施例では、分散型コンピュータ・システムが本明細書で説明される動作を実施するように、及び単一のデバイスがすべての動作を実施しないように、異なるやり方で動作する複数のデバイスを備える分散型コンピュータ・システムである。

【0214】

本明細書で提供されるあらゆる実例、又は例示的な言葉（たとえば、「など、などの（ｓｕｃｈａｓ）」）の使用は、本開示の実施例をより明らかにすることのみを意図しており、別段の主張のない限り、本開示の範囲に制限を加えるものではない。本明細書のいかなる言葉も、特許請求されていない任意の要素を、本開示の実践に不可欠なものとして示すと解釈されるべきではない。

【0215】

本明細書で引用される出版物、特許出願、及び特許を含むすべての参考文献は、各参考文献が参照により組み込まれることが個別に明確に示され、その全体が本明細書に記載されたかのように、それと同程度まで参照により本明細書に組み込まれる。

【0216】

明細書及び特許請求の範囲において、「結合される」及び「接続される」という用語が、その派生語とともに使用され得る。これらの用語は、互いに同義語として意図されていないことがあることが理解されるべきである。むしろ、特定の実例では、「接続される」又は「結合される」は、２つ又はそれ以上の要素が物理的又は電気的に互いに直接又は間接的に接触していることを示すために使用され得る。「結合される」はまた、２つ又はそれ以上の要素が直接互いに接触していないが、それでもなお互いに連動又は対話することを意味し得る。

【0217】

別段の具体的な記載がない限り、明細書全体を通して、「処理する（ｐｒｏｃｅｓｓｉｎｇ）」、「算出する（ｃｏｍｐｕｔｉｎｇ）」、「計算する（ｃａｌｃｕｌａｔｉｎｇ）」、又は「決定する（ｄｅｔｅｒｍｉｎｉｎｇ）」などの用語は、コンピューティング・システムのレジスタ及び／又はメモリ内の、電子的などの物理的な量として表されるデータを、コンピューティング・システムのメモリ、レジスタ又は他のそのような情報ストレージ、送信、若しくはディスプレイ・デバイス内の物理的な量として同様に表される他のデータになるように操作及び／又は変換する、コンピュータ又はコンピューティング・システム、或いは同様の電子コンピューティング・デバイスのアクション及び／又はプロセスを指す。

【0218】

同様に、「プロセッサ」という用語は、レジスタ及び／又はメモリからの電子データを処理し、その電子データを、レジスタ及び／又はメモリに記憶され得る他の電子データに変換する任意のデバイス、又はデバイスの一部分を指し得る。「コンピューティング・プラットフォーム」は、１つ又は複数のプロセッサを備え得る。本明細書で使用される「ソフトウェア」プロセスは、たとえば、タスク、スレッド、及び知的エージェントなど、経時的にワークを実施するソフトウェア及び／又はハードウェア・エンティティを含み得る。また、各プロセスは、命令を直列で又は並列で、連続的に又は断続的に行うための複数のプロセスを指し得る。少なくとも１つの実施例では、「システム」及び「方法」という用語は、１つ又は複数の方法をシステムが具体化し得、方法がシステムと考えられ得る場合に限り、本明細書において交換可能に使用される。

【0219】

本明細書では、アナログ・データ又はデジタル・データを取得すること、獲得すること、受信すること、或いはそれらをサブシステム、コンピュータ・システム、又はコンピュータ実装機械に入力することに言及し得る。少なくとも１つの実施例では、アナログ・データ又はデジタル・データを取得する、獲得する、受信する、又は入力するプロセスは、関数コール、又はアプリケーション・プログラミング・インターフェースへのコールのパラメータとしてデータを受信することによってなど、様々なやり方で実現され得る。少なくとも１つの実施例では、アナログ・データ又はデジタル・データを取得する、獲得する、受信する、又は入力するプロセスは、直列又は並列インターフェースを介してデータを転送することによって実現され得る。少なくとも１つの実施例では、アナログ・データ又はデジタル・データを取得する、獲得する、受信する、又は入力するプロセスは、提供するエンティティから獲得するエンティティにコンピュータ・ネットワークを介してデータを転送することによって実現され得る。少なくとも１つの実施例では、アナログ・データ又はデジタル・データを提供すること、出力すること、送信すること、送出すること、又は提示することにも言及し得る。様々な実例では、アナログ・データ又はデジタル・データを提供する、出力する、送信する、送出する、又は提示するプロセスは、関数コールの入力又は出力パラメータ、アプリケーション・プログラミング・インターフェース又はプロセス間通信機構のパラメータとしてデータを転送することによって実現され得る。

【0220】

本明細書の説明は、説明された技法の例示的な実施例について述べているが、他のアーキテクチャが、説明された機能性を実装するために使用され得、本開示の範囲内にあることが意図される。さらに、説明を目的として、責任の具体的な分散が定義され得るが、様々な機能及び責任は、状況に応じて異なるやり方で分散及び分割され得る。

【0221】

さらに、主題は、構造的特徴及び／又は方法論的行為に特有の言語で説明されたが、添付の特許請求の範囲で特許請求される主題は、説明された特有の特徴又は行為に必ずしも限定されるとは限らないことが理解されるべきである。むしろ、特有の特徴及び行為は、特許請求の範囲を実装する例示的な形態として開示される。

【図1】