特表2022-520919 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ オキュラス　ブイアール，エルエルシーの特許一覧

特表2022-520919機械学習ベースシェーダをもつグラフィックス処理チップ

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5A-5B
6A
6B
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2022-04-04

(54)【発明の名称】機械学習ベースシェーダをもつグラフィックス処理チップ

(51)【国際特許分類】

G06T 15/80 20110101AFI20220328BHJP

G06N 3/08 20060101ALI20220328BHJP

【ＦＩ】

G06T15/80

G06N3/08

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2021533491

(86)(22)【出願日】2020-02-13

(85)【翻訳文提出日】2021-08-10

(86)【国際出願番号】 US2020018130

(87)【国際公開番号】W WO2020172043

(87)【国際公開日】2020-08-27

(31)【優先権主張番号】16/281,703

(32)【優先日】2019-02-21

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＢＬＵＥＴＯＯＴＨ

(71)【出願人】

【識別番号】515046968

【氏名又は名称】フェイスブック・テクノロジーズ・リミテッド・ライアビリティ・カンパニー

【氏名又は名称原語表記】ＦＡＣＥＢＯＯＫＴＥＣＨＮＯＬＯＧＩＥＳ，ＬＬＣ

(74)【代理人】

【識別番号】110002974

【氏名又は名称】特許業務法人ＷｏｒｌｄＩＰ

(72)【発明者】

【氏名】シード，クリストフハーマン

(72)【発明者】

【氏名】カプラニヤン，アントンエス．

【テーマコード（参考）】

5B080

【Ｆターム（参考）】

5B080AA14

5B080AA19

5B080BA02

5B080CA01

5B080CA04

5B080DA06

5B080FA02

5B080FA09

5B080GA11

(57)【要約】

本明細書で開示される実施形態は、コンピュータグラフィックスをレンダリングするためのグラフィックス処理チップに関する。本グラフィックス処理チップは、グラフィックスレンダリングパイプラインに従って本グラフィックス処理チップの動作を管理するように構成されたコントローラを含み得る。動作は、ジオメトリ処理動作と、ラスタ化動作と、シェーディング動作とを含み得る。本チップは、シェーディング動作の少なくとも一部分を実施するように構成された機械学習モデルを記憶するように構成されたプログラマブルメモリ構成要素をさらに含み得る。本チップは、機械学習モデルに従ってシェーディング動作を実施するために選択的に使用されるように構成された複数の処理ユニットをも含み得る。本チップは、シェーディング動作を使用して生成された画像データを記憶するように構成された少なくとも１つの出力メモリをも含み得る。
【選択図】図１

【特許請求の範囲】

【請求項1】

グラフィックス処理チップであって、
グラフィックスレンダリングパイプラインに従って前記グラフィックス処理チップの動作を管理するように構成されたコントローラであって、前記動作が、ジオメトリ処理動作と、ラスタ化動作と、シェーディング動作とを含む、コントローラと、
前記シェーディング動作の少なくとも一部分を実施するように構成された機械学習モデルを記憶するように構成された少なくとも１つのプログラマブルメモリ構成要素と、
前記機械学習モデルに従って前記シェーディング動作を実施するために選択的に使用されるように構成された複数の処理ユニットと、
前記シェーディング動作を使用して生成された画像データを記憶するように構成された少なくとも１つの出力メモリと
を備える、グラフィックス処理チップ。

【請求項2】

前記機械学習モデルが、前記プログラマブルメモリ構成要素に記憶され、観察データと、ライティングデータと、色データと、材料特性データとに基づいて出力を生成するように構成され、
前記出力メモリに記憶された前記画像データが、前記機械学習モデルの前記出力を使用して生成される、
請求項１に記載のグラフィックス処理チップ。

【請求項3】

前記機械学習モデルの前記出力が、強度データを含み、
前記画像データが、前記色データと前記強度データとに基づいて生成される、
請求項２に記載のグラフィックス処理チップ。

【請求項4】

前記機械学習モデルが、第２の強度データに基づいて前記出力を生成するようにさらに構成された、
請求項３に記載のグラフィックス処理チップ。

【請求項5】

前記少なくとも１つのプログラマブルメモリ構成要素が、前記観察データと、前記ライティングデータと、前記色データと、前記材料特性データとのうちの１つまたは複数に基づいて第２の出力を生成するように構成された第２の機械学習モデルを記憶するように構成され、
前記第２の強度データが、前記第２の出力と、前記観察データと、前記ライティングデータとを使用して生成され、
前記機械学習モデルと前記第２の機械学習モデルとが、複数のトレーニングサンプルを使用してエンドツーエンドでトレーニングされる、
請求項４に記載のグラフィックス処理チップ。

【請求項6】

前記第２の強度データが、照明モデルに従って生成され、前記第２の機械学習モデルの前記第２の出力が、前記第２の強度データを生成するために前記照明モデルによって使用される鏡面データを含む、
請求項５に記載のグラフィックス処理チップ。

【請求項7】

前記機械学習モデルが、複数のトレーニングサンプルを使用してトレーニングされ、
前記複数のトレーニングサンプルの各々が、仮想表面に関連する材料特性データと、フラグメントに関連するターゲット色データとに関連し、前記ターゲット色データが、後処理効果を伴うターゲット画像に関連する、
請求項１に記載のグラフィックス処理チップ。

【請求項8】

前記機械学習モデルがニューラルネットワークを備える、
請求項１に記載のグラフィックス処理チップ。

【請求項9】

前記複数の処理ユニットがデジタル信号プロセッサである、
請求項１に記載のグラフィックス処理チップ。

【請求項10】

オフチップ回路と通信するためのインターフェースをさらに備え、該インターフェースを通してレンダリング命令が受信される、請求項１に記載のグラフィックス処理チップ。

【請求項11】

前記観察データと、前記ライティングデータと、前記色データと、前記材料特性データとが、１つまたは複数のフラグメントに関連し、前記１つまたは複数のフラグメントが、前記ジオメトリ処理動作および前記ラスタ化動作を使用して生成される、
請求項２に記載のグラフィックス処理チップ。

【請求項12】

前記色データと前記材料特性データとが、前記１つまたは複数のフラグメントを通して可視であると決定された１つまたは複数の仮想表面に関連する、
請求項１１に記載のグラフィックス処理チップ。

【請求項13】

前記複数の処理ユニットが、前記ジオメトリ処理動作または前記ラスタ化動作を実施するために選択的に使用されるようにさらに構成された、請求項１に記載のグラフィックス処理チップ。

【請求項14】

前記ジオメトリ処理動作または前記ラスタ化動作を実施するように構成された１つまたは複数の固定機能プロセッサ
をさらに備える、請求項１に記載のグラフィックス処理チップ。

【請求項15】

前記コントローラは、前記ジオメトリ処理動作を前記ラスタ化動作の前に実施させるように構成され、前記コントローラは、前記シェーディング動作を、前記ジオメトリ処理動作および前記ラスタ化動作の後に実施させるように構成された、請求項１に記載のグラフィックス処理チップ。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本出願は、その内容全体がすべての目的のために参照により本明細書に組み込まれる、２０１９年２月２１日に出願された米国出願第１６／２８１，７０３号からのその優先権を主張する。

【0002】

本開示は、一般に、グラフィックス処理チップおよび機械学習に関する。

【背景技術】

【0003】

「コンピュータグラフィックス」は、グラフィックスハードウェアおよびソフトウェアを使用して作成された（静止画像とビデオとを含む）コンピュータ生成された画像データを指す。コンピュータグラフィックス、特に、高解像度および／または高いフレームレートをもつコンピュータグラフィックスは、生成するために計算量的にコストがかかる。たとえば、４０９６×２１６０の解像度をもつ単一の画像を生成することは、ほぼ９００万ピクセルの色が決定される必要があることを意味する。６０フレーム毎秒（ｆｐｓ）でビデオを生成するために、毎秒必要とされるピクセルの数は、５億３０００万に急速に近づく。厳しい時間フレーム内でそのような膨大な量の色データをレンダリングするために必要とされる計算電力（ｃｏｍｐｕｔａｔｉｏｎａｌｐｏｗｅｒ）の量は、しばしば、コンピュータグラフィックスアプリケーションにとってボトルネックになる。たとえば、リアルタイムレンダリングのタイミング要求を満たすために、コンピュータグラフィックスアプリケーションは、しばしば、シーンの解像度および／または複雑さを犠牲にする必要があり、それにより、理想に満たない結果が生じる。

【0004】

コンピュータグラフィックスの高い計算要求に対処するために、専用ハードウェアが開発されている。グラフィックス処理ユニット（「ＧＰＵ」）は、グラフィックス処理のために最適化された専用コンピューティングハードウェアである。汎用中央処理ユニット（「ＣＰＵ」）と比較して、ＧＰＵは、高度並列動作を実施するように設計された、より多くの実行ユニットおよびトランジスタを有する。さらに、ＧＰＵは、グラフィックスレンダリングパイプラインにおいて共通である特定の動作を実施するための特別に設計されたハードウェア構成要素を含む。たとえば、ＧＰＵは、概して、ジオメトリ処理、ラスタ化、およびシェーディングを実施するためのハードウェア構成要素を有し得る。パイプライン中のいくつかの段が、物理ベース（ｐｈｙｓｉｃａｌｌｙ－ｂａｓｅｄ）レンダリング技法を使用するように設計され、これは、計算コストが高く、うまくスケーリングしない。したがって、所望の画像が複雑なシーンのものであり、および／または所望の画像解像度が高い場合、計算費用が法外になり得る。したがって、現在のＧＰＵ設計は、グラフィックスをレンダリングするための多大な処理電力（ｐｒｏｃｅｓｓｉｎｇｐｏｗｅｒ）を提供しているが、それらの性能は、引き続き、グラフィックスアプリケーションにとってボトルネックである。

【発明の概要】

【0005】

本明細書で説明される特定の実施形態は、グラフィックスレンダリングパイプライン中の１つまたは複数のフェーズを機械学習ベースであるようにサポートするように設計されたグラフィックス処理チップに関係する。たとえば、グラフィックス処理チップは、シェーディング動作を、そのようなタスクを実施するようにトレーニングされた機械学習モデルに従って実施するように構成されたプログラマブルデジタル信号プロセッサ（ＤＳＰ）のアレイを含み得る。たとえば、機械学習モデルは、入力としてフラグメントに関連する属性（たとえば、位置、法線、反射率、ライティングなど）をとり、フラグメントについての色を出力するようにトレーニングされ得る。そのような機械学習ベース手法によって実施される動作は、計算コストが高い物理ベースシェーディングを実施するために設計されたストリーミングプロセッサまたは固定機能モジュールをもつ旧来のＧＰＵによって実施される動作よりもはるかに速い。さらに、本明細書で説明されるグラフィックス処理チップは、グラフィックスレンダリングが、旧来のＧＰＵよりもはるかにスケーラブルであることを可能にし、これは、厳しい時間制約（たとえば、リアルタイムレンダリング）をもつコンピュータグラフィックスアプリケーションが、はるかに複雑なおよび／または詳細なシーンを設計することを可能にする。

【0006】

本発明の実施形態は、限定はしないが、モバイルデバイス、デスクトップ、サーバ、グラフィックスシステム、および人工現実システムを含む、任意のタイプのコンピューティングシステムを含むかまたは任意のタイプのコンピューティングシステムとともに実装され得る。人工現実は、ユーザへの提示の前に何らかの様式で調整された形式の現実であり、これは、たとえば、仮想現実（ＶＲ）、拡張現実（ＡＲ）、複合現実（ＭＲ）、ハイブリッド現実、あるいはそれらの何らかの組合せおよび／または派生物を含み得る。人工現実コンテンツは、完全に生成されたコンテンツ、またはキャプチャされたコンテンツ（たとえば、現実世界の写真）と組み合わせられた生成されたコンテンツを含み得る。人工現実コンテンツは、ビデオ、オーディオ、触覚フィードバック、またはそれらの何らかの組合せを含み得、それらのいずれも、（観察者に３次元効果をもたらすステレオビデオなどの）単一のチャネルまたは複数のチャネルにおいて提示され得る。さらに、いくつかの実施形態では、人工現実は、たとえば、人工現実におけるコンテンツを作成するために使用される、および／または人工現実において使用される（たとえば、人工現実におけるアクティビティを実施する）アプリケーション、製品、アクセサリ、サービス、またはそれらの何らかの組合せに関連し得る。人工現実コンテンツを提供する人工現実システムは、ホストコンピュータシステムに接続されたヘッドマウントディスプレイ（ＨＭＤ）、スタンドアロンＨＭＤ、モバイルデバイスまたはコンピューティングシステム、あるいは、１人または複数の観察者に人工現実コンテンツを提供することが可能な任意の他のハードウェアプラットフォームを含む、様々なプラットフォーム上に実装され得る。

【0007】

本明細書で開示される実施形態は例にすぎず、本開示の範囲はそれらに限定されない。特定の実施形態は、上記で開示された実施形態の構成要素、要素、特徴、機能、動作、またはステップのすべてを含むか、いくつかを含むか、またはいずれをも含まないことがある。本発明による実施形態は、特に、グラフィックス処理チップ、方法、記憶媒体、システム、およびコンピュータプログラム製品を対象とする添付の特許請求の範囲で開示され、１つの請求項カテゴリー、たとえば、グラフィックス処理チップにおいて述べられた任意の特徴は、別の請求項カテゴリー、たとえば、システム、記憶媒体、コンピュータプログラム製品、および方法においても請求され得る。添付の特許請求の範囲における従属関係または参照は、形式的理由で選定されるにすぎない。ただし、前の請求項への意図的な参照（特に複数の従属関係）から生じる主題も請求され得、その結果、請求項とその特徴との任意の組合せが、開示され、添付の特許請求の範囲で選定された従属関係にかかわらず請求され得る。請求され得る主題は、添付の特許請求の範囲に記載の特徴の組合せだけでなく、特許請求の範囲における特徴の任意の他の組合せをも含み、特許請求の範囲において述べられた各特徴は、特許請求の範囲における任意の他の特徴または他の特徴の組合せと組み合わせられ得る。さらに、本明細書で説明または示される実施形態および特徴のいずれかは、別個の請求項において、ならびに／あるいは、本明細書で説明もしくは示される任意の実施形態もしくは特徴との、または添付の特許請求の範囲の特徴のいずれかとの任意の組合せで請求され得る。

【0008】

本発明によれば、グラフィックス処理チップが、
グラフィックスレンダリングパイプラインに従ってグラフィックス処理チップの動作を管理するように構成されたコントローラであって、動作が、ジオメトリ処理動作と、ラスタ化動作と、シェーディング動作とを含む、コントローラと、
シェーディング動作の少なくとも一部分を実施するように構成された機械学習モデルを記憶するように構成された（または記憶する）少なくとも１つのプログラマブルメモリ構成要素と、
機械学習モデルに従ってシェーディング動作を実施するために選択的に使用されるように構成された複数の処理ユニットと、
シェーディング動作を使用して生成された画像データを記憶するように構成された少なくとも１つの出力メモリと
を備える。

【0009】

機械学習モデルは、プログラマブルメモリ構成要素に記憶され得、観察データと、ライティングデータと、色データと、材料特性データとに基づいて出力を生成するように構成され得、
出力メモリに記憶された画像データは、機械学習モデルの出力を使用して生成され得る。

【0010】

機械学習モデルの出力は、強度データを含み得、
画像データは、色データと強度データとに基づいて生成され得る。

【0011】

機械学習モデルは、第２の強度データに基づいて出力を生成するように構成され得る。

【0012】

少なくとも１つのプログラマブルメモリ構成要素は、観察データと、ライティングデータと、色データと、材料特性データとのうちの１つまたは複数に基づいて第２の出力を生成するように構成された第２の機械学習モデルを記憶するように構成され得、
第２の強度データは、第２の出力と、観察データと、ライティングデータとを使用して生成され得る。

【0013】

第２の強度データは、照明モデルに従って生成され得る。

【0014】

第２の機械学習モデルの第２の出力は、第２の強度データを生成するために照明モデルによって使用される鏡面データを含み得る。

【0015】

機械学習モデルと第２の機械学習モデルとは、複数のトレーニングサンプルを使用してエンドツーエンドでトレーニングされ得る。

【0016】

機械学習モデルは、複数のトレーニングサンプルを使用してトレーニングされ得る。

【0017】

複数のトレーニングサンプルの各々が、仮想表面に関連する材料特性データと、フラグメントに関連するターゲット色データとに関連し得る。

【0018】

ターゲット色データは、後処理効果をもつターゲット画像に関連し得る。

【0019】

機械学習モデルはニューラルネットワークを備え得る。

【0020】

複数の処理ユニットはデジタル信号プロセッサであり得る。

【0021】

グラフィックス処理チップは、
レンダリング命令がそこを通って受信される、オフチップ回路と通信するためのインターフェース
をさらに備え得る。

【0022】

観察データと、ライティングデータと、色データと、材料特性データとは、１つまたは複数のフラグメントに関連し得る。

【0023】

１つまたは複数のフラグメントは、ジオメトリ処理動作およびラスタ化動作を使用して生成され得る。

【0024】

色データと材料特性データとは、１つまたは複数のフラグメントを通して可視であると決定された１つまたは複数の仮想表面に関連し得る。

【0025】

複数の処理ユニットは、ジオメトリ処理動作またはラスタ化動作を実施するために選択的に使用されるように構成され得る。

【0026】

グラフィックス処理チップは、
ジオメトリ処理動作またはラスタ化動作を実施するように構成された１つまたは複数の固定機能プロセッサ
をさらに備え得る。

【0027】

コントローラは、ジオメトリ処理動作がラスタ化動作より前に実施されることを引き起こすように構成され得る。

【0028】

コントローラは、シェーディング動作が、ジオメトリ処理動作およびラスタ化動作の後に実施されることを引き起こすように構成され得る。

【0029】

１つまたは複数のコンピュータ可読非一時的記憶媒体は、実行されたとき、本発明によるシステムまたは上述の実施形態のいずれかにおいて実施するように動作可能であるソフトウェアを具現し得る。

【0030】

コンピュータ実装方法は、本発明によるシステムまたは上述の実施形態のいずれかを使用し得る。

【0031】

好ましくはコンピュータ可読非一時的記憶媒体を備えるコンピュータプログラム製品は、本発明によるシステムまたは上述の実施形態のいずれかにおいて使用され得る。

【図面の簡単な説明】

【0032】

【図1】特定の実施形態による、ＭＬグラフィックス処理チップの一例を示す図である。

【図2】特定の実施形態による、ＭＬグラフィックス処理チップのための例示的な機械学習シェーディングアーキテクチャを示す図である。

【図3】特定の実施形態による、ＭＬグラフィックス処理チップのための機械学習シェーディングアーキテクチャ３００の別の実施形態を示す図である。

【図4】特定の実施形態による、ＭＬグラフィックス処理チップのための別の例示的な機械学習シェーディングアーキテクチャを示す図である。

【図5A-5B】特定の実施形態において使用され得るニューラルネットワークアーキテクチャの例を示す図である。

【図6A】参照画像と、本明細書で説明される実施形態を使用して生成された予測された画像との間の比較を提供する図である。

【図6B】参照画像と、本明細書で説明される実施形態を使用して生成された予測された画像との間の比較を提供する図である。

【図7】特定の実施形態による、グラフィックス処理チップの例示的な処理フローを示す図である。

【図8】例示的なコンピュータシステムを示す図である。

【発明を実施するための形態】

【0033】

ＧＰＵは、３Ｄグラフィックスをレンダリングするための専用プロセッサである。旧来のＧＰＵは、シーンの描写から画像を合成するために、グラフィックスレンダリングパイプラインに従って一連の動作を実施するように設計される。概念的に、グラフィックスレンダリングパイプラインは、入力として３Ｄモデルをとり、３Ｄモデルは、通常、ワイヤメッシュの三角形または他のタイプのジオメトリによって定義される。グラフィックスレンダリングパイプラインの一例は、高レベルにおいて、ジオメトリ処理、ラスタ化、シェーディング、および後処理を含み得る。ジオメトリ処理フェーズ中に、コンピュータグラフィックスオブジェクト（たとえば、ティーポット、テーブルなど）の（たとえば、頂点およびエッジの３Ｄ座標を使用して定義された）３Ｄモデル定義が、モデル座標系から共通座標系に変換され得る。３Ｄモデル変換の出力は、頂点のストリームであり得る。次いで、各頂点のライティング特性が、ライティング状態およびカメラ位置に基づいて計算され得る。次いで、頂点は、色付き三角形にアセンブルされ得る。このフェーズの出力は、三角形のストリームであり得る。可視でない三角形が、ｚバッファテストに基づいて廃棄され（または、クリッピングされ）得る。

【0034】

グラフィックスレンダリングパイプラインのジオメトリ処理フェーズの後に、得られた三角形がラスタ化され得る。ラスタ化は、三角形の各々を１つまたは複数のフラグメントによって表されるラスタフォーマットに変換するプロセスである（たとえば、視覚的に、フラグメントは、三角形を集合的に近似する正方形であり得る）。フラグメントは、候補ピクセル値を表し得る（各ピクセルが複数のフラグメントに対応し得る）。ラスタ化フェーズの出力は、フラグメントのストリームである。

【0035】

グラフィックスレンダリングパイプライン中の次のフェーズはシェーディングであり得、シェーディングは、可視である各フラグメントの適切な色を決定するプロセスを指す。旧来のＧＰＵは、物理ベースシェーディングを実施するように設計される。たとえば、各フラグメントのための適切な色値を計算するために、シェーディングプロセスは、光の物理的挙動および特性を考慮するシェーディングアルゴリズム（たとえば、グーローシェーディングまたはフォンシェーディング）および／または照明モデルを使用するように構成され得る。概念的に、たとえば、物理ベースシェーダは、仮想３Ｄ表面とともに、その位置および配向、材料特性、および／またはテクスチャに基づいて、物理学に従って、光線がどのように挙動するのかを計算することによって、光線がどのように反射し、屈折させ、および／または回折してサブ光線になり得るかを考慮し得る。このプロセスは、計算コストが高く、シーン複雑さとうまくスケーリングしない（たとえば、シーン中のより多くの光源および／またはオブジェクトを考慮するために、より多くの計算が必要とされる）。その結果、ＧＰＵの既存のシェーディングプロセスは、グラフィックスアプリケーションについて実際的ボトルネックを課する。

【0036】

ピクセル色がシェーディングフェーズによって決定された後に、限定はしないが、ブレンディング、ぼかし、アンチエイリアシングなどを含む、所望の効果を作成するために、任意の所望の後処理が実施され得る。一例として、ぼかしが望まれるとき、レンダリングシステムは、シェーディングプロセスからビットアキュレート画像結果をとり、次いで、ぼかした画像を生成するために近くのピクセルを平均化し得る。したがって、ぼかした画像を生成するために、システムは、（１）最初に、ビットアキュレート画像を生成し、（２）結果をぼかす。所望の出力（この場合、ぼかした画像）を直接生成しないことが、非効率性をもたらし得る。

【0037】

旧来のＧＰＵは、グラフィックスレンダリングパイプラインの様々な動作を実施するために最適化された特別に設計されたハードウェアを装備する。たとえば、いくつかのＧＰＵが、各々、ジオメトリ処理、ラスタ化、またはシェーディングを加速することに専用である固定機能処理ユニットを有し得る。追加または代替として、ＧＰＵは、パイプラインの異なる段を実施するというタスクを選択的に与えられ得る、浮動小数点計算の速いおよび効率的な並列実行を提供するように設計されたストリームプロセッサのアレイを有し得る。たとえば、ＧＰＵの物理レイアウトが、主にストリームプロセッサによって占有され得、ストリームプロセッサは、頂点処理、ジオメトリ処理、およびピクセル／フラグメント処理など、動作を実施するというタスクを選択的に与えられ得る。しかしながら、速度および効率は、フレキシビリティを犠牲にして成り立つ。たとえば、ストリームプロセッサは、高レベルの並列性およびデータ局所性を必要とするアプリケーションに好適であるが、それらのアプリケーションは、論理的または分岐集約的動作を実施することについて効率的でない。

【0038】

ストリームプロセッサおよび固定機能ハードウェアは、シェーディング動作を実施するために極めて最適化されているが、そのような動作は、それにもかかわらず計算コストが高く（たとえば、物理ベースシミュレーション）、リアルタイム性能を限定する。旧来のＧＰＵの様々な限界と、グラフィックをレンダリングするためのより速い、より電力効率的なやり方の必要とに対処するために、本明細書で説明される特定の実施形態は、機械学習ベースである段をもつグラフィックスレンダリングパイプラインをサポートするように構成された機械学習アクセラレーションハードウェアをもつ新しい機械学習（ＭＬ）グラフィックス処理チップを導入する。特定の実施形態では、グラフィックス処理チップによって実装される機械学習パイプラインは、物理ベースシェーディングではなく、シェーディングを実施するための機械学習技法を使用し得る。ＧＰＵ上で、グラフィックスレンダリングパイプラインの異なる段が、一般に、異なる電力消費特性を有することが観測される。上述のように、シェーディング処理段は、一般にボトルネックである。たとえば、一般的な画像をレンダリングするために、おおよそ、使用される電力および時間の１０％がジオメトリ処理のためのものであり得、５０％がシェーディングのためのものであり得、４０％が局所シェーディングおよび後処理のためのものであり得る。後処理動作が実施されない場合、シェーディングのために費やされる電力および時間の総割合が、さらに、ジオメトリ処理のために使用される電力および時間を少なくする（たとえば、シェーディングが電力消費の８０％を担う）ことになる。したがって、物理ベース計算に依拠するのではなく、シェーディング動作を実施するための機械学習技法を使用することによって、ＭＬグラフィックス処理チップは、著しく少ない電力および時間で画像をレンダリングすることができる。ＭＬベースシェーダを使用することの追加の利益は、そのことが、設計者に、厳しいランタイム需要を満たすためにレンダリング品質を犠牲にするためのフレキシビリティを与えることである。たとえば、高いフレームレートを必要とするがビットアキュレート結果を必要としないアプリケーションでは、ＭＬグラフィックス処理チップは、より速い結果を出力するためにより小さいニューラルネットワークを使用し得る。レンダリング品質がビットアキュレートでないことがあるが、そのレンダリング品質は、準最適な品質が知覚可能でないことがある（たとえば、シーンが高速で移動していることがあるか、またはピクセルがいずれにせよユーザの周辺視野中にあり得る）ので、依然として、その特定のアプリケーションにとって十分に良好であり得る。このオプションは、旧来のＧＰＵ上では、シェーダがビットアキュレート結果のみを出力するように構成されるので、利用可能でない。

【0039】

図１は、特定の実施形態による、ＭＬグラフィックス処理チップ１００の一例を示す。ＭＬグラフィックス処理チップ１００は、レンダリング命令およびデータがそこを通って受信される、オフチップ回路（たとえば、中央処理ユニットまたはメモリモジュール）と通信するための入出力インターフェース１１０を有し得る。論理をスケジュールすること、計算リソースを割り当てること、スレッド管理などを実施するためのコントローラ１２０もあり得る。ＭＬグラフィックス処理チップ１００は、ラスタ化、データアセンブリ、ｚカリング（ｚ－ｃｕｌｌｉｎｇ）など、高度並列タスクを実施するための固定機能プロセッサ１２５をも有し得る。チップ１００は、シェーディング動作を実施するようにトレーニングされた機械学習モデルを含む、プログラマブル命令を記憶するための１つまたは複数のメモリバンク１２８をも有し得る。さらに、ＭＬグラフィックス処理チップ１００は、出力画像が表示のために書き込まれる、キャッシュ１４０（たとえば、Ｌ１またはＬ２キャッシュ）とフレームバッファ１５０とを有し得る。

【0040】

特定の実施形態では、ＭＬグラフィックス処理チップ１００は、ＭＬ動作を加速するように構成されたデジタル信号プロセッサ（ＤＳＰ）１３０の大きいアレイを有し得る。ＧＰＵによって使用されるストリームプロセッサとは異なり、ＤＳＰは、機械学習モデルおよびデータ構成の変動する設計に適応することができる、よりフレキシブルなプロセッサである。たとえば、ＤＳＰ１３０は、深層ニューラルネットワークおよび畳み込み層のための共通動作であるベクトルおよび／または行列演算を加速するように構成され得る。ＤＳＰ１３０はまた、いくつかの機械学習モデル（たとえば、リカレントニューラルネットワーク）によって必要とされ得る、メモリ集約的な動作を扱うのにより好適である。したがって、ＤＳＰ１３０は、ＭＬグラフィックス処理チップ１００の、オンチップでの必要とされる機械学習動作を実施する効率および能力を改善し、レイテンシおよび非効率性をもたらすことがある、ＣＰＵとの動作の義務を分けることを行う必要をなくすかまたは最小限に抑えるのを助ける。

【0041】

特定の実施形態では、ＭＬグラフィックス処理チップ１００は、機械学習モデルを使用して、グラフィックスレンダリングパイプラインの全シェーディング段を実施するように構成され得る。機械学習ベース手法は、シェーディングに対する物理ベース手法に勝るいくつかの利点を有する。上記で説明されたように、旧来の物理ベースシェーディングパイプラインは、光の物理的特性を模倣するために複雑な計算を実施する必要があるので、計算コストが高い。その結果、物理ベースシェーディングは、シーンの複雑さと不十分にスケーリングする（たとえば、多くのオブジェクトおよび／または光源を有するシーンが、割り振られた時間内にレンダリングするために、そのシーンを過度に複雑にし得る）。対照的に、機械学習ベースシェーディングパイプラインは、通常ならば物理ベースパイプラインにおいて必要とされるであろう光の横断および他の計算コストが高い算出を計算する必要なしに、いくつかの入力（たとえば、ライティング、材料特性、光線入射など）がどのように色に相関するかを学習するために、機械学習を使用する。さらに、全フレームがレンダリングされた後に後処理効果が適用される（たとえば、クリーンで、シャープな画像がレンダリングされた後に、その画像が、エイリアシングアーティファクトを補正するために後続の後処理ステップにおいて変えられる）旧来のパイプラインとは異なり、機械学習ベースシェーディングプロセスは、所望の後処理効果（たとえば、アンチエイリアシング、被写界深度、ぼかしなど）をもつフレームを直接レンダリングし得る。機械学習ベースシェーディングプロセスはまた、複数のピクセルの色が１つのパスにおいて決定されることを可能にすることによって、さらなる最適化を与える。特定の実施形態では、機械学習モデルを通る各パスが、単一のピクセルについての色値を出力し得る。しかしながら、他の実施形態では、機械学習モデルは、機械学習モデルの１つのパスにおいて複数のピクセルの色値を処理するように構成され得る（たとえば、１つのパスの出力は、タイルと呼ばれることもある、２×２、３×３、またはｎ×ｍブロックのピクセルについての色値であり得る）。さらに、機械学習ベースシェーディングプロセスは、シーン複雑さに対してはるかにスケーラブルであり、これは、グラフィックスアプリケーションの設計者が、グラフィックスレンダリングの実用性によってあまり妨害されないことを可能にする。本明細書で説明される実施形態によって与えられる計算効率のこれらの例は、低減された電力消費（これは、限られた電源および重みおよびサイズ限界をもつモバイルデバイスにとって特に重要である）およびレンダリング時間につながる。

【0042】

図２は、特定の実施形態による、ＭＬグラフィックス処理チップのための例示的な機械学習シェーディングアーキテクチャ２００を示す。機械学習アーキテクチャ２００は、シェーディングのタスクを実施するように構成されたニューラルネットワーク２４０（または他の好適な機械学習モデル）を含み得る。シェーディングニューラルネットワーク２４０は、（１つまたは複数の）フラグメントに関連するデータを処理し、その（１つまたは複数の）フラグメントについての対応する出力２５０（たとえば、フラグメントについての色値）を生成するように構成され得る。各フラグメントが、フラグメントを通して可視である仮想空間における表面（たとえば、仮想りんごの表面）に関連し得、その表面に関連するパラメータが、シェーディングニューラルネットワーク２４０のための入力として使用され得る。たとえば、ネットワーク２４０は、入力として、表面に対するカメラ／観察者の観察方向など、環境データ２１０をとり得る。環境データ２１０は、表面に対する周囲光源をも含み得る（たとえば、表面に対する光源の相対ロケーションが、ベクトルを使用して表され得る）。特定の実施形態では、表面の色２２０もシェーディングニューラルネットワーク２４０に入力され得る。たとえば、表面がりんごの表面である場合、その停止サイン（ｓｔｏｐｓｉｇｎ）の知られている色は、赤のシェードであり得る（たとえば、赤色値、緑色値、および青色値で表される）。表面色２２０に加えて、（たとえば、表面法線によって表される）表面配向および材料特性を表すパラメータなど、表面に関連する他のパラメータ２３０も、ネットワーク２４０に入力され得る。材料特性の例は、金属特性についての測度、粗さ、鏡面反射率（ｓｐｅｃｕｌａｒｒｅｆｌｅｃｔａｎｃｅ）、クリアコート、クリアコート粗さ、屈折率、および材料特性の任意の他の好適な測度を含み得る。材料特性は、物理ベースである（たとえば、材料特性が、木材またはガラスなど、オブジェクトの実際の物理的材料特性に対応するように定義される）か、または任意の所望の様式で定義され得る（たとえば、仮想オブジェクトの材料特性が、現実または物理学によって制約されない任意の所望の材料特性を有し得る）。

【0043】

特定の実施形態では、シェーディングニューラルネットワーク２４０は、２５０において、フラグメントについて、ＲＧＢ（赤色、緑色、および青色）およびアルファ（透過性）で表された色を直接出力することを学習し得る。ネットワーク２４０がそこから学習するトレーニングデータは、各々、（１つまたは複数の）フラグメントのパラメータ（たとえば、観察方向、光源、材料特性など）と、その（１つまたは複数の）フラグメントについての対応する知られているターゲット色値（すなわち、グランドトゥルース）とを含む、十分に多数のトレーニングサンプルを含み得る。たとえば、フォトリアリスティック結果が望まれる場合、グランドトゥルースは、フォトリアリスティック画像の色値であろう。この例では、グランドトゥルース色は、フォトリアリスティック画像のものであるが、グランドトゥルース色は、そのように限定されず、任意の所望の色であり得る。たとえば、グランドトゥルースは、コンピュータ生成されたまたはレンダリングされた画像、特定の効果（たとえば、ぼかしまたは平滑化効果）が適用された画像、いくつかの画像補正（たとえば、ホワイトバランシング、色補正、アンチエイリアシングなど）を受けた画像、または任意の他の所望のターゲット画像であり得る。ネットワーク２４０が（１つまたは複数の）フラグメントについての推論された色結果を出力するたびに、ネットワーク２４０は、損失関数を使用して、結果をその（１つまたは複数の）フラグメントの知られている色と比較し、それに応じてニューラルネットワーク２４０を更新するためにバックプロパゲーションを使用し得る。十分に多数のそのようなトレーニング反復の後に（たとえば、損失関数がしきい値誤差レートを下回った後に、またはしきい値数のトレーニング反復の後に）、トレーニングが終了し得る。

【0044】

特定の実施形態では、シェーディングニューラルネットワーク２４０は、入力データから（１つまたは複数の）所与のフラグメントについての適切な色を推論し、２５０において結果を出力するようにトレーニングされ得る。シェーディングニューラルネットワーク２４０がトレーニングされると、シェーディングニューラルネットワーク２４０は、動作中、ＭＬグラフィックス処理チップ１００の１つまたは複数のプログラマブルＤＳＰ１３０によって実行され得る。たとえば、ＭＬグラフィックス処理チップ１００がジオメトリ処理およびラスタ化を実施した後に、そこから生成されたフラグメントは、それらの色を決定するために、シェーディングニューラルネットワーク２４０に入力され得る。特定の実施形態では、単一のフラグメントまたはフラグメントのタイルが、シェーディングニューラルネットワーク２４０を使用して一緒に処理され得る。たとえば、シェーディングニューラルネットワーク２４０は、入力として（１つまたは複数の）フラグメントに関連するパラメータ（たとえば、観察方向、光源、表面色、材料データなど）をとり、その（１つまたは複数の）フラグメントについての色を生成するために使用され得る適切な出力を推論し得る。

【0045】

シェーディングニューラルネットワーク２４０は、２５０においてＲＧＢ（赤色、緑色、および青色）およびアルファ（透過性）で表された色値を直接出力することを学習し得るが、いくつかの機械学習モデルでは、フラグメント色を直接出力するために必要とされるであろう乗法的動作（ｍｕｌｔｉｐｌｉｃａｔｉｖｅｏｐｅｒａｔｉｏｎ）を学習することが困難であり得る。したがって、他の実施形態では、シェーディングニューラルネットワークは、代わりに、フラグメント色を計算するために使用され得る色重みおよび強度を決定することを学習し得る。図３は、特定の実施形態による、ＭＬグラフィックス処理チップのための機械学習シェーディングアーキテクチャ３００の別の実施形態を示す。機械学習シェーディングアーキテクチャ３００は、入力として、図２に示されているものと同様の、観察およびライティング方向３１０、表面色３２０、および他の材料特性３３０など、（１つまたは複数の）フラグメントに関連する様々なパラメータをとるように構成されたシェーディングニューラルネットワーク３４０を含み得る。しかしながら、フラグメントについての最終ＲＧＢデータを直接出力する代わりに、シェーディングネットワーク３４０は、色重みおよび強度を出力するように構成され得る（たとえば、重みおよび強度値が、ＲＧＢ色チャネルの各々について生成され得る）。ネットワーク３４０によって出力された色重みおよび強度は、次いで、色計算モジュール３７０を使用して、（たとえば、表面色３６０の各色チャネルを、その色チャネルについての対応する推論された重みおよび／または強度とともに適用または乗算することによって）フラグメントに関連する表面色３６０と組み合わせられ得る。色計算モジュール３７０は、次いで、３５０において、フラグメントについてのＲＧＢ色を出力し得る。

【0046】

特定の実施形態では、シェーディングニューラルネットワーク３４０は、入力データから所与の（１つまたは複数の）フラグメントについての適切な色重みおよび強度を推論するようにトレーニングされ得る。ネットワーク３４０がそこから学習するトレーニングデータは、各々、（１つまたは複数の）フラグメントのパラメータ（たとえば、観察方向、光源、材料特性など）と、その（１つまたは複数の）フラグメントについての対応する知られているターゲット色値（すなわち、グランドトゥルース）とを含む、十分に多数のトレーニングサンプル（たとえば、数千、数百万、数十億など）を含み得る。前に説明されたように、グランドトゥルースまたはターゲット色は、フォトリアリスティック画像、レンダリングされた画像、後処理効果をもつ画像などであり得る。ネットワーク３４０が、推論された色重みおよび／または強度を出力するたびに、色計算モジュール３７０は、それらの結果を表面色３６０と組み合わせて、フラグメント色３５０を生成し得る。ネットワーク３４０は、損失関数を使用して、生成されたフラグメント色を（１つまたは複数の）フラグメントの知られている色と比較し、それに応じてニューラルネットワーク３４０を更新するためにバックプロパゲーションを使用し得る。十分に多数のそのようなトレーニング反復の後に（たとえば、損失関数がしきい値誤差レートを下回った後に、またはしきい値数のトレーニング反復の後に）、トレーニングが終了し得る。トレーニングされると、ＭＬグラフィックス処理チップは、トレーニングされたシェーディングニューラルネットワーク３４０を使用して、色重み／強度を生成し、出力を使用して、アーキテクチャ３００に従って（１つまたは複数の）フラグメントについての適切な色を計算し得る。

【0047】

図４は、特定の実施形態による、ＭＬグラフィックス処理チップのための別の例示的な機械学習シェーディングアーキテクチャ４００を示す。この実施形態では、アーキテクチャ４００は、可視表面の光沢を表す鏡面項（ｓｐｅｃｕｌａｒｔｅｒｍ）をさらに考慮するために機械学習を使用するように設計される。特定の実施形態では、アーキテクチャ４００は、入力として、環境データ４１０（たとえば、観察方向および光源方向）、表面色４１１、および他のパラメータ４１２（たとえば、表面の材料特性）など、フラグメントのデータをとり、鏡面表現ｓを予測するように構成された、鏡面指数（ｓｐｅｃｕｌａｒ－ｅｘｐｏｎｅｎｔ）ネットワーク４２０を含み得る。鏡面表現は、次いで、局所表面が周辺光、拡散光、および鏡面光を反射するやり方を記述する、ブリン－フォン照明モデルなど、照明モデル４３０において使用され得る。たとえば、モデルは、次のように定義され得る。
ｆ＝ｍａｘ（Ｎ・Ｈ，０）^ｓ
ここで、
ｆは、光強度を表し（色チャネルごとであり得る）、
Ｎは、表面の法線ベクトルを表し、
Ｈは、半角ベクトルを表し、
ｓは、鏡面指数を表す。
半角ベクトルＨは、次のように定義される。

ここで、
ｖは、観察者／カメラのほうを向く表面上の関心ポイントからの方向を表し、
Ｌは、各光源のほうを向く表面上の関心ポイントからの方向を表す。
関心フラグメントに関連する入力データ４１０～４１２に基づいて、鏡面指数ネットワーク４２０は、鏡面指数値ｓを予測し得る。次いで、シェーディングアーキテクチャ４００は、照明モデル４３０を使用して、予測された鏡面指数ｓおよび観察方向および光方向ベクトル４４０に基づいて、フラグメントについての光強度（たとえば、これは、各色チャネルについてのものであり得る）を計算し得る。

【0048】

シェーディングアーキテクチャ４００は、色重みおよび強度を予測するために、シェーディングニューラルネットワーク４６０への入力パラメータの一部として照明モデル４３０の出力を使用し得る。シェーディングニューラルネットワーク４６０は、双方向反射率分布関数（ＢＲＤＦ：ＢｉｄｉｒｅｃｔｉｏｎａｌＲｅｆｌｅｃｔａｎｃｅＤｉｓｔｒｉｂｕｔｉｏｎＦｕｎｃｔｉｏｎ）を表す、照明モデル４３０の出力を提供されるので、シェーディングニューラルネットワーク４６０は、著しくより滑らかな結果を作り出すために、ＢＲＤＦからの偏差を学習する必要があるにすぎないであろう。図３に示されているネットワーク３４０と同様のシェーディングニューラルネットワーク４６０は、入力として、環境データ４５０（たとえば、観察方向および光源方向）、表面色４５１、および他のパラメータ４５２（たとえば、表面の材料特性）など、フラグメントデータをとり得る。これらのパラメータデータ４５０～４５２は、鏡面指数ネットワーク４２０に入力されたパラメータデータ４１０～４１２と同じであるか、またはそれらとは異なり得る。フラグメントパラメータデータ４５０～４５２と照明モデル４３０からの出力とに基づいて、シェーディングニューラルネットワーク４６０は、関心フラグメントについての色重みおよび／または強度を予測し得る。図３を参照しながら説明されたことと同様に、色計算モジュール４７０が、予測された色重み／強度を表面色４８０と組み合わせて、フラグメント色４９０を生成し得る。

【0049】

特定の実施形態では、鏡面指数ネットワーク４２０とシェーディングニューラルネットワーク４６０とが、エンドツーエンド様式でトレーニングされ得る。たとえば、ネットワーク４２０および４６０がそこから学習するトレーニングデータは、各々、（１つまたは複数の）フラグメントのパラメータ（たとえば、観察方向、光源、材料特性など）と、その（１つまたは複数の）フラグメントについての対応する知られている色値（すなわち、グランドトゥルース）とを含む、十分に多数のトレーニングサンプル（たとえば、数千、数百万、数十億など）を含み得る。前に説明されたように、グランドトゥルースまたはターゲット色は、フォトリアリスティック画像、レンダリングされた画像、後処理効果をもつ画像などであり得る。フラグメントパラメータを使用して、ネットワーク４２０および４６０は、上記で説明されたプロセスを使用して、４９０において、推論されたフラグメント色を出力し得る。ネットワーク４２０および４６０は、損失関数を使用して、生成されたフラグメント色をフラグメントの知られている色と比較し、それに応じてネットワーク４２０および４６０を更新するためにバックプロパゲーションを使用し得る。十分に多数のそのようなトレーニング反復の後に（たとえば、損失関数がしきい値誤差レートを下回った後に、またはしきい値数のトレーニング反復の後に）、トレーニングが終了し得る。トレーニングされると、ＭＬグラフィックス処理チップは、トレーニングされた鏡面指数ネットワーク４２０およびシェーディングニューラルネットワーク４６０を使用して、色重み／強度を生成し、出力を使用して、アーキテクチャ４００に従って（１つまたは複数の）フラグメントについての適切な色を計算し得る。

【0050】

特定の実施形態では、本明細書で説明されるニューラルネットワーク（たとえば、シェーディングニューラルネットワークおよび／または鏡面指数ネットワーク）は、いくつかの層を有し得る。図５Ａおよび図５Ｂは、特定の実施形態において使用され得るニューラルネットワークアーキテクチャの例を示す。図５Ａは、例示的なニューラルネットワークアーキテクチャ５００を示す。このアーキテクチャ５００を有するニューラルネットワークは、上述のフラグメントデータ（たとえば、観察方向、光方向、材料特性など）など、入力５１０を受信し得る。ネットワークは、全結合層５２０を使用して入力データを処理し得る。全結合層５２０の出力は、アクティブ化ブロック５３０によって処理され得る。次いで、アクティブ化ブロック５３０の出力は、１つまたは複数のＲｅｓｎｅｔブロック５４０によって処理され得る。次いで、最後のＲｅｓｎｅｔブロック５４０の出力は、全結合層５５０によって処理され得、全結合層５５０は、推論されたまたは予測された結果（たとえば、色重み／強度または鏡面指数）を出力する。図５Ｂは、各Ｒｅｓｎｅｔブロック５４０の一実施形態を示す。各Ｒｅｓｎｅｔブロック５４０が、全結合層５６０と、後続のアクティブ化層５７０と、後続の別の全結合層５８０とを使用して、各Ｒｅｓｎｅｔブロック５４０の入力を処理し得る。次いで、最後の全結合層５８０の出力は、５９０において、スキップ接続５９９を通してＲｅｓｎｅｔブロック５４０の入力と加算され得る。次いで、加算ブロック５９０の出力は、別のアクティブ化層５９５によって処理され得、別のアクティブ化層５９５は、結果を、図５Ａに示されている次のＲｅｓｎｅｔブロック５４０または全結合層５５０に出力し得る。Ｒｅｓｎｅｔブロックは、深く積層されたより小さい層を可能にし、これは、ネットワークの内側の冗長性を助ける。これらの図は、特定のネットワークアーキテクチャを示すが、本開示は、任意の他の好適なネットワークアーキテクチャをも企図する。

【0051】

図６Ａおよび図６Ｂは、参照画像と、本明細書で説明される実施形態を使用して生成された予測された画像との間の比較を提供する。特に、図６Ａは、旧来のＧＰＵパイプラインを使用して生成されたシーンの参照画像６００の一例を示す。一方、図６Ｂは、本明細書で説明される実施形態を使用してレンダリングされた同じシーンの予測された画像６０１を示す。これらの例からわかるように、機械学習ベースのグラフィックスパイプラインを使用した予測された画像６０１は、旧来のＧＰＵのグラフィックスパイプラインを使用して生成されたフォトリアリスティック画像６００と知覚的に同様である。これらの例は、本明細書の他の場所で説明されるように、ＭＬグラフィックス処理チップを使用することの様々な利益が、画像品質の著しい低減という犠牲を払わないことを証明する。

【0052】

図７は、特定の実施形態による、グラフィックス処理チップの例示的な処理フローを示す。ステップ７１０において、グラフィックス処理チップは、レンダリング命令を受信し得る。命令は、中央処理ユニット、メモリモジュールなど、１つまたは複数のオフチップ回路に結合されたインターフェースを通して受信され得る。レンダリング命令は、たとえば、レンダリングされるべきシーンの３Ｄモデル、光源、および観察者／カメラの観察方向を含み得る。応答して、グラフィックス処理チップは、コントローラを通して、ハードウェアおよび／またはファームウェアにおいて実装されたグラフィックスレンダリングパイプラインに従って、実施されるべき動作をスケジュールし得る。

【0053】

ステップ７２０において、グラフィックス処理チップは、たとえば、３Ｄモデルを別の座標系に変換すること、三角形をアセンブルすることを含む、ジオメトリ処理動作を実施すること、可視性テストを実施することなどを行い得る。特定の実施形態では、ジオメトリ処理動作は、デジタル信号プロセッサに割り当てられた固定機能プロセッサ、またはその２つの組合せによって実施され得る。特定の実施形態では、ジオメトリ処理動作は、シーンの可視部を表すために使用される一連の三角形を出力し得る。三角形（またはその頂点）の各々が、色および他の材料特性など、表面特性に関連し得る。

【0054】

ステップ７３０において、グラフィックス処理チップは、たとえば、各三角形がそこを通って可視であるフラグメントを決定することを含む、ラスタ化動作を実施し得る。特定の実施形態では、ジオメトリ処理動作は、デジタル信号プロセッサに割り当てられた固定機能プロセッサ、またはその２つの組合せによって実施され得る。

【0055】

ステップ７４０において、グラフィックス処理チップは、たとえば、１つまたは複数のフラグメントについての適切な色を決定するために、１つまたは複数の機械学習モデルを使用してそれらのフラグメント（たとえば、単一のフラグメントまたはフラグメントのタイル）を処理することを含む、シェーディング動作を実施し得る。特定の実施形態では、チップのコントローラは、オンチップデジタル信号プロセッサを使用して実施されるべきシェーディング動作をスケジュールし得る。動作は、前に説明されたように、トレーニングされた機械学習モデルに従って行われ得る。たとえば、フラグメントの色を決定するために、ＤＳＰは、トレーニングされたニューラルネットワークに従って、そのフラグメントに関連するデータ（たとえば、観察データ、ライティングデータ、可視表面の色データ、および／または可視表面に関連する材料特性データ）を処理し得る。モデルの出力は、フラグメントについての画像データを計算するために表面色データとともに使用され得る、強度データであり得る。特定の実施形態では、ニューラルネットワークは、入力として、第２のニューラルネットワーク（たとえば、鏡面指数ネットワーク）および照明モデルを使用して生成された強度データをさらにとり得る。たとえば、鏡面指数ネットワークは、鏡面データ（たとえば、鏡面指数）を生成するために、観察データ、ライティングデータ、可視表面の色データ、および／または可視表面に関連する材料特性データのうちの１つまたは複数を処理するように構成され得る。次いで、鏡面データは、照明モデルに従って、強度データを算出するために使用され得る。次いで、この強度データは、関心フラグメントに関連するデータとともに、シェーディングニューラルネットワークに入力され得る。次いで、シェーディングニューラルネットワークは、最終強度データに対応し得る出力を生成し得る。次いで、最終強度データは、フラグメントについての適切な画像データを生成するために、表面の色に適用され得る。

【0056】

ステップ７５０において、生成された画像データは、グラフィックス処理チップによって出力され得る。たとえば、生成された画像データは、それらがオフチップ回路によって読み取られ得るように、オンチップキャッシュおよび／またはフレームバッファ中に蓄積され得る。たとえば、フレームバッファ中の画像データは、ＣＰＵによって読み取られ、クラウドベース配信のためにサーバに送信されるか、または表示のためにディスプレイユニット（たとえば、モニタ、仮想現実ヘッドセット、拡張現実ヘッドセットなど）にフォワーディングされ得る。

【0057】

図８は、グラフィックス処理チップが設置され得る例示的なコンピュータシステム８００を示す。特定の実施形態では、１つまたは複数のコンピュータシステム８００は、本明細書で説明または示される１つまたは複数の方法の１つまたは複数のステップを実施する。特定の実施形態では、１つまたは複数のコンピュータシステム８００は、本明細書で説明または示される機能性を提供する。特定の実施形態では、１つまたは複数のコンピュータシステム８００上で稼働しているソフトウェアは、本明細書で説明または示される１つまたは複数の方法の１つまたは複数のステップを実施するか、あるいは本明細書で説明または示される機能性を提供する。特定の実施形態は、１つまたは複数のコンピュータシステム８００の１つまたは複数の部分を含む。本明細書では、コンピュータシステムへの言及は、適切な場合、コンピューティングデバイスを包含し得、その逆も同様である。その上、コンピュータシステムへの言及は、適切な場合、１つまたは複数のコンピュータシステムを包含し得る。

【0058】

本開示は、任意の好適な数のコンピュータシステム８００を企図する。本開示は、任意の好適な物理的形態をとるコンピュータシステム８００を企図する。限定としてではなく例として、コンピュータシステム８００は、組込み型コンピュータシステム、システムオンチップ（ＳＯＣ）、（たとえば、コンピュータオンモジュール（ＣＯＭ）またはシステムオンモジュール（ＳＯＭ）などの）シングルボードコンピュータシステム（ＳＢＣ）、デスクトップコンピュータシステム、ラップトップまたはノートブックコンピュータシステム、対話型キオスク、メインフレーム、コンピュータシステムのメッシュ、携帯電話、携帯情報端末（ＰＤＡ）、サーバ、タブレットコンピュータシステム、拡張／仮想現実デバイス、あるいはこれらのうちの２つまたはそれ以上の組合せであり得る。適切な場合、コンピュータシステム８００は、１つまたは複数のコンピュータシステム８００を含むか、単一または分散型であるか、複数のロケーションにわたるか、複数のマシンにわたるか、複数のデータセンターにわたるか、あるいは１つまたは複数のネットワーク中の１つまたは複数のクラウド構成要素を含み得るクラウド中に常駐し得る。適切な場合、１つまたは複数のコンピュータシステム８００は、実質的な空間的または時間的制限なしに、本明細書で説明または示される１つまたは複数の方法の１つまたは複数のステップを実施し得る。限定としてではなく一例として、１つまたは複数のコンピュータシステム８００は、リアルタイムまたはバッチモードで、本明細書で説明または示される１つまたは複数の方法の１つまたは複数のステップを実施し得る。１つまたは複数のコンピュータシステム８００は、適切な場合、異なる時間においてまたは異なるロケーションにおいて、本明細書で説明または示される１つまたは複数の方法の１つまたは複数のステップを実施し得る。

【0059】

特定の実施形態では、コンピュータシステム８００は、プロセッサ８０２と、メモリ８０４と、ストレージ８０６と、入出力（Ｉ／Ｏ）インターフェース８０８と、通信インターフェース８１０と、バス８１２とを含む。本開示は、特定の配置において特定の数の特定の構成要素を有する特定のコンピュータシステムを説明し、示すが、本開示は、任意の好適な配置において任意の好適な数の任意の好適な構成要素を有する任意の好適なコンピュータシステムを企図する。

【0060】

特定の実施形態では、本明細書で説明されるグラフィックス処理チップを含み得る、プロセッサ８０２は、コンピュータプログラムを作り上げる命令など、命令を実行するためのハードウェアを含む。限定としてではなく一例として、命令を実行するために、プロセッサ８０２は、内部レジスタ、内部キャッシュ、メモリ８０４、またはストレージ８０６から命令を取り出し（またはフェッチし）、それらの命令を復号および実行し、次いで、内部レジスタ、内部キャッシュ、メモリ８０４、またはストレージ８０６に１つまたは複数の結果を書き込み得る。特定の実施形態では、プロセッサ８０２は、データ、命令、またはアドレスのための１つまたは複数の内部キャッシュを含み得る。本開示は、適切な場合、任意の好適な数の任意の好適な内部キャッシュを含むプロセッサ８０２を企図する。限定としてではなく一例として、プロセッサ８０２は、１つまたは複数の命令キャッシュと、１つまたは複数のデータキャッシュと、１つまたは複数のトランスレーションルックアサイドバッファ（ＴＬＢ）とを含み得る。命令キャッシュ中の命令は、メモリ８０４またはストレージ８０６中の命令のコピーであり得、命令キャッシュは、プロセッサ８０２によるそれらの命令の取出しを高速化し得る。データキャッシュ中のデータは、プロセッサ８０２において実行する命令が動作する対象のメモリ８０４またはストレージ８０６中のデータのコピー、プロセッサ８０２において実行する後続の命令によるアクセスのための、またはメモリ８０４もしくはストレージ８０６に書き込むための、プロセッサ８０２において実行された前の命令の結果、あるいは他の好適なデータであり得る。データキャッシュは、プロセッサ８０２による読取りまたは書込み動作を高速化し得る。ＴＬＢは、プロセッサ８０２のための仮想アドレストランスレーション（ｖｉｒｔｕａｌ－ａｄｄｒｅｓｓｔｒａｎｓｌａｔｉｏｎ）を高速化し得る。特定の実施形態では、プロセッサ８０２は、データ、命令、またはアドレスのための１つまたは複数の内部レジスタを含み得る。本開示は、適切な場合、任意の好適な数の任意の好適な内部レジスタを含むプロセッサ８０２を企図する。適切な場合、プロセッサ８０２は、１つまたは複数の算術論理ユニット（ＡＬＵ）を含むか、マルチコアプロセッサであるか、または１つまたは複数のプロセッサ８０２を含み得る。本開示は、特定のプロセッサを説明し、示すが、本開示は任意の好適なプロセッサを企図する。

【0061】

特定の実施形態では、メモリ８０４は、プロセッサ８０２が実行するための命令、またはプロセッサ８０２が動作する対象のデータを記憶するためのメインメモリを含む。限定としてではなく一例として、コンピュータシステム８００は、ストレージ８０６または（たとえば、別のコンピュータシステム８００などの）別のソースからメモリ８０４に命令をロードし得る。プロセッサ８０２は、次いで、メモリ８０４から内部レジスタまたは内部キャッシュに命令をロードし得る。命令を実行するために、プロセッサ８０２は、内部レジスタまたは内部キャッシュから命令を取り出し、それらの命令を復号し得る。命令の実行中またはその後に、プロセッサ８０２は、（中間結果または最終結果であり得る）１つまたは複数の結果を内部レジスタまたは内部キャッシュに書き込み得る。プロセッサ８０２は、次いで、メモリ８０４にそれらの結果のうちの１つまたは複数を書き込み得る。特定の実施形態では、プロセッサ８０２は、１つまたは複数の内部レジスタまたは内部キャッシュ中の、あるいは（ストレージ８０６または他の場所とは対照的な）メモリ８０４中の命令のみを実行し、１つまたは複数の内部レジスタまたは内部キャッシュ中の、あるいは（ストレージ８０６または他の場所とは対照的な）メモリ８０４中のデータのみに対して動作する。（アドレスバスおよびデータバスを各々含み得る）１つまたは複数のメモリバスが、プロセッサ８０２をメモリ８０４に結合し得る。バス８１２は、以下で説明されるように、１つまたは複数のメモリバスを含み得る。特定の実施形態では、１つまたは複数のメモリ管理ユニット（ＭＭＵ）が、プロセッサ８０２とメモリ８０４との間に常駐し、プロセッサ８０２によって要求されるメモリ８０４へのアクセスを容易にする。特定の実施形態では、メモリ８０４は、ランダムアクセスメモリ（ＲＡＭ）を含む。このＲＡＭは、適切な場合、揮発性メモリであり得る。適切な場合、このＲＡＭは、ダイナミックＲＡＭ（ＤＲＡＭ）またはスタティックＲＡＭ（ＳＲＡＭ）であり得る。その上、適切な場合、このＲＡＭは、シングルポートまたはマルチポートＲＡＭであり得る。本開示は任意の好適なＲＡＭを企図する。メモリ８０４は、適切な場合、１つまたは複数のメモリ８０４を含み得る。本開示は、特定のメモリを説明し、示すが、本開示は任意の好適なメモリを企図する。

【0062】

特定の実施形態では、ストレージ８０６は、データまたは命令のための大容量ストレージを含む。限定としてではなく一例として、ストレージ８０６は、ハードディスクドライブ（ＨＤＤ）、フロッピーディスクドライブ、フラッシュメモリ、光ディスク、光磁気ディスク、磁気テープ、またはユニバーサルシリアルバス（ＵＳＢ）ドライブ、あるいはこれらのうちの２つまたはそれ以上の組合せを含み得る。ストレージ８０６は、適切な場合、リムーバブルまたは非リムーバブル（または固定）媒体を含み得る。ストレージ８０６は、適切な場合、コンピュータシステム８００の内部または外部にあり得る。特定の実施形態では、ストレージ８０６は、不揮発性ソリッドステートメモリである。特定の実施形態では、ストレージ８０６は、読取り専用メモリ（ＲＯＭ）を含む。適切な場合、このＲＯＭは、マスクプログラムＲＯＭ、プログラマブルＲＯＭ（ＰＲＯＭ）、消去可能ＰＲＯＭ（ＥＰＲＯＭ）、電気的消去可能ＰＲＯＭ（ＥＥＰＲＯＭ）、電気的書き換え可能ＲＯＭ（ＥＡＲＯＭ）、またはフラッシュメモリ、あるいはこれらのうちの２つまたはそれ以上の組合せであり得る。本開示は、任意の好適な物理的形態をとる大容量ストレージ８０６を企図する。ストレージ８０６は、適切な場合、プロセッサ８０２とストレージ８０６との間の通信を容易にする１つまたは複数のストレージ制御ユニットを含み得る。適切な場合、ストレージ８０６は、１つまたは複数のストレージ８０６を含み得る。本開示は、特定のストレージを説明し、示すが、本開示は任意の好適なストレージを企図する。

【0063】

特定の実施形態では、Ｉ／Ｏインターフェース８０８は、コンピュータシステム８００と１つまたは複数のＩ／Ｏデバイスとの間の通信のための１つまたは複数のインターフェースを提供する、ハードウェア、ソフトウェア、またはその両方を含む。コンピュータシステム８００は、適切な場合、これらのＩ／Ｏデバイスのうちの１つまたは複数を含み得る。これらのＩ／Ｏデバイスのうちの１つまたは複数は、人とコンピュータシステム８００との間の通信を可能にし得る。限定としてではなく一例として、Ｉ／Ｏデバイスは、キーボード、キーパッド、マイクロフォン、モニタ、マウス、プリンタ、スキャナ、スピーカー、スチールカメラ、スタイラス、タブレット、タッチスクリーン、トラックボール、ビデオカメラ、別の好適なＩ／Ｏデバイス、またはこれらのうちの２つまたはそれ以上の組合せを含み得る。Ｉ／Ｏデバイスは１つまたは複数のセンサーを含み得る。本開示は、任意の好適なＩ／Ｏデバイスと、それらのＩ／Ｏデバイスのための任意の好適なＩ／Ｏインターフェース８０８とを企図する。適切な場合、Ｉ／Ｏインターフェース８０８は、プロセッサ８０２がこれらのＩ／Ｏデバイスのうちの１つまたは複数を駆動することを可能にする１つまたは複数のデバイスまたはソフトウェアドライバを含み得る。Ｉ／Ｏインターフェース８０８は、適切な場合、１つまたは複数のＩ／Ｏインターフェース８０８を含み得る。本開示は、特定のＩ／Ｏインターフェースを説明し、示すが、本開示は任意の好適なＩ／Ｏインターフェースを企図する。

【0064】

特定の実施形態では、通信インターフェース８１０は、コンピュータシステム８００と、１つまたは複数の他のコンピュータシステム８００または１つまたは複数のネットワークとの間の（たとえば、パケットベース通信などの）通信のための１つまたは複数のインターフェースを提供する、ハードウェア、ソフトウェア、またはその両方を含む。限定としてではなく一例として、通信インターフェース８１０は、イーサネットまたは他のワイヤベースネットワークと通信するためのネットワークインターフェースコントローラ（ＮＩＣ）またはネットワークアダプタ、あるいはＷＩ－ＦＩネットワークなどのワイヤレスネットワークと通信するためのワイヤレスＮＩＣ（ＷＮＩＣ）またはワイヤレスアダプタを含み得る。本開示は、任意の好適なネットワークと、そのネットワークのための任意の好適な通信インターフェース８１０とを企図する。限定としてではなく一例として、コンピュータシステム８００は、アドホックネットワーク、パーソナルエリアネットワーク（ＰＡＮ）、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）、メトロポリタンエリアネットワーク（ＭＡＮ）、またはインターネットの１つまたは複数の部分、あるいはこれらのうちの２つまたはそれ以上の組合せと通信し得る。これらのネットワークのうちの１つまたは複数の１つまたは複数の部分は、ワイヤードまたはワイヤレスであり得る。一例として、コンピュータシステム８００は、（たとえば、ＢＬＵＥＴＯＯＴＨＷＰＡＮなどの）ワイヤレスＰＡＮ（ＷＰＡＮ）、ＷＩ－ＦＩネットワーク、ＷＩ－ＭＡＸネットワーク、（たとえば、モバイル通信用グローバルシステム（ＧＳＭ）ネットワークなどの）セルラー電話ネットワーク、または他の好適なワイヤレスネットワーク、あるいはこれらのうちの２つまたはそれ以上の組合せと通信し得る。コンピュータシステム８００は、適切な場合、これらのネットワークのいずれかのための任意の好適な通信インターフェース８１０を含み得る。通信インターフェース８１０は、適切な場合、１つまたは複数の通信インターフェース８１０を含み得る。本開示は、特定の通信インターフェースを説明し、示すが、本開示は任意の好適な通信インターフェースを企図する。

【0065】

特定の実施形態では、バス８１２は、コンピュータシステム８００の構成要素を互いに結合する、ハードウェア、ソフトウェア、またはその両方を含む。限定としてではなく一例として、バス８１２は、アクセラレーテッドグラフィックスポート（ＡＧＰ）または他のグラフィックスバス、拡張業界標準アーキテクチャ（ＥＩＳＡ）バス、フロントサイドバス（ＦＳＢ）、ＨＹＰＥＲＴＲＡＮＳＰＯＲＴ（ＨＴ）相互接続、業界標準アーキテクチャ（ＩＳＡ）バス、ＩＮＦＩＮＩＢＡＮＤ相互接続、ローピンカウント（ＬＰＣ）バス、メモリバス、マイクロチャネルアーキテクチャ（ＭＣＡ）バス、周辺構成要素相互接続（ＰＣＩ）バス、ＰＣＩ－Ｅｘｐｒｅｓｓ（ＰＣＩｅ）バス、シリアルアドバンストテクノロジーアタッチメント（ＳＡＴＡ）バス、ビデオエレクトロニクス規格協会ローカル（ＶＬＢ）バス、または別の好適なバス、あるいはこれらのうちの２つまたはそれ以上の組合せを含み得る。バス８１２は、適切な場合、１つまたは複数のバス８１２を含み得る。本開示は、特定のバスを説明し、示すが、本開示は任意の好適なバスまたは相互接続を企図する。

【0066】

本明細書では、１つまたは複数のコンピュータ可読非一時的記憶媒体は、適切な場合、（たとえば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）または特定用途向けＩＣ（ＡＳＩＣ）などの）１つまたは複数の半導体ベースまたは他の集積回路（ＩＣ）、ハードディスクドライブ（ＨＤＤ）、ハイブリッドハードドライブ（ＨＨＤ）、光ディスク、光ディスクドライブ（ＯＤＤ）、光磁気ディスク、光磁気ドライブ、フロッピーディスケット、フロッピーディスクドライブ（ＦＤＤ）、磁気テープ、ソリッドステートドライブ（ＳＳＤ）、ＲＡＭドライブ、セキュアデジタルカードまたはドライブ、任意の他の好適なコンピュータ可読非一時的記憶媒体、あるいはこれらのうちの２つまたはそれ以上の任意の好適な組合せを含み得る。コンピュータ可読非一時的記憶媒体は、適切な場合、揮発性、不揮発性、または揮発性と不揮発性との組合せであり得る。

【0067】

本明細書では、「または」は、明確に別段に指示されていない限り、またはコンテキストによって別段に指示されていない限り、包括的であり、排他的ではない。したがって、本明細書では、「ＡまたはＢ」は、明確に別段に指示されていない限り、またはコンテキストによって別段に指示されていない限り、「Ａ、Ｂ、またはその両方」を意味する。その上、「および」は、明確に別段に指示されていない限り、またはコンテキストによって別段に指示されていない限り、共同と個別の両方である。したがって、本明細書では、「ＡおよびＢ」は、明確に別段に指示されていない限り、またはコンテキストによって別段に指示されていない限り、「共同でまたは個別に、ＡおよびＢ」を意味する。

【0068】

本開示の範囲は、当業者が理解するであろう、本明細書で説明または示される例示的な実施形態に対するすべての変更、置換、変形、改変、および修正を包含する。本開示の範囲は、本明細書で説明または示される例示的な実施形態に限定されない。その上、本開示は、本明細書のそれぞれの実施形態を、特定の構成要素、要素、特徴、機能、動作、またはステップを含むものとして説明し、示すが、これらの実施形態のいずれも、当業者が理解するであろう、本明細書のどこかに説明または示される構成要素、要素、特徴、機能、動作、またはステップのうちのいずれかの任意の組合せまたは置換を含み得る。さらに、特定の機能を実施するように適応されるか、配置されるか、実施することが可能であるか、実施するように構成されるか、実施することが可能にされるか、実施するように動作可能であるか、または実施するように動作する、装置またはシステムあるいは装置またはシステムの構成要素に対する添付の特許請求の範囲における参照は、その装置、システム、または構成要素が、そのように適応されるか、配置されるか、可能であるか、構成されるか、可能にされるか、動作可能であるか、または動作する限り、その装置、システム、構成要素またはその特定の機能が、アクティブにされるか、オンにされるか、またはロック解除されるか否かにかかわらず、その装置、システム、構成要素を包含する。さらに、本開示は、特定の実施形態を、特定の利点を提供するものとして説明するかまたは示すが、特定の実施形態は、これらの利点のいずれをも提供しないか、いくつかを提供するか、またはすべてを提供し得る。

【図1】