特開2023-179645 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ フラウンホッファー−ゲゼルシャフト　ツァ　フェルダールング　デァ　アンゲヴァンテン　フォアシュンク　エー．ファオの特許一覧

特開2023-179645ニューラルネットワークの表現形式

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7a
7b
7c
7d
8
9
10
11
12
13
14a
14b
15
16
17
18
19
20
21
22
23
24a
24b
25

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023179645

(43)【公開日】2023-12-19

(54)【発明の名称】ニューラルネットワークの表現形式

(51)【国際特許分類】

H04N 19/463 20140101AFI20231212BHJP

【ＦＩ】

H04N19/463

【審査請求】有

【請求項の数】16

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2023175417

(22)【出願日】2023-10-10

(62)【分割の表示】P 2022520429の分割

【原出願日】2020-09-30

(31)【優先権主張番号】19200928.0

(32)【優先日】2019-10-01

(33)【優先権主張国・地域又は機関】EP

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＴＥＮＳＯＲＦＬＯＷ

２．Ｂｌｕ－ｒａｙ

(71)【出願人】

【識別番号】591037214

【氏名又は名称】フラウンホッファー－ゲゼルシャフトツァフェルダールングデァアンゲヴァンテンフォアシュンクエー．ファオ

(74)【代理人】

【識別番号】100079577

【弁理士】

【氏名又は名称】岡田全啓

(72)【発明者】

【氏名】マトラッジシュテファン

(72)【発明者】

【氏名】ハーセポール

(72)【発明者】

【氏名】キルヒホッファーハイナー

(72)【発明者】

【氏名】ミューラーカルステン

(72)【発明者】

【氏名】ザメクボイチェヒ

(72)【発明者】

【氏名】ヴィーデマンズィーモン

(72)【発明者】

【氏名】マルペデトレフ

(72)【発明者】

【氏名】シーアルトーマス

(72)【発明者】

【氏名】サンチェスデラフエンテヤーゴ

(72)【発明者】

【氏名】スクーピンローベルト

(72)【発明者】

【氏名】ウィーガントトーマス

(57)【要約】（修正有）

【課題】ニューラルネットワークの効率的な利用及び／又はニューラルネットワークの効率的な送信及び／又は更新のための概念を提供する。
【解決手段】ニューラルネットワークの表現が符号化されたデータストリーム（４５）であって、ニューラルネットワークのニューロン相互接続を定義するニューラルネットワークパラメータがデータストリーム（４５）に符号化される符号化順序（１０４）を示す直列化パラメータ（１０２）を含むデータストリーム（４５）を生成する。
【選択図】図４

【特許請求の範囲】

【請求項1】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記ニューラルネットワーク（１０）のニューロン相互接続（２２、２４）を定義するニューラルネットワークパラメータ（３２）が前記データストリーム（４５）に符号化される符号化順序（１０４）を示す直列化パラメータ（１０２）を含む、データストリーム（４５）。

【請求項2】

前記ニューラルネットワークパラメータ（３２）は、文脈適応型算術符号化（６００）を用いて前記データストリーム（４５）に符号化される、請求項１に記載のデータストリーム（４５）。

【請求項3】

前記データストリーム（４５）は、１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分（２００）は、前記ニューラルネットワーク（１０）の対応するニューラルネットワーク層（２１０、３０）を表現し、前記直列化パラメータ（１０２）は、所定のニューラルネットワーク層（２１０、３０）内の前記ニューラルネットワークのニューロン相互接続（２２、２４）を定義する、ニューラルネットワークパラメータが前記データストリーム（４５）に符号化される前記符号化順序（１０４）を示す、請求項１又は２に記載のデータストリーム（４５）。

【請求項4】

前記直列化パラメータ（１０２）は、ｎ個の符号化順序（１０４）のセット（１０８）のうち前記符号化順序（１０４）を示すｎ－ａｒｙパラメータである、請求項１乃至３のいずれかに記載のデータストリーム（４５）。

【請求項5】

前記ｎ個の符号化順序（１０４）のセット（１０８）は、
前記所定の符号化順序が、前記ニューラルネットワーク（１０）の所定のニューラルネットワーク層（２１０、３０）を記述するテンソル（３０）の次元（３４）を走査（トラバース）する順序が異なる第１の所定の符号化順序（１０６₁）、及び／又は、
前記ニューラルネットワークのスケーラブルな符号化のために、前記所定の符号化順序が前記ニューラルネットワークの所定のニューラルネットワーク層（２１０、３０）を走査する回数（１０７）が異なる第２の所定の符号化順序（１０６₂）、及び／又は、
前記所定の符号化順序が前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）を走査する順序が異なる第３の所定の符号化順序（１０６₃）、及び／又は
、
前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）のニューロン（１４、１８、２０）が走査される順序が異なる第４の所定の符号化順序（１０６₄）
を含む、請求項４に記載のデータストリーム（４５）。

【請求項6】

前記直列化パラメータ（１０２）は、前記符号化順序（１０４）がニューラルネットワーク層（２１０、３０）のニューロン（１４、１８、２０）をデフォルト順序に対して順列化するのに用いる順列を示す、請求項１乃至５のいずれかに記載のデータストリーム（４５）。

【請求項7】

前記順列は、前記ニューラルネットワークパラメータ（３２）が前記符号化順序（１０４）に沿って単調に増加するか、または前記符号化順序（１０４）に沿って単調に減少するように、前記ニューラルネットワーク層（２１０、３０）の前記ニューロン（１４、１８、２０）を順序付ける、請求項６に記載のデータストリーム（４５）。

【請求項8】

前記順列は、前記直列化パラメータ（１０２）によって信号化可能な所定の符号化順序
のうち、前記直列化パラメータ（１０２）が示す前記順列について、前記ニューラルネットワークパラメータ（３２）を前記データストリーム（４５）に符号化するためのビットレートが最小となるように、前記ニューラルネットワーク層（２１０、３０）の前記ニューロン（１４、１８、２０）を順序付ける、請求項６に記載のデータストリーム（４５）。

【請求項9】

前記ニューラルネットワークパラメータ（３２）は、重みおよびバイアスを含む、請求項１乃至８のいずれかに記載のデータストリーム（４５）。

【請求項10】

前記データストリーム（４５）は、個別にアクセス可能なサブ部分（４３、４４、２４０）に構造化され、それぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワーク（１０）の対応するニューラルネットワーク部分を表現しており、それぞれのサブ部分（４３、４４、２４０）が、後続のサブ部分が前記符号化順序（１０４）によって走査される前に前記符号化順序（１０４）によって完全に走査される、請求項１乃至９のいずれかに記載のデータストリーム（４５）。

【請求項11】

前記ニューラルネットワークパラメータ（３２）は、任意の個別にアクセス可能な部分（２００）またはサブ部分（４３、４４、２４０）の始点において、文脈適応型算術符号化（６００）を用いて、及び、文脈初期化を用いて、前記データストリーム（４５）に符号化される、請求項３乃至１０のいずれかに記載のデータストリーム（４５）。

【請求項12】

前記データストリーム（４５）が、それぞれの個別にアクセス可能な部分（２００）又はサブ部分（４３、４４、２４０）が始まる開始コード（２４２）、及び／又は、それぞれの個別にアクセス可能な部分またはサブ部分の始まりを指すポインタ（２２０、２４４）、及び／又は、前記データストリーム（４５）を解析する際に前記それぞれの個別にアクセス可能な部分またはサブ部分をスキップするためにそれぞれの個別にアクセス可能な部分又はサブ部分のデータストリーム長（２４６）のポインタを含む、請求項３乃至１１のいずれかに記載のデータストリーム（４５）。

【請求項13】

前記ニューラルネットワーク（１０）を推論に使用するときに、前記ニューラルネットワークパラメータ（３２）を表現する数値表現およびビットサイズを示す数値計算表現パラメータ（１２０）をさらに含む、請求項１乃至１２のいずれかに記載のデータストリーム（４５）。

【請求項14】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記データストリーム（４５）は、前記ニューラルネットワーク（１０）を推論に用いるときに、前記データストリームに符号化されている前記ニューラルネットワークのニューラルネットワークパラメータ（３２）を表現する数値表現及びビットサイズを示す数値計算表現パラメータ（１２０）を含む、データストリーム（４５）。

【請求項15】

データストリーム（４５）は、個別にアクセス可能なサブ部分（４３、４４、２４０）に構造化され、後続の個別にアクセス可能なサブ部分が前記符号化順序（１０４）によって走査される前に、それぞれの個別にアクセス可能なサブ部分が前記符号化順序（１０４）によって完全に走査されるように、それぞれの個別にアクセス可能なサブ部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記データストリーム（４５）は、所定の個別にアクセス可能なサブ部分について、前記所定の個別にアクセス可能なサブ部分に符号化された前記ニューラルネットワークパラメータ（３２）のパラメータタイプを示すタイプパラメータを含む、請求項１乃至１４のいずれかに記載のデータストリーム（４５）。

【請求項16】

前記タイプパラメータは、少なくとも、ニューラルネットワークの重みとニューラルネットワークのバイアスとを区別する、請求項１５に記載のデータストリーム（４５）。

【請求項17】

前記データストリーム（４５）は、１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現し、前記データストリーム（４５）は、所定のニューラルネットワーク層について、前記ニューラルネットワークの前記所定のニューラルネットワーク層のニューラルネットワーク層タイプを示すニューラルネットワーク層タイプパラメータ（１３０）をさらに含む、請求項１乃至１６のいずれかに記載のデータストリーム（４５）。

【請求項18】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記データストリーム（４５）は、１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現しており、前記データストリーム（４５）はさらに、所定のニューラルネットワーク層について、前記ニューラルネットワークの前記所定のニューラルネットワーク層のニューラルネットワーク層タイプを示すニューラルネットワーク層タイプパラメータ（１３０）を含む、データストリーム（４５）。

【請求項19】

前記ニューラルネットワーク層タイプパラメータ（１３０）は、少なくとも、完全連結層タイプと畳み込み層タイプとを区別する、請求項１７又は１８に記載のデータストリーム（４５）。

【請求項20】

前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記データストリーム（４５）は、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、それぞれの個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）を含む、請求項１乃至１９のいずれかに記載のデータストリーム（４５）。

【請求項21】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記データストリーム（４５）は、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、前記それぞれの所定の個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）を含む、データストリーム（４５）。

【請求項22】

それぞれの個別にアクセス可能な部分は、
前記ニューラルネットワークの対応するニューラルネットワーク層（２１０）、又は、
前記ニューラルネットワークのニューラルネットワーク層（２１０）のニューラルネットワーク部分（４３、４４、２４０）を表現する、請求項２０又は２１に記載のデータストリーム（４５）。

【請求項23】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記データストリーム（４５）は１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現しており、前記データストリーム（４５）は、所定の部分内で、個別にアクセス可能なサブ部分（４３、４４、２４０）にさらに構造化され、それぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワークの前記それぞれのニューラルネットワーク層（２１０、３０）の対応するニューラルネットワーク部分を表現し、前記データストリーム（４５）は、１つ以上の所定の個別にアクセス可能なサブ部分（４３、４４、２４０）のそれぞれについて、
前記それぞれの所定の個別にアクセス可能なサブ部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの所定の個別にアクセス可能なサブ部分の始まりを指し示すポインタ（２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの所定の個別にアクセス可能なサブ部分をスキップするための、前記それぞれの所定の個別にアクセス可能なサブ部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを含む、請求項１乃至２２のいずれかに記載のデータストリーム（４５）。

【請求項24】

前記データストリーム（４５）は、それぞれの個別にアクセス可能な部分およびそれぞれの個別にアクセス可能なサブ部分の始点において、文脈適応型算術符号化（６００）を用いて、かつ、文脈初期化を用いて、前記ニューラルネットワークの前記表現が符号化されている、請求項２３に記載のデータストリーム（４５）。

【請求項25】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記データストリーム（４５）は、１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現しており、前記データストリーム（４５）は、所定の部分内で、個別にアクセス可能なサブ部分（４３、４４、２４０）にさらに構造化され、それぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワークの前記それぞれのニューラルネットワーク層（２１０、３０）の対応するニューラルネットワーク部分を表現し、前記データストリーム（４５）は、１つ以上の所定の個別にアクセス可能なサブ部分（４３、４４、２４０）のそれぞれについて、
前記それぞれの所定の個別にアクセス可能なサブ部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの所定の個別にアクセス可能なサブ部分の始まりを指し示すポインタ（２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの所定の個別にアクセス可能なサブ部分をスキップするために、前記それぞれの所定の個別にアクセス可能なサブ部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを含む、データストリーム（４５）。

【請求項26】

前記データストリーム（４５）は、それぞれの個別にアクセス可能な部分およびそれぞれの個別にアクセス可能なサブ部分の始点において、文脈適応型算術符号化（６００）を用いて、かつ、文脈初期化を用いて、前記ニューラルネットワークの表現が符号化されている、請求項２５記載のデータストリーム（４５）。

【請求項27】

前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記データストリーム（４５）は、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、前記ニューラルネットワーク
（１０）を推論に使用する際に使用しなければならない、または任意に使用できる１つ以上の処理オプション（２５２）を示す処理オプションパラメータ（２５０）を含む、請求項の１乃至２６のいずれかに記載のデータストリーム（４５）。

【請求項28】

前記処理オプションパラメータ（２５０）は、所定の処理オプション（２５２）のセットのうち、前記１つ以上の利用可能な処理オプション（２５２）を示し、
前記所定の処理オプション（２５２）は、
前記それぞれの所定の個別にアクセス可能な部分の並列処理能力、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のサンプル単位並列処理能力（２５２₂）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のチャネル単位並列処理能力（２５２₁）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分の分類カテゴリ単位並列処理能力、及び／又は、
同じ前記ニューラルネットワーク部分に関連するが、前記データストリーム（４５）に層方式で符号化されている前記ニューラルネットワークのバージョン（３３０）の別のバージョンに属する前記データストリーム（４５）の別の個別にアクセス可能な部分から得られる計算結果に対する、前記それぞれの所定の個別にアクセス可能な部分によって表現される前記ニューラルネットワーク部分の依存性を含む、請求項２７に記載のデータストリーム（４５）。

【請求項29】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記データストリーム（４５）は、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、前記ニューラルネットワーク（１０）を推論に使用する際に使用しなければならないか又は任意で使用できる１つ以上の処理オプション（２５２）を示す処理オプションパラメータ（２５０）を含む、データストリーム（４５）。

【請求項30】

前記処理オプションパラメータ（２５０）は、所定の処理オプション（２５２）のセットのうち、前記１つ以上の利用可能な処理オプション（２５２）を示し、
前記所定の処理オプション（２５２）は、
前記それぞれの所定の個別にアクセス可能な部分の並列処理能力、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のサンプル単位並列処理能力（２５２₂）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のチャネル単位並列処理能力（２５２₁）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分の分類カテゴリ単位並列処理能力、及び／又は、
同じ前記ニューラルネットワーク部分に関連するが、前記データストリーム（４５）に層方式で符号化されている前記ニューラルネットワークのバージョン（３３０）の別のバージョンに属する前記データストリーム（４５）の別の個別にアクセス可能な部分から得られる計算結果に対する、前記それぞれの所定の個別にアクセス可能な部分によって表現される前記ニューラルネットワーク部分の依存性を含む、請求項２９に記載のデータストリーム（４５）。

【請求項31】

ニューラルネットワークを表現するニューラルネットワークパラメータ（３２）が符号化され、
前記ニューラルネットワークパラメータ（３２）は、量子化インデックス（３２’’）に量子化（２６０）されて前記データストリーム（４５）に符号化され、
前記ニューラルネットワークの異なるニューラルネットワーク部分内のニューラルネットワークパラメータ（３２）が異なって量子化（２６０）されるように、前記ニューラルネットワークパラメータ（３２）が前記データストリーム（４５）に符号化され、前記データストリーム（４５）は、前記ニューラルネットワーク部分のそれぞれについて、前記それぞれのニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化するための再構成ルール（２７０）を示す、
請求項１乃至３０のいずれかに記載のデータストリーム（４５）。

【請求項32】

ニューラルネットワークを表現するニューラルネットワークパラメータ（３２）がその中に符号化されているデータストリーム（４５）であって、
前記ニューラルネットワークパラメータ（３２）は、量子化インデックス（３２’’）に量子化（２６０）されて前記データストリーム（４５）に符号化され、
前記ニューラルネットワークの異なるニューラルネットワーク部分におけるニューラルネットワークパラメータ（３２）が異なってで量子化（２６０）されるように、前記ニューラルネットワークパラメータ（３２）が前記データストリーム（４５）に符号化され、前記データストリーム（４５）は、前記ニューラルネットワーク部分のそれぞれについて、前記それぞれのニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化するための再構成ルール（２７０）を示す、データストリーム（４５）。

【請求項33】

前記ニューラルネットワーク部分が、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）及び／又は前記ニューラルネットワークの所定のニューラルネットワーク層（２１０、３０）が細分化された層部分を含む、請求項３１又は３２に記載のデータストリーム（４５）。

【請求項34】

前記データストリーム（４５）が、第２のニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化するための第２の再構成ルール（２７０₂、２７０ａ₂）に対してデルタ符号化されて符号化された第１のニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化するための第１の再構成ルール（２７０₁、２７０ａ₁）を有する、請求項３１乃至３３のいずれかに記載のデータストリーム（４５）。

【請求項35】

前記データストリーム（４５）は、前記第１の再構成ルール（２７０₁、２７０ａ₁）を示すための第１の指数値と、前記第２の再構成ルール（２７０₂、２７０ａ₂）を示すための第２の指数値と、を含み、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、所定の基底の指数によって定義される第１の量子化ステップサイズと、前記第１の指数値によって定義される第１の指数とによって定義され、かつ、
第２の再構成ルール（２７０₂、２７０ａ₂）は、前記所定の基底の指数によって定義される第２の量子化ステップサイズと、前記第１および第２の指数値の和で定義される第２の指数とによって定義される、請求項３４に記載のデータストリーム（４５）。

【請求項36】

前記データストリーム（４５）は、さらに前記所定の基底を示す、請求項３５記載のデータストリーム（４５）。

【請求項37】

前記データストリーム（４５）は、第１のニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化するための第１の再構成ルール（２７０₁、２７０ａ₁）を示すための第１の指数値と、第２のニューラルネットワーク部分に関
連するニューラルネットワークパラメータ（３２）を逆量子化するための第２の再構成ルール（２７０₂、２７０ａ₂）を示すための第２の指数値とを含み、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、所定の基底の指数によって定義される第１の量子化ステップサイズと、前記第１の指数値と所定の指数値との和によって定義される第１の指数とによって定義され、かつ、
前記第２の再構成ルール（２７０₂、２７０ａ₂）は、前記所定の基底の指数によって定義される第２の量子化ステップサイズと、前記第２の指数値と前記所定の指数値との和によって定義される第２の指数とによって定義される、請求項３１乃至３４のいずれかに記載のデータストリーム（４５）。

【請求項38】

前記データストリーム（４５）は、さらに前記所定の基底を示す、請求項３７に記載のデータストリーム（４５）。

【請求項39】

前記データストリーム（４５）は、ニューラルネットワーク範囲で前記所定の基底を示す、請求項３８に記載のデータストリーム（４５）。

【請求項40】

前記データストリーム（４５）は、さらに前記所定の指数値を示す、請求項３７乃至３９のいずれかに記載のデータストリーム（４５）。

【請求項41】

前記データストリーム（４５）は、ニューラルネットワーク層（２１０、３０）範囲で前記所定の指数値を示す、請求項４０に記載のデータストリーム（４５）。

【請求項42】

前記データストリーム（４５）は、前記所定の基底をさらに示し、前記データストリーム（４５）は、前記所定の基底が前記データストリーム（４５）によって示される範囲よりも細かい範囲で前記所定の指数値を示す、請求項４０又は４１に記載のデータストリーム（４５）。

【請求項43】

前記データストリーム（４５）は、前記所定の基底が非整数形式で符号化され、前記第１及び第２の指数値が整数形式で符号化されている、請求項３５乃至４２のいずれかに記載のデータストリーム（４５）。

【請求項44】

前記データストリーム（４５）は、前記第１の再構成ルール（２７０₁、２７０ａ₁）を示すための第１の量子化インデックス－再構成レベルマッピング（２６５）を定義する第１のパラメータセット（２６４）と、前記第２の再構成ルール（２７０₂、２７０ａ₂）を示すための第２の量子化インデックス－再構成レベルマッピング（２６５）を定義する第２のパラメータセット（２６４）と、を含み、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、前記第１の量子化インデックス－再構成レベルマッピング（２６５）によって定義され、かつ、
前記第２の再構成ルール（２７０₂、２７０ａ₂）は、前記第１の量子化インデックス－再構成レベルマッピング（２６５）を前記第２の量子化インデックス－再構成レベルマッピング（２６５）により所定の方法で拡張することにより定義される、請求項３４乃至４３のいずれかに記載のデータストリーム（４５）。

【請求項45】

前記データストリーム（４５）は、前記第１の再構成ルール（２７０₁、２７０ａ₁）を示すために、第１の量子化インデックス－再構成レベルマッピング（２６５）を定義する第１のパラメータセット（２６４）を含み、前記第２の再構成ルール（２７０₂、２７０
ａ₂）を示すために、第２の量子化インデックス－再構成レベルマッピング（２６５）を
定義する第２のパラメータセット（２６４）を含み、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、所定の量子化インデックス－再構成レベルマッピング（２６５）を前記第１の量子化インデックス－再構成レベルマッピン
グ（２６５）により所定の方法で拡張することにより定義され、
前記第２の再構成ルール（２７０₂、２７０ａ₂）は、前記所定の量子化インデックス－再構成レベルマッピング（２６５）を前記第２の量子化インデックス－再構成レベルマッピング（２６５）により前記所定の方法で拡張することにより定義される、請求項３４乃至４４のいずれかに記載のデータストリーム（４５）。

【請求項46】

前記データストリーム（４５）は、さらに前記所定の量子化インデックス－再構成レベルマッピング（２６５）を示す、請求項４５に記載のデータストリーム（４５）。

【請求項47】

前記データストリーム（４５）は、ニューラルネットワーク範囲又はニューラルネットワーク層（２１０、３０）範囲で、前記所定の量子化インデックス－再構成レベルマッピング（２６５）を示す、請求項４６に記載のデータストリーム（４５）。

【請求項48】

前記所定の方法によれば、
拡張される前記量子化インデックス－再構成レベルマッピングに従った、それぞれのインデックス値（３２’’）の第１の再構成レベルへのマッピングは、拡張される前記量子化インデックス－再構成レベルマッピングを拡張する前記量子化インデックス－再構成レベルマッピングに従った、前記それぞれのインデックス値（３２’’）の第２の再構成レベルへのマッピングが存在する場合はそれによって置換される、及び／又は、
拡張される前記量子化インデックス－再構成レベルマッピングに従うとそれぞれの前記インデックス値（３２’’）をマッピングすべき再構成レベルが定義されず、また拡張される前記量子化インデックス－再構成レベルマッピングを拡張する前記量子化インデックス－再構成レベルマッピングに従うと対応する再構成レベルへマッピングされる前記任意のインデックス値（３２’’）について、前記それぞれのインデックス値（３２’’）から前記対応する再構成レベルへのマッピングが採用される、及び／又は、
拡張される前記量子化インデックス－再構成レベルマッピングを拡張する前記量子化インデックス－再構成レベルマッピングに従うとそれぞれの前記インデックス値（３２’’）をマッピングすべき再構成レベルが定義されず、また拡張される前記量子化インデックス－再構成レベルマッピングに従うと対応する再構成レベルへマッピングされる任意のインデックス値（３２’’）について、前記それぞれのインデックス値（３２’’）から前記対応する再構成レベルへのマッピングが採用される、請求項４４乃至４７のいずれかに記載のデータストリーム（４５）。

【請求項49】

前記データストリーム（４５）は、所定のニューラルネットワーク部分の前記再構成ルール（２７０）を示すために、
量子化ステップサイズ（２６３）を示す量子化ステップサイズパラメータ（２６２）と、
量子化インデックス－再構成レベルマッピング（２６５）を定義するパラメータセット（２６４）と、を含み、
前記所定のニューラルネットワーク部分の前記再構成ルール（２７０）は、
所定のインデックス間隔（２６８）内の量子化インデックス（３２’’）に対する量子化ステップサイズ（２６３）、及び
前記所定のインデックス間隔（２６８）外の量子化インデックス（３２’’）に対する量子化インデックス－再構成レベルマッピング（２６５）によって定義される、請求項３１乃至４８のいずれかに記載のデータストリーム（４５）。

【請求項50】

ニューラルネットワークを表現するニューラルネットワークパラメータ（３２）が符号化されているデータストリーム（４５）であって、
前記ニューラルネットワークパラメータ（３２）が、量子化インデックス（３２’’）に量子化（２６０）されて前記データストリーム（４５）に符号化され、
前記データストリーム（４５）は、前記ニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための再構成ルール（２７０）を示すために、
量子化ステップサイズ（２６３）を示す量子化ステップサイズパラメータ（２６２）と、
量子化インデックス－再構成レベルマッピング（２６５）を定義するパラメータセット（２６４）と、を含み、
前記所定のニューラルネットワーク部分の前記再構成ルール（２７０）は、
所定のインデックス間隔（２６８）内の量子化インデックス（３２’’）に対する量子化ステップサイズ（２６３）、及び、
前記所定のインデックス間隔（２６８）外の量子化インデックス（３２’’）に対する量子化インデックス－再構成レベルマッピング（２６５）によって定義される、データストリーム（４５）。

【請求項51】

前記所定のインデックス間隔（２６８）はゼロを含む、請求項４９又は５０に記載のデータストリーム（４５）。

【請求項52】

前記所定のインデックス間隔（２６８）は所定の大きさ閾値まで拡張し、前記所定の大きさ閾値を超える量子化インデックス（３２’’）は、前記量子化インデックス－再構成レベルマッピング（２６５）が逆量子化（２８０）に用いられることを示すエスケープコードを表現する、請求項５１に記載のデータストリーム（４５）。

【請求項53】

前記パラメータセット（２６４）が、前記所定のインデックス間隔（２６８）の外の量子化インデックス（３２’’）に関連する再構成レベルのリストによって、前記量子化インデックス－再構成レベルマッピング（２６５）を定義する、請求項４９乃至５２のいずれかに記載のデータストリーム（４５）。

【請求項54】

前記ニューラルネットワーク部分が、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）の１つ以上のサブ部分、及び／又は、前記ニューラルネットワークの１つ以上のニューラルネットワーク層を含む、請求項３１乃至５３のいずれかに記載のデータストリーム（４５）。

【請求項55】

前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、その中に符号化される対応するニューラルネットワーク部分のための前記ニューラルネットワークパラメータ（３２）を有する、請求項３１乃至５４のいずれかに記載のデータストリーム（４５）。

【請求項56】

前記個別にアクセス可能な部分（２００）は、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術符号化（６００）を用いて、かつ、文脈初期化を用いて符号化される、請求項５５に記載のデータストリーム（４５）。

【請求項57】

前記データストリーム（４５）は、個別にアクセス可能な部分それぞれについて、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの個別にアクセス可能な部分の始まりを指す示すポインタ（２２０、２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするために、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータと、含む、請求項５５又は５６に記載のデータストリーム（４５）。

【請求項58】

前記データストリーム（４５）は、前記ニューラルネットワーク部分のそれぞれについて、それぞれの前記ニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための前記再構成ルール（２７０）を、
前記ニューラルネットワーク全体に関連する前記データストリーム（４５）のメインヘッダ部分（４７）、
前記各ニューラルネットワーク部分が一部を成す前記ニューラルネットワーク層（２１０）に関連する前記データストリーム（４５）のヘッダー部分（１１０）に関連するニューラルネットワーク層（２１０、３０）、又は、
前記それぞれのニューラルネットワーク部分に関連する前記データストリーム（４５）のニューラルネットワーク部分固有のヘッダ部分に示す、請求項５５乃至５７のいずれかに記載のデータストリーム（４５）。

【請求項59】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化され、それぞれの部分は前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記データストリーム（４５）は、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、前記それぞれの所定の個別にアクセス可能な部分を識別するための識別パラメータ（３１０）を含む、請求項１乃至５８のいずれかに記載のデータストリーム（４５）。

【請求項60】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化され、各部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記データストリーム（４５）は、１つ以上の所定の個別にアクセス可能な部分（２００）それぞれについて、前記それぞれの所定の個別にアクセス可能な部分を識別するための識別パラメータ（３１０）を含む、データストリーム（４５）。

【請求項61】

前記識別パラメータ（３１０）が、ハッシュ関数又はエラー検出コード又はエラー訂正コードを介して、前記それぞれの所定の個別にアクセス可能な部分に関連する、請求項５９又は６０に記載のデータストリーム（４５）。

【請求項62】

２つ以上の所定の個別にアクセス可能な部分の集合を識別するための上位の識別パラメータ（３１０）をさらに含む、請求項５９乃至６１のいずれかに記載のデータストリーム（４５）。

【請求項63】

前記上位の識別パラメータ（３１０）は、ハッシュ関数又はエラー検出コード又はエラー訂正コードを介して、前記２つ以上の所定の個別にアクセス可能な部分の前記識別パラメータ（３１０）に関連している、請求項６２に記載のデータストリーム（４５）。

【請求項64】

前記個別にアクセス可能な部分（２００）は、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術符号化（６００）を用いて、文脈初期化を用いて符号化される、請求項５９乃至６３のいずれかに記載のデータストリーム（４５）。

【請求項65】

前記データストリーム（４５）が、それぞれの個別にアクセス可能な部分について、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）、及び／又は、
前記データストリームを解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするために、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを含む、請求項５９乃至６４のいずれかに記載のデータストリーム（４５）。

【請求項66】

前記ニューラルネットワーク部分が、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）の１つ以上のサブ部分、及び／又は、前記ニューラルネットワークの１つ以上のニューラルネットワーク層を含む、請求項５９乃至６５のいずれかに記載のデータストリーム（４５）。

【請求項67】

前記データストリーム（４５）は、ニューラルネット（１０）の表現が層方式で符号化されて、前記ニューラルネットの異なるバージョン（３３０）がデータストリーム（４５）に符号化され、前記データストリーム（４５）は、１つ以上の個別にアクセス可能な部分（２００）に構造化され、各部分は前記ニューラルネットワークの対応するバージョン（３３０）に関連しており、
前記データストリーム（４５）は前記ニューラルネットワークの第１のバージョン（３３０₂）が、
第２の部分に符号化された前記ニューラルネットワークの第２のバージョン（３３０₁）に対してデルタ符号化されて、及び／又は、
前記ニューラルネットワークの前記第１のバージョン（３３０₂）に基づく推論を実
行するために、各々が、第２の部分に符号化された前記ニューラルネットワークの第２のバージョン（３３０₁）の対応するニューラルネットワーク部分（３３４）の実行に追加
して実行される１つ以上の補償ニューラルネットワーク部分（３３２）の形態であって、
前記それぞれの補償ニューラルネットワーク部分（３３２）及び前記対応するニューラルネットワーク部分（３３４）の出力が合計される、補償ニューラルネットワーク部分の形態で、
第１の部分に符号化される、請求項１乃至６６のいずれかに記載のデータストリーム（４５）。

【請求項68】

ニューラルネットワーク（１０）の表現が層方式で符号化されたデータストリーム（４５）であって、
前記ニューラルネットの異なるバージョン（３３０）がデータストリーム（４５）に符号化され、前記データストリーム（４５）は、１つ以上の個別にアクセス可能な部分（２００）に構造化され、各部分は前記ニューラルネットワークの対応するバージョンに関連しており、
前記データストリーム（４５）は前記ニューラルネットワークの第１のバージョン（３３０₂）が、
第２の部分に符号化された前記ニューラルネットワークの第２のバージョン（３３０₁）に対してデルタ符号化されて、及び／又は、
前記ニューラルネットワークの前記第１のバージョン（３３０₂）に基づく推論を実
行するために、各々が、第２の部分に符号化された前記ニューラルネットワークの第２のバージョン（３３０₁）の対応するニューラルネットワーク部分（３３４）の実行に追加
して実行される１つ以上の補償ニューラルネットワーク部分（３３２）の形態であって、
前記それぞれの補償ニューラルネットワーク部分（３３２）及び前記対応するニューラルネットワーク部分（３３４）の出力が合計される、補償ニューラルネットワーク部分（３３２）の形態で、
第１の部分に符号化される、データストリーム（４５）。

【請求項69】

前記データストリーム（４５）は、前記ニューラルネットワークの前記第１のバージョン（３３０₂）が、
重み及び／又はバイアスの差、及び／又は、
追加のニューロン（１４、１８、２０）又はニューロン相互接続（２２、２４）
点で前記第２の部分に符号化された前記ニューラルネットワークの前記第２のバージョン（３３０₁）に対してデルタ符号化されて、第１の部分に符号化されている、請求項６７
又は６８に記載のデータストリーム（４５）。

【請求項70】

前記個別にアクセス可能な部分（２００）は、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術符号化（６００）を用いて、かつ、文脈初期化を用いて符号化される、請求項６７乃至６９のいずれかに記載のデータストリーム（４５）。

【請求項71】

前記データストリーム（４５）は、個別にアクセス可能な部分それぞれについて、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするために、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを含む、請求項６７乃至７０のいずれかに記載のデータストリーム（４５）。

【請求項72】

前記データストリーム（４５）は、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、前記それぞれの所定の個別にアクセス可能な部分を識別するための識別パラメータ（３１０）を含む、請求項６７乃至７１のいずれかに記載のデータストリーム（４５）。

【請求項73】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化され、各部分は前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記データストリーム（４５）は、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、前記ニューラルネットワークの前記表現を補足するための補足データ（３５０）を含む、請求項１乃至７２のいずれかに記載のデータストリーム（４５）。

【請求項74】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化され、各部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記データストリーム（４５）は、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、前記ニューラルネットワークの前記表現を補足するための補足データ（３５０）を含む、データストリーム（４５）。

【請求項75】

前記データストリーム（４５）は、前記補足データ（３５０）が前記ニューラルネットワークに基づく推論には必須ではないと示す、請求項７３又は７４に記載のデータストリーム（４５）。

【請求項76】

前記データストリーム（４５）は、前記１つ以上の所定の個別にアクセス可能な部分（２００）について前記ニューラルネットワークの前記表現を補足するための前記補足データ（３５０）が別の個別アクセス可能な部分（２００）に符号化されて、前記データストリーム（４５）が、前記１つ以上の所定の個別にアクセス可能な部分（２００）について
、前記それぞれの所定の個別アクセス可能な部分が対応する前記ニューラルネットワーク部分に関連する、対応する別の所定の個別にアクセス可能な部分を含むようになっている、請求項７３乃至７５のいずれかに記載のデータストリーム（４５）。

【請求項77】

前記ニューラルネットワーク部分は、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）及び／又は、前記ニューラルネットワークの所定のニューラルネットワーク層が細分化された層部分を含む、請求項７３乃至７６のいずれかに記載のデータストリーム（４５）。

【請求項78】

前記個別にアクセス可能な部分（２００）は、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術符号化（６００）を用いて、かつ、文脈初期化を用いて符号化される、請求項７３乃至７７のいずれかに記載のデータストリーム（４５）。

【請求項79】

前記データストリーム（４５）は、それぞれの個別にアクセス可能な部分について、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの個別にアクセス可能な部分の始まりを示すポインタ（２２０、２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするために、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータ、を含む、請求項７３乃至７８のいずれかに記載のデータストリーム（４５）。

【請求項80】

前記補足データ（３５０）は、
ニューラルネットワークパラメータ（３２）の関連性スコア、及び／又は、
ニューラルネットワークパラメータ（３２）の摂動ロバスト性に関連する、請求項７３乃至７９のいずれかに記載のデータストリーム（４５）。

【請求項81】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記データストリーム（４５）は、制御データ部分（４２０）のシーケンス（４１０）に構造化された階層的制御データ（４００）を含み、前記制御データ部分（４２０）は前記ニューラルネットワークに関する情報を前記制御データ部分（４２０）のシーケンスに沿って詳細度を増して提供する、請求項１乃至８０のいずれかに記載のデータストリーム（４５）。

【請求項82】

ニューラルネットワーク（１０）の表現が符号化されたデータストリーム（４５）であって、
前記データストリーム（４５）は、制御データ部分（４２０）のシーケンス（４１０）に構造化された階層的制御データ（４００）を含み、前記制御データ部分（４２０）は、前記ニューラルネットワークの情報を制御データ部分（４２０）の前記シーケンスに沿って詳細度を増して提供する、データストリーム（４５）。

【請求項83】

前記制御データ部分（４２０）の少なくともいくつかは、前記ニューラルネットワークに関する部分的に冗長な情報を提供する、請求項８１又は８２に記載のデータストリーム（４５）。

【請求項84】

第１の制御データ部分は、デフォルト設定を伴うデフォルトニューラルネットワークタイプを示すことによって前記ニューラルネットワークに関する前記情報を提供し、第２の制御データ部分は、前記デフォルト設定のそれぞれを示すパラメータを含む、請求項８１
乃至請求項８３のいずれかに記載のデータストリーム（４５）。

【請求項85】

ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化する装置であって、
前記装置は、前記ニューラルネットワークのニューロン相互接続（２２、２４）を定義するニューラルネットワークパラメータ（３２）が前記データストリーム（４５）に符号化される符号化順序（１０４）を示す直列化パラメータ（１０２）を前記データストリーム（４５）に供給するように構成される、装置。

【請求項86】

前記装置は、前記データストリーム（４５）に、文脈適応型算術符号化を用いて前記ニューラルネットワークパラメータ（３２）を符号化するように構成されている、請求項８５に記載の装置。

【請求項87】

前記装置は、
前記データストリーム（４５）を１つ以上の個別にアクセス可能な部分（２００）に構造化し、それぞれの個別にアクセス可能な部分は前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現し、かつ、
前記データストリーム（４５）に、前記直列化パラメータ（１０２）によって示される前記符号化順序（１０４）に従って、所定のニューラルネットワーク層内の前記ニューラルネットワークのニューロン相互接続（２２、２４）を定義するニューラルネットワークパラメータを符号化するように構成されている、請求項８５又は８６に記載の装置。

【請求項88】

前記直列化パラメータ（１０２）が、ｎ個の符号化順序（１０４）のセット（１０８）のうち前記符号化順序（１０４）を示すｎ－ａｒｙパラメータである、請求項８５乃至８７のいずれかに記載の装置。

【請求項89】

前記ｎ個の符号化順序（１０４）のセット（１０８）は、
前記所定の符号化順序が、前記ニューラルネットワーク（１０）の所定のニューラルネットワーク層（２１０、３０）を記述するテンソル（３０）の次元（３４）を走査（トラバース）する順序が異なる第１の所定の符号化順序（１０６₁）、及び／又は、
前記ニューラルネットワークのスケーラブルな符号化のために、前記所定の符号化順序が前記ニューラルネットワークの所定のニューラルネットワーク層を走査する回数（１０７）が異なる第２の所定の符号化順序（１０６₂）、及び／又は、
前記所定の符号化順序が前記ニューラルネットワークのニューラルネットワーク層を走査する順序が異なる第３の所定の符号化順序（１０６₃）、及び／又は、
前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）のニューロン（１４、１８、２０）が走査される順序が異なる第４の所定の符号化順序（１０６₄）
を含む、請求項８８に記載の装置。

【請求項90】

前記直列化パラメータ（１０２）は、前記符号化順序（１０４）がニューラルネットワーク層（２１０、３０）のニューロン（１４、１８、２０）をデフォルト順序に対して順列化するのに用いる順列を示す、請求項８５乃至８９のいずれかに記載の装置。

【請求項91】

前記順列は、前記ニューラルネットワークパラメータ（３２）が前記符号化順序（１０４）に沿って単調に増加するか、または前記符号化順序（１０４）に沿って単調に減少するように、前記ニューラルネットワーク層（２１０、３０）の前記ニューロン（１４、１８、２０）を順序付ける、請求項９０に記載の装置。

【請求項92】

前記順列は、前記直列化パラメータ（１０２）によって信号化可能な所定の符号化順序のうち、前記直列化パラメータ（１０２）が示す前記順列について、前記ニューラルネッ
トワークパラメータ（３２）の前記データストリーム（４５）に符号化するためのビットレートが最小となるように、前記ニューラルネットワーク層（２１０、３０）の前記ニューロン（１４、１８、２０）を順序付ける、請求項９０に記載の装置。

【請求項93】

前記ニューラルネットワークパラメータ（３２）は、重みおよびバイアスを含む、請求項８５乃至９２のいずれかに記載の装置。

【請求項94】

前記装置は、前記データストリーム（４５）が、個別にアクセス可能なサブ部分（４３、４４、２４０）に構造化され、それぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、それぞれのサブ部分（４３、４４、２４０）が、後続のサブ部分が前記符号化順序（１０４）によって走査される前に前記符号化順序（１０４）によって完全に走査されるように構成される、請求項８５乃至９３のいずれかに記載の装置。

【請求項95】

前記ニューラルネットワークパラメータ（３２）は、任意の個別にアクセス可能な部分（２００）またはサブ部分（４３、４４、２４０）の始点において、文脈適応型算術符号化を用いて、及び、文脈初期化を用いて、前記データストリームに符号化される、請求項８７乃至９４のいずれかに記載の装置。

【請求項96】

前記装置が、
前記データストリームに、それぞれの個別にアクセス可能な部分（２００）又はサブ部分（４３、４４、２４０）が始まる開始コード（２４２）、及び／又は、それぞれの個別にアクセス可能な部分またはサブ部分の始まりを指すポインタ（２２０、２４４）、及び／又は、前記データストリームの解析する際に前記それぞれの個別にアクセス可能な部分またはサブ部分をスキップするためにそれぞれの個別にアクセス可能な部分又はサブ部分のデータストリーム長（２４６）のポインタを符号化するように構成される、請求項８７乃至９５のいずれかに記載の装置。

【請求項97】

前記装置が、前記データストリームに、前記ニューラルネットワーク（１０）を推論に使用するときに、前記ニューラルネットワークパラメータ（３２）を表現する数値表現およびビットサイズを示す数値計算表現パラメータ（１２０）を符号化するように構成される、請求項８５乃至９６のいずれかに記載の装置。

【請求項98】

ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化する装置であって、
前記装置は、前記データストリーム（４５）に、前記ニューラルネットワーク（１０）を推論に用いるときに、前記データストリームに符号化されている前記ニューラルネットワークのニューラルネットワークパラメータ（３２）を表現する数値表現及びビットサイズを示す数値計算表現パラメータ（１２０）を提供するように構成される、装置。

【請求項99】

前記装置は、前記データストリーム（４５）を個別にアクセス可能なサブ部分（４３、４４、２４０）に構造化するように構成され、後続の個別にアクセス可能なサブ部分が前記符号化順序（１０４）によって走査される前に、それぞれの個別にアクセス可能なサブ部分が前記符号化順序（１０４）によって完全に走査されるように、それぞれの個別にアクセス可能なサブ部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記装置は、前記データストリーム（４５）に、所定の個別にアクセス可能なサブ部分について、前記ニューラルネットワークパラメータと、前記所定の個別にアクセス可能なサブ部分に符号化された前記ニューラルネットワークパラメータのパラメータタイプを示すタイプパラメータとを符号化するように構成されている、請求項８５乃至９８のいずれかに記載の装置。

【請求項100】

前記タイプパラメータは、少なくとも、ニューラルネットワークの重みとニューラルネットワークのバイアスとを区別する、請求項９９に記載の装置。

【請求項101】

前記装置は、前記データストリーム（４５）を１つ以上の個別にアクセス可能な部分（２００）に構造化するように構成され、それぞれに個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現し、
前記データストリーム（４５）に、所定のニューラルネットワーク層について、前記ニューラルネットワークの前記所定のニューラルネットワーク層タイプを示すニューラルネットワーク層タイプパラメータ（１３０）を符号化するように構成されている、請求項８５乃至１００のいずれかに記載の装置。

【請求項102】

ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化する装置であって、
前記データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分が前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現し、前記装置が、前記データストリーム（４５）に、所定のニューラルネットワーク層について、前記ニューラルネットワークの前記所定のニューラルネットワーク層のニューラルネットワーク層タイプを示すニューラルネットワーク層タイプパラメータ（１３０）を提供するように構成される、装置。

【請求項103】

前記ニューラルネットワーク層タイプパラメータ（１３０）は、少なくとも、完全連結層タイプと畳み込み層タイプとを区別する、請求項１０１又は１０２に記載の装置。

【請求項104】

前記装置は、前記データストリーム（４５）を個別にアクセス可能な部分（２００）に構造化するように構成され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、
前記データストリーム（４５）に、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、それぞれの個別アクセス可能な部分の始まりを指すポインタ（２２０、２４４）を符号化するように構成される、前記請求項８５乃至１０３のいずれかに記載の装置。

【請求項105】

ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化する装置であって、
前記データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの部分が前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現しており、前記装置が、前記データストリーム（４５）に対して、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記それぞれの所定の個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）を提供するよう構成される、装置。

【請求項106】

それぞれの個別にアクセス可能な部分は、
前記ニューラルネットワークの対応するニューラルネットワーク層（２１０）、又は、
前記ニューラルネットワークのニューラルネットワーク層（２１０）のニューラルネットワーク部分（４３、４４、２４０）を表現する、請求項１０４又は１０５に記載の装置。

【請求項107】

前記装置は、ニューラルネットワーク（１０）の表現を前記データストリーム（４５）に符号化するように構成されており、前記データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化されており、それぞれの個別にアクセス可能な部
分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現しており、前記データストリーム（４５）が所定の部分内で、個別にアクセス可能なサブ部分（４３、４４、２４０）にさらに構造化されており、それぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワークの前記それぞれのニューラルネットワーク層の対応するニューラルネットワーク部分を表現し、前記装置は、前記データストリーム（４５）に、１つ以上の所定の個別にアクセス可能なサブ部分（４３、４４、２４０）のそれぞれについて、
前記それぞれの所定の個別にアクセス可能なサブ部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの所定の個別にアクセス可能なサブ部分の始まりを指し示すポインタ（２４４）、及び／又は、
前記データストリームを解析する際に、前記それぞれの所定の個別にアクセス可能なサブ部分をスキップするための、前記それぞれの所定の個別にアクセス可能なサブ部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを提供するように構成される、請求項８５乃至１０６のいずれかに記載の装置。

【請求項108】

前記装置は、前記データストリーム（４５）に、それぞれの個別にアクセス可能な部分およびそれぞれの個別にアクセス可能なサブ部分の始点において、文脈適応型算術符号化を用いて、かつ、文脈初期化を用いて、前記ニューラルネットワークの前記表現を符号化するように構成される、請求項１０７記載の装置。

【請求項109】

ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化する装置であって、
前記データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化されており、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現しており、前記データストリーム（４５）は、所定の部分内で、個別にアクセス可能なサブ部分（４３、４４、２４０）にさらに構造化され、それぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワークの前記それぞれのニューラルネットワーク層の対応するニューラルネットワーク部分を表現し、前記装置は、前記データストリーム（４５）に、１つ以上の所定の個別にアクセス可能なサブ部分（４３、４４、２４０）のそれぞれに対して、
前記それぞれの所定の個別にアクセス可能なサブ部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの所定の個別にアクセス可能なサブ部分の始まりを指し示すポインタ（２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの所定の個別にアクセス可能なサブ部分をスキップするための、前記それぞれの所定の個別にアクセス可能なサブ部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを提供するように構成される、装置。

【請求項110】

前記装置は、前記データストリーム（４５）に、それぞれの個別にアクセス可能な部分およびそれぞれの個別にアクセス可能なサブ部分の始点において、文脈適応型算術符号化を用いて、かつ、文脈初期化を用いて、前記ニューラルネットワークの前記表現を符号化するように構成される、請求項１０９記載の装置。

【請求項111】

前記装置が、ニューラルネットワーク（１０）の表現をデータストリームに符号化するように構成され、前記データストリーム（４５）が個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分が、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記装置が、前記データストリーム（４５）に、１つ以上の所定の個別アクセス可能な部分のそれぞれについて、前記ニューラル
ネットワーク（１０）を推論に使用する際に使用しなければならない、または任意に使用できる１つ以上の処理オプション（２５２）を示す処理オプションパラメータ（２５０）を提供するように構成されている、請求項８５乃至１１０のいずれかに記載の装置。

【請求項112】

前記処理オプションパラメータ（２５０）は、所定の処理オプション（２５２）のセットのうち、前記１つ以上の利用可能な処理オプション（２５２）を示し、
前記所定の処理オプション（２５２）は、
前記それぞれの所定の個別にアクセス可能な部分の並列処理能力、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のサンプル単位並列処理能力（２５２₂）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のチャネル単位並列処理能力（２５２₁）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分の分類カテゴリ単位並列処理能力、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分によって表される前記ニューラルネットワーク部分の、同じ前記ニューラルネットワーク部分に関連するが、前記データストリーム（４５）に層方式で符号化されている前記ニューラルネットワークのバージョン（３３０）の別のバージョンに属する前記データストリーム（４５）の別の個別にアクセス可能な部分から得られる計算結果に対する依存性を含む、請求項１１１に記載の装置。

【請求項113】

ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化する装置であって、
前記データストリーム（４５）が個別にアクセス可能な部分（２００）に構造化されており、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記装置が、前記データストリーム（４５）に、１つ以上の所定の個別にアクセス可能な部分それぞれについて、前記ニューラルネットワーク（１０）を推測に使用する際に使用しなければならないか又は任意に使用できる１つ以上の処理オプション（２５２）を示す処理オプションパラメータ（２５０）を提供するよう構成される、データストリーム符号化のための装置。

【請求項114】

前記処理オプションパラメータ（２５０）は、所定の処理オプション（２５２）のセットのうち、前記１つ以上の利用可能な処理オプション（２５２）を示し、
前記所定の処理オプション（２５２）は、
前記それぞれの所定の個別にアクセス可能な部分の並列処理能力、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のサンプル単位並列処理能力（２５２₂）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のチャネル単位並列処理能力（２５２₁）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分の分類カテゴリ単位並列処理能力、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分によって表される前記ニューラルネットワーク部分の、同じ前記ニューラルネットワーク部分に関連するが、前記データストリーム（４５）に層方式で符号化されている前記ニューラルネットワークのバージョン（３３０）の別のバージョンに属する前記データストリーム（４５）の別の個別にアクセス可能な部分から得られる計算結果に対する依存性を含む、請求項１１３に記載の装置。

【請求項115】

前記装置が、ニューラルネットワークを表現するニューラルネットワークパラメータ（３２）をデータストリーム（４５）に符号化するように構成されており、前記ニューラルネットワークパラメータ（３２）が、量子化インデックス（３２’’）に量子化（２６０）されて前記データストリーム（４５）に符号化され、前記ニューラルネットワークの異
なるニューラルネットワーク部分内のニューラルネットワークパラメータ（３２）が異なって量子化（２６０）されるように、前記ニューラルネットワークパラメータ（３２）が前記データストリーム（４５）に符号化され、前記装置は、前記ニューラルネットワーク部分のそれぞれについて、前記それぞれのニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための再構成ルール（２７０）を示す前記データストリーム（４５）を提供するように構成される、請求項８５乃至１１４のいずれかに記載の装置。

【請求項116】

ニューラルネットワークを表現するニューラルネットワークパラメータ（３２）をデータストリーム（４５）に符号化する装置であって、
前記ニューラルネットワークパラメータ（３２）が量子化インデックス（３２’’）に量子化（２６０）されて前記データストリーム（４５）に符号化され、前記ニューラルネットワークの異なるニューラルネットワーク部分におけるニューラルネットワークパラメータ（３２）が異なって量子化（２６０）されるように、前記ニューラルネットワークパラメータ（３２）が前記データストリーム（４５）に符号化され、前記装置は、前記ニューラルネットワーク部分のそれぞれについて、前記それぞれのニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化（２８０）のための再構成ルール（２７０）を示す前記データストリーム（４５）を提供するように構成される、装置。

【請求項117】

前記ニューラルネットワーク部分が、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）及び／又は前記ニューラルネットワークの所定のニューラルネットワーク層が細分化された層部分を含む、請求項１１５又は１１６に記載の装置。

【請求項118】

前記装置は、前記データストリーム（４５）に、第１のニューラルネットワーク部分に関連するニューラルネットワークパラメータ（２８０）を逆量子化するための第１の再構成ルール（２７０₁、２７０ａ₁）を、第２のニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための第２の再構成ルール（２７０₂、２７０ａ₂）に対してデルタ符号化して符号化するよう構成されている、請求項１１５乃至１１７のいずれかに記載の装置。

【請求項119】

前記装置は、前記データストリーム（４５）に、前記第１の再構成ルール（２７０₁、
２７０ａ₁）を示すための第１の指数値と、前記第２の再構成ルール（２７０₂、２７０ａ₂）を示すための第２の指数値とを符号化するように構成され、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、所定の基底の指数によって定義される第１の量子化ステップサイズ（２６３）と、前記第１の指数値で定義される第１の指数とによって定義され、かつ、
前記第２の再構成ルール（２７０₂、２７０ａ₂）は、前記所定の基底の指数によって定義される第２の量子化ステップサイズ（２６３）と、前記第１および第２の指数値の和で定義される第２の指数とによって定義される、請求項１１８に記載の装置。

【請求項120】

前記データストリームは、さらに所定の基底を示す、請求項１１９に記載の装置。

【請求項121】

前記装置は、前記データストリームに、第１のニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための第１の再構成ルール（２７０₁、２７０ａ₁）を示すための第１の指数値と、第２のニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための第２の再構成ルール（２７０₂、２７０ａ₂）を示すための第２の指数値とを符号化するよう構成されており、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、所定の基底の指数によって定義さ
れる第１の量子化ステップサイズ（２６３）と、前記第１の指数値と所定の指数値との和によって定義される第１の指数とによって定義され、かつ、
前記第２の再構成ルール（２７０₂、２７０ａ₂）は、前記所定の基底の指数によって定義される第２の量子化ステップサイズ（２６３）と、前記第２の指数値と前記所定の指数値との和によって定義される第２の指数とによって定義される、請求項１１５乃至１１８のいずれかに記載の装置。

【請求項122】

前記データストリームは、さらに所定の基底を示す、請求項１２１に記載の装置。

【請求項123】

前記データストリームは、ニューラルネットワーク範囲で前記所定の基底を示す、請求項１２２に記載の装置。

【請求項124】

前記データストリームは、さらに前記所定の指数値を示す、請求項１２１乃至１２３のいずれかに記載の装置。

【請求項125】

前記データストリームは、ニューラルネットワーク層（２１０、３０）範囲で前記所定の指数値を示す、請求項１２５に記載の装置。

【請求項126】

前記データストリームは、前記所定の基底をさらに示し、前記データストリームは、前記所定の基底が前記データストリームによって示される範囲よりも細かい範囲で前記所定の指数値を示す、請求項１２４又は１２５に記載の装置。

【請求項127】

前記装置は、前記データストリームに、前記所定の基底を非整数形式で、前記第１および第２の指数値を整数形式で符号化するように構成される、前記請求項１１９乃至１２６のいずれかに記載の装置。

【請求項128】

前記装置は、前記データストリームに、前記第１の再構成ルール（２７０₁、２７０ａ₁）を示すために、第１の量子化インデックス－再構成レベルマッピング（２６５）を定義する第１のパラメータセット（２６４）と、前記第２の再構成ルール（２７０₂、２７０
ａ₂）を示すために、第２の量子化インデックス－再構成レベルマッピング（２６５）を
定義する第２のパラメータセット（２６４）とを符号化するよう構成されており、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、前記第１の量子化インデックス－再構成レベルマッピング（２６５）によって定義され、かつ、
前記第２の再構成ルール（２７０₂、２７０ａ₂）は、前記第１の量子化インデックス－再構成レベルマッピング（２６５）を前記第２の量子化インデックス－再構成レベルマッピング（２６５）により所定の方法で拡張することにより定義される、請求項１１８乃至１２７のいずれかに記載の装置。

【請求項129】

前記装置は、前記データストリームに、前記第１の再構成ルール（２７０₁、２７０ａ₁）を示すために、第１の量子化インデックス－再構成レベルマッピング（２６５）を定義する第１のパラメータセット（２６４）と、前記第２の再構成ルール（２７０₂、２７０
ａ₂）を示すために、第２の量子化インデックス－再構成レベルマッピング（２６５）を
定義する第２のパラメータセット（２６４）とを符号化するよう構成されており、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、前記第１の量子化インデックス－再構成レベルマッピング（２６５）によって定義され、
前記第２の再構成ルール（２７０₂、２７０ａ₂）は、前記第１の量子化インデックス－再構成レベルマッピング（２６５）を前記第２の量子化インデックス－再構成レベルマッピング（２６５）で所定の方法で拡張することにより定義される、請求項１１８乃至１２８のいずれかに記載の装置。

【請求項130】

前記データストリームは、さらに、前記所定の量子化インデックス－再構成レベルマッピング（２６５）を示す、請求項１２９に記載の装置。

【請求項131】

前記データストリームは、ニューラルネットワーク範囲又はニューラルネットワーク層（２１０、３０）範囲で、前記所定の量子化インデックス－再構成レベルマッピング（２６５）を示す、請求項１３０に記載の装置。

【請求項132】

前記所定の方法によれば、
拡張される前記量子化インデックス－再構成レベルマッピングに従った、それぞれのインデックス値（３２’’）の第１の再構成レベルへのマッピングは、拡張される前記量子化インデックス－再構成レベルマッピングを拡張する前記量子化インデックス－再構成レベルマッピングに従った、前記それぞれのインデックス値（３２’’）の第２の再構成レベルへのマッピングが存在する場合はそれによって置換される、及び／又は、
拡張される前記量子化インデックス－再構成レベルマッピングに従うとそれぞれのインデックス値（３２’’）をマッピングすべき再構成レベルが定義されず、また拡張される前記量子化インデックス－再構成レベルマッピングを拡張する前記量子化インデックス－再構成レベルマッピングに従うと対応する再構成レベルへマッピングされる前記任意のインデックス値（３２’’）について、前記それぞれのインデックス値（３２’’）から前記対応する再構成レベルへのマッピングが採用される、及び／又は、
拡張される前記量子化インデックス－再構成レベルマッピングを拡張する前記量子化インデックス－再構成レベルマッピングに従うとそれぞれの前記インデックス値（３２’’）をマッピングすべき再構成レベルが定義されず、また拡張される前記量子化インデックス－再構成レベルマッピングに従うと対応する再構成レベルへマッピングされる任意のインデックス値（３２’’）について、前記それぞれのインデックス値（３２’’）から前記対応する再構成レベルへのマッピングが採用される、請求項１２８乃至１３１のいずれかに記載の装置。

【請求項133】

前記装置は、前記データストリームに、所定のニューラルネットワーク部分の前記再構成ルール（２７０）を示すために、
量子化ステップサイズ（２６３）を示す量子化ステップサイズパラメータ（２６２）と、
量子化インデックス－再構成レベルマッピング（２６５）を定義するパラメータセット（２６４）と、を符号化するように構成されており、
前記所定のニューラルネットワーク部分の前記再構成ルール（２７０）は、
所定のインデックス間隔（２６８）内の量子化インデックス（３２’’）に対する量子化ステップサイズ（２６３）、及び
前記所定のインデックス間隔（２６８）外の量子化インデックス（３２’’）に対する量子化インデックス－再構成レベルマッピング（２６５）によって定義される、請求項１１５乃至１３２のいずれかに記載の装置。

【請求項134】

ニューラルネットワークを表現するニューラルネットワークパラメータ（３２）をデータストリーム（４５）に符号化する装置であって、
前記ニューラルネットワークパラメータ（３２）が、量子化インデックス（３２’’）に量子化（２６０）されて前記データストリーム（４５）に符号化されており、
前記装置が、前記データストリーム（４５）に、前記ニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための再構成ルール（２７０）示すために、
量子化ステップサイズ（２６３）を示す量子化ステップサイズパラメータ（２６２）と、
量子化インデックス－再構成レベルマッピング（２６５）を定義するパラメータセット（２６４）と、を提供するように構成されており、
前記所定のニューラルネットワーク部分の前記再構成ルール（２７０）は、
所定のインデックス間隔（２６８）内の量子化インデックス（３２’’）に対する量子化ステップサイズ（２６３）、及び、
前記所定のインデックス間隔（２６８）外の量子化インデックス（３２’’）に対する量子化インデックス－再構成レベルマッピング（２６５）によって定義される、装置。

【請求項135】

前記所定のインデックス間隔（２６８）はゼロを含む、請求項１３３又は１３４に記載の装置。

【請求項136】

前記所定のインデックス間隔（２６８）は所定の大きさ閾値まで拡張し、前記所定の大きさ閾値を超える量子化インデックス（３２’’）は、量子化インデックス－再構成レベルマッピング（２６５）が逆量子化（２８０）に用いられることを示すエスケープコードを表現する、請求項１３５に記載の装置。

【請求項137】

前記パラメータセット（２６４）が、前記所定のインデックス間隔（２６８）の外の量子化インデックス（３２’’）に関連する再構成レベルのリストによって、量子化インデックス－再構成レベルマッピング（２６５）を定義する、請求項１３３乃至１３６のいずれかに記載の装置。

【請求項138】

前記ニューラルネットワーク部分が、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）の１つ以上のサブ部分、及び／又は、前記ニューラルネットワークの１つ以上のニューラルネットワーク層を含む、請求項１１５乃至１３７のいずれかに記載の装置。

【請求項139】

前記装置が、前記データストリーム（４５）を個別にアクセス可能な部分（２００）に構造化し、対応するニューラルネットワーク部分のための前記ニューラルネットワークパラメータ（３２）をそれぞれの個別にアクセス可能な部分に符号化するように構成されている、請求項１１５乃至１３８のいずれかに記載の装置。

【請求項140】

前記装置は、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術符号化を使用して、文脈初期化を使用して、及び、データストリームに、前記個別にアクセス可能な部分（２００）を符号化するように構成されている、請求項１３９に記載の装置。

【請求項141】

前記装置は、前記データストリームに、個別にアクセス可能な部分それぞれについて、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの個別にアクセス可能な部分の始まりを指す示すポインタ（２２０、２４４）、及び／又は、
前記データストリームを解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするための、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを、符号化するように構成される、請求項１３９又は１４０に記載の装置。

【請求項142】

前記装置は、前記ニューラルネットワーク部分のそれぞれについて、前記それぞれのニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための再構成ルール（２７０）の指示を、
前記ニューラルネットワーク全体に関連する前記データストリームのメインヘッダ部分（４７）、
前記それぞれのニューラルネットワーク部分が属する前記ニューラルネットワーク層（
２１０）に関連する前記データストリームのヘッダー部分（１１０）に関連するニューラルネットワーク層（２１０、３０）、又は、
前記それぞれのニューラルネットワーク部分に関連する前記データストリームのニューラルネットワーク部分固有のヘッダ部分において、
前記データストリームに符号化するように構成されている、請求項１３９乃至１４１のいずれかに記載の装置。

【請求項143】

前記装置は、ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化するように構成され、前記データストリーム（４５）が個別にアクセス可能な部分（２００）に構造化され、それぞれの部分は前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記装置は、前記データストリーム（４５）に、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記それぞれの所定の個別にアクセス可能な部分を識別するための識別パラメータ（３１０）を提供するように構成される、請求項８５乃至１４２のいずれかに記載の装置。

【請求項144】

ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化するための装置であって、
前記データストリーム（４５）が個別にアクセス可能な部分（２００）に構造化されており、各部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記装置が、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記データストリーム（４５）に、前記それぞれの所定の個別にアクセス可能な部分を識別するための識別パラメータ（３１０）を提供するように構成されている、装置。

【請求項145】

前記識別パラメータ（３１０）が、ハッシュ関数又はエラー検出コード又はエラー訂正コードを介して、前記それぞれの所定の個別にアクセス可能な部分に関連する、請求項１４３又は１４４に記載の装置。

【請求項146】

前記装置は、前記データストリーム（４５）に、２つ以上の所定の個別にアクセス可能な部分の集合を識別するための上位の識別パラメータ（３１０）を符号化するように構成される、前記請求項１４３乃至１４５のいずれかに記載の装置。

【請求項147】

前記上位の識別パラメータ（３１０）は、ハッシュ関数又はエラー検出コード又はエラー訂正コードを介して、前記１つ以上の所定の個別にアクセス可能な部分の前記識別パラメータ（３１０）に関連している、請求項１４６に記載の装置。

【請求項148】

前記装置は、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術符号化を用いて、かつ、文脈初期化を用いて、前記データストリームに、前記個別にアクセス可能な部分（２００）を符号化するように構成される、請求項１４３乃至１４７のいずれかに記載の装置。

【請求項149】

前記装置は、それぞれの個別にアクセス可能な部分について、前記データストリームに、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）、及び／又は、
前記データストリームを解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするための、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを、符号化するように構成される、請求項１４３乃至１４８のいずれかに記載の装置。

【請求項150】

前記ニューラルネットワーク部分が、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）、及び／又は、前記ニューラルネットワークの１つ以上のニューラルネットワーク層（２１０、３０）の１つ以上のサブ部分を含む、請求項１４３乃至１４９のいずれかに記載の装置。

【請求項151】

前記装置は、ニューラルネットワーク（１０）の表現をデータストリーム（４５）に層方式で符号化するように構成されており、前記ニューラルネットワークの異なるバージョン（３３０）が前記データストリーム（４５）に符号化され、かつ、前記データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化され、各部分が前記ニューラルネットワークの対応するバージョンに関連しており、
前記装置は、
前記ニューラルネットワークの第１のバージョン（３３０₂）を、
第２の部分に符号化された前記ニューラルネットワークの第２のバージョン（３３０₁）に対してデルタ符号化されて、及び／又は、
前記ニューラルネットワークの前記第１のバージョン（３３０₂）に基づく推論を実
行するために、各々が第２の部分に符号化された前記ニューラルネットワークの第２のバージョン（３３０₁）の対応するニューラルネットワーク部分（３３４）の実行に追加し
て実行される１つ以上の補償ニューラルネットワーク部分（３３２）の形態であって、かつ、
前記それぞれの補償ニューラルネットワーク部分（３３２）及び前記対応するニューラルネットワーク部分（３３４）の出力が合計される、、補償ニューラルネットワーク部分の形態で、
第１の部分に符号化するように構成されており、請求項８５乃至１５０のいずれかに記載の装置。

【請求項152】

ニューラルネットワーク（１０）の表現をデータストリーム（４５）に層方式で符号化する装置であって、
前記ニューラルネットワークの異なるバージョン（３３０）が前記データストリーム（４５）に符号化され、かつ、前記データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化され、各部分が前記ニューラルネットワークの対応するバージョンに関連しており、
前記装置は、
前記ニューラルネットワークの第１のバージョン（３３０₂）を、
第２の部分に符号化された前記ニューラルネットワークの第２のバージョン（３３０₁）に対してデルタ符号化して、及び／又は、
前記ニューラルネットワークの前記第１のバージョン（３３０₂）に基づく推論を実
行するために、各々が第２の部分に符号化された前記ニューラルネットワークの第２のバージョン（３３０₁）の対応するニューラルネットワーク部分（３３４）の実行に追加し
て実行される１つ以上の補償ニューラルネットワーク部分（３３２）の形態であって、かつ、
前記それぞれの補償ニューラルネットワーク部分（３３２）及び前記対応するニューラルネットワーク部分（３３４）の出力が合計される、補償ニューラルネットワーク部分（３３２）の形態で、
第１の部分へ符号化するように構成されている、装置。

【請求項153】

前記装置は、前記データストリームの第２の部分に、前記ニューラルネットワークの前記第２のバージョン（３３０₁）を符号化するように構成され；及び、
前記装置は、
前記ニューラルネットワークの前記第１のバージョン（３３０₂）を、
重み及び／又はバイアスの差、及び／又は、
追加のニューロン（１４、１８、２０）又はニューロン相互接続（２２、２４）
で前記第２の部分に符号化された前記ニューラルネットワークの前記第２のバージョン（３３０₁）に対してデルタ符号化し、前記データストリームの第１の部分に符号化する
ように構成される、請求項１５１または１５２に記載の装置。

【請求項154】

前記装置は、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術符号化（６００）を用いて、かつ、文脈初期化を用いて、前記データストリームに、前記個別にアクセス可能な部分（２００）を符号化するように構成される、請求項１５１乃至１５３のいずれかに記載の装置。

【請求項155】

前記装置は、個別にアクセス可能な部分それぞれについて、前記データストリームに、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）、及び／又は、
前記データストリームを解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするための、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを、符号化するように構成されている、請求項１５１乃至１５４のいずれかに記載の装置。

【請求項156】

前記装置は、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、データストリームに、前記それぞれの所定の個別のアクセス可能な部分を識別するための識別パラメータ（３１０）を符号化するように構成されている、請求項１５１乃至１５５のいずれかに記載の装置。

【請求項157】

前記装置は、ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化するように構成され、前記データストリーム（４５）が個別にアクセス可能な部分（２００）に構造化され、各部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記装置は、前記データストリーム（４５）に、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、前記ニューラルネットワークの前記表現を補足するための補足データ（３５０）を提供するように構成されている、請求項８５乃至１５６のいずれかに記載の装置。

【請求項158】

ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化する装置であって、
前記データストリーム（４５）が個別にアクセス可能な部分（２００）に構造化され、各部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記装置が、前記データストリーム（４５）に、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、ニューラルネットワークの表現を補足するための補足データ（３５０）を提供するように構成されている、装置。

【請求項159】

前記データストリーム（４５）は、前記補足データ（３５０）が前記ニューラルネットワークに基づく推論には必須ではないと示す、請求項１５７または１５８に記載の装置。

【請求項160】

前記装置は、前記１つ以上の所定の個別にアクセス可能な部分（２００）について前記ニューラルネットワークの前記表現を補足するための前記補足データ（３５０）を別の個別にアクセス可能な部分（２００）に符号化するように構成され、前記データストリームが、前記１つ以上の所定の個別にアクセス可能な部分（２００）について、前記それぞれの所定の個別アクセス可能な部分が対応する前記ニューラルネットワーク部分に関連する
、対応する別の所定の個別にアクセス可能な部分を含むようになっている、請求項１５７乃至１５９のいずれかに記載の装置。

【請求項161】

前記ニューラルネットワーク部分は、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）及び／又は、前記ニューラルネットワークの所定のニューラルネットワーク層（２１０、３０）が細分化された層部分を含む、請求項１５７乃至１６０のいずれかに記載の装置。

【請求項162】

前記装置は、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術符号化を用いて、かつ、文脈初期化を用いて、前記個別にアクセス可能な部分（２００）を符号化するように構成される、請求項１５７乃至１６１のいずれかに記載の装置。

【請求項163】

前記装置が、それぞれの個別にアクセス可能な部分について、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの個別にアクセス可能な部分の始まりを示すポインタ（２２０、２４４）、及び／又は、
前記データストリームを解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするための、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを、前記データストリームに符号化するように構成される、請求項１５７乃至１６２のいずれかに記載の装置。

【請求項164】

前記補足データ（３５０）は、
ニューラルネットワークパラメータ（３２）の関連性スコア、及び／又は、
ニューラルネットワークパラメータ（３２）の摂動ロバスト性に関連する、請求項１５７乃至１６３のいずれかに記載の装置。

【請求項165】

ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化するための装置であって、
前記装置は、前記データストリーム（４５）に、制御データ部分（４２０）のシーケンス（４１０）に構造化された階層的制御データ（４００）を提供するように構成されており、前記制御データ部分は、前記ニューラルネットワークに関する情報を制御データ部分の詳細度を増して提供する、請求項８５乃至１６４のいずれかに記載の装置。

【請求項166】

ニューラルネットワーク（１０）の表現をデータストリーム（４５）に符号化する装置であって、
前記装置は、制御データ部分（４２０）のシーケンス（４１０）に構造化された階層的制御データ（４００）を前記データストリーム（４５）に提供するように構成され、前記制御データ部分は、前記ニューラルネットワークの情報を制御データ部分の前記シーケンスに沿って詳細度を増して提供する、装置。

【請求項167】

前記制御データ部分（４２０）の少なくともいくつかは、前記ニューラルネットワークに関する部分的に冗長な情報を提供する、請求項１６５又は１６６に記載の装置。

【請求項168】

第１の制御データ部分は、デフォルト設定を伴うデフォルトニューラルネットワークタイプを示すことによって前記ニューラルネットワークに関する前記情報を提供し、第２の制御データ部分は、前記デフォルト設定のそれぞれを示すパラメータを含む、請求項１６５乃至１６７のいずれかに記載の装置。

【請求項169】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号するため
の装置であって、
前記装置は、前記ニューラルネットワークのニューロン相互接続（２２、２４）を定義するニューラルネットワークパラメータ（３２）がデータストリーム（４５）に符号化される符号化順序（１０４）を示す直列化パラメータ（１０２）をデータストリーム（４５）から復号化するように構成される、装置。

【請求項170】

前記装置は、前記データストリーム（４５）から、文脈適応型算術復号化を用いて前記ニューラルネットワークパラメータ（３２）を復号化するように構成されている、請求項１６９に記載の装置。

【請求項171】

前記データストリームは、１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現し、
前記装置が、前記データストリーム（４５）から、所定のニューラルネットワーク層内の前記ニューラルネットワークのニューロン相互接続（２２、２４）を定義するニューラルネットワークパラメータを連続的に復号化するように構成されており、
前記符号化順序（１０４）を使用して、前記データストリーム（４５）から連続的に復号化されたニューラルネットワークパラメータを前記ニューロン相互接続（２２、２４）に割り当てる、請求項１６９又は１７０に記載の装置。

【請求項172】

前記直列化パラメータ（１０２）が、ｎ個の符号化順序（１０４）のセット（１０８）のうち前記符号化順序（１０４）を示すｎ－ａｒｙパラメータである、請求項１６９乃至１７１のいずれかに記載の装置。

【請求項173】

前記ｎ個の符号化順序（１０４）のセット（１０８）は、
前記所定の符号化順序が、前記ニューラルネットワーク（１０）の所定のニューラルネットワーク層（２１０、３０）を記述するテンソル（３０）の次元（３４）を走査（トラバース）する順序が異なる第１の所定の符号化順序（１０６₁）、及び／又は、
前記ニューラルネットワークのスケーラブルな符号化のために、前記所定の符号化順序が前記ニューラルネットワークの所定のニューラルネットワーク層（２１０、３０）を走査する回数（１０７）が異なる第２の所定の符号化順序（１０６₂）、及び／又は、
前記所定の符号化順序が前記ニューラルネットワークのニューラルネットワーク層を走査する順序が異なる第３の所定の符号化順序（１０６₃）、及び／又は、
前記ニューラルネットワークのニューラルネットワーク層のニューロン（１４、１８、２０）が走査される順序が異なる第４の所定の符号化順序（１０６₄）を含む、請求項１
７２に記載の装置。

【請求項174】

前記直列化パラメータ（１０２）は、前記符号化順序（１０４）がニューラルネットワーク層（２１０、３０）のニューロン（１４、１８、２０）をデフォルト順序に対して順列化するのに用いる順列を示す、請求項１６９乃至１７３のいずれかに記載の装置。

【請求項175】

前記順列は、前記ニューラルネットワークパラメータ（３２）が前記符号化順序（１０４）に沿って単調に増加するか、または前記符号化順序（１０４）に沿って単調に減少するように、前記ニューラルネットワーク層（２１０、３０）の前記ニューロン（１４、１８、２０）を順序付ける、請求項１７４に記載の装置。

【請求項176】

前記順列は、前記直列化パラメータ（１０２）によって信号化可能な所定の符号化順序のうち、前記直列化パラメータ（１０２）が示す前記順列について、前記ニューラルネットワークパラメータ（３２）を前記データストリーム（４５）に符号化するためのビットレートが最小となるように、前記ニューラルネットワーク層（２１０、３０）の前記ニュ
ーロン（１４、１８、２０）を順序付ける、請求項１７４に記載の装置。

【請求項177】

前記ニューラルネットワークパラメータ（３２）は、重みおよびバイアスを含む、請求項１６９乃至１７６のいずれかに記載の装置。

【請求項178】

前記装置は、前記データストリームから、個別にアクセス可能な部分（２００）に前記データストリームが構造化されている個別にアクセス可能なサブ部分（４３、４４、２４０）を復号化するように構成されており、それぞれのサブ部分（４３、４４、２４０）が後続のサブ部分が前記符号化順序（１０４）によって走査される前に前記符号化順序（１０４）によって完全に走査されるように、それぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現する、請求項１６９乃至１７７のいずれかに記載の装置。

【請求項179】

前記ニューラルネットワークパラメータ（３２）は、任意の個別にアクセス可能な部分（２００）またはサブ部分（４３、４４、２４０）の始点において、文脈適応型算術復号化を用いて、及び、文脈初期化を用いて、前記データストリームから復号化される、請求項１７１乃至１７８のいずれかに記載の装置。

【請求項180】

前記装置が、前記データストリームから、それぞれの個別にアクセス可能な部分（２００）又はサブ部分（４３、４４、２４０）を始まる開始コード（２４２）、及び／又は、それぞれの個別にアクセス可能な部分またはサブ部分の始まりを指すポインタ（２２０、２４４）、及び／又は、前記データストリームを解析する際に前記それぞれの個別にアクセス可能な部分またはサブ部分をスキップするためにそれぞれの個別にアクセス可能な部分またはサブ部分のデータストリーム長（２４６）のポインタを復号化するように構成されている、請求項１７１乃至１７９のいずれかに記載の装置。

【請求項181】

前記装置が、前記データストリームから、前記ニューラルネットワーク（１０）を推論に使用するときに、前記ニューラルネットワークパラメータ（３２）を表現する数値表現およびビットサイズを示す数値計算表現パラメータ（１２０）を復号化するように構成される、請求項１６９乃至１８０のいずれかに記載の装置。

【請求項182】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化するための装置であって、
前記装置は、前記データストリーム（４５）から、前記ニューラルネットワーク（１０）を推論に用いるときに、前記データストリームに符号化されている前記ニューラルネットワークのニューラルネットワークパラメータ（３２）を表現する数値表現及びビットサイズを示す数値計算表現パラメータ（１２０）を復号化するように構成されており、前記データストリーム（４５）から復号化された前記ニューラルネットワークパラメータ（３２）を表現するための数値表現及びビットサイズを使用するように構成されている、装置。

【請求項183】

前記データストリーム（４５）は個別にアクセス可能なサブ部分（４３、４４、２４０）に構造化され、後続の個別にアクセス可能なサブ部分が前記符号化順序（１０４）によって走査される前に、それぞれの個別にアクセス可能なサブ部分が前記符号化順序（１０４）によって完全に走査されるように、それぞれの個別にアクセス可能なサブ部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記装置は、前記データストリーム（４５）から、所定の個別にアクセス可能なサブ部分について、前記ニューラルネットワークパラメータと、前記所定の個別にアクセス可能なサブ部分から復号化された前記ニューラルネットワークパラメータのパラメータタイプを示すタイプパラメータとを復号化するように構成されている、請求項１６９乃至１８２のいずれかに
記載の装置。

【請求項184】

前記タイプパラメータは、少なくとも、ニューラルネットワークの重みとニューラルネットワークのバイアスとを区別する、請求項１８３に記載の装置。

【請求項185】

データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの１つ以上の個別にアクセス可能な部分が前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現し、
前記装置が、前記データストリーム（４５）から、所定のニューラルネットワーク層について、前記ニューラルネットワークの前記所定のニューラルネットワーク層のニューラルネットワーク層タイプを示すニューラルネットワーク層タイプパラメータ（１３０）を復号化するように構成されている、請求項１６９乃至１８４のいずれかに記載の装置。

【請求項186】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化する装置であって、
前記データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの部分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現し、前記装置が、前記データストリーム（４５）から、所定のニューラルネットワーク層（２１０、３０）について、前記ニューラルネットワークの前記所定のニューラルネットワーク層のニューラルネットワーク層タイプを示すニューラルネットワーク層タイプパラメータ（１３０）を復号化するよう構成される、装置。

【請求項187】

前記ニューラルネットワーク層タイプパラメータ（１３０）は、少なくとも、完全連結層タイプと畳み込み層タイプとを区別する、請求項１８５又は１８６に記載の装置。

【請求項188】

前記データストリーム（４５）が個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、
前記装置が、前記データストリーム（４５）から、１つ以上の所定の個別アクセス可能部分（２００）のそれぞれについて、それぞれの個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）を復号化するように構成されている、請求項１６９乃至１８７のいずれかに記載の装置。

【請求項189】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化するための装置であって、
前記データストリーム（４５）は１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの部分が前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現しており、前記装置が、前記データストリーム（４５）から、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記それぞれの所定の個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）を復号化するよう構成されている、装置。

【請求項190】

それぞれの個別にアクセス可能な部分は、
前記ニューラルネットワークの対応するニューラルネットワーク層（２１０）、又は、
前記ニューラルネットワークのニューラルネットワーク層（２１０）のニューラルネットワーク部分（４３、４４、２４０）を表現する、請求項１８８又は１８９に記載の装置。

【請求項191】

前記装置は、前記データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化するように構成されており、前記データストリーム（４５）が１つ以上の個別
にアクセス可能な部分（２００）に構造化されており、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現しており、前記データストリーム（４５）が所定の部分内で、個別にアクセス可能なサブ部分（４３、４４、２４０）にさらに構造化されており、それぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワークの前記それぞれのニューラルネットワーク層（２１０、３０）の対応するニューラルネットワーク部分を表現し、前記装置は、前記データストリーム（４５）から、１つ以上の所定の個別にアクセス可能なサブ部分（４３、４４、２４０）のそれぞれについて、
前記それぞれの所定の個別にアクセス可能なサブ部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの所定の個別にアクセス可能なサブ部分の始まりを指し示すポインタ（２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの所定の個別にアクセス可能なサブ部分をスキップするための、前記それぞれの所定の個別にアクセス可能なサブ部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを復号化するように構成される、請求項１６９乃至１９０のいずれかに記載の装置。

【請求項192】

前記装置は、前記データストリーム（４５）から、それぞれの個別にアクセス可能な部分およびそれぞれの個別にアクセス可能なサブ部分の始点において、文脈適応型算術復号化を用いて、かつ、文脈初期化を用いて、前記ニューラルネットワークの表現を復号化するように構成されている、請求項１９１に記載の装置。

【請求項193】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化する装置であって、
前記データストリーム（４５）は、１つ以上の個別にアクセス可能な部分（２００）に構造化されており、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現しており、前記データストリーム（４５）は、所定の部分内で、個別にアクセス可能なサブ部分（４３、４４、２４０）にさらに構造化され、それぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワークの前記それぞれのニューラルネットワーク層（２１０、３０）の対応するニューラルネットワーク部分を表現し、前記装置は、前記データストリーム（４５）から、１つ以上の所定の個別にアクセス可能なサブ部分（４３、４４、２４０）のそれぞれに対して、
前記それぞれの所定の個別にアクセス可能なサブ部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの所定の個別にアクセス可能なサブ部分の始まりを指し示すポインタ（２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの所定の個別にアクセス可能なサブ部分をスキップするための、前記それぞれの所定の個別にアクセス可能なサブ部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを復号化するように構成される、装置。

【請求項194】

前記装置は、前記データストリーム（４５）から、それぞれの個別にアクセス可能な部分およびそれぞれの個別にアクセス可能なサブ部分の始点において、文脈適応型算術復号化を用いて、かつ、文脈初期化を用いて、前記ニューラルネットワークの前記表現を復号化するよう構成される、請求項１９３に記載の装置。

【請求項195】

前記装置が、データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化するように構成され、前記データストリーム（４５）が個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分が、前記ニューラルネッ
トワークの対応するニューラルネットワーク部分を表現し、前記装置が、前記データストリーム（４５）から、１つ以上の所定の個別アクセス可能部分（２００）のそれぞれについて、前記ニューラルネットワーク（１０）を推論に使用する際に使用しなければならない、または任意に使用できる１つ以上の処理オプション（２５２）を示す処理オプションパラメータ（２５０）を復号化するように構成されている、請求項１６９乃至１９４のいずれかに記載の装置。

【請求項196】

前記処理オプションパラメータ（２５０）は、所定の処理オプション（２５２）のセットのうち、前記１つ以上の利用可能な処理オプション（２５２）を示し、
前記所定の処理オプション（２５２）は、
前記それぞれの所定の個別にアクセス可能な部分の並列処理能力、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のサンプル単位並列処理能力（２５２₂）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のチャネル単位並列処理能力（２５２₁）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分の分類カテゴリ単位並列処理能力、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分によって表される前記ニューラルネットワーク部分の、同じ前記ニューラルネットワーク部分に関連するが、前記データストリーム（４５）に層方式で符号化されている前記ニューラルネットワークのバージョン（３３０）の別のバージョンに属する前記データストリーム（４５）の別の個別にアクセス可能な部分から得られる計算結果に対する依存性を含む、請求項１９５に記載の装置。

【請求項197】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化する装置であって、
前記データストリーム（４５）が個別にアクセス可能な部分（２００）に構造化されており、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記装置が、１つ以上の所定の個別にアクセス可能な部分それぞれについて、前記データストリーム（４５）から、前記ニューラルネットワーク（１０）を推測に使用する際に使用しなければならないか又は任意に使用できる１つ以上の処理オプション（２５２）を示す処理オプションパラメータ（２５０）を復号化するよう構成される、装置。

【請求項198】

前記処理オプションパラメータ（２５０）は、所定の処理オプション（２５２）のセットのうち、前記１つ以上の利用可能な処理オプション（２５２）を示し、
前記所定の処理オプション（２５２）は、
前記それぞれの所定の個別にアクセス可能な部分の並列処理能力、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のサンプル単位並列処理能力（２５２₂）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分のチャネル単位並列処理能力（２５２₁）、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分の分類カテゴリ単位並列処理能力、及び／又は、
前記それぞれの所定の個別にアクセス可能な部分によって表される前記ニューラルネットワーク部分の、同じ前記ニューラルネットワーク部分に関連するが、前記データストリーム（４５）に層方式で符号化されている前記ニューラルネットワークのバージョン（３３０）の別のバージョンに属する前記データストリーム（４５）の別の個別にアクセス可能な部分から得られる計算結果に対する依存性を含む、請求項１９７に記載の装置。

【請求項199】

前記装置が、ニューラルネットワークを表現するニューラルネットワークパラメータ（
３２）をデータストリーム（４５）から復号化するように構成されており、前記ニューラルネットワークパラメータ（３２）が、量子化インデックス（３２’’）に量子化（２６０）されて前記データストリーム（４５）に符号化され、前記ニューラルネットワークの異なるニューラルネットワーク部分内のニューラルネットワークパラメータ（３２）が異なって量子化（２６０）されるように、前記ニューラルネットワークパラメータ（３２）が前記データストリーム（４５）に符号化され、前記装置は、前記ニューラルネットワーク部分のそれぞれについて、前記データストリーム（４５）から、前記それぞれのニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための再構成ルール（２７０）を復号化するように構成される、請求項１６９乃至１９８のいずれかに記載の装置。

【請求項200】

ニューラルネットワークを表現するニューラルネットワークパラメータ（３２）をデータストリーム（４５）から復号化する装置であって、
前記ニューラルネットワークパラメータ（３２）が量子化インデックス（３２’’）に量子化（２６０）されて前記データストリーム（４５）に符号化され、前記ニューラルネットワークの異なるニューラルネットワーク部分におけるニューラルネットワークパラメータ（３２）が異なって量子化（２６０）されるように、前記ニューラルネットワークパラメータ（３２）が前記データストリーム（４５）に符号化され、前記装置は、前記ニューラルネットワーク部分のそれぞれについて、前記データストリーム（４５）から、前記それぞれのニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための再構成ルール（２７０）を復号化するよう構成される、装置。

【請求項201】

前記ニューラルネットワーク部分が、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）及び／又は前記ニューラルネットワークの所定のニューラルネットワーク層が細分化された層部分を含む、請求項１９９又は２００に記載の装置。

【請求項202】

前記装置は、前記データストリーム（４５）から、第１のニューラルネットワーク部分に関連するニューラルネットワークパラメータ（２８０）を逆量子化するための第１の再構成ルール（２７０₁、２７０ａ₁）を、第２のニューラルネットワーク部分に関連するニューラルネットワークパラメータ（２８０）を逆量子化するための第２の再構成ルール（２７０₂、２７０ａ₂）に対してデルタ復号化して復号化するように構成される、請求項１９９乃至２０１のいずれかに記載の装置。

【請求項203】

前記装置は、前記データストリーム（４５）から、前記第１の再構成ルール（２７０₁
、２７０ａ₁）を示すための第１の指数値と、前記第２の再構成ルール（２７０₂、２７０ａ₂）を示すための第２の指数値とを復号化するように構成され、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、所定の基底の指数で定義される第１の量子化ステップサイズ（２６３）と、前記第１の指数値で定義される第１の指数とによって定義され、かつ、
前記第２の再構成ルール（２７０₂、２７０ａ₂）は、前記所定の基底の指数によって定義される第２の量子化ステップサイズ（２６３）と、前記第１および第２の指数値の和で定義される第２の指数とによって定義される、請求項２０２に記載の装置。

【請求項204】

データストリーム（４５）が、さらに所定の基底を示す、請求項２０３に記載の装置。

【請求項205】

前記装置は、前記データストリーム（４５）から、第１のニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための第１の再構成ルール（２７０₁、２７０ａ₁）を示すための第１の指数値と、第２のニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化
（２８０）するための第２の再構成ルール（２７０₂、２７０ａ₂）を示すための第２の指数値を復号化するように構成されており、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、所定の基底の指数によって定義される第１の量子化ステップサイズ（２６３）と、前記第１の指数値と所定の指数値との和によって定義される第１の指数とによって定義され、かつ、
前記第２の再構成ルール（２７０₂、２７０ａ₂）は、前記所定の基底の指数によって定義される第２の量子化ステップサイズ（２６３）と、前記第２の指数値と前記所定の指数値との和によって定義される第２の指数とによって定義される、請求項１９９乃至２０２のいずれかに記載の装置。

【請求項206】

前記データストリームは、さらに所定の基底を示す、請求項２０５に記載の装置。

【請求項207】

前記データストリームは、ニューラルネットワーク範囲で前記所定の基底を示す、請求項２０６に記載の装置。

【請求項208】

前記データストリームは、さらに前記所定の指数値を示す、請求項２０５から２０７のいずれかに記載の装置。

【請求項209】

前記データストリーム（４５）は、ニューラルネットワーク層（２１０、３０）範囲で前記所定の指数値を示す、請求項２０８に記載の装置。

【請求項210】

前記データストリームは、前記所定の基底をさらに示し、前記データストリームは、前記所定の基底が前記データストリームによって示される範囲よりも細かい範囲で前記所定の指数値を示す、請求項２０８又は２０９に記載の装置。

【請求項211】

前記装置は、前記データストリームから、前記所定の基底を非整数形式で、前記第１および第２の指数値を整数形式で復号化するように構成される、請求項２０３乃至２１０のいずれかに記載の装置。

【請求項212】

前記装置は、前記データストリームから、前記第１の再構成ルール（２７０₁、２７０
ａ₁）を示すために、第１の量子化インデックス－再構成レベルマッピング（２６５）を
定義する第１のパラメータセット（２６４）と、前記第２の再構成ルール（２７０₂、２
７０ａ₂）を示すために、第２の量子化インデックス－再構成レベルマッピング（２６５
）を定義する第２のパラメータセット（２６４）とを復号化するよう構成されており、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、前記第１の量子化インデックス－再構成レベルマッピング（２６５）によって定義され、
前記第２の再構成ルール（２７０₂、２７０ａ₂）は、前記第１の量子化インデックス－再構成レベルマッピング（２６５）を前記第２の量子化インデックス－再構成レベルマッピング（２６５）で所定の方法で拡張することにより定義される、請求項２０２乃至２１１のいずれかに記載の装置。

【請求項213】

前記装置は、前記データストリームから、前記第１の再構成ルール（２７０₁、２７０
ａ₁）を示すために、第１の量子化インデックス－再構成レベルマッピング（２６５）を
定義する第１のパラメータセット（２６４）と、前記第２の再構成ルール（２７０₂、２
７０ａ₂）を示すために、第２の量子化インデックス－再構成レベルマッピング（２６５
）を定義する第２のパラメータセット（２６４）とを復号化するよう構成されており、
前記第１の再構成ルール（２７０₁、２７０ａ₁）は、前記第１の量子化インデックス－再構成レベルマッピング（２６５）によって定義され、
前記第２の再構成ルール（２７０₂、２７０ａ₂）は、前記第１の量子化インデックス－
再構成レベルマッピング（２６５）を前記第２の量子化インデックス－再構成レベルマッピング（２６５）で所定の方法で拡張することにより定義される、請求項２０２乃至２１２のいずれかに記載の装置。

【請求項214】

前記データストリームは、さらに、前記所定の量子化インデックス－再構成レベルマッピング（２６５）を示す、請求項２１３に記載の装置。

【請求項215】

前記データストリームは、ニューラルネットワーク範囲又はニューラルネットワーク層（２１０、３０）範囲で、前記所定の量子化インデックス－再構成レベルマッピング（２６５）を示す、請求項２１４に記載の装置。

【請求項216】

前記所定の方法によれば、
拡張される前記量子化インデックス－再構成レベルマッピングに従った、それぞれのインデックス値（３２’’）の第１の再構成レベルへのマッピングは、拡張される前記量子化インデックス－再構成レベルマッピングを拡張する前記量子化インデックス－再構成レベルマッピングに従った、前記それぞれのインデックス値（３２’’）の第２の再構成レベルへのマッピング存在する場合はそれによって置換される、及び／又は、
拡張される前記量子化インデックス－再構成レベルマッピングに従うとそれぞれの前記インデックス値（３２’’）をマッピングすべき再構成レベルが定義されず、また拡張される前記量子化インデックス－再構成レベルマッピングを拡張する前記量子化インデックス－再構成レベルマッピングに従うと対応する再構成レベルへマッピングされる前記任意のインデックス値（３２’’）について、前記それぞれのインデックス値（３２’’）から前記対応する再構成レベルへのマッピングが採用される、及び／又は、
拡張される前記量子化インデックス－再構成レベルマッピングを拡張する前記量子化インデックス－再構成レベルマッピングに従うとそれぞれの前記インデックス値（３２’’）をマッピングすべき再構成レベルが定義されず、また拡張される前記量子化インデックス－再構成レベルマッピングに従うと対応する再構成レベルへマッピングされる任意のインデックス値（３２’’）について、前記それぞれのインデックス値（３２’’）から前記対応する再構成レベルへのマッピングが採用される、請求項２１２から２１５のいずれかに記載の装置。

【請求項217】

前記装置は、前記データストリームから、所定のニューラルネットワーク部分の再構成ルール（２７０）を示すための復号化を行うように構成されており、
量子化ステップサイズ（２６３）を示す量子化ステップサイズパラメータ（２６２）と、
量子化インデックス－再構成レベルマッピング（２６５）を定義するパラメータセット（２６４）と、を含み、
前記所定のニューラルネットワーク部分の前記再構成ルール（２７０）は、
所定のインデックス間隔（２６８）内の量子化インデックス（３２’’）に対する量子化ステップサイズ（２６３）、及び
前記所定のインデックス間隔（２６８）外の量子化インデックス（３２’’）に対する量子化インデックス－再構成レベルマッピング（２６５）によって定義される、請求項１９９乃至２１６のいずれかに記載の装置。

【請求項218】

ニューラルネットワークを表現するニューラルネットワークパラメータ（３２）をデータストリーム（４５）から復号化する装置であって、
前記ニューラルネットワークパラメータ（３２）が、量子化インデックス（３２’’）に量子化（２６０）されて前記データストリーム（４５）に符号化されており、
前記装置が、
量子化ステップサイズ（２６３）を示す量子化ステップサイズパラメータ（２６２）と
、
量子化インデックス－再構成レベルマッピング（２６５）を定義するパラメータセット（２６４）と、
を前記データストリーム（４５）から復号化することによって、前記ニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための再構成ルール（２７０）を前記データストリーム（４５）から導出可能に構成されており、
前記所定のニューラルネットワーク部分の前記再構成ルール（２７０）は、
所定のインデックス間隔（２６８）内の量子化インデックス（３２’’）に対する量子化ステップサイズ（２６３）、及び、
前記所定のインデックス間隔（２６８）外の量子化インデックス（３２’’）に対する量子化インデックス－再構成レベルマッピング（２６５）によって定義される、装置。

【請求項219】

前記所定のインデックス間隔（２６８）はゼロを含む、請求項２１７又は２１８に記載の装置。

【請求項220】

前記所定のインデックス間隔（２６８）は所定の大きさ閾値まで拡張し、前記所定の大きさ閾値を超える量子化インデックス（３２’’）は、量子化インデックス－再構成レベルマッピング（２６５）が逆量子化（２８０）に用いられることを示すエスケープコードを表現する、請求項２１９に記載の装置。

【請求項221】

前記パラメータセット（２６４）が、前記所定のインデックス間隔（２６８）の外の量子化インデックス（３２’’）に関連する再構成レベルのリストによって、量子化インデックス－再構成レベルマッピング（２６５）を定義する、請求項２１７乃至２２０のいずれかに記載の装置。

【請求項222】

前記ニューラルネットワーク部分が、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）の１つ以上のサブ部分、及び／又は、前記ニューラルネットワークの１つ以上のニューラルネットワーク層を含む、請求項１９９乃至２２１のいずれかに記載の装置。

【請求項223】

前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化されており、前記装置は、対応するニューラルネットワーク部分のための前記ニューラルネットワークパラメータ（３２）をそれぞれの個別にアクセス可能な部分から復号化するように構成されている、請求項１９９乃至２２２のいずれかに記載の装置。

【請求項224】

前記装置は、前記データストリーム（４５）から、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術復号化を使用して、及び、文脈初期化を使用して、前記個別にアクセス可能な部分（２００）を復号化するように構成されている、２２３に記載の装置。

【請求項225】

前記装置は、前記データストリーム（４５）から、個別にアクセス可能な部分それぞれについて、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするための、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを、読み取るように構成されている、請求項２２３又は２２４に記載の装置。

【請求項226】

前記装置は、前記ニューラルネットワーク部分のそれぞれについて、前記それぞれのニューラルネットワーク部分に関連するニューラルネットワークパラメータ（３２）を逆量子化（２８０）するための再構成ルール（２７０）の指示を、
前記ニューラルネットワーク全体に関する前記データストリーム（４５）のメインヘッダ部分（４７）、
前記それぞれのニューラルネットワーク部分が属する前記ニューラルネットワーク層に関連する前記データストリーム（４５）のヘッダー部分（１１０）に関連するニューラルネットワーク層（２１０、３０）、又は、
前記それぞれのニューラルネットワーク部分に関連する前記データストリームのニューラルネットワーク部分固有のヘッダ部分において、前記データストリーム（４５）から読み取るように構成されている、請求項２２３乃至２２５のいずれかに記載の装置。

【請求項227】

前記装置は、データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化するように構成され、前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化され、それぞれの部分は前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記装置は、前記データストリーム（４５）から、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記それぞれの所定の個別アクセス可能な部分を識別するための識別パラメータ（３１０）を復号化するように構成される、請求項１６９乃至２２６のいずれかに記載の装置。

【請求項228】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化するための装置であって、
前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構造化されており、各部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記装置は、前記データストリーム（４５）から、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記それぞれの所定の個別にアクセス可能な部分を識別するための識別パラメータ（３１０）を復号化するように構成されることを特徴とする装置。

【請求項229】

前記識別パラメータ（３１０）が、ハッシュ関数又はエラー検出コード又はエラー訂正コードを介して、前記それぞれの所定の個別にアクセス可能な部分に関連する、請求項２２７又は２２８に記載の装置。

【請求項230】

前記装置が、前記データストリーム（４５）から、２つ以上の所定の個別にアクセス可能な部分の集合を識別するための上位の識別パラメータ（３１０）を復号化するように構成される、請求項２２７乃至２２９のいずれかに記載の装置。

【請求項231】

前記上位の識別パラメータ（３１０）は、ハッシュ関数又はエラー検出コード又はエラー訂正コードを介して、前記１つ以上の所定の個別にアクセス可能な部分の前記識別パラメータ（３１０）に関連している、請求項２３０に記載の装置。

【請求項232】

前記装置は、前記データストリーム（４５）から、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術復号化を用いて、かつ、文脈初期化を用いて、前記個別にアクセス可能な部分（２００）を復号化するように構成される、請求項２２７乃至２３１のいずれかに記載の装置。

【請求項233】

前記装置は、前記データストリームから、それぞれの個別にアクセス可能な部分について、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は
、
前記それぞれの個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）、及び／又は、
前記データストリームを解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするための、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを、読み取るように構成される、請求項２２７乃至２３２のいずれかに記載の装置。

【請求項234】

前記ニューラルネットワーク部分が、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）、及び／又は、前記ニューラルネットワークの１つ以上のニューラルネットワーク層の１つ以上のサブ部分を含む、請求項２２７乃至２３３のいずれかに記載の装置。

【請求項235】

前記装置は、層方式で符号化されたデータストリーム（４５）から、ニューラルネット（１０）の表現を復号化するように構成されており、前記ニューラルネットワークの異なるバージョン（３３０）が前記データストリーム（４５）に符号化され、かつ、前記データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化され、各部分が前記ニューラルネットワークの対応するバージョンに関連しており、
前記装置は、
第２の部分に符号化された前記ニューラルネットワークの第２のバージョン（３３０１）に対してデルタ復号化を使用することによって、及び／又は、
前記データストリーム（４５）から、それぞれが前記ニューラルネットワークの前記第１のバージョン（３３０₂）に基づく推論を実行するために、１つ以上の補償ニューラ
ルネットワーク部分（３３２）を復号化することにより、
第１の部分から符号化された前記ニューラルネットワークの第１のバージョン（３３０₂）を復号化するように構成されており、
第２の部分に符号化された前記ニューラルネットワークの第２のバージョン（３３０１）の対応するニューラルネットワーク部分（３３４）の実行に追加して実行され、
前記それぞれの補償ニューラルネットワーク部分（３３２）及び前記対応するニューラルネットワーク部分（３３４）の出力が合計される、請求項の１６９乃至２３４のいずれかに記載の装置。

【請求項236】

前記装置は、層方式で符号化されたデータストリーム（４５）から、ニューラルネット（１０）の表現を復号化するように構成されており、前記ニューラルネットワークの異なるバージョン（３３０）が前記データストリーム（４５）に符号化され、かつ、前記データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化され、各部分が前記ニューラルネットワークの対応するバージョンに関連しており、
前記装置は、
第２の部分に符号化された前記ニューラルネットワークの第２のバージョン（３３０１）に対してデルタ復号化を使用することによって、及び／又は、
前記データストリーム（４５）から、前記ニューラルネットワークの前記第１のバージョン（３３０₂）に基づく推論を実行するための、それぞれがそうである１つ以上の補
償ニューラルネットワーク部分（３３２）を復号化することにより、
第１の部分から前記ニューラルネットワークの第１のバージョン（３３０₂）を復号化
するように構成されており、
第２の部分に符号化されたニューラルネットワークの第２のバージョン（３３０１）の対応するニューラルネットワーク部分（３３４）の実行に追加して実行され、
前記それぞれの補償ニューラルネットワーク部分（３３２）及び前記対応するニューラルネットワーク部分（３３４）の出力が合計される、装置。

【請求項237】

前記装置が、前記データストリーム（４５）の第２の部分から、前記ニューラルネットワークの前記第２のバージョン（３３０₁）を復号化するように構成され；及び、
前記装置は、
前記ニューラルネットワークの前記第１のバージョン（３３０₂）を、重み及び／
又はバイアスの差、及び／又は、
追加のニューロン（１４、１８、２０）又はニューロン相互接続（２２、２４）
で前記第２の部分に符号化された前記ニューラルネットワークの前記第２のバージョン（３３０₁）に対してデルタ復号化し、前記データストリーム（４５）の第１の部分から
復号化するように構成される、請求項２３５又は２３６に記載の装置。

【請求項238】

前記装置は、前記それぞれの個別にアクセス可能な部分の始点において、前記データストリーム（４５）から、文脈適応型算術復号化（６００）を用いて、文脈初期化を用いて、前記個別にアクセス可能な部分（２００）を復号化するように構成される、任意の先の請求項２３５から２３７のいずれかに記載の装置。

【請求項239】

前記装置は、前記データストリーム（４５）から、個別にアクセス可能な部分それぞれについて、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）、及び／又は、
前記データストリームを解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするための、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを、復号化するように構成される、請求項２３５乃至２３８のいずれかに記載の装置。

【請求項240】

前記装置は、前記データストリームから、１つ以上の所定の個別にアクセス可能な部分（２００）のそれぞれについて、前記それぞれの所定の個別にアクセス可能な部分を識別するための識別パラメータ（３１０）を復号化するように構成される、請求項２３５乃至２３９のいずれかに記載の装置。

【請求項241】

前記装置は、データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化するように構成され、前記データストリーム（４５）は、個別にアクセス可能な部分（２００）に構成され、各部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記装置は、前記データストリーム（４５）から、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記ニューラルネットワークの前記表現を補足するための補足データ（３５０）を復号化するように構成される、請求項１６９乃至２４０のいずれかに記載の装置。

【請求項242】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化する装置であって、
前記データストリーム（４５）は個別にアクセス可能な部分（２００）に構造化され、各部分が、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記装置は、前記データストリーム（４５）から、１つ以上の所定の個別にアクセス可能な部分（２００）それぞれについて、ニューラルネットワークの表現を補足するための補足データ（３５０）を復号化するよう構成されている、装置。

【請求項243】

前記データストリーム（４５）は、前記補足データ（３５０）が前記ニューラルネットワークに基づく推論には必須ではないと示す、請求項２４１又は２４２に記載の装置。

【請求項244】

前記装置は、前記１つ以上の所定の個別アクセス可能部分（２００）について前記ニューラルネットワークの前記表現を補足するための補足データ（３５０）を、別の個別にアクセス可能な部分から復号化するように構成され、前記データストリーム（４５）が、前記１つ以上の所定の個別アクセス可能部分のそれぞれについて、前記それぞれの所定の個別アクセス可能部分が対応する前記ニューラルネットワーク部分に関連する、対応する別の所定の個別にアクセス可能な部分を含むようになっている、請求項２４１乃至２４３のいずれかに記載の装置。

【請求項245】

前記ニューラルネットワーク部分は、前記ニューラルネットワークのニューラルネットワーク層（２１０、３０）及び／又は、前記ニューラルネットワークの所定のニューラルネットワーク層が細分化された層部分を含む、請求項２４１乃至２４４のいずれかに記載の装置。

【請求項246】

前記装置は、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術復号化を用いて、かつ、文脈初期化を用いて、前記個別にアクセス可能な部分（２００）を復号化するように構成される、請求項２４１乃至２４５のいずれかに記載の装置。

【請求項247】

前記装置は、前記データストリームから、それぞれの個別にアクセス可能な部分について、
前記それぞれの個別にアクセス可能な部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの個別にアクセス可能な部分の始まりを示すポインタ（２２０、２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの個別にアクセス可能な部分をスキップするための、前記それぞれの個別にアクセス可能な部分のデータストリーム長（２４６）を示すデータストリーム長パラメータを、読み取るように構成されている、請求項２４１乃至２４６のいずれかに記載の装置。

【請求項248】

前記補足データ（３５０）は、
ニューラルネットワークパラメータ（３２）の関連性スコア、及び／又は、
ニューラルネットワークパラメータ（３２）の摂動ロバスト性に関連する、請求項２４１乃至２４７のいずれかに記載の装置。

【請求項249】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化するための装置であって、
前記装置は、前記データストリーム（４５）から、制御データ部分（４２０）のシーケンス（４１０）に構造化された階層的制御データ（４００）を復号化するように構成されており、前記制御データ部分は、前記ニューラルネットワークに関する情報を制御データ部分のシーケンスに沿って詳細度を増して提供する、請求項１６９乃至２４８のいずれかに記載の装置。

【請求項250】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化する装置であって、
前記装置は、前記データストリーム（４５）から、制御データ部分（４２０）のシーケンス（４１０）に構造化された階層的制御データ（４００）を復号化するように構成され、前記制御データ部分は、前記ニューラルネットワークに関する情報を制御データ部分の前記シーケンスに沿って詳細度を増して提供する、装置。

【請求項251】

前記制御データ部分（４２０）の少なくともいくつかは、前記ニューラルネットワークに関する部分的に冗長な情報を提供する、請求項２４９または２５０に記載の装置。

【請求項252】

第１の制御データ部分は、デフォルト設定を伴うデフォルトニューラルネットワークタイプを示すことによって前記ニューラルネットワークに関する前記情報を提供し、第２の制御データ部分は、前記デフォルト設定のそれぞれを示すパラメータを含む、請求項２４９乃至２５１のいずれかに記載の装置。

【請求項253】

ニューラルネットワークを用いた推論を行うための装置であって、
請求項１６９乃至２５２のいずれかに記載のデータストリーム（４５）を復号化して前記データストリーム（４５）から前記ニューラルネットワークを導出するための装置と、
前記ニューラルネットワークに基づいて前記推論を実行するように構成されたプロセッサと、を含む、装置。

【請求項254】

ニューラルネットワークの表現をデータストリーム（４５）に符号化するための方法であって、
前記ニューラルネットワークのニューロン相互接続を定義するニューラルネットワークパラメータが前記データストリームに符号化される符号化順序を示す直列化パラメータを前記データストリームに提供するステップを含む、方法。

【請求項255】

ニューラルネットワークの表現をデータストリームに符号化するための方法であって、
前記ニューラルネットワークを推論に使用する際に、前記データストリームに符号化される前記ニューラルネットワークのニューラルネットワークパラメータが表現される数値表現とビットサイズを示す数値計算表現パラメータを前記データストリームに提供するステップを含む、方法。

【請求項256】

ニューラルネットワークの表現をデータストリームに符号化する方法であって、
前記データストリームが１つ以上の個別にアクセス可能な部分に構造化され、それぞれの個別にアクセス可能な部分が前記ニューラルネットワークの対応するニューラルネットワーク層を表現しており、前記方法が、所定のニューラルネットワーク層について、前記ニューラルネットワークの前記所定のニューラルネットワーク層のニューラルネットワーク層タイプを示すニューラルネットワーク層タイプパラメータを前記データストリームに提供するステップを含む、方法。

【請求項257】

ニューラルネットワークの表現をデータストリームに符号化する方法であって、
前記データストリームが１つ以上の個別にアクセス可能な部分に構造化され、各部分が前記ニューラルネットワークの対応するニューラルネットワーク層を表現しており、前記方法が、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記データストリームに、前記それぞれの所定の個別にアクセス可能な部分の始まりを指すポインタを提供するステップを含む、方法。

【請求項258】

ニューラルネットワークの表現をデータストリームに符号化する方法であって、
前記データストリームが１つ以上の個別にアクセス可能な部分に構造化され、それぞれの個別にアクセス可能な部分が前記ニューラルネットワークの対応するニューラルネットワーク層を表現しており、前記データストリームが所定の部分内で、個別にアクセス可能なサブ部分にさらに構造化され、それぞれのサブ部分が前記ニューラルネットワークの前記それぞれのニューラルネットワーク層の対応するニューラルネットワーク部分を表現しており、前記方法が、前記データストリームに、１つ以上の所定の個別にアクセス可能なサブ部分のそれぞれについて、
前記それぞれの所定の個別にアクセス可能なサブ部分が始まる開始コード、及び／又は、
前記それぞれの所定の個別にアクセス可能なサブ部分の始まりを指すポインタ、及び／
又は、
前記データストリームを解析する際に、前記所定の個別アクセス可能なサブ部分をスキップするための、前記所定の個別アクセス可能なサブ部分のデータストリーム長を示すデータストリーム長パラメータと、を提供するステップを含む、方法。

【請求項259】

ニューラルネットワークの表現をデータストリームに符号化する方法であって、
前記データストリームが個別にアクセス可能な部分に構造化され、それぞれの個別にアクセス可能な部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記方法は、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記ニューラルネットワークを推論に使用する際に、使用しなければならない、または任意に使用できる１つ以上の処理オプションを示す処理オプションパラメータを前記データストリームに提供するステップを含む、方法。

【請求項260】

ニューラルネットワークを表現するニューラルネットワークパラメータをデータストリームに符号化する方法であって、
前記ニューラルネットワークパラメータは量子化インデックスに量子化されて前記データストリームに符号化され、前記ニューラルネットワークの異なるニューラルネットワーク部分のニューラルネットワークパラメータが異なって量子化されるように前記データストリームに符号化され、前記方法は、前記ニューラルネットワーク部分のそれぞれについて、前記それぞれのニューラルネットワーク部分に関連するニューラルネットワークパラメータを逆量子化するための再構成ルールを示す前記データストリームを提供するステップを含む、方法。

【請求項261】

ニューラルネットワークを表現するニューラルネットワークパラメータをデータストリームに符号化する方法であって、
前記ニューラルネットワークパラメータが量子化インデックスに量子化されて前記データストリームに符号化され、前記方法は、前記ニューラルネットワークパラメータを逆量子化するための再構成ルールを示すために、
量子化ステップサイズを示す量子化ステップサイズパラメータと、
量子化インデックス－再構成レベルマッピングを定義するパラメータセットと、を前記データストリームに提供するステップを含み、
前記所定のニューラルネットワーク部分の前記再構成ルールが、
所定のインデックス間隔内の量子化インデックスについての前記量子化ステップサイズと、
前記所定のインデックス間隔外の量子化インデックスについての前記量子化インデックス－再構成レベルマッピングと、により定義される、方法。

【請求項262】

ニューラルネットワークの表現をデータストリームに符号化する方法であって、
前記データストリームが個別にアクセス可能な部分に構造化され、各部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記方法は、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記データストリームに、前記それぞれの所定の個別にアクセス可能な部分を識別するための識別パラメータを提供するステップを含む、方法。

【請求項263】

ニューラルネットワークの表現を層方式でデータストリームに符号化する方法であって、
前記ニューラルネットワークの異なるバージョンが前記データストリームに符号化され、かつ、前記データストリームが１つ以上の個別にアクセス可能な部分に構造化され、各部分は前記ニューラルネットワークの対応するバージョンに関連しており、前記方法は、前記ニューラルネットワークの第１のバージョンを、
第２の部分に符号化された前記ニューラルネットワークの第２のバージョンに対してデルタ符号化して、及び／又は、
前記ニューラルネットワークの前記第１のバージョンに基づく推論を実行するために、各々が、第２の部分に符号化された前記ニューラルネットワークの第２のバージョンの対応するニューラルネットワーク部分の実行に追加して実行される１つ以上の補償ニューラルネットワーク部分の形態であって、
それぞれの前記補償ニューラルネットワーク部分及び前記対応するニューラルネットワーク部分の出力が合計される、補償ニューラルネットワーク部分の形態で、
前記第１の部分に符号化するステップを含む、方法。

【請求項264】

ニューラルネットワークの表現をデータストリームに符号化する方法であって、
前記データストリームが個別にアクセス可能な部分に構造化され、各部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記方法は、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記データストリームに、前記ニューラルネットワークの前記表現を補足するための補足データを提供するステップを含む、方法。

【請求項265】

ニューラルネットワークの表現をデータストリームに符号化する方法であって、
前記方法は、制御データ部分のシーケンスに構造化された階層的制御データを前記データストリームに提供するステップを含み、前記制御データ部分は、制御データ部分の前記シーケンスに沿って詳細度を増して前記ニューラルネットワークに関する情報を提供する、方法。

【請求項266】

データストリームからニューラルネットワークの表現を復号化する方法であって、
前記ニューラルネットワークのニューロン相互接続を定義するニューラルネットワークパラメータが前記データストリームに符号化される符号化順序を示す直列化パラメータを前記データストリームから復号化するステップを含む、方法。

【請求項267】

データストリームからニューラルネットワークの表現を復号化する方法であって、
前記方法は、前記ニューラルネットワークを推論に使用する際に前記データストリームに符号化されている前記ニューラルネットワークのニューラルネットワークパラメータが表現されるべき数値表現とビットサイズを示す数値計算表現パラメータを前記データストリームから復号化するステップと、前記データストリームから復号化された、前記ニューラルネットワークパラメータを表現するための前記数値表現及びビットサイズを使用するステップと、を含む、方法。

【請求項268】

データストリームからニューラルネットワークの表現を復号化する方法であって、
前記データストリームが１つ以上の個別にアクセス可能な部分に構造化され、各部分が前記ニューラルネットワークの対応するニューラルネットワーク層を表現し、前記方法が、前記データストリームから、所定のニューラルネットワーク層について、前記ニューラルネットワークの前記所定のニューラルネットワーク層のニューラルネットワーク層タイプを示すニューラルネットワーク層タイプパラメータを復号化するステップを含む、方法。

【請求項269】

データストリームからニューラルネットワークの表現を復号化する方法であって、
前記データストリームが１つ以上の個別にアクセス可能な部分に構造化され、各部分が前記ニューラルネットワークの対応するニューラルネットワーク層を表現し、前記方法が、前記データストリームから、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記それぞれの所定の個別にアクセス可能な部分の始まりを指すポインタを復号化するステップを含む、方法。

【請求項270】

データストリームからニューラルネットワークの表現を復号化する方法であって、
前記データストリームが１つ以上の個別にアクセス可能な部分に構造化され、それぞれの個別にアクセス可能な部分が前記ニューラルネットワークの対応するニューラルネットワーク層を表現しており、前記データストリームが、所定の部分内で、個別にアクセス可能なサブ部分にさらに構造化され、それぞれのサブ部分が前記ニューラルネットワークの前記それぞれのニューラルネットワーク層の対応するニューラルネットワーク部分を表現しており、前記方法が、前記データストリームから、１つ以上の所定の個別にアクセス可能なサブ部分のそれぞれについて、
前記それぞれの所定の個別にアクセス可能なサブ部分が始まる開始コード、及び／又は、
前記それぞれの所定の個別にアクセス可能なサブ部分の始まりを指す示すポインタ、及び／又は、
前記データストリームを解析する際に、前記所定の個別アクセス可能なサブ部分をスキップするための、前記それぞれの所定の個別アクセス可能なサブ部分のデータストリーム長を示すデータストリーム長パラメータと、を復号化するステップを含む、方法。

【請求項271】

データストリームからニューラルネットワークの表現を復号化する方法であって、
前記データストリームが個別にアクセス可能な部分に構造化され、それぞれの個別にアクセス可能な部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記方法は、前記データストリームから、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記ニューラルネットワークを推論のために使用しなければならない、または任意に使用できる１つ以上の処理オプションを示す処理オプションパラメータを復号化するステップを含む、方法。

【請求項272】

ニューラルネットワークを表現するニューラルネットワークパラメータをデータストリームから復号化する方法であって、
前記ニューラルネットワークパラメータは量子化インデックスに量子化されて前記データストリームに符号化され、前記ニューラルネットワークの異なるニューラルネットワーク部分のニューラルネットワークパラメータが異なるように前記データストリームに符号化され、前記方法は、前記ニューラルネットワーク部分のそれぞれについて、前記それぞれのニューラルネットワーク部分に関連するニューラルネットワークパラメータを逆量子化するための再構成ルールを前記データストリームから復号化するステップを含む、装置。

【請求項273】

ニューラルネットワークを表現するニューラルネットワークパラメータをデータストリームから復号化する方法であって、
前記ニューラルネットワークパラメータが量子化インデックスに量子化されて前記データストリームに符号化され、前記方法は、
量子化ステップサイズを示す量子化ステップサイズパラメータと、
量子化インデックス－再構成レベルマッピングを定義するパラメータセットと、
を前記データストリームから復号化することによって、前記ニューラルネットワークパラメータを逆量子化するための再構成ルールを前記データストリームから導出するステップを含み、
前記所定のニューラルネットワーク部分の前記再構成ルールが、
所定のインデックス間隔内の量子化インデックスに対する前記量子化ステップサイズと、
前記所定のインデックス間隔外の量子化インデックスに対する前記量子化インデックス－再構成レベルマッピングと、により定義される、方法。

【請求項274】

データストリームからニューラルネットワークの表現を復号化する方法であって、
前記データストリームが個別にアクセス可能な部分に構造化され、各部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記方法は、前記データストリームから、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記それぞれの所定の個別にアクセス可能な部分を識別するための識別パラメータを復号化するステップを含む、方法。

【請求項275】

層方式でデータストリームに符号化されたニューラルネットワークの表現をデータストリームから復号化する方法であって、
前記ニューラルネットワークの異なるバージョンが前記データストリームに符号化され、かつ、前記データストリームが１つ以上の個別にアクセス可能な部分に構造化され、各部分は前記ニューラルネットワークの対応するバージョンに関連しており、前記方法は、前記ニューラルネットワークの第１のバージョンを、
第２の部分に符号化された前記ニューラルネットワークの第２のバージョンに対してデルタ復号化を用いることによって、及び／又は、
前記ニューラルネットワークの前記第１のバージョンに基づく推論を実行するために、各々が、第２の部分に符号化された前記ニューラルネットワークの第２のバージョンの対応するニューラルネットワーク部分の実行に追加して実行される１つ以上の補償ニューラルネットワーク部分を前記データストリームから復号化することによって、
第１の部分から復号化するステップを含み、
前記それぞれの補償ニューラルネットワーク部分及び前記対応するニューラルネットワーク部分の出力が合計される、方法。

【請求項276】

データストリームからニューラルネットワークの表現を復号化する方法であって、
前記データストリームが個別にアクセス可能な部分に構造化され、各部分が前記ニューラルネットワークの対応するニューラルネットワーク部分を表現しており、前記方法は、前記データストリームから、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、前記ニューラルネットワークの前記表現を補足するための補足データを復号化するステップを含む、方法。

【請求項277】

データストリームからニューラルネットワークの表現を復号化する方法であって、
前記方法は、制御データ部分のシーケンスに構造化された階層的制御データを前記データストリームから復号化するステップを含み、前記制御データ部分は、制御データ部分の前記シーケンスに沿って詳細度を増して前記ニューラルネットワークに関する情報を提供する、方法。

【請求項278】

コンピュータによって実行されるとき、コンピュータに請求項２５４乃至２７７のいずれかに記載の方法を実行させるためのコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本願発明は、ニューラルネットワークの表現形式に関する概念に関するものである。

【背景技術】

【0002】

ニューラルネットワーク（ＮＮ）は、現在、多くのアプリケーションでブレークスルーを起こしている。
-画像/ビデオデータにおけるオブジェクトの検出や分類
-音声の音声認識・キーワード認識
-音声合成
-光学式文字認識
-言語翻訳
-など

【0003】

しかし、ＮＮの表現に必要なデータ量が膨大であるため、利用シーンによっては適用が困難な場合がある。多くの場合、このデータは、ニューロン間の接続を表現する「重み」と「バイアス」という２種類のパラメータで構成されている。重みは通常、入力値に対して何らかの線形変換（例えば、内積や畳み込み）を行うパラメータ、言い換えれば、ニューロンの入力に重みを付けるパラメータであり、バイアスは線形計算後に追加されるオフセット、言い換えれば、ニューロンが受信した重み付きメッセージの集計を相殺するものである。より具体的には、これらの重み、バイアス、およびＮＮの各層（最大数百）の潜在的に非常に多数のニューロン（最大数千万）の２つの間の各接続を特徴付けるさらなるパラメータが、特定のＮＮに関連するデータの主要部分を占有する。また、これらのパラメータは、典型的には、サイズの大きい浮動小数点の日付型から構成されている。これらのパラメータは通常、各層（レイヤー）の全パラメータを含む大きなテンソルとして表現される。アプリケーションで、関連するＮＮの頻繁な送信や更新が必要な場合、必要なデータレートが深刻なボトルネックとなる。したがって、ＮＮ表現の符号化サイズを縮小するために、これらのマトリックス（行列）の非可逆圧縮を行うことが有望なアプローチである。

【0004】

通常、パラメータテンソルは、ＮＮを完全に再構成して実行するために必要なすべてのデータ（上記のパラメータマトリックスなど）とさらなる特性（パラメータテンソルの次元、層（レイヤー）のタイプ、演算など）を運ぶコンテナ形式（ＯＮＮＸ（ＯｐｅｎＮｅｕｒａｌＮｅｔｗｏｒｋＥｘｃｈａｎｇｅ）、Ｐｙｔｏｒｃｈ、ＴｅｎｓｏｒＦｌｏｗなど）で格納される。

【0005】

機械学習予測因子、あるいは、代替的に言えば、ニューラルネットワークなどの機械学習モデルの送信／更新を、ＮＮ表現のコード化されたサイズ、計算上の推論の複雑さ、ＮＮ表現の記述または保存の複雑さを同時に低減しながら推論品質の保存の点でより効率的にする、あるいは現在よりも頻繁にＮＮの送信／更新を可能にする、あるいは目下の特定のタスク及び／又は特定のローカル入力データ統計の推論品質を改善するように、より効率的にする概念を手元に持つことは有利であろう。さらに、ニューラルネットワークの使用法が現在よりも効果的になるように、ニューラルネットワークに基づく予測を行う際のニューラルネットワーク表現、そのようなニューラルネットワーク表現の導出、およびそのようなニューラルネットワーク表現の使用法を提供することが有利であろう。

【発明の概要】

【発明が解決しようとする課題】

【0006】

従って、本発明の目的は、ニューラルネットワークの効率的な利用、及び／又は、ニューラルネットワークの効率的な送信及び／又は更新のための概念を提供することである。この目的は、本願の独立請求項の主題によって達成される。

【課題を解決するための手段】

【0007】

本発明による更なる実施形態は、本願の従属請求項の主題によって定義される。

【0008】

本願発明の第１の側面の基礎となる考え方は、ＮＮの表現が符号化されたデータストリームに直列化パラメータを符号化／復号化すれば、ニューラルネットワーク（ＮＮ）の使用効率が高くなる、というものである。直列化パラメータは、ＮＮのニューロン相互接続を定義するＮＮパラメータがデータストリームに符号化される符号化順序を示す。ニューロン相互接続は、ＮＮの異なるＮＮ層のニューロン間の接続を表現する場合がある。言い換えれば、ＮＮパラメータは、ＮＮの第１層に関連する第１ニューロンと、ＮＮの第２層に関連する第２ニューロンとの間の接続を定義する場合がある。復号化は、符号化順序を使用して、データストリームから連続的に復号化されたＮＮパラメータをニューロン相互接続に割り当てることができる。

【0009】

特に、直列化パラメータを用いることで、ビット列を意味のある連続したＮＮパラメータのサブセットに効率的に分割できることがわかった。直列化パラメータは、ＮＮの効率的な実行を可能にするＮＮパラメータのグループ化を示しているのかもしれない。これは、ＮＮのアプリケーションシナリオに依存して行われるかもしれない。異なるアプリケーションシナリオの場合、符号化は、異なる符号化順序を使用してＮＮパラメータを走査するかもしれない。したがって、ＮＮパラメータは、ＮＮのアプリケーションシナリオに依存する個々の符号化順序を使用して符号化することができ、復号化は、直列化パラメータによって提供される情報によって、復号化中にそれに応じてＮＮパラメータを再構成することができる。ＮＮパラメータは、１つ以上のパラメータマトリックス（行列）またはテンソルのエントリを表現する場合があり、パラメータマトリックスまたはテンソルは推論手続きに使用される場合がある。ＮＮの１つ以上のパラメータマトリックスまたはテンソルは、復号化されたＮＮパラメータと直列化パラメータに基づいて、復号化器によって効率的に再構成されることが判明している。

【0010】

このように、直列化パラメータは、異なるアプリケーション固有の符号化順序を使用することができ、効率を改善した柔軟な符号化および復号化を可能にする。例えば、異なる次元に沿ってパラメータを符号化すると、エントロピー符号化器がそれらの間の依存関係をよりよく捕らえることができるため、結果として圧縮性能に利益をもたらすことがある。別の例では、あるアプリケーション固有の基準、すなわち、入力データのどの部分に関連するか、あるいは、共同実行可能かどうかに従ってパラメータをグループ化し、並行して復号／入力できるようにすることが望ましい場合がある。さらなる例は、ドット積演算を実行する際に復号化されたパラメータの効率的なメモリ割り当てをサポートするＧＥＭＭ（ＧｅｎｅｒａｌＭａｔｒｉｘＭａｔｒｉｘ）積スキャン順序に従ってパラメータを符号化することである（ＡｎｄｒｅｗＫｅｒｒ、２０１７）。

【0011】

さらなる実施形態は、例えば、符号化されるＮＮパラメータのエネルギー圧縮を達成し、その後、結果の順序に従って結果の並べ替えデータを処理／直列化／符号化するために、データの符号化器側の選択並べ替えに向けられている。従って、並べ替えは、符号化順序に沿って着実に同じ増加または同じ減少をするように、パラメータを並べ替えることができる。

【0012】

本願の第２の側面によれば、本願の発明者は、ＮＮの表現が符号化されたデータストリームに／から数値計算表現パラメータを符号化／復号化すると、ニューラルネットワーク
（ＮＮ）の使用効率が高くなることに気付いた。数値計算表現パラメータは、データストリームに符号化されたＮＮのＮＮパラメータがＮＮを推論に用いる際に表現されるべき数値表現、例えば浮動小数点または固定小数点表現、およびビットサイズを示す。符号化器は、ＮＮパラメータを符号化するように構成される。復号化器は、ＮＮパラメータを復号化するように構成され、データストリーム、ＤＳから復号化されたＮＮパラメータを表現するために数値表現とビットサイズを使用するように構成されるかもしれない。

【0013】

本実施形態は、ＮＮパラメータと、ＮＮを用いた推論においてＮＮパラメータを使用した結果得られる活性化値とを、同じ数値表現とビットサイズで表現することが有利であるという考えに基づいている。数値計算表現パラメータに基づき、ＮＮパラメータの示された数値表現およびビットサイズと、活性化値の数値表現およびビットサイズの可能性を効率的に比較することが可能である。これは、数値計算表現パラメータが数値表現として固定小数点表現を示している場合に特に有利であると考えられる。なぜなら、ＮＮパラメータと活性化値の両方を固定小数点表現で表現することができれば、固定小数点演算により効率的に推論を行うことができるためである。

【0014】

本願の第３の態様によれば、本願の発明者は、ＮＮの表現が符号化されたデータストリームに／からＮＮ層タイプパラメータを符号化／復号化すると、ニューラルネットワークの使用効率が高くなることを実現した。ＮＮ層タイプパラメータは、ＮＮの所定のＮＮ層のＮＮ層タイプ（例えば、畳み込み層タイプまたは完全連結層タイプ）を示す。データストリームは、１つ以上の個別にアクセス可能な部分に構造化され、それぞれの個別にアクセス可能な部分は、ＮＮの対応するＮＮ層を表現している。所定のＮＮ層は、ニューラルネットワークのＮＮ層のうちの１つを表現する。任意選択で、ＮＮの２つ以上の所定のＮＮ層のそれぞれについて、ＮＮ層タイプパラメータがデータストリームに／から符号化／復号化され、ＮＮ層タイプパラメータは少なくともいくつかの所定のＮＮ層間で異なることが可能である。

【0015】

この実施形態は、例えば、パラメータテンソル／マトリックスの次元の意味を理解するために、データストリームがＮＮ層のＮＮ層タイプパラメータを含んでいることが有用であるかもしれないという考えに基づいている。さらに、データの依存性をよりよく捕捉し、より高い符号化効率につながるように、例えば、文脈（コンテキスト）モデルの異なるセットまたはモードを使用することによって、復号化が復号化前に知っておくべき重要な情報を符号化する際に、異なる層（レイヤー）が異なるように扱われることがある。

【0016】

同様に、ＮＮパラメータのパラメータタイプを示すタイプパラメータをデータストリームに符号化／復号化することが有利な場合がある。タイプパラメータは、ＮＮパラメータが重みを表現するかバイアスを表現するかを示すことができる。データストリームは、１つ以上の個別にアクセス可能な部分に構造化されており、それぞれの個別にアクセス可能な部分は、ＮＮの対応するＮＮ層を表現している。対応する所定のＮＮ層を表現する個別にアクセス可能な部分は、個別にアクセス可能なサブ部分にさらに構造化されるかもしれない。それぞれの個別にアクセス可能なサブ部分は、後続の個別にアクセス可能なサブ部分が符号化順序によって走査される前に、符号化順序によって完全に走査される。各個別にアクセス可能なサブ部分には、例えば、ＮＮパラメータとタイプパラメータが符号化され、復号化されることが可能である。最初の個別にアクセス可能なサブ部分のＮＮパラメータは、第２の個別にアクセス可能なサブ部分のＮＮパラメータと異なるパラメータタイプであっても、同じパラメータタイプであってもよい。同じＮＮ層に関連する異なるタイプのＮＮパラメータは、同じ個別にアクセス可能な部分に関連する異なる個別にアクセス可能なサブ部分へ符号化／から復号化されるかもしれない。パラメータタイプの区別は、例えば、パラメータのタイプごとに異なるタイプの依存性を使用できる場合、または並列復号化が望まれる場合などに、符号化／復号化にとって有益であり得る。例えば、同じＮ
Ｎ層に並列に関連付けられた異なるタイプのＮＮパラメータを符号化／復号化することが可能である。これにより、ＮＮパラメータの符号化／復号化の効率が向上し、また、エントロピー符号化器がＮＮパラメータ間の依存関係をよりよく捉えることができるため、結果として圧縮性能に有利となる場合がある。

【0017】

本願の第４の態様によれば、本願の発明者は、ＮＮの表現が符号化されたデータストリームにポインタを符号化／データストリームからポインタを復号化すると、ニューラルネットワークの送信／更新が非常に効率的になることを発見した。これは、データストリームが個別にアクセス可能な部分に構成され、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、ポインタがそれぞれの所定の個別にアクセス可能な部分の始まりを指し示しているためである。すべての個別にアクセス可能な部分が所定の個別にアクセス可能な部分である必要はないが、すべての個別にアクセス可能な部分が所定の個別にアクセス可能な部分を表現する可能性がある。１つ以上の所定の個別アクセス可能部分は、デフォルトで設定されるかもしれないし、データストリームに符号化されたＮＮのアプリケーションに依存して設定されるかもしれない。ポインタは、例えば、バイト単位のデータストリーム位置として、またはオフセット、例えばデータストリームの始まりに対して、またはそれぞれの所定の個別にアクセス可能な部分が属するＮＮ層に対応する部分の始まりに対するオフセットとして、それぞれの所定の個別にアクセス可能な部分の始まりを示す。このポインタは、データストリームのヘッダ部分に符号化／ヘッダ部分から復号化される場合がある。実施形態によれば、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、ポインタは、それぞれの所定の個別アクセス可能な部分がニューラルネットワークの対応するＮＮ層を表現する場合には、データストリームのヘッダ部分に符号化／復号化され、それぞれの所定の個別アクセス可能な部分がＮＮのＮＮ層を表現する場合には、ポインタがＮＮ層の対応する部分のパラメータセット部分に符号化／復号化されている。ＮＮのＮＮ層のＮＮ部分は、それぞれのＮＮ層のベースライン部分を表現するかもしれないし、あるいは、それぞれの層（レイヤー）のアドバンスド部分（ａｄｖａｎｃｅｄｓｅｃｔｉｏｎ）を表現するかもしれない。ポインタを用いることで、データストリームの所定の個別にアクセス可能な部分に効率的にアクセスすることができ、例えば、層（レイヤー）処理の並列化や、データストリームをそれぞれのコンテナ形式にパッケージ化することが可能となる。ポインタを利用することで、所定の個別にアクセス可能な部分へより簡単に、より速く、より適切にアクセスできるため、ＮＮの並列または部分的な復号化と実行を必要とするアプリケーションを容易にする。

【0018】

本願の第５の態様によれば、本願の発明者は、開始コード、ポインタ、及び／又はデータストリーム長パラメータが、ＮＮの表現が符号化されたデータストリームの個別にアクセス可能なサブ部分へ符号化／データストリームからサブ部分が復号化される場合、ニューラルネットワークの送信／更新が非常に効率化することを実現した。データストリームは、１つ以上の個別にアクセス可能な部分に構造化され、それぞれの個別にアクセス可能な部分は、ニューラルネットワークの対応するＮＮ層を表現している。さらに、データストリームは、１つ以上の所定の個別にアクセス可能な部分内で、個別にアクセス可能なサブ部分にさらに構造化され、それぞれの個別にアクセス可能なサブ部分は、ニューラルネットワークのそれぞれのＮＮ層の対応するＮＮ部分を表現している。装置は、１つ以上の所定の個別にアクセス可能なサブ部分のそれぞれについて、それぞれの所定の個別にアクセス可能なサブ部分が始まる開始コード、及び／又はそれぞれの所定の個別にアクセス可能なサブ部分の始まりを指すポインタ、及び／又はＤＳを解析する際にそれぞれの所定の個別にアクセス可能なサブ部分をスキップするためにそれぞれの所定の個別にアクセス可能なサブ部分のデータストリーム長を示すデータストリーム長パラメータを、データストリームに符号化して／データストリームから復号化するよう構成されている。開始コード、ポインタ、及び／又は、データストリーム長パラメータは、所定の個別にアクセス可能なサブ部分への効率的なアクセスを可能にする。これは、ＮＮパラメータを部分的にまた
は並行して復号／処理／入力させることが有益であるため、特定の構成可能な方法でＮＮ層内のＮＮパラメータのグループ化に依存し得るアプリケーションに特に有益である。したがって、個別にアクセス可能な部分への個別にアクセス可能なサブ部分ごとのアクセスは、必要なデータに並行してアクセスしたり、不要なデータ部分を除外したりするのに役立つ。また、それは、開始コードを用いて示すことで十分であることが判明した。これは、ＮＮ層ごとのデータ量、すなわち個別にアクセス可能な部分は、通常、ＮＮ層がデータストリーム全体の中で開始コードによって検出される場合よりも少ないという知見に基づくものである。それでも、個別にアクセス可能な部分へのアクセスを改善するために、ポインタ及び／又はデータストリーム長パラメータを使用することも有利である。実施形態によれば、データストリームの個別にアクセス可能な部分内の１つ以上の個別にアクセス可能なサブ部分は、個別にアクセス可能な部分のパラメータセット部分内のデータストリーム位置をバイトで示すポインタによって示される。データストリーム長パラメータは、個別にアクセス可能なサブ部分のラン長を示す場合がある。データストリーム長パラメータは、データストリームのヘッダ部分へ符号化／から復号化、または個別にアクセス可能な部分のパラメータセット部分へ符号化／から復号化されるかもしれない。データストリーム長パラメータは、１つ以上の個別にアクセス可能なサブ部分を適切なコンテナにパッケージする目的で、それぞれの個別にアクセス可能なサブ部分の切り出しを容易にするために使用されるかもしれない。実施形態によれば、データストリームを復号化する装置は、１つ以上の所定の個別にアクセス可能なサブ部分について、データストリームにアクセスするために、開始コード及び／又はポインタ及び／又はデータストリーム長パラメータを使用するように構成される。

【0019】

本願の第６の態様によれば、本願の発明者は、ＮＮの表現が符号化されているデータストリームに処理オプションパラメータが符号化／データストリームから処理オプションパラメータが復号化されると、ニューラルネットワークの使用効率が高くなることに気付いた。データストリームは、個別にアクセス可能な部分に構造化され、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、処理オプションパラメータは、ニューラルネットワークを推論に使用する際に使用しなければならない、または任意に使用することができる１つ以上の処理オプションを示す。処理オプションパラメータは、クライアントが個別にアクセス可能な部分（Ｐ）及び／又は個別にアクセス可能なサブ部分（ＳＰ）にアクセスするかどうか、およびどのようにアクセスするかを決定するさまざまな処理オプションのうちの１つの処理オプションを示す場合がある。例えば、Ｐ及び／又はＳＰのそれぞれについて、それぞれのＰまたはＳＰの並列処理能力及び／又はそれぞれのＰまたはＳＰのサンプル単位並列処理能力及び／又はそれぞれのＰまたはＳＰのチャネル単位並列処理能力及び／又はそれぞれのＰまたはＳＰの分類カテゴリ単位並列処理能力及び／又は他の処理オプションのようにである。処理オプションパラメータは、クライアントの適切な意思決定を可能にし、その結果、ＮＮの高効率な使用を可能にする。

【0020】

本願の第７の側面によれば、本願の発明者は、ＮＮパラメータを逆量子化するための再構成ルールが、ＮＮパラメータが属するＮＮ部分に依存する場合、ニューラルネットワークの送信／更新が高効率化することを発見した。ニューラルネットワークを表現するＮＮパラメータは、量子化インデックスに量子化されてデータストリームに符号化される。復号化するための装置は、例えば、再構成ルールを使用して、ＮＮパラメータを再構成するために量子化インデックスを逆量子化するように構成される。ＮＮパラメータは、ＮＮの異なるＮＮ部分のＮＮパラメータが異なるようにデータストリームに符号化され、データストリームは、ＮＮ部分のそれぞれについて、それぞれのＮＮ部分に関連するＮＮパラメータを逆量子化するための再構成ルールを示している。復号化するための装置は、ＮＮ部分のそれぞれについて、それぞれのＮＮ部分に関するデータストリームによって示される再構成ルールを使用して、それぞれのＮＮ部分におけるＮＮパラメータを逆量子化するように構成される。ＮＮ部分は、例えば、ＮＮの１つ以上のＮＮ層及び／又はＮＮの所定の
ＮＮ層が細分化されたＮＮ層の部分を含む。

【0021】

実施形態によれば、第１のＮＮ部分に関連するＮＮパラメータを逆量子化するための第１の再構成ルールは、第２のＮＮ部分に関連するＮＮパラメータを逆量子化するための第２の再構成ルールに対してデルタ符号化されてデータストリームに符号化される。第１のＮＮ部分は第１のＮＮ層からなり、第２のＮＮ部分は第２の層からなる可能性があり、第１のＮＮ層は第２のＮＮ層と異なる。あるいは、第１のＮＮ部分は第１のＮＮ層からなり、第２のＮＮ部分は第１のＮＮ層のうちの１つの部分からなる可能性がある。この代替例では、所定のＮＮ層の一部におけるＮＮパラメータに関連する再構成ルール、例えば第２の再構成ルールが、所定のＮＮ層に関連する再構成ルール、例えば第１の再構成ルールに対してデルタ符号化される。この再構成ルールの特別なデルタ符号化は、再構成ルールをシグナリングするために少数のビットしか使用しないことを可能にし、ニューラルネットワークの効率的な送信／更新をもたらすことができるかもしれない。

【0022】

本願の第８の態様によれば、本願の発明者は、ＮＮパラメータを逆量子化するための再構成ルールが、ＮＮパラメータに関連する量子化インデックスの大きさに依存する場合、ニューラルネットワークの送信／更新が非常に効率化されることに気付いた。ニューラルネットワークを表現するＮＮパラメータは、量子化インデックスに量子化されてデータストリームに符号化される。復号化するための装置は、例えば、再構成ルールを使用して、ＮＮパラメータを再構成するために量子化インデックスを逆量子化するように構成される。データストリームは、ＮＮパラメータを逆量子化するための再構成ルールを示すために、量子化ステップサイズを示す量子化ステップサイズパラメータと、量子化インデックス－再構成レベルマッピングを定義するパラメータセットと、を備える。所定のＮＮ部分におけるＮＮパラメータの再構成ルールは、所定のインデックス間隔（ｉｎｔｅｒｖａｌ、区間）内の量子化インデックスに対しては量子化ステップサイズにより定義され、所定のインデックス間隔外の量子化インデックスに対しては量子化インデックス－再構成レベルマッピングにより定義される。各ＮＮパラメータについて、例えば所定のインデックス間隔内の量子化インデックスに対応するそれぞれのＮＮパラメータは、それぞれの量子化インデックスに量子化ステップサイズを乗算することによって再構成され、例えば所定のインデックス間隔外の量子化インデックスに対応するそれぞれのＮＮパラメータは、それぞれの量子化インデックスを量子化インデックス－再構成レベルマッピングを用いて再構成レベル上にマッピングすることによって再構成される。復号化器は、データストリーム内のパラメータセットに基づいて量子化インデックス－再構成レベルマッピングを決定するように構成されるかもしれない。実施形態によれば、パラメータセットは、量子化インデックス－再構成レベルマッピングのセットのうちの１つの量子化インデックス－再構成レベルマッピングを指すことによって量子化インデックス－再構成レベルマッピングを定義し、量子化インデックス－再構成レベルマッピングのセットはデータストリームの一部でない可能性があり、例えば、符号化器側および復号化器側で保存される可能性がある。量子化インデックスの大きさに基づいて再構成ルールを定義すると、少ないビット数で再構成ルールのシグナリング（ｓｉｇｎａｌｌｉｎｇ、信号化）が可能となる。

【0023】

本願の第９の態様によれば、本願の発明者は、ＮＮの表現が符号化されたデータストリームの個別にアクセス可能な部分に識別パラメータを符号化／から識別パラメータを復号化すれば、ニューラルネットワークの送信／更新が非常に効率的になることに気付いた。データストリームは、個別にアクセス可能な部分に構造化され、１つ以上の所定の個別にアクセス可能な部分のそれぞれについて、それぞれの所定の個別にアクセス可能な部分を識別するための識別パラメータが、データストリームに符号化／データストリームから復号化されている。識別パラメータは、所定の個別にアクセス可能な部分のバージョンを示すかもしれない。これは、多くのクライアントが個別にＮＮをさらに学習し、相対的なＮＮの更新を中央のエンティティに送り返す分散学習のようなシナリオにおいて特に有利で
ある。識別パラメータは、バージョニング（バージョン管理）スキームによって個々のクライアントのＮＮを識別するために使用され得る。それによって、中央のエンティティは、ＮＮ更新が構築されているＮＮを識別することができる。追加的に、または代替的に、識別パラメータは、所定の個別にアクセス可能な部分が、ＮＮのベースライン部分と関連しているかどうか、またはＮＮのアドバンスドの／強化された／完全な部分と関連しているかどうかを示すかもしれない。これは、例えば、スケーラブルＮＮのようなユースケース（ｕｓｅｃａｓｅｓ）において有利であり、完全な結果を受け取るために完全なまたは強化されたＮＮが実行される前に、例えば、予備結果を生成するために、ＮＮのベースライン部分が実行され得る。さらに、ＮＮを表現するＮＮパラメータに基づいて再構成可能なパラメータテンソルの送信エラーまたは不随意の変化は、識別パラメータを使用して容易に認識可能である。識別パラメータにより、事前に決定された個別にアクセス可能な各部分が整合性をチェックし、ＮＮ特性に基づいて検証できる場合に操作をよりエラーロバストにすることができる。

【0024】

本願の第１０の態様によれば、本願の発明者は、デルタ符号化を用いて、または補償スキームを用いて、異なるバージョンのＮＮをデータストリームに符号化／データストリームから復号化すれば、ニューラルネットワークの送信／更新が非常に効率化されることに気付いた。データストリームは、ＮＮの異なるバージョンがデータストリームに符号化されるように、ＮＮの表現が層（レイヤー）方式で符号化されている。データストリームは、１つ以上の個別にアクセス可能な部分に構造化されており、それぞれの個別にアクセス可能な部分は、ＮＮの対応するバージョンに関連している。データストリームは、例えば、第１の部分に符号化されたＮＮの第１のバージョンは、第２の部分に符号化されたＮＮの第２のバージョンに対してデルタ符号化されている。追加的に、または代替的に、データストリームは、例えば、１つまたは複数の補償ＮＮ部分の形で第１の部分に符号化されたＮＮの第１のバージョンを有し、その各々は、ＮＮの第１のバージョンに基づいて推論を行うために、第２の部分に符号化されたＮＮの第２のバージョンの対応するＮＮ部分の実行に加えて実行され、それぞれの補償ＮＮ部分および対応するＮＮ部分の出力が合計される。データストリーム中のＮＮのこれらの符号化されたバージョンにより、クライアント、例えば、復号化器は、その処理能力を合わせることができ、または、第２のバージョン、例えば、より複雑な前進した（ａｄｖａｎｃｅｄ）ＮＮを処理する前に、第１のバージョン、例えば、ベースラインで最初に推論を行うことができるかもしれない。さらに、デルタ符号化及び／又は補償スキームを適用／使用することにより、ＮＮの異なるバージョンは、少ないビット数でＤＳに符号化されることができる。

【0025】

本願の第１１の態様によれば、本願の発明者は、ＮＮの表現が符号化されているデータストリームの個別にアクセス可能な部分に補足データを符号化／から補足データを復号化すると、ニューラルネットワークの使用効率が高くなることに気付いた。データストリームは、個別にアクセス可能な部分に構造化され、データストリームは、１つ以上の所定の個別にアクセス可能な部分の各々について、ＮＮの表現を補足するための補足データを含んでいる。この補足データは、通常、ＮＮの復号化／再構成／推論には必要ないが、アプリケーションの観点からは不可欠となり得る。したがって、この補足データを、唯一の推論を目的とするＮＮの復号化に無関係であるとマークして、補足データを必要としないクライアント、例えば復号化器が、データのこの部分をスキップできるようにすることが有利である。

【0026】

本願の第１２の態様によれば、本願の発明者は、ＮＮの表現が符号化されたデータストリームに、階層的制御データを符号化／復号化すれば、ニューラルネットワークの利用が非常に効率的になることに気がついた。データストリームは、制御データ部分のシーケンスに構造化された階層的制御データからなり、制御データ部分は、ＮＮに関する情報を制御データ部分のシーケンスに沿って詳細度を増して提供する。制御データを階層的に構造
化することは、復号化器があるレベルの態様までの制御データしか必要としない場合があり、したがって、さらなる態様を提供する制御データをスキップすることができるので有利である。このように、ユースケースと環境に関する知識に応じて、異なるレベルの制御データが必要となる場合があり、このような制御データを提示する前述の方式により、異なるユースケースに対して必要な制御データへの効率的なアクセスが可能となる。

【0027】

いくつかの態様を装置の文脈で説明してきたが、これらの態様は、ブロックまたは装置が方法ステップまたは方法ステップの特徴に対応する方法の説明も表していることは明らかである。実施形態は、コンピュータ上で実行されるとき、そのような方法を実行するためのプログラムコードを有するコンピュータプログラムに関する。

【0028】

本発明の実施形態は、従属請求項の主題である。本願発明の好ましい実施形態は、図に関して以下に説明される。図面は必ずしも縮尺通りではなく、代わりに一般に本発明の原理を説明することに重点が置かれている。以下の説明において、本発明の様々な実施形態が、以下の図面を参照して説明される。

【図面の簡単な説明】

【0029】

【図1】図１は、ニューラルネットワークを符号化／復号化するための符号化／復号化パイプラインの一例を示す図である。

【図2】図２は、実施形態の１つに従って符号化／復号化され得るニューラルネットワークを示す図である。

【図3】図３は、実施形態による、ニューラルネットワークの層のパラメータテンソルの直列化（シリアライゼーション）を示す図である。

【図4】図４は、実施形態による、ニューラルネットワークのパラメータがどのように直列化されるかを示すための直列化パラメータの使用法を示す図である。

【図5】図５は、単一出力チャネル畳み込み層の例を示す図である。

【図6】図６は、全連結層の例を示す図である。

【図7a】図７ａは、実施形態による、ニューラルネットワークパラメータが符号化され得るｎ個の符号化順序のセットを示す図である。

【図7b】図７ｂは、実施形態による、ニューラルネットワークパラメータが符号化され得るｎ個の符号化順序のセットを示す図である。

【図7c】図７ｃは、実施形態による、ニューラルネットワークパラメータが符号化され得るｎ個の符号化順序のセットを示す図である。

【図7d】図７ｄは、実施形態による、ニューラルネットワークパラメータが符号化され得るｎ個の符号化順序のセットを示す図である。

【図8】図８は、実施形態による、個別にアクセス可能な部分またはサブ部分の文脈適応型算術符号化を示す図である。

【図9】図９は、実施形態による、数値計算表現パラメータの使用法を示す図である。

【図10】図１０は、実施形態による、ニューラルネットワークのニューラルネットワーク層のニューラルネットワーク層タイプを示すニューラルネットワーク層タイプパラメータの使用法を示す図である。

【図11】図１１は、実施形態による、個別にアクセス可能な部分の始まりを指すポインタを有するデータストリームの一般的な実施形態を示す図である。

【図12】図１２は、実施形態による、個別にアクセス可能な部分の始まりを指すポインタを有するデータストリームの詳細な実施形態を示す図である。

【図13】図１３は、実施形態による、個別にアクセス可能なサブ部分へのアクセスを可能にするための、開始コード、及び／又はポインタ、及び／又はデータストリーム長パラメータの使用法を示す図である。

【図14a】図１４ａは、実施形態による、ポインタを用いたサブ層アクセスを示す図である。

【図14b】図１４ｂは、実施形態による、開始コードを使用したサブ層アクセスを示す図である。

【図15】図１５は、実施形態による、個別にアクセス可能な部分に対する可能な処理オプションとしてのランダムアクセスの例示的なタイプを示す図である。

【図16】図１６は、実施形態による、処理オプションパラメータの使用法を示す図である。

【図17】図１７は、実施形態による、ニューラルネットワーク部分依存再構成ルールの使用法を示す図である。

【図18】図１８は、実施形態による、量子化されたニューラルネットワークパラメータを表現する量子化インデックスに基づく再構成ルールの決定を示す図である。

【図19】図１９は、実施形態による、識別パラメータの使用法を示す図である。

【図20】図２０は、実施形態による、異なるバージョンのニューラルネットワークの符号化／復号化を示す図である。

【図21】図２１は、実施形態による、２つのバージョンのニューラルネットワークのデルタ符号化であり、２つのバージョンは、その重み及び／又はバイアスが異なることを示す図である。

【図22】図２２は、実施形態による、２つのバージョンのニューラルネットワークの代替デルタ符号化を示し、２つのバージョンは、ニューロンまたはニューロンの相互接続の数が異なっている。

【図23】図２３は、実施形態による、補償ニューラルネットワーク部分を使用するニューラルネットワークの異なるバージョンの符号化を示す図である。

【図24a】図２４ａは、実施形態による、補足データを有するデータストリームの一実施形態を示す。

【図24b】図２４ｂは、実施形態による、補足データを有するデータストリームの代替的な実施形態を示す。

【図25】図２５は、制御データ部分のシーケンスを有するデータストリームの一実施形態を示す図である。

【発明を実施するための形態】

【0030】

また、以下の説明では、異なる図に記載されている場合でも、同等または同等の機能を持つ要素には、同等または同等の参照数字を付している。

【0031】

以下の説明では、本発明の実施形態のより全体的な説明を提供するために、複数の詳細が記載されている。しかし、本発明の実施形態は、これらの特定の詳細なしに実施され得ることは、当業者には明らかであろう。他の例では、本発明の実施形態を不明瞭にしないために、周知の構造およびデバイスは、詳細ではなくブロック図の形態で示される。さらに、本明細書で後述する異なる実施形態の特徴は、特に断りのない限り、互いに組み合わせてもよい。

【0032】

以下の本願の実施形態の説明は、その利点と、同じものがこれらの利点をどのように達成するかを説明するために、本願の実施形態の簡単な紹介と概要から始まる。

【0033】

現在進行中のＮＮ圧縮に関するＭＰＥＧ活動で開発されたようなＮＮの符号化表現の現在の活動では、複数の層（レイヤー）方式のパラメータテンソルを表現するモデルビットストリームを、個々の層のパラメータテンソルの符号化表現を含むより小さなサブビットストリーム、すなわち層（レイヤー）ビットストリームに分けることが有益であることが見出された。これは、そのようなモデルビットストリームがコンテナ形式の文脈で保存／ロードされる必要がある場合、またはＮＮ層の並列復号化／実行を特徴とするアプリケーションシナリオで一般に役立つことができる。

【0034】

以下では、ニューラルネットワーク、ＮＮの効果的な圧縮を達成すること、及び／又はＮＮを表現するデータへのアクセスを改善し、したがってＮＮの効果的な送信／更新をもたらすことを支援し得る様々な例を説明する。

【0035】

本願の以下の実施例の理解を容易にするために、説明は、本願の後続の概略的な実施例が組み込まれ得る、それに適合する可能な符号化器及び復号化器の提示から始まる。

【0036】

図１は、ＤｅｅｐＣＡＢＡＣによる符号化／復号化パイプラインの簡単なスケッチ例を示し、このような圧縮スキームの内部動作を説明するものである。まず、ニューロン１４、２０及び／又は１８間、例えば先行ニューロン１４₁～１４₃と中間ニューロン２０₁、
２０₂との間の接続２２、例えば接続２２₁～２２₆の重み３２、例えば重み３２₁～３２₆
が、本例ではマトリックス３０として示されているテンソルに形成される（図１のステップ１）。図１のステップ１では、例えば、ニューラルネットワーク１０、ＮＮの第１層に関連する重み３２が、マトリックス３０に形成される。図１に示す実施形態によれば、マトリックス３０の列は先行ニューロン１４₁～１４₃に関連付けられ、マトリックス３０の行は中間ニューロン２０₁、２０₂に関連付けられるが、形成されたマトリックスは代替的に図示のマトリックス３０の反転を表現することができることは明らかである。

【0037】

次に、各ＮＮパラメータ、例えば重み３２は、ステップ２及び３に示すように、文脈（ｃｏｎｔｅｘｔ）適応型算術符号化６００を用いて、特定の走査順序、例えば行優先順（左から右、上から下）に従って符号化、例えば量子化及びエントロピ符号化される。以下により詳細に概説するように、異なる走査順序、すなわち符号化順序を使用することも可能である。ステップ２および３は、符号化器４０、すなわち符号化するための装置によって実行される。復号化器５０、すなわち復号化のための装置は、逆の処理順序のステップで同じプロセスに従う。すなわち、まず、ステップ４に示すように、符号化された値の整数表現のリストを復号化し、次に、ステップ５に示すように、そのリストをそのテンソル表現３０’に再形成する。最後に、ステップ６に示すように、テンソル３０’をネットワークアーキテクチャ１０’、すなわち再構築されたＮＮにロードする。再構成されたテンソル３０’は、再構成されたＮＮパラメータ、すなわち復号化されたＮＮパラメータ３２’を構成している。

【0038】

図１に示すＮＮ１０は、少数のニューロン１４、２０、１８を有する単純なＮＮに過ぎない。ニューロンは、以下において、ノード、要素、モデル要素、または次元としても理解される。さらに、参照符号１０は、機械学習（ＭＬ）予測器、言い換えれば、ニューラルネットワークのような機械学習モデルを示す。

【0039】

図２を参照しながら、ニューラルネットワークをより詳細に説明する。特に、図２は、入力ノード又は要素１４を有する入力インターフェース１２と、出力ノード又は要素１８を有する出力インターフェース１６とを備えるＭＬ予測器１０を示す。入力ノード／要素１４は、入力データを受信する。言い換えれば、入力データはそこに適用される。例えば、それらは、例えば、各要素１４がピクチャのピクセルと関連付けられているピクチャを受け取ることができる。あるいは、要素１４上に適用される入力データは、オーディオ信号、センサ信号などの一次元信号のような信号であってもよい。さらに代替的に、入力データは、医療ファイルデータなどの特定のデータセットを表現するものであってもよい。入力要素１４の数は、任意の数であってよく、例えば、入力データのタイプに依存する。出力ノード１８の数は、図１に示すように１つであってもよいし、図２に示すように１つよりも多くてもよい。各出力ノードまたは要素１８は、特定の推論または予測タスクと関連付けられてもよい。特に、ＭＬ予測器１０がＭＬ予測器１０の入力インターフェース１２上に適用されたある入力上に適用されると、ＭＬ予測器１０は、各出力ノード１８で生
じる活性化、すなわち活性化値が、例えば、入力された画像が車、人、相などのあるオブジェクトを含むか否かなどのある特徴を有するか否か、またはどの程度ありそうかなどの入力データに関するある質問に対する答えを示すことができる推論または予測結果を出力インターフェース１６において出力する。

【0040】

この点で、入力インターフェースに適用される入力は、活性化、すなわち各入力ノードまたは要素１４に適用される活性化として解釈されることもある。

【0041】

入力ノード１４と出力ノード（複数可）１８との間で、ＭＬ予測器１０は、さらなる要素またはノード２０を含み、これらは、これらの先行ノードから活性化を受け取るように先行ノードに接続２２を介して、また、ノード２０の活性化、すなわち活性化値を後継ノードに転送するために後継ノードに一つ以上のさらなる接続２４を介して接続される。

【0042】

先行ノードは、ＭＬ予測器１０の他の内部ノード２０であってもよく、それを介して、図２に例示的に示される中間ノード２０が間接的に入力ノード１４に接続されてもよく、又は図１に示されるように、直接的に入力ノード１４に接続されてもよく、後継ノードは、ＭＬ予測器１０の他の中間ノードであってもよく、それを介して、例示的に示される中間ノード２０が出力インターフェース又は出力ノードに接続されるか、又は図１に示されるように、直接的に出力ノード２８に接続されてもよい。

【0043】

ＭＬ予測器１０の入力ノード１４、出力ノード１８及び内部ノード２０は、ＭＬ予測器１０の特定の層（レイヤー）に関連付けられ又は帰属することができるが、ＭＬ予測器１０の層構造化は任意であり、本願の実施形態が適用されるＭＬ予測器は、このような層状（レイヤー状）ネットワークに制限されない。ＭＬ予測器１０の例示的に示された中間ノード２０に関する限り、同じものは、入力インターフェース１２から接続２２を介して受け取った先行ノードから接続２４を介して出力インターフェース１６に向かって後継ノードに活性化、すなわち活性化値を転送することによってＭＬ予測器１０の推論又は予測タスクに貢献する。その際、ノードまたは要素２０は、入力ノード２２における活性化、すなわち活性化値に基づいて、接続２４を介して後継ノードに向けて転送されるその活性化、すなわち活性化値を計算し、その計算は、それぞれの先行ノードから受け取った入力、すなわちその活性化と、それぞれの先行ノードおよび中間ノード２０を接続する接続２２に関連する重みとの積であるそれぞれの接続２２に対する加重和すなわち加算を有する和を計算することを含む。代替的にまたはより一般的に、活性化ｘは、ノードまたは要素ｉ、２０から接続２４を介して、マッピング関数ｍ_ij（ｘ）によって後継ノードｊの方へ転送されることに留意されたい。したがって、接続２４と同様に各接続２２も、それに関連するある種の重み、または代替的に、マッピング関数ｍ_ijの結果を有することができる。ノード２０が特定の後継ノードに向かって出力する活性化における計算には、任意に、さらなるパラメータが関与していてもよい。ＭＬ予測器１０の部分に対する関連性スコアを決定するために、入力インターフェース１２におけるある入力に対するある予測または推論タスクを終了したときに出力ノード１８において生じる活性化、または関心のある予め定義されたまたは興味深い出力活性化が使用されてもよい。各出力ノード１８におけるこの活性化は、関連性スコア決定のための出発点として使用され、関連性は、入力インターフェース１２に向かって誤差逆伝播（ｂａｃｋｐｒｏｐａｇａｔｅｄ）される。特に、ノード２０のようなＭＬ予測器１０の各ノードにおいて、関連性スコアは、ノード２０の場合には接続２２を介してのような先行ノードに向かって分配され、各先行ノードに関連する前述の積に比例する方法で分配され、加重和を介して、ノード２０などの誤差逆伝播される活性化である現在のノードの活性化に対して寄与している。すなわち、ノード２０などのあるノードからそのある先行ノードに誤差逆伝播される関連性率は、そのノードの関連性に、その先行ノードから受信した活性化とその活性化が前述のそれぞれのノードの合計に寄与した重みとの比率に応じた係数を乗じ、先行ノードの活性化とこれらの活性化
がその誤差逆伝播されるべき現在のノードの加重合計に寄与した重みとのすべての積の合計に応じた値で割ることによって計算されうる。

【0044】

上記の方法において、ＭＬ予測器１０の部分に対する関連性スコアは、例えば、ＭＬ予測器によって実行される１つ以上の推論においてそれ自体が現れるようなこれらの部分の活性化に基づいて決定される。このような関連性スコアが決定される「部分」は、上述したように、予測器１０のノードまたは要素であってよく、ここで、再び、例えば、要素２０は、例えば、予測器１０によって行われる推論または予測中に計算されるような中間値の任意の計算であってよいように、ＭＬ予測器１０は任意の層状（レイヤー状）ＭＬネットワークに制限されないことに留意されたい。例えば、上で議論された方法で、要素またはノード２０の関連性スコアは、このノードまたは要素２０がその後継ノード／要素から受け取るインバウンド関連性メッセージを集約または合計することによって計算され、その後継ノード／要素は、順に、ノード２０に関して代表的に上で概説した方法でその関連性スコアを分配する。

【0045】

図２に関して説明したＭＬ予測器１０、すなわちＮＮは、図１に関して説明した符号化器４０を用いてデータストリーム４５に符号化され、図１に関して説明した復号化器５０を用いてデータストリーム４５から再構成／復号化される。

【0046】

以下に説明する特徴及び／又は機能は、図１に関して説明した圧縮スキームで実装することができ、図１および図２に関して説明したＮＮに関連する。

【0047】

１パラメータテンソルの直列化
ビットストリームのサブ層（レイヤー）単位処理が有効なアプリケーションが存在する。例えば、層（レイヤー）が独立したサブセット、例えば別々に学習（ｔｒａｉｎｅｄ、訓練）されたベースライン部分とアドバンスド部分（ａｄｖａｎｃｅｄｐｏｒｔｉｏｎ）とに構成され、クライアントがベースライン層のサブセットのみまたはアドバンスド層のサブセット（ａｄｖａｎｃｅｄｌａｙｅｒｓｕｂｓｅｔ）を追加で実行することを決定できる方法で、利用可能なクライアントの計算能力に適応するＮＮが存在する（Ｔａｏ、２０１８年）。別の例としては、データチャンネル固有の操作を特徴とするＮＮ、例えば、操作を例えばカラーチャンネルごとに別々に並列に実行できる画像処理ＮＮの層がある（Ｃｈｏｌｌｅｔ，２０１６）。

【0048】

上記の目的のために、図３を参照すると、層のパラメータテンソル３０の直列化１００₁または１００₂は、例えば、エントロピー符号化の前に、アプリケーションの観点から意味のある連続したサブセット４３₁から４３₃、または４４₁と４４₂に容易に分割できるビットストリング４２₁または４２₂を要求している。これは、チャネル１００₁ごとまたは
サンプル１００₂ごとのすべてのＮＮパラメータ、例えば重み３２のグループ化、または
ベースライン対アドバンスド部分のニューロンのグループ化を含むことができる。そのようなビットストリングは、その後、機能的関係を有するサブ層ビットストリームを形成するためにエントロピー符号化することができる。

【0049】

図４に示すように、直列化パラメータ１０２は、データストリーム４５に符号化／データストリーム４５から復号化することができる。直列化パラメータは、ＮＮパラメータ３２がＮＮパラメータ３２の符号化の前または符号化時にどのようにグループ化されるかを示すことができる。直列化パラメータ１０２は、ＮＮパラメータのデータストリーム４５への符号化を可能にするために、パラメータテンソル３０のＮＮパラメータ３２がビットストリームに直列化される方法を示す。

【0050】

一実施形態では、直列化情報、すなわち直列化パラメータ１０２は、ビットストリーム
、すなわちデータストリーム４５のパラメータセット部分１１０に、層の範囲で示され、例えば図１２、１４ａ、１４ｂまたは２４ｂを参照されたい。

【0051】

別の実施形態は、パラメータテンソル３０（図１及び図７の符号化順序１０６₁を参照
）の次元３４₁及び３４₂を直列化パラメータ１０２として信号化する。この情報は、例えば、パラメータマトリックス、すなわちパラメータテンソル３０のエントリ、すなわち重み３２と、サンプル１００₂及び色チャンネル１００₁との間の明確な関連性を有する例示的な画像処理ＮＮについて、図３に示されるように、効率的な実行を可能にするために、パラメータの復号化リストがそれぞれの方法で、例えばメモリ内でグループ化／編成されるべき場合において有用であり得る。図３は、２つの異なる直列化モード１００₁及び１
００₂と、結果として生じるサブ層４３及び４４の例示的な説明図である。

【0052】

さらなる実施形態では、図４に示すように、ビットストリーム、すなわちデータストリーム４５は、符号化器４０がＮＮパラメータ３２、例えば層（レイヤー）、ニューロン、テンソルを走査した順序１０４を、復号化器５０が復号化中にそれに応じてＮＮパラメータ３２を再構成できるように指定する。符号化器４０および復号化器５０の説明については図１を参照されたい。すなわち、ＮＮパラメータ３２の異なる走査順序３０₁、３０₂は、異なるアプリケーションシナリオにおいて適用され得る。

【0053】

例えば、異なる次元に沿ってパラメータを符号化することは、エントロピー符号化器がそれらの間の依存関係をよりよく捕らえることができるかもしれないので、結果として生じる圧縮性能に利益をもたらすかもしれない。別の例では、あるアプリケーション特有の基準、すなわち、それらが入力データのどの部分に関連するか、またはそれらが共同で実行できるかどうかに従ってパラメータをグループ化し、それらが並行して復号化／入力されるようにすることが望ましい場合がある。さらなる例は、ドット積演算を実行する際に復号化されたパラメータの効率的なメモリ割り当てをサポートするＧＥＭＭ（ＧｅｎｅｒａｌＭａｔｒｉｘＭａｔｒｉｘ）積スキャン順序に従ってパラメータを符号化することである（ＡｎｄｒｅｗＫｅｒｒ、２０１７）。

【0054】

さらなる例は、例えば、符号化されるべきＮＮパラメータ３２のエネルギー圧縮を達成し、その後、結果として生じる順序１０４に従って結果として並び替えられたデータを処理／直列化／符号化するために、例えば、図７の符号化順序１０６₄によって示されるデ
ータの符号化器側の選択並べ替えに関連するものである。並び替えは、したがって、符号化順序１０４に沿って着実に同じ増加または同じ減少をするように、ＮＮパラメータ３２を並べ替えるものでもよい。

【0055】

図５は、例えば、画像及び／又はビデオ分析アプリケーションのための、単一出力チャンネル畳み込み層についての例を示す。カラー画像は複数のチャネルを有し、典型的には、赤、緑、青などの各色チャネルに対して１つである。データの観点からは、モデルへの入力として提供される１つの画像は、実際には３つの画像であることを意味する。

【0056】

テンソル３０ａは、入力データ１２に適用され、一定のステップサイズでウィンドウのように入力上を走査することができる。テンソル３０ａは、フィルタとして理解される。テンソル３０ａは入力データ１２を左から右へ移動し、それぞれ通過後に次の下位行へジャンプする。オプションのいわゆるパディング（ｐａｄｄｉｎｇ）は、テンソル３０ａが入力マトリックスのエッジにぶつかったときにどのように振る舞うべきかを決定する。テンソル３０ａは、その視野内の各点に対して、ＮＮパラメータ３２、例えば固定重み（ｆｉｘｅｄｗｅｉｇｈｔｓ）を有し、例えば、現在の視野内の画素値とこれらの重みから結果マトリックス（ｒｅｓｕｌｔｍａｔｒｉｘ）を計算する。この結果マトリックスの大きさは、テンソル３０ａの大きさ（カーネルサイズ）、パディング、特にステップサイ
ズに依存する。入力画像は３チャンネル（例えば深度３）を有し、次にその画像に適用されるテンソル３０ａも、例えば３チャンネル（例えば深度３）を有する。入力１２の深さとテンソル３０ａの深さにかかわらず、テンソル３０ａは、単一の値をもたらすドット積演算を用いて、入力１２に適用される。

【0057】

デフォルトで、ＤｅｅｐＣＡＢＡＣは、任意の与えられたテンソル３０ａをそのそれぞれのマトリックス３０ｂの形式に変換し、図５に示すように、行長順１０４₁で、すなわ
ち、左から右、上から下へとＮＮパラメータ３２をデータストリーム４５に符号化３する。しかし、図７に関して説明するように、他の符号化順序１０４／１０６は、高い圧縮を達成するために有利であるかもしれない。

【0058】

図６は、完全連結層の場合の例である。完全連結層又は密な層は、通常のニューラルネットワーク構造であり、全てのニューロンは、全ての入力１２、すなわち先行ノード、及び全ての出力１６’、すなわち後継ノードに接続される。テンソル３０は、対応するＮＮ層を表現し、テンソル３０は、ＮＮパラメータ３２を含む。ＮＮパラメータ３２は、符号化順序１０４に従ってデータストリームに符号化される。図７に関して説明するように、特定の符号化順序１０４／１０６は、高い圧縮を達成するために有利であろう。

【0059】

ここで、説明は図４に戻り、ＮＮパラメータ３２の直列化の一般的な説明を可能にする。図４に関して説明した概念は、図５を参照する単一出力チャネル畳み込み層と、図６を参照する完全連結層の両方に適用可能である。

【0060】

図４に示すように、本願の実施形態Ａ１は、ニューラルネットワーク（ＮＮ）の表現が符号化されたデータストリーム４５（ＤＳ）に関するものである。データストリームは、ニューラルネットワークのニューロン相互接続を定義するＮＮパラメータ３２がデータストリーム４５に符号化される符号化順序１０４を示す直列化パラメータ１０２を含んでいる。

【0061】

実施形態ＺＡ１によれば、ニューラルネットワークの表現をＤＳ４５に符号化するための装置は、ニューラルネットワークのニューロン相互接続を定義するＮＮパラメータ３２がデータストリーム４５に符号化される符号化順序１０４を示す直列化パラメータ１０２をデータストリーム４５に提供するように構成される。

【0062】

実施形態ＸＡ１によれば、ＤＳ４５からニューラルネットワークの表現を復号化するための装置は、例えば、ニューラルネットワークのニューロン相互接続を定義するＮＮパラメータ３２がデータストリーム４５に符号化される符号化順序１０４を示す直列化パラメータ１０２をデータストリーム４５から復号化し、符号化順序１０４を使用してＤＳ４５から直列に復号化したＮＮパラメータ３２をニューロン相互接続に割当てるように構成される。

【0063】

図４は、ＮＮ層に関連付けられたＮＮパラメータ３２を有するＮＮ層の異なる表現を示している。実施形態によれば、２次元テンソル３０₁、すなわちマトリックス、または３
次元テンソル３０₂が、対応するＮＮ層を表現することができる。

【0064】

以下では、異なる特徴及び／又は機能性をデータストリーム４５の文脈で説明するが、特徴及び／又は機能性は、同じようにまたは同様に、実施形態ＺＡ１による装置の、または実施形態ＸＡ１による装置の、特徴及び／又は機能性であることも可能である。

【0065】

実施形態Ａ２によれば、先の実施形態Ａ１のＤＳ４５のうち、ＮＮパラメータ３２は、例えば図１及び図８を参照すると、文脈適応型算術符号化６００を用いてＤＳ４５に符号
化される。したがって、実施形態ＺＡ１による装置は、文脈適応型算術符号化６００を用いてＮＮパラメータ３２を符号化するように構成することができ、実施形態ＸＡ１による装置は、文脈適応型算術復号化を用いてＮＮパラメータ３２を復号化するように構成することができる。

【0066】

実施形態Ａ３によれば、実施形態Ａ１またはＡ２のＤＳ４５のうち、データストリーム４５は、図８または以下の図の１つに示すように、１つ以上の個別にアクセス可能な部分２００に構造化され、それぞれの個別にアクセス可能な部分２００は、ニューラルネットワークの対応するＮＮ層２１０を表現しており、直列化パラメータ１０２は、所定のＮＮ層２１０内のニューラルネットワークのニューロン相互接続を定義するＮＮパラメータ３２がデータストリーム４５に符号化される符号化順序１０４を示す。

【0067】

実施形態Ａ４によれば、先の任意の実施形態Ａ１～Ａ３のＤＳ４５のうち、直列化パラメータ１０２は、例えば図７に示すように、ｎ個の符号化順序のセット１０８のうち符号化順序１０４を示すｎ－ａｒｙパラメータである。

【0068】

実施形態Ａ４ａによれば、実施形態Ａ４のＤＳ４５のうち、ｎ個の符号化順序のセット１０８は、以下を含む。
所定の符号化命令１０４がＮＮの所定のＮＮ層を記述するテンソル３０の次元、例えば、ｘ次元、ｙ次元及び／又はｚ次元を走査する（トラバースする、ｔｒａｖｅｒｓｅ）順序において異なる第１の所定の符号化順序１０６₁；及び／又は、
ＮＮのスケーラブルな符号化のために、所定の符号化順序１０４がＮＮの所定のＮＮ層を走査する回数１０７が異なる第２の所定の符号化順序１０６₂；及び／又は、
所定の符号化順序１０４がＮＮのＮＮ層２１０を走査する順序が異なる第３の所定の符号化順序１０６₃；及び／又は、
ＮＮのＮＮ層のニューロン２０を走査する順序が異なる第４の所定の符号化順序１０６₄。

【0069】

第の所定の符号化順序１０６₁は、例えば、ＮＮパラメータ３２の符号化時にテンソル
３０の個々の次元がどのように走査されるかが互いに異なる。例えば、符号化順序１０４₁は、符号化順序１０４₂と異なっている。つまり、符号化順序１０４₁は、行長順、すな
わち、行が左から右へ、上から下へ行順にテンソル３０が走査され、所定の符号化順序１０４₂は、列長順、すなわち、列が上から下へ、左から右へ列順にテンソル３０が走査さ
れる。同様に、第１の所定の符号化順序１０６₁は、所定の符号化順序１０４が３次元テ
ンソル３０の次元を走査する順序において異なることができる。

【0070】

第２の所定の符号化順序１０６₂は、例えばテンソル／マトリックス３０によって表現
されるＮＮ層が走査される頻度において異なる。ＮＮ層は、例えば、所定の符号化順序１０４を２回走査されることができ、それによって、ＮＮ層のベースライン部分とアドバンスド部分が、データストリーム４５に符号化／データストリーム４５から復号化されることができる。ＮＮ層が所定の符号化順序によって走査される回数１０７は、データストリームに符号化されるＮＮ層のバージョンの数を定義する。したがって、ＮＮ層を少なくとも２回走査する符号化順序を示す直列化パラメータ１０２の場合、復号化器は、ＮＮ層のどのバージョンを復号化することができるかをその処理能力に基づいて決定し、選択したＮＮ層バージョンに対応するＮＮパラメータ３２を復号化するように構成される。

【0071】

第３の所定の符号化順序１０６₃は、ＮＮ１０の異なるＮＮ層２１０₁及び２１０₂に関
連するＮＮパラメータが、ＮＮ１０の１つ以上の他のＮＮ層２１０と異なる所定の符号化順序又は同じ符号化順序を用いて、データストリーム４５に符号化されるかどうかを定義している。

【0072】

第４の所定の符号化順序１０６₄は、対応するＮＮ層を表現するテンソル／マトリクス
３０を左上のＮＮパラメータ３２₁から右下のＮＮパラメータ３２₁₂まで斜めに千鳥に走
査する所定の符号化順序１０４₃を含む。

【0073】

実施形態Ａ４ａによれば、任意の先の実施形態Ａ１～Ａ４ａのＤＳ４５のうち、直列化パラメータ１０２は、符号化順序１０４がデフォルト順序に対してＮＮ層のニューロンを順列化するのに用いる順列を示す。言い換えれば、直列化パラメータ１０２は、順列を示し、順列の使用時に、符号化順序１０４は、デフォルト順序に対してＮＮ層のニューロンを順列化する。第４の所定の符号化順序１０６₄について図７に示されるように、データ
ストリーム４５₀について図示されるような行長順序は、デフォルト順序を表現する。他
のデータストリーム４５は、デフォルト順序に対する順列を使用してその中に符号化されたＮＮパラメータを含んでいる。

【0074】

実施形態Ａ４ｂによれば、実施形態Ａ４ａのＤＳ４５のうち、順列は、ＮＮパラメータ３２が符号化順序１０４に沿って単調に増加するように、または符号化順序１０４に沿って単調に減少するように、ＮＮ層２１０のニューロンを順序付ける。

【0075】

実施形態Ａ４ｃによれば、実施形態Ａ４ａのＤＳ４５のうち、順列は、直列化パラメータ１０２によって信号化可能な所定の符号化順序１０４のうち、ＮＮパラメータ３２をデータストリーム４５に符号化するためのビットレートが直列化パラメータ１０２によって示される順列に対して最低であるように、ＮＮ層２１０のニューロンを順列化させる。

【0076】

実施形態Ａ５によれば、任意の先の実施形態Ａ１～Ａ４ｃのＤＳ４５のうち、ＮＮパラメータ３２は、重みとバイアスを含む。

【0077】

実施形態Ａ６によれば、任意の先の実施形態Ａ１～Ａ５のＤＳ４５のうち、データストリーム４５は、個別にアクセス可能なサブ部分４３／４４に構造化され、それぞれのサブ部分４３／４４は、ニューラルネットワーク１０の対応するＮＮ部分、例えばＮＮ層２１０の一部を表現するので、後続のサブ部分４３／４４が符号化順序１０４によって走査される前に各サブ部分４３／４４は、符号化順序１０４によって完全に走査される。ＮＮ層を表現するテンソル３０の行、列、またはチャネルは、個別にアクセス可能なサブ部分４３／４４に符号化されるかもしれない。同じＮＮ層に関連する異なる個別にアクセス可能なサブ部分４３／４４は、異なるニューロン１４／１８／２０又は同じＮＮ層に関連するニューロン相互接続２２／２４を含む。個別にアクセス可能なサブ部分４３／４４は、テンソル３０の行、列又はチャネルを表現する。個別にアクセス可能なサブ部分４３／４４は、例えば、図３に示されている。あるいは、図２１から図２３に示すように、個別にアクセス可能なサブ部分４３／４４は、ＮＮ層のベースライン部分およびＮＮ層のアドバンスド部分のように、ＮＮ層の異なるバージョンを表現する。

【0078】

実施形態Ａ７によれば、実施形態Ａ３およびＡ６のいずれかのＤＳ４５のうち、ＮＮパラメータ３２は、任意の個別にアクセス可能な部分２００またはサブ部分４３／４４の始まり２０２において、文脈適応型算術符号化６００を用いて、かつ、文脈初期化を用いてＤＳ４５にコーディングされる。例えば、図８を参照されたい。

【0079】

実施形態Ａ８によれば、実施形態Ａ３およびＡ６のいずれかのＤＳ４５のうち、データストリーム４５は、それぞれの個別にアクセス可能な部分２００またはサブ部分２４０が始まる開始コード２４２、及び／又は、それぞれの個別にアクセス可能な部分２００またはサブ部分２４０の始まりを指すポインタ２２０／２４４、及び／又は、ポインタデータストリーム長、すなわち、図１１から図１４に示すように、ＤＳ４５を解析する際にそれ
ぞれの個別にアクセス可能な部分２００またはサブ部分２４０をスキップするための、それぞれの個別にアクセス可能な部分２００またはサブ部分２４０のデータストリーム長２４６を示すパラメータである。

【0080】

別の実施形態は、ビットストリーム、すなわちデータストリーム４５における復号化されたパラメータ３２’のビットサイズおよび数値表現を特定する。例えば、実施形態は、復号化されたパラメータ３２’が８ビット符号付き固定小数点フォーマットで表現され得ることを特定し得る。この指定は、例えば、活性化値も例えば８ビット固定小数点表現で表現することが可能なアプリケーションにおいて、その後、固定小数点演算により推論をより効率的に実行することができるので、非常に有用である。

【0081】

実施形態Ａ９によれば、先の実施形態Ａ１～Ａ８のいずれかのＤＳ４５の、ＮＮを推論に用いる際にＮＮパラメータ３２を表現する数値表現およびビットサイズを示す数値計算表現パラメータ１２０をさらに含む。例えば、図９を参照されたい。

【0082】

図９は、ニューラルネットワークの表現が符号化されたデータストリーム４５の実施形態Ｂ１を示し、データストリーム４５は、ＤＳ４５に符号化されているＮＮのＮＮパラメータ３２が、推論のためにＮＮを使用するときに表現されるべき数値表現、例えば浮動小数点、固定小数点表現、およびビットサイズを示す数値計算表現パラメータ１２０を含んでいる。

【0083】

対応する実施形態ＺＢ１は、ニューラルネットワークの表現をＤＳ４５に符号化するための装置に関するものであり、装置は、ＤＳ４５に符号化されるＮＮのＮＮパラメータ３２が、推論のためにＮＮを用いるときに、表現される数値表現、例えば浮動小数点、固定小数点表現およびビットサイズを示す数値計算表現パラメータ１２０をデータストリーム４５に与えるように構成される。

【0084】

対応する実施形態ＸＢ１は、ＤＳ４５からニューラルネットワークの表現を復号化するための装置に関するものである。装置は、データストリーム４５から、数値表現、例えば、ＤＳ４５に符号化されたＮＮのＮＮパラメータ３２が、ＮＮを推論に使用する際に、表現される浮動小数点、固定小数点表現、およびビットサイズを示す数値計算表現パラメータ１２０を復号化するように構成されており、ＤＳ４５から復号化されたＮＮパラメータ３２を表現するために数値表現およびビットサイズを任意選択的に使用するように構成されている。

【0085】

以下では、異なる特徴及び／又は機能性をデータストリーム４５の文脈で説明するが、特徴及び／又は機能性はまた、同じようにまたは同様に、実施形態ＺＢ１による装置の特徴及び／又は機能性、あるいは実施形態ＸＢ１による装置の特徴及び／又は機能性でありうる。

【0086】

さらなる実施形態は、層（レイヤー）内のパラメータタイプを信号化する。ほとんどの場合、層は、重みとバイアスの２種類のパラメータ３２によって構成される。これら２種類のパラメータの区別は、例えば、符号化中にそれぞれ異なる種類の依存関係が使用された場合、または並列復号化が望まれる場合などに、復号化の前に有益であり得る。

【0087】

実施形態Ａ１０によれば、先の実施形態Ａ１～Ｂ１のいずれかのＤＳ４５のうち、データストリーム４５は、個別にアクセス可能なサブ部分４３／４４に構造化される。それぞれのサブ部分４３／４４は、ニューラルネットワークの対応するＮＮ部分、例えばＮＮ層の一部を表現し、それぞれのサブ部分４３／４４は、後続のサブ部分４３／４４が符号化順序１０４によって走査される前に符号化順序１０４によって完全に走査され、データス
トリーム４５は、所定のサブ部分について、所定のサブ部分に符号化されるＮＮパラメータ３２のパラメータタイプを示すタイプパラメータを含む。

【0088】

実施形態Ａ１０ａによれば、実施形態Ａ１０のＤＳのうち、タイプパラメータは、少なくとも、ＮＮ重みとＮＮバイアスとを識別する。

【0089】

最後に、さらなる実施形態は、ＮＮパラメータ３２が含まれる層２１０のタイプ、例えば、畳み込みまたは完全連結を信号化する。この情報は、例えば、パラメータテンソル３０の次元の意味を理解するために有用であり得る。例えば、２ｄ畳み込み層の重みパラメータは、４ｄテンソル３０として表現されてもよく、ここで、第１の次元はフィルタの数、第２の次元はチャネルの数、残りはフィルタの２ｄ空間次元を指定する。さらに、異なる層２１０は、データ内の依存性をよりよく捕捉し、より高い符号化効率を導くために（例えば、文脈モデルの異なるセットまたはモードを使用することによって）、符号化中に異なって扱われてもよく、その情報は、復号化前に復号化器が知ることが重要である場合がある。

【0090】

実施形態Ａ１１によれば、先の実施形態Ａ１からＡ１０ａのいずれかのＤＳ４５のうち、データストリーム４５は、１つ以上の個別にアクセス可能な部分２００に構造化され、それぞれの部分２００は、ニューラルネットワーク１０の対応するＮＮ層２１０を表現し、データストリーム４５は、所定のＮＮ層に対して、ＮＮの所定のＮＮ層のＮＮ層タイプを示すＮＮ層タイプパラメータ１３０をさらに含む。例えば、図１０を参照する。

【0091】

図１０は、ニューラルネットワークの表現が符号化されたデータストリーム４５の実施形態Ｃ１を示す。データストリーム４５は、１つ以上の個別にアクセス可能な部分２００に構造化され、それぞれの部分はニューラルネットワークの対応するＮＮ層２１０を表現し、データストリーム４５は、所定のＮＮ層に対して、ＮＮの所定のＮＮ層のＮＮ層タイプを示すＮＮ層タイプパラメータ１３０を更に含む。

【0092】

対応する実施形態ＺＣ１は、データストリーム４５が１つ以上の個別にアクセス可能な部分２００に構造化されるように、ニューラルネットワークの表現をＤＳ４５に符号化する装置に関する。それぞれの部分２００は、ニューラルネットワークの対応するＮＮ層２１０を表現し、装置は、所定のＮＮ層２１０について、データストリーム４５にＮＮの所定のＮＮ層２１０のＮＮ層タイプを示すＮＮ層タイプパラメータ１３０を提供するよう構成される。

【0093】

対応する実施形態ＸＣ１は、ＤＳ４５からニューラルネットワークの表現を復号化する装置に関する。データストリーム４５は、１つ以上の個別にアクセス可能な部分２００に構造化され、それぞれの部分２００は、ニューラルネットワークの対応するＮＮ層２１０を表現する。装置は、データストリーム４５から、所定のＮＮ層２１０に対して、ＮＮの所定のＮＮ層２１０のＮＮ層タイプを示すＮＮ層タイプパラメータを復号化するように構成される。

【0094】

実施形態Ａ１２によれば、実施形態Ａ１１およびＣ１のいずれかのＤＳ４５のうち、ＮＮ層タイプパラメータ１３０は、少なくとも、完全連結型、ＮＮ層２１０₁参照、および
畳み込み層タイプ、ＮＮ層２１０_N参照、を識別する。したがって、実施形態ＺＣ１に従
う装置は、２つの層タイプを識別するためにＮＮ層タイプパラメータ１３０を符号化することができ、実施形態ＸＢ１に従う装置は、２つの層タイプを識別するためにＮＮ層タイプパラメータ１３０を復号化することができる。

【0095】

２ビットストリームランダムアクセス
２．１層ビットストリームランダムアクセス
レイヤー処理を並列化したり、ビットストリームを各コンテナ形式でパッケージするなど、多くの用途でビットストリームの部分集合にアクセスすることは重要である。そのようなアクセスを可能にするための最先端における１つの方法は、例えば、各層２１０のパラメータテンソル３０の後の符号化依存性を破壊し、各層ビットストリーム、例えば個別にアクセス可能な部分２００の前に、モデルビットストリーム、すなわちデータストリーム４５に開始コードを挿入することである。特に、モデルビットストリーム内の開始コードは、開始コードの検出が、潜在的に非常に多数の開始コードにわたって最初からモデルビットストリーム全体を通して解析することを必要とするので、層ビットストリームを分離する適切な方法でない。

【0096】

本発明のこの側面は、パラメータテンソル３０の符号化モデルビットストリームを最先端より優れた方法で構造化することに関するものであり、ＮＮの並列または部分的な復号化および実行を必要とするアプリケーションを容易にするために、ビットストリーム部分、例えば層ビットストリームへのより容易、より高速かつより適切なアクセスを可能にするさらなる技術に関するものである。

【0097】

本発明の一実施形態では、モデルビットストリーム、すなわちデータストリーム４５内の個々の層ビットストリーム、例えば、個別にアクセス可能な部分２００は、モデルの範囲を有するビットストリームのパラメータセット／ヘッダー部分４７内のバイトまたはオフセット（例えば、符号化ユニットの始まりに対するバイトオフセット）におけるビットストリーム位置を通じて示される。図１１及び図１２は、本実施の形態を説明するための図である。図１２は、ポインタ２２０によって示されるビットストリームの位置またはオフセットを介した層（レイヤー）アクセスを示す。さらに、それぞれの個別にアクセス可能な部分２００は、任意に層パラメータセット１１０を構成し、その層パラメータセット１１０に、１つ以上の前述のパラメータを符号化および復号化することができる。

【0098】

実施形態Ａ１３によれば、先の実施形態Ａ１～Ａ１２のいずれかのＤＳ４５のうちの、データストリーム４５は、個別にアクセス可能な部分２００に構造化される。それぞれの部分２００は、対応するＮＮ部分、例えば、ニューラルネットワークの１つ以上のＮＮ層またはＮＮ層の一部を表現する。データストリーム４５は、１つ以上の所定の個別アクセス可能部分２００のそれぞれについて、例えばそれぞれの個別アクセス可能な部分２００の始まりを指すポインタ２２０を含み、個別アクセス可能部分が対応するＮＮ層を表現する場合には図１１または図１２を参照されたい。個別アクセス可能部分が所定のＮＮ層の一部、例えば個別にアクセス可能なサブ部分２４０を表現する場合には図１３～図１５を参照されたい。以下では、ポインタ２２０は、参照符号２４４で示されることもある。

【0099】

各ＮＮ層について、それぞれのＮＮ層に関連する個別にアクセス可能な部分２００は、それぞれのＮＮ層の対応するＮＮ部分を表現する。この場合、ここおよび以下の説明では、そのような個別にアクセス可能な部分２００は、個別にアクセス可能なサブ部分２４０として理解される。

【0100】

図１１は、より一般的な実施形態Ｄ１であって、ニューラルネットワークの表現が符号化されたデータストリーム４５を示し、データストリーム４５は、個別にアクセス可能な部分２００に構造化されている。それぞれの個別にアクセス可能な部分２００は、ニューラルネットワークの対応するＮＮ部分、例えば１つ以上のＮＮ層またはＮＮ層の部分を示している。データストリーム４５は、１つ以上の所定の個別にアクセス可能な部分２００ごとに、それぞれの所定の個別にアクセス可能な部分２００の始まりを指すポインタ２２０を含む。

【0101】

実施形態によれば、ポインタ２２０は、第１の個別にアクセス可能な部分２００₁の始
まりに対するオフセットを示す。第１の個別にアクセス可能な部分２００₁を指す第１の
ポインタ２２０₁は、オフセットなしを示す。したがって、第１のポインタ２２０₁を省略することが可能である。あるいは、ポインタ２２０は、例えば、ポインタ２２０が符号化されるパラメータセットの終端を基準としたオフセットを示す。

【0102】

対応する実施形態ＺＤ１、は、データストリーム４５が１つ以上の個別にアクセス可能な部分２００に構造化されるように、ニューラルネットワークの表現をＤＳ４５に符号化する装置に関する。各部分２００はニューラルネットワークの対応するＮＮ部分、例えば１つ以上のＮＮ層またはＮＮ層の一部を表現する。装置は、データストリーム４５に、１つ以上の所定の個別にアクセス可能な部分２００ごとに、それぞれの所定の個別にアクセス可能な部分２００の始まりを指すポインタ２２０を提供するよう構成される。

【0103】

対応する実施形態ＸＤ１は、ＤＳ４５からニューラルネットワークの表現を復号化するための装置に関するものである。データストリーム４５は、１つ以上の個別にアクセス可能な部分２００に構造化されており、それぞれの部分２００は、ニューラルネットワークの対応するＮＮ部分、例えば１つ以上のＮＮ層またはＮＮ層の一部を表現する。装置は、１つ以上の所定の個別アクセス可能部分２００のそれぞれについて、データストリーム４５から、それぞれの所定の個別アクセス可能部分２００の始まりを指すポインタ２２０を復号化し、例えば、ＤＳ４５にアクセスするためにポインタ２２０のうちの１つ以上を使用するように構成される。

【0104】

実施形態Ａ１４によれば、先の実施形態Ａ１３及びＤ１のいずれかに記載のＤＳ４５のうち、それぞれの個別にアクセス可能な部分２００が以下を表現する。
ニューラルネットワークの対応するＮＮ層２１０、又は、
ＮＮのＮＮ層２１０のＮＮ部分。例えば、図３または図２１～図２３のいずれかを参照されたい。

【0105】

２．２サブ層ビットストリームランダムアクセス
セクション１で述べたように、部分的にまたは並行して復号化／処理／推論させることが有益であるため、特定の構成可能な方法で層２１０内のパラメータテンソル３０をグループ化することに依存するアプリケーションが存在する。したがって、層ビットストリーム、例えば個別にアクセス可能な部分２００へのサブ層単位アクセスは、所望のデータに並行してアクセスすること、または不要なデータ部分を省くことに役立ち得る。

【0106】

一実施形態では、層ビットストリーム内の符号化依存性は、サブ層（レイヤー）の精度でリセットされ、すなわち、ＤｅｅｐＣＡＢＡＣ確率状態をリセットする。

【0107】

本発明の別の実施形態では、層ビットストリーム、すなわち個別にアクセス可能な部分２００内の個々のサブ層ビットストリーム、すなわち個別にアクセス可能なサブ部分２４０は、ビットストリーム、すなわちデータストリーム４５のパラメータセット部分１１０内のバイト単位のビットストリーム位置、例えばポインタ２４４、またはオフセット、例えばポインタ２４４を通じて、層またはモデルの範囲と一緒に示される。図１３、図１４ａ及び図１５は、実施形態を示す。図１４ａは、相対的なビットストリーム位置またはオフセットによるサブ層アクセス、すなわち、個別にアクセス可能なサブ部分２４０へのアクセスを示す。さらに、例えば、個別にアクセス可能な部分２００は、層レベルのポインタ２２０によってもアクセスすることができる。層レベルのポインタ２２０は、例えば、ＤＳ４５のモデルパラメータセット４７、すなわち、ヘッダに符号化される。ポインタ２２０は、ＮＮのＮＮ層を含む対応するＮＮ部分を表現する個別にアクセス可能な部分２００を指し示す。サブ層レベルのポインタ２４４は、例えば、ＮＮのＮＮ層を含む対応する
ＮＮ部分を表現する個別にアクセス可能な部分２００の層パラメータセット１１０に符号化される。ポインタ２４４は、ＮＮのＮＮ層の一部を含む対応するＮＮ部分を表現する個別にアクセス可能なサブ部分２４０の始まりを指し示す。

【0108】

実施形態によれば、層レベルのポインタ２２０は、第１の個別にアクセス可能な部分２００₁の始まりを基準とするオフセットを示す。サブ層レベルのポインタ２４４は、ある
個別にアクセス可能な部分２００の第１の個別にアクセス可能なサブ部分２４０の始まりを基準としたオフセットを示している。

【0109】

実施形態によれば、ポインタ２２０／２４４は、多数のユニットを含む集合単位に対するバイトオフセットを示す。ポインタ２２０／２４４は、集合体ユニットの始まりから集合体ユニットのペイロード内のユニットの始まりまでのバイトオフセットを示す。

【0110】

本発明の別の実施形態では、層ビットストリーム、すなわち個別にアクセス可能な部分２００内の個々のサブ層ビットストリーム、すなわち個別にアクセス可能なサブ部分２４０は、ビットストリーム、すなわちデータストリーム４５内の検出可能な開始コード２４２を介して示され、これは層ごとのデータ量が、層がモデルビットストリームすなわちデータストリーム４５全体の中の開始コード２４２によって検出される場合よりも通常少ないので十分であるだろう。図１３及び図１４ｂは、本実施形態を説明する。図１４ｂは、サブ層レベルでの、すなわちそれぞれの個別にアクセス可能なサブ部分２４０についての開始コード２４２と、層レベルでの、すなわちそれぞれの個別にアクセス可能な部分２００についてのビットストリーム位置、すなわちポインタ２２０の使用法を説明するものである。

【0111】

別の実施形態では、（サブ）層ビットストリーム部分、個別にアクセス可能なサブ部分２４０のラン長、すなわちデータストリーム長２４６は、適切なコンテナに包装する目的で前記部分、すなわち個別にアクセス可能なサブ部分２４０の切り出しを容易にするために、ビットストリーム４５のパラメータセット／ヘッダー部分４７または個別にアクセス可能な部分２００のパラメータセット部分１１０で示されている。図１３に示されるように、個別にアクセス可能なサブ部分２４０のデータストリーム長２４６は、データストリーム長パラメータによって示される。

【0112】

図１３は、そニューラルネットワークの表現が符号化されたデータストリーム４５の実施形態Ｅ１を示す。データストリーム４５は、１つ以上の個別にアクセス可能な部分２００に構造化され、それぞれの個別にアクセス可能な部分２００は、ニューラルネットワークの対応するＮＮ層を表現する。データストリーム４５は、所定の部分内、例えば個別にアクセス可能な部分２００内において、個別にアクセス可能なサブ部分２４０にさらに構造化され、それぞれのサブ部分２４０は、ニューラルネットワークのそれぞれのＮＮ層の対応するＮＮ部分を表現する。データストリーム４５は、１つ以上の所定の個別にアクセス可能なサブ部分２４０のそれぞれについて、以下を含む。
それぞれの所定の個別にアクセス可能なサブ部分２４０が始まる開始コード２４２、及び／又は、
それぞれの所定の個別にアクセス可能なサブ部分２４０の始まりを指し示すポインタ２４４、及び／又は、
ＤＳ４５を解析する際にそれぞれの所定の個別にアクセス可能なサブ部分２４０をスキップするための、それぞれの所定の個別にアクセス可能なサブ部分２４０のデータストリーム長２４６を示すデータストリーム長パラメータ。

【0113】

本明細書に記載された個別にアクセス可能なサブ部分２４０は、個別にアクセス可能なサブ部分４３／４４に関して記載されたのと同じまたは類似の特徴及び／又は機能性を有
する可能性がある。

【0114】

同じ所定部分内の個別にアクセス可能なサブ部分２４０は、すべて同じデータストリーム長２４６を有し、それによって、データストリーム長パラメータが１つのデータストリーム長２４６を示し、そのデータストリーム長２４６が同じ所定部分内のそれぞれの個別にアクセス可能なサブ部分２４０に対して適用可能である。データストリーム長パラメータは、データストリーム４５全体のすべての個別にアクセス可能なサブ部分２４０のデータストリーム長２４６を示し、またはデータストリーム長パラメータは、それぞれの個別にアクセス可能な部分２００について、それぞれの個別にアクセス可能な部分２００のすべての個別にアクセス可能なサブ部分２４０のデータストリーム長２４６を示す。１つ以上のデータストリーム長パラメータは、データストリーム４５のヘッダ部分４７、またはそれぞれの個別にアクセス可能な部分２００のパラメータセット部分１１０に符号化される。

【0115】

対応する実施形態ＺＥ１は、ニューラルネットワークの表現をＤＳ４５に符号化する装置に関する。データストリーム４５は、１つ以上の個別にアクセス可能な部分２００に構造化される。それぞれの個別にアクセス可能な部分２００はニューラルネットワークの対応するＮＮ層を表現する。データストリーム４５は、所定の部分、例えば、個別にアクセス可能な部分２００内において、個別にアクセス可能なサブ部分２４０にさらに構造化され、それぞれのサブ部分２４０は、ニューラルネットワークのそれぞれのＮＮ層の対応するＮＮ部分を表現する。装置は、データストリーム４５に、１つ以上の所定の個別にアクセス可能なサブ部分２４０それぞれについて、以下を供給するように構成される。
それぞれの所定の個別にアクセス可能なサブ部分２４０が始まる開始コード２４２、及び／又は、
それぞれの所定の個別にアクセス可能なサブ部分２４０の始まりを指し示すポインタ２４４、及び／又は、
ＤＳ４５の解析する際に、それぞれの所定の個別にアクセス可能なサブ部分２４０をスキップするための、それぞれの所定の個別にアクセス可能なサブ部分２４０のデータストリーム長２４６を示すデータストリーム長パラメータ。

【0116】

別の対応する実施形態ＸＥ１は、ＤＳ４５からニューラルネットワークの表現を復号化するための装置に関する。データストリーム４５は、１つ以上の個別にアクセス可能な部分２００に構造化される。それぞれの個別にアクセス可能な部分２００はニューラルネットワークの対応するＮＮ層を表現する。データストリーム４５は、所定の部分、例えば、個別にアクセス可能な部分２００内において、個別にアクセス可能なサブ部分２４０にさらに構造化され、それぞれのサブ部分２４０は、ニューラルネットワークのそれぞれのＮＮ層の対応するＮＮ部分を表現する。装置は、データストリーム４５から、１つ以上の所定の個別にアクセス可能なサブ部分２４０それぞれについて、以下を復号化するように構成される。
それぞれの所定の個別にアクセス可能なサブ部分２４０が始まる開始コード２４２、及び／又は、
それぞれの所定の個別にアクセス可能なサブ部分２４０の始まりを指し示すポインタ２４４、及び／又は、
ＤＳ４５を解析する際に、それぞれの所定の個別にアクセス可能なサブ部分２４０をスキップするための、それぞれの所定の個別にアクセス可能なサブ部分２４０のデータストリーム長２４６を示すデータストリーム長パラメータ。
そして、例えば１つ以上の所定の個別にアクセス可能なサブ部分２４０に対して、ＤＳ４５にアクセスするためのこの情報、例えば開始コード２４２、ポインタ２４４及び／又はデータストリーム長パラメータを使用するように構成される。

【0117】

実施形態Ｅ２によれば、実施形態Ｅ１のＤＳ４５のうち、データストリーム４５は、それぞれの個別にアクセス可能な部分２００およびそれぞれの個別にアクセス可能なサブ部分２４０の始点において、文脈適応型算術符号化を用いて、及びコンテキスト初期化を用いて、ニューラルネットワークの表現が符号化されている。例えば、図８を参照とする。

【0118】

実施形態Ｅ３によれば、実施形態Ｅ１または実施形態Ｅ２のデータストリーム４５は、本明細書における任意の他の実施形態によるものである。そして、実施形態ＺＥ１及びＸＥ１の装置も、本明細書に記載された任意の他の特徴及び／又は機能によって完成され得ることは明らかである。

【0119】

２．３ビットストリームランダムアクセスの種類
選択された直列化タイプ、例えば図３に示す直列化タイプ１００₁及び１００₂から生じる（サブ）層２４０のタイプに応じて、クライアントが（サブ）層ビットストリーム２４０にアクセスするであろうか、及び方法を決定する様々な処理オプションも利用可能である。例えば、選択された直列化１００₁が、サブ層２４０が画像色チャネル固有であり、
これにより復号／推論のデータチャネル単位の並列化が可能となる場合、これは、クライアントに対するビットストリーム４５において示されるべきである。別の例は、図２０から図２３に関して説明したように、特定の層／モデルのアドバンスドＮＮサブセットとは独立して復号／推論され得るベースラインＮＮサブセットからの予備的結果の導出である。

【0120】

一実施形態では、モデル全体、１つまたは複数の層の範囲を有するビットストリーム４５内のパラメータセット／ヘッダ４７は、クライアントが適切に意思決定できるようにするために、（サブ）層ランダムアクセスのタイプを示している。図１５は、直列化によって決定されるランダムアクセスの２つの例示的なタイプ２５２₁および２５２₂を示す。例示されたランダムアクセスのタイプ２５２₁および２５２₂は、対応するＮＮ層を表現する個別にアクセス可能な部分２００に対する可能な処理オプションを表現する。第１の処理オプション２５２₁は、個別にアクセス可能な部分２００₁内のＮＮパラメータへのデータチャネル単位アクセスを示し、第２の処理オプション２５２₂は、個別にアクセス可能な
部分２００₂内のＮＮパラメータへのサンプル単位アクセスを示す。

【0121】

図１６は、ニューラルネットワークの表現が符号化されたデータストリーム４５の一般的な実施形態Ｆ１を示す。データストリーム４５は、個別にアクセス可能な部分２００に構造化されており、それぞれの個別にアクセス可能な部分２００は、例えば、１つ以上のＮＮ層を含むか、又は、ニューラルネットワークのＮＮ層の部分を含む、対応するＮＮ部分を表現する。データストリーム４５は、１つ以上の所定の個別アクセス可能な部分２００のそれぞれについて、推論のためにＮＮを用いるときに使用しなければならない、または任意に使用できる１つ以上の処理オプション２５２を示す処理オプションパラメータ２５０を含む。

【0122】

対応する実施形態ＺＦ１は、ニューラルネットワークの表現をＤＳ４５に符号化するための装置に関する。データストリーム４５は、個別にアクセス可能な部分２００に構造化される。それぞれの個別にアクセス可能な部分２００は、例えば１つ以上のＮＮ層を含むか、又は、ニューラルネットワークのＮＮ層の部分を含む、対応するＮＮ部分を表現する。装置は、１つ以上の所定の個別にアクセス可能な部分２００のそれぞれについて、推論にＮＮを使用するときに使用しなければならない、または任意に使用できる１つ以上の処理オプション２５２を示す処理オプションパラメータ２５０をデータストリーム４５に供給するように構成される。

【0123】

別の対応する実施形態ＸＦ１は、ＤＳ４５からニューラルネットワークの表現を復号化
するための装置に関する。データストリーム４５は、個別にアクセス可能な部分２００に構造化されている。それぞれの個別にアクセス可能な部分２００は、例えばニューラルネットワークの１つ以上のＮＮ層を含む、またはＮＮ層の部分を含む、対応するＮＮ部分を表現している。装置は、１つ以上の所定の個別にアクセス可能な部分２００のそれぞれについて、推論にＮＮを使用する際に使用しなければならない、または任意に使用できる１つ以上の処理オプション２５２を示す処理オプションパラメータ２５０を、データストリーム４５から復号化するように構成される。例えば、装置は、後者に基づいて、１つ以上の所定の個別にアクセス可能な部分のうち、どの部分にアクセス、スキップ及び／又は復号化するかを復号化するように構成される。１つ以上の処理オプション２５２に基づいて、装置は、どのように及び／又はどの個別にアクセス可能な部分または個別にアクセス可能なサブ部分をアクセス、スキップ及び／又は復号化することができるかを決定するように構成される。

【0124】

実施形態Ｆ１のＤＳ４５の実施形態Ｆ２によれば、処理オプションパラメータ２５０は、以下を含む所定の処理オプションの集合のうち、１つ以上の利用可能な処理オプション２５２を示す。
それぞれの所定の個別にアクセス可能な部分２００の並列処理能力、及び／又は、
それぞれの所定の個別アクセス可能な部分２００のサンプル単位並列処理能力２５２₁
、及び／又は、
それぞれの所定の個別アクセス可能な部分２００のチャンネル単位並列処理能力２５２₂、及び／又は、
それぞれの所定の個別アクセス可能な部分２００の分類カテゴリ単位並列処理能力、及び／又は、
図２０から図２３に示すように、同じニューラルネットワーク部分に関連するが、ＤＳに層方式で符号化されているＮＮのバージョンの別のバージョンに属するＤＳの別の個別にアクセス可能な部分から得られる計算結果に対する、それぞれの所定の個別にアクセス可能な部分によって表現される、例えばＮＮ層であるＮＮ部分の依存性。

【0125】

実施形態ＺＦ１による装置は、処理オプションパラメータ２５０が、所定の処理オプションのセットのうちの１つ以上の処理オプションを示すように、処理オプションパラメータ２５０を符号化するように構成されている。実施形態ＸＦ１による装置は、所定の処理オプションのセットのうちの１つ以上の処理オプションを示す処理オプションパラメータ２５０を復号化するように構成される。

【0126】

３量子化パラメータのシグナリング
層ペイロード、例えば個々のアクセス可能な部分２００に符号化されたＮＮパラメータ３２、またはサブ層ペイロード、例えば個々のアクセス可能なサブ部分２４０に符号化されたＮＮパラメータ３２は、例えば重み、バイアスなどのように有理数を表現する異なる種類のパラメータ３２を含んでいてもよい。

【0127】

図１８に示す好ましい実施形態では、そのようなタイプのパラメータの１つは、再構成された値、すなわち再構成されたＮＮパラメータ３２’が、再構成パラメータを含むこれらの値、すなわち量子化インデックス３２’’に再構成ルール２７０を適用して導出されるように、ビットストリームにおいて整数値としてシグナリングされる。例えば、このような再構成ルール２７０は、各整数値、すなわち量子化インデックス３２’’に、関連する量子化ステップサイズ２６３を乗算することからなる場合がある。量子化ステップサイズ２６３は、この場合における再構成パラメータである。

【0128】

好ましい実施形態では、再構成パラメータは、モデルパラメータセット４７の中か、層パラメータセット１１０の中か、サブ層ヘッダ３００の中のいずれかで信号化される。

【0129】

別の好ましい実施形態では、第１の再構成パラメータのセットがモデルパラメータセット内で信号化され、任意に、第２の再構成パラメータのセットが層パラメータセット内で信号化され、任意に、第３の再構成パラメータのセットがサブ層ヘッダ内で信号化される。存在する場合、第２の再構成パラメータのセットは、第１の再構成パラメータのセットに依存する。存在する場合、第３の再構成パラメータのセットは、第１及び／又は第２の再構成パラメータのセットに依存し得る。この実施形態は、図１７に関してより詳細に説明される。

【0130】

【0131】

好ましい実施形態では、ｓ＝２^-0.5である。

【0132】

有理数ｓは、例えば、浮動小数点値として符号化されてもよい。第１及び第２の整数値ｘ₁及びｘ₂は、全体の信号コストを最小にするために、固定又は可変のビット数を用いて信号化されてもよい。例えば、層のサブ層の量子化ステップサイズが類似している場合、関連する値ｘ₂はむしろ小さな整数であり、それらを信号化するためにわずかなビットし
か許可しないことが効率的である場合がある。

【0133】

好ましい実施形態では、図１８に示すように、再構成パラメータは、コードブック、すなわち、整数と有理数とのマッピングのリストである量子化インデックス－再構成レベルマッピングで構成される。ビットストリーム４５に整数値Ｗ_nとして符号化された、層ま
たはサブ層ペイロードの関連するパラメータは、以下の再構成ルール２７０を用いて再構成される。各整数値Ｗ_nは、コードブックで検索される。関連する整数がＷ_nに一致する１つのマッピングが選択され、関連する有理数が再構成された値、すなわち再構成されたＮＮパラメータ３２’となる。

【0134】

別の好ましい実施形態では、第１及び／又は第２及び／又は第３の再構成パラメータのセットはそれぞれ、先の好ましい実施形態によるコードブックから構成されている。しかし、再構成ルールを適用するために、第１及び／又は第２及び／又は第３の再構成パラメータのセットのコードブックのマッピングの集合和を作成することによって、１つのジョイントコードブックが導出される。同じ整数を持つマッピングが存在する場合、第３のセットの再構成パラメータのコードブックのマッピングは第２のセットの再構成パラメータのコードブックのマッピングより優先され、第２のセットの再構成パラメータのコードブックのマッピングは第１のセットの再構成パラメータのコードブックのマッピングより優先される。

【0135】

図１７は、ニューラルネットワーク１０を表現する、その中に符号化されたＮＮパラメータ３２を有するデータストリーム４５の実施形態Ｇ１を示す。ＮＮパラメータ３２は、量子化インデックスに量子化される方法２６０でＤＳ４５に符号化される。ＮＮ１０の異なるＮＮ部分のＮＮパラメータ３２が異なって量子化２６０されるようにＤＳ４５に符号化される。ＤＳ４５はＮＮ部分のそれぞれについて、それぞれのＮＮ部分に関連するＮＮ
パラメータを逆量子化するための再構成ルール２７０を示す。

【0136】

例えば、ＮＮの各ＮＮ部分はＮＮのノード間の相互接続を含み、異なるＮＮ部分はＮＮのノード間の異なる相互接続を含む。

【0137】

実施形態によれば、ＮＮ部分は、ＮＮ１０のＮＮ層２１０及び／又はＮＮの所定のＮＮ層が細分化された層サブ部分４３を含む。図１７に示すように、ＮＮの１つの層２１０内のすべてのＮＮパラメータ３２は、ＮＮ１０の第１の層２１０₁内のＮＮパラメータ３２
がＮＮ１０の第２の層２１０₂内のＮＮパラメータ３２と異なるように量子化２６０され
ているＮＮのＮＮ部分を表現する。また、ＮＮ層２１０₁内のＮＮパラメータ３２が、異
なる層サブ部分４３、すなわち個別にアクセス可能なサブ部分にグループ化されることも可能であり、各グループがＮＮ部分を表現する可能性がある。したがって、ＮＮ層２１０₁の異なる層サブ部分４３は、異なるように量子化２６０される。

【0138】

対応する実施形態ＺＧ１は、ニューラルネットワーク１０を表現するＮＮパラメータ３２をＤＳ４５に符号化する装置に関する。ＮＮパラメータ３２は量子化インデックスに量子化された方法２６０でＤＳ４５に符号化される。ＮＮ１０の異なるＮＮ部分のＮＮパラメータ３２が異なって量子化２６０されるように、ＮＮパラメータ３２がＤＳ４５に符号化される。装置は、ＮＮ部分のそれぞれについて、それぞれのＮＮ部分に関連するＮＮパラメータ３２を逆量子化するための再構成ルールを示すＤＳ４５を提供するように構成される。任意選択的に、装置は、量子化２６０を実行することもできる。

【0139】

別の対応する実施形態ＸＧ１は、ニューラルネットワーク１０を表現するＮＮパラメータ３２をＤＳ４５から復号化する装置に関する。ＮＮパラメータ３２は、量子化インデックスに量子化された方法２６０でＤＳ４５に符号化されている。ＮＮ１０の異なるＮＮ部分のＮＮパラメータ３２が異なって量子化２６０されるように、ＮＮパラメータ３２はＤＳ４５に符号化される。装置は、ＮＮ部分のそれぞれについて、それぞれのＮＮ部分に関連するＮＮパラメータ３２を逆量子化するための再構成ルール２７０をデータストリーム４５から復号化するように構成される。任意選択で、装置は、再構成ルール２７０、すなわち、現在逆量子化されたＮＮパラメータ３２が属するＮＮ部分に関連するものを用いて逆量子化を実行することもできる。装置は、ＮＮ部分のそれぞれについて、それぞれのＮＮ部分に関連する復号化された再構成ルール２７０を用いて、それぞれのＮＮ部分のＮＮパラメータを逆量子化するように構成されることもできる。

【0140】

以下では、データストリーム４５の文脈で異なる特徴及び／又は機能性を説明するが、特徴及び／又は機能性はまた、同じようにまたは同様に、実施形態ＺＧ１による装置又は実施形態ＸＧ１による装置の特徴及び／又は機能性であることができる。

【0141】

既に上述したように、実施形態Ｇ１のＤＳ４５のうち、実施形態Ｇ２によれば、ＮＮ部分は、ＮＮ１０のＮＮ層２１０及び／又はＮＮ１０の所定のＮＮ層２１０が細分化された層（レイヤー）部分を含む。

【0142】

実施形態Ｇ３によれば、実施形態Ｇ１又はＧ２のＤＳ４５のうち、ＤＳ４５は、第２のＮＮ部分に関連するＮＮパラメータ３２を逆量子化２６０するための第２の再構成ルール２７０₂に対してデルタ符号化されて、第１のＮＮ部分に関連するＮＮパラメータ３２を
逆量子化するための第１の再構成ルール２７０₁をそこに符号化したものを有する。ある
いは、図１７に示すように、第１のＮＮ部分、すなわち層サブ部分４３₁に関連するＮＮ
パラメータ３２を逆量子化するための第１の再構成ルール２７０ａ₁は、第２のＮＮ部分
、すなわち層サブ部分４３₂に関連する第２の再構成ルール２７０ａ₂に対してデルタ符号化されてＤＳ４５に符号化されている。また、第１のＮＮ部分、すなわち層サブ部分４３
１に関連するＮＮパラメータ３２を逆量子化するための第１の再構成ルール２７０ａ₁が
、第２のＮＮ部分、すなわちＮＮ層２１０₂に関連する第２の再構成ルール２７０₂に対してデルタ符号化されてＤＳ４５に符号化されるということも可能である。

【0143】

以下の実施形態では、実施形態の不明瞭さを避けるために、第１の再構成ルールを２７０₁と表記し、第２の再構成ルールを２７０₂と表記する。しかし、以下の実施形態でも、第１の再構成ルール及び／又は第２の再構成ルールは、上述のように、ＮＮ層２１０の層サブ部分４３を表現するＮＮ部分に対応し得ることは明らかである。

【0144】

実施形態Ｇ４によれば、実施形態Ｇ３のＤＳ４５のうち、ＤＳ４５は、第１の再構成ルール２７０₁を示すための第１の指数値と、第２の再構成ルール２７０₂を示すための第２の指数値とを含む。
第１の再構成ルール２７０₁は、所定の基底の指数と、第１の指数値によって定義され
る第１の指数とによって定義される第１の量子化ステップサイズによって定義され、かつ、
第２の再構成ルール２７０₂は、所定の基底の指数と、第１および第２の指数値の和で
定義される第２の指数とによって定義される第２の量子化ステップサイズによって定義される。

【0145】

実施形態Ｇ４ａによれば、実施形態Ｇ４のＤＳのうち、ＤＳ４５は、さらに所定の基底を示す。

【0146】

実施形態Ｇ４’によれば、先のいずれかの実施形態Ｇ１～Ｇ３のＤＳのうち、ＤＳ４５は、第１のＮＮ部分に関連するＮＮパラメータ３２を逆量子化するための第１の再構成ルール２７０₁を示すための第１の指数値と、第２のＮＮ部分に関連するＮＮパラメータ３
２を逆量子化するための第２の再構成ルール２７０₂を示すための第２の指数値とを含む
。
第１の再構成ルール２７０₁は、所定の基底の指数と、第１の指数値と所定の指数値と
の和で定義される第１の指数とによって定義される第１の量子化ステップサイズによって定義され、
第２の再構成ルールは、所定の基底の指数と、第２の指数値と所定の指数値との和によって定義される第２の量子化ステップサイズによって定義される。

【0147】

実施形態Ｇ４’のＤＳの実施形態Ｇ４’ａによれば、ＤＳは、さらに所定の基底を示す。

【0148】

実施形態Ｇ４’ｂによれば、実施形態Ｇ４’ａのＤＳのうち、ＤＳは、ＮＮの範囲すなわちＮＮ全体に関連する所定の基底を示す。

【0149】

実施形態Ｇ４’ｃによれば、実施形態Ｇ４’からＧ４’ｂのいずれかの前の実施形態のＤＳのうち、ＤＳ４５はさらに所定の指数値を示している。

【0150】

実施形態Ｇ４’ｄによれば、実施形態Ｇ４’ｃのＤＳ４５のうち、ＤＳ４５は、ＮＮ層範囲、すなわち、第１ＮＮ部分４３₁および第２ＮＮ部分４３₂が属する所定のＮＮ層２１０について、所定の指数値を示す。

【0151】

実施形態Ｇ４’ｅによれば、任意の先の実施形態Ｇ４’ｃおよびＧ４’ｄのＤＳのうち、ＤＳ４５は、所定の基数をさらに示し、ＤＳ４５は、所定の基数がＤＳ４５によって示される範囲よりも細かい範囲で所定の指数値を示す。

【0152】

実施形態Ｇ４ｆによれば、先の実施形態Ｇ４からＧ４ａ又はＧ４’からＧ４’ｅのいずれかのＤＳ４５のうち、ＤＳ４５は、非整数フォーマット、例えば浮動小数点又は有理数又は固定小数点数でその中に符号化された所定の基底と、整数フォーマット、例えば符号付き整数での第１および第２指数値とを有する。オプションとして、所定の指数値も整数形式でＤＳ４５に符号化される場合がある。

【0153】

実施形態Ｇ５によれば、実施形態Ｇ３からＧ４ｆのいずれかのＤＳのうち、ＤＳ４５は、第１の再構成ルール２７０₁を示すために、第１の量子化インデックス－再構成レベル
マッピングを定義する第１のパラメータセットと、第２の再構成ルール２７０₂を示すた
めに、第２の量子化インデックス－再構成レベルマッピングを定義する第２のパラメータセットとを含む。
第１の再構成ルール２７０₁は、第１の量子化インデックス－再構成レベルマッピング
によって定義される。
第２の再構成ルール２７０₂は、第１の量子化インデックス－再構成レベルマッピング
を第２の量子化インデックス－再構成レベルマッピングで所定の方法で拡張することによって定義される。

【0154】

実施形態Ｇ５’によれば、実施形態Ｇ３からＧ５のいずれかに記載のＤＳ４５の、ＤＳ４５は、第１の再構成ルール２７０₁を示すために第１の量子化インデックス－再構成レ
ベルマッピングを定義する第１のパラメータセットと、第２の再構成ルール２７０₂を指
示すための第２の量子化インデックス－再構成レベルマッピングを定義する第２のパラメータセットとを含む。
第１の再構成ルール２７０₁は、所定の量子化インデックス－再構成レベルマッピング
を、第１の量子化インデックス－再構成レベルマッピングによって所定の方法で拡張することによって定義され、かつ、
第２の再構成ルール２７０₂は、所定の量子化インデックス－再構成レベルマッピング
を第２の量子化インデックス－再構成レベルマッピングによって所定の方法で拡張することによって定義される。

【0155】

実施形態Ｇ５’ａによれば、実施形態Ｇ５’のＤＳ４５のうち、ＤＳ４５は、さらに、所定の量子化インデックス－再構成レベルマッピングを示す。

【0156】

実施形態Ｇ５’ｂによれば、実施形態Ｇ５’ａのＤＳ４５のうち、ＤＳ４５は、ＮＮ範囲で、すなわちＮＮ全体に関する、またはＮＮ層範囲で、すなわち第１ＮＮ部分４３₁お
よび第２ＮＮ部分４３₂が属する所定のＮＮ層２１０に関する所定の量子化インデックス
－再構成レベルマッピングを示している。所定の量子化インデックス－再構成レベルマッピングは、ＮＮ層を表現するＮＮ部分の場合、ＮＮスコープで示されるかもしれない。例えば、ＮＮ部分のそれぞれについて、それぞれのＮＮ部分は対応するＮＮ層を表現し、例えば、第１のＮＮ部分は第２のＮＮ部分と異なるＮＮ層を表現する。しかし、ＮＮ部分の少なくともいくつかが層サブ部分４３を表現する場合に、ＮＮ範囲で所定の量子化インデックス－再構成レベルマッピングを示すことも可能である。さらに、または代替的に、層サブ部分４３を表現するＮＮ部分の場合には、ＮＮ層範囲において、所定の量子化インデックス－再構成レベルマッピングが示されることもあり得る。

【0157】

実施形態Ｇ５ｃによれば、先の実施形態Ｇ５又はＧ５’～Ｇ５’ｂのいずれかのＤＳ４５のうち所定の態様に従って、
拡張される量子化インデックス－再構成レベルマッピングに従った、それぞれのインデックス値、すなわち量子化インデックス３２’’の、第１の再構成レベルへのマッピングは、拡張される量子化インデックス－再構成レベルマッピングを拡張する量子化インデックス－再構成レベルマッピングに従った、それぞれのインデックス値の、第２の再構成レ
ベルへのマッピングが存在する場合はそれによって優先され、及び／又は、
、拡張される量子化インデックス－再構成レベルマッピングに従うと、それぞれのインデックス値がマッピングされるべき再構成レベルが定義されず、拡張される量子化インデックス－再構成レベルマッピングを拡張する量子化インデックス－再構成レベルマッピングに従うと、対応する再構成レベルへマッピングされる任意のインデックス値に対して、それぞれのインデックス値から対応する再構成レベルへのマッピングが採用され、及び／又は、
拡張される量子化インデックス－再構成レベルマッピングを拡張する量子化インデックス－再構成レベルマッピングに従うと、それぞれのインデックス値がマッピングされるべき再構成レベルが定義されず、拡張される量子化インデックス－再構成レベルマッピングに従うと、対応する再構成レベル上にマッピングされる任意のインデックス値に対して、それぞれのインデックス値から対応する再構成レベルへのマッピングが採用される。

【0158】

図１８に示す実施形態Ｇ６によれば、先の任意の実施形態Ｇ１～Ｇ５ｃのＤＳ４５のうち、ＤＳ４５は、所定のＮＮ部分の再構成ルール２７０を示すために、例えばＮＮ層を表現する、またはＮＮ層の層サブ部分示すために以下を含む。
量子化ステップサイズ２６３を示す量子化ステップサイズパラメータ２６２、及び、
量子化インデックス－再構成レベルマッピング２６５を定義するパラメータセット２６４。
ここで、所定のＮＮ部分の再構成ルール２７０は、
所定のインデックス間隔２６８内の量子化インデックス３２’’に対する量子化ステップサイズ２６３、及び、
所定のインデックス区間２６８外の量子化インデックス３２’’に対する量子化インデックス－再構成レベルマッピング２６５、
により定義される。

【0159】

図１８は、ニューラルネットワークを表現するＮＮパラメータ３２をその中に符号化したデータストリーム４５の実施形態Ｈ１を示す図である。
ここで、ＮＮパラメータ３２は、量子化インデックス３２’’上に量子化２６０された形でＤＳ４５に符号化される。
ここで、ＤＳ４５は、ＮＮパラメータ２８０、すなわち量子化インデックス３２’’を逆量子化するための再構成ルール２７０を示すために、以下を含む。
量子化ステップサイズ２６３を示す量子化ステップサイズパラメータ２６２及び、
量子化インデックス－再構成レベルマッピング２６５を定義するパラメータセット２６４。
ここで、所定のＮＮ部分の再構成ルール２７０は、
所定のインデックス間隔２６８内の量子化インデックス３２’’に対する量子化ステップサイズ２６３と、
所定のインデックス区間２６８外の量子化インデックス３２’’に対する量子化インデックス－再構成レベルマッピング２６５と、によって定義される。

【0160】

対応する実施形態ＺＨ１は、ニューラルネットワークを表現するＮＮパラメータ３２をＤＳ４５に符号化するための装置に関する。ＮＮパラメータ３２は量子化インデックス３２’’に量子化２６０されてＤＳ４５に符号化される。装置は、ＮＮパラメータ３２を逆量子化するための再構成ルール２７０を指示するために、ＤＳ４５に以下を提供するよう構成される。
量子化ステップサイズ２６３を示す量子化ステップサイズパラメータ２６２及び、
量子化インデックス－再構成レベルマッピング２６５を定義するパラメータセット２６４。
ここで、所定のＮＮ部分の再構成ルール２７０は、
所定のインデックス間隔２６８内の量子化インデックス３２’’に対する量子化ステップサイズ２６３と、
所定のインデックス区間２６８外の量子化インデックス３２’’に対する量子化インデックス－再構成レベルマッピング２６５と、により定義される。

【0161】

別の対応する実施形態ＸＨ１は、ニューラルネットワークを表現するＮＮパラメータ３２をＤＳ４５から復号化する装置に関する。ＮＮパラメータ３２は、量子化インデックス３２’’に量子化されてＤＳ４５に符号化される。装置は、
量子化ステップサイズ２６３を示す量子化ステップサイズパラメータ２６２及び、
量子化インデックス－再構成レベルマッピング２６５を定義するパラメータセット２６４をＤＳ４５から復号化することによって、ＮＮパラメータすなわち量子化インデックス３２’’を逆量子化するための再構成ルール２７０を導出可能に構成されている。
ここで、所定のＮＮ部分の再構成ルール２７０は、
所定のインデックス間隔２６８内の量子化インデックス３２’’に対する量子化ステップサイズ２６３と、
所定のインデックス区間２６８外の量子化インデックス３２’’に対する量子化インデックス－再構成レベルマッピング２６５と、により定義される。

【0162】

以下では、データストリーム４５の文脈で異なる特徴及び／又は機能性を説明するが、特徴及び／又は機能性は、同じようにまたは同様に、実施形態ＺＨ１による装置、または実施形態ＸＨ１による装置の特徴及び／又は機能性であってもよい。

【0163】

実施形態Ｇ７によれば、先の実施形態Ｇ６またはＨ１のいずれかのＤＳ４５の、所定の指標間隔２６８はゼロを含む。

【0164】

実施形態Ｇ８によれば、実施形態Ｇ７のＤＳ４５のうち、所定のインデックス間隔２６８は所定の大きさ閾値ｙまで延び、所定の大きさ閾値ｙを超える量子化インデックス３２’’は、量子化インデックス－再構成レベルマッピング２６５が逆量子化２８０に用いられることを信号化するエスケープコードを表現している。

【0165】

実施形態Ｇ９によれば、先の実施形態Ｇ６からＧ８のいずれかのＤＳ４５の、パラメータセット２６４は、所定のインデックス間隔２６８外の量子化インデックス３２’’に関連する再構成レベルのリストによって、量子化インデックス－再構成レベルマッピング２６５を定義している。

【0166】

実施形態Ｇ１０によれば、先の実施形態Ｇ１からＧ９のいずれかのＤＳ４５のうち、ＮＮ部分は、ＮＮのＮＮ層の１つ以上のサブ部分及び／又はＮＮの１つ以上のＮＮ層を含む。図１８は、ＮＮの１つのＮＮ層を含むＮＮ部分についての例である。ＮＮパラメータ３２を含むＮＮパラメータテンソル３０は、対応するＮＮ層を表現する。

【0167】

実施形態Ｇ１１によれば、先の実施形態Ｇ１～Ｇ１０のいずれかのＤＳ４５のうち、データストリーム４５は、個別にアクセス可能な部分に構造化され、それぞれの個別にアクセス可能な部分は、対応するＮＮ部分について、そこに符号化されているＮＮパラメータ３２を有する。例えば図８または図１０～図１７のうちの１つを参照されたい。

【0168】

実施形態Ｇ１２によれば、Ｇ１１のＤＳ４５のうち、個別にアクセス可能な部分は、例えば図８に示すように、個別にアクセス可能な部分それぞれの始点において、文脈適応型算術符号化を用いて、かつ、文脈初期化を用いて符号化される。

【0169】

実施形態Ｇ１３によれば、任意の前の実施形態Ｇ１１又はＧ１２のＤＳ４５のうち、デ
ータストリーム４５は、例えば図１１から図１５のうちの１つに示されるように、それぞれの個別にアクセス可能な部分について、
それぞれの個別にアクセス可能な部分が始まる開始コード２４２、及び／又は、
それぞれの個別にアクセス可能な部分の始まりを指すポインタ２２０／２４４、及び／又は、
ＤＳ４５を解析する際にそれぞれの個別にアクセス可能な部分をスキップするための、それぞれの個別にアクセス可能な部分のデータストリーム長を示すデータストリーム長パラメータ２４６と、を含む。

【0170】

実施形態Ｇ１４によれば、先のいずれかの実施形態Ｇ１１からＧ１３のＤＳ４５のうち、データストリーム４５は、ＮＮ部分のそれぞれについて、それぞれのＮＮ部分に関連するＮＮパラメータ３２を逆量子化２８０するための再構成ルール２７０を、
ＮＮ全体に関するＤＳ４５のメインヘッダ部分４７、
それぞれのＮＮ部分が属するＮＮ層２１０に関連するＤＳ４５のＮＮ層関連ヘッダー部分１１０、又は、
それぞれのＮＮ部分に関連するＤＳ４５のＮＮ部分特定ヘッダー部分３００、例えば、ＮＮ部分がＮＮ層２１０の層サブ部分、すなわち、個別にアクセス可能なサブ部分４３／４４／２４０を表現する場合、その一部である、
内において示す。

【0171】

実施形態Ｇ１５によれば、任意の先の実施形態Ｇ１１～Ｇ１４のＤＳ４５のうち、ＤＳ４５は任意の先の実施形態Ａ１～Ｆ２によるものである。

【0172】

４パラメータハッシュに依存する識別子
分散学習のように、多くのクライアントが個別にネットワークをさらに学習し、相対的なＮＮの更新を中央のエンティティに送り返すシナリオでは、バージョン管理スキームによってネットワークを識別することが重要である。これにより、中央のエンティティは、ＮＮ更新が構築されているＮＮを識別することができる。

【0173】

スケーラブルなＮＮのような他のユースケースでは、完全なまたは強化されたＮＮを実行して完全な結果を得る前に、例えば予備的な結果を生成するために、ＮＮのベースライン部分を実行することができる。強化されたＮＮは、ベースラインＮＮの若干異なるバージョン、例えば更新されたパラメータテンソールを使用する場合がある。そのような更新されたパラメータテンソルが差動的に符号化される場合、すなわち、以前に符号化されたパラメータテンソルの更新として、差動的に符号化された更新が構築されているパラメータテンソルを、例えば、図１９に示すように、識別パラメータ３１０を用いて識別することが必要である。

【0174】

さらに、ＮＮの完全性が最も重要であるユースケース、すなわち、送信エラーまたはパラメータテンソルの不本意な変化が容易に認識できるようにする必要があるユースケースが存在する。識別子、すなわち識別パラメータ３１０は、それがＮＮの特性に基づいて検証され得る場合、操作をよりエラーロバストにする。

【0175】

しかし、最先端のバージョン管理は、コンテナ全体のデータ形式のチェックサムまたはハッシュを介して行われ、異なるコンテナ内の等価なＮＮを照合することは容易ではない。しかし、関係するクライアントが異なるフレームワーク／コンテナを使用している場合もある。また、ＮＮの完全な再構成を行わない限り、ＮＮのサブセット（層、サブ層）だけを識別／検証することは不可能である。

【0176】

したがって、本発明の一部として、一実施形態では、識別子、すなわち識別パラメータ
３１０は、各エンティティ、すなわちモデル、層、サブ層とともに運ばれ、各エンティティが以下を行うことを可能にする。
－アイデンティティの確認、及び／又は、
－参照する、または参照される、及び／又は、
－整合性を確認する。

【0177】

別の実施形態では、識別子は、ＭＤ５又はＳＨＡ５などのハッシュアルゴリズム、あるいは、ＣＲＣ又はチェックサムなどのエラー検出コードを使用して、パラメータテンソルから導出される。

【0178】

別の実施形態では、あるエンティティのそのような識別子は、下位エンティティの識別子を使用して導出されるる。例えば、層（レイヤー）識別子は構成するサブ層の識別子から、モデル識別子は構成する層の識別子から導出されるであろう。

【0179】

図１９は、ニューラルネットワークの表現が符号化されたデータストリーム４５の実施形態Ｉ１を示す。データストリーム４５は、個別にアクセス可能な部分２００に構造化されている。それぞれの部分２００は、例えば、１つ以上のＮＮ層を含むか、又はＮＮ層の部分を含む、ニューラルネットワークの対応するＮＮ部分を表現する。データストリーム４５は、１つ以上の所定の個別にアクセス可能な部分２００ごとに、それぞれの所定の個別にアクセス可能な部分２００を識別するための識別パラメータ３１０を含む。

【0180】

対応する実施形態ＺＩ１は、ニューラルネットワークの表現をＤＳ４５に符号化する装置に関する。データストリーム４５は、個別にアクセス可能な部分２００に構造化される。各部分２００は、例えば１つ以上のＮＮ層を含むか又はＮＮ層の部分を含み、ニューラルネットワークの対応するＮＮ部分を表現する。装置は、データストリーム４５に、１つ以上の所定の個別のアクセス可能な部分２００のそれぞれに対して、それぞれ所定の個別にアクセス可能な部分２００を特定するための識別パラメータ３１０を提供するように構成される。

【0181】

別の対応する実施形態ＸＩ１は、ＤＳ４５からニューラルネットワークの表現を復号化する装置に関する。データストリーム４５は、個別にアクセス可能な部分２００に構造化されている。各部分２００は、例えば、１つ以上のＮＮ層を含むか又はＮＮ層の部分を含む、ニューラルネットワークの対応するＮＮ部分を表現する。装置は、データストリーム４５から、１つ以上の所定の個別にアクセス可能な部分２００それぞれについて、それぞれの所定の個別にアクセス可能な部分２００を識別するための識別パラメータ３１０を復号化するよう構成されている。

【0182】

以下では、データストリーム４５の文脈で異なる特徴及び／又は機能性を説明するが、特徴及び／又は機能性はまた、同じようにまたは同様に、実施形態ＺＩ１による装置の特徴及び／又は機能性、または実施形態ＸＩ１による装置の特徴及び／又は機能性であることができる。

【0183】

実施形態Ｉ２によれば、実施形態Ｉ１のＤＳ４５のうち、識別パラメータ３１０は、ハッシュ関数またはエラー検出コードまたはエラー訂正コードを介して、それぞれの所定の個別にアクセス可能な部分２００に関連付けられる。

【0184】

実施形態Ｉ３によれば、先の実施形態Ｉ１及びＩ２のいずれかのＤＳ４５のうち、１つ以上の所定の個別にアクセス可能な部分２００の集合体を識別するための上位の識別パラメータをさらに含む。

【0185】

実施形態Ｉ４によれば、実施形態Ｉ３のＤＳ４５のうち、上位の識別パラメータは、ハッシュ関数または誤り検出コードまたは誤り訂正コードを介して、１つ以上の所定の個別にアクセス可能な部分２００の識別パラメータ３１０に関連づけられる。

【0186】

実施形態Ｉ５によれば、先の実施形態Ｉ１からＩ４のいずれかのＤＳ４５のうち、個別アクセス可能部分２００は、例えば図８に示すように、それぞれの個別にアクセス可能な部分の始点において、文脈適応型算術符号化を用いて、及び文脈初期化を使って符号化される。

【0187】

実施形態Ｉ６によれば、先の実施形態Ｉ１からＩ５のいずれかのＤＳ４５のうち、データストリーム４５は、例えば図１１から図１５のいずれかに示すように、個別にアクセス可能な部分２００それぞれについて、
それぞれの個別にアクセス可能な部分２００が始まる開始コード２４２、及び／又は、
それぞれの個別にアクセス可能な部分２００の始まりを指すポインタ２２０／２４４、及び／又は、
ＤＳ４５を解析する際にそれぞれの個別にアクセス可能な部分２００をスキップするための、それぞれの個別にアクセス可能な部分２００のデータストリーム長を示すデータストリーム長パラメータ２４６、を含む。

【0188】

実施形態Ｉ７によれば、先の実施形態Ｉ１～Ｉ６のいずれかのＤＳ４５のうち、ＮＮ部分は、ＮＮのＮＮ層の１つ以上のサブ部分及び／又はＮＮの１つ以上のＮＮ層を含む。

【0189】

実施形態Ｉ８によれば、先の実施形態Ｉ１からＩ７のいずれかのＤＳ４５のうち、ＤＳ４５は、先の実施形態Ａ１からＧ１５のいずれかによるものである。

【0190】

５スケーラブルＮＮビットストリーム
前述したように、いくつかのアプリケーションは、例えば、図２０から図２３に示すように、層２１０またはそのグループ、すなわちサブ層４３／４４／２４０を、ベースライン、例えばＮＮ１０の第２のバージョン３３０₁、およびアドバンスド部分３３０₂、例えばＮＮ１０の第１のバージョン３３０₂に分けてＮＮ１０の構造化をさらに進めることに
依存している。クライアントがその処理能力を一致させられるか、より複雑なアドバンスドＮＮの処理に先立ってベースラインでまず推測を行うことができるかもしれない。このような場合、セクション１から４で説明したように、ＮＮ層のそれぞれのサブ部分のパラメータテンソル３０を独立してソートし、コード化し、情報に基づいた方法でアクセスできるようにすることが有益である。

【0191】

さらに、場合によっては、ＮＮ１０は、
－図２２に示すように、層におけるニューロンの数を減らすこと、例えば、より少ない演算を必要とすること、及び／又は、
－図２１に示すように、重みの量子化をより粗くすること、例えば、より高速な再構成を可能にすること、及び／又は、
－図２３に示すように、一般的なベースラインＮＮとパーソナライズされたアドバンスドＮＮのような、異なるトレーニング（学習）。
－など、によってベースラインとアドバンスドバリアントに分割することができる。

【0192】

図２１は、ＮＮと差分デルタ信号３４２の変形例を示す図である。ベースラインバージョン、例えば、ＮＮの第２のバージョン３３０₁と、アドバンスドバージョン、例えば、
ＮＮの第１のバージョン３３０₂とが図示されている。図２１は、２つの量子化設定を有
する元のＮＮの単一の層、例えば、対応する層を表現するパラメータテンソル３０から２つの層の変種を作成し、それぞれのデルタ信号３４２を作成する上記の場合の１つを示す
。ベースラインバージョン３３０₁は粗い量子化に関連付けられ、アドバンスドバージョ
ン３３０₂は細かい量子化に関連付けられる。アドバンスドバージョン３３０₂は、ベースラインバージョン３３０₁とは相対的にデルタ符号化することができる。

【0193】

図２２は、元のＮＮの分離のさらなる変形を示す。図２２において、ＮＮ分離のさらなる変形が示される。例えば、左側において、層、例えば、対応する層を表現するパラメータテンソル３０のベースライン部分３０ａおよびアドバンスド部分３０ｂへの分離が示され、すなわち、アドバンスド部分３０ｂがベースライン部分３０ａを拡張している。アドバンスド部分３０ｂの推論には、ベースライン部分３０ａの推論が必要である。図２２の右側では、アドバンスド部分３０ｂの中央部分がベースライン部分３０ａの更新で構成されていることが示されているが、これも図２１に示されるようにデルタ符号化することが可能である。

【0194】

これらの場合、ベースライン３３０₁およびアドバンスド３３０₂のＮＮバージョンのＮＮパラメータ３２、例えば重みは、明確な依存関係を有し、及び／又はＮＮのベースラインバージョン３３０₁は、何らかの形でＮＮのアドバンスドバージョン３３０₂の一部となる。

【0195】

したがって、アドバンスドＮＮ部分、すなわちＮＮの第１のバージョン３３０₂のパラ
メータテンソル３０ｂを、ベースラインＮＮバージョン、すなわちＮＮの第２の部分３３０１のパラメータテンソル３０ｂに対するデルタとして、ＮＮスケールまたは層スケール、あるいはサブ層スケールで符号化することは、コーディング効率、処理オーバーヘッド、並列化などの面で有益である。

【0196】

さらなる変形が図２３に描かれており、そこでは、ＮＮのアドバンスドバージョンが、非可逆圧縮ベースラインＮＮバリアントの存在下での学習によって、元のＮＮに対する圧縮影響を補償するために作成される。アドバンスドＮＮは、ベースラインＮＮと並行して推論され、そのＮＮパラメータ、例えば、重みは、ベースラインＮＮと同じニューロンに接続される。図２３は、例えば、ロッシー符号化されたベースラインＮＮバリアントに基づく増強ＮＮの学習を示す図である。

【0197】

一実施形態では、（サブ）層ビットストリーム、すなわち個別にアクセス可能な部分２００又は個別にアクセス可能なサブ部分３４／４４／２２０は、２つ以上の（サブ）層ビットストリームに分割され、第１のものは（サブ）層のベースラインバージョン３３０₁
、第２のものは第１の（サブ）層のアドバンスドバージョン３３０₂といったように表現
される。ビットストリーム順でベースラインバージョン３３０₁がアドバンスドバージョ
ン３３０₂に先行する。

【0198】

別の実施形態では、（サブ）層ビットストリームは、ビットストリーム内の別の（サブ）層のパラメータテンソル３０の増分更新、例えばデルタパラメータテンソル、すなわちデルタ信号３４２、及び／又はパラメータテンソルを含む増分更新を含むように示される。

【0199】

別の実施形態では、（サブ）層ビットストリームは、パラメータテンソル３０の増分更新を含むマッチング識別子を有する（サブ）層ビットストリームを参照する参照識別子を運ぶ。

【0200】

図２０は、ＮＮ１０の異なるバージョン３３０がデータストリーム４５に符号化されるように層方式でニューラルネットワーク１０の表現が符号化されているデータストリーム４５の実施形態Ｊ１を示す。データストリーム４５は、１つ以上の個別にアクセス可能な
部分２００に構造化される。各部分２００はニューラルネットワーク１０の対応するバージョン３３０に関連する。
データストリーム４５は、ＮＮ１０の第１のバージョン３３０₂が、
第２の部分２００₁に符号化されたＮＮ１０の第２のバージョン３３０₁に対してデルタ符号化３４０されて、及び／又は、
ニューラルネットワークの第１のバージョン３３０₂に基づく推論を実行するために
、各々が、第２の部分２００₁に符号化されたＮＮ１０の第２のバージョン３３０₁の対応するＮＮ部分３３４の実行に追加して実行される１つ以上の補償ＮＮ部分３３２の形態であって、かつ、
それぞれの補償ＮＮ部分３３２及び対応するＮＮ部分３３４の出力３３６が合計される３３８補償ＮＮ部分３３２の形態で、
第１の部分２００₂に符号化される。

【0201】

実施形態によれば、補償ＮＮ部分３３２は、図２１に示すようにデルタ信号３４２、または図２２に示すように追加のテンソルおよびデルタ信号、または例えば図２３に示すように対応するＮＮ部分３３４内のＮＮパラメータとは異なるように学習されたＮＮパラメータ含む場合がある。

【0202】

図２３に示すように実施形態によれば、補償ＮＮ部分３３２は、第２のニューラルネットワークのＮＮ部分の量子化されたＮＮパラメータを含み、第２のニューラルネットワークのＮＮ部分は、ＮＮ１０、すなわち第１のＮＮの対応するＮＮ部分３３４と関連付けられている。第２のニューラルネットワークは、補償ＮＮ部分３３２が、第１のＮＮの対応するＮＮ部分３３４に対する圧縮影響、例えば量子化誤差を補償するために使用され得るように、学習されるかもしれない。それぞれの補償ＮＮ部分３３２および対応するＮＮ部分３３４の出力は、ＮＮ１０の第１のバージョン３３０₂に対応するＮＮパラメータを再
構成して、ＮＮ１０の第１のバージョン３３０₂に基づく推論を可能にするために合計さ
れる。

【0203】

上述した実施形態では、ＮＮ１０の異なるバージョン３３０を１つのデータストリームで提供することに主に焦点を当てているが、異なるバージョン（複数）３３０を異なるデータストリーム（複数）で提供することも可能である。異なるバージョン３３０は、例えば、より単純なバージョンと比較して異なるデータストリームにデルタ符号化される。したがって、別々のデータストリーム（ＤＳ）が使用されるかもしれない。例えば、最初に、初期ＮＮデータを含むＤＳが送信され、後に、更新されたＮＮデータを含むＤＳが送信される。

【0204】

対応する実施形態ＺＪ１は、ＮＮ１０の異なるバージョン３３０がデータストリーム４５に符号化され、データストリーム４５が１つ以上の個別にアクセス可能な部分２００に構造化されるようにニューラルネットワークの表現をＤＳ４５に階層的に符号化する装置に関する。それぞれの部分２００はニューラルネットワーク１０の対応するバージョン３３０に関連する。装置は、
ＮＮ１０の第１のバージョン３３０₂を、
第２の部分２００₁に符号化されたＮＮ１０の第２のバージョン３３０₁に対してデルタ符号化３４０されて、及び／又は、
ＮＮ１０の第１のバージョン３３０₂に基づく推論を実行するために、各々が、第２
の部分２００₁に符号化されたＮＮ１０の第２のバージョン３３０₁の対応するＮＮ部分３３４の実行に追加して実行される１つ以上の補償ＮＮ部分３３２の形態であって、及び、
それぞれの補償ＮＮ部分３３２及び対応するＮＮ部分３３４の出力３３６が合計される３３８補償ＮＮ部分３３２の形態で、
第１の部分２００₂に符号化するように構成されている。

【0205】

別の対応する実施形態ＸＪ１は、層方式で符号化されたＤＳ４５からニューラルネットワーク１０の表現を復号化する装置に関する。ＮＮ１０の異なるバージョン３３０がデータストリーム４５に符号化され、データストリーム４５が１つ以上の個別にアクセス可能な部分２００に構造化され、それぞれの部分２００がニューラルネットワーク１０の対応するバージョン３３０に関連しており、装置は、
第２の部分２００₁に符号化されたＮＮ１０の第２のバージョン３３０₁に対してデルタ復号化３４０を使用することによって、及び／又は、
ＤＳ４５から、それぞれがＮＮ１０の第１のバージョン３３０₂に基づく推論を実行
するために、１つ以上の補償ＮＮ部分３３２を復号化することによって、
第１の部分２００₂から符号化されたＮＮ１０の第１のバージョン３３０₂を復号化するように構成されており、
第２の部分２００₁に符号化されたＮＮ１０の第２のバージョン３３０₁の対応するＮＮ部分３３４の実行に追加して実行され、
それぞれの補償ＮＮ部分３３２および対応するＮＮ部分３３４の出力３３６が合計される３３８。

【0206】

以下では、データストリーム４５の文脈で異なる特徴及び／又は機能性を説明するが、特徴及び／又は機能性は、同じ方法または同様の方法で、実施形態ＺＪ１による装置の特徴及び／又は機能性、又は実施形態ＸＪ１による装置の特徴及び機能性であってもよい。

【0207】

実施形態Ｊ２によれば、実施形態Ｊ１のデータストリーム４５のうち、データストリーム４５は、ＮＮ１０の第１のバージョン３３０₁が、
重み及び／又はバイアスの差、すなわち、例えば図２１に示すように、ＮＮ１０の第１のバージョン３３０₁に関連するＮＮパラメータとＮＮ１０の第２のバージョン３３０₂に関連するＮＮパラメータとの間の差、及び／又は、
例えば図２２に示すように、追加のニューロンまたはニューロンの相互接続、
で第２の部分２００₂に符号化されたＮＮ１０の第２のバージョン３３０₂に対してデルタ符号化３４０され、第１の部分２００₁に符号化されている。

【0208】

実施形態Ｊ３によれば、任意の先の実施形態Ｊ１およびＪ２のＤＳのうち、個別にアクセス可能な部分２００は、例えば図８に示すように、それぞれの個別にアクセス可能な部分２００の始点において、文脈適応型算術符号化を用いて、文脈初期化を使って符号化される。

【0209】

実施形態Ｊ４によれば、任意の前の実施形態Ｊ１～Ｊ３のＤＳのうち、データストリーム４５は、例えば図１１～図１５のうちの１つに示されるように、それぞれの個別にアクセス可能な部分２００は、
それぞれの個別にアクセス可能な部分２００が始まる開始コード２４２、及び／又は、
それぞれの個別にアクセス可能な部分２００の始まりを指すポインタ２２０／２４４、及び／又は、
ＤＳ４５を解析する際に、それぞれの個別にアクセス可能な部分２００をスキップするための、それぞれの個別にアクセス可能な部分２００のデータストリーム長２４６を示すデータストリーム長パラメータを含む。

【0210】

実施形態Ｊ５によれば、先の任意の実施形態Ｊ１～Ｊ４のＤＳ４５のうち、データストリーム４５は、１つ以上の所定の個別にアクセス可能な部分２００のそれぞれについて、例えば図１９に示すように、それぞれの所定の個別にアクセス可能な部分２００を識別するための識別パラメータ３１０を含む。

【0211】

実施形態Ｊ６によれば、先の実施形態Ｊ１～Ｊ５のいずれかのＤＳ４５のうち、ＤＳ４５は、先の実施形態Ａ１～Ｉ８のいずれかによる。

【0212】

６補強データ
図２４ａおよび図２４ｂに示すように、パラメータテンソル３０に追加の補強（または補助／補足）データ３５０が付随するアプリケーション（適用）シナリオが存在する。この補足データ３５０は、通常、ＮＮの復号／再構成／推論には必要ないが、しかし、アプリケーションの観点からは必須となり得る。例としては、例えば、各パラメータ３２の関連性に関する情報（ＳｅｂａｓｔｉａｎＬａｐｕｓｃｈｋｉｎ，２０１９）、または摂動に対する各パラメータ３２の堅牢性を示す間隔または分散などのパラメータ３２の十分な統計に関する情報（ＣｈｒｉｓｔｏｓＬｏｕｉｚｏｓ，２０１７）であってよい。

【0213】

そのような増強情報、すなわち補足データ３５０は、ＤｅｅｐＣＡＢＡＣなどのスキームを使用して増強データ３５０を同様に符号化することが望ましいように、ＮＮのパラメータテンソル３０に関してかなりの量のデータを導入し得る。しかし、増強を必要としないクライアントがデータのこの部分をスキップできるように、唯一の推論の目的のために、このデータをＮＮの復号化に無関係であるとマークすることが重要である。

【0214】

一実施形態では、増強データ３５０は、（サブ）層ビットストリームデータに依存せずに、例えば、個別にアクセス可能な部分２００及び／又は個別にアクセス可能なサブ部分２４０に依存せずに符号化されるが、それぞれの（サブ）層ビットストリームと散在してモデルビットストリーム、すなわちデータストリーム４５を形成する追加の（サブ）層増強ビットストリーム、すなわち、さらなる個別にアクセス可能な部分３５２で運ばれる。図２４ａ及び図２４ｂは、本実施形態を示す。図２４ｂは、増強ビットストリーム３５２を説明する図である。

【0215】

図２４ａ及び２４ｂは実施形態Ｋ１であって、ニューラルネットワークの表現が符号化されたデータストリーム４５を示す。データストリーム４５は、個別にアクセス可能な部分２００に構造化される。それぞれの部分２００はニューラルネットワークの対応するＮＮ部分を表現する。データストリーム４５は、１つ以上の所定の個別にアクセス可能な部分２００それぞれについて、ＮＮの表現を補うための補強データ３５０を含む。代替的に、図２４ｂに示すように、データストリーム４５は、１つ以上の所定の個別にアクセス可能な部分２００について、ＮＮの表現を補足するための補足データ３５０を含む。

【0216】

対応する実施形態ＺＫ１は、ニューラルネットワークの表現をＤＳ４５に符号化する装置に関する。データストリーム４５は、個別にアクセス可能な部分２００に構造化される。それぞれの部分２００は、ニューラルネットワークの対応するＮＮ部分を表現する。装置は、データストリーム４５に、１つ以上の所定の個別にアクセス可能な部分２００それぞれについて、ＮＮの表現を補足するための補足データ３５０を提供するよう構成される。あるいは、装置は、データストリーム４５に、１つ以上の所定の個別にアクセス可能な部分２００について、ＮＮの表現を補足するための補足データ３５０を提供するように構成されている。

【0217】

別の対応する実施形態ＸＫ１は、ＤＳ４５からニューラルネットワークの表現を復号化する装置に関する。データストリーム４５は、個別にアクセス可能な部分２００に構造化されている。それぞれの部分２００は、ニューラルネットワークの対応するＮＮ部分を表現している。装置は、データストリーム４５から、１つ以上の所定の個別にアクセス可能な部分２００のそれぞれについて、ＮＮの表現を補足するための補足データ３５０を復号化するよう構成される。あるいは、装置は、データストリーム４５から、１つ以上の所定
の個別にアクセス可能な部分２００について、ＮＮの表現を補足するための補足データ３５０を復号化するように構成されている。

【0218】

以下では、異なる特徴及び／又は機能性をデータストリーム４５の文脈で説明するが、特徴及び／又は機能性はまた、同じようにまたは同様に、実施形態ＺＫ１による装置の特徴及び／又は機能性、あるいは実施形態ＸＫ１による装置の特徴及び／又は機能性であり得る。

【0219】

実施形態Ｋ２によれば、実施形態Ｋ１のデータストリーム４５のうち、ＤＳ４５は、補足データ３５０をＮＮに基づく推論に必須ではないと示す。

【0220】

実施形態Ｋ３によれば、前の実施形態Ｋ１及びＫ２のいずれかのデータストリーム４５のうち、データストリーム４５は、図２４ｂに示すように、さらなる個別にアクセス可能な部分３５２に符号化された１つ以上の所定の個別にアクセス可能な部分２００について、ＮＮの表現を補足するための補足データ３５０を有する。ＤＳ４５は、１つ以上の所定の個別にアクセス可能な部分２００について、例えば、１つ以上の所定の個別にアクセス可能な部分２００のそれぞれについて、それぞれの所定の個別にアクセス可能な部分２００が対応するＮＮ部分に関連する対応するさらなる所定の個別にアクセス可能な部分３５２を含む。

【0221】

実施形態Ｋ４によれば、先の任意の実施形態Ｋ１～Ｋ３のＤＳ４５のうち、ＮＮ部分は、ＮＮの１つ以上のＮＮ層及び／又はＮＮの所定のＮＮ層が細分化された層部分を含む。図２４ｂによれば、例えば、個別にアクセス可能な部分２００₂及び対応する更なる所定
の個別にアクセス可能な部分３５２は、１つ以上のＮＮ層を含むＮＮ部分に関する。

【0222】

実施形態Ｋ５によれば、任意の前の実施形態Ｋ１～Ｋ４のＤＳ４５のうち、個別にアクセス可能な部分２００は、例えば図８に示すように、それぞれの個別にアクセス可能な部分２００の始点において、文脈適応型算術符号化を用いて、文脈初期化を使って符号化される。

【0223】

実施形態Ｋ６によれば、先の任意の実施形態Ｋ１～Ｋ５のＤＳ４５のうち、データストリーム４５は、例えば図１１～図１５のいずれかに示すように、それぞれの個別にアクセス可能な部分２００について、
それぞれの個別にアクセス可能な部分２００が始まる開始コード２４２、及び／又は、
それぞれの個別にアクセス可能な部分２００の始まりを指すポインタ２２０／２４４、及び／又は、
ＤＳ４５を解析する際にそれぞれの個別アクセス可能部分２００をスキップするための、それぞれの個別にアクセス可能な部分２００のデータストリーム長２４６を示すデータストリーム長パラメータを含む。

【0224】

実施形態Ｋ７によれば、先の任意の実施形態Ｋ１～Ｋ６のＤＳ４５のうち、補足データ３５０は、
ＮＮパラメータの関連性スコア、及び／又は、
ＮＮパラメータの摂動ロバスト性に関するものである。

【0225】

実施形態Ｋ８によれば、先のいずれかの実施形態Ｋ１～Ｋ７のＤＳ４５のうち、ＤＳ４５は、先の実施形態Ａ１～Ｊ６のいずれかによる。

【0226】

７拡張された制御データ
異なるアクセス機能の記述された機能性の他に、拡張された階層的制御データ構造、す
なわち制御データ部分４２０のシーケンス４１０が、異なるアプリケーションおよび使用シナリオのために必要とされるかもしれない。一方では、圧縮されたＮＮ表現（またはビットストリーム）は、ＴｅｎｓｏｒＦｌｏｗまたはＰｙｔｏｒｃｈなどの特定のフレームワークの内部から使用されてもよく、この場合、最小限の制御データ４００のみが、例えば、ｄｅｅｐＣＡＢＡＣ符号化パラメータテンソルを復号化するために必要である。一方、フレームワークの特定のタイプは、復号化器に知られていないかもしれず、その場合、追加の制御データ４００が必要とされる。このように、ユースケースと環境の知識に応じて、図２５に示すように、異なるレベルの制御データ４００が必要とされる場合がある。

【0227】

図２５は、圧縮されたニューラルネットワークのための階層的制御データ（ＣＤ）構造、すなわち制御データ部分４２０のシーケンス４１０を示す。使用環境に応じて、異なるＣＤレベル、すなわち制御データ部分４２０、例えば点線のボックスが存在するかしないかである。図２５において、例えばニューラルネットワークの表現５００を含む圧縮ビットストリームは、上記のモデルビットストリームタイプのいずれでもよく、例えば、サブビットストリームに細分化ありの、あるいは細分化なしのネットワークの全ての圧縮データを含む。

【0228】

したがって、復号化器および符号化器に既知のタイプおよびアーキテクチャを有する特定のネットワーク（例えば、ＴｅｎｓｏｒＦｌｏｗ、Ｐｙｔｏｒｃｈ、Ｋｅｒａｓなど）が圧縮ＮＮ技術を含む場合、圧縮ＮＮビットストリーム（ＣｏｍｐｒｅｓｓｅｄＮＮＢｉｔｓｒｅａｍ）のみが必要である。しかし、復号化器がいかなる符号化器の設定も知らない場合、ネットワークの完全な再構成を可能にすることに加えて、制御データのフルセット、すなわち制御データ部分４２０の完全なシーケンス４１０が必要とされる。

【0229】

異なる階層的制御データ層、すなわち制御データ部４２０の例は、以下の通りである。
－ＣＤレベル１：圧縮データ復号化器制御情報。
－ＣＤレベル２：それぞれのフレームワークからの特定のシンタックス要素（ＴｅｎｓｏｒＦｌｏｗ、Ｐｙｔｏｒｃｈ、Ｋｅｒａｓ）
－ＣＤレベル３：フレームワーク間フォーマット要素、例えば異なるフレームワークで使用するためのＯＮＮＸ（ＯＮＮＸ＝ＯｐｅｎＮｅｕｒａｌＮｅｔｗｏｒｋＥｘｃｈａｎｇｅ）
－ＣＤレベル４：ネットワークのトポロジーに関する情報
－ＣＤレベル５：完全なネットワークパラメータ情報（ネットワークのトポロジーに関する知識が無しで完全な再構成のための）

【0230】

したがって、この実施形態は、Ｎレベル、すなわちＮの制御データ部分４２０の階層的制御データ構造を記述することになる。ここで、０～Ｎレベルは、特定の圧縮のみのコアデータの使用から完全に自己完結したネットワーク再構成までの異なる使用モードを可能にするために存在し得る。レベル、すなわち制御データ部分４２０は、既存のネットワークアーキテクチャおよびフレームワークからのシンタックスを含むことさえある。

【0231】

別の実施形態では、異なるレベル、すなわち制御データ部分４２０は、異なる精度でのニューラルネットワークに関する情報を含んでもよい。例えば、レベル構造は、以下のように構成されてもよい。
－ＣＤレベル１：ネットワークのパラメータに関する情報を内包する。例えば、タイプ、寸法など。
－ＣＤレベル２：ネットワークの層に関する情報を含む。例：タイプ，識別など。
－ＣＤレベル３：ネットワークのトポロジーに関する情報を含む。例：層（レイヤー）間の接続性。
－ＣＤレベル４：ニューラルネットワークのモデルに関する情報を含む。例：バージョ
ン、学習パラメータ、性能など。
－ＣＤレベル５：学習・検証されたデータセットに関する情報を含む。例：１０００ラベルのカテゴリを有する２２７ｘ２２７解像度の入力自然画像など。

【0232】

図２５は、実施形態Ｌ１を示す。データストリーム４５は、ニューラルネットワークの表現５００が符号化されている。データストリーム４５は、制御データ部分４２０のシーケンス４１０に構造化された階層的制御データ４００を含む。制御データ部分４２０は、ＮＮに関する情報を制御データ部分４２０のシーケンス４１０に沿って詳細度を増して提供する。第２の制御データ部分４２０₂の第２の階層的制御データ４００₂は、第１の制御データ部分４２０₁の第１の階層的制御データ４００₁よりも詳細な情報を含む。

【0233】

実施形態によれば、制御データ部分４２０は、追加のトポロジー情報を含むことができる異なるユニットを表現するかもしれない。

【0234】

対応する実施形態ＺＬ１は、ニューラルネットワークの表現５００をＤＳ４５に符号化するための装置に関連する。装置は、制御データ部分４２０のシーケンス４１０に構造化された階層制御データ４００をデータストリーム４５に提供するように構成されている。制御データ部分４２０は、ＮＮに関する情報を制御データ部分４２０のシーケンス４１０に沿って詳細度を増して提供する。

【0235】

別の対応する実施形態ＸＬ１は、ＤＳ４５からニューラルネットワークの表現５００を復号化するための装置に関する。装置は、データストリーム４５から制御データ部分４２０のシーケンス４１０に構造化された階層的制御データ４００を復号化するように構成されている。制御データ部分４２０は、ＮＮに関する情報を制御データ部分４２０のシーケンス４１０に沿って詳細度を増して提供する。

【0236】

以下では、異なる特徴及び／又は機能性をデータストリーム４５の文脈で説明するが、特徴及び／又は機能性は、同じように、または同様に、実施形態ＺＬ１による、または実施形態ＸＬ１による、装置の特徴および機能性であることもできる。

【0237】

実施形態Ｌ２によれば、実施形態Ｌ１のデータストリーム４５のうち、制御データ部分４２０の少なくともいくつかは、ＮＮに関する部分的に冗長である情報を提供する。

【0238】

実施形態Ｌ３によれば、実施形態Ｌ１又はＬ２のデータストリーム４５のうち、第１の制御データ部分４２０₁は、デフォルト設定を意味するデフォルトＮＮタイプを示す方法
でＮＮに関する情報を提供し、第２の制御データ部分４２０₂は、デフォルト設定のそれ
ぞれを示すパラメータを含む。

【0239】

実施形態Ｌ４によれば、先の実施形態Ｌ１～Ｌ３のいずれかのＤＳ４５のうち、ＤＳ４５は、先の実施形態Ａ１～Ｋ８のいずれかによる。

【0240】

実施形態Ｘ１は、任意の以前の実施形態によるデータストリーム４５を復号化するための装置に関する。装置は、データストリーム４５から、例えば、上記実施形態ＸＡ１からＸＬ１のいずれかによるＮＮ１０を導出するように構成されている。例えば、装置は、ＤＳ４５が任意の以前の実施形態に従うように符号化／復号化するようにさらに構成されている。

【0241】

本装置は、例えば、
開始コード２４２を検索し、及び／又は、
データストリーム長４５パラメータを使用して、個別にアクセス可能な部分２００をス
キップする、及び／又は、
ポインタ２２０／２４４を使用して、個別にアクセス可能な部分２００の始まりにおいてデータストリーム４５の解析を再開する、及び／又は、
復号化されたＮＮパラメータ３２’を、符号化順序１０４に従って、ニューロン１４、１８、２０またはニューロン相互接続２２／２４に関連付ける、及び／又は、
文脈適応型算術復号化および文脈初期化を実行する、及び／又は、
逆量子化／値再構成２８０を実行し、及び／又は、
量子化ステップサイズ２６３を計算するために指数の和を実行し、及び／又は、
エスケープコードを推定するなど、所定のインデックス間隔２６８を離れる量子化インデックス３２’’に応答して、量子化インデックス－再構成レベルマッピング２６５のルックアップを実行する、及び／又は、
ある個別にアクセス可能な部分２００に対してハッシュを実行し、またはエラー検出／訂正コードを適用し、その結果を対応する識別パラメータ３１０と比較して、個別にアクセス可能な部分２００の正しさをチェックする、及び／又は、
基礎となるＮＮバージョン３３０に重み及び／又はバイアス差を加えること、及び／又は、基礎となるＮＮバージョン３３０に追加のニューロン１４、１８、２０もしくはニューロン相互接続２２／２４を加えること、又は１つ以上の補償ＮＮ部分と対応するＮＮ部分の共同実行とその出力の合計を行うことによってＮＮ１０のあるバージョン３３０を再構成する、及び／又は、
現在読み込まれている制御データ部４２０が装置に既知のパラメータ状態を想定した時点で読み出しを停止し、所定の程度に適合する程度の態様で情報、すなわち階層的制御データ４００を提供しながら、制御データ部４２０を順次読み出す。

【0242】

実施形態Ｙ１は、ＮＮ１０を使用して推論を実行する装置に関するものであり、実施形態Ｘ１に従ってデータストリーム４５を復号化してデータストリーム４５からＮＮ１０を導出する装置と、ＮＮ１０に基づいて推論を実行するように構成されたプロセッサと、を含む。

【0243】

実施形態Ｚ１は、任意の前の実施形態によるデータストリーム４５を符号化するための装置、例えば、上記実施形態ＺＡ１～ＺＬ１のいずれかによる、例えば、ＤＳ４５が任意の前の実施形態に従うように符号化／復号化するようにさらに構成された装置に関するものである。

【0244】

この装置は、例えば、最適な圧縮効率のために最適なものを見つけるために、符号化順序１０４を選択する。

【0245】

実施形態Ｕは、実施形態ＸＡ１～ＸＬ１またはＺＡ１～ＺＬ１のいずれかの装置によって実行される方法に関するものである。

【0246】

実施形態Ｗは、コンピュータによって実行されるとき、コンピュータに実施形態Ｕの方法を実行させるためのコンピュータプログラムに関するものである。

【0247】

実施形態の変形例。

【0248】

いくつかの側面は装置の文脈で説明されてきたが、これらの側面は、ブロックまたは装置が方法ステップまたは方法ステップの特徴に対応する、対応する方法の説明も表現することは明らかである。同様に、方法ステップの文脈で説明された側面は、対応するブロックまたは項目または対応する装置の特徴の説明も表現している。方法ステップのいくつかまたはすべては、例えばマイクロプロセッサ、プログラマブルコンピュータ、または電子回路のようなハードウェア装置によって（またはそれを使用して）実行されてもよい。い
くつかの実施形態では、最も重要な方法ステップの１つまたはそれ以上が、そのような装置によって実行されてもよい。

【0249】

特定の実装要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実装することができる。実装は、デジタル記憶媒体、例えばフロッピー（登録商標）ディスク、ＤＶＤ、Ｂｌｕ－Ｒａｙ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはＦＬＡＳＨメモリであって、その上に格納された電子的に読み取り可能な制御信号を有し、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協力する（または協力できる）ものを使用して実行することができる。したがって、デジタル記憶媒体は、コンピュータ読取可能であってもよい。

【0250】

本発明によるいくつかの実施形態は、電子的に読み取り可能な制御信号を有するデータキャリアからなり、本明細書に記載の方法の１つが実行されるように、プログラム可能なコンピュータシステムと協働することが可能なものである。

【0251】

一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実施することができ、そのプログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに、方法の１つを実行するために動作可能である。プログラムコードは、例えば、機械読み取り可能な担体に格納されてもよい。

【0252】

他の実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを、機械読み取り可能な担体に格納することによって構成される。

【0253】

言い換えれば、本発明方法の実施形態は、それゆえ、コンピュータプログラムがコンピュータ上で実行される場合、本明細書に記載された方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

【0254】

本発明方法のさらなる実施形態は、したがって、本明細書に記載の方法の１つを実行するためのコンピュータプログラムをその上に記録してなるデータ担体（またはデジタル記憶媒体、またはコンピュータ読取可能媒体）である。データキャリア、デジタル記憶媒体、または記録媒体は、典型的には、有形及び／又は非遷移的である。

【0255】

したがって、本発明方法のさらなる実施形態は、本明細書に記載された方法の１つを実行するためのコンピュータプログラムを表現するデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、データ通信接続、例えばインターネットを介して転送されるように構成されてもよい。

【0256】

さらなる実施形態は、本明細書に記載された方法の１つを実行するように構成されたまたは適合された処理手段、例えばコンピュータ、またはプログラマブルロジックデバイスを含む。

【0257】

さらなる実施形態は、本明細書に記載された方法の１つを実行するためのコンピュータプログラムをその上にインストールしたコンピュータを具備する。

【0258】

本発明によるさらなる実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを受信機に（例えば、電子的または光学的に）転送するように構成された装置またはシステムからなる。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイス等であってもよい。装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを含んでいてもよい。

【0259】

いくつかの実施形態では、プログラマブルロジックデバイス（例えば、フィールドプログラマブルゲートアレイ）を使用して、本明細書に記載の方法の機能性の一部または全部を実行することができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載される方法の１つを実行するためにマイクロプロセッサと協働してよい。一般に、本方法は、任意のハードウェア装置によって実行されることが好ましい。

【0260】

本書に記載された装置は、ハードウェア装置を用いて、またはコンピュータを用いて、あるいはハードウェア装置とコンピュータの組合せを用いて実施することができる。

【0261】

本明細書に記載された装置、又は本明細書に記載された装置の任意の構成要素は、少なくとも部分的にハードウェア及び／又はソフトウェアで実装されてもよい。

【0262】

本明細書に記載される方法は、ハードウェア装置を用いて、又はコンピュータを用いて、又はハードウェア装置とコンピュータの組合せを用いて実行されてもよい。

【0263】

本明細書に記載された方法、又は本明細書に記載された装置の任意の構成要素は、少なくとも部分的にハードウェア及び／又はソフトウェアによって実行されてもよい。

【0264】

以上説明した実施形態は、本発明の原理を説明するためのものに過ぎない。本明細書に記載された配置および詳細の修正および変形は、当業者には明らかであることが理解される。したがって、差し迫った特許請求の範囲の範囲によってのみ限定され、本明細書における実施形態の説明および解説によって提示される特定の詳細によって限定されないことが意図される。

【0265】

８．参照
Andrew Kerr, D. M. (2017, 5). Retrieved from https://devblogs.nvidia.com/cutlass-linear-algebra-cuda/
Chollet, F. (2016). Xception: Deep Learning with Depthwise Separable Convolutions. Retrieved from https://arxiv.org/abs/1610.02357
Christos Louizos, K. U. (2017). Bayesian Compression for Deep Learning. NI PSSebastian Lapuschkin, S. W.-R. (2019). Unmasking Clever Hans predictors and asse
ssing what machines really learn. Nature Comminications.
Tao, K. C. (2018). Once for All: A Two-Flow Convolutional Neural Network for Vis
ual Tracking. IEEE Transactions on Circuits and Systems for Video Techno logy, 3377-3386

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7a】

【図7b】

【図7c】

【図7d】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】

【図14a】

【図14b】

【図15】

【図16】

【図17】

【図18】

【図19】

【図20】

【図21】

【図22】

【図23】

【図24a】

【図24b】

【図25】

【手続補正書】

【提出日】2023-11-06

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化されるように、ニューラルネットワーク（１０）の表現を前記データストリーム（４５）に符号化する装置であって、
それぞれの部分は前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現しており、前記装置は前記データストリーム（４５）に対して、１つ以上の既定の個別にアクセス可能な部分のそれぞれについて、前記それぞれの既定の個別にアクセス可能な部分の始まりを指すポインタ（２２０、２４４）を提供するよう構成される、装置。

【請求項2】

データストリーム（４５）が１つ以上の個別にアクセス可能な部分（２００）に構造化され、ここでそれぞれの個別にアクセス可能な部分は、ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現するように、且つ前記データストリーム（４５）が既定の部分内で、個別にアクセス可能なサブ部分（４３、４４、２４０）にさらに構造化され、ここでそれぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワークの前記それぞれのニューラルネットワーク層の対応するニューラルネットワーク部分を表現するように、前記ニューラルネットワーク（１０）の表現を前記データストリーム（４５）に符号化するための装置であって、前記装置は、前記データストリーム（４５）に対し、１つ以上の既定の個別にアクセス可能なサブ部分（４３、４４、２４０）のそれぞれについて、
それぞれの前記既定の個別にアクセス可能なサブ部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの既定の個別にアクセス可能なサブ部分の始まりを指し示すポインタ（２４４）、及び／又は、
前記データストリームを解析する際に、前記それぞれの既定の個別にアクセス可能なサブ部分をスキップするための、前記それぞれの既定の個別にアクセス可能なサブ部分のデータストリーム長（２４６）を示すデータストリーム長パラメータ
を提供するように構成される、装置。

【請求項3】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化するための装置であって、
前記データストリーム（４５）は１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの部分は前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現し、前記装置は、１つ以上の既定の個別にアクセス可能な部分のそれぞれについて、それぞれの前記既定の個別にアクセス可能な部分の始まりを指し示すポインタ（２２０、２４４）を前記データストリーム（４５）から復号化するよう構成される、装置。

【請求項4】

それぞれの個別にアクセス可能な部分は、
前記ニューラルネットワークの対応するニューラルネットワーク層（２１０）、又は、
前記ニューラルネットワークのニューラルネットワーク層（２１０）のニューラルネットワーク部分（４３、４４、２４０）
を表現する、請求項３に記載の装置。

【請求項5】

前記装置は、前記データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化するように構成され、前記データストリーム（４５）は１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現し、前記データストリーム（４５）は既定の部分内で、個別にアクセス可能なサブ部分（４３、４４、２４０）にさらに構造化されており、それぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワークの前記それぞれのニューラルネットワーク層（２１０、３０）の対応するニューラルネットワーク部分を表現し、前記装置は、１つ以上の既定の個別にアクセス可能なサブ部分（４３、４４、２４０）のそれぞれについて、
それぞれの前記既定の個別にアクセス可能なサブ部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの既定の個別にアクセス可能なサブ部分の始まりを指し示すポインタ（２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの既定の個別にアクセス可能なサブ部分をスキップするための、前記それぞれの既定の個別にアクセス可能なサブ部分のデータストリーム長（２４６）を示すデータストリーム長パラメータ
を前記データストリーム（４５）から復号化するように構成される、
請求項３または請求項４に記載の装置。

【請求項6】

前記装置は、それぞれの個別にアクセス可能な部分およびそれぞれの個別にアクセス可能なサブ部分の始点において、文脈適応型算術復号化を用いて、かつ、文脈初期化を用いて、前記ニューラルネットワークの表現を前記データストリーム（４５）から復号化するように構成される、請求項５に記載の装置。

【請求項7】

データストリーム（４５）からニューラルネットワーク（１０）の表現を復号化するための装置であって、
前記データストリーム（４５）は、１つ以上の個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク層（２１０、３０）を表現し、前記データストリーム（４５）は、既定の部分内で、個別にアクセス可能なサブ部分（４３、４４、２４０）にさらに構造化され、それぞれのサブ部分（４３、４４、２４０）は、前記ニューラルネットワークのそれぞれの前記ニューラルネットワーク層（２１０、３０）の対応するニューラルネットワーク部分を表現し、前記装置は、１つ以上の既定の個別にアクセス可能なサブ部分（４３、４４、２４０）のそれぞれについて、
それぞれの前記既定の個別にアクセス可能なサブ部分が始まる開始コード（２４２）、及び／又は、
前記それぞれの既定の個別にアクセス可能なサブ部分の始まりを指し示すポインタ（２４４）、及び／又は、
前記データストリーム（４５）を解析する際に、前記それぞれの既定の個別にアクセス可能なサブ部分をスキップするための、前記それぞれの既定の個別にアクセス可能なサブ部分のデータストリーム長（２４６）を示すデータストリーム長パラメータ
を前記データストリーム（４５）から復号化するように構成される、装置。

【請求項8】

前記装置は、それぞれの個別にアクセス可能な部分およびそれぞれの個別にアクセス可能なサブ部分の始点において、文脈適応型算術復号化を用いて、かつ、文脈初期化を用いて、前記ニューラルネットワークの前記表現を前記データストリーム（４５）から復号化するように構成される、請求項７に記載の装置。

【請求項9】

前記装置はニューラルネットワーク（１０）の表現をデータストリーム（４５）から復号化するように構成され、前記データストリーム（４５）は個別にアクセス可能な部分（２００）に構造化され、それぞれの個別にアクセス可能な部分は、前記ニューラルネットワークの対応するニューラルネットワーク部分を表現し、前記装置は、１つ以上の既定の個別にアクセス可能な部分（２００）のそれぞれについて、前記ニューラルネットワーク（１０）を推論に使用する際に使用しなければならないまたは任意に使用できる１つ以上の処理オプション（２５２）を示す処理オプションパラメータ（２５０）を前記データストリーム（４５）から復号化するように構成される、請求項３乃至８のいずれかに記載の装置。

【請求項10】

前記処理オプションパラメータ（２５０）は、
前記それぞれの既定の個別にアクセス可能な部分の並列処理能力、及び／又は、
前記それぞれの既定の個別にアクセス可能な部分のサンプル単位並列処理能力（２５２₂）、及び／又は、
前記それぞれの既定の個別にアクセス可能な部分のチャネル単位並列処理能力（２５２₁）、及び／又は、
前記それぞれの既定の個別にアクセス可能な部分の分類カテゴリ単位並列処理能力、及び／又は、
同じニューラルネットワーク部分に関連するが、前記データストリーム（４５）に層方式で符号化されている前記ニューラルネットワークのバージョン（３３０）のうちの別のバージョンに属する、前記データストリーム（４５）の別の個別にアクセス可能な部分から得られる計算結果に対する前記それぞれの既定の個別にアクセス可能な部分が表現する前記ニューラルネットワーク部分の依存性
を含む既定の処理オプション（２５２）のセットのうちから１つ以上の利用可能な前記処理オプション（２５２）を示す、請求項９に記載の装置。

【請求項11】

ニューラルネットワークを用いて推論を行うための装置であって、
請求項３乃至１０のいずれかに記載の、データストリーム（４５）を復号化して前記データストリーム（４５）から前記ニューラルネットワークを導出するための装置と、
前記ニューラルネットワークに基づいて前記推論を実行するように構成されたプロセッサと、
を含む、装置。

【請求項12】

データストリームが１つ以上の個別にアクセス可能な部分に構造化されるように、ニューラルネットワークの表現を前記データストリームに符号化するための方法であって、
各部分は前記ニューラルネットワークの対応するニューラルネットワーク層を表現し、前記方法は、１つ以上の既定の個別にアクセス可能な部分のそれぞれについて、それぞれの前記既定の個別にアクセス可能な部分の始まりを指し示すポインタを前記データストリームに提供するステップを含む、方法。

【請求項13】

データストリームが１つ以上の個別にアクセス可能な部分に構造化され、ここでそれぞれの個別にアクセス可能な部分がニューラルネットワークの対応するニューラルネットワーク層を表現するように、且つ前記データストリームが既定の部分内で、個別にアクセス可能なサブ部分にさらに構造化され、ここでそれぞれのサブ部分は前記ニューラルネットワークの前記それぞれのニューラルネットワーク層の対応するニューラルネットワーク部分を表現するように、ニューラルネットワークの表現を前記データストリームに符号化する方法であって、前記方法は、１つ以上の既定の個別にアクセス可能なサブ部分のそれぞれについて、
それぞれの前記既定の個別にアクセス可能なサブ部分が始まる開始コード、及び／又は、
前記それぞれの既定の個別にアクセス可能なサブ部分の始まりを指し示すポインタ、及び／又は、
前記データストリームを解析する際に、前記既定の個別にアクセス可能なサブ部分をスキップするための、前記既定の個別にアクセス可能なサブ部分のデータストリーム長を示すデータストリーム長パラメータ、
を前記データストリームに提供するステップを含む、方法。

【請求項14】

データストリームからニューラルネットワークの表現を復号化するための方法であって、
前記データストリームは１つ以上の個別にアクセス可能な部分に構造化され、各部分は前記ニューラルネットワークの対応するニューラルネットワーク層を表現し、前記方法は、１つ以上の既定の個別にアクセス可能な部分のそれぞれについて、それぞれの前記既定の個別にアクセス可能な部分の始まりを指し示すポインタを前記データストリームから復号化するステップを含む、方法。

【請求項15】

データストリームからニューラルネットワークの表現を復号化するための方法であって、
前記データストリームは１つ以上の個別にアクセス可能な部分に構造化され、それぞれの個別にアクセス可能な部分は前記ニューラルネットワークの対応するニューラルネットワーク層を表現し、前記データストリームは、既定の部分内で、個別にアクセス可能なサブ部分にさらに構造化され、それぞれのサブ部分は前記ニューラルネットワークのそれぞれの前記ニューラルネットワーク層の対応するニューラルネットワーク部分を表現し、前記方法は、１つ以上の既定の個別にアクセス可能なサブ部分のそれぞれについて、
それぞれの前記既定の個別にアクセス可能なサブ部分が始まる開始コード、及び／又は、
前記それぞれの既定の個別にアクセス可能なサブ部分の始まりを指し示すポインタ、及び／又は、
前記データストリームを解析する際に、前記既定の個別にアクセス可能なサブ部分をスキップするための、前記それぞれの既定の個別にアクセス可能なサブ部分のデータストリーム長を示すデータストリーム長パラメータ、
を前記データストリームから復号化するステップを含む、方法。

【請求項16】

コンピュータによって実行されると、前記コンピュータに請求項１２乃至１５のいずれかに記載の方法を実行させるためのコンピュータプログラム。

【外国語明細書】

知財求人

青山学院大学 (神奈川県相模原市中央区淵野辺)

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版