IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フォンダシオン ベー-コムの特許一覧

特表2023-534481ニューラルネットワークを使用したビデオ復号化
<>
  • 特表-ニューラルネットワークを使用したビデオ復号化 図1
  • 特表-ニューラルネットワークを使用したビデオ復号化 図2
  • 特表-ニューラルネットワークを使用したビデオ復号化 図3
  • 特表-ニューラルネットワークを使用したビデオ復号化 図4
  • 特表-ニューラルネットワークを使用したビデオ復号化 図5
  • 特表-ニューラルネットワークを使用したビデオ復号化 図6
  • 特表-ニューラルネットワークを使用したビデオ復号化 図7
  • 特表-ニューラルネットワークを使用したビデオ復号化 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-08-09
(54)【発明の名称】ニューラルネットワークを使用したビデオ復号化
(51)【国際特許分類】
   H04N 19/70 20140101AFI20230802BHJP
   H04N 19/85 20140101ALI20230802BHJP
   G06V 10/82 20220101ALI20230802BHJP
   G06T 7/00 20170101ALI20230802BHJP
【FI】
H04N19/70
H04N19/85
G06V10/82
G06T7/00 350C
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023502953
(86)(22)【出願日】2021-07-13
(85)【翻訳文提出日】2023-03-15
(86)【国際出願番号】 EP2021069519
(87)【国際公開番号】W WO2022013249
(87)【国際公開日】2022-01-20
(31)【優先権主張番号】2007529
(32)【優先日】2020-07-17
(33)【優先権主張国・地域又は機関】FR
(81)【指定国・地域】
(71)【出願人】
【識別番号】521196970
【氏名又は名称】フォンダシオン ベー-コム
【氏名又は名称原語表記】FONDATION B-COM
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100092624
【弁理士】
【氏名又は名称】鶴田 準一
(74)【代理人】
【識別番号】100114018
【弁理士】
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100153729
【弁理士】
【氏名又は名称】森本 有一
(74)【代理人】
【識別番号】100151459
【弁理士】
【氏名又は名称】中村 健一
(72)【発明者】
【氏名】フェリクス アンリ
(72)【発明者】
【氏名】ゴルドン クラール
【テーマコード(参考)】
5C159
5L096
【Fターム(参考)】
5C159KK13
5C159LA00
5C159RB09
5C159RC11
5C159RC24
5C159UA02
5C159UA05
5L096DA02
5L096HA02
5L096HA11
5L096KA01
5L096KA04
(57)【要約】
データストリームは、インジケータ(IND)と、ビデオ又はオーディオコンテンツを表すデータ(Fnn)とを含む。このデータストリームを復号化する方法は、インジケータ(IND)を復号化して、表現データ(Fnn)を復号化するために使用される人工ニューラルネットワークがデータストリーム中に符号化されるか、又は所定の人工ニューラルネットワークセットの一部を形成するかを特定するステップ(E60)と、表現データ(Fnn)を人工ニューラルネットワークによって復号化するステップ(E70)と、を含む。インジケータ(IND)を復号化することにより、人工ニューラルネットワークが上述の所定のセットの一部を形成することが特定される場合、方法は、ニューラルネットワークの識別子(Inn)を復号化するステップ(E62)を伴う。関連する復号化装置及び関連するデータストリームも記載される。
【特許請求の範囲】
【請求項1】
インジケータ(IND、IND’)と、オーディオ又はビデオコンテンツを表すデータ(Fnn)とを含むデータストリームを復号化する方法であって、
- 前記インジケータ(IND、IND’)を復号化して、前記表現データ(Fnn)を復号化するために使用される人工ニューラルネットワーク(18)が前記データストリーム中で符号化されるか、又は所定の人工ニューラルネットワークセットに属するかを特定するステップ(E60)と、
- 前記表現データ(Fnn)を前記人工ニューラルネットワーク(18)によって復号化するステップ(D70)と、
を含む方法。
【請求項2】
前記コンテンツは、ビデオシーケンスの第一の部分であり、前記ビデオシーケンスは、前記第一の部分及び第二の部分を含み、前記表現データを復号化する前記ステップは、前記第一の部分を生成し、前記方法は、他のデータを別の人工ニューラルネットワークによって復号化して、前記第二の部分を生成するステップをさらに含む、請求項1に記載の復号化方法。
【請求項3】
前記他の人工ニューラルネットワークは、前記人工ニューラルネットワークの構造と同一の構造を有する、請求項2に記載の復号化方法。
【請求項4】
前記第一の部分及び前記第二の部分は、使用される前記コンテンツの表現フォーマットについて2つの画像グループをそれぞれ形成する、請求項2又は3に記載の復号化方法。
【請求項5】
人工ニューラルネットワークのリスト(L)を、データストリームの送信を制御するための装置に送信するステップ(E50)を含む、請求項1~4の何れか一項に記載の復号化方法。
【請求項6】
前記インジケータ(IND)を復号化することにより、前記人工ニューラルネットワーク(18)が前記所定のセットに属することが特定される場合、前記ニューラルネットワーク(18)の識別子(Inn)を復号化するステップ(E62)を含む、請求項1~5の何れか一項に記載の復号化方法。
【請求項7】
記憶ユニット(12)内において、前記復号化された識別子(Inn)によって識別された前記人工ニューラルネットワーク(18)のパラメータを読み出すステップを含む、請求項6に記載の復号化方法。
【請求項8】
前記記憶ユニット(12)は、ランダムアクセスデコーダを形成する第一の人工ニューラルネットワークを表す第一のパラメータセットと、低レイテンシデコーダを形成する第二の人工ニューラルネットワークを表す第二のパラメータセットとを記憶する、請求項7に記載の復号化方法。
【請求項9】
前記復号化された識別子によって識別された前記人工ニューラルネットワークに関するデータがない場合、エラーメッセージを生成するステップを含む、請求項6に記載の復号化方法。
【請求項10】
リモートサーバから、前記復号化された識別子(Inn)によって識別された前記人工ニューラルネットワーク(18)のパラメータを受信するステップを含む、請求項6に記載の復号化方法。
【請求項11】
前記インジケータ(IND’)を復号化することにより、前記人工ニューラルネットワーク(18)が前記データストリーム中で符号化されることが特定される場合、前記データストリームに含まれる、前記人工ニューラルネットワーク(18)を符号化するデータ(Rc)を復号化して、前記人工ニューラルネットワーク(18)のパラメータを取得するステップ(E66)を含む、請求項1~5の何れか一項に記載の復号化方法。
【請求項12】
復号化装置であって、
- インジケータ(IND、IND’)と、オーディオ又はビデオコンテンツを表すデータ(Fnn)とを含むデータストリームを受信するためのユニット(11)と、
- 前記インジケータ(IND、IND’)を復号化することにより、前記表現データ(Fnn)を復号化するために使用される人工ニューラルネットワーク(18)が所定の人工ニューラルネットワークセットに属するか、又は前記データストリーム中で符号化されるかを特定し、且つ前記表現データを前記人工ニューラルネットワーク(18)によって復号化するように設計された復号化アセンブリ(14、16)と、
を含む複合化装置。
【請求項13】
データストリームであって、オーディオ又はビデオコンテンツを表すデータ(Fnn)と、前記表現データ(Fnn)を復号化するために使用される人工ニューラルネットワーク(18)が前記データストリーム中で符号化されるか、又は所定の人工ニューラルネットワークセットに属するかを示すインジケータ(IND、IND’)とを含むデータストリーム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオビジュアルコンテンツの復号化の技術分野に関する。
【0002】
特に、本発明は、データストリームを復号化する方法並びに関連する装置及びデータストリームに関する。
【背景技術】
【0003】
ビデオコンテンツを表すデータを人工ニューラルネットワークによって圧縮することが提案されている。したがって、圧縮データの復号化は、他の人工ニューラルネットワークによって実行され得、これは、例えば、2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR),Long Beach,CA,USA,2019,pp.10998-11007のGuo Lu et al.による記事「DVC:An End-to-end Deep Video Compression Framework」に記載されている。
【発明の概要】
【課題を解決するための手段】
【0004】
これに関して、本発明は、インジケータと、オーディオ又はビデオコンテンツを表すデータとを含むデータストリームを復号化する方法を提案し、この方法は、
- インジケータを復号化して、前記表現データを復号化するために使用される人工ニューラルネットワークがデータストリーム中で符号化されるか、又は所定の人工ニューラルネットワークセットに属するかを特定するステップと、
- 前記表現データを人工ニューラルネットワークによって復号化するステップと、
を含む。
【0005】
このようなインジケータにより、したがって、デコーダは、コンテンツを表すデータを復号化するために使用される人工ニューラルネットワークにそれがアクセスすることができる方法がわかる。
【0006】
この復号化方法は、インジケータを復号化することにより、人工ニューラルネットワークが前記所定のセットに属することが特定される場合、ニューラルネットワークの識別子を復号化するステップを含み得る。
【0007】
本発明は、元々それ自体知られている方法において、オーディオ又はビデオコンテンツを表すデータと、所定の人工ニューラルネットワークセットのうちの1つの人工ニューラルネットワークセットを指定する識別子とを含むデータストリームを復号化する方法も提案し、この方法は、
- 識別子を復号化するステップと、
- 前記表現データを、復号化された識別子によって指定される人工ニューラルネットワークによって復号化するステップと、
を含む。
【0008】
識別子の復号化は、したがって、後述するように、所定の人工ニューラルネットワークセット、例えば電子復号化装置がアクセスできる所定の人工ニューラルネットワークセットのうち、何れの人工ニューラルネットワークセットを使用しなければならないかを示す。
【0009】
1つの可能性によれば、復号化方法は、記憶ユニット内において、復号化された識別子によって識別された人工ニューラルネットワークのパラメータを読み出すステップをさらに含み得る。
【0010】
この記憶ユニットは、ランダムアクセスデコーダを形成する第一の人工ニューラルネットワークを表す第一のパラメータセット及び/又は低レイテンシデコーダを形成する第二の人工ニューラルネットワークを表す第二のパラメータセットを記憶するようになされ得る。
【0011】
さらに、復号化方法は、復号化された識別子によって識別された人工ニューラルネットワークに関するデータが(ここでは記憶ユニット内に)ない場合、エラーメッセージを生成するステップを含み得る。
【0012】
第二の可能性によれば、方法は、リモートサーバから、復号化された識別子によって識別された人工ニューラルネットワークのパラメータを受信するステップを含み得る。
【0013】
さらに、復号化方法は、インジケータを復号化することにより、人工ニューラルネットワークがデータストリーム中で符号化されることが特定される場合、データストリームに含まれる、人工ニューラルネットワークを符号化するデータを復号化して、人工ニューラルネットワークのパラメータを取得するステップを含み得る。
【0014】
考え得る実施形態によれば、復号化方法は、人工ニューラルネットワークのリストを、データストリームの送信を制御するための装置に送信する(予備的)ステップを含み得る。特定の実施形態において、この人工ニューラルネットワークリストは、前述の所定のセットに対応し得る。換言すれば、この場合、所定の人工ニューラルネットワークセットは、このリストの人工ニューラルネットワークを含み得る(又はそれによって形成され得る)。
【0015】
コンテンツは、実際には、ビデオシーケンスの第一の部分を含み得、このビデオシーケンスは、したがって、前記第一の部分及び第二の部分を含み得る。
【0016】
この場合、前記表現データを復号化するステップは、前記第一の部分を生成し、方法は、他のデータを別の人工ニューラルネットワークによって復号化して、第二の部分を生成するステップをさらに含み得る。
【0017】
考え得る実施形態によれば、他の人工ニューラルネットワークは、前記人工ニューラルネットワークの構造と同一の構造を有し、それにより電子復号化装置内での人工ニューラルネットワークの更新が単純化される。
【0018】
第一の部分及び上述の第二の部分は、例えば、使用されるコンテンツの表現フォーマットについて2つの画像グルーブをそれぞれ形成する。
【0019】
本発明は、復号化装置も提案し、これは、
- インジケータと、オーディオ又はビデオコンテンツを表すデータとを含むデータストリームを受信するためのユニットと、
- インジケータを復号化することにより、前記表現データを復号化するために使用される人工ニューラルネットワークが所定の人工ニューラルネットワークセットに属するか、又はデータストリーム中で符号化されるかを特定し、且つ前記表現データを人工ニューラルネットワークによって復号化するように設計された復号化アセンブリと、
を含む。
【0020】
本発明は、復号化装置をさらに提案し、これは、
- オーディオ又はビデオコンテンツを表すデータと、所定の人工ニューラルネットワークセットのうちの1つの人工ニューラルネットワークを指定する識別子とを含むデータストリームを受信するためのユニットと、
- 識別子を復号化し、且つ前記表現データを、前記復号化された識別子によって指定される人工ニューラルネットワークによって復号化するように設計された復号化アセンブリと、
を含む。
【0021】
後述の実施形態において、このような復号化アセンブリは、インジケータ及び/若しくは識別子を復号化するように設計若しくはプログラムされたプロセッサ及び/又はある時点で同じ種類の複数の動作を並列に行い、且つ前述の表現データを復号化するための上述の人工ニューラルネットワークを実装するように設計された並列処理ユニットを含む。
【0022】
本発明は、データストリームも提案し、これは、オーディオ又はビデオコンテンツを表すデータと、前記表現データを復号化するために使用される人工ニューラルネットワークがデータストリーム中で符号化されるか、又は所定の人工ニューラルネットワークセットに属するかを示すインジケータとを含む。
【0023】
本発明は、最後に、データストリームを提案し、これは、オーディオ又はビデオコンテンツを表すデータと、所定の人工ニューラルネットワークセットのうち、前記表現データを復号化するために使用される1つの人工ニューラルネットワークを指定する識別子とを含む。
【0024】
当然のことながら、本発明の様々な特徴、代替形態及び実施形態は、これらが相互に矛盾しないか又は排他的でない限り、各種の組合せによって相互に関連付けられ得る。
【0025】
さらに、本発明の他の様々な特徴は、本発明の非限定的な実施形態を図解する下記の図面に関して行われる以下の説明から明らかになるであろう。
【図面の簡単な説明】
【0026】
図1】本発明の枠組み内で使用される電子符号化装置を示す。
図2図1の電子符号化装置内で実行される符号化方法のステップを示すフローチャートである。
図3図2の方法によって得られるデータストリームの第一の例である。
図4図2の方法によって得られるデータストリームの第二の例である。
図5図2の方法によって得られるデータストリームの第三の例である。
図6図2の方法によって得られるデータストリームの第四の例である。
図7】本発明の実施形態による電子符号化装置を示す。
図8図7の電子復号化装置内で実行される復号化方法のステップを示すフローチャートである。
【発明を実施するための形態】
【0027】
図1は、少なくとも1つの人工ニューラルネットワーク8を使用する電子符号化装置2を示す。
【0028】
電子符号化装置2は、プロセッサ4(例えば、マイクロプロセッサ)及び並列処理ユニット6、例えばグラフィック処理ユニット、すなわちGPU又はテンソル処理ユニット、すなわちTPUを含む。
【0029】
図1に概略的に示されるように、プロセッサ4は圧縮されることになるオーディオ又はビデオコンテンツを表すデータP、B、ここではフォーマットデータPとコンテンツデータBを受信する。
【0030】
フォーマットデータPは、オーディオ又はビデオコンテンツの表現フォーマットの特性、例えばビデオコンテンツの場合には画像サイズ(ピクセルの単位)、フレームレート、輝度情報のバイナリ深度及び色差情報のバイナリ深度を示す。
【0031】
コンテンツデータBは、オーディオ又はビデオコンテンツの(ここでは圧縮されていない)表現を形成する。例えばビデオコンテンツの場合、コンテンツデータは、画像シーケンスの各画像の各画素について、そのピクセルの輝度値を表すデータ及び/又はピクセルの色差値を表すデータを含む。
【0032】
並列処理ユニット6は、プロセッサ4によって構成された後に人工ニューラルネットワーク8を実装するように設計される。その目的のために、並列処理ユニットはある時点で同じ種類の複数の動作を並列に行うように設計される。
【0033】
以下に説明するように、人工ニューラルネットワーク8は、圧縮データCを得ることを目的として、コンテンツデータBの処理の枠内で使用される。
【0034】
本明細書に記載の実施形態において、コンテンツデータBが人工ニューラルネットワーク8の入力で適用されると、人工ニューラルネットワーク8は出力で圧縮データCを生成する。
【0035】
人工ニューラルネットワーク8の入力で適用された(すなわち人工ニューラルネットワーク8の入力層で適用された)コンテンツデータBは、画像のブロック、又は画像成分のブロック(例えば、輝度若しくは色差成分のブロック又はこの画像の色成分のブロック)、又はビデオシーケンスの画像、又はビデオシーケンスの画像の成分(例えば、輝度若しくは色差成分又は色成分)、又はビデオシーケンスの一連の画像も表し得る。
【0036】
例えば、この場合、入力層のニューロンの少なくとも幾つかは、画像成分のピクセル値をそれぞれ受信するように適合され得、前記値は、コンテンツデータBの1つによって表される。
【0037】
代替として、コンテンツデータBの処理は、幾つかの人工ニューラルネットワークの使用を含み得、これは、例えば、前述の記事、2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR),June 2019のGuo Lu et al.による「DVC:An End-to-end Deep Video Compression Framework」に記載されている。
【0038】
これから電子符号化装置2によって実行される符号化方法の例を、図2を参照しながら説明する。
【0039】
プロセッサ4にリンクされるメモリは、例えば、コンピュータプログラム命令を記憶し、これは、これらの命令がプロセッサ4によって実行されると、図2の方法のステップの少なくとも一部を実行するように設計される。換言すれば、プロセッサ4は図2のステップの少なくとも一部を実行するようにプログラムされる。
【0040】
図2の方法は、ここで、電子復号化装置によってアクセス可能な人工ニューラルネットワークのリストを受信する任意選択的ステップE2から始まる。
【0041】
リストは、例えば、電子符号化装置2のプロセッサ4によって電子復号化装置(例えば、後に説明する図7の電子復号化装置10と一致する)から直接受信される。
【0042】
以下に説明するように、電子復号化装置によってアクセス可能な人工ニューラルネットワークは、それに関して電子復号化装置が関係する人工ニューラルネットワークを定義するパラメータを記憶するか、又はサーバ等のリモート電子設備との接続によってこれらのパラメータにアクセスし得る人工ニューラルネットワークである。
【0043】
代替として、リストは、電子装置2のプロセッサ4により、上述のサーバ等のリモートサーバから直接受信できる。
【0044】
図2の方法は、符号化プロセス-復号化プロセスのペアを選択するステップE4に続く。符号化プロセスについて前述したように、符号化プロセスと復号化プロセスは各々、少なくとも1つの人工ニューラルネットワークを使用する。
【0045】
本明細書に記載の例では、符号化プロセスは符号化人工ニューラルネットワークによって実行され、復号化プロセスは復号化人工ニューラルネットワークによって実行される。
【0046】
符号化人工ニューラルネットワーク及び復号化ニューラルネットワークによって形成されるセット(符号化人工ニューラルネットワークの出力は復号化人工ニューラルネットワークの入力に適用される)は、例えば、オートエンコーダを形成する。
【0047】
符号化プロセス-復号化プロセスペアは、例えば、事前設定された複数の符号化プロセス-復号化プロセスペア、すなわちここでは複数の符号化人工ニューラルネットワーク-復号化人工ニューラルネットワークペアの中から選択される。
【0048】
電子復号化装置によってアクセス可能な人工ニューラルネットワークのリストが事前に受け取られている場合(ステップE2で前述したとおり)、符号化プロセス-復号化プロセスペアは、例えば、そのために復号化プロセスが受け取ったリスト中にある人工ニューラルネットワークを使用する符号化プロセス-復号化プロセスペアの中から選択される。
【0049】
符号化プロセス-復号化プロセスペアは、所期の用途(例えば、ユーザが電子符号化装置2の図示されていないユーザインタフェースを用いて示す)に応じても選択され得る。例えば、所期の用途がビデオ会議である場合、選択される符号化プロセス-復号化プロセスペアには低レイテンシの復号化プロセスが含まれる。他の用途の場合、選択される符号化プロセス-復号化プロセスペアにはランダムアクセス復号化プロセスが含まれる。
【0050】
ビデオシーケンスの復号化のための低レイテンシプロセスでは、ビデオシーケンスの画像は、例えば、符号化されたデータによって表され、それが直ちに送信され、復号化され得、データは、その後、ビデオ画像の表示順に送信され得るが、それにより、この場合、符号化と復号化との間に1フレームのレイテンシが確保される。
【0051】
ビデオシーケンスの復号化のためのランダムアクセスプロセスでは、それぞれ複数の画像に関する符号化されたデータは、これらの画像の表示順以外の順序で送信され、それにより圧縮度を高めることができる。他の画像を参照せずに符号化された画像(いわゆるイントラフレーム)は、その後、規則的に符号化され得、それによりビデオシーケンスの復号化を符号化されたストリーム内の複数の箇所から開始することができる。
【0052】
その目的のために、IEEE Transactions on Circuits and Systems for Video Technology, vol.22,no.12,pp.1649-1668,Dec.2012内のG.J.Sullivan,J.-R.Ohm,W.-J.Han and T.Wiegandによる記事「Overview of the High Efficiency Video Coding (HEVC) Standard」を参照されたい。
【0053】
符号化プロセス-復号化プロセスペアは、最良の圧縮-歪みバランスを得るためにも選択され得る。
【0054】
その目的のために、複数の符号化プロセス-復号化プロセスペアをコンテンツデータBに適用し、よりよい圧縮-歪みバランスに到達するセットを選択することが可能である。
【0055】
代替として、コンテンツの種類を特定し(例えば、コンテンツデータBを分析することによる)、特定された種類に応じた符号化プロセス-復号化プロセスペアを選択することが可能である。
【0056】
符号化プロセス-復号化プロセスペアは、電子復号化装置で利用可能な計算能力に応じても選択され得る。この計算能力を表す情報は、電子復号化装置から電子符号化装置に事前に送信されている(例えば、上述のステップE2で電子符号化装置によって受信されている)可能性がある。
【0057】
符号化プロセス-復号化プロセスペアを選択するための様々な基準を相互に組み合わせることも可能であり得る。
【0058】
符号化プロセス-復号化プロセスペアが選択されると、プロセッサ4は、並列処理ユニット6を並列処理ユニット6が選択された符号化方法を実行できるような方法で構成するステップE6に進む。
【0059】
このステップE6は、特に選択された符号化プロセスによって使用される符号化人工ニューラルネットワーク8の並列処理ユニット6内でのインスタンス化を含む。
【0060】
このインスタンス化は、特に以下のステップ、
- 並列処理ユニット6内において、符号化人工ニューラルネットワークを実装するのに必要なメモリスペースを留保するステップ、及び/又は
- 並列処理ユニット6を、符号化人工ニューラルネットワーク8を定義する重みW及び活性化関数でプログラムするステップ、及び/又は
- 並列処理ユニット6のローカルメモリ内にコンテンツデータBの少なくとも一部をロードするステップ
を含み得る。
【0061】
図2の方法は、したがって、符号化プロセスを実行するステップE8、すなわちコンテンツデータBを符号化人工ニューラルネットワーク8の入力に適用する(又は換言すれば入力としてコンテンツデータBをとることによって符号化人工ニューラルネットワーク8を作動させる)ステップを含む。
【0062】
したがって、ステップE8により、圧縮データCを(ここでは符号化人工ニューラルネットワーク8の出力で)生成できる。
【0063】
以下のステップは、特に圧縮データCを含み、電子復号化装置(例えば、図7に関して説明する電子復号化装置10)に向けられるデータストリームの符号化(すなわち準備)に関する。
【0064】
方法は、したがって、特にオーディオ又はビデオコンテンツの表現フォーマットのデータ特性(ここでは例えば符号化されているビデオシーケンスのフォーマットに関連付けられるデータ)を含む第一のヘッダ部分Fcを符号化するステップE10を含む。
【0065】
第一のヘッダ部分Fcを形成するこれらのデータは、例えば、画像サイズ(ピクセルの単位)、フレームレート、輝度情報のバイナリ深度及び色差情報のバイナリ深度を示す。これらのデータは、例えば、上述のフォーマットデータPに基づいて(考え得る再フォーマットの後に)構成される。
【0066】
図2の方法は、したがって、データストリームを復号化できる電子復号化装置(例えば、図7に関して後述する電子復号化装置10)にとっての復号化人工ニューラルネットワーク(ステップE4で選択された復号化プロセスによって使用される)の利用可能性を特定するステップE12に続く。
【0067】
この特定は、ステップE2で受け取ったリストに基づいて行われ得、プロセッサ4はこの場合、ステップE4で選択された復号化プロセスによって使用される復号化人工ニューラルネットワークがステップE2で受け取ったリストに属しているか否かを特定する。(当然のことながら、符号化プロセス-復号化プロセスペアが電子復号化装置にとって利用可能な復号化人工ニューラルネットワークに対応するように体系的に選択される実施形態において、ステップE12は、省略され得、したがって、方法は、ステップE14に続く。)
【0068】
考え得る実施形態によれば、電子復号化装置にとっての復号化人工ニューラルネットワークの利用可能性に関する情報がない場合、方法は(すでに説明したように、復号化人工ニューラルネットワークを記述するデータが電子復号化装置に送信されるように)ステップE16に続く。
【0069】
プロセッサ4が、ステップE12において、復号化人工ニューラルネットワークが電子復号化装置にとって利用可能であることを特定した場合(矢印P)、方法は、下記のステップE14に続く。
【0070】
プロセッサ4が、ステップE12において、復号化人工ニューラルネットワークが電子復号化装置にとって利用可能ではないことを特定した場合(矢印N)、方法は、以下のステップE16に続く。
【0071】
代替として、ステップE12の後のステップとしてのステップE14かステップE16かの選択は、他の基準に依存して、例えば電子符号化装置2に記憶された(且つおそらくユーザが電子符号化装置2のユーザインタフェースを介して調整可能であり得る)専用のインジケータ又はユーザが行う(例えば、電子符号化装置2のユーザインタフェースを介して得られる)選択に応じて行うこともできる。
【0072】
プロセッサ4は、インジケータINDを含む第二のヘッダ部分と、ここでは復号化人工ニューラルネットワークの識別子Innを含む第三のヘッダ部分を符号化するステップE14に進む。
【0073】
ステップE14において、データストリーム中で符号化されるインジケータINDは、その復号化人工ニューラルネットワークが所定の人工ニューラルネットワークセット、ここでは電子復号化装置にとって利用可能な(又はアクセス可能な)人工ニューラルネットワークセット(すなわちステップE2で受け取られるリストの人工ニューラルネットワークのセット)に属することを示す。
【0074】
復号化人工ニューラルネットワークの識別子Innは、変換により、(特に電子符号化装置と電子復号化装置が共有する)この復号化人工ニューラルネットワークを例えば上述の所定のセット内で定義する識別子である。
【0075】
プロセッサ4は、インジケータIND’を含む第二のヘッダ部分とここでは復号化人工ニューラルネットワークを記述するデータRcを含む第三のヘッダ部分を符号化するステップE16に進む。
【0076】
ステップE16において、データストリーム中で符号化されたインジケータIND’は、復号化人工ニューラルネットワークがデータストリーム中で符号化されたこと、すなわち上述の記述データRcによって表されることを示す。
【0077】
復号化人工ニューラルネットワークは、例えば、記述データ(又は復号化人工ニューラルネットワークを符号化するデータ)Rcにより、MPEG-7 part 17等の標準又はJSON等のフォーマットに従って符号化される(すなわち表される)。
【0078】
その目的のために、Proceedings of the 36th International Conference on Machine Learning,Long Beach,California,PMLR 97,2019におけるS.Wiedemann et al.による記事「DeepCABAC:Context-adaptive binary arithmetic coding for deep neural network compression」又はIEEE Transaction on Neural Networks and Learning Systems(Vol.31,Iss.3),March 2020におけるS.Wiedemann et al.による記事「Compact and Computationally Efficient Representation of Deep Neural Networks」を参照されたい。
【0079】
ステップE16後のステップE14において、図2の方法は、電子復号化装置が復号化人工ニューラルネットワークを使用して復号化プロセスを実行する可能性を特定するステップE18に続く。
【0080】
プロセッサ4は、例えば、この可能性を、(おそらく電子符号化装置と電子復号化装置との間のそれ以前の交換によって)電子復号化装置がこの復号化プロセスを実行するように設計されたモジュール又はこの電子復号化装置のプロセッサによってソフトウェアが実行されたときに電子復号化装置によるこの復号化プロセスの実行に適しているソフトウェアを含むか否かを特定することによって特定する。
【0081】
プロセッサ4は、電子復号化装置が復号化プロセスを実行できることを特定した場合、方法は、後述のステップE22に続く。
【0082】
プロセッサ4が、電子復号化装置が復号化プロセスを実行できないことを特定した場合、方法は、(ステップE22に進む前に)後述のステップE20を実行する。
【0083】
代替として、(ステップE22を実行する前に)ステップE20を実行するか否かの選択は、他の基準に存して、例えば電子符号化装置2内に記憶された(及びおそらくユーザによって電子符号化装置2のユーザインタフェースを介して調整可能な)専用インジケータ又は(例えば、電子符号化装置2のユーザインタフェースを介して得られる)ユーザによって行われた選択に応じて行うことができる。
【0084】
プロセッサ4は、ステップE20において、データストリーム中で電子復号化装置のプロセッサによって実行可能なコンピュータプログラムExe(又はコード)を含む第四のヘッダ部分を符号化する。(電子復号化装置内でのコンピュータプログラムExeの使用については、図8を参照して後に説明する。)
【0085】
電子復号化装置内での実行に合わせて調整されるようにするために、コンピュータプログラムは、例えば、電子復号化装置のハードウェア構成に関する情報(例えば、電子符号化装置2と電子復号装置との以前の交換によって受け取られた情報)に応じてライブラリ内で選択される。
【0086】
プロセッサ4は、したがって、ステップE8で得られた圧縮データCに基づいて圧縮ストリームFnnを符号化するステップE22に進む。
【0087】
この点において、上述の説明では、ステップE8は、ヘッダFetを符号化するステップ(ステップE10~E20)前に説明されていることがわかる。しかしながら、実際には、ステップE8は、ステップE22の直前に実行できる。
【0088】
特に、ステップE8によって圧縮されるべきオーディオ又はビデオコンテンツの一部のみを処理できる場合(例えば、ステップE8は圧縮されるべきビデオシーケンスのブロック、又は成分、又は画像の処理を実行する場合)、ステップE8(コンテンツの連続部分に関係する圧縮データを取得するため)及びE22(データストリーム中で得られた圧縮データを符号化するため)の実行を繰り返すことが可能である。
【0089】
プロセッサ4は、したがって、ステップE24において、ヘッダFet及び圧縮ストリームFnnを含む完全なデータストリームを構築することができる。
【0090】
完全なデータストリームは、ヘッダFet及び圧縮ストリームFnnが個別に識別可能となるような方法で構築される。
【0091】
考え得る実施形態によれば、ヘッダFetは、完全なデータストリーム中の圧縮ストリームFnnの開始のインジケータを含む。このインジケータは、例えば、圧縮データストリームの開始からの圧縮ストリームFnnの始まりの位置をビットで表したものである。(換言すれば、ヘッダはこの場合、所定の固定の長さを有する。)
【0092】
ヘッダFet及び圧縮ストリームFnnのその他の識別方法も代替として想定でき、これは、例えば、マーカ(すなわち圧縮ストリームFnnの開始を示すために使用され、その使用がデータストリームの残りの部分又は少なくともヘッダFetに隠されるバイナリの組合せ)である。
【0093】
図3~6には、図2の方法によって得られ得る完全なデータストリームの例が示されている。
【0094】
すでに説明したように、これらのデータストリームはヘッダFetと圧縮ストリームFnnを含む。
【0095】
図3のケース(ステップE14が実行され、ステップE20が実行されなかった状況に対応する)では、ヘッダは、
- オーディオ又はビデオコンテンツの表現フォーマットのデータ特性を含む第一の部分Fcと、
- 復号化人工ニューラルネットワークが所定の人工ニューラルネットワークセットに属することを示すインジケータINDを含む第二の部分と、
- 復号化人工ニューラルネットワークの識別子Innを含む第三の部分と、
を含む。
【0096】
図4のケース(ステップE16が実行され、ステップE20が実行されていない状況に対応する)では、ヘッダは、
- オーディオ又はビデオコンテンツの表現フォーマットのデータ特性を含む第一の部分Fcと、
- 復号化人工ニューラルネットワークがデータストリーム中で符号化されていることを示すインジケータIND’を含む第二の部分と、
- 復号化人工ニューラルネットワークを記述するデータRc(ここではそれを符号化するデータ)を含む第三の部分と、
を含む。
【0097】
図5のケース(ステップE14及びE20が実行された状況に対応する)では、ヘッダは、
- オーディオ又はビデオコンテンツの表現フォーマットのデータ特性を含む第一の部分Fcと、
- 復号化人工ニューラルネットワークが所定の人工ニューラルネットワークセットに属することを示すインジケータINDを含む第二の部分と、
- 復号化人工ニューラルネットワークの識別子Innを含む第三の部分と、
- コンピュータプログラムExeを含む第四の部分と、
を含む。
【0098】
図6のケース(ステップE16及びE20が実行された状況に対応する)では、ヘッダは、
- オーディオ又はビデオコンテンツの表現フォーマットのデータ特性を含む第一の部分Fcと、
- 復号化人工ニューラルネットワークがデータストリーム中で符号化されていることを示すインジケータIND’を含む第二の部分と、
- 復号化人工ニューラルネットワークを記述するデータRc(ここではそれを符号化するデータ)を含む第三の部分と、
- コンピュータプログラムExeを含む第四の部分と、
を含む。
【0099】
ステップE24で構築されるデータストリームは、「Packet-Transport System」フォーマット又は「Byte-Stream」フォーマット等、それ自体知られている送信フォーマットにカプセル化され得る。
【0100】
「Packet-Transport System」フォーマット(例えば、RTPプロトコルによって提案される)の場合、データは、識別可能なパケットによって符号化され、通信ネットワーク上で送信される。ネットワークは、ネットワーク層によって提供されるパケット識別情報を用いて、データ(画像、画像の集合及びここではヘッダFetと圧縮ストリームFnn)の境界を容易に識別できる。
【0101】
「Byte-Stream」フォーマットの場合、特にパケットはなく、ステップE24の構築は、関連するデータの境界(例えば、ストリームのうちの各画像に対応する部分間及びここではヘッダFetと圧縮ストリームFnnとの間の境界)を、ネットワーク抽出層(NAL)ユニットの使用等の追加の手段を使用して識別できなければならず、この場合、固有のバイナリの組合せ(0×00000001等)によってデータ間の境界を識別することが可能である)。
【0102】
ステップE24で構築される完全なデータストリームは、その後、ステップE26において、電子復号化装置26に向かって(図示されていない通信手段により且つ/又は少なくとも1つの通信ネットワークを通して)発出するか、又は電子符号化装置2に(後に送信するか又は代替として後に例えば電子符号化装置自体内で復号化するために(この場合、図8に関して後述する復号化方法をさらに実行するように設計される))記憶され得る。
【0103】
オーディオ又はビデオコンテンツが複数の部分(例えば、コンテンツがビデオシーケンスである場合、複数の画像群)を含むときには、ステップE4~E24の方法はおそらく、コンテンツの各部分について(例えば、各画像群について)、図3~6の1つに示されるデータストリームを得るような方法で実行することができる。したがって、各画像群に関する圧縮ストリームFnnは、関係する画像群にとって適正であり、おそらく後述のように他の画像群に使用される人工ニューラルネットワークと異なる人工ニューラルネットワークを使用して復号化できる。人工ニューラルネットワークは、おそらく、同じ構造を有し得る(且つその重み及び/又は特定の人工ニューラルネットワークを定義する活性化関数のみが異なる)。
【0104】
図7は、少なくとも1つの人工ニューラルネットワーク18を使用する電子復号化装置10を示す。
【0105】
この電子復号化装置10は、受信ユニット11、プロセッサ14(例えば、マイクロプロセッサ)及び並列処理ユニット16、例えばグラフィック処理ユニット、すなわちGPU又はテンソル処理ユニット、すなわちTPUを含む。
【0106】
受信ユニット11は、例えば、通信回路(無線周波数通信回路等)であり、それにより電子符号化装置2等の外部電子装置からデータ(及び特にここでは符号化されたデータストリーム)を受信し、これらのデータを(そこに受信ユニット11が例えばバスによって接続される)プロセッサ14に通信することが可能となる。
【0107】
電子復号化装置10は、記憶ユニット12、例えばメモリ(リライタブル不揮発性メモリであり得る)又はハードドライブも含む。記憶ユニット12は、図7において、プロセッサ14と異なる素子として示されているが、記憶ユニット12は、代替として、プロセッサ14に内蔵され得る(すなわちその中に含まれ得る)。
【0108】
プロセッサ14はこの場合、例えば記憶ユニット12に記憶されたコンピュータプログラムの複数の命令を連続的に実行するように適合される。
【0109】
並列処理ユニット16は、プロセッサ14によって構成された後、人工ニューラルネットワーク18を実装するように設計される。その目的のために、並列処理ユニット16は、ある時点で同じ種類の複数の動作を並列に行うように設計される。
【0110】
図7に概略的に示されているように、プロセッサ14は、第一のデータセット、ここではヘッダFetと、オーディオ又はビデオコンテンツを表す第二のデータセット、ここでは圧縮ストリームFnnを含むデータストリームを(例えば、電子復号化装置10の、図示されない通信手段を介して)受信する。
【0111】
後述するように、人工ニューラルネットワーク18は、第二のデータセット(すなわちここでは圧縮データFnn)の処理の枠組み内において、初期オーディオ又はビデオコンテンツBに対応するオーディオ又はビデオコンテンツを取得するために使用される。
【0112】
記憶ユニット12は、複数のパラメータセットを記憶でき、各パラメータセットは復号化人工ニューラルネットワークを定義する。後述するように、プロセッサ14はこの場合、これらのパラメータセットのうちの特定のパラメータセットによって並列処理ユニット16を、並列処理ユニット16がこの特定のパラメータセットによって定義される人工ニューラルネットワークを実装できるような方法で構成できる。
【0113】
記憶ユニット12は、特に、ランダムアクセスデコーダを形成する第一の人工ニューラルネットワークを定義する第一のパラメータセット及び/又は低レイテンシデコーダを形成する第二の人工ニューラルネットワークを定義する第二のパラメータセットを記憶し得る。
【0114】
この場合、電子復号化装置10には、コンテンツへのランダムアクセスが望ましい状況とコンテンツが遅滞なく表示されることになる状況の両方のための事前の復号化オプションがある。
【0115】
ここで、図8に関して、電子復号化装置10内において、並列処理ユニット16によって実装される人工ニューラルネットワーク18を用いて実行される復号化方法を説明する。
【0116】
この方法は、電子復号化装置10による、復号化対象のデータストリームの送信を制御する装置に向けた、電子復号化装置10によって利用可能な人工ニューラルネットワークのリストLの送信の人選択的ステップから開始され得る。データストリーム送信制御装置は、例えば、電子符号化装置2であり得る。(電子符号化装置2は、この場合、このリストLを図2に関して前述したステップE2で受信する。)代替として、データストリーム送信制御装置は、電子符号化装置2と協働する専用サーバでもあり得る。
【0117】
電子復号化装置10がアクセス可能な人工ニューラルネットワークは、電子復号化装置10がそれに関して(前述のように)関係する人工ニューラルネットワークを定義するパラメータセットを記憶するか、又は(後述のように)サーバ等のリモート電子設備との接続によってこのパラメータセットにアクセスし得る人工ニューラルネットワークである。
【0118】
図8の方法は、(電子復号化装置10、正確にはここでは受信ユニット11によって)第一のパラメータセット、すなわちヘッダFetと第二のパラメータセット、すなわち圧縮ストリームFnnを含むデータストリームを受信するステップE52を含む。受信ユニット11は、受信したデータストリームをプロセッサ14に送信する。
【0119】
プロセッサ14は、したがって、受信したデータストリーム内の第一のデータセット(ヘッダFet)及び第二のデータセット(圧縮ストリームFnn)を、例えば圧縮ストリームの始まりのインジケータ(ステップE24の説明ですでに述べた)によって識別するステップE54に進む。
【0120】
プロセッサ14は、ステップE54において、第一のデータセット(ヘッダ)、すなわちここではヘッダFet内の異なる部分も識別し得、これは、前述の図3~6に示されるように、第一の部分Fc(データストリームによって符号化されたコンテンツのフォーマットの特性を表すデータを含む)、第二の部分(インジケータIND又はIND’)、第三の部分(Inn又は符号化データRc)及びおそらく第四の部分(コンピュータプログラムExe)である。
【0121】
ステップE54において、第一のデータ内で実行可能命令(例えば、コンピュータプログラムExeの命令)が識別(すなわち検出)される場合、プロセッサ14は、ステップE56において、これらの実行可能命令を実行し、第一のデータセットからのデータの処理のステップの少なくとも特定のものの実行を開始し得る。これらの命令は、プロセッサ14又は代替として電子復号化装置10内でインスタンス化された仮想マシンによって実行され得る。
【0122】
図7の方法は、オーディオ又はビデオコンテンツの表現フォーマットの特性であるデータFcを、このフォーマットの特性を取得するような方法で復号化するステップE58に続く。ビデオコンテンツの場合、例えば、データ部分Fcの復号化により、画像サイズ(ピクセルの単位)、及び/又はフレームレート、及び/又は輝度情報のバイナリ深度、及び/又は色差情報のバイナリ深度を取得することが可能となる。
【0123】
プロセッサ14は、次に、(特定の実施形態では前述のようにステップE54での第一のデータセット内で識別された命令の実行により)ここではヘッダFetの第二の部分に含まれるインジケータIND、IND’を復号化するステップE60に進む。
【0124】
受信したデータストリーム中にあるインジケータIND、IND’の復号化が、復号化に使用される人工ニューラルネットワーク18が所定の人工ニューラルネットワークセットに属することを示す場合(すなわち、第一のデータセット中にあるインジケータが、復号化人工ニューラルネットワーク18が所定の人工ニューラルネットワークに属することを示すインジケータINDである場合)、方法は、後述のステップE62に続く。
【0125】
受信したデータストリーム中にあるインジケータIND、IND’の復号化が、復号化に使用される人工ニューラルネットワーク18がデータストリーム内で符号化されることを示す場合(すなわち、第一のデータセット中にあるインジケータが、復号化人工ニューラルネットワーク18がデータストリーム内で符号化されることを示すインジケータIND’である場合)、方法は、後述のステップE66に続く。
【0126】
ステップE62において、プロセッサ14は、(特定の実施形態において前述のようにステップE54での第一のデータセット内で識別された命令の実行により)識別子Inn(ここではヘッダFetの第三の部分に含まれる)の復号化に進む。前述のように、この識別子Innは、例えば、前述の所定の人工ニューラルネットワークセット内の復号化人工ニューラルネットワーク18を指定する識別子である。
【0127】
プロセッサ14は、したがって、(特定の実施形態において前述のようにステップE54での第一のデータセット内で識別された命令の実行により)復号化された識別子Innに関連付けられたパラメータセットを記憶ユニット12内から読み出すステップE64に進むことができる(このパラメータセットは、復号化された識別子Innによって識別される人工ニューラルネットワークを定義する)。
【0128】
考え得る実施形態によれば、プロセッサ14は、復号化された識別子Innによって識別されるこの人工ニューラルネットワークに関するデータ(特にパラメータ)が(ここでは記憶ユニット12内に)ない場合にエラーメッセージを生成するようになされ得る。
【0129】
代替として(又は復号化された識別子Innによって識別された人工ニューラルネットワークのための記憶ユニット12に何れのパラメータセットも記憶されていない場合)、電子復号化装置10は、(特定の実施形態において前述のようにステップE54での第一のデータセット内で識別された命令の実行により)リモートサーバにパラメータセットのリクエストを送信し(このリクエストは、例えば、符号化された識別子Innを含む)、ステップE64において、復号化された識別子Innによって識別される人工ニューラルネットワークを定義するパラメータセットを回答として受信し得る。
【0130】
次に、方法は後述のステップE68に続く。
【0131】
ステップE66において、プロセッサ14は、(特定の実施形態において前述のようにステップE54での第一のデータセット内で識別された命令の実行により)人工ニューラルネットワーク18を記述するデータRc(ここではヘッダFetの第三の部分に含まれる)の復号化に進む。
【0132】
前述のように、これらの記述データ(又は符号化データ)Rcは、例えば、MPEG-7 part 17等の標準又はJSON等のフォーマットに従って符号化される。
【0133】
記述データRcの符号化により、第二のデータセットからのデータ(すなわちここでは圧縮ストリームFnnのデータ)を復号化するために使用される人工ニューラルネットワークを定義するパラメータを取得することが可能となる。
【0134】
方法は、この場合、ステップE68に続き、これについて以下に説明する。
【0135】
プロセッサ14は、次に、(特定の実施形態において前述のようにステップE54での第一のデータセット内で識別された命令の実行により)復号化人工ニューラルネットワーク18を定義するパラメータ(ステップE64又はステップE66で取得したパラメータ)によって並列処理ユニット16を、並列処理ユニット16が復号化人工ニューラルネットワーク18を実装できるような方法で構成するステップE68に進む。
【0136】
この構成ステップE68は、特に並列処理ユニット16内の復号化人工ニューラルネットワーク18を、ここではステップE64又はステップE66で得られたパラメータを使用してインスタンス化することを含む。
【0137】
このインスタンス化は、特に、
- 並列処理ユニット16内において、復号化人工ニューラルネットワーク18を実装するのに必要なメモリスペースを留保するステップ、及び/又は
- 並列処理ユニット16を、復号化人工ニューラルネットワーク18を定義するパラメータ(例えば、重みW’及び活性化関数を含む)(ステップE64又はステップE66で得られたパラメータ)でプログラムするステップ、及び/又は
- 並列処理ユニット16のローカルメモリ内に第二のデータセットからのデータの少なくとも一部(すなわち圧縮ストリームFnnのデータの少なくとも一部)をロードするステップ
を含み得る。
【0138】
ステップE58~E68の上述の説明からわかるように、第一のデータセットFetのデータは、したがって、プロセッサ14によってこのように処理される。
【0139】
プロセッサ14は、その後、ステップE70において、第二のデータセットからのデータ(ここでは圧縮ストリームFnnのデータ)を、並列処理ユニット16によって実装される人工ニューラルネットワーク18に、これらのデータが少なくとも部分的に人工ニューラルネットワーク18を使用する復号化プロセスによって処理されるような方法で適用する(すなわち提示する)ことができる。
【0140】
本明細書で説明する例では、人工ニューラルネットワーク18は入力として第二のデータセットFnnのデータを受信し、出力として、オーディオ又はビデオ再生装置上での再生に適応された符号化済みコンテンツの表現Iを生成する。換言すれば、第二のデータセットFnnのデータの少なくとも特定のものが人工ニューラルネットワーク18の入力層に適用され、人工ニューラルネットワーク18の出力層は上述の符号化済みコンテンツの表現Iを生成する。ビデオコンテンツ(1つの画像又は画像シーケンスを含む)の場合、人工ニューラルネットワーク18は、したがって、出力として(すなわちその出力層において)画像の少なくとも1つのマトリクス表現Iを生成する。
【0141】
特定の実施形態において、圧縮ストリームFcの特定のデータ(例えば、あるブロック又はある画像に対応する)を処理するために、人工ニューラルネットワーク18は入力として圧縮ストリームFc内の先行データ(例えば、先行ブロック又は先行画像に対応する)の処理中に人工ニューラルネットワーク18で生成されたデータの少なくとも特定のものを受信できる。この場合、それは人工ニューラルネットワーク18の出力で生成されたデータを人工ニューラルネットワーク18の入力に再注入するステップE72に進む。
【0142】
さらに、他の考え得る実施形態によれば、復号化プロセスは、コンテンツデータBの処理に関してすでに前述したように、複数の人工ニューラルネットワークを使用できる。
【0143】
第二のセットからのデータ(ここでは圧縮ストリームFnnの少なくとも特定のデータ)は、したがって、第一のセットからのデータの部分に依存するプロセス(ここでは符号化データRcの識別子Innに依存するプロセス)により、並列処理ユニット16によって実装される人工ニューラルネットワーク18を使用して処理されている。
【0144】
プロセッサ14は、その後、ステップ74において、人工ニューラルネットワーク18による圧縮ストリームFnnの処理が終了したか否かを特定する。
【0145】
特定結果が否定(N)の場合、方法はステップE70に戻り、圧縮ストリームFnnの他のデータを人工ニューラルネットワーク18に適用する。
【0146】
特定結果が肯定(P)の場合、方法はステップE76に続き、プロセッサ14は受信したデータストリーム内に処理すべきデータが残っているか否かを特定する。
【0147】
ステップE76での特定結果が否定(N)の場合、方法はステップE78で終了する。
【0148】
ステップE76での特定結果が肯定(P)の場合、方法はステップE52に戻り、図3~6の1つに示されるデータストリームの新しい部分の処理を行う。
【0149】
以上、符号化ステップE4~E24の繰返しとして示されているように、データストリームのこの別の部分も、したがって、第一のデータセットと、他のオーディオ又はビデオコンテンツを表す第二のデータセット(例えば、ビデオコンテンツの場合、使用されるコンテンツの表現フォーマットに関する他の画像グループ)とを含む。この場合、ステップE54~E66にで前述したように、他の人工ニューラルネットワークをこれらの第一のデータの特定のものに基づいて特定でき、その後、並列処理ユニット16はこの別の人工ニューラルネットワークを(前述のステップE68に従って)実装するように構成され得る。データストリームのこの別の部分の第二のデータセットからのデータ(例えば、前述の他の画像グループに関する)は、その後、この別の人工ニューラルネットワークによって(ステップE70で前述したように)復号化され得る。
【0150】
上述の別の人工ニューラルネットワークは、前述の人工ニューラルネットワーク18の構造と同一の構造を有し得、それにより並列処理ユニット16を構成するステップが単純化される(現在の人工ニューラルネットワークを定義する重み及び/又は活性化関数のみが例えば更新される)。
図1
図2
図3
図4
図5
図6
図7
図8
【国際調査報告】