IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ フォンダシオン ベー-コムの特許一覧

特表2023-534495ニューラルネットワークを使用した並列ビデオ復号化
<>
  • 特表-ニューラルネットワークを使用した並列ビデオ復号化 図1
  • 特表-ニューラルネットワークを使用した並列ビデオ復号化 図2
  • 特表-ニューラルネットワークを使用した並列ビデオ復号化 図3
  • 特表-ニューラルネットワークを使用した並列ビデオ復号化 図4
  • 特表-ニューラルネットワークを使用した並列ビデオ復号化 図5
  • 特表-ニューラルネットワークを使用した並列ビデオ復号化 図6
  • 特表-ニューラルネットワークを使用した並列ビデオ復号化 図7
  • 特表-ニューラルネットワークを使用した並列ビデオ復号化 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-08-09
(54)【発明の名称】ニューラルネットワークを使用した並列ビデオ復号化
(51)【国際特許分類】
   H04N 19/90 20140101AFI20230802BHJP
   H04N 19/436 20140101ALI20230802BHJP
【FI】
H04N19/90
H04N19/436
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023503012
(86)(22)【出願日】2021-07-13
(85)【翻訳文提出日】2023-03-15
(86)【国際出願番号】 EP2021069515
(87)【国際公開番号】W WO2022013247
(87)【国際公開日】2022-01-20
(31)【優先権主張番号】2007530
(32)【優先日】2020-07-17
(33)【優先権主張国・地域又は機関】FR
(81)【指定国・地域】
(71)【出願人】
【識別番号】521196970
【氏名又は名称】フォンダシオン ベー-コム
【氏名又は名称原語表記】FONDATION B-COM
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100092624
【弁理士】
【氏名又は名称】鶴田 準一
(74)【代理人】
【識別番号】100114018
【弁理士】
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100153729
【弁理士】
【氏名又は名称】森本 有一
(74)【代理人】
【識別番号】100151459
【弁理士】
【氏名又は名称】中村 健一
(72)【発明者】
【氏名】フェリクス アンリ
(72)【発明者】
【氏名】ゴルドン クラール
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159KK13
5C159PP16
5C159RC11
5C159TC02
5C159TC08
5C159TC18
5C159TD17
5C159UA02
5C159UA05
(57)【要約】
プロセッサ(14)と、ある時点で同じ種類の複数の動作を並列に行うように設計された並列処理ユニット(16)とを含む電子装置(10)によってデータフローを復号化する方法において、データフローは、第一のデータセット(Fet)と、オーディオ又はビデオコンテンツを表す第二のデータセット(Fnn)とを含む。この復号化方法は、プロセッサ(14)が第一のデータセット(Fet)からのデータを処理するステップと、第二のデータセット(Fnn)からのデータを、第一のセット(Fet)からのデータに少なくとも部分的に依存するプロセスを使用し、且つ並列処理ユニット(16)によって実装される人工ニューラルネットワーク(18)を使用して処理すること(E70)により、オーディオ又はビデオコンテンツを取得するステップと、を含む。
【特許請求の範囲】
【請求項1】
プロセッサ(14)と、ある時点で同じ種類の複数の動作を並列に行うように設計された並列処理ユニット(16)とを含む電子装置(10)によってデータストリームを復号化する方法において、前記データストリームは、第一のデータセット(Fet)と、オーディオ又はビデオコンテンツを表す第二のデータセット(Fnn)とを含むことと、前記方法は、
- 前記第一のデータセット(Fet)からのデータをプロセッサ(14)によって処理するステップ(E56、E58、E60、E62、E66)と、
- 前記第二のデータセット(Fnn)からのデータを、前記第一のセット(Fet)からの前記データの少なくとも一部に依存するプロセスを使用し、且つ前記並列処理ユニット(16)によって実装される人工ニューラルネットワーク(18)を使用して処理すること(E70)により、前記オーディオ又はビデオコンテンツを取得するステップと、
を含むことを特徴とする方法。
【請求項2】
前記並列処理ユニット(16)を、前記第一のデータセット(Fet)からの前記データの少なくとも一部に応じて構成するステップ(E68)を含む、請求項1に記載の復号化方法。
【請求項3】
前記第一のデータセット(Fet)は、前記人工ニューラルネットワーク(18)を記述するデータ(Rc)を含み、前記構成ステップ(E68)において、前記プロセッサ(14)は、前記並列処理ユニット(16)を前記記述データ(Rc)に基づいて構成する、請求項2に記載の復号化方法。
【請求項4】
前記電子装置(10)は、それぞれ複数の人工ニューラルネットワークを定義する複数のパラメータセットを記憶するための記憶ユニット(12)を含み、前記第一のデータセット(Fet)は、識別子(Inn)を含み、前記構成ステップ(E68)において、前記プロセッサ(14)は、前記並列処理ユニット(16)を、前記複数のパラメータセットのうち、前記識別子(Inn)に関連付けられたパラメータセットに基づいて構成する、請求項2に記載の復号化方法。
【請求項5】
前記データストリームは、前記電子装置(10)内で実行可能な命令(Exe)をさらに含み、前記第一のデータセット(Fet)からの前記データの前記処理は、少なくとも部分的に前記命令(Exe)の少なくとも一部の実行によって行われる、請求項1~4の何れか一項に記載の復号化方法。
【請求項6】
前記並列処理ユニット(16)を構成する前記ステップ(E68)は、前記命令(Exe)の少なくとも一部の実行によって行われる、請求項2に直接的又は間接的に従属する場合の請求項5に記載の復号化方法。
【請求項7】
前記データストリーム内の前記第一のデータセット(Fet)及び前記第二のデータセット(Fnn)を識別するステップ(E54)を含む、請求項1~6の何れか一項に記載の復号化方法。
【請求項8】
前記第一のデータセット(Fet)は、前記データストリームによって符号化された前記コンテンツのフォーマットの特性を表すデータ(Fc)を含む、請求項1~7の何れか一項に記載の復号化方法。
【請求項9】
前記第二のセット(Fnn)からの前記データの前記処理は、画像の少なくとも一部の少なくとも1つのマトリクス表現(I)を生成する、請求項1~8の何れか一項に記載の復号化方法。
【請求項10】
前記人工ニューラルネットワーク(18)は、前記第二のデータセット(Fnn)からのデータを入力として受信する、請求項1~9の何れか一項に記載の復号化方法。
【請求項11】
前記人工ニューラルネットワーク(18)は、前記人工ニューラルネットワーク(18)の出力として以前に生成されたデータを入力として受信する、請求項1~10の何れか一項に記載の復号化方法。
【請求項12】
第一のデータセット(Fet)と、オーディオ又はビデオコンテンツを表す第二のデータセット(Fnn)とを含むデータストリームを復号化するための電子装置(10)であって、
- 前記第一のデータセット(Fet)からのデータを処理するように適合されたプロセッサ(14)と、
- ある時点で同じ種類の複数の動作を並列に行うように設計された並列処理ユニット(16)であって、前記第二のデータセット(Fnn)からのデータを、前記第一のセット(Fet)からの前記データの少なくとも一部に依存するプロセスを使用し、且つ前記並列処理ユニット(16)によって実装される人工ニューラルネットワーク(18)を使用して処理することにより、前記オーディオ又はビデオコンテンツを取得するように適合された並列処理ユニット(16)と、
を含む電子装置(10)。
【請求項13】
前記プロセッサ(14)は、前記並列処理ユニット(16)を、前記第一のデータセット(Fet)からの前記データの少なくとも一部に応じて構成するように適合される、請求項12に記載の電子装置。
【請求項14】
それぞれ複数の人工ニューラルネットワークを定義する複数のパラメータセットを記憶するための記憶ユニット(12)を含み、前記第一のデータセット(Fet)は、識別子(Inn)を含み、前記プロセッサ(14)は、前記並列処理ユニット(16)を、前記複数のパラメータセットのうち、前記識別子(Inn)に関連付けられたパラメータセットに基づいて構成するように適合される、請求項13に記載の電子装置。
【請求項15】
前記並列処理ユニット(16)は、画像の少なくとも一部の少なくとも1つのマトリクス表現(I)を生成するように適合される、請求項12~14の何れか一項に記載の電子装置。
【請求項16】
第一のデータセット(Fet)と、オーディオ又はビデオコンテンツを表す第二のデータセット(Fnn)とを含むデータストリームであって、前記第一のデータセット(Fet)は、少なくとも部分的に、前記第二のデータセット(Fnn)からのデータを、人工ニューラルネットワークを使用して処理するためのプロセスを定義するデータ(Inn、Rc)を含む、データストリーム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテンツの復号化、特にオーディオ又はビデオコンテンツの技術分野に関する。
【0002】
特に、本発明は、データストリームを復号化するための方法及び電子装置並びに関連するデータストリームに関する。
【背景技術】
【0003】
特にビデオ復号化の分野において、プロセッサ(一般に電子装置の中央ユニット、すなわち「中央処理ユニット」、略してCPU)と、ある時点で同じ種類の複数の動作を並列に行うように設計された並列処理ユニットとの両方を含む電子装置を使用することが知られている。このような並列処理ユニットは、例えば、グラフィック処理ユニット、すなわちGPU又はテンソル処理ユニット、すなわちTPUであり、これは、例えば、2016年8月22日付のTechradarのJoe Osborneによる記事「Google’s Tensor Processing Unit explained:this is what the future of computing looks like」に記載されている。
【0004】
さらに、ビデオコンテンツを表すデータを人工ニューラルネットワークによって圧縮することが提案されている。したがって、圧縮データの復号化は、他の人工ニューラルネットワークによって実行され得、これは、例えば、2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR),Long Beach,CA,USA,2019,pp.10998-11007のGuo Lu et al.による記事「DVC:An End-to-end Deep Video Compression Framework」に記載されている。
【発明の概要】
【課題を解決するための手段】
【0005】
これに関して、本発明は、プロセッサと、ある時点で同じ種類の複数の動作を並列に行うように設計された並列処理ユニットとを含む電子装置によってデータストリームを復号化する方法において、データストリームは、第一のデータセットと、オーディオ又はビデオコンテンツを表す第二のデータセットとを含むことと、この方法は、
- 第一のデータセットからのデータをプロセッサによって処理するステップと、
- 第二のデータセットからのデータを、第一のデータセットからのデータの少なくとも一部に依存するプロセスを使用し、且つ並列処理ユニットによって実装される人工ニューラルネットワークを使用して処理することにより、オーディオ又はビデオコンテンツを取得するステップと、
を含むことを特徴とする方法を提案する。
【0006】
並列処理ユニットによって実装される人工ニューラルネットワークにより、第二のセットからのデータを処理するステップは、したがって、データストリームに含まれる第一のセットからのデータに応じて調整され得る。これにより、人工ニューラルネットワークによる第二のデータのその復号化のための処理がフレキシブルで効率的なものとなる。
【0007】
方法は、したがって、例えば並列処理ユニットを、第一のデータセットからのデータの少なくとも一部に応じて構成するステップを含むことができる。
【0008】
並列処理ユニットの構成は、並列処理ユニットのメモリアロケーション、及び/又は並列処理メモリのメモリのインスタンス化、及び/又は(第一のデータセットからのデータの前記少なくとも一部に応じた)並列処理ユニット上で実行される処理動作への値の割当(ここでは、実際には、人工ニューラルネットワークを定義する重み及び/又は活性化関数の割当であり、これらの重み及び/又は活性化関数は、第一のデータセットからのデータの前記少なくとも一部に応じて特定される)を含み得る。
【0009】
第一の可能性によれば、第一のデータセットは、人工ニューラルネットワークを記述するデータ(例えば、人工ニューラルネットワークを符号化するデータ)を含み得る。この場合、構成ステップにおいて、プロセッサは、並列処理ユニットをこれらの記述データに基づいて構成し得る。
【0010】
第二の可能性によれば、電子装置は、それぞれ複数の人工ニューラルネットワークを定義する複数のパラメータセットを記憶するための記憶ユニットを含み得る。第一のデータセットは、この場合、識別子を含み得る。したがって、構成ステップにおいて、プロセッサは、並列処理ユニットを、複数のパラメータセットのうち、この識別子に関連付けられたパラメータセットに基づいて構成することができる。
【0011】
プロセッサは、例えば、マイクロプロセッサであり、プロセッサは、したがって、コンピュータプログラムからの複数の命令を連続的に実行することができる。
【0012】
さらに、データストリームは、電子装置内で(例えば、プロセッサ又は代替として仮想マシンによって)実行可能な命令をさらに含むようになされ得る。第一のデータセットからのデータの処理は、この場合、少なくとも部分的にこれらの命令の少なくとも一部の実行によって行われ得る。
【0013】
特に、並列処理ユニットの構成ステップは、したがって、これらの命令の少なくとも一部の実行によって行われ得る。
【0014】
復号化方法は、データストリーム内の第一のデータセット及び第二のデータセットを識別するステップをさらに含み得る(例えば、第一のデータセット及び/又は第二のデータセットのための所定のバイナリ長を利用することによるか、又は第一のデータセットと第二のデータセットとの境界のインジケータの利用による)。
【0015】
第一のデータセットは、データストリームによって符号化されたコンテンツのフォーマットの特性を表すデータをさらに含み得る。
【0016】
コンテンツがビデオコンテンツである(すなわちこのコンテンツが少なくとも1つの画像、おそらく画像シーケンスを含む)場合、第二のセットからのデータの処理は、例えば、画像の少なくとも一部(例えば、画像のブロック若しくは画像の成分又は画像全体)の少なくとも1つのマトリクス表現を生成し得る。
【0017】
人工ニューラルネットワークは、第二のデータセットからのデータを入力として(すなわち人工ニューラルネットワークの入力層で)受信し得る。人工ニューラルネットワークは、上述のマトリクス表現を出力として(すなわち人工ニューラルネットワークの出力層で)さらに生成し得る。
【0018】
考え得る実施形態によれば、人工ニューラルネットワークは、人工ニューラルネットワークの出力として(すなわち出力層で)以前に生成されたデータを入力として(すなわち上述の入力層で)さらに受信し得る。
【0019】
本発明は、第一のデータセットと、オーディオ又はビデオコンテンツを表す第二のデータセットとを含むデータストリームを復号化するための電子装置も提案し、電子装置は、
- 第一のデータセットからのデータを処理するように適合されたプロセッサ、
- ある時点で同じ種類の複数の動作を並列に行うように設計された並列処理ユニットであって、第二のデータセットからのデータを、第一のセットからのデータの少なくとも一部に依存するプロセスを使用し、且つ並列処理ユニットによって実装される人工ニューラルネットワークを使用して処理することにより、オーディオ又はビデオコンテンツを取得するように適合された並列処理ユニット
を含む。
【0020】
前述のように、プロセッサは、並列処理ユニットを、第一のデータセットからのデータの少なくとも一部に応じて構成するようにさらに適合され得る。
【0021】
並列処理ユニットは、画像の少なくとも一部の少なくとも1つのマトリクス表現を生成するように適合され得る。
【0022】
本発明は、最後に、第一のデータセットと、オーディオ又はビデオコンテンツを表す第二のデータセットとを含むデータストリームを提案し、第一のデータセットは、少なくとも部分的に、第二のデータセットからのデータを、人工ニューラルネットワークを使用して処理するためのプロセスを定義するデータを含む。
【0023】
前述のように、また以下に説明するように、少なくとも部分的に処理プロセスを定義するこれらのデータは、人工ニューラルネットワークの識別子(所定の人工ニューラルネットワークセットのうちの)又は人工ニューラルネットワークを記述するデータ(例えば、それを符号化するデータ)であり得る。
【0024】
当然のことながら、本発明の様々な特徴、代替形態及び実施形態は、これらが相互に矛盾しないか又は排他的でない限り、各種の組合せによって相互に関連付けられ得る。
【0025】
さらに、本発明の他の様々な特徴は、本発明の非限定的な実施形態を図解する下記の図面に関して行われる以下の説明から明らかになるであろう。
【図面の簡単な説明】
【0026】
図1】本発明の枠組み内で使用される電子符号化装置を示す。
図2図1の電子符号化装置内で実行される符号化方法のステップを示すフローチャートである。
図3図2の方法によって得られるデータストリームの第一の例である。
図4図2の方法によって得られるデータストリームの第二の例である。
図5図2の方法によって得られるデータストリームの第三の例である。
図6図2の方法によって得られるデータストリームの第四の例である。
図7】本発明の実施形態による電子符号化装置を示す。
図8図7の電子復号化装置内で実行される復号化方法のステップを示すフローチャートである。
【発明を実施するための形態】
【0027】
図1は、少なくとも1つの人工ニューラルネットワーク8を使用する電子符号化装置2を示す。
【0028】
電子符号化装置2は、プロセッサ4(例えば、マイクロプロセッサ)及び並列処理ユニット6、例えばグラフィック処理ユニット、すなわちGPU又はテンソル処理ユニット、すなわちTPUを含む。
【0029】
図1に概略的に示されるように、プロセッサ4は圧縮されることになるオーディオ又はビデオコンテンツを表すデータP、B、ここではフォーマットデータPとコンテンツデータBを受信する。
【0030】
フォーマットデータPは、オーディオ又はビデオコンテンツの表現フォーマットの特性、例えばビデオコンテンツの場合には画像サイズ(ピクセルの単位)、フレームレート、輝度情報のバイナリ深度及び色差情報のバイナリ深度を示す。
【0031】
コンテンツデータBは、オーディオ又はビデオコンテンツの(ここでは圧縮されていない)表現を形成する。例えばビデオコンテンツの場合、コンテンツデータは、画像シーケンスの各画像の各画素について、そのピクセルの輝度値を表すデータ及び/又はピクセルの色差値を表すデータを含む。
【0032】
並列処理ユニット6は、プロセッサ4によって構成された後に人工ニューラルネットワーク8を実装するように設計される。その目的のために、並列処理ユニットはある時点で同じ種類の複数の動作を並列に行うように設計される。
【0033】
以下に説明するように、人工ニューラルネットワーク8は、圧縮データCを得ることを目的として、コンテンツデータBの処理の枠内で使用される。
【0034】
本明細書に記載の実施形態において、コンテンツデータBが人工ニューラルネットワーク8の入力で適用されると、人工ニューラルネットワーク8は出力で圧縮データCを生成する。
【0035】
人工ニューラルネットワーク8の入力で適用された(すなわち人工ニューラルネットワーク8の入力層で適用された)コンテンツデータBは、画像のブロック、又は画像成分のブロック(例えば、輝度若しくは色差成分のブロック又はこの画像の色成分のブロック)、又はビデオシーケンスの画像、又はビデオシーケンスの画像の成分(例えば、輝度若しくは色差成分又は色成分)、又はビデオシーケンスの一連の画像も表し得る。
【0036】
例えば、この場合、入力層のニューロンの少なくとも幾つかは、画像成分のピクセル値をそれぞれ受信するように適合され得、前記値は、コンテンツデータBの1つによって表される。
【0037】
代替として、コンテンツデータBの処理は、幾つかの人工ニューラルネットワークの使用を含み得、これは、例えば、前述の記事、2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR),June 2019のGuo Lu et al.による「DVC:An End-to-end Deep Video Compression Framework」に記載されている。
【0038】
これから電子符号化装置2によって実行される符号化方法の例を、図2を参照しながら説明する。
【0039】
プロセッサ4にリンクされるメモリは、例えば、コンピュータプログラム命令を記憶し、これは、これらの命令がプロセッサ4によって実行されると、図2の方法のステップの少なくとも一部を実行するように設計される。換言すれば、プロセッサ4は図2のステップの少なくとも一部を実行するようにプログラムされる。
【0040】
図2の方法は、ここで、電子復号化装置によってアクセス可能な人工ニューラルネットワークのリストを受信する任意選択的ステップE2から始まる。
【0041】
リストは、例えば、電子符号化装置2のプロセッサ4によって電子復号化装置(例えば、後に説明する図7の電子復号化装置10と一致する)から直接受信される。
【0042】
以下に説明するように、電子復号化装置によってアクセス可能な人工ニューラルネットワークは、それに関して電子復号化装置が関係する人工ニューラルネットワークを定義するパラメータを記憶するか、又はサーバ等のリモート電子設備との接続によってこれらのパラメータにアクセスし得る人工ニューラルネットワークである。
【0043】
代替として、リストは、電子装置2のプロセッサ4により、上述のサーバ等のリモートサーバから直接受信できる。
【0044】
図2の方法は、符号化プロセス-復号化プロセスのペアを選択するステップE4に続く。符号化プロセスについて前述したように、符号化プロセスと復号化プロセスは各々、少なくとも1つの人工ニューラルネットワークを使用する。
【0045】
本明細書に記載の例では、符号化プロセスは符号化人工ニューラルネットワークによって実行され、復号化プロセスは復号化人工ニューラルネットワークによって実行される。
【0046】
符号化人工ニューラルネットワーク及び復号化ニューラルネットワークによって形成されるセット(符号化人工ニューラルネットワークの出力は復号化人工ニューラルネットワークの入力に適用される)は、例えば、オートエンコーダを形成する。
【0047】
符号化プロセス-復号化プロセスペアは、例えば、事前設定された複数の符号化プロセス-復号化プロセスペア、すなわちここでは複数の符号化人工ニューラルネットワーク-復号化人工ニューラルネットワークペアの中から選択される。
【0048】
電子復号化装置によってアクセス可能な人工ニューラルネットワークのリストが事前に受け取られている場合(ステップE2で前述したとおり)、符号化プロセス-復号化プロセスペアは、例えば、そのために復号化プロセスが受け取ったリスト中にある人工ニューラルネットワークを使用する符号化プロセス-復号化プロセスペアの中から選択される。
【0049】
符号化プロセス-復号化プロセスペアは、所期の用途(例えば、ユーザが電子符号化装置2の図示されていないユーザインタフェースを用いて示す)に応じても選択され得る。例えば、所期の用途がビデオ会議である場合、選択される符号化プロセス-復号化プロセスペアには低レイテンシの復号化プロセスが含まれる。他の用途の場合、選択される符号化プロセス-復号化プロセスペアにはランダムアクセス復号化プロセスが含まれる。
【0050】
ビデオシーケンスの復号化のための低レイテンシプロセスでは、ビデオシーケンスの画像は、例えば、符号化されたデータによって表され、それが直ちに送信され、復号化され得、データは、その後、ビデオ画像の表示順に送信され得るが、それにより、この場合、符号化と復号化との間に1フレームのレイテンシが確保される。
【0051】
ビデオシーケンスの復号化のためのランダムアクセスプロセスでは、それぞれ複数の画像に関する符号化されたデータは、これらの画像の表示順以外の順序で送信され、それにより圧縮度を高めることができる。他の画像を参照せずに符号化された画像(いわゆるイントラフレーム)は、その後、規則的に符号化され得、それによりビデオシーケンスの復号化を符号化されたストリーム内の複数の箇所から開始することができる。
【0052】
その目的のために、IEEE Transactions on Circuits and Systems for Video Technology, vol.22,no.12,pp.1649-1668,Dec.2012内のG.J.Sullivan,J.-R.Ohm,W.-J.Han and T.Wiegandによる記事「Overview of the High Efficiency Video Coding (HEVC) Standard」を参照されたい。
【0053】
符号化プロセス-復号化プロセスペアは、最良の圧縮-歪みバランスを得るためにも選択され得る。
【0054】
その目的のために、複数の符号化プロセス-復号化プロセスペアをコンテンツデータBに適用し、よりよい圧縮-歪みバランスに到達するセットを選択することが可能である。
【0055】
代替として、コンテンツの種類を特定し(例えば、コンテンツデータBを分析することによる)、特定された種類に応じた符号化プロセス-復号化プロセスペアを選択することが可能である。
【0056】
符号化プロセス-復号化プロセスペアは、電子復号化装置で利用可能な計算能力に応じても選択され得る。この計算能力を表す情報は、電子復号化装置から電子符号化装置に事前に送信されている(例えば、上述のステップE2で電子符号化装置によって受信されている)可能性がある。
【0057】
符号化プロセス-復号化プロセスペアを選択するための様々な基準を相互に組み合わせることも可能であり得る。
【0058】
符号化プロセス-復号化プロセスペアが選択されると、プロセッサ4は、並列処理ユニット6を並列処理ユニット6が選択された符号化方法を実行できるような方法で構成するステップE6に進む。
【0059】
このステップE6は、特に選択された符号化プロセスによって使用される符号化人工ニューラルネットワーク8の並列処理ユニット6内でのインスタンス化を含む。
【0060】
このインスタンス化は、特に以下のステップ、
- 並列処理ユニット6内において、符号化人工ニューラルネットワークを実装するのに必要なメモリスペースを留保するステップ、及び/又は
- 並列処理ユニット6を、符号化人工ニューラルネットワーク8を定義する重みW及び活性化関数でプログラムするステップ、及び/又は
- 並列処理ユニット6のローカルメモリ内にコンテンツデータBの少なくとも一部をロードするステップ
を含み得る。
【0061】
図2の方法は、したがって、符号化プロセスを実行するステップE8、すなわちコンテンツデータBを符号化人工ニューラルネットワーク8の入力に適用する(又は換言すれば入力としてコンテンツデータBをとることによって符号化人工ニューラルネットワーク8を作動させる)ステップを含む。
【0062】
したがって、ステップE8により、圧縮データCを(ここでは符号化人工ニューラルネットワーク8の出力で)生成できる。
【0063】
以下のステップは、特に圧縮データCを含み、電子復号化装置(例えば、図7に関して説明する電子復号化装置10)に向けられるデータストリームの符号化(すなわち準備)に関する。
【0064】
方法は、したがって、特にオーディオ又はビデオコンテンツの表現フォーマットのデータ特性(ここでは例えば符号化されているビデオシーケンスのフォーマットに関連付けられるデータ)を含む第一のヘッダ部分Fcを符号化するステップE10を含む。
【0065】
第一のヘッダ部分Fcを形成するこれらのデータは、例えば、画像サイズ(ピクセルの単位)、フレームレート、輝度情報のバイナリ深度及び色差情報のバイナリ深度を示す。これらのデータは、例えば、上述のフォーマットデータPに基づいて(考え得る再フォーマットの後に)構成される。
【0066】
図2の方法は、したがって、データストリームを復号化できる電子復号化装置(例えば、図7に関して後述する電子復号化装置10)にとっての復号化人工ニューラルネットワーク(ステップE4で選択された復号化プロセスによって使用される)の利用可能性を特定するステップE12に続く。
【0067】
この特定は、ステップE2で受け取ったリストに基づいて行われ得、プロセッサ4はこの場合、ステップE4で選択された復号化プロセスによって使用される復号化人工ニューラルネットワークがステップE2で受け取ったリストに属しているか否かを特定する。(当然のことながら、符号化プロセス-復号化プロセスペアが電子復号化装置にとって利用可能な復号化人工ニューラルネットワークに対応するように体系的に選択される実施形態において、ステップE12は、省略され得、したがって、方法は、ステップE14に続く。)
【0068】
考え得る実施形態によれば、電子復号化装置にとっての復号化人工ニューラルネットワークの利用可能性に関する情報がない場合、方法は(すでに説明したように、復号化人工ニューラルネットワークを記述するデータが電子復号化装置に送信されるように)ステップE16に続く。
【0069】
プロセッサ4が、ステップE12において、復号化人工ニューラルネットワークが電子復号化装置にとって利用可能であることを特定した場合(矢印P)、方法は、下記のステップE14に続く。
【0070】
プロセッサ4が、ステップE12において、復号化人工ニューラルネットワークが電子復号化装置にとって利用可能ではないことを特定した場合(矢印N)、方法は、以下のステップE16に続く。
【0071】
代替として、ステップE12の後のステップとしてのステップE14かステップE16かの選択は、他の基準に依存して、例えば電子符号化装置2に記憶された(且つおそらくユーザが電子符号化装置2のユーザインタフェースを介して調整可能であり得る)専用のインジケータ又はユーザが行う(例えば、電子符号化装置2のユーザインタフェースを介して得られる)選択に応じて行うこともできる。
【0072】
プロセッサ4は、インジケータINDを含む第二のヘッダ部分と、ここでは復号化人工ニューラルネットワークの識別子Innを含む第三のヘッダ部分を符号化するステップE14に進む。
【0073】
ステップE14において、データストリーム中で符号化されるインジケータINDは、その復号化人工ニューラルネットワークが所定の人工ニューラルネットワークセット、ここでは電子復号化装置にとって利用可能な(又はアクセス可能な)人工ニューラルネットワークセット(すなわちステップE2で受け取られるリストの人工ニューラルネットワークのセット)に属することを示す。
【0074】
復号化人工ニューラルネットワークの識別子Innは、変換により、(特に電子符号化装置と電子復号化装置が共有する)この復号化人工ニューラルネットワークを例えば上述の所定のセット内で定義する識別子である。
【0075】
プロセッサ4は、インジケータIND’を含む第二のヘッダ部分とここでは復号化人工ニューラルネットワークを記述するデータRcを含む第三のヘッダ部分を符号化するステップE16に進む。
【0076】
ステップE16において、データストリーム中で符号化されたインジケータIND’は、復号化人工ニューラルネットワークがデータストリーム中で符号化されたこと、すなわち上述の記述データRcによって表されることを示す。
【0077】
復号化人工ニューラルネットワークは、例えば、記述データ(又は復号化人工ニューラルネットワークを符号化するデータ)Rcにより、MPEG-7 part 17等の標準又はJSON等のフォーマットに従って符号化される(すなわち表される)。
【0078】
その目的のために、Proceedings of the 36th International Conference on Machine Learning,Long Beach,California,PMLR 97,2019におけるS.Wiedemann et al.による記事「DeepCABAC:Context-adaptive binary arithmetic coding for deep neural network compression」又はIEEE Transaction on Neural Networks and Learning Systems(Vol.31,Iss.3),March 2020におけるS.Wiedemann et al.による記事「Compact and Computationally Efficient Representation of Deep Neural Networks」を参照されたい。
【0079】
ステップE16後のステップE14において、図2の方法は、電子復号化装置が復号化人工ニューラルネットワークを使用して復号化プロセスを実行する可能性を特定するステップE18に続く。
【0080】
プロセッサ4は、例えば、この可能性を、(おそらく電子符号化装置と電子復号化装置との間のそれ以前の交換によって)電子復号化装置がこの復号化プロセスを実行するように設計されたモジュール又はこの電子復号化装置のプロセッサによってソフトウェアが実行されたときに電子復号化装置によるこの復号化プロセスの実行に適しているソフトウェアを含むか否かを特定することによって特定する。
【0081】
プロセッサ4は、電子復号化装置が復号化プロセスを実行できることを特定した場合、方法は、後述のステップE22に続く。
【0082】
プロセッサ4が、電子復号化装置が復号化プロセスを実行できないことを特定した場合、方法は、(ステップE22に進む前に)後述のステップE20を実行する。
【0083】
代替として、(ステップE22を実行する前に)ステップE20を実行するか否かの選択は、他の基準に存して、例えば電子符号化装置2内に記憶された(及びおそらくユーザによって電子符号化装置2のユーザインタフェースを介して調整可能な)専用インジケータ又は(例えば、電子符号化装置2のユーザインタフェースを介して得られる)ユーザによって行われた選択に応じて行うことができる。
【0084】
プロセッサ4は、ステップE20において、データストリーム中で電子復号化装置のプロセッサによって実行可能なコンピュータプログラムExe(又はコード)を含む第四のヘッダ部分を符号化する。(電子復号化装置内でのコンピュータプログラムExeの使用については、図8を参照して後に説明する。)
【0085】
電子復号化装置内での実行に合わせて調整されるようにするために、コンピュータプログラムは、例えば、電子復号化装置のハードウェア構成に関する情報(例えば、電子符号化装置2と電子復号装置との以前の交換によって受け取られた情報)に応じてライブラリ内で選択される。
【0086】
プロセッサ4は、したがって、ステップE8で得られた圧縮データCに基づいて圧縮ストリームFnnを符号化するステップE22に進む。
【0087】
この点において、上述の説明では、ステップE8は、ヘッダFetを符号化するステップ(ステップE10~E20)前に説明されていることがわかる。しかしながら、実際には、ステップE8は、ステップE22の直前に実行できる。
【0088】
特に、ステップE8によって圧縮されるべきオーディオ又はビデオコンテンツの一部のみを処理できる場合(例えば、ステップE8は圧縮されるべきビデオシーケンスのブロック、又は成分、又は画像の処理を実行する場合)、ステップE8(コンテンツの連続部分に関係する圧縮データを取得するため)及びE22(データストリーム中で得られた圧縮データを符号化するため)の実行を繰り返すことが可能である。
【0089】
プロセッサ4は、したがって、ステップE24において、ヘッダFet及び圧縮ストリームFnnを含む完全なデータストリームを構築することができる。
【0090】
完全なデータストリームは、ヘッダFet及び圧縮ストリームFnnが個別に識別可能となるような方法で構築される。
【0091】
考え得る実施形態によれば、ヘッダFetは、完全なデータストリーム中の圧縮ストリームFnnの開始のインジケータを含む。このインジケータは、例えば、圧縮データストリームの開始からの圧縮ストリームFnnの始まりの位置をビットで表したものである。(換言すれば、ヘッダはこの場合、所定の固定の長さを有する。)
【0092】
ヘッダFet及び圧縮ストリームFnnのその他の識別方法も代替として想定でき、これは、例えば、マーカ(すなわち圧縮ストリームFnnの開始を示すために使用され、その使用がデータストリームの残りの部分又は少なくともヘッダFetに隠されるバイナリの組合せ)である。
【0093】
図3~6には、図2の方法によって得られ得る完全なデータストリームの例が示されている。
【0094】
すでに説明したように、これらのデータストリームはヘッダFetと圧縮ストリームFnnを含む。
【0095】
図3のケース(ステップE14が実行され、ステップE20が実行されなかった状況に対応する)では、ヘッダは、
- オーディオ又はビデオコンテンツの表現フォーマットのデータ特性を含む第一の部分Fc、
- 復号化人工ニューラルネットワークが所定の人工ニューラルネットワークセットに属することを示すインジケータINDを含む第二の部分、
- 復号化人工ニューラルネットワークの識別子Innを含む第三の部分
を含む。
【0096】
図4のケース(ステップE16が実行され、ステップE20が実行されていない状況に対応する)では、ヘッダは、
- オーディオ又はビデオコンテンツの表現フォーマットのデータ特性を含む第一の部分Fc、
- 復号化人工ニューラルネットワークがデータストリーム中で符号化されていることを示すインジケータIND’を含む第二の部分、
- 復号化人工ニューラルネットワークを記述するデータRc(ここではそれを符号化するデータ)を含む第三の部分
を含む。
【0097】
図5のケース(ステップE14及びE20が実行された状況に対応する)では、ヘッダは、
- オーディオ又はビデオコンテンツの表現フォーマットのデータ特性を含む第一の部分Fc、
- 復号化人工ニューラルネットワークが所定の人工ニューラルネットワークセットに属することを示すインジケータINDを含む第二の部分、
- 復号化人工ニューラルネットワークの識別子Innを含む第三の部分、
- コンピュータプログラムExeを含む第四の部分
を含む。
【0098】
図6のケース(ステップE16及びE20が実行された状況に対応する)では、ヘッダは、
- オーディオ又はビデオコンテンツの表現フォーマットのデータ特性を含む第一の部分Fc、
- 復号化人工ニューラルネットワークがデータストリーム中で符号化されていることを示すインジケータINDを含む第二の部分、
- 復号化人工ニューラルネットワークを記述するデータRc(ここではそれを符号化するデータ)を含む第三の部分、
- コンピュータプログラムExeを含む第四の部分
を含む。
【0099】
ステップE24で構築されるデータストリームは、「Packet-Transport System」フォーマット又は「Byte-Stream」フォーマット等、それ自体知られている送信フォーマットにカプセル化され得る。
【0100】
「Packet-Transport System」フォーマット(例えば、RTPプロトコルによって提案される)の場合、データは、識別可能なパケットによって符号化され、通信ネットワーク上で送信される。ネットワークは、ネットワーク層によって提供されるパケット識別情報を用いて、データ(画像、画像の集合及びここではヘッダFetと圧縮ストリームFnn)の境界を容易に識別できる。
【0101】
「Byte-Stream」フォーマットの場合、特にパケットはなく、ステップE24の構築は、関連するデータの境界(例えば、ストリームのうちの各画像に対応する部分間及びここではヘッダFetと圧縮ストリームFnnとの間の境界)を、ネットワーク抽出層(NAL)ユニットの使用等の追加の手段を使用して識別できなければならず、この場合、固有のバイナリの組合せ(0×00000001等)によってデータ間の境界を識別することが可能である)。
【0102】
ステップE24で構築される完全なデータストリームは、その後、ステップE26において、電子復号化装置26に向かって(図示されていない通信手段により且つ/又は少なくとも1つの通信ネットワークを通して)発出するか、又は電子符号化装置2に(後に送信するか又は代替として後に例えば電子符号化装置自体内で復号化するために(この場合、図8に関して後述する復号化方法をさらに実行するように設計される))記憶され得る。
【0103】
オーディオ又はビデオコンテンツが複数の部分(例えば、コンテンツがビデオシーケンスである場合、複数の画像群)を含むときには、ステップE4~E24の方法はおそらく、コンテンツの各部分について(例えば、各画像群について)、図3~6の1つに示されるデータストリームを得るような方法で実行することができる。したがって、各画像群に関する圧縮ストリームFnnは、関係する画像群にとって適正であり、おそらく後述のように他の画像群に使用される人工ニューラルネットワークと異なる人工ニューラルネットワークを使用して復号化できる。人工ニューラルネットワークは、おそらく、同じ構造を有し得る(且つその重み及び/又は特定の人工ニューラルネットワークを定義する活性化関数のみが異なる)。
【0104】
図7は、少なくとも1つの人工ニューラルネットワーク18を使用する電子復号化装置10を示す。
【0105】
この電子復号化装置10は、受信ユニット11、プロセッサ14(例えば、マイクロプロセッサ)及び並列処理ユニット16、例えばグラフィック処理ユニット、すなわちGPU又はテンソル処理ユニット、すなわちTPUを含む。
【0106】
受信ユニット11は、例えば、通信回路(無線周波数通信回路等)であり、それにより電子符号化装置2等の外部電子装置からデータ(及び特にここでは符号化されたデータストリーム)を受信し、これらのデータを(そこに受信ユニット11が例えばバスによって接続される)プロセッサ14に通信することが可能となる。
【0107】
電子復号化装置10は、記憶ユニット12、例えばメモリ(リライタブル不揮発性メモリであり得る)又はハードドライブも含む。記憶ユニット12は、図7において、プロセッサ14と異なる素子として示されているが、記憶ユニット12は、代替として、プロセッサ14に内蔵され得る(すなわちその中に含まれ得る)。
【0108】
プロセッサ14はこの場合、例えば記憶ユニット12に記憶されたコンピュータプログラムの複数の命令を連続的に実行するように適合される。
【0109】
並列処理ユニット16は、プロセッサ14によって構成された後、人工ニューラルネットワーク18を実装するように設計される。その目的のために、並列処理ユニット16は、ある時点で同じ種類の複数の動作を並列に行うように設計される。
【0110】
図7に概略的に示されているように、プロセッサ14は、第一のデータセット、ここではヘッダFetと、オーディオ又はビデオコンテンツを表す第二のデータセット、ここでは圧縮ストリームFnnを含むデータストリームを(例えば、電子復号化装置10の、図示されない通信手段を介して)受信する。
【0111】
後述するように、人工ニューラルネットワーク18は、第二のデータセット(すなわちここでは圧縮データFnn)の処理の枠組み内において、初期オーディオ又はビデオコンテンツBに対応するオーディオ又はビデオコンテンツを取得するために使用される。
【0112】
記憶ユニット12は、複数のパラメータセットを記憶でき、各パラメータセットは復号化人工ニューラルネットワークを定義する。後述するように、プロセッサ14はこの場合、これらのパラメータセットのうちの特定のパラメータセットによって並列処理ユニット16を、並列処理ユニット16がこの特定のパラメータセットによって定義される人工ニューラルネットワークを実装できるような方法で構成できる。
【0113】
記憶ユニット12は、特に、ランダムアクセスデコーダを形成する第一の人工ニューラルネットワークを定義する第一のパラメータセット及び/又は低レイテンシデコーダを形成する第二の人工ニューラルネットワークを定義する第二のパラメータセットを記憶し得る。
【0114】
この場合、電子復号化装置10には、コンテンツへのランダムアクセスが望ましい状況とコンテンツが遅滞なく表示されることになる状況の両方のための事前の復号化オプションがある。
【0115】
ここで、図8に関して、電子復号化装置10内において、並列処理ユニット16によって実装される人工ニューラルネットワーク18を用いて実行される復号化方法を説明する。
【0116】
この方法は、電子復号化装置10による、復号化対象のデータストリームの送信を制御する装置に向けた、電子復号化装置10によって利用可能な人工ニューラルネットワークのリストLの送信の人選択的ステップから開始され得る。データストリーム送信制御装置は、例えば、電子符号化装置2であり得る。(電子符号化装置2は、この場合、このリストLを図2に関して前述したステップE2で受信する。)代替として、データストリーム送信制御装置は、電子符号化装置2と協働する専用サーバでもあり得る。
【0117】
電子復号化装置10がアクセス可能な人工ニューラルネットワークは、電子復号化装置10がそれに関して(前述のように)関係する人工ニューラルネットワークを定義するパラメータセットを記憶するか、又は(後述のように)サーバ等のリモート電子設備との接続によってこのパラメータセットにアクセスし得る人工ニューラルネットワークである。
【0118】
図8の方法は、(電子復号化装置10、正確にはここでは受信ユニット11によって)第一のパラメータセット、すなわちヘッダFetと第二のパラメータセット、すなわち圧縮ストリームFnnを含むデータストリームを受信するステップE52を含む。受信ユニット11は、受信したデータストリームをプロセッサ14に送信する。
【0119】
プロセッサ14は、したがって、受信したデータストリーム内の第一のデータセット(ヘッダFet)及び第二のデータセット(圧縮ストリームFnn)を、例えば圧縮ストリームの始まりのインジケータ(ステップE24の説明ですでに述べた)によって識別するステップE54に進む。
【0120】
プロセッサ14は、ステップE54において、第一のデータセット(ヘッダ)、すなわちここではヘッダFet内の異なる部分も識別し得、これは、前述の図3~6に示されるように、第一の部分Fc(データストリームによって符号化されたコンテンツのフォーマットの特性を表すデータを含む)、第二の部分(インジケータIND又はIND’)、第三の部分(Inn又は符号化データRc)及びおそらく第四の部分(コンピュータプログラムExe)である。
【0121】
ステップE54において、第一のデータ内で実行可能命令(例えば、コンピュータプログラムExeの命令)が識別(すなわち検出)される場合、プロセッサ14は、ステップE56において、これらの実行可能命令を実行し、第一のデータセットからのデータの処理のステップの少なくとも特定のものの実行を開始し得る。これらの命令は、プロセッサ14又は代替として電子復号化装置10内でインスタンス化された仮想マシンによって実行され得る。
【0122】
図7の方法は、オーディオ又はビデオコンテンツの表現フォーマットの特性であるデータFcを、このフォーマットの特性を取得するような方法で復号化するステップE58に続く。ビデオコンテンツの場合、例えば、データ部分Fcの復号化により、画像サイズ(ピクセルの単位)、及び/又はフレームレート、及び/又は輝度情報のバイナリ深度、及び/又は色差情報のバイナリ深度を取得することが可能となる。
【0123】
プロセッサ14は、次に、(特定の実施形態では前述のようにステップE54での第一のデータセット内で識別された命令の実行により)ここではヘッダFetの第二の部分に含まれるインジケータIND、IND’を復号化するステップE60に進む。
【0124】
受信したデータストリーム中にあるインジケータIND、IND’の復号化が、復号化に使用される人工ニューラルネットワーク18が所定の人工ニューラルネットワークセットに属することを示す場合(すなわち、第一のデータセット中にあるインジケータが、復号化人工ニューラルネットワーク18が所定の人工ニューラルネットワークに属することを示すインジケータINDである場合)、方法は、後述のステップE62に続く。
【0125】
受信したデータストリーム中にあるインジケータIND、IND’の復号化が、復号化に使用される人工ニューラルネットワーク18がデータストリーム内で符号化されることを示す場合(すなわち、第一のデータセット中にあるインジケータが、復号化人工ニューラルネットワーク18がデータストリーム内で符号化されることを示すインジケータIND’である場合)、方法は、後述のステップE66に続く。
【0126】
ステップE62において、プロセッサ14は、(特定の実施形態において前述のようにステップE54での第一のデータセット内で識別された命令の実行により)識別子Inn(ここではヘッダFetの第三の部分に含まれる)の復号化に進む。前述のように、この識別子Innは、例えば、前述の所定の人工ニューラルネットワークセット内の復号化人工ニューラルネットワーク18を指定する識別子である。
【0127】
プロセッサ14は、したがって、(特定の実施形態において前述のようにステップE54での第一のデータセット内で識別された命令の実行により)復号化された識別子Innに関連付けられたパラメータセットを記憶ユニット12内から読み出すステップE64に進むことができる(このパラメータセットは、復号化された識別子Innによって識別される人工ニューラルネットワークを定義する)。
【0128】
考え得る実施形態によれば、プロセッサ14は、復号化された識別子Innによって識別されるこの人工ニューラルネットワークに関するデータ(特にパラメータ)が(ここでは記憶ユニット12内に)ない場合にエラーメッセージを生成するようになされ得る。
【0129】
代替として(又は復号化された識別子Innによって識別された人工ニューラルネットワークのための記憶ユニット12に何れのパラメータセットも記憶されていない場合)、電子復号化装置10は、(特定の実施形態において前述のようにステップE54での第一のデータセット内で識別された命令の実行により)リモートサーバにパラメータセットのリクエストを送信し(このリクエストは、例えば、符号化された識別子Innを含む)、ステップE64において、復号化された識別子Innによって識別される人工ニューラルネットワークを定義するパラメータセットを回答として受信し得る。
【0130】
次に、方法は後述のステップE68に続く。
【0131】
ステップE66において、プロセッサ14は、(特定の実施形態において前述のようにステップE54での第一のデータセット内で識別された命令の実行により)人工ニューラルネットワーク18を記述するデータRc(ここではヘッダFetの第三の部分に含まれる)の復号化に進む。
【0132】
前述のように、これらの記述データ(又は符号化データ)Rcは、例えば、MPEG-7 part 17等の標準又はJSON等のフォーマットに従って符号化される。
【0133】
記述データRcの符号化により、第二のデータセットからのデータ(すなわちここでは圧縮ストリームFnnのデータ)を復号化するために使用される人工ニューラルネットワークを定義するパラメータを取得することが可能となる。
【0134】
方法は、この場合、ステップE68に続き、これについて以下に説明する。
【0135】
プロセッサ14は、次に、(特定の実施形態において前述のようにステップE54での第一のデータセット内で識別された命令の実行により)復号化人工ニューラルネットワーク18を定義するパラメータ(ステップE64又はステップE66で取得したパラメータ)によって並列処理ユニット16を、並列処理ユニット16が復号化人工ニューラルネットワーク18を実装できるような方法で構成するステップE68に進む。
【0136】
この構成ステップE68は、特に並列処理ユニット16内の復号化人工ニューラルネットワーク18を、ここではステップE64又はステップE66で得られたパラメータを使用してインスタンス化することを含む。
【0137】
このインスタンス化は、特に、
- 並列処理ユニット16内において、復号化人工ニューラルネットワーク18を実装するのに必要なメモリスペースを留保するステップ、及び/又は
- 並列処理ユニット16を、復号化人工ニューラルネットワーク18を定義するパラメータ(例えば、重みW’及び活性化関数を含む)(ステップE64又はステップE66で得られたパラメータ)でプログラムするステップ、及び/又は
- 並列処理ユニット16のローカルメモリ内に第二のデータセットからのデータの少なくとも一部(すなわち圧縮ストリームFnnのデータの少なくとも一部)をロードするステップ
を含み得る。
【0138】
ステップE58~E68の上述の説明からわかるように、第一のデータセットFetのデータは、したがって、プロセッサ14によってこのように処理される。
【0139】
プロセッサ14は、その後、ステップE70において、第二のデータセットからのデータ(ここでは圧縮ストリームFnnのデータ)を、並列処理ユニット16によって実装される人工ニューラルネットワーク18に、これらのデータが少なくとも部分的に人工ニューラルネットワーク18を使用する復号化プロセスによって処理されるような方法で適用する(すなわち提示する)ことができる。
【0140】
本明細書で説明する例では、人工ニューラルネットワーク18は入力として第二のデータセットFnnのデータを受信し、出力として、オーディオ又はビデオ再生装置上での再生に適応された符号化済みコンテンツの表現Iを生成する。換言すれば、第二のデータセットFnnのデータの少なくとも特定のものが人工ニューラルネットワーク18の入力層に適用され、人工ニューラルネットワーク18の出力層は上述の符号化済みコンテンツの表現Iを生成する。ビデオコンテンツ(1つの画像又は画像シーケンスを含む)の場合、人工ニューラルネットワーク18は、したがって、出力として(すなわちその出力層において)画像の少なくとも1つのマトリクス表現Iを生成する。
【0141】
特定の実施形態において、圧縮ストリームFcの特定のデータ(例えば、あるブロック又はある画像に対応する)を処理するために、人工ニューラルネットワーク18は入力として圧縮ストリームFc内の先行データ(例えば、先行ブロック又は先行画像に対応する)の処理中に人工ニューラルネットワーク18で生成されたデータの少なくとも特定のものを受信できる。この場合、それは人工ニューラルネットワーク18の出力で生成されたデータを人工ニューラルネットワーク18の入力に再注入するステップE72に進む。
【0142】
さらに、他の考え得る実施形態によれば、復号化プロセスは、コンテンツデータBの処理に関してすでに前述したように、複数の人工ニューラルネットワークを使用できる。
【0143】
第二のセットからのデータ(ここでは圧縮ストリームFnnの少なくとも特定のデータ)は、したがって、第一のセットからのデータの部分に依存するプロセス(ここでは識別子Inn又は符号化データRcに依存するプロセス)により、並列処理ユニット16によって実装される人工ニューラルネットワーク18を使用して処理されている。
【0144】
プロセッサ14は、その後、ステップ74において、人工ニューラルネットワーク18による圧縮ストリームFnnの処理が終了したか否かを特定する。
【0145】
特定結果が否定(N)の場合、方法はステップE70に戻り、圧縮ストリームFnnの他のデータを人工ニューラルネットワーク18に適用する。
【0146】
特定結果が肯定(P)の場合、方法はステップE76に続き、プロセッサ14は受信したデータストリーム内に処理すべきデータが残っているか否かを特定する。
【0147】
ステップE76での特定結果が否定(N)の場合、方法はステップE78で終了する。
【0148】
ステップE76での特定結果が肯定(P)の場合、方法はステップE52に戻り、図3~6の1つに示されるデータストリームの新しい部分の処理を行う。
【0149】
以上、符号化ステップE4~E24の繰返しとして示されているように、データストリームのこの別の部分も、したがって、第一のデータセットと、他のオーディオ又はビデオコンテンツを表す第二のデータセット(例えば、ビデオコンテンツの場合、使用されるコンテンツの表現フォーマットに関する他の画像グループ)とを含む。この場合、ステップE54~E66に前述したように、他の人工ニューラルネットワークをこれらの第一のデータの特定のものに基づいて特定でき、その後、並列処理ユニット16はこの別の人工ニューラルネットワークを(前述のステップE68に従って)実装するように構成され得る。データストリームのこの別の部分の第二のデータセットからのデータ(例えば、前述の他の画像グループに関する)は、その後、この別の人工ニューラルネットワークによって(ステップE70で前述したように)復号化され得る。
【0150】
上述の別の人工ニューラルネットワークは、前述の人工ニューラルネットワーク18のそれと同じ構造を有し得、それにより並列処理ユニット16を構成するステップが単純化される(現在の人工ニューラルネットワークを定義する重み及び/又は活性化関数のみが例えば更新される)。
図1
図2
図3
図4
図5
図6
図7
図8
【国際調査報告】