(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-01-19
(54)【発明の名称】複数解像度を使う階層コーディングスキーム内での信号エレメントコーディングフォーマット互換性
(51)【国際特許分類】
H04N 19/30 20140101AFI20220112BHJP
H04N 19/85 20140101ALI20220112BHJP
【FI】
H04N19/30
H04N19/85
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021545336
(86)(22)【出願日】2019-10-09
(85)【翻訳文提出日】2021-05-25
(86)【国際出願番号】 GB2019052869
(87)【国際公開番号】W WO2020089583
(87)【国際公開日】2020-05-07
(32)【優先日】2018-10-09
(33)【優先権主張国・地域又は機関】GB
(32)【優先日】2018-12-14
(33)【優先権主張国・地域又は機関】GB
(32)【優先日】2019-01-14
(33)【優先権主張国・地域又は機関】GB
(32)【優先日】2019-02-13
(33)【優先権主張国・地域又は機関】GB
(81)【指定国・地域】
(71)【出願人】
【識別番号】521151072
【氏名又は名称】ヴイ-ノヴァ インターナショナル リミテッド
【氏名又は名称原語表記】V-NOVA INTERNATIONAL LIMITED
【住所又は居所原語表記】1 Sheldon Square,Paddington,London Greater London W2 6TT,UNITED KINGDOM
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(72)【発明者】
【氏名】フェラーラ,シモーヌ
(72)【発明者】
【氏名】マーディ,グイド
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LA02
5C159MA34
(57)【要約】
信号を符号化および復号化するための方法が与えられる。当該方法は、第1信号(900)および第2信号(960)を受信する工程を有し、第1および第2信号は共通コンテンツの異なるバージョンを含み、第1信号(900)は第1信号エレメントコーディングフォーマットを使用し、第2信号(960)は第2信号エレメントコーディングフォーマットを使用する。第1信号(900)は下位符号化信号(910)を生成するべく下位エンコーディングモジュール(1103)によって符号化される。下位符号化信号(910)は下位復号化信号を生成するべく復号化される。下位復号化信号は、処理済み信号を生成するべく、第1信号エレメントコーディングフォーマットから第2信号エレメントコーディングフォーマットへ少なくとも変換しかつアップサンプリングすることによって処理される。処理済み信号および第2信号(960)は、上位符号化信号(920)を生成するべく上位エンコーディングモジュール(1107)によって処理される。
【特許請求の範囲】
【請求項1】
信号を復号化する方法であって、
第1信号および第2信号を受信する工程であって、前記第1信号および前記第2信号は共通のコンテンツの異なるバージョンを有し、前記第1信号は第1信号エレメントコーディングフォーマットを使用し、前記第2信号は第2信号エレメントコーディングフォーマットを使用するところの工程と、
下位符号化信号を生成するべく、下位エンコーディングモジュールによって前記第1信号を符号化する工程と、
下位復号化信号を生成するべく、前記下位符号化信号を復号化する工程と、
処理済み信号を生成するべく、前記第1信号エレメントコーディングフォーマットから前記第2信号エレメントコーディングフォーマットへ少なくとも変換することにより、前記下位復号化信号を処理する工程と、
上位符号化信号を生成するべく、前記処理済み信号および前記第2信号を上位エンコーディングモジュールによって処理する工程と
を備える方法。
【請求項2】
前記第1信号エレメントコーディングフォーマットは第1色空間を表し、前記第2信号エレメントコーディングフォーマットは第2色空間を表す、ことを特徴とする請求項1に記載の方法。
【請求項3】
前記信号エレメントコーディングフォーマットは標準ダイナミックレンジ(SDR)を表し、前記第2信号エレメントコーディングフォーマットは高ダイナミックレンジ(HDR)を表し、HDRフォーマットはSDRフォーマットより高い輝度および/または広い色域を有する、ことを特徴とする請求項1または2に記載の方法。
【請求項4】
前記第1信号エレメントコーディングフォーマットは第1ビット深度を有し、前記第2信号エレメントコーディングフォーマットは第2ビット深度を有し、前記第1ビット深度は前記第2ビット深度より小さい、ことを特徴とする請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記第1信号エレメントコーディングフォーマットは第1レベルの品質であり、前記第2信号エレメントコーディングフォーマットは第2レベルの品質であり、前記第2レベルの品質は前記第1レベルの品質より高い、ことを特徴とする請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記上位符号化信号は、基準信号としての前記第2信号と前記基準信号の再構成済みバージョンとしての前記処理済み信号との間の差を表す残差データを有するエンハンスメント信号である、ことを特徴とする請求項1から5のいずれか一項に記載の方法。
【請求項7】
前記下位復号化信号を処理する工程は、アップサンプリング済み信号を生成するべく前記下位復号化信号をアップサンプリングする工程、および中間符号化信号を生成するべく前記アップサンプリング済み信号および前記第1信号を中間エンコーダで処理する工程を有する、ことを特徴とする請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記中間符号化信号は、基準信号としての前記第1信号と、前記基準信号の再構成済みバージョンとしての前記アップサンプリング済み信号との間の差を表す残差データを有するエンハンスメント信号を有する、ことを特徴とする請求項7に記載の方法。
【請求項9】
前記中間符号化信号は、中間再構成済み信号を出力するべく、前記下位復号化信号のアップサンプリング済みバージョンによって復号化および処理される、ことを特徴とする請求項か7または8に記載の方法。
【請求項10】
前記第1信号エレメントコーディングフォーマットから前記第2信号エレメントコーディングフォーマットへ少なくとも変換することによって、前記アップサンプリング済み信号を処理する工程は、前記第1色空間から前記第2色空間へ前記中間再構成済み信号を変換する工程を有する、ことを特徴とする請求項9または10に記載の方法。
【請求項11】
前記下位復号化信号を処理する工程は、前記第1信号エレメントコーディングフォーマットから前記第2信号エレメントコーディングフォーマットへ前記下位復号化信号を変換する工程、および前記処理済み信号を生成するべく前記変換の出力をアップサンプリングする工程を有する、ことを特徴とする請求項1から10のいずれか一項に記載の方法。
【請求項12】
当該方法は、下位符号化信号を生成するべく、前記第1信号を下位符号化モジュールによって符号化する前に、前記第1信号をダウンサンプリングする工程を備える、請求項1から11のいずれか一項に記載の方法。
【請求項13】
前記第1信号は連続する複数のフレームを有し、前記第2信号は対応する連続する複数のフレームを有し、各フレームは前記下位エンコーダによって符号化される、ことを特徴とする請求項1から12のいずれか一項に記載の方法。
【請求項14】
前記第1信号エレメントコーディングフォーマットから前記第2信号エレメントコーディングフォーマットへ変換する工程は非線形である、ことを特徴とする請求項1から13のいずれか一項に記載の方法。
【請求項15】
前記第1信号エレメントコーディングフォーマットから第2信号エレメントコーディングフォーマットへ変換する工程は非予測的である、ことを特徴とする請求項1から14のいずれか一項に記載の方法。
【請求項16】
信号を復号化する方法であって、
第1信号エレメントコーディングフォーマットで下位復号化信号を生成するべく、下位復号化モジュールによって下位符号化信号を復号化する工程と、
上位再構成済み信号を生成するべく、第1信号エレメントコーディングフォーマットから第2信号エレメントコーディングフォーマットへ少なくとも変換しかつアップサンプリングすることにより、前記下位復号化信号を処理する工程と、
上位復号化信号を生成するべく、上位符号化信号を上位復号化モジュールによって復号化する工程と、
前記第2信号エレメントコーディングフォーマットでオリジナル信号の再構成である上位合成済み復号化信号を生成するべく、前記上位デコーディングモジュールによって前記上位再構成済み信号および前記上位復号化信号を処理する工程と
を備える方法。
【請求項17】
前記第1信号エレメントコーディングフォーマットは第1色空間を表し、前記第2信号エレメントコーディングフォーマットは第2色空間を表す、ことを特徴とする請求項16に記載の方法。
【請求項18】
前記下位復号化信号は標準ダイナミックレンジ(SDR)を有し、前記上位合成済み復号化信号は高ダイナミックレンジ(HDR)を有し、HDRフォーマットはSDRフォーマットより高い輝度および/または広い色域を有する、ことを特徴とする請求項16または17に記載の方法。
【請求項19】
前記下位復号化信号は第1ビット深度を有し、前記上位再構成済み信号は第2ビット深度を有し、前記第1ビット深度は前記第2ビット深度より小さい、ことを特徴とする請求項16から18のいずれか一項に記載の方法。
【請求項20】
前記第1信号エレメントコーディングフォーマットは第1レベルの品質であり、前記第2信号エレメントコーディングフォーマットは第2レベルの品質であり、前記第2レベルの品質は前記第1レベルの品質より高い、ことを特徴とする請求項16から19のいずれか一項に記載の方法。
【請求項21】
前記上位復号化信号は、前記第2信号エレメントコーディングフォーマットでオリジナル信号を再構成するべく、前記上位再構成済み信号を調節するための残差データを有するエンハンスメント信号である、ことを特徴とする請求項16から20のいずれか一項に記載の方法。
【請求項22】
中間復号化信号を生成するべく、中間デコーディングモジュールによって中間符号化信号を復号化する工程を備え、前記下位復号化信号を処理する工程は、アップサンプリング済み信号を生成するべく前記下位復号化信号をアップサンプリングする工程、および中間再構成済み信号を生成するべく前記アップサンプリング済み信号および前記中間復号化信号を前記中間デコーダで処理する工程を有する、ことを特徴とする請求項16に記載の方法。
【請求項23】
前記中間復号化信号は、前記第1信号エレメントコーディングフォーマットでオリジナル信号を再構成するべく、前記アップサンプリング済み信号を調節するための残差データを有するエンハンスメント信号である、ことを特徴とする請求項22に記載の方法。
【請求項24】
前記下位復号化信号を処理する工程は、第1色空間から第2色空間へ前記中間再構成済み信号を変換する工程を有する、ことを特徴とする請求項22または23に記載の方法。
【請求項25】
接続されたディスプレイが前記第2信号エレメントコーディングフォーマットを表示することができないか否かを検知する工程と、もしそうであれば、前記中間再構成済み信号を出力する工程を備える、請求項16に記載の方法。
【請求項26】
ディスプレイが前記第1信号エレメントコーディングフォーマットのみを表示することができる場合、前記上位合成済み復号化信号を前記第1信号エレメントコーディングフォーマットへ逆変換するよう選択する工程を備える、請求項17に記載の方法。
【請求項27】
前記下位復号化信号は前記上位合成済み復号化信号のすべてのフレームを有し、前記下位符号化信号内の各フレームは前記下位符号化モジュールによって復号化され、前記上位合成済み復号化信号のベースバージョンを与え、前記上位符号化信号は前記ベースバージョンの各フレームに対するエンハンスメント情報を有する、ことを特徴とする請求項16から26のいずれか一項に記載の方法。
【請求項28】
前記第1信号エレメントコーディングフォーマットから前記第2信号エレメントコーディングフォーマットへ変換する工程は非線形である、ことを特徴とする請求項16から27のいずれか一項に記載の方法。
【請求項29】
前記第1信号エレメントコーディングフォーマットから前記第2信号エレメントコーディングフォーマットへ変換する工程は非予測的である、ことを特徴とする請求項16から28のいずれか一項に記載の方法。
【請求項30】
請求項1から29のいずれか一項に記載の方法を実行するよう適応されたコンピュータプログラム。
【請求項31】
請求項30に記載のコンピュータプログラムを有するコンピュータ読み取り可能記憶媒体またはデータキャリア。
【請求項32】
請求項1から29のいずれか一項に記載の方法を実行するよう適応された、プロセッサおよびメモリを有するデータ処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本願発明は、信号、特に、ビデオ信号を処理するための方法に関する。信号処理は、これに限定しないが、ビデオ信号内のダイナミックカラーレンジを増加させるようなデータを取得し、導出し、出力し、受信し、かつ再構成することを含む。
【背景技術】
【0002】
技術の進歩は、特に圧縮、記憶および伝送用に信号を処理するための多くの異なる技術および方法が存在することを示している。例えば、長年にわたって、情報が圧縮されるように画像およびビデオ信号を符号化するための多くの方法が開発されてきた。これは、地上波無線放送、ケーブル放送、衛星放送、もしくはインターネット、または他のデータネットワークのいずれかを介する任意の伝送路のストレージ要求および帯域幅要求を減少させる利点を有する。技術が進歩するに従い、圧縮および伝送のより洗練された方法が開発された。高品質な信号が所望され、例えば、高解像度ビデオ(フレームあたりの増加画素数または一秒あたりの増加フレーム数として現れる)を有する信号が要求されている。結果として、既存の多くの信号フォーマットが存在し、これらのフォーマットを使用ことができるか、またはできない多くのタイプの信号エンコーダおよびデコーダが存在する。これは、最も広範囲の視聴者に利用可能なコンテンツを保証したいコンテンツのクリエータおよび配信者にとっては問題である。結果として、クリエータおよび配信者は、例えば、MPEG-2、MPEG-4Part10、High Efficiency Video Coding (HEVC)などの標準符号化技術を使って符号化された多くの異なるエンコーディングフォーマットでコンテンツを提供しなければならない。また、符号化信号の配信もまた、標準化および非標準化放送およびストリーミング技術によって促進されている。全体として、これがコンテンツ配信者にとってコストを増加させる複雑な状況を作っており、かつ、普及ずみの古い技術(例えば、旧式デコーダおよびセットトップボックスなど)との互換性欠如のために、より新しくかつより良い技術の適用をより困難なものにしている。
【0003】
高ダイナミックレンジ(HDR)ビデオは、品質改善のひとつの次元を付加することにより高品質ビデオを伝送する潜在性を示した。すなわち、解像度の増加(すなわち、フレームあたりのより多くの画素数)および動き忠実性の増加(すなわち、一秒あたりのより多くのフレーム数)とは別に、オペレータはダイナミックレンジを増加させることもできる(すなわち、より広範囲の輝度、トーン、ひいてはよりビビッドなコントラストおよびカラー)。HDR対応ディスプレイの広い有用性はHDRビデオとの関連性をより増加させている。
【0004】
高ダイナミックレンジ(HDR)は、典型的に、標準ダイナミックレンジ(SDR)より高い輝度および/または色域を指し、後者は従来のガンマ曲線を使って色域を表す。HDRは、典型的に、最も明るいおよび最も暗いカラーの値を変化させること、および、異なるカラープレーン(典型的に、標準カラープレーンからワイドカラー全域プレーンに拡張された)を使うことによって演算する。
【0005】
現在の市場には、十分に大きな範囲の利用価値を有するように、典型的に、10ビット(またはそれ以上の高ビット深度)表示のカラー成分(例えば、輝度Yおよび彩度CbおよびCr)を要求するさまざまなHDR実装が存在する。このHDR実装のひとつは、HDR 100であり、それは、ビデオストリーム内に表示された輝度および色域を調整するためにビデオ信号内の統計メタデータを使用する。こうして、単一のHRD設定がビデオシーケンスを通じて適用される。動的メタデータを使う異なる実装は、HDR10+またはドルビー(商標)ビジョンなどのさまざまな商業的名称を有する。動的メタデータに関して、HDR設定は、フレームバイフレーム方式で変更され、したがって、場面の変化に対してより高い粒度および順応を与えうる。
【0006】
しかし、現在、HDRビデオの伝送は、HEVCなどのネイティブ10ビットビデオフォーマットを復号化することができるデコーダを要求している。ほとんどのオペレータが、8ビットのAVC/H.264ビデオを復号化することができる古い装置のみを所有している大部分の顧客ベースにサービスを提供し続ける必要があるので、しばしばこれは、ビデオワークフローの複製を要求する。同様に、それはまた、オペレータが、VP9などの8ビットフォーマットを有するHDRを使用することを妨げる。さらに、HDRによって要求されるトーンマッピングは、圧縮効率を最適化するために必ずしも最適にフィットしない。この視点での他の情報は、以下の論文を参照することで明らかである。A. Banitalebi-Dehkordi, M. Azimi, M. T. Pourazad and P. Nasiopoulos, "Compression of high dynamic range video using the HEVC and H.264/AVC standards," 10th International Conference on Heterogeneous Networking for Quality, Reliability, Security and Robustness, Rhodes, 2014, pp. 8-12.
【0007】
より新しいコーディング標準、特にHDR関連標準または技術と、容易に置換またはアップグレードできない古いデコーディング装置との非互換性に関する一般的問題が存在する。信号伝送用に利用可能な制限された帯域幅の一般的問題も存在する。異なる方法で符号化された同じコンテンツの多くのバージョンを作成しかつ維持する際に、コンテンツ配信者用の処理およびストレージオーバーヘッドの一般的問題も存在し、この問題は、HDRタイプの信号(すなわち、より広い輝度範囲およびコントラスト比に対するポテンシャルを有する信号および/またはより広いカラー全域を表す情報を含む信号)を符号化するいくつかの競合しかつ広範囲に非互換の技術の導入によって悪化する。
【発明の概要】
【発明が解決しようとする課題】
【0008】
本開示は、上述した問題のひとつ以上を解決することを目的とする。
【課題を解決するための手段】
【0009】
本開示において、HDRタイプの情報が上述したひとつ以上の問題を解決するために、階層コーディングスキームでどのように組み合わされるかについて説明する。特に、HDRタイプの信号がHDR互換ディスプレイ装置を介してユーザに与えられることを可能にし、かつ、ひとつ以上のデコーダ技術または関連するディスプレイ装置がHDRタイプの情報を処理することができない場合に、HDR非同等信号がユーザに与えられることを可能にするような方法で、階層信号が符号化され、伝送され、復号化されることが可能となるエンコードおよびデコード方式を与えることを目的とする。特に、よりエレガントかつ効率的な方法を与えることを目的とする。また、可能な場合、HDRタイプの復号化およびSDRタイプの符号化に必要なすべての情報からなる合成符号化ビデオストリームを与えること、および、HDRタイプの復号化に必要な情報がデコーダに入力されたか否かまたはHDRタイプの復号化に必要な情報がデコーダで使用されたか否か(例えば、該情報は無視されたかまたは破棄されうる)のフレキシビリティを与えることである。
【0010】
添付する特許請求の範囲に従う、方法、コンピュータプログラム、コンピュータ読み取り可能記憶媒体またはデータキャリア、およびデータ処理装置が与えられる。
【0011】
本願発明の第1の態様は、第1信号および第2信号を受信することを有する、信号をエンコードするための方法を開示する。第1および第2の信号は、共通コンテンツの異なるバージョンを有する。第1信号は第1信号エレメントコーディングフォーマットを使用し、第2信号は第2信号エレメントコーディングフォーマットを使用する。第1信号は下位符号化信号を生成する下位符号化モジュールによって符号化される。下位符号化信号は下位復号化信号を生成するべく復号化される。下位復号化信号は、少なくとも、第1信号エレメントコーディングフォーマットから第2信号エレメントコーディングフォーマットへ変換することによって処理されかつアップサンプリングされ、処理済み信号が生成される。こうして、信号改良、ポテンシャル帯域幅の減少、および後方互換性のひとつ以上が与えられる。
【0012】
第1信号エレメントコーディングフォーマットは、第1色空間を表してよく、第2信号エレメントコーディングフォーマットは第2色空間を表してよい。
【0013】
第1信号エレメントコーディングフォーマットは、標準ダイナミックレンジSDRを表してよく、第2信号エレメントコーディングフォーマットは、高ダイナミックレンジHDRを表してよく、HDRフォーマットはSDRフォーマットよりも高い輝度および/または広い色域を有してよい。
【0014】
任意で、第1信号エレメントコーディングフォーマットは、第1ビット深度を有してよく、第2信号エレメントコーディングフォーマットは第2ビット深度を有してよく、ここで、第1ビット深度は第2ビット深度より小さくて良い。
【0015】
任意で、第1信号エレメントコーディングフォーマットは、第1レベルの品質であってよく、第2信号エレメントコーディングフォーマットは第2レベルの品質であってよく、ここで、第2レベルの品質は、第1レベルの品質より高くてよい。
【0016】
上位符号化信号は、基準信号としての第2信号と、基準信号の再構成バージョンとしての処理済み信号との間の差を表す残差データからなるエンハンスメント信号であってよい。
【0017】
下位復号化信号を処理する工程は、アップサンプリング済み信号を生成するべく下位復号化信号をアップサンプリングすること、および、中間符号化信号を生成するべく、中間エンコーダにおいて、アップサンプリング済み信号および第1信号を処理することを有してよい。
【0018】
任意で、中間符号化信号は、基準信号としての第1信号と、基準信号の再構成バージョンとしてのアップサンプリング済み信号との間の差を表す残差データを有するエンハンスメント信号を有してよい。
【0019】
任意で、中間符号化信号は、中間再構成済み信号を出力するべく、アップサンプリング済みバージョンの下位復号化信号によって復号化されかつ処理されてよい。
【0020】
少なくとも第1信号エレメントコーディングフォーマット信号を第2信号エレメントコーディングフォーマット信号に変換することによって、アップサンプリング済み信号を処理する工程は、第1色空間から第2色空間へ中間再構成済み信号を変換することを有してよい。
【0021】
下位復号化信号を処理する工程は、第1信号エレメントコーディングフォーマットから第2信号エレメントコーディングフォーマットへ下位復号化信号を変換すること、および、処理済み信号を生成するべく変換の出力をアップサンプリングすることを有してよい。
【0022】
上述した方法は、下位符号化モジュールによって、下位符号化信号を生成するべく、第1信号を符号化する前に第1信号をダウンサンプリングすることを有する。こうして、符号化の処理は、より少数の画素に対して実行され、したがってより迅速に実行可能である。
【0023】
第1信号は、連続する複数のフレームを有してよく、第2信号は対応する連続する複数のフレームを有してよく、各フレームは下位エンコーダによって符号化されてよい。こうして、フレームカウントおよびシグナリングの必要性が減少し、付加的に、イントラ符号化基準フレームを管理する必要性が大きく減少する。
【0024】
第1信号エレメントコーディングフォーマットから第2信号エレメントコーディングフォーマットへ変換する工程は、非線形であってよい。
【0025】
第1信号エレメントコーディングフォーマットから第2信号エレメントコーディングフォーマットへ変換する工程は、非予測的であってよい。こうして、第1信号エレメントコーディングフォーマットから第2信号エレメントコーディングフォーマットへの変換は、付加的な予測情報の計算を必要としないスタンドアロン形式で実行されてよく、それにより、変換機能のモジュラー交換がより簡単に促進される。また、こうして、デコーダでの計算負荷が減少し、より多くの後方互換性が実現されうる。
【0026】
また、信号を復号化する方法が与えられる。当該方法は、第1信号エレメントコーディングフォーマットで下位復号化信号を生成するべく、下位デコーディングモジュールによって、下位符号化信号を復号化することを有する。下位復号化信号は、上位再構成済み信号を生成するべく、少なくとも、第1信号エレメントコーディングフォーマットから第2信号エレメントコーディングフォーマットへ変換しかつアップサンプリングすることによって処理される。上位符号化信号は、上位復号化信号を生成するべく上位復号化モジュールによってデコードされる。上位再構成済み信号および上位復号化信号は、第2信号エレメントコーディングフォーマットでオリジナル信号を再構成した上位合成済み復号化信号を生成するべく上位復号化モジュールによって処理される。こうして、信号改良、ポテンシャル帯域幅の減少、および後方互換性のひとつ以上が与えられる。
【0027】
任意で、第1信号エレメントコーディングフォーマットは第1色空間を表してよく、第2信号エレメントコーディングフォーマットは第2色空間を表してよい。
【0028】
任意で、下位復号化信号は標準ダイナミックレンジ(SDR)を有してよく、上位復号化信号は高ダイナミックレンジ(HDR)を有してよく、HDRフォーマットは、SDRフォーマットより、高い輝度および広い色域を有してよい。
【0029】
任意で、下位復号化信号は第1ビット深度を有してよく、上位再構成済み信号は第2ビット深度を有してよく、ここで第1ビット深度は第2ビット深度より小さくてよい。
【0030】
任意で、第1信号エレメントコーディングフォーマットは、第1レベルの品質を有してよく、第2信号エレメントコーディングフォーマットは第2レベルの品質を有してよく、ここで第2レベルの品質は第1レベルの品質より高くてよい。
【0031】
任意で、上位復号化信号は、第2信号エレメントコーディングフォーマットでオリジナル信号を再構成するべく、上位再構成済み信号を調節するための残差データを有するエンハンスメント信号であってよい。
【0032】
中間符号化信号は、中間復号化信号を生成するべく中間デコーディングモジュールによって復号化されてよく、ここで、下位復号化信号を処理する工程は、アップサンプリング済み信号を生成するべく、下位復号化信号をアップサンプリングすること、および、中間再構成済み信号を生成するべく中間デコーダにおいてアップサンプリング済み信号および中間復号化信号を処理することを有する。
【0033】
任意で、中間復号化信号は、第1信号エレメントコーディングフォーマットでオリジナル信号を再構成するべく、アップサンプリング済み信号を調節するための残差データを有してよい。こうして、コーデックタイプの不正確さが補正されうる。
【0034】
任意で、下位復号化信号を処理する工程は、第1色空間から第2色空間へ中間再構成済み信号を変換することを有してよい。
【0035】
任意で、復号化の方法は、接続ディスプレイが第2信号エレメントコーディングフォーマットを表示することができないか否かを検知し、もしそうであれば、中間再構成済み信号を出力する工程を有してよい。こうして、後方互換性が与えられる。
【0036】
上位合成済み復号化信号は、ディスプレイが第1信号エレメントコーディングフォーマットのみを表示することができる場合、第1信号エレメントコーディングフォーマットに逆変換されてよい。こうして、後方互換性が与えられる。
【0037】
下位符号化信号は、上位合成済み復号化信号のすべてのフレームを有してよく、ここで、下位符号化信号の各フレームは下位復号化モジュールによって復号化されてよく、かつ、上位合成済み復号化信号のベースバージョンを与え、上位符号化信号はベースバージョンの各フレームに対するエンハンスメント情報を有してよい。
【0038】
任意で、第1信号エレメントコーディングフォーマットから第2信号エレメントコーディングフォーマットへ変換する工程は、非線形であってよい。
【0039】
任意で、第1信号エレメントコーディングフォーマットから第2信号エレメントコーディングフォーマットへ変換する工程は、非予測的であってよい。こうして、コーディングフォーマット変換は付加的な予測情報の計算を必要とせず、スタンドアロン形式で実行されてよく、その結果、変換機能のモジュラー交換がより単純に促進される。また、こうして、デコーダでの計算負荷が減少し、かつ、より多くの後方互換性が実現されうる。
【0040】
上述した信号符号化および復号化方法を実行するのに適応されるコンピュータプログラムが与えられる。
【0041】
上述した信号符号化および復号化方法を実行するのに適応されるコンピュータプログラムを含むコンピュータ読み取り可能記憶媒体またはデータキャリアが与えられる。
【0042】
上述した信号符号化および復号化方法を実行するように適応された、プロセッサおよびメモリを有するデータ処理装置が与えられる。
【0043】
以下で本願発明は、添付する図面を参照して、例示として説明される。
【図面の簡単な説明】
【0044】
【
図1】
図1は、信号を符号化および復号化するための例示的システムを示す。
【
図2】
図2は、第1実施形態に従うデコーディングシステムの例を示す。
【
図3】
図3は、第1実施形態の第1変形例に従うデコーダの例を示す。
【
図4】
図4は、第1実施形態の第2変形例に従うデコーダの例を示す。
【
図5】
図5は、第1実施形態の第3変形例に従うデコーダの例を示す。
【
図7】
図7は、第2実施形態に従うエンコーディングシステムの例を示す。
【
図8】
図8は、第2実施形態に従うデコーディングシステムおよび方法の例を示す。
【
図9】
図9は、第3実施形態に従うエンコーディングシステムの例を示す。
【
図10】
図10は、第3実施形態に従うデコーディングシステムの例を示す。
【
図11】
図11は、第1実施形態に従うエンコーディングシステムの例を示す。
【
図12】
図12は、第4実施形態に従うエンコーディングシステムの例を示す。
【
図13】
図13は、第4実施懈怠の第1変形例に従うエンコーディングシステムの例を示す。
【
図14】
図14は、第1変形例に対応するデコーディングシステムの例を示す。
【発明を実施するための形態】
【0045】
使用する用語に関してこの明細書の読者を補助するため、いくつかの定義が以下に与えられる。
【0046】
非限定的例として、信号は、画像、オーディオ信号、マルチチャネルオーディオ信号、ビデオ信号、マルチビュービデオ信号(例えば、3Dビデオ)、体積信号(例えば、医療結像、科学結像、ホログラフィー結像など)、体積ビデオ信号、または、4次元以上を有する信号であってもよい。
【0047】
広く言えば、ビデオは動画の記録、再生または放送として定義される。ビデオ信号は個々のフレームのシーケンスからなり、その各々は符号化/復号化方法を通じて個別に圧縮されてよい。
【0048】
符号化は、ひとつのソースから他のソース、またはその情報のストレージへの効率的な伝送を可能にするべく、ひとつのフォーマットから他のフォーマットへ情報を変換することに関連する処理である。符号化されるべき情報は、生ビデオであってよく、それはしばしばオリジナル形式でうまく伝送できない大量のデータを含む。したがって生ビデオが符号化または復号化されると、生ビデオコンテンツの伝送に必要な量の空間は減少する。復号化は符号化の逆の処理であり、符号化情報をオリジナルの伝送前情報に逆変換(解凍)することに関連する。符号化および復号化は損失ありか損失なしであってよい。
【0049】
ビデオ信号、特にHDRビデオに関する信号に対して、カラーボリュームを制限した(すなわち、関連するHDR標準によって要求されるピーク輝度/コントラストおよび色域を与えない)消費者ディスプレイである、SMPTEはマスタリングディスプレイ上に出現する際にシーンを記述するためのメタデータを定義する。SMPTE ST 2086 "Mastering Display Colour Volume Metadata Supporting High Luminance and Wide Colour Gamut Images" は、MaxFALL (Maximum Frame Average Light Level) および MaxCLL (Maximum Content Light Level)などの静的データを記述する。SMPTE ST 2094 "Content-Dependent Metadata for Color Volume Transformation of High Luminance and Wide Color Gamut Images"は、シーンからシーンへ変化する動的メタデータを有する。これは、ST 2094-10 (Dolby Vision format)、ST 2094-30 (Technicolor format)で定義されるColour Volume Reconstruction Information (CVRI) SMPTE ST 2094-20 (Philips format)およびColour Remapping Information (CRI)、およびHDR10+ ST 2094-40 (Samsung format)を含む。補助データは、ここに説明するメタデータを含んでよく、残差情報などの付加的エンハンスメント情報は任意の補助データの一部であってよい。
【0050】
ビデオコンテンツは、規定レベル(または複数レベル)の品質で伝送されてよく、それは例えば、特定の空間解像度またはフレームレートまたはピーク信号対ノイズ比(PSNR)によって定義されてもよい。品質のレベルは、ビデオコンテンツを運ぶ伝送チャネルの制約によって制限されてよい。一例として、既存のデコーディングハードウエアは、所与の解像度および/またはフレームレート(第1の品質レベル)まで信号を復号化してよい。ひとつ以上の付加的レベルの品質は、コンピュータデコーディング方法を使って再構成されてよい。第1レベルの品質より高いレベルの品質の復号化を実行するために、アップデートすることができない旧式のデコーディング装置は、第1レベルの品質で信号を単純に復号化し、かつ、付加的なエンハンスメントデータを無視する。
【0051】
信号のビット深度は、特定の値を通信するのに使用されるビット数に関連する。ビデオにおいて、ビット深度(しばしばカラー深度とも言う)は、画像内の画素を表すカラー成分(例えば、輝度Yおよび彩度CbおよびCr)に関連し、特に、画像内に記録される輝度レベルの数およびカラー数を定義する。ビット深度が8ビット以下である画像は、標準ダイナミックレンジの画像と考えられ、ビット信号が8ビットを超える画像は高ダイナミックレンジまたはエンハンスドダイナミックレンジを有する画像であると考えられる。
【0052】
画像解像度は、どのくらいの量の情報が利用可能であるかの尺度であると考えられてよい。本質的に、ビデオ解像度は、どのくらいの量の情報が特定画像で視認できるかの基本尺度である。典型的に空間ビデオ解像度は、ディスプレイ装置上で各次元に表示可能な画素数によって定義され、通常はディスプレイ装置の高さに対するディスプレイ装置の幅として与えられる。例えば、フルHD信号は、1920×1080ピクセルとして表され、またはより単純に1080pと表される。典型的にUHD信号は、3840×2160ピクセルのフレーム解像度を有してよく、通常は単純に4K解像度として言及される。UHD信号はまた8K解像度(例えば、7680×4320ピクセル)を有してもよい。同様に、ビデオ信号において付加的な一時的解像度が存在してよく、例えば、ビデオ信号は、毎秒25、30、50、60、100、および120フレームなどのさまざまなフレームレートで使用可能であってよい。
【0053】
アップサンプリングの処理は、信号の品質を強化するべく、低解像度バージョンの信号または信号のシーケンスを、高解像度バージョンの信号へ変換することを含む。アップサンプリングは、より高いレートで信号をサンプリングすることにより得られたシーケンスの近似を生成し、典型的にデコーダによって符号化データに対して実行される。アップサンプリングは、空間的に(すなわち、画素解像度に対して)または時間的に(すなわち、フレームレートに対して)実行可能である。
【0054】
逆に、ダウンサンプリングは、より低いレートで信号をサンプリングすることにより得られたシーケンスの近似を生成し、信号の低解像度バージョンを生じさせる。
【0055】
色空間は、特定の色に対して再生されるのを可能にする色のセットの数学的表現として定義されてよい。デジタル画像およびビデオ表示に対して最も通常使用される2つの色空間は、RGB(赤/緑/青)およびYCrCb(輝度/赤彩度/青彩度)である。色空間は、色定義の詳細を与えるITU-R Recommendations BT709、2020、2100、2390のひとつ以上によって定義されるようにより広く定義されてよい。それは、画素のような画像エレメントがビデオ信号内でどのように表されるか、および、ある場合には信号の以下の性質のパラメータをカバーまたは定義するかの仕様を含む。信号の性質は、サンプリングパターン(例えば、4:4:4から4:2:2)、ビット深度、輝度成分のダイナミックレンジ、色域、使用される電気光学伝送関数モデル、最低輝度レベル(例えば、ブラックレベル)、および最高輝度レベル(例えば、ホワイトレベル)を含む。
【0056】
以下の例はフレームを含むビデオコンテンツを有する信号に対して、各ビデオセグメント内の各フレームに対して実行されている任意の処理によって、利用可能なように実行されることに注意すべきである。ある例において、いくつかのフレームは、異なるように処理されてよいが、すべてのフレームに対して同じように処理すれば、フレームカウンティングおよびシグナリングの必要性が減少し、かつ、イントラコーディング基準フレーム管理の必要性が著しく減少するので有利である。
【0057】
図1は、本出願で説明するような信号を符号化および復号化するための例示的システムを示す。特に、オリジナル信号100は、エンコーダ1100によって符号化される。データストリーム1150はエンコーダによって生成され、デコーダ1200-0から1200-Nへ伝送される。データストリームは分割されてよく、データストリーム1150の一部はデコーダに送られる。各デコーダは、データストリームの各部分を復号化し、レベル#0で再構成された信号からレベル#Nで再構成された信号を取得する。最終信号は、ひとつの信号を取得するべく、異なるレベルで再構成された異なる信号を処理しかつ組み合わせることによって得られる。異なるデコーダは、データストリームの異なる部分を受信し、異なるレベルの品質で信号を再構成することができる。デコーダは異なるレベルの品質を復号化しかつ出力してよい。
【0058】
図2は、本願で説明するようなデコーディングシステムの一例を示す。特に、データストリーム1150は、複数のデコーダ1200-0および1200-1によって受信される。データストリーム1150は、標準準拠データストリーム(例えば、AVC、HEVC、VVC他などの標準コーデックおよび非標準コーデックに準拠する)および補助データストリームから形成されてよい。第1サブストリームは、データストリームをデータストリーム220に分割する第1デコーダ1200-1へ供給され、それは、低品質のビデオ240を生成するべく標準デコーダ2230へ供給される。低品質ビデオ240は、出力ビデオSDR280、すなわち、SDRを有するビデオ出力を生成するべく、エンハンスメントデコーダ270によってデータストリーム210とともに処理される。この場合、出力ビデオSDRは、処理(例えば、アップサンプリング)後であるがデータストリーム210(例えば、デコーダ1200-1がデータストリーム210を解読できない場合)によっていかなる付加的情報も追加されない低品質ビデオ240か、または、データストリーム210(合成済みストリーム)から導出された付加的情報によってそれを処理した後の低品質ビデオ240のいずれかに対応し、その後、合成済みストリームはTVまたはSDRビデオのみを表示することができるディスプレイに適応するために、SDR解像度にダウンサンプリングされる。第2サブストリームは、データストリームをデータストリーム220へ分割する第2デコーダ1200-0へ供給され、それは、低品質ビデオ240を生成するべく標準デコーダ230へ供給される。低品質ビデオ240は出力ビデオHDR260を生成するべくエンハンスメントデコーダ250によってデータストリーム210と一緒に処理される。
【0059】
図1および2において、データストリームは、デコーディングモジュール1200-0、1200-Nで受信される。データストリームはプロトコル標準(例えば、DASH、HLS等)などの規格および/またはコーディング規格(AVC、HEVC、VVC等などのMPEG規格、またはVP9、AV1、VC-6等などの他のコーデックフォーマット)に準拠するデータからなるストリームであってよい。データストリームはその後デマクシングモジュールによって2つ(またはそれ以上)の別個のストリームに分割される。第1ストリームは、標準ベーススキーム(例えば、AVC、HEVC、VVC、VC-6等)または非標準ベーススキーム(例えば、VP9,AV1等)などの第1デコーディングスキームに従って復号化するデコーディングモジュールに送られる。第1デコーディングモジュールの出力(例えば、第1復号化ビデオ信号)は第2デコーディングスキームにしたがって復号化する第2デコーディングモジュールに送られる。第2デコーディングモジュールはまた、第1デコーディングモジュールの出力によって処理される場合、エンハンスド復号化ビデオ信号を生成するある補助データストリームを受信してもよい。
【0060】
ひとつの例において、第1デコーディングスキームは、第2デコーディングスキームと同じである。
【0061】
他の例において、第1デコーディングスキームは、第2デコーディングスキームと異なる。第2デコーディングスキームはまた、アップサンプリング、残差逆量子化、残差変換、動き補償フレームバッファからの残差の付加、後処理などの演算を含んでよい。残差情報は例えば、以下の説明から明らかなように、基準信号を基準信号の再構成済みバージョンと比較することによって生成される差信号である。
【0062】
ある例において、補助データストリームもまた、HDR信号を再構成するために必要なあるメタデータ(静的または動的)を含む。このメタデータは、エンハンスドHDR符号化ビデオ信号を生成するように、第1デコーディングモジュールの出力および補助データストリーム内の他のデータとともに第2デコーディングモジュールによって処理されうる。メタデータは、HDR情報のレンジを特定するためのレンジ情報を含んでよく、HDR信号が、タイトルバイタイトル方式で、または、シーンバイシーンもしくはフレームバイフレーム方式で、ディスプレイ上に適切に与えられることを保証するための情報を含んでもよい。補助データストリームはまた、残差情報を含んでよい。
【0063】
ある例において、第1デコーディングモジュールは、低ビット深度(例えば、8ビット)信号を再構成し、第2デコーディングモジュールはHDRに従う高ビット深度(例えば、10ビット)信号へ当該信号を変換する。ひとつの例において、第2デコーディングモジュールは、デコーディング装置が高ビット信号(例えば、10ビット)HDR画像を表示することができないか否かを検知することができる。その場合、それは低ビット深度(例えば、8ビット)信号を符号化しかつ表示する。
【0064】
いくつかの例において、第2デコーディングモジュールは、値の範囲を調節するのに必要な処理を、出力信号を第1(低)レベル品質から再構成するのに必要な他の処理と組み合わせる。ひとつの例において、メモリバッファに複数回触れることを避けるよう、アップサンプリング操作がレンジ調節と組み合わされ、その結果メモリアクセス回数および必要なメモリ帯域幅の両方が減少する。例えば、残りの処理は、アップサンプリングおよび/またはアップサンプリングした低レベルの品質を高レベルの品質へ変換するための残差データの付加を含む。
【0065】
いくつかの例において、第1デコーディングモジュールは、信号の低解像度描出を再構成する。HDR調節はその後、第2デコーディングモジュールによって信号の低解像度再構成に対して適用される。その調節に続いて、第2エンコーディングモジュールは、高解像度および/または高品質信号を取得するよう、信号および残りの補助データをさらに処理する。
【0066】
いくつかの例において、エンコーダは、高ビット信号(例えば、10ビット)HDRソース信号を受信する。エンコーダはソース信号をダウンサンプリングし、低ビット深度(例えば、8ビット)SDR信号を取得するようダウンサンプリングした描出を調節する。SDR信号は第1符号化データセットを得るべく第1コーデックによって処理される。第1コーデックの復号化出力は、高ビット深度HDR信号へ変換され、それはその後、オリジナルソース信号のフル解像度再構成済み描出を再構成するために使用されるべき付加的補助データを含む第2符号化データセットを生成するよう第2エンコーダモジュールによって処理される。
【0067】
いくつかの例において、エンコーダは、ダウンサンプリング操作の前または後に高ビット深度HDR信号を処理する。例えば、高ビット深度HDR信号は、ここに参照として組み込むITU-R Recommendation BT.2020、ITU-R Recommendation BT.2100等で定義されるような色空間内で表現されてよい。背景技術として、Rec.2100は、HDR信号用に使用されてよい2つの伝達関数定義、すなわち、SMPTE ST 2084(ここに参考として組み込む)として先に標準化されたPerceptual Quantizer (PQ)、およびARIB STD-B67(ここに参考として組み込む)として先に標準化されたHybrid Log-Gamma (HLG)を含む。10ビットのカラービット深度を有するPQスキームはまたHDR10と呼ばれてきた(https://en.wikipedia.org/wiki/Rec._2020 - cite_note-HDRCompatibleCEA2015-49)。同様に、10ビットのカラービット深度を有するHLGスキームはHLG10と呼ばれてきた。
【0068】
HDR信号は、それをITU-R Recommendation BT.709等(ここに参考として組み込む)に定義されるような異なる色空間へ変換するべく、ダウンサンプリングの前または後に処理されてよい。例えば、この変換は、生成信号が低ビット深度(例えば、8ビット)SDR信号であるように実行されうる。この信号はその後、上述したように第1エンコーディングモジュールによって使用される。
【0069】
逆に、第1コーデックの復号化出力は、高ビット深度HDR信号(例えば、10ビット)を生成するべく、アップサンプリングの前または後に、第1色空間(例えば、BT.709)から第2色空間(例えば、BT.2020またはBT.2100)へ変換される。この信号はその後、上述したように第2エンコーダモジュールによって処理されうる。
【0070】
いくつかの例において、第1デコーディングモジュールは第1符号化信号を受信し、かつ、低解像度描出の信号を再構成し、それも例えば低ビット深度(例えば、8ビット)SDR信号である。SDR信号は第1色空間(例えば、BT.709)内で表されてよく、高解像度描出へのアップサンプリング操作の前または後に第2色空間(例えば、BT.2020またはBT.2100)へ変換され、したがって高解像度の例えば高ビット深度(例えば、10ビット)でHDR信号が生成される。第2符号化信号は、調節信号または残差信号を生成するべく、第2デコーディングモジュールによって復号化される。HDR信号はその後、調節信号を使って調節済みHDR信号を生成するべく、第2デコーディングモジュールによってさらに処理されてよい。この調節に続いて、第2エンコーディングモジュールは、より高解像度および/またはより高品質信号を得るよう、信号およびその他の補助データをさらに処理する。
【0071】
変換は、ITU-R Recommendation BT.2407およびITU-R Recommendation BT.2087に含まれるような周知技術の方法を使って実行可能であり、それらはここに参考として組み込む。色空間どうしの間の変換をサポートするのに使用されるルックアップテーブル(LUTs)および/または他の周知の方法(例えば、Report ITU-R BT.2408-0 or HLG Look-Up Table Licensing by the BBR R&D、いずれもここに参考として組み込む)も存在する。
【0072】
他の例において、例えば、ダウンサンプリング処理による手続き前にカラー変換を実行することにより、ソース信号は調節されかつ低ビット深度SDR信号へ変換される。
【0073】
図3は、第1実施形態に従うデコーダの例を示す。データストリーム210はdemux300によって3つの異なるストリーム、すなわちHDRストリームまたはレンジデータ310、エンハンスメントデータの第1セット330、およびエンハンスメントデータの第2セット360に分割される。HDRレンジデータ310はHDR調節モジュール320へ供給され、かつ、低品質ビデオ240と組み合わされて第1出力ストリームを生成する。第1出力ストリームは第1エンハンサー340へ供給され、エンハンスメントデータの第1セット330とともに処理されて第2出力ストリームを生成する。第2出力ストリームは最後に、アップサンプラー350に供給され、アップサンプリング済みストリームは第2エンハンサー370によってエンハンスメントデータの第2セット360によって処理されてビデオHDR出力260を出力する。エンハンスメントデータの第1セット330が存在しなければ、第1出力ストリームは直接アップサンプラー350に供給され、それ以外の残りの工程は不変のままである点に注意すべきである。
【0074】
図4は、第2実施形態に従うデコーダの例を示す。第2実施形態は、第1実施形態の代替的実施形態として見てよい。データストリーム210は、demux300によって、3つの異なるストリーム、すなわち、HDRストリーム310、エンハンスメントデータの第1セット330およびエンハンスメントデータの第2セット360に分割される。エンハンスメントデータの第1セット330は、第1エンハンサー400に供給され、低品質ビデオ240と組み合わされて第1出力ストリームを生成する。この第1出力ストリームは、アップサンプリング済みバージョンを生成するべくアップサンプラー410へ供給され、それはその後HDRストリームデータ310とともにHDR調節モジュール420に供給されて第2出力ストリームを生成する。第2出力ストリームは第2エンハンサー370によってエンハンスメントデータ360の第2セットにより処理され、ビデオHDR出力260を出力する。エンハンスメントデータの第1セット330が存在しなければ、低品質ビデオ240は直接アップサンプラー410に供給され、それ以外の残りの工程は不変のままである点に注意すべきである。
【0075】
図5は、第3実施形態に従うデコーダの例を示す。第3実施形態は第1および第2実施形態のひとつ以上の代替例として実施されてよい。データストリーム210は、demux300によって3つの異なるストリーム、すなわち、HDRストリーム310、エンハンスメントデータの第1セット330およびエンハンスメントデータの第2セット360に分割される。エンハンスメントデータ330の第1セットは第1エンハンサー500へ供給され、低品質ビデオ240と組み合わされて第1出力ストリームを生成する。この第1出力ストリームはアップサンプラー510へ供給され、HDRレンジデータ310とともに処理されて第2出力ストリームを生成する。第2出力ストリームは、第2エンハンサー520によってエンハンスメントデータの第2セット360により処理され、ビデオ出力280を出力する。この場合、アップサンプリングおよびHDR調節がひとつの操作に組み合わされる。
【0076】
図3、4および5に示す実施形態において、HDRレンジデータ310、エンハンスメントデータの第1セット330、およびエンハンスメントデータの第2セット360のひとつ以上がデータストリーム210から欠如している場合、対応するエンハンスメントまたはこのデータを使用する調節操作もまた省略される。この場合、demux済みデータストリームの一部が存在しなければ、その後受信処理装置(例えば、エンハンサーまたはHDR調節モジュールのひとつ)は受信済みビデオストリームを通過させるように構成されてよい。ある場合において、例えば、ディスプレイ装置がHDRビデオをレンダリングすることができないなら、エンハンスメントデコーダはHDR調節操作を省略することによってSDRビデオを出力するように構成されてよい。異なるビデオ出力がエンハンスメントデコーダ250のコンポーネントの動作を選択的に制御することにより構成されてよい。
【0077】
図6は、本願で説明するようなコンピュータシステム600の例を示す。コンピュータシステム600は、上述したデコーダが実装されるところの多重プロセッサを含んで示されている。コンピュータシステムは、システムバス611、コンピュータ読み取り可能記憶媒体612、ひとつ以上のプロセッサ613、I/Oインターフェース614、および通信インターフェース615を有する。
図6は、I/Oインターフェース614に通信可能に接続された入力装置670および記憶装置680、および通信インターフェース615を介してひとつ以上のネットワーク690に通信可能に接続されたコンピュータシステム600を示す。コンピュータ読み取り可能記憶媒体612は、信号プロセッサアプリケーション640-1を格納し、それは上述した少なくともエンハンスメントデコーダを実行する。信号プロセッサアプリケーション640-1は、ひとつ以上の信号プロセッサが640-2を処理する際に、ひとつ以上のプロセッサ613によって実行されてよい。エレメントの並行処理を可能にするよう、多重プロセッサに対して復号化処理を配分することができるのが特に有利である。ここで説明するエンコーディングおよびデコーディングシステム、および方法は並行処理の有効利用を可能にする。
【0078】
図7は、本願で説明されるようなエンコーディングシステムおよび方法の一例を示す。入力信号700、例えば高ビット深度(例えば10ビットまたは12ビット、あるいは16ビット、またはそれ以上)のHDRタイプの信号が、エンコーディングシステムで受信される。入力信号はその後、第1カラー変換モジュール701を介して、第1色空間(例えば、BT.2020またはBT.2100)から第2色空間(例えば、BT.709)へ変換される。第1色空間および第2色空間は異なる。変換中、信号のビット深度は、オリジナルの高ビット深度から低ビット深度(例えば、8ビット)SDR信号へ減少されてよい。SDR信号はその後、高解像度から低解像度へ渡すべくダウンサンプラー702によって処理される。出力信号はその後第1エンコーダ703によって処理される。ひとつの例において、第1エンコーダ703は、MPEG規格等に基づく標準ベースの周知のエンコーディングモジュールであり、かつ、ひとつの例において、有意な部分のエンドユーザが互換性を有する広く使用される符号化規格であり、この技術の広範な後方互換性を与える。
【0079】
他の例において、変換およびダウンサンプリングは、逆の順番で実行されてよい。すなわち、最初にダウンサンプリング、次に変換が実行される。他の例において、ダウンサンプリング操作は実行されず、したがって変換済み信号が第1エンコーダ703に直接渡される。この最も基本的な場合において、ダウンサンプリング操作が実行されない場合、解像度の変化は存在しない。
【0080】
第1エンコーダ703の出力は第1符号化ストリーム710である。これは、上述したように広く復号化可能であるベースレイヤー出力として考えてもよく、入力信号700とは異なる色空間内(および任意で低解像度)でユーザに入力信号の描出を与えることができる。異なる色空間は、ひとつ以上の任意の数の異なるフォーマットであってよく、または信号に対するひとつ以上の任意の他の制約によって定義されてもよい。ひとつの例において、色空間はRGB色空間からYUV色空間へ、またはHDRタイプの色空間からSDRタイプの色空間へ変化してよい。
【0081】
第1エンコーダ703の出力は第1デコーダ704によってさらに処理され、出力符号化信号はその後第2カラー変換モジュール705へ渡され、符号化信号を第2色空間から第1色空間へ逆変換する。第2カラー変換モジュール705は、第1色空間変換モジュール701によって使用されたものへの逆処理を使用してよい。第1カラー変換モジュール701から第2カラー変換モジュール705へ流れるいかなる情報もなく、逆処理またはそれ以外を利用する際の利点は、メタデータが不要であるか、または色空間変換705をどのように実行するかの他の指示にある。明らかになるように、高レベルの符号化処理は、色空間変換の任意の不正確さを補正する方法を提供する。したがって、高レベル符号化のために、第1色空間内で信号を正確にまたは完全に予測しようとする必要がない。
【0082】
付加的に、第2カラー変換モジュール705によって実行される変換中、HDRタイプの信号を生成するべく、信号のビット深度は低ビット深度(例えば、8ビット)から高ビット深度(例えば、10ビット、12ビット、またはそれ以上)へ増加されてよい。HDRタイプの信号、または単純なカラー変換済み信号は、その後アップサンプラー706によってアップサンプリングされ、生成されたアップサンプリング済みHDRタイプ信号は、第2エンコーダ707によってオリジナル入力信号とともに処理され、第2符号化ストリーム720を生成する。
【0083】
第2エンコーダ707によって実行される処理は、基準信号としての入力信号700と、オリジナル信号700の再構成としてのアップサンプリング済みHDRタイプ信号との間の差を表す残差信号を生成してよい。残差信号は、オリジナル入力信号700またはその近似をデコーダで再構成するべく、デコーダにおいて対応するアップサンプリング済みHDRタイプ信号を調節するために使用されてよい。この場合、残差信号は、任意のアーティファクトまたは第1エンコーダ703および第1デコーダ704によって導入される他の信号不一致を構成する。換言すれば、残差信号はコーデックタイプの不正確さを補正する。付加的に、残差信号は、第1および第2色空間変換モジュール701および705の両方によって実行される、色空間変換によって導入される任意のアーティファクトまたは信号不一致を補正する。最後に、使用されるとき、残差信号はダウンサンプラー702およびアップサンプラー706によって導入される任意の不一致を補正する。これによって、為すべき設計上の決定は、上述したもののより単純または効率的なバージョンを使用することができる。残差信号は既知の技術を使って符号化されてよい。
【0084】
ひとつの例において、変換およびアップサンプリングは逆の順序で実行可能である。すなわち、最初にアップサンプリング、次に変換が実行される。他の例において、アップサンプリング操作は実行されず、したがって変換済み信号が第2エンコーダ707へ直接渡される。この場合第2エンコーダ707は以前と同様に残差信号を生成するが、今回は解像度の変更はない。
【0085】
図7から分かるように、エンコーダおよび関連する符号化方法は規格準拠または他の符号化手段を使って符号化されてよい第1符号化ストリーム710を生成し、それは第1またはベースレベルの品質の信号を表す。エンコーダおよび関連する符号化方法はまた、第2符号化ストリーム720またはエンハンスメントストリームを生成し、それは、デコーダにおいて第1符号化ストリーム710から導出された、ベースレベルの品質で信号のカラー変換済みバージョンを調節または補正するための残差情報を有してよい。カラー変化に加え解像度変化が存在してもよい。これらすべての特徴は、これに限定しないがHDRからSDRへの変換などの色空間変換が、符号化入力信号の広く符号化可能なバージョンに加えて符号化および復号化を許容する合成信号を個別および/または集合的に生じさせ、ひいては信号改良、ポテンシャル帯域幅の減少、および後方互換性のひとつ以上を与える。アーキテクチャーおよびストラクチャーは従来技術を超える効率を与えてよい。
【0086】
図8は、本願で説明するようなデコーディングシステムおよび方法の一例を示す。第1デコーダ801は第1符号化ストリーム710を受信し、それを符号化して第2色空間内で符号化信号820を生成する。それは、低ビット深度(例えば、8ビット)でSDRタイプの信号であってよい。符号化信号820はその後第2色空間から第1色空間へ符号化信号を逆変換するべく、カラー変換モジュール802へ渡される。変換中、信号のビット深度は低ビット深度(例えば、8ビット)から高ビット深度(例えば、10ビット、12ビットまたはそれ以上)へ増加され、オリジナルHDRタイプ信号の再構成であるHDRタイプ信号を低解像度で生成する。変換済み信号(第1色空間および/またはHDRタイプ)はその後、アップサンプラー803によってアップサンプリングされ、生成されたアップサンプリング済み信号は、第2符号化ストリーム720とともに第2デコーダ804によって処理され、第1符号化信号810(例えば、第1色空間内および/または補正されたHDRタイプの信号)を生成する。ここで、第2符号化ストリーム720は、オリジナル入力信号700(例えば、エンコーダで受信されたような)またはその近似を再構成するべく、アップサンプリング済みHDRタイプ信号とともに組み合わされる(例えば、合算される)残差情報を含んでよい。代替的に、他の例において、色変換およびアップサンプリングは、逆の順序で実行可能である。すなわち、最初にアップサンプリングし、続いてカラー変換を実行する。他の例において、アップサンプリング操作803は実行されず、したがって変換済み信号は第2デコーダ804へ直接渡される。これは解像度変更が存在しない場合のベースケースで生じる。
【0087】
図8のデコーディングシステムは第2色空間内にある第1復号化信号820を生成し、それはSDRタイプ信号であってよい。第1復号化信号820はディスプレイへ出力するのに使用可能であり、特に、第1復号化信号820が第2色空間へ変換された場合、使用可能な情報を利用することができないディスプレイに対して有利である。
図8のデコーディングシステムはまた、HDRタイプ信号であってよい第1色空間内にある最終復号化信号810を生成し、それは、第2符号化ストリーム720内の残差信号によって補正される。最終復号化信号810は、第1色空間と互換性があるディスプレイに出力するのに使用可能である。最終復号化信号810は、第1復号化信号820(例えば、エンハンスドカラーおよび/または解像度)と比べた場合、付加的レベルの品質であってよい。デコーディングシステムは、接続された任意のディスプレイがどのような性能を有するかを決定してよく、したがって、最終復号化信号810を作成するか否か、最初の復号化信号820を使用するか否か、および/または最終復号化信号を互換フォーマットに逆変換するか否かを選択してよい。
【0088】
図9は、本願で説明するようなエンコーディングシステムの一例を示す。
図9の例は
図7の例の変形例と見てもよい。
図7の開示と共通の特徴は簡潔さのため詳細に説明しない。特に、
図9は3つのレイヤーの符号化、および2つの別個の入力信号が存在するところの例を示し、それは同じ解像度であってよいが色空間および/またはSDR/HDR特性が異なってよい。
【0089】
本例において、例えば低ビット深度(例えば、8ビット)SDR信号であるSDR入力信号900は、エンコーディングシステムで受信される。これは、オリジナル信号(例えば、カメラまたはビデオフィードなどのビデオソースから直接得られる)かまたは、HDR色空間(例えば、BT.2020またはBT.2100)からSDR色空間(例えば、BT.709)へ変換されたHDR信号(例えば、HDR入力信号960)のいずれかであってよい。SDR信号900は、高解像度から低解像度へ渡すよう、ダウンサンプラー902によって処理される。出力信号はその後第1エンコーダ903によって処理される。第1エンコーダ903の出力は、第1符号化ストリーム910である。第1エンコーダ903の出力は第1デコーダ904によってさらに復号化され、出力復号化信号はその後アップサンプラー906によってアップサンプリングされ、生成されたアップサンプリング済みSDR信号は、第2エンコーダ907によってオリジナルSDR入力信号900とともに処理されて第2符号化ストリーム920を生成する。
図7を参照して説明したように、第2符号化ストリーム920はダウンサンプリング/アップサンプリング処理902および906並びに符号化/復号化処理903および904において、任意の不一致を補正するための残差ウィンドウを有してよい。
【0090】
第2符号化ストリーム920および第1符号化ストリーム910はその後SDRデコーダ930へ渡される。後者は
図10の矩形領域内で示すSDRデコーダに類似してよい。SDRデコーダ930は、第1符号化ストリーム910を復号化し、それをアップサンプリングしてSDR入力信号900の再構成バージョンを作成する。その中に残差情報がある場合に第2符号化ストリーム920はその後、SDR入力信号900の再構成済みバージョンをSDR入力信号またはそれに近似する信号に改良または調節するのに使用される。これまでの信号の色空間はSDR入力信号900のものと同じである。
【0091】
SDRデコーダ930の出力はその後、SDR色空間からHDR色空間へ復号化信号を変換するべくカラー変換モジュール940へ渡される。変換中、信号のビット深度は低ビット深度(例えば、8ビット)から高ビット深度(例えば10ビットまたは12ビット)へ増加されてよく、HDR信号(例えば、より大きいダイナミックレンジの輝度および/またはより広い色域を有するもの)を生成する。生成されたHDR信号はその後、HDR入力信号960とともに第3エンコーダ950へ供給され、第2符号化ストリーム970を生成する。この第3符号化ストリーム970は、デコーダでHDR信号を再構成するのに使用可能な付加的復号化情報を含んでよい。
【0092】
第3符号化ストリーム970は、カラー変換処理における任意の不一致を一次的に補正する残差信号を有してよい。残差信号は、基準信号としてのHDR入力信号960と、生成されたHDR信号との間の差を表す。第3符号化ストリーム970の残差信号はダウンサンプリング/アップサンプリング処理902および906、ならびに符号化/復号化処理903および904から生じる任意の問題を補正してよく、それらは第2符号化ストリーム920の残差によってまだ解決されていない。残差信号は、HDR入力信号960またはその近似を再構成するべく、デコーダにおいて対応する色空間変換済みHDR信号を調節するのに使用されてよい。例えば、第3エンコーダ950によって生成された残差信号は、HDRフォーマットへの変換に続いてSDRデコーダ930の出力とHDR入力信号960との間の差を補正してよい。
【0093】
図10は、デコーディングシステムの例を示す。
図10のデコーディングシステムは
図9のエンコーダによって出力された符号化ストリームを受け取るように設計されている。第1デコーダ1001は第1符号化ストリーム910を受信し、それを復号化して第1復号化信号を生成する。第1復号化信号はその後アップサンプラー1003によってアップサンプリングされ、生成されたアップサンプリング済み信号は、例えばその中の残差信号を使って、第2符号化ストリーム920とともに第2デコーダ1004によって処理され、SDR符号化信号1010を生成する。SDR符号化信号1010はその後、復号化信号をSDR色空間からHDR色空間へ変換するべくカラー変換モジュール1002へ渡される。変換中、信号のビット深度もまた低ビット深度から高ビット深度へ増加されてよく、HDR再構成済み信号を生成する。HDR再構成済み信号はその後、例えばその中の残差信号を使ってHDR符号化信号1030を生成するべく、第3符号化ストリーム970とともに第3デコーダ1020へ渡される。例えば、第2符号化ストリーム970内の残差信号はカラー変換モジュール1002の出力と組み合わされて(例えば、加算されて)よい。
【0094】
図9および10のエンコーディングおよびデコーディングシステムは、信号、特に非排他的に、2つの解像度および2つの色空間内で使用可能なビデオ信号を符号化および復号化するためのフレキシブルかつ効率的な技術を与える。2つの別個の信号がエンコーダに入力され、一方は、他方より高いかまたはより洗練された色空間を有する。例えば、一方の信号は、高ダイナミックレンジ色空間(例えば、高輝度およびコントラスト比および/または広い色域を有する)内にあってよく、他方の信号は非高ダイナミックレンジまたは標準ダイナミックレンジ内にあってよい。この2つの別個の入力信号に関連する多重符号化ストリームはデコーダで使用可能である。
【0095】
付加的に、エンコーディングおよびデコーディングシステムはまた、より低いかまたはより洗練されていない色空間で信号のダウンサンプリング済みバージョン、例えば、低ビット深度でSDR信号のダウンサンプリング済みバージョンを与える。この信号は、第1エンコーダ903によって符号化され、エンコーダシステムから出力された信号に対してベースレイヤーを形成する。ベースレイヤーは入力信号900、960より低解像度である。したがって、より旧式のデコーダがより低解像度で第1符号化ストリーム910(例えば、ベースレイヤー)を復号化することができるように、後方互換性を保証するより有用なエンコーディングおよびデコーディングシステムが与えられる。例えば、第1符号化ストリーム910は標準解像度であってよいが、第2符号化ストリーム920および第3符号化ストリーム970はHDまたは1080p解像度であってよい。代替的に、第1符号化ストリーム910はHDまたは1080p解像度であってよく、第2符号化ストリーム920および第3符号化ストリーム970がUHDまたは4K解像度であってよい。より高い解像度を扱うことができるデコーダは、例えば、UHDまたは4K解像度の高解像度でアップサンプル済み描出をアップサンプリングおよび補正し、かつ、それをSDR復号化信号1010として出力するべく、第2符号化ストリーム920、特に内部に含まれる残差情報を利用することができる。ある場合において、SDR復号化信号1010は、高解像度を表示することができるが、第1またはHDR色空間内のビデオデータを表示するよう適応されないディスプレイ装置によって視認可能であってよい。第2デコーダ1004でのアップサンプリング1030および補正は、ソフトウエアによって実行されてよく、それは、この技術を適用するよう既存の旧式デコーダに対してソフトウエアのアップデートを与えることが可能であってよい。もちろん、アップサンプリング済みおよび補正済み描画は、色空間変換1002および第3符号化ストリーム970によって与えられるさらなる信号改良用のベーシスとして使用されてよい。デコーダがこの能力を有し、かつ、補正済みディスプレイがこの信号を表示する対応する能力を有していればであるが。わかるように、コンテンツプロバイダは、ひとつ以上の信号のコンテンツを供給し、エンコーディングおよびデコーディングシステムは、さまざまなデコーダ/ディスプレイの組み合わせで3つのフォーマットにおいて信号を再生するのに必要な第1、第2および第3符号化ストリームを適切に分配することができる。第2および第3符号化ストリーム920および970が残差信号であれば、これは効率的に符号化されてよい(それが第1エンコーダ903によって出力された高密度または構造化データに比べ低密度または非構造化データを表す場合)。例えば、残差はほぼゼロ平均であってよく、多くのゼロ値(比較される2つの信号が異ならないところの領域内で)を有してよい。信号のこの形式は有効に圧縮されてよい。
【0096】
図11は、本願で説明するエンコーディングシステムの例を示す。例えば低ビット信号(例えば、8ビット)SDR信号であるSDR入力信号900は、エンコーディングシステムで受信される。これは、オリジナル信号(例えば、カメラまたはビデオフィードなどのビデオソースから直接得られる)かまたはHDR色空間(例えばBT.2020またはBT.2100)からSDR色空間(例えばBT.709)へ変換されたHDR入力信号(例えば、HDR入力信号960)のいずれか一方であってよい。SDR入力信号900はその後、第1エンコーダ1103によって処理される。第1エンコーダ1103の出力は第1符号化ストリーム910である。第1エンコーダ1103の出力は第1デコーダ1104によってさらに復号化され、出力された復号化信号はその後、カラー変換モジュール1105に渡され、SDR色空間からHDR色空間へ逆変換される。変換中、信号のビット深度は低ビット深度から高ビット深度へ増加されてよく、HDR信号を生成する。HDR信号はその後、アップサンプラー1106によってアップサンプリングされ、生成されたアップサンプリング済み信号は第2エンコーダ1107によってHDRオリジナル入力信号960とともに処理され、第2符号化ストリーム920を生成する。
【0097】
ひとつの例において、変換およびアップサンプリングは逆の順序で実行されてよい。すなわち、最初にアップサンプリングし、その後変換を実行してよい。他の例において、アップサンプリング操作は実行されず、従って変換済み信号が第2エンコーダ1107へ直接渡される。ある場合、色変換が低解像度でより急速に実行されうるので、アップサンプリングの前に色変換を実行することが有益である。残差信号が第2エンコーダ1107によって生成されれば、これはHDR入力信号960とアップサンプラー1106の出力との任意の差を補正する。
【0098】
第1符号化ストリーム910および第2符号化ストリーム920はその後、
図8に示したようなデコーダ(例えば、
図11に示す対応する第1符号化ストリーム710および第2符号化ストリーム720の代わりに)に送られ、復号化SDR信号820および復号化HDR信号810を生成するべく復号化される。
【0099】
図12は、本願で説明するようなエンコーディングシステムの例を示す。入力信号1000、例えば高ビット深度(例えば、10ビットまたは12ビット)HDR信号は、エンコーディングシステムで受信される。入力信号はその後、高解像度から低解像度に渡すようダウンサンプラー1002によって処理される。ダウンサンプリング済み信号はその後、トーンマッピングコンバータ1003を使って、トーンマッピング済み変換ダウンサンプリング済み信号へ変換される。トーンマッピングコンバータ1003は、従来および既知のトーンマッピング演算子およびアルゴリズム(背景技術としてのみ読者は米国特許出願第20150078661号、第20170070719号または米国特許第9437171号を参照でき、それらはここに参考文献として組み込む)を使って入力信号に対してトーンマップ1016を導出する。変換は、例えば非制限的例として輝度および彩度値、ブライトネス、コントラスト、およびカラー、ガンマロジック、彩度デシメーション、スケーリング、彩度ノイズリダクション等のダウンサンプリングに関連するさまざまなパラメータを調節することを含んでよい。変換処理において、トーンマッピングコンバータ1003は、ダウンサンプリング済み信号を、高ビット深度(例えば10ビットまたは12ビット)HDR信号を低ビット深度(例えば、8ビット)SDR信号にさらに変換してよい。例えば、これは、第1エンコーダ1004が10ビットまたはそれ以上のビット深度の信号ではなく8ビット信号のみを処理することができる場合に最も有益である。トーンマップ1016は、例えば圧縮または非圧縮でデコーディングシステムへ(例えばメタデータとして)伝送されてよい。トーンマッピング済みダウンサンプリング信号はその後、第1エンコーダ1004によって処理される、ひとつの例において、変換およびダウンサンプリングは逆の順序で実行されてよい。すなわち、最初にダウンサンプリングし、次に変換を実行してよい。他の例において、ダウンサンプリング演算は実行されず、したがって変換済み信号は第1エンコーダ1004へ直接渡される。
【0100】
第1エンコーダ1004の出力、すなわち第1符号化ストリーム1012は、第1デコーダ1005によってさらに復号化され、第1復号化信号を生成する。任意で、第1復号化信号は、トーンマッピング済みダウンサンプリング信号とともに第2エンコーダ1006によって処理され、第2符号化ストリーム1014を生成する。任意で、第2符号化ストリームは第2デコーダ1007によって復号化され、第2符号化信号を生成するために、第1復号化信号に付加される(図示せず)。第2復号化信号(または、第2エンコーダおよび第2デコーダが使用されない場合、第1復号化信号)はその後、トーンマッピングコンバータ1003によって生成されたトーンを使って、トーンマップ調節済み信号を生成するトーンマッピング逆コンバータ1008によって処理される。トーンマッピング逆コンバータ1008は、従来および/または既知の逆トーンマッピング演算子およびアルゴリズム(背景技術としてのみ読者は上述した公開特許文献を参照できる)を使って、トーンマップによって示されるように信号を再調節することにより、トーンマッピングコンバータと逆の方法で動作してよい。第2復号化信号が低ビット深度(例えば、8ビット)SDR信号であれば、トーンマッピング逆コンバータは第2復号化信号を、低ビット深度(例えば、8ビット)SDR信号から高ビット深度(例えば10ビットまたは12ビット)HDR信号へさらに変換してよい。信号はその後、アップサンプラー1009によってアップサンプリングされ、生成されたアップサンプリング済み信号は、第3符号化信号1020を生成するべく第3エンコーダ1010によってオリジナル入力信号とともに処理される。ひとつの例において、変換およびアップサンプリングは逆の順序で実行されてよい。すなわち、最初にアップサンプリング、次に変換が実行される。他の例において、アップサンプリング演算は実行されず、したがって、変換済み信号は第3エンコーダ1010に直接渡される。
【0101】
任意第2エンコーダ1006は第1デコーダの出力とトーンマッピング済みダウンサンプリング信号との間の差を補正するよう動作してよい。これは第1デコーダの出力とトーンマッピング済みダウンサンプリング信号との間の差(例えば、残差)を導出しかつ効率的な方法でその残差を符号化するために実行されうる。符号化残差はその後、それを復号化するべく任意第2デコーダ1007によって逆処理され、かつそれを第1復号化信号に付加し、第1復号化信号の有効な補正済みバージョンである第2復号化信号を生成する。
【0102】
同様に、第3エンコーダ1010は、オリジナル入力信号1000とアップサンプリング済みHDR信号、例えばアップサンプラー1009の出力との間の差を補正するように動作してよい。これは、例えば、オリジナル入力信号とアップサンプリング済みHDR信号との間の差(例えば、残差)を導出しかつその残差を効果的な方法で符号化するために、実行されてよい。符号化残差はその後、デコーディングシステムによって逆処理され、かつアップサンプリング済みHDR信号へ付加される。
【0103】
任意第2エンコーダ/デコーダ、および第3エンコーダ/デコーダは、例えば、ここに参考文献として組み込む特許文献WO2014/170819、WO2013/011466、WO2013/011492またはWO2017/089839に開示されるような方法で動作してよい。
【0104】
低解像度信号に対してトーンマップを導出することにより(例えば、ダウンサンプリングの後に)、トーンマップの処理は、より少数の画素に対して実行されるので有意に減少し、したがってより迅速に実行可能となる。また、トーンマップのサイズはフル解像度でのトーンマップと比べ減少され、その後それを圧縮すればより大きな効率を与えることができる。さらに、任意第2エンコーダ/デコーダが処理で使用されれば、第1エンコーダ/デコーダによって導入される任意のアーティファクト(例えば、カラーバンディング、ブロック等)が低解像度で補正され、したがって、高解像度で補正されるアーティファクトに比べアーティファクトの効率的な補正が可能になる。さらに、第2エンコーダはHDR入力信号にできるだけ近い符号化信号をもたらすために、さらに残差を付加することによって信号をさらに強化する。
【0105】
図13は、本願で説明するようなエンコーディングシステムの例を示す。入力信号1000、例えば高ビット深度(例えば、10ビットまたは12ビット)HDR信号がエンコーディングシステムにおいて受信される。入力信号はその後、高解像度から低解像度へ渡すべく、ダウンサンプラー1002によって処理される。ダウンサンプリング済み信号はその後、トーンマッピングコンバータ1003を使って、トーンマッピング済み変換ダウンサンプリング信号へ変換されてよい。トーンマッピングコンバータ1003は、従来および/または既知のトーンマッピング演算子およびアルゴリズム(例えば、上述したような)を使って入力信号のトーンマップ1016を導出する。変換は、例えば非制限的例として、輝度および彩度値、ブライトネス、コントラスト、カラー、ガンマロジック、彩度デシメーション、スケーリング、彩度ノイズリダクション等のダウンサンプリング済み信号に関連するさまざまなパラメータを調節することを含んでよい。変換の処理において、トーンマップコンバータ1003はダウンサンプリング済み信号を、高ビット深度(例えば、10ビットまたは12ビット)HDR信号から低ビット信号(例えば、8ビット)SDR信号へさらに変換してよい。例えば、これは、第1エンコーダ1004が10ビットまたはそれ以上の高ビット深度信号ではなく8ビット信号のみを処理することができる場合に、最も有益であってよい。トーンマップ1016は、圧縮または非圧縮のいずれかによって、デコーディングシステムへ(例えばメタデータとして)伝送されてよい。トーンマッピング済みダウンサンプリング信号はその後、第1エンコーダ1004によって処理される。ひとつの例において、変換およびダウンサンプリングは逆の順序で実行されてよい。すなわち、最初にダウンサンプリングし、次に変換が実行される。他の例において、ダウンサンプリング動作は実行されず、したがって、変換済み信号は第1エンコーダ1004に直接渡される。第1エンコーダ1004の出力、すなわち第1符号化ストリーム1020は、第1復号化信号を生成するべく第1デコーダ1005によってさらに復号化される。第1復号化信号はその後、トーンマップコンバータ1003によって生成されたトーンマップ1016を使って、トーンマッピング逆コンバータ1008によって処理され、トーンマップ調節済み信号を生成する。トーンマッピング逆コンバータ1008は、従来および/または既知の逆トーンマッピング演算子およびアルゴリズム(上述したような)を使って、トーンマップによって示されるように信号を再調節することによりトーンマッピングコンバータと逆の方法で動作してよい。第2復号化信号が低ビット深度(例えば、8ビット)SDR信号であれば、トーンマッピング逆コンバータは第2復号化信号を、低ビット深度(例えば、8ビット)SDR信号から高ビット深度(例えば、10ビットまたは12ビット)HDR信号へさらに変換してよい。任意で、トーンマッピングされた補正済み信号はダウンサンプリング済み信号とともに第2エンコーダ1006によって処理され、第2符号化信号1014を生成する。任意で、第2符号化ストリームは第2デコーダ1007によって復号化され、第2復号化信号を生成するために第1復号化信号へ付加される(図示せず)。第2復号化信号(または、第2エンコーダおよび第2デコーダが使用されない場合には、第1復号化信号)がその後アップサンプラー1009によってアップサンプリングされ、生成されたアップサンプリング済み信号が第3エンコーダ1010によってオリジナル入力信号とともに処理され第3符号化信号ストリーム1020を生成する。ひとつの例において、変換およびアップサンプリングは逆の順序で実行されてよい。すなわち、最初にアップサンプリングし、次に変換が実行される。他の例において、アップサンプリング動作は実行されず、したがって変換済み信号が第3エンコーダ1010へ直接渡される。
【0106】
任意第2エンコーダ1006は第1デコーダの出力とダウンサンプリング済み信号との間の差を補正するよう動作してよい。これは、例えば第1デコーダの出力とダウンサンプリング済み信号との間の差(例えば、残差)を導出し、かつ、その残差を効率的な方法で符号化するために実行されてよい。符号化残差はその後、それを復号化するべく任意第2デコーダ1007によって逆処理され、それを第1復号化信号に付加して、第1復号化信号の有効補正済みバージョンである第2復号化信号を生成する。
【0107】
同様に、第3エンコーダ1010はオリジナルの入力信号とアップサンプリング済みHDR信号との間の差を補正するよう動作してよい。これは、例えば、オリジナル信号とアップサンプリング済みHDR信号との間の差(例えば、残差)を導出し、かつ、その残差を効率的な方法で符号化するために実行されてよい。符号化残差はその後、デコーディングシステムによって逆処理され、アップサンプリング済みHDR信号へ付加されてよい。
【0108】
任意第2エンコーダ/デコーダおよび第3エンコーダ/デコーダは、例えば、上記した特許文献に説明されるのと類似の方法で動作してよい。
【0109】
低解像度信号に対してトーンマップを導出する(例えば、ダウンサンプリング後)ことにより、トーンマップの処理は、それがより少ない数の画素に対して実行されるので、大きく減少し、したがってそれはより迅速に実行可能となる。また、トーンマップのサイズはフル解像度でのトーンマップに比べて減少し、その後圧縮されればそれは大きな効率を与える。さらに、任意第2エンコーダ/デコーダが処理に使用されるならば、第1エンコーダ/デコーダおよび/またはトーンマッピング処理によって導入される任意のアーティファクト(例えば、カラーバンディング、ブロック等)は低解像度で補正可能となり、したがって、高解像度で補正されるアーティファクトに比べてアーティファクトの効率的な補正が可能になる。さらに、第3エンコーダは、HDR入力信号にできるだけ近い符号化信号をもたらすために、さらなる残差を付加することによって、信号をさらに強化する。
【0110】
図14は、本願で説明するようなデコーディングシステムの例を示す。第1デコーダ1101は、第1符号化ストリーム1010を受信し、それを復号化して第1復号化信号1120を生成する。第1復号化信号1120はその後、受信したトーンマップメタデータ1016を使ってトーンマップ調節済み信号を生成するトーンマッピング逆コンバータ1108によって処理される。トーンマッピング逆コンバータ1108は、従来および/または既知の逆トーンマッピング演算子およびアルゴリズム(例えば、上述したような)を使って、トーンマップによって示されるように信号を再調節することによって、トーンマッピングコンバータとは逆の方法で動作してよい。第1復号化信号が低ビット深度(例えば、8ビット)SDR信号であれば、トーンマッピング逆コンバータは、第1復号化信号を、低ビット深度(例えば8ビット)SDR信号から高ビット深度(例えば、10ビットまたは12ビット)HDR信号へさらに変換してよい。任意で、第2デコーダ1201は復号化第1残差ストリームを生成するべく第2符号化ストリーム1014を復号化する。また、トーンマップ調節済み信号は、第2符号化信号を生成するべく、復号化第1残差ストリームとともに第2デコーダ1201によって任意に処理される。第2復号化信号(例えば、第2復号化ストリーム1014が受信されず、したがって第2デコーダ1201が使用されない場合、トーンマッピングされた調節済み信号)がその後、トーンマッピングされた補正済みアップサンプリング信号を生成するべくアップサンプラー1103によってアップサンプリングされる。ひとつの例において、トーンマッピング済み変換およびアップサンプリングは、逆の順序で実行可能である。すなわち、最初にアップサンプリングし、その後変換が実行される。他の例において、アップサンプリング動作は実行されず、したがってトーンマッピング済み信号がアップサンプラー1103へ直接渡される。第3デコーダ1104は、第3符号化ストリーム1020を復号化し、復号化第2残差ストリームを生成する。トーンマッピングされた補正済みアップサンプリング信号は、第3復号化信号を生成するべく、復号化第2残差ストリームとともに第3デコーダ1104によってさらに処理される。第3復号化信号はHDR信号であってよい。
【0111】
低解像度信号(例えば、アップサンプリング前)に対してトーンマップを処理することにより、トーンマップの処理は、それがより少数の画素に対して実行されるので大きく減少し、したがって、それはより迅速に実行可能となる。また、トーンマップのサイズはフル解像度でのトーンマップに比べ減少し、解凍はさらに効率よくなる。さらに、任意第2デコーダが処理に使用されれば、第1デコーダおよび/またはトーンマッピング処理によって導入される任意のアーティファクト(例えば、カラーバンディング、ブロック等)は低解像度で補正可能となり、したがって、高解像度で補正されるアーティファクトに比べ、アーティファクトの効率的な補正が可能となる。さらに、第3符号化ストリームは、HDR入力信号にできるだけ近い符号化信号をもたらすために、さらなる残差を付加することにより信号をさらに強化する。
【0112】
図12から14の例は、例えば、トーンマッピングパラメータが処理中のフレームに基づいて変化する場合に、動的トーンマッピングが実行される際に適用されてよい。本例は例えば各フレームが個別に処理される連続フレームに容易に適用されてよく、それらはエンコーダおよびデコーダシステムにおいて効率的かつ容易に実行されてよい。
【0113】
ここで説明した例により、8ビットの低解像度ビデオ、10ビットまたは12ビットHDR情報の局所的再構成用のトーンマップ、および補正メタデータを含むデータセットへの10ビットまたは12ビットのHDRビデオの効率的変換が、フル解像度完全品質画像の再構成を可能にする。階層ベースの符号化方法において低解像度でトーンマップ変換を実行することは、この演算に必要な処理電力を最小化することが可能となるようなユニークな利益のセットをもたらす(符号化および復号化の両方において、それはライブビデオおよび低電力デコーダ装置に対して特に重要である)。例えば、補正メタデータの有用性は、10ビット-8ビット-10ビット変換処理において導入されうる任意のバンディングを補正可能にする。最後に、10ビットまたは12ビットから8ビットへの変換は、視認可能な後方互換性8ビット標準ダイナミックレンジ(SDR)低解像度ビデオを与えるか、または最大圧縮用の局所画像ヒストグラムをインテリジェントに分配することによって、圧縮効率を最大化するかのいずれかのためにキャリブレーションされうる。
【0114】
上述した例で議論した変換において、デコーダにおいていわゆるブラインド変換が使用されてもよく、または、エンコーダがデコーダの動作をシミュレートしてよい。これは、変換が、変換機能のモジュラー交換を容易にするスタンドアロンの方法で実行されてよいことを意味している。これは、アップサンプリング、ダウンサンプリング、色空間変換、HDR-SDR変換およびその逆変換、信号エレメントコーディングフォーマット変更等に適用される。例えば、異なる変換方法が、異なるフレームまたは異なるビデオストリームに対して適用されてよい。これは、符号化および復号化を連係させるようエンコーダとデコーダとの間で信号を送ってよい。しかし、これらの変更を盛り込むために、システムアーキテクチャーまたは処理フローに変更は必要ない。これは、非依存処理である残差信号の使用により可能となる、例えば、それらは2つの比較信号(基準信号と再構成済み信号)の間の差を補正するが、再構成済み信号はさまざまな方法で生成されてよい。本例はまた、ビデオデータの小さい部分、例えば、コーディングユニットまたは2×2もしくは4×4ピクセルのブロックにおいて、並列に実行することも可能である。これは、処理フローの実行はビデオデータのフレームの部分内の空間依存性を導入しないためである。これは、異なるフレーム部分の有効な並列処理を可能にし、例えば、実施形態は、異なるフレーム部分に対して並列に適応されてよく、その後ひとつ以上の品質レベルで出力信号を生成するべく最終出力を作成する。
【0115】
ここで説明された例は、異なる色表現を処理することができる容易に実行可能な単純スキームを与え、これらの色表現は異なるレベルの色品質を与えてよい。ある例において、個々の変換コンポーネントまたはモジュールは、信号を予測しようとせず、スタンドアロン形式で動作し、残差を使うエンハンスメント信号が適切な調節を与えることができる。このアプローチはまた、メタデータ用に伝送ストリームを変更することを考える必要がなく、これらの変換コンポーネントおよびモジュールに対して、必要に応じてそれらを変更しながら、より多くのモジュラーアプローチを取ることを可能にする。
【0116】
いくつかのタイプの色空間変換が実行可能である。特に、非線形色空間変換が使用可能である。
【0117】
付加的な効果は、比較的洗練度の低い信号を比較的洗練度の高い信号へ変化させる際に、色空間、HDRまたは信号エレメントコーディングフォーマット情報を符号化するべく、残差情報(例えば、信号に対する変化のみ)を使用することにより達成されてよい。
【0118】
上述したすべての例において、第1エンコーディングモジュール/エンコーダ(および対応する第1デコーディングモジュール/デコーダ)が、標準MPEGコーデック(例えば、AVC、HEVC等)、非標準コーデック(例えば、VP9、AV1等)、またはPERSEUS(商標)などの階層的コーデックなどの任意のタイプのコーディングスキームに対応してよい。
【0119】
上述した詳細な説明は非限定的例として与えられ、任意の変更または組み合わせが本説明に含まれる。
【先行技術文献】
【特許文献】
【0120】
【特許文献1】米国特許出願第20150078661号明細書
【特許文献2】米国特許出願第20170070719号明細書
【特許文献3】米国特許第9437171号明細書
【特許文献4】国際公開WO2014/170819号公報
【特許文献5】国際公開WO2013/011466号公報
【特許文献6】国際公開WO2013/011492号公報
【特許文献7】国際公開WO2017/089839号公報
【非特許文献】
【0121】
【非特許文献1】A. Banitalebi-Dehkordi, M. Azimi, M. T. Pourazad and P. Nasiopoulos, "Compression of high dynamic range video using the HEVC and H.264/AVC standards," 10th International Conference on Heterogeneous Networking for Quality, Reliability, Security and Robustness, Rhodes, 2014, pp. 8-12.
【国際調査報告】