(58)【調査した分野】(Int.Cl.,DB名)
前記ルーマ予測器が、予測される信号のルーマ成分のピクセル値が入力信号のルーマ・ピクセル値のみに基づいて予測される、多項式予測器を含む、請求項1記載の方法。
前記クロマ予測器が、予測される信号のクロマ成分のピクセル値が入力信号のルーマおよびクロマ値の両方に基づいて予測される複数色チャネル多重回帰(MMR)予測器を含む、請求項1記載の方法。
前記第一の空間解像度が前記第二の空間解像度より高く、前記予測された信号を適用して前記出力信号を生成する前に、前記予測された信号はアップサンプリングされて、前記第一の空間解像度をもつアップサンプリングされた予測された信号を生成する、請求項9記載の方法。
残差ピクセルについての前記なめらかさメトリック値が、当該残差ピクセルのまわりの領域におけるピクセル値の標準偏差に基づいて計算される、請求項21記載の方法。
【発明を実施するための形態】
【0015】
向上ダイナミックレンジをもつ超高精細度信号の後方互換な符号化が本稿において記述される。超高精細度(UHD)解像度および高または向上ダイナミックレンジ(EDR)をもつ一方の信号とUHD(またはより低い)解像度および標準ダイナミックレンジ(SDR)をもつ他方の信号という二つの信号によって表現されうる入力ビデオ信号が与えられて、該二つの信号が後方互換な層構成にされたストリームにおいて符号化される。該ストリームは、レガシー・デコーダがHD標準ダイナミックレンジ(SDR)信号を抽出し、新しいデコーダがUHD EDR信号を抽出することを許容する。
【0016】
下記の記述では、本発明の十全な理解を提供するために、説明の目的で数多くの個別的詳細が記載される。しかしながら、本発明がそうした個別的詳細なしでも実施されうることは明白であろう。他方、本発明を無用に埋没させるのを避けるために、よく知られた構造および装置は網羅的な詳細さでは記述されない。
【0017】
〈概観〉
本稿に記載される例示的実施形態は、向上ダイナミックレンジをもつ超高精細度信号の後方互換な符号化および復号に関する。超高精細度(UHD)解像度および高または向上ダイナミックレンジ(EDR)をもつ一方の信号とUHD(またはより低い)解像度および標準ダイナミックレンジ(SDR)の他方の信号という二つの信号によって表現された入力ビデオ信号が与えられて、該二つの信号が後方互換な層構成にされたストリームにおいて符号化される。該ストリームは、レガシー・デコーダがHD標準ダイナミックレンジ(SDR)信号を抽出し、新しいデコーダがUHD EDR信号を抽出することを許容する。基本層HD SDR信号に応答して、別個のルーマおよびクロマ予測モデルを使って予測された信号が生成される。ルーマ予測器においては、予測される信号のルーマ・ピクセル値は基本層のルーマ・ピクセル値のみに基づいて計算される。一方、クロマ予測器においては、予測される信号のクロマ・ピクセル値は、基本層のルーマおよびクロマ・ピクセル値の両方に基づいて計算される。入力UHD EDR信号と予測された信号とに基づいて残差信号が計算される。符号化されたビットストリームを形成するために、基本層信号および残差信号は別個に符号化される。
【0018】
もう一つの実施形態では、受領器は受領された層構成にされたビットストリームを多重分離して、HD解像度および標準ダイナミックレンジ(SDR)の符号化された基本層(BL)ストリームと、UHD解像度および向上ダイナミックレンジ(EDR)の符号化された向上層ストリームとを生成する。符号化されたBLストリームは、BLデコーダを使って復号され、HD解像度および標準ダイナミックレンジの復号されたBL信号を生成する。復号されたBL信号に応答して、予測されたEDR信号が生成される。ここで、予測された信号のルーマ成分のピクセル値は、復号されたBL信号のルーマ・ピクセル値のみに基づいて予測され、予測された信号の少なくとも一つのクロマ成分のピクセル値は、復号されたBL信号のルーマおよびクロマ値両方に基づいて予測される。符号化されたELストリームは、ELデコーダを使って復号されて、復号された残差信号を生成する。復号された残差信号および予測された信号に応答して、出力UHD EDR信号も生成されうる。
【0019】
もう一つの実施形態では、向上層における残差信号は、非線形量子化器によって量子化される前に適応的に前処理される。ある実施形態では、残差ピクセル値は、それらを囲むピクセルの標準偏差が閾値より低い場合には、0に前置量子化される。
【0020】
もう一つの実施形態では、非線形量子化器の入力範囲は、非常に大きなまたは非常に小さなピクセル値をもつ残差ピクセルのピクセル接続性の指標に従って制約される。
【0021】
もう一つの実施形態では、非線形量子化器のパラメータは、シーン内のフレームの連続的なシーケンスにまたがる残差ピクセルの極端な値(extreme values)に基づいて設定される。
【0022】
〈超高精細度EDR信号のためのエンコーダ〉
HDTV、セットトップボックスまたはブルーレイ・プレーヤーのような既存の表示および再生装置は典型的には1080p HD解像度(たとえば60フレーム毎秒で1920×1080)までの信号をサポートする。消費者用途のためには、そのような信号は現在、典型的には、ルーマ‐クロマ・カラー・フォーマットにおける色成分毎、ピクセル毎に8ビットのビット深さを使って圧縮される。ここで、典型的にはクロマ成分はルーマ成分より低い解像度をもつ(たとえば、YCbCrまたはYUV 4:2:0カラー・フォーマット)。8ビット深さおよび対応する低いダイナミックレンジのため、そのような信号は典型的には、標準ダイナミックレンジ(SDR)の信号と称される。
【0023】
超高精細度(UHD)のような新たなテレビジョン規格が開発されつつあるので、向上した解像度および/または向上ダイナミックレンジをもつ信号を、レガシーのHDTVデコーダおよびより新しいUHDデコーダの両方が処理できるフォーマットでエンコードすることが望ましいことがある。
【0024】
図1は、向上ダイナミックレンジ(EDR)をもつUHD信号の後方互換な符号化をサポートするシステムの例示的な実装のある実施形態を描いている。エンコーダは基本層(BL)エンコーダ(130)および向上層(EL)エンコーダ(160)を有する。ある実施形態では、BLエンコーダ130はMPEG-2またはH.264エンコーダのようなレガシー・エンコーダであり、ELエンコーダ160はHEVCエンコーダのような新しい規格のエンコーダである。レガシーのBLデコーダをサポートするために、BLエンコーダ130は典型的には8ビット・エンコーダであるが、ELエンコーダ160は、H.264およびHEVC規格によって指定されるような10ビットのようなより高いビット深さをもつ入力ストリームをサポートしてもよい。しかしながら、このシステムは、標準ベースのものであれ独自のものであれ、既知のまたは将来のエンコーダの任意の組み合わせに適用可能である。
【0025】
図1に描かれるように、映画またはテレビジョン放送のような入力信号は、UHD EDR入力(102)およびUHD SDR入力(104)の二つの信号によって表現されてもよい。たとえば、UHD EDR信号(102)は、HDRカメラによって捕捉され、EDRディスプレイのためにカラーグレーディングされた4K(たとえば3840×2160)解像度の信号であってもよい。同じ信号は、対応する4K SDR信号104を生成するよう4K SDRディスプレイ上でカラーグレーディングされてもよい。あるいはまた、SDR信号104は、EDR信号に、当技術分野で既知のトーンマッピングまたはディスプレイ管理技法の任意のものを適用することによって生成されてもよい。一般性を失うことなく、これらの入力信号はいずれも典型的には16ビットまたは等価な(たとえば浮動小数点)ビット深さ表現を使ってRGB色空間において表現されてもよい。本稿での用法では、Nビット信号という用語は、一つまたは複数の色成分(たとえばRGBまたはYCbCr)をもつ画像またはビデオ信号であって、これらの色成分の任意のもの(たとえばY)における各ピクセルがNビットのピクセル値によって表現されるものを表わす。Nビット表現を与えられると、そのような各ピクセルは0から2
N−1までの間の値を取り得る。たとえば、8ビット表現において、各色成分について、各ピクセルは0から255までの間の値を取ることができる。
【0026】
ある実施形態では、UHD SDR信号104はHD SDR信号(たとえば1080p)にダウンサンプリングされてもよく、次いでレガシーの8ビット・エンコーダを使うエンコードに好適なカラー・フォーマット、たとえば8ビットYCbCr 4:2:0カラー・フォーマットに変換される。そのような変換は、色変換(たとえばRGBからYCbCr変換115−C)およびクロマ・サブサンプリング(たとえば4:4:4から4:2:0への変換120−C)を含んでいてもよい。こうして、HD SDR信号128は、もとのUHD EDR信号102の後方互換な信号表現を表わす。信号128は、後方互換な符号化されたビットストリーム132を生成するようBLエンコーダ130によってエンコードされてもよい。BLエンコーダ130は、MPEG-2、MPEG-4パート2、H.264、HEVC、VP8などのような既知のまたは将来のビデオ圧縮アルゴリズムの任意のものを使って、HD SDR信号128を圧縮またはエンコードしてもよい。
【0027】
UHD EDR信号102を与えられて、ダウンサンプリング(110−A)および色変換プロセス(115−Bおよび120−B)はUHD EDR信号102を参照予測HD EDR信号124に変換してもよい。ある好ましい実施形態では、この段におけるダウンサンプリングおよび色変換プロセス(110−A、115−Bおよび120−B)(たとえば選択されたフィルタおよび色空間)は、基本層においてHD SDR信号128を生成するために使われるダウンサンプリングおよび色変換プロセス(110−B、115−Cおよび120−C)と同一であるかまたはできるだけ近いべきである。
【0028】
UHD EDRからHD EDRへの変換に続いて、HD EDR信号124の出力はルーマ(Y 124−Y)およびクロマ(CbCr 124−C)成分に分離され、これらの成分が、ルーマ予測器145およびクロマ予測器140のための予測係数を決定するために適用される。
【0029】
HD SDR信号128を与えられて、BLエンコーダ130は、符号化されたBLビットストリーム132だけでなく、対応するBLデコーダによって復号される際にそうなるような、HD SDR信号128を表わすBL信号126をも生成する。いくつかの実施形態では、信号126は、BLエンコーダ130に続く別個のBLデコーダ(図示せず)によって生成されてもよい。他のいくつかの実施形態では、BLエンコーダ130において動き補償を実行するために使われる信号126がフィードバック・ループから生成されてもよい。
図1に描かれるように、HD EDR信号126の出力は、そのルーマ(Y 126−Y)およびクロマ成分(CbCr 126−C)に分離されてもよく、それらの成分がHD EDR'信号147を予測するためにルーマ予測器145およびクロマ予測器140に加えられる。
【0030】
ある実施形態では、ルーマ予測器145は、基本層HD SDR信号のルーマ・ピクセル値126−Yに基づいてHD EDR'信号147のルーマ成分を予測するために多項式予測器を有していてもよい。そのような予測器においては、ルーマ・ピクセル成分は、当該信号の他の色成分のいずれにおけるどのピクセル値も考慮に入れることなく予測されうる。たとえば、g
iがBL HD SDR信号のルーマ・ピクセル値(126−Y)を表わすとすると、一般性を失うことなく、三次の多項式予測器は
【数1】
と表わされてもよい。ここで、a
k、b
kおよびc
kは予測器係数である。ある実施形態では、予測器係数は、予測された値(^付きのs
i)と参照HD EDR信号におけるルーマ・ピクセル値(s
i)(124−Y)との間の平均平方誤差
【数2】
を最小化するなどの、当該技術分野で既知の任意の最小化誤差技法によって決定されうる。
【0031】
ある実施形態では、クロマ予測器140も上記と同様の多項式予測器であってもよいが、ある好ましい実施形態では、クロマ予測器140は、2012年4月13日に出願されたPCT出願第PCT/US2012/033605(WO2012/142471として公開)「複数色チャネル多重回帰予測器」によって記述されるような複数色チャネル多重回帰(multi-color channel, multiple regression)(MMR)予測器を有する。同出願の内容はここに参照によってその全体において組み込まれる。MMR予測器は、HD EDR参照信号124および基本層HD SDR信号126におけるルーマおよびクロマ・ピクセル値両方からの情報を使ってHD EDRの信号のクロマ成分を予測する。MMRモデルにおける予測係数も、予測されるクロマ値と参照HD EDR信号124のルーマおよびクロマ・ピクセル値との間のMSEを最小にすることによる平均平方誤差(mean-square-error)最小化技法を使って決定されてもよい。
【0032】
HD SDR信号126および参照HD HDR信号124の両方が、ルーマ成分の空間解像度が各クロマ成分の空間解像度の二倍であるYCbCr 4:2:0フォーマットであるので、これらの信号両方のルーマ成分は、クロマ予測器140に適用される前にダウンサンプリングされる(135−Aおよび135−B)。ある好ましい実施形態では、ルーマ・ダウンサンプリング135−Aおよび135−Bにおいて使用されるフィルタは4:4:4から4:2:0への処理(120)において使われたクロマ・ダウンサンプリング・フィルタと同じである。ルーマおよびクロマ予測係数は、シーン毎、ピクチャー・グループ毎またはフレーム毎など、関心のある多様な時間間隔で更新されうる。予測フィルタ係数は、補助データまたはメタデータとしてビットストリーム中にその値を埋め込むなど、多様な方法によってデコーダに通信されうる。
【0033】
予測されたHD EDR'信号147を与えられて、アップサンプラー150はUHD EDR'信号152を生成し、これが残差信号167を生成するために使われる。UHD EDR'信号が好ましい符号化フォーマット(たとえばYCbCr 4:2:0)にあるので、もとのフォーマット(たとえばRGB)からのもとのUHD EDR信号102を前記好ましい符号化フォーマットのUHD EDR信号122に変換するために、追加的な色変換(115−A)およびクロマ・ダウンサンプリング(120−A)ステップが必要とされることがある。信号122および152は減算されて、EL残差信号167を生成する。
【0034】
ある実施形態では、色変換(115−A)およびクロマ・サブサンプリング・プロセス(120−A)は、BL符号化された信号128および予測信号124を生成するために使われている色変換(115−Bおよび115−C)およびクロマ・サブサンプリング・プロセス(120−Bおよび120−C)と同一であるかまたはできるだけ近いべきである。
【0035】
ある実施形態では、ELエンコーダ160によってEL信号167を符号化するために、信号は非線形量子化器(NLQ: non-linear quantizer)155によって処理されてもよい。好適な非線形量子化器の例は、2012年4月24日に出願されたPCT特許出願第PCT/US2012/034747号(WO2012/148883として公開)「非線形VDR残差量子化器」において見出されうる。この出願の内容はここに参照によってその全体において組み込まれる。NLQ 155の出力は、好適なデコーダに伝送されうる符号化されたELビットストリーム162を生成するためにELエンコーダ160を使って圧縮されてもよい。さらに、いくつかの実施形態では、残差(167)は、ダウンサンプリング・モジュール(図示せず)によって空間的にダウンサンプリングされてもよい。そのようなダウンサンプリング(たとえば両方の次元方向における2または4倍のダウンサンプリング)は、非常に低いビット・レートにおいて符号化効率を改善する。ダウンサンプリングは、非線形量子化器(155)の前または後のいずれで実行されてもよい。
【0036】
ELエンコーダ160は、MPEG-2、MPEG-4、H.264、HEVC規格などによって記述されたようないかなる好適なエンコーダであってもよい。ある実施形態では、BL符号化されたビットストリーム132、EL符号化されたビットストリーム162および符号化プロセスに関係したメタデータ(たとえば予測器パラメータまたはルックアップテーブル)が単一のビットストリーム(図示せず)に多重化されてもよい。
【0037】
図1に描かれるように、ある好ましい実施形態では、ダウンサンプリング(110−Aまたは110−B)は好ましくはカラー・フォーマット変換(115−Bおよび120−Bまたは115−Cおよび120−C)の前に適用されるが、いくつかの実施形態では、ダウンサンプリングは色変換の後に実行されてもよい。たとえば、ある実施形態では、110−Aへの入力はUHD EDR YCbCr信号122から直接受領されてもよく、よってHD EDR参照信号124を生成するために色変換処理115−Bおよび120−Bを行なう必要がなくなる。同様に、ダウンサンプリング110−Bは色変換ステップ120−Cの後に実行されることができる。
【0038】
いくつかの実施形態では、ベースラインHD SDR信号128は、正しい解像度およびカラー・フォーマットでエンコーダ100に対してすでに利用可能であってもよい。そのような場合、ダウンサンプリング(110−B)および色変換ステップ(115−Cおよび120−C)はバイパスされてもよい。
【0039】
いくつかの実施形態では、UHD EDR信号102は、16ビットより低いまたはより高い精度で利用可能であってもよいが、その精度は8ビットよりは高いことが期待される(たとえば、10ビットまたは12ビット)。同様に、UHD SDR信号104は、16ビットより低い精度ですでに利用可能であってもよい(たとえば8ビットまたは10ビット)。
【0040】
〈超高精細度EDR信号のためのデコーダ〉
図2は、向上ダイナミックレンジ(EDR)をもつUHD信号の後方互換なデコードをサポートするシステムの例示的な実装のある実施形態を描いている。エンコーダ(たとえば100)によって伝送された符号化された信号に応答して、デコーダ200は、少なくとも二つの符号化サブストリーム、すなわち符号化されたBLストリーム132および符号化されたELストリーム162を含む符号化されたビットストリームを多重分離する。
【0041】
符号化されたBLストリーム132は、BLデコーダ215を使ってデコードされることができるHD SDR信号(217)を含んでいる。ある実施形態では、BDデコーダ215はBLエンコーダ130にマッチする。たとえば、既存の放送およびブルーレイ規格との後方互換性のために、BLデコーダ215はMPEG-2またはH.264符号化規格の一つまたは複数に準拠しうる。BLデコード215に続いて、HD SDRデコーダは、デコードされたHD SDR信号217に、追加的な色変換(270)を適用して、はいってくる信号を、圧縮に好適なカラー・フォーマット(たとえばYCbCr 4:2:0)から表示に好適なカラー・フォーマット(たとえばRGB 4:4:4)に変換してもよい。向上した解像度および/またはEDR表示機能をもつ受領器は、
図2に描かれるように、BLおよびELビットストリーム(132および162)両方からの情報を組み合わせて、向上ダイナミックレンジをもつUHD信号(たとえば232)を生成してもよい。
【0042】
BLデコード215に続いて、デコードされた信号217はそのルーマ(217−Y)およびクロマ(217−C)成分に分割される。ルーマ成分(217−Y)は、HD EDR'信号255についてのルーマ推定値を生成するようルーマ予測器240によって処理される。ルーマおよびクロマ成分は、HD EDR'信号255についてのクロマ推定値を生成するようクロマ予測器250によっても処理される。ある実施形態では、クロマ予測器によってルーマ信号217−Yを処理する前に、ルーマ信号はクロマ成分の解像度に一致するよう、ダウンサンプラー245によってサブサンプリングされる。ルーマおよびクロマ予測器(240および250)は、エンコーダ100におけるルーマおよびクロマ予測器(145および140)にマッチする。よって、ルーマ予測器240は多項式予測器であってもよく、クロマ予測器はMMR予測器であってもよい。ある実施形態では、これらの予測器の特性およびフィルタ・パラメータは、受領された符号化ビットストリームに埋め込まれているメタデータを使って決定されてもよい。ルーマおよびクロマ予測ステップ(240および250)に続いて、予測されたHD EDR'信号255は、UHD EDR'信号265を生成するようアップサンプリングされる(260)。
【0043】
符号化されたビットストリーム162を与えられ、ELデコーダ210はそれをデコードしてUHD EDR残差信号212を生成する。ELデコーダ210はELエンコーダ160にマッチする。エンコーダ100が非線形量子化器155を残差167に適用した場合、非線形量子化解除器(NLDQ: non-linear de-quantizer)220を適用して量子化解除された残差222を生成することによって、非線形量子化プロセスが反転される。エンコーダ(100)が残差(167)に対して空間的ダウンサンプリングを適用した場合には、NLDQ(220)の前または後の空間的アップサンプラー(図示せず)が、デコードされた残差(たとえば212または222)をその適正な空間解像度にアップサンプリングしてもよい。UHD EDR'推定値265に残差222を加える(225)ことにより、デコーダ200は、エンコーダによって伝送されたUHD EDR信号122の解像度およびカラー・フォーマット(たとえば4:2:0 YCbCr)にマッチするUHD EDR信号227を生成してもよい。目標用途に依存して、一組の色変換(230)がUHD EDR信号232を表示または他の処理に好適なフォーマットに変換してもよい。ある実施形態では、YCbCr 4:2:0信号227を与えられて、色変換230は4:2:0から4:4:4へのクロマ・アップサンプリング・ステップおよびそれに続くYCbCrからRGBへの色変換ステップを含んでいてもよい。
【0044】
〈混合されたプログレッシブおよびインターレース・フォーマットのエンコードおよびデコード〉
プログレッシブ・ビデオ信号(たとえば720pまたは1080p)の採用が増えているにもかかわらず、インターレースされたビデオ信号(たとえば1080i)の放送は、ビデオ放送においていまだきわめて一般的である。もう一つの実施形態では、
図3は、プログレッシブおよびインターレース・フォーマットの混合を使った層エンコードをサポートするUHD EDRエンコード・システム(300)のもう一つの例を描いている。一例では、BL信号(332)はインターレース・フォーマット(たとえば1080iまたは2160i)で符号化され、一方EL信号(162)はプログレッシブ・フォーマット(たとえば2160p)で符号化される。
【0045】
エンコード・システム(300)は、エンコード・システム(100)の機能の大半を共有するので、本節では、両システムの間の主要な相違のみを論じることにする。
図3に描かれるように、基本層処理において、SDR信号(104)は、BLエンコーダ(130)を使ってエンコードのために好適なカラー・フォーマット(たとえば4:2:0 YCbCr)に色変換される。ある例示的な実施形態では、BLエンコーダ(130)の出力(332)はインターレースされたSDR信号を含んでいてもよい。インターレース器(320−A)は、プログレッシブ入力(128)を基本層信号(332)の所望される符号化解像度(たとえば1080i)のインターレースされた信号に変換するために、当技術分野で知られている任意のインターレースおよびダウンサンプリング技法を適用しうる。
【0046】
システム(100)に比べ、向上層では、システム(100)の処理コンポーネント(110−A)(115−B)および(120−B)はみな、インターレース器(320−B)で置換されてもよい。インターレース器(320−B)は、プログレッシブ入力(122)をインターレースされた信号(126)の解像度にマッチするインターレースされた信号(124)に変換するために、当技術分野において既知の任意のインターレースおよびダウンサンプリング技法を適用しうる。ある好ましい実施形態では、(320−A)および(320−B)のダウンサンプリングおよびインターレース機能は、色アーチファクトを軽減し、全体的な画像符号化品質を改善するために、できるだけ互いと同一であるまたは近いべきである。
【0047】
システム(300)におけるルーマおよびクロマ予測器(145および140)は、システム(100)のものと同じままであるが、今ではそれぞれの入力の別個のフィールドに対して作用する。今では信号(124)および(126)はインターレースされた信号だからである。
【0048】
インターレース解除器(350)も二重の機能をもつ:予測されたHD EDR'の信号(347)をインターレース解除し、それをUHD EDR信号(122)の解像度にマッチするようアップサンプリングし、それにより、信号(122)と同じ解像度およびフォーマットをもつ予測されたUHD EDR'信号152を生成する。システム(300)における残差(167)の処理はシステム(100)について述べたのと同じままである。
【0049】
いくつかの実施形態では、SDR信号(104)はすでにインターレースされたフォーマットになっていることがあり、その場合、インターフェース器(320−A)はダウンサンプラーで置換されてもよい。インターレース器(320−A)は、入力信号(104)がすでにインターレースされていて、適正な解像度になっていれば、なくされてもよい。
【0050】
ある実施形態では、入力信号(102)および(104)はいずれもHD解像度信号(たとえば1080p)であってもよい。その場合、システム(300)の出力は、符号化されたインターレースされたHD(たとえば1080i)基本層信号(332)および符号化されたプログレッシブHD(たとえば1080p)残差(162)を含んでいてもよい。
【0051】
ある実施形態では、BL信号(332)および残差(162)はいずれも同じ解像度だが混合フォーマットであってもよい。たとえば、BL信号(332)は2160iで符号化されていてもよく、一方、EL信号(162)は2160pで符号化されていてもよい。
【0052】
図4は、混合フォーマット・エンコーダ(300)によって生成された信号をデコードするデコーダ・システム(400)の例示的な実装の実施形態を描いている。システム(400)はデコーダ・システム(200)とほとんど同一であるが、次の相違点がある:a)デコードされたBL信号(417)は今ではインターレースされたビデオ信号である、(b)ルーマおよびクロマ予測器(240および250)はインターレースされた信号(417)および(247)のフィールドに作用する、c)予測されたHD EDR'信号(455)はインターレースされた信号である。
【0053】
インターレース解除器(460)は機能において、システム(300)のインターレース解除器(350)にマッチし、よって、インターレースされたHD EDR'信号(455)をインターレース解除し、アップサンプリングする。それにより、その出力であるUHD EDR'信号(465)は、デコードされた誤差残差信号(222)と同じ解像度およびフォーマットをもつ。
【0054】
先述したように、システム(300)は、非線形量子化器(155)の前または後のいずれかにEL経路における空間的ダウンサンプリング・モジュール(図示せず)をも含んでいてもよい。そのような場合、デコーダ(400)では、デコードされた残差(212)をその適正な空間解像度に復元するために、NLDQ(220)の前または後の空間的アップサンプラーが使用されてもよい。
【0055】
〈ルーマ・レンジ駆動の適応アップサンプリング〉
図1に描かれるように、ルーマおよびクロマ予測ステップ(140、145)に続いて、予測されたHD EDR'信号(147)は2倍アップサンプリングされ(150)、予測されたUHD EDR'信号152を生成する。同様のプロセスがデコーダ(200)においても実行されており、ルーマおよびクロマ予測ステップ(240、250)に続いて、予測されたHD EDR'信号(255)が2倍アップサンプリングされて(260)、予測されたUHD EDR'信号(265)を生成する。アップサンプラー(150)および(260)は当技術分野において知られている任意のアップサンプリング技法を有していてよいが、本節において記述されるルーマ・レンジ駆動の適応アップサンプリング技法を用いることによって、改善された画質が達成されうる。
【0056】
もとのEDR信号(122)とその予測された値(152)との間の予測誤差(167)が、対応するSDR信号(104)におけるルミナンス値に依存して変わりうることが観察されている。すなわち、画像中の明るいまたはハイライト領域における残差(167)は、暗いトーンまたは中間トーンにおける残差とは異なる型の特性を示す。ある実施形態では、SDR入力のルミナンス・レンジが二つ以上のルーマ・サブレンジに分割されてもよい。適応アップサンプリング・フィルタリング方法は、EDR予測画像の異なるピクセルに異なるアップサンプリング・フィルタを適用しうる。ここで、各フィルタは、SDR画像中の対応するピクセルのルーマ・サブレンジに従って選択される。エンコーダおよびデコーダの両方が改善された画質のために同じアップサンプリング・フィルタを適用しうるよう、これらのルーマ・サブレンジのそれぞれを同定する閾値ならびに使われるフィルタの識別情報および/またはフィルタ係数自身は、エンコーダ(100)からデコーダ(200)に、メタデータまたは他の補助データを介して通信されてもよい。
【0057】
【数3】
がHD EDR'信号(147)のルミナンス・ピクセル値を表わすとする。これは、BLエンコーダ(130)の出力のルミナンス値、すなわちSDR信号s
ij(126−Y)に基づいて予測される。th(i)(i=0,N)がピクセルs
ijのルミナンス・レンジ(0≦s
ij≦1)を関心のあるN個のルーマ・レンジ(N≧1)に分割する一組の閾値を表わすとする(たとえば、N=3については、黒、中間トーンおよびハイライトに分割)。H
iは、i番目の関心のあるルーマ・レンジについてステップ(150)または(260)で使われるi番目の(i=1,N)アップサンプリング・フィルタについての一組のフィルタ係数を表わすとし、
【数4】
がs
ijまたはそのローカルな近傍の関数を表わすとすると、ある実施形態では、アップサンプリング・フィルタリング(たとえば150または260)は、擬似コードで表わされる次のアルゴリズム1に従って実行されてもよい。
【0058】
アルゴリズム1 − ルーマ・レンジ駆動のアップサンプリング・プロセス
【表1】
いくつかの実施形態では、H
iは2D非分離可能フィルタのフィルタ係数を表わしていてもよい。他のいくつかの実施形態では、H
iは、限定するわけではないが水平方向および垂直方向のアップサンプリング・フィルタについての係数を含む、2D分離可能アップサンプリング・フィルタの係数を表わしていてもよい。フィルタ係数H
iは事前計算されてメモリに記憶されてもよく、何らかの画像品質基準に従って適応的に計算されてもよい。たとえば、ある実施形態では、フィルタ係数H
iは、アップサンプリング・フィルタの出力である予測されたUHD EDR'信号(152)と入力UHD EDR信号(122)との間の平均平方誤差が最小になるように計算されてもよい。
【0059】
いくつかの実施形態では、
【数5】
は関心のある単一のピクセル値(たとえばs
ijまたはs
ij-1)を表わしていてもよく、他のいくつかの実施形態では、
【数6】
はs
ijの周囲の一つまたは複数のピクセルの局所的な平均または他の何らかの関数(たとえばメジアン、最小値または最大値)を表わしていてもよい。
【0060】
ある実施形態では、閾値th(i)は、入力信号の画像統計(たとえば、黒、中間トーンまたはハイライトの平均値)に基づいて決定されてもよい。これらの統計は、ピクセル領域毎、フレーム毎またはシーン毎(たとえば同様のルミナンス特性をもつ逐次的なピクチャーの群)に計算されてもよい。いくつかの実施形態では、th(i)はフィルタリング設計プロセスの一部として逐次反復的に決定されてもよい。たとえば、フィルタ係数H
iが何らかの最適化基準、たとえば信号(167)の平均平方誤差(MSE)の最小化に基づいて計算される場合を考えると、ある実施形態では、アルゴリズム2は擬似コードにおいて、二つの限界を定める閾値(t_lowおよびt_high)を与えられて新しい閾値(th*)を決定する例示的な方法ならびに閾値探索きざみ(step)を記述している。
【0061】
アルゴリズム2 − 二つのルーマ・サブレンジについての閾値決定(N=2)
Partition_Function(t_low, t_high, step)〔分割関数〕
{
j=0;
Pth[100]; //可能な閾値(possible threshold)の配列
D[100]; //歪み(distortion)値の配列
for(t=t_low, th<=t_high, th=th+step)
{
Pth(j)=th;
入力のs
ijピクセルを二つのルーマ・レンジA1およびA2に分割
ここで、
【数7】
A1内のピクセルのみを考えてフィルタH
1を導出
A2内のピクセルのみを考えてフィルタH
2を導出
二つのフィルタH
1およびH
2を使ってアップスケーリングを実行して、アップスケーリングされた予測された信号
【数8】
(152)を決定
誤差残差信号(167)のMSE、D(j)を計算
【数9】
j++;
}
最適な閾値th*として、D(j)が最小になるPth(j)の値を定義:
【数10】
計算されたth*についてフィルタ係数H
1およびH
2を計算
return(th*)+
}
。
【0062】
上記の記述において、t_lowおよびt_highは閾値をさがしてもよい関心のある境界値を表わす。たとえば、ある実施形態では、t_low=min(s
ij)=0およびt_high=max(s
ij)=1(ここで、1は規格化された最大可能な値を表わす)が可能なルミナンス値のフル・レンジをカバーするが、他の実施形態では、境界値のレンジはずっと小さくてもよい。たとえば、時刻tにおける入力フレームについての閾値を計算することは、以前に、たとえば時刻t−1に計算された閾値を考慮に入れてもよい。よって、前の閾値を中心とするより小さな範囲(たとえば、Cが定数であるとして(th(i)−C,th(i)+C))内のみを探索する。
【0063】
アルゴリズム2を与えられると、いくつかの実施形態では、同様のアプローチを使って、ピクチャー・フレームのルーマ・レンジを、追加的な閾値を使ってルミナンス・レンジの追加的なパーティションに細分してもよい。ある例示的な実施形態では、所与のルミナンス・レンジ(A,B)を二つまたは三つのルミナンス・サブレンジに細分するために、次のアルゴリズム(アルゴリズム3)が使用されてもよい。
【0064】
アルゴリズム3 − 三つのルーマ・サブレンジについての閾値決定(N=3)
//N=2について閾値を決定する
TH*=Partition_Function(A,B,step)
D=D(TH*) //二つのパーティションを使って全体的な歪みを計算
//低バンドでさらなるパーティションを試す
TH_L*=Partition_Function(A,TH*,step)
DL=D(TH_L*) //三つのパーティションを使って全体的な歪みを計算
//高バンドでさらなるパーティションを試す
TH_H*=Partition_Function(TH*,B,step)
DH=D(TH_H*) //三つのパーティションを使って全体的な歪みを計算
If( (DL<DH) &&(DL<D) )
低バンドのパーティションを選択
th[]={A,TH_L*,TH*,B}
elseif( (DH<DL) && (DH<D) )
高バンドのパーティションを選択
th[]={A,TH*,TH_H*,B}
else
二つのパーティションのままとする
th[]={A,TH*,B]
end
。
【0065】
アルゴリズム2および3によって計算された閾値はエンコーダ(100)およびデコーダ(200)の両方においてアルゴリズム1に適用されてもよい。ある実施形態では、計算された閾値はメタデータを使ってエンコーダ(100)からデコーダ(200)に伝送されてもよい。
【0066】
先述したように、インターリーブ解除器(350)および(460)はインターリーブ解除およびアップサンプリングの機能を組み合わせてもよい。画像処理の分野の当業者は、アップサンプラー(150)および(126)の改善された設計のためのここで論じたルーマ・レンジ駆動の方法が、インターレース器(350)および(460)におけるアップサンプラーの設計においても適用されうることを理解するであろう。
【0067】
〈適応的な残差処理〉
図1および
図3に描かれるように、向上層(EL)において、残差信号(167)は、ELストリーム(162)を生成するようELエンコーダ(160)によって圧縮される前に、非線形量子化器(NLQ)(155)によって処理されてもよい。一般性を失うことなく、
図5は、本発明のある実施形態に基づく、NLQ(155)についての例示的な入力‐出力関係を描いている。
【0068】
図5に描かれるように、(−X
max,X
max)は関心のあるフレームまたはフレーム領域において符号化されるべき残差ピクセルx(167)のピクセル値のレンジを表わすとする。Levelは量子化器のそれぞれの側における利用可能な符号語の数を表わすとする(たとえば、x≧0についてLevel=128)。すると、正の閾値Tを与えられて、
【数11】
とする。すると、入力残差xを与えられると、xをレンジ(−X
max,X
max)内にクリッピングした後、
図5の量子化動作は次のように表現されうる
【数12】
ここで、Q(x)は量子化された出力を表わし、SLは(T,X
max)内でのQ(x)の傾きを表わし、Mは残差x=0のときの出力符号語を表わすoffset〔オフセット〕値を表わす。閾値Tは比較的小さな数であり、いくつかの実施形態ではT=0である。
【0069】
パラメータT、M、X
maxおよびSLは、残差信号xの各色成分について別個に定義されてもよく、メタデータを使って受領器に通信されてもよい。いくつかの実施形態では、NLQ量子化パラメータの一つまたは複数はフレーム全体、フレームの一つまたは複数のパーティションもしくは部分領域または複数フレームの群(たとえばシーン)について定義されてもよい。
【0070】
そのような量子化器を与えられると、受領器(たとえば(200))上で、量子化解除プロセス(たとえばNLDQ(220))は次のように表現されうる
【数13】
R
cmpは受領された(デコードされた)残差(またはEL信号(212))を表わし、^付きのR
cmpは量子化解除された出力(222)を表わし、これもたとえば範囲
【数14】
内に制限されていてもよい。
【0071】
実験結果は、NLQ(155)のパラメータの適応的な設定と組み合わせた残差データ(167)の適正な前処理が、ELストリームのより効率的な符号化を与え、よって低減された符号化アーチファクトおよびよりよい全体的な画像品質につながりうることを示した。本節では、三つの残差前処理アルゴリズムが次に記述される。
【0072】
〈標準偏差メトリックを使った残差の前置量子化(pre-quantization)〉
残差信号(167)の適正でない量子化および符号化は、特に比較的低いビットレート(たとえば0.5Mbits/s)でELストリームを符号化するとき、デコードされた信号(232)におけるブロック・アーチファクトを生じることがある。ある実施形態では、こうしたアーチファクトは、比較的「なめらかな」領域に位置されていると知覚されるある種の残差値を適応的に前置量子化する(pre-quantize)ことによって軽減されうる。本発明のある実施形態に基づくそのようなプロセスの例が
図6Aに描かれている。ここで、限定するわけではないが、各残差ピクセルのまわりの長方形のピクセル領域のなめらかさの測定は、その領域中のピクセルの標準偏差を計算することに基づく。
【0073】
r
fiはf番目のフレームのi番目の残差ピクセルを表わすとする。このピクセルは、n
fiと記されるW
σ×W
σのピクセル領域(たとえばW
σ=15)の中心にあるとする。すると、ステップ(602)において、このピクセルについての標準偏差σ
fiは次のように決定される。
【0074】
【数15】
閾値T
σを与えられて、ステップ(606)では、σ
fi<T
σであれば、残差ピクセルr
fiは所定の値(たとえば0)に設定されてもよい。閾値T
σは固定されていてもよく、あるいはある好ましい実施形態では、残差フレーム特性および全体的なビット・レート要求に依存して適応的に決定されてもよい。たとえば、P
fはf番目のフレームにおけるピクセルの総数を表わすとする。σ
fiはステップ(602)における計算された標準偏差値を表わすとする。ステップ(604)では、T
σは次のように決定されてもよい:
(a)σ
fiを降順にソートして、ソートされた
【数16】
リストを生成する
(b)すると、T
σは
【数17】
ソートされたリストにおけるk*P
f
番目の値である。ここで、kは範囲(0.0から1.0)において定義される。たとえば、k=0.25について、1920×1080のフレームを与えられると、T
σは上記ソートされたリストにおける518,400番目の標準偏差値の値に対応する。
【0075】
なめらかさを計算する代替的な方法は、W
σ×W
σピクセルの平均または分散を計算することまたは各ピクセルのまわりの領域のエッジ・マップに基づくメトリックを計算することまたは当技術分野において既知の他の何らかのなめらかさ検出および決定アルゴリズムを含んでいてもよい。
【0076】
〈残差末尾境界調節〉
X
f+がフレームfにおける最大の正の残差値を表わし、X
f-がフレームfにおける最小の負の残差値の絶対値を表わすとする。すると、
X
f+=max{r
fi| i=0,…,P
f−1}
X
f-=|min{r
fi| i=0,…,P
f−1}|
となる。
【0077】
図5に描かれるように、量子化器の入力境界はX
f+およびX
f-を使って決定されることができる(たとえばX
max=X
f+)。しかしながら、実験結果によれば、残差値は釣り鐘状の分布をもち、典型的にはX
f+またはX
f-のいずれかに近い各フレーム中のピクセルは非常に少数であることが示されている。先述したように、
図5に描かれる量子化器について、量子化きざみはX
max/Levelに比例する。固定数(たとえばLevelの値)の符号語については、量子化に起因する歪みはX
maxの値にじかに比例する。よって、より小さなX
maxが好ましい。ある実施形態では、X
f+またはX
f-に従ってX
maxを決定する代わりに、新しい、より小さな範囲[Th
f-,Th
f+]が決定される。NLQ(155)を適用する前に、残差ピクセル値は新しい範囲[Th
f-,Th
f+]内に収まるよう制約される(またはクリッピングされる)。ここで、フレームfについて、Th
f+は正の残差についての境界を表わし、Th
f-は負の残差についての境界を表わす。すなわち、
r
fi=clip3(r
fi,Th
f-,Th
f+)
である。ここで、clip3()関数は、Th
f+より大きな残差ピクセル値はTh
f+にクリッピングされ、Th
f-より小さな残差ピクセル値はTh
f-にクリッピングされることを表わす。
【0078】
NLQプロセスについてのより小さな入力レンジは量子化に起因するより小さな誤差を与えるが、残差信号の制約されないクリッピングは知覚できるアーチファクトを与えることがある。よって、残差信号の特性に応じて新しいレンジの選択を適応する必要がある。ある実施形態では、これら二つの閾値は、残差ピクセル値の観察される接続性(または疎である度合い)に基づいて適応的に決定される。すなわち、非常に大きな値をもつ孤立した残差ピクセルは全体的な品質に対する影響は最小限でクリッピングされてもよいが、接続された残差ピクセルのピクセル値は適正に符号化されるべきである。本発明のある実施形態に基づく、そのような境界決定プロセスの例示的な実装は
図6Bにおいてプロセス(650)によって描かれている。
【0079】
プロセス(650)は、Th以上の残差ピクセル値が疎に接続されていると考えられ、よってクリッピングされることができるという条件を満たす閾値Thを計算する。プロセス(650)は、入力残差値に依存してTh
f-またはTh
f+境界のいずれかを計算するために使われてもよい。たとえば、Th
f+=Thを決定するためには、本プロセスは、たとえばレンジ(0,X
f+)内の正の残差ピクセル値のみを考える。
【0080】
【数18】
Th
f-=Thを決定するためには、本プロセスは、たとえばレンジ(0,X
f-)内の負の残差ピクセル値の絶対値のみを考える。
【0081】
【数19】
ステップ(610)では、本プロセスは初期値を閾値Thに設定することによって始まる。よって、r
fiのもとの境界を与えられて(たとえば、Th_L=0およびTh_H=X
f+またはTh_H=X
f-)、ある例示的な実施形態では、初期閾値が既知のレンジの中央の値に設定されてもよい。たとえば、
Th=(Th_H+Th_L)/2
となる。
【0082】
閾値Thを与えられて、ステップ(612)では、二値マップM
fが生成される。ここで、二値マップの要素は
m
fi=(R
fi≧Th)
M
f(i)=m
fi
として計算される。
【0083】
M
fを与えられて、ステップ(614)において、各二値ピクセルの接続性を決定できる。たとえば、MATLABでは、近傍接続性(たとえば4ピクセルまたは8ピクセル接続された近傍)は、関数bwconncompを使って計算できる。NC
f(i)が二値画像M
fにおける各ピクセルの近傍ピクセルの数を表わすとする。ステップ(618)では、ピクセルの接続性が所定の接続性閾値T
cc(たとえばT
cc=5ピクセル)を超える場合には該ピクセルはクリッピングされないよう、閾値Thが調節されてもよい。たとえば、すべてのピクセルにわたる最大ピクセル接続性が所定の接続性閾値T
ccを超える場合、閾値Thは増加させられてもよく、そうでない場合には減少させられてもよい。たとえば、二分探索を使って、
if(max{NC
f(i)}≧T
cc) //各ピクセルについての最大接続性がT
ccを超える
Th_L=Th;
else
Th_H=Th;
Th_old=Th:
Th=(TH_H+Th_L)/2;
。
【0084】
計算量を減らすために、ある実施形態では、本プロセスは収束試験ステップ(620)を含んでいてもよい。たとえば、収束ステップ(620)は、前の(または古い)閾値と新しい閾値との間の差を計算してもよい。それらの差が所定の収束閾値より大きい場合には、プロセスは再びステップ(612)から、新たな閾値を用いて継続される。そうでない場合には、プロセスは終了し、使用されるべき最終的な境界を出力する(たとえば、Th
f+=Th)。
【0085】
〈シーンに基づく非線形量子化〉
先に論じたように、いくつかの実施形態では、非線形量子化(155)は以下のパラメータ:X
max、offset(たとえばM)およびLevelを使って表現されてもよい(
図5に関係した議論も参照)。いくつかの実施形態では、これらのパラメータを、フレームのシーケンス、たとえばシーンにおける残差ピクセル特性を使って決定することが有益であることがある。
【0086】
F個のフレームのシーケンスについてのX
f+およびX
f-の値を与えられて、
X
+=max{X
f+|f=1,…,F}
X
-=max{X
f-|f=1,…,F}
とする。
【0087】
すると、非線形量子化器のパラメータは、シーン全体について次のように設定されてもよい。
【0088】
【数20】
ここで、EL_bitdepthはELエンコーダ(160)のビット深さを表わし(たとえばEL_bitdepth=8)、Δは小さな正の値(たとえばΔ=0.1)を表わす。ある実施形態では、クロマ成分について、量子化レベルの数は次式を使って決定されてもよい。
【0089】
【数21】
もう一つの実施形態では、X
f+およびX
f-の値は、先に計算された対応するTh
f+およびTh
f-の値で置き換えられてもよい。
【0090】
〈例示的なコンピュータ・システム実装〉
本発明の実施形態は、コンピュータ・システム、電子回路およびコンポーネントにおいて構成されたシステム、マイクロコントローラ、フィールド・プログラム可能なゲート・アレイ(FPGA)または他の構成設定可能もしくはプログラム可能な論理デバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)のような集積回路(IC)装置および/またはそのようなシステム、デバイスまたはコンポーネントの一つまたは複数を含む装置を用いて実装されてもよい。コンピュータおよび/またはICは、本稿に記載したようなUHD EDR信号に関係する命令を実行、制御または執行してもよい。コンピュータおよび/またはICは、本稿に記載したようなUHD EDR信号の符号化に関係する多様なパラメータまたは値の任意のものを計算してもよい。エンコードおよびデコード実施形態は、ハードウェア、ソフトウェア、ファームウェアおよびそれらのさまざまな組み合わせにおいて実装されうる。
【0091】
本発明のある種の実装は、プロセッサに本発明の方法を実行させるソフトウェア命令を実行するコンピュータ・プロセッサを有する。たとえば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどにおける一つまたは複数のプロセッサが、該プロセッサにとってアクセス可能なプログラム・メモリ中のソフトウェア命令を実行することによって、上記に記載したようなUHD EDR信号の符号化に関係する方法を実装してもよい。本発明は、プログラム・プロダクトの形で提供されてもよい。プログラム・プロダクトは、データ・プロセッサによって実行されたときに該データ・プロセッサに本発明の方法を実行させる命令を含むコンピュータ可読信号のセットを担持する任意の媒体を含みうる。本発明に基づくプログラム・プロダクトは、幅広い多様な形のいかなるものであってもよい。プログラム・プロダクトは、たとえば、フロッピーディスケット、ハードディスクドライブを含む磁気データ記憶媒体、CD-ROM、DVDを含む光データ記憶媒体、ROM、フラッシュRAMを含む電子データ記憶媒体などのような物理的な媒体であってもよい。プログラム・プロダクト上のコンピュータ可読信号は任意的に圧縮または暗号化されていてもよい。
【0092】
上記でコンポーネント(たとえば、ソフトウェア・モジュール、プロセッサ、組立体、装置、回路など)が言及されるとき、特に断わりのない限り、そのコンポーネントへの言及(「手段」への言及を含む)は、本発明の例示した実施例における機能を実行する開示される構造と構造的に等価ではないコンポーネントも含め、記載されるコンポーネントの機能を実行する(たとえば機能的に等価な)任意のコンポーネントをそのコンポーネントの等価物として含むと解釈されるべきである。
【0093】
〈等価物、拡張、代替その他〉
このように、UHD EDR信号の後方互換な符号化および復号に関係する例示的な実施形態が記載されている。以上の明細書では、本発明の諸実施形態について、実装によって変わりうる数多くの個別的詳細に言及しつつ述べてきた。このように、何が本発明であるか、何が出願人によって本発明であると意図されているかの唯一にして排他的な指標は、この出願に対して付与される特許の請求項の、その後の訂正があればそれも含めてかかる請求項が特許された特定の形のものである。かかる請求項に含まれる用語について本稿で明示的に記載される定義があったとすればそれは請求項において使用される当該用語の意味を支配する。よって、請求項に明示的に記載されていない限定、要素、属性、特徴、利点もしくは特性は、いかなる仕方であれかかる請求項の範囲を限定すべきではない。よって、明細書および図面は制約する意味ではなく例示的な意味で見なされるべきものである。
いくつかの態様を記載しておく。
〔態様1〕
後方互換な層構成にされたストリームにおいて入力ビデオ・データをエンコードする方法であって:
第一の空間解像度および第一のダイナミックレンジをもつ第一の信号にアクセスする段階と;
第二の空間解像度および第二のダイナミックレンジをもつ第二の信号にアクセスする段階であって、前記第二のダイナミックレンジは前記第一のダイナミックレンジより低い、段階と;
前記第二の信号に応答して、プロセッサにより、ある好ましい符号化カラー・フォーマットをもつ基本層信号を生成する段階と;
前記第一の信号に応答して、前記プロセッサにより、前記第二の空間解像度、前記第一のダイナミックレンジおよび前記好ましい符号化カラー・フォーマットをもつ参照予測信号を生成する段階と;
前記参照予測信号のルーマ・ピクセル値および前記基本層信号のルーマ・ピクセル値に応答してルーマ予測器のためのルーマ予測係数を計算する段階と;
前記参照予測信号のルーマおよびクロマ・ピクセル値および前記基本層信号のルーマおよびクロマ・ピクセル値両方に応答してクロマ予測器のためのクロマ予測係数を計算する段階と;
前記基本層信号および前記ルーマおよびクロマ予測係数に応答して、前記ルーマ予測器および前記クロマ予測器を使って前記第一のダイナミックレンジをもつ予測された信号を生成する段階と;
前記第一の信号および前記予測された信号に応答して残差信号を生成する段階と;
前記基本層信号に応答して基本層エンコーダを使って符号化された基本層ストリームを生成する段階と;
前記残差信号に応答して向上層エンコーダを使って符号化された向上層ストリームを生成する段階とを含む、
方法。
〔態様2〕
前記第一の空間解像度が超高精細度(UHD)解像度であり、前記第二の空間解像度が高精細度(HD)空間解像度である、態様1記載の方法。
〔態様3〕
前記第一のダイナミックレンジは高または向上ダイナミックレンジであり、前記第二のダイナミックレンジは標準ダイナミックレンジである、態様1記載の方法。
〔態様4〕
前記好ましいカラー・フォーマットがYCbCr 4:2:0を含む、態様1記載の方法。
〔態様5〕
前記ルーマ予測器が、予測される信号のルーマ成分のピクセル値が入力信号のルーマ・ピクセル値のみに基づいて予測される、多項式予測器を含む、態様1記載の方法。
〔態様6〕
前記クロマ予測器が、予測される信号のクロマ成分のピクセル値が入力信号のルーマおよびクロマ値の両方に基づいて予測される複数色チャネル多重回帰(MMR)予測器を含む、態様1記載の方法。
〔態様7〕
前記符号化された向上層ストリームを生成する前に、前記残差信号を非線形量子化器によって処理する段階をさらに含む、態様1記載の方法。
〔態様8〕
前記ルーマ予測係数および前記クロマ予測係数に応答してメタデータを生成し、該メタデータをデコーダに伝送することをさらに含む、態様1記載の方法。
〔態様9〕
層構成にされたストリームをデコードする方法であって:
符号化されたビットストリームを受領する段階であって、前記符号化されたビットストリームは、第一の空間解像度および第一のダイナミックレンジをもつ符号化された向上層(EL)ストリームおよび第二の空間解像度および第二のダイナミックレンジをもつ符号化された基本層(BL)ストリームを含んでおり、前記第一のダイナミックレンジは前記第二のダイナミックレンジより高い、段階と;
前記符号化されたBLストリームを、BLデコーダを使ってデコードして、デコードされたBL信号を生成する段階と;
前記デコードされたBL信号に応答して、前記第一のダイナミックレンジをもつ予測された信号を生成する段階であって、前記予測された信号のルーマ・ピクセル値は前記デコードされたBL信号のルーマ・ピクセル値のみに基づいて予測され、前記予測された信号の少なくとも一つのクロマ成分のクロマ・ピクセル値は前記デコードされたBL信号の前記ルーマおよびクロマ・ピクセル値両方に基づいて予測される、段階と;
前記符号化されたELストリームをELデコーダを使ってデコードしてデコードされた残差信号を生成する段階と;
前記デコードされた残差信号および前記予測された信号に応答して、前記第一の解像度および前記第一のダイナミックレンジをもつ出力信号を生成する段階とを含む、
方法。
〔態様10〕
前記出力信号を生成する前に、前記デコードされた残差信号を非線形量子化解除器によって処理する段階をさらに含む、態様9記載の方法。
〔態様11〕
前記第一の空間解像度が前記第二の空間解像度より高く、前記予測された信号を適用して前記出力信号を生成する前に、前記予測された信号はアップサンプリングされて、前記第一の空間解像度をもつアップサンプリングされた予測された信号を生成する、態様9記載の方法。
〔態様12〕
前記第一の空間解像度が超高精細度(UHD)解像度であり、前記第二の空間解像度が高精細度(HD)空間解像度である、態様11記載の方法。
〔態様13〕
前記第一のダイナミックレンジは高または向上ダイナミックレンジであり、前記第二のダイナミックレンジは標準ダイナミックレンジである、態様9記載の方法。
〔態様14〕
前記残差信号を生成する段階がさらに:
アップスケーリング・プロセスを使って前記予測された信号をアップスケーリングして、前記第一の空間解像度をもつアップスケーリングされた予測された信号を生成する段階と;
前記第一の信号および前記アップスケーリングされた予測された信号に応答して、前記残差信号を生成する段階とをさらに含む、
態様1記載の方法。
〔態様15〕
前記アップスケーリングされた予測された信号を生成する段階が:
前記予測された信号における一つまたは複数のピクセルについて、ルーマ閾値および選択基準を適用して、前記第二の信号における対応するピクセルのルミナンス・サブレンジを選択する段階と;
前記予測された信号における前記一つまたは複数のピクセルに、前記ルミナンス・サブレンジについて決定されたアップスケーリング・フィルタを適用して、前記アップスケーリングされた予測された信号についての対応するピクセル値を生成する段階とを含む、
態様14記載の方法。
〔態様16〕
前記ルーマ閾値および前記ルミナンス・サブレンジについての前記アップスケーリング・フィルタに関係した情報を、デコーダに伝達することをさらに含む、態様15記載の方法。
〔態様17〕
前記アップサンプリングされた予測された信号を生成する段階がさらに:
エンコーダから、ルミナンス・レンジをルミナンス・サブレンジに分割するルーマ閾値を受領する段階と;
前記ルミナンス・サブレンジのそれぞれについてアップスケール・フィルタ情報を前記エンコーダから受領する段階と;
前記予測された信号における一つまたは複数のピクセルについて、前記ルーマ閾値および選択基準を適用して、前記デコードされたBL信号における一つまたは複数の対応するピクセルについて、前記ルミナンス・サブレンジのうちのあるルミナンス・サブレンジを選択する段階と;
前記予測された信号における前記一つまたは複数のピクセルに、前記ルミナンス・サブレンジに対応するアップスケーリング・フィルタを適用して、前記アップスケーリングされた予測された信号についての対応するピクセル値を生成する段階とを含む、
態様11記載の方法。
〔態様18〕
前記デコードされたBL信号がインターレースされた信号を含み、前記出力信号を生成する段階がさらに:
前記予測された信号をアップサンプリングおよびインターレース解除して、前記第一の空間解像度をもつプログレッシブなアップサンプリングされた予測された信号を生成する段階と;
前記デコードされた残差信号および前記プログレッシブなアップサンプリングされた予測された信号に応答して、前記第一の解像度および前記第一のダイナミックレンジをもつ前記出力信号を生成する段階とを含む、
態様9記載の方法。
〔態様19〕
前記第一の解像度が前記第二の解像度と同じである、態様1記載の方法。
〔態様20〕
前記第一の解像度が前記第二の解像度と同じである、態様9記載の方法。
〔態様21〕
層構成にされたビデオ・エンコーダの向上層における残差ピクセル・データを前処理する方法であって:
残差ピクチャー・フレームにおける残差ピクセル値にアクセスする段階であって、前記残差ピクセル値は非線形量子化器によって処理されるものである、段階と;
前記残差ピクチャー・フレームにおける一つまたは複数の残差ピクセルについて一つまたは複数のなめらかさメトリック値を計算する段階と;
前記一つまたは複数の残差ピクセル値のうち対応するなめらかさメトリック値がある閾値より小さいものを所定の値に設定する段階とを含む、
方法。
〔態様22〕
計算された前記一つまたは複数のなめらかさメトリック値を降順にソートして、ソートされたなめらかさメトリック値のリストを生成する段階と;
前記なめらかさメトリック値の一つを、前記閾値として選択する段階とをさらに含む、
態様21記載の方法。
〔態様23〕
残差ピクセルについての前記なめらかさメトリック値が、当該残差ピクセルのまわりの領域におけるピクセル値の標準偏差に基づいて計算される、態様21記載の方法。
〔態様24〕
層構成にされたビデオ・エンコーダの向上層における残差ピクセル・データについての非線形量子化器における入力レンジ・パラメータを決定する方法であって:
残差ピクチャー・フレームにおける残差ピクセル値にアクセスする段階であって、前記残差ピクセル値は前記非線形量子化器によって処理されるものである、段階と;
a)第一の閾値を設定する段階と;
b)前記第一の閾値に基づいて前記残差ピクチャー・フレームの二値マップを生成する段階と;
c)前記二値マップ内のピクセルについて最大ピクセル接続性を計算する段階と;
d)計算された最大ピクセル接続性および接続性閾値基準に基づいて第二の閾値を生成する段階と;
e)段階b)、c)、d)を繰り返すまたは前記第二または第一の閾値を前記非線形量子化器の入力レンジ境界値として出力する段階とを含む、
方法。
〔態様25〕
段階d)がさらに:
前記計算された最大接続性が前記接続性閾値基準より大きい場合には前記第一の閾値を増大させる、あるいは前記計算された最大接続性が前記接続性閾値基準より小さい場合には前記第一の閾値を減少させることによって、前記第二の閾値を生成する段階を含む、
態様23記載の方法。
〔態様26〕
前記第一の閾値と前記第二の閾値との間の差がある収束閾値より大きいと判定される場合に、段階b)、c)、d)が繰り返される、態様23記載の方法。
〔態様27〕
プロセッサを有し、態様1、9または24のうちいずれか一項記載の方法を実行するよう構成されている装置。
〔態様28〕
態様1、9または24のうちいずれか一項記載の方法を実行するためのコンピュータ実行可能命令が記憶されている、非一時的なコンピュータ可読記憶媒体。