(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024112926
(43)【公開日】2024-08-21
(54)【発明の名称】符号化及び復号化方法並びに装置
(51)【国際特許分類】
H04N 19/597 20140101AFI20240814BHJP
【FI】
H04N19/597
【審査請求】有
【請求項の数】16
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024083084
(22)【出願日】2024-05-22
(62)【分割の表示】P 2022538281の分割
【原出願日】2020-11-30
(31)【優先権主張番号】19306707.1
(32)【優先日】2019-12-19
(33)【優先権主張国・地域又は機関】EP
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.HDMI
2.BLUETOOTH
(71)【出願人】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ドイエン、ディディエ
(72)【発明者】
【氏名】ガルピン、フランク
(72)【発明者】
【氏名】ボワソン、ギヨーム
(57)【要約】 (修正有)
【課題】MVD(マルチビュー+深度)データのビデオ符号化又は復号化のための方法及び装置を提供する。
【解決手段】復号化方法は、マルチビュービデオコンテンツの少なくとも1つの基準ビュー及び現在のビューを含むビューのセットに関するビューパラメータを取得すること及びビューのセットの基準ビューと現在のビューの少なくとも1つの対について、基準ビューのピクセルに順投影方法を適用して中間予測画像を生成して、基準ビューのカメラ座標系から現在のビューのカメラ座標系にこれらのピクセルを投影することを含む。予測画像は、画像データを再構成することを可能にする情報を含む。方法はまた、現在のビューの再構成画像のバッファ内の少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶すること及び少なくとも1つの最終予測画像を含むバッファに記憶された画像から現在のビューの現在の画像を再構成することを含む。
【選択図】
図14A
【特許請求の範囲】
【請求項1】
復号化のための方法であって、
マルチビュービデオコンテンツの少なくとも1つの基準ビュー及び現在のビューを含むビューのセットに関するビューパラメータを取得することであって、各ビューがテクスチャ層及び深度層を含む、こと(140)と、
前記ビューのセットの基準ビューと前記現在のビューの少なくとも1つの対について、前記基準ビューのピクセルに順投影方法を適用して中間予測画像を生成して、前記基準ビューのカメラ座標系から前記現在のビューのカメラ座標系にこれらのピクセルを投影することであって、前記予測画像が、画像データを再構成することを可能にする情報を含む、こと(141)と、
前記現在のビューの再構成画像のバッファ内の少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶すること(143)と、
前記バッファに記憶された前記画像から前記現在のビューの現在の画像を再構成することであって、前記バッファが、前記少なくとも1つの最終予測画像を含む、こと(144)と、を含む、方法。
【請求項2】
符号化のための方法であって、
マルチビュービデオコンテンツの少なくとも1つの基準ビュー及び現在のビューを含むビューのセットに関するビューパラメータを取得することであって、各ビューがテクスチャ層及び深度層を含む、こと(140)と、
前記ビューのセットの基準ビューと前記現在のビューの少なくとも1つの対について、前記基準ビューのピクセルに順投影方法を適用して中間予測画像を生成して、前記基準ビューのカメラ座標系から前記現在のビューのカメラ座標系にこれらのピクセルを投影することであって、前記予測画像が、画像データを再構成することを可能にする情報を含む、こと(141)と、
前記現在のビューの再構成画像のバッファ内の少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶すること(143)と、
前記バッファに記憶された前記画像から前記現在のビューの現在の画像を再構成することであって、前記バッファが、前記少なくとも1つの最終予測画像を含む、こと(144)と、を含む、方法。
【請求項3】
画像データを再構成することを可能にする前記情報が、テクスチャデータ及び深度データを含む、請求項1又は2に記載の方法。
【請求項4】
前記順投影方法が、
前記基準ビューの前記カメラ座標系から世界座標系への前記基準ビューの現在のピクセルへの逆投影を適用して、逆投影ピクセルを取得することであって、前記逆投影が、基準カメラと呼ばれる前記基準ビューを取得するカメラのポーズ行列、前記基準カメラの逆内部行列、及び前記現在のピクセルに関連付けられた深度値を使用する、こと(130)と、
前記逆投影ピクセルを前記現在のビューの前記座標系に投影して、現在のカメラと呼ばれる前記現在のビューを取得するカメラの内部行列及び外部行列を使用して順投影ピクセルを取得することであって、各行列が前記ビューパラメータから取得される、こと(131)と、
前記取得された順投影ピクセルが、前記現在のカメラのピクセルのグリッド上のピクセルに対応していない場合、前記順投影ピクセルに最も近いピクセルの前記グリッドのピクセルを選択して、補正された順投影ピクセルを取得すること(132)と、を含む、請求項3に記載の方法。
【請求項5】
前記方法が、各中間投影画像に、又は前記最終投影画像内に分離された欠落ピクセルを充填することを含む、請求項3又は4に記載の方法。
【請求項6】
画像データを再構成することを可能にする前記情報が、動き情報を含む、請求項1又は2に記載の方法。
【請求項7】
前記順投影方法が、
前記基準ビューの前記カメラ座標系から世界座標系への前記基準ビューの現在のピクセルへの逆投影を適用して、逆投影ピクセルを取得することであって、前記逆投影が、基準カメラと呼ばれる前記基準ビューを取得するカメラのポーズ行列、前記基準カメラの逆内部行列、及び前記現在のピクセルに関連付けられた深度値を使用する、こと(130)と、
前記逆投影ピクセルを前記現在のビューの前記座標系に投影して、現在のカメラと呼ばれる前記現在のビューを取得するカメラの内部行列及び外部行列を使用して順投影ピクセルを取得することであって、各行列が前記ビューパラメータから取得される、こと(131)と、
前記取得された順投影ピクセルが、前記現在のカメラのピクセルのグリッド上のピクセルに対応していない場合、前記順投影ピクセルに最も近いピクセルの前記グリッドのピクセルを選択して、補正された順投影ピクセルを取得すること(132)と、
前記順投影ピクセル又は前記補正された順投影ピクセルと前記基準ビューの前記現在のピクセルとの間の変位を表す動きベクトルを計算すること(133)と、を含む、請求項6に記載の方法。
【請求項8】
前記方法が、各中間投影画像に、又は前記最終投影画像内に分離された欠落動き情報を充填することを含む、請求項6又は7に記載の方法。
【請求項9】
少なくとも1つの最終投影画像が、中間投影画像である、請求項1~8のいずれか一項に記載の方法。
【請求項10】
少なくとも1つの最終投影画像が、少なくとも2つの中間予測画像の集約から生じる、請求項1~8のいずれか一項に記載の方法。
【請求項11】
前記方法が、基準ビューと現在のビューの少なくとも1つの対に関して、前記順投影方法を前記基準ビューのピクセルに適用する前に、前記基準ビューの前記深度層をサブサンプリングすることを含む、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記方法が、2つの一方向予測子ブロックの加重和として計算された双方向予測子ブロックから前記現在の画像の現在のブロックを再構成することであって、各一方向予測子ブロックが、前記現在のビューの再構成画像の前記バッファに記憶された1つの画像から抽出され、前記一方向予測子ブロックの少なくとも1つが、前記バッファに記憶された最終予測画像から抽出される、ことを含む、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記加重和に使用される少なくとも1つの重みが、一方向予測子ブロックのピクセルの信頼度の関数で修正される、請求項12に記載の方法。
【請求項14】
請求項1に従属する場合、各ビューの前記ビューパラメータが、SEIメッセージによって提供される、請求項3~13のいずれか1項に記載の方法。
【請求項15】
現在のビューの各最終予測画像を再構成することを可能にする情報を表すシンタックス要素が、スライスヘッダ又はシーケンシングヘッダ内、又は画像ヘッダ、又は同期点若しくは画像のレベルで含まれる、先行する請求項のいずれか一項に記載の方法。
【請求項16】
前記マルチビュービデオコンテンツが、符号化ビデオストリーム内で符号化される、又は符号化ビデオストリームから復号化され、VSPモードと呼ばれる、現在のビューが最終予測画像を使用して予測モードに従って符号化されて、前記現在のブロックに関して予測ブロックを生成するとき、前記VSPモードによる前記現在のブロックの前記符号化が、前記現在のブロックに対応する前記符号化ビデオストリームの一部内のフラグによって明示的にシグナリングされる、又は前記現在のビューの再構成画像の前記バッファに記憶された再構成画像のリスト内の最終予測画像のインデックスを表すシンタックス要素によって暗黙的にシグナリングされる、請求項1又は請求項3から15のいずれか一項に記載の復号化のための方法、又は請求項2から15のいずれか一項に記載の符号化のための方法。
【請求項17】
前記現在のブロックに対応する前記符号化ビデオストリームの一部が、動き情報を表すシンタックス要素を含む、請求項16に記載の復号化のための方法又は請求項16に記載の符号化のための方法。
【請求項18】
前記動き情報が、動きベクトル精密化及び/又は前記現在のビューの再構成画像の前記バッファに記憶された最終予測画像のリスト内の最終予測画像のインデックスを表す、請求項17に記載の復号化のための方法、又は請求項17に記載の符号化のための方法。
【請求項19】
マージモード又はスキップモードで符号化される現在のブロックが、VSPモードで符号化されたブロックから符号化パラメータを受け継ぐとき、前記現在のブロックがVSPパラメータも受け継ぐ、請求項1又は請求項3~18のいずれか一項による復号化のための方法、又は請求項2から18のいずれかに記載の符号化のための方法。
【請求項20】
復号化のためのデバイスであって、
マルチビュービデオコンテンツの少なくとも1つの基準ビュー及び現在のビューを含むビューのセットに関するビューパラメータを取得する手段であって、各ビューがテクスチャ層及び深度層を含む、手段(140)と、
前記ビューのセットの基準ビューと前記現在のビューの少なくとも1つの対について、前記基準ビューのピクセルに順投影方法を適用して中間予測画像を生成して、前記基準ビューのカメラ座標系から前記現在のビューのカメラ座標系にこれらのピクセルを投影する手段であって、前記予測画像が、画像データを再構成することを可能にする情報を含む、手段(141)と、
前記現在のビューの再構成画像のバッファ内の少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶する手段(143)と、
前記バッファに記憶された前記画像から前記現在のビューの現在の画像を再構成する手段であって、前記バッファが、前記少なくとも1つの最終予測画像を含む、手段(144)と、を含む、デバイス。
【請求項21】
復号化のためのデバイスであって、
マルチビュービデオコンテンツの少なくとも1つの基準ビュー及び現在のビューを含むビューのセットに関するビューパラメータを取得することであって、各ビューがテクスチャ層及び深度層を含む、手段(140)と、
前記ビューのセットの基準ビューと前記現在のビューの少なくとも1つの対について、前記基準ビューのピクセルに順投影方法を適用して中間予測画像を生成して、前記基準ビューのカメラ座標系から前記現在のビューのカメラ座標系にこれらのピクセルを投影する手段であって、前記予測画像が、画像データを再構成することを可能にする情報を含む、手段(141)と、
前記現在のビューの再構成画像のバッファ内の少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶する手段(143)と、
前記バッファに記憶された前記画像から前記現在のビューの現在の画像を再構成する手段であって、前記バッファが、前記少なくとも1つの最終予測画像を含む、手段(144)と、を含む、デバイス。
【請求項22】
請求項20又は21に記載のデバイス又は請求項20及び21に記載のデバイスを備える、装置。
【請求項23】
請求項2~19のいずれか一項に記載の符号化のための方法に従って、又は請求項21に記載の符号化のためのデバイスによって、又は請求項22の装置によって生成されたデータを含む信号。
【請求項24】
請求項2~19のいずれか1項に記載の方法を実施するためのプログラムコード命令を含む、コンピュータプログラム。
【請求項25】
請求項2~19のいずれか1項に記載の方法を実施するためのプログラムコード命令を記憶する情報記憶手段。
【発明の詳細な説明】
【技術分野】
【0001】
本実施形態のうちの少なくとも1つは、概して、ビデオ符号化若しくは復号化のための方法及び装置に関し、より具体的には、MVD(マルチビュー+深度)データのビデオ符号化又は復号化のための方法及び装置に関する。
【背景技術】
【0002】
マルチビュー画像又はビデオコンテンツ(複数のカメラからの複数のビュー)の圧縮は、画像及びビデオ専門家によって数年間調査されている。2つのタイプのコンテンツは、一般に、同期画像を含む、マルチビュー(MV)コンテンツと呼ばれ、各画像が、同じシーン上の異なる視点に対応するコンテンツと、MVコンテンツがマルチビュー+深度コンテンツ(MVD)と呼ばれるシーンの深度情報によって補完されるコンテンツである。
【0003】
2015年、マルチビューコンテンツの符号化効率を改善するために、HEVCの2つの延長(ISO/IEC 23008-2-MPEG-H Part 2、高効率ビデオ符号化/ITU-T H.265)が採用された:
・MVコンテンツのためのMV-HEVC、
・MVDコンテンツのための3D-HEVC。
【0004】
MV-HEVCでは、HEVC空間イントラ画像予測(すなわち、イントラ予測)及び時間的インター画像予測(すなわち、インター予測)に加えて、ビュー間の類似点を利用するビュー間予測モードが導入された。第1のビューは、基準として選択され、少なくとも第2のビューは、視差ベースの動き予測を使用して、この基準ビューに関して符号化される。
図11は、時間的及びビュー間の両方の方向におけるMVコンテンツの画像間の相互依存性の例を示す。ビューView0は、HEVCとの後方互換性を維持するためのビュー間予測なしに復号化可能な基準ビューを表す。時刻T0において、ビューView1及びView2は、全てのイントラ画像(I画像)として符号化されず、T0におけるビューView0の再構成画像を予測のための基準画像として使用して符号化/復号化される。時刻T1のビューView1の画像は、ビューView1の画像を基準画像として使用するだけでなく、時刻T1のビューView0の画像も使用して符号化/復号化される。
【0005】
MV-HEVCが試験されたコンテンツは、ステレオコンテンツ又はマルチビューコンテンツのみであるが、位置合わせされたカメラによって取得された「3」ビューのみを用いている。しかし、このMV-HEVCアプローチに従うと、ビュー間予測は、隣接するビュー間の視差推定に基づいて、隣接するビューとの冗長性を利用しているだけである。このアプローチは、カメラアレイによって捕捉されるコンテンツに適合していない。
【0006】
3D-HEVCでは、MV-HEVCと同じアプローチが採用されているが、高密度深度情報(すなわち、各ビューのピクセル当たりの深度情報)の送信も考慮している。コンテンツは同じであるため、隣接するビューと同じビュー間アプローチが採用されている。追加の深度情報の使用を含む、ビュー間予測のより複雑な組み合わせが導入されている。
【0007】
予測モード選択の深度情報を使用するために、ビュー基本合成予測モード(VSP)が導入されている。基本VSPモードは、現在のブロックに関して、現在のブロックに隣接するブロックの深度情報に対応する視差動きベクトル(DMV)情報を使用する。深度情報は、現在のブロックの予測子としてテクスチャのブロックを基準ビューから取得するために使用される。現在のブロックの深度がテクスチャの後に復号化されるため、使用される深度情報は、既に再構成された隣接するブロックのうちの1つである。再構成された隣接ブロックの深度値は、一般に、ビュー間予測のためのサブ最適深度値とみなされる。
【0008】
改善されたVSPモードの提供を可能にする解決策を提案することが望ましい。
【発明の概要】
【0009】
第1の態様では、本実施形態のうちの1つ又は複数は復号化のための方法を提供し、方法は、
マルチビュービデオコンテンツの少なくとも1つの基準ビュー及び現在のビューを含むビューのセットに関するビューパラメータを取得することであって、各ビューがテクスチャ層及び深度層を含む、ことと、
ビューのセットの基準ビューと現在のビューの少なくとも1つの対について、基準ビューのピクセルに順投影方法を適用して中間予測画像を生成して、基準ビューのカメラ座標系から現在のビューのカメラ座標系にこれらのピクセルを投影することであって、予測画像が、画像データを再構成することを可能にする情報を含む、ことと、
現在のビューの再構成画像のバッファ内の少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶することと、
当該バッファに記憶された画像から現在のビューの現在の画像を再構成することであって、当該バッファが、当該少なくとも1つの最終予測画像を含む、ことと、を含む。
【0010】
第2の態様では、本実施形態のうちの1つ又は複数は符号化のための方法を提供し、方法は、
マルチビュービデオコンテンツの少なくとも1つの基準ビュー及び現在のビューを含むビューのセットに関するビューパラメータを取得することであって、各ビューがテクスチャ層及び深度層を含む、ことと、
ビューのセットの基準ビューと現在のビューの少なくとも1つの対について、基準ビューのピクセルに順投影方法を適用して中間予測画像を生成して、基準ビューのカメラ座標系から現在のビューのカメラ座標系にこれらのピクセルを投影することであって、予測画像が、画像データを再構成することを可能にする情報を含む、ことと、
現在のビューの再構成画像のバッファに少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶することと、
当該バッファに記憶された画像から現在のビューの現在の画像を再構成することであって、当該バッファが、少なくとも1つの最終予測画像を含む、ことと、を含む。
【0011】
第3の態様では、本実施形態のうちの1つ又は複数は復号化のためのデバイスを提供し、デバイスは、
マルチビュービデオコンテンツの少なくとも1つの基準ビュー及び現在のビューを含むビューのセットに関するビューパラメータを取得することであって、各ビューがテクスチャ層及び深度層を含む、手段と、
ビューのセットの基準ビューと現在のビューの少なくとも1つの対について、基準ビューのピクセルに順投影方法を適用して中間予測画像を生成して、基準ビューのカメラ座標系から現在のビューのカメラ座標系にこれらのピクセルを投影する手段であって、予測画像が、画像データを再構成することを可能にする情報を含む、手段と、
現在のビューの再構成画像のバッファ内の少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶する手段と、
当該バッファに記憶された画像から現在のビューの現在の画像を再構成することであって、当該バッファが、当該少なくとも1つの最終予測画像を含む、手段と、を含む。
【0012】
第4の態様では、本実施形態のうちの1つ又は複数は符号化のためのデバイスを提供し、デバイスは、
マルチビュービデオコンテンツの少なくとも1つの基準ビュー及び現在のビューを含むビューのセットに関するビューパラメータを取得することであって、各ビューがテクスチャ層及び深度層を含む、手段と、
ビューのセットの基準ビューと現在のビューの少なくとも1つの対について、基準ビューのピクセルに順投影方法を適用して中間予測画像を生成して、基準ビューのカメラ座標系から現在のビューのカメラ座標系にこれらのピクセルを投影する手段であって、予測画像が、画像データを再構成することを可能にする情報を含む、手段と、
現在のビューの再構成画像のバッファ内の少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶する手段と、
当該バッファに記憶された画像から現在のビューの現在の画像を再構成することであって、当該バッファが、当該少なくとも1つの最終予測画像を含む、手段と、を含む。
【0013】
第5の態様では、本実施形態のうちの1つ又は複数は、第3及び/又は第4の態様によるデバイスを含む装置を提供する。
【0014】
第6の態様では、本実施形態の1つ又は複数は、第2の態様による符号化のための方法に従って、又は第4の態様による符号化のためのデバイスによって生成されたデータを含む信号を提供する。
【0015】
第7の態様では、本実施形態のうちの1つ又は複数は、第1又は第2の態様による方法を実施するためのプログラムコード命令を含むコンピュータプログラムを提供する。
【0016】
第8の態様では、本実施形態のうちの1つ又は複数は、第1又は第2の態様による方法を実施するためのプログラムコード命令を記憶する情報記憶手段を提供する。
【0017】
第9の態様では、1つ又は複数の実施形態はまた、第6の態様による信号を送信又は受信するための方法及び装置を提供する。
【0018】
第10の態様では、1つ又は複数の実施形態はまた、上述の方法のうちのいずれかの少なくとも一部を実行するための命令を含むコンピュータプログラム製品を提供する。
【0019】
前述の態様のいずれかの実施形態では、画像データを再構成することを可能にする情報は、テクスチャデータ及び深度データを含む。
【0020】
前述の態様のいずれかの実施形態では、順投影方法は、
基準ビューのカメラ座標系から世界座標系への基準ビューの現在のピクセルへの逆投影を適用して、逆投影ピクセルを取得することであって、逆投影が、基準カメラと呼ばれる基準ビューを取得するカメラのポーズ行列、基準カメラの逆内部行列、及び現在のピクセルに関連付けられた深度値を使用する、ことと、
逆投影ピクセルを現在のビューの座標系に投影して、現在のカメラと呼ばれる現在のビューを取得するカメラの内部行列及び外部行列を使用して順投影ピクセルを取得することであって、各行列がビューパラメータから取得される、ことと、
取得された順投影ピクセルが、現在のカメラのピクセルのグリッド上のピクセルに対応していない場合、順投影ピクセルに最も近いピクセルの当該グリッドのピクセルを選択して、補正された順投影ピクセルを取得することと、を含む。
【0021】
前述の態様のいずれかの実施形態では、方法は、各中間投影画像内又は最終投影画像内に分離された欠落ピクセルを充填することを含む。
【0022】
前述の態様のいずれかの実施形態では、画像データを再構成することを可能にする情報は、動き情報を含む。
【0023】
前述の態様のいずれかの実施形態では、順投影方法は、
基準ビューのカメラ座標系から世界座標系への基準ビューの現在のピクセルへの逆投影を適用して、逆投影ピクセルを取得することであって、逆投影が、基準カメラと呼ばれる基準ビューを取得するカメラのポーズ行列、基準カメラの逆内部行列、及び現在のピクセルに関連付けられた深度値を使用する、ことと、
逆投影ピクセルを現在のビューの座標系に投影して、現在のカメラと呼ばれる現在のビューを取得するカメラの内部行列及び外部行列を使用して順投影ピクセルを取得することであって、各行列がビューパラメータから取得される、ことと、
取得された順投影ピクセルが、現在のカメラのピクセルのグリッド上のピクセルに対応していない場合、順投影ピクセルに最も近いピクセルの当該グリッドのピクセルを選択して、補正された順投影ピクセルを取得することと、
順投影ピクセル又は補正された順投影ピクセルと基準ビューの現在のピクセルとの間の変位を表す動きベクトルを計算することと、を含む。
【0024】
前述の態様のいずれかの実施形態では、方法は、各中間投影画像内又は最終投影画像内に分離された欠落動き情報を充填することを含む。
【0025】
前述の態様のいずれかの実施形態では、少なくとも1つの最終投影画像は、中間投影画像である。
【0026】
前述の態様のいずれかの実施形態では、少なくとも1つの最終投影画像は、少なくとも2つの中間予測画像の集約から生じる。
【0027】
前述の態様のいずれかの実施形態では、方法が、基準ビューと現在のビューの少なくとも1つの対に関して、順投影方法を基準ビューのピクセルに適用する前に、基準ビューの深度層をサブサンプリングすることを含む。
【0028】
前述の態様のいずれかの実施形態では、方法が、2つの一方向予測子ブロックの加重和として計算された双方向予測子ブロックから現在の画像の現在のブロックを再構成することであって、各一方向予測子ブロックが、現在のビューの再構成画像のバッファに記憶された1つの画像から抽出され、一方向予測子ブロックの少なくとも1つが、当該バッファに記憶された最終予測画像から抽出される、ことを含む。
【0029】
前述の態様のいずれかの実施形態では、加重和に使用される少なくとも1つの重みが、一方向予測子ブロックのピクセルの信頼度の関数で修正される。
【0030】
前述の態様のいずれかの実施形態では、各ビューのビューパラメータは、SEIメッセージによって提供される。
【0031】
前述の態様のいずれかの実施形態では、現在のビューの各最終予測画像を再構成することを可能にする情報を表すシンタックス要素が、スライスヘッダ又はシーケンシングヘッダ内、又は画像ヘッダ、又は同期点若しくは画像のレベルで含まれる。
【0032】
前述の態様のいずれかの実施形態では、マルチビュービデオコンテンツが、符号化ビデオストリーム内で符号化される、又は符号化ビデオストリームから復号化され、VSPモードと呼ばれる、現在のブロックが最終予測画像を使用して予測モードに従って符号化されて、現在のブロックに関して予測ブロックを生成するとき、VSPモードによる現在のブロックの符号化が、当該現在のブロックに対応する符号化ビデオストリームの一部内のフラグによって明示的にシグナリングされる、又は現在のビューの再構成画像のバッファに記憶された再構成画像のリスト内の最終予測画像のインデックスを表すシンタックス要素によって暗黙的にシグナリングされる。
【0033】
前述の態様のいずれかの実施形態では、当該現在のブロックに対応する符号化ビデオストリームの一部は、動き情報を表すシンタックス要素を含む。
【0034】
前述の態様のいずれかの実施形態では、動き情報が、動きベクトル精密化及び/又は現在のビューの再構成画像のバッファに記憶された最終予測画像のリスト内の最終予測画像のインデックスを表す。
【0035】
前述の態様のいずれかの実施形態では、マージモード又はスキップモードで符号化される現在のブロックが、VSPモードで符号化されたブロックから符号化パラメータを受け継ぐとき、当該現在のブロックがVSPパラメータも受け継ぐ。
【図面の簡単な説明】
【0036】
【
図1】MVDコンテンツを取得するように適合されたカメラアレイの例を概略的に示す。
【
図2】カメラアレイによって提供されるMVDコンテンツを符号化するように適合された処理モジュールを概略的に表す。
【
図3】MVDコンテンツを表す符号化ビデオストリームを復号化するように適合された処理モジュールを概略的に表す。
【
図4】様々な態様及び実施形態が実装される、符号化モジュール又は復号化モジュールを実装することができる処理モジュールのハードウェアアーキテクチャの例を概略的に示す。
【
図5】様々な態様及び実施形態が実装されているシステムの一例のブロック図を示す。
【
図7】1つのビューを表す符号化ビデオストリームを符号化するための方法の例を概略的に示す。
【
図8】1つのビューを表す符号化ビデオストリームを復号化するための方法の例を概略的に示す。
【
図9】マルチビューコンテンツを表す符号化ビデオストリームを符号化するための方法の例を概略的に示す。
【
図10】マルチビューコンテンツを表す符号化ビデオストリームを復号化するための方法の例を概略的に示す。
【
図11】MVコンテンツのビュー間依存性の例を概略的に示す。
【
図12】世界座標系とカメラ座標系との間の概略的な遷移を示す。
【
図13A】予測画像生成プロセスで使用される順投影方法の例を概略的に示す。
【
図14A】予測画像生成プロセスの第1の実施形態を示す。
【
図14B】予測画像生成プロセスの第2の実施形態の詳細を示す。
【
図15】予測画像生成プロセスの第3の実施形態を示す。
【
図16】予測画像生成プロセスの第4の実施形態を示す。
【
図17】ビュー間予測を使用しないビデオ圧縮方法のシンタックス解析プロセスの基本的な実施形態を概略的に示す。
【
図18】新しいVSPモードを使用したビデオ圧縮方法のシンタックス解析プロセスの第1の実施形態を概略的に示す。
【
図19】新しいVSPモードを使用したビデオ圧縮方法のシンタックス解析プロセスの第2の実施形態を概略的に示す。
【
図20】新しいVSPモードを使用したビデオ圧縮方法のシンタックス解析プロセスの第3の実施形態を概略的に示す。
【
図21】新しいVSPモードを使用したビデオ圧縮方法のシンタックス解析プロセスの第4の実施形態を概略的に示す。
【
図22A】予測画像生成プロセスの第5の実施形態を示す。
【
図22B】予測画像生成プロセスの第6の実施形態の詳細を示す。
【
図23】予測画像生成プロセスの第7の実施形態を示す。
【
図24】MV-HEVC及び3D-HEVCコーデックの典型的な符号化構造及び画像依存性を概略的に示す。
【
図25】予測画像生成プロセスの第8の実施形態を示す。
【発明を実施するための形態】
【0037】
以下の説明では、いくつかの実施形態は、ジョイントビデオエキスパートチーム(JVET)として知られるITU-T及びISO/IEC専門家らの共同作業チームによる開発下での国際基準である汎用ビデオ符号化(VVC)のコンテキストで、又はHEVC、MV-HEVC、若しくは3D-HEVCのコンテキストで開発されたツールを使用する。しかしながら、これらの実施形態は、VVC、HEVC、MV-HEVC、又は3D-HEVCに対応するビデオ符号化/復号化方法に限定されず、他のビデオ符号化/復号化方法だけでなく、MVDコンテンツに適合された他の画像符号化/復号化方法にも適用される。
【0038】
以下に記載される実施形態では、新しいVSPモードが提案される。
【0039】
以下、
図24、6、7、及び8は、いくつかの用語を紹介することを可能にする基本的な実施形態を説明する。
【0040】
図24は、MV-HEVC及び3D-HEVCコーデックの典型的な符号化構造及び画像依存性を概略的に示す。
【0041】
MV及び3D-HEVCは、層が1つのビットストリームに多重化され、互いに依存し得る多層アプローチを用いることが知られている。MV及び3D-HEVCでは、層は、特定のカメラに関連するシーンのテクスチャ、深度、又は他の補助情報を表すことができる。同じカメラに属する全ての層は、ビューとして称され、同じタイプの情報(例えば、テクスチャ又は深度)を保有する層は、通常、3Dビデオの範囲内のコンポーネントと呼ばれる。
【0042】
図24は、ビュー「0」(ベースビューとも呼ばれる)2409及びビュー1 2410の2つのビューを含む典型的な符号化構造を示す。各ビューは、2つの層を含む。ビュー0 2409は、テクスチャの画像2401及びテクスチャの画像2405から成る第1の層と、深度の画像2403及び深度の画像2407を含む第2の層とを含む。ビュー1 2410は、テクスチャの画像2402及び2406から成る第1の層と、深度の画像2404及び2408を含む第2の層とを備える。
【0043】
2つの連続した時刻が示され、設計選択によって、同じ捕捉時間又は表示時間インスタンスに関連付けられた全ての画像が1つのアクセスユニット(AU)に含まれる。画像2401、2402、2403、及び2404は、同じAU 0 2411にある。画像2405、2406、2407及び2408は、同じAU 1 2412にある。ベース層は、一般に、HEVC単層プロファイルに適合するために必要とされ、したがって、ベースビューのテクスチャコンポーネントである。
【0044】
AUのベース層画像に続く画像の層は、エンハンスメント層と称され、ベースビュー以外のビューは、エンハンスメントビューと称される。AUでは、全てのコンポーネントについて、ビューの順序が同じである必要がある。符号化の組み合わせを容易にするために、3D-HEVCでは、特定のビューの深度コンポーネントがそのテクスチャコンポーネントに直接続くことが更に必要とされる。異なる層及びAU内の画像間の依存関係の概要を
図24に示し、以下で更に論じる。
【0045】
しかしながら、MV-HEVCでは、同じビュー及びコンポーネントの画像を使用する従来の時間的画像間予測(
図24の頭字語TIIPに関連付けられた矢印で表される)を超えて、MV-HEVCは、同じAU及びコンポーネントだが異なるビュー内の画像からの予測を可能にし、以下、この予測は、ビュー間予測(
図24の頭字語IVPに関連付けられた矢印で表される矢印で表される)と称する。ビュー間予測のために、他のビューからの復号化画像を、現在の画像の基準画像として使用することができる。
【0046】
現在の画像の現在のブロックに関連付けられた動きベクトルは、同じビューの時間的基準画像に関連する場合には時間的であり得(以下TMVと称する)、又はビュー間基準画像に関連する場合には視差MVであり得る(以下DMVと称する)。MVがTMV又はDMVであるかどうかに関係なく、同じように動作する既存のブロックレベルHEVC動き補償モジュールを使用することができる。
【0047】
圧縮性能の向上のために、3D-HEVCは、新しいタイプの層間予測を可能にすることによってMV-HEVCを拡張する。
図24に示すように、新しい予測タイプは以下の通りである。
・同じコンポーネント内だが、異なるAU及び異なるビューにおける画像を参照する、時間的及びビュー間予測の組み合わせ(
図24の頭字語TII+IVPを有する矢印で表される);
・同じAU及びビュー内だが、異なるコンポーネント内の画像を参照する、コンポーネント間予測(
図24の頭字語ICPを有する矢印で表される);
・同じAU内だが、異なるビュー及びコンポーネント内の画像を参照する、コンポーネント間とビュー間予測の組み合わせ(
図24の頭字語ICIPを有する矢印で表される)。
【0048】
MV-HEVCと比較した更なる設計変更は、サンプル及び動き情報、に加えて、残差、視差、及び分割情報も予測又は推測することができることである。テクスチャ及び深度符号化ツールの詳細な概要は、文献「Overview of the Multiview and 3D Extensions of High Efficiency Video Coding, IEEE Transactions on circuits and systems for video technology、第26巻、第1号、2016年1月、G.Tech;Y.Chen;K.Muller;J-R.Ohm;A.Vetro;Y-K.Wang」で提供される。
【0049】
HEVCとVVCとの間の類似性のために、MV及び3D-HEVCの文脈において定義された圧縮ツールをVVCのコンテキストに適合させて、(深度情報の有無にかかわらず)マルチビューコンテンツを扱うことができるコーデックを取得することができるはずである。HEVCのコンテキストにおけるように、VVCのコンテキストにおいて、テクスチャ情報のみを含むマルチビューコンテンツのベース層は、VVCと完全に互換性があるはずである。
【0050】
図6、7、及び8は、マルチビューコンテンツのベース層を符号化するために使用することができる基本的な圧縮方法のいくつかの主要な特徴を想起させる。
【0051】
図6は、元のビデオ10のピクセル11の画像による分割の例を示す。ここでは、ピクセルは、マルチビューコンテンツのベース層に対応する3つの成分、すなわち輝度成分と2つのクロミナンス成分からなると考えられる。同じ分割を、マルチビューコンテンツの全ての層、すなわちテクスチャ層及び深度層に適用することができる。加えて、同じ分割を、別の数のコンポーネント又は層、例えば、4つの成分(輝度成分、2つのクロミナンス成分、及び透明性成分)を含むテクスチャ層と深度層とに適用することができる。
【0052】
画像は、複数の符号化エンティティに分割される。まず、
図6の参照番号13で示すように、画像が符号化ツリーユニット(CTU)と呼ばれるブロックのグリッドに分割される。CTUは、輝度サンプルのN×Nブロックと、クロミナンスサンプルの2つの対応するブロックとで構成される。Nは、一般に、例えば、「128」の最大値を有する2のべき乗である。第2に、画像は1つ又は複数のタイル行及びタイル列に分割することができ、タイルは画像の矩形領域をカバーするCTUのシーケンスである。いくつかのビデオ圧縮スキームによっては、タイルを1つ又は複数のブリックに分割することができ、その各々はタイル内の少なくとも1つのCTU行からなる。タイル及びブリックの概念の上には、画像の少なくとも1つのタイル又はタイルの少なくとも1つのブリックを含むことができるスライスと呼ばれる別の符号化エンティティが存在する。
【0053】
図6の例では、参照番号12で示すように、画像11は、3つのスライスS1、S2、及びS3に分割され、各スライスは複数のタイル(図示せず)を含む。
【0054】
図6の参照番号14で示すように、CTUは、符号化ユニット(CU)と呼ばれる1つ又は複数のサブブロックの階層ツリーの形態に分割され得る。CTUは、階層ツリーのルート(すなわち、親ノード)であり、複数のCU(すなわち、子ノード)に分割され得る。各CUは、より小さいCUに更に分割されていない場合は階層ツリーのリーフになり、更に分割されている場合はより小さいCU(すなわち、子ノード)の親ノードになる。異なるタイプの階層ツリーを使用することができ、ここで、CTU又はCUが4つの正方形CU又は等しいサイズに分割されている四分木であり、二分木では、CTU(CU)は、等しいサイズの「2」つの矩形CUに水平又は垂直に分割することができる。三分木では、CTU(CU)は、「3」つの矩形CUに水平又は垂直に分割することができる。
【0055】
図6の例では、CTU 14は、四分木タイプの分割を使用して、最初に「4」つの正方形CUに分割される。左上のCUは、更に分割されていないため、階層ツリーのリーフであり、すなわち、他のCUの親ノードではない。右上のCUは、やはり四分木タイプの分割を使用して、「4」つのより小さい正方形CUに更に分割される。右下のCUは、二分木タイプの分割を使用して「2」つの矩形CUに垂直に分割される。左下のCUは、三分木タイプの分割を使用して「3」つの矩形CUに垂直に分割される。
【0056】
画像の符号化中、分割は適応的であり、各CTUは、圧縮効率基準を最適化するように分割される。
【0057】
いくつかのビデオ圧縮スキームでは、予測ユニット(PU)及び変換ユニット(TU)の概念が登場した。実際、この場合、予測(すなわち、PU)及び変換(すなわち、TU)に使用される符号化エンティティは、CUの部分であり得る。例えば、
図6に示すように、サイズ2N×2NのCUは、サイズN×2N又はサイズ2N×NのPU 1411に分割することができる。更に、当該CUは、サイズN×Nの「4」つのTU 1412又はサイズ
【0058】
【数1】
の「16」個のTUに分割することができる。
【0059】
本出願では、「ブロック」又は「画像ブロック」という用語は、CTU、CU、PU、及びTUのうちのいずれか1つを指すために使用することができる。更に、「ブロック」又は「画像ブロック」という用語は、マクロブロック、パーティション、及びサブブロックを指すために使用することができ、より一般的には、多数のサイズのサンプルのアレイを指すために使用することができる。
【0060】
本出願では、「再構成(reconstructed)」及び「復号化(decoded)」という用語は、交換可能に使用され得、「ピクセル(pixel)」及び「サンプル(sample)」という用語は、交換可能に使用され得、「画像(image)」及び「ピクチャ(picture)」という用語は、交換可能に使用され得る。MVDデータの特定のコンテキストでは、
図24のAUと同様に、時間Tにおけるフレームは、各ビューに関して、時間Tに対応する画像(テクスチャ及び深度)を含むエンティティとみなされる。通常、「再構成」という用語は、エンコーダ側で使用され、「復号化」は、デコーダ側で使用される。
【0061】
図7は、符号化モジュールによって実行されるビデオストリームを符号化するための方法を概略的に示す。符号化のためのこの方法の変形形態が考えられるが、明確さを目的として、以下では予想される全ての変形形態を記載することなく、
図7の符号化のための方法について説明する。特に、符号化のための記載された方法は、マルチビューコンテンツのベース層に適用され、当該ベース層の各ピクセルは、輝度成分及び2つのクロミナンス成分を含む。マルチビューコンテンツ、特に深度層の符号化に適合された特定の符号化ツールは、これ以上説明しない。
【0062】
現在の元の画像501の符号化は、
図6に関連して説明したように、ステップ502中の現在の元の画像501の分割から始まる。したがって、現在の画像501は、CTU、CU、PU、TUなどに分割される。各ブロックについて、符号化モジュールは、イントラ予測とインター予測との間の符号化モードを決定する。
【0063】
イントラ予測は、イントラ予測方法に従って、ステップ503中に、符号化される現在のブロックの因果的近傍に位置する再構成ブロックのピクセルから導出された予測ブロックから現在のブロックのピクセルを予測することからなる。イントラ予測の結果は、近傍のブロックのどのピクセルを使用するかを示す予測方向と、現在のブロックと予測ブロックとの差の計算から生じる残差ブロックである。
【0064】
インター予測は、基準ブロックと呼ばれる、現在の画像の前又は後の画像のピクセルのブロックから現在のブロックのピクセルを予測することからなり、この画像は基準画像と呼ばれる。インター予測方法による現在のブロックの符号化中に、類似性基準による、現在のブロックに最も近い基準画像のブロックが、動き推定ステップ504によって決定される。ステップ504中に、インデックスによって特定された基準画像内の基準ブロックの位置を示す動きベクトルが決定される。当該動きベクトルと基準画像の当該インデックスは、動き補償ステップ505中に使用され、その間に残差ブロックは、現在のブロックと基準ブロックとの間の差の形態で計算される。ここでは、1予測インター予測のみが説明されることに留意されたい。また、現在のブロックが2つの動きベクトルと関連付けられ、2つの異なる画像(各々が基準画像インデックスによって指定される)に2つの基準ブロックを指定し、このブロックの残差ブロックが、2つの残差ブロックの平均である二予測インター予測(又はBモード)が存在する。
【0065】
イントラ予測及びインター予測は、空間的及び時間的予測の一般的な原理に基づいて多くのモードを含む一般的な用語であることに留意されたい。
【0066】
選択ステップ506中、試験された予測モードの中で、レート/歪み基準に従って圧縮性能を最適化する予測モードが、符号化モジュールによって選択される。予測モードが選択されると、残差ブロックはステップ507中に変換され、ステップ509中に量子化される。符号化モジュールは、変換をスキップして、変換されていない残差信号に量子化を直接適用することができることに留意されたい。現在のブロックがイントラ予測に従って符号化されるとき、予測方向と、変換され量子化される残差ブロックとは、ステップ510中にエントロピエンコーダによって符号化される。現在のブロックがインター予測に従って符号化されると、ブロックの動きベクトルは、符号化されるブロックの近くに位置する再構成ブロックに対応する動きベクトルのセットから選択された予測ベクトルから予測される。動き情報(動きベクトル残差、動きベクトル予測子のインデックス、基準画像のインデックスを含む)は、次に、ステップ510中にエントロピエンコーダによって、動き残差及び予測ベクトルを識別するためのインデックスの形態で符号化される。変換され量子化された残差ブロックは、ステップ510中にエントロピエンコーダによって符号化される。符号化モジュールは、変換及び量子化の両方をバイパスすることができ、すなわちエントロピ符号化は、変換処理又は量子化処理を適用することなく残差に適用されることに留意されたい。エントロピ符号化の結果は、符号化ビデオストリーム511に挿入される。
【0067】
量子化ステップ509の後、現在のブロックは、そのブロックに対応するピクセルが将来の予測に使用され得るように再構成される。この再構成段階は、予測ループとも呼ばれる。したがって、逆量子化は、ステップ512中に変換され量子化された残差ブロックに適用され、ステップ513中に逆変換が適用される。ステップ514中に取得されたブロックに使用される予測モードによって、ブロックの予測ブロックが再構成される。現在のブロックがインター予測に従って符号化される場合、符号化モジュールは、ステップ516中に、現在のブロックの基準ブロックを識別するために、現在のブロックの動きベクトルを使用する動き補償を適用する。現在のブロックがイントラ予測に従って符号化される場合、ステップ515中に、現在のブロックに対応する予測方向が、現在のブロックの基準ブロックを再構成するために使用される。再構成された現在のブロックを取得するために、基準ブロック及び再構成された残差ブロックが追加される。
【0068】
再構成後、ステップ517中に、符号化アーチファクトを低減することを意図したインループポストフィルタリングが、再構成ブロックに適用される。このポストフィルタリングは、デコーダと同じ基準画像の符号化を取得し、したがって符号化と復号化との間のドリフトを回避するために予測ループで行われるので、インループポストフィルタリングと呼ばれる。例えば、インループポストフィルタリングは、デブロッキングフィルタリング及びSAO(サンプル適応オフセット)フィルタリングを含む。インループデブロッキングフィルタのアクティブ化又は非アクティブ化を表すパラメータ、及びアクティブ化されると、当該インループデブロッキングフィルタの特性は、エントロピ符号化ステップ510中に、符号化ビデオストリーム511に導入される。
【0069】
ブロックが再構成されると、ブロックは、ステップ518中に、再構成画像のメモリ519に記憶された再構成画像に挿入され、このメモリは、基準画像メモリ、基準画像バッファ、又は復号化ピクチャバッファ(DPB)とも呼ばれる。そのように記憶された再構成画像は、符号化される他の画像の基準画像として機能することができる。
【0070】
図8は、復号化モジュールによって実行される、
図7に関連して説明された方法に従って符号化された符号化ビデオストリーム511を復号化するための方法を概略的に示す。復号化のためのこの方法の変形形態が考えられるが、明確さを目的として、以下では予想される全ての変形形態を記載することなく、
図8の復号化のための方法について説明する。
【0071】
復号化はブロック毎に行われる。現在のブロックの場合、これはステップ610中に現在のブロックのエントロピ復号化から始まる。エントロピ復号化は、ブロックの予測モードを取得することを可能にする。
【0072】
ブロックがインター予測に従って符号化されている場合、エントロピ復号化は、予測ベクトルインデックス、動き残差、基準画像のインデックス、及び残差ブロックを取得することを可能にする。ステップ608中に、予測ベクトルインデックス及び動き残差を使用して、現在のブロックに対して動きベクトルが再構成される。
【0073】
ブロックがイントラ予測に従って符号化されている場合、エントロピ復号化は、予測方向及び残差ブロックを取得することを可能にする。復号化モジュールによって実装されるステップ612、613、614、615、616及び617は、全て、符号化モジュールによって実装されるステップ512、513、514、515、516、及び517とそれぞれ同一である。復号化ブロックは、復号化画像に保存され、復号化画像は、ステップ618でDPB 619に記憶される。復号化モジュールが所与の画像を復号化するとき、DPB 619に記憶された画像は、当該所与の画像の符号化中に符号化モジュールによってDPB 519に記憶された画像と同一である。符号化された画像はまた、例えば表示のために復号化モジュールによって出力され得る。
【0074】
図1は、MVDコンテンツを取得するように適合されたカメラアレイの例を概略的に示す。
【0075】
図1は、4×4グリッド上に位置付けられた「16」個のカメラ10A~10Pを含むカメラアレイ10を表す。カメラアレイ10の各カメラは、同じシーンに焦点を合わせ、例えば、ピクセルが輝度成分及び2つのクロミナンス成分を含む画像の例示的な画像を取得することができる。例えば、カメラアレイ10に接続された計算手段又は測定手段(図示せず)は、カメラアレイ10のカメラによって生成された各画像の深度マップを生成するために使用される。
図1の例では、画像に関連付けられた各深度マップは、当該画像と同じ解像度を有する(すなわち、深度マップは、当該画像の各ピクセルの深度値を含む)。したがって、カメラアレイ10は、「16」個のテクスチャ層及び「16」個の深度層を含むMVDコンテンツを生成する。そのようなタイプのカメラアレイでは、捕捉されたビュー間の重なりが重要である。そのようなマルチビューコンテンツで達成され得る全体的な圧縮率を改善することが、以下の実施形態の目標である。
【0076】
カメラアレイ10の各カメラは、内部及び外部カメラパラメータに関連付けられている。本明細書で後述するように、これらのパラメータは、予測画像を作成するためにデコーダによって必要とされる。一実施形態では、内部及び外部パラメータは、SEI(補足エンハンスメント情報)メッセージの形態でデコーダに提供される。SEIメッセージは、メタデータを伝達するためにH.264/AVC及びHEVCで定義された。
【0077】
表 TAB1は、カメラアレイの内部及び外部パラメータを伝達するように適合されたSEIメッセージのシンタックスを記載している。このシンタックスは、HEVC(セクションG.14.2.6)におけるマルチビュー取得情報SEIメッセージシンタックスのシンタックスと同一である。
【0078】
【0079】
以下に記載される実施形態の目標の1つは、少なくとも1つの他のビューに基づいて1つのビューの予測を改善することである。上述のようにカメラアレイによって捕捉されたマルチビューコンテンツを標的とするため、カメラのいずれかは、近隣ビューの一部又は全部に対して良好な予測を提供することができる。現在のビューの現在の画像の予測画像を作成するために、以前に復号化されたビュー及びそれらの関連するカメラパラメータ並びに現在のビューに関連付けられたカメラパラメータが使用される。ビュー内のテクスチャ層又は深度層のいずれかが、新しいvspモードを使用することができることに留意されたい。
【0080】
プレーンピンホールとして較正されたカメラと
【0081】
【数2】
当該カメラの内部行列について考える。
・fは、射出瞳からカメラのセンサまでの距離を指し、ピクセルで表され、文献では誤って「焦点距離」と呼ばれることが多い。表 TAB1では、この情報は、以下のパラメータのセットで説明される。
【0082】
【0083】
【数3】
は、いわゆる「主点」、すなわちセンサ上へのピンホールの正射影のピクセル座標を示す。表1では、この情報は、以下のパラメータのセットで説明される。
【0084】
【表3】
・α及びγはそれぞれ、ピクセルのアスペクト比及びセンサのスキュー係数を示す。α値は表1では直接表されていないが、αf値は以下のように表されている。
【0085】
【表4】
・γ値は、以下のように表1に記載されている。
【0086】
【0087】
【数4】
がカメラの座標系(CS)における所与の点の座標である場合、画像
【0088】
【数5】
内の投影の座標は、次のように(ピクセルで)与えられる。
【0089】
【数6】
ここで、記号≡は均質ベクトル間の等価関係を示す。
【0090】
【0091】
【0092】
【数9】
はそれぞれ、基準座標系(CS)におけるカメラの配向及び位置を表す。カメラの外部行列は、以下のように定義される。
【0093】
【0094】
各カメラについて、表 TAB1では、R及びT行列は、以下によって記述される。
【0095】
【0096】
【数11】
がそれぞれカメラCSと基準CS内の同じ点を指す場合、
【0097】
【数12】
である。
図12は、基準CSからカメラCSへの、及びカメラCSから基準CSへの投影を表す。
【0098】
ここで、所与のカメラcが現在のビューを提供していると考える。カメラcは、内部行列Kc及びポーズ行列Pcに関連付けられている。
【0099】
【数13】
はカメラcよって取得された現在のビューの画像内の現在のピクセル、zはその推定深度とする。現在のピクセル
【0100】
【数14】
に対応する内部行列K
c’と外部行列Q
c’とに関連付けられたカメラc´によって提供された基準ビューの画像のピクセル
【0101】
【0102】
【0103】
図9は、MVDコンテンツを表す符号化ビデオストリームを符号化するための方法の例を概略的に示す。
【0104】
図9の方法は、第1のビュー501及び第2のビュー501Bを符号化することを可能にする方法である。この例では、
図24のように、第1のビューは、テクスチャデータを含むベース層(層「0」)と、深度データを含む層「1」とを含む。第2のビューは、テクスチャデータを含む層「2」と、深度データを含む層「3」とを含む。表現を簡略化するため、2つのビューのみを符号化することが表されているが、
図9の方法によってより多くのビューを符号化することができる。例えば、カメラアレイ10によって生成された「16」個のビューを、
図9の符号化のための方法によって符号化することができる。
【0105】
実施形態(9a)では、第1のビュー501は、他の全てのビューが直接的又は間接的に予測されるルートビューとみなされる。第1のビュー501は、任意のビュー間又は層間予測なしで符号化される。一実施形態では、層「0」及び層「1」は、並列に又は順次のいずれかで別々に符号化される。一実施形態では、層「0」及び層「1」は、
図7を参照して記載された同じステップ502、503、504、505、506、507、508、509、510、512、513、514、515、516、517、518、及び519を使用して符号化される。言い換えれば、第1のビュー501のテクスチャ及び深度データは、
図7の方法を使用して符号化される(
図24の矢印TIIPに対応する)。
【0106】
実施形態(9b)では、層「0」は、
図7の方法を使用して符号化されているが、当該方法は、層「1」に対してわずかに修正されて、3D HEVCに定義されたモードを組み込み、当該ビューのテクスチャ層からビューの深度層を予測する(
図24の矢印ICPに対応する)。
【0107】
実施形態(9c)では、第2のビュー501Bのテクスチャ層(層「2」)は、ステップ502、503、504、505B、507、508、509、510、512、513、514、515、516、517、518、及び519とそれぞれ同一のステップ502B、503B、504B、505B、507B、508B、509B、510B、512B、513B、515B、516B、517B、518B、及び519Bを含むプロセスによって符号化される。
【0108】
新しい予測画像は、ステップ521で処理モジュール20によって生成され、DPB 519Bに導入される。この新しい予測画像は、ステップ522で処理モジュール20によって使用されて、第2のビュー501Bのテクスチャ層の現在の画像の現在のブロックについて、VSP予測子の信号と呼ばれる予測子を決定する。VSP予測子による予測は、以下単にVSPモードとも呼ばれる新しいVSPモードに対応する。
【0109】
VSPモードは、従来のインターモードと非常に類似している。実際、DPB 519Bに導入されると、ステップ521中に生成された新しい予測画像は、(ステップ521中に生成された予測画像が、第2のビュー501Bのテクスチャ層の現在の画像と時間的に同じ場所に配置される場合でも)時間的予測のための通常の基準画像として扱われる。したがって、新しいVSPモードは、ビュー間予測によって生成された特定の基準画像を使用するインターモードとして考慮され得る。ステップ522は、動き推定ステップ及び動き補償ステップを含む。VSPモードを使用して符号化されるブロックは、動き情報及び残差の形態で符号化され、動き情報は、ステップ521中に生成された予測画像の識別子を含む。
【0110】
ステップ506B中、処理モジュール20は、ステップ522中に生成されたVSP予測子が、通常のイントラ及びインター予測子に加えて考慮されるという点で、ステップ506とは異なるステップを実行する。同様に、処理モジュール20は、新しいVSPモードが現在のブロックに可能性として適用され得る予測モードのセットに属するという点で、ステップ514とは異なるステップ514Bを実行する。ステップ506B中に現在のブロックに対して新しいVSPモードが選択された場合、処理モジュール20は、ステップ523中に対応するVSP予測子を再構成する。
【0111】
実施形態(9d)では、第2のビュー501Bの深度層(層「3」)は、同じステップ502B、503B、504B、505B、506B、507B、508B、509B、510B、512B、513B、514B、515B、516B、517B、518B、519B、521、522、及び523を使用して符号化される。したがって、新しいVSPモードは、第2のビュー501Bの深度層(層「3」)に適用される。より一般的には、VSPモードは、別のビューから予測されるビューの深度層に適用することができる。
【0112】
実施形態(9e)では、層「3」の符号化は、3D HEVCに定義されたモードを組み込み、当該ビューからビューの深度層を予測する(
図24の矢印ICPに対応する)。
【0113】
図9の例では、第2のビュー501Bは、少なくともテクスチャ層「0」がいかなるビュー間予測も伴わずに符号化されている第1のビュー501から符号化される。2つ以上のビューが
図9の方法によって符号化されるとき、任意の第3のビューは、少なくともテクスチャ層が任意のビュー間予測なしで(例えば、第1のビュー501から)符号化されるビューから、又はテクスチャ層がビュー間予測で符号化されるビューから(例えば、第2のビュー501Bから)、符号化することができる。
【0114】
図示されるように、
図9の符号化方法は、ビュー毎に1つずつの2つの符号化層を含む。当然のことながら、3つ以上のビューが符号化された場合、
図9の符号化方法は、ビューの数と同数の符号化層を含むものとする。
図9の例では、各符号化層は、自身のDPBを有する。言い換えれば、各ビューは、自身のDPBに関連付けられる。
【0115】
以下に記載されるように、DPBの画像は、複数の基準インデックスによってインデックス付けされる:
・ref_idx:DPBで使用する基準画像のインデックス、
・ref_idx_l0:DPBに記憶された基準画像のリストl0で使用する基準画像のインデックス。フレームTでビューiを復号化するために、ref_idx_l0によって言及されるリストは異なるフレームのビューiを含む、
・ref_idx_l1:DPBに記憶された基準画像のリストl1で使用する基準画像のインデックス。フレームTでビューiを復号化するために、ref_idx_l1によって言及されるリストは異なるフレームのビューiを含む、
・ref_idx2:現在の画像に時間的に対応する基準画像のうち、使用する基準画像のインデックス。インデックスref_idx2は、順投影によって生成された画像のみを指す。フレームTでビューiを復号化するため、ref_idx2によって言及されるリストは、フレームTに対応する基準画像を含む。
【0116】
図10は、マルチビューコンテンツを表す符号化ビデオストリームを復号化するための方法の例を概略的に示す。
【0117】
実施形態(9a)に対応する実施形態(10a)では、層「0」及び層「1」は、並列に又は順次のいずれかで別々に復号化される。一実施形態では、「0」及び層「1」は、
図8に関連して記載された同じステップ608、610、612、613、614、615、616、617、618、619を使用して復号化される。言い換えれば、第1のビュー501のテクスチャ及び深度データは、
図8の方法を使用して符号化される(
図24の矢印TIIPに対応する)。
【0118】
実施形態(9b)に対応する実施形態(10b)では、層「0」は、
図8の方法を使用して復号化されるが、当該方法は、層「1」に対してわずかに修正されて、3D HEVCに定義されたモードを組み込む(
図24の矢印ICPに対応する)。
【0119】
実施形態(9c)に対応する実施形態(10c)では、第2のビュー501Bのテクスチャ層(層「2」)は、それぞれステップ608、610、612、613、615、616、617、618、619と同一であるステップ608B、610B、612B、613B、615B、616B、617B、618B、619Bを含むプロセスによって復号化される。ステップ621では、処理モジュール20は、ステップ521中に生成された画像と同一の新しい予測画像を生成し、この画像をDPB 619Bに導入する。処理モジュール20は、新しいVSPモードが現在のブロックに可能性として適用され得る予測モードのセットに属するという点で、ステップ614とは異なるステップ614Bを実行する。ステップ506B中に現在のブロックに対して新しいVSPモードが選択された場合、処理モジュール20は、ステップ623中に対応するVSP予測子を再構成する。
【0120】
実施形態(9d)に対応する実施形態(10d)では、第2のビュー501Bの深度層(層「3」)は、同じステップ608B、610B、612B、613B、614B、615B、616B、617B、618B、619B、621、及び623を使用して復号化される。
【0121】
図示されるように、
図10の復号化方法は、ビュー毎に1つずつの2つの符号化層を含む。当然のことながら、3つ以上のビューが復号化された場合、
図9の復号化方法は、ビューの数と同数の復号化層を含むものとする。
図9の例では、各復号化層は、それ自体のDPBを有する。言い換えれば、各ビューは、自身のDPBに関連付けられる。
【0122】
図2は、カメラアレイによって提供されるMVDコンテンツを符号化するように適合された処理モジュールを概略的に表す。
【0123】
図2では、2つのカメラ10A及び10Bのみを含むカメラアレイ10の簡略化された表現が示されている。カメラアレイ10の各カメラは、有線又は無線であり得る通信リンクを使用して、処理モジュール20と通信する。
図2では、処理モジュール20は、符号化ビデオストリーム内で、以下に記載される新しいVSPモードを使用して、カメラアレイ10によって生成されたマルチビューコンテンツを符号化する。
【0124】
図3は、MVDコンテンツを表す符号化ビデオストリームを復号化するように適合された処理モジュールを概略的に表す。
【0125】
図3では、処理モジュール20は、符号化ビデオストリームを復号化する。処理モジュール20は、復号化から生じる画像を表示することができる表示デバイス26に有線又は無線であり得る通信リンクによって接続される。表示デバイスは、例えば、仮想現実ヘッドセット、3D TV、又はコンピュータディスプレイである。
【0126】
図4は、以下に記載される様々な実施形態を実施することができる符号化モジュール又は復号化モジュールを実装することができる処理モジュール20のハードウェアアーキテクチャの例を概略的に示す。処理モジュール20は、非限定的な例として、通信バス205によって接続された、1つ又は複数のマイクロプロセッサ、汎用コンピュータ、専用コンピュータ、及びマルチコアアーキテクチャに基づくプロセッサを包含するプロセッサ又はCPU(中央処理装置)200と、ランダムアクセスメモリ(RAM)201と、読み出し専用メモリ(ROM)202と、限定するものではないが、電気的消去可能プログラマブル読み取り専用メモリ(EEPROM)、読み取り専用メモリ(ROM)、プログラマブル読み取り専用メモリ(PROM)、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、フラッシュ、磁気ディスクドライブ、及び/又は光ディスクドライブを含む、不揮発性メモリ及び/又は揮発性メモリを含み得る、記憶デバイス203、又はSD(セキュアデジタル)カードリーダ及び/又はハードディスクドライブ(HDD)などの記憶媒体リーダ及び/又はネットワークアクセス可能な記憶装置と、データを他のモジュール、デバイス、又は機器と交換するための少なくとも1つの通信インターフェース204と、を含む。通信インターフェース204は、通信チャネルを介してデータを送信及び受信するように構成された送受信機を含むことができるが、これらに限定されない。通信インターフェース204は、モデム又はネットワークカードを含むことができるが、これらに限定されない。
【0127】
処理モジュール20が復号化モジュールを実装する場合、通信インターフェース204は、例えば、処理モジュール20が、符号化ビデオストリームを受信し、復号化ビデオストリームを提供することを可能にする。
【0128】
処理モジュールが符号化モジュールを実装する場合、通信インターフェース204は、例えば、処理モジュール20が元の画像データを受信して、符号化ビデオストリームを符号化及び提供することを可能にする。
【0129】
プロセッサ200は、ROM 202、外部メモリ(図示せず)、記憶媒体、又は通信ネットワークからRAM 201にロードされた命令を実行することができる。処理モジュール20の電源が投入されると、プロセッサ200は、RAM 201から命令を読み出し、それらを実行することができる。これらの命令は、例えば、
図9に関連して説明した復号化方法又は
図10に関連して説明した符号化方法のプロセッサ200による実施を引き起こすコンピュータプログラムを形成し、復号化方法及び符号化方法は、本明細書において後述する様々な態様及び実施形態を含む。
【0130】
当該符号化又は復号化方法のアルゴリズム及びステップの全て又は一部は、DSP(デジタル信号プロセッサ)又はマイクロコントローラなどのプログラマブルマシンによる命令セットの実行によってソフトウェア形式で実装されてもよく、又はFPGA(フィールドプログラマブルゲートアレイ)又はASIC(特定用途向け集積回路)などのマシン又は専用コンポーネントによってハードウェア形式で実装されてもよい。
【0131】
図5は、様々な態様及び実施形態が実装されているシステム2の一例のブロック図を示す。システム2は、以下に説明する様々な構成要素を含むデバイスとして具現化することができ、本文書に説明する態様及び実施形態のうちの1つ以上を実行するように構成されている。このようなデバイスの例としては、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ録画システム、接続型家電、仮想現実ヘッドセット、及びサーバなどの様々な電子デバイスが挙げられるが、これらに限定されない。システム2の要素は、単独で、又は組み合わせて、単一の集積回路(IC)、複数のIC、及び/又は別個の構成要素で具体化され得る。例えば、少なくとも1つの実施形態では、システム2は、復号化モジュール又は符号化モジュールを実装する1つの処理モジュール20を含む。しかし、別の実施形態では、システム2は、復号化モジュールを実装する1つの処理モジュール20と復号化モジュールを実装する1つの処理モジュール20、又は復号化モジュール及び符号化モジュールを実装する1つの処理モジュール20を備えることができる。様々な実施形態では、システム2は、例えば、通信バスを経由して、又は専用の入力ポート及び/若しくは出力ポートを介して、1つ以上の他のシステム又は他の電子デバイスに通信可能に結合される。様々な実施形態では、システム2は、本文書に記載されている態様及び実施形態のうちの1つ又は複数を実装するように構成されている。
【0132】
一実施形態では、システム2は、符号化モジュール又は復号化モジュールのうちの1つ又はその両方を実装することができる少なくとも1つの処理モジュール20を含む。
【0133】
処理モジュール20への入力は、ブロック22に示されるように様々な入力モジュールを通して提供され得る。そのような入力モジュールとしては、限定するものではないが、(i)例えば、放送局から無線で送信されるRF信号を受信する無線周波数(RF)モジュール、(ii)構成要素(COMP)入力モジュール(又はCOMP入力モジュールのセット)、(iii)ユニバーサルシリアルバス(USB)入力モジュール、及び/又は(iv)高精細度マルチメディアインターフェース(High Definition Multimedia Interface(HDMI)入力モジュールが挙げられる。他の実施例は、
図5に示されていないが、複合ビデオを含む。
【0134】
様々な実施形態において、ブロック22の入力モジュールは、技術分野で既知であるように、関連するそれぞれの入力処理要素を有する。例えば、RFモジュールは、(i)所望の周波数を選択する(信号を選択する、又は信号を周波数帯域に帯域制限するとも称される)、(ii)選択された信号をダウンコンバートする、(iii)特定の実施形態で、(例えば)チャネルと称され得る信号周波数帯域を選択するために、再びより狭い周波数帯域に帯域制限する、(iv)ダウンコンバート及び帯域制限された信号を復調する、(v)誤り訂正を実施する、及び(vi)データパケットの所望のストリームを選択するために多重分離する、ために適切な要素と関連付けられ得る。様々な実施形態のRFモジュールは、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、バンドリミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラー訂正器、及びデマルチプレクサを含む。RF部分は、例えば、受信信号をより低い周波数(例えば、中間周波数又はベースバンドに近い周波数)又はベースバンドにダウンコンバートすることを含む、これらの機能のうちの様々な機能を実行するチューナを含むことができる。セットトップボックスの一実施形態では、RFモジュール及びその関連する入力処理要素は、有線(例えば、ケーブル)媒体を介して送信されるRF信号を受信し、所望の周波数帯域にフィルタリング、ダウンコンバート、及び再フィルタリングすることによって周波数選択を実行する。様々な実施形態では、上述した(及び他の)要素の順序を並べ替える、これらの要素の一部を削除する、及び/又は、類似若しくは異なる機能を実行する他の要素を追加する。要素を追加することは、例えば、増幅器及びアナログ-デジタル変換器を挿入するなど、既存の要素間に要素を挿入することを含み得る。様々な実施形態において、RFモジュールは、アンテナを含む。
【0135】
更に、USBモジュール及び/又はHDMIモジュールは、システム2をUSB接続及び/又はHDMI接続を介して他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含むことができる。入力処理の様々な側面、例えば、リード-ソロモンエラー訂正は、例えば、必要に応じて、別個の入力処理IC内で実装する、又は処理モジュール20内で実装することができることを理解されたい。同様に、USB又はHDMIインターフェース処理の側面は、必要に応じて、別個のインターフェースIC内で、又は処理モジュール20内で実装することができる。復調され、誤り訂正され、逆多重化されたストリームは、処理モジュール20に提供される。
【0136】
システム2の様々な要素は、一体型ハウジング内に提供され得る。一体型ハウジング内では、様々な要素が相互接続され、適切な接続配列、例えば、Inter-IC(I2C)バス、配線、及びプリント回路基板を含む当技術分野で知られている内部バスを使用して、それらの間でデータを送信し得る。例えば、システム2では、処理モジュール20は、バス205によって当該システム2の他の要素に相互接続される。
【0137】
処理モジュール20の通信インターフェース204は、システム2が通信チャネル21上で通信することを可能にする。通信チャネル21は、例えば、有線及び/又は無線媒体内に実装することができる。
【0138】
データは、様々な実施例において、Wi-Fiネットワーク、例えば、IEEE 802.11(IEEEは、the Institute of Electrical and Electronics Engineersを指す)などの無線ネットワークを使用して、システム2にストリーミングされるか、又は他の方法で提供される。これらの実施形態のWi-Fi信号は、Wi-Fi通信のために適合された通信チャネル21及び通信インターフェース204を介して受信される。これらの実施形態の通信チャネル21は、一般には、ストリーミングアプリケーション及び他のオーバーザトップ通信を可能にするためにインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。別の実施形態では、入力ブロック22のHDMI接続を介してデータを配信するセットトップボックスを使用して、システム2にストリーミングデータを提供する。更に別の実施形態では、入力ブロック22のRF接続を使用してシステム2にストリーミングデータを提供する。上記のように、様々な実施形態は、データをストリーミング以外の方法で提供する。加えて、様々な実施形態は、Wi-Fi以外の無線ネットワーク、例えば、セルラーネットワーク又はBluetoothネットワークを使用する。システム2に提供されるデータは、例えば、カメラ10のアレイによって提供されるMVD信号を含む。
【0139】
システム2は、ディスプレイインターフェース23を介したディスプレイ26、オーディオインターフェース24を介したスピーカ27、及びインターフェース25を介した他の周辺デバイス28を含む、様々な出力デバイスに出力信号を提供することができる。様々な実施形態のディスプレイ26は、例えば、タッチスクリーンディスプレイ、有機発光ダイオード(OLED)ディスプレイ、湾曲ディスプレイ、及び/又は折り畳み可能なディスプレイのうちの1つ以上を含む。ディスプレイ26は、テレビジョン、タブレット、ラップトップ、携帯電話(移動電話)、スマートフォン、仮想現実ヘッドセット、又は他のデバイス用であり得る。ディスプレイ26はまた、他の構成要素に統合されていてもよく(例えば、スマートフォンのように)、又は別個(例えば、ラップトップの外部モニタ)であってもよい。他の周辺デバイス28としては、実施形態の様々な例において、スタンドアロンデジタルビデオディスク(又はデジタル多用途ディスク)(両方の用語の略称としてDVR)、ディスクプレーヤ、ステレオシステム、及び/又は照明システムのうちの1つ以上が挙げられる。様々な実施形態は、システム2の出力に基づいて機能を提供する1つ以上の周辺デバイス28を使用する。例えば、ディスクプレーヤは、システム2の出力を再生する機能を実行する。
【0140】
様々な実施形態では、制御信号は、システム2とディスプレイ26、スピーカ27、又は他の周辺デバイス28との間で、AV.Link、Consumer Electronics Control(CEC)、又はユーザ介入の有無にかかわらずデバイス間の制御を可能にする他の通信プロトコルなどの信号伝達を使用して通信される。出力デバイスは、それぞれのインターフェース23、24、及び25を通じた専用接続を介してシステム2に通信可能に結合することができる。代替的に、出力デバイスは、通信インターフェース204を介して通信チャネル21を使用してシステム2に接続することができる。ディスプレイ26及びスピーカ27は、例えば、テレビジョンなどの電子デバイス内のシステム2の他の構成要素と単一のユニットに統合され得る。様々な実施形態において、ディスプレイインターフェース23は、ディスプレイドライバ、例えば、タイミングコントローラ(T Con)チップなどを含む。
【0141】
代替的に、例えば、入力22のRFモジュールが個別のセットトップボックスの一部である場合、ディスプレイ26及びスピーカ27を他の構成要素のうちの1つ以上から分離することができる。ディスプレイ26及びスピーカ27が外部構成要素である様々な実施形態では、出力信号は、例えば、HDMIポート、USBポート、又はCOMP出力を含む専用の出力接続を介して提供することができる。
【0142】
様々な実装形態は、復号化することを含む。本出願で使用される場合、「復号」は、例えば、ディスプレイに適した最終出力を生成するために、受信された符号化ビデオストリームに対して実行されるプロセスの全て又は一部を包含し得る。様々な実施形態において、このような処理は、例えば、エントロピ復号化、逆量子化、逆変換、及び予測など、デコーダによって一般的に実行される処理のうちの1つ以上を含む。様々な実施形態では、そのようなプロセスにはまた、若しくは代替的に、例えば、本出願に記載される、例えば、新たなVSPモードを復号化するための様々な実装形態のデコーダによって実施されるプロセスも含まれる。
【0143】
「復号化処理」という句が、操作のサブセットを具体的に指すことを意図しているか、又はより広範な復号化処理を一般的に指すことを意図しているかは、特定の説明の文脈に基づいて明らかになり、当業者にはよく理解されると考えられる。
【0144】
様々な実装形態は、符号化することを含む。「復号」に関する上記の考察と同様に、本出願で使用される場合、「符号化」は、例えば、符号化ビデオストリームを生成するために入力ビデオシーケンスで実行されるプロセスの全部又は一部を包含し得る。様々な実施形態において、このような処理は、例えば、分割、予測、変換、量子化、及びエントロピ符号化など、エンコーダによって一般的に実行される処理のうちの1つ以上を含む。様々な実施形態において、このような処理は、これらに加えて、又は代替的に、本出願に説明される、例えば、新たなVSPモードにより復号化するための様々な実装形態のエンコーダによって実行される処理を含む。
【0145】
「符号化処理」という句が、操作のサブセットを具体的に指すことを意図しているか、又はより広範な符号化処理を一般的に指すことを意図しているかは、特定の説明の文脈に基づいて明らかになり、当業者にはよく理解されると考えられる。
【0146】
例えば、フラグVSP及びインデックスref_idx2などの本明細書で使用されるシンタックス要素は記述的な用語であることに留意されたい。したがって、これらは他のシンタックス要素名の使用を排除するものではない。
【0147】
図がフローチャートとして提示されている場合、その図は対応する装置のブロック図も提供するものと理解されたい。同様に、図がブロック図として提示されている場合、その図は対応する方法/処理のフローチャートも提供するものと理解されたい。
【0148】
様々な実施形態は、速度歪み最適化を指す。特に、符号化プロセス中に、レートと歪みとの間のバランス又はトレードオフは、通常、多くの場合は計算の複雑さの制約を与えるものと考えられる。レート歪み最適化は、通常、レートと歪みの加重和であるレート歪み関数を最小化するように定式化される。レート歪み最適化問題を解くには、様々なアプローチがある。例えば、これらのアプローチは、全ての考慮されるモード又は符号化パラメータ値を含む全ての符号化オプションの広範なテストに基づき得、それらの符号化コスト、並びに符号化及び復号化後の再構成された信号の関連する歪みの完全な評価を伴う。また、符号化の複雑さを軽減するために、より高速なアプローチ、特に、再構成された信号ではなく、予測又は予測残差信号に基づく近似歪みの計算を使用することもできる。これらの2つのアプローチを組み合わせて使用することもでき、例えば、可能な符号化オプションの一部のみに対して近似歪みを使用し、他の符号化オプションに対しては完全な歪みを使用することができる。別のアプローチでは、可能な符号化オプションのサブセットのみを評価する。より一般的には、多くのアプローチは、最適化を実行するために様々な技術のいずれかを採用するが、最適化は、必ずしも符号化コスト及び関連する歪みの両方の完全な評価ではない。
【0149】
本明細書に記載された実装形態及び態様は、例えば、方法又はプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装することができる。たとえ単一の形式の実装形態の文脈でのみ説明されている場合でも(例えば、方法としてのみ説明されている)、説明された特徴の実装形態は、他の形式(例えば、装置又はプログラム)でも実装することができる。装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェアにおいて実装することができる。方法は、例えば、プロセッサにおいて実装することができ、プロセッサは、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブルロジックデバイスを含む一般的な処理デバイスを指す。プロセッサはまた、例えば、コンピュータ、携帯電話、携帯型/パーソナルデジタルアシスタント(「PDA」)及びエンドユーザ間の情報の通信を容易にする他のデバイスなどの通信デバイスを含む。
【0150】
「一実施形態」又は「実施形態」又は「一実装形態」又は「実装形態」、及びそれらの他の変形形態の言及は、実施形態に関連して説明される特定の特徴、構造、特性などが、少なくとも一実施形態に含まれることを意味する。したがって、本明細書の様々な場所に現れる「一実施形態では」又は「実施形態では」又は「一実装形態では」又は「実装形態では」という語句の出現、並びに任意の他の変形例は、必ずしも全てが同じ実施形態を指すものではない。
【0151】
加えて、本出願は、様々な情報を「決定する」ことに言及する場合がある。情報を決定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、又は情報をメモリから取り出すことのうちの1つ以上を含むことができる。
【0152】
更に、本出願は、様々な情報に「アクセスすること」に言及する場合がある。情報にアクセスすることは、例えば、情報を受信すること、(例えば、メモリから)情報を取得すること、情報を格納すること、情報を移動すること、情報をコピーすること、情報を計算すること、情報を決定すること、情報を予測すること、又は情報を推定することのうちの1つ以上を含むことができる。
【0153】
加えて、本出願は、様々な情報を「受信する」ことに言及する場合がある。受信することは、「アクセスする」と同様に、広義の用語であることを意図している。情報を受信することは、例えば、情報にアクセスすること、又は(例えば、メモリから)情報を取得することのうちの1つ以上を含むことができる。更に、「受信する」は、一般には、例えば、情報を格納する、情報を処理する、情報を送信する、情報を移動する、情報をコピーする、情報を消去する、情報を計算する、情報を決定する、情報を予測する、又は情報を推定するなどの操作時に、何らかの形で関与する。
【0154】
「/」、「及び/又は」、「のうちの少なくとも1つ」、「1つ又は複数」のいずれかの使用、例えば、「A/B」、「A及び/又はB」、「A及びBのうちの少なくとも1つ」、「A及びBの1つ又は複数」の場合、最初にリストされた選択肢(A)のみの選択、又は2番目にリストされた選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を包含することを意図しているものと理解されたい。更なる例として、「A、B、及び/又はC」及び「A、B、及びCのうちの少なくとも1つ」、「A、B及びCのうちの1つ又は複数」の場合、このような句は、最初にリストされた選択肢(A)のみの選択、又は2番目にリストされた選択肢(B)のみの選択、又は3番目にリストされた選択肢(C)のみの選択、又は、最初及び2番目にリストされた選択肢(A及びB)のみの選択、又は、最初及び3番目にリストされた選択肢(A及びC)のみの選択、又は、2番目及び3番目にリストされた選択肢(B及びC)のみの選択、又は3つの選択肢(A及びB及びC)全ての選択、を包含するように意図されている。このことは、技術分野及び関連技術分野の通常の技術を有する者に明らかであるように、リストされた項目の数だけ拡張することができる。
【0155】
また、本明細書で使用される「シグナリングする」という語は、特に、対応するデコーダに対して何かを示すことを意味する。例えば、特定の実施形態では、エンコーダは、新しいVSPモードを表す情報を信号伝達する。このように、ある実施形態では、同じパラメータがエンコーダ側とデコーダ側の両方で使用される。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用することができるように、特定のパラメータをデコーダに送信する(明示的なシグナリング)ことができる。逆に、デコーダが既にその特定のパラメータ及び他のパラメータを有する場合は、単にデコーダがその特定のパラメータを認識及び選択することを可能にするように、送信を行わないシグナリング(暗黙的なシグナリング)を使用することができる。実際の機能の送信を回避することにより、様々な実施形態において、ビットの節約が実現される。シグナリングは、様々な方法で達成できることを理解されたい。例えば、1つ以上のシンタックス要素、フラグなどが、様々な実施形態において、対応するデコーダに情報をシグナリングするために使用される。上の説明は、語「信号(signal)」の動詞形に関するものであるが、語「信号」は、本明細書では名詞としても使用され得る。
【0156】
この当業者には明らかであるように、実装形態では、例えば、格納又は送信することができる情報を伝えるようにフォーマットされた様々な信号を生成することができる。これらの情報は、例えば、方法を実行するための命令、又は説明されている実装形態の1つによって生成されるデータを含むことができる。例えば、説明されている実施形態の符号化ビデオストリームを伝えるように信号をフォーマットすることができる。このような信号は、例えば、電磁波として(例えば、スペクトルの無線周波数部分を使用する)、又はベースバンド信号としてフォーマットすることができる。フォーマットすることは、例えば、符号化ビデオストリームを符号化すること、及び符号化ビデオストリームで搬送波を変調することを含むことができる。信号が伝える情報は、例えば、アナログ情報又はデジタル情報とすることができる。信号は、既知であるように、様々な異なる有線リンク又は無線リンクを介して送信することができる。信号は、プロセッサ可読媒体に格納することができる。
【0157】
図13Aは、予測画像生成プロセスで使用される順投影方法の例を概略的に示す。
図13Bは、
図13Aの順投影方法の別の表現である。
図13A及び
図13Bの順投影プロセスは、ステップ521及び621中に使用される。順投影プロセスは、カメラmの第1のビューによって取得された第1のビューのピクセルに適用されて、これらのピクセルを第1のビューのカメラ座標系からカメラnによって取得された第2のビューのカメラ座標系に投影する。各ピクセルは、テクスチャ情報及び深度情報を含むとみなされる。
【0158】
ステップ130では、処理モジュール20は、第1のビューのカメラ座標系から基準座標系(すなわち、世界座標系)へ第1のビューの現在のピクセルP(u,v)を逆投影して、
図13Bに示されるように逆投影されたピクセルP
wを取得する。逆投影は、カメラmのポーズ行列P
m、カメラm,の逆内部行列
【0159】
【数17】
現在のピクセルに関連付けられる深度値を使用する。ポーズ行列P
mと内部行列K
mは、例えば、表 TAB1に記載されているSEIメッセージから、処理モジュール20によって取得されたカメラパラメータを使用して定義される。
【0160】
ステップ131では、処理モジュール20は、逆投影されたピクセルPwを、カメラnの内部行列Knと外部行列Qnを用いて第2のビューの座標系に投影する。再度、内部行列Kn及び外部行列Qnは、例えば、表 TAB1に記載されているSEIメッセージから、処理モジュール20によって取得されたカメラパラメータを使用して定義される。この投影がカメラn領域に入っていないとき、この投影は拒否される。カメラnの領域に入っているとき、この投影は、ほぼ確実に現実のピクセルにほとんど入っておらず、「4」つのピクセルの間にある。
【0161】
ステップ132では、処理モジュール20は、逆投影ピクセルPwの投影に最も近いカメラnのピクセルのグリッドのピクセルP’(u’、v’)を選択する。例えば、最も近いピクセルは、例えば、カメラnのピクセルのグリッドのピクセルであり、逆投影ピクセルPwの投影に対する距離を最小化することである。この距離は、例えば、グリッドのピクセルの座標と逆投影ピクセルPwの投影との間の平方根の合計(又は絶対差の合計)の平方根として計算される。
【0162】
図13A及び
図13Bの順投影プロセスによって取得されたピクセルP’(u’、v’)は、投影ピクセルP(u,v)のテクスチャ値及び深度値を保持する。ピクセルP’(u’、v’)のセットは、投影画像を形成する。
【0163】
図14Aは、予測画像生成プロセスの第1の実施形態を示す。
【0164】
実施形態(14A)とも呼ばれる
図14Aの実施形態では、1つのビューは、現在のビューを再構成するための可能な予測子として使用されるようにシグナリングされている。
【0165】
図14Aに記載のプロセスは、
図9の符号化方法のステップ521中、及び
図10の復号化方法のステップ621中に実行されて、第1のビュー501から基準画像を生成して、第2のビュー501Bの現在の画像を符号化するステップ140~143を含む。
【0166】
ステップ140では、処理モジュール20は、基準ビュー(例えば、第1のビュー501)及び現在のビュー(例えば、第2のビュー501B)のためのカメラパラメータ(すなわち、ビューパラメータ)を取得する。
図14Aのプロセスがステップ521中に実行されるとき、処理モジュール20は、これらのパラメータをカメラアレイ10のカメラから直接、又はユーザから取得する。
図14Aのプロセスがステップ621中に実行されるとき、処理モジュール20は、SEIメッセージ(例えば、表 TAB1に記載のSEIメッセージ)又はユーザからこれらのパラメータを取得する。
【0167】
ステップ141では、処理モジュール20は、基準ビュー(例えば、第1のビュー501)と現在のビュー(例えば、第2のビュー501B)の間で、
図13A及び
図13Bに記載された順投影方法を適用して予測画像G(k)を生成する。予測画像G(k)は、現在のビューのDPB(例えば、DPB519B(619B))に導入されて、現在のビューの現在の画像についての第K
thの予測画像のうちの1つになることを意図している。
【0168】
成功した予測から生じる予測画像G(k)の各ピクセルは、基準ビューの対応する投影ピクセルのテクスチャ値及び深度値を保持する。順投影後、分離された欠落ピクセルは(第2のビュー領域に入らない失敗した投影に起因して)留まり得る。
【0169】
ステップ142では、処理モジュール20は、分離された欠落ピクセルを満たす。一実施形態では、分離された欠落ピクセルは、隣接するピクセル値の平均で満たされる。別の実施形態では、分離された欠落ピクセルは、隣接するピクセル値の中央値で満たされる。別の実施形態では、分離された欠落ピクセルは、デフォルト値(典型的には、8ビットで符号化された値の場合、128)で満たされる。
【0170】
ステップ143では、処理モジュール20は、現在のビューのDPBに予測画像G(k)を記憶する。
【0171】
ステップ144では、処理モジュール20は、現在のビューのDPBに含まれる基準画像を使用して現在のビューの現在の画像を再構成し、DPBは予測画像G(k)を含む。
【0172】
図14Aのプロセスが
図9の符号化方法に適用される場合、生成は、ステップ502B、503B、504B、505B、506B、507B、508B、509B、510B、512B、513B、514B、515B、516B、517B、518B、519B、522、及び523を含む。
【0173】
図14Aのプロセスが
図10の復号化方法に適用されるとき、生成は、ステップ608B、610B、612B、613B、614B、615B、616B、617B、618B、619B、及び623を含む。
【0174】
図14Bは、予測画像生成プロセスの第2の実施形態の詳細を示す。
【0175】
図14Bの実施形態では、実施形態(14B)とも呼ばれ、現在のビューを予測するためにいくつかの図が利用可能である。例えば、
図9に戻ると、時点Tにおいて、第1のビューの画像(テクスチャ及び深度)及び第2のビューの画像が符号化及び再構成され、第3のビューの画像は、第1及び第2のビューの再構成画像から生成された予測画像を使用して符号化される準備が整っている。同様に、本発明者らが
図10に戻ると、時点Tにおいて、第1のビュー(テクスチャ及び深度)及び第2のビューの画像が再構成され、第3のビューの画像が、第1及び第2のビューの再構成画像から生成された予測画像を使用して復号化される準備が整っている。
【0176】
実施形態(14B)では、複数のビューが使用されて、現在のビューを再構成するために1つの集約予測画像を生成する。より正確には、実施形態(14B)では、複数のビューの各ビューに対して予測画像が生成され、集約予測画像は、複数の予測画像から生成される。
【0177】
ステップ140では、処理モジュール20は、複数のビューの各ビュー及び現在のビューのカメラパラメータ(すなわち、ビューパラメータ)を取得する。
【0178】
実施形態(14A)と比較すると、ステップ141は、ステップ1411~1415に置き換えられる。
【0179】
ステップ1411では、処理モジュール20は、変数jを「0」に初期化する。変数jは、複数のビューの全てのビューを列挙するために使用される。
【0180】
ステップ1412では、処理モジュール20は、ビューjと現在のビューとの間で
図13A及び
図13Bに記載される順投影方法を適用する予測画像G(k)
jを生成する。例えば、ビューjは、第1のビュー501又は第2のビュー501Bであり、現在のビューは第3のビューである。
【0181】
ステップ1413では、処理モジュール20は、変数jの値を、複数のビュー内のビューNb_viewsの数と比較する。j<Nb_viewsである場合、ステップ1413の後にステップ1414が続き、jは1単位インクリメントされる。
【0182】
ステップ1414の後にステップ1412が続き、新しい予測画像G(k)jが生成される。
【0183】
j=Nb_viewsである場合、ステップ1413の後にステップ1415が続き、予測画像G(k)jが集約されて、現在のビューのDPBに記憶されることを意図した集約予測画像G(k)を生成する。
【0184】
集約プロセスの一実施形態では、複数の予測画像の第1の予測画像G(k)jのピクセル値(テクスチャ値及び深度値)を保持することによって、複数の予測画像G(k)jが集約される。第1の予測画像は、例えば、予測画像G(k)j=0である。
【0185】
集約プロセスの一実施形態では、予測画像G(k)jは、現在のビューに最も近いビューjから生成されたG(k)jのピクセル値(テクスチャ値及び深度値)を保持することによって集約される。いくつかのビューが現在のビューから同じ距離にある場合(すなわち、いくつかの最も近いビューがある)、いくつかの最も近いビューのうちの最も近いビューがランダムに選択される。例えば、カメラアレイ10では、カメラ10Aによって生成された第1のビュー及びカメラ10Cによって生成された第2のビューのみが、カメラ10Bによって生成された現在のビューを予測するために利用可能であると仮定する。次いで、第1及び第2のビューは、現在のビューに最も近いビューであり、現在のビューまで同じ距離にある。第1及び第2のビューのうちの1つをランダムに選択して、ピクセル値を集約予測画像G(k)に提供する。
【0186】
集約プロセスの一実施形態では、予測画像のサイズG(k)jは、最良品質を有する予測画像G(k)jピクセル値(テクスチャ値及び深度値)を保持することによって集約される。例えば、ピクセルの質を表す情報は、当該ピクセルを含む変換ブロックに適用される量子化パラメータの値である。予測画像G(k)jのピクセルの質は、予測画像G(k)jを取得するために順投影が適用された画像のピクセル(すなわち、量子化パラメータ)の品質に依存する。
【0187】
集約プロセスの一実施形態では、予測画像G(k)jは、最も近い深度値(zバッファアルゴリズム)を有する予測画像G(k)jのピクセル値(テクスチャ値及び深度値)を保持することによって集約される。
【0188】
集約プロセスの一実施形態では、予測画像G(k)jは、集約予測画像G(k)jの隣接ピクセルが既に予測画像から予測されるときに、予測画像G(k)jのピクセル値(テクスチャ値及び深度値)を保持することによって集約される。
【0189】
集約プロセスの一実施形態では、予測画像G(k)jは、予測画像G(k)jのピクセル値(テクスチャ値及び深度値)の平均、加重平均、中央値を計算することによって、予測画像のディメンションを計算することによって集約される。
【0190】
ステップ1415の後にステップ142が続き、処理モジュール20が、集約予測画像G(k)内の分離された欠落ピクセルを満たす。
【0191】
ステップ143では、集約予測画像G(k)は、現在のビューのDPBに記憶される。
【0192】
ステップ144では、処理モジュール20は、現在のビューのDPBに含まれる基準画像を使用して現在のビューの現在の画像を再構成し、DPBは、集約予測画像G(k)を含む。
【0193】
図15は、予測画像生成プロセスの第3の実施形態を示す。
【0194】
実施形態(15)とも呼ばれる
図15の実施形態では、実施形態(14B)と同様に、現在のビューを予測するためにいくつかの図が利用可能である。
【0195】
実施形態(15)では、複数のビューの各ビューに対して予測画像が生成される。しかしながら、実施形態14Bのように、集約予測画像を生成し、当該集約予測画像を現在のビューのDPBに挿入する代わりに、実施形態(15)では、生成された各予測画像がDPBに挿入される。
【0196】
ステップ140では、処理モジュール20は、複数のビューの各ビュー及び現在のビューのカメラパラメータ(すなわち、ビューパラメータ)を取得する。
【0197】
ステップ1501では、処理モジュール20は、変数jを「0」に初期化する。変数jは、複数のビューの全てのビューを列挙するために使用される。
【0198】
ステップ1502では、処理モジュール20は、ビューjと現在のビューとの間で
図13A及び
図13Bに記載される順投影方法を適用する予測画像G(k)
jを生成する。
【0199】
ステップ1503では、処理モジュール20は、集約予測画像G(k)内の分離された欠落ピクセルを満たす。
【0200】
このステップ1504では、処理モジュール20は、現在のビューのDPBに予測画像G(k)jを記憶する。
【0201】
ステップ1505では、処理モジュール20は、変数jの値を、複数のビュー内のビューの数Nb_viewsと比較する。j<Nb_viewsである場合、ステップ1505の後にステップ1506が続き、jは1単位インクリメントされる。
【0202】
ステップ1506の後にステップ1502が続き、新しい予測画像G(k)jが生成される。
【0203】
j=Nb_viewsである場合、ステップ1505の後にステップ144が続く。ステップ144では、処理モジュール20は、現在のビューのDPBに含まれる基準画像を使用して現在のビューの現在の画像を再構成し、DPBは、複数の予測画像G(k)jを含む。
【0204】
実施形態15の変形例において、予測画像G(k)jに加えて、予測画像G(k)jから生成された集約予測画像及び/又は予測画像G(k)jのサブセットから生成された集約予測画像が、現在のビューのDPBに挿入される。
【0205】
実施形態15の変形例において、予測画像G(k)jの代わりに、予測画像G(k)jから生成された集約予測画像と予測画像G(k)jのサブセットから生成された集約予測画像が現在のビューのDPBに挿入される、又は予測画像G(k)jのサブセットから生成された集約予測画像のみが現在のビューのDPBに挿入される。
【0206】
図16は、予測画像生成プロセスの第4の実施形態を示す。
【0207】
実施形態(16)とも呼ばれる
図16の実施形態の目的は、予測画像の生成の複雑さを低減することである。実施形態(16)では、現在のビューの画像についての予測画像を生成するために使用される基準ビューの各画像がブロックに分割される。次いで、ブロック当たり1つのみの深度値を保持するために、基準ビューの画像の深度層がサブサンプリングされる。その結果、ブロックの全てのピクセルは、順投影に同じ深度値を使用する。ブロックと関連付けられた深度値を選択するためのポリシーが定義される。それは、以下のアプローチのうちの1つを含むことができる。
・ブロックのうちの1つの特定のピクセルの深度値が、ブロック、例えば、左上のブロック又は中間の1つを表す。
・(平均位置を有する)ブロックの平均又は中央深度値が、ブロックを表す。
・(関連付けられた位置又は中央位置を有する)より頻繁な深度値が、ブロックを表す。
【0208】
実施形態(16)は、処理モジュール20が基準ビュー及び現在のビューのカメラパラメータ(すなわち、ビューパラメータ)を取得するステップ140から始まる。
【0209】
ステップ161では、処理モジュール20は、変数nを「1」に初期化する。
【0210】
ステップ162では、処理モジュール20は、変数N_subの値をチェックして、サブサンプリングが基準ビューの画像に適用されるかどうかを判定する。N_subが=1である場合、サブサンプリングが基準ビューの深度層に適用されない。その場合、ステップ162の後にステップ141が続き、処理モジュール20が、基準ビューと現在のビューとの間に、
図13A及び
図13Bに記載された順投影方法を適用する予測画像G(k)を生成する。
【0211】
ステップ143では、予測画像G(k)は、現在のビューのDPBに記憶される。
【0212】
ステップ143の後にステップ142が続き、処理モジュール20が分離された欠落ピクセルを満たす。
【0213】
ステップ144では、処理モジュール20は、現在のビューのDPBに含まれる基準画像を使用して現在のビューの現在の画像を再構成し、DPBは、予測画像G(k)を含む。
【0214】
N_sub>1である場合、サブサンプリングが基準ビューの深度層に適用される。一実施形態では、N_sub>1である場合、N_subは2の倍数である。この基準ビューの画像が幅wと高さhを有する場合、当該画像は、例えば、同じサイズの
【0215】
【0216】
ステップ162の後にステップ163が続き、処理モジュール20は、選択のために定義されたポリシーを使用して、基準ビューの画像のブロック番号nに対して深度値を選択する。
【0217】
ステップ164では、処理モジュール20は、基準ビューの画像のブロック番号nについて、基準ビューと現在のビューとの間に、
図13A及び
図13Bに記載の順投影方法を適用する予測ブロックGblock(n,k)を生成する。
【0218】
ステップ165では、処理モジュール20は、基準ビューの画像のブロック番号nの位置と同じ位置に、現在のビューのDPBに予測ブロックGblock(n,k)を記憶する。
【0219】
ステップ166では、処理モジュール20は、変数nの値を基準ビューNB_Blocksの画像内のブロック数と比較する。n<Nb_blocksの場合、ステップ166の後にステップ167が続き、変数nが1単位インクリメントされる。ステップ167の後にステップ162が続き、順投影が新しいブロックに適用される。
【0220】
n=Nb_blocksの場合、ステップ166の後に上述したステップ142及び144が続く。基準ビューの画像のNB_Blocks上のループの終了時に、ブロックGblock(n、k)の組み合わせは、予測画像G(k)を形成することに留意されたい。
【0221】
実施形態(16)の変形例では、実施形態(14B)及び(15)と同様に、実施形態(16)を複数の基準ビューの画像に適用して、複数の予測画像を得ることができる。
【0222】
この変形例の実施形態では、複数の予測画像は、現在のビューのDPBに記憶される。
【0223】
この変形例の実施形態では、複数の予測画像が集約されて、集約予測画像を形成し、集約予測画像は、現在のビューのDPBに記憶される。
【0224】
この変形例の実施形態では、複数の予測画像の少なくとも1つのサブセットが集約されて集約予測画像を形成し、各集約予測画像は、現在のビューのDPBに記憶される。
【0225】
この変形例の実施形態では、複数の予測画像の少なくとも1つのサブセットが集約されて、集約予測画像を形成し、各集約予測画像は、複数の予測画像、及び複数の予測画像の全てを集約する集約予測画像に加えて、現在のビューのDPBに記憶される。
【0226】
実施形態(16)の変形例では、基準ビューの画像は、等しくないサイズのブロックに分割される。例えば、当該画像は、深度値が均一である(例えば、最小深度値と最大深度値の差が最小深度値の±10%を超えていない領域)大きなブロック(128×128、64×64、32×32、16×16、又は8×8)と、深度値が不均一である(例えば、最小深度値と最大深度値の差が最小深度値の±10%を超える領域)小さいブロック(4×4又は2×2)に分割される。
【0227】
双方向実施形態と称される一実施形態では、実施形態(14A)、(14B)、(15)、及び(16)の少なくとも1つの予測画像を使用して、基準ブロック(すなわち、VSP予測子ブロック)を、双予測(すなわち、双予測間予測)を使用して予測される現在の画像の現在のブロックに提供する。その場合、現在のブロックは2つの動き情報と関連付けられ、2つの異なる画像内の2つの基準ブロックを指定し、このブロックの残差ブロック、すなわち、重みw0=1/2によって重み付けされる第1の基準ブロックと重みw1=1/2によって重み付けされる第2の基準ブロックは、2つの残留ブロックの平均である。この現在のブロックのサンプルScurrは、次のようにして取得される。
【0228】
【数19】
ただし、S
0は第1の基準ブロックのサンプルであり、S
1は第2の基準ブロックのサンプルである。
【0229】
実施形態WPと呼ばれる一実施形態では、実施形態(14A)、(14B)、(15)、及び(16)の少なくとも1つの予測画像を使用して、加重予測(WP)を使用して予測される現在の画像の現在のブロックに基準ブロック(すなわち、VSP予測子ブロック)を提供する。その場合、現在のブロックは2つの動き情報と関連付けられ、2つの異なる画像内の2つの基準ブロックを指定し、このブロックの残差ブロック、すなわち、重みw0によって重み付けされる第1の基準ブロックと重みw1によって重み付けされる第2の基準ブロックは、2つの残留ブロックの加重平均である。再度、現在のブロックのサンプルScurrは、次のように取得される。
【0230】
【0231】
実施形態WPは、サンプルの重み付け、例えば三角形モードを使用して、全てのモードに一般化することができることに留意されたい。
【0232】
上述するように、順方向予測は、分離された欠落ピクセルを含む予測画像を生成し得る。現在まで、ホール充填プロセスを使用して、分離された欠落ピクセルを充填した。しかしながら、ホール充填プロセスは、実ピクセルの近似のみを提供する。
【0233】
実施形態の変形例では、双方向実施形態と修正された重み付けを有する実施形態と呼ばれる実施形態WPの変形例では、重み付けプロセスは、予測画像のサンプル(すなわち、ピクセル)の信頼度を表す値を考慮に入れるように修正される。この変形例では、現在のブロックのサンプルScurrは、次のようにして取得される。
【0234】
【数21】
ここで、Mask
0は、サンプルw
0の信頼度に依存し、Mask
1はサンプルw
1の信頼度に依存する。
【0235】
修正された重み付けを有する実施形態の第1の変形例では、Mask0(Mask1)は、サンプルS0(S1)がホール充填によって取得される場合にはゼロに等しく、そうでなければ「1」に等しい。Mask0=Mask1=0の場合、処理モジュール20は、デフォルト値をScurrに提供する。
【0236】
修正された重み付けを有する実施形態の第2の変形例では、Mask0(Mask1)は、サンプルS0(S1)がホール充填によって取得される場合には低い正の値(例えば「1」に設定され、そうでなければ高い正の値(例えば「10000」)に設定される。言い換えれば、サンプルS0(S1)がホール充填によって取得される場合の値Mask0(Mask1)は、サンプルS0(S1)が順投影によって取得される場合のMask0(Mask1)よりも低い。
【0237】
修正された重み付けを有する実施形態の第3の変形例では、サンプルの信頼度は、当該サンプルとその近傍のサンプルとの類似性に依存する。例えば、近傍のサンプルと類似するサンプルS0(S1)は、近傍のサンプルと異なるサンプルS0(S1)に関連付けられたMask0(Mask1)の値よりも高いMask0(Mask1)の値に関連付けられる。2つのサンプル間の差は、例えば、2つのサンプルの値間の差の平方根として計算される。
【0238】
修正された重み付けを有する実施形態の第4の変形例では、サンプルの信頼度は、当該サンプルと近傍のサンプルとの類似性、及び当該サンプル(ホール充填又は直接順投影)を得るために適用されるプロセスに依存する。
【0239】
修正された重み付けを有する実施形態の第5の変形例では、予測画像のサンプルの信頼度は、ピクセルレベルの代わりにブロックレベル(典型的にはサイズ4×4)で計算される。ブロックのサンプルに関連付けられた値Mask0(Mask1)は、当該ブロックのサンプルの平均信頼度に依存する。
【0240】
修正された重み付けを有する実施形態の第6の変形例では、予測画像のサンプルの信頼度は、その深度値の他の深度マップとの一致に依存する。ビューnの深度Dnでのサンプル位置Pnのビューmへの順投影は、深度Dmでのサンプル位置Pmに対応している。サンプル位置Pnにおける深度Dnは、深度Dmでのサンプル位置Pmのビューnへの順投影がサンプル位置Pnに達している場合、一致した深度とみなされる。そうでなければ、サンプル位置における深度Dnは、ビューmと一致しているとはみなされない。同じプロセスが他のビューにも適用され、次いで、同じ位置Pnにおける深度Dnについてのスコアが、不一致と完全一致との間で確立され得る。サンプルの信頼度は、その深度の一致に比例する。
【0241】
場合によっては、双方向インター予測モード又は加重予測を使用して予測されるブロックは、予測画像からの1つの基準ブロックと、順方向予測によって取得されない画像からの1つの基準ブロックとを使用することができる。修正された加重を有する実施形態の第3、第4、第5、及び第6の変形例では、順方向予測によって取得されない画像のサンプルは、可能な限り最も高い信頼度を有するサンプルとみなされる。例えば、Mask0(Mask1)の可能な値が、
・「0」及び「1」の場合、順予測によって取得されない画像のサンプルは、「1」に等しい値Mask0(Mask1)と関連付けられる、
・「1」と「10000」の場合、順予測によって取得されない画像のサンプルは、と「10000」に等しい値Mask0(Mask1)と関連付けられる、
・「0」と「1」との間の場合、順予測によって取得されない画像のサンプルは、「1」に等しい値Mask0(Mask1)と関連付けられる、
・「1」と「10000」との間の場合、順予測によって取得されない画像のサンプルは、「10000」に等しい値Mask0(Mask1)と関連付けられる。
【0242】
デコーダ側の負担を軽減し、ビュー間予測を使用する準拠デコーダの最大複雑さの上限を定めるため、現在のビューと予測画像を生成するために使用されるビューとの間の関係は、符号化MVDデータに対応する符号化ビデオストリーム(例えば、符号化ビデオストリーム511及び/又は511B)でシグナリングされる。このシグナリングから、デコーダは、有利なことに、予測画像を予め計算することができる。そのようなアプローチの利点は、基準ピクチャバッファ充填(すなわち、DPB充填)のみが修正されるため、非常に少ない変更でのレガシーデコーダの使用を可能にすることである。
【0243】
以下では、予測画像又は集約予測画像を再構成することを可能にし、上記の実施形態に適合された情報を表す、view_parameterと呼ばれるシンタックス要素を提案する。一実施形態では、当該シンタックス要素view_parameterは、スライスヘッダのレベルで符号化ビデオストリームに挿入される。別の実施形態では、シンタックス要素view_parameterは、シーケンスヘッダ(すなわち、シーケンスパラメータセット(SPS))、1つの画像の又は複数の画像によって共有される画像ヘッダ(すなわち、ピクチャパラメータセット(PPS))に、又は同期点若しくは画像のレベルで、符号化ビデオストリーム(例えば、IDR(瞬時復号化リフレッシュ)画像のヘッダ)に挿入される。当該シンタックス要素を受信するたびに、デコーダは、ビュー間の関係の知識を更新することができる。
【0244】
【0245】
表 TAB2は、1つの予測画像のみ又は1つの集約予測画像のみが、1つの予測画像のみが現在のビューのDPBに挿入される実施形態(典型的には、1つの予測画像のみが生成される、又は1つの集約予測画像のみが生成される実施形態(14A)、(14B)、(16)に適合されたシンタックス要素view_parameterの第1のバージョンを表す。
【0246】
シンタックス要素view_parameterの第1のバージョンは、現在のビューの一意の識別子を表すパラメータview_idを含む。現在のビューがフレームについて復号された第1のビューではない場合、フラグvsp_flagは、vspモードが現在のビューに使用されているか否かを示す。パラメータnumber_of_inter_view_predictor_usedは、現在のビューを復号化するために使用された(既に復号化された)最大数のビューを表す。パラメータpredictor_id[view_id][i]は、現在のビューの予測画像を作成するために使用される各ビューの識別子を提供する。一実施形態では、現在のビューを復号化するために使用されるビューの最大数は、「8」に固定される。その場合、パラメータpredictor_id[view_id]を符号化するために「3」ビットが必要である。
【0247】
当然のことながら、第1のビューと第2のビューとの間のビュー間予測は、2つのビューのカメラパラメータがデコーダ側で利用可能である場合、すなわち、表 TAB1に記載されたSEIメッセージがデコーダによって受信及び符号化された場合にのみ可能である。
【0248】
【0249】
表 TAB3は、複数の予測画像及び/又は集約予測画像が、現在のビューのDPBに挿入される実施形態(典型的には、複数の予測画像又は集約予測画像が生成される実施形態(15)及び(16))に適合されたシンタックス要素view_parameterの第2のバージョンを表す。
【0250】
その場合、現在のビューは、複数の基準ビューに関連付けることができる。シンタックス要素view_parameterの第2のバージョンでは、パラメータnumber_inter_view_predictor_minus1は、パラメータview_idによって特定された現在のビューのビュー間予測に使用される予測画像又は集約予測画像の数を指定する。パラメータnumber_inter_view_predictor_used_minus1は、各予測画像又は集約予測画像について、当該予測画像又は集約予測画像を生成するために使用される基準ビューの数を指定する。予測画像の場合、パラメータparameter number_inter_view_predictor_used_minus1は、1つに設定される。パラメータpredictor_idは、予測画像又は集約予測画像を生成するためにどのビューが使用されるかを指定する。
【0251】
表 TAB2及びTAB3から分かるように、VSPモードは、フラグvsp_flagによって、シンタックス要素view_parameterのスライスヘッダレベルでアクティブ化することができる。
【0252】
スライスレベルでのシグナリングは、このスライスに含まれるブロックがVSPモードを潜在的に使用することができるかどうかをデコーダに伝えることを可能にする。しかしながら、スライス内のどのブロックが実際にVSPモードを使用するかを指定するものではない。
【0253】
一実施形態では、スライスレベルでアクティブ化されると、VSPモードの実際の使用がブロックレベルでシグナリングされる。
【0254】
図17は、VSPモードを使用しないビデオ圧縮方法のシンタックス解析プロセスの基本的な実施形態を概略的に示す。
【0255】
図17の基本的な実施形態は、表 TAB4に記載されるブロック(予測ユニット(PU)とも呼ばれる)のシンタックスに基づく。この基本的な実施形態は、現在のブロックを復号化するときにデコーダによって実行される。しかしながら、エンコーダは、デコーダが復号化することができるものに準拠したシンタックスを符号化する。
【0256】
ステップ1700では、処理モジュール20は、現在のブロックがスキップモードで符号化されているかどうかを判定する。はいの場合、処理モジュール20は、現在のブロックについての識別子merge_idxを復号化する。識別子merge_idxは、現在のブロックの近傍のどの候補ブロックが現在のブロックを復号化する情報を提供するかを識別する。識別子merge_idxの復号化の後、スキップモードに適合された復号化プロセスを適用する現在のブロックの復号化が続く。
【0257】
現在のブロックがスキップモードで符号化されていない場合、ステップ1701で、処理モジュール20は、現在のブロックがイントラモードで符号化されているかどうかを判定する。はいの場合、ステップ1702で、現在のブロックがイントラモード復号化プロセスを使用して復号化される。
【0258】
現在のブロックがイントラモードで符号化されていない場合、ステップ1703で、処理モジュールは、現在のブロックがマージモードに符号化されているかどうかを判定する。現在のブロックがマージモードで符号化されている場合、処理モジュールは、ステップ1704で、現在のブロックのための識別子merge_idxを復号化する。識別子merge_idxの復号化の後に、マージモードに適合された復号化プロセスを適用する現在のブロックの復号化が続く。
【0259】
現在のブロックがマージモードで符号化されていない場合、ステップ1705で、処理モジュール20は、現在のブロックが双方向又は一方向インター予測モードで符号化されているかどうかを判定する。
【0260】
現在のブロックが一方向インター予測モードで符号化されている場合、ステップ1705の後にステップ1712が続き、処理モジュール20は、DPBに記憶された基準画像のリスト内の1つのインデックス(ref_idx_l0又はref_idx_l1)を復号化する。このインデックスは、どの基準画像が現在のブロックに対する予測子ブロックを提供するかを示す。
【0261】
ステップ1713では、処理モジュール20は、現在のブロックについて動きベクトル精密化mvdを復号化する。
【0262】
ステップ1714では、処理モジュール20は、動きベクトル予測子を指定する動きベクトル予測子インデックスを復号化する。この動き情報を用いて、処理モジュール20は、現在のブロックを復号化する。
【0263】
現在のブロックが双方向予測モードで符号化されるとき、ステップ1705に続いてステップ1706が続き、その間に処理モジュール20は、DPBに記憶された基準画像のリスト内の第1のインデックスを復号化する(ref_idx_l0)。
【0264】
ステップ1707では、処理モジュール20は、現在のブロックについて第1の動きベクトル精密化mvdを復号化する。
【0265】
ステップ1708では、処理モジュール20は、第1の動きベクトル予測子を指定する第1の動きベクトル予測子インデックスを復号化する。
【0266】
ステップ1709では、処理モジュール20は、DPBに記憶された基準画像のリスト内の第2のインデックス(ref_idx_l1)を復号化する。
【0267】
ステップ1710では、処理モジュール20は、現在のブロックについて第2の動きベクトル精密化mvdを復号化する。
【0268】
ステップ1711では、処理モジュール20は、第2の動きベクトル予測子を指定する第2の動きベクトル予測子インデックスを復号化する。
【0269】
この動き情報を用いて、処理モジュール20は、2つの予測子を生成し、これら2つの予測子を使用して現在のブロックを復号化する。
【0270】
【0271】
図18は、新しいVSPモードを使用したビデオ圧縮方法のシンタックス解析プロセスの第1の実施形態を概略的に示す。
【0272】
以下で実施形態(18)と呼ばれる
図18の実施形態は、表 TAB5に記載のブロックのシンタックスに基づく。表 TAB4及び表 TAB5のシンタックス間の違いは太字で表される。この実施形態は、現在のブロックを復号化するときにデコーダによって実行される。しかしながら、エンコーダは、デコーダが復号化することができるものに準拠したシンタックスを符号化する。
【0273】
【0274】
以下に記載されるように、実施形態(18)において、VSPモードの使用は、ブロックレベルで、フラグVSPによりシグナリングされる。フラグVSP=1の場合、VSPモードが現在のブロックに対してアクティブ化される。そうでなければ、VSPモードは非アクティブ化される。更に、実施形態(18)では、ブロックがVSPモードで符号化されるとき、予測子ブロックは、現在のブロックと同じ場所に配置される。その結果、基準画像(その場合の予測画像又は集約予測画像である)からブロック予測子を得るために、動きベクトルは必要ない。更に、
図18に関連して後述するように、2つの予測子ブロックが同じ予測画像又は集約予測画像から抽出される場合、VSPモードと双方向インター予測との組み合わせは不可能である。実際、VSPモードでは、各予測子は現在のブロックと同じ位置に配置されるため、双方向インター予測の場合、2つの予測子ブロックは同じである。
【0275】
実施形態(18)のシンタックス及び解析方法は、1つのみの予測画像又が集約予測画像が現在の層のDPBに挿入されるときの実施形態(14A)、(14B)、及び(16)に適合される。
【0276】
ステップ1800では、処理モジュール20は、現在のブロックがスキップモードで符号化されているかどうかを判定する。はいの場合、処理モジュール20は、ステップ1804で、現在のブロックについての識別子merge_idxを復号化する。識別子merge_idxの復号化後、スキップモードに適合された復号化プロセスを適用する現在のブロックの復号化を行う。
【0277】
現在のブロックがスキップモードで符号化されていない場合、ステップ1801で、処理モジュール20は、現在のブロックがイントラモードで符号化されているかどうかを判定する。はいの場合、ステップ1802で、現在のブロックがイントラモード復号化プロセスを使用して復号化される。
【0278】
現在のブロックがイントラモードで符号化されていない場合、ステップ1803で、処理モジュールは、現在のブロックがマージモードに符号化されているかどうかを判定する。現在のブロックがマージモードで符号化されている場合、処理モジュールは、ステップ1806で、現在のブロックのための識別子merge_idxを復号化する。識別子merge_idxの復号化の後に、マージモードに適合された復号化プロセスを適用する現在のブロックの復号化が続く。
【0279】
現在のブロックがマージモードで符号化されていない場合、ステップ1807で、処理モジュール20は、現在のブロックが双方向又は一方向インター予測モードで符号化されているかどうかを判定する。
【0280】
現在のブロックが一方向インター予測モードで符号化されている場合、ステップ1807の後にステップ1808が続き、処理モジュール20は、フラグVSPを復号化して、現在のブロックがVSPモードで符号化されているかどうかを判定する。現在のブロックがVSPモードで符号化されている場合、処理モジュール20は、VSPモード復号化プロセスに従って現在のブロックを復号化する。言い換えれば、現在のブロックは、現在のビューのDPBに記憶された予測画像(又は集約予測画像)のブロックから予測される。その場合、DPB内の予測画像(又は集約予測画像)の位置は暗黙的であり、デコーダによって既知である(すなわち、予測画像(又は集約予測画像)は、体系的にDPB内の同じ位置にある)。
【0281】
現在のブロックがVSPモードで符号化されていない場合、ステップ1808の後にステップ1810が続き、処理モジュール20は、DPBに記憶された基準画像のリスト内の1つのインデックス(ref_idx_l0又はref_idx_l1)を復号化する。
【0282】
ステップ1811では、処理モジュール20は、現在のブロックについて動きベクトル精密化mvdを復号化する。
【0283】
ステップ1812では、処理モジュール20は、動きベクトル予測子を指定する動きベクトル予測子インデックスを復号化する。この動き情報を用いて、処理モジュール20は、現在のブロックを復号化する。
【0284】
現在のブロックが双方向予測モードで符号化されるとき、ステップ1807の後にステップ1813が続き、処理モジュール20がフラグVSPを復号化して、現在のブロックの第1の予測ブロックが予測画像から(又は集約予測画像から)取得されたかどうかを判定する。現在のブロックの第1の予測ブロックが予測画像から(又は集約予測画像から)取得される場合、ステップ1809と同一のステップ1814で、第1の予測子ブロックが取得される。ステップ1814の後にステップ1819が続き、処理モジュール20が、DPBに記憶された基準画像のリスト内のインデックス(ref_idx_l1)を復号化する。
【0285】
ステップ1820では、処理モジュール20は、現在のブロックについて動きベクトル精密化mvdを復号化する。
【0286】
ステップ1821では、処理モジュール20は、動きベクトル予測子を指定する動きベクトル予測子インデックスを復号化する。ステップ1819、1820及び1821で取得された動き情報を用いて、処理モジュール20は、第2の予測子ブロックを決定する。これら2つの予測子を用いて、処理モジュール20は、現在のブロックを復号化する双方向予測子aを決定する。
【0287】
現在のブロックの第1の予測ブロックが予測画像から(又は集約予測画像から)取得されない場合、処理モジュールは、ステップ1810、1811及び1812とそれぞれ同一のステップ1815、1816、及び1817を実行して、第1の予測子を取得する。
【0288】
ステップ1818では、処理モジュール20は、フラグVSPを復号化して、現在のブロックの第2の予測ブロックが予測画像から(又は集約予測画像から)取得されるかどうかを判定する。現在のブロックの第2の予測ブロックが予測画像から(又は集約予測画像から)取得される場合、ステップ1809と同一のステップ1822で、第2の予測子ブロックが取得される。第1及び第2の予測子ブロックを使用して、処理モジュールは、現在のブロックを復号化する。
【0289】
現在のブロックの第2の予測ブロックが予測画像から(又は集約予測画像から)取得されない場合、ステップ1819において、処理モジュール20は、DPBに記憶された基準画像のリスト内の第2のインデックスを復号化する(ref_idx_l1)。
【0290】
ステップ1820では、処理モジュール20は、現在のブロックについて第2の動きベクトル精密化mvdを復号化する。
【0291】
ステップ1821では、処理モジュール20は、第2の動きベクトル予測子を指定する第2の動きベクトル予測子インデックスを復号化する。
【0292】
ステップ1815、1816、1817、1819、1820、及び1821で取得された動き情報により、処理モジュール20は、現在のブロックを復号化する。
【0293】
実施形態(18)の変形例では、ステップ1804で、処理モジュール20は、現在のブロックのVSPフラグを復号化する。VSPモードが現在のブロックについてアクティブ化される場合、処理モジュール20は、ステップ1809と同一のステップ1805を実行する。VSPモードが現在のブロックに対してアクティブ化されない場合、処理モジュール20はステップ1806を実行する。
【0294】
図19は、新しいVSPモードを使用したビデオ圧縮方法のシンタックス解析プロセスの第2の実施形態を概略的に示す。
【0295】
以下「実施形態(19)」と呼ばれる
図19の実施形態は、表 TAB6に記載のブロックのシンタックスに基づく。表 TAB4及び表 TAB6のシンタックス間の違いは太字で表される。この実施形態は、現在のブロックを復号化するときにデコーダによって実行される。しかしながら、エンコーダは、デコーダが復号化することができるものに準拠したシンタックスを符号化する。
【0296】
【0297】
実施形態(19)は、実施形態(18)と非常に類似している。実施形態(19)は、VSPモードで符号化されたブロックのシンタックスが、動きベクトル差mvdを表すシンタックス要素を含むという点で、実施形態(18)とは異なる。この特徴の結果は、2つの予測子ブロックが同じ予測画像又は集約予測画像から抽出されるときのVSPモードと双方向インター予測との組み合わせが現在可能であることである。実際、実施形態(19)では、動きベクトル差mvdの存在は、2つの異なる予測子ブロックを取得することを可能にする。
【0298】
実施形態(19)のシンタックス及び解析方法は、1つのみの予測画像又は集約予測画像が現在の層のDPBに挿入されるときの実施形態(14A)、(14B)、及び(16)に適合される。
【0299】
実施形態(19)は、ステップ1800~1808、1810~1813、1815~1821とそれぞれ同一のステップ1900~1908、1910~1913、1915~1921を含む。
【0300】
VSPモードが現在のブロックに対してアクティブ化されるとき、ステップ1908の後にステップ1909が続き、動きベクトル差mvdが現在のブロックに対して計算される。この動きベクトル差mvdは、予測画像又は集約予測画像内の予測子ブロックを指定することを可能にする。次いで、当該予測子が、現在のブロックを復号化するために使用される。
【0301】
VSPフラグが、現在のブロックの第1の予測子が予測画像又は集約予測画像から生成されることを指定する場合、ステップ1913の後にステップ1914が続き、動きベクトル差mvdが現在のブロックについて計算される。この動きベクトル差mvdは、予測画像又は集約予測画像内の第1の予測子ブロックを指定することを可能にする。
【0302】
ステップ1914の後にステップ1918が続く。VSPフラグが、現在のブロックの第2の予測子が予測画像又は集約予測画像から生成されることを指定する場合、ステップ1918の後にステップ1922が続き、動きベクトル差mvdが現在のブロックについて計算される。この動きベクトル差mvdは、予測画像又は集約予測画像内の第2の予測子ブロックを指定することを可能にする。現在のブロックは、双方向予測モードとして第1及び第2の予測子から復号化される。
【0303】
ステップ1905はステップ1909と同一であることに留意されたい。
【0304】
図20は、新しいVSPモードを使用したビデオ圧縮方法のシンタックス解析プロセスの第3の実施形態を概略的に示す。
【0305】
以下の「実施形態(20)」と呼ばれる
図20の実施形態は、表 TAB7に記載のブロックのシンタックスに基づく。表 TAB4及び表 TAB7のシンタックス間の違いは太字で表される。この実施形態は、現在のブロックを復号化するときにデコーダによって実行される。しかしながら、エンコーダは、デコーダが復号化することができるものに準拠したシンタックスを符号化する。
【0306】
実施形態(20)は、実施形態(19)と非常に類似している。実施形態(20)は、VSPモードで符号化されたブロックのシンタックスが、動きベクトル差mvdを表すシンタックス要素を含まないが、DPBに記憶された基準画像のリストに少なくとも1つのインデックス(ref_idx2_l0又はref_idx2_l1)を含むという点で、実施形態(19)とは異なる。このインデックスは、どの予測画像が現在のブロックの予測子ブロックを提供するかを示す。この特徴の結果として、VSPモードと双方向インター予測との組み合わせが可能となる。実際、実施形態(20)では、2つの異なる予測画像(又は集約予測画像)を指定する双方向インター予測の場合の2つのインデックスの存在は、2つの異なる予測子ブロックを取得することを可能にする。
【0307】
実施形態(20)のシンタックス及び解析方法は、複数の予測画像又は集約予測画像が現在の層のDPBに挿入されるときに、実施形態(15)及び(16)に適合される。
【0308】
実施形態(20)は、ステップ1900~1908、1910~1913、1915~1921とそれぞれ同一であるステップ2000~2008、2010~2013、2015~2021を含む。
【0309】
実施形態(19)のステップ1909は、実施形態(20)のステップ2009によって置き換えられる。ステップ2009では、処理モジュール(20)は、現在のブロックを含む画像に時間的に対応する(すなわち、同じフレーム内の)予測画像又は集約予測画像の中の基準画像のリストl0(又はl1)内のインデックスを表すシンタックス要素ref_idx2_l0(又はref_idx2_l1)を復号化する。処理モジュール20は、インデックスref_idx2_l0(又はref_idx2_l1)によって指定された予測画像(又は集約予測画像)から、現在のブロックと空間的に同じ位置に配置される予測子ブロックを抽出する。次いで、処理モジュールは、取得された予測子ブロックを使用して現在のブロックを復号化する。
【0310】
実施形態(19)のステップ1914は、実施形態(20)のステップ2014によって置き換えられる。ステップ2014では、処理モジュール(20)は、現在のブロックを含む画像に時間的に対応する(すなわち、同じフレーム内の)予測画像又は集約予測画像のうち使用する基準画像の第1のリストl0内のインデックスを表すシンタックス要素ref_idx2_l0を復号化する。処理モジュール20は、インデックスref_idx2_l0によって指定された予測画像(又は集約予測画像)から、現在のブロックと空間的に同じ位置に配置される第1の予測子ブロックを抽出する。
【0311】
実施形態(19)のステップ1922は、実施形態(20)のステップ2022によって置き換えられる。ステップ2022では、処理モジュール(20)は、現在のブロックを含む画像に時間的に対応する(すなわち、同じフレーム内の)予測画像又は集約予測画像のうち使用する基準画像の第2のリストl1内のインデックスを表すシンタックス要素ref_idx2_l1を復号化する。処理モジュール20は、インデックスref_idx2_l1によって指定された予測画像(又は集約予測画像)から、現在のブロックと空間的に同じ位置に配置される第2の予測子ブロックを抽出する。
【0312】
ステップ2021又は2022の後、処理モジュール20は、双予測インターモードで、第1及び第2の予測子を使用して現在のブロックを復号化する。
【0313】
ステップ2005は、ステップ2009と同一であることに留意されたい。
【0314】
【0315】
図21は、新しいVSPモードを使用したビデオ圧縮方法のシンタックス解析プロセスの第4の実施形態を概略的に示す。
【0316】
以下、実施形態(21)と呼ばれる
図21の実施形態は、表 TAB8に記載されるブロックのシンタックスに基づく。表 TAB4及び表 TAB8のシンタックス間の違いは太字で表される。この実施形態は、現在のブロックを復号化するときにデコーダによって実行される。しかしながら、エンコーダは、デコーダが復号化することができるものに準拠したシンタックスを符号化する。
【0317】
実施形態(21)は、実施形態(18)と非常に類似している。しかしながら、実施形態(21)では、ブロックレベルでのVSPモードの使用は、フラグVSPによって明示的に指定される代わりに、基準画像のインデックス(ref_idx_l0又はref_idx_l1)から推測される。
【0318】
実施形態(21)のシンタックス及び解析方法は、1つのみの予測画像又は集約画像が現在の層のDPBに挿入されるときの実施形態(14A)、(14B)、及び(16)に適合される。
【0319】
実施形態(21)は、ステップ1800~1803、1805~1807、1809~1812、1814~1817、1819~1822とそれぞれ同一であるステップ2100~2103、2105~2107、2109~2112、2114~2117、2119~2122を含む。
【0320】
ステップ2104では、予測画像又は集約予測画像に対応する基準画像のリスト内の基準画像を指定するインデックスref_idx2_l0又はインデックスref_idx2_l1が識別子merge_idxによって指定される候補ブロックから受け継がれる場合、処理モジュール20は、VSPモードが現在のブロックについてアクティブ化されたと考える。
【0321】
ステップ2108では、リストl0内の基準画像を指定するインデックスref_idx_l0が、予測画像又は集約予測画像を指定する場合、VSPモードは、現在のブロックについてアクティブ化されたと考える。例えば、ref_idx_l0=0は、予測画像又は集約予測画像に対応する基準画像を示す。
【0322】
ステップ2113では、基準画像のリストl0内の基準画像を指定するインデックスref_idx_l0が予測画像又は集約予測画像を指定する場合、処理モジュール20は、現在のブロックの第1の予測子が、予測画像又は集約予測画像から取得されると考える。
【0323】
ステップ2118では、基準画像のリストl1内の基準画像を指定するインデックスref_idx_l1が予測画像又は集約予測画像を指定する場合、処理モジュール20は、現在のブロックの第2の予測子が、予測画像又は集約予測画像から取得されると考える。例えば、ref_idx_l1=0は、予測画像又は集約予測画像に対応する基準画像を指定する。
【0324】
【0325】
表 TAB8のシンタックスにおいて、動きベクトル差mvd及び動きベクトル予測子インデックスmvpは、関数is_vsp_generatedが偽に戻るときにのみ復号化される。この関数is_vsp_generatedは、以下のように定義される。
【0326】
is_vsp_generated(idx)は、
・基準インデックスidxが同じフレーム内のビューから生成されたフレームを指す場合、真に戻り、
・そうでない場合、偽に戻る。
【0327】
以下、実施形態(18bis)と呼ばれる実施形態(18)の変形例では、現在のブロックがマージモード又はスキップモードで符号化されている場合、フラグVSPは、現在のブロックについて符号化されない。その場合、処理モジュール20は、まず識別子merge_idxを復号化し、識別子merge_idxによって指定された候補ブロックがVSPモードで符号化されたかどうかを判定する。候補ブロックがVSPモードで符号化された場合、現在のブロックは、候補ブロックからVSPパラメータを受け継ぎ、現在のブロックは、これらのパラメータを使用して復号化される。そうでなければ、現在のブロックは、通常のマージモード復号化プロセスを適用して復号化される。この実施形態(18bis)は、表 TAB9に記載されるブロックのシンタックスに基づく。
【0328】
実施形態(18)、(18bis)、(19)、(20)、及び(21)を組み合わせて、追加の実施形態を得ることができる。
【0329】
例えば、VSPモードで符号化された現在のブロックのシンタックスは、動きベクトル差mvdと、現在のブロックを含む画像に時間的に対応する(すなわち、同じフレーム内の)予測画像又は集約予測画像のうち使用する基準画像の第1のリストl0及び/又は第2のリストl1内のインデックスを表すシンタックス要素ref_idx2_l0及び/又はref_idx2_l1とを復号化する。これは、実施形態(19)及び(20)の組み合わせに対応する。
【0330】
別の例では、VSPモードで符号化された現在のブロックのシンタックスは、動きベクトル差mvdを含むことができ、VSPモードの使用は、フラグ表示VSPによって示される代わりに、シンタックス要素ref_idx_l0及び/又はref_idx_l1から推測することができる。これは、実施形態(19)及び(21)の組み合わせに対応する。
【0331】
別の例では、VSPモードで符号化された現在のブロックのシンタックスは、シンタックス要素ref_idx2_l0及び/又はref_idx2_l1を含むことができ、VSPモードの使用は、フラグ表示VSPによって示される代わりに、シンタックス要素ref_idx_l0及び/又はref_idx_l1から推測することができる。これは、実施形態(20)及び(21)の組み合わせに対応する。
【0332】
他の例では、
・実施形態(18)は、実施形態(19)、(20)、及び(21)と組み合わせることができる。
・実施形態(19)、(20)、及び(21)は、組み合わせることができる。
・実施形態(19)、(20)、(21)、及び(22)は、組み合わせることができる、
・など。
【0333】
【0334】
現在まで、ビュー間予測に使用される投影画像(又は集約投影画像)は、各ピクセルテクスチャデータ及び深度データを含むと考えられていた。MI(動き情報)ベースのVSP実施形態と呼ばれる別の実施形態では、予測画像(及び集約予測画像)は、各ピクセル又はピクセルのサブセットの動き情報のみを含むMI(動き情報)予測画像(又はMI集約予測画像)と呼ばれる画像によって置き換えられる。
【0335】
MIベースのVSP実施形態では、
図13Aの順投影プロセスは、追加のステップ133を含む。ステップ133では、処理モジュール20は、ステップ130~132の順投影によって取得されたピクセルP’(u’、v’)と、投影ピクセルP(u、v)との間の変位を表す動きベクトルMVを計算する。この動きベクトルMVは、MI予測画像に記憶されるように意図される。
【0336】
以下では、実施形態(14A)、(14B)、(15)、及び(16)に対するMIベースのVSP実施形態の影響を説明する。
【0337】
MIベースのVSP実施形態では、実施形態(14A)は修正され、実施形態(14A_MI)になる。実施形態(14A_MI)は、
図22Aで表される。
【0338】
実施形態(14A_MI)の第1のステップは、実施形態(14A)に関連して既に説明されたステップ140である。
【0339】
ステップ141_MIでは、処理モジュール20は、基準ビュー(例えば、第1のビュー501)と現在のビュー(例えば、第2のビュー501B)との間でステップ130~133の順投影を適用してMI予測画像MI(k)を生成する。MI予測画像MI(k)は、現在のビューのDPB(例えば、DPB519B(619B))に導入されて、現在のビューの現在の画像についての第Kthの予測画像のうちの1つになることを意図している。
【0340】
ステップ142_MIでは、処理モジュール20は、分離された欠落動き情報を満たす。一実施形態では、分離された欠落動き情報は、隣接するピクセル動き情報で満たされる。別の実施形態では、分離された欠落動き情報は、デフォルト値(典型的には、動きベクトル=(0,0))で満たされる。別の実施形態では、分離された欠落動き情報は無効とみなされ、動き情報の有効性を表すフラグは、各動き情報と関連付けられている。
【0341】
ステップ143_MIでは、処理モジュール20は、現在のビューのDPBにMI予測画像MI(k)を記憶する。
【0342】
ステップ144_MIでは、処理モジュール20は、現在のビューのDPBに含まれる基準画像を使用して現在のビューの現在の画像を再構成し、DPBは、MI予測画像MI(k)を含む。MI予測画像MI(k)は、処理モジュール20によって使用されて、予測画像G(k)を生成する。実際、MI予測画像MI(k)に含まれる動き情報は、基準画像内のこの動き情報によって指定された各ピクセルに動き補償を適用するために使用される。
【0343】
任意選択で、実施形態(14A_MI)は、MI予測画像MI(k)における動き情報の量を低減することからなるステップ220を含む。実際、画像の各ピクセル位置についての動き情報を有することは、大量のデータを表す。一実施形態では、MI予測画像MI(k)は、サイズN×Mのブロックに分割され、N及びMは2の倍数であり、当該MI予測画像MI(k)の幅及び高さよりも小さい。各N×Mブロックに対して、1つの動き情報のみが保持される。言い換えれば、動き情報は、係数N×Mによってサブサンプリングされる。一実施形態では、N=M=4であり、1つの動き情報は「16」個の動き情報から除外される。
【0344】
一実施形態では、サブサンプリングは、各ブロックについて、N×M動き情報内の1つの特定の動き情報を選択することからなる。
【0345】
一実施形態では、サブサンプリングは、各ブロックについて、N×M動き情報の中央値を選択することからなる(中央値は、動きベクトルのノルムを使用して計算される)。
【0346】
一実施形態では、サブサンプリングは、N×M動き情報内で最も良く出現する動き情報を選択することからなる。
【0347】
一実施形態では、サブサンプリングは、サブブロック全体のビュー(zバッファアルゴリズム)の最小深度に対応する動き情報を選択することからなる。
【0348】
一実施形態では、サブサンプリングは、N×M動き情報のうちの第1の投影値を保持することからなる。
【0349】
MIベースのVSP実施形態では、実施形態(14B)は修正され、実施形態(14B_MI)になる。実施形態(14B_MI)は、
図22Bに示される。
【0350】
実施形態(14B)と比較すると、実施形態(14B_MI)では、ステップ1412は、ステップ1412_MIによって置き換えられ、ステップ1415は、ステップ1415_MIによって置き換えられる。
【0351】
ステップ1412では、処理モジュール20は、ビューjと現在のビューとの間でステップ130~133の順投影方法を適用してMI予測画像MI(k)jを生成する。
【0352】
ステップ1415_MIでは、処理モジュール20は、予測画像MI(k)jから集約MI予測画像MI(k)を計算し、このMI予測画像MI(k)は、現在のビューのDPBに記憶されることを意図している。
【0353】
集約プロセスの一実施形態では、予測画像MI(k)jは、複数のMI予測画像のうちの第1のMI予測画像MI(k)jの動き情報を保持することによって集約される。第1のMI予測画像は、例えば、予測画像MI(k)j=0である。
【0354】
集約プロセスの一実施形態では、MI予測画像MI(k)jは、現在のビューに最も近いビューjから生成されたMI(k)jの動き情報を保持することによって集約される。いくつかのビューが現在のビューから同じ距離にある場合(すなわち、いくつかの最も近いビューがある)、いくつかの最も近いビューのうちの最も近いビューがランダムに選択される。例えば、カメラアレイ10では、カメラ10Aによって生成された第1のビュー及びカメラ10Cによって生成された第2のビューのみが、カメラ10Bによって生成された現在のビューを予測するために利用可能であると仮定する。次いで、第1及び第2のビューは、現在のビューに最も近いビューであり、現在のビューまで同じ距離にある。第1及び第2のビューのうちの1つが、動き情報をMI集約予測画像MI(k)に提供するように選択される。
【0355】
集約プロセスの一実施形態では、MI予測画像MI(k)jは、最良の質を有する予測画像MI(k)jの動き情報を保持することによって集約される。例えば、ピクセルの質を表す情報は、当該ピクセルを含む変換ブロックに適用される量子化パラメータの値である。
【0356】
集約プロセスの一実施形態において、MI予測画像MI(k)jは、最も近い深度値(zバッファアルゴリズム)を有する予測画像MI(k)jの動き情報を保持することによって集約される。
【0357】
集約プロセスの一実施形態では、MI予測画像MI(k)jは、集約予測画像MI(k)jの隣接ピクセルが既に予測画像から予測されるときに、予測画像MI(k)jのピクセル値(テクスチャ値及び深度値)を保持することによって集約される。
【0358】
集約プロセスの一実施形態では、MI予測画像MI(k)jは、MI予測画像MI(k)jの動き情報の平均、加重平均、中央値を計算することによって集約される。
【0359】
動き情報は、動きベクトルを表す情報、及び基準画像のリスト内の基準画像のインデックス(例えば、ref_idx_l0、ref_idx_l1、ref_idx2_l0、ref_idx2_l1)を表す情報を含むことに留意されたい。
【0360】
上記から分かるように、実施形態(14B_MI)では、サブサンプリング(ステップ220)は、集約MI予測画像MI(k)に対して実行される。実施形態(14B_MI)の変形例において、ステップ220のサブサンプリングは、各MI予測画像MI(k)jに対して行われる。
【0361】
上記から分かるように、実施形態(14B_MI)では、サブサンプリング(ステップ220)及び集約ステップ1415_MIは、別々のステップである。実施形態(14B_MI)の変形例では、サブサンプリングは集約ステップ中に実行される。
【0362】
MIベースのVSP実施形態では、実施形態(15)は修正され、実施形態(15_MI)になる。実施形態(15_MI)は、
図23に示される。
【0363】
実施形態(15)と比較すると、実施形態(15_MI)では、ステップ1502はステップ1502によって置き換えられ、ステップ1503はステップ1503_MIによって置き換えられ、ステップ1504はステップ1504_MIで置き換えられ、ステップ144はステップ144_MIで置き換えられる。
【0364】
ステップ1502_MIは、ステップ1412_MIと同一である。
【0365】
このステップ1503_MIは、ホール充填プロセスがMI予測画像MI(k)の代わりに、MI予測画像MI(k)の代わりにMI予測画像MI(k)jに適用されることを除いて、ステップ142_MIと同一である。
【0366】
ステップ1504_MIでは、予測画像MI(k)jが、現在のビューのDPBに格納される。
【0367】
実施形態(15_MI)におけるステップ144_MIは、現在のビューのDPBが、MI予測画像MI(k)jの数Nb_viewsを含むことを除いて、実施形態(14B_MI)のでステップ144_MIと同一である。
【0368】
実施形態(15_MI)の変形例では、サブサンプリングステップ220が、ステップ1503_MIと1504_MIとの間に導入される。
【0369】
実施形態(15_MI)の変形例において、予測画像MI(k)jに加えて、予測画像MI(k)jから生成された集約予測画像及び/又は予測画像MI(k)jのサブセットから生成された集約予測画像が、現在のビューのDPBに挿入される。
【0370】
実施形態(15_MI)の変形例において、予測画像MI(k)jの代わりに、予測画像MI(k)jから生成された集約予測画像と予測画像MI(k)jのサブセットから生成された集約予測画像が現在のビューのDPBに挿入される、又は予測画像MI(k)jのサブセットから生成された集約予測画像のみが現在のビューのDPBに挿入される。
【0371】
MIベースのVSP実施形態では、実施形態(16)は修正され、実施形態(16_MI)になる。実施形態(16_MI)は、
図25に示される。
【0372】
実施形態(16)と比較すると、実施形態(16_MI)では、ステップ164はステップ164_MIで置き換えられ、ステップ165はステップ165_MIで置き換えられ、ステップ141はステップ141_MIで置き換えられ、ステップ143はステップ143_MIで置き換えられ、ステップ142はステップ142_MIで置き換えられ、ステップ144はステップ144_MIで置き換えられる。
【0373】
実施形態(16_MI)におけるステップ141_MIは、実施形態(14A_MI)のステップ141_MIと同一である。
【0374】
実施形態(16_MI)におけるステップ143_MIは、実施形態(14A_MI)のステップ143_MIと同一である。
【0375】
実施形態(16_MI)におけるステップ142_MIは、実施形態(14A_MI)のステップ142_MIと同一である。
【0376】
実施形態(16_MI)におけるステップ144_MIは、実施形態(14A_MI)のステップ144_MIと同一である。
【0377】
ステップ164では、処理モジュール20は、基準ビューの画像のブロック番号nについて、基準ビューと現在のビューとの間に、ステップ130~133に記載の順投影方法を適用して動き情報の予測ブロックMIblock(n,k)を生成する。
【0378】
ステップ165_MIでは、処理モジュール20は、基準ビューの画像のブロック番号nの位置と同じ位置に、現在のビューのDPBにブロックMIblock(n,k)を記憶する。
【0379】
実施形態(16_MI)の変形例では、実施形態(14B)及び(15)と同様に、実施形態(16)を複数の基準ビューの画像に適用して、複数のMI予測画像を取得することができる。
【0380】
この変形例の実施形態では、複数のMI予測画像は、現在のビューのDPBに記憶される。
【0381】
この変形例の実施形態では、複数のMI予測画像は、MI集約予測画像を形成するように集約され、集約MI予測画像は、現在のビューのDPBに記憶される。
【0382】
この変形例の実施形態では、複数のMI予測画像の少なくとも1つのサブセットが集約されて、集約MI予測画像を形成し、各集約MI予測画像は、現在のビューのDPBに記憶される。
【0383】
この変形例の実施形態では、複数のMI予測画像の少なくとも1つのサブセットが集約されて、集約MI予測画像を形成し、各集約MI予測画像は、MI予測画像、及び複数の予測画像の全てを集約する集約MI予測画像に加えて、現在のビューのDPBに記憶される。
【0384】
双方向、WP、及び修正された重み付けを有する実施形態は、全てのMIベースのVSP実施形態(すなわち、実施形態(14A)、(14B)、(15)、及び(16))に同じように適用される。
【0385】
ここまで、動き情報は、動きベクトルを表す情報、及び基準画像のリスト内の基準画像のインデックス(例えば、ref_idx_l0、ref_idx_l1、ref_idx2_l0、ref_idx2_l1)を表す情報を含むと考えられる。MIベースのVSP実施形態の変形例では、MI予測画像MI(k)がサイズN×Mのブロックに分割されたとき、各N×Mブロックに関連付けられた動き情報は、動きベクトルを表す情報の代わりに、基準ビューのN×Mブロックのピクセルから現在のビュー内の現在のブロックのピクセルを決定することを可能にする疑似動きモデルのパラメータを含む。
【0386】
実施形態(18)及び(18bis)のシンタックス及び解析方法は、1つのみのMI予測画像又は集約MI予測画像が現在の層のDPBに挿入されるときの実施形態(14A_MI)、(14B_MI)、及び(16_MI)に適合される。
【0387】
実施形態(19)のシンタックス及び解析方法は、1つのみのMI予測画像又は集約MI予測画像が現在の層のDPBに挿入されるときの実施形態(14A_MI)、(14B_MI)、及び(16_MI)に適合される。
【0388】
実施形態(20)のシンタックス及び解析方法は、複数のMI予測画像又は集約MI予測画像が現在の層のDPBに挿入されるときの実施形態(15_MI)及び(16_MI)に適合される。
【0389】
実施形態(21)のシンタックス及び解析方法は、1つのみのMI予測画像又は集約MI予測画像のみが現在の層のDPBに挿入されるときの実施形態(14A_MI)、(14B_MI)、及び(16_MI)に適合される。
【0390】
実施形態(18)、(18bis)、(19)、(20)、及び(21)の特徴を組み合わせた実施形態は、MIベースのVSP実施形態にも適用される。
【0391】
以上、いくつかの実施形態について説明した。これらの実施形態の特徴は、単独で、又は任意の組み合わせで提供することができる。更に、実施形態は、様々な請求項のカテゴリ及びタイプにわたって、以下の特徴、デバイス、又は態様の1つ以上を、単独で、又は組み合わせで含むことができる。
・記載されたシンタックス要素又はそのバリエーションのうちの1つ又は複数を含むビットストリーム又は信号。
・記載されたシンタックス要素又はそのバリエーションのうちの1つ又は複数を含むビットストリーム又は信号を作成及び/又は送信及び/又は受信及び/又は復号化する。
・記載された実施形態のいずれかに従ってMVD符号化又は復号化を実行するテレビ、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・記載された実施形態のいずれかに従ってMVD符号化を実行し、取得された画像を(例えば、モニタ、スクリーン、又は他のタイプのディスプレイを使用して)表示するテレビ、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・記載された実施形態のうちのいずれかに従って符号化ビデオストリームを含む信号を受信するために(例えば、チューナを使用して)チャネルをチューニングし、マルチビュー復号化を実行するテレビ、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・記載された実施形態のうちのいずれかに従って符号化ビデオストリームを含む無線上の信号を(例えば、アンテナを使用して)受信し、MVD復号化を実行するテレビ、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
【手続補正書】
【提出日】2024-06-06
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
復号化のための方法であって、
マルチビュービデオコンテンツの少なくとも1つの基準ビューに関連付けられた第1のカメラパラメータと、現在のビューに関連付けられた第2のカメラパラメータとを得ることであって、各ビューがテクスチャ層及び深度層を含む、ことと、
前記基準ビューのピクセルに順投影方法を適用して、前記第1のカメラパラメータによって定義される前記基準ビューのカメラ座標系から前記第2のカメラパラメータによって定義される前記現在のビューのカメラ座標系に前記ピクセルを投影することにより、中間予測画像を生成することであって、前記中間予測画像の各投影ピクセルが、前記投影ピクセルと前記ピクセルがそこから投影される前記基準ビューの前記ピクセルとの間の変位を表す動き情報値に関連付けられている、ことと、
前記現在のビューの時間的予測に使用される再構成画像の復号化ピクチャバッファに、少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶することと、
前記復号化ピクチャバッファに記憶された画像から前記現在のビューの現在の画像を再構成することと、を含む、方法。
【請求項2】
前記順投影方法が、
前記基準ビューの前記カメラ座標系から世界座標系への逆投影を前記基準ビューの現在のピクセルに適用することで逆投影ピクセルを得ることであって、前記逆投影が、前記基準ビューを取得する基準カメラのポーズ行列、前記基準カメラの逆内部行列、及び前記現在のピクセルに関連付けられた深度値を使用し、前記基準カメラの前記ポーズ行列及び前記逆内部行列が、前記第1のカメラパラメータから得られる、ことと、
前記現在のビューを取得する現在のカメラの内部行列及び外部行列を使用して前記逆投影ピクセルを前記現在のビューの前記カメラ座標系に投影することで順投影ピクセルを得ることであって、前記現在のカメラの前記内部行列及び前記外部行列が、前記第2のカメラパラメータから得られる、ことと、
前記順投影ピクセルが、前記現在のカメラのピクセルグリッド上のピクセルに対応していない場合、前記順投影ピクセルに最も近い前記ピクセルグリッドのピクセルを選択して、補正された順投影ピクセルを得ることと、
前記順投影ピクセルと前記基準ビューの前記現在のピクセルとの間の変位を表す動きベクトルを計算することと、を含む、請求項1に記載の方法。
【請求項3】
前記方法が、各中間予測画像又は前記最終予測画像内の分離された欠落ピクセル動き情報値を、隣接するピクセル動き情報値又はデフォルト値で充填することを含む、請求項1に記載の方法。
【請求項4】
前記少なくとも1つの最終予測画像が、少なくとも2つの中間予測画像を集約することによって得られる、請求項1に記載の方法。
【請求項5】
符号化のための方法であって、
マルチビュービデオコンテンツの少なくとも1つの基準ビューに関連付けられた第1のカメラパラメータと、現在のビューに関連付けられた第2のカメラパラメータとを得ることであって、各ビューがテクスチャ層及び深度層を含む、ことと、
前記基準ビューのピクセルに順投影方法を適用して、前記第1のカメラパラメータによって定義される前記基準ビューのカメラ座標系から前記第2のカメラパラメータによって定義される前記現在のビューのカメラ座標系に前記ピクセルを投影することにより、中間予測画像を生成することであって、前記中間予測画像の各投影ピクセルが、前記投影ピクセルと前記ピクセルがそこから投影される前記基準ビューの前記ピクセルとの間の変位を表す動き情報値に関連付けられている、ことと、
前記現在のビューの時間的予測に使用される再構成画像の復号化ピクチャバッファに、少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶することと、
前記復号化ピクチャバッファに記憶された画像から前記現在のビューの現在の画像を再構成することと、を含む、方法。
【請求項6】
前記順投影方法が、
前記基準ビューの前記カメラ座標系から世界座標系への逆投影を前記基準ビューの現在のピクセルに適用することで逆投影ピクセルを得ることであって、前記逆投影が、前記基準ビューを取得する基準カメラのポーズ行列、前記基準カメラの逆内部行列、及び前記現在のピクセルに関連付けられた深度値を使用し、前記基準カメラの前記ポーズ行列及び前記逆内部行列が、前記第1のカメラパラメータから得られる、ことと、
前記現在のビューを取得する現在のカメラの内部行列及び外部行列を使用して前記逆投影ピクセルを前記現在のビューの前記カメラ座標系に投影することで順投影ピクセルを得ることであって、前記現在のカメラの前記内部行列及び前記外部行列が、前記第2のカメラパラメータから得られる、ことと、
前記順投影ピクセルが、前記現在のカメラのピクセルグリッド上のピクセルに対応していない場合、前記順投影ピクセルに最も近い前記ピクセルグリッドのピクセルを選択して、補正された順投影ピクセルを得ることと、
前記順投影ピクセルと前記基準ビューの前記現在のピクセルとの間の変位を表す動きベクトルを計算することと、を含む、請求項5に記載の方法。
【請求項7】
前記方法が、各中間予測画像又は前記最終予測画像内の分離された欠落ピクセル値を、隣接するピクセル値の平均、隣接するピクセル値の中央値、又はデフォルト値で充填することを含む、請求項5に記載の方法。
【請求項8】
少なくとも1つの最終予測画像が、少なくとも2つの中間予測画像を集約することによって得られる、請求項5に記載の方法。
【請求項9】
復号化のためのデバイスであって、
マルチビュービデオコンテンツの少なくとも1つの基準ビューに関連付けられた第1のカメラパラメータと、現在のビューに関連付けられた第2のカメラパラメータとを得る手段であって、各ビューがテクスチャ層及び深度層を含む、手段と、
前記基準ビューのピクセルに順投影方法を適用して、前記第1のカメラパラメータによって定義される前記基準ビューのカメラ座標系から前記第2のカメラパラメータによって定義される前記現在のビューのカメラ座標系に前記ピクセルを投影するように構成された中間予測画像を生成する手段であって、前記中間予測画像の各投影ピクセルが、前記投影ピクセルと前記ピクセルがそこから投影される前記基準ビューの前記ピクセルとの間の変位を表す動き情報値に関連付けられている、手段と、
前記現在のビューの時間的予測に使用される再構成画像の復号化ピクチャバッファに、少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶する手段と、
前記復号化ピクチャバッファに記憶された画像から前記現在のビューの現在の画像を再構成する手段と、を含む、デバイス。
【請求項10】
前記順投影方法が、
前記基準ビューの前記カメラ座標系から世界座標系への逆投影を前記基準ビューの現在のピクセルに適用することで逆投影ピクセルを取得することであって、前記逆投影が、前記基準ビューを取得する基準カメラのポーズ行列、前記基準カメラの逆内部行列、及び前記現在のピクセルに関連付けられた深度値を使用し、前記基準カメラの前記ポーズ行列及び前記逆内部行列が、前記第1のカメラパラメータから得られる、ことと、
前記現在のビューを取得する現在のカメラの内部行列及び外部行列を使用して前記逆投影ピクセルを前記現在のビューの前記カメラ座標系に投影することで順投影ピクセルを得ることであって、前記現在のカメラの前記内部行列及び前記外部行列が、前記第2のカメラパラメータから得られる、ことと、
前記順投影ピクセルが、前記現在のカメラのピクセルグリッド上のピクセルに対応していない場合、前記順投影ピクセルに最も近い前記ピクセルグリッドのピクセルを選択して、補正された順投影ピクセルを得ることと、
前記順投影ピクセルと前記基準ビューの前記現在のピクセルとの間の変位を表す動きベクトルを計算することと、を含む、請求項9に記載のデバイス。
【請求項11】
前記デバイスが、各中間予測画像又は前記最終予測画像内の分離された欠落ピクセル値を、隣接するピクセル値の平均、隣接するピクセル値の中央値、又はデフォルト値で充填するように構成されている、請求項9に記載のデバイス。
【請求項12】
前記少なくとも1つの最終予測画像が、少なくとも2つの中間予測画像を集約することによって得られる、請求項9に記載のデバイス。
【請求項13】
符号化のためのデバイスであって、
マルチビュービデオコンテンツの少なくとも1つの基準ビューに関連付けられた第1のカメラパラメータと、現在のビューに関連付けられた第2のカメラパラメータとを得る手段であって、各ビューがテクスチャ層及び深度層を含む、手段と、
前記基準ビューのピクセルに順投影方法を適用して、前記第1のカメラパラメータによって定義される前記基準ビューのカメラ座標系から前記第2のカメラパラメータによって定義される前記現在のビューのカメラ座標系に前記ピクセルを投影するように構成された中間予測画像を生成する手段であって、前記中間予測画像の各投影ピクセルが、前記投影ピクセルと前記ピクセルがそこから投影される前記基準ビューの前記ピクセルとの間の変位を表す動き情報値に関連付けられている、手段と、
前記現在のビューの時間的予測に使用される再構成画像の復号化ピクチャバッファに、少なくとも1つの中間予測画像から得られた少なくとも1つの最終予測画像を記憶する手段と、
前記復号化ピクチャバッファに記憶された画像から前記現在のビューの現在の画像を再構成する手段と、を含む、デバイス。
【請求項14】
前記順投影方法が、
前記基準ビューの前記カメラ座標系から世界座標系への逆投影を前記基準ビューの現在のピクセルに適用することで逆投影ピクセルを得ることであって、前記逆投影が、前記基準ビューを取得する基準カメラのポーズ行列、前記基準カメラの逆内部行列、及び前記現在のピクセルに関連付けられた深度値を使用し、前記基準カメラの前記ポーズ行列及び前記逆内部行列が、前記第1のカメラパラメータから得られる、ことと、
前記現在のビューを取得する現在のカメラの内部行列及び外部行列を使用して前記逆投影ピクセルを前記現在のビューの前記カメラ座標系に投影することで順投影ピクセルを得ることであって、前記現在のカメラの前記内部行列及び前記外部行列が、前記第2のカメラパラメータから得られる、ことと、
前記順投影ピクセルが、前記現在のカメラのピクセルグリッド上のピクセルに対応していない場合、前記順投影ピクセルに最も近い前記ピクセルグリッドのピクセルを選択して、補正された順投影ピクセルを得ることと、
前記順投影ピクセルと前記基準ビューの前記現在のピクセルとの間の変位を表す動きベクトルを計算することと、を含む、請求項13に記載のデバイス。
【請求項15】
前記デバイスが、各中間予測画像又は前記最終予測画像内の分離された欠落ピクセル値を、隣接するピクセル値の平均、隣接するピクセル値の中央値、又はデフォルト値で充填するように構成されている、請求項13に記載のデバイス。
【請求項16】
前記少なくとも1つの最終予測画像が、少なくとも2つの中間予測画像を集約することによって得られる、請求項13に記載のデバイス。
【外国語明細書】