(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-26
(45)【発行日】2024-08-05
(54)【発明の名称】パーティション符号化を用いた有効な予測
(51)【国際特許分類】
H04N 19/70 20140101AFI20240729BHJP
H04N 19/593 20140101ALI20240729BHJP
H04N 19/597 20140101ALI20240729BHJP
【FI】
H04N19/70
H04N19/593
H04N19/597
【外国語出願】
(21)【出願番号】P 2022178255
(22)【出願日】2022-11-07
(62)【分割の表示】P 2020194476の分割
【原出願日】2012-11-09
【審査請求日】2022-12-07
(32)【優先日】2011-11-11
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】515089080
【氏名又は名称】ジーイー ビデオ コンプレッション エルエルシー
【住所又は居所原語表記】1 Research Circle,Niskayuna,NY 12309,USA
(74)【代理人】
【識別番号】100079577
【氏名又は名称】岡田 全啓
(72)【発明者】
【氏名】メルクレ フィリップ
(72)【発明者】
【氏名】バルトニク クリスティアン
(72)【発明者】
【氏名】ラクシュマン ハリチャラン
(72)【発明者】
【氏名】マルペ デトレフ
(72)【発明者】
【氏名】ミューラー カルステン
(72)【発明者】
【氏名】ウィーガント トーマス
(72)【発明者】
【氏名】テヒ ゲルハルト
【審査官】岩井 健二
(56)【参考文献】
【文献】国際公開第2012/147740(WO,A1)
【文献】国際公開第2011/046607(WO,A2)
【文献】国際公開第2010/082463(WO,A1)
【文献】米国特許出願公開第2011/0274166(US,A1)
【文献】Shujie Liu et al.,"New Depth Coding Techniques With Utilization of Corresponding Video",IEEE Transactions on Broadcasting,2011年06月,Vol.57, No.2,pp.551-561,ISSN:0018-9316
【文献】Min-Koo Kang et al.,"ADAPTIVE GEOMETRY-BASED INTRA PREDICTION FOR DEPTH VIDEO CODING",Proceedings of the 2010 IEEE International Conference on Multimedia and Expo (ICME 2010),2010年07月,pp.1230-1235,ISBN:978-1-4244-7491-2
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
符号化された情報を使用してデータストリームからビデオ信号のブロックを再構成するためのデコーダであって、
ルックアップ・リストにおけるブロックウェッジレットパターンの位置を示すインデックスを前記データストリームから抽出し、ここで前記ブロックウェッジレットパターンは前記ブロックをウェッジレット線に沿って第1の部分及び第2の部分に分離し、
前記ブロックの近接サンプルの第1のセットの値に基づいて前記第1の部分のための第1の予測値を決定する、または前記ブロックの近接サンプルの第2のセットの値に基づいて前記第2の部分のための第2の予測値を決定することによって前記ブロックを予測し、
ここで前記近接サンプルの第1のセットおよび第2のセットは前記ブロックに隣接し、
前記データストリームから前記ブロックウェッジレットパターンのためのリファイン値を示すリファインシンタックス要素を抽出し、前記リファイン値を前記ブロックウェッジレットパターンに適用することによって前記ブロックの前記予測をリファインし、ここで前記リファイン値は前記ブロックウェッジレットパターンのリファイン方向を示す符号である
ように構成されることを特徴とするデコーダ。
【請求項2】
前記第1の予測値は前記近接サンプルの第1のセットの平均値を含み、前記第2の予測値は前記近接サンプルの第2のセットの平均値を含むことを特徴とする、請求項1に記載のデコーダ。
【請求項3】
前記リファイン値を適用する際に、前記ブロックに関連付けられた既定の空間的にサンプリングされたコンポーネントまたは前記ブロックの奥行きマップが前記データストリーム内で伝送されている参照量子化ステップサイズに依存する量子化ステップサイズを使用して、前記リファイン値をスケーリングするように構成されることを特徴とする、請求項1に記載のデコーダ。
【請求項4】
前記デコーダは前記ブロックのテクスチャサンプルアレイを再構成するために前記参照量子化ステップサイズを使用するように構成されることを特徴とする、請求項3に記載のデコーダ。
【請求項5】
前記デコーダの予測ループにおいて前記ブロックを基準として使用するようにさらに構成されることを特徴とする、請求項1に記載のデコーダ。
【請求項6】
前記リファインシンタックス要素は、前記リファイン値の絶対値を示す第1のシンタックス要素および前記リファイン値の符号値を示す第2のシンタックス要素を含むことを特徴とする、請求項1に記載のデコーダ。
【請求項7】
前記リファイン値を適用する際に、前記リファイン値を前記第1または第2の予測値と線形結合するようにさらに構成されることを特徴とする、請求項1に記載のデコーダ。
【請求項8】
ビデオ信号のブロックをデータストリームに符号化するためのエンコーダであって、
前記ブロックをウェッジレット線に沿って第1の部分及び第2の部分に分離するブロックウェッジレットパターンの位置を導出し、前記ブロックウェッジレットパターンの位置を示すインデックスを前記データストリームに挿入し、
前記ブロックの近接サンプルの第1のセットの値に基づいて前記第1の部分のための第1の予測値を決定する、または前記ブロックの近接サンプルの第2のセットの値に基づいて前記第2の部分のための第2の予測値を決定することによって前記ブロックを予測し、
ここで前記近接サンプルの第1のセットおよび第2のセットは前記ブロックに隣接し、
前記ブロックウェッジレットパターンに関連付けられたリファイン値を決定し、ここで前記リファイン値は前記ブロックウェッジレットパターンのリファイン方向を示す符号であり、
前記リファイン値を表す1つ以上のリファインシンタックス要素を前記データストリームに符号化する
ように構成されることを特徴とする、エンコーダ。
【請求項9】
前記第1の予測値は前記近接サンプルの第1のセットの平均値を含み、前記第2の予測値は前記近接サンプルの第2のセットの平均値を含むことを特徴とする、請求項8に記載のエンコーダ。
【請求項10】
前記ブロックの予測をリファインするために、前記リファイン値は前記第1または第2の予測値と線形結合されることを特徴とする、請求項8に記載のエンコーダ。
【請求項11】
前記ブロックに関連付けられた既定の空間的にサンプリングされたコンポーネントまたは前記ブロックの奥行きマップが前記データストリーム内で伝送されている参照量子化ステップサイズに依存する量子化ステップサイズを使用して、前記リファイン値を量子化するようにさらに構成されることを特徴とする、請求項8に記載のエンコーダ。
【請求項12】
前記エンコーダは前記ブロックのテクスチャサンプルアレイを符号化するために前記参照量子化ステップサイズを使用するように構成されることを特徴とする、請求項11に記載のエンコーダ。
【請求項13】
前記エンコーダの予測ループにおいて前記ブロックを基準として使用するようにさらに構成されることを特徴とする、請求項8に記載のエンコーダ。
【請求項14】
前記1つ以上のリファインシンタックス要素は、前記リファイン値の絶対値を示す第1のシンタックス要素および前記リファイン値の符号値を示す第2のシンタックス要素を含むことを特徴とする、請求項8に記載のエンコー
ダ。
【発明の詳細な説明】
【技術分野】
【0001】
本願発明は、パーティション符号化を用いたサンプルアレイ符号化に関する。
【背景技術】
【0002】
多くの符号化スキームは、ブロックにサンプルアレイの再分割を使用しているサンプルアレイデータを圧縮する。サンプルアレイは、テクスチャ(すなわち、画像)の空間サンプリングを定めることができるが、しかしながら、他のサンプルアレイは、例えば、奥行きマップ等の類似の符号化技術を使用して、圧縮され得る。それぞれのサンプルアレイによって、空間的にサンプリングされる情報の異なる性質のために、異なる符号化概念は、異なる種類のサンプルアレイにとって最適である。しかしながら、そのようなサンプルアレイにかかわりなく、個々の符号化オプションを、サンプルアレイのブロックに割り当てるために、これらの符号化概念の多くは、ブロック再分割処理を使用し、このことにより、一方の個々のブロックに割り当てられた符号化パラメータを符号化するためのサイド情報レートとそれぞれのブロックの予測ミスのための予測残差を符号化するための残差符号化レートとの間のよいトレードオフをみつけること、あるいは、残差符号化有りまたは無しでレート/歪の意味で良好な構成を見出す。
【0003】
主に、ブロックは、矩形であるか、正方形である。明らかに、符号化ユニット(ブロック)の形状を符号化されるサンプルアレイの内容に適応させることが可能であることは、有利である。しかしながら、残念なことに、ブロックまたは符号化ユニットの形状をサンプルアレイの内容に適応させることは、付加的なサイド情報をブロック分割のシグナリングすることに費やすことが必要である。ブロックのウェッジレット型分割が、可能ブロック分割形状と関連するサイド情報オーバーヘッドとの間の適切な妥協であるとわかった。ウェッジレット型分割は、ブロックの分割を、例えば、特有の符号化パラメータが用いられ得るウェッジレットパーティションに導く。
【0004】
しかしながら、ウェッジレット分割に対する制限さえ、ブロックの分割をシグナリングするための付加的なオーバーヘッドの重要な量を導き、そして、したがって、より効率的な方法のサンプルアレイの符号化におけるブロックを分割する際のより高い自由度を可能にするより有効な符号化概念を手元に有することは好ましいであろう。
【発明の概要】
【発明が解決しようとする課題】
【0005】
この目的は、係属中の独立請求項の主題によって達成される。
【課題を解決するための手段】
【0006】
ブロックの2分割のパーティションへの固定パーティション値を割り当てることにより現行ブロックを予測する方法は、特に例えばこれらのサンプルアレイの内容が大部分は平坦域または急なエッジにより各々から切り離される同程度の値の単純接続された領域から成る奥行き/視差マップなどのサンプルアレイを符号化する場合には、全く効果的である。しかしながら、この種の固定パーティション値の伝送は、回避されなければならないサイド情報の相当な量をまだ必要とする。個々のパーティションに関連したあるいは隣接した近接サンプル値の平均値が、固定パーティション値のための予測因子として使用される場合、このサイド情報のレートは更に低下することができる。
【0007】
更なる下位の態様は、従属する請求項の主題である。
【0008】
本願発明の好ましい実施の形態は、添付する図に関して後に詳細に述べられる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、本願発明の実施例が実施例に従って構築され得る多視点エンコーダのブロック図を示す。
【
図2】
図2は、視点および映像の奥行き/視差の境界全体の情報再使用の説明のための多視点信号の一部の概要図を示す。
【
図4】
図4は、連続(左)および別々の信号空間(右)の二次ブロックのウェッジレットパーティションを示す。
【
図5】
図5は、ウェッジレットブロックパーティションの6つの異なる幾何学的配置の概略図を示す。
【
図6】
図6は、ブロックサイズ4×4(左)8×8(中間)および16×16(右)のウェッジレットパーティションパターンの実施例を示す。
【
図7】
図7は、パーティション情報およびCPV(パーティション領域の奥行き信号の平均値)を結合することによって、ウェッジレットモデルを有する奥行き信号の近似を示す。
【
図8】
図8は、ウェッジレットパーティションパターンの生成を示す。
【
図9】
図9は、連続(左)および別々の信号空間(右)の二次ブロックの輪郭パーティションを示す。
【
図10】
図10は、ブロックサイズ8×8の輪郭パーティションパターンの実施例を示す。
【
図11】
図11は、パーティション情報およびCPV(パーティション領域の奥行き信号の平均値)を結合することによって、輪郭モデルを有する奥行き信号の近似を示す。
【
図12】
図12は、上記の参照ブロックがタイプのウェッジレットパーティション(左)または正規のイントラ方向(右)であるシナリオのためのウェッジレットパーティション(青)のイントラ予測を示す。
【
図13】
図13は、テクスチャの輝度情報(luma)の参照からウェッジレット(青)および輪郭(緑)パーティション情報の予測を示す。
【
図14】
図14は、ブロックパーティションのCPVを示す。近接ブロック(左)の隣接するサンプルおよびブロック(右)の横断面からのCPV予測,異なるCPVタイプの関係を示す。
【
図15】
図15は、テクスチャの輝度情報(luma)の相違に基づくモードの事前選択を示す。
【
図16】
図16は、実施例によるデコーダのブロック図を示す。
【
図18】
図18は、実施例によるデコーダのブロック図を示す。
【
図20】
図20は、実施例によるデコーダのブロック図を示す。
【
図22】
図22は、実施例によるデコーダのブロック図を示す。
【
図24】
図24は、実施例によるデコーダのブロック図を示す。
【発明を実施するための形態】
【0010】
本願発明の以下の好適な実施例の説明は、本願発明の実施例が有利に使用され得る可能な環境から始める。特に、実施例による多視点コーデックは、
図1~3に関して記載されている。しかしながら、後文に記載されている実施例が多視点符号化に制限されないと強調されるべきである。それにもかかわらず、さらに以下において記載されているいくつかの形態は、よりよく理解されえ、多視点符号化、または、具体的には、特に、奥行きマップの符号化を有する場合、特別な相乗効果を有する。従って、
図1~3の後、説明は、イントロダクションから不規則性ブロック分割およびそれとともに含まれる課題に進める。この説明は
図4~11を参照し、そして、その後記載された本願発明の実施例の説明の基礎を構成する。
【0011】
今述べたように、さらに、以下で概説される実施例は、画像およびビデオ符号化アプリケーションにおいて、非矩形であるか不規則性ブロック分割およびモデリング機能を使用して、特に、例えば、場面のジオメトリを表すために、奥行きマップの符号化に適用できる。ただし、これらの実施例は、従来の画像およびビデオ符号化にも適用できる。さらに、以下で概説される実施例は、さらに、画像およびビデオ符号化アプリケーションにおいて、非矩形ブロック分割およびモデリング機能を使用するための概念を提供する。実施例は、特に、(場面のジオメトリを表すために)奥行きマップの符号化にも適用できる。しかし、従来の画像およびビデオ符号化にも適用できる。
【0012】
多視点ビデオ符号化において、ビデオ場面(複数のカメラによって同時に撮影される)の2以上の視点が、単一のビットストリームにおいて符号化される。多視点ビデオ符号化の第1の目的は、3Dの視聴印象を提示することによって、エンドユーザに高度なマルチメディア体験を提供することである。2つの視点が符号化される場合、2つの再構成されたビデオシーケンスは、(グラス(眼鏡)を装着して)従来の立体表示において、表示され得る。しかしながら、従来の立体表示のためのグラスの必要な使用は、ユーザにとってしばしば面倒である。グラスなしで、高品質なステレオ視聴印象を可能にすることは、現在、研究開発の重要なテーマである。そのような自動立体視的なディスプレイに対する有望な技術は、レンチキュラレンズ・システムに基づく。原則上は、円柱状レンズのアレイが、ビデオ場面の多視点が同時に表示される方法における従来のディスプレイに搭載される。各視点は、小さい円錐において表示される。その結果、ユーザの各眼は、異なる画像を見る;この効果は、特別なグラスなしに、ステレオ印象を作り出す。しかしながら、この種の自動立体視的なディスプレイは、概して、同じビデオ場面の10-30の視点を必要とする(技術がさらに改善される場合、より多くの視点が必要とされる)。2つ以上の視点が、ビデオ場面に対する視点をインタラクティブに選択するために、可能性を使用者に提供するためにも使用され得る。しかしながら、ビデオ場面の多視点の符号化は、従来の単眼視(2D)ビデオと比較して、必要とされるビットレートを大幅に増加する。通常、必要とされるビットレートは、ほぼ線形に符号化された視点の数に伴って増加する。自動立体視的なディスプレイのための送信データ量を減らすための概念は、少数の視点(おそらく、2-5の視点)のみを送信するように構成されるが、加えて、いわゆる奥行きマップを送信することが、1つ以上の視点に対する画像サンプルの奥行き(カメラに対する現実世界のオブジェクトの距離)を表現する。対応する奥行きマップとともに符号化された少数の視点を与えることは(高品質な中間視点(符号化される視点の間に位置する仮想視点)、および、付加的な視点もカメラアレイの一方または両端まで少し広げるために)、適切なレンダリング技術によって、レシーバ側で作成され得る。
【0013】
最新技術の画像およびビデオ符号化において、画像または、画像のためのサンプルアレイの特定のセットは、通常、特定の符号化パラメータに関連しているブロックに分解される。画像は、通常、複数のサンプルアレイ(輝度および色信号)を構成する。加えて、画像は、付加的な補助サンプルアレイに関連し得る。そして、それは、例えば、透過情報または奥行きマップを特定し得る。各画像またはサンプルアレイは、通常、ブロックに分解される。ブロック(またはサンプルアレイの対応するブロック)は、画像間予測または画像内予測によって予測される。ブロックは、異なるサイズを有し、そして、正方形または矩形であり得る。画像をブロックに分割することは、シンタックスによって調整することもでき、あるいは、それは、ビットストリームの内部で、(少なくとも部分的に)シグナリングし得る。しばしば、定義済みサイズのブロックのための再分割をシグナリングするシンタックス要素が、送信される。この種のシンタックス要素は、あるブロックがより小さいブロックに再分割され、そして、例えば、予測の目的で、関連する符号化パラメータに関連付けられるかどうか、あるいはどのようにしたかを、を明確にすることができる。ブロック(または、サンプルアレイの対応しているブロック)の全てのサンプルのために、関連する符号化パラメータを復号化することは、特定の方法において、明確にされ得る。例において、ブロックにおける全てのサンプルは、例えば、(1組の既に符号化された画像における参照画像を確認する)参照インデックス、(参照画像および現行画像の間のブロックにおける動きのための大きさを特定する)動きパラメータ、補間フィルタを特定するためのパラメータ、イントラ予測モード等の同一の1組の予測パラメータを使用して予測される。動きパラメータは、水平および垂直成分を有する変位ベクトルによって、または、6つの成分からなるアファイン動きパラメータのような、より高次の動きパラメータによって、表され得る。(例えば、参照インデックスおよび動きパラメータのような)2以上の組の特定の予測パラメータが、単一のブロックに関連していることも可能である。その場合、これらの特定の予測パラメータの組ごとに、ブロック(または、サンプルアレイの対応するブロック)のための単一の中間予測信号が生成され、そして、最終的な予測信号は、中間予測信号を重畳することを含む組み合わせによって形成される。対応する重みパラメータおよび(加重和に加えられる)潜在的に固定のオフセットも、画像、もしくは参照画像、もしくは1組の参照画像に対して調整され得るか、または対応するブロックに対する1組の予測パラメータにおいて、それらは含まれる。残差信号とも呼ばれる、元のブロック(または、サンプルアレイの対応するブロック)とそれらの予測信号との差は、たいてい、変換され、そして量子化される。しばしば、2次元変換は、残差信号(または、対応する残差ブロックのための対応するサンプルアレイ)に適用される。変換符号化のために、特定の1組の予測パラメータが用いられた、ブロック(またはサンプルアレイの対応するブロック)が変換を適用する前に、さらに、分割され得る。変換ブロックは、予測のために用いられるブロックに等しいか、あるいはより小さい。変換ブロックが、予測のために用いられる2以上のブロックを含むことも可能である。異なる変換ブロックは、異なるサイズを有し得て、変換ブロックは、正方形または矩形のブロックを表し得る。変換の後、結果として得る変換係数は、量子化され、そして、いわゆる変換係数レベルが得られる。予測パラメータと同様に、変換係数レベルも、存在する場合、再分割情報は、エントロピー符号化される。
【0014】
ITU-T Rec.H.264|ISO/IEC JTC 1 14496-10のような最高水準の符号化技術、またはHEVCのための現在のワーキングモデルは、奥行きマップにも適用でき、符号化ツールは、特に、自然なビデオの符号化のための設計である。奥行きマップは、自然なビデオシーケンスの画像として異なる特性を有する。例えば、奥行きマップは、空間的な詳細をより少なく含む。それらは、主に、(オブジェクトの境界を表す)鋭いエッジ、および、(オブジェクト領域を表す)ほとんど一定であるかゆっくりと変化するサンプル値の大きな領域によって特徴付けられる。奥行きマップが、特に、奥行きマップの特性を利用するために設計された符号化ツールを適用することによって、より効率的に符号化する場合、奥行きマップを有する多視点ビデオ符号化の全体の符号化効率は、改善され得る。
【0015】
本願発明のその後説明される実施例が、有利に使用され得る、可能な符号化環境の根拠として役立つために、可能な多視点符号化概念が、
図1~3に関して以下にさらに記載される。
【0016】
図1は、実施例による多視点信号を符号化するためのエンコーダを示す。
図1の実施例は、多数の視点でも可能であるが、
図1の多視点信号は、2つの視点12
1および12
2を含むように、10で実例として示される。さらに、
図1の実施例によれば、各視点12
1および12
2は、ビデオ14、奥行き/視差マップデータ16を含む。ただし、いくつかの奥行き/視差マップデータを含まない視点を有する多視点信号と関連して使われる場合、さらに、以下で記載される実施例の有利な原則の多くは、有利であり得る。
【0017】
それぞれの視点12
1および12
2のビデオ14は、異なる投射/視聴方向に沿って、共通の場面の投射の空間時間的サンプリングを表す。この制約が、必ずしも条件が満たされている必要があるというわけではないにもかかわらず、好ましくは、視点12
1および12
2のビデオ14の時間的なサンプリングレートは互いに等しい。
図1において示されるように、好ましくは、各ビデオ14は、それぞれのタイムスタンプt,t-1,t-2,…に関連付けされている各フレームを有する一連のフレームを含む。
図1において、ビデオフレームは、v
view number,time stamp numberによって示される。各フレームv
i,tは、それぞれのタイムスタンプtでのそれぞれの視点方向に沿った場面iの空間的なサンプリングを表す。そして、このように、例えば、輝度サンプルのための1つのサンプルアレイおよび色サンプルを有する2つのサンプル、またはただ単に輝度サンプルまたはRGB色空間の色成分のような他の色成分のためのサンプルアレイのような1つ以上のサンプルアレイを含む。1つ以上のサンプルアレイの空間分解能は、1つのビデオ14、ならびに異なる視点12
1および12
2のビデオ14の両方の範囲内で異なり得る。
【0018】
同様に、奥行き/視差マップデータ16は、視点12
1および12
2のそれぞれの視聴方向に沿って測定された共通の場面の場面オブジェクトの奥行きの空間的-時間的サンプリングを表す。奥行き/視差マップデータ16の時間的なサンプリングレートは、
図1において図示するように、同じ視点の関連付けられたビデオの時間的サンプリングレートに等しくてもよいか、または、そこから異なってもよい。
図1の場合において、各ビデオフレームvは、それとともに、それぞれの視点12
1および12
2の奥行き/視差マップデータ16のそれぞれの奥行き/視差マップdと関連付けている。換言すれば、
図1の実施例において、視点iおよびタイムスタンプtの各ビデオフレームv
i,tは、それに関連付けられる奥行き/視差マップd
i,tを有する。奥行き/視差マップdの空間的な分解能に関して、同じことが、ビデオフレームに関して上記に示されるように適用する。すなわち、空間的な分解能は、異なる視点の奥行き/視差マップの間で異なってもよい。
【0019】
多視点信号10を効率的に圧縮するために、
図1のエンコーダは、視点12
1および12
2をデータストリーム18に並列に符号化する。しかしながら、第1の視点12
1を符号化するために使用される符号化パラメータは、同上を導入するために再利用されるか、または、第2の視点12
2を符号化する際に使用される第2の符号化パラメータを予測するために再利用される。この大きさによって、
図1のエンコーダは、視点12
1および12の並列符号化が、同様に、これらの視点に対する符号化パラメータを決定するエンコーダを結果として得るという事実を有効に使用する。その結果、これらの符号化パラメータの間の冗長性は、効果的に、圧縮率またはレート/歪率(測定された歪、例えば、全部のデータストリーム18の符号化レートとして測定された視点およびレートの両方の平均歪として)を増加させるために有効に使用され得る。
【0020】
特に、
図1のエンコーダは、通常、参照符号20によって示され、そして、多視点信号10を受信するための入力、およびデータストリーム18を出力するための出力を含む。
図2において分かるように、
図1のエンコーダ20は、視点12
1および12
2ごとに、2つの符号化ブランチを含み、すなわち、ビデオデータのための一方と、奥行き/視差マップデータのための他方である。したがって、エンコーダ20は、視点1のビデオデータのための符号化ブランチ22
v,1、視点1の奥行き/視差マップデータのための符号化ブランチ22
d,1、第2の視点のビデオデータのための符号化ブランチ22
v,2、および第2の視点の奥行き/視差マップデータのための符号化ブランチ22
d,2を含む。これらの符号化ブランチ22の各々は、同様に構築される。エンコーダ20の構成および機能性を記載するために、以下の説明は、符号化ブランチ22
v,1の構成および機能性から始める。この機能性は、すべてのブランチ22に共通である。その後、ブランチ22の個々の特徴が述べられる。
【0021】
符号化ブランチ22v,1は、多視点信号12の第1の視点121のビデオ141を符号化するためにあり、そして、したがって、ブランチ22v,1は、ビデオ141を受信するための入力を有する。このほか、ブランチ22v,1は、言及される順序で互いに直列に接続される、減算器24、量子化/変換モジュール26、再量子化/逆変換モジュール28、加算器30、さらなる処理モジュール32、復号化画像バッファ34、順に、互いに並列に接続される2つの予測モジュール36および38、ならびに、一方において、予測モジュール36および38の出力の間に接続され、他方において減算器24の反転入力に接続される結合器またはセレクタ40を含む。結合器40の出力は、さらに、加算器30の入力にも接続される。減算器24の非反転入力は映像141を受信する。
【0022】
符号化ブランチ22
v,1の要素24~40は、ビデオ14
1を符号化するために協働する。符号化は、特定の部分を単位にして、ビデオ14
1を符号化する。例えば、ビデオ14
1の符号化において、フレームv
1,kは、例えば、ブロック、または他のサンプルグループのセグメントにセグメント化される。セグメンテーションは、時間ともに一定であるか、または時間内に変化し得る。さらに、セグメンテーションは、初期設定でエンコーダおよびデコーダに知られ得るか、またはデータストリーム18の範囲内において、シグナリングされ得る。セグメンテーションは、行および列におけるブロックの重なり合わない配列のようなブロックへのフレームの標準的なセグメンテーションであり得るか、または、様々なサイズのブロックへの4分木ベースのセグメンテーションであり得る。減算器24の非反転入力に入力されているビデオ14
1の現在の符号化されたセグメントは、
図1~3の以下の記載におけるビデオ
1の現行ブロックと呼ばれている。
【0023】
予測モジュール36および38は、現行ブロックを予測するためにあり、そして、このために、予測モジュール36および38は、復号化画像バッファ34に接続されるそれらの入力を有する。実際には、予測モジュール36および38の両方は、減算器24の非反転入力から入ってくる現行ブロックを予測するために、復号化画像バッファ34において存在しているビデオ141の以前に再構成された部分を使用する。この点に関しては、予測モジュール36は、ビデオ141の同じフレームのすでに再構成された部分の空間的に近接したところから、ビデオ141の現在の部分を空間的に予測するイントラ予測器として作動するのに対して、予測モジュール38は、ビデオ141の以前に再構成されたフレームから現在の部分を時間的に予測するインター予測器として作動する。モジュール36および38の両方は、ある予測パラメータに従って、またはある予測パラメータにより記述されて、それらの予測を実行する。より、具体的には、後者のパラメータは、例えば、最大ビットレートのようないくつかの制約の下であるいは制約なしでレート/歪率を最適化することのような若干の最適化目的を最適化するために若干の最適化フレームワークにおいて、エンコーダ20により決定される。
【0024】
例えば、イントラ予測モジュール36は、近接する内容に沿ったイントラ予測方向のように現在の部分に対する空間的な予測パラメータを決定し得て、ビデオ141の同じフレームのすでに再構成された部分は、後者を予測するための現在の部分に拡大され/コピーされる。
【0025】
インター予測モジュール38は、以前に再構成されたフレームから現在の部分を予測するために、動き補償を使用し得る、そして、それとともに含まれるインター予測パラメータは、動きベクトル、参照フレームインデックス、現在の部分に関する動き予測再分割情報、仮定番号、またはいくつかのそれらの組み合わせを含んでもよい。
【0026】
結合器40は、モジュール36および38によって提供された1以上の予測を結合し、または、単にその1つだけを選択し得る。結合器または選択器40は、減算器24の挿入入力、およびさらに加算器30の入力にそれぞれ現在の部分の結果として得られる予測を転送する。
【0027】
減算器24の出力において、現在の部分の予測の残差が出力され、量子化/変換モジュール36は、変換係数の量子化とともに、この残差信号を変換するために構成される。変換は、例えば、DTCのようないくつかのスペクトルで分解している変換であり得る。量子化のため、量子化/変換モジュール26の結果として得る処理は、非可逆的である。すなわち、符号化損失が生じる。モジュール26の出力は、データストリームの範囲内に送信されるための残差信号421である。すべてのブロックが残差符号化に依存するわけではない。むしろ、いくつかの符号化モードは、残差符号化を抑制し得る。
【0028】
残差信号421は、可能な限り、残差信号を再構成するために、すなわち、量子化雑音にもかかわらず、減算器24による出力として残差信号に対応するために、モジュール28において、逆量子化され、逆変換される。加算器30は、加算によって現在の部分の予測とともにこの再構成された残差信号を結合する。他の結合も可能である。例えば、減算器24は、比率の残差を測定するための除算器として作動することができ、そして、変形例によれば、加算器は、現在の部分を再構成するための乗算器として実装され得る。このように、加算器30の出力は、現在の部分の予備の再構成を表す。しかしながら、モジュール32におけるさらなる処理は、再構成を促進するために任意に使用され得る。この種のさらなる処理は、例えば、非ブロック化すること、適応フィルタリングなどを含み得る。利用可能なすべての再構成は、今までのところ、復号化画像バッファ34においてバッファリングされる。このように、復号化画像バッファ34は、ビデオ141の以前に再構成されたフレーム、および以前に、現在の部分が属する現在のフレームの再構成された部分をバッファリングする。
【0029】
データストリーム18から多視点信号を再構成するためのデコーダを有効にするために、量子化/変換モジュール26は、残差信号421をエンコーダ20のマルチプレクサ44に送る。同時に、予測モジュール36は、イントラ予測パラメータ461をマルチプレクサ44に送り、インター予測モジュール38は、インター予測パラメータ481をマルチプレクサに送り、さらに、処理モジュール32は、さらなる処理パラメータ501をマルチプレクサ44に送り、順に、全てのこの情報を、データストリーム18に多重送信するか、または挿入する。
【0030】
図1の実施例による上記の説明から明らかになったので、符号化ブランチ22
v,1によるビデオ14
1の符号化は、符号化が、奥行き/視差マップデータ16
1および他の視点12
2のいくらかのデータから独立しているという点で、自己完結している。より一般の観点で、符号化ブランチ22
v,1は、修正データ、すなわち、上述の残差信号42
1を得るために、符号化パラメータを決定すること、そして、第1の符号化パラメータにしたがって、ビデオ14
1の以前に符号化された部分からビデオ14
1の現行部分を予測すること、現行部分の符号化された部分からエンコーダ20によってデータストリーム18に符号化されること、および現行部分の予測の予測エラーを決定することによって、データストリーム18に符号化映像14
1とみなされる。符号化パラメータおよび修正データは、データストリーム18に挿入される。
【0031】
符号化ブランチ22v,1によってデータストリーム18に挿入される上述の符号化パラメータは、以下の1つまたは、全ての組み合わせを含み得る。
【0032】
-第1に、ビデオ141のための符号化パラメータは、簡潔に議論されるように、ビデオ141のフレームのセグメンテーションを定義し/送信し得る。
【0033】
-さらに、符号化パラメータは、各セグメンテーションまたは現在の部分のために示している符号化モード情報を含み得る。そして、符号化モードは、イントラ予測、インター予測、またはそれらの組み合わせのようなそれぞれのセグメントを予測するために使用され得る。
【0034】
-符号化パラメータは、イントラ予測によって予測される部分/セグメントのためのイントラ予測パラメータ、およびインター予測された部分/セグメントのためのインター予測パラメータのような述べられた予測パラメータも含み得る。
【0035】
-しかしながら、符号化パラメータは、加えて、復号器側にどのように現在、またはビデオ141の以下の部分を予測するためにそれを用いる前に、すでに、ビデオ141の再構成された部分を処理するかについてシグナリングするさらなる処理パラメータ501を含み得る。これらのさらなる処理パラメータ501は、それぞれのフィルタ、フィルタ係数等をインデックス付けするインデックスを含み得る。
【0036】
-予測パラメータ461,481および更なる処理パラメータ501は、加えて、モード選択の精度を定義すること、または、更なる処理の範囲内におけるフレームの異なる部分に対する異なる適応フィルタの装置のような、完全に独立したセグメンテーションを定義するために、サブセグメンテーションデータを含む。
【0037】
-符号化パラメータは、残差信号の決定にも影響を与え、このように、残差信号421の一部でもあり得る。例えば、量子化/変換モジュール26により出力されたスペクトル変換係数レベルは、修正データとみなされるが、量子化ステップサイズは、同様に、データストリーム18の範囲内にシグナリングされ、量子化ステップサイズパラメータは、符号化パラメータとみなされ得る。
【0038】
-符号化パラメータは、上述される第1の予測ステージで予測残差の第2のステージの予測を定義する予測パラメータをさらに定義し得る。イントラ/インター予測は、この点で使用され得る。
【0039】
符号化効率を増加させるために、エンコーダ20は、全ての符号化パラメータおよび、例えば、それぞれのモジュールの下から符号化情報交換モジュール52に示される垂直に伸びる矢印によって実例として示されるように、モジュール36,38および32の範囲内における処理により影響する、または影響される更なる情報を受信する、符号化情報変換モジュール52を含む。符号化情報変換モジュール52は、ブランチがお互いから符号化パラメータを予測し、または導入するように、符号化パラメータおよび符号化ブランチ22間の任意の更なる符号化情報を分配する役割を果たす。
図1の実施例において、順序は、この目的を達成するために、データ要素、すなわち、多視点信号10の視点12
1および12
2のビデオおよび奥行き/視差マップデータの中で定義される。特に、第1の視点12
1のビデオ14
1は、ビデオ14
2に続いて第1の視点の奥行き/視差マップデータ16
1、および、そして、第2の視点12
2の奥行き/視差マップデータ16
2などに先行する。多視点信号10のデータ要素中のこの厳格な順序は、全ての多視点信号10の符号化のために厳しく適用される必要がない点に留意すべきである。しかし、より簡単な考察のために、以下において、この順序が一定であると仮定される。データ要素の中の順序は、また、当然それとともに関連するブランチ22の中の順序を定義する。
【0040】
既に上記で示されるように、符号化ブランチ22d,1,22v,2および22d,2のような更なる符号化ブランチ22は、それぞれの入力161,142および162をそれぞれ符号化するために符号化ブランチ22v,1と同様に作動する。しかしながら、ビデオおよび視点121および122のそれぞれの奥行き/視差マップデータ中の言及された順序、ならびに符号化ブランチ22の中で定義される対応する順序のため、例えば、符号化ブランチ22d,1は、第1の視点121の奥行き/視差マップデータ161の現在の部分を符号化するために使用されるために予測符号化パラメータにおいて付加的な自由を有する。これは、異なる視点のビデオおよび奥行き/視差マップデータのうちの上記の順序のためである。例えば、これらの要素の各々は、これらのデータ要素の中の前述の順序において先立ってその要素と同様にそれ自体の再構成された部分を使用して符号化され得る。したがって、奥行き/視差マップデータ161の符号化において、符号化ブランチ22d,1は、対応するビデオ141の以前に再構成された部分から公知の情報を使用することができる。ブランチ22d,1が、奥行き/視差マップデータ161の若干の特性を予測するために、ビデオ141の再構成された部分をどのように利用し、そして、それは、奥行き/視差マップデータ161の圧縮のより良好な圧縮率を可能にするかは、理論的には無制限である。例えば、符号化ブランチ22d,1は、奥行き/視差マップデータ161の符号化に対する符号化パラメータを得るために、上述したようにビデオ141を符号化することに関係する符号化パラメータを予測/導入し得る。導入の場合には、データストリーム18の範囲内における奥行き/視差データマップ161に関するいくつかの符号化パラメータのシグナリングが、抑制され得る。予測の場合には、単に、これらの符号化パラメータに関する予測残差/修正データだけが、データストリーム18の範囲内においてシグナリングされなければならない。また、そのような符号化パラメータの予測/導入もさらに以下に記載される。
【0041】
意外なことに、モジュール36および38に関して上記のモードに加えて、符号化ブランチ22d,1は、奥行き/視差マップ161のブロックを符号化することが利用できる付加的な符号化モードを有し得る。このような付加的な符号化モードは、さらに、以下において記載され、不規則性ブロック分割モードに関する。代替の視点において、以下の記載のように、不規則性分割は、ブロック/パーティションへの奥行き/視差マップの再分割の継続とみなされ得る。
【0042】
どんな場合でも、付加的な予測機能は、次のデータ要素、すなわち、第2の視点12
2のビデオ14
2および奥行き/視差マップデータ16
2のために存在する。これらの符号化ブランチに関して、そのインター予測モジュールは、時間的な予測を実行し得るだけでなく、視点間予測を実行し得る。対応するインター予測パラメータは、時間的な予測と、すなわち、視点間予測セグメント、視差ベクトル、視点インデックス、参照フレームインデックス、および/または仮説の数の表示、すなわち、例えば合計によって視点間インター予測を形成することにおける加入しているインター予測の数の表示と、比較するように、同様の情報を含む。このような視点間予測は、ビデオ14
2に関するブランチ22
v,2でなく、奥行き/視差マップデータ16
2に関するブランチ22
d,2のインター予測モジュール38のためにも利用可能である。当然ながら、これらのインター予測パラメータも、しかしながら、
図1に示されない3つの可能な視点の次の視点データのために導入/予測の根拠として役立ち得る符号化パラメータを表す。
【0043】
上記の程度に起因して、マルチプレクサ44によって、データストリーム18に挿入されるデータ量は、さらに低下する。特に、符号化ブランチ22d,1,22v,2および22d,2の符号化パラメータの量は、先行する符号化ブランチの符号化パラメータを導入するか、または、単に、それに関係する予測残差をマルチプレクサ44によりデータストリーム28に挿入するかによって大きく減少され得る。時間的およびインター予測のどちらかを選ぶ能力のため、符号化ブランチ22v,2および22d,2の残差データ423および424の量がより低下もする。残差データの量の減少は、時間的および視点間予測モードを区別する際の付加的な符号化効果を過度に補償する。
【0044】
更に詳細に符号化パラメータの導入/予測の原則を説明するために、
図2が参照される。
図2は、多視点信号10の典型的な部分を示す。
図2は、セグメントまたは部分60a,60bおよび60cにセグメント化されるものとしての、ビデオフレームv
1,tを示す。説明の単純化のため、フレームv
1,tの3つの部分のみが示される。ただし、セグメンテーションは、フレームをセグメント/部分に、継ぎ目なくおよびギャップなく分離し得る。前述したように、ビデオフレームv
1,tのセグメンテーションは、修正され、または時間内に変化され、そして、セグメンテーションは、データストリームの範囲内でシグナリングされるか、またはされない。
図2は、部分60aおよび60bがこの場合において、見本となるようなフレームv
1,t-1であるビデオ14
1のいくつかの参照フレームの再構成されたバージョンからも動きベクトル62aおよび62bを使用して時間的に予測されることを示す。周知のように、ビデオ14
1のフレームの中の符号化順序は、これらのフレームの中の表現順序と一致されえない。そして、従って、参照フレームは、表示時間順序64における現行フレームv
1,tに続き得る。例えば、部分60cは、イントラ予測パラメータがデータストリーム18に挿入されるためのイントラ予測された部分である。
【0045】
奥行き/視差マップd
1,tの符号化において、符号化ブランチ22
d,1は、
図2に関して、以下において例示される下記の1つ以上の上述の可能性を利用し得る。
【0046】
-例えば、奥行き/視差マップd
1,tの符号化において、符号化ブランチ22
d,1は、符号化ブランチ22
v,1によって使用されるように、ビデオフレームv
1,tのセグメンテーションを導入し得る。従って、ビデオフレームv
1,tのための符号化パラメータの範囲内におけるセグメンテーションパラメータがある場合、奥行き/視差マップデータd
1,tのためにその再送信が回避され得る。あるいは、符号化ブランチ22
d,1は、データストリーム18を介してビデオフレームv
1,tと関連してセグメンテーションの偏差の信号を伝送することに関する奥行き/視差マップd
1,tのために使用されるセグメンテーションの基礎/予測として、ビデオフレームv
1,tのセグメンテーションを使用し得る。
図2は、符号化ブランチ22
d,1が奥行き/視差マップd
1,tのプリセグメンテーションとしてビデオフレームv
1,tのセグメンテーションを使用するという場合を例示する。すなわち、符号化ブランチ22
d,1は、ビデオv
1,tのセグメンテーションからプリセグメンテーションを導入するかまたはそこからプリセグメンテーションを予測する。
【0047】
-更に、符号化ブランチ22d,1は、ビデオフレームv1,tにおけるそれぞれの部分60a,60bおよび60cに割り当てられる符号化モードから、奥行き/視差マップd1,tの部分66a,66bおよび66cの符号化モードを導入するかまたは予測し得る。ビデオフレームv1,tと奥行き/視差マップd1,tとの間の異なるセグメンテーションの場合において、ビデオフレームv1,tからの符号化モードの導入/予測が、ビデオフレームv1,tのセグメンテーションの同じ場所に位置された部分から得られるように、ビデオフレームv1,tからの符号化モードの導入/予測は制御され得る。同じ場所に位置することの適切な定義は、以下の通りである。奥行き/視差マップd1,tにおける現行部分に対するビデオフレームv1,tにおける同じ場所に位置された部分は、例えば、奥行き/視差マップd1,tにおける現行フレームの左上の角で同じ場所に位置される部分を含んでいる。符号化モードの予測の場合において、符号化ブランチ22d,1は、データストリーム18の範囲内において、明示的にシグナリングされるビデオフレームv1,tの範囲内における符号化モードに関連して奥行き/視差マップd1,tの部分66a~66cの符号化モードの偏差をシグナリングし得る。
【0048】
-予測パラメータに関する限り、符号化ブランチ22
d,1は、同じ奥行き/視差マップd
1,tの範囲内において近接した部分を符号化するために使用される予測パラメータを空間的に導入または予測するため、または、ビデオフレームv
1,tの同じ場所に位置される部分60a~60cを符号化するために使用される予測パラメータからそれを導入/予測する自由を有する。例えば、
図2は、奥行き/視差マップd
1,tの部分66aがインター予測部分であり、そして、対応する動きベクトル68aが、ビデオフレームv
1,tの同じ場所に位置される部分60aの動きベクトル62aから導入または予測され得ることを例示する。予測の場合において、単に動きベクトルの差だけが、インター予測パラメータ48
2の一部として、データストリーム18に挿入される。
【0049】
-符号化効率に関して、符号化ブランチ22
d,1が不規則性ブロック分割を使用している奥行き/視差マップd
1,tのプリセグメンテーションのセグメントを再分割するための能力を有することは、有利であるだろう。同じ視点の再構成された画像v
1,tから、ウェジレット分離線70のようなパーティション情報を導出するために、さらに以下において記載される実施例のいくつかの不規則性ブロック分割モードが参照される。この基準によって、奥行き/視差マップd
1,tのプリセグメンテーションのブロックが、再分割される。例えば、奥行き/視差マップd
1,tのブロック66cは、2つのウェジレット形のパーティション72aおよび72bに再分割される。符号化ブランチ22
d,1は、これらのサブセグメント72aおよび72bを別々に符号化するために構成され得る。
図2の場合、両方のサブセグメント72aおよび72bは、それぞれの動きベクトル68cおよび68dを使用して、インター予測されることを見本として示される。セクション3および4によれば、符号化ブランチ22
d,1は、不規則性ブロック分割のためのいくつかの符号化オプションのどちらかを選択し、そして、データストリーム18の範囲内においてサイド情報としてデコーダに選択のシグナリングするための自由を有し得る。
【0050】
ビデオ142の符号化において、符号化ブランチ22v,1が利用できる符号化モードのオプションに加えて、符号化ブランチ22v,2は、視点間予測のオプションを有する。
【0051】
例えば、
図2は、ビデオフレームv
2,tのセグメンテーションの部分64bが視差ベクトル76を使用する第1の視点ビデオ14
1の時間的に対応するビデオフレームv
1,tからの視点間予測であることを例示する。
【0052】
この違いにもかかわらず、符号化ブランチ22v,2は、加えて、特に、これらの符号化において使用される符号化パラメータのようなビデオフレームv1,tの符号化および奥行き/視差マップd1,tを形成する全ての利用可能な情報を使用し得る。従って、符号化ブランチ22v,2は、時間的に位置合わせしたビデオフレームv1,tおよび奥行き/視差マップd1,tのそれぞれの同じ場所に位置する部分60aおよび66aの動きベクトル62aおよび68のいくつかまたは組み合わせからビデオフレームv2,tの時間的にインター予測された部分74aのための動きベクトル78を含む動きパラメータを導入または予測し得る。あるとしても、予測残差は、部分74aに対するインター予測パラメータに関してシグナリングされ得る。この点に関しては、動きベクトル68aは、動きベクトル62aそれ自身から予測/導入にすでに受けさせることが、取り消されなければならない。
【0053】
ビデオフレームv1,tおよび対応する奥行き/視差マップd1,tの両方の符号化パラメータが利用可能であるので、モジュール52によって配信される利用可能な共通のデータが増加するとともに、その上、奥行き/視差マップd1,tの符号化に関して、上述したように、ビデオフレームv2,tを符号化するための導入/予測符号化パラメータの他の可能性は、符号化ブランチ22v,2によってビデオフレームv2,tの符号化に適用できる。
【0054】
それから、符号化ブランチ22d,2は、符号化ブランチ22d,1によって奥行き/視差マップd1,tの符号化と同様に、奥行き/視差マップd2,tを符号化する。これは、例えば、同じ視点122のビデオフレームv2,tから、符号化パラメータ導入/予測の場合の全てに関して、真である。しかしながら、加えて、符号化ブランチ22d,2は、以前の視点121の奥行き/視差マップd1,tを符号化するために使用されていた符号化パラメータから符号化パラメータを導入/予測するための機会も有する。加えて、符号化ブランチ22d,2は、符号化ブランチ22v,2に関して説明されるように、視点間予測を使用し得る。
【0055】
図1のエンコーダ20を記載した後、それは、例えば、ソフトウェア、ハードウェアまたはファームウェア、すなわち、プログラム可能なハードウェアにおいて実装され得る点に留意すべきである。
図1のブロックダイヤグラムは、エンコーダ20が、構造的に並列符号化ブランチ、すなわち、ビデオ毎の1つの符号化ブランチおよび多視点信号10の奥行き/視差データを含むことを示唆するにもかかわらず、これが事実である必要はない。例えば、要素24~40のタスクを実行するように構成されるソフトウェアルーチン、回路部分またはプログラム可能な論理部分は、それぞれ、符号化ブランチの各々のためのタスクを成し遂げるために順次使用され得る。並列処理において、並列符号化ブランチの処理は、パラレルプロセッサコアまたは並列運転回路構成において実行され得る。
【0056】
図3は、例えば、データストリーム18から多視点信号によって表される場面に対応する1つまたはいくつかの視点ビデオを再構成するためにデータストリーム18を復号化することができるデコーダを示す。大部分は、
図1の引用符号が、
図1に関しても上で設けられる機能性の記載が
図3にも適用されることを示すために、出来るだけ再利用されるように、
図3のデコーダの構造および機能性は、
図20のエンコーダと類似する。
【0057】
図3のデコーダは、通常、引用符号100によって示され、データストリーム18のための入力および上記の1つまたはいくつかの視点102の再構成を出力するための出力を含む。デコーダ100は、視点抽出器108および符号化パラメータ交換器110と同様に、データストリーム18によって表される多視点信号10(
図1)のデータ要素の各々のためのデマルチプレクサ104および一対の復号化ブランチ106を含む。
図1のエンコーダを有するケースであったように、復号化ブランチ106は、同じ相互接続において同じ復号化要素を含む。そして、それは、したがって、典型的に、第1の視点12
1のビデオ14
1の復号化のための原因である復号化ブランチ106
v,1に関して記載される。特に、各符号化ブランチ106は、多視点信号10、すなわち、復号化ブランチ106
v,1のケースにおけるビデオ14
1のそれぞれのデータ要素を視点抽出器108に出力するために、マルチプレクサ104のそれぞれの出力に接続される入力、および視点抽出器108のそれぞれの入力に接続される出力を含む。その間に、各符号化ブランチ106は、逆量子化/逆変換モジュール28、加算器30、さらなる処理モジュール32、およびマルチプレクサ104および視点抽出器108との間に直列的に接続される復号化画像バッファ34を含む。加算器30、さらなる処理モジュール32および復号化画像バッファ34は、復号化画像バッファ34およびさらに加算器30の入力との間に接続された、述べられた順序で予測モジュール36および38の並列接続の後に続く結合器/セレクタ40とともにループを形成する。
図1の場合のように同じ参照番号を用いて示されるように、復号化ブランチ106の要素28~40の構造および機能性は、復号化ブランチ106の要素が、データストリーム18の範囲内において、伝達される情報の使用によって符号化処理の処理をエミュレートする点において、
図1における符号化ブランチの対応する要素と類似する。当然、復号化ブランチ106は、単にエンコーダ20によって、最終的に選択される符号化パラメータに関して符号化手順を逆転させるだけであるが、
図1のエンコーダ20は、符号化パラメータの最適セットを、任意に、特定の制約(例えば、最大ビットレート等)に従属することに関するレート/歪曲コスト関数を最適化している符号化パラメータのような若干の最適化の意味で求めなければならない。
【0058】
デマルチプレクサ104は、データストリーム18をさまざまな復号化ブランチ106に分配するためのものである。例えば、デマルチプレクサ104は、残差データ42
1を有する逆量子化/逆変換モジュール28、さらなる処理パラメータ50
1を有するさらなる処理モジュール32、イントラ予測パラメータ46
1を有するイントラ予測モジュール36、およびインター予測モジュール48
1を有するインター予測モジュール38に提供する。符号化パラメータ交換器110は、共通の符号化パラメータおよび様々な復号化ブランチ106の間の他の共通データを分配するために、
図1の対応するモジュール52のように作動する。
【0059】
視点抽出器108は、並列の復号化ブランチ106によって再構成されるように多視点信号を受信し、そして、外部的に設けられている中間の抽出制御データ112によって定められる視点角または観察方向に対応する1つまたはいくつかの視点102をそれらから抽出する。
【0060】
エンコーダ20の対応する部分と関連するデコーダ100の類似の構造のため、視点抽出器108に対するインタフェースまでのその機能性は、類似して、上記の記載に容易に説明される。
【0061】
実際、復号化ブランチ106
v,1および106
d,1は、(42
1の範囲内のスケーリングパラメータ、パラメータ46
1,48
1,50
1、および対応する非導入のパラメータ、および予測残差、第2のブランチ16
d,1の符号化パラメータ、すなわち、42
2、パラメータ46
2,48
2,50
2のような)データストリーム18において含まれる第1の符号化パラメータにしたがって、多視点信号10の以前の再構成された部分から第1の視点12
1の現行部分を予測すること、第1の視点12
1の現行部分の再構成の以前のデータストリーム18から再構成され、およびデータストリーム18において含まれる42
1および42
2の範囲内における第1の修正データを使用して第1の視点12
1の現行部分の予測の予測エラーを修正することによって、データストリーム18から多視点信号10の第1の視点12
1を再構成するために一緒に作動する。復号化ブランチ106
v,1は、ビデオ14
1を復号化する役割を果たす一方、符号化ブランチ106
d,1は、奥行き/視差マップデータ16
1を再構成することに対する責任を負う。例えば、
図2を参照されたい。復号化ブランチ106
v,1は、データストリーム18、すなわち、42
1内のスケーリングパラメータ、パラメータ46
1,48
1,50
1から読み込まれた対応する符号化パラメータにしたがって、多視点信号10の以前に再構成された部分からの60a,60bまたは60cのような、ビデオ14
1の現行部分を予測し、そして、データストリーム18から、すなわち、42
1の範囲内における変換係数レベルから得られる、対応する修正データを使用してこの予測の予測エラーを修正することによって、データストリーム18から第1の視点12
1のビデオ14
1を再構成する。例えば、復号化ブランチ106
v,1は、ビデオフレームの間の符号化順序、および、フレームの範囲内におけるセグメントの符号化のために、エンコーダの対応する符号化ブランチのようなこれらのフレームのセグメント間における符号化順序のために使用するセグメント/部分の単位におけるビデオ14
1を処理する。したがって、ビデオ14
1の全ての以前に再構成された部分は、現行部分に対して予測するために利用可能である。現行部分の符号化パラメータは、1つ以上のイントラ予測パラメータ50
1、インター予測パラメータ48
1、さらなる処理モジュール32のためのフィルタパラメータ等を含み得る。予測エラーを修正するための修正データは、残差データ42
1の範囲内におけるスペクトル変換係数レベルによって表され得る。符号化パラメータのこれらのすべてが、全部送信されるものに必要であるわけではない。それらのいくつかは、ビデオ14
1の近接したセグメントの符号化パラメータから空間的に予測され得る。例えば、ビデオ14
1に対する動きベクトルは、ビデオ14
1の近接した部分/セグメントの動きベクトル間の差の動きベクトルとしてビットストリームの範囲内において送信され得る。
【0062】
第2の復号化ブランチ106d,1に関する限り、それは、残差データ422および対応する予測およびデータストリーム18の範囲内における信号を伝送するようなフィルタパラメータおよびデマルチプレクサ104、すなわち、視点間の境界を横切ることによって予測されない符号化パラメータによってそれぞれの復号化ブランチ106d,1に分配されるだけでなく、符号化パラメータおよびデマルチプレクサ104を介して復号化ブランチ106v,1に提供された修正データ、または符号化情報変換モジュール110を介して分配されるようないかなる情報を経ても、アクセスされ得る。このように、復号化ブランチ106d,1は、デマルチプレクサ104を介して送られる符号化パラメータの部分から第1の視点121に対する復号化ブランチ106v,1および106d,1のペアに、奥行き/視差マップデータ161を再構成するためのその符号化パラメータを決定する。そして、それは、部分的に、復号化ブランチ106v,1に費やされ、そして、送られるこれらの符号化パラメータの部分に重なる。例えば、復号化ブランチ106v,1は、一方、フレームv1,tの他の近接した部分に対する動きベクトル差として、他方、482の範囲内において明示的に送信される動きベクトルの差として、例えば、481の範囲内において明示的に送信される動きベクトル62aから動きベクトル68aを決定する。加えて、または、代案として、復号化ブランチ106d,1は、奥行き/視差マップデータ161の復号化に関して一時的に、上記のように、不規則性ブロック分割を導出するためにウェッジレット分離線の予測に関して、上述したようにビデオ141の再構成された部分を使用し得る。そして、以下において、より詳細に概説される。
【0063】
さらに、具体的に、復号化ブランチ106d,1は、少なくとも部分的に復号化ブランチ106v,1(または、そこから導入される)によって使用される符号化パラメータから予測されて、および/または復号化ブランチ106v,1の復号化画像バッファ34におけるビデオ141の再構成された部分から予測される符号化パラメータの使用によってデータストリームから第1の視点121の奥行き/視差マップデータ141を再構成する。符号化パラメータの予測残差は、データストリーム18からデマルチプレクサ104を介して得られ得る。復号化ブランチ106d,1のための他の符号化パラメータは、完全にデータストリーム108の範囲内に送信され得るか、または、他の基準について、すなわち、符号化のために使用された符号化パラメータに、奥行き/視差マップデータ161自身の以前に再構成された部分のいくつかを参照にする。これらの符号化パラメータに基づいて、復号化ブランチ106d,1は、奥行き/視差マップデータ161の以前の再構成された部分から奥行き/視差マップデータ141の現行部分を予測し、奥行き/視差マップデータ161の現行部分の再構成の前に復号化ブランチ106d,1、によってデータストリーム18から再構成され、そして、それぞれの修正データ422を使用して奥行き/視差マップデータ161の現行部分の予測の予測エラーを修正する。
【0064】
符号化に関してすでに上述したように、第2の視点122に対する復号化ブランチ106v,2および106d,2のペアの機能性は、第1の視点121の場合と同様である。両方のブランチは、特有の符号化パラメータの使用によって、データストリーム18から多視点信号10の第2の視点122を再構成するために協働する。単に、これらの符号化パラメータの一部だけは、これらの2つの復号化ブランチ106v,2および106d,2のいずれかにデマルチプレクサ104を介して送信され、そして分配されることを必要とする。そして、それは、視点141および142、そして、任意に視点間予測された部分の残差の間の視点の境界全体を導入/予測されない。第2の視点122の現行部分は、多視点信号10の以前に再構成された部分から予測され、第2の視点122のそれぞれの現行部分の再構成の前に復号化ブランチ106のいずれかによってデータストリーム18から再構成され、そして、したがって、復号化ブランチ106v,2および106d,2のこのペアにデマルチプレクサ104によって送られる修正データ、すなわち、423および424を使用して予測エラーを修正する。
【0065】
復号化ブランチ106d,2は、復号化ブランチ106v,1,106d,1および106v,2のいずれかによって使用された符号化パラメータから、再構成されたビデオ142および/または第1の視点121の再構成された奥行き/視差マップデータ161から少なくとも部分的に導入/予測によってその符号化パラメータを決定し得る。例えば、データストリーム18は、奥行き/視差マップデータ162の現行部分80bに対して、この現行部分80bの符号化パラメータがビデオ141、奥行き/視差マップデータ161およびビデオ142のいずれかまたはそれらの適切な部分集合のいずれかまたはそれらの同じ場所に位置する部分から導入または予測されるかどうか、およびどの部分かに関して、シグナリングする。例えば、これらの符号化パラメータの関心のある部分は、84のような動きベクトル、または視差ベクトル82のような視差ベクトルを含み得る。さらに、不規則性分割されたブロックについて、他の符号化パラメータは、復号化ブランチ106d,2によって導出され得る。
【0066】
いずれにせよ、多視点データ10の再構成された部分は、その中で含まれる視点が、新しい視点、すなわち、例えば、これら新しい視点に関連したビデオの視点抽出に基づく視点抽出器108に届く。この視点抽出は、それとともに関連した奥行き/視差マップデータを使用することによって、ビデオ141および142の再投射を含むか、あるいは伴い得る。率直に言って、他の中間視点へのビデオの再投射において、視聴者により近くに位置される場面部分に対応するビデオの部分は、視聴者の位置からより遠くに位置する場面部分に対応する映像の部分より、視差方向、すなわち、方向の異なるベクトル視差方向に沿ってシフトされる。
【0067】
デコーダは視点抽出器108を必ずしも含む必要はないと述べられなければならない。むしろ、視点抽出器108は、なくてもよい。この場合、デコーダ100は、単に、それらのうちの1つ、いくつかまたは全体のような、視点121および122のいずれかを再構成するためである。奥行き/視差データが個々の視点121および122に対して存在しない場合において、視点抽出器108は、それにもかかわらず、互いに近接した視点の対応する部分を各々と関連づけている視差ベクトルを有効に使用することによって、中間視点抽出を実行し得る。近接した視点のビデオと関連した視差ベクトル場の視差ベクトルをサポートするようにこれらの視差ベクトルを使用して、視点抽出器108は、この視差ベクトル場を適用することによって、近接した視点121および122のそのようなビデオから中間視点ビデオを構築し得る。例えば、ビデオフレームv2,tは、その部分/セグメントの視点間予測の50%を有することを仮定する。すなわち、部分/セグメントの50%に対して、視差ベクトルが存在する。残った部分のために、視差ベクトルは、空間的の意味で補間/外挿により、視点抽出器108によって決定され得る。ビデオ142の以前に再構成されたフレームの部分/セグメントのための視差ベクトルを使用する時間的補間も使用され得る。ビデオフレームv2,tおよび/または参照ビデオフレームv1,tは、それから、中間視点を得るために、これらの視差ベクトルに従って歪められ得る。この目的を達成するために、視差ベクトルは、第1の視点121および第2の視点122の視点位置との間の中間視点の中間視点位置に従って、スケーリングされる。この手順に関する詳細は、以下により詳細に概説される。
【0068】
しかしながら、単に、ビデオを含む1つの視点の符号化および上記に概説された実施例の第1の視点12
1のような対応する奥行き/視差マップデータである場合を考察すると、以下に概説された実施例は、
図1~3のフレームワークにおいて有利に使用され得る。その場合、送信された信号情報、すなわち、単一の視点12
1は、視点合成に対応した信号、すなわち、視点合成を可能にする信号と呼ばれ得る。奥行き/視差マップデータ16
1を有するビデオ14
1を加えることは、奥行き/視差マップデータ16
1を有効に使用することによって、近接する新しい視点に再度投影する視点12
1によって視点合成のいくつかのソートを実行するために視点抽出器108を可能にする。また、符号化効率のゲインは、不規則性ブロック分割を使用することによって得られる。また、さらに、以下に記載される不規則性ブロック分割の実施例は、上記に記載される態様の視点間符号化情報の交換から、単一の視点の符号化概念の独立の範囲内において使用され得る。具体的には、
図1~3の上記の実施例は、ブランチ22,100
v/d,2および関連する視点12
2が見当たらない範囲まで、変化し得る。
【0069】
このように、
図1~3は、その後説明された不規則性ブロック分割が有利に使用され得る多視点符号化概念のための実施例を示した。しかしながら、サンプルアレイが奥行き/視差マップであるかどうかにかかわらず、以下に説明する符号化モードは他の種類のサンプルアレイの符号化に関連して使用できることを再度強調する。以下に記載される符号化モードのいくつかは、対応するテクスチャマップに加えて奥行き/視差マップの共存さえ必要としない。
【0070】
特に、以下で概説される実施例は、若干の符号化モードを含み、それによって、ブロックの信号は、信号のサンプルを2セットのサンプルに分けて、そして、固定サンプル値によってサンプルの各一組を表すモデルによって表される。以下で説明された符号化モードのいくつかが、ブロックの信号を直接表すために使用されるか、または、付加的な残差情報(例えば、変換係数レベル)の符号化によってさらにリファインされるブロックのための予測信号を生成するために使用され得る。その後説明された符号化モードのうちの1つが、奥行き信号に適用される場合、他の良好な面に加えて、有利な点は、奥行き信号が、徐々に変化する領域の間において徐々に変化する領域および鋭いエッジによって主に特徴付けられるという事実から結果として得られ得る。徐々に変化する領域は、変換符号化アプローチ(すなわち、DCTに基づく)によって効率的に表され得る一方、2つのほぼ固定領域の間における鋭いエッジの表現は、符号化される多数の変換係数を必要とする。以下に概説されるいくつかの実施例に関して記載されるように、エッジを含むこの種のブロックは、2つの領域(各々固定サンプル値を有する)にブロックを分けるモデルを使用することによってよりよく表され得る。
【0071】
以下において、本願発明の異なる実施例が、さらに詳細に記載される。セクション1および2において、ブロックを固定サンプル値の2つの領域に分割するための基本概念が記載される。セクション3は、ブロックが異なる領域にどのように分割され得るか、およびどのようなパラメータが領域に対するサンプル値と同様に分割を表すために送信されることを必要とするか特定するための異なる実施例を記載する。実施例は、他のいかなるブロックから独立している分割情報をシグナリングするため、空間的に近接したブロックのための送信されたデータに基づいて分割情報をシグナリングするため、および符号化される奥行きマップに関連するすでに送信されたテクスチャ画像(従来のビデオの画像)に基づく分割情報のシグナリングするための概念を含む。そして、セクション4は、不規則に配置されたブロックを扱うための若干の実施例と関係しているモード情報、分割情報および固定サンプル値の符号化に関して、本願発明の実施例を記載する。
【0072】
以下の説明が、主に、(特に、多視点ビデオ符号化の内容において)奥行きマップの符号化に対して対象とされ、そして、以下の説明が、所与の奥行きブロックに基づくにもかかわらず、本願発明のいくつかの実施例は、従来のビデオ符号化に対しても適用され得る。それ故に、用語「奥行きブロック」が、一般的用語「信号ブロック」に置き換えられる場合、記載が、他の信号タイプに適用され得る。さらにまた、以下の記載は、時々正方形のブロックに集中するが、しかし、本願発明は、矩形ブロックまたはサンプルの他に接続され、または単接続のサンプルのセットにも適用され得る。
【0073】
1.ウェッジレット
ブロックベースのハイブリッドビデオ符号化において、例えば、
図1~3に示されるように、フレームは、矩形ブロックにおいて再分割される。しばしば、これらのブロックは正方形であり、そして、各ブロックのための処理は、同じ機能的構造に従う。このセクションの大部分の実施例は正方形のブロックを使用するけれども、ウェッジレットブロックパーティションおよびすべての関連した方法は、正方形のブロックに限られているというわけではなく、如何なる矩形のブロックサイズに対してもむしろ可能である点に留意されたい。
【0074】
1.1 ウェッジレットブロックパーティション
ウェッジレットブロックパーティションの基本的な原則は、
図4において例示されるように、線201によって分離されるようにブロック200の領域を2つの領域202a,202bに分割することである。ここで、2つの領域は、P
1およびP
2を示すラベルがつけられる。分離線は、開始点Sおよび終了点Eによって決定され、いずれもブロックの境界上に設置される。時々、以下において、領域P
1は、ウェッジレットパーティション202aと呼ばれ、一方、領域P
2は、ウェッジレットパーティション202bと呼ばれる。
【0075】
連続的な信号空間に対して(
図4の左側参照)、開始点の位置は、S(x
S,y
S)であり、終了点の位置は、E(x
E,y
E)であり、いずれのブロックサイズの制限は、0≦x≦x
Eおよび0≦y≦y
Eである(ここで、座標のうちの1つは、最小値(0)または最大値(x
Eまたはy
E)に等しくなければならない。)。これらの定義によれば、分離線の方程式は、以下の通りである:
【0076】
この方程式は、xS≠xEに対してのみ有効であることに留意されたい。そのとき、2つの領域P1およびP2は、それぞれ線の左のエリアおよび右のエリアとして定義される。
【0077】
通常、デジタル画像処理において、たいてい、個々に分離した信号空間(
図4の右側を参照)が使用され、ここで、ブロックは、グリッド正方形で例示されるサンプル203の整数で構成される。ここで、開始点および終了点SおよびEは、位置S(u
S,v
S)およびE(u
E,v
E)を有するブロック200のサンプルに接しているために一致し、いずれのブロックサイズの制限は、0≦x≦u
E、および0≦y≦v
Eである。個々に分離した場合において、分離線の方程式は、式(1)に従って定式化され得る。しかしながら、
図4の右において例示されるように、完全なサンプルのみが、2つの領域の部分として割り当てられるように、領域P
1およびP
2の定義は、ここでは異なる。この割り当ての問題は、セクション1.4.1において記載されるように、アルゴリズム的に解決され得る。
【0078】
ウェッジレットブロックパーティション202a,202bは、ブロック200の異なるエッジに位置するように、開始点および終了点204を必要とする。従って、
図5において例示されるように、ウェッジレットブロックパーティション202a,202bの6つの異なる幾何学的配置が、矩形または正方形ブロック200によって区別される。
【0079】
1.2 ウェッジレットパーティションパターン
符号化処理におけるウェッジレットブロックパーティションを使用するために、パーティション情報は、パーティションパターンの形式で格納され得る。この種のパターンは、サイズのアレイu
B×v
Bからなり、そして、各要素は、一致しているサンプルが領域P
1またはP
2に帰属するかどうかのバイナリ情報を含む。
図6は、例えば、異なるブロックサイズのウェッジレットパーティションパターンを示す。ここで、バイナリ領域情報、すなわち、2つのセグメンテーションは、サンプル203を黒または白によって表わす。
【0080】
1.3 ウェッジレットモデリングおよび近似
ウェッジレットをともなって1ブロックの奥行き信号のモデリングのために、必要情報は、概念的に2つの要素からなる。例えば、パーティションパターンの形式において、一方は、パーティション情報(セクション1.1を参照)であり、そして、それは、2つの領域(セクション1.2を参照)の1つに各サンプル203を割り当てる。必要な他の情報要素は、領域のサンプルに割り当てられる値である。2つのウェッジレット領域の各々の値は、定数として定義され得る。これは、いくつかの以下において概説される実施例の場合である。このように、この値は、固定パーティション値(CPV)として参照する。その場合、第2の情報要素は、指定された領域のための2つの代表的なサンプル値を構成する。
【0081】
ウェッジレットによって奥行きブロックの信号に近づけるために、
図7において示すように、所与のパーティションのCPVは、対応する領域の元の奥行き信号の平均値として算出され得る。
図7の左側において、代表的な奥行きマップ以外のグレースケールの部分が示される。現在、ウェッジレットベースの分割の対象であるブロック200が、見本として示される。特に、拡大されたグレースケールバージョンと同様に、元の奥行き信号205の範囲内におけるその図示する位置が示される。第1に、パーティション情報、すなわち、考えられる2つのセグメンテーションの領域P
1およびP
2が、ブロック200に覆われる。それから、1つの領域のCPVは、それぞれの領域によってカバーされた全てのサンプルの平均値として算出される。
図5における実施例のパーティション情報がよく奥行き信号205に合致する場合、領域P
1(濃いグレー)に対する低いCPVおよび領域P
2(薄いグレー)に対する高いCPVを有するウェッジレットモデル、すなわち、概説されたウェッジレット分割モードに基づくブロック200の予測を結果として得ることは、奥行きブロックの良好な近似を表す。
【0082】
1.4 ウェッジレット処理
1.4.1 ウェッジレットパターンリスト
ウェッジレットブロックパーティションの効率的な処理および信号の伝送の目的のために、パーティションパターンは、ルックアップ・リストにおいて体系化され得る。ウェッジレットパターンリストは、領域の分離線のための開始点の位置および終了点の位置のすべての可能な組み合わせに対するパターンを含み、または、全ての可能な組み合わせの適切なサブセットを含む。このように、1つのルックアップ・リストは、各予測ブロックサイズに対して生成され得る。特定のブロックサイズのリストの範囲内における特定のパターンの位置またはインデックスに依存しているエンコーダおよびデコーダ(詳細はセクション3を参照)の間にシグナリングすることを可能にするために、同一のリストが、エンコーダおよびデコーダにおいて利用可能にされ得る。これは、パターンの定義済みセットを含むことによっても、エンコーダおよびデコーダの初期設定の一部として、同一の生成アルゴリズムを実行することによっても実装され得る。
【0083】
図8において例示されるように、ウェッジレットパーティションパターン・ルックアップ・リストを作成するための中心的な機能は、1つのリスト要素の生成である。これは、以下において説明するように(または、類似のアルゴリズムによって)、実現され得る。空のパターン(バイナリ要素のu
B×v
Bアレイ)並びに、開始点Sおよび終了点Eの座標(
図8の左)が与えられ、第1のステップは、分離線を描画することである。この目的のために、ブレゼンハムの線アルゴリズムが適用され得る。一般に、アルゴリズムは、サンプル203が2つの所与の点の間の直線に近い近似を形成するためにプロットされることを決定する。ウェッジレットパーティションパターンの場合、開始点Sおよび終了点Eの間の線に近い全ての要素203がマークされる(
図8(中間の左)における黒色のボックス)。最後のステップは、マークされたサンプルによって結果として得ている分離された2つの領域のうちの一方を塗りつぶすことである。ここで、上述した割り当て問題が述べられることを必要とする。パターンの要素はバイナリであるので、ブレゼンハムのアルゴリズムによってマークされた分離線は、1つの領域の部分となる。線サンプルが理論的に、両方の領域の部分である場合、直感的に、これは不安定となるようにみえる。しかしながら、大部分の損失なしに、分離線サンプルを1つの領域に割り当てることが可能である。これは、領域を塗りつぶしているアルゴリズムと同様に両方の線のマークが、幾何学的配置の認識、すなわち、幾何学的配置に従って基礎となる角に関するという事実によって、確実にされる。事実に基づいて、角領域が分離線によって完全に区切られ、この領域を塗りつぶすことは、比較的シンプルである。塗りつぶすアルゴリズムは、基礎となる角要素206から開始し、そして、それがすでにマークされる要素およびこのように線207(
図8(中間の右)を参照)の部分に達するまで、連続的にすべてのパターン要素にカラム-および線のようにマークされる。その結果、所与の開始点の位置および終了点の位置のウェッジレットパーティションパターンは、バイナリ値(
図8の右)によって表される。
【0084】
特定のブロックサイズのウェッジレットパーティションパターン・ルックアップ・リストのための生成方法は、可能な線開始位置および終了位置のためのリスト要素を作製する。これは、
図5において示される6つの幾何学的配置を通じて反復することによって実現される。各幾何学的配置に対して、開始位置は、ブロックのエッジの一方に位置し、終了位置は、ブロックのエッジの他方に位置し、そして、リスト生成プロセスは、開始位置および終了位置の可能な各組み合わせに対して上記において導入されたウェッジレットパターンの生成方法を実行する。効率的な処理およびシグナリングのために、ウェッジレットパターンリストは、特定の特有のパターンのみを含むべきである。したがって、新しいパターンがリストに追加される前に、それが既にリストのパターンのいずれかと同一であるか、または、同一でないかのチェックがなされる。このような場合、パターンは、冗長で、したがって、破棄される。それに加えて、それらが、有効なウェッジレットブロックパーティションを表していない場合、面パターン、すなわち、全てのサンプルが1つの領域に割り当てられ、リストからも除外される。
【0085】
記載されているウェッジレットパターンリストに対する拡張として、パターンの生成に対して使用される線開始位置と終了位置の解像度は、例えば、ブロックサイズに応じて、最適に増加、また減少され得る。この拡張の目的は、符号化の効率と複雑さとの間における、より良好なトレードオフを発見することである。解像度を上昇させることは、より多くのパターンを有するリストに至るが、その一方で、解像度を減少させることは、通常の解像度と比較して、より短いリストの解像度を結果として得る。従って、解像度は、通常、小さいブロックサイズに対して増加し、大きいブロックサイズに対して減少する。開始位置および終了位置のため解像度の独立に注意することは重要であり、リストに格納されるウェッジレットパーティションパターンは、通常、標準の解像度、すなわち元のブロックサイズを有する必要がある。解像度を低下させることは、上述したように、開始位置および終了位置のサブセットの用途にのみ、パターンを生成することによってシンプルに実現され得る。例えば、半分の解像度は、パターンの生成をあらゆる第2の開始位置および終了位置に制限することを意味する。その一方、解像度を増加させることは、より困難である。すべての開始位置および終了位置をカバーするために、上述したアルゴリズムを使用して、増加した解像度を有する一時的なパターンが最初に発生する。第2のステップにおいて、結果として得られるパターンは、一定の解像度に、ダウンサイジングがなされる。バイナリデータのため、ダウンサイジングは、補間値をサポートしない、そして、それは、増加した解像度の場合には、同一のパターンの大きい数を結果として得ることに注意されたい。
【0086】
上述したウェッジレットパターン生成の最終結果として、ウェッジレットパターンの順序リストは、エンコーダ側およびデコーダ側の両方で導出される。実際の実装において、これらのパターンは、使用された符号化アルゴリズム/符号化規格によって予め定義されることもあり得る。さらに、それは、上述した実際のアルゴリズムによってパターンを生成する必要はなく、このアルゴリズムの改良も使用され得る。エンコーダおよびデコーダのいずれもが、符号化プロセスおよび復号化プロセスのためのウェッジレットパターンの同じリストを生成した(そして、後の使用)ことが、重要なだけである。
【0087】
1.4.2 最小の歪みのウェッジレットサーチ
上述したルックアップ・リストに基づいて、ウェッジレットパーティションによるブロック信号の最良近似は、サーチアルゴリズムによって発見され得る。ウェッジレットベースの符号化アルゴリズムのために、最良近似は、最小の歪みをもたらすウェッジレットモデルとして理解され得る。換言すれば、サーチは、所与のブロックに対するウェッジレットパーティションパターンの最良の一致を発見しようとする。サーチは、導出されるパターン・リストを利用する。そして、それは、所与のブロックサイズ(詳細についてセクション1.4.1を参照)のためのすべての可能なウェッジレットパーティションパターンを含む。パターンは、再度生成することを必要としない場合、最小の歪みウェッジレットサーチが実行されるたびに、これらのリストは、サーチの処理時間を制限することを助ける。各サーチステップは、次のステップから構成され得る:
【0088】
・ 所与のパーティションパターンおよび元のブロック信号からのCPV値の算出。
・ 元のブロック信号とウェッジレットモデルとの間の歪みDW,curの算出。
・ DW,cur<DW,minの評価:真の場合、最小の歪みのウェッジレット情報を更新し、DW,min=DW,curを設定することによって、現在のパーティションパターンのリストインデックスを格納する。
【0089】
歪みの代わりに、ラグランジアン・コストの大きさが、使用されるウェッジレットパターンを発見するために使用され得る。ラグランジアン定数の大きさは、加重和D+λ・Rであり、歪みDの加重はレートRとともに特定のウェッジレットパターンによって得られ、レートRは、ラグランジアン乗数λが与えられる付随するパラメータを送信するために必要である。
【0090】
異なる方法は、包括的な検索から高速検索方法に及ぶ、サーチアルゴリズムに対して可能である。包括的な検索は、ウェッジレットパターンリストの全ての要素が最小の歪みに対して引き続いて検査されることを意味する。遅い(それは、特にエンコーダにとって重要である)ことの代償がなければ、この方法により、確実に全体的な最小値が分かることになる。方法を進歩させた高速検索手段は、必要な検索ステップの数を減らす。高速検索方法は、例えば、連続するリファインであり得た。第1のフェーズにおいて、開始位置および終了位置、例えば、あらゆる4つの境界サンプルのみの制限された数から結果として得るパーティションパターンのサブセットのための最小の歪みのウェッジレットが、検索される。第2のフェーズにおいて、開始位置および終了位置は、リファインされる。例えば、あらゆる第2の境界サンプルを許容し、第1のフェーズの最良の結果の周辺に、検査された開始位置および終了位置の範囲を制限している。あらゆるサイクルにおいて、ステップサイズをリファインすることによって、最後に、最小の歪みのウェッジレットが分かる。全ての検索と対比して、そのような高速検索方法は、極小を探し出すことを可能にするのみであるが、しかし、検査されるウェッジレットパターンの数は、著しくより低く、そして、従って、検索はより高速である。例えば、ブロックサイズの関数として、第1のフェーズのステップサイズが、一定値であることを必要とせず、最適に、セットされることができることに注意されたい。
【0091】
ウェッジレット線またはウェッジレットパターンのコースを割り出しているちょうど議論されたインデックスは、wedge_full_tab_idxと呼ばれ得る。
【0092】
2 輪郭
このセクションにおいて、大部分の実施例は正方形ブロックを使用するけれども、輪郭ブロックパーティションおよびすべての関連した実施例が、正方形ブロックに限られるというわけではなく、いかなる矩形のブロックサイズにとってもむしろ可能である点に留意されたい。
【0093】
2.1 輪郭ブロックパーティション
輪郭ブロックパーティションの基本的な原則は、ブロック200のエリアを2つの領域202a,202bに分割することである。ウェッジレットブロックパーティションとは異なり、領域の間の分離線201は、幾何学の定式化によって記載されえない。
図9において、P
1およびP
2を示すラベルがつけられた2つの領域によって例示されるように、輪郭の領域が任意の形状でありえ、それらは接続されることさえ必要としない。
【0094】
図9は、輪郭ブロックパーティションのための連続および分離した信号空間の違いも例示する。また、完全なサンプルだけは、分離した信号空間(
図9の右)に対する2つの領域のどちらかの部分として割り当てられ得る。輪郭パーティション情報は、分離した参照信号から導出され(詳細はセクション3.2.2を参照)、そして、幾何学の定式から導出されず、ウェッジレットブロックパーティションに対する割り当て問題は、ここで考慮される必要はない。
【0095】
2.2 輪郭パーティションパターン
ウェッジレットパーティションパターンの一致において(セクション1.2を参照)、輪郭ブロックパーティション情報は、パーティションパターンの形で、格納され得る。そのようなパターンは、サイズu
B×v
Bのアレイを構成し、各要素は、一致しているサンプルが領域P
1またはP
2のいずれかに属するかのバイナリ情報を含む。
図10は、黒色または白色のサンプル色彩によってバイナリ領域情報を表す輪郭パーティションパターンの例を示す。
【0096】
2.3 輪郭モデリングおよび近似
輪郭によって有するブロックの奥行き信号に近似する原則は、セクション1.3において記載されたウェッジレットの概念と同一である。また、必須の情報は、2つの要素パーティション情報およびパーティションフィリング指示から構成され、そして、それは、対応する領域の元の深さ信号の平均値として算出され、各2つの領域に対して、順に1つの固定パーティション値(CPV)を含み得る。
【0097】
輪郭近似は、
図11において例示される。ここで、予測ブロック200の元の奥行き信号は、その環境を示すために強調され、そして、拡大されて示される。また、領域P
1およびP
2に関してパーティション情報は、ブロックによって最初にオーバーレイされ、そうすると、CPVは、領域によって覆われる全てのサンプルの平均値として算出される。
図11における例において、パーティション情報がよく奥行き信号と一致する場合、領域P
1(濃いグレー)に対する低いCPVおよび領域P
2(薄いグレー)に対する高いCPVを有する結果として得る輪郭モデルが、奥行きブロックの良好な近似を表す。
【0098】
3. ブロックパーティション符号化
例えば、
図1~3の符号化環境のような、多視点ビデオおよび奥行き(MVD)のための符号化フレームワークの範囲内で、以前のセクションに記載された方法およびアルゴリズムを使用するために、新規な符号化ルーチンまたはモードが定義されるべきであり、そして、必要なツールは、エンコーダおよびデコーダにおいて実装されるべきである。
【0099】
例えば、
図1のエンコーダまたは符号化ブランチ22
v/d,1のような、ハイブリッドビデオエンコーダのために、これらのツールは、評価、予測またはシグナリングの一部として分類され得る。評価は、それらが元の入力情報(例えば圧縮されていない画像)に依存するので、符号化プロセスの一部だけであるツールを要約する。それとは対照的に、それらが送信されたおよび/または再構成された情報(例えば復号化画像)に依存するだけであるので、予測は、符号化および復号化プロセスの一部であるツールを要約する。シグナリングは、エンコーダからデコーダまでビットストリーム中で送信した情報の符号化のためのツールを要約する。従って、それらは、同一のシンタックスおよび同一のエントロピー符号化状態を使用することを必要とする。
【0100】
評価ツールにとって、歪は、古典的なビデオ符号化アプローチから公知であるように、歪およびブロックの元の奥行き信号の相違を測定して、例えば、平均二乗誤差(MSE)または平均絶対差(MAD)として、または、合成された視点の歪として、ブロックの歪奥行き信号のために変位されたサンプルにより生じた合成された視点の違いを測定することにより、導出できることに注意すべきである。
【0101】
下記に概説された実施例に従って不規則性ブロックパーティション符号化のための概念は、パーティション情報(セクション3.1および3.2を参照)を処理するためにおよび処理CPV(セクション3.3を参照)に対するものに分割することができる。
【0102】
3.1. ウェッジレットベースのイントラ符号化
このセクションは、ウェッジレットブロックパーティション(セクション1を参照)に基づいて、2つのイントラ符号化モードを提示する。両方のモードは、デルタCPV法(セクション3.3.2を参照)と結合され得る。
【0103】
3.1.1. ウェッジレットブロックパーティションのイントラモデリング
このモードの基本的な原則は、エンコーダでベストマッチしているウェッジレットパーティションを見つけて、ビットストリーム中にパーティション情報を明確に送信することである。デコーダにおいて、ブロックの信号は、明確に送信されたパーティション情報を使用して再構成される。従って、このモードのための主なツールは、評価およびシグナリングの一部である。
【0104】
このモードのためのウェッジレットパーティション情報は、予測されないが、エンコーダにおいて評価プロセス内で検索される。この目的のために、セクション1.4.2にて説明したように、最小歪ウェッジレット検索は、基準として現行ブロックの元の奥行き信号を用いて実行される。検索は、使用される変形法に関してベストマッチしているウェッジレットパーティションをもたらす。
【0105】
デコーダでブロックを再構成して、ウェッジレットパーティション情報は、ビットストリーム中にシグナリングしなければならない。これは、リスト(セクション1.4.1を参照)の一致しているパターンの位置またはインデックスを明確に送信することにより、実現される。このリストインデックスは、ビンの定数によりシグナリングされる。N要素を有するウェッジレットパターンリストが与えられて、使用されるパターンのインデックスは、固定長符号または可変長符号または算数符号化(コンテキスト適応2進算術符号化を含む)、または、他のいかなるエントロピー符号化方法を使用して符号化される。ウェッジレットパーティション情報をシグナリングする高度な方法は、各パーティションパターンの確率に基づいてリストをソートするか、パーティション情報、例えば、線の開始位置および終了位置または線の開始位置と勾配、の代替表現を使用することを含むことができる。
【0106】
3.1.2. ウェッジレットブロックパーティションのイントラ予測
このモードの基本的な原則は、同じ画像、すなわちイントラ予測における以前に符号化されたブロックが利用できる情報から、ウェッジレットパーティションを予測することである。より良好な近似のために、例えば、線の終了位置を変化させることなどにより、予測されたパーティションは、例えば、エンコーダでリファインされる。ビットストリーム中の線の終了位置へのオフセットの唯一の伝送は、十分であり得る、そして、デコーダで、ブロックの信号は、予測されたパーティションおよびオフセットなどの送信されたリファイン情報を結合することから生じるパーティション情報を使用して再構成され得る。従って、このモードのための主なツールは、予測、評価およびシグナリングの一部である。
【0107】
このモードのためのウェッジレットパーティション情報の予測は、分離線の開始位置および勾配で構成されるウェッジレット表現により、内部的に働く。更なる処理のために、すなわち線の終了位置オフセットを適応させて、ブロックの信号を再構成して、予測結果は、線の開始位置および終了位置からなる表現に変換される。このモードの予測処理は、以前に符号化されたブロック、例えば現行ブロックの左側および上側の近接ブロックの情報から、線の開始位置および勾配を導き出す。
図12において、単に現行ブロック210および上記の隣接ブロック212だけが、示される。なお、数ブロックにとって、近接ブロックの一方または両方は、利用できないことに注意すべきである。この種の場合、このモードのための処理は、スキップされるかまたは失った情報を意味あるデフォルト値に設定することと共に続けられる。
【0108】
図12にて示したように、2つの主な概念は、現在示唆された実施例に従ってウェッジレットパーティション情報を予測するために区別される。2つの近接参照ブロックのうちの1つが、
図12の左側の実施例に示されるウェッジレットタイプであるときに、第1の概念は、ブロック212がウェッジレット分割に模範となるように従属するケースをカバーする。2つの近接参照ブロックがウェッジレットタイプではなく、
図12の右側の実施例に示されるデフォルトイントラ符号化タイプでもよいイントラ方向タイプであるときに、第2の概念は、ブロック212がイントラ符号化に模範となるように従属するケースをカバーする。
【0109】
参照ブロック212が、ウェッジレットタイプである場合、予測プロセスは、以下の通りに機能することができる:
図12、左側によれば、参照ウェッジレットの勾配m
refは、第1ステップの開始位置S
refおよび終了位置E
refから導出される。この概念の原則は、現行ブロック210の参照ウェッジレット、すなわちウェッジレット分離線201’を、現行ブロック210内において、延長することであり、そして、それは、参照ウェッジレット212の分離線201’の延長が、実際に現行ブロック210を横切る場合のみ可能である。従って、次のステップは、参照ウェッジレットを延長し続けることが可能かどうかを調べることである。
図12、左側の実施例は、それが可能であるシナリオを示す、しかし、参照ウェッジレットの開始位置および終了位置が、ブロックの左および右のエッジにある場合、線の延長は、下記のブロックを横切らないであろう。チェックが肯定的な場合に、開始位置S
Pおよび終了位置E
Pは、最終ステップで予測される。勾配m
pが定義によりm
refに等しいので、ブロック境界サンプルを有する延長線の交差ポイントとして、位置は単に算出される。
【0110】
参照ブロック212が、イントラ方向タイプである場合、予測プロセスは、以下の通りに機能することができる:
図12、右側によれば、参照ブロック212の勾配m
refは、第1ステップのイントラ予測方向214から導出される。イントラ方向214が抽象的なインデックスの形で設けられているだけの場合には、マッピングまたは変換機能は、勾配m
refを達成するために必要であるかも知れない。ウェッジレットタイプの参照ブロック212から予測するための概念とは異なり、分離線情報は、イントラ方向タイプの参照ブロック212により提供されていない。従って、開始位置S
pは、デコーダ、すなわち、左側および上記の隣接ブロックの隣接するサンプル、でも利用できる情報から導出される。それらは、
図12、右側においてハッチングされて示される。ハッチングの密度は、近接しているサンプルの値を表す。
図12、右側に図示されるように、これらの近接するサンプルから、最大傾斜を有する近接するサンプルの一対に近接しているものは、開始位置S
pとして選ばれる。ここで、傾斜は、2つの連続的なサンプルの値の絶対差として理解される。ウェッジレットパーティションのために、線開始点S
pは、2つの領域202a,202bをブロック210の一つのエッジ216の異なる値で切り離す。従って、隣接ブロックの隣接するサンプルの中の最大傾斜点がS
pの最高の予測である。勾配に関し、再び定義することにより、m
pは、m
refに等しく、かつ、S
pと共に、終了位置E
pは、最終ステップとして算出され得る。
【0111】
2つの提示された概念は、相補的である。ウェッジレットタイプの参照ブロックからの予測は、より優れてマッチしているパーティション情報を有するが、必ずしも可能でない、イントラ方向タイプの参照ブロックからの予測は常に可能であるが、パーティション情報は、より悪く適合する。従って、2つの概念を1つの予測モードに結合することは、有益である。付加的なシグナリングなしにこれを実現するために、以下の処理階層が、定義され得る:上記参照ブロックがウェッジレットタイプである場合、パーティションの予測を試みる。さもなければ、左側の参照ブロックがウェッジレットタイプである場合、パーティションの予測を試みる。さもなければ、上記および左側の参照情報からパーティションを予測する。後者のために、上記および左方向の間に決定するための異なる決定基準が、可能である。そして、単に上記を優先させることから共同で方向および隣接するサンプルの傾斜を評価する高度な方法に及ぶ。上側および左側の参照ブロックがウェッジレットタイプである場合、この種の高度な基準も、適用され得る。
【0112】
ウェッジレットパーティションをリファインするための線終了位置オフセットは、予測されえないが、エンコーダにより評価プロセス内で検索することができる。検索のために、
図12にて図示したように、候補パーティションは、予測されたウェッジレットパーティションおよび線終了位置E
offのためのオフセット値から発生する。オフセット値の範囲にわたって繰り返すことにより、および、異なる結果として生じるウェッジレットパーティションの歪を比較することにより、ベストマッチしているウェッジレットパーティションのオフセット値は、使用される変形法に関して決定される。
【0113】
デコーダでブロックを再構成するために、線終了位置オフセット値は、ビットストリームにおいてシグナリングされることになっている。同上は、3つのシンタックス要素の使用によってシグナリングされ得る。第1のシグナリングは、いかなるオフセットE
offが存在するかに関する。すなわち、同上がゼロであるかに関する。第2のものは、オフセットの符号、すなわちオフセットがゼロでない場合に、時計回り、または、反時計回りの偏差を意味する。そして、第3は、絶対オフセット値-1を示す:dmm_delta_end_flag、dmm_delta_end_sign_flag、dmm_delta_end_abs_minus1。疑似符号において、これらのシンタックス要素は、以下として含めることができる。
dmm_delta_end_abs_minus1およびdmm_delta_end_sign_flagは、DmmDeltaEnd、すなわち、E
offを導出するために用いることができる。そして、以下の通りである:
DmmDeltaEnd[ x0 ][ y0 ] = ( 1 - 2 *dmm_delta_end_sign_flag[ x0 ][ y0 ] ) *
( dmm_delta_end_abs_minus1[ x0 ][ y0 ] + 1)
【0114】
最も可能性が高い場合は、オフセット値がゼロであるということである。効率的なシグナリングのために、第1のビンが送られ、それはオフセットがゼロかどうかを示すフラグの機能を有する。そして、オフセットがゼロでない場合、k+1追加ビンは、±2kの範囲内のオフセット値をシグナリングするために続き、ここで、最初のビンは、符号を表し、そして、残りのk個のビンは、オフセットの絶対値を表す。効率的な符号化のために、kは概して小さい数であって、例えばブロックサイズに応じて、適応的に設定されるかも知れない。線終了位置オフセットは、固定長符号、可変長符号または算術符号化(コンテキスト適応2進算術符号化を含む)を含む他のいかなるエントロピー符号化テクニックにより送信され得る。
【0115】
3.2. ブロックパーティション符号化のコンポーネント間予測
このセクションは、テクスチャからパーティション情報を予測することに基づいて、2つの符号化モードを提示する。両方のモードは、デルタCPV法(セクション3.3.2を参照)と結合され得る。テクスチャ情報(すなわち従来のビデオ画像)は、関連する奥行きマップの前に送信されると仮定される。
【0116】
ウェッジレットとして、または、輪郭ブロックパーティションとして、これらのモードの基本的な原則は、テクスチャ参照ブロックからパーティション情報を予測することとして記述することができる。この種の予測は、コンポーネント間予測と呼ばれ得る。時間的または視点間予測とは異なり、テクスチャ基準ピクチャが同時に、そして、同じ斜視図から場面を示すように、動きまたは視差補償は、ここでは必要ない。パーティション情報が、これらのモードのために送信されないので、コンポーネント間予測は、参照として再構成されたテクスチャ画像を使用する。テクスチャ符号化のために使用する色空間に応じて、テクスチャ信号の1つ以上の構成要素は、コンポーネント間予測のために考慮される。ビデオ符号化のために、一般的にYUV色空間が、使用される。ここで、輝度成分は、奥行きブロック、すなわちオブジェクト間のエッジ、の信号を予測するために最も重要な情報を含む。このように、先進的手法は、ジョイント予測のために、または、輝度予測結果をリファインするために、さらに彩度成分を利用するが、単純なコンポーネント間予測方法は、輝度成分の情報を利用するだけである。
【0117】
3.2.1 ウェッジレットブロックパーティションのテクスチャベース予測
このモードの基本的な原則は、テクスチャ参照ブロック216から奥行きマップ213の深さブロック210のウェッジレットパーティションを予測することである。これは、
図13にて示したように、再構成されたテクスチャ画像のためにベストマッチしているウェッジレットパーティションを検索することにより実現される。この目的のために、参照として、最小限の歪ウェッジレット検索は、セクション1.4.2において説明したように、奥行きブロック210として再構成されたテクスチャ信号215、より詳しくは同じ位置およびサイズを有する輝度ブロック216を参照として使用して実行される。結果として生じるウェッジレットパーティションパターン218は、奥行きブロックの予測220のために使用される。
図13において、これは上側のボックスにより強調され、そして、示された実施例のために、予測されたウェッジレットパーティション(中央の)は、奥行きブロック210に非常によく接近する。記載されているウェッジレット予測は、エンコーダおよびデコーダで同時に実行され得るので、パーティション情報のシグナリングは、このモードのために必要とされない。
【0118】
3.2.2. 輪郭ブロックパーティションのテクスチャベース予測
このモードの基本的な原則は、テクスチャ参照ブロックから奥行きブロックの輪郭パーティションを予測することである。
図10に示したように、これは、再構成されたテクスチャ画像215のための輪郭パーティション218’を導出することにより実現される。この目的のために、輪郭近似は、再構成されたテクスチャ信号215、より詳しくは奥行きブロック210として同じ位置およびサイズを有する輝度ブロック216を参照として使用して実行される。この種の輪郭予測が、エンコーダおよびデコーダで同時に実行され得るので、パーティション情報のシグナリングは、このモードのために必要とされない。
【0119】
輪郭パーティションパターンは、参照ブロック216の平均値を算出すること、そして、それを閾値として設定することにより生成することができる。参照ブロック216のサンプル値が閾値以下に、または、上回っているかどうかに依存して、一致している位置は、パーティションパターン218’において、領域P
1またはP
2の一部として、マークされる。結果として得られる輪郭パーティションパターン218’は、奥行きブロック210の予測220のために使用される。
図13において、これは下側のボックスにより強調され、そして、示された実施例のために、予測された輪郭パーティション(中間)218’は、確実に奥行きブロック210に接近する。しかしながら、うまく奥行き信号に接近しない閾値アプローチは、潜在的に多くの分離された小さい部分を有する不安定なパターンを生じる。輪郭パターンの整合性を改善するために、偏差プロセスは、例えばフィルタリングまたはセグメンテーションアプローチにより、拡張することができる。
【0120】
輪郭パーティションパターンを定義しているバイナリのパーティションパターンdmmWedgeletPattern[x,y]は、分割されるべきブロックの範囲内でのサンプル位置を意味している、ただし、(x,y)、ただし、x,y=0..nT-1により、配置されたテクスチャビデオブロックの輝度サンプルvideoLumaSample[x,y]、ただし、x,y=0..nT-1の輝度サンプルから、以下のように得られる。
閾値tHは、以下として導出される:
tH=sumDC/(nT*nT),ただし、sumDC+=videoLumaSamples[x,y]for x,y=0..nT-1
パターン値は、以下のように設定される:
videoLumaSamples[x,y]がtHより大きい場合、以下を適用する:
dmmWedgeletPattern[x,y]=1
さもなければ、以下を適用する:
dmmWedgeletPattern[x,y]=0
【0121】
3.3 CPV符号化
CPV符号化のための概念が、このセクションにおいて提供される。両方のパーティションタイプとして、ウェッジレットおよび輪郭、が、定義により一定値を持つ2つのパーティション領域を有するので、それらはブロックパーティション情報(セクション3.1および3.2を参照)を予測するかまたは推定するための全ての4つのモードに同じく適用され得る。従って、CPV処理は、パーティションタイプまたは符号化モードを区別することを必要とせず、パーティションパターンが現行の奥行きブロックに与えられるとむしろ仮定する。
【0122】
3.3.1 予測CPV
CPV予測のより良好な理解のために、3種類のCPV、元のCPV、予測されたCPVおよびデルタCPV、が区別される。それらの関係は、ブロック(
図14,左の点線230)の断面のための
図14,右側において略図で例示される。ここで、線232は、線230に沿ったブロック200の元の信号を表す。セクション1.3および2.3の説明によれば、元のCPV(
図14,右側の線234および236)は、それぞれ、対応する領域P
1およびP
2によりカバーされる信号の平均値として算出される。
【0123】
元のCPVのW
orig,P1およびW
orig,P2は、与えられたブロックパーティションに対し元の信号(
図14の左側または線232)の最高の近似値を導くが、元の信号がデコーダにおいて利用できないので、ビットストリーム中に値を送信するのに必要であろう。これは、ビットレートに関して全く犠牲を伴い、CPVの予測の原則を導入することにより回避することができる。元のCPVとは対照的に、予測されたCPVは、
図14、左のハッチングされたサンプル203に図示されるように、デコーダ、すなわち、左側および上側の近接ブロックの隣接するサンプル、でも利用できる情報から導出される。ここで、隣接するサンプルはグレーにマークされ、そして、所与のパーティションの各領域のための予測されたCPVは、対応する領域(
図14、左側の線238および240)に隣接するそれらのサンプルの平均値を算出することから結果として生じる。左側または上側の近接ブロックが必ずしも利用できないことに注意されたい。このような場合、それぞれの隣接するサンプルは、デフォルト値に設定することができる。
【0124】
図14、右側において、予測されたCPVのW
pred,P1、およびW
pred,P2は、線238および240により表わされ、かつ、説明図は、元のおよび予測されたCPVが著しく異なり得ることを強調する。実際、ΔW
P1およびΔW
P2の元のおよび予測値間の相違は、現行ブロック200の元の信号232およびハッチングされたサンプル203上に示された再構成された近接ブロックの境界信号の間の類似性に依存する。この差は、対応する領域のデルタCPVとして定義される。これは、デルタCPVΔW
P1およびΔW
P2がエンコーダで推定され、ビットストリームで送信されれば、デルタCPVを予測されたCPVに加えることにより、デコーダで元のCPVを再構成することが可能であることを意味する。元の値の代わりにデルタを送信するだけで、必要なビットレートの大幅な減少をもたらす。
【0125】
予測された固定パーティション値CPVは、dmmPredPartitionDC1およびdmmPredPartitionDC2と呼ぶことができて、以下のように隣接するサンプルp[x,y]より導出することができる。以下において、dmmWedgeletPatternが、サンプル(x,y)ただし、x,y=0..nT-1が手本となるように包囲している現行ブロックを分割することを意味する。すなわち、上部エッジに近接しているサンプル位置は、(x-1)ただし、x=0..nT-1に位置し、左エッジに近接しているサンプル位置は、(-1,y)ただし、y=0..nT-1に位置する。すでに再構成された近接するサンプル値は、p[x,y]を意味する。sumPredDC2、sumPredDC1、numSamplesPredDC2およびnumSamplesPredDC1は、最初にゼロにセットされる:
For x = 0..nT-1 the above neighbouring samples are summed up as:
- If dmmWedgeletPattern[ x, 0 ] is equal to 1 (partition P1, for instance), the following applies:
sumPredDC2 += p[ x, -1 ] and numSamplesPredDC2 += 1
- Otherwise (partition P2, for instance), the following applies:
sumPredDC1 += p[ x, -1 ] and numSamplesPredDC1 += 1
For y = 0..nT-1 the left neighbouring samples are summed up as:
- If dmmWedgeletPattern[ 0, y ] is equal to 1, the following applies:
sumPredDC2 += p[ -1, y ] and numSamplesPredDC2 += 1
- Otherwise, the following applies:
sumPredDC1 += p[ -1, y ] and numSamplesPredDC1 += 1
The predicted constant partition values are derived as follows.
- If numSamplesPredDC1 is equal to 0, the following applies:
dmmPredPartitionDC1 = 1 << ( BitDepthY - 1 )
- Otherwise, the following applies:
dmmPredPartitionDC1 = sumPredDC1 / numSamplesPredDC1
- If numSamplesPredDC2 is equal to 0, the following applies:
dmmPredPartitionDC2 = 1 << ( BitDepthY - 1 )
- Otherwise, the following applies:
dmmPredPartitionDC2 = sumPredDC2 / numSamplesPredDC2
【0126】
3.3.2 量子化およびデルタCPVの適応
CPV予測の原則に基づいて、デルタCPVの効率的な処理のための概念は、このセクションにおいて紹介される。ビットストリームのデルタCPVを送信することは、ブロックパーティション符号化のための再構成された信号の歪を減少する目的を果たす。しかしながら、元のおよび予測された信号の相違が視差の変換符号化によってもカバーされるので、デルタCPV値をシグナリングするために必要なビットレートは、この方法の利益を定める。従って、デルタCPVの量子化は、以下の通りに導入することができる:値は、エンコーダで評価された後、線形に量子化され、デコーダで再構成の前に逆量子化される。量子化されたデルタCPVを送信することは、ビットレートが減少する効果がある一方で、逆量子化された値から再構成された信号は、最高の近似値と僅かに異なるだけである。結論的には、これは、量子化なしのケースと比較して、低いレート-歪コストをもたらす。線形量子化のステップサイズに関して、パフォーマンスは、変換符号化、すなわちQPの関数として、かつ、固定値ではないとして、量子化ステップサイズを定めること、から公知の原則を適用することにより更に高めることができる。量子化ステップサイズをqΔCPV=2QP/10ただし1≦qΔCPV≦max(ΔCPV)/2としてデルタCPVに設定することは、効率的かつ強固であることがわかった。
【0127】
分割されたブロックの2つの領域のためのビットストリームのデルタCPVの可能なシグナリングは、以下のように構成され得る:
【0128】
特定のブロックのためのビットストリーム上の伝送は、明確に送信されるかまたは若干の符号化モードシンタックス要素から導出されるシンタックス要素DmmDeltaFlagに依存するようにされ得る。
【0129】
dmm_dc_1_abs、dmm_dc_1_sign_flag、dmm_dc_2_abs, dmm_dc_2_sign_flagは、以下の通りにDmmQuantOffsetDC1およびDmmQuantOffsetDC2の値を導出するために用いることができる:
DmmQuantOffsetDC1[ x0 ][ y0 ] = ( 1 - 2 *dmm_dc_1_sign_flag[ x0 ][ y0 ] ) *
dmm_dc_1_abs[ x0 ][ y0 ]
DmmQuantOffsetDC2[ x0 ][ y0 ] = ( 1 - 2 *dmm_dc_2_sign_flag[ x0 ][ y0 ] ) *
dmm_dc_2_abs[ x0 ][ y0 ]
【0130】
逆量子化されたオフセットdmmOffsetDC1およびdmmOffsetDC2は、以下の通りDmmQuantOffsetDC1およびDmmQuantOffsetDC2から導出可能である。
dmmOffsetDC1 = DmmQuantOffsetDC1 * Clip3( 1, ( 1 << BitDepthY ) - 1, 2 (QP'
Y
/10)- 2 )
dmmOffsetDC2 = DmmQuantOffsetDC2 * Clip3( 1, ( 1 << BitDepthY ) - 1, 2 (QP'
Y
/10)- 2 )
【0131】
BitDepthYは、DmmQuantOffsetDC1およびDmmQuantOffsetDC2が内部的に表す、エンコーダおよびデコーダ内、にあるビット幅でもよく、QP’は、例えば、現在のスライスの予測残差の符号化変換係数レベルに含まれるちょうど言及された量子化パラメータQPでもよい。
【0132】
固定パーティション値CPVは、それから、逆量子化されたオフセットを予測されたCPVに加えることにより入手できる:
第1のパーティションのために:dmmPredPartitionDC1 + dmmOffsetDC1
第2のパーティションのために:dmmPredPartitionDC2 + dmmOffsetDC2
【0133】
セクション3の最初にすでに述べたように、評価ツールのための歪は、2つの異なる方法で測定され得る。デルタCPVに関して、これらの変形方法は、評価プロセスに強く影響を及ぼす。歪がブロックの歪および元の奥行き信号の間の違いとして測定された場合に備えて、評価プロセスは、上述のようにデルタCPVを単に計算し、量子化することにより、元のCPVの最も近い近似値を検索する。歪が合成された視点のために測定される場合に、評価プロセスは、デルタCPVを合成された視点の品質により優れて適応させるために延長され得る。これは、必然的に元のCPVで最高の近似値に至るそれらのデルタCPVが、必ずしも最良の合成された視点品質をもたらさないという事実に基づく。最も良好な合成された視点品質をもたらすデルタCPVを見出すために、評価プロセスは、最小限の歪検索により延長される(セクション1.4.2と比較)。そして、それは、2つのパーティションのための可能なデルタCPVの組合せのすべてにわたって繰返し適用される。効率的な処理およびシグナリングのために、テストされた値の範囲は、制限され得る。検索は、合成された視点の中で最小限の歪が生じるデルタCPVの組合せを結果として生じ、伝送のために、これらの値は最後に量子化される。
【0134】
デルタCPV法が潜在的に、変換/量子化および(残りの)残余の伝送をスキップすることを可能にすることに注意されたい。それぞれ、元のあるいは最適奥行き信号に近い近似値のため、特に描写された視点の品質に関して評価される場合、視差を省略する影響は、制限される。
【0135】
4. モードの符号化
4.1 モードシグナリング
符号化プロセスにおいて、1つのモードは、レート-歪最適化によるあらゆるブロックのために選択され、そして、モード情報は、ビットストリームにおいて、例えば、パーティションおよびCPV情報の前にシグナリングされる。セクション3によれば、以下の4ブロックパーティションモードを、(例えば、不規則でない分割モードに加えて)定義することができる:
【0136】
・ Wedgelet_ModelIntra:ウェッジレットブロックパーティションのイントラモデリング(セクション3.1.1を参照)
・ Wedgelet_PredlIntra:ウェッジレットブロックパーティションのイントラ予測(セクション3.1.2を参照)
・ Wedgelet_PredTexture:ウェッジレットブロックパーティションのテクスチャベース予測(セクション3.2.1を参照)
・ Contor_PredTexture:輪郭ブロックパーティションのテクスチャベース予測(セクション3.2.2を参照)
【0137】
4つのモードの各々は、デルタCPV処理(セクション3.3.2を参照)のための方法の有無にかかわらず適用されえ、デコーダの信号を送るための8つの異なるmode_IDを結果として生じ、そして、それは、処理のタイプはブロックの予測および再構成のために適用されなければならない。
【0138】
上記に導かれるブロックパーティションモードが、
図1~3の一つのような既存の符号化フレームワークへのブロック符号化モードの追加セットとして実行される場合、モード情報に先行する追加フラグは、ビットストリームにおいて送信されえ、そして、ブロックパーティションモードが用いられるか否かがシグナリングされる。このフラグがセットされない場合に、通常のブロック符号化モードシグナリングが続く。そうでなければ、mode_IDが、シグナリングされ、それは、実際のブロックパーティションモードおよびデルタCPVが送信されるか否かをも示している。ビットストリームにおいて、mode_IDは、3つのビンにより表される。
【0139】
4.2 モードプリセレクション
モードプリセレクションの背後にある発想は、現行ブロックのために選択されそうにないモードを除外する概念を実行することにより、ブロックパーティション符号化(セクション3を参照)のための処理およびシグナリングを行う努力を減少することである。
【0140】
第1のモードプリセレクション概念は、小さいブロックサイズのために確率が非常に低いモードを使用不能にする。これは、ほとんどの場合、歪がモード情報のシグナリングを行うために必要なレートと比較して高いことを意味する。セクション4.1において定義された4つのモードの中で、これは、Wedgelet_PredIntraおよびContour_PredTextureに当てはまる。統計分析に基づいて、これらの2つのモードは、ブロックサイズ4×4およびそれ以下で、使用不能である。
【0141】
第2のモードプリセレクション概念は、コンポーネント間予測、すなわち、Wedgelet_PredTextureおよびContour_PredTexture、に基づいた2つのモードに当てはまる。意味あるブロックパーティションパターンがテクスチャ参照ブロックから導出できる可能性が非常に低い場合、この概念の背後にある発想は、適応的に、これらのモードを除外することである。この種のブロックは、相対的に重要なエッジおよび輪郭のない平面であることにより特徴づけられる。これらのブロックを特定するために、テクスチャ参照ブロックの相違が、分析される。2つの言及されたモードを無効にするための基準は、相違が特定の閾値以下にあるということである。このモードプリセレクション方法は、以下の通りに実現される:相違は、輝度サンプルおよび参照ブロック(
図13の216を参照)の平均値間の平均絶対誤差(MAE)として測定される。固定値の代わりに、閾値は、量子化パラメータ(QP)の関数として、設定される。QPがより高く逆もしかりである場合、MAE値の統計分析の結果に基づいて、閾値は、t
MAE(QP)=QP/2として設定され、これらの2つのモードは、より多くのブロックを除外する効果を有する。
【0142】
図15は、それぞれ、2つのテクスチャ輝度ブロック250および250
2に関する詳細および絶対差対252
1および252
2の右の平均値により、このモードプリセレクション方法の視覚化を示す。ブロック250
1は、ほとんど構造を有さない非常に平坦な空間サンプル値外観を有する。そして、それは非常に低い差異により反映される。意味あるパーティション情報が、このブロック250
1から予測されえないので、モードWedgelet_PredTextureおよびContour_PredTextureは考慮されない。ブロック250
2は高い相違を有することとは対照的に、重要なエッジおよび輪郭が結果として得られる。このように、おそらく、ブロック250
2から導出されるパーティション情報は、一致している奥行きブロックのパーティションのための良好な予測因子であるので、2つのモードが考慮される。
表1:プリセレクション決定によるモード。
【0143】
表1は、利用できるモード上の2つのモードプリセレクション概念の効果をまとめる。特定のモードを除外することにより、ビットストリームにおいてシグナリングしなければならないmode_IDの数は、減少する。各方法は、1つによりmode_IDをシグナリングするために必要なビンの数を減らし、かつ、2つにより両方のモードの組合せがビンの数を減らすので、表は、2つの方法が効率的な方法に組み込まれ得ることを示す。
【0144】
5. 一般化
いくつかの考えられる不規則性分割モード、一方ではその2つのセグメンテーション決定(3.1および3.2を参照)への概念的再分割および他方では2つのパーティション(3.3を参照)符号化パラメータの符号化のみならず、符号化フレームワークにおけるそれらのあり得る作業およびこの種のモードが付加的に供給することがあり得る符号化環境の説明を記述した後、それぞれのデコーダおよびエンコーダのための結果として生じる実施例は、部分的により一般的な用語で記載されるものとする。特に、以下のセクションは、上記で概説される特定の有利な詳細を強調して、これらの詳細がどのように上述よりもより一般的であるという意味でデコーダおよびエンコーダ内で使われ得るかについて、上述したよりもより包括的に説明する。特に、下記で概説されるように、上記のモードで使用される有利な態様のいくつかは、個々に利用することができる。
【0145】
5.1. ブロック境界全体のウェッジレット分離線の延長線
上記の議論から明白になったように、ウェッジレット分割の使用は、一方では分割する旨をシグナリングするためのシグナリングオーバーヘッドおよび他方では不規則性分割による達成可能な多様性との間にあり得る妥協を形成する。それにもかかわらず、サイド情報データの著しい量は、パーティション情報、すなわち、ウェッジレット分離線の位置、例えば、ウェッジレット分離線の位置のインデックスを使用することにより、例えばセクション3.1.1に関して上記で概説される概念に従って、明確に送信するために必要である。
【0146】
従って、ブロック境界全体のウェッジレット分離線の延長線は、ちょうど概説された課題を解決する1つの考えられる方法を形成する。セクション3.1.2の前記説明は、この課題のソリューションを利用するための具体例を説明した。しかしながら、より一般的に、ブロック境界の上のウェッジレット分離線の延長線についての発想を利用する際に、
図16に関して下記で概説されるように、デコーダは、本願発明の実施例に従って、構成され得る。それにもかかわらず、セクション3.1.2および3~4の中の他のセクションに記載されているすべての詳細は、個々に下記で提示される説明と結合され得る可能な実現の詳細として理解されることになっている。
【0147】
図16のデコーダは、一般に、参照符号300により示されて、データストリーム304からサンプルアレイ302を再構成するように構成されている。デコーダは、ブロックベースの復号化により再構成を実行するように構成されている。例えば、サンプルアレイ302は、一連のサンプルアレイの一部でもよく、そして、デコーダ300は、ブロック304毎に異なる符号化モードをサポートしているブロックベースのハイブリッドデコーダとして実行することができる。サンプルアレイは、任意の空間的にサンプルされた情報、例えばテクスチャまたは奥行きマップであってもよい。例えば、
図16のデコーダ300は、サンプルアレイ302を表しているテクスチャ/ビデオおよび奥行き/視差マップを含んでいる1つの視点を再構成するために実行することができる。その限りにおいて、デコーダ300は、復号化ブランチ106
d,1さらに106
v,1の一対として実現することができるか、または個々に復号化ブランチ106
d,1により実行することができる。すなわち、予測残差の残差の符号化の有無にかかわらず、デコーダ300は、イントラ予測、時間的(動き補償された)予測および/または視点間(視差補償された)予測のような符号化モードを使用しているサンプルアレイ302を再構成するように構成され得る。符号化モードは、例えば、それぞれのブロックのための明確なウェッジレット符号化モードを備えることができ、ウェッジレット分離線の位置は、データストリーム304、例えばセクション3.1.1で概説されるモードの中で、明確に送信される。
【0148】
いずれにせよ、このデコーダ300は、現行ブロック210、例えば既定の符号化モードオプションが、データストリーム304の中でシグナリングされるブロック、のために実行するように構成され、ステップが現在概説された。これらのステップに含まれる機能は、イントラ予測モジュール36またはイントラ予測モジュールおよび交換モジュール52の範囲内で組み込むことができる。
【0149】
それぞれのモードの1ブロックのためのデコーダ300により実行されるステップは、ウェッジレット分離線位置予測306であり、位置のリファイン308および復号化310が続く。特に、
図16のデコーダは、ステップ306aで、予測された位置312でのウェッジレット分離線が、近接ブロック212のウェッジレット分離線201’の延長または継続を現行ブロック210中へ作成するように、ブロック210の近接ブロック212のウェッジレット分離線201’に依存している。サンプルアレイ302のブロック210の範囲内のウェッジレット分離線の位置312を予測するように構成される。また、デコーダ300は、データストリーム304からブロック212のためのそれぞれの明確なシグナリングにより、または若干の他の符号化オプションにより、例えばテクスチャサンプルアレイ中のエッジ検出により、どのサンプルアレイ302が属する等、近接ブロック212のウェッジレット分離線201’の位置を導出することができる。他の可能性は、上記で記載されていて、更に後述する。
【0150】
上述の通り、それがセクション3.1.2の前記説明を有するケースであったので、位置312が306において予測されるブロック210のウェッジレット分離線は、直線でもよい。しかしながら、その代わりに、例えば一連のサンプル位置ホップ、すなわち、線における各々次のピクセルを定め、分離線に属する一連のシンボル、を使用して、線は、さらに一般的に定義することができる。線は、線201’から予測されることもできる既定の分析的に決定された湾曲を有することができるか、またはデータストリーム304のいくつかの他の以前に処理された部分から導出することもできる。
【0151】
特に、その後、ブロック210のウェッジレット分離線が、ウェッジレット分離線の一般の延長方向に横方向の位置と同様に一般の延長方向に関して前もって決定されるように、予測306が構成され得る。曲線の場合には、例えば、多項式関数を使用する曲線近似は、ブロック212の分離線を外挿して、それぞれ、ブロック210の分離線の位置を決めるために用いることができる。直線の場合には、ウェッジレット分離線への横方向の方向における傾きおよび位置が、決定される。
【0152】
予測306に関して、近隣および延長が、空間的観点で必ずしも定義される必要はないとも述べられなければならない。むしろ、ブロック210および212は、時間的にも近接し得る。例えば、ブロック212は、サンプルアレイ302に時間的に近接しているサンプルアレイシーケンスのサンプルアレイの同じ位置に配置されたブロックであり得る。その場合、ブロック210へのウェッジレット分離線201の延長は、「時間的継続」である。
【0153】
どのようにして予測306が実行され得るかの明確な可能性は、セクション3.1.2において上記で概説され、説明はここで述べられる。位置のリファイン308は、予測された位置312をリファインするためにある。すなわち、デコーダ300は、位置のリファイン308において、データストリーム304中でシグナリングされたリファイン情報を使用してブロック210のウェッジレット分離線301の予測された位置312をリファインするように構成されている。従って、リファインされたウェッジレット分離線201は、ブロック210を第1および第2のウェッジレットパーティション202aおよび202bに分割する。
【0154】
上述の通り、デコーダ300は、予測された位置312のウェッジレット分離線201が近接ブロック212のウェッジレット分離線201’の空間同一直線上の延長を形成するように構成することができる、そして、リファイン情報にかかわりなく、近接ブロック212に隣接している既定のブロック210のウェッジレット分離線の開始位置314が、予測された位置312と関連して維持されるように、リファインは制限され得る。すなわち、まっすぐなウェッジレット分離線の場合には、単にその傾斜だけがリファインされ得て、その一方で、ブロック210および212を分離しているブロック210のエッジ316のウェッジレット分離線201の開始点は、不変のままである。例えば、ウェッジレット分離線201の反対側の終了位置の中で、予測されたウェッジレット分離線位置312に従う終了位置320からブロック210の外周に沿ったウェッジレット分離線201の反対端、すなわち、ウェッジレット分離線201の終了部分318、のオフセットは、セクション3.1.2に関して上述したようにデータストリーム304の中でシグナリングされ得る。
【0155】
セクション3.1.2において、オフセットは、Eoffとして示された。このセクションにて説明したように、より小さいオフセットは、それとともに関連付けられたより大きなオフセットよりもより高い確率を有するように、デコーダ300は、外周方向に沿ってサンプル位置ピッチを単位にして測定された、ブロック210の外周に沿った直接的な延長サンプル位置320からの様々な起こり得るオフセットが、より大きなオフセットからより小さいオフセットまで単調に増加するそれとともに関連付けされた確率推定を持つエントロピー復号化を使用してデータストリームからリファイン情報を抽出するように構成され得る。例えば、VLC符号語長は、単調に減少することができる。
【0156】
また、上記でも記載されているように、3つのシンタックス要素は、E
offを送信するために用いてもよい。第1のシグナリングは、いかなるオフセットE
offが存在するかに関する。すなわち、同上がゼロであるかに関する。第2のものは、オフセットの符号、すなわちオフセットがゼロでない場合に、時計回り、または、反時計回りの偏差を意味する。そして第3は、絶対オフセット値-1を示す:dmm_delta_end_flag、dmm_delta_end_sign_flag、dmm_delta_end_abs_minus1。疑似符号において、これらのシンタックス要素は、以下として含めることができる。
dmm_delta_end_abs_minus1およびdmm_delta_end_sign_flagは、DmmDeltaEnd、すなわちE
offを導出するのに使用することができる。そして、以下の通りである:
DmmDeltaEnd[ x0 ][ y0 ] = ( 1 - 2 *dmm_delta_end_sign_flag[ x0 ][ y0 ] ) *
( dmm_delta_end_abs_minus1[ x0 ][ y0 ] + 1)
【0157】
それから、デコーダ300が、復号化310において、第1および第2のウェッジレットパーティション202aおよび202bを単位にして、既定のブロック210を復号化するように構成されている。セクション3および4、特にセクション4において、上記で提出される説明において、復号化310は、第1のウェッジレットパーティション202a内に第1の固定パーティション値Wpred,P1をサンプルアレイ位置のサンプルに、および第2のウェッジレットパーティション202b内に第2の固定パーティション値Wpred,P2をサンプルアレイ位置のサンプルに割り当てることにより、現行ブロック210の予測を含む。復号化手順310のこの実現の効果は、サイド情報の量が低く保たれ得るということである。特に、このあり得る実現は、その間で急なエッジを有する比較的平坦な値の平坦域から成る上記概説された性質を有するサンプルアレイにより運ばれるそのような情報の場合、例えば、奥行きマップのような場合には、特に有利である。しかしながら、デコーダが他の符号化パラメータをウェッジレットパーティション202aおよび202bに個々に割り当てたことは、可能でさえある。例えば、動きおよび/または視差補償予測は、復号化310においてパーティション202aおよび202bに個々に適用され得、このことにより、例えば個々のベクトルなどのパーティション202aおよび202bのために、それぞれの動きおよび/または視差パラメータを個々に得る。代わりに、パーティション202aおよび202bは、例えば個々にイントラ符号化命令をそれぞれ同上に適用することにより、復号化306において個々にイントラ符号化され得る。
【0158】
図16によれば、以下の情報は、ブロック210のためにデータストリームに存在してもよい:1)ステップ306-310をトリガするそれぞれの既定の状態を有する符号化オプション識別子、2)終了位置オフセットなどのリファイン情報、3)任意に、符号化パラメータ-例えばCPVまたはCPV残差のような-1つまたは両方のパーティション202a,202bのための-任意な、なぜなら同上は予測することが可能である-近接するサンプル/ブロックから空間的にあるいは時間的に、4)任意に、デルタCPVのような符号化パラメータ残差。
【0159】
さらに、手順306~310により実現される符号化モードが、データストリーム304の中でそれぞれの符号化オプション識別子のそれぞれの共通の既定の値によりトリガされる2つの符号化モードオプションの中の単にデフォルト符号化モードオプションだけであるように、
図16のデコーダ300は、構成され得る。符号化オプション識別子が既定の値を有する場合、既定のブロックに近接している一組の候補ブロックのいずれかがブロック210に達しているウェッジレット分離線を有するかどうかをチェックすることを用いて、データストリーム304から符号化オプション識別子を検索するように、例えば、
図16のデコーダ300は、構成され得る。例えば、候補ブロックは、サンプルアレイ302の復号化ブロック304のデコーダ300により適用された符号化順序中-または、復号化順序中-の現行ブロック210に先行するサンプルアレイ302の空間的な近接ブロック304を含むことができる。例えば、符号化順序は、ブロック304を行方向に左から右に、上から下に、走査することができ、そして、その場合、候補ブロックは、現行ブロック210の左に直接近接しているブロックを含むことができ、かつ、例えばブロック212のように、現行ブロック210の上に直接近接しているブロックを含むことができる。チェックで候補ブロックのセットの中にこの種のウェッジレットブロックがあることが分かる場合、デコーダ300は、予測306、リファイン308および変更されていない方法の復号化310を実行することができる。しかしながら、そうでない場合には、デコーダ300は、それと異なり予測306を実行することができる。セクション3.1.2において、上記に記述されたように、かつ、次のセクションに関して更に詳細に概説されるように、デコーダ300は、そのとき、現行ブロック210に近接している再構成された近接サンプルに依存しているかまたは候補ブロックの一つ以上のイントラ予測されたブロックのイントラ予測方向に依存している現行ブロック210の中のウェッジレット分離線201の延長方向を設定することにより、現行ブロック210中のウェッジレット分離線201の位置を予測するように構成され得る。復号化310の固定パーティション値の予測のための考え得る実現に関する限り、参照は上記、および、下記の説明でなされる。
【0160】
更に、ブロック境界全体にわたるウェッジレット分離線の延長が、現行ブロック、例えば上記で概説されて、下記で更に記載されているような輪郭モード、の2つのセグメンテーションのより多くの自由を可能にする符号化モードと結合される場合、特定の効果が結果として得られる点に留意する必要がある。具体的には、デコーダ300は、輪郭分割モードと同様にブロック306~310により実現されるモードをサポートするように構成されえ、それにより、符号化オーバーヘッドをブロックのニーズに適切に適応させることを可能にする。
【0161】
いずれにせよ、手順306~310による復号化/再構成としてのブロックは、デコーダ300の予測ループの参照として役立つことができる。すなわち、2値予測を使用する場合における予測結果は、例えば、動きおよび/または視差補償予測のための参照として役立つことができる。さらに、復号化310により得られた再構成された値は、復号化順序に続くサンプルアレイ302のいかなるブロック304のイントラ予測における空間隣接サンプルとして役立つことができる。
【0162】
図17は、
図16のデコーダに適合している可能なエンコーダを示す。特に、予測された位置のウェッジレット分離線が、隣接ブロックの既定のブロックへのウェッジレット分離線の延長を形成するように、
図17は、サンプルアレイをデータストリームに符号化するために、既定のブロックの隣接ブロックのウェッジレット分離線に依存するサンプルアレイの既定のブロック内にウェッジレット分離線の位置を予測するように構成されるエンコーダ330を示す。この機能は、332で示される。更に、デコーダ330は、リファイン情報を使用してウェッジレット分離線の予測された位置をリファインするために機能334を有する、そして、既定のブロックのウェッジレット分離線が、既定のブロックを、第1および第2のウェッジレットパーティションに分割する。エンコーダ330も、リファイン情報がデータストリームに挿入される挿入機能336、および、エンコーダ330が既定のブロックを第1および第2のウェッジレットパーティションを単位として符号化する符号化機能を有する。
【0163】
5.2 隣接ブロックのイントラ予測方向からのウェッジレット分離線延長方向予測
上記に記載されているように、ウェッジレットベースのブロック分割さえ、ウェッジレット分離線の位置についてデコーダ側に知らせるために、サイド情報の著しい量を必要とする。
【0164】
以下に概説された実施例が基づく発想は、隣接している、イントラ予測されたブロックのイントラ予測方向が、現行ブロックのウェッジレット分離線の延長方向を予測するために使用することができ、これにより、分割情報を伝送するために必要なサイド情報のレートを低減することができる。
【0165】
上記説明において、セクション3.1.2は、セクション3および4において上記で概説されている、不規則性分割モードの集合を制限しないように、より一般的な用語で同様に説明されている、下記に概説された実施例のあり得る実現が示された。むしろ、ちょうど言及された発想は、下記でより詳しく述べるように、セクション3.1.2に記載されている他の詳細から独立して有利に使用され得る。それにもかかわらず、セクション3.1.2および他のセクションに記載されているすべての詳細は、可能な実現の詳細として理解されるべきであり、それは下記で提示される説明と個々に結合され得る。
【0166】
したがって、
図18は、デコーダ400のための実施例を示し、そして、可能な付加的な機能性に関する限り、それはちょうど概説された発想を利用して、セクション3.1.2および/または
図1~3に関して上述したように実現することができる。すなわち、
図18のデコーダ400は、データストリーム304からサンプルアレイ302を再構成するように構成される。
図18のデコーダ400は、通常、
図18のデコーダにとっては任意である機能306~310により定義される符号化モードを除いて、
図16のデコーダ300に関してセクション5において上記で述べられるように、実現することができる。すなわち、
図18のデコーダ400は、ブロックベースの復号化、例えばブロックベースのハイブリッド復号化により、
図18のサンプルアレイ302を再構成するために動作することができる。サンプルアレイ302のブロック303が利用できる符号化モードの中で、デコーダ400の機能モジュール402に関して、更に概説されるイントラ予測モードがある。それがちょうど
図18のデコーダ300を有するケースであるので、ブロック303へのサンプルアレイ302の再分割は、デフォルトで固定することができる、またはそれぞれの再分割情報によりデータストリーム304の中でシグナリングすることができる。特に、
図18のデコーダ400は、
図1~3に関して、すなわち符号化ブランチ106
v/d,1の一対あるいは単に106
d,1などの奥行きデコーダなどの
図3のデコーダまたは視点デコーダのいずれかのように、上記で概説されたように構成され得る。
【0167】
特に、
図18のデコーダ400は、サンプルアレイ302の第1のブロック212がイントラ予測を使用して予測する機能402を有する。例えば、イントラ予測モードは、ブロック212のためのデータストリーム304の中でシグナリングされる。デコーダ400は、第1のブロック212にイントラ予測方向214に沿って第1のブロック212に隣接するサンプルアレイ302のサンプル404の再構成された値をコピーすることにより第1のブロック212を満たすことによって、イントラ予測402を実行するように構成され得る。イントラ予測方向214は、ブロック212のためのデータストリーム304の中で、例えばいくつかの可能な方向の中の1つを、インデックスを付けることによりシグナリングすることもできる。あるいは、ブロック212そのもののイントラ予測方向214は、予測を受け得る。例えば、復号化ブランチ106
d,1のイントラ予測器36が、ステップ402を実行するように構成され得る
図1~3の説明を参照されたい。具体的には、隣接サンプル404は、それらの再構成がすでに利用でき、ブロック212に隣接している隣接サンプル404の再構成された値を含むように、デコーダ400により復号化順序におけるすでにパスされたサンプルアレイ302のブロック303に属することができる。上述したように、さまざまな符号化モードが、復号化順序において先行しているこれら先行するブロックを再構成するためにデコーダ400により使用され得る。
【0168】
更に、
図18のデコーダ400は、隣接ブロック212のイントラ予測方向214に依存している第2のブロック210内にウェッジレット分離線201の延長方向をセットすることにより、第1のブロック212に隣接している第2のブロック210内にウェッジレット分離線201の位置312を予測するように構成することができ、ウェッジレット分離線201は、第2のブロック210を第1および第2のウェッジレットパーティション202aおよび202bに分割する。例えば、
図18のデコーダ400は、ウェッジレット分離線201の延長方向の表現の量子化に関して可能な限りイントラ予測方向214に等しくなるべくウェッジレット分離線201の延長方向を設定するように構成され得る。まっすぐな分離線の場合には、延長方向は、単に線の傾斜に対応する。カーブした分離線の場合には、隣接ブロックに対する境界での現行ブロックの分離線の局所的な傾斜として、イントラ予測方向を、例えば、導入することができる。例えば、
図18のデコーダ400は、イントラ予測方向214の最高の近似値を形成する一連の可能な延長方向の中から延長方向を選択する。
【0169】
このように、予測404において、デコーダ400は、少なくともその延長方向が関係する限り、現行ブロック210のウェッジレット分離線201の位置312を予測する。第2のブロック210のウェッジレット分離線201の位置の導出は、延長方向408を変更されていないままにすることで決定することができる。例えば、ウェッジレット分離線201の開始点314の予測が、ステップ406のウェッジレット分離線位置を導出する際にデコーダ400により実行され得ることがセクション3.1.2に記載されていたけれども、デコーダ400は、その代わりに、データストリーム304の中で明確なシグナリングによりこの開始点314を導出するように構成され得る。さらに、
図18のデコーダ400は、例えば延長方向316の維持中などで、延長方向に並行に延長方向316の側方における導出406において、以前に復号化されたサンプルアレイにおける同じ位置に配置されたウェッジレットブロックから横方向の距離を時間的に予測することにより、または、サンプルアレイ302と比較して異なる視点に属している他のサンプルアレイから横方向の位置を空間的に予測することにより、ウェッジレット分離線201を空間的に配置するように構成することができた。
【0170】
しかしながら、デコーダ400が、サンプルアレイ302の第2のブロック210内にウェッジレット分離線201の位置を導出する際に、第2のブロック210の外周の一部に沿って第2のブロック210に隣接して伸びているサンプル系統のサンプルの一連の再構成された値の連続的なものの間で最大の変化の位置にウェッジレット分離線201の開始点314を配置することが好ましい。サンプルの線は、小さいクロスにより表されているサンプルを有する
図18の参照符号410により示される。サンプルの線410は、利用できる空間的に隣接したブロックのサンプルに制限され得る。いずれにせよ、最大の変化が決定されるサンプルの線410が、
図18に示すように矩形ブロック210の角のうちの1つのまわりに延長することができることが強調されるべきである。このように、この手順によれば、デコーダ400は、隣接するサンプルおよびサンプル線410との間で始まるように導出406におけるウェッジレット分離線を配置するように構成でき、ここで、延長方向408と平行して、再構成された値の最大差が、存在する。
【0171】
したがって、良好な予測がデータストリーム304中の明確なシグナリングより別の手段によりウェッジレット分離線201の位置を導出するとわかった時から、サイド情報のレートが保存される。
【0172】
それから、デコーダ400による復号化412は、それが
図16に関してちょうど記載されていたように、どのデコーダ400が、第1および第2のウェッジレットパーティション202aおよび202bを単位にして第2のブロックを復号化するかについて、生じる。
【0173】
当然に、
図18のデコーダ400は、また、
図16のリファイン機能308を備えるように変更され得る。従って、ステップ406において導出されるように、ウェッジレット分離線-上記で示されたものとして、まっすぐであると限られることができるかまたはできないか-の位置の終了位置320に関連して現行ブロック210のウェッジレット分離線201の終了位置318のオフセットが、データストリーム304の中でシグナリングをすることができる。
【0174】
また、上記でも記載されているように、3つのシンタックス要素は、この種の終了位置オフセットE
offを送信するために用いることができ、第1のシグナリングは、いかなるオフセットE
offが存在するかに関する。すなわち、同上がゼロかどうかに関する。第2のものは、オフセットの符号、すなわちオフセットがゼロでない場合に、時計回り、または、反時計回りの偏差を意味する。および、第3は絶対オフセット値-1を示す:dmm_delta_end_flag、dmm_delta_end_sign_flag、dmm_delta_end_abs_minus1。疑似符号において、これらのシンタックス要素は、以下として含めることができる。
dmm_delta_end_abs_minus1およびdmm_delta_end_sign_flagは、DmmDeltaEnd、すなわち、E
offを導出するのに使用することができる。そして、以下の通りである:
DmmDeltaEnd[ x0 ][ y0 ] = ( 1 - 2 *dmm_delta_end_sign_flag[ x0 ][ y0 ] ) *
( dmm_delta_end_abs_minus1[ x0 ][ y0 ] + 1)
【0175】
しかしながら、代わりの手順は、同様に実現可能である。例えば、終了位置オフセットのシグナリングを行う代わりに、イントラ予測方向214に応じてセットされる延長方向と関連して方向または角度オフセットは、ブロック202のためのデータストリーム304の中でシグナリングされる可能性がある。
【0176】
図18によれば、以下の情報は、ブロック210のためのデータストリームに存在してもよい:1)ステップ406-412をトリガするそれぞれ既定の状態を有する符号化オプション識別子、2)任意に、終了位置オフセットなどのリファイン情報、3)任意に、符号化パラメータ-例えばCPVまたはCPV残差のような-1つまたは両方のパーティション202a,202bのための-任意な、なぜなら同上は-予測することが可能である-隣接するサンプル/ブロックから空間的にあるいは時間的に、4)任意に、デルタCPVのような符号化パラメータ残差。
【0177】
セクション3.3の説明に関連する復号化ステップ412の考えられる変更態様に関して、参照は、
図16のステップ310の上記説明になされる。
【0178】
図18のデコーダ400が、ステップ406および412をデータストリーム304の中で符号化オプション識別子により有効化される符号化モードオプションとみなすように構成され得ることは、言うまでもない、ここで、現行ブロック210の近隣の一組の候補ブロックのいずれもすでにそのウェッジレット分離線を有しない場合に備えて、ウェッジレット分離線位置導出406は、ウェッジレット分離線位置を導出するための従属の大きさを形成する。そして、それの延長は、現行ブロック210まで続く。
【0179】
図19は、
図18のデコーダに適合しているエンコーダのための実施例を示す。
図19のエンコーダは、通常、参照符号430で示されて、サンプルアレイをデータストリーム304に符号化するように構成される。内部的には、エンコーダ430は、ブロック432のイントラ予測およびブロック434の
図18のブロック406の説明に基づく線導出を使用してサンプルアレイの第1のブロックを予測するように構成される。それから、エンコーダ430は、符号化ブロック436において第1および第2のパーティションを単位にして、434における線導出の主題であった第2のブロックを符号化する。
【0180】
当然、エンコーダ430は、
図19に示される機能を越えて、
図18のデコーダの機能を反映させるために動作するように構成される。すなわち、エンコーダ430は、ブロックベースを使用して、例えば、ブロックベースのハイブリッド符号化を使用して動作することができる。明確に述べられていないにもかかわらず、
図16のデコーダと比較したとき、同上も
図17のエンコーダに関して当てはまる。
【0181】
5.3 隣接サンプルの再構成された値に従ってその開始点を配置することによるウェッジレット分離線導出
ウェッジレットブロックのウェッジレット分離線の位置に関する情報を伝送するために必要なサイド情報を減少させる更なる方法は、更に以下で概説される実施例の基礎を形成する。特に、発想は、すなわち、ウェッジレット分離線の開始点を外周に沿って現行ブロックに隣接して伸びているサンプル系統のサンプルの一連の再構成された値の連続的なものの間で最大の変化の位置に配置することにより、以前に再構成されたサンプル、すなわち符号化/復号化順序に従う現行ブロックに先行するブロックの再構成された値が、ウェッジレット分離線の開始点の正しい配置の少なくとも予測を可能にする。このように、セクション5.1および5.2に関して上記で概説された可能性と同様、必要なサイド情報レートは、デコーダが正しくウェッジレット分離線を配置するのを可能にするために、低下することができる。下記で概説される実施例の基礎をなしている発想は、したがって、下記で概説される実施例のあり得る実現が、記載されているセクション3.1.2の上記説明においても利用される。
【0182】
従って、
図20は、デコーダ500のための実施例を示す、そして、それはちょうど概説された発想を利用して、可能な更なる機能性が関係する限り、セクション3.1.2および/または
図1~3に関して上述したように実現することができる。すなわち、
図20のデコーダ500は、データストリーム304からサンプルアレイ302を再構成するように構成される。通常、
図20のデコーダ500は、例えば、それは
図18のデコーダのために任意である機能306~310により定義された符号化モードを除いて、および、
図18のデコーダ400に関して、例えば、
図20のデコーダのために任意である機能402、406および412により定義された符号化モードを除いて、例えば、
図16のデコーダ300に関して、上記をセクション5.1または5.2で述べられるように、実現することができる。すなわち、
図20のデコーダ500は、ブロックベースの復号化、例えばブロックベースのハイブリッド復号化、により、
図20のサンプルアレイ302を再構成するために動作することができる。それがちょうど
図18のデコーダ300を有するケースである時、サンプルアレイ302のブロック303への再分割は、デフォルトで固定することができるか、またはそれぞれの再分割情報によりデータストリーム304の中でシグナリングすることができる。特に、
図20のデコーダ500は、
図1~3に関して上記で概説されるように、すなわち
図3のデコーダのように、または符号化ブランチ106
v/d,1の対のような視点デコーダ、あるいは単に106
d,1のような奥行きデコーダとして、構成することができる。
【0183】
率直に言って、参照符号500で示される
図20のデコーダは、主に
図18のデコーダに対応する。しかしながら、ブロック402および406において、
図18に関して概説された機能は、単に
図20に関する任意のステップを表す。むしろ、
図20のデコーダ500は、ステップ406’において、サンプルアレイ302の既定のブロック210内に、ウェッジレット分離線201の位置を、ウェッジレット分離線201の開始点314を既定のブロック210の外周の一部に沿った既定のブロック210に隣接して延長しているサンプルの線410の一連の再構成された値の連続するものの間の最大変化位置に配置することにより導出するように構成され、ウェッジレット分離線201は、既定のブロック210を第1および第2のウェッジレットパーティション202aおよび202bに分割する。ステップ412’において、デコーダ500は、
図18に関して上記で概説したやり方で、結果として得るパーティション202aおよび202bの復号化を実行する。
【0184】
具体的には、導出406’において、反時計回りまたは時計回り方向でこれらのサンプルを横断するときに、デコーダ500は、それらの発生のそれらの順序に従ってブロック210のすでに復号化された隣接ブロックのサンプルの再構成された値を指令する。再構成された値の結果として得るシーケンスは、502で
図20において示される。以上のように、連続的な再構成された値の最も大きな差は、第n番目および第(n+1)番目の隣接しているサンプルの間に生じる、そして、したがって、
図20のデコーダは、エッジ316にてウェッジレット分離線を配置するであろう。そして、それに、隣接しているサンプルのこの一対は、次々と直接に隣接サンプルのこの一対に隣接するブロック210のサンプル間で隣接する。上記で概説されるように、デコーダ500は、行方向のブロックスキャン方向を使用することができ、そして、したがって、サンプル線410の隣接したサンプルは、ブロック210の左側のエッジおよび上部エッジに沿って延びることができる。同じことは、復号化/符号化順序に従って、行方向にスキャンされるツリールートブロックの行方向のスキャンのミックスを用いて達成することができ、ここで、現在訪問されるツリールートブロックごとに、四分木再分割は実行され、そのリーフルートブロックは、奥行き優先の横断順序においてスキャンされる。この種の順序を使用するときに、すでに再構成された隣接サンプルの最大数を有する可能性は、幅優先横断順序を使用することと比較して増加する。
【0185】
導出406’において、
図20のデコーダ500は、任意の方法と同様に、
図18に関して、および、セクション3.1.2において記載されているように、ウェッジレット分離線延長方向408の導出を使用することができる。あるいは、デコーダ500が現行ブロック210のウェッジレット分離線201を配置するウェッジレット分離線延長方向は、異なって、例えば、それは、サンプルアレイ302を含むサンプルアレイシーケンスの以前に復号化したサンプルアレイの同じ位置に配置されたウェッジレットブロックから、時間的に予測され得る。あるいは、ウェッジレット分離線の終了点318の明確なシグナリングが、使用され得る。明確なシグナリングは、サンプル位置から終了点318のオフセットが、ブロック210の中間点全体の開始位置314と関連して逆の位置に位置していることを表すことができる。他のソリューションも、もちろん、実現可能である。
【0186】
この点に関しては、第n番目のサンプル位置、第(n+1)番目のサンプル位置またはその間のサブピクセル位置に対応するために、開始点314が、ステップ406’においてデコーダ500により定義され得る点に留意する必要がある。
【0187】
セクション5.1および5.2における前述の組合せ可能性の多くは、現在のセクションの実施例にも移転可能である。例えば、ブロック406’および412’により実現されるデコーダ500の符号化モードは、候補隣接ブロックのセットのうちの1つが現行ブロック210まで続いているウェッジレット分離線を備えているときはいつでも、その代わりに実行されるデフォルト符号化モードを表しているセクション5.1のウェッジレット分離線延長概念を有する共通の符号化オプション識別子の共通の既定の値によりトリガされる補助的な代替機能を表すことができる。他の一般化および変更態様も、可能である。例えば、デコーダ500は、輪郭分割モードその他をサポートすることもできた。
【0188】
図20によれば、以下の情報は、ブロック210のためのデータストリームに存在してもよい:1)ステップ406’-412’をトリガするそれぞれの既定の状態を有する符号化オプション識別子、2)任意に、終了位置オフセットなどのリファイン情報、3)任意に、符号化パラメータ-例えばCPVまたはCPV残差のような-1つまたは両方のパーティション202a,202bのための-任意な、なぜなら同上は予測することが可能である-隣接するサンプル/ブロックから空間的にあるいは時間的に、4)任意に、デルタCPVのような符号化パラメータ残差。
【0189】
図21は、
図20のデコーダに適合しているエンコーダを示す。ブロック436に関して
図19に関して概説されるように、同上は、参照符号530により示されて、ステップ406および符号化436’に従う線導出434’を実行できるように構成される。
【0190】
5.4 画像の同じ位置に配置された部分の二値化処理による奥行き/視差マップのタイル(ピクセル)ベースの2つのセグメンテーション
上記説明から明白になったので、ウェッジレットベースの分割は、一方ではサイド情報レートおよび他方では分割の可能性の達成可能な多様性の間の一種のトレードオフを表す。それと比較して、輪郭に分割することは、サイド情報レートに関してより複雑なようである。
【0191】
更に下記で記載されている実施例の基礎をなしている発想は、それであるパーティションがウェッジレットパーティションでなければならない程度まで、分割する制約を軽減する能力は、奥行き/視差マップの2つのセグメンテーションのための良好な予測因子を導出するためにオーバーレイされた空間的にサンプリングされたテクスチャ情報に比較的複雑でない統計分析を適用することを可能にする。このように、この発想によれば、画像の形の同じ位置に配置されたテクスチャ情報が存在し、そして、その意味あるテクスチャ変化が、ここで、観察できれば、正確にシグナリングオーバーヘッドを軽減する自由が増加することである。この発想のあり得る実現、それはこの発想を利用する、は、セクション3.2.2において上記で記載されていたが、より多くの一般名称で下記に更に詳細に記載されている。また、セクション3.2.2および他のセクションに記載されているすべての詳細は、可能な実現の詳細として理解されるべきである、そして、それは個々に下記で発表される説明と結合され得る。
【0192】
特に、
図22は、本願発明のこの種の実施例によるデコーダ600を示す。デコーダ600は、データストリーム304から画像215と関連した奥行き/視差マップ213の既定のブロックを再構成するためにある。デコーダは、セグメンタ602、空間転送器604およびデコーダ606を含む。デコーダ600は、復号化ブランチ106
d,1/2のいずれかに関して上述したように構成され得る。すなわち、デコーダ600は、ブロック-ベースで作用することができる。更に、同上は、ハイブリッドビデオデコーダとして実現することができる。ブロックへの奥行き/視差マップ213の再分割は、ブロックに完全に画像215の再分割を導出することができるか、またはそこから逸脱することができ、ここで、奥行き/視差マップの再分割は、データストリーム304の中でシグナリングできるかまたは、さもなければデコーダ600に知られ得る。
【0193】
セグメンタ602は、参照ブロックの第1および第2のパーティションへの2つのセグメンテーションを得る参照ブロック216の範囲内で画像215を二値化処理することにより、奥行き/視差マップ213の既定のブロック210と同じ位置に配置される、画像215の参照ブロック216をセグメント化するように構成される。
【0194】
空間転送器604は、それから、既定のブロック210の第1および第2のパーティション202aおよび202bを得るために、画像の参照ブロック216の2つのセグメンテーションを奥行き/視差マップ213の既定のブロック210に転送する。
【0195】
デコーダ606は、第1および第2のパーティション202aおよび202bを単位にして既定のブロック210を復号化するように構成される。デコーダ606の機能は、ボックス310、412および412’に関して上記の機能に対応する。
【0196】
図1~3について考えれば、セグメンタおよび転送器機能は、交換モジュール52および110の範囲内でそれぞれ含まれ得る。その一方で、デコーダ606の機能は、例えば、イントラ予測モジュールで実現することができる。
【0197】
図22の要素に関する可能な実施詳細を表すことができるセクション3.2.2に関して上述したように、セグメンタ602は、個々に、それぞれの値がそれぞれの既定の値より大きいか小さいかに関しては、画像215の参照ブロック216の第1および第2のパーティション202aおよび202bの各々は、画像215の参照ブロック216を完全にカバーし互いに補完的であるタイル608のセットであることができるように、二値化処理において、参照ブロック216の二次元再分割のタイル608での参照ブロック216の中で画像215の値を個々にチェックすることができるように構成することができる。すなわち、二値化処理は、タイル608が画像215のうちの個々のサンプル610に対応するという場合に、サンプル解像度で実行され得る。二値化処理における個々のチェックの対象である値が、再構成された画像215の再構成された値であるという点で、デコーダ600が、画像215の再構成を担当してもよいと述べられなければならない。特に、
図1~3について述べたように、デコーダ600は、それとともに関連する奥行き/視差マップ213の前に画像215を再構成するように構成され得る。
【0198】
すでに上述したように、セグメンタ602は、セグメント化する際に、参照ブロック216の第1および第2のパーティションへの2つのセグメンテーションを得るために、モルフォロジカルホールフィリング(morphological hole filling)および/またはローパスフィルタリングを二値化処理の結果上に適用するように構成され得る。これは、空間転送器604により空間的に転送された参照ブロック216から得られた2つのセグメンテーションのパーティションの2つの多くの分離された部分の発生を回避する、しかしながら、この種の突然の奥行き変化が、目にみえて発生する可能性は、かなり低い。当然、エンコーダは、同じことを実行する。
【0199】
更に、デコーダ600およびセグメンタ602は、二値化処理において、画像215の参照ブロック216の再構成されたサンプル値の中心的傾向の大きさを決定し、画像215の参照ブロック216の各再構成されたサンプル値を決定された大きさに依存するそれぞれの閾値と比較することにより二値化処理を実行するよう構成することができる。上述の通り、閾値は、参照ブロック216の中のサンプル610の中でグローバルに定義され得る。中心傾向として、算術平均または中央値のような、いくつかの平均値が、使用され得る。
【0200】
セクション4.2において上述した通り、デコーダ600は、既定の閾値を上回っている画像215の参照ブロック216の中でサンプルの値の演繹的な決定された分散だけの場合には単にブロック602~606により表される符号化モードの有効性を裏づけるように構成されえた。そうでない場合には、二値化処理により発見された2つのセグメンテーションは、奥行き/視差マップのブロック210の外観のための良好な予測器をおそらく形成せず、そして、したがって、この符号化モードは、このブロックを考慮に入れることができない。モードの可能性を抑圧することにより、エントロピー確率評価が考慮されなければならないそれぞれの符号化オプション識別子のシンボル値の数の不利なおよび不必要な増加、は、回避される。
【0201】
図22によれば、以下の情報は、ブロック210のためのデータストリームに存在してもよい:1)ステップ602-604をトリガするそれぞれの既定の状態を有する符号化オプション識別子、2)任意に、例えば閾値、指向性等を満たしている後続フィルタリング/ホールフィルタリング指向性等の2つのセグメンテーションを導く情報、3)任意に、1つまたは両方のパーティション202a,202bの符号化パラメータ-例えばCPVまたはCPV残差などは- 隣接するサンプル/ブロックから空間的にあるいは時間的に、同上を予測することが可能であるため任意である。4)任意に、デルタCPVのような符号化パラメータ残差。
【0202】
図16、18および20の実施例に関して上述のすべての更なるバリエーションは、
図22の実施例にも適用できる。これは、デコーダ600の予測ループの参照および
図22の符号化モードの結合の可能性の一部としての予測結果の使用にとって、セクション5.1~5.3のいずれにおいても記載された他の符号化モードのいずれかに関して、または、セクション3~4において上記のバリエーションに関して、特に真実である。
【0203】
図23は、
図22のデコーダに適合しているエンコーダのあり得る実施を示す。
図23のエンコーダは、通常、参照符号630により示されて、データストリーム304に画像と関連した奥行き/視差マップの既定のブロックを符号化するように構成される。エンコーダは、それらがデータストリーム304の前に符号化された部分の内部に再構成されたバージョンに作用するという点で、
図22の構成要素602および604のように作動するセグメンタ632および空間転送器634を含む。エンコーダ636は、結果として生じるパーティションを単位として、既定のブロックを符号化する。
【0204】
5.5 画像から画像の参照ブロックの中のサンプル値分散上の奥行き/視差マップへの2つのセグメンテーション伝送の有効性の依存性
下記で概説される実施例の基礎をなしている発想は、セクション4.2、すなわち、奥行き/視差マップの現行ブロックのコンテンツの良好な近似値を達成する可能性が、この2つのセグメンテーション移動モードをトリガするために対応する符号化オプション識別子のそれぞれの既定の値の条件を正当化するために十分に高い場合、奥行き/視差マップの現行ブロックの上の2つのセグメンテーションの次の移動を有する画像の範囲内の同じ位置に配置された参照ブロックに基づく2つのセグメンテーションの導出に従う発想が単に合理的なだけである、において、すでに述べられていた。換言すれば、それぞれの2つのセグメンテーション移動がいずれにしろ非常に選択されなさそうであるという場合のこの符号化オプション識別子をエントロピー符号化するときに、サイド情報レートは、奥行き/視差マップの現行ブロックのための符号化オプション識別子のそれぞれの既定の値を考慮に入れる必要性を回避することにより保存され得る。
【0205】
このように、
図22のデコーダ600の修正された実施例によれば、一般にデコーダ600の考えられる実施態様に関する限り、上述の説明を参照すれば、デコーダは通常、
図20のデコーダと同様に構成される。しかしながら、セグメンタ602は、参照ブロック216を輪郭パーティションにも、また、ウェッジレットパーティションにもセグメント化するように構成されるために制限されない。むしろ、セグメンタ602は、単に参照ブロックの2つのセグメンテーションから第1および第2のパーティションを得るために、参照ブロック216の中で画像215のテクスチャ特徴に応じて画像215の参照ブロック216をセグメント化するように構成されるだけである。例えば、セグメンタ602は、この種の修正された実施例に従って、空間転送器604により奥行き/視差ブロック210上に空間的にこのようにして位置する線をブロック216から転送するためにウェッジレット分離線の可能な延長方向を検出するため、エッジ検出を使用することができる。セグメンタ602による他のあり得る2つのセグメンテーションも、実現可能である。
【0206】
しかしながら、セグメンタ602によるセグメンテーション、空間転送器604による空間転送および復号化が、デコーダ600の符号化オプションの第1のセットのうちの1つを形成し、そしてそれはデコーダ600の符号化オプションの第2のセットの一部でないように、デコーダ600は、この実施例に従って、構成されるであろうこと以上に、ここで、デコーダは、画像215の参照ブロック216の中でサンプル値の分散を決定するように、データストリーム304から符号化オプション識別子を検索するように、および、既定の閾値を越えた分散の場合の符号化オプションの第1のセットへのインデックスとして符号化オプション識別子を使用するように、セグメンテーション、空間転送およびインデックスが1つの符号化オプションを示す場合に既定のブロック210上へのボックス602~606の復号化、および分散の場合の符号化オプションの第2のセットへのインデックスとして既定の閾値を継承することを伴って、更に構成されるであろう。このように、符号化オプション識別子をシグナリングするためのオーバーヘッドをシグナリングすることが、セーブされ得る。分散として、平均絶対差、標準偏差または分散が、使用され得る。
【0207】
図22のちょうど言及された変更態様の実施例の更なる変更態様に関して、セクション4.2に関してセクション5.4および説明が参照される。
【0208】
対応するエンコーダは、
図23のエンコーダから導出可能である。
【0209】
5.6 隣接するサンプルから一方または両方の固定パーティション値の予測を使用した2分割による有効な予測
すでに今までに記載されている各種実施形態に関して上記で概説されるように、ブロックの2分割のパーティションに固定パーティション値を割り当てることにより現行ブロックを予測する方法は、特に、大抵は奥行き/視差マップのようなこれらのサンプルアレイのコンテンツが大部分は平坦域または急峻なエッジにより互いに分離された類似の値のシンプルに接続された領域からなるサンプルアレイを符号化する場合に、全く効果的である。それにもかかわらず、この種の固定パーティション値の伝送さえ、回避されなければならないサイド情報の相当な量を必要とする。
【0210】
更に下記で記載されている実施例の基礎をなしている発想は、隣接しているサンプルの値の平均値が関連付けられている、または、それぞれのパーティションに隣接することが固定パーティション値のための予測因子として使用される場合、このサイド情報のレートが低減し得るということである。発明者は、サンプルアレイのブロックのためのこの種の符号化モードが、それぞれの固定パーティション値のリファインのシグナリングを放置しておくことさえできることを発見した。
【0211】
図24は、データストリーム304からサンプルアレイ302を再構成するためのデコーダ700を示す。デコーダ700は、ブロックベースの復号化を使用しているサンプルアレイ302を再構成するように構成することができて、ハイブリッド復号化を使用するように構成することができる。通常、セクション5.1~5.5においても上記のすべての考えられる実施態様は、
図24のデコーダ700に適用される。当然、現行ブロック210を2つのパーティションに分割するためのすべての考えられる実施態様は、単に、この点に関しては、異なって実施することもできる
図24のデコーダ700の任意の代替手段を表すだけである。
【0212】
特に、デコーダ700は、現行ブロック210の予測を導出するために異なる作業または機能を実行するように構成される。特に、デコーダ700は、サンプルアレイ302の既定のブロック210の2つのパーティションからハッチングされたサンプルで示される第1のパーティション、およびハッチングされていないサンプルで示された第2のパーティションへの導出702を実行するように構成される。更に、各隣接しているサンプルが、それが関連するパーティションに隣接するように、デコーダ700は、第1および第2のパーティションのそれぞれの一つを有する、既定のブロック210まで隣接している、サンプルアレイ302の隣接しているサンプルの各々の関連付け704を実行するように構成される。
図24において、それは関連付け704の主題である隣接しているサンプリングは、2つの異なる種類のハッチング、すなわち、ドットハッチングおよびクロスハッチングで示される。ドットハッチングされたものは、ブロック210のサンプルに隣接しているサンプルを示し、それはブロック210の1つのパーティションに属するが、クロスハッチングされたものは、他のパーティションに属するブロック210のサンプルに隣接する。セクション5.1~5.4に関して上述したように、デコーダ700は、デコーダ700によりすでに再構成されたサンプルアレイ302のブロック303の隣接しているサンプルの有用性のための高い確率を達成するために、サンプルアレイ302のブロック303の中の適切な符号化/復号化順序を使用することができる。
【0213】
もちろん、利用できる隣接しているサンプル、すなわちサンプルアレイ302のすでに再構成されたブロック303内に配置されるブロック210の隣接しているサンプル、が単にブロック210のパーティションのうちの1つに加わるだけであることが、生じることができる。その場合、データストリーム304は、隣接しているサンプルのいずれも隣接しないそれぞれの他のパーティションのための固定パーティション値を明確に送信することができる。その代わりに、若干の他の代替手順は、その場合デコーダ700により実行され得る。例えば、デコーダ700は、その場合、この失われた固定パーティション値を既定の値またはサンプルアレイ302の以前に再構成された値の中の長期平均および/または若干の他の以前に再構成されたサンプルアレイから決定された値に設定することができる。
【0214】
最後に、予測706において、デコーダ700は、第1のパーティションと関連付けされた隣接しているサンプルの値の平均値を、第1のパーティションの中に配置されるサンプルアレイのサンプルに、および/または第2のパーティションと関連付けされた隣接しているサンプルの値の平均値を、第2のパーティションの中に配置されているサンプルアレイのサンプルに配置されるサンプルアレイのサンプルに割り当てることにより、既定のブロック210を予測する。
【0215】
デコーダ700は、データストリームの中でリファイン情報を使用して、すなわち第1のパーティションと関連した隣接しているサンプルの値の平均値上にリファイン情報の範囲内で第1のリファイン値を適用することにより、および/または、第2のパーティションと関連した隣接しているサンプルの値の平均値上にリファイン情報の範囲内で第2のリファイン値を適用することにより、既定のブロック210の予測をリファインするように構成され得る。この点に関し、デコーダ700は、第1のおよび/または第2のリファイン値を適用する際に、線形結合するように、第1のおよび/または第2のリファイン値と、第1のパーティションと関連付けられる隣接しているサンプルの値の平均値および/または第2のパーティションと関連付けられる隣接しているサンプルの値の平均値とをそれぞれ例えば加算するように、さらに構成することができる。デコーダ700は、第1のおよび/または第2のリファイン値を適用する際に、データストリームから第1のおよび/または第2のリファイン値を検索でき、サンプルアレイに関連付けられる既定の空間的にサンプリングされた成分-テクスチャおよび/または奥行きマップ-がデータストリーム内に送信される参照量子化ステップサイズに依存する量子化ステップサイズを使用して検索されたように第1のおよび/または第2のリファイン値をスケーリングできるよう構成され得る。サンプルアレイは、例えば、奥行きマップでもよいが、参照量子化ステップサイズは、奥行きマップが関連付けられるビットストリームからテクスチャサンプルアレイを再構成するためにデコーダ700により用いられてもよい。更なる参照は、詳しくはセクション3.3.2の各部になされる。
【0216】
デコーダは、サンプルアレイの既定のブロックの2つのパーティションから、第1および第2のパーティションを導出する際に、予測された位置でのウェッジレット分離線が隣接しているブロックのウェッジレット分離線の既定のブロックへの延長を形成するように、既定のブロックの隣接しているブロックのウェッジレット分離線に依存しているサンプルアレイの既定のブロック内にウェッジレット分離線の位置を予測するように構成される。デコーダは、データストリーム内のリファイン情報を使用してウェッジレット分離線の予測された位置をリファインするように更に構成され、既定のブロックのウェッジレット分離線は、既定のブロックを第1および第2のパーティションに分離する。
【0217】
前述のように、デコーダ700は、セクション5.1~5.5で述べられる考えのいずれかを使用して2分割を行うことができる。デコーダ700は、既定のブロック210に隣接しているサンプルアレイ302の参照ブロックを、第1のブロックに隣接しているサンプルアレイのサンプルの再構成値をコピーすることにより、参照ブロックを満たすことによりイントラ予測を使用することにより、参照ブロックへのイントラ予測方向に沿って、予測するように構成され得る。サンプルアレイの既定のブロックの2つのパーティションから第1および第2のパーティションを導出する際に、デコーダ700は、イントラ予測方向に応じて既定のブロックの中のウェッジレット分離線の延長方向を設定することにより既定のブロック210内にウェッジレット分離線の位置を予測することができ、ウェッジレット分離線は、既定のブロックを第1および第2のパーティションに分割する。
【0218】
その代わりに、サンプルアレイ302が、画像と関連した奥行き/視差マップである場合、デコーダ700は、参照ブロックの2つのセグメンテーションから第1および既定のパーティションを得るために参照ブロック内で画像を二値化処理することにより既定のブロック210と同じ位置に配置される画像の参照ブロックをセグメント化するように、および、第1および第2のパーティションを得るために、奥行き/視差マップの既定のブロック上に画像の参照ブロックの2つのセグメンテーションを空間的に転送するように構成され得る。
【0219】
デコーダは、デコーダの予測ループの参照として既定のブロックを使用するように更に構成され得る。
【0220】
図25は、
図24のデコーダ700に適合しているエンコーダ730のための可能な実施例を示す。データストリーム中のサンプルアレイを符号化するためのエンコーダ730は、サンプルアレイの既定のブロックの2つのパーティションから第1および第2のパーティションを導出する732ように、および、各隣接しているサンプルが、同上が関連付けられているパーティションに隣接するように既定のブロックに隣接しているサンプルアレイの隣接しているサンプルの各々を第1および第2のパーティションのそれぞれのひとつに関連付ける734ように構成されている。エンコーダは、第1のパーティションに関連付けされた、第1のパーティション内に位置しているサンプルアレイのサンプルに隣接しているサンプルの値の平均値および第2のパーティションに関連付けされた、第2のパーティション内に位置しているサンプルアレイのサンプルに隣接しているサンプルの値の平均値を割り当てることにより、既定のブロックを予測する736ように更に構成される。
【0221】
若干の態様が、装置に関連して記載されているが、これらの形態は対応する方法の記載も表すことは明らかである。ここで、1ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップに関連して記載されている形態は、対応するブロックまたは項目または対応する装置の特徴の説明を表す。方法のステップのいくつかまたは全てが、例えば、マイクロプロセッサ、プログラミング可能なコンピュータ、または電子回路のようなハードウェア装置によって(または使用して)実行され得る。いくつかの実施の形態において、最も重要なステップの若干またはより多くは、そのような装置によって実行され得る。
【0222】
特定の実現要求に応じて、本願発明の実施の形態は、ハードウェアにおいて、または、ソフトウェアにおいて、実施され得る。その実現態様は、それぞれの方法が実行されるように、プログラミング可能なコンピュータシステムと協働するか(または、協働することができる)、そこに格納された電子的に読み込み可能な制御信号を有するデジタル記憶媒体、例えば、フロッピー(登録商標)ディスク、DVD、Blu-ray(登録商標)、CD、ROM、PROM、EPROM、EEPROM、またはFLASHメモリを使用して実行され得る。従って、デジタル記憶媒体は、コンピュータ読み込み可能でもよい。
【0223】
本願発明による若干の実施の形態は、本願明細書において記載される方法のうちの1つが実行されるように、プログラミング可能なコンピュータシステムと協働することができる電子的に読み込み可能な制御信号を有するデータキャリアを含む。
【0224】
通常、本願発明の実施の形態は、プログラム・コードを有するコンピュータ・プログラム製品として実施され、コンピュータ・プログラム製品がコンピュータ上で実行する場合、プログラム・コードは、方法のうちの1つを実行するために作動される。プログラム・コードは、機械可読キャリアに、例えば、格納され得る。
【0225】
他の実施の形態は、機械可読キャリアに格納され、本願明細書において記載される方法のうちの1つを実行するためのコンピュータ・プログラムを含む。
【0226】
換言すれば、コンピュータ・プログラムがコンピュータ上で実行する場合、本願発明の方法の実施の形態は、従って、本願明細書において記載される方法のうちの1つを実行するためのプログラム・コードを有するコンピュータ・プログラムである。
【0227】
従って、本願発明の方法の更なる実施の形態は、その上に記録され、本願明細書において記載される方法のうちの1つを実行するためのコンピュータ・プログラムを含むデータキャリア(または、デジタル記憶媒体、またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体または記録された媒体は、一般的には、有形でありおよび/または、非一時的である。
【0228】
従って、本願発明の方法の更なる実施の形態は、本願明細書において記載される方法のうちの1つを実行するためのコンピュータ・プログラムを表しているデータストリームまたは一連の信号である。例えば、データストリームまたは一連の信号は、データ通信接続、例えば、インターネットを介して転送されるように構成され得る。
【0229】
更なる実施の形態は、本願明細書において記載される方法のうちの1つを実行するために構成され、または適合される処理手段、例えば、コンピュータ、またはプログラム可能な論理回路を含む。
【0230】
更なる実施の形態は、その上にインストールされ、本願明細書において記載される方法のうちの1つを実行するためのコンピュータ・プログラムを有するコンピュータを含む。
【0231】
本願発明による更なる実施の形態は、レシーバに本願明細書に記載される方法のうちの1つを実行するためのコンピュータ・プログラムを(例えば、電子的にまたは光学的に)転送するために構成される装置またはシステムを含む。レシーバは、例えば、コンピュータ、モバイル機器、メモリ装置等でもよい。装置またはシステムは、例えば、レシーバにコンピュータ・プログラムを転送するためのファイルサーバを含んでも良い。
【0232】
いくつかの実施の形態において、プログラム可能な論理回路(例えば、フィールドプログラマブルゲートアレイ(Field Programmable Gate Array))が、本願明細書において記載されるいくつかまたは全ての機能を実行するために使用され得る。いくつかの実施の形態において、フィールドプログラマブルゲートアレイは、本願明細書において記載される方法の1つを実行するために、マイクロプロセッサと協働し得る。一般に、方法は、いくつかのハードウェア装置によって、好ましくは実行される。
【0233】
上述した実施の形態は、本願発明の原則の例を表すだけである。本願明細書において記載される装置の修正および変更および詳細は、他の当業者にとって明らかであるものと理解される。従って、間近に迫った特許請求の範囲だけによってのみ制限され、ならびに、本願発明の記述および説明によって表された明細書の詳細な記載によっては、制限されないことが意図される。