【文献】
Satoshi Kondo, Hisao Sasai,A Motion Compensation Technique Using Sliced Blocks In Hybrid Video Coding,Image Processing, 2005. ICIP 2005. IEEE International Conference on,米国,IEEE,2005年 9月11日,vol.2,pp.305-308
【文献】
Oscar Divorra Escoda, et al.,Geometry-Adaptive Block Partitioning for Video Coding,Acoustics, Speech and Signal Processing, 2007. ICASSP 2007. IEEE International Conference on,米国,IEEE,2007年 4月15日,vol.1,pp.I657-I660,URL,http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=4217165
【文献】
Oscar Divorra, et al.,Geometry-adaptive Block Partioning,ITU-Telecommunications Standardization Sector STUDY GROUP 16 Question 6 Video Coding Experts Group (VCEG) 32nd Meeting: San Jose, CA, 20-21 April, 2007,2007年 4月19日,VCEG-AF10.doc,URL,http://wftp3.itu.int/av-arch/video-site/0704_San/VCEG-AF10.zip
(58)【調査した分野】(Int.Cl.,DB名)
ピクチャの少なくとも一部を少なくとも1つのパラメトリック・モデルに応じて適応的に分割することによって前記ピクチャに対応する画像データを符号化する符号化器を有する、ビデオ符号化のための適応的なジオメトリック・パーティション装置において、
前記少なくとも1つのパラメトリック・モデルは、少なくとも1つの曲線の少なくとも1つの定式化を含み、
前記符号化器は、ビデオ符号化規格またはビデオ符号化勧告のハイブリッド予測符号化器であり、かつ、パラメトリック・モデルに基づくパーティションを、前記ピクチャのマクロブロックおよびサブマクロブロックの少なくとも一方に、それぞれ、前記マクロブロックおよび前記サブマクロブロックの少なくとも一方のための符号化モードとして適用し、
前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線の少なくとも一方は、1または2以上の画像輪郭および1または2以上の動き境界のうちの少なくとも一方を表し、
前記曲線は、直線でない形状を有し、
前記符号化器は、少なくとも1つのハイレベル・シンタックス要素を使用して、前記少なくとも1つのパラメトリック・モデルのパラメータの精度の黙示的な符号化を行う、前記装置。
前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方が、前記画像データのジオメトリック特性を表すモデルから導出される、請求項1記載の装置。
前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方として、少なくとも1つの多項式が使用される、請求項1記載の装置。
2以上のパラメトリック・モデルが利用可能である場合、所与の画像部分用の前記少なくとも1つのパラメトリック・モデルがモデルのセットから適応的に選択され、前記選択が黙示的または明示的に符号化される、請求項1記載の装置。
スライス・ヘッダ・レベル、補助拡張情報レベル、ピクチャ・パラメータ・セット・レベル、シーケンス・パラメータ・セット・レベル、およびネットワーク抽象化レイヤー・ユニット・ヘッダ・レベルのうちの少なくとも1つに前記少なくとも1つのハイレベル・シンタックス要素が配置される、請求項1記載の装置。
圧縮効率と符号化器の複雑性の少なくとも一方を制御するために、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方のパラメータの精度が適応する、請求項1記載の装置。
ピクチャの少なくとも一部を少なくとも1つのパラメトリック・モデルに応じて適応的に分割することによって前記ピクチャに対応する画像データを符号化するステップを含む、ビデオ符号化のための適応的なジオメトリック・パーティション方法において、
前記少なくとも1つのパラメトリック・モデルは、少なくとも1つの曲線の少なくとも1つの定式化を含み、
前記符号化するステップは、ビデオ符号化規格またはビデオ符号化勧告のハイブリッド予測符号化器であり、かつ、パラメトリック・モデルに基づくパーティションを、前記ピクチャのマクロブロックおよびサブマクロブロックの少なくとも一方に、それぞれ、前記マクロブロックおよび前記サブマクロブロックの少なくとも一方のための符号化モードとして適用する符号化器において実行され、
前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線の少なくとも一方は、1または2以上の画像輪郭および1または2以上の動き境界のうちの少なくとも一方を表し、
前記曲線は、直線でない形状を有し、
前記符号化するステップは、少なくとも1つのハイレベル・シンタックス要素を使用して、前記少なくとも1つのパラメトリック・モデルのパラメータの精度の黙示的な符号化を行う、前記方法。
2以上のパラメトリック・モデルが利用可能である場合、所与の画像部分用の前記少なくとも1つのパラメトリック・モデルがモデルのセットから適応的に選択され、前記選択が黙示的または明示的に符号化される、請求項9記載の方法。
スライス・ヘッダ・レベル、補助拡張情報レベル、ピクチャ・パラメータ・セット・レベル、シーケンス・パラメータ・セット・レベル、およびネットワーク抽象化レイヤー・ユニット・ヘッダ・レベルのうちの少なくとも1つに前記少なくとも1つのハイレベル・シンタックス要素が配置される、請求項9記載の方法。
圧縮効率と符号化器の複雑性の少なくとも一方を制御するために、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方のパラメータの精度が適応する、請求項9記載の方法。
【背景技術】
【0002】
一般的なビデオ符号化技術は、ビデオ画像をモデル化するために、予測に加えて残差符号化を使用する。他のアプローチでもまた、(動き補償を用いる、または、動き補償を用いない)ウエブレット変換を発生させるのにリフティング・スキームが使用される場合のように、信号変換の何らかの処理の段階として予測を考慮することがある。予測は、パーティションをベースとして各フレーム上で実行される。即ち、各フレームは、ブロック、または、ツリー構造にネスト化されたブロックの集合(セット)に分割され、次に、各ブロック・パーティションがイントラ予測子またはインター予測子に加え、何らかの残差符号化を用いて符号化される。ブロックへのフレーム分割は、フレーム全体に渡って通常はブロックであるグリッド領域(マクロブロックと呼ばれる)を定めることによって実行され、さらに、各マクロブロックは、より小さなブロック(サブブロック、または、サブマクロブロックと呼ばれる)に分割される。通常、異なるテクスチャ、色、滑らかさ、および/または異なる動きを有するオブジェクトおよび/またはフレーム領域の境界上のマクロブロックは、客観的および/または主観的に可及的に高品質で、可及的に効率的にマクロブロックの符号化を行うため、サブブロックにさらに分割される傾向にある。
【0003】
近年の研究においては、ツリー構造が画像情報の符号化には最適なものではないことが示されてきた。これらの研究は、規則的なエッジまたは輪郭によって分けられる異質な(heterogeneous)各領域(ここでは、各領域はフラット、スムーズ、または、静的なテクスチャなどの明確に定義された均一な特性を有するものとみなされる)を画像のツリーベースの符号化によって最適に符号化できないことを支持している。この問題は、エッジ、輪郭、または、配向されたテクスチャに沿って存在するジオメトリカルな冗長性をツリー構造が最適にとらえることができないという事実によるものである。このコンセプトは、適応されたマクロブロックのツリー分割が単純な固定サイズのフレーム分割よりも良好ではあっても、依然として、効率的に符号化を行う目的で二次元データに含まれるジオメトリックな情報をとらえるのには十分に最適なものではないことを示している。
【0004】
フレーム分割は、効率的にビデオ符号化を行う上で重要な鍵となる処理である。ISO/IEC MEPG−4 Part 10 AVC規格/ITU−T H.264勧告(以下、「MPEG−4 AVC規格」と呼ぶ。)などの近年のビデオ圧縮技術は、ツリーベースのフレーム・パーティションを使用する。これは、ISO/IEC MEPG−2規格およびITU−T H.263勧告(以下、「H.263勧告」と呼ぶ。)のような従来のビデオ符号化規格および勧告において通常に使用される単純な均一なブロック・パーティションよりも効率的なものであるように見受けられる。しかしながら、ツリーベースのフレーム分割は、二次元データのジオメトリック構造を効率的にとらえることができないため、依然として可及的に効率的にビデオ情報を符号化するものではない。
【0005】
現在主流のビデオ符号化規格においては、ツリー構造のマクロブロック分割(パーティション)が採用されている。ITU−T H.261勧告(以下、「H.261勧告」と呼ぶ)、ISO/IEC MEPG−1規格、さらに、ISO/IEC MPEG−2規格/ITU−T H.263勧告(以下、「MPEG−2規格」と呼ぶ。)は、16×16マクロブロック(MB)・パーティションのみをサポートしている。ISO/IEC MPEG−4規格/ITU−T H.264勧告(以下、「MPEG−4 AVC規格」と呼ぶ。)シンプル・プロファイル(simple profile)またはITU−T H.263(+)勧告は、16×16MB(マクロブロック)のための16×16および8×8のパーティションをサポートしている。16×16MBは、16×8、8×16、または8×8のサイズのマクロブロック・パーティションに分割することができる。8×8のパーティションは、サブマクロブロックとしても知られている。さらに、サブマクロブロックは、8×4、4×8、および4×4のサブマクロブロック・パーティションに分割される。
図1を参照すると、MPEG−4 AVC規格に従ったマクロブロック・パーティションのセットが概ね参照符号100によって示されている。具体的には、マクロブロック・パーティションは、参照符号110によって示され、サブマクロブロック・パーティションは、参照符号120によって示されている。近年の研究においては、ツリー構造が画像情報の符号化には最適なものではないことが示されてきた。このような研究の中には、画像のツリーベースの符号化によって規則的なエッジまたは輪郭によって分けられる異質な領域を最適に符号化できないことが証明するものがある。
【0006】
このことを対象として行われた従来の取り組みの中には、動き補償のための単純なツリーベースの分割によって提供されるものとは異なる他のタイプのブロック分割が必要とされていることを実験的に確かめたものがある。これらの技術は、ツリーベースのブロック・パーティションに加え、動き推定および補償のための動きエッジにより良好に適応することができる何らかの追加的なマクロブロック・パーティションを使用することを提案している。
【0007】
H.263コーデックのフレームワーク内における従来技術の1つのアプローチ(以下、「第1の従来技術のアプローチ」と呼ぶ。)では、2つの追加的な対角動き補償モードを使用することを提案している。これらのモードのうちの一つが選択されると、対象のマクロブロックが対角セグメントによって分けられた2つの同様の三角形に分割される。符号化モードによっては、この分割は、一方のモードでは、左下の角部から右上の角部に向かって行われ、2番目のモードでは、左上の角部から右下の角部に向かって行われる。
図2Aおよび
図2Bを参照すると、本明細書において「第1の従来技術のアプローチ」と呼ばれるものに対応する追加的な動き補償符号化モードが概ね参照符号200、250によってそれぞれ示されている。動き補償符号化モード200は、右側が上がった対角エッジ符号化モードに対応し、動き補償符号化モード250は、左側が上がった対角エッジ符号化モードに対応する。
【0008】
第1の従来技術のアプローチは、これらのモードが固定された対角方向による16×8または8×16の動き補償モードの単純なバリエーションであるという意味では、非常に限定されたものである。これらのモードが定義するエッジは、非常に粗いものであり、その精密さは、ビデオ・フレームに存在する様々なエッジにフィットするのには十分ではない。ジオメトリック情報の明示的な符号化(が行われることはなく、符号化器においてこの情報の適応された処理が行われることが支障をきたしている。2つのモードは、符号化モードのリストに導入され、これにより、モードのリスト中のこれらの2つのモードの後に位置する他の符号化モードの符号化負荷が増大する。
【0009】
第1の従来技術のアプローチから直接的に発展したものは、3つの他の従来技術に関しており、これらをそれぞれ、本明細書において、第2の従来技術のアプローチ、第3の従来技術のアプローチ、さらに、第4の従来技術のアプローチと言及する。総じてこれらの研究においては、第1の従来技術のアプローチにおいて説明したものよりも多数の動き補償の符号化モードのセットが導入される。第2、第3、および第4の従来技術のアプローチに関して説明するシステムは、配向されたパーティションを含み、多数の追加的な符号化モードを導入する。これらの各モードは、16×8、8×16のモードを異なるように変換したバージョン、さらに、ジグザグの輪郭を有する第1の従来技術のアプローチにおいて提案された各モードを異なるように変換したバージョンである。
図3を参照すると、「第2」、「第3」、および「第4の従来技術のアプローチ」と呼ばれるものに関する動き補償符号化モードが概ね参照符号300によって示されている。18個の動き補償符号化モードが示されている。
【0010】
第1の従来技術のアプローチの場合と同様に、動き補償の第2、第3、および第4の従来のアプローチにおいて定義されるパーティションは、ビデオ・フレームのコンテンツにとっては大雑把であり、精密なものではない。配向されたパーティションのセットの数が第1の従来技術におけるアプローチのものよりも多い場合であっても、依然として、ビデオ・フレームに存在する様々なエッジを効率的に符号化するには十分に精密なものではない。この場合、ジオメトリック情報の明示的な符号化が行われることはなく、符号化器においてこの情報の適応された処理が行われることが支障をきたしている。さらに、より多数のモードのセットを符号化するために導入される負荷は、モードのリストにおける配向されたモードに続く方向性の無いモードにさらに悪い影響を及ぼすものである。
【0011】
第5の従来のアプローチは、第2、第3、および第4の従来技術のアプローチにおいて、動き補償に基づく予測を行う従前の目的に加えて、配向されたモードのパーティション内でイントラ予測を使用することを提案している。第5の従来技術のアプローチに存在する制約は、第2、第3、および第4の従来技術のアプローチから引き継がれているため、前述の各段落に記載された内容の全ては、第5の従来技術のアプローチにも当てはまる。
【0012】
第6の従来技術のアプローチは、文献に存在する研究から、最も柔軟なフレームワークを提案する。第6の従来技術のアプローチは、2つのモードのみを導入することを提案し、これらのモードでは、2つの境界ポイントを結合するセグメントがブロック・パーティションを発生させるために使用される。提案される動き補償符号化モードのうち、第1のモードは、マクロブロックを2つのマクロブロック境界ポイントを接続するセグメントによって分けられる2つのパーティションに分割する。
図4Aを参照すると、本明細書において「第6の従来技術のアプローチ」と呼ばれるものの第1の動き補償符号化モードに従ったマクロブロック分割が概ね参照符号400によって示されている。
【0013】
第2の提案されたモードは、マクロブロックのサブブロックへの主分割に基づき、さらに、各サブブロックの境界上の2つのポイントを結合するセグメントを使用して、各サブブロックが分割される。
図4Bを参照すると、本明細書において「第6の従来技術のアプローチ」と呼ばれるものの第2の動き補償符号化モードに従ったマクロブロック分割が概ね参照符号450によって示されている。
【0014】
第6の従来技術のアプローチにおいて概略説明されるスキームに関しては、依然として幾つかの制約が存在し、これらの制約は以下のものを含む。
【0015】
第6の従来技術のアプローチに関連する第1の制約としては、セグメントによる2つの境界ポイントの結合として定義されるブロック分割は、より複雑な境界または輪郭の場合を効率的に取り扱うことができないという点である。このため、第6の従来技術のアプローチは、より複雑な形の近似を行うために、マクロブロックをサブブロックに分割し、各サブブロックにおけるセグメントの結合ポイントを使用することを提案するが、これは効率的ではない。
【0016】
第6の従来技術のアプローチに関連する第2の制約は、各パーティションが動き推定のためのものとしてとらえられるだけであり、発生したパーティション内で何らかのイントラ符号化技術を使用することは考慮されないという点である。これにより、提案された技術では、エフェクトを明らかにすること(新たなデータがシーケンスの間にオブジェクトの裏側より現れる状況)を取り扱うことができず、または、単に、いずれかのビデオ・フレームにおいて非時間的な予測方法で情報を符号化することができない。
【0017】
第6の従来技術のアプローチに関連する第3の制約は、歪みおよび符号化コストの観点から、符号化境界ポイントによるパーティション符号化は十分に効率的なものではないという点である。なぜならば、これらは、パーティション境界におけるジオメトリック特性を適切に表すことができないため、ビデオ・フレームにおけるデータのジオメトリック特性を適切に示していないからである。実際、ビデオ・フレームにおけるデータは、通常、相異なるビデオ成分および/またはオブジェクトのローカルな向きおよびローカルな位置のようなジオメトリックな情報のための相異なる統計値を表している。境界ポイントを単純に使用したのでは、このような情報を反映することはできない。従って、このような統計値を符号化のために有効に利用することはできない。
【0018】
第6の従来技術のアプローチに関連する第4の制約は、ビデオ圧縮品質が異なれば、最良の歪み対符号化効率のトレードオフを達成するために、要求されるジオメトリックな情報に対する精度が異なる点である。第6の従来技術のアプローチは、ビデオ圧縮品質に依存してブロック・パーティションを符号化するために送信される情報に適応するものではない。さらに、第6の従来技術のアプローチは、パーティション・ジオメトリック情報の適切な表現を有するものではない、さらに/または、記述するものではない。従って、第6の従来技術のアプローチは、何らかのジオメトリック情報を他のジオメトリック情報よりも高い精度で符号化することが要求されても、このような要求に対応できるものではない。
【0019】
第6の従来技術のアプローチに関連する第5の制約は、境界の一方の側に部分的に存在し、他方の側に部分的に存在するパーティションの境界に存在する画素を第6の従来技術のアプローチが取り扱うようには見受けられない点である。これらの画素は、必要なときに、両方のパーティション側からの情報を合成できるとよい。
【0020】
図8を参照すると、MPEG−4 AVC規格に従ったビデオ符号化を実行することが可能なビデオ符号化器が概ね参照符号800によって示されている。
【0021】
ビデオ符号化器800は、結合器885の非反転入力部と信号通信する出力部を有するフレーム順序付けバッファ810を含む。結合器885の出力部は、変換器/量子化器825の第1の入力部と信号通信するように結合されている。変換器/量子化器825の出力部は、エントロピー符号化器845の第1の入力部と、逆変換器/逆量子化器850の第1の入力部と信号通信するように結合されている。エントロピー符号化器845の出力部は、結合器890の第1の非反転入力部と信号通信するように結合されている。結合器890の出力部は、出力バッファ835の第1の入力部と信号通信するように結合されている。
【0022】
符号化器コントローラ805の第1の出力部は、フレーム順序付けバッファ810の第2の入力部と、逆変換器/逆量子化器850の第2の入力部と、ピクチャ・タイプ決定モジュール815の入力部と、マクロブロック・タイプ(MBタイプ)決定モジュール820の入力部と、イントラ予測モジュール860の第2の入力部と、デブロッキング・フィルタ865の第2の入力部と、動き補償器870の第1の入力部と、動き推定器875の第1の入力部と、参照ピクチャ・バッファ880の第2の入力部と信号通信するように結合されている。
【0023】
符号化器コントローラ805の第2の出力部は、補助拡張情報(SEI)挿入器830の第1の入力部と、変換器/量子化器825の第2の入力部と、エントロピー符号化器845の第2の入力部と、出力バッファ835の第2の入力部と、シーケンス・パラメータ・セット(SPS)/ピクチャ・パラメータ・セット(PPS)挿入器840の入力部と信号通信するように結合されている。
【0024】
ピクチャ・タイプ決定モジュール815の第1の出力部は、フレーム順序付けバッファ810の第3の入力部と信号通信するように結合されている。ピクチャ・タイプ決定モジュール815の第2の出力部は、マクロブロック・タイプ決定モジュール820の第2の入力部と信号通信するように結合されている。
【0025】
シーケンス・パラメータ・セット(SPS)/ピクチャ・パラメータ・セット(PPS)挿入器840の出力部は、結合器890の第3の非反転入力部と信号通信するように結合されている。
【0026】
逆変換器/逆量子化器850の出力部は、結合器825の第1の非反転入力部と信号通信するように結合されている。結合器825の出力部は、イントラ予測モジュール860の第1の入力部と、デブロッキング・フィルタ865の第1の入力部と信号通信するように結合されている。デブロッキング・フィルタ865の出力部は、参照ピクチャ・バッファ880の第1の入力部と信号通信するように結合されている。参照ピクチャ・バッファ880の出力部は、動き推定器875の第2の入力部と信号通信するように結合されている。動き推定器875の第1の出力部は、動き補償器870の第2の入力部と信号通信するように結合されている。動き推定器875の第2の出力部は、エントロピー符号化器845の第3の入力部と信号通信するように結合されている。
【0027】
動き補償器870の出力部は、スイッチ897の第1の入力部と信号通信するように結合されている。イントラ予測モジュール860の出力部は、スイッチ897の第2の入力部と信号通信するように結合されている。マクロブロック・タイプ決定モジュール820の出力部は、スイッチ897の第3の入力部と信号通信するように結合されている。スイッチ897の出力部は、結合器825の第2の非反転入力部と信号通信するように結合されている。
【0028】
フレーム順序付けバッファ810の入力部および符号化器コントローラ805は、符号化器800の入力部として、入力ピクチャ801を受信するために利用可能である。さらに、補助拡張情報(SEI)挿入器830の入力部は、符号化器800の入力部として、メタデータを受信するために利用可能である。出力バッファ835の出力部は、符号化器800の出力部として、ビットストリームを出力するために利用可能である。
【0029】
図10を参照すると、MPEG−4 AVC規格に従ったビデオ復号処理を実行することが可能なビデオ復号器が概ね参照符号1000によって示されている。
【0030】
ビデオ復号器1000は、エントロピー復号器1045の第1の入力部と信号通信するように結合された出力部を有する入力バッファ1010を含む。エントロピー復号器1045の第1の出力部は、逆変換器/逆量子化器1050の第1の入力部と信号通信するように結合されている。逆変換器/逆量子化器1050の出力部は、結合器1025の第2の非反転入力部と信号通信するように結合されている。結合器1025の出力部は、デブロッキング・フィルタ1065の第2の入力部と、イントラ予測モジュール1060の第1の入力部と信号通信するように結合されている。デブロッキング・フィルタ1065の第2の出力部は、参照ピクチャ・バッファ1080の第1の入力部と信号通信するように結合されている。参照ピクチャ・バッファ1080の出力部は、動き補償器1070の第2の入力部と信号通信するように結合されている。
【0031】
エントロピー復号器1045の第2の出力部は、動き補償器1070の第3の入力部と、デブロッキング・フィルタ1065の第1の入力部と信号通信するように結合されている。エントロピー復号器1045の第3の出力部は、復号器コントローラ1005の入力部と信号通信するように結合されている。復号器コントローラ1005の第1の出力部は、エントロピー復号器1045の第2の入力部と信号通信するように結合されている。復号器コントローラ1005の第2の出力部は、逆変換器/逆量子化器1050の第2の入力部と信号通信するように結合されている。復号器コントローラ1005の第3の出力部は、デブロッキング・フィルタ1065の第3の入力部と信号通信するように結合されている。復号器コントローラ1005の第4の出力部は、イントラ予測モジュール1060の第2の入力部と、動き補償器1070の第1の入力部と、参照ピクチャ・バッファ1080の第2の入力部と信号通信するように結合されている。
【0032】
動き補償器1070の出力部は、スイッチ1097の第1の入力部と信号通信するように結合されている。イントラ予測モジュール1060の出力部は、スイッチ1097の第2の入力部と信号通信するように結合されている。スイッチ1097の出力部は、結合器1025の第1の非反転入力部と信号通信するように結合されている。
【0033】
入力バッファ1010の入力部は、復号器1000の入力部として、入力ビットストリームを受信するために利用可能である。デブロッキング・フィルタ1065の第1の出力部は、復号器1000の出力部として、出力ピクチャを出力するために利用可能である。
上記の第1〜第6の従来技術のアプローチに関連する技術は、それぞれ、以下に示す非特許文献1〜6に記載されている。
【発明を実施するための形態】
【0043】
本発明の原理は、ビデオ符号化処理および復号処理のためにアダブティブなジオメトリック分割を行う方法および装置に関する。
【0044】
本説明は、本発明の原理を例示するものである。従って、本明細書において明示的に記載、または図示されていなくとも、当業者が本発明の原理を実施する様々な構成を企図することが可能であり、このような構成が本願の精神および範囲の中に包含されることが理解できるであろう。
【0045】
本明細書に記載された全ての例および条件付の文言は、本発明の原理を読者が理解するのを助けるための教示目的のものであり、発明者によって寄与された概念は、技術を発展させるものであり、このような具体的に記載された例や条件に限定されるように解釈されるべきではない。
【0046】
また、本明細書における本発明の原理、態様、および、実施の形態についての全ての記載、さらに、その特定の例は、構造的、機能的な均等物を包含するように意図したものである。さらに、このような均等物は、現在公知の均等物だけでなく、将来において開発される均等物、即ち、構造に係らず、同一の機能を実行するように開発された全ての要素を包含するように意図されている。
【0047】
従って、例えば、当業者であれば、本明細書において示されたブロック図は、本発明の原理を実施する回路を例示する概念図であることが理解できよう。同様に、フローチャート、フロー図、状態遷移図、擬似コードなどは、いずれも様々な処理を表す。これらの処理は、実質的にコンピュータによって読み取り可能なメディアにおいて表すことができ、コンピュータまたはプロセッサにより実行され、このようなコンピュータまたはプロセッサがはっきりと図示されているかどうかに係るものではない。
【0048】
各図面において示される様々な要素の機能は、専用のハードウエアの使用により提供されてもよく、適切なソフトウエアと関連付けてソフトウエアを実行することが可能なハードウエアの使用によって提供されてもよい。機能がプロセッサによって提供される場合にも、単一の専用プロセッサによって提供されてもよく、単一の共有プロセッサによって提供されてもよく、複数の別個のプロセッサによって提供されてもよく、幾つかのプロセッサが共有されていてもよい。さらに、用語「プロセッサ」または「コントローラ」を明示的に使用した場合であっても、ソフトウエアを実行することが可能なハードウエアのみを意味するように解釈されるべきではなく、限定するものではないが、ディジタル信号プロセッサ(DSP)・ハードウエア、ソフトウエアを格納する読み出し専用メモリ(ROM)、ランダム・アクセス・メモリ(RAM)、および不揮発性の記憶装置を黙示的に含むことがある。
【0049】
また、従来のおよび/または慣習的な他のハードウエアを含むこともある。同様に、図面に示されたどのスイッチも概念的なものに過ぎない。これらの機能はプログラム・ロジックの動作を介して、専用のロジックを介して、プログラム制御と専用のロジックとのインタラクションを介して、または、手動でも実行されることがある。文脈からより具体的に理解できるように、実施者により、特定の技術を選択可能である。
【0050】
本願の特許請求の範囲において、特定の機能を実施するための手段として表現されたいずれの要素も、この機能をどのような方法で実行するものも包含するように意図している。例えば、a)機能を実行する回路要素を組み合わせたもの、または、b)形態に関わらず、ソフトウエア、つまり、ファームウエア、マイクロコード等を含み、機能を実施するためにソフトウエアを実行する適当な回路と組み合わせたものも包含する。このような請求の範囲によって定義される本発明の原理は、請求項に記載された様々な手段によって提供される機能が請求の範囲の要件として、組み合わせられ、まとめられている事実に基づいたものである。従って、出願人は、このような機能を提供することが可能な手段はどのようなものであっても、本願において示されているものと均等であるとみなす。
【0051】
本明細書において、本発明の原理の「一実施の形態」、または、「実施の形態」と言及されている場合、これは、実施の形態に関して記載される特定の特徴事項、構造、特性などが本発明の原理の少なくとも1つの実施の形態に含まれることを意味する。従って、明細書全体に渡って様々な箇所に存在する文言「一実施の形態においては」、または、「実施の形態においては」は、必ずしも、同一の実施の形態について言及するものではない。
【0052】
用語「ブロック」および「領域」は、本願明細書において同じ意味で使用されていることが理解されよう。
【0053】
さらに、文言「既存のビデオ符号化規格」および「ビデオ符号化勧告」は、開発が完了していないものも含み、本発明の原理を出願する時点で存在するどのような既存のビデオ符号化規格および勧告をも含むことがある。このような規格および勧告として、限定するものではないが、H.261、H.262、H.263、H.263+、H.263++、MPEG−1、MPEG−2、MPEG−4 AVCなどが挙げられる。
【0054】
さらに、用語「拡張バージョン」は、ビデオ符号化規格および/または勧告に関して使用された場合には、修正されたもの、進化されたもの、または、さもなければ、拡張されたものを意味する。
【0055】
さらに、表現「画像データ」は、静止画像および動画像(即ち、動きを含む画像シーケンス)のいずれかに対応するデータを意味するように意図されていることが理解されよう。
【0056】
さらに、本明細書において使用される「ハイレベル・シンタックス」は、マクロブロック層よりも階層的に上位に位置するビットストリームに存在するシンタックスを意味する。例えば、本明細書において使用されるハイレベル・シンタックスは、限定するものではないが、スライス・ヘッダ・レベル、補助拡張情報(SEI)レベル、ピクチャ・パラメータ・セット・レベル、シーケンス・パラメータ・セット・レベル、および、NALユニット・ヘッダ・レベルでのシンタックスを意味する場合がある。
【0057】
用語「および/または」の使用は、例えば、「Aおよび/またはB」の場合、1番目に列挙されたオプション(A)の選択、2番目に列挙されたオプション(B)の選択、または、両方のオプション(AおよびB)の選択を包含すると意図される。別の例として、「A、B、および/またはC」の場合、このような文言は、1番目に列挙されたオプション(A)の選択、2番目に列挙されたオプション(B)の選択、3番目に列挙されたオプション(C)の選択、1番目および2番目に列挙されたオプション(AおよびB)の選択、2番目および3番目に列挙されたオプション(AおよびC)の選択、2番目および3番目に列挙されたオプション(BおよびC)、または、全ての3つのオプション(A、B、およびC)の選択を包含すると意図される。列挙された多くの項目の分だけ、このことが拡張されることは、当該技術分野、さらに、関連する技術分野における通常の技術知識を有するものであれば容易に理解できるであろう。
【0058】
上述したように、本発明の原理は、ビデオ符号化処理および復号処理のために適応したジオメトリック分割を行う方法および装置に関する。
【0059】
本発明の原理の1つ以上の実施の形態は、ツリーベースのアプローチの効率の悪さを克服するために、ローカル信号のジオメトリーをとらえ、表現することが可能なフレーム領域分割のためのパラメトリック・モデルを使用する。本発明の原理の様々な実施の形態において使用されるパラメトリック・モデリングは、少なくとも1つの曲線(一時多項式の場合には、直線となる)の陰的または陽的な定式化によって画像部分(またはマクロブロック)内の少なくとも1つのパーティションを定義するものとして、定義され、このパラメトリック・モデリングの特定の実施の形態では、いわゆる「陰関数曲線(implicit curve)」の定式化に従ったパーティションおよび曲線を一緒に定義する。上述した第6の従来技術のアプローチは、ブロックの周縁に位置する2つの所与のポイント間での直線結合としてブロック内部のスライスされたパーティション間の境界を定義するが、この点において、本発明の原理に従って使用される一般的な曲線の定式化は、上述した第6の従来技術のものとは区別される。
【0060】
予測されるフレームの領域またはブロックが与えられると、従来のツリー分割をベースとするモードに加えて、ジオメトリック・パーティション・モードがテストされる。対象のブロックまたは領域は、1つまたは1セットのパラメトリック・モデルによって記述される幾つかの領域に分割される。具体的には、この場合、ブロックまたは領域が2つのパーティションに分割される形式が考えられ、ここで、パーティションの境界は、パラメトリック・モデルまたは関数
【数1】
によって記述される。xおよびyは座標軸を表し、
【数2】
は、パーティションの形状を記述する情報を含むパラメータのセットを表す。フレームのブロックまたは領域が
【数1】
を使用してパーティションに分割されると、生成された各パーティションは、何らかの歪みおよび符号化コスト尺度のトレードオフに基づいて、最も適切な予測子を用いて予測される。
【0061】
このようなパーティションの記述が興味深い理由として、近年の研究において、ツリー構造が画像情報の符号化には最適なものではないことが示されてきたことが挙げられる。これらの研究は、規則的なエッジまたは輪郭によって分けられる異質な各領域を画像のツリーベースの符号化によって最適に符号化できないことを支持している。この問題は、エッジ、輪郭、または、配向されたテクスチャに沿って存在するジオメトリカルな冗長性をツリー構造が最適にとらえることができないという事実によるものである。ビデオ・シーケンスにおいては、エッジおよび/または輪郭が符号化されなければならないような様々な状況が普通に存在する。そのうちの1つは、イントラ符号化されたデータが符号化される場合である。様々な視覚的データの間の境界は、最も関連する情報の1つ、例えば、エッジおよびオブジェクトの輪郭である。インター符号化されたデータでは、動いているオブジェクトの周りの輪郭さらに、異なる動きの領域間の輪郭もまた、関連性があり、重要である。
【0062】
本発明の原理の実施の形態は、二次元データのジオメトリーに適応した一般的なジオメトリックなフレーム分割のための技術を提供する。生成された各領域は、次に、最も効率的なタイプの予測、例えば、インターおよび/またはイントラ予測タイプを使用して符号化される。一実施の形態では、ブロックまたはフレーム領域にジオメトリック・パーティションを生成することを含む。従来のツリーの代わりに、ブロックまたはフレーム領域をジオメトリカルに適応したパーティションに分割することにより、送信される情報量、さらに、予測処理によって生成される残差量を低減することができる。本発明の原理に従って、各ブロック内でパーティション境界の生成、近似、および/または符号化を行うのにパラメトリック・モデルが使用される。このようなアプローチにより、二次元データの主なジオメトリック特性を良好にとらえることが可能となる。例えば、モデル・パラメータは、例として、限定するものではないが、パーティション境界角度、位置、不連続性、および/または、曲率といったものに関わる情報を独立して有するように定義することができる。パーティション符号化のためのパラメトリック・モデルの使用により、極めてコンパクトなパーティション・エッジの記述が可能となり、これにより、符号化するパラメータの数が最小限となる。さらに、パーティション・モデル・パラメータの各々を、それぞれの統計的データおよび性質に従って最良に符号化するために、独立した、または、異なるジオメトリック情報を分離するようにパーティション・モデル・パラメータを定義することができる。このようなモデルベースのジオメトリック情報の処理により、ジオメトリック・パラメータ毎に割り当てられる符号化情報量を選択的に増減させることが可能となる。符号化効率に加え、このような特徴は、演算量の制御に有用であるほか、符号化効率に対する影響を最小限にする。
【0063】
パラメータ・モデルをベースとするパーティション記述を使用する一つの利点は、ブロックにおける2つのパーティションの間でスムーズなパーティション境界を効率的に記述することができる可能性である。多くの場合、イントラ・フレームにおける2つの相異なるオブジェクトまたはエッジ間の境界は、何らかの多項式
【数3】
によってモデル化し、精細に近似することができる。
図5を参照すると、パーティションP0およびP1を用いた多項式モデルに基づくスムーズなパーティション境界が概ね参照符号500によって示されている。
【0064】
ジオメトリック画像およびビデオ符号化のために、
【数4】
(以下、f(x,y)とも表現する)パラメータは、ローカル角度、位置、および/または、何らかの曲率の大きさなどのジオメトリック情報を記述するように演算することができる。従って、一次多項式
【数5】
の特定の場合において、ブロック・パーティションは、所与の座標軸のセットに対する角度および距離を記述するように表される。
【数6】
パーティション境界は、f(x,y)=0となる位置(x,y)上で定義される。
【0065】
図6を参照すると、パラメトリック・モデルとして使用するための、ジオメトリー(角度および位置)が記載されたパラメータを用いた一次多項式を使用する例が概ね参照符号600によって示されている。
【0066】
各ブロックからの2つの領域の生成に係る実施の形態においては、パーティションを記述するのに以下の黙示的な定式を使用することができる。
【数7】
【0067】
零ライン(f(x,y)=0)の一方の側に位置する全ての画素は、1つのパーティション領域(例えば、パーティション1)に属するものとして分類される。他方の側に位置する全ての画素は、代替的な領域(例えば、パーティション0)に属するものとして分類される。
【0068】
パーティション境界上の画素を取り扱うオプションの方法
各パーティションの離散的な性質を考慮すると、分離ラインまたは曲線の近傍上で、画素の中には、一方、または、他方のパーティションに部分的に属するとみなされるだけのものがある。これは、パラメトリック・モデルの定式化が連続的であり、各パーティションの実現が離散的であるという事実によるものである。
【0069】
このような画素は、パーティションの各側を記述するのに使用される予測子の影響を受けることがある。従って、各画素は、「部分面」として、パーティション1やパーティション0とは異なるラベルが付けられることがある。一方または他方の画素に1および0のラベルを付ける方式を採用しているのは、簡略化のためのものである。「部分面」画素は、従って、その間の何らかの値によって識別することができる。これには、対象画素がどの程度パーティション0に入りこんでいるかの情報を含む(例えば、値1は完全であること、値0.5は半分、値0は何も無いことを表す)。勿論、上述したナンバリングの方式、本明細書に渡って使用するナンバリングの方式は、例示的なもの、分かりやすくするためのものに過ぎず、本明細書において与えられた本発明の原理の開示内容を考慮すれば、当該技術分野、さらに、関連する技術分野における通常の技術知識を有するものであれば、本発明の原理の精神の範囲内で、本発明の原理に使用されるこれらのナンバリングの方式、さらに、その他のナンバリングの方式を企図するであろう。前述した内容は、パーティション0のためのラベル付けの以下の定義のように形式的に表される。
【数8】
【0070】
ラベル(x,y)=1は、該当画素が第1のパーティションに含まれているかどうかを示す。ラベル(x,y)=0は、該当画素が第2のパーティションに含まれていることを示す。その他の値は、該当する特定の画素に対し、第1のパーティションからの予測値に対する寄与の重み付けを示すように、部分的に分類される。第2のパーティションからの予測は、重み(1−ラベル(x,y))で「部分面」画素の値に寄与する。このジェネリックな画素分類は、パーティション・マスクの形式で生成される。
図7を参照すると、一次多項式を使用したパラメトリック・モデルf(x,y)から生成されたパーティション・マスクが概ね参照符号700によって示されている。上述したように、本明細書中に記載した浮動小数点は、想定される選択値の単なる例である。実際、f(x,y)に依存して、0.5以外の閾値が想定可能である。「部分面」として分類される画素についても、それに重なるパーティションのうちの1つの内部での1つ以上の近傍画素の関数として、または、それに重なる1つ以上のパーティションの関数の組み合わせとして、予測可能である。さらに、当該技術分野、関連する技術分野における通常の技術知識を有するものであれば、本明細書に記載された本発明の原理のどのような態様も、整数での実施および/またはルックアップ・テーブルの利用のために適応できる場合があることを理解できるであろう。
【0071】
パーティション関数f,(x,y),パラメータ空間をサンプリングするための考慮事項
復号器が対象のブロックまたは領域のパーティションを決定できるようにするためにモデル・パラメータの符号化および送信が必要である。このため、パーティション・パラメータの精度は、ブロックまたはパーティション領域を記述するために割り当てられる符号化コストの最大の量によって制約を受ける。
【0072】
一般性を失うことなく、想定されるパーティション(または、ジオメトリック・モデル)の辞書は、
f(x,y)の各パラメータのサンプリング精度を決定することによって、先験的に定義される。ジオメトリック一次多項式境界の場合、例えば、これは以下のように定義される。
【数9】
ここで、ΔρおよびΔθは、選択された量子化(パラメータ精度)ステップである。しかしながら、選択された値におけるオフセットを設定することができる。θおよびρの量子化された各指数は、パーティションの形状を符号化するために送信される情報である。しかしながら、(MPEG−4 AVC規格のために定義されているような)垂直方向および水平方向の各モードが別個の符号化モードとして使用される場合、ρ=0および角度0度および90度のジオメトリック・パーティションは、想定されるパーティションの構成のセットより除かれる。これにより、ビットが節約されると共に、複雑性が低減する。
【0073】
復号器は、符号化器によって使用されるパラメータの精度を把握している必要がある。この情報は、パーティション・パラメータの各タイプ毎に、明示的に、または、黙示的に、何らかの既に存在するデータの関数(例えば、MPEG−4 AVC規格における量子化パラメータ)として送信することができる。パラメータ精度は、シーケンス、画像、および/またはスライス・レベルなどの何らかのハイレベル・シンタックスに従って適応させることができる。
【0074】
本発明の原理に関して本明細書において記載される領域分割を使用するビデオ通信システムは、領域分割を使用する各領域毎に、パーティションの形状を記述するのに必要な符号化されたパラメータのセットを送信するとよい。送信されるデータの残りは、全てのジオメトリー符号化された領域について、ツリーベースのパーティション・モードで送信されたものと同様である。実際、各モデルベースのパーティションについて、予測情報が送信されるとよい。さらに、予測の後、最終的に、残差予測誤差も符号化されてもよい。
【0075】
パラメトリックな、モデルベースの、ジオメトリック領域分割は、フレームの分割に依存したビデオ符号化器/復号器における全ての処理に影響を与える。本発明の原理を享受することが可能な、本発明の原理に適応させることができるビデオ・システムにおけるより一般的な処理/モジュールは、限定するものではないが、符号化器/復号器の一般的な制御、領域予測(エントロピー補償/イントラ・データ予測)、動き推定、エントロピー符号化処理/復号処理、およびアーティファクト低減のためのインループ・フィルタ処理を含む。
【0076】
以下、MPEG−4 AVC規格のフレームワークに関して実施の形態を説明する。しかしながら、本発明の原理は、MPEG−4 AVCのみに限定されるものではなく、本発明の原理の精神を逸脱することなく、他のビデオ符号化規格や勧告にも容易に利用することができる。
【0077】
本発明の原理に従ったパラメトリック・モデル・パーティションを考慮するためのMPEG−4 AVC規格 ビデオ符号化器および復号器の拡張
次に、本発明の原理に従ったMPEG−4 AVC規格の拡張に関して実施の形態を説明する。MEPG−4 AVC規格は、符号化性能を最適化するために、ツリーベースのフレーム分割に依存している。本発明の原理に係る実施の形態に従ってMPEG−4 AVC規格を拡張することは、MPEG−4規格が依存しているツリーベースのフレーム分割に固有の制約を克服するのに役立つ。
【0078】
パラメトリック・モデルベースの領域分割は、新たなブロック符号化モードの形態でMPEG−4 AVC規格に組み込むことができる。MPEG−4 AVC規格のツリーベースのフレーム分割は、必要な時と場所で、16×16、16×8、8×16、8×8、8×4、4×8、および4×4のブロックに各ピクチャを分割する。これらの分割タイプは、符号化モードに関連付けられ、同時に、モードに依存して、インター・タイプであってもよいし、イントラ・タイプであってもよい。これらのブロック・パーティション・モードに加え、パラメトリック・モデルf(x,y)がブロック内のパーティションを記述するのに使用される追加のパーティション・ブロック・モードを導入する。パラメトリック・モデルを用いて分割されるこのようなブロック・モードは、本明細書において、「ジオメトリック・モード(Geometric Mode)」と呼ばれる。この目的は、可及的に大きなパーティションを生成することである。従って、パラメトリック・モデルの目的は、16×16サイズのブロックまたは、ツリーベースのパーティションの各リーフ(葉)が集まったもの(unions)に適用されることである。しかしながら、圧縮効率が問題となる場合、8×8の「ジオメトリック・モード」・ブロックもまた考慮される。8×8の「ジオメトリック・モード」の使用は、複雑性のファクタに依存して有効または無効になる。ハイレベル・シンタックスは、8×8の「ジオメトリック・モード」が使用されているかどうかを示すために、信号によって知らせることもできる。これにより、このようなモードが使用されないときの符号化の負荷を低減することができる。シンタックス・レベルの具体的な例として、限定するものではないが、シーケンス、ピクチャ、および/またはスライス・レベルが挙げられる。
【0079】
このような符号化モードの新たなファミリーを挿入するために、MPEG AVC規格における符号化器および/または復号器を修正することができる。
図8、
図9、
図10、および
図11に描くように、新たなモードを扱って、ジオメトリック情報をとらえ、符号化できるようにするために、MPEG−4 AVC規格における主構成ブロックの機能を修正し、拡張することができる。
【0080】
図9を参照すると、本発明の原理と共に使用されるために拡張されたMPEG−4 AVC規格に従ったビデオ符号化を実行することが可能なビデオ符号化器が概ね参照符号900によって示されている。
【0081】
ビデオ符号化器900は、結合器985の非反転入力部と信号通信する出力部を有するフレーム順序付けバッファ910を含む。結合器985の出力部は、ジオメトリック拡張を用いた変換器/量子化器927の第1の入力部と信号通信するように結合されている。ジオメトリック拡張を用いた変換器/量子化器927の出力部は、ジオメトリック拡張を用いたエントロピー符号化器945の第1の入力部と、逆変換器/逆量子化器950の第1の入力部と信号通信するように結合されている。ジオメトリック拡張を用いたエントロピー符号化器945の出力部は、結合器990の第1の非反転入力部と信号通信するように結合されている。結合器990の出力部は、出力バッファ935の第1の入力部と信号通信するように結合されている。
【0082】
ジオメトリック拡張を用いた符号化器コントローラ905の第1の出力部は、フレーム順序付けバッファ910の第2の入力部と、逆変換器/逆量子化器950の第2の入力部と、ピクチャ・タイプ決定モジュール915の入力部と、ジオメトリック拡張を用いたマクロブロック・タイプ(MBタイプ)決定モジュール920の入力部と、ジオメトリック拡張を用いたイントラ予測モジュール960の第2の入力部と、ジオメトリック拡張を用いたデブロッキング・フィルタ965の第2の入力部と、ジオメトリック拡張を用いた動き補償器970の第1の入力部と、ジオメトリック拡張を用いた動き推定器975の第1の入力部と、参照ピクチャ・バッファ980の第2の入力部と信号通信するように結合されている。
【0083】
ジオメトリック拡張を用いた符号化器コントローラ905の第2の出力部は、補助拡張情報(SEI)挿入器930の第1の入力部と、ジオメトリック拡張部を用いた変換器/量子化器927の第2の入力部と、ジオメトリック拡張を用いたエントロピー符号化器945の第2の入力部と、出力バッファ935の第2の入力部と、シーケンス・パラメータ・セット(SPS)/ピクチャ・パラメータ・セット(PPS)挿入器940の入力部と信号通信するように結合されている。
【0084】
ピクチャ・タイプ決定モジュール915の第1の出力部は、フレーム順序付けバッファ910の第3の入力部と信号通信するように結合されている。ピクチャ・タイプ決定モジュール915の第2の出力部は、ジオメトリック拡張を用いたマクロブロック・タイプ決定モジュール920の第2の入力部と信号通信するように結合されている。
【0085】
シーケンス・パラメータ・セット(SPS)/ピクチャ・パラメータ・セット(PPS)挿入器940の出力部は、結合器990の第3の非反転入力部と信号通信するように結合されている。
【0086】
逆変換器/逆量子化器950の出力部は、結合器925の第1の非反転入力部と信号通信するように結合されている。結合器925の出力部は、ジオメトリック拡張を用いたイントラ予測モジュール960の第1の入力部と、ジオメトリック拡張を用いたデブロッキング・フィルタ965の第1の入力部と信号通信するように結合されている。ジオメトリック拡張を用いたデブロッキング・フィルタ965の出力部は、参照ピクチャ・バッファ980の第1の入力部と信号通信するように結合されている。参照ピクチャ・バッファ980の出力部は、ジオメトリック拡張を用いた動き推定器975の第2の入力部と信号通信するように結合されている。ジオメトリック拡張を用いた動き推定器975の第1の出力部は、ジオメトリック拡張を用いた動き補償器970の第2の入力部と信号通信するように結合されている。ジオメトリック拡張を用いた動き推定器975の第2の出力部は、ジオメトリック拡張を用いたエントロピー符号化器945の第3の入力部と信号通信するように結合されている。
【0087】
ジオメトリック拡張を用いた動き補償器970の出力部は、スイッチ997の第1の入力部と信号通信するように結合されている。イントラ予測モジュール960の出力部は、スイッチ997の第2の入力部と信号通信するように結合されている。ジオメトリック拡張を用いたマクロブロック・タイプ決定モジュール920の出力部は、スイッチ997の第3の入力部と信号通信するように結合されている。スイッチ997の出力部は、結合器925の第2の非反転入力部と、結合器985の反転入力部と信号通信するように結合されている。
【0088】
ジオメトリック拡張を用いたフレーム順序付けバッファ910の入力部およびジオメトリック拡張を用いた符号化器コントローラ905は、符号化器900の入力部として、入力ピクチャ901を受信するために利用可能である。さらに、補助拡張情報(SEI)挿入器930の入力部は、符号化器900の入力部として、メタデータを受信するために利用可能である。出力バッファ935の出力部は、符号化器900の出力部として、ビットストリームを出力するために利用可能である。
【0089】
図11を参照すると、本発明の原理と共に使用されるために拡張されたMPEG−4 AVC規格に従ったビデオ復号処理を実行することが可能なビデオ復号器が概ね参照符号1100によって示されている。
【0090】
ビデオ復号器1100は、ジオメトリック拡張を用いたエントロピー復号器1145の第1の入力部と信号通信するように結合された出力部を有する入力バッファ1110を含む。ジオメトリック拡張を用いたエントロピー復号器1145の第1の出力部は、ジオメトリック拡張を用いた逆変換器/逆量子化器1150の第1の入力部と信号通信するように結合されている。ジオメトリック拡張を用いた逆変換器/逆量子化器1150の出力部は、結合器1125の第2の非反転入力部と信号通信するように結合されている。結合器1125の出力部は、ジオメトリック拡張を用いたデブロッキング・フィルタ1165の第2の入力部と、ジオメトリック拡張を用いたイントラ予測モジュール1160の第1の入力部と信号通信するように結合されている。ジオメトリック拡張を用いたデブロッキング・フィルタ1165の第2の入力部は、参照ピクチャ・バッファ1180の第1の入力部と信号通信するように結合されている。参照ピクチャ・バッファ1180の出力部は、ジオメトリック拡張を用いた動き補償器1170の第2の入力部と信号通信するように結合されている。
【0091】
ジオメトリック拡張を用いたエントロピー復号器1145の第2の出力部は、ジオメトリック拡張を用いた動き補償器1170の第3の入力部と、ジオメトリック拡張を用いたデブロッキング・フィルタ1165の第1の入力部と信号通信するように結合されている。ジオメトリック拡張を用いたエントロピー復号器1145の第3の出力部は、ジオメトリック拡張を用いた復号器コントローラ1105の入力部と信号通信するように結合されている。ジオメトリック拡張を用いた復号器コントローラ1105の第1の出力部は、ジオメトリック拡張を用いたエントロピー復号器1145の第2の入力部と信号通信するように結合されている。ジオメトリック拡張を用いた復号器コントローラ1105の第2の出力部は、ジオメトリック拡張を用いた逆変換器/逆量子化器1150の第2の入力部と信号通信するように結合されている。ジオメトリック拡張を用いた復号器コントローラ1105の第3の出力部は、ジオメトリック拡張を用いたデブロッキング・フィルタ1165の第3の入力部と信号通信するように結合されている。ジオメトリック拡張を用いた復号器コントローラ1105の第4の出力部は、ジオメトリック拡張を用いたイントラ予測モジュール1160の第2の入力部と、ジオメトリック拡張を用いた動き補償器1170の第1の入力部と、参照ピクチャ・バッファ1180の第2の入力部と信号通信するように結合されている。
【0092】
ジオメトリック拡張を用いた動き補償器1170の出力部は、スイッチ1197の第1の入力部と信号通信するように結合されている。ジオメトリック拡張を用いたイントラ予測モジュール1160の出力部は、スイッチ1197の第2の入力部と信号通信するように結合されている。スイッチ1197の出力部は、結合器1125の第1の非反転入力部と信号通信するように結合されている。
【0093】
入力バッファ1110の入力部は、復号器1100の入力部として、入力ビットストリームを受信するために利用可能である。ジオメトリック拡張を用いたデブロッキング・フィルタ1165の第1の出力部は、復号器1100の出力部として、出力ピクチャを出力するために利用可能である。
【0094】
MPEG−4 AVC規格に対する本発明の原理の使用に係る想定される修正/拡張に関し、符号化器および/または復号制御モジュールは、「ジオメトリック・モード」に必要な全ての決定ルールおよび符号化処理構造を含むように修正/拡張することができる。
【0095】
MPEG−4 AVC規格に対する本発明の原理の使用に係る別の想定される修正/拡張に関し、f(x,y)およびそのパラメータによって記述される任意のパーティションを有するブロックを補償するように、動き補償モジュールを適応させることができる。
【0096】
MPEG−4 AVC規格に対する本発明の原理の使用に係るさらに別の想定される修正/拡張に関し、パラメトリック・モデルベースの符号化モードにおいて利用可能な相異なる分類のパーティションために最も適切な動きベクトルをテストし、選択するように、動き補償モジュールを適応させることができる。
【0097】
MPEG−4 AVC規格に対する本発明の原理の使用に係るさらに別の想定される修正/拡張に関し、パラメトリック・モデルベースの各パーティションにおいて最も適切な予測モードを選択する可能性を用いたパラメトリック・モデルベースのブロック分割を考慮するように、イントラ・フレーム予測を適応させることができる。
【0098】
MPEG−4 AVC規格に対する本発明の原理の使用に係るさらに別の想定される修正/拡張に関し、パラメトリック・モデルベースのパーティションを用いたブロック内部の動き領域のより複雑な形状を取り扱うために、デブロッキング・インループ・フィルタ・モジュールを適応させることができる。
【0099】
MPEG−4 AVC規格に対する本発明の原理の使用に係るさらに別の想定される修正/拡張に関し、パラメトリック・モデルベースのモードを用いて関連付けられる新たなデータの符号化処理および/復号処理を行うように、エントロピー符号化処理および/または復号処理を適応させ、拡張することができる。さらに、動き領域のより複雑な形状を取り扱うために、動き予測を適応させることができる。パラメトリック・モデルベースのペーティション・パラメータを効率的に符号化するための予測子を生成し、使用することもできる。
【0100】
符号化器特定ブロック
符号化器制御
符号化器制御モジュールは、パラメトリック・モデルベースのブロック・パーティションに基づいて新たなモードを考慮するために拡張することができる。これらのモード(ジオメトリック・モードと呼ばれる)は、MPEG−4 AVC規格における既存のモードの中に挿入される。動き補償のためのインターモードの特定の場合においては、16×16および8×8のパラメトリック・モデルベースで分割されたブロックが存在する。各モデルは、それぞれ、マクロブロック・サイズのモードおよびサブマクロブロック・サイズのモード内に挿入される。構造的な類似性により、これらのモードは、ジオメトリック16×16モードでは、16×8および/または8×16の前、間、または後に論理的に挿入され、ジオメトリック8×8モードでは8×4および/または4×8の前、間、または後に挿入される。例示的な実施態様においては、低ビットレートのため、16×8、および8×16、さらに、8×4および4×8モードの低コストでの使用を可能にするために、16×16および8×8のジオメトリック・モードがMPEG−4 AVC 方向ホモローグ(directional homologues)の直後に挿入される。グローバルな使用に係る統計的データに従って、これらを表1および表2に示すように、MPEG−4 AVC方向モード(およびサブモード)の直前に挿入することもできる。
【表1】
【表2】
【0101】
動き推定
必要な場合、ジオメトリーが適応されたブロック・パーティションを取り扱うように動き推定モジュールを適応させてもよい。例として、ジオメトリック・モードにおいては、動きは、従来のツリーベースのパーティション・モード16×8、8×16、8×4、または、4×8の場合と同様に記述さる。実際、これらのモードは、本願のパラメトリック・モデルベースのパーティション・モードの何らかの特定のインスタンスのように機能することができる。従って、これらは、使用されるパラメトリック・モデルの想定される構成から除外される。各パーティションは、必要に応じて、さらに、PブロックまたはBブロックが符号化中であるかどうかにより、1つまたは複数の参照値を用いてモデル化される。
【0102】
Pモードの例:
完全なPモードのパラメトリック・モデルベースで分割されたブロックにおいては、双方のパーティションが参照フレームから選択された整合パッチによってモデル化される。各パッチは、選択されたジオメトリック・パーティションに適した形状を有していなければならない。PマクロブロックおよびPサブマクロブロックの場合と同様に、動きベクトルがパーティション毎に送信される。この点についての1つの例では、何らかの歪みの尺度(D)および何らかの符号化コストの尺度(R)の観点から、ブロック内の情報が最良に記述されるように、動きベクトル、さらに、f(x,y)モデル・パラメータが選択される。この目的で、DおよびRが共に最小化されるように、各ブロックについて全てのパラメータが一緒に最適化される。
【数10】
ここでλは乗算ファクタであり、MV
1およびMV
0は、パーティション内の双方の動きベクトルを表し、θおよびρは、一次多項式の特定の場合のパーティション・パラメータを示す。各Ωxは、各種情報のための有効な値のセット(集合)を表す。
【0103】
本発明の原理に係る1つ以上の実施の形態と共に使用される歪みの尺度の適応例は、各パーティションのために生成されるマスクの使用である(
図7のマスクの例参照)。次に、各パーティションを考慮するように、以下のように、どのような従来のブロックベースの歪み尺度も修正することができる。
【数11】
上記数式において、MASK
P1(x,y)およびMASK
P0(x,y)は、それぞれ、f(x,y)パーティションの各々を表す。これを高速に実施することは、極めて小さな値(例えば、所与の閾値(0.5などの閾値)未満〜零)のマスク値に対して追加される処理の数を減少させるよって可能となる。また、このような単純化の例は、0.5以下の全ての値は零に切り捨て、0.5を超える全ての値を1に切り上げるといったような単純化されたマスクを作成することでもよい。そこで、一実施の形態においては、マスクが1である位置のもののみが加算され、歪みが算出される。このような場合、追加される処理のみが必要であり、各マスクにおいて零の値を有する全ての位置が無視される。
【0104】
一実施の形態においては、全てのパーティションで動きサーチを実行することに加え、パーティション自体も動き情報と共に決定される。従って、サーチは、f(x,y)パラメータに対しても行われる。
図16を参照すると、モデルベースのパーティション・パラメータおよび予測サーチ(例えば、動き推定のための動きベクトル・サーチ)を使用したジオメトリック・モード推定のための例示的な方法が概ね参照符号1600によって示されている。
【0105】
方法1600は、制御をループ端ブロック1610に受け渡す開始ブロック1605を含む。ループ端ブロック1610は、全ての数の想定されるエッジ(エッジの数は、ジオメトリック精度に依存する)に対してループを実行し、変数iを初期化し、制御を機能ブロック1615に受け渡す。機能ブロック1615は、パラメータ・セットiを用いてパーティションを生成し、制御を機能ブロック1620に受け渡す。機能ブロック1620は、パーティション・セットiを与えられた最良の予測子をサーチし、制御を決定ブロック1625に受け渡す。決定ブロック1625は、最良のパーティションおよび最良の予測が決定されているかどうかを判定する。最良のパーティションおよび最良の予測が決定されている場合には、制御が機能ブロック1630に受け渡される。最良のパーティションおよび最良の予測が決定されていない場合には、制御がループ端ブロック1635に受け渡される。
【0106】
機能ブロック1630は、最良のジオメトリック・パラメータおよび予測子の選択肢を保存し、制御をループ端ブロック1635に受け渡す。
【0107】
ループ端ブロック1635は、全ての数の想定されるエッジに対してループを終了し、制御を終了ブロック1640に受け渡す。
【0108】
ブロック・パーティションのために幾つかの想定されるモデルのタイプのモードを使用することが望まれる場合、動き推定は、データに適応された最良のモデルを見つけるために、複数の異なるモードをテストすることに関わるであろう。復号器側での最良のモデルの選択は、必要な補助情報を送信することによって処理される。
【0109】
エントロピー符号化
エントロピー符号化は、ジオメトリック・パラメータの統計的なデータ、さらに、近傍の復号/符号化ブロックからの予測モデルに従って、ジオメトリック・パラメータを符号化するために拡張することができ、近傍の復号/符号化ブロック自体、ジオメトリック・パーティション情報を含むことがある。パラメトリック・モデルを用いて分割されたブロックのための動きベクトル予測子は、各々の分割されたブロックのジオメトリー、さらに、近傍の、既に符号化されたブロックのジオメトリーに適応されている。各ジオメトリック・パーティション動きベクトルは、空間および/または時間的に近傍のブロックから適応的に選択された動きベクトルのセットより予測される。これについての一実施の形態は、現在のブロック・パーティションのジオメトリーに依存して、1つ、または3つの空間近傍の動きベクトルを使用することである。動きベクトルの数が3である場合、これらには、メジアン・フィルタがかけられる。次に、予測された各動きベクトルは、可変長符号化(VLC)または算術符号化に基づく符号化を使用して、MEPG−4 AVC規格に従って符号化される。
【0110】
次に、モデルベースのパーティション・パラメータのための2つの例示的な符号化アプローチについて説明する。
【0111】
モデルベースのパーティション・パラメータのための第1の例示的な符号化アプローチにおいては、このようなパラメータは、近傍にモデルベースの(またはジオメトリック)ブロックが存在しない場合に、予測無しに符号化される。そこで、一次多項式の場合、可変長符号化の一実施の形態においては、各角度は、一様な符号を用いて符号化され、半径は、ゴロム符号(Golomb code)を使用することができる。
【0112】
モデルベースのパーティション・パラメータのための第2の例示的な符号化アプローチにおいては、このようなパラメータは、少なくとも1つの近傍のモデルベース(またはジオメトリック)ブロックが存在する場合に、予測を用いて符号化される。パラメータ予測の実施の形態は、前側に存在する近傍ブロックからのパラメトリック・モードを現在のブロックに投影することによって実行される。実際、一次多項式の場合、一例では、前のブロックのラインを現在のブロックに継続させることによってパラメータを予測する。2つのブロックが利用可能である場合には、予測されたラインは、マクロブロック境界を有する隣接ラインの両方の交点を結合するものである。
【0113】
図13を参照すると、左側のブロックのパラメータから右側のブロックのパーティション・パラメータを予測する例が概ね参照符号1300によって示されている。
【0114】
図14を参照すると、上側のブロックのパラメータからの下側のブロックのパーティション・パラメータを予測する例が概ね参照符号1400によって示されている。
【0115】
図15を参照すると、上側および左側のブロックの各パラメータから下側のブロックのパーティション・パラメータを予測する例が概ね参照符号1500によって示されている。
【0116】
次に、予測されたパラメータは、ゴロム符号を使用して別個に符号化される。角度の特定の場合において、後のVLC符号化またはAC符号化のための最良の想定される統計的なデータを有するために、周期的な特性を有効に利用することができる。VLCの一例においては、ゴロム符号を使用することができる。
【0117】
ジオメトリック・ブロック・モードの符号化処理構造に関し、
図17、
図18、
図19は、一般的なパラメトリック・モデルベースのブロックのための符号化フローチャートの特定の実施の形態を描いている。実際、パラメトリック・モデルベースのブロックを符号化するために、動きデータに追加して、ブロック符号化処理の何らかの時点において、パーティション・パラメータが符号化されることとなる。
【0118】
図17を参照すると、ジオメトリカルに分割された予測ブロックを符号化する例示的な方法が概ね参照符号1700によって示されている。
【0119】
方法1700は、制御を決定ブロック1710に受け渡す開始ブロック1705を含む。決定ブロック1710は、現在のモードタイプがジオメトリック・モードタイプであるかどうかを判定する。現在のモードタイプがジオメトリック・モードタイプである場合には、制御が機能ブロック1715に受け渡される。現在のモードタイプがジオメトリック・モードタイプでない場合には、制御が終了ブロック1730に受け渡される。
【0120】
機能ブロック1715は、ジオメトリック・モードタイプを符号化し、制御を機能ブロック1720に受け渡す。機能ブロック1720は、ジオメトリック・パーティション・パラメータを符号化し、制御を終了ブロック1725に受け渡す。機能ブロック1725は、パーティション予測を符号化し、制御を終了ブロック1730に受け渡す。
【0121】
図18Aを参照すると、ジオメトリカルに分割されたインター予測ブロックを符号化する例示的な方法が概ね参照符号1800によって示されている。
【0122】
方法1800は、制御を決定ブロック1804に受け渡す開始ブロック1802を含む。決定ブロック1804は、現在のモードタイプがジオメトリック・インター・モードタイプであるかどうかを判定する。現在のモードタイプがジオメトリック・インター・モードタイプである場合には、制御が機能ブロック1806に受け渡される。現在のモードタイプがジオメトリック・インター・モードタイプでない場合には、制御が終了ブロック1812に受け渡される。
【0123】
機能ブロック1806は、ジオメトリック・インター・モードタイプを符号化し、制御を機能ブロック1808に受け渡す。機能ブロック1808は、ジオメトリック・パーティション・パラメータを符号化し(例えば、予測のために近傍のジオメトリック・データが利用可能である場合には、これを使用し、適切に符号化テーブルを適応させる)、制御を機能ブロック1810に受け渡す。機能ブロック1810は、パーティション・インター予測を符号化し(例えば、予測のために近傍の復号されたデータが利用可能である場合には、これを使用し、適切に符号化テーブルを適応させる)、制御を終了ブロック1812に受け渡す。
【0124】
図18Bを参照すると、ジオメトリカルに分割されたイントラ予測ブロックを符号化する例示的な方法が概ね参照符号1850によって示されている。
【0125】
方法1850は、制御を決定ブロック1854に受け渡す開始ブロック1852を含む。決定ブロック1854は、現在のモードタイプがジオメトリック・インター・モードタイプであるかどうかを判定する。現在のモードタイプがジオメトリック・インター・モードタイプである場合には、制御が機能ブロック1856に受け渡される。現在のモードタイプがジオメトリック・インター・モードタイプでない場合には、制御が終了ブロック1862に受け渡される。
【0126】
機能ブロック1856は、ジオメトリック・インター・モードタイプを符号化し、制御を機能ブロック1858に受け渡す。機能ブロック1858は、ジオメトリック・パーティション・パラメータを符号化し(例えば、予測のために近傍のジオメトリック・データが利用可能である場合には、これを使用し、適切に符号化テーブルを適応させる)、制御を機能ブロック1860に受け渡す。機能ブロック1860は、パーティション・インター予測を符号化し(例えば、予測のために近傍の復号されたデータが利用可能である場合には、これを使用し、適切に符号化テーブルを適応させる)、制御を終了ブロック1862に受け渡す。
【0127】
図19を参照すると、複数のタイプのモデルを有する例示的な方法が概ね参照符号1900によって示されている。
【0128】
方法1900は、制御を決定ブロック1910に受け渡す開始ブロック1905を含む。決定ブロック1910は、現在のモードタイプがジオメトリック・モードタイプであるかどうかを判定する。現在のモードタイプがジオメトリック・モードタイプである場合には、制御が機能ブロック1915に受け渡される。現在のモードタイプがジオメトリック・モードタイプでない場合には、制御が終了ブロック1950に受け渡される。
【0129】
機能ブロック1915は、ジオメトリック・モードタイプを符号化し、制御を準備ブロック1920に受け渡す。準備ブロック1920は、現在のパーティションのためにパラメトリック・モデルAまたはBを選択する。パラメトリック・モデルAが選択された場合には、制御が機能ブロック1935に受け渡される。そうでない場合、パラメトリック・モデルBが選択された場合には、制御が機能ブロック1925に受け渡される。
【0130】
機能ブロック1935は、符号をパラメトリック・モデルAに対応するように指定し、制御を機能ブロック1940に受け渡す。機能ブロック1940は、パラメトリック・モデルAのためのジオメトリック・パーティション・パラメータを符号化し、制御を機能ブロック1945に受け渡す。
【0131】
機能ブロック1925は、符号をパラメトリック・モデルBに対応するように指定し、制御を機能ブロック1930に受け渡す。機能ブロック1930は、パラメトリック・モデルBのためのジオメトリック・パーティション・パラメータを符号化し、制御を機能ブロック1945に受け渡す。
【0132】
機能ブロック1945は、パーティション予測を符号化し、制御を終了ブロック1950に受け渡す。
【0133】
符号化器/復号器共有ブロック
動き補償
パラメトリック・モデルベースで分割されたブロックにおける非方形/非矩形のパーティションを補償するために動き補償モジュールを拡張することができる。動き補償処理のためのブロック再構成は、本明細書においてで上述した動き推定処理に直接続くものである。実際、補償は、動きベクトルに関連付けられた2つの、パーティション形状のピクスマップ(pixmaps)と共にパーティションの最良のセットを予測子として使用することに対応する。既に定義したように、「部分面(Partial Surface)」画素は、動きベクトルに関連付けられたピクスマップの所与のルールに従った組み合わせとして算出される。
【0134】
イントラ予測
ブロックのパラメトリック・モデルベースのパーティションに従ってイントラ・データを予測するために、イントラ予測がアップグレードされる。パラメトリック・モデルベースのパーティションを用いたイントラ予測は、パラメトリック・モデルベースのパーティションを用いた動き補償および動き推定と同様に定義されるが、生成されたパーティションの各々を満たすために、代わりにイントラ予測が使用されるという基本的な違いがある。
【0135】
インループ・デブロッキング・フィルタ
インループ・デブロッキング・フィルタは、予測のブロック構造、さらに、残差符号化離散コサイン変換(DCT)に起因するブロッキング・アーティファクトを低減する。インループ・デブロッキング・フィルタは、符号化されたビデオ・データに依存して、さらに、ブロック境界に渡った各画素間のローカル強度の差に依存して、フィルタ強度を適応させる。本発明の原理に係る実施の形態は、ビデオ・データ表現の新たな形態を導入する。パラメトリック・モデルベースのパーティションを含むブロックは、必ずしも、各4×4ブロック上で一定の動きベクトル値、または、一定の参照フレーム値を有するものではない。実際、パラメトリック・モデルベースのパーティションを用いて任意に分割されたブロックにおいては、所与の動きベクトルによる影響を受ける領域およびブロック境界は、パラメトリック・モデルによって強いられる形状によって定義される。従って、4×4ブロックは、所与の位置で使用される動きベクトルおよび使用される参照フレームに関し、これが有する全体的な影響により、半分が1つのパーティションとなり、他方の半分が別のパーティションとなるように見える。よって、フィルタ強度決定の処理を適応させることによって、インループ・デブロッキング・フィルタ・モジュールが拡張される。この処理は、ここで、内部ブロック・パーティションの特定の形状を考慮してフィルタ強度を決定することが可能となるとよい。フィルタをかけるブロック境界の部分によっては、他のMPEG−4 AVCモードによってなされるように、4×4のブロックに従うのではなく、パーティションの形状に従って、適切な動きベクトルおよび参照フレームを得る必要がある。
図12を参照すると、パラメトリック・モデルベースで分割されたマクロブロックが概ね参照符号1200によって示されている。パラメトリック・モデルベースで分割されたマクロブロックは、デブロッキング・フィルタ強度決定のためにどのように情報が選択されるかを示すデブロッキング領域の幾つかの例を含む。フィルタ強度は、各4×4のブロックのデブロッキング・フィルタがかけられる側毎に一度算出される。
【0136】
フィルタ強度算出のために考慮されるパーティションの選択は、フィルタがかけられるブロック側に大部分が重なっているパーティションを選ぶことによって行われる。しかしながら、第2の代替的な方法では、角部のブロックにおける演算を単純にするために、フィルタがかけられる両方のブロック・エッジの大部分を含むパーティションからの動きおよび参照フレーム情報を有するように全ての変換ブロック全体が考慮される。
【0137】
デブロッキング・インループ・フィルタとパラメトリック・モデルベースのブロック分割の使用を組み合わせる第3の代替的な方法では、ブロック境界がモデルベースでブロックが分割されるモード(例えば、ジオメトリック・モード)の影響を受けるとき、場所に係らず、常に、ブロック境界を介してある程度のフィルタをかけることを可能にする。ジオメトリック・モードは、境界に影響を与えるブロック、境界近傍のブロックのいずれかのものである。また、デブロッキング・フィルタをジオメトリック・モードにおけるマクロブロックの境界に位置しない変換ブロックにかけてもよいし、かけなくともよい。
【0138】
デブロッキング・インループ・フィルタを組み合わせる第4の代替的な方法では、最初の2つの方法のいずれかを考慮するが、変換ブロックにおいてある程度のフィルタの使用をトリガーする条件として次のものを追加する。モデルベースのパーティション曲線とマクロブロック境界との間の接合部を含む変換ブロックによってブロック境界が影響を受ける場合には、ある程度のデブロッキングを使用する。
【0139】
復号器特定ブロック
復号器制御モジュール
復号器制御モジュールは、パラメトリック・モデルベースのブロック分割に基づく新たなモードを考慮するために拡張される。これらのモード(ジオメトリック・モードと呼ばれる)は、復号器側で実行されるものと同様に、MPEG−4 AVC規格における既存のモードの中に挿入される。符号化器側で符号化される情報を正確に復元するために、符号化器の構造および復号処理シーケンスと完全に一致するように復号器制御モジュールが修正される。
【0140】
エントロピー復号
エントロピー復号は、モデルベースのブロック分割の使用のために拡張することができる。上述したエントロピー符号化処理に従って、エントロピー復号は、上述した符号化処理に一致するように拡張される必要がある。
図20、
図21、および
図22は、パラメトリック・モデルベースの符号化モードに関連する情報を復号するための、この点に関して想定される特定の実施の形態を示しており、ここでは、どのブロック・モードが使用されるかを示す符号語が既に復号されており、復号器制御のために利用可能である。
【0141】
図20を参照すると、ジオメトリカルに分割された予測ブロックを復号する例示的な方法が概ね参照符号2000によって示されている。
【0142】
方法2000は、制御を機能ブロック2010に受け渡す開始ブロック2005を含む。機能ブロック2010は、現在のモードタイプがジオメトリック・モードタイプであるかどうかを判定する。現在のモードタイプがジオメトリック・モードタイプである場合には、制御が機能ブロック2015に受け渡される。現在のモードタイプがジオメトリック・モードタイプでない場合には、制御が終了ブロック2025に受け渡される。
【0143】
機能ブロック2015は、ジオメトリック・パーティション・パラメータを復号し、制御を機能ブロック2020に受け渡す。機能ブロック2020は、パーティション予測を復号し、制御を終了ブロック2025に受け渡す。
【0144】
図21Aを参照すると、ジオメトリカルに分割されたインター予測ブロックを復号する例示的な方法が概ね参照符号2100によって示されている。
【0145】
方法2100は、制御を機能ブロック2114に受け渡す開始ブロック2112を含む。機能ブロック2114は、現在のモードタイプがジオメトリック・モードタイプであるかどうかを判定する。現在のモードタイプがジオメトリック・モードタイプである場合には、制御が機能ブロック2116に受け渡される。現在のモードタイプがジオメトリック・モードタイプでない場合には、制御が終了ブロック2120に受け渡される。
【0146】
機能ブロック2116は、ジオメトリック・パーティション・パラメータを復号し(例えば、予測のために近傍のジオメトリック・データが利用可能である場合には、これを使用し、適切に符号化テーブルを適応させる)、制御を機能ブロック1810に受け渡す。機能ブロック2118は、パーティション・インター予測を復号し(例えば、予測のために近傍の復号されたデータが利用可能である場合には、これを使用し、適切に符号化テーブルを適応させる)、制御を終了ブロック2120に受け渡す。
【0147】
図21Bを参照すると、ジオメトリカルに分割されたイントラ予測ブロックを復号する例示的な方法が概ね参照符号2150によって示されている。
【0148】
方法2150は、制御を機能ブロック2164に受け渡す開始ブロック2162を含む。機能ブロック2164は、現在のモードタイプがジオメトリック・モードタイプであるかどうかを判定する。現在のモードタイプがジオメトリック・モードタイプである場合には、制御が機能ブロック2166に受け渡される。現在のモードがジオメトリック・モードタイプでない場合には、制御が終了ブロック2170に受け渡される。
【0149】
機能ブロック2166は、ジオメトリック・パーティション・パラメータを復号し(例えば、予測のために近傍のジオメトリック・データが利用可能である場合には、これを使用し、適切に符号化テーブルを適応させる)、制御を機能ブロック2168に受け渡す。機能ブロック2168はパーティション・イントラ予測を復号し(例えば、予測のために近傍の復号されたデータが利用可能である場合には、これを使用し、適切に符号化テーブルを適応させる)、制御を終了ブロック2170に受け渡す。
【0150】
図22を参照すると、複数のタイプのモデルを復号する例示的な方法が概ね参照符号2200によって示されている。
【0151】
方法2200は、制御を決定ブロック2210に受け渡す開始ブロック2205を含む。決定ブロック2210は、現在のモードタイプがジオメトリック・モードタイプであるかどうかを判定する。現在のモードタイプがジオメトリック・モードタイプである場合には、制御が機能ブロック2215に受け渡される。現在のモードタイプがジオメトリック・モードタイプでない場合には、制御が終了ブロック2240に受け渡される。
【0152】
機能ブロック2215は、パラメトリック・モデル選択を復号し、制御を準備ブロック2220に受け渡す。準備ブロック2220は、現在のパーティションのためにパラメトリック・モデルAまたはBを選択する。パラメトリック・モデルAが選択された場合には、制御が記録ブロック2225に受け渡される。そうでない場合、パラメトリック・モデルBが選択された場合には、制御が機能ブロック2230に受け渡される。
【0153】
機能ブロック2225は、パラメトリック・モデルAのためのジオメトリック・パーティション・パラメータを復号し、制御を機能ブロック2235に受け渡す。
【0154】
機能ブロック2230は、パラメトリック・モデルBのためのジオメトリック分割パラメータを復号し、制御を機能ブロック2235に受け渡す。
【0155】
機能ブロッック2235は、パーティション予測を復号し、制御を終了ブロック2240に受け渡す。
【0156】
図23を参照すると、スライス・ヘッダ・シンタックス符号化のための例示的な方法が概ね参照符号2300によって示されている。
【0157】
方法2300は、制御を機能ブロック2310に受け渡す開始ブロック2305を含む。機能ブロック2310は、スライス関連情報Iを符号化し、制御を機能ブロック2315に受け渡す。機能ブロック2315は、スライス品質(QP)符号化情報を符号化し、制御を機能ブロック2320に受け渡す。機能ブロック2320は、ジオメトリック・パラメータ精度情報を符号化し、制御を機能ブロック2325に受け渡す。機能ブロック2325は、スライス関連情報IIを符号化し、制御を終了ブロック2330に受け渡す。表現「スライス関連情報I」および「スライス関連情報」は、スライス・ヘッダ関連情報を表し、ジオメトリック精度パラメータがスライス・ヘッダの既存のシンタックス内に挿入される。
【0158】
図24を参照すると、ジオメトリック・パラメータ精度を導出する例示的な方法が概ね参照符号2400によって示されている。
【0159】
方法2400は、制御を機能ブロック2410に受け渡す開始ブロック2405を含む。機能ブロック2410は、今回(即ち、現在)のマクロブロックのためのQPパラメータを取得し、制御を機能ブロック2415に受け渡す。機能ブロック2415は、ジオメトリック・パラメータ精度を算出し、制御を終了ブロック2420に受け渡す。
【0160】
図25を参照すると、ジオメトリック・ブロックを再構成する例示的な方法が概ね参照符号2500によって示されている。
【0161】
方法2500は、制御を機能ブロック2510に受け渡す開始ブロック2505を含む。機能ブロック2510は、各パラメータからジオメトリック・パーティションを判定し、制御を機能ブロック2515に受け渡す。機能ブロック2515は、パーティション予測を再構築し、制御を機能ブロック2530に受け渡す。機能ブロッック2520は、アンチエイリアス処理を施し、制御を機能ブロック2525に受け渡す。機能ブロック2525は、再構成された残差を加え、制御を終了ブロック2530に受け渡す。
【0162】
図26を参照すると、現在のブロックのための最良のモードをサーチする例示的な方法が概ね参照符号2600によって示されている。
【0163】
方法2600は、制御を機能ブロック2610と、機能ブロック2615と、機能ブロック2620と、機能ブロック2625と、および機能ブロック2630とに受け渡す開始ブロック2605を含む。機能ブロック2610は、16×16のブロック・モードをテストし、制御を機能ブロック2635に受け渡す。機能ブロック2615は、16×8のブロック・モードをテストし、制御を機能ブロック2635に受け渡す。機能ブロック2620は、8×16のブロック・モードをテストし、制御を機能ブロック2635に受け渡す。機能ブロック2625は、16×16のブロック・モードをテストし、制御を機能ブロック2635に受け渡す。機能ブロック2630は、8×8のブロック・モードをテストし、制御を機能ブロック2635に受け渡す。
【0164】
機能ブロック2635は、現在のブロックのための最良のブロックを選択し、制御を終了ブロック2640に受け渡す。
【0165】
図27を参照すると、スライス・ヘッダ・シンタックス復号の例示的な方法が概ね参照符号2700によって示されている。
【0166】
方法2700は、制御を機能2710に受け渡す開始ブロック2705を含む。機能ブロック2710は、スライス関連情報Iを復号し、制御を機能ブロック2715に受け渡す。機能ブロック2715は、スライス品質符号化情報を復号し、制御を機能ブロック2720に受け渡す。機能ブロック2720は、ジオメトリック・パラメータ精度情報を復号し、制御を機能ブロック2725に受け渡す。機能ブロック2725は、スライス関連情報IIを復号し、制御を終了ブロック2730に受け渡す。
【0167】
本発明の多くの付随する利点/特徴の幾つかについて説明する。これらの幾つかは既に述べた通りのものである。例えば、1つの利点/特徴は、少なくとも1つのパラメトリック・モデルに応答して、ピクチャを少なくとも部分的に適応的に分割することによって、前記ピクチャに対応する画像データを符号化する符号化器を含む装置である。前記少なくとも1つのパラメトリック・モデルは、少なくとも1つ曲線の黙示的な定式化および明示的な定式化の少なくとも一方に関わる。
【0168】
別の利点/特徴は、上述した符号化器を有する装置であって、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線の少なくとも一方が、ジオメトリックな信号モデルから導出される、前記装置である。
【0169】
また、別の利点/特徴は、上述した符号化器を有する装置であって、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線の少なくとも一方が、1つ以上の画像輪郭および1つ以上の動き境界のうちの少なくとも一方を記述する、前記装置である。
【0170】
さらに、別の利点/特徴は、上述した符号化器を有する装置であって、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方として、少なくとも1つの多項式が使用される、前記装置である。
【0171】
さらに、別の利点/特徴は、上述した符号化器を有する装置であって、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方として、一次多項式モデルが使用される、前記装置である。
【0172】
さらに、別の利点/特徴は、上述した一次多項式モデルが使用される符号化器を有する装置であって、前記一次多項式モデルが角度パラメータおよび距離パラメータを含む、前記装置である。
【0173】
さらに、別の利点/特徴は、上述した符号化器を有する装置であって、1つを超えるパラメトリック・モデルを利用可能である場合、所与の画像部分のための前記少なくとも1つのパラメトリック・モデルが1セットのモデルから適応的に選択され、前記選択が黙示的または明示的に符号化される、前記装置である。
【0174】
さらに、別の利点/特徴は、上述した符号化器を有する装置であって、前記符号化器は、少なくとも1つのハイレベル・シンタックス要素を使用して、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方のパラメータの精度の黙示的または明示的な符号化を実行する、前記装置である。
【0175】
さらに、別の利点/特徴は、上述した少なくとも1つのハイレベル・シンタックスを使用する符号化器を有する装置であって、スライス・ヘッダ・レベル、補助拡張情報(SEI)レベル、ピクチャ・パラメータ・セット・レベル、シーケンス・パラメータ・セット・レベル、およびネットワーク抽象化レイヤー・ユニット・ヘッダ・レベルのうちの少なくとも1つに前記少なくとも1つのハイレベル・シンタックス要素が配置される、前記装置である。
【0176】
さらに、別の利点/特徴は、上述した符号化器を有する装置であって、圧縮効率と符号化器の複雑性の少なくとも一方を制御するために、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方のパラメータの精度が適応される、前記装置である。
【0177】
さらに、別の利点/特徴は、上述した符号化器を有する装置であって、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方のパラメータの精度が圧縮品質パラメータに依存して適応される、前記装置である。
【0178】
さらに、別の利点/特徴は、上述した符号化器を有する装置であって、前記ピクチャのうちの少なくとも1つの、少なくとも1つのパーティションで関連付けられる、予測子データが空間的に近傍のブロックおよび時間的に近傍のブロックのうちの少なくとも一方から予測される、前記装置である。
【0179】
さらに、別の利点/特徴は、上述した符号化器を有する装置であって、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方のためのパーティション・モデル・パラメータが空間的に近傍のブロックおよび時間的に近傍のブロックのうちの少なくとも一方から予測される、前記装置である。
【0180】
さらに、別の利点/特徴は、上述した符号化器を有する装置であって、前記符号化器は、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方に従って、1つ以上のパーティションに部分的に存在する各画素の各予測値を、アンチエイリアス処理、前記各画素の対応する各位置の各予測値の一部の組み合わせ、前記各画素の前記対応する各位置の各予測値の合計、近傍値、前記画素が部分的に位置するとみなされる、前記1つ以上のパーティションからの、複数の異なるパーティションの各予測子、の少なくとも1つを使用して算出する、前記装置である。
【0181】
さらに、別の利点/特徴は、上述した符号化器を有する装置であって、前記符号化器が、既存のビデオ符号化規格またはビデオ符号化勧告の既存のハイブリッド予測符号化器の拡張バージョンである、前記装置である。
【0182】
さらに、別の利点/特徴は、上述した既存のビデオ符号化規格またはビデオ符号化勧告の既存のハイブリッド予測符号化器の拡張バージョンである符号化器を有する装置であって、前記符号化器が、前記マクロブロックおよび前記サブマクロブロックのうちの少なくとも一方のための符号化モードとして、前記ピクチャのマクロブロックおよびサブブロックの少なくとも一方に対してパラメトリック・モデルベースのパーティションを適用する、前記装置である。
【0183】
さらに、別の利点/特徴は、上述したパラメトリック・モデルベースのパーティションを適用する符号化器を有する装置であって、既存のビデオ符号化規格またはビデオ符号化勧告の既存のマクロブロックおよびサブマクロブロック符号化モード内にパラメトリック・モデルベースの符号化モードが挿入される、前記装置である。
【0184】
さらに、別の利点/特徴は、上述したパラメトリック・モデルベースのパーティションを適用する符号化器を有する装置であって、前記符号化器は、前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方のモデル・パラメータを選択し、パーティション予測データと共にパラメトリック・モデルベースのパーティションを生成する、前記装置である。
【0185】
さらに、別の利点/特徴は、上述したパラメトリック・モデルベースのパーティションを適用する符号化器を有する装置であって、前記符号化器は、歪み尺度および符号化コスト尺度の少なくとも一方を共に最小化するために、前記少なくとも1つのパラメトリック・モデル、前記少なくとも1つの曲線、およびパーティション予測のうちの少なくとも1つのモデル・パラメータを選択する、前記装置である。
【0186】
さらに、別の利点/特徴は、上述したパラメトリック・モデルベースのパーティションを適用する符号化器を有する装置であって、少なくとも2つのパラメトリック・モデルベースのパーティションに重なる前記ピクチャのうち、少なくとも1つピクチャの各画素は、前記少なくとも2つのパラメトリック・モデルベースのパーティションの予測値の加重リニア平均である、前記装置である。
【0187】
さらに、別の利点/特徴は、上述したパラメトリック・モデルベースのパーティションを適用する符号化器を有する装置であって、パーティション予測は、インターまたはイントラのタイプの少なくとも一方である、前記装置である。
【0188】
さらに、別の利点/特徴は、上述したパラメトリック・モデルベースのパーティションを適用する符号化器を有する装置であって、前記符号化器は、パーティション・モデル・パラメータ符号化のための前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方のために、パラメータ予測値を選択的に使用する、前記装置である。
【0189】
さらに、別の利点/特徴は、上述したパラメータ予測値を選択的に使用する符号化器を有する装置であって、前記各ピクチャの特定の1つの現在のブロックのための予測値が近傍のブロックから前記現在のブロックへの曲線外挿に基づく、前記装置である。
【0190】
さらに、別の利点/特徴は、上述したパラメータ予測値を選択的に使用する符号化器を有する装置であって、前記復号器は、複数の異なるコンテキスト・テーブルまたは符号化テーブルを使用して前記少なくとも1つのパラメトリック・モデルおよび前記少なくとも1つの曲線のうちの少なくとも一方のパラメータが予測されているかどうかに依存して前記画像データを符号化する、前記装置である。
【0191】
さらに、別の利点/特徴は、上述したパラメトリック・モデルベースのパーティションを適用する符号化器を有する装置であって、前記符号化器が、ISO/IEC MEPG−4 Part 10 AVC規格/ITU−T H.264勧告のための符号化器の拡張バージョンである、前記装置である。
【0192】
さらに、別の利点/特徴は、上述したパラメトリック・モデルベースのパーティションを適用する符号化器を有する装置であって、パラメトリック・モデルベースのパーティション・モードが使用されている場合に、前記符号化器は、前記マクロブロックおよび前記サブマクロブロックのうちの前記少なくとも一方の非ツリーベースの分割による少なくとも1つのパラメトリック・モデルベースのパーティションによって影響を受ける変換サイズのブロックを取り扱うように適応されたデブロッキング・フィルタおよび参照フレーム・フィルタの少なくとも一方を適用する、前記装置である。
【0193】
本発明の原理のこれらの特徴およびその他の特徴は、関連する分野において通常の知識を有するものであれば、本明細書中の開示内容に基づいて、容易に解明することができるであろう。本発明の原理の開示内容は、ハードウエア、ソフトウエア、ファームウエア、特定用途向けプロセッサ、または、これらを組み合わせたものの形態で実施することができることが理解できよう。
【0194】
より好ましくは、本発明の原理の開示内容は、ハードウエアおよびソフトウエアを組み合わせて実施される。さらに、ソフトウエアは、プログラム・ストレージ・ユニットに上に現実的に実装されるアプリケーション・プログラムとして実施される。アプリケーション・プログラムは、適切なアーキテクチャからなるマシンにアップロードされ、このマシンによって実行されるようにしてもよい。好ましくは、このマシンは、1つ以上の中央処理装置(CPU)、ランダム・アクセス・メモリ(RAM)、入出力(I/O)インタフェースを有するコンピュータ・プラットフォーム上で実施される。また、コンピュータ・プラットフォームは、オペレーティング・システムおよびマイクロインストラクション・コードを含むようにしてもよい。本明細書中で開示される様々な処理および機能は、マイクロインストラクション・コードの一部を構成するものでもよいし、アプリケーション・プログラムの一部を構成するものであってもよいし、これらを組み合わせたものであってもよいし、CPUによって実行されるものであってもよい。さらに、追加的なデータ記憶装置や印刷機等、コンピュータ・プラットフォームに様々な他の周辺機器を結合するようにしてもよい。
【0195】
添付図面に示すシステムの構成要素および方法のステップの幾つかは、好ましくは、ソフトウエアの形態によって実施されるため、システムの構成要素または処理機能ブロック間の実際の結合は、本発明の原理をプログラムする方法によって異なる場合があることが理解できよう。本明細書の開示する内容に基づいて、関連する技術における通常の技術知識を有するものであれば、本発明の原理の実施の形態または構成、さらに、類似した実施の形態または構成を企図することができるであろう。
【0196】
添付図面を参照して本明細書中で例示的な実施の形態について説明したが、本発明はこれらの実施の形態に厳格に限定されるものではなく、関連技術に関して通常の技術を有する者であれば、本発明の原理の範囲または精神を逸脱することなく、様々な変更、改変を施すことが可能であることが理解できるであろう。このような変更、改変は、全て、添付の請求の範囲に定義されたような本発明の原理の範囲に含まれるべきものと解釈するべきである。