(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023166563
(43)【公開日】2023-11-21
(54)【発明の名称】動きベクトル復号装置、符号化装置及び記録媒体
(51)【国際特許分類】
H04N 19/513 20140101AFI20231114BHJP
H04N 19/70 20140101ALI20231114BHJP
【FI】
H04N19/513
H04N19/70
【審査請求】有
【請求項の数】3
【出願形態】OL
(21)【出願番号】P 2023149202
(22)【出願日】2023-09-14
(62)【分割の表示】P 2021020063の分割
【原出願日】2015-11-02
(31)【優先権主張番号】62/073,326
(32)【優先日】2014-10-31
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.WCDMA
(71)【出願人】
【識別番号】503447036
【氏名又は名称】サムスン エレクトロニクス カンパニー リミテッド
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】イ,ジン-ヨン
(72)【発明者】
【氏名】ジョン,スン-ス
(72)【発明者】
【氏名】ミン,ジョン-ヘ
(72)【発明者】
【氏名】イ,ソン-イル
(57)【要約】 (修正有)
【課題】動きベクトルを予測して符号化するビデオ符号化方法及び装置並びにビデオ映像の動きベクトルを予測して復号する方法及び装置を提供する。
【解決手段】動きベクトル符号化方法は、現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得し、予測動きベクトル候補を使用し、現在ブロックの予測動きベクトル、現在ブロックの動きベクトル及び現在ブロックの動きベクトル解像度を決定し、現在ブロックの予測動きベクトルを示す情報、現在ブロックの動きベクトルと現在ブロックの予測動きベクトルとの残差動きベクトル及び現在ブロックの動きベクトル解像度を示す情報を符号化する。所定の複数動きベクトル解像度は、1画素単位の解像度より大きい画素単位の解像度を含む。
【選択図】
図1B
【特許請求の範囲】
【請求項1】
動きベクトルの復号装置において、
現在ブロックの予測動きベクトル及び前記現在ブロックの残差動きベクトルを獲得する獲得部と、
複数の解像度のうち前記現在ブロックに対応する解像度に基づき、前記残差動きベクトルのためのシフト値を獲得し、前記シフト値を用いた左シフトを行って前記残差動きベクトルをアップスケーリングし、前記シフト値に基づいて前記予測動きベクトルを調節し、前記アップスケーリングされた残差動きベクトルと前記調節された予測動きベクトルに基づいて前記現在ブロックの動きベクトルを復元する復号部と、を含み、
前記シフト値は、複数の整数値のうち、いずれか1つであり、
前記複数の解像度は、1より大きい解像度を含む、復号装置。
【請求項2】
動きベクトルの符号化装置において、
複数の解像度のうち現在ブロックに対応する解像度に基づき、前記現在ブロックの残差動きベクトルのためのシフト値を獲得し、前記現在ブロックの予測動きベクトルを獲得し、前記シフト値に基づいて前記予測動きベクトルを調節し、前記現在ブロックの動きベクトルと前記現在ブロックの調節された予測動きベクトルに基づいて前記現在ブロックの残差動きベクトルを獲得する予測部と、
前記シフト値を用いた右シフトを行って前記現在ブロックの残差動きベクトルをダウンスケーリングし、前記ダウンスケーリングされた残差動きベクトルを符号化する符号化部と、を含み、
前記シフト値は、複数の整数値のうち、いずれか1つであり、
前記複数の解像度は、1より大きい解像度を含む、符号化装置。
【請求項3】
ビットストリームを記録したコンピュータで読み取り可能な記録媒体において、
前記ビットストリームは、現在ブロックの残差動きベクトルに係わる情報を含み、
前記残差動きベクトルに係わる情報は、
複数の解像度のうち前記現在ブロックに対応する解像度に基づき、前記現在ブロックの残差動きベクトルのためのシフト値を獲得し、
前記現在ブロックの予測動きベクトルを獲得し、
前記シフト値に基づいて前記予測動きベクトルを調節し、
前記現在ブロックの動きベクトルと前記現在ブロックの調節された予測動きベクトルに基づいて前記現在ブロックの残差動きベクトルを獲得し、
前記シフト値を用いた右シフトを行って前記現在ブロックの残差動きベクトルをダウンスケーリングし、
前記ダウンスケーリングされた残差動きベクトルを符号化することにより生成され、
前記シフト値は、複数の整数値のうちいずれか1つであり、
前記複数の解像度は、1より大きい解像度を含む、記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ビデオ符号化方法及びビデオ復号方法に係り、さらに具体的には、ビデオ映像の動きベクトルを予測して符号化する方法及びその装置、ビデオ映像の動きベクトルを予測して復号する方法及びその装置に関する。
【背景技術】
【0002】
H.264 AVC(advanced video coding)及びHEVC(high efficiency video coding)のようなコーデックでは、現在ブロックの動きベクトルを予測するために、現在ブロックに隣接した、以前に符号化されたブロック、または以前に符号化されたピクチャ内の同一位置にあるブロックの動きベクトルを、現在ブロックの予測動きベクトル(motion vector prediction)として使用することができる。
【0003】
ビデオ符号化方法、ビデオ復号方法では、映像を符号化するために、1つのピクチャをマクロブロックに分割し、インター予測(inter prediction)またはイントラ予測(intra prediction)を利用して、それぞれのマクロブロックを予測符号化することができる。
【0004】
該インター予測は、ピクチャ間の時間的な重複性を除去して映像を圧縮する方法であり、動き推定符号化が代表的な例である。該動き推定符号化は、少なくとも1つの参照ピクチャを利用して、現在ピクチャのブロックをそれぞれ予測する。所定の評価関数を利用して、現在ブロックと最も類似した参照ブロックを所定の検索範囲で検索する。
【0005】
現在ブロックを参照ブロックに基づいて予測し、現在ブロックから、予測結果として生成された予測ブロックを減算して生成された残差ブロックを符号化する。このとき、予測をさらに正確に行うために、参照ピクチャの検索範囲に対して補間を行い、画素単位(integer pel unit)より小さいピクセル単位の副画素を生成し、生成された副画素に基づいてインター予測を行うことができる。
【発明の概要】
【0006】
一実施形態による、動きベクトル復号装置及び動きベクトル符号化装置及びその方法は、最適の予測動きベクトル、及び動きベクトルの解像度を決定し、効率的に映像を符号化または復号して装置の複雑度を低くすることができる。
【0007】
一方、本発明の技術的課題及び効果は、以上で言及した特徴に制限されるものではなく、言及されていなかったり異なったりする他の技術的課題は、以下の記載から当該技術分野の当業者に明確に理解されるであろう。
【図面の簡単な説明】
【0008】
【
図1A】一実施形態による動きベクトル符号化装置のブロック図である。
【
図1B】一実施形態による動きベクトル符号化方法のフローチャートである。
【
図2A】一実施形態による動きベクトル復号装置のブロック図である。
【
図2B】一実施形態による動きベクトル復号方法のフローチャートである。
【
図3A】多様な解像度に基づいて動き補償を行うための補間を示す図面である。
【
図3B】1/4画素,1/2画素,1画素及び2画素単位の動きベクトル解像度を示す図面である。
【
図4A】予測動きベクトル候補を獲得するための現在ブロックの候補ブロックを示す図面である。
【
図4B】一実施形態による予測動きベクトル候補の生成過程を示す図面である。
【
図5A】一実施形態による、符号化単位及び予測単位を示す図面である。
【
図5B】
図5Bは適応的に決定された動きベクトル解像度を伝送するための一実施形態によるprediction_unitシンタックスの一部を示す図面である。
【
図5C】適応的に決定された動きベクトル解像度を伝送するための他の実施形態によるprediction_unitシンタックスの一部を示す図面である。
【
図5D】適応的に決定された動きベクトル解像度を伝送するための他の実施形態によるprediction_unitシンタックスの一部を示す図面である。
【
図6A】複数の解像度を使用してマージ候補リストを構成する一実施形態を示す図面である。
【
図6B】複数の解像度を使用してマージ候補リストを構成する他の実施形態を示す図面である。
【
図7A】解像度が異なる2つの動きベクトルが示す画素を示す図面である。
【
図7B】4倍に拡大したピクチャを構成する画素と、互いに異なる解像度の動きベクトルとを示す図面である。
【
図8】本発明の一実施形態による、ツリー構造による符号化単位に基づいたビデオ符号化装置のブロック図を図示する図面である。
【
図9】一実施形態による、ツリー構造による符号化単位に基づいたビデオ復号装置のブロック図を図示する図面である。
【
図10】一実施形態による符号化単位の概念を図示する図面である。
【
図11】一実施形態による、符号化単位に基づいたビデオ符号化部のブロック図を図示する図面である。
【
図12】一実施形態による、符号化単位に基づいたビデオ復号部のブロック図を図示する図面である。
【
図13】一実施形態による、深度別符号化単位及びパーティションを図示する図面である。
【
図14】一実施形態による、符号化単位及び変換単位の関係を図示する図面である。
【
図15】一実施形態による符号化情報を図示する図面である。
【
図16】一実施形態による深度別符号化単位を図示する図面である。
【
図17】一実施形態による、符号化単位、予測単位及び変換単位の関係を図示する図面である。
【
図18】一実施形態による、符号化単位、予測単位及び変換単位の関係を図示する図面である。
【
図19】一実施形態による、符号化単位、予測単位及び変換単位の関係を図示する図面である。
【
図20】表1の符号化モード情報による、符号化単位、予測単位及び変換単位の関係を図示する図面である。
【
図21】一実施形態による、プログラムが保存されたディスクの物理的構造を例示する図面である。
【
図22】ディスクを利用してプログラムを記録して判読するためのディスクドライブを図示する図面である。
【
図23】コンテンツ流通サービス(content distribution service)を提供するためのコンテンツ供給システム(content supply system)の全体的構造を図示する図面である。
【
図24】一実施形態による、本発明のビデオ符号化方法及びビデオ復号方法が適用される携帯電話の外部構造を図示する図面である。
【
図25】該携帯電話の内部構造を図示する図面である。
【
図26】一実施形態による通信システムが適用されたデジタル放送システムを図示する図面である。
【
図27】一実施形態による、ビデオ符号化装置及びビデオ復号装置を利用するクラウドコンピューティングシステムのネットワーク構造を図示する図面である。
【発明を実施するための形態】
【0009】
一実施形態による動きベクトルの符号化装置において、現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得し、前記予測動きベクトル候補を使用し、前記現在ブロックの予測動きベクトル、前記現在ブロックの動きベクトル、及び前記現在ブロックの動きベクトル解像度を決定する予測部、及び前記現在ブロックの予測動きベクトルを示す情報、前記現在ブロックの動きベクトルと、前記現在ブロックの予測動きベクトルとの残差動きベクトル、及び前記現在ブロックの動きベクトル解像度を示す情報を符号化する符号化部を含み、前記所定の複数動きベクトル解像度は、1画素単位の解像度より大きい画素単位の解像度を含むことを特徴とする。
【0010】
前記予測部は、前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合を使用し、前記第1動きベクトル解像度の画素単位に参照ブロックを探索し、前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を使用し、前記第2動きベクトル解像度の画素単位に参照ブロックを探索し、前記第1動きベクトル解像度と、前記第2動きベクトル解像度は、互いに異なる解像度であり、前記第1予測動きベクトル候補集合と、前記第2予測動きベクトル候補集合は、前記空間的候補ブロック及び時間的候補ブロックに含まれた候補ブロックのうち互いに異なる候補ブロックから獲得されることを特徴とする。
【0011】
前記予測部は、前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合を使用し、前記第1動きベクトル解像度の画素単位に参照ブロックを探索し、前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を使用し、前記第2動きベクトル解像度の画素単位に参照ブロックを探索し、前記第1動きベクトル解像度と、前記第2動きベクトル解像度は、互いに異なる解像度であり、前記第1予測動きベクトル候補集合と、前記第2予測動きベクトル候補集合は、互いに異なる個数の予測動きベクトル候補を含むことを特徴とする。
【0012】
前記符号化部は、前記現在ブロックの動きベクトルの解像度の画素単位が最小動きベクトル解像度の画素単位より大きい場合、前記残差動きベクトルを、前記現在ブロックの動きベクトルの解像度によってダウンスケーリング(down-scaling)して符号化することを特徴とする。
【0013】
前記現在ブロックが、映像を構成する現在符号化単位であり、符号化単位別に動きベクトル解像度が同一に決定され、前記現在符号化単位内にAMVP(advanced motion vector prediction)モードと予測された予測単位が存在すれば、前記符号化部は、前記現在ブロックの動きベクトル解像度を示す情報として、前記AMVPモードと予測された予測単位の動きベクトル解像度を示す情報を1回符号化することを特徴とする。
【0014】
前記現在ブロックが、映像を構成する現在符号化単位であり、予測単位別に動きベクトル解像度が同一に決定され、前記現在符号化単位内にAMVPモードと予測された予測単位が存在すれば、前記符号化部は、前記現在ブロックの動きベクトル解像度を示す情報として、前記現在ブロック内に存在するAMVPモードと予測された予測単位別に、動きベクトル解像度を示す情報を符号化することを特徴とする。
【0015】
一実施形態による動きベクトルの符号化装置において、現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得し、前記予測動きベクトル候補を使用し、前記現在ブロックの予測動きベクトル、前記現在ブロックの動きベクトル、及び前記現在ブロックの動きベクトル解像度を決定する予測部、及び前記現在ブロックの予測動きベクトルを示す情報、前記現在ブロックの動きベクトルと、前記現在ブロックの予測動きベクトルとの残差動きベクトル、及び前記現在ブロックの動きベクトル解像度を示す情報を符号化する符号化部を含み、前記予測部は、前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合を使用し、前記第1動きベクトル解像度の画素単位に参照ブロックを探索し、前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を使用し、前記第2動きベクトル解像度の画素単位に参照ブロックを探索し、前記第1動きベクトル解像度と、前記第2動きベクトル解像度は、互いに異なる解像度であり、前記第1予測動きベクトル候補集合と、前記第2予測動きベクトル候補集合は、前記空間的候補ブロック及び時間的候補ブロックに含まれる候補ブロックのうち互いに異なる候補ブロックから獲得されるか、あるいは互いに異なる個数の予測動きベクトル候補を含むことを特徴とする。
【0016】
一実施形態による動きベクトルの符号化装置において、現在ブロックに係わる少なくとも1つのマージ候補を含むマージ候補リスト(merge candidate list)を生成し、前記マージ候補リストに含まれたマージ候補のうち1つの候補の動きベクトルを利用し、前記現在ブロックの動きベクトルを決定して符号化し、前記マージ候補リストは、前記マージ候補リストに含まれた候補の動きベクトルを、所定の複数動きベクトル解像度によってダウンスケーリングした動きベクトルを含むことを特徴とする。
【0017】
前記ダウンスケーリングは、前記最小動きベクトル解像度の動きベクトルが示す画素の代わりに、前記最小動きベクトル解像度の動きベクトルが示す画素の周辺に位置した画素のうちいずれか1つの画素を、前記現在ブロックの動きベクトルの解像度に基づいて選択し、前記選択された画素を示すように調整することを特徴とする。
【0018】
一実施形態による動きベクトルの復号装置において、現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得し、前記予測動きベクトル候補のうち前記現在ブロックの予測動きベクトルを示す情報を獲得し、前記現在ブロックの動きベクトルと、前記現在ブロックの予測動きベクトルとの残差動きベクトル、及び前記現在ブロックの動きベクトル解像度を示す情報を獲得する獲得部、並びに前記残差動きベクトル、前記現在ブロックの予測動きベクトルを示す情報、及び前記現在ブロックの動きベクトル解像度情報に基づいて、前記現在ブロックの動きベクトルを復元する復号部を含み、前記所定の複数動きベクトル解像度は、1画素単位の解像度より大きい画素単位の解像度を含むことを特徴とする。
【0019】
前記所定の複数動きベクトル解像度の予測動きベクトル候補は、第1動きベクトル解像度の1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合、及び第2動きベクトル解像度の1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を含み、前記第1動きベクトル解像度と、前記第2動きベクトル解像度は、互いに異なる解像度であり、前記第1予測動きベクトル候補集合と、前記第2予測動きベクトル候補集合は、前記空間的候補ブロック及び時間的候補ブロックに含まれる候補ブロックのうち互いに異なる候補ブロックから獲得されるか、あるいは互いに異なる個数の予測動きベクトル候補を含むことを特徴とする。
【0020】
前記復号部は、前記現在ブロックの動きベクトルの解像度の画素単位が最小動きベクトル解像度の画素単位より大きい場合、前記残差動きベクトルを、前記最小動きベクトル解像度によってアップスケーリング(up-scaling)して復元することを特徴とする。
【0021】
前記現在ブロックが、映像を構成する現在符号化単位であり、符号化単位別に動きベクトル解像度が同一に決定され、前記現在符号化単位内にAMVPモードと予測された予測単位が存在すれば、前記獲得部は、前記ビットストリームから、前記現在ブロックの動きベクトル解像度を示す情報として、前記AMVPモードと予測された予測単位の動きベクトル解像度を示す情報を1回獲得することを特徴とする。
【0022】
一実施形態による動きベクトルの復号装置において、現在ブロックに係わる少なくとも1つのマージ候補を含むマージ候補リストを生成し、前記マージ候補リストに含まれたマージ候補のうち1つの候補の動きベクトルを利用し、前記現在ブロックの動きベクトルを決定して復号し、前記マージ候補リストは、前記マージ候補リストに含まれた候補の動きベクトルを、所定の複数動きベクトル解像度によってダウンスケーリングした動きベクトルを含むことを特徴とする。
【0023】
一実施形態による動きベクトルの復号装置において、現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得し、前記予測動きベクトル候補のうち前記現在ブロックの予測動きベクトルを示す情報を獲得し、前記現在ブロックの動きベクトルと、前記現在ブロックの予測動きベクトルとの残差動きベクトル、及び前記現在ブロックの動きベクトル解像度を示す情報を獲得する獲得部、並びに前記残差動きベクトル、前記現在ブロックの予測動きベクトルを示す情報、及び前記現在ブロックの動きベクトル解像度情報に基づいて、前記現在ブロックの動きベクトルを復元する復号部を含み、前記所定の複数動きベクトル解像度の予測動きベクトル候補は、第1動きベクトル解像度の1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合、及び第2動きベクトル解像度の1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を含み、前記第1動きベクトル解像度と、前記第2動きベクトル解像度は、互いに異なる解像度であり、前記第1予測動きベクトル候補集合と、前記第2予測動きベクトル候補集合は、前記空間的候補ブロック及び時間的候補ブロックに含まれた候補ブロックのうち互いに異なる候補ブロックから獲得されるか、あるいは互いに異なる個数の予測動きベクトル候補を含むことを特徴とする。
【0024】
一実施形態による前記動きベクトル復号方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読取り可能な記録媒体が提供される。
【0025】
以下、
図1Aないし
図7Bを参照し、一実施形態による、ビデオ符号化装置及びビデオ復号装置、並びにその方法のための動きベクトル解像度の符号化装置、復号装置、及びその方法が提案される。以下、ビデオ符号化装置及びその方法は、それぞれ後述する動きベクトル符号化装置及び動きベクトル符号化方法を含んでもよい。また、ビデオ復号装置及びその方法は、それぞれ後述する動きベクトル復号装置及び動きベクトル復号方法を含んでもよい。
【0026】
また、
図8ないし
図20を参照し、先に提案したビデオ符号化方法及びビデオ復号方法に適用可能な一実施形態による、ツリー構造の符号化単位に基づいたビデオ符号化技法及びビデオ復号技法が開示される。また、
図21ないし
図27を参照し、先に提案したビデオ符号化方法、ビデオ復号方法が適用可能な一実施形態が開示される。
【0027】
以下、「映像」は、ビデオの静止映像や動画、すなわち、ビデオそのものを示すことができる。
【0028】
以下、「サンプル」は、映像のサンプリング位置に割り当てられたデータであり、プロセッシング対象になるデータを意味する。例えば、空間領域の映像において、ピクセルがサンプルでもある。
【0029】
以下、「現在ブロック(current block)」は、符号化または復号する現在映像の符号化単位、または予測単位のブロックを意味する。
【0030】
明細書全体において、ある部分がある構成要素を「含む」としたり、ある構成要素において、「構成」されるとしたりするとき、それは、特別に反対となる記載がない限り、他の構成要素を除くものではなく、他の構成要素をさらに含んでもよいということを意味する。また、明細書で使用される「部」という用語は、ソフトウェア、FPGAまたはASICのようなハードウェア構成要素を意味し、「部」は、ある役割を行うことができる。しかし、「部」は、ソフトウェアまたはハードウェアに限定される意味ではない。「部」は、アドレッシングすることができる記録媒体にあるように構成されもするが、それ以上のプロセッサを再生させるように構成されもする。従って、一例として、「部」は、ソフトウェア構成要素、客体志向ソフトウェア構成要素、クラス構成要素及びタスク構成要素のような構成要素と、プロセス、関数、属性、プロシージャ、サブルーチン、プログラムコードのセグメント、ドライバ、ファームウエア、マイクロコード、回路、データ、データベース、データ構造、テーブル、アレイ及び変数を含む。構成要素及び「部」のうちから提供される機能は、さらに少数の構成要素及び「部」に結合されたり、さらなる構成要素及び「部」にさらに分離される。
【0031】
まず、
図1Aないし
図7Bを参照し、一実施形態よる、ビデオを符号化するための動きベクトルの符号化装置及びその方法、並びにビデオを復号するための動きベクトルの復号装置及びその方法が開示される。
【0032】
図1Aは、一実施形態による動きベクトル符号化装置10のブロック図を示す。
【0033】
ビデオ符号化においてインター予測は、現在映像と、他の映像との類似性を使用する予測方法を意味する。現在映像より先に復元された参照映像のうち、現在映像の現在領域と類似した参照領域が検出され、現在領域と参照領域との座標上の距離が動きベクトルでもって表現され、現在領域と参照領域とのピクセル値の差が残差(residual)データと表現される。従って、現在領域に対するインター予測によって、現在領域の映像情報を直接出力する代りに、参照映像を示すインデックス、動きベクトル及び残差データを出力し、符号化/復号の効率を向上させることができる。
【0034】
一実施形態による動きベクトル符号化装置10は、ビデオの各映像のブロック別に、インター予測を行うために使用される動きベクトルを符号化することができる。ブロックのタイプは、正方形または長方形でもあり、任意の幾何学的形態でもある。一定サイズのデータ単位に制限されるものではない。一実施形態によるブロックは、ツリー構造による符号化単位のうちでは、最大符号化単位、符号化単位、予測単位、変換単位などでもある。ツリー構造による符号化単位に基づいたビデオ符号化/復号方式は、
図8ないし
図20を参照して後述する。
【0035】
動きベクトル符号化装置10は、予測部11及び符号化部13を含んでもよい。
【0036】
一実施形態による動きベクトル符号化装置10は、ビデオそれぞれの映像ブロック別に、インター予測のための動きベクトルの符号化を行うことができる。
【0037】
動きベクトル符号化装置10は、動きベクトル予測(motion vector prediction)、ブロック併合(PU merging)またはAMVP(advanced motion vector prediction)のために、現在ブロックと異なるブロックの動きベクトルを参照し、現在ブロックの動きベクトルを決定することができる。
【0038】
一実施形態による動きベクトル符号化装置10は、現在ブロックに、時間的または空間的に隣接する他のブロックの動きベクトルを参照し、現在ブロックの動きベクトルを決定することができる。動きベクトル符号化装置10は、現在ブロックの動きベクトルの参照対象にもなる候補ブロックの動きベクトルを含む予測候補を決定することができる。動きベクトル符号化装置10は、予測候補のうちから選択された1つの動きベクトルを参照し、現在ブロックの動きベクトルを決定することができる。
【0039】
一実施形態による動きベクトル符号化装置10は、符号化単位(coding unit)から分割される予測の基本になる単位である予測単位(prediction unit)に分割し、動き推定(motion estimation)を介して、現在ピクチャと隣接した参照ピクチャにおいて、現在符号化単位と最も類似した予測ブロックを検索し、現在ブロックと予測ブロックとの動き情報を示す動きパラメータ(motion parameter)を決定することができる。
【0040】
一実施形態による予測単位は、符号化単位から分割が始まり、四分木形態に分割されずに1回だけ分割される。例えば、1つの符号化単位が複数個の予測単位に分割され、分割によって生成された予測単位は、さらに追加して分割されない。
【0041】
動きベクトル符号化装置10は、動き推定のために、参照ピクチャの解像度を横方向に最大n倍(nは整数)まで、縦方向に最大n倍拡大し、1/n画素位置の正確度で、現在ブロックの動きベクトルを決定することができる。その場合、nを、ピクチャの最小動きベクトル解像度という。
【0042】
例えば、最小動きベクトル解像度の画素単位が1/4画素である場合、動きベクトル符号化装置10は、ピクチャの解像度を縦横方向に4倍拡大し、最大1/4画素位置の正確度の動きベクトルを決定することができる。ただし、映像の特性によって、1/4画素単位で動きベクトルを決定するのが十分ではない場合もあり、反対に、1/4画素単位で動きベクトルを決定するのが、1/2画素位置の動きベクトルを決定するより非効率的でもある。従って、一実施形態による動きベクトル符号化装置10は、現在ブロックの動きベクトルの解像度を適応的に決定し、決定された予測動きベクトル、実際動きベクトル、動きベクトル解像度を符号化することができる。
【0043】
一実施形態による予測部11は、動きベクトル予測候補のうち一つを使用し、現在ブロックのインター予測のための最適の動きベクトルを決定することができる。
【0044】
予測部11は、現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得し、予測動きベクトル候補を使用し、現在ブロックの予測動きベクトル、現在ブロックの動きベクトル、及び現在ブロックの動きベクトル解像度を決定することができる。空間的候補ブロックは、現在ブロックと空間的に隣接した周辺ブロックを少なくとも一つ含んでもよい。また、時間的候補ブロックは、現在ブロックのPOC(picture order count)と異なるPOCを有する参照ピクチャ内において、現在ブロックと同一のところに位置したブロックと、該同一位置のブロックと空間的に隣接した周辺ブロックとを少なくとも一つ含んでもよい。一実施形態による予測部11は、少なくとも1つの予測動きベクトル候補をそのままコピーするか、組み合わせるか、あるいは変形し、現在ブロックの動きベクトルを決定することができる。
【0045】
予測部11は、予測動きベクトル候補を使用し、現在ブロックの予測動きベクトル、現在ブロックの動きベクトル、及び現在ブロックの動きベクトル解像度を決定することができる。所定の複数動きベクトル解像度は、1画素単位の解像度より大きい画素単位の解像度を含んでもよい。すなわち、所定の複数動きベクトル解像度は、2画素単位、3画素単位、4画素単位などの解像度を含んでもよい。しかし、所定の複数動きベクトル解像度は、必ずしも1画素単位以上の解像度を含むものではなく、1画素単位以下の解像度だけでも構成される。
【0046】
予測部11は、予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合(set)を使用し、第1動きベクトル解像度の画素単位に参照ブロックを探索し、予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を使用し、前記第2動きベクトル解像度の画素単位に参照ブロックを探索することができる。第1動きベクトル解像度と第2動きベクトル解像度は、互いに異なる解像度でもある。第1予測動きベクトル候補集合と第2予測動きベクトル候補集合は、空間的候補ブロック及び時間的候補ブロックに含まれた候補ブロックのうち互いに異なる候補ブロックから獲得される。第1予測動きベクトル候補集合と第2予測動きベクトル候補集合は、互いに異なる個数の予測動きベクトル候補を含んでもよい。
【0047】
予測部11が所定の複数動きベクトル解像度の予測動きベクトル候補を使用し、現在ブロックの予測動きベクトル、現在ブロックの動きベクトル、及び現在ブロックの動きベクトル解像度を決定する方法は、
図4Bを参照して後述する。
【0048】
符号化部13は、現在ブロックの予測動きベクトルを示す情報、現在ブロックの動きベクトルと、現在ブロックの予測動きベクトルとの残差動きベクトル、及び現在ブロックの動きベクトル解像度を示す情報を符号化することができる。符号化部13は、実際動きベクトルと予測動きベクトルとの残差動きベクトルを使用し、さらに少ないビットを使用し、現在ブロックの動きベクトルを符号化することができるので、映像符号化の圧縮率を向上させることができる。符号化部13は、後述するように、現在ブロックの動きベクトル解像度を示すインデックスを符号化することができる。また、符号化部13は、最小動きベクトル解像度と、現在ブロックの動きベクトル解像度との差に基づいて、残差動きベクトルをダウンスケーリング(down-scaling)し、符号化することができる。
【0049】
図1Bは、一実施形態による動きベクトル符号化方法のフローチャートを示す。
【0050】
段階12において、一実施形態による動きベクトル符号化装置10は、現在ブロックの空間的候補ブロック及び時間的候補ブロックの動きベクトルを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得することができる。所定の複数動きベクトル解像度は、1画素単位の解像度より大きい画素単位の解像度を含んでもよい。
【0051】
段階14において、一実施形態による動きベクトル符号化装置10は、段階12で獲得した予測動きベクトル候補を使用し、現在ブロックの予測動きベクトル、現在ブロックの動きベクトル、及び現在ブロックの動きベクトル解像度を決定することができる。
【0052】
段階16において、一実施形態による動きベクトル符号化装置10は、段階14で決定された、予測動きベクトルを示す情報、現在ブロックの動きベクトルと、現在ブロックの予測動きベクトルとの残差動きベクトル、及び現在ブロックの動きベクトル解像度を示す情報を符号化することができる。
【0053】
図2Aは、一実施形態による動きベクトル復号装置のブロック図を示す。
【0054】
動きベクトル復号装置20は、受信されたビットストリームをパージングし、現在ブロックのインター予測を行うための動きベクトルを決定することができる。
【0055】
獲得部21は、現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得することができる。空間的候補ブロックは、現在ブロックと空間的に隣接した周辺ブロックを少なくとも一つ含んでもよい。また、時間的候補ブロックは、現在ブロックのPOCと異なるPOCを有する参照ピクチャ内において、現在ブロックと同一のところに位置したブロックと、該同一位置のブロックと空間的に隣接した周辺ブロックとを少なくとも一つ含んでもよい。所定の複数動きベクトル解像度は、1画素単位の解像度より大きい画素単位の解像度を含んでもよい。すなわち、所定の複数動きベクトル解像度は、2画素単位、3画素単位、4画素単位などの解像度を含んでもよい。しかし、所定の複数動きベクトル解像度は、必ずしも1画素単位以上の解像度を含むものではなく、1画素単位以下の解像度だけでも構成される。
【0056】
所定の複数動きベクトル解像度の予測動きベクトル候補は、第1動きベクトル解像度の1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合(set)、及び第2動きベクトル解像度の1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を含んでもよい。第1動きベクトル解像度と第2動きベクトル解像度は、互いに異なる解像度である。第1予測動きベクトル候補集合と第2予測動きベクトル候補集合は、空間的候補ブロック及び時間的候補ブロックに含まれる候補ブロックのうち互いに異なる候補ブロックから獲得される。また、第1予測動きベクトル候補集合と第2予測動きベクトル候補集合は、互いに異なる個数の予測動きベクトル候補を含んでもよい。
【0057】
獲得部21は、受信されたビットストリームから、予測動きベクトル候補のうち現在ブロックの予測動きベクトルを示す情報を獲得し、現在ブロックの動きベクトルと、現在ブロックの予測動きベクトルとの残差動きベクトル、及び現在ブロックの動きベクトル解像度に係わる情報を獲得することができる。
【0058】
復号部23は、獲得部21で獲得した残差動きベクトル、現在ブロックの予測動きベクトルを示す情報、及び現在ブロックの動きベクトル解像度情報に基づいて、現在ブロックの動きベクトルを復元することができる。復号部23は、最小動きベクトル解像度と、現在ブロックの動きベクトル解像度との差に基づいて、受信された残差動きベクトルに係わるデータをアップスケーリングして復元することができる。
【0059】
図5Aないし5Dを参照し、多様な実施形態による動きベクトル復号装置20が、受信されたビットストリームをパージングし、現在ブロックに係わる動きベクトル解像度を獲得する方法が後述される。
【0060】
図2Bは、一実施形態による動きベクトル復号方法のフローチャートを示す。
【0061】
段階22において、一実施形態による動きベクトル復号装置20は、現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得することができる。
【0062】
段階24において、一実施形態による動きベクトル復号装置20は、ビットストリームから、予測動きベクトル候補のうち現在ブロックの予測動きベクトルを示す情報を獲得し、現在ブロックの動きベクトルと、現在ブロックの予測動きベクトルとの残差動きベクトル、及び現在ブロックの動きベクトル解像度を示す情報を獲得することができる。所定の複数動きベクトル解像度は、1画素単位の解像度より大きい画素単位の解像度を含んでもよい。
【0063】
段階26において、一実施形態による動きベクトル復号装置20は、段階24で獲得した残差動きベクトル、現在ブロックの予測動きベクトルを示す情報、及び現在ブロックの動きベクトル解像度情報に基づいて、現在ブロックの動きベクトルを復元することができる。
【0064】
図3Aは、多様な解像度に基づいて動き補償を行うための補間を示す。
【0065】
動きベクトル符号化装置10は、現在ブロックをインター予測するための所定の複数動きベクトルの解像度の動きベクトルを決定することができる。所定の複数動きベクトルの解像度は、2k画素単位(kは整数)の解像度を含んでもよい。もしkが0より大きい場合には、動きベクトルは、参照映像内の一部画素だけ示すことができ、kが0より小さい場合には、nタップ(nは整数)のFIRフィルタ(finite impulse response filter)を利用して補間を行い、副画素単位の画素を生成し、生成された副画素単位の画素を示すことができる。例えば、動きベクトル符号化装置10は、最小動きベクトル解像度を1/4画素単位と決定し、所定の複数動きベクトルの解像度を1/4,1/2,1及び2画素単位と決定することができる。
【0066】
例えば、nタップFIRフィルタを利用して補間を行い、1/2画素単位の副画素(aないしl)を生成することができる。縦方向の1/2副画素について述べれば、整数画素単位のA1、A2、A3、A4、A5及びA6を利用して補間を行い、副画素aを生成し、整数画素単位のB1、B2、B3、B4、B5及びB6を利用して補間を行い、副画素bを生成することができる。同一方法で、副画素c,d,e及びfを生成することができる。
【0067】
横方向の副画素の画素値は、次のように計算される。例えば、a=(A1-5×A2+20×A3+20×A4-5×A5+A6)/32、b=(B1-5×B2+20×B3+20×B4-5×B5+B6)/32のように計算される。副画素c,d,e及びfの画素値も、同一方法によって計算される。
【0068】
横方向の副画素と同様に、縦方向の副画素も、6タップFIRフィルタを利用して補間を行い、生成することができる。A1、B1、C1、D1、E1及びF1を利用して副画素gを生成し、A2、B2、C2、D2、E2及びF2を利用し、副画素hを生成することができる。
【0069】
縦方向の副画素の画素値も、横方向の副画素の画素値と同一の方法によって計算される。例えば、g=(A1-5×B1+20×C1+20×D1-5×E1+F1)/32のように計算することができる。
【0070】
対角方向の1/2画素単位副画素mは、他の1/2画素単位副画素を利用して補間される。言い換えれば、副画素mの画素値は、m=(a-5×b+20×c+20×d-5×e+f)/32のように計算される。
【0071】
1/2画素単位の副画素を生成すれば、整数画素単位の画素と、1/2画素単位の副画素とを利用し、1/4画素単位の副画素を生成することができる。隣接した2個画素を利用して補間を行い、1/4画素単位の副画素を生成することができる。または、1/4画素単位の副画素は1/2画素単位の副画素値を利用せず、整数画素単位の画素値に直接補間フィルタを適用して生成される。
【0072】
前述の補間フィルタは、6タップフィルタを例として挙げて記載したが、動きベクトル符号化装置10は、他のタップ数を有するフィルタを使用し、ピクチャを補間することができる。例えば、補間フィルタは、4タップ、7タップ、8タップ、12タップフィルタを含んでもよい。
【0073】
図3Aに図示されているように、参照ピクチャに対して補間を行い、1/2画素単位の副画素、及び1/4画素単位の副画素が生成されれば、補間された参照ピクチャと、現在ブロックと比較し、SAD(sum of absolute difference)または率・歪曲(rate-distortion)コストが最小であるブロックを1/4画素単位に探索し、1/4画素単位の解像度を有する動きベクトルが決定される。
【0074】
図3Bは、最小動きベクトル解像度が1/4画素単位である場合、1/4画素、1/2画素、1画素及び2画素単位の動きベクトル解像度を示す。
図3Bの(a)、(b)、(c)、(d)は、それぞれ座標(0,0)を基準に、1/4画素、1/2画素、1画素及び2画素単位の解像度の動きベクトルが示すことができる画素の座標(黒色四角形で表示)を示す。
【0075】
一実施形態による動きベクトル符号化装置10は、副画素単位で動き補償を行うために、整数画素位置で決定された動きベクトルを基準に、副画素単位に基づいて、参照ピクチャ内で、現在ブロックと類似したブロックを検索することができる。
【0076】
例えば、動きベクトル符号化装置10は、整数画素位置で動きベクトルを決定し、参照ピクチャの解像度を2倍に拡大し、整数画素位置で決定された動きベクトルを基準に、(-1,-1)~(1,1)範囲で最も類似した予測ブロックを検索することができる。次に、さらに解像度を2倍に拡大し、4倍の解像度で、1/2画素位置の動きベクトルを基準に、(-1,-1)~(1,1)範囲で最も類似した予測ブロックを検索することにより、最終的な1/4画素の解像度での動きベクトルを決定することができる。
【0077】
例えば、整数画素位置の動きベクトルが、座標(0,0)を基準に、(-4,-3)である場合、1/2画素の解像度においては、動きベクトルが(-8,-6)になり、もし(0,-1)ほど動くなら、1/2画素の解像度の動きベクトルは、最終的に(-8,-7)と決定される。また、1/4画素の解像度での動きベクトルは、(-16,-14)に変更され、さらに(-1,0)ほど動くなら、1/4画素の解像度の最終的な動きベクトルは、(-17,-14)に決定される。
【0078】
一実施形態による動きベクトル符号化装置10は、1画素単位より大きい画素単位で動き補償を行うために、整数画素位置で決定された動きベクトルを基準に、1画素位置より大きい画素位置に基づいて、参照ピクチャ内で、現在ブロックと類似したブロックを検索することができる。以下、1画素位置より大きい画素位置(例えば、2画素、3画素、4画素)をスーパー画素(super pixel)という。
【0079】
例えば、整数画素位置の動きベクトルが、座標(0,0)を基準に、(-4,-8)である場合、2画素の解像度においては、動きベクトルが(-2,-4)と決定される。1/4画素単位の動きベクトルを符号化するためには、整数画素単位の動きベクトルに比べ、多くのビットが消耗されるが、1/4画素単位の正確なインター予測を行うことができ、残差ブロック符号化に消耗されるビット数を減らすことができる。
【0080】
しかし、1/4画素単位よりさらに小さい画素単位、例えば、1/8画素単位で補間を行い、副画素を生成し、それに基づいて1/8画素単位の動きベクトルを推定すれば、動きベクトルの符号化に過度に多くのビットが消耗され、むしろ符号化の圧縮率が低下する。
【0081】
また、映像に多くのノイズが存在するか、あるいはテクスチャが少ないときには、解像度をスーパー画素単位で設定して動き推定を行い、符号化の圧縮率を向上させることができる。
【0082】
図4Aは、予測動きベクトル候補を獲得するための現在ブロックの候補ブロックを示す。
【0083】
予測部11は、符号化される現在ブロックの参照ピクチャに対して、現在ブロックに係わる動き予測を行うために、現在ブロックの1以上の予測動きベクトルの候補を獲得することができる。予測部11は、予測動きベクトルの候補を獲得するために、現在ブロックの空間的候補ブロックと時間的候補ブロックとのうち少なくとも一つを獲得することができる。
【0084】
現在ブロックが、異なるPOCを有する参照フレームを参照して予測された場合、予測部11は、現在ブロックの周辺に位置したブロック、現在ブロックと時間的に異なる(異なるPOCの)参照フレームに属した同一位置ブロック(co-located block)、及び該同一位置ブロックの周辺ブロックを使用し、予測動きベクトル候補を獲得することができる。
【0085】
例えば、空間的候補ブロックは、現在ブロック410の隣接ブロックである左側ブロックA1 411、上端ブロックB1 412、左側上端ブロックB2 413、右側上端ブロックB0 414及び左側下端ブロックA0 425のうち少なくとも一つを含んでもよい。時間的候補ブロックは、現在ブロックと異なるPOCを有する参照フレームに属した同一位置ブロック430、及び同一位置ブロック430の隣接ブロックH 431のうち少なくとも一つを含んでもよい。動きベクトル符号化装置10は、時間的候補ブロック及び空間的候補ブロックの動きベクトルを、予測動きベクトル候補として獲得することができる。
【0086】
予測部11は、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得することができる。各予測動きベクトル候補は、互いに異なる解像度を有することができる。すなわち、予測部11は、予測動きベクトル候補のうち第1予測動きベクトル候補を使用し、第1動きベクトル解像度の画素単位に参照ブロックを探索し、第2予測動きベクトル候補を使用し、第2動きベクトル解像度の画素単位に参照ブロックを探索することができる。第1予測動きベクトル候補と第2予測動きベクトル候補は、空間的候補ブロック及び時間的候補ブロックに属するブロックのうち互いに異なるブロックを使用して獲得される。
【0087】
予測部11は、動きベクトルの解像度によって、候補ブロックの集合(すなわち、予測動きベクトル候補の集合)の個数及び種類を異なるように決定することができる。
【0088】
例えば、最小動きベクトル解像度が1/4画素であり、所定の複数動きベクトル解像度として、1/4画素,1/2画素,1画素及び2画素単位を使用する場合、予測部11は、各解像度ごとに、所定個数の予測動きベクトル候補を生成することができる。各解像度の予測動きベクトル候補は、互いに異なる候補ブロックの動きベクトルでもある。予測部11は、各解像度ごとに互いに異なる候補ブロックを使用し、予測動きベクトル候補を獲得することにより、最適の参照ブロックを検索することができる確率を高め、率・歪曲コストを低下させることにより、符号化効率を向上させることができる。
【0089】
現在ブロックの動きベクトルを決定するために、予測部11は、各予測動きベクトル候補を利用し、参照ピクチャ内の探索開始位置と決定し、各予測動きベクトル候補の解像度に基づいて、最適の参照ブロックを探索することができる。すなわち、現在ブロックの予測動きベクトル候補が獲得されれば、動きベクトル符号化装置10は、各予測動きベクトル候補に該当する所定解像度の画素単位に参照ブロックを探索し、現在ブロックの動きベクトルと各予測動きベクトルとの差値に基づいた率・歪曲コストを比較し、最小コストを有する予測動きベクトルを決定することができる。
【0090】
符号化部13は、決定された1つの予測動きベクトルと、現在ブロックの実際動きベクトルとの差ベクトルである残差動きベクトル、及び現在ブロックのインター予測のために使われた動きベクトル解像度を示す情報を符号化することができる。
【0091】
符号化部13は、残差動きベクトルを、数式(1)のように決定して符号化することができる。MVxは、現在ブロックの実際動きベクトルのx成分であり、MVyは、現在ブロックの実際動きベクトルのy成分である。pMVxは、現在ブロックの予測動きベクトルのx成分であり、pMVyは、現在ブロックの予測動きベクトルのy成分である。MVDxは、現在ブロックの残差動きベクトルのx成分であり、MVDyは、現在ブロックの残差動きベクトルのy成分である。
【0092】
MVDx=MVx-pMVx
MVDy=MVy-pMVy (1)
復号部23は、ビットストリームから獲得された予測動きベクトルを示す情報と、残差動きベクトルとを使用し、現在ブロックの動きベクトルを復元することができる。復号部23は、数式(2)のように、予測動きベクトルと残差動きベクトルとを合算することにより、最終動きベクトルを決定することができる。
【0093】
MVx=pMVx+MVDx
MVy=pMCy+MVDy (2)
動きベクトル符号化装置10は、最小動きベクトル解像度が副画素単位であるならば、予測動きベクトルと実際の動きベクトルとに整数値を乗じ、整数値で動きベクトルを示すことができる。もし座標(0,0)で出発した1/4画素単位の解像度の予測動きベクトルが、座標が1/2,3/2)を示し、最小動きベクトル解像度が、1/4画素単位であるならば、動きベクトル符号化装置10は、予測動きベクトルに整数4を乗じた値であるベクトル(2,6)を予測動きベクトルとして符号化することができる。もし最小動きベクトル解像度が1/8画素単位であるならば、予測動きベクトルに整数8を乗じ、ベクトル(4,12)を予測動きベクトルとして符号化することができる。
【0094】
図4Bは、一実施形態による予測動きベクトル候補の生成過程を示す。
【0095】
前述のところのように、予測部11は、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得することができる。
【0096】
例えば、最小動きベクトル解像度が1/4画素であり、所定の複数動きベクトル解像度が、1/4画素、1/2画素、1画素及び2画素を含む場合、予測部11は、各解像度ごとに、所定個数の予測動きベクトル候補を生成することができる。予測部11は、所定の複数動きベクトル解像度によって、予測動きベクトル候補の集合460,470,480,490をそれぞれ異なるように構成することができる。各集合460,470,490,490は、互いに異なる候補ブロックから持ってきた予測動きベクトルを含んでもよく、互いに異なる個数の予測動きベクトルを含んでもよい。予測部11は、各解像度ごとに、互いに異なる候補ブロックを使用することにより、最適の予測ブロックを検索することができる確率を高め、率・歪曲コストを低下させることにより、符号化効率を向上させることができる。
【0097】
1/4画素単位の解像度の予測動きベクトル候補460は、2つの互いに異なる時間的または空間的な候補ブロックから決定される。例えば、予測部11は、現在ブロックの左側ブロック411の動きベクトルと、上端ブロック412の動きベクトルとを1/4画素の予測動きベクトル候補460として獲得し、各予測動きベクトル候補別に最適の動きベクトルを探索することができる。すなわち、予測部11は、現在ブロックの左側ブロック411の動きベクトルを利用して探索開始位置を決定し、1/4画素単位に参照ブロックを探索し、最適の予測動きベクトルと、参照ブロックとを決定することができる。また、予測部11は、上端ブロック412の動きベクトルを利用して探索開始位置を決定し、1/4画素単位に参照ブロックを探索し、他の最適の予測動きベクトルと参照ブロックとを決定することができる。
【0098】
1/2画素単位の解像度の予測動きベクトル候補470は、1つの時間的または空間的な候補ブロックから決定される。1/2画素単位の解像度の予測動きベクトル候補は、1/4画素単位の解像度の予測動きベクトル候補と異なる予測動きベクトルでもある。例えば、予測部11は、現在ブロックの右側上端ブロック414の動きベクトルを、1/2画素の予測動きベクトル候補470として獲得することができる。すなわち、予測部11は、右側上端ブロック414の動きベクトルを利用して探索開始位置を決定し、1/2画素単位に参照ブロックを探索し、他の最適の予測動きベクトルと参照ブロックとを決定することができる。
【0099】
1画素単位の解像度の予測動きベクトル候補480は、1つの時間的または空間的な候補ブロックから決定される。1画素単位の解像度の予測動きベクトルは、1/4画素単位の解像度と1/2画素単位との解像度において使用した予測動きベクトル460,470と異なる予測動きベクトルでもある。例えば、予測部11は、時間的候補ブロック430の動きベクトルを、1画素の予測動きベクトル候補480として決定することができる。すなわち、予測部11は、時間的候補ブロック430の動きベクトルを利用して探索開始位置を決定し、1画素単位に参照ブロックを探索し、他の最適の予測動きベクトルと参照ブロックとを決定することができる。
【0100】
2画素単位の解像度の予測動きベクトル候補490は、1つの時間的または空間的な候補ブロックから決定される。2画素単位の解像度の予測動きベクトルは、他の解像度において使用した予測動きベクトルと異なる予測動きベクトルでもある。例えば、予測部11は、左側下端ブロック425の動きベクトルを2画素の予測動きベクトル490として決定することができる。すなわち、予測部11は、左側下端ブロック425の動きベクトルを利用して探索開始位置を決定し、2画素単位に参照ブロックを探索し、他の最適の予測動きベクトルと参照ブロックとを決定することができる。
【0101】
予測部11は、現在ブロックの動きベクトルと、各予測動きベクトルとに基づいた率・歪曲コストを比較し、最終的に現在ブロックの動きベクトル、1つの予測動きベクトル、及び1つの動きベクトル解像度495を決定することができる。
【0102】
動きベクトル符号化装置10は、現在ブロックの動きベクトルの解像度の画素単位が最小動きベクトル解像度の画素単位より大きい場合、残差動きベクトルを、前記現在ブロックの動きベクトルの解像度によってダウンスケーリングし、符号化することができる。また、動きベクトル復号装置20は、現在ブロックの動きベクトルの解像度の画素単位が最小動きベクトル解像度の画素単位より大きい場合、残差動きベクトルを、前記最小動きベクトル解像度によってアップスケーリングし、復元することができる。
【0103】
符号化部13は、最小動きベクトル解像度が1/4画素単位であり、現在ブロックの動きベクトル解像度が1/2画素単位の解像度と決定される場合、残差動きベクトルの大きさを小さくするために、決定された実際動きベクトルと予測動きベクトルとを1/2画素単位に調整することにより、残差動きベクトルを計算することができる。
【0104】
符号化部13は、実際動きベクトルと予測動きベクトルとの大きさを半分に減少させ、残差動きベクトルの大きさも半分に減少させることができる。すなわち、最小動きベクトル解像度が1/4画素単位である場合、4で乗じて表現された予測動きベクトル(MVx,MVy)をさらに2で割り、予測動きベクトルを表現することができる。例えば、最小動きベクトル解像度が、1/4画素単位であり、予測動きベクトルが(-24,-16)である場合、1/2画素単位の解像度の動きベクトルは、(-12,-8)になり、2画素単位の解像度の動きベクトルは、(-3,-2)になる。下記数式(3)は、ビットシフト(bit shift)演算を使用し、実際動きベクトル(MVx,MVy)と予測動きベクトル(pMVx,pMCy)との大きさを半分に減少させる過程を示す。
【0105】
MVDx=(MVx)>>1-(pMVx)>>1
MVDy=(MVy)>>1-(pMCy)>>1 (3)
復号部23は、最終的に決定された予測動きベクトル(pMVx,pMCy)に、受信された残差動きベクトル(MVDx,MVDy)を合算することにより、数式(4)のように、現在ブロックに係わる最終動きベクトル(MVx,MVy)を決定することができる。復号部23は、数式(4)のように獲得された予測動きベクトルと、残差動きベクトルとをビットシフト演算を使用してアップスケーリングし、現在ブロックに係わる動きベクトルを復元することができる。
【0106】
MVx=(pMVx)<<1+(MVDx)<<1
MVy=(pMCy)<<1+(MVDy)<<1 (4)
一実施形態による符号化部13は、もし最小動きベクトル解像度が1/2n画素であり、現在ブロックに対して、2k画素単位の解像度の動きベクトルが決定される場合、以下のような数式(5)を使用し、残差動きベクトルを決定することができる。
【0107】
MVDx=(MVx)>>(k+n)-(pMVx)>>(k+n)
MVDy=(MVy)>>(k+n)-(pMCy)>>(k+n) (5)
復号部23は、最終的に決定された予測動きベクトルに、受信された残差動きベクトルを合算することにより、数式(6)のように、現在ブロックの最終動きベクトルを決定することができる。
【0108】
MVx=(pMVx)<<(k+n)+(MVDx)<<(k+n)
MVy=(pMCy)<<(k+n)+(MVDy)<<(k+n) (6)
残差動きベクトルの大きさが減少すれば、残差動きベクトルを表現するビット数が減少し、符号化効率が向上する。
【0109】
図3A及び
図3Bを参照して説明したように、2
k画素単位の動きベクトルにおいて、kが0より小さい場合、参照ピクチャは、整数ではない位置のピクセルを生成するために補間を行う。反対に、kが0より大きい動きベクトルである場合、参照ピクチャにおいて、全ての画素ではない2
k倍数の位置に存在する画素だけ探索する。従って、復号部23は、現在ブロックの動きベクトル解像度が1画素単位より大きいか、あるいはそれと同じ場合、復号する現在ブロックの動きベクトルの解像度によって、参照ピクチャの補間遂行を省略することができる。
【0110】
図5Aは、一実施形態による、符号化単位及び予測単位を示す。
【0111】
現在ブロックが、映像を構成する現在符号化単位であり、符号化単位別に、インター予測のための動きベクトル解像度が同一に決定され、現在符号化単位内に、AMVPモードと予測された予測単位が1以上存在すれば、符号化部13は、現在ブロックの動きベクトル解像度を示す情報として、AMVPモードと予測された予測単位の動きベクトル解像度を示す情報を1回だけ符号化し、動きベクトル復号装置20に伝送することができる。獲得部21は、ビットストリームから、現在ブロックの動きベクトル解像度を示す情報として、AMVPモードと予測された予測単位の動きベクトル解像度を示す情報を1回だけ獲得することができる。
【0112】
図5Bは、適応的に決定された動きベクトル解像度を伝送するための一実施形態によるprediction_unitシンタックスの一部を示す。
図5Bは、一実施形態による動きベクトル復号装置20が、現在ブロックの動きベクトル解像度を示す情報を獲得する動作を定義するシンタックスである。
【0113】
例えば、
図5Aに図示されているように、現在符号化単位560が、2Nx2Nサイズであり、予測単位563が、符号化単位560と同一サイズ(2Nx2N)であり、AMVPモードを使用して予測された場合、符号化部13は、現在符号化単位560に対して、符号化単位560の動きベクトル解像度を示す情報を1回符号化し、獲得部21は、符号化単位560の動きベクトル解像度を示す情報を、ビットストリームから1回獲得することができる。
【0114】
現在符号化単位570の大きさが2Nx2Nであり、2NxNサイズの2つの予測単位573,577に分割された場合、予測単位573は、マージモードと予測されたので、符号化部13は、予測単位573に係わる動きベクトル解像度を示す情報を伝送せず、予測単位577は、AMVPモードと予測されたので、符号化部13は、予測単位573に係わる動きベクトル解像度を示す情報を1回伝送し、獲得部21は、予測単位577に係わる動きベクトル解像度を示す情報をビットストリームから1回獲得することができる。すなわち、符号化部13は、現在符号化単位570の動きベクトル解像度を示す情報として、予測単位577に係わる動きベクトル解像度を示す情報を1回伝送し、復号部23は、現在符号化単位570の動きベクトル解像度を示す情報として、予測単位577に係わる動きベクトル解像度を示す情報を1回受信することができる。動きベクトル解像度を示す情報は、「cu_resolution_idx[x0][y0]」のように、所定の複数動きベクトルのうちいずれか一つを示すインデックスの形態にもなる。
【0115】
図5Bのシンタックスを参照すれば、現在符号化単位に対して、動きベクトル解像度が抽出されたか否かということを示す情報である「parsedMVResolution 510」と、現在符号化単位の動きベクトル解像度を示す情報である「mv_resolution_idx 512」との初期値をそれぞれ0に設定することができる。まず、予測単位573の場合、マージモードと予測されたので、条件513を満足しないので、獲得部21は、現在予測単位の動きベクトル解像度を示す情報「cu_resolution_idx[x0][y0]」を受信しない。
【0116】
予測単位577の場合、AMVPモードと予測されたので、条件513を満足し、「parsedMVResolution」が0の値であるので、条件514を満足し、獲得部21は、「cu_resolution_idx[x0][y0]516」を受信することができる。「cu_resolution_idx[x0][y0]」を受信したので、「parsedMVResolution」を1に設定する(518)。「mv_resolution_idx」に受信した「cu_resolution_idx[x0][y0]」を保存する(520)。
【0117】
現在符号化単位580の大きさが2Nx2Nであり、2NxNサイズの2つの予測単位583,587に分割されたし予測単位583と、予測単位587とがいずれもAMVPモードと予測された場合、符号化部13は、現在符号化単位580の動きベクトル解像度を示す情報を1回符号化して伝送し、獲得部21は、符号化単位580の動きベクトル解像度を示す情報をビットストリームから1回受信することができる。
【0118】
図5Bのシンタックスを参照すれば、予測単位583の場合、条件513を満足し、「parsedMVResolution」が0の値であるので、条件514を満足し、獲得部21は、「cu_resolution_idx[x0][y0]516」を獲得することができる。復号部23は、「cu_resolution_idx[x0][y0]」を獲得したので、「parsedMVResolution」を1に設定し(518)、「mv_resolution_idx」に獲得した「cu_resolution_idx[x0][y0]」を保存する(520)。ただし、予測単位587の場合、すでに「parsedMVResolution」が1の値を有するので、条件文514を満足することができないので、獲得部21は、「cu_resolution_idx[x0][y0]516」を獲得しない。すなわち、獲得部21は、現在符号化単位580に係わる動きベクトル解像度を示す情報を、予測単位583からすでに受信したので、予測単位587からは、動きベクトル解像度を示す情報(予測単位583の動きベクトル解像度と同じ)を獲得する必要がない。
【0119】
現在符号化単位590の大きさが2Nx2Nであり、2NxNサイズの2つの予測単位593,597に分割され、予測単位593と予測単位597とがいずれもマージモードと予測された場合には、条件文513を満足しないので、獲得部21は、現在符号化単位590に対して、動きベクトル解像度を示す情報を獲得しない。
【0120】
他の実施形態による符号化部13は、現在ブロックが、映像を構成する現在符号化単位であり、予測単位別に、インター予測のための動きベクトル解像度が同一に決定され、現在符号化単位内に、AMVPモードと予測された予測単位が1以上存在すれば、符号化部13は、現在ブロックの動きベクトル解像度を示す情報として、現在ブロック内に存在するAMVPモードと予測された予測単位別に、動きベクトル解像度を示す情報を、動きベクトル復号装置20に伝送することができる。獲得部21は、ビットストリームから、現在ブロックの動きベクトル解像度を示す情報として、現在ブロック内に存在する各予測単位別に、動きベクトル解像度を示す情報を獲得することができる。
【0121】
図5Cは、適応的に決定された動きベクトル解像度を伝送するための他の実施形態によるprediction_unitシンタックスの一部を示す。
図5Cは、他の実施形態による動きベクトル復号装置20が、現在ブロックの動きベクトル解像度を示す情報を獲得する動作を定義するシンタックスである。
【0122】
図5Cのシンタックスが、
図5Bのシンタックスと異なるところは、現在符号化単位に対して、動きベクトル解像度が抽出されたか否かということを示す「parsedMVResolution 510」が存在しないので、獲得部21は、現在符号化単位内に存在する予測単位別に、動きベクトル解像度を示す情報「cu_resolution_idx[x0,y0]」を獲得する(524)というところである。
【0123】
例えば、
図5Aを再び参照すれば、現在符号化単位580の大きさが2Nx2Nであり、2NxNサイズの2つの予測単位583,587に分割され、予測単位583と予測単位587は、いずれもAMVPモードと予測され、予測単位583の動きベクトル解像度が1/4画素であり、予測単位587の動きベクトル解像度が2画素である場合、獲得部21は、1つの符号化単位580に対して、2つの動きベクトル解像度(すなわち、予測単位583)の動きベクトル解像度1/2と、予測単位587の動きベクトル解像度1/4よを示す情報を獲得する(524)。
【0124】
他の実施形態による符号化部13は、予測単位の予測モードに係わりなく、現在予測単位に対して適応的に動きベクトル解像度を決定する場合、動きベクトル解像度を示す情報を予測モードと係わりなく、予測単位別に符号化して伝送し、獲得部11は、動きベクトル解像度を示す情報を、ビットストリームから予測モードと係わりなく、予測単位別に獲得することができる。
【0125】
図5Dは、適応的に決定された動きベクトル解像度を伝送するための他の実施形態によるprediction_unitシンタックスの一部を示す。
図5Dは、他の実施形態による動きベクトル復号装置20が、現在ブロックの動きベクトル解像度を示す情報を獲得する動作を定義するシンタックスである。
【0126】
図5B及び
図5Cで説明したシンタックスは、適応的動きベクトル解像度決定方法が、予測モードがAMVPモードである場合に限って適用されると仮定したが、
図5Dは、適応的動きベクトル解像度決定方法が予測モードと係わりなく適用される場合を仮定したシンタックスの例である。
図5Dのシンタックスを参照すれば、獲得部21は、予測単位の予測モードと係わりなく、「cu_resolution_idx[x0][y0]」を、予測単位別に受信する(534)。
【0127】
図5Bないし
図5Dを参照して説明した動きベクトル解像度を示すインデックス「cu_resolution_idx[x0][y0]」は、単項(unary)または固定長(fixed length)に符号化されて伝送される。また、2個の動きベクトル解像度だけ使用する場合、「cu_resolution_idx[x0][y0]」は、フラグ形式のデータでもある。
【0128】
動きベクトル符号化装置10は、符号化に使用される所定の複数動きベクトル解像度を、スライス単位またはブロック単位で適応的に構成することができる。また、動きベクトル復号装置10は、復号に使用される所定の複数動きベクトル解像度を、スライス単位またはブロック単位で適応的に構成することができる。スライス単位またはブロック単位で適応的に構成される所定の複数動きベクトル解像度を、動きベクトル解像度候補群とすることができる。すなわち、動きベクトル符号化装置10と、動きベクトル復呼号装置20は、すでに符号化または復号された周辺ブロックの情報に基づいて、現在ブロックの動きベクトル候補群の種類及び個数を異なるように構成することができる。
【0129】
例えば、動きベクトル符号化装置10または動きベクトル復号装置20は、最小動きベクトル解像度が1/4画素単位である場合、全ての映像に同一に固定された動きベクトル解像度候補群として、1/4画素,1/2画素,1画素及び2画素単位の解像度を使用することができる。動きベクトル符号化装置10または動きベクトル復号装置20は、全ての映像に同一に固定された動きベクトル解像度候補群を使用する代わりに、すでに符号化された周辺ブロックの動きベクトル解像度が小さい場合には、現在ブロックの動きベクトル解像度候補群として、1/8画素,1/4画素及び1/2画素単位を使用し、周辺ブロックの動きベクトル解像度が大きい場合には、現在ブロックの動きベクトル解像度候補群として、1/2画素,1画素、及び2画素単位を使用することができる。動きベクトル符号化装置10または動きベクトル復号装置20は、動きベクトルの大きさ及び他の情報に基づいて、スライス単位またはブロック単位で、動きベクトル解像度候補群の種類及び数を異なるように構成することもできる。
【0130】
動きベクトル解像度候補群を構成する解像度の種類及び個数は、動きベクトル符号化装置10及び動きベクトル復号装置20が常に全く同じように設定して使用するか、あるいは周辺ブロックの情報、及びそれ以外の情報に基づいて、同一方法で類推することができる。または、動きベクトル符号化装置10で使用した動きベクトル解像度候補群に係わる情報をビットストリームに符号化し、明確に動きベクトル復号装置20に伝送することができる。
【0131】
図6Aは、複数の解像度を使用し、マージ候補リストを構成する一実施形態を示す。
【0132】
動きベクトル符号化装置10は、予測単位別に伝送される動き情報に係わるデータ量を減らすために、空間的(spatial)/時間的(temporal)周辺ブロックの動き情報に基づいて、現在ブロックの動き情報として設定するマージ(merge)モードを利用することができる。動きベクトル符号化装置10は、動き情報を予測するためのマージ候補リストを、符号化装置及び復号装置で同一に構成し、リスト内の候補選択情報を復号装置に伝送することにより、動き関連データの量を効果的に減らすことができる。
【0133】
動きベクトル復号装置20は、現在ブロックが、マージモードを使用して予測する予測単位が存在する場合、動きベクトル符号化装置10と同一方法で、現在ブロックに係わるマージ候補リストを構成し、ビットストリームから、リスト内の候補選択情報を獲得し、現在ブロックの動きベクトルを復号することができる。
【0134】
マージ候補リストは、空間的周辺ブロックの動き情報を基盤とした空間的候補、時間的周辺ブロックの動き情報を基盤とした時間的候補を含んでもよい。動きベクトル符号化装置10と動きベクトル復号装置20は、所定の順序によって、所定の複数動きベクトル解像度の空間的候補、時間的候補を、マージ候補リスト(merge candidate list)に含めることができる。
【0135】
図3Aないし
図4Bを参照して説明した動きベクトル解像度決定方法は、現在ブロックの予測単位が、AMVPモードを使用して符号化される場合に限って適用されず、残差動きベクトルを伝送せずに、予測動きベクトル候補のうち1つの予測動きベクトルを最終動きベクトルとしてすぐに使用する予測モード(例えば、マージモード)を使用する場合にも適用される。
【0136】
すなわち、動きベクトル符号化装置10と動きベクトル復号装置20は、予測動きベクトル候補を、所定の複数動きベクトル解像度に適するように調整し、調整された予測動きベクトル候補を、現在ブロックの動きベクトルとして決定することができる。すなわち、マージ候補リスト内に含まれた候補ブロックの動きベクトルは、最小動きベクトル解像度の動きベクトルを、所定の複数動きベクトル解像度によって、ダウンスケーリングした動きベクトルを含んでもよい。ダウンスケーリングの方法は、
図7A及び
図7Bを参照して後述する。
【0137】
例えば、最小動きベクトル解像度が1/4画素であり、所定の複数動きベクトル解像度候補が1/4画素、1/2画素、1画素及び2画素であり、マージ候補リストが、(A1,B1,B0,A0,B2,同一位置(co-located)ブロック)で構成されていると仮定する。動きベクトル復号装置20の獲得部21は、
図6Aのように、1/4解像度での予測動きベクトル候補を構成し、1/4解像度の予測動きベクトルを、1/2画素、1画素及び2画素の解像度に調整し、解像度の順序によって、順次に複数の解像度のマージ候補リストを獲得することができる。
【0138】
図6Bは、複数の解像度を使用して、マージ候補リストを構成する他の実施形態を示す。
【0139】
動きベクトル符号化装置10と動きベクトル復号装置20は、
図6Bのように、1/4画素単位の解像度での予測動きベクトル候補を構成し、1/4画素単位の解像度の各予測動きベクトル候補を、1/2画素、1画素及び2画素単位の解像度に調整し、予測動きベクトル候補の順序によって、順次にマージ候補リストを獲得することもできる。
【0140】
動きベクトル復号装置20は、現在ブロックがマージモードを使用して予測する予測単位が存在する場合、獲得部21が獲得した複数の解像度のマージ候補リストと、ビットストリームから獲得したマージ候補インデックスに係わる情報とに基づいて、現在ブロックに係わる動きベクトルを決定することができる。
【0141】
図7Aは、解像度が異なる2つの動きベクトルが示す画素を示す。
【0142】
動きベクトル符号化装置10は、高解像度の動きベクトルを、対応する低解像度動きベクトルに調整する(adjust)ために、高解像度の既存の動きベクトルが示す画素の代わりに、周辺の画素を示すように、動きベクトルを調整することができる。周辺の画素のうちいずれか1つの画素を選択するのが、ラウンディング(rounding)である。
【0143】
例えば、座標(0,0)を基準に、(19,27)を示す1/4画素の解像度の動きベクトルを、1画素単位の解像度の動きベクトルに調整するために、1/4画素の解像度の動きベクトル(19,27)を整数4で割り、除算の過程でラウンディングが発生する。説明の便宜のために、以下、各解像度の動きベクトルは、座標(0,0)から出発し、座標(x,y)(x、yは、整数)を示すと仮定する。
【0144】
図7Aを参照すれば、最小動きベクトルの解像度が1/4画素単位であり、1/4画素単位の解像度の動きベクトル715を1画素単位の解像度の動きベクトルに調整するために、1/4画素動きベクトル715が示す画素710周辺の4個の整数画素720,730,740,750が対応する1画素動きベクトル725,735,745,755が示す候補画素にもなる。すなわち、座標710の値が(19,27)であるならば、座標1020は、(7,24)になり、座標730は、(16,28)になり、座標740は、(20,28)になり、座標750は、(20,24)にもなる。
【0145】
一実施形態による動きベクトル符号化装置10は、1/4画素単位の解像度の動きベクトル710を、対応する1画素単位解像度の動きベクトルに調整するとき、右側上端の整数画素740を示すように決定することができる。すなわち、1/4画素単位の解像度の動きベクトルが、座標(0,0)を出発し、座標(19,27)を指し示すならば、対応する1画素単位の解像度の動きベクトルは、座標(0,0)を出発し、座標(20,28)を指し示し、最終的な1画素単位の解像度の動きベクトルは、(5,7)にもなる。
【0146】
一実施形態による動きベクトル符号化装置10は、高解像度動きベクトルを低解像度動きベクトルに調整するとき、調整された低解像度動きベクトルは、常に高解像度動きベクトルが示す画素の右側上端を指し示すようにする。他の実施形態による動きベクトル符号化装置10は、調整された低解像度動きベクトルは、常に高解像度動きベクトルが指し示す画素の左側上端、左側下端または右側下端の画素を指し示すようにする。
【0147】
動きベクトル符号化装置10は、高解像度動きベクトルを、現在ブロックの動きベクトルの解像度によって、高解像度動きベクトルが指し示す画素の周辺に位置した左側上端、右側上端、左側下端、右側下端の4個の画素のうち、対応する低解像度動きベクトルが指し示す画素を異なって選択することができる。
【0148】
例えば、
図7Bを参照すれば、1/2画素の動きベクトルは、1/4画素動きベクトルが指し示す画素1060の左側上端の画素1080を指し示し、1画素の動きベクトルは、1/4画素動きベクトルが指し示す画素の右側上端の画素1070を指し示し、2画素の動きベクトルは、1/4画素動きベクトルが指し示す画素の右側下端の画素1090を指し示すように調整することができる。
【0149】
動きベクトル符号化装置10は、既存の高解像度の動きベクトルが指し示す画素の代わりに、周辺画素のうちいずれか1つの画素を指し示すようにするとき、解像度、1/4画素の動きベクトル候補、周辺ブロックの情報、符号化情報、任意のパターンのうち少なくとも一つに基づいて指し示す画素の位置を決定することができる。
【0150】
一方、説明の便宜のために、
図3Aないし
図7Bでは、それぞれ動きベクトル符号化装置10が遂行する動作についてのみ説明し、動きベクトル復号装置20での動作は、省略するか、あるいは動きベクトル復号装置20が遂行する動作についてのみ説明し、動きベクトル符号化装置10での動作を省略したが、各動きベクトル符号化装置10及び動きベクトル復号装置20においても、各動きベクトル復号装置20及び動きベクトル符号化装置10と対応する動作が遂行されるということは、本実施形態が属する技術分野の通常の技術者であるならば、容易に理解することができるであろう。
【0151】
以下、
図8ないし
図20を参照し、一実施形態による、ツリー構造の符号化単位及び変換単位に基づいたビデオ符号化方法及びその装置、ビデオ復号方法及びその装置が開示される。
図1Aないし
図7Bを参照して説明した動きベクトル符号化装置10は、ビデオ符号化装置800に含まれてもよい。すなわち、動きベクトル符号化装置10は、ビデオ符号化装置800が符号化する映像のインター予測を行うための予測動きベクトルを示す情報、残差動きベクトル、動きベクトル解像度を示す情報を、
図1Aないし
図7Bを参照して説明した方法によって符号化することができる。
【0152】
図8は、本発明の一実施形態による、ツリー構造による符号化単位に基づいたビデオ符号化装置800のブロック図を図示する。
【0153】
一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ符号化装置800は、符号化単位決定部820及び出力部830を含む。以下、説明の便宜のために、一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ符号化装置800は、「ビデオ符号化装置800」と縮約して指称する。
【0154】
符号化単位決定部820は、映像の現在ピクチャのための最大サイズの符号化単位である最大符号化単位に基づいて、現在ピクチャを区画することができる。現在ピクチャが最大符号化単位より大きければ、現在ピクチャの映像データは、少なくとも1つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ32x32,64x64,128x128,256x256などのデータ単位であり、縦横に大きさが2の累乗である正方形のデータ単位でもある。
【0155】
一実施形態による符号化単位は、最大サイズ及び深度で特徴づけられる。深度とは、最大符号化単位から符号化単位が空間的に分割された回数を示し、深度が深くなるほど、深度別符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度であり、最小符号化単位が最下位符号化単位と定義される。最大符号化単位は、深度が深くなるにつれ、深度別符号化単位の大きさは小さくなるので、上位深度の符号化単位は、複数個の下位深度の符号化単位を含んでもよい。
【0156】
前述のように、符号化単位の最大サイズによって、現在ピクチャの映像データを最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含んでもよい。一実施形態による最大符号化単位は、深度別に分割されるので、最大符号化単位に含まれた空間領域(spatial domain)の映像データが、深度によって階層的に分類される。
【0157】
最大符号化単位の高さ及び幅を階層的に分割することができる総回数を制限する最大深度、及び符号化単位の最大サイズがあらかじめ設定されている。
【0158】
符号化単位決定部820は、深度ごとに、最大符号化単位の領域が分割された少なくとも1つの分割領域を符号化し、少なくとも1つの分割領域別に最終符号化結果が出力される深度を決定する。すなわち、符号化単位決定部820は、現在ピクチャの最大符号化単位ごとに、深度別符号化単位で映像データを符号化し、最小の符号化誤差が発生する深度を選択し、最終深度として決定する。決定された最終深度及び最大符号化単位別映像データは、出力部830に出力される。
【0159】
最大符号化単位内の映像データは、最大深度以下の少なくとも1つの深度によって、深度別符号化単位に基づいて符号化され、それぞれの深度別符号化単位に基づいた符号化結果が比較される。深度別符号化単位の符号化誤差の比較結果、符号化誤差が最小である深度が選択される。それぞれの最大化符号化単位ごとに、少なくとも1つの最終深度が決定される。
【0160】
最大符号化単位の大きさ、は深度が深くなるにつれ、符号化単位が階層的に分割されて分割され、符号化単位の個数は増加する。また、1つの最大符号化単位に含まれる同一深度の符号化単位であるとしても、それぞれのデータに係わる符号化誤差を測定し、下位深度への分割いかんが決定される。従って、1つの最大符号化単位に含まれるデータであるとしても、位置によって、深度別符号化誤差が異なるので、位置によって、最終深度が異なって決定される。従って、1つの最大符号化単位に対して、最終深度が1以上設定され、最大符号化単位のデータは、1以上の最終深度の符号化単位によって区画される。
【0161】
従って、一実施形態による符号化単位決定部820は、現在最大符号化単位に含まれるツリー構造による符号化単位が決定される。一実施形態による、「ツリー構造による符号化単位」は、現在最大符号化単位に含まれる全ての深度別符号化単位において、最終深度と決定された深度の符号化単位を含む。最終深度の符号化単位は、最大符号化単位内において同一領域では、深度によって階層的に決定され、他の領域については、独立して決定される。同様に、現在領域に係わる最終深度は、他の領域に係わる最終深度と独立して決定される。
【0162】
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数と係わる指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示すことができる。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総個数を示すことができる。例えば、最大符号化単位の深度が0であるとするとき、最大符号化単位が1回分割された符号化単位の深度は、1に設定され、2回分割された符号化単位の深度は、2に設定される。その場合、最大符号化単位から4回分割された符号化単位が最小符号化単位であるならば、深度0,1,2,3及び4の深度レベルが存在するので、第1最大深度は、4に設定され、第2最大深度は、5に設定される。
【0163】
最大符号化単位の予測符号化及び変換が行われる。予測符号化及び変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに、深度別符号化単位を基に行われる。
【0164】
最大符号化単位が深度別に分割されるたびに、深度別符号化単位の個数が増加するので、深度が深くなるにつれて生成される全ての深度別符号化単位に対して、予測符号化及び変換を含んだ符号化が行われなければならない。以下、説明の便宜のために、少なくとも1つの最大符号化単位のうち、現在深度の符号化単位を基に予測符号化及び変換について説明する。
【0165】
一実施形態によるビデオ符号化装置800は、映像データの符号化のためのデータ単位の大きさまたは形態を多様に選択することができる。映像データの符号化のためには、予測符号化、変換、エントロピー符号化などの段階を経るが、全ての段階にわたって、同一データ単位が使用され、段階別にデータ単位が変更されもする。
【0166】
例えば、ビデオ符号化装置800は、映像データの符号化のための符号化単位だけではなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択することができる。
【0167】
最大符号化単位の予測符号化のためには、一実施形態による最終深度の符号化単位、すなわち、それ以上さらに分割されない符号化単位を基に予測符号化が行われる。以下、予測符号化の基になる、それ以上さらに分割されない符号化単位を「予測単位」と称する。該予測単位が分割されたパーティションは、該予測単位、並びに該予測単位の高さ及び幅のうち少なくとも一つが分割されたデータ単位を含んでもよい。該パーティションは、符号化単位の予測単位が分割された形態のデータ単位であり、該予測単位は、符号化単位と同一サイズのパーティションでもある。
【0168】
例えば、サイズ2Nx2N(ただし、Nは正の整数)の符号化単位が、それ以上分割されない場合、サイズ2Nx2Nの予測単位になり、パーティションの大きさは、2Nx2N、2NxN、Nx2N、NxNなどでもある。一実施形態によるパーティションモードは、予測単位の高さまたは幅が対称的な比率に分割された対称的パーティションだけではなく、1:nまたはn:1のように、非対称的な比率に分割されたパーティション、幾何学的な形態に分割されたパーティション、任意的形態のパーティションなどを選択的に含んでもよい。
【0169】
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも一つでもある。例えば、イントラモード及びインターモードは、2Nx2N,2NxN,Nx2N,NxNサイズのパーティションに対して遂行される。また、スキップモードは、2Nx2Nサイズのパーティションに対してのみ遂行される。符号化単位以内の1つの予測単位ごとに、独立して符号化が行われ、符号化誤差が最小である予測モードが選択される。
【0170】
また、一実施形態によるビデオ符号化装置800は、映像データの符号化のための符号化単位だけではなく、符号化単位と異なるデータ単位を基に、符号化単位の映像データの変換を行うことができる。符号化単位の変換のためには、符号化単位より小さいか、あるいはそれと同じ大きさの変換単位を基に変換が行われる。例えば、該変換単位は、イントラモードのためのデータ単位、及びインターモードのための変換単位を含んでもよい。
【0171】
一実施形態による、ツリー構造による符号化単位と類似した方式で、符号化単位内の変換単位も、再帰的にさらに小サイズの変換単位に分割されながら、符号化単位のレジデュアルデータが、変換深度によって、ツリー構造による変換単位によって区画される。
【0172】
一実施形態による変換単位についても、符号化単位の高さ及び幅が分割され、変換単位に至るまでの分割回数を示す変換深度が設定される。例えば、サイズ2Nx2Nの現在符号化単位の変換単位の大きさが2Nx2Nであるならば、変換深度0に設定され、変換単位の大きさがNxNであるならば、変換深度1に設定され、変換単位の大きさがN/2xN/2であるならば、変換深度2に設定される。すなわち、変換単位についても、変換深度によって、ツリー構造による変換単位が設定される。
【0173】
深度別分割情報は、深度だけではなく、予測関連情報及び変換関連情報が必要である。従って、符号化単位決定部820は、最小符号化誤差を発生させた深度だけではなく、予測単位をパーティションに分割したパーティションモード、予測単位別予測モード、変換のための変換単位の大きさなどを決定することができる。
【0174】
一実施形態による、最大符号化単位のツリー構造による符号化単位及び予測単位/パーティション、並びに変換単位の決定方式については、
図17ないし
図19を参照して詳細に説明する。
【0175】
符号化単位決定部820は、深度別符号化単位の符号化誤差を、ラグランジュ乗数(Lagrangian multiplier)基盤の率・歪曲最適化技法(rate-distortion optimization)を利用して測定することができる。
【0176】
出力部830は、符号化単位決定部820で決定された少なくとも1つの深度に基づいて符号化された最大符号化単位の映像データ及び深度別分割情報を、ビットストリーム形態で出力する。
【0177】
符号化された映像データは、映像のレジデュアルデータの符号化結果でもある。
【0178】
深度別分割情報は、深度情報、予測単位のパーティションモード情報、予測モード情報、変換単位の分割情報などを含んでもよい。
【0179】
最終深度情報は、現在深度で符号化せず、下位深度の符号化単位で符号化するか否かということを示す深度別分割情報を利用して定義される。現在符号化単位の現在深度が深度であるならば、現在符号化単位は、現在深度の符号化単位で符号化されるので、現在深度の分割情報は、それ以上下位深度に分割されないように定義される。反対に、現在符号化単位の現在深度が深度ではないならば、下位深度の符号化単位を利用した符号化を試みなければならないので、現在深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
【0180】
現在深度が深度ではないならば、下位深度の符号化単位に分割された符号化単位に対して符号化が行われる。現在深度の符号化単位内に、下位深度の符号化単位が1以上存在するので、それぞれの下位深度の符号化単位ごとに反復的に符号化が行われ、同一深度の符号化単位ごとに、再帰的(recursive)符号化が行われる。
【0181】
1つの最大符号化単位内でツリー構造の符号化単位が決定され、深度の符号化単位ごとに、少なくとも1つの分割情報が決定されなければならないので、1つの最大符号化単位については、少なくとも1つの分割情報が決定される。また、最大符号化単位のデータは、深度によって階層的に区画され、位置別に深度が異なるので、データに対して、深度及び分割情報が設定される。
【0182】
従って、一実施形態による出力部830は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも一つに対して、当該深度及び符号化モードに係わる符号化情報を割り当てられる。
【0183】
一実施形態による最小単位は、最下位深度である最小符号化単位が4分割された大きさの正方形のデータ単位である。一実施形態による最小単位は、最大符号化単位に含まれる全ての符号化単位内、予測単位内、パーティション単位内及び変換単位内に含まれる最大サイズの正方形データ単位でもある。
【0184】
例えば、出力部830を介して出力される符号化情報は、深度別符号化単位別符号化情報と予測単位別符号化情報とに分類される。深度別符号化単位別符号化情報は、予測モード情報、パーティションサイズ情報を含んでもよい。予測単位別に伝送される符号化情報は、インターモードの推定方向に係わる情報、インターモードの参照映像インデックスに係わる情報、動きベクトルに係わる情報、イントラモードのクロマ成分に係わる情報、イントラモードの補間方式に係わる情報などを含んでもよい。
【0185】
ピクチャ別、スライス別またはGOP別に定義される符号化単位の最大サイズに係わる情報、及び最大深度に係わる情報は、ビットストリームのヘッダ、シーケンスパラメータセットまたはピクチャパラメータセットなどに挿入される。
【0186】
また、現在ビデオに対して許容される変換単位の最大サイズに係わる情報、及び変換単位の最小サイズに係わる情報も、ビットストリームのヘッダ、シーケンスパラメータセットまたはピクチャパラメータセットなどを介して出力される。出力部830は、予測に係わる参照情報、予測情報、スライスタイプ情報などを符号化して出力することができる。
【0187】
ビデオ符号化装置800の最も簡単な形態の実施形態によれば、深度別符号化単位は、1階層上位深度の符号化単位の高さ及び幅を半分にした大きさの符号化単位である。すなわち、現在深度の符号化単位の大きさが2Nx2Nであるならば、下位深度の符号化単位の大きさは、NxNである。また、2Nx2Nサイズの現在符号化単位は、NxNサイズの下位深度符号化単位を最大4個含む。
【0188】
従って、ビデオ符号化装置800は、現在ピクチャの特性を考慮して決定された最大符号化単位の大きさ及び最大深度を基に、それぞれの最大符号化単位ごとに、最適の形態及び大きさの符号化単位を決定し、ツリー構造による符号化単位を構成することができる。また、それぞれの最大符号化単位ごとに、多様な予測モード、変換方式などで符号化することができるので、多様な映像サイズの符号化単位の映像特性を考慮して最適の符号化モードが決定される。
【0189】
従って、映像の解像度が非常に高いか、あるいはデータ量が非常に多い映像を既存マクロブロック単位で符号化するならば、ピクチャ当たりマクロブロックの数が過度に多くなる。それによって、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなり、データ圧縮効率が低下する傾向がある。従って、一実施形態によるビデオ符号化装置は、映像の大きさを考慮し、符号化単位の最大サイズを増大させながら、映像特性を考慮し、符号化単位を調節することができるので、映像圧縮効率が上昇する。
【0190】
図9は、一実施形態による、ツリー構造による符号化単位に基づいたビデオ復号装置900のブロック図を図示する。
【0191】
図2Aないし
図7Bを参照して説明した動きベクトル復号装置20は、ビデオ復号装置900に含まれてもよい。すなわち、動きベクトル復号装置20は、ビデオ復号装置900が復号する映像のインター予測を行うための予測動きベクトルを示す情報、残差動きベクトル、動きベクトル解像度を示す情報を、符号化されたビデオに係わるビットストリームを受信してパージングし、パージングされた情報に基づいて、動きベクトルを復元することができる。
【0192】
一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ復号装置900は、受信部910、映像データ及び符号化情報抽出部920、並びに映像データ復号部930を含む。以下、説明の便宜のために、一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ復号装置900は、「ビデオ復号装置900」と縮約して指称する。
【0193】
一実施形態によるビデオ復号装置900の復号動作のための符号化単位、深度、予測単位、変換単位、各種分割情報など各種用語の定義は、
図8及びビデオ符号化装置800を参照して説明したところと同一である。
【0194】
受信部910は、符号化されたビデオに係わるビットストリームを受信してパージングする。映像データ及び符号化情報抽出部920は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位によって、符号化単位ごとに符号化された映像データを抽出し、映像データ復号部930に出力する。映像データ及び符号化情報抽出部920は、現在ピクチャに係わるヘッダ、シーケンスパラメータセットまたはピクチャパラメータセットから、現在ピクチャの符号化単位の最大サイズに係わる情報を抽出することができる。
【0195】
また、映像データ及び符号化情報抽出部920は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位に係わる最終深度及び分割情報を抽出する。抽出された最終深度及び分割情報は、映像データ復号部930に出力される。すなわち、ビット列の映像データを最大符号化単位に分割し、映像データ復号部930に、最大符号化単位ごとに映像データを復号させる。
【0196】
最大符号化単位別深度及び分割情報は、1以上の深度情報に対して設定され、深度別分割情報は、当該符号化単位のパーティションモード情報、予測モード情報及び変換単位の分割情報などを含んでもよい。また、深度情報として、深度別分割情報が抽出されもする。
【0197】
映像データ及び符号化情報抽出部920が抽出した最大符号化単位別深度及び分割情報は、一実施形態によるビデオ符号化装置800のように、符号化端で、最大符号化単位別深度別符号化単位ごとに反復的に符号化を行い、最小符号化誤差を発生させることによって決定された深度及び分割情報である。従って、ビデオ復号装置900は、最小符号化誤差を発生させる符号化方式によってデータを復号し、映像を復元することができる。
【0198】
一実施形態による、深度及び符号化モードに係わる符号化情報は、当該符号化単位、予測単位及び最小単位のうち所定データ単位に対して割り当てられているので、映像データ及び符号化情報抽出部920は、所定データ単位別に、深度及び分割情報を抽出することができる。所定データ単位別に、当該最大符号化単位の深度及び分割情報が記録されているのであるならば、同一深度及び分割情報を有している所定データ単位は、同一最大符号化単位に含まれるデータ単位と類推される。
【0199】
映像データ復号部930は、最大符号化単位別深度及び分割情報に基づいて、それぞれの最大符号化単位の映像データを復号し、現在ピクチャを復元する。すなわち、映像データ復号部930は、最大符号化単位に含まれるツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、判読されたパーティションモード、予測モード、変換単位に基づいて符号化された映像データを復号することができる。復号過程はイ、ントラ予測及び動き補償を含む予測過程、及び逆変換過程を含んでもよい。
【0200】
映像データ復号部930は、深度別符号化単位の予測単位のパーティションモード情報及び予測モード情報に基づいて、符号化単位ごとに、それぞれのパーティション及び予測モードによって、イントラ予測または動き補償を行うことができる。
【0201】
また、映像データ復号部930は、最大符号化単位別逆変換のために、符号化単位別に、ツリー構造による変換単位情報を判読し、符号化単位ごとに、変換単位に基づいた逆変換を行うことができる。逆変換を介して、符号化単位の空間領域の画素値が復元される。
【0202】
映像データ復号部930は、深度別分割情報を利用して、現在最大符号化単位の深度を決定することができる。もし分割情報が現在深度において、それ以上分割されないということを示しているならば、現在深度が深度である。従って、映像データ復号部930は、現在最大符号化単位の映像データに対して、現在深度の符号化単位を、予測単位のパーティションモード、予測モード及び変換単位大きさ情報を利用して復号することができる。
【0203】
すなわち、符号化単位、予測単位及び最小単位のうち所定データ単位に対して設定されている符号化情報を観察し、同一分割情報を含んだ符号化情報を保有しているデータ単位が集まり、映像データ復号部930によって、同一符号化モードによって復号する1つのデータ単位と見なされる。かように決定された符号化単位ごとに、符号化モードに係わる情報を獲得し、現在符号化単位の復号が遂行される。
【0204】
図10は、一実施形態による符号化単位の概念を図示する。
【0205】
符号化単位の例は、符号化単位の大きさは、幅x高さで表現され、サイズ64x64である符号化単位から、サイズ32x32,16x16,8x8を含んでもよい。サイズ64x64の符号化単位は、サイズ64x64,64x32,32x64,32x32のパーティションに分割され、サイズ32x32の符号化単位は、サイズ32x32,32x16,16x32,16x16のパーティションに分割され、サイズ16x16の符号化単位は、サイズ16x16,16x8,8x16,8x8のパーティションに分割され、サイズ8x8の符号化単位は、サイズ8x8,8x4,4x8,4x4のパーティションに分割される。
【0206】
ビデオデータ1010については、解像度は、1920x1080に設定され、符号化単位の最大サイズは、64に設定され、最大深度は、2に設定されている。ビデオデータ1020については、解像度は、1920x1080に設定され、符号化単位の最大サイズは、64に設定され、最大深度は、3に設定されている。ビデオデータ1030については、解像度は、352x288に設定され、符号化単位の最大サイズは、16に設定され、最大深度は、1に設定されている。
図10に図示された最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示す。
【0207】
解像度が高いか、あるいはデータ量が多い場合、符号化効率の向上だけではなく、映像特性を正確に反映させるために、符号化サイズの最大サイズが相対的に大きいことが望ましい。従って、ビデオデータ1030に比べ、解像度が高いビデオデータ1010,1020は、符号化サイズの最大サイズが64に選択される。
【0208】
ビデオデータ1010の最大深度が2であるので、ビデオデータ1010の符号化単位1015は、長軸サイズが64である最大符号化単位から、2回分割されて深度が2階層深くなり、長軸サイズが32,16である符号化単位まで含んでもよい。一方、ビデオデータ1030の最大深度が1であるので、ビデオデータ1030の符号化単位1035は、長軸サイズが16である符号化単位から、1回分割されて深度が1階層深くなり、長軸サイズが8である符号化単位まで含んでもよい。
【0209】
ビデオデータ1020の最大深度が3であるので、ビデオデータ1020の符号化単位1025は、長軸サイズが64である最大符号化単位から、3回分割されて深度が3階層深くなり、長軸サイズが32,16,8である符号化単位まで含んでもよい。深度が深くなるほど、細部情報の表現能が向上する。
【0210】
図11は、一実施形態による、符号化単位に基づいたビデオ符号化部1100のブロック図を図示する。
【0211】
一実施形態によるビデオ符号化部1100は、ビデオ符号化装置800のピクチャ符号化部1520において、映像データを符号化するのに経る作業を遂行する。すなわち、イントラ予測部1120は、現在映像1105のうちイントラモードの符号化単位に対して、予測単位別にイントラ予測を行い、インター予測部1115は、インターモードの符号化単位に対して、予測単位別に、現在映像1105、及び復元ピクチャバッファ1110で獲得された参照映像を利用して、インター予測を行う。現在映像1105は、最大符号化単位に分割された後、順次にエンコーディングが行われる。そのとき、最大符号化単位がツリー構造に分割される符号化単位に対して、エンコーディングが行われる。
【0212】
イントラ予測部1120またはインター予測部1115から出力された各モードの符号化単位に係わる予測データを、現在映像1105のエンコーディングされる符号化単位に係わるデータから除くことにより、レジデュデータを生成し、該レジデュデータは、変換部1125及び量子化部1130を経て、変換単位別に量子化された変換係数として出力される。量子化された変換係数は、逆量子化部1145、逆変換部1150を介して、空間領域のレジデュデータに復元される。復元された空間領域のレジデュデータは、イントラ予測部1120またはインター予測部1115から出力された各モードの符号化単位に係わる予測データと加えられることにより、現在映像1105の符号化単位に係わる空間領域のデータに復元される。復元された空間領域のデータは、デブロッキング部1155及びSAO遂行部1160を経て、復元映像として生成される。生成された復元映像は、復元ピクチュアバッファ1110に保存される。復元ピクチャバッファ1110に保存された復元映像は、他の映像のインター予測のための参照映像に利用される。変換部1125及び量子化部1130において量子化された変換係数は、エントロピー符号化部1135を経て、ビットストリーム1140として出力される。
【0213】
一実施形態によるビデオ符号化部1100が、ビデオ符号化装置800に適用されるために、ビデオ符号化部1100の構成要素であるインター予測部1115、イントラ予測部1120、変換部1125、量子化部1130、エントロピー符号化部1135、逆量子化部1145、逆変換部1150、デブロッキング部1155及びSAO遂行部1160が、最大符号化単位ごとにツリー構造による符号化単位のうちそれぞれの符号化単位に基づいた作業を遂行することができる。
【0214】
特に、イントラ予測部1120及びインター予測部1115は、現在最大符号化単位の最大サイズ及び最大深度を考慮し、ツリー構造による符号化単位のうちそれぞれの符号化単位のパーティションモード及び予測モードを決定し、変換部1125は、ツリー構造による符号化単位のうちそれぞれの符号化単位内の四分木による変換単位の分割いかんを決定することができる。
【0215】
図12は、一実施形態による、符号化単位に基づいたビデオ復号部1200のブロック図を図示する。
【0216】
エントロピー復号部1215は、ビットストリーム1205から、復号対象である符号化された映像データ、及び復号のために必要な符号化情報をパージングする。符号化された映像データは、量子化された変換係数であり、逆量子化部1220及び逆変換部1225は、量子化された変換係数からレジデュデータを復元する。
【0217】
イントラ予測部1240は、イントラモードの符号化単位に対して、予測単位別にイントラ予測を行う。インター予測部1235は、現在映像のうちインターモードの符号化単位に対して、予測単位別に復元ピクチャバッファ1230で獲得された参照映像を利用してインター予測を行う。
【0218】
イントラ予測部1240またはインター予測部1235を経た各モードの符号化単位に係わる予測データと、レジデュデータとが加えられることにより、現在映像1105の符号化単位に係わる空間領域のデータが復元され、復元された空間領域のデータは、デブロッキング部1245及びSAO遂行部1250を経て、復元映像1260として出力される。また、復元ピクチュアバッファ1230に保存された復元映像は、参照映像として出力される。
【0219】
ビデオ復号装置900のピクチャ復号部930で映像データを復号するために、一実施形態によるビデオ復号部1200のエントロピー復号部1215後の段階別作業が遂行される。
【0220】
ビデオ復号部1200が、一実施形態によるビデオ復号装置900に適用されるために、ビデオ復号部1200の構成要素であるエントロピー復号部1215、逆量子化部1220、逆変換部1225、イントラ予測部1240、インター予測部1235、デブロッキング部1245及びSAO遂行部1250が、最大符号化単位ごとに、ツリー構造による符号化単位のうちそれぞれの符号化単位に基づいて作業を遂行することができる。
【0221】
特に、イントラ予測部1240及びインター予測部1235は、ツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、パーティションモード及び予測モードを決定し、逆変換部1225は、符号化単位ごとに、四分木構造による変換単位の分割いかんを決定することができる。
【0222】
図13は、一実施形態による、深度別符号化単位及びパーティションを図示する。
【0223】
一実施形態によるビデオ符号化装置800、及び一実施形態によるビデオ復号装置900は、映像特性を考慮するために、階層的な符号化単位を使用する。符号化単位の最大高及び最大幅、最大深度は、映像の特性によって適応的に決定され、ユーザの要求によって、多様に設定されもする。あらかじめ設定された符号化単位の最大サイズによって、深度別符号化単位の大きさが決定される。
【0224】
一実施形態による符号化単位の階層構造1300は、符号化単位の最大高及び最大幅が64であり、最大深度が3である場合を図示している。そのとき、該最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示す。一実施形態による、符号化単位の階層構造1300の縦軸に沿って、深度が深くなるので、深度別符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造1300の横軸に沿って、それぞれの深度別符号化単位の予測符号化の基になる予測単位及びパーティションが図示されている。
【0225】
すなわち、符号化単位1310は、符号化単位の階層構造1300のうち最大符号化単位であり、深度が0であり、符号化単位の大きさ、すなわち、高さ及び幅が64x64である。縦軸に沿って深度が深くなり、サイズ32x32である深度1の符号化単位1320、サイズ16x16である深度2の符号化単位1330、サイズ8x8である深度3の符号化単位1340が存在する。サイズ8x8である深度3の符号化単位1340は、最小符号化単位である。
【0226】
それぞれの深度別に横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64x64の符号化単位1310が予測単位であるならば、予測単位は、サイズ64x64の符号化単位1310に含まれるサイズ64x64のパーティション1310、サイズ64x32のパーティション1312、サイズ32x64のパーティション1314、サイズ32x32のパーティション1316に分割される。
【0227】
同様に、深度1のサイズ32x32の符号化単位1320の予測単位は、サイズ32x32の符号化単位1320に含まれるサイズ32x32のパーティション1320、サイズ32x16のパーティション1322、サイズ16x32のパーティション1324、サイズ16x16のパーティション1326に分割される。
【0228】
同様に、深度2のサイズ16x16の符号化単位1330の予測単位は、サイズ16x16の符号化単位1330に含まれるサイズ16x16のパーティション1330、サイズ16x8のパーティション1332、サイズ8x16のパーティション1334、サイズ8x8のパーティション1336に分割される。
【0229】
同様に、深度3のサイズ8x8の符号化単位1340の予測単位は、サイズ8x8の符号化単位1340に含まれるサイズ8x8のパーティション1340、サイズ8x4のパーティション1342、サイズ4x8のパーティション1344、サイズ4x4のパーティション1346に分割される。
【0230】
一実施形態によるビデオ符号化装置800の符号化単位決定部820は、最大符号化単位1310の深度を決定するために、最大符号化単位1310に含まれるそれぞれの深度の符号化単位ごとに符号化を行わなければならない。
【0231】
同一範囲及び同一サイズのデータを含むための深度別符号化単位の個数は、深度が深くなるほど、深度別符号化単位の個数も増加する。例えば、深度1の符号化単位一つを含むデータに対して、深度2の符号化単位は、四つが必要である。従って、同一データの符号化結果を深度別に比較するために、1つの深度1の符号化単位、及び4つの深度2の符号化単位を利用して、それぞれ符号化されなければならない。
【0232】
それぞれの深度別符号化のためには、符号化単位の階層構造1300の横軸に沿って、深度別符号化単位の予測単位ごとに符号化を行い、当該深度で最小の符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造1300の縦軸に沿って深度が深くなり、それぞれの深度ごとに符号化を行い、深度別代表符号化誤差を比較し、最小符号化誤差が検索される。最大符号化単位1310において、最小符号化誤差が発生する深度及びパーティションが、最大符号化単位1310の深度及びパーティションモードに選択される。
【0233】
図14は、一実施形態による、符号化単位及び変換単位の関係を図示する。
【0234】
一実施形態によるビデオ符号化装置800、または一実施形態によるビデオ復号装置900は、最大符号化単位ごとに、最大符号化単位より小さいか、あるいはそれと同じ大きさの符号化単位で映像を符号化するか、あるいは復号する。符号化過程において、変換のための変換単位の大きさは、それぞれの符号化単位ほど大きくないデータ単位を基に選択される。
【0235】
例えば、一実施形態によるビデオ符号化装置800、または一実施形態によるビデオ復号装置900において、現在符号化単位1410が64x64サイズであるとき、32x32サイズの変換単位1420を利用して変換が行われる。
【0236】
また、64x64サイズの符号化単位1410のデータを、64x64サイズ以下の32x32,16x16,8x8,4x4サイズの変換単位でそれぞれ変換を行って符号化した後、原本との誤差が最小である変換単位が選択される。
【0237】
【0238】
一実施形態によるビデオ符号化装置800の出力部830は、分割情報として、それぞれの深度の符号化単位ごとに、パーティションモードに係わる情報1500、予測モードに係わる情報1510、変換単位サイズに係わる情報1520を符号化して伝送することができる。
【0239】
パーティションモードに係わる情報1500は、現在符号化単位の予測符号化のためのデータ単位として、現在符号化単位の予測単位が分割されたパーティションの形態に係わる情報を示す。例えば、サイズ2Nx2Nの現在符号化単位CU_0は、サイズ2Nx2Nのパーティション1502、サイズ2NxNのパーティション1504、サイズNx2Nのパーティション1506、サイズNxNのパーティション1508のうちいずれか1つのタイプに分割されて利用される。その場合、現在符号化単位のパーティションモードに係わる情報1500は、サイズ2Nx2Nのパーティション1502、サイズ2NxNのパーティション1504、サイズNx2Nのパーティション1506及びサイズNxNのパーティション1508のうち一つを示すように設定される。
【0240】
予測モードに係わる情報1510は、それぞれのパーティションの予測モードを示す。例えば、予測モードに係わる情報1510を介して、パーティションモードに係わる情報1500が示すパーティションが、イントラモード1512、インターモード1514及びスキップモード1516のうち一つで予測符号化が行われるということが設定される。
【0241】
また、変換単位サイズに係わる情報1520は、現在符号化単位をいかなる変換単位を基に変換を行うかということを示す。例えば、変換単位は、第1イントラ変換単位サイズ1522、第2イントラ変換単位サイズ1524、第1インター変換単位サイズ1526、第2インター変換単位サイズ1528のうち一つである。
【0242】
一実施形態によるビデオ復号装置900の映像データ及び符号化情報抽出部1610は、それぞれの深度別符号化単位ごとに、パーティションモードに係わる情報1500、予測モードに係わる情報1510、変換単位サイズに係わる情報1520を抽出して復号に利用することができる。
【0243】
図16は、一実施形態による深度別符号化単位を図示する。
【0244】
深度の変化を示すために、分割情報が利用される。該分割情報は、現在深度の符号化単位が下位深度の符号化単位に分割されるか否かということを示す。
【0245】
深度0及び2N_0x2N_0サイズの符号化単位1600の予測符号化のための予測単位1610は、2N_0x2N_0サイズのパーティションモード1612、2N_0xN_0サイズのパーティションモード1614、N_0x2N_0サイズのパーティションモード1616、N_0xN_0サイズのパーティションモード1618を含んでもよい。予測単位が対称的な比率に分割されたパーティション1612,1614,1616,1618だけが例示されているが、前述のように、パーティションモードは、それらに限定されるものではなく、非対称的パーティション、任意的形態のパーティション、幾何学的形態のパーティションなどを含んでもよい。
【0246】
パーティションモードごとに、1つの2N_0x2N_0サイズのパーティション、2つの2N_0xN_0サイズのパーティション、2つのN_0x2N_0サイズのパーティション、4つのN_0xN_0サイズのパーティションごとに、反復的に予測符号化が行われる。サイズ2N_0x2N_0、サイズN_0x2N_0、サイズ2N_0xN_0及びサイズN_0xN_0のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。スキップモードは、サイズ2N_0x2N_0のパーティションについてのみ予測符号化が行われる。
【0247】
サイズ2N_0x2N_0,2N_0xN_0及びN_0x2N_0のパーティションモード1612,1614,1616のうち一つによる符号化誤差が最小であれば、それ以上下位深度に分割する必要はない。
【0248】
サイズN_0xN_0のパーティションモード1618による符号化誤差が最小であれば、深度0を1に変更しながら分割し1620)、深度2及びサイズN_0xN_0のパーティションモードの符号化単位1630に対して反復的に符号化を行い、最小符号化誤差を検索する。
【0249】
深度1及びサイズ2N_1x2N_1(=N_0xN_0)の符号化単位1630の予測符号化のための予測単位1640は、サイズ2N_1x2N_1のパーティションモード1642、サイズ2N_1xN_1のパーティションモード1644、サイズN_1x2N_1のパーティションモード1646、サイズN_1xN_1のパーティションモード1648を含んでもよい。
【0250】
また、サイズN_1xN_1のパーティションモード1648による符号化誤差が最小であれば、深度1を深度2に変更しながら分割し1650)、深度2及びサイズN_2xN_2の符号化単位1660に対して反復的に符号化を行い、最小符号化誤差を検索する。
【0251】
最大深度がdである場合、深度別符号化単位は、深度d-1になるまで設定され、分割情報は、深度d-2まで設定される。すなわち、深度d-2から分割され1670)、深度d-1まで符号化が行われる場合、深度d-1及びサイズ2N_(d-1)x2N_(d-1)の符号化単位1680の予測符号化のための予測単位1690は、サイズ2N_(d-1)x2N_(d-1)のパーティションモード1692、サイズ2N_(d-1)xN_(d-1)のパーティションモード1694、サイズN_(d-1)x2N_(d-1)のパーティションモード1696、サイズN_(d-1)xN_(d-1)のパーティションモード1698を含んでもよい。
【0252】
パーティションモードのうち、1つのサイズ2N_(d-1)x2N_(d-1)のパーティション、2つのサイズ2N_(d-1)xN_(d-1)のパーティション、2つのサイズN_(d-1)x2N_(d-1)のパーティション、4つのサイズN_(d-1)xN_(d-1)のパーティションごとに反復的に予測符号化を介した符号化が行われ、最小符号化誤差が発生するパーティションモードが検索される。
【0253】
サイズN_(d-1)xN_(d-1)のパーティションモード1698による符号化誤差が最小であるとしても、最大深度がdであるので、深度d-1の符号化単位CU_(d-1)は、それ以上下位深度への分割過程を経ず、現在最大符号化単位1600に係わる深度が深度d-1に決定され、パーティションモードは、N_(d-1)xN_(d-1)と決定される。また、最大深度がdであるので、深度d-1の符号化単位1652に対して、分割情報は設定されない。
【0254】
データ単位1699は、現在最大符号化単位に係わる「最小単位」とされる。一実施形態による最小単位は、最下位深度である最小符号化単位が4分割された大きさの正方形のデータ単位でもある。そのような反復的符号化過程を介して、一実施形態によるビデオ符号化装置800は、符号化単位1600の深度別符号化誤差を比較し、最小の符号化誤差が発生する深度を選択し、深度を決定し、当該パーティションモード及び予測モードが、深度の符号化モードに設定される。
【0255】
かように、深度0,1,…,d-1,dの全ての深度別最小符号化誤差を比較し誤差が最小である深度が選択されて深度で決定される。深度、及び予測単位のパーティションモード及び予測モードは、分割情報として符号化されて伝送される。また、深度0から深度に至るまで符号化単位が分割されなければならないので、深度の分割情報だけが「0」に設定され、深度を除いた深度別分割情報は、「1」に設定されなければならない。
【0256】
一実施形態によるビデオ復号装置900の映像データ及び符号化情報抽出部920は、符号化単位1600に係わる深度、及び予測単位に係わる情報を抽出し、符号化単位1612の復号に利用することができる。一実施形態によるビデオ復号装置900は、深度別分割情報を利用して、分割情報が「0」である深度を深度として把握し、当該深度に係わる分割情報を利用して復号に利用することができる。
【0257】
図17、
図18及び
図19は、一実施形態による、符号化単位、予測単位及び変換単位の関係を図示する。
【0258】
符号化単位1710は、最大符号化単位に対して、一実施形態によるビデオ符号化装置800が決定した深度別符号化単位である。予測単位1760は、符号化単位1710のうちそれぞれの深度別符号化単位の予測単位のパーティションであり、変換単位1770は、それぞれの深度別符号化単位の変換単位である。
【0259】
深度別符号化単位1710は、最大符号化単位の深度が0であるとすれば、符号化単位1712,1054は、深度が1であり、符号化単位1714,1716,1718,1728,1750,1752は、深度が2であり、符号化単位1720,1722,1724,1726,1730,1732,1748は、深度が3であり、符号化単位1740,1742,1744,1746は、深度が4である。
【0260】
予測単位1760において、一部パーティション1714,1716,1722,1732,1748,1750,1752,1754は、符号化単位が分割された形態である。すなわち、パーティション1714,1722,1750,1754は、2NxNのパーティションモードであり、パーティション1716,1748,1752は、Nx2Nのパーティションモードであり、パーティション1732は、NxNのパーティションモードである。深度別符号化単位1710の予測単位及びパーティションは、それぞれの符号化単位より小さいか、あるいはそれと同じである。
【0261】
変換単位1770において、一部変換単位1752の映像データについては、符号化単位に比べて小さいサイズのデータ単位で変換または逆変換が行われる。また、変換単位1714,1716,1722,1732,1748,1750,1752,1754は、予測単位1760において、当該予測単位及びパーティションと比較すれば、互いに異なる大きさまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置800、及び一実施形態に他のビデオ復号装置900は、同一符号化単位に係わるイントラ予測/動き推定/動き補償作業、及び変換/逆変換作業であるとしても、それぞれ別個のデータ単位を基に行われる。
【0262】
それによって、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに、再帰的に符号化が行われ、最適符号化単位が決定されることにより、再帰的ツリー構造による符号化単位が構成される。該符号化情報は、符号化単位に係わる分割情報、パーティションモード情報、予測モード情報、変換単位サイズ情報を含んでもよい。以下、表1は、一実施形態によるビデオ符号化装置800、及び一実施形態によるビデオ復号装置900で設定することができる一例を示す。
【0263】
【表1】
一実施形態によるビデオ符号化装置800の出力部830は、ツリー構造による符号化単位に係わる符号化情報を出力し、一実施形態によるビデオ復号装置900の符号化情報抽出部920は、受信されたビットストリームから、ツリー構造による符号化単位に係わる符号化情報を抽出することができる。
【0264】
分割情報は、現在符号化単位が下位深度の符号化単位に分割されるか否かということを示す。現在深度dの分割情報が0であるならば、現在符号化単位が、下位符号化単位にそれ以上分割されない深度が深度であるので、深度に対して、パーティションモード情報、予測モード、変換単位サイズ情報が定義される。分割情報によって、1段階さらに分割されなければならない場合には、分割された4個の下位深度の符号化単位ごとに、独立して符号化が行われなければならない。
【0265】
予測モードは、イントラモード、インターモード及びスキップモードのうち一つで示すことができる。イントラモード及びインターモードは、全てのパーティションモードで定義され、スキップモードは、パーティションモード2Nx2Nでのみ定義される。
【0266】
パーティションモード情報は、予測単位の高さまたは幅が対称的な比率に分割された対称的パーティションモード2Nx2N,2NxN,Nx2N及びNxNと、非対称的な比率に分割された非対称的パーティションモード2NxnU,2NxnD,nLx2N,nRx2Nを示すことができる。非対称的パーティションモード2NxnU及び2NxnDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的パーティションモードnLx2N及びnRx2Nは、それぞれ幅が1:3及び3:1に分割された形態を示す。
【0267】
変換単位サイズは、イントラモードで二種の大きさ、インターモードで二種の大きさに設定される。すなわち、変換単位分割情報が0であるならば、変換単位の大きさが、現在符号化単位のサイズ2Nx2Nに設定される。変換単位分割情報が1であるならば、現在符号化単位が分割された大きさの変換単位が設定される。また、サイズ2Nx2Nである現在符号化単位に係わるパーティションモードが、対称形パーティションモードであるならば、変換単位の大きさは、NxNに設定され、非対称形パーティションモードであるならば、N/2xN/2に設定される。
【0268】
一実施形態による、ツリー構造による符号化単位の符号化情報は、深度の符号化単位、予測単位及び最小単位単位のうち少なくとも一つに対して割り当てられる。深度の符号化単位は、同一符号化情報を保有している予測単位及び最小単位を1以上含んでもよい。
【0269】
従って、隣接したデータ単位同士それぞれ保有している符号化情報を確認すれば、同一深度の符号化単位に含まれるか否かということが確認される。また、データ単位が保有している符号化情報を利用すれば、当該深度の符号化単位を確認することができるので、最大符号化単位内の深度の分布が類推される。
【0270】
従って、その場合、現在符号化単位が周辺データ単位を参照して予測する場合、現在符号化単位に隣接する深度別符号化単位内のデータ単位の符号化情報が直接参照されて利用される。
【0271】
他の実施形態で、現在符号化単位が周辺符号化単位を参照して予測符号化が行われる場合、隣接する深度別符号化単位の符号化情報を利用し、深度別符号化単位内において、現在符号化単位に隣接するデータが検索されることにより、周辺符号化単位が参照されもする。
【0272】
図20は、表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を図示する。
【0273】
最大符号化単位2000は、深度の符号化単位2002,2004,2006,2012,2014,2016,2018を含む。そのうち1つの符号化単位2018は、深度の符号化単位であるので、分割情報が0に設定される。サイズ2Nx2Nの符号化単位2018のパーティションモード情報は、パーティションモード2Nx2N 2022,2NxN 2024,Nx2N 2026,NxN 2028,2NxnU 2032,2NxnD 2034、nLx2N 2036及びnRx2N 2038のうち一つに設定される。
【0274】
変換単位分割情報(TU size flag)は、変換インデックスの一種であり、変換インデックスに対応する変換単位の大きさは、符号化単位の予測単位タイプまたはパーティションモードによって変更される。
【0275】
例えば、パーティションモード情報が、対称形パーティションモード2Nx2N 2022,2NxN 2024,Nx2N 2026及びNxN 2028のうち一つに設定されている場合、変換単位分割情報が0であるならば、サイズ2Nx2Nの変換単位2042が設定され、変換単位分割情報が1であるならば、サイズNxNの変換単位2044が設定される。
【0276】
パーティションモード情報が非対称形パーティションモード2NxnU 2032,2NxnD 2034、nLx2N 2036及びnRx2N 2038のうち一つに設定された場合、変換単位分割情報(TU size flag)が0であるならば、サイズ2Nx2Nの変換単位2052が設定され、変換単位分割情報が1であるならば、サイズN/2xN/2の変換単位2054が設定される。
【0277】
図20を参照して説明した変換単位分割情報(TU size flag)は、0または1の値を有するフラグであるが、一実施形態による変換単位分割情報は、1ビットのフラグに限定されるものではなく、設定によって、0、1、2、3、…などに増加させ、変換単位が階層的に分割されもする。変換単位分割情報は、変換インデックスの一実施形態として利用される。
【0278】
その場合、一実施形態による変換単位分割情報を、変換単位の最大サイズ、変換単位の最小サイズと共に利用すれば、実際に利用された変換単位の大きさが表現される。一実施形態によるビデオ符号化装置800は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を符号化することができる。符号化された最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報は、SPSに挿入される。一実施形態によるビデオ復号装置900は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を利用し、ビデオ復号に利用することができる。
【0279】
例えば、(a)現在符号化単位がサイズ64x64であり、最大変換単位サイズが32x32であるならば、(a-1)変換単位分割情報が0であるとき、変換単位の大きさは、32x32に設定され、(a-2)変換単位分割情報が1であるとき、変換単位の大きさは、16x16に設定され、(a-3)変換単位分割情報が2であるとき、変換単位の大きさは、8x8に設定される。
【0280】
他の例として、(b)現在符号化単位がサイズ32x32であり、最小変換単位サイズが32x32であるならば、(b-1)変換単位分割情報が0であるとき、変換単位の大きさは、32x32に設定され、変換単位の大きさは、32x32より小さいことがないので、それ以上の変換単位分割情報が設定されることがない。
【0281】
さらに他の例として、(c)現在符号化単位がサイズ64x64であり、最大変換単位分割情報が1であるならば、変換単位分割情報は、0または1であり、他の変換単位分割情報が設定されることがない。
【0282】
従って、最大変換単位分割情報を、「MaxTransformSizeIndex」と定義し、最小変換単位サイズを、「MinTransformSize」と定義し、変換単位分割情報が0である場合の変換単位サイズを、「RootTuSize」と定義するとき、現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」は、下記数式(I)のように定義される。
【0283】
CurrMinTuSize
=max(MinTransformSize, RootTuSize/(2^MaxTransformSizeIndex)) (I)
現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」と比較し、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、システム上採択可能な最大変換単位サイズを示すことができる。すなわち、数式(I)によれば、「RootTuSize/(2^MaxTransformSizeIndex)」は、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」を最大変換単位分割情報に相応する回数ほど分割した変換単位サイズであり、「MinTransformSize」は、最小変換単位サイズであるので、それらのうち小さい値が、現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」でもある。
【0284】
一実施形態による最大変換単位サイズ「RootTuSize」は、予測モードによって異なる。
【0285】
例えば、現在予測モードがインターモードであるならば、「RootTuSize」は、下記数式(II)によって決定される。数式(II)において、「MaxTransformSize」は、最大変換単位サイズを示し、「PUSize」は、現在予測単位サイズを示す。
【0286】
RootTuSize=min(MaxTransformSize, PUSize) (II)
すなわち、現在予測モードがインターモードであるならば、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、最大変換単位サイズ及び現在予測単位サイズのうち小さい値に設定される。
【0287】
現在パーティション単位の予測モードがイントラモードであるならば、「RootTuSize」は、下記数式(III)によって決定される。「PartitionSize」は、現在パーティション単位の大きさを示す。
【0288】
RootTuSize=min(MaxTransformSize, PartitionSize) (III)
すなわち、現在予測モードがイントラモードであるならば、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、最大変換単位サイズ及び現在パーティション単位サイズのうち小さい値に設定される。
【0289】
ただし、パーティション単位の予測モードによって変動する一実施形態による現在最大変換単位サイズ「RootTuSize」は、一実施形態であるのみ、現在最大変換単位サイズを決定する要因は、それらに限定されるものではないということに留意しなければならない。
【0290】
図8ないし
図20を参照して説明した、ツリー構造の符号化単位に基づいたビデオ符号化技法によって、ツリー構造の符号化単位ごとに、空間領域の映像データが符号化され、ツリー構造の符号化単位に基づいたビデオ復号技法によって、最大符号化単位ごとに復号が行われながら、空間領域の映像データが復元され、ピクチャ、及びピクチャシーケンスであるビデオが復元される。復元されたビデオは、再生装置によって再生されるか、記録媒体に保存されるか、あるいはネットワークを介して伝送される。
【0291】
一方、前述の本発明の実施形態は、コンピュータで実行されるプログラムに作成可能であり、コンピュータで読取り可能な記録媒体を利用し、前記プログラムを動作させる汎用デジタルコンピュータで具現される。前記コンピュータで読取り可能な記録媒体は、マグネチック記録媒体(例えば、ROM(read-only memory)、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD-ROM(compact disc read only memory)、DVD(digital versatile disc)など)のような記録媒体を含む。
【0292】
説明の便宜のために、先に
図1Aないし
図20を参照して説明したビデオ符号化方法及び/またはビデオ符号化方法は、「本発明のビデオ符号化方法」と呼ぶ。また、先に
図1Aないし
図20を参照して説明したビデオ復号方法及び/またはビデオ復号方法は、「本発明のビデオ復号方法」と呼ぶ。
【0293】
また、先に
図1Aないし
図20を参照して説明したビデオ符号化装置、ビデオ符号化装置800、またはビデオ符号化部1100で構成されたビデオ符号化装置は、「本発明のビデオ符号化装置」と呼ぶ。また、先に
図1Aないし
図20を参照して説明したビデオ復号装置900、またはビデオ復号部1200で構成されたビデオ復号装置は、「本発明のビデオ復号装置」と呼ぶ。
【0294】
一実施形態による、プログラムが保存されるコンピュータで判読可能な記録媒体がディスク21000である実施形態について以下で詳細に説明する。
【0295】
図21は、一実施形態による、プログラムが保存されたディスク26000の物理的構造を例示する。記録媒体として説明されたディスク26000は、ハードドライブ、CD-ROMディスク、ブルーレイ(Blu-ray(登録商標))ディスク、DVDディスクでもある。ディスク26000は、多数の同心円のトラックTrから構成され、トラックTrは、円周方向に沿って、所定個数のセクタSeに分割される。前述の一実施形態による、プログラムを保存するディスク26000における特定領域に、前述の量子化パラメータ決定方法、ビデオ符号化方法及びビデオ復号方法を具現するためのプログラムが割り当てられて保存される。
【0296】
前述のビデオ符号化方法及びビデオ復号方法を具現するためのプログラムを保存する記録媒体を利用して達成されたコンピュータシステムについて、
図22を参照して説明する。
【0297】
図22は、ディスク26000を利用して、プログラムを記録して判読するためのディスクドライブ26800を図示する。コンピュータシステム26700は、ディスクドライブ26800を利用して、本発明のビデオ符号化方法及びビデオ復号方法のうち少なくとも一つを具現するためのプログラムを、ディスク26000に保存することができる。ディスク26000に保存されたプログラムを、コンピュータシステム26700上で実行するために、ディスクドライブ26800によって、ディスク26000からプログラムが判読され、該プログラムがコンピュータシステム26700に伝送される。
【0298】
図21及び
図22で例示されたディスク26000だけではなく、メモリカード、ROMカセット、SSD(solid state drive)にも本発明のビデオ符号化方法及びビデオ復号方法のうち少なくとも一つを具現するためのプログラムが保存される。
【0299】
前述の実施形態によるビデオ符号化方法及びビデオ復号方法が適用されたシステムについて説明する。
【0300】
図23は、コンテンツ流通サービス(content distribution service)を提供するためのコンテンツ供給システム(content supply system)11000の全体的構造を図示する。通信システムのサービス領域は、所定サイズのセルに分割され、各セルにベースステーションになる無線基地局11700,11800,11900,12000が設置される。
【0301】
コンテンツ供給システム11000は、多数の独立デバイスを含む。例えば、コンピュータ12100、PDA(personal digital assistant)12200、カメラ12600及び携帯電話12500のような独立デバイスが、インターネットサービス・プロバイダ11200、通信網11400及び無線基地局11700,11800,11900,12000を経てインターネット11100に連結される。
【0302】
しかし、コンテンツ供給システム11000は、
図23に図示された構造にのみ限定されるものではなく、デバイスが選択的に連結される。独立デバイスは、無線基地局11700,11800,11900,12000を経ず、通信網11400に直接連結されもする。
【0303】
ビデオカメラ12300は、デジタルビデオカメラのように、ビデオ映像を撮影することができる撮像デバイスである。携帯電話12500は、PDC(personal digital communications)方式、CDMA(code division multiple access)方式、W-CDMA(wideband code division multiple access)方式、GSM(global system for mobile communications(登録商標))方式及びPHS(personal handyphone system)方式のような多様なプロトコルのうち少なくとも1つの通信方式を採択することができる。
【0304】
ビデオカメラ12300は、無線基地局11900及び通信網11400を経て、ストリーミングサーバ11300に連結される。ストリーミングサーバ11300は、ユーザが、ビデオカメラ12300を使用して伝送したコンテンツをリアルタイム放送でストリーミング伝送することができる。ビデオカメラ12300から受信されたコンテンツは、ビデオカメラ12300またはストリーミングサーバ11300によって符号化される。ビデオカメラ12300によって撮影されたビデオデータは、コンピュータ12100を経て、ストリーミングサーバ11300にも伝送される。
【0305】
カメラ12600によって撮影されたビデオデータも、コンピュータ12100を経て、ストリーミングサーバ11300に伝送される。カメラ12600は、デジタルカメラのように、静止映像及びビデオ映像をいずれも撮影することができる撮像装置である。カメラ12600から受信されたビデオデータは、カメラ12600またはコンピュータ12100によって符号化される。ビデオ符号化及びビデオ復号のためのソフトウェアは、コンピュータ12100がアクセスすることができるCD-ROMディスク、フロッピーディスク、ハードディスクドライブ、SSD、メモリカードのようなコンピュータで判読可能な記録媒体に保存される。
【0306】
また、携帯電話12500に搭載されたカメラによってビデオが撮影された場合、ビデオデータが携帯電話12500から受信される。
【0307】
該ビデオデータは、ビデオカメラ12300、携帯電話12500またはカメラ12600に搭載されたLSI(large scale integrated circuit)システムによって符号化される。
【0308】
一実施形態によるコンテンツ供給システム11000において、例えば、コンサートの現場録画コンテンツのように、ユーザがビデオカメラ12300、カメラ12600、携帯電話12500、または他の撮像デバイスを利用して録画されたコンテンツが符号化され、ストリーミングサーバ11300に伝送される。ストリーミングサーバ11300は、コンテンツデータを要請した他のクライアントに、コンテンツデータをストリーミング伝送することができる。
【0309】
該クライアントは、符号化されたコンテンツデータを復号することができるデバイスであり、例えば、コンピュータ12100、PDA 12200、ビデオカメラ12300または携帯電話12500でもある。従って、コンテンツ供給システム11000は、クライアントをして、符号化されたコンテンツデータを受信して再生させる。また、コンテンツ供給システム11000は、クライアントをして、符号化されたコンテンツデータを受信してリアルタイムに復号して再生させ、個人放送(personal broadcasting)を可能にする。
【0310】
コンテンツ供給システム11000に含まれた独立デバイスの符号化動作及び復号動作に、本発明のビデオ符号化装置及びビデオ復号装置が適用される。
【0311】
図24及び
図25を参照し、コンテンツ供給システム11000において、携帯電話12500の一実施形態について詳細に説明する。
【0312】
図24は、一実施形態による、本発明のビデオ符号化方法及びビデオ復号方法が適用される携帯電話12500の外部構造を図示する。携帯電話12500は、機能が制限されておらず、応用プログラムを介して相当部分の機能を変更するか、あるいは拡張することができるスマートフォンでもある。
【0313】
携帯電話12500は、無線基地局12000とRF信号を交換するための内蔵アンテナ12510を含み、カメラ12530によって撮影された映像、またはアンテナ12510によって受信されて復号された映像をディスプレイするためのLCD(liquid crystal display)画面、OLED(organic light emitting diodes)画面のようなディスプレイ画面12520を含む。スマートフォン12510は、制御ボタン、タッチパネルを含む動作パネル12540を含む。ディスプレイ画面12520がタッチスクリーンである場合、動作パネル12540は、ディスプレイ画面12520のタッチ感知パネルをさらに含む。スマートフォン12510は、音声、音響を出力するためのスピーカ12580、または他の形態の音響出力部と、音声、音響が入力されるマイクロフォン12550、または他の形態の音響入力部と、を含む。スマートフォン12510は、ビデオ及び静止映像を撮影するためのCCDカメラのようなカメラ12530をさらに含む。また、スマートフォン12510は、カメラ12530によって撮影されるか、電子メール(E-mail)でもって受信されるか、あるいは他の形態で獲得されたビデオや静止映像のように、符号化されるか、あるいは復号されたデータを保存するための記録媒体12570と、記録媒体12570を携帯電話12500に装着するためのスロット12560と、を含んでもよい。記録媒体12570は、SDカードまたはプラスチックケースに内蔵されたEEPROM(electrically erasable and programmable read only memory)のような他の形態のフラッシュメモリでもある。
【0314】
図25は、携帯電話12500の内部構造を図示する。ディスプレイ画面12520及び動作パネル12540で構成された携帯電話12500の各パートを組織的に制御するために、電力供給回路12700、動作入力制御部12640、映像符号化部12720、カメラ・インターフェース12630、LCD制御部12620、映像復号部12690、マルチプレクサ/デマルチプレクサ(MUX/DEMUX)12680、記録/判読部12670、変調/復調(modulation/demodulation)部12660及び音響処理部12650が、同期化バス12730を介して中央制御部12710に連結される。
【0315】
ユーザが電源ボタンを動作し、「電源オフ」状態から「電源オン」状態に設定すれば、電力供給回路12700は、バッテリパックから携帯電話12500の各パートに電力を供給することにより、携帯電話12500が動作モードにセッティングされる。
【0316】
中央制御部12710は、CPU(central processing unit)、ROM及びRAM(random access memory)含む。
【0317】
携帯電話12500が、外部に通信データを送信する過程においては、中央制御部12710の制御によって、携帯電話12500でデジタル信号が生成される、例えば、音響処理部12650では、デジタル音響信号が生成され、ビデオ符号化部12720では、デジタル映像信号が生成され、動作パネル12540及び動作入力制御部12640を介して、メッセージのテキストデータが生成される。中央制御部12710の制御によって、デジタル信号が変調/復調部12660に伝達されれば、変調/復調部12660は、デジタル信号の周波数帯域を変調し、通信回路12610は、帯域変調されたデジタル音響信号に対して、D/A変換(digital-analog conversion)処理及び周波数変換(frequency conversion)処理を行う。通信回路12610から出力された送信信号は、アンテナ12510を介して、音声通信基地局または無線基地局12000に送出される。
【0318】
例えば、携帯電話12500が通話モードであるとき、マイクロフォン12550によって獲得された音響信号は、中央制御部12710の制御によって、音響処理部12650でデジタル音響信号に変換される。生成されたデジタル音響信号は、変調/復調部12660及び通信回路12610を経て送信信号に変換され、アンテナ12510を介して送出される。
【0319】
データ通信モードで、電子メールのようなテキストメッセージが伝送される場合、動作パネル12540を利用して、メッセージのテキストデータが入力され、テキストデータが、動作入力制御部12640を介して、中央制御部12610に伝送される。中央制御部12610の制御によって、テキストデータは、変調/復調部12660及び通信回路12610を介して送信信号に変換され、アンテナ12510を介して、無線基地局12000に送出される。
【0320】
データ通信モードで、映像データを伝送するために、カメラ12530によって撮影された映像データが、カメラ・インターフェース12630を介して、映像符号化部12720に提供される。カメラ12530によって撮影された映像データは、カメラ・インターフェース12630及びLCD制御部12620を介して、ディスプレイ画面12520に直ちにディスプレイされる。
【0321】
映像符号化部12720の構造は、前述の本発明のビデオ符号化装置の構造と相応する。映像符号化部12720は、カメラ12530から提供された映像データを、前述の本発明のビデオ符号化方式によって符号化し、圧縮符号化された映像データに変換して、符号化された映像データを、多重化/逆多重化部12680に出力することができる。カメラ12530の録画中に、携帯電話12500のマイクロフォン12550によって獲得された音響信号も、音響処理部12650を経て、デジタル音響データに変換され、デジタル音響データは、多重化/逆多重化部12680に伝達される。
【0322】
多重化/逆多重化部12680は、音響処理部12650から提供された音響データと共に、像符号化部12720から提供された符号化された映像データを多重化する。多重化されたデータは、変調/復調部12660及び通信回路12610を介して、送信信号に変換され、アンテナ12510を介して送出される。
【0323】
携帯電話12500が、外部から通信データを受信する過程では、アンテナ12510を介して受信された信号を、周波数復元(frequency recovery)処理及びA/D変換(analog-digital conversion)処理を介して、デジタル信号を変換する。変調/復調部12660は、デジタル信号の周波数帯域を復調する。帯域復調されたデジタル信号は、種類によって、ビデオ復号部12690、音響処理部12650またはLCD制御部12620に伝達される。
【0324】
携帯電話12500は、通話モードであるとき、アンテナ12510を介して受信された信号を増幅し、周波数変換及びA/D変換(analog-digital conversion)処理を介してデジタル音響信号を生成する。受信されたデジタル音響信号は、中央制御部12710の制御によって、変調/復調部12660及び音響処理部12650を経て、アナログ音響信号に変換され、アナログ音響信号が、スピーカ12580を介して出力される。
【0325】
データ通信モードで、インターネットのウェブサイトからアクセスされたビデオファイルのデータが受信される場合、アンテナ12510を介して、無線基地局12000から受信された信号は、変調/復調部12660の処理結果、多重化されたデータを出力し、多重化されたデータは、多重化/逆多重化部12680に伝達される。
【0326】
アンテナ12510を介して受信した多重化されたデータを復号するために、多重化/逆多重化部12680は、多重化されたデータを逆多重化し、符号化されたビデオデータストリームと、符号化されたオーディオデータストリームとを分離する。同期化バス12730によって、符号化されたビデオデータストリームは、ビデオ復号部12690に提供され、符号化されたオーディオデータストリームは、音響処理部12650に提供される。
【0327】
映像復号部12690の構造は、前述の本発明のビデオ復号装置の構造と相応する。映像復号部12690は、前述の本発明のビデオ復号方法を利用し、符号化されたビデオデータを復号し、復元されたビデオデータを生成し、復元されたビデオデータを、LCD制御部12620を経て、ディスプレイ画面12520に復元されたビデオデータを提供することができる。
【0328】
それにより、インターネットのウェブサイトからアクセスされたビデオファイルのビデオデータが、ディスプレイ画面12520でディスプレイされる。それと同時に、音響処理部12650も、オーディオデータをアナログ音響信号に変換し、アナログ音響信号をスピーカ12580に提供することができる。それによって、インターネットのウェブサイトからアクセスされたビデオファイルに含まれたオーディオデータも、スピーカ12580で再生される。
【0329】
携帯電話12500、または他の形態の通信端末機は、本発明のビデオ符号化装置及びビデオ復号装置をいずれも含む送受信端末機であるか、前述の本発明のビデオ符号化装置のみを含む送信端末機であるか、あるいは本発明のビデオ復号装置のみを含む受信端末機でもある。
【0330】
本発明の通信システムは、
図25を参照して説明した構造に限定されるものではない。例えば、
図26は、一実施形態による通信システムが適用されたデジタル放送システムを図示する。
【0331】
図26の一実施形態によるデジタル放送システムは、本発明のビデオ符号化装置及びビデオ復号装置を利用し、衛星ネットワークまたは地上波ネットワークを介して伝送されるデジタル放送を受信することができる。
【0332】
具体的に述べれば、放送局12890は、電波を介して、ビデオデータストリームを通信衛星または放送衛星12900に伝送する。放送衛星12900は、放送信号を伝送し、該放送信号は、家庭にあるアンテナ12860によって、衛星放送受信機に受信される。各家庭で、符号化されたビデオストリームは、TV受信機12810、セットトップボックス(set-topbox)12870、または他のデバイスによって復号されて再生される。
【0333】
再生装置12830において、本発明のビデオ復号装置が具現されることにより、再生装置12830が、ディスク及びメモリカードのような記録媒体12820に記録された符号化されたビデオストリームを判読して復号することができる。それによって、復元されたビデオ信号は、例えば、モニタ12840で再生される。
【0334】
衛星/地上波放送のためのアンテナ12860、またはケーブルTV受信のためのケーブルアンテナ12850に連結されたセットトップボックス12870にも、本発明のビデオ復号装置が搭載される。セットトップボックス12870の出力データも、TVモニタ12880で再生される。
【0335】
他の例として、セットトップボックス12870の代りに、TV受信機12810自体に、本発明のビデオ復号装置が搭載されもする。
【0336】
適切なアンテナ12910を具備した自動車12920が、衛星12800または無線基地局11700から送出される信号を受信することもできる。自動車12920に搭載された自動車ナビゲーションシステム12930のディスプレイ画面に、復号されたビデオが再生される。
【0337】
ビデオ信号は、本発明のビデオ符号化装置によって符号化されて記録媒体に記録されて保存される。具体的に見れば、DVDレコーダによって、映像信号がDVDディスク12960に保存されるか、あるいはハードディスクレコーダ12950によってハードディスクに映像信号が保存される。他の例として、該ビデオ信号は、SDカード12970に保存されもする。ハードディスクレコーダ12950が、一実施形態による本発明のビデオ復号装置を具備すれば、DVDディスク12960、SDカード12970、または他の形態の記録媒体に記録されたビデオ信号がモニタ12880で再生される。
【0338】
自動車ナビゲーションシステム12930は、
図25のカメラ12530、カメラ・インターフェース12630及びビデオ符号化部12720を含まないこともある。例えば、コンピュータ12100及びTV受信機12810も、
図25のカメラ12530、カメラ・インターフェース12630及びビデオ符号化部12720を含まないこともある。
【0339】
図27は、一実施形態による、ビデオ符号化装置及びビデオ復号装置を利用するクラウドコンピューティングシステムのネットワーク構造を図示する。
【0340】
本発明のクラウドコンピューティングシステムは、クラウドコンピューティングサーバ14000、ユーザDB 14100、コンピューティング資源14200及びユーザ端末機を含んでなる。
【0341】
該クラウドコンピューティングシステムは、ユーザ端末機の要請により、インターネットのような情報通信網を介して、コンピューティング資源のオンデマンド・アウトソーシングサービスを提供する。クラウドコンピュータ環境で、サービスプロバイダは、互いに異なる物理的な位置に存在するデータセンターのコンピューティング資源を仮想化技術で統合し、ユーザが必要とするサービスを提供する。サービスユーザは、アプリケーション(application)、ストレージ(storage)、運用体制(OS)、保安(security)などのコンピューティング資源を、各ユーザ所有の端末にインストールして使用するのではなく、仮想化技術を介して生成された仮想空間上のサービスを、所望時点に所望程度選んで使用することができる。
【0342】
特定サービスユーザのユーザ端末機は、インターネット及び移動通信網を含む情報通信網を介して、クラウドコンピューティングサーバ14100に接続する。ユーザ端末機は、クラウドコンピューティングサーバ14100から、クラウドコンピューティングサービス、特に、動画再生サービスを提供される。ユーザ端末機は、デスクトップPC 14300、スマートTV 14400、スマートフォン14500、ノート型パソコン14600、PMP(portable multimedia player)14700、タブレットPC 14800など、インターネット接続が可能な全ての電子機器にもなる。
【0343】
クラウドコンピューティングサーバ14100は、クラウド網に分散されている多数のコンピューティング資源14200を統合し、ユーザ端末機に提供することができる。多数のコンピューティング資源14200は、さまざまなデータサービスを含み、ユーザ端末機からアップロードされたデータを含んでもよい。かように、クラウドコンピューティングサーバ14100は、さまざまなところに分散している動画データベースを仮想化技術で統合し、ユーザ端末機が要求するサービスを提供する。
【0344】
ユーザDB 14100には、クラウドコンピューティングサービスに加入しているユーザ情報が保存される。ここで、該ユーザ情報は、ログイン情報と、住所、氏名など個人信用情報と、を含んでもよい。また、ユーザ情報は、動画のインデックス(index)を含んでもよい。ここで、該インデックスは、再生を完了した動画リスト、再生中の動画リスト、再生中動画の停止時点などを含んでもよい。
【0345】
ユーザDB 14100に保存された動画に係わる情報は、ユーザデバイス間に共有される。従って、例えば、ノート型パソコン14600から再生要請され、ノート型パソコン14600に、所定動画サービスを提供した場合、ユーザDB 14100に、所定動画サービスの再生ヒストリーが保存される。スマートフォン14500から、同一動画サービスの再生要請が受信される場合、クラウドコンピューティングサーバ14100は、ユーザDB 14100を参照し、所定動画サービスを探して再生する。スマートフォン14500が、クラウドコンピューティングサーバ14100を介して、動画データストリームを受信する場合、動画データストリームを復号し、ビデオを再生する動作は、先に
図24を参照して説明した携帯電話12500の動作と類似している。
【0346】
クラウドコンピューティングサーバ14100は、ユーザDB 14100に保存された所定動画サービスの再生ヒストリーを参照することもできる。例えば、クラウドコンピューティングサーバ14100は、ユーザ端末機から、ユーザDB 14100に保存された動画に対する再生要請を受信する。該動画が、それ以前に再生中であったのなら、クラウドコンピューティングサーバ14100は、ユーザ端末機からの選択によって、最初から再生するか、あるいは以前停止時点から再生するかということにより、ストリーミング方法が異なる。例えば、ユーザ端末機が、最初から再生するように要請した場合には、クラウドコンピューティングサーバ14100がユーザ端末機に、当該動画を最初フレームからストリーミング伝送する。一方、端末機が、以前停止時点から続けて再生するように要請した場合には、クラウドコンピューティングサーバ14100がユーザ端末機に、当該動画を停止時点のフレームからストリーミング伝送する。
【0347】
そのとき、ユーザ端末機は、
図1Aないし
図20を参照して説明した本発明のビデオ復号装置を含んでもよい。他の例として、ユーザ端末機は、
図1Aないし
図20を参照して説明した本発明のビデオ符号化装置を含んでもよい。また、ユーザ端末機は、
図1Aないし
図20を参照して説明した本発明のビデオ符号化装置及びビデオ復号装置をいずれも含んでもよい。
【0348】
図1Aないし
図20を参照して説明したビデオ符号化方法及びビデオ復号方法、ビデオ符号化装置及びビデオ復号装置が活用される一実施形態について、
図21ないし
図27で説明した。しかし、
図1Aないし
図20を参照して説明したビデオ符号化方法及びビデオ復号方法が、記録媒体に保存されたり、ビデオ符号化装置及びビデオ復号装置がデバイスで具現されたりする一実施形態は、
図21ないし
図27の実施形態に限定されるものではない。
【0349】
本発明による方法、プロセス、装置、製品及び/またはシステムは、簡単であり、コスト的に効果的であり、複雑ではないく、かつ非常に多様で正確である。また、本発明による、プロセス、装置、製品及びシステムに、周知の構成要素を適用することにより、即座に利用することができるが、効率的で経済的な製造、応用及び活用を具現することができる。本発明の他の重要な側面は、コスト低減、システム単純化、性能上昇を要求する現趨勢に符合するものである。かような本発明の実施形態に見ることができる有用な様相は、結果として、少なくとも現技術のレベルを高くするであろう。
【0350】
本発明は、特定の最上の実施形態に係わって説明したが、それら以外に、本発明に、代替、変形及び修正が適用された発明は、前述の説明に照らし、当業者に明白であろう。すなわち、特許請求の範囲は、そのような全ての代替、変形及び修正がなされた発明を含むように解釈する。従って、該明細書及び図面で説明した全ての内容は、例示的であって非制限的な意味に解釈されなければならない。本発明による方法、プロセス、装置、製品及び/またはシステムは、簡単であり、コスト的に効果的であり、複雑ではないので、非常に多様であって正確である。また、本発明による、プロセス、装置、製品及びシステムに、周知の構成要素を適用することにより、即座に利用することができ、効率的で経済的な製造、応用及び活用を具現することができる。本発明の他の重要な側面は、コスト低減、システム単純化、性能上昇を要求する現趨勢に符合するというのである。かような本発明の実施形態に見ることができる有用な様相は、結果的に、少なくとも現技術のレベルを高めることができるであろう。
【0351】
本発明は、特定の最上の実施形態に係わって説明しが、それら以外に、本発明に代替、変形及び修正が適用された発明は、前述の説明に照らし、当業者に明白であろう。すなわち、特許請求の範囲は、そのような全ての代替、変形及び修正がなされた発明を含むように解釈するのである。従って、該明細書及び図面で説明した全ての内容は、例示的であって非制限的な意味に解釈されなければならない。
【0352】
以下、実施の形態に基づく手段を例示的に列挙する。
(付記1)
動きベクトルの符号化装置において、
現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得し、前記予測動きベクトル候補を使用し、前記現在ブロックの予測動きベクトル、前記現在ブロックの動きベクトル、及び前記現在ブロックの動きベクトル解像度を決定する予測部と、
前記現在ブロックの予測動きベクトルを示す情報、前記現在ブロックの動きベクトルと、前記現在ブロックの予測動きベクトルとの残差動きベクトル、及び前記現在ブロックの動きベクトル解像度を示す情報を符号化する符号化部と、を含み、
前記所定の複数動きベクトル解像度は、1画素単位の解像度より大きい画素単位の解像度を含むことを特徴とする装置。
(付記2)
前記予測部は、
前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合を使用し、前記第1動きベクトル解像度の画素単位に参照ブロックを探索し、
前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を使用し、前記第2動きベクトル解像度の画素単位に参照ブロックを探索し、
前記第1動きベクトル解像度と、前記第2動きベクトル解像度は、互いに異なる解像度であり、
前記第1予測動きベクトル候補集合と、前記第2予測動きベクトル候補集合は、前記空間的候補ブロック及び時間的候補ブロックに含まれた候補ブロックのうち互いに異なる候補ブロックから獲得されることを特徴とする付記1に記載の装置。
(付記3)
前記予測部は、
前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合を使用し、前記第1動きベクトル解像度の画素単位に参照ブロックを探索し、
前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を使用し、前記第2動きベクトル解像度の画素単位に参照ブロックを探索し、
前記第1動きベクトル解像度と、前記第2動きベクトル解像度は、互いに異なる解像度であり、
前記第1予測動きベクトル候補集合と、前記第2予測動きベクトル候補集合は、互いに異なる個数の予測動きベクトル候補を含むことを特徴とする付記1に記載の装置。
(付記4)
前記符号化部は、
前記現在ブロックの動きベクトルの解像度の画素単位が、最小動きベクトル解像度の画素単位より大きい場合、前記残差動きベクトルを、前記現在ブロックの動きベクトルの解像度によってダウンスケーリングして符号化することを特徴とする付記1に記載の装置。
(付記5)
前記現在ブロックが、映像を構成する現在符号化単位であり、符号化単位別に動きベクトル解像度が同一に決定され、前記現在符号化単位内にAMVP(advanced motion vector prediction)モードと予測された予測単位が存在すれば、
前記符号化部は、前記現在ブロックの動きベクトル解像度を示す情報として、前記AMVPモードと予測された予測単位の動きベクトル解像度を示す情報を1回符号化することを特徴とする付記1に記載の装置。
(付記6)
前記現在ブロックが、映像を構成する現在符号化単位であり、予測単位別に動きベクトル解像度が同一に決定され、前記現在符号化単位内にAMVPモードと予測された予測単位が存在すれば、
前記符号化部は、前記現在ブロックの動きベクトル解像度を示す情報として、前記現在ブロック内に存在するAMVPモードと予測された予測単位別に、動きベクトル解像度を示す情報を符号化することを特徴とする付記1に記載の装置。
(付記7)
動きベクトルの符号化装置において、
現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得し、前記予測動きベクトル候補を使用し、前記現在ブロックの予測動きベクトル、前記現在ブロックの動きベクトル、及び前記現在ブロックの動きベクトル解像度を決定する予測部と、
前記現在ブロックの予測動きベクトルを示す情報、前記現在ブロックの動きベクトルと、前記現在ブロックの予測動きベクトルとの残差動きベクトル、及び前記現在ブロックの動きベクトル解像度を示す情報を符号化する符号化部と、を含み、
前記予測部は、
前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合を使用し、前記第1動きベクトル解像度の画素単位に参照ブロックを探索し、
前記予測動きベクトル候補のうちから選択された1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を使用し、前記第2動きベクトル解像度の画素単位に参照ブロックを探索し、
前記第1動きベクトル解像度と、前記第2動きベクトル解像度は、互いに異なる解像度であり、
前記第1予測動きベクトル候補集合と、前記第2予測動きベクトル候補集合は、前記空間的候補ブロック及び時間的候補ブロックに含まれる候補ブロックのうち互いに異なる候補ブロックから獲得されるか、あるいは互いに異なる個数の予測動きベクトル候補を含むことを特徴とする装置。
(付記8)
動きベクトルの符号化装置において、
現在ブロックに係わる少なくとも1つのマージ候補を含むマージ候補リストを生成し、前記マージ候補リストに含まれたマージ候補のうち1つの候補の動きベクトルを利用し、前記現在ブロックの動きベクトルを決定して符号化し、
前記マージ候補リストは、前記マージ候補リストに含まれた候補の動きベクトルを、所定の複数動きベクトル解像度によってダウンスケーリングした動きベクトルを含むことを特徴とする装置。
(付記9)
前記ダウンスケーリングは、
前記最小動きベクトル解像度の動きベクトルが示す画素の代わりに、前記最小動きベクトル解像度の動きベクトルが示す画素の周辺に位置した画素のうちいずれか1つの画素を、前記現在ブロックの動きベクトルの解像度に基づいて選択し、前記選択された画素を示すように調整することを特徴とする付記8に記載の装置。
(付記10)
動きベクトルの復号装置において、
現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得し、前記予測動きベクトル候補のうち前記現在ブロックの予測動きベクトルを示す情報を獲得し、前記現在ブロックの動きベクトルと、前記現在ブロックの予測動きベクトルとの残差動きベクトル、及び前記現在ブロックの動きベクトル解像度を示す情報を獲得する獲得部と、
前記残差動きベクトル、前記現在ブロックの予測動きベクトルを示す情報、及び前記現在ブロックの動きベクトル解像度情報に基づいて、前記現在ブロックの動きベクトルを復元する復号部と、を含み、
前記所定の複数動きベクトル解像度は、1画素単位の解像度より大きい画素単位の解像度を含むことを特徴とする装置。
(付記11)
前記所定の複数動きベクトル解像度の予測動きベクトル候補は、
第1動きベクトル解像度の1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合、及び第2動きベクトル解像度の1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を含み、
前記第1動きベクトル解像度と、前記第2動きベクトル解像度は、互いに異なる解像度であり、
前記第1予測動きベクトル候補集合と、前記第2予測動きベクトル候補集合は、前記空間的候補ブロック及び時間的候補ブロックに含まれる候補ブロックのうち互いに異なる候補ブロックから獲得されるか、あるいは互いに異なる個数の予測動きベクトル候補を含むことを特徴とする付記10に記載の装置。
(付記12)
前記復号部は、
前記現在ブロックの動きベクトルの解像度の画素単位が、最小動きベクトル解像度の画素単位より大きい場合、前記残差動きベクトルを、前記最小動きベクトル解像度によってアップスケーリングして復元することを特徴とする付記10に記載の装置。
(付記13)
前記現在ブロックが、映像を構成する現在符号化単位であり、符号化単位別に、動きベクトル解像度が同一に決定され、前記現在符号化単位内に、AMVP(advanced motion vector prediction)モードと予測された予測単位が存在すれば、
前記獲得部は、前記ビットストリームから、前記現在ブロックの動きベクトル解像度を示す情報として、前記AMVPモードと予測された予測単位の動きベクトル解像度を示す情報を1回獲得することを特徴とする付記10に記載の装置。
(付記14)
動きベクトルの復号装置において、
現在ブロックに係わる少なくとも1つのマージ候補を含むマージ候補リストを生成し、前記マージ候補リストに含まれたマージ候補のうち1つの候補の動きベクトルを利用し、前記現在ブロックの動きベクトルを決定して復号し、
前記マージ候補リストは、前記マージ候補リストに含まれた候補の動きベクトルを、所定の複数動きベクトル解像度によってダウンスケーリングした動きベクトルを含むことを特徴とする装置。
(付記15)
動きベクトルの復号装置において、
現在ブロックの空間的候補ブロック及び時間的候補ブロックを使用し、所定の複数動きベクトル解像度の予測動きベクトル候補を獲得し、前記予測動きベクトル候補のうち前記現在ブロックの予測動きベクトルを示す情報を獲得し、前記現在ブロックの動きベクトルと、前記現在ブロックの予測動きベクトルとの残差動きベクトル、及び前記現在ブロックの動きベクトル解像度を示す情報を獲得する獲得部と、
前記残差動きベクトル、前記現在ブロックの予測動きベクトルを示す情報、及び前記現在ブロックの動きベクトル解像度情報に基づいて、前記現在ブロックの動きベクトルを復元する復号部と、を含み、
前記所定の複数動きベクトル解像度の予測動きベクトル候補は、
第1動きベクトル解像度の1以上の予測動きベクトル候補を含む第1予測動きベクトル候補の集合、及び第2動きベクトル解像度の1以上の予測動きベクトル候補を含む第2予測動きベクトル候補の集合を含み、
前記第1動きベクトル解像度と、前記第2動きベクトル解像度は、互いに異なる解像度であり、
前記第1予測動きベクトル候補集合と、前記第2予測動きベクトル候補集合は、前記空間的候補ブロック及び時間的候補ブロックに含まれた候補ブロックのうち互いに異なる候補ブロックから獲得されるか、あるいは互いに異なる個数の予測動きベクトル候補を含むことを特徴とする装置。
【先行技術文献】
【特許文献】
【0353】
【特許文献1】特開平7-240927号公報
【特許文献2】特開2006-187025号公報