(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-15
(45)【発行日】2022-08-23
(54)【発明の名称】画像予測方法および関連装置
(51)【国際特許分類】
H04N 19/52 20140101AFI20220816BHJP
H04N 19/46 20140101ALI20220816BHJP
【FI】
H04N19/52
H04N19/46
【外国語出願】
(21)【出願番号】P 2019114759
(22)【出願日】2019-06-20
(62)【分割の表示】P 2017518250の分割
【原出願日】2015-04-15
【審査請求日】2019-07-18
【審判番号】
【審判請求日】2021-07-26
(31)【優先権主張番号】201410526608.8
(32)【優先日】2014-09-30
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】503433420
【氏名又は名称】華為技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian, Longgang District, Shenzhen, Guangdong 518129, P.R. China
(73)【特許権者】
【識別番号】505383316
【氏名又は名称】中国科学技▲術▼大学
【氏名又は名称原語表記】UNIVERSITY OF SCIENCE AND TECHNOLOGY OF CHINA
【住所又は居所原語表記】96, Jinzhai Road, Baohe District, Hefei, Anhui 230026, P.R. China
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(72)【発明者】
【氏名】李 礼
(72)【発明者】
【氏名】李 厚▲強▼
(72)【発明者】
【氏名】▲呂▼ 卓逸
(72)【発明者】
【氏名】林 四新
【合議体】
【審判長】清水 正一
【審判官】川崎 優
【審判官】新井 寛
(56)【参考文献】
【文献】特開2012-165278(JP,A)
【文献】Han Huang et al., ”Control-Point Representation and Differential Coding Affine-Motion Compensation”, IEEE Transactions on Circuits and Systems for Video Technology, Oct. 2013, Vol.23, No.10, pp.1651-1660
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
ビデオ符号化処理に使用される画像予測方法であって、
現在の画像ブロック
のK個のピクセルサンプルの運動ベクトル予測子(MVP)を判断するステップであって、Kは1よりも大きい整数である、ステップと、
運動推定によって前記K個のピクセルサンプルの運動ベクトルを取得するステップと、
前記K個のピクセルサンプルの前記運動ベクトルおよび対応するMVPに基づいて、前記K個のピクセルサンプルの運動ベクトル差(MVD)を取得するステップと、
前記K個のピクセルサンプルの前記MVDに0でないものがある場合、フラグおよび前記K個のピクセルサンプルの前記MVDをビットストリームに書き込むステップであって、前記フラグの値は第1の値に設定される、ステップ、または前記K個のピクセルサンプルの前記MVDがいずれも0である場合、フラグをビットストリームに書き込むステップであって、前記フラグの値は第2の値に設定される、ステップと、
非並進運動モデルおよび前記K個のピクセルサンプルの前記運動ベクトルに基づいて、前記現在の画像ブロックにある各ピクセルの予測ピクセル値を取得するステップと
を含み、
前記フラグは
、前記現在の画像ブロック
の前記K個のピクセルサンプルのすべてのMVDが0であるか否かを
1ビットで指示する、方法。
【請求項2】
前記K個のピクセルサンプルは、前記現在の画像ブロックで左上ピクセルサンプル、右上ピクセルサンプル、または左下ピクセルサンプルにある少なくとも2つのピクセルサンプルを含み、
前記現在の画像ブロックにおける前記左上ピクセルサンプルは、前記現在の画像ブロックの左上頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの左上頂点を含むピクセルブロックであり、
前記現在の画像ブロックにおける前記左下ピクセルサンプルは、前記現在の画像ブロックの左下頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの左下頂点を含むピクセルブロックであり、
前記現在の画像ブロックにおける前記右上ピクセルサンプルは、前記現在の画像ブロックの右上頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの右上頂点を含むピクセルブロックである、請求項1に記載の方法。
【請求項3】
非並進運動モデルおよび前記K個のピクセルサンプルの前記運動ベクトルに基づいて、前記現在の画像ブロックにある各ピクセルの予測ピクセル値を取得する前記ステップは、
前記非並進運動モデルおよび前記K個のピクセルサンプルの前記運動ベクトルに基づいて、前記現在の画像ブロックにある各ピクセルの運動ベクトルを計算するステップと、
前記現在の画像ブロックにある各ピクセルの計算された運動ベクトルに基づいて、前記現在の画像ブロックに対しピクセル値予測を遂行するステップと
を含む、請求項1または2に記載の方法。
【請求項4】
前記フラグの前記第1の値はfalseであり、前記フラグの前記第2の値はtrueである、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記K個のピクセルサンプルの前記運動ベクトルおよび対応するMVPに基づいて、前記K個のピクセルサンプルの運動ベクトル差(MVD)を取得する前記ステップは、
前記K個のピクセルサンプルの前記運動ベクトルと前記対応するMVPとの間で減算を遂行することによって、前記K個のピクセルサンプルの前記MVDを取得するステップ
を含む、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記非並進運動モデルは、アフィン変換モデル、放物運動モデル、回転運動モデル、パースペクティブ運動モデル、せん断運動モデル、または拡大縮小運動モデルのうちのいずれか1つのモデルである、請求項1から5のいずれか一項に記載の方法。
【請求項7】
ビデオ復号化処理に使用される画像予測方法であって、
現在の画像ブロック
のK個のピクセルサンプルの運動ベクトル予測子(MVP)を判断するステップであって、Kは1よりも大きい整数である、ステップと、
ビットストリームから前記現在の画像ブロックのフラグを復号化するステップと、
前記フラグの値が第1の値である場合、前記ビットストリームから前記K個のピクセルサンプルの運動ベクトル差(MVD)を復号化するか、または前記フラグの値が第2の値である場合、前記K個のピクセルサンプルの前記MVDがすべて0であると判断し、前記K個のピクセルサンプルの前記MVDおよび前記K個のピクセルサンプルの対応するMVPに基づいて、前記K個のピクセルサンプルの個々の運動ベクトルを取得するステップと、
非並進運動モデルおよび前記K個のピクセルサンプルの前記運動ベクトルに基づいて、前記現在の画像ブロックにある各ピクセルの予測ピクセル値を取得するステップと
を含み、
前記フラグは
、前記現在の画像ブロック
の前記K個のピクセルサンプルのすべてのMVDが0であるか否かを
1ビットで指示する、方法。
【請求項8】
前記K個のピクセルサンプルは、前記現在の画像ブロックで左上ピクセルサンプル、右上ピクセルサンプル、または左下ピクセルサンプルにある少なくとも2つのピクセルサンプルを含み、
前記現在の画像ブロックにおける前記左上ピクセルサンプルは、前記現在の画像ブロックの左上頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの左上頂点を含むピクセルブロックであり、
前記現在の画像ブロックにおける前記左下ピクセルサンプルは、前記現在の画像ブロックの左下頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの左下頂点を含むピクセルブロックであり、
前記現在の画像ブロックにおける前記右上ピクセルサンプルは、前記現在の画像ブロックの右上頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの右上頂点を含むピクセルブロックである、請求項7に記載の方法。
【請求項9】
非並進運動モデルおよび前記K個のピクセルサンプルの前記運動ベクトルに基づいて、前記現在の画像ブロックにある各ピクセルの予測ピクセル値を取得する前記ステップは、
前記非並進運動モデルおよび前記K個のピクセルサンプルの前記運動ベクトルに基づいて、前記現在の画像ブロックにある各ピクセルの運動ベクトルを計算するステップと、
前記現在の画像ブロックにある各ピクセルの計算された運動ベクトルに基づいて、前記現在の画像ブロックに対しピクセル値予測を遂行するステップと
を含む、請求項7または8に記載の方法。
【請求項10】
前記フラグの前記第2の値はtrueであり、前記フラグの前記第2の値は、前記現在の画像ブロック
の前記K個のピクセルサンプルの前記MVDがいずれも0であることを指示し、
前記フラグの前記第1の値はfalseであり、前記フラグの前記第1の値は、前記K個のピクセルサンプルの前記MVDに0でないものがあることを指示する、請求項7から9のいずれか一項に記載の方法。
【請求項11】
前記非並進運動モデルは、アフィン変換モデル、放物運動モデル、回転運動モデル、パースペクティブ運動モデル、せん断運動モデル、または拡大縮小運動モデルのうちのいずれか1つのモデルである、請求項7から10のいずれか一項に記載の方法。
【請求項12】
符号化装置であって、
現在の画像ブロック
のK個のピクセルサンプルの運動ベクトル予測子(MVP)を判断するように構成された第1のユニットであって、Kは1よりも大きい整数である、第1のユニットと、
運動推定によって前記K個のピクセルサンプルの運動ベクトルを取得するように構成された第2のユニットと、
前記K個のピクセルサンプルの前記運動ベクトルおよび対応するMVPに基づいて、前記K個のピクセルサンプルの運動ベクトル差(MVD)を取得するように構成された第3のユニットと、
前記K個のピクセルサンプルの前記MVDに0でないものがある場合、フラグおよび前記K個のピクセルサンプルの前記MVDをビットストリームに書き込むことであって、前記フラグの値は第1の値に設定される、こと、または前記K個のピクセルサンプルの前記MVDがいずれも0である場合、フラグをビットストリームに書き込むことであって、前記フラグの値は第2の値に設定される、ことを行うように構成された第4のユニットと、
非並進運動モデルおよび前記K個のピクセルサンプルの前記運動ベクトルに基づいて、前記現在の画像ブロックにある各ピクセルの予測ピクセル値を取得するように構成された第5のユニットと
を含み、
前記フラグは
、前記現在の画像ブロック
の前記K個のピクセルサンプルのすべてのMVDが0であるか否かを
1ビットで指示する、装置。
【請求項13】
前記K個のピクセルサンプルは、前記現在の画像ブロックで左上ピクセルサンプル、右上ピクセルサンプル、または左下ピクセルサンプルにある少なくとも2つのピクセルサンプルを含み、
前記現在の画像ブロックにおける前記左上ピクセルサンプルは、前記現在の画像ブロックの左上頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの左上頂点を含むピクセルブロックであり、
前記現在の画像ブロックにおける前記左下ピクセルサンプルは、前記現在の画像ブロックの左下頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの左下頂点を含むピクセルブロックであり、
前記現在の画像ブロックにおける前記右上ピクセルサンプルは、前記現在の画像ブロックの右上頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの右上頂点を含むピクセルブロックである、請求項12に記載の装置。
【請求項14】
前記第5のユニットは、
前記非並進運動モデルおよび前記K個のピクセルサンプルの前記運動ベクトルに基づいて、前記現在の画像ブロックにある各ピクセルの運動ベクトルを計算することと、
前記現在の画像ブロックにある各ピクセルの計算された運動ベクトルに基づいて、前記現在の画像ブロックに対しピクセル値予測を遂行することと
を行うようにさらに構成される、請求項12または13に記載の装置。
【請求項15】
前記フラグの前記第1の値はfalseであり、前記フラグの前記第2の値はtrueである、請求項12から14のいずれか一項に記載の装置。
【請求項16】
前記第3のユニットは、
前記K個のピクセルサンプルの前記運動ベクトルと前記対応するMVPとの間で減算を遂行することによって、前記K個のピクセルサンプルの前記MVDを取得すること
を行うようにさらに構成される、請求項12から15のいずれか一項に記載の装置。
【請求項17】
前記非並進運動モデルは、アフィン変換モデル、放物運動モデル、回転運動モデル、パースペクティブ運動モデル、せん断運動モデル、または拡大縮小運動モデルのうちのいずれか1つのモデルである、請求項12から16のいずれか一項に記載の装置。
【請求項18】
復号化装置処理であって、
現在の画像ブロック
のK個のピクセルサンプルの運動ベクトル予測子(MVP)を判断するように構成された第1のユニットであって、Kは1よりも大きい整数である、第1のユニットと、
ビットストリームから前記現在の画像ブロックのフラグを復号化するように構成された第2のユニットと、
前記フラグの値が第1の値である場合、前記ビットストリームから前記K個のピクセルサンプルの運動ベクトル差(MVD)を復号化するか、または前記フラグの値が第2の値である場合、前記K個のピクセルサンプルの前記MVDがすべて0であると判断し、前記K個のピクセルサンプルの前記MVDおよび前記K個のピクセルサンプルの対応するMVPに基づいて、前記K個のピクセルサンプルの個々の運動ベクトルを取得することを行うように構成された第3のユニットと、
非並進運動モデルおよび前記K個のピクセルサンプルの前記運動ベクトルに基づいて、前記現在の画像ブロックにある各ピクセルの予測ピクセル値を取得するように構成された第4のユニットと
を含み、
前記フラグは
、前記現在の画像ブロック
の前記K個のピクセルサンプルのすべてのMVDが0であるか否かを
1ビットで指示する、装置。
【請求項19】
前記K個のピクセルサンプルは、前記現在の画像ブロックで左上ピクセルサンプル、右上ピクセルサンプル、または左下ピクセルサンプルにある少なくとも2つのピクセルサンプルを含み、
前記現在の画像ブロックにおける前記左上ピクセルサンプルは、前記現在の画像ブロックの左上頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの左上頂点を含むピクセルブロックであり、
前記現在の画像ブロックにおける前記左下ピクセルサンプルは、前記現在の画像ブロックの左下頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの左下頂点を含むピクセルブロックであり、
前記現在の画像ブロックにおける前記右上ピクセルサンプルは、前記現在の画像ブロックの右上頂点であるか、または前記現在の画像ブロック内にあって前記現在の画像ブロックの右上頂点を含むピクセルブロックである、請求項18に記載の装置。
【請求項20】
前記第4のユニットは、
前記非並進運動モデルおよび前記K個のピクセルサンプルの前記運動ベクトルに基づいて、前記現在の画像ブロックにある各ピクセルの運動ベクトルを計算することと、
前記現在の画像ブロックにある各ピクセルの計算された運動ベクトルに基づいて、前記現在の画像ブロックに対しピクセル値予測を遂行することと
を行うようにさらに構成される、請求項18または19に記載の装置。
【請求項21】
前記フラグの前記第2の値はtrueであり、前記フラグの前記第2の値は、前記現在の画像ブロック
の前記K個のピクセルサンプルの前記MVDがいずれも0であることを指示し、
前記フラグの前記第1の値はfalseであり、前記フラグの前記第1の値は、前記K個のピクセルサンプルの前記MVDに0でないものがあることを指示する、請求項18から20のいずれか一項に記載の装置。
【請求項22】
前記非並進運動モデルは、アフィン変換モデル、放物運動モデル、回転運動モデル、パースペクティブ運動モデル、せん断運動モデル、または拡大縮小運動モデルのうちのいずれか1つのモデルである、請求項18から21のいずれか一項に記載の装置。
【請求項23】
符号化装置であって、
命令を格納した記憶装置と、
前記記憶装置と通信する1つ以上のプロセッサと
を含み、
前記1つ以上のプロセッサは、前記命令を実行して請求項1から6のいずれか一項に記載の方法を実施する、装置。
【請求項24】
復号化装置であって、
命令を格納した記憶装置と、
前記記憶装置と通信する1つ以上のプロセッサと
を含み、
前記1つ以上のプロセッサは、前記命令を実行して請求項7から11のいずれか一項に記載の方法を実施する、装置。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、2014年9月30日に中国特許庁に出願された「PICTURE PREDICTION METHOD AND RELATED APPARATUS」と題する中国特許出願第201410526608.8号の優先権を主張するものであり、引用によって上記中国特許出願の全文が本願に援用される。
【0002】
本発明は画像処理技術分野に関し、具体的には画像予測方法および関連装置に関する。
【背景技術】
【0003】
光電式取得技術の開発と高精細デジタルビデオに対する要求の絶えざる高まりを受けてビデオデータの量はますます多くなっている。限りある異種伝送帯域幅と多様化したビデオ応用のため、ビデオ符号化効率に対する要求は絶えず高まっている。この要求を受けて高効率ビデオ符号化(英語:High Efficient Video Coding、略してHEVC)規格を策定する取り組みが始まっている。
【0004】
ビデオ圧縮符号化の基本原理では空間領域と時間領域とコードワードとの相関を用いて余剰を可能な限り排除する。現在主流やり方ではブロックベースのハイブリッドビデオ符号化方式で予測(フレーム内予測とフレーム間予測とを含む)、変換、量子化、エントロピー符号化等のステップを遂行してビデオ圧縮符号化を実現する。この符号化方式は存立の見込みが高いため、HEVCでもこのブロックベースのハイブリッドビデオ符号化方式が引き続き採用されている。
【0005】
様々なビデオ符号化/復号化ソリューションの中でも運動推定や運動補償は符号化/復号化効率を左右する重要な技術となっている。従来の様々なビデオ符号化/復号化ソリューションでは、物体の動きが常に並進運動に一致し、物体全体の全ての部分の動きが同じであると想定している。従来の運動推定アルゴリズムや運動補償アルゴリズムはどれも基本的には並進運動モデル(英語:translational motion model)に基づくブロック運動補償アルゴリズムである。しかし現実世界の動きは多様であり、拡大/縮小運動や回転運動や放物運動といった不規則な動きはいたるところにある。前世紀の80年代以降にビデオ符号化の専門家は不規則運動の普遍性を認識し、不規則運動モデル(アフィン運動モデル、回転運動モデル、拡大縮小運動モデル等の非並進運動モデル)を導入することでビデオ符号化効率を高めることを望んでいる。ただし、非並進運動モデルに基づいて遂行される従来の画像予測の計算複雑性は概してすこぶる高い。
【発明の概要】
【課題を解決するための手段】
【0006】
本発明の実施形態は非並進運動モデルに基づく画像予測の計算複雑性を軽減するための画像予測方法および関連装置を提供する。
【0007】
本発明の第1の態様は、画像予測方法を提供し、該画像予測方法は、
現在の画像ブロックでK個のピクセルサンプルの運動ベクトル予測子を判断するステップであって、ここでKは1よりも大きい整数であり、K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含み、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、第1の空間的に隣接する画像ブロックは第1の頂角ピクセルサンプルに空間的に隣接する、判断するステップと、
非並進運動モデルとK個のピクセルサンプルの運動ベクトル予測子とに基づいて、現在の画像ブロックに対しピクセル値予測を遂行するステップとを含む。
【0008】
第1の態様を参照し、第1の態様の第1の可能な実装様態において、K個のピクセルサンプルは、現在の画像ブロックで左上ピクセルサンプル、右上ピクセルサンプル、または左下ピクセルサンプルにある少なくとも2つのピクセルサンプルを含み、
現在の画像ブロックにおける左上ピクセルサンプルは、現在の画像ブロックの左上頂点であるか、または現在の画像ブロック内にあって現在の画像ブロックの左上頂点を含むピクセルブロックであり、現在の画像ブロックにおける左下ピクセルサンプルは、現在の画像ブロックの左下頂点であるか、または現在の画像ブロック内にあって現在の画像ブロックの左下頂点を含むピクセルブロックであり、現在の画像ブロックにおける右上ピクセルサンプルは、現在の画像ブロックの右上頂点であるか、または現在の画像ブロック内にあって現在の画像ブロックの右上頂点を含むピクセルブロックである。
【0009】
第1の態様の第1の可能な実装様態を参照し、第1の態様の第2の可能な実装様態において、第1の空間的に隣接する画像ブロックは、画像ブロックX1、画像ブロックX2、または画像ブロックX3であり、
現在の画像ブロックにおける左上ピクセルサンプルの運動ベクトル予測子は、画像ブロックX1の運動ベクトルに基づいて得られ、画像ブロックX1は、現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX1は、現在の画像ブロックにおいて左上ピクセルサンプルに空間的に隣接し、
現在の画像ブロックにおける右上ピクセルサンプルの運動ベクトル予測子は、画像ブロックX2の運動ベクトルに基づいて得られ、画像ブロックX2は、現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX2は、現在の画像ブロックにおいて右上ピクセルサンプルに空間的に隣接し、
現在の画像ブロックにおける左下ピクセルサンプルの運動ベクトル予測子は、画像ブロックX3の運動ベクトルに基づいて得られ、画像ブロックX3は、現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX3は、現在の画像ブロックにおいて左下ピクセルサンプルに空間的に隣接する。
【0010】
第1の態様の第2の可能な実装様態を参照し、第1の態様の第3の可能な実装様態において、
第1の頂角ピクセルサンプルは、現在の画像ブロックにおける左上ピクセルサンプルであり、第1の空間的に隣接する画像ブロックは、画像ブロックX1であり、画像ブロックX1は、現在の画像ブロックの左上で空間的に隣接する画像ブロックである。
【0011】
第1の態様の第3の可能な実装様態を参照し、第1の態様の第4の可能な実装様態において、
画像ブロックX2は、現在の画像ブロックの上方で空間的に隣接する画像ブロックであるか、または
画像ブロックX2の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は、画像ブロックX5の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX5は、画像ブロックX2を除く、右上頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのうちのいずれか1つである。
【0012】
第1の態様の第3の可能な実装様態または第1の態様の第4の可能な実装様態を参照し、第1の態様の第5の可能な実装様態において、
画像ブロックX3は、現在の画像ブロックの左側で空間的に隣接する画像ブロックであるか、または
画像ブロックX3の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は、画像ブロックX6の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX6は、画像ブロックX3を除く、左下頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのうちのいずれか1つである。
【0013】
第1の態様、または第1の態様の第1から第5の可能な実装様態のいずれか1つを参照し、第1の態様の第6の可能な実装様態において、非並進運動モデルとK個のピクセルサンプルの運動ベクトル予測子とに基づいて、現在の画像ブロックに対しピクセル値予測を遂行するステップは、
K個のピクセルサンプルにおけるK1個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1でない場合に、K1個のピクセルサンプルの運動ベクトル予測子を参照フレームY1にスケールするステップと、K個のピクセルサンプルの運動ベクトルを得るために、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使って、K個のピクセルサンプルに対し運動推定を遂行するステップと、非並進運動モデルとK個のピクセルサンプルの運動ベクトルとを使って、現在の画像ブロックに対しピクセル値予測を遂行するステップとを含み、ここで、K2個のピクセルサンプルは、K個のピクセルサンプルのうち、K1個のピクセルサンプルを除いた残りのピクセルサンプルであり、K1およびK2は正の整数である。
【0014】
第1の態様の第6の可能な実装様態を参照し、第1の態様の第7の可能な実装様態において、ピクセルサンプルiは、K個のピクセルサンプルのうち、第1の頂角ピクセルサンプルを除くいずれかのピクセルサンプルであり、ピクセルサンプルiの運動ベクトル予測子に対応する予測方向が第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する予測方向と異なる場合、ピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスは0である。
【0015】
第1の態様の第7の可能な実装様態を参照し、第1の態様の第8の可能な実装様態において、参照フレームY1は、第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する参照フレームであり、ピクセルサンプルiの運動ベクトル予測子が参照フレームY1にスケールされることは、第1の頂角ピクセルサンプルとピクセルサンプルiとの運動ベクトル予測子に対応する参照フレームインデックスが異なる場合に、ピクセルサンプルiの運動ベクトル予測子が参照フレームY1にスケールされることを含む。
【0016】
第1の態様の第6の可能な実装様態、または第1の態様の第7の可能な実装様態、または第1の態様の第8の可能な実装様態を参照し、第1の態様の第9の可能な実装様態において、K個のピクセルサンプルの運動ベクトルを得るために、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使って、K個のピクセルサンプルに対し運動推定を遂行するステップは、
K個のピクセルサンプルの運動ベクトルを得るために、反復探索アルゴリズムに基づいて、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使って、K個のピクセルサンプルに対し運動推定を遂行するステップを含む。
【0017】
第1の態様、または第1の態様の第1から第9の可能な実装様態のいずれか1つ参照し、第1の態様の第10の可能な実装様態において、非並進運動モデルは、下記モデルのうち、すなわち、アフィン変換モデル、放物運動モデル、回転運動モデル、パースペクティブ運動モデル、せん断運動モデル、または拡大縮小運動モデルのうち、いずれか1つである。
【0018】
第1の態様、または第1の態様の第1から第10の可能な実装様態のいずれか1を参照し、第1の態様の第11の可能な実装様態において、
画像予測方法は、ビデオ符号化処理に応用され、または画像予測方法は、ビデオ復号化処理に応用される。
【0019】
本発明の第2の態様は、画像予測装置を提供し、該画像予測装置は、
現在の画像ブロックでK個のピクセルサンプルの運動ベクトル予測子を判断するように構成された判断ユニットであって、ここでKは1よりも大きい整数であり、K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含み、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、第1の空間的に隣接する画像ブロックは第1の頂角ピクセルサンプルに空間的に隣接する、判断ユニットと、
非並進運動モデルとK個のピクセルサンプルの運動ベクトル予測子とに基づいて、現在の画像ブロックに対しピクセル値予測を遂行するように構成された予測ユニットとを含む。
【0020】
第2の態様を参照し、第2の態様の第1の可能な実装様態において、K個のピクセルサンプルは、現在の画像ブロックで左上ピクセルサンプル、右上ピクセルサンプル、または左下ピクセルサンプルにある少なくとも2つのピクセルサンプルを含み、
現在の画像ブロックにおける左上ピクセルサンプルは、現在の画像ブロックの左上頂点であるか、または現在の画像ブロック内にあって現在の画像ブロックの左上頂点を含むピクセルブロックであり、現在の画像ブロックにおける左下ピクセルサンプルは、現在の画像ブロックの左下頂点であるか、または現在の画像ブロック内にあって現在の画像ブロックの左下頂点を含むピクセルブロックであり、現在の画像ブロックにおける右上ピクセルサンプルは、現在の画像ブロックの右上頂点であるか、または現在の画像ブロック内にあって現在の画像ブロックの右上頂点を含むピクセルブロックである。
【0021】
第2の態様の第1の可能な実装様態を参照し、第2の態様の第2の可能な実装様態において、第1の空間的に隣接する画像ブロックは、画像ブロックX1、画像ブロックX2、または画像ブロックX3であり、
現在の画像ブロックにおける左上ピクセルサンプルの運動ベクトル予測子は、画像ブロックX1の運動ベクトルに基づいて得られ、画像ブロックX1は、現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX1は、現在の画像ブロックにおいて左上ピクセルサンプルに空間的に隣接し、
現在の画像ブロックにおける右上ピクセルサンプルの運動ベクトル予測子は、画像ブロックX2の運動ベクトルに基づいて得られ、画像ブロックX2は、現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX2は、現在の画像ブロックにおいて右上ピクセルサンプルに空間的に隣接し、
現在の画像ブロックにおける左下ピクセルサンプルの運動ベクトル予測子は、画像ブロックX3の運動ベクトルに基づいて得られ、画像ブロックX3は、現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX3は、現在の画像ブロックにおいて左下ピクセルサンプルに空間的に隣接する。
【0022】
第2の態様の第2の可能な実装様態を参照し、第2の態様の第3の可能な実装様態において、
第1の頂角ピクセルサンプルは、現在の画像ブロックにおける左上ピクセルサンプルであり、第1の空間的に隣接する画像ブロックは、画像ブロックX1であり、画像ブロックX1は、現在の画像ブロックの左上で空間的に隣接する画像ブロックである。
【0023】
第2の態様の第3の可能な実装様態を参照し、第2の態様の第4の可能な実装様態において、
画像ブロックX2は、現在の画像ブロックの上方で空間的に隣接する画像ブロックであるか、または
画像ブロックX2の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は、画像ブロックX5の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX5は、画像ブロックX2を除く、右上頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのうちのいずれか1つである。
【0024】
第2の態様の第3の可能な実装様態または第2の態様の第4の可能な実装様態を参照し、第2の態様の第5の可能な実装様態において、
画像ブロックX3は、現在の画像ブロックの左側で空間的に隣接する画像ブロックであり、あるいは
画像ブロックX3の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は、画像ブロックX6の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX6は、画像ブロックX3を除く、左下頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのうちのいずれか1つである。
【0025】
第2の態様、または第2の態様の第1から第5の可能な実装様態のいずれか1つを参照し、第2の態様の第6の可能な実装様態において、予測ユニットは、K個のピクセルサンプルにおけるK1個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1でない場合に、K1個のピクセルサンプルの運動ベクトル予測子を参照フレームY1にスケールし、K個のピクセルサンプルの運動ベクトルを得るために、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使って、K個のピクセルサンプルに対し運動推定を遂行し、且つ非並進運動モデルとK個のピクセルサンプルの運動ベクトルとを使って、現在の画像ブロックに対しピクセル値予測を遂行するように具体的に構成され、ここで、K2個のピクセルサンプルは、K個のピクセルサンプルのうち、K1個のピクセルサンプルを除いた残りのピクセルサンプルであり、K1およびK2は正の整数である。
【0026】
第2の態様の第6の可能な実装様態を参照し、第2の態様の第7の可能な実装様態において、ピクセルサンプルiは、K個のピクセルサンプルのうち、第1の頂角ピクセルサンプルを除くいずれかのピクセルサンプルであり、ピクセルサンプルiの運動ベクトル予測子に対応する予測方向が第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する予測方向と異なる場合、ピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスは0である。
【0027】
第2の態様の第7の可能な実装様態を参照し、第2の態様の第8の可能な実装様態において、参照フレームY1は、第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する参照フレームであり、予測ユニットは、第1の頂角ピクセルサンプルとピクセルサンプルiとの運動ベクトル予測子に対応する参照フレームインデックスが異なる場合に、ピクセルサンプルiの運動ベクトル予測子を参照フレームY1にスケールするように具体的に構成される。
【0028】
第2の態様、または第2の態様の第1から第8の可能な実装形態を参照し、第2の態様の第9の可能な実装様態において、非並進運動モデルは、下記モデルのうち、すなわち、アフィン変換モデル、放物運動モデル、回転運動モデル、パースペクティブ運動モデル、せん断運動モデル、または拡大縮小運動モデルのうち、いずれか1つである。
【0029】
第2の態様、または第2の態様の第1から第9の可能な実装様態のいずれか1つを参照し、第2の態様の第10の可能な実装様態において、画像予測装置は、ビデオ符号化装置に応用され、または画像予測装置は、ビデオ復号化装置に応用される。
【0030】
本発明の実施形態の技術的解決手段において、判断されたK個のピクセルサンプルの運動ベクトル予測子が非並進運動モデルに基づいて現在の画像ブロックに対して遂行されるピクセル値予測のときに参照されることは分かるであろう。K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含む。K個のピクセルサンプルの運動ベクトル予測子は予測に直接使用され、K個のピクセルサンプルにおける第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、K個のピクセルサンプルの運動ベクトル予測子には1つの任意のケースがある。このため、大規模な計算によってK個のピクセルサンプルの複数の任意の運動ベクトル予測子群からK個のピクセルサンプルの運動ベクトル予測子が選択される従来技術のメカニズムは放棄される。これはビットストリームで運動情報予測子の選択情報を伝送することを回避するのに役立ち、符号化効率を上げるのに役立ち、且つ非並進運動モデルに基づく画像予測の計算複雑性を大幅に軽減するのにも役立つ。
【図面の簡単な説明】
【0031】
【
図1a】本発明の一実施形態によるフレーム内予測に対応する予測単位分割様態の概略図である。
【
図1b】本発明の一実施形態によるフレーム間予測に対応する数通りの予測単位分割様態の概略図である。
【
図1c】本発明の一実施形態による画像予測方法の概略流れ図である。
【
図2】本発明の一実施形態による現在の画像ブロックの可能な隣接参照ブロックの概略図である。
【
図3a】本発明の一実施形態による別の画像予測方法の概略流れ図である。
【
図3b】本発明の一実施形態による現在の画像ブロックの可能な隣接参照ブロックの別の概略図である。
【
図3c】本発明の一実施形態による現在の画像ブロックの参照フレームの概略図である。
【
図3d】本発明の一実施形態による現在の画像ブロックの概略図である。
【
図3e】本発明の一実施形態による画像ブロックのアフィン変換の概略図である。
【
図4a】本発明の一実施形態による別の画像予測方法の概略流れ図である。
【
図4b】本発明の一実施形態による現在の画像ブロックの隣接参照ブロックの別の概略図である。
【
図5】本発明の一実施形態による別の画像予測方法の概略流れ図である。
【
図6】本発明の一実施形態による別の画像予測方法の概略流れ図である。
【
図7】本発明の一実施形態によるビデオ復号化方法の概略流れ図である。
【
図8】本発明の一実施形態による画像予測装置の概略図である。
【
図9】本発明の一実施形態による別の画像予測装置の概略図である。
【
図10】本発明の一実施形態による別の画像予測装置の概略図である。
【発明を実施するための形態】
【0032】
本発明の実施形態は非並進運動モデルに基づく画像予測の計算複雑性を軽減するための画像予測方法および関連装置を提供する。
【0033】
当業者が本発明の技術的解決手段をより良く理解できるようにするため、これ以降、本発明の実施形態の添付図面を参照しながら本発明の実施形態の技術的解決手段を明確かつ完全に説明する。当然ながら、説明する実施形態は本発明の実施形態の全てではなく一部に過ぎない。創造的な取り組みをせずとも本発明の実施形態をもとに当業者によって考案される他の実施形態はいずれも本発明の保護範囲に入る。
【0034】
これ以降、詳しい説明を個別に提示する。
【0035】
本発明の明細書と請求項と添付図面で用語「第1(first)」、「第2(second)」、「第3(third)」、「第4(fourth)」等は異なるものを区別するものであって、特定の順序を示すものではない。加えて、用語「含む(include)」、「有する(have)」、ならびにその変形は非排他的な包含をカバーするものである。例えば、一連のステップまたはユニットを含むプロセス、方法、システム、製品、または装置は記載されたステップまたはユニットに限定されず、記載されていないステップまたはユニットを任意にさらに含み、あるいはプロセス、方法、製品、または装置に特有の別のステップまたはユニットを任意にさらに含む。
【0036】
これ以降はまず、本発明の実施形態に関係し得るいくつかのコンセプトを説明する。
【0037】
ほとんどの符号化方式でビデオシーケンスは一連の画像(英語:picture)を含み、画像はスライス(英語:slice)にさらに分割され、sliceはブロック(英語:block)にさらに分割される。ビデオ符号化とは、ブロックを単位として使用し、pictureの左上隅位置から行ごとに左から右、上から下へ符号化処理を遂行することである。一部の新しいビデオ符号化規格ではblockのコンセプトがさらに拡大されている。H.264規格にはマクロブロック(英語:macro block、略してMB)があり、MBは予測符号化に使える複数の予測ブロックに分割できる。HEVC規格には符号化単位(英語:coding unit、略してCU)や予測単位(英語:prediction unit、略してPU)や変換単位(英語:transform unit、略してTU)といった基本的コンセプトが採用されており、複数のUnitは機能に従って分類され、まったく新しい木状構造が記述に使われている。例えばCUは四分木に従ってより小さいCUに分割でき、より小さいCUはさらに分割でき、四分木構造を形成する。PUとTUも同様の木構造を有する。単位がCUであろうがPUであろうがTUであろうが、単位は基本的にはblockのコンセプトに属する。CUはマクロブロックMBや符号化ブロックに似ており、画像を分割し符号化するための基本単位である。PUは予測ブロックに相当し得、予測符号化の基本単位である。CUは分割モードに従って複数のPUにさらに分割される。TUは変換ブロックに相当し得、予測残差を変換する基本単位である。
【0038】
HEVC規格で符号化単位のサイズには4つのレベルが、すなわち64x64、32x32、16x16、および8x8が、あり得る。各レベルの符号化単位はフレーム内予測とフレーム間予測に従ってサイズが異なる予測単位に分割できる。例えば
図1aおよび
図1bに見られるように、
図1aはフレーム内予測に対応する予測単位分割様態の一例を示している。
図1bはフレーム内予測に対応する数通りの予測単位分割様態の例を示している。
【0039】
ビデオ符号化の専門家はビデオ符号化技術を開発し発展させる過程で、符号化効率を上げるため、隣接する符号化/復号化ブロック間の時間的・空間的相関を使用する様々な方法を考案している。H264/先進ビデオ符号化(英語:Advanced Video Coding、略してAVC)規格ではスキップモード(skip mode)とダイレクトモード(direct mode)が符号化効率を上げる効果的手段となっている。ビットレートが低い場合に使われる2つの符号化モードのブロックは符号化シーケンス全体の半分超を占めることがある。スキップモードが使われる場合は、ビットストリームにスキップモードフラグメントを加えて近傍の運動ベクトルだけを使用することによって現在の画像ブロックの運動ベクトルを得ることができ、現在の画像ブロックの再構成値として運動ベクトルに従って参照ブロックの値が直接コピーされる。加えて、ダイレクトモードが使われる場合は、符号化器が隣接する運動ベクトルを使って現在の画像ブロックの運動ベクトルを得、現在の画像ブロックの予測子として運動ベクトルに従って参照ブロックの値を直接コピーし、符号化器で予測子を使って現在の画像ブロックに対し予測符号化を遂行できる。進化したHEVC規格ではビデオ符号化効率をさらに上げるため新しい符号化手段がいくつか導入されている。融合符号化(merge)モードと先進運動ベクトル予測(英語:advanced motion vector prediction、略してAMVP)モードは2つの重要なフレーム間予測手段である。融合符号化では、現在の符号化ブロックの隣接する符号化済みブロックの運動情報(予測方向と運動ベクトルと参照フレームインデックスとを含む)を使って候補運動情報セットが構成され、比較により最高の符号化効率を可能にする候補運動情報が現在の符号化ブロックの運動情報として選ばれてよく、参照フレームの中で現在の符号化ブロックの予測子が見つけられ、現在の符号化ブロックに対し予測符号化が遂行され、運動情報が選ばれた隣接する符号化済みブロックを指し示すインデックス値がビットストリームに書き込まれる。先進運動ベクトル予測モードが使われる場合は、隣接する符号化済みブロックの運動ベクトルが現在の符号化ブロックの運動ベクトル予測子として使われ、最高の符号化効率を可能にする運動ベクトルが現在の符号化ブロックの運動ベクトルを予測するために選ばれてよく、選ばれた隣接運動ベクトルを指し示すインデックス値がビデオビットストリームに書き込まれてよい。
【0040】
これ以降は本発明の実施形態の技術的解決手段をさらに説明する。
【0041】
これ以降はまず、本発明の実施形態で提供される画像予測方法を説明する。本発明の実施形態で提供される画像予測方法はビデオ符号化装置かビデオ復号化装置によって実行される。ビデオ符号化装置やビデオ復号化装置はビデオを出力したり保管したりする必要がある何らかの装置であってよく、例えばラップトップコンピュータ、タブレットコンピュータ、パーソナルコンピュータ、携帯電話機、またはビデオサーバーであってよい。
【0042】
本発明の画像予測方法の一実施形態において、画像予測方法は、現在の画像ブロックでK個のピクセルサンプルの運動ベクトル予測子(英語:motion vector predictor、略してMVP)を判断するステップであって、ここでKは1よりも大きい整数であり、K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含み、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、第1の空間的に隣接する画像ブロックは第1の頂角ピクセルサンプルに空間的に隣接する、判断するステップと、非並進運動モデルとK個のピクセルサンプルの運動ベクトル予測子とに基づいて現在の画像ブロックに対しピクセル値予測を遂行するステップとを含む。
【0043】
図1cを参照し、
図1cは本発明の一実施形態による画像予測方法の概略流れ図である。
図1cの一例に見られるように、本発明の本実施形態で提供される画像予測方法は下記ステップを含んでよい。
【0044】
101.現在の画像ブロックでK個のピクセルサンプルの運動ベクトル予測子を判断する。
【0045】
Kは1よりも大きい整数であり、K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含み、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られる。第1の空間的に隣接する画像ブロックは第1の頂角ピクセルサンプルに空間的に隣接する。
【0046】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られる。具体的に述べると、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに等しくてよく(つまり、現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルが第1の頂角ピクセルサンプルの運動ベクトル予測子として使用され)、あるいは現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに対し既定の変換を遂行することによって得られる運動ベクトル予測子が第1の頂角ピクセルサンプルの運動ベクトル予測子として使用されてよい。
【0047】
102.非並進運動モデルとK個のピクセルサンプルの運動ベクトル予測子とに基づいて現在の画像ブロックに対しピクセル値予測を遂行する。
【0048】
任意に選べることとして、本発明のいくつかの可能な実装様態において、非並進運動モデルは下記モデルのうち、すなわちアフィン変換モデル、放物運動モデル、回転運動モデル、パースペクティブ運動モデル、せん断運動モデル、または拡大縮小運動モデルのうち、いずれか1つである。非並進運動モデルが前述の具体例に限定されないことは理解できるであろう。
【0049】
本実施形態の技術的解決手段において、判断されたK個のピクセルサンプルの運動ベクトル予測子が非並進運動モデルに基づいて現在の画像ブロックに対して遂行されるピクセル値予測のときに参照されることは分かるであろう。K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含む。K個のピクセルサンプルの運動ベクトル予測子は予測に直接使用され、K個のピクセルサンプルにおける第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、K個のピクセルサンプルの運動ベクトル予測子には1つの任意のケースがある。このため、大規模な計算によってK個のピクセルサンプルの複数の任意の運動ベクトル予測子群からK個のピクセルサンプルの運動ベクトル予測子が選択される従来技術のメカニズムは放棄される。これはビットストリームで運動情報予測子の選択情報を伝送することを回避するのに役立ち、符号化効率を上げるのに役立ち、且つ非並進運動モデルに基づく画像予測の計算複雑性を大幅に軽減するのにも役立つ。
【0050】
また、第1の空間的に隣接する画像ブロックは第1の頂角ピクセルサンプルに空間的に隣接し、現在の画像ブロックの第1の空間的に隣接する画像ブロックは予め設定される(つまり、現在の画像ブロックの第1の空間的に隣接する画像ブロックは事前に取り決められるか設定されると考えることができる)。したがって、これはK個のピクセルサンプルの運動ベクトル予測子を速やかに判断するのに役立つ。加えて、画像ブロック間の空間相関を十分に活用することによって余剰が排除されるため、これは符号化効率をさらに上げるのに役立つ。
【0051】
K個のピクセルサンプルを選択する様々な様態があり得る。
【0052】
任意に選べることとして、本発明のいくつかの可能な実装様態において、K個のピクセルサンプルは、現在の画像ブロックで左上ピクセルサンプル、右上ピクセルサンプル、左下ピクセルサンプル、または右下ピクセルサンプルにある少なくとも2つのピクセルサンプルを含む。
【0053】
ピクセルサンプルがピクセルブロックである場合、ピクセルブロックのサイズは例えば2×2、1×2、4×2、4×4、または別のサイズである。
【0054】
任意に選べることとして、本発明のいくつかの可能な実装様態において、現在の画像ブロックにおける左上ピクセルサンプルは現在の画像ブロックの左上頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの左上頂点を含むピクセルブロックである。現在の画像ブロックにおける左下ピクセルサンプルは現在の画像ブロックの左下頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの左下頂点を含むピクセルブロックである。現在の画像ブロックにおける右上ピクセルサンプルは現在の画像ブロックの右上頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの右上頂点を含むピクセルブロックである。現在の画像ブロックにおける右下ピクセルサンプルは現在の画像ブロックの右下頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの右下頂点を含むピクセルブロックである。
【0055】
任意に選べることとして、本発明のいくつかの可能な実装様態において、K個のピクセルサンプルは現在の画像ブロックにおける中心ピクセルサンプルをさらに含んでよい。現在の画像ブロックにおける中心ピクセルサンプルは現在の画像ブロックの中心ピクセルであってよく、あるいは現在の画像ブロック内にあって現在の画像ブロックの中心ピクセルを含むピクセルブロックであってよい。
【0056】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の空間的に隣接する画像ブロックは画像ブロックX1、画像ブロックX2、画像ブロックX3、または画像ブロックX4であってよい。
【0057】
現在の画像ブロックにおける左上ピクセルサンプルの運動ベクトル予測子は画像ブロックX1の運動ベクトルに基づいて得られてよく、画像ブロックX1は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX1は現在の画像ブロックにおいて左上ピクセルサンプルに空間的に隣接する。
【0058】
現在の画像ブロックにおける右上ピクセルサンプルの運動ベクトル予測子は画像ブロックX2の運動ベクトルに基づいて得られてよく、画像ブロックX2は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX2は現在の画像ブロックにおいて右上ピクセルサンプルに空間的に隣接する。
【0059】
現在の画像ブロックにおける左下ピクセルサンプルの運動ベクトル予測子は画像ブロックX3の運動ベクトルに基づいて得られてよく、画像ブロックX3は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX3は現在の画像ブロックにおいて左下ピクセルサンプルに空間的に隣接する。
【0060】
現在の画像ブロックにおける右下ピクセルサンプルの運動ベクトル予測子は画像ブロックX4の運動ベクトルに基づいて得られてよく、画像ブロックX4は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX4は現在の画像ブロックにおいて右下ピクセルサンプルに空間的に隣接する。
【0061】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の頂角ピクセルサンプルは現在の画像ブロックにおける左上ピクセルサンプルであてってよく、第1の空間的に隣接する画像ブロックは画像ブロックX1であってよい。画像ブロックX1は現在の画像ブロックの左上で空間的に隣接する画像ブロックであり、あるいは画像ブロックX1は現在の画像ブロックの左側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX1は現在の画像ブロックの上方で空間的に隣接する画像ブロックである。
【0062】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX2は現在の画像ブロックの上方で空間的に隣接する画像ブロックであり、あるいは画像ブロックX2は現在の画像ブロックの右上で空間的に隣接する画像ブロックであり、あるいは画像ブロックX2は現在の画像ブロックの右側で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX2の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX5の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX5は、画像ブロックX2を除く、右上頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。つまり、画像ブロックX2の位置は特定の方針に基づいて決定されてよく、あるいは画像ブロックX2の位置は直接的に取り決められてよい。
【0063】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX3は現在の画像ブロックの左側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX3は現在の画像ブロックの左下で空間的に隣接する画像ブロックであり、あるいは画像ブロックX3は現在の画像ブロックの下方で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX3の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX6の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX6は、画像ブロックX3を除く、左下頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。つまり、画像ブロックX3の位置は特定の方針に基づいて決定されてよく、あるいは画像ブロックX3の位置は直接的に取り決められてよい。
【0064】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX4は現在の画像ブロックの右側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX4は現在の画像ブロックの右下で空間的に隣接する画像ブロックであり、あるいは画像ブロックX4は現在の画像ブロックの下方で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX4の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX7の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX7は、画像ブロックX4を除く、左下頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。
【0065】
図2を参照し、
図2は画像ブロックX1と画像ブロックX2と画像ブロックX3と画像ブロックX4のいくつかの可能な位置の例を示すものである。
【0066】
任意に選べることとして、本発明のいくつかの可能な実装様態において、非並進運動モデルとK個のピクセルサンプルの運動ベクトル予測子とに基づいて現在の画像ブロックに対しピクセル値予測を遂行するステップは、K個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1である場合に、K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し運動推定を遂行するステップと、非並進運動モデルとK個のピクセルサンプルの運動ベクトルとを使って現在の画像ブロックに対しピクセル値予測を遂行するステップとを具体的に含んでよい。
【0067】
任意に選べることとして、本発明のいくつかの可能な実装様態において、非並進運動モデルとK個のピクセルサンプルの運動ベクトル予測子とに基づいて現在の画像ブロックに対しピクセル値予測を遂行するステップは、K個のピクセルサンプルにおけるK1個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1でない場合に、K1個のピクセルサンプルの運動ベクトル予測子を参照フレームY1にスケールするステップと、K個のピクセルサンプルの運動ベクトルを得るため、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行するステップと、非並進運動モデルとK個のピクセルサンプルの運動ベクトルとを使って現在の画像ブロックに対しピクセル値予測を遂行するステップとを具体的に含んでよく、ここでK2個のピクセルサンプルはK個のピクセルサンプルのうちK1個のピクセルサンプルを除いた残りのピクセルサンプルであり、K1とK2は正の整数である。
【0068】
任意に選べることとして、本発明のいくつかの可能な実装様態において、参照フレームY1は第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する参照フレームであってよく、あるいは参照フレームY1はK個のピクセルサンプルにある別のピクセルサンプルの運動ベクトル予測子に対応する参照フレームであってよい。
【0069】
任意に選べることとして、本発明のいくつかの可能な実装様態において、ピクセルサンプルiはK個のピクセルサンプルで第1の頂角ピクセルサンプルを除くいずれかのピクセルサンプルであり、ピクセルサンプルiの運動ベクトル予測子に対応する予測方向が第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する予測方向と異なる場合、ピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスは0である。
【0070】
任意に選べることとして、本発明のいくつかの可能な実装様態において、ピクセルサンプルiの運動ベクトル予測子が参照フレームY1にスケールされることは、第1の頂角ピクセルサンプルとピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスが異なる場合に、ピクセルサンプルiの運動ベクトル予測子が参照フレームY1にスケールされることを含んでよい。
【0071】
任意に選べることとして、本発明のいくつかの可能な実装様態において、K個のピクセルサンプルの運動ベクトルを得るため、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行するステップは、K個のピクセルサンプルの運動ベクトルを得るため、反復探索アルゴリズム(または別種の運動推定アルゴリズム)に基づいてK2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行するステップを含んでよい。
【0072】
当然ながら、他のいくつかの可能な応用シナリオにおいてK個のピクセルサンプルに対し運動推定を遂行するステップは省かれてよい。正規化ステップさえ省かれてよい。つまり、K個のピクセルサンプルにおけるK1個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1でない場合に、K1個のピクセルサンプルの運動ベクトル予測子が参照フレームY1にスケールされるステップは省かれてよい。
【0073】
本実施形態で提供される前述の画像予測方法のいずれか1がビデオ符号化処理やビデオ復号化処理に応用されてよいことは理解できるであろう。
【0074】
本発明の実施形態で前述した解決手段をより良く理解し実施するため、これ以降はより具体的な応用シナリオを参照しながらさらに説明する。
【0075】
図3aを参照し、
図3aは本発明の別の実施形態による別の画像予測方法の概略流れ図である。
図3aの一例に見られるように、本発明の別の実施形態で提供される別の画像予測方法は下記ステップを含んでよい。
【0076】
301.現在の画像ブロックでK個のピクセルサンプルの運動ベクトル予測子を判断する。
【0077】
本実施形態の一例でK=3である。
【0078】
本実施形態でK個のピクセルサンプルは現在の画像ブロックの左上頂点と右上頂点と左下頂点とを含む。
【0079】
図3bの一例に見られるように、現在の画像ブロックの左上頂点の運動ベクトル予測子は現在の画像ブロックの左上にある隣接画像ブロックAの運動ベクトルに等しい。現在の画像ブロックの右上頂点の運動ベクトル予測子は現在の画像ブロックの上方にある隣接画像ブロックBの運動ベクトルに等しく、あるいは現在の画像ブロックの右上頂点の運動ベクトル予測子は現在の画像ブロックの右上にある隣接画像ブロックCの運動ベクトルに等しくてよい。現在の画像ブロックの左下頂点の運動ベクトル予測子は現在の画像ブロックの左下にある隣接画像ブロックEの運動ベクトルに等しくてよく、あるいは現在の画像ブロックの左下頂点の運動ベクトル予測子は現在の画像ブロックの左側にある隣接画像ブロックDの運動ベクトルに等しくてよい。
【0080】
例えば、現在の画像ブロックの右上頂点および左下頂点の運動ベクトル予測子は次式に基づいて判断されてよい。
【0081】
【0082】
上記の式(1)および式(2)で
【数2】
は画像ブロックAの運動ベクトル(MV)を表す。
【0083】
上記の式(1)で
【数3】
は現在の画像ブロックの右上頂点のMVPを表し、
【数4】
は画像ブロックBのMVを表し、
【数5】
は画像ブロックCのMVを表す。上記の式(2)で
【数6】
は現在の画像ブロックの右上頂点のMVPを表し、
【数7】
は画像ブロックDのMVを表し、
【数8】
は画像ブロックEのMVを表す。
【0084】
つまり、右上頂点のMVPの場合、ブロックAの運動ベクトル絶対値との差が大きい画像ブロックが空間的に隣接する画像ブロックBおよび画像ブロックCから選択される。左下頂点のMVPの場合、ブロックAの運動ベクトル絶対値との差が大きい画像ブロックが空間的に隣接する画像ブロックDおよび画像ブロックEから選択される。
【0085】
302.K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し運動推定を遂行する。
【0086】
K個のピクセルサンプルにおけるK1個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1でない場合、K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し運動推定を遂行するステップは、K1個のピクセルサンプルの運動ベクトル予測子を参照フレームY1にスケールするステップと(つまり、K1個のピクセルサンプルの運動ベクトル予測子に対し正規化処理を遂行するステップと)、K個のピクセルサンプルの運動ベクトルを得るため、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行するステップとを含む。
【0087】
K1個のピクセルサンプルの運動ベクトル予測子に対し正規化処理が遂行される前に、ピクセルサンプルiの運動ベクトル予測子の参照フレームインデックスは先に変更されてよい。ピクセルサンプルiはK個のピクセルサンプルの中で現在の画像ブロックの左上頂点を除くいずれかのピクセルサンプル(例えば左下頂点または右上頂点)である。ピクセルサンプルiの運動ベクトル予測子に対応する予測方向が左上頂点の運動ベクトル予測子に対応する予測方向と異なる場合(例えばピクセルサンプルiの運動ベクトル予測子に対応する予測方向が前方予測であって左上頂点の運動ベクトル予測子に対応する予測方向が後方予測である場合、あるいはピクセルサンプルiの運動ベクトル予測子に対応する予測方向が後方予測であって左上頂点の運動ベクトル予測子に対応する予測方向が前方予測である場合)、ピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスは0である。
【0088】
任意に選べることとして、本発明のいくつかの可能な実装様態において、運動ベクトル予測子を参照フレームにスケールする方法は次の通りであってよい。現在の符号化フレームインデックスはCurPocであると仮定し、画像ブロックAの参照フレーム(すなわち左上頂点のMVPに対応する参照フレーム)は先参照フレームである仮定する。先参照フレームインデックスはDesPocであり、右上頂点または左下頂点のMVPに対応する参照フレームは元参照フレームであり、元参照フレームインデックスはSrcPocであり、右上頂点または左下頂点の運動ベクトル予測子はMVPであり、スケーリングの後に得られる右上頂点または左下頂点の運動ベクトル予測子はMV
Sである。
図3cに見られるように、MV
Sは次式を使った計算によって得られてよい。
【数9】
【0089】
詳しく述べると、K個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1である場合は、(K1個のピクセルサンプルの運動ベクトル予測子は既に正規化された状態になっているため)K1個のピクセルサンプルの運動ベクトル予測子に対し正規化処理は遂行されず、K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し直接運動推定が遂行されてよい。
【0090】
任意に選べることとして、K個のピクセルサンプルの運動ベクトルを得るためK個のピクセルサンプルに対し運動推定が遂行されることは、K個のピクセルサンプルの運動ベクトルを得るため、反復探索アルゴリズムに基づいてK個のピクセルサンプルに対し運動推定が遂行されることを含んでよい。
【0091】
任意に選べることとして、本発明のいくつかの可能な実装様態において、K個のピクセルサンプルの運動ベクトルを得るため、反復探索アルゴリズムの毎回の計算に基づいてK個のピクセルサンプルに対し運動推定が遂行されることは下記ステップを含んでよい。
【0092】
S1.式(3)、(4)、および(5)に従って各ピクセルのφk(p)を計算する。
【0093】
φk(p)でk=1、2、3である。
【0094】
図3dに見られるように、現在の画像ブロックXのサイズはS1×S2であると仮定し、現在の画像ブロックXにおける各ピクセルpの座標は(x,y)であると仮定する。
【0095】
【0096】
【0097】
【数12】
は方向xと方向yにおける現在の画像ブロックXの各ピクセルpの導関数をそれぞれ表す。本実施形態の一例ではSobel演算子を使って導関数が計算される。別の演算子(例えばGaussian演算子)が使われてもよい。式(6)および式(7)の例にはSobel演算子のテンプレートが示されている。
【0098】
【0099】
現在のピクセルpの座標が(x,y)と仮定し、式(8)および式(9)の例には
【数14】
の計算式が示されており、ここでpred[x][y]は座標が(x,y)である現在の画像ブロックXの中にあるピクセルの予測ピクセル値を表す。
【0100】
【0101】
現在の画像ブロックXの端に位置するピクセルの隣接ピクセルは存在しないことがあり、
【数16】
は現在の画像ブロックXの端に位置するピクセルの隣接ピクセルの対応する値に差し替えられることがある。
【0102】
S3.予測誤差e(P)を計算する。
【0103】
現在のピクセルpの座標が(x,y)であると仮定する。
e(p)=org[x][y]-pred[x][y] 式(10)
ここでorg[x][y]とpred[x][y]は、元のピクセル値と座標が(x,y)である現在の画像ブロックXの中にあるピクセルの予測ピクセル値とをそれぞれ表す。
【0104】
S4.δ
x1、δ
x2、δ
x3、δ
y1、δ
y2、およびδ
y3がそれぞれ方向xと方向yにおける現在の画像ブロックXの3つの頂点の運動ベクトル変化であると仮定し、一次方程式セット(11)を解く計算でδ
x1、δ
x2、δ
x3、δ
y1、δ
y2、およびδ
y3を求める。
H
xklδ
xk=g
xk,k=1,2,3
H
yklδ
yk=g
yk,k=1,2,3 方程式セット(11)
ここで
【数17】
である。
【0105】
上述したステップS1~S4に基づき、この計算における現在の画像ブロックにある3つのピクセルサンプルの各々の方向xの運動ベクトル変化δxと各ピクセルサンプルの方向yの運動ベクトル変化δyは運動推定によって得られてよい。
【0106】
上述したステップS1~S4の反復様態に基づいて1回以上の計算が遂行され、運動推定によって現在の画像ブロックにあるK個のピクセルサンプルの運動ベクトルを得ることができる。
【0107】
任意に選べることとして、本発明のいくつかの可能な実装様態において、運動推定と対応するMVPとによって得られたK個のピクセルサンプルの運動ベクトルで減算がさらに遂行されてよく、これによりK個のピクセルサンプルの運動ベクトル差(英語:motion vector difference、略してMVD)を得、K個のピクセルサンプルのMVDはビデオビットストリームに書き込まれてよい。
【0108】
さらに、ピクセルサンプルに対応するMVDをビデオビットストリームに書き込むか否かを指示するため、構文要素affine_no_MVD_flagが使われてよい。例えば、前述したK個のピクセルサンプルに対応するMVDがいずれも0なら、affine_no_MVD_flagはtrueに設定されてよく、MVDはビデオビットストリームに書き込まれず、あるいは前述したK個のピクセルサンプルに対応するMVDに0でないものがあるなら、affine_no_MVD_flagはfalseに設定されてよく、K個のピクセルサンプルに対応するMVDはビデオビットストリームに書き込まれる。
【0109】
303.アフィン変換モデルとK個のピクセルサンプルの運動ベクトルとに基づいて現在の画像ブロックにある各ピクセルの運動ベクトルを計算する。
【0110】
現在の予測ブロックXのサイズがS1×S2であると仮定する。座標が(0,0)、(S1,0)、および(0,S2)である3つの頂点の運動ベクトル(vx0,vy0)、(vx1,vy1)、および(vx2,vy2)はステップ301およびステップ302を遂行することによって計算される。
【0111】
3つの頂点の座標と運動ベクトルはアフィン変換式(12)に代入され、現在の画像ブロックにある各ピクセルの運動ベクトルを計算できる。
図3eにアフィン変換の概略図を示すことができる。
【0112】
座標が(x,y)であるピクセルの運動ベクトルは次の通りに計算される。
【0113】
【0114】
さらに、現在の画像ブロックにある各ピクセルの運動情報は別の画像ブロックの運動ベクトル予測に役立てることができるため、4×4のブロックごとに1個の運動情報が保管されてよく、4×4の各ブロックの運動ベクトルは左上隅のピクセルの運動情報として、または4×4ブロック内の他のピクセルの運動情報として、保管される。
【0115】
尚、本実施形態では説明のため非並進運動モデルの一例としてアフィン変換モデルが主に使われており、別の非並進運動モデルとK個のピクセルサンプルの運動ベクトルとに基づいて現在の画像ブロックにある各ピクセルの運動ベクトルを計算するメカニズムも原理は同様であるが、そのメカニズムでは本実施形態に使われているものとは異なる式が使われてもよい。ここでは例を1つずつ列挙しない。
【0116】
304.現在の画像ブロックにある各ピクセルの計算運動ベクトルに基づいて現在の画像ブロックに対しピクセル値予測を遂行する。
【0117】
さらに、ビデオ符号化のときには、現在の画像ブロックの元のピクセル値と、ピクセル値予測によって得られた現在の画像ブロックの予測ピクセル値とを使って、現在の画像ブロックの残余が得られてよく、現在の画像ブロックの残余はビデオビットストリームに書き込まれてよい。
【0118】
本実施形態の技術的解決手段において、判断されたK個のピクセルサンプルの運動ベクトル予測子が非並進運動モデルに基づいて現在の画像ブロックに対して遂行されるピクセル値予測のときに参照されることは分かるであろう。K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含む。K個のピクセルサンプルの運動ベクトル予測子は予測に直接使用され、K個のピクセルサンプルにおける第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、K個のピクセルサンプルの運動ベクトル予測子には1つの任意のケースがある。このため、大規模な計算によってK個のピクセルサンプルの複数の任意の運動ベクトル予測子群からK個のピクセルサンプルの運動ベクトル予測子が選択される従来技術のメカニズムは放棄される。これはビットストリームで運動情報予測子の選択情報を伝送することを回避するのに役立ち、符号化効率を上げるのに役立ち、且つ非並進運動モデルに基づく画像予測の計算複雑性を大幅に軽減するのにも役立つ。
【0119】
さらに、現在の画像ブロックにおけるK個のピクセルサンプルのMVPの予測方向は正規化され、参照フレームインデックスは処理され、K個のピクセルサンプルのMVPに対応する運動ベクトルは参照フレームインデックスに従って同じ参照フレームにスケールされマップされる。さらに、現在の画像ブロックにある各ピクセルの運動ベクトルはK個のピクセルサンプルの最良の運動ベクトルに従ってアフィン変換式を用いて計算されてよい。前述の解決手段は、ビデオが非並進的内容を含む場合に、例えばレンズのズーミング、物体の変形、または動く物体の回転を含む場合に、現在のビデオ符号化規格ではフレーム間予測精度が低くなるという問題を解決するのに役立つ。加えて、従来技術で提案されたアフィン変換技術が多方向予測や多参照フレーム方式予測に応用し難いという欠点は克服されるため、ビデオシーケンスの一時的相関を十分に活用して一時的な余剰を排除し、符号化効率を上げるのに役立つ。
【0120】
図4aを参照し、
図4aは本発明の別の実施形態による別の画像予測方法の概略流れ図である。
図4aの一例に見られるように、本発明の別の実施形態で提供される別の画像予測方法は下記ステップを含んでよい。
【0121】
401.現在の画像ブロックでK個のピクセルサンプルの運動ベクトル予測子を判断する。
【0122】
本実施形態の一例でK=3である。
【0123】
本実施形態でK個のピクセルサンプルは現在の画像ブロックの左上頂点と右上頂点と左下頂点とを含む。
【0124】
図4bの一例に見られるように、現在の画像ブロックの左上頂点の運動ベクトル予測子は現在の画像ブロックの左上にある隣接画像ブロックAの運動ベクトルに等しい。現在の画像ブロックの右上頂点の運動ベクトル予測子は現在の画像ブロックの上方にある隣接画像ブロックBの運動ベクトルに等しい。現在の画像ブロックの左下頂点の運動ベクトル予測子は現在の画像ブロックの左側にある隣接画像ブロックDの運動ベクトルに等しくてよい。
【0125】
402.K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し運動推定を遂行する。
【0126】
K個のピクセルサンプルにおけるK1個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1でない場合、K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し運動推定を遂行するステップは、K1個のピクセルサンプルの運動ベクトル予測子を参照フレームY1にスケールするステップと(つまり、K1個のピクセルサンプルの運動ベクトル予測子に対し正規化処理を遂行するステップと)、K個のピクセルサンプルの運動ベクトルを得るため、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行するステップとを含む。
【0127】
K1個のピクセルサンプルの運動ベクトル予測子に対し正規化処理が遂行される前に、ピクセルサンプルiの運動ベクトル予測子の参照フレームインデックスは先に変更されてよい。ピクセルサンプルiはK個のピクセルサンプルの中で現在の画像ブロックの左上頂点を除くいずれかのピクセルサンプル(例えば左下頂点または右上頂点)である。ピクセルサンプルiの運動ベクトル予測子に対応する予測方向が左上頂点の運動ベクトル予測子に対応する予測方向と異なる場合(例えばピクセルサンプルiの運動ベクトル予測子に対応する予測方向が前方予測であって左上頂点の運動ベクトル予測子に対応する予測方向が後方予測である場合、あるいはピクセルサンプルiの運動ベクトル予測子に対応する予測方向が後方予測であって左上頂点の運動ベクトル予測子に対応する予測方向が前方予測である場合)、ピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスは0である。
【0128】
任意に選べることとして、本発明のいくつかの可能な実装様態において、運動ベクトル予測子を参照フレームにスケールする方法は次の通りであってよい。現在の符号化フレームインデックスはCurPocであると仮定し、画像ブロックAの参照フレーム(すなわち左上頂点のMVPに対応する参照フレーム)は先参照フレームである仮定する。先参照フレームインデックスはDesPocであり、右上頂点または左下頂点のMVPに対応する参照フレームは元参照フレームであり、元参照フレームインデックスはSrcPocであり、右上頂点または左下頂点の運動ベクトル予測子はMVPであり、スケーリングの後に得られる右上頂点または左下頂点の運動ベクトル予測子はMV
Sである。MV
Sは次式を使った計算によって得られてよい。
【数19】
【0129】
詳しく述べると、K個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1である場合は、(K1個のピクセルサンプルの運動ベクトル予測子は既に正規化された状態になっているため)K1個のピクセルサンプルの運動ベクトル予測子に対し正規化処理は遂行されず、K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し直接運動推定が遂行されてよい。
【0130】
任意に選べることとして、K個のピクセルサンプルの運動ベクトルを得るためK個のピクセルサンプルに対し運動推定が遂行されることは、K個のピクセルサンプルの運動ベクトルを得るため、反復探索アルゴリズムに基づいてK個のピクセルサンプルに対し運動推定が遂行されることを含んでよい。具体的な反復探索アルゴリズムについては前述した実施形態で関連する説明を参照されたい。ここでは詳細を繰り返し説明しない。
【0131】
任意に選べることとして、本発明のいくつかの可能な実装様態において、運動推定と対応するMVPとによって得られたK個のピクセルサンプルの運動ベクトルで減算がさらに遂行されてよく、これによりK個のピクセルサンプルのMVDを得、K個のピクセルサンプルのMVDはビデオビットストリームに書き込まれてよい。
【0132】
さらに、ピクセルサンプルに対応するMVDをビデオビットストリームに書き込むか否かを指示するため、構文要素affine_no_MVD_flagが使われてよい。例えば、前述したK個のピクセルサンプルに対応するMVDがいずれも0なら、affine_no_MVD_flagはtrueに設定されてよく、MVDはビデオビットストリームに書き込まれず、あるいは前述したK個のピクセルサンプルに対応するMVDに0でないものがあるなら、affine_no_MVD_flagはfalseに設定されてよく、K個のピクセルサンプルに対応するMVDはビデオビットストリームに書き込まれる。
【0133】
403.アフィン変換モデルとK個のピクセルサンプルの運動ベクトルとに基づいて現在の画像ブロックにある各ピクセルの運動ベクトルを計算する。
【0134】
さらに、現在の画像ブロックにある各ピクセルの運動情報は別の画像ブロックの運動ベクトル予測に役立てることができるため、4×4(または8×8)のブロックごとに1個の運動情報が保管されてよく、4×4(または8×8)の各ブロックの運動ベクトルは左上隅のピクセルの運動情報として、または4×4(または8×8)ブロック内の他のピクセルの運動情報として、保管される。
【0135】
運動情報は、運動ベクトルと、運動ベクトルに対応する予測方向と、運動ベクトルに対応する参照フレームインデックスとを含んでよい。
【0136】
尚、本実施形態では説明のため非並進運動モデルの一例としてアフィン変換モデルが主に使われており、別の非並進運動モデルとK個のピクセルサンプルの運動ベクトルとに基づいて現在の画像ブロックにある各ピクセルの運動ベクトルを計算するメカニズムも原理は同様であるが、そのメカニズムでは本実施形態に使われているものとは異なる式が使われてもよい。ここでは例を1つずつ列挙しない。
【0137】
404.現在の画像ブロックにある各ピクセルの計算運動ベクトルに基づいて現在の画像ブロックに対しピクセル値予測を遂行する。
【0138】
さらに、ビデオ符号化のときには、現在の画像ブロックの元のピクセル値と、ピクセル値予測によって得られた現在の画像ブロックの予測ピクセル値とを使って、現在の画像ブロックの残余が得られてよく、現在の画像ブロックの残余はビデオビットストリームに書き込まれてよい。
【0139】
本実施形態の技術的解決手段において、判断されたK個のピクセルサンプルの運動ベクトル予測子が非並進運動モデルに基づいて現在の画像ブロックに対して遂行されるピクセル値予測のときに参照されることは分かるであろう。K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含む。K個のピクセルサンプルの運動ベクトル予測子は予測に直接使用され、K個のピクセルサンプルにおける第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、K個のピクセルサンプルの運動ベクトル予測子には1つの任意のケースがある。このため、大規模な計算によってK個のピクセルサンプルの複数の任意の運動ベクトル予測子群からK個のピクセルサンプルの運動ベクトル予測子が選択される従来技術のメカニズムは放棄される。これはビットストリームで運動情報予測子の選択情報を伝送することを回避するのに役立ち、符号化効率を上げるのに役立ち、且つ非並進運動モデルに基づく画像予測の計算複雑性を大幅に軽減するのにも役立つ。
【0140】
さらに、現在の画像ブロックにおけるK個のピクセルサンプルのMVPの予測方向は正規化され、参照フレームインデックスは処理され、K個のピクセルサンプルのMVPに対応する運動ベクトルは参照フレームインデックスに従って同じ参照フレームにスケールされマップされる。さらに、現在の画像ブロックにある各ピクセルの運動ベクトルはK個のピクセルサンプルの最良の運動ベクトルに従ってアフィン変換式を用いて計算されてよい。前述の解決手段は、ビデオが非並進的内容を含む場合に、例えばレンズのズーミング、物体の変形、または動く物体の回転を含む場合に、現在のビデオ符号化規格ではフレーム間予測精度が低くなるという問題を解決するのに役立つ。加えて、従来技術で提案されたアフィン変換技術が多方向予測や多参照フレーム方式予測に応用し難いという欠点は克服されるため、ビデオシーケンスの一時的相関を十分に活用して一時的な余剰を排除し、符号化効率を上げるのに役立つ。
【0141】
図5を参照し、
図5は本発明の別の実施形態による別の画像予測方法の概略流れ図である。
図5の一例に見られるように、本発明の別の実施形態で提供される別の画像予測方法は下記ステップを含んでよい。
【0142】
501.現在の画像ブロックでK個のピクセルサンプルの運動ベクトル予測子を判断する。
【0143】
本実施形態の一例でK=3である。
【0144】
本実施形態でK個のピクセルサンプルは現在の画像ブロックの左上頂点と右上頂点と左下頂点とを含む。
【0145】
ステップ501で現在の画像ブロックにあるK個のピクセルサンプルの運動ベクトル予測子を判断する具体的様態については、前述した実施形態のいずれかの様態を参照されたい。
【0146】
502.前述したK個のピクセルサンプルの運動ベクトル予測子を前述したK個のピクセルサンプルの運動ベクトルとして使用し、且つアフィン変換モデルとK個のピクセルサンプルの運動ベクトルとに基づいて現在の画像ブロックにある各ピクセルの運動ベクトルを計算する。
【0147】
さらに、現在の画像ブロックにある各ピクセルの運動情報は別の画像ブロックの運動ベクトル予測に役立てることができるため、4×4(または8×8)のブロックごとに1個の運動情報が保管されてよく、4×4(または8×8)の各ブロックの運動ベクトルは左上隅のピクセルの運動情報として、または4×4(または8×8)ブロック内の他のピクセルの運動情報として、保管される。
【0148】
運動情報は、運動ベクトルと、運動ベクトルに対応する予測方向と、運動ベクトルに対応する参照フレームインデックスとを含んでよい。
【0149】
尚、本実施形態では説明のため非並進運動モデルの一例としてアフィン変換モデルが主に使われており、別の非並進運動モデルとK個のピクセルサンプルの運動ベクトルとに基づいて現在の画像ブロックにある各ピクセルの運動ベクトルを計算するメカニズムも原理は同様であるが、そのメカニズムでは本実施形態に使われているものとは異なる式が使われてもよい。ここでは例を1つずつ列挙しない。
【0150】
503.現在の画像ブロックにある各ピクセルの計算運動ベクトルに基づいて現在の画像ブロックに対しピクセル値予測を遂行する。
【0151】
さらに、ビデオ符号化のときには、現在の画像ブロックの元のピクセル値と、ピクセル値予測によって得られた現在の画像ブロックの予測ピクセル値とを使って、現在の画像ブロックの残余が得られてよく、現在の画像ブロックの残余はビデオビットストリームに書き込まれてよい。
【0152】
本実施形態の技術的解決手段において、判断されたK個のピクセルサンプルの運動ベクトル予測子が非並進運動モデルに基づいて現在の画像ブロックに対して遂行されるピクセル値予測のときに参照されることは分かるであろう。K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含む。K個のピクセルサンプルの運動ベクトル予測子は予測に直接使用され、K個のピクセルサンプルにおける第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、K個のピクセルサンプルの運動ベクトル予測子には1つの任意のケースがある。このため、大規模な計算によってK個のピクセルサンプルの複数の任意の運動ベクトル予測子群からK個のピクセルサンプルの運動ベクトル予測子が選択される従来技術のメカニズムは放棄される。これはビットストリームで運動情報予測子の選択情報を伝送することを回避するのに役立ち、符号化効率を上げるのに役立ち、且つ非並進運動モデルに基づく画像予測の計算複雑性を大幅に軽減するのにも役立つ。
【0153】
さらに、現在の画像ブロックにおけるK個のピクセルサンプルのMVPの予測方向は正規化され、参照フレームインデックスは処理され、K個のピクセルサンプルのMVPに対する運動ベクトルは参照フレームインデックスに従って同じ参照フレームにスケールされマップされる。前述の解決手段は、ビデオが非並進的内容、例えばレンズのズーミング、物体の変形、または動く物体の回転を含む場合に、現在のビデオ符号化規格ではフレーム間予測精度が低くなるという問題を解決するのに役立つ。加えて、従来技術で提案されたアフィン変換技術が多方向予測や多参照フレーム方式予測に応用し難いという欠点は克服されるため、ビデオシーケンスの一時的相関を十分に活用して一時的な余剰を排除し、符号化効率を上げるのに役立つ。
【0154】
図6を参照し、
図6は本発明の別の実施形態による別の画像予測方法の概略流れ図である。
図6の一例に見られるように、本発明の別の実施形態で提供される別の画像予測方法は下記ステップを含んでよい。
【0155】
601.現在の画像ブロックでK個のピクセルサンプルの運動ベクトル予測子を判断する。
【0156】
本実施形態の一例でK=3である。
【0157】
本実施形態でK個のピクセルサンプルは現在の画像ブロックの左上頂点と右上頂点と左下頂点とを含む。
【0158】
ステップ601で現在の画像ブロックにあるK個のピクセルサンプルの運動ベクトル予測子を判断する具体的様態については、前述した実施形態のいずれかの様態を参照されたい。
【0159】
602.K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し運動推定を遂行する。
【0160】
K個のピクセルサンプルにおけるK1個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1でない場合、K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し運動推定を遂行するステップは、K1個のピクセルサンプルの運動ベクトル予測子を参照フレームY1にスケールするステップと(つまり、K1個のピクセルサンプルの運動ベクトル予測子に対し正規化処理を遂行するステップと)、K個のピクセルサンプルの運動ベクトルを得るため、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行するステップとを含む。
【0161】
K1個のピクセルサンプルの運動ベクトル予測子に対し正規化処理が遂行される前に、ピクセルサンプルiの運動ベクトル予測子の参照フレームインデックスは先に変更されてよい。ピクセルサンプルiはK個のピクセルサンプルの中で現在の画像ブロックの左上頂点を除くいずれかのピクセルサンプル(例えば左下頂点または右上頂点)である。ピクセルサンプルiの運動ベクトル予測子に対応する予測方向が左上頂点の運動ベクトル予測子に対応する予測方向と異なる場合(例えばピクセルサンプルiの運動ベクトル予測子に対応する予測方向が前方予測であって左上頂点の運動ベクトル予測子に対応する予測方向が後方予測である場合、あるいはピクセルサンプルiの運動ベクトル予測子に対応する予測方向が後方予測であって左上頂点の運動ベクトル予測子に対応する予測方向が前方予測である場合)、ピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスは0である。
【0162】
詳しく述べると、K個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1である場合は、(K1個のピクセルサンプルの運動ベクトル予測子は既に正規化された状態になっているため)K1個のピクセルサンプルの運動ベクトル予測子に対し正規化処理は遂行されず、K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し直接運動推定が遂行されてよい。
【0163】
任意に選べることとして、K個のピクセルサンプルの運動ベクトルを得るためK個のピクセルサンプルに対し運動推定が遂行されることは、K個のピクセルサンプルの運動ベクトルを得るため、反復探索アルゴリズムに基づいてK個のピクセルサンプルに対し運動推定が遂行されることを含んでよい。具体的な反復探索アルゴリズムについては、前述した実施形態で関連する説明を参照されたい。ここでは詳細を繰り返し説明しない。
【0164】
任意に選べることとして、本発明のいくつかの可能な実装様態において、運動推定と対応するMVPとによって得られたK個のピクセルサンプルの運動ベクトルで減算がさらに遂行されてよく、これによりK個のピクセルサンプルのMVDを得、K個のピクセルサンプルのMVDはビデオビットストリームに書き込まれてよい。
【0165】
さらに、ピクセルサンプルに対応するMVDをビデオビットストリームに書き込むか否かを指示するため、構文要素affine_no_MVD_flagが使われてよい。例えば、前述したK個のピクセルサンプルに対応するMVDがいずれも0なら、affine_no_MVD_flagはtrueに設定されてよく、MVDはビデオビットストリームに書き込まれず、あるいは前述したK個のピクセルサンプルに対応するMVDに0でないものがあるなら、affine_no_MVD_flagはfalseに設定されてよく、K個のピクセルサンプルに対応するMVDはビデオビットストリームに書き込まれる。
【0166】
603.アフィン変換モデルとK個のピクセルサンプルの運動ベクトルとに基づいて現在の画像ブロックにある各ピクセルの運動ベクトルを計算する。
【0167】
さらに、現在の画像ブロックにある各ピクセルの運動情報は別の画像ブロックの運動ベクトル予測に役立てることができるため、4×4(または8×8)のブロックごとに1個の運動情報が保管されてよく、4×4(または8×8)の各ブロックの運動ベクトルは左上隅のピクセルの運動情報として、または4×4(または8×8)ブロック内の他のピクセルの運動情報として、保管される。
【0168】
運動情報は、運動ベクトルと、運動ベクトルに対応する予測方向と、運動ベクトルに対応する参照フレームインデックスとを含んでよい。
【0169】
尚、本実施形態では説明のため非並進運動モデルの一例としてアフィン変換モデルが主に使われており、別の非並進運動モデルとK個のピクセルサンプルの運動ベクトルとに基づいて現在の画像ブロックにある各ピクセルの運動ベクトルを計算するメカニズムも原理は同様であるが、そのメカニズムでは本実施形態に使われているものとは異なる式が使われてもよい。ここでは例を1つずつ列挙しない。
【0170】
604.現在の予測単位にアフィン変換方式のフレーム間予測モード(ステップ601~ステップ603)を使用するレート歪コストを計算し、且つそのレート歪コストをHEVCフレーム間予測モードを使用する計算レート歪コストに比較する。
【0171】
アフィン変換方式のフレーム間予測モードを使用するレート歪コストがHEVCフレーム間予測モードを使用するレート歪コスト未満である場合は、現在の画像ブロックの最適フレーム間予測モードがアフィン変換方式のフレーム間予測モードに設定される。具体的に述べると、現在の画像ブロックの最適フレーム間予測モードがアフィン変換方式のフレーム間予測モードであることを指示するため、構文要素affine_MC_flagはtrueに設定されてよい。アフィン変換方式のフレーム間予測モードを使用するレート歪コストがHEVCフレーム間予測モードを使用するレート歪コスト以上である場合は、現在の画像ブロックの最適フレーム間予測モードがHEVCフレーム間予測モードであることを指示するため、構文要素affine_MC_flagはfalseに設定される。
【0172】
605.現在の画像ブロックにある各ピクセルの計算運動ベクトルに基づいて現在の画像ブロックに対しピクセル値予測を遂行する。
【0173】
例えば、ルミナンス成分の場合、ピクセルの運動ベクトルが1/4ピクセル精度である場合は、HEVC補間フィルタを使って各ピクセルの予測ピクセル値が得られてよく、あるいはピクセルの運動ベクトルが1/4ピクセル精度を上回る場合は、HEVC補間フィルタを使ってピクセルから最短距離にある4つの1/4ピクセルの予測ピクセル値が最初に得られ、その後ピクセルの予測ピクセル値を得るため双線形補間が遂行される。クロミナンス成分の場合、予測ピクセル値はHEVC補間フィルタを使って得られる。
【0174】
さらに、ビデオ符号化のときには、現在の画像ブロックの元のピクセル値と、ピクセル値予測によって得られた現在の画像ブロックの予測ピクセル値とを使って、現在の画像ブロックの残余が得られてよく、現在の画像ブロックの残余はビデオビットストリームに書き込まれる。具体的に述べると、現在の予測単位の残余は変換と量子化とエントロピー符号化とを経た後にビデオビットストリームに書き込まれる。
【0175】
本実施形態の技術的解決手段において、判断されたK個のピクセルサンプルの運動ベクトル予測子が非並進運動モデルに基づいて現在の画像ブロックに対して遂行されるピクセル値予測のときに参照されることは分かるであろう。K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含む。K個のピクセルサンプルの運動ベクトル予測子は予測に直接使用され、K個のピクセルサンプルにおける第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、K個のピクセルサンプルの運動ベクトル予測子には1つの任意のケースがある。このため、大規模な計算によってK個のピクセルサンプルの複数の任意の運動ベクトル予測子群からK個のピクセルサンプルの運動ベクトル予測子が選択される従来技術のメカニズムは放棄される。これはビットストリームで運動情報予測子の選択情報を伝送することを回避するのに役立ち、符号化効率を上げるのに役立ち、且つ非並進運動モデルに基づく画像予測の計算複雑性を大幅に軽減するのにも役立つ。
【0176】
さらに、現在の画像ブロックにおけるK個のピクセルサンプルのMVPの予測方向は正規化され、参照フレームインデックスは処理され、K個のピクセルサンプルのMVPに対応する運動ベクトルは参照フレームインデックスに従って同じ参照フレームにスケールされマップされる。さらに、現在の画像ブロックにある各ピクセルの運動ベクトルはK個のピクセルサンプルの最良の運動ベクトルに従ってアフィン変換式を用いて計算されてよい。前述の解決手段は、ビデオが非並進的内容を含む場合に、例えばレンズのズーミング、物体の変形、または動く物体の回転を含む場合に、現在のビデオ符号化規格ではフレーム間予測精度が低くなるという問題を解決するのに役立つ。加えて、従来技術で提案されたアフィン変換技術が多方向予測や多参照フレーム方式予測に応用し難いという欠点は克服されるため、ビデオシーケンスの一時的相関を十分に活用して一時的な余剰を排除し、符号化効率を上げるのに役立つ。
【0177】
図7を参照し、
図7は本発明の一実施形態によるビデオ復号化方法の概略流れ図である。
図7の一例に見られるように、本発明の本実施形態で提供されるビデオ復号化方法は下記ステップを含んでよい。
【0178】
701.復号化器は、現在の画像ブロックにアフィン変換方式のフレーム間予測モードが使われているか否かを判断するため、ビデオビットストリームで構文要素affine_MC_flagを復号化する。
【0179】
702.現在の画像ブロックにアフィン変換方式のフレーム間予測モードが使われている場合、復号化器は、現在の画像ブロックに使われているフレーム間予測方向を判断するため、ビデオビットストリームで構文要素affine_inter_dir_flagを復号化する。
【0180】
703.復号化器は構文要素affine_inter_dir_flagに従って現在の画像ブロックにあるK個のピクセルサンプルのMVPを判断する。
【0181】
現在の画像ブロックにあるK個のピクセルサンプルは、前述した実施形態のいずれか1つで説明されている現在の画像ブロックにあるK個のピクセルサンプルであってよい。
【0182】
704.復号化器は、ビデオビットストリームにあって現在の画像ブロックに対応する構文要素affine_no_MVD_flagを復号化することによって、現在の画像ブロックにあるK個のピクセルサンプルに対応するMVDが0であるか否かを判断する。affine_no_MVD_flagがtrueである場合、これは現在の画像ブロックにあるK個のピクセルサンプルに対応するMVDはいずれも0であることを意味し、K個のピクセルサンプルの得られたMVPに対する運動ベクトルがK個のピクセルサンプルの運動ベクトルとして使用されてよい。affine_no_MVD_flagがfalseである場合、これはK個のピクセルサンプルに対応するMVDに0ではないものがあることを意味し、K個のピクセルサンプルに対応するMVDは別の復号化によって得られ、ピクセルサンプルの運動ベクトルを得るため、各ピクセルサンプルに対応するMVDと対応するMVPとが加えられる。
【0183】
705.復号化器は現在の画像ブロックの残余係数を復号化し、且つ現在の画像ブロックにある残余ピクセルを得るため逆量子化と逆変換とを遂行する。
【0184】
706.復号化器は、アフィン変換モデルとK個のピクセルサンプルの運動ベクトルとに基づいて現在の画像ブロックにある各ピクセルの運動ベクトルを計算し、且つ現在の画像ブロックの予測ピクセル値を得るため、現在の画像ブロックにある各ピクセルの計算運動ベクトルに基づいて現在の画像ブロックに対しピクセル値予測を遂行する。
【0185】
尚、本実施形態では説明のため非並進運動モデルの一例としてアフィン変換モデルが主に使われており、別の非並進運動モデルとK個のピクセルサンプルの運動ベクトルとに基づいて現在の画像ブロックにある各ピクセルの運動ベクトルを計算するメカニズムも原理は同様であるが、そのメカニズムでは本実施形態に使われているものとは異なる式が使われてもよい。ここでは例を1つずつ列挙しない。
【0186】
707.復号化器は現在の画像ブロックにある残余ピクセルと現在の画像ブロックの予測ピクセル値とに従って現在の画像ブロックを再構成する。
【0187】
さらに、現在の画像ブロックにある各ピクセルの運動情報は別の画像ブロックの運動ベクトル予測に役立てることができるため、4×4(または8×8)のブロックごとに1個の運動情報が保管されてよく、4×4(または8×8)の各ブロックの運動ベクトルは左上隅のピクセルの運動情報として、または4×4(または8×8)ブロック内の他のピクセルの運動情報として、保管される。
【0188】
運動情報は、運動ベクトルと、運動ベクトルに対応する予測方向と、運動ベクトルに対応する参照フレームインデックスとを含んでよい。
【0189】
本実施形態の技術的解決手段において、判断されたK個のピクセルサンプルの運動ベクトル予測子が非並進運動モデルに基づいて現在の画像ブロックに対して遂行されるピクセル値予測のときに参照されることは分かるであろう。K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含む。K個のピクセルサンプルの運動ベクトル予測子は予測に直接使用され、K個のピクセルサンプルにおける第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、K個のピクセルサンプルの運動ベクトル予測子には1つの任意のケースがある。このため、大規模な計算によってK個のピクセルサンプルの複数の任意の運動ベクトル予測子群からK個のピクセルサンプルの運動ベクトル予測子が選択される従来技術のメカニズムは放棄される。これはビットストリームで運動情報予測子の選択情報を伝送することを回避するのに役立ち、符号化効率を上げるのに役立ち、且つ非並進運動モデルに基づく画像予測の計算複雑性を大幅に軽減するのにも役立つ。
【0190】
さらに、現在の画像ブロックにおけるK個のピクセルサンプルのMVPの予測方向は正規化され、参照フレームインデックスは処理され、K個のピクセルサンプルのMVPに対応する運動ベクトルは参照フレームインデックスに従って同じ参照フレームにスケールされマップされる。さらに、現在の画像ブロックにある各ピクセルの運動ベクトルはK個のピクセルサンプルの最良の運動ベクトルに従ってアフィン変換式を用いて計算されてよい。前述の解決手段は、ビデオが非並進的内容を含む場合に、例えばレンズのズーミング、物体の変形、または動く物体の回転を含む場合に、現在のビデオ符号化規格ではフレーム間予測精度が低くなるという問題を解決するのに役立つ。加えて、従来技術で提案されたアフィン変換技術が多方向予測や多参照フレーム方式予測に応用し難いという欠点は克服されるため、ビデオシーケンスの一時的相関を十分に活用して一時的な余剰を排除し、符号化効率を上げるのに役立つ。
【0191】
最新ビデオ符号化規格HEVCの符号化器を使って本発明の実施形態で提供されるいくつかの解決手段についてエミュレーション試験が行われた。例えば試験は低遅延(LDB)とランダムアクセス(RA)という2つの構成で行われ、本発明の実施形態の解決手段の性能がHM11.0解決手段の性能に比較された。アフィン特性が比較的明白な6つの試験シーケンスが試験に選ばれた。試験シーケンスは表1に列挙されており、エミュレーション結果は表2に示されている。
【0192】
【0193】
【0194】
性能カウンタBD-rateはQPが22、27、32、および37である4つの点の結果を用いた計算によって得られてよく、3つの成分Y、U、およびVのピーク信号対ノイズ比(PSNR)がそれぞれ計算される。
【0195】
本発明の実施形態の解決手段において、LDB構成では平均BD-rate(Y)性能が4.5%増加し、RA構成で平均BD-rate(Y)性能が5.0%増加し、17.8%も増加することは分かるであろう。つまり、PSNRの質が同じである場合にHM11.0解決手段と比べて本発明の解決手段は最大17.8%のビットレートを低減できる。
【0196】
これ以降、いくつかの他の非並進運動モデルを説明する。
【0197】
アフィン変換モデルは下記モデルに一致する運動モデルである。
【数20】
ここでa、b、c、d、e、およびfは定数パラメータであり、(x,y)はピクセルの元の座標であり、(x’,y’)はピクセルに対しアフィン変換が遂行された後に得られる座標であり、Vxはx軸方向の運動ベクトルであり、Vyはy軸方向の運動ベクトルである。
【0198】
回転運動モデルは次のように表すことができる。
【数21】
ここでαは回転角であり、aおよびbはパラメータである。
【0199】
パースペクティブ運動モデルは次のように表すことができる。
【数22】
ここで
【数23】
はパースペクティブ行列である。
【0200】
せん断運動モデルは次のように表すことができる。
【数24】
ここで
【数25】
はせん断行列であり、その他は定数パラメータである。
【0201】
拡大縮小運動モデルは次のように表すことができる。
【数26】
ここでρ
x、ρ
y、θ
x、およびθ
yは定数パラメータである。
【0202】
二次運動モデルは次のように表すことができる。
【数27】
ここでuおよびvは元の座標を表し、xおよびyは変換後に得られる座標を表し、その他は定数パラメータである。
【0203】
前述した例は様々な運動モデルのいくつかの可能な表現形式の例に過ぎず、当然ながら、様々な運動モデルが別の形式をとり得ることは理解できるであろう。
【0204】
これ以降は前述した解決手段を実施する関連装置をさらに提示する。
【0205】
図8を参照し、本発明の一実施形態は画像予測装置800を提供し、画像予測装置800は、
現在の画像ブロックでK個のピクセルサンプルの運動ベクトル予測子を判断するように構成された判断ユニット810であって、ここでKは1よりも大きい整数であり、K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含み、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、第1の空間的に隣接する画像ブロックは第1の頂角ピクセルサンプルに空間的に隣接する、判断ユニット810と、
非並進運動モデルとK個のピクセルサンプルの運動ベクトル予測子とに基づいて現在の画像ブロックに対しピクセル値予測を遂行するように構成された予測ユニット820とを含んでよい。
【0206】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られる。具体的に述べると、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに等しくてよく(つまり、現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルが第1の頂角ピクセルサンプルの運動ベクトル予測子として使用され)、あるいは現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに対し既定の変換を遂行することによって得られる運動ベクトル予測子が第1の頂角ピクセルサンプルの運動ベクトル予測子として使用されてよい。
【0207】
任意に選べることとして、本発明のいくつかの可能な実装様態において、非並進運動モデルは下記モデルのうち、すなわちアフィン変換モデル、放物運動モデル、回転運動モデル、パースペクティブ運動モデル、せん断運動モデル、または拡大縮小運動モデルのうち、いずれか1つである。非並進運動モデルが前述の具体例に限定されないことは理解できるであろう。
【0208】
K個のピクセルサンプルを選択する様々な様態があり得る。
【0209】
任意に選べることとして、本発明のいくつかの可能な実装様態において、K個のピクセルサンプルは、現在の画像ブロックで左上ピクセルサンプル、右上ピクセルサンプル、左下ピクセルサンプル、または右下ピクセルサンプルにある少なくとも2つのピクセルサンプルを含む。
【0210】
ピクセルサンプルがピクセルブロックである場合、ピクセルブロックのサイズは例えば2×2、1×2、4×2、4×4、または別のサイズである。
【0211】
任意に選べることとして、本発明のいくつかの可能な実装様態において、現在の画像ブロックにおける左上ピクセルサンプルは現在の画像ブロックの左上頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの左上頂点を含むピクセルブロックである。現在の画像ブロックにおける左下ピクセルサンプルは現在の画像ブロックの左下頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの左下頂点を含むピクセルブロックである。現在の画像ブロックにおける右上ピクセルサンプルは現在の画像ブロックの右上頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの右上頂点を含むピクセルブロックである。現在の画像ブロックにおける右下ピクセルサンプルは現在の画像ブロックの右下頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの右下頂点を含むピクセルブロックである。
【0212】
任意に選べることとして、本発明のいくつかの可能な実装様態において、K個のピクセルサンプルは現在の画像ブロックにおける中心ピクセルサンプルをさらに含んでよい。現在の画像ブロックにおける中心ピクセルサンプルは現在の画像ブロックの中心ピクセルであってよく、あるいは現在の画像ブロック内にあって現在の画像ブロックの中心ピクセルを含むピクセルブロックであってよい。
【0213】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の空間的に隣接する画像ブロックは画像ブロックX1、画像ブロックX2、画像ブロックX3、または画像ブロックX4であってよい。
【0214】
現在の画像ブロックにおける左上ピクセルサンプルの運動ベクトル予測子は画像ブロックX1の運動ベクトルに基づいて得られてよく、画像ブロックX1は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX1は現在の画像ブロックにおいて左上ピクセルサンプルに空間的に隣接する。
【0215】
現在の画像ブロックにおける右上ピクセルサンプルの運動ベクトル予測子は画像ブロックX2の運動ベクトルに基づいて得られてよく、画像ブロックX2は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX2は現在の画像ブロックにおいて右上ピクセルサンプルに空間的に隣接する。
【0216】
現在の画像ブロックにおける左下ピクセルサンプルの運動ベクトル予測子は画像ブロックX3の運動ベクトルに基づいて得られてよく、画像ブロックX3は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX3は現在の画像ブロックにおいて左下ピクセルサンプルに空間的に隣接する。
【0217】
現在の画像ブロックにおける右下ピクセルサンプルの運動ベクトル予測子は画像ブロックX4の運動ベクトルに基づいて得られてよく、画像ブロックX4は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX4は現在の画像ブロックにおいて右下ピクセルサンプルに空間的に隣接する。
【0218】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の頂角ピクセルサンプルは現在の画像ブロックにおける左上ピクセルサンプルであてってよく、第1の空間的に隣接する画像ブロックは画像ブロックX1であってよい。画像ブロックX1は現在の画像ブロックの左上で空間的に隣接する画像ブロックであり、あるいは画像ブロックX1は現在の画像ブロックの左側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX1は現在の画像ブロックの上方で空間的に隣接する画像ブロックである。
【0219】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX2は現在の画像ブロックの上方で空間的に隣接する画像ブロックであり、あるいは画像ブロックX2は現在の画像ブロックの右上で空間的に隣接する画像ブロックであり、あるいは画像ブロックX2は現在の画像ブロックの右側で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX2の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX5の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX5は、画像ブロックX2を除く、右上頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。つまり、画像ブロックX2の位置は特定の方針に基づいて決定されてよく、あるいは画像ブロックX2の位置は直接的に取り決められてよい。
【0220】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX3は現在の画像ブロックの左側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX3は現在の画像ブロックの左下で空間的に隣接する画像ブロックであり、あるいは画像ブロックX3は現在の画像ブロックの下方で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX3の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX6の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX6は、画像ブロックX3を除く、左下頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。つまり、画像ブロックX3の位置は特定の方針に基づいて決定されてよく、あるいは画像ブロックX3の位置は直接的に取り決められてよい。
【0221】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX4は現在の画像ブロックの右側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX4は現在の画像ブロックの右下で空間的に隣接する画像ブロックであり、あるいは画像ブロックX4は現在の画像ブロックの下方で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX4の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX7の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX7は、画像ブロックX4を除く、左下頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。
【0222】
図2を参照し、
図2は画像ブロックX1と画像ブロックX2と画像ブロックX3と画像ブロックX4のいくつかの可能な位置の例を示すものである。
【0223】
任意に選べることとして、本発明のいくつかの可能な実装様態において、予測ユニット820は、K個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1である場合に、K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し運動推定を遂行し、且つ非並進運動モデルとK個のピクセルサンプルの運動ベクトルとを使って現在の画像ブロックに対しピクセル値予測を遂行するように構成されてよい。
【0224】
任意に選べることとして、予測ユニット820は、K個のピクセルサンプルにおけるK1個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1でない場合に、K1個のピクセルサンプルの運動ベクトル予測子を参照フレームY1にスケールし、K個のピクセルサンプルの運動ベクトルを得るため、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行し、且つ、非並進運動モデルとK個のピクセルサンプルの運動ベクトルとを使って現在の画像ブロックに対しピクセル値予測を遂行するように構成されてよく、ここでK2個のピクセルサンプルはK個のピクセルサンプルのうちK1個のピクセルサンプルを除いた残りのピクセルサンプルであり、K1とK2は正の整数である。
【0225】
任意に選べることとして、本発明のいくつかの可能な実装様態において、参照フレームY1は第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する参照フレームであってよく、あるいは参照フレームY1はK個のピクセルサンプルにある別のピクセルサンプルの運動ベクトル予測子に対応する参照フレームであってよい。
【0226】
任意に選べることとして、本発明のいくつかの可能な実装様態において、ピクセルサンプルiはK個のピクセルサンプルで第1の頂角ピクセルサンプルを除くいずれかのピクセルサンプルであり、ピクセルサンプルiの運動ベクトル予測子に対応する予測方向が第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する予測方向と異なる場合、ピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスは0である。
【0227】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の頂角ピクセルサンプルとピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスが異なる場合に、予測ユニット820はピクセルサンプルiの運動ベクトル予測子を参照フレームY1にスケールしてよい。
【0228】
任意に選べることとして、本発明のいくつかの可能な実装様態において、予測ユニット820は、K個のピクセルサンプルの運動ベクトルを得るため、反復探索アルゴリズム(または別種の運動推定アルゴリズム)に基づいてK2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行するように構成されてよい。
【0229】
任意に選べることとして、本発明のいくつかの可能な実装様態において、K個のピクセルサンプルの運動ベクトルを得るため、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行するステップは、K個のピクセルサンプルの運動ベクトルを得るため、反復探索アルゴリズムに基づいてK2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行するステップを含む。
【0230】
画像予測装置800はビデオ符号化装置に応用され、あるいは画像予測装置800はビデオ復号化装置に応用される。
【0231】
本実施形態における画像予測装置800の全機能モジュールの機能が前述した方法の実施形態の方法に従って具体的に実施されてよいことは理解できるであろう。具体的な実施プロセスについては前述した方法の実施形態で関連する説明を参照し、ここでは詳細を繰り返し説明しない。画像予測装置800はビデオを出力したり再生したりする必要がある何らかの装置であってよく、例えばラップトップコンピュータ、タブレットコンピュータ、パーソナルコンピュータ、または携帯電話機であってよい。
【0232】
本実施形態の技術的解決手段において、判断されたK個のピクセルサンプルの運動ベクトル予測子が非並進運動モデルに基づいて現在の画像ブロックに対して遂行されるピクセル値予測のときに参照されることは分かるであろう。K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含む。K個のピクセルサンプルの運動ベクトル予測子は予測に直接使用され、K個のピクセルサンプルにおける第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、K個のピクセルサンプルの運動ベクトル予測子には1つの任意のケースがある。このため、大規模な計算によってK個のピクセルサンプルの複数の任意の運動ベクトル予測子群からK個のピクセルサンプルの運動ベクトル予測子が選択される従来技術のメカニズムは放棄される。これはビットストリームで運動情報予測子の選択情報を伝送することを回避するのに役立ち、符号化効率を上げるのに役立ち、且つ非並進運動モデルに基づく画像予測の計算複雑性を大幅に軽減するのにも役立つ。
【0233】
また、第1の空間的に隣接する画像ブロックは第1の頂角ピクセルサンプルに空間的に隣接し、現在の画像ブロックの第1の空間的に隣接する画像ブロックは予め設定される(つまり、現在の画像ブロックの第1の空間的に隣接する画像ブロックは事前に取り決められるか設定されると考えることができる)。したがって、これはK個のピクセルサンプルの運動ベクトル予測子を速やかに判断するのに役立つ。加えて、画像ブロック間の空間相関を十分に活用することによって余剰が排除されるため、これは符号化効率をさらに上げるのに役立つ。
【0234】
図9を参照し、
図9は本発明の一実施形態による画像予測装置900の概略図である。画像予測装置900は少なくとも1つのバス901と、バス901へ接続された少なくとも1つのプロセッサ902と、バス901へ接続された少なくとも1つのメモリ903とを含んでよい。
【0235】
プロセッサ902は、メモリ903に記憶されたコードをバス901を使って呼び出すことにより、現在の画像ブロックでK個のピクセルサンプルの運動ベクトル予測子を判断し、且つ非並進運動モデルとK個のピクセルサンプルの運動ベクトル予測子とに基づいて現在の画像ブロックに対しピクセル値予測を遂行し、ここでKは1よりも大きい整数であり、K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含み、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、第1の空間的に隣接する画像ブロックは第1の頂角ピクセルサンプルに空間的に隣接する。
【0236】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られる。具体的に述べると、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに等しくてよく(つまり、現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルが第1の頂角ピクセルサンプルの運動ベクトル予測子として使用され)、あるいは現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに対し既定の変換を遂行することによって得られる運動ベクトル予測子が第1の頂角ピクセルサンプルの運動ベクトル予測子として使用されてよい。
【0237】
任意に選べることとして、本発明のいくつかの可能な実装様態において、非並進運動モデルは下記モデルのうち、すなわちアフィン変換モデル、放物運動モデル、回転運動モデル、パースペクティブ運動モデル、せん断運動モデル、または拡大縮小運動モデルのうち、いずれか1つである。非並進運動モデルが前述の具体例に限定されないことは理解できるであろう。
【0238】
K個のピクセルサンプルを選択する様々な様態があり得る。
【0239】
任意に選べることとして、本発明のいくつかの可能な実装様態において、K個のピクセルサンプルは、現在の画像ブロックで左上ピクセルサンプル、右上ピクセルサンプル、左下ピクセルサンプル、または右下ピクセルサンプルにある少なくとも2つのピクセルサンプルを含む。
【0240】
ピクセルサンプルがピクセルブロックである場合、ピクセルブロックのサイズは例えば2×2、1×2、4×2、4×4、または別のサイズである。
【0241】
任意に選べることとして、本発明のいくつかの可能な実装様態において、現在の画像ブロックにおける左上ピクセルサンプルは現在の画像ブロックの左上頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの左上頂点を含むピクセルブロックである。現在の画像ブロックにおける左下ピクセルサンプルは現在の画像ブロックの左下頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの左下頂点を含むピクセルブロックである。現在の画像ブロックにおける右上ピクセルサンプルは現在の画像ブロックの右上頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの右上頂点を含むピクセルブロックである。現在の画像ブロックにおける右下ピクセルサンプルは現在の画像ブロックの右下頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの右下頂点を含むピクセルブロックである。
【0242】
任意に選べることとして、本発明のいくつかの可能な実装様態において、K個のピクセルサンプルは現在の画像ブロックにおける中心ピクセルサンプルをさらに含んでよい。現在の画像ブロックにおける中心ピクセルサンプルは現在の画像ブロックの中心ピクセルであってよく、あるいは現在の画像ブロック内にあって現在の画像ブロックの中心ピクセルを含むピクセルブロックであってよい。
【0243】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の空間的に隣接する画像ブロックは画像ブロックX1、画像ブロックX2、画像ブロックX3、または画像ブロックX4であってよい。
【0244】
現在の画像ブロックにおける左上ピクセルサンプルの運動ベクトル予測子は画像ブロックX1の運動ベクトルに基づいて得られてよく、画像ブロックX1は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX1は現在の画像ブロックにおいて左上ピクセルサンプルに空間的に隣接する。
【0245】
現在の画像ブロックにおける右上ピクセルサンプルの運動ベクトル予測子は画像ブロックX2の運動ベクトルに基づいて得られてよく、画像ブロックX2は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX2は現在の画像ブロックにおいて右上ピクセルサンプルに空間的に隣接する。
【0246】
現在の画像ブロックにおける左下ピクセルサンプルの運動ベクトル予測子は画像ブロックX3の運動ベクトルに基づいて得られてよく、画像ブロックX3は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX3は現在の画像ブロックにおいて左下ピクセルサンプルに空間的に隣接する。
【0247】
現在の画像ブロックにおける右下ピクセルサンプルの運動ベクトル予測子は画像ブロックX4の運動ベクトルに基づいて得られてよく、画像ブロックX4は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX4は現在の画像ブロックにおいて右下ピクセルサンプルに空間的に隣接する。
【0248】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の頂角ピクセルサンプルは現在の画像ブロックにおける左上ピクセルサンプルであてってよく、第1の空間的に隣接する画像ブロックは画像ブロックX1であってよい。画像ブロックX1は現在の画像ブロックの左上で空間的に隣接する画像ブロックであり、あるいは画像ブロックX1は現在の画像ブロックの左側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX1は現在の画像ブロックの上方で空間的に隣接する画像ブロックである。
【0249】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX2は現在の画像ブロックの上方で空間的に隣接する画像ブロックであり、あるいは画像ブロックX2は現在の画像ブロックの右上で空間的に隣接する画像ブロックであり、あるいは画像ブロックX2は現在の画像ブロックの右側で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX2の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX5の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX5は、画像ブロックX2を除く、右上頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。つまり、画像ブロックX2の位置は特定の方針に基づいて決定されてよく、あるいは画像ブロックX2の位置は直接的に取り決められてよい。
【0250】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX3は現在の画像ブロックの左側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX3は現在の画像ブロックの左下で空間的に隣接する画像ブロックであり、あるいは画像ブロックX3は現在の画像ブロックの下方で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX3の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX6の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX6は、画像ブロックX3を除く、左下頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。つまり、画像ブロックX3の位置は特定の方針に基づいて決定されてよく、あるいは画像ブロックX3の位置は直接的に取り決められてよい。
【0251】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX4は現在の画像ブロックの右側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX4は現在の画像ブロックの右下で空間的に隣接する画像ブロックであり、あるいは画像ブロックX4は現在の画像ブロックの下方で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX4の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX7の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX7は、画像ブロックX4を除く、左下頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。
【0252】
任意に選べることとして、本発明のいくつかの可能な実装様態において、プロセッサ902は、K個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1である場合に、K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し運動推定を遂行し、且つ非並進運動モデルとK個のピクセルサンプルの運動ベクトルとを使って現在の画像ブロックに対しピクセル値予測を遂行するように構成されてよい。
【0253】
任意に選べることとして、本発明のいくつかの可能な実装様態において、プロセッサ902は、K個のピクセルサンプルにおけるK1個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1でない場合に、K1個のピクセルサンプルの運動ベクトル予測子を参照フレームY1にスケールし、K個のピクセルサンプルの運動ベクトルを得るため、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行し、且つ、非並進運動モデルとK個のピクセルサンプルの運動ベクトルとを使って現在の画像ブロックに対しピクセル値予測を遂行するように構成されてよく、ここでK2個のピクセルサンプルはK個のピクセルサンプルのうちK1個のピクセルサンプルを除いた残りのピクセルサンプルであり、K1とK2は正の整数である。
【0254】
任意に選べることとして、本発明のいくつかの可能な実装様態において、参照フレームY1は第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する参照フレームであってよく、あるいは参照フレームY1はK個のピクセルサンプルにある別のピクセルサンプルの運動ベクトル予測子に対応する参照フレームであってよい。
【0255】
任意に選べることとして、本発明のいくつかの可能な実装様態において、ピクセルサンプルiはK個のピクセルサンプルで第1の頂角ピクセルサンプルを除くいずれかのピクセルサンプルであり、ピクセルサンプルiの運動ベクトル予測子に対応する予測方向が第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する予測方向と異なる場合、ピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスは0である。
【0256】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の頂角ピクセルサンプルとピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスが異なる場合、プロセッサ902はピクセルサンプルiの運動ベクトル予測子を参照フレームY1にスケールするように構成されてよい。
【0257】
任意に選べることとして、本発明のいくつかの可能な実装様態において、プロセッサ902は、K個のピクセルサンプルの運動ベクトルを得るため、反復探索アルゴリズム(または別種の運動推定アルゴリズム)に基づいてK2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行するように構成されてよい。
【0258】
本実施形態における画像予測装置900の全機能モジュールの機能が前述した方法の実施形態の方法に従って具体的に実施されてよいことは理解できるであろう。具体的な実施プロセスについては前述した方法の実施形態で関連する説明を参照し、ここでは詳細を繰り返し説明しない。画像予測装置900はビデオを出力したり再生したりする必要がある何らかの装置であってよく、例えばラップトップコンピュータ、タブレットコンピュータ、パーソナルコンピュータ、または携帯電話機であってよい。
【0259】
本実施形態の技術的解決手段において、判断されたK個のピクセルサンプルの運動ベクトル予測子が非並進運動モデルに基づいて現在の画像ブロックに対して遂行されるピクセル値予測のときに参照されることは分かるであろう。K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含む。K個のピクセルサンプルの運動ベクトル予測子は予測に直接使用され、K個のピクセルサンプルにおける第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、K個のピクセルサンプルの運動ベクトル予測子には1つの任意のケースがある。このため、大規模な計算によってK個のピクセルサンプルの複数の任意の運動ベクトル予測子群からK個のピクセルサンプルの運動ベクトル予測子が選択される従来技術のメカニズムは放棄される。これはビットストリームで運動情報予測子の選択情報を伝送することを回避するのに役立ち、符号化効率を上げるのに役立ち、且つ非並進運動モデルに基づく画像予測の計算複雑性を大幅に軽減するのにも役立つ。
【0260】
また、第1の空間的に隣接する画像ブロックは第1の頂角ピクセルサンプルに空間的に隣接し、現在の画像ブロックの第1の空間的に隣接する画像ブロックは予め設定される(つまり、現在の画像ブロックの第1の空間的に隣接する画像ブロックは事前に取り決められるか設定されると考えることができる)。したがって、これはK個のピクセルサンプルの運動ベクトル予測子を速やかに判断するのに役立つ。加えて、画像ブロック間の空間相関を十分に活用することによって余剰が排除されるため、これは符号化効率をさらに上げるのに役立つ。
【0261】
図10を参照し、
図10は本発明の別の実施形態による画像予測装置1000の構造的ブロック図である。画像予測装置1000は、少なくとも1つのプロセッサ1001と、少なくとも1つのネットワークインターフェース1004または他のユーザーインターフェース1003と、メモリ1005と、少なくとも1つの通信バス1002とを含んでよい。通信バス1002はこれらのコンポーネントの間で接続と通信を実施するように構成される。画像予測装置1000は、ディスプレイ(例えばタッチスクリーン、LCD、ホログラフィックイメージング装置(Holographic imaging device)、CRT、映写(Projector))、クリック装置(例えばマウス、トラックボール(trackball)、タッチパッド、またはタッチスクリーン)、カメラおよび/またはピックアップ装置等を含むユーザーインターフェース1003を任意に含んでよい。
【0262】
メモリ1005は読み取り専用メモリとランダムアクセスメモリとを含んでよく、プロセッサ1001に命令とデータを提供してよい。メモリ1005の一部は不揮発性ランダムアクセスメモリ(NVRAM)をさらに含んでよい。
【0263】
いくつかの実装様態において、メモリ1005は下記要素を、すなわち実行可能モジュールまたはデータ構造、またはこれのサブセット、またはこれの拡張セットを、記憶する。
様々なシステムプログラムを含み、様々な基本的サービスを実施しハードウェアベースのタスクを処理するために使われる、オペレーティングシステム10051
様々なアプリケーションプログラムを含み、様々なアプリケーションサービスを実施するために使われる、アプリケーションプログラムモジュール10052
【0264】
本発明の本実施形態において、メモリ1005に記憶されたプログラムや命令を呼び出すことにより、プロセッサ1001は現在の画像ブロックでK個のピクセルサンプルの運動ベクトル予測子を判断するように構成され、ここでKは1よりも大きい整数であり、K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含み、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、第1の空間的に隣接する画像ブロックは第1の頂角ピクセルサンプルに空間的に隣接し、且つプロセッサ1001は非並進運動モデルとK個のピクセルサンプルの運動ベクトル予測子とに基づいて現在の画像ブロックに対しピクセル値予測を遂行するように構成される。
【0265】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られる。具体的に述べると、第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに等しくてよく(つまり、現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルが第1の頂角ピクセルサンプルの運動ベクトル予測子として使用され)、あるいは現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに対し既定の変換を遂行することによって得られる運動ベクトル予測子が第1の頂角ピクセルサンプルの運動ベクトル予測子として使用されてよい。
【0266】
任意に選べることとして、本発明のいくつかの可能な実装様態において、非並進運動モデルは下記モデルのうち、すなわちアフィン変換モデル、放物運動モデル、回転運動モデル、パースペクティブ運動モデル、せん断運動モデル、または拡大縮小運動モデルのうち、いずれか1つである。非並進運動モデルが前述の具体例に限定されないことは理解できるであろう。
【0267】
K個のピクセルサンプルを選択する様々な様態があり得る。
【0268】
任意に選べることとして、本発明のいくつかの可能な実装様態において、K個のピクセルサンプルは、現在の画像ブロックで左上ピクセルサンプル、右上ピクセルサンプル、左下ピクセルサンプル、または右下ピクセルサンプルにある少なくとも2つのピクセルサンプルを含む。
【0269】
ピクセルサンプルがピクセルブロックである場合、ピクセルブロックのサイズは例えば2×2、1×2、4×2、4×4、または別のサイズである。
【0270】
任意に選べることとして、本発明のいくつかの可能な実装様態において、現在の画像ブロックにおける左上ピクセルサンプルは現在の画像ブロックの左上頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの左上頂点を含むピクセルブロックである。現在の画像ブロックにおける左下ピクセルサンプルは現在の画像ブロックの左下頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの左下頂点を含むピクセルブロックである。現在の画像ブロックにおける右上ピクセルサンプルは現在の画像ブロックの右上頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの右上頂点を含むピクセルブロックである。現在の画像ブロックにおける右下ピクセルサンプルは現在の画像ブロックの右下頂点であり、あるいは現在の画像ブロック内にあって現在の画像ブロックの右下頂点を含むピクセルブロックである。
【0271】
任意に選べることとして、本発明のいくつかの可能な実装様態において、K個のピクセルサンプルは現在の画像ブロックにおける中心ピクセルサンプルをさらに含んでよい。現在の画像ブロックにおける中心ピクセルサンプルは現在の画像ブロックの中心ピクセルであってよく、あるいは現在の画像ブロック内にあって現在の画像ブロックの中心ピクセルを含むピクセルブロックであってよい。
【0272】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の空間的に隣接する画像ブロックは画像ブロックX1、画像ブロックX2、画像ブロックX3、または画像ブロックX4であってよい。
【0273】
現在の画像ブロックにおける左上ピクセルサンプルの運動ベクトル予測子は画像ブロックX1の運動ベクトルに基づいて得られてよく、画像ブロックX1は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX1は現在の画像ブロックにおいて左上ピクセルサンプルに空間的に隣接する。
【0274】
現在の画像ブロックにおける右上ピクセルサンプルの運動ベクトル予測子は画像ブロックX2の運動ベクトルに基づいて得られてよく、画像ブロックX2は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX2は現在の画像ブロックにおいて右上ピクセルサンプルに空間的に隣接する。
【0275】
現在の画像ブロックにおける左下ピクセルサンプルの運動ベクトル予測子は画像ブロックX3の運動ベクトルに基づいて得られてよく、画像ブロックX3は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX3は現在の画像ブロックにおいて左下ピクセルサンプルに空間的に隣接する。
【0276】
現在の画像ブロックにおける右下ピクセルサンプルの運動ベクトル予測子は画像ブロックX4の運動ベクトルに基づいて得られてよく、画像ブロックX4は現在の画像ブロックの空間的に隣接する画像ブロックであり、画像ブロックX4は現在の画像ブロックにおいて右下ピクセルサンプルに空間的に隣接する。
【0277】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の頂角ピクセルサンプルは現在の画像ブロックにおける左上ピクセルサンプルであてってよく、第1の空間的に隣接する画像ブロックは画像ブロックX1であってよい。画像ブロックX1は現在の画像ブロックの左上で空間的に隣接する画像ブロックであり、あるいは画像ブロックX1は現在の画像ブロックの左側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX1は現在の画像ブロックの上方で空間的に隣接する画像ブロックである。
【0278】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX2は現在の画像ブロックの上方で空間的に隣接する画像ブロックであり、あるいは画像ブロックX2は現在の画像ブロックの右上で空間的に隣接する画像ブロックであり、あるいは画像ブロックX2は現在の画像ブロックの右側で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX2の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX5の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX5は、画像ブロックX2を除く、右上頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。つまり、画像ブロックX2の位置は特定の方針に基づいて決定されてよく、あるいは画像ブロックX2の位置は直接的に取り決められてよい。
【0279】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX3は現在の画像ブロックの左側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX3は現在の画像ブロックの左下で空間的に隣接する画像ブロックであり、あるいは画像ブロックX3は現在の画像ブロックの下方で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX3の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX6の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX6は、画像ブロックX3を除く、左下頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。つまり、画像ブロックX3の位置は特定の方針に基づいて決定されてよく、あるいは画像ブロックX3の位置は直接的に取り決められてよい。
【0280】
任意に選べることとして、本発明のいくつかの可能な実装様態において、画像ブロックX4は現在の画像ブロックの右側で空間的に隣接する画像ブロックであり、あるいは画像ブロックX4は現在の画像ブロックの右下で空間的に隣接する画像ブロックであり、あるいは画像ブロックX4は現在の画像ブロックの下方で空間的に隣接する画像ブロックである。さらに任意に選べることとして、画像ブロックX4の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値は画像ブロックX7の運動ベクトル絶対値と画像ブロックX1の運動ベクトル絶対値との差の絶対値以上であり、画像ブロックX7は、画像ブロックX4を除く、左下頂点に空間的に隣接する現在の画像ブロックの残りの少なくともいくつかの空間的に隣接する画像ブロックのいずれか1つである。
【0281】
任意に選べることとして、本発明のいくつかの可能な実装様態において、プロセッサ1001は、K個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1である場合に、K個のピクセルサンプルの運動ベクトルを得るため、K個のピクセルサンプルの運動ベクトル予測子を使ってK個のピクセルサンプルに対し運動推定を遂行し、且つ非並進運動モデルとK個のピクセルサンプルの運動ベクトルとを使って現在の画像ブロックに対しピクセル値予測を遂行するように構成されてよい。
【0282】
任意に選べることとして、本発明のいくつかの可能な実装様態において、プロセッサ1001は、K個のピクセルサンプルにおけるK1個のピクセルサンプルの運動ベクトル予測子に対応する参照フレームが参照フレームY1でない場合に、K1個のピクセルサンプルの運動ベクトル予測子を参照フレームY1にスケールし、K個のピクセルサンプルの運動ベクトルを得るため、K2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行し、且つ、非並進運動モデルとK個のピクセルサンプルの運動ベクトルとを使って現在の画像ブロックに対しピクセル値予測を遂行するように構成されてよく、ここでK2個のピクセルサンプルはK個のピクセルサンプルのうちK1個のピクセルサンプルを除いた残りのピクセルサンプルであり、K1とK2は正の整数である。
【0283】
任意に選べることとして、本発明のいくつかの可能な実装様態において、参照フレームY1は第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する参照フレームであってよく、あるいは参照フレームY1はK個のピクセルサンプルにある別のピクセルサンプルの運動ベクトル予測子に対応する参照フレームであってよい。
【0284】
任意に選べることとして、本発明のいくつかの可能な実装様態において、ピクセルサンプルiはK個のピクセルサンプルで第1の頂角ピクセルサンプルを除くいずれかのピクセルサンプルであり、ピクセルサンプルiの運動ベクトル予測子に対応する予測方向が第1の頂角ピクセルサンプルの運動ベクトル予測子に対応する予測方向と異なる場合、ピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスは0である。
【0285】
任意に選べることとして、本発明のいくつかの可能な実装様態において、第1の頂角ピクセルサンプルとピクセルサンプルiの運動ベクトル予測子に対応する参照フレームインデックスが異なる場合、プロセッサ1001はピクセルサンプルiの運動ベクトル予測子を参照フレームY1にスケールするように構成されてよい。
【0286】
任意に選べることとして、本発明のいくつかの可能な実装様態において、プロセッサ1001は、K個のピクセルサンプルの運動ベクトルを得るため、反復探索アルゴリズム(または別種の運動推定アルゴリズム)に基づいてK2個のピクセルサンプルの運動ベクトル予測子と参照フレームY1にスケールされたK1個のピクセルサンプルの運動ベクトル予測子とを使ってK個のピクセルサンプルに対し運動推定を遂行するように構成されてよい。
【0287】
本実施形態における画像予測装置1000の全機能モジュールの機能が前述した方法の実施形態の方法に従って具体的に実施されてよいことは理解できるであろう。具体的な実施プロセスについては前述した方法の実施形態で関連する説明を参照し、ここでは詳細を繰り返し説明しない。画像予測装置1000はビデオを出力したり再生したりする必要がある何らかの装置であってよく、例えばラップトップコンピュータ、タブレットコンピュータ、パーソナルコンピュータ、または携帯電話機であってよい。
【0288】
本実施形態の技術的解決手段において、判断されたK個のピクセルサンプルの運動ベクトル予測子が非並進運動モデルに基づいて現在の画像ブロックに対して遂行されるピクセル値予測のときに参照されることは分かるであろう。K個のピクセルサンプルは現在の画像ブロックにおける第1の頂角ピクセルサンプルを含む。K個のピクセルサンプルの運動ベクトル予測子は予測に直接使用され、K個のピクセルサンプルにおける第1の頂角ピクセルサンプルの運動ベクトル予測子は現在の画像ブロックの予め設定された第1の空間的に隣接する画像ブロックの運動ベクトルに基づいて得られ、K個のピクセルサンプルの運動ベクトル予測子には1つの任意のケースがある。このため、大規模な計算によってK個のピクセルサンプルの複数の任意の運動ベクトル予測子群からK個のピクセルサンプルの運動ベクトル予測子が選択される従来技術のメカニズムは放棄される。これはビットストリームで運動情報予測子の選択情報を伝送することを回避するのに役立ち、符号化効率を上げるのに役立ち、且つ非並進運動モデルに基づく画像予測の計算複雑性を大幅に軽減するのにも役立つ。
【0289】
また、第1の空間的に隣接する画像ブロックは第1の頂角ピクセルサンプルに空間的に隣接し、現在の画像ブロックの第1の空間的に隣接する画像ブロックは予め設定される(つまり、現在の画像ブロックの第1の空間的に隣接する画像ブロックは事前に取り決められるか設定されると考えることができる)。したがって、これはK個のピクセルサンプルの運動ベクトル予測子を速やかに判断するのに役立つ。加えて、画像ブロック間の空間相関を十分に活用することによって余剰が排除されるため、これは符号化効率をさらに上げるのに役立つ。
【0290】
尚、説明を簡単にするため、前述した方法の実施形態は一連の行為として表現されている。ただし、本発明によると一部のステップは別の順序で遂行されてよく、あるいは同時に遂行されてよいため、当業者なら本発明が記載された行為の順序に限定されないことを理解するであろう。加えて当業者は、明細書で説明されている実施形態がいずれも実施形態の例であって、関係する行為やモジュールが必ずしも本発明にとって必須ではないことを理解するであろう。
【0291】
上記の実施形態ではどの実施形態も的を絞って説明されている。或る1つの実施形態で詳しく説明されていない部分については、他の実施形態に記載された関連する説明を参照されたい。
【0292】
本願で提供される実施形態で開示されている装置が別の様態で実装されてよいことを理解されたい。例えば、説明されている装置の実施形態は一例に過ぎない。例えば、ユニットの分割は論理的な機能分割に過ぎず、実際の実装では別の分割であってもよい。例えば、複数のユニットやコンポーネントが組み合わされて別のシステムにまとめられてもよく、一部の機能は無視されてもよく、遂行されなくてもよい。加えて、表示もしくは論述された相互結合や直接結合や通信接続は何らかのインターフェースを用いて実装されてよい。装置またはユニット間の間接結合や通信接続は電子的形態やその他の形態で実装されてよい。
【0293】
単独部分として説明されているユニットは物理的に単独であってもなくてもよく、ユニットとして表示されている部分は物理的なユニットであってもなくてもよく、1ヶ所に置かれてもよく、複数のネットワークユニットに分散されてもよい。実施形態の解決手段の目的を達成するため、ユニットの一部または全部が実際のニーズに応じて選ばれてよい。
【0294】
加えて、本発明の実施形態の機能ユニットは1つの処理ユニットに統合されてよく、それぞれのユニットが物理的に単独で存在してもよく、2つ以上のユニットは1つのユニットに統合される。統合されたユニットはハードウェアの形で実装されてよく、あるいはソフトウェア機能ユニットの形で実装されてもよい。
【0295】
前述の統合されたユニットがソフトウェア機能ユニットの形で実装され、独立した製品として販売もしくは使用される場合、統合されたユニットはコンピュータ可読記憶媒体に記憶されてよい。このような理解に基づき、本発明の技術的解決手段は、あるいは先行技術に寄与する部分は、あるいは技術的解決手段の全部または一部は、ソフトウェア製品の形で実装されてよい。ソフトウェア製品は記憶媒体に記憶され、本発明の実施形態で説明した方法のステップの全部または一部を遂行することをコンピュータ装置(パーソナルコンピュータ、サーバー、ネットワーク装置等であってよい)に命令する命令を含む。前述した記憶媒体は、USBフラッシュドライブ、読み取り専用メモリ(ROM、Read-Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、リムーバブルハードディスク、磁気ディスク、光ディスク等、プログラムコードを記憶できる媒体を含む。
【0296】
上記の実施形態は、本発明の技術的解決手段を説明するためのものに過ぎず、本発明を制限するものではない。上記の実施形態を参照しながら本発明を詳しく説明したが、当業者は、本発明の実施形態の技術的解決手段の精神および範囲から逸脱することなく上記の実施形態で説明した技術的解決手段に変更を加えたり、その技術的要素に同等の差し替えを行うことができることを理解するであろう。
【符号の説明】
【0297】
800 画像予測装置
810 判断ユニット
820 予測ユニット
900 画像予測装置
901 バス
902 プロセッサ
903 メモリ
1000 画像予測装置
1001 プロセッサ
1002 通信バス
1003 ユーザーインターフェース
1004 ネットワークインターフェース
1005 メモリ
10051 オペレーティングシステム
10052 アプリケーションプログラム