(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024059251
(43)【公開日】2024-05-01
(54)【発明の名称】映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法
(51)【国際特許分類】
H04N 19/103 20140101AFI20240423BHJP
H04N 19/157 20140101ALI20240423BHJP
H04N 19/59 20140101ALI20240423BHJP
【FI】
H04N19/103
H04N19/157
H04N19/59
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022166819
(22)【出願日】2022-10-18
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103090
【弁理士】
【氏名又は名称】岩壁 冬樹
(74)【代理人】
【識別番号】100124501
【弁理士】
【氏名又は名称】塩川 誠人
(72)【発明者】
【氏名】飯田 健太
(72)【発明者】
【氏名】徳満 健太
(72)【発明者】
【氏名】森吉 達治
(72)【発明者】
【氏名】蝶野 慶一
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LB05
5C159MA04
5C159MA05
5C159MA14
5C159MA21
5C159MC11
5C159RC12
5C159TA17
5C159TA61
5C159TA62
5C159TB08
5C159TC03
5C159TC41
5C159TD02
5C159TD05
5C159TD06
5C159UA02
5C159UA05
5C159UA16
(57)【要約】
【課題】映像符号化装置において、ある符号化処理が他の符号化処理を制約する場合に、映像符号化装置と映像復号装置との間の相互接続性が低下しないようにする。
【解決手段】映像符号化装置10は、処理対象フレームの解像度と異なる解像度の符号化済みのフレームを参照フレームとする特定処理を含む予測符号化処理を実行可能な映像符号化装置であって、予測符号化処理を実行する符号化部11と、予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いた補正を行うことになる第2処理、または、第1処理および第2処理の双方の実行を禁止する制御部12とを含む。
【選択図】
図12
【特許請求の範囲】
【請求項1】
処理対象フレームの解像度と異なる解像度の符号化済みのフレームを参照フレームとする特定処理を含む予測符号化処理を実行可能な映像符号化装置であって、
前記予測符号化処理を実行する符号化手段と、
前記予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いて補正を行うことになる第2処理、または、前記第1処理および前記第2処理の双方の実行を禁止する制御手段と
を備える映像符号化装置。
【請求項2】
前記第1処理は、複数種類の処理を含み、
前記第2処理は、複数種類の処理を含み、
前記制御手段は、前記第1処理に含まれる全ての処理の実行と前記第2処理に含まれる全ての処理の実行とを禁止する
請求項1に記載の映像符号化装置。
【請求項3】
前記第1処理は、複数種類の処理を含み、
前記第2処理は、複数種類の処理を含み、
前記制御手段は、前記第1処理に含まれる全ての処理と前記第2処理に含まれる全ての処理とのうちの一部の実行を禁止する
請求項1に記載の映像符号化装置。
【請求項4】
VVC(Versatile Video Coding)規格に基づく予測符号化処理を実行する映像符号化装置であって、
前記特定処理は、RPR(Reference Picture Resampling)を使用する符号化処理であり、
前記第1処理に含まれる処理は、TMVP(Temporal Motion Vector Prediction)を使用する処理およびSbTMVP(Subblock-based Temporal Motion Vector Prediction)を使用する処理であり、
前記第2処理に含まれる処理は、DMVR(Decoder side Motion Vector Refinement)を使用する処理、BDOF(Bi-directional Optical Flow)を使用する処理、およびPROF(Prediction Refinement with Optical Flow)を使用する処理である
請求項2または請求項3に記載の映像符号化装置。
【請求項5】
予測復号処理を行う映像復号装置であって、
予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いた補正を行うことになる第2処理、または、前記第1処理および前記第2処理の双方の実行が禁止されて生成された符号化データを対象とした復号を行う復号手段
を備える映像復号装置。
【請求項6】
処理対象フレームの解像度と異なる解像度の符号化済みのフレームを参照フレームとする特定処理を含む予測符号化処理を実行するための映像符号化方法であって、
前記予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いた補正を行うことになる第2処理、または、前記第1処理および前記第2処理の双方の実行を禁止する
映像符号化方法。
【請求項7】
予測復号処理を実行するための映像復号方法であって、
予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いた補正を行うことになる第2処理、または、前記第1処理および前記第2処理の双方の実行が禁止されて生成された符号化データを対象とした復号を行う
映像復号方法。
【請求項8】
請求項1から請求項3のいずれかに記載の映像符号化装置と、
請求項5に記載の映像復号装置と
を備える映像システム。
【請求項9】
コンピュータに、処理対象フレームの解像度と異なる解像度の符号化済みのフレームを参照フレームとする特定処理を含む予測符号化処理を実行させるための映像符号化プログラムであって、
前記コンピュータに、
前記予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いた補正を行うことになる第2処理、または、前記第1処理および前記第2処理の双方の実行を禁止させる
ための映像符号化プログラム。
【請求項10】
コンピュータに、予測復号処理を実行させるための映像復号プログラムであって、
前記コンピュータに、
予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いた補正を行うことになる第2処理、または、前記第1処理および前記第2処理の双方の実行が禁止されて生成された符号化データを対象とした復号を行わせる
ための映像復号プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、インター予測に基づく映像の符号化および復号を行うことが可能な映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法に関する。
【背景技術】
【0002】
映像符号化装置は、映像信号の各時刻の映像フレームを符号化して映像ビットストリームを生成する。例えば、映像符号化装置は、H.264/AVC(Advanced Video Coding)規格、H.265/HEVC(High Efficiency Video Coding)規格、または、H.266/VVC(Versatile Video Coding)規格(以下、VVC規格という。)等に基づいて符号化処理を実行する。
【0003】
処理対象フレームは、各ブロックに分割される。各ブロックに、符号化処理が適用される。イントラ予測による符号化方法とインター予測による符号化方法とが含まれる。イントラ予測は、処理対象フレーム内の領域を参照して実行される予測符号化方法である。インター予測は、符号化済みのフレームの領域を参照して処理対象フレームの符号化する予測符号化方法である。
【0004】
VVC規格では、様々な符号化ツール(以下、ツールという。)が用意されている。ツールは、符号化効率の改善などを目的とする符号化技術である(例えば、非特許文献1参照)。
【0005】
VVC規格におけるツールの一つに、RPR(Reference Picture Resampling)がある。RPRは、インター予測符号化方法で符号化する時、所定の条件を満たす場合に、処理対象フレームの解像度(サイズ)とは異なる解像度の符号化済みフレームの参照を許容する。具体的には、映像符号化装置は、処理対象フレームのサイズが参照する符号化済みフレームのサイズと異なる場合、符号化済みフレームをリサイズしたフレームを参照して符号化する。以下、映像符号化装置をエンコーダということがある。
【0006】
異なる解像度の符号化済みフレームを参照して処理対象フレームを符号化する場合、RPRを使用できないと、符号化処理において制約が生ずる。例えば、一連のフレームからなる映像中に参照フレームとなる他のフレームのサイズと異なるサイズのフレームが出現するときに、エンコーダは、一旦終端処理を行って、異なるサイズのフレームをI(Intra coded)フレームとして符号化する必要がある。RPRが使用できないと、インター予測による符号化方法を選択できず、エンコーダは、P(Predictive)フレームやB(Bi-directional predicted)フレームを使用できないからである。異なるサイズのフレームが頻繁に出現する場合、例えば、フレームのサイズ変更が頻繁に行われる場合には、エンコーダは、頻繁に終端処理を行う必要がある。これにより、符号化効率が低下する可能性がある。
【0007】
RPRが使用可能である場合には、上記のような制約にとらわれずに解像度切り替えを行うことができる。VVC規格では、RPRが適用される場合に使用が禁止されるツールがある。以下、使用が禁止されるツールを特定ツールということがある。
【先行技術文献】
【非特許文献】
【0008】
【非特許文献1】Recommendation ITU-T H.266 "Versatile video coding", Telecommunication Standardization Sector of ITU, 2020年8月
【非特許文献2】ARIB規格 STD-B32 3.3版「デジタル放送における映像符号化、音声符号化及び多重化方式」,電波産業会,2015年 7月3日
【発明の概要】
【発明が解決しようとする課題】
【0009】
以下、映像復号装置をデコーダということがある。エンコーダとデコーダが、共通の方式に準拠した装置であるとする時、エンコーダは、デコーダで正しく復号可能であるストリームを常に生成することを保証されている必要がある。デコーダが、エンコーダで特定の条件下において生成されたストリームのみ正しく復号できない場合、相互接続性が低下した状態となる。様々な条件下で相互接続性を低下させないために、エンコーダの開発では、デコーダで常に正しく復号できることを保証することを目的とした、網羅的な検証が必要とされる。
【0010】
エンコーダの処理について、ある符号化ツールを使用する場合に、所定のツールの使用を禁止するなど、他の符号化ツールへの制約を必要とする場合がある。この場合に、制約を適用することなく符号化処理を実行した時、デコーダ側で復号ができないストリームが生成されることとなる。すなわち、エンコーダとデコーダとの間の相互接続性が低下する。
【0011】
特に、他のツールを制約するツールの有効および無効が頻繁に切り替わる場合、相互接続性が低下した状態になりやすくなる。また、検証時に網羅する条件が増加することとなり、検証にかかる時間を増加させる。
【0012】
本発明は、検証にかかる時間を抑制しつつ、映像符号化装置と映像復号装置との間の相互接続性が低下しないようにすることを目的とする。
【課題を解決するための手段】
【0013】
本発明による映像符号化装置は、処理対象フレームの解像度と異なる解像度の符号化済みのフレームを参照フレームとする特定処理を含む予測符号化処理を実行可能な映像符号化装置であって、予測符号化処理を実行する符号化手段と、予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いて補正を行うことになる第2処理、または、第1処理および第2処理の双方の実行を処理対象フレームと符号化済みフレームの解像度に関わらず常に禁止する制御手段とを含む。
【0014】
本発明による映像復号装置は、予測復号処理を行う映像復号装置であって、予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いて補正を行うことになる第2処理、または、第1処理および第2処理の双方の実行が禁止されて生成された符号化データを対象とした復号を行う復号手段を含む。
【0015】
本発明による映像符号化方法は、処理対象フレームの解像度と異なる解像度の符号化済みのフレームを参照フレームとする特定処理を含む予測符号化処理を実行するための映像符号化方法であって、予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いて補正を行うことになる第2処理、または、第1処理および第2処理の双方の実行を処理対象フレームと符号化済みフレームの解像度に関わらず常に禁止する。
【0016】
本発明による映像復号方法は、予測復号処理を実行するための映像復号方法であって、予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いて補正を行うことになる第2処理、または、第1処理および第2処理の双方の実行が禁止されて生成された符号化データを対象とした復号を行う。
【0017】
本発明による映像システムは、上記の映像符号化装置と上記の映像復号装置とを含む。
【0018】
本発明による映像符号化プログラムは、コンピュータに、処理対象フレームの解像度と異なる解像度の符号化済みのフレームを参照フレームとする特定処理を含む予測符号化処理を実行させるための映像符号化プログラムであって、コンピュータに、予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いて補正を行うことになる第2処理、または、第1処理および第2処理の双方の実行を処理対象フレームと符号化済みフレームの解像度に関わらず常に禁止させる。
【0019】
本発明による映像復号プログラムは、コンピュータに、予測復号処理を実行させるための映像復号プログラムであって、コンピュータに、予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いて補正を行うことになる第2処理、または、第1処理および第2処理の双方の実行が禁止されて生成された符号化データを対象とした復号を行わせる。
【発明の効果】
【0020】
本発明によれば、検証にかかる時間を抑制しつつ、映像符号化装置と映像復号装置との間の相互接続性が低下しないようにすることができる。また、映像符号化装置および映像復号装置への、禁止の対象とするツールの処理に必要な処理部の実装の省略を可能とする効果もある。
【図面の簡単な説明】
【0021】
【
図2】映像符号化装置の構成例を示すブロック図である。
【
図3】符号化制御器の動作例を示すフローチャートである。
【
図4】映像符号化装置の処理の一例を示す説明図である。
【
図5】映像復号装置の構成例を示すブロック図である。
【
図6】映像復号器の動作例を示すフローチャートである。
【
図8】実施形態の効果を説明するための説明図である。
【
図9】実施形態の効果を説明するための説明図である。
【
図10】映像システムの構成例を示すブロック図である。
【
図11】情報処理システムの構成例を示すブロック図である。
【
図12】映像符号化装置の主要部を示すブロック図である。
【
図13】映像復号装置の主要部を示すブロック図である。
【発明を実施するための形態】
【0022】
以下、本発明の実施形態を図面を参照して説明する。
【0023】
[前提条件]
VVC規格において、RPRを使用するためには、"sps_ref_pic_resampling_enabled_flag"と"sps_res_change_in_clvs_allowed_flag"とが有効である値(=1)を持つ必要がある。これらの値が有効である時、各フレームに対するRPRの適用の有無は、処理対象フレームおよび符号化済みフレームの"Picture Parameter Set (PPS)"の情報に基づいて、自動的に決定され、"RprConstraintsActiveFlag"のパラメータに情報が保持される。例えば、処理対象フレームに対応するpps_pic_width_in_luma_samplesの値と処理対象フレームに対応するpps_pic_width_in_luma_samplesの値とが一致しない場合、"RprConstraintsActiveFlag"の値は、RPRが適用されることを示す値(=1)である。
【0024】
RPRが適用される場合には、特定ツールの使用が禁止される。具体的には、特定ツールは、TMVP(Temporal Motion Vector Prediction)、SbTMVP(Subblock-based Temporal Motion Vector Prediction)、DMVR(Decoder side Motion Vector Refinement)、BDOF(Bi-directional Optical Flow)、およびPROF(Prediction Refinement with Optical Flow)である。
【0025】
TMVPは、時間方向予測を用いて動きベクトルを導出するツールである。具体的には、異なる時間のフレームである参照フレームにおいて、符号化対象ブロック符号化対象ブロックの空間位置を基に決定される情報を用いて、動きベクトルが導出される。なお、符号化対象ブロックは、処理対象フレームにおけるブロックである。
【0026】
VVC規格では、TMVPの動きベクトルの導出のために、幅と高さがW、Hである符号化対象ブロックの左上の座標を(x,y)とするとき、異なる時間のフレームである参照フレームにおいて、(((x+W)>>3)<<3,(y+H)>>3)<<3)の位置、または(((x+W>>1)>>3)<<3,(y+H>>1)>>3)<<3)の位置に対応するブロックの情報が参照される。なお、フレームの左上を原点とし、水平および垂直方向の軸が右および下方向を正とする座標空間が想定される。“a>>n”、“a<<n”は、それぞれある値aに対する、右方向および左方向へのnビットを示す。
【0027】
SbTMVPは、サブブロック単位でのTMVPである。例えば、幅と高さがW、Hである符号化対象ブロックの左上の座標が(x,y)であり、そのブロックを幅と高さがそれぞれ8であるP×Q個のサブブロックに分割したとする。p番目およびq番目のサブブロックを想定する。なお、0≦p<P,0≦q<Qである。そのサブブロックは、参照フレームにおいて(((x+p×8+4+dx)>>3)<<3,((y+q×8+4+dy)>>3)<<3)の位置にあるブロックの参照を基本とし、動きベクトルを導出する。dxとdyは、符号化対象ブロックでTMVPにより導出された動きベクトルの、水平方向および垂直方向の変位量を示す。
【0028】
DMVRは、スキップモードおよびマージモードにおいて、デコーダ側で、動きベクトルを補正するツールである。具体的には、デコーダ側で、双方向予測で指定された2枚の符号化済みフレームの参照ブロックの一方を所定画素範囲でシフトさせて最もSAD(Sum of Absolute Difference)値が小さくなる位置を探索し、得られたシフト値を用いて動きベクトルを補正するツールである。言い換えると、DMVRは、復号時に計算される情報を用いた補正を行うツールである。
【0029】
BDOFは、デコーダ側で、双方向予測で生成された2枚の画像を用いて、画素毎の輝度値の時間変化と空間勾配値とからオプティカルフローを導出し、オプティカルフローを符号化対象ブロックにおける補正値に変換して予測画像を補正するツールである。したがって、復号時に計算される情報を用いた補正をするツールである。
【0030】
PROFは、サブブロックモードでアフィン予測が使用される場合に、アフィン動き補償で得られた予測値に補正量を導出し、加算することによって輝度信号の予測値を算出するツールである。よって、PROFは、復号時に計算される情報を用いた補正をするツールである。
【0031】
図1は、VVC規格における、RPR使用時の禁止ツールと、各ツールの有効/無効を制御するシンタクス(Syntax)を示す表である。"sps"で始まるシンタクスは、シーケンス単位で有効/無効を制御するシンタクスである。"ph"で始まるシンタクスは、ピクチャ単位で有効/無効を制御するシンタクスである。"*_control_present_in_ph_flag"は、ピクチャでのツールの制御を禁止するツールである。なお、"*"は、ワイルドカードを意味する。また、
図1における「リファインメント」は、補正することを意味する。これらのシンタクスを用いて、符号化時に禁止ツールの使用を無効にすることが可能である。
【0032】
[実施形態]
図2は、映像符号化装置の構成例を示すブロック図である。
図2に示す映像符号化装置1は、映像符号化器110、多重化器120、および符号化制御器130を備えている。映像符号化器110は、予測符号化器111、符号列生成器112、ローカル復号器113、ループフィルタ114、フレームバッファ115、および解像度変換器116を含む。なお、映像符号化装置1は、RPRを使用可能である。なお、
図2における矢印は、信号(データ)の流れの方向を端的に示すが、双方向性を排除するものではない。このことは、他のブロック図についても同様である。
【0033】
予測符号化器111は、入力映像を構成する各ピクチャに対して、イントラ予測またはインター予測を用いて予測符号化処理を行う。予測符号化器111は、予測符号化処理において、周波数変換した予測誤差画像(周波数変換係数)を量子化する。量子化された周波数変換係数を変換量子化値とする。ローカル復号器113は、変換量子化値へ逆量子化および逆変換を施すことで復元される予測誤差画像と、予測符号化器111で生成された予測画像とから再構築画像を生成する。ループフィルタ114は、再構築信号をフィルタリングしてフレームバッファ115に格納する。解像度変換器116は、インター予測時に、バッファリングされている再構築画像のサイズと入力画像のサイズが異なる場合に、再構築画像へリサイジング処理を施す機能を持つ。予測符号化器111は、符号列生成器112に変換量子化値を供給する。
【0034】
符号列生成器112は、予測パラメータおよび変換量子化値をエントロピー符号化する。予測パラメータは、予測モード(イントラ予測、インター予測)、イントラ予測ブロックサイズ、イントラ予測方向、インター予測ブロックサイズ、および動きベクトルなど、予測に関連した情報である。予測パラメータは、各種のシンタクス値を含む。符号列生成器112は、エントロピー符号化された変換量子化値と予測パラメータとを多重化器120に出力する。予測パラメータは、符号化制御器130から多重化器120に供給されてもよい。
【0035】
多重化器120は、符号化された変換量子化値と予測パラメータとを多重化して映像ビットストリームとして出力する。例えば、映像ビットストリームは、映像復号装置に伝送される。
【0036】
符号化制御器130は、予測パラメータの決定等の処理を行う。符号化制御器130は、予測パラメータを、予測符号化器111および符号列生成器112に出力する。
【0037】
次に、符号化制御器130の動作を説明する。
図3は、符号化制御器130の動作例を示すフローチャートである。
図3には、RPRに関する制御が示されている。
【0038】
映像符号化装置1は、RPRを使用可能な装置である。また、映像符号化装置1は、TMVP、SbTMVP、DMVR、BDOFおよびPROFを実行するための仕組みを持たなくてよい。そのような仕組みは、例えば、ソフトウェアで実現可能である。映像符号化装置1がそのように構成されている場合には、実装すべき特定ツールが減るので、映像符号化装置1の規模(例えば、プログラムサイズ)を減らすことができる。
【0039】
符号化制御器130は、RPRの適用有無に関わらず、特定ツール(使用禁止ツール)の使用を禁止するための制御を行う(ステップS101)。具体的には、符号化制御器130は、以下のシンタクス要素の値を設定する処理を行う。
【0040】
TMVPの使用を禁止するために、sps_temporal_mvp_enabled_flag=0、かつ、ph_temporal_mvp_enabled_flag=0となるように設定する。
【0041】
SbTMVPの使用を禁止するために、sps_sbtmvp_enabled_flag=0となるように設定する。
【0042】
DMVRの使用を禁止するために、sps_dmvr_enabled_flag=0、かつ、sps_dmvr_control_present_in_ph_flag=0となるように設定する。
【0043】
BDOFの使用を禁止するために、sps_bdof_enabled_flag=0、かつ、sps_bdof_control_present_in_ph_flag=0となるように設定する。
【0044】
PROFの使用を禁止するために、sps_affine_prof_enabled_flag=0、かつ、sps_prof_control_present_in_ph_flag=0となるように設定する。
【0045】
なお、ステップS101の処理で、符号化制御器130は、例えば、使用可能なルールが設定されているツールパターンのテーブルから特定ツールを除外する。符号化制御器130は、特定ルールも設定されているツールパターンを使用する状態から、特定ルールが設定されていないツールパターンを使用する状態に切り替わってもよい。
【0046】
符号化制御器130は、設定したシンタクス要素の値を、予測符号化器111および符号列生成器112に出力する(ステップS102)。
【0047】
以後、予測符号化器111は、予測符号化処理において、使用禁止された特定ツールを使用することなく処理対象フレームの符号化処理を行う。
【0048】
図4は、映像符号化装置の処理の一例を示す説明図である。
図4に示す例では、ピクチャ順序カウント(POC:Picture Order Count)がnのフレームが処理対象フレームである。POCが(n-1)のフレームは、高解像度映像のフレームである。POCがnのフレームは、低解像度映像のフレームである。本実施形態では、RPRの適用に関わらず、特定ツール(使用禁止ツール)を使用せずに符号化される。
【0049】
図4に示す例は、例えば、POCがnおよび(n+1)のフレームが、符号化難易度の高いフレーム、すなわち発生符号量があらかじめ決められている所定値よりも多くなるフレームとなる場合に、解像度を落としてから符号化することによる符号量抑制を目的として使用される。
【0050】
本実施形態では、RPRを使用可能な映像符号化装置1が、RPR適用時に特定ツールを使用した処理を常に行わないので、映像符号化装置1と、映像符号化装置1が伝送した映像ビットストリームを受信する映像復号装置との間の相互接続性が低下することはない。すなわち、映像システムにおいて、RPRを使用可能な一般的な映像復号装置が用いられても、映像復号装置が、RPR適用時における特定ツールの使用によって、受信した映像ビットストリームの復号ができなくなるということはない。
【0051】
[変形例1]
上記の実施形態では、符号化制御器130は、RPRが適用される場合に、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理(例えば、TMVPまたはSbTMVPを用いた処理)、および、復号時に計算される情報を用いて補正を行うことになる第2処理(例えば、DMVR、BDOF、またはPROFを用いた処理)の全ての実行を禁止するような制御を行う。
【0052】
しかし、符号化制御器130は、第1処理と第2処理のうちの一部の実行を禁止するような制御を行うこともできる。例えば、映像符号化装置1が、TMVP、SbTMVP、DMVR、BDOFおよびPROFのうちの一部(一部の特定ツール)のみが実行可能であるように構成されてもよい。換言すれば、符号化制御器130は、RPRが無効であると判定したときに、使用可能であるとされるツールを除くツールの使用を禁止する制御を行う。RPRが有効である場合には、第1処理と第2処理の実行を禁止する。
【0053】
映像符号化装置1がそのように構成されている場合には、実装すべき特定ツールが上記の実施形態と比較すると増えるものの、本発明を適用しない場合よりも削減することが可能となるので、映像符号化装置1の規模(例えば、プログラムサイズ)を減らすことができる。
【0054】
なお、変形例1において、RPR適用時に特定ツールを使用した処理が実行されないことを保証するために、符号化制御器130は、処理対象フレームの解像度が変更されるときに、使用可能であるとされている特定ツールの使用を禁止する制御を行う。
【0055】
上記の実施形態では、定常的に全ての特定ツールの使用が禁止される。その結果、フレームのサイズが切り替えられる度に特定ツールの使用を禁止するための制御を行う必要はない。その反面、符号化効率が低下する。しかし、変形例1では、特定ツールの使用が禁止されるとき以外の状況では、特定ツールの一部の使用が可能であるので、符号化効率の低下が抑制される。
【0056】
[変形例2]
RPRが適用される場合に、符号化制御器130は、TMVP、SbTMVP、DMVR、BDOFおよびPROFに関する"sps_*_enabled_flag"のシンタックス値を1とし、"ph_*_enabled_flag"のシンタックス値を0にしてもよい。すなわち、特定のツールの使用をシーケンス単位で禁止するのではなく、ピクチャ単位での使用を禁止することにより、実施形態と同等の処理を実現する。
【0057】
変形例2でも、RPRが適用される場合に、特定ツールの一部の使用が可能であるといえる。
【0058】
なお、変形例2において、RPR適用時に特定ツールを使用した処理が実行されないことを保証するために、符号化制御器130は、処理対象フレームの解像度が変更されるときに、使用可能であるとされている特定ツールの使用を禁止する制御を行う。
【0059】
図5は、映像復号装置の構成例を示すブロック図である。
図5に示す映像復号装置2は、多重化解除器220および映像復号器210を備えている。映像復号器210は、エントロピー復号器212と予測復号器211とを含む。
【0060】
多重化解除器220は、映像符号化装置から伝送される映像ビットストリームを多重化解除して、エントロピー符号化された映像ビットストリームを抽出する。映像ビットストリームには、符号化データすなわち符号化された変換量子化値と予測パラメータとが含まれる。
【0061】
エントロピー復号器212は、映像ビットストリームをエントロピー復号する。予測復号器211は、再構築画像を生成する。予測復号器211は、再構築画像を復号映像として出力する。
【0062】
次に、映像復号器210の動作を説明する。
図6は、映像復号器210の動作例を示すフローチャートである。
【0063】
エントロピー復号器212は、エントロピー符号化された映像ビットストリームをエントロピー復号する(ステップS201)。エントロピー復号された映像ビットストリームは、予測復号器211に入力される。
【0064】
予測復号器211は、エントロピー復号された映像ビットストリームに対して復号処理を行う(ステップS202)。ステップS202において、予測復号器211は、映像ビットストリームに対して予測復号処理を行って予測信号を生成する。予測復号器211は、予測信号を使用して再構築画像を生成する。
【0065】
上述したように、RPRを使用可能な映像符号化装置1において、RPR適用時に特定ツールを使用した処理が実行されないことが保証されている。したがって、映像復号装置2は、RPR適用時における特定ツールの使用によって、映像符号化装置1から受信した映像ビットストリームの復号ができなくなるということはない。なお、映像符号化装置1から受信される映像ビットストリームには、予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に予測画像への補正を行うことになる第2処理、または、第1処理および第2処理の双方の実行が禁止されて生成された符号化データが含まれている。
【0066】
次に、上記の効果以外の効果について説明する。
【0067】
図7には、非特許文献2において導入されているピクチャ構造であるSOP(Structure of Pictures)の一例が示されている。SOPは、時間方向階層符号化(時間スケーラブル符号化)が行われる場合には、各AU(Access Unit)の符号化順および参照関係が記述される単位になる。時間スケーラブル符号化は、複数フレームの映像の中から、部分的にフレームを取り出せるようにする符号化である。なお、1つのGOP(Group of Pictures)は、1つ以上のSOPで構成される。また、
図7において、横軸は表示順を示し、縦軸は階層を示す。階層として、階層0、階層1、階層2および階層3がある。
【0068】
図8は、
図7に示されたピクチャ構造を使用して片方向のインター予測が実行される場合の異なるサイズのフレームが参照される回数を示す説明図である。
図9は、
図7に示されたピクチャ構造を使用して双方向のインター予測が実行される場合の異なるサイズの画像が参照される回数を示す説明図である。なお、フレームのサイズは、スライスタイプごとに決定されるとする。
【0069】
図8および
図9において、S
0~S
4は、それぞれ画像サイズ(フレームサイズ)を示す。すなわち、サイズの集合S∈{S
0,S
1,S
2,S
3,S
4}であり、また、S
0≠S
1≠S
2≠S
3≠S
4である。
【0070】
また、
図8および
図9において、SIZEx(x=I、P、B1、B2、B3)のxにおける「I」は、Iフレームに対応する。「P」は、Pフレームに対応する。「B1」は、階層1のBフレームに対応する。「B2」は、階層2のBフレームに対応する。「B3」は、階層3のBフレームに対応する。
【0071】
図8における最右欄および
図9における最右欄に、異なるサイズの画像を参照する回数が示されている。
図8に示すように、片方向のインター予測が実行される場合には、参照する合計回数は347である。したがって、[347×探索されるCU(Coding Unit:符号化単位)]回の予測処理が発生する。
図9に示すように、双方向のインター予測が実行される場合には、参照する合計回数は230である。したがって、[合計230×探索されるCU]回の予測処理が発生する。
【0072】
RPRを使用可能であって上記の実施形態が適用されていない映像符号化装置に対して、RPRに関する制約(TMVP、SbTMVP、DMVR、BDOFおよびPROFの使用不可)が守られているか否か検証する必要がある。また、映像復号装置も検証される必要がある。
【0073】
しかし、上記の実施形態の映像符号化装置では、RPR適用時に特定ツールを使用した処理が実行されないことが保証されるので、RPRに関する制約が守られているか否か検証されなくてもよい。すなわち、上記の実施形態の映像符号化装置では、装置の検証に要する時間が短縮される。
【0074】
図10は、映像システムの構成例を示すブロック図である。
図10に示す映像システムは、映像符号化装置10(第1の実施形態の映像符号化装置1に相当)と、映像復号装置20(第1の実施形態の映像復号装置2に相当)とが、伝送路(無線伝送路または有線伝送路)30で接続されるシステムである。
【0075】
映像処理システムにおいて、映像符号化装置10は、上記の実施形態で説明された特徴を持つ映像ビットストリームを生成できる。また、映像処理システムにおいて、映像復号装置20は、上記の各実施形態で説明された特徴を持つ映像ビットストリームを復号できる。
【0076】
また、上記の実施形態を、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。
【0077】
図11に示す情報処理システムは、CPU(Central Processing Unit)等のプロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体1003およびビットストリームを格納するための記憶媒体1004を備える。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。
【0078】
情報処理システムにおいて、プログラムメモリ1002には、上記の実施形態で示された各ブロックの機能を実現するためのプログラム(映像符号化プログラムまたは映像復号プログラム)が格納される。
【0079】
そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、上記の実施形態で示された映像符号化器110、多重化器120、符号化制御器130、映像復号器210、および多重化解除器220の機能を実現する。
【0080】
例えば、プロセッサ1001が、
図2に示された映像符号化装置1における各ブロックの機能を実現するための映像符号化プログラムに従って処理を実行することによって、映像符号化装置1の機能が実現される。また、例えば、プロセッサ1001が、
図5に示された映像復号装置2における各ブロックの機能を実現するための映像復号プログラムに従って処理を実行することによって、映像復号装置2の機能が実現される。
【0081】
なお、少なくともプログラムメモリ1002は、非一時的なコンピュータ可読媒体(non-transitory computer readable medium)である。ただし、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)に格納されてもよい。一時的なコンピュータ可読媒体には、例えば、有線通信路または無線通信路を介して、すなわち、電気信号、光信号または電磁波を介して、プログラムが供給される。
【0082】
図12は、映像符号化装置の主要部を示すブロック図である。映像符号化装置10は、処理対象フレームの解像度と異なる解像度の符号化済みのフレームを参照フレームとする特定処理(例えば、RPRに基づく処理)を含む予測符号化処理を実行可能な映像符号化装置であって、予測符号化処理を実行する符号化部(符号化手段)11(実施形態では、予測符号化器111で実現される。)と、予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理(例えば、TMVPを使用する処理、SbTMVPを使用する処理)もしくは復号時に計算される情報を用いて補正を行うことになる第2処理(例えば、DMVRを使用する処理、BDOFを使用する処理、PROFを使用する処理)、または、第1処理および第2処理の双方の実行を禁止する制御部(制御手段)12(実施形態では、符号化制御器130で実現される。)とを備えている。
【0083】
図13は、映像復号装置の主要部を示すブロック図である。映像復号装置20は、予測復号処理を行う映像復号装置であって、予測符号化処理において、符号化対象ブロックの空間位置を基に決定される、異なる時間のフレームにおけるブロックの情報を用いる第1処理もしくは復号時に計算される情報を用いて補正を行うことになる第2処理、または、第1処理および第2処理の双方の実行が禁止されて生成された符号化データを対象とした復号を行う復号部(復号手段)21(実施形態では、予測復号器211で実現される。)を備えている。
【符号の説明】
【0084】
1,10 映像符号化装置
11 符号化部
12 制御部
2,20 映像復号装置
21 復号部
110 映像符号化器
111 予測符号化器
112 符号列生成器
113 ローカル復号器
114 ループフィルタ
115 フレームバッファ
116 解像度変換器
120 多重化器
130 符号化制御器
210 映像復号器
211 予測復号器
212 エントロピー復号器
220 多重化解除器
1001 プロセッサ
1002 プログラムメモリ
1003,1004 記憶媒体