IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

<>
  • 特開-映像符号化装置及びプログラム 図1
  • 特開-映像符号化装置及びプログラム 図2
  • 特開-映像符号化装置及びプログラム 図3
  • 特開-映像符号化装置及びプログラム 図4
  • 特開-映像符号化装置及びプログラム 図5
  • 特開-映像符号化装置及びプログラム 図6
  • 特開-映像符号化装置及びプログラム 図7
  • 特開-映像符号化装置及びプログラム 図8
  • 特開-映像符号化装置及びプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024000443
(43)【公開日】2024-01-05
(54)【発明の名称】映像符号化装置及びプログラム
(51)【国際特許分類】
   H04N 19/126 20140101AFI20231225BHJP
   H04N 19/147 20140101ALI20231225BHJP
   H04N 19/176 20140101ALI20231225BHJP
【FI】
H04N19/126
H04N19/147
H04N19/176
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2022099213
(22)【出願日】2022-06-20
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100161148
【弁理士】
【氏名又は名称】福尾 誠
(72)【発明者】
【氏名】森田 泰子
(72)【発明者】
【氏名】日下部 裕一
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159KK02
5C159LA00
5C159TA53
5C159TB08
5C159TC08
5C159TD16
5C159UA02
(57)【要約】
【課題】HDR/広色域映像のような鮮やかな色彩を含む映像を圧縮する際の主観品質を向上させる。
【解決手段】映像符号化装置1は、原画像を劣化させた劣化画像を生成する劣化画像生成部50と、劣化画像のブロックごとの劣化度の第1推定値、及び劣化画像のブロックごとの符号量の第2推定値を求め、第1推定値の第1順位と第2推定値の第2順位の差に応じて、符号化対象部分に対する符号量を調整する符号量調整部60と、を備え、符号量調整部60は、輝度信号及び色信号から指標値を算出する第1画質指標を用いて、原画像及び劣化画像を比較して、第1推定値を求める。
【選択図】図1
【特許請求の範囲】
【請求項1】
入力映像の原画像を符号化する映像符号化装置であって、
前記原画像を劣化させた劣化画像を生成する劣化画像生成部と、
前記劣化画像のブロックごとの劣化度の第1推定値、及び前記劣化画像のブロックごとの符号量の第2推定値を求め、前記第1推定値を大きさ順に並べ替えた第1順位と、前記第2推定値を大きさ順に並べ替えた第2順位の差に応じて、符号化対象部分に対する符号量を調整する符号量調整部と、を備え、
前記符号量調整部は、輝度信号及び色信号から指標値を算出する第1画質指標を用いて、前記原画像及び前記劣化画像を比較して、前記第1推定値を求める、映像符号化装置。
【請求項2】
前記符号量調整部は、輝度信号から指標値を算出する第2画質指標を用いて、前記原画像及び前記劣化画像から前記第2推定値を求める、請求項1に記載の映像符号化装置。
【請求項3】
前記符号量調整部は、前記第1推定値を大きい順に並べ替えた前記第1順位が、前記第2推定値を大きい順に並べ替えた前記第2順位よりも大きいほど、前記符号化対象に対する符号量を小さくするように調整する、請求項1又は2に記載の映像符号化装置。
【請求項4】
コンピュータを、請求項1又は2に記載の映像符号化装置として機能させるためのプログラム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像符号化装置及びプログラムに関するものである。
【背景技術】
【0002】
現在、普及が広まっている映像符号化方式VVC(Versatile Video Coding)、HEVC(High Efficiency Video Coding)は、従来方式に比べて多様な符号化ツールを有しており、映像を効率良く圧縮することができる。その一方で、当該方式を用いて効率的に符号化するには、膨大な数のツールから適切な1つを逐次選定することが課題となる。非特許文献1の8.2章に記載されているように、HEVCの参照ソフトウェアHM(HEVC test Model)では、ラグランジュコスト関数に基づくRD(レート-歪)最適化によって適切な符号化モードを選択しており、VVCの参照ソフトウェアVTM(VVC Test Model)でも同じアルゴリズムが採用されている。このコスト関数では、符号化した際のレートR(Rate)と符号化歪D(Distortion)の関係を式(1)のように定義しており、コストJを最小化するモードを選択する。
【0003】
J=D+λR (1)
【0004】
ただし、式(1)においてλはラグランジュ乗数を示し、一般にビットレートが低いほど大きい値に設定される。HM,VTMともに、レート制御をする際には、このラグランジュ乗数λをもとに量子化パラメータQPを決定する。式(1)における符号化歪Dとしては、画質指標PSNR(Peak Signal-to-Noise Ratio)との相関が高いことから、原画像と符号化画像(原画像を符号化した後に復号した画像)との二乗誤差和SSE(Sum of Squared Error)が主に用いられている。
【0005】
しかし、PSNRは計算の簡易さもあって従来から広く利用されているものの、平均二乗誤差に基づく評価値が視覚的な劣化度と乖離があることが課題となっている。これを解決するために、非特許文献2には、視覚的な劣化度との相関が高い画質指標VMAF(Video Multimethod Assessment Fusion)のスコアを式(1)のコスト関数に反映させて、符号化映像の主観品質を向上させる技術が記載されている。
【0006】
図9を用いて、非特許文献2に開示された技術の概略について説明する。まず、原画像hをQP=QPで先行符号化した符号化画像f、及び原画像hをQP=QP’(非特許文献2の実験ではQP’=QP+5に設定)で先行符号化した符号化画像f’から、合成画像gを生成する。ここで、合成画像gは、符号化画像fのi番目のCTU(Coding Tree Unit)を符号化画像f’のi番目のCTUに置き換えたものである。これらの画像を使ってi番目のCTUに対するスケーリング係数sを式(2)で求め、式(3)に示すようにコスト関数におけるラグランジュ乗数λに適用して符号化する。式(2)においてVMAF(x,y)はxを参照画像、yを評価画像としたときのVMAFスコアを示す。
【0007】
【数1】
【0008】
近年、従来よりも幅広い範囲の明るさを表現可能なHDR(High Dynamic Range:高ダイナミックレンジ)映像、及び従来よりも鮮やかな色を再現可能な広色域映像の普及が進んでいる。2018年に開始した新4K8K衛星放送では、この両者の性質を持つHDR/広色域映像が採用されており、映像フォーマットはITU-R勧告BT.2100に規定されている。HDR/広色域映像は、従来のSDR(Standard Dynamic Range)/標準色域映像に比べて異なる性質を持つため、例えば、非特許文献3に記載されている専用の画質指標の開発が進められている。
【先行技術文献】
【非特許文献】
【0009】
【非特許文献1】大久保榮、「H.265/HEVC教科書」、初版、インプレスジャパン、2013年10月21日発行
【非特許文献2】H. Zhang, J. Xu and L. Song, "Video Multimethod Assessment Fusion Based Rate-Distortion Optimization for Versatile Video Coding," 2021 IEEE International Conference on Image Processing (ICIP), 2021, pp. 2064-2068.
【非特許文献3】M. Rousselot, X. Ducloux, O. Le Meur and R. Cozot, “Quality Metric Aggregation for HDR/WCG Images,” 2019 IEEE International Conference on Image Processing (ICIP), 2019, pp. 3786-3790.
【発明の概要】
【発明が解決しようとする課題】
【0010】
非特許文献2に記載の技術は、画質指標として輝度信号のみを計算に利用するVMAFを採用しており、色信号の劣化を考慮していないため、鮮やかな色彩を含むHDR/広色域映像に適していないという問題点がある。さらに、符号化画像からコスト関数の歪Dのみを推定しており、レートRを考慮していないという問題点がある。
【0011】
かかる事情に鑑みてなされた本発明の目的は、HDR/広色域映像のような鮮やかな色彩を含む映像を符号化する際の主観品質を向上させることが可能な映像符号化装置及びプログラムを提供することにある。
【課題を解決するための手段】
【0012】
上記課題を解決するため、一実施形態に係る映像符号化装置は、入力映像の原画像を符号化する映像符号化装置であって、前記原画像を劣化させた劣化画像を生成する劣化画像生成部と、前記劣化画像のブロックごとの劣化度の第1推定値、及び前記劣化画像のブロックごとの符号量の第2推定値を求め、前記第1推定値を大きさ順に並べ替えた第1順位と、前記第2推定値を大きさ順に並べ替えた第2順位の差に応じて、符号化対象部分に対する符号量を調整する符号量調整部と、を備え、前記符号量調整部は、輝度信号及び色信号から指標値を算出する第1画質指標を用いて、前記原画像及び前記劣化画像を比較して、前記第1推定値を求める。
【0013】
さらに、一実施形態において、前記符号量推定部は、輝度信号から指標値を算出する第2画質指標を用いて、前記原画像及び前記劣化画像から前記第2推定値を求めてもよい。
【0014】
さらに、一実施形態において、前記符号量調整部は、前記第1推定値を大きい順に並べ替えた前記第1順位が、前記第2推定値を大きい順に並べ替えた前記第2順位よりも大きいほど、前記符号化対象に対する符号量を小さくするように調整してもよい。
【0015】
また、一実施形態係るプログラムは、コンピュータを、上記映像符号化装置として機能させる。
【発明の効果】
【0016】
本発明によれば、HDR/広色域映像のような鮮やかな色彩を含む映像を符号化する際の主観品質を向上させることが可能となる。
【図面の簡単な説明】
【0017】
図1】一実施形態に係る映像符号化装置の構成例を示すブロック図である。
図2】一実施形態に係る映像符号化装置における劣化度推定部及び符号量推定部の処理を説明する図である。
図3】HDR/広色域原画像を符号化した符号化画像のCTUごとの値の大小関係を示す図である。
図4図3を求める際に使用した画像から求めた、第1推定値の大小関係を示す図である。
図5図3を求める際に使用した画像から求めた、第2推定値の大小関係を示す図である。
図6】一実施形態に係る映像符号化装置における符号量調整方法の一例を示すフローチャートである。
図7】一実施形態に係る映像符号化装置におけるスケーリング係数決定部の処理を説明する図である。
図8】一実施形態に係る映像符号化装置における符号化部の構成例を示すブロック図である。
図9】従来の画質指標VMAFのスコアをコスト関数に反映させる技術を説明する図である。
【発明を実施するための形態】
【0018】
以下、本発明の一実施形態について、図面を参照して詳細に説明する。
【0019】
図1は、一実施形態に係る映像符号化装置の構成例を示すブロック図である。図1に示す映像符号化装置1は、符号化部10と、符号化モード候補導出部30と、コスト最適化部40と、劣化画像生成部50と、符号量調整部60と、符号化結果格納部70と、を備える。
【0020】
映像符号化装置1は、入力映像を符号化し、符号化結果であるビットストリームを外部に出力する。HEVC,VVCなどの映像符号化方式では、入力映像をCTU(Coding Tree Unit)と呼ばれる最大ブロック単位に分割してCTUごとに符号化処理を行い、CTU内のCU(Coding Unit)分割形状や、CUごとの予測モード、変換モードなどを順次決定する。
【0021】
符号化モード候補導出部30は、ビットレート、GOP(Group Of Picture)構造といった入力パラメータと、これまでに選択した符号化モードとに応じて、処理対象のCTU及びその内部のCUに対する1以上の符号化モード候補を決定する。符号化モードは、符号化ツール及びパラメータ(イントラ予測のDC予測モードなど)の組み合わせである。符号化モード候補導出部30は、任意の既知の手法を適用することができ、例えばVVCの参照ソフトウェアVTMの内部処理と同様に、多数の符号化モードから候補となる少数のモードを決定(枝刈り)する。そして、符号化モード候補導出部30は、決定した符号化モード候補を符号化部10に出力する。
【0022】
符号化部10は、入力映像に対して、入力パラメータと、符号化モード候補導出部30により決定された符号化モード候補を適用して、符号化処理を行う。そして、符号化部10は、符号化結果をコスト最適化部40及び符号化結果格納部70に出力するとともに、局部復号画像をコスト最適化部40に出力する。符号化部10の詳細については後述する。
【0023】
コスト最適化部40は、複数の符号化モードのうち、符号化部10の符号化コストを最適化する符号化モード(以下、「最適符号化モード」という。)を決定する。そして、コスト最適化部40は、最適符号化モードを符号化モード候補導出部30及び符号化結果格納部70に出力する。図1に示すように、コスト最適化部40は、符号化歪算出部41と、符号量算出部42と、符号化モード決定部43と、を備える。
【0024】
符号化歪算出部41は、入力映像と、符号化部10から入力した局部復号画像とを比較して、符号化歪Dを算出する。そして、符号化歪算出部41は、符号化歪Dを符号化モード決定部43に出力する。符号化歪Dを表す評価値は、本実施形態では二乗誤差和SSEとするが、これに限られるものではなく、絶対値誤差和SAD(Sum of Absolute Difference)、アダマール変換絶対値誤差和SATD(Sum of Absolute Transformed Difference)などでもよい。
【0025】
符号量算出部42は、符号化部10から入力した符号化結果の符号量Rを算出する。そして、符号量算出部42は、符号量Rを符号化モード決定部43に出力する。
【0026】
本実施形態では、コスト関数を式(4)で定義し、ラグランジュ乗数λに対するスケーリング係数aを調整することで、主観品質を向上させた効率の良いHDR/広色域映像符号化を行う。なお、本実施形態では、スケーリング係数aをCTU(128×128画素に設定されることが多い)ごとに設定するが、64×64画素、32×32画素など任意のサイズのブロックごとに設定するようにしてもよい。
【0027】
J=D+aλR (4)
【0028】
符号化モード決定部43は、符号量調整部60から入力したスケーリング係数aを用いて式(4)に示すコストJを計算し、コストJが最小となる最適符号化モードを決定する。そして、符号化モード決定部43は、決定した最適符号化モードを符号化モード候補導出部30及び符号化結果格納部70に出力する。
【0029】
符号化結果格納部70は、符号化モード決定部43により決定された最適符号化モードを用いて符号化部10により符号化された符号化結果を、映像符号化装置1の外部に出力する。該符号化結果は、図示しない復号装置により復号される。
【0030】
劣化画像生成部50は、入力映像に対してフィルタ処理又は符号化処理を施して、入力映像の1フレームごとに原画像hから劣化画像fを生成する。フィルタ処理には、ガウシアンフィルタなどの平滑化フィルタを用いてよい。符号化処理には、VVC,HEVCなどの符号化方式を用いてよい。そして、劣化画像生成部50は、生成した劣化画像fを符号量調整部60に出力する。
【0031】
符号量調整部60は、劣化画像fのブロックごとの劣化度の推定値(第1推定値)、及び劣化画像fのブロックごとの符号量の推定値(第2推定値)を求め、第1推定値を大きさ順に並べ替えた順位(第1順位)と第2推定値を大きさ順に並べ替えた順位(第2順位)の差に応じて、入力映像の符号化対象部分(原画像)に対する符号量を調整する。図1に示すように、符号量調整部60は、劣化度推定部61と、符号量推定部62と、スケーリング係数決定部63と、を備える。
【0032】
劣化度推定部61は、輝度信号及び色信号から指標値を算出するHDR/広色域映像用画質指標(第1画質指標Vc)を用いて、原画像h及び劣化画像fを比較して、劣化画像fのブロックごとの劣化度の推定値を求める。第1画質指標Vcは、輝度信号及び色信号を考慮して画質を評価する指標であればよく、例えば所定の関数であってもよいし、機械学習済みのモデルであってもよいし、非特許文献3に記載の指標であってもよい。第1画質指標Vcに画像を入力すると、劣化度の推定値が出力される。
【0033】
符号量推定部62は、劣化画像fのブロックごとの符号量の推定値を求める。劣化画像生成部50にて劣化画像fを符号化処理により生成した場合には、「符号量の推定値」とは、実際の符号量であってもよい。本実施形態では、輝度信号のみから指標値を算出する画質指標(第2画質指標V)を用いて、原画像h及び劣化画像fを比較して、劣化画像fのブロックごとの符号量の推定値を求める。第2画質指標Vは、輝度信号のみを考慮した画質指標であり、輝度信号のみからなる画像を用いて第1画質指標Vcと同様に求めた値としてもよい。例えば、第1画質指標Vcの入力映像の形式がBT.2100のRGBコンポーネントである場合、画像f,g,hのRGBをR=G=B=0.2627×R+0.6780×G+0.0593×Bと変換して入力することで、第2画質指標Vを算出することができる。
【0034】
図2は、劣化度推定部61及び符号量推定部62の処理を説明する図である。劣化度推定部61及び符号量推定部62は、図2に示すように、原画像hを量子化パラメータQP=QPとして先行符号化した符号化画像f、及び原画像hから、合成画像gを生成する。ここで、合成画像gは、符号化画像fのi番目のCTUを原画像hのi番目のCTUに置き換えたものである。
【0035】
劣化度推定部61は、符号化画像f、原画像h、及び合成画像gを使って、次式(5)に示すように、第1画質指標Vcの各ブロックの変化量を第1推定値ΔVcとして算出する。第1画質指標Vcは輝度信号及び色信号を考慮して画質を評価するため、主観画質に近くなる。そのため、第1推定値ΔVcは、i番目のCTUにおける歪(コスト関数のDに相当)の推定量を示す。
【0036】
ΔVc=Vc(h,g)-Vc(h,f) (5)
【0037】
符号量推定部62は、符号化画像f、原画像h、及び合成画像gを使って、次式(6)に示すように、第2画質指標Vの各ブロックの変化量を第2推定値ΔVとして算出する。第2推定値ΔVは、i番目のCTUにおける符号量(コスト関数のRに相当)の推定量を示す。
【0038】
ΔV=V(h,g)-V(h,f) (6)
【0039】
図3に、一例として、VTMを用いてHDR/広色域原画像Hを量子化パラメータQP=37で符号化した符号化画像FのCTUごとの符号量の大小関係を示す。VTMでは輝度信号を重視したRD最適化が行われる。画像のサイズは1920×1080画像であり、CTUのサイズは128×128画素である。図4に、上記原画像H及び符号化画像Fから算出した第1推定値ΔVcの大小関係を示す。図5に、上記原画像H及び符号化画像Fからから算出した第2推定値ΔVの大小関係を示す。図3,4,5において、値の大きいブロックを太い枠で示し、値の小さいブロックを細い枠で示す。さらに、太い枠で示すブロックにおいては斜線の本数が多いほど値が大きいことを示し、細い枠で示すブロックにおいてはドットの数が多いほど値が大きいことを示す。図3,4,5により、第1推定値ΔVcと符号量の大小は相関が高くないが、第2推定値ΔVと符号量の大小は相関が高いことが分かる。この傾向は、図3で使用された画像に限られるものではなく、複数の画像により確かめられた。
【0040】
スケーリング係数決定部63は、第1推定値ΔVcを大きさ順に並べ替えた順位(第1順位)と第2推定値ΔVを大きさ順に並べ替えた順位(第2順位)を求めて比較する。スケーリング係数決定部63は、符号化対象部分のブロックにおいて、第1順位と第2順位の差に応じて、該符号化対象に対する符号量が大きく又は小さくなるように調整する。
【0041】
一般に、主観的な劣化が大きい部分の符号量を大きくし、逆に主観的な劣化が小さい部分の符号量を小さくすることで、主観品質が高くかつ効率が良い符号化を行うことができる。このことから、スケーリング係数決定部63は、画面内の合計N個のブロックについて、ブロックごとの第1推定値ΔVc及び第2推定値ΔVを、降順又は昇順に並び替え、順位の差が大きいブロックに対しては、式(4)に示すスケーリング係数aを変更する。なお、図3,4,5に示す例では、ブロック数N=15×9=135であり、図4,5について1~135の順位を求める。
【0042】
(符号量調整方法)
次に、スケーリング係数決定部63の処理を、図6及び図7を参照して説明する。図6は、スケーリング係数決定部63による符号量調整方法の一例を示すフローチャートである。図7は、ブロック数N=12である場合のスケーリング係数決定部63の処理を説明する図である。
【0043】
ステップS101では、ブロックごとに、第1推定値ΔVc及び第2推定値ΔVを計算する。
【0044】
ステップS102では、第1推定値ΔVcを降順(歪が大きい順)に並べた際の第1順位O1と、第2推定値ΔVを降順(符号量が大きい順)に並べた際の第2順位O2を求める。図7(a)はO1を示し、図7(b)はO2を示し、図7(c)はO1-O2を示す。
【0045】
映像符号化においては、主観的な歪が大きい部分ほど符号量が割当てられるようになっていることが望ましいため、O1-O2=0となることが理想である。そこで、スケーリング係数決定部63は、順位の差が大きい場合には、理想的な状態により近くなるように、式(4)に示すスケーリング係数aを変更する。本実施形態では、順位の差が大きいとは、合計N個のブロックがある場合に、式(7)に示す閾値T以上の差があることと定義する。式(7)の右辺は天井関数であり、N/2以上の最小の整数を意味する。例えばN=12の場合にはT=6となる。なお、本実施形態では順位の差の閾値は1つであるが、順位の差の閾値を複数設けて段階的にスケーリング係数aの値を大きく又は小さくするようにしてもよい。
【0046】
【数2】
【0047】
ステップS103では、次式(8)を満たすか否かを判定する。ステップS103がYesである場合には処理をステップS104に進め、ステップS103がNoである場合には処理をステップS105に進める。図7に示す例では、ブロックαが式(8)を満たす。
【0048】
【数3】
【0049】
式(8)を満たす場合は、第1順位O1が大きく(第1推定値ΔVcが小さく)、第2順位O2が小さい(第2推定値ΔVが大きい)ので、主観的な歪が小さい部分に符号量が大きく割当てられていることを意味する。そこでこれを是正するために、ステップS104では、当該CTUのスケーリング係数aを1よりも大きい値(例えば、1.2)に決定する。
【0050】
ステップS105では、次式(9)を満たすか否かを判定する。ステップS105がYesである場合には処理をステップS106に進め、ステップS105がNoである場合には処理をステップS107に進める。図7に示す例では、ブロックβが式(9)を満たす。
【0051】
【数4】
【0052】
式(9)を満たす場合は、第1順位O1が小さく(第1推定値ΔVcが大きく)、第2順位O2が大きい(第2推定値ΔVが小さい)ので、主観的な歪が大きい部分に符号量が小さく割当てられていることを意味する。そこでこれを是正するために、ステップS106では、当該CTUのスケーリング係数aを1よりも小さい値(例えば、0.8)に決定する。
【0053】
ステップS107では、スケーリング係数aを1に決定する。以上のように変更したスケーリング係数aを使用して符号化することで、HDR/広色域映像のような鮮やかな色彩を含む映像を圧縮する際の符号化効率を向上させることができる。
【0054】
このように、スケーリング係数決定部63は、符号化対象部分のブロックにおいて、第1推定値ΔVcを大きい順に並べ替えた前記第1順位O1が、第2推定値ΔVを大きい順に並べ替えた第2順位O2よりも大きいほど、符号量を小さくするように調整する(スケーリング係数aを1よりも大きい値に決定する)。言い換えれば、スケーリング係数決定部63は、符号化対象部分のブロックにおいて、第1推定値ΔVcを大きい順に並べ替えた第1順位O1が、第2推定値ΔVを大きい順に並べ替えた第2順位O2よりも小さいほど、符号量を大きくするように調整する(スケーリング係数aを1よりも小さい値に決定する)。
【0055】
なお、本実施形態では、ラグランジュ乗数λのスケーリング係数aを変更することによって符号化効率を向上させているが、スケーリング係数決定部63に代えて量子化パラメータ調整部を備え、量子化パラメータQPを変更するようにしてもよい。この場合、量子化パラメータ調整部は、符号化対象部分のブロックにおいて、第1推定値ΔVcを大きい順に並べ替えた前記第1順位O1が、第2推定値ΔVを大きい順に並べ替えた第2順位O2よりも大きいほど、符号量を小さくするように調整する(量子化パラメータQPを大きくするように調整する)。言い換えれば、量子化パラメータ調整部は、符号化対象部分のブロックにおいて、第1推定値ΔVcを大きい順に並べ替えた第1順位O1が、第2推定値ΔVを大きい順に並べ替えた第2順位O2よりも小さいほど、符号量を大きくするように調整する(量子化パラメータQPを小さくするように調整する)。
【0056】
(符号化部)
次に、符号化部10の詳細について説明する。図8は、符号化部10の構成例を示すブロック図である。図8に示す符号化部10は、ブロック分割部11と、減算部12と、変換部13と、量子化部14と、逆量子化部15と、逆変換部16と、加算部17と、記憶部18と、予測部19と、エントロピー符号化部20と、を備える。
【0057】
ブロック分割部11は、入力映像のフレームをCTU,CUといった符号化処理を行うブロック単位に分割したブロック画像を生成し、減算部12及び予測部19に出力する。
【0058】
減算部12は、ブロック分割部11から入力したブロック画像の各画素値から、後述する予測部19から入力した予測ブロック画像の各画素値を減算して、ブロック画像と予測ブロック画像との差を示す残差ブロック画像を生成し、変換部13に出力する。
【0059】
変換部13は、減算部12から入力した残差ブロック画像に対して、直交変換などの変換処理を行って変換係数を算出し、量子化部14に出力する。
【0060】
量子化部14は、変換部13から入力した変換係数を、量子化パラメータQPに対応する量子化ステップで除算して量子化することにより量子化係数を生成し、逆量子化部15及びエントロピー符号化部20に出力する。量子化部14により、データ量の削減が行われる。
【0061】
逆量子化部15は、量子化部14から入力した量子化係数に対して、量子化ステップを乗ずることにより変換係数を復元し、逆変換部16に出力する。
【0062】
逆変換部16は、逆量子化部15から入力した変換係数に対して、逆変換処理(変換部13で行った変換を元に戻す処理)を行って残差ブロック画像を復元し、加算部17に出力する。例えば、変換部13が離散コサイン変換を行った場合には、逆変換部16は逆離散コサイン変換を行う。
【0063】
加算部17は、逆変換部16から入力した残差ブロック画像と、予測部19から入力した予測画像とを加算し、局部復号画像として記憶部18、及びコスト最適化部40の符号化歪算出部41に出力する。
【0064】
このように、符号化部10は、量子化係数に対して量子化ステップを乗じて変換係数を復元し、該変換係数に対して逆変換処理を行って残差ブロック画像を復元し、該残差ブロック画像とイントラ予測画像又は動き補償予測画像とを加算して局部復号画像を生成する。なお、符号化部10は、加算部17が出力する局部復号画像に対してデブロッキングフィルタによるフィルタ処理などの後処理を行ってから、記憶部18に出力してもよい。
【0065】
予測部19は、イントラ予測(画面内予測)、又はインター予測(画面間予測、動き補償予測)を行う。イントラ予測では、記憶部18に記憶された局部復号画像に対して、イントラ予測モードに従ってイントラ予測したイントラ予測画像を生成する。インター予測では、記憶部18に記憶された局部復号画像に対して、動きベクトルに従って動き補償予測した動き補償予測画像を生成する。予測部19は、イントラ予測画像と動き補償予測画像とを切替えて予測ブロック画像とし、減算部12及び加算部17に出力する。予測部19は、予測処理に用いられた予測パラメータ(イントラ予測モード及び動きベクトル情報)をエントロピー符号化部20に出力する。
【0066】
エントロピー符号化部20は、量子化部14から入力した量子化係数、及び符号化処理に用いられたブロックサイズ情報、変換情報、予測パラメータなどのパラメータに対してエントロピー符号化を行い、データ圧縮を行って符号化結果であるビットストリームを生成し、コスト最適化部40の符号量算出部42、及び符号化結果格納部70に出力する。
【0067】
(実験結果)
表1に、本実施形態に係る映像符号化装置1をあるHDR/広色域画像に適用した実験結果を示す。画質指標Vcは原画像に近いほど値が大きくなり、最大値が1の指標である。映像符号化装置1により符号化を行うことで、先行符号化に比べて符号量を小さくしつつ、客観評価値を向上させる効果があることを確認できた。
【0068】
【表1】
【0069】
このように、本実施形態に係る映像符号化装置1は、コスト関数の符号化歪DとレートRの関係を画質指標で推定することにより、HDR/広色域映像のような鮮やかな色彩を含む映像を圧縮する際の主観品質を向上させることが可能となる。
【0070】
(プログラム)
上記の映像符号化装置1として機能させるために、プログラム命令を実行可能なコンピュータを用いることも可能である。ここで、コンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。
【0071】
コンピュータは、プロセッサと、記憶部と、入力部と、出力部と、通信インターフェースとを備える。プロセッサは、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、SoC(System on a Chip)などであり、同種又は異種の複数のプロセッサにより構成されてもよい。プロセッサは、記憶部からプログラムを読み出して実行することで、上記各構成の制御及び各種の演算処理を行う。なお、これらの処理内容の少なくとも一部をハードウェアで実現することとしてもよい。入力部は、ユーザの入力操作を受け付けてユーザの操作に基づく情報を取得する入力インターフェースであり、ポインティングデバイス、キーボード、マウスなどである。出力部は、情報を出力する出力インターフェースであり、ディスプレイ、スピーカなどである。通信インターフェースは、外部の装置と通信するためのインターフェースである。
【0072】
プログラムは、コンピュータが読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性(non-transitory)の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROM、USB(Universal Serial Bus)メモリなどであってもよい。また、このプログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
【0073】
例えば、コンピュータを上記の映像符号化装置1として機能させるためのプログラムは、原画像を劣化させた劣化画像を生成する劣化画像生成ステップと、劣化画像のブロックごとの劣化度の第1推定値、及び前記劣化画像のブロックごとの符号量の第2推定値を求め、第1推定値を大きさ順に並べ替えた第1順位と、第2推定値を大きさ順に並べ替えた第2順位の差に応じて、符号化対象部分に対する符号量を調整する符号量調整ステップと、をコンピュータに実行させ、符号量調整ステップは、輝度信号及び色信号から指標値を算出する第1画質指標を用いて、原画像及び劣化画像を比較して、第1推定値を求める。
【0074】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形又は変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
【符号の説明】
【0075】
1 映像符号化装置
10 符号化部
11 ブロック分割部
12 減算部
13 変換部
14 量子化部
15 逆量子化部
16 逆変換部
17 加算部
18 記憶部
19 予測部
20 エントロピー符号化部
30 符号化モード候補導出部
40 コスト最適化部
41 符号化歪算出部
42 符号量算出部
43 符号化モード決定部
50 劣化画像生成部
60 符号量調整部
61 劣化度推定部
62 符号量推定部
63 スケーリング係数決定部
70 符号化結果格納部
図1
図2
図3
図4
図5
図6
図7
図8
図9