(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2016-171510(P2016-171510A)
(43)【公開日】2016年9月23日
(54)【発明の名称】予測符号化判定装置、符号化装置、及びプログラム
(51)【国際特許分類】
H04N 19/107 20140101AFI20160826BHJP
H04N 19/139 20140101ALI20160826BHJP
H04N 19/172 20140101ALI20160826BHJP
【FI】
H04N19/107
H04N19/139
H04N19/172
【審査請求】未請求
【請求項の数】7
【出願形態】OL
【全頁数】10
(21)【出願番号】特願2015-50991(P2015-50991)
(22)【出願日】2015年3月13日
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】100161148
【弁理士】
【氏名又は名称】福尾 誠
(72)【発明者】
【氏名】松尾 康孝
(72)【発明者】
【氏名】根本 慎平
(72)【発明者】
【氏名】境田 慎一
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159NN01
5C159NN28
5C159SS26
5C159TA23
5C159TB04
5C159TC12
5C159TD04
5C159TD12
5C159UA02
5C159UA39
(57)【要約】
【課題】動きがランダムな映像の符号化画質を向上させる。
【解決手段】予測符号化判定装置1は、映像を入力して、符号化対象フレームと参照フレームとの間の動きベクトルを生成する動き推定部11と、動きベクトルから符号化対象フレームのインター予測の難度を算出するインター予測難度測定部12と、インター予測の難度から、符号化対象フレームがインター予測を行うのに適しているかイントラ予測を行うのに適しているかを判定するインター/イントラ予測判定部13と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
映像を入力して、符号化対象フレームと参照フレームとの間の動きベクトルを生成する動き推定部と、
前記動きベクトルから、前記符号化対象フレームのインター予測の難度を算出するインター予測難度測定部と、
前記インター予測の難度から、前記符号化対象フレームがインター予測を行うのに適しているかイントラ予測を行うのに適しているかを判定するインター/イントラ予測判定部と、
を備えることを特徴とする予測符号化判定装置。
【請求項2】
前記動き推定部は、SURF特徴量のマッチングを行うことにより前記動きベクトルを生成することを特徴とする、請求項1に記載の予測符号化判定装置。
【請求項3】
前記インター予測難度測定部は、前記動きベクトルの分散値を前記インター予測の難度として算出することを特徴とする、請求項1又は2に記載の予測符号化判定装置。
【請求項4】
前記インター/イントラ予測判定部は、前記インター予測の難度を閾値判定することにより、前記符号化対象フレームがインター予測を行うのに適しているか否かを判定することを特徴とする、請求項1から3のいずれか一項に記載の予測符号化判定装置。
【請求項5】
請求項1から4のいずれか一項に記載の予測符号化判定装置を備え、
前記インター/イントラ予測判定部により、前記符号化対象フレームがインター予測を行うのに適していると判定された場合には、前記符号化対象フレームをインター予測して符号化し、前記符号化対象フレームがインター予測を行うのに適していないと判定された場合には、前記符号化対象フレームをイントラ予測して符号化することを特徴とする符号化装置。
【請求項6】
コンピュータを、請求項1から4のいずれか一項に記載の予測符号化判定装置として機能させるためのプログラム。
【請求項7】
コンピュータを、請求項5に記載の符号化装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、予測符号化方式を判定する予測符号化判定装置、符号化装置、及びプログラムに関する。
【背景技術】
【0002】
映像の符号化方式として、ITU−T H.264/MPEG−4 AVCや、ITU−T H.265/MPEG−H HEVCなどが知られている。これらの符号化方式では、インター予測(フレーム間予測、画面間予測)、及びイントラ予測(フレーム内予測、画面内予測)が用いられる。インター予測は時間的に前後する参照フレームから予測画像を生成し、原画像との差分を符号化する予測符号化方式である。イントラ予測はフレーム内符号化されるブロックに対して、符号化済みの隣接ブロックの画素から予測画像を生成し、原画像との差分を符号化する予測符号化方式である。
【0003】
また、特許文献1には、画像符号化方法において、ブロックごとに動き補償のサイズ、画像のサイズ、局部復号時のフレームレートを基準に符号化難易度を判定し、ブロックが双方向インター予測を行うBピクチャに属する場合は順方向及び逆方向のいずれかだけをインター予測の方向とする技術が開示されている。
【0004】
また、特許文献2には、低フレームレート映像にフレームを補間内挿して高フレームレート映像を生成する装置であり、フレーム内の任意ブロック内の輝度値の分散からブロック領域内の画像が平坦かどうかを調べることで動き検出難易度を判定する技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第4755093号公報
【特許文献2】特開2010−288006号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、従来の符号化技術は、符号化対象フレームがインター予測を行うのに適しているか否かを判定していないという課題があった。そのため、「火花が飛び散る」、「稲穂が揺れる」、「水しぶき」などのような動きがランダムな特殊映像でインター予測を行うと、インター予測の精度が低くなり、符号化画質が低くなる可能性が高かった。
【0007】
かかる事情に鑑みてなされた本発明の目的は、符号化対象フレームがインター予測を行うのに適しているか否かを判定することが可能な予測符号化判定装置、符号化装置、及びプログラムを提供することにある。
【課題を解決するための手段】
【0008】
上記課題を解決するため、本発明に係る予測符号化判定装置は、映像を入力して、符号化対象フレームと参照フレームとの間の動きベクトルを生成する動き推定部と、前記動きベクトルから、前記符号化対象フレームのインター予測の難度を算出するインター予測難度測定部と、前記インター予測の難度から、前記符号化対象フレームがインター予測を行うのに適しているかイントラ予測を行うのに適しているかを判定するインター/イントラ予測判定部と、を備えることを特徴とする。
【0009】
さらに、本発明に係る予測符号化判定装置において、前記動き推定部は、SURF特徴量のマッチングを行うことにより前記動きベクトルを生成することを特徴とする。
【0010】
さらに、本発明に係る予測符号化判定装置において、前記インター予測難度測定部は、前記動きベクトルの分散値を前記インター予測の難度として算出することを特徴とする。
【0011】
さらに、本発明に係る予測符号化判定装置において、前記インター/イントラ予測判定部は、前記インター予測の難度を閾値判定することにより、前記符号化対象フレームがインター予測を行うのに適しているか否かを判定することを特徴とする。
【0012】
また、上記課題を解決するため、本発明に係る符号化装置は、上記予測符号化判定装置を備え、前記インター/イントラ予測判定部により、前記符号化対象フレームがインター予測を行うのに適していると判定された場合には、前記符号化対象フレームをインター予測して符号化し、前記符号化対象フレームがインター予測を行うのに適していないと判定された場合には、前記符号化対象フレームをイントラ予測して符号化することを特徴とする。
【0013】
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記予測符号化判定装置として機能させることを特徴とする。
【0014】
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記符号化装置として機能させることを特徴とする。
【発明の効果】
【0015】
本発明の予測符号化判定装置によれば、インター予測の難度を判定して符号化対象フレームがインター予測を行うのに適しているかイントラ予測を行うのに適しているかを判定することができる。また、本発明の符号化装置によれば、インター予測の難度に応じてインター予測とイントラ予測とを切り替えることにより、動きがランダムな映像の符号化画質を向上させることが可能となる。
【図面の簡単な説明】
【0016】
【
図1】本発明の第1の実施形態に係る予測符号化判定装置の構成例を示すブロック図である。
【
図2】SURF特徴量の算出方法を説明する図である。
【
図3】参照フレーム間の予測構造例を示す図である。
【
図4】本発明の第2の実施形態に係る符号化装置の構成例を示すブロック図である。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態について、図面を参照して詳細に説明する。
【0018】
(第1の実施形態)
図1は、本発明の第1の実施形態に係る予測符号化判定装置の構成例を示すブロック図である。
図1に示す例では、予測符号化判定装置1は、動き推定部11と、インター予測難度測定部12と、インター/イントラ予測判定部13とを備える。予測符号化判定装置1は、映像(原画像群)を入力し、符号化対象フレームがインター予測を行うのに適しているかイントラ予測を行うのに適しているかを判定する。すなわち、符号化対象フレームに対して、インター予測を適用させるかイントラ予測を適用させるかを決定する。
【0019】
動き推定部11は、映像(原画像群)を入力して、符号化対象フレーム(基準フレーム)と参照フレームとの間で動き推定を行って動きベクトルを生成し、動きベクトル情報をインター予測難度測定部12に出力する。ここで動き推定では、本発明が対象とする「火花が飛び散る映像」のような動きがランダムな映像を高精度に動き推定するため、拡大・縮小、回転、照明変動に強いSURF(Speeded-Up Robust Features)特徴量を用いるのが好適である。
【0020】
図2は、SURF特徴量の算出方法を説明する図である。SURF特徴量は、原画像に分散値を可変としたガウシアンフィルタを適用した画像において、ヘッセ(Hessian)行列値の極大点を探すことで複数の特徴点を抽出する。
図2では左図に示すように、8×8画素のブロックの中心点を特徴点としている。次に、各特徴点においてハールウェーブレット(Haar wavelet)を用いて強度の強い方向を求める。そして、強度の強い方向を原方向として、
図2の右図に示すように2×2画素の領域ごとに、ハールウェーブレットを用いて水平方向の微分値dx及び垂直方向の微分値dyを求めることにより、Σdx、Σ|dx|、Σdy、及びΣ|dy|の4つの特徴量を算出する。
【0021】
図2に示すように特徴点を中心とする8×8画素のブロック単位で特徴量を算出すると、8×8画素のブロックには2×2画素の領域が4×4個存在するので、1つの特徴点において64(=4×4×4)次元の特徴量が得られる。なお、SURFの詳細については、例えば H. Bay, A. Ess, T. Tuytelaars, and L. V. Gool, "Speeded-Up Robust Features (SURF)", Elsevier, vol. 110, Issue 3, p. 346-359, Jun. 2008を参照されたい。
【0022】
SURF特徴量を用いる場合、動き推定部11は、符号化対象フレームと参照フレームとの間でSURF特徴量のマッチングを行うことにより、特徴点ごとに動きベクトルを求める。具体的には、符号化対象フレーム内の任意の特徴点Aにおける特徴量に対して64次元のユークリッド距離が最小となる参照フレーム内の特徴点Bをマッチング点として抽出し、特徴点AB間の水平方向及び垂直方向の位置ずれ量を動きベクトルとして算出する。SURF特徴量のマッチングを用いた動き推定により、ランダムな動きが多い映像におけるインター予測精度(動き推定精度)を向上させることが可能となる。
【0023】
図3は、参照フレーム間の予測構造例を示す図である。動き推定部11は、インター予測の参照フレームを、参照フレーム間の予測構造情報を基に判定する。
図3に示す例では、P
1ピクチャを符号化対象フレームとすると、I
0ピクチャが参照フレームとなるため、P
1ピクチャとI
0ピクチャ位置の原画像間でSURF特徴量によるマッチングを行う。また、B
2ピクチャを符号化対象フレームとすると、I
0ピクチャとP
1ピクチャが参照フレームとなるため、B
2ピクチャとI
0ピクチャ位置、及びB
2ピクチャとP
1ピクチャ位置の原画像間で動き推定を行う。
【0024】
なお、参照フレームの予測構造情報の入力は必須ではなく、参照フレームの予測構造情報を入力しないで、常に符号化対象フレームの1フレーム前(過去)の時間位置との原画像間で動き推定を行うようにしてもよい。
【0025】
インター予測難度測定部12は、動き推定部11により生成された動きベクトルから、符号化対象フレームのインター予測の難度を算出して、インター予測難度情報をインター/イントラ予測判定部13に出力する。画面間符号化難度は、例えば動き推定部11により生成された動きベクトルの分散値、平均値、中央値、又はこれらの組み合わせとする。特に、動きのランダム性を解析するために、動きベクトルの分散値を用いるのが簡便である。
【0026】
インター/イントラ予測判定部13は、インター予測難度測定部12からインター予測難度情報を入力して、符号化対象フレームがインター予測を行うのに適しているかイントラ予測を行うのに適しているかを判定し、判定結果を示す判定情報(例えば、1ビットのフラグ)を外部に出力する。
【0027】
インター/イントラ予測判定部13は、例えばインター予測難度情報が動きベクトルの分散値の場合は、分散値が閾値Tmを越えれば当該符号化対象フレームは動きがランダムであると判定して、イントラ予測を行うのに適していると判定し、分散値が閾値Tm以下であればインター予測を行うのに適していると判定する。閾値Tmの値は、例えば10000とする。
【0028】
上述したように、予測符号化判定装置1は、動き推定部11により、符号化対象フレームと参照フレームとの間の動きベクトルを生成し、インター予測難度測定部12により、動きベクトルから符号化対象フレームのインター予測の難度を算出し、インター/イントラ予測判定部13により、インター予測の難度から符号化対象フレームがインター予測を行うのに適しているかイントラ予測を行うのに適しているかを判定する。かかる構成により、予測符号化判定装置1は、インター予測の難度を判定し、符号化対象フレームがインター予測を行うのに適しているかイントラ予測を行うのに適しているかを判定することが可能となる。
【0029】
なお、上述した予測符号化判定装置1として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、予測符号化判定装置1の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
【0030】
(第2の実施形態)
つぎに、本発明の第2の実施形態について説明する。
図4は、本発明の第2の実施形態に係る符号化装置の構成例を示すブロック図である。
図4に示す例では、符号化装置20は、上述した予測符号化判定装置1と、減算部21と、直交変換部22と、量子化部23と、逆量子化部24と、逆直交変換部25と、加算部26と、デブロッキングフィルタ27と、メモリ28と、イントラ予測部29と、動き補償部30と、切替えスイッチ31と、可変長符号化部32とを備える。符号化装置20は、従来のITU−T H.264/MPEG−4 AVCや、ITU−T H.265/MPEG−H HEVCなどの符号化方式による符号化装置と比較して、予測符号化判定装置1を更に備える点と、イントラ予測部29、動き補償部30、及び可変長符号化部32が予測符号化判定装置1から判定情報を入力して動作する点が相違する。
【0031】
減算部21は、原画像と、切替えスイッチ31を介してイントラ予測部29又は動き補償部30から入力される予測画像との差分を算出し、差分画像を直交変換部22に出力する。
【0032】
直交変換部22は、減算部21から入力される差分画像に対してブロック単位で直交変換処理を施し、得られる直交変換係数を量子化部23に出力する。
【0033】
量子化部23は、直交変換部22から入力される直交変換係数に対して量子化テーブルを選択して量子化処理を行い、量子化された直交変換係数を逆量子化部24及び可変長符号化部32に出力する。
【0034】
逆量子化部24は、量子化部23から入力される量子化された直交変換係数に対して逆量子化処理を行い、得られる直交変換係数を逆直交変換部25に出力する。
【0035】
逆直交変換部25は、逆量子化部24から入力される直交変換係数に対して逆直交変換(例えば、IDCT;Inverse Discrete Cosine Transform)処理を施し、逆直交変換した画像を加算部26に出力する。
【0036】
加算部26は、逆直交変換部25から入力される逆直交変換した画像と、切替えスイッチ31を介してイントラ予測部29又は動き補償部30から入力される予測画像とを加算して局部復号画像を生成し、生成した局部復号画像をデブロッキングフィルタ27に出力する。
【0037】
デブロッキングフィルタ27は、符号化によりブロックの境界に発生するブロックノイズを除去するために、ブロック境界強度に応じて適応的にフィルタリング処理を施し、メモリ28に出力する。
【0038】
予測符号化判定装置1は、上述したように映像を入力して判定情報を生成し、イントラ予測部29、動き補償部30、及び可変長符号化部32に出力する。
【0039】
イントラ予測部29は、予測符号化判定装置1から入力される判定情報がイントラ予測を行うのに適している旨を示していた場合には、メモリ28に記憶された局部復号画像を参照し、イントラ予測モードを選択してイントラ予測画像を生成する。そして、生成したイントラ予測画像を切替えスイッチ31を介して減算部21及び加算部26に出力し、イントラ予測モードを可変長符号化部32に出力する。
【0040】
動き補償部30は、予測符号化判定装置1から入力される判定情報がインター予測を行うのに適している旨を示していた場合には、原画像に対して、メモリ28に記憶された過去及び/又は未来のフレームを参照し、動き推定により動きベクトルを生成し、生成した動きベクトルを可変長符号化部32に出力する。また、動き補償部30は、メモリ28に記憶された復号画像に対し、生成した動きベクトルを用いて動き補償を行ってインター予測したインター予測画像を生成し、生成したインター予測画像を切替えスイッチ31を介して減算部21及び加算部26に出力する。
【0041】
切替えスイッチ31は、イントラ予測部29から入力されるイントラ予測画像と、動き補償部30から入力されるインター予測画像とを切替えて、減算部21及び加算部26に出力する。
【0042】
可変長符号化部32は、量子化部23から入力される量子化された直交変換係数についてスキャンを行って可変長符号化処理を施し、得られる符号化データを外部に出力する。また、可変長符号化部32は、イントラ予測部29から入力される予測モード、動き補償部30から入力される動きベクトルの情報、及び予測符号化判定装置1から入力される判定情報に可変長符号化処理を施し、得られる符号化データを外部に出力する。
【0043】
このように、符号化装置20は予測符号化判定装置1を備え、インター/イントラ予測判定部13により、符号化対象フレームがインター予測を行うのに適していると判定された場合には、符号化対象フレームをインター予測して符号化し、符号化対象フレームがインター予測を行うのに適していないと判定された場合には、符号化対象フレームをイントラ予測して符号化する。このため、動きがランダムなフレームではインター予測を避けてイントラ予測を行うことができ、符号化画質を向上させることができるようになる。
【0044】
ここで、上述した符号化装置20として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、符号化装置20の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの記憶部に格納しておき、当該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
【0045】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
【符号の説明】
【0046】
1 予測符号化判定装置
11 動き推定部
12 インター予測難度測定部
13 インター/イントラ予測判定部
20 符号化装置
21 減算部
22 直交変換部
23 量子化部
24 逆量子化部
25 逆直交変換部
26 加算部
27 デブロッキングフィルタ
28 メモリ
29 イントラ予測部
30 動き補償部
31 切替えスイッチ
32 可変長符号化部