(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-20
(45)【発行日】2023-11-29
(54)【発明の名称】画像処理装置、画像処理方法および画像処理プログラム
(51)【国際特許分類】
G06T 7/187 20170101AFI20231121BHJP
H04N 19/52 20140101ALI20231121BHJP
H04N 19/57 20140101ALI20231121BHJP
H04N 19/54 20140101ALI20231121BHJP
G06T 7/207 20170101ALI20231121BHJP
【FI】
G06T7/187
H04N19/52
H04N19/57
H04N19/54
G06T7/207
(21)【出願番号】P 2021090660
(22)【出願日】2021-05-28
【審査請求日】2022-01-27
【新規性喪失の例外の表示】特許法第30条第2項適用 令和3年2月8日開催 筑波大学情報学群 情報メディア創成学類 卒業研究最終発表会(WEB会議)
【前置審査】
(73)【特許権者】
【識別番号】398034168
【氏名又は名称】株式会社アクセル
(74)【代理人】
【識別番号】110000279
【氏名又は名称】弁理士法人ウィルフォート国際特許事務所
(72)【発明者】
【氏名】小島 悠貴
(72)【発明者】
【氏名】林 慶悟
【審査官】宮島 潤
(56)【参考文献】
【文献】特開2020-30502(JP,A)
【文献】特開2013-54429(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G06V 10/00 - 20/90
G06V 30/418
G06V 40/16
G06V 40/20
G06T 1/00 - 1/40
G06T 3/00 - 5/50
G06T 9/00 - 9/40
H04N 7/12
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
動画像において符号化の対象となるフレームの画像である対象画像内のブロック領域を対象領域とし、
前記動画像において既に符号化されたフレームの画像である参照画像における前記対象領域に類似する領域を参照領域とし、前記対象領域または前記参照領域の一方を第1領域とし他方を第2領域とし、前記第1領域内に前記第1領域の中心を中心とする円の円周上に等間隔で離散して配置される複数の第1サブ領域を、
後述する探索範囲の更新を可能にする前記円の半径と前記第1サブ領域の形状および大きさとで作成し、前記第1サブ領域と同じ形状および大きさであり前記複数の第1サブ領域のそれぞれに類似する複数の第2サブ領域を、前記第2領域内の探索範囲であって、初期の探索範囲が、前記第1領域における前記第1サブ領域の位置と同じ前記第2領域における位置から前記第2領域の中心を軸として前記第1領域と前記第2領域との相対的な回転角度だけ回転させた位置に、前記第2サブ領域の候補となる複数の候補サブ領域を内部に作成できる形状および大きさで離散して設定された複数の探索範囲のそれぞれから探索する探索部と、
前記第1領域の中心を原点とし前記第1サブ領域の位置を示す座標ベクトルの大きさと、前記第2領域の中心を原点とし前記第2サブ領域の位置を示す座標ベクトルの大きさと、に基づいて、前記第2領域に対する前記第1領域の拡大または縮小の比率を算出する算出部と、
前記比率が拡大であれば前記探索範囲を前記第2領域の中心に近づく方向に所定の固定値だけ更新し、前記比率が縮小であれば前記探索範囲を前記中心から遠ざかる方向に所定の固定値だけ更新し、前記探索部による前記第2サブ領域の探索と、前記算出部による前記比率の算出とを実行することを
、探索範囲を固定して第2サブ領域を探索する場合よりも計算量が少なくなるように回数を制限する所定の終了条件が満たされるまで繰り返し、最終的に決定された前記比率を出力する更新部と、
を有する画像処理装置。
【請求項2】
前記探索部は、前記探索範囲内に候補サブ領域を移動させながら、前記候補サブ領域と前記第1サブ領域との画像同士の画素値の類似度を算出し、前記類似度の最も高い候補サブ領域を前記第2サブ領域と決定する、
請求項1に記載の画像処理装置。
【請求項3】
前記算出部は、前記第1領域の中心を原点とし前記第1サブ領域の位置を示す座標ベクトルの大きさが1となるように、前記第2領域の中心を原点とし前記第2サブ領域の位置を示す座標ベクトルの大きさを変化させた第1ベクトルと、前記第2領域の中心を原点とし前記第2サブ領域の位置を示す座標ベクトルの大きさが1となるように、前記第1領域の中心を原点とし前記第1サブ領域の位置を示す座標ベクトルの長さを変化させた第2ベクトルの一方または両方を主成分分析することにより得られる主成分の固有値に基づいて前記比率を算出する、
請求項1に記載の画像処理装置。
【請求項4】
前記算出部は、前記主成分の前記固有値および固有ベクトルを算出し、前記第1領域が前記第2領域に対して、前記固有ベクトルが示す方向に、前記固有値に表された比率で拡大または縮小していることに基づいて、前記第2領域に対する前記第1領域の拡大または縮小の比率を算出する、
請求項3に記載の画像処理装置。
【請求項5】
探索部が、
動画像において符号化の対象となるフレームの画像である対象画像内のブロック領域を対象領域とし、
前記動画像において既に符号化されたフレームの画像である参照画像における前記対象領域に類似する領域を参照領域とし、前記対象領域または前記参照領域の一方を第1領域とし他方を第2領域とし、前記第1領域内に前記第1領域の中心を中心とする円の円周上に等間隔で離散して配置される複数の第1サブ領域を、
後述する探索範囲の更新を可能にする前記円の半径と前記第1サブ領域の形状および大きさとで作成し、前記第1サブ領域と同じ形状および大きさであり前記複数の第1サブ領域のそれぞれに類似する複数の第2サブ領域を、前記第2領域内の探索範囲であって、初期の探索範囲が、前記第1領域における前記第1サブ領域の位置と同じ前記第2領域における位置から前記第2領域の中心を軸として前記第1領域と前記第2領域との相対的な回転角度だけ回転させた位置に、前記第2サブ領域の候補となる複数の候補サブ領域を内部に作成できる形状および大きさで離散して設定された複数の探索範囲のそれぞれから探索し、
算出部が、
前記第1領域の中心を原点とし前記第1サブ領域の位置を示す座標ベクトルの大きさと、前記第2領域の中心を原点とし前記第2サブ領域の位置を示す座標ベクトルの大きさと、に基づいて、前記第2領域に対する前記第1領域の拡大または縮小の比率を算出し、
更新部が、前記比率が拡大であれば前記探索範囲を前記第2領域の中心に近づく方向に所定の固定値だけ更新し、前記比率が縮小であれば前記探索範囲を前記中心から遠ざかる方向に所定の固定値だけ更新し、前記探索部による前記第2サブ領域の探索と、前記算出部による前記比率の算出とを実行することを
、探索範囲を固定して第2サブ領域を探索する場合よりも計算量が少なくなるように回数を制限する所定の終了条件が満たされるまで繰り返し、最終的に決定された前記比率を出力する、
画像処理方法。
【請求項6】
探索部が、
動画像において符号化の対象となるフレームの画像である対象画像内のブロック領域を対象領域とし、
前記動画像において既に符号化されたフレームの画像である参照画像における前記対象領域に類似する領域を参照領域とし、前記対象領域または前記参照領域の一方を第1領域とし他方を第2領域とし、前記第1領域内に前記第1領域の中心を中心とする円の円周上に等間隔で離散して配置される複数の第1サブ領域を、
後述する探索範囲の更新を可能にする前記円の半径と前記第1サブ領域の形状および大きさとで作成し、前記第1サブ領域と同じ形状および大きさであり前記複数の第1サブ領域のそれぞれに類似する複数の第2サブ領域を、前記第2領域内の探索範囲であって、初期の探索範囲が、前記第1領域における前記第1サブ領域の位置と同じ前記第2領域における位置から前記第2領域の中心を軸として前記第1領域と前記第2領域との相対的な回転角度だけ回転させた位置に、前記第2サブ領域の候補となる複数の候補サブ領域を内部に作成できる形状および大きさで離散して設定された複数の探索範囲のそれぞれから探索し、
算出部が、
前記第1領域の中心を原点とし前記第1サブ領域の位置を示す座標ベクトルの大きさと、前記第2領域の中心を原点とし前記第2サブ領域の位置を示す座標ベクトルの大きさと、に基づいて、前記第2領域に対する前記第1領域の拡大または縮小の比率を算出し、
更新部が、前記比率が拡大であれば前記探索範囲を前記第2領域の中心に近づく方向に所定の固定値だけ更新し、前記比率が縮小であれば前記探索範囲を前記中心から遠ざかる方向に所定の固定値だけ更新し、前記探索部による前記第2サブ領域の探索と、前記算出部による前記比率の算出とを実行することを
、探索範囲を固定して第2サブ領域を探索する場合よりも計算量が少なくなるように回数を制限する所定の終了条件が満たされるまで繰り返し、最終的に決定された前記比率を出力する、
処理をコンピュータに実行させるための画像処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像処理技術に関する。
【背景技術】
【0002】
動画像を圧縮する重要な技術の一つとしてフレーム間予測符号化がある。フレーム間予測符号化では、符号化するフレーム(以下「対象フレーム」ともいう)とは異なる時刻の符号化処理済のフレーム(以下「参照フレーム」ともいう)を基に対象フレームの画像を予測し、対象フレームの実際の画像と予測した画像の差分を符号化する。対象フレームの符号化処理済のフレームとの差分を符号化することによりフレームのデータ量を削減することができる。
【0003】
フレーム間予測符号化では、フレームを複数に分割したブロック単位で以下の(1)~(3)の処理が行われる
【0004】
(1)対象フレーム内のブロック(以下「対象ブロック」という)に類似するブロック(以下「参照ブロック」という)を参照フレーム内から画像マッチング技術を用いて探索する
【0005】
(2)対象ブロックと探索で得られた参照ブロックとの差分画像を求める
【0006】
(3)探索で得られた参照ブロックから対象ブロックへの動きを示す動きベクトルを求める。
【0007】
このようにして圧縮された動画像のフレームを復号するとき、参照ブロックと差分画像と動きベクトルから対象ブロックの画像を復元することができる。
【0008】
上述したように上記(1)では、対象ブロックと類似する参照ブロックを探索する際に画像マッチング技術が用いられる。画像マッチング技術として特徴ベースマッチングや領域ベースマッチングといった様々な方式が知られている。動画像内での物体の動きには、移動、伸縮(スケール変化)、および回転が含まれる。
【0009】
特許文献1には動画像圧縮における動きを算出する技術が開示されている。画像平面上の現フレ-ムの既知の領域の3点とこれらの3点について探索された3つの平行移動ベクトルを用いて前フレ-ムの領域の3点の座標を求める。更に、現フレ-ムおよび前フレ-ムの領域の6点の位置座標より各々のベクトルの水平と垂直成分を算出し、それらのベクトルのx、y成分より、水平と垂直方向の回転角度、伸縮倍率、平行移動量の6個のアフィン変換パラメータを算出する。
【0010】
また、非特許文献1には、画像のスケール変化や回転に関連する技術が開示されている。画像ブロックに含まれる画素の勾配に関するヒストグラムを作成し、ヒストグラムの最大値となるピークをキーポイントのオリエンテーションとして割り当てる。そして、キーポイントのオリエンテーション方向に画像を回転する。
【0011】
特許文献1に開示された技術では、平行移動ベクトルを探索する処理が複雑である。非特許文献1に開示された技術では、画像の勾配強度と勾配方向とを用いてヒストグラムを作成する処理が複雑である。そのため、対象ブロックと参照ブロックとの相対的な拡大または縮小の比率を求める計算量が多くなる。拡大または縮小のことを以下「拡縮」という場合がある。また、拡大または縮小の比率のことを以下「拡縮率」という場合がある。
【0012】
これに対して、特許文献2には、対象領域(対象ブロックに相当)と参照領域(参照ブロックに相当)に互いに対応する複数のサブ領域を定め、サブ領域間の相対的な位置関係すなわちサブ領域の動きを示すベクトルを主成することにより、対象領域の参照領域に対する拡縮率を決定するという手法が開示されている。これにより拡縮率の計算量が低減される。
【0013】
特許文献2の手法では、対象領域と参照領域に互いに対応する複数のサブ領域を定めるとき、対象領域内に設定したサブ対象領域毎に参照領域内にて探索範囲を決めて、当該サブ対象領域との類似度が高いサブ参照領域を探索する。
【先行技術文献】
【特許文献】
【0014】
【文献】特開平9-98424号公報
【文献】特開2020-030502号公報
【非特許文献】
【0015】
【文献】Gradientベースの特徴抽出-SIFTとHOG- 藤吉弘亘 情報処理学会 研究報告CVIM 160, pp. 211-224, September, 2007.
【発明の概要】
【発明が解決しようとする課題】
【0016】
特許文献2の手法では、参照領域内にてサブ参照領域を探索する処理において、探索範囲を大きくすればサブ対象領域との類似度の高いサブ参照領域を見つけることができ、拡縮率の精度が上がる。しかし、探索範囲を大きくすれば類似度算出の処理が増大してしまう。
【0017】
本開示のひとつの目的は、領域同士の拡大または縮小の比率を、より少ない計算量で算出する技術を提供することである。
【課題を解決するための手段】
【0018】
本開示のひとつの態様による画像処理装置は、対象領域または参照領域の一方である第1領域内の複数の第1サブ領域のそれぞれに対応する複数の第2サブ領域を、前記対象領域または前記参照領域の他方である第2領域内の探索範囲から探索する探索部と、前記第1領域における前記第1サブ領域と、前記第2領域における前記第2サブ領域との相対的な位置関係に基づいて、前記第2領域に対する前記第1領域の拡大または縮小の比率を算出する算出部と、前記比率に基づいて前記探索範囲を更新し、前記探索部による前記第2サブ領域の探索と、前記算出部による前記比率の算出とを再度実行させる更新部と、を有する。
【発明の効果】
【0019】
本開示のひとつの態様によれば、参照領域に対する対象領域の拡大または縮小の比率を、より少ない計算量で算出することができる。
【図面の簡単な説明】
【0020】
【
図1】画像処理装置の機能構成を示すブロック図である。
【
図2】画像処理装置のハードウェア構成を示すブロック図である。
【
図3】画像処理装置による全体処理のフローチャートである。
【
図6】第1の拡縮演算処理のフローチャートである。
【
図7】対象領域内にサブ対象領域が作成された様子を示す図である。
【
図8】参照領域に設定された初期の探索範囲を示す図である。
【
図9】参照領域内でサブ参照領域が決定された様子を示す図である。
【
図10】サブ参照領域を基準として正規化されたサブ対象領域の一例を示す図である。
【
図11】ステップS203で求めた複数のベクトルの主成分の固有ベクトルを示す図である。
【
図12】第2の拡縮演算処理のフローチャートである。
【
図13】参照領域内にサブ参照領域が作成された様子を示す図である。
【
図14】対象領域に設定された初期の探索範囲を示す図である。
【
図15】対象領域内でサブ対象領域が決定された様子を示す図である。
【
図16】ステップS303で求めた複数のベクトルの主成分の固有ベクトルを示す図である。
【発明を実施するための形態】
【0021】
以下、本発明の実施形態について図面を参照して説明する。
【0022】
本実施形態では、画像の拡大あるいは縮小の比率を算出する装置の一例として画像の差分符号化を行う画像符号化装置を例示する。差分符号化は、符号化の対象となる静止画フレームの画像(対象画像)と、符号化に利用する静止画フレームの画像(参照画像)から予測した画像(予測画像)との差分を符号化する符号化方式である。例えば、対象画像は、動画像において符号化の対象となっている静止画フレームの画像であり、参照画像は、動画像において既に符号化された前フレームの画像である。
【0023】
参照画像から対象画像にできるだけ近い予測画像を生成すれば、対象画像と予測画像との差分が小さくなり、その結果、符号化後のデータ量を小さくすることができる。例えば、対象画像に限りなく近い予測画像が得られれば差分がほとんどなくなり、符号化後のデータ量は小さくなる。逆に、予測が不能であれば、例えば、対象画像と参照画像との差分をそのまま符号化し、符号化後のデータ量が大きくなる。
【0024】
図1は、画像処理装置の機能構成を示すブロック図である。
図2は、画像処理装置のハードウェア構成を示すブロック図である。
【0025】
図1を参照すると、画像処理装置1は、制御部10と、記憶部20とを備える。記憶部20には、フレーム情報21と、差分符号情報22とが格納される。フレーム情報21は、動画を構成する各フレームの画像データである。差分符号情報22は、差分符号化により符号化された各フレームの画像データである。
【0026】
制御部10は、記憶部20に格納されたフレーム情報21を用いてフレームの画像を符号化し、符号化後の画像データを差分符号情報22として記憶部20に記録する。
【0027】
図2を参照すると、画像処理装置1のハードウェアは一例としてコンピュータ装置400である。コンピュータ装置400は、制御回路401と、記憶装置402と、読書装置403と、記録媒体404と、通信インターフェイス405と、入出力インターフェイス406と、入力装置407と、表示装置408とを有している。制御回路401、記憶装置402、読書装置403、通信インターフェイス405、入出力インターフェイス406、および表示装置408はバス410により互いに接続される。記録媒体404は読書装置403に接続される。入力装置407は入出力インターフェイス406に接続される。また通信インターフェイス405はネットワーク409と接続される。
【0028】
制御回路401は、コンピュータ装置400全体を制御する。制御回路401は一例としてプロセッサである。制御回路401は、記憶装置402に記録された不図示の画像処理プログラムを実行することにより、
図1に示した制御部10として動作する。
【0029】
記憶装置402は、制御回路401を制御部10として機能させる画像処理プログラムを記憶する。また、記憶装置402は、制御回路401が動作するための各種データを記憶する。また、記憶装置402は、
図1における記憶部20として機能する。
【0030】
読書装置403は、着脱可能な記録媒体404からデータを読み出し、また記録媒体404へデータを書き込む。
【0031】
記録媒体404は、SD(Secure Digital)メモリーカード、FD(Floppy Disk)、CD(Compact Disc)、DVD(Digital Versatile Disk)、BD(Blu-ray Disk:登録商標)、およびフラッシュメモリなどの非一時的記録媒体である。記録媒体404は、例えば、コンピュータ装置400に与えるデータ、コンピュータ装置400で生成されたデータ、およびコンピュータ装置400で取得されたデータを格納する。また、記録媒体404は、
図1に示した記憶部20内の情報を記憶してもよい。
【0032】
通信インターフェイス405は、ネットワーク409を介してコンピュータ装置400と不図示の他の装置とを通信可能に接続する。
【0033】
入出力インターフェイス406は、入力装置407等の各種入出力装置と接続するインターフェイスである。入出力インターフェイス406は、入力装置407から入力された信号を、バス410を介して制御回路401に出力する。また、入出力インターフェイス406は、制御回路401から出力された信号を、バス410を介して入出力装置に出力する。入力装置407は入出力装置の例である。
【0034】
入力装置407は、キーボード、マウス等の入力装置である。入力装置407は、ユーザによる情報の入力操作を受け付け、入力された情報に対応する信号を入出力インターフェイス406に出力する。例えば、ユーザが入力装置407に映像の差分符号化の開始の指示を入力すると、入力装置407は指示を示す信号を入出力インターフェイス406に出力する。
【0035】
表示装置408は、制御回路401からの制御により各種情報を画面に表示する。
【0036】
ネットワーク409は、コンピュータ装置400と他の装置を通信可能に接続する。
【0037】
【0038】
図1を参照すると、制御部10は、参照領域決定部11と、拡縮算出部12と、予測画像生成部16と、差分符号化部17とを含む。
【0039】
参照領域決定部11は、記憶部20のフレーム情報21から符号化対象である対象画像の画像データを取得し、対象画像内にあるブロック領域(対象領域)の符号化に利用する参照画像における対象領域に類似する領域を参照領域として決定する。類似するというのは、類似の程度を示す指標の値が大きいことをいう。以下、類似の程度を示す指標を類似度ともいう。画像同士の類似度の評価方法は特に限定されないが、例えば画素値の二乗誤差和などで評価することができる。例えば、対象領域との類似度が所定の閾値を超える領域を参照領域としてもよい。あるいは対象領域との類似度が参照画像における他の領域と比べて高い領域を参照領域としてもよい。参照領域を決定するとき、参照領域決定部11は、参照画像内で参照領域の候補を順次スライドしながら、総当たりで候補の領域と対象領域との類似度を算出することにより、対象領域との類似度が高い領域を探索する。後述する予測画像の作成において参照領域を拡大または縮小して対象領域の画像を予測するので、参照領域は対象領域の拡大または縮小の基準となる。
【0040】
拡縮算出部12は、対象領域内の複数のサブ対象領域と、各サブ対象領域に対応する参照領域内の複数のサブ参照領域との相対的な位置関係に基づいて、対象領域の参照領域に対する拡大または縮小の比率を決定する。拡縮算出部12は探索部13と算出部14と更新部15とを有し、それらが連携動作することにより、対象領域の参照領域に対する拡大または縮小の比率を決定する。
【0041】
探索部13は、対象領域内の複数のサブ対象領域のそれぞれに対応する複数のサブ参照領域を、参照領域内の探索範囲から探索する。算出部14は、対象領域におけるサブ対象領域と、参照領域におけるサブ参照領域との相対的な位置関係に基づいて、参照領域に対する対象領域の拡大または縮小の比率を算出する。更新部15は、算出部14により算出された比率に基づいて、参照領域における探索範囲を更新し、探索部13によるサブ参照領域の探索と、算出部14による比率の算出とを再度実行させる。ここに示した探索部13によるサブ参照領域の探索と算出部14による比率の算出と更新部15による探索範囲の更新とを含む一連の処理が複数回繰り返される。このように、拡大または縮小の比率を一旦決定し、その比率に基づいて決定した探索範囲内でサブ領域を探索し、得られたサブ領域を用いて拡大または縮小の比率を再度算出するので、探索範囲を大きくしなくても好適なサブ領域を見つけることができ、領域同士の拡大または縮小の比率を、より少ない計算量で算出することができる。
【0042】
なお、ここでは、対象領域内のサブ対象領域を基に参照領域内でサブ参照領域を探索し、対象領域の参照領域に対する拡大または縮小の比率を算出する例を示したが、参照領域内のサブ参照領域を基に対象領域内でサブ対象領域を探索しても、対象領域の参照領域に対する拡大または縮小の比率を算出することができる。本実施形態では、対象領域内のサブ対象領域を基に参照領域内でサブ参照領域を探索して算出した比率と、参照領域内のサブ参照領域を基に対象領域内でサブ対象領域を探索して算出した比率とを基に、対象領域の参照領域に対する拡大または縮小の比率を決定するものとする。ただし、いずれか一方のみを行い、それにより得られた比率を用いることにしてもよい。例えば、対象画像と参照画像が時間的に離れていない場合、比率が1に近いことが分かっている場合にいずれか一方のみを行うことにし、計算を簡略化してもよい。本実施形態における処理の詳細は後述する。
【0043】
予測画像生成部16は、参照領域を拡縮算出部12により決定された比率で拡大または縮小した画像を用いて、参照画像から対象画像を予測した予測画像を生成する。
【0044】
差分符号化部17は、予測画像生成部16で生成された予測画像と対象画像との差分を符号化する。差分を符号化した符号データは記憶部20に差分符号情報22として記録される。
【0045】
本実施形態によれば、より少ない計算量で比率を計算し、その比率で参照領域を拡大または縮小した画像を用いて対象領域の予測画像を生成するので、少ない計算量で良好な差分符号化を行うことができる。
【0046】
なお、参照領域決定部11は、参照画像内の互いに重複可能な複数の領域を候補領域とし、候補領域を所定の回転角度だけ回転させた回転候補領域と、対象領域との類似度を算出し、類似度に基づいて、複数の候補領域の中から参照領域を決定することにしてもよい。参照画像内の領域を回転させた領域と対象領域との類似度を用いて参照領域を探索するので、良好な参照領域を決定することができ、その結果、良好な差分符号化をすることができる。このとき、例えば、複数の回転角度を予め定めておき、それぞれの候補領域について各回転角度だけ回転させた回転候補領域を作成し、それら複数の回転候補領域と対象領域との類似度を総当たりで算出し、最も類似度の高い回転候補領域の元の候補領域を参照領域とすることにしてもよい。また、このときの回転候補領域の回転角度が、対象領域と参照領域の相対的な回転角度であると言える。
【0047】
図3は、画像処理装置による全体処理のフローチャートである。
【0048】
図3を参照すると、まず、ステップS101にて、参照領域決定部11は、対象画像内の対象領域に類似する参照画像内の領域を参照領域として決定する。
【0049】
図4は対象画像の一例を示す図である。
図5は参照画像の一例を示す図である。ここでは
図4に示した対象画像100内の対象領域110と類似度が高い領域を、
図5に示した参照画像200内から探索するものとする。本例では、参照領域決定部11は、参照画像200内で参照領域の候補である候補領域211を順次スライドさせ、候補領域211を所定の回転角度だけ回転させて回転候補領域とし、対象領域110との類似度を算出し、類似度が最も高かった回転候補領域の元となった候補領域211を参照領域210とする。
【0050】
次に、拡縮算出部12は以下に説明するステップS102~ステップS106による拡縮算出処理を実行する。
【0051】
まず、ステップS102にて、拡縮算出部12は第1の拡縮演算処理を実行する。第1の拡縮演算処理は対象領域から参照領域を見た場合の拡大または縮小に関する演算処理である。
【0052】
図6は、第1の拡縮演算処理のフローチャートである。
【0053】
図6を参照すると、まず、ステップS201にて、拡縮算出部12は、対象領域内に複数のサブ対象領域を作成する。
図7は、対象領域内にサブ対象領域が作成された様子を示す図である。
図7に示すように、拡縮算出部12は、対象領域110の中心を中心とする円周上に等間隔で複数のサブ対象領域(第1サブ対象領域)121を作成する。ここでは1から8までの番号が付された8個のサブ対象領域121が作成されている。
【0054】
次に、ステップS202にて、拡縮算出部12は、参照領域210に探索範囲を設定し、探索部13により、探索範囲内で、複数のサブ対象領域121のそれぞれに類似する領域(サブ参照領域)を探索する。
【0055】
図8は、参照領域に設定された初期の探索範囲を示す図である。
図8を参照すると、参照領域210に探索範囲220が設定されている。探索範囲220は、サブ対象領域121のそれぞれに対して個々に設定される。初期の探索範囲220は、対象領域110における各サブ対象領域121を切り出した位置と同じ参照領域210内の位置から、参照領域210の中心を軸として対象領域110と参照領域210との相対的な回転角度だけ回転させた位置の近傍に、所定の形状および大きさで設定される。
【0056】
拡縮算出部12は、
図7に示したそれぞれのサブ対象領域121に類似する領域を、それぞれの探索範囲220内で探索し、類似度の高い領域を当該サブ対象領域121に対応するサブ参照領域(第1サブ参照領域)とする。具体例としては、拡縮算出部12は、探索範囲220内に候補の領域をスライドさせながら、その都度、その候補の領域とサブ対象領域121との類似度を評価し、評価した中で類似度の最も高い候補の領域をサブ参照領域と定めることにしてもよい。
【0057】
図9は、参照領域内でサブ参照領域が決定された様子を示す図である。
図9を参照すると、参照領域210内に各サブ対象領域121に対応するサブ参照領域221が決定されている。
【0058】
全てのサブ対象領域121に対応するサブ参照領域221が決定したら、次に、ステップS203にて、拡縮算出部12は、算出部14により、対象領域110の中心を原点とし複数のサブ対象領域121の位置を示す座標ベクトルの大きさが1となるように、参照領域210の中心を原点とし複数のサブ参照領域221の位置を示す座標ベクトルを正規化した複数のベクトル(第1ベクトル)を求める。ここで求めたベクトルの集合は、対象領域の参照領域に対する拡大または縮小の比率の方向毎の分布を示す。
図10は、正規化されたサブ対象領域の一例を示す図である。
図10には、正規化の結果として、対応するサブ参照領域221に対して原点Oからの距離が拡大または縮小されたサブ対象領域122が示されている。
【0059】
次に、ステップS204にて、拡縮算出部12は、算出部14により、ステップS203で求めた複数のベクトルを主成分分析して主成分(主成分A)を求める。ここで求まる主成分の固有ベクトルは拡大または縮小の方向を示し、固有値は拡大または縮小の比率を示す。第1主成分の固有値をα´とし、第2主成分の固有値をβ´とする。第1主成分の固有ベクトルをVα´とし、第2主成分の固有ベクトルをVβ´とする。
図11は、ステップS203で求めた複数のベクトルの主成分の固有ベクトルを示す図である。
図11を参照すると、第1主成分の固有ベクトルVα´と、第2主成分の固有ベクトルVβ´とが示されている。
【0060】
図3に戻り、更に、ステップS103にて、拡縮算出部12は第2の拡縮演算処理を実行する。第2の拡縮演算処理は参照領域から対象領域を見た場合の拡大または縮小に関する演算処理である。
【0061】
図12は、第2の拡縮演算処理のフローチャートである。
【0062】
図12を参照すると、まず、ステップS301にて、拡縮算出部12は、参照領域内に複数のサブ参照領域を作成する。
図13は、参照領域内にサブ参照領域が作成された様子を示す図である。
図13に示すように、拡縮算出部12は、参照領域210の中心を中心とする円周上に等間隔で複数のサブ参照領域(第2サブ参照領域)222を作成する。ここでは1から8までの番号が付された8個のサブ参照領域222が作成されている。
【0063】
次に、ステップS302にて、拡縮算出部12は、対象領域110に探索範囲を設定し、探索部13部により、探索範囲内で、複数のサブ参照領域222のそれぞれに類似する領域(サブ対象領域)を探索する。
【0064】
図14は、対象領域に設定された初期の探索範囲を示す図である。
図14を参照すると、対象領域110に探索範囲120が設定されている。探索範囲120は、サブ参照領域221のそれぞれに対して個々に設定される。初期の探索範囲120は、参照領域210における各サブ参照領域221を切り出した位置と同じ対象領域110内の位置から、対象領域110の中心を軸として参照領域210と対象領域110との相対的な回転角度だけ回転させた位置の近傍に、所定の形状および大きさで設定される。
【0065】
拡縮算出部12は、
図13に示したそれぞれのサブ参照領域222に類似する領域を、それぞれの探索範囲120内で探索し、類似度の高い領域を当該サブ参照領域222に対応するサブ対象領域(第2サブ対象領域)とする。具体例としては、拡縮算出部12は、探索範囲120内に候補の領域をスライドさせながら、その都度、その候補の領域とサブ参照領域222との類似度を評価し、評価した中で類似度の最も高い候補の領域をサブ対象領域と定めることにしてもよい。
【0066】
図15は、対象領域内でサブ対象領域が決定された様子を示す図である。
図15を参照すると、対象領域110内に各サブ参照領域221に対応するサブ対象領域122が決定されている。
【0067】
全てのサブ参照領域222に対応するサブ対象領域122が決定したら、次に、ステップS303にて、拡縮算出部12は、算出部14により、参照領域210の中心を原点とし複数のサブ参照領域222の位置を示す座標ベクトルの大きさが1となるように正規化した、対象領域110の中心を原点とし複数のサブ対象領域122の位置を示す座標ベクトルである複数のベクトル(第2ベクトル)を求める。ここで求めたベクトルの集合は、対象領域の参照領域に対する拡大または縮小の比率の方向毎の分布を示す。
【0068】
次に、ステップS304にて、拡縮算出部12は、算出部14により、ステップS303で求めた複数のベクトルを主成分分析して主成分(主成分B)を求める。ここで求まる主成分の固有ベクトルは拡大または縮小の方向を示し、固有値は拡大または縮小の比率を示す。第1主成分の固有値をαとし、第2主成分の固有値をβとする。第1主成分の固有ベクトルをVαとし、第2主成分の固有ベクトルをVβとする。
図16は、ステップS303で求めた複数のベクトルの主成分の固有ベクトルを示す図である。
図16を参照すると、第1主成分の固有ベクトルをVαと、第2主成分の固有ベクトルをVβとが示されている。
【0069】
なお、上述した第1の拡縮演算処理と第2の拡縮演算処理を実行する順序は特に限定されない。第2の拡縮演算処理を第1の拡縮演算処理より先に実行してもよい。
【0070】
図3に戻り、更に、ステップS104にて、拡縮算出部12は、拡縮決定処理を実行する。拡縮決定処理は第1の拡縮演算処理の処理結果と第2の拡縮演算処理の処理結果とに基づき、対象領域の参照領域に対する拡大または縮小の方向および比率を決定する処理である。
【0071】
【0072】
図17を参照すると、拡縮算出部12は、ステップS401にて、αα´≦1かつββ´<1であるか否か判定する。ステップS401の判定がYESであれば、拡縮算出部12は、ステップS402にて、固有ベクトルVαが示す方向に固有値αが示す比率で縮小し、固有ベクトルVβが示す方向に固有値βが示す比率で縮小していると判断する。
【0073】
ステップS401の判定がNOであれば、拡縮算出部12は、ステップS403にて、αα´>1かつββ´≧1であるか否か判定する。ステップS403の判定がYESであれば、拡縮算出部12は、ステップS404にて、固有ベクトルVα´が示す方向に固有値α´が示す比率で拡大し、固有ベクトルVβ´が示す方向に固有値β´が示す比率で拡大していると判断する。
【0074】
ステップS403の判定がNOであれば、拡縮算出部12は、ステップS405にて、αα´>1かつββ´<1かつ固有ベクトルVαと固有ベクトルVα´のなす角が所定角度(例えば45°)より小さいか否か判定する。ステップS405の判定がYESであれば、拡縮算出部12は、ステップS406にて、拡大あるいは縮小の再計算を行う。再計算では、拡縮算出部12は、固有ベクトルVα´付近の第1ベクトルと、固有ベクトルVβ付近の第2ベクトルとの和集合に対して主成分分析をし、得られた主成分の固有値を拡大または縮小の比率とし、固有ベクトルを拡大または縮小の方向とする。なお、固有ベクトルVα´付近のベクトルにいうのは、固有ベクトルVα´に方向が近いベクトルという意味であり、つまり、固有ベクトルVα´の方向と所定範囲内に方向が向いているベクトルをいう。また、本例において、固有ベクトルVαと固有ベクトルVα´のなす角が所定角度(例えば45°)より小さいことを条件としているのは、固有ベクトルVαと固有ベクトルVα´は本来的には近い方向にあるはずなので、これらのなす角度が大きい場合を除外するものである。
【0075】
ステップS405の判定がNOであれば、拡縮算出部12は、ステップS407にて、αα´=1かつββ´=1であるか否か判定する。ステップS407の判定がYESであれば、拡縮算出部12は、ステップS408にて、対象領域は参照領域に対して拡大も縮小もしていないと判断する。ステップS407の判定がNOであれば、拡縮算出部12は、ステップS409にて、対象領域は参照領域に対して拡大しているのか縮小しているのか不明であると判断する。
【0076】
図3に戻り、更に、ステップS105にて、拡縮算出部12は、所定の終了条件を満たしたか否か判定する。終了条件は特に限定されないが、ここでは一例として、ステップS104による比率の決定を所定回数実行したら、終了するという条件であるとする。
【0077】
終了条件が満たされていなければ、ステップS106にて、拡縮算出部12は、更新部15により探索範囲を更新してステップS102に戻す。ここでは第1の拡縮演算処理と第2の拡縮演算処理に用いる探索範囲をそれぞれ更新する。
【0078】
拡縮算出部12は、拡縮決定処理にて算出された比率が、対象領域110が参照領域210に対して拡大となる比率であれば、第1の拡縮演算処理に用いる探索範囲を参照領域210の中心に近づく方向に更新し、対象領域110が参照領域210に対して縮小となる比率であれば、第1の拡縮演算処理に用いる探索範囲を参照領域210の中心から遠ざかる方向に移動させる。探索範囲をどの程度移動させるかは特に限定されない。例えば、移動量を所定の固定値としてもよいし、比率に応じた値としてもよい。
【0079】
また、拡縮算出部12は、拡縮決定処理にて算出された比率が、対象領域110が参照領域210に対して拡大となる比率であれば、第2の拡縮演算処理に用いる探索範囲を対象領域110の中心に近づく方向に更新し、対象領域110が参照領域210に対して縮小となる比率であれば、第2の拡縮演算処理に用いる探索範囲を対象領域110の中心から遠ざかる方向に移動させる。探索範囲をどの程度移動させるかは特に限定されない。例えば、移動量を所定の固定値としてもよいし、比率に応じた値としてもよい。
【0080】
探索範囲が更新された後、第1の拡縮演算処理、第2の拡縮演算処理、および拡縮決定処理が再び実行される。
【0081】
ステップS105にて終了条件が満たされていれば、更に、ステップS107にて、予測画像生成部16は、参照画像200から対象画像100を予測した予測画像を生成する。その際、予測画像生成部16は、参照領域210を拡縮算出部12により最終的に決定された比率で拡大または縮小した画像を予測画像の対象領域110に相当する領域の予測に用いる。そのために、予測画像生成部16は、参照領域から対象領域への移動量を示す動きベクトルと、参照領域210の画像から予測した画像と対象領域110の画像との差分画像とを生成する。生成されたデータは予測画像のデータに含められる。なお、拡縮算出部12が拡大しているのか縮小しているのか不明と判断した対象領域に相当する領域には等倍の参照領域の画像を用いてもよい。
【0082】
続いて、ステップS108にて、差分符号化部17は、予測画像生成部16で生成された予測画像と対象画像100との差分画像を用いて対象画像100を符号化し、差分を符号化した符号データを記憶部20に差分符号情報22として記録する。
【0083】
以上説明した実施形態には以下に示す事項が含まれている。ただし、本実施形態に含まれる事項が以下に示すものに限定されることはない。
【0084】
(事項1)
対象領域または参照領域の一方である第1領域内の複数の第1サブ領域のそれぞれに対応する複数の第2サブ領域を、前記対象領域または前記参照領域の他方である第2領域内の探索範囲から探索する探索部と、
前記第1領域における前記第1サブ領域と、前記第2領域における前記第2サブ領域との相対的な位置関係に基づいて、前記第2領域に対する前記第1領域の拡大または縮小の比率を算出する算出部と、
前記比率に基づいて前記探索範囲を更新し、前記探索部による前記第2サブ領域の探索と、前記算出部による前記比率の算出とを再度実行させる更新部と、
を有する画像処理装置。
これによれば、拡大または縮小の比率を一旦決定し、その比率に基づいて決定した探索範囲内でサブ領域を探索し、得られたサブ領域を用いて拡大または縮小の比率を再度算出するので、探索範囲を大きくしなくても好適なサブ領域を見つけることができ、領域同士の拡大または縮小の比率を、より少ない計算量で算出することができる。
【0085】
(事項2)
前記探索部は、前記第1領域に所定の円周上に前記第1サブ領域を作成し、前記第2領域における前記第1サブ領域に対応する位置の近傍に初期の探索範囲を作成し、
前記更新部は、前記比率が拡大であれば前記探索範囲を前記円周の中心に近づく方向に更新し、前記比率が縮小であれば前記探索範囲を前記中心から遠ざかる方向に更新する、
事項1に記載の画像処理装置。
【0086】
(事項3)
前記探索部は、前記探索範囲の互いに重複可能な複数の領域を候補サブ領域とし、前記候補サブ領域と前記第1サブ領域との類似度を算出し、前記類似度に基づいて前記候補サブ領域のいずれかを前記第2サブ領域と決定する、
事項1に記載の画像処理装置。
これによれば、探索領域内の候補サブ領域と第1サブ領域との類似度を用いて第2サブ領域を探索する構成において、拡大または縮小の比率を一旦決定し、その比率に基づいて更新した探索範囲内で第2サブ領域を探索するので、探索範囲を大きくしなくても類似度の高いサブ領域を見つけることができる。
【0087】
(事項4)
前記算出部は、前記第1領域内の前記第1サブ領域と、前記第2領域内の前記第2サブ領域との相対的な位置関係に基づく複数のベクトルを主成分分析することにより得られる主成分の固有値に基づいて前記比率を算出する、
事項1に記載の画像処理装置。
【0088】
(事項5)
前記算出部は、前記複数のベクトルを主成分分析して前記主成分の前記固有値および固有ベクトルを算出し、前記第1領域が前記第2領域に対して、前記固有ベクトルに基づいて定まる方向に、前記固有値に基づいて定まる比率で拡大または縮小していることを算出する、
事項4に記載の画像処理装置。
これによれば、拡大または縮小の比率だけでなく拡大または縮小の方向も求まるので、どの方向にどれだけ拡大または縮小しているかを求めることができる。
【0089】
(事項6)
前記対象領域は符号化の対象となる対象画像に含まれる領域であり、前記参照領域は前記対象画像の符号化に用いる参照画像に含まれる領域であり、
前記画像処理装置は、
前記対象領域に対して、該対象領域の拡大または縮小の基準となる前記参照領域を決定する領域決定部と、
前記参照領域を前記比率に基づいて拡大または縮小した画像を用いて、前記対象画像を予測した予測画像を生成する予測画像生成部と、
前記予測画像と前記対象画像との差分を符号化する差分符号化部と、を更に有する、
事項1に記載の画像処理装置。
これによれば、拡大および縮小した画像を用いる予測差分符号化を行う画像処理装置において、より少ない計算量で拡大または縮小の比率を算出し、良好な差分符号化を実現することができる。
【0090】
上述した本発明の実施形態は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本発明の範囲を逸脱することなしに、他の様々な態様で本発明を実施することができる。上記各実施例の装置は、ソフトウェアプログラムをプロセッサで実行することにより実現されるものとして例示したが、これに限定されることはない。制御部10の一部または全部の機能をハードウェアで実現するものであってもよい。また、制御部10の一部または全部の機能を専用プロセッサで実現するものであってもよい。
【符号の説明】
【0091】
1…画像処理装置、10…制御部、11…参照領域決定部、12…拡縮算出部、13…探索部、14…算出部、15…更新部、16…予測画像生成部、17…差分符号化部、20…記憶部、21…フレーム情報、22…差分符号情報、100…対象画像、110…対象領域、120…探索範囲、121…サブ対象領域、122…サブ対象領域、200…参照画像、210…参照領域、211…候補領域、220…探索範囲、221…サブ参照領域、222…サブ参照領域、400…コンピュータ装置、401…制御回路、402…記憶装置、403…読書装置、404…記録媒体、405…通信インターフェイス、406…入出力インターフェイス、407…入力装置、408…表示装置、409…ネットワーク、410…バス