IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 大学共同利用機関法人情報・システム研究機構の特許一覧

<>
  • 特許-符号化方法、符号化装置及びプログラム 図1
  • 特許-符号化方法、符号化装置及びプログラム 図2
  • 特許-符号化方法、符号化装置及びプログラム 図3
  • 特許-符号化方法、符号化装置及びプログラム 図4
  • 特許-符号化方法、符号化装置及びプログラム 図5
  • 特許-符号化方法、符号化装置及びプログラム 図6
  • 特許-符号化方法、符号化装置及びプログラム 図7
  • 特許-符号化方法、符号化装置及びプログラム 図8
  • 特許-符号化方法、符号化装置及びプログラム 図9
  • 特許-符号化方法、符号化装置及びプログラム 図10
  • 特許-符号化方法、符号化装置及びプログラム 図11
  • 特許-符号化方法、符号化装置及びプログラム 図12
  • 特許-符号化方法、符号化装置及びプログラム 図13
  • 特許-符号化方法、符号化装置及びプログラム 図14
  • 特許-符号化方法、符号化装置及びプログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-19
(45)【発行日】2022-10-27
(54)【発明の名称】符号化方法、符号化装置及びプログラム
(51)【国際特許分類】
   H04N 19/527 20140101AFI20221020BHJP
【FI】
H04N19/527
【請求項の数】 5
(21)【出願番号】P 2021505508
(86)(22)【出願日】2019-11-29
(86)【国際出願番号】 JP2019046710
(87)【国際公開番号】W WO2020183811
(87)【国際公開日】2020-09-17
【審査請求日】2021-08-05
(31)【優先権主張番号】P 2019047260
(32)【優先日】2019-03-14
(33)【優先権主張国・地域又は機関】JP
【新規性喪失の例外の表示】特許法第30条第2項適用 2018 IEEE International Conference on Image Processing https://2018.ieeeicip.org
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(73)【特許権者】
【識別番号】504202472
【氏名又は名称】大学共同利用機関法人情報・システム研究機構
(74)【代理人】
【識別番号】110001634
【氏名又は名称】弁理士法人志賀国際特許事務所
(72)【発明者】
【氏名】高村 誠之
(72)【発明者】
【氏名】チョン ジーン
(72)【発明者】
【氏名】ヤン チェン
【審査官】田中 純一
(56)【参考文献】
【文献】特開2015-104030(JP,A)
【文献】特開2010-103877(JP,A)
【文献】特開2007-312425(JP,A)
【文献】特開2004-221744(JP,A)
【文献】Zhengyou Zhang,Flexible Camera Calibration By Viewing a Plane From Unknown Orientations,[online],2002年08月06日,https://ieeexplore.ieee.org/document/791289,URL<https://ieeexplore.ieee.org/document/791289>
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/12
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
符号化装置が実行する符号化方法であって、
カメラによって動画像の複数のフレームに撮影された物体の画像に基づいて、前記複数のフレームにおいて前記カメラの内部行列に関するカメラパラメータが同一であるか否かを判定し、前記カメラパラメータが同一である場合、前記カメラパラメータを所定の装置に出力するステップと、
前記カメラパラメータが同一である場合、前記物体の画像に定められた3点の移動先を表す6個のパラメータを生成し、6個の前記パラメータに基づいてホモグラフィ行列を生成し、6個の前記パラメータを前記所定の装置に出力するステップと、
前記動画像の復号画像に対して、前記ホモグラフィ行列を用いる射影変換を実行するステップと、
前記射影変換の結果と前記フレームとの差分である予測残差信号を生成するステップと、
前記予測残差信号を符号化するステップと
を含む符号化方法。
【請求項2】
前記物体の外観は、平面状の形状を有する、請求項1に記載の符号化方法。
【請求項3】
カメラによって動画像の複数のフレームに撮影された物体の画像に基づいて、前記複数のフレームにおいて前記カメラの内部行列に関するカメラパラメータが同一であるか否かを判定し、前記カメラパラメータが同一である場合、前記カメラパラメータを所定の装置に出力する解析部と、
前記カメラパラメータが同一である場合、前記物体の画像に定められた3点の移動先を表す6個のパラメータを生成し、6個の前記パラメータに基づいてホモグラフィ行列を生成し、6個の前記パラメータを前記所定の装置に出力する行列生成部と、
前記動画像の復号画像に対して、前記ホモグラフィ行列を用いる射影変換を実行する射影変換部と、
前記射影変換の結果と前記フレームとの差分である予測残差信号を生成する減算部と、
前記予測残差信号を符号化する符号化部と
を備える符号化装置。
【請求項4】
前記物体の外観は、平面状の形状を有する、請求項3に記載の符号化装置。
【請求項5】
請求項3又は請求項4に記載の符号化装置としてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、符号化方法、符号化装置及びプログラムに関する。
本願は、2019年3月14日に、日本に出願された特願2019-047260号に基づき優先権を主張し、その内容をここに援用する。
【背景技術】
【0002】
絵画、タブレット端末又は地面等の平面状の形状を外観に有する物体(以下「平面状の物体」という。)をカメラが動画撮影する場合がある。動画像のフレームに撮影された物体の画像の形状、大きさ及び位置は、物体の動きとカメラの動きとに応じて、動画像のフレームごとに変化する。撮影された平面状の物体の画像の形状、大きさ及び位置が動画像の各フレームにおいて同じになるように、符号化装置が物体の画像の動きを補償(動き補償)する場合がある。
【0003】
動画像符号化の規格の一つであるMPEG-4(非特許文献1参照)のASP(Advanced Simple Profile)には、グローバル動き補償(Global Motion Compensation : GMC)と呼ばれる動き補償の方式が採用されている。符号化装置は、動画像のフレームの隅ごとに2次元動きベクトルを定めることによって動き補償を実行する。
【0004】
図7は、シンタクス要素の一つである「no_of_sprite_warping_points」に関する図である。「no_of_sprite_warping_points」の値が4である場合、符号化装置は、射影変換を用いてグローバル動き補償を実行する。1本の2次元動きベクトルは、2個のパラメータを持つ。したがって、符号化装置は、グローバル動き補償の処理単位ごとに、8(=2×4)個のパラメータを復号装置に伝送する。
【0005】
「no_of_sprite_warping_points」の値が3である場合、符号化装置は、相似変換を用いて動き補償を実行する。相似変換の自由度は、射影変換の自由度よりも低い。「no_of_sprite_warping_points」の値が2である場合、符号化装置は、アフィン変換(Affine transformation)を用いて動き補償を実行する。アフィン変換の自由度も、射影変換の自由度より低い。そこで、「no_of_sprite_warping_points」の値を2又は3で適応的に切り替える方法が、JVET(Joint Exploration team on Future Video Coding)の規格案として提案されている(非特許文献2参照)。
【0006】
「no_of_sprite_warping_points」の値が3である場合のアフィン変換と等価である変換を用いた動き補償が提案されている(非特許文献3参照)。H.264/AVC(Advanced Video Coding)(非特許文献4参照)と、H.265/HEVC(High Efficiency Video Coding)(非特許文献5参照)とでは、符号化装置は、フレームの間で平行移動(非回転移動)する物体の画像の変形のみを動き補償する。この動き補償は、「no_of_sprite_warping_points」の値が1である場合の動き補償に相当する。
【0007】
3次元空間に存在する平面状の物体(剛体)をカメラが移動しながら撮影した2次元画像(フレーム)における座標の関係式は、式(1)のように表される。
【0008】
【数1】
【0009】
図8は、4本の動きベクトルに基づく射影変換の例を示す図である。フレーム400の4点「(x,y),…,(x,y)」が、フレーム401の4点「(x’,y’),…,(x’,y’)」に対応する場合、符号化装置は、式(1)の線型方程式を解くことで、「h11,…,h32」を導出することができる。ここで、フレーム400の4点「(x,y)…(x,y)」は、矩形であるフレーム400の頂点でなくてもよい。
【0010】
符号化装置は、「h11,…,h32」と式(2)~(5)とに基づく射影変換によって、フレーム400の点(x,y)に対応するフレーム401の点(x’,y’)を導出する。式(2)の3×3行列「H」は、ホモグラフィ行列である。
【0011】
【数2】
【0012】
【数3】
【0013】
【数4】
【0014】
【数5】
【0015】
フレーム400における既知の4点の移動先を表す8個のパラメータ(x’,y’,…,x’,y’)は、符号化装置が点(x,y)を点(x’,y’)に変換するために必要なパラメータである。このことは、ホモグラフィ行列Hの変数「h11,…,h32」が8個であることと、MPEG-4のASPのグローバル動き補償が「no_of_sprite_warping_points=4(パラメータ数=8)であることとに対応している。
【先行技術文献】
【非特許文献】
【0016】
【文献】ISO/IEC 14496-2:2004 Information technology -- Coding of audio-visual objects -- Part 2: Visual
【文献】F. Zou, J. Chen, M. Karczewicz, X. Li, H.-C. Chuang, W.-J. Chien “Improved affine Motion Prediction”, JVET-C0062, May 2016
【文献】M. Narroschke, R. Swoboda, “Extending HEVC by an affine motion model”, Picture coding symposium 2013
【文献】ISO/IEC 14496-10:2014 Information technology -- Coding of audio-visual objects -- Part 10: Advanced Video Coding
【文献】ISO/IEC 23008-2:2015 Information technology -- High efficiency coding and media delivery in heterogeneous environments -- Part 2: High efficiency video coding
【発明の概要】
【発明が解決しようとする課題】
【0017】
このように、移動するカメラから撮影された平面状の物体の画像がカメラ及び物体の相対位置等に応じて変形する場合、符号化装置は、8個のパラメータに基づく射影変換を用いて動き補償する。また、位置が固定されたカメラによって撮影された静止中の任意形状の物体の画像がカメラのカメラパラメータに応じて変形する場合も、符号化装置は、8個のパラメータに基づく射影変換を用いて動き補償する。
【0018】
しかしながら、平面状の物体の物理的な変形には制約がある。このため、平面状の物体の物理的な変形の自由度は、射影変換が表現し得る変形の自由度(8個のパラメータ)よりも少ない。
【0019】
図9は、平面状の板(剛体)の例を示す図である。図10から図15は、図9に示された平面状の板の変形の第1例から第6例を示す図である。図9から図15では、平面状の板は、市松模様の板(チェッカーボード)として表現されている。位置が固定されたカメラの向きがカメラパラメータに応じて変化した場合、図9に示された平面状の板の画像は、図10又は図11に示された平面状の板の画像のように変形する。移動するカメラの姿勢が変化した場合、図9に示された平面状の板の画像は、図12に示された平面状の板の画像のように回転及び縮小する。
【0020】
図9に示された平面状の板が剛体であることから、図13から図15に示された平面状の板の画像の異常な変形は、明らかに不自然である。しかしながら、符号化装置は、図13から図15に示された平面状の板の画像の変形を、8個のパラメータ(自由度)の射影変換を用いて表現している。このように、従来の符号化装置は、画像の符号化効率を向上させることができない場合がある。
【0021】
上記事情に鑑み、本発明は、画像の符号化効率を向上させることが可能である符号化方法、符号化装置及びプログラムを提供することを目的としている。
【課題を解決するための手段】
【0022】
本発明の一態様は、符号化装置が実行する符号化方法であって、符号化装置が実行する符号化方法であって、カメラによって動画像の複数のフレームに撮影された物体の画像に基づいて、前記複数のフレームにおいて前記カメラの内部行列に関するカメラパラメータが同一であるか否かを判定し、前記カメラパラメータが同一である場合、前記カメラパラメータを所定の装置に出力するステップと、前記カメラパラメータが同一である場合、前記物体の画像に定められた3点の移動先を表す6個のパラメータを生成し、6個の前記パラメータに基づいてホモグラフィ行列を生成し、6個の前記パラメータを前記所定の装置に出力するステップと、前記動画像の復号画像に対して、前記ホモグラフィ行列を用いる射影変換を実行するステップと、前記射影変換の結果と前記フレームとの差分である予測残差信号を生成するステップと、前記予測残差信号を符号化するステップとを含む符号化方法である。
【0023】
本発明の一態様は、カメラによって動画像の複数のフレームに撮影された物体の画像に基づいて、前記複数のフレームにおいて前記カメラの内部行列に関するカメラパラメータが同一であるか否かを判定し、前記カメラパラメータが同一である場合、前記カメラパラメータを所定の装置に出力する解析部と、前記カメラパラメータが同一である場合、前記物体の画像に定められた3点の移動先を表す6個のパラメータを生成し、6個の前記パラメータに基づいてホモグラフィ行列を生成し、6個の前記パラメータを前記所定の装置に出力する行列生成部と、前記動画像の復号画像に対して、前記ホモグラフィ行列を用いる射影変換を実行する射影変換部と、前記射影変換の結果と前記フレームとの差分である予測残差信号を生成する減算部と、前記予測残差信号を符号化する符号化部とを備える符号化装置である。
【0024】
本発明の一態様は、上記の符号化装置としてコンピュータを機能させるためのプログラムである。
【発明の効果】
【0025】
本発明により、画像の符号化効率を向上させることが可能である。
【図面の簡単な説明】
【0026】
図1】実施形態における、符号化装置の構成例を示す図である。
図2】実施形態における、動き補償部の構成例を示す図である。
図3】実施形態における、画像の座標の例を示す図である。
図4】実施形態における、3本の動きベクトルに基づく射影変換の例を示す図である。
図5】実施形態における、符号化装置の動作例を示すフローチャートである。
図6】実施形態における、動き補償部の動作例を示すフローチャートである。
図7】シンタクス要素の一つである「no_of_sprite_warping_points」に関する図である。
図8】4本の動きベクトルに基づく射影変換の例を示す図である。
図9】平面状の板の例を示す図である。
図10】平面状の板の変形の第1例を示す図である。
図11】平面状の板の変形の第2例を示す図である。
図12】平面状の板の変形の第3例を示す図である。
図13】平面状の板の変形の第4例を示す図である。
図14】平面状の板の変形の第5例を示す図である。
図15】平面状の板の変形の第6例を示す図である。
【発明を実施するための形態】
【0027】
本発明の実施形態について、図面を参照して詳細に説明する。
符号化装置は、例えば図10から図15に示された物体の画像の変形を、射影変換を用いて表現する。物体の物理的な変形には制約があるので、符号化装置は、8個よりも少ない数のパラメータ(自由度)の射影変換を用いて、動画像のフレームにおける物体の画像の変形を表現する。符号化装置は、8個よりも少ない6個のパラメータ(自由度)の射影変換を用いた精度の高い動き補償によって、画像の符号化効率を向上させることができる。
【0028】
図1は、符号化装置1の構成例を示す図である。符号化装置1は、動画像を符号化する装置である。符号化装置1は、動画像のフレームに定められたブロックごとに、動画像を符号化する。符号化装置1は、符号化データを復号装置に出力する。符号化装置1は、6個のパラメータ(3本の動きベクトル)を表す信号(以下「6パラメータ信号」という。)と、カメラパラメータを表す信号(以下「カメラパラメータ信号」という。)とを、復号装置等の外部装置(不図示)に出力する。
【0029】
符号化装置1は、減算部10と、変換部11と、量子化部12と、エントロピー符号化部13と、逆量子化部14と、逆変換部15と、加算部16と、歪除去フィルタ17と、フレームメモリ18と、フレーム内予測部19と、動き補償部20と、切替部21とを備える。
【0030】
符号化装置1における動き補償部20以外の各機能部は、例えば、「H.265/HEVC」及び「H.264/AVC」等の周知の動画像符号化の規格に基づいて動作してもよい。符号化装置1における動き補償部20の一部は、周知の動画像符号化の規格に基づいて動作してもよい。
【0031】
符号化装置1の一部又は全部は、CPU(Central Processing Unit)又はGPU(Graphics Processing Unit)等のプロセッサが、不揮発性の記録媒体(非一時的な記録媒体)であるメモリに記憶されたプログラムを実行することにより、ソフトウェアとして実現される。符号化装置1の一部又は全部は、例えば、LSI(Large Scale Integration)又はFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。
【0032】
減算部10は、予測信号を動画像信号から減算する。予測信号は、フレーム内予測部19又は動き補償部20によって、所定の処理単位ごとに生成される。所定の処理単位は、H.265/HEVCでは、予測単位(prediction unit)である。減算部10は、減算結果である予測残差信号を、変換部11に出力する。変換部11は、予測残差信号に対して離散コサイン変換(Discrete Cosine Transform)を実行する。量子化部12は、離散コサイン変換の結果を量子化する。エントロピー符号化部13は、量子化の結果に対してエントロピー符号化を実行する。エントロピー符号化部13は、エントロピー符号化の結果である符号化データを、復号装置等の外部装置(不図示)に出力する。
【0033】
逆量子化部14は、量子化の結果を逆量子化する。逆変換部15は、逆量子化の結果に対して逆離散コサイン変換(Inverse Discrete Cosine Transform)を実行する。加算部16は、逆離散コサイン変換の結果と予測信号とを加算することによって、復号画像を生成する。歪除去フィルタ17は、復号画像の歪を除去することによって、歪が除去された復号画像信号を生成する。
【0034】
フレームメモリ18は、歪が除去された復号画像信号を記憶する。フレームメモリ18に記憶された復号画像信号(ローカル復号画像信号)は、復号装置によって生成される復号画像信号と同じである。フレームメモリ18は、記憶されている時間が所定時間以上となった復号画像信号を、フレームメモリ18から削除する。なお、フレームメモリ18は、長時間参照フレームの復号画像信号を、フレームメモリ18が削除指示を取得するまで記憶してもよい。フレームメモリ18は、参照されないフレームの復号画像信号を記憶しなくてもよい。
【0035】
フレーム内予測部19は、復号画像信号に対してフレーム内予測処理を実行することによって、フレーム内予測処理の結果に応じた予測信号を生成する。動き補償部20は、復号画像信号に対して動き補償予測処理を実行することによって、動き補償予測処理の結果に応じた予測信号を生成する。切替部21は、フレーム内予測処理の結果に応じた予測信号を、減算部10に出力する。切替部21は、動き補償予測処理の結果に応じた予測信号を、減算部10に出力する。
【0036】
次に、動き補償部20の構成例を説明する。
図2は、動き補償部20の構成例を示す図である。動き補償部20は、解析部200と、フレーム間予測部201と、行列生成部202と、射影変換部203と、切替部204とを備える。
【0037】
動き補償のモードには、第1モードと、第2モードとがある。第1モードは、「H.265/HEVC」及び「H.264/AVC」等の周知の動画像符号化の規格におけるフレーム間予測処理に基づく動き補償のモードである。第2モードは、3本の動きベクトル(6パラメータ信号)に基づくホモグラフィ行列を用いて、フレームメモリ18に記憶された復号画像信号(ローカル復号画像信号)に対して、射影変換を射影変換単位ごとに実行する動き補償のモードである。
【0038】
解析部200は、所定の期間(時間区間)における動画像の複数のフレーム(以下「フレームグループ」という。)を、動画像信号として取得する。解析部200は、取得されたフレームグループについて、カメラパラメータが不変である期間において撮影されたフレームグループであるか否かを判定する。カメラパラメータが不変である期間において撮影されたフレームグループに対しては、ホモグラフィ行列を用いる射影変換の精度が高いので、第1モードの動き補償よりも第2モードの動き補償が適している。
【0039】
カメラパラメータが不変でない期間において撮影されたフレームグループであると判定された場合、解析部200は、第1モードを表す動き補償モード信号(以下「第1動き補償モード信号」という。)を生成する。解析部200は、第1動き補償モード信号を、フレーム間予測部201及び切替部204に出力する。
【0040】
カメラパラメータが不変である期間において撮影されたフレームグループであると判定された場合、解析部200は、第2モードを表す動き補償モード信号(以下「第2動き補償モード信号」という。)を生成する。解析部200は、第2動き補償モード信号を、行列生成部202及び切替部204に出力する。
【0041】
フレーム間予測部201は、第1動き補償モード信号を解析部200から取得した場合、復号画像信号をフレームメモリ18から取得する。フレーム間予測部201は、動画像信号を解析部200から取得する。フレーム間予測部201は、周知の動画像符号化の規格におけるフレーム間予測処理に基づく動き補償を、復号画像信号に対して実行する。フレーム間予測部201は、第1モードの動き補償に基づく予測信号を、切替部204に出力する。
【0042】
行列生成部202は、第2動き補償モード信号を解析部200から取得した場合、フレームグループとカメラパラメータ信号とを、解析部200から取得する。行列生成部202は、第2動き補償モード信号を解析部200から取得した場合、復号画像信号をフレームメモリ18から取得する。
【0043】
行列生成部202は、6パラメータ信号を、復号装置等の外部装置(不図示)と射影変換部203とに、フレームごとに出力する。行列生成部202は、6パラメータ信号を、復号装置等の外部装置(不図示)と射影変換部203とに、復号画像に定められた射影変換単位ごとに出力する。復号装置等の外部装置は、出力されたカメラパラメータ信号及び6パラメータ信号を用いて、ホモグラフィ行列を導出することができる。行列生成部202は、出力されたカメラパラメータ信号と6パラメータ信号とを用いて、ホモグラフィ行列「H」を生成する。
【0044】
射影変換部203は、ホモグラフィ行列「H」を用いる射影変換を、フレームメモリ18に記憶された復号画像信号(ローカル復号画像信号)に対して実行する。射影変換部203は、第2モードの動き補償に基づく予測信号を、切替部204に出力する。
【0045】
図3は、画像の座標の例を示す図(参考文献1「ディジタル画像処理」,CG-ARTS協会,2015,p.314)である。3次元空間に存在する平面300における点Pの座標(v,v,v)と、移動するカメラの座標(x,y,1)との関係は、式(6)のように表される。
【0046】
【数6】
【0047】
ここで、「h」は、カメラの位置C1から平面300への垂線の長さを表す。「n」は、垂線の方向を表す単位ベクトルを表す。「t」は、カメラの位置C1を始点とし、カメラの位置C2を終点とするベクトルを表す。「R」は、3×3のサイズの回転行列を表す。すなわち、「R」は、位置C1から位置C2までカメラが移動した際の空間回転量を表す。「A」は、カメラパラメータを表す。位置C1から撮影された点Pの画像の座標「m1=(x,y,1)」と、位置C2から撮影された点Pの画像の座標「m2=(x’,y’,1)」と、カメラパラメータ「A」との組み合わせは、カメラの内部行列を表す。内部行列のサイズは、3×3である。zは、行列又はベクトルであるzの転置を表す。
【0048】
ホモグラフィ行列「H」の全ての要素が定数倍となる変動は許容される。ホモグラフィ行列「H」は、所定の定数λを用いて、式(7)のように表される。
【0049】
【数7】
【0050】
ここで、カメラパラメータ「A」は、3次元空間におけるカメラの位置及び方向に依存しないパラメータである(参考文献2「Z. Zhang, Flexible Camera Calibration by Viewing a Plane from Unknown Orientations, Proc. ICCV 1999, vol. 1, pp. 666-673, 1999」)。例えば、カメラパラメータ「A」は、パン、チルト及びズームのパラメータである。解析部200は、射影変換部203が動き補償を実行する前に、行列生成部202にカメラパラメータを送信する。
【0051】
図3では、3次元空間における位置(ベクトル)は、座標「t=(tx,ty,tz)」を用いて表現される。平面300は、座標tのz座標「tz=0」を示す平面である。カメラの位置C1から平面300への垂線の長さ「h」は、カメラの位置C1の座標tのz座標の絶対値を表す。解析部200は、射影変換部203が動き補償を実行する前に、行列生成部202にカメラの位置C1のz座標の絶対値を送信する。カメラの位置C1から平面300への垂線の方向を表す単位ベクトルnは、常に(0,0,1)である。したがって、式(8)は、3次元ベクトルとなっている。
【0052】
【数8】
【0053】
位置C1から位置C2までカメラが移動した場合について、行列生成部202は、空間回転量「R」と座標「t」とに基づいて、ホモグラフィ行列「H」を導出する。空間回転量「R」にとって必要十分なパラメータの個数は3個である。空間回転量「R」は、式(9)を用いて、式(10)のように表される。
【0054】
【数9】
【0055】
【数10】
【0056】
ここで、θは、x軸方向の回転角を表す。θは、y軸方向の回転角を表す。θは、z軸方向の回転角を表す。座標「t」が3次元ベクトルであることから、座標「t」にとって必要十分なパラメータの個数は3個である。行列生成部202がホモグラフィ行列「H」を導出するためには、空間回転量「R」にとって必要十分なパラメータの個数は3個と、座標「t」にとって必要十分なパラメータの個数は3個との計6個のパラメータがあればよい。
【0057】
行列生成部202は、式(11)に示された6個のパラメータ(θ,θ,θ,t,t,t)を、予め定められたホモグラフィ行列「H」に対する多次元探索処理によって導出する。
【0058】
【数11】
【0059】
行列生成部202は、空間回転量「R」の第1列をR1と、空間回転量「R」の第2列をR2として、空間回転量「R」の第3列を上書きする多次元探索によって、6個のパラメータ「θ,θ,θ,sx,sy,sz」を導出してもよい。
【0060】
【数12】
【0061】
例えば、行列生成部202は、6個のパラメータ(変数)を、式(13)、式(14)及び式(15)に示された各値に基づく6次元探索によって、式(16)のように導出する。
【0062】
【数13】
【0063】
【数14】
【0064】
【数15】
【0065】
【数16】
【0066】
ホモグラフィ行列「H」は、式(17)のように導出される。
【0067】
【数17】
【0068】
なお、行列生成部202は、ホモグラフィ行列「H」が導出されるために必要十分な6個のパラメータを、参考文献2に示された方法によって導出してもよい。
【0069】
図4は、3本の動きベクトルに基づく射影変換の例を示す図である。射影変換部203は、点(x,y)の動きベクトルに基づいて、点(x,y)を点(x’,y’)に変換する。射影変換部203は、点(x,y)の動きベクトルに基づいて、点(x,y)を点(x’,y’)に変換する。射影変換部203は、点(x,y)の動きベクトルに基づいて、点(x,y)を点(x’,y’)に変換する。
【0070】
射影変換部203は、点(x’,y’)と点(x’,y’)と点(x’,y’)とホモグラフィ行列「H」とを用いる射影変換によって、点「(x,y)=(600,0)」を、点「(x’,y’)=(610.1,-4.8346)」に変換する。
【0071】
このように、射影変換部203は、わずか6個のパラメータ(3本の動きベクトル)を用いる射影変換によって、残りの1本の動きベクトルを導出する。すなわち、行列生成部202は、わずか6個のパラメータで、ホモグラフィ行列「H」を生成する。
【0072】
次に、符号化装置1の動作例を説明する。
図5は、符号化装置1の動作例を示すフローチャートである。減算部10は、予測残差信号を生成する(ステップS101)。変換部11は、予測残差信号に対して離散コサイン変換を実行する。量子化部12は、離散コサイン変換の結果を量子化する(ステップS102)。エントロピー符号化部13は、量子化の結果に対してエントロピー符号化を実行する(ステップS103)。
【0073】
逆量子化部14は、量子化の結果を逆量子化する。逆変換部15は、逆量子化の結果に対して逆離散コサイン変換を実行する(ステップS104)。加算部16は、逆離散コサイン変換の結果と予測信号とを加算することによって、復号画像を生成する(ステップS105)。歪除去フィルタ17は、復号画像の歪を除去することによって、歪が除去された復号画像信号を生成する(ステップS106)。
【0074】
歪除去フィルタ17は、復号画像信号をフレームメモリ18に記録する(ステップS107)。フレーム内予測部19は、復号画像信号に対してフレーム内予測処理を実行することによって、フレーム内予測処理の結果に応じた予測信号を生成する。動き補償部20は、復号画像信号に対して動き補償予測処理を実行することによって、動き補償予測処理の結果に応じた予測信号を生成する(ステップS108)。
【0075】
図6は、動き補償部20の動作例を示すフローチャートである。解析部200は、フレームグループを取得する(ステップS201)。解析部200は、フレームグループの各フレームの画像を解析し、解析結果に基づいてカメラパラメータを導出する。解析部200は、カメラパラメータ「A」が不変である期間において撮影されたフレームグループであるか否かを判定する(ステップS202)。
【0076】
カメラパラメータ「A」が不変である期間において撮影されたフレームグループである場合(ステップS202:YES)、解析部200は、第2動き補償モード信号を、行列生成部202と切替部204とに出力する(ステップS203)。
【0077】
解析部200は、カメラパラメータ信号を、行列生成部202に出力する。解析部200は、カメラパラメータ信号を、復号装置等の外部装置(不図示)に出力する(ステップS204)。
【0078】
行列生成部202は、6パラメータ信号を、復号装置等の外部装置(不図示)に対して、フレームごとに出力する。また、行列生成部202は、6パラメータ信号を、復号装置等の外部装置(不図示)に対して、復号画像に定められた射影変換単位(予測単位)ごとに出力する(ステップS205)。
【0079】
行列生成部202は、カメラパラメータ信号と6パラメータ信号とを用いて、ホモグラフィ行列「H」を生成する(ステップS206)。射影変換部203は、フレームメモリ18に記憶された復号画像信号(ローカル復号画像信号)に対して、ホモグラフィ行列「H」を用いる射影変換によって第2モードの動き補償を実行する(ステップS207)。
【0080】
射影変換部203は、第2モードの動き補償に基づく予測信号を、切替部204に出力する。切替部204は、第2モードの動き補償に基づく予測信号を、減算部10に出力する(ステップS208)。
【0081】
射影変換部203は、取得されたフレームグループにおける全てのフレームに対して第2モードの動き補償が実行されたか否かを判定する(ステップS209)。いずれかのフレームに対して第2モードの動き補償が実行されていないと判定された場合(ステップS209:NO)、射影変換部203は、ステップS205に処理を戻す。全てのフレームに対して第2モードの動き補償が実行されたと判定された場合(ステップS209:YES)、行列生成部202及び射影変換部203は、取得されたフレームグループに対する動き補償の処理を終了する。
【0082】
カメラパラメータ「A」が不変でない期間において撮影されたフレームグループ(周知のフレーム間予測処理に適したフレームグループ)である場合(ステップS202:NO)、解析部200は、第1動き補償モード信号を、フレーム間予測部201と切替部204とに出力する(ステップS210)。
【0083】
フレーム間予測部201は、周知の動画像符号化の規格におけるフレーム間予測処理に基づく動き補償を、フレームメモリ18に記憶された復号画像信号(ローカル復号画像信号)に対して実行する(ステップS211)。フレーム間予測部201は、第1モードの動き補償に基づく予測信号を、切替部204に出力する。切替部204は、第1モードの動き補償に基づく予測信号を、減算部10に出力する(ステップS212)。
【0084】
フレーム間予測部201は、取得されたフレームグループにおける全てのフレームに対して第1モードの動き補償が実行されたか否かを判定する(ステップS213)。いずれかのフレームに対して第1モードの動き補償が実行されていないと判定された場合(ステップS213:NO)、フレーム間予測部201は、ステップS211に処理を戻す。全てのフレームに対して第1モードの動き補償が実行されたと判定された場合(ステップS213:YES)、フレーム間予測部201は、取得されたフレームグループに対する動き補償の処理を終了する。
【0085】
以上のように、実施形態の符号化装置1は、解析部200と、行列生成部202と、射影変換部203とを備える。解析部200は、カメラによって動画像の複数のフレーム(フレームグループ)に撮影された物体の画像を解析する。解析部200は、解析結果に基づいて、フレームグループにおいてカメラの内部行列に関するカメラパラメータが同一であるか否かを判定する。解析部200は、カメラの内部行列に関するカメラパラメータが同一である場合、カメラパラメータを所定の装置に出力する。カメラパラメータの変化量が所定範囲内であれば、カメラパラメータが同一であると見なされてもよい。行列生成部202は、カメラパラメータが同一である場合、撮影された物体の画像に定められた3点の移動先を表す6個のパラメータ(3本の動きベクトル)を生成する。行列生成部202は、6個のパラメータに基づいて、ホモグラフィ行列を生成する。行列生成部202は、6個のパラメータを所定の装置に出力する。射影変換部203は、動画像の復号画像(ローカル復号画像信号)に対して、ホモグラフィ行列を用いる射影変換を射影変換単位で実行する。射影変換部203は、射影変換の結果を、第2モードの動き補償に基づく予測信号として切替部204に出力する。
【0086】
このように、実施形態の符号化装置1は、物体の画像の射影変換に基づく動き補償によって、高画質の復号画像を生成可能である少ない符号量の符号化データを生成する。これによって、実施形態の符号化装置1は、画像の符号化効率を向上させることが可能である。実施形態の符号化装置1は、カメラパラメータが不変である期間のフレームグループの動き補償では、予め定められたカメラパラメータと射影変換単位(予測単位)ごとの6パラメータ伝送によって、オーバーヘッドを削減することが可能である。
【0087】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【産業上の利用可能性】
【0088】
本発明は、静止画像又は動画像の可逆符号化若しくは非可逆符号化を実行する符号化装置に適用可能である。
【符号の説明】
【0089】
1…符号化装置、10…減算部、11…変換部、12…量子化部、13…エントロピー符号化部、14…逆量子化部、15…逆変換部、16…加算部、17…歪除去フィルタ、18…フレームメモリ、19…フレーム内予測部、20…動き補償部、21…切替部、200…解析部、201…フレーム間予測部、202…行列生成部、203…射影変換部、204…切替部、300…平面、400…フレーム、401…フレーム、C1…位置、C2…位置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15