特許第6202879号(P6202879)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社朋栄の特許一覧

特許6202879ローリングシャッタ歪み補正と映像安定化処理方法
<>
  • 特許6202879-ローリングシャッタ歪み補正と映像安定化処理方法 図000056
  • 特許6202879-ローリングシャッタ歪み補正と映像安定化処理方法 図000057
  • 特許6202879-ローリングシャッタ歪み補正と映像安定化処理方法 図000058
  • 特許6202879-ローリングシャッタ歪み補正と映像安定化処理方法 図000059
  • 特許6202879-ローリングシャッタ歪み補正と映像安定化処理方法 図000060
  • 特許6202879-ローリングシャッタ歪み補正と映像安定化処理方法 図000061
  • 特許6202879-ローリングシャッタ歪み補正と映像安定化処理方法 図000062
  • 特許6202879-ローリングシャッタ歪み補正と映像安定化処理方法 図000063
  • 特許6202879-ローリングシャッタ歪み補正と映像安定化処理方法 図000064
  • 特許6202879-ローリングシャッタ歪み補正と映像安定化処理方法 図000065
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6202879
(24)【登録日】2017年9月8日
(45)【発行日】2017年9月27日
(54)【発明の名称】ローリングシャッタ歪み補正と映像安定化処理方法
(51)【国際特許分類】
   H04N 5/232 20060101AFI20170914BHJP
   G06T 3/00 20060101ALI20170914BHJP
【FI】
   H04N5/232 290
   G06T3/00
【請求項の数】14
【全頁数】23
(21)【出願番号】特願2013-105996(P2013-105996)
(22)【出願日】2013年5月20日
(65)【公開番号】特開2014-229971(P2014-229971A)
(43)【公開日】2014年12月8日
【審査請求日】2016年5月16日
(73)【特許権者】
【識別番号】391040320
【氏名又は名称】株式会社朋栄
(74)【代理人】
【識別番号】100148851
【弁理士】
【氏名又は名称】鎌田 和弘
(72)【発明者】
【氏名】松永 力
【審査官】 高野 美帆子
(56)【参考文献】
【文献】 特開2010−193302(JP,A)
【文献】 米国特許出願公開第2012/0154579(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/222−5/257
G06T 3/00
(57)【特許請求の範囲】
【請求項1】
CMOSセンサから取得された映像に対して、ローリングシャッタに起因する動き歪み変形を隣接する2画像間の2次元4パラメータアフィン変換し、その変換行列を勾配拘束条件を用いた領域ベースの直接法により推定した後、解析的に分解することにより並進パラメータを計算し、
移動カメラの場合には、推定した前記並進パラメータの時系列変化に対して、レベル適応を加味した巡回型フィルタにより揺れ成分を除去する
ことを特徴とする映像安定化処理方法。
【請求項2】
請求項1に記載の映像安定化処理方法において、
前記2画像間の2次元4パラメータアフィン変換は、2画素間の濃淡値の勾配情報を用いて直接的な計算により算出する
ことを特徴とする映像安定化処理方法。
【請求項3】
請求項1または請求項2に記載の映像安定化処理方法において、
前記変換行列を勾配拘束条件を用いた領域ベースの直接法により推定した後の解析的な分解は、
線形解法を用いた反復更新により最適化したアフィン変換行列の解析的な分解である
ことを特徴とする映像安定化処理方法。
【請求項4】
請求項3に記載の映像安定化処理方法において、
前記線形解法を用いた反復更新による最適化は、最小二乗法を用いる演算処理である
ことを特徴とする映像安定化処理方法。
【請求項5】
請求項1乃至請求項4のいずれか一項に記載の映像安定化処理方法において、
CMOSセンサから取得された映像における動き歪み変形と、揺れの補正と、を同時に行うこと
ことを特徴とする映像安定化処理方法。
【請求項6】
請求項1乃至請求項5のいずれか一項に記載の映像安定化処理方法において、
前記変換行列を勾配拘束条件を用いた領域ベースの直接法により推定する場合に、画像特徴や対応付けを用いない
ことを特徴とする映像安定化処理方法。
【請求項7】
請求項1乃至請求項6のいずれか一項に記載の映像安定化処理方法において、
カメラの移動に伴う視野映像の移動を保持したまま、映像中の揺れのみを補正する
ことを特徴とする映像安定化処理方法。
【請求項8】
請求項1乃至請求項7のいずれか一項に記載の映像安定化処理方法をコンピュータに実行させるためのプログラム。
【請求項9】
請求項8に記載のプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
【請求項10】
請求項1乃至請求項7のいずれか一項に記載の映像安定化処理方法を実行するビデオスタビライザー。
【請求項11】
請求項10に記載のビデオスタビライザーであって、
低域通過フィルタとして前記巡回型フィルタを用いて、現在と過去のデータのみを用いることにより、余分なフレーム遅延を発生させず、リアルタイムで処理を実行する
ことを特徴とするビデオスタビライザー。
【請求項12】
請求項1乃至請求項7のいずれか一項に記載の映像安定化処理方法において、
前記2次元4パラメータアフィン変換は、前記ローリングシャッタに起因する動き歪み変形を、画像の2次元幾何学変換としてモデル化したものである
ことを特徴とする映像安定化処理方法。
【請求項13】
請求項1乃至請求項7のいずれか一項に記載の映像安定化処理方法において、
前記変換行列を前記勾配拘束条件を用いた前記領域ベースの直接法による推定においては、画像中の特徴点の抽出処理及び抽出した前記特徴点の前記2画像間における対応付け処理を、遂行しない
ことを特徴とする映像安定化処理方法。
【請求項14】
請求項1乃至請求項7のいずれか一項に記載の映像安定化処理方法において、
前記巡回型フィルタによる前記揺れ成分の除去においては、ブレによる不要な動きとカメラの有意な動きとを分離する
ことを特徴とする映像安定化処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、CMOSセンサを用いたカメラにより撮影された映像における動き歪み変形の補正(ローリングシャッタ歪み補正)と、揺れの補正を同時に行う映像安定化処理に関する。
【背景技術】
【0002】
映像の動きを推定する方法は古くから研究されており、当該方法は、特徴ベースによる方法と、領域ベースによる方法に大別される。特徴ベースによる方法は、コーナー点や直線等の画像特徴を検出し、それらを画像(フレーム)間で対応付けることにより画像の動きを推定するが、エッジ等の特徴抽出処理及びそれらのフレーム間対応付け処理には、比較的多くの処理時間とコストが掛かる。
【0003】
このように、特徴ベースによる方法は、特徴抽出処理やその後の対応付け処理にコストを要することから、領域ベースによる方法を用いた揺れ安定化装置の開発や製品化も鋭意なされている。しかし、いずれもCCDセンサにより取得されたカメラ映像を対象としており、CMOSセンサによる動き歪み変形には対応しておらず、当該CMOSの揺れ映像の安定化はできない。
【0004】
また、従来、カメラの意図的な動き(例えばパン)と、意図しない揺れ(ぶれ)による動きとを、取得された映像段階において判別することができないことから、移動カメラによる取得映像から、画像処理により不要な揺れ(ぶれ)のみを除去することは、十分にはできなかった。
【0005】
下記特許文献1には、CMOSセンサからの映像データ読み出し方法において、ある走査線の読み込み中に次の走査線の読み込みを開始する複数走査線の同時読み出し等の工夫をすることにより、歪みを軽減する撮像方式が開示されている。
【0006】
また、下記特許文献2では、映像処理による歪み補正を行う方法が開示されているが、画像特徴点を用いる方法であり、映像の揺れによる平行移動成分と歪み成分の両者を別々に推定する技術思想が開示されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2011−142592号公報
【特許文献2】特開2013−017155号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
従来、特徴ベースによる映像の動きを推定する方法も領域ベースによる映像の動きを推定する方法も、CMOSセンサによる動き歪み変形の補正には対応しておらず、揺れ映像の安定化はできなかった。例えば、ラスタスキャン時のスキャン速度よりも速く画面内の被写体が移動する状況等においては、被写体の形状が歪むように映像取得(動き歪み)されることが知られているところ、これに対する有効な補正方法はなかった。
【0009】
また、従来、カメラの意図的な動き(例えばパン)と意図しない揺れ(ぶれ)による動きとを、取得された映像段階において判別することができないことから、移動カメラによる取得映像から不要な揺れのみを除去することは、十分にはできなかった。
【課題を解決するための手段】
【0010】
本発明においては、CMOSセンサを用いたカメラにより撮影された映像における動き歪み変形と揺れの補正を同時に行うことが可能なように、ローリングシャッタに起因する動き歪み変形を、隣接する2画像間(2フレーム間)の2次元4パラメータアフィン変換により記述する。そして、その変換行列を最適に推定した後、解析的に分解することにより並進パラメータを計算する。
【0011】
この場合に、何らの画像特徴や対応付けを用いることなく(すなわち従来の特徴ベースによる方法を用いることなく)、勾配拘束条件を用いた領域ベースの直接法により推定するものとする。移動カメラの場合には、推定した並進パラメータの時系列変化に対して、巡回型フィルタにレベル適応を加味した巡回型フィルタにより揺れ成分を除去して、カメラの移動(すなわちパン等による視野映像の移動)を保持したまま、映像中の揺れ(ぶれ)のみを補正するものとする。
【0012】
従って、本発明の映像安定化処理方法は、CMOSセンサから取得された映像に対して、ローリングシャッタに起因する動き歪み変形を隣接する2画像間の2次元4パラメータアフィン変換し、その変換行列を勾配拘束条件を用いた領域ベースの直接法により推定した後、解析的に分解することにより並進パラメータを計算することを特徴とする。
【0013】
また、本発明の映像安定化処理方法は、好ましくは移動カメラの場合には、推定した並進パラメータの時系列変化に対して、レベル適応を加味した巡回型フィルタにより揺れ成分を除去することを特徴とする。
【0014】
また、本発明の映像安定化処理方法は、さらに好ましくは変換行列を勾配拘束条件を用いた領域ベースの直接法により推定した後の解析的な分解が、線形解法を用いた反復更新により最適化したアフィン変換行列の解析的な分解であることを特徴とする。
【0015】
また、本発明の映像安定化処理方法は、さらに好ましくは線形解法を用いた反復更新による最適化が、最小二乗法を用いる演算処理であることを特徴とする。
【0016】
また、本発明の映像安定化処理方法は、さらに好ましくはCMOSセンサから取得された映像における動き歪み変形と、揺れの補正と、を同時に行うことを特徴とする。
【0017】
また、本発明の映像安定化処理方法は、さらに好ましくは変換行列を勾配拘束条件を用いた領域ベースの直接法により推定する場合に、画像特徴や対応付けを用いないことを特徴とする。
【0018】
また、本発明の映像安定化処理方法は、さらに好ましくはカメラの移動に伴う視野映像の移動を保持したまま、映像中の揺れのみを補正することを特徴とする。
【0019】
また、本発明のプログラムは、上述のいずれかに記載の映像安定化処理方法をコンピュータに実行させるためのプログラムであることを特徴とする。
【0020】
また、本発明の記憶媒体は、上述のプログラムを記憶したコンピュータが読み取り可能な記憶媒体であることを特徴とする。
【0021】
また、本発明のビデオスタビライザーは、上述のいずれかに記載の映像安定化処理方法を実行するビデオスタビライザーであることを特徴とする。
【発明の効果】
【0022】
本発明により、CMOSセンサを用いた撮像装置により撮影された映像における動き歪み変形と揺れの補正とが同時に処理可能となる。また、カメラのパン等移動カメラにおける揺れを含む映像の場合、カメラの移動を保持したまま、映像中の揺れのみを補正することが可能となる。また、移動カメラから固定カメラヘ遷移する場合、あるいはその逆の場合にも、動き歪み変形と揺れに対して同時にかつ忠実に補正処理対応することが可能となる。
【図面の簡単な説明】
【0023】
図1】固定カメラの場合の、CMOSカメラ映像の動き歪み補正および安定化処理(ぶれ補正処理)を説明するブロック図である。
図2】移動カメラの場合の、CMOSカメラ映像の動き歪み補正および安定化処理(ぶれ補正処理)を説明するブロック図である。
図3】CMOSカメラの順次露光(ラスタスキャン)による動き歪みを説明する図であり、縦線が画像の右方向へ移動する場合(カメラを左にパンした場合)とその結果得られる歪み画像(上段)を説明し、円が画像の下方向へ移動する場合(カメラが上にパン(ティルトともいう)した場合)とその結果得られる歪み画像(下段)を説明する図である。
図4】CMOSカメラの動き歪みを説明する図である。
図5】シミュレーションにより生成したカメラの動きの方向による格子画像のCMOS動き歪み画像であり、(a)がカメラ動きなしの場合を説明し、(b)がカメラが左を向くと画像は右に変形する場合を説明し、(c)がカメラが右を向くと画像は左に変形する場合を説明し、(d)がカメラが上を向くと画像は伸びる場合を説明し、(e)がカメラが下を向くと画像は縮む場合を説明している。
図6図5の格子画像を歪み変形させたシミュレーション画像において、カメラの動きなしの画像を基準画像として、4パラメータアフィン変換行列を計算して歪み補正した結果を説明する図であり、(a)は基準画像(カメラ動きなし)を説明する図であり、(b)〜(e)は、図5のカメラの動きによる各動き歪み画像(b)〜(e)の補正結果を説明する図であるが、画像境界は歪み変形の補正が分かりやすいように黒のままとしている。
図7】(a)は、水平および垂直方向にそれぞれ平均0、標準偏差5および3画素の正規乱数による並進パラメータを用いて生成した並進歪み画像列の加算平均画像を示す図であり(30フレーム)、(b)は、第1フレームを基準画像として、第2フレーム以降、順次隣接する2画像間の並進パラメータを推定した結果を用いて歪み補正および安定化処理を行った処理結果の画像列の加算平均画像を示す図であり、歪み変形と揺れにより輪郭が重なって見える処理前(a)の加算平均画像に対して、処理後(b)の加算平均画像は明瞭に見えるところ、画像境界付近の黒味は補正処理による見切れのためであり、(c)は、歪み画像列の生成に用いた並進パラメータの軌跡を説明する図である。
図8】ディジタルカメラ(キヤノンIXY DIGITAL500(登録商標))で撮影した2592×1944画素の画像に対して、並進パラメータを与えて、その一部分を切り出して生成した並進歪み画像列の一部を説明する図であり、水平および垂直方向の基準となる並進パラメータ(tx,ty)=(15,3)に対して、それぞれ平均0、標準偏差1画素の正規乱数を加えた並進パラメータを用いて画像サイズが640×480画素の並進歪み画像列を生成した結果を示しており、左から右の順に、カメラが左上方へパンアップしている等速直線運動する移動カメラによる映像と見なすことができ、上段は、そのようにして生成した原画像列であり、中段は、固定カメラとして補正した結果の画像列であり、下段は移動カメラとして補正した結果の画像列を説明する図である。
図9】移動カメラによる並進歪み画像列から推定した隣接2画像間の並進パラメータの時系列変化のグラフを説明する図であり、上段が水平方向、下段が垂直方向を示している。
図10】実施例における階層動き推定処理を説明するブロック図である。
【発明を実施するための形態】
【0024】
本発明においては、CMOSセンサを用いたカメラにより撮影された映像における動き歪み変形と揺れの補正とを同時に行うことが可能なように、ローリングシャッタに起因する動き歪み変形を隣接する2画像間の2次元4パラメータアフィン変換により記述する。そして、その変換行列を最適に推定した後、解析的に分解することにより並進パラメータを計算する。
【0025】
この場合に、何らの画像特徴や対応付けを用いることなく、勾配拘束条件を用いた領域ベースの直接法により推定するものとする。移動カメラの場合には、推定した並進パラメータの時系列変化に対して、巡回型フィルタにレベル適応を加味した巡回型フィルタにより揺れ成分を除去して、カメラの移動(すなわち視野映像の移動)を保持したまま、映像中の揺れ(すなわち「ぶれ」)のみを補正するものとする。
【0026】
上述のように本発明においては、CMOSセンサを用いたカメラにより撮影された映像における動き歪み変形と揺れの補正とを同時に可能となるように、移動カメラの場合には、推定した並進パラメータの時系列変化に対して、巡回型フィルタにレベル適応を加味したフィルタにより揺れ成分を除去して、カメラの移動を保持したまま、映像中の揺れのみを補正する。また、レベル適応によるフィルタ処理のため、移動カメラから固定カメラヘの遷移、あるいはその逆の場合にも忠実に補正処理対応することが可能となる。
【0027】
このため、CMOSセンサのローリングシャッタ(順次露光)機構による動き歪みを2次元アフィン変換としてモデル化して、その変換行列を勾配拘束条件に基づき推定し、推定した変換行列を解析的に分解することにより動き歪みをなす並進パラメータを計算し、さらに推定した並進パラメータの時系列変化に対して、レベル適応処理を加味した巡回型フィルタ処理を施すものとする。
【0028】
本発明の方法は、ベースバンドビデオ信号を処理するハードウェア装置により実現することも可能であるし、MXFファイルを処理するソフトウェアおよびそれを実行するコンピュータをベースとした装置により実現することも可能である。また、MXFファイルをベースバンドビデオ信号に変換あるいは逆変換する装置を用いれば、その他の多様な構成による実現が可能である。
【0029】
図1は、固定カメラの場合の、CMOSカメラ映像の動き歪み補正および安定化処理を説明するブロック図である。図1において、動き推定(Motion Estimation)により2画像


の間の4パラメータアフィン変換行列を推定して、それを分解した並進パラメータ


により歪み補正(Distortion Correction)する。
【0030】
並進パラメータを累積加算した


によって、歪み補正の結果を揺れ補正(Motion Stabilization)する。すなわち、


である。ここで、Z−1は、1フレーム遅延を表す。
【0031】
移動カメラの場合は、



を累積加算したものではなく、


を直接に低域通過フィルタ(LPF)によって平滑化した


により歪み補正の結果を図2に示すように、揺れ補正(Motion Stabilization)する。図2は、移動カメラの場合の、CMOSカメラ映像の動き歪み補正および安定化処理を説明するブロック図である。
【0032】
平滑化した並進パラメータを用いれば、パン等の移動するカメラにおいても、揺れ補正が可能となる。低域通過フィルタとして巡回型フィルタを用いると、現在と過去のデータしか使わないので余分なフレーム遅延が発生せず、処理全体の遅延量の観点から優位である。
【0033】
また、2画像間の動き歪みをなす並進パラメータの推定結果の時系列に施す巡回型フィルタに信号のレベル差に応じた重み係数を導入する。1次バタワース巡回フィルタの場合、水平方向の並進パラメータ


は、次の[数1]ように計算される(垂直方向の並進パラメータに関しては、


とすればよい)。
【0034】
【数1】
ここで、

【0035】
また、


は、信号のレベル差の許容範囲を調整するパラメータであり、α,α,βは、1次バタワース巡回型フィルタ係数であり、以下に示す[数2]のように計算される。
【0036】
【数2】
【0037】
ここで、


は、サンプリング周期であり、


は、ディジタルカットオフ角周波数である。
【0038】
すなわち、本発明においては、揺れと歪みとを同時に補正することが可能であり、動きを推定するのに特徴点の抽出や対応付けを行わず、移動するカメラから不要な揺れのみを補正する、ことに特徴があり、特に、移動カメラに対応するためのレベル適応フィルタに大きな特徴を有する。
【0039】
単なる巡回型フィルタであれば、カメラが動いている状態から静止する状態へ変化する場合の変化点、あるいはその逆に静止している状態から動いている状態へ変化する場合の変化点が鈍るので、正しい補正処理が行われないが、本発明で説明する上述のレベル適応フィルタを用いると、動き/静止の状態変化に対して忠実な補正が可能となる。
【0040】
(対応点を用いないローリングシャッタ歪み補正と映像安定化)
近年、低価格な携帯電話カメラからハイエンドのディジタル一眼レフカメラ(Digital Single Lens Reflex camera、DSLR)まで、CMOSセンサが広範に使われてきている。CMOSセンサは、低価格化、低消費電力化、大判化が可能であるが、従来のCCDセンサと大きく異なる点は、ローリングシャッタと呼ばれる順次露光機構を用いて画素データを取得することにあり、これに起因する動き歪み変形が生じる点である。
【0041】
本発明は、ローリングシャッタ機構によるCMOSカメラ映像におけるスタビライザ処理を行う。このとき、何らの画像特徴や対応付けを用いない。隣接する2画像間のグローバル動きを2次元アフィン変換により記述し、その推定には、非線形最適化を行わずに線形解法を用いる。線形解法の反復により最適化したアフィン変換行列を解析的に分解することにより並進パラメータを計算する。画像シミュレーション実験を行い、固定カメラ、移動カメラいずれの映像に含まれる動き歪み変形を補正するとともに揺れを除去して安定化する。移動カメラの場合には、推定した並進パラメータの時系列変化に対して、巡回型フィルタ処理により揺れ成分を除去して、カメラの移動を保持したまま、映像中の揺れのみを補正する。移動カメラから固定カメラへ遷移する際にも、変化に忠実な安定化処理を実現する。
【0042】
(CMOS動き歪みモデル)
CMOSセンサはCCDセンサとは異なるシャッタ機構を持つ。CCDセンサではすべての画素が同時に露光されるが、CMOSセンサの場合、小型、低価格を達成するためにライン走査による順次露光を用いている。したがって、カメラの動きが走査時間に比較して非常に大きい場合、CMOSセンサの最初と最後のラインの時間差のために、CMOSカメラ映像はカメラの動きの方向と種類によって歪む。図3はそのようなローリングシャッタ機構において、どのように走査時間の間にシーン中の物体が動くのかを示している。図3は、CMOSカメラの順次露光による動き歪みを説明する図であり、縦線が画像の右方向へ移動する場合(カメラを左にパンした場合)とその結果得られる歪み画像(上段)を説明し、円が画像の下方向へ移動する場合(カメラが上にパン(ティルトともいう)した場合)とその結果得られる歪み画像(下段)を説明する図である。
【0043】
ここで、画像縦横サイズがV×HのCMOSカメラが動くと、撮影されたシーン中の物体の特徴点xは1フレーム期間中に画像の動きuによって動くとする。並進動きを仮定すると、

【数3】

であり、その速度vは1フレーム時間Tfで割ることによって得られる。

【数4】
【0044】
t=0で画面左上の画像原点から走査開始する画像Iにおいて、特徴点xnが1フレーム期間にunで動くとすると、画素位置xdn=(xdn,ydn)までの経過時間は、

【数5】

であり、CMOS歪み位置xdnは、歪みのない場合の位置xnに動き歪みによる変動項を加えた次のようなCMOS動き歪みモデルを満たす。
【0045】

【数6】

【数7】

と近似すると、

【数8】


[数8]から、ydnについて解くと、
【0046】

【数9】

【数10】

したがって、(xn,yn)と(xdn,ydn)の間の並進動きによる歪み変換は次のようになる。
【0047】

【数11】

これを、

【数12】

と書くと、

【数13】

だから、並進歪みによる隣接する2画像I、In+1の間の関係は次のようになる(図4)。図4は、CMOSカメラの動き歪みを説明する図である。
【0048】

【数14】

ここで、

【数15】

変換行列An,n+1を要素で書くと、

【数16】

であり、これを

【数17】


と置いて、行列の各要素を等値する。txn、tyn、txn+1、tyn+1について解くと、次のようになる。
【0049】
【数18】

【数19】

【数20】

【数21】
【0050】
また、図5は、シミュレーションにより生成したカメラの動きの方向による格子画像のCMOS動き歪み画像であり、(a)がカメラ動きなしの場合を説明し、(b)がカメラが左を向くと画像は右に変形する場合を説明し、(c)がカメラが右を向くと画像は左に変形する場合を説明し、(d)がカメラが上を向くと画像は伸びる場合を説明し、(e)がカメラが下を向くと画像は縮む場合を説明している。
【0051】
(2次元アフィン変換によるCMOS動き推定)
並進動きによる歪み変形を表す変換行列An,n+1は2次元アフィン変換であるが、その自由度(未知パラメータの個数)は4である。そこで、これを4パラメータアフィン変換と呼ぶことにする。したがって、CMOS動き推定は4パラメータアフィン変換を計算することに帰着する。4パラメータアフィン変換行列を計算する方法を以下に示す。
【0052】
[数14]より、第1画像IをAn,n+1により4パラメータアフィン変換すると、第2画像In+1に重なるから、重なり部分では次の関係が成り立つ。

【数22】
【0053】
[数22]の右辺をテイラー展開により1次近似すると、

【数23】

であり、a=(a2,a3,a5,a6)を求めるためには、次の目的関数Jを最小化する。以降、xdn→x、ydn→yと略記する。
【0054】
【数24】

ここで、

【数25】

である。Σは2画像の重複した領域中のすべての画素に渡る和を表す。[数24]は勾配拘束条件の最小二乗推定である。各パラメータでJを微分すると次のようになる。
【0055】
【数26】

したがって、次のような連立方程式を解けばよい。
【0056】
【数27】

そのようにして計算したa2、a3、a5、a6から、[数18]〜[数21]により、並進パラメータtxn、tyn、txn+1、tyn+1を計算する。
【0057】
そのようにして得られたtxn、tyn、txn+1、tyn+1を初期値として、例えば、ガウス・ニュートン法により最適化してもよいが、4パラメータアフィン変換行列An,n+1は並進パラメータに関しては線形ではないので、直接最適化するのは煩雑になる。そこで、An,n+1を反復更新により最適に推定した結果を分解する。上記の最小二乗法を反復により最適化する手順は次のようになる。
【0058】
ステップ1、初期値を与えて第1画像の変換画像を生成して、J←∞(十分大きい値)とする。
ステップ2、第2画像と変換された第1画像で、[数25]による画素毎の時空間勾配Ix、Iy、Itを計算する。
ステップ3、次の連立方程式を解く。
【0059】
【数28】

ステップ4、a2、a3、a5、a6を次のように更新する。
【0060】
【数29】

ステップ5、更新されたパラメータaによる第1画像の変換画像を生成して、残差J’=J(a)を計算する。J’<=Jかつ|J-J’|<ε(微小しきい値)ならaを返して終了する。そうでなければ、J←J’としてステップ2に戻る。
【0061】
実際には、ガウシアンフィルタを掛けて間引くことにより階層画像を生成して、最も低解像度の画像間で推定したパラメータをより高解像度の画像間における動き推定処理に伝播させる階層動き推定処理を行う。
【0062】
図10は、実施例における階層動き推定処理を説明するブロック図である。図10に示すように、隣接する動き歪み2画像「I」と「In+1」を入力する。それぞれにガウシアンフィルタGσを掛けて画像サイズを1/2に間引く(↓2)。間引き処理を繰り返し行い画像サイズを1/4まで縮小する。原画像サイズをLevel0とすると、1/2画像サイズをLevel1、1/4画像サイズをLevel2と呼ぶ。
【0063】
4パラメータアフィン変換行列パラメータの初期値a(0)を与えて、1/4画像サイズのIを4パラメータアフィン変換による補正処理(W)を行う。そして、1/4画像サイズのIn+1との間で、4パラメータアフィン変換行列を推定する(M)。その推定結果をa(0)に加えた結果をa(1)として、次の1/2画像サイズによるLevel1処理に用いる。
【0064】
4パラメータアフィン変換行列パラメータの初期値a(0)は、1/4画像サイズのI、In+1において、例えばブロックマッチングによる並進パラメータとすればよい。その場合のa(0)=(a2、a3、a5、a6)=(0、tx(0)、0、ty(0))である。ここで、(tx(0)、ty(0))がブロックマッチングによる並進パラメータである。
【0065】
1/4画像サイズによるLevel2処理同様に、1/2画像サイズによるLevel1処理は、4パラメータアフィン変換行列パラメータa(1)による1/2画像サイズのIを4パラメータアフィン変換による補正処理(W)を行う。そして、1/2画像サイズのIn+1との間で、4パラメータアフィン変換行列を推定する(M)。その推定結果をa(1)に加えた結果をa(2)として、次の原画像サイズによるLevel0処理に用いる。
【0066】
1/2画像サイズによるLevel1処理同様に、原画像サイズによるLevel0処理は、4パラメータアフィン変換行列パラメータa(2)による原画像サイズのIを4パラメータアフィン変換による補正処理(W)を行う。そして、原画像サイズのIn+1との間で、4パラメータアフィン変換行列を推定する(M)。その推定結果をa(2)に加えた結果のa(3)が最終的な4パラメータアフィン変換行列の推定結果であり、その結果の4パラメータアフィン変換行列を分解して並進パラメータを計算する。得られた並進パラメータに対して時系列処理を行い、その結果の並進パラメータにより再び合成した4パラメータアフィン変換行列により最終的に原画像サイズのIn+1を補正して出力する。
【0067】
(CMOS動き歪み補正と安定化処理)
上述のように図1は、固定カメラの場合のCMOSカメラ映像の動き歪み補正および安定化処理を説明するブロック図である。図1において、動き推定(Motion Estimation)により2画像I、In+1の間の4パラメータアフィン変換行列を推定して、それを分解した並進パラメータtn=(txn,tyn)により歪み補正(Distortion Correction)する。並進パラメータを累積加算したτn=(τxn,τyn)によって、歪み補正の結果を揺れ補正(Motion Stabilization)する。すなわち、
【0068】

【数30】

である。Z−1は1フレーム遅延を表す。
【0069】
移動カメラの場合は、tnを累積加算したものではなく、tnを低域通過フィルタ(LPF)によって平滑化したτnにより歪み補正の結果を揺れ補正(Motion Stabilization)する(図2)。上述した図2において、平滑化した並進パラメータを用いれば、パン等の移動するカメラにおいても、揺れ補正が可能となる。低域通過フィルタとして巡回型フィルタを用いると、現在と過去のデータしか使わないので余分なフレーム遅延が発生せず、処理全体の遅延量の観点から優位である。1次バタワース巡回型フィルタの場合、その出力は次のように計算される。
【0070】
【数31】

【数32】
【0071】
ここで、ωacは双一次変換によってプリウォーピング(prewarping)されたアナログカットオフ角周波数であり、ディジタルカットオフ角周波数をωc=2πfcとすると、次のようになる。
【0072】
【数33】

Tsはサンプリング周期であり、fsをサンプリング周波数とするとTs=1/fsである。
【0073】
[数31]は、水平方向も垂直方向もベクトルとしてまとめて書いている。カットオフ周波数が同じであれば、フィルタ係数も同じであるが、それぞれ異なるカットオフ周波数としても構わない。
【0074】
しかし、移動カメラから固定カメラへ遷移する場合、巡回型フィルタは平滑化作用を強めるほど、減衰により変化点が鈍る。これは、移動カメラが静止したにも関わらず、しばらくの間、移動カメラとして安定化処理がなされることを意味する。あるいはその逆に固定カメラから移動カメラへ遷移する場合も同様である。
【0075】
そこで、変化点がフィルタ処理の減衰により鈍らないように、巡回型フィルタに信号のレベル差に応じた重み係数を導入する。1次バタワース巡回フィルタの場合、水平方向の並進パラメータτxnは次のように計算される。
【0076】
【数34】

ここで、

【数35】

【数36】


【数37】

σrは信号のレベル差の許容範囲を調整するためのパラメータである。垂直方向の並進パラメータに関しては、τx→τy、tx→tyとして計算すればよい。
【0077】
実際には、固定カメラの場合も移動カメラの場合も歪み補正と揺れ補正はそれぞれの並パラメータtn、τnを再び合成した4パラメータアフィン変換によりまとめて行う。変換によるサブピクセル精度の画素座標における画素値は、近傍画素による内挿補間により計算する。
【0078】
(画像シミュレーション実験)
【0079】
(1)人工画像シミュレーション実験
図6は、図5の格子画像を歪み変形させたシミュレーション画像において、カメラの動きなしの画像を基準画像として、4パラメータアフィン変換行列を計算して歪み補正した結果を説明する図である。図6に示すCMOS動き歪み補正画像において、(a)は基準画像(カメラ動きなし)を説明する図であり、(b)〜(e)は図5のカメラの動きによる動き歪み画像(b)〜(e)の補正結果を説明する図であり、画像境界は歪み変形の補正が分かりやすいように黒のままとしている。
図6から、水平および垂直方向いずれの動きによる歪み変形も補正できていることがわかる。
【0080】
(2)実画像列シミュレーション実験(固定カメラの場合)
ディジタルカメラ(ニコンD40(登録商標))で撮影した3008×2000画素の画像に対して、並進パラメータを与えて、その一部分を切り出して、並進歪み画像を生成する。水平および垂直方向にそれぞれ平均0、標準偏差5および3画素の正規乱数による並進パラメータを用いて並進歪み画像列を生成する。生成した画像サイズは640×480画素である。これは、固定カメラによる定点監視映像と見なすことができる。
【0081】
図7(a)はそのようにして生成した並進歪み画像列の加算平均画像を示す図である(30フレーム)。第1フレームを基準画像として、第2フレーム以降、順次隣接する2画像間の並進パラメータを推定した結果を用いて歪み補正および安定化処理を行った。図7(b)は処理結果の画像列の加算平均画像を示す図である。歪み変形と揺れにより輪郭が重なって見える処理前の加算平均画像に対して、処理後の加算平均画像は明瞭に見える。画像境界付近の黒味は補正処理による見切れのためである。図7(c)は歪み画像列の生成に用いた並進パラメータの軌跡を説明する図である。
【0082】
補正結果の隣接2画像間の二乗誤差画像のピークSN比により定量的に評価する。ピークSN比PSNRは二乗誤差画像の平均輝度値(平均ノイズ電力)MSEおよび最大輝度値(最大信号電力)I2maxから次のように求められる。実験では、Imaxを8ビット最大画素値255とした。
【0083】
【数38】
【0084】
(3)実画像列シミュレーション実験(移動カメラの場合)
図8は、ディジタルカメラ(キヤノンIXY DIGITAL500(登録商標))で撮影した2592×1944画素の画像に対して、並進パラメータを与えて、その一部分を切り出して生成した並進歪み画像列の一部である。水平および垂直方向の基準となる並進パラメータ(tx,ty)=(15,3)に対して、それぞれ平均0、標準偏差1画素の正規乱数を加えた並進パラメータを用いて並進歪み画像列を生成する。生成した画像サイズは640×480画素である。図8において、画像は左から右の順に、カメラが左上方へパンアップしている等速直線運動する移動カメラによる映像と見なすことができる。図8上段は、そのようにして生成した原画像列であり、中段は、固定カメラとして補正した結果の画像列、下段は移動カメラとして補正した結果の画像列である。
【0085】
固定カメラとして行った歪み補正および安定化処理の結果は、第1フレームを基準として完全に安定しているが、入力が移動カメラによる画像列のため、基準フレームから大きく移動すると、次第に見切れる領域が大きくなっていく。
【0086】
一方、移動カメラとして行った歪み補正および安定化処理の結果は、カメラの移動に伴い、補正処理が追従しているのがわかる。ここでは、不要な揺れ成分を除去して、カメラの軌跡を滑らかにするために、隣接2画像間において推定した並進パラメータの時系列変化に対して1次バタワース巡回型レベル適応フィルタ処理を行い、その結果の並進パラメータを用いて各フレームを補正した。1次バタワース巡回型レベル適応フィルタにおけるカットオフ周波数は水平および垂直方向いずれも0.01Hz、σr2をそれぞれ、20、3とした。
【0087】
図9は、移動カメラによる並進歪み画像列から推定した隣接2画像間の並進パラメータの時系列変化のグラフを説明する図であり、上段が水平方向、下段が垂直方向を示している。図9において、並進パラメータの時系列変化(Original)を1次バタワース巡回型低域通過フィルタ(fc=1Hz)により平滑化した並進パラメータ(IIR)、1次バタワース巡回型レベル適応フィルタ(fc=0.01Hz、σr2 を水平および垂直方向でそれぞれ20、3)により平滑化した並進パラメータ(IIRbilateral)。1次バタワース巡回型レベル適応フィルタにより揺れ成分である高周波成分が除去されて並進パラメータが滑らかになっているのがわかる。
【0088】
さらに、並進パラメータを(tx,ty)=(0,0)として、同様に正規乱数を加えて引き続き並進歪み画像列を生成する。すなわち、カメラが移動した後、静止して固定カメラになる場合である。図9の30フレーム目の移動カメラから固定カメラへの変化点において、カットオフ周波数が1Hzの1次バタワース巡回型フィルタにより平滑化した並進パラメータは、平滑化作用による減衰のためカメラが静止したフレームを越えても、すぐには0にはならない。
【0089】
一方、1次バタワース巡回型フィルタによる平滑化の結果は、移動カメラにおける揺れ成分を除去しつつ、変化点も保持しており、カメラが静止した後もほぼ0に近い平滑結果が得られている。簡易なしきい値処理で十分に固定カメラであることを判別可能である。平滑化した並進パラメータの絶対値があるしきい値以下の場合、固定カメラであると判定して、安定化処理のための補正には、平滑化した並進パラメータではなく、そのフレームから並進パラメータを累積加算した結果を用いればよい。
【0090】
(まとめ)
本発明では、CMOSセンサを用いたカメラにより撮影された映像における動き歪み変形と揺れの補正を同時に行うために、ローリングシャッタに起因する動き歪み変形を隣接する画像間のグローバルな2次元4パラメータアフィン変換により記述して、その変換行列を最適に推定した後、解析的に分解することにより並進パラメータを計算した。このとき、何らの画像特徴や対応付けを用いることなく、画素を直接的に処理することにより推定を行った。
【0091】
画像シミュレーション実験を行い、固定カメラ、移動カメラいずれの映像に含まれる動き歪み変形を補正するとともに揺れを除去して安定化した。移動カメラの場合には、推定した並進パラメータの時系列変化に対して、巡回型レベル適応フィルタ処理により揺れ成分を除去して、カメラの移動を保持したまま、映像中の揺れのみを補正した。移動カメラから固定カメラへ遷移する際にも、変化に忠実な安定化処理を実現した。
【0092】
(補足説明)
カメラ映像の揺れの安定化を実現する方式は、カメラに取り付けた加速度センサからの情報に基づいてカメラのレンズやカメラ自身を動かすことにより揺れを補正する光学式、機械式と呼ばれるものと、画像処理による電子式と呼ばれるものに分けられる。
【0093】
これらの装置は、一般にビデオスタビライザと呼ばれるが、画像処理による電子式によるビデオスタビライザは、揺れの補正可能な範囲や装置の小型化、耐久性等、多くの点で優位である。また、画像処理による電子式によるビデオスタビライザは、既に取得済みの映像の後処理として後発的に処理することが可能であるので、光学式による揺れ補正が充分でなかった場合や、保管されていた過去の映像等に対して追加的に処理することが可能である。
【0094】
例えば、2画像間の画面全体のグローバル動きの推定をオプティカルフローによって行い、カメラ映像の揺れを安定化させた例がある[非特許文献1]。
【0095】
非特許文献[1]
M. Irani, B. Rousso, and S. Peleg, Recovery of ego-motion using region alignment, IEEE Transactions on Pattern Analysis and Machine Intelligence,
19-3 (1997), 268-272.
【0096】
画像処理によるカメラ映像の揺れの安定化は、連続する画像のグローバルな動きを推定する問題に帰着される。
【0097】
画像の動きの推定は、画像処理・コンピュータビジョンにおける基本的な問題であり、これまでに多くの研究がなされてきたが、それらは大きく領域ベースによる手法と、特徴ベースによる手法に分けられる。
【0098】
領域ベースの方法としては、動画像圧縮符号化の国際標準規格MPEG[非特許文献2]では、ブロックマッチングが用いられ、コンピュータビジョンではオプティカルフロー[非特許文献3,4]がよく用いられるが、いずれも濃淡画素を直接処理するものである。
【0099】
非特許文献[2]
ISO/IEC-11172, Coding of moving pictures and associated audio for digital storage media up to 1.5 Mbits/s, 1993.
【0100】
非特許文献[3]
B. K. P. Horn and B. G. Schunck, Determining optical flow,
Artificial Intelligence, 17 (1981), 185-203.
【0101】
非特許文献[4]
B. D. Lucas and T. Kanade, An iterative image registration technique with an application to stereo vision, Proceedings of the 1981 DARPA Image Understanding Workshop, April, 1981, 121-130.
【0102】
一方、位相相関法[5] のように、画像を周波数変換することによって周波数領域で行う処理もある。
【0103】
非特許文献[5]
G. A. Thomas, Television motion measurement for DATV and other applications、
BBC R&D Reports RD1987/11, 1987.
【0104】
特徴ベースの方法としては、コーナー等の画像特徴点や画像中の直線を用いるものがある。金澤・金谷は、特徴点から2画像間の射影変換を最適に計算した[6]。松永は、海洋上の船舶から撮影される映像に含まれる画像の回転と上下動を除去するために、映像中の水平線を検出することにより動揺映像の安定化を行った[7]。
【0105】
非特許文献[6]
金澤靖, 金谷健一, 段階的マッチングによる画像モザイク生成,
電子情報通信学会論文誌D-II, J86-D-II-6 (2003), 816-824.
【0106】
非特許文献[7]
松永力, 水平線検出による船体動揺映像の安定化,
第15回画像センシングシンポジウム(SSII2009)講演論文集, 横浜(パシフィコ横浜).
【0107】
これまでのスタビライザ処理の多くはCCDセンサによるカメラを前提としているが、CMOSセンサにおけるスタビライザ処理の研究もなされている。RingabyとForssen[非特許文献8]は、携帯電話のカメラ映像を安定化するために、予めカメラの内部パラメータを校正した後、映像中の特徴点を抽出し、それを追跡した。カメラの運動を3次元回転モデルにより記述し、そのパラメータ推定には、再投影誤差の最小化を行うために非線形最適化を用いた。そして、推定したパラメータを平均化することによって安定化を行った。Grundmannら[非特許文献9]は、画面をブロック分割して、ブロック毎に隣接する2画像間の2次元射影変換を計算して、それらの重ね合わせにより動き歪みを補正したが、射影変換を計算するためには、やはり、映像中の特徴点を用いている。
【0108】
非特許文献[8]
E. Ringaby and P.-E. Forssen, Efficient video rectication and stabilisation for cell-phones, International Journal of Computer Vision, 96-3 (2012), 335-352.
【0109】
非特許文献[9]
M. Grundmann, V. Kwatra, D. Castro, and I. Essa, Calibration-free rolling shutter removal, Proceedings of IEEE Conference on Computational Photography (ICCP2012), April, 2012.
【0110】
本発明は、ローリングシャッタ機構によるCMOSカメラ映像におけるスタビライザ処理を行う。このとき、何らの画像特徴や対応付けを用いない。隣接する2画像間のグローバル動きを2次元アフィン変換により記述し、その推定には、非線形最適化を行わずに線形解法を用いる。線形解法の反復により最適化したアフィン変換行列を解析的に分解することにより並進パラメータを計算する。
【0111】
画像シミュレーション実験を行い、固定カメラ、移動カメラいずれの映像に含まれる動き歪み変形を補正するとともに揺れを除去して安定化することが確認できた。
【0112】
移動カメラの場合には、推定した並進パラメータの時系列変化に対して、巡回型フィルタ処理により揺れ成分を除去して、カメラの移動を保持したまま、映像中の揺れのみを補正する。移動カメラから固定カメラへ遷移する際にも、変化に忠実な安定化処理を実現することができる。
【0113】
また、本発明では、映像処理による方法のため、いかなるCMOSセンサを用いたカメラにより撮影された動き歪みや揺れを伴う録画された蓄積映像であっても、補正することが可能である。
【0114】
従来公知の方法では、画像特徴点の抽出と2画像間における特徴点の対応付け処理には処理時間とコストが掛かる。本発明では、何らの画像特徴を用いることなく、画素値を直接処理することにより揺れ補正と歪み補正を同時に行う。平行成分と歪み成分をまとめて推定および補正することができる。
【産業上の利用可能性】
【0115】
本発明は、映像処理全般、特に、映像監視やセキュリティに好適である。映像の動き情報を推定して、動き補正処理を行うビデオスタビライザ、フレームレー卜変換等の処理を遂行する場合の基礎とできる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10