(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6677980
(24)【登録日】2020年3月18日
(45)【発行日】2020年4月8日
(54)【発明の名称】パノラマビデオデータの処理装置、処理方法及び処理プログラム
(51)【国際特許分類】
G06T 3/00 20060101AFI20200330BHJP
G06T 7/30 20170101ALI20200330BHJP
G06T 7/70 20170101ALI20200330BHJP
H04N 1/387 20060101ALI20200330BHJP
G03B 15/00 20060101ALI20200330BHJP
G03B 37/00 20060101ALI20200330BHJP
【FI】
G06T3/00 755
G06T7/30
G06T7/70 B
H04N1/387 110
G03B15/00 W
G03B37/00 A
【請求項の数】9
【全頁数】9
(21)【出願番号】特願2015-136346(P2015-136346)
(22)【出願日】2015年7月7日
(65)【公開番号】特開2017-21430(P2017-21430A)
(43)【公開日】2017年1月26日
【審査請求日】2018年2月13日
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100092772
【弁理士】
【氏名又は名称】阪本 清孝
(74)【代理人】
【識別番号】100119688
【弁理士】
【氏名又は名称】田邉 壽二
(72)【発明者】
【氏名】要 強
(72)【発明者】
【氏名】三功 浩嗣
(72)【発明者】
【氏名】徐 栄
(72)【発明者】
【氏名】内藤 整
【審査官】
新井 則和
(56)【参考文献】
【文献】
特開2008−276621(JP,A)
【文献】
特開2004−046573(JP,A)
【文献】
特開2015−121850(JP,A)
【文献】
特開2012−242821(JP,A)
【文献】
Beom Su Kim et al.,Real-time Panorama Canvas of Natural Images,IEEE Transactions on Consumer Electronics,IEEE,2011年11月,Vol. 57, No. 4,pp. 1961-1968,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6131177
【文献】
Mostafa Kamali et al.,Stabilizing Omnidirectional Videos Using 3D Structure and Spherical Image Warping,MVA2011 IAPR Conference on Machine Vision Applications,2011年 6月,pp. 177-180,https://pdfs.semanticscholar.org/24ae/f030acc11d26d2f4ec1f1ec4ac8462230ebf.pdf
(58)【調査した分野】(Int.Cl.,DB名)
G06T 3/00
G06T 7/00−7/90
G03B 15/00
G03B 37/00
H04N 1/387
(57)【特許請求の範囲】
【請求項1】
パノラマビデオデータの処理装置であって、
フレームの一部の領域であり2次元(平面)画像として見做せる大きさとして前記フレームの0.15倍の大きさの画像のパッチから特徴点を抽出する抽出手段と、
前記パッチの特徴点に対応する、前記フレームの次のフレームの画素を判定する判定手段と、
前記パッチの特徴点と、前記判定手段が判定した画素の位置に基づき、前記パッチを前記次のフレームに射影する射影行列を決定する決定手段と、
前記射影行列により前記パッチを射影した前記次のフレームの第1領域に基づき、前記フレームと前記次のフレームの角度差を判定する角度判定手段と、
前記角度判定手段が判定する、前記パノラマビデオデータの連続するフレーム間それぞれの角度差に基づき前記パノラマビデオデータを変換する変換手段と、
を備えていることを特徴とするパノラマビデオデータの処理装置。
【請求項2】
前記パッチは、前記フレームの中央を含む画像である請求項1に記載のパノラマビデオデータの処理装置。
【請求項3】
前記変換手段は、前記パノラマビデオデータの連続するフレーム間の角度差が減少する様に前記パノラマビデオデータを変換することを特徴とする請求項1又は2に記載のパノラマビデオデータの処理装置。
【請求項4】
前記角度判定手段は、前記フレームと前記次のフレームの角度差として、互いに直交する第1方向、第2方向及び第3方向それぞれを回転軸とする3つの角度差を判定することを特徴とする請求項1から3のいずれか1項に記載のパノラマビデオデータの処理装置。
【請求項5】
前記角度判定手段は、前記パッチ内の位置と前記第1領域の対応する位置との水平方向の距離に基づき前記第1方向を回転軸とする第1角度差を求め、前記パッチ内の位置と前記第1領域の対応する位置との垂直方向の距離に基づき前記第2方向を回転軸とする第2角度差を求め、前記パッチの各辺と前記第1領域の対応する辺との角度差に基づき前記第3方向を回転軸とする第3角度差を求めることを特徴とする請求項4に記載のパノラマビデオデータの処理装置。
【請求項6】
前記角度判定手段は、前記パッチの形状を正方形とし、前記パッチの形状に対する前記第1領域の2つの対角線の長さの比に基づき前記角度差の信頼度の有無を判定し、
前記変換手段は、信頼度が無いと前記角度判定手段が判定した角度差を、前記パノラマビデオデータの変換に使用しないことを特徴とする請求項1から5のいずれか1項に記載のパノラマビデオデータの処理装置。
【請求項7】
前記変換手段は、前記パノラマビデオデータの連続するフレーム間の角度差をローパスフィルタによりフィルタし、フィルタ後の角度差に基づき前記パノラマビデオデータを変換することを特徴とする請求項1から6のいずれか1項に記載のパノラマビデオデータの処理装置。
【請求項8】
パノラマビデオデータを処理装置で処理する処理方法であって、
フレームの一部の領域であり2次元(平面)画像として見做せる大きさとして前記フレームの0.15倍の大きさの画像のパッチから特徴点を抽出する抽出ステップと、
前記パッチの特徴点に対応する、前記フレームの次のフレームの画素を判定する画素判定ステップと、
前記パッチの特徴点と、前記判定ステップにおいて判定された画素の位置に基づき、前記パッチを前記次のフレームに射影する射影行列を決定する決定ステップと、
前記射影行列により前記パッチを射影した前記次のフレームの第1領域に基づき、前記フレームと前記次のフレームの角度差を判定する角度判定ステップと、
前記角度判定ステップにおいて判定された、前記パノラマビデオデータの連続するフレーム間それぞれの角度差に基づき前記パノラマビデオデータを変換する変換ステップと、
を含むことを特徴とするパノラマビデオデータの処理方法。
【請求項9】
請求項1から7のいずれか1項に記載の処理装置としてコンピュータを機能させることを特徴とするパノラマビデオデータの処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、1つ以上の撮像装置により取得した全周囲映像といった、パノラマビデオデータの安定化技術に関する。
【背景技術】
【0002】
近年、撮影位置を中心に水平面内において360度の全周囲画像(パノラマ画像)を撮影するパノラマ撮影技術が注目を集めている。また、このパノラマ画像を連続して撮影することでパノラマ動画とすることも行われている。パノラマ画像は、例えば、その向きをそれぞれ異ならせた複数のカメラで撮影し、各カメラが撮影した画像のデータを合成することで生成される。或いは、フィッシュアイ・レンズの様な超広角レンズを用いることで撮影される。パノラマ画像の各被写体の位置は極座標で表されるが、ディスプレイ等に表示する際には平面座標に変換されて平面画像として表示される。また、パノラマ動画のデータ(以下、パノラマビデオデータ)から、ユーザが指定した視点を中心にある狭い領域を切り出して平面画像として表示することで、自由視点映像システムを構築することができる。
【0003】
例えば、パノラマ動画を、カメラを固定することなく、例えば、手持ちで撮影すると手振れ等の影響により再生時の映像が見難くなる。したがって、手持ち等で撮影して取得したパノラマビデオデータの手振れを抑える様な処理を事前に行って、処理後のパノラマビデオデータを保存しておくことが求められる。この事前処理により、ブレの無い安定した動画を再生することができる。
【0004】
非特許文献1は、カメラの射影行列と、各パノラマ画像の特徴軌跡からパノラマビデオデータを安定化させる構成を開示している。特許文献1は、カメラパラメータに基づきパノラマ画像を生成する構成を開示している。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】米国特許第6157747号明細書
【非特許文献】
【0006】
【非特許文献1】Kamali,M. et al.,"Stabailizing omnidirectional video using 3D structure and spherical image warping",IAPR Conference on Machine Vision Applications,pp.177−180,2011年
【発明の概要】
【発明が解決しようとする課題】
【0007】
非特許文献1の構成は、特徴軌跡の追跡に高い計算コストが必要となる。また、特許文献1に記載の構成は、カメラの内部パラメータが必要であり個々のカメラに応じたパラメータの調整等、処理が煩雑となる。
【0008】
本発明は、簡易にパノラマビデオデータの安定化処理を行う処理装置、処理方法及び
処理プログラムを提供するものである。
【課題を解決するための手段】
【0009】
本発明の一側面によると、パノラマビデオデータの処理装置は、フレームの一部の領域であり2次元(平面)画像として見做せる大きさ
として前記フレームの0.15倍の大きさの画像のパッチの特徴点を抽出する抽出手段と、前記パッチの特徴点に対応する、前記フレームの次のフレームの画素を判定する判定手段と、前記パッチの特徴点と、前記判定手段が判定した画素の位置に基づき、前記パッチを前記次のフレームに射影する射影行列を決定する決定手段と、前記射影行列により前記パッチを射影した前記次のフレームの第1領域に基づき、前記フレームと前記次のフレームの角度差を判定する角度判定手段と、前記角度判定手段が判定する、前記パノラマビデオデータの連続するフレーム間それぞれの角度差に基づき前記パノラマビデオデータを変換する変換手段と、を備えていることを特徴とする。
【発明の効果】
【0010】
本発明によると、簡易にパノラマビデオデータの安定化処理を行うことができる。
【図面の簡単な説明】
【0011】
【
図2】一実施形態によるパノラマビデオデータの安定化処理を示すフローチャート。
【
図5】一実施形態による回転角度を求める処理の説明図。
【
図6】一実施形態による回転角度を求める処理の説明図。
【
図7】一実施形態による回転角度を求める処理の説明図。
【発明を実施するための形態】
【0012】
以下、本発明の例示的な実施形態について図面を参照して説明する。なお、以下の実施形態は例示であり、本発明を実施形態の内容に限定するものではない。また、以下の各図においては、実施形態の説明に必要ではない構成要素については図から省略する。
【0013】
<第一実施形態>
図1は、本実施形態による処理装置の構成図であり、
図2は、本実施形態よるパノラマビデオデータ安定化処理のフローチャートである。
図1の記憶部1には、撮像装置で撮影した安定化処理前のパノラマビデオデータ(以下、単に、ビデオデータとも呼ぶ。)が格納される。なお、記憶部1に格納されているビデオデータで再生される動画は、N個のフレームからなるものとする。また、制御部8は、処理装置の全体を制御する。S10において、制御部8は、フレームのインデックスiを1に初期化する。S11において、パッチ選択部2は、記憶部1に記憶されているビデオデータのi番目のフレーム(以下、フレームIiと呼ぶ。)からパッチPiを選択する。本実施形態において、パッチPiとは、フレームIiの一部の領域の画像であり、パッチPiの大きさは、2次元(平面)画像と見做せる程度の大きさとする。なお、パッチPiの大きさを小さくし過ぎると、パッチPi内の特徴点の数が少なくなり過ぎるため、パッチPiの大きさは、2次元画像と見做せる程度の大きさで可能な限り大きくする。例えば、パッチPiとして、元のフレームの大きさの0.15倍程度の大きさを選択することができる。また、パッチPiとして選択するフレームIi内の位置は任意であるが、例えば、フレームIiの中央を含む様にする。これは、通常、フレームの中央付近に特徴点が多いからである。なお、最初のフレームI1のパッチP1についてはユーザが選択し、その後のフレームからのパッチ選択については、ユーザが選択した位置或いはその近傍にて行う構成であっても良い。
【0014】
S12において、特徴点抽出部3は、パッチPiの特徴点を抽出する。特徴点の抽出には任意の公知のアルゴリズムを使用することができる。S13において、マッチング部4は、パッチPiの特徴点に対応する、次のフレームIi+1内の位置(画素)を判定する。S14において、行列決定部5は、パッチPiの特徴点と、フレームIi+1の対応する位置との関係に基づき、射影行列であるホモグラフィック行列Hを求める。なお、パッチPiの位置(画素)は、
図3に示す平面座標系で表される。本実施形態においては、水平方向の座標をU軸とし、垂直方向の座標をV軸とし、U軸の位置がuであり、V軸の位置がvである画素Qを(u,v)で表す。例えば、パッチPiの位置(u,v)に対応するフレームIi+1の平面座標系での位置が(u´,v´)であるとすると、2つの位置と、ホモグラフィック行列Hとの関係は以下の式で表される。
【0015】
(u´,v´,1)=sH(u,v,1)T
なお、sは任意のスカラー値である。
【0016】
S15において、回転角度判定部6は、求めたホモグラフィック行列HによりパッチPiを、フレームIi+1上に投影し、フレームIi+1上に投影されたパッチPiの領域P´を求める。
図5は、パッチPiと、領域P´の一例を示している。S16において、回転角度判定部6は、パッチPiと、領域P´それぞれのコーナーの位置を求める。そして、S17において、回転角度判定部6は、パッチPiと、領域P´に基づき、フレームIiに対するフレームIi+1の回転角度Δαi、Δβi、Δγiを以下に説明する用に求める。なお、
図4に示す様に、α、β、γは、それぞれ、極座標系において互いに直交する3つの方向、つまり、X軸、Y軸、Z軸を回転軸とする回転角度とする。また、以下の説明においては、X軸及びZ軸が水平方向であり、Y軸が垂直方向であるものとする。
【0017】
まず、回転角度判定部6は、パッチPiと領域P´それぞれについて、S16で求めたコーナーの位置から中心点を算出する。
図5に示す様に、本例において、パッチPの中心点をOとし、領域P´の中心点をO´とする。そして、
図5に示す様に、回転角度判定部6は、U軸方向における中心点O及びO´の距離ΔSと、V軸方向における中心点O及びO´の距離ΔTを求める。ΔSは、Y軸周りの回転により生じているため、Δβiは以下の式により求めることができる。
Δβi=360×ΔS/W
ここで、Wは、
図6に示す様に、極座標における中心点O´を通る水平面内の円周である。なお、本実施形態では中心点O´を通る水平面内の円周をWとするが、中心点Oを通る水平面内の円周としても良い。或いは、中心点Oを通る水平面内の円周と中心点O´を通る水平面内の円周の平均値等をWとしても良い。さらには、中心点Oを通る水平面内の円周と中心点O´を通る水平面内の円周の小さい方の値以上であり、かつ、大きい方の値以下の任意の値をWとすることができる。
【0018】
一方、ΔTは、X軸周りの回転により生じているため、Δαiは以下の式により求めることができる。
Δαi=360×ΔT/H
ここで、Hは、極座標における円周の半分の値である。これは、全周囲画像を平面座標で示す場合、そのV軸方向の長さは、円周の半分に基づきスケーリングされるからである。
【0019】
また、Z軸周りの回転は、本例においては、平面座標系の面内の回転となる。したがって、回転角度判定部6は、Z軸周りの回転角度Δγiを、パッチPiの辺と、領域P´の対応する辺との角度により求める。具体的には、
図7に示す様に、パッチPiの4つの辺に対する、領域P´の対応する4つの辺の角度をそれぞれa、b、c、dとすると、Δγiは以下の式により求めることができる。
Δγi=(a+b+c+d)/4
【0020】
なお、本実施形態では、パッチPiと、領域P´との中心点間の距離によりX軸及びY軸周りの回転角度を求めたが、パッチPiと、領域P´の重心や、その他の任意の基準で決めたパッチ及び領域内の対応する点間の距離により回転角度を求める構成であっても良い。
【0021】
回転角度判定部6がΔαi、Δβi、Δγiを算出すると、制御部8は、S18でiを1だけ増加させ、S19でiがNであるか否かを判定する。iがNではないと、総てのフレーム対する処理は終了していないので、制御部8は、総てのフレーム対する処理が終了するまでS11からの処理を各部に繰り返させる。一方、S18でiがNであると、総てのフレームに対する処理が終了し、隣接するフレーム間の回転角度(Δαi,Δβi,Δγi)(i=1〜N−1)が算出されている。したがって、データ変換部7は、1番目のフレームを基準としたk番目のフレームのX軸、Y軸、Z軸周りの回転角度αk、βk、γkを、以下の式で求めることができる。
【0023】
なお、α0、β0及びγ0は、所定の初期値である。データ変換部7は、S20で、k番目のフレームを(−αk、−βk、−γk)だけ回転させる様にデータ変換し、変換後のデータを記憶部1に保存する。これにより、各フレーム間の角度差が減少し、ブレを低減させることができる。変換後のビデオデータにより、ブレの少ない安定した動画像を再生することができる。
【0024】
本実施形態では、カメラパラメータを必要とせず、かつ、特徴軌跡の追跡の必要もない。したがって、簡易にパノラマビデオデータの安定化処理を行うことができる。なお、本実施形態ではパッチPiを正方形としたが、長方形や菱形、さらには他の多角形であっても良い。
【0025】
<第二実施形態>
続いて第二実施形態について、第一実施形態との相違点を中心に説明する。第一実施形態においてデータ変換部7は、回転角度判定部6が判定した(Δαi,Δβi,Δγi)の総てを使用してビデオデータの変換を行った。しかしながら、フレームのピントが合っていないことや、大きなブレ等により(Δαi,Δβi,Δγi)に大きな誤差が含まれると、安定化処理の精度が劣化する。特に、k番目のフレーム回転角度(αk、βk、γk)は、上述した様に、(Δαi,Δβi,Δγi)の積算値であるため、あるところで誤差の大きな(Δαi,Δβi,Δγi)が生じると、その誤差は、それ以後の総てのフレームに波及してしまう。
【0026】
したがって、本実施形態では、
図2のS17において、(Δαi,Δβi,Δγi)を求めた際に、求めた(Δαi,Δβi,Δγi)の信頼度の有無を判定し、信頼度が無い場合、求めた(Δαi,Δβi,Δγi)を(0,0,0)に置き換える。つま
り、信頼度が無い回転角度差についてはビデオデータの変換処理に使用しない。以下、
図8を用いて信頼度の判定について説明する。
よう懇願する次第であります。
【0027】
図8に示す様に、本実施形態では、領域P´の2つの対角線の長さの比(D1/D2)を信頼度の尺度として使用する。例えば、パッチPを正方形とすると、パッチPの2つの対角線の長さの比は1である。パッチPiの形状に対して領域P´の形状がひどく変形すると、(D1/D2)の値は、1に対してかなり大きい値か、かなり小さい値になる。通常、連続するフレーム間においては、パッチPに対して領域P´がそれ程変形することはないため、本実施形態では閾値Th1と閾値Th2(Th1<Th2)を設定し、Th1≦(D1/D2)≦Th2であると、(Δαi,Δβi,Δγi)は信頼できると判定する。一方、(D1/D2)の値がTh1より小さい場合と、Th2より大きい場合には、(Δαi,Δβi,Δγi)は信頼できないと判定してその値を0とする。なお、その他の処理については第一実施形態と同様である。なお、パッチPiの形状に対する領域P´の形状の変形度合を示す他の値を信頼度の判定に使用する構成であっても良い。なお、本実施形態では信頼度が無いと判定された回転角度を総て0に置きかえるが、通常、連続するフレーム間の回転角度は小さく、0にすることの影響は少ない。
【0028】
<第三実施形態>
第一実施形態においては、回転角度判定部6が判定した(Δαi,Δβi,Δγi)をそのまま使用して(αk、βk、γk)を求めていた。本実施形態では、(Δαi,Δβi,Δγi)をi=1から順に並べ、その波形をローパスフィルタによりフィルタする。そして、フィルタ後の、(Δαi,Δβi,Δγi)に基づき(αk、βk、γk)を求める。ローパスフィルタを行うことにより、急激な変化が緩和され変換後のビデオデータの安定性が向上する。
【0029】
なお、本発明による処理装置は、コンピュータを上記処理装置として機能・動作させるプログラムにより実現することができる。これらコンピュータプログラムは、コンピュータが読み取り可能な記憶媒体に記憶されて、又は、ネットワーク経由で配布が可能なものである。
【符号の説明】
【0030】
3:特徴点抽出部、4:マッチング部、5:行列決定部、6:回転角度判定部、7:データ変換部