(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-01-16
(45)【発行日】2023-01-24
(54)【発明の名称】画像生成装置、および画像生成プログラム
(51)【国際特許分類】
H04N 23/68 20230101AFI20230117BHJP
H04N 23/40 20230101ALI20230117BHJP
G03B 15/00 20210101ALI20230117BHJP
G02B 23/24 20060101ALI20230117BHJP
A61B 1/00 20060101ALI20230117BHJP
A61B 1/045 20060101ALI20230117BHJP
G03B 37/00 20210101ALN20230117BHJP
【FI】
H04N5/232 480
H04N5/225 500
G03B15/00 W
G03B15/00 H
G03B15/00 L
G03B15/00 Q
G03B15/00 U
G02B23/24 B
A61B1/00 C
A61B1/045 610
G03B37/00 A
(21)【出願番号】P 2018547656
(86)(22)【出願日】2017-10-23
(86)【国際出願番号】 JP2017038196
(87)【国際公開番号】W WO2018079490
(87)【国際公開日】2018-05-03
【審査請求日】2020-10-22
(31)【優先権主張番号】P 2016208049
(32)【優先日】2016-10-24
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】304021417
【氏名又は名称】国立大学法人東京工業大学
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】小池 英樹
(72)【発明者】
【氏名】中澤 正和
(72)【発明者】
【氏名】下澤 一輝
【審査官】吉田 千裕
(56)【参考文献】
【文献】特開2007-043225(JP,A)
【文献】特開2001-111934(JP,A)
【文献】特開2008-118495(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/222-5/257
G03B 15/00
G02B 23/24
A61B 1/00
A61B 1/045
G03B 37/00
(57)【特許請求の範囲】
【請求項1】
移動する物体に装着される撮像部と、
前記撮像部で取得された画像に基づき、同一視点方向の動画を生成する際、前記撮像部が移動する際の移動前後の画像中、前記撮像部が移動する前のフレームtの画像中に存在する特徴点を捉えて、前記撮像部が移動した後のフレーム(t+1)の画像中の特徴点と一致させることにより、移動量を演算して、当該移動量で画像を戻す姿勢修正を繰り返して動画のフレームを連続させる制御部と、
を備えた画像生成装置であって、
前記制御部は、各時刻におけるフレームに対して、一のステップで、高緯度領域を低緯度領域に回転移動させて、前記低緯度領域から特徴点を抽出し、当該特徴点の座標を逆の回転で元の前記高緯度領域の画像における座標に修正し、その後、前記一のステップの次のステップで、前のフレームから抽出された特徴点と現在のフレームから抽出された特徴点とを照合するとともに、姿勢変化を推定する算出部と、前記推定された姿勢変化から、前記姿勢修正を行う生成部と、を有することを特徴とする画像生成装置。
【請求項2】
前記算出部は、前記特徴点照合で全天球画像から生成された二次元の回転画像を用いて、特徴点が画像周縁の歪みの多い高緯度領域にある場合、同一視点方向の周縁の歪の少ない低緯度領域に画像を移動させてから、特徴点を一致させることを特徴とする請求項1に記載の画像生成装置。
【請求項3】
前記物体は、回転運動を伴い移動することを特徴とする請求項1に記載の画像生成装置。
【請求項4】
前記物体は、並進運動を伴い移動することを特徴とする請求項1に記載の画像生成装置。
【請求項5】
前記撮像部は、全天球型カメラに設けられていることを特徴とする請求項1に記載の画像生成装置。
【請求項6】
前記撮像部は、カプセル内視鏡の一方側または他方側とのうち、少なくとも何れか一方に設けられていることを特徴とする請求項1に記載の画像生成装置。
【請求項7】
前記制御部は、欠落したエラーフレームを、前記エラーフレームの前のフレームと入れ替えて補完することを特徴とする請求項1に記載の画像生成装置。
【請求項8】
前記制御部は、周囲が欠落したエラーフレームの画像のうち、周囲の欠落した部分を黒い画像で補完することを特徴とする請求項7に記載の画像生成装置。
【請求項9】
移動する物体に設けられて、前記移動する物体の周囲を撮影する撮像部と、
前記撮像部で取得された動画から前記撮像部が移動する際の移動量を演算して、動画のフレームを連続させる制御部と、を備えた画像生成装置に
実行させるための画像生成プログラムであって、
前記画像生成装置に、前記撮像部で撮像された動画の画像中に存在する特徴点を捉える特徴点抽出ステップと、
各時刻におけるフレームに対して、高緯度領域を低緯度領域に回転移動させて、前記低緯度領域から特徴点を抽出し、当該特徴点の座標を逆の回転で元の前記高緯度領域の画像における座標に修正する修正ステップと、
前のフレームから抽出された特徴点と現在のフレームから抽出された特徴点とを照合する特徴点照合ステップと、
移動量を演算して、当該移動量で画像を戻すことを繰り返して動画のフレームを連続させるステップと、を
実行させるための画像生成プログラム。
【請求項10】
移動する物体の周囲を撮影した動画から前記移動する物体の移動量を演算して、動画のフレームを連続させ
る、画像生成装置に実行させるための画像生成プログラムであって、
前記画像生成装置に、前記動画の画像中に存在する特徴点を捉える特徴点抽出ステップと、
各時刻におけるフレームに対して、高緯度領域を低緯度領域に回転移動させて、前記低緯度領域から特徴点を抽出し、当該特徴点の座標を逆の回転で元の前記高緯度領域の画像における座標に修正する修正ステップと、
前のフレームから抽出された特徴点と現在のフレームから抽出された特徴点とを照合する特徴点照合ステップと、
移動量を演算して、前記移動量で画像を戻すことを繰り返して動画のフレームを連続させるステップと、
を実行させるための画像生成プログラム。
【請求項11】
前記画像生成装置に、照合が失敗したかあるいは成功したかの判定を行う照合判定ステップと、
照合が失敗した場合に、照合が成功するフレームの取得を行うフレーム取得ステップと、
を実行させるための請求項9または10に記載の画像生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像生成装置、および画像生成プログラムに関する。
【背景技術】
【0002】
従来、回転する物体に、カメラを組み合わせて、物体から見た周囲の映像を得る画像生成装置が知られている(例えば、非特許文献1等参照)。
【先行技術文献】
【非特許文献】
【0003】
【文献】Jonas Pfeil,Kristain Hildebrand,Carsten Gremzow,Bernd Bickel,and Marc Alexa.Throwable panoramic ball camera. In SIGGRAPH Asia 2011 Emerging Technologies,SA’11,pp.4:1-4:2
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、このような従来の画像生成装置では、物体の回転の程度によってカメラの姿勢も変化し、視線が不安定になる。このため、安定した画像を得るため、視点を固定したいが、視点がぶれて生成された動画が見ずらくなってしまう。
また、静止画を連結する手法では、先の画像へ再生箇所がジャンプしてしまい、一瞬動きが止まったり、ある画像から次の画像に映像が飛んで連続していない不自然な映像になってしまういわゆるコマ落ちが発生する場合もある。
【0005】
そこで、本発明は、視点を同一方向に固定して、安定した画像から見やすい動画を生成できる画像生成装置、および画像生成プログラムを提供することを課題としている。
【課題を解決するための手段】
【0006】
本発明に係る画像生成装置は、移動する物体に装着される撮像部と、撮像部で取得された画像に基づき、同一視点方向の動画を生成する際、画像中に存在する特徴点を捉えて、移動後の画像中の特徴点と一致させることにより、移動量を演算して、移動量で画像を戻すことを繰り返して動画のフレームを連続させる制御部とを備えることを特徴としている。
【発明の効果】
【0007】
本発明によれば、視点が同一方向に固定されて安定した画像が良好な動画を生成することができる。
【図面の簡単な説明】
【0008】
【
図1】画像生成装置の構成を示す模式的なブロック図である。
【
図2】画像生成装置のうち、撮像部が設けられたボールの構成を示す斜視図である。
【
図3】画像生成装置の記憶部に格納される情報を示す模式的なブロック図である。
【
図4】画像生成装置の制御部の構成を示す模式的なブロック図である。
【
図6】変形例の画像生成装置で、撮像部が設けられたボールの構成を示す分解斜視図である。
【
図7】画像生成装置に用いられる画像生成プログラムのフローチャートである。
【
図8】画像生成装置で、特徴点を抽出する様子を示す概念図である。
【
図9】画像生成装置で、特徴点を照合させる様子を示す概念図である。
【
図10】画像生成装置で、姿勢変化を推定する様子を示す概念図である。
【
図11】画像生成装置で、姿勢を修正する様子を示す概念図である。
【
図12】変形例の画像生成装置で、全天球カメラを内蔵したボールの構成を示す模式的な分解斜視図である。
【
図13】他の実施形態の画像生成装置に用いるカプセル内視鏡の全体図である。
【
図14】カプセル内視鏡の使用態様を示す模式的な概念図である。
【
図15】一般的なカプセル内視鏡で撮像された映像の一例を示す図である。
【
図16】2つのカメラによって撮影された画像の一例を示す模式的な概念図である。
【
図17】特徴点マッチングが成功した一例を示す模式的な概念図である。
【
図18】特徴点マッチングが失敗した一例を示す模式的な概念図である。
【
図19】
図15に対応する補完された映像の一例を示す図である。
【
図20】欠落したフレームを補完する様子を説明する模式的な概念図である。
【
図21】不完全な魚眼画像から全天球の画像に変換したことを説明する模式的な概念図である。
【
図22】エラーフレームが発生した場合に、修正により復帰したフレームの様子を説明する模式的な概念図である。
【
図23】他の実施形態の画像生成プログラムの一実施例を示し、左側の画像が比較のために示す既存手法においてエラー後、意味のない画像が流れる様子を示す模式的な概念図である。右側の画像は、改良された様子を示し、フレームにエラーフレームが発生しても、修正により復帰したフレームの様子を説明する模式的な概念図である。
【
図24】実施形態の画像生成装置に用いられる画像生成プログラムのフローチャートである。
【
図25】他の実施形態の画像生成プログラムで、上から1行目は、撮像された映像を連続させたフレームを示し、2行目は、特徴点を抽出する工程の後、特徴点を照合させる工程を示し、3行目は、比較のために従来の画像生成プログラムを用いて安定化させた後のフレームを、4行目は、この実施形態の画像生成プログラムを用いて安定化させた後フレームを示すものである。
【
図26】実施形態の変形例1のクレーン車を説明する斜視図である。
【
図27】他の実施形態の変形例2のドローン(無人機)を説明する斜視図である。
【
図28】他の実施形態の変形例3の釣り竿を説明する斜視図である。
【発明を実施するための形態】
【0009】
本発明の実施形態について、
図1乃至
図12を参照して詳細に示す。説明において、同一の要素には同一の番号を付し、重複する説明は省略する。
【0010】
図1は、実施形態の画像生成装置Sの構成を説明する模式的なブロック図である。
実施形態の画像生成装置Sは、撮像部1と、制御を行うPC(パーソナルコンピュータ:制御部)2と、物体に装着されるカメラ4とを備えている。
【0011】
このうち、
図2に示すように、物体としてのボール3は、回転運動を伴って移動する撮像部1を設けている。撮像部1は、表面の球面に均等または、ほぼ均等に複数台のカメラ4(ここでは、X=6台)を有している。
カメラ4には、それぞれレンズ5が設けられていて、各レンズ5は、それぞれ外方に向けて配置されている。これにより、カメラ4は、ボール3の周囲の全ての空間を撮影可能な全天球型のカメラとして機能することができる。
【0012】
すなわち、実施形態のボール3に設けられた6台のカメラ4では、撮影した動画が全天球動画となり、全天球動画は、全方向(ボール3を中心に360°)の情報を撮影することができる。
従って、全天球動画は、どの方向の視点でも、たとえば、移動方向正面や、移動方向の背面など、視界の切れ目を生じさせることがない。ここでは、6台のカメラ4で撮影しているが、1枚の全天球映像が得られれば、X=何台のカメラであっても構わない。
【0013】
また、
図1のPC2は、通信インターフェース部10と、カメラ4によって撮影された情報およびプログラムなどを記憶する記憶部11と、通信インターフェース部10で受信した画像に基づき、同一視点方向の動画を生成する制御部12と、制御部12で演算された動画を出力して表示するモニタからなる表示部13と、キーボード等の入力部20とを有している。
【0014】
この通信インターフェース部10は、ネットワーク100に接続されて、送受信を行うとともに、ボール3のカメラ4によって撮影されたデータを受信可能とする通信手段を含む。
そして、通信インターフェース部10は、ブルートゥース(登録商標)などの無線通信により、回転を含む移動しているボール3から送られてくる画像の信号を受信可能に構成されている。なお、ここでは、無線通信の一例として、ブルートゥースを挙げたが、特にこれに限らず、ボール3から送られてくる画像を受信可能であれば、他の無線通信規格に基づく通信手段を用いてもよい。
【0015】
記憶部11は、揮発性メモリ、不揮発性メモリを有して構成されている。このうち、揮発性メモリとしては、スタティック・ランダム・アクセス・メモリ(SRAM)とダイナミック・ランダム・アクセス・メモリ(DRAM)を含む。また、BIOS、プログラムコードおよびシステムソフトウェアなどは、不揮発性メモリに格納される。不揮発性メモリは、リードオンリィメモリ(ROM)、EPROM、EEPROM、フラッシュメモリ、磁気記憶媒体、コンパクトディスクなどの光学ディスクを含む。
【0016】
そして、この実施形態の記憶部11には、
図3に示すように、動画11a、特徴点画像11b、数式11c、姿勢変換行列11dが随時、呼び出し可能に格納されている。
【0017】
図4に示すように、制御部12は、CPU(CentralProcessingUnit)などにより主に構成されていて、記憶部11に記憶されたプログラムまたは、ネットワーク100からダウンロードされたアプリケーションプログラムを実行する。これにより、制御部12は、カメラ4から送られてくる画像の情報を演算して、動画を生成するように構成されている。動画は、表示部13に出力されて表示される(
図1参照)。
【0018】
制御部12は、6台のカメラ4から動画を取得する取得部12aを備えている。この取得部12aでは、1枚の全天球の画像41を生成する。
さらに、制御部12は、次にこの1枚の全天球の画像41から、n枚(nは任意の自然数、π/n、ここでは6枚であるがカメラ4の台数とは関連がない。)の回転画像を生成する分割部12bと、低緯度の部分の特徴点を抽出する抽出部12cと、n枚の画像を1枚の全体画像に統合する統合部12dとを備える。さらに、制御部12は、一致度を算出する算出部12eと、姿勢の推定を行う生成部12fと、生成された画像を出力する出力部12gとを備えている。
【0019】
すなわち、制御部12は、動画を生成する際、画像中に存在する特徴点を捉えて、移動後の画像中の特徴点と一致させることにより、移動量を演算して、姿勢を修正することにより動画のフレームを連続させる。ここで、特徴点とは、たとえば画素値の変化が他の箇所よりも大きい若しくはまれに小さい箇所で、他の箇所との差異が明確な部分を示す。
まず、取得部12aで動画が取得されると、分割部12bにて1枚の全天球の画像41から、n枚の回転画像(π/nずつ回転)が生成される(
図8中の回転画像42a~47a参照)。
【0020】
抽出部12cは、SIFT(Scale-InvariantFeatureTransform)を用いて各フレームから特徴点を抽出する。SIFTは、画像のスケールや回転に対して不変な特徴点を求めるアルゴリズムである。このSIFTは、様々な強さで平滑化した画像の差分からDoG(Difference-of-Gaussian)画像を生成して、ガウス方向の値の変化、すなわち画像に強さの異なるぼかしを適用した場合の画素値の変化を基に特徴点を抽出する。
【0021】
図5は、球面座標を表している。また、
図6は、正距円筒図法による全天球画像座標を表している。正距円筒図法によって表された画像は経線と緯線とが直角を成し、等間隔の経度と緯度とをもって交差するという性質を有する。しかしながら、球面上では、これらは等間隔に配置されていない。よって、表示部13にて全天球画像を2次元の画像として表示すると、低緯度領域では、情報が正しく表示されるが、高緯度領域では、情報が経度方向に引き伸ばされて歪みが発生する。このため、高緯度領域では、特徴点を取得することができなかったり、特徴量が正確に抽出できない場合がある。
このため、抽出部12cは、n枚すべてに対し、低緯度の部分だけを使って特徴点抽出を行う。
なお、この実施形態では、特徴点の抽出にSIFTを用いたが、SIFTに代えてSURFやAKAZEなどの他のアルゴリズムを用いて特徴点を抽出してもよい。
【0022】
そして、統合部12dは、n枚の回転画像の抽出結果を用いて、特徴点をもつ1枚の画像を作る。これらの動作は、各時刻におけるフレームに対して行われる。
また、算出部12eは、前のフレームと現在のフレームの特徴点を用いて特徴点照合を行い、姿勢変換行列Rを求める。
制御部12は、特徴点が画像周縁の歪みの多い部分にある場合、同一視点方向の周縁の歪の少ない部分である低緯度の部分に画像を移動させてから、特徴点を一致させる。
生成部12fは、姿勢変換行列Rを用いて現在のフレーム画像を前のフレームの画像に戻す。出力部12gは、画像をモニタ等の表示部13に出力する。
【0023】
表示部13は、制御部12で生成された同一視点方向の動画を出力して表示する。
そして、カメラ4によって撮影された3次元の全方位の画像は、表示部13によって、2次元の画像としてリアルタイムで表示される。
【0024】
この際、カメラ4によって構成される全天球カメラは、カメラモデルとしてカメラを中心とする3次元球面を想定すると、3次元球面の経緯度(θ,φ)と、正距円筒図法による全天球画像座標(u,v)との関係は以下のようになる。
u=w/2π・(θ+π) (-π≦θ<π)…(1)
v=h/π・(φ+π/2) (-π/2≦θ<π/2)…(2)
ただし、wは画像の幅、hは画像の高さである。
【0025】
次に、実施形態の画像生成装置Sの画像処理について、
図7に示すフローチャートに沿って、
図8~
図11を参照しつつ、説明する。
カメラ4によって撮影されたデータに基づいて画像処理が開始されると、ステップS0では、取得部12aで画像が取得される。ステップS1では、特徴点を抽出するため、撮像部1で撮像された動画の画像中に存在する特徴点を捉える(
図8参照)。
【0026】
ここで、まず全天球画像からの特徴点と特徴量との抽出方法について説明する。前述したように正距円筒図法で示された全天球画像は、低緯度領域のみ情報が正しく表示され、高緯度領域では、画像41のように情報に歪が生じている。
そして、情報が正しく表示される低緯度領域内の特徴点を抽出することにより、姿勢修正に用いる特徴点照合(マッチング)に対応させることができる。
【0027】
この実施形態の制御部12の取得部12a(
図4参照)は、特徴点を抽出したい注目する領域が高緯度にあるときは、注目する領域を球面の回転によって、移動方向前方の同一視点方向の周縁の歪の少ない低緯度の領域へ移動させる。
すなわち、制御部12は、各時刻において
図8に示す全天球の画像41を1枚撮影して生成する(original)。この全天球の画像41から分割部12b(
図4参照)は、回転画像42~47をn枚(π/nより)、生成する。回転画像42a~47aは、π/6(n枚の値は任意に決められる)ずつ回転させて、ここでは、6枚(π/6なので6枚)、生成される。
そして、抽出部12cは、この6枚の回転画像42a~47aのそれぞれにおいて画像の歪みの少ない低緯度の部分だけを使って特徴点抽出を行う。さらに、この実施形態では、統合部12dがこれらの6枚から得られた特徴点をまとめて全体画像49の特徴点とする。この結果、original画像において歪みの影響の少ない特徴点が抽出される。
【0028】
このように、特徴点と特徴量とを抽出する前に、球面の回転によって注目する領域を低緯度の領域へと移動する。すなわち、カメラ4の座標系のX軸周りに適切な量だけ回転させることにより、擬似的に高緯度領域を低緯度へ移動させることができる。
たとえば、
図8中、回転画像42a~47aに示すように高緯度に存在した注目する領域は、移動方向と同一の視点方向の周縁の歪の少ない低緯度の領域に移動して、低緯度の領域に存在するのと同様に正確に特徴点と特徴量とを抽出することが可能となる。
【0029】
特徴点は低緯度領域で抽出するため、抽出した特徴点の座標と元の画像とにおける特徴点のあるべき座標は異なる。このため、生成部12f(
図4参照)で推定された姿勢に基づいて、特徴点と特徴量とを抽出するために行った回転と逆の回転を特徴点の座標に適用する。これにより、元の画像における特徴点の座標に修正することができる。
【0030】
ステップS2では、算出部12e(
図4参照)にて特徴点照合が行われる(
図9参照)。特徴点照合は、特徴点が画像周縁の歪みの多い部分にあると判定すると、同一視点方向の周縁の歪の少ない部分に画像を移動させてから、移動前の画像中の特徴点と移動後の画像中の特徴点と一致させる。
ここでは、フレームtの特徴点とフレーム(t+1)の特徴点とが照合されているものが示されている。図中2つのフレームt,フレーム(t+1)に跨る直線は、同一であると推定される特徴点同士を結んだものである。
各フレームの特徴点と特徴量とは、低緯度に移動された特徴点から正確に抽出されているため、照合結果の信頼性が向上している。
【0031】
ステップS3では、算出部12e(
図4参照)にて姿勢変化の推定が行われる(
図10参照)。ここでは、得られた照合情報から、基本行列Eを、回転と並進とに分解して、カメラ4の姿勢変化の姿勢変換行列Rを求める。
すなわち、全天球画像上で抽出した特徴点の座標を正規化画像座標へ変換する。たとえば、照合の結果を用いて8点アルゴリズムによって2つのフレームの撮影時のカメラ間の基本行列Eを推定する。なお、ロバストに推定するためにRANSACやLMedsを用いるとなおよい。
このように、基本行列Eを、回転と並進とに分解することにより、2つのフレーム間の回転行列と並進ベクトルとが得られる姿勢変換行列Rとなる。このため、姿勢変換行列Rにより2つのフレーム間のカメラ4の姿勢変化が求められる。
【0032】
ステップS4では、生成部12f(
図4参照)にて姿勢修正が行われる(
図11(a)参照)。ここでは、各フレームごとの姿勢変化を示す姿勢変換行列Rが得られたことから、これらの積として任意のフレームの姿勢を修正して、フレームF1からフレームFnまでの全ての隣接フレーム間の姿勢変化を計算する。
すなわち、初期フレームから始めて現フレームまでの全ての隣接するフレーム間で、姿勢変換行列Rを推定する。
そして、それらの総乗は、
図11(b)に示すように初期のフレームと現在のフレームとの姿勢変化を表す回転行列であるとみなせる。
これにより、現在のフレームに対してその姿勢変換行列R(n-1)(nはフレーム数)、を作用させることにより、現在のフレームを初期のフレームの視点に連続させることができる。
【0033】
この実施形態では、初期フレームと現在のフレームとの間で直接、姿勢を推定しない。
これには、以下の理由が存在する。すなわち、(i)隣接するフレーム間の時間差は微小である。このため、特徴点の移動量も微小に限られる。これにより、3次元球面上で移動量の大きい特徴点同士の照合をフィルタリングできる。(ii)隣接するフレーム間の時間差は微小である。よって、シーンは静的である。(iii)隣接するフレーム間の時間差は微小である。したがって、並進による特徴点の見え方に変化はない。
【0034】
ステップS5では、次のフレームがあるか否かが判定される。ステップS5にて、次のフレームがある場合(ステップS5にてYes)、ステップS2に戻り、特徴点の抽出が継続して行われる。また、ステップS5にて、次のフレームがない場合(ステップS5にてNo)、制御部12は、処理を終了する。
【0035】
次に、この実施形態の画像生成装置Sの作用効果について説明する。
この実施形態の画像生成装置Sでは、特徴点照合ステップS2にて、特徴点が画像周縁の歪みの多い部分にあると判定すると、同一視点方向の周縁の歪の少ない部分に画像を移動させてから、移動前の画像中の特徴点と移動後の画像中の特徴点と一致させる。
このため、カメラ4を設けたボール3が高速で回転していても、6枚の回転画像42a~47aのそれぞれにおいて画像の歪みの少ない低緯度の部分だけを使って特徴点抽出を行うことができる。したがって、抽出された特徴点および特徴量の精度を良好なものとすることができる。
そして、この精度の良好な特徴点の情報に基づいて正確な移動量を算出して、姿勢修正を行うことにより、隣接するフレーム間を繋げることができる。このため、フレーム間は円滑に連続して、視点が固定されて安定した動画を生成できる。しかも、生成された動画は、回転して移動するボール3の周囲を全て撮影した見えない部分の存在しない、安定した動画を得られる。このため、スポーツや、医療、災害現場等、様々な分野に用いることができる。
【0036】
また、この実施形態では、複数のレンズ5を組み合わせた全天球型のカメラ4を用いたので、移動方向正面や、移動方向の背面など、どの方向の視点にもフレームの切れ目を生じさせることなく、視野が連続した動画を生成することができる。
【0037】
さらに、この実施形態では、
図8に示すように、1枚撮影された全天球の画像41から、π/6ずつ回転させた6枚の回転画像42a~47aを生成して、それぞれにおいて画像の歪みの少ない低緯度の部分だけを使って特徴点抽出が行なわれている。このため、さらに、歪みの影響の少ない多数の特徴点が全体画像49の特徴点としてまとめられる。従って、隣接フレーム間の姿勢変化を計算する際にも、移動量の推定の精度を向上させることが出来、さらに動画の視点の位置を安定させることができる。
【0038】
<実施例>
図12は、実施形態の変形例の画像生成装置Sで、撮像部としての全天球カメラ14が内蔵されたボール30の構成を示す分解斜視図である。なお、前記実施形態と同一乃至均等な部分については、説明を省略する。
この変形例のボール30は、中空半球形状の透明アクリル樹脂製の一対のドーム31,32を係合させて、外形形状が球体となるように構成されている。
ボール30の内部には、固定用円形板15が設けられている。固定用円形板15は、ドーム31,32の内側面31a,32aに、移動不能となるように固定されている。そして、固定用円形板15の一部には、全天球カメラ14を固定する装着孔16が開口されている。
【0039】
また、この変形例の全天球カメラ14は、箱型の筺体14aの表,裏両側面14bに、それぞれに撮影可能画角が180度以上、好ましくは約270度程度の2つのレンズ14c,14cが設けられている。そして、固定用円形板15の装着孔16に筺体14aを嵌着させた状態で、ドーム31,32の略中心に、2つのレンズ14c,14cが配置されるように構成されている。
このため、この全天球カメラ14は、2つのレンズの画像を合成することにより、周囲を360度撮影した全天球の画像を生成できる。
【0040】
このように構成された変形例の全天球カメラ14では、表,裏両側面14bに設けられた2つのレンズ14cによって、周囲を360度撮影することが可能である。このため、この変形例の全天球カメラ14では、実施形態の作用効果に加えて、さらに少ないカメラの台数で、どの方向にも切れ目なく、動画のフレームを連続させて、一定の方向に視線を安定させた動画を円滑に生成することができる。
【0041】
<他の実施形態>
図13~
図22は、他の実施形態として、医療用のカプセル内視鏡80に本発明の画像生成装置および画像生成プログラムを適用したものを示している。
近年,医療分野では、
図13に示すように、魚眼レンズ83,83を有して、広範囲を撮影可能なカメラ82,82を両端に内蔵しているカプセル内視鏡80が普及してきた。カプセル内視鏡80は、
図14に示すように被験者kの嚥下により消化器官内を流下させながら周囲の器官を内側から撮像する。これにより、身体の内部が容易に確認できる。
【0042】
一方で、カプセル内視鏡80はいくつか問題点を抱えている。たとえば、二つのカメラ82,82から得られた映像を同時に観察することができない問題点がある。
この問題点に対して、カメラ82,82から得られた映像から全天球動画を生成することにより、施術者は、二つの映像の位置関係を一目で認識できるようになる。
【0043】
しかしながら、この際、カプセル内視鏡80は体内で回転しながら進むため、単純に全天球動画を生成したとしても、カプセル内視鏡80がどのように進んでいるのかがわかりにくい。
このため、カプセル内視鏡80から得られた映像に対して、前記実施形態にて説明した全天球動画を安定化させる手法を応用することで、この課題を解決する。
【0044】
そこで、他の実施形態の構成を説明すると、
図13に示すように、カプセル内視鏡80は、小型のカメラ82,82を内蔵したカプセル型の内視鏡のことである。カプセル内視鏡80は、片側のみ、または両端に一つずつ、撮像部としての小型カメラをつけた形式のものが存在する。
このうち、この実施形態では、両側に小型のカメラ82,82を有するカプセル内視鏡を用いて説明する。この形式のカプセル内視鏡80は、円筒状の筒部材84の軸方向両端に、それぞれ小型のカメラ82,82が装着されている。
筒部材84の軸方向の各端部には、ほぼ半球状を呈して透明のオプティカルドーム86,86が端部の開口を塞ぐように装着されている。そして、各カメラ82は、それぞれ端部に装着されたオプティカルドーム86により覆われている。
【0045】
筒部材84の各端部に設けられているカメラ82,82は、2つ合わせて360度に近い全天球映像を撮影することができる。
そして、この撮影された映像は、カプセル内視鏡80に内蔵された無線送信装置によって、被験者kに取り付けられたレコーダ87(
図14)に送信される。レコーダ87は、被験者kの身体に取り付けられたセンサ88に接続されている。レコーダ87では、前記した実施形態と同様に制御部12(
図1参照)によって演算された動画が表示部13のモニタに出力される。施術者は、レコーダ87に送られてくる画像を、表示部13を通じて被験者の身体の外方で見ることができる。
この際、センサ88による位置情報と撮影された動画とが結びつけられていて、体内の位置が特定されるようにしてもよい。
【0046】
<画像欠落への対処>
発明者らが提案した前記実施形態の全天球動画安定化手法では、ボールに取り付けられたカメラによって撮影された全天球映像から、回転成分を除去して視点を固定する。
回転しながら移動するという点で前記実施形態のボールカメラと、この実施形態のカプセル内視鏡80とは、共通している。
そこで、このカプセル内視鏡80に前記実施形態の安定化方法を適用すると、回転しながら移動するカプセル内視鏡80の映像を施術者が見やすいよう安定化させることができる。
【0047】
図13に示すように、この実施形態のカプセル内視鏡80は、軸線L上に180度反対側を向く2つの小型のカメラ82,82を配置している。全天球画像は、これらの2つのカメラ82,82で撮影される魚眼画像を正距円筒図法やキューブマップ法などによって変換することで作られる。
しかしながら、カプセル内視鏡80の映像は、
図15に示すように、完全な円形の魚眼映像(円周魚眼の影像)ではなく、対角線魚眼の影像であるため、上下左右の部分a~dが切取られてしまう。
また、それぞれのカメラの画角angは約172度となり、0~4度、176度~180度の部分は撮影されていない。このため、単に2つのカメラ82,82の画像を合せただけでは、360度の撮影画像を得ることができない。
【0048】
さらに、カプセル内視鏡80に内蔵されたそれぞれのカメラ82,82は、常に同期しながら撮影しているのではなく、それぞれが独立して撮影している。つまり、2つのカメラ82,82で撮影された画像のタイムスタンプが一致していない。このため、容易に全天球画像を作ることができない。
【0049】
使用したカプセル内視鏡80は、バッテリの容量を考慮し断続的に撮影していたり、上述したように移動速度によってフレームレートを変化させながら撮影している。たとえば、消化管内でのカプセル内視鏡80の移動が遅い場合は、毎秒4枚、速い場合には、毎秒35枚というように、カプセル内視鏡80の移動速度に合わせて枚数が調整されながら撮影される。
このため、一部のフレームが欠損する場合がある。
【0050】
また、カプセル内視鏡80は、内臓という狭い空間で、内臓の内壁面に接触しながら撮影している。このため、画像が全体的に暗く鮮明ではない。よって、撮影された映像は、撮影開始から撮影終了まで完全に連続した映像とはならない。
ところで、視点固定アルゴリズムでは、フレーム間で特徴点マッチングを行う。このため、全天球動画を作る上で画像の特徴点が得られるか否かは、画像を安定させるために大きく影響する。
【0051】
たとえば、
図16に示すように、画像番号としては前方のカメラ82が撮影した映像のフレームがF1.F3.F5・・・と奇数番号で、後方のカメラ82が撮影した映像のフレームがF2.F4.F6・・・のように偶数番号となっている。
図16では、フレームレートが一定ではない場合に、途中のフレームが欠損していることを表している。
【0052】
前記実施形態のアルゴリズムを用いた安定化の手法では、フレーム間の特徴点マッチングが行なわれ、姿勢変化が求められた後、回転行列と並進ベクトルとに分解される。
そして、基準フレームからの累積回転行列を現在のフレームにかけることで画像を修正している。この操作を全てのフレームに対して行うことで全天球動画の視点を固定することが可能となる。
しかしながら、このアルゴリズムでは、基準フレームからの姿勢変化を累積回転行列で修正しているため、途中のフレーム間での姿勢変化の推定に失敗してしまうとそれ以降の特徴点のマッチングが行えず、画像を修正できなくなってしまう虞があった。
たとえば、前記実施形態の画像生成装置では、フレーム間の特徴点マッチングのマッチング数がある閾値以下になった場合に姿勢推定が失敗したと判定している。
【0053】
Rijをframe i とframe j 間の姿勢変化とすると、次の式1にて表される。
【式1】
【0054】
図17は、特徴点マッチングが成功した一例を示す模式的な概念図である。また、
図18は、特徴点マッチングが失敗した一例を示す模式的な概念図である。
【0055】
本実施形態は、フレームの欠損および2つのカメラ82,82の非同期といった問題を解決するため、途中のフレームを補完し、両側のカメラ82,82で撮影したフレーム数を同じとすることで擬似的に連続した魚眼映像(擬似円周魚眼の画像)としている。すなわち、欠損しているフレームと前のフレームとを入れ替える。これにより、欠落しているフレーム部分が円滑に接続されて、擬似的に連続した魚眼映像を得られる。
この際、具体的に制御部12は、それぞれのカメラ82,82で撮影された画像同士のタイムスタンプが合っておらず、それを合わせるのは困難であると判断すると、同じ番号のフレームは、同じ時刻で撮影されたものとして処理を行うように構成されている。
【0056】
図15を参照しながら説明すると、このように、不完全な魚眼画像から全天球画像への変換を行うため、
図15の画像では、1つのカメラ82の画角が180度より小さく(たとえば172度)、上下左右に切り取られた部分a~dを有している。
そこで、
図19に示すように、仮想的に画角が180度の円として扱うことにより、正距円筒図法を用いて変換することができる。
【0057】
図19は、欠落したフレームを補完した様子を説明する模式的な概念図である。
図19では、撮影画像の部分a~dの境界線から外側の円までの間は死角の黒い画像として扱う。このため、
図15の画像では、欠落していた上下左右の部分a~dが黒い画像で補完されている。全天球画像に変換した場合に周囲に現れる黒い帯は、この箇所が変換されたものである。
図20は、欠落したフレームを補完する様子を説明する模式的な概念図である。
図21は、不完全な魚眼画像から全天球の画像に変換したことを説明する模式的な概念図である。カメラ82で撮影された状態の生データから全天球画像を作成する具体的な手順としては、(1)生データから時刻情報など不要な箇所を切り取る。(2)同じ時刻で撮影されたと仮定した2枚の魚眼画像の欠落する部分を補完後、左右に並べて1枚の画像にする。(3)正距円筒図法で全天球画像に変換する。(1)~(3)の処理を全てのフレームに対して行う。そして、フレーム間を連結することで全天球動画に変換することができる。
【0058】
<特徴点照合処理>
特徴点を結びつけて連続させる際に、欠落した画像が存在すると、円滑な動画を得にくい。そこで、フレームの欠落する部分を修正により復帰させる。
図22は、フレームにエラーフレームが発生した場合に、修正により復帰したフレームの様子を説明する模式的な概念図である。
全天球動画安定化手法のアルゴリズムでは、特徴点マッチングが失敗すると意味のある映像としては、そこで終了してしまう(
図22中右上部分参照)という問題点があった(以下、失敗した時点でのフレームをエラーフレームと呼ぶ)。
この実施形態の画像生成装置では、この問題を解決するために、特徴点マッチングが失敗したら、そこで、累積回転行列を単位行列で初期化し、次のフレームを基点として処理を再び開始するように、前記実施形態のボールカメラを改良してカプセル内視鏡80に適用した。
なお、エラーフレームと前フレーム間の回転行列も単位行列で初期化するため、基点フレームの視点はプログラムを開始した時点のフレームの視点とは異なる。つまり、マッチングが失敗する度に視点はエラーフレームの視点に固定されてしまう。
【0059】
次に、この実施形態のカプセル内視鏡80を用いた画像生成装置の実施例について説明する。
使用したカプセル内視鏡80は、画角は172×2度,フレームレートは移動速度に応じて変化し、毎秒4フレームから35フレームで、大腸粘膜を撮影することができる大腸カプセル内視鏡を用いた。カプセル内視鏡80に用いるカメラ82,82の非同期やフレームが欠損しているという問題点は、フレームレートを一定にすることにより解決してもよい。
【0060】
カプセル内視鏡80は、画角が172×2度であるため、死角が存在する。全天球動画に変換した際に3つの部分に別れてしまっているため、わかりにくいが、ある程度視点は固定されていると判断した。
しかし,明らかに誤った推定により不自然に修正されている箇所もあり完全とは言えない。また、特徴点マッチングが失敗して回転行列が得られなかった場合には,次のフレームを基点として処理を再実行することができた。
【0061】
この結果を
図23に示す。
図23は、比較例の画像を左側に示している。この比較例では、既存手法においてエラー後、意味のない画像が流れる様子である。また、
図23中右側の画像が本実施形態のカプセル内視鏡80を用いた画像生成装置の画像生成プログラムで、エラー後も回転を推定できるように改良された様子を示す模式的な概念図である。
しかしながら、このように修正により連続させても、マッチングが失敗したと判断されるのは回転行列が得られなかった時のみであり、誤った推定で得られた回転行列によって不正確な回転が行われた際には検知することができない。
このため、誤った回転をしたまま処理が進んでしまうことがあった。
【0062】
このように、視点固定アルゴリズムをカプセル内視鏡80に適用した結果、いくつかの問題点が見つかった。
1つ目に、死角が多く動画自体が見にくいという点である。今回は不完全な魚眼画像から全天球画像を作成したため死角が多かった。これは、カプセル内視鏡80の性能の向上により画角が180度以上のものを2つ使用できれば、撮影できる範囲が広がり、死角のない完全な全天球画像を作ることができる。すなわち、完全な全天球画像であれば、2つの魚眼映像のつながりが分かるため、視認しやすい。
【0063】
これに対して本実施形態の画像生成装置では、
図15および
図19に示すように、死角となる上下左右の部分a~dが黒い画像で補完されている。
これにより、完全な全天球画像でなくとも、2つの魚眼映像のつながりが分かりやすくなった。
【0064】
2つ目は、特徴点マッチングによる誤った推定やマッチング数が少ないために回転が推定できないという点である。特徴点マッチングは画像中に特徴点が多いほど成功しやすい。しかしながら、カプセル内視鏡80の映像の様に内臓に密着した状態で撮影されるものでは、暗く特徴点が少ない画像となる。このような場合は、特徴点が検出できず誤推定や失敗となる可能性が高い。
また、内臓のように周囲の状況が常に変化する映像ではカメラが回転したものと判断され、誤推定の原因になると考えられる。
【0065】
次に、
図24のフローチャートおよび
図25に沿って画像生成装置の処理について説明する。なお、前記実施形態の
図7と同一乃至均等な部分については、説明を省略する。
図24のフローチャート中、ステップS00~ステップS12までは、前記実施形態のステップS0~ステップS2までと同様に、取得された画像(ステップS00)のフレーム(ステップS10)から特徴点を抽出(ステップS11)して、次のフレームと特徴点の照合(ステップS12)を行う(
図25中第1行目および第2行目参照)。
【0066】
ステップS16では、照合が失敗したかあるいは成功したかの判定を行う。ステップS16で照合が成功した場合は、次のステップS13に進み(ステップS16にてNO)、ステップS16で照合が失敗した場合は、ステップS10に戻り(ステップS16にてYES)、フレームの取得を行う。
【0067】
ステップS13~ステップS15までは、前記実施形態のステップS3~ステップS5までと同様に、姿勢変化の推定が行われ(
図10参照)、結果を用いて8点アルゴリズムによって2つのフレームから得られる姿勢変換行列Rを用いて、ステップS14では、姿勢修正が行われる。
【0068】
図25の第3行目に示す従来の安定化手法では、照合の失敗が生じるとフレーム間の結びつけが行えず、そのフレームの集合で無意味な画像E1,E2…が、処理が終了するまで継続して生成されてしまう。
これに対して、
図25の第4行目に示すこの実施形態の安定化終了では、照合の失敗が生じると、取得されている画像の次のフレームの画像G1を用いて、エラーした画像E1を補完する。
取得された次のフレームの画像G1が照合可能である場合、特徴点を一致させて、姿勢を修正する安定化処理を継続できる。なお、照合が成功しない場合は、照合が成功するまでステップS10を繰り返す。
このため、取得した画像に不連続点があっても、直ちに次のフレームへ照合が成功するフレームが割り当てられて、エラーから復帰する。したがって、照合が失敗した場合でもフレームの切れ目が目立たない安定した見やすい画像が得られる。
【0069】
ステップS15では、前記実施形態のステップS5と同様に、次のフレームがあるか否かが判定される。ステップS15にて、次のフレームがある場合(ステップS15にてYes)、ステップS10に戻り、特徴点の抽出が継続して行われる(ステップS11~ステップS12)。また、ステップS15にて、次のフレームがない場合(ステップS15にてNo)、前記実施形態と同様に制御部12は、処理を終了する。
【0070】
次に、この実施形態の画像生成装置の作用効果について説明する。この実施形態の画像生成装置では、カプセル内視鏡80で撮影された映像を全天球映像に変換し、視点固定のアルゴリズムを適用した。
そして、元のアルゴリズムでは特徴点マッチングに失敗するとそれ以降は修正できないという問題点(
図22中右上部分参照)があったが、この実施形態の画像生成装置の画像生成プログラムのように基点フレームを更新することで失敗した後も視点を固定して、エラーから復帰して、画像を継続すること(
図22中右下部分参照)ができた。
なお、失敗する度に視点が変わってしまうことを防止するため、カルマンフィルタなどを用いて回転行列を推定するなどを行うとさらに望ましい。
【0071】
また、内視鏡映像に死角が存在する場合は、カプセル内視鏡80の性能の向上により画角が180度以上のものを2つ使用することにより、撮影可能な範囲を広げて、死角のない完全な全天球画像を作るようにしてもよい。
【0072】
さらに、カプセル内視鏡80によって撮影される映像自体が暗い場合には、LED照光装置の補助光を使用したり、あるいはISO感度を高感度なものに変更する等、カプセル内視鏡80に用いるカメラ82の性能を向上させるとなおよい。
【0073】
<変形例1>
図26は、実施形態の変形例1のクレーン車50を示している。このクレーン車50は、アーム部51の先端から延出されるワイヤ52の一端にフック部材53が吊り下げられている。そして、このフック部材53に、前記実施形態のボール3等が係止され、運転席54から離間した位置まで延伸されたアーム部51の先端から、ボール3を下降させることができる。
これにより、災害現場等により人が入れない空間にボール3を侵入させて、内部の様子を安定した画像で撮影することができる。
【0074】
<変形例2>
図27は、実施形態の変形例2のドローン(無人機)60を示している。ドローン60の機体中央部下面側61には、前記実施形態のボール3または、他の実施形態のカプセル内視鏡80と同等のカメラ62が装着されていて、操縦者から離間した位置でドローン60の周囲の様子を安定した画像で撮影することができる。
ドローン60は、遠隔操作が可能であるため、オペレータは、災害現場から離れていても現場の様子を詳細に撮影することができ、二次災害を防止できる。
【0075】
<変形例3>
図28は、実施形態の変形例3の釣り竿70である。ロッド71の手もとに固定されているリール72は、複数のガイド73通して、釣り糸74が繰り出されている。釣り糸74の先端には、実施形態のボール3または、他の実施形態のカプセル内視鏡80と同等のカメラ75が装着されている。
そして、ロッド71を握る地上の者から離間した位置で、釣り糸74の先端のカメラ75を降ろして、水中の様子を安定した画像で撮影することができる。
【0076】
以上、本実施形態に係る画像生成装置S、および画像生成プログラムについて詳述してきたが、本発明はこれらの実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更可能であることは言うまでもない。
【0077】
例えば、本実施形態では、撮影された1枚の全天球の画像41からπ/6ずつ回転させた6枚の回転画像42a~47aを生成している。しかしながら、特にこれに限らない。たとえば、π/4又はπ/8ずつ回転させた4枚又は8枚の画像等、回転角度が相違する1枚または複数の画像をどのような回転方向の角度の間隔で用いてもよく、それぞれにおいて画像の歪みの少ない低緯度の部分を使って特徴点の抽出が行なえるものであればよい。
【0078】
さらに、実施形態では、6台のカメラ4によって、また変形例では、2台に相当する2つのレンズ14cを有する全天球カメラ14によって、撮像部1を構成している。しかしながら特にこれに限らない。たとえば、1又は2台以上の複数のカメラを用いて撮像部1を構成してもよく、撮影した動画が全天球動画となり、全天球動画は、好ましくは全方向の情報を記録することができるものであれば、カメラの数量、形状および組み合わせが特に限定されるものではない。
【0079】
たとえば、前記他の実施形態では、
図13に示すように、魚眼レンズ83,83を有していて、広範囲を撮影可能なカメラ82,82を両端に内蔵しているカプセル内視鏡80を用いているが、特にこれに限らない。たとえば、一方側または他方側とのうち、少なくとも何れか一方にカメラ82が設けられていて、広範囲を撮影可能なカメラ82,82であれば、魚眼レンズ83以外の広角レンズであってもよく、カメラ82やレンズの形状、数量、および材質が特に限定されるものではない。
【0080】
また、実施形態および変形例では、撮像部1を装着する物体としてボール3,30を用いているが、特にこれに限らない。たとえば、回転移動可能な立方体のフレームの各面に全天球カメラを装着してもよい。また、ラグビーボールのような楕円球であってもよい。このように、回転運動を伴い移動する物体の形状は、球形に限定されるものではない。
【0081】
そして、実施形態の画像生成装置Sでは、ボールが同時に、回転運動する場合および並進運動する場合について説明してきたが特にこれに限らず、回転運動または並進運動のうち、少なくとも何れか一方を行うものであればよい。
【符号の説明】
【0082】
1 撮像部
3,30 ボール
4 カメラ
5,14c レンズ
10 通信インターフェース部
11 記憶部
12 制御部
13 表示部
14 全天球カメラ(カメラ)
14a 筺体
15 固定用円形板
16 装着孔
20 入力部
31 ドーム
80 カプセル内視鏡
82 小型のカメラ(撮像部)
100 ネットワーク