(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-29
(45)【発行日】2023-10-10
(54)【発明の名称】画像処理装置及び画像処理プログラム
(51)【国際特許分類】
G01H 9/00 20060101AFI20231002BHJP
G06T 7/00 20170101ALI20231002BHJP
G06T 7/20 20170101ALI20231002BHJP
G06T 7/262 20170101ALI20231002BHJP
H04N 23/60 20230101ALI20231002BHJP
【FI】
G01H9/00 Z
G06T7/00 610Z
G06T7/20 100
G06T7/262
H04N23/60 100
(21)【出願番号】P 2019227634
(22)【出願日】2019-12-17
【審査請求日】2022-10-05
(73)【特許権者】
【識別番号】000003621
【氏名又は名称】株式会社竹中工務店
(73)【特許権者】
【識別番号】304020177
【氏名又は名称】国立大学法人山口大学
(74)【代理人】
【識別番号】100084995
【氏名又は名称】加藤 和詳
(74)【代理人】
【識別番号】100099025
【氏名又は名称】福田 浩志
(72)【発明者】
【氏名】三浦 一幸
(72)【発明者】
【氏名】長 篤志
【審査官】福田 裕司
(56)【参考文献】
【文献】特開2018-136191(JP,A)
【文献】特開2006-180479(JP,A)
【文献】特開2017-075887(JP,A)
【文献】特開2019-179316(JP,A)
【文献】特開平07-129777(JP,A)
【文献】米国特許出願公開第2017/0299427(US,A1)
【文献】国際公開第2019/097577(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G01H 9/00
G06T 7/00
G06T 7/20
G06T 7/262
H04N 23/60
(57)【特許請求の範囲】
【請求項1】
複数の物体が被写体として含まれ、かつ、撮影装置による撮影によって得られた動画像を取得する取得部と、
前記取得部によって取得された動画像における、各々前記複数の物体の何れかの領域である複数の物体領域を抽出する抽出部と、
前記取得部によって取得された動画像における、前記抽出部によって抽出された前記複数の物体領域の各々に対する振動解析を行い、前記複数の物体領域の各々の間で共通となる振動成分を前記撮影装置の振動成分であるとして特定する特定部と、
を備えた画像処理装置。
【請求項2】
前記抽出部は、前記動画像に含まれるS/N比が所定レベル以上である領域を検出し、検出した領域における空間的に連続する部分画素群の各領域を前記複数の物体領域として抽出する、
請求項1に記載の画像処理装置。
【請求項3】
前記動画像に対して複素空間フィルタリング処理を行うことにより位相画像を生成する生成部と、
前記抽出部によって抽出された前記複数の物体領域について、前記生成部によって生成された位相画像の前記動画像における各フレーム画像間の変動を示す信号である位相変動信号を導出する導出部と、
前記導出部によって導出された位相変動信号を、周波数解析によって時間周波数スペクトルに変換する変換部と、
前記変換部によって得られた時間周波数スペクトルを用いて、同一領域内の時間周波数スペクトルを平均化した位相変動スペクトルを前記複数の物体領域の各々について算出する算出部と、
を更に備え、
前記特定部は、前記算出部によって算出された位相変動スペクトルにおいて、前記複数の物体領域に共通するピーク周波数を含む所定周波数範囲を、前記撮影装置の振動成分であるとして特定する、
請求項1又は請求項2に記載の画像処理装置。
【請求項4】
前記導出部は、前記位相画像がラッピングされた位相である場合、当該位相画像の各画素の位相に対してアンラップ処理を行った後に前記位相変動信号を導出する、
請求項3に記載の画像処理装置。
【請求項5】
複数の物体が被写体として含まれ、かつ、撮影装置による撮影によって得られた動画像を取得し、
取得した動画像における、各々前記複数の物体の何れかの領域である複数の物体領域を抽出し、
取得した動画像における、抽出した前記複数の物体領域の各々に対する振動解析を行い、前記複数の物体領域の各々の間で共通となる振動成分を前記撮影装置の振動成分であるとして特定する、
処理をコンピュータに実行させるための画像処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置及び画像処理プログラムに関する。
【背景技術】
【0002】
大地震が発生した直後の建物の健全性を評価する際には、当該建物の詳細な診断を行うに先立って避難要否の判断を行うための一次的な診断が重要となる。そこで、本発明の発明者らは、特許文献1において、加速度センサ等に依存せずに一次的な簡易診断が可能となり得る建物の健全性の診断を行うシステムを提案している。
【0003】
このシステムでは、撮影装置により対象となる建物が撮影された動画像を解析することで得られる、当該建物の固有振動数の地震発生前後の変化率等をもとに当該建物の健全性を数値化することができる。
【0004】
対象となる建物の固有振動数を算出する場合において、特許文献2~3及び非特許文献1に開示されている技術等を用いて動画像中の微振動成分を検出することで固有振動数を算定する場合には、撮影装置自身が微振動環境下に存在すると撮影装置の振動と建物の振動との切り分けが必要となる。
【0005】
撮影装置の振動と建物の振動との時間周波数特性及び空間周波数特性が十分に異なる場合は、特許文献1にも記載されているように時空間周波数領域上で分離することが可能となる。しかし、撮影装置の振動特性と建物の振動特性とが時空間周波数領域上でラップする場合は単純に分離することができないため、本来計測したい建物の振動の固有振動数等の特性を正しく評価できない場合がある。
【0006】
一方で、撮影装置の振動を軽減させる技術として、撮影装置と三脚等の付帯器具とを含めた撮影システム全体の重量を重くする、防振ゴムやスプリング等の器具を導入する等といった物理的な防振対策も考えられる。しかし、この対策では、地盤の振動等に含まれる数Hz以下程度の周波数帯域での劇的な効果は期待できない。
【0007】
そこで、撮影装置の振動成分を検出(さらには除去まで)できるソフトウェア的な処理が必要とされている。なお、このようなソフトウェア的な対策は、特許文献1に記載されている移動撮影による建物の健全性を診断する用途に限らず、固定撮影での建物の健全性の診断の用途も含む、特許文献2~3及び非特許文献1に代表される被写体の時空間フィルタリングに基づく動画像処理のみの振動解析手法において全般的に有用である。
【0008】
ソフトウェア的な振動成分の検出処理及び除去処理に関する技術として、特許文献4には、機械式又は光学式ではない、デジタル式の手ぶれ補正技術が開示されている。この技術では、観賞や記録等の目視用途、パノラマ合成や3次元再構成等の画像間のマッチング用途等において、撮影装置自身の動きに起因する画像上の変動を除去することができる。
【先行技術文献】
【特許文献】
【0009】
【文献】特開2018-136191号公報
【文献】米国特許出願公開第2014/0072190号明細書
【文献】米国特許第9324005号明細書
【文献】特開2019-004451号公報
【非特許文献】
【0010】
【文献】J.G. Chen, A. Davis, N. Wadhwa, F. Durand, W.T. Freeman, and O. Buyukozturk, “Video Camera-based Vibration Measurement for Condition Assessment of Civil Infrastructure”, International Symposium Non-Destructive Testing in Civil Engineering (2015)
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかしながら、目視用途で主に検出や除去を行わなければならない対象は、数画素(ピクセル)以上に及ぶ変動成分であり、特許文献4に開示されている技術では、サブピクセル級の極微細な変動の検出等についてはなんら記載されていない。また、マッチング用途ではサブピクセル級の精度が要求される場合があるが、複数の画素の対応関係に基づく幾何変換をベースとすることが多く、建物の常時微動を撮影した動画像のような、一見すると動きが存在しないような被写体において撮影装置の振動成分が混入した場合に正しく機能するとは限らない。
【0012】
本開示は、以上の事情を鑑みて成されたものであり、動画像から撮影装置の微細な振動成分を精度良く検出することができる画像処理装置及び画像処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0013】
請求項1に記載の本発明に係る画像処理装置は、複数の物体が被写体として含まれ、かつ、撮影装置による撮影によって得られた動画像を取得する取得部と、前記取得部によって取得された動画像における、各々前記複数の物体の何れかの領域である複数の物体領域を抽出する抽出部と、前記取得部によって取得された動画像における、前記抽出部によって抽出された前記複数の物体領域の各々に対する振動解析を行い、前記複数の物体領域の各々の間で共通となる振動成分を前記撮影装置の振動成分であるとして特定する特定部と、を備える。
【0014】
請求項1に記載の本発明に係る画像処理装置によれば、撮影装置による撮影によって得られた動画像における、各々複数の物体の何れかの領域である複数の物体領域を抽出し、上記動画像における、上記複数の物体領域の各々に対する振動解析を行い、当該複数の物体領域の各々の間で共通となる振動成分を上記撮影装置の振動成分であるとして特定することで、動画像から撮影装置の微細な振動成分を精度良く検出することができる。
【0015】
請求項2に記載の本発明に係る画像処理装置は、請求項1に記載の画像処理装置であって、前記抽出部は、前記動画像に含まれるS/N比が所定レベル以上である領域を検出し、検出した領域における空間的に連続する部分画素群の各領域を前記複数の物体領域として抽出する。
【0016】
請求項2に記載の本発明に係る画像処理装置によれば、動画像に含まれるS/N比が所定レベル以上である領域を検出し、検出した領域における空間的に連続する部分画素群の各領域を上記複数の物体領域として抽出することで、より簡易に当該複数の物体領域を高い信頼性で抽出することができる。
【0017】
請求項3に記載の本発明に係る画像処理装置は、請求項1又は請求項2に記載の画像処理装置であって、前記動画像に対して複素空間フィルタリング処理を行うことにより位相画像を生成する生成部と、前記抽出部によって抽出された前記複数の物体領域について、前記生成部によって生成された位相画像の前記動画像における各フレーム画像間の変動を示す信号である位相変動信号を導出する導出部と、前記導出部によって導出された位相変動信号を、周波数解析によって時間周波数スペクトルに変換する変換部と、前記変換部によって得られた時間周波数スペクトルを用いて、同一領域内の時間周波数スペクトルを平均化した位相変動スペクトルを前記複数の物体領域の各々について算出する算出部と、を更に備え、前記特定部は、前記算出部によって算出された位相変動スペクトルにおいて、前記複数の物体領域に共通するピーク周波数を含む所定周波数範囲を、前記撮影装置の振動成分であるとして特定する。
【0018】
請求項3に記載の本発明に係る画像処理装置によれば、動画像に対して複素空間フィルタリング処理を行うことにより位相画像を生成し、上記複数の物体領域について、生成した位相画像の上記動画像における各フレーム画像間の変動を示す信号である位相変動信号を導出し、導出した位相変動信号を、周波数解析によって時間周波数スペクトルに変換し、当該時間周波数スペクトルを用いて、同一領域内の時間周波数スペクトルを平均化した位相変動スペクトルを上記複数の物体領域の各々について算出し、算出した位相変動スペクトルにおいて、上記複数の物体領域に共通するピーク周波数を含む所定周波数範囲を、上記撮影装置の振動成分であるとして特定することで、より高精度に撮影装置の振動成分を特定することができる。
【0019】
請求項4に記載の本発明に係る画像処理装置は、請求項3に記載の画像処理装置であって、前記導出部は、前記位相画像がラッピングされた位相である場合、当該位相画像の各画素の位相に対してアンラップ処理を行った後に前記位相変動信号を導出する。
【0020】
請求項4に記載の本発明に係る画像処理装置によれば、上記位相画像がラッピングされた位相である場合、当該位相画像の各画素の位相に対してアンラップ処理を行った後に上記位相変動信号を導出することで、より高精度に当該位相変動信号を導出することができる。
【0021】
請求項5に記載の本発明に係る画像処理プログラムは、複数の物体が被写体として含まれ、かつ、撮影装置による撮影によって得られた動画像を取得し、取得した動画像における、各々前記複数の物体の何れかの領域である複数の物体領域を抽出し、取得した動画像における、抽出した前記複数の物体領域の各々に対する振動解析を行い、前記複数の物体領域の各々の間で共通となる振動成分を前記撮影装置の振動成分であるとして特定する、処理をコンピュータに実行させる。
【0022】
請求項5に記載の本発明に係る画像処理プログラムによれば、撮影装置による撮影によって得られた動画像における、各々複数の物体の何れかの領域である複数の物体領域を抽出し、上記動画像における、上記複数の物体領域の各々に対する振動解析を行い、当該複数の物体領域の各々の間で共通となる振動成分を上記撮影装置の振動成分であるとして特定することで、動画像から撮影装置の微細な振動成分を精度良く検出することができる。
【発明の効果】
【0023】
以上説明したように、本発明によれば、動画像から撮影装置の微細な振動成分を精度良く検出することができる。
【図面の簡単な説明】
【0024】
【
図1】実施形態に係る画像処理装置のハードウェア構成の一例を示すブロック図である。
【
図2】実施形態に係る画像処理装置の機能的な構成の一例を示すブロック図である。
【
図3】実施形態に係る動画像データベースの構成の一例を示す模式図である。
【
図4】実施形態に係る振動成分特定処理の一例を示すフローチャートである。
【
図5】実施形態に係る動画像(代表画像)の一例を示す正面図である。
【
図6A】実施形態に係る位相画像(水平成分)の一例を示す正面図である。
【
図6B】実施形態に係る位相画像(垂直成分)の一例を示す正面図である。
【
図7A】実施形態に係る動画像の一部画像の一例を示す正面図である。
【
図7B】
図7Aに示す画像に対してラベリング処理を実施した結果の一例を示す正面図である。
【
図8】実施形態に係る位相変動信号の一例を示すグラフである。
【
図9】実施形態に係るサンプル画像(正弦波画像)の一例を示す正面図である。
【
図10】実施形態に係る時間周波数スペクトルの一例を示すグラフである。
【
図11】実施形態に係る実証実験の説明に供する時間周波数スペクトルの一例を示すグラフである。
【発明を実施するための形態】
【0025】
以下、図面を参照して、本発明を実施するための形態例を詳細に説明する。なお、本実施形態では、本発明を、風加振や地盤振動の影響下での微動状態における建物を撮影した動画像を処理対象とした画像処理装置に適用した場合について説明する。
【0026】
まず、
図1及び
図2を参照して、本実施形態に係る画像処理装置10の構成を説明する。なお、画像処理装置10の例としては、パーソナルコンピュータ及びサーバコンピュータ等の情報処理装置が挙げられる。
【0027】
図1に示すように、本実施形態に係る画像処理装置10は、CPU(Central Processing Unit)11、一時記憶領域としてのメモリ12、不揮発性の記憶部13、キーボードとマウス等の入力部14、液晶ディスプレイ等の表示部15、媒体読み書き装置(R/W)16及び通信インタフェース(I/F)部18を備えている。CPU11、メモリ12、記憶部13、入力部14、表示部15、媒体読み書き装置16及び通信I/F部18はバスB1を介して互いに接続されている。媒体読み書き装置16は、記録媒体17に書き込まれている情報の読み出し及び記録媒体17への情報の書き込みを行う。
【0028】
記憶部13はHDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等によって実現される。記憶媒体としての記憶部13には、振動成分特定プログラム13Aが記憶されている。振動成分特定プログラム13Aは、振動成分特定プログラム13Aが書き込まれた記録媒体17が媒体読み書き装置16にセットされ、媒体読み書き装置16が記録媒体17からの振動成分特定プログラム13Aの読み出しを行うことで、記憶部13へ記憶される。CPU11は、振動成分特定プログラム13Aを記憶部13から読み出してメモリ12に展開し、振動成分特定プログラム13Aが有するプロセスを順次実行する。また、記憶部13には、動画像データベース13B、複素空間フィルタデータベース13C等の各種データベースが記憶される。
【0029】
本実施形態に係る画像処理装置10は、通信I/F部18に、動画像の撮影を行う撮影装置20が接続される。撮影装置20は、撮影時に複数の建物を含むように撮影を行うためのものである。なお、撮影装置20による撮影方法は、空撮、地上での人による移動撮影、三脚や固定部材等を用いた固定撮影等の何れの方法でもよい。また、本実施形態では、撮影装置20としてカラー画像を撮影する撮影装置を適用しているが、これに限定されるものではなく、例えば、モノクロ画像を撮影する撮影装置を撮影装置20として適用する形態としてもよい。
【0030】
次に、
図2を参照して、本実施形態に係る画像処理装置10の機能的な構成について説明する。
図2に示すように、画像処理装置10は、取得部11A、抽出部11B、生成部11C、導出部11D、変換部11E、算出部11F及び特定部11Gを含む。画像処理装置10のCPU11が振動成分特定プログラム13Aを実行することで、取得部11A、抽出部11B、生成部11C、導出部11D、変換部11E、算出部11F及び特定部11Gとして機能する。
【0031】
本実施形態に係る取得部11Aは、複数の物体が被写体として含まれ、かつ、撮影装置20による撮影によって得られた動画像を取得する。なお、本実施形態では、上記物体として、建物を適用しているが、これに限定されるものではない。例えば、橋、塔等の建物を除く建造物、山、樹木等の自然物や、脈動などの生体情報、空調ダクトや変圧器などの設備機器、またはこれらの複数種類の組み合わせ等を上記物体として適用する形態としてもよい。
【0032】
また、本実施形態に係る抽出部11Bは、取得部11Aによって取得された動画像における、各々上記複数の物体の何れかの領域である複数の物体領域を抽出する。そして、本実施形態に係る特定部11Gは、取得部11Aによって取得された動画像における、抽出部11Bによって抽出された複数の物体領域の各々に対する振動解析を行い、当該複数の物体領域の各々の間で共通となる振動成分を撮影装置20の振動成分であるとして特定する。本実施形態に係る抽出部11Bは、上記動画像に含まれるS/N比(Signal to Noise ratio)が所定レベル以上である領域を検出し、検出した領域における空間的に連続する部分画素群の各領域を上記複数の物体領域として抽出する。
【0033】
一方、本実施形態に係る生成部11Cは、上記動画像に対して複素空間フィルタリング処理を行うことにより位相画像を生成する。また、本実施形態に係る導出部11Dは、抽出部11Bによって抽出された複数の物体領域について、生成部11Cによって生成された位相画像の上記動画像における各フレーム画像間の変動を示す信号である位相変動信号を導出する。また、本実施形態に係る変換部11Eは、導出部11Dによって導出された位相変動信号を、周波数解析によって時間周波数スペクトルに変換する。さらに、本実施形態に係る算出部11Fは、変換部11Eによって得られた時間周波数スペクトルを用いて、同一領域内の時間周波数スペクトルを平均化した位相変動スペクトルを上記複数の物体領域の各々について算出する。
【0034】
ここで、本実施形態に係る特定部11Gは、算出部11Fによって算出された位相変動スペクトルにおいて、上記複数の物体領域に共通するピーク周波数を含む所定周波数範囲を、撮影装置20の振動成分であるとして特定する。また、本実施形態に係る導出部11Dは、上記位相画像がラッピングされた位相である場合、当該位相画像の各画素の位相に対してアンラップ処理を行った後に位相変動信号を導出する。
【0035】
次に、
図3を参照して、本実施形態に係る動画像データベース13Bについて説明する。
図3に示すように、本実施形態に係る動画像データベース13Bは、予め割り振られた動画像ID(Identification)毎に、撮影装置20による動画像の撮影によって得られた動画像情報が記憶されている。このように、本実施形態では、動画像情報を事前に撮影装置20から取り込んで動画像データベース13Bに登録しているが、これに限定されるものではない。例えば、撮影装置20による撮影を常時実施し、所定レベル以上の振動が発生した際に撮影装置20から得られる動画像情報をオンラインで、リアルタイム又は非リアルタイムで用いる形態等としてもよい。
【0036】
一方、本実施形態に係る複素空間フィルタデータベース13Cは、予め定められた複素空間フィルタ(本実施形態では、複素ガボールフィルタ(Gabor Filter))を示す情報が登録されている。但し、複素空間フィルタは複素ガボールフィルタに限定されるものではなく、空間位相特性が90度だけ異なり、空間振幅特性が等しい空間フィルタ(実部フィルタ、虚部フィルタ)を組とした複素空間フィルタであれば、他のフィルタを複素空間フィルタとして適用してもよい。
【0037】
次に、
図4~
図10を参照して、本実施形態に係る画像処理装置10の作用を説明する。ユーザによって振動成分特定プログラム13Aの実行を開始する指示入力が入力部14を介して行われた場合に、画像処理装置10のCPU11が当該振動成分特定プログラム13Aを実行することにより、
図4に示す振動成分特定処理が実行される。なお、ここでは、錯綜を回避するために、動画像データベース13B及び複素空間フィルタデータベース13Cが構築済みであり、処理対象とする動画像情報がユーザによって指定されている場合について説明する。
【0038】
図4のステップ200で、取得部11Aは、ユーザによって指定された動画像情報(以下、「処理対象動画像情報」という。)を動画像データベース13Bから読み出すことにより取得する。
【0039】
ステップ202で、生成部11Cは、複素空間フィルタデータベース13Cから複素空間フィルタを示す情報を読み出し、処理対象動画像情報に対して当該複素空間フィルタ(本実施形態では、複素ガボールフィルタ)による複素空間フィルタリング処理を行って位相画像を生成する。
【0040】
即ち、まず、生成部11Cは、読み出した複素空間フィルタを用いた複素空間フィルタリング処理を行うことで、処理対象動画像情報により示される動画像の各フレーム画像から、実部画像Ireと虚部画像Iimを算出する。次いで、生成部11Cは、次の式(1)による演算を画素毎に行うことにより、位相画像Iθを算出する。
【0041】
Iθ=tan-1(Iim/Ire) (1)
【0042】
以上の処理を処理対象動画像情報により示される動画像の全フレーム画像に実行する。複素空間フィルタリング処理は、空間領域上での畳み込みカーネルのコンボリューションによる方法と、空間周波数領域上でのフィルタ積による方法との何れの方法を適用してもよい。
【0043】
例えば、処理対象動画像情報により示される動画像のうちの1枚の画像が、一例として
図5に示す画像である場合、上述した複素空間フィルタリング処理によって得られる水平成分の位相画像が
図6Aに示すものとなり、垂直成分の位相画像が
図6Bに示すものとなる。なお、
図5に示す画像は、便宜上、建物を被写体としたものではなく、本発明の発明者らが制作した構造物を被写体として撮影したものを適用している。
【0044】
ステップ204で、抽出部11Bは、導出した位相画像Iθにおける撮影装置20の振動成分の検出対象とする領域(以下、「処理対象領域」という。)を決定する。本実施形態では、処理対象領域の決定方法として、S/N比が所定レベル以上である画素群を処理対象領域とする方法を適用している。ここで、S/N比が所定レベル以上である画素群の一例としては、取得部11Aによって取得した段階の処理対象動画像情報が示す動画像において、フレーム画像の空間1次微分フィルタ(例えば、Sobelフィルタ)、空間2次微分フィルタ(例えば、ラプラシアンフィルタ)、あるいはエッジ画像を検出するエッジ検出処理を施した出力画像が相当する。スパイク的なノイズ成分を除去して、領域の塊を確保する必要があれば、メディアンフィルタや、膨張処理及び収縮処理を併用する。抽出部11Bは、最終的に閾値処理により二値化することで処理対象領域を決定する。
【0045】
なお、処理対象領域の決定方法は以上の方法に限定されるものではなく、例えば、ユーザによって予め指定された注目領域を処理対象領域として決定する形態としてもよい。
【0046】
ステップ206で、抽出部11Bは、ステップ204の処理によって得られた処理対象領域に対応する二値化画像に対してラベリング処理を行い、空間的に連続する画素群を1つの塊として切り分けることで、処理対象領域を複数の部分画素群に分割する。この処理によって得られた複数の部分画素群が、上述した複数の物体領域に相当し、以下では当該部分画素群を物体領域という。
【0047】
図7Bには、処理対象とする画像が
図5に示した画像の一部の画像である
図7Aに示すものである場合における、ステップ206の処理によって得られた物体領域の一例が示されている。なお、
図7Bでは、物体領域毎に異なる濃度で示しており、
図7Bに示す例では、6つの物体領域が抽出されている。
【0048】
ステップ208で、導出部11Dは、ステップ202の処理によって得られた位相画像Iθに対して位相アンラップ処理を行う。即ち、位相情報は、一般的には-π~+πの範囲で折り返される形でラッピングされている(即ち、例えばπ+π/4→-π/4となる。)。そこで、本実施形態では、位相アンラップ処理(位相接続処理)を行う。位相アンラップ処理としては、例えば、インターネット(URL:https://www.researchgate.net/publication/265151826)、(URL:http://retrofocus28.blogspot.com/2013/12/phase-unwrapping_26.html)、(URL:https://jp.mathworks.com/help/dsp/ref/unwrap.html#f5-1119858)等に記載の既知のアルゴリズムを適用することができる。なお、導出した位相画像Iθがラッピングされていないものであれば、本ステップ208の処理は実行する必要がないことは言うまでもない。
【0049】
ステップ210で、導出部11Dは、以上の処理を経て得られた位相画像Iθに対して、ステップ206の処理によって得られた物体領域のうちの何れか1つの物体領域(以下、「処理対象物体領域」という。)の各画素における、位相画像Iθそのままで時間方向に切り取った時系列データである、上述した位相変動信号を算出する。
【0050】
図8には、処理対象とする画像が
図7Aに示すものである場合における、ステップ210の処理によって得られた、位相アンラップ処理による位相接続の前後における位相変動信号の一例が示されている。なお、
図8に示す例では、位相接続前の位相変動信号を破線で示し、位相接続後の位相変動信号を実線で示している。
【0051】
図8に示すように、位相接続により、+180度を超えて-180度に折り返された信号が+180度を超えて連続的に表される。但し、
図8の例で用いた位相アンラップ処理は、位相が2回転以上することを想定していないため、
図8における横軸の値が120フレーム付近で+360度を超えた信号の折り返しが残ったままとなっている。これは、アンラップ後の信号に位相アンラップ処理を再度施すことで解消される。しかし、本発明はサブピクセル級の微弱な振動を対象としているが、位相ラッピングが生じる場合はサブピクセルを超えるような大きな動きを生じていると解釈することも可能なため、ラッピングが生じた画素群または画像領域は処理対象領域から除外することを検知する目的で位相アンラップ処理を利用することも可能である。
【0052】
ステップ212で、変換部11Eは、ステップ210の処理によって得られた処理対象物体領域の位相変動信号を周波数解析により、時間周波数領域の信号である時間周波数スペクトルに変換する。
【0053】
図10には、
図9に示す空間波長8画素で、かつ、100画素×100画素の正弦波画像を、撮影装置の振動成分に見立てた振幅0.5画素、時間周波数2Hzで振動させた動画像における、ステップ212の処理によって得られた時間周波数スペクトルの一例が示されている。なお、
図10に示す例では、複素空間フィルタとして、空間波長λ=8画素にピークを持つガウス関数型のバンドパスフィルタを用いている。
【0054】
ステップ214で、算出部11Fは、ステップ212の処理によって得られた処理対象物体領域の時間周波数スペクトルに対して、同一領域内の時間周波数スペクトルを平均化した時間周波数スペクトルを、上述した位相変動スペクトルとして算出する。
【0055】
ステップ216で、算出部11Fは、以上のステップ210~ステップ214の処理が全ての物体領域について終了したか否かを判定し、否定判定となった場合はステップ210に戻る一方、肯定判定となった時点でステップ218に移行する。なお、ステップ210~ステップ216の処理を繰り返し実行する場合に、CPU11は、それまでに処理対象としなかった物体領域を処理対象物体領域とする。
【0056】
ステップ218で、特定部11Gは、全ての物体領域の位相変動スペクトルにおいて、各物体領域に共通するピーク周波数を、撮影装置20の振動成分によるピークであると推定し、当該ピーク周波数を含む所定周波数範囲を撮影装置20の振動成分であるとして特定し、特定した振動成分を示す情報を記憶部13の所定領域に記憶した後に本振動成分特定処理を終了する。
【0057】
次に、本実施形態に係る画像処理装置10による撮影装置の振動成分の特定に関する検証実験について説明する。
【0058】
図11には、一例として
図5に示す動画像を処理対象として適用した場合の画像処理装置10による解析結果の一例が示されている。なお、
図11に示す例は、被写体が13Hzで振動しており、撮影装置20が8Hzで振動している場合で、かつ、物体領域として4箇所の領域を任意に抽出した場合について示している。
【0059】
図11に示すように、複数の物体領域に跨がってピークが検出された8Hzが撮影装置20の振動成分であることが特定できることが確認された。
【0060】
以上説明したように、本実施形態によれば、複数の物体が被写体として含まれ、かつ、撮影装置による撮影によって得られた動画像を取得する取得部11Aと、取得部11Aによって取得された動画像における、各々前記複数の物体の何れかの領域である複数の物体領域を抽出する抽出部11Bと、取得部11Aによって取得された動画像における、抽出部11Bによって抽出された前記複数の物体領域の各々に対する振動解析を行い、前記複数の物体領域の各々の間で共通となる振動成分を前記撮影装置の振動成分であるとして特定する特定部11Gと、を備えている。従って、動画像から撮影装置の微細な振動成分を精度良く検出することができる。
【0061】
また、本実施形態によれば、動画像に含まれるS/N比が所定レベル以上である領域を検出し、検出した領域における空間的に連続する部分画素群の各領域を上記複数の物体領域として抽出している。従って、より簡易に当該複数の物体領域を高い信頼性で抽出することができる。
【0062】
また、本実施形態によれば、動画像に対して複素空間フィルタリング処理を行うことにより位相画像を生成し、上記複数の物体領域について、生成した位相画像の上記動画像における各フレーム画像間の変動を示す信号である位相変動信号を導出し、導出した位相変動信号を、周波数解析によって時間周波数スペクトルに変換し、当該時間周波数スペクトルを用いて、同一領域内の時間周波数スペクトルを平均化した位相変動スペクトルを上記複数の物体領域の各々について算出し、算出した位相変動スペクトルにおいて、上記複数の物体領域に共通するピーク周波数を含む所定周波数範囲を、上記撮影装置の振動成分であるとして特定している。従って、より高精度に撮影装置の振動成分を特定することができる。
【0063】
さらに、本実施形態によれば、上記位相画像がラッピングされた位相である場合、当該位相画像の各画素の位相に対してアンラップ処理を行った後に上記位相変動信号を導出している。従って、より高精度に当該位相変動信号を導出することができる。
【0064】
なお、上記実施形態において、例えば、取得部11A、抽出部11B、生成部11C、導出部11D、変換部11E、算出部11F及び特定部11Gの各処理を実行する処理部(processing unit)のハードウェア的な構造としては、次に示す各種のプロセッサ(processor)を用いることができる。上記各種のプロセッサには、前述したように、ソフトウェア(プログラム)を実行して処理部として機能する汎用的なプロセッサであるCPUに加えて、FPGA(Field-Programmable Gate Array)等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
【0065】
処理部は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせや、CPUとFPGAとの組み合わせ)で構成されてもよい。また、処理部を1つのプロセッサで構成してもよい。
【0066】
処理部を1つのプロセッサで構成する例としては、第1に、クライアント及びサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが処理部として機能する形態がある。第2に、システムオンチップ(System On Chip:SoC)等に代表されるように、処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、処理部は、ハードウェア的な構造として、上記各種のプロセッサの1つ以上を用いて構成される。
【0067】
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)を用いることができる。
【符号の説明】
【0068】
10 画像処理装置
11 CPU
11A 取得部
11B 抽出部
11C 生成部
11D 導出部
11E 変換部
11F 算出部
11G 特定部
12 メモリ
13 記憶部
13A 振動成分特定プログラム
13B 動画像データベース
13C 複素空間フィルタデータベース
14 入力部
15 表示部
16 媒体読み書き装置
17 記録媒体
18 通信I/F部
20 撮影装置