(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0011】
一般に、地図情報などの付加情報として道路上付属物を検出するためには、全てのルートを車両で走行し、道路付属物を撮影しなければならず、多額の調査費用がかかってしまう。また、新設された道路や工事により変更となった道路上の道路付属物をタイムリーに地図情報に反映できない。そこで、本発明の実施形態では、複数(不特定多数)のスマートホンユーザが撮影した画像を用いて道路付属物をタイムリーに検出することを可能としている。
【0012】
ところで、スマートホンで撮影した映像をサーバーに転送する場合、データ通信量の上限制限により、不特定多数のユーザから効率的に映像データを集められないという課題がある。また、スマートホンでのデータ伝送量の月額の上限制限を超えないように、低ビットレートの映像データを伝送した場合、ブロックノイズ等の影響により物体の輪郭が不鮮明となり、背景内の道路付属物を検出できないという課題がある。特に、上述の特許文献1では、低ビットレートの画像を伝送したとすると、画像内の一部の輪郭(縦線、横線、文字等)が不鮮明となってしまう。従って、画像毎に画像内の色の平均値を用いても、画像内に含まれる背景と背景内の物体を分離できず、背景内の物体を検出できない。そこで、本発明の実施形態では、低ビットレートの画像データを用いても、所望の対象物の検出を可能とするための技術を提案する。
【0013】
つまり、本発明の実施形態は、映像内の画像の明るさが変わる場合でも、また、低ビットレートの画像の伝送によって画像の一部の輪郭が不鮮明になる場合でも、画像内の背景と背景内の物体を分離して、背景内の物体検出を実現する画像処理装置およびその方法を提供する。
【0014】
以下、添付図面を参照して本発明の実施形態について説明する。添付図面では、機能的に同じ要素は同じ番号で表示される場合もある。なお、添付図面は本発明の原理に則った具体的な実施形態と実装例を示しているが、これらは本発明の理解のためのものであり、決して本発明を限定的に解釈するために用いられるものではない。
【0015】
本実施形態では、当業者が本発明を実施するのに十分詳細にその説明がなされているが、他の実装・形態も可能で、本発明の技術的思想の範囲と精神を逸脱することなく構成・構造の変更や多様な要素の置き換えが可能であることを理解する必要がある。従って、以降の記述をこれに限定して解釈してはならない。
【0016】
更に、本発明の実施形態は、後述されるように、汎用コンピュータ上で稼動するソフトウェアで実装しても良いし専用ハードウェア又はソフトウェアとハードウェアの組み合わせで実装しても良い。
【0017】
以下では「プログラムとしての各処理部(例えば、明暗補正部等)」を主語(動作主体)として本発明の実施形態における各処理について説明を行うが、プログラムはプロセッサ(CPU等)によって実行されることで定められた処理をメモリ及び通信ポート(通信制御装置)を用いながら行うため、プロセッサを主語とした説明としてもよい。
【0018】
(1)第1の実施形態
<画像処理装置の機能構成>
図1は、本発明の実施形態による画像処理装置の機能構成を示すブロック図である。画像処理装置1は、入力部10と、画像補正部11と、色空間変換部12と、明暗補正部13と、物体検出部14と、信頼度判定部15と、描画部16と、記録部17と、制御部91と、を有している。当該画像処理装置は、スマートホン等の携帯移動端末装置内に実装しても良いし、後述する(第2乃至第4の実施形態)ように、携帯移動端末装置とネットワークを介して接続されるサーバー内に実装しても良い。
【0019】
画像処理装置1における、入力部10、画像補正部11、色空間変換部12、明暗補正部13、物体検出部14、信頼度判定部15、描画部16、及び記録部17は、プログラムによって実現しても良いし、モジュール化して実現しても良い。
【0020】
入力部10には動画像データが入力される。例えば、入力部10は、ドライブレコーダー等の撮像手段が、所定時間間隔で撮像した、JPG、Jpeg2000、PNG、BMP形式等の符号化された静止画像データ等を取得して、その画像を入力画像としてもよい。また、入力部10は、MotionJPEG、MPEG、H.264、HD/SDI形式等の動画像データから、所定間隔のフレームの静止画像データを抜き出して、その画像を入力画像としてもよい。また、入力部10は、撮像手段がバスやネットワーク等を介して取得した画像を入力画像としてもよい。また、入力部10は、後述するように、脱着可能な記録媒体に、既に記憶されていた画像を入力画像としてもよい。
【0021】
画像補正部11は、画像のアスペクト比の補正を行って、間延びしない補正後の画像を作成する。
【0022】
色空間変換部12は、入力画像の色空間を変換した画像を作成する。
【0023】
明暗補正部13は、メモリ90に記憶した過去画像の色の明るさ情報と現在の画像の色の明るさ情報を用いて、現在の画像の色の明るさ変化量を求め、その明るさ変化量を用いて明暗を補正した画像を作成する。
【0024】
物体検出部14は、明暗補正後の画像から対象物体分離用の閾値を求め、その閾値を用いて、その画像内の背景と背景内の物体を分離して、背景内の物体を検出する。また、物体検出部14は、基準画像と階調数を削減したヒストグラムを用いて、検出した物体を識別する。
【0025】
信頼度判定部15は、検出した物体の緯度、経度から検出頻度を求め、その検出頻度から検出した物体の信頼度を判定する。
【0026】
描画部16は、前記物体検出部14で検出した物体を囲むように検出枠を画像上に描画する。
【0027】
記録部17は、前記描画部16で原画像上に検出枠を描画した画像をメモリに保存する。
【0028】
制御部91は、プロセッサで実現され、画像処理装置1内の各要素に接続される。画像処理装置1の各要素の動作は、上述した各構成要素の自律的な動作、又は制御部91の指示により動作する。
【0029】
このように本実施形態の画像処理装置1では、色空間変換部12で求めた色空間変換後の画像と、明暗補正部13で算出した画像の明るさ(色の明るさ)の変化量を用いて、画像毎に画像の明暗強調割合を変更し、物体検出部14で明暗補正後の画像から閾値を求め、その閾値を用いて、画像内の背景と背景内の物体を分離して背景内の物体を検出し、基準画像と階調数を削減したヒストグラムを用いて、検出した物体を識別することを特徴とする。
【0030】
<画像処理装置のハードウェア構成>
図2は、本発明の実施形態による画像処理装置1のハードウェア構成例を示す図である。画像処理装置1は、各種プログラムを実行するCPU(プロセッサ)201と、各種プログラムを格納するメモリ202と、各種データを格納する記憶装置(メモリ90に相当)203と、検出後画像を出力するための出力装置204と、ユーザによる指示や画像等を入力するための入力装置205と、他の装置と通信を行うための通信デバイス206と、を有し、これらがバス207によって相互に接続されている。
【0031】
CPU201は、必要に応じてメモリ202から各種プログラムを読み込み、実行する。
【0032】
メモリ202は、プログラムとしての、入力部10と、画像補正部11と、色空間変換部12と、明暗補正部13と、物体検出部14と、信頼度判定部15と、描画部16と、記録部17と、を格納する。
【0033】
記憶装置203は、処理対象画像(後述の画像N)よりも前に撮影された過去画像(後述の画像N−1までの画像)、明暗補正部13によって生成された画像の各画素値、算出された画像毎の閾値、基準画像のデータ等を記憶している。
【0034】
出力装置204は、ディスプレイ、プリンタ、スピーカー等のデバイスで構成される。例えば、出力装置204は、描画部16によって生成されたデータをディスプレイ画面上に表示する。
【0035】
入力装置205は、キーボード、マウス、マイク等のデバイスで構成される。入力装置205によってユーザによる指示(処理対象画像の決定を含む)が画像処理装置1に入力されたりする。
【0036】
通信デバイス206は、画像処理装置1としては必須の構成ではなく、携帯移動端末に通信デバイスが含まれる場合には、画像処理装置1は通信デバイス206を保持していなくても良い。通信デバイス206は、例えば、ネットワークを介して接続される他の装置(例えば、サーバー)から送信されてきたデータ(画像を含む)を受信し、記憶装置203に格納する動作を行う。
【0037】
<各部の構成と動作>
以下、各要素の構成と動作について詳細に説明する。
【0038】
(i)画像補正部11
映像を撮影する際に画面上に表示される画像のアスペクト比と撮影した映像をメモリに保存するときのアスペクト比が異なる場合があり、画像補正部11はこのアスペクト比の違いによって間延びした画像を補正する処理を実行する。ここで、スマートホンやドライブレコーダーなどによって映像を撮影する時に画面上に表示される画像の幅をd_h、画像の高さをd_vとし、当該映像をメモリに保存する時の画像の幅をs_h、画像の高さをs_vとする。このとき、画像補正部11は、式1を用いて画像幅の比率hrを算出し、式2を用いて画像高さの比率vrを算出する。
【0040】
hr≧vrの場合、画像補正部11は、下記式3及び式4を用いて、補正後の画像幅c_hと画像高さc_vを求める。一方、hr<vrの場合、画像補正部11は、下記式5と式6を用いて、補正後の画像幅c_hと画像高さc_vを求める。
【0042】
このように、画像補正部11によって、入力画像の幅と高さが画像幅c_hと画像高さc_vとなるように画像のアスペクト比を補正することにより、間延びを補正した画像を作成する。なお、撮影時のアスペクト比とメモリ保存時のアスペクト比が同じの場合には、メモリ保存された画像がそのまま入力画像として使えるので(間延びした画像となっていないので)、画像補正部11によるアスペクト比補正処理は不要である。
【0043】
(ii)色空間変換部12
色空間変換部12は、例えば、入力画像のRGB色空間をLab色空間に変換した画像を生成する。Lab色空間変換により、当該画像のL値、a値、及びb値が取得される。L値は明度のような情報であり、a及びb値は色情報である。
【0044】
(iii)明暗補正部13
図3は、明暗補正部13の動作の一例を説明するための図である。色空間変換部12で求めた、画像NをLab色空間に変換した後の画像を画像NAとすると、明暗補正部13は、画像NAの色情報(a値又はb値)を用いて、画像NAの領域R2内の色情報(色の明るさ:a値又はb値)の平均値aveR2を算出する。また、明暗補正部13は、メモリ90(記憶装置203に相当)から画像N−1の領域R1内の色の明るさの平均値aveR1を読込む。
【0045】
次に、明暗補正部13は、下記式7を用いて、画像N−1までの過去の画像の色の明るさ(a値又はb値)の平均値をブレンドしたaveR1と画像Nの色の明るさの平均値aveR2をブレンドした平均値aveRNを算出する。ただし、式7において、C1=C2+C3である。ここで、過去の画像からの色の明るさの変化を緩やかにしたい場合には過去の画像の重みC2を大きくし、現画像の方に色の明るさを劇的に変化させたい場合には現画像の重みC3を大きくすればよい。ただし、C3を大きくして現画像ばかり重視し過ぎると正確に明暗補正できない場合もあるため、ある程度は過去の画像も考慮する必要がある(重みC2をあまり小さくし過ぎない必要がある)。例えば、過去の画像からの色の明るさの変化を緩やかにしたい場合にはC2を0.9、C3を0.1に設定する。また、現画像の方に色の明るさを劇的に変化させたい場合には、C2及びC3を0.5に設定することが考えられる。
【0047】
また、明暗補正部13は、下記式8を用いて、倍率値vを算出する。ただし、式8において、aveR1の値がaveR2の値以上の場合には、E1をaveR2、E2をaveR1とし、aveR1の値がaveR2の値より小さい場合には、E1をaveR1、E2をaveR2とする。なお、倍率値vは固定値であっても良い。
【0049】
さらに、明暗補正部13は、下記式9を用いて、画像Nの領域R2内の色の明るさの平均値よりも暗い画素についてはより暗く、画像Nの領域R2内の色の明るさの平均値よりも明るい画素についてはより明るくなるように画像Nを補正する。このような補正をすることにより、入力された画像のままでは埋もれていて見えづらい物が検出できるようになる。ただし、式9において、cnは、画像NAの各画素のa値もしくはb値を示す。
【0051】
明暗補正部13により、画素毎にcnCor値を求め、画像NAの明暗を補正した画像NBを作成する。
【0052】
(iv)物体検出部14
物体検出部14は、下記式10を用いて、画像毎に閾値Thを求める。
【0054】
ここで、αは、より明るい画素或いはより暗い画素だけを抽出した場合の閾値の補正値であり、対象の物体をより切り出しやすくするためのパラメータである。
【0055】
画像NAの各画素がa値の場合、物体検出部14は、αをプラス値として画像毎に求めた閾値Thを用いて、各画素値≧Thの場合はs値(例えば、s=255)、各画素値<Thの場合はt値(例えば、t=0)に各画素値を設定し、背景と物体を分離した画像を作成する。これにより、より明るい物体を効率よく分離可能となる。或いは、画像NAの各画素がb値の場合、物体検出部14は、αをマイナス値として画像毎に求めた閾値Thを用いて、各画素値≦Thの場合はs値(例えば、s=255)、各画素値>Thの場合はt値(例えば、t=0)に各画像値を設定し、背景と物体を分離した画像を作成する。これにより、より暗い物体を効率よく分離可能となる。
【0056】
従って、物体検出部14の処理により、例えば、
図4の画像Nの領域R2について、物体検出後の画像NDに示す背景と物体に分離可能となる。
【0057】
さらに、物体検出部14は、検出した物体が何の標識かを識別するための処理を実行する。この場合、物体検出部14は、例えば、識別したい標識の基準画像(予めデータベース等として用意されている)をメモリ90から読込み、基準画像と検出した物体の画像(RGBの画像で比較する)の各々について、
図5に示すように、ビットレートに応じて(基準画像のビットレートを処理対象の画像Nのビットレートに調整する)、階調数を削減したヒストグラムA(例えば、基準画像のヒストグラム)とB(検出した画像のヒストグラム)を作成する。そして、物体検出部14は、作成したヒストグラムAとBの類似度を算出することにより、識別したい標識か否かを判定する(ヒストグラムの形状が近い(Bhattacharyya距離が短い)か否かで類似度を判定する)。類似度については、例えば、下記式11に示すように、RGB毎に、ヒストグラム間のBhattacharyya距離によるB32(c)を求め、求めたr成分に関するB32(r)とg成分に関するB32(g)とb成分に関するB32(b)を用いて類似度Rを算出する。なお、ここで、cは、r、g、bのどれかを表す。
【0059】
図5によれば、例えばビットレートが10M/bpsの画像については、階調数を128に削減(階調数を調整)して、ヒストグラム間の類似度を判定することが好ましい。また、ビットレートが7M/bpsの画像については、階調数を64以上128以下の間の値に削減して、ヒストグラム間の類似度を判定することが好ましい。このように、階調数を削減したヒストグラム間の類似度を算出することで、ビットレートが低い画像のブロック歪みによる影響を抑制して、基準画像と検出した物体の画像の類似度を判定することが可能となる。つまり、検出した物体の画像が劣化していても類似度を判定することができる。さらに、ヒストグラム間の類似度判定に対して、従来技術であるニューラルネットワークを用いて機械学習により画像の特徴量から識別器を作成し、その識別器を用いて、検出した物体を識別する判定を加えてもよい。つまり、類似度が高いと判定された基準画像が複数検出された場合、ニューラルネットワークを用いた識別器により、検出物体としてどの画像が正しい(確からしい)かを識別する。
【0060】
(v)信頼度判定部15
信頼度判定部15は、
図6に示すように、検出した物体の撮影時のGPS情報から緯度、経度を求め、その位置の検出頻度を累積して、メモリ90(記憶装置203に相当)に格納する。つまり、複数のユーザによる検出結果や同じユーザによる複数回の検出結果が蓄積される。そして、信頼度判定部15は、累積した検出頻度を予め設定された閾値Th_hと比較し、検出頻度が閾値Th_h以上であれば、検出した物体の(緯度、経度)の信頼度Cが高いと判定する。このように信頼度を判定するのは、撮影する移動体(例えば、自動車)によって移動速度や撮影位置(高さや道路の走行位置)が異なる場合があり、計測される緯度及び経度が微妙に異なることがあるためである。
【0061】
(vi)描画部16
描画部16は、信頼度Cが高いと判定された場合、
図7に示されるように、
図3の画像Nに対して、物体検出部14で検出した物体を囲むように検出枠を画像N上に描画する(画像NE参照)。一方、信頼度Cが低いと判定された場合(検出頻度が閾値Th_hに達していない場合)、描画部16は、検出枠を画像N上に描画しない。
【0062】
(vii)記録部17
記録部17は、描画部16で原画像N上に検出枠を描画した画像をメモリ90に保存する。
【0063】
<画像処理装置の処理手順>
図8は、本発明の実施形態による画像処理装置1の動作を説明するためのフローチャートである。以下では、各処理部(入力部10、画像補正部11等)を動作主体として記述するが、CPU201を動作主体とし、CPU201がプログラムとしての各処理部を実行するように読み替えても良い。
【0064】
(i)ステップ801
入力部10は、入力された画像を受け付け、当該入力画像を画像補正部11に出力する。
【0065】
(ii)ステップ802
画像補正部11は、上述の式1〜式6を用いて、画像のアスペクト比の補正を行って、補正後の画像を作成する。
【0066】
(iii)ステップ803
色空間変換部12は、画像補正部11が出力した補正後の画像N、すなわち、RGBの色空間画像を一例として、Lab色空間画像に変換した画像NAを求める。
【0067】
(iv)ステップ804
明暗補正部13は、色空間変換部12で求めた画像NAから、画像Nの領域R2内の色の明るさの平均値aveR2を算出する。また、明暗補正部13は、メモリ90から画像N−1(時間的に1つ前の画像)の領域R1内の色の明るさの平均値aveR1を読込む。そして、明暗補正部13は、上述の式7〜式9を用いて、明暗を補正した画像NBを生成する。
【0068】
(v)ステップ805
物体検出部14は、上述の式10を用いて、画像毎に閾値Thを求める。
【0069】
(vi)ステップ806
物体検出部14は、明暗を補正した画像NBの各画素値cnCorについて、閾値Thと比較する。すなわち、画像NBの各画素がa値のとき、cnCor≧閾値Thの場合、処理はステップ807に移行する。一方、cnCor<閾値Thの場合、処理はステップ808に移行する。なお、画像NBの各画素がb値のとき、cnCor≦閾値Thの場合、処理はステップ807に移行する。一方、cnCor>閾値Thの場合、処理はステップ808に移行する。
【0070】
(vii)ステップ807
画像NBの各画素がa値及びb値の何れの場合でも、物体検出部14は、補正値にs値(例えば、255)を設定する。
【0071】
(viii)ステップ808
画像NBの各画素がa値及びb値の何れの場合でも、物体検出部14は、補正値にt値(例えば、0)を設定する。
【0072】
(ix)ステップ809
物体検出部14は、対象画像内の全ての画素について補正値が求まるまで、上記ステップ806から808を繰り返す。ステップ806から809のステップを繰り返すことにより、例えば、
図4の画像Nの領域R2は、物体検出後の画像NDに示す背景と物体に分離可能となる。
【0073】
(x)ステップ810
物体検出部14は、基準画像をメモリ90(記憶装置203)から読み出し、検出した物体の画像と基準画像に対して階調数を削減したヒストグラムを作成し、上述の式11を用いて、類似度Rを算出する。類似度Rが高い場合(類似度R≦閾値Th_R:類似度Rは上記Bhattacharyya距離として算出されるため、「類似度が高い=距離が短い」を意味する)に、物体検出部14は、検出した物体を識別したい標識と判定する。なお、上述したように、ニューラルネットワークを用いた機械学習により求めた識別器を用い、その識別器による判別結果を上記判定に加えて、識別したい標識か否かを判定してもよい。
【0074】
(xi)ステップ811
信頼度判定部15は、検出した物体の撮影時の位置情報(緯度、経度)を累積し、累積した検出頻度が閾値Th_h以上であれば、検出した物体の(緯度、経度)の信頼度Cが高いと判定する。一方、検出頻度が閾値Th_h未満であれば、信頼度Cは低いと判定される。
【0075】
(xii)ステップ812
描画部16は、信頼度Cが高い場合に、物体検出部14で検出した物体を囲むように検出枠を画像N上に描画する。信頼度Cが低い場合には、描画部16は、検出枠を画像N上に描画することはしない。
【0076】
(xiii)ステップ813
記録部17は、物体の検出枠を描画した画像をメモリ90(記憶装置203に相当)に保存する。
【0077】
本発明の実施形態によれば、画像N−1までの過去の画像の色の明るさの平均値をブレンドしたaveR1、及び処理対象の画像Nの色の明るさの平均値aveR2を用いて、画像Nの明暗を補正した画像NBを作成し、画像NB毎に閾値Thを求めている。したがって、閾値Thを用いて、画像N内の背景と背景内の物体を分離することが可能となる。
【0078】
また、ビットレートに応じて階調数を削減したヒストグラムを用いて、検出した物体と識別したい標識との類似度を判定しているため、ビットレートの低い画像に含まれるブロックノイズの影響を抑制して、画像内の物体の輪郭が不鮮明な場合でも、検出した物体を識別することが可能となる。また、検出した物体の位置情報を累積し、検出頻度を判定することで、検出した物体の位置情報をより正確に求めることが可能となる。
【0079】
このように、過去画像と対象画像の明るさ情報を用いて対象画像の明暗を強調した画像を作成し、画像毎に画像内の領域を分離する閾値を求めることで、移動車両の進む方向によって映像内の画像の明るさが変わる場合でも、画像内の背景と背景内の物体を分離して、背景内の物体を検出することが可能となる。また、スマートホン等のデータ通信量を抑え、より正確な位置情報と共に、ビットレートの低い画像内から物体を検出し、かつ検出した物体を識別することが可能となる。さらに、不特定多数のユーザが撮影した車載スマートホンの映像内から物体を検出し、位置情報の検出頻度からより正確な位置を求めることで、新設さえた道路や工事により変更となった道路上の道路付属物をタイムリーに検出することが可能となる。
【0080】
(2)第2の実施形態
図9は、本発明の第2の実施形態によるPOI(Point of Interest)情報作成システム900の構成を示す機能ブロック図である。POI情報作成システム900は、サーバー等903と、移動端末装置905と、を有する。
【0081】
移動端末装置905は、例えばスマートホンのような装置であり、画像データを撮影する撮像部901と、サーバー等903から伝送されてきた検出後画像を表示するための表示部904と、を有している。なお、移動端末装置905は、図示されてはいないが、画像データをサーバー等903に送信したり、サーバー等903から送信されてきたデータを受信したりする通信デバイスを有している。
【0082】
サーバー等903は、移動端末装置905から伝送されてきた画像データに対して、本発明の第1の実施形態による画像処理を行う画像処理装置1と、画像処理装置1から出力された検出後画像を格納する格納部902と、を有している。なお、サーバー等903は、図示されてはいないが、移動端末装置905から送信されてきた画像データを受信したり、移動端末装置905に検出後画像データを送信したりする通信デバイスを有している。
【0083】
画像処理装置1は、撮像部901で撮影した画像データ内から道路付属物等の物体を検出する。画像処理装置1は、基準画像に、施設情報やスポット情報などの特定看板を設定することで、画像データ内から特定看板を検出する。
【0084】
表示部904は、サーバー等903から伝送された特定看板等の検出後画像を、移動端末装置(例えばスマートホンなど)905の表示画面に表示する。
【0085】
第2の実施形態によれば、車載スマートホンで撮影した映像内から特定看板を検出し、特定看板の検出画像と位置情報をセットで格納することで、POI情報作成システムを提供することが可能となる。
【0086】
(3)第3の実施形態
図10は、本発明の第3の実施形態による警告システム1000の構成を示す機能ブロック図である。警告システム1000は、サーバー等1003と、移動端末装置1006と、を有している。
【0087】
移動端末装置1006は、例えばスマートホンのような装置であり、画像データを撮影する撮像部1001と、サーバー等1003から伝送された検出後画像を表示する表示部1004と、サーバー等1003から伝送されたアラート情報を出力する出力部1005と、を有している。なお、移動端末装置1006は、図示されてはいないが、画像データをサーバー等1003に送信したり、サーバー等1003から送信されてきたデータを受信したりする通信デバイスを有している。
【0088】
サーバー等1003は、移動端末装置1006から伝送されてきた画像データに対して、本発明の第1の実施形態による画像処理を行う画像処理装置1と、画像処理装置1から出力された検出後画像を格納する格納部1002と、を有している。なお、サーバー等1003は、図示されてはいないが、移動端末装置1006から送信されてきた画像データを受信したり、移動端末装置1006に検出後画像データやアラート情報を送信したりする通信デバイスを有している。
【0089】
画像処理装置1は、撮像部1001で撮影した画像データ内から道路付属物などの物体を検出する。また、画像処理装置1は、基準画像に、速度標識などの標識を設定することで、画像データ内から標識を検出する。
【0090】
表示部1004は、サーバー等1003から伝送された速度標識等の検出後画像を、移動端末装置1006(例えば、スマートホンなど)の表示画面(図示せず)に表示する。
【0091】
出力部1005は、サーバー等1003から伝送されたアラート情報を、移動端末装置1006のスピーカーから出力したり、表示画面(図示せず)に表示したりする。
【0092】
さらに、アラートが出された地点の画像(検出された画像)をサーバー等1003及び/又は移動端末装置1006において登録するようにしても良い。このとき、第1の実施形態で説明したように、検出頻度が所定の閾値Th_h以上である場合に登録するようにしても良い。
【0093】
第3の実施形態によれば、車載スマートホンで撮影した映像内から速度標識などの標識を検出し、標識の検出後画像とアラート情報をセットにしてスマートホンなどに伝送することで、警告システムを提供することが可能となる。
【0094】
(4)第4の実施形態
図11は、本発明の第4の実施形態による簡易誘導システム1100の構成を示す機能ブロック図である。簡易誘導システム1100は、サーバー等1103と、移動端末装置1106と、を有している。
【0095】
移動端末装置1106は、例えばスマートホンのような装置であり、画像データを撮影する撮像部1101と、サーバー等1103から伝送された検出後画像を表示する表示部1104と、サーバー等1103から伝送された誘導情報を出力する出力部1105と、を有している。なお、移動端末装置1106は、図示されてはいないが、画像データをサーバー等1103に送信したり、サーバー等1103から送信されてきたデータを受信したりする通信デバイスを有している。
【0096】
移動端末装置1106は、その時々の使用可能帯域により、低画質な画像データ(例えば5Mbps以下)と、高画質な画像データ(例えば10Mbps以上)とを切り替えて送信することができる。これにより、帯域制限がある場合でも画像データを送信することができる。
【0097】
さらに、高画質な画像データを送る場合には、看板が写っている可能性が高い領域をトリミングしたり、画像サイズの縮小をして送信することもできる。低画質な画像データと、高画質な画像データを縮小した場合では、後者の方が高精度に画像処理を行うことができるためである。これにより、画像処理装置での検出処理の精度を向上させることができる。
【0098】
サーバー等1103は、移動端末装置1106から伝送されてきた画像データに対して、本発明の第1の実施形態による画像処理を行う画像処理装置1と、画像処理装置1から出力された検出後画像を格納する格納部1102と、を有している。なお、サーバー等1103は、図示されてはいないが、移動端末装置1106から送信されてきた画像データを受信したり、移動端末装置1106に検出後画像データや誘導情報を送信したりする通信デバイスを有している。
【0099】
サーバー等1103は、移動端末装置1106から送られてきた画像データを処理した後、ユーザーから指示があった場合など必要に応じて、移動端末装置1106に対し、先に受信した画像データよりも高画質の画像データを送るよう指示を出すことができる。これにより、必要な位置の画像のみを高画質な画像データを使って解析し、それ以外の位置の画像は低画質な画像データを使って解析することで、画像処理装置の負荷を減らすことができる。
【0100】
画像処理装置1は、撮像部1101で撮影した画像データ内から道路付属物などの物体を検出する。また、画像処理装置1は、基準画像に、方面看板(道路案内標識)などの標識を設定することで、画像データ内から方面看板を検出する。また、方面看板の矢印や文字から、矢印や文字のパターンマッチング等により誘導方向を検出する。
【0101】
表示部1104は、サーバー等1103から伝送された方面看板等の検出後画像を、移動端末装置1106(例えばスマートホンなど)の表示画面(図示せず)に表示する。
【0102】
出力部1105は、サーバー等1103から伝送された誘導情報を、移動端末装置1106のスピーカーから出力したり、表示画面(図示せず)に表示したりする。
【0103】
第4の実施形態によれば、車載スマートホンで撮影した映像内から方面看板などの標識を検出し、標識の検出後画像と誘導情報をセットにしてスマートホンなどに伝送することで、簡易誘導システムを提供することが可能となる。
【0104】
(5)まとめ
(i)本発明による画像処理装置は、対象画像の色空間を変換し、変換された色空間における色情報を取得する処理と、対象画像において、検出すべき物体を含む対象領域における色情報の明るさの平均値を示す第1の平均値を算出する処理と、対象領域において、各画素の色情報の明るさと第1の平均値とを比較し、明暗を補正した補正画像を生成する処理と、補正画像に基づいて物体を抽出する処理と、を実行する。より具体的には、式9に示されるように、対象画像(画像N:現画像)の情報を用いて、色情報(a値やb値)の明るさの平均値よりも暗い画素はより暗く、当該平均値よりも明るい画素はより明るくなるように明暗補正されて補正画像(明暗をさらに強調した画像)が生成される。この際、倍率値vを導入し、過去の画像(画像N−1までの画像)の色情報の明るさの平均値をも考慮して明暗補正を行っても良い。このように明暗補正をして対象画像から所望の物体を抽出(検出)するので、移動車両の進む方向によって映像内の画像の明るさが変わる場合でも、画像内の背景と背景内の物体を分離して、背景内の物体を検出することができるようになる。過去の画像を考慮する場合には、時系列に変化する画像の明るさに応じて画像毎に画像内の領域を分離することができるようになる。
【0105】
そして、画像処理装置は、予め用意された基準画像と対象画像の中から抽出(検出)された物体とを比較することにより物体を識別する。これにより、抽出した物体が何であるか識別することができるようになる。
【0106】
また、画像が例えばスマートホン等によって撮影された低ビットレートの画像であった場合には、基準画像の階調数を削減(調整)し、階調数を削減した基準画像と検出された物体の画像とを比較し、両者のヒストグラムのBhattacharyya距離を算出する。そして、その距離が所定の閾値(Th_R)よりも小さい場合に類似度が高いと判定するようにする。このようにすることにより、低ビットレートの画像の伝送によってブロックノイズにより画像の一部の輪郭が不鮮明になる場合でも、ビットレートの低い画像に含まれるブロックノイズの影響を抑制することができ、画像内の背景と背景内の物体を分離して、背景内の物体を検出することが可能となる。
【0107】
さらに、画像処理装置は、対象画像Nを撮影した時に取得された位置情報(GPS情報)を用いて、例えば不特定多数のユーザによる識別物体の位置や同一ユーザによる複数回の処理結果による識別物体の位置を累積し、当該累積の結果得られる検出頻度に応じて、識別した物体の信頼度を判定するようにしても良い。このようにすることにより、識別物体の正しい位置の情報をユーザに提供することができるようになる。
【0108】
なお、スマートホンによって画像が撮影される場合、撮影されるアスペクト比とメモリに格納されるアスペクト比が異なることがある。このようにアスペクト比が実際の撮影時と異なる場合に、メモリから画像が読み込まれて対象画像とされるときには、画像処理装置は、画像のアスペクト比を調整して当該対象画像の間延びを補正する処理を実行する。このようにすることにより、間延びした画像を修正して、正確に所望の物体を抽出し、識別することができるようになる。
【0109】
(ii)第2の実施形態によれば、車載スマートホンで撮影した映像内から施設情報やスポット情報を示す特定看板を検出し、特定看板認識によるPOI情報作成システムを提供することが可能となる。
【0110】
(iii)第3の実施形態によれば、車載スマートホンで撮影した映像内から速度標識などの標識を検出し、標識認識による警告システムを提供することが可能となる。
【0111】
(iv)第4の実施形態によれば、車載スマートホンで撮影した映像内から方面看板などの標識を検出し、方面看板認識による簡易誘導システムを提供することが可能となる。
【0112】
(v)以上説明した各実施形態については、次のような変形が可能である。
【0113】
色空間変換部12では、入力画像をLab色空間に変換した画像を作成したが、HSV色空間等の他の色空間の画像に変換してもよく、同様の効果を有する。
【0114】
物体検出部14では、式11を用いて、基準画像と検出した物体の画像との類似度を判定したが、B32(r)、B32(g)、B32(b)のどれか1つを用いてもよく、また、それぞれの組合せを用いて類似度を判定してもよく、同様の効果を有する。
【0115】
(vi)本発明は、実施形態の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をシステム或は装置に提供し、そのシステム或は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
【0116】
また、プログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。さらに、記憶媒体から読み出されたプログラムコードが、コンピュータ上のメモリに書きこまれた後、そのプログラムコードの指示に基づき、コンピュータのCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。
【0117】
さらに、実施の形態の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することにより、それをシステム又は装置のハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、使用時にそのシステム又は装置のコンピュータ(又はCPUやMPU)が当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしても良い。
【0118】
最後に、ここで述べたプロセス及び技術は本質的に如何なる特定の装置に関連することはなく、コンポーネントの如何なる相応しい組み合わせによってでも実装できる。更に、汎用目的の多様なタイプのデバイスがここで記述した方法に従って使用可能である。ここで述べた方法のステップを実行するのに、専用の装置を構築するのが有益である場合もある。また、実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。本発明は、具体例に関連して記述したが、これらは、すべての観点に於いて限定の為ではなく説明の為である。本分野にスキルのある者には、本発明を実施するのに相応しいハードウェア、ソフトウェア、及びファームウエアの多数の組み合わせがあることが解るであろう。例えば、記述したソフトウェアは、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
【0119】
さらに、上述の実施形態において、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていても良い。
【0120】
加えて、本技術分野の通常の知識を有する者には、本発明のその他の実装がここに開示された本発明の明細書及び実施形態の考察から明らかになる。記述された実施形態の多様な態様及び/又はコンポーネントは、単独又は如何なる組み合わせでも使用することが出来る。