(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022182437
(43)【公開日】2022-12-08
(54)【発明の名称】画像処理装置、画像処理方法およびプログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20221201BHJP
G06T 7/70 20170101ALI20221201BHJP
G06T 3/40 20060101ALI20221201BHJP
【FI】
G06T7/00 350C
G06T7/70 A
G06T3/40
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2021089992
(22)【出願日】2021-05-28
(71)【出願人】
【識別番号】390010054
【氏名又は名称】コイト電工株式会社
(74)【代理人】
【識別番号】100104215
【弁理士】
【氏名又は名称】大森 純一
(74)【代理人】
【識別番号】100196575
【弁理士】
【氏名又は名称】高橋 満
(74)【代理人】
【識別番号】100168181
【弁理士】
【氏名又は名称】中村 哲平
(74)【代理人】
【識別番号】100160989
【弁理士】
【氏名又は名称】関根 正好
(74)【代理人】
【識別番号】100117330
【弁理士】
【氏名又は名称】折居 章
(74)【代理人】
【識別番号】100168745
【弁理士】
【氏名又は名称】金子 彩子
(74)【代理人】
【識別番号】100176131
【弁理士】
【氏名又は名称】金山 慎太郎
(74)【代理人】
【識別番号】100197398
【弁理士】
【氏名又は名称】千葉 絢子
(74)【代理人】
【識別番号】100197619
【弁理士】
【氏名又は名称】白鹿 智久
(72)【発明者】
【氏名】内山 知大
【テーマコード(参考)】
5B057
5L096
【Fターム(参考)】
5B057AA16
5B057BA02
5B057CA08
5B057CA12
5B057CA16
5B057CB08
5B057CB12
5B057CB16
5B057CC03
5B057CD05
5B057CE08
5B057CE09
5B057DA07
5B057DA12
5B057DB02
5B057DC40
5L096AA06
5L096BA04
5L096CA02
5L096DA02
5L096DA03
5L096EA03
5L096EA13
5L096EA35
5L096FA69
5L096HA09
5L096HA11
(57)【要約】 (修正有)
【課題】検出領域の拡張を図りつつ、物体の検出率を向上させることができる画像処理装置、画像処理方法およびプログラムを提供する。
【解決手段】画像処理装置100は、前処理部12と、検出部13と、を具備する。前処理部は、第1の画像と、第1の画像の一部の領域の拡大画像又は縮小画像である第2の画像とを含む所定サイズの入力画像を生成する。検出部は、入力画像から検出対象である物体を検出する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
第1の画像と、前記第1の画像の一部の領域の拡大画像又は縮小画像である第2の画像とを含む所定サイズの入力画像を生成する前処理部と、
前記入力画像から検出対象である物体を検出する検出部と
を具備する画像処理装置。
【請求項2】
請求項1に記載の画像処理装置であって、
前記前処理部は、前記第1の画像の元画像を前記所定サイズに収まるように縮小する画像調整部を有する
画像処理装置。
【請求項3】
請求項2に記載の画像処理装置であって、
前記第2の画像は、前記第1の画像と異なる解像度を有する
画像処理装置。
【請求項4】
請求項2又は3に記載の画像処理装置であって、
前記前処理部は、前記第1の画像を前記所定サイズに収まるように縮小したときに得られる前記入力画像の余白部に、前記第2の画像を合成する画像合成部をさらに有する
画像処理装置。
【請求項5】
請求項2~4のいずれか1つに記載の画像処理装置であって、
前記前処理部は、前記第1の画像の予め設定された領域の拡大画像を前記第2の画像として抽出する画像抽出部をさらに有する
画像処理装置。
【請求項6】
請求項5に記載の画像処理装置であって、
前記画像抽出部は、前記第2の画像の解像度を前記元画像の解像度に変換する
画像処理装置。
【請求項7】
請求項5又は6に記載の画像処理装置であって、
前記画像抽出部は、前記第1の画像の異なる複数の領域の拡大画像をそれぞれ前記第2の画像として抽出する
画像処理装置。
【請求項8】
請求項1~7のいずれか1つに記載の画像処理装置であって、
前記検出部は、前記入力画像における前記物体の種別および位置を検出する
画像処理装置。
【請求項9】
請求項1~8のいずれか1つに記載画像処理装置であって、
前記検出部は、深層学習器を含む
画像処理装置。
【請求項10】
第1の画像と、前記第1の画像の一部の領域の拡大画像である第2の画像とを含む所定サイズの入力画像を生成し、
前記入力画像から検出対象である物体を検出する
画像処理方法。
【請求項11】
第1の画像と、前記第1の画像の一部の領域の拡大画像である第2の画像とを含む所定サイズの入力画像を生成するステップと、
前記入力画像から検出対象である物体を検出するステップと
をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力画像から物体を検出する画像処理装置、画像処理方法およびプログラムに関する。
【背景技術】
【0002】
機械学習モデルを用いて画像から物体を検出する技術が広く知られている。例えば特許文献1には、予め学習されたモデルを用いて、対象物体の複数のパーツそれぞれの候補領域を検出して、検出した候補領域に基づいて複数のパーツから相対的に信頼性が高い高信頼パーツと、相対的に信頼性の低い非高信頼パーツとを選択し、高信頼パーツに基づいて非高信頼パーツを再配置し、対象物体の複数のパーツの位置を検出する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
機械学習のひとつである深層学習(Deep Learning)を利用した画像の物体検出処理においては、物体(オブジェクト)の検出を容易にするため、入力画像が所定サイズ(例えば、正方形)に定められている。このため、所定サイズにない入力画像については、画像の長辺と短辺の大きさを上記所定サイズに調整する必要がある。例えば、入力画像の画像サイズが上記所定サイズに合致しない場合、画像比率を維持して画像サイズを変換(主として縮小)することが多い。この場合、縦横の比率に合わない領域(余白部分)は黒く塗り潰されるなどして、実質的に検出処理として利用されない無駄な領域が生じてしまう。また、入力画像が所定サイズに縮小されると、画像内の物体の検出率の低下を招くという問題があった。
【0005】
以上のような事情に鑑み、本発明の目的は、検出領域の拡張を図りつつ、物体の検出率を向上させることができる画像処理装置、画像処理方法およびプログラムを提供することにある。
【課題を解決するための手段】
【0006】
本発明の一形態に係る画像処理装置は、前処理部と、物体検出部とを具備する。
前記前処理部は、第1の画像と、前記第1の画像の一部の領域の拡大画像又は縮小画像である第2の画像とを含む所定サイズの入力画像を生成する。
前記検出部は、前記入力画像から検出対象である物体を検出する。
【0007】
上記画像処理装置においては、第1の画像と、その第1の画像の一部の領域の拡大画像又は縮小画像である第2の画像とを含む所定サイズの入力画像を生成する前処理部を備えているため、検出領域の拡張を図りつつ、検出部における物体の検出率を向上させることができる。
【0008】
前記前処理部は、前記第1の画像の元画像を前記所定サイズに収まるように縮小する画像調整部を有してもよい。
これにより、深層学習モデルを用いた物体の検出を行うことができる。
【0009】
前記前処理部は、前記第1の画像を前記所定サイズに収まるように縮小したときに得られる前記入力画像の余白部に、前記第2の画像を合成する画像合成部をさらに有してもよい。
【0010】
前記前処理部は、前記第1の画像の予め設定された領域の拡大画像を前記第2の画像として抽出する画像抽出部をさらに有してもよい。
【0011】
前記画像抽出部は、前記第2の画像の解像度を前記元画像の解像度に変換するように構成されてもよい。
【0012】
前記画像抽出部は、前記第1の画像の異なる複数の領域の拡大画像をそれぞれ前記第2の画像として抽出するように構成されてもよい。
【0013】
前記検出部は、前記入力画像における前記物体の種別および位置を検出するように構成されてもよい。
【0014】
前記検出部は、深層学習器を含んでもよい。
【0015】
本発明の一形態に係る物体検出方法は、
第1の画像と、前記第1の画像の一部の領域の拡大画像である第2の画像とを含む所定サイズの入力画像を生成し、
前記入力画像から検出対象である物体を検出する。
【0016】
本発明の一形態に係るプログラムは、
第1の画像と、前記第1の画像の一部の領域の拡大画像又は縮小画像である第2の画像とを含む所定サイズの入力画像を生成するステップと、
前記入力画像から検出対象である物体を検出するステップと
をコンピュータに実行させる。
【発明の効果】
【0017】
本発明によれば、検出領域の拡張を図りつつ、物体の検出率を向上させることができる。
【図面の簡単な説明】
【0018】
【
図1】本発明の一実施形態に係る画像処理装置の構成を示すブロック図である。
【
図2】深層学習器へ入力される画像サイズの説明図である。
【
図3】上記画像処理装置の一作用を説明する概念図である。
【
図4】上記画像処理装置において実行される処理の手順の一例を示すフローチャートである。
【
図5】入力画像の元画像の一例を示す模式図である。
【
図6】
図5に示す元画像の調整後の様子を示す模式図である。
【
図7】上記画像処理装置において生成された入力画像を示す模式図である。
【
図8】本発明の他の実施形態の作用を説明する概念図である。
【発明を実施するための形態】
【0019】
以下、図面を参照しながら、本発明の実施形態を説明する。
【0020】
<第1の実施形態>
図1は、本発明の一実施形態に係る画像処理装置100の構成を示すブロック図である。本実施形態の画像処理装置100は、例えば、交差点などの車道を撮影するカメラ1の画像から検出対象である物体を検出し、その種別や位置を判定し、その判定結果を、上記交差点や車道に設置された信号機を管理する管制センタ2、あるいは当該信号機を制御する信号機制御部3へ送信するように構成される。
【0021】
本実施形態において、検出対象である物体は、例えば、車道を走行する車両のほか、側道や横断歩道上の歩行者などを含む。車両には、自動車、二輪車、軽車両などが含まれる。これに以外にも、検出目的に応じて、検出対象を任意に設定することができる。
【0022】
カメラ1は、撮影領域を所定のフレームレート(例えば、30フレーム/秒)で撮影するビデオカメラである。カメラ1の設置場所は特に限定されず、信号機であってよいし、撮影領域近傍の電柱あるいは建物の屋上などであってもよい。
【0023】
[画像処理装置]
画像処理装置100は、典型的には、CPU(Central Processing Unit)やメモリ等を備えるコンピュータで構成される。画像処理装置100は、制御部10と、記憶部21と、通信部22とを備える。CPU処理の一部をGPUで処理してもよい。
【0024】
制御部10は、CPUの機能ブロックとして、取得部11と、前処理部12と、検出部13とを有する。
【0025】
取得部11は、カメラ1から撮影領域の画像データを取得し、記憶部21へ格納する。前処理部12は、後述するように、取得部11で取得した画像を検出部13で処理できる画像サイズに調整する。検出部13は、前処理部12でサイズ調整された入力画像から、あらかじめ検出対象として設定された物体(オブジェクト)を検出する。本実施形態では、検出部13は、深層学習器を含み、記憶部21に格納された学習モデルを使用しながら、入力画像における検出対象の存在の有無を判定し、検出対象が存在する場合はその種別(車両、歩行者など)や位置を個々の検出対象ごとに検出する。
【0026】
記憶部21は、半導体メモリ、ハードディスクドライブ等の記憶装置で構成される。記憶部21は、制御部10に後述する各種機能を実行させるためのプログラムや演算パラメータ、さらに、検出部13における物体検出処理の際に参照される学習モデルが格納される。記憶部21は、画像処理装置100に内蔵される場合に限られず、画像処理装置100とは別体の記憶装置であってもよいし、ネットワークを介して制御装置10と接続可能なクラウドサーバ等であってもよい。
【0027】
通信部22は、管制センタ2あるいは信号機制御部3との間で情報の送受信を行うことが通信モジュールで構成される。通信方式は特に限定されず、有線であってもよいし、無線であってもよい。
【0028】
なお、管制センタ2は、管制エリアに属する信号機を管理する交通管制センタである。信号機制御部3は、例えば、交差点内の複数の信号機を統括的に制御する制御装置である。信号機制御部3は、制御対象である信号機が管制エリアに属する場合は管制センタ2からの指示に基づいて各信号機を制御し、制御対象である信号機が非管制エリアに属する場合は信号機制御部3が主体となって各信号機を制御する。
【0029】
深層学習を利用した画像の物体検出処理においては、物体(オブジェクト)の検出を容易にするため、
図2(A)に示すように入力画像が所定サイズSに定められている。このため、所定サイズSにない入力画像については、画像の長辺と短辺の大きさを所定サイズSに調整する必要がある。例えば、入力画像の画像サイズが所定サイズSに合致しない場合、
図2(B)に示すように、画像比率を維持して画像サイズを変換(主として縮小)することが多いが、縦横の比率に合わない領域(余白部分)は黒く塗り潰されるなどして、実質的に検出処理として使用されない領域が生じてしまう。
【0030】
また、画像内に大きく撮像される部分と小さく撮像される部分がある場合、小さく撮像される部分は上記縮小処理によって深層学習が検出しやすい大きさより小さくなるため、検出対象の検出率が低下するという問題があった。
【0031】
そこで本実施形態では、入力画像の本来使用されない領域を活用することで、深層学習を無駄なく活用できるように画像処理装置100が構成されている。具体的に、前処理部12は、
図3に示すように、入力画像を構成する第1の画像G1と、その一部の領域G1aの拡大画像である第2の画像G2を生成し、その第2の画像G2を入力画像の使用されない領域に埋め込むことで物体の検出率の向上を図るようにしている。以下、前処理部12の詳細について説明する。
【0032】
[前処理部の詳細]
前処理部12は、
図3に示すように、第1の画像G1と、第1の画像G1の一部の領域G1aの拡大画像である第2の画像G2とを含む所定サイズSの入力画像Gを生成する。
第1の画像G1は、取得部11で取得したカメラ1の撮影画像に相当する。第2の画像G2として抽出される領域G1aは、第1の画像G1においてユーザにより予め設定された画素領域である。所定サイズSとは、深層学習器を構成する検出部13に入力される画像のサイズであって、典型的には、正方形である。
【0033】
本実施形態において前処理部12は、画像調整部121と、画像抽出部122と、画像合成部123とを有する。
【0034】
画像調整部121は、第1の画像G1の元画像(カメラ1の撮影画像)を所定サイズSに収まるように縮小するように構成される。例えば、カメラ1の撮影画像が縦1080画素、横1920画素(縦横比9:16)の場合、その画像比率を変更することなく、
図3に示すように撮影画像のサイズを所定サイズSに収まるように縮小した第1の画像G1に加工する。第1の画像G1は、典型的には、カメラ1の撮影画像の画素データを間引くことで解像度を低下させた画像である。
【0035】
画像抽出部122は、第1の画像G1の予め設定された領域G1aの拡大画像を第2の画像G2として抽出する。領域G1aは、任意に設定可能であり、撮影対象やカメラ1の広角あるいは倍率などに応じて任意に設定可能である。第2の画像G2として抽出する領域の数も1つに限られず、2つ以上であってもよい。また、第2の画像G2は、第1の画像G1の解像度よりも高い解像度であることが好ましく、例えば、第2の画像G2の解像度は、第1の画像G1の元画像の解像度に変換される。
【0036】
画像合成部123は、第1の画像G1を所定サイズSに収まるように縮小したときに得られる入力画像Gの余白部に第2の画像G2を合成するように構成される。上記余白部は、
図2(B)における非使用領域に相当し、検出部13において本来ならば検出領域として利用されない部分に相当する。本実施形態では、この余白部分を有効に活用しつつ、第1の画像G1の画像サイズでは物体を検出することが困難な領域の拡大画像(第2の画像G2)で当該余白部分を埋める。これにより、第1の画像G1および第2の画像G2の2つの画像サイズで物体検出が行えるようになるため、物体の検出率の向上が図れるようになる。
【0037】
[画像処理方法]
続いて、以上のように構成される画像処理装置100の典型的な動作について説明する。
図4は、制御装置10において実行される処理手順の一例を示すフローチャートである。
【0038】
取得部11は、カメラ1の撮影画像を取得する(ステップ101)。
図5に、カメラ1の撮影画像G0の一例を示す。ここでは、撮影画像G0として、道路の交差点の一部の領域を被写体とした広角カメラ画像が示されている。この撮影画像G0には、交差点で信号待ちしている複数台の車両Vおよび複数の横断歩道Cが撮影されている。
【0039】
続いて、前処理部12(画像調整部121)は、撮影画像G0を検出部13へ入力するのに必要な所定サイズS(
図2(A)参照)に調整する(ステップ102)。
本実施形態では、撮影画像G0の縦横比(例えば、9:16)を維持しつつ、
図6に示すように、撮影画像G0を所定サイズSに収まるように縮小した第1の画像G1を生成する。
【0040】
続いて、前処理部12(画像抽出部122)は、第1の画像G1の予め設定された領域G1a(
図6参照)の拡大画像を第2の画像G2として抽出する(ステップ103)。
領域G1aの位置や大きさは任意に設定可能である。例えば、信号待ちしている車両Vの台数の検出を目的とする場合、第1の画像G1において、信号待ちしている車列の後方部分を第2の画像G2として抽出可能に領域G1aが設定される。
【0041】
特に、カメラ1に広角レンズが使用されている場合などにおいては、カメラ1から遠方の領域ほど物体が小さく撮影されることになる。その領域に検出対象が存在する場合、前工程で撮影画像G0のサイズ調整処理(ステップ102)が実行されると、当該領域に存在する検出対象(例えば
図5における車両V1)がさらに小さくなり、検出部13における物体検出処理で適切な検出処理が行えなくなるおそれがある。そこで本実施形態では、このような領域を第2の画像G2としての抽出領域として設定あるいは指定することにより、撮影画像G0の縮小処理に伴う上述した弊害を解消し、遠方位置に撮影された物体の検出率の向上を図るようにしている。
【0042】
続いて、前処理部(画像合成部123)は、抽出した領域G1aの拡大画像を第2の画像G2として、入力画像の非使用領域に当該第2の画像G2を合成する処理を実行する(ステップ104)。
【0043】
画像合成部123は、第2の画像G2を第1の画像G1の元画像である撮影画像G0の解像度に変換する処理を実行する。これにより、第2の画像G2をより高精度に生成することができるため、検出部13における物体検出処理を適切に行うことが可能となる。
【0044】
画像合成部123はさらに、入力画像の非使用領域に合成した第2の画像G2の座標情報を、第1の画像G1の領域G1aにおける座標情報に紐づけて記憶部21へ格納する。これにより、第2の画像G2で検出された物体の座標位置を、第1の画像G1上の座標位置に対応付けて特定することが可能となる。
【0045】
続いて、検出部13は、第1の画像G1および第2の画像G2を含む入力画像を基に、検出対象である物体の検出処理を実行する(ステップ105)。
物体の検出処理は、入力画像(第1の画像G1および第2の画像G2)における物体の存在の有無、物体が存在する場合はその種別および位置をそれぞれ検出する。物体の検出処理には、例えば、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を使用した深層学習モデルが用いられる。
【0046】
続いて検出部13は、検出した物体の検出位置、特に、第2の画像G2で検出された物体の座標位置を第1の画像G1の座標系に変換する処理を実行する(ステップ106)。
これにより、例えば、第1の画像G1では検出されなかった物体(例えば車両V1)が第2の画像G2で検出された場合、検出された物体V1の位置を第1の画像G1上における位置として容易に把握することができる。
【0047】
続いて、制御部10は、検出部13における物体の検出結果を管制センタ2あるいは信号機制御部3へ出力する(ステップ107)。
管制センタ2あるいは信号機制御部3は、画像処理装置100の出力に基づき、カメラ1の撮像領域に対応する信号機の階梯を制御するための秒数の現示データを切り替える。例えば、信号待ちで停止している車両V1の台数が所定台数以上である場合、信号機の赤色表示の秒数を短くする、あるいは、右折レーンでの停止車両台数が所定以上である場合、右折矢印信号の表示時間を長くするなどの信号機制御を実行する。これにより、当該交差点における渋滞の発生を抑制することができる。
【0048】
以上の処理を、カメラ1から画像を取得するたびに繰り返し実行することにより、撮影領域における交通状況をリアルタイムで把握することができるため、適切な信号機制御が実現可能となる。
【0049】
なお、画像処理装置100から出力される物体検出情報は、表示装置などに画像として表示されてもよい。また、画像処理装置100から出力される物体検出情報を基に、当該交差点を通行する車両へ提示可能な運転支援情報が生成されてもよい。運転支援情報としては、例えば、横断歩道Cに歩行者が検出された場合、当該横断歩道を通過する右折車等へ歩行者の存在を知らせる各種アラート情報が挙げられる。
【0050】
以上のように本実施形態によれば、深層学習が処理する画像サイズをすべて活用して検出部13における画像の認識処理を実行することができるため、検出領域を拡張することが可能となり、これにより撮影画像の物体検出処理を効率よく行うことができる。
【0051】
また、1つの入力画像に解像度が異なる複数の画像を合成するようにしているので、深層学習を複数回実行することなく物体の検出結果を取得することができる。また、一方の画像で検出できない画像を他方の画像で検出することが可能となるため、物体の検出率の向上を図ることができる。
【0052】
さらに本実施形態によれば、第1の画像G1の一部の領域G1aの拡大画像を第2の画像G2として抽出、合成するようにしているので、検出目的や撮影対象の種類などに応じて抽出領域を自由に設定することができる。
【0053】
<変形例>
以上の説明で、第2の画像G2は、第1の画像G1の一部の領域G1aの拡大画像であるが、これに限られず、第2の画像G2は、第1の画像G1の一部の領域G1aの縮小画像であってもよい。
【0054】
第2の画像G2が、第1の画像G1の一部の領域G1aの縮小画像である場合について説明する。検出部13が入力画像における検出対象の有無を判定する場合、記憶部21に格納された学習モデルを使用し、物体検出処理を行う。ここで、学習モデルで学習する検出対象となる物体の画像サイズが、第1の画像G1に表示される検出対象となる物体の画像サイズより小さい場合、深層学習が検出しやすい大きさより大きくなるため検出対象の検出率が低下するという問題があった。
【0055】
そこで入力画像の本来使用されない領域を活用することで、検出対象の検出率が向上できるように画像処理装置100が構成されている。具体的には、前処理部12は、入力画像を構成する第1の画像G1と、その一部の領域G1aの縮小画像である第2の画像G2を生成し、その第2の画像を入力画像の使用されない領域に埋め込まれる。これにより深層学習が検出しやすい大きさに縮小されるため、物体の検出率の向上を図ることができる。
また第2の画像G2のサイズに関しては、学習モデルによる学習時の検出対象となる物体のサイズとおおよそ同じであることが好ましい。
【0056】
以上、本発明の実施形態について説明したが、本発明は上述の実施形態にのみ限定されるものではなく種々変更を加え得ることは勿論である。
【0057】
例えば以上の実施形態では、第2の画像G2として第1の画像G1の一部の領域G1aを抽出するようにしたが、抽出する領域の数は1つに限られず、例えば
図8に示すように2つ以上であってもよい。この場合、同図において領域G1aの拡大画像は第2の画像G2aとして、領域G1bの拡大画像は第2の画像G2bとして、それぞれ入力画像に合成される。領域G1a,G1bの大きさや拡大率は任意に設定可能である。
【0058】
また、以上の実施形態では、道路の交差点の撮影画像から物体(主に車両)を検出する処理を例に挙げて説明したが、勿論これに限られず、交通施設や商業施設における各種監視システムに本発明は適用可能である。
【符号の説明】
【0059】
1…カメラ
10…制御装置
11…取得部
12…前処理部
13…検出部
100…画像処理装置
121…画像調整部
122…画像抽出部
123…画像合成部
G0…撮影画像(元画像)
G1…第1の画像
G2…第2の画像