(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024077770
(43)【公開日】2024-06-10
(54)【発明の名称】信号処理装置および信号処理方法
(51)【国際特許分類】
G06V 10/25 20220101AFI20240603BHJP
【FI】
G06V10/25
【審査請求】未請求
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2022189910
(22)【出願日】2022-11-29
(71)【出願人】
【識別番号】316005926
【氏名又は名称】ソニーセミコンダクタソリューションズ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】亀山 純哉
(72)【発明者】
【氏名】三浦 悟司
(72)【発明者】
【氏名】五関 正三
(72)【発明者】
【氏名】後藤 昌一
(57)【要約】
【課題】撮像画像に対するAIを用いた認識処理による精度を向上させることが可能な信号処理装置および信号処理方法を提供する。
【解決手段】本開示に係る信号処理装置は、撮像画像に対して探索領域を設定する領域制御部と、前記探索領域における輝度情報に対する変換処理を実行する画像処理部と、を備え、前記領域制御部は、前記画像処理部で前記変換処理が実行された画像に対するオブジェクト検出の結果に基づき前記探索領域から注目領域を決定する。
【選択図】
図4
【特許請求の範囲】
【請求項1】
撮像画像に対して探索領域を設定する領域制御部と、
前記探索領域における輝度情報に対する変換処理を実行する画像処理部と、
を備え、
前記領域制御部は、
前記画像処理部で前記変換処理が実行された画像に対するオブジェクト検出の結果に基づき前記探索領域から注目領域を決定する、
信号処理装置。
【請求項2】
前記画像処理部は、
前記変換処理として前記輝度情報に対するヒストグラム平坦化を実行する、
請求項1に記載の信号処理装置。
【請求項3】
前記領域制御部は、
前記探索領域のうち前記オブジェクト検出により検出されたオブジェクトの数が最大の探索領域を、前記注目領域として決定する、
請求項1に記載の信号処理装置。
【請求項4】
前記領域制御部は、
前記撮像画像を分割した各領域を順次に前記探索領域として設定する、
請求項1に記載の信号処理装置。
【請求項5】
前記領域制御部は、
前記オブジェクト検出の結果に応じて前記探索領域を段階的に狭める、
請求項1に記載の信号処理装置。
【請求項6】
前記領域制御部は、
前記オブジェクト検出により検出された2以上のオブジェクトの重心位置に応じて前記探索領域を段階的に狭める、
請求項5に記載の信号処理装置。
【請求項7】
前記画像処理部は、
前記探索領域に含まれる画像の画像特徴量に基づき、2以上の前記探索領域から類似度が所定以上の領域を探索する、
請求項1に記載の信号処理装置。
【請求項8】
撮像装置から出力された前記撮像画像を取得し、取得した前記撮像画像が前記画像処理部で前記変換処理を施された画像を、学習されたモデルを用いて情報処理を行う情報処理装置に出力する、
請求項1に記載の信号処理装置。
【請求項9】
プロセッサにより実行される、
撮像画像に対して探索領域を設定する領域制御ステップと、
前記探索領域における輝度情報に対する変換処理を実行する画像処理ステップと、
を有し、
前記領域制御ステップは、
前記画像処理ステップにより前記変換処理が実行された画像に対するオブジェクト検出の結果に基づき前記探索領域から注目領域を決定する、
信号処理方法。
【請求項10】
撮像画像に対して画像処理を施して、学習された第1のモデルを用いた処理を行う処理部に出力する画像処理部と、
予め用意された第1の特徴量と、前記画像処理を施された前記撮像画像から抽出された第2の特徴量とに基づき、少なくとも前記画像処理部による前記画像処理を制御するためのパラメータを生成する生成部と、
を備える、
信号処理装置。
【請求項11】
前記生成部は、
前記第1のモデルを学習した学習データに基づき抽出された特徴量を、前記第1の特徴量として用いる、
請求項10に記載の信号処理装置。
【請求項12】
前記生成部は、
前記画像処理を施された前記撮像画像に対して、前記第1のモデルに対応する第2のモデルを用いた処理を行い、該処理の結果に基づき抽出された特徴量を、前記第1の特徴量として用いる、
請求項10に記載の信号処理装置。
【請求項13】
前記生成部は、
前記第2のモデルを用いた処理に基づくスコアがより高くなるように、前記パラメータを生成する、
請求項12に記載の信号処理装置。
【請求項14】
前記生成部は、
前記画像処理部が前記処理部に出力するための前記撮像画像に対して予め取得した前記撮像画像に基づき、前記第2のモデルを用いた処理を行う、
請求項12に記載の信号処理装置。
【請求項15】
前記第2のモデルは、前記処理部が有する前記第1のモデルである、
請求項12に記載の信号処理装置。
【請求項16】
前記生成部は、
前記第1の特徴量と前記第2の特徴量とに基づき、前記撮像画像を出力する撮像装置を制御するためのパラメータをさらに生成する、
請求項10に記載の信号処理装置。
【請求項17】
プロセッサにより実行される、
撮像画像に対して画像処理を施して、学習された第1のモデルを用いた処理を行う処理部に出力する画像処理ステップと、
予め用意された第1の特徴量と、前記画像処理を施された前記撮像画像から抽出された第2の特徴量とに基づき、少なくとも前記画像処理ステップによる前記画像処理を制御するためのパラメータを生成する生成ステップと、
を有する、
信号処理方法。
【請求項18】
撮像画像に対して、前記撮像画像の画像特徴量を最大化するための、輝度情報に対する変換処理を実行する画像処理部、
を備える、
信号処理装置。
【請求項19】
複数の前記撮像画像から抽出された前記画像特徴量のそれぞれに基づき、類似度が所定以上の領域を探索する探索部、
をさらに備え、
前記探索部は、
前記探索された前記類似度が所定以上の領域を示す情報を、オブジェクト検出のための情報として出力する、
請求項18に記載の信号処理装置。
【請求項20】
プロセッサにより実行される、
撮像画像に対して、前記撮像画像の画像特徴量を最大化するための、輝度情報に対する変換処理を実行する画像処理ステップ、
を有する、
信号処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、信号処理装置および信号処理方法に関する。
【背景技術】
【0002】
カメラにより撮像された撮像画像に対してAI(Artificial Intelligence)を用いて認識処理を行う技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
撮像画像に対するAIを用いた認識処理における認識精度の向上が求められている。
【0005】
本開示は、撮像画像に対するAIを用いた認識処理による精度を向上させることが可能な信号処理装置および信号処理方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示に係る信号処理装置は、撮像画像に対して探索領域を設定する領域制御部と、前記探索領域における輝度情報に対する変換処理を実行する画像処理部と、を備え、前記領域制御部は、前記画像処理部で前記変換処理が実行された画像に対するオブジェクト検出の結果に基づき前記探索領域から注目領域を決定する。
【図面の簡単な説明】
【0007】
【
図1A】各実施形態に係る情報処理システムの構成例を示すブロック図である。
【
図1B】各実施形態に係る情報処理システムの構成例を示すブロック図である。
【
図2】各実施形態に適用可能な信号処理装置の一例のハードウェア構成を示すブロック図である。
【
図3】各実施形態に適用可能なカメラの一例のハードウェア構成を示すブロック図である。
【
図4】第1の実施形態に係る信号処理装置の機能を説明するための一例の機能ブロック図である。
【
図5】第1の実施形態の第1の例による処理を説明するための模式図である。
【
図6】第1の実施形態の第1の例に係る第1の処理を示す一例のフローチャートである。
【
図7】撮像画像データをN個の小領域に分割した例を示す模式図である。
【
図8】第1の実施形態の第1の例に係る第2の処理を示す一例のフローチャートである。
【
図9】第1の実施形態の第2の例による処理を説明するための模式図である。
【
図10】第1の実施形態の第2の例に係る処理を示す一例のフローチャートである。
【
図11】第1の実施形態の第2の例に係る探索領域の縮小処理を説明するための模式図である。
【
図12】第2の実施形態に係る信号処理装置の機能を説明するための一例の機能ブロック図である。
【
図13】第2の実施形態に係る処理を示す一例のフローチャートである。
【
図14】第3の実施形態に係る情報処理システムの一例の構成を示すブロック図である。
【
図15】第3の実施形態の第1の例に係る情報処理システムの一例の構成を示すブロック図である。
【
図16】第3の実施形態の第2の例に係る情報処理システムの一例の構成を示すブロック図である。
【発明を実施するための形態】
【0008】
以下、本開示の実施形態について、図面に基づいて詳細に説明する。なお、以下の実施形態において、同一の部位には同一の符号を付することにより、重複する説明を省略する。
【0009】
以下、本開示の実施形態について、下記の順序に従って説明する。
1.本開示の技術の概要
2.各実施形態に適用可能な構成
2-1.システム構成例
2-2.ハードウェア構成例
3.第1の実施形態
3-1.第1の例
3-2.第2の例
4.第2の実施形態
5.第3の実施形態
5-1.第1の例
5-2.第2の例
【0010】
(1.本開示の技術の概要)
先ず、本開示の技術について概略的に説明する。本開示では、例えばカメラにより撮像された撮像画像の部分あるいは全体を対象として信号処理を実行して、対象の領域における画像特徴量を最大化する。この画像特徴量が最大化された画像に対して、AI(Artificial Intelligence)を用いてAI処理、例えば認識処理を実行する。画像特徴量が最大化された画像に対してAIによる認識処理を実行することで、より高精度の認識結果を取得することが可能となる。また、本開示では、AIタスクに適した画像特徴量に基づく、カメラおよび信号処理に対するキャリブレーション方法も提案する。
【0011】
(2.各実施形態に適用可能な構成)
次に、各実施形態に適用可能な構成について説明する。
【0012】
(2-1.システム構成例)
図1Aおよび
図1Bは、各実施形態に係る情報処理システムの構成例を示すブロック図である。
【0013】
図1Aにおいて、情報処理システム1aは、それぞれ有線あるいは無線により接続されるカメラ10と、信号処理装置20と、AI装置30と、を含む。カメラ10は、被写体を撮像し、撮像により得られた撮像画像を出力する。より具体的には、カメラ10は、所定のフレームレートで、動画像による撮像を行い、フレームごとの撮像画像を出力する。
【0014】
信号処理装置20は、カメラ10から出力された撮像画像を取得し、取得した撮像画像に対して所定の信号処理を施す。例えば、信号処理装置20は、取得した撮像画像に対して、AI装置30がAI処理を行う注目領域の候補である探索領域を設定してよい。探索領域は、撮像画像の一部の小領域であってもよいし、撮像画像の全体を含む大領域であってもよい。
【0015】
また、信号処理装置20は、設定した探索領域の画像特徴量を最大化するための信号処理を施してよい。信号処理装置20は、画像特徴量を最大化するための信号処理として、輝度情報に対する変換処理を施してよい。より具体的には、信号処理装置20は、当該信号処理として、ヒストグラム平坦化を適用してよい。
【0016】
ヒストグラム平坦化は、画素値のヒストグラムが全体的に平坦になるように濃度変換を行う処理である。コントラストの低い画像は、ある輝度帯域に画素値の頻度が集中している。そのため、ヒストグラムを平坦化することで、コントラストの高い画像を得ることが可能である。ヒストグラム平坦化により画像を高コントラスト化することで、当該画像による画像特徴量を最大化することが可能である。
【0017】
信号処理装置20は、撮像画像に対して上述の信号処理を施した画像を、AI装置30に渡す。
【0018】
信号処理装置20は、さらに、AI装置30から、探索領域の画像に対してAI処理を施した処理結果を受け取ってよい。信号処理装置20は、AI装置30から受け取った処理結果に基づき、探索領域から継続的に処理対象とする注目領域を決定してよい。
【0019】
AI装置30は、例えば予め学習されたモデルを有し、信号処理装置20から渡された画像に対して当該モデルを用いてAIによる処理を実行する。より具体的には、AI装置30は、信号処理装置20から渡された画像から画像の特徴を示す画像特徴量を抽出し、抽出した画像特徴量に基づきAIによる処理を実行する。AI装置30が実行するAIによる処理(以下、適宜、AI処理と呼ぶ)は、特に限定されないが、例えばCNN(Convolutional Neural Network)を用いた、画像特徴量に基づく認識処理であってよい。AI装置30は、AI処理による処理結果を信号処理装置20に渡してよい。また、AI装置30は、AI処理による処理結果を外部に出力してよい。さらに、AI装置30は、抽出した画像特徴量を外部に出力してもよい。
【0020】
なお、
図1Aでは、カメラ10、信号処理装置20およびAI装置30がそれぞれ独立した装置として示されているが、これはこの例に限定されない。例えば、カメラ10と信号処理装置20とを一体的に構成してよい。同様に、信号処理装置20とAI装置30とを一体的に構成してもよいし、カメラ10、信号処理装置20およびAI装置30を一体的に構成することもできる。さらに、AI装置30は、単独の装置に限定されず、例えばクラウドネットワーク上に構成されるシステムであってもよい。
【0021】
図1Bは、各実施形態に適用可能な情報処理システムの別の構成例を示すブロック図である。
図1Bにおいて、情報処理システム1bは、複数のカメラ10
1、10
2、…と、これらカメラ10
1、10
2、…それぞれに接続される複数の信号処理装置20
1、20
2、…を含む。各信号処理装置20
1、20
2、…は、AI装置30’に接続される。
【0022】
AI装置30’は、各信号処理装置201、202、…から渡された画像から画像特徴量を抽出し、抽出した画像特徴量に基づき、認識処理のようなAI処理を実行し、AI処理による処理結果を各信号処理装置201、202、…に返すと共に、外部に出力する。
【0023】
図1Bに示す情報処理システム1bは、各カメラ10
1、10
2、…による各撮像画像に対して、各信号処理装置20
1、20
2、…により、画像特徴量を最大化するために、ヒストグラム平坦化といった輝度情報の変換処理を施している。この処理により、撮像画像に基づく画像特徴量の抽出において、例えば各カメラ10
1、10
2、…の撮像条件の差異(照明条件が異なるなど)を吸収することができる。
【0024】
図1Aおよび
図1Bにそれぞれ示した情報処理システム1aおよび1bは、例えば撮像画像に基づく監視を行う監視システムに適用可能である。例えば、
図1Bに示す情報処理システム1bでは、カメラ10
1、10
2、…による各撮像画像に基づき、各撮像画像内に共通するオブジェクト(例えば人)を特定してよい。また、
図1Aに示す情報処理システム1aにおいても、カメラ10により撮像された、時系列方向の各撮像画像に基づき、各撮像画像内に共通するオブジェクト(例えば人)を特定してよい。情報処理システム1aまたは1bが適用された監視システムは、このように特定されたオブジェクト(人)を追跡することができる。
【0025】
(2-2.ハードウェア構成例)
次に、各実施形態に適用可能なハードウェア構成例について説明する。
【0026】
図2は、各実施形態に適用可能な信号処理装置20の一例のハードウェア構成を示すブロック図である。
【0027】
図2において、信号処理装置20は、CPU(Central Processing Unit)2000と、ROM(Read Only Memory)2001と、RAM(Random Access Memory)2002と、ストレージ装置2003と、データI/F(インタフェース)2004と、通信I/F2005と、カメラI/F2006と、を含み、これら各部がバス2020により互いに通信可能に接続される。また、信号処理装置20は、画像処理装置2010をさらに含んでよい。画像処理装置2010は、バス2020に接続され、信号処理装置20の各部と互いに通信可能に接続される。
【0028】
ストレージ装置2003は、例えばフラッシュメモリやハードディスクドライブといった不揮発性の記憶媒体である。CPU2000は、ROM2001およびストレージ装置2003に記憶されるプログラムに従い、RAM2002をワークメモリとして用いて、この信号処理装置20の全体の動作を制御する。
【0029】
データI/F2004は、外部の装置との間でのデータの入出力を制御する。例えば、データI/F2004は、カメラ10との間でのデータの入出力や、AI装置30との間でのデータの入出力を制御するものであってもよい。データI/F2004は、接続される機器(カメラ10、AI装置30)に独自の方式のインタフェースであってよいし、データI/F2004は、例えばUSB(Universal Serial Bus)やBluetooth(登録商標)といった、汎用のインタフェースであってもよい。
【0030】
通信I/F2005は、LAN(Local Area Network)やインターネットといった通信ネットワークを介した通信を制御する。
【0031】
カメラI/F2006は、カメラ10との間で通信を行うためのインタフェースである。信号処理装置20は、カメラ10から出力される画像データを、カメラI/F2006により受信し、例えばCPU2000に渡す。
図2の例では、カメラI/F2006が独立したブロックとして示されているが、これはこの例に限定されず、例えばデータI/F2004をカメラI/F2006として用いることも可能である。
【0032】
画像処理装置2010は、例えばISP(Image Signal Processor)であってよく、CPU2000からの指示に従い、バス2020を介して供給される画像データに対して画像処理を施す。画像処理装置2010による画像処理の結果は、例えばCPU2000に渡される。
【0033】
なお、画像処理装置2010により実行される画像処理が、CPU2000により実行可能である場合には、画像処理装置2010を省略することができる。
【0034】
図3は、各実施形態に適用可能なカメラ10の一例のハードウェア構成を示すブロック図である。
図3において、カメラ10は、CPU1000と、ROM1001と、RAM1002と、センサ1010と、フレームメモリ1011と、カメラI/F1012と、を含み、これら各部がバス1020により互いに通信可能に接続される。
【0035】
CPU1000は、ROM1001に記憶されるプログラムに従い、RAM1002をワークメモリとして用いて、このカメラ10の全体の動作を制御する。
【0036】
センサ1010は、受光した光を電気信号に変換する画素が行列状の配列で配置された画素アレイと、画素アレイに含まれる各画素を駆動するための駆動回路と、各画素から読み出された電気信号(画素信号)に対してノイズ除去、ゲイン調整といった所定の信号処理を施す信号処理回路とを含む。また、当該信号処理回路は、各画素からアナログ方式の信号として読み出された画素信号を、ディジタル方式の信号(画素データ)に変換するAD(Analog to Digital)変換回路をさらに含む。
【0037】
センサ1010は、レンズ、絞り機構、オートフォーカス機構などを含む光学部11を介して入射された光が画素アレイの照射面に照射される。センサ1010は、各画素において露光を行い、露光により各画素から読み出されたアナログ方式の画素信号をディジタル方式の画素データに変換して出力する。センサ1010から出力された画素データは、フレームメモリ1011に格納される。フレームメモリ1011に1フレーム分の画素データが格納されると、それがフレーム画像の画像データとして、フレームメモリ1011から読み出される。
【0038】
なお、1フレームの画像データは、1フレーム期間に画素アレイにおける有効画素領域から読み出された画素信号に基づくデータである。
【0039】
カメラI/F1012は、外部機器(例えば信号処理装置20)との間で通信を行うためのインタフェースである。カメラ10は、撮像画像データを、カメラI/F1012から外部に出力する。より具体的には、カメラ10は、フレームメモリ1011から読み出された1フレーム分の画像データを、カメラI/F1012から、撮像画像データとして出力する。なお、撮像画像データは、適宜、撮像画像と呼ばれることがある。また、カメラI/F1012は、外部機器との間で、コマンドを含む各種データの入出力を行ってよい。
【0040】
なお、AI装置30は、CPU、ROM、RAM、ストレージ装置、通信I/Fなどを有し、一般的なコンピュータと同等の構成を適用できるので、ここでの詳細な説明を省略する。AI装置30が実行するAI処理のためのモデルは、例えばストレージ装置に格納される。
【0041】
(3.第1の実施形態)
次に、本開示の第1の実施形態について説明する。本開示の第1の実施形態では、AI装置30が継続的にAI処理を行うための注目領域を自動探索するシステムを提案する。より具体的には、第1の実施形態では、撮像画像の全体あるいは小領域による探索領域に対して画像特徴量を最大化するための画像処理を施してAI装置30によりAI処理を実行し、その処理結果に基づき、AI装置30が継続的にAI処理を行うための注目領域を決定する。
【0042】
なお、以下では、特に記載の無い限り、AI装置30は、AI処理としてオブジェクト検出を行うための認識処理を実行するものとする。
【0043】
図4は、第1の実施形態に係る信号処理装置20の機能を説明するための一例の機能ブロック図である。
【0044】
図4において、第1の実施形態に係る情報処理システム1cが含む信号処理装置20aは、領域制御部200と、画像処理部201と、検出結果処理部202と、を含む。
【0045】
これら領域制御部200、画像処理部201および検出結果処理部202は、第1の実施形態に係る信号処理プログラムがCPU2000上で動作することで構成されてよい。これに限らず、これら領域制御部200、画像処理部201および検出結果処理部202の一部または全部を、互いに協働して動作するハードウェア回路(ISPなど)により構成してもよい。
【0046】
領域制御部200は、カメラ10から出力された撮像画像に対して探索領域あるいは注目領域を設定する。
【0047】
画像処理部201は、領域制御部200により設定された探索領域あるいは注目領域の画像データに対して画像特徴量を最大化するための画像処理を施す。画像処理部201は、画像処理を施した画像データをAI装置30に渡す。
【0048】
本開示では、画像処理部201における画像データの画像特徴量を最大化する画像処理として、ヒストグラム平坦化を行う。ヒストグラム平坦化は、画素値のヒストグラムが全体的に平坦になるように濃度変換を行う処理である。換言すれば、ヒストグラム平坦化処理は、画像データの輝度情報に対する変換処理ということができる。コントラストの低い画像は、ある輝度帯域に画素値の頻度が集中している。そのため、ヒストグラムを平坦化することで、コントラストの高い画像を得ることが可能である。ヒストグラム平坦化により画像を高コントラスト化することで、当該画像による画像特徴量を最大化することが可能である。
【0049】
検出結果処理部202は、AI装置30による認識処理によるオブジェクトの検出結果を取得する。例えば、AI装置30は、認識処理により検出されたオブジェクトに基づき当該オブジェクトを含むバウンディングボックスを生成し、生成したバウンディングボックスを示す情報を、オブジェクトの検出結果として出力してよい。バウンディングボックスを示す情報は、例えば、バウンディングボックスの画像内での座標を示す情報を含む。バウンディングボックスの座標は、例えばX軸方向の最大値および最小値、Y軸方向の最大値および最小値により表してよい。検出結果処理部202は、AI装置30から取得した検出結果に対して、処理の処理を実行する。
【0050】
なお、以下では、「バウンディングボックスを示す情報」を単に「バウンディングボックス」として記述することがある。
【0051】
領域制御部200は、検出結果処理部202によりAI装置30の検出結果に所定の処理が施された情報に基づき、探索領域の絞り込み、AI装置30が継続的に認識対象とする注目領域の決定、などの処理を行う。
【0052】
信号処理装置20において、CPU2000は、実施形態に係る機能を実現するためのプログラムが実行されることで、上述した領域制御部200、画像処理部201および検出結果処理部202を、RAM2002における主記憶領域に、例えばモジュールとして構成する。
【0053】
当該プログラムは、例えば通信I/F2005を介した通信により、図示されないネットワークを介して外部から取得し、当該信号処理装置20上にインストールすることが可能とされている。これに限らず、当該プログラムは、CD(Compact Disk)やDVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリといった着脱可能な記憶媒体に記憶されて提供されてもよい。
【0054】
(3-1.第1の例)
第1の実施形態の第1の例について説明する。第1の実施形態の第1の例は、撮像画像データに対して予め決められた小領域ごとにヒストグラム平坦化を施して順次、オブジェクトを探索するようにした例である。
【0055】
図5は、第1の実施形態の第1の例による処理を説明するための模式図である。信号処理装置20aにおいて、領域制御部200は、撮像画像データ40を小領域に分割する。
図5のセクション(a)の例では、領域制御部200は、撮像画像データ40を高さおよび幅方向にそれぞれ3分割し、9個の小領域#1~#9に分割している。ここで、中央の小領域#5にオブジェクト60(この場合は人)が含まれているものとする。
【0056】
信号処理装置20aにおいて、画像処理部201は、
図5のセクション(b)に示されるように、例えば撮像画像データ40の左上の小領域#1を探索領域50としてヒストグラム平坦化処理を行い、処理された小領域#1の画像データをAI装置30に渡す。AI装置30は、信号処理装置20aから渡された小領域#1の画像データから画像特徴量を抽出し、抽出した画像特徴量に基づきAI処理を実行する。
【0057】
画像処理部201は、同様にして、次に、
図5のセクション(c)に示されるように、小領域#1の右隣の小領域#2を探索領域50としてヒストグラム平坦化処理を行い、処理された小領域#2の画像データをAI装置30に渡す。AI装置30は、信号処理装置20aから渡された小領域#2の画像データから画像特徴量を抽出し、抽出した画像特徴量に基づきAI処理を実行する。画像処理部201は、以降、撮像画像データ40の右下の小領域#9に向けて、各小領域#3~#9の画像データを順次に探索領域50としてヒストグラム平坦化処理を行い、AI装置30に渡す。AI装置30は、信号処理装置20aから渡された小領域#3~#9の各画像データに対して、順次に、画像特徴量の抽出処理、抽出した画像特徴量に基づくAI処理、を実行する。
【0058】
ここで、
図5のセクション(d)に示されるように、AI装置30において、探索領域50としての小領域#5においてオブジェクト60が検出されたものとする。AI装置30は、検出されたオブジェクト60に対してバウンディングボックス61を生成し、生成したバウンディングボックス61を示す情報を、信号処理装置20aに渡す。
【0059】
信号処理装置20aにおいて、検出結果処理部202は、AI装置30から渡されたバウンディングボックス61を示す情報に基づき、当該探索領域において設定されたバウンディングボックス61の数をカウントする。検出結果処理部202は、カウントしたバウンディングボックス61の数を、領域制御部200に渡す。
【0060】
領域制御部200は、各小領域#1~#9におけるバウンディングボックス61の数を比較し、小領域#1~#9のうち最もバウンディングボックス61の数が多い小領域を、AI装置30が継続的に認識処理を行う対象の注目領域として設定する。
【0061】
図6は、第1の実施形態の第1の例に係る第1の処理を示す一例のフローチャートである。
図6に示される第1の処理は、信号処理装置20aが少なくとも1フレーム分の画像データを記憶可能な画像保存用メモリを有している場合の例である。信号処理装置20aは、RAM2002の所定記憶領域を画像保存用メモリに適用してよい。これに限らず、信号処理装置20aは、画像保存用メモリとして別途にフレームメモリを設けてもよい。
【0062】
なお、ここでは、領域制御部200は、撮像画像データ40を、高さおよび幅方向にそれぞれ3分割し、9個の小領域に分割するものとする。
図7は、撮像画像データ40をN個の小領域に分割した例を示す模式図である。
図7の例では、N=9とされ、撮像画像データ40が分割された9個の小領域#1~#9に対して、左上の小領域#1から右下の小領域#9に向けて、それぞれ探索領域とした場合の変数i=0~i=8が割り当てられている。
【0063】
なお、
図6および
図7では、探索領域を、その時点で注目している注目領域(ROI:Region of Interest)として示している。
【0064】
ステップS100で、信号処理装置20aは、カメラ10から出力された1フレーム分の撮像画像データを取得し、取得した撮像画像データを、画像保存用メモリに記憶する。次のステップS101で、信号処理装置20aにおいて領域制御部200は、変数i=0とする。
【0065】
次のステップS102で、領域制御部200は、撮像画像データに対して、探索領域(ROI)を変数iの小領域に設定する。画像処理部201は、設定された探索領域の画像データに対してヒストグラム平坦化処理を実行する。画像処理部201は、ヒストグラム平坦化処理が実行された探索領域の画像データをAI装置30に渡す。
【0066】
次のステップS103で、AI装置30は、信号処理装置20aから渡された、探索領域の画像データから画像特徴量を抽出し、抽出した画像特徴量に基づき、オブジェクト60を認識し検出するオブジェクト検出処理を実行する。AI装置30は、オブジェクト検出処理の検出結果として、オブジェクトを含むバウンディングボックス61を信号処理装置20aに渡す。信号処理装置20aは、検出結果処理部202により、AI装置30から渡されたバウンディングボックス61の数をカウントする。
【0067】
次のステップS104で、領域制御部200は、撮像画像データに設定される全ての探索領域に対する処理が終了したか否かを判定する。より具体的には、領域制御部200は、変数i=N-1となったか否かを判定する。領域制御部200は、全ての探索領域に対する処理が終了していないと判定した場合(ステップS104、「No」)、変数i=i+1として処理をステップS102に戻す。
【0068】
一方、領域制御部200は、全ての探索領域に対する処理が終了したと判定した場合(ステップS104、「Yes」)、処理をステップS105に移行させる。ステップS105で、領域制御部200は、変数i=0~8の各小領域のうち、バウンディングボックス61の数が最大となる小領域を、AI装置30が継続的に認識処理を行う対象の注目領域として設定する。
【0069】
ステップS105の処理が終了すると、
図6のフローチャートによる一連の処理が終了される。
【0070】
ここで、信号処理装置20aは、
図6のフローチャートによる処理を、例えば数分ごとに1回、数10秒ごとに1回など、所定の時間間隔で定期的に実行する。処理を実行する時間間隔は、この例に限定されず、情報処理システム1cのユースケースに応じて設定される。例えば、当該情報処理システム1cが監視システムに適用される場合、当該時間間隔は、監視対象における人の流れが大きく変わるタイミングに応じて設定してよい。例えば、当該時間間隔を、1日の時間帯ごと、1週間における所定の曜日ごと、季節ごと、などに設定することが考えられる。
【0071】
AI装置30は、
図6のフローチャートのステップS105で決定された注目領域に対する認識処理を、次に当該フローチャートによる処理が実行されステップS105で注目領域が決定されるまで、継続的に実行する。
【0072】
図8は、第1の実施形態の第1の例に係る第2の処理を示す一例のフローチャートである。
図8に示される第2の処理は、信号処理装置20aが画像保存用メモリを有していない場合の例である。
【0073】
なお、1フレーム分の撮像画像データ40は、
図7と同様に、高さおよび幅方向にそれぞれ3分割された9個(N=9)の小領域#1~#9に分割され、撮像画像データ40を積算フレーム数F(Fは整数;1≦F)だけ取得するものとする。また、積算フレーム数Fのうちk(kは整数;1≦k≦F)番目のフレームの各撮像画像データ40において、左上の小領域#1から右下の小領域#9に向けて、それぞれ探索領域とした場合の変数i(i=0,1,…,8)が割り当てられているものとする。
【0074】
ステップS110で、信号処理装置20aにおいて領域制御部200は、変数k=1とする。次のステップS111で、領域制御部200は、変数i=0とする。
【0075】
次のステップS112で、信号処理装置20aは、カメラ10からkフレーム目の変数iで指定される小領域の画像データを取得する。例えば、信号処理装置20aは、領域制御部200により、カメラ10から出力される1フレーム分の撮像画像データ40から、変数iで指定される小領域に含まれる画像データを選択的に取得する。これに限らず、信号処理装置20aは、領域制御部200により、カメラ10のフレームメモリ1011から、変数iで指定される小領域に含まれる画像データを選択的に読み出してもよい。
【0076】
次のステップS113で、領域制御部200は、AI装置30の認識処理の対象となる探索領域(ROI)を、変数iの小領域に設定する。画像処理部201は、ステップS111で取得された、設定された探索領域の画像データに対してヒストグラム平坦化処理を実行する。画像処理部201は、ヒストグラム平坦化処理が実行された探索領域の画像データをAI装置30に渡す。
【0077】
次のステップS114で、AI装置30は、信号処理装置20aから渡された、探索領域の画像データから画像特徴量を抽出し、抽出した画像特徴量に基づき、オブジェクト60を認識し検出するオブジェクト検出処理を実行する。AI装置30は、オブジェクト検出処理の検出結果として、オブジェクトを含むバウンディングボックス61を信号処理装置20aに渡す。信号処理装置20aは、検出結果処理部202により、AI装置30から渡されたバウンディングボックス61の数をカウントする。
【0078】
次のステップS115で、領域制御部200は、k番目のフレームの撮像画像データに設定される全ての探索領域に対する処理が終了したか否かを判定する。より具体的には、領域制御部200は、変数i=N-1となったか否かを判定する。領域制御部200は、k番目のフレームについて、全ての探索領域に対する処理が終了していないと判定した場合(ステップS115、「No」)、変数i=i+1として処理をステップS112に戻す。
【0079】
一方、領域制御部200は、k番目のフレームの全ての探索領域に対する処理が終了したと判定した場合(ステップS115、「Yes」)、処理をステップS116に移行させる。
【0080】
ステップS116で、領域制御部200は、F番目のフレームの撮像画像データに対する処理が終了したか否かを判定する。より具体的には、領域制御部200は、変数k=Fとなったか否かを判定する。領域制御部200は、F番目のフレームの撮像画像データに対する処理が終了していないと判定した場合(ステップS116、「No」)、変数k=k+1として処理をステップS111に戻す。
【0081】
一方、領域制御部200は、ステップS116で、F番目のフレームの撮像画像データに対する処理が終了したと判定した場合(ステップS116、「Yes」)、処理をステップS117に移行させる。
【0082】
ステップS117で、領域制御部200は、1~F番目の各フレームの撮像画像データについて、変数i=0~8の各小領域それぞれのバウンディングボックス61数を積算する。領域制御部200は、変数i=0~8の各小領域それぞれのFフレーム分が積算されたバウンディングボックス61の数を求め、求めた数が最大となる小領域を、AI装置30が継続的に認識処理を行う対象の注目領域として設定する。
【0083】
ステップS117の処理が終了すると、
図8のフローチャートによる一連の処理が終了される。
【0084】
信号処理装置20aは、
図8のフローチャートによる処理を、上述した
図6のフローチャートと同様に、例えば数分ごとに1回、数10秒ごとに1回など、所定の時間間隔で定期的に実行する。AI装置30は、
図8のフローチャートのステップS117で決定された注目領域に対する認識処理を、次に当該フローチャートによる処理が実行されステップS117で注目領域が決定されるまで、継続的に実行する。
【0085】
第1の実施形態の第1の例の第2の方法では、各小領域の画像データを、処理の都度、取得しているため、例えば小領域#1と小領域#9とで時系列的に異なるフレームから画像データを取得する場合が起こり得る。そのため、第1の実施形態の第1の例の第2の方法では、複数フレームにわたり各小領域の情報を積算することで、各小領域の時系列的な情報のブレの抑制を可能としている。
【0086】
このように、第1の実施形態の第1の例では、撮像画像データを分割した小領域ごとに画像特徴量の最大化を行い、オブジェクト検出を実行する。さらに、各小領域のうち、検出されたオブジェクト60(バウンディングボックス61)の数が最大となる小領域を、AI装置30が認識処理を継続的に実行する注目領域に決定している。すなわち、第1の実施形態の第1の例では、撮像画像データから絞り込まれ、且つ、画像特徴量が最大化された小領域に対して、AI装置30による認識処理を実行させることができ、認識処理における認識精度を向上させることが可能となる。
【0087】
(3-2.第2の例)
次に、第1の実施形態の第2の例について説明する。第1の実施形態の第2の例は、撮像画像データの大領域、例えば撮像画像データの全体を含む領域に対してヒストグラム平坦化を行いオブジェクトを探索し、多数のオブジェクトが検出された方向に領域を狭め、オブジェクトの探索領域を絞り込んでいくようにした例である。
【0088】
図9は、第1の実施形態の第2の例による処理を説明するための模式図である。
図9のセクション(a)に例示されるように、撮像画像データ40に、例えばそれぞれ人であるオブジェクト60a、60bおよび60cが含まれているものとする。
【0089】
第1の実施形態の第2の例では、信号処理装置20aにおいて、領域制御部200は、
図9のセクション(b)に示されるように、先ず撮像画像データ40の全体を含む大領域を探索領域50aとして設定し、当該探索領域50aに対して、AI装置30による認識処理を実行する。同図セクション(b)の例では、オブジェクト60a~60cのうちオブジェクト60aおよび60bが認識処理により検出され、それぞれバウンディングボックス61aおよび61bが生成されている。
【0090】
領域制御部200は、検出結果のバウンディングボックス61aおよび61bに基づき探索領域50aを絞り込み、
図9のセクション(c)に例示されるように、新たな探索領域50bを生成する。この例では、探索領域50bに対してAI装置30による認識処理を実行することで、オブジェクト60aおよび60bに加えてオブジェクト60cが検出され、オブジェクト60cに対するバウンディングボックス61cが追加して生成されている。
【0091】
図10は、第1の実施形態の第2の例に係る処理を示す一例のフローチャートである。ここでは、信号処理装置20aが少なくとも1フレーム分の画像データを記憶可能な画像保存用メモリを有しているものとして説明を行う。
【0092】
ステップS200で、信号処理装置20aは、カメラ10から出力された1フレーム分の撮像画像データを取得し、取得した撮像画像データを、画像保存用メモリに記憶する。次のステップS201で、信号処理装置20aにおいて領域制御部200は、変数i=0とする。なお、図示は省略するが、ステップS201までの段階では、信号処理装置20aにおいて領域制御部200は、1フレームの撮像画像データの全体を含む大領域を、探索領域として設定している。
【0093】
次のステップS202で、信号処理装置20aにおいて、領域制御部200は、縮小率Riで探索領域(ROI)を縮小する。なお、値Rは、0<R<1である固定値である。変数i=0であれば、縮小率Ri=1となり探索領域は縮小されない。値Rが0.5、変数i=1であれば、縮小率Ri=0.5となり、探索領域は、例えば元の探索領域の幅Wおよび高さHがそれぞれ0.5倍になるように縮小される。
【0094】
探索領域の縮小方法は、この例に限定されない。例えば、元の探索領域の面積を縮小率に応じて縮小させてもよい。
【0095】
なお、探索領域を縮小する際の中心は、変数i=0の場合、すなわち初期値では、撮像画像データによる画面の中央位置とされる。変数i≧1の場合には、後述する複数のバウンディングボックス61の重心位置が、探索領域を縮小する際の中心となる。
【0096】
次のステップS203で、画像処理部201は、ステップS202で縮小処理された探索領域の画像データに対してヒストグラム平坦化処理を実行する。画像処理部201は、ヒストグラム平坦化処理が実行された探索領域の画像データをAI装置30に渡す。
【0097】
次のステップS204で、AI装置30は、信号処理装置20aから渡された、探索領域の画像データから画像特徴量を抽出し、抽出した画像特徴量に基づき、オブジェクト60を認識し検出するオブジェクト検出処理を実行する。AI装置30は、オブジェクト検出処理の検出結果として、オブジェクトを含むバウンディングボックス61を信号処理装置20aに渡す。信号処理装置20aは、検出結果処理部202により、AI装置30から渡されたバウンディングボックス61の数をカウントする。
【0098】
さらに、ステップS204で検出結果処理部202は、AI装置30から複数のバウンディングボックス61が渡された場合、これら複数のバウンディングボックス61の重心の座標を算出する。
【0099】
次のステップS205で、領域制御部200は、ステップS202~ステップS204の処理を、予め設定されたサーチ回数Sだけ実行したか否かを判定する。より具体的には、領域制御部200は、変数i=S-1であるか否かを判定する。領域制御部200は、ステップS202~ステップS204の処理の実行回数がサーチ回数Sに達していないと判定した場合(ステップS205、「No」)、変数i=i+1として、処理をステップS202に戻す。
【0100】
一方、領域制御部200は、ステップS202~ステップS204の処理の実行回数がサーチ回数Sに達したと判定した場合)ステップS205、「Yes」)、処理をステップS206に移行させる。
【0101】
なお、ステップS202~ステップS204の処理は、撮像画像データ40内に複数のバウンディングボックス61が存在する場合、複数のバウンディングボックス61の組み合わせのそれぞれについて実行してよい。また、ステップS202~ステップS204の処理は、撮像画像データ40内に、互いに近接する複数のバウンディングボックスによる塊が複数、存在する場合、この複数の塊それぞれについて実行してもよい。
【0102】
ステップS206で、領域制御部200は、バウンディングボックス61の数が最大となる探索領域を、AI装置30が継続的に認識処理を行う対象の注目領域として設定する。
【0103】
ステップS206の処理が終了すると、
図10のフローチャートによる一連の処理が終了される。
【0104】
ここで、信号処理装置20aは、
図10のフローチャートによる処理を、例えば数分ごとに1回、数10秒ごとに1回など、所定の時間間隔で定期的に実行する。AI装置30は、
図10のフローチャートのステップS206で決定された注目領域に対する認識処理を、次に当該フローチャートによる処理が実行されステップS206で注目領域が決定されるまで、継続的に実行する。
【0105】
図11は、第1の実施形態の第2の例に係る探索領域の縮小処理を説明するための模式図である。ここで、撮像画像データ40による画像のサイズは、幅W×高さHであるものとする。
【0106】
例えば、変数i=0の段階において、
図11のセクション(a)に示されるように、撮像画像データ40の全体を含む探索領域50cにおいて、2つのオブジェクトが検出され、それぞれバウンディングボックス61dおよび61eが生成されたものとする。この場合、検出結果処理部202は、
図10フローチャートのステップS204において、バウンディングボックス61dの座標情報と、バウンディングボックス61eの座標情報とに基づき、バウンディングボックス61dとバウンディングボックス61eとの重心の座標62aを算出する。
【0107】
変数i=1の段階では、
図11のセクション(b)に示されるように、探索領域50cが、重心の座標62aを中心に縮小率R
i=R
1=Rで縮小され、幅W×R、高さH×Rの探索領域50dが設定される。この探索領域50dに対するAI装置30の認識処理により、新たに1つのオブジェクトが検出され、当該オブジェクトによるバウンディングボックス61fが生成されたものとする。この場合、検出結果処理部202は、
図10フローチャートのステップS204において、バウンディングボックス61dの座標情報と、バウンディングボックス61eの座標情報と、バウンディングボックス61fの座標情報と、に基づき、バウンディングボックス61dとバウンディングボックス61eとバウンディングボックス61fとの重心の座標62bを算出する。
【0108】
次の変数i=2の段階でも同様にして、探索領域50dが、重心の座標62bを中心に縮小率Ri=R2で縮小され、幅W×R2、高さH×R2の探索領域50eが設定される。
【0109】
第1の実施形態の第2の例では、上述の、変数iと値Rとに基づく縮小率による探索領域50の縮小処理、および、縮小された探索領域50に対するAI装置30による認識処理を、サーチ回数Sだけ繰り返し実行する。
【0110】
このように、第1の実施形態の第2の例では、撮像画像データに対して設定する探索領域に対して画像特徴量の最大化を行って認識処理を実行し、認識処理により多数のオブジェクトが検出された方向に、探索領域を縮小してさらに認識処理を実行している。そのため、第1の実施形態の第2の例でも、撮像画像データから絞り込まれ、且つ、画像特徴量が最大化された探索領域に対して、AI装置30による認識処理を実行させることができ、認識処理における認識精度を向上させることが可能となる。
【0111】
(4.第2の実施形態)
次に、本開示の第2の実施形態について説明する。
【0112】
本開示の第2の実施形態に係る情報処理システムは、AI処理を行うために撮像画像に設定した探索領域あるいは注目領域に対して所定の信号処理を施し、複数の画像特徴量から類似度の高い画像特徴量を探索する。
【0113】
より具体的には、第2の実施形態に係る情報処理システムは、撮像画像に対して設定された探索領域あるいは注目領域に対して、輝度情報の変換処理を施し、当該探索領域あるいは注目領域における画像特徴量を最大化する。輝度情報の変換処理としては、例えばヒストグラム平坦化処理を適用してよい。
【0114】
図12は、第2の実施形態に係る信号処理装置20の機能を説明するための一例の機能ブロック図である。
【0115】
図12において、第2の実施形態に係る情報処理システム1dが含む信号処理装置20bは、画像処理部201と、類似特徴量探索部210と、を含む。
【0116】
画像処理部201は、
図4を用いて説明した画像処理部201と同等の機能を有するものであって、撮像画像データに対して所定に設定された探索領域あるいは注目領域の画像データに対して画像特徴量を最大化するための画像処理を施す。より具体的には、画像処理部201は、探索領域あるいは注目領域の画像データに対して例えばヒストグラム平坦化を行うことで、当該画像データの画像特徴量を最大化する。画像処理部201は、画像特徴量が最大化された画像データをAI装置30に渡す。
【0117】
AI装置30は、信号処理装置20bから渡された画像データから画像特徴量を抽出し、抽出した画像特徴量に基づきAI処理を実行すると共に、当該画像特徴量を信号処理装置20bに返す。信号処理装置20bにおいて、類似特徴量探索部210は、AI装置30から渡された画像特徴量が2以上ある場合、これら2以上の画像特徴量の類似度を求め、類似度が所定以上の画像特徴量の組を探索する。
【0118】
具体的な例として、類似特徴量探索部210は、AI装置30から渡された画像特徴量に基づき、特徴点間の距離などに応じてオブジェクトと推測される領域を抽出する。類似特徴量探索部210は、複数の画像データ間で、各画像データから抽出された領域ごとに画像特徴量の類似度を求め、類似度が所定以上の画像特徴量の組を探索する。
【0119】
例えば、第2の実施形態に係る情報処理システム1dを
図1Aに示した1台のカメラ10を含む情報処理システム1aに適用した場合、類似特徴量探索部210は、当該カメラ10で異なる時刻に撮像された複数の撮像画像データについて、類似度を求めてよい。
【0120】
また例えば、第2の実施形態に係る情報処理システム1dを
図1Bに示した複数台のカメラ10
1、10
2、…を含む情報処理システム1bに適用した場合、信号処理装置20
1、20
2、…のうち少なくとも1つの信号処理装置、例えば信号処理装置20
1において、他の信号処理装置20
2、…から出力された各画像データからAI装置30’が抽出した各画像特徴量を取得して、類似度を求めてよい。
【0121】
図13は、第2の実施形態に係る処理を示す一例のフローチャートである。
【0122】
ステップS300で、信号処理装置20bは、カメラ10から撮像画像データを取得する。次のステップS301で、信号処理装置20bにおいて画像処理部201は、ステップS300で取得した撮像画像データに対してヒストグラム平坦化処理を実行する。ここで、画像処理部201は、撮像画像データに対して探索領域が設定されている場合は、探索領域に含まれる画像データに対してヒストグラム平坦化処理を実行する。
【0123】
信号処理装置20bは。画像処理部201によりヒストグラム平坦化処理が施された画像データを、AI装置30に渡す。AI装置30は、信号処理装置20bから渡された画像データから特徴量を抽出し、抽出した特徴量を信号処理装置20bに渡す。
【0124】
次のステップS302で、信号処理装置20は、AI装置30から渡された画像特徴量を取得する。信号処理装置20bは、取得した画像特徴量を類似特徴量探索部210に渡す。類似特徴量探索部210は、渡された画像特徴量を保持する。
【0125】
次のステップS303で、類似特徴量探索部210は、画像特徴量が2以上取得されたか否か、すなわち、類似特徴量探索部210が保持する画像特徴量が2以上になったか否かを判定する。類似特徴量探索部210は、取得された画像特徴量が2未満であると判定した場合(ステップS303、「No」)、処理をステップS300に戻す。
【0126】
一方、類似特徴量探索部210は、画像特徴量が2以上取得されたと判定した場合(ステップS303、「Yes」)、処理をステップS304に移行させる。ステップS304で、類似特徴量探索部210は、保持している各画像特徴量を比較し、比較した画像特徴量間の類似度を求める。
【0127】
次のステップS305で、類似特徴量探索部210は、ステップS304で比較した画像特徴量の組のうち、類似度が所定以上の組があるか否かを判定する。類似特徴量探索部210は、類似度が所定以上の組が無いと判定した場合(ステップS305、「No」)、処理をステップS300に戻す。
【0128】
一方、類似特徴量探索部210は、類似度が所定以上の組があると判定した場合(ステップS305、「Yes」)、処理をステップS306に移行させる。ステップS306で、類似特徴量探索部210は、類似度が所定以上の組の各画像特徴量が同一オブジェクトの画像特徴量であると判定する。次のステップS307で、信号処理装置20bは、類似特徴量探索部210によりステップS306で同一であると判定されたオブジェクトを示す情報をAI装置30に渡す。
【0129】
第2の実施形態に係る情報処理システム1dは、上述のように、複数の撮像画像データが信号処理装置20bにより処理された各画像データから抽出された各画像特徴量の類似度に基づき、当該複数の撮像画像データに含まれる同一オブジェクトを検出する。そのため、第2の実施形態に係る情報処理システム1dを適用することで、時系列的に異なる複数の撮像画像データ、あるいは、異なる複数のカメラから取得された複数の撮像画像データに共通に含まれるオブジェクトを追跡することが可能となる。
【0130】
また、その場合において、比較対象の画像特徴量として、撮像画像データにおける画像特徴量抽出の対象となる領域の画像データに対してヒストグラム平坦化処理を施した上で抽出した画像特徴量を用いている。そのため、画像特徴量における、複数の撮像画像データの、時系列的な差異、あるいは、カメラ101、102、…の設置位置の差異などによる環境の差分を吸収することが可能である。
【0131】
(5.第3の実施形態)
次に、本開示の第3の実施形態について説明する。本開示の第3の実施形態は、上述した第1の実施形態および第2の実施形態に適用可能な、カメラ10および信号処理装置20(画像処理部201)のキャリブレーション方法に関するものである。第3の実施形態では、特に、AI装置30におけるAI処理に適した画像特徴量によるキャリブレーション方法を提案する。
【0132】
図14は、第3の実施形態に係る情報処理システムの一例の構成を示すブロック図である。
図14において、情報処理システム1eは、カメラ10、信号処理装置20およびAI装置30に加えて、比較部70を含む。
【0133】
ここで、信号処理装置20は、上述したヒストグラム平坦化処理および画像特徴量の抽出処理以外にも、画像データに対する輝度調整、彩度調整といった、一般的な画像処理を、画像データに対して実行してよい。すなわち、AI装置30は、上述したヒストグラム平坦化処理を施した画像データから抽出された画像特徴量に基づくAI処理に限らず、ユースケースに応じて、ヒストグラム平坦化処理以外の画像処理を施した画像データから抽出した画像特徴量に基づくAI処理も実行することがある。そのため、信号処理装置20では、カメラ10から出力された撮像画像データに対して、上述した一般的な画像処理も実行可能とされている。
【0134】
比較部70は、カメラ10から出力された撮像画像データに基づき抽出された画像特徴量(2)と、予め用意された画像特徴量(1)とが入力される。画像特徴量(1)は、AI装置30が実行するAI処理に適した画像特徴量が用いられる。
【0135】
比較部70は、入力された画像特徴量(1)と画像特徴量(2)とを比較して、画像特徴量(1)と画像特徴量(2)との類似度を求める。比較部70は、求めた類似度が最大となるように、カメラ10および信号処理装置20のうち少なくとも信号処理装置20(画像処理部201)における画像処理を制御する画質パラメータを調整する。
【0136】
比較部70は、信号処理装置20(画像処理部201)に対する画質パラメータとして、画像データの輝度、彩度、周波数成分など画質を制御するパラメータを適用してよい。また、比較部70は、カメラ10に対する画質パラメータとして、シャッタ速度、露光時間、ゲインなど撮像動作を制御するパラメータを適用してよい。
【0137】
比較部70による画像特徴量(1)および画像特徴量(2)の比較と、その比較結果に基づき生成した画質パラメータによるカメラ10および信号処理装置20の調整と、による処理を、ループ処理として例えば類似度が所定以上になるまで繰り返し実行して、カメラ10および信号処理装置20のキャリブレーションを行う。なお、このキャリブレーション処理は、必ずしも頻繁に実行する必要はなく、例えばシステムの設置時に一度実行して性能を最大化し、その後は、環境が変わるタイミングなどに応じて実行することが考えられる。環境が変わるタイミングの例として、例えば、カメラ10が屋外に設置される場合は季節の遷移に応じたタイミングや、カメラ10が屋内に設置される場合は屋内のレイアウト変更に応じたタイミングが考えられる。
【0138】
第3の実施形態に係る情報処理システム1eは、このように、予め用意された画像特徴量(1)と、撮像画像データに基づき抽出した画像特徴量(2)とを比較する。情報処理システム1eは、比較の結果、両者の類似度が最大となるようにカメラ10および信号処理装置20のうち少なくとも信号処理装置20の画質パラメータを設定している。そのため、AI装置30におけるAI処理を、より高精度で実行することが可能となる。
【0139】
なお、以下では、説明のため、特に記載の無い限り、画像処理部201に対する画質パラメータと、カメラ10に対する画質パラメータとを総称して画質パラメータと呼び、画質パラメータがカメラ10と画像処理部201とにそれぞれ渡されるものとする。
【0140】
(5-1.第1の例)
次に、第3の実施形態に係るキャリブレーション処理について、より具体的に説明する。先ず、第3の実施形態の第1の例に係るキャリブレーション処理について説明する。
【0141】
第3の実施形態の第1の例は、AI装置30がAI処理を実行する際に用いる学習済AIモデルを学習させるための用いた学習データが既知の場合の例である。第3の実施形態の第1の例では、上述した予め用意された画像特徴量(1)として、AI装置30がAI処理を実行する際に用いる学習済AIモデルを学習させるための用いた学習データに基づく画像特徴量を用いる。
【0142】
図15は、第3の実施形態の第1の例に係る情報処理システムの一例の構成を示すブロック図である。
【0143】
図15において、情報処理システム1fは、カメラ10、信号処理装置20およびAI装置30に加えて、キャリブレーション部80aを含む。キャリブレーション部80aは、例えば信号処理装置20に含まれてもよいし、独立したハードウェアにより構成してもよい。これに限らず、AI装置30がキャリブレーション部80aを含む構成としてもよい。
【0144】
なお、
図15では、信号処理装置20として画像処理部201のみを示し、他の部分を省略している。画像処理部201は、カメラ10から出力された撮像画像データに所定の画像処理を施して、AI装置30およびキャリブレーション部80aに渡す。
【0145】
AI装置30は、学習データ301により学習された、学習済AIモデル300を含む。AI装置30は、画像処理部201から渡された画像データから画像特徴量を抽出し、抽出した画像特徴量に対して、学習済AIモデル300を用いてAI処理を実行する。
【0146】
キャリブレーション部80aは、画像特徴分析部800と、AIモデル画像特徴分析部801と、比較部802と、を含む。
【0147】
画像特徴分析部800は、画像処理部201から渡された、撮像画像データに画像処理を施された画像データを分析し、当該画像データから画像特徴量を抽出する。画像特徴分析部800は、抽出した画像特徴量を、上述の画像特徴量(2)として、比較部802に渡す。
【0148】
AIモデル画像特徴分析部801は、学習済AIモデル300を学習させるために用いた学習データ301を分析し、当該学習データ301から画像特徴量を抽出する。AIモデル画像特徴分析部801は、学習データ301から抽出した画像特徴量を、上述の画像特徴量(2)として、比較部802に渡す。例えば、AIモデル画像特徴分析部801は、学習データ301に含まれる複数の画像データそれぞれから抽出した画像特徴量を統合して、画像特徴量(2)として比較部802に渡す。
【0149】
比較部802は、上述した比較部70と対応するもので、画像特徴量(1)と画像特徴量(2)とを比較して、画像特徴量(1)と画像特徴量(2)との類似度を算出し、算出した類似度が最大になるような画質パラメータを生成する。比較部802は、例えば画像処理部201の画像処理を制御するための画質パラメータを生成し、生成した画質パラメータを画像処理部201に渡す。比較部802は、カメラ10の撮像動作を制御するための画質パラメータを生成し、カメラ10に渡してもよい。
【0150】
(5-2.第2の例)
次に、第3の実施形態の第2の例に係るキャリブレーション処理について説明する。
【0151】
第3の実施形態の第2の例は、AI装置30がAI処理を実行する際に用いる学習済AIモデルを学習させるための用いた学習データが未知の場合の例である。第3の実施形態の第2の例では、上述した予め用意された画像特徴量(1)として、AI装置30がAI処理を実行する際に用いる学習済AIモデルと同等のモデルを用いて撮像画像データに対するAI処理を実行し、当該AI処理の結果に基づき取得される画像特徴量を用いる。
【0152】
図16は、第3の実施形態の第2の例に係る情報処理システムの一例の構成を示すブロック図である。
【0153】
図16において、情報処理システム1gは、
図15に示したキャリブレーション部80aに代えて、キャリブレーション部80bを含む。キャリブレーション部80bは、画像特徴分析部800と、AIモデル画像特徴分析部803と、AI処理部810と、を含む。また、AI処理部810は、AIモデル300’を含む。AIモデル300’は、AI装置30が有する学習済AIモデル300と同一モデルである。例えば、AIモデル300’は、学習済AIモデル300のコピーでもよいし、学習済AIモデル300と同等の構成を有し、学習済AIモデル300を学習させた学習データにより学習されたモデルであってもよい。
【0154】
画像処理部201は、カメラ10から出力された撮像画像データに所定の画像処理を施し、AI装置30におよびキャリブレーション部80bに渡す。キャリブレーション部80bにおいて、画像処理部201から渡された画像データは、画像特徴分析部800とAIモデル画像特徴分析部803とに渡される。
【0155】
画像特徴分析部800は、
図15に示した画像特徴分析部800と同等なので、ここでの説明を省略する。
【0156】
AIモデル画像特徴分析部803は、画像処理部201から渡された画像データを分析して画像特徴量を抽出し、抽出した画像特徴量をAI処理部810に渡す。AI処理部810は、AIモデル画像特徴分析部803から渡された画像特徴量に対して、AIモデル300’を用いてAI処理(例えば認識処理)を実行し、検知の度合いを示すスコアを算出する。AI処理部810が算出するスコアは、特に限定されないが、AP(Average Precision)値、ヒートマップなどを適用してよい。AI処理部810は、算出したスコアをAIモデル画像特徴分析部803に返す。
【0157】
ここで、画像処理部201は、カメラ10から出力された1つの撮像画像データに対して種々の画像処理を施し、それぞれ異なる性質を有する複数の画像データを生成してよい。例えば、画像処理部201は、撮像画像データに対する画像処理により、輝度、彩度、色相、などを変更した画像データや、ノイズを加えた画像データ、拡大/縮小/変形した画像データ、エッジ強調あるいはボケを加えた画像データなどを生成してよい。
【0158】
AIモデル画像特徴分析部803は、画像処理部201から渡される各画像データに応じてAI処理部810から渡された各スコアを比較し、最も高いスコアとなる画像データを特定する。このように特定された画像データは、AI処理部810によるAIモデル300’を用いたAI処理に最も適合した性質を持つ画像データであると見做すことができる。AIモデル画像特徴分析部803は、最も高いスコアが得られたとして特定した画像データの画像特徴量を抽出し、画像特徴量(1)として比較部802に渡す。
【0159】
比較部802は、上述の第1の例における比較部802と同様に、画像特徴量(1)と画像特徴量(2)とを比較してこれらの類似度を算出し、算出した類似度が最大になるような画質パラメータを生成し、生成した画質パラメータを画像処理部201およびカメラ10に渡す。
【0160】
なお、AIモデル画像特徴分析部803に渡される画像データは、画像特徴分析部800に渡される画像データと異なるものであってよい。例えば、カメラ10により予め撮像された撮像画像データに対して画像処理部201により画像処理した画像データを、AIモデル画像特徴分析部803に渡してよい。この場合において、カメラ10の撮像範囲は、画像特徴分析部800に渡す画像データの元の撮像画像データを撮像する際のカメラ10の撮像範囲と対応している必要がある。
【0161】
この第3の実施形態の第2の例によれば、AI装置30が有する学習済AIモデル300の学習に用いた学習データが未知であっても、カメラ10および画像処理部201のキャリブレーションを実行することが可能である。また、第3の実施形態の第2の例によれば、カメラ10により撮像された撮像画像データに基づき画像特徴量(1)を生成しているため、カメラ10および画像処理部201に対する画質パラメータを動的に生成することが可能であり、それにより、カメラ10の設置環境に依らず、AI装置30による検知精度の最大化を図ることができる。
【0162】
なお、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。
【0163】
なお、本技術は以下のような構成も取ることができる。
(1)
撮像画像に対して探索領域を設定する領域制御部と、
前記探索領域における輝度情報に対する変換処理を実行する画像処理部と、
を備え、
前記領域制御部は、
前記画像処理部で前記変換処理が実行された画像に対するオブジェクト検出の結果に基づき前記探索領域から注目領域を決定する、
信号処理装置。
(2)
前記画像処理部は、
前記変換処理として前記輝度情報に対するヒストグラム平坦化を実行する、
前記(1)に記載の信号処理装置。
(3)
前記領域制御部は、
前記探索領域のうち前記オブジェクト検出により検出されたオブジェクトの数が最大の探索領域を、前記注目領域として決定する、
前記(1)または(2)に記載の信号処理装置。
(4)
前記領域制御部は、
前記撮像画像を分割した各領域を順次に前記探索領域として設定する、
前記(1)乃至(3)の何れかに記載の信号処理装置。
(5)
前記領域制御部は、
前記オブジェクト検出の結果に応じて前記探索領域を段階的に狭める、
前記(1)乃至(3)の何れかに記載の信号処理装置。
(6)
前記領域制御部は、
前記オブジェクト検出により検出された2以上のオブジェクトの重心位置に応じて前記探索領域を段階的に狭める、
前記(5)に記載の信号処理装置。
(7)
前記画像処理部は、
前記探索領域に含まれる画像の画像特徴量に基づき、2以上の前記探索領域から類似度が所定以上の領域を探索する、
前記(1)乃至(6)の何れかに記載の信号処理装置。
(8)
撮像装置から出力された前記撮像画像を取得し、取得した前記撮像画像が前記画像処理部で前記変換処理を施された画像を、学習されたモデルを用いて情報処理を行う情報処理装置に出力する、
前記(1)乃至(7)の何れかに記載の信号処理装置。
(9)
プロセッサにより実行される、
撮像画像に対して探索領域を設定する領域制御ステップと、
前記注目領域における輝度情報に対する変換処理を実行する画像処理ステップと、
を有し、
前記領域制御ステップは、
前記画像処理ステップにより前記変換処理が実行された画像に対するオブジェクト検出の結果に基づき前記探索領域から注目領域を決定する、
信号処理方法。
(10)
撮像画像に対して画像処理を施して、学習された第1のモデルを用いた処理を行う処理部に出力する画像処理部と、
予め用意された第1の特徴量と、前記画像処理を施された前記撮像画像から抽出された第2の特徴量とに基づき、少なくとも前記画像処理部による前記画像処理を制御するためのパラメータを生成する生成部と、
を備える、
信号処理装置。
(11)
前記生成部は、
前記第1のモデルを学習した学習データに基づき抽出された特徴量を、前記第1の特徴量として用いる、
前記(10)に記載の信号処理装置。
(12)
前記生成部は、
前記画像処理を施された前記撮像画像に対して、前記第1のモデルに対応する第2のモデルを用いた処理を行い、該処理の結果に基づき抽出された特徴量を、前記第1の特徴量として用いる、
前記(10)に記載の信号処理装置。
(13)
前記生成部は、
前記第2のモデルを用いた処理に基づくスコアがより高くなるように、前記パラメータを生成する、
前記(12)に記載の信号処理装置。
(14)
前記生成部は、
前記画像処理部が前記処理部に出力するための前記撮像画像に対して予め取得した前記撮像画像に基づき、前記第2のモデルを用いた処理を行う、
前記(12)または(13)に記載の信号処理装置。
(15)
前記第2のモデルは、前記処理部が有する前記第1のモデルである、
前記(12)乃至(14)の何れかに記載の信号処理装置。
(16)
前記生成部は、
前記第1の特徴量と前記第2の特徴量とに基づき、前記撮像画像を出力する撮像装置を制御するためのパラメータをさらに生成する、
前記(10)乃至(15)の何れかに記載の信号処理装置。
(17)
前記生成部は、
前記第1の特徴量に対する前記第2の特徴量の差分が小さくなるように、前記パラメータを生成する、
前記(10)乃至(16)の何れかに記載の信号処理装置。
(18)
プロセッサにより実行される、
撮像画像に対して画像処理を施して、学習された第1のモデルを用いた処理を行う処理部に出力する画像処理ステップと、
予め用意された第1の特徴量と、前記画像処理を施された前記撮像画像から抽出された第2の特徴量とに基づき、少なくとも前記画像処理ステップによる前記画像処理を制御するためのパラメータを生成する生成ステップと、
を有する、
信号処理方法。
(19)
撮像画像に対して、前記撮像画像の画像特徴量を最大化するための、輝度情報に対する変換処理を実行する画像処理部、
を備える、
信号処理装置。
(20)
複数の前記撮像画像にから抽出された前記画像特徴量のそれぞれから、類似度が所定以上の領域を探索する探索部、
をさらに備え、
前記探索部は、
前記探索された前記類似度が所定以上の領域を示す情報を、オブジェクト検出のための情報として出力する、
前記(19)に記載の信号処理装置。
(21)
プロセッサにより実行される、
撮像画像に対して、前記撮像画像の画像特徴量を最大化するための、輝度情報に対する変換処理を実行する画像処理ステップ、
を有する、
信号処理方法。
【符号の説明】
【0164】
1a,1b,1c,1d,1e,1f,1g 情報処理システム
10,101,102 カメラ
11 光学部
20,201,202,20a,20b 信号処理装置
30,30’ AI装置
40 撮像画像データ
50 探索領域
60,60a,60b,60c オブジェクト
61,61a,61b,61c,61d,61e,61f バウンディングボックス
62a,62b 重心の座標
70 比較部
80a,80b キャリブレーション部
200 領域制御部
201 画像処理部
202 検出結果処理部
210 類似特徴量探索部
300 学習済AIモデル
300’ AIモデル
301 学習データ
800 画像特徴分析部
801,803 AIモデル画像特徴分析部
802 比較部
810 AI処理部