IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オムロン株式会社の特許一覧

特開2022-167586情報処理装置、情報処理方法、及び制御プログラム
<>
  • 特開-情報処理装置、情報処理方法、及び制御プログラム 図1
  • 特開-情報処理装置、情報処理方法、及び制御プログラム 図2
  • 特開-情報処理装置、情報処理方法、及び制御プログラム 図3
  • 特開-情報処理装置、情報処理方法、及び制御プログラム 図4
  • 特開-情報処理装置、情報処理方法、及び制御プログラム 図5
  • 特開-情報処理装置、情報処理方法、及び制御プログラム 図6
  • 特開-情報処理装置、情報処理方法、及び制御プログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022167586
(43)【公開日】2022-11-04
(54)【発明の名称】情報処理装置、情報処理方法、及び制御プログラム
(51)【国際特許分類】
   G06T 7/60 20170101AFI20221027BHJP
   G06T 7/00 20170101ALI20221027BHJP
【FI】
G06T7/60 300Z
G06T7/00 660B
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2021073468
(22)【出願日】2021-04-23
(71)【出願人】
【識別番号】000002945
【氏名又は名称】オムロン株式会社
(74)【代理人】
【識別番号】100155712
【弁理士】
【氏名又は名称】村上 尚
(72)【発明者】
【氏名】張 超
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096FA05
5L096FA06
5L096FA55
5L096FA59
5L096FA60
5L096FA62
5L096FA67
5L096FA69
5L096GA08
5L096GA51
5L096HA11
(57)【要約】
【課題】撮像条件に関わらず、撮像画像から物体を正確に識別することが可能な情報処理装置、情報処理方法、及び制御プログラムを実現する。
【解決手段】第1外接多角形領域算出部(32)は、特徴領域を包含する凸包外接領域としての第1外接多角形領域を算出する。慣性主軸算出部(33)は、特徴領域の慣性主軸を算出する。領域分割部(34)は、慣性主軸を用いて、特徴領域を分割する。領域選択部(36)は、分割された特徴領域をそれぞれ包含する凸包外接領域としての2つの第2外接多角形領域と第1外接多角形領域との面積比に基づいて、第1外接多角形領域、または2つの第2外接多角形領域のいずれかを選択する。物体識別部(37)は、選択された第1外接多角形領域、または2つの第2外接多角形領域に対して物体検出処理を実行する。
【選択図】図1
【特許請求の範囲】
【請求項1】
撮像画像を処理する情報処理装置であって、
入力された撮像画像から、所定の特徴を有する特徴領域を検出する特徴領域検出部と、
前記特徴領域を包含する凸包外接領域としての第1外接多角形領域を算出する第1外接多角形領域算出部と、
前記特徴領域の慣性主軸を算出する慣性主軸算出部と、
算出された前記慣性主軸を用いて、前記特徴領域を分割する領域分割部と、
分割された前記特徴領域をそれぞれ包含する凸包外接領域としての2つの第2外接多角形領域を算出する第2外接多角形領域算出部と、
前記2つの第2外接多角形領域と前記第1外接多角形領域との面積比に基づいて、前記第1外接多角形領域、および、前記2つの第2外接多角形領域のいずれか一方を選択する領域選択部と、
前記領域選択部により選択された前記第1外接多角形領域、または前記2つの第2外接多角形領域に対して物体検出処理を実行する物体識別部と、を備える、情報処理装置。
【請求項2】
前記第1外接多角形領域算出部は、更に前記特徴領域を包含するバウンディングボックスを算出し、
前記慣性主軸算出部は、前記特徴領域の重心と、前記バウンディングボックスの中心または前記凸包外接領域の重心との位置関係に基づいて、前記慣性主軸を算出する、請求項1に記載の情報処理装置。
【請求項3】
前記物体識別部は、物体検出処理を実行することにより、人体を識別する、請求項1または2に記載の情報処理装置。
【請求項4】
前記特徴領域検出部は、前記特徴領域として、動きのある領域、所定範囲内の画素値を有する領域、および、エッジで囲まれた領域の少なくとも一つを検出する、請求項1から3のいずれか1項に記載の情報処理装置。
【請求項5】
撮像画像を処理する情報処理方法であって、
入力された撮像画像から、所定の特徴を有する特徴領域を検出する特徴領域検出工程と、
前記特徴領域を包含する凸包外接領域としての第1外接多角形領域を算出する第1外接多角形領域算出工程と、
前記特徴領域の慣性主軸を算出する慣性主軸算出工程と、
算出された前記慣性主軸を用いて、前記特徴領域を分割する領域分割工程と、
分割された前記特徴領域をそれぞれ包含する凸包外接領域としての2つの第2外接多角形領域を算出する第2外接多角形領域算出工程と、
前記2つの第2外接多角形領域と前記第1外接多角形領域との面積比に基づいて、前記第1外接多角形領域、および、前記2つの第2外接多角形領域のいずれか一方を選択する領域選択工程と、
前記領域選択工程により選択された前記第1外接多角形領域、または前記2つの第2外接多角形領域に対して物体検出処理を実行する物体識別工程と、を備える、情報処理方法。
【請求項6】
請求項1に記載の情報処理装置としてコンピュータを機能させるための制御プログラムであって、前記特徴領域検出部、前記第1外接多角形領域算出部、前記慣性主軸算出部、前記領域分割部、前記第2外接多角形領域算出部、前記領域選択部、及び前記物体識別部としてコンピュータを機能させるための制御プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、撮像画像を処理する情報処理装置、情報処理方法、及び制御プログラムに関する。
【背景技術】
【0002】
デジタルカメラなどの撮像装置では、撮像された撮像画像に対して所定の情報処理(データ処理)を行うことにより、当該撮像画像から人体などの物体を検出し、検出した物体や、当該物体を囲んだ枠体を表示部等の表示装置に表示させることが知られている。
【0003】
上記のような撮像装置では、撮像画像において撮像対象の物体とその影とを識別することが求められている。特許文献1には、所定の基準輝度値に基づき撮像画像を処理して、撮像対象の物体、例えば、人体と、その人体の影とを識別する技術が知られている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008-245063号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところが、上記のような従来技術では、撮像画像の撮像条件によっては、撮像画像から物体を正確に識別できないことがあった。具体的には、従来技術では、周囲の明るさが暗い場合や逆光である場合などにおいて、撮像画像における物体とその影との各輝度値が互いに近い値となり、これら物体と影とを分割することができずに、撮像画像から当該物体を正確に識別できないことがあった。
【0006】
本開示は上記の問題点を鑑みてなされたものであり、撮像条件に関わらず、撮像画像から物体を正確に識別することが可能な情報処理装置、情報処理方法、及び制御プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本開示は、上述の課題を解決するために、以下の構成を採用する。
【0008】
本開示の一側面に係る情報処理装置は、撮像画像を処理する情報処理装置であって、入力された撮像画像から、所定の特徴を有する特徴領域を検出する特徴領域検出部と、前記特徴領域を包含する凸包外接領域としての第1外接多角形領域を算出する第1外接多角形領域算出部と、前記特徴領域の慣性主軸を算出する慣性主軸算出部と、算出された前記慣性主軸を用いて、前記特徴領域を分割する領域分割部と、分割された前記特徴領域をそれぞれ包含する凸包外接領域としての2つの第2外接多角形領域を算出する第2外接多角形領域算出部と、前記2つの第2外接多角形領域と前記第1外接多角形領域との面積比に基づいて、前記第1外接多角形領域、および、前記2つの第2外接多角形領域のいずれか一方を選択する領域選択部と、前記領域選択部により選択された前記第1外接多角形領域、または前記2つの第2外接多角形領域に対して物体検出処理を実行する物体識別部と、を備える。
【0009】
上記構成によれば、所定の特徴を有する特徴領域を検出するとともに、検出した特徴領域の慣性主軸を算出して、当該慣性主軸を用いて検出した特徴領域を分割している。また、分割前の特徴領域を包含する第1外接多角形領域と、分割後の2つの特徴領域をそれぞ
れ包含する第2外接多角形領域とに、対応する特徴領域を包含する凸包外接領域を用いている。これにより、領域選択部での第1外接多角形領域、または2つの第2外接多角形領域の選択処理を適切に、かつ、精度よく行うことが可能となり、物体識別部での物体検出処理を高精度に実行することができる。この結果、撮像条件に関わらず、撮像画像から物体を正確に識別することが可能となる。
【0010】
上記一側面に係る情報処理装置において、前記第1外接多角形領域算出部は、更に前記特徴領域を包含するバウンディングボックスを算出し、前記慣性主軸算出部は、前記特徴領域の重心と、前記バウンディングボックスの中心または前記凸包外接領域の重心との位置関係に基づいて、前記慣性主軸を算出してもよい。
【0011】
上記構成によれば、特徴領域の慣性主軸を精度よく算出することができる。この結果、撮像条件に関わらず、撮像画像から物体をより正確に識別することが可能となる。
【0012】
上記一側面に係る情報処理装置において、前記物体識別部は、物体検出処理を実行することにより、人体を識別してもよい。
【0013】
上記構成によれば、物体識別部は人体を精度よく識別することが可能となる。
【0014】
上記一側面に係る情報処理装置において、前記特徴領域検出部は、前記特徴領域として、動きのある領域、所定範囲内の画素値を有する領域、および、エッジで囲まれた領域の少なくとも一つを検出してもよい。
【0015】
上記構成によれば、撮像条件に関わらず、特徴領域を的確に検出することが可能となり、撮像画像から物体をより正確に識別することができる。
【0016】
また、本開示の一側面に係る情報処理方法は、撮像画像を処理する情報処理方法であって、入力された撮像画像から、所定の特徴を有する特徴領域を検出する特徴領域検出工程と、前記特徴領域を包含する凸包外接領域としての第1外接多角形領域を算出する第1外接多角形領域算出工程と、前記特徴領域の慣性主軸を算出する慣性主軸算出工程と、算出された前記慣性主軸を用いて、前記特徴領域を分割する領域分割工程と、分割された前記特徴領域をそれぞれ包含する凸包外接領域としての2つの第2外接多角形領域を算出する第2外接多角形領域算出工程と、前記2つの第2外接多角形領域と前記第1外接多角形領域との面積比に基づいて、前記第1外接多角形領域、および、前記2つの第2外接多角形領域のいずれか一方を選択する領域選択工程と、前記領域選択工程により選択された前記第1外接多角形領域、または前記2つの第2外接多角形領域に対して物体検出処理を実行する物体識別工程と、を備える。
【0017】
上記構成によれば、所定の特徴を有する特徴領域を検出するとともに、検出した特徴領域の慣性主軸を算出して、当該慣性主軸を用いて検出した特徴領域を分割している。また、分割前の特徴領域を包含する第1外接多角形領域と、分割後の2つの特徴領域をそれぞれ包含する第2外接多角形領域とに、対応する特徴領域を包含する凸包外接領域を用いている。これにより、領域選択工程での第1外接多角形領域、または2つの第2外接多角形領域の選択処理を適切に、かつ、精度よく行うことが可能となり、物体識別工程での物体検出処理を高精度に実行することができる。この結果、撮像条件に関わらず、撮像画像から物体を正確に識別することが可能となる。
【0018】
また、本開示の一側面に係る制御プログラムは、情報処理装置としてコンピュータを機能させるための制御プログラムであって、前記特徴領域検出部、前記第1外接多角形領域算出部、前記慣性主軸算出部、前記領域分割部、前記第2外接多角形領域算出部、前記領
域選択部、及び前記物体識別部としてコンピュータを機能させる。
【0019】
上記構成によれば、撮像条件に関わらず、撮像画像から物体を正確に識別することが可能となる。
【発明の効果】
【0020】
本開示によれば、撮像条件に関わらず、撮像画像から物体を正確に識別することが可能な情報処理装置、情報処理方法、及び制御プログラムを提供することができる。
【図面の簡単な説明】
【0021】
図1】本開示の一実施形態に係る撮像装置の構成例を示すブロック図である。
図2】上記撮像装置の動作例を示すフローチャートである。
図3】上記撮像装置の具体的な動作例を説明する図である。
図4】上記撮像装置の具体的な他の動作例を説明する図である。
図5】上記撮像装置での効果の一例を説明する図である。
図6】比較例での問題点を説明する図である。
図7】上記撮像装置の具体的な他の動作例を説明する図である。
【発明を実施するための形態】
【0022】
〔実施形態〕
§1 適用例
まず、図1を用いて、本開示が適用される場面の一例について説明する。図1は、本開示の一実施形態に係る撮像装置の構成例を示すブロック図である。尚、以下の説明では、デジタルカメラなどの撮像装置に本開示を適用した場合を例示して説明する。しかしながら、本開示は、撮像画像を処理する情報処理装置であれば何等限定されるものではなく、タブレット端末やスマートフォーンなどの携帯端末、あるいは撮像画像を出力する撮像部が別体に設けられたパーソナルコンピュータ等の情報処理端末などに本開示を適用することもできる。
【0023】
図1に示されるように、本実施形態の撮像装置1は、撮像部2と、撮像部2からの撮像画像を処理する制御部3とを備える。制御部3は、特徴領域検出部31、第1外接多角形領域算出部32、慣性主軸算出部33、領域分割部34、第2外接多角形領域算出部35、領域選択部36、及び物体識別部37を備える。
【0024】
特徴領域検出部31は、所定の特徴を有する特徴領域を、入力された撮像画像から検出する。第1外接多角形領域算出部32は、特徴領域を包含する凸包外接領域としての第1外接多角形領域を算出する。慣性主軸算出部33は、特徴領域の慣性主軸を算出する。なお、上記凸包外接領域とは、撮像画像において、特徴領域に含まれた全ての画素(ピクセル)を包含するように、当該特徴領域の最も外側に存在する、隣接した2つの画素を順次繋いだ直線(外接線)によって区切られる凸形状の領域をいう。
【0025】
領域分割部34は、算出された慣性主軸を用いて、特徴領域を2つに分割する。第2外接多角形領域算出部35は、分割された特徴領域をそれぞれ包含する凸包外接領域としての2つの第2外接多角形領域を算出する。領域選択部36は、2つの第2外接多角形領域と第1外接多角形領域との面積比に基づいて、第1外接多角形領域、または2つの第2外接多角形領域のいずれかを選択する。物体識別部37は、選択された第1外接多角形領域、または2つの第2外接多角形領域に対して物体検出処理を実行する。
【0026】
このようにして、制御部3は、入力された撮像画像から、特徴領域を包含する第1外接多角形領域(凸包外接領域)を求めている。また、制御部3は、特徴領域の慣性主軸を算
出して、算出した慣性主軸を用いて特徴領域を分割している。また、制御部3は、分割した特徴領域をそれぞれ包含する2つの第2外接多角形領域(凸包外接領域)を求めている。更に、制御部3は、分割後の2つの第2外接多角形領域、または分割前の第1外接多角形領域から物体検出処理対象の凸包外接領域を選択し、選択した凸包外接領域に対して、物体検出処理を実行して、入力された撮像画像から、人体などの物体を識別する。
【0027】
よって本実施形態によれば、撮像装置1は、所定の特徴を有する特徴領域を検出するとともに、検出した特徴領域の慣性主軸を算出して、当該慣性主軸を用いて検出した特徴領域を分割している。また、分割前の特徴領域を包含する第1外接多角形領域と、分割後の2つの特徴領域をそれぞれ包含する第2外接多角形領域とに、対応する特徴領域を包含する凸包外接領域を用いている。これにより、領域選択部での第1外接多角形領域、または2つの第2外接多角形領域の選択処理を適切に、かつ、精度よく行うことが可能となり、物体識別部での物体検出処理を高精度に実行することができる。この結果、撮像装置1は、撮像条件に関わらず、撮像画像から物体を正確に識別することが可能となる。
【0028】
§2 構成例
<撮像装置1の構成について>
図1に示すように、撮像装置1は、撮像部2と、制御部3と、表示部4と、記憶部5とを備える。撮像装置1は、撮像部2で撮像した撮像画像を表示部4に表示させたり、記憶部5に記憶させたりする。また、撮像装置1は、撮像画像に対して、制御部3によって所定の(データ)処理を行うことで当該撮像画像に含まれた人体などの所定の物体を識別し、その識別結果を含めて表示部4に表示させたり、記憶部5に記憶させたりする。
【0029】
撮像部2は、図示しない撮像素子を備え、撮像装置1に対するユーザーの操作指示に応じて、動画像や静止画像を撮像する。撮像部2は、動画像や静止画像の撮像画像を制御部3に出力する。
【0030】
表示部4は、液晶ディスプレイパネルや発光ダイオードなどを備えており、所定の情報表示を行う。表示部4は、例えば、タッチパネルと一体に構成されることにより、ユーザーからの指示を受け付ける入力部として機能するように構成されてもよい。
【0031】
記憶部5は、制御部3によって用いられる各種データを記憶している。更に記憶部5はコンピュータに実行されることによって、コンピュータを制御部3として機能させる各種ソフトウェアを記憶していてもよい。また、記憶部5には、上記領域選択部36での後述の領域選択処理に用いられる閾値が記憶されている。
【0032】
制御部3は、撮像装置1の各部を統括的に制御する機能を備えている演算装置である。制御部3は、例えば1つ以上のプロセッサ(例えばCPUなど)が、1つ以上のメモリ(例えばRAMやROMなど)に記憶されているプログラムを実行することで撮像装置1の各部を制御してもよい。また、制御部3は、上記のように、複数の機能ブロックを備えており、各機能ブロックは、所定のデータ処理を行うようになっている。
【0033】
ここで、制御部3の構成について説明する。制御部3は、入力された撮像画像から、所定の特徴を有する特徴領域を検出する特徴領域検出部31と、第1外接多角形領域を算出する第1外接多角形領域算出部32と、特徴領域の慣性主軸を算出する慣性主軸算出部33とを備える。
【0034】
制御部3は、慣性主軸算出部33が算出した慣性主軸を用いて、特徴領域検出部31が検出した特徴領域を分割する領域分割部34と、領域分割部34からの分割された特徴領域をそれぞれ包含する2つの第2外接多角形領域を算出する第2外接多角形領域算出部3
5とを備える。
【0035】
制御部3は、第1外接多角形領域算出部32が算出した第1外接多角形領域、および、第2外接多角形領域算出部35が算出した2つの第2外接多角形領域のいずれか一方を選択する領域選択部36と、領域選択部36が選択した第1外接多角形領域、または2つの第2外接多角形領域から物体を識別する物体識別部37とを備える。
【0036】
§3 動作例
<撮像装置1の動作例>
図2図4も参照して、本実施形態の撮像装置1の動作例について具体的に説明する。図2は、上記撮像装置の動作例を示すフローチャートである。図3は、上記撮像装置の具体的な動作例を説明する図である。図4は、上記撮像装置の具体的な他の動作例を説明する図である。
【0037】
図2において、ステップS1で、特徴領域検出部31は、撮像部2から入力された撮像画像から、例えば、差分法を用いて、所定の特徴を有する特徴領域を抽出する。
【0038】
次に、ステップS2で、第1外接多角形領域算出部32は、特徴領域検出部31が検出した特徴領域を包含するバウンディングボックスを作成する。
【0039】
続いて、ステップS3で、慣性主軸算出部33は、特徴領域の重心と、バウンディングボックスの中心とを算出する。また、慣性主軸算出部33は、特徴領域の重心に基づいて、第1慣性主軸を算出し、更に第1慣性主軸の偏角θを算出する。尚、偏角θとは、後述するように、例えば、撮像画像での水平軸(X軸)及び垂直軸(Y軸)のうち、例えば、X軸に対する慣性主軸の角度をいう。
【0040】
次に、ステップS4で、慣性主軸算出部33は、ステップS3で求めた偏角θに対して、90度加算することにより、当該偏角θを補正して、ステップS3で求めた第1慣性主軸とは傾きが90度異なる第2慣性主軸を求める。
【0041】
続いて、ステップS5で、慣性主軸算出部33は、ステップS3及びS4でそれぞれ求めた第1及び第2慣性主軸のうち、算出したバウンディングボックスの中心に基づいて、撮像画像により好適な慣性主軸を算出する。
【0042】
次に、ステップS6で、第1外接多角形領域算出部32は、特徴領域検出部31で抽出された特徴領域全体の凸包外接領域を算出する。
【0043】
続いて、ステップS7で、領域分割部34は、ステップS1で抽出された特徴領域を、ステップS5で算出された慣性主軸を用いて、2つに分割する。その後、第2外接多角形領域算出部35は、分割された分割後の2つの特徴領域についてのそれぞれの凸包外接領域を作成する。
【0044】
次に、ステップS8で、領域選択部36は、ステップS7で作成した、分割後の2つの凸包外接領域と、ステップS6で求めた、分割前の凸包外接領域との面積比が予め設定された閾値以下であるか否かについて判定する。
【0045】
領域選択部36は、上記面積比が閾値以下であることを判定した場合(S8でYES)、領域選択部36は、分割後の2つの凸包外接領域を選択して(ステップS9)、物体識別部37に出力する。
【0046】
一方、領域選択部36は、上記面積比が閾値を超えることを判定した場合(S8でNO)、領域選択部36は、ステップS6で求めた分割前の凸包外接領域を選択して(ステップS10)、物体識別部37に出力する。
【0047】
続いて、ステップS11で、物体識別部37は、領域選択部36が選択した、分割後の2つの凸包外接領域、または分割前の凸包外接領域に対して、物体検出処理を行う。
【0048】
尚、上記のステップS10の説明以外に、領域選択部36が分割前の凸包外接領域に代えて、分割前の特徴領域、あるいはその分割前の特徴領域を包含するバウンディングボックスを選択する構成でもよい。
【0049】
ここで、図3及び図4を用いて、本実施形態の撮像装置1のより具体的な動作例について説明する。
【0050】
図3に示すように、特徴領域検出部31は、入力された撮像画像において、例えば、人体の動体ピクセルとその影の動体ピクセルとを含んだ特徴領域101を検出する。この特徴領域検出部31は、入力された撮像画像から、特徴領域101として、例えば、動きのある領域、所定範囲内の画素値(画素(ピクセル)の輝度値)を有する領域、および、エッジで囲まれた領域の少なくとも一つを検出する。
【0051】
つまり、特徴領域検出部31は、所定の特徴として、「領域に動きがある」、「領域が所定範囲内の画素値を有する」、または「領域がエッジで囲まれている」などの特徴を検出する。また、上記所定範囲内の画素値とは、例えば、人体などの所定の物体が取り得る画素値の範囲を示している。また、物体の周囲の明るさなどの撮像条件は時刻に応じて変化するため、所定範囲内の画素値もまた時刻に応じて変化させてもよい。
【0052】
また、特徴領域検出部31は、例えば、差分法を用いて、所定の物体である動体を含んだ特徴領域101を検出する。具体的には、特徴領域検出部31は、動きの有無について、背景差分法、またはフレーム間差分法を用いて判定して、人体の動体ピクセルと影の動体ピクセルとを含んだ特徴領域101を検出する。
【0053】
背景差分法では、例えば、撮像画像のうち、所定の背景画像との画素値の差分(絶対値)が所定値以上の画素を、動きのある画素(動体ピクセル)として検出する。
【0054】
フレーム間差分法では、例えば、現在の撮像画像(現在のフレーム)のうち、過去の撮像画像(過去のフレーム)との画素値の差分が所定値以上の画素を、動きのある画素(動体ピクセル)として検出する。このフレーム間差分法において、例えば、過去のフレームは、現在のフレームの所定数前のフレームであり、所定数は1以上である。この所定数は、制御部3での情報処理のフレームレート(情報処理速度)や、撮像部2による撮像処理のフレームレート(撮像処理速度)などに応じて決定されてもよい。
【0055】
次に、第1外接多角形領域算出部32は、例えば、上記特徴領域101を包含する矩形状の外形を有する、バウンディングボックス(Bounding Box)を算出する。具体的には、第1外接多角形領域算出部32は、特徴領域101を包含する領域のうち、人体の動体ピクセル及び影の動体ピクセルを含んだバウンディングボックスGを求める。バウンディングボックスGは、撮像画像の水平軸に平行な直線と垂直軸に平行な直線とによって特徴領域を包含した矩形状によって構成されている。
【0056】
続いて、慣性主軸算出部33は、特徴領域検出部31が検出した特徴領域の慣性主軸を算出する。具体的には、慣性主軸算出部33は、撮像画像において、検出された特徴領域
101の重心GCを求めるとともに、算出されたバウンティングボックスGの中心G1を求める。また、慣性主軸算出部33は、重心GCを通る特徴領域101の第1慣性主軸K1を算出する。
【0057】
また、慣性主軸算出部33は、上記X軸に対する第1慣性主軸K1の偏角θを求め、更にこの偏角θに90度を加えた角度(偏角(θ+90))でX軸と交わる、つまり、第1慣性主軸K1に直交する第2慣性主軸K2を求める。
【0058】
そして、慣性主軸算出部33は、バウンディングボックスGの中心G1に対する特徴領域101の重心GCの位置関係に基づいて、当該特徴領域101の第1慣性主軸K1及び第2慣性主軸K2のうち、ステップS6で求められる凸包外接領域を分割するための1つの慣性主軸を決定する。
【0059】
具体的には、慣性主軸算出部33は、撮像画像において、バウンディングボックスGの中心G1を通るX軸とこれに直交するY軸により、バウンディングボックスGを右上部分(第1象限)、右下部分(第4象限)、左上部分(第2象限)、及び左下部分(第3象限)で4分割したときに、重心GCが右上部分または左下部分に存在するときは、第1慣性主軸K1を選択する。また、慣性主軸算出部33は、重心GCが右下部分または左上部分に存在するときは、第2慣性主軸K2を選択する。すなわち、図3に示す例では、重心GCが右下部分に存在するので、慣性主軸算出部33は、凸包外接領域の分割用の慣性主軸として第2慣性主軸K2を選択する。
【0060】
このように、慣性主軸算出部33は、慣性主軸算出用外接多角形領域に存在する2つの慣性主軸のうち、撮像画像でのバウンディングボックスGの中心G1と特徴領域の重心GCとの位置関係に基づいて、凸包外接領域(第1外接多角形領域)を分割する慣性主軸を決定している。これにより、本実施形態の撮像装置1では、第1外接多角形領域をより適切に分割して、当該第1外接多角形領域に含まれる物体を高精度に識別することが可能となる。
【0061】
なお、慣性主軸算出部33は、特徴領域検出部が検出した特徴領域の重心と、第1外接多角形領域算出部32が算出した凸包外接領域の重心との位置関係に基づいて慣性主軸を決定してもよい。なお、慣性主軸算出部33での慣性主軸の算出方法は、上述の2通りの算出方法に限定されるものではなく、公知の算出方法を適用することができる。
【0062】
図4に示すように、第1外接多角形領域算出部32は、人体の動体ピクセル及びその影の動体ピクセルを含んだ動体ピクセル全体の特徴領域101(図3)を包含する凸包外接領域Tを算出する。この凸包外接領域Tは、特徴領域101に含まれた全ての画素を包含する最小の凸多角形(凸多面体)である。ここで凸多角形とは、内角が180°未満である頂点のみから構成される多角形である。より具体的には、凸包外接領域Tは、特徴領域101に含まれた画素のうち、最も外側に存在する、隣接する画素同士を直線で繋いだ形状によって構成されている。
【0063】
次に、領域分割部34は、慣性主軸算出部33で算出された第2慣性主軸K2を用いて、特徴領域を分割する。第2外接多角形領域算出部35は、分割後の2つの特徴領域の一方に属する、人体の動体ピクセルを含んだ特徴領域を包含する凸包外接領域T1と、他方に属する、影の動体ピクセルを含んだ特徴領域を包含する凸包外接領域T2とを求める。
【0064】
そして、領域選択部36は、分割後の上記2つの凸包外接領域T1及びT2の合計面積を分割前の凸包外接領域Tの面積で除算した面積比(つまり、画素数比)が閾値以下であることを判定すれば、領域選択部36は、2つの凸包外接領域T1及びT2を選択して物
体識別部37に出力する。また、領域選択部36は、上記面積比が閾値を超えることを判定すれば、領域選択部36は、分割前の凸包外接領域Tを選択して物体識別部37に出力する。尚、上記合計面積において、凸包外接領域T1及びT2に重複部分が存在する場合には、その重複部分の面積については、凸包外接領域T1及びT2の面積和から減算する。
【0065】
このように、領域選択部36は、分割後に作成した2つの凸包外接領域T1及びT2の合計面積と分割前の凸包外接領域Tの面積比を予め定められた閾値との比較をすることにより、物体識別部37で物体検出処理を行う凸包外接領域を選択している。これにより、本実施形態の撮像装置1では、例えば、人体を高精度に識別することができる。つまり、特徴領域に人体が含まれている場合には、当該特徴領域の分割によって、人体の動体ピクセルを含んだ領域により近い分割領域(凸包外接領域T1)を求めることができるからである。
【0066】
次に、物体識別部37は、領域選択部36からの凸包外接領域に対して、物体検出処理を行うことにより、当該凸包外接領域に含まれた物体が人体などの所定の物体であるか否かについて識別する。具体的には、物体識別部37は、例えば、HoGやHaar-likeなどの画像特徴とブースティングを組み合わせた物体検出処理を実行する。物体識別部37は、識別結果を表示部4に出力する。これにより、表示部4では、撮像部2からの撮像画像とともに、物体の識別結果も併せて表示することができる。
【0067】
尚、上記の説明以外に、物体識別部37は、例えば、R-CNN、Fast R-CN
N、YOLO、SSDなどのディープラーニングにより生成された学習済みモデルを用いてもよい。また、物体識別部37が識別する物体としては、人体以外に、例えば、人以外の動物、自動車などの車輛、あるいは建物などの建築物などがある。
【0068】
以上のように、本実施形態の撮像装置1では、特徴領域検出部31は撮像部2からの撮像画像から特徴領域を検出する。第1外接多角形領域算出部32は、特徴領域を包含する凸包外接領域としての第1外接多角形領域と当該特徴領域を包含するバウンディングボックスを算出する。慣性主軸算出部33は、特徴領域の慣性主軸を算出し、領域分割部34は、算出された慣性主軸を用いて、特徴領域を2つに分割する。第2外接多角形領域算出部35は、分割後の特徴領域をそれぞれ包含する凸包外接領域としての2つの第2外接多角形領域を算出する。領域選択部36は、2つの第2外接多角形領域と第1外接多角形領域との面積比に基づいて、第1外接多角形領域、または2つの第2外接多角形領域のいずれかを選択する。物体識別部37は、選択された第1外接多角形領域、または2つの第2外接多角形領域に対して物体検出処理を実行する。これにより、領域選択部36での第1外接多角形領域、または2つの第2外接多角形領域の選択処理を適切に、かつ、精度よく行うことが可能となる。この結果、物体識別部37は、物体検出処理を高精度に実行することができる。したがって、本実施形態の撮像装置1は、撮像条件に関わらず、撮像画像から物体を正確に識別することが可能となる。
【0069】
また、本実施形態では、第1外接多角形領域算出部32は特徴領域を包含するバウンディングボックスを更に算出し、慣性主軸算出部33は、特徴領域の重心とバウンディングボックスの中心とに基づいて、特徴領域の慣性主軸を算出しているので、慣性主軸の算出精度を容易に向上させることができ、ひいては物体の識別精度も容易に向上させることができる。
【0070】
なお、上記の説明では、第1外接多角形領域算出部32がバウンディングボックス及び凸包外接領域を算出する構成について説明したが、本実施形態はこれに限定されるものではなく、例えば、第1外接多角形領域算出部32が凸包外接領域のみ算出し、別途設けた
バウンティングボックス算出部によってバウンディングボックスを算出する構成でもよい。
【0071】
ここで、図5及び図6を用いて、本実施形態の撮像装置1において、第1外接多角形領域として凸包外接領域を用いた場合での具体的な効果について説明する。図5は、上記撮像装置での効果の一例を説明する図である。図6は、比較例での問題点を説明する図である。
【0072】
図5に示すように、撮像部2からの撮像画像において、例えば、人体に対して、その影が90度以外の角度、例えば、90度未満の角度で存在している場合、第1外接多角形領域算出部32は、人体の動体ピクセル及び影の動体ピクセルを含んだ動体ピクセル全体の特徴領域を包含する凸包外接領域Ttを算出する。領域分割部34は、慣性主軸K3を用いて、特徴領域を分割して、第2外接多角形領域算出部35は、人体の動体ピクセルを含んだ凸包外接領域Tt1と、影の動体ピクセルを含んだ凸包外接領域Tt2とを算出する。また、撮像画像では、凸包外接領域Ttから凸包外接領域Tt1及びTt2を減算した領域が人体の動体ピクセルと影の動体ピクセルとの間の空間に対応した凸包外接領域Tt3となる。
【0073】
このように、本実施形態の撮像装置1では、特徴領域を分割して、分割前の凸包外接領域Ttと分割後の凸包外接領域Tt1及びTt2との面積比と閾値との比較を行うことにより、人体に対して、その影が90度以外の角度で存在している場合でも、人体の動体ピクセルを含んだ領域により近い凸包外接領域Tt1を算出することができるとともに、影の動体ピクセルを含んだ領域により近い凸包外接領域Tt2を算出することができる。更に、本実施形態では、人体の動体ピクセルと影の動体ピクセルとの間の空間により近い凸包外接領域Tt3とすることができる.この結果、本実施形態の撮像装置1では、撮像画像に含まれる人体及び影を正確に識別することができる。
【0074】
一方、比較例についての検証結果を以下に示す。この比較例では、本実施形態品と異なり、分割前の第1外接多角形領域あるいは分割後の第2外接多角形領域として、凸包外接領域が適用されずに、バウンディングボックスが適用される。
【0075】
すなわち、図6に示すように、比較例において、慣性主軸を用いて、バウンディングボックスを分割すると、比較例では、人体の動体ピクセルを含んだバウンディングボックスである外接領域HB1と、バウンディングボックスである影の動体ピクセルを含んだ外接領域HB2と、が新たに算出される。
【0076】
また、外接領域HB2には、図6に円S1及びS2にて示すように、実際の影の動体ピクセルよりも大きい領域が含まれている。すなわち、比較例では、外接領域HB2が実際の影の領域よりも大幅に大きな面積を有することになり、領域選択部36における面積比の計算に悪影響を与えることになる。したがって、物体識別部37に出力する領域を正しく選択することができないこととなり、物体識別部37での当該撮像画像に含まれる人体及び影を正確に識別することが困難となる。すなわち、比較例よりも、面積比の算出に凸包外接領域を適用した本実施形態品の方が、人体に対して、その影が90度以外の角度で存在している場合でも、人体及び影を正確に識別することができる。
【0077】
なお、上記の説明では、所定の物体として人体を識別する場合を例示して説明したが、本実施形態の撮像装置1はこれに限定されない。例えば、図7に示すように、人体201以外に、例えば、車両202を含む撮像画像にも適用することができる。
【0078】
具体的には、本実施形態の撮像装置1では、人体201については、上記面積比が閾値
以下となるため、人体201の動体ピクセルを含む凸包外接領域と、その人体201の影の動体ピクセルを含む凸包外接領域とに分けて作成される。このため、表示部4では、例えば、その表示画像P1において、人体201を含んだ枠203と、人体201の影を含んだ枠204とが表示される。
【0079】
また、車両202については、上記面積比が閾値を超えるため、車両202の動体ピクセルを含む凸包外接領域と、その車両202の影の動体ピクセルを含む凸包外接領域とが分割されない。このため、表示部4では、例えば、車両202とその影の双方を含んだ枠205が表示される。
【0080】
〔ソフトウェアによる実現例〕
撮像装置1の機能ブロック(特に、制御部3)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
【0081】
後者の場合、制御部3は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば1つ以上のプロセッサを備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本開示の目的が達成される。
【0082】
上記プロセッサとしては、例えばCPU(Central Processing Unit)を用いることが
できる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、磁気ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などを更に備えていてもよい。
【0083】
また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
【0084】
本開示は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても本開示の技術的範囲に含まれる。
【符号の説明】
【0085】
1 撮像装置
3 制御部
31 特徴領域検出部
32 第1外接多角形領域算出部
33 慣性主軸算出部
34 領域分割部
35 第2外接多角形領域算出部
36 領域選択部
37 物体識別部
図1
図2
図3
図4
図5
図6
図7