特許第6875646号(P6875646)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通クライアントコンピューティング株式会社の特許一覧

特許6875646画像処理装置、および、画像処理プログラム
<>
  • 特許6875646-画像処理装置、および、画像処理プログラム 図000002
  • 特許6875646-画像処理装置、および、画像処理プログラム 図000003
  • 特許6875646-画像処理装置、および、画像処理プログラム 図000004
  • 特許6875646-画像処理装置、および、画像処理プログラム 図000005
  • 特許6875646-画像処理装置、および、画像処理プログラム 図000006
  • 特許6875646-画像処理装置、および、画像処理プログラム 図000007
  • 特許6875646-画像処理装置、および、画像処理プログラム 図000008
  • 特許6875646-画像処理装置、および、画像処理プログラム 図000009
  • 特許6875646-画像処理装置、および、画像処理プログラム 図000010
  • 特許6875646-画像処理装置、および、画像処理プログラム 図000011
  • 特許6875646-画像処理装置、および、画像処理プログラム 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6875646
(24)【登録日】2021年4月27日
(45)【発行日】2021年5月26日
(54)【発明の名称】画像処理装置、および、画像処理プログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20210517BHJP
   H04N 7/18 20060101ALI20210517BHJP
【FI】
   G06T7/00 350B
   H04N7/18 K
【請求項の数】4
【全頁数】14
(21)【出願番号】特願2019-110438(P2019-110438)
(22)【出願日】2019年6月13日
(65)【公開番号】特開2020-201880(P2020-201880A)
(43)【公開日】2020年12月17日
【審査請求日】2019年7月5日
(73)【特許権者】
【識別番号】518133201
【氏名又は名称】富士通クライアントコンピューティング株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(72)【発明者】
【氏名】石田 智弘
(72)【発明者】
【氏名】村上 紳介
【審査官】 藤原 敬利
(56)【参考文献】
【文献】 特開2016−171526(JP,A)
【文献】 国際公開第2008/035411(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 − 7/90
H04N 7/18
(57)【特許請求の範囲】
【請求項1】
魚眼レンズを備える撮影手段によって撮影された魚眼画像を取得する取得部と、
前記魚眼画像から光軸中心を含む中央画像を抽出する中央画像抽出部と、
前記魚眼画像から光軸中心を含む所定領域より外周側に存在する外周側画像を抽出する外周側画像抽出部と、
前記外周側画像抽出部によって抽出された前記外周側画像を周方向に複数の分割外周側画像に分割する際に、過去の魚眼画像中の移動物体に関する統計情報に基づいて、前記外周側画像のうち移動物体の出現頻度が他の領域より高いものとして分類された領域を分割位置にしないようにして、前記外周側画像を周方向に複数の前記分割外周側画像に分割する分割部と、
複数の前記分割外周側画像それぞれを矩形の平面画像に変換する変換部と、
複数の前記平面画像と、平面画像に関する機械学習によって学習済みの第1の推論モデルと、に基づいて、複数の前記平面画像に写っている物体を推論する第1の推論部と、
前記中央画像と、中央画像に関する機械学習によって学習済みの第2の推論モデルと、に基づいて、前記中央画像に写っている物体を推論する第2の推論部と、を備える画像処理装置。
【請求項2】
前記中央画像抽出部は、前記魚眼画像から矩形の前記中央画像を抽出する、請求項1に記載の画像処理装置。
【請求項3】
前記取得部は、撮影対象領域を鉛直下向きに撮影するように設置されている前記撮影手段によって撮影された前記魚眼画像を取得する、請求項1に記載の画像処理装置。
【請求項4】
コンピュータを、
魚眼レンズを備える撮影手段によって撮影された魚眼画像を取得する取得部と、
前記魚眼画像から光軸中心を含む中央画像を抽出する中央画像抽出部と、
前記魚眼画像から光軸中心を含む所定領域より外周側に存在する外周側画像を抽出する外周側画像抽出部と、
前記外周側画像抽出部によって抽出された前記外周側画像を周方向に複数の分割外周側画像に分割する際に、過去の魚眼画像中の移動物体に関する統計情報に基づいて、前記外周側画像のうち移動物体の出現頻度が他の領域より高いものとして分類された領域を分割位置にしないようにして、前記外周側画像を周方向に複数の前記分割外周側画像に分割する分割部と、
複数の前記分割外周側画像それぞれを矩形の平面画像に変換する変換部と、
複数の前記平面画像と、平面画像に関する機械学習によって学習済みの第1の推論モデルと、に基づいて、複数の前記平面画像に写っている物体を推論する第1の推論部と、
前記中央画像と、中央画像に関する機械学習によって学習済みの第2の推論モデルと、に基づいて、前記中央画像に写っている物体を推論する第2の推論部と、して機能させるための画像処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、および、画像処理プログラムに関する。
【背景技術】
【0002】
近年、撮影画像を用いた機械学習(推論を含む。)の研究開発が盛んに行われている。また、従来から、一般的な撮影画像のほかに、魚眼レンズを使って広範囲を撮影した画像である魚眼画像がある。魚眼画像を機械学習に用いることができれば、様々な点で有益である。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2016−48834号公報
【特許文献2】特開2012−253723号公報
【特許文献3】特開2010−217984号公報
【特許文献4】国際公開第2013/001941号
【特許文献5】特表2014−519091号公報
【特許文献6】特開2012−226645号公報
【特許文献7】特開2012−230546号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、魚眼画像は、画像中の位置によって被写体が異なる歪み方をしているので、機械学習に高い認識精度で用いるのは容易ではない。
【0005】
そこで、本発明は、上記事情に鑑みてなされたものであり、画像中の歪みを考慮して魚眼画像を機械学習に高い認識精度で用いることができる画像処理装置、および、画像処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1態様に係る画像処理装置は、魚眼レンズを備える撮影手段によって撮影された魚眼画像を取得する取得部と、前記魚眼画像から光軸中心を含む中央画像を抽出する中央画像抽出部と、前記魚眼画像から光軸中心を含む所定領域より外周側に存在する外周側画像を抽出する外周側画像抽出部と、前記外周側画像抽出部によって抽出された前記外周側画像を周方向に複数の分割外周側画像に分割する際に、過去の魚眼画像中の移動物体に関する統計情報に基づいて、前記外周側画像のうち移動物体の出現頻度が他の領域より高いものとして分類された領域を分割位置にしないようにして、前記外周側画像を周方向に複数の前記分割外周側画像に分割する分割部と、複数の前記分割外周側画像それぞれを矩形の平面画像に変換する変換部と、複数の前記平面画像と、平面画像に関する機械学習によって学習済みの第1の推論モデルと、に基づいて、複数の前記平面画像に写っている物体を推論する第1の推論部と、前記中央画像と、中央画像に関する機械学習によって学習済みの第2の推論モデルと、に基づいて、前記中央画像に写っている物体を推論する第2の推論部と、を備える。
【0008】
また、画像処理装置において、例えば、前記中央画像抽出部は、前記魚眼画像から矩形の前記中央画像を抽出する。
【0009】
また、画像処理装置において、例えば、前記取得部は、撮影対象領域を鉛直下向きに撮影するように設置されている前記撮影手段によって撮影された前記魚眼画像を取得する。
【0010】
本発明の第2態様に係る画像処理プログラムは、コンピュータを、魚眼レンズを備える撮影手段によって撮影された魚眼画像を取得する取得部と、前記魚眼画像から光軸中心を含む中央画像を抽出する中央画像抽出部と、前記魚眼画像から光軸中心を含む所定領域より外周側に存在する外周側画像を抽出する外周側画像抽出部と、前記外周側画像抽出部によって抽出された前記外周側画像を周方向に複数の分割外周側画像に分割する際に、過去の魚眼画像中の移動物体に関する統計情報に基づいて、前記外周側画像のうち移動物体の出現頻度が他の領域より高いものとして分類された領域を分割位置にしないようにして、前記外周側画像を周方向に複数の前記分割外周側画像に分割する分割部と、複数の前記分割外周側画像それぞれを矩形の平面画像に変換する変換部と、複数の前記平面画像と、平面画像に関する機械学習によって学習済みの第1の推論モデルと、に基づいて、複数の前記平面画像に写っている物体を推論する第1の推論部と、前記中央画像と、中央画像に関する機械学習によって学習済みの第2の推論モデルと、に基づいて、前記中央画像に写っている物体を推論する第2の推論部と、して機能させる。
【発明の効果】
【0011】
本発明の上記第1態様、上記第2態様によれば、画像中の歪みを考慮して魚眼画像を機械学習に高い認識精度で用いることができる。
【図面の簡単な説明】
【0012】
図1図1は、実施形態の画像処理装置の機能構成を示すブロック図である。
図2図2は、実施形態の魚眼画像例の模式図である。
図3図3は、実施形態の魚眼画像例における中央画像の抽出領域を示す図である。
図4図4は、実施形態の魚眼画像例における外周側画像の抽出領域を示す図である。
図5図5は、実施形態において、外周側画像に基づいて作成した合成平面画像((a))と、抽出された中央画像((b))と、を示す図である。
図6図6は、実施形態の画像処理装置による第1の処理を示すフローチャートである。
図7図7は、図6の第1の処理における分割位置設定処理の詳細を示すフローチャートである。
図8図8は、実施形態において、ヒートマップにおける人物集中領域が1つの場合の外周側画像の分割位置の設定例の説明図である。
図9図9は、実施形態において、ヒートマップにおける人物集中領域が2つの場合の外周側画像の分割位置の第1の設定例の説明図である。
図10図10は、実施形態において、ヒートマップにおける人物集中領域が2つの場合の外周側画像の分割位置の第2の設定例の説明図である。
図11図11は、実施形態の画像処理装置による第2の処理を示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、添付図面を参照して、画像処理装置、および、画像処理プログラムの実施形態について詳細に説明する。
【0014】
図1は、実施形態の画像処理装置1の機能構成を示すブロック図である。画像処理装置1は、撮影画像を用いた機械学習(推論を含む。)を実行するコンピュータ装置である。この機械学習では、例えば、カメラにより得られた撮影画像に対して画像処理を行って、画像中の人物や顔を検出することで学習を行う。また、機械学習としては、例えば、ディープラーニング(深層学習)を用いる。
【0015】
ディープラーニングは、多層構造のニューラルネットワークを用いた機械学習であり、多くの分野で有効性が確認されている。例えば、ディープラーニングは、画像・音声の認識において人間に匹敵するほど高い認識精度を実現している。
【0016】
ディープラーニングでは、識別対象に関する教師データを用いた学習(教師あり学習)を行うことにより、ニューラルネットワークに自動的に識別対象の特徴を学習する。そして、ディープラーニングでは、特徴を学習したニューラルネットワークを用いて識別対象を識別(推論)する。
【0017】
例えば、推論処理として画像における人物検出を例にとると、ディープラーニングでは、人物全体が写った大量の画像を学習用の画像として教師あり学習を行うことにより、画像に写った人物全体の特徴をニューラルネットワークに自動的に学習する。あるいは、推論処理として画像における顔検出を例にとると、ディープラーニングでは、人物の顔が写った大量の画像を学習用の画像として教師あり学習を行うことにより、画像に写った人物の顔の特徴をニューラルネットワークに自動的に学習する。
【0018】
ディープラーニングでは、このように特徴を学習したニューラルネットワークを用いることで、画像に写った識別対象を識別することなどの推論処理が可能な学習済みの推論モデルを生成できる。
【0019】
このようなディープラーニングなどの機械学習に、魚眼レンズを使って広範囲を撮影した画像である魚眼画像を用いることができれば、様々な点で有益である。しかし、魚眼画像は、画像中の位置によって被写体が異なる歪み方をしているので、機械学習に高い認識精度で用いるのは容易ではない。なお、以下では、特に、撮影対象領域を鉛直下向きに撮影するように設置されている魚眼カメラ(以下、単に「カメラ」とも称する。)によって撮影された魚眼画像を例にとって説明する。
【0020】
そのような魚眼画像では、画像中の位置によって被写体の歪み方(映る角度、大きさ)が異なり、したがって認識する特徴も異なるため、認識精度に誤差が生じてしまう。また、この魚眼画像を平面展開すると画像中心に近いほど被写体が大きく引き伸ばされてしまい、認識精度にさらに誤差が生じてしまう。そこで、以下では、画像中の歪みを考慮して魚眼画像を機械学習に高い認識精度で用いることができる技術について説明する。
【0021】
図1に示すように、画像処理装置1は、処理部2、記憶部3、入力部4、表示部5、および、通信部6を備える。
【0022】
処理部2は、例えばCPU(Central Processing Unit)によって構成され、記憶部3に記憶された画像処理プログラムを実行することで実現される機能構成として、取得部21、中央画像抽出部22、外周側画像抽出部23、分割部24、変換部25、合成部26、第1の推論部27、および、第2の推論部28を備える。なお、以下において、処理部2における各部21〜28以外の処理については、動作主体を「処理部2」と表記する。
【0023】
取得部21は、魚眼レンズを備えるカメラ100(撮影手段)によって撮影された魚眼画像を取得し、記憶部3に格納する。
【0024】
中央画像抽出部22は、魚眼画像から光軸中心を含む中央画像(例えば矩形の中央画像)を抽出する。外周側画像抽出部23は、魚眼画像から光軸中心を含む所定領域より外周側に存在する外周側画像を抽出する。
【0025】
分割部24は、外周側画像を周方向に複数の分割画像(分割外周側画像)に分割する。例えば、分割部24は、外周側画像を周方向に複数の分割画像に分割する際に、過去の魚眼画像中の移動物体に関する統計情報に基づいて、移動物体が多い領域ほど分割位置にならないようにして、外周側画像を周方向に複数の分割画像に分割する。
【0026】
また、例えば、分割部24は、統計情報に基づいて、魚眼画像中の移動物体が多い2つの領域が分割位置にならないようにして、外周側画像を周方向に2つの分割画像に分割する際に、魚眼画像の中心から当該2つの領域それぞれの中心までの直線同士のなす角度が90度未満の場合は、当該2つの領域が同じ側になるように、外周側画像を、魚眼画像の中心を通る1本の線で周方向に分割する。また、分割部24は、当該角度が90度以上の場合は、当該2つの領域が反対側になるように、外周側画像を、魚眼画像の中心を通る1本の線で周方向に分割する。
【0027】
また、例えば、分割部24は、統計情報を元に魚眼画像中の領域を移動物体の出現頻度で分類した情報であるヒートマップ情報に基づいて、移動物体が多い領域ほど分割位置にならないようにして、外周側画像を周方向に複数の分割画像に分割する。
【0028】
変換部25は、外周側画像を矩形の平面画像に変換する。例えば、変換部25は、複数の分割画像それぞれを矩形の平面画像に変換する。合成部26は、複数の平面画像をつなぎ合わせて矩形の合成平面画像を作成する際に、合成平面画像の縦と横の長さの比が1:1に近づくように、合成平面画像を作成する。
【0029】
第1の推論部27は、合成平面画像と、平面画像に関する機械学習によって学習済みの第1の推論モデルと、に基づいて、合成平面画像に写っている物体を推論する。
【0030】
第2の推論部28は、中央画像と、中央画像に関する機械学習によって学習済みの第2の推論モデルと、に基づいて、中央画像に写っている物体を推論する。各部21〜28の処理の詳細については、図2以降を用いて後述する。
【0031】
記憶部3は、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子や、HDD(Hard Disk Drive)などから構成される。
【0032】
記憶部3は、例えば、統計情報、ヒートマップ情報、第1の推論モデル、第2の推論モデル等を記憶する。統計情報は、上述のように、過去の魚眼画像中の移動物体に関する統計情報である。ヒートマップ情報は、統計情報を元に魚眼画像中の領域を移動物体の出現頻度で分類した情報である。
【0033】
第1の推論モデルは、平面画像に関する機械学習によって学習済みの推論モデルである。第2の推論モデルは、中央画像に関する機械学習によって学習済みの推論モデルである。つまり、画像処理装置1では、魚眼画像において画像中の位置によって被写体が異なる歪み方をしていることを考慮して、外周側画像を変換した平面画像に関する第1の推論モデルと、中央画像に関する第2の推論モデルと、を別々に用意する。これにより、高精度の物体認識が可能となる。
【0034】
入力部4は、ユーザが各種情報を入力するための手段であり、例えば、キーボード、マウス、タッチパネル等によって構成される。
【0035】
表示部5は、各種情報を表示するための手段であり、例えば、液晶ディスプレイやタッチパネル等によって構成される。
【0036】
通信部6は、カメラ100等の外部装置と通信するための手段であり、例えば、通信インタフェース等によって構成される。
【0037】
図2は、実施形態の魚眼画像例の模式図である。図2における魚眼画像F1は、カメラ100によって撮影対象領域を鉛直下向きに撮影して得られた画像である。魚眼画像F1では、画像中の位置によって人物の映る角度や大きさが異なっている。具体的には、画像の中心に近いほど人物は頭頂部方向から撮影されたように、かつ、大きく写り、また、画像の中心から遠いほど人物は水平方向から撮影されたように、かつ、小さく写っている。
【0038】
ここで、図3は、実施形態の魚眼画像例における中央画像の抽出領域を示す図である。図3の魚眼画像F1において、領域R1は中央画像に対応する領域である。つまり、中央画像抽出部22は、魚眼画像F1から領域R1に対応する画像を中央画像として抽出する。
【0039】
また、図4は、実施形態の魚眼画像例における外周側画像の抽出領域を示す図である。図4の魚眼画像F1において、領域R2と領域R3を合わせた領域(以下、領域R23と称する。)は、外周側画像に対応する領域である。つまり、外周側画像抽出部23は、魚眼画像F1から領域R23に対応する画像を外周側画像として抽出する。なお、魚眼画像F1から、領域R1に内接する中心円(全体の中心点を中心とする円)を除いた領域が、領域R23である。
【0040】
また、分割部24は、例えば、領域R23に対応する外周側画像を周方向に2つの分割画像(領域R2に対応する分割画像と領域R3に対応する分割画像)に分割する。
【0041】
また、図5は、実施形態において、外周側画像に基づいて作成した合成平面画像((a))と、抽出された中央画像((b))と、を示す図である。図5(a)において、領域R3aの画像は、図4の領域R3の分割画像に対応する平面画像である。つまり、変換部25は、図4の領域R3の分割画像を平面展開することで、図5(a)の領域R3aの矩形の平面画像に変換する。
【0042】
また、図5(a)において、領域R2aの画像は、図4の領域R2の分割画像に対応する平面画像である。つまり、変換部25は、図4の領域R2の分割画像を平面展開することで、図5(a)の領域R2aの矩形の平面画像に変換する。
【0043】
また、合成部26は、領域R2aの平面画像と領域R3aの平面画像をつなぎ合わせて矩形の合成平面画像を作成する。その際、合成部26は、合成平面画像の縦と横の長さの比が1:1に近づくように、合成平面画像を作成する。そうすることで、合成平面画像を機械学習に用いたときの人物の認識精度が高くなる。第1の推論部27は、図5(a)の合成平面画像と第1の推論モデルに基づいて、合成平面画像に写っている物体を推論する。
【0044】
また、図5(b)において、領域R1の中央画像は、図3の領域R1の中央画像と同じである。そして、第2の推論部28は、図5(b)の中央画像と第2の推論モデルに基づいて、中央画像に写っている物体を推論する。
【0045】
次に、図6を参照して、実施形態の画像処理装置1による第1の処理について説明する。図6は、実施形態の画像処理装置1による第1の処理を示すフローチャートである。この第1の処理は、推論処理を行う前の前処理である。
【0046】
ステップS1において、処理部2は、記憶部3に格納されている画像処理アプリケーションを起動する。
【0047】
次に、ステップS2において、処理部2は、カメラ100と接続されているか否かを判定し、Yesの場合はステップS3に進み、Noの場合は処理を終了する。
【0048】
ステップS3において、処理部2は、記憶部3に格納されているカメラの機能情報を取得する。
【0049】
次に、ステップS4において、処理部2は、ステップS3で取得したカメラの機能情報に基いて、接続されているカメラ100が魚眼カメラか否かを判定し、Yesの場合はステップS6に進み、Noの場合はステップS5に進む。
【0050】
ステップS5において、処理部2は、取得する撮影画像に対する画像処理について、補正無しを設定し、ステップS10に進む。
【0051】
ステップS6において、処理部2は、記憶部3に格納されたカメラの設置情報に基いて、カメラ100の設置位置が天井か側面かを判定し、天井であればステップS8に進み、側面であればステップS7に進む。
【0052】
ステップS7において、処理部2は、取得する魚眼画像に対する画像処理について、平面展開処理を設定し、ステップS10に進む。
【0053】
ステップS8において、処理部2は、取得する魚眼画像に対する分割方法(例えば中央画像と2つの外周側画像への分割)について設定する。
【0054】
次に、ステップS9において、処理部2は、分割位置設定処理を実行する。ここで、図7は、図6の第1の処理におけるステップS9の分割位置設定処理の詳細を示すフローチャートである。
【0055】
ステップS21において、処理部2は、分割位置が自動設定に設定されているか否かを判定し、Yesの場合はステップS22に進み、Noの場合はステップS25に進む。
【0056】
ステップS22において、処理部2は、設定値が指定されているか否かを判定し、Yesの場合はステップS24に進み、Noの場合はステップS23に進む。
【0057】
ステップS23において、処理部2は、分割位置を初期値(例えば外周側画像について2分割であれば水平方向)に設定し、処理を終了する。
【0058】
ステップS24において、処理部2は、分割位置を指定値(ユーザによって指定された値)に設定し、処理を終了する。
【0059】
ステップS25において、処理部2は、カメラ解像度、フレーム数などの各値を設定する。
【0060】
次に、ステップS26において、処理部2の取得部21は、カメラ100からの魚眼画像の取得を開始する。
【0061】
次に、ステップS27において、処理部2は、カウンタ値を「0」にセットする。
【0062】
次に、処理部2は、カウンタ値が「3」か否かを判定し、Yesの場合はステップS23に進み、Noの場合はステップS29に進む。
【0063】
ステップS29において、処理部2は、タイマ計測を開始する。次に、ステップS30において、処理部2は、魚眼画像中に移動物体(例えば人物の移動)があるか否かを判定し、Yesの場合はステップS31に進み、Noの場合はステップS32に進む。
【0064】
ステップS31において、処理部2は、記憶部3に格納しているヒートマップ情報に反映する。
【0065】
ステップS32において、処理部2は、タイムアウト(所定値が経過)したか否かを判定し、Yesの場合はステップS33に進み、Noの場合はステップS30に戻る。
【0066】
ステップS33において、処理部2は、カウンタ値をインクリメント(1加算)する。次に、ステップS34において、処理部2は、ヒートマップ情報に赤い表示エリア(人物集中領域)があるか否かを判定し、Yesの場合はステップS35に進み、Noの場合はステップS28に戻る。
【0067】
ステップS35において、処理部2は、赤い表示エリア(人物集中領域)が複数か否かを判定し、Yesの場合はステップS37に進み、Noの場合はステップS36に進む。
【0068】
ステップS36において、処理部2は、赤い表示エリア(人物集中領域)が1つのときの設定手順にしたがって、分割位置を設定する。ここで、図8は、実施形態において、ヒートマップにおける人物集中領域が1つの場合の外周側画像の分割位置(画像中央の曲線部分の表記を省略。図9図10も同様)の設定例の説明図である。
【0069】
図8(a)に示すように、ヒートマップにおける人物集中領域が領域H1であるものとする。その場合、例えば、図8(b)に示すように、領域H1の中心点P1と全体中心点Cとを結ぶ線L1と垂直になって全体中心点Cを通る線を、分割位置の線L2として設定する。
【0070】
図7に戻って、ステップS37において、処理部2は、赤い表示エリア(人物集中領域)が複数のときの設定手順にしたがって、分割位置を設定する。ここで、図9は、実施形態において、ヒートマップにおける人物集中領域が2つの場合の外周側画像の分割位置の第1の設定例の説明図である。
【0071】
図9(a)に示すように、ヒートマップにおける人物集中領域が領域H2、H3の2つであるものとする。その場合、例えば、図9(b)に示すように、まず、領域H2の中心点P2と全体中心点Cとを結ぶ線を、線L3とする。また、領域H3の中心点P3と全体中心点Cとを結ぶ線を、線L4とする。そして、線L3と線L4の間の角が90度未満であるものとする。
【0072】
その場合、線L3と線L4の間の角を二等分する線を、線L5とする。そして、線L5と垂直になって全体中心点Cを通る線を、分割位置の線L6として設定する。このようにすることで、画像中の複数の人物の位置のバランスがよくなり、機械学習における人物の認識精度が向上する。
【0073】
また、図10は、実施形態において、ヒートマップにおける人物集中領域が2つの場合の外周側画像の分割位置の第2の設定例の説明図である。図10(a)に示すように、ヒートマップにおける人物集中領域が領域H4、H5の2つであるものとする。その場合、例えば、図10(b)に示すように、まず、領域H4の中心点P4と全体中心点Cとを結ぶ線を、線L7とする。また、領域H5の中心点P5と全体中心点Cとを結ぶ線を、線L8とする。そして、線L7と線L8の間の角が90度以上であるものとする。
【0074】
その場合、線L7と線L8の間の角を二等分する線を、分割位置の線L9として設定する。このようにすることで、画像中の複数の人物の位置のバランスがよくなり、機械学習における人物の認識精度が向上する。
【0075】
次に、図11を参照して、実施形態の画像処理装置1による第2の処理について説明する。図11は、実施形態の画像処理装置による第2の処理を示すフローチャートである。この第2の処理は、推論処理である。
【0076】
ステップS41において、取得部21は、魚眼レンズを備えるカメラ100によって撮影された魚眼画像を取得する。
【0077】
次に、ステップS42において、中央画像抽出部22は、魚眼画像から光軸中心を含む中央画像を抽出する(図3)。次に、ステップS43において、外周側画像抽出部23は、魚眼画像から光軸中心を含む所定領域より外周側に存在する外周側画像を抽出する(図4)。
【0078】
次に、ステップS44において、分割部24は、外周側画像を周方向に複数の分割画像に分割する(図4)。次に、ステップS45において、変換部25は、複数の分割画像それぞれを矩形の平面画像に変換する(図5(a))。
【0079】
次に、ステップS46において、合成部26は、複数の平面画像をつなぎ合わせて矩形の合成平面画像を作成する(図5(a))。
【0080】
次に、ステップS47において、第1の推論部27は、合成平面画像(図5(a))と第1の推論モデルに基づいて、合成平面画像に写っている物体を推論する。
【0081】
次に、ステップS48において、第2の推論部28は、中央画像(図5(b))と第2の推論モデルに基づいて、中央画像に写っている物体を推論する。なお、ステップS47とステップS48は、同時に実行してもよい。
【0082】
このようにして、実施形態の画像処理装置1によれば、画像中の歪みを考慮して魚眼画像を機械学習に高い認識精度で用いることができる。具体的には、魚眼画像から抽出した中央画像については中央画像用の第2の推論モデルに基づいて推論し、魚眼画像から抽出した外周側画像については矩形の平面画像に変換してから平面画像用の第1の推論モデルに基づいて推論することで、物体を高精度で推論することができる。
【0083】
また、外周側画像を周方向に複数の分割外周側画像に分割した後に矩形の平面画像に変換してから第1の推論モデルに基づいて推論することで、さらに認識精度を向上することができる。
【0084】
また、魚眼画像から抽出する中央画像を矩形とすることで、機械学習に適用しやすい。
【0085】
なお、画像処理装置1による上述の処理は、撮影対象領域を鉛直下向きに撮影するように設置されているカメラ100からの魚眼画像に対して特に効果的であるが、これに限定されない。例えば、撮影対象領域を水平方向に撮影するように設置されているカメラ100からの魚眼画像に対しても、本発明を適用することができる。カメラ100の向きに関係なく、魚眼画像における歪みは存在するからである。
【0086】
開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
【0087】
例えば、本実施形態では、画像処理装置1を1つのコンピュータ装置によって実現するものとして説明したが、これに限定されず、画像処理装置1を複数のコンピュータ装置によって実現してもよい。
【0088】
また、用いる機械学習は、ディープラーニングに限定されず、ディープラーニング以外であってもよい。
【0089】
また、本実施形態では、機械学習における学習と推論のうち、特に推論の場面について説明したが、これに限定されず、学習の場面にも本発明を適用することができる。
【0090】
また、図9図10では、人物集中領域が2つの場合について説明したが、これに限定されず、人物集中領域が3つ以上の場合であっても、人物集中領域を集中度合いでランク分けすること等によって同様に対応することができる。
【0091】
また、本実施形態では、外周側画像を分割するものとしたが、これに限定されず、外周側画像を分割しなくてもよい。
【0092】
また、魚眼画像の周方向の分割は、2分割に限定されず、3つ以上への分割であってもよい。
【0093】
また、図4における領域R2、R3に含まれない中心の円領域の大きさは、魚眼画像の解像度やレンズの種類等によって、適宜、変更してもよい。
【0094】
本発明は、例えば、監視カメラ、全天球カメラ等に適用することができる。
【符号の説明】
【0095】
1…画像処理装置、2…処理部、3…記憶部、4…入力部、5…表示部、6…通信部、21…取得部、22…中央画像抽出部、23…外周側画像抽出部、24…分割部、25…変換部、26…合成部、27…第1の推論部、28…第2の推論部、100…カメラ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11