(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-02
(45)【発行日】2022-12-12
(54)【発明の名称】画像処理装置、画像処理方法およびプログラム
(51)【国際特許分類】
H04N 5/232 20060101AFI20221205BHJP
G06T 7/194 20170101ALI20221205BHJP
H04N 7/18 20060101ALI20221205BHJP
【FI】
H04N5/232 290
G06T7/194
H04N7/18 D
H04N7/18 U
(21)【出願番号】P 2018018206
(22)【出願日】2018-02-05
【審査請求日】2021-01-21
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】100126240
【氏名又は名称】阿部 琢磨
(74)【代理人】
【識別番号】100124442
【氏名又は名称】黒岩 創吾
(72)【発明者】
【氏名】松井 太一
【審査官】高野 美帆子
(56)【参考文献】
【文献】特開2012-203680(JP,A)
【文献】特開2016-115214(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/232
G06T 7/194
H04N 7/18
(57)【特許請求の範囲】
【請求項1】
撮像部によって撮像された撮像画像から物体を検出する検出手段と、
前記物体の特徴に基づいて、前記撮像画像から検出された前記物体に対応する領域の時間閾値を設定する設定手段と、
前記撮像画像内の前記領域内の前記物体が静止している時間が前記時間閾値に達した場合に、前記領域内の前記物体が背景画像に反映されるように前記撮像画像に基づいて前記背景画像を更新する更新手段と、を有し、
前記設定手段は、前記物体がプライバシー保護の対象である場合、前記物体に対応する領域の前記時間閾値として第1の値を設定し、前記物体がプライバシー保護の対象でない場合、前記物体に対応する領域の前記時間閾値として、前記第1の値よりも小さい第2の値を設定することを特徴とする画像処理装置。
【請求項2】
前記検出手段は特定の形状特徴に基づくパターンマッチングまたは特定の色により前記撮像画像から前記物体を検出することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記プライバシー保護の対象は、人体であることを特徴とする請求項1または2に記載の画像処理装置。
【請求項4】
前記更新手段により更新した背景画像と前記撮像画像におけるプライバシー保護の対象を匿名化した匿名画像とを合成してプライバシー保護画像を生成する合成手段を更に備えることを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
【請求項5】
前記設定手段は、前記
撮像画像の所定の領域について常に背景化される様に設定することで、前記撮像画像の所定の領域がプライバシー保護の対象とならない様に設定することができる請求項4に記載の画像処理装置。
【請求項6】
前記設定手段は、前記
撮像画像の所定の領域について常に背景化されない様に設定することで、前記撮像画像の所定の領域がプライバシー保護の対象となる様に設定することができる請求項4に記載の画像処理装置。
【請求項7】
前記設定手段は、前記撮像画像の所定の領域について常に背景化されない様に設定されている場合に、当該所定の領域について前記更新手段が更新した背景画像を表示するか、ぼかし処理を実施して表示するかのどちらか一方を設定することができる請求項6に記載の画像処理装置。
【請求項8】
前記検出手段は特定の距離以上のオブジェクトを、プライバシーを保護する度合の低い物体として検出することを特徴とする請求項1乃至7のいずれか1項に記載の画像処理装置。
【請求項9】
撮像部によって撮像された撮像画像から物体を検出する検出工程と、
前記物体の特徴に基づいて、撮像画像から検出された前記物体に対応する領域の時間閾値を設定する設定工程と、
前記撮像画像内の前記領域内の前記物体が静止している時間が前記時間閾値に達した場合に、前記領域内の前記物体が背景画像に反映されるように前記撮像画像に基づいて背景画像を更新する更新工程と、を有し、
前記設定工程において、前記物体がプライバシー保護の対象である場合、前記物体に対応する領域の前記時間閾値として第1の値を設定し、前記物体がプライバシー保護の対象でない場合、前記物体に対応する領域の前記時間閾値として、前記第1の値よりも小さい第2の値を設定することを特徴とする画像処理方法。
【請求項10】
コンピュータを、
撮像部によって撮像された撮像画像から物体を検出する検出手段と、
前記物体の特徴に基づいて、撮像画像から検出された前記物体に対応する領域の時間閾値を設定する設定手段と、
前記撮像画像内の前記領域内の前記物体が静止している時間が前記時間閾値に達した場合に、前記領域内の前記物体が背景画像に反映されるように前記撮像画像に基づいて背景画像を更新する更新手段と、を有し、
前記設定手段は、前記物体がプライバシー保護の対象である場合、前記物体に対応する領域の前記時間閾値として第1の値を設定し、前記物体がプライバシー保護の対象でない場合、前記物体に対応する領域の前記時間閾値として、前記第1の値よりも小さい第2の値を設定することを特徴とする画像処理装置として動作させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像処理装置、画像処理方法およびプログラムに関し、特に画像中の特定の物体を隠してプライバシーを保護する技術に関する。
【背景技術】
【0002】
昨今、街中への監視カメラの設置が進んでいる。ここで、監視カメラに映る個人のプライバシーを保護する重要性が高まっている。例えば、特許文献1では背景画像と処理対象画像を比較し、比較結果に応じて処理対象画像の特定領域を隠蔽処理してプライバシーを保護する方法が開示されている。特に画像に表示されている人体や動体を検出し、隠蔽処理の精度を上げている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1では、画像中の人体および動体以外の領域を一律の時間で背景更新しており、直ぐに背景化するべき対象や領域について好ましくプライバシーを保護するための処理ができなかった。
【0005】
そこで、本発明の目的は、撮影されたプライバシー保護対象のものとそうでないものに対して、それぞれに適した背景化時間を設定することができる画像処理装置を提供することである。
【課題を解決するための手段】
【0006】
本発明の画像処理装置は、撮像部によって撮像された撮像画像から物体を検出する検出手段と、前記物体の特徴に基づいて、撮像画像から検出された前記物体に対応する領域の時間閾値を設定する設定手段と、前記撮像画像内の前記領域内の前記物体が静止している時間が前記時間閾値に達した場合に、前記領域内の前記物体が前記背景画像に反映されるように前記撮像画像に基づいて背景画像を更新する更新手段と、を有し、前記設定手段は、前記物体がプライバシー保護の対象である場合、前記物体に対応する領域の前記時間閾値として第1の値を設定し、前記物体がプライバシー保護の対象でない場合、前記物体に対応する領域の前記時間閾値として、前記第1の値よりも小さい第2の値を設定することを特徴とする。
【発明の効果】
【0007】
本発明によれば、画像中の物体に対応する背景化の時間を設定することで、より好ましくプライバシーを保護する処理を行うことが出来る。
【図面の簡単な説明】
【0008】
【
図1】(a)画像処理装置の機能構成を示すブロック図である。(b)画像処理システムの概略構成を示す模式図である。
【
図2】画像処理装置のハードウェア構成を示すブロック図である。
【
図3】(a)-(g)プライバシー保護処理の概要を説明するための模式図である。
【
図4】(a)-(g)プライバシー保護処理の例を説明するための模式図である。
【
図5】プライバシー保護処理の概略を示すフローチャートである。
【
図6】時間閾値の設定をするためのGUIを示す模式図である。
【
図7】背景画像に関する設定をするためのGUIを示す模式図である。
【発明を実施するための形態】
【0009】
以下、添付の図面を参照して、実施形態について詳細に説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
【0010】
<実施形態1>
図1(b)は、本実施形態の画像処理システムを示す模式図である。少なくとも1つ以上の画像出力装置120はネットワーク110を介して画像処理装置101と通信可能に接続されている。画像出力装置120としては、監視用途のネットワークカメラやNVR(ネットワーク・ビデオ・レコーダ)などがある。以降の説明はネットワークカメラ(単にカメラ120と称す)を例に説明する。ネットワーク110はインターネットプロトコルに沿った通信によりカメラ120の配信映像を画像処理装置101に伝送したり、カメラ120の制御信号や設定パラメータを画像処理装置101からカメラ120に伝送したりする。画像処理装置101は画像出力装置120から動画像データを取得し、取得した動画像データについてプライバシー保護処理をする。プライバシー保護処理を実施した画像データ(動画像データ)は、ネットワーク110に接続されている他のクライアント装置に出力したり、画像処理装置とローカルに接続されているディスプレイに表示させたり、NVR120に録画したりできる。
【0011】
図2は、画像処理装置101のハードウェア構成を示すプロック図である。画像処理装置101は、CPU201、ROM202、RAM203、外部メモリ204、ネットワークインターフェース205、入力装置206、表示デバイス207、システムバス208から構成される。
【0012】
CPU201は、画像処理装置101における動作を統括的に制御するものであり、システムバス208を介して、各構成(202~207)を制御する。ROM202は、CPU201が処理を実行するために必要な制御プログラム等を記憶する不揮発性メモリである。なお、CPUが実行するプログラムは、外部メモリ204や着脱可能な記憶媒体に記憶されていてもよい。
【0013】
RAM203は、CPU201の主メモリ、ワークエリアとして機能する。すなわち、CPU201は、後述の処理の実行に際してROM202から必要なプログラム等をRAM203にロードし、読み込んだプログラムを実行することで各種の機能動作を実現する。
【0014】
外部メモリ204は、例えば、CPU201がプログラムを用いた処理を行う際に必要な各種データや各種情報等を記憶している。また、外部メモリ204には、例えば、CPU201がプログラム等を用いた処理を行うことにより得られた各種データや各種情報等が記憶される。
【0015】
ネットワークインターフェース205は、外部装置と通信するためのインターフェースである。ネットワークインターフェース205は、例えばLANインターフェースである。なお、本実施形態では、画像処理装置101がクライアントPC(パーソナルコンピュータ)である場合の例を中心に説明する。
【0016】
入力装置206は、CPU201への入力装置として機能する。入力装置206は、例えばキーボードやマウスやボタンである。
【0017】
表示デバイス207は、CPU201の出力を表示するディスプレイである。ネットワークインターフェース205から外部に映像出力する場合もあり、構成によっては不要となる場合もある。
【0018】
なお、画像出力装置120も
図2と同様の構成を有する。画像出力装置120がネットワークカメラの場合は、表示デバイス207は無く、イメージセンサやレンズ、画像処理用のプロセッサ(不図示)を備えている。レンズは着脱式のレンズであってもよい。
【0019】
図1(a)は画像処理装置101の概略構成を示し、画像処理装置101は画像取得部102、動体検出部103、物体検出部104、パラメータ設定部105、背景更新部106、画像比較部107、画像合成部108、出力部109を有している。
【0020】
画像取得部102は画像出力装置120から所定の間隔で画像を順次取得し、取得した画像を動体検出部103と物体検出部104と背景更新部106と画像比較部107に送る。
【0021】
動体検出部103は、画像取得部102より取得された画像と背景画像(背景モデル)とを比較することにより動体の検出を行う(背景差分法)。すなわち、動体検出部103は、画像取得部102による取得画像と、当該取得画像とは撮影時刻が異なる他画像との比較に基づいて動体領域を検出する。なお、背景モデルは、画像内の変化に追従して動体検出部103により適宜更新されるものであり、画像ではなく特徴(各画素の輝度成分などを抜き出した情報)であってもよい。
【0022】
動体検出部103は、動体検出処理により得られた動体情報を背景更新部106に送る。本実施形態の動体情報には、画像から検出された動体の中心座標(位置情報)と外接矩形(形状情報)の情報が含まれる。動体検出部103は、画像取得部102により取得された複数の画像のそれぞれに対して動画検出処理を実行し、その結果得られた動体情報を背景更新部106に送る。
【0023】
物体検出部104は、画像取得部102により取得された画像から特定の物体を検出する物体検出処理を行う。本実施形態の物体検出部104は、画像取得部102により取得された画像から次に説明するような方法で物体検出処理を行う。
【0024】
第一にパターンマッチング法の使用である。画像取得部102により取得された画像と予め定められたパターン画像(もしくは特徴)を比較することで物体の検出を行う。検出対象は人体、イス、机等、検出出来るパターン画像を持っているものはどのようなものでも対象となる。人体とは全身であってもよいし、上半身や頭、顔、手などの全身の一部であってもよい。ただし、物体の検出方法はパターンマッチング法に限らず、画像の色、明るさ、濃度勾配、テクスチャ、機械学習の特徴量を用いた検出でも構わない。
【0025】
第二に距離検出である。現在カメラ画像から距離を検出することが出来るカメラが存在することは知られている(2眼もしくはCCDの画素2画素を用いて三角測量で距離を取得する)。画像取得部102により取得された画像から領域毎の距離を計測する。距離によって次のように物体検出を行う。所定の距離以上遠い領域はプライバシー保護の対象ではなく背景にするべき領域とする。距離が前フレームと比較して所定の距離以上近づいた領域は、人体がその領域に入った可能性があり、プライバシー保護対象の領域とする。
【0026】
第一の方法と第二の方法で検出された画像領域の特徴量(特徴)に基づき、領域毎にスコアを作成する。人体領域等プライバシー保護が必要と検知された領域はスコアを高く、遠景やイス、机等プライバシー保護が不要な物体と検出された領域はスコアを低く設定する。また、スコアはより確からしさを加味して算出し、よりプライバシー保護が必要な領域である可能性が高いと判定されればより高いスコアに、よりプライバシー保護が不要な領域である可能性が高いと判定されればより低いスコアになる。
【0027】
以上のような方法で領域毎に算出されたスコア情報を背景更新部106に送る。
【0028】
背景更新部106は、画像取得部102により取得された画像と、動体検出部103から取得した動体情報と、物体検出部104から取得した画像領域のスコア情報とに基づいて背景画像を生成する。そして、背景更新部106は、背景画像を画像比較部107と画像合成部108に送る。背景更新部106による背景画像の生成処理の詳細は後述する。
【0029】
画像比較部107は、背景更新部106から取得した背景画像のうち、画像比較部107から取得した保護領域情報が示す保護領域に所定の画像を合成して保護画像を生成する。保護画像とは処理前の入力画像に比べてプライバシーが保護されている画像であってその生成方法の詳細は後述する。画像合成部108は、生成した保護画像を出力部109に送る。
【0030】
出力部109は、画像合成部108から取得した保護画像を表示させる。なお、画像出力装置101がネットワークカメラに実装される場合、出力部109は、ネットワークカメラを介して接続されるモニタ装置に対して保護画像を送信できる。また、画像処理装置101がモニタ装置に実装される場合、ネットワークカメラから取得した背景画像に所定の画像を合成することで保護画像を生成し、生成した保護画像を表示させる。パラメータ設定部105は、物体検出部104の物体検出に必要なパラメータを設定する(詳細は
図6を用いて後述する)。
【0031】
次に、背景更新部106による背景画像の生成方法について説明する。背景更新部106は、背景画像を所定の大きさで分割した領域(ブロック)ごとに安定背景時間を管理する。安定背景時間は、動体情報および画像領域のスコア情報に基づいて画像領域毎に設定されるもので、画像領域の物体の背景化に対応する。
【0032】
以降の説明では、背景更新部106による背景画像の生成処理を、(A)最初の画像、(B)最初の画像の次以降の画像の2つのケースに分けて説明する。
【0033】
(A)最初の背景画像(装置を起動したり撮影条件を変更したりする等してから初めて作成する背景画像)の作成処理について
本ケースは、背景画像が未生成の状態である。このケースにおいて背景更新部106は、画像取得部102から取得した画像を背景画像として記憶する。なお、背景更新部106は、背景画像のすべてのブロックの安定背景時間として0を設定する。
【0034】
(B)以降の背景画像の作成処理
本ケースは、最初の画像が背景画像として設定され、それ以降に背景画像を作成するケースである。このケースにおいて背景更新部106は、動体情報により特定される動体領域が属するブロック以外のブロックに対応する安定背景化時間を更新(インクリメント)する。そして、背景更新部106は、更新後の安定背景時間が時間閾値以上になったブロックを特定し、画像取得部102で新しく取得した画像について特定されたブロックに対応する領域の画素値に基づいて背景画像を更新する。ここで、安定背景時間が時間閾値以上になったブロックとは、動体未検出状態が時間閾値の間継続していた領域を意味する。そして、背景更新部106は、背景画像の更新に用いたブロックに対応する安定背景時間を0に設定する。
【0035】
背景更新部106は、画像領域のスコア情報に基づいて画像領域毎に時間閾値を設定する。スコアが大きいほどプライバシー保護の必要性が高く、スコアが小さいほどプライバシー保護の必要性が低い。背景更新部106は、スコアが高いほど長い時間を時間閾値として設定し、より背景画像に合成され難く(背景化し難く)する。一方でスコアが低いほど短い時間を時間閾値として設定し、より短時間で背景画像に合成され易く(背景化され易く)なる。背景更新部106は、画像領域の物体の特徴量に合わせてプライバシー保護度のスコアを設定し、状況にあった時間閾値を設定する。時間閾値は背景化時間とも呼称してもよい。
【0036】
プライバシー保護が必要な度合が高い物として人体、機密情報が記された物体等がある。プライバシーを保護する度合が低いが移動するものとしてイス、時計等がある。例えば背景更新部106は、最大のスコアになっている画像領域では安定背景時間を無限大に設定する。例えば、最小のスコアになっている画像領域では安定背景時間を0に設定する。例えば背景更新部106は、人体と検出された画像領域では最大スコアに設定する。例えばイスや時計として検出された画像領域では最小スコアに設定する。
【0037】
次に、ケース(B)における処理の詳細を
図3と
図4を用いて説明する。なお、
図3(a)と
図4(a)は画像取得部102から取得した画像(取得画像)であり、
図3(b)と
図4(b)は動体情報及び物体情報を画像と同サイズの白い画像に描画した結果(認識結果)である。また、
図3(c)と
図4(c)は安定背景時間を示し、
図3(d)と
図4(d)は時間閾値を示し、
図3(e)と
図4(e)は更新後の背景画像を示している。
【0038】
図3(a)から
図3(g)は、本実施形態に係る背景画像の取得処理を開始したタイミングにおける状態を示している。
図3は、上述のケース(A)に対応する。典型的には、ケース(A)は、画像処理装置101が背景画像の生成を開始したタイミングや、既存背景画像がリセットされた直後のタイミングである。上述の通り、本実施形態の背景更新部106は、ケース(A)において画像取得部102から取得した画像をそのまま背景画像として記憶するので、
図3(a)取得画像と
図3(e)背景画像とは同一である。また
図3(b)に示すように、ここでは動体や物体が検出されていない。当初の背景画像は前景が写り込んでいないことが望ましい。
【0039】
図4(a)から
図3(g)は、
図3からある時間経過した後の状態を示し、
図3(e)に示した背景画像が設定されているものとする。
図4(a)に示す取得画像には人物401とイス402が写っている。
図4(b)は、動体検出部103の動体検出処理により動体403が検出され、物体検出部104の物体検出処理により物体404と物体405が検出されたことを示している。
【0040】
図4(c)は、動体検出処理により検出された動体領域が属するブロックは安定背景時間が0に設定(リセット)されたことを示している。また
図4(c)が示す通り、動体領域でない領域に対するブロックの安定背景時間は一定時間ごとにインクリメントされ、初期値の0から9に増加している。
【0041】
図4(d)は、物体検出処理により検出された動体情報から算出されたスコアによって時間閾値が設定されたものを表している。本実施形態では標準の時間閾値は60に設定されている。物体404は人体と判定され、スコアの最大値が設定されたため、物体404がある領域の時間閾値は∞(無限大)に設定されている。一方で、物体405はイスと判定され、標準より低いスコアが設定されたため、物体405がある領域の時間閾値は9に設定されている。
【0042】
図4(e)は、
図4(c)で示す安定背景時間と時間閾値の比較結果に基づいて更新された背景画像を示している。イス402の領域の安定背景化時間が9になり、その領域の時間閾値9に達したためイスの領域の部分画像が背景画像として合成(背景化)されている。それ以外の領域は時間閾値に達していないため、以前の背景画像(
図3(e))のままである。
【0043】
次に、画像比較部107による保護領域情報の生成方法について説明する。保護領域情報とは、画像内の保護対象の位置と形状を示す情報である。本実施形態では、特にプライバシーが保護されるべき領域を保護領域としている。
【0044】
画像比較部107は、画像取得部102から取得した取得画像から輝度成分を抽出し輝度画像を生成すると共に、背景更新部106から取得した背景画像から同様に輝度画像を生成する。そして、画像比較部107は、取得画像に基づく輝度画像と、背景画像に基づく輝度画像とのピクセル単位(画素毎)での差分の絶対値からなる差分画像を生成する。そして、画像比較部107は、差分画像のピクセル(画素)のうち、所定の閾値よりも大きい差分値を有するピクセルを保護対象ピクセルとして決定する。そして、画像比較部107は、隣接する保護対象ピクセル同士を結合し、ある面積(画素数)以上の領域を保護領域として特定し、保護領域の位置と形状を示す保護領域情報を生成する。
【0045】
図3(f)と
図4(f)は、
図3(d)と
図4(d)背景画像と
図3(a)と
図4(a)取得画像とに基づいて生成された保護領域情報に対応する保護領域を示している。
図3(f)には保護領域が無いことを示しており、
図4(f)は保護領域として人物401に対応する領域についてプライバシーを保護する必要がある領域であることを示している。画像合成部108は、背景画像の保護領域情報が示す保護領域に所定の画像を合成して得られる保護画像を生成する。なお、所定の画像とは、例えば保護領域情報により特定される位置及び形状に対応する保護領域について一色の画像で塗りつぶす等して匿名性を高めるように生成(匿名化)したシルエット画像である。すなわち、画像合成部108は、背景画像の生成後(更新後)に、取得された処理対象画像と背景画像との比較に応じた特定領域(保護領域)を保護画像(隠蔽画像)とする画像処理を実行する(シルエット化とも称す)。
【0046】
図3(g)と
図4(g)は、
図3(e)と
図4(e)の背景画像と
図3(f)と
図4(f)の保護領域情報とに基づいて画像合成部108が生成した保護画像である。
図4の(f)に示される通り、早く背景化されるべきイスは背景化して実物が見えており、プライバシー保護されるべき人体は顔を含む全身(もしくは一部)が隠蔽される等して個人が判別できないように匿名化されている。
【0047】
次に、本実施形態の画像処理装置101の処理の流れを説明する。
図5は、本実施形態の画像処理装置101の動作を説明するためのフローチャートである。画像処理装置101のCPU201は、
図5の処理に係るプログラムをROM202やRAM203から読み出して実行することにより、
図5の処理を実現する。本実施形態の画像処理装置101は、利用者によるプライバシー保護処理の開始指示に応じて、
図5の処理を開始する。ただし、
図5の処理の開始タイミングは上記の例に限らない。例えば、展示会の画像については重要人物が写るタイミング等があらかじめ分かっていれば所定の時刻(VIPタイム)になったことをトリガーとして処理を開始してもよいし、駅構内や店舗の画像については営業時間に入ったことをトリガーとして処理を開始してもよい。
【0048】
まず、画像取得部102は画像出力装置120から送信される画像を、ネットワーク110を介して取得する(S101)。画像出力装置120が撮像装置である場合は撮像画像をリアルタイムで取得し、画像出力装置120が録画装置である場合は録画済みの録画画像(録画映像)を取得する。画像の取得方法は他の方法でも構わないし、画像がH.264やJPEGやHEVC、HEIFなどの既知の符号化方式で圧縮されている場合は画像取得部102が復号化するようにしてもよい。
【0049】
動体検出部103は、画像取得部102で取得された画像(取得画像)についてRAM203に保持している背景画像に基づいて背景差分法により動体の検出処理を行い、物体検出部104は、画像内の特徴量に基づいて物体検出処理を行う(S102)。すなわち、動体検出部103は、画像間(取得画像と背景画像)の差分に基づいて動体領域(前景領域)を検出し、検出により得られる動体情報(動体の中心座標(位置情報)と外接矩形(形状情報))を背景更新部106に送信する。また、物体検出部104は、画像内の特徴に基づいて物体領域を検出し、検出により得られる物体情報(物体の中心座標(位置情報)と外接矩形(形状情報)とスコア)を背景更新部106に送信する。
【0050】
背景更新部106は、動体情報と物体情報に基づいて背景画像の更新処理(生成処理)を行う(S103)。より具体的には、背景更新部106は、新しく物体領域として検出されたブロックに、対応する時間閾値の値を設定し、動体領域として検出されなかったブロックに対応する安定背景時間の値を、一定時間ごとにインクリメントする。インクリメントの結果、取得画像のうち安定背景時間の値が閾値以上になったブロックの位置に対応する部分画像を用いて、背景画像についてこのブロックに対応する位置の画素値を置き変えることで更新する。なお、更新は画素値を100%置き変える方法以外に、背景画像の画素値に所定の割合で合成(例えば、背景画像40%、取得画像の部分画像60%)するようにしてもよい。そして、背景更新部106は、更新後の背景画像をRAM203に保存するとともに画像比較部107に送信する。なお、本実施形態では安定背景時間をブロック毎に管理する例を中心に説明しているが、ブロックのサイズ、および形状は任意である。
【0051】
画像比較部107は、画像取得部102から取得した取得画像と、背景更新部106から取得した背景画像との比較に基づいて保護領域情報を生成する(S104)。そして、画像比較部107は、生成した保護領域情報を画像合成部108に送信する。
【0052】
画像合成部108は、背景更新部106から取得した背景画像と画像比較部107から取得した保護領域情報とに基づいて保護画像を生成する(S105)。より具体的には、画像合成部108は、取得画像(撮像画像、録画画像)のうち、保護領域情報が示す保護領域に対応する位置の部分画像に隠蔽処理を実施する。そして、画像合成部108は、隠蔽処理済みの画像(マスク画像、シルエット画像)を背景画像に合成して保護画像を生成する。画像合成部108は、生成した保護画像を出力部109経由でディスプレイに表示させたり、他の外部装置に出力したりする。
【0053】
出力部109は、例えば保護画像を表示させる(S106)。すなわち、出力部109は、背景画像の生成後(更新後)に、取得された取得画像(処理対象画像)と背景画像との比較に応じた保護領域(特定領域)が隠蔽画像となった保護画像を表示させる。例えば、画像処理装置101がPCである場合、ディスプレイで保護画像が表示されることになる。
【0054】
ステップS106の処理が完了すると、
図6の処理を継続するか終了するかが判定され(S107)、継続する場合にはS101に戻る。
【0055】
図6は本実施形態のパラメータ設定部105として動作するGUI(グラフィカル・ユーザー・インターフェース)の一例であり、画像処理装置101のCPU201が所定のプログラムをRAM203から読み出して表示デバイス207に表示することで実現する。ウィンドウ600は物体検出部104が検出処理を実行するためのパラメータを設定するためにユーザからの指示を受け付けるGUI(受付手段)であり、オブジェクト毎または特徴毎に時間閾値(背景化時間)を設定することができる。ID606の横に並ぶ欄601~欄605の条件はアンド条件(欄601~欄605の条件の全てを満たしたときに成立する条件)となる。欄601は設定対象の物体の種類や領域識別子を示し、ユーザはプルダウンで選択したり自由にテキスト入力したりする。欄602は欄601で設定している物体の種類や領域識別子に対応する時間閾値(背景化するかどうかを判断する閾値)である。
【0056】
欄603は形状認識をするか否か、および形状認識のパターンマッチングに用いるパターン画像を設定できる。空欄をユーザがクリックすると、画像処理装置101や外部に保持しているファイルを参照したり、ユーザが描画して概略のパターンを設定したりすることができる。欄604は色認識をするか否か、色認識に用いる画素値(例えば、RGB画素値)を設定できる。空欄をユーザがクリックすると、不図示のカラーパレットを表示させたり、画像取得部102の取得した画像(撮像画像、録画画像)の中で色を指定するスポイトツールを起動したりする。欄605は、更に距離測定をするか否か、およびその距離を設定できる。
【0057】
ID606は時間閾値に関わる各エントリにユニークな値であって、本実施形態ではIDの大きい条件がIDの小さい条件よりも優先される。ボタン607をユーザが押下すると画像取得部102の取得した画像(撮像画像、録画画像)が別ウィンドウで立ち上がりその中でユーザが矩形描画ツール(マウスによるドラッグ開始位置と終了位置を矩形の左上と左下とする)を用いて時間閾値を設定する領域の位置とサイズを設定する。
【0058】
ユーザが、ボタン608を押下することでパラメータ設定部105はウィンドウ600で設定した内容をパラメータとして物体検出部104や背景更新部106に設定する(ボタン609の押下により条件を破棄してもよい)。パラメータ設定部105から設定されるパラメータの詳細は、物体検出部104が検出処理を実行するためのパラメータ(検出する形状パターンや色、距離)や、背景更新部106が背景を更新するためのパラメータ(時間閾値と対象プロック)である。
【0059】
ここで、
図6の各設定について説明を補足する。ID606が「6」の条件は、領域Bについて時間閾値を0に設定している。時間閾値を「0秒」に設定した画像領域は常に背景画像と比較画像が一致するので、保護領域になることはない(シルエット化されない)。例えば、駅構内に設置した監視カメラで線路を含む画角で撮像した撮像画像について、線路上についてはプライバシー保護よりも安全性を重視する必要があるので、この設定を利用すればよい。
【0060】
ID606が「5」の条件は時間閾値が「無限(秒)」に設定されているので、常に保護領域になる(シルエット化される)。また、ID606が「4」の条件は距離が2m以下の被写体についてプライバシーを保護する度合が高いとして時間閾値「600秒」を設定している。また、ID606が「3」の条件は「上半身の形状特徴」に基づいてパターンマッチングし検出した領域について、「人体」であるためプライバシーを保護する度合が高いオブジェクトとして時間閾値「600秒」を設定している。ID606が「2」の条件は、色が「黒」で「イス上部の形状特徴」に基づいて検出した領域について、「イス」であるためプライバシーを保護する度合が低いオブジェクトとして時間閾値「20秒」を設定している。イス以外であっても、机や会議室の備品なども同様に適用できる。ID606が「1」の条件は、ID606が「2から6」の条件に当てはまらない領域について標準の時間閾値「60秒」を設定している。
【0061】
以上の説明の通り、本実施形態によれば画像処理装置101は複数の検出部(動体検出部103と物体検出部104)を用いて背景画像を生成し、更新する。その際に、物体の特性毎に背景化する時間閾値を設定できるので、物体の特性毎にプライバシーを保護する対象であるか設定しておけばプライバシーがより保護されやすくなる。具体的には、プライバシー保護の対象が背景画像に含まれにくくなり、保護対象でないものは保護画像に含まれやすくなる。
【0062】
なお、
図6のID「6」の条件のように時間閾値に「0」を設定した領域について、次の3つのパターンのいずれかで表示する様に、
図6のウィンドウ600で切り替えるように設定できるようにしてもよい。1つ目は「そのまま背景画像を表示する」形態であり、この場合は撮像画像や録画画像がそのまま表示される。2つ目は「最初の画像のまま固定する」形態であり、
図3(a)に相当する画像が表示される。3つ目は「ぼかし画像にする」形態であり、この場合は、時間閾値に「0」を設定した領域についてぼかし処理や、モザイク処理などを行った画像を表示する。
【0063】
なお、上述の実施形態では背景更新部106が更新した背景画像を画像合成部108が保護画像の生成に利用しているが、画像合成部108が保護画像の生成に用いる背景画像を別途設定するようにしてもよい。
【0064】
図7は、背景画像を設定するためのGUI(グラフィカル・ユーザー・インターフェース)の一例であり、画像処理装置101のCPU201が所定のプログラムをRAM203から読み出して表示デバイス207にウィンドウ700を表示する。
【0065】
領域701は動体検出部103や背景更新部106に関わる設定をする箇所である。ここでは、「任意の画像」か、上述した背景画像を「自動更新」するかの一方を選択できる。任意の画像を選択した場合は、設定ボタンを押下しユーザが画像処理装置101や外部装置から所定の画像ファイルを参照して設定する。設定した画像の縮小画像も領域701に表示される。
【0066】
一方で、背景画像を「自動更新」にした場合、「人体検出オプション」のチェックボックスを切り替えることで、物体検出部104の利用の有無をユーザが設定することもできる。
図7の例では人体検出を「OFF」に設定しているので、その分、パターンマッチングの処理負荷が軽減される。また、背景画像を「自動更新」にした場合、画像取得部102が「撮像画像」から画像を取得するか「録画画像」から画像を取得するかを選択できる。これは、
図1(b)に示すように、ネットワーク110上に撮像装置120と録画装置120の両方が存在するときに、画像のソースを選択することができる。録画装置120を選択した場合は、録画装置の保持している映像データのうち対象とするフレームを開始時間と長さで指定することができる。
【0067】
領域702は画像合成部108が利用する背景画像を設定する箇所である。ここでは、任意の画像ファイルを設定するための「設定」ボタンや撮像装置120で撮像しているライブ画像を直接的に背景画像として設定するための「ライブ画像を設定」ボタンがある。また、領域701で設定した背景画像をそのまま利用するようにする設定もできる。
【0068】
領域設定703は、領域701で自動更新する背景画像に関する設定箇所で、設定ボタンを押下することにより、
図6で示したウィンドウ600を表示させる。領域704は、領域701から領域703の設定を反映するカメラをユーザが選択できる。ネットワーク110上に複数の監視カメラがある場合でも簡易に同様の設定をすることができる。「ファイル出力間隔」は、画像合成部108が保護画像に対応する画像ファイル(JPEGやHEIF)を外部メモリ204の所定の箇所に書き込む間隔を示す設定である。画像合成部108は保護画像の配信と並行して画像ファイルを保存することができる。「ファイル数上限」は外部メモリ204で保持する上限の画像ファイルの個数に関する設定であり、1から60480の間で整数値を設定することができ、上限に達すると古いファイルから上書きされていく。
【0069】
また、上述の実施形態では時間閾値を更新する(上書き)点について説明を省略しているが、例えば、動体検出部103や物体検出部104の検出タイミングと同等、もしくは、より長い時間をとってもよい。例えば、画像出力部120が60fps、Full HDで画像を撮像する際に、画像取得部102は10fps、Full HDの撮像画像を取得し、取得した撮像画像を動体検出部103と物体検出部104に提供する。そして、背景更新部106は、処理を開始した時点では10fpsで入力される撮像画像について毎フレームで時間閾値を更新する処理をする。具体的には、動体検出部103や物体検出部104が以前のフレームと同様の検知をした領域については、インクリメントしたスコア(安定背景時間)を維持する。一方で、動体検出部103や物体検出部104が以前のフレームと異なる検知をした領域については、インクリメントしたスコアを0にリセットし、検知内容に基づいて新しい時間閾値を設定する。なお、背景更新部106は何フレームかに1回更新するようにして処理負荷を軽減させてもよい。このトリガはユーザ指定や、動体検出部103や物体検出部104が所定時間、物体や一定面積以上の動体を検知しなかった事とする。
【0070】
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するソフトウェア(プログラム)を、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサー(CPUやMPU等)がプログラムを読出し実行する処理である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【符号の説明】
【0071】
101 画像処理装置
102 画像取得部
103 動体検出部
104 物体検出部
105 パラメータ設定部
106 背景更新部
107 画像比較部
108 画像合成部
109 出力部
120 画像出力装置