IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特開2024-138079プログラム、画像処理方法およびシステム
<>
  • 特開-プログラム、画像処理方法およびシステム 図1
  • 特開-プログラム、画像処理方法およびシステム 図2
  • 特開-プログラム、画像処理方法およびシステム 図3
  • 特開-プログラム、画像処理方法およびシステム 図4
  • 特開-プログラム、画像処理方法およびシステム 図5
  • 特開-プログラム、画像処理方法およびシステム 図6
  • 特開-プログラム、画像処理方法およびシステム 図7
  • 特開-プログラム、画像処理方法およびシステム 図8
  • 特開-プログラム、画像処理方法およびシステム 図9
  • 特開-プログラム、画像処理方法およびシステム 図10
  • 特開-プログラム、画像処理方法およびシステム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024138079
(43)【公開日】2024-10-07
(54)【発明の名称】プログラム、画像処理方法およびシステム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240927BHJP
   G06T 7/70 20170101ALI20240927BHJP
   H04N 7/18 20060101ALI20240927BHJP
【FI】
G06T7/00 660B
G06T7/00 660A
G06T7/70 A
G06T7/00 300F
H04N7/18 D
H04N7/18 K
【審査請求】有
【請求項の数】18
【出願形態】OL
(21)【出願番号】P 2024118752
(22)【出願日】2024-07-24
(62)【分割の表示】P 2022569776の分割
【原出願日】2021-11-11
(31)【優先権主張番号】P 2020206707
(32)【優先日】2020-12-14
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】平川 康史
(72)【発明者】
【氏名】油井 夏城
(57)【要約】
【課題】マスク領域に含まれる人物を適切にマスクする。
【解決手段】画像処理装置(10)は、画像データ取得部(111)、マスク領域設定部(112)、特定部(113)、身体推定部(117)、判定部(114)および処理部(115)を有する。画像データ取得部(111)は、カメラが撮影した所定の空間の画像データを取得する。マスク領域設定部(112)は、空間におけるマスク領域を設定する。特定部(113)は、画像データに含まれる人物の画像である人物画像を特定する。身体推定部(117)は、コンピュータは、人物画像に基づいて、人物の身体を推定する。判定部(114)は、人物画像にかかる人物の身体がマスク領域に含まれるか否かの判定を行う。処理部(115)は、判定手段による判定の結果に基づいて、人物をマスクする処理を行う。
【選択図】図1
【特許請求の範囲】
【請求項1】
第1の画像を取得する処理と、
画像に写った人物をマスクするためのマスク領域の範囲を受け付ける処理と、
前記第1の画像において、設定された前記マスク領域に含まれる人物をマスクする処理と
をコンピュータに実行させるプログラム。
【請求項2】
前記人物の頭部の位置を求める処理を更に前記コンピュータに実行させる
請求項1に記載のプログラム。
【請求項3】
前記第1の画像に写る物体の特徴量に基づいて、前記第1の画像に写る人物の位置を特定する処理を更に前記コンピュータに実行させ、
前記マスクする処理は、前記人物の位置に基づいてマスクすることを含む
請求項1に記載のプログラム。
【請求項4】
前記マスクする処理は、前記人物を塗りつぶす処理を含む
請求項1に記載のプログラム。
【請求項5】
前記マスクする処理は、前記第1の画像と前記第1の画像よりも前の時刻において撮影された第2の画像との差分に基づいて前記人物をマスクすることを含む
請求項1に記載のプログラム。
【請求項6】
前記第1の画像は、前記第2の画像が撮影されてから所定時間以内に取得された画像である
請求項5に記載のプログラム。
【請求項7】
コンピュータが、
第1の画像を取得し、
画像に写った人物をマスクするためのマスク領域の範囲を受け付け、
前記第1の画像において、設定された前記マスク領域に含まれる人物をマスクする処理を行う
画像処理方法。
【請求項8】
前記コンピュータが、更に、前記人物の頭部の位置を求める
請求項7に記載の画像処理方法。
【請求項9】
前記コンピュータが、更に、前記第1の画像に写る物体の特徴量に基づいて、前記第1の画像に写る人物の位置を特定し、
前記マスクする処理は、前記人物の位置に基づいてマスクすることを含む
請求項7に記載の画像処理方法。
【請求項10】
前記マスクする処理は、前記人物を塗りつぶす処理を含む
請求項7に記載の画像処理方法。
【請求項11】
前記マスクする処理は、前記第1の画像と前記第1の画像よりも前の時刻において撮影された第2の画像との差分に基づいて前記人物をマスクすることを含む
請求項7に記載の画像処理方法。
【請求項12】
前記第1の画像は、前記第2の画像が撮影されてから所定時間以内に取得された画像である
請求項11に記載の画像処理方法。
【請求項13】
カメラが撮影した画像を処理するためのシステムであって、
前記システムは、
第1の画像を取得する手段と、
画像に写った人物をマスクするためのマスク領域の範囲を受け付ける手段と、
前記第1の画像において、設定された前記マスク領域に含まれる人物をマスクする処理を行う手段と
を備えるシステム。
【請求項14】
前記人物の頭部の位置を求める手段を更に備える
請求項13に記載のシステム。
【請求項15】
前記第1の画像に写る物体の特徴量に基づいて、前記第1の画像に写る人物の位置を特定する手段を更に備え、
前記マスクする処理は、前記人物の位置に基づいてマスクすることを含む
請求項13に記載のシステム。
【請求項16】
前記マスクする処理は、前記人物を塗りつぶす処理を含む
請求項13に記載のシステム。
【請求項17】
前記マスクする処理は、前記第1の画像と前記第1の画像よりも前の時刻において撮影された第2の画像との差分に基づいて前記人物をマスクすることを含む
請求項13に記載のシステム。
【請求項18】
前記第1の画像は、前記第2の画像が撮影されてから所定時間以内に取得された画像である
請求項17に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像処理装置、画像処理方法および非一時的なコンピュータ可読媒体に関する。
【背景技術】
【0002】
撮像された画像の指定領域に含まれる人物をマスクする技術が開発されている。
【0003】
このような技術に関連して、例えば特許文献1には、監視カメラからの映像情報から人物画像を検出し、監視空間内に人物が足を踏み入れたか否かを判定する技術が記載されている。
【0004】
また特許文献2には、映像中の物体の一部が監視領域の範囲内に含まれるか否かの第1のステップの基準と、所定の第2のステップの基準を設定し、これらに合致するか否か判断することで、検知対象を検知する技術が記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】国際公開第2019/220589号
【特許文献2】国際公開第2014/118872号
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、画像に設定した指定領域内に含まれる人物をマスクする場合、カメラの位置や撮像対象の位置により、意図しない人物がマスク対象に含まれる場合があった。
【0007】
本開示はこのような課題を鑑みてなされたものであり、マスク領域に含まれる人物を適切にマスクする技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
本開示の1実施形態にかかる画像処理装置は、画像データ取得手段、マスク領域設定手段、特定手段、身体推定手段、判定手段および処理手段を有する。画像データ取得手段は、カメラが撮影した所定の空間の画像データを取得する。マスク領域設定手段は、空間におけるマスク領域を設定する。特定手段は、画像データに含まれる人物の画像である人物画像を特定する。身体推定手段は、人物画像に基づいて、人物の身体を推定する。判定手段は、人物画像にかかる人物の身体がマスク領域に含まれるか否かの判定を行う。処理手段は、判定手段による判定の結果に基づいて、人物をマスクする処理を行う。
【0009】
本開示の1実施形態にかかる方法は、以下の方法をコンピュータが実行する。コンピュータは、カメラが撮影した所定の空間の画像データを取得する。コンピュータは、空間におけるマスク領域を設定する。コンピュータは、画像データに含まれる人物の画像である人物画像を特定する。コンピュータは、人物画像に基づいて、人物の身体を推定する。コンピュータは、人物画像にかかる人物の身体がマスク領域に含まれるか否かを判定する。コンピュータは、判定結果に基づいて、人物をマスクする処理を行う。
【0010】
本開示の1実施形態にかかるプログラムは、コンピュータに、以下のステップを実行させるものである。コンピュータは、カメラが撮影した所定の空間の画像データを取得する。コンピュータは、空間におけるマスク領域を設定する。コンピュータは、画像データに含まれる人物の画像である人物画像を特定する。コンピュータは、人物画像に基づいて、人物の身体を推定する。コンピュータは、人物画像にかかる人物の身体がマスク領域に含まれるか否かを判定する。コンピュータは、判定結果に基づいて、人物をマスクする処理を行う。
【発明の効果】
【0011】
本開示によれば、マスク領域に含まれる人物を適切にマスクする画像処理装置等を提供することができる。
【図面の簡単な説明】
【0012】
図1】実施の形態1にかかる画像処理装置のブロック図である。
図2】実施の形態1にかかる画像処理方法を示すフローチャートである。
図3】実施の形態2にかかる画像処理システムのブロック図である。
図4】実施の形態2にかかる画像処理装置のブロック図である。
図5】実施の形態2にかかる画像処理装置のフローチャートである。
図6】実施の形態2にかかる画像処理装置が処理する画像の例を示す図である。
図7】実施の形態3にかかる画像処理システムのブロック図である。
図8】実施の形態3にかかる画像処理装置のフローチャートである。
図9】実施の形態3にかかる画像処理装置が処理する画像の例を示す図である。
図10】実施の形態3にかかる画像処理装置が処理する人物画像の例を示す図である。
図11】コンピュータのハードウェア構成を例示するブロック図である。
【発明を実施するための形態】
【0013】
以下、発明の実施の形態を通じて本発明を説明するが、特許請求の範囲にかかる発明を以下の実施形態に限定するものではない。また、実施形態で説明する構成の全てが課題を解決するための手段として必須であるとは限らない。説明の明確化のため、以下の記載および図面は、適宜、省略、および簡略化がなされている。なお、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
【0014】
<実施の形態1>
以下、図面を参照して本発明の実施の形態について説明する。図1は、実施の形態1にかかる画像処理装置10のブロック図である。図1に示す画像処理装置10は、所定の施設内または屋外に設置されたカメラに通信可能に接続して使用される。画像処理装置10は、画像データに対してマスク処理を行う機能を有している。マスク処理とは、画像の一部を抽出し、抽出した画像をマスクする処理である。本実施の形態における「マスクする処理」とは、例えば抽出した画像に対して行う処理と抽出しなかった画像に対して行う処理を異なるものとする処理である。本実施の形態における画像処理装置10は、撮影された画像データから所定の条件に応じて人物をマスクする処理をおこなう。画像処理装置10は主な構成として、画像データ取得部111、マスク領域設定部112、特定部113、判定部114および処理部115を有している。
【0015】
画像データ取得部111は、カメラが撮影した所定の空間の画像データを取得する。画像データ取得部111が接続するカメラは1台でもよいし複数でもよい。また画像データ取得部111が接続するカメラは所定の画角を撮影するために固定されていてもよいし、パン、チルトまたはズームを行う可動式のものであってもよい。画像データ取得部111は、カメラから取得した画像データを、適宜各構成に供給する。
【0016】
マスク領域設定部112は、画像データ取得部111が取得した画像データに対して、上記所定の空間におけるマスク領域を設定する。マスク領域は、画像内に設定される閉じた領域である。画像処理装置10は、所定の条件にしたがい、マスク領域に人物が存在すると判定する場合に、この人物をマスクする処理を行う。マスク領域設定部112は、予め定められた領域をマスク領域として設定してもよいし、画像処理装置10を使用するユーザの操作に応じてマスク領域を設定してもよい。またマスク領域設定部112は、所定の条件に応じてこの条件に対応したマスク領域を設定してもよい。マスク領域設定部112は、設定したマスク領域に関する情報を判定部114に供給する。
【0017】
特定部113は、画像データ取得部111が取得した画像データを受け取り、受け取った画像データに含まれる人物画像を特定する。人物画像とは、人物が含まれる画像である。特定部113は、例えば画像データに対して畳み込み処理を行うことにより人物画像の特徴量と一致する特徴量を有する領域を検索する。そして特定部113は人物画像の特徴量と一致する領域を人物画像と特定する。特定部113は、人物画像として特定した画像の領域に関する情報を、判定部114に供給する。
【0018】
判定部114は、画像データにおけるマスク領域に関する情報をマスク領域設定部112から受け取る。また判定部114は、画像データにおける人物画像の領域に関する情報を特定部113から受け取る。そして判定部114は、画像データ取得部111が取得した画像データに対して、人物画像がマスク領域に含まれるか否かを判定する。判定部114はこの判定の結果に関する情報として、判定結果を処理部115に供給する。
【0019】
処理部115は、判定部114から判定結果を受け取り、受け取った判定結果にしたがい、人物をマスクする処理を行う。人物をマスクする処理は、マスク処理にかかる人物画像に対する画像処理であってもよいし、マスク処理にかかる人物画像に対する演算処理であってもよい。例えば人物をマスクする処理は、マスク処理にかかる人物画像に対して行う塗りつぶしの処理や、背景差分による人物画像の除去などの画像処理であってもよい。また例えば人物をマスクする処理は、画像に含まれる人物の数を演算する際に、マスク処理にかかる人物を含まないなどの演算処理であってもよい。
【0020】
図2は、実施の形態1にかかる画像処理方法を示すフローチャートである。図2に示すフローチャートは、例えば画像処理装置10を起動することにより開始される。
【0021】
まず、画像処理装置10の画像データ取得部111は、カメラが撮影した所定の空間の画像データを取得する(ステップS11)。画像データ取得部111は、取得した画像データを画像処理装置10が有する各構成に適宜供給する。
【0022】
次に、マスク領域設定部112は、画像データの所定空間にマスク領域を設定する(ステップS12)。マスク領域設定部112は、マスク領域に関する情報を、判定部114に供給する。
【0023】
次に、特定部113は、画像データに含まれる人物の画像である人物画像を特定する(ステップS13)。特定部113は、特定した人物画像に関する情報を、判定部114に供給する。
【0024】
次に、判定部114は、人物画像がマスク領域に含まれるか否かを判定する(ステップS14)。人物画像がマスク領域に含まれると判定しない場合(ステップS14:NO)、画像処理装置10は、マスク処理を実行せずにフローチャートを終了する。人物画像がマスク領域に含まれると判定する場合(ステップS14:YES)、画像処理装置10は、ステップS15に進む。
【0025】
ステップS15において、処理部115は、判定結果にしたがい、マスク領域に含まれる人物をマスクする処理を行う(ステップS15)。処理部115がマスク処理を実行し終えると、画像処理装置10は、一連の処理を終了する。
【0026】
なお、上述の処理は、カメラから画像データが画像処理装置10に供給される度に実行されてもよい。また上述の処理において、ステップS12とステップS13との順序は逆でもよい。またステップS12とステップS13とは並行して行われてもよい。
【0027】
以上、実施の形態1にかかる画像処理装置について説明した。尚、画像処理装置10は、図示しない構成としてプロセッサ及び記憶装置を有するものである。画像処理装置10が有する記憶装置は、例えばフラッシュメモリやSSD(Solid State Drive)などの不揮発性メモリを含む記憶装置を含む。この場合に、画像処理装置10が有する記憶装置は、上述の画像処理方法を実行するためのコンピュータプログラム(以降、単にプログラムとも称する)を記憶している。またプロセッサは、記憶装置からコンピュータプログラムをDRAM(Dynamic Random Access Memory)等のバッファメモリへ読み込ませ、当該プログラムを実行する。
【0028】
画像処理装置10が有する各構成は、それぞれが専用のハードウェアで実現されていてもよい。また、各構成要素の一部又は全部は、汎用または専用の回路(circuitry)、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。また、プロセッサとして、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)等を用いることができる。なお、ここに説明した構成に関する説明は、本開示において以下に説明するその他の装置またはシステムにおいても、適用され得る。
【0029】
また、画像処理装置10の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。また、画像処理装置10の機能がSaaS(Software as a Service)形式で提供されてもよい。
【0030】
以上、実施の形態1について説明した。実施の形態1にかかる画像処理装置10は、画像データから人物画像を特定し、特定した人物画像がマスク領域に含まれる場合にマスク処理を行う。よって、実施の形態1によれば、マスク領域に含まれる人物を適切にマスクする画像処理装置等を提供することができる。
【0031】
<実施の形態2>
次に、実施の形態2について説明する。図3は、実施の形態2にかかる画像処理システム1のブロック図である。図3に示す画像処理システム1は、画像処理装置20、ディスプレイ200およびカメラ300を含む。
【0032】
画像処理装置20は、通信ネットワークであるネットワークN1を介してカメラ300と通信可能に接続し、カメラ300が生成した画像データを取得する。また画像処理装置20は、ディスプレイ200と通信可能に接続し、マスク処理の結果をディスプレイ200に表示する。ネットワークN1は、LAN(Local Area Network)であってもよいし、WAN(Wide Area Network)であってもよい。
【0033】
ディスプレイ200は、例えば液晶ディスプレイや有機エレクトロルミネッセンスを含む表示装置である。ディスプレイ200は、画像処理装置20と通信可能に接続し、画像処理装置20から画像データを受け取り、受け取った画像データを表示する。なお、図3に示した例において、画像処理装置20とディスプレイ200とはネットワークN1を介さずに接続しているが、ネットワークN1を介して接続していてもよい。ディスプレイ200に表示される画像を画像処理システム1のユーザが視認することにより、ユーザは、画像処理装置20が実行する画像処理の結果を把握できる。
【0034】
カメラ300は、施設900の所定の位置に固定されており、施設内の風景を撮影する。カメラ300は、ネットワークN1を介して画像処理装置20に通信可能に接続している。例えばカメラ300は1秒間に30フレームの画像を撮影し、撮影したこれらの画像にかかる画像データを画像データ取得部111に供給する。図に示すように、例えばカメラ300は点線により示した画角により人物P1、人物P2および人物P3が存在する風景を撮影し、画像データを生成して画像処理装置20に供給する。
【0035】
次に、図4を参照して画像処理装置20についてさらに説明する。図4は、実施の形態2にかかる画像処理装置20のブロック図である。画像処理装置20は、参照位置設定部116を有する点が、実施の形態1にかかる画像処理装置10と異なる。
【0036】
画像データ取得部111は、カメラ300から複数の画像データを取得する。複数の画像データとは、異なる時刻に撮影された画像データである。画像データ取得部111は例えば、毎秒30フレームのカメラから30分の1秒毎に、画像データを受け取る。
【0037】
本実施の形態におけるマスク領域設定部112は、カメラ300が撮影した空間における所定の高さに設定された仮想の水平面内にマスク領域を設定する。このとき所定の高さは例えばユーザにより設定され得る。またマスク領域設定部112は、画像データにかかる空間における床面を推定し、推定した床面にマスク領域を設定するものであってもよい。このような構成により、画像処理装置20は、ユーザがマスク領域の設定を行う際に、設定が容易になる。また後述の参照位置と組み合わせることにより、画像処理装置20は、人物が所定のマスク領域に侵入したか否かを容易に判定できる。
【0038】
本実施の形態における特定部113は、動いている人物の画像として人物画像を特定する。そのため、特定部113は、まず画像データ取得部111から異なる時刻に生成された複数の画像データを取得する。次に、特定部113は例えば、これら複数の画像データのそれぞれ対応する画素の差分を求める。これにより特定部113は、動いている物体の画像を検出する。さらに特定部113は、動いている物体の画像から人物画像を特定する。なお、特定部113が動いている人物の画像を特定する手法は、上述のものに限られない。例えば特定部113は、画像データ取得部111から受け取る画像データごとに人物画像を検出し、人物画像を検出した画像の前または後のフレームとの差分を求めることにより、動いている人物にかかる人物画像を検出してもよい。
【0039】
特定部113は、抽出した画像データが人物画像であることを同定するための学習器を介して人物画像を特定するものであってもよい。この場合、学習器は、抽出した画像データの特徴量を算出し、算出した特徴量が人物画像の特徴量と類似していることを検出するものであってもよい。このような学習器は、例えばHOG(Histograms of Oriented Gradients)やサポートベクターマシンを利用したものであってもよい。
【0040】
また特定部113は、多層構造のニューラルネットワークを含む学習器を介して人物画像を特定してもよい。この場合、特定部113は、深層学習を行った学習器を含むものであってもよい。なお、深層学習を行った学習器は、学習済みモデルとも称される。特定部113は、このような学習済みモデルを含むものであってもよいし、画像処理装置10の外部に存在する学習済みモデルと通信可能に接続する構造を有していてもよい。
【0041】
また特定部113は、人物の外側に接する外接矩形を特定するものであってもよい。すなわち特定部113は、人物画像を含む矩形画像を人物画像として特定する。この場合に特定部113は、カメラから取得した画像データにかかる所定の矩形画像を抽出し、抽出した矩形画像が人物画像であるか否かを判定する。これにより特定部113は、人物画像を特定する処理を簡素化または高速化できる。特定部113が外接矩形を特定する場合、判定部114は、外接矩形がマスク領域に含まれるか否かを判定する。
【0042】
本実施の形態における参照位置設定部116は、人物画像にかかる参照位置を設定する。参照位置設定部116は例えば、上記外接矩形の所定位置に参照位置を設定する。外接矩形の所定位置とは、例えば、矩形の下端中央位置である。また外接矩形の所定位置とは、例えば、矩形の中央位置である。参照位置を設定することにより、判定部114は、参照位置がマスク領域に含まれるか否かを判定できる。または参照位置を例えば人物画像の下端部に設定し、マスク領域を床面における所定の範囲に設定することにより、画像処理装置20は、人物が所定のマスク領域に侵入したか否かを容易に判定できる。なお、参照位置設定部116が設定する参照位置は、所定の範囲を有する領域であってもよいし、所定の位置の画素を指定するものであってもよい。また参照位置は1つでもよいし複数でもよい。
【0043】
本実施の形態における判定部114は、人物画像がマスク領域に含まれるか否かを判定する際に、例えば、外接矩形がマスク領域に含まれるか否かを判定してもよい。あるいは、本実施の形態における判定部114は、人物画像にかかる参照位置がマスク領域に含まれるか否かを判定してもよい。また判定部114は、ユーザの操作や所定の条件等により、このような判定の設定を行ってもよい。
【0044】
次に、図5を参照して、画像処理装置20が実行する処理について説明する。図5は、実施の形態2にかかる画像処理装置のフローチャートである。図5に示す例は、参照位置設定部116が設定した参照位置がマスク領域に含まれるか否かを判定するものである。図5に示すフローチャートは、ステップS13とステップS15との間における処理が、実施の形態1におけるフローチャートと異なる。
【0045】
ステップS13において、特定部113は、画像データに含まれる人物画像を特定する(ステップS13)。ここで特定部113は、外接矩形を人物画像として特定する。特定部113は、特定した人物画像に関する情報を、参照位置設定部116に供給する。
【0046】
次に、参照位置設定部116は、人物画像にかかる参照位置を設定する(ステップS21)。参照位置設定部116は、設定した参照位置に関する情報を判定部114に供給する。
【0047】
次に、判定部114は、人物画像に設定した参照位置がマスク領域に含まれるか否かを判定する(ステップS22)。参照位置がマスク領域に含まれると判定しない場合(ステップS22:NO)、画像処理装置20は、マスク処理を実行せずにフローチャートを終了する。参照位置がマスク領域に含まれると判定する場合(ステップS22:YES)、画像処理装置20は、ステップS15に進み、処理部115は、判定結果にしたがい、マスク領域に含まれる人物をマスクする処理を行う(ステップS15)。処理部115がマスク処理を実行し終えると、画像処理装置20は、一連の処理を終了する。
【0048】
次に、図6を参照して、画像処理装置20が処理する画像データの例について説明する。図6は、実施の形態2にかかる画像処理装置20が処理する画像の例を示す図である。図6には、画像201が示されている。画像201は、ディスプレイ200に表示される画像の例である。画像201は、カメラ300により撮影された施設900の風景であって、人物P1、人物P2および人物P3が歩いている状況が示されている。
【0049】
画像201には、マスク領域設定部112が設定した第1マスク領域240が太い二点鎖線により示されている。第1マスク領域240は、画像201にかかる空間における床面に設定されている。そのため図に示すように、第1マスク領域240は、画像にかかる空間の手前側(画像201の下方)の方が、画像にかかる空間の奥側(画像201の上方)よりも広く表示されている。マスク領域設定部112は、画像データ取得部111から受け取った画像データを解析して、このように、空間の奥行きを仮想的に設定できる。
【0050】
画像201に含まれる人物P1の画像は、第1人物画像210である。第1人物画像210は、人物P1の周囲に設定された外接矩形を含む。第1人物画像210の下端には、第1参照点211が示されている。同様に、人物P2の画像は、第2人物画像220であって、人物P2の周囲に設定された外接矩形および第2人物画像220の下端に設定された第2参照点221を含む。また人物P3の画像は、第3人物画像230であって、人物P3の周囲に設定された外接矩形および第3人物画像230の下端に設定された第3参照点231を含む。このように、図6に示す例において、特定部113は、人物を特定すると、外接矩形により人物画像を特定する。また参照位置設定部116は、外接矩形の下端中央部に参照位置を設定する。
【0051】
特定部113が人物画像を特定する際および外接矩形を設定する際に、特定部113は、例えば画像201を、畳み込み処理により所定の大きさの人物画像が存在するか否かを解析する。画像201は、例えば画像の左上が原点であり、左から右に向かう横方向がX軸であり、上から下に向かう縦方向がY軸である。この場合、例えば特定部113は、原点からXプラス方向に画像の解析処理を行い、右端まで処理が終わると、Y軸をプラス方向に移動させ、再び左端からXプラス方向に解析処理を行う。
【0052】
このとき特定部113は、画像201の奥行きに応じて、解析する際の矩形の大きさを変化させ得る。すなわち特定部113は、画像201の上側すなわち空間の奥側ほど比較的に小さいサイズにより人物画像の特定を行い、画像201の下側すなわち空間の手前側ほど比較的に大きいサイズにより人物画像の特定を行う。このような処理により、特定部113は、効率よく人物画像を特定できる。
【0053】
図6に示す例では、第1マスク領域240は、第1人物画像210を全く含まず、第2人物画像220の下部を含み、第3人物画像230の全体を含む。このような状況において、判定部114は、少なくとも第1人物画像210が第1マスク領域240に含まれると判定しない。
【0054】
判定部114の設定が外接矩形の全体を含む場合にマスク処理を行うものであった場合には、判定部114は第3人物画像230を第1マスク領域240に含むと判定する一方、第2人物画像220を第1マスク領域240に含むと判定しない。この場合、処理部115は、第3人物画像230に対してマスク処理を行う。
【0055】
判定部114の設定が参照位置を含む場合にマスク処理を行うものであった場合には、判定部114は第2人物画像220および第3人物画像230を第1マスク領域240に含むと判定する。この場合、処理部115は、第2人物画像220および第3人物画像230に対してマスク処理を行う。
【0056】
以上、実施の形態2について説明した。実施の形態2にかかる画像処理装置20は、所定の条件に従い、特定した人物画像がマスク領域に含まれるか否かを判定する。よって、実施の形態2によれば、マスク領域に含まれる人物を適切にマスクする画像処理装置等を提供することができる。
【0057】
<実施の形態3>
次に、実施の形態3について説明する。実施の形態3は、人物の身体を推定する機能を有する点が、上述の実施の形態と異なる。図7は、実施の形態3にかかる画像処理装置30のブロック図である。画像処理装置30は、上述の構成に加えて、身体推定部117を有する。
【0058】
身体推定部117は、特定部113が特定した人物画像を受け取り、受け取った人物画像から人物の身体を推定する。本実施の形態における「人物の身体」は、人物の身体を形成する主たる構造をモデル化したものをいう。
【0059】
例えば身体推定部117は、人物画像から人物の主たる関節の位置を推定する。またこの場合、身体推定部117は、推定した関節の位置から、関連する関節同士を結び、人物の姿勢を推定してもよい。
【0060】
また例えば身体推定部117は、人物画像から人物の主たる部位(頭部、胴体部、腕部、脚部など)の位置や姿勢を推定してもよい。またこの場合、身体推定部117は、推定した身体の姿勢の位置から、主たる部位同士を接続する関節点を推定してもよい。
【0061】
身体推定部117は、人物画像から、人物画像に含まれない人物の身体を補完して身体を推定してもよい。例えばカメラが撮影した人物の足元に任意の物体が存在する場合には、画像データに含まれる人物画像には、この人物の足元が含まれない。ここで、身体推定部117は、一般的な人間の身体における各部位の大きさの比率情報を記憶している。そのため、身体推定部117は、この比率情報を参照して人物画像における人物の身体を補完することができる。
【0062】
なお、身体推定部117は、人物画像における主たる部位の特徴量を算出して人物の姿勢を推定してもよい。また身体推定部117は、人物画像から姿勢を推定する場合に、所定の学習を行った学習済みモデルを利用してもよい。
【0063】
本実施の形態における判定部114は、人物の身体がマスク領域に含まれるか否かを判定するものであってもよい。この場合、判定部114は、人物の身体のうち、予め設定された部分がマスク領域に含まれるか否かを判定するものであってもよい。また判定部114は、参照位置設定部116が設定した参照位置がマスク領域に含まれるか否かを判定するものであってもよい。
【0064】
本実施の形態における参照位置設定部116は、人物の身体の情報を受け取り、受け取った身体の情報から、この人物における所定の部位に参照位置を設定するものであってもよい。例えば参照位置設定部116は、人物の足元に参照位置を設定するものであってもよい。より詳細には例えば、参照位置設定部116は、人物の右足と左足を結ぶ直線と人物の背骨に沿った直線との交点を含む参照位置を設定するものであってもよい。参照位置設定部116は、上述の内容に限られず、人物の所定の位置を参照位置に設定してもよい。
【0065】
本実施の形態におけるマスク領域設定部112は、複数のマスク領域を設定できる。また本実施の形態における判定部114は、複数のマスク領域が設定された場合において、それぞれのマスク領域に対して個別の条件により人物画像が含まれるか否かを判定できる。すなわち、マスク領域設定部112が例えば、第1マスク領域と、第1マスク領域と異なる第2マスク領域とを設定した場合において、判定部114は、第1マスク領域に対しては所定の第1条件により人物画像が第1マスク領域に含まれるか否かを判定する。また判定部114は、第2マスク領域に対しては第1条件と異なる第2条件により人物画像が第2マスク領域に含まれるか否かを判定する。
【0066】
次に、図8を参照して実施の形態3にかかる画像処理方法について説明する。図8は、実施の形態3にかかる画像処理装置のフローチャートである。図8に示すフローチャートは、ステップS13とステップS21との間に、ステップS31が存在する点が、図5において説明したフローチャートと異なる。
【0067】
ステップS13において、特定部113は、画像データに含まれる人物画像を特定する(ステップS13)。特定部113は、特定した人物画像に関する情報を、身体推定部117に供給する。
【0068】
次に、身体推定部117は、受け取った人物画像に関する情報から、人物の身体を推定する(ステップS31)。身体推定部117は、人物の身体の推定に関する情報を、参照位置設定部116に供給する。
【0069】
参照位置設定部116は、身体推定部117から受け取った情報から、人物画像にかかる参照位置を設定する(ステップS21)。参照位置設定部116は、設定した参照位置に関する情報を判定部114に供給する。
【0070】
次に、判定部114は、人物の身体にかかる参照位置がマスク領域に含まれるか否かを判定する(ステップS22)。参照位置がマスク領域に含まれると判定しない場合(ステップS22:NO)、画像処理装置30は、マスク処理を実行せずにフローチャートを終了する。参照位置がマスク領域に含まれると判定する場合(ステップS22:YES)、画像処理装置30は、ステップS15に進み、処理部115は、判定結果にしたがい、マスク領域に含まれる人物をマスクする処理を行う(ステップS15)。処理部115がマスク処理を実行し終えると、画像処理装置30は、一連の処理を終了する。
【0071】
次に、図9を参照して、特定部113、参照位置設定部116および身体推定部117が行う処理の具体例について説明する。図9は、実施の形態3にかかる画像処理装置30が処理する人物画像の例を示す図である。
【0072】
図9は、人物P1にかかる3つの人物画像が処理の経過に沿って左から右の順に人物画像210A、人物画像210Bおよび人物画像210Cが示されている。人物画像210Aは、特定部113が画像データから人物を特定して設定した画像である。
【0073】
人物画像210Aの右側には、人物画像210Bが示されている。人物画像210Bは、人物画像210Aに第1身体画像212が重畳されている。身体推定部117は、人物画像210Bから人物P1の身体を推定して第1身体画像212を生成する。第1身体画像212は、複数の関節点を含む。また第1身体画像212は、2つの異なる関節点同士を接続する複数の直線を含む。
【0074】
参照位置設定部116は、第1身体画像212に含まれる関節点を参照位置として設定できる。例えば、参照位置設定部116は人物P1の右足関節点K1または左足関節点K2を参照位置に設定する。この場合、判定部114は、右足関節点K1または左足関節点K2がマスク領域に含まれるか否かを判定する。なお、参照位置設定部116は、複数の関節点を参照位置として設定してもよい。例えば参照位置設定部116は、人物P1の右足関節点K1および左足関節点K2を参照位置に設定してもよい。この場合、判定部114は、右足関節点K1と左足関節点K2の両方がマスク領域に含まれるか否かを判定する。すなわち参照位置設定部116は、上述の例に限らず、1つ以上の関節点を参照位置として設定できる。そして判定部114は、参照位置として設定された関節点がマスク領域に含まれるか否かを判定する。
【0075】
人物画像210Bの右側には、人物画像210Cが示されている。人物画像210Cは、人物画像210Bに第1参照点213が重畳されている。参照位置設定部116は、人物画像210Bを利用して第1参照点213を設定する。第1参照点213は、人物P1の足元に設定される参照位置である。
【0076】
参照位置設定部116は例えば、人物P1の右足関節点K1および左足関節点K2を結んだ直線L1の中点を、第1参照点213として設定する。また参照位置設定部116は例えば、人物P1の右足関節点K1と左足関節点K2とを結ぶ直線L1と人物P1の背骨に沿った直線L2との交点を、第1参照点213として設定する。この場合、判定部114は、人物P1の足元に設定された第1参照点213がマスク領域に含まれるか否かを判定する。
【0077】
次に、図10を参照して、画像処理装置30が行う処理にかかる画像の具体例を説明する。図10は、実施の形態3にかかる画像処理装置が処理する画像の例を示す図である。図10には、画像202が示されている。画像202は、図6と同様に、人物P1、人物P2および人物P3が歩いている状況が示されている。また画像202は、マスク領域設定部112が設定した第1マスク領域240が太い二点鎖線により示されている。さらに画像202は、マスク領域設定部112が設定した第2マスク領域250が太い一点鎖線により示されている。ここで、第1マスク領域240と第2マスク領域250とは、互いに重なり合う重複領域245を有している。
【0078】
画像202に含まれる人物P1の画像は、第1人物画像210Cである。第1人物画像210Cは、人物P1の周囲に設定された外接矩形を含む。また第1人物画像210Cは、図9において説明したように、第1身体画像212と第1参照点213とを含む。同様に、人物P2の画像は、第2人物画像220Cであって、人物P2の周囲に設定された外接矩形、第2身体画像222および第2参照点223を含む。また人物P3の画像は、第3人物画像230Cであって、人物P3の周囲に設定された外接矩形、第3身体画像232および第3参照点233を含む。
【0079】
図10に示す画像202において、マスク領域設定部112は、第1マスク領域240と、第2マスク領域250とを設定している。また判定部114は、第1マスク領域240に対しては第1条件により人物画像が第1マスク領域240に含まれるか否かを判定する。第1条件は、人物画像である外接矩形が第1マスク領域240に含まれることである。また、判定部114は、第2マスク領域250に対しては第1条件と異なる第2条件により人物画像が第2マスク領域250に含まれるか否かを判定する。第2条件は、人物画像にかかる参照位置が第2マスク領域250に含まれることである。
【0080】
図10における第1人物画像210Cは、第1条件にも第2条件にも合致しない。そのため、第1人物画像210Cはマスク処理の対象外である。第2人物画像220Cは、第1条件には合致しないが第2条件には合致する。また第3人物画像230Cは、第1条件には合致するが第2条件には合致しない。そのため、第2人物画像220Cおよび第3人物画像230Cは、マスク処理の対象である。処理部115は、第2人物画像220Cおよび第3人物画像230Cに対してマスク処理を実行する。
【0081】
以上、実施の形態3について説明した。画像処理装置30は、身体推定部117を有することにより、人物画像における人物の関節点や足元位置などを特定し、特定した位置がマスク領域に含まれるか否かを判定できる。よって、実施の形態3によれば、マスク領域に含まれる人物の身体の状況に対応したマスク処理を行う画像処理装置等を提供することができる。また画像処理装置30は、複数のマスク領域を設定し、設定したマスク領域ごとに異なる判定条件を設定できる。よって、実施の形態3によれば、マスク領域に対して好適に条件を設定できる画像処理装置等を提供することができる。
【0082】
<ハードウェア構成の例>
以下、本開示における画像処理装置の各機能構成がハードウェアとソフトウェアとの組み合わせで実現される場合について説明する。
【0083】
図11は、コンピュータのハードウェア構成を例示するブロック図である。本開示における画像処理装置は、図に示すハードウェア構成を含むコンピュータ500により上述の機能を実現できる。コンピュータ500は、スマートフォンやタブレット端末などといった可搬型のコンピュータであってもよいし、PCなどの据え置き型のコンピュータであってもよい。コンピュータ500は、各装置を実現するために設計された専用のコンピュータであってもよいし、汎用のコンピュータであってもよい。コンピュータ500は、所定のアプリケーションをインストールされることにより、所望の機能を実現できる。
【0084】
コンピュータ500は、バス502、プロセッサ504、メモリ506、ストレージデバイス508、入出力インタフェース(I/F)510およびネットワークインタフェース(I/F)512を有する。バス502は、プロセッサ504、メモリ506、ストレージデバイス508、入出力インタフェース510、及びネットワークインタフェース512が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ504などを互いに接続する方法は、バス接続に限定されない。
【0085】
プロセッサ504は、CPU、GPUまたはFPGAなどの種々のプロセッサである。メモリ506は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。
【0086】
ストレージデバイス508は、ハードディスク、SSD、メモリカード、又はROM(Read Only Memory)などを用いて実現される補助記憶装置である。ストレージデバイス508は、所望の機能を実現するためのプログラムが格納されている。プロセッサ504は、このプログラムをメモリ506に読み出して実行することで、各装置の各機能構成部を実現する。
【0087】
入出力インタフェース510は、コンピュータ500と入出力デバイスとを接続するためのインタフェースである。例えば入出力インタフェース510には、キーボードなどの入力装置や、ディスプレイ装置などの出力装置が接続される。
【0088】
ネットワークインタフェース512は、コンピュータ500をネットワークに接続するためのインタフェースである。
【0089】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
【0090】
上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
(付記1)
カメラが撮影した所定の空間の画像データを取得する画像データ取得手段と、
前記空間におけるマスク領域を設定するマスク領域設定手段と、
前記画像データに含まれる人物の画像である人物画像を特定する特定手段と、
前記人物画像に基づいて、前記人物の身体を推定する身体推定手段と、
前記人物画像にかかる前記人物の身体が前記マスク領域に含まれるか否かの判定を行う判定手段と、
前記判定手段による判定の結果に基づいて、前記人物をマスクする処理を行う処理手段と、を備える
画像処理装置。
(付記2)
前記画像データ取得手段は、異なる時刻に生成された複数の前記画像データを取得し、
前記特定手段は、前記複数の前記画像データに基づいて動いている前記人物の前記人物画像を特定する、
付記1に記載の画像処理装置。
(付記3)
前記特定手段は、抽出した前記画像データが前記人物画像であることを同定する学習器を介して前記人物画像を特定する、
付記1または2に記載の画像処理装置。
(付記4)
前記特定手段は、多層構造のニューラルネットワークを含む前記学習器を介して前記人物画像を特定する、
付記3に記載の画像処理装置。
(付記5)
前記特定手段は、前記人物の外側に接する外接矩形を特定し、
前記判定手段は、前記外接矩形が前記マスク領域に含まれるか否かを判定する、
付記1~4のいずれか一項に記載の画像処理装置。
(付記6)
前記人物画像にかかる参照位置を設定する参照位置設定手段をさらに備え、
前記参照位置設定手段は、前記外接矩形の所定位置に前記参照位置を設定し、
前記判定手段は、前記参照位置が前記マスク領域に含まれるか否かを判定する、
付記5に記載の画像処理装置。
(付記7)
前記身体推定手段は、前記人物画像に基づいて、前記人物画像に含まれない前記人物の身体を補完して前記身体を推定する、
付記1に記載の画像処理装置。
(付記8)
前記人物画像にかかる参照位置を設定する参照位置設定手段をさらに備え、
前記参照位置設定手段は、前記身体の情報に基づいて、前記人物における所定の部位に前記参照位置を設定する、
付記7に記載の画像処理装置。
(付記9)
前記参照位置設定手段は、前記身体の情報に基づいて、前記人物の足元に前記参照位置を設定する、
付記8に記載の画像処理装置。
(付記10)
前記参照位置設定手段は、前記身体の情報に基づいて、前記人物の右足と左足を結ぶ直線と前記人物の背骨に沿った直線との交点を含む前記参照位置を設定する、
付記8に記載の画像処理装置。
(付記11)
前記身体推定手段は、前記人物画像に基づいて、前記人物の関節点を推定し、
前記参照位置設定手段は、所定の前記関節点を前記参照位置として設定する、
付記8に記載の画像処理装置。
(付記12)
マスク領域設定手段は、前記空間における所定の高さに設定された仮想の水平面内に前記マスク領域を設定する
付記1~11のいずれか一項に記載の画像処理装置。
(付記13)
前記マスク領域設定手段は、前記空間における床面を推定し、前記床面に前記マスク領域を設定する、
付記12に記載の画像処理装置。
(付記14)
前記マスク領域設定手段は、第1マスク領域と、前記第1マスク領域と異なる第2マスク領域とを設定し、
前記判定手段は、前記第1マスク領域に対しては所定の第1条件により前記人物画像が前記第1マスク領域に含まれるか否かを判定し、
前記第2マスク領域に対しては前記第1条件と異なる第2条件により前記人物画像が前記第2マスク領域に含まれるか否かを判定する、
付記1~13のいずれか一項に記載の画像処理装置。
(付記15)
コンピュータが、
カメラが撮影した所定の空間の画像データを取得し、
前記空間におけるマスク領域を設定し、
前記画像データに含まれる人物の画像である人物画像を特定し、
前記人物画像に基づいて、前記人物の身体を推定し、
前記人物画像にかかる前記人物の身体が前記マスク領域に含まれるか否かの判定を行い、
前記判定の結果に基づいて、前記人物をマスクする処理を行う、
画像処理方法。
(付記16)
カメラが撮影した所定の空間の画像データを取得する処理と、
前記空間におけるマスク領域を設定する処理と、
前記画像データに含まれる人物の画像である人物画像を特定する処理と、
前記人物画像に基づいて、前記人物の身体を推定する処理と、
前記人物画像にかかる前記人物の身体が前記マスク領域に含まれるか否かの判定を行う処理と、
前記判定の結果に基づいて、前記人物をマスクする処理を行う処理と、を備える画像処理方法を、コンピュータに実行させるプログラムが格納された非一時的なコンピュータ可読媒体。
【0091】
この出願は、2020年12月14日に出願された日本出願特願2020-206707を基礎とする優先権を主張し、その開示の全てをここに取り込む。
【符号の説明】
【0092】
1 画像処理システム
10 画像処理装置
20 画像処理装置
30 画像処理装置
111 画像データ取得部
112 マスク領域設定部
113 特定部
114 判定部
115 処理部
116 参照位置設定部
117 身体推定部
200 ディスプレイ
201 画像
210 第1人物画像
211 第1参照点
212 第1身体画像
213 第1参照点
220 第2人物画像
221 第2参照点
222 第2身体画像
223 第2参照点
230 第3人物画像
231 第3参照点
232 第3身体画像
233 第3参照点
240 第1マスク領域
250 第2マスク領域
300 カメラ
500 コンピュータ
900 施設
N1 ネットワーク
P1 人物
P2 人物
P3 人物
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11