IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 横河電機株式会社の特許一覧

特開2022-48889装置、システム、方法およびプログラム
<>
  • 特開-装置、システム、方法およびプログラム 図1
  • 特開-装置、システム、方法およびプログラム 図2
  • 特開-装置、システム、方法およびプログラム 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022048889
(43)【公開日】2022-03-28
(54)【発明の名称】装置、システム、方法およびプログラム
(51)【国際特許分類】
   G08B 25/00 20060101AFI20220318BHJP
   G08B 25/04 20060101ALI20220318BHJP
   H04N 7/18 20060101ALI20220318BHJP
【FI】
G08B25/00 510M
G08B25/04 E
H04N7/18 D
【審査請求】有
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2020154941
(22)【出願日】2020-09-15
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.SMALLTALK
(71)【出願人】
【識別番号】000006507
【氏名又は名称】横河電機株式会社
(74)【代理人】
【識別番号】110000877
【氏名又は名称】龍華国際特許業務法人
(72)【発明者】
【氏名】小嶋 修
(72)【発明者】
【氏名】和田 篤士
【テーマコード(参考)】
5C054
5C087
【Fターム(参考)】
5C054CA04
5C054CC02
5C054FE28
5C054HA19
5C087AA02
5C087AA19
5C087BB02
5C087BB20
5C087BB74
5C087DD03
5C087EE07
5C087EE14
5C087FF01
5C087FF02
5C087FF19
5C087GG02
5C087GG08
5C087GG10
5C087GG17
5C087GG83
(57)【要約】      (修正有)
【課題】監視カメラを用いた種々の警備システムにおける装置、システム、方法およびプログラムを提供する。
【解決手段】警備システムにおいて、装置1は、出力の可能な監視カメラが撮影した画像に基づいて、被写体についての異常の可能性を判定する判定部41と、異常の可能性があると判定したことに応じて、被写体に対して音声を発することを監視カメラに指示する指示部43と、音声に対する被写体の反応を監視カメラから取得する取得部44と、音声に対する被写体の反応に基づいて、被写体を異常または正常と検知する検知部45と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
音声出力の可能な監視カメラが撮影した画像に基づいて、被写体についての異常の可能性を判定する判定部と、
異常の可能性があると判定されたことに応じて、前記被写体に対して音声を発することを前記監視カメラに指示する指示部と、
前記音声に対する前記被写体の反応を前記監視カメラから取得する取得部と、
前記音声に対する前記被写体の反応に基づいて、前記被写体を正常または異常と検知する検知部と
を備える装置。
【請求項2】
前記検知部により前記被写体が異常と検知されたことに応じ、前記監視カメラを介して当該装置のオペレータと前記被写体との間の通話を開始する通話処理部を備える、
請求項1に記載の装置。
【請求項3】
前記検知部により前記被写体が異常と検知されたことに応じてアラート信号を出力する出力部を備える、
請求項1または2に記載の装置。
【請求項4】
前記指示部は、前記音声として警報音を発することを前記監視カメラに指示する、
請求項1から3の何れか一項に記載の装置。
【請求項5】
前記指示部は、前記被写体に特定の動作を要求する前記音声を発することを前記監視カメラに指示する、
請求項1から4の何れか一項に記載の装置。
【請求項6】
前記検知部は、前記被写体が前記特定の動作を行わないことに応じて、前記被写体を異常と検知する、
請求項5に記載の装置。
【請求項7】
前記特定の動作は、前記監視カメラに近づく動作である、
請求項5または6に記載の装置。
【請求項8】
前記特定の動作は、前記監視カメラに向けて証明書を見せる動作である、
請求項5または6に記載の装置。
【請求項9】
前記検知部は、前記監視カメラにより撮影された前記証明書の内容に応じて前記被写体を異常と検知する、
請求項8に記載の装置。
【請求項10】
前記検知部は、前記監視カメラを介して前記被写体に対して前記音声を発して前記音声に対する前記被写体の反応を取得する処理を前記指示部および前記取得部が複数回繰り返した結果に基づいて前記被写体を異常または正常と検知する、
請求項1から9の何れか一項に記載の装置。
【請求項11】
前記検知部は、前記監視カメラによる監視領域に対して前記被写体が立ち入り権限を有しないことに応じて当該被写体を異常と検知し、当該被写体が故意または過失の何れにより前記監視領域に入ったかを更に検知する、請求項1から10の何れか一項に記載の装置。
【請求項12】
前記指示部は、
監視カメラから取得される被写体の画像または音声の少なくとも一方と、当該被写体に対して警備員が発した音声とを含む学習データを用いて学習処理が行われたモデルであって、被写体の画像または音声の少なくとも一方が入力されることに応じて、被写体に対して発するべき音声に対応する信号を出力するモデルを用いて、前記監視カメラに発生させる音声を決定する、
請求項1から11の何れか一項に記載の装置。
【請求項13】
請求項1から12の何れか一項に記載の装置と、
撮影した画像を前記装置に供給する監視カメラと、
を備えるシステム。
【請求項14】
音声出力の可能な監視カメラが撮影した画像に基づいて、被写体についての異常の可能性を判定する判定段階と、
異常の可能性があると判定されたことに応じて、前記被写体に対して音声を発することを前記監視カメラに指示する指示段階と、
前記音声に対する前記被写体の反応を前記監視カメラから取得する取得段階と、
前記音声に対する前記被写体の反応に基づいて、前記被写体を異常または正常と検知する検知段階と
を備える方法。
【請求項15】
コンピュータを、
音声出力の可能な監視カメラが撮影した画像に基づいて、被写体についての異常の可能性を判定する判定部と、
異常の可能性があると判定されたことに応じて、前記被写体に対して音声を発することを前記監視カメラに指示する指示部と、
前記音声に対する前記被写体の反応を前記監視カメラから取得する取得部と、
前記音声に対する前記被写体の反応に基づいて、前記被写体を異常または正常と検知する検知部
として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、装置、システム、方法およびプログラムに関する。
【背景技術】
【0002】
従来、監視カメラを用いた種々の警備システムが提案されている(例えば、特許文献1参照)。
[特許文献1] 特開2015-162232号公報
【発明の概要】
【0003】
本発明の第1の態様においては、装置が提供される。装置は、音声出力の可能な監視カメラが撮影した画像に基づいて、被写体についての異常の可能性を判定する判定部を備えてよい。装置は、異常の可能性があると判定されたことに応じて、被写体に対して音声を発することを監視カメラに指示する指示部を備えてよい。装置は、音声に対する被写体の反応を監視カメラから取得する取得部を備えてよい。装置は、音声に対する被写体の反応に基づいて、被写体を異常と検知する検知部を備えてよい。
【0004】
装置は、検知部により被写体が異常と検知されたことに応じ、監視カメラを介して当該装置のオペレータと被写体との間の通話を開始する通話処理部を備えてよい。
【0005】
装置は、検知部により被写体が異常と検知されたことに応じてアラート信号を出力する出力部を備えてよい。
【0006】
指示部は、音声として警報音を発することを監視カメラに指示してよい。
【0007】
指示部は、被写体に特定の動作を要求する音声を発することを監視カメラに指示してよい。
【0008】
検知部は、被写体が特定の動作を行わないことに応じて、被写体を異常と検知してよい。
【0009】
特定の動作は、監視カメラに近づく動作であってよい。
【0010】
特定の動作は、監視カメラに向けて証明書を見せる動作であってよい。
【0011】
検知部は、監視カメラにより撮影された証明書の内容に応じて被写体を異常と検知してよい。
【0012】
検知部は、監視カメラを介して被写体に対して音声を発して音声に対する被写体の反応を取得する処理を指示部および取得部が複数回繰り返した結果に基づいて被写体を異常と検知してよい。
【0013】
検知部は、監視カメラによる監視領域に対して被写体が立ち入り権限を有しないことに応じて当該被写体を異常と検知し、当該被写体が故意または過失の何れにより監視領域に入ったかを更に検知してよい。
【0014】
指示部は、監視カメラから取得される被写体の画像または音声の少なくとも一方と、当該被写体に対して警備員が発した音声とを含む学習データを用いて学習処理が行われたモデルであって、被写体の画像または音声の少なくとも一方が入力されることに応じて、被写体に対して発するべき音声に対応する信号を出力するモデルを用いて、監視カメラに発生させる音声を決定してよい。
【0015】
本発明の第2の態様においては、システムが提供される。システムは、第1の態様の装置を備えてよい。システムは、撮影した画像を装置に供給する監視カメラを備えてよい。
【0016】
本発明の第3の態様においては、方法が提供される。方法は、音声出力の可能な監視カメラが撮影した画像に基づいて、被写体についての異常の可能性を判定する判定段階を備えてよい。方法は、異常の可能性があると判定されたことに応じて、被写体に対して音声を発することを監視カメラに指示する指示段階を備えてよい。方法は、音声に対する被写体の反応を監視カメラから取得する取得段階を備えてよい。方法は、音声に対する被写体の反応に基づいて、被写体を異常と検知する検知段階を備えてよい。
【0017】
本発明の第4の態様においては、プログラムが提供される。プログラムは、コンピュータを、音声出力の可能な監視カメラが撮影した画像に基づいて、被写体についての異常の可能性を判定する判定部として機能させてよい。プログラムは、コンピュータを、異常の可能性があると判定されたことに応じて、被写体に対して音声を発することを監視カメラに指示する指示部として機能させてよい。プログラムは、コンピュータを、音声に対する被写体の反応を監視カメラから取得する取得部として機能させてよい。プログラムは、コンピュータを、音声に対する被写体の反応に基づいて、被写体を異常と検知する検知部として機能させてよい。
【0018】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0019】
図1】本実施形態に係る警備システム1を示す。
図2】装置4の動作を示す。
図3】本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。
【発明を実施するための形態】
【0020】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0021】
[1.警備システム1]
図1は、本実施形態に係る警備システム1を示す。警備システム1は、監視カメラ2と、装置4とを備える。
【0022】
ここで本実施形態では一例として、監視カメラ2と装置4とは直接接続されてもよいし、通信ネットワークを介して接続されてもよい。通信ネットワークは、インターネット、広域ネットワーク(WAN)、ローカルエリアネットワーク等の各種ネットワークまたはその組み合わせを含んで構成されてよい。通信ネットワークは、有線および無線の少なくとも一方による接続ポイントを含んでよい。通信ネットワークは、インターネットなどの公衆回線から分離された専用回線により実現されてもよい。
【0023】
[1.1.監視カメラ2]
監視カメラ2は、監視領域の撮影を行い、撮影した画像を装置4に供給する。監視カメラ2は、常時、撮影を行って動画像(映像とも称する)データを生成してよい。一例として各監視カメラ2は30f/sで撮影を行ってよい。監視カメラ2は可視光のカメラであってもよいし、赤外線や紫外線(一例としてX線)のカメラであってもよい。監視カメラ2は、撮影した動画像データを内部の記憶領域(図示せず)に記憶してもよい。
【0024】
監視カメラ2は、スピーカ20を有してよく、音声出力が可能であってよい。例えば、スピーカ20は、装置4からの指示に応じて音声を出力してよい。本実施形態においては一例として、音声とは、言語音(声とも称する)であってよい。
【0025】
また、監視カメラ2は、マイク21を有してよい。この場合、監視カメラ2により撮影される動画像データには、音声データが結合されてよい。また、監視カメラ2は、被写体の発する音声をマイク21によって電気信号に変換し、装置4に供給してよい。
【0026】
なお、被写体は人であってもよいし、野生動物や家畜などの動物であってもよいし、自動車や自転車などの車両であってもよい。
【0027】
監視カメラ2は、道路や駐車場、街灯、電柱に配置されてもよいし、設備の出入り口や通路などに配置されてもよい。設備は、プラントでもよいし、学校や住宅、駅、空港、博物館、病院、店舗(一例として飲食店)などであってもよいし、テーマパークや遊園地、それらのアトラクション用施設などであってもよい。プラントとしては、化学やバイオ等の工業プラントの他、ガス田や油田等の井戸元やその周辺を管理制御するプラント、水力・火力・原子力等の発電を管理制御するプラント、太陽光や風力等の環境発電を管理制御するプラント、上下水やダム等を管理制御するプラント等が挙げられる。設備の出入り口とは、設備の内側と外側との境界に設けられた出入り口であってもよいし、設備内の一の領域と他の領域との境界に設けられた出入り口であってもよい。
【0028】
[1.2.装置4]
装置4は、監視カメラ2と協働して設備の警備を支援する。装置4は、通信部40と、判定部41と、モデル42と、指示部43と、取得部44と、検知部45と、通話処理部46と、出力部47とを有する。
【0029】
[1.2.1.通信部40]
通信部40は、監視カメラ2と装置4の各部との間で通信を行う。
【0030】
[1.2.2.判定部41]
判定部41は、監視カメラ2が撮影した画像に基づいて、被写体についての異常の可能性を判定する。例えば、判定部41は、異常の可能性の有無を判定してよい。判定部41は、異常の可能性があると判定したことに応じて、その旨を示す信号を指示部43に供給してよい。判定部41は、異常の可能性があると判定したことに応じて、その判定の元となった画像をさらに指示部43に供給してよい。
【0031】
なお、被写体の異常とは、一例として、被写体が道に迷っていることであってもよいし、体調が悪いことであってもよいし、監視カメラ2の監視領域に不正に侵入していることであってもよい。
【0032】
[1.2.3.モデル42]
モデル42は、被写体の画像または音声の少なくとも一方が入力されることに応じて、当該被写体に対して発するべき音声に対応する信号を出力する。被写体に対して発するべき音声は、被写体が正常であるか異常であるかを識別し得る反応を被写体に生じさせる音声であってよい。また、被写体に対して発するべき音声は、被写体が監視カメラ2の監視領域に立ち入り権限を有するか否かを識別し得る反応を被写体に生じさせる音声であってもよい。また、被写体に対して発するべき音声は、被写体が立ち入り権限を持たない監視領域に故意または過失の何れにより入ったかを識別し得る反応を被写体に生じさせる音声であってもよい。発するべき音声に対応する信号は、音声の内容を示す識別番号であってもよいし、音声をテキスト化したテキストデータであってもよい。
【0033】
モデル42は、監視カメラ2から取得される被写体の画像または音声の少なくとも一方と、当該被写体に対して警備員が発した音声とを含む学習データを用いて学習処理が行われていてよい。
【0034】
なお、モデル42は、入力される画像や音声を解析する解析部と、解析結果に応じて推奨する音声を出力する機械学習アルゴリズムとを有してよい。解析部は、被写体の画像から被写体の動作、または、被写体の外観の特徴の少なくとも1つを検出してもよいし、被写体や警備員の音声を音声認識してテキスト化し、当該テキストを形態素解析して複数の形態素を検出してもよい。機械学習アルゴリズムは、本実施形態では一例としてリカレント型またはタイムディレイ型などのニューラルネットワークであるが、ランダムフォレスト、勾配ブースティング、ロジスティック回帰、および、サポートベクタマシン(SVM)などを含む他の機械学習アルゴリズムであってもよい。ニューラルネットワークは、解析部により検出され得る各要素に対応するノードを入力層に含み、推奨する音声に対応するノードを出力層に含んでよい。入力層および出力層の間には、1または複数のノードを含む中間層(隠れ層)が介在してよい。ニューラルネットワークは、ノード間をつなぐエッジの重み、および、出力ノードのバイアス値を調整することで学習処理が行われてよい。
【0035】
[1.2.4.指示部43]
指示部43は、被写体について異常の可能性があると判定されたことに応じて、被写体に対して音声を発することを監視カメラ2に指示する。指示部43は、オペレータの操作を必要とせずに、自動的に監視カメラ2に指示を行ってよい。
【0036】
指示部43は、モデル42を用いて、監視カメラ2に発生させる音声を決定してよい。例えば、指示部43は、被写体の画像または音声の少なくとも一方をモデル42に供給して、発するべき音声に対応する信号をモデル42から取得してよい。指示部43は、モデル42から取得した信号を監視カメラ2に供給してよい。
【0037】
[1.2.5.取得部44]
取得部44は、監視カメラ2から発せられた音声に対する被写体の反応を監視カメラ2から取得する。取得部44は被写体の反応として、監視カメラ2により撮影された動画像データを取得してもよいし、動画像データから抽出される静止画像データや、動画像データに結合された音声データを取得してもよい。取得部44は、取得した反応を検知部45に供給してよい。
【0038】
[1.2.6.検知部45]
検知部45は、音声に対する被写体の反応に基づいて、被写体を異常または正常と検知する。検知部45は、被写体を異常と検知したことに応じて、その旨を示す信号を通話処理部46および出力部47に供給してよい。
【0039】
また、検知部45は、被写体を異常と検知しなかったことに応じて、処理の繰り返しを指示する信号を指示部43に供給してよい。これにより、監視カメラ2を介して被写体に対して音声を発する処理と、音声に対する被写体の反応を取得する処理とが指示部43および取得部44により改めて行われる。この場合に、検知部45は、監視カメラ2を介して被写体に対して音声を発して音声に対する被写体の反応を取得する処理を指示部43および取得部44が複数回繰り返した結果に基づいて被写体を異常または正常と検知してよい。検知部45は、処理の繰り返しを指示する信号を指示部43に供給する場合には、取得部44から供給された被写体の反応を指示部43にさらに供給してよい。
【0040】
[1.2.7.通話処理部46]
通話処理部46は、検知部45により被写体が異常と検知されたことに応じて、監視カメラ2を介して装置4のオペレータ(警備員とも称する)と被写体との間の通話を開始する。通話処理部46は、通話に用いられるスピーカ460およびマイク461を有してよい。
【0041】
[1.2.8.出力部47]
出力部47は、検知部45により被写体が異常と検知されたことに応じてアラート信号を出力する。例えば、出力部47は、アラート信号をモニタ(図示せず)に表示してよい。この場合には、モニタでアラート信号を確認したオペレータは監視カメラ2の画像を確認して、現場に警備員を派遣してよい。また、出力部47は、予め設定された送信先にアラート信号を送信してもよい。送信先は、監視カメラ2を設置した警備会社であってもよいし、設備のオーナーや管理会社であってもよいし、設備を含む地域の警察や病院であってもよい。
【0042】
[1.3.装置4から得られる効果]
以上の装置4によれば、被写体について異常の可能性があると判定されたことに応じて監視カメラ2から音声が発せられ、当該音声に対する被写体の反応に基づいて被写体が異常または正常と検知される。従って、監視カメラ2を介して異常な被写体を速やかに検知することができる。
【0043】
また、被写体が異常と検知されたことに応じて、監視カメラ2を介して装置4のオペレータと被写体との間の通話が開始されるので、オペレータから被写体への指示を即座に行うことができる。
【0044】
また、被写体が異常と検知されたことに応じて、アラート信号が出力されるので、異常な被写体の発生を即座に報知することができる。
【0045】
また、監視カメラ2から取得される被写体の画像または音声の少なくとも一方と、当該被写体に対して警備員が発した音声とを含む学習データを用いて学習処理が行われたモデル42を用いて、監視カメラ2に発生させる音声が決定させるので、適切な音声を監視カメラ2に発生させることができる。
【0046】
また、監視カメラ2を介して被写体に対して音声を発して被写体の反応を取得する処理を取得部44および検知部45が複数回繰り返した結果に基づいて検知部45が被写体を異常または正常と検知するので、異常な被写体を正確に検知することができる。
【0047】
[2.装置4の動作]
図2は、装置4の動作を示す。装置4は、ステップS11~S31の処理を行うことにより設備の警備を支援する。なお、監視カメラ2は、この動作とは無関係に撮影を行って、動画像データを逐次、装置4に供給してよい。
【0048】
ステップS11において、判定部41は、監視カメラ2が撮影した画像に基づいて、被写体についての異常の可能性を判定する。
【0049】
判定部41は、動画像から検出される被写体の動作から異常可能性を判定してよい。例えば、判定部41は、他の被写体と異なる不審な動作から異常可能性を判定してよい。一例として、判定部41は、監視カメラ2から顔を隠し続ける動作や、同じ場所を行き来する動作、しゃがみ込む動作、泣き続ける動作を検出したことに応じて、異常の可能性があると判定してよい。
【0050】
これに加えて、または、これに代えて、判定部41は、動画像内の静止画像(フレームとも称する)から検出される被写体の外観の特徴から異常可能性を判定してもよい。例えば、判定部41は、泣き顔や、危険物(一例としてナイフや拳銃など)、ピッキングの道具などを検出したことに応じて、異常の可能性があると判定してよい。また、判定部41は、以前に撮影された被写体やその外観の特徴データを蓄積記憶しておき、これまでに撮影されたことのない被写体を検出したことに応じて、異常の可能性があると判定してよい。また、判定部41は、被写体の顔が頭髪やサングラス、帽子、マスクなどで覆われていて顔の特徴が検出できないことに応じて、異常の可能性があると判定してよい。
【0051】
ステップS13において、装置4は、異常の可能性があったか否かを判定する。異常の可能性があったと判定された場合(ステップS13;Yes)にはステップS15に処理が移行される。異常の可能性がなかったと判定された場合(ステップS13;No)にはステップS11に処理が移行される。
【0052】
ステップS15において指示部43は、被写体に対して音声を発することを監視カメラ2に指示する。これにより、監視カメラ2から被写体に対して音声が発せられる。
【0053】
ここで、監視カメラ2から発生される音声は、モデル42を用いて決定されてよい。監視カメラ2から発せられる音声は、被写体に対して特定の動作を要求する音声であってよい。また、監視カメラ2から発生される音声は、被写体が監視カメラ2の監視領域に立ち入り権限を有するか否かや、被写体が立ち入り権限を持たない監視領域に故意または過失の何れにより入ったかを識別し得る反応を被写体に生じさせる音声であってもよい。
【0054】
例えば、特定の動作は、監視カメラ2に向けて証明書を見せる動作であってよい。証明書は、社員証や通行証、入場許可証などであってよい。
【0055】
また、特定の動作は、監視カメラ2に近づく動作であってもよい。また、特定の動作は、予め設定されたキーワード(合言葉とも称する)を発する動作であってもよい。また、特定の動作は、予め設定されたジェスチャを行う動作であってもよい。合言葉やジェスチャは、被写体に監視領域への立ち入り権限があることを示してよく、監視カメラ2が設置された設備の警備会社などによって任意に設定され、監視領域に立ち入り権限を持つ人それぞれに予め教えられてよい。
【0056】
また、指示部43からの指示により監視カメラ2から発せられる音声は、被写体に対して動作を要求しない音声であってもよい。例えば、発せられる音声は、監視領域が部外者に立ち入り禁止であることを知らせる音声(一例として「このエリアは立ち入り禁止です」という音声)であってもよい。
【0057】
ステップS17において取得部44は、音声に対する被写体の反応を監視カメラ2から取得する。例えば、取得部44は、動作を要求された被写体の反応を監視カメラ2から取得してよい。
【0058】
ステップS19において検知部45は、音声に対する被写体の反応に基づいて、被写体を異常または正常と検知する。検知部45は、被写体の反応が異常であることに応じて、被写体を異常と検知してよい。例えば、検知部45は、被写体の反応がないこと(一例として、判定部41が異常可能性ありと判定した動作を被写体が継続すること)に応じて、被写体を異常と検知してよい。これにより、被写体が体調の悪化により動けない場合に、被写体が異常と検知されてよい。
【0059】
被写体に対して特定の動作を要求する音声がステップS15の処理により発せられている場合には、検知部45は、被写体が当該特定の動作を行わないことに応じて、被写体を異常と検知してもよい。また、被写体が監視カメラ2の監視領域に立ち入り権限を有するか否かを識別し得る反応を被写体に生じさせる音声がステップS15の処理により発せられている場合には、検知部45は、被写体が立ち入り権限を有しないと識別したことに応じて、被写体を異常と検知してもよい。
【0060】
例えば、証明書を見せるよう要求する音声が発せられている場合には、検知部45は、被写体が証明書を見せないことに応じて、被写体を異常と検知してよい。また、検知部45は、監視カメラ2により撮影された証明書の内容に応じて被写体を異常と検知してもよい。
【0061】
この場合には、検知部45は、証明書の撮影画像から抽出される証明書の内容に応じて被写体を異常と検知してよい。例えば、検知部45は、証明書に含まれる顔写真の顔と、被写体の顔とが異なることに応じて被写体を異常と検知してよい。一例として、検知部45は、画像解析により両者の顔の特徴(例えば、特徴点の位置関係や、瞳や皮膚、頭髪の色など)を抽出して顔の異同を判定してよい。検知部45は、各証明書の内容を格納した警備用サーバ(図示せず)にアクセス可能である場合には、撮影された証明書のテキストを文字認識して、当該証明書の所有者の登録情報を警備用サーバから取得し、被写体の顔と、撮影された証明書の所有者の顔とが異なることに応じて被写体を異常と検知してもよい。また、検知部45は、撮影された証明書のテキストの内容が警備用サーバ内の何れの証明書の内容とも一致しないことに応じて被写体を異常と検知してもよい。
【0062】
また、合言葉を発するよう要求する音声が発せられている場合には、検知部45は、被写体が発する音声を音声認識して、正しい合言葉を発しないことに応じて被写体を異常と検知してよい。
【0063】
監視カメラ2による監視領域に対して被写体が立ち入り権限を有しない場合には、検知部45は、当該被写体が故意または過失の何れにより監視領域に入ったかを更に検知してよい。一例として、検知部45は、被写体が監視カメラ2に顔を向けない場合や、被写体が監視カメラ2から遠ざかる場合に、当該被写体が故意に監視領域に入ったと検知してよい。なお、ステップS19において検知部45は、被写体を異常とも正常とも検知できない場合には、検知不能としてもよい。
【0064】
ステップS21において装置4は、被写体が異常と検知されたか否かを判定する。被写体が異常と判定された場合(ステップS21;Yes)には、ステップS27に処理が移行される。被写体が異常と判定されなかった場合(ステップS21;No)には、ステップS23に処理が移行される。被写体が異常と判定されなかった場合とは、被写体が正常と検知された場合であってもよいし、検知不能であるとされた場合であってもよい。
【0065】
ステップS23において検知部45は、既定回数(例えば3回)だけ指示部43および取得部44の処理(本実施形態では一例としてステップS15およびステップS17の処理)が繰り返されたか否かを判定する。
【0066】
既定回数だけ処理が繰り返されたと判定した場合(ステップS23;Yes)には、ステップS11に処理が移行する。この場合には、判定部41により他の被写体についての異常の可能性が判定されてよい。既定回数だけ処理が繰り返されていないと判定した場合(ステップS23;No)には、ステップS25に処理が移行する。
【0067】
ステップS25において、検知部45は、指示部43に対し処理の繰り返しを指示する信号を供給する。これにより、ステップS15の処理が改めて行われ、指示部43からの指示により、同じ被写体に対して監視カメラ2から改めて音声が発せられる。このようにしてステップS15の処理が行われる毎に同じ被写体に音声が発せられる場合には、各回のステップS15の処理において音声は同一であってもよいし、異なってもよい。
【0068】
例えば、検知部45は、処理の繰り返しを指示する信号とともに、ステップS17で取得された被写体の反応を指示部43に供給してよい。この場合には、指示部43は、供給された被写体の反応をモデルに供給して、発するべき音声に対応する信号をモデル42から取得してよい。一例として、1回目のステップS15の処理において発せられる音声は、監視領域が部外者に立ち入り禁止であることを知らせる音声であってよく、2回目のステップS15の処理において発せられる音声は、現在地が立ち入り禁止エリアであることを理解したか否かをジェスチャで示すことを被写体に要求する音声(一例として「理解している場合には手を挙げてください」という音声)であってよい。
【0069】
ステップS27において通話処理部46は、監視カメラ2を介して装置4のオペレータと被写体との間の通話を開始する。これにより、オペレータは道に迷った被写体に対し、目的地への道順を教えてもよいし、監視領域に不正に侵入した被写体に対し、その場に留まるよう指示してもよい。なお、ステップS27の処理においては、出力部47がアラート信号を出力してもよい。本実施形態では一例として、ステップS27の処理において出力部47は、装置4のモニタ(図示せず)にアラート信号を表示してよい。
【0070】
ステップS29において装置4は、被写体が故意または過失の何れにより監視領域に入ったとステップS19で検知されたかを判定する。被写体が故意に監視領域に入っていない、つまり過失により監視領域に入ったと検知された場合(ステップS29;No)には、装置4は動作を終了する。被写体が故意に監視領域に入ったと検知された場合(ステップS29;Yes)には、ステップS31に処理が移行される。
【0071】
ステップS31において出力部47は、アラート信号を出力する。本実施形態では一例として、ステップS31の処理において出力部47は、監視カメラ2を設置した警備会社や、設備を含む地域の警察にアラート信号を出力してよい。
【0072】
以上の動作によれば、被写体に特定の動作を要求する音声を発することが監視カメラ2に指示されるので、被写体が正常であるか異常であるかを識別し得る反応を被写体に生じさせることができる。従って、異常な被写体を正確に検知することができる。
【0073】
また、要求された特定の動作を被写体が行わないことに応じて、被写体が異常と検知されるので、異常な被写体を確実に検知することができる。
【0074】
また、被写体に要求される特定の動作は、監視カメラ2に向けて証明書を見せる動作であるので、証明書を持たずに監視領域に不正に侵入した異常な被写体を検知することができる。
【0075】
また、撮影された証明書の内容に応じて被写体の異常が検知されるので、正当な証明書を持たずに監視領域に不正に侵入した異常な被写体を検知することができる。
【0076】
また、被写体に要求される特定の動作は、監視カメラ2に近づく動作であるので、撮影されるのを嫌がる異常な被写体を確実に検知することができる。
【0077】
また、被写体が監視領域に立ち入り権限を有しないことに応じて被写体が異常と検知され、当該被写体が故意または過失の何れにより監視領域に入ったかが更に検知されるので、故意に監視領域に侵入した被写体を検知することができる。
【0078】
[3.変形例]
なお、上記の実施形態においては、通話処理部46は被写体が異常と検知されたことに応じて通話を開始することとして説明したが、オペレータの操作により任意のタイミング(一例としてオペレータが被写体を異常と判断したタイミング)で通話を開始してもよい。
【0079】
また、装置4は学習済みのモデル42を有することとして説明したが、モデル42の学習処理を行う学習処理部をさらに有してもよい。学習処理部は、オペレータが被写体を異常と判断して通話を開始した場合に監視カメラ2から取得される被写体の画像または音声の少なくとも一方と、被写体に対してオペレータが発した音声とを含む学習データを用いてモデル42の学習処理を行って良い。学習データに含まれる被写体の画像や音声は、被写体が異常であるという判断の元となった画像(一例として通話の開始操作が行われたタイミングの画像)であってもよいし、オペレータの発した音声に対する被写体の反応を示す画像や音声であってもよい。
【0080】
また、装置4はモデル42を有することとして説明したが、モデル42を有しなくてもよい。この場合には、指示部43は、装置4に外部接続されたモデル42を用いて監視カメラ2に発生させる音声を決定してよい。これに代えて、監視カメラ2に発生させる音声は予め決定されてもよい。
【0081】
また、装置4が通話処理部46および出力部47を有することとして説明したが、これらを有しないこととしてもよい。この場合には、装置4は、異常と検知された被写体の画像を内部に保存してよい。
【0082】
また、指示部43は言語としての音声、つまり言語音を発することを監視カメラ2に指示することとして説明したが、非言語音の音声を発することを監視カメラ2に指示してもよい。例えば、指示部43は、警報音を発することを監視カメラ2に指示してもよい。この場合にも、正常および異常を識別し得る反応を被写体に生じさせることができるため、異常な被写体を正確に検知することができる。
【0083】
また、本発明の様々な実施形態は、フローチャートおよびブロック図を参照して記載されてよく、ここにおいてブロックは、(1)操作が実行されるプロセスの段階または(2)操作を実行する役割を持つ装置のセクションを表わしてよい。特定の段階およびセクションが、専用回路、コンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、および/またはコンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタルおよび/またはアナログハードウェア回路を含んでよく、集積回路(IC)および/またはディスクリート回路を含んでよい。プログラマブル回路は、論理AND、論理OR、論理XOR、論理NAND、論理NOR、および他の論理操作、フリップフロップ、レジスタ、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルロジックアレイ(PLA)等のようなメモリ要素等を含む、再構成可能なハードウェア回路を含んでよい。
【0084】
コンピュータ可読媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読媒体は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(RTM)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0085】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1または複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかを含んでよい。
【0086】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサまたはプログラマブル回路に対し、ローカルにまたはローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して提供され、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく、コンピュータ可読命令を実行してよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【0087】
図3は、本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。コンピュータ2200にインストールされたプログラムは、コンピュータ2200に、本発明の実施形態に係る装置に関連付けられる操作または当該装置の1または複数のセクションとして機能させることができ、または当該操作または当該1または複数のセクションを実行させることができ、および/またはコンピュータ2200に、本発明の実施形態に係るプロセスまたは当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ2200に、本明細書に記載のフローチャートおよびブロック図のブロックのうちのいくつかまたはすべてに関連付けられた特定の操作を実行させるべく、CPU2212によって実行されてよい。
【0088】
本実施形態によるコンピュータ2200は、CPU2212、RAM2214、グラフィックコントローラ2216、およびディスプレイデバイス2218を含み、それらはホストコントローラ2210によって相互に接続されている。コンピュータ2200はまた、通信インタフェース2222、ハードディスクドライブ2224、DVD-ROMドライブ2226、およびICカードドライブのような入/出力ユニットを含み、それらは入/出力コントローラ2220を介してホストコントローラ2210に接続されている。コンピュータはまた、ROM2230およびキーボード2242のようなレガシの入/出力ユニットを含み、それらは入/出力チップ2240を介して入/出力コントローラ2220に接続されている。
【0089】
CPU2212は、ROM2230およびRAM2214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ2216は、RAM2214内に提供されるフレームバッファ等またはそれ自体の中にCPU2212によって生成されたイメージデータを取得し、イメージデータがディスプレイデバイス2218上に表示されるようにする。
【0090】
通信インタフェース2222は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ2224は、コンピュータ2200内のCPU2212によって使用されるプログラムおよびデータを格納する。DVD-ROMドライブ2226は、プログラムまたはデータをDVD-ROM2201から読み取り、ハードディスクドライブ2224にRAM2214を介してプログラムまたはデータを提供する。ICカードドライブは、プログラムおよびデータをICカードから読み取り、および/またはプログラムおよびデータをICカードに書き込む。
【0091】
ROM2230はその中に、アクティブ化時にコンピュータ2200によって実行されるブートプログラム等、および/またはコンピュータ2200のハードウェアに依存するプログラムを格納する。入/出力チップ2240はまた、様々な入/出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入/出力コントローラ2220に接続してよい。
【0092】
プログラムが、DVD-ROM2201またはICカードのようなコンピュータ可読媒体によって提供される。プログラムは、コンピュータ可読媒体から読み取られ、コンピュータ可読媒体の例でもあるハードディスクドライブ2224、RAM2214、またはROM2230にインストールされ、CPU2212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ2200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置または方法が、コンピュータ2200の使用に従い情報の操作または処理を実現することによって構成されてよい。
【0093】
例えば、通信がコンピュータ2200および外部デバイス間で実行される場合、CPU2212は、RAM2214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース2222に対し、通信処理を命令してよい。通信インタフェース2222は、CPU2212の制御下、RAM2214、ハードディスクドライブ2224、DVD-ROM2201、またはICカードのような記録媒体内に提供される送信バッファ処理領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、またはネットワークから受信された受信データを記録媒体上に提供される受信バッファ処理領域等に書き込む。
【0094】
また、CPU2212は、ハードディスクドライブ2224、DVD-ROMドライブ2226(DVD-ROM2201)、ICカード等のような外部記録媒体に格納されたファイルまたはデータベースの全部または必要な部分がRAM2214に読み取られるようにし、RAM2214上のデータに対し様々なタイプの処理を実行してよい。CPU2212は次に、処理されたデータを外部記録媒体にライトバックする。
【0095】
様々なタイプのプログラム、データ、テーブル、およびデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU2212は、RAM2214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプの操作、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM2214に対しライトバックする。また、CPU2212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU2212は、第1の属性の属性値が指定される、条件に一致するエントリを当該複数のエントリの中から検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0096】
上で説明したプログラムまたはソフトウェアモジュールは、コンピュータ2200上またはコンピュータ2200近傍のコンピュータ可読媒体に格納されてよい。また、専用通信ネットワークまたはインターネットに接続されたサーバーシステム内に提供されるハードディスクまたはRAMのような記録媒体が、コンピュータ可読媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ2200に提供する。
【0097】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0098】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0099】
1 警備システム
2 監視カメラ
4 装置
40 通信部
41 判定部
42 モデル
43 指示部
44 取得部
45 検知部
46 通話処理部
47 出力部
2200 コンピュータ
2201 DVD-ROM
2210 ホストコントローラ
2212 CPU
2214 RAM
2216 グラフィックコントローラ
2218 ディスプレイデバイス
2220 入/出力コントローラ
2222 通信インタフェース
2224 ハードディスクドライブ
2226 DVD-ROMドライブ
2230 ROM
2240 入/出力チップ
2242 キーボード
図1
図2
図3