(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024153740
(43)【公開日】2024-10-29
(54)【発明の名称】管理システム、管理方法、およびプログラム
(51)【国際特許分類】
H04N 7/18 20060101AFI20241022BHJP
G10L 15/10 20060101ALI20241022BHJP
H04M 11/00 20060101ALI20241022BHJP
G10L 25/51 20130101ALN20241022BHJP
【FI】
H04N7/18 D
G10L15/10 500Z
H04M11/00 301
G10L25/51
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2024118621
(22)【出願日】2024-07-24
(62)【分割の表示】P 2022575001の分割
【原出願日】2021-01-15
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100110928
【弁理士】
【氏名又は名称】速水 進治
(72)【発明者】
【氏名】川上 和也
(57)【要約】
【課題】監視カメラの有無に関わらず、事象の発生を早期に検知し、その事象に関連する人物を含む移動体を探し出す。
【解決手段】情報処理装置は、画像を処理することにより、対象地域に存在する移動体を特定する特徴情報、およびその時の位置情報を生成するとともに、特徴情報と位置情報を時刻情報に関連付けた当該移動体の移動履歴情報を生成して関係者データベースに記憶させる移動履歴生成部と、位置情報および時刻情報に紐づいた音声を解析することにより、事象の発生を検知するとともに、事象の発生地点および時刻を特定する事象特定部と、特定された発生地点および時刻を用いて関係者データベースを検索することにより、事象に関連する移動体、および事象を目撃可能な地点に存在した移動体の少なくとも一方である関係移動体の特徴情報を抽出する抽出部と、を備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
情報の管理システムであって、
前記管理システムは、
カメラから送信された画像を取得する処理と、
マイクロフォンから送信された音声を取得する処理と、
前記画像に基づいて移動体の情報を取得する処理と、
前記音声に基づいて事象を検知する処理と、
前記検知された事象の位置情報に基づいて、前記事象と関連する移動体の情報を取得する処理と、
端末と前記事象と関連する移動体の位置に関する情報とに基づいた距離に応じて、前記端末に通知を行う処理と、を実行する、管理システム。
【請求項2】
請求項1に記載の管理システムにおいて、
前記事象と関連する移動体の位置に関する情報は、前記事象と関連する移動体の移動先を含む、管理システム。
【請求項3】
請求項1または2に記載の管理システムにおいて、
前記通知は、前記事象の発生場所に関する情報を含む、管理システム。
【請求項4】
請求項1から3のいずれか一項に記載の管理システムにおいて、
前記移動体は車両を含む、管理システム。
【請求項5】
請求項1から4のいずれか一項に記載の管理システムにおいて、
前記事象を検知する処理は、交通事故に起因した音を検知することを含む、管理システム。
【請求項6】
請求項1から5のいずれか一項に記載の管理システムにおいて、
前記端末は、前記通知を表示する手段または前記通知を音声によって出力する手段の少なくともいずれかを有し、前記移動体のドライバーによって操作される端末を含む、管理システム。
【請求項7】
情報の管理方法であって、
前記管理方法は、
1以上のコンピュータが、
カメラから送信された画像を取得し、
マイクロフォンから送信された音声を取得し、
前記画像に基づいて移動体の情報を取得し、
前記音声に基づいて事象を検知し、
前記検知された事象の位置情報に基づいて、前記事象と関連する移動体の情報を取得し、
端末と前記事象と関連する移動体の位置に関する情報とに基づいた距離に応じて、前記端末に通知を行う、管理方法。
【請求項8】
コンピュータに、
カメラから送信された画像を取得する処理と、
マイクロフォンから送信された音声を取得する処理と、
前記画像に基づいて移動体の情報を取得する処理と、
前記音声に基づいて事象を検知する処理と、
前記検知された事象の位置情報に基づいて、前記事象と関連する移動体の情報を取得する処理と、
端末と前記事象と関連する移動体の位置に関する情報とに基づいた距離に応じて、前記端末に通知を行う処理と、を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、監視システムの情報処理装置、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
特許文献1には、撮影対象の破壊などの異常音に反応して、監視対象の撮像データの記録を行う監視システムが記載されている。特許文献2には、所定のエリアの映像情報を入力して所定期間テンポラリメモリに保存しておき、イベントが発生したときに、イベントの時刻を含むイベント情報の入力を受け付け、その時刻の前後の期間の映像情報をテンポラリメモリから取り出して保存メモリに格納することで、イベントに関連した映像情報を取得しやすくする映像情報共有システムが記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2006-60328号公報
【特許文献2】特開2019-4373号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
近年、監視カメラが街中や建物の周辺に増えてきてはいるものの、一方で、犯罪などは監視カメラのない場所で起きることの方が多いため、そのような場所での犯罪を早期に解決することが望まれている。
【0005】
本発明は上記事情に鑑みてなされたものであり、その目的とするところは、監視カメラの有無に関わらず、事象の発生を早期に検知し、その事象に関連する人物を含む移動体を探し出すことにある。
【課題を解決するための手段】
【0006】
本発明の各側面では、上述した課題を解決するために、それぞれ以下の構成を採用する。
【0007】
第一の側面は、情報の管理システムに関する。
第一の側面に係る情報の管理システムは、
カメラから送信された画像を取得する処理と、
マイクロフォンから送信された音声を取得する処理と、
前記画像に基づいて移動体の情報を取得する処理と、
前記音声に基づいて事象を検知する処理と、
前記検知された事象の位置情報に基づいて、前記事象と関連する移動体の情報を取得する処理と、
端末と前記事象と関連する移動体の位置に関する情報とに基づいた距離に応じて、前記端末に通知を行う処理と、を実行する。
【0008】
第二の側面は、少なくとも1つのコンピュータにより実行される、情報の管理方法に関する。
第二の側面に係る管理方法は、
1以上のコンピュータが、
カメラから送信された画像を取得し、
マイクロフォンから送信された音声を取得し、
前記画像に基づいて移動体の情報を取得し、
前記音声に基づいて事象を検知し、
前記検知された事象の位置情報に基づいて、前記事象と関連する移動体の情報を取得し、
端末と前記事象と関連する移動体の位置に関する情報とに基づいた距離に応じて、前記端末に通知を行う、ことを含む。
【0009】
なお、本発明の他の側面としては、上記第二の側面の方法を少なくとも1つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。
このコンピュータプログラムは、コンピュータにより実行されたとき、コンピュータに、その管理方法を実施させるコンピュータプログラムコードを含む。
【0010】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【0011】
また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。
【0012】
また、本発明の方法およびコンピュータプログラムには複数の手順を順番に記載してあるが、その記載の順番は複数の手順を実行する順番を限定するものではない。このため、本発明の方法およびコンピュータプログラムを実施するときには、その複数の手順の順番は内容的に支障のない範囲で変更することができる。
【0013】
さらに、本発明の方法およびコンピュータプログラムの複数の手順は個々に相違するタイミングで実行されることに限定されない。このため、ある手順の実行中に他の手順が発生すること、ある手順の実行タイミングと他の手順の実行タイミングとの一部ないし全部が重複していること、等でもよい。
【発明の効果】
【0014】
上記各側面によれば、監視カメラの有無に関わらず、事象の発生を早期に検知し、その事象に関連する人物を含む移動体を探し出す技術を提供することができる。
【図面の簡単な説明】
【0015】
【
図1】実施形態に係る監視システムの概要を模式的に示す図である。
【
図2】
図1に示す監視システムの情報処理装置、画像処理装置、および音声処理装置をそれぞれ実現するコンピュータのハードウェア構成を例示するブロック図である。
【
図3】実施形態に係る情報処理装置の構成例を論理的に示す機能ブロック図である。
【
図4】記憶装置に記憶される各種情報のデータ構造例を示す図である。
【
図5】記憶装置に記憶される各種情報のデータ構造例を示す図である。
【
図6】実施形態の情報処理装置の動作例を示すフローチャートである。
【
図7】実施形態に係る情報処理装置の構成例を論理的に示す機能ブロック図である。
【
図8】ある地域におけるカメラとマイクロフォンの設置例を示す図である。
【
図9】実施形態の情報処理装置の動作例を示すフローチャートである。
【
図10】実施形態に係る情報処理装置の構成例を論理的に示す機能ブロック図である。
【
図11】実施例1の監視システムの構成例を示す図である。
【
図12】実施例1の監視システムの動作例を示すフローチャートである。
【
図13】実施例2の監視システムの動作例を示すフローチャートである。
【発明を実施するための形態】
【0016】
以下、本発明の実施の形態について、図面を用いて説明する。なお、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また、以下の各図において、本発明の本質に関わらない部分の構成については省略してあり、図示されていない。
【0017】
実施形態において「取得」とは、自装置が他の装置や記憶媒体に格納されているデータまたは情報を取りに行くこと(能動的な取得)、および、自装置に他の装置から出力されるデータまたは情報を入力すること(受動的な取得)の少なくとも一方を含む。能動的な取得の例は、他の装置にリクエストまたは問い合わせしてその返信を受信すること、及び、他の装置や記憶媒体にアクセスして読み出すこと等がある。また、受動的な取得の例は、配信(または、送信、プッシュ通知等)される情報を受信すること等がある。さらに、「取得」とは、受信したデータまたは情報の中から選択して取得すること、または、配信されたデータまたは情報を選択して受信することであってもよい。
【0018】
(第1実施形態)
<システム概要>
図1は、実施形態に係る監視システム1の概要を模式的に示す図である。監視システム1は、情報処理装置100と、画像処理装置200と、音声処理装置210と、少なくとも一つのカメラ5と、少なくとも一つのマイクロフォン7とを備えている。さらに、監視システム1は、記憶装置300を備えている。
【0019】
カメラ5は、監視システム1に特化したものであってもよいし、例えば、以前から設置されているカメラを利用してもよい。あるいは、カメラ5は、車載カメラであってもよい。カメラ5は、街頭、施設内、建物内など様々な場所に設置されてよい。マイクロフォン7は、カメラ5とは別に、街頭、施設内、建物内など様々な場所に設置されてよい。マイクロフォン7は、カメラ5に搭載されているものであってもよい。マイクロフォン7はカメラ5よりも多くの場所に設置されてもよい。特に、人目に付かない場所に設置されてもよい。
【0020】
さらに、監視システム1は、臭いを検知する臭度センサ、温度センサ、煙探知器、ガス漏れ検知器、あるいは、通報ボタンの押下を検知するセンサなどのセンサ(不図示)をさらに備えてもよい。センサはこれらに限定されず、検知対象となる事象を特定するのに使用できる情報を取得するセンサを用いることができる。
【0021】
記憶装置300は、情報処理装置100および画像処理装置200の少なくとも一方の内部に含まれる装置であってもよいし、情報処理装置100および画像処理装置200とは別体の装置であってもよいし、これらの組み合わせであってもよい。
【0022】
カメラ5は、撮像画像を生成する。カメラ5は、レンズとCCD(Charge Coupled Device)イメージセンサといった撮像素子を備える。カメラ5は、画角に入る人物の動きに合わせて追従してカメラ本体やレンズの向きの制御、ズーム制御、焦点合わせ等を行う機構を備えてもよい。
【0023】
カメラ5は、監視システム1に特化されたものでないものでもよいため、撮影範囲や撮影時間は特に限定されない。ただし、カメラ5は、関係移動体を撮影可能な範囲を撮影してもよい。また、カメラ5は、関係移動体が存在する可能性が高い日時や期間を撮影時間としてもよい。
【0024】
例えば、カメラ5は、関係移動体が訪問予定の日時や期間に訪問予定の場所を含む範囲を撮影してもよい。あるいは、カメラ5は、犯罪が多く発生している時間帯やエリア(例えば、人通りの少ない場所や治安の悪い地域、観光地など)の、街頭、道路、通路、空き地、路地裏、店舗や施設などの建物や敷地内、建物内の特定のフロア、店舗のレジ周辺などを含む範囲を撮影してもよい。あるいは、人で混雑しているイベントや祭などの会場において、それらの開催日時に合わせてカメラ5の台数、撮影箇所、撮影範囲などを変えてもよい。
【0025】
カメラ5で生成された画像は、通信ネットワーク3を介して情報処理装置100または画像処理装置200に送信される。画像は、カメラ5から情報処理装置100に送信され、情報処理装置100から画像処理装置200に画像処理のために送信されてもよいし、カメラ5から画像処理装置200に送信され、画像処理装置200から情報処理装置100に画像処理された結果が送信されてもよいし、これらの組み合わせであってもよい。
【0026】
カメラ5またはマイクロフォン7と、情報処理装置100または画像処理装置200の間の接続方式は、無線でも有線でもよい。無線接続の場合は、カメラ5またはマイクロフォン7、情報処理装置100、および画像処理装置200はそれぞれ無線通信機能を有しているものとする。カメラ5は、例えばIP(Internet Protocol)カメラ等のネットワークカメラであってもよい。
【0027】
カメラ5により生成される画像の利用方法は、(a1)対象地域における移動体10の移動履歴情報の生成、(a2)事象の発生の検知後の移動体10の移動経路の推定などである。
【0028】
例えば、(a2)の事象の発生の検知後の移動体10の移動経路の推定するために画像を用いる場合は、画像はリアルタイムに情報処理装置100または画像処理装置200に送信されるのが好ましい。ただし、情報処理装置100または画像処理装置200に送信される画像は、カメラ5からすぐに送信されなくてもよく、所定の時間遅延した画像であってもよい。カメラ5で生成された画像は、一旦記憶装置(記憶装置300であってもよいし、他の記憶装置(記録媒体も含む)であってもよい)に格納され、情報処理装置100または画像処理装置200が記憶装置から逐次または所定間隔毎に読み出してもよい。さらに、情報処理装置100または画像処理装置200に送信される画像は、動画像であるのが好ましいが、所定間隔毎のフレーム画像であってもよいし、静止画であってもよい。
【0029】
さらに、その事象に関連する移動体10の移動を追跡するように、複数のカメラ5を切り替えて撮影してもよい。あるいは、複数のカメラ5の撮像画像を用いて事象に関連する移動体10の移動を追跡してもよい。
【0030】
一方、(a1)の対象地域における移動体10の移動履歴情報の生成に画像を用いる場合は、画像はリアルタイムに情報処理装置100または画像処理装置200に送信されなくてもよく、一旦記憶装置(記録媒体も含む)に記憶された後、情報処理装置100または画像処理装置200が記憶装置から画像を読み出して処理してもよい。
【0031】
<ハードウェア構成例>
図2は、
図1に示す監視システム1の情報処理装置100、画像処理装置200、および音声処理装置210をそれぞれ実現するコンピュータ1000のハードウェア構成を例示するブロック図である。
【0032】
コンピュータ1000は、バス1010、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、およびネットワークインタフェース1060を有する。
【0033】
バス1010は、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、およびネットワークインタフェース1060が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1020などを互いに接続する方法は、バス接続に限定されない。
【0034】
プロセッサ1020は、CPU(Central Processing Unit) やGPU(Graphics Processing Unit)などで実現されるプロセッサである。
【0035】
メモリ1030は、RAM(Random Access Memory)などで実現される主記憶装置である。
【0036】
ストレージデバイス1040は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、又はROM(Read Only Memory)などで実現される補助記憶装置である。ストレージデバイス1040は監視システム1の情報処理装置100の各機能(例えば、後述する
図3の移動履歴生成部102、事象特定部104、および抽出部106、あるいは、
図7の移動経路生成部108等)を実現するプログラムモジュールを記憶している。プロセッサ1020がこれら各プログラムモジュールをメモリ1030上に読み込んで実行することで、そのプログラムモジュールに対応する各機能が実現される。また、ストレージデバイス1040は、情報処理装置100または画像処理装置200が使用する各種情報を記憶する記憶部(不図示)としても機能する。また、記憶装置300もストレージデバイス1040により実現されてもよい。
【0037】
プログラムモジュールは、記録媒体に記録されてもよい。プログラムモジュールを記録する記録媒体は、非一時的な有形のコンピュータ1000が使用可能な媒体を含み、その媒体に、コンピュータ1000(プロセッサ1020)が読み取り可能なプログラムコードが埋め込まれてよい。
【0038】
入出力インタフェース1050は、コンピュータ1000と各種入出力機器とを接続するためのインタフェースである。
【0039】
ネットワークインタフェース1060は、コンピュータ1000を通信ネットワーク3に接続するためのインタフェースである。この通信ネットワーク3は、例えばLAN(Local Area Network)やWAN(Wide Area Network)である。ネットワークインタフェース1060が通信ネットワーク3に接続する方法は、無線接続であってもよいし、有線接続であってもよい。ただし、ネットワークインタフェース1060は用いられないことも有る。
【0040】
そして、コンピュータ1000は、入出力インタフェース1050またはネットワークインタフェース1060を介して、必要な機器(例えば、カメラ5、マイクロフォン7、センサ(不図示)、ディスプレイ(不図示)、スピーカ(不図示)など)に接続する。
【0041】
監視システム1は、情報処理装置100と、画像処理装置200との組み合わせにより実現されるため、それぞれを構成する複数のコンピュータ1000により実現される。情報処理装置100は、例えば、サーバコンピュータやパーソナルコンピュータである。画像処理装置200は、情報処理装置100とは別体の装置であってもよいし、情報処理装置100の内部に含まれる装置であってもよいし、これらの組み合わせであってもよい。
【0042】
後述するように、エリア別に認識される移動体である人物の服装、言語、利用する乗り物などが異なるため、画像処理装置200や音声処理装置210が認識すべき服装、言語、乗り物などに対応したモデルが、エリア別、または言語別に予め準備されてもよい。
【0043】
後述する
図3の本実施形態の情報処理装置100の各構成要素は、
図2のコンピュータ1000のハードウェアとソフトウェアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。各実施形態の情報処理装置100を示す機能ブロック図は、ハードウェア単位の構成ではなく、論理的な機能単位のブロックを示している。
【0044】
<機能構成例>
図3は、本実施形態に係る情報処理装置100の構成例を論理的に示す機能ブロック図である。情報処理装置100は、移動履歴生成部102と、事象特定部104と、抽出部106と、を備える。
移動履歴生成部102は、画像を処理することにより、対象地域に存在する移動体を特定する特徴情報、およびその時の位置情報を生成するとともに、特徴情報と位置情報を時刻情報に関連付けた当該移動体の移動履歴情報を生成して関係者データベース310に記憶させる。
事象特定部104は、位置情報および時刻情報に紐づいた音声を解析することにより、事象の発生を検知するとともに、事象の発生地点および時刻を特定する。
抽出部106は、事象特定部104により特定された発生地点および時刻を用いて関係者データベース310を検索することにより、事象に関連する移動体、および事象を目撃可能な地点に存在した移動体の少なくとも一方である関係移動体の特徴情報を抽出する。
【0045】
対象地域とは、移動体の移動を監視する対象の地域であり、対象地域内には、少なくとも一つのカメラ5と、少なくとも一つのマイクロフォン7が設置されている。カメラ5は、対象地域の少なくとも一部の領域を撮影範囲とする。マイクロフォン7は、対象地域の少なくとも一部の領域の音声を集音する。ただし、情報処理装置100が利用する画像および音声は、必ずしも対象地域に設置されているカメラ5およびマイクロフォン7により生成されたものでなくてもよい。つまり、対象地域に設置されているカメラ5またはマイクロフォン7の代わりに、対象地域外に設置されているカメラ5により生成された画像または対象地域外に設置されているマイクロフォン7により集音された音声を情報処理装置100が用いることも排除されない。
【0046】
移動体10は、人および車両の少なくとも一方を含む。
【0047】
移動体10を特定する特徴情報は、例えば、人物の顔、虹彩、静脈、耳介、指紋、歩容、背格好(身長、肩幅、身丈、骨格等)等の少なくともいずれか一つの特徴量を含む。さらに、特徴情報は、衣服(形、色、素材等)、髪型(髪色も含む)、装飾品(帽子、眼鏡、アクセサリ等)、所持品(バッグ、傘、杖等)等のうち少なくとも一つの特徴を示す特徴情報を含んでもよい。さらに、移動体10は、車両であってもよいため、車両の特徴(例えば、車両の種類、ナンバープレート、車種、車体の色など)を示す特徴情報を含んでもよい。あるいは、これら特徴情報のうち、少なくとも2つを組み合わせた特徴情報を用いてもよい。後述するように、移動体10を特定する特徴情報は、移動体10の音声の特徴情報、例えば、しゃべり声、話している言葉、しゃべり方、言語、方言、息づかい、声紋、泣き声、足音、荷物を引きずる音、衣服や装飾品の音、発砲音、エンジン音、クラクションの音、クラクションの鳴らし方、ドアの開閉音などを含んでもよい。
【0048】
関係者データベース310は、記憶装置300に含まれる。ただし、記憶装置300は上記したように複数の記憶装置が構成されてもよい。
【0049】
図4は、記憶装置300に記憶される各種情報のデータ構造例を示す図である。カメラテーブル302は、カメラ5を特定する識別情報であるカメラIDに、当該カメラ5が設置されている位置情報が関連付けられている。さらに、カメラテーブル302は、カメラ5のIPアドレスを含んでもよい。マイクロフォンテーブル304は、マイクロフォン7を特定する識別情報であるマイクIDに、当該マイクロフォン7が設置されている位置情報が関連付けられている。さらに、マイクロフォンテーブル304は、マイクロフォン7のIPアドレスを含んでもよい。
【0050】
位置情報は、例えば、緯度経度座標系、平面直角座標系、測地系、住所などのうち少なくとも一つで示されてよく、複数の情報を組み合わせもよく、特に限定されない。
【0051】
画像記憶部306は、カメラ5から送信された画像を格納する。画像記憶部306は、画像を撮像したカメラ5のカメラID(あるいは、カメラ5のIPアドレスでもよい)に、画像の受信日時(ただし、受信日時に限定されず、例えば、撮影日時、画像生成日時、保存日時などであってもよい。)と、画像データとが関連付けて記憶される。あるいは、カメラ5(あるいは、カメラ5の設置地域)または日時別に格納領域(例えば、ディレクトリやフォルダ)を分けて画像データを格納してもよい。あるいは、画像データのファイル名にカメラ5を特定できる情報(例えば、カメラIDやIPアドレス)を含めてもよい。言い換えると、画像記憶部306には、画像データが、どのカメラ5で何時撮影されたものであるか分かる状態で格納されていれば、その格納方法は特に限定されない。
【0052】
音声記憶部308は、マイクロフォン7から送信された音声を格納する。音声記憶部308は、音声を集音したマイクロフォン7のマイクID(あるいは、マイクロフォン7のIPアドレスでもよい)に、音声の受信日時(ただし、受信日時に限定されず、例えば、集音日時、音声生成日時、録音日時などであってもよい。)と、音声データと、が関連付けて記憶される。あるいは、マイクロフォン7(あるいは、マイクロフォン7の設置地域)または日時別に格納領域(例えば、ディレクトリやフォルダ)を分けて音声データを格納してもよい。あるいは、音声データのファイル名にマイクロフォン7を特定できる情報(例えば、マイクIDやIPアドレス)を含めてもよい。言い換えると、音声記憶部308には、音声データが、どのマイクロフォン7で何時集音されたものであるか分かる状態で格納されていれば、その格納方法は特に限定されない。
【0053】
関係者データベース310には、移動体10の移動履歴情報が格納される。移動履歴情報は、画像内で認識された移動体10の特徴情報に、移動体10の位置情報と、当該画像に移動体10が写っている時点の日時とが関連付けられている。位置情報は、当該画像が撮影されたカメラ5の設置位置情報と、カメラ5の撮影方向や撮影範囲(画角)などの情報と、画像内の移動体10の位置とに基づいて算出される。移動体10の位置情報は、例えば、緯度経度座標系、平面直角座標系、測地系、住所などのうち少なくとも一つで示されてよく、複数の情報を組み合わせもよく、特に限定されない。日時は、移動体10が写っている画像(または画像フレーム)のタイムスタンプなどの情報から算出される。
【0054】
さらに、移動履歴情報には、画像内で認識された移動体10の特徴情報に、移動体10の移動方向が関連付けられる。あるいは、例えば、360度カメラや撮影方向を変更できるカメラ5で撮影された画像内で認識された移動体10の場合、特徴情報に撮影方向を示す情報をさらに関連付けてもよい。また、関係者データベース310には、移動履歴情報に格納されている特徴情報が抽出された画像データ(フレーム)を特定できる情報(例えば、画像データのファイル名(または格納場所)や画像フレーム番号など)をさらに特徴情報に関連付けて記憶されてもよい。
【0055】
移動履歴生成部102は、カメラ5で撮像され、画像記憶部306に格納されている画像を、画像処理装置200を用いて解析する。ただし、画像はカメラ5から受信した画像であってもよく、画像記憶部306に記憶されていなくてもよい。画像処理装置200により認識される移動体10は、画像内の全ての人物や車両を認識対象としてもよいし、特定の人物や車両を予め登録しておいて認識対象としてもよい。特定の人物は、例えば、要人、外国人、観光客などであり、特に警護が必要な人物を含む。さらに、特定の人物は、指名手配者、容疑者、要注意人物などであってもよく、特に、監視が必要な人物を含んでもよい。
【0056】
事象特定部104は、マイクロフォン7で集音され、音声記憶部308に格納された音声を、音声処理装置210を用いて解析する。ただし、音声はマイクロフォン7から受信した音声であってもよく、音声記憶部308に記憶されていなくてもよい。
【0057】
事象特定部104により検知される事象とは、例えば、犯罪や事件などである。事象は、例えば、窃盗、強盗、スリ、置き引き、万引き、恐喝、喧嘩、暴力、暴行、傷害または傷害致死事件、誘拐、爆破、殺人、通り魔、テロ、立て籠もり、放火、交通事故(ひき逃げ、当て逃げ、暴走など)、構造物の破壊(器物損壊)などである。
【0058】
事象特定部104は、所定の音声を認識することで、事象の発生を検知する。例えば、事象特定部104は、人が発した単語または文章を用いて事象の発生を検知してもよい。事象特定部104は、例えば、助けを求める音声、つまり被害者側の音声(例えば、「助けて」、「撃たないで」、「やめて」、「返して」、「誘拐だ」など)、脅す音声、つまり、犯罪者側の音声(例えば、「手を上げろ」、「よこせ」、「騒ぐな」、「黙れ」、「おとなしくしろ」、「撃つぞ」など)を認識することで事件の発生を検知してもよい。
【0059】
上記の言葉だけでなく、その音量、性質(例えば、怯えた様子や錯乱状態、威嚇、押し殺した声など)、トーン、言語や方言、悲鳴や罵声などを認識し、さらに、認識された音声の継続時間を、事象の発生の検知の条件に用いてもよい。さらに、衝撃音(例えば、交通事故など)、機械音、破裂音、爆発音、音波、および、これらの音の継続時間などを認識し、事象の発生の条件に用いてもよい。
【0060】
さらに、例えば、特定人物の声を予め登録しておき、事象特定部104は、特定人物の声で、「助けて」などの言葉が検出された場合に事象の発生を検知してもよい。
【0061】
事象特定部104は、上記した複数の条件を組み合わせて事象の発生を推定することができる。推定条件は、以下に例示されるがこれらに限定されない。
(b1)「誘拐!」、「助けて」を2回以上検出、音量は所定値以上、音声の継続時間は10秒以上
(b2)衝撃音を検出、音声の継続時間は10秒
(b3)「助けて」を2回以上検知、音量は所定値以上
【0062】
事象特定部104は、さらに、事象の緊急性を示す緊急度を特定してもよい。事象特定部104は、事象の緊急度を、対象人物に特定人物が含まれるか否かを用いて特定してもよい。事象特定部104は、例えば、上記(b1)の場合や、特定人物の声が認識された場合などは緊急度が高レベルであると特定し、上記(b2)の場合は緊急度が中程度レベルであると特定し、上記(b3)の場合は緊急度が低レベルであると特定してもよい。これらの条件は、地域における事象の発生状況などに応じて設定できてよい。
【0063】
また、上記特定人物毎に、緊急度を高める条件を予め登録しておき、事象特定部104は、条件を満たした場合に緊急度を高めてもよい。
【0064】
さらに、事象の発生を特定するための条件は、時期、時間帯、日時、施設の種類や場所などに応じても設定できてよい。つまり、事象が発生しやすい時期、時間帯、日時、施設の種類や場所などを指定して条件を設定することで、事象の発生の特定の精度を向上させることができる。事象別に事象の発生を示す音声情報や、その他の条件や状況(例えば、発生しやすい場所、時期、時間帯、日時など)を、機械学習させてモデル化してもよい。
【0065】
事象の発生が検知されたとき、事象特定部104は、当該事象の発生検知の根拠となった音声を収集したマイクロフォン7の位置情報を特定するとともに、さらに音声データ内で当該音声が発生している時刻を特定する。
【0066】
事象特定部104は、
図5の事象記憶部312に特定した事象毎(例えば、事象毎に事象発生IDを付与してもよい)に、その事象の発生日時と位置情報を関連付けて記憶する。さらに、事象特定部104は、事象の緊急度を関連付けて事象記憶部312に記憶してもよい。さらに、推定される事象の種類(
図5には不図示)を関連付けて事象記憶部312に記憶してもよい。事象特定部104は、事象の種類を、例えば、音声に含まれる言葉から、誘拐、強盗、スリなどを推定してもよい。さらに、事象特定部104は、音声に含まれる音の種類、音量、性質などから、例えば、交通事故、爆発、発砲、破裂などを推定してもよい。
【0067】
さらに、事象特定部104は、事象発生地点の周囲に設置されているカメラ5を特定し、カメラ5の画像を取得し、さらに、事象の種類を推定したり、緊急度を特定したりしてもよい。
【0068】
抽出部106は、事象記憶部312を参照、または事象特定部104から受け渡された事象の発生日時と位置情報を取得し、取得した日時と位置情報を用いて関係者データベース310の移動履歴情報を検索し、該当する特徴情報を抽出する。事象発生時点の位置情報を示す画像から抽出される特徴情報は、1つとは限らず複数の特徴情報が抽出されてよい。抽出された特徴情報は、事象に関連する移動体10、および事象を目撃可能な地点に存在した移動体10の少なくとも一方である関係移動体を示している。
【0069】
関係移動体は、事象の当事者と車両、事象を目撃した人と車両、事象に関連した人と車両を含み、さらに、画像に写っている一般の人と車両を含んでもよい。どの移動体を関係移動体とするか否かは、ユーザにより設定変更できてもよいし、システム毎に設定されていてもよい。
【0070】
例えば、セキュリティが高く設定されているビルなどでは、ビルの中に存在している人物を全て関係移動体として特徴情報を生成して、移動履歴情報を生成してもよい。街中などでは、要人、外国人、または観光客など特に警護や監視が必要な人物を関係移動体として予め特徴情報を登録しておき、画像処理により登録済みの特徴情報が認識されたら関係移動体として移動履歴情報を生成してもよい。さらに、登録済みの関係移動体の行動予定を予め登録できてもよい。行動予定に従った日時および場所の画像について関係移動体の移動履歴情報を生成してもよい。また、犯罪者や容疑者など特に監視が必要な人物についても、関係移動体として特徴情報を予め登録しておき、画像処理により登録済みの特徴情報が認識されたら関係移動体として移動履歴情報を生成してもよい。指名手配中、潜伏していると予想される地域の画像を特定して画像処理を行い、登録済みの特徴情報が認識されたら、当該関係移動体の移動履歴情報を生成してもよい。
【0071】
抽出部106により抽出された事象に関連する関係移動体(以後、関係者とも呼ぶ)の特徴情報は、
図5の関係者移動履歴記憶部314に記憶されてよい。なお、
図5の事象記憶部312および関係者移動履歴記憶部314も記憶装置300に含まれてよい。関係者移動履歴記憶部314には、発生が検知された事象毎に、抽出された少なくとも一つの特徴情報と、その日時と位置情報とが関連付けて記憶される。
【0072】
さらに、事象特定部104は、事象の発生時の音声情報を用いて、事象の属性情報を生成してもよい。そして、抽出部106は、事象の属性情報もさらに用いて関係者データベース310を検索してもよい。事象の属性情報は、例えば、事象の種類、規模、および緊急度の少なくとも一つを含んでよい。
【0073】
なお、
図1、
図3、および後述する
図7において、情報処理装置100、画像処理装置200、および音声処理装置210はそれぞれ一つのハードウェア(例えばサーバ)で構成されている。ただし、情報処理装置100、画像処理装置200および音声処理装置210はそれぞれ複数のハードウェア(例えば複数のサーバ)で構成されてもよい。例えば、画像処理装置200および情報処理装置100の移動履歴生成部102が第1のサーバによって実現され、音声処理装置210および情報処理装置100の事象特定部104が第2のサーバで実現され、情報処理装置100の抽出部106が第3のサーバで実現されてもよい。また、画像処理装置200、情報処理装置100の移動履歴生成部102および抽出部106が第1のサーバで実現され、音声処理装置210および情報処理装置100の事象特定部104が第2のサーバで実現されてもよい。ただし組み合わせはこれらに限定されない。
【0074】
<動作例>
図6は、本実施形態の情報処理装置100の動作例を示すフローチャートである。
情報処理装置100は、関係者データベース310の構築処理と、事象検知および関係移動体抽出処理の2つのフローに従い動作してよい。ただし、処理フローの組み合わせはこれに限定されない。
【0075】
<関係者データベース310の構築処理>
まず、情報処理装置100の移動履歴生成部102は、関係者データベース310の構築処理を行う。移動履歴生成部102は、画像処理装置200にカメラ5が撮像した画像を処理させ、対象地域に存在する移動体10を特定する特徴情報、およびその時の位置情報を生成する(ステップS101)。そして、移動履歴生成部102は、特徴情報と位置情報を時刻情報に関連付けた当該移動体10の移動履歴情報を生成し、関係者データベース310に記憶される(ステップS103)。
【0076】
具体的には、画像処理装置200により画像内から移動体10の特徴情報が抽出されると、移動履歴生成部102は、当該画像を撮影したカメラ5を特定し、当該カメラ5の撮影日時と設置場所(撮影方向や撮影範囲などを含む)などの撮影情報を特定し、特定された撮影情報に基づいて移動体10の位置情報と存在日時を算出する。そして、抽出された移動体10の特徴情報に、算出した移動体10の位置情報と日時を関連付けて関係者データベース310に登録する。さらに、移動履歴生成部102は、前後の画像を用いて当該移動体10の移動方向を算出し、さらに移動履歴情報の特徴情報に移動体10の移動方向を関連付けて記憶させる。
【0077】
また、移動履歴生成部102は、マイクロフォン7により集音された音声を音声処理装置210により解析し、特定の移動体10に関する音声の特徴情報(以後、音声特徴情報とも呼ぶ)を移動履歴情報に日時と位置情報に関連付けて記憶してもよい。特定の移動体10とは、例えば、特定人物や特定車両である。特定の人物は、例えば、要人、外国人、観光客などであり、特に警護が必要な人物を含む。さらに、特定の人物は、指名手配者、容疑者、要注意人物などであってもよく、特に、監視が必要な人物を含んでもよい。
【0078】
つまり、移動履歴生成部102は、画像および音声の少なくとも一方を使用して移動履歴情報を生成してもよい。
【0079】
関係者データベース310の移動履歴情報に記憶されている特定人物の顔などの特徴情報に、当該特定人物の音声特徴情報を、さらに関連付けてもよい。特定人物の音声特徴情報は、特定人物を特定できる特徴情報であり、例えば、特定人物のしゃべり声、話している言葉、しゃべり方、言語、方言、息づかい、声紋、足音、荷物を引きずる音、衣服や装飾品の音、発砲音などであってもよい。あるいは、特定車両の音声特徴情報を移動履歴情報に日時と位置情報に関連付けて記憶してもよい。特定車両の音声特徴情報は、特定車両を特定できる特徴情報であり、例えば、特定車両のエンジン音、クラクションの音、クラクションの鳴らし方、ドアの開閉音などであってもよい。特定人物と特定車両に関係がある場合は、特定人物と特定車両の情報もそれぞれ関連付けられて移動履歴情報に記憶されてもよい。
【0080】
関係者データベース310の構築処理は、定期的、常時、または随時、繰り返し行われてよい。構築処理を実行するタイミングや頻度などは地域別、施設の種類や場所、時期、時間帯、および日時などの少なくともいずれか一つに応じて設定できてよい。また、関係者データベース310に登録された移動体10の特徴情報の移動履歴情報は、所定期間が経過した後、削除またはアーカイブとして別の記憶装置に移動されてもよい。
【0081】
<事象検知および関係者抽出処理>
次に、事象特定部104は、音声処理装置210にマイクロフォン7が集音した音声の解析を行わせ(ステップS111)、事象の発生を監視する(ステップS113)。そして、事象の発生が検知されると(ステップS113のYES)、事象特定部104は、事象の発生した地点の位置情報と発生日時を特定する(ステップS115)。そして、抽出部106は、ステップS115で特定された事象の発生位置情報と発生日時を用いて関係者データベース310の移動履歴情報を検索し、関係移動体を抽出する(ステップS117)。
【0082】
具体的には、事象特定部104は、マイクロフォン7が集音した音声を音声処理装置210により解析した結果に基づいて、事象の発生を検知する。上記したように、事象特定部104は、音声処理装置210により音声の種類、言葉、音量、性質、トーン、しゃべり方、言語、方言、悲鳴、罵声などの認識結果を用いて事象の発生を検知する。所定の事象発生条件を満たした場合、事象特定部104は事象の発生を検知する。事象特定部104は、検知した事象の発生地点および発生時刻を、当該事象検知の根拠となった音声を集音したマイクロフォン7の位置情報と音声データのタイムスタンプなどの情報から、特定する。上記したように、事象の緊急度も事象特定部104により特定されてよい。事象特定部104により検知された事象発生に関する情報は、事象記憶部312に記憶されてよい。
【0083】
そして、抽出部106は、事象特定部104により特定された事象発生の位置情報と日時の情報を用いて関係者データベース310の移動履歴情報を検索する。特に抽出部106は、事象発生の日時の前後を含む情報を中心に検索するのが好ましい。そして、事象に関連する関係移動体に対応する少なくとも一つの特徴情報を抽出する。
【0084】
本実施形態によれば、移動履歴生成部102は、カメラ5が撮像した画像を処理することにより、対象地域に存在する移動体10を特定する特徴情報、およびその時の位置情報を生成するとともに、特徴情報と位置情報を時刻情報に関連付けた当該移動体10の移動履歴情報を生成して関係者データベース310に記憶させる。事象特定部104は、マイクロフォン7が集音した音声を解析することにより、事象の発生を検知するとともに、事象の発生地点および時刻を特定する。抽出部106は、事象特定部104により特定された発生地点および時刻を用いて関係者データベース310を検索することにより、関係移動体の特徴情報を抽出する。
【0085】
この構成により、情報処理装置100は、カメラ5の有無に関わらず、事象の発生を早期に検知し、その事象に関連する人物を含む関係移動体を事前に収集した画像から構築された関係者データベース310から探し出すことができる。
【0086】
(第2実施形態)
図7は、本実施形態に係る情報処理装置100の構成例を論理的に示す機能ブロック図である。本実施形態の情報処理装置100は、抽出された関係移動体の特徴情報の移動経路を推定する構成を有する点以外は上記実施形態と同様である。
図7の情報処理装置100は、
図3の情報処理装置100の構成に加え、さらに移動経路生成部108を有している。ただし、本実施形態の情報処理装置100は、他の実施形態の構成の少なくともいずれか一つと矛盾を生じない範囲で組み合わせてもよい。
【0087】
移動経路生成部108は、事象の発生地点の周囲に配置されたカメラ5の事象の発生時刻前後を含む画像を処理するとともに、事象の発生地点の周囲に配置されたマイクロフォン7の事象の発生時刻前後を含む音声を解析することにより、関係移動体をトラッキングし、関係移動体の移動経路を生成する。
【0088】
事象の発生地点の周囲に配置されたカメラ5またはマイクロフォン7の特定方法は、様々考えられ、以下に示すがこれらに限定されない。また以下の複数の方法を組み合わせてもよい。
(c1)事象の発生が検知された音声を集音したマイクロフォン7の位置情報を中心として半径10メートル以内の範囲に設置されているカメラ5をカメラテーブル302に記憶されているカメラ5の位置情報から検索する。あるいは、事象の発生が検知された音声を集音したマイクロフォン7の位置情報を中心として半径10メートル以内の範囲に設置されているマイクロフォン7をマイクロフォンテーブル304に記憶されているマイクロフォン7の位置情報から検索する。
(c2)カメラ5およびマイクロフォン7を、地域別、通路別、施設または建物別、あるいは、犯罪種別(推定される事象の種類)や犯罪者(関係移動体)の属性に応じて予め想定される逃走ルート別などに予めグルーピングしておき、事象の発生が検知された音声を集音したマイクロフォン7と同じグループに属するカメラ5およびマイクロフォン7を選択する。
【0089】
移動経路生成部108は、選択されたカメラ5の画像のうち、事象の発生時刻の前後所定時間分の画像を画像処理装置200に処理させることにより、関係移動体の特徴情報を画像から抽出し、関係移動体の画像特徴情報が抽出された画像を撮像したカメラ5の位置情報と、カメラ5の撮影方向や撮影範囲などの撮影情報に基づいて、関係移動体の画像特徴情報の時刻毎の位置情報および移動方向を推定する。移動経路生成部108は、1つのカメラ5が撮影した画像において、事象の発生時刻の前後所定時間分の画像内での関係移動体の移動方向および移動経路を推定するとともに、隣接する複数のカメラ5が撮影した画像において、事象の発生時刻の前後所定時間分の画像内での関係移動体の移動方向および移動経路を推定する。
【0090】
さらに、移動経路生成部108は、選択されたマイクロフォン7の音声のうち、事象の発生時刻の前後所定時間分の音声を音声処理装置210に解析させることにより関係移動体の音声の特徴情報を音声から抽出し、関係移動体の音声特徴情報が抽出された音声を集音したマイクロフォン7の位置情報と、マイクロフォン7の指向性や集音精度(集音可能な距離範囲など)に基づいて、関係移動体の音声特徴情報の時刻毎の位置情報および移動方向を推定する。移動経路生成部108は、1つのマイクロフォン7が集音した音声において、事象の発生時刻の前後所定時間分の音声内での関係移動体の移動方向および移動経路を推定するとともに、隣接する複数のマイクロフォン7が集音した音声において、事象の発生時刻の前後所定時間分の音声内での関係移動体の移動方向および移動経路を推定する。
【0091】
本実施形態では、カメラ5は例えば、主要な道路の交差点などに設置されているが、路地裏には設置されておらず、マイクロフォン7が路地裏に設置されていることを想定して説明する。
図8は、ある地域におけるカメラ5とマイクロフォン7の設置例を示す図である。この図の例では、主要な道路R1およびR2の交差点にそれぞれカメラ5aおよびカメラ5bが設置されている。さらに、路地裏には複数のマイクロフォン7a~7hが設置されている。
【0092】
例えば、マイクロフォン7aが集音した音声から事象の発生が検知された場合、マイクロフォン7aの周囲のカメラ5aで撮像された画像を画像処理装置200が処理することにより、関係移動体の人物M1の特徴情報が抽出される。移動経路生成部108は、カメラ5aの設置位置情報、および撮影方向や撮影範囲などの撮影情報から人物M1のその時点の位置と移動方向を算出する。カメラ5aで撮像された画像から関係移動体の人物M1の特徴情報が抽出されたため、カメラ5aの周囲のカメラ5bで撮像された画像のうち、事象が発生した時刻前後の所定時間分の画像について画像処理装置200が処理して関係移動体の特徴情報を探す。
【0093】
もし、関係移動体の人物M1がカメラ5bの撮影範囲内に移動した場合には、事象が発生した時刻前後の所定時間分のカメラ5bの撮像画像を画像処理装置200により処理することで関係移動体の人物M1の特徴情報が抽出でき、関係移動体の人物M1の移動経路を推定できる。一方、カメラ5bの事象が発生した時刻前後の所定時間分の画像内に関係移動体の人物M1の特徴情報が抽出されなかった場合には、関係移動体の人物M1はカメラ5bの撮影範囲内には移動していないと推定できる。
【0094】
さらに、マイクロフォン7aが集音した音声から事象の発生が検知されたとき、マイクロフォン7aの周囲の他のマイクロフォン7b~7hで集音された音声のうち、事象が発生した時刻前後の所定時間分の音声について、音声処理装置210が解析を行う。音声処理装置210は、関係移動体の音声特徴情報(例えば、人物M1のしゃべり声、話している言葉、しゃべり方、言語、方言、息づかい、声紋、泣き声、足音、荷物を引きずる音、衣服や装飾品の音、発砲音など)を音声の中から抽出する。移動経路生成部108は、関係移動体の音声特徴情報が抽出されたマイクロフォン7の位置情報、指向性、集音可能距離(範囲)に基づいて、関係移動体の位置と移動方向を推定する。
【0095】
移動経路生成部108は、事象が発生した時刻前後の所定時間分の複数のマイクロフォン7a~7hの音声の中から、関係移動体の人物M1の音声特徴情報を探し出す。
図8の例では、関係移動体の人物M1は、破線矢印の方向に沿って移動しているため、例えば、マイクロフォン7bで集音された音声から関係移動体の人物M1の音声特徴情報が抽出され、その後、マイクロフォン7cで集音された音声から関係移動体の人物M1の音声特徴情報が抽出される。その他のマイクロフォン7で集音された音声から関係移動体の人物M1の音声特徴情報は抽出されない。
【0096】
その後、時間経過とともに、マイクロフォン7b、マイクロフォン7cで集音された音声の中から関係移動体の人物M1の音声特徴情報が抽出されたとする。すると、移動経路生成部108は、事象が発生した地点Pから関係移動体の人物M1は、カメラ5aの方向に移動した後、右折し、マイクロフォン7bの前を通過し、右折して路地裏に入れ込み、マイクロフォン7cの周辺に身を潜めたことを推定する。
【0097】
なお、カメラ5aおよびカメラ5bで撮像された画像に写っている人物M2および人物M3は、関係移動体として特徴情報を関係者データベース310に登録されてもよい。特に、人物M2は、事象を目撃することができた人物として登録されてよい。
【0098】
抽出部106は、関係者データベース310から関係移動体の特徴情報を抽出する際に、例えば、事象の発生時に発生地点から、移動体10が存在している地点までの距離に応じて、事象との関係性を特定してもよい。抽出部106は、例えば、事象の発生地点から半径10メートル(第1距離)以内に存在している移動体10は事象に直接関係している当事者と特定して抽出してもよい。あるいは、抽出部106は、事象の発生地点から半径15~50メートル(第1距離より離れている第2距離)の範囲に存在している移動体10は事象の目撃者または事象に巻き込まれた人物として特定して抽出してもよい。
【0099】
移動経路生成部108により追跡された関係移動体の時刻毎の位置情報から関係移動体の移動経路は生成される。移動経路生成部108により生成された移動経路は、関係者移動履歴記憶部314に事象毎に日時情報に関連付けて記憶される。
【0100】
<動作例>
図9は、情報処理装置100の動作例を示すフローチャートである。
図9を用いて、移動経路生成部108による移動経路生成処理の手順について説明する。
まず、移動経路生成部108は、検知された事象の発生地点の周囲のカメラ5の事象の発生時刻前後を含む画像を画像処理装置200に処理させる(ステップS121)。カメラ5の画像内に関係移動体の特徴情報が含まれている場合、その特徴情報を抽出し、位置情報と日時を特定する。そして、移動経路生成部108は、特定された関係移動体の特徴情報に日時と位置情報を関連付けて関係者移動履歴記憶部314に記憶してもよい。
【0101】
次に移動経路生成部108は、検知された事象の発生地点の周囲のマイクロフォン7の事象の発生時刻前後を含む音声を音声処理装置210に解析させる(ステップS123)。マイクロフォン7の音声内に関係移動体の音声特徴情報が含まれている場合、その音声特徴情報を抽出し、位置情報と日時を特定する。そして、移動経路生成部108は、特定された関係移動体の音声特徴情報に日時と位置情報を関連付けて関係者移動履歴記憶部314に記憶してもよい。
【0102】
移動経路生成部108は、ステップS121で画像から特定された関係移動体の位置情報および移動方向と、ステップS123で音声から特定された関係移動体の位置情報および移動方向とを時系列に組み合わせて、関係移動体の移動経路を生成する(ステップS125)。生成された移動経路は関係者移動履歴記憶部314に記憶されてよい。
【0103】
また、ステップS123の音声解析処理は、ステップS121で特定された関係移動体の位置情報から推定される移動経路の周辺に設置されているマイクロフォン7が集音した音声について行うようにしてもよい。つまり、画像処理により特定された関係移動体の位置情報により大まかな移動経路上の位置間隔を、音声解析により特定された位置情報で補填して、より詳細な移動経路を推定することができる。
【0104】
さらに、移動経路生成部108は、関係移動体の時刻毎の位置情報の移動から関係移動体の移動速度を算出してもよい。移動経路生成部108は、関係移動体の移動速度から、関係移動体の移動手段をさらに特定してもよい。移動手段とは、例えば、徒歩、駆け足、自転車、バイク、自動車、バス、電車などを含む。
【0105】
さらに、移動経路生成部108は、特定済みの関係移動体の移動経路から所定時間先の移動先を、関係移動体の移動方向、移動速度、および移動手段に基づいて推定してもよい。推定される移動先は複数の候補が推定されてもよい。さらに、移動経路生成部108は、複数の候補の確度を算出してもよい。
【0106】
移動経路生成部108は、関係移動体の時間毎の移動先の候補地点を算出する。抽出部106は、この候補地点を中心として半径10メートル(第3距離)以内に存在している移動体を関係移動体の中でも事象の当事者として抽出し、当該関係移動体の移動経路を移動経路生成部108に生成させてもよい。また、この候補地点を中心として半径15~50メートル(第3距離より離れている第4距離)の範囲に存在している移動体を、事象の関係者として抽出し、当該関係移動体の移動経路を移動経路生成部108に生成させてもよい。抽出部106により抽出されたこれらの関係移動体の特徴情報は、関係者移動履歴記憶部314にさらに記憶されてよい。
【0107】
抽出部106は、抽出された関係移動体の中に、予め登録されている特定人物(例えば、要人)などが含まれているか否かを判別してもよい。特定人物が含まれている場合は、緊急度を高めてもよい。
【0108】
本実施形態によれば、移動経路生成部108は、事象の発生地点の周囲に配置されたカメラ5の事象の発生時刻前後を含む画像を処理するとともに、事象の発生地点の周囲に配置されたマイクロフォン7の事象の発生時刻前後を含む音声を解析することにより、関係移動体の移動経路を生成する。
【0109】
これにより、情報処理装置100は、事象に関連する関係移動体の移動経路を推定でき、関係移動体の追跡が可能になる。
【0110】
(第3実施形態)
図10は、本実施形態に係る情報処理装置100の構成例を論理的に示す機能ブロック図である。本実施形態の情報処理装置100は、発生事象または関係移動体に関する情報を出力処理する構成を有する点以外は上記実施形態と同様である。
図10情報処理装置100は、
図7の情報処理装置100の構成に加え、さらに出力処理部112を有している。さらに、情報処理装置100は、表示装置110に接続されている。ただし、本実施形態の情報処理装置100は、他の実施形態の構成の少なくともいずれか一つと矛盾を生じない範囲で組み合わせてもよい。
【0111】
<機能構成例>
出力処理部112は、事象特定部104により検知された事象に関する情報、および移動経路生成部108により生成された関係移動体の移動経路の少なくとも一方を報知情報として所定の出力先に出力させる。出力先は、様々考えられるが、例えば、監視センタの表示装置110の監視用のモニタ画面であってもよいし、警察官や警備員などが携帯している端末(不図示)であってもよいし、警察署の表示装置(不図示)の監視用のモニタ画面であってもよい。
【0112】
さらに、出力先は、事象が発生した周辺に居る所定の人物が携帯している端末(不図示)であってもよい。所定の人物とは、例えば、事象発生地点または関係移動体の移動経路周辺にいる人物であって、店舗の店員、宅配業者など街中を移動している人物、バスや路面電車などの公共交通機関の職員や運転手、タクシードライバー、旅行の添乗員や観光客などを含んでもよい。
【0113】
出力先となる端末には、予め通知を受信するためのアプリケーションがインストールされて起動されていて、通知を受信する状態で待機させることで通知を受信できてよい。また、通知を受信した後は、予めユーザ登録済みの所定のウェブサイトにログインすることで、発生した事象の関係移動体の移動経路を表示させることができてもよい。
【0114】
出力方法は、モニタ画面への表示、メールの送信、およびスピーカ(不図示)からの音声または警報音の出力の少なくともいずれか一つを含む。メールの送信先となるメールアドレス、携帯端末のIPアドレス、および携帯電話番号の少なくともいずれか一つの宛先は予め登録されていてもよいし、送信時に入力を受け付けてもよい。
【0115】
端末は、携帯電話、スマートフォン、タブレット端末、PDA(Personal Digital Assistant)、ノートPC(Personal Computer)パーソナルコンピュータなどを含む。
【0116】
出力内容は、検知された事象に関する報知情報として、事象の発生時間、発生場所、事象の種類、事象の内容、事象による被害状況、関係移動体の数、関係移動体の情報(顔写真、あるいは、画像から解析された属性情報(例えば、性別、年齢、容姿、服装など))、および移動経路などの情報を含んでもよい。出力内容は、事象の発生を伝えるとともに、避難を呼びかけるメッセージ、または後述するように事象への対処を依頼するメッセージを含んでもよい。移動経路は地図上にマッピングされて重畳表示されてもよい。関係移動体が利用している推定される移動手段(徒歩、自転車、小型車、中型車、大型車、バイクなど)も表示されるのが好ましい。さらに、移動経路上のカメラ5で撮影された画像を表示させてもよい。移動経路は、複数の候補を出力してもよい。移動先も複数の候補を出力してもよい。
【0117】
また、出力処理部112は、移動経路を示す地図と、移動経路上に設置されているカメラ5の映像とを、監視センタのディスプレイにマルチ表示させてもよい。
【0118】
また、情報処理装置100は、操作受付部(不図示)をさらに備えてもよい。操作受付部は、表示装置110に表示される各種画面への、監視システム1の管理者の操作を受け付ける。あるいは、操作受付部は、特定の人物の携帯端末に表示される画面への特定の人物の操作を受け付けてもよい。この場合、特定の人物の携帯端末にインストールされているアプリケーションが操作を受け付け、情報処理装置100に操作内容を送信し、操作受付部が受信してもよいし、所定のウェブサイトにアクセスすることで表示される画面上の操作を操作受付部が受け付けてもよい。
【0119】
出力処理部112は、事象の発生地点または関係移動体の移動先の周囲に居る人物の端末を、例えば、端末のGPS(Global Positioning System)受信機が示す位置情報を取得することで出力先となる端末を選択して報知情報を送信してもよい。さらに、出力処理部112は、事象発生地点または関係移動体の移動先に距離が近い順に上位から少なくとも一つの端末を出力先として選択して報知情報を送信してもよい。さらに、出力処理部112は、事象発生地点または関係移動体の移動先になるべく早く到着可能な人物の端末を特定して報知情報を送信してもよい。出力処理部112は、端末の位置情報の履歴情報から、端末の移動速度を算出し、端末の移動手段を特定することで、端末の位置から事象発生地点または関係移動体の移動先までの移動時間を算出し、移動時間が短い順に上位から少なくとも一つの端末を出力先として選択して報知情報を送信してもよい。ただし、出力先となる端末の選択処理は、移動経路生成部108が行ってもよい。
【0120】
端末への報知の目的は、(d1)発生事象への対処の要請、(d2)発生事象からの避難指示などである。端末側では、対処の要請を受け入れ可能な時間、あるいは、受け入れできない時間を設定できてよい。
【0121】
端末上に報知情報を通知するための画面は、以下が含まれてよい。
(e1)事象の緊急度および、想定される事象の内容の表示
(e2)対処に必要な道具や装備の表示
(e3)事象の発生場所の表示
(e4)対処要請に対する承諾ボタン/拒否ボタンの表示
【0122】
操作受付部が、端末において承諾ボタンの押下を受け付けた場合、対処要請に応じた当該端末に対して対処内容の詳細情報を送信して画面表示させる。具体的には以下の情報が送信されてよい。
(f1)関係移動体(人物または車両)に関する情報(画像を含む)、事象現場の画像(映像であってもよい)および音声
(f2)関係移動体に接触(ヒアリングの実施)を要請するメッセージと、当該要請に対する承諾ボタン/拒否ボタンの表示
【0123】
操作受付部は、端末において接触要請に対する承諾ボタンの押下を受け付けた場合、要請に応じた当該端末に対して関係移動体へのヒアリング項目リストを送信して画面表示させる。ヒアリング項目リストは、関係移動体に対して、いつ、どこで、何をしていて、今はここで何をしているのか、などの質問項目を含む。また、ヒアリングの内容は、関係移動体の属性、事象の種類、緊急度、事象発生地点の地域などの条件毎に複数の内容が準備されているのが好ましい。条件は出力処理部112が自動的に判別してヒアリング内容を選択してもよいし、対処しているユーザがプルダウン形式で選択して変更できてもよい。
【0124】
さらに、ヒアリング中、ユーザの端末のカメラまたはユーザが装備しているボディカメラなどと連携してヒアリングの様子を撮影、および音声を録音し、記録してもよい。さらに、ヒアリング中の会話の音声から、自動的に聞き取りに対する関係移動体の回答内容を音声認識により抽出して回答入力を受け付けてもよい。さらに、音声認識された内容は、編集画面により修正や内容の追加ができてもよい。ただし、変更履歴も記録されるのが好ましい。
【0125】
ヒアリングの実施状況(例えば、未実施、対応中、完了など)は、監視センタや管理者の端末、あるいは、通知を受信した他の特定の人物の端末などに送信され、画面表示されてもよい。
【0126】
端末においてヒアリング中の映像は、リアルタイムに監視センタに送信され、画面表示されるのが好ましい。出力処理部112は、端末から送信された画像を画像処理装置200を用いて処理することにより、以下の情報を生成する。
(g1)関係移動体(関係者)の個人データの本人確認を実施
(g2)関係移動体(関係者または車両)の過去の犯罪歴を検索
(g3)関係移動体(関係者)の目の動きや発汗量を解析(心理状態を推測)
(g4)関係移動体(関係者)の動作を解析
【0127】
上記の情報がヒアリングの結果の正確さおよび信憑性を評価し、端末から受信したヒアリングの結果とともにヒアリング記録情報として記憶装置300に記憶してもよい。評価方法は、例えば、ポイント数が高い程信憑性が高いと評価されるように、上記(g1)~(g4)の項目毎にポイントを設け、項目毎のポイント数を合算することで評価ポイントを算出してもよい。ポイント数が高い程信憑性が高いと評価してもよい。項目毎のポイント数や合計ポイント数もヒアリング記録情報に記憶してもよい。
【0128】
評価結果は、ヒアリング中にリアルタイムにヒアリング中の端末に送信してもよい。信憑性が低い評価結果が得られている場合には、ヒアリング項目の内容を変更できてもよい。変更は、出力処理部112が自動的に行ってもよいし、表示される評価結果を見ながら、ヒアリングをしているユーザがプルダウン形式のリストから選択して変更してもよい。
【0129】
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
【実施例0130】
本監視システム1を構築する際には、監視のリアルタイム性を重視するケースと、動作の軽さ(高速性)重視するケースなど、様々なケースが考えられる。以下、リアルタイム監視を実現する監視システム1の実施例1と、動作の軽さ(高速性)を実現する監視システム1の実施例2について説明する。
(実施例1)
実施例1の監視システム1は、リアルタイム監視を実現する構成を有する。
図11は、実施例1の監視システム1の構成例を示す図である。
監視システム1は、DBサーバ400と、VMS(Video Management System)410と、解析サーバ420と、DB圧縮サーバ430と、カメラ5と、マイクロフォン(各種センサを含む)7と、を備えている。DBサーバ400は、上記実施形態の情報処理装置100および記憶装置300に相当する。解析サーバ420は、上記実施形態の画像処理装置200および音声処理装置210に相当する。
【0131】
実施例1の監視システム1ではDBサーバ400の記憶装置は大きな容量が必要でありコストがかかるため、DB圧縮サーバ430を用いてDBサーバ400の容量を抑えている。
【0132】
図12は、実施例1の監視システム1の動作例を示すフローチャートである。このフローはリアルタイムに常時実行される。まず、VMS410は、カメラ5から画像をリアルタイムに取得し記憶する。さらに、DBサーバ400は、マイクロフォン7から音声をリアルタイムに取得し記憶する(ステップS201)。そして、解析サーバ420は、VMS410に記憶されている画像を処理し、DBサーバ400は、関係者データベース310を構築する(ステップS203)。
【0133】
そして、DBサーバ400の記憶装置の残容量が所定値より少なくなった場合(ステップS205のYES)、DB圧縮サーバ430は関係者データベース310を情報が古い順に圧縮して記憶する(ステップS207)。このとき、圧縮済みの元の情報はDBサーバ400の記憶装置から削除してよい。DBサーバ400の記憶装置の残容量が所定値より少なくなくない場合(ステップS205のNO)、ステップS207はバイパスして関係者データベース310の圧縮処理は行わない。
【0134】
さらに、所定期間が経過した場合(ステップS209のYES)、DB圧縮サーバ430に記憶されている圧縮データを古い順に削除する(ステップS211)。所定期間とは例えば、30日などである。所定期間が経過してない間は(ステップS209のNO)、ステップS211はバイパスしてデータ削除は行わない。実施例1ではこのフローが常時リアルタイムに繰り返し実行される。一方で、上記実施形態で説明した
図6の関係者抽出処理フローも常時リアルタイムに繰り返し実行される。これにより実施例1では、事象の発生をリアルタイムに捉え、リアルタイムに構築されている関係者データベース310の検索を行い、関係移動体の抽出を行うことができる。例えば、事象の発生頻度が高い地域において、実施例1の監視システム1が好適である。
【0135】
(実施例2)
実施例2の監視システム1は、動作の軽さ(高速性)を実現する構成を有する。実施例2の監視システム1は、実施例1と同じ構成を有している。ただし、実施例2の監視システム1は、DB圧縮サーバ430を有していなくてもよく、下記の動作例ではDB圧縮サーバ430は有している構成で説明する。
【0136】
図13は、実施例2の監視システム1の動作例を示すフローチャートである。このフローもリアルタイムに常時実行される。まず、VMS410は、カメラ5から画像をリアルタイムに取得し記憶する。さらに、DBサーバ400は、マイクロフォン7から音声をリアルタイムに取得し記憶する(ステップS201)。解析サーバ420は、所定時間が経過したとき(ステップS301のYES)、VMS410に記憶されている画像を処理し、DBサーバ400は、関係者データベース310を構築する(ステップS203)。ここで、所定時間とは、例えば、15分である。そして、所定時間が経過していない間は、ステップS203はバイパスして関係者データベース310の構築処理を行わない。
【0137】
さらに、所定期間が経過した場合(ステップS209のYES)、DB圧縮サーバ430に記憶されている圧縮データを古い順に削除する(ステップS211)。所定期間とは例えば、30日などである。所定期間が経過してない間は(ステップS209のNO)、ステップS211はバイパスしてデータ削除は行わない。
【0138】
そして、上記実施形態で説明した
図6の関係者抽出処理フローを実行する。解析サーバ420がマイクロフォン7から取得した音声をリアルタイムに解析し、事象が検知された場合(ステップS303のYES)、DBサーバ400は関係者データベース310の検索処理を開始する(ステップS305)。そして、ステップS201に戻る。ステップS305により開始された検索処理と並行してステップS201以降の処理は行われてよい。事象が検知されない場合(ステップS303のNO)、ステップS201に戻る。
【0139】
実施例2の構成では、関係者データベース310の構築処理を所定時間毎に行うことで、サーバの処理負荷を低減できる。例えば、事象の発生が少ない地域で、事象検知後の関係者データベース310の検索処理が行われる頻度が少ない場合などに実施例2の監視システム1が好適である。
【0140】
以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
なお、本発明において利用者に関する情報を取得および/または利用する場合は、これを適法に行うものとする。
【0141】
以下、参考形態の例を付記する。
1. 画像を処理することにより、対象地域に存在する移動体を特定する特徴情報、およびその時の位置情報を生成するとともに、前記特徴情報と前記位置情報を時刻情報に関連付けた当該移動体の移動履歴情報を生成して関係者データベースに記憶させる移動履歴生成手段と、
位置情報および時刻情報に紐づいた音声を解析することにより、事象の発生を検知するとともに、前記事象の発生地点および時刻を特定する事象特定手段と、
前記事象特定手段により特定された前記発生地点および時刻を用いて前記関係者データベースを検索することにより、前記事象に関連する前記移動体、および前記事象を目撃可能な地点に存在した前記移動体の少なくとも一方である関係移動体の特徴情報を抽出する抽出手段と、を備える、情報処理装置。
2. 1.に記載の情報処理装置において、
前記移動体は、人および車両の少なくとも一方を含む、情報処理装置。
3. 1.または2.に記載の情報処理装置において、
前記事象の発生地点の周囲に配置されたカメラの前記事象の発生時刻前後を含む画像を処理するとともに、および前記事象の発生地点の周囲に配置されたマイクロフォンの前記事象の発生時刻前後を含む音声を解析することにより、前記関係移動体の移動経路を生成する移動経路生成手段をさらに備える、情報処理装置。
4. 3.に記載の情報処理装置において、
前記移動経路生成手段は、前記関係移動体の時刻毎の前記位置情報から前記関係移動体の移動速度を算出し、算出された前記移動速度から前記関係移動体の移動手段を特定する、情報処理装置。
5. 1.から4.のいずれか一つに記載の情報処理装置において、
前記移動履歴生成手段は、
前記移動履歴情報を生成するときに、前記画像および音声の少なくとも一方を使用する情報処理装置。
6. 1.から5.のいずれか一つに記載の情報処理装置において、
前記事象特定手段は、人が発した単語または文章を用いて前記事象の発生を検知する、情報処理装置。
7. 1.から6.のいずれか一つに記載の情報処理装置において、
前記事象特定手段は、前記事象の発生時の音声情報を用いて、前記事象の属性情報を生成し、
前記抽出手段は、前記事象の属性情報もさらに用いて前記関係者データベースを検索する、情報処理装置。
8. 7.に記載の情報処理装置において、
前記事象の属性情報は、事象の種類、規模、及び緊急性の少なくとも一つを含む、情報処理装置。
9. 8.に記載の情報処理装置において、
前記事象特定手段は、前記事象の緊急性を、対象人物に特定人物が含まれるか否かを用いて特定する、情報処理装置。
【0142】
10. 情報処理装置が、
画像を処理することにより、対象地域に存在する移動体を特定する特徴情報、およびその時の位置情報を生成するとともに、前記特徴情報と前記位置情報を時刻情報に関連付けた当該移動体の移動履歴情報を生成して関係者データベースに記憶させ、
位置情報および時刻情報に紐づいた音声を解析することにより、事象の発生を検知するとともに、前記事象の発生地点および時刻を特定し、
特定された前記発生地点および時刻を用いて前記関係者データベースを検索することにより、前記事象に関連する前記移動体、および前記事象を目撃可能な地点に存在した前記移動体の少なくとも一方である関係移動体の特徴情報を抽出する、情報処理方法。
11. 10.に記載の情報処理方法において、
前記移動体は、人および車両の少なくとも一方を含む、情報処理方法。
12. 10.または11.に記載の情報処理方法において、
前記情報処理装置が、さらに、
前記事象の発生地点の周囲に配置されたカメラの前記事象の発生時刻前後を含む画像を処理するとともに、および前記事象の発生地点の周囲に配置されたマイクロフォンの前記事象の発生時刻前後を含む音声を解析することにより、前記関係移動体の移動経路を生成する、情報処理方法。
13. 12.に記載の情報処理方法において、
前記情報処理装置が、
前記関係移動体の時刻毎の前記位置情報から前記関係移動体の移動速度を算出し、算出された前記移動速度から前記関係移動体の移動手段を特定する、情報処理方法。
14. 10.から13.のいずれか一つに記載の情報処理方法において、
前記情報処理装置が、
前記移動履歴情報を生成するときに、前記画像および音声の少なくとも一方を使用する情報処理方法。
15. 10.から14.のいずれか一つに記載の情報処理方法において、
前記情報処理装置が、
人が発した単語または文章を用いて前記事象の発生を検知する、情報処理方法。
16. 10.から15.のいずれか一つに記載の情報処理方法において、
前記情報処理装置が、
前記事象の発生時の音声情報を用いて、前記事象の属性情報を生成し、
前記事象の属性情報もさらに用いて前記関係者データベースを検索する、情報処理方法。
17. 16.に記載の情報処理方法において、
前記事象の属性情報は、事象の種類、規模、及び緊急性の少なくとも一つを含む、情報処理方法。
18. 17.に記載の情報処理方法において、
前記情報処理装置が、
前記事象の緊急性を、対象人物に特定人物が含まれるか否かを用いて特定する、情報処理方法。
【0143】
19. コンピュータに、
画像を処理することにより、対象地域に存在する移動体を特定する特徴情報、およびその時の位置情報を生成するとともに、前記特徴情報と前記位置情報を時刻情報に関連付けた当該移動体の移動履歴情報を生成して関係者データベースに記憶させる手順、
位置情報および時刻情報に紐づいた音声を解析することにより、事象の発生を検知するとともに、前記事象の発生地点および時刻を特定する手順、
特定された前記発生地点および時刻を用いて前記関係者データベースを検索することにより、前記事象に関連する前記移動体、および前記事象を目撃可能な地点に存在した前記移動体の少なくとも一方である関係移動体の特徴情報を抽出する手順、を実行させるためのプログラム。
20. 19.に記載のプログラムにおいて、
前記移動体は、人および車両の少なくとも一方を含む、プログラム。
21. 19.または20.に記載のプログラムにおいて、さらに、
前記事象の発生地点の周囲に配置されたカメラの前記事象の発生時刻前後を含む画像を処理するとともに、および前記事象の発生地点の周囲に配置されたマイクロフォンの前記事象の発生時刻前後を含む音声を解析することにより、前記関係移動体の移動経路を生成する手順、をコンピュータに実行させるためのプログラム。
22. 21.に記載のプログラムにおいて、
前記関係移動体の時刻毎の前記位置情報から前記関係移動体の移動速度を算出し、算出された前記移動速度から前記関係移動体の移動手段を特定する手順、をコンピュータに実行させるためのプログラム。
23. 19.から22.のいずれか一つに記載のプログラムにおいて、
前記移動履歴情報を生成するときに、前記画像および音声の少なくとも一方を使用する手順、をコンピュータに実行させるためのプログラム。
24. 19.から23.のいずれか一つに記載のプログラムにおいて、
人が発した単語または文章を用いて前記事象の発生を検知する手順、をコンピュータに実行させるためのプログラム。
25. 19.から24.のいずれか一つに記載のプログラムにおいて、
前記事象の発生時の音声情報を用いて、前記事象の属性情報を生成する手順、
前記事象の属性情報もさらに用いて前記関係者データベースを検索する手順、をコンピュータに実行させるためのプログラム。
26. 25.に記載のプログラムにおいて、
前記事象の属性情報は、事象の種類、規模、及び緊急性の少なくとも一つを含む、プログラム。
27. 26.に記載のプログラムにおいて、
前記事象の緊急性を、対象人物に特定人物が含まれるか否かを用いて特定する手順、をコンピュータに実行させるためのプログラム。