IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ TOA株式会社の特許一覧

<>
  • 特開-コミュニケーションシステム 図1
  • 特開-コミュニケーションシステム 図2
  • 特開-コミュニケーションシステム 図3
  • 特開-コミュニケーションシステム 図4
  • 特開-コミュニケーションシステム 図5
  • 特開-コミュニケーションシステム 図6
  • 特開-コミュニケーションシステム 図7
  • 特開-コミュニケーションシステム 図8
  • 特開-コミュニケーションシステム 図9
  • 特開-コミュニケーションシステム 図10
  • 特開-コミュニケーションシステム 図11
  • 特開-コミュニケーションシステム 図12
  • 特開-コミュニケーションシステム 図13
  • 特開-コミュニケーションシステム 図14
  • 特開-コミュニケーションシステム 図15
  • 特開-コミュニケーションシステム 図16
  • 特開-コミュニケーションシステム 図17
  • 特開-コミュニケーションシステム 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023048554
(43)【公開日】2023-04-07
(54)【発明の名称】コミュニケーションシステム
(51)【国際特許分類】
   H04M 11/00 20060101AFI20230331BHJP
   H04N 7/18 20060101ALI20230331BHJP
   G08B 25/00 20060101ALI20230331BHJP
【FI】
H04M11/00 301
H04N7/18 D
G08B25/00 510M
【審査請求】未請求
【請求項の数】3
【出願形態】OL
(21)【出願番号】P 2021157939
(22)【出願日】2021-09-28
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLUETOOTH
(71)【出願人】
【識別番号】000223182
【氏名又は名称】TOA株式会社
(72)【発明者】
【氏名】鈴木 章弘
【テーマコード(参考)】
5C054
5C087
5K201
【Fターム(参考)】
5C054CH05
5C054DA01
5C054DA09
5C054FC00
5C054GB01
5C054GD05
5C054GD06
5C054HA18
5C087AA02
5C087AA44
5C087BB02
5C087DD05
5C087DD20
5C087EE16
5C087FF02
5C087FF04
5C087GG06
5K201BA02
5K201BA03
5K201BA05
5K201BB08
5K201CA01
5K201CA04
5K201CB06
5K201CC02
5K201CC04
5K201DC05
5K201DC07
5K201EA05
5K201EC06
5K201ED02
5K201EF03
5K201EF04
5K201EF07
(57)【要約】      (修正有)
【課題】インターカムシステムや監視カメラシステムを融合する等してより付加価値の高いコミュニケーションシステムを提供する。
【解決手段】コミュニケーションシステム1は、通話端末を含むインターカムシステム(通信システム10)と、監視カメラ41を含む監視カメラシステム40と、を備える。通話端末は、話者の音声を収音するマイクと、話者を撮影するカメラとを有する。監視カメラシステムは、監視カメラの撮影映像を画像認識することにより第1イベントを検知し、第1イベントを示す第1通知を送信することにより、インターカムシステムは、マイクから入力される音声の録音とカメラの撮影映像の録画のうち少なくとも一方を開始する。インターカムシステムは、音声認識と画像認識のうち少なくとも一方を行って第2イベントを検知し、第2イベントを示す第2通知を送信することにより、監視カメラシステムは、監視カメラによる撮影を開始する。
【選択図】図1
【特許請求の範囲】
【請求項1】
エリア内に存する通話端末を含むインターカムシステムと、
前記エリア内に存する監視カメラを含む監視カメラシステムとを備え、
前記通話端末は、話者の音声を収音するマイクと、話者を撮影する位置に設けられたカメラとを有し、
前記監視カメラシステムは、前記監視カメラの撮影映像を画像認識することにより前記エリア内の第1イベントを検知し、当該第1イベントに応答して前記インターカムシステムに対して前記第1イベントを示す第1通知を送信することにより、前記インターカムシステムは、前記第1通知に応答して前記マイクから入力される音声の録音と前記カメラの撮影映像の録画のうち少なくとも一方を開始する第1イベント検知応答動作を実行し、
前記インターカムシステムは、前記通話端末の前記マイクから入力される音声の音声認識と前記通話端末の前記カメラの撮影映像の画像認識のうち少なくとも一方を行って前記エリア内の第2イベントを検知し、当該第2イベントに応答して前記監視カメラシステムに対して前記第2イベントを示す第2通知を送信することにより、前記監視カメラシステムは、前記第2通知に応答して前記監視カメラによる撮影を開始する第2イベント検知応答動作を実行するコミュニケーションシステム。
【請求項2】
複数の通話端末と、
複数の監視カメラと、
前記複数の通話端末の設置位置と、前記複数の監視カメラの設置位置とを含むデータベースとを備え、
前記通話端末は、話者の音声を収音するマイクと、話者を撮影する位置に設けられたカメラとを有し、
前記監視カメラは、撮影映像を画像認識することにより第1イベントを検知し、当該第1イベントに応答して、前記データベースを参照して自機の設置位置から所定範囲内にある1つ以上の前記通話端末に対し前記第1イベントを示す第1通知を送信することにより、当該1つ以上の通話端末は、前記第1通知に応答して前記マイクから入力される音声の録音と前記カメラの撮影映像の録画のうち少なくとも一方を開始する第1イベント検知応答動作を実行し、
前記通話端末は、前記マイクから入力される音声の音声認識と前記カメラの撮影映像の画像認識のうち少なくとも一方を行って第2イベントを検知し、当該第2イベントに応答して、前記データベースを参照して自機の設置位置から所定範囲内にある1つ以上の前記監視カメラに対して前記第2イベントを示す第2通知を送信することにより、当該1つ以上の監視カメラは、前記第2通知に応答して撮影を開始する第2イベント検知応答動作を実行するコミュニケーションシステム。
【請求項3】
請求項1又は2に記載のコミュニケーションシステムであって、
前記第1イベントの検知は、撮影映像の画像認識により物体を検知することを含み、
前記第2イベントの検知は、音声の音声認識により悲鳴等の特定の発声を検知することと、撮影映像の画像認識により物体を検知することのうち少なくとも一方を含むコミュニケーションシステム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、インターカムやIPスピーカーを用いた構内通話、拡声放送や、監視カメラシステムを用いた映像監視、映像記録等を統合して運用することができるコミュニケーションシステムに関する。
【背景技術】
【0002】
インターカムシステムは、主として構内通話を行うシステムである。典型的には、インターカムシステムは、1つ以上の通話端末と、1つ以上のスピーカーのような拡声機器を含む。各通話端末は、マイクやスピーカーを備え、ネットワークを介して相互に接続されている。各通話端末は、SIPプロトコル等所定のプロトコルに従って、入力された音声を別の通話先の通話端末に伝送することで、構内通話を行う。また、各通話端末は、入力された音声を拡声機器に送信することで、拡声機器からの拡声方法を行う。
【0003】
監視カメラシステムは、主として防犯用途で用いられるシステムである。典型的には、監視カメラシステムは、1つ以上の監視カメラと、各監視カメラが接続されるレコーダーが含む。各監視カメラは、天井や壁面等の所定の場所に据え付けられるカメラや、ドローンや自動車等の移動体に備え付けられるカメラを含む。レコーダーは、監視カメラの撮影映像を受信し、内蔵や外付けの記録媒体に保存することで録画することや、リアルアイムで外部のディスプレイに対して撮影映像を出力することでライブ視聴することができる。
【0004】
インターカムシステムの一例が特許文献1に開示されている。監視カメラシステムの一例が特許文献2に開示されている。
【特許文献1】特開2006-114951号
【特許文献2】特開2009-296207号
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、インターカムシステムや監視カメラシステムを融合する等してより付加価値の高いコミュニケーションシステムを提供することを目的とする。
【課題を解決するための手段】
【0006】
コミュニケーションシステムは、エリア内に存する通話端末を含むインターカムシステムと、前記エリア内に存する監視カメラを含む監視カメラシステムとを備える。前記通話端末は、話者の音声を収音するマイクと、話者を撮影する位置に設けられたカメラとを有する。前記監視カメラシステムは、前記監視カメラの撮影映像を画像認識することにより前記エリア内の第1イベントを検知し、当該第1イベントに応答して前記インターカムシステムに対して前記第1イベントを示す第1通知を送信することにより、前記インターカムシステムは、前記第1通知に応答して前記マイクから入力される音声の録音と前記カメラの撮影映像の録画のうち少なくとも一方を開始する第1イベント検知応答動作を実行する。前記インターカムシステムは、前記通話端末の前記マイクから入力される音声の音声認識と前記通話端末の前記カメラの撮影映像の画像認識のうち少なくとも一方を行って前記エリア内の第2イベントを検知し、当該第2イベントに応答して前記監視カメラシステムに対して前記第2イベントを示す第2通知を送信することにより、前記監視カメラシステムは、前記第2通知に応答して前記監視カメラによる撮影を開始する第2イベント検知応答動作を実行する。
【発明の効果】
【0007】
本発明により、より付加価値の高いコミュニケーションシステムを提供することができる。
【図面の簡単な説明】
【0008】
図1図1は、本発明の実施形態に係るコミュニケーションシステムを示す図である。
図2図2は、LANとWANを含むコミュニケーションシステムの構成例を示す図である。
図3図3は、通話システム内の通話端末の構成例を示す図である。
図4図4は、動作モードに応じて異なる録画動作の一例を示す図である。
図5図5は、動作モードに応じて異なる録画動作の一例示す図である。
図6図6は、通話システムと監視カメラシステム間でのイベント検知機能の一例を示すフローチャートである。
図7図7は、通話システムの通話エリアの場所と監視カメラシステムの監視エリアの場所とを対応付けるデータベースの一例を示す図である。
図8図8は、通話システムの通話エリアの場所と監視カメラシステムの監視エリアの場所とを対応付けるデータベースの一例を示す図である。
図9図9は、監視カメラシステム内の監視カメラの構成例を示す図である。
図10図10は、本発明の実施形態に係るコミュニケーションシステムにおいて、AI処理部を有する構成例を示す図である。
図11図11は、拡声システム内のIPスピーカーの構成例を示す図である。
図12図12は、通話システムにおける録音放送機能の一例を示すフローチャートである。
図13図13は、通話システムと拡声システム間のダウンロード放送機能の一例を示すフローチャートである。
図14図14は、通話システムと拡声システム間の一斉放送機能の一例を示すフローチャートである。
図15図15は、拡声システム内のページングゲートウェイが非常信号源と接続されている構成例を示す図である。
図16図16は、非常放送との共存機能におけるページングゲートウェイとIPスピーカーの動作フローの一例を示すフローチャートである。
図17図17は、非常放送との共存機能におけるページングゲートウェイの動作フローの一例を示すフローチャートである。
図18図18は、非常放送との共存機能におけるIPスピーカーの動作フローの一例を示すフローチャートである。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態について図面を参照して説明する。図1は、実施形態に係るコミュニケーションシステム1を示す。コミュニケーションシステム1は、通話システム10と、システムマネージャー20と、レコーダー30と、監視カメラシステム40と、拡声システム50とを含む。通話システム10と、システムマネージャー20と、レコーダー30と、監視カメラシステム40と、拡声システム50とは、ネットワークを介して相互に接続されている。
【0010】
通話システム10は、1つ以上の通話端末11を含む。通話端末11は、音声通話を行う端末であって、ネットワークを介して他の通話端末11と音声データの送受信を行うことで音声通話を行う機能を有する。各通話端末11には、ネットワーク上で自己を固有に識別する識別子(例えば、IPアドレス)が割り当てられている。通話端末11は、音声通話時、IP通話用のプロトコルに準拠して音声データや映像データの送受信を行う。IP通話用のプロトコルの一例は、IETF(Internet Engineering Task Force:インターネット技術タスクフォース)により標準化されRFC3261にて規定されているSIP(Session Initiation Protocol)である。
【0011】
システムマネージャー20は、通話端末11がIP通話用プロトコルに従って音声データや映像データの送受信処理を行うための制御装置である。送受信処理は、発呼等の呼制御を含む。例えば、システムマネージャー20は、SIPに準拠して呼制御を行うSIPサーバーである。システムマネージャー20には、ネットワーク上で自己を固有に識別する識別子(例えば、IPアドレス)が割り当てられている。
【0012】
レコーダー30は、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の記録媒体を備える録画装置である。レコーダー30は、通話端末11と同様にIP通話用プロトコルに準拠しており、IP通話用プロトコルに従って通話端末11から送信される映像データを録画する機能を有する。レコーダー30には、ネットワーク上で自己を固有に識別する識別子(例えば、IPアドレス)が割り当てられている。
【0013】
監視カメラシステム40は、防犯用途等で所定のエリア(監視エリア)を監視するためのシステムであり、1つ以上の監視カメラ41とレコーダー42を含む。各監視カメラ41は、CCDやCMOS等の画像センサーで取得した映像信号から映像データを生成し、外部に送信する機能を有する。監視カメラ14は、監視カメラシステム用の伝送プロトコルに準拠して映像をストリーミング送信する。監視カメラシステム用伝送プロトコルの一例は、ONVIF(Open Network Video Interface Forum)規格に準拠したプロトコルである。各監視カメラ41には、ネットワーク上で自己を固有に識別する識別子(例えば、IPアドレス)が割り当てられている。監視カメラ41は、レコーダー42は、HDDやSSD等の記録媒体を備える録画装置であり、接続された監視カメラ41から送信される映像データを録画する機能を有する。レコーダー42は、監視カメラ41と同様に監視カメラシステム用伝送プロトコルに準拠して映像データを受信して録画する。レコーダー42には、ネットワーク上の固有の識別情報(例えば、IPアドレス)が割り当てられている。レコーダー42は、マイクを介した音声入力機能を有し、マイクから入力された音声から音声データを生成し、外部に送信する機能を有する。レコーダー42は、監視カメラシステム用伝送プロトコルに準拠して音声データを送信する。監視カメラシステム40は、VMS(Video Management System)によって統合管理されてもよい。VMSによって統合管理される場合、PC(Personal Computer)にインストールされたVMSソフトウェアによって、監視カメラ41及びレコーダー42が制御され管理される。VMSによって統合管理される場合、レコーダー42は、VMSソフトウェアがインストールされ、HDDやSSD等の記録媒体を備えるPCであってもよく、この場合、PCに備わるマイクから入力された音声の音声データを外部に送信する。
【0014】
拡声システム50は、災害時の避難誘導やBGM等の音楽再生等の用途のため所定のエリア(拡声エリア)に設けられたシステムであり、1つ以上のIPスピーカー51を含む。各IPスピーカー51にはネットワーク上の固有の識別情報(例えば、IPアドレス)が割り当てられている。IPスピーカー51は、通話端末11と同様のIP通話用プロトコルと、レコーダー42と同様の監視カメラシステム用伝送プロトコルとに準拠して、音声データを受信して再生し拡声する機能を有する。また、拡声システム50は、IPスピーカー51と同一のネットワークに接続されたページングゲートウェイ52を含む。ページングゲートウェイ52には、ネットワーク上の固有の識別情報(例えば、IPアドレス)が割り当てられている。ページングゲートウェイ52は、通話端末11と同様のIP通話用プロトコルと、レコーダー42と同様の監視カメラシステム用伝送プロトコルとに準拠して、ネットワークを介して音声データを受信し、ネットワークを介してIPスピーカー51に音声データを転送する機能を有する。すなわち、ページングゲートウェイ52は、IPスピーカー51向けの音声データをいったん受け取り、IPスピーカー51に音声データを転送することで一斉同報させることができる。ページングゲートウェイ52は、マルチキャストやブロードキャストにより音声データをIPスピーカー51に転送するとよい。IPスピーカー51は、イーサネットケーブやセルラー通信等の無線通信媒体を介してデジタル化された音声データを受信し、再生する。
【0015】
このように、コミュニケーションシステム1において、通話システム10と、システムマネージャー20と、レコーダー30と、監視カメラシステム40と、拡声システム50とはネットワークを介して相互接続されており、通話システム10の通話端末11同士で音声通話を行ったり、通話システム10の通話端末11から拡声システム50のIPスピーカー51に音声放送を行ったり、監視カメラシステム40のレコーダー42から拡声システムのIPスピーカー51に音声放送を行ったりすることができる。
【0016】
図2に示すように、コミュニケーションシステム1は、複数のLAN(Local Area Network)と、これらを相互接続するインターネット等のWAN(Wide Area Network)を介して構成されてもよい。通話システム10と、システムマネージャー20と、レコーダー30と、監視カメラシステム40と、拡声システム50とのそれぞれがLAN上に構成され、相互接続される。このような構成において、複数のLANを跨いで、異なる通話システム10間で通話端末11同士の音声通話を行ったり、一方のLAN内の通話システム10の通話端末11から他方のLAN内の拡声システム50のIPスピーカーに音声放送を行ったり、一方のLAN内の監視カメラシステム40のレコーダー42から他方のLAN内の拡声システム50のIPスピーカー51に音声放送を行ったり、多様なコミュニケーションを行うことができる。通話システム10がLAN上で構成される場合、通話端末11は、LANを構成するルーターにイーサネットケーブルで接続され、イーサネットケーブルを介して音声データを送信するとともに、イーサネットケーブルを介してPoE(Power over Ethernet)給電されるとよい。監視カメラシステム40がLAN上で構成される場合、監視カメラ41やレコーダー42は、LANを構成するルーターにイーサネットケーブルで接続され、イーサネットケーブルを介して映像データを送受信するとともに、イーサネットケーブルを介してPoE給電されるとよい。拡声システム50がLAN上で構成される場合、IPスピーカー51やページングゲートウェイ52は、LANを構成するルーターにイーサネットケーブルで接続され、イーサネットケーブルを介して音声データを受信するとともに、イーサネットケーブルを介してPoE給電されるとよい。
【0017】
以下、IP通話用プロトコルとしてSIPを用い、監視カメラシステム用伝送プロトコルとしてONVIFプロトコルを用いる例で説明する。
【0018】
通話端末11は、図3に示すように、マイク110と、スピーカー111と、カメラ112と、表示部113と、入力部114とを備える。マイク110は、通話端末11の筐体から外側に収音方向が向けられた電気音響変換器であり、通話端末11に対して話しかける話者の音声を収音して音声信号を出力する。スピーカー111は、通話端末11の筐体から外側に放音方向が向けられた電気音響変換器であり、音声データが再生されて得た音声を出力する。カメラ112は、CCDイメージセンサーやCMOSイメージセンサー等の撮像素子を含む撮像装置であり、通話端末11の筐体から外側であって通話端末11に対して話しかける話者の姿が映る方向に撮像方向が向けられている。カメラ112は、撮影して得て映像信号から静止画又は動画の映像データを生成して出力する。表示部113は、LCDや有機EL等の表示素子を含むディスプレイであり、自端末11や他の通信端末11のカメラ112で撮影した映像や、その他GUI等に係る画像を表示する。入力部114は、ボタンやスイッチ等、ユーザーの操作を受け付ける入力デバイスである。入力部114と表示部113とは統合されてタッチパネルを構成してもよい。通話端末11は、机上や卓上に置くタイプのものや壁掛け、壁埋め込みタイプのものなど、種々の態様を取りうる。通話端末11は、いわば、スピーカーフォン、インターフォン、インターカムと呼ばれる通話装置である。
【0019】
(動作モード)
通話端末11は、複数の動作モードで動作する。動作モードとして少なくとも待機も度と通話モードと拡声モードとを有する。待機モードは、通話端末11への電源投入後、他の通話端末11との通話も行わず、IPスピーカー51やページングゲートウェイ52への拡声放送も行わない間、待機モードで動作する。待機モードは、一般待機モードと監視待機モードとを含む。一般待機モードは、マイク110とスピーカー111とカメラ112とをOFFにして音声も映像も外部に送信しないモードである。監視待機モードは、防犯用途のため少なくとも映像を監視カメラシステム40に伝送するモードであり、少なくともカメラ112と任意にマイク110とをONにし、スピーカー111はOFFにするモードである。通話端末11は、待機モード時、入力部114からのユーザー操作に応じた手動で、又は所定の条件に従って自動的に、一般待機モードと監視待機モードとを切り替える。例えば、通話端末11は、待機モード時、デフォルトでは一般待機モードで動作し、入力部114からのユーザー操作に応答して監視待機モードに切り替える。例えば、通話端末11は、待機モード時、デフォルトでは一般待機モードで動作し、所定のスケジュールに従って所定の時間の到来に応答して監視待機モードに切り替える。
【0020】
通話端末11は、待機モード中に、入力部114からのユーザー操作に応じた手動で、又は所定の条件に従って自動的に、通話モード又は拡声モードに切り替える。通話モードは、通話端末11が他の通話端末11との間で音声データの送受信を行い、複数の通話端末11間で通話を行うモードである。拡声モードは、通話端末11がIPスピーカー51に音声データを送信してIPスピーカー51から音声を拡声させるモードである。例えば、通話端末11は、入力部114を介した、通話相手となる他の通話端末11の宛先を選択して発呼する操作に応答して通話モードに遷移する。例えば、通話端末11は、他の通話端末11からの発呼を受信することに応答して通話モードに遷移する。例えば、通話端末11は、入力部114を介した、他の通話端末11からの発呼に応答するユーザー操作に応答して通話モードに遷移する。例えば、通話端末11は、入力部114を介した、拡声放送相手となるIPスピーカー51又はページングゲートウェイ52の宛先を選択して発呼する操作に応じて拡声モードに遷移する。通信端末11は、通話モード時、音声通話(ビデオ通話)のためマイク110とスピーカー111とカメラ112とをONにする。通話端末11は、拡声モード時、拡声放送のためマイク110をONにする。通話端末11は、通話モード時、通話相手の通話端末11との通信を終了して通話が終了すると、通話モードを終了して待機モードに遷移する。通話端末11は、拡声モード時、IPスピーカー51又はページングゲートウェイ52との通信を終了すると、拡声モードを終了して待機モードに遷移する。
【0021】
(通話機能)
通話端末11は、通話モード時、ONされているマイク110から入力された音声の音声データとカメラ112が撮影している映像の映像データを、SIPを用いて宛先となる他の通話端末11(通話相手の通話端末11)に送信する。また、通話モード時、他の通話端末11からSIPで送信されてくる音声データを再生してスピーカー111から音声を出力し、送信されてくる映像データを再生して表示部113に表示する。また、通話端末11は、通話相手の通話端末11への送信と並行して、マイク110から入力された音声の音声データと、カメラ112の撮影映像の映像データと、通話相手の通話端末11から送信されてくる音声データ及び映像データとをSIPを用いてレコーダー30に送信する。レコーダー30は、SIPに従って受信した音声データと映像データを、通話記録として録画する。通話端末11は、通話を終了して通話モードを終了すると、これに応答して、通話相手の通話端末11との間での音声データ及び映像データの送受信を終了し、レコーダー30への音声データ及び映像データの送信を終了する。レコーダー30は、通話モードになった通信端末11から音声データ及び映像データの受信を開始すると録画を開始し、通話モードが終了して通信端末11から音声データ及び映像データの受信が止まると録画を終了し、その間録画して生成した映像データを通話記録として保存する。レコーダー30は、録画の開始及び終了ごとに1つの動画ファイルを生成することで、一回の通話がなされるたびに通話記録として個別の動画ファイルが生成されるようにするとよい。
【0022】
通話端末11は、拡声モード時、ONされているマイク110から入力された音声の音声データを、SIPを用いて宛先となるIPスピーカー51又はページングゲートウェイ52に送信する。
【0023】
(録画機能)
通話端末11は、監視待機モード時、ONされているカメラ112が撮影している映像の映像データとマイク110から入力された音声の音声データとを生成し、ONVIFプロトコルを用いて常時レコーダー42に送信する。レコーダー42は、ONVIFプロトコルに従って受信した映像データと音声データを記録媒体に記録することで録画する。通信端末11は、監視待機モードにおけるレコーダー42への録画は、通話モード又は拡声モードに遷移しても継続する。監視待機モード時の動作について、図4及び図5を参照して説明する。監視待機モードに設定されている間、通話端末11は、常時、音声データと映像データをレコーダー42に送信して防犯用途の録画を実行する。通話端末11は、監視待機モード中に、通話モードが開始しても、レコーダー42への録画動作を終了しない。通話モード時、通信端末11は、レコーダー42への音声データと映像データの送信を継続しつつ、並行して、通話のために通話相手である他の通話端末11との間で音声データと映像データの送受信をしつつ、通話記録のために音声データと映像データとをレコーダー30に送信する。通話モードを終了すると、通話端末11は、通話記録のために音声データと映像データとをレコーダー30に送信することは終了するが、レコーダー42に対する音声データと映像データの送信は継続する。同様に、通話端末11は、監視待機モード中に、拡声モードが開始しても、レコーダー42への録画動作を終了しない。拡声モード時、通信端末11は、レコーダー42への音声データと映像データの送信を継続しつつ、並行して、拡声放送のためにIPスピーカー51又はページングゲートウェイ52に対して音声データを送信する。拡声モードを終了すると、通話端末11は、IPスピーカー51又はページングゲートウェイ52への音声データの送信は終了するが、レコーダー42に対する音声データと映像データの送信は継続する。
【0024】
(イベント検知機能)
通話システム10と監視カメラシステム40とは互いに、イベントの検知と、当該検知に対する応答を行う。ここで、イベントとは、音声や映像から推測される事象であって、通話システム10が設けられている場所(通話エリア)や監視カメラシステム40が設けられている場所(監視エリア)にて発生したと推測される事象である。イベントの一例は、通話エリアや監視エリアで何者かが発した悲鳴であり、これは例えば音声を解析することで推測できる事象である。イベントの一例は、通話エリアや監視エリアに侵入した不審者であり、これは例えば映像を解析することで推測できる事象である。
【0025】
図6は、通話システム10と監視カメラシステム40間のイベント検知機能を示すフローチャートである。監視カメラシステム40において、監視カメラ41は監視エリア内を撮影しており、撮影映像から監視エリア内のイベントを検知する(S10)。S10において、監視カメラ41は、画像センサーから入力した映像信号を解析し、監視エリア内の異常を検知する。例えば、監視カメラシステム40は、監視カメラ41にて所定時間間隔で(所定のフレームレートで)得た複数の映像を比較し、映像の中で変化がある場所(画素群)を特定し、この画素群に対応する場所に人や車両等の動体を検知する動体検知機能を有する。例えば、監視カメラシステム40は、予め検知したい人物や車両等の写真に係る画像データを保持し、監視カメラ41にて所定時間間隔で(所定のフレームレートで)得た複数の映像それぞれを画像データと比較し、所定の一致度があった場合に監視エリア内に当該人物や車両等がいることを検知する対象物検知機能を有する。上記検知機能は、監視カメラ41に備わっていてもよいし、レコーダー42に備わっていてもよい。このように、監視カメラシステム40は、監視カメラ41の撮像映像から監視エリア内の異常を検知すると、これに応答して、通話システム10に対してその旨を通知する通知メッセージを送信する(S11)。S11において、監視カメラ41又はレコーダー42がネットワークを介して通話メッセージを通話端末11に送信する。ここで、監視カメラシステム40は、自システムが設けられた監視エリアに対応する通話エリアに設けられた通話システム10に通知メッセージを送信する。すなわち、S11において、監視カメラシステム40は、異常が検知された監視エリアと同一の場所又は最も近い場所に通話エリアを有する通話システム10を特定し、当該通話システム10に通知メッセージを送信する。
【0026】
コミュニケーションシステム1は、それぞれ異なる通話エリアを有する複数の通話システム10と、それぞれ異なる監視エリアを有する監視カメラシステム40を含みうる。この場合、コミュニケーションシステム1は、各通話システム10の通話エリアの場所を示す通話エリア場所情報と、各監視カメラシステム40の監視エリアの場所を示す監視エリア場所情報とが含むデータベースを保持する。図7は、一例としてデータベース70を示す。データベース70は、複数ある通話システム10のうち各通話システム10の場所と、複数ある監視カメラシステム40のうち各監視カメラシステム40の場所とを保持する。図5に示す例では、データベース70上において、通話システム10-1は場所AAAAと対応付けられ、通話システム10-2は場所BBBBと対応付けられ、通話システム10-3は場所CCCCと対応付けられ、監視カメラシステム40-1は場所EEEEと対応付けられ、監視カメラシステム40-2は場所AAAAと対応付けられ、監視カメラシステム40-3は場所BBBBと対応付けられている。各システムは、対応付けられた場所に設置されていることを示す。データベース70において、各場所の情報は、ユーザーによって手動で入力され、例えば、通話システム10や監視カメラシステム40管理者によって入力されてもよいし、システムによって自動的に入力されてもよい。一例として、通話システム10及び監視カメラシステム40は、GPS(Global Positioning System)等のGNSS(Global Navigation Satellite System)を用いた測位システムを備え、当該測位システムによって取得した経度や緯度といった位置情報であり、当該位置情報を参照して自動的にデータベース70が生成される。一例として、通話システム10及び監視カメラシステム40は、Bluetooth等を用いたビーコン信号、RFID(Radio Frequency IDentification)、超音波、地磁気、UWB(Ultra Wide Band)信号等を用いた屋内測位システムを備え、当該屋内測位システムによって取得した屋内位置情報であり、当該屋内位置情報を参照して自動的にデータベース70が生成される。一例として、通話システム10の通話端末11に備わる入力部114から位置情報のユーザー入力を受け付けて、受け付けた位置情報がデータベース70に入力される。一例として、監視カメラシステム40の監視カメラ41又はレコーダー42に備わる入力手段(ボタン、スイッチ、キーボード等のユーザーインターフェース)から位置情報のユーザー入力を受け付けて、受け付けた位置情報がデータベース70に入力される。完全に互いの場所の情報が一致する通話システム10と監視カメラシステム40とは同じ場所に設置されていると判断してよいし、所定の誤差の範囲内である実質的に同じ場所の情報に対応付けられた通話システム10と監視カメラシステム40とは同じ場所に設置されていると判断してよい。
【0027】
図8は、データベース70の別の例を示す。図6に示す例では、データベース70は、各通話システム10内の通話端末11毎に対応付けられた場所と、各監視カメラシステム40内の監視カメラ41毎に対応付けられた場所とを保持する。図6に示す例では、データベース上70において、通話システム10-1内の通話端末11-1は場所aaaaと対応付けられ、通話端末11-2は場所bbbbと対応付けられ、通話端末11-3は場所ccccと対応付けられ、監視カメラシステム40-1内の監視カメラ41-1は場所eeeeと対応付けられ、監視カメラ41-2は場所aaaaと対応付けられ、監視カメラ41-3は場所bbbbと対応付けられている。各通話端末11及び各監視カメラ41は、対応付けられている場所に設置されていることを示す。
データベース70において、各場所の情報は、ユーザーによって手動で入力され、例えば、通話端末11や監視カメラ41管理者によって入力されてもよいし、システムによって自動的に入力されてもよい。一例として、各通話端末11及び各監視カメラ41は、GPS等のGNSSを用いた測位システムを備え、当該測位システムによって取得した経度や緯度といった位置情報であり、当該位置情報を参照して自動的にデータベース70が生成される。一例として、各通話端末11及び各監視カメラ41は、Bluetooth等を用いたビーコン信号、RFID、超音波、地磁気、UWB信号等を用いた屋内測位システムを備え、当該屋内測位システムによって取得した屋内位置情報であり、当該屋内位置情報を参照して自動的にデータベース70が生成される。一例として、通話端末11に備わる入力部114から位置情報のユーザー入力を受け付けて、受け付けた位置情報がデータベース70に入力される。一例として、監視カメラ41に備わる入力手段(ボタン、スイッチ、キーボード等のユーザーインターフェース)から位置情報のユーザー入力を受け付けて、受け付けた位置情報がデータベース70に入力される。完全に互いの場所の情報が一致する通話端末11と監視カメラ41とは同じ場所に設置されていると判断してよいし、所定の誤差の範囲内である実質的に同じ場所の情報に対応付けられた通話端末11と監視カメラ41とは同じ場所に設置されていると判断してよい。
【0028】
S11において、監視カメラシステム40は、データベース70を参照して、自己の監視エリアと同一又は最も近い通話エリアを有する通話システム10を特定して、当該通話システム10に通知メッセージを送信する。一例として、監視カメラシステム40は、自己の場所の情報と実質的に一致する又は最も近い場所の情報と対応付けられた通話システム10を特定し、当該通話システム10内の通話端末11(例えば、複数の通話端末11がある場合はいずれか、いくつか、又は全ての通話端末11)に対して通知メッセージを送信する。一例として、監視カメラシステム40は、S10でイベントを検知した監視カメラ41を特定し、当該監視カメラ41の場所の情報と実質的に一致する又は最も近い場所の情報と対応付けられた通話端末11を特定し、特定した通話端末11に対して通知メッセージを送信する。
【0029】
通話システム10において、通知メッセージを受信した通話端末11(S12)は、通知メッセージ応答して、イベントへの応答動作を行う(S13)。イベント応答動作の一例は、マイク110から入力される音声信号の保存やカメラ112で撮像して取得される映像信号の保存を開始することである。S13において、通話端末11は、マイク110がOFFであったときは、通知メッセージに応答してマイク110をONにし、マイク110からの入力音声の録音を開始する。S13において、通話端末11は、カメラ112がOFFであったときは、通知メッセージに応答してカメラ112をONにし、カメラ112の撮像映像の録画を開始する。通話端末11は、HDDやSSD等の内蔵記録媒体を備えるか、又はSDカードやUSBメモリー(フラッシュドライブ)等の外部記録媒体を受け付け、S13においては、これら記録媒体に録音した音声データや録画した映像データを保存するとよい。S13において、通話端末11は、一般待機モード時、通知メッセージに応答して、監視待機モードに移行し、マイク110やカメラ112をONにして、録音した音声データや録画した映像データをレコーダー42に送信することでレコーダー42での保存を開始するようにしてもよい。S13において、通話端末11は、応答した通知メッセージに関する情報(例えば、通知メッセージを送信した監視カメラ41やレコーダー42の識別子や、通知メッセージを受信した日時等)と対応付けて録音及び録画を行うとよい。S10~S13によって、ある監視エリアで監視カメラシステム40がイベントを検知したとき、その監視エリアに対応する通話エリアの通話システム10がイベントに応答した動作を行うことができる。例えば、ある監視エリアで監視カメラ41によって不審者の侵入が検知されたとき、監視エリアと同じ場所又は近くの場所にある通話端末11によって録音と録画を開始し、不審者の状況を録音、録画することができる。
【0030】
S10~S14とは逆に、通話システム10において、通話端末11に備わるマイク110とカメラ112を用いて通話エリアを監視しており、マイク110から入力される音声やカメラ112の撮像映像から通話エリア内のイベントを検知し(S20)、監視カメラシステム40がこのイベントに応答する(S23)。S20において、通話システム10は、通話端末11のカメラ110から入力された音声信号を解析し、通話エリア内の異常を検知する。例えば、通話システム10は、マイク110から入力される音声信号を所定時間間隔で周波数分析し、悲鳴等の特定の音声に対応する特定の周波数パターンが発生すると異常を検知したり、マイク110から入力される音声信号のレベル(振幅)を所定時間間隔で監視し、所定レベル以上のレベルが発生すると異常を検知したりする異常検知機能を有する。また例えば、通話システム10は、カメラ112の画像センサーから入力した映像信号を解析し、通話エリア内の異常を検知する異常検知機能を有する。これは、上述した監視カメラシステム40による動体検知機能、対象物検知機能等と同様である。これら検知機能は、各通話端末11に備わっているとよい。このように、通話システム10は、通話端末11に備わるマイク110やカメラ112を用いて通話エリア内の異常を検知すると、これに応答して、監視カメラシステム40に対してその旨を通知する通知メッセージを送信する(S21)。S21において、異常を検知した通話端末11がネットワークを介して通話メッセージを監視カメラ41又はレコーダー42に送信する。ここで、通話システム10は、自システムが設けられた通話エリアに対応する監視エリアに設けられた監視カメラシステム40に通知メッセージを送信する。すなわち、S21において、監視カメラシステム40がS11で行うのと同様に、通話システム10は、データベース70を参照して、異常が検知された通話エリアと同一の場所又は最も近い場所に監視エリアを有する監視カメラシステム40を特定し、当該監視カメラシステム40に通知メッセージを送信する。一例として、通話システム10は、自己の場所の情報と実質的に一致する又は最も近い場所の情報と対応付けられた監視カメラシステム40を特定し、当該監視カメラシステム40内の監視カメラ41(例えば、複数の監視カメラ41がある場合はいずれか、いくつか、又は全ての監視カメラ41)又はレコーダー42に対して通知メッセージを送信する。一例として、通話システム10は、S20でイベントを検知した通話端末11を特定し、当該通話端末11の場所の情報と実質的に一致する又は最も近い場所の情報と対応付けられた監視カメラ41を特定し、特定した監視カメラ41に対して通知メッセージを送信する。
【0031】
監視カメラ41は、図9に示すように、カメラ410とPTZ機構411を備える。カメラ410は、CCDイメージセンサーやCMOSイメージセンサー等の撮像素子を含む撮像装置であり、監視カメラ41の筐体から外側であって監視カメラ41が設置されている監視エリアの一部または全体が映る方向に撮像方向が向けられている。カメラ410は、撮影して得て映像信号から静止画又は動画の映像データを生成して出力する。PTZ機構411は、カメラ410を接続され、モーター等のアクチュエーターを含み、カメラ410を駆動してパン、チルト、ズームを行う機構である。監視カメラ41は、例えば、壁面や天井面等に取り付けられるカメラで、ボックス型、ビューレット型(バレット型)、ドーム型等のカメラである。
【0032】
監視カメラシステム40において、通知メッセージを受信した監視カメラ41又はレコーダー42(S22)は、通知メッセージ応答して、イベントへの応答動作を行う(S23)。イベント応答動作の一例は、監視カメラ41のPTZ機構411を駆動してカメラ410をパン、チルト、ズームし、監視エリア内を撮影して映像データをレコーダー42に保存する。S23において、通知メッセージを受信した監視カメラ41は、カメラ410がOFFであるとき、通知メッセージ応答してカメラ410をONにして撮影を開始する。より具体的には、S23において、通知メッセージ応答して監視カメラ41は、通知メッセージを送信してきた通話端末11の方向に向けてパン、チルト、ズームを行い、撮影を行う。S23において、通知メッセージを受信したレコーダー42は、接続されている監視カメラ41のカメラ410がOFFであるとき、通知メッセージ応答して、監視カメラ41に対してカメラ410をONにさせて撮影を開始させる。より具体的には、S23において、通知メッセージに応答してレコーダー42は、接続されている監視カメラ41に対して、通知メッセージを送信してきた通話端末11に方向に向けてパン、チルト、ズームを行って撮影を実行させる。S23において、監視カメラ41は、応答した通知メッセージに関する情報(例えば、通知メッセージを送信した通話端末11の識別子や、通知メッセージを受信した日時等)と対応付けて映像データの保存を行うとよい。S20~S23によって、ある通話エリアで通話システム10がイベントを検知したとき、その通話エリアに対応する監視エリアの監視カメラシステム40がイベントに応答した動作を行うことができる。例えば、ある通話エリアで通話端末11によって悲鳴が検知されたとき、通話エリアと同じ場所又は近くの場所にある監視カメラ41によって録画を開始し、悲鳴が発生した状況を録画することができる。
【0033】
(AIの活用)
通話システム10は、通話端末11に備わるカメラ110やカメラ112を用いてイベント検知を行う際、AI(Artificail Intelligence)を活用するとよい。図10に示すように、通話端末11は、AI処理部115を備える。また、通話端末11は、インターネット等のWANを介して、AI処理部720を備えるサーバー72に接続される。AI処理部115は、ニューラルネットワークを有し、予め機械学習(深層学習、ディープラーニングを含む)により生成された学習済みの学習モデルを有するプロセッサーである。サーバー72は、WANを介してアクセス可能なWebサーバーであり、AI処理部720を備える。AI処理部720は、ニューラルネットワークを有し、予め機械学習(深層学習、ディープラーニングを含む)により生成された学習済みの学習モデルを有するプロセッサーである。AI処理部720は、AI処理部115よりも高コストであるが高機能であり処理能力が高い。AI処理部115は、AI処理部720よりも低コストであるが低機能であり処理能力が低い。
【0034】
AI処理部115は、学習モデル115aを備える。学習モデル115aは、音声データや映像データの入力を受け付けて、当該音声データや映像データから何らかの判定を行うモデルである。学習モデル115aは、第1のイベントと関連した音声データや映像データのサンプルを大量に教師データとして入力し、当該第1のイベントに関連した音声データや映像データの特徴を学習することによって、新たな音声データや映像データの入力から第1のイベントの判定を行うよう構成されたモデルである。AI処理部720は、学習モデル720aを備える。学習モデル720aは、音声データや映像データの入力を受け付けて、当該音声データや映像データから何らかの判定を行うモデルである。学習モデル720aは、第2のイベントと関連した音声データや映像データのサンプルを大量に教師データとして入力し、当該第2のイベントに関連した音声データや映像データの特徴を学習することによって、新たな音声データや映像データの入力から第2のイベントの判定を行うよう構成されたモデルである。ここで、第2のイベントは、第1のイベントと異なり、第1のイベントよりも判定するにはより高い計算能力が求められるイベントである。すなわち、第2のイベントを判定する処理は、第1のイベントを判定する処理よりも高負荷な処理である。AI処理部115を用いた判定処理は、WANを介した通信が不要なローカル処理であることから、通話端末11にとって応答性が高い、すなわち、判定結果を得るまでの時間が短くリアルタイム性が高い。一方、AI処理部720を用いた判定処理は、より高度な判定が行えるものの、WANを介した通信が必要であるため、通話端末11にとって応答性が低い、すなわち、判定結果を得るまでの時間が短くリアルタイム性が低い。
【0035】
上述したようなAI処理部115とAI処理部720の特徴を踏まえ、通話端末11は、AI処理部115とAI処理部720とを適宜使い分ける。一例として、通話端末11は、状況に応じて、AI処理部115とAI処理部720のいずれか一方を使用する。一例として、通話端末11は、AI処理部115とAI処理部720とを連携して使用する。通話端末11は、ローカルのAI処理部115を用いるときは、音声データまたは映像データをAI処理部115に入力し、学習モデル115aによる判定結果を受け取る。通話端末11は、ネットワーク経由でAI処理部720を用いるときは、WANを介して音声データ又は映像データをAI処理部720に送信し、WANを介して学習モデル720aによる判定結果を受信する。
【0036】
例えば、第1のイベントは悲鳴等、音声に関するイベントであり、第1のイベントの判定処理は、音声データから悲鳴等のイベントを判定する処理である。学習モデル115aは、悲鳴等のイベントのサンプルとなる音声データを教師データとして入力し、悲鳴等の特徴を学習して、新たな音声データの入力から悲鳴等の発生を判定するよう構成されている。第2のイベントは、移動体の発生等、映像に関するイベントであり、第2のイベントの判定処理は、映像データから移動体の発生等のイベントを判定する処理である。学習モデル720aは、移動体の発生等のイベントのサンプルとなる映像データを教師データとして入力し、移動体等の特徴を学習して、新たな映像データの入力から移動体の発生等を判定するよう構成されている。通話端末11は、入力部114を介したユーザー入力に応じて、AI処理部115を用いてマイク110の入力音声の音声データから悲鳴等の判定を行うか、AI処理部720を用いてカメラ112の撮像映像の映像データから移動体の発生等の判定を行うか、手動で切り替えるとよい。また、通話端末11は、マイク110がONになっているときは、AI処理部115を用いてマイク110の入力音声から悲鳴等の判定を行い、カメラ112がONになっているときは、AI処理部720を用いてカメラ112の撮像映像から移動体の発生等の判定を行うとよい。マイク110とカメラ112の両方がONになっているときは、通話端末11は、AI処理部115を用いた判定処理とAI判定部720を用いた判定処理のうち一方又は両方を実行するとよい。なお、第1のイベントが音声に関するイベントであって第2のイベントが映像に関するイベントであるというのは単なる一例であって、これに限定されるものではなく、逆に第1のイベントが映像に関するイベントであって第2のイベントが音声に関するイベントであってもよい。
【0037】
例えば、第1のイベントの判定は音声又は映像に関する第一段階目の判定であり、第2のイベントの判定は音声又は映像に関する第二段階目の判定であって第一段階目の判定よりも高負荷な判定である。例えば、第1のイベントの判定は、映像データから移動体の発生等を判定する処理であり、第2のイベントの判定は、予め定められた人物や物体等特定の物体の移動体の発生等を判定する処理である。すなわち、第1のイベントの判定は、そのものが何であるかは問わず何かしらの移動体の発生の判定で良いが、第2のイベントの判定は、予め判定すべきものとして定められた特定の人物(例えば指名手配犯)や物体(例えば特定のナンバーの自動車)の判定である。一例として、通話端末11は、段階的にAI処理部115とAI処理部720を使用する。例えば、通話端末11は、AI処理部115を常時駆動し、カメラ112の撮像映像を所定時間間隔でAI処理部115に入力して第1のイベントの判定処理を行う。次に、通話端末11は、AI処理部115で第1のイベント判定がされると、これに応答して、AI処理部115が第1のイベントを判定した映像データをサーバー72に送信、第2のイベントの判定処理を行う。このように段階的に判定を行うことで、例えば、まずAI処理部115で何らかの移動体の発生を判定した後、続けてAI処理部720でその移動体が特定の人物や物体であるのかを判定することができる。常時AI処理部720で判定処理を行うよりも、効率的な判定を行うことができる。
【0038】
(拡声機能)
通話システム10は、拡声モード時、拡声システム50に音声データを送信して、IPスピーカー51から音声を拡声放送させる。例えば、各通話端末11は、入力部114からのユーザー入力によって宛先となるIPスピーカー51又はページングゲートウェイ52の指定を受け付け、指定した1つ以上のIPスピーカー51又はページングゲートウェイ52に対して音声データを送信する。通話システム10から拡声システム50内のIPスピーカー51から同一内容の音声を拡声放送させたいときは、ページングゲートウェイ52に音声データを送信するとよい。ページングゲートウェイ52は、受信した音声データを、同一のネットワークに接続された全てのIPスピーカー51に対して転送することで、全てのIPスピーカー51に音声データを再生して出力させる。IPスピーカー51は、図11に示すように、スピーカー510と記憶部510とを備える。スピーカー510は、IPスピーカー51の筐体から外側に放音方向が向けられた電気音響変換器であり、音声データが再生されて得た音声を出力する。記憶部511は、通話システム10から受信した音声データを一時的に又は非一時的に保持する記憶媒体であり、ROMやRAM等のメモリー又はHDDやSSD等のストレージ、もしくはこれらの組み合わせである。
【0039】
(リアルタイム放送機能)
通話システム10は、拡声モード時、マイク110の入力音声を即時、リアルタイムで放送するリアルタイム放送機能を有する。リアルタイム放送では、通話システム10は、マイク110から入力される音声の音声データを、即時音声ストリームとして指定したIPスピーカー51又はページングゲートウェイ52に送信する。例えば、通話端末11は、マイク110から入力される音声から音声データを生成し、即時、RTP(Realtime Transport Protocol)等のストリーム用プロトコルを用いて音声ストリームをIPスピーカー51又はページングゲートウェイ52に送信する。IPスピーカー51は、順次受信する音声ストリームを即時再生して出力する。ページングゲートウェイ52は、順次受信する音声ストリームを、同一ネットワーク内のIPスピーカー51に転送する。
【0040】
(録音放送機能)
通話システム10は、拡声モード時、マイク110の入力音声をいったん通話端末11に保持(録音)し、ユーザー(話者)が聞き返してから放送する録音放送機能を有する。図12は、録音放送機能の一例を示すフローチャートである。録音放送機能が有効であるとき、通話端末11は、マイク110の入力音声から音声データを生成するが、即時音声ストリームとして送信するのではなく、一時的に音声データを記録媒体に保存する(S40)。通話端末11は、HDDやSSD等の内蔵記録媒体を備えるか、又はSDカードやUSBメモリー(フラッシュドライブ)等の外部記録媒体を受け付け、S40においては、これら記録媒体に録音した音声データを保存するとよい。S40において、通話端末11は、話者がマイク110に向かって話しかけることを開始することによりマイク110からの音声入力が始まると、自動的に録音を開始してもよい。S40において、通話端末11は、入力部114から録音開始を指示するユーザー操作を受け付け、これに応じて、録音を開始してもよい。S40において、通話端末11は、録音開始後、話者がマイク110に向かって話しかけることを止めることによりマイク110からの音声入力が途絶えると、自動的に録音を停止してもよい。S40において、通話端末11は、録音開始後、入力部114から録音終了を指示するユーザー操作を受け付け、これに応じて、録音を終了してもよい。S40において、通話端末11は、録音開始から録音終了までに入力された音声から一連の音声データを生成して記憶媒体に保存する。通話端末11は、S40において記憶媒体に保存した音声データを、一定時間内に保持し、当該一定時間が経過すると自動的に音声データを記録媒体から消去してもよい。通話端末11は、音声データが記録媒体に保持されている一定時間内、保持されている音声データの再生を行うことができる(S41)。一例として、S41において、通話端末11は、S40で録音終了したことに応答して、自動的に、一定時間内に音声データを再生する。一例として、S41において、通話端末11は、一定時間内、入力部114から再生を指示するユーザー入力を受け付け、これに応答して、再生を行う。S41において、通話端末11は、再生した音声をスピーカー111から出力する。S41での再生後、通話端末11は、入力部114から放送を指示するユーザー操作又は録音やり直しを指示するユーザー操作を受け付ける。通話端末11は、放送を指示するユーザー操作に応答して、S41で再生した音声データを放送する、すなわち、記録媒体に保持してある音声データの音声ストリームを指定されたIPスピーカー51又はページングゲートウェイ52に送信する(S42)。一方、通話端末11は、録音やり直しを指示するユーザー操作に応答して、記録媒体に保持してある音声データを消去し、S40に戻って再度話者の音声の録音を行う。以上の録音再生機能によって、ユーザー(話者)は、いったん自分が話した内容を再生して聞いてみて確認してから放送することができ、もし聞いてみて内容に満足がいかないときは録音しなおして放送することができる。
【0041】
(ダウンロード放送機能)
通話システム10は、拡声モード時、ストリーム用プロトコルを用いて音声ストリームを送信するのではなく、音声ファイルをIPスピーカー51又はページングゲートウェイ52にダウンロードし、ダウンロードされた音声ファイルの再生を行うダウンロード放送機能を有する。図13は、ダウンロード放送機能の一例を示すフローチャートである。拡声モード時にダウンロード放送機能が有効であるとき、通話システム10において、通話端末11は、マイク110を介して入力される音声を録音し、すなわち、音声を符号化して音声データを生成して記憶媒体に保持する(S50)。S50において、通話端末11は、話者がマイク110に向かって話しかけることを開始することによりマイク110からの音声入力が始まると、自動的に録音を開始してもよい。S50において、通話端末11は、入力部114から録音開始を指示するユーザー操作を受け付け、これに応じて、録音を開始してもよい。S50において、通話端末11は、録音開始後、話者がマイク110に向かって話しかけることを止めることによりマイク110からの音声入力が途絶えると、自動的に録音を停止してもよい。S50において、通話端末11は、録音開始後、入力部114から録音終了を指示するユーザー操作を受け付け、これに応じて、録音を終了してもよい。S50において、通話端末11は、録音開始から録音終了までに入力された音声から一連の音声データを生成して記憶媒体に保存する。S50において、通話端末11は、MP3等の所定のファイルフォーマットに従って音声ファイルを生成し、当該音声ファイルを保持するとよい。
【0042】
次に、通話端末11は、記録媒体に保持した音声データを、指定したIPスピーカー51又はページングゲートウェイ52にダウンロードする(S51)。S51において、通話端末11は、S50での録音完了後、自動的にダウンロードを開始するとよい。S51において、通話端末11は、S50での録音完了後、入力部114からダウンロードを指示するユーザー操作を受け付け、これに応答してダウンロードを開始してもよい。S51において、通話端末11は、HTTP(Hypertext Transfer Protocol)やFTP(File Transfer Protocol)等のファイル転送のプロトコルを用いて音声データをIPスピーカー51又はページングゲートウェイ52に転送する。
【0043】
IPスピーカー51又はページングゲートウェイ52は、音声データをダウンロードし、ダウンロードした音声データを記録媒体に保持する(S52)。S52において、IPスピーカー51は、記憶部511にダウンロードした音声データを保持する。ページングゲートウェイ52も、IPスピーカー51と同様に、ROMやRAM等のメモリー又はHDDやSSD等のストレージ、もしくはこれらの組み合わせを含む記憶媒体を備え、S50において、当該記憶媒体にダウンロードした音声データを保持する。IPスピーカー51又はページングゲートウェイ52は、音声データのダウンロードが完了すると、その旨を示すメッセージ(ダウンロード完了通知メッセージ)を通話端末11に送信する(S53)。
【0044】
IPスピーカー51又はページングゲートウェイ52に音声データが保持されている状態で、通話システム10は、拡声システム50に対して当該保持されている音声データを再生して放送することを指示することができる(S55~S57)。通話端末11は、入力部114から内蔵音源放送を指示するユーザー操作を受け付け、これに応答して、内蔵音源の放送を指示する要求メッセージ(内蔵音源放送要求メッセージ)を、指定したIPスピーカー51又はページングゲートウェイ52に送信する(S55)。IPスピーカー51は、内蔵音源放送要求メッセージを受信し(S56)、これに応答して、記憶部511に保持されている音声データを再生してスピーカー510から出力することにより拡声エリアに放送を行う(S57)。記憶部511に保持されている音声データが複数ある場合は、S55において通話端末11は、入力部114から音声データを選択するユーザー操作を受け付け、これにより、選択された音声データを示す情報(音声データ特定情報)が内蔵音源放送要求メッセージに含まれる。S57において、IPスピーカー51は、内蔵音源放送要求メッセージに含まれる音声データ特定情報を参照し、音声データ特定情報が示す音声データを記憶部511から読み出して再生する。ページングゲートウェイ52は、内蔵音源放送要求メッセージを受信すると(S56)、これに応答して、記憶媒体に保持されている音声データを、同一ネットワーク内のIPスピーカー51に転送することで、IPスピーカー51に音声データを再生させる(S57)。記憶媒体に保持されている音声データが複数ある場合は、S55において通話端末11は、入力部114から音声データを選択するユーザー操作を受け付け、これにより、選択された音声データを示す情報(音声データ特定情報)が内蔵音源放送要求メッセージに含まれる。S57において、ページングゲートウェイ52は、内蔵音源放送要求メッセージに含まれる音声データ特定情報を参照し、音声データ特定情報が示す音声データを記憶媒体から読み出して転送する。S57において、ページングゲートウェイ52は、マルチキャストやブロードキャストにより音声データを転送するとよい。以上のダウンロード放送機能によって、音声データは、IPスピーカー51又はページングゲートウェイ52にいったんダウンロードしてから再生されるため、ネットワークの帯域が狭い等通信環境がストリーミング再生には適さない場合であっても、音切れを起こすことなく良好な拡声放送を実現することができる。
【0045】
S50~S57の変形例として、拡声システム50は、音声データのダウンロードが完了する(S52)と、通話システム10からの指示を待たずに自動的に当該音声データを再生するようにしてもよい(S57)。この変形例の場合、IPスピーカー51は、音声データのダウンロードが完了すると(S52)、記憶媒体に保持し、ダウンロード完了通知メッセージを送信するとともに、もしくはダウンロード完了通知メッセージを送信することなく、自動的に、記憶媒体に記憶した音声データを再生することで拡声放送を行う(S57)。また、この変形例の場合、ページングゲートウェイ52は、音声データのダウンロードが完了すると(S52)、記憶媒体に保持し、ダウンロード完了通知メッセージを送信するとともに、もしくはダウンロード完了通知メッセージを送信することなく、自動的に、記憶媒体に記憶した音声データをIPスピーカー51に転送することで、IPスピーカー51に音声データを再生される(S57)。
【0046】
(一斉放送機能)
通話システム10は、拡声モード時、拡声システム50に複数のIPスピーカー51が含まれる場合に、同じ内容を各IPスピーカー51から一斉に同じタイミングで放送する一斉放送機能を有する。図14は、一斉放送機能の一例を示すフローチャートである。拡声モード時一斉放送機能が有効であるとき、通話システム10において、通話端末11は、マイク110を介して入力される音声を録音し、すなわち、音声を符号化して音声データを生成して記憶媒体に保持する(S60)。S60での録音動作は、S50での録音動作と同様である。次に、通話端末11は、記録媒体に保持した音声データを、拡声システム50内の複数のIPスピーカー51にダウンロードする(S61)。S61において、通話端末11は、入力部114から2つ以上のIPスピーカー51を選択するユーザー操作を受け付け、これに応答して、選択されたIPスピーカー51に音声データを送信するとよい。S61において、通話端末11は、入力部114から一斉放送を指示するユーザー操作を受け付け、これに応答して、拡声システム50内の全てのIPスピーカー51に音声データを送信してもよい。S61において、通話端末11は、S60での録音完了後、自動的にダウンロードを開始するとよい。S61において、通話端末11は、S60での録音完了後、入力部114からダウンロードを指示するユーザー操作を受け付け、これに応答してダウンロードを開始してもよい。S61において、通話端末11は、例えば、HTTPやFTP等のファイル転送のプロトコルを用いて音声データをIPスピーカー51に転送することでダウンロードする。
【0047】
各IPスピーカー51は、音声データをダウンロードし、ダウンロードした音声データを記録媒体に保持する(S62)。S62において、IPスピーカー51は、記憶部511にダウンロードした音声データを保持する。IPスピーカー51は、音声データのダウンロードが完了すると、その旨を示すメッセージ(ダウンロード完了通知メッセージ)を通話端末11に送信する(S63)。通話システム10は、音声データの送信を開始(S61)した後、送信先のIPスピーカー51全てからダウンロード完了通知メッセージを受信するのを待つ(S64、S65)。通話システム10は、通話端末11が全てのIPスピーカー51からダウンロード完了通知メッセージを受信すると(S65:Yes)、自動的に、拡声システム50に対してダウンロード完了した音声データの再生、放送を指示する(S66)。S66において、通話端末11は、S61で音声データをダウンロードしたすべてのIPスピーカー51からダウンロード完了通知メッセージを受信した(S65:Yes)に応答して、自動的に、これら全てのIPスピーカー51に対して放送を指示する放送指示メッセージを送信する。
【0048】
各IPスピーカー51は、放送指示メッセージを受信し(S67)、これに応答して、ダウンロードして記憶部511に保持した音声データを再生してスピーカー510より出力することにより拡声エリアに放送を行う(S68)。S60~S68により、拡声エリア内において、複数のIPスピーカー51から一斉放送を行う際の同報性が確保される。すなわち、複数のIPスピーカー51が個別に音声データのストリームを受信して再生して放送しようとすると、通話システム10と拡声システム50との間のネットワークの状況(通話端末11と各IPスピーカー51との間のネットワーク状況)によっては、IPスピーカー51間で音声ストリームを受信する速度に差が出て、その結果IPスピーカー51間で出力される音に時間的なズレが生じる可能性がある。また、通話システム10で音声データをファイル化して拡声システム50にダウンロードしてから再生する手法であっても、同様に、通話システム10と拡声システム50との間のネットワークの状況(通話端末11と各IPスピーカー51との間のネットワーク状況)によっては、IPスピーカー51間でダウンロード完了までの時間に差が出て、その結果IPスピーカー51間で出力される音に時間的なズレが生じる可能性がある。これに対し、S60~S68によれば、放送対象となる全てのIPスピーカー51で音声データのダウンロードが完了してから、一斉に当該ダウンロード完了した音声データの放送が指示されるため、全てのIPスピーカー51が一斉に略同じタイミングで放送を開始することができる。
【0049】
(非常放送との共存機能)
拡声システム50は、オフィスビルや工場、ショッピングモール等の商業施設に設置されうる。これら施設は、消防法令の定めにより、規模によって非常放送設備の設置が必要なことがある。非常放送設備は、非常放送音声をアンプで増幅して施設の各フロアに設置された複数の非常放送用スピーカーから出力するよう構成されている。非常放送設備が設置される施設に拡声システム50が設置される場合、IPスピーカー51もまた各フロアに設置されるが、非常放送設備が作動した際、非常放送用スピーカーから出力される非常放送音声と競合しないように配慮しなければならない。すなわち、消防法令の定めにより、非常放送設備が作動した際には、非常放送用スピーカーから出力される非常放送音声は、他の音と明らかに区別して聞き取ることができるようにしなければならない。そのため、非常放送設備の作動時には、非常放送用スピーカーと同じ場所に設置されている他のスピーカーからは音声が出力されないような仕掛けが求められる。従来、非常放送設備と同じ場所に設置されるいわゆる業務放送設備では、非常放送設備や自動火災報知設備からの信号を受けて電源を遮断する電源カットリレーが用いられている。しかしながら、拡声システム50では、IPスピーカー51はイーサネットケーブルを介してルーターに接続されてPoE給電を受けることがある。このような構成では、IPスピーカー51の電源を遮断するにはルーターの電源を落とす必要があるが、ルーターにはIPスピーカー51以外の機器も接続されることがあり、ルーター自体の電源を落とすことは望ましくないことがある。このような事情に照らして、拡声システム50は、電源を遮断することなく非常放送設備と共存しうる放送制御機能を有する。
【0050】
図15に示すように、拡声システム50において、ページングゲートウェイ52は、ネットワークを介して通話システム10等と接続される経路とは別に独立して、非常信号源80と接続される。非常信号源80は、拡声システム50が設置されている施設に設置されている非常放送設備を作動させる信号であって火災等の非常事態の発生を示す信号を発報する信号源である。非常信号源80は、例えば、自動火災報知設備や非常放送設備である。非常信号源80は、火災等の非常事態の発生を検知すると、非常信号を外部に発報するよう構成されており、ページングゲートウェイ52は、この非常信号を受信する。
【0051】
図16は、非常放送設備と共存するための放送制御機能の一例を示すフローチャートである。ページングゲートウェイ52は、常時、所定時間間隔で非常信号源80から非常信号を受信したか否かを監視し(S80)、非常信号を受信した場合(S80:Yes)、これに応答して放送禁止を示すメッセージ(放送禁止メッセージ)を、同一ネットワーク内の全てのIPスピーカー51に対して送信する(S81)。放送禁止メッセージは、マルチキャストやブロードキャストを用いてIPスピーカー51に対して送信するとよい。
【0052】
各IPスピーカー51は、通常、デフォルト状態では動作モードを放送可能モードに設定して稼働する(S82)。IPスピーカー51は、放送可能モード時、適時放送が可能であり、例えば、上述したリアルタイム放送機能、録音放送機能、ダウンロード放送機能、一斉放送機能に従って音声データの再生、出力を行う。例えば、IPスピーカー51は、放送可能モード時、リアルタイム放送機能や録音放送機能に従って順次受信する音声ストリームを再生して出力する。例えば、IPスピーカー51は、放送可能モード時、ダウンロード放送機能に従って受信した放送指示に応答して音声データを再生して出力する(S56~S57)。例えば、IPスピーカー51は、放送可能モード時、一斉放送機能に従って受信した放送指示に応答して音声データを再生して出力する(S67~S68)一方、IPスピーカー51は、ページングゲートウェイ52から放送禁止メッセージを受信すると(S83)、これに応答して動作モードを放送禁止モードに設定する(S84)。IPスピーカー51は、放送禁止モード時、拡声放送を行えず、音声データの再生、出力は行わない。例えば、IPスピーカー51は、放送禁止モード時、リアルタイム放送機能や録音放送機能に従って音声ストリームを受信しても、当該音声ストリームを再生しない。例えば、IPスピーカー51は、放送禁止モード時、ダウンロード放送機能に従って放送指示を受信しても(S56)、音声データを再生しない。例えば、IPスピーカー51は、放送禁止モード時、一斉放送機能に従って放送指示を受信しても(S67)、音声データを再生しない。以上のように制御することにより、非常放送が行う必要性が生じた際にIPスピーカー51の動作モードを放送禁止モードに遷移させ、非常放送と干渉が起きることを防ぐことができる。
【0053】
図17及び18は、非常放送設備と共存するための放送制御機能の一例を示すフローチャートである。ページングゲートウェイ52は、常時、所定時間間隔で非常信号源80から非常信号を受信したか否かを監視し(S91)、非常信号を受信していない限りにおいて常時、放送許可を示すメッセージ(放送許可メッセージ)を、同一ネットワーク内の全てのIPスピーカー51に対して送信する(S91:No、S90)。放送許可メッセージは、マルチキャストやブロードキャストを用いて所定時間間隔でIPスピーカー51に対して送信し続けるとよい。ページングゲートウェイ52は、非常信号源80から非常信号の受信を検知すると(S91:Yes)、これに応答して即時、自動的に非常信号の送信を停止する(S92)。
【0054】
各IPスピーカー51は、常時、所定時間間隔でページングゲートウェイ52から放送許可メッセージを受信したか否かを監視し(S95)、放送許可メッセージを受信している限りにおいて動作モードを放送可能モードに設定して稼働する(S96)。IPスピーカー51は、放送可能モード時、適時放送が可能であり、例えば、上述したリアルタイム放送機能、録音放送機能、ダウンロード放送機能、一斉放送機能に従って音声データの再生、出力を行う。例えば、IPスピーカー51は、放送可能モード時、リアルタイム放送機能や録音放送機能に従って順次受信する音声ストリームを再生して出力する。例えば、IPスピーカー51は、放送可能モード時、ダウンロード放送機能に従って受信した放送指示に応答して音声データを再生して出力する(S56~S57)。例えば、IPスピーカー51は、放送可能モード時、一斉放送機能に従って受信した放送指示に応答して音声データを再生して出力する(S67~S68)。一方、各IPスピーカー51は、ページングゲートウェイ52から放送許可メッセージを受信しなくなると(S95:No)、これに応答して即時、自動的に動作モードを放送禁止モードに設定する(S97)。IPスピーカー51は、放送禁止モード時、拡声放送を行えず、音声データの再生、出力は行わない。例えば、IPスピーカー51は、放送禁止モード時、リアルタイム放送機能や録音放送機能に従って音声ストリームを受信しても、当該音声ストリームを再生しない。例えば、IPスピーカー51は、放送禁止モード時、ダウンロード放送機能に従って放送指示を受信しても(S56)、音声データを再生しない。例えば、IPスピーカー51は、放送禁止モード時、一斉放送機能に従って放送指示を受信しても(S67)、音声データを再生しない。
【0055】
S95~S97の変形例として、IPスピーカー51は、放送許可メッセージの受信確認(S95)を常時行うのではなく、放送を行うタイミングで行ってもよい。すなわち、例えば、IPスピーカー51は、リアルタイム放送機能や録音放送機能に従って音声ストリームの受信を開始したことに応答して、この音声ストリームの再生を開始する前に、放送許可メッセージの受信確認を行う(S95)。この場合、IPスピーカー51は、音声ストリームはいったんバッファリングしておき、放送許可メッセージを受信していることが確認できた場合に限り(S95:Yes)、バッファリングした音声ストリームの再生を開始するとよい。また例えば、IPスピーカー51は、ダウンロード放送機能に従って放送指示を受信したことに応答して、この放送指示に従って音声データの再生を開始する(S57)前に、放送許可メッセージの受信確認を行う(S95)。この場合、IPスピーカー51は、放送許可メッセージを受信していることが確認できた場合に限り(S95:Yes)、音声データの再生を開始するとよい(S57)。また例えば、IPスピーカー51は、一斉放送機能に従って放送指示を受信したことに応答して、この放送指示に従って音声データの再生を開始する(S68)前に、放送許可メッセージの受信確認を行う(S95)。この場合、IPスピーカー51は、放送許可メッセージを受信していることが確認できた場合に限り(S95:Yes)、音声データの再生を開始するとよい(S68)。
【0056】
以上のように、各IPスピーカー51は、ページングゲートウェイ52が非常信号を受信しないとき(非常放送が作動していないとき)にページングゲートウェイ52から常時放送許可メッセージが送られてくることに応答して音声データの再生、放送を行い、放送許可メッセージの受信が途絶えると非常放送と干渉すると判断して音声データの再生、放送を行わない。S80~S84に示した放送制御だと、S81によってページングゲートウェイ52から送信される放送禁止メッセージがパケットロス等によって万が一IPスピーカー51に到達しない場合、IPスピーカー51の動作モードを放送禁止モードに遷移できないおそれがある。S90~S97で示した放送制御は、非常放送と干渉が発生することをより確実に防止することができる。
【0057】
(補足)
通話端末11は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等を含む処理部と、処理部が実行可能なコンピュータープログラムを保持するメモリーとを備える。処理部がメモリーに保持されたコンピュータープログラムを実行することにより、通話端末11の各種機能が実現される。メモリーに保持されるコンピュータープログラムには、通話機能、録画機能、イベント検知機能、AIを用いた判定機能、拡声機能、リアルタイム放送機能、録音放送機能、ダウンロード放送機能、一斉放送機能等、上述した各種機能を実行するプログラム命令が含まれる。
【0058】
レコーダー30は、CPUやMPU等を含む処理部と、処理部が実行可能なコンピュータープログラムを保持するメモリーとを備える。処理部がメモリーに保持されたコンピュータープログラムを実行することにより、レコーダー30の各種機能が実現される。メモリーに保持されるコンピュータープログラムには、録画機能等、上述した各種機能を実行するプログラム命令が含まれる。
【0059】
監視カメラ41は、CPUやMPU等を含む処理部と、処理部が実行可能なコンピュータープログラムを保持するメモリーとを備える。処理部がメモリーに保持されたコンピュータープログラムを実行することにより、監視カメラ41の各種機能が実現される。メモリーに保持されるコンピュータープログラムには、イベント検知機能等、上述した各種機能を実行するプログラム命令が含まれる。
【0060】
レコーダー42は、CPUやMPU等を含む処理部と、処理部が実行可能なコンピュータープログラムを保持するメモリーとを備える。処理部がメモリーに保持されたコンピュータープログラムを実行することにより、レコーダー42の各種機能が実現される。メモリーに保持されるコンピュータープログラムには、録画機能、イベント検知機能等、上述した各種機能を実行するプログラム命令が含まれる。
【0061】
IPスピーカー51は、CPUやMPU等を含む処理部と、処理部が実行可能なコンピュータープログラムを保持するメモリーとを備える。処理部がメモリーに保持されたコンピュータープログラムを実行することにより、IPスピーカー51の各種機能が実現される。メモリーに保持されるコンピュータープログラムには、拡声機能、リアルタイム放送機能、録音放送機能、ダウンロード放送機能、一斉放送機能、非常放送との共存機能等、上述した各種機能を実行するプログラム命令が含まれる。
【0062】
ページングゲートウェイ52は、CPUやMPU等を含む処理部と、処理部が実行可能なコンピュータープログラムを保持するメモリーとを備える。処理部がメモリーに保持されたコンピュータープログラムを実行することにより、ページングゲートウェイ52の各種機能が実現される。メモリーに保持されるコンピュータープログラムには、拡声機能、リアルタイム放送機能、録音放送機能、ダウンロード放送機能、一斉放送機能、非常放送との共存機能等、上述した各種機能を実行するプログラム命令が含まれる。
【符号の説明】
【0063】
1 コミュニケーションシステム
10 通話システム
20 システムマネージャー
30 レコーダー
40 監視カメラシステム
50 拡声システム

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18