(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024017860
(43)【公開日】2024-02-08
(54)【発明の名称】情報処理装置、情報処理方法、およびプログラム
(51)【国際特許分類】
H04N 5/926 20060101AFI20240201BHJP
H04N 23/60 20230101ALI20240201BHJP
G10L 25/84 20130101ALI20240201BHJP
G10L 25/21 20130101ALI20240201BHJP
【FI】
H04N5/926 100
H04N5/232 300
G10L25/84
G10L25/21
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2022120780
(22)【出願日】2022-07-28
(71)【出願人】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100089118
【弁理士】
【氏名又は名称】酒井 宏明
(72)【発明者】
【氏名】斉藤 敦久
【テーマコード(参考)】
5C053
5C122
【Fターム(参考)】
5C053GB21
5C053LA01
5C053LA11
5C053LA14
5C122DA03
5C122EA12
5C122FH08
5C122FJ01
5C122GA01
5C122GA23
5C122HA13
5C122HA35
5C122HB01
5C122HB09
5C122HB10
(57)【要約】
【課題】画像情報に変化がない場合でも音声情報に変化がある場合には高品質の画像情報を記録することができる情報処理装置、情報処理方法、およびプログラムを提供する。
【解決手段】本発明は、撮影部から画像情報および音声情報を取得する取得部と、前記音声情報に基づいて、所定値以上の音量の音声を検知した場合は第1品質で前記画像情報を圧縮し、前記所定値以上の音量の音声を検知しなかった場合は前記第1品質より低い第2品質で前記画像情報を圧縮する圧縮部と、前記圧縮部が圧縮した前記画像情報を記憶する記憶部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
撮影部から画像情報および音声情報を取得する取得部と、
前記音声情報に基づいて、所定値以上の音量の音声を検知した場合は第1品質で前記画像情報を圧縮し、前記所定値以上の音量の音声を検知しなかった場合は前記第1品質より低い第2品質で前記画像情報を圧縮する圧縮部と、
前記圧縮部が圧縮した前記画像情報を記憶する記憶部と、
を備える情報処理装置。
【請求項2】
前記圧縮部は、前記音声情報に基づいて前記所定値以上の音量の音声を検知した場合、該音声を検知したタイミングの所定時間前から、当該音声を検知したタイミングの所定時間後までの所定時間帯に撮影された前記画像情報を前記第1品質で圧縮する、請求項1に記載の情報処理装置。
【請求項3】
複数の前記撮影部それぞれの設置場所または撮影方向を示す位置情報を記憶する第2記憶部をさらに有し、
前記圧縮部は、前記複数の撮影部のうち第1撮影部から取得した前記音声情報から前記所定値以上の音量の音声を検知した場合は、前記位置情報に基づいて、前記複数の撮影部のうち前記第1撮影部から所定範囲内にある第2撮影部から取得した前記画像情報を、前記第2撮影部から取得した前記音声情報に関わらず、前記第1品質で圧縮する、請求項1に記載の情報処理装置。
【請求項4】
情報処理装置で実行される情報処理方法であって、
撮影部から画像情報および音声情報を取得する工程と、
前記音声情報に基づいて、所定値以上の音量の音声を検知した場合は第1品質で前記画像情報を圧縮し、前記所定値以上の音量の音声を検知しなかった場合は前記第1品質より低い第2品質で前記画像情報を圧縮する工程と、
圧縮した前記画像情報を記憶部に保存する工程と、
を含む情報処理方法。
【請求項5】
コンピュータを、
撮影部から画像情報および音声情報を取得する取得部と、
前記音声情報に基づいて、所定値以上の音量の音声を検知した場合は第1品質で前記画像情報を圧縮し、前記所定値以上の音量の音声を検知しなかった場合は前記第1品質より低い第2品質で前記画像情報を圧縮する圧縮部と、
前記圧縮部が圧縮した前記画像情報を記憶部に保存する記憶制御部と、
して機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
特許文献1には、監視カメラ等の撮影部により撮影した映像信号(画像情報の一例)を圧縮する構成が開示されている。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかしながら、上記構成では、映像信号から侵入物あるいは侵入者の有無を検知してデータの圧縮率を制御して記録していたため、映像信号に変化がない場合は低品質の記録となってしまう。
【0004】
本発明は、上記に鑑みてなされたものであって、画像情報に変化がない場合でも音声情報に変化がある場合には高品質の画像情報を記録することができる情報処理装置、情報処理方法、およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
上述した課題を解決し、目的を達成するために、本発明は、撮影部から画像情報および音声情報を取得する取得部と、前記音声情報に基づいて、所定値以上の音量の音声を検知した場合は第1品質で前記画像情報を圧縮し、前記所定値以上の音量の音声を検知しなかった場合は前記第1品質より低い第2品質で前記画像情報を圧縮する圧縮部と、前記圧縮部が圧縮した前記画像情報を記憶する記憶部と、を備える。
【発明の効果】
【0006】
本発明によれば、画像情報に変化がない場合でも音声情報に変化がある場合には高品質の画像情報を記録することができる、という効果を奏する。
【図面の簡単な説明】
【0007】
【
図1】
図1は、第1の実施の形態にかかる情報処理装置を適用したサーバのハードウェア構成の一例を示す図である。
【
図2】
図2は、第1の実施の形態にかかるサーバの機能構成の一例を示すブロック図である。
【
図3】
図3は、第1の実施の形態にかかるサーバにおける画像情報および音声情報の記録処理の流れの一例を示すシーケンス図である。
【
図4】
図4は、第1の実施の形態にかかるサーバにおける音声情報の解析処理の流れの一例を示すフローチャートである。
【
図5】
図5は、第1の実施の形態にかかるサーバにおける画像情報および音声情報の保存に用いるバッファの一例を説明するための図である。
【
図6】
図6は、第2の実施の形態にかかる情報処理システムのシステム構成の一例を示す図である。
【
図7】
図7は、第2の実施の形態にかかる情報処理システムにおける画像情報および音声情報の記録処理の流れの一例を示すシーケンス図である。
【
図8】
図8は、第3の実施の形態にかかる情報処理システムの構成の一例を示す図である。
【
図9】
図9は、第3の実施の形態にかかる情報処理システムが有する複数のカメラの配置例を説明するための図である。
【
図10】
図10は、第3の実施の形態にかかる情報処理システムにおける画像情報および音声情報の圧縮処理の一例を説明するための図である。
【
図11】
図11は、第3の実施の形態にかかる情報処理システムにおける画像情報および音声情報の記録処理の流れの一例を示すシーケンス図である。
【
図12】
図12は、第3の実施の形態にかかる情報処理システムにおける音声情報の解析処理の流れの一例を示すフローチャートである。
【
図13】
図13は、第3の実施の形態にかかる情報処理システムにおけるカメラの位置情報の記憶方法の一例を説明するための図である。
【発明を実施するための形態】
【0008】
以下に添付図面を参照して、情報処理装置、情報処理方法、およびプログラムの実施の形態を詳細に説明する。
【0009】
(第1の実施の形態)
図1は、第1の実施の形態にかかる情報処理装置を適用したサーバのハードウェア構成の一例を示す図である。本実施の形態では、サーバ5(例えば、クラウドサーバ)は、
図1に示されているように、コンピュータによって構築されており、
図1に示されているように、CPU501、ROM502、RAM503、HD504、HDD(Hard Disk Drive)コントローラ505、ディスプレイ506、外部機器接続I/F(Interface)508、ネットワークI/F509、データバス510、キーボード511、ポインティングデバイス512、DVD-RW(Digital Versatile Disk Rewritable)ドライブ514、メディアI/F516を備えている。
【0010】
これらのうち、CPU501は、サーバ5全体の動作を制御する。ROM502は、IPL等のCPU501の駆動に用いられるプログラムを記憶する。RAM503は、CPU501のワークエリアとして使用される。HD504は、プログラム等の各種データを記憶する。HDDコントローラ505は、CPU501の制御にしたがってHD504に対する各種データの読み出しまたは書き込みを制御する。ディスプレイ506は、カーソル、メニュー、ウィンドウ、文字、または画像等の各種情報を表示する。外部機器接続I/F508は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F509は、通信ネットワーク100を利用してデータ通信をするためのインターフェースである。データバス510は、
図1に示されているCPU501等の各構成要素を電気的に接続するためのアドレスバスまたはデータバス等である。
【0011】
また、キーボード511は、文字、数値、各種指示等の入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス512は、各種指示の選択または実行、処理対象の選択、カーソルの移動等を行う入力手段の一種である。DVD-RWドライブ514は、着脱可能な記録媒体の一例としてのDVD-RW513に対する各種データの読み出しまたは書き込みを制御する。なお、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F516は、フラッシュメモリ等の記録メディア515に対するデータの読み出しまたは書き込み(記憶)を制御する。
【0012】
図2は、第1の実施の形態にかかるサーバの機能構成の一例を示すブロック図である。本実施の形態にかかるサーバ5は、
図2に示すように、映像入力部101、音声入力部102、データ圧縮部103、音声解析部104、データ記録部105、および映像・音声データ記憶部106を有する。
【0013】
映像入力部101は、カメラ等の撮影部により撮影した画像の情報(以下、画像情報という)取得する取得部の一例である。音声入力部102は、マイク等の集音部により集音した音声の情報(以下、音声情報という)を取得する取得部の一例である。音声解析部104は、音声入力部102により取得される音声情報を解析する。
【0014】
データ圧縮部103は、音声入力部102により取得した音声情報に基づいて、一定レベル(所定値の一例)以上の音量の音声を検知した場合、第1品質の一例である高品質(例えば、予め設定される圧縮率より低い圧縮率)で画像情報および音声情報を圧縮する圧縮部の一例である。一方、データ圧縮部103は、音声入力部102により取得した音声情報に基づいて、一定レベル以上の音量の音声を検知しなかった場合、高品質より低い第2品質の一例である低品質(例えば、予め設定される圧縮率より高い圧縮率)で画像情報および音声情報を圧縮する。なお、圧縮率とは、圧縮によりデータ量が低減される程度を示す。以下では圧縮によりデータ量が低減される程度が大きい場合を「高い圧縮率」、圧縮によりデータ量が低減される程度が小さい場合を「低い圧縮率」と表現する場合がある。また、高い圧縮率に設定する場合を「圧縮率を上げる」、低い圧縮率に設定する場合を「圧縮率を下げる」と表現する場合がある。また、低い圧縮率を第1品質、高い圧縮率を第2品質と表現する場合があり、設定する圧縮率は任意に設定することができるが、第1品質は第2品質よりも圧縮によりデータ量が低減される程度が小さいものとする。
【0015】
データ記録部105は、データ圧縮部103により圧縮された画像情報および音声情報を、映像・音声データ記憶部106に保存する記憶制御部の一例である。映像・音声データ記憶部106は、データ圧縮部103により圧縮された画像情報および音声情報を記憶する記憶部の一例である。本実施の形態にかかるサーバ5では、画像情報および音声情報の両方を圧縮し、圧縮された画像情報および音声情報の両方を映像・音声データ記憶部106に保存しているが、少なくとも、画像情報を圧縮して、映像・音声データ記憶部106に保存するものであれば、これに限定するものではない。
【0016】
すなわち、本実施の形態では、データ圧縮部103は、入力される音声情報に一定レベル以上の音量の人間の音声または打撃音を検知した場合には、品質を落とさず画像情報を記録する。一方、データ圧縮部103は、入力される音声情報に一定レベル以上の音量の人間の音声と打撃音を検知しなかった場合には、品質を落として画像情報を記録する。これにより、音声情報から侵入物または侵入者等の変化の有無を検知して画像情報および音声情報等の圧縮の品質を制御して記録できる。その結果、画像情報に変化がない場合でも音声情報に変化がある場合に高品質の画像情報および音声情報を記録できる。
【0017】
図3は、第1の実施の形態にかかるサーバにおける画像情報および音声情報の記録処理の流れの一例を示すシーケンス図である。本実施の形態では、映像入力部101は、取得した画像情報(映像データ)をデータ圧縮部103に入力する(ステップS301)。映像入力部101は、取得した音声情報(音声データ)をデータ圧縮部103および音声解析部104に入力する(ステップS302、ステップS303)。
【0018】
音声解析部104は、入力される音声情報を解析し(ステップS304)、その解析結果に基づいて、データ圧縮部103による画像情報および音声情報の圧縮を制御する(ステップS305)。データ圧縮部103は、音声解析部104による音声情報の解析結果に基づいて、画像情報および音声情報を圧縮する(ステップS306)。そして、データ圧縮部103は、圧縮データ(圧縮した画像情報および音声情報)をデータ記録部105に入力する(ステップS307)。データ記録部105は、圧縮した画像情報および音声情報を映像・音声データ記憶部106に保存する(ステップS308)。
【0019】
図4は、第1の実施の形態にかかるサーバにおける音声情報の解析処理の流れの一例を示すフローチャートである。本実施の形態では、音声解析部104は、まず、音声情報から音声(人間の音声)を抽出する(ステップS401)。次いで、音声解析部104は、抽出した音声の音量が一定レベル以上であるか否かを判断する(ステップS402)。
【0020】
抽出した音声の音量が一定レベル以上である場合(ステップS402:Yes)、データ圧縮部103は、画像情報および音声情報を高品質で圧縮する(ステップS403)。一方、抽出した音声の音量が一定レベル以上でない場合(ステップS402:No)、音声解析部104は、音声情報から打撃音を抽出する(ステップS404)。
【0021】
音声解析部104は、抽出した打撃音の音量が一定レベル以上であるか否かを判断する(ステップS405)。抽出した打撃音の音量が一定レベル以上である場合(ステップS405:Yes)、データ圧縮部103は、画像情報および音声情報を高品質で圧縮する(ステップS406)。一方、抽出した打撃音の音量が一定レベル以上でない場合(ステップS405:No)、データ圧縮部103は、画像情報および音声情報を低品質で圧縮する(ステップS407)。
【0022】
図5は、第1の実施の形態にかかるサーバにおける画像情報および音声情報の保存に用いるバッファの一例を説明するための図である。音声情報の解析結果に基づいて、画像情報および音声情報の圧縮の品質を制御する場合、データ圧縮部103は、元データ(画像情報および音声情報)を複数(n)の一定期間T分のバッファ(B0,B1,...,Bn)に記録しておく。
【0023】
そして、データ圧縮部103は、一定レベル以上の音量の音声または打撃音を検出時(例えば、B4~B6,B10)に、その前後x個のバッファ(例えば、B3~B7,B9~B11)に記録されているデータ(画像情報および音声情報)を高品質でデータ圧縮する。また、データ圧縮部103は、それ以外のバッファ(B0~B2,B8)を低品質でデータ圧縮する。
【0024】
すなわち、データ圧縮部103は、音声情報に基づいて一定レベル以上の音量の音声または打撃音を検知した場合、所定時間帯に撮影された画像情報を第1品質で圧縮する。ここで、所定時間帯は、一定レベル以上の音量の音声または打撃音を検知したタイミングの所定時間前から、該音声または打撃音を検知したタイミングの所定時間後までであっても良い。ここで、所定時間は、予め設定される時間である。
【0025】
このように、第1の実施の形態にかかるサーバ5によれば、音声情報から侵入物または侵入者等の変化の有無を検知して画像情報および音声情報等の圧縮の品質を制御して記録できる。その結果、画像情報に変化がない場合でも音声情報に変化がある場合に高品質の画像情報および音声情報を記録できる。
【0026】
(第2の実施の形態)
本実施の形態は、撮影部およびサーバを有する情報処理システムにより、画像情報の記録処理を実現する例である。以下の説明では、第1の実施の形態と同様の構成については説明を省略する。
【0027】
図6は、第2の実施の形態にかかる情報処理システムのシステム構成の一例を示す図である。本実施の形態にかかる情報処理システムは、
図6に示すように、カメラ1(撮影部の一例)、およびサーバ5を有し、それらは、ネットワークを介して互いに通信可能に接続されている。
【0028】
カメラ1は、映像入力部101、音声入力部102、およびデータ転送部107を有する。データ転送部107は、画像情報および音声情報をサーバ5に転送する。
【0029】
サーバ5は、データ圧縮部103、音声解析部104、データ記録部105、映像・音声データ記憶部106、およびデータ受信部108を有する。データ受信部108は、カメラ1から、画像情報および音声情報を受信する。
【0030】
図7は、第2の実施の形態にかかる情報処理システムにおける画像情報および音声情報の記録処理の流れの一例を示すシーケンス図である。本実施の形態では、カメラ1のデータ転送部107は、映像入力部101により取得される画像情報および音声入力部102により取得される音声情報を、サーバ5に転送する(ステップS701)。そして、サーバ5のデータ受信部108は、カメラ1から、画像情報および音声情報を受信する。そして、データ受信部108は、受信した画像情報および音声情報をデータ圧縮部103に渡し(ステップS702)、かつ受信した音声情報を音声解析部104に渡す(ステップS703)。
【0031】
このように、第2の実施の形態にかかる情報処理システムによれば、第1の実施の形態と同様の作用効果を得ることができる。
【0032】
(第3の実施の形態)
本実施の形態は、情報処理システムが、複数の撮影部を有する例である。以下の説明では、上述の実施の形態と同様の構成については説明を省略する。
【0033】
図8は、第3の実施の形態にかかる情報処理システムの構成の一例を示す図である。
図9は、第3の実施の形態にかかる情報処理システムが有する複数のカメラの配置例を説明するための図である。本実施の形態にかかる情報処理システムは、
図8に示すように、複数のカメラ1、およびサーバ5を有する。例えば、情報処理システムは、
図9に示すように、設置場所(位置P)および撮影方向(方向D)が異なる複数のカメラ1-1,1-2,...,1-nを有していても良い。以下の説明では、カメラ1-1,...,1-nを区別しない場合には、カメラ1と記載する。
【0034】
また、サーバ5は、データ圧縮部103、音声解析部104、データ記録部105、映像・音声データ記憶部106、およびデータ受信部108に加えて、カメラ情報データ記憶部109を有する。カメラ情報データ記憶部109は、複数のカメラ1のそれぞれの設置場所(位置P)および撮影方向(方向D)の少なくとも一方を示す位置情報を記憶する第2記憶部の一例である。
【0035】
データ圧縮部103は、複数のカメラ1のうちいずれかのカメラ1(例えば、カメラ1-2)から取得した音声情報から一定レベル以上の音量の音声を検知した場合、カメラ情報データ記憶部109に記憶される位置情報に基づいて、複数のカメラ1のうちカメラ1-2から所定範囲内にある他のカメラ1(例えば、カメラ1-1)から取得した画像情報および音声情報を、カメラ1-1から取得した音声情報に関わらず、高品質で圧縮する。これにより、音声情報に変化が発生して画像情報を記録する場合に複数のカメラ1の画像情報および音声情報を高品質で記録できる。その結果、記録された画像情報または音声情報からの侵入物または侵入者等の異常の有無の検出精度を高めることができる。
【0036】
図10は、第3の実施の形態にかかる情報処理システムにおける画像情報および音声情報の圧縮処理の一例を説明するための図である。
図10に示すように、カメラ1-2だけが一定レベル以上の音量の音声を検出した場合、カメラ1-2付近で何かが発生していると考えられる。
【0037】
その場合、データ圧縮部103は、複数のカメラ1-1~1-nのうち、カメラ1-2の付近または近傍(例えば、カメラ1-2から予め設定された範囲内)のカメラ1-1により撮影された画像情報および音声情報のデータ圧縮率を上げない。一方、データ圧縮部103は、方向Dが遠いカメラ1-3,1-4により撮影された画像情報および音声情報のデータ圧縮率を上げる。また、データ圧縮部103は、カメラ1-2からの位置Pが遠いが、方向Dがカメラ1-2に近いカメラ1-5により撮影される画像情報のデータ圧縮率を上げない等を行っても良い。
【0038】
例えば、カメラ情報データ記憶部109は、下記の表1に示すように、一定レベル以上の音量の音声が検出されたカメラ1の番号(カメラ番号)と、画像情報および音声情報のデータ圧縮率を上げるか否かを示すデータ圧縮率情報と、を対応付けるカメラ情報データを記憶しても良い。この場合、データ圧縮部103は、表1において、一定レベル以上の音量の音声が検出されたカメラ1と対応付けられるデータ圧縮率情報に基づいて、複数のカメラ1のそれぞれにより撮影される画像情報および音声情報をデータ圧縮しても良い。
【表1】
【0039】
図11は、第3の実施の形態にかかる情報処理システムにおける画像情報および音声情報の記録処理の流れの一例を示すシーケンス図である。本実施の形態では、音声解析部104は、カメラ情報データ記憶部109に対して位置情報およびカメラ情報データの取得を要求し(ステップS1101)、カメラ情報データ記憶部109から位置情報およびカメラ情報データを取得する(ステップS1102)。そして、音声解析部104は、取得した位置情報およびカメラ情報データに基づいて、入力される音声情報を解析し(ステップS304)、その解析結果に基づいて、データ圧縮部103による画像情報および音声情報の圧縮を制御する(ステップS305)。
【0040】
図12は、第3の実施の形態にかかる情報処理システムにおける音声情報の解析処理の流れの一例を示すフローチャートである。本実施の形態では、抽出した打撃音の音量が一定レベル以上でない場合(ステップS405:No)、音声解析部104は、一定レベル以上の音量の打撃音の音声情報を取得したカメラ1の付近(または近傍)のカメラ1により取得される音声情報に含まれる打撃音の音量が一定レベル以上であるか否かを判断する(ステップS1201)。
【0041】
近傍のカメラ1により取得される音声情報に含まれる打撃音の音量が一定レベル以上である場合(ステップS1201:Yes)、データ圧縮部103は、画像情報および音声情報を高品質で圧縮する(ステップS1202)。一方、近傍のカメラ1により取得される音声情報に含まれる打撃音の音量が一定レベル以上でない場合(ステップS1201:No)、データ圧縮部103は、画像情報および音声情報を低品質で圧縮する(ステップS1203)。
【0042】
図13は、第3の実施の形態にかかる情報処理システムにおけるカメラの位置情報の記憶方法の一例を説明するための図である。本実施の形態では、情報処理システムは、
図13に示すように、XYZ座標系における、複数のカメラ1のそれぞれの位置PのXYZ座標、および複数のカメラ1のそれぞれの方向Dの相対的なベクトルのXYZ座標を求める。そして、カメラ情報データ記憶部109は、下記の表2に示すように、複数のカメラ1のそれぞれと対応付けて、位置PのXYZ座標および方向Dの相対的なベクトルのXYZ座標を含む位置情報を記憶しても良い。
【表2】
【0043】
あるカメラ1-nの位置情報に基づくデータ圧縮率を上げるかどうかの判定は、一定レベル以上の音量の音声を検出したカメラ1の位置PのXYZ座標と、カメラ1-nの位置Pを始点としたベクトルとの距離を求め、その距離が一定値以内であればデータ圧縮率を上げず、その距離が一定値を超えたらデータ圧縮率を上げても良い。判定に用いる一定値は、予め決めておいても良いし、ユーザに任意に設定させるようにしても良い。
【0044】
例えば、一定レベル以上の音量の音声を検出したカメラ1の位置PのXYZ座標と、カメラ1-nの位置Pを始点としたベクトル方向の直線との距離kは、下記の式1により求めても良い。下記の式2により求められる距離kが0以下である場合、カメラ1の位置Pがカメラ1-nの後ろとなるため、最短距離はカメラ1-nとの距離を求めれば良い。
【数1】
【数2】
【0045】
このように、第3の実施の形態にかかる情報処理システムによれば、音声情報に変化が発生して画像情報を記録する場合に複数のカメラ1の画像情報および音声情報を高品質で記録できる。その結果、記録された画像情報または音声情報からの侵入物または侵入者等の異常の有無の検出精度を高めることができる。
【0046】
なお、本実施の形態のサーバ5で実行されるプログラムは、ROM502等に予め組み込まれて提供される。本実施の形態のサーバ5で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)、CD-R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
【0047】
さらに、本実施の形態のサーバ5で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、本実施の形態のサーバ5で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
【0048】
本実施の形態のサーバ5で実行されるプログラムは、上述した各部(映像入力部101、音声入力部102、データ圧縮部103、音声解析部104、データ記録部105)を含むモジュール構成となっており、実際のハードウェアとしてはCPU501等のプロセッサの一例が上記ROM502からプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、映像入力部101、音声入力部102、データ圧縮部103、音声解析部104、データ記録部105が主記憶装置上に生成されるようになっている。
【0049】
上記で説明した実施の形態の各機能は、一または複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、従来の回路モジュール等のデバイスを含むものとする。
【0050】
本実施の形態に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。ある実施の形態では、サーバ5は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。同様に、カメラ1は、互いに通信するように構成された複数のコンピューティングデバイスを含むことができる。同様に、サーバ5の機能は、カメラ1によって実行することができる。また、サーバ5とカメラ1の各要素は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていても良い。
【0051】
なお、サーバ5は、例えば、PJ(Projector:プロジェクタ)、IWB(Interactive White Board:相互通信が可能な電子式の黒板機能を有する白板)、デジタルサイネージ等の出力装置、HUD(Head Up Display)装置、産業機械、撮像装置、集音装置、医療機器、ネットワーク家電、自動車(Connected Car)、ノートPC(Personal Computer)、携帯電話、スマートフォン、タブレット端末、ゲーム機、PDA(Personal Digital Assistant)、デジタルカメラ、ウェアラブルPCまたはデスクトップPC等であってもよい。
【符号の説明】
【0052】
1 カメラ
5 サーバ
101 映像入力部
102 音声入力部
103 データ圧縮部
104 音声解析部
105 データ記録部
106 映像・音声データ記憶部
107 データ転送部
108 データ受信部
109 カメラ情報データ記憶部
501 CPU
502 ROM
503 RAM
【先行技術文献】
【特許文献】
【0053】