(58)【調査した分野】(Int.Cl.,DB名)
前記音源テンプレート生成部は、音源テンプレートの生成時に、高調波成分を除いたうえで各音階の音の有無を検出することを特徴とする請求項1に記載の音響信号検出システム。
前記テンプレート比較部は、前記音源テンプレートとの比較時にあっては、高調波成分を除かずに、高調波成分を含めたままで各階調音の有無を検出することを特徴とする請求項1又は2に記載の音響信号検出システム。
前記テンプレート比較部は、前記音源テンプレートとの比較時にあっては、高調波成分を除かずに、高調波成分を含めたままで各階調音の有無を検出することを特徴とする請求項4又は5に記載の音響信号検出サーバー。
前記テンプレート比較部は、前記音源テンプレートとの比較時にあっては、高調波成分を除かずに、高調波成分を含めたままで各階調音の有無を検出することを特徴とする請求項7又は8に記載の音響信号検出装置。
前記テンプレート比較ステップでは、前記音源テンプレートとの比較時にあっては、高調波成分を除かずに、高調波成分を含めたままで各階調音の有無を検出することを特徴とする請求項10又は11に記載の音響信号検出プログラム。
前記テンプレート比較処理では、前記音源テンプレートとの比較時にあっては、高調波成分を除かずに、高調波成分を含めたままで各階調音の有無を検出することを特徴とする請求項13又は14に記載の音響信号検出方法。
【発明を実施するための形態】
【0044】
[第1実施形態]
(音響信号検出システムの概要)
以下に添付図面を参照して、本発明に係るシステムの実施形態を詳細に説明する。
図1は、第1実施形態に係るシステムの全体構成を示す概念図である。
【0045】
図1に示すように、本実施形態に係る音響信号検出システムは、評価の対象となる評価音響信号中に含まれる特定音響信号を検出する音響信号検出システムであって、通信回線を相互に接続して構築される通信ネットワーク5上に配置された管理サーバー2と、無線基地局3と、無線基地局3を通じて無線通信が可能なユーザー端末1とを備えている。
【0046】
通信ネットワーク5は、通信プロトコルTCP/IPを用いたIP網であって、種々の通信回線(電話回線やISDN回線、ADSL回線、光回線などの公衆回線、専用回線、無線通信網)を相互に接続して構築される分散型の通信ネットワークである。このIP網には、10BASE−Tや100BASE−TX等によるイントラネット(企業内ネットワーク)や家庭内ネットワークなどのLANなども含まれる。
【0047】
無線基地局3は、図示しないゲートウェイ装置を通じて通信ネットワーク5に接続され、ユーザー端末1との間で無線通信接続を確立し、ユーザー端末1による通話やデータ通信を提供する装置である。
【0048】
ユーザー端末1は、CPUを備えた演算処理装置であり、無線通信機能を有した携帯可能なモバイルコンピューターやPDA(Personal Digital Assistance)、携帯電話機、スマートフォン、タブレットPC等である。このユーザー端末1は、基地局等の中継点と無線で通信し、通話やデータ通信等の通信サービスを移動しつつ受けることができる。ユーザー端末1の通信方式としては、例えば、FDMA方式、TDMA方式、CDMA方式、W−CDMAの他、PHS(Personal Handyphone System)方式等が挙げられる。
【0049】
また、このユーザー端末1は、デジタルカメラ機能、アプリケーションソフトの実行機能、或いはGPS機能等の機能が搭載されている他、外部から音響信号を取得するマイクを備えており、このマイクによって外部の音響を音声信号や音声ファイルとして取得する音響信号検出装置として機能する。
【0050】
管理サーバー2は、通信ネットワーク5上に配置され、ユーザーに対するサービスを管理する一般的なサーバー装置であって、WWW(World Wide Web)等のドキュメントシステムにおいて、HTML(HyperText Markup Language)ファイルや画像ファイル、音楽ファイルなどの情報送信を行うサーバーコンピューター或いはその機能を持ったソフトウェアであり、HTML文書や画像などの情報を蓄積しておき、Webブラウザなどのクライアントソフトウェアの要求に応じて、インターネットなどの通信ネットワーク5を通じてこれらの情報を送信する。
【0051】
特に管理サーバー2は、ユーザー端末1に対して、特定音響信号を検出するための音源テンプレートD1と、及び音源テンプレートD1に関連づけられて発生されるべきイベントに関する情報であるイベント情報D2とを生成し、これらの情報をユーザー端末1に配信する。
【0052】
ここで、「特定音響信号」とは、本システムが検出するべき音響のみを含んだ信号を意味しこの例えば、スーパーマーケットや家電量販店などで店内に流される独自のテーマソング、駅や電車内で流される駅名又は発車メロディー、アーティストの楽曲のワンフレーズなどが含まれる。
【0053】
また、「音源テンプレートD1」とは、特定音響信号について、所定の周波数帯域における音響信号の有無を音階平均率に基づいて抽出し、音響信号の分布及びその時間的変化が、音階ごとに二値化されて時系列で記録された情報(STFT(short−time Fourier transform)データ)である。「音源テンプレート」は、システムのいずれかのデバイスを用いて生成されるものであり、例えば、ユーザー端末でユーザー自ら生成してもよく、生成済みの音源テンプレートをサーバーからダウンロードするようにしてもよい。
【0054】
また、「音階平均率」としては、半音ずつの音で構成された12音階の他、種々の音階が含まれる。「音響信号の有無を二値化」するとは、各音階の音があるか否かのみを検出することを意味し、例えば、音響信号が所定のしきい値を上回るか否かにより判定する手法が挙げられる。
【0055】
また、イベントとしては、ユーザーが所定のエリアAに移動して特定の音源を検出した場合に発生するものであり、音声やテキスト表示によるメッセージ出力や、画像・動画の再生、アプリケーションの起動など種々の情報処理サービスが挙げられる。そして、これら種々の情報処理サービスに関するデータ又はプログラムがイベント情報D2として配信される。この配信される情報D2としては、例えば、クーポン情報、チケット情報、プレゼント情報、乗り換え案内情報、目的地である旨を通知する通知情報などが含まれる。
【0056】
エリアAとは、例えば、ショッピングモールやコンサート会場など特定の音響を出力する場所であり、エリアA内には、スピーカー等の音再生手段4から音響(テーマソング、又は効果音など)が出力されるようになっている。そして、その音響をユーザー端末1のマイク等で聞き取り、音声データ等として取得することで、その音響内に含まれる音源テンプレートD1の有無に応じてイベントが発生されるようになっている。
【0057】
(各装置の内部構造)
次いで、上述した音響信号検出システムを構成する各装置の内部構造について説明する。
図2は、第1実施形態に係る管理サーバー2ーの内部構成を示すブロック図であり、
図3は、第1実施形態に係るユーザー端末1の内部構成を示すブロック図である。また、
図4(a)〜(c)は、第1実施形態に係る音源テンプレートD1の及び比較先テンプレートを示す説明図である。なお、ここで、
図4中の横軸は時間経過を示し、
図4中の縦軸は周波数を示している。また、
図5は、音源テンプレートD1が作成されるパート位置を示す説明図である。なお、説明中で用いられる「モジュール」とは、装置や機器等のハードウェア、或いはその機能を持ったソフトウェア、又はこれらの組み合わせなどによって構成され、所定の動作を達成するための機能単位を示す。
【0058】
(1)管理サーバー2
管理サーバー2は、単一のサーバー装置の他、Webサーバーやデータベースサーバーなど複数種のサーバー群から構成することができ、本実施形態では、通信部21と、制御部22と、各種データベース23〜25を備えている。
【0059】
通信部21は、通信ネットワーク5を通じて、ユーザー端末との間でデータの送受信を行う通信インターフェースである。データベース23〜25は、本システムに関する各種の情報を蓄積するデータベース群であり、本実施形態では、ユーザー端末1を所有するユーザーに関する情報を保持するユーザー情報データベース23と、イベントデータベース24と、音源テンプレートデータベース25とを備えている。
【0060】
ユーザー情報データベース23には、ユーザーを識別する識別番号に、ユーザー端末の電話番号、及びメールアドレスの他、ユーザーの年齢、性別、住所、及び趣向情報などの属性情報や音響検出を実行した履歴情報が関連づけて記録されている。
【0061】
音源テンプレートデータベース25は、特定音響信号について生成された音源テンプレートD1のを蓄積する蓄積装置であり、制御部22の音源テンプレート生成部222が生成した音源テンプレートD1のが、音源テンプレートD1のを識別するテンプレート識別子に関連づけて記憶されている。
【0062】
イベントデータベース24は、ユーザーに対して発生させるイベント情報D2を蓄積する装置であり、イベントを識別するイベント識別子が付加されている。また、本実施形態においてイベントデータベース24には、テンプレート識別子に、発生させるべきイベントのイベント識別子が関連づけて記憶されている。
【0063】
この発生させるべきイベントは、例えば、全ユーザーに対して共通のイベントであってもよく、ユーザーの属性に応じて変更してもよい。すなわち、同じ音源テンプレートD1のであっても、例えば、ユーザーが女性であれば化粧品、食品等に関するイベントの識別子を関連づけ、例えば、ユーザーの性別が男性であれば、ゴルフなどのスポーツ、又は家電に関するイベントの識別子が関連づけることも可能である。
【0064】
また、例えば、
図5に示すように、同一楽曲のワンフレーズのうち、異なる位置のパートを切り取って、音源テンプレートD11〜D13として生成し、ユーザーの属性に応じて異なる位置の音源テンプレートを配信させることで、例えば、家族で同時に同じ店舗に入った場合でも、大人と子供では異なるイベントを発生させるなど、ユーザーに発生させるイベント情報を変更させることができるようになっている。
【0065】
なお、この際、切り取るパートは音源テンプレートD11及びD12のように重なっていてもよいし、音源テンプレートD13のように他のテンプレートと重ならなくてもよい。さらには、ユーザーの年齢や趣向情報に基づいてイベントを選択可能となっており、年齢や性別などユーザーの特定に適したサービスを提供することができる。
【0066】
このように、各ユーザーに対して発生すべきイベントを変更するために、イベントデータベース24内のイベント情報(例えば、食品に関する情報)には、属性情報(例えば、女性)が関連づけられるとともに、この属性情報に対応するテンプレート識別子(例えば、化粧会社のテーマソング)がイベント識別子と関連づけられるようになっている。
【0067】
制御部22は、CPUやDSP(Digital Signal Processor)等のプロセッサ、メモリ、及びその他の電子回路等のハードウェア、或いはその機能を持ったプログラム等のソフトウェア、又はこれらの組み合わせなどによって構成された演算モジュールであり、プログラムを適宜読み込んで実行することにより種々の機能モジュールを仮想的に構築し、構築された各機能モジュールによって、各部の動作制御、ユーザー操作に対する種々の処理を行っている。
【0068】
この制御部22には、音響を検出する機能として、音源データ取得部221と、音源テンプレート生成部222と、イベント生成部223と、配信管理部224と、ユーザー登録部225とを備えている。
【0069】
ユーザー登録部225は、本システムを受けるためのユーザー登録を受け付けるモジュールである。このユーザー登録部225は、ユーザーの各種情報を取得すると、ユーザーを特定するための識別子を付与してユーザー情報データベース23に記録する。
【0070】
音源データ取得部221は、評価の対象となる特定音響信号を取得するモジュールであり、例えば、クーポンを発行するサービス提供側から音声信号や音声ファイルを取得する。
【0071】
音源テンプレート生成部222は、音源データ取得部221が取得した特定音響信号に基づいて音源テンプレートD1を生成するモジュールである。具体的に、音源データ取得部221は、音の周波数帯域を12音階平均率にまるめて音階テーブルを生成する。音階テーブルの作成法としては、中心周波数fmから前後fm*2^(±1/12)を境界値とするものとする。さらに、あるしきい値を超えた値の中で、高調派成分を除いた音量(Amplitude)最大N個を抜き出す。なお、Nは1以上の整数とするものとする。この高調波成分については、音源テンプレートの作成時にあっては、高調波成分を除いたうえで各音階の音の有無を検出し、テンプレートとの比較時にあっては、高調波成分を除かずに、高調波成分を含めたままで各階調音の有無を検出する。これにより、検出対象となる音階の倍音となる高調波成分の影響を低減することができ、より適正な音源テンプレートを作成できるとともに、比較の際には、逆に倍音の影響を利用して検出精度を高めることができる。
【0072】
そして、この処理を各窓幅(ブロック数)で行うことで、
図4(a)に示すように、所定の周波数帯域における音響信号の有無を音階平均率に基づいて抽出し、音響信号の分布及びその時間的変化が、音階ごとに二値化され時系列で記録された所定長さの音源テンプレートD1が作成される。各窓幅(ブロック数)で抜き出す特徴点は、同じ個数でもよいし、違う個数でもよいものとする。なお、違う個数を抜き出す場合は、しきい値を超えた値のうち高調派成分を除いた全てを取得するものとする。
【0073】
また、本実施形態において、音源テンプレート生成部222は、特定音響信号について、音源テンプレートD1を生成する際、各音階における信号強度を検出し、検出された音響信号が所定のしきい値を上回るか否かに基づいて音響信号の有無を抽出してもよい。このしきい値は、発生させるべきイベントの種類に応じて異なる値に設定されている。
【0074】
本実施形態では、基音+1/2Freqの単位であって、発話域を除く周波数でテンプレートを用意するものとする。さらに、ここでは、機械学習機能を用いて、抽出する周波数領域、数、窓幅を学習させるものとする。この機械学習機能としては、人工ニューラルネットワーク、遺伝的アルゴリズム、強化学習等教師あり学習などを用いることができ、そのために、学習用のデータがサーバー内に蓄積されている。
【0075】
このように生成された音源テンプレートD1は、テンプレート識別子が付加されて音源テンプレートデータベース25に蓄積される。なお、音源テンプレート生成部222は、
図5に示すように、同じ曲であっても異なるパートからそれぞれ音源テンプレートD11〜D13を作成することも可能である。
【0076】
イベント生成部223は、ユーザーに提供すべきイベント情報を生成するモジュールであり、生成したイベント情報D2を識別するイベント識別子に関連づけてイベントデータベース24に蓄積する。
【0077】
配信管理部224は、各種のデータを通信ネットワーク上に配信する制御を管理するモジュールであり、音源テンプレート配信部224aを備えている。音源テンプレート配信部224aは、ユーザー端末からのアクセスに基づいて、音源テンプレート生成部222が生成した音源テンプレートD1をユーザー端末1に対して配信するモジュールである。
【0078】
この際、配信管理部224は、音源テンプレート配信部224aが配信した音源テンプレートD1のテンプレート識別子と、発生させるべきイベントのイベント識別子とを関連づけてイベントデータベース24に登録する。なお、配信管理部224は、予めテンプレート識別子と、発生させるべきイベントのイベント識別子とを関連づけ、音源テンプレートD1とイベント情報D2とを合わせてユーザー端末1に配信してもよい。
【0079】
また、配信管理部224は、アクセスしたユーザーの属性情報を参照し、その属性情報に関連したイベント情報を選択する機能を有している。この機能によれば、例えば、
図5に示すように、1つのフレーズから異なるパートの音源テンプレートD11〜D13が生成されている場合には、各パートの音源テンプレートD11〜D13を選択して、それぞれに対して異なるイベントを選択することができるようになっている。
【0080】
(2)ユーザー端末及び音再生手段
次いで、ユーザー端末1及び音再生手段4の内部構造について説明する。
図6は、本実施形態に係るダブルバッファリング処理を示す説明図であり、
図7は、本実施形態に係るテンプレート比較手法を示す説明図である。また、
図8〜10は、本実施形態に係る適合率に応じて表示される表示情報を示す説明図である。
【0081】
音再生手段4は、
図3に示すように、音響を再生する手段であり、音声信号や音声ファイルを読み出して再生する制御部41と、音声信号や音声ファイルを外部に音響として出力するスピーカー42と、音声信号や音声ファイルを一時的に記憶するバッファ43a及び43bからなる。制御部41は、オーディオアンプ等の音楽再生用の電子回路であり、各種の記録メディアに記録された音声信号や音声ファイルを読み出して、アンプ等によって音声信号や音声ファイルを増幅させてスピーカー42に入力する。スピーカー42は、音声信号や音声ファイルを物理振動に変換して外部に出力する機器である。
【0082】
制御部41は、特定音響を再生する際、
図6に示すように、バッファ43a及びバッファ43bを用いて、ダブルバッファリング処理を行っている。本実施形態では、2つのバッファ43a及び43bに同一の生波形データを保持させて、この生波形データを制御部41の再生デバイスに入力して交互に音を出力させることで、再生用のデータが常に存在して音が途切れなく出力されるようにしている。
【0083】
この際、制御部41では、
図6に示すように、再生を開始して一方のバッファ43aが空になった時点でイベントを発生させるように関連づけておき、イベントが発生するとそのイベント内で、次のデータをバッファに用意して、その後に再生を開始する。この際、他方のバッファ43bには音データが残るように制御することで、再生音は途切れること再生されることとなる。なお、本実施形態では、最初は両方のバッファ43a,43bを同時にセットし、次回からは交互にバッファ43a,43bを使うようにするものとする。
【0084】
一方、ユーザー端末1は、
図3に示すように、無線インターフェース11と、アプリケーション実行部17と、出力インターフェース13と、入力インターフェース12と、メモリ15と、音響取得部16と、音源テンプレート受信部14とを備えている。
【0085】
無線インターフェース11は、通話やデータ通信を行うための移動通信用のプロトコルによる無線通信機能と、例えば無線LAN等のデータ通信用のプロトコルによる無線通信機能とを備えている。なお、この無線インターフェースは、モバイルコンピューターやPDAにおいては、無線LANアダプタ等により実現することができる。なお、この無線インターフェース11には、Wifi等の無線LANの他、赤外線通信、Bluetooth(登録商標)等の近距離通信のインターフェースが含まれる。
【0086】
出力インターフェース13は、ディスプレイやスピーカーなど、映像や音響を出力するデバイスである。特に、この出力インターフェース13には、液晶ディスプレイなどの表示部13aが含まれており、アプリケーションにより構築されるGUI(Graphical User Interface)がこの表示部13aに表示される。
【0087】
入力インターフェース12は、操作ボタンやタッチパネルなどユーザー操作を入力するデバイスである。また、入力インターフェース12は、外部から出力され、評価対象となる評価音響信号を取得するマイク12aを備えている。このマイク12aで取得した評価音響信号は、データ変換されて音響取得部16に入力される。この「評価音響信号」とは、外部から出力された各種の音響が混ざり合った音響信号であり、雑音内に特定音響信号が含まれている信号や、特定音響信号が含まれず雑音のみの信号である場合も含まれる。また、「評価音響信号の取得」としては、マイク等の音響デバイスを用いて音響を直接電気信号として取得する他、無線・有線の通信により音声信号や音声ファイルとして取得する場合が含まれる。評価音響信号内には、特定音響信号と雑音の音響信号とが交ざり合った信号である。
【0088】
メモリ15は、OS(Operating System)や各種のアプリケーション用のプログラム、その他のデータ等などを記憶する記憶装置であり、このメモリ15内には、管理サーバー2から配信された音源テンプレートD1と、音源テンプレートD1に関連づけられたイベント情報D2がイベントデータベース151に記憶されている。なお、これらのデータは、テンプレート識別子及びイベント識別子に基づいて関連づけられている。また、メモリ15内には、本発明に係る音響信号検出プログラムが管理サーバー2からダウンロードされて蓄積されているものとする。
【0089】
音源テンプレート受信部14は、通信ネットワーク5を通じて音源テンプレートD1と、当該音源テンプレートD1に基づいて発生させるべきベントに関するイベント情報D2とを受信するモジュールであり、この音源テンプレート受信部14は、音源テンプレートD1を取得する音源テンプレート取得部としての機能を有している。取得した音源テンプレートD1及びイベント情報D2は、イベントデータベース151に蓄積される。
【0090】
音響取得部16は、マイク12aから入力された音響を取得し、当該音響を評価音響信号、若しくは特定音響信号として出力するモジュールである。音響取得部16においても、音声取り込み処理としてダブルバッファリング処理を実行しており、入力される同一の評価音響信号をふたつのバッファに対して時間をずらして記録して音抜けを防止している。
【0091】
そして、評価音響信号として取得された信号は、評価対象変換部171に入力され、特定音響信号として取得された信号は、音源テンプレート生成部175に入力される。この入力先の決定は、当該音響信号プログラムが起動され、音源テンプレートD1を作成メニュー、若しくはテンプレート比較メニューのいずれかが選択されることで決定される。
【0092】
アプリケーション実行部17は、一般のOSやブラウザソフト、電子メール、画像表示ソフトなどのアプリケーションを実行するモジュールであり、通常はCPU等により実現される。このアプリケーション実行部17で管理サーバー2からダウンロードした音響信号検出プログラムを実行することにより、CPU上に評価対象変換部171と、テンプレート比較部172と、適合率出力部173と、イベント発生管理部174と、受信管理部176と、音源テンプレート生成部175との機能モジュールが仮想的に構築される。
【0093】
評価対象変換部171は、音響取得部16から取得された評価音響信号について、所定の周波数帯域における音響信号の有無を音階平均率に基づいて抽出し、音響信号の分布及びその時間的変化が、音階ごとに二値化されて時系列で記録された比較先テンプレートD3を生成するモジュールである。
【0094】
より具体的に、評価対象変換部171は、音の周波数帯域を12音階平均率にまるめて音階テーブルを作成し、その音階テーブルの中から、あるしきい値を超えた値の中で、音量(Amplitude)最大M個を抜き出して比較先テンプレートD3として生成する。この評価先テンプレートでは、N<Mとなるように設定するものとする。また、比較先テンプレートD3は、高調派成分を含むものとする。
【0095】
そして、各窓幅(block数)で同じ処理を行い、音源テンプレートD1を作成する。この際、評価対象変換部171は、リアルタイム処理を行うため、音源テンプレート生成とは異なり、同じ個数を想定する。このような処理により、
図4(c)に示すような比較先テンプレートD3が生成される。
【0096】
テンプレート比較部172は、比較先テンプレートD3と音源テンプレートD1とを比較して、二値化された音響信号の分布の適合率を算出するモジュールである。具体的に、テンプレート比較部172は、イベントデータベース151から
図4(b)に示す音源テンプレートD1を取り出して、
図4(c)に示すような比較先テンプレートD3に対して、1窓幅(block数)ずつずらしながら比較して適合率を算出する。
【0097】
ここで、上記評価対象変換部171、テンプレート比較部172による処理は、入力される比較先テンプレートD3をFIFO(First In First Out)方式で持つことで、リアルタイムで実行されるようになっている。具体的には、
図7に示すように、評価対象変換部171に入力された評価音響信号は、ダブルバッファリング処理が実行されて、ブロック幅単位でテンプレート化処理される。そして、予め分析済みの音源テンプレートD1と同じ長さのテンプレート幅分を有するデータをFIFO方式で保持しつつ、保持分の比較先テンプレートD3を音源テンプレートD1と比較して、適合率出力部173によって適合率を算出する。なお、適合率出力部173において、音源テンプレートD1と比較して適合率を算出している間も、比較先テンプレートD3の生成はリアルタイムで行っている。
【0098】
適合率出力部173は、テンプレート比較部172により算出された適合率に応じた比較結果信号を出力するモジュールである。本実施形態では、適合率が完全一致であるか否かによって比較結果を分けてもよく、また、適合率を複数段階に分け、その適合率の割合に応じて比較結果を変化させてもよい。このように比較結果信号を適合率の割合に応じて変化させることで、イベント発生のトリガーとなる特定音響信号が近くにあることを知らせる音レーダー機能を実行可能となる。
【0099】
具体的に、音レーダー機能を実行する場合には、音レーダー用の適合率を算出する。この適合率の算出は、時間を無視した周波数帯域だけのテンプレート適合率を[M_a]とし、時間を考慮したテンプレート適合率を[M_t]とし、重み付け係数を[α]とすると、
(式1)音レーダー用適合率=M_a+ α*M_t
によって算出される。
【0100】
イベント発生管理部174は、適合率出力部173から出力された比較結果信号に基づき、当該比較結果信号に係る音源テンプレートD1のテンプレート識別子についてイベントデータベース151を照合し、発生させるべきイベントを選出し、選出されたイベントを発生させるモジュールである。このイベント発生管理部174は、適合率出力部173から出力された比較結果信号に基づき、適合率に応じたグラフィックの表示を行うように制御する適合率表示部174aを有している。
【0101】
例えば、適合率表示部174aは、適合率出力部173において適合率が完全一致か否かのみ判断された場合には、検出成功の比較結果信号を取得した場合、
図8(a)に示すようなキャラクターを表示部13aの画面上に表示させ、適合率が満たさず検出失敗の比較結果信号を取得した場合、
図8(b)に示すようなキャラクターを表示部13aの画面上に表示させる。
【0102】
一方、音レーダー機能によって、音レーダー用適合率を算出した場合には、その適合率に応じた比較結果信号が入力され、イベント発生管理部174では、その比較結果に応じてイベントを変更して、画面上の表示も変化させる。
【0103】
この処理を実行する場合には、所定のしきい値に応じて音響信号の有無を変化させた複数の音源テンプレートD1を用いるものとし、その信号強度の強弱に応じて段階的に比較結果信号を変化させる。具体的に、適合率が低い場合には、適合率表示部174aは、
図9(a)に示すように「特定音響信号が聞こえない」表情のキャラクターを表示させる。また、ある程度の適合率である場合には、
図9(b)に示すように「特定音響が近くにある」表情のキャラクターに変化させる。そして、適合率が完全一致である場合には、
図9(c)に示すように「イベント発生可能」である表情のキャラクターを表示させて、その後にイベント情報を表示させる。なお、イベント発生までの適合率に達していない場合には、入力される音響信号の強弱や入力方向を検出して、特定音響までの距離や方向を示すように目のサイズや口の動きを変化させるようにしてもよい。
【0104】
入力方向を検出する手法としては、例えば、テンプレートとの比較結果において適合している音量の総計を、テンプレート中の適合ブロックの総計として算出し、そのブロック数の変遷を履歴として記録し、前回の算出結果と、今回の算出結果のブロックの総計を比較する方法が挙げられる。この方法では、前回と今回の適合ブロック数を比較し、その比較において、ブロック数が増加していれば近づいていると判断し、減少していれば遠くなっていると判断する。他の手法としては、音声を取得するマイクデバイスを指向性のものにすることにより、より明確に方向性を検出することができ、さらに複数マイクを用いて、ビームフォーミニングを用い、左右の音声の強弱により音源方向を特定するようにしてもよい。また、端末に、GPSやコンパス、ジャイロ等の位置情報取得手段が備えられている場合には、端末の移動方向と、音響信号の強度変化から、入力方向を特定するようにしてもよい。
【0105】
このような音レーダー機能を実行することで、サービスを提供する音源テンプレートD1がユーザーの傍にあることや、その場所に近づいているか否かをユーザーに通知して誘導することができる。
【0106】
また、適合率表示部174aは、生成した比較先テンプレートD3を、
図10(a)及び(b)に示すように、音響信号の有無を音階平均率で区分けし、音響信号の分布を同心円の形状で表示させてもよい。この表示情報は、1周が1オクターブを表し、外周の円ほど高周波数(高いオクターブ領域)を表示するようになっている。この場合でも、特定音響までの距離や方向を示すように表示を変化させてもよい。
【0107】
音源テンプレート生成部175は、ユーザー端末1側で、特定音響信号に基づいて、音源テンプレートD1を生成するモジュールである。この音源テンプレートD1の作成は、管理サーバー2における音源テンプレート生成部222と同様な処理によって生成され、しきい値に応じて音響信号の有無を抽出する処理を実行することもできる。
【0108】
受信管理部176は、音源テンプレート受信部14が受信した音源テンプレートD1のテンプレート識別子と、このテンプレート識別子に基づいて発生させるべきイベントに関する情報D2とを関連づけて、イベントデータベース151に登録させるモジュールである。
【0109】
(音響信号検出方法)
次いで、本発明の音響信号検出方法について説明する。
図11は、音響信号検出システムの動作の概要を示すフローチャート図である。なお、本実施形態では、管理サーバー2においてユーザー登録が完了されているものとする。
【0110】
評価の対象となる評価音響信号中に含まれる特定音響信号を検出する音響信号検出方法では、先ず、イベント生成部223は、ユーザーに対して発生させるイベントに関するイベント情報D2を生成する(S101)。このイベント情報D2は、イベントを識別するイベント識別子に関連づけてイベントデータベース24に蓄積する。
【0111】
次いで、音源テンプレート生成部222において、特定音響信号を取得し(S102)、特定音響信号に基づいて、音源テンプレートD1を生成する音源テンプレート生成処理を行う(S103)。この際、音源テンプレートD1の生成処理では、特定音響信号について、音源テンプレートD1を生成する際、各音階における信号強度を検出し、検出された音響信号が所定のしきい値を上回るか否かに基づいて音響信号の有無を抽出するようにしてもよい。なお、しきい値は、発生させるべきイベントの種類に応じて異なる値に設定されている。
【0112】
生成された音源テンプレートD1は、音源テンプレートD1を識別するテンプレート識別子が付加されて音源テンプレートデータベース25に蓄積される。この際、配信管理部224は、音源テンプレートD1を識別するテンプレート識別子と、発生させるべきイベントを識別するイベント識別子とを関連づけて、イベントデータベース24に記憶させるデータベース制御処理を行う(S103)。この際、配信管理部224は、ユーザー情報データベース23を参照して、配信先となるユーザー端末1が所持するユーザーの属性情報(性別、年齢、又は趣向情報)に基づいて、イベント情報D2を選択するように制御してもよい。
【0113】
その後、管理サーバー2が主導で、若しくは、ユーザー端末1から音源テンプレートD1を要求する信号を取得した場合に、音源テンプレート配信部224aは、音源テンプレートD1を、通信ネットワーク5を通じて配信する音源テンプレート配信処理を実行する(S105)。この際、配信管理部224は、この音源テンプレートD1に基づいて発生させるべきイベント情報D2についても合わせて配信してもよく、発生すべきイベントが変更された場合には、新しいイベント情報D2をユーザー端末1に配信する。新たなイベント情報D2を配信した場合、配信管理部224は、テンプレート識別子に、発生させるべきイベントを関連づけてイベントデータベース24に更新登録する。
【0114】
ユーザー端末1では、音源テンプレート受信部14によって、音源テンプレートD1と当該音源テンプレートD1に基づいて発生させるべきイベント情報D2とを受信すると(S106)、受信管理部176の制御によって、音源テンプレートD1を識別するテンプレート識別子と、発生させるべきイベントを識別するイベント識別子とを関連づけてイベントデータベース151に記憶させる(S107)。その後、音響信号検出プログラムを起動させて、音再生手段4のスピーカー42から所定の音が出力されている状態で(S108)、マイク12aから外部の音響を読み取らせる(S109)。
【0115】
ユーザー端末1の音響取得部16は、この音響を評価音響信号として取得し、取得された評価音響信号を評価対象変換部171に入力する。評価対象変換部171では、この評価音響信号に基づいて、比較先テンプレートD3を生成する評価対象変換する処理を実行する(S110)。
【0116】
比較先テンプレートD3がFIFO方式によって生成されると、その比較先テンプレートD3はテンプレート比較部172に入力される。テンプレート比較部172では、比較先テンプレートD3と音源テンプレートD1とを比較して、二値化された音響信号の分布の適合率を算出するテンプレート比較処理を実行する(S111)。
【0117】
テンプレート比較処理により算出された適合率は適合率出力部173に入力され、適合率出力部173では、その適合率に応じた比較結果信号を出力する適合率出力処理を実行する(S112)。適合率出力処理によって出力された比較結果信号は、イベント発生管理部174に入力される。
【0118】
イベント発生管理部174では、出力された比較結果信号に基づいて、イベント発生の有無を判断する(S113)。なお、このイベント発生の有無は、例えば、比較結果信号が両テンプレートについて完全一致しているか、若しくは一致度が所定のしきい値以上であるか否かなどに基づいて判断される。なお、この一致の程度に応じて発生させるイベントを選択するようにしてもよく、これにより、目標とする音源が遠い場合と、近い場合とで表示するメッセージや起動するアプリケーションを切り換えることができる。
【0119】
なお、ここでのイベントとは、プログラム上における例外処理や、分岐処理など、一定の要件が満たされることを条件として発生する処理であり、このイベントにより発生された処理によって提供されるシステムやサービスもここで言う「イベント」に含まれる。例えば、特定の音源を検出した場合に、音声やテキスト表示によるメッセージ出力や、画像・動画の再生、アプリケーションの起動など種々の情報処理サービスも、ここでのイベントに含まれる。
【0120】
ステップS113において、イベントを発生しないと判断した場合には(S113における“N”)、イベントを発生させることなく、ステップS108〜S112までの処理を繰り返す。一方、イベントを発生すると判断した場合には、(S113における“Y”)、当該比較結果信号に係る音源テンプレートD1のテンプレート識別子についてイベントデータベース24を照合し、発生させるべきイベントを選出し、選出されたイベントを発生させるイベント発生管理処理を実行する(S114)。この際、適合率表示部174aでは、適合率出力処理により出力された比較結果信号に基づき、適合率に応じたグラフィックの表示を行う(S115)。
【0121】
その後、イベント発生、若しくはユーザー操作によって特定音響検出の処理が選択されるまで(S116における“N”)、ステップS108〜ステップS115までの処理を繰り返し、特定音響検出の処理終了が選択された場合には(S116における“Y”)、終了する。
【0122】
(音響信号検出プログラム)
上述した第1実施形態係る音響信号検出システム、音響信号検出装置、音響信号検出サーバー、及びオブジェクト制御方法は、所定の言語で記述されたプログラムをコンピューター上で実行することにより実現することができる。すなわち、このプログラムを、ユーザー端末やWebサーバー等のコンピューターやICチップにインストールし、CPU2上で実行することにより、上述した各機能を有するシステムを容易に構築することができる。このプログラムは、例えば、通信回線を通じて配布することが可能であり、またスタンドアローンの計算機上で動作するパッケージアプリケーションとして譲渡することができる。
【0123】
そして、このようなプログラムは、パーソナルコンピューターで読み取り可能な記録媒体に記録することができ、汎用のコンピューターや専用コンピューターを用いて、上述した音響信号検出システム、音響信号検出装置、音響信号検出サーバー、及びオブジェクト制御方法を実施することが可能となるとともに、プログラムの保存、運搬及びインストールを容易に行うことができる。
【0124】
(作用・効果)
このような本実施形態によれば、特定音響信号を、音階平均律に基づいてその周波数帯域における信号の有無を抽出して生成したテンプレート同士の比較により行うため、複雑な演算処理を要することなく音源とのマッチング処理を行うことができ、データをダウンサイズすることによる高速演算によってリアルタイム処理が可能となる。また、音響信号の有無を、二値化されたテンプレートによって検出することから、雑音下での検出が可能となる。これらの結果、例えば、店舗内で放送されているテーマソングなどを検出した場合にクーポンやポイントを配布するなどのように、特定の音響検出をトリガーとしたサービスを提供することができ、サービスの多様化、充実化を図ることができる。
【0125】
また、本実施形態では、特定音響の検出に用いられる音源テンプレートD1と任意のイベントとを関連づけておくことで、ユーザー端末1における特定音響の検出をトリガーとしたイベントを発生させることができる。また、いずれのユーザーが、どこでどのような音響を検出したかについての情報を収集することができ、リアルなユーザー動向を調査することができ、ビックデータの構築によるマーケティングの充実を図ることができる。特に、本実施形態では、ユーザー端末自体が主導となって、特定音響信号を検出して比較結果を算出しているので、通信ネットワーク5上に配置されるサーバー装置等に依存することなく、よりリアルタイム処理が可能となる。
【0126】
また、本実施形態によれば、音源テンプレート生成部222は、音源テンプレートD1を生成する際、各音階における信号強度を検出し、検出された音響信号が、イベントの種類に応じて異なる値に設定されたしきい値を上回るか否かに基づいて音響信号の有無を抽出しているので、しきい値の値を変えて音源テンプレートD1を作成することにより、同じ特定音響が検出される場合であっても、音源テンプレートD1の種類によって異なるイベントを発生させることができる。これにより、例えば、家族で同時に同じ店舗に入り、同じ特定音響を検出したとしても、大人と子供では異なるイベントを発生させるなど、年齢や性別などユーザーの特定に適したサービスを提供することができる。
【0127】
また、本実施形態によれば、音源テンプレート配信部224aが配信した音源テンプレートD1のテンプレート識別子と、発生させるべきイベントとを関連づけてイベントデータベース24に登録しているので、例えば、インターネット上のサーバーから、Webページや電子メール等を介して音源テンプレートD1を配信し、その音源テンプレートD1ごとにイベントを関連づけておくことができ、Web上のサービスと実店舗でのサービスを密接にリンクさせることができ、サービスの精細化を図ることができる。
【0128】
また、本実施形態では、適合率表示部174aは、適合率出力部173から出力された比較結果信号に基づき、適合率に応じたグラフィックの表示を行っているので、イベントの1つとして適合率の表示を行うことによって、操作者は適合率を視認することができ、音源までの距離を視覚的に確認することができる。これにより、例えば、特定音響までの距離や方向を示す音源レーダーのような仕組みを構築することができ、雑音の多い環境であっても、ユーザーを音源の位置まで誘導することができ、この仕組みを利用したゲーム性の高い種々のサービスを提供することができる。
【0129】
[第2実施形態]
上述した実施形態では、音響信号検出プログラム、音源テンプレートD1及びイベント情報D2等をユーザー端末に保持させて、スタンドアローン形式で音響信号を検出する処理を実行するようにしたが、本発明はこれに限定されるものではなく、通信ネットワーク5上に配置されたサーバーにおいて、これらの処理を実行するようにしてもよい。
図12は、第2実施形態に係る音響信号検出システムの全体構成を示す概念図である。なお、第2実施形態において、上述した第1実施形態と同一の構成要素には同一の符号を付し、その機能等は特に言及しない限り同一であり、その説明は省略する。
【0130】
(音響信号検出システムの概要)
図11に示すように、本実施形態に係る音響信号検出システムは、通信ネットワーク5上に配置された、機能の異なるサーバー群6及び7と、無線基地局3と、無線基地局3を通じて無線通信が可能なユーザー端末1Aとを備えている。
【0131】
ユーザー端末1Aは、上述した第1実施形態と同様なCPUを備えた演算処理機能、及び無線通信機能を有した携帯可能な情報処理端末であり、基地局等の中継点と無線で通信し、通話やデータ通信等の通信サービスを移動しつつ受けることができる。また、ユーザー端末1Aは、アプリケーションソフトの実行機能等を備えるとともに、外部から音響信号を取得するマイクを備えており、このマイクによって外部の音響を音声信号や音声ファイルとして取得する。
【0132】
サーバー群6及び7は、処理機能が異なる一般的なサーバー装置である。本実施形態では、両テンプレートの比較を行う複数のテンプレート比較サーバー7(7a〜7n)と、ユーザー端末1Aとテンプレート比較サーバー7との間に位置し、負荷分散を行う複数の制御管理サーバー6(6a〜6n)とから構成される。また、制御管理サーバー6は、テンプレート比較サーバー7から取得した比較結果に応じて、ユーザー端末に対してイベントを発生させる機能も備えている。
【0133】
このような制御管理サーバー6(6a〜6n)及びテンプレート比較サーバー7(7a〜7n)は、提供するサービスの種類に応じて、テンプレート比較やイベント発生の処理を行うように複数のサーバー装置で構成されているものとする。
【0134】
そして、本実施形態では、ユーザー端末1Aが外部から評価音響信号を取得し、その評価音響信号のデータ形式そのまま、通信ネットワーク5上に送信することで、制御管理サーバー6及びテンプレート比較サーバー7によって、特定音響信号の検出処理が実行され、その比較結果がユーザー端末1Aに返信されてイベントが発生されるようになっている。
【0135】
(各装置の内部構造)
次いで、上述した音響信号検出システムを構成する各装置の内部構造について説明する。
図12は、第2実施形態に係るユーザー端末1Aの内部構成を示すブロック図であり、
図13は、第2実施形態に係る制御管理サーバー及びテンプレート比較サーバーの内部構成を示すブロック図である。
【0136】
(1)ユーザー端末
先ず、ユーザー端末1Aの内部構造について説明する。
図12に示すように、ユーザー端末1Aには、無線インターフェース11と、アプリケーション実行部18と、出力インターフェース13と、入力インターフェース12と、メモリ15と、音響取得部16とを備えている。
【0137】
音響取得部16は、上記同様、マイク12aから入力された音響を取得し、当該音響を評価音響信号、若しくは特定音響信号として出力するモジュールである。本実施形態においては、これらの信号は、音響送信部181に送信される。アプリケーション実行部18は、一般のOSやブラウザソフト、電子メール、画像表示ソフトなどのアプリケーションを実行するモジュールであり、本実施形態においてもCPU等により実現される。このアプリケーション実行部18で管理サーバー2からダウンロードした音響信号検出プログラムを実行することにより、本実施形態では、音響送信部181と、イベント実行部182とが構成される。
【0138】
音響送信部181は、音響取得部16から取得した評価音響信号、若しくは特定音響信号をIPパケット化するなどして、ユーザー端末1Aを識別するユーザー識別子とともに、制御管理サーバー6に送信するモジュールである。なお、配信先となる制御管理サーバー6(6a〜6n)は、ユーザー登録をしたサーバー装置であるものとする。
【0139】
イベント実行部182は、制御管理サーバー6から送られた、比較結果に基づいて選出されたイベント情報D2を取得して、当該イベント情報D2に応じて所定のイベントを実行するモジュールである。本実施形態においても実行されるイベントとは、音声やテキスト表示によるメッセージ出力や、画像・動画の再生、アプリケーションの起動など種々の情報処理サービスが挙げられ、取得するイベント情報D2とは、クーポン情報、チケット情報、プレゼント情報、乗り換え案内情報、目的地である旨を通知する通知情報などである。そして、イベント実行部182は、このイベント情報D2を用いて、表示部13aにイベントに関する表示情報を表示させる。
【0140】
(2)制御管理サーバー及びテンプレート比較サーバーの内部構成
次いで、制御管理サーバー6及びテンプレート比較サーバー7の内部構成について説明する。本実施形態において、制御管理サーバー6は、ユーザー管理機能と、音源テンプレート作成機能、比較先テンプレート作成機能と、イベント発生管理機能とを有しており、ユーザー登録部62と、評価対象変換部63と、イベント発生管理部64と、イベント生成部65と、音源テンプレート生成部68と、配信管理部69と、通信部61と、ユーザー情報データベース67と、イベントデータベース66とを備えている。
【0141】
ユーザー登録部62は、本システムを受けるためのユーザー登録を受け付けるモジュールである。このユーザー登録部62は、ユーザーの各種情報を取得すると、ユーザーを特定するための識別子を付与してユーザー情報データベース67に記録する。ユーザー情報データベース67には、ユーザーを識別する識別子に、ユーザー端末の電話番号、及びメールアドレスの他、ユーザーの年齢、性別、住所、及び趣向情報などの属性情報や、音響検出を実行した履歴情報が関連づけて記録されている。
【0142】
評価対象変換部63は、ユーザー端末1Aから送信された評価音響信号について、所定の周波数帯域における音響信号の有無を音階平均率に基づいて抽出し、音響信号の分布及びその時間的変化が、音階ごとに二値化されて時系列で記録された比較先テンプレートD3を生成するモジュールである。この具体的処理については、第1実施形態と同様であるため省略する。
【0143】
イベント生成部65は、ユーザーに提供すべきイベント情報D2を生成するモジュールであり、生成したイベント情報D2を識別するイベント識別子に関連づけてイベントデータベース66に蓄積する。
【0144】
音源テンプレート生成部68は、例えば、クーポンを発行するサービス提供側から取得した特定音響信号に基づいて音源テンプレートD1を生成するモジュールであり、生成した音源テンプレートD1にはテンプレート識別子が付加される。なお、本実施形態においても、音源テンプレート生成部68は、音源テンプレートD1を生成する際、各音階における信号強度を検出し、検出された音響信号が所定のしきい値を上回るか否かに基づいて音響信号の有無を抽出するようにしてもよい。そして、そのしきい値は、発生させるべきイベントの種類に応じて異なる値に設定されている。
【0145】
配信管理部69は、各種のデータを通信ネットワーク上に配信する制御を管理するモジュールであり、音源テンプレート配信部69aを備えている。音源テンプレート配信部69aは、音源テンプレート生成部68が生成した音源テンプレートを、テンプレート比較部74を有するテンプレート比較サーバー7に対し、通信ネットワーク5を通じて配信するモジュールであり、本実施形態では、テンプレート識別子を付加した状態で送信する。
【0146】
また、配信管理部69は、音源テンプレート配信部69aが配信した音源テンプレートD1のテンプレート識別子と、発生させるべきイベントとのイベント識別子を関連づけてイベントデータベース66に記憶する。なお、本実施形態では、制御管理サーバー6において音源テンプレートD1を生成して保存する構成としたが、本発明は、これに限定するものではなく、テンプレート比較サーバー7において、音源テンプレートD1を生成して蓄積してもよい。
【0147】
イベントデータベース66は、ユーザーに対して発生させるイベント情報D2を蓄積する装置であり、イベントを識別するイベント識別子が付加されて記憶されるとともに、音源テンプレートD1を識別するテンプレート識別子と、発生させるべきイベントを識別するイベント識別子とを関連づけて記憶されている。
【0148】
イベント発生管理部64は、テンプレート比較サーバー7の適合率出力部75から出力された比較結果信号に基づき、当該比較結果信号に係る音源テンプレートD1のテンプレート識別子についてイベントデータベース66を照合し、発生させるべきイベントを選出し、選出されたイベントに関する情報をユーザー端末1Aに通知するモジュールである。
【0149】
このイベント発生管理部64には、テンプレート比較サーバー7の適合率出力部から出力された比較結果信号に基づき、適合率に応じたグラフィックの表示を行うための制御信号、を通信ネットワーク5を通じてユーザー端末1Aに送出する適合率表示制御部64aを有している。通信部61は、通信ネットワーク5を通じて、ユーザー端末1A及びテンプレート比較サーバー7との間でデータの送受信を行う通信インターフェースである。
【0150】
次いで、テンプレート比較サーバー7について説明する。本実施形態において、テンプレート比較サーバー7は、テンプレート比較機能と、適合率出力機能とを有しており、音源テンプレート取得部72と、テンプレート比較部74と、適合率出力部75と、音源テンプレートデータベース73と、通信部71とを備えている。
【0151】
音源テンプレート取得部72は、制御管理サーバー6において生成された音源テンプレートを取得するモジュールであり、関連づけられたテンプレート識別子に基づいて音源テンプレートデータベース73に記憶する。通信部71は、通信ネットワーク5を通じて、制御管理サーバー6との間でデータの送受信を行う通信インターフェースである。
【0152】
音源テンプレートデータベース73は、特定音響信号について生成された音源テンプレートD1を蓄積する蓄積装置であり、音源テンプレートD1に音源テンプレートD1を識別するテンプレート識別子が関連づけられて記憶されている。
【0153】
テンプレート比較部74は、比較先テンプレートD3と音源テンプレートD1とを比較して、二値化された音響信号の分布の適合率を算出するモジュールである。適合率出力部75は、テンプレート比較部74により算出された適合率に応じた比較結果信号を、通信ネットワーク5を介して制御管理サーバー6に送出するモジュールである。なお、テンプレート比較部74及び適合率出力部75の具体的な処理は、第1実施形態と同様であるため、その説明は省略する。また、第1実施形態で説明したリアルタイム処理やダブルバッファリング処理などを含む各処理についても、本実施形態では実行されているものとし、その説明は省略する。
【0154】
(音響信号検出方法)
次いで、第2実施形態に係る音響信号検出方法について説明する。
図15は、音響信号検出システムの動作の概要を示すフローチャート図である。なお、本実施形態においても、制御管理サーバー6においてユーザー登録が完了されているものとする。
【0155】
本実施形態に係る音響信号検出方法では、先ず、イベント生成部65において、ユーザーに対して発生させるイベントに関するイベント情報D2を生成する(S201)。このイベント情報D2は、イベントを識別するイベント識別子に関連づけてイベントデータベース66に蓄積する。
【0156】
次いで、音源テンプレート生成部68において、特定音響信号を取得し(S202)、特定音響信号に基づいて、音源テンプレートD1を生成する音源テンプレート生成処理を行う(S203)。この際、音源テンプレートD1の生成処理では、特定音響信号について、音源テンプレートD1を生成する際、各音階における信号強度を検出し、検出された音響信号が所定のしきい値を上回るか否かに基づいて音響信号の有無を抽出するようにしてもよい。なお、しきい値は、発生させるべきイベントの種類に応じて異なる値に設定されている。その後、生成された音源テンプレートD1は、音源テンプレートD1を識別するテンプレート識別子が付加され、音源テンプレート配信部69aによって、テンプレート比較サーバー7に対して配信される(S204)。
【0157】
この際、配信管理部69では、音源テンプレート配信部69aが配信した音源テンプレートD1のテンプレート識別子と、発生させるべきイベントとのイベント識別子を関連づけてイベントデータベース66に記憶するデータベース制御処理を行う(S205)。テンプレート比較サーバー7では、音源テンプレート取得部72が、送信された音源テンプレートD1を取得し(S206)、関連づけられたテンプレート識別子に基づいて音源テンプレートデータベース73に記憶する(S207)。
【0158】
その後、音再生手段4のスピーカー42から所定の音が出力されている状態で(S208)、音響信号検出プログラムが起動されると、マイク12aから外部の音響が読み取られる。ユーザー端末1Aの音響取得部16は、この音響を評価音響信号として取得し、取得された評価音響信号は、音響送信部181を介して制御管理サーバー6へ送信される(S209)。制御管理サーバー6の評価対象変換部63では、この評価音響信号を取得し(S210)、比較先テンプレートD3を生成する評価対象変換する処理を実行する(S211)。なお、ユーザー端末1から配信された評価音響信号にはユーザー識別子が付加され、いずれのユーザー端末1Aから送られてきたかが判別可能となっており、このユーザー識別子に基づいて相互通信されるようになっている。
【0159】
比較先テンプレートD3が生成されると、その比較先テンプレートD3は通信ネットワーク5を介してテンプレート比較サーバー7へ配信される(S212)。テンプレート比較サーバー7が比較先テンプレートD3を取得すると(S213)、そのデータは、テンプレート比較部74に入力される。テンプレート比較部74では、比較先テンプレートD3と音源テンプレートD1とを比較して、二値化された音響信号の分布の適合率を算出するテンプレート比較処理を実行する(S214)。
【0160】
テンプレート比較処理により算出された適合率は適合率出力部75に入力され、適合率出力部75では、その適合率に応じた比較結果信号を出力する適合率出力処理を実行する(S215)。適合率出力処理によって出力された比較結果信号は、通信ネットワーク5を介して、制御管理サーバー6へ送信される。
【0161】
制御管理サーバー6では、その結果信号がイベント発生管理部64に入力され、イベント発生管理部64では、出力された比較結果信号に基づいて、イベント発生の有無を判断する(S216)。なお、このイベント発生の有無は、例えば、比較結果信号が両テンプレートが完全一致しているか、若しくは所定のしきい値以上であるか否かなど、発生させるべきイベントに応じて選択される。イベントを発生しないと判断した場合には、(S216における“N”)、イベントを発生させることなく、ステップS208〜S215までの処理を繰り返す。
【0162】
一方、イベントを発生すると判断した場合には、(S216における“Y”)、当該比較結果信号に係る音源テンプレートD1のテンプレート識別子についてイベントデータベース66を照合し、発生させるべきイベントを選出し、選出されたイベントを発生させるイベント発生管理処理を実行する(S217)。具体的には、ユーザー識別子に基づいて、ユーザー端末1Aに対し、イベント情報D2を配信する。この際、適合率表示制御部64aでは、適合率出力処理により出力された比較結果信号に基づき、適合率に応じたグラフィックの表示制御を行う表示制御信号も送信する。
【0163】
次いで、ユーザー端末1Aのイベント実行部182は、イベント情報D2及び、表示制御信号に基づいて、表示部13a上に比較結果に応じたグラフィックを表示させる(S218)。その後、イベント発生、若しくはユーザー操作によって特定音響検出の処理が選択されるまで(S219における“N”)、ステップS208〜ステップS220までの処理を繰り返し、特定音響検出の処理終了が選択された場合には(S219における“Y”)、終了する。
【0164】
(音響信号検出プログラム)
上述した第2実施形態係る音響信号検出システム、音響信号検出装置、音響信号検出サーバー、及びオブジェクト制御方法についても、所定の言語で記述されたプログラムをコンピューター上で実行することにより実現することができる。すなわち、このプログラムを、ユーザー端末やWebサーバー等のコンピューターやICチップにインストールし、CPU上で実行することにより、上述した各機能を有するシステムを容易に構築することができる。このプログラムは、例えば、通信回線を通じて配布することが可能であり、またスタンドアローンの計算機上で動作するパッケージアプリケーションとして譲渡することができる。
【0165】
そして、このようなプログラムは、パーソナルコンピューターで読み取り可能な記録媒体に記録することができ、汎用のコンピューターや専用コンピューターを用いて、上述した音響信号検出システム、音響信号検出装置、音響信号検出サーバー、及びオブジェクト制御方法を実施することが可能となるとともに、プログラムの保存、運搬及びインストールを容易に行うことができる。
【0166】
(作用・効果)
このような本実施形態においても、特定音響信号を、音階平均律に基づいてその周波数帯域における信号の有無を抽出して生成したテンプレート同士の比較により行うため、複雑な演算処理を要することなく音源とのマッチング処理を行うことができ、データをダウンサイズすることによる高速演算によってリアルタイム処理が可能となる。また、音響信号の有無を、二値化されたテンプレートによって検出することから、雑音下での検出が可能となる。これらの結果、例えば、店舗内で放送されているテーマソングなどを検出した場合にクーポンやポイントを配布するなどのように、特定の音響検出をトリガーとしたサービスを提供することができ、サービスの多様化、充実化を図ることができる。
【0167】
また、本実施形態では、特定音響の検出に用いられる音源テンプレートD1と任意のイベントとを関連づけておくことで、ユーザー端末1Aにおける特定音響の検出をトリガーとしたイベントを発生させることができる。また、いずれのユーザーが、どこでどのような音響を検出したかについての情報を収集することができ、リアルなユーザー動向を調査することができ、ビックデータの構築によるマーケティングの充実を図ることができる。特に、本実施形態では、通信ネットワーク5上に配置されたサーバー6,7において、評価音響信号を比較先テンプレートにしたり、両テンプレートを比較して、その適合率を算出したりしているので、ユーザーが所持するユーザー端末1Aに対する処理負担の軽減、及びメモリ容量の有効利用を図ることができる。
【0168】
また、本実施形態によれば、音源テンプレート生成部68は、音源テンプレートD1を生成する際、各音階における信号強度を検出し、検出された音響信号が、イベントの種類に応じて異なる値に設定されたしきい値を上回るか否かに基づいて音響信号の有無を抽出しているので、しきい値の値を変えて音源テンプレートD1を作成することにより、同じ特定音響が検出される場合であっても、音源テンプレートD1の種類によって異なるイベントを発生させることができる。これにより、例えば、家族で同時に同じ店舗に入り、同じ特定音響を検出したとしても、大人と子供では異なるイベントを発生させるなど、年齢や性別などユーザーの特定に適したサービスを提供することができる。
【0169】
また、本実施形態によれば、音源テンプレート配信部69aが配信した音源テンプレートD1のテンプレート識別子と、発生させるべきイベントとを関連づけてイベントデータベース66に登録しているので、例えば、インターネット上のサーバーから、Webページや電子メール等を介して音源テンプレートD1を配信し、その音源テンプレートD1ごとにイベントを関連づけておくことができ、Web上のサービスと実店舗でのサービスを密接にリンクさせることができ、サービスの精細化を図ることができる。
【0170】
また、本実施形態では、適合率表示制御部64aは、適合率出力部75から出力された比較結果信号に基づき、適合率に応じたグラフィックの表示を行う制御を行っているので、イベントの1つとして適合率の表示を行うことによって、操作者は適合率を視認することができ、音源までの距離を視覚的に確認することができる。これにより、例えば、特定音響までの距離や方向を示す音源レーダーのような仕組みを構築することができ、雑音の多い環境であっても、ユーザーを音源の位置まで誘導することができ、この仕組みを利用したゲーム性の高い種々のサービスを提供することができる。
【0171】
[各種サービス]
次いで、上述したような実施形態に係る音響信号検出システム及び方法を応用した各サービスについて以下に説明する。なお、以下のサービスは、上述した第1実施形態、及び第2実施形態で実施可能である。
【0172】
(クーポン配信サービス)
先ず、上述した各実施形態に係る音響信号検出システム及び方法をクーポン配信サービスに適用した場合を例に説明する。このクーポン配信サービスは、スーパーマーケットや家電量販店など実店舗にユーザーが来店した際、店舗のスピーカーから出力された特定の音をユーザー端末1が認識すると、そのユーザー端末1、1Aの表示部13aの画面上に、クーポンやポイント情報を画面上に表示させて割引サービスを提供するものである。
【0173】
詳述すると、クーポン配信サービスにおいて「音源テンプレート」は、店舗同時のテーマソングや、タイムセール時に出力される効果音を用いるものとする。そして、この音源テンプレートD1に対して、発生させるべきイベントとしては、例えば、来店ポイント贈与であったり、割引サービスであったり、タイムセール情報であったりしてもよい。
【0174】
この際、例えば、ユーザーの属性に応じて、発生するイベントを変えることで、例えば、ショッピングモール内において放送されている同一のテーマソングを流した場合であっても、女性には化粧品や食料品などに関するクーポンをイベントとして発生させ、子供には玩具などに関するクーポンをイベントとして発生させ、男性には、ゴルフや家電などに関するクーポンをイベントとして発生させることができる。この場合、同一のパート部分を音源テンプレートD1とし、ユーザー属性に応じて、関連づけられるイベント情報を変更してもよく、また、異なるパート部分を音源テンプレートD11〜D13として生成し、それぞれの音源テンプレートに対して、異なるイベント情報を関連づけしてもよい。
【0175】
(回線品質判定サービス)
次いで、上述したような各実施形態の音響信号検出システム及び方法を回線品質判定サービスに適用した場合を例に説明する。この回線品質判定サービスは、電話の開通工事終了時において、その周囲に特定の音を出力し、ユーザー端末1,A1にエコー(反響)が生じているか否かによって回線品質を判定するものである。この場合、ユーザー端末1、1Aは、開通工事業者が所持するものである。また、この回線品質判定を行う場合、その評価式は、以下のような評価式を用いて、10段階評価を行うものとする。
【0176】
評価式=Normalized(Sum(M_n[i]×Amp[i])) range: [0,10]
ここで、「M_n」とは、マッチング率であり、「Amp」とは、その時の音量(Amplitude)のAverage(テンプレート幅)を示すものである。なお、上式において、正規化(Normalized)は、必要に応じて適宜行うものであってよい。
【0177】
さらに、このサービスにおいて、表示部13aには、
図11(a)及び(b)に示すように、エコーの具合に応じてキャラクターの表情を変化させて開通工事業者が判定結果を認識し易くする。具体的に、
図11(a)に示す画像はエコーが生じていない場合に表示され、
図11(b)に示す画像は、エコーが生じている場合に表示される。なお、本実施形態では、この評価を10段階で表すもととするが、その数は限定されるものではない。
【0178】
なお、この回線品質判定を生の音声で行う場合には、リアルタイムに音源テンプレートを作成し、上述した評価式と同じ式を用いて評価を行う。このとき、音源としての生の音声の長さに対するバッファリングする音声の長さを適宜変更することで対応することができる。
【0179】
このような実施形態によれば、本発明を回線品質サービスに用いることで、電話の開通工事の際にエコーが生じるか否かを簡易に調査することができる。
【0180】
(道案内サービス)
次いで、上述した各実施形態に係る音響信号検出システム及び方法を道案内サービスに適用した場合を例に説明する。この道案内サービスは、例えば、駅のスピーカーから出力される特定の音に基づいて、目的のプラットホーム、改札、又はトイレなどの所定の目的地まで案内を行うものである。
【0181】
このサービスで利用される「音源テンプレート」としては、例えば、駅名を連呼する音声や、各駅で流している効果音(発車オルゴール等)、その他の各駅で独自に利用している効果音が含まれる。そして、案内するべき目的地としては、例えば、所定のプラットホームや改札口、トイレの場所が含まれる。なお、このサービスでは、音響の種類及び信号強度と、目的地との関係を地図情報として蓄積し、イベント情報と関連づけておくものとする。
【0182】
この地図情報は、ユーザー端末1に蓄積してもよく、管理サーバー2、若しくは制御管理サーバー6に蓄積してもよい。管理サーバー2又は制御管理サーバー6に地図情報を保持させる場合には、アップデートが容易となる。なお、ユーザー端末1に保持させる場合には、最新のマップ情報は逐次ユーザー端末1に配信されるものとする。
【0183】
そして、このサービスに利用する場合には、上述した音レーダー機能を用い、適合率に応じて、次に行くべき場所が近いか遠いかを案内するようにする。これにより目的地へ誘導させ易くすることができる。このように本システム及び方法を道案内サービスに利用する場合には、例えば、新宿駅、渋谷駅、東京駅といった乗り換えが複雑な駅や、初めて訪れた大きな駅においても、その場所から出力される音に基づいて、適切に目的地に誘導させることができる。
【0184】
(音認証サービス)
次いで、上述したような各実施形態の音響信号検出システム及び方法を認証サービスに適用した場合を例に説明する。
【0185】
この認証サービスは、音源テンプレートD1をユーザーにチケットとして配布して、その音源テンプレートD1を用いて認証に利用するものである。このサービスで利用される「音源テンプレート」としては、例えば、会社訪問時には会社のテーマソングとなり、スポーツ観戦時には、そのチームの応援ソングとなり、コンサート鑑賞の際には、そのアーティストの楽曲が音源テンプレートとなる。また、発生するイベントとは、チケットの発行となっている。
【0186】
そして、ここでは、入口等において特定音響信号を含む音楽を流すことで、音源テンプレートD1をダウンロードしたユーザー端末1にのみ、イベントが発生して、画面上にチケットを表示させることができるため、入場を許可することができる。
【0187】
さらに、このサービスをコンサートチケットとして実施する場合、異なるパート部分を音源テンプレートD11〜D13として生成し、それぞれの音源テンプレートD1に対して、異なる内容のイベント情報(チケット内容)を関連づけしてもよい。
【0188】
これにより、例えば、ユーザーごとに異なるイベントを発生できるため、例えば、コンサート会場の座席情報をユーザーに配信させることができる。また、上記道案内サービスと同様に、音レーダー機能及び会場内の地図情報を用いることで、座席や、会場内の施設(トイレ、売店等)までの道のりを案内することもできる。
【0189】
また、所定のパートから生成した音源テンプレートD11〜D13に対してプレゼント当選のイベントを関連づけることで、コンサート中にアーティストがそのパート部分を演奏した際、所定のユーザーにプレゼント当選を通知させるサービスを実施できる。
【0190】
なお、アーティストの楽曲を音源テンプレートD1として配布した際、当該楽曲を着信メロディーとして利用可能とすることもできる。これにより、ユーザーにとっては、通常利用時に好きなアーティストの楽曲を着信メロディーとして取得することができるため有益となる。なお、この場合には、コンサートチケットとして使用後には、イベント識別子の関連づけを解除するものとする。また、音源テンプレートD1自体には、コピーガードなどの処理を行い、セキュリティを高める。
【0191】
(乗り過ごし防止サービス)
次いで、上述した各実施形態に係る音響信号検出システム及び方法を道乗り過ごし防止サービスに適用した場合を例に説明する。
【0192】
乗り過ごし防止サービスは、例えば、電車に乗っているユーザーに対して目的の駅に到着したことを通知するものである。このサービスで利用される「音源テンプレート」としては、駅名や、発車時の音、扉が開いた音、車内のアナウンス音が含まれる。なお、この際、各駅で異なる音を用いている場合には、例えば、一駅前の音を認識して次の駅が目的地であることを通知するようにしてもよい。また、駅名を認識する場合には、音声認識ではなく、あくまでイントネーション音楽としてその音から音源テンプレートD1を作成するものとする。
【0193】
この場合には、例えば、電車やバスに乗っている場合、目的地で出力される音を認識して、ユーザーに目的地に到着したことを通知できるので、乗り過ごしを防止することができる。
【0194】
[変更例]
なお、上述した各実施形態の説明は、本発明の一例である。このため、本発明は上述した実施形態に限定されることなく、本発明に係る技術的思想を逸脱しない範囲であれば、設計等に応じて種々の変更が可能である。以下に、本発明の変更例について説明する。
【0195】
(変更例1)
上述したテンプレートの比較では、二値化された音響信号が分布したテンプレートを比較して適合率を算出する手法を用いたが、本発明は、これに限定するものではなく、種々の比較方法を用いることができる。例えば、音源テンプレートD1において、最大音量からの差分データを利用してもよい。具体的には、先ず、音源テンプレートD1の各ブロックにおいて、最大音量からの差分データを算出して保存する。この際、その差分データを正規化して保存しておく。次に、テンプレートマッチングを行う。なお、テンプレートマッチングの際には、相互相関係数を計算するものとする。
【0196】
そいて、最もマッチング率の高い領域において、テンプレートと同じ周波数領域の音量(Amplitude)差分データを抜き出し、音量(Amplitude)差分データの正規化を行う。次いで、音源テンプレートと比較先テンプレートとを比較する。この際、差分データが大きく異なる部分(しきい値)は、ノイズとして処理をする。テンプレートマッチング率と音量(Amplitude)差分マッチング率とを加算して、しきい値と比較することで比較結果を判断する。
【0197】
また、上述した実施形態に対してテンプレートのパラメータを自動で調整する機能を持たせてもよい。すなわち、この自動調節機能を有することで、信号量(signal)と雑音量(noise)の比であるSN比が異なる環境下で、最適なパラメータを自動的に動的に変更することができるので、例えば、外の環境と家の中の環境の異なる雑音レベルに対して、最適なパラメータに適応することが可能である。また、リアルタイムに動的に最適なパラメータ調整を行うことができる。
【0198】
以下に、このパラメータ自動調整について説明する。ここでは、機能学習を用いた場合と、動的パラメータを用いた場合について説明する。
【0199】
・機械学習を用いたパラメータ調整
先ず、 テンプレートを作成後、学習用データを準備する。学習用データは、テンプレート音源と雑音とが混合したものと、テンプレート音源が入っていない、任意の音源を用意する。ここで音が混合したデータは、雑音レベルが異なる複数のデータを用意するものとする。
【0200】
そして、先ず、教師あり機械学習機能を用いて、窓幅(blockサイズ)、テンプレートの音量(Amplitude)個数、比較される音源の音量(Amplitude)数を学習する。この際、雑音レベルが高いものと低いものに対して、学習が収束しない場合は、個別に学習結果を保持する。また、全ての学習データに対して、機械学習が収束しない場合は、学習用データをSN比で分類し、分類ごとに学習を行う。
【0201】
このように、分類ごとに学習したデータを用いて、全ての学習データに対して、マッチング率を保持する。このデータは、動的パラメータ調整の際に用いてもよい。全ての教師信号に対して、学習が収束した場合は、学習結果を学習した音源テンプレート全てに適用する。そして、生成された学習データは、ユーザー端末、又はサーバーのいずれかに保持される。
【0202】
また、保持されるデータは、音源テンプレート、SN比、平均音量(Amplitude)、ブロックサイズ、比較に使うテンプレートの音量(Amplitude)の個数、比較される音源の音量(Amplitude)の個数である。
【0203】
このように学習機能を用いる場合には、1つのテンプレートに対して、複数の属性情報を持つことがある。また、適用する機械学習は、人工ニューラルネットワーク、遺伝的アルゴリズム、教科学習等教師あり学習など種々の機能を用いることができる。
【0204】
次いで、動的パラメータの適用について説明する。動的パラメータを適用する場合には、先ず、アプリケーションを起動した後、マイクから入ってくる音の強さを、ある一定時間(t_amp)の平均値で持つようにする(ステップ1)。そして、テンプレートの属性情報である、音量(Amplitude)の平均値からパラメータの候補を抽出して(ステップ2)、候補になった全てのパラメータに対して、マッチング率を計算する。そして、適合率としきい値とを比較する(ステップ3)。
【0205】
ここで、しきい値を超えて適合したと判定された場合(ステップ3におけるYes)、候補になっていないパラメータを用いて適合率を計算する(ステップ4)。この候補になっていないパラメータは、全てを用いてもよいし、1つでもよいし、ランダムに抽出してもよい(ステップ5)。
【0206】
候補になっていないパラメータを用いた適合率が、保持されている適合率とかけ離れていない場合は適合したと判定する(ステップ6)。反対に、候補になっていないパラメータを用いた適合率が、かけ離れている場合は、適合しなかったと判定する(ステップ7)。
【0207】
一方、しきい値を超えずに、適合しなかったと判定した場合は(ステップ3におけるNo)、パラメータの候補を抽出しなおす(ステップ8)。なお、パラメータの候補は、SN比をもとにしてもいいし、全てのパラメータに対して行ってもよい。このパラメータの候補の抽出では、上記ステップ4で適合したと判定された音源を保持しておき、学習済みパラメータの中で、最も近い振る舞いを行うものを選定する(ステップ9)。
【0208】
そして、選定されたパラメータをもとに、マッチング率を計算して(ステップ10)、上記ステップ7のように適合しないと判断されるまで処理を繰り返す。その後、ステップ7のように適合しないと判断された場合には、ステップ8の処理を行う。
【0209】
(変更例2)
上述した各実施形態では、特定音響信号から生成された音源テンプレートD1をユーザー端末若しくはサーバーに蓄積しておき、音再生手段4から出力された評価音響信号(比較先テンプレートD3)を読み取って比較する構成とした。しかしながら、本発明は、これに限定するものではなく、例えば、音源テンプレートからなる音データをユーザー端末1、1Aのスピーカー等から出力し、外部の装置によって読み取らせて比較する構成としてもよい。すなわち、本変更例では、ユーザー端末1、1Aが音再生手段4として機能し、外部の装置がユーザー端末1、1Aとして機能することとなる。
【0210】
この場合、外部の装置によって保持され、比較先となるテンプレートについても、特定音響信号から生成されたテンプレートとなる。また、イベント情報は、サーバー側に蓄積しておき、当該テンプレートの識別子に関連づけられることとなる。
【0211】
そして、ユーザー端末1のメモリには、出力すべき音源テンプレートをサーバーから取得して保持しておき、外部の装置に対して読み取り可能なように出力させることで、外部装置で両テンプレートが一致するか否かを判断し、一致する場合には、テンプレート識別子に関連づけられたイベントを発生させることができる。
【0212】
このような本変更例2に係る構成を用いることで、コンサートチケットの認証サービスを実行することができる。すなわち、この認証サービスでは、ユーザー端末1、1Aにチケットとして特定音響信号から生成したテンプレートを配布する。一方、会場の入場口には、音響信号を読み取り可能なマイクを備えた認証装置を設置する。この認証装置には、内部メモリに比較先となるテンプレートを記憶させてもよく、また、通信処理可能であれば、通信ネットワーク5上に配置されたサーバーに比較先となるテンプレートを記憶させてもよい。
【0213】
そして、入場口に設置された認証装置にユーザー端末1を近づかせた状態で、スピーカーからテンプレートに基づいた音響を出力させることで、認証側に記憶されたテンプレートと比較して完全一致か否かを判断することで認証処理を行う。
【0214】
このような認証サービスを用いることで、この際、音源テンプレートを生成する場合に、周波数がカットされているので、本来の音とは異なる音になっているため、単純に音を切り出して認証情報としてもセキュリティを高めることができる。また、バーコードやQRコード(登録商標)のような静的データではなく、動的データであるため、真意が難しく、セキュリティレベルが高くなる。
【0215】
なお、本変更例では、ユーザー端末1、1Aのスピーカーからテンプレートに基づいた音響を出力したが、例えば、
図10(a)及び(b)に示すように、表示部13aにテンプレートに基づいた表示画面を表示させるとともに、認証装置にカメラなど撮像手段を設けて、画像によって認証処理を行ってもよい。この場合には、無音で処理が行えるため、外部に音を出力させることができない状況下においても、認証処理を実行することができる。
【0216】
(その他の変更例)
なお、第2実施形態では、複数のサーバー装置に音響信号検出に係る各機能を分散させて配置したが、本発明はこれに限定されるものではなく、サーバー装置を単体として、これに全ての機能を備えさせてもよく、各モジュールの機能に特化したより多くのサーバー装置を分散配置させて、各装置を通信によって協動させるようにしてもよい。