(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0015】
1.実施形態
1−1.構成
図1は、コンテンツ提供システム9の全体構成を示す図である。コンテンツ提供システム9は、例えばショッピングモールにある複数の小売店でそれぞれ流されているBGM(Background Music)を利用して、各小売店に対応したコンテンツを顧客に提供するシステムである。
コンテンツ提供システム9は、通信端末1と、コンテンツサーバ2と、ネットワーク3と、音響装置4とを有する。音響装置4は、各小売店に設置されてBGMを放音するとともに、このBGM(基礎音)に音響透かしを重畳する装置である。通信端末1は、例えば携帯電話機であり、音響装置4によって放音されるBGMの音を内蔵マイクによって取得して、その音に応じたコンテンツを、無線接続しているネットワーク3を介してコンテンツサーバ2に要求する。ネットワーク3は、通信端末1とコンテンツサーバ2とが無線により通信する通信路である。コンテンツサーバ2は、複数のコンテンツをグループごとに記憶したコンピュータであり、通信端末1の要求に応じてコンテンツを提供する。
【0016】
図2は、音響装置4の構成を示す図である。記憶部42は、ハードディスクドライブなどの記憶手段であり、後述するCPUに読み込まれるプログラムを記憶する。また、記憶部42は、上述したBGMなどの基礎音を示す基礎音情報421と、この基礎音情報421に重畳させる音響透かしであるグループ情報422とを記憶する。この実施形態における音響透かしは、グループ分けされたコンテンツのグループを特定する情報となっている。
【0017】
次に、制御部41は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)を備えており、CPUがROMに記憶されているブートローダや記憶部42に記憶されているプログラムを読み出して実行することにより音響装置4の各部を制御する。また、制御部41のCPUは、記憶部42から基礎音情報421を読み出してBGMの音響信号に変換するとともに、グループ情報422を読み出して人間に聴こえ難い周波数帯域の音響信号に変換し、BGMの音響信号に重畳する。
【0018】
放音部43は、制御部41から出力されるデジタルの音響信号をアナログ信号に変換するD/A変換器と、アンプ、スピーカなどを備えた放音装置である。
【0019】
図3は、通信端末1の構成を示す図である。制御部11は、CPU、ROM、RAMを備えており、CPUがROMに記憶されているブートローダや記憶部12に記憶されているプログラムを読み出して実行することにより通信端末1の各部を制御する。
【0020】
記憶部12はEEPROM(Electrically Erasable Programmable Read Only Memory)などの記憶手段であり、CPUに読み込まれるプログラムを記憶する。また、記憶部12は、種類表121を記憶する。
【0021】
図4は、種類表121の一例を示す図である。種類表121は、種類情報とコマンド情報とを関連付けるものである。種類情報とは、コンテンツの種類を示した情報であり、その種類のコンテンツを特定するために用いられる。例えば、「地図」という文字列は地図の情報を表すコンテンツを特定する情報である。「地図」のコンテンツには、様々な場所の地図情報があり、例えば、様々なランドマークの緯度・経度およびそのランドマークの付帯情報などがある。
また、「クーポン」という文字列は、商品取引のときに金銭に替えて利用される代替貨幣の情報を特定する情報である。「クーポン」のコンテンツには、例えば、不正を防止できるような予測が困難な多数桁(例えば10桁以上)の文字列などがある。
また、「広告」という文字列は、商品の販売促進などを目的とした広告の情報を特定する情報である。「広告」のコンテンツには、その商品の外観や値段などを示した画像などがある。
また、「レストラン予約」という文字列は、レストランの予約を受け付ける入力フォームなどを備えたWEBページのURL(Uniform Resource Locator)などである。
【0022】
コマンド情報とは、種類情報を表す言葉の発音を示した情報であり、例えば、「地図」であれば「ちず」という発音を示した情報である。種類情報を表す言葉の発音は一つの種類情報に対して複数あってもよく、その複数の発音のそれぞれが一つの種類情報に対応付けられていればよい。つまり、種類表121において、コマンド情報と種類情報とは1対1または複数対1に関連付けられているので、一つのコマンド情報が定まるとこれに対応する一つの種類情報が定まる。
【0023】
図3に示す操作部13は指示を入力するための操作ボタンなどを備えており、ユーザによる操作を受け付けてその操作内容に応じた信号を制御部11に供給する。表示部14は、制御部11からの指示に応じて、通信端末1に関する情報やコンテンツサーバ2から取得したコンテンツに基づく画像等を表示する。通信部15は、コンテンツサーバ2と通信するための無線インターフェースである。
【0024】
音響信号取得部16は、音を取得する内蔵マイクや、内蔵マイクにより取得された音を音響信号に変換するA/D変換器などを有しており、周囲の音に応じた音響信号を生成する。
【0025】
図5は、コンテンツサーバ2の構成を示す図である。制御部21は、CPU、ROM、RAMを備えており、CPUがROMに記憶されているブートローダや記憶部22に記憶されているプログラムを読み出して実行することによりコンテンツサーバ2の各部を制御する。
【0026】
通信部25は、ネットワーク3を介して通信端末1と通信するためのインターフェースである。記憶部22はハードディスクドライブなどの大容量の記憶手段であり、制御部21に読み込まれるプログラムを記憶する。また、記憶部22は、コンテンツデータベース(DB(Database))221を記憶する。
【0027】
図6は、コンテンツDB221の一例を示す図である。コンテンツDB221は、複数のコンテンツをそれぞれ種類情報に対応付けて一のグループ情報で表されるデータを構成し、更にこのグループ情報は、複数のグループ情報で構成されるデータを構成して、全体として複数のコンテンツ群を記憶するデータベースである。コンテンツDB221は、これら複数のコンテンツ群にそれぞれ固有のグループ情報を対応付けて記憶する。したがってグループ情報によってこれに対応するコンテンツ群が特定され、種類情報によってそのコンテンツ群に含まれる一つのコンテンツが特定される。この実施形態におけるグループ情報は、本発明の第1情報の一例である。また、第2情報(種類情報)が複数個集まって、上位の階層である一つの第1情報(グループ情報)を構成する。なお、一つの種類情報に対応するコンテンツは一つであってもよいし、複数であってもよい。
【0028】
例えば、コンテンツDB221のグループ情報のフィールドには「G1」「G2」「G3」…という記号が記述されている。これらは各コンテンツ群に関連付けられて、そのコンテンツ群を特定する情報として機能する。各コンテンツ群は、種類情報とコンテンツとをそれぞれ対応付けている。そして、
図5に示すように、「G1」に関連付けられたコンテンツ群には、種類情報として「地図」「クーポン」「広告」「レストラン予約」…などがあり、それぞれにコンテンツが対応付けて記憶されている。この実施形態における種類情報は、本発明の第2情報の一例である。
【0029】
次に、通信端末1の機能的構成について説明する。
図7は、通信端末1の機能的構成を示す図である。
図7に示すように、制御部11は、抽出部111、情報要求部112、特定部113、情報取得部114、要求部115、および受信部116として機能する。音響信号取得部16は、内蔵マイクが取得した音から音響信号を生成する。この音響信号は、放音部43が報音した音のみならずユーザやその近傍に居る人が発した音声などの音も含んだ信号となる。抽出部111は、音響信号取得部16により取得された音から生成された音響信号(以下、取得音響信号という)からグループ情報422を抽出する。
【0030】
図8は、グループ情報422を含んだ取得音響信号の構造を模式的に表した図である。グループ情報422は、コンテンツサーバ2において記憶されているコンテンツ群を特定するための情報である。
図8に示すグラフにおいて、横軸は周波数fを示し、縦軸は音圧レベルを示す。
図8に示すように、グループ情報422を含んだ取得音響信号にあっては、周波数f
0よりも低い周波数帯域に、基礎音情報421に基づく音響信号(BGM)が含まれる。そして、周波数f
0よりも高い周波数帯域に、グループ情報422に基づく音響信号の周波数成分が含まれる。
【0031】
周波数f
0は、例えば18.5kHzのように、可聴域(およそ20Hz〜20kHz)の高域の限界付近である。この場合、グループ情報422を含んだ取得音響信号に応じた放音において、人間の耳にはグループ情報422に相当する音をほとんど聴き取ることができないとともに、グループ情報422が基礎音情報421に基づく音の音質を損なわせることがほぼないため、聴感上の悪影響を抑えることができる。
【0032】
なお、周波数f
0は、18.5kHzに限らない。例えば15kHzとして、可聴域内の比較的高周波の帯域にグループ情報422が重畳されてもよい。すなわち、グループ情報422がどの周波数帯域を用いて重畳されるかについて、本発明において特定の帯域に限定されることはない。また、取得音響信号において、基礎音情報421に基づく音響信号とグループ情報422に基づく音響信号のレベル比は、その取得音響信号からグループ情報422が抽出可能であれば、どのようなレベル比でもよい。
【0033】
抽出部111は、例えば遮断周波数をf
0とするHPF(High Pass Filter)を備える。抽出部111は、このHPFを用いたフィルタリング処理を施して、上記の取得音響信号からグループ情報422に相当する周波数成分を取り出し、この周波数成分に基づいてグループ情報422を抽出する。
【0034】
情報要求部112は、操作部13がユーザの操作を受け付けたタイミングに応じて決まる期間に取得された音による取得音響信号を特定部113に送る。上記のタイミングに応じて決まる期間とは、例えば、操作を受け付けたタイミングから10秒間などの決められた時間が経過するまでの期間や、何らかの操作が継続されている期間などである。また、制御部11のRAMに継続して取得音響信号をバッファリングしておき、操作を受け付けたタイミングの前の決められた時間に相当する期間にバッファリングされた取得音響信号を送っても良い。さらに、期間の開始時刻および終了時刻の両方を、それぞれユーザの操作を受け付けたタイミングによって決めてもよい。加えて、上記の各期間を適宜組み合わせるような制御をしてもよい。
【0035】
特定部113は、取得音響信号に対して音声認識を行い、音声によって話されている言葉をコマンド情報として認識する。この場合、取得音響信号に含まれる音声には、BGM中に含まれる歌や話声と、ユーザやその周囲に居る人が話した音声が含まれる。そして、特定部113は、記憶部12の種類表121を参照して、認識したコマンド情報に対応する種類情報を特定する。音声認識とは、音声を含んだ音響信号に対して自然言語処理を行い、その音声によって何が話されているかを判定するものである。音声認識は、例えば隠れマルコフモデルに基づく手法により行われる。
【0036】
情報取得部114は、特定部113が特定した種類情報を取得して要求部115に送信する。抽出部111により音響透かしであるグループ情報422が抽出され、特定部113により種類情報が特定されると、要求部115は、このグループ情報422と種類情報とを取得する。そして要求部115は、通信部15を用いてグループ情報422と種類情報との組をコンテンツサーバ2に送信する。受信部116は、要求部115による送信した組に対応する応答としてコンテンツサーバ2が送信したコンテンツを受信する。制御部11は、表示部14によりこのコンテンツに応じた画像を表示する。
【0037】
図9は、コンテンツサーバ2の機能的構成を示す図である。
図9に示すように、制御部21は、選択部211および送信部212として機能する。制御部21は、通信端末1から送信されたグループ情報422および種類情報の組を通信部25によって受信する。すなわち、通信部25は本発明における組受信手段の一例である。選択部211は、受信したこの組に基づいて、この組に対応したコンテンツを選択する。具体的には、選択部211は、記憶部22に記憶されたコンテンツDB221を参照し、上記のグループ情報422により特定されるコンテンツ群のうち、上記の種類情報により特定されるコンテンツを選択する。すなわち、選択部211は本発明における選択手段の一例である。
【0038】
送信部212は、選択部211により選択されたコンテンツを読み出して通信部25を用いて通信端末1に送信する。これにより通信端末1は、上記のグループ情報422および種類情報の組に対応するコンテンツを受信する。すなわち、送信部212および通信部25は本発明における送信手段の一例である。そして、通信端末1は、受信したコンテンツに基づいて、例えばそのコンテンツに応じた画像を表示部14によって表示する。
【0039】
1−2.動作
図10は、コンテンツ提供システム9の動作を示すシーケンス図である。音響装置4がグループ情報422を含んだBGMを放音すると(ステップS101)、このBGMの音が届く範囲にあった通信端末1の音響信号取得部16がこの音を取得して音響信号を生成する。つまり、通信端末1が収音する(ステップS102)。通信端末1は、取得した音響信号に対してHPFなどのフィルタリング処理を施し、重畳されていたグループ情報422を抽出する(ステップS103)。また、通信端末1は、取得した音響信号に対して音声認識に基づく自然言語処理によってコマンド情報を認識し、種類表121を参照して、このコマンド情報に対応付けられている種類情報を特定する(ステップS104)。通信端末1は、ネットワーク3を介して、上記のグループ情報422と種類情報の組をコンテンツサーバ2へ送信し、この組に対応するコンテンツを要求する(ステップS105)。
【0040】
コンテンツサーバ2は、通信端末1から送信されたグループ情報422および種類情報の組を受信すると、コンテンツDB221を参照し、グループ情報422によって特定されるコンテンツ群を検索する(ステップS106)。そして、コンテンツサーバ2は、上記のコンテンツ群を見つけた場合に、さらにそのコンテンツ群に含まれるコンテンツのうち、受信した上記の種類情報によって特定されるコンテンツを検索する(ステップS107)。このコンテンツが見つかると、コンテンツサーバ2は、これを通信端末1に送信する(ステップS108)。通信端末1は、コンテンツサーバ2から送信されたコンテンツを受信し(ステップS109)、このコンテンツに応じた画像を表示する(ステップS110)。
【0041】
以上の動作によりコンテンツ提供システム9は、音を取得した通信端末1に向けてその音に応じたコンテンツをコンテンツサーバ2が送信することにより、通信端末1の要求するコンテンツを提供する。そして、通信端末1が音響信号に含まれているグループ情報422を抽出し、さらに、その音響信号から認識される言葉(コマンド情報)に応じて種類情報を特定するので、グループ情報422と種類情報との組み合わせが多様になり、音響透かしのみを用いる場合に比べて、コンテンツサーバ2によって提供されるコンテンツの多様性が広がる。
【0042】
なお、上述した動作においては、グループ情報422とBGM中の特定の音声(コマンド情報;
図4参照)の組み合わせによってコンテンツが特定されるから、BGMの内容に対応したコンテンツ選択が自動的に行われる。また、ユーザやその近傍に居る人が特定の音声(コマンド情報;
図4参照)を発した場合は、これとグループ情報422との組み合わせによって定まるコンテンツが選択されるから、ユーザ等の意志を反映したコンテンツ選択も自動的に行われる。
【0043】
2.変形例
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例を組み合わせてもよい。
(変形例1)
上述した実施形態において、音響装置4が音を空気中に放音し、通信端末1がその音を取得した。しかし、音の伝搬媒体は空気に限らない。例えば、テーブルを構成する木材などの固体や水槽中に満たされている水などの液体を通じて音を伝搬させるものであってもよい。
【0044】
この場合、音響装置4は、外部に振動を与える振動部材により出力を行う。すなわち、振動部材は、気体、液体、固体のいずれかの媒体に音波を伝搬させることで音を出力する。一方、通信端末1の音響信号取得部16は、例えば振動ピックアップ(振動検出子)であり、部材を伝搬する音波を検出し、この音を表す音響信号を取得する。
【0045】
このような構成であっても、取得音響信号がグループ情報422を含んでいれば、通信端末1が取得音響信号からグループ情報422を抽出し、このグループ情報422を用いてコンテンツサーバ2にコンテンツを要求することができる。つまり、本発明の音は、気体、固体及び液体のどれを伝搬するものであってもよい。また、本発明の音は、可聴帯域だけではなく、可聴帯域外(具体的には、超音波や超低周波のみに成分を持つもの)で、人間が知覚できないものであってもよい。
【0046】
(変形例2)
上述した実施形態において、特定部113は、取得音響信号に対して音声認識処理を行ってこの取得音響信号に応じた種類情報を特定していたが、種類情報を特定するために行う処理は音声認識に限られない。すなわち、特定部113は、種類情報を特定する処理を行うのであれば、取得音響信号が示す音声によって表されている言語やテキストなど音韻性情報を認識しなくてもよい。特定部113は、例えば、話者認識やパターンマッチング処理などを行ってもよい。
【0047】
話者認識とは、音声の個人性情報を抽出して、誰の声であるか判定するものである。音声の個人性情報には、発声内容に依存しないフォルマントの平均、声紋等の音声特徴量などがある。特定部113が話者認識を行って取得音響信号が示す声が誰の声であるかを判定する場合、種類表121には誰の声であるかに対応付けて種類情報が記述されていればよい。なお、制御部11は、各ユーザが操作部13によって入力した指示の履歴に基づいて嗜好、傾向を判断し、この判断結果に応じて種類表121の上述した対応付けを書き換えてもよい。
【0048】
また、特定部113は、取得音響信号から音声の抑揚や調子、語調など音響的な特徴を測定して、この測定結果に基づいて音声を発した人物の喜怒哀楽等の感情を示す情報(以下、感情情報という)を推定し、この感情情報に応じた種類情報を特定してもよい。例えば、特定部113は、音声の音響的な特徴を測定し、その音声に対し、予め記憶部12に記憶されている感情の分類を、音響的な特徴に関連付けて定義したテーブルを基に、「沈んでいる」、「活発」、「暗い」、「明るい」、「急いでいる」、「のんびりしている」、「苛立っている」、「落ち着いている」等の感情の分類を行う。そして、例えば、感情の分類が「沈んでいる」の場合に、特定部113は、例えば映画館やレストランなど、ユーザの気分を高揚させる種類情報を特定する。感情の分類とそれに対応する種類情報との関連付けは予め記憶部12に記憶されていてもよいし、各ユーザによって編集されてもよい。
【0049】
また、特定部113は、例えば感情の分類からユーザが応答を早急に求めているか否かを判断し、その判断結果をコンテンツサーバ2へ送信して、この判断結果に応じて処理を変更させてもよい。例えば、ユーザが応答を早急に求めていると判断した場合、特定部113はその旨を示す信号をコンテンツサーバ2に送る。この信号を受け取ったコンテンツサーバ2の制御部21は、並列して実行している他の処理よりも、応答を早急に求められている処理を優先するように、例えば処理の待ち行列を書き換えればよい。また、コンテンツサーバ2の制御部21は、応答を早急に求められている旨の信号を受け取った場合、ユーザの現在位置に近い施設に関するコンテンツを選択してもよい。この場合、通信端末にGPS(Global Positioning System)などの測位システムを設けていればよい。そして、通信端末1によって測位された通信端末1自身の位置を示す情報をコンテンツサーバ2が取得して、通信端末1を所持しているユーザの現在位置を特定すればよい。
【0050】
なお、通信端末1は、ユーザの体温や脈拍などの身体に関する情報(以下、身体情報という)を検知するセンサを有していてもよい。そして、特定部113は、センサによって検知された身体情報と、上記の音響的な特徴とを組み合わせて、感情情報を推定してもよい。つまり、特定部113は、音韻性情報以外の情報を、個人性情報や感情情報として抽出して、コンテンツサーバ2が送信するコンテンツの特定に利用してもよい。
【0051】
パターンマッチング処理とは、予め標準として決められた音である標準音と取得音響信号が示す音(以下、取得音という)とのそれぞれのパターンを照合する処理である。このパターンとは、例えば楽音(メロディ、リズム、ハーモニー等の要素を含む)の起伏を表すものや、音の波形を表すものなどである。パターンマッチング処理は、例えば特定部113によって以下のように行われる。
【0052】
標準音と取得音とは、それぞれ時間軸に沿って配列された各単位時間における音圧レベルを表すデータ列として表される。特定部113は、一方のデータ列の時間軸を決められた範囲内で前後に移動させたり、伸縮したりして他方のデータ列の時間軸に対応付ける。双方の時間軸が対応付けられたら、例えば、一方の音圧レベルの最大値を他方の音圧レベルの最大値に合うように係数を乗じ、それぞれの単位時間における音圧レベルの差の絶対値を積算して相関係数として算出する。そして、特定部113は、算出した相関係数が閾値未満になった場合に、取得音と標準音とが一致したとして、標準音に予め対応付けられている種類情報を取得音響信号に応じた種類情報として特定する。この場合、種類表121には標準音に対応付けて種類情報が記述されていればよい。なお、前述の音圧レベルは、特定の周波数帯域の音圧レベルもよいし、全周波数帯域の音圧レベルでもよい。また、特定の周波数特性の重み付けをした全周波数帯域の音圧レベルでもよい。
【0053】
(変形例3)
特定部113の機能は、通信端末1以外の外部装置によって実現されてもよい。
図11は、特定部113の機能を外部装置によって実現する場合の制御部11の機能的構成を示す図である。この場合、情報要求部112が、通信部15を介して、外部のサーバ(
図11によって図示せず)に、取得音響信号に応じた種類情報を要求する。外部のサーバは、種類表121を備えている。そして、この外部のサーバは、この要求に応じて、音声認識、話者認識、パターンマッチング処理などを行って取得音響信号に応じた種類情報を特定し、これを通信端末1に送信する。情報取得部114は、外部のサーバから送信されたこの種類情報を取得すればよい。なお、特定部113の機能は、コンテンツサーバ2によって実現されてもよい。
【0054】
(変形例4)
上述した実施形態において、コンテンツ提供システム9の音響装置4は、小売店の店頭にコンテンツを提供するエリアを形成するために用いられていたが、他の場所に提供エリアを形成するために用いられてもよい。例えば、バスの停留所や駅などの車両の乗降場所に音響装置4が設けられて、特定のサービスを提供する場所に提供エリアを形成する目的に用いられてもよい。この場合、音響装置4は、その付近に来たユーザの通信端末1に対してのみ、車両の運行ダイヤや接近・遅延情報、車両の行き先に関する情報を配信することも可能である。これ以外にも、カフェやレストラン、駅構内、ホテルやオフィスのロビーなど、不特定多数の人物が出入りする場所にコンテンツ提供システム9を構成してもよく、本発明において特定の場所に限定されることはない。
【0055】
(変形例5)
上述した実施形態において、通信端末1が取得音響信号から抽出したグループ情報422が、直接、コンテンツ群を特定するために用いられていたが、グループ情報422は、外部のサーバなどに送信されて、コンテンツ群を特定するための他の情報に変換されてもよい。
図12は、変形例5に係るコンテンツ提供システム9aの全体構成を示す図である。コンテンツ提供システム9aは、ネットワーク3に接続された複数のコンテンツサーバ2を備え、さらにネットワーク3に接続された変換サーバ5を備える。変換サーバ5は、通信端末1から送信されるグループ情報422を受信し、このグループ情報422に対応するコンテンツサーバ2のアドレスを特定し、特定したアドレスを通信端末1に送信するサーバである。
【0056】
図13は、変形例5に係る変換サーバ5の構成を示す図である。制御部51は、CPU、ROM、RAMを備えており、CPUがROMに記憶されているブートローダや記憶部52に記憶されているプログラムを読み出して実行することにより変換サーバ5の各部を制御する。
【0057】
通信部55は、通信端末1とネットワーク3を介して通信するためのインターフェースである。記憶部52は、ハードディスクドライブなどの大容量の記憶手段であり、制御部51に読み込まれるプログラムを記憶する。また、記憶部52は、変換表521を記憶する。
【0058】
図14は、変形例5に係る変換表521の一例を示す図である。変換表521には、グループ情報とコンテンツサーバアドレスとが対応付けられている。コンテンツサーバアドレスは、コンテンツサーバ2のそれぞれに割り当てられた固有のIPアドレスなどであり、コンテンツサーバ2を特定して通信するための識別情報である。なお、変換表521には、一のグループ情報に対して一のコンテンツサーバアドレスが対応付けられていてもよいし、一のグループ情報に対して複数のコンテンツサーバアドレスが対応付けられていてもよい。
【0059】
通信端末1は、取得音響信号から音響透かしであるグループ情報422を抽出すると、ネットワーク3を介してこのグループ情報422を変換サーバ5に送信する。変換サーバ5は、通信端末1からグループ情報422を受信すると、変換表521を参照して、受信したこのグループ情報422に一致するグループ情報を検索する。一致するグループ情報が見つかった場合、変換表521においてそのグループ情報に対応付けられているコンテンツサーバアドレスを読み出して、通信部55を介してこれを通信端末1に送信する。例えば、
図14に示す例において、通信端末1が変換サーバ5に送信したグループ情報422が「G1」であれば、変換サーバ5はこれに対応付けられているコンテンツサーバアドレス「121.1.247.xxx」を通信端末1に送信する。
【0060】
通信端末1は、変換サーバ5からグループ情報422に対応する情報であるコンテンツサーバアドレスを受信(取得)する。そして、通信端末1は、受信したコンテンツサーバアドレスを用いて、これが示すコンテンツサーバ2に接続すると共に、後述するように種類情報をコンテンツサーバ2に送信する。
図15は、変形例5に係るコンテンツサーバ2の構成を示す図である。このコンテンツサーバ2が実施形態に係るコンテンツサーバ2と相違する点は、記憶部22がコンテンツDB221に替えてコンテンツ表221aを有する点である。コンテンツ表221aは、コンテンツサーバ2ごとに異なっていてもよい。
【0061】
図16は、変形例5に係るコンテンツ表221aの一例を示す図である。コンテンツ表221aは、種類情報とコンテンツとを対応付ける。コンテンツサーバ2の制御部21は、コンテンツ表221aを参照して通信端末1から送信された種類情報に対応付けられているコンテンツを特定すると、通信部25を介して、特定したこのコンテンツを通信端末1に送信する。以上により、通信端末1は、取得音響信号から抽出したグループ情報422に対応するコンテンツサーバアドレスを取得し、取得したコンテンツサーバアドレスによって特定されるコンテンツサーバ2から、種類情報に応じたコンテンツの提供を受ける。すなわち、通信端末1は、グループ情報(またはコンテンツサーバアドレス)および種類情報の組に対応するコンテンツを受信する。
【0062】
なお、この場合、通信端末1の制御部11によって実現される抽出部111は、要求部115にグループ情報422を送らなくてもよい。抽出部111は、例えば
図11に破線で示すように、情報要求部112にグループ情報422を送ってもよい。この場合、情報要求部112は、通信部15を介して、グループ情報422に対応するコンテンツサーバアドレスを変換サーバ5に要求するとともに、外部のサーバ(
図11によって図示せず)に、取得音響信号に応じた種類情報を要求する。そして、情報取得部114は、上記のコンテンツサーバアドレスと種類情報とを取得し、要求部115は、このコンテンツサーバアドレスと種類情報との組に応じたコンテンツをコンテンツサーバ2に要求すればよい。
【0063】
また、例えば複数の音響装置4がネットワーク3を介して通信可能に構成されている場合、変換サーバ5は、音響装置4とコンテンツサーバ2とを対応付けて記憶していてもよい。この場合、変換サーバ5は、各音響装置4に対応付けられたコンテンツサーバ2を特定する。そして、変換サーバ5は、コンテンツ表221aにおいて、このコンテンツサーバ2のコンテンツサーバアドレスと対応付けて記述されているグループ情報を音響装置4に送信すればよい。音響装置4は、変換サーバ5から受信したグループ情報を基礎音情報に重畳して得られたデータに基づく放音をすればよい。
【0064】
(変形例6)
上述した実施形態において、音響装置4は、記憶部42に記憶された基礎音情報421とグループ情報422とを読み出して、基礎音情報421のうち人間に聴こえ難い周波数帯域にグループ情報422を重畳して音響信号を出力する装置であったが、音響装置4は、外部装置と通信する通信部を備えていてもよく、基礎音情報421やグループ情報422を外部装置から通信により取得してもよい。
【0065】
また、上述した実施形態において、音響装置4は、基礎音情報421にグループ情報422を重畳して音響信号を出力していたが、音響装置4に接続された外部装置がこの重畳を行ってもよい。この外部装置は、例えばショッピングモールのグループ情報を取りまとめるサーバなどである。このサーバは、ショッピングモールの設立地域や建物、フロア単位でショッピングモール全体をグループに分類しており、それぞれのグループにグループ情報を関連付けて記憶している。そして、このサーバは、ショッピングモール内の各小売店舗がどのグループに属しているかを記憶しているため、各小売店舗に向けて、その小売店舗に対応するグループ情報422を基礎音情報421に重畳して送信する。このとき、このサーバは、コンテンツサーバ2とグループ情報に関する調整を行ってもよい。例えば、グループ情報を管理する管理者が、これらのグループ情報を追加したり削除したりする編集をした場合に、この編集内容がコンテンツサーバ2およびこのサーバの双方に反映されるようになっていればよい。
【0066】
また、音響装置4は、放送される信号を受信して基礎音情報421やグループ情報422を取得してもよい。
図17は、変形例6に係るコンテンツ提供システム9bの全体構成を示す図である。このコンテンツ提供システム9bは、
図12に示したコンテンツ提供システム9aの構成に加えて種類情報サーバ6と放送局7とを備える。種類情報サーバ6は、放送局7が放送する番組を構成する動画データおよび音声データなどの番組データを記憶するコンピュータである。また、種類情報サーバ6は、番組の音声を示す音声データを、例えば、その音声データによって示される音声が誰の声であるかに応じて区分けしており、この区分けごとに種類情報が関連付けられている。
【0067】
放送局7は、種類情報サーバ6から番組データを取得し、これにその番組固有の識別情報をグループ情報422として重畳させて、生成したデータに基づく番組信号を電波によって放送する。音響装置4は、この放送局7が放送する番組の番組信号を受信して、その番組に含まれる音響信号に応じた音を出力する。
【0068】
種類情報サーバ6が、ネットワーク3を介して通信端末1から取得音響信号の送信とともにその取得音響信号に応じた種類情報を要求されると、種類情報サーバ6は、送信された取得音響信号と記憶している番組データに含まれる音響信号とを照合するパターンマッチング処理を行う。そして、種類情報サーバ6は、取得音響信号に応じた音が番組内に出現する時間軸上の位置を特定し、その位置に応じた種類情報を通信端末1に送信する。
【0069】
これにより、例えば、放送局7は、或るドラマ番組の音を示す音響信号に、その番組固有の識別情報をグループ情報422として重畳して放送する。音響装置4は、放送を受信して、番組固有のグループ情報422が含まれた音響信号に基づく音を出力する。出力されたこの音を取得した通信端末1の音響信号取得部16は、この音から取得音響信号を取得する。通信端末1は、取得音響信号からグループ情報422を抽出して変換サーバ5に送信し、変換サーバ5からグループ情報422に応じたコンテンツサーバアドレスを受信する。また、通信端末1は、ユーザの操作を操作部13によって受け付けて、受け付けたタイミングに応じて決まる期間に音響信号取得部16が取得した取得音響信号を種類情報サーバ6へ送信する。
【0070】
種類情報サーバ6は、通信端末1から取得音響信号を受信して、その取得音響信号に応じた音が番組内に出現する時間軸上の位置を特定する。ここで例えば、このドラマ番組の音声データは、役者が話す台詞の開始から終了までを一つの区間として区切っており、各区間にはその台詞を話す役者の役者名が種類情報として対応付けられている。したがって、通信端末1から送信された取得音響信号に含まれる音声が或る役者の台詞であった場合、種類情報サーバ6は、その役者名を種類情報として通信端末1に送信する。通信端末1は、その役者名を、送信した取得音響信号に応じた種類情報として受信する。
【0071】
通信端末1は、変換サーバ5から受信したコンテンツサーバアドレスによってコンテンツサーバ2を特定する。そして、通信端末1は、特定したこのコンテンツサーバ2へ、種類情報サーバ6から取得した種類情報(役者名)を送信する。コンテンツサーバ2は、コンテンツ表221aから種類情報に対応付けられたコンテンツを見つけると、このコンテンツを通信端末1に送信する。具体的に、このコンテンツとは、例えば、その役者名の役者がドラマ中で着用していた衣服の広告などである。そして、通信端末1には、この衣服の広告が提供される。
【0072】
この構成により、テレビドラマを視聴している視聴者が、そのドラマに出演している役者が着用している衣服や小物などに興味を示した場合に、その視聴者は通信端末1を操作するだけでそれらに関する広告の情報を得ることができる。なお、番組はテレビ番組に限られず、ラジオ番組であってもよい。要するに番組は、音を表す音響信号を含む信号により放送されるものであればよい。また、グループ情報を重畳させる構成は放送局7に限られず、種類情報サーバ6が重畳してもよいし、種類情報サーバ6に記憶されている番組データに予めグループ情報が含められていてもよい。
【0073】
なお、この変形例において、通信端末1は、ユーザの操作を操作部13によって受け付けて、受け付けたタイミングに応じて決まる期間に音響信号取得部16が取得した取得音響信号を種類情報サーバ6へ送信していたが、受け付けたタイミングそのものを示すタイミング信号を種類情報サーバ6へ送信してもよい。具体的には、操作部13がユーザの操作を受け付けると、通信端末1の制御部11は内蔵されたタイマを参照して、現在の時刻を示す現在時刻情報を取得する。そして、通信端末1は、ネットワーク3を介してこの現在時刻情報に基づいたタイミング信号を種類情報サーバ6へ送信する。上記タイミング信号は、種類情報サーバ6が通信端末から取得音響信号を受信したタイミングを示すタイミング信号でも良い。要するに、タイミング信号は通信端末1の送信時刻を示す信号だけではなく、種類情報サーバ6の受信時刻を示す信号でもよい
【0074】
この場合、種類情報サーバ6は、番組に含まれる複数の内容を、その各内容が放送された時間(放送時間)に対応付けるスケジュール表を記憶するとともに、この各内容に応じた種類情報をそれぞれ記憶している。そして、種類情報サーバ6は、送信されたタイミング信号と記憶しているスケジュール表とを照合し、タイミング信号が示す時刻が、スケジュール表におけるどの放送時間に含まれるかを特定し、その放送時間に放送された番組の内容を特定して、その内容に応じた種類情報を通信端末1に送信すればよい。これにより、通信端末1は、操作部13がユーザの操作を受け付けたタイミングに対応する種類情報を取得する。
【0075】
(変形例7)
上述した実施形態において、コンテンツ群はグループ情報によって特定され、そのコンテンツ群に含まれる一つのコンテンツは種類情報によって特定されていたが、種類情報がコンテンツ群を特定し、グループ情報がコンテンツ群に含まれる一つのコンテンツを特定してもよい。要するに、グループ情報と種類情報との組によって、通信端末1に送信される一つのコンテンツが特定されればよい。即ち、第1情報(グループ情報)が複数個集まって、上位の階層である一の第2情報(種類情報)を構成してもよい。
【0076】
(変形例8)
上述した実施形態におけるグループ情報は、単なる番号(G1,G2、・・・)であったが、コンテンツサーバ2において記憶されているコンテンツ群を特定するための情報であればどのようなものであってもよい。例えば、グループ情報は、俳優名、放音時刻、音響装置4や放送局7の識別情報等、何らかの意味を持つ文字列の情報であってもよい。また、一つの種類情報に複数のコンテンツが対応する構成では、これら複数のコンテンツから一つのコンテンツを特定する情報でもよい。例えば、「地図」という種類情報に対しては、「住所(番地)」でもよいし、「商品広告」に対しては「商品名」でもよい。
【0077】
(変形例9)
本発明の通信端末1は、携帯電話機に限られず、PDA(Personal Digital Assistant)やモバイルコンピュータ、ゲーム機、デジタルサイネージなどの、無線通信を行うことのできる種々の通信端末でもよい。
【0078】
(変形例10)
上述した実施形態における通信端末1の制御部11や、コンテンツサーバ2の制御部21によって実行されるプログラムは、磁気記録媒体(磁気テープ、磁気ディスク(HDD、FD)など)、光記録媒体(光ディスク(CD、DVD)など)、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記録した状態で提供し得る。また、インターネットのようなネットワーク経由でダウンロードさせることも可能である。このように制御部11や制御部21によって実現される機能は、1又は複数のソフトウエアにより実現されてもよいし、1又は複数のハードウエアにより実現されてもよい。
【0079】
(変形例11)
上述した実施形態において、受信部116により受信されたコンテンツは、このコンテンツに応じた画像を表示部14に表示させるために用いられていたが、このコンテンツは他の処理に用いられてもよい。例えば、受信したコンテンツが音楽を示す音楽データである場合、通信端末1に備えられた放音部によってこの音楽データによって示される音楽を放音してもよい。