(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、多言語の人々が滞在する場所や施設等では音声を聴取する利用者が理解可能な言語が区々であるため、利用者に適した言語にて音声案内を提供することが必ずしも可能ではないという問題がある。
以上の事情を考慮して、本発明は、音声を聴取する利用者に適した言語にて案内音声を提供することを解決課題とする。
【課題を解決するための手段】
【0005】
以上の課題を解決するために、本発明の一態様にかかる管理装置は、第1の案内音声で用いられる第1の言語とは異なる第2の言語を指定する言語情報を設定する言語設定部と、第1の案内音声に対応する第2の案内音声を、言語情報にしたがって第2の言語で放音する情報処理装置に対して、言語設定部が設定した言語情報を通知する通知部とを具備する。以上の構成においては、情報処理装置に対して、第1の案内音声に対応する第2の案内音声を放音する際の第2の言語を管理装置から通知するので、情報処理装置から音声を聴取する利用者が理解可能な言語を言語情報として設定することにより利用者に応じた適切な言語による音声案内が可能となる。
【0006】
本発明の好適な態様において、情報処理装置が複数ある場合に、言語設定部は、言語情報を複数の情報処理装置の各々について設定し、通知部は、複数の情報処理装置の各々に対して、対応する言語情報を通知する。以上の構成においては、複数の情報処理装置について個別の言語情報が通知されるので、多言語の利用者が利用する場所や施設において利用者が理解可能な言語に翻訳された第2の音声案内が各情報処理装置から可能となる。
【0007】
以上の各態様にかかる管理装置は、当該管理装置の動作方法(管理方法)としても特定され得る。具体的には、本発明の好適な態様に係る管理方法は、第1の案内音声で用いられる第1の言語とは異なる第2の言語を指定する言語情報を設定し、第1の案内音声に対応する第2の案内音声を、言語情報にしたがって第2の言語で放音する情報処理装置に対して、設定した言語情報を通知することとを包含する。
【0008】
本発明の一態様にかかる情報処理装置は、第1の案内音声で用いられる第1の言語とは異なる第2の言語を指定する言語情報を管理装置から受信する言語情報受信部と、第1の案内音声に対応する第2の案内音声を、言語情報受信部で受信した言語情報で指定された第2の言語で放音するよう放音部を制御する放音制御部とを具備する。以上の構成においては、情報処理装置は、管理装置から通知された第2の言語による第2の案内音声を放音するので、情報処理装置からの音声を聴取する利用者が理解可能な言語に第2の言語を設定することにより利用者に応じた適切な言語による音声案内が可能となる。
【0009】
本発明の好適な態様において、第1の案内音声に対する音声認識で取得された文字列に対応する、言語情報で指定された第2の言語の翻訳データを取得する翻訳部をさらに具備し、放音制御部は、取得した翻訳データに応じた音響を第2の案内音声として放音するよう放音部を制御する。以上の構成においては、翻訳部は、音声認識により取得された文字列に対応する、指定言語の翻訳データを取得するので、第2の言語による第2の案内音声を簡易に生成することが可能となる。
【0010】
好ましくは、翻訳部は、相異なる案内音声を表わす複数の登録文字列のうち、第1の案内音声に対する音声認識で取得された文字列に類似する登録文字列を特定し、当該特定した登録文字列に対応する翻訳データを取得する。以上の構成においては、翻訳部は、音声認識で取得された文字列に類似する登録文字列を特定し、当該特定した登録文字列に対応する翻訳データを取得する。音声認識の精度が十分でない場合には第1の案内音声の発音内容の誤認識が生じ得る。本構成では音声認識で取得された文字列に類似する登録文字列を特定するので、誤認識の影響が低減され得る。よって、不適切な翻訳データが第2の案内音声として放音される可能性が低減される。例えば災害時の緊急放送など、ほぼ定型文による音声案内が第1の言語で行われる場合には、類似度が高い登録文字列が特定される可能性が高まるため、本構成は特に好適である。
【0011】
本発明の好適な態様において、放音制御部は、第2の案内音声に関連するコンテンツを利用者の端末装置で再生させるための再生情報を放音するよう放音部を制御する。以上の構成においては、第2の案内音声に加えて、第2の案内音声に関連するコンテンツを利用者の端末装置で再生させるための再生情報を放音するので、第2の案内音声の聴取が不可能な場合に再生情報に基づき再生したコンテンツが示す情報を利用者が代替的に利用することが可能である。また、第2の案内音声に関連する付加的な情報をコンテンツとして配信することが可能となり、利用者の利便性が向上する。
【0012】
さらには、本発明は、管理装置と、当該管理装置と通信する情報処理装置とを有する情報提供システムとしても把握され得る。具体的には、本発明の好適な態様に係る情報提供システムは、管理装置と、当該管理装置と通信する情報処理装置とを有する情報提供システムであって、管理装置は、第1の案内音声で用いられる第1の言語とは異なる第2の言語を指定する言語情報を設定する言語設定部と、言語設定部が設定した言語情報を情報処理装置に対して通知する通知部とを具備し、情報処理装置は、第1の案内音声に対応する第2の案内音声を、通知部から通知された言語情報で指定された第2の言語で放音するよう放音部を制御する放音制御部を具備する。また、上記情報提供システムは、当該情報提供システムにおける情報提供方法としても把握され得る。
【発明を実施するための形態】
【0014】
図1は、本発明にかかる一実施形態の情報提供システム100の構成図である。本実施形態の情報提供システム100は、複数の個別空間R(R1,R2,R3,……)の各々において利用者UR(UR1,UR2,UR3,……)にサービスを提供する施設において、施設の管理者UFから各利用者URに対して情報を提供するためのコンピュータシステムである。かかる施設としては、ホテルなどの宿泊施設や貸し会議室を提供する施設などが例示される。図示されるように、情報提供システム100は、例えばホテルのフロントなど管理者空間Fに設置された収音装置40および管理装置10と、各個別空間Rに設置された放音装置50および情報処理装置20とを具備する。収音装置40と各個別空間Rの放音装置50とは信号線40aを介して接続される。管理装置10と情報処理装置20とは例えばWi−fi(登録商標)に準拠した相互の通信が可能である。各利用者URは端末装置30を携帯して各個別空間R(例えばホテルの部屋)を利用する。端末装置30は、例えば携帯電話機やスマートフォン等の可搬型の通信端末である。なお、実際には、各個別空間Rでは複数の利用者URが情報提供システム100のサービスを利用し得るが、以下の説明では便宜上ひとりの利用者URと1個の端末装置30に着目する。また、管理装置10と情報処理装置20との間の通信は、LAN(Local Area Network)による通信や、インターネット等を含む通信網を介した通信でもよい。
【0015】
収音装置40は、周囲の音響を収音する音響機器(マイクロホン)である。具体的には、管理者UFが発音した第1の案内音声Gを収音して当該案内音声Gの波形を表す音響信号SGを生成する。本実施形態の管理者UFは、事前に用意された複数の文字列(以下「登録文字列」という)のいずれかを第1の案内音声Gとして発音する。例えば、複数の登録文字列が収録された緊急時誘導マニュアルを参照して、管理者UFは、緊急時の状況に応じた登録文字列を選択的に第1の案内音声Gとして発音する。すなわち、第1の案内音声Gは、基本的には、管理者UFが内容を任意に決定できるものではなく、事前に用意された既知の内容である。
【0016】
放音装置50は、収音装置40が生成した音響信号SGに応じた音響を放音する音響機器(スピーカ)である。具体的には、音響信号SGが表す第1の案内音声Gが放音装置50から利用者URに対して放音される。以上の説明から理解される通り、本実施形態の情報提供システム100は、管理者空間Fに配置された収音装置40が収音した第1の案内音声Gを各個別空間Rの放音装置50から放音する既存の施設内アナウンスシステムである。
【0017】
情報提供システム100は、概略的には、施設内アナウンスシステムにより第1の言語による第1の案内音声Gが放音されると、第1の案内音声Gに対応する第2の案内音声GLを、第1の案内音声Gの第1の言語とは異なる第2の言語にて情報処理装置20から放音するものである。第1の案内音声Gは、例えば緊急事態の発生を通知する音声や災害時の避難指示を案内する音声等である。より具体的には、管理者UF(例えばホテルのフロント係)が発音した第1の言語による第1の案内音声Gを管理者空間Fに配置される収音装置40が収音して音響信号SGを生成する。各個別空間Rに配置された放音装置50は収音装置40が生成した音響信号SGを各個別空間Rにおいて音響(第1の案内音声Gを表わす)として放音する。各個別空間Rに設置された情報処理装置20は、同個別空間Rに配置された放音装置50から放音された音響を収音して音響信号SGを生成し、当該音響信号SGに対する音声認識で第1の案内音声Gの発音内容を表す文字列(以下「認識文字列」という)を生成する。情報処理装置20は、認識文字列に対応する、第2の言語での翻訳データを取得し、当該翻訳データに基づく第2の案内音声GLを放音する。第2の言語は、管理装置10から各情報処理装置20に通知される言語情報L(LR1, LR2,LR3,……)により個別空間Rごとに指定される。翻訳データは、第1の言語による認識文字列に対応する、第2の言語による案内音声(第2の案内音声GL)の発音内容を表現する文字列(以下、「翻訳文字列」という)である。利用者URは各個別空間R(例えばホテルの部屋)において、当該個別空間Rに対して指定された第2の言語による第2の案内音声GLを聴取する。
【0018】
情報処理装置20は、第2の言語による第2の案内音声GLの放音とともに、翻訳データに対応する再生情報Qを取得して端末装置30に音響として送信する。具体的には、第2の案内音声GLを表わす音響信号SGに再生情報Qを表わす音響成分が混合された音響が情報処理装置20から放音される。再生情報Qは、第2の案内音声GLに関連する情報(以下「コンテンツ」という)を端末装置30が利用者URに提示するための情報であり、典型的には、コンテンツの識別情報である。再生情報Qを受信した端末装置30は、第2の案内音声GLの発音内容を表現する文字列をコンテンツとして利用者URに提示する。したがって、第2の案内音声が例えば緊急避難指示の場合、第2の案内音声GLの全部または一部を聞き逃した利用者URが第2の案内音声GLの内容を正確に把握することが可能である。また、例えば利用者URが第2の案内音声GLの聴取が困難な難聴者である場合、第2の案内音声GLの発音内容を文字情報にて把握することが可能である。
【0019】
図2は、情報提供システム100における管理装置10および任意の1個の情報処理装置20の構成図である。
図2に例示される通り、本実施形態の管理装置10は、言語設定部112と通知部113とを有する制御部11と、操作部12と表示部13と記憶部14と通信部15を備える。制御部11は、CPU(Central Processing Unit)等の演算処理装置で構成され、管理装置10の全体的な動作を制御する。記憶部14に記憶されたプログラムを制御部11が実行することで、本実施形態の管理装置10の言語設定部112および通知部113としての機能がそれぞれ実現される。制御部11の一部の機能を専用の電子回路で実現した構成や、制御部11の機能を複数の装置に分散した構成も採用され得る。
【0020】
操作部12は、管理者UFによる操作を受付ける入力機器である。表示部13は液晶表示パネル等の表示装置であり、例えば言語情報Lを設定するための入力画面を表示する。例えば管理者UFは、表示部13を見ながら操作部12を適宜に操作することで、各個別空間Rについて言語情報Lを設定する。なお、操作部12と表示部13とが一体的に形成されたタッチパネルを用いてもよい。
【0021】
記憶部14は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体のほか、磁気記録媒体や半導体記録媒体等の公知の記録媒体でもよい。記憶部14は、制御部11が実行するプログラムや制御部11が使用する各種のデータを記憶する。なお、上記のプログラムは、図示せぬ通信網を介した配信の形態で提供されて記憶部14にインストールされてもよい。
【0022】
記憶部14は言語情報テーブルTLを記憶する。
図2に示されるように、言語情報テーブルTLには、各個別空間Rごとに言語情報L(LR1,LR2,……)が設定(記憶)される。言語情報Lの設定は以下のように行われる。
例えば施設がホテル等の宿泊施設の場合には、宿泊客(すなわち利用者UR)のホテルへのチェックイン(利用登録)時に、ホテルのフロント係(すなわち管理者UF)が表示部13に表示された入力画面を見ながら利用者URの国籍または言語を操作部12の操作により入力(または表示された候補の国籍または言語から選択)する。言語設定部112は、記憶部14の言語情報テーブルTLにおいて、入力内容に応じた言語を利用者URが滞在する部屋(個別空間R)に対して設定する。なお、管理者UFではなく利用者URが、管理装置10と通信可能な通信装置(例えば、利用者URが携帯する端末装置30)や管理装置10に有線または無線にて接続された利用者端末を用いて言語を入力(または選択)してもよい。
【0023】
通信部15は、LANやWi−fiにしたがい施設内の情報処理装置20とそれぞれ通信する。通知部113は言語情報テーブルTLに記憶された各言語情報Lを、対応する個別空間Rの情報処理装置20に対して通信部15からそれぞれ通知する。
【0024】
情報処理装置20は、施設内の複数の個別空間Rの各々に設置され、制御部21と収音部22と記憶部24と通信部25と放音部26とを具備する。記憶部24は、例えば非一過性の記録媒体であり、CD-ROM等の光学式記録媒体のほか、磁気記録媒体や半導体記録媒体等の公知の記録媒体が採用され得る。記憶部24は、制御部21が実行するプログラムや制御部21が使用する各種のデータを記憶する。なお、上記のプログラムは、図示せぬ通信網を介した配信の形態で提供されて記憶部24にインストールされてもよい。
【0025】
記憶部24は案内テーブルTMを記憶する。
図2に示されるように、案内テーブルTMには、第1の案内音声Gの各登録文字列TG(TG1,TG2,……)に対応する他の言語での翻訳文字列TGL(TGL11,TGL12,……)が、翻訳文字列TGLに関連するコンテンツを再生するための再生情報Q(Q11,Q12,……)とともに登録される。さらに、記憶部24は、当該情報処理装置20が設置される個別空間Rについて管理装置10から通知された言語情報Lを記憶する。
【0026】
制御部21は、言語情報受信部211と音声認識部212と翻訳部213と放音制御部214を具備する。制御部21は、CPU等の演算処理装置で構成され、情報処理装置20の全体的な動作を制御する。記憶部24に記憶されたプログラムを制御部21が実行することで、本実施形態の情報処理装置20の言語情報受信部211、音声認識部212、翻訳部213、および放音制御部214としての機能がそれぞれ実現される。通信部25は、LANやWi−fiにしたがい管理装置10と通信する。言語情報受信部211は管理装置10の通知部113から通知された言語情報Lを通信部25を介して受信し、記憶部24に当該言語情報Lを記憶する。
【0027】
収音部22は、周囲の音響を収音する音響機器(マイクロホン)である。具体的には、収音部22は当該情報処理装置20が設置された個別空間Rの放音装置50から放音される第1の案内音声Gを収音して当該案内音声の波形を表わす音響信号SGを生成する。なお、アナログの信号である第1の案内音声Gをデジタルの音響信号SGに変換するA/D変換器の図示は便宜的に省略されている。
【0028】
音声認識部212は、収音部22が生成した音響信号SGに対する音声認識で、第1の案内音声Gの発音内容を表す認識文字列TGAを取得する。第1の案内音声Gの音声認識には、例えばHMM(Hidden Markov Model)等の音響モデルと言語的な制約を示す言語モデルとを利用した認識処理等の公知の技術が任意に採用され得る。翻訳部213は、案内テーブルTMに登録された複数の登録文字列TGのうち、認識文字列TGAに対応する登録文字列TGを特定する。
【0029】
前述の通り、管理者UFは、緊急時の避難誘導マニュアル等で事前に用意された登録文字列TGを第1の案内音声Gとして基本的には発音するから、理想的には、音声認識部212が音響信号SGに対する音声認識で解析した認識文字列TGAは、案内テーブルTMに登録された何れかの登録文字列TGに合致する。しかし、実際には、個々の管理者UFに特有の発話の特徴(くせ)や収音部22の周囲の雑音等に起因して、音声認識部212による解析には誤認識が発生し得る。また、緊急時のアナウンスが必ずしもマニュアルに記載された文字列のとおり行われるとは限らない。したがって、認識文字列TGAと登録文字列TGとは、相互に類似しても部分的には相違する場合がある。以上の事情を考慮して、本実施形態の翻訳部213は、案内テーブルTMに登録された複数の登録文字列TGのうち音声認識部212が解析した認識文字列TGAに類似する登録文字列TGを特定する。具体的には、翻訳部213は、認識文字列TGAと登録文字列TGとの類似度の指標を算出し、案内テーブルTMに登録された複数の登録文字列TGのうち認識文字列TGAとの類似度が最大となる1個の登録文字列TGを特定する。類似度の指標の算定には公知の方法を任意に算定し得るが、文字列間の類似性を評価するための編集距離(レーベンシュタイン距離)がその一例である。
翻訳部213は、特定した登録文字列TGに対応して案内テーブルTMに記憶された相異なる複数の言語による複数の翻訳文字列TGLのうち、管理装置10から通知されて記憶部24に記憶された言語情報Lが指定する言語の翻訳文字列TGLを取得し、放音制御部214に供給する。
【0030】
放音制御部214は、翻訳部213が取得した翻訳文字列TGLを発音した音声を表す音響信号SGLを公知の音声合成技術で生成するとともに、当該翻訳文字列TGLに対応して案内テーブルTMに登録された再生情報Qを取得し、音響信号SGLに再生情報Qの音響成分を混合した音響信号S[GL,Q]を生成する。音響信号S[GL,Q]のうち再生情報Qを含む音響成分の放音制御部54による生成には公知の技術が任意に採用され得るが、例えば、所定の周波数の正弦波等の搬送波を再生情報Qで周波数変調することで再生情報Qを含む音響成分を生成する構成や、拡散符号を利用した再生情報Qの拡散変調と所定の周波数の搬送波を利用した周波数変換とを順次に実行して再生情報Qを含む音響成分を生成する構成が好適である。再生情報Qを含む音響成分の周波数帯域は、放音部26による放音と端末装置30による収音とが可能な周波数帯域であり、かつ、利用者URが通常の環境で聴取する音声(例えば第2の案内音声GL)や楽音等の音響の周波数帯域を上回る周波数帯域(例えば18kHz以上かつ20kHz以下)の範囲内に包含される。ただし、再生情報Qの音響成分の周波数帯域は任意であり、例えば可聴帯域内の再生情報Qの音響成分を生成することも可能である。なお、放音制御部214は、音響信号SGLと再生情報Qの音響成分とを別々のタイミングで個別に放音してもよい。もっとも再生情報Qは第2の案内音声GLを補完する情報を再生するためのものである。この観点から、両者を別々のタイミングで放音する場合には、音響信号SGLの放音の後に、再生情報Qの音響成分を放音することが望ましい。
【0031】
以上の説明から理解される通り、情報処理装置20の放音制御部214は、空気振動としての音響(音波)を伝送媒体とする音響通信で再生情報Qを端末装置30に送信する手段として機能する。すなわち、放音制御部214は、収音部22が収音した第1の案内音声Gに対応する第2の案内音声GLを放音部26から放音させるとともに、再生情報Qを含む音響の放音部26からの放音により当該再生情報Qを端末装置30に送信する。
【0032】
放音部26は、放音制御部214から供給される音響信号S[GL,Q]に応じた音響を放音する音響機器(スピーカ)である。放音制御部214は、生成した音響信号S[GL,Q]が表わす音響を放音するよう放音部26を制御する。個別空間Rの情報処理装置20の放音部26から放音された音響(第2の案内音声GLおよび再生情報Qを表わす)は、個別空間Rにいる利用者URに聴取されるとともに、個別空間R内の端末装置30の収音部32により収音される。
【0033】
図3は本実施形態にかかる任意の1個の端末装置30の構成図である。図示のように、端末装置30は、収音部32と制御部31と記憶部36と提示部38とを具備する。収音部32は、周囲の音響を収音する音響機器(マイクロホン)であり、具体的には、情報処理装置20の放音部26から放音される音響(第2の案内音声GLおよび再生情報Qを表わす)を収音して音響信号S[GL,Q]を生成する。前述のように、音響信号S[GL,Q]は、再生情報Qの音響成分を含有する。なお、収音部32が生成した音響信号S[GL,Q]をアナログからデジタルに変換するA/D変換器の図示は便宜的に省略されている。
【0034】
記憶部36は、例えば非一過性の記録媒体であり、CD-ROM等の光学式記録媒体のほか、磁気記録媒体や半導体記録媒体等の公知の記録媒体でもよい。記憶部36は、制御部31が実行するプログラムや制御部31が使用する各種のデータを記憶する。制御部31は、端末装置30の全体的な動作を制御する処理装置(例えばCPU)である。本実施形態の端末装置30の制御部31は、記憶部36に記憶されたプログラムを実行することで、再生情報Qに応じたコンテンツCを利用者URに提示するための複数の機能(情報抽出部341および提示制御部342)を実現する。記憶部36は、複数のコンテンツCを、各々の再生情報Qと対応させて予め記憶する。
【0035】
情報抽出部341は、収音部32が生成した音響信号S[GL,Q]の復調で再生情報Qを抽出する。具体的には、情報抽出部341は、再生情報Qの音響成分を含む周波数帯域の帯域成分を強調するフィルタ処理と情報処理装置20での変調処理に対応した復調処理とを音響信号S[GL,Q]に対して実行することで再生情報Qを抽出する。提示制御部342は、情報抽出部341が抽出した再生情報Qに応じたコンテンツCを記憶部36から取得して提示部38に提示させる。提示部38は、提示制御部342から供給されたコンテンツCを利用者URに提示する。提示部38は、コンテンツCを表示する表示機器(例えば液晶表示パネル)である。なお、図示せぬ通信網に接続されたサーバ装置に複数のコンテンツCを保持し、端末装置30からの要求(再生情報Qを含む要求)に応じてサーバ装置からコンテンツCを配信してもよい。また、再生情報QはコンテンツCの識別情報でなくとも、コンテンツ自体であってもよい。すなわち、情報処理装置20の案内テーブルTMに記憶される再生情報QをコンテンツC自体としてもよい。この場合には、端末装置30の記憶部36はコンテンツCを記憶していなくともよい。
【0036】
図4は、情報提供システム100の全体的な動作の説明図である。情報提供システム100の管理装置10は、個別空間Rを利用する利用者URに対して言語情報Lを設定する(SA1)。その後、管理装置10は、複数の個別空間Rの各々に設置された各情報処理装置20に対して、対応する言語情報Lを言語情報テーブルTLから取得して通知する(SA2)。言語情報Lは任意のタイミングで各個別空間Rの情報処理装置20に通知され得るが、例えば1日に1回予め定められた時刻にすべての個別空間Rの情報処理装置20に対して一括で通知してもよい。あるいは、施設の利用登録時(例えば施設がホテルの場合にはチェックイン時)に、対応する個別空間Rの情報処理装置20に対して言語情報Lを逐次通知してもよい。言語情報Lが通知された情報処理装置20は、通知された言語情報Lを記憶部24に記憶する(SA3)。
【0037】
その後、管理者空間Fに設置された収音装置40は、管理者UFが発音した第1の案内音声Gを収音して音響信号SGを生成する。音響信号SGは、個別空間Rの各々に設置された放音装置50に供給されて音響として各個別空間R内で放音装置50から放音される。情報処理装置20の収音部22は収音した音響を表わす音響信号SGを生成する(SA4)。
【0038】
情報処理装置20では、音声認識部212による認識文字列TGAの生成(SA5)と、翻訳部213による翻訳文字列TGLの特定(SA6)と、放音制御部214による音響信号S[GL,Q]の生成(SA7)とが実行される。具体的には、音声認識部212は、音響信号SGに対する音声認識で認識文字列TGAを生成する(SA5)。翻訳部213は、案内テーブルTMに登録された複数の登録文字列TGのうち、認識文字列TGAに最も類似する登録文字列TGを特定する(SA61)。そして、特定した登録文字列TGに対応して案内テーブルTMに記憶されている複数の言語の翻訳文字列TGLのうち、記憶部24に記憶された言語情報Lが指定する言語の翻訳文字列TGLを取得する(SA62)。放音制御部214は、翻訳部213が取得した翻訳文字列TGLに対応して案内テーブルTMに登録された再生情報Qを取得し(SA71)、翻訳文字列TGLの音響信号SGLに再生情報Qの音響成分を混合した音響信号S[GL,Q]を生成(SA72)し、音響信号S[GL,Q]に応じた音響を放音部26から放音させる(SA8)。
【0039】
放音部26が放音した音響は端末装置30の収音部32により収音される(SA8)。端末装置30では、収音部32が収音により生成した音響信号S[GL,Q]から情報抽出部341が再生情報Qを抽出し(SA9)、提示制御部342は、当該再生情報Qに応じたコンテンツCを記憶部36から取得して(SA10)、提示部38から利用者URに提示する(SA11)。したがって、個別空間Rの利用者URは、放音装置50から第1の言語の第1の案内音声Gが放音されたあと、第1の案内音声Gに対応する第2の案内音声GLを管理装置10において設定された言語で聴取することが可能である。また、利用者URは当該第2の案内音声GLのコンテンツC(例えば、第2の案内音声GLの発音内容を示す文字列)を提示部38の表示で確認することも可能である。
【0040】
以上説明したように、本実施形態の構成においては、情報処理装置20に対して、第1の案内音声Gに対応する第2の案内音声GLを放音する際の第2の言語を管理装置10から通知し、情報処理装置20は、管理装置10から通知された言語情報Lで指定された第2の言語による第2の案内音声GLを放音する。したがって、情報提供システム100では、情報処理装置20からの音声を聴取する利用者URが理解可能な言語を言語情報Lとして設定することにより各個別空間Rの利用者URに応じた適切な言語による音声案内が可能となる。さらには、複数の個別空間Rの各々の情報処理装置20について個別の言語情報Lが通知されるので、多言語の利用者が利用する場所や施設において利用者URが理解可能な言語に翻訳された第2の音声案内が各情報処理装置20から可能となる。
【0041】
また、翻訳部213は、音声認識により取得された認識文字列TGAに対応する、言語情報Lで指定された言語の翻訳文字列TGLを取得するので、第2の言語による第2の案内音声GLを簡易に生成することが可能となる。さらには、翻訳部213は、認識文字列TGAに最も類似する登録文字列TGを特定し、特定した登録文字列TGに対応する翻訳文字列TGLを取得する。音声認識部212による音声認識の精度が十分でない場合には第1の案内音声Gを表わす音響信号SGの発音内容の誤認識が生じ得る。本構成では音声認識で取得された認識文字列TGAに類似する登録文字列TGを特定するので、誤認識の影響が低減され得る。よって、不適切な意味内容の第2の案内音声GLが情報処理装置20から放音される可能性が低減されるという利点がある。
【0042】
さらに、本実施形態の情報処理装置20は、第2の案内音声GLに加えて、第2の案内音声GLに関連するコンテンツCを端末装置30で再生させるための再生情報Qを放音するので、第2の案内音声GLの聴取が不可能な場合に再生情報Qに基づき再生したコンテンツCが示す情報を利用者URは代替的に利用できるという利点もある。
【0043】
<変形例>
以上に例示した各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。
【0044】
(1)上述の実施形態では、言語情報Lを管理装置10に対する操作で設定するが、情報処理装置20に対する操作で言語情報Lを設定してもよい。例えば、管理装置20から情報処理装置20に通知された言語情報Lを、利用者URが情報処理装置20に対する操作で変更可能な構成としてもよい。
【0045】
(2)上述の実施形態では、情報処理装置20の音声認識部212が音響信号SGの音声認識を実行するが、例えば、サーバ装置を施設内に設置して当該サーバ装置に音声認識を実行させる構成や、通信網を介して情報処理装置20に接続されたサーバ装置(クラウド上のサーバ装置)に音声認識を実行させる構成も採用し得る。この場合、情報処理装置20は、サーバ装置の認識結果(認識文字列TGA)を受信し、翻訳部213は前述したような処理(すなわち、翻訳文字列TGLの取得以降の処理)を実行する。この構成によれば、情報処理装置20の処理負荷が軽減されるため、装置構成を簡素化することが可能である。また、情報処理装置20よりも高精度の音声認識機能をサーバ装置に持たせる場合には、翻訳部213はサーバ装置による認識結果を用いることで精度良く登録文字列TGを特定することが可能となる。したがって、第1の案内音声Gにより精度良く合致した第2の案内音声GLを放音できるという利点もある。
【0046】
(3)上述の実施形態では、案内テーブルTMに翻訳文字列TGLを記憶するが、翻訳文字列TGLを発音した音声データを記憶してもよい。すなわち、翻訳部213が第1の案内音声Gの音響信号SGに対する音声認識で取得された文字列に対応する、言語情報Lで指定された第2の言語の翻訳データを取得することには、翻訳データとして翻訳文字列TGLを取得することのほか、翻訳文字列TGLを発音した音声を表わす音響信号SGLを取得することも含む。
【0047】
(4)上述の実施形態では、管理装置10と複数の情報処理装置20とを具備する情報提供システム100を例示したが、情報提供システム100が管理装置10と1つの情報処理装置20を具備し、管理装置10は当該1つの情報処理装置20について言語情報Lを設定するとともに、情報処理装置20に対して言語情報Lを通知する構成でもよい。また、上述の実施形態では、複数の個別空間Rを有する施設において各個別空間に1つの情報処理装置20を配置する場合を一例として説明したが、1つの空間に複数の情報処理装置20を設置し、これら複数の情報処理装置20の各々について管理装置10において言語情報Lを管理装置10において設定し、情報処理装置20に通知する構成も採用し得る。
【0048】
(5)上述の実施形態では、コンテンツCを表示する表示機器を提示部38として例示したが、コンテンツCに対応する音響(例えばコンテンツCを発音した音声)を放音する放音機器(例えばスピーカやヘッドホン)を提示部38として利用することも可能である。
【0049】
(6)上述の実施形態では、第2の案内音声GLの放音に加えて、再生情報Qを音響通信にて端末装置30に対して送信するが、再生情報Qの送信は必須ではない。この場合、登録文字列TG、翻訳文字列TGLおよび再生情報Qを関連づけて記憶した案内テーブルTMは、再生情報Qを記憶せず、放音制御部214は、再生情報Qを含む音響成分を生成しない。
【0050】
(7)上述の実施形態では、登録文字列TG、翻訳文字列TGL、および再生情報Qを関連づけて記憶した案内テーブルTMを情報処理装置20の記憶部24が記憶したが、案内テーブルTMを保持する場所は以上の例示に限定されない。例えば、図示せぬ通信網を介して情報処理装置20と通信するサーバ装置に案内テーブルTMを記憶することも可能である。情報処理装置20は、音声認識部212による認識結果(認識文字列TGA)と言語情報Lとを含む取得要求をサーバ装置に送信する。サーバ装置は、取得要求に含まれた認識文字列TGAに最も類似する登録文字列TGを特定したうえで、特定した登録文字列TGに対応して記憶された複数言語の翻訳文字列TGLのうち言語情報Lが指定する言語の翻訳文字列TGLと再生情報Qを、要求元の情報処理装置20に送信する。情報処理装置20の放音制御部214は、受信した翻訳文字列TGLから音響信号SGLを生成する。以上の説明から理解される通り、情報処理装置20に案内テーブルTMを保持する構成は必須ではない。この場合には、登録文字列TG、翻訳文字列TGL、および再生情報Qのアップデートの際には各情報処理装置20に記憶された案内テーブルTMを更新せずともサーバ装置に記憶された案内テーブルTMを更新することで最新の状態を容易に保てるという利点がある。
【0051】
(8)上述の実施形態では、音響を伝送媒体とする音響通信で再生情報Qを端末装置30に送信したが、端末装置30に再生情報Qを送信するための通信方式は以上の例示に限定されない。例えば、電波や赤外線等の電磁波を伝送媒体とした無線通信で情報処理装置20から端末装置30に再生情報Qを送信することも可能である。以上の例示から理解される通り、再生情報Qの送信には、通信網が介在しない近距離無線通信が好適であり、音響を伝送媒体とする音響通信や電磁波を伝送媒体とする無線通信は近距離無線通信の例示である。