(58)【調査した分野】(Int.Cl.,DB名)
前記第1のスピーカと前記第2のスピーカとは、前記近端側マイクロホンの位置を通り上下方向に延びる直線を挟んで、当該直線における互いに異なる側に配置されており、
前記第1のマイクロホンと前記第2のマイクロホンとは、前記遠端側スピーカの位置を通り上下方向に延びる直線を挟んで、当該直線における互いに異なる側に配置されている、
請求項14に記載の遠隔会話システム。
【発明を実施するための形態】
【0013】
本発明の第1の実施形態に係る遠隔会話装置、遠隔会話方法、および、遠隔会話システムについて、図を参照して説明する。
図1は、本発明の第1の実施形態に係る遠隔会話装置および遠隔会話システムの構成を示すブロック図である。
図2は、近端側のマイクロホンとスピーカとの配置を示す図である。
図3は、遠端側のマイクロホンとスピーカとの配置を示す図である。
【0014】
図1に示すように、遠隔会話システム1は、近端側会話装置10と遠端側会話装置20とを備える。近端側会話装置10が本発明の「遠隔会話装置」に対応する。近端側会話装置10と遠端側会話装置20とは、無線または有線で通信を行う。なお、本発明で言う、遠隔会話とは、通常の会話に限るものではなく、遠隔地間の会議等、遠隔地間で音声のやり取りを行うものを含む。
【0015】
近端側会話装置10は、マイクロホン11、送信部12、受信部13、近端側フィルタ14、および、スピーカ15を備える。近端側フィルタ14は、フィルタ141とフィルタ142とを備える。スピーカ15は、スピーカ151とスピーカ152とを有し、ステレオスピーカを構成している。送信部12、受信部13、および、近端側フィルタ14は、信号処理部B10を構成している。信号処理部B10は、送信部12、受信部13、および、近端側フィルタ14のそれぞれの機能を実行するIC等のハードウエアによって実現されている。
【0016】
図2に示すように、マイクロホン11、スピーカ151、および、スピーカ152は、ヘッドセットを構成している。信号処理部B10は、ヘッドセットに装着されており、マイクロホン11、スピーカ151、および、スピーカ152に接続している。
【0017】
マイクロホン11は、ヘッドセットの横方向の略中央位置で、且つ、上下方向の下側の位置に配置されている。マイクロホン11は、ヘッドセットの中央側に収音指向性の中心を向けて配置されている。
【0018】
スピーカ151は、ヘッドセットの横方向の第1端に配置されており、スピーカ152は、ヘッドセットの横方向の第2端に配置されている。言い換えれば、スピーカ151とスピーカ152とは、マイクロホン11を通り上下方向に延びる直線を基準にして線対称の位置に配置されている。スピーカ151とスピーカ152は、ヘッドセットの中央側に放音指向性の中心を向けて配置されている。
【0019】
近端側のユーザ91がヘッドセットを装着すると、マイクロホン11はユーザ91の口911の近くに配置される。これにより、ユーザ91が発声すると、マイクロホン11は、この音声を収音する。
【0020】
スピーカ151は、ユーザ91に左耳915Lに装着され、スピーカ152は、ユーザ91の右耳915Rに装着される。これにより、ユーザ91は、スピーカ151から放音された音声を左耳915Lで聞き、スピーカ152から放音された音声を右耳915Rで聞くことができる。
【0021】
信号処理部B10は、ヘッドセットに装着されており、マイクロホン11、スピーカ151、および、スピーカ152に接続している。
【0022】
マイクロホン11は、ユーザ91の音声を収音して、収音信号S11を生成する。マイクロホン11は、収音信号S11を、近端側フィルタ14のフィルタ141、142と送信部12とに出力する。
【0023】
送信部12は、収音信号S11を、通信信号S12に変換して、遠端側会話装置20の受信部21に送信する。
【0024】
受信部13は、後述の遠端側会話装置20からの通信信号S25を受信する。受信部13は、通信信号S25から、放音信号S131、S132、フィルタ係数Co131、Co132を復調する。したがって、受信部13は、本発明の「伝達特性取得部」の機能を有する。受信部13は、放音信号S131をスピーカ151に出力し、放音信号S132をスピーカ152に出力する。受信部13は、フィルタ係数Co131をフィルタ141に出力し、フィルタ係数Co132をフィルタ142に出力する。
【0025】
なお、詳細は後述するが、放音信号S131は、遠端側会話装置20のマイクロホン231で収音され、エコーキャンセラ241でエコーキャンセル処理された音声信号である。放音信号S132は、遠端側会話装置20のマイクロホン232で収音され、エコーキャンセラ242でエコーキャンセル処理された音声信号である。フィルタ係数Co131は、エコーキャンセラ241のフィルタ係数Co241と同じであり、フィルタ係数Co132は、エコーキャンセラ241のフィルタ係数Co242と同じである。これら、フィルタ係数Co131、Co132、Co241、Co242が、本発明の「伝達特性」に対応する。
【0026】
フィルタ141は、フィルタ係数Co131を用いて、収音信号S11をフィルタ処理する。フィルタ141は、例えば、IIRフィルタによって構成されており、収音信号S11に対して、フィルタ係数Co131を用いた畳み込み演算を行うことによって、フィルタ処理を実行する。フィルタ141は、このフィルタ処理後の収音信号(調整後の収音信号)S141を、スピーカ151に出力する。
【0027】
フィルタ142は、フィルタ係数Co132を用いて、収音信号S11をフィルタ処理する。フィルタ142は、例えば、IIRフィルタによって構成されており、収音信号S11に対して、フィルタ係数Co132を用いた畳み込み演算を行うことによって、フィルタ処理を実行する。フィルタ142は、このフィルタ処理後の収音信号(調整後の収音信号)S142を、スピーカ152に出力する。
【0028】
このような処理を行うことによって、フィルタ処理後の収音信号S141、S142は、遠端側の音場の伝達特性に応じた音声信号となる。
【0029】
スピーカ151は、放音信号S131とフィルタ処理後の収音信号S141とを放音する。スピーカ152は、放音信号S132とフィルタ処理後の収音信号S142とを放音する。
【0030】
このように、近端側会話装置10を用いることによって、近端側のユーザ91は、遠端側の音場の伝達特性で自分の声を聞きながら、遠端側のユーザ92の音声を聞くことができる。したがって、近端側のユーザ91は、あたかも遠端側に居て、遠端側のユーザ92と会話しているような感覚、すなわち会話の臨場感を得ることができる。
【0031】
そして、この構成を用いれば、近端側に1個のマイクロホンと2個のスピーカを備えればよく、遠端側の音場の伝達特性を実現するための大掛かりな構成を近端側に必要としない。したがって、簡素な構成で、離れた場所間での臨場感の有る会話を実現できる。
【0032】
この際、遠端側会話装置20は、例えば、具体的に次の構成および処理を実現すればよい。
【0033】
遠端側会話装置20は、受信部21、スピーカ22、マイクロホン231、マイクロホン232、遠端側フィルタ24、および、送信部25を備える。遠端側フィルタ24は、エコーキャンセラ241とエコーキャンセラ242とを備える。マイクロホン231とマイクロホン232とは、ステレオマイクを構成している。受信部21、遠端側フィルタ24、および、送信部25は、信号処理部B20を構成している。信号処理部B20は、受信部21、遠端側フィルタ24、および、送信部25のそれぞれの機能を実行するIC等のハードウエアによって実現されている。
【0034】
図3に示すように、スピーカ22、マイクロホン231、マイクロホン232、および、信号処理部B20は、顔型のロボット200に実装されている。なお、必ずしも、顔型のロボット200である必要はなく、少なくとも、スピーカ22、マイクロホン231、および、マイクロホン232を所定の位置関係に保持できればよい。信号処理部B20は、スピーカ22、マイクロホン231、および、マイクロホン232に接続している。
【0035】
スピーカ22は、ロボット200の横方向の略中央位置で、且つ、上下方向の下側の位置に配置されている。スピーカ22は、ロボット200の正面側に放音指向性の中心を向けて配置されている。
【0036】
マイクロホン231は、ロボット200の横方向の第1端に配置されており、マイクロホン232は、ロボット200の横方向の第2端に配置されている。言い換えれば、マイクロホン231とマイクロホン232とは、スピーカ22を通り上下方向に延びる直線を基準にして線対称の位置に配置されている。マイクロホン231とマイクロホン232とは、ロボット200の正面側に収音指向性の中心を向けて配置されている。
【0037】
すなわち、スピーカ22とマイクロホン231との位置関係は、近端側のマイクロホン11とスピーカ151との位置関係に対応している。さらに、スピーカ22とマイクロホン232との位置関係は、近端側のマイクロホン11とスピーカ152との位置関係に対応している。
【0038】
受信部21は、近端側会話装置10の送信部12からの通信信号S12を受信し、遠端側放音信号S21を復調する。遠端側放音信号S21は、近端側の収音信号S11と同じ音声信号である。受信部21は、遠端側放音信号S21を、スピーカ22とエコーキャンセラ241、242とに出力する。スピーカ22は、遠端側放音信号S21を放音する。
【0039】
マイクロホン231およびマイクロホン232は、遠端側のユーザ92の音声を収音する。この際、マイクロホン231は、音声エコーSE22Rを収音し、マイクロホン232は、音声エコーSE22Lを収音してしまう。
【0040】
音声エコーSE22Rは、スピーカ22とマイクロホン231との位置関係、スピーカ22の放音指向性、マイクロホン231の収音指向性、および、遠端側の音響特性によって、特性が決まるエコーである。音声エコーSE22Lは、スピーカ22とマイクロホン232との位置関係、スピーカ22の放音指向性、マイクロホン232の収音指向性、および、遠端側の音響特性によって、特性が決まるエコーである。すなわち、音声エコーSE22R、音声エコーSE22Lは、遠端側の音場の伝達特性によって、特性が決定される。
【0041】
マイクロホン231は、収音した音声およびエコーを含む収音信号S231を生成して、エコーキャンセラ241に出力する。マイクロホン232は、収音した音声およびエコーを含む収音信号S232を生成して、エコーキャンセラ242に出力する。
【0042】
エコーキャンセラ241は、既知のエコーキャンセル技術を用いて、収音信号S231に対してエコーキャンセル処理を実行する。この処理によって、エコーキャンセラ241は、収音信号S231に含まれる音声エコーSE22Rを抑圧する。エコーキャンセラ241は、このエコーキャンセル後の収音信号S241を、送信部25に出力する。また、エコーキャンセラ241は、エコーキャンセル処理に利用したフィルタ係数Co241を送信部25に出力する。
【0043】
エコーキャンセラ242は、既知のエコーキャンセル技術を用いて、収音信号S232に対してエコーキャンセル処理を実行する。この処理によって、エコーキャンセラ242は、収音信号S232に含まれる音声エコーSE22Lを抑圧する。エコーキャンセラ241は、このエコーキャンセル後の収音信号S242を、送信部25に出力する。
【0044】
また、エコーキャンセラ242は、エコーキャンセル処理に利用したフィルタ係数Co242を送信部25に出力する。
【0045】
送信部25は、収音信号S241、S242と、フィルタ係数Co241、Co241とを組にして、これらを通信信号S25に変換して、近端側会話装置10の受信部13に送信する。
【0046】
この収音信号S241は、上述の近端側会話装置10の放音信号S131として復調され、収音信号S242は、上述の近端側会話装置10の放音信号S132として復調される。また、フィルタ係数Co241は、上述の近端側会話装置10のフィルタ係数Co131として復調され、フィルタ係数Co242は、上述の近端側会話装置10のフィルタ係数Co132として復調される。そして、上述した近端側会話装置10の処理が実行される。
【0047】
このような構成の遠隔会話システム1を用いることによって、遠端側のユーザ92の音声は、エコーキャンセルされた鮮明な音声として、近端側のユーザ91に放音される。したがって、近端側のユーザ91は、あたかも遠端側に居て、遠端側のユーザ92と会話しているような会話の臨場感を得ながら、遠端側のユーザ92の音声を鮮明に聞き取ることができる。
【0048】
そして、この構成を用いれば、遠端側に1個のスピーカと2個のマイクロホンを備えればよく、遠端側の音場の伝達特性を実現するための大掛かりな構成を遠端側にも必要としない。したがって、遠隔会話システム1としても、簡素な構成で、離れた場所間での臨場感の有る会話を実現できる。
【0049】
また、この構成では、遠端側のエコーキャンセラ241のフィルタ係数Co241を、近端側のフィルタ141のフィルタ係数Co131として利用でき、遠端側のエコーキャンセラ242のフィルタ係数Co242を、近端側のフィルタ142のフィルタ係数Co132として利用できる。したがって、複雑な処理を行うことなく、離れた場所間での臨場感の有る会話を実現できる。
【0050】
なお、フィルタ係数Co131は、フィルタ係数Co241と同じでなくてもよく、フィルタ係数Co241を基に設定されたものであってもよい。フィルタ係数Co132は、フィルタ係数Co242と同じでなくてもよく、フィルタ係数Co241を基に設定されたものであってもよい。
【0051】
また、本実施形態では、フィルタ係数を用いて、近端側の収音信号S11を調整する態様を示したが、遠端の音場の伝達特性を表す数値であれば、フィルタ係数に代えて用いることができる。具体的には、インパルス応答そのものまたはインパルス応答に代用できるものであればよい。インパルス応答の場合、遠端側において、スピーカとマイクロホンを用いて、インパルス応答を測定し、当該インパルス応答を用いて、近端側で収音信号に対して畳み込み処理を行えばよい。
【0052】
また、上述の説明では、1回の音声の送受信の場合を示した。しかしながら、会話を継続する際には、複数回の音声の送受信を行う。このように複数回の音声の送受信を行う場合には、送受信毎に遠端側会話装置20からフィルタ係数Co241、Co242を取得し、近端側会話装置10のフィルタ係数Co131、Co132を、この送受信に合わせて逐次的に更新すればよい。これにより、会話を行っている時間における遠端側の音場の伝達特性を、近端側において、さらに忠実に再現できる。したがって、近端側のユーザ91は、さらに臨場感の有る会話を実現できる。
【0053】
この際、遠端側の音場の伝達特性として遠端側のフィルタ係数Co241、Co242を用いることによって、通信されるデータ量を小さくできる。これにより、近端側のフィルタ141、142におけるフィルタ処理の時間遅れを抑制できる。したがって、時間遅れを殆ど発生することなく、遠端側の音場の伝達特性を、近端側において再現でき、さらに臨場感の有る会話を実現できる。
【0054】
上述の説明では、近端側会話装置10および遠隔会話システム1の処理のそれぞれを機能ブロック毎に実行する態様を示した。しかしながら、次のフローチャートに示す方法をプログラム化しておき、当該プログラムを、情報処理装置(例えばCPU)等の適切なハードウエアで実行することでも、上述の会話を実現できる。
【0055】
図4は、本発明の第1の実施形態に係る近端側会話装置で実行する遠隔会話方法を示すフローチャートである。
【0056】
近端側会話装置は、近端側のユーザの音声を収音し、収音信号を生成する(S101)。この処理は「近端側収音処理」に対応する。
【0057】
近端側会話装置は、遠端側の伝達特性を取得する(S102)。この処理は「伝達特性取得処理」に対応する。遠端側の伝達特性の取得方法としては、例えば、
図5に示す方法を用いればよい。
図5は、伝達特性の取得方法を示すフローチャートである。
【0058】
近端側会話装置は、近端側の収音信号を、遠端側会話装置に送信する(S201)。遠端側会話装置は、近端側の収音信号を放音する(S202)。この処理は「遠端側放音処理」に対応する。遠端側会話装置は、遠端側で収音して遠端側の収音信号を生成する。この処理は「遠端側収音処理」に対応する。遠端側会話装置は、近端側の収音信号に起因するエコーを抑圧するエコーキャンセル処理を実行する(S203)。この処理は「遠端側フィルタ処理」に対応する。遠端側会話装置は、エコーキャンセルのフィルタ係数を、近端側会話装置に送信する(S204)。近端側会話装置は、遠端側のフィルタ係数を受信し、遠端側の伝達特性とする(S205)。これらの処理により、近端側会話装置は、遠端側の伝達特性を取得できる。
【0059】
近端側会話装置は、遠端側の伝達特性を用いて、ステップS101で取得した収音信号を調整する(S103)。この処理は「近端側フィルタ処理」に対応する。近端側会話装置は、調整後の収音信号を近端側で放音する(S104)。この処理は「近端側放音処理」に対応する。
【0060】
このような遠隔会話方法を用いることによって、近端側のユーザは、遠端側の音場の伝達特性で自分の声を聞きながら、遠端側のユーザと臨場感のある会話を実現できる。
【0061】
なお、上述の説明では、近端側において、1個のマイクロホンと2個のスピーカとが配置され、遠端側において、1個のスピーカと2個のマイクロホンとが配置される態様を示した。しかしながら、マイクロホンの個数とスピーカの個数とは、これに限るものではない。この際、マイクロホンの個数とスピーカの個数は、多すぎない方が好ましい。ただし、上述の説明のように、近端側において、スピーカを2個としてステレオスピーカを構成し、遠端側において、マイクロホンを2個としてステレオマイクロホンを構成することによって、マイクロホンの個数とスピーカの個数とを少なく抑えながら、臨場感を得ることができ、有効である。この場合、通信されるフィルタ係数が少なく、遠端側のフィルタ係数を近端側に高速に送信できる。したがって、近端側でのフィルタ係数を殆ど遅延させることなく設定でき、リアルタイム性が重要な遠隔会話システムにとっては、より有効である。
【0062】
また、近端側のマイクロホンの個数と遠端側のスピーカの個数は同じであり、近端側のスピーカの個数と遠端側のマイクロホンの個数は同じであることが好ましい。さらに、近端側におけるマイクロホンに対するスピーカの配置と、遠端側におけるスピーカに対するマイクロホンの配置とは、同じであることが好ましい。これにより、遠端側のフィルタ係数は、近端側のフィルタ係数として容易に利用可能になる。したがって、近端側でのフィルタ係数の決定を速くでき、リアルタイム性が重要な遠隔会話システムにとっては、より有効である。
【0063】
なお、近端側におけるマイクロホンに対するスピーカの配置と、遠端側におけるスピーカに対するマイクロホンの配置とが異なる場合には、次に示す第2の実施形態に係る構成を用いるとよい。
【0064】
図6は、本発明の第2の実施形態に係る遠隔会話装置の構成を示すブロック図である。
図6に示すように、第2の実施形態に係る近端側会話装置10Aは、第1の実施形態に係る近端側会話装置10に対して、近端側フィルタ14Aの構成において異なる。近端側会話装置10Aの他の構成は、近端側会話装置10と同様であり、同様の箇所の説明は省略する。
【0065】
近端側フィルタ14Aは、フィルタ141、フィルタ142、伝達差調整フィルタ143、および、伝達差調整フィルタ144を備える。フィルタ141、フィルタ142は、第1の実施形態に係る近端側フィルタ14を構成するフィルタと同じである。
【0066】
伝達差調整フィルタ143のフィルタ係数は、近端側のマイクロホン11とスピーカ151との伝達特性と、遠端側のスピーカ22とマイクロホン231との伝達特性との差を相殺する値に設定されている。
【0067】
伝達差調整フィルタ144のフィルタ係数は、近端側のマイクロホン11とスピーカ152との間の伝達特性と、遠端側のスピーカ22とマイクロホン232との間の伝達特性との差を相殺する値に設定されている。
【0068】
伝達差調整フィルタ143、144のフィルタ係数は、ヘッドセットにおけるマイクロホン11とスピーカ151、152との位置関係、収音指向性、および、放音指向性と、ロボット200におけるスピーカ22とマイクロホン231、232との位置関係、放音指向性、および、収音指向性との差から、予め推定算出できる。
【0069】
伝達差調整フィルタ143は、収音信号S11をフィルタ処理し、フィルタ141に出力する。フィルタ141は、伝達差調整フィルタ143でフィルタ処理された収音信号S11をフィルタ処理し、スピーカ151に出力する。
【0070】
伝達差調整フィルタ144は、収音信号S11をフィルタ処理し、フィルタ142に出力する。フィルタ142は、伝達差調整フィルタ144でフィルタ処理された収音信号S11をフィルタ処理し、スピーカ152に出力する。
【0071】
このような構成および処理を行うことによって、近端側会話装置10Aは、遠端側の音場の伝達特性を更に忠実に再現できる。したがって、近端側のユーザは、遠端側のユーザとさらに臨場感のある会話を実現できる。
【0072】
なお、上述の実施形態では遠端側のフィルタ係数と遠端側の収音信号とを組にして通信する態様を示したが、遠端側のフィルタ係数と遠端側の収音信号とを別の経路で通信してもよい。この場合、遠端側のフィルタ係数が、遠端側の収音信号よりも速く、近端側会話装置に受信されるようにすればよい。
【0073】
また、上述の各実施形態では、音声のみを用いた遠隔会話装置、および、遠隔会話システムを示したが、遠端側に映像を撮影する機能を備え、近端側に当該映像を再生する機能を備えることによって、より臨場感のある会話を実現できる。
【0074】
また、上述の各実施形態では、遠端側会話装置20が静止している態様を示したが、遠端側会話装置20は移動可能であってもよい。この場合、移動した位置に応じたフィルタ処理が実行され、それぞれの位置に応じて、臨場感のある会話を実現できる。
【0075】
また、上述の各実施形態では、近端側会話装置と遠端側会話装置とで個別の機能を有する態様を示した。しかしながら、上述の近端側会話装置の機能と遠端側会話装置の機能とは、1個の会話装置に備えさせることも可能である。これにより、近端側と遠端側とで同様の処理および作用効果を実現できる。
【0076】
また、上述の説明では、遠端側の遠隔会話装置としてロボット等を用いる態様を示した。しかしながら、ロボットに限らず、据え置き型の遠隔会話装置であってもよく、携帯通信端末等のポータブル型の遠隔会話装置であってもよい。また、例えば、所定の筐体に備え付けられたマイクロホンとスピーカを含む態様であってもよく、例えば、自動車に備え付けられたマイクロホンとスピーカを含む態様であってもよい。
【0077】
また、これらの携帯通信端末等のポータブル型の遠隔会話装置、自動車に備え付けられた遠隔会話装置の構成は、遠端側の遠隔会話装置に限るものではなく、近端側の遠隔会話装置に適用することも可能である。