特許第6977772号(P6977772)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤマハ株式会社の特許一覧

特許6977772音声処理方法、音声処理装置、ヘッドセット、および、遠隔会話システム
<>
  • 特許6977772-音声処理方法、音声処理装置、ヘッドセット、および、遠隔会話システム 図000002
  • 特許6977772-音声処理方法、音声処理装置、ヘッドセット、および、遠隔会話システム 図000003
  • 特許6977772-音声処理方法、音声処理装置、ヘッドセット、および、遠隔会話システム 図000004
  • 特許6977772-音声処理方法、音声処理装置、ヘッドセット、および、遠隔会話システム 図000005
  • 特許6977772-音声処理方法、音声処理装置、ヘッドセット、および、遠隔会話システム 図000006
  • 特許6977772-音声処理方法、音声処理装置、ヘッドセット、および、遠隔会話システム 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6977772
(24)【登録日】2021年11月15日
(45)【発行日】2021年12月8日
(54)【発明の名称】音声処理方法、音声処理装置、ヘッドセット、および、遠隔会話システム
(51)【国際特許分類】
   H04R 3/02 20060101AFI20211125BHJP
   H04R 1/10 20060101ALI20211125BHJP
【FI】
   H04R3/02
   H04R1/10 101A
【請求項の数】15
【全頁数】14
(21)【出願番号】特願2019-528292(P2019-528292)
(86)(22)【出願日】2017年7月7日
(86)【国際出願番号】JP2017024887
(87)【国際公開番号】WO2019008733
(87)【国際公開日】20190110
【審査請求日】2019年12月25日
【前置審査】
(73)【特許権者】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】110000970
【氏名又は名称】特許業務法人 楓国際特許事務所
(72)【発明者】
【氏名】鵜飼 訓史
(72)【発明者】
【氏名】村松 未輝雄
【審査官】 堀 洋介
(56)【参考文献】
【文献】 特開2013−055536(JP,A)
【文献】 特開2012−151745(JP,A)
【文献】 特開2013−038763(JP,A)
【文献】 特開2008−227775(JP,A)
【文献】 特開2012−094945(JP,A)
【文献】 特開2010−183434(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04R 3/02
H04R 1/10
(57)【特許請求の範囲】
【請求項1】
近端側の音声を収音して、収音信号を生成する近端側収音処理と、
遠端側の伝達特性を用いて前記収音信号を調整する近端側フィルタ処理と、
調整後の前記収音信号と、前記近端側の収音信号と異なる遠端側の音声信号と、を近端側スピーカから放音する近端側放音処理と、
を行い、
近端側マイクロホンと近端側スピーカとの位置関係による近端側の伝達特性と、遠端側マイクロホンと遠端側スピーカとの位置関係による遠端側の伝達特性との差を相殺する伝達差調整処理を前記収音信号に対して行い、
前記伝達差調整処理を行った収音信号に対して、前記近端側フィルタ処理を行う、
音声処理方法。
【請求項2】
前記遠端側の伝達特性を取得する伝達特性取得処理を、
行う、請求項1に記載の音声処理方法。
【請求項3】
前記伝達特性取得処理は、逐次的に前記伝達特性を取得し、
前記近端側フィルタ処理は、前記逐次的に取得した前記伝達特性を用いて、前記収音信号を調整する、
請求項2に記載の音声処理方法。
【請求項4】
前記近端側フィルタ処理は、
前記近端側スピーカから近端側マイクロホンに回り込む前記遠端側の音声信号を前記収音信号から抑圧して、抑圧後の収音信号とフィルタ係数とを出力する、
請求項1乃至請求項3のいずれかに記載の音声処理方法。
【請求項5】
遠端側スピーカで近端側の収音信号を放音する遠端側放音処理と、
遠端側で収音し、前記遠端側放音処理で放音した音を含む遠端側の収音信号を生成する遠端側音声信号生成処理と、
遠端側マイクロホンに回り込む前記近端側の収音信号を前記遠端側の収音信号から抑圧して、前記遠端側の音声信号とフィルタ係数とを出力する遠端側フィルタ処理と、
を行う、
請求項1乃至請求項4のいずれかに記載の音声処理方法。
【請求項6】
近端側の音声を収音して、収音信号を生成する近端側マイクロホンと、
遠端側の伝達特性を用いて前記収音信号を調整する近端側フィルタと、
調整後の前記収音信号と、前記近端側の収音信号と異なる遠端側の音声信号と、を放音する近端側スピーカと、
を備え、
前記近端側マイクロホンと前記近端側スピーカとの位置関係による近端側の伝達特性と、遠端側マイクロホンと遠端側スピーカとの位置関係による遠端側の伝達特性との差を相殺するフィルタ処理を実行する伝達差調整フィルタを、さらに備え、
前記伝達差調整フィルタは、前記収音信号に対してフィルタ処理を実行し、
前記近端側フィルタは、前記伝達差調整フィルタでフィルタ処理した収音信号を調整する、
音声処理装置。
【請求項7】
前記遠端側の伝達特性を取得する伝達特性取得部を、
備える、請求項6に記載の音声処理装置。
【請求項8】
前記伝達特性取得部は、逐次的に前記伝達特性を取得し、
前記近端側フィルタは、前記逐次的に取得した前記伝達特性を用いて、前記収音信号を調整する、
請求項7に記載の音声処理装置。
【請求項9】
前記近端側フィルタは、
前記近端側スピーカから前記近端側マイクロホンに回り込む前記遠端側の音声信号を前記収音信号から抑圧して、抑圧後の収音信号とフィルタ係数とを出力する、
請求項6乃至請求項8のいずれかに記載の音声処理装置。
【請求項10】
請求項6乃至請求項9のいずれかに記載の音声処理装置が装着され
前記近端側スピーカは、
右用スピーカと左用スピーカとを備えるステレオスピーカであり、
前記近端側スピーカと前記近端側マイクロホンとが所定の位置関係で固定されている、
ヘッドセット。
【請求項11】
請求項6乃至請求項10のいずれかに記載の音声処理装置と、前記遠端側に配置され、前記音声処理装置と通信する遠端側会話装置と、を備え、
前記遠端側会話装置は、
前記近端側の前記収音信号を放音する遠端側スピーカと、
前記遠端側で収音し、前記遠端側スピーカが放音した音を含む遠端側の収音信号を生成する遠端側マイクロホンと、
前記遠端側スピーカから前記遠端側マイクロホンに回り込む前記近端側の前記収音信号を前記遠端側の収音信号から抑圧する遠端側フィルタと、
を備え、
前記伝達特性は、前記遠端側フィルタのフィルタ係数である、
遠隔会話システム。
【請求項12】
前記近端側フィルタは、
前記近端側の前記収音信号に対して前記フィルタ係数を用いた畳み込み演算を行うことで、前記近端側の前記収音信号を調整する、
請求項11に記載の遠隔会話システム。
【請求項13】
前記遠端側会話装置は、
前記遠端側の音声信号と前記フィルタ係数とを組にして前記音声処理装置に送信する、
請求項11または請求項12に記載の遠隔会話システム。
【請求項14】
前記近端側スピーカは、第1のスピーカと第2のスピーカを有し、
前記第1のスピーカと前記第2のスピーカとの組は、ステレオスピーカを構成しており、
前記遠端側マイクロホンは、第1のマイクロホンと第2のマイクロホンとを有し、
前記第1のマイクロホンと前記第2のマイクロホンとの組は、ステレオマイクを構成しており、
前記第1のマイクロホンに対応する前記伝達特性は、前記第1のスピーカで放音される前記収音信号に用いられ、
前記第2のマイクロホンに対応する前記伝達特性は、前記第2のスピーカで放音される前記収音信号に用いられている、
請求項11乃至請求項13のいずれかに記載の遠隔会話システム。
【請求項15】
前記第1のスピーカと前記第2のスピーカとは、前記近端側マイクロホンの位置を通り上下方向に延びる直線を挟んで、当該直線における互いに異なる側に配置されており、
前記第1のマイクロホンと前記第2のマイクロホンとは、前記遠端側スピーカの位置を通り上下方向に延びる直線を挟んで、当該直線における互いに異なる側に配置されている、
請求項14に記載の遠隔会話システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、近端側と遠端側との間で通信を介した会話を行う遠隔会話装置、ヘッドセット、遠隔会話システム、および、遠隔会話方法に関する。
【背景技術】
【0002】
特許文献1、2には、遠端側(再現環境)の音場を近端側で再現する装置および方法が記載されている。特許文献1、2では、遠端側において、複数のスピーカと複数のマイクとを配置する。遠端側において、複数のスピーカで放音し、この音を複数のマイクで収音することで、遠端側の伝達特性を取得する。
【0003】
特許文献1の装置および方法は、遠端側で得た収音信号を伝達係数によって調整し、ユーザを取り囲むように配置した複数のスピーカから放音する。
【0004】
特許文献2の装置および方法は、ユーザを取り囲むように複数のマイクと複数のスピーカとを設置している。特許文献2の装置および方法は、ユーザを取り囲むように配置した複数のマイクでユーザの音声を収音する。特許文献2の装置および方法は、収音したユーザの音声を伝達係数を用いて調整し、ユーザを取り囲むように配置した複数のスピーカから放音する。
【0005】
このように、特許文献1、2では、音場を再現できる程度の多くの数のマイクとスピーカとを予め設置し、伝達特性を取得している。また、特許文献1、2では、音場の再現時には、伝達特性の取得時と同じ数のスピーカを、伝達特性の取得時と同じ位置に配置している。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】国際公開第2014/069111号明細書
【特許文献2】国際公開第2014/069112号明細書
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1、2に記載の装置および方法では、近端側と遠端側とで会話を行う場合に、近端側の話者が遠端側の話者と遠端側において会話している感覚を、容易な構成で実現できない。
【0008】
したがって、本発明の目的は、近端側の話者が遠端側において遠端側の話者と会話している感覚を、近端側において簡素な構成で実現する遠隔会話装置、遠隔会話システム、および、遠隔会話方法を提供することにある。
【課題を解決するための手段】
【0009】
この発明の遠隔会話装置は、近端側マイクロホン、伝達特性取得部、近端側フィルタ、および、近端側スピーカを備える。近端側マイクロホンは、近端側の音声を取得し、収音信号を生成する。伝達特性取得部は、遠端側の伝達特性を取得する。近端側フィルタは、伝達特性を用いて収音信号を調整する。近端側スピーカは、遠端側の音声信号と調整後の収音信号とを放音する。
【0010】
この構成の遠隔会話装置、近端側と遠端側との会話を実現しながら、遠端側の伝達特性を用いて、近端側の収音信号を調整する。これにより、近端側の話者は、遠端側の話者の声とともに、遠端側の音響に応じた自分の声を聞ける。
【発明の効果】
【0011】
この発明の遠隔会話装置は、近端側の話者が遠端側において遠端側の話者と会話している感覚を、近端側において簡素な構成で実現できる。
【図面の簡単な説明】
【0012】
図1】本発明の第1の実施形態に係る遠隔会話装置および遠隔会話システムの構成を示すブロック図である。
図2】近端側のマイクロホンとスピーカとの配置を示す図である。
図3】遠端側のマイクロホンとスピーカとの配置を示す図である。
図4】本発明の第1の実施形態に係る遠隔会話方法を示すフローチャートである。
図5】伝達特性の取得方法を示すフローチャートである。
図6】本発明の第2の実施形態に係る遠隔会話装置の構成を示すブロック図である。
【発明を実施するための形態】
【0013】
本発明の第1の実施形態に係る遠隔会話装置、遠隔会話方法、および、遠隔会話システムについて、図を参照して説明する。図1は、本発明の第1の実施形態に係る遠隔会話装置および遠隔会話システムの構成を示すブロック図である。図2は、近端側のマイクロホンとスピーカとの配置を示す図である。図3は、遠端側のマイクロホンとスピーカとの配置を示す図である。
【0014】
図1に示すように、遠隔会話システム1は、近端側会話装置10と遠端側会話装置20とを備える。近端側会話装置10が本発明の「遠隔会話装置」に対応する。近端側会話装置10と遠端側会話装置20とは、無線または有線で通信を行う。なお、本発明で言う、遠隔会話とは、通常の会話に限るものではなく、遠隔地間の会議等、遠隔地間で音声のやり取りを行うものを含む。
【0015】
近端側会話装置10は、マイクロホン11、送信部12、受信部13、近端側フィルタ14、および、スピーカ15を備える。近端側フィルタ14は、フィルタ141とフィルタ142とを備える。スピーカ15は、スピーカ151とスピーカ152とを有し、ステレオスピーカを構成している。送信部12、受信部13、および、近端側フィルタ14は、信号処理部B10を構成している。信号処理部B10は、送信部12、受信部13、および、近端側フィルタ14のそれぞれの機能を実行するIC等のハードウエアによって実現されている。
【0016】
図2に示すように、マイクロホン11、スピーカ151、および、スピーカ152は、ヘッドセットを構成している。信号処理部B10は、ヘッドセットに装着されており、マイクロホン11、スピーカ151、および、スピーカ152に接続している。
【0017】
マイクロホン11は、ヘッドセットの横方向の略中央位置で、且つ、上下方向の下側の位置に配置されている。マイクロホン11は、ヘッドセットの中央側に収音指向性の中心を向けて配置されている。
【0018】
スピーカ151は、ヘッドセットの横方向の第1端に配置されており、スピーカ152は、ヘッドセットの横方向の第2端に配置されている。言い換えれば、スピーカ151とスピーカ152とは、マイクロホン11を通り上下方向に延びる直線を基準にして線対称の位置に配置されている。スピーカ151とスピーカ152は、ヘッドセットの中央側に放音指向性の中心を向けて配置されている。
【0019】
近端側のユーザ91がヘッドセットを装着すると、マイクロホン11はユーザ91の口911の近くに配置される。これにより、ユーザ91が発声すると、マイクロホン11は、この音声を収音する。
【0020】
スピーカ151は、ユーザ91に左耳915Lに装着され、スピーカ152は、ユーザ91の右耳915Rに装着される。これにより、ユーザ91は、スピーカ151から放音された音声を左耳915Lで聞き、スピーカ152から放音された音声を右耳915Rで聞くことができる。
【0021】
信号処理部B10は、ヘッドセットに装着されており、マイクロホン11、スピーカ151、および、スピーカ152に接続している。
【0022】
マイクロホン11は、ユーザ91の音声を収音して、収音信号S11を生成する。マイクロホン11は、収音信号S11を、近端側フィルタ14のフィルタ141、142と送信部12とに出力する。
【0023】
送信部12は、収音信号S11を、通信信号S12に変換して、遠端側会話装置20の受信部21に送信する。
【0024】
受信部13は、後述の遠端側会話装置20からの通信信号S25を受信する。受信部13は、通信信号S25から、放音信号S131、S132、フィルタ係数Co131、Co132を復調する。したがって、受信部13は、本発明の「伝達特性取得部」の機能を有する。受信部13は、放音信号S131をスピーカ151に出力し、放音信号S132をスピーカ152に出力する。受信部13は、フィルタ係数Co131をフィルタ141に出力し、フィルタ係数Co132をフィルタ142に出力する。
【0025】
なお、詳細は後述するが、放音信号S131は、遠端側会話装置20のマイクロホン231で収音され、エコーキャンセラ241でエコーキャンセル処理された音声信号である。放音信号S132は、遠端側会話装置20のマイクロホン232で収音され、エコーキャンセラ242でエコーキャンセル処理された音声信号である。フィルタ係数Co131は、エコーキャンセラ241のフィルタ係数Co241と同じであり、フィルタ係数Co132は、エコーキャンセラ241のフィルタ係数Co242と同じである。これら、フィルタ係数Co131、Co132、Co241、Co242が、本発明の「伝達特性」に対応する。
【0026】
フィルタ141は、フィルタ係数Co131を用いて、収音信号S11をフィルタ処理する。フィルタ141は、例えば、IIRフィルタによって構成されており、収音信号S11に対して、フィルタ係数Co131を用いた畳み込み演算を行うことによって、フィルタ処理を実行する。フィルタ141は、このフィルタ処理後の収音信号(調整後の収音信号)S141を、スピーカ151に出力する。
【0027】
フィルタ142は、フィルタ係数Co132を用いて、収音信号S11をフィルタ処理する。フィルタ142は、例えば、IIRフィルタによって構成されており、収音信号S11に対して、フィルタ係数Co132を用いた畳み込み演算を行うことによって、フィルタ処理を実行する。フィルタ142は、このフィルタ処理後の収音信号(調整後の収音信号)S142を、スピーカ152に出力する。
【0028】
このような処理を行うことによって、フィルタ処理後の収音信号S141、S142は、遠端側の音場の伝達特性に応じた音声信号となる。
【0029】
スピーカ151は、放音信号S131とフィルタ処理後の収音信号S141とを放音する。スピーカ152は、放音信号S132とフィルタ処理後の収音信号S142とを放音する。
【0030】
このように、近端側会話装置10を用いることによって、近端側のユーザ91は、遠端側の音場の伝達特性で自分の声を聞きながら、遠端側のユーザ92の音声を聞くことができる。したがって、近端側のユーザ91は、あたかも遠端側に居て、遠端側のユーザ92と会話しているような感覚、すなわち会話の臨場感を得ることができる。
【0031】
そして、この構成を用いれば、近端側に1個のマイクロホンと2個のスピーカを備えればよく、遠端側の音場の伝達特性を実現するための大掛かりな構成を近端側に必要としない。したがって、簡素な構成で、離れた場所間での臨場感の有る会話を実現できる。
【0032】
この際、遠端側会話装置20は、例えば、具体的に次の構成および処理を実現すればよい。
【0033】
遠端側会話装置20は、受信部21、スピーカ22、マイクロホン231、マイクロホン232、遠端側フィルタ24、および、送信部25を備える。遠端側フィルタ24は、エコーキャンセラ241とエコーキャンセラ242とを備える。マイクロホン231とマイクロホン232とは、ステレオマイクを構成している。受信部21、遠端側フィルタ24、および、送信部25は、信号処理部B20を構成している。信号処理部B20は、受信部21、遠端側フィルタ24、および、送信部25のそれぞれの機能を実行するIC等のハードウエアによって実現されている。
【0034】
図3に示すように、スピーカ22、マイクロホン231、マイクロホン232、および、信号処理部B20は、顔型のロボット200に実装されている。なお、必ずしも、顔型のロボット200である必要はなく、少なくとも、スピーカ22、マイクロホン231、および、マイクロホン232を所定の位置関係に保持できればよい。信号処理部B20は、スピーカ22、マイクロホン231、および、マイクロホン232に接続している。
【0035】
スピーカ22は、ロボット200の横方向の略中央位置で、且つ、上下方向の下側の位置に配置されている。スピーカ22は、ロボット200の正面側に放音指向性の中心を向けて配置されている。
【0036】
マイクロホン231は、ロボット200の横方向の第1端に配置されており、マイクロホン232は、ロボット200の横方向の第2端に配置されている。言い換えれば、マイクロホン231とマイクロホン232とは、スピーカ22を通り上下方向に延びる直線を基準にして線対称の位置に配置されている。マイクロホン231とマイクロホン232とは、ロボット200の正面側に収音指向性の中心を向けて配置されている。
【0037】
すなわち、スピーカ22とマイクロホン231との位置関係は、近端側のマイクロホン11とスピーカ151との位置関係に対応している。さらに、スピーカ22とマイクロホン232との位置関係は、近端側のマイクロホン11とスピーカ152との位置関係に対応している。
【0038】
受信部21は、近端側会話装置10の送信部12からの通信信号S12を受信し、遠端側放音信号S21を復調する。遠端側放音信号S21は、近端側の収音信号S11と同じ音声信号である。受信部21は、遠端側放音信号S21を、スピーカ22とエコーキャンセラ241、242とに出力する。スピーカ22は、遠端側放音信号S21を放音する。
【0039】
マイクロホン231およびマイクロホン232は、遠端側のユーザ92の音声を収音する。この際、マイクロホン231は、音声エコーSE22Rを収音し、マイクロホン232は、音声エコーSE22Lを収音してしまう。
【0040】
音声エコーSE22Rは、スピーカ22とマイクロホン231との位置関係、スピーカ22の放音指向性、マイクロホン231の収音指向性、および、遠端側の音響特性によって、特性が決まるエコーである。音声エコーSE22Lは、スピーカ22とマイクロホン232との位置関係、スピーカ22の放音指向性、マイクロホン232の収音指向性、および、遠端側の音響特性によって、特性が決まるエコーである。すなわち、音声エコーSE22R、音声エコーSE22Lは、遠端側の音場の伝達特性によって、特性が決定される。
【0041】
マイクロホン231は、収音した音声およびエコーを含む収音信号S231を生成して、エコーキャンセラ241に出力する。マイクロホン232は、収音した音声およびエコーを含む収音信号S232を生成して、エコーキャンセラ242に出力する。
【0042】
エコーキャンセラ241は、既知のエコーキャンセル技術を用いて、収音信号S231に対してエコーキャンセル処理を実行する。この処理によって、エコーキャンセラ241は、収音信号S231に含まれる音声エコーSE22Rを抑圧する。エコーキャンセラ241は、このエコーキャンセル後の収音信号S241を、送信部25に出力する。また、エコーキャンセラ241は、エコーキャンセル処理に利用したフィルタ係数Co241を送信部25に出力する。
【0043】
エコーキャンセラ242は、既知のエコーキャンセル技術を用いて、収音信号S232に対してエコーキャンセル処理を実行する。この処理によって、エコーキャンセラ242は、収音信号S232に含まれる音声エコーSE22Lを抑圧する。エコーキャンセラ241は、このエコーキャンセル後の収音信号S242を、送信部25に出力する。
【0044】
また、エコーキャンセラ242は、エコーキャンセル処理に利用したフィルタ係数Co242を送信部25に出力する。
【0045】
送信部25は、収音信号S241、S242と、フィルタ係数Co241、Co241とを組にして、これらを通信信号S25に変換して、近端側会話装置10の受信部13に送信する。
【0046】
この収音信号S241は、上述の近端側会話装置10の放音信号S131として復調され、収音信号S242は、上述の近端側会話装置10の放音信号S132として復調される。また、フィルタ係数Co241は、上述の近端側会話装置10のフィルタ係数Co131として復調され、フィルタ係数Co242は、上述の近端側会話装置10のフィルタ係数Co132として復調される。そして、上述した近端側会話装置10の処理が実行される。
【0047】
このような構成の遠隔会話システム1を用いることによって、遠端側のユーザ92の音声は、エコーキャンセルされた鮮明な音声として、近端側のユーザ91に放音される。したがって、近端側のユーザ91は、あたかも遠端側に居て、遠端側のユーザ92と会話しているような会話の臨場感を得ながら、遠端側のユーザ92の音声を鮮明に聞き取ることができる。
【0048】
そして、この構成を用いれば、遠端側に1個のスピーカと2個のマイクロホンを備えればよく、遠端側の音場の伝達特性を実現するための大掛かりな構成を遠端側にも必要としない。したがって、遠隔会話システム1としても、簡素な構成で、離れた場所間での臨場感の有る会話を実現できる。
【0049】
また、この構成では、遠端側のエコーキャンセラ241のフィルタ係数Co241を、近端側のフィルタ141のフィルタ係数Co131として利用でき、遠端側のエコーキャンセラ242のフィルタ係数Co242を、近端側のフィルタ142のフィルタ係数Co132として利用できる。したがって、複雑な処理を行うことなく、離れた場所間での臨場感の有る会話を実現できる。
【0050】
なお、フィルタ係数Co131は、フィルタ係数Co241と同じでなくてもよく、フィルタ係数Co241を基に設定されたものであってもよい。フィルタ係数Co132は、フィルタ係数Co242と同じでなくてもよく、フィルタ係数Co241を基に設定されたものであってもよい。
【0051】
また、本実施形態では、フィルタ係数を用いて、近端側の収音信号S11を調整する態様を示したが、遠端の音場の伝達特性を表す数値であれば、フィルタ係数に代えて用いることができる。具体的には、インパルス応答そのものまたはインパルス応答に代用できるものであればよい。インパルス応答の場合、遠端側において、スピーカとマイクロホンを用いて、インパルス応答を測定し、当該インパルス応答を用いて、近端側で収音信号に対して畳み込み処理を行えばよい。
【0052】
また、上述の説明では、1回の音声の送受信の場合を示した。しかしながら、会話を継続する際には、複数回の音声の送受信を行う。このように複数回の音声の送受信を行う場合には、送受信毎に遠端側会話装置20からフィルタ係数Co241、Co242を取得し、近端側会話装置10のフィルタ係数Co131、Co132を、この送受信に合わせて逐次的に更新すればよい。これにより、会話を行っている時間における遠端側の音場の伝達特性を、近端側において、さらに忠実に再現できる。したがって、近端側のユーザ91は、さらに臨場感の有る会話を実現できる。
【0053】
この際、遠端側の音場の伝達特性として遠端側のフィルタ係数Co241、Co242を用いることによって、通信されるデータ量を小さくできる。これにより、近端側のフィルタ141、142におけるフィルタ処理の時間遅れを抑制できる。したがって、時間遅れを殆ど発生することなく、遠端側の音場の伝達特性を、近端側において再現でき、さらに臨場感の有る会話を実現できる。
【0054】
上述の説明では、近端側会話装置10および遠隔会話システム1の処理のそれぞれを機能ブロック毎に実行する態様を示した。しかしながら、次のフローチャートに示す方法をプログラム化しておき、当該プログラムを、情報処理装置(例えばCPU)等の適切なハードウエアで実行することでも、上述の会話を実現できる。
【0055】
図4は、本発明の第1の実施形態に係る近端側会話装置で実行する遠隔会話方法を示すフローチャートである。
【0056】
近端側会話装置は、近端側のユーザの音声を収音し、収音信号を生成する(S101)。この処理は「近端側収音処理」に対応する。
【0057】
近端側会話装置は、遠端側の伝達特性を取得する(S102)。この処理は「伝達特性取得処理」に対応する。遠端側の伝達特性の取得方法としては、例えば、図5に示す方法を用いればよい。図5は、伝達特性の取得方法を示すフローチャートである。
【0058】
近端側会話装置は、近端側の収音信号を、遠端側会話装置に送信する(S201)。遠端側会話装置は、近端側の収音信号を放音する(S202)。この処理は「遠端側放音処理」に対応する。遠端側会話装置は、遠端側で収音して遠端側の収音信号を生成する。この処理は「遠端側収音処理」に対応する。遠端側会話装置は、近端側の収音信号に起因するエコーを抑圧するエコーキャンセル処理を実行する(S203)。この処理は「遠端側フィルタ処理」に対応する。遠端側会話装置は、エコーキャンセルのフィルタ係数を、近端側会話装置に送信する(S204)。近端側会話装置は、遠端側のフィルタ係数を受信し、遠端側の伝達特性とする(S205)。これらの処理により、近端側会話装置は、遠端側の伝達特性を取得できる。
【0059】
近端側会話装置は、遠端側の伝達特性を用いて、ステップS101で取得した収音信号を調整する(S103)。この処理は「近端側フィルタ処理」に対応する。近端側会話装置は、調整後の収音信号を近端側で放音する(S104)。この処理は「近端側放音処理」に対応する。
【0060】
このような遠隔会話方法を用いることによって、近端側のユーザは、遠端側の音場の伝達特性で自分の声を聞きながら、遠端側のユーザと臨場感のある会話を実現できる。
【0061】
なお、上述の説明では、近端側において、1個のマイクロホンと2個のスピーカとが配置され、遠端側において、1個のスピーカと2個のマイクロホンとが配置される態様を示した。しかしながら、マイクロホンの個数とスピーカの個数とは、これに限るものではない。この際、マイクロホンの個数とスピーカの個数は、多すぎない方が好ましい。ただし、上述の説明のように、近端側において、スピーカを2個としてステレオスピーカを構成し、遠端側において、マイクロホンを2個としてステレオマイクロホンを構成することによって、マイクロホンの個数とスピーカの個数とを少なく抑えながら、臨場感を得ることができ、有効である。この場合、通信されるフィルタ係数が少なく、遠端側のフィルタ係数を近端側に高速に送信できる。したがって、近端側でのフィルタ係数を殆ど遅延させることなく設定でき、リアルタイム性が重要な遠隔会話システムにとっては、より有効である。
【0062】
また、近端側のマイクロホンの個数と遠端側のスピーカの個数は同じであり、近端側のスピーカの個数と遠端側のマイクロホンの個数は同じであることが好ましい。さらに、近端側におけるマイクロホンに対するスピーカの配置と、遠端側におけるスピーカに対するマイクロホンの配置とは、同じであることが好ましい。これにより、遠端側のフィルタ係数は、近端側のフィルタ係数として容易に利用可能になる。したがって、近端側でのフィルタ係数の決定を速くでき、リアルタイム性が重要な遠隔会話システムにとっては、より有効である。
【0063】
なお、近端側におけるマイクロホンに対するスピーカの配置と、遠端側におけるスピーカに対するマイクロホンの配置とが異なる場合には、次に示す第2の実施形態に係る構成を用いるとよい。
【0064】
図6は、本発明の第2の実施形態に係る遠隔会話装置の構成を示すブロック図である。図6に示すように、第2の実施形態に係る近端側会話装置10Aは、第1の実施形態に係る近端側会話装置10に対して、近端側フィルタ14Aの構成において異なる。近端側会話装置10Aの他の構成は、近端側会話装置10と同様であり、同様の箇所の説明は省略する。
【0065】
近端側フィルタ14Aは、フィルタ141、フィルタ142、伝達差調整フィルタ143、および、伝達差調整フィルタ144を備える。フィルタ141、フィルタ142は、第1の実施形態に係る近端側フィルタ14を構成するフィルタと同じである。
【0066】
伝達差調整フィルタ143のフィルタ係数は、近端側のマイクロホン11とスピーカ151との伝達特性と、遠端側のスピーカ22とマイクロホン231との伝達特性との差を相殺する値に設定されている。
【0067】
伝達差調整フィルタ144のフィルタ係数は、近端側のマイクロホン11とスピーカ152との間の伝達特性と、遠端側のスピーカ22とマイクロホン232との間の伝達特性との差を相殺する値に設定されている。
【0068】
伝達差調整フィルタ143、144のフィルタ係数は、ヘッドセットにおけるマイクロホン11とスピーカ151、152との位置関係、収音指向性、および、放音指向性と、ロボット200におけるスピーカ22とマイクロホン231、232との位置関係、放音指向性、および、収音指向性との差から、予め推定算出できる。
【0069】
伝達差調整フィルタ143は、収音信号S11をフィルタ処理し、フィルタ141に出力する。フィルタ141は、伝達差調整フィルタ143でフィルタ処理された収音信号S11をフィルタ処理し、スピーカ151に出力する。
【0070】
伝達差調整フィルタ144は、収音信号S11をフィルタ処理し、フィルタ142に出力する。フィルタ142は、伝達差調整フィルタ144でフィルタ処理された収音信号S11をフィルタ処理し、スピーカ152に出力する。
【0071】
このような構成および処理を行うことによって、近端側会話装置10Aは、遠端側の音場の伝達特性を更に忠実に再現できる。したがって、近端側のユーザは、遠端側のユーザとさらに臨場感のある会話を実現できる。
【0072】
なお、上述の実施形態では遠端側のフィルタ係数と遠端側の収音信号とを組にして通信する態様を示したが、遠端側のフィルタ係数と遠端側の収音信号とを別の経路で通信してもよい。この場合、遠端側のフィルタ係数が、遠端側の収音信号よりも速く、近端側会話装置に受信されるようにすればよい。
【0073】
また、上述の各実施形態では、音声のみを用いた遠隔会話装置、および、遠隔会話システムを示したが、遠端側に映像を撮影する機能を備え、近端側に当該映像を再生する機能を備えることによって、より臨場感のある会話を実現できる。
【0074】
また、上述の各実施形態では、遠端側会話装置20が静止している態様を示したが、遠端側会話装置20は移動可能であってもよい。この場合、移動した位置に応じたフィルタ処理が実行され、それぞれの位置に応じて、臨場感のある会話を実現できる。
【0075】
また、上述の各実施形態では、近端側会話装置と遠端側会話装置とで個別の機能を有する態様を示した。しかしながら、上述の近端側会話装置の機能と遠端側会話装置の機能とは、1個の会話装置に備えさせることも可能である。これにより、近端側と遠端側とで同様の処理および作用効果を実現できる。
【0076】
また、上述の説明では、遠端側の遠隔会話装置としてロボット等を用いる態様を示した。しかしながら、ロボットに限らず、据え置き型の遠隔会話装置であってもよく、携帯通信端末等のポータブル型の遠隔会話装置であってもよい。また、例えば、所定の筐体に備え付けられたマイクロホンとスピーカを含む態様であってもよく、例えば、自動車に備え付けられたマイクロホンとスピーカを含む態様であってもよい。
【0077】
また、これらの携帯通信端末等のポータブル型の遠隔会話装置、自動車に備え付けられた遠隔会話装置の構成は、遠端側の遠隔会話装置に限るものではなく、近端側の遠隔会話装置に適用することも可能である。
【符号の説明】
【0078】
1:遠隔会話システム
10、10A:近端側会話装置
11:マイクロホン
12:送信部
13:受信部
14、14A:近端側フィルタ
15:スピーカ
20:遠端側会話装置
21:受信部
22:スピーカ
24:遠端側フィルタ
25:送信部
91、92:ユーザ
141、142:フィルタ
143、144:伝達差調整フィルタ
151、152:スピーカ
200:ロボット
231、232:マイクロホン
241:Co
241:エコーキャンセラ
242:Co
242:エコーキャンセラ
911:口
915L:左耳
915R:右耳
B10、B20:信号処理部
Co131、Co132:フィルタ係数
Co241、Co242:フィルタ係数
S11:収音信号
S12:通信信号
S131:放音信号
S132:放音信号
S141:収音信号
S142:収音信号
S21:遠端側放音信号
S231:収音信号
S232:収音信号
S241:収音信号
S242:収音信号
S25:通信信号
SE22L:音声エコー
SE22R:音声エコー
図1
図2
図3
図4
図5
図6