特開2024-162395 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＪＸ日鉱日石エネルギー株式会社の特許一覧 ▶ ＮＴＴソノリティ株式会社の特許一覧

特開2024-162395通話制御装置、通話制御方法、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024162395

(43)【公開日】2024-11-21

(54)【発明の名称】通話制御装置、通話制御方法、およびプログラム

(51)【国際特許分類】

H04R 3/02 20060101AFI20241114BHJP

H04M 1/00 20060101ALI20241114BHJP

【ＦＩ】

H04R3/02

H04M1/00 H

【審査請求】未請求

【請求項の数】13

【出願形態】ＯＬ

(21)【出願番号】P 2023077854

(22)【出願日】2023-05-10

(71)【出願人】

【識別番号】000004444

【氏名又は名称】ＥＮＥＯＳ株式会社

(71)【出願人】

【識別番号】522237542

【氏名又は名称】ＮＴＴソノリティ株式会社

(74)【代理人】

【識別番号】100121706

【弁理士】

【氏名又は名称】中尾直樹

(74)【代理人】

【識別番号】100128705

【弁理士】

【氏名又は名称】中村幸雄

(74)【代理人】

【識別番号】100147773

【弁理士】

【氏名又は名称】義村宗洋

(72)【発明者】

【氏名】咲間修平

(72)【発明者】

【氏名】門脇正天

(72)【発明者】

【氏名】小林和則

(72)【発明者】

【氏名】滝澤拓斗

(72)【発明者】

【氏名】柿山陽一郎

【テーマコード（参考）】

5D220

5K127

【Ｆターム（参考）】

5D220CC01

5K127BB02

5K127BB03

5K127MA02

5K127MA06

(57)【要約】

【課題】通話においてエコーキャンセル処理を行うことなく、音響エコーを低減させる。
【解決手段】通話制御装置は、送話信号を得るためのマイクロホンの使用の状態を判定するか、または、マイクロホンで集音された音響信号に基づいて発話の状態を判定する。さらに通話制御装置は、マイクロホンが使用されている時間区間、または、発話が行われている時間区間の何れかである制限区間では、第１スピーカからの第１受話信号の再生を制限し、第２スピーカから第２受話信号を再生し、制限区間以外の時間区間である非制限区間では、第１スピーカから第１受話信号を再生し、第２スピーカから第２受話信号を再生する。ここで、第２スピーカの音放出位置からマイクロホンの受音位置までの間での音の減衰量は、第１スピーカの音放出位置からマイクロホンの受音位置までの間での音の減衰量よりも大きい。
【選択図】図３

【特許請求の範囲】

【請求項1】

送話信号を得るためのマイクロホンの使用の状態を判定するか、または、前記マイクロホンで集音された音響信号に基づいて発話の状態を判定する判定部と、
前記マイクロホンが使用されている時間区間、または、前記発話が行われている時間区間の何れかである制限区間では、第１スピーカからの第１受話信号の再生を制限し、第２スピーカから第２受話信号を再生し、前記制限区間以外の時間区間である非制限区間では、前記第１スピーカから前記第１受話信号を再生し、前記第２スピーカから前記第２受話信号を再生する受話制御部と、を有し、
前記第２スピーカの音放出位置から前記マイクロホンの受音位置までの間での音の減衰量は、前記第１スピーカの音放出位置から前記マイクロホンの受音位置までの間での音の減衰量よりも大きい、通話制御装置。

【請求項2】

請求項１の通話制御装置であって、
前記判定部は、前記発話の状態を判定し、
前記制限区間は、前記発話が行われている時間区間である、通話制御装置。

【請求項3】

請求項２の通話制御装置であって、
前記制限区間において前記送話信号を送信し、前記非制限区間において前記送話信号の送信を制限する送話制御部をさらに有する、通話制御装置。

【請求項4】

請求項２の通話制御装置であって、
前記判定部は、
（１）前の時間区間が前記制限区間である場合、前記第１受話信号に基づく推定回り込み信号を考慮することなく、前記音響信号に基づく信号に基づいて前記発話の状態を判定し、
（２）前の時間区間が前記非制限区間である場合、前記音響信号に基づく信号から前記推定回り込み信号を減じて得られる推定送話信号に基づいて前記発話の状態を判定する、
通話制御装置。

【請求項5】

請求項２の通話制御装置であって、
前記判定部は、前記発話の状態と前記第１受話信号の大きさとを判定し、
前記制限区間は、前記発話が行われており、かつ、前記第１受話信号の大きさが第３基準値を超える時間区間である、通話制御装置。

【請求項6】

請求項２の通話制御装置であって、
前記マイクロホンは、身体を伝達した前記音響信号を集音するように構成されており、
前記判定部は、前記音響信号の高域周波数成分よりも低周波数成分を優先的に扱って前記発話の状態を判定し、
前記高域周波数は、前記低域周波数よりも高い、
通話制御装置。

【請求項7】

請求項２の通話制御装置であって、
前記マイクロホンは、身体を伝達した前記音響信号を集音するように構成されており、
前記判定部は、前記音響信号に基づく信号から前記第１受話信号に基づく推定回り込み信号を減じて得られる推定送話信号に基づいて前記発話の状態を判定し、
前記推定回り込み信号の低域周波数の成分が、高域周波数の成分よりも抑制されているか、または、前記推定回り込み信号の高域周波数の成分が、低域周波数の成分よりも増幅されており、
前記高域周波数は、前記低域周波数よりも高い、
通話制御装置。

【請求項8】

請求項７の通話制御装置であって、
前記音響信号に基づく信号は、前記音響信号の高域周波数成分よりも低周波数成分を優先的に扱って得られる信号である、通話制御装置。

【請求項9】

請求項１の通話制御装置であって、
前記マイクロホンは、身体を伝達した前記音響信号を集音するように構成されており、
前記送話信号は、前記音響信号の高域周波数の成分を低域周波数の成分よりも増幅して得られる信号に基づき、
前記高域周波数は、前記低域周波数よりも高く、
前記受話制御部は、前記制限区間において、前記第１受話信号の前記高域周波数の成分の再生を、前記第１受話信号の前記低域周波数の成分の再生よりも制限する、通話制御装置。

【請求項10】

請求項１の通話制御装置であって、
前記受話制御部は、前記制限区間では、さらに前記第２スピーカから前記第１受話信号を再生する、
通話制御装置。

【請求項11】

請求項１の通話制御装置であって、
前記第１スピーカは、外耳道に向けて装着されるように構成されており、
前記外耳道の中に装着されるように構成された耳内マイクロホンを前記マイクロホンとして設定するか、前記外耳道の外に配置されるように構成された外部マイクロホンを前記マイクロホンとして設定するかを切り替え可能であり、
前記制限区間は、前記耳内マイクロホンが前記マイクロホンとして設定され、かつ、前記マイクロホンが使用されている時間区間、または、前記耳内マイクロホンが前記マイクロホンとして設定され、かつ、前記マイクロホンで集音された音響信号に基づいて前記発話が行われていると判定された時間区間の何れかである、
通話制御装置。

【請求項12】

通話制御装置による通話制御方法であって、
送話信号を得るためのマイクロホンの使用の状態を判定するか、または、前記マイクロホンで集音された音響信号を用いて発話の状態を判定する判定ステップと、
前記マイクロホンが使用されている時間区間、または、前記発話が行われている時間区間の何れかである制限区間では、第１スピーカからの第１受話信号の再生を制限し、第２スピーカから第２受話信号を再生し、前記制限区間以外の時間区間である非制限区間では、前記第１スピーカから前記第１受話信号を再生し、前記第２スピーカから前記第２受話信号を再生する受話制御ステップと、を有し、
前記第２スピーカの音放出位置から前記マイクロホンの受音位置までの間での音の減衰量は、前記第１スピーカの音放出位置から前記マイクロホンの受音位置までの間での音の減衰量よりも大きい、通話制御方法。

【請求項13】

請求項１から１１の何れかの通話制御装置としてコンピュータを機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、通話技術に関し、特に音響エコーを抑制する技術に関する。

【背景技術】

【0002】

スピーカとマイクロホンを有し通話可能なイヤホンやヘッドホンでは、スピーカからマイクロホンに回り込む音（音響エコー）をキャンセルする必要がある。従来、音響エコーをキャンセルは、エコーキャンセラによるエコーキャンセル処理で行うのが一般的であった（例えば、非特許文献１等参照）。また、騒音環境下で通話を行うために耳内マイクロホンを用いる方法がある（例えば、非特許文献２等参照）。

【先行技術文献】

【非特許文献】

【0003】

【非特許文献1】羽田陽一，“：5-1 通信における音響エコー”，2011年11月，電子情報通信学会，「知識ベース知識の森 2群－6編－5章」，[2023年3月20日検索]，インターネット＜https://www.ieice-hbkb.org/files/02/02gun_06hen_05.pdf＞

【非特許文献2】“三洋・日鉄エレ、「耳でしゃべる」イヤホンマイク“ｅ耳くん”を発売”，[online]，2007年12月18日，日鉄エレックス，[2022年12月8日検索]，インターネット＜https://www.phileweb.com/news/d-av/200712/18/19995.html＞

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかし、騒音環境下で耳内マイクロホンを使う場合、耳内マイクロホンで集音される音響エコーのレベル（大きさ、例えば、振幅やパワー）は非常に大きく、これに比べて集音される装着者の音声のレベルは小さい。そのため、このような場合にエコーキャンセル処理を行うと、集音された音声に基づく送話信号が大きく劣化してしまう。また、エコーキャンセル処理の演算量は大きい。このような問題は、イヤホンやヘッドホンを使用したり、耳内マイクロホンを使用したりする場合に限定されるものではなく、通話においてエコーキャンセル処理を行う場合に共通するものである。

【0005】

このような点に鑑み、本発明では、通話においてエコーキャンセル処理を行うことなく、音響エコーを低減させる技術を提供する。

【課題を解決するための手段】

【0006】

通話制御装置は、送話信号を得るためのマイクロホンの使用の状態を判定するか、または、マイクロホンで集音された音響信号に基づいて発話の状態を判定する。さらに通話制御装置は、マイクロホンが使用されている時間区間、または、発話が行われている時間区間の何れかである制限区間では、第１スピーカからの第１受話信号の再生を制限し、第２スピーカから第２受話信号を再生し、制限区間以外の時間区間である非制限区間では、第１スピーカから第１受話信号を再生し、第２スピーカから第２受話信号を再生する。ここで、第２スピーカの音放出位置からマイクロホンの受音位置までの間での音の減衰量は、第１スピーカの音放出位置から当該マイクロホンの受音位置までの間での音の減衰量よりも大きい。

【発明の効果】

【0007】

これにより、通話においてエコーキャンセル処理を行うことなく、音響エコーを低減させることができる。

【図面の簡単な説明】

【0008】

【図1】図１は、実施形態の通話システムを例示するための図である。

【図2】図２Ａは、一方の耳（左耳）に装着されるように構成された実施形態の通話装置の構成を例示するための透過図である。図２Ｂは、他方の耳（右耳）に装着されるように構成された実施形態の通話装置の構成を例示するための透過図である。

【図3】図３は、実施形態の通話制御装置の機能構成を例示するためのブロック図である。

【図4】図４は、利用者の口元に装着された外部マイクロホンで観測された音声信号の感度Ｘ、当該利用者の耳元に装着された外部マイクロホンで観測された音声信号の感度Ｙ、および、当該利用者の外耳道またはその近傍に装着された耳内マイクロホンで観測された音声信号の感度Ａを例示した図である。音声信号の「感度」とは、利用者の口元に装着された外部マイクロホンで観測された当該利用者の音声信号の周波数スペクトルで正規化された音声信号の周波数スペクトルを意味する。図６の横軸は周波数（Frequency [Hz]）を表し、縦軸は感度（Sensitivity [dB]）を表す。

【図5】図５は、実施形態の判定ステップを例示するためのフロー図である。

【図6】図６は、他方の耳（右耳）に装着されるように構成された実施形態の通話装置の構成を例示するための透過図である。

【図7】図７は、実施形態の通話制御装置の機能構成を例示するためのブロック図である。

【発明を実施するための形態】

【0009】

以下、図面を参照して本発明の実施形態を説明する。
以下で説明する各実施形態では、通話制御装置が、送話信号を得るためのマイクロホンの使用の状態を判定するか、または、マイクロホンで集音された音響信号に基づいて発話の状態を判定する。さらに通話制御装置は、マイクロホンが使用されている時間区間、または、発話が行われている時間区間の何れかである制限区間では、第１スピーカからの第１受話信号の再生を制限し、第２スピーカから第２受話信号を再生し、制限区間以外の時間区間である非制限区間では、第１スピーカから第１受話信号を再生し、第２スピーカから第２受話信号を再生する。ここで、第２スピーカの音放出位置（例えば、振動板の位置）からマイクロホンの受音位置までの間での音の減衰量は、第１スピーカの音放出位置から当該マイクロホンの受音位置までの間での音の減衰量よりも大きい。

【0010】

ここで、マイクロホンが使用されていたり、発話が行われていたりする場合に、第１スピーカの再生を制限するため、第１スピーカからマイクロホンに回り込む音（音響エコー）を抑制することができる。このような場合でも、他方の第２スピーカからは第２受話信号が再生される。なお、第２スピーカの音放出位置からマイクロホンの受音位置までの間での音の減衰量は、第１スピーカの音放出位置からマイクロホンの受音位置までの間での音の減衰量よりも大きい。そのため、第２スピーカから第２受話信号が再生されていても、第２スピーカからマイクロホンに回り込む音は小さい。これにより、通話においてエコーキャンセル処理を行うことなく、音響エコーを低減させることができる。

【0011】

例えば、第１スピーカは、一方の耳（例えば、左耳）に装着されるように構成されており、第２スピーカは、他方の耳（例えば、右耳）に装着されるように構成されている。第１スピーカおよび第２スピーカは、例えば、イヤホンやヘッドホン等のスピーカである。しかし、これは本発明を限定するものではない。マイクロホンは、空気伝搬した音響信号を集音するように構成されていてもよいし、身体を伝達した音響信号を集音するように構成されていてもよい。前者のマイクロホンは、例えば、耳外（外耳道の外）に配置されるように構成された外部マイクロホンである。後者のマイクロホンは、例えば、外耳道の近傍（外耳道とつながっている空間）または外耳道の中に装着されるように構成された耳内マイクロホンであってもよいし、首部分に装着されるように構成された咽喉マイクロホンであってもよいし、頭部、喉、胴体、腕、手等の身体部位に装着されるように構成された骨伝導マイクロホンであってもよい。なお、騒音環境下で通話を行う場合、前者のマイクロホンでは、利用者の音声だけではなく、外部の騒音も高いレベルで集音してしまい、音声のＳ／Ｎ比が低下してしまう。一方、後者のマイクロホンでは、身体を伝達した音響信号を集音するため、利用者の音声を集音しつつ、外部の騒音の集音を抑制でき、前者のマイクロホンよりも高いＳ／Ｎ比で音声を集音できる。例えば、イヤホン等に設けられた耳内マイクロホンを用いた場合、耳内マイクロホンに到達する騒音はイヤホン等に遮られて音圧が小さくなっているが、利用者が発した音声は、空気中のみならず、利用者の身体をも伝わって耳内マイクロホンに到達する。空気中を伝わる音声は騒音と同様にイヤホン等に遮られて音圧が小さくなるが、身体を伝わる音声はさほど減衰しない。そのため、耳内マイクロホンは、騒音環境下でも高いＳ／Ｎ比で音声を集音できる。そのため、騒音環境下で通話を行う場合には、後者のマイクロホンの方が好ましい。

【0012】

発話の状態の判定は、マイクロホンで集音された音響信号に基づいて行われる。この判定は、例えば、マイクロホンで集音された音響信号の全てを用いて行われてもよいし、この音響信号の一部の成分を用いることなく残りの成分を用いて行われてもよいし、この音響信号の各周波数成分に重み付けを行って得られる信号を用いて行われてもよい。例えば、身体を介して伝達された音声は、その高域周波数成分が大きく減衰する。そのため、身体を伝達した音響信号を集音するように構成されたマイクロホンを用いる場合、このような音響信号の周波数特性を考慮し、発話の状態の判定を行ってもよい。また、この判定は、マイクロホンで集音された音響信号とその他の信号とを用いて行われてもよい。例えば、マイクロホンで集音された音響信号と第１受話信号とに基づいて、この判定が行われてもよい。これらの具体例については、後述する。

【0013】

制限区間では、第１スピーカからの第１受話信号の再生を制限する。例えば、制限区間では、第１スピーカからの第１受話信号の再生を停止してもよいし、第１スピーカからの第１受話信号の再生レベル（再生音の大きさ、例えば、再生音の振幅やパワー）を低減させてもよい。また、第１受話信号の再生の停止や再生レベルの低減は、例えば、すべての周波数において一律に行われてもよいし、一律に行われなくてもよい。例えば、身体を介して伝達された音声は、その高域周波数成分が大きく減衰する。そのため、身体を伝達した音響信号を集音するように構成されたマイクロホンを用いる場合、このような身体を伝達した音響信号の周波数特性を考慮し、第１スピーカからの第１受話信号の再生を停止や再生レベルの低減を行ってもよい。これらの具体例については、後述する。また、制限区間では、第２スピーカからは第２受話信号が再生される。例えば、第２スピーカは第２受話信号を制限することなく再生する。

【0014】

第２スピーカの音放出位置からマイクロホンの受音位置までの間での音の減衰量は、第１スピーカの音放出位置からマイクロホンの受音位置までの間での音の減衰量よりも大きい。すなわち、第１スピーカからマイクロホンに回り込む音（音響エコー）の音圧レベルは、第２スピーカからマイクロホンに回り込む音の音圧レベルよりも大きい。例えば、第２スピーカからマイクロホンに回り込む音の音圧レベルは、第１スピーカからマイクロホンに回り込む音の音圧レベルに比べて無視できるほど小さい。例えば、第１スピーカから発せられた或る音圧レベル（音の大きさ、例えば、音の振幅やパワー）の信号はマイクロホンに到達するが、第２スピーカから発せられた当該音圧レベルの信号はマイクロホンに到達しない。例えば、第１スピーカの音放出位置からマイクロホンの受音位置までの距離は、第２スピーカの音放出位置からマイクロホンの受音位置までの距離よりも近い。例えば、マイクロホンの受音位置は第１スピーカの音放出位置の近傍であるが、第１スピーカの音放出位置からは離れている。例えば、マイクロホンの受音位置は第１スピーカの音放出位置と同じ空間に面しているが、マイクロホンの受音位置と第２スピーカの音放出位置とは互いに別の空間に面している。

【0015】

［第１実施形態］
次に、本発明の第１実施形態を説明する。第１実施形態では、送話信号を得るためのマイクロホンの使用の状態が判定され、マイクロホンが使用されている時間区間を、前述の制限区間とする。また、第１実施形態では、一例としてマイクロホンおよびスピーカを備えたイヤホンに本発明を実装する例を説明する。しかし、これは本発明を限定するものではない。

【0016】

＜構成＞
図１に例示するように、本実施形態の通話システムでは、通話システム１－ｉを装着したＩ人の利用者１０００－ｉが通話（音声通信）を行う。通話システム１－ｉは通話装置１１－ｉ，１２－ｉを含む。ただし、ｉ＝１，２，…，Ｉであり、Ｉは２以上の整数である。図１は、Ｉ＝２の例であり、通話システム１－１および通話システム１－２をそれぞれ装着した２人の利用者１０００－１，１０００－２が通話を行う例を示している。しかし、これは本発明を限定するものではなく、本実施形態の通話システム１－ｉを装着して３人以上の利用者が通話を行ってもよい。以降、通話システム１－ｉの総称を通話システム１とし、通話装置１１－ｉの総称を通話装置１１とし、通話装置１２－ｉの総称を通話装置１２とし、利用者１０００－ｉの総称を利用者１０００とする。その他の名称に付される参照符号についても「α－ｉ」の総称を「α」と表記する。

【0017】

＜通話装置１１＞
図２Ａに例示するように、本形態の通話装置１１は、利用者１０００の一方の耳１０１０（例えば、左耳）に装着されるように構成されている。本形態の通話装置１１は、通話制御装置１１１、スピーカ１１２（第１スピーカ）、マイクロホン１１３（耳内マイクロホン）、マイクロホン１１４（外部マイクロホン）、筐体１１５、およびイヤーチップ１１６（イヤーピース、イヤーパッド）を有する。

【0018】

筐体１１５は、中空の中空部１１５１，１１５２および先端部１１５３を有している。筐体１１５の中空部１１５１側の壁には音孔１１５ａが設けられている。音孔１１５ａは筐体１１５の壁よりも音を透過しやすい孔であり、例えば、貫通孔等である。先端部１１５３の径は中空部１１５２の径よりも小さく、中空部１１５２の先端部１１５３側の領域はテーパー状に形成され、中空部１１５２につながっている。先端部１１５３の端部は開放端１１５３ａとなっており、この開放端１１５３ａを通じて中空部１１５２および先端部１１５３の内部が開放端１１５３ａの外方に開放されている。先端部１１５３の外側には、先端部１１５３を囲むイヤーチップ１１６が取り付けられている。

【0019】

中空部１１５１の内部には通話制御装置１１１が取り付けられ、通話制御装置１１１はスピーカ１１２およびマイクロホン１１３，１１４と電気的に接続されている。本形態では、通話における送話信号を得るためにマイクロホン１１３，１１４を用いる。すなわち、マイクロホン１１３，１１４で集音された音声等の音響信号に基づき、送話信号が得られる。

【0020】

スピーカ１１２は、中空部１１５１と中空部１１５２の間に取り付けられている。このスピーカ１１２は、中空部１１５２側に受話信号Ｒ_１（第１受話信号）の再生音を放出するように配置されている。例えば、スピーカ１１２の音放出位置（例えば、振動板の位置）は、中空部１１５２に面している。

【0021】

マイクロホン１１３は、例えば、先端部１１５３内部の中空部１１５２側の位置に取り付けられている。このマイクロホン１１３の受音位置は、中空部１１５２と同一の空間に面している。ここで、マイクロホン１１３は、利用者１０００の身体を伝達した音響信号（例えば、利用者１０００の音声信号）を集音するように構成されている。しかし、マイクロホン１１３の受音位置は、スピーカ１１２の音放出位置と同じ空間に面しており、スピーカ１１２の音放出位置にも近い。つまり、マイクロホン１１３は、利用者１０００の身体を伝達した音響信号のみならず、スピーカ１１２から放出された受話信号Ｒ_１の再生音も到達する位置に配置されている。

【0022】

マイクロホン１１４は中空部１１５１の内部に配置されている。マイクロホン１１４の受音位置は、音孔１１５ａの近傍であり、マイクロホン１１４はこの音孔１１５ａを通じて筐体１１５の外部の音を集音できるように構成されている。図２Ａの例では、マイクロホン１１４はスピーカ１１２の背面側に配置されている。すなわち、マイクロホン１１４の受音位置は、スピーカ１１２の音放出位置と同じ空間には面していない。しかし、マイクロホン１１４の受音位置は、スピーカ１１２の音放出位置に近い。そのため、スピーカ１１２から放出される受話信号Ｒ_１の音圧レベルによっては、マイクロホン１１４は、筐体１１５の外部の音のみならず、スピーカ１１２から放出された受話信号Ｒ_１の再生音も到達する位置に配置されている。

【0023】

通話装置１１は、開放端１１５３ａを利用者１０００の一方の鼓膜１０１２側（例えば、左耳の鼓膜）に向けた状態で、イヤーチップ１１６が取り付けられた先端部１１５３が耳１０１０の外耳道１０１１に挿入されるように構成されている。これにより、先端部１１５３の内部に取り付けられたマイクロホン１１３が、外耳道１０１１の近傍または外耳道１０１１の中に配置される。一方、中空部１１５１の内部に配置されたマイクロホン１１４は、外耳道１０１１の外側に配置される。また、スピーカ１１２は、外耳道１０１１に向けて配置される。すなわち、スピーカ１１２から外耳道１０１１に向けて受話信号Ｒ_１の再生音が放出される。

【0024】

＜通話装置１２＞
図２Ｂに例示するように、本形態の通話装置１２は、利用者１０００の他方の耳１０２０（例えば、右耳）に装着されるように構成されている。本形態の通話装置１２は、通話制御装置１２１、スピーカ１２２（第２スピーカ）、筐体１２５、およびイヤーチップ１２６を有する。

【0025】

筐体１２５は、中空の中空部１２５１，１２５２および先端部１２５３を有している。先端部１２５３の径は中空部１２５２の径よりも小さく、中空部１２５２の先端部１２５３側の領域はテーパー状に形成され、中空部１２５２につながっている。先端部１２５３の端部は開放端１２５３ａとなっており、この開放端１２５３ａを通じて中空部１２５２および先端部１２５３の内部が開放端１２５３ａの外方に開放されている。先端部１２５３の外側には、先端部１２５３を囲むイヤーチップ１２６が取り付けられている。

【0026】

中空部１２５１の内部には通話制御装置１２１が取り付けられ、通話制御装置１２１はスピーカ１２２と電気的に接続されている。

【0027】

スピーカ１２２は、中空部１２５１と中空部１２５２の間に取り付けられている。このスピーカ１２２は、中空部１２５２側に受話信号Ｒ_２（第２受話信号）の再生音を放出するように配置されている。例えば、スピーカ１２２の音放出位置（例えば、振動板の位置）は、中空部１２５２に面している。

【0028】

通話装置１２は、開放端１２５３ａを利用者１０００の他方の鼓膜１０２２側（例えば、右耳の鼓膜）に向けた状態で、イヤーチップ１２６が取り付けられた先端部１２５３が他方の耳１０２０の外耳道１０２２に挿入されるように構成されている。

【0029】

なお、通話装置１１（図２Ａ）は利用者１０００の一方の耳１０１０（例えば、左耳）に装着されるが、通話装置１２（図２Ｂ）は利用者１０００の他方の耳１０２０（例えば、右耳）に装着される。そのため、通話装置１１，１２が利用者１０００に装着された際には、通話装置１１（図２Ａ）のマイクロホン１１３，１１４の受音位置は、通話装置１２（図２Ｂ）のスピーカ１２２の音放出位置と異なる空間に面しており、スピーカ１２２の音放出位置からも遠い。よって、通話装置１１（図２Ａ）のマイクロホン１１３，１１４には、通話装置１２（図２Ｂ）のスピーカ１２２から放出された受話信号Ｒ_２の再生音がほとんど到達しない。そのため、通話装置１１（図２Ａ）のスピーカ１１２から放出される受話信号Ｒ_１の再生音と違い、通話装置１２（図２Ｂ）のスピーカ１２２から放出される受話信号Ｒ_２の再生音は、ほとんど音響エコーの原因とはならない。

【0030】

通話装置１２（図２Ｂ）のスピーカ１１２（第２スピーカ）の音放出位置からマイクロホン１１３，１１４の受音位置までの間での音の減衰量は、通話装置１１（図２Ａ）のスピーカ１１２（第１スピーカ）の音放出位置からマイクロホン１１３，１１４の受音位置までの間での音の減衰量よりも大きい。そのため、通話装置１２のスピーカ１２２からの再生音は、通話装置１１のスピーカ１１２からの再生音よりも、音響エコーの原因になりにくい。特に、スピーカ１２２からの再生音が、マイクロホン１１３，１１４でほとんど観測されない場合、スピーカ１２２からの再生音は、ほとんど音響エコーの原因にならない。

【0031】

＜通話制御装置１１１，１２１＞
図３に例示するように、通話制御装置１１１は、判定部１１１ａ、受話制御部１１１ｂ、および送話制御部１１１ｃを含む。また、通話制御装置１２１は受話制御部１２１ｂを含む。スピーカ１１２は受話制御部１１１ｂと電気的に接続されており、マイクロホン１１３，１１４は送話制御部１１１ｃと電気的に接続されている。スピーカ１２２は受話制御部１２１ｂと電気的に接続されている。

【0032】

＜処理＞
通話を行う利用者１０００は、前述のように、一方の耳１０１０（例えば、左耳）に通話装置１１を装着し、他方の耳１０２０（例えば、右耳）に通話装置１２を装着する（図１，図２Ａ，図２Ｂ）。

【0033】

＜マイクロホン制御ステップ＞
通話装置１１の送話制御部１１１ｃ（図３）は、マイクロホン１１３，１１４のＯＮ状態とＯＦＦ状態とを切り替えることができる。例えば、送話制御部１１１ｃは、利用者１０００による操作に基づいて入力された信号、スマートフォン等の他の機器から入力された信号、またはその他の契機で入力された信号等に基づいて、マイクロホン１１３，１１４のＯＮ状態とＯＦＦ状態とを切り替える。マイクロホン１１３，１１４のＯＮ状態は、当該マイクロホン１１３，１１４が使用されている状態であり、マイクロホン１１３，１１４のＯＦＦ状態は、当該マイクロホン１１３，１１４が使用されていない状態である。利用者１０００の発話は、ＯＮ状態のマイクロホン１１３，１１４では集音されるが、ＯＦＦ状態のマイクロホン１１３，１１４では集音されない。

【0034】

ＯＮ状態のマイクロホン１１３，１１４で集音された音響信号（例えば、音声信号等）は、送話制御部１１１ｃに送られる。送話制御部１１１ｃは、送られた音響信号に基づく送話信号Ｔを得て出力する。送話信号Ｔは他の利用者１０００が装着する他の通話システム１に送信される。一方、ＯＦＦ状態のマイクロホン１１３，１１４では集音されないため、送話信号Ｔも送信されない。

【0035】

＜判定ステップ＞
判定部１１１ａは、送話制御部１１１ｃにアクセスし、マイクロホン１１３，１１４の使用状態を判定する。例えば、判定部１１１ａは、マイクロホン１１３，１１４が使用されているかを判定してもよいし、マイクロホン１１３，１１４が使用されていないかを判定してもよいし、マイクロホン１１３，１１４が使用されているか否かを判定してもよい。判定部１１１ａは、例えば、ソフトウェア的処理、電気的処理、または機械的処理によって、この判定を行う。例えば、判定部１１１ａは、送話制御部１１１ｃのソフトウェア・プロファイル、送話制御部１１１ｃでマイクロホン１１３，１１４の信号を受信しているか否か、電気的または機械的なスイッチの状態等によって、マイクロホン１１３，１１４の使用状態を判定する。例えば、Bluetooth（登録商標）のソフトウェア・プロファイルには、音楽受聴用のA2DP（Advanced Audio Distribution Profile）および通話用のHFP（Hands-Free Profile）がある。例えば、判定部１１１ａは、HFPが使用されている場合にマイクロホン１１３，１１４が使用されていると判定し、そうでない場合にマイクロホン１１３，１１４が使用されていないと判定する。あるいは、判定部１１１ａは、HFPが使用されているときにマイクロホン１１３，１１４が使用されていると判定し、A2DPが使用されている場合にマイクロホン１１３，１１４が使用されていないと判定してもよい。例えば、送話制御部１１１ｃでマイクロホン１１３，１１４の出力信号のレベルを観測し、判定部１１１ａは、その出力信号のレベルが予め設定した閾値以上となった場合にマイクロホン１１３，１１４が使用されていると判定し、そうでない場合にマイクロホン１１３，１１４が使用されていないと判定してもよい。この閾値は、想定されるマイクロホン１１３，１１４のノイズレベルよりも大きい値に設定する。また、マイクロホン１１３，１１４のノイズレベルの推定をリアルタイムで行い、推定されたノイズレベルに１．０以上の係数を乗じた値を閾値としても良い。例えば、マイクロホン１１３，１１４のＯＮ状態とＯＦＦ状態とを切り替えるためのPush to talkスイッチが通話システム１に設けられており、判定部１１１ａは、このPush to talkスイッチの状態がＯＮ状態である場合にマイクロホン１１３，１１４が使用されていると判定し、そうでない場合にマイクロホン１１３，１１４が使用されていないと判定してもよい。あるいは、判定部１１１ａは、Push to talkスイッチの状態がＯＮ状態である場合にマイクロホン１１３，１１４が使用されていると判定し、ＯＦＦ状態である場合にマイクロホン１１３，１１４が使用されていないと判定してもよい。判定部１１１ａでの判定結果は受話制御部１１１ｂに送られる。

【0036】

＜受話制御ステップ＞
他の利用者１０００が装着する他の通話システム１から送信された送話信号は、受話信号Ｒ_１（第１受話信号）として通話装置１１の通話制御装置１１１の受話制御部１１１ｂに入力され、受話信号Ｒ_２（第２受話信号）として通話装置１２の通話制御装置１２１の受話制御部１２１ｂに入力される。受話制御部１１１ｂは、判定部１１１ａでの判定結果に基づいて、スピーカ１１２から受話信号Ｒ_１を再生するか否かを切り替える。以下に詳細に説明する。

【0037】

＜制限区間での処理＞
受話制御部１１１ｂは、判定部１１１ａでの判定結果に基づいて、マイクロホン１１３，１１４が使用されている時間区間を制限区間に設定する。例えば、受話制御部１１１ｂは、マイクロホン１１３，１１４が使用されていると判定された時間区間、または、マイクロホン１１３，１１４が使用されていないと判定されていない時間区間のいずれかを制限区間に設定する。制限区間では、受話制御部１１１ｂは、スピーカ１１２から受話信号Ｒ_１を再生しない。例えば、制限区間では、受話制御部１１１ｂは、スピーカ１１２に受話信号Ｒ_１に基づく信号を供給しない。そのため、マイクロホン１１３，１１４がＯＮ状態であっても、スピーカ１１２から受話信号Ｒ_１の再生音が放出されることはなく、受話信号Ｒ_１の再生音がマイクロホン１１３，１１４に回り込んで集音されることもない。一方、受話制御部１２１ｂは、判定部１１１ａでの判定結果にかかわらず、スピーカ１２２から受話信号Ｒ_２を再生する。スピーカ１２２は、例えば、受話信号Ｒ_２を制限することなく、この再生を行う。利用者１０００は、一方の耳１０１０に装着したスピーカ１１２から受話信号Ｒ_１が再生されなくても、他方の耳１０２０に装着したスピーカ１２２から再生された受話信号Ｒ_２の再生音を聴取できる。なお、制限区間では、送話制御部１１１ｃは、マイクロホン１１３，１１４から送られた音響信号に基づく送話信号Ｔを、通話先の他の通話システム１に送信する。この場合、送話信号Ｔの一部の成分が、この他の通話システム１から送信された受話信号Ｒ_２に含まれることがある。このような受話信号Ｒ_２は、受話制御部１２１ｂに入力され、スピーカ１２２から再生される。しかし、スピーカ１２２は、マイクロホン１１３，１１４から離れているため、スピーカ１２２から放出された受話信号Ｒ_２の再生音は、ほとんどマイクロホン１１３，１１４に到達しない。そのため、受話信号Ｒ_２に送話信号Ｔの一部の成分が含まれていても、その成分はマイクロホン１１３，１１４でほとんど集音されない。

【0038】

＜非制限区間での処理＞
制限区間以外の時間区間を非制限区間では、受話制御部１１１ｂはスピーカ１１２から受話信号Ｒ_１を再生する。例えば、受話制御部１１１ｂは、スピーカ１１２に受話信号Ｒ_１に基づく信号を供給する。スピーカ１１２は、例えば、受話信号Ｒ_１を制限することなく、受話信号Ｒ_１の再生を行う。また、受話制御部１２１ｂもスピーカ１２２から受話信号Ｒ_２を再生する。スピーカ１２２は、例えば、受話信号Ｒ_２を制限することなく、受話信号Ｒ_２の再生を行う。これにより、利用者１０００は、一方の耳１０１０で受話信号Ｒ_１の再生音を聴取し、他方の耳１０２０で受話信号Ｒ_２の再生音を聴取できる。なお、非制限区間では、送話制御部１１１ｃは送話信号Ｔを送信しない。そのため、受話信号Ｒ_１および受話信号Ｒ_２には、送話信号Ｔの成分は含まれない。

【0039】

＜本形態の特徴＞
以下の表に本形態の処理内容をまとめる。

【表1】

本形態では、マイクロホン１１３，１１４がＯＮ状態のときに（制限区間）、一方の耳１０１０に装着されたスピーカ１１２から受話信号Ｒ_１を再生せず、他方の耳１０２０に装着されたスピーカ１２２から受話信号Ｒ_２を再生する。その結果、スピーカ１１２から放出された受話信号Ｒ_１の再生音がマイクロホン１１３，１１４で集音されることを防止できる。また、スピーカ１２２は、マイクロホン１１３，１１４から離れているため、スピーカ１２２から放出された受話信号Ｒ_２の再生音は、ほとんどマイクロホン１１３，１１４に到達しない。これらにより、本形態では、エコーキャンセル処理を行うことなく、音響エコーの発生を防止または抑制できる。また前述のように、騒音環境下において、耳内マイクロホンであるマイクロホン１１３で集音された音声信号に対してエコーキャンセル処理を行うと、それによって得られる送話信号Ｔが大きく劣化してしまう。本形態では、エコーキャンセル処理を行わないため、このような問題も発生しない。これにより、高品質の音声通話を実現できる。

【0040】

一方、マイクロホン１１３，１１４がＯＦＦ状態のときに（非制限区間）、一方の耳１０１０に装着されたスピーカ１１２から受話信号Ｒ_１を再生し、他方の耳１０２０に装着されたスピーカ１２２から受話信号Ｒ_２を再生する。これにより、利用者１０００は、受話信号Ｒ_１，Ｒ_２の再生音を両耳で聴取でき、快適な聴取環境で通話を行うことができる。

【0041】

［第１実施形態の変形例１］
第１実施形態では、制限区間において受話信号Ｒ_１を全く再生しなかった。しかし、制限区間における受話信号Ｒ_１のレベルを、非制限区間における受話信号Ｒ_１のレベルよりも減衰させて再生してもよい。制限区間において、受話信号Ｒ_１の再生を完全に停止しなくても、制限区間での受話信号Ｒ_１の再生音のレベルを、非制限区間での受話信号Ｒ_１の再生音のレベルよりも小さくすることで、音響エコーを抑制できる場合もあるからである。

【0042】

［第１実施形態の変形例２］
本形態のマイクロホン１１３は、耳内マイクロホンであり、身体を伝達した音響信号を集音するように構成されている。前述のように、身体を介して伝達された音声は、その高域周波数成分が大きく減衰する。そのため、マイクロホン１１３で集音された音声信号は、低周波数成分に比べて高域周波数成分が大きく減衰したものになる。図４に、利用者１０００の口元に装着されたマイクロホン（図示せず）で観測された音声信号の感度Ｘ、前述のように利用者１０００の耳１０１０に装着された通話装置１１のマイクロホン１１４（外部マイクロホン）で観測された音声信号の感度Ｙ、および、マイクロホン１１３（耳内マイクロホン）（利用者１０００の外耳道１０１１またはその近傍に装着されたマイクロホン１１３）で観測された音声信号の感度Ａを例示する。なお、音声信号の「感度」とは、利用者１０００の口元に装着されたマイクロホンで観測された当該利用者１０００の音声信号の周波数スペクトルで正規化された音声信号の周波数スペクトルを意味する。図４の横軸は周波数（Frequency [Hz]）を表し、縦軸は感度（Sensitivity [dB]）を表す。図４に例示するように、利用者１０００の身体を介して伝達され、マイクロホン１１３で観測された音声信号の感度Ａは、周波数が高くなるほど低くなる。一方、空気伝搬され、マイクロホン１１４で観測された音声信号の感度Ｙは、周波数が高くなっても高い。

【0043】

そのため、送話制御部１１１ｃが、マイクロホン１１３で集音された音響信号（例えば、音声信号等）の高域周波数の成分を低域周波数の成分よりも増幅して送話信号Ｔを生成してもよい。すなわち、マイクロホン１１３で集音された音響信号の高域周波数の成分は、低域周波数の成分よりも減衰している。そのため、送話制御部１１１ｃは、例えば、マイクロホン１１３で集音された音響信号の高域周波数の成分を低域周波数の成分よりも増幅して、送話信号Ｔを生成してもよい。なお、高域周波数は低域周波数よりも高い周波数である。例えば、送話制御部１１１ｃが、マイクロホン１１３で集音された音響信号の各周波数ω［Ｈｚ］の成分Ｂ（ω）に各比率Ｘ（ω）／Ａ（ω）を乗じたＢ（ω）Ｘ（ω）／Ａ（ω）に基づく送話信号Ｔを生成してもよい。ここで、Ｘ（ω）は感度Ｘの周波数ωの成分を表し、Ａ（ω）は感度Ａの周波数ωの成分を表す。この場合、感度Ｘ，Ａは事前に設定されたものを用いる。または、送話制御部１１１ｃが、例えば、マイクロホン１１３で集音された音響信号の各周波数ω［Ｈｚ］の成分Ｂ（ω）に各比率Ｙ（ω）／Ａ（ω）を乗じたＢ（ω）Ｙ（ω）／Ａ（ω）に基づく送話信号Ｔを生成してもよい。ここで、Ｙ（ω）は感度Ｙの周波数ωの成分を表す。この場合、感度Ａ，Ｙは事前に設定されたものであってもよいし、マイクロホン１１３，１１４でそれぞれ集音された音響信号に基づいて計算されたものであってもよい。その他、送話制御部１１１ｃが、例えば、マイクロホン１１３で集音された音響信号の周波数成分のうち、或る周波数ＴＨ１より高い周波数の成分のみを増幅して送話信号Ｔを生成してもよい。ここで、周波数ＴＨ１は、例えば、２ｋＨｚ以上３ｋＨｚ以下の範囲に属する周波数である。

【0044】

このように、マイクロホン１１３で集音された音響信号の高域周波数の成分を低域周波数の成分よりも増幅して送話信号Ｔを生成した場合、低域周波数の成分に比べて高域周波数の成分の方が、音響エコーを引き起こし易くなる。そのため、受話制御部１１１ｂが、制限区間において、スピーカ１１２からの受話信号Ｒ_１（第１受話信号）の高域周波数の成分の再生を、受話信号Ｒ_１（第１受話信号）の低域周波数の成分の再生よりも制限してもよい。マイクロホン１１３で集音された音響信号（身体を伝達した音響信号）の周波数特性を考慮すると、これによっても、音響エコーを抑制できる場合があるからである。例えば、受話制御部１１１ｂが、制限区間において、受話信号Ｒ_１の低域周波数の成分および高域周波数の成分の再生を制限するが、高域周波数の成分のレベルを低域周波数の成分のレベルよりも減衰させて再生してもよい。例えば、受話制御部１１１ｂが、制限区間において、受話信号Ｒ_１のうち、或る周波数ＴＨ２より低い低域周波数の成分のレベルを１／β_Ｌにし、周波数ＴＨ２以上の高域周波数の成分のレベルを１／β_Ｈにし、スピーカ１１２から再生してもよい。ここで、β_Ｌ，β_Ｈは正の実数であり、β_Ｌ＞１、β_Ｈ＞１、β_Ｈ＞β_Ｌを満たす。周波数ＴＨ２は、周波数ＴＨ１と同一であってもよいし、同一でなくてもよい。周波数ＴＨ２は、例えば、２ｋＨｚ以上３ｋＨｚ以下の範囲に属する周波数である。または、例えば、受話制御部１１１ｂが、制限区間において、受話信号Ｒ_１の低域周波数の成分の再生を制限することなく、受話信号Ｒ_１の高域周波数の成分の再生を制限してもよい。例えば、受話制御部１１１ｂが、制限区間において、受話信号Ｒ_１のうち、周波数ＴＨ２より低い低域周波数の成分の再生を制限することなく、周波数ＴＨ２以上の高域周波数の成分の再生を制限してもよい。例えば、受話制御部１１１ｂが、制限区間において、受話信号Ｒ_１のうち、周波数ＴＨ２より低い低域周波数の成分のレベルを減衰させず、周波数ＴＨ２以上の高域周波数の成分のレベルを１／β_Ｈにし、スピーカ１１２から再生してもよい。

【0045】

［第１実施形態の変形例３］
第１実施形態では、送話制御部１１１ｃが、マイクロホン１１３，１１４のＯＮ状態とＯＦＦ状態とを同時に切り替えた。しかしながら、送話制御部１１１ｃが、マイクロホン１１３のＯＮ状態とＯＦＦ状態の切り替えと、マイクロホン１１４のＯＮ状態とＯＦＦ状態の切り替えとを独立に行ってもよい。また、第１実施形態では、マイクロホン１１３，１１４が使用されている時間区間を制限区間とした。しかし、マイクロホン１１３が使用されている時間区間を制限区間としてもよいし、マイクロホン１１４が使用されている制限区間としてもよい。

【0046】

送話制御部１１１ｃが、外部の騒音の大きさに応じて、マイクロホン１１３（耳内マイクロホン）を使用するか、マイクロホン１１４（外部マイクロホン）を使用するかを切り替えてもよい。例えば、マイクロホン１１４で観測された音響信号の大きさが閾値ＴＨ１１以上となったときに（騒音が大きいときに）、マイクロホン１１４からマイクロホン１１３に切り替えられ、マイクロホン１１３で観測される音響信号の大きさが閾値ＴＨ１２よりも小さくなったときに（騒音が小さいときに）、マイクロホン１１３からマイクロホン１１４に切り替えられてもよい。なお、閾値ＴＨ１２は閾値ＴＨ１１よりも小さい。マイクロホン１１３に切り替えられた場合、送話制御部１１１ｃは、マイクロホン１１３のＯＮ状態とＯＦＦ状態の切り替えを行うことができるが、マイクロホン１１４は常にＯＦＦ状態となる。一方、マイクロホン１１４に切り替えられた場合、送話制御部１１１ｃは、マイクロホン１１４のＯＮ状態とＯＦＦ状態の切り替えを行うことができるが、マイクロホン１１３は常にＯＦＦ状態となる。ここで、マイクロホン１１４は、例えば、耳外に配置されるように構成された外部マイクロホンであり、スピーカ１１２から放出された受話信号Ｒ_１の再生音がさほど到達しないケースもある。このようなケースでは、マイクロホン１１４が使用される時間区間でスピーカ１１２から受話信号Ｒ_１の再生音が放出されても、音響エコーはほとんど問題とならない。そのため、騒音が小さく、マイクロホン１１４に切り替えられた場合には、マイクロホン１１４がＯＮ状態であるかＯＦＦ状態であるかにかかわらず、非制限区間とされてもよい。一方、マイクロホン１１３は、例えば、耳内に配置されるように構成された耳内マイクロホンであり、スピーカ１１２から放出された受話信号Ｒ_１の再生音を集音しやすい。そのため、騒音が大きく、マイクロホン１１３に切り替えられた場合には、マイクロホン１１３がＯＮ状態である時間区間（マイクロホン１１３が使用されている時間区間）が制限区間とされ、マイクロホン１１３がＯＦＦ状態である時間区間（マイクロホン１１３が使用されていない時間区間）が非制限区間とされてもよい。以下の表にこの処理内容をまとめる。

【表2】

また、外部の騒音の大きさに応じて、マイクロホン１１３とマイクロホン１１４とを自動的に切り替えることに代え、利用者１０００が手動で、マイクロホン１１３を使用するか、マイクロホン１１４を使用するかを切り替えてもよい。ここで、マイクロホン１１４に切り替えられた場合には、マイクロホン１１４がＯＮ状態であるかＯＦＦ状態であるかにかかわらず、非制限区間とされてもよい。一方、マイクロホン１１３に切り替えられた場合には、マイクロホン１１３がＯＮ状態である時間区間（マイクロホン１１３が使用されている時間区間）を制限区間とし、マイクロホン１１３がＯＦＦ状態の時間区間（マイクロホン１１３が使用されていない時間区間）を非制限区間としてもよい、

【0047】

まとめると、スピーカ１１２（第１スピーカ）は、外耳道１０１１に向けて装着されるように構成されており、外耳道１０１１の中に装着されるように構成されたマイクロホン１１３（耳内マイクロホン）をマイクロホンとして設定するか、外耳道１０１１の外に配置されるように構成されたマイクロホン１１４（外部マイクロホン）をマイクロホンとして設定するかを切り替え可能であり、制限区間は、マイクロホン１１３（耳内マイクロホン）がマイクロホンとして設定され、かつ、マイクロホン１１３が使用されている時間区間であり、非制限区間は、それ以外の時間区間であってもよい。

【0048】

［第１実施形態の変形例４］
マイクロホン１１３またはマイクロホン１１４の何れかが省略されてもよい。また、通話装置１２側に、送話信号の生成に用いないマイクロホンを設けてもよい（例えば、アクティブノイズキャンセリング（ＡＮＣ）用のマイクロホン）。また、通話装置１２側に、送話信号の生成に用いるマイクロホンと、そこで集音された音響信号に基づく音響エコーを抑制するためのエコーキャンセラと、を設けてもよい。

【0049】

［第１実施形態の変形例５］
制限区間において、通話制御装置１２１（図３）の受話制御部１２１ｂが、スピーカ１２２から、受話信号Ｒ_２（第２受話信号）だけでなく、さらに受話信号Ｒ_１（第１受話信号）を再生してもよい。例えば、通話制御装置１１１の受話制御部１１１ｂが、制限区間のときに、受話信号Ｒ_１を受話制御部１２１ｂに送り、受話制御部１２１ｂが受話信号Ｒ_１と受話信号Ｒ_２とをスピーカ１２２から再生してもよい。これにより、制限区間でスピーカ１１２による受話信号Ｒ_１の再生が制限されても、スピーカ１２２から受話信号Ｒ_１が再生される。その結果、制限区間であっても、利用者１０００は、受話信号Ｒ_１と受話信号Ｒ_２の両方の再生音を聴取できる。これは、ステレオ信号のように、受話信号Ｒ_１と受話信号Ｒ_２とが異なっている場合に特に有効である。

【0050】

［第２実施形態］
第１実施形態では、送話信号を得るためのマイクロホンの使用の状態に基づいて、スピーカ１１２からの受話信号Ｒ_１の再生を制御した。これに対し、第２実施形態では、マイクロホンで集音された音響信号に基づく発話の状態に基づいて、スピーカ１１２からの受話信号Ｒ_１の再生を制御する。すなわち、本形態では、マイクロホン１１３，１１４で集音された音響信号に基づいて発話の状態を判定する。また、発話が行われている時間区間を制限区間とし、この制限区間以外の時間区間を非制限区間とする。制限区間では、スピーカ１１２からの受話信号Ｒ_１の再生を制限するが、スピーカ１２２からは受話信号Ｒ_２を再生する。例えば、スピーカ１２２から再生される受話信号Ｒ_２は制限されない。これにより、通話においてエコーキャンセル処理を行うことなく、音響エコーを低減させることができる。また、非制限区間では、スピーカ１１２から受話信号Ｒ_１を再生し、スピーカ１２２から受話信号Ｒ_２を再生する。これらの再生は制限されない。以降、既に説明した事項については、同じ参照番号を用い、説明を簡略化する。

【0051】

＜構成＞
図１に例示するように、本実施形態の通話システムでは、通話システム２－ｉを装着したＩ人の利用者１０００－ｉが通話を行う。通話システム２－ｉは通話装置２１－ｉ，１２－ｉを含む。ただし、ｉ＝１，２，…，Ｉであり、Ｉは２以上の整数である。図１は、Ｉ＝２の例であり、通話システム２－１および通話システム２－２をそれぞれ装着した２人の利用者１０００－１，１０００－２が通話を行う例を示している。しかし、これは本発明を限定するものではなく、本実施形態の通話システム２－ｉを装着して３人以上の利用者が通話を行ってもよい。

【0052】

＜通話装置２１＞
図２Ａに例示するように、本形態の通話装置２１は、第１実施形態の本形態の通話装置１１の通話制御装置１１１を、通話制御装置２１１に置換したものである。すなわち、通話装置２１は、通話制御装置２１１、スピーカ１１２、マイクロホン１１３、マイクロホン１１４、筐体１１５、およびイヤーチップ１１６を有する。

【0053】

＜通話装置１２＞
第１実施形態と同じである。

【0054】

＜通話制御装置２１１＞
図３に例示するように、通話制御装置２１１は、判定部２１１ａ、受話制御部２１１ｂ、および送話制御部２１１ｃを含む。スピーカ１１２は受話制御部２１１ｂと電気的に接続されており、マイクロホン１１３，１１４は送話制御部２１１ｃと電気的に接続されている。

【0055】

＜処理＞
通話を行う利用者１０００は、前述のように、一方の耳１０１０（例えば、左耳）に通話装置２１を装着し、他方の耳１０２０（例えば、右耳）に通話装置１２を装着する（図１，図２Ａ，図２Ｂ）。

【0056】

＜マイクロホン制御ステップ＞
第１実施形態と同様、通話装置２１の送話制御部２１１ｃ（図３）は、マイクロホン１１３，１１４のＯＮ状態とＯＦＦ状態とを切り替えることができる。ＯＮ状態のマイクロホン１１３，１１４で集音された音響信号は、送話制御部２１１ｃに送られる。送話制御部２１１ｃは、後述する判定部２１１ａでの判定結果に基づいて、送られた音響信号に基づく送話信号Ｔを得て出力するか否かを判定する。送話制御部２１１ｃから出力された送話信号Ｔは、他の利用者１０００が装着する他の通話システム２に送信される。一方、ＯＦＦ状態のマイクロホン１１３，１１４は音響信号を集音しないため、送話信号Ｔも送信されない。他の利用者１０００が装着する他の通話システム２から送信された送話信号は、受話信号Ｒ_１（第１受話信号）として通話装置２１の通話制御装置２１１の受話制御部２１１ｂに入力され、受話信号Ｒ_２（第２受話信号）として通話装置１２の通話制御装置１２１の受話制御部１２１ｂに入力される。受話制御部２１１ｂは、以下の判定部２１１ａでの判定結果に基づいて、スピーカ１１２から受話信号Ｒ_１を再生するか否かを切り替える。

【0057】

＜判定ステップ＞
判定部２１１ａは、少なくとも送話制御部２１１ｃにアクセスし、マイクロホン１１３，１１４で集音された音響信号に基づいて発話の状態を判定する。例えば、判定部２１１ａは、集音された音響信号のレベルに基づいて発話の状態を判定する。判定部２１１ａは、マイクロホン１１３，１１４の何れかで集音された音響信号に基づいて発話の状態を判定してもよいし、マイクロホン１１３，１１４の両方で集音された音響信号に基づいて発話の状態を判定してもよい。また、判定部２１１ａは、さらに受話制御部２１１ｂにアクセスし、さらに受話信号Ｒ_１に基づく音響信号を用いて発話の状態を判定してもよい。例えば、判定部２１１ａは、集音された音響信号と受話信号Ｒ_１に基づく音響信号のレベルに基づいて発話の状態を判定する。なお判定部２１１ａは、発話が行われている時間区間（発話区間）を判定してもよいし、発話が行われていない時間区間（非発話区間）を判定してもよいし、発話区間および非発話区間の両方を判定してもよい。また、マイクロホン１１３，１１４がＯＦＦ状態の場合には音響信号が集音されないため、発話は行われていないと判定される。

【0058】

＜判定ステップの一例＞
以下では、判定部２１１ａが、マイクロホン１１３で集音された音響信号と、受話信号Ｒ_１に基づく音響信号と、に基づいて、発話の状態を判定する例を示す。しかし、これは一例であって、本発明を限定するものではない。

【0059】

マイクロホン１１３は、利用者１０００の発話に基づく音響信号だけでなく、スピーカ１１２から再生された受話信号Ｒ_２に基づく音響信号も集音する。そのため、マイクロホン１１３で集音された音響信号から、受話信号Ｒ_１に基づく音響信号の成分（推定回り込み信号）を減じてから、利用者１０００の発話の状態を判定した方が、発話の状態を正確に判定できる。しかし、このように判定しても、完全に発話状態を正確に判定できるとは限らない。すなわち、実際には発話が行われているにもかかわらず、発話が行われていないと誤判定（誤判定Ｉ）されることも、実際には発話が行われていないにもかかわらず、発話が行われていると誤判定（誤判定ＩＩ）されることもある。

【0060】

本形態では、発話が行われていると判定されている時間区間、または、発話が行われていないと判定されていない時間区間の何れかを制限区間とし、それ以外の時間区間を非制限区間とする。そのため、誤判定Ｉが生じると、本来は制限区間とすべき時間区間が非制限区間とされてしまう。非制限区間では、スピーカ１１２から受話信号Ｒ_１が再生されてしまう。そのため、誤判定Ｉが生じると、発話が行われているにもかかわらず、スピーカ１１２から受話信号Ｒ_１の再生音が再生されてしまい、音響エコーの発生を誘発してしまう。

【0061】

一方、誤判定ＩＩが生じると、本来は非制限区間とすべき時間区間を制限区間としてしまう。制限区間では、スピーカ１１２からの受話信号Ｒ_１の再生が制限される。そのため、誤判定ＩＩが生じると、発話が行われていないにもかかわらず、スピーカ１１２からの受話信号Ｒ_１の再生が制限されてしまう。しかしながら、この場合でも、スピーカ１２２からは受話信号Ｒ_２が再生されるため、誤判定ＩＩが生じても大きな問題とはならない。

【0062】

そのため、全体として判定精度が下がったとしても、誤判定Ｉを減らすような設定が好ましい。ここで、前の時間区間が制限区間（発話が行われていると判定された時間区間）である場合、現在の時間区間でも発話が行われている確率が高い。そのため、前の時間区間が制限区間のときに、現在の時間区間で発話が行われていると判定され易い設定が好ましい。これにより、誤判定Ｉを減らせるからである。そのため、前の時間区間が制限区間であるときには、受話信号Ｒ_１に基づく推定回り込み信号を考慮することなく、マイクロホン１１３で集音された音響信号に基づいて、利用者１０００の発話の状態を判定することが好ましい。

【0063】

一方、前の時間区間が非制限区間（発話が行われていないと判定された時間区間）である場合には、現在の時間区間でも発話が行われていない確率が高い。現在の時間区間で発話が行われていない場合には、誤判定Ｉは生じない。誤判定Ｉは、現在の時間区間で発話が行われていることを前提とするからである。現在の時間区間で発話が行われていない場合に誤判定ＩＩが生じることはあるが、上述のように誤判定ＩＩは大きな問題とはならない。そのため、前の時間区間が非制限区間であるときには、誤判定ＩＩを無理に減らすような設定ではなく、発話状態の判定精度が全体として高くなる設定が望ましい。そのため、前の時間区間が非制限区間であるときには、マイクロホン１１３で集音された音響信号から、受話信号Ｒ_１に基づく推定回り込み信号を減じて、利用者１０００の発話の状態を判定することが好ましい。

【0064】

以上より、判定部２１１ａは、以下のような判定を行うことが望ましい。
（１）前の時間区間ｔ－１が制限区間である場合、判定部２１１ａは、受話信号Ｒ_１（第１受話信号）に基づく推定回り込み信号Ｗ（ｔ）を考慮することなく、マイクロホン１１３で集音された音響信号に基づく信号Ｍ（ｔ）に基づいて発話の状態を判定する。
（２）前の時間区間ｔ－１が非制限区間である場合、判定部２１１ａは、信号Ｍ（ｔ）から推定回り込み信号Ｗ（ｔ）を減じて得られる推定送話信号Ｓ（ｔ）に基づいて発話の状態を判定する。
ここで、Ｗ（ｔ）は、現在の時間区間ｔ（時間区間ｔ－１の次の時間区間）での推定回り込み信号を表す。例えば、Ｗ（ｔ）＝Ｈ（ｔ）＊Ｒ_１（ｔ）である。ただし、Ｈ（ｔ）はスピーカ１１２の音放出位置からマイクロホン１１３の受音位置までのインパルス応答であり、＊は畳み込み演算を表す。遅延や反射を無視できるような環境（例えば、通話装置１１がイヤホンである場合）では、Ｈ（ｔ）を実数定数のＨとして近似できる。この場合にはＷ（ｔ）＝Ｈ＊Ｒ_１（ｔ）と近似できる（以下、同様）。Ｒ_１（ｔ）は時間区間ｔにおける受話信号Ｒ_１を表す。Ｍ（ｔ）は、現在の時間区間ｔにおいてマイクロホン１１３で集音された音響信号に基づく信号を表す。Ｍ（ｔ）は、マイクロホン１１３で集音された音響信号そのものであってもよいし、マイクロホン１１３で集音された音響信号の関数値（例えば、単調増加関数値）であってもよい。Ｓ（ｔ）は、現在の時間区間ｔの推定送話信号を表す。例えば、Ｓ（ｔ）＝Ｍ（ｔ）－Ｈ（ｔ）＊Ｒ_１（ｔ）である。なお、マイクロホン１１３がＯＦＦ状態の場合には音響信号が集音されないため、発話は行われていないと判定される。

【0065】

より具体的には、例えば、判定部２１１ａは、以下のような判定を行う。
（１）前の時間区間ｔ－１が制限区間である場合
・判定部２１１ａは、現在の時間区間ｔにおいてマイクロホン１１３で集音された音響信号に基づく信号Ｍ（ｔ）のレベルが基準値Ｔｍ（第１基準値）を超えているときに、現在の時間区間ｔで、発話が行われていると判定するか、または、発話が行われていないと判定しない。ここで、Ｔｍは正の実数定数である。
・判定部２１１ａは、現在の時間区間ｔにおいてマイクロホン１１３で集音された音響信号に基づく信号Ｍ（ｔ）のレベルが基準値Ｔｍ以下であるときに、現在の時間区間ｔで、発話が行われていると判定しないか、または、発話が行われていないと判定する。

【0066】

（２）前の時間区間ｔ－１が非制限区間である場合
・判定部２１１ａは、推定送話信号Ｓ（ｔ）のレベルが基準値Ｔｓ（第２基準値）を超えているときに、発話が行われていると判定するか、または、発話が行われていないと判定しない。ここで、Ｔｓは正の実数定数である。
・判定部２１１ａは、推定送話信号Ｓ（ｔ）のレベルが基準値Ｔｓ以下であるときに、発話が行われていると判定しないか、または、発話が行われていないと判定する。

【0067】

この具体例を、図５を用いて説明する。判定部２１１ａは、前の時間区間ｔ－１が制限区間か否かを判定する（ステップＳ２０１）。ここで、前の時間区間ｔ－１が制限区間であった場合にはステップＳ２０２に進む。一方、前の時間区間ｔ－１が非制限区間であった場合にはステップＳ２０３に進む。なお、前の時間区間ｔ－１で判定が行われていない場合には、前の時間区間ｔ－１を制限区間とみなしてもよいし、非制限区間とみなしてもよい。しかし、音響エコーの原因となる誤判定Ｉを減らすためには、前の時間区間ｔ－１で判定が行われていない場合に、前の時間区間ｔ－１を制限区間とみなすことが望ましい。

【0068】

ステップＳ２０２では、判定部２１１ａは、信号Ｍ（ｔ）のレベルが基準値Ｔｍを超えているか否かを判定する。例えば、判定部２１１ａは、｜Ｍ（ｔ）｜＞Ｔｍであるか否かを判定する。｜Ｍ（ｔ）｜はＭ（ｔ）の振幅を表す。ここで、信号Ｍ（ｔ）のレベルが基準値Ｔｍを超えている場合（例えば、｜Ｍ（ｔ）｜＞Ｔｍ）、判定部２１１ａは、時間区間ｔで発話は行われていないと判定しないか、または、時間区間ｔで発話は行われていると判定する（ステップＳ２０４）。一方、信号Ｍ（ｔ）のレベルが基準値Ｔｍ以下である場合（例えば、｜Ｍ（ｔ）｜≦Ｔｍ）、判定部２１１ａは、時間区間ｔで発話は行われていないと判定するか、または、時間区間ｔで発話は行われていると判定しない（ステップＳ２０５）。その後、判定部２１１ａは、時間区間ｔでの判定を終える。

【0069】

ステップＳ２０３では、判定部２１１ａは、推定送話信号Ｓ（ｔ）＝Ｍ（ｔ）－Ｈ（ｔ）＊Ｒ_１（ｔ）のレベルが基準値Ｔｓを超えているか否かを判定する。例えば、判定部２１１ａは、｜Ｓ（ｔ）｜＞Ｔｓであるか否かを判定する。ここで、推定送話信号Ｓ（ｔ）のレベルが基準値Ｔｓを超えている場合（例えば、｜Ｓ（ｔ）｜＞Ｔｓ）、判定部２１１ａは、時間区間ｔで発話は行われていないと判定しないか、または、時間区間ｔで発話は行われていると判定する（ステップＳ２０４）。一方、推定送話信号Ｓ（ｔ）のレベルが基準値Ｔｓ以下である場合（例えば、｜Ｓ（ｔ）｜≦Ｔｓ）、時間区間ｔで発話は行われていないと判定するか、または、時間区間ｔで発話は行われていると判定しない（ステップＳ２０５）。その後、判定部２１１ａは、時間区間ｔでの判定を終える。なお、ステップＳ２０２において｜Ｍ（ｔ）｜に代えて、｜Ｍ（ｔ）｜を時間平滑化して得られるＰｍ（ｔ）が用いられてもよい。ここでＮ_ｍは２以上の正整数である。

【数1】

また、ステップＳ２０３において｜Ｓ（ｔ）｜に代えて、｜Ｓ（ｔ）｜を時間平滑化して得られるＰｓ（ｔ）が用いられてもよい。ここでＮ_ｓは２以上の正整数である。

【数2】

【0070】

＜受話制御ステップ＞
受話制御部２１１ｂには、判定部２１１ａでの判定結果が入力される。受話制御部２１１ｂは、判定部２１１ａでの判定結果に基づいて、スピーカ１１２から受話信号Ｒ_１を再生するか否かを切り替える。以下に詳細に説明する。

【0071】

＜制限区間での処理＞
受話制御部２１１ｂは、判定部２１１ａでの判定結果に基づいて、発話が行われている時間区間を制限区間に設定する。例えば、受話制御部２１１ｂは、発話が行われていると判定されている時間区間、または、発話が行われていないと判定されていない時間区間のいずれかを制限区間に設定する。その他は、受話制御部１１１ｂが受話制御部２１１ｂに置換されることを除き、第１実施形態の受話制御ステップにおける制限区間での処理と同じである。すなわち、制限区間では、受話制御部２１１ｂは、スピーカ１１２から受話信号Ｒ_１を再生しない。一方、受話制御部１２１ｂは、スピーカ１２２から受話信号Ｒ_２を再生する。

【0072】

＜非制限区間での処理＞
制限区間以外の時間区間を非制限区間の処理は、受話制御部１１１ｂが受話制御部２１１ｂに置換されることを除き、第１実施形態の受話制御ステップにおける非制限区間での処理と同じである。すなわち、受話制御部１１１ｂはスピーカ１１２から受話信号Ｒ_１を再生する。また、受話制御部１２１ｂもスピーカ１２２から受話信号Ｒ_２を再生する。

【0073】

＜送話制御ステップ＞
送話制御部２１１ｃには、判定部２１１ａでの判定結果が入力される。送話制御部２１１ｃは、判定部２１１ａでの判定結果に基づいて、送話信号Ｔを送信するか否かを切り替える。以下に詳細に説明する。

【0074】

＜制限区間での処理＞
送話制御部２１１ｃも、判定部２１１ａでの判定結果に基づいて、発話が行われているを制限区間に設定する。例えば、送話制御部２１１ｃは、発話が行われていると判定されている時間区間、または、発話が行われていないと判定されていない時間区間のいずれかを制限区間に設定する。制限区間では、送話制御部２１１ｃは、マイクロホン１１３，１１４から送られた音響信号に基づく送話信号Ｔを得て出力する。送話信号Ｔは、他の利用者１０００が装着する他の通話システム２に送信される。

【0075】

＜非制限区間での処理＞
制限区間以外の時間区間を非制限区間では、送話制御部２１１ｃは、マイクロホン１１３，１１４から送られた音響信号に基づく送話信号Ｔを出力しない。これにより、非制限区間において、他の通話システム２に送信された送話信号Ｔの一部の成分が、受話信号Ｒ_１として受話制御部２１１ｂに戻り、スピーカ１１２から再生されることで音響ノイズが発生することを防止できる。

【0076】

＜本形態の特徴＞
以下の表に本形態の処理内容をまとめる。

【表3】

本形態では、発話が行われているときに（制限区間）、一方の耳１０１０に装着されたスピーカ１１２から受話信号Ｒ_１を再生せず、他方の耳１０２０に装着されたスピーカ１２２から受話信号Ｒ_２を再生する。その結果、スピーカ１１２から放出された受話信号Ｒ_１の再生音がマイクロホン１１３，１１４で集音されることを防止できる。また、スピーカ１２２は、マイクロホン１１３，１１４から離れているため、スピーカ１２２から放出された受話信号Ｒ_２の再生音は、ほとんどマイクロホン１１３，１１４に到達しない。これらにより、本形態では、エコーキャンセル処理を行うことなく、音響エコーの発生を防止または抑制できる。また前述のように、騒音環境下において、耳内マイクロホンであるマイクロホン１１３で集音された音声信号に対してエコーキャンセル処理を行うと、それによって得られる送話信号Ｔが大きく劣化してしまう。本形態では、エコーキャンセル処理を行わないため、このような問題も発生しない。

【0077】

一方、発話が行われていないときには（非制限区間）、一方の耳１０１０に装着されたスピーカ１１２から受話信号Ｒ_１を再生し、他方の耳１０２０に装着されたスピーカ１２２から受話信号Ｒ_２を再生する。これにより、利用者１０００は、受話信号Ｒ_１，Ｒ_２の再生音を両耳で聴取できる。また、この際、送話制御部２１１ｃは、マイクロホン１１３，１１４から送られた音響信号に基づく送話信号Ｔを出力しない。すなわち、送話制御部２１１ｃは、制限区間において送話信号Ｔを送信するが、非制限区間において送話信号Ｔの送信を制限する。これにより、非制限区間において、音響ノイズが発生することを防止できる。

【0078】

＜第２実施形態の変形例１＞
第２実施形態では、制限区間において受話信号Ｒ_１を全く再生しなかった。しかし、制限区間における受話信号Ｒ_１のレベルを、非制限区間における受話信号Ｒ_１のレベルよりも減衰させて再生してもよい。制限区間において、受話信号Ｒ_１の再生を完全に停止しなくても、制限区間での受話信号Ｒ_１の再生音のレベルを、非制限区間での受話信号Ｒ_１の再生音のレベルよりも小さくすることで、音響エコーを抑制できる場合もあるからである。

【0079】

＜第２実施形態の変形例２＞
第１実施形態の変形例２と同様に、送話制御部２１１ｃが、マイクロホン１１３で集音された音響信号（例えば、音声信号等）の高域周波数の成分を低域周波数の成分よりも増幅して送話信号Ｔを生成してもよい。このように、マイクロホン１１３で集音された音響信号の高域周波数の成分を低域周波数の成分よりも増幅して送話信号Ｔを生成した場合、低域周波数の成分に比べて高域周波数の成分の方が、音響エコーを引き起こし易くなる。そのため、受話制御部２１１ｂが、制限区間において、スピーカ１１２からの受話信号Ｒ_１（第１受話信号）の高域周波数の成分の再生を、受話信号Ｒ_１（第１受話信号）の低域周波数の成分の再生よりも制限してもよい。マイクロホン１１３で集音された音響信号（身体を伝達した音響信号）の周波数特性を考慮すると、これによっても、音響エコーを抑制できる場合があるからである。

【0080】

［第２実施形態の変形例３］
第２実施形態では、送話制御部２１１ｃが、マイクロホン１１３，１１４のＯＮ状態とＯＦＦ状態とを同時に切り替えた。しかしながら、送話制御部２１１ｃが、マイクロホン１１３のＯＮ状態とＯＦＦ状態の切り替えと、マイクロホン１１４のＯＮ状態とＯＦＦ状態の切り替えとを独立に行ってもよい。

【0081】

送話制御部２１１ｃが、外部の騒音の大きさに応じて、マイクロホン１１３（耳内マイクロホン）を使用するか、マイクロホン１１４（外部マイクロホン）を使用するかを切り替えてもよい。ここで、騒音が大きく、マイクロホン１１３に切り替えられた場合には、発話が行われていると判定された時間区間を制限区間とし、発話が行われていないと判定された時間区間を非制限区間としてもよい。一方、騒音が小さく、マイクロホン１１４に切り替えられた場合には、発話が行われているか否かにかかわらず、非制限区間とされてもよい。

【0082】

外部の騒音の大きさに応じて、マイクロホン１１３とマイクロホン１１４とを自動的に切り替えることに代え、利用者１０００が手動で、マイクロホン１１３を使用するか、マイクロホン１１４を使用するかを切り替えてもよい。この場合も、マイクロホン１１３に切り替えられた場合には、発話が行われていると判定された時間区間を制限区間とし、発話が行われていないと判定された時間区間を非制限区間としてもよい。一方、マイクロホン１１４に切り替えられた場合には、発話が行われているか否かにかかわらず、非制限区間とされてもよい。

【0083】

まとめると、スピーカ１１２（第１スピーカ）は、外耳道１０１１に向けて装着されるように構成されており、外耳道１０１１の中に装着されるように構成されたマイクロホン１１３（耳内マイクロホン）をマイクロホンとして設定するか、外耳道１０１１の外に配置されるように構成されたマイクロホン１１４（外部マイクロホン）をマイクロホンとして設定するかを切り替え可能であり、制限区間は、マイクロホン１１３（耳内マイクロホン）がマイクロホンとして設定され、かつ、マイクロホン１１３で集音された音響信号に基づいて発話が行われていると判定された時間区間であり、非制限区間は、それ以外の時間区間であってもよい。

【0084】

［第２実施形態の変形例４］
第２実施形態で示した＜判定ステップの一例＞では、マイクロホン１１３で集音された音響信号と、受話信号Ｒ_１に基づく音響信号と、に基づいて、発話の状態を判定した。しかし、＜判定ステップの一例＞において、マイクロホン１１３がマイクロホン１１４に置換されてもよいし、マイクロホン１１３がマイクロホン１１３，１１４に置換されてもよい。また、＜判定ステップの一例＞では、前の時間区間が時間区間ｔ－１である例を示したが、前の時間区間が時間区間ｔ－γであってもよい。ただし、γは１以上の整数である。

【0085】

［第２実施形態の変形例５］
本形態のマイクロホン１１３は、耳内マイクロホンであり、身体を伝達した音響信号を集音するように構成されている。前述のように、身体を介して伝達された音声は、その高域周波数成分が大きく減衰する。そのため、マイクロホン１１３で集音された音声信号は、低周波数成分に比べて高域周波数成分が大きく減衰したものになる。そのため、判定ステップにおいて、判定部２１１ａがマイクロホン１１３で集音された音響信号のうち、高域周波数成分よりも低周波数成分を優先的に扱って発話の状態の判定を行ってもよい。これにより、発話の状態をより精度よく判定できるからである。例えば、判定部２１１ａは、以下の何れかのように発話の状態の判定を行ってもよい。なお、高域周波数は、低域周波数よりも高い。
（１）判定部２１１ａは、マイクロホン１１３で集音された音響信号に代えて、マイクロホン１１３で集音された音響信号の低域周波数の成分を含むが音響信号の高域周波数の成分を含まない信号を用い、発話の状態の判定を行ってもよい。
（２）判定部２１１ａは、マイクロホン１１３で集音された音響信号に代えて、マイクロホン１１３で集音された音響信号の低域周波数の成分に高域周波数の成分よりも大きな重みを与えて得られる信号を用い、発話の状態の判定を行ってもよい。
（３）判定部２１１ａは、マイクロホン１１３で集音された音響信号に代えて、判定部２１１ａは、マイクロホン１１３で集音された音響信号の高域周波数の成分を低域周波数の成分よりも抑制して得られる信号を用い、発話の状態の判定を行ってもよい。

【0086】

［第２実施形態の変形例６］
上述の判定ステップの一例では、判定部２１１ａは、前の時間区間ｔ－γ（例えば、γ＝１）が非制限区間である場合に、推定送話信号Ｓ（ｔ）に基づいて発話の状態を判定する。ここで、推定送話信号Ｓ（ｔ）＝Ｍ（ｔ）－Ｈ（ｔ）＊Ｒ_１（ｔ）は、マイクロホン１１３で集音された音響信号に基づく信号Ｍ（ｔ）から受話信号Ｒ_１（ｔ）（第１受話信号）に基づく推定回り込み信号Ｗ（ｔ）＝Ｈ（ｔ）＊Ｒ_１（ｔ）を減じて得られる信号であった。ここで、マイクロホン１１３で集音された音声信号は、低周波数成分に比べて高域周波数成分が大きく減衰したものになる。このような場合、Ｗ（ｔ）＝Ｈ（ｔ）＊Ｒ_１（ｔ）に代えて、推定回り込み信号Ｗ（ｔ）の低域周波数の成分を高域周波数の成分よりも抑制して得られる信号を推定回り込み信号として用いるか、または、推定回り込み信号Ｗ（ｔ）の高域周波数の成分を低域周波数の成分よりも増幅して得られる信号を推定回り込み信号として用いることが望ましい。これにより、推定送話信号Ｓ（ｔ）に含まれる信号Ｍ（ｔ）の低域周波数成分が強調され、発話の状態をより精度よく判定できるからである。

【0087】

より好ましくは、マイクロホン１１３で集音された音響信号に基づく信号Ｍ（ｔ）として、マイクロホン１１３で集音された音響信号の高域周波数成分よりも低周波数成分を優先的に扱って得られる信号を用いてもよい（第２実施形態の変形例５）。第２実施形態の変形例５で例示したように、マイクロホン１１３で集音された音響信号の高域周波数成分よりも低周波数成分を優先的に扱って得られる信号の具体例は以下の通りである。
（１）マイクロホン１１３で集音された音響信号の低域周波数の成分を含むが音響信号の高域周波数の成分を含まない信号。
（２）マイクロホン１１３で集音された音響信号の低域周波数の成分に高域周波数の成分よりも大きな重みを与えて得られる信号。
（３）マイクロホン１１３で集音された音響信号の高域周波数の成分を低域周波数の成分よりも抑制して得られる信号。

【0088】

［第２実施形態の変形例７］
判定部２１１ａが、送話制御部１１１ｃと受話制御部２１１ｂにアクセスし、上述のように発話の状態を判定し、さらに受話信号Ｒ_１（第１受話信号）のレベル（大きさ、例えば、振幅やパワー）を判定してもよい。この場合、受話制御部２１１ｂは、これらの判定部２１１ａでの判定結果に基づいて、発話が行われており、かつ、受話信号Ｒ_１のレベルが基準値ＴＨ３（第３基準値）を超える時間区間を制限区間に設定し、それ以外の時間区間を非制限区間に設定してもよい。ここで、基準値ＴＨ３は予め定められた実数定数である。すなわち、発話が行われていても、スピーカ１１２から再生される受話信号Ｒ_１のレベルが小さいときには音響エコーが問題にならないことがある。一方で、発話が行われ、かつ、スピーカ１１２から再生される受話信号Ｒ_１のレベルが大きいときには、音響エコーの問題が深刻になる。そのため、発話が行われており、かつ、受話信号Ｒ_１のレベルが基準値ＴＨ３を超える時間区間を制限区間に設定し、それ以外の時間区間を非制限区間に設定することで、音響エコーの抑制と、快適な聴取環境の実現とを適切なバランスで実現できる。

【0089】

［第２実施形態の変形例８］
第１実施形態の変形例５と同様に、制限区間において、通話制御装置１２１（図３）の受話制御部１２１ｂが、スピーカ１２２から、受話信号Ｒ_２（第２受話信号）だけでなく、さらに受話信号Ｒ_１（第１受話信号）を再生してもよい。例えば、通話制御装置２１１の受話制御部２１１ｂが、制限区間のときに、受話信号Ｒ_１を受話制御部１２１ｂに送り、受話制御部１２１ｂが受話信号Ｒ_１と受話信号Ｒ_２とをスピーカ１２２から再生してもよい。これにより、制限区間でスピーカ１１２による受話信号Ｒ_１の再生が制限されても、スピーカ１２２から受話信号Ｒ_１が再生される。その結果、制限区間であっても、利用者１０００は、受話信号Ｒ_１と受話信号Ｒ_２の両方の再生音を聴取できる。これは、ステレオ信号のように、受話信号Ｒ_１と受話信号Ｒ_２とが異なっている場合に特に有効である。

【0090】

［第２実施形態の変形例９］
第２実施形態では、送話制御部２１１ｃは、非制限区間では、マイクロホン１１３，１１４から送られた音響信号に基づく送話信号Ｔを全く出力しなかった。しかし、例えば、非制限区間において、送話制御部２１１ｃが送話信号Ｔのレベルを下げた送話信号を送信してもよいし、送話信号Ｔの低域周波数よりも高域周波数を減衰させた信号を送話送信してもよい。すなわち、送話制御部２１１ｃは、制限区間において送話信号Ｔを送信し、非制限区間において送話信号Ｔの送信を制限すればよい。これによっても、送話信号Ｔに基づく音響エコーを抑制できるからである。また、送話制御部２１１ｃが、制限区間および非制限区間の両方において、送話信号Ｔを制限することなく送信してもよい。これによっても、送話信号Ｔに基づく音響エコーが問題にならないケースもあるからである。すなわち、以下のような処理が行われてもよい。

【表4】

【0091】

［第３実施形態］
アクティブ・ノイズ・キャンセリング（ＡＮＣ）に用いるマイクロホンやスピーカを第１，２実施形態およびそれらの変形例のマイクロホンやスピーカに流用してもよい。

【0092】

＜構成＞
図１に例示するように、本実施形態の通話システムでは、通話システム３－ｉを装着したＩ人の利用者１０００－ｉが通話（音声通信）を行う。通話システム３－ｉは通話装置３１－ｉ，３２－ｉを含む。ただし、ｉ＝１，２，…，Ｉであり、Ｉは２以上の整数である。図１は、Ｉ＝２の例であり、通話システム３－１および通話システム３－２をそれぞれ装着した２人の利用者１０００－１，１０００－２が通話を行う例を示している。しかし、これは本発明を限定するものではなく、本実施形態の通話システム３－ｉを装着して３人以上の利用者が通話を行ってもよい。

【0093】

＜通話装置３１＞
図２Ａに例示するように、本形態の通話装置３１は、第１実施形態の本形態の通話装置１１の通話制御装置１１１を、通話制御装置３１１に置換したものである。すなわち、通話装置３１は、通話制御装置３１１、スピーカ１１２、マイクロホン１１３、マイクロホン１１４、筐体１１５、およびイヤーチップ１１６を有する。

【0094】

＜通話装置３２＞
図６に例示するように、本形態の通話装置３２は、利用者１０００の耳１０２０に装着されるように構成されている。本形態の通話装置３２は、通話制御装置３２１、スピーカ１２２、マイクロホン３２３（耳内マイクロホン）、マイクロホン３２４（外部マイクロホン）、筐体３２５、およびイヤーチップ１２６を有する。

【0095】

筐体３２５は、中空の中空部１２５１，１２５２および先端部１２５３を有している。筐体３２５の中空部１２５１側の壁には音孔３２５ａが設けられている。音孔３２５ａは筐体３２５の壁よりも音を透過しやすい孔であり、例えば、貫通孔等である。中空部１２５１の内部には通話制御装置３２１が取り付けられ、通話制御装置３２１はスピーカ１２２およびマイクロホン３２３，３２４と電気的に接続されている。

【0096】

マイクロホン３２３は、例えば、先端部１２５３内部の中空部１２５２側の位置に取り付けられている。このマイクロホン３２３の受音位置は、中空部１２５２と同一の空間に面している。ここで、マイクロホン３２３は、利用者１０００の身体を伝達した音響信号を集音するように構成されている。

【0097】

マイクロホン３２４は中空部１２５１の内部に配置されている。マイクロホン３２４の受音位置は、音孔３２５ａの近傍であり、マイクロホン３２４はこの音孔３２５ａを通じて筐体３２５の外部の音を集音できるように構成されている。図６の例では、マイクロホン３２４はスピーカ１２２の背面側に配置されている。

【0098】

通話装置３２は、開放端１２５３ａを利用者１０００の一方の鼓膜１０２２側に向けた状態で、イヤーチップ１２６が取り付けられた先端部１２５３が耳１０２０の外耳道１０２１に挿入されるように構成されている。これにより、先端部１２５３の内部に取り付けられたマイクロホン３２３が、外耳道１０２１の近傍または外耳道１０２１の中に配置される。一方、中空部１２５１の内部に配置されたマイクロホン３２４は、外耳道１０２１の外側に配置される。

【0099】

図７に例示するように、通話制御装置３１１は、判定部１１１ｃ（２１１ａ）、受話制御部１１１ｂ（２１１ｂ）、送話制御部１１１ｃ（２１１ｃ）、ＡＮＣ処理部３１１ｄ、および合成部３１１ｅを含む。スピーカ１１２は、合成部３１１ｅを介して、ＡＮＣ処理部３１１ｄおよび受話制御部１１１ｂ（２１１ｂ）と電気的に接続されている。マイクロホン１１３は、送話制御部１１１ｃ（２１１ｃ）およびＡＮＣ処理部３１１ｄと電気的に接続されている。マイクロホン１１４は、ＡＮＣ処理部３１１ｄと電気的に接続されている。

【0100】

通話制御装置３２１は、受話制御部１２１ｂ、ＡＮＣ処理部３２１ｄ、および合成部３２１ｅを含む。スピーカ１２２は、合成部３２１ｅを介して受話制御部１２１ｂおよびＡＮＣ処理部３２１ｄと電気的に接続されている。マイクロホン３２３，３２４は、ＡＮＣ処理部３２１ｄと電気的に接続されている。

【0101】

＜処理＞
通話を行う利用者１０００は、前述のように、一方の耳１０１０（例えば、左耳）に通話装置３１を装着し、他方の耳１０２０（例えば、右耳）に通話装置３２を装着する（図１，図２Ａ，図６）。ＡＮＣ処理部３１１ｄは、マイクロホン１１３，１１４で集音された音響信号に基づいて、ＡＮＣのための出力音響信号を生成し、スピーカ１１２に送る。スピーカ１１２は、この出力音響信号を放出する。同様に、ＡＮＣ処理部３２１ｄは、マイクロホン３２３，３２４で集音された音響信号に基づいて、ＡＮＣのための出力音響信号を生成し、スピーカ１２２に送る。スピーカ１２２は、この出力音響信号を放出する。なお、ＡＮＣには周知の方法を用いればよい。その他の処理は、第１，２実施形態およびそれらの変形例の何れかと同じである。

【0102】

［ハードウェア構成］
各実施形態における通話制御装置１１１，２１１，３１１，１２１，３２１は、例えば、ＣＰＵ（central processing unit）等のプロセッサ（ハードウェア・プロセッサ）やＲＡＭ（random-access memory）・ＲＯＭ（read-only memory）等のメモリ等を備える汎用または専用のコンピュータが所定のプログラムを実行することで構成される装置である。すなわち、各実施形態における通話制御装置１１１，２１１，３１１，１２１，３２１は、例えば、それぞれが有する各部を実装するように構成された処理回路（processing circuitry）を有する。このコンピュータは１個のプロセッサやメモリを備えていてもよいし、複数個のプロセッサやメモリを備えていてもよい。このプログラムはコンピュータにインストールされてもよいし、予めＲＯＭ等に記録されていてもよい。また、ＣＰＵのようにプログラムが読み込まれることで機能構成を実現する電子回路（circuitry）ではなく、単独で処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。また、１個の装置を構成する電子回路が複数のＣＰＵを含んでいてもよい。

【0103】

上述のプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は非一時的な（non-transitory）記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。

【0104】

このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。上述のように、このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

【0105】

各実施形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

【0106】

［その他の変形例］
なお、本発明は上述の実施形態に限定されるものではない。例えば、耳内マイクロホンであるマイクロホン１１３に代えて、身体を伝達した音響信号を集音するように構成されたその他のマイクロホンが用いられてもよい。例えば、マイクロホン１１３として、咽喉マイクロホンが用いられてもよいし、骨伝導マイクロホンが用いられてもよい。また、マイクロホン１１３，１１４の一方が省略されてもよい。また、マイクロホン１１３に代えて、空気中を伝搬した音響信号を観測するマイクロホンが用いられてもよい。

【0107】

上述の実施形態およびそれらの変形例では、マイクロホンおよびスピーカを備えたイヤホンに本発明を実装する例を説明した。しかしながら、マイクロホンおよびスピーカを備えたヘッドホン等のその他の装置に本発明を実装してもよい。また、利用者１０００が上述の通話システムを装着し、さらにイヤマフを装着してもよい。また、マイクロホンやスピーカが利用者１０００の耳等の身体に装着されなくてもよい。例えば、マイクロホンや複数のスピーカが床、壁、椅子等に設置されており、複数のスピーカのうち、いずれかの第１スピーカからの再生音が利用者１０００の一方の耳で主に聴取され、他の何れかの第２スピーカからの再生音が利用者１０００の他方の耳で主に聴取されるように構成されていてもよい。例えば、第１スピーカからの再生音が利用者１０００の一方の耳でのみ聴取され、第２スピーカからの再生音が利用者１０００の他方の耳でのみ聴取されるように構成されていてもよい。このような場合でも、第２スピーカの音放出位置からマイクロホンの受音位置までの間での音の減衰量が、第１スピーカの音放出位置からマイクロホンの受音位置までの間での音の減衰量よりも大きければ、上述した効果を得ることができる。

【0108】

第２実施形態およびその変形例において、判定部２１１ａが、受話信号Ｒ_１に対して適応フィルタによるエコーキャンセル処理を行ってから判定ステップを行ってもよい。

【0109】

制限区間と非制限区間とで、スピーカ１２２から再生される受話信号Ｒ_２のレベルも異なってもよい。例えば、制限区間でスピーカ１２２から再生される受話信号Ｒ_２のレベルが、非制限区間でスピーカ１２２から再生される受話信号Ｒ_２のレベルよりも大きくてもよい。制限区間では、もう一方のスピーカ１１２から再生される受話信号Ｒ_１のレベルが制限されるため、利用者１０００の聞き易さが低下する。制限区間でスピーカ１２２から再生される受話信号Ｒ_２のレベルを大きくすることで、この問題を軽減できる。

【0110】

また、上述した各部での処理は、時間領域で行われてもよいし、時間周波数領域で行われてもよい。

【0111】

また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、特許請求の範囲の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。例えば、上述した変形例を組み合わせて実行されてもよい。

【符号の説明】

【0112】

１，２，３通話システム
１１，１２，２１，３１，３２通話装置
１１１，１２１，２１１，３１１，３２１通話制御装置
１１２，１２２スピーカ
１１３，１１４，１２２，３２３，３２４マイクロホン
１１１ａ，２１１ａ判定部
１１１ｂ，２１１ｂ受話制御部
１１１ｃ，２１１ｃ送話制御部

【図1】