(58)【調査した分野】(Int.Cl.,DB名)
前記第1の音響の集音結果に基づく音響信号に対して、少なくとも、前記音響デバイスから出力される音響信号が、前記内部空間を介して前記第2の音響として集音されるまでの系の伝達関数に応じた特性を付与し、前記第1の信号成分として出力する第3のフィルタ処理部を備える、請求項1に記載の信号処理装置。
前記第3のフィルタ処理部は、前記第1のフィルタ処理部から出力される前記差分信号を入力信号として、前記第1の信号成分を生成する、請求項2に記載の信号処理装置。
【発明を実施するための形態】
【0013】
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0014】
なお、説明は以下の順序で行うものとする。
1.概要
2.ヒアスルー効果を実現するための原理
2.1.概要
2.2.基本的な機能構成
3.第1の実施形態
4.第2の実施形態
4.1.概略的な機能構成
4.2.遅延量を低減するための構成例
4.3.変形例
4.4.まとめ
5.第3の実施形態
6.ハードウェア構成
7.まとめ
【0015】
<1.概要>
まず、本開示に係る信号処理装置の特徴をよりわかりやすくするために、当該信号処理装置を適用し得る、イヤフォンやヘッドフォンのような頭部装着型音響デバイスの適用例について説明したうえで、本開示に係る信号処理装置の課題について整理する。
【0016】
イヤフォンやヘッドフォンのようにユーザが頭部に装着して使用する頭部装着型音響デバイスの中には、単に音響情報を出力するのみのものに限らず、利用シーンを想定した機能が付加されたものも普及してきている。具体的な一例として、所謂ノイズキャンセリング技術を利用することで、外部環境からの環境音(所謂、ノイズ)を抑制し遮音効果を高めることが可能な頭部装着型音響デバイスが挙げられる。
【0017】
一方で、所謂スマートフォン、タブレット端末、及びウェアラブル端末のように、ユーザが携行可能に構成された情報処理装置の普及に伴い、頭部装着型音響デバイスの利用シーンも、所謂オーディオコンテンツの聴取に限らず、さらに多様化してきている。
【0018】
例えば、近年では、情報処理装置が、音声合成技術により通知対象となる情報を音声により読み上げることで、ユーザが、画面等を確認することなく、当該情報を認識可能としたユーザインタフェース(UI:User Interface)が普及してきている。また、他の一例として、音声認識技術を応用することで、ユーザが、情報処理装置と音声により対話を行うことで、当該機器を操作可能とした、音声入力に基づく対話型のUIも普及してきている。
【0019】
このようなUIを所謂公共の場でも使用可能とするために、頭部装着型音響デバイスを、ユーザが常時装着している状況下も想定されるようになってきている。例えば、
図1は、本開示の一実施形態に係る信号処理装置を適用した頭部装着型音響デバイスの適用例について説明するための説明図である。即ち、
図1に示す例では、ユーザは、外出時等のように所謂公共の場において、頭部装着型音響デバイス51を装着しながら、スマートフォン等のような携行可能な情報処理装置を利用しているシーンの一例を示している。
【0020】
このように、ユーザが頭部装着型音響デバイス51を常時装着している状況下においては、情報処理装置から出力される音響情報(例えば、オーディオコンテンツ)を聴取可能であり、かつ、外部環境からの所謂環境音についても聴取可能な状態であることが望ましい場合がある。また、この場合には、ユーザが、外部環境からの環境音を、頭部装着型音響デバイス51を装着していない場合と同様の態様で聴取可能であることがより望ましい。
【0021】
なお、以降の説明では、ユーザが、頭部装着型音響デバイス51を装着している場合においても、外部環境からの所謂環境音を、当該頭部装着型音響デバイス51を装着していない場合と同様の態様で聴取可能な状態を、「ヒアスルー状態」と称する場合がある。同様に、ユーザが、頭部装着型音響デバイスを装着している場合においても、外部環境からの所謂環境音を、当該頭部装着型音響デバイス51を装着していない場合と同様の態様で聴取可能とする効果を、「ヒアスルー効果」と称する場合がある。
【0022】
上記に説明したようなヒアスルー状態が実現されると、例えば、ユーザは、公共の場においても、頭部装着型音響デバイスを装着した状態で周囲の状況を確認しながら、メールやニュースの通知の内容を示す音声出力を確認することが可能となる。また、他の一例として、ユーザは、移動中に周囲の状況を確認しながら、所謂通話機能により、他のユーザとの通話を行うことも可能となる。
【0023】
一方で、より自然なヒアスルー効果をユーザに体験させるためには、所謂カナル型のイヤフォンのように密閉性が高い(換言すると、外部環境との間の遮蔽性が高い)頭部装着型音響デバイスの使用を前提とした技術が重要となる。これは、所謂オープンエアヘッドフォンのような密閉性が比較的低い頭部装着型音響デバイスが使用される状況下では、所謂音漏れの影響が大きく、公共の場での使用が必ずしも好適ではない場合があることに起因する。
【0024】
他方で、カナル型のイヤフォンのように密閉性の高い頭部装着型音響デバイスが使用される状況下では、頭部装着型音響デバイスを介してユーザの耳の中(所謂外耳道)に漏れ込む外部環境からの環境音についても、少なくとも一部が遮蔽されることとなる。そのため、ユーザは、外部環境からの環境音を、頭部装着型音響デバイスを装着していない状態とは異なる態様で聴取するか、もしくは、当該環境音を聴取
することが困難となる可能性がある。
【0025】
そこで、本開示では、所謂カナル型のイヤフォンのように密閉性の高い頭部装着型音響デバイスが使用される状況下において、上記に説明したようなヒアスルー状態を実現するための技術の一例について説明する。
【0026】
<2.ヒアスルー効果を実現するための原理>
[2.1.概要]
まず、ヒアスルー効果を実現するための原理の一例について、所謂、FF(Feed-Forward)型のNC(Noise Canceling)イヤフォン(もしくは、ヘッドフォン)の例と比較して説明する。例えば、
図2は、ヒアスルー効果を実現するための原理の一例について説明するための説明図であり、頭部装着型音響デバイス51を、所謂FF型のNCイヤフォンとして構成する場合における、当該頭部装着型音響デバイス51の概略的な機能構成の一例を示している。
【0027】
図2に示すように、頭部装着型音響デバイス51は、例えば、マイクロフォン71と、フィルタ回路72と、パワーアンプ73と、スピーカ74とを含む。なお、
図2において、参照符号Fは、音源Sからの音響Nが、頭部装着型音響デバイス51の筐体を介して、ユーザの耳の中(即ち、外耳道内)に到達する(即ち、漏れ込む)までの伝搬環境の伝達関数を模式的に示している。また、参照符号F’は、音源Sからの音響Nが、マイクロフォン71に到達するまでの伝搬環境の伝達関数を模式的に示している。
【0028】
ここで、
図3を参照する。
図3は、ユーザUが、頭部装着型音響デバイス51として、所謂カナル型のイヤフォンを装着した場合に、音源Sからの音響Nが当該ユーザUに聴取されるまでの伝搬環境の一例を模式的に示した図である。
図3において、参照符号UAは、ユーザUの外耳道内の空間(以降では、単に「外耳道」と称する場合がある)を模式的に示している。また、
図3における参照符号F及びF’は、
図2に示す伝搬環境F及びF’に対応している。なお、以降の説明では、
図3に示すように、ユーザUの耳部に対して頭部装着型音響デバイス51が装着された場合における、当該頭部装着型音響デバイス51の内側において外耳道UAと連接する空間を「内部空間」と称する場合がある。また、ユーザUの耳部に対して頭部装着型音響デバイス51が装着された場合における、当該頭部装着型音響デバイス51の外側の空間を「外部空間」と称する場合がある。
【0029】
図2及び
図3に示すように、ユーザの耳部U’(具体的には、外耳道UAに連接する内部空間)には、伝搬環境Fを介して伝搬した音源Sからの音響Nが漏れ込む場合がある。そのため、NCイヤフォンでは、伝搬環境Fを介して伝搬した音響Nに対して、逆相の信号(ノイズ低減信号)を加算することで、当該音響Nの影響を緩和している。
【0030】
具体的には、外部環境の音源Sからの音響Nは、例えば、伝搬環境F’を介してマイクロフォン71に到達し、当該マイクロフォン71に集音される。フィルタ回路72は、マイクロフォン71に集音された音響Nに基づき、伝搬環境Fを介して伝搬する当該音響Nの逆相の信号(ノイズ低減信号)を生成する。フィルタ回路72により生成されたノイズ低減信号は、パワーアンプ73によりゲインが調整され、スピーカ74を介して、ユーザの耳部U’に向けて出力される。これにより、伝搬環境Fを介して伝搬してユーザの耳部U’に伝搬する音響Nの成分が、スピーカ74から出力されるノイズ低減信号の成分により打ち消され、当該音響Nが抑制されることとなる。
【0031】
ここで、マイクロフォン71、パワーアンプ73、及びスピーカ74それぞれのデバイス特性に基づく伝達関数を、M、A、及びHとする。また、フィルタ回路72が、マイクロフォン71により集音された音響信号に基づきノイズ低減信号を生成する際のフィルタ係数をαとする。このとき、NCイヤフォンでは、以下に(式1)で示す関係式を満たすように、フィルタ回路72のフィルタ係数αを設計することで、所謂ノイズキャンセリングを実現している。
【0033】
これに対して、ヒアスルー状態では、
図3に示すように、頭部装着型音響デバイス51が装着されている状態で、ユーザUが、外部環境の音源Sからの音響Nを、頭部装着型音響デバイス51を装着していない場合と略等しい態様で聴取することとなる。
【0034】
例えば、
図4は、ユーザUが、頭部装着型音響デバイス51を装着していない場合に、音源Sからの音響Nが当該ユーザUに聴取されるまでの伝搬環境の一例を模式的に示した図である。
図4において、参照符号Gは、音源Sからの音響Nが、ユーザUの外耳道UA内に直接到達するまでの伝搬環境の伝達関数を模式的に示している。
【0035】
即ち、
図2に示した頭部装着型音響デバイス51に基づき、ヒアスルー効果を実現する場合には、
図3に示した状況(頭部装着型音響デバイス51が装着された状況)と、
図4に示した状況(頭部装着型音響デバイス51が装着されていない状況)とが等化となるように、スピーカ74から出力される音響を生成できればよいこととなる。
【0036】
具体的には、ヒアスルー効果を実現する場合におけるフィルタ回路72のフィルタ係数をγとすると、以下に(式2)及び(式3)で示す関係式を満たすように、当該フィルタ係数γを設計することで、理想的には、ヒアスルー効果を実現することが可能となる。
【0038】
なお、ノイズキャンセリングとヒアスルー効果とのそれぞれは、双方ともに、
図2に示すように、頭部装着型音響デバイス51を介して外耳道UA内に伝搬する音響Nと、スピーカ74から出力される音響との、空中での音波加算により各効果が実現される。そのため、音源Sからの音響Nが、マイクロフォン71により集音され、フィルタ回路72及びパワーアンプ73を介してスピーカ74から出力されるまでの遅延量が、ADC(ADコンバータ)やDAC(DAコンバータ)による変換処理も含めて、約100μs以下に抑えられることが望ましいことがわかっている。
【0039】
ここで、上記に説明した、遅延量を100μs以下とする理由についてさらに詳しく説明する。密閉性の高い頭部装着型音響デバイス51(例えば、カナル型のイヤフォンやオーバーヘッド型のヘッドフォン)において、筐体に設置されたマイクロフォン71の集音結果に基づきヒアスルー効果を実現する場合には、ADC及びDACを設けることで、フィルタ係数γのフィルタ回路72をデジタルフィルタとして構築することが望ましい。これは、フィルタ回路72をデジタルフィルタとして構築することで、アナログフィルタに比べてばらつきが少なく、かつ、アナログフィルタでは実現が困難なフィルタ処理を容易に実現することが可能であることに起因する
【0040】
一方で、ADC及びDACを設ける場合には、デシメーション及びインターポレーション等のフィルタリング処理により処理負荷が増大し、その分だけ遅延が生じることとなる。
【0041】
前述したように、
図2において、スピーカ74から出力される音響と、伝搬環境Fを介して伝搬する音源Sからの音響Nとは、外耳道UA内の空間(換言すると、鼓膜付近の空間)で加算され、加算後の音が1つの音としてユーザに認識されることとなる。そのため、一般的には、遅延量が10msを超えるとエコーが発生しているように認識されたり、音が二重に聞こえるように認識されるといった現象が生じることが知られている。また、遅延量が10msに満たない場合においても、音の相互干渉により周波数特性に影響を与える場合があり、ヒアスルー効果やノイズキャンセリングを実現することが困難となる場合がある。
【0042】
具体的な一例として、
図2において、スピーカ74から出力される音響と、伝搬環境Fを介して伝搬する音源Sからの音響Nとの間に、1msの遅延が生じたものとする。この場合には、1kHz近傍の帯域の音響信号については、位相が1周期分(即ち、360deg)ずれて加算される。これに対して、500Hz近傍の帯域の音響信号については、位相が逆相となり、打ち消しあうこととなる。即ち、1msの遅延が生じた信号どうしが単純加算された場合には、所謂ディップが生じることとなる。一方で、遅延量を100μsに抑えた場合には、逆相の関係によりディップが生じる周波数帯を、5kHzまで上げることが可能となる。
【0043】
一般的には、人間の外耳道は、個人差はあるものの、概ね3kHz〜4kHz近傍に共振点があることが知られている。そのため、4kHzを超える周波数帯においては、所謂個人差の部分に相当するため、遅延量を100μs以下に抑えることで、ディップが生じる周波数帯が5kHz近傍となるように調整することで、好適なヒアスルー効果を得られるものと考えられる。
【0044】
[2.2.基本的な機能構成]
次に、
図5を参照して、ヒアスルー効果を実現するための信号処理装置の基本的な機能構成の一例について説明する。
図5は、本開示の一実施形態に係る信号処理装置80の基本的な機能構成の一例を示したブロック図である。なお、前述の通り、信号処理装置80は、各音響信号をデジタル信号に変換して各種フィルタ処理を施すため、実際にはDAC及びADCを含むが、
図5に示す例では、説明をよりわかりやすくするために、DAC及びADCの記載を省略している。
【0045】
図5において、参照符号51a及び51bは、前述した頭部装着型音響デバイス51を示している。即ち、参照符号51aは、右耳に装着された頭部装着型音響デバイス51を示しており、参照符号51bは、左耳に装着された頭部装着型音響デバイス51を示している。なお、頭部装着型音響デバイス51a及び51bを特に区別しない場合には、前述の通り、「頭部装着型音響デバイス51」と称する場合がある。また、
図5に示す例では、頭部装着型音響デバイス51a及び51bは、同様の構成を有するため、頭部装着型音響デバイス51a側にのみ着目して示し、頭部装着型音響デバイス51bについては図示を省略している。
【0046】
図5に示すように、頭部装着型音響デバイス51は、装着部510と、ドライバ511と、外部マイクロフォン513とを含む。
【0047】
装着部510は、頭部装着型音響デバイス51の筐体のうち、ユーザUに対して装着される部分を示している。
【0048】
例えば、頭部装着型音響デバイス51が、所謂カナル型のイヤフォンとして構成されている場合には、装着部510は、その外形として、装着者であるユーザUの耳孔部に対して少なくともその一部が挿入可能に構成され、それにより該ユーザUの耳部に対して装着できるようにされている。具体的には、この場合の装着部510にはユーザUの耳孔部に対して挿入可能な形状とされた耳孔挿入部が形成され、該耳孔挿入部が耳孔部に対して挿入されることで、装着部510がユーザUの耳部に対して装着状態となる。例えば、
図3に示す例は、頭部装着型音響デバイス51の装着部510がユーザUの耳部に対して装着されている状態を示していることとなる。
【0049】
なお、装着部510がユーザUに対して装着された場合に、当該装着部510の内側の空間(即ち、ユーザUの外耳道UAに連接する空間)が、前述した内部空間に相当する。
【0050】
ドライバ511は、スピーカ等の音響デバイスを駆動することで、当該音響デバイスに当該音響信号に基づく音響を出力させるための構成である。具体的な一例として、ドライバ511は、入力されたアナログの音響信号(換言すると、駆動信号)に基づき、スピーカの振動板を振動させることで、当該スピーカに当該音響信号に基づく音響を出力させる。
【0051】
外部マイクロフォン513は、頭部装着型音響デバイス51をユーザUに装着するための装着部510の外側の外部空間を伝搬する音響(所謂、環境音)を、直接的に集音するための集音デバイスである。外部マイクロフォン513は、例えば、MEMS(Micro Electro Mechanical Systems)技術に基づき形成された、所謂MEMSマイクロフォンとして構成され得る。なお、外部マイクロフォン513は、当該外部空間を伝搬する音響を集音可能であれば、その設置場所は特に限定されない。具体的な一例として、外部マイクロフォン513は、頭部装着型音響デバイス51の装着部に設けられていてもよいし、当該装着部とは異なる位置に設けられていてもよい。なお、外部マイクロフォン513により集音される音響(即ち、環境音)が、「第1の音響」の一例に相当する。
【0052】
図5に示す信号処理装置80は、ヒアスルー効果を実現するために、各種信号処理(例えば、
図2〜
図4を参照して説明したフィルタ処理)を実行するための構成である。
図5に示すように、信号処理装置80は、マイクアンプ111と、HTフィルタ121と、加算部123と、パワーアンプ141と、EQ(イコライザ)131とを含む。
【0053】
マイクアンプ111は、音響信号のゲインを調整するための所謂増幅器である。外部マイクロフォン513により集音された環境音は、マイクアンプ111によりゲインが調整され(例えば、増幅され)、HTフィルタ121に入力される。
【0054】
HTフィルタ121は、
図2〜
図4を参照して説明した、ヒアスルー効果を実現する場合におけるフィルタ回路72(
図2参照)に相当する。即ち、HTフィルタ121は、マイクアンプ111から出力される音響信号(即ち、外部マイクロフォン513に集音され、マイクアンプ111によりゲインが調整された音響信号)に対して、前述した(式2)及び(式3)に基づき説明したフィルタ係数γに基づく信号処理を施す。なお、このときHTフィルタ121より信号処理の結果として出力される音響信号を、以降では「差分信号」と称する場合がある。即ち、差分信号と、頭部装着型音響デバイス51の装着部510を介して内部空間に伝搬する環境音(即ち、
図2及び
図3において、伝搬環境Fを介して伝搬する音響)とが加算されることで、ユーザが直接聴取した場合の環境音が模擬されることとなる(即ち、ヒアスルー効果が実現されることとなる)。なお、HTフィルタ121が、「第1のフィルタ処理部」の一例に相当する。
【0055】
HTフィルタ121は、マイクアンプ111から出力される音響信号に対する信号処理の結果として生成した差分信号を、加算部123に出力する。
【0056】
EQ131は、オーディオコンテンツや音声電話における受話信号のように、信号処理装置80に入力される音響信号(以降では、「音響入力」と称する場合がある)に対して、所謂イコライジング処理を施す。具体的な一例として、ノイズキャンセリングやヒアスルー効果を実現する場合のように、環境音の集音結果をフィードバックする場合には、当該環境音の音響特性により低域側の成分のゲインが増大する傾向にある。そのため、EQ131は、音響入力から、当該フィードバックに基づき重畳される低域側の音響成分を事前に抑制するように、当該音響入力の音響特性(例えば、周波数特性)を補正する。なお、当該音響入力が、「入力音響信号」の一例に相当する。
【0057】
そして、EQ131は、イコライジング処理を施した音響入力を加算部123に出力する。
【0058】
加算部123は、EQ131から出力される音響入力(即ち、イコライジング処理後の音響入力)に対して、HTフィルタ121から出力される差分信号を加算し、加算結果として生成された音響信号をパワーアンプ141に出力する。
【0059】
パワーアンプ141は、音響信号のゲインを調整するための所謂増幅器である。加算部123から出力された音響信号(即ち、音響入力と差分信号との加算結果)は、パワーアンプ141によりゲインが調整され(例えば、増幅され)、ドライバ511に出力される。そして、パワーアンプ141から出力される音響信号に基づき、ドライバ511がスピーカを駆動することで、当該音響信号に基づく音響が、装着部510の内側の内部空間(即ち、ユーザUの外耳道UAに連接する空間)に放射される。
【0060】
なお、ドライバ511がスピーカを駆動することで内部空間に放射された音響は、前述したように、頭部装着型音響デバイス51の装着部510を介して内部空間に伝搬する環境音(即ち、
図2及び
図3において、伝搬環境Fを介して伝搬する音響)と加算されて、ユーザUに聴取される。このとき、ドライバ511から内部空間に放射された音響に含まれる差分信号の成分が、装着部510を介して内部空間に伝搬する環境音と加算されて、ユーザUに聴取されることとなる。即ち、ユーザUは、オーディオコンテンツ等の音響入力に加えて、環境音を、
図4に示すように、頭部装着型音響デバイス51を装着していない場合と同様の態様で聴取することが可能となる。
【0061】
なお、上記に説明した信号処理装置80の動作はあくまで一例であり、ユーザUが、頭部装着型音響デバイス51を装着している状態で、環境音を聴取可能であれば、信号処理装置80は、必ずしもヒアスルー効果を忠実に再現しなくてもよい。具体的な一例として、HTフィルタ121は、ユーザUが、頭部装着型音響デバイス51を装着していない状態よりも、環境音の音量がより高く感じるように、差分信号の特性やゲインを制御してもよい。同様に、HTフィルタ121は、ユーザUが、頭部装着型音響デバイス51を装着していない状態よりも、環境音の音量がより低く感じるように、差分信号の特性やゲインを制御してもよい。このような構成に基づき、信号処理装置80は、例えば、音響入力の入力状況や、当該音響入力の種別(例えば、オーディオコンテンツや音声通話の受話信号等)に応じて、ユーザUに聴取される環境音の音量を制御してもよい。
【0062】
以上、
図5を参照して、ヒアスルー効果を実現するための信号処理装置の基本的な機能構成の一例について説明した。
【0063】
一方で、所謂カナル型のイヤフォン等のように密閉性の高い頭部装着型音響デバイス51を装着している場合には、ユーザUは、自身が発声する声の聞こえ方に違和感を覚える場合があり、この点については、
図5に示す例についても同様である。これは、ユーザ自身が発声した声の振動が、内部空間内に伝搬することに起因する。そこで、
図6を参照して、ユーザ自身が発声した声の振動が内部空間内に伝搬する現象が発生する仕組みについて説明する。
図6は、ユーザ自身が発声した声の振動が内部空間内に伝搬する現象が発生する仕組みについて説明するための説明図である。
【0064】
図6に示すように、ユーザUが発声した声の振動は、当該ユーザUの頭部内で骨や肉を介して外耳道UAに伝搬し、外耳道壁を2次スピーカのように振動させる。ここで、カナル型のイヤフォンのように密閉性の高い頭部装着型音響デバイス51が装着されている場合には、当該頭部装着型音響デバイス51により外耳道UA内の空間の密閉度が高くなっており、空気の逃げ道が限られているため、当該空間内での振動が直接鼓膜に伝わることとなる。なお、このとき、内部空間内に伝搬したユーザUが発声した声の振動は、低域が増幅されたかのように鼓膜に伝わるため、ユーザUには、自身の声がくぐもったように聞こえることとなり、当該ユーザUは、違和感を覚えることとなる。
【0065】
本開示の各実施形態に係る信号処理装置は、上記に説明したような課題を鑑みてなされたものであり、より好適な態様で(即ち、ユーザがより違和感を覚えない態様で)ヒアスルー効果を実現することを目的としている。
【0066】
<3.第1の実施形態>
まず、
図7を参照して、本開示の第1の実施形態に係る信号処理装置の機能構成の一例について説明する。
図7は、本実施形態に係る信号処理装置の機能構成の一例について示したブロック図である。なお、以降の説明では、本実施形態に係る信号処理装置を、前述した信号処理装置80(
図5参照)と区別するために、「信号処理装置11」と称する場合がある。また、
図7に示す機能構成は、
図5に示した例と同様に、説明をよりわかりやすくするために、DAC及びADCの記載を省略している。
【0067】
図7に示すように、本実施形態に係る信号処理装置11は、マイクアンプ151と、減算部171と、オキュリュージョンキャンセラ161と、EQ132とを含む点で、前述した信号処理装置80(
図5参照)と異なる。また、
図7に示すように、本実施形態に係る信号処理装置11を適用可能な頭部装着型音響デバイス51は、内部マイクロフォン515を含む点で、前述した信号処理装置80を適用可能な頭部装着型音響デバイス51(
図5参照)と異なる。そこで、以降の説明では、本実施形態に係る信号処理装置11と、当該信号処理装置11を適用可能な頭部装着型音響デバイス51との機能構成について、特に、
図5に示す例と異なる部分に着目して説明する。
【0068】
内部マイクロフォン515は、頭部装着型音響デバイス51をユーザUに装着するための装着部510の内側の内部空間(即ち、ユーザUの外耳道UAに連接する空間)に伝搬する音響を集音するための集音デバイスである。内部マイクロフォン515は、外部マイクロフォン513と同様に、例えば、MEMS技術に基づき形成された、所謂MEMSマイクロフォンとして構成され得る。
【0069】
内部マイクロフォン515は、例えば、装着部510の内側に、外耳道UAの方向を向くように設置される。もちろん、内部マイクロフォン515は、当該内部空間に伝搬する音響を集音可能であれば、その設置場所は特に限定されないことは言うまでもない。
【0070】
なお、内部マイクロフォン515により集音される音響信号には、ドライバ511による制御に基づきスピーカから出力された音響の成分と、装着部510を介して内部空間に伝搬する環境音の成分(
図2及び
図3において、伝搬環境Fを介して伝搬する音響)と、外耳道UAに伝搬するユーザの声の成分(
図6に示す、声の成分)とが含まれる。また、内部マイクロフォン515により集音される音響(即ち、内部空間に伝搬する音響)が、「第2の音響」の一例に相当する。
【0071】
マイクアンプ151は、音響信号のゲインを調整するための所謂増幅器である。内部マイクロフォン515による集音結果(即ち、内部空間に伝搬する音響の集音結果)に基づく音響信号は、マイクアンプ151によりゲインが調整され(例えば、増幅され)、減算部171に入力される。
【0072】
EQ132は、内部マイクロフォン515及びマイクアンプ151のデバイス特性に応じて、音響入力に対してイコライジング処理を施すための構成である。具体的には、内部マイクロフォン515及びマイクアンプ151のデバイス特性に基づく伝達関数をMとした場合に、EQ132は、当該音響入力に対して、目標特性−Mとしての周波数特性を与える。なお、内部マイクロフォン515及びマイクアンプ151のデバイス特性に応じた伝達関数Mについては、事前の実験等の結果に基づき、あらかじめ算出しておけばよい。そして、EQ132は、イコライジング処理が施された音響入力を減算部171に出力する。なお、EQ132によりイコライジング処理が施された音響入力が、「第2の信号成分」の一例に相当する。
【0073】
減算部171は、マイクアンプ151から出力される音響信号から、EQ132から出力される音響入力(即ち、目標特性−Mとしての周波数特性が与えられた音響入力)を減算し、減算結果として生成された音響信号をオキュリュージョンキャンセラ161に出力する。なお、減算部171による減算結果として出力される音響信号は、内部マイクロフォン515により集音される音響信号の各成分のうち、音響入力の成分が抑制された音響信号に相当する。具体的には、当該音響信号には、前述した差分信号と装着部510を介して内部空間に伝搬する環境音とが加算された成分(以降では、「環境音の成分」と称する場合がある)と、ユーザUの頭部の骨や肉を介して外耳道UAに伝搬する当該ユーザUの声の成分(以降では、単に「声の成分」と称する場合がある)とが含まれることとなる。
【0074】
オキュリュージョンキャンセラ161は、所謂、FB(Feed-Back)型のNCフィルタと同様の原理で動作する、所謂フィルタ処理部に相当する。オキュリュージョンキャンセラ161は、減算部171から出力される音響信号に基づき、当該音響信号の成分を、あらかじめ決められた音量に抑制するための音響信号(以降では、「ノイズ低減信号」と称する場合がある)を生成する。
【0075】
なお、前述したように、減算部171から出力される音響信号には、環境音の成分と、声の成分とが含まれており、当該声の成分は、伝搬経路の特性により低域側が増幅されている。そのため、オキュリュージョンキャンセラ161は、例えば、ユーザUが頭部装着型音響デバイス51を装着していない場合と同様の態様で、当該ユーザUに当該声の成分を聴取させるために、減算部171から取得した音響信号のうち声の成分の低域側を抑制させるための、ノイズ低減信号を生成してもよい。なお、オキュリュージョンキャンセラ161が、「第2の信号処理部」の一例に相当する。
【0076】
以上のようにして、オキュリュージョンキャンセラ161は、減算部171から出力される音響信号に基づき、ノイズ低減信号を生成する。そして、オキュリュージョンキャンセラ161は、生成したノイズ低減信号を加算部123に出力する。
【0077】
EQ131は、
図5を参照して前述したEQ131と同様に、音響入力に対してイコライジング処理を施す。
【0078】
また、本実施形態に係るEQ131は、ドライバ511が駆動するスピーカの構造等によって出力音に与えられる特性と、当該スピーカから内部マイクロフォン515までの空間の伝達関数とに応じて、音響入力に対してさらにイコライジング処理を施す。例えば、ドライバ511が駆動するスピーカの構造等によって出力音に与えられる特性に相当する伝達関数と、当該スピーカから内部マイクロフォン515までの空間の伝達関数とを掛けあわせたものをHとする。この場合には、EQ131は、音響入力に対して、目標特性1/Hとしての周波数特性を与える。なお、ドライバ511が駆動するスピーカの構造等によって出力音に与えられる特性に相当する伝達関数と、当該スピーカから内部マイクロフォン515までの空間の伝達関数とについては、事前の実験等の結果に基づき、あらかじめ算出しておけばよい。そして、EQ131は、イコライジング処理が施された音響入力を加算部123に出力する。
【0079】
加算部123は、EQ131から出力される音響入力(即ち、イコライジング処理後の音響入力)に対して、HTフィルタ121から出力される差分信号と、オキュリュージョンキャンセラ161から出力されるノイズ低減信号とを加算する。そして、加算部123は、加算結果として生成された音響信号をパワーアンプ141に出力する。
【0080】
加算部123から出力された音響信号(即ち、音響入力、差分信号、及びノイズ低減信号の加算結果)は、パワーアンプ141によりゲインが調整され(例えば、増幅され)、ドライバ511に出力される。そして、パワーアンプ141から出力される音響信号に基づき、ドライバ511がスピーカを駆動することで、当該音響信号に基づく音響が、装着部510の内側の内部空間(即ち、ユーザUの外耳道UAに連接する空間)に放射される。
【0081】
以上、
図7を参照して本実施形態に係る信号処理装置11の機能構成の一例について説明した。なお、上記に説明した信号処理装置11の各構成の動作が実現可能であれば、信号処理装置11の構成は、必ずしも
図7に示す例には限定されない。
【0082】
例えば、
図8は、本実施形態に係る信号処理装置11の構成の一例について説明するための説明図である。
図7に示す例では、頭部装着型音響デバイス51と信号処理装置11とが、別装置として構成されていた。これに対して、
図8に示す例では、頭部装着型音響デバイス51と信号処理装置11とが同一筐体に設けられている場合の構成の一例について示している。具体的には、
図8に示す例では、頭部装着型音響デバイス51の装着部510内に、信号処理装置11に相当する構成(例えば、信号処理部)を内蔵している。
【0083】
もちろん、信号処理装置11は、独立した装置として構成されていてもよいし、所謂スマートフォン等のような情報処理装置の一部として構成されていてもよい。また、信号処理装置11のうち、少なくとも一部の構成が、当該信号処理装置11とは異なる外部装置(例えば、サーバ等)に設けられていてもよい。なお、このような場合においても、外部環境を伝搬する環境音が、外部マイクロフォン513により集音され、HTフィルタ121及びパワーアンプ141を介して頭部装着型音響デバイス51のスピーカから出力されるまでの遅延量が、ADCやDACによる変換処理も含めて、約100μs以下に抑えられることが望ましいことは言うまでもない。
【0084】
以上説明したように、本実施形態に係る信号処理装置11は、内部マイクロフォン515による集音結果(即ち、内部空間に伝搬する音響の集音結果)に基づき、ユーザUの声の成分のうち少なくとも一部の成分を抑制するノイズ低減信号を生成する。そして、信号処理装置11は、入力された音響入力に対して、生成した差分信号と、当該ノイズ低減信号とを加算し、加算後の音響信号を出力する。これにより、信号処理装置11から出力される音響信号に基づき、頭部装着型音響デバイス51のドライバ511がスピーカを駆動することで、当該音響信号に基づく音響が内部空間内に放射される。
【0085】
なお、ドライバ511がスピーカを駆動することで内部空間に放射される音響には、オキュリュージョンキャンセラ161により生成されたノイズ低減信号に基づく成分が含まれる。このノイズ低減信号に基づく成分は、内部空間内で、ユーザUの発話に基づき、外耳道UAに伝搬する当該ユーザUの声の成分と加算される。これにより、当該声の成分のうち、少なくとも一部の成分(例えば、声の成分のうち低域側の成分)が抑制され、当該抑制後の声の成分が、ユーザUの鼓膜に達し、当該ユーザUに聴取されることとなる。即ち、本実施形態に係る信号処理装置11に依れば、ユーザUが聴取される自身の声に違和感を覚えない態様で、ヒアスルー効果を実現することが可能となる。
【0086】
<4.第2の実施形態>
次に、本開示の第2の実施形態に係る信号処理装置について説明する。前述した第1の実施形態では、オキュリュージョンキャンセラ161を設けることにより、ユーザUが聴取される自身の声に違和感を覚えない態様で、ヒアスルー効果を実現していた。一方で、前述した第1の実施形態に係る信号処理装置11では、オキュリュージョンキャンセラ161が処理対象とする音響信号には、頭部装着型音響デバイス51のスピーカから出力された差分信号の成分が含まれている。そのため、オキュリュージョンキャンセラ161によって当該音響信号に基づき生成されるノイズ低減信号により、差分信号の成分が抑制され、ヒアスルー効果が十分に得られない(もしくは、ユーザUに特性の異なる環境音が聴取される)場合がある。
【0087】
即ち、本実施形態に係る信号処理装置は、上記に説明した課題を鑑みてなされており、第1の実施形態に係る信号処理装置11に比べて、より自然な態様(即ち、ユーザUがより違和感を覚えない態様)で、ヒアスルー効果を実現することを目的としている。なお、以降の説明では、本実施形態に係る信号処理装置を、前述した第1の実施形態に係る信号処理装置11と区別するために、「信号処理装置12」と称する場合がある。
【0088】
[4.1.概略的な機能構成]
まず、
図9を参照して、本実施形態に係る信号処理装置12の機能構成の一例について説明する。
図9は、本実施形態に係る信号処理装置の機能構成の一例について示したブロック図である。なお、
図9に示す機能構成は、
図5及び
図7に示した例と同様に、説明をよりわかりやすくするために、DAC及びADCの記載を省略している。
【0089】
図9に示すように、本実施形態に係る信号処理装置12は、モニターキャンセラ181と、減算部191とを含む点で、前述した第1の実施形態に係る信号処理装置11(
図7参照)と異なる。そこで、以降の説明では、本実施形態に係る信号処理装置12の機能構成について、特に、前述した第1の実施形態に係る信号処理装置11(
図7参照)と異なる部分に着目して説明する。
【0090】
モニターキャンセラ181及び減算部191は、マイクアンプ151から出力される音響信号(換言すると、内部マイクロフォン515の集音結果に基づく音響信号)中の各成分のうち、差分信号に相当する成分を抑制するための構成である。
【0091】
図9に示す信号処理装置12では、外部マイクロフォン513により集音された環境音は、マイクアンプ111によりゲインが調整され(例えば、増幅され)、HTフィルタ121とモニターキャンセラ181とに入力される。
【0092】
モニターキャンセラ181は、HTフィルタ121と同様に、マイクアンプ111から出力される音響信号に対して、前述した(式2)及び(式3)に基づき説明したフィルタ係数γに基づく信号処理を施すことで差分信号を生成する。
【0093】
また、モニターキャンセラ181は、生成した差分信号に対して、パワーアンプ141、ドライバ511、及びマイクアンプ151それぞれのデバイス特性と、内部空間内の空間特性との影響が反映されるように、各特性に応じた伝達関数に基づき、フィルタ処理を施す。これは、オキュリュージョンキャンセラ161から、パワーアンプ141、ドライバ511、及びマイクアンプ151を介して、当該オキュリュージョンキャンセラ161に至るまでの系の特性が、マイクアンプ111から出力される音響信号には反映されていないことに起因する。
【0094】
なお、モニターキャンセラ181において、上記に説明したフィルタ処理を実行するための構成として、無限インパルス応答フィルタ(IIRフィルタ)と有限インパルス応答フィルタ(FIRフィルタ)とを設けてもよい。この場合には、例えば、上記に説明したフィルタ処理のうち、単純遅延成分に対する処理を主にFIRフィルタに割り当て、周波数特性に関する処理を主にIIRフィルタに割り当てるとよい。
【0095】
もちろん、IIRフィルタ及びFIRフィルタを設ける構成は、あくまで一例であり、必ずしもモニターキャンセラ181の構成を限定するものではない。具体的な一例として、モニターキャンセラ181にFIRフィルタを設け、当該FIRフィルタに、単純遅延成分に対する処理と、周波数特性に関する処理との双方を実行させてもよい。
【0096】
また、他の一例として、遅延成分の影響が十分に小さい場合には、上記に説明したフィルタ処理を、IIRフィルタのみで再現してもよい。なお、遅延成分の影響を小さくするための方法の一例としては、例えば、ADC及びDACや、ビットレートの変換に使用するフィルタ(例えば、デシメーションフィルタ)として、低遅延のデバイスを採用する方法が挙げられる。また、ドライバ511(及びスピーカ)や、外部マイクロフォン513及び内部マイクロフォン515等の音響系として、駆動時の遅延がより短いデバイス(即ち、よりレスポンスの良いデバイス)を採用してもよい。また、内部空間内において、ドライバ511が駆動するスピーカと、内部マイクロフォン515とをより近接させることで、当該スピーカと内部マイクロフォン515との間の音速の遅延を低減させてもよい。
【0097】
なお、パワーアンプ141、ドライバ511、及びマイクアンプ151それぞれのデバイス特性と、内部空間内の空間特性とについては、例えば、時間引き伸ばしパルス(TSP:Time Stretched Pulse)等を用いて事前に導出することが可能である。この場合には、例えば、パワーアンプ141(具体的には、DAC)入力される音響信号(TSP)と、マイクアンプ151から出力される音響信号との測定結果に基づき、各特性を算出すればよい。また、他の一例として、パワーアンプ141、ドライバ511、及びマイクアンプ151それぞれのデバイス特性と、内部空間内の空間特性とを個別に測定し、各測定結果を畳み込んでもよい。即ち、モニターキャンセラ181のフィルタ特性については、上記に説明した、各特性の事前の測定結果に基づき、あらかじめ調整しておけばよい。なお、モニターキャンセラ181が、「第3のフィルタ処理部」の一例に相当する。また、モニターキャンセラ181によりフィルタ処理が施された音響信号が、「第1の信号成分」に相当する。
【0098】
そして、モニターキャンセラ181は、各種フィルタ処理が施された差分信号を、減算部191に出力する。
【0099】
減算部191は、マイクアンプ151から出力される音響信号から、モニターキャンセラ181から出力される差分信号を減算し、減算結果として生成された音響信号を、後段に位置する減算部171に出力する。なお、このとき、減算部171による減算結果として出力される音響信号は、内部マイクロフォン515により集音される音響信号の各成分のうち、差分信号に相当する成分が抑制された音響信号に相当する。
【0100】
なお、以降の処理は、前述した第1の実施形態に係る信号処理装置11と同様である。即ち、減算部191から出力された音響信号は、減算部171により、EQ132から出力される音響入力の成分が減算され、オキュリュージョンキャンセラ161に入力される。なお、このときオキュリュージョンキャンセラ161に入力される音響信号は、内部マイクロフォン515により集音される音響信号の各成分のうち、差分信号に相当する成分と、音響入力に相当する成分とが抑制された音響信号(即ち、声の成分)に相当する。
【0101】
このような構成により、本実施位形態に係る信号処理装置12では、オキュリュージョンキャンセラ161がノイズ低減信号を生成するための処理対象から、差分信号の成分を除外することが可能となる。即ち、本実施位形態に係る信号処理装置12では、ノイズ低減信号により、差分信号の成分が抑制されるといった事態を防止することが可能となる。そのため、本実施形態に係る信号処理装置12は、前述した第1の実施形態に係る信号処理装置11に比べて、より自然な態様(即ち、ユーザUがより違和感を覚えない態様)で、ヒアスルー効果を実現することが可能となる。
【0102】
以上、
図9を参照して、本実施形態に係る信号処理装置12の機能構成の一例について説明した。
【0103】
[4.2.遅延量を低減するための構成例]
次に、本実施形態に係る信号処理装置12において、外部マイクロフォン513による集音結果に基づく差分信号や、内部マイクロフォン515による集音結果に基づくノイズ低減信号が、音響入力に加算され、スピーカから出力されるまでの遅延量を低減する仕組みの一例について説明する。
【0104】
まず、
図9において、参照符号R11で示された系、即ち、外部マイクロフォン513の集音結果に基づく音響信号が、マイクアンプ111、HTフィルタ121、パワーアンプ141、及びドライバ511を介して内部空間に放射されるまでの系に着目する。系R11では、前述した通り、好適な態様でヒアスルー効果を実現する(具体的には、ディップが生じる周波数帯が5kHz近傍となるように調整する)ためには、遅延量を100μs以下に抑えられることが望ましい。なお、以降の説明では、系R11における遅延量を、「遅延量D_HTF」と称する場合がある。
【0105】
次いで、参照符号R13で示された系、即ち、外部マイクロフォン513の集音結果に基づく音響信号が、モニターキャンセラ181を介して、減算部191に至る系に着目する。
図9に示す構成において、モニターキャンセラ181は、HTフィルタ121と同様に差分信号を生成している。
【0106】
また、ドライバ511が差分信号に基づきスピーカを駆動することで、内部空間に放射された当該差分信号の成分を含む音響に基づく音響信号が、当該内部空間内を空間伝搬し、内部マイクロフォン515に集音されるまで(即ち、スピーカと内部マイクロフォン515との間の伝搬時)に伝搬遅延が生じる。なお、以降の説明では、当該内部空間内における伝搬遅延の遅延量を、「遅延量D_ACO」と称する場合がある。
【0107】
即ち、減算部191において、内部マイクロフォン515により集音された音響信号から、差分信号の成分を好適に減算するためには、系R13における遅延量を、遅延量D_HTF(100μs)と、遅延量D_ACOとの加算分以下とする必要がある。
【0108】
なお、ドライバ511が駆動するスピーカと内部マイクロフォン515との間の距離は、所謂オーバーヘッド型のヘッドフォンのように比較的長い場合においても、3〜4cm程度となる。
【0109】
ここで、ドライバ511が駆動するスピーカと内部マイクロフォン515との間の距離を、仮に3.4cmとした場合には、内部空間内における伝搬遅延の遅延量D_ACOは、(0.034m)/(音速=340m/s)=100μsとなる。なお、ドライバ511が駆動するスピーカと内部マイクロフォン515との間の距離が近いほど、遅延量D_ACOがより短くなることは言うまでもない。
【0110】
以上の点から、系R13における遅延量をD_HTCとした場合に、遅延量D_HTC≦D_HTF+D_ACOの関係を満たし、かつ、D_HTF≦100μs、D_ACO≦100μsの関係を満たす必要があることとなる。
【0111】
そこで、以降では、上記に説明したような遅延の条件を満たすための、信号処理装置12の構成の一例について、
図10を参照して説明する。
図10は、本実施形態に係る信号処理装置12において、遅延量をより低減する(即ち、上記に示した遅延の条件を満たす)ための構成の一例について説明するための説明図である。なお、
図10に示す例では、
図9に示した信号処理装置12に対して、アナログ信号とデジタル信号との間の変換処理を行うためのADC及びDACと、デジタル信号のサンプリングレートを変換するフィルタとが明示的に示されている。
【0112】
具体的には、
図10には、
図9に示した信号処理装置12の機能構成に対して、ADC112及び152と、DAC142と、デシメーションフィルタ113及び153と、インターポレーションフィルタ133、134、及び143とが明示的に示されている。なお、
図10に示す例では、信号処理装置12に入力される音響入力のサンプリングレートが1Fs(1Fs=48kHz)であるものとする。
【0113】
ADC112及び152は、アナログの音響信号をデジタル信号に変換するための構成である。ADC112及び152は、例えば、アナログの音響信号に対してデルタシグマ変調を施すことでデジタル信号に変換する。また、DAC142は、デジタル信号をアナログの音響信号に変換するための構成である。
【0114】
また、デシメーションフィルタ113及び153は、入力されたデジタル信号のサンプリングレートを、当該サンプリングレートよりも低い所定のサンプリングレートにダウンサンプリングするための構成である。また、インターポレーションフィルタ133、134、及び143は、入力されたデジタル信号のサンプリングレートを、当該サンプリングレートよりも高い所定のサンプリングレートにアップサンプリングするための構成である。
【0115】
外部マイクロフォン513の集音結果に基づき出力されるアナログの音響信号は、マイクアンプ111によりゲインが調整され、ADC112によりデジタル信号に変換される。なお、
図10に示す例では、ADC112は、入力されたアナログ信号を、64Fsのサンプリングレートで標本化して、デジタル信号に変換する。ADC112は変換後のデジタル信号をデシメーションフィルタ113に出力する。
【0116】
デシメーションフィルタ113は、ADC112から出力されるデジタル信号のサンプリングレートを、64Fsから8Fsにダウンサンプリングする。即ち、デシメーションフィルタ113の後段に位置する構成(例えば、HTフィルタ121やモニターキャンセラ181)は、サンプリングレートが8Fsにダウンサンプリングされたデジタル信号を対象として、各種処理を実行することとなる。
【0117】
また、内部マイクロフォン515の集音結果に基づき出力されるアナログの音響信号は、マイクアンプ151によりゲインが調整され、ADC152によりデジタル信号に変換される。なお、
図10に示す例では、ADC152は、入力されたアナログ信号を、64Fsのサンプリングレートで標本化して、デジタル信号に変換する。ADC152は変換後のデジタル信号をデシメーションフィルタ153に出力する。
【0118】
デシメーションフィルタ153は、ADC152から出力されるデジタル信号のサンプリングレートを、64Fsから8Fsにダウンサンプリングする。即ち、デシメーションフィルタ153の後段に位置する構成(例えば、オキュリュージョンキャンセラ161)は、サンプリングレートが8Fsにダウンサンプリングされたデジタル信号を対象として、各種処理を実行することとなる。
【0119】
また、EQ132によりイコライジング処理が施された音響入力(1Fsのデジタル信号)は、インターポレーションフィルタ134によりサンプリングレートが8Fsにアップサンプリングされ、減算部171に入力される。同様に、EQ131によりイコライジング処理が施された音響入力(1Fsのデジタル信号)は、インターポレーションフィルタ133によりサンプリングレートが8Fsにアップサンプリングされ、加算部123に入力される。
【0120】
そして、加算部123により、HTフィルタ121から出力される差分信号と、インターポレーションフィルタ133から出力される音響入力と、オキュリュージョンキャンセラ161から出力されるノイズ低減信号とが加算される。なお、このとき加算部123により加算される、差分信号、音響入力、及びノイズ低減信号は、いずれも8Fsのデジタル信号となる。
【0121】
そして、加算部123の加算結果として出力される8Fsのデジタル信号は、インターポレーションフィルタ143により、64Fsのデジタル信号にアップサンプリングされ、DAC142によりアナログの音響信号に変換されたうえでパワーアンプ141に入力される。そして、当該アナログの音響信号は、パワーアンプ141によりゲインが調整されたうえで、ドライバ511に入力される。これにより、ドライバ511は、入力されたアナログの音響信号に基づきスピーカを駆動することで、当該スピーカに、当該アナログの音響信号に基づく音響を内部空間に放射させる。
【0122】
以上、説明したように、
図10に示す例では、信号処理装置12は、集音されたアナログの音響信号が変換された64Fsのデジタル信号を、音響入力のサンプリングレート(1Fs)よりも高い8Fs程度にダウンサンプリングしている。
【0123】
即ち、
図10に示す信号処理装置12では、HTフィルタ121、モニターキャンセラ181、及びオキュリュージョンキャンセラ161は、8Fsのデジタル信号を対象として各演算(即ち、フィルタ処理)を実行することとなるため、1サンプル単位の遅延を低減することが可能となる。
【0124】
また、
図10に示す信号処理装置12では、64Fsのデジタル信号を、8Fsのデジタル信号にダウンサンプリングするため、1Fsのデジタル信号にダウンサンプリングする場合に比べて、当該ダウンサンプリングに係る処理(即ち、ADC112及びADC152の処理)の遅延量を低く抑えることが可能となる。なお、このことは、アップサンプリングに係る処理についても同様である。即ち、
図10に示す信号処理装置12では、8Fsのデジタル信号を、64Fsのデジタル信号にアップサンプリングするため、1Fsのデジタル信号からアップサンプリングする場合に比べて、当該アップサンプリングに係る処理(即ち、DAC142の処理)の遅延量を低く抑えることが可能となる。
【0125】
なお、HTフィルタ121、モニターキャンセラ181、及びオキュリュージョンキャンセラ161の各演算のうち、少なくとも一部の演算については、さらにサンプリンレートの低い(例えば、1Fs)のデジタル信号にダウンサンプリングしたうえで、当該デジタル信号を処理対象としてもよい。
【0126】
例えば、
図11は、モニターキャンセラ181の機能構成の一例を示した図である。
図11に示すモニターキャンセラ181は、8Fsのデジタル信号を1Fsのデジタル信号にダウンサンプリングしたうえで、当該1Fsのデジタル信号を対象として各種フィルタ処理が実行されるように構成されている。
【0127】
具体的には、
図11に示すモニターキャンセラ181は、デシメーションフィルタ183と、IIRフィルタ184と、FIRフィルタ185と、インターポレーションフィルタ186とを含む。
【0128】
デシメーションフィルタ183は、モニターキャンセラ181に入力される8Fsのデジタル信号を、1Fsのデジタル信号にダウンサンプリングし、1Fsにダウンサンプリングされた当該デジタル信号を、後段に位置するIIRフィルタ184に出力する。
【0129】
IIRフィルタ184及びFIRフィルタ185は、
図9を参照して前述したモニターキャンセラ181によるフィルタ処理を実行するための構成である。なお、前述した通り、モニターキャンセラ181によるフィルタ処理のうち、主に、周波数特性に関する処理がIIRフィルタ184に割り当てられ、単純遅延成分に対する処理がFIRフィルタ185に割り当てられる。なお、
図11に示す例では、IIRフィルタ184及びFIRフィルタ185は、1Fsのデジタル信号を対象として各種フィルタ処理を実行することとなる。
【0130】
そして、IIRフィルタ184及びFIRフィルタ185により各種フィルタ処理が施されたデジタル信号(即ち、1Fsのデジタル信号)は、インターポレーションフィルタ186により、8Fsのデジタル信号にアップサンプリングされる。そして、8Fsにアップサンプリングされたデジタル信号は、モニターキャンセラ181の後段に位置する減算部191(
図10参照)に出力されることとなる。
【0131】
以上のように、本実施形態に係る信号処理装置12においては、各種演算(例えば、HTフィルタ121、モニターキャンセラ181、及びオキュリュージョンキャンセラ161における各演算)のうち、少なくとも一部の演算について、局所的にサンプリングレートを下げることにより、当該演算のためのリソースを削減してもよい。なお、信号処理装置12における各種演算のうち、いずれの演算を対象として局所的にサンプリングレートを下げるかについては、事前の実験等により、ダウンサンプリングに伴うリソース削減の効率を確認し、当該確認結果に基づき適宜決定すればよい。
【0132】
以上、
図9及び
図10を参照して、本実施形態に係る信号処理装置12における各系(例えば、
図9及び
図10に示す系R11及びR13)における遅延量を低減し、より好適な態様でヒアスルー効果を実現するための仕組みの一例について説明した。なお、上記では、
図9に示した信号処理装置12を基に遅延量を低減する仕組みの一例について説明したが、
図5に示す信号処理装置80や、
図7に示す信号処理装置11についても、同様の仕組みに基づき遅延量を低減可能であることは言うまでもない。
【0133】
[4.3.変形例]
次に、
図12を参照して、本実施形態に係る信号処理装置12の変形例について説明する。
図12は、本実施形態の変形例に係る信号処理装置の機能構成の一例について示したブロック図である。なお、変形例に係る信号処理装置を、
図9及び
図10を参照して説明した本実施形態に係る信号処理装置12と区別するために、「信号処理装置13」と称する場合がある。なお、
図12に示す例では、
図10と同様に、アナログ信号とデジタル信号との間の変換処理を行うためのADC及びDACと、デジタル信号のサンプリングレートを変換するフィルタとが明示的に示されている。
【0134】
図12に示すように、変形例に係る信号処理装置13は、
図12に示すモニターキャンセラ181に替えて、モニターキャンセラ181’を含む点で、前述した実施形態に係る信号処理装置12(
図10参照)と異なる。そのため、本説明では、特に、モニターキャンセラ181’の構成に着目して説明し、その他の構成については、前述した実施形態に係る信号処理装置12と同様のため、詳細な説明は省略する。
【0135】
図12に示すように、モニターキャンセラ181’は、HTフィルタ121の後段に位置し、当該HTフィルタ121から出力される差分信号を処理の対象とする。このような構成により、モニターキャンセラ181’は、
図9を参照して説明したモニターキャンセラ181と異なり、差分信号の生成に係る処理(即ち、前述した(式2)及び(式3)に基づく処理)を実行する必要はない。
【0136】
即ち、モニターキャンセラ181’は、入力された差分信号に対して、パワーアンプ141、ドライバ511、及びマイクアンプ151それぞれのデバイス特性と、内部空間内の空間特性との影響が反映されるように、各特性に応じた伝達関数に基づくフィルタ処理を施す。
【0137】
そして、モニターキャンセラ181’は、フィルタ処理が施された差分信号を、後段に位置する減算部191に出力する。なお、以降の処理については、前述した実施形態に係る信号処理装置12(
図9及び
図10参照)と同様である。
【0138】
このような構成により、変形例に係る信号処理装置13は、
図9及び
図10に示した信号処理装置12のHTフィルタ121及びモニターキャンセラ181における差分信号の生成に係る処理を、HTフィルタ121の処理として共通化することが可能となる。そのため、変形例に係る信号処理装置13は、前述した実施形態に係る信号処理装置12に比べて、差分信号の生成に係る演算のためのリソースを低減し、ひいては、回路規模を削減することも可能となる。
【0139】
以上、
図12を参照して、本実施形態の変形例に係る信号処理装置13について説明した。
【0140】
[4.4.まとめ]
以上、説明したように、本実施形態に係る信号処理装置12は、内部マイクロフォン515の集音結果に基づく音響信号から、音響入力の成分に加えて差分信号に相当する成分を減算している。このような構成により、本実施位形態に係る信号処理装置12では、オキュリュージョンキャンセラ161がノイズ低減信号を生成するための処理対象から、差分信号の成分を除外することが可能となる。即ち、本実施位形態に係る信号処理装置12では、ノイズ低減信号により、差分信号の成分が抑制されるといった事態を防止することが可能となる。そのため、本実施形態に係る信号処理装置12は、前述した第1の実施形態に係る信号処理装置11に比べて、より自然な態様(即ち、ユーザUがより違和感を覚えない態様)で、ヒアスルー効果を実現することが可能となる。
【0141】
<5.第3の実施形態>
次に、本開示の第3の実施形態に係る信号処理装置について説明する。前述したように、本開示の各実施形態に係る信号処理装置では、内部マイクロフォン515による内部空間を伝搬する音響の集音結果を利用して、外耳道UAに伝搬するユーザの声の成分を抑制するためのノイズ低減信号を生成している。このような構成のため、内部マイクロフォン515の集音結果に基づく音響信号(即ち、内部空間を伝搬する音響)には、前述したように声の成分(即ち、ユーザUの頭部の骨や肉を介して外耳道UAに伝搬する当該ユーザUの声の成分)が含まれていることは前述した通りである。
【0142】
そこで、本実施形態では、内部マイクロフォン515による集音結果に基づく音響信号に含まれる声の成分を、音声入力(例えば、音声通話における送話信号)として利用することが可能な信号処理装置の一例について説明する。
【0143】
例えば、
図13は、本実施形態に係る信号処理装置の機能構成の一例を示したブロック図である。なお、以降では、
図13に示す信号処理装置を、前述した各実施形態に係る信号処理装置と区別するために、「信号処理装置14a」と称する場合がある。また、
図13に示す機能構成は、説明をよりわかりやすくするために、DAC及びADCの記載を省略している。
【0144】
図13に示すように、本実施形態に係る信号処理装置14aは、ノイズゲート411と、EQ412と、コンプレッサ413とを含む点で、前述した第2の実施形態に係る信号処理装置13(
図9参照)と異なる。そこで、本説明では、本実施形態に係る信号処理装置14aの機能構成について、特に、前述した第2の実施形態に係る信号処理装置13と異なる部分に着目して説明し、その他の部分については詳細な説明は省略する。
【0145】
図13に示すように、信号処理装置14aでは、参照符号n11で示された、減算部191の後段に位置する(即ち、減算部191と減算部171との間に位置する)ノードにおいて、当該ノードn11を通過する音響信号が分波され、分波された一部の音響信号がノイズゲート411に入力される。
【0146】
ノイズゲート411は、入力される音響信号に対して所謂ノイズゲート処理を施すための構成である。具体的には、ノイズゲート411は、ノイズゲート処理として、入力される音響信号のレベルが一定レベル以下となる出力信号のレベルを下げ(つまり、ゲートを閉じ)、当該一定レベルを超えると出力信号のレベルを基に戻す(つまり、ゲートを開く)処理を行う。なお、一般に行われているように、ノイズゲート処理における出力レベルの減衰の割合、ゲートの開閉エンベロープ、及び、ゲートが反応する周波数帯域等のパラメータは、発話音(即ち、入力される音響信号に含まれる声の成分)の明瞭度の向上が図られるよう適切に設定する。
【0147】
そして、ノイズゲート411は、ノイズゲート処理を施した音響信号を、後段に位置するEQ412に出力する。
【0148】
EQ412は、ノイズゲート411から出力される音響信号に対して、イコライジング処理を施すための構成である。前述したように、ノードn11から分波される音響信号(即ち、内部マイクロフォン515の集音結果に基づく音響信号)に含まれる声の成分は、低域が増幅されており、当該音響信号(即ち、声の成分)に基づく音響は聴取者にくぐもったように聞こえる。そのため、EQ412は、当該音響信号に基づく音響が、聴取者により自然に聞こえるように(即ち、より自然な周波数特性バランスとなるように)、当該音響信号の周波数特性を補正することで、聴取される音響の明瞭度を向上させる。
【0149】
なお、EQ412が入力された音響信号に対してイコライジング処理を施すための目標特性については、例えば、事前の実験等の結果に基づきあらかじめ決定しておけばよい。
【0150】
そして、EQ412は、イコライジング処理が施された音響信号(即ち、声の成分を含む音響信号)を、後段に位置するコンプレッサ413に出力する。
【0151】
コンプレッサ413は、入力される音響信号に対して、所謂コンプレッサ処理として、時間振幅を整える処理を施すための構成である。
【0152】
具体的には、入力される音響信号に含まれる声の成分は、前述した通り、ユーザUの頭部の骨や肉を介して外耳道UAに伝搬し、外耳道壁を2次スピーカのように振動させ、当該振動が外耳道UAを介して内部マイクロフォン515に到達する。このように、声の成分が内部マイクロフォン515に到達するまでの伝搬経路は、外部環境を伝搬する場合のような空気伝搬に比べて、ある程度の非線形性を有する。
【0153】
そのため、発生時の声の大きさによって変わる発話音声の大小の差が、通常の空気伝搬を介した集音を行う場合に比べて大きくなり、そのままであると集音された音声を聴取者が聞き取り難くなる場合がある。
【0154】
そこで、コンプレッサ413は、内部マイクロフォン515による集音結果に基づく音響信号(具体的には、EQ412から出力される音響信号)の時間軸振幅を、発話音声の大小の差が抑制されるように整える。
【0155】
以上のようにして、コンプレッサ413は、入力される音響信号に対してコンプレッサ処理を施し、当該コンプレッサ処理が施された音響信号(即ち、声の成分を含む音響信号)を、音声信号として出力する。
【0156】
なお、
図13に示した信号処理装置14aの構成はあくまで一例であり、内部マイクロフォン515により集音された声の成分を含む音響信号を、音声信号として出力することが可能であれば、その構成は特に限定されない。
【0157】
例えば、
図14は、本実施形態に係る信号処理装置の機能構成の他の一例について示したブロック図である。なお、以降の説明では、
図14に示す信号処理装置を、
図13を参照して前述した信号処理装置と区別する場合には、「信号処理装置14b」と称する場合がある。また、
図14に示す信号処理装置を、
図13を参照して前述した信号処理装置と区別しない場合には、単に「信号処理装置14」と称する場合がある。
【0158】
図14に示すように、信号処理装置14bにおいては、参照符号n12で示された、減算部171の後段に位置する(即ち、減算部171とオキュリュージョンキャンセラ161との間に位置する)ノードにおいて、当該ノードn12を通過する音響信号が分波され、分波された一部の音響信号がノイズゲート411に入力される。
【0159】
ここで、ノードn12を通過する音響信号は、ノードn11を通過する音響信号から、さらに、音響入力の成分が減算された音響信号に相当する。そのため、
図14に示す信号処理装置14bでは、
図13に示した信号処理装置14aに比べて、内部マイクロフォン515の集音結果に基づく音響信号のうち、声の成分以外の他の成分がより抑制された音響信号を、音声信号として出力することが可能となる。
【0160】
以上、
図13及び
図14を参照して、本実施形態に係る信号処理装置14の機能構成の一例について説明した。
【0161】
なお、前述したように、本実施形態に係る信号処理装置14では、内部マイクロフォン515の集音結果に基づく音響信号から、減算部191により差分信号が減算された後の音響信号を対象として、音声信号として出力している。このような構成により、内部マイクロフォン515の集音結果に基づく音響信号に含まれる各成分のうち、環境音に相当する成分が抑制された音響信号が、音声信号として出力されることとなる。即ち、本実施形態に係る信号処理装置14に依れば、外部環境においてマイクロフォン等を使用してユーザUの音声を集音する場合に比べて、よりS/N比の高い(即ち、ノイズの少ない)音声入力を取得することが可能となる。
【0162】
次に、
図15を参照して、本実施形態に係る信号処理装置14の適用例について説明する。
図15は、本実施形態に係る信号処理装置14の適用例について説明するための説明図である。具体的には、
図15は、信号処理装置14から出力される音声信号を、音声入力として利用することで、当該音声入力が示す指示内容に基づき、各種処理を実行することが可能な情報処理システムの機能構成の一例を示している。
【0163】
図15に示す情報処理システムは、頭部装着型音響デバイス51と、信号処理装置14と、解析部61と、制御部63と、処理実行部65とを含む。なお、頭部装着型音響デバイス51と、信号処理装置14とについては、
図13または
図14に示す例と同様のため詳細な説明は省略する。
【0164】
解析部61は、信号処理装置14から出力される音声信号(即ち、音声出力)を、音声入力として取得し、当該音声入力が示す内容(即ち、ユーザUからの指示内容)を後述する制御部63が認識できるように、当該音声入力に対して各種解析を施すための構成である。解析部61は、音声認識部611と、自然言語処理部613とを含む。
【0165】
音声認識部611は、信号処理装置14から取得した音声入力を、所謂音声認識技術に基づき解析することで、文字情報に変換する。そして、音声認識部611は、音声認識技術に基づく解析の結果、即ち、音声入力が変換された文字情報を、自然言語処理部613に出力する。
【0166】
自然言語処理部613は、信号処理装置14から取得された音声入力に対する音声認識技術に基づく解析の結果として、当該音声入力が変換された文字情報を、音声認識部611から取得する。自然言語処理部613は、取得した当該文字情報に対して、所謂自然言語処理技術に基づく解析(例えば、字句解析(形態素解析)、構文解析、及び意味解析等)を施す。
【0167】
そして、自然言語処理部613は、信号処理装置14から取得された音声入力が変換された文字情報に対する自然言語処理の結果を示す情報を、制御部63に出力する。
【0168】
制御部63は、信号処理装置14から取得された音声入力に対する解析結果(即ち、当該音声入力が変換された文字情報に対する自然言語処理の結果)を示す情報を、解析部61から取得する。制御部63は、取得した解析結果に基づき、当該音声入力に基づくユーザUからの指示内容を認識する。
【0169】
制御部63は、認識したユーザUからの指示内容に基づき、対象となる機能(例えば、アプリケーション)を特定し、特定した機能の実行を処理実行部65に指示する。
【0170】
処理実行部65は、各種機能を実行するための構成である。処理実行部65は、制御部63から指示に基づき、対象となる機能を実行するための各種データ(例えば、アプリケーションを実行するためのライブラリや、コンテンツのデータ)を読み出し、読み出したデータに基づき、当該機能を実行する。なお、処理実行部65が、各種機能を実行するためのデータについては、当該処理実行部65が読み出し可能な位置に記憶されていれば、その記憶先は特に限定されない。
【0171】
また、このとき処理実行部65は、制御部63から指示された機能の実行結果に基づく音響情報(例えば、指示に基づき再生されたオーディオコンテンツ)を、信号処理装置14に入力してもよい。また、他の一例として、処理実行部65は、制御部63から指示された機能の実行結果に基づき、ユーザUに対して提示する内容を示した音声情報を、所謂音声合成技術に基づき生成し、生成した音声情報を信号処理装置14に入力してもよい。このような構成により、ユーザUは、自身の指示内容に基づく各種機能実行結果を、頭部装着型音響デバイス51を介して出力される音響情報(音声情報)として認識することが可能となる。
【0172】
即ち、
図15に示した情報処理システムに依れば、ユーザUは、頭部装着型音響デバイス51を装着した状態で、音声により各種機能の実行を情報処理システムに指示することで、当該機能の実行結果に基づく音響情報を、当該頭部装着型音響デバイス51を介して聴取することが可能となる。
【0173】
具体的な一例として、ユーザUは、音声により所望のオーディコンテンツの再生を指示することで、当該オーディオコンテンツの再生結果を、当該頭部装着型音響デバイス51を介して聴取することが可能となる。
【0174】
また、他の一例として、ユーザは、情報処理システムに対して、所望の文字情報(例えば、配信されたメールやニュース、ネットワーク上にアップロードされている情報等)の読み上げを指示することで、当該文字情報の読み上げ結果を、頭部装着型音響デバイス51を介して聴取することが可能となる。
【0175】
また、他の一例として、
図15に示す情報処理システムを、所謂音声通話に利用してもよい。この場合には、信号処理装置14から出力される音声信号を
送話信号として利用し、受信した受話信号については、信号処理装置14に対して音響入力として入力すればよい。
【0176】
なお、
図15に示した情報処理システムの構成はあくまで一例であり、上記に説明した情報処理システムの各構成の処理が実現できれば、必ずしも、
図15に示す構成には限定されない。具体的な一例として、解析部61、制御部63、及び処理実行部65のうち、少なくとも一部の構成を、ネットワークを介して接続された外部装置(例えば、サーバ)に設けてもよい。
【0177】
以上、本実施形態に係る信号処理装置14の適用例として、
図15を参照して、信号処理装置14から出力される音声信号を、音声入力として利用した情報処理システムの機能構成の一例について説明した。
【0178】
<6.ハードウェア構成>
次に、
図16を参照して、本開示の各実施形態に係る信号処理装置10(即ち、上述した信号処理装置11〜14)のハードウェア構成の一例について説明する。
図16は、本開示の各実施形態に係る信号処理装置10のハードウェア構成の一例を示した図である。
【0179】
図16に示すように、本実施形態に係る信号処理装置10は、プロセッサ901と、メモリ903と、ストレージ905と、操作デバイス907と、報知デバイス909と、音響デバイス911と、集音デバイス913と、バス917とを含む。また、信号処理装置10は、通信デバイス915を含んでもよい。
【0180】
プロセッサ901は、例えばCPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)又はSoC(System on Chip)であってよく、信号処理装置10の様々な処理を実行する。プロセッサ901は、例えば、各種演算処理を実行するための電子回路により構成することが可能である。なお、前述した信号処理装置11〜14の各構成(特に、HTフィルタ121、オキュリュージョンキャンセラ161、モニターキャンセラ181等)は、プロセッサ901により実現され得る。
【0181】
メモリ903は、RAM(Random Access Memory)及びROM(Read Only Memory)を含み、プロセッサ901により実行されるプログラム及びデータを記憶する。ストレージ905は、半導体メモリ又はハードディスクなどの記憶媒体を含み得る。
【0182】
操作デバイス907は、ユーザが所望の操作を行うための入力信号を生成する機能を有する。操作デバイス907は、例えば、タッチパネルとして構成され得る。また、他の一例として、操作デバイス907は、例えばボタン、スイッチ、及びキーボードなどユーザが情報を入力するための入力部と、ユーザによる入力に基づいて入力信号を生成し、プロセッサ901に供給する入力制御回路などから構成されてよい。
【0183】
報知デバイス909は、出力デバイスの一例であり、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)装置、有機EL(OLED:Organic Light Emitting Diode)ディスプレイなどのデバイスであってよい。この場合には、報知デバイス909は、画面を表示することにより、ユーザに対して所定の情報を報知することができる。
【0184】
なお、上記に示した報知デバイス909の例はあくまで一例であり、ユーザに対して所定の情報を報知可能であれば、報知デバイス909の態様は特に限定されない。具体的な一例として、報知デバイス909は、LED(Light Emitting Diode)のように、点灯又は点滅のパターンにより、所定の情報をユーザに報知するデバイスであってもよい。また、報知デバイス909は、所謂バイブレータのように、振動することで、所定の情報をユーザに報知するデバイスであってもよい。
【0185】
音響デバイス911は、スピーカ等のように、所定の音響信号を出力することで、所定の情報をユーザに報知するデバイスである。なお、前述した、頭部装着型音響デバイス51のうち、特に、ドライバ511により駆動されるスピーカは、音響デバイス911により構成され得る。
【0186】
集音デバイス913は、マイクロフォン等のような、ユーザから発せられた音声や周囲の環境の音響を集音し、音響情報(音響信号)として取得するためのデバイスである。また、集音デバイス913は、集音された音声や音響を示すアナログの音響信号を示すデータを音響情報として取得してもよいし、当該アナログの音響信号をデジタルの音響信号に変換し、変換後のデジタルの音響信号を示すデータを音響情報として取得してもよい。なお、前述した、頭部装着型音響デバイス51における、外部マイクロフォン513及び内部マイクロフォン515は、集音デバイス913により実現され得る。
【0187】
通信デバイス915は、信号処理装置10が備える通信手段であり、ネットワークを介して外部装置と通信する。通信デバイス915は、有線または無線用の通信インタフェースである。通信デバイス915を、無線通信インタフェースとして構成する場合には、当該通信デバイス915は、通信アンテナ、RF(Radio Frequency)回路、ベースバンドプロセッサなどを含んでもよい。
【0188】
通信デバイス915は、外部装置から受信した信号に各種の信号処理を行う機能を有し、受信したアナログ信号から生成したデジタル信号をプロセッサ901に供給することが可能である。
【0189】
バス917は、プロセッサ901、メモリ903、ストレージ905、操作デバイス907、報知デバイス909、音響デバイス911、集音デバイス913、及び通信デバイス915を相互に接続する。バス917は、複数の種類のバスを含んでもよい。
【0190】
また、コンピュータに内蔵されるプロセッサ、メモリ、及びストレージなどのハードウェアを、上記した信号処理装置10が有する構成と同等の機能を発揮させるためのプログラムも作成可能である。また、当該プログラムを記録した、コンピュータに読み取り可能な記憶媒体も提供され得る。
【0191】
<7.まとめ>
以上、説明したように、本開示の各実施形態に係る信号処理装置10(即ち、上述した信号処理装置11〜14)は、頭部装着型音響デバイス51の装着部510の外側の外部空間を伝搬する環境音の集音結果に基づき、差分信号を生成する。また、信号処理装置10は、装着部510の内側の内部空間に伝搬する音響の集音結果に基づき、当該内部空間に伝搬する声の成分を抑制するためのノイズ低減信号を生成する。そして、信号処理装置10は、入力される音響入力に対して、生成した差分信号とノイズ低減信号とを加算し、当該加算結果に基づき生成される音響信号を頭部装着型音響デバイス51のドライバ511に出力する。これにより、当該音響信号によりドライバ511が駆動され、当該音響信号に基づく音響が内部空間に放射される。
【0192】
このような構成により、内部空間内に放射された音響に含まれる差分信号の成分と、装着部510を介して内部空間に伝搬する環境音(即ち、
図2及び
図3において、伝搬環境Fを介して伝搬する音響)とが、内部空間内で加算され、当該加算結果がユーザUに聴取されるため、ヒアスルー効果を実現することが可能となる。また、内部空間内に放射された音響に含まれるノイズ低減信号と、ユーザUの頭部の肉や骨を介して外耳道UAに伝搬する声の成分とが加算され、当該加算結果がユーザUに聴取されるため、ユーザUは、自身の声をより自然な(即ち、違和感を覚えない)態様で聴取することが可能となる。
【0193】
なお、上記に説明した、本開示の各実施形態に係る信号処理装置10により実行される一連の処理(即ち、各種フィルタ処理等の信号処理)が、「信号処理方法」の一例に相当する。
【0194】
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
【0195】
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
【0196】
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
聴取者の耳に対して装着される装着部の外側の外部空間を伝搬する第1の音響の集音結果を取得する第1の取得部と、
前記装着部の内側において外耳道と連接する内部空間を伝搬する第2の音響の集音結果を取得する第2の取得部と、
前記第1の音響の集音結果に基づき、前記外部空間から前記外耳道内に向けて直接伝搬する前記第1の音響と、前記外部空間から前記装着部を介して前記内部空間に伝搬する前記第1の音響との差分に略等しい差分信号を生成する第1のフィルタ処理部と、
前記第2の音響の集音結果から、前記第1の音響の集音結果に基づく第1の信号成分と、前記装着部の内側から前記内部空間に向けて音響デバイスから出力させる入力音響信号に基づく第2の信号成分とが減算された減算信号を生成する減算部と、
前記減算信号に基づき、当該減算信号を低減するためのノイズ低減信号を生成する第2のフィルタ処理部と、
前記入力音響信号に対して、前記差分信号と、前記ノイズ低減信号とを加算することで、前記音響デバイスを駆動するための駆動信号を生成する加算部と、
を備える、信号処理装置。
(2)
前記第1の音響の集音結果に基づく音響信号に対して、少なくとも、前記音響デバイスから出力される音響信号が、前記内部空間を介して前記第2の音響として集音されるまでの系の伝達関数に応じた特性を付与し、前記第1の信号成分として出力する第3のフィルタ処理部を備える、前記(1)に記載の信号処理装置。
(3)
前記第3のフィルタ処理部は、前記第1の音響の集音結果を入力信号として、前記第1の信号成分を生成する、前記(2)に記載の信号処理装置。
(4)
前記第3のフィルタ処理部は、前記第1のフィルタ処理部から出力される前記差分信号を入力信号として、前記第1の信号成分を生成する、前記(2)に記載の信号処理装置。
(5)
前記第3のフィルタ処理部は、入力された前記前記第1の音響の集音結果に基づく音響信号のうち、遅延成分を処理するための第4のフィルタ処理部と、周波数成分を処理するための第5のフィルタ処理部とを備える、前記(2)〜(4)のいずれか一項に記載の信号処理装置。
(6)
前記第4のフィルタ処理部は、無限インパルス応答フィルタを含む、前記(5)に記載の信号処理装置。
(7)
前記第5のフィルタ処理部は、有限インパルス応答フィルタを含む、前記(5)または(6)に記載の信号処理装置。
(8)
前記入力音響信号を第1の目標特性に等化して前記加算部に出力する第1の等化処理部と、
当該入力音響信号を第2の目標特性に等化して、前記第2の信号成分として前記減算部に出力する第2の等化処理部と、
を備える、前記(1)〜(7)のいずれか一項に記載の信号処理装置。
(9)
前記第2の音響の集音結果からの前記第1の信号成分の減算結果に基づく信号成分を、音声信号として出力する音声信号出力部を備える、前記(1)〜(8)のいずれか一項に記載の信号処理装置。
(10)
音声信号出力部は、前記減算信号を前記音声信号として出力する、前記(9)に記載の信号処理装置。
(11)
前記第1の音響を集音する第1の集音部と、前記第2の音響を集音する第2の集音部とのうち、少なくともいずれかを含む、前記(1)〜(10)のいずれか一項に記載の信号処理装置。
(12)
前記音響デバイスを含む、前記(1)〜(11)のいずれか一項に記載の信号処理装置。
(13)
聴取者の耳に対して装着される装着部の外側の外部空間を伝搬する音響の集音結果を取得する取得部と、
前記音響の集音結果に基づき、前記外部空間から外耳道内に向けて直接伝搬する前記音響と、前記外部空間から前記装着部を介して前記外耳道内に伝搬する前記音響との差分に略等しい差分信号を生成するフィルタ処理部と、
前記装着部の内側から前記外耳道内に向けて音響デバイスから出力させる入力音響信号に対して、前記差分信号を加算することで、前記音響デバイスを駆動するための駆動信号を生成する加算部と、
を備え、
前記外部空間を伝搬する音響が集音されてから、当該音響に基づく前記差分信号が加算された前記駆動信号に基づく音響が、前記音響デバイスから出力されるまでの遅延量が100μ秒以下である、
信号処理装置。
(14)
前前記外部空間を伝搬する音響の集音結果を、第1のサンプリングレートで第1のデジタル信号にAD変換するAD変換部と、
前記第1のデジタル信号を、前記第1のサンプリングレートよりも低く、前記入力音響信号を標本化するための第2のサンプリングレートよりも高い、第3のサンプリングレートにダウンサンプリングすることで第2のデジタル信号を生成する、デシメーションフィルタと、
前記第3のサンプリングレートで標本化されたデジタル信号を、第1のサンプリングレートにアップサンプリングするインターポレーションフィルタと、
前記インターポレーションフィルタの出力結果をアナログの音響信号にDA変換するDA変換部と、
を備え、
前記フィルタ処理部は、前記第2のデジタル信号を入力信号として、前記差分信号を生成する、
前記(13)に記載の信号処理装置。
(15)
プロセッサが、
聴取者の耳に対して装着される装着部の外側の外部空間を伝搬する第1の音響の集音結果を取得することと、
前記装着部の内側の外耳道と連接する内部空間を伝搬する第2の音響の集音結果を取得することと、
前記第1の音響の集音結果に基づき、前記外部空間から前記外耳道内に向けて直接伝搬する前記第1の音響と、前記外部空間から前記装着部を介して前記内部空間に伝搬する前記第1の音響との差分に略等しい差分信号を生成することと、
前記第2の音響の集音結果から、前記第1の音響の集音結果に基づく第1の信号成分と、前記装着部の内側から前記内部空間に向けて音響デバイスから出力させる入力音響信号に基づく第2の信号成分とが減算された減算信号を生成することと、
前記減算信号に基づき、当該減算信号を低減するためのノイズ低減信号を生成することと、
前記入力音響信号に対して、前記差分信号と、前記ノイズ低減信号とを加算することで、前記音響デバイスを駆動するための駆動信号を生成することと、
を含む、信号処理方法。
(16)
コンピュータに、
聴取者の耳に対して装着される装着部の外側の外部空間を伝搬する第1の音響の集音結果を取得することと、
前記装着部の内側の外耳道と連接する内部空間を伝搬する第2の音響の集音結果を取得することと、
前記第1の音響の集音結果に基づき、前記外部空間から前記外耳道内に向けて直接伝搬する前記第1の音響と、前記外部空間から前記装着部を介して前記内部空間に伝搬する前記第1の音響との差分に略等しい差分信号を生成することと、
前記第2の音響の集音結果から、前記第1の音響の集音結果に基づく第1の信号成分と、前記装着部の内側から前記内部空間に向けて音響デバイスから出力させる入力音響信号に基づく第2の信号成分とが減算された減算信号を生成することと、
前記減算信号に基づき、当該減算信号を低減するためのノイズ低減信号を生成することと、
前記入力音響信号に対して、前記差分信号と、前記ノイズ低減信号とを加算することで、前記音響デバイスを駆動するための駆動信号を生成することと、
を実行させる、プログラム。