IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ソニー株式会社の特許一覧

特許7384162信号処理装置、信号処理方法、およびプログラム
<>
  • 特許-信号処理装置、信号処理方法、およびプログラム 図1
  • 特許-信号処理装置、信号処理方法、およびプログラム 図2
  • 特許-信号処理装置、信号処理方法、およびプログラム 図3
  • 特許-信号処理装置、信号処理方法、およびプログラム 図4
  • 特許-信号処理装置、信号処理方法、およびプログラム 図5
  • 特許-信号処理装置、信号処理方法、およびプログラム 図6
  • 特許-信号処理装置、信号処理方法、およびプログラム 図7
  • 特許-信号処理装置、信号処理方法、およびプログラム 図8
  • 特許-信号処理装置、信号処理方法、およびプログラム 図9
  • 特許-信号処理装置、信号処理方法、およびプログラム 図10
  • 特許-信号処理装置、信号処理方法、およびプログラム 図11
  • 特許-信号処理装置、信号処理方法、およびプログラム 図12
  • 特許-信号処理装置、信号処理方法、およびプログラム 図13
  • 特許-信号処理装置、信号処理方法、およびプログラム 図14
  • 特許-信号処理装置、信号処理方法、およびプログラム 図15
  • 特許-信号処理装置、信号処理方法、およびプログラム 図16
  • 特許-信号処理装置、信号処理方法、およびプログラム 図17
  • 特許-信号処理装置、信号処理方法、およびプログラム 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-13
(45)【発行日】2023-11-21
(54)【発明の名称】信号処理装置、信号処理方法、およびプログラム
(51)【国際特許分類】
   H04S 7/00 20060101AFI20231114BHJP
   H04S 1/00 20060101ALI20231114BHJP
   G10K 15/00 20060101ALI20231114BHJP
【FI】
H04S7/00 300
H04S1/00 200
G10K15/00 L
【請求項の数】 13
(21)【出願番号】P 2020537414
(86)(22)【出願日】2019-08-02
(86)【国際出願番号】 JP2019030413
(87)【国際公開番号】W WO2020036077
(87)【国際公開日】2020-02-20
【審査請求日】2022-06-09
(31)【優先権主張番号】P 2018153658
(32)【優先日】2018-08-17
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(74)【代理人】
【識別番号】100121131
【弁理士】
【氏名又は名称】西川 孝
(74)【代理人】
【識別番号】100082131
【弁理士】
【氏名又は名称】稲本 義雄
(74)【代理人】
【識別番号】100168686
【弁理士】
【氏名又は名称】三浦 勇介
(72)【発明者】
【氏名】佐藤 広則
(72)【発明者】
【氏名】中川 亨
(72)【発明者】
【氏名】曲谷地 哲
(72)【発明者】
【氏名】沖本 越
【審査官】大石 剛
(56)【参考文献】
【文献】国際公開第2017/130255(WO,A1)
【文献】特表2018-502535(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04S 7/00
H04S 1/00
G10K 15/00
(57)【特許請求の範囲】
【請求項1】
ユーザの第1の頭部伝達関数から抽出された第1の帯域の特性と、前記第1の頭部伝達関数が測定される第1の測定環境と異なる第2の測定環境で測定された第2の頭部伝達関数から抽出された前記第1の帯域より高い帯域を含む第2の帯域の特性とを合成することで、第3の頭部伝達関数を生成する合成部
を備える信号処理装置。
【請求項2】
前記第1の帯域は、第1の周波数から第2の周波数までの帯域であり、
前記第2の帯域は、前記第1の周波数より低い帯域と、前記第2の周波数より高い帯域を含む
請求項1に記載の信号処理装置。
【請求項3】
前記第1の頭部伝達関数は、前記ユーザが配置した音源を用いて実測されるデータであり、
前記第2の頭部伝達関数は、あらかじめ理想的な測定環境で測定されたプリセットデータである
請求項1に記載の信号処理装置。
【請求項4】
前記第1の帯域は、個人に依存する特性を含む帯域である
請求項に記載の信号処理装置。
【請求項5】
前記第2の帯域は、前記音源が再生できない帯域を含む
請求項に記載の信号処理装置。
【請求項6】
前記音源は、スピーカを有するデバイスである
請求項に記載の信号処理装置。
【請求項7】
前記デバイスは、ディスプレイをさらに有する
請求項に記載の信号処理装置。
【請求項8】
前記デバイスは、スマートフォンである
請求項に記載の信号処理装置。
【請求項9】
前記デバイスは、テレビジョン受像機である
請求項に記載の信号処理装置。
【請求項10】
前記第1の頭部伝達関数から抽出された前記第1の帯域の特性に含まれる前記音源の特性を除去するよう、前記第1の帯域の特性を補正する補正部をさらに備える
請求項に記載の信号処理装置。
【請求項11】
前記第2の頭部伝達関数に対応する頭部インパルス応答から分離された残響成分を、前記第3の頭部伝達関数に付加する付加部をさらに備える
請求項1に記載の信号処理装置。
【請求項12】
信号処理装置が、
ユーザの第1の頭部伝達関数から抽出された第1の帯域の特性と、前記第1の頭部伝達関数が測定される第1の測定環境と異なる第2の測定環境で測定された第2の頭部伝達関数から抽出された前記第1の帯域より高い帯域を含む第2の帯域の特性とを合成することで、第3の頭部伝達関数を生成する
信号処理方法。
【請求項13】
コンピュータに、
ユーザの第1の頭部伝達関数から抽出された第1の帯域の特性と、前記第1の頭部伝達関数が測定される第1の測定環境と異なる第2の測定環境で測定された第2の頭部伝達関数から抽出された前記第1の帯域より高い帯域を含む第2の帯域の特性とを合成することで、第3の頭部伝達関数を生成する
処理を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、信号処理装置、信号処理方法、およびプログラムに関し、特に、手軽に頭部伝達関数の個人化を実現することができるようにした信号処理装置、信号処理方法、およびプログラムに関する。
【背景技術】
【0002】
音源から耳への音の伝わり方を表現する頭部伝達関数(HRTF:Head-Related Transfer Function)を用いて、ヘッドホンで音像を立体的に再現する技術がある。
【0003】
例えば、特許文献1には、ダミーヘッドを用いて測定したHRTFを利用して、立体音響を再生する携帯端末が開示されている。
【0004】
しかしながら、HRTFには個人性があるため、ダミーヘッドを用いて測定したHRTFでは正確な音像定位ができなかった。これに対して、リスナ自身のHRTFを測定することで、HRTFを個人化し、精度の高い音像定位を実現できることが知られている。
【0005】
ところが、リスナ自身のHRTFを測定する場合、無響室や大型スピーカなどの大規模な設備を用いる必要があった。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2009-260574号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
そこで、例えばスマートフォンを音源として、リスナ自身のHRTFが測定できれば、大規模な設備を用いることなく、手軽にHRTFの個人化を実現することができる。
【0008】
しかしながら、スマートフォンのスピーカは、その再生帯域が狭いため、十分な特性のHRTFを測定することができなかった。
【0009】
本開示は、このような状況に鑑みてなされたものであり、全帯域における頭部伝達関数の個人化を手軽に実現することができるようにするものである。
【課題を解決するための手段】
【0010】
本開示の信号処理装置は、ユーザの第1の頭部伝達関数から抽出された第1の帯域の特性と、前記第1の頭部伝達関数が測定される第1の測定環境と異なる第2の測定環境で測定された第2の頭部伝達関数から抽出された前記第1の帯域より高い帯域を含む第2の帯域の特性とを合成することで、第3の頭部伝達関数を生成する合成部を備える信号処理装置である。
【0011】
本開示の信号処理方法は、ユーザの第1の頭部伝達関数から抽出された第1の帯域の特性と、前記第1の頭部伝達関数が測定される第1の測定環境と異なる第2の測定環境で測定された第2の頭部伝達関数から抽出された前記第1の帯域より高い帯域を含む第2の帯域の特性とを合成することで、第3の頭部伝達関数を生成する信号処理方法である。
【0012】
本開示のプログラムは、コンピュータに、ユーザの第1の頭部伝達関数から抽出された第1の帯域の特性と、前記第1の頭部伝達関数が測定される第1の測定環境と異なる第2の測定環境で測定された第2の頭部伝達関数から抽出された前記第1の帯域より高い帯域を含む第2の帯域の特性とを合成することで、第3の頭部伝達関数を生成する処理を実行させるためのプログラムである。
【0013】
本開示においては、ユーザの第1の頭部伝達関数から抽出された第1の帯域の特性と、前記第1の頭部伝達関数が測定される第1の測定環境と異なる第2の測定環境で測定された第2の頭部伝達関数から抽出された前記第1の帯域より高い帯域を含む第2の帯域の特性とが合成されることで、第3の頭部伝達関数が生成される。
【発明の効果】
【0014】
本開示によれば、手軽に頭部伝達関数の個人化を実現することが可能となる。
【0015】
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
【図面の簡単な説明】
【0016】
図1】本開示に係る技術を適用した携帯端末の構成例を示すブロック図である。
図2】携帯端末の機能構成例を示すブロック図である。
図3】頭部伝達関数の生成処理について説明するフローチャートである。
図4】第1の実施の形態の携帯端末の構成例を示すブロック図である。
図5】頭部伝達関数の生成処理について説明するフローチャートである。
図6】複数チャンネルについての頭部伝達関数の測定について説明する図である。
図7】頭部伝達関数の帯域抽出について説明する図である。
図8】残響成分の付加について説明する図である。
図9】NCマイクロフォン利用時の特性の補正について説明する図である。
図10】出力部の構成例を示す図である。
図11】周波数特性の変更について説明する図である。
図12】第2の実施の形態の携帯端末の構成例を示すブロック図である。
図13】頭部伝達関数の生成処理について説明するフローチャートである。
図14】左右方向の頭部伝達関数の推定について説明する図である。
図15】推定フィルタの周波数特性の例を示す図である。
図16】頭部伝達関数の生成処理について説明するフローチャートである。
図17】正中面および矢状面の頭部伝達関数の測定について説明する図である。
図18】コンピュータの構成例を示すブロック図である。
【発明を実施するための形態】
【0017】
以下、本開示を実施するための形態(以下、実施の形態とする)について説明する。なお、説明は以下の順序で行う。
【0018】
1.本開示に係る技術を適用した携帯端末の構成と動作
2.第1の実施の形態(複数チャンネルについての頭部伝達関数の測定)
3.第2の実施の形態(正面方向についての頭部伝達関数の測定)
4.第3の実施の形態(正中面についての頭部伝達関数の測定)
5.その他
【0019】
<1.本開示に係る技術を適用した携帯端末の構成と動作>
(携帯端末の構成)
まず、図1を参照して、本開示に係る技術を適用した信号処理装置としての携帯端末の構成例について説明する。
【0020】
図1に示される携帯端末1は、例えば、いわゆるスマートフォンなどの携帯電話機として構成される。
【0021】
携帯端末1は、制御部11を備える。制御部11は、携帯端末1内の各部の動作を制御する。制御部11は、制御ライン28を介して、携帯端末1内の各部とデータのやり取りを行う。
【0022】
また、携帯端末1は、通信端末として必要な無線通信を行う通信部12を備える。通信部12には、アンテナ13が接続される。通信部12は、無線通信用の基地局と無線通信を行い、基地局との間で双方向のデータ伝送を行う。通信部12は、データライン29を介して、基地局側から受信したデータを携帯端末1内の各部に送出する。また、携帯端末1内の各部からデータライン29を介して伝送されたデータを、基地局側に送信する。
【0023】
データライン29には、通信部12の他に、メモリ14、表示部15、音声処理部17、および立体音響処理部21が接続される。
【0024】
メモリ14は、携帯端末1を動作させるために必要なプログラムや、ユーザが記憶させた各種データなどを記憶する。メモリ14には、ダウンロードなどで得られた音楽データなどの音声信号も記憶される。
【0025】
表示部15は、液晶ディスプレイや有機ELディスプレイなどで構成され、制御部11の制御により、各種情報の表示を行う。
【0026】
操作部16は、表示部15を構成するディスプレイと一体となって構成されるタッチパネルや、携帯端末1の筐体に設けられる物理的なボタンなどで構成される。タッチパネル(操作部16)としての表示部15には、数字や記号などのダイヤルキー、各種機能キーなどを表すボタンが表示される。各ボタンの操作情報は、制御部11に供給される。
【0027】
音声処理部17は、音声信号の処理を行う処理部であり、スピーカ18とマイクロフォン19が接続される。スピーカ18とマイクロフォン19は、通話時に受話器として機能する。
【0028】
通信部12から音声処理部17に供給される音声データは、音声処理部17により復調されてアナログ音声信号となり、増幅などのアナログ処理が施されてスピーカ18から放音される。また、マイクロフォン19により収音された音声の音声信号は、音声処理部17によりデジタル音声データに変調され、変調された音声データが通信部12に供給されて、無線送信などが行われる。
【0029】
また、音声処理部17に供給される音声データのうち、立体音響として出力される音声は、立体音響処理部21に供給され、処理される。
【0030】
立体音響処理部21は、バイノーラル立体音響を再現する2チャンネルの音声信号を生成する。立体音響処理部21が処理する音声信号は、音声処理部17から供給される他、メモリ14などから読み出されてデータライン29を介して供給されたり、通信部12で受信された音声データがデータライン29を介して供給されるなどしてもよい。
【0031】
立体音響処理部21で生成された音声信号は、携帯端末1本体に内蔵された左右のチャンネル用の2つのスピーカ22L,22Rから出力されたり、出力端子23に接続された図示せぬヘッドホンから出力されたりする。
【0032】
スピーカ22L,22Rは、携帯端末1本体に内蔵される、比較的小型なスピーカユニットを使用したスピーカであり、携帯端末1本体の周囲にいるリスナに対して再生音を聞かせることができる程度に増幅して出力させるスピーカである。
【0033】
音声信号を図示せぬヘッドホンから出力させる場合には、出力端子23にヘッドホンを直接、有線接続する他に、例えばBluetooth(登録商標)などの方式でヘッドホンと無線通信することで、ヘッドホンに音声信号を供給する構成としてもよい。
【0034】
図2は、上述した携帯端末1の機能構成例を示すブロック図である。
【0035】
図2の携帯端末1は、測定部51、帯域抽出部52、HRTFデータベース53、帯域抽出部54、合成部55、音声入力部56、および出力部57を備えている。
【0036】
測定部51は、携帯端末1を扱うユーザの頭部伝達関数(HRTF)を測定する。例えば、測定部51は、ユーザに対して1または複数の方向に配置された、例えばインパルス信号などの測定用音波を再生する音源に基づいて、頭部伝達関数を取得する。
【0037】
測定用音波を再生する音源は、少なくとも1つのスピーカを有する1のデバイスであればよく、そのスピーカは、必ずしも再生帯域が広いものでなくてもよい。
【0038】
例えば、測定用音波を再生する音源を、携帯端末1のスピーカ18とすることができる。この場合、ユーザは、所定の方向に携帯端末1を配置し、ユーザが左右の耳に装着した図示せぬマイクロフォンに、スピーカ18からの測定用音波を収音させる。測定部51は、所定の手段により供給されるマイクロフォンからの音声信号に基づいて、そのユーザの頭部伝達関数Hmを取得する。
【0039】
帯域抽出部52は、測定部51により測定された頭部伝達関数Hmから第1の帯域の特性を抽出する。抽出された第1の帯域の頭部伝達関数Hmは、合成部55に供給される。
【0040】
HRTFデータベース53は、頭部伝達関数Hmが測定される現在の測定環境とは異なる測定環境で測定された頭部伝達関数Hpを保持している。頭部伝達関数Hpは、例えばユーザが配置した携帯端末1のスピーカ18を用いて実測される頭部伝達関数Hmとは異なり、あらかじめ測定されたプリセットデータとされる。頭部伝達関数Hpは、例えば、平均的な形状の頭部や耳をもつ人やダミーヘッドについて、無響室や大型スピーカなどの設備を備える理想的な測定環境で測定された頭部伝達関数とされる。
【0041】
帯域抽出部54は、HRTFデータベース53に保持されている頭部伝達関数Hpから、上述した第1の帯域以外の第2の帯域の特性を抽出する。抽出された第2の帯域の頭部伝達関数Hpは、合成部55に供給される。
【0042】
合成部55は、帯域抽出部52からの第1の帯域の頭部伝達関数Hmと、帯域抽出部54からの第2の帯域の頭部伝達関数Hpとを合成することで、全帯域の頭部伝達関数Hを生成する。すなわち、頭部伝達関数Hは、第1の帯域については頭部伝達関数Hmの周波数特性を有し、第2の帯域については頭部伝達関数Hpの周波数特性を有する頭部伝達関数となる。生成された頭部伝達関数Hは、出力部57に供給される。
【0043】
音声入力部56は、再生させたい立体音響の元となる音声信号を出力部57に入力する。
【0044】
出力部57は、音声入力部56から入力された音声信号に対して、合成部55からの頭部伝達関数Hを畳み込んで2チャンネルの音声信号として出力する。出力部57により出力される音声信号は、バイノーラル立体音響を再現する音声信号となる。
【0045】
(携帯端末の動作)
次に、図3のフローチャートを参照して、携帯端末1による頭部伝達関数の生成処理について説明する。
【0046】
ステップS1において、測定部51は、スマートフォン(携帯端末1)を音源として用いることで、頭部伝達関数Hmを測定する。
【0047】
ステップS2において、帯域抽出部52は、測定された頭部伝達関数Hmから第1の帯域の特性を抽出する。第1の帯域は、あらかじめ決められた第1の周波数f1から、周波数f1より高い第2の周波数f2までの帯域であってよいし、単に、周波数f1より高い帯域であってもよい。第1の帯域は、特に、個人に依存する特性が現れやすい帯域とされる。
【0048】
ステップS3において、帯域抽出部54は、HRTFデータベース53に保持されているプリセットの頭部伝達関数Hpから第2の帯域の特性を抽出する。第2の帯域は、周波数f1より低い帯域と周波数f2より高い帯域を含む帯域であってもよいし、単に、周波数f1より低い帯域を含む帯域であってもよい。第2の帯域は、例えば、個人に依存する特性が現れにくく、スマートフォンが再生できない帯域とされる。
【0049】
ステップS4において、合成部55は、抽出された第1の帯域の頭部伝達関数Hmと、第2の帯域の頭部伝達関数Hpとを合成することで、頭部伝達関数Hを生成する。
【0050】
以上の処理によれば、実測された頭部伝達関数からは、個人に依存する特性が現れやすい帯域の特性が抽出され、プリセットの頭部伝達関数からは、個人に依存する特性が現れにくく、スマートフォンが再生できない帯域の特性が抽出される。したがって、再生帯域が狭いスマートフォンを音源としてユーザの頭部伝達関数を測定する場合であっても、十分な特性の頭部伝達関数を取得することができ、大規模な設備を用いることなく、全帯域における頭部伝達関数の個人化を手軽に実現することが可能となる。
【0051】
以下、本開示の技術に係る実施の形態について説明する。
【0052】
<2.第1の実施の形態>
(携帯端末の構成)
図4は、本開示の技術に係る第1の実施の形態の携帯端末1の構成例を示す図である。
【0053】
図4の携帯端末1は、バンドパスフィルタ111、補正部112、およびイコライザ113を備える。さらに、携帯端末1は、残響成分分離部121、ハイパスフィルタ131、イコライザ132、バンドパスフィルタ141、イコライザ142、ローパスフィルタ151、イコライザ152、合成部161、および残響成分付加部162を備える。
【0054】
バンドパスフィルタ111は、実測された頭部伝達関数Hmから、中域の特性を抽出する。中域は、あらかじめ決められた第1の周波数f1から、周波数f1より高い第2の周波数f2までの帯域とされる。抽出された中域の頭部伝達関数Hmは、補正部112に供給される。
【0055】
補正部112は、携帯端末1のスピーカ18の逆特性を用いて、頭部伝達関数Hmに含まれるスピーカ18の特性を除去するよう頭部伝達関数Hmを補正する。スピーカ18の逆特性は、あらかじめ測定されたプリセットデータであり、携帯端末1の機種毎に異なる特性を示す。スピーカ18の特性が除去された中域の頭部伝達関数Hmは、イコライザ113に供給される。
【0056】
イコライザ113は、中域の頭部伝達関数Hmに対して周波数特性の調整を行い、合成部161に出力する。
【0057】
残響成分分離部121は、プリセットデータである頭部伝達関数Hpを時間領域で表現した頭部インパルス応答において、直接成分と残響成分とを分離する。分離された残響成分は、残響成分付加部162に供給される。分離された直接成分に対応する頭部伝達関数Hpは、ハイパスフィルタ131、バンドパスフィルタ141、ローパスフィルタ151それぞれに供給される。
【0058】
ハイパスフィルタ131は、頭部伝達関数Hpから、高域の特性を抽出する。高域は、上述した周波数f2より高い帯域とされる。抽出された高域の頭部伝達関数Hpは、イコライザ132に供給される。
【0059】
イコライザ132は、高域の頭部伝達関数Hpに対して周波数特性の調整を行い、合成部161に出力する。
【0060】
バンドパスフィルタ141は、頭部伝達関数Hpから、中域の特性を抽出する。抽出された中域の頭部伝達関数Hpは、イコライザ142に供給される。
【0061】
イコライザ142は、中域の頭部伝達関数Hpに対して周波数特性の調整を行い、合成部161に出力する。このとき、中域の頭部伝達関数Hpには、そのゲインを0または略0にする処理が施されてもよい。
【0062】
ローパスフィルタ151は、頭部伝達関数Hpから、低域の特性を抽出する。低域は、上述した周波数f1より低い帯域とされる。抽出された低域の頭部伝達関数Hmは、イコライザ152に供給される。
【0063】
イコライザ152は、低域の頭部伝達関数Hpに対して周波数特性の調整を行い、合成部161に出力する。
【0064】
合成部161は、イコライザ113からの中域の頭部伝達関数Hm、イコライザ132からの高域の頭部伝達関数Hp、およびイコライザ152からの低域の頭部伝達関数Hpを合成し、全帯域の頭部伝達関数Hを生成する。生成された頭部伝達関数Hは、残響成分付加部162に供給される。
【0065】
残響成分付加部162は、合成部161からの頭部伝達関数Hに、残響成分分離部121からの残響成分を付加する。残響成分が付加された頭部伝達関数Hは、出力部57における畳み込みに用いられる。
【0066】
(頭部伝達関数の生成処理)
図5は、図4の携帯端末1による頭部伝達関数の生成処理について説明するフローチャートである。
【0067】
ステップS11において、測定部51(図2)は、スマートフォン(携帯端末1)を音源として用いることで、複数チャンネルについての頭部伝達関数Hmを測定する。これにより、頭部伝達関数が測定されたチャンネル数分の仮想音源を定位させることができる。
【0068】
例えば、図6のAの左図に示されるように、ユーザUがその左右斜め前それぞれにスマートフォンSPを手に持って腕を伸ばした状態で、頭部伝達関数を測定したとする。この場合、図6のAの右図に示されるように、ユーザUの左右斜め前それぞれに、仮想音源VS1,VS2を定位させることができる。
【0069】
また、図6のBの左図に示されるように、ユーザUがその正面、左右斜め前、左右横それぞれにスマートフォンSPを手に持って腕を伸ばした状態で、頭部伝達関数を測定したとする。この場合、図6のBの右図に示されるように、ユーザUの正面、左右斜め前、左右横それぞれに、仮想音源VS1,VS2,VS3,VS4,VS5を定位させることができる。
【0070】
ステップS12において、バンドパスフィルタ111は、測定された頭部伝達関数Hmから中域の特性を抽出する。抽出された中域の頭部伝達関数Hmは、補正部112によってスピーカ18の特性が除去された後、イコライザ113によって周波数特性の調整が行われる。
【0071】
ステップS13において、ハイパスフィルタ131およびローパスフィルタ151は、HRTFデータベース53に保持されているプリセットの頭部伝達関数Hpから低域・高域の特性を抽出する。抽出された低域の頭部伝達関数Hpは、イコライザ152によって周波数特性の調整が行われ、高域の頭部伝達関数Hpは、イコライザ132によって周波数特性の調整が行われる。ステップS13の処理は、あらかじめ行われていてもよい。
【0072】
なお、プリセットの頭部伝達関数Hpに対応する頭部インパルス応答からは、残響成分分離部121によって残響成分が分離される。分離された残響成分は、残響成分付加部162に供給される。
【0073】
ステップS14において、合成部161は、抽出された低域の頭部伝達関数Hmと、低域・高域の頭部伝達関数Hpとを合成することで、頭部伝達関数Hを生成する。
【0074】
図7のA,Bはそれぞれ、実測された頭部伝達関数Hmと、プリセットの頭部伝達関数Hpの周波数特性を示す図である。
【0075】
図7のAにおいて、破線枠FMで囲まれる帯域の特性が、バンドパスフィルタ111によって頭部伝達関数Hmから抽出される中域の特性である。中域は、例えば1kHzから12kHzまでの帯域とされる。
【0076】
一方、図7のBにおいて、破線枠FLで囲まれる帯域の特性が、ローパスフィルタ151によって頭部伝達関数Hpから抽出される低域の特性である。低域は、例えば1kHzより低い帯域とされる。また、図7のBにおいて、破線枠FHで囲まれる帯域の特性が、ハイパスフィルタ131によって頭部伝達関数Hpから抽出される高域の特性である。高域は、例えば12kHzより高い帯域とされる。
【0077】
このようにして抽出された1kHzから12kHzまでの帯域の頭部伝達関数Hmと、1kHzより低い帯域および12kHzより高い帯域の頭部伝達関数Hpとが合成されることで、全帯域の頭部伝達関数Hが生成される。
【0078】
スピーカの口径が小さく、再生帯域の狭いスマートフォンでは再生できない1kHzより低い帯域では、頭部伝達関数において個人に依存する特性が現れにくく、プリセットの特性に置き換えても十分な音像定位の精度が得られる。また、12kHzより高い帯域は、音像定位への寄与が小さく、プリセットの特性に置き換えても音像定位の精度に影響がない上に、プリセットの特性による高音質化が期待される。
【0079】
ステップS15において、残響成分付加部162は、合成部161からの頭部伝達関数Hに、残響成分分離部121からの残響成分を付加する。
【0080】
図8のA,Bはそれぞれ、実測された頭部伝達関数Hmと、プリセットの頭部伝達関数Hpを時間領域で表現した頭部インパルス応答を示す図である。
【0081】
図8のAにおいて、破線枠FDで囲まれている波形が、実測された頭部伝達関数Hmに対応する頭部インパルス応答Imの直接成分である。
【0082】
一方、図8のBにおいて、破線枠FRで囲まれている波形が、プリセットの頭部伝達関数Hpに対応する頭部インパルス応答Ipの残響成分である。
【0083】
図8の例では、実測された頭部インパルス応答Imの残響成分は、プリセットの頭部インパルス応答Ipと比較して、波形の振幅が小さくなっている。これらの波形の振幅の大小関係は、スマートフォンのスピーカを用いた測定環境によって異なり、実測された頭部インパルス応答Imの残響成分が、プリセットの頭部インパルス応答Ipと比較して、波形の振幅が大きくなることもある。
【0084】
残響成分付加部162においては、合成部161からの頭部伝達関数Hに、頭部インパルス応答Ipから分離された残響成分が付加される。残響成分が付加された頭部伝達関数Hは、出力部57における畳み込みに用いられる。
【0085】
以上の処理によれば、再生帯域が狭いスマートフォンを音源としてユーザの頭部伝達関数を測定する場合であっても、十分な特性の頭部伝達関数を取得することができる。すなわち、大規模な設備を用いることなく、全帯域における頭部伝達関数の個人化を手軽に実現することが可能となる。
【0086】
また、頭部インパルス応答の残響成分は、個人に依存しないので、実測された頭部インパルス応答にプリセットの頭部インパルス応答を付加しても、頭部伝達関数の個人化を実現することができる。さらに、ユーザが腕を伸ばした程度の状態での頭部伝達関数の測定であっても、プリセットの頭部インパルス応答の残響特性により、数m離れた場所にスピーカが設置されているような仮想音源を定位させるといった、距離感の制御を実現することができる。
【0087】
(ノイズキャンセリングマイクロフォンの利用)
上述した頭部伝達関数の測定においては、ユーザが左右の耳に装着するマイクロフォンとして、市販のノイズキャンセリングマイクロフォン(NCマイクロフォン)を利用することができる。
【0088】
図9は、同一のリスナを対象として、理想的な測定環境において測定専用のマイクロフォンとスピーカを用いて測定した頭部伝達関数Hdと、NCマイクロフォンとスマートフォンのスピーカを用いて測定した頭部伝達関数Hnの特性を示す図である。
【0089】
図中、1kHzより低い帯域において、頭部伝達関数Hnのゲインが小さいのは、スマートフォンのスピーカの、その帯域におけるゲインが小さいことによるものである。
【0090】
また、実測された頭部伝達関数の特性が用いられる中域(破線枠FMで囲まれる帯域)では、図中、白抜き矢印で示されるように、頭部伝達関数Hdと頭部伝達関数Hnとで差分が生じることがある。
【0091】
そこで、あらかじめ、NCマイクロフォン毎にこのような差分データを記録しておき、実測された頭部伝達関数の特性の補正量として用いるようにする。差分データによる補正は、例えば補正部112によって行われるようにする。これにより、市販のNCマイクロフォンを利用した場合であっても、実測された頭部伝達関数の特性を、理想的な測定環境で測定された頭部伝達関数の特性に近づけることができる。
【0092】
(音色の変更)
本実施の形態においては、仮想音源の音像定位を変えずに、立体音響の音色を変更することが可能である。
【0093】
図10は、出力部57(図2)の構成例を示す図である。
【0094】
出力部57には、FIR(Finite Impulse Response)フィルタ181L,181Rが設けられる。
【0095】
FIRフィルタ181Lは、音声入力部56(図2)からの音声信号に、合成部55からの頭部伝達関数Hのうちの左耳用の頭部伝達関数HLを畳み込むことで、左耳用の音声信号SLを出力する。
【0096】
同様に、FIRフィルタ181Rは、音声入力部56からの音声信号に、合成部55からの頭部伝達関数Hのうちの右耳用の頭部伝達関数HRを畳み込むことで、右耳用の音声信号SRを出力する。
【0097】
なお、出力部57においては、定位させたい仮想音源の数だけ、図10に示される構成が設けられ、各構成からの音声信号SL,SRが加算・合成されて出力される。
【0098】
FIRフィルタ181L,181Rは、直線位相特性を有するので、位相特性を保持した状態で周波数特性を変更することが可能となる。例えば、図11に示されるように、1つのインパルス応答190に対して、FIRフィルタ181L,181Rを適用することで、その周波数特性を、特性191としたり、特性192とすることができる。
【0099】
これにより、個人化された音像定位を変えずに、立体音響の音色を、他の音場の音色に変更することが可能となる。
【0100】
<3.第2の実施の形態>
(携帯端末の構成)
図12は、本開示の技術に係る第2の実施の形態の携帯端末1の構成例を示す図である。
【0101】
図12の携帯端末1は、バンドパスフィルタ111の前段に、推定部211とイコライザ212を備える点以外は、図4の携帯端末1と同様の構成を有する。
【0102】
推定部211は、実測された所定の方向についての頭部伝達関数Hmから、他の方向についての頭部伝達関数を推定する。実測された頭部伝達関数と推定された頭部伝達関数は、イコライザ212に供給される。
【0103】
イコライザ212は、推定部211からの頭部伝達関数に対して周波数特性の調整を行い、バンドパスフィルタ111に出力する。
【0104】
(頭部伝達関数の生成処理)
図13は、図12の携帯端末1による頭部伝達関数の生成処理について説明するフローチャートである。
【0105】
ステップS21において、測定部51(図2)は、スマートフォン(携帯端末1)を音源として用いることで、ユーザの正面方向についての頭部伝達関数Hmを測定する。この例では、ユーザが正面に携帯端末1を持って腕を伸ばした状態で、頭部伝達関数Hmが測定される。
【0106】
ステップS22において、推定部211は、測定された正面方向の頭部伝達関数Hmから、ユーザの左右方向の頭部伝達関数を推定する。
【0107】
ここで、左右方向の頭部伝達関数の推定について詳細に説明する。
【0108】
まず、図14のAに示されるように、ユーザUの正面方向にスマートフォンSPを配置することで測定された左右両耳の頭部伝達関数をCL,CRとする。
【0109】
次に、図14のBに示されるように、推定対称となる、ユーザUの正面方向から左30°方向についての左右両耳の頭部伝達関数をLL,LRとする。同様に、図14のCに示されるように、推定対称となる、ユーザUの正面方向から右30°方向についての左右両耳の頭部伝達関数をRL,RRとする。
【0110】
これら4つの特性LL,LR,RL,RRを、ユーザUとスマートフォンSPのスピーカとの距離によって日向側特性と日陰側特性に分類して推定する。具体的には、LL,RRは、スピーカから見てユーザUに近い側(日向側)の特性であるので、日向側特性に分類される。また、LR,RLは、スピーカから見てユーザUから見てスピーカの陰になる側(日陰側)の特性であるので、日陰側特性に分類される。
【0111】
日向側特性は、スピーカからの音が直接耳に伝搬する直接成分が大きいため、正面方向の測定により得られた特性と比べて中域から高域のゲインが大きくなる。
【0112】
一方、日陰側特性は、スピーカからの音が頭部を回り込んで伝搬するため、正面方向の測定により得られた特性と比べて高域のゲインが減衰する。
【0113】
また、スピーカから左右の耳までの距離の差による両耳時間差が生じる。
【0114】
以上の物理的な伝達特性を考慮し、正面方向についての特性CL,CRに対する補正項目を、以下の2項目とする。
【0115】
(1)音源が左右方向に移動することに起因する、中域から高域の音の増幅や、頭部の日陰側における音の減衰を再現するゲインの補正
(2)音源が左右方向に移動することに起因する、音源からの距離の変化に伴う遅延の補正
【0116】
図15は、正面方向についての特性CL,CRに対して、上記2項目の補正を実現する推定フィルタの周波数特性を示す図である。
【0117】
図15のAには、日向側特性を推定するための日向側推定フィルタが示される。日向側推定フィルタにおいては、中域から高域にかけてゲインが増大している。
【0118】
一方、図15のBには、日陰側特性を推定するための日陰側推定フィルタが示される。日陰側推定フィルタにおいては、中域から高域にかけてゲインが大きく減衰している。
【0119】
ここで、日向側推定フィルタのインパルス応答をfilti(t)とすると、日向側特性LL,RRは以下のように推定される。
【0120】
LL(t)=filti(t)*CL(t)
RR(t)=filti(t)*CR(t)
なお、“*”は畳み込みを意味する。
【0121】
また、日陰側推定フィルタのインパルス応答をfiltc(t)とすると、日陰側特性RL,LRは以下のように推定される。
【0122】
RL(t)=filtc(t)*CL(t)
LR(t)=filtc(t)*CR(t)
【0123】
以上のようにして推定された左右方向の頭部伝達関数は、正面方向の頭部伝達関数とともに、イコライザ212によって周波数特性の調整が行われる。なお、日陰側特性は、個人に依存する特性が現れにくいので、あらかじめ用意されたプリセットの特性が用いられてもよい。
【0124】
ステップS23において、バンドパスフィルタ111は、測定/推定された頭部伝達関数から中域の特性を抽出する。抽出された中域の頭部伝達関数は、補正部112によってスピーカ18の特性が除去された後、イコライザ113によって周波数特性の調整が行われる。
【0125】
なお、ステップS24以降の処理は、図5のフローチャートのステップS13以降の処理と同様であるので、その説明は省略する。
【0126】
以上の処理によれば、再生帯域が狭いスマートフォンを音源としてユーザの頭部伝達関数を測定する場合であっても、十分な特性の頭部伝達関数を取得することができる。すなわち、大規模な設備を用いることなく、全帯域における頭部伝達関数の個人化を手軽に実現することが可能となる。
【0127】
特に、本実施の形態においては、ユーザの正面方向の頭部伝達関数から左右方向の頭部伝達関数が推定されるので、1回の頭部伝達関数の測定のみで、複数の仮想音源を定位させる頭部伝達関数の個人化を実現することができる。
【0128】
<4.第3の実施の形態>
以下においては、ユーザの正中面についての頭部伝達関数から矢状面についての頭部伝達関数を推定する例について説明する。
【0129】
図16は、図12の携帯端末1による頭部伝達関数の生成処理の他の例について説明するフローチャートである。
【0130】
ステップS31において、測定部51(図2)は、スマートフォン(携帯端末1)を音源として用いることで、ユーザの正中面についての頭部伝達関数を測定する。
【0131】
例えば、図17のAに示されるように、ユーザUが、正中面351内にスマートフォンSPを配置することで、頭部伝達関数が測定される。図17の例では、正中面351内のユーザの正面、斜め上、斜め下の3方向についての頭部伝達関数が測定される。
【0132】
ステップS32において、推定部211は、測定された正中面の頭部伝達関数から、ユーザの左右の矢状面の頭部伝達関数を推定する。
【0133】
例えば、図17のBに示されるように、ユーザUのいる空間において、ユーザUの左側で正中面351に平行な矢状面352Lについての頭部伝達関数と、ユーザUの右側で正中面351に平行な矢状面352Rについての頭部伝達関数が推定される。
【0134】
ここでの頭部伝達関数の推定は、例えば、正中面351内のユーザの正面、斜め上、斜め下の3方向についての頭部伝達関数それぞれに対して、上述した日向側推定フィルタと日陰側推定フィルタを用いた補正を行うことで実現される。
【0135】
推定された矢状面の頭部伝達関数は、正中面の頭部伝達関数とともに、イコライザ212によって周波数特性の調整が行われる。
【0136】
なお、ステップS33以降の処理は、図13のフローチャートのステップS23以降の処理と同様であるので、その説明は省略する。
【0137】
以上の処理によれば、再生帯域が狭いスマートフォンを音源としてユーザの頭部伝達関数を測定する場合であっても、十分な特性の頭部伝達関数を取得することができる。すなわち、大規模な設備を用いることなく、全帯域における頭部伝達関数の個人化を手軽に実現することが可能となる。
【0138】
特に、本実施の形態においては、ユーザの周囲の任意の方向の頭部伝達関数が推定されるので、ユーザの所望する方向に仮想音源を定位させる頭部伝達関数の個人化を実現することができる。
【0139】
<5.その他>
(音源の他の例)
上述した説明においては、測定用音波を再生する音源を、スピーカを有するスマートフォンとしたが、これ以外のデバイスとしてもよい。例えば、測定用音波を再生する音源を、スピーカとディスプレイを有するテレビジョン受像機とすることもできる。テレビジョン受像機は、高々200Hz程度の帯域までしか再生できず、スマートフォンと同様、再生帯域が広いものではない。
【0140】
本開示に係る技術によれば、再生帯域が狭いテレビジョン受像機を音源としてユーザの頭部伝達関数を測定する場合であっても、十分な特性の頭部伝達関数を取得することができる。
【0141】
(クラウドコンピューティングへの適用)
本開示に係る技術を適用した信号処理装置は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
【0142】
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
【0143】
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
【0144】
例えば、図2のHRTFデータベース53が、インターネットなどのネットワークを介して接続されるサーバなど(いわゆるクラウド)に設けられてもよい。
【0145】
また、図2の携帯端末1が備える全ての構成がクラウドに設けられてもよい。この場合、携帯端末1は、収音した測定用音波の音声信号をクラウドに送信し、クラウドからの立体音響を再現する音声信号を受信し再生するのみの構成となる。
【0146】
(プログラムによる処理の実行)
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
【0147】
図18は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
【0148】
上述した携帯端末1は、図18に示す構成を有するコンピュータにより実現される。
【0149】
CPU1001、ROM1002、RAM1003は、バス1004により相互に接続されている。
【0150】
バス1004には、さらに、入出力インタフェース1005が接続されている。入出力インタフェース1005には、キーボード、マウスなどよりなる入力部1006、ディスプレイ、スピーカなどよりなる出力部1007が接続される。また、入出力インタフェース1005には、ハードディスクや不揮発性のメモリなどよりなる記憶部1008、ネットワークインタフェースなどよりなる通信部1009、リムーバブルメディア1011を駆動するドライブ1010が接続される。
【0151】
以上のように構成されるコンピュータでは、CPU1001が、例えば、記憶部1008に記憶されているプログラムを入出力インタフェース1005およびバス1004を介してRAM1003にロードして実行することにより、上述した一連の処理が行われる。
【0152】
CPU1001が実行するプログラムは、例えばリムーバブルメディア1011に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供され、記憶部1008にインストールされる。
【0153】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたときなどの必要なタイミングで処理が行われるプログラムであっても良い。
【0154】
なお、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。
【0155】
また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
【0156】
さらに、本開示は以下のような構成をとることができる。
(1)
ユーザの第1の頭部伝達関数から抽出された第1の帯域の特性と、前記第1の頭部伝達関数が測定される第1の測定環境と異なる第2の測定環境で測定された第2の頭部伝達関数から抽出された前記第1の帯域以外の第2の帯域の特性とを合成することで、第3の頭部伝達関数を生成する合成部
を備える信号処理装置。
(2)
前記第1の帯域は、第1の周波数から第2の周波数までの帯域であり、
前記第2の帯域は、前記第1の周波数より低い帯域と、前記第2の周波数より高い帯域を含む
(1)に記載の信号処理装置。
(3)
前記第1の帯域は、第1の周波数より高い帯域であり、
前記第2の帯域は、前記第1の周波数より低い帯域を含む
(1)に記載の信号処理装置。
(4)
前記第1の頭部伝達関数は、前記ユーザが配置した音源を用いて実測されるデータであり、
前記第2の頭部伝達関数は、あらかじめ理想的な測定環境で測定されたプリセットデータである
(1)乃至(3)のいずれかに記載の信号処理装置。
(5)
前記第1の帯域は、個人に依存する特性を含む帯域である
(4)に記載の信号処理装置。
(6)
前記第2の帯域は、前記音源が再生できない帯域を含む
(4)または(5)に記載の信号処理装置。
(7)
前記音源は、スピーカを有するデバイスである
(4)乃至(6)のいずれかに記載の信号処理装置。
(8)
前記デバイスは、ディスプレイをさらに有する
(7)に記載の信号処理装置。
(9)
前記デバイスは、スマートフォンである
(8)に記載の信号処理装置。
(10)
前記デバイスは、テレビジョン受像機である
(8)に記載の信号処理装置。
(11)
前記第1の頭部伝達関数から抽出された前記第1の帯域の特性に含まれる前記音源の特性を除去するよう、前記第1の帯域の特性を補正する補正部をさらに備える
(4)乃至(10)のいずれかに記載の信号処理装置。
(12)
前記第2の頭部伝達関数に対応する頭部インパルス応答から分離された残響成分を、前記第3の頭部伝達関数に付加する付加部をさらに備える
(1)乃至(11)のいずれかに記載の信号処理装置。
(13)
信号処理装置が、
ユーザの第1の頭部伝達関数から抽出された第1の帯域の特性と、前記第1の頭部伝達関数が測定される第1の測定環境と異なる第2の測定環境で測定された第2の頭部伝達関数から抽出された前記第1の帯域以外の第2の帯域の特性とを合成することで、第3の頭部伝達関数を生成する
信号処理方法。
(14)
コンピュータに、
ユーザの第1の頭部伝達関数から抽出された第1の帯域の特性と、前記第1の頭部伝達関数が測定される第1の測定環境と異なる第2の測定環境で測定された第2の頭部伝達関数から抽出された前記第1の帯域以外の第2の帯域の特性とを合成することで、第3の頭部伝達関数を生成する
処理を実行させるためのプログラム。
【符号の説明】
【0157】
1 携帯端末, 51 測定部, 52 帯域抽出部, 53 HRTFデータベース, 54 帯域抽出部, 55 合成部, 56 音声入力部, 57 出力部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18