(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024125727
(43)【公開日】2024-09-19
(54)【発明の名称】クラスタリング装置、及びクラスタリング方法
(51)【国際特許分類】
H04S 7/00 20060101AFI20240911BHJP
【FI】
H04S7/00 300
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2023033741
(22)【出願日】2023-03-06
(71)【出願人】
【識別番号】308036402
【氏名又は名称】株式会社JVCケンウッド
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】井手上 涼
(72)【発明者】
【氏名】小西 正也
(72)【発明者】
【氏名】村田 寿子
(72)【発明者】
【氏名】下条 敬洋
(72)【発明者】
【氏名】叶 和樹
(72)【発明者】
【氏名】藤井 優美
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162CD26
5D162DA22
5D162EG02
(57)【要約】
【課題】適切にクラスタリングできるクラスタリング装置、及びクラスタリング方法を提供する。
【解決手段】クラスタリング装置は、周波数特性を平滑化して、平滑化特性を算出する平滑化処理部214と、平滑化特性のピークとノッチを特定する特定部216、ピークとノッチに応じた第1特徴量ベクトルを取得する第1特徴量算出部217と、平滑化特性を近似した近似関数を示す形状特性を算出する形状特性算出部218と、形状特性に応じた第2特徴量ベクトルを取得する第2特徴量算出部219と、第1特徴量ベクトルに基づいて、クラスタリングを行う第1クラスタリング部221と、第2特徴量ベクトルに応じて、クラスタリングを行う第2クラスタリング部222と、を備えている。
【選択図】
図3
【特許請求の範囲】
【請求項1】
複数の被測定者に対する測定で収音された収音信号の周波数特性を取得する周波数特性取得部と、
前記周波数特性を平滑化して、平滑化特性を算出する平滑化処理部と、
前記平滑化特性のピークとノッチを特定する特定部と、
前記ピークとノッチに応じた第1特徴量ベクトルを算出する第1特徴量算出部と、
前記平滑化特性を近似した近似関数を示す形状特性を算出する形状特性算出部と、
前記形状特性に応じた第2特徴量ベクトルを算出する第2特徴量算出部と、
複数の前記第1特徴量ベクトルに基づいて、クラスタリングを行う第1クラスタリング部と、
複数の前記第2特徴量ベクトルに基づいて、クラスタリングを行う第2クラスタリング部と、を備えたクラスタリング装置。
【請求項2】
前記形状特性算出部が、
前記ピーク又は前記ノッチに応じて、前記平滑化特性を複数の帯域に分割し、
前記帯域毎に前記近似関数を求めて、帯域毎に前記形状特性を算出する請求項1に記載のクラスタリング装置。
【請求項3】
前記第1クラスタリング部及び第2クラスタリング部でクラスタリングされた各クラスタの代表特性を算出する代表特性算出部をさらに備えた請求項1、又は2に記載のクラスタリング装置。
【請求項4】
前記被測定者に対する測定データと、クラスタリング結果のデータとを格納するデータ格納部と、
頭外定位受聴を行うユーザに対するユーザ測定で得られたユーザデータと、前記測定データとを比較して、前記ユーザと最も類似する被測定者を特定する比較部と、
前記比較部で特定された被測定者の属するクラスタの代表特性に基づいて、フィルタを決定するフィルタ決定部と、を備えた請求項3に記載のクラスタリング装置。
【請求項5】
複数の被測定者に対する測定で収音された収音信号の周波数特性を取得するステップと、
前記周波数特性を平滑化して、平滑化特性を算出するステップと、
前記平滑化特性のピークとノッチを特定するステップと、
前記ピークとノッチに応じた第1特徴量ベクトルを算出するステップと、
前記平滑化特性を近似した近似関数を示す形状特性を算出するステップと、
前記形状特性に応じた第2特徴量ベクトルを算出するステップと、
複数の前記第1特徴量ベクトルに基づいて、クラスタリングを行うステップと、
複数の前記第2特徴量ベクトルに基づいて、クラスタリングを行うステップと、を備えたクラスタリング方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、クラスタリング生成装置、及びクラスタリング方法に関する。
【背景技術】
【0002】
音像定位技術として、ヘッドホンを用いて受聴者の頭部の外側に音像を定位させる頭外定位技術がある。頭外定位技術では、ヘッドホンから耳までの特性をキャンセルし、ステレオスピーカから耳までの4本の特性を与えることにより、音像を頭外に定位させている。
【0003】
頭外定位再生においては、2チャンネル(以下、chと記載)のスピーカから発した測定信号(インパルス音等)を聴取者本人(ユーザ)の耳に設置したマイクロフォン(以下、マイクとする)で録音する。そして、インパルス応答で得られた収音信号に基づいて、処理装置がフィルタを作成する。これにより、スピーカから外耳道のマイク位置までの空間音響伝達特性に応じたフィルタが作成される。作成したフィルタを2chのオーディオ信号に畳み込むことにより、頭外定位再生を実現することができる。
【0004】
さらに、ヘッドホンから耳までの特性をキャンセルするためのフィルタを生成するために、ヘッドホンから耳元乃至鼓膜までの特性(外耳道伝達関数ECTF、外耳道伝達特性とも言う)を聴取者本人の耳に設置したマイクで測定する。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1には、頭外定位フィルタを決定するシステムが開示されている。このシステムは、空間音響伝達特性に関する第1のプリセットデータと外耳道伝達特性に関する第2のプリセットデータとをデータベースに格納している。具体的には、予め、複数の被測定者の外耳道伝達特性と空間音響伝達特性とが測定されている。被測定者毎に、第1のプリセットデートと第2のプリセットデータとが対応付けられている。そして、頭外定位受聴を行うユーザについては、外耳道伝達特性のみが測定される。
【0007】
このシステムは、ユーザの外耳道伝達特性の周波数特性を平滑化している。システムは、平滑化した周波数特性のピークとノッチとをユーザ特徴量として抽出している。システムは、複数の第2のプリセットデータの中からユーザ特徴量が類似する特徴量を有するデータを抽出している。システムは、ユーザ特徴量と類似する特徴量に基づいて、空間音響フィルタを決定している。さらに、周波数特性のピーク数とノッチ数に基づいて、第2のプリセットデータをクラスタリングしている。
【0008】
このような収音信号を用いる場合、より適切にクラスタリングすることが望まれる。
【0009】
本開示は上記の点に鑑みなされたものであり、適切にクラスタリングすることができるクラスタリング装置、及びクラスタリング方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
本実施の形態にかかるクラスタリング装置は、複数の被測定者に対する測定で収音された収音信号の周波数特性を取得する周波数特性取得部と、前記周波数特性を平滑化して、平滑化特性を算出する平滑化処理部と、前記平滑化特性のピークとノッチを特定する特定部と、前記ピークとノッチに応じた第1特徴量ベクトルを算出する第1特徴量算出部と、前記平滑化特性を近似した近似関数を示す形状特性を算出する形状特性算出部と、前記形状特性に応じた第2特徴量ベクトルを算出する第2特徴量算出部と、複数の前記第1特徴量ベクトルに基づいて、クラスタリングを行う第1クラスタリング部と、複数の前記第2特徴量ベクトルに基づいて、クラスタリングを行う第2クラスタリング部と、を備えている。
【0011】
本実施の形態にかかるクラスタリング方法は、複数の被測定者に対する測定で収音された収音信号の周波数特性を取得するステップと、前記周波数特性を平滑化して、平滑化特性を算出するステップと、前記平滑化特性のピークとノッチを特定するステップと、前記ピークとノッチに応じた第1特徴量ベクトルを算出するステップと、前記平滑化特性を近似した近似関数を示す形状特性を算出するステップと、前記形状特性に応じた第2特徴量ベクトルを算出するステップと、複数の前記第1特徴量ベクトルに基づいて、クラスタリングを行うステップと、複数の前記第2特徴量ベクトルに基づいて、クラスタリングを行うステップと、を備えている。
【発明の効果】
【0012】
本開示によれば、適切にクラスタリングすることができるクラスタリング装置、及びクラスタリング方法を提供することができる。
【図面の簡単な説明】
【0013】
【
図1】本実施の形態に係る頭外定位処理装置を示すブロック図である。
【
図2】空間音響伝達特性を測定する測定装置の構成を示す図である。
【
図4】平滑化特性のピークとノッチとを示すグラフである。
【
図6】クラスタリングの処理を示すフローチャートである。
【
図7】特徴量の抽出処理を示すフローチャートである。
【
図8】ピークとノッチの特定処理を示すフローチャートである。
【
図9】頭外定位フィルタ決定装置の構成を示すブロック図である。
【
図10】データ格納部に格納されたデータを説明するための図である。
【発明を実施するための形態】
【0014】
本実施の形態にかかる音像定位処理の概要について説明する。本実施の形態にかかる頭外定位処理は、空間音響伝達特性と外耳道伝達特性を用いて頭外定位処理を行うものである。空間音響伝達特性は、スピーカなどの音源から外耳道までの伝達特性である。外耳道伝達特性は、ヘッドホン又はイヤホンのスピーカユニットから鼓膜までの伝達特性である。本実施の形態では、ヘッドホン又はイヤホンを装着した状態での外耳道伝達特性を測定している。また、空間音孔伝達特性については,ユーザ以外の被測定者から得られたデータを用いている。それらのデータを用いて頭外定位処理を実現している。
【0015】
本実施の形態にかかる頭外定位処理は、パーソナルコンピュータ、スマートホン、タブレットPCなどのユーザ端末で実行される。ユーザ端末は、プロセッサ等の処理手段、メモリやハードディスクなどの記憶手段、液晶モニタ等の表示手段、タッチパネル、ボタン、キーボード、マウスなどの入力手段を有する情報処理装置である。ユーザ端末は、データを送受信する通信機能を有していてもよい。さらに、ユーザ端末には、ヘッドホン又はイヤホンを有する出力手段(出力ユニット)が接続される。ユーザ端末と出力手段との接続は、有線接続でも無線接続でもよい。
【0016】
高い定位効果を得るには、ユーザ本人の特性を測定して頭外定位フィルタを生成することが好ましい。ユーザ個人の空間音響伝達特性は、スピーカ等の音響機材や室内の音響特性が整えられたリスニングルームで行われることが一般的である。すなわち、ユーザがリスニングルームに行くか、ユーザの自宅などにリスニングルームを準備する必要がある。このため、ユーザ個人の空間音響伝達特性を適切に測定することができない場合がある。
【0017】
また、ユーザの自宅などにスピーカを設置してリスニングルームを準備した場合でも、左右非対称にスピーカが設置されている場合や、部屋の音響環境が音楽聴取に最適でない場合がある。このような場合、自宅で適切な空間音響伝達特性を測定することは大変困難である。
【0018】
一方、ユーザ個人の外耳道伝達特性の測定は、マイクユニット、及びヘッドホンを装着した状態で行われる。すなわち、ユーザがマイクユニット、及びヘッドホンを装着していれば、外耳道伝達特性を測定することができる。ユーザがリスニングルームに行く必要や、ユーザの家に大がかりなリスニングルームを準備する必要がない。また、外耳道伝達特性を測定するための測定信号の発生や、収音信号の記録などはスマートホンやPCなどのユーザ端末を用いて、行うことができる。
【0019】
このように、ユーザ個人に対して、空間音響伝達特性の測定を実施することが困難である場合がある。そこで、外耳道伝達特性の測定結果から、空間音響伝達特性に応じた空間音響フィルタを求めることが望まれる。そこで、本実施の形態では、事前に複数の空間音響伝達特性に応じて、複数の被測定者をクラスタリングしている。複数の被測定者を2以上のクラスタに分類する。このようにすることで、空間音響伝達特性の測定を実施しなくても、ユーザに適切なフィルタを決定することができる。
【0020】
(頭外定位処理装置)
本実施の形態にかかる音場再生装置の一例である、頭外定位処理装置100のブロック図を
図1に示す。頭外定位処理装置100は、ヘッドホン43を装着するユーザUに対して音場を再生する。そのため、頭外定位処理装置100は、LchとRchのステレオ入力信号XL、XRについて、音像定位処理を行う。LchとRchのステレオ入力信号XL、XRは、CD(Compact Disc)プレイヤーなどから出力されるアナログのオーディオ再生信号、又は、mp3(MPEG Audio Layer-3)等のデジタルオーディオデータである。なお、オーディオ再生信号、又はデジタルオーディオデータをまとめて再生信号と称する。すなわち、LchとRchのステレオ入力信号XL、XRが再生信号となっている。
【0021】
本実施の形態では、頭外定位処理装置100が、フィルタを適切に生成するための演算処理を行っている。頭外定位処理装置100の演算処理部は、パーソナルコンピュータ(PC)、タブレット端末、スマートホン等であり、メモリ、及びプロセッサを備えている。メモリは、処理プログラムや各種パラメータや測定データなどを記憶している。プロセッサは、メモリに格納された処理プログラムを実行する。プロセッサが処理プログラムを実行することで、各処理が実行される。プロセッサは、例えば、CPU(Central Processing Unit)、FPGA(Field-Programmable Gate Array)、DSP(Digital Signal Processor),ASIC(Application Specific Integrated Circuit)、又は、GPU(Graphics Processing Unit)等であってもよい。
【0022】
なお、頭外定位処理装置100は、物理的に単一な装置に限られるものではなく、一部の処理が異なる装置で行われてもよい。例えば、一部の処理がスマートホンなどにより行われ、残りの処理がヘッドホン43に内蔵されたDSP(Digital Signal Processor)などにより行われてもよい。
【0023】
頭外定位処理装置100は、頭外定位処理部10、逆フィルタLinvを格納する逆フィルタ部41、逆フィルタRinvを格納する逆フィルタ部42、及びヘッドホン43を備えている。頭外定位処理部10、逆フィルタ部41、及び逆フィルタ部42は、具体的にはプロセッサ等により実現可能である。
【0024】
頭外定位処理部10は、空間音響伝達特性Hls、Hlo、Hro、Hrsを格納する畳み込み演算部11~12、21~22、及び加算器24、25を備えている。畳み込み演算部11~12、21~22は、空間音響伝達特性を用いた畳み込み処理を行う。頭外定位処理部10には、CDプレイヤーなどからのステレオ入力信号XL、XRが入力される。頭外定位処理部10には、空間音響伝達特性が設定されている。頭外定位処理部10は、各chのステレオ入力信号XL、XRに対し、空間音響伝達特性のフィルタ(以下、空間音響フィルタとも称する)を畳み込む。空間音響伝達特性は被測定者の頭部や耳介で測定した頭部伝達関数HRTFでもよいし、ダミーヘッドまたは第三者の頭部伝達関数であってもよい。
【0025】
4つの空間音響伝達特性Hls、Hlo、Hro、Hrsを1セットとしたものを空間音響伝達関数とする。畳み込み演算部11、12、21、22で畳み込みに用いられるデータが空間音響フィルタとなる。空間音響伝達特性Hls、Hlo、Hro、Hrsを所定のフィルタ長で切り出すことで、空間音響フィルタが生成される。
【0026】
空間音響伝達特性Hls、Hlo、Hro、Hrsのそれぞれは、インパルス応答測定などにより、事前に取得されている。例えば、被測定者が左右の耳にマイクをそれぞれ装着する。被測定者の前方に配置された左右のスピーカが、インパルス応答測定を行うための、インパルス音をそれぞれ出力する。そして、スピーカから出力されたインパルス音等の測定信号をマイクで収音する。マイクでの収音信号に基づいて、空間音響伝達特性Hls、Hlo、Hro、Hrsが取得される。左スピーカと左マイクとの間の空間音響伝達特性Hls、左スピーカと右マイクとの間の空間音響伝達特性Hlo、右スピーカと左マイクとの間の空間音響伝達特性Hro、右スピーカと右マイクとの間の空間音響伝達特性Hrsが測定される。
【0027】
そして、畳み込み演算部11は、Lchのステレオ入力信号XLに対して空間音響伝達特性Hlsに応じた空間音響フィルタを畳み込む。畳み込み演算部11は、畳み込み演算データを加算器24に出力する。畳み込み演算部21は、Rchのステレオ入力信号XRに対して空間音響伝達特性Hroに応じた空間音響フィルタを畳み込む。畳み込み演算部21は、畳み込み演算データを加算器24に出力する。加算器24は2つの畳み込み演算データを加算して、逆フィルタ部41に出力する。
【0028】
畳み込み演算部12は、Lchのステレオ入力信号XLに対して空間音響伝達特性Hloに応じた空間音響フィルタを畳み込む。畳み込み演算部12は、畳み込み演算データを、加算器25に出力する。畳み込み演算部22は、Rchのステレオ入力信号XRに対して空間音響伝達特性Hrsに応じた空間音響フィルタを畳み込む。畳み込み演算部22は、畳み込み演算データを、加算器25に出力する。加算器25は2つの畳み込み演算データを加算して、逆フィルタ部42に出力する。
【0029】
逆フィルタ部41、42にはヘッドホン特性(ヘッドホンの再生ユニットとマイク間の特性)をキャンセルする逆フィルタLinv、Rinvが設定されている。そして、頭外定位処理部10での処理が施された再生信号(畳み込み演算信号)に逆フィルタLinv、Rinvを畳み込む。逆フィルタ部41で加算器24からのLch信号に対して、Lch側のヘッドホン特性の逆フィルタLinvを畳み込む。同様に、逆フィルタ部42は加算器25からのRch信号に対して、Rch側のヘッドホン特性の逆フィルタRinvを畳み込む。逆フィルタLinv、Rinvは、ヘッドホン43を装着した場合に、ヘッドホンユニットからマイクまでの特性をキャンセルする。マイクは、外耳道入口から鼓膜までの間ならばどこに配置してもよい。
【0030】
逆フィルタ部41は、処理されたLch信号YLをヘッドホン43の左ユニット43Lに出力する。逆フィルタ部42は、処理されたRch信号YRをヘッドホン43の右ユニット43Rに出力する。ユーザUは、ヘッドホン43を装着している。ヘッドホン43は、Lch信号YLとRch信号YR(以下、Lch信号YLとRch信号YRをまとめてステレオ信号とも称する)をユーザUに向けて出力する。これにより、ユーザUの頭外に定位された音像を再生することができる。
【0031】
このように、頭外定位処理装置100は、空間音響伝達特性Hls、Hlo、Hro、Hrsに応じた空間音響フィルタと、ヘッドホン特性の逆フィルタLinv,Rinvを用いて、頭外定位処理を行っている。以下の説明において、空間音響伝達特性Hls、Hlo、Hro、Hrsに応じた空間音響フィルタと、ヘッドホン特性の逆フィルタLinv,Rinvとをまとめて頭外定位処理フィルタとする。2chのステレオ再生信号の場合、頭外定位フィルタは、4つの空間音響フィルタと、2つの逆フィルタとから構成されている。そして、頭外定位処理装置100は、ステレオ再生信号に対して合計6個の頭外定位フィルタを用いて畳み込み演算処理を行うことで、頭外定位処理を実行する。頭外定位フィルタは、ユーザU個人の測定に基づくものであることが好ましい。例えば,ユーザUの耳に装着されたマイクが収音した収音信号に基づいて、頭外定位フィルタが設定されている。
【0032】
このように空間音響フィルタと、ヘッドホン特性の逆フィルタLinv,Rinvはオーディオ信号用のフィルタである。これらのフィルタが再生信号(ステレオ入力信号XL、XR)に畳み込まれることで、頭外定位処理装置100が、頭外定位処理を実行する。
【0033】
(空間音響伝達特性の測定装置)
図2を用いて、空間音響伝達特性Hls、Hlo、Hro、Hrsを測定する測定装置200について説明する。
図2は、被測定者1に対して測定を行うための測定構成を模式的に示す図である。なお、ここでは、被測定者1は、
図1のユーザUと異なる人物となっている。後述するクラスタリング処理に先立って、複数の被測定者1に対して同様の測定が行われている。
【0034】
図2に示すように、測定装置200は、ステレオスピーカ5とマイクユニット2を有している。ステレオスピーカ5が測定環境に設置されている。測定環境は、ユーザUの自宅の部屋やオーディオシステムの販売店舗やショールーム等でもよい。測定環境は、スピーカや音響の整ったリスニングルームであることが好ましい。
【0035】
本実施の形態では、測定装置200の処理装置201が、空間音響フィルタを適切に生成するための演算処理を行っている。処理装置201は、音楽プレイヤーなどを有している。処理装置201は、パーソナルコンピュータ(PC)、タブレット端末、スマートホン等であってもよい。
【0036】
ステレオスピーカ5は、左スピーカ5Lと右スピーカ5Rを備えている。例えば、被測定者1の前方に左スピーカ5Lと右スピーカ5Rが設置されている。左スピーカ5Lと右スピーカ5Rは、インパルス応答測定を行うためのインパルス音等を出力する。以下、本実施の形態では、音源となるスピーカの数を2(ステレオスピーカ)として説明するが、測定に用いる音源の数は2に限らず、1以上であればよい。すなわち、1chのモノラル、または、5.1ch、7.1ch等の、いわゆるマルチチャンネル環境においても同様に、本実施の形態を適用することができる。
【0037】
マイクユニット2は、左のマイク2Lと右のマイク2Rを有するステレオマイクである。左のマイク2Lは、被測定者1の左耳9Lに設置され、右のマイク2Rは、被測定者1の右耳9Rに設置されている。具体的には、左耳9L、右耳9Rの外耳道入口から鼓膜までの位置にマイク2L、2Rを設置することが好ましい。マイク2L、2Rは、ステレオスピーカ5から出力された測定信号を収音して、収音信号を取得する。マイク2L、2Rは収音信号を処理装置201に出力する。被測定者1は、人でもよく、ダミーヘッドでもよい。すなわち、本実施形態において、被測定者1は人だけでなく、ダミーヘッドを含む概念である。
【0038】
上記のように、左スピーカ5L、右スピーカ5Rで出力されたインパルス音をマイク2L、2Rで測定することでインパルス応答が測定される。処理装置201は、インパルス応答測定により取得した収音信号をメモリなどに記憶する。これにより、左スピーカ5Lと左マイク2Lとの間の空間音響伝達特性Hls、左スピーカ5Lと右マイク2Rとの間の空間音響伝達特性Hlo、右スピーカ5Rと左マイク2Lとの間の空間音響伝達特性Hro、右スピーカ5Rと右マイク2Rとの間の空間音響伝達特性Hrsが測定される。すなわち、左スピーカ5Lから出力された測定信号を左マイク2Lが収音することで、空間音響伝達特性Hlsが取得される。左スピーカ5Lから出力された測定信号を右マイク2Rが収音することで、空間音響伝達特性Hloが取得される。右スピーカ5Rから出力された測定信号を左マイク2Lが収音することで、空間音響伝達特性Hroが取得される。右スピーカ5Rから出力された測定信号を右マイク2Rが収音することで、空間音響伝達特性Hrsが取得される。
【0039】
また、測定装置200は、収音信号に基づいて、左右のスピーカ5L、5Rから左右のマイク2L、2Rまでの空間音響伝達特性Hls、Hlo、Hro、Hrsに応じた空間音響フィルタを生成してもよい。例えば、処理装置201は、空間音響伝達特性Hls、Hlo、Hro、Hrsを所定のフィルタ長で切り出す。
【0040】
このようにすることで、処理装置201は、頭外定位処理装置100の畳み込み演算に用いられる空間音響フィルタを生成する。
図1で示したように、頭外定位処理装置100が、左右のスピーカ5L、5Rと左右のマイク2L、2Rとの間の空間音響伝達特性Hls、Hlo、Hro、Hrsに応じた空間音響フィルタを用いて頭外定位処理を行う。すなわち、空間音響フィルタをオーディオ再生信号に畳み込むことにより、頭外定位処理を行う。
【0041】
処理装置201は、空間音響伝達特性Hls、Hlo、Hro、Hrsのそれぞれに対応する収音信号に対して同様の処理を実施している。すなわち、空間音響伝達特性Hls、Hlo、Hro、Hrsに対応する4つの収音信号に対して、それぞれ同様の処理が実施される。これにより、空間音響伝達特性Hls、Hlo、Hro、Hrsに対応する空間音響フィルタをそれぞれ生成することができる。
【0042】
次に、処理装置201が空間音響伝達特性をクラスタリングする処理について、
図3を用いて説明する。
図3は、処理装置201の構成を示すブロック図である。なお、以下、処理装置201は、測定装置200に用いられている装置となっているが、以下に示す少なくとも一部の機能は、測定装置200の処理装置201とは異なる装置に搭載されていてもよい。
【0043】
処理装置201は、測定信号生成部211と、収音信号取得部212と、周波数特性取得部213と、平滑化処理部214と、極値抽出部215と、特定部216と、第1特徴量算出部217と、形状特性算出部218と、第2特徴量算出部219と、クラスタリング部220と、を備えている。クラスタリング部220は第1クラスタリング部221と、第2クラスタリング部222とを備えている。処理装置201は、データ格納部225と、代表特性算出部226とを備えている。
【0044】
処理装置201は、パーソナルコンピュータ(PC)、タブレット端末、スマートホン等であり、メモリ、及びプロセッサを備えている。メモリは、処理プログラムや各種パラメータや測定データなどを記憶している。プロセッサは、メモリに格納された処理プログラムを実行する。
【0045】
測定信号生成部211は、D/A変換器やアンプなどを備えており、外耳道伝達特性を測定するための測定信号を生成する。測定信号は、例えば、インパルス信号やTSP(Time Stretched Pulse)信号等である。ここでは、測定信号としてインパルス音を用いて、測定装置200がインパルス応答測定を実施している。
【0046】
マイクユニット2の左マイク2L、右マイク2Rがそれぞれ測定信号を収音し、収音信号を処理装置201に出力する。収音信号取得部212は、左マイク2L、右マイク2Rで収音された収音信号を取得する。なお、収音信号取得部212は、マイク2L、2Rからの収音信号をA/D変換するA/D変換器を備えていてもよい。収音信号取得部212は、複数回の測定により得られた信号を同期加算してもよい。時間領域の収音信号をECTFと称する。
【0047】
周波数特性取得部213は、収音信号の周波数特性を取得する。周波数特性取得部213は、離散フーリエ変換や離散コサイン変換により収音信号の周波数特性を算出する。周波数特性取得部213は、例えば、時間領域の収音信号をFFT(高速フーリエ変換)することで、周波数特性を算出する。周波数特性は、振幅スペクトルと、位相スペクトルとを含んでいる。なお、周波数特性取得部213は振幅スペクトルの代わりにパワースペクトルを生成してもよい。このようにすることで、周波数特性取得部213が、収音信号の周波数特性を取得する。
【0048】
平滑化処理部214は、周波数特性に対して平滑化処理を行うことで、平滑化特性(平滑化スペクトルともいう)を算出する。平滑化処理部214は、移動平均やSavitzky-Golayフィルタ、平滑化スプライン、ケプストラム変換、ケプストラム包絡線等の手法を用いて、周波数振幅特性のスペクトルデータを平滑化する。これにより、平滑化処理部214は平滑化特性を算出することができる。
【0049】
極値抽出部215は、平滑化特性の極値を抽出する。極値抽出部215は、平滑化特性の極大値と極小値を抽出する。つまり、平滑化特性の傾きが正から負に変わる点を極大値とし、負から正に変わる点を極小値とする。極値抽出部215は、複数の極大値と、複数の極小値とを算出する。
【0050】
特定部216は、平滑化特性からピークとノッチとを特定する。ここで、複数のノッチを区別するため、低周波数側から順にN1、N2、N3等として特定する。同様に、複数のピークを区別するため、低周波数側から順にP1、P2、P3等として特定する。特定部216は複数の極大値の中から,3つのピークP1、P2、P3を選択する。特定部216は複数の極小値の中から、3つのノッチN1、N2、N3を選択する。
【0051】
図4は、平滑化特性と、平滑化特性から得られたノッチN1~N3と、ピークP1~P3と、を模式的に示すグラフである。低周波数側から順に、ピークP1、ノッチN1、ピークP2、ノッチN2、ピークP3、ノッチN3が特定されている。特定部216は、いずれの収音信号を平滑化した平滑化特性に対して、3つのピークP1~P3と3つのノッチN1~N3を特定する。
【0052】
ここで、特定部216は、所定の選定帯域SB1の中から、ピークP1を選定する。また、特定部216は、所定の選定帯域SB2から、ノッチN2を選択する。選定帯域SB1は、2kHz~6kHzとすることができる。選定帯域SB2は、6kHz~9kHzとすることができる。
【0053】
選定帯域SB1、SB2は、聴覚特性を元に設定されている。例えば、
図5はラウドネスカーブを示すグラフである。選定帯域SB1、SB2のラウドネスカーブの最小可聴曲線に基づいて設定される。2kHz~6kHzは最も敏感な帯域で、小さい音が大きく聴こえる。大きい音はより大きく聴こえる。空間音響伝達特性の最大値(ピーク)もこの帯域に含まれる。よって、特定部216は、選定帯域SB1である2.5kHz~5kHzからピークP1を選定する。選定帯域SB1の中で最もレベルの高い極大値をピークP1とする。
【0054】
また、5kHz~9kHzでは、周波数が高くなるにつれて、小さく聴こえる。また小さい音はより小さく聴こえる。よって、空間音響伝達特性の最小値(ノッチN2)、選定帯域SB2である6kHz~9kHzの中から選定する。
【0055】
例えば、特定部216は、選定帯域SB2における極小値からノッチN2を選択する。特定部216は、選定帯域SB2における極小値を抽出し、その極小値で最も低いレベルの極小値をノッチN2とする。
【0056】
特定部216は、選定帯域SB1における極大値からピークP1を選択する。特定部216は、選定帯域SB1における極大値を抽出し、その中で最もレベルの高い極大値をピークP1とする。
【0057】
特定部216はピークP1とノッチN2との間の帯域から、ノッチN1とピークP2を特定する。特定部216は、ピークP1とノッチN2との間の帯域にある極小値からノッチN1を選定する。さらに、特定部216はノッチN1とノッチN2との間に帯域にある極大値からピークP2を特定する。
【0058】
さらに、特定部216は、ノッチN2よりも高周波数側にある極大値からピークP3を特定する。特定部216は、ピークP3よりも高周波数側にある極小値からノッチN3を特定する。特定部216は、選定帯域SB3からピークP3とノッチN3を特定することができる。選定帯域SB3は、個人特性が最も表れる範囲である12kHz以下の帯域である。つまり、選定帯域SB3は、ノッチN2よりも高く、12kHZ以下の帯域である。選定帯域SB3の上限周波数を12kHzとすることで、個人特性を示すピークP3とノッチN3を特定することができる。
【0059】
第1特徴量算出部217は、ピークとノッチに応じた第1特徴量ベクトルを算出する。第1特徴量算出部217は、ピークP1~P3とノッチN1~N3のデータから第1特徴量を算出する。第1特徴量は、ピークP1~P3、ノッチN1~N3の周波数とゲインとを要素として含む特徴量ベクトルとなる。例えば、第1特徴量ベクトルは、12次元の特徴量ベクトルとなっている。ピークとノッチを示す特徴量をピークノッチ特徴量ともいう。
【0060】
形状特性算出部218は、平滑化特性を近似した近似関数を示す形状特性を算出する。そのため、形状特性算出部218は平滑化特性を近似した近似関数を算出する。例えば、形状特性算出部218は、最小二乗法等を用いたフィッティングにより多項式近似を行う。ここで、形状特性算出部218は、以下の式(1)に示すような4次の多項式で平滑化特性を近似する。
G=aX4+bX3+cX2+dX+e ・・・(1)
【0061】
ここで、Gは近似関数であり、Xは周波数を示す値である。a、b、c、d、eは多項式近似の解として求められる係数であり、定数となっている。平滑化特性の形状特性を示す値として係数a、b、c、d、eを算出する。
【0062】
第2特徴量算出部219は、形状特性に応じた第2特徴量ベクトルを算出する。具体的には、第2特徴量ベクトルは、係数a、b、c、d、eを要素として含む特徴量ベクトルとなっている。
【0063】
さらに、本実施の形態では、形状特性算出部218が、平滑化特性を複数の帯域に分割している。形状特性算出部218は、帯域毎に近似関数を求めて、帯域毎に形状特性を算出している。例えば、平滑化特性は、
図4に示すように、分割帯域B1、B2、B3の3つに分割されている。
【0064】
分割帯域B1は、最低周波数(1Hz)以上、ノッチN1以下の帯域である。分割帯域B2は、ノッチN1以上、ノッチN2以下の帯域である。分割帯域B3は、ノッチN2以上、12kHz以下の帯域である。このように、特定部216で特定されたノッチに応じて、平滑化特性が複数の分割帯域に分割されている。つまり、それぞれのノッチの周波数を境界周波数として、平滑化特性が分割される。
【0065】
形状特性算出部218は、分割帯域毎に、近似関数を算出する。
図4において、分割帯域B1の近似関数を近似関数G1として示す。同様に、分割帯域B2の近似関数を近似関数G2とし、分割帯域B3の近似関数を近似関数G3として示す。近似関数G1はピークP1とノッチN1を結ぶ曲線(多項式)となる。近似関数G2はノッチN1とピークP2とノッチN2を結ぶ曲線(多項式)となる。近似関数G3はノッチN2とピークP3とノッチN3を結ぶ曲線(多項式)となる。
【0066】
第2特徴量算出部219は近似関数G1~G3の係数を特徴量として算出する。ここでは、近似関数を4次の多項式としている。近似関数G1~G3において、係数a~eはそれぞれ異なる。近似関数G1の係数a、b、c、d、eをそれぞれ係数a1、b1、c1、d1、e1とする。同様に、近似関数G2の係数a、b、c、d、eをそれぞれ係数a2、b2、c2、d2、e2とし、近似関数G3の係数a、b、c、d、eをそれぞれ係数a3、b3、c3、d3、e3とする。
【0067】
第2特徴量ベクトルは、a1~a3、b1~b3、c1~c3、d1~d3,e1~e3を要素として含むベクトルとなる。例えば、第2特徴量ベクトルは15次元の特徴量ベクトルとなる。近似関数を示すこれらの係数を形状特徴量ともいう。
【0068】
第1特徴量算出部217、第2特徴量算出部219が周波数特性(平滑化特性)の特徴量を算出する。そして、クラスタリング部220は、これらの特徴量に基づいて、クラスタリングを行う。これにより、複数の被測定者がクラスタリングされる。
【0069】
具体的には、クラスタリング部220は、第1クラスタリング部221と第2クラスタリング部222とを備えている。第1クラスタリング部221は第1特徴量ベクトルを用いて、平滑化特性をクラスタリングする。第1クラスタリング部221によるクラスタリングの処理を第1クラスタリング処理という。例えば、第1クラスタリング部221は、予め設定されたk(kは2以上の整数)個のクラスタに分類するk平均法(k-means)で平滑化特性をクラスタリングする。これにより、第1特徴量ベクトルに応じて、k個のクラスタが生成される。つまり、複数の被測定者の周波数特性が、2以上のクラスタに分類される。
【0070】
さらに、第2クラスタリング部222は、第2特徴量ベクトルを用いて、平滑化特性をクラスタリングする。第2クラスタリング部222によるクラスタリングの処理を第2クラスタリング処理という。例えば、第2クラスタリング部222は、予め設定されたk(kは2以上の整数)個のクラスタに分類するk平均法(k-means)で平滑化特性をクラスタリングする。これにより、第2特徴量ベクトルに応じて、複数のクラスタが生成される。つまり、複数の被測定者の周波数特性が、2以上のクラスタに分類される。
【0071】
例えば、第1クラスタリング処理で生成された各クラスタについて、さらに、k平均法などでクラスタリングを行う。つまり、第1クラスタリング処理の各クラスタがさらに細いクラスタに分類される。このようにすることで、少ない工数で適切なクラスタリングを行うことができる。
【0072】
クラスタリング部220は、周波数特性(平滑化特性)から得られた特徴量に基づいて、被測定者を複数のクラスタに分類している。もちろん、第1のクラスタリング処理と第2のクラスタリング処理とで分類される数は同じであってもよく、異なっていてもよい。このように、クラスタリング部220は、2段階のクラスタリング処理を行うことで、より適切なクラスタを生成することができる。
【0073】
ユーザ本人と形状の相関値が低い他の被測定者の空間音響伝達特性を示すフィルタを用いた場合でも、適切に頭外定位する事ができる場合がある。形状特性に基づく第2特徴量よりも、ピークとノッチに基づく第1特徴量が頭外定位に有意性があるとみなして、最初に第1クラスタリング部221が、第1特徴量で第1クラスタリングを行う。次に形状特性を示す第2特徴量で第2クラスタリング部222が、第2クラスタリング処理を行う。このようにすることで、より聴感特性に特化した方法で分類することができる。
【0074】
データ格納部225はクラスタリングした結果を示すデータを格納する。例えば、各クラスタに属する被測定者やその各種データを格納する。データ格納部225は、特徴量などのデータをデータベースとして格納してもよい。データ格納部225は、各クラスタの代表特性や各被測定者の空間音響伝達特性などを格納していてもよい
【0075】
代表特性算出部226は、各クラスタの代表特性を算出する。ここでは、m個のクラスタに分類されているとする。代表特性算出部226は、m個のクラスタのそれぞれについて、代表特性を算出する。例えば、代表特性算出部226は各クラスタの重心位置と特徴量ベクトルとの間の距離を算出する。代表特性算出部226は、重心位置に最も近い特徴量ベクトルの被測定者のデータを代表特性として算出する。この代表特性は、頭外定位受聴を行うユーザが空間音響フィルタを決定するためのデータとして用いられる。例えば、各クラスタを代表する被測定者の空間音響伝達特性が代表特性となる。
【0076】
次に、
図6を用いて、本実施の形態に係るクラスタリング方法について説明する。
図6はクラスタリング方法を示すフローチャートである。まず、処理装置201が収音信号の特徴量を抽出する(S101)。そして、クラスタリング部220が特徴量に基づいて、被測定者をクラスタリングする(S102)。ここでは、第1クラスタリング部221が第1特徴量ベクトルを用いた第1クラスタリング処理を行った後、第2クラスタリング部222が第2特徴量ベクトルを用いた第2クラスタリング処理を行う。つまり、クラスタリング部220が、2段階のクラスタリング処理を実行する。これにより、クラスタリングが終了する。つまり、多数の被測定者の音響伝達特性が複数のクラスタに分類される。
【0077】
図7は、特徴量を抽出するステップS101の詳細を示すフローチャートである。まず、周波数特性取得部213が収音信号の周波数特性を取得する(S201)。具体的には,周波数特性取得部213が収音信号をFFT処理することで、周波数振幅特性を算出する。平滑化処理部214が、周波数振幅特性を平滑化処理する(S202)。これにより、周波数振幅特性を平滑化した平滑化特性が算出される。
【0078】
極値抽出部215が平滑化特性の極値を抽出する(S203)。これにより、平滑化特性のスペクトルデータの中から、複数の極大値、及び複数の極小値が求められる。極大値は両隣のゲイン(振幅レベル)よりもゲイン(振幅レベル)が高いデータとなる。極小値は両隣のゲイン(振幅レベル)よりもゲイン(振幅レベル)が低いデータとなる。
【0079】
次に、特定部216がピークポイントHP/ノッチポイントHNを選定する(S204)。ここでは、特定部216は、極大値と、その両隣の極小値とのレベル差が閾値以上となる極大値をピークポイントHPとする。特定部216は、極小値と、その両隣の極大値とのレベル差が閾値以上となる極小値をノッチポイントHNとする。ピークポイントHPはピークP1~P3の候補となる極大値となる。ノッチポイントHNはノッチN1~N3の候補となる極小値となる。
【0080】
特定部216がピークP1~P3とノッチN1~N3を特定する(S205)。つまり、特定部216がピークポイントHPからピークP1~P3を選択する。同様に、特定部216がノッチポイントHNからノッチN1~N3を選択する。この処理については後述する。
【0081】
第1特徴量算出部217がピークP1~P3、ノッチN1~N3の特徴量を算出する(S206)。第1特徴量算出部217は、ピークP1~P3、ノッチN1~N3の周波数とゲイン(振幅レベル)を第1特徴量として算出する。これにより、ピークとノッチを示す第1特徴量ベクトルが算出される。
【0082】
次に、形状特性算出部218が、形状特性を算出する(S207)。形状特性算出部218は平滑化特性を近似する近似関数を求めることで、形状特性を算出する。ここでは、分割帯域B1~B3のそれぞれにおいて、平滑化特性の近似関数G1~G3を算出する。そして、第2特徴量算出部219が近似関数を示す形状特徴量を算出する(S208)。これにより、平滑化特性の形状の特徴を示す第2特徴量ベクトルが算出される。
【0083】
図8はピークP1~P3とノッチN1~N3を特定するステップS205の詳細を示すフローチャートである。まず、特定部216が選定帯域SB2にあるノッチポイントHNからノッチN2を選定する(S301)。例えば、選定帯域SB2に含まれる複数のノッチポイントHNの中で、ゲインが最小のノッチポイントHNがノッチN2となる。
【0084】
特定部216が選定帯域SB1にあるピークポイントHPからピークP1を選定する(S302)。選定帯域SB1に含まれる複数のピークポイントHPの中で、ゲインが最大のピークポイントHPがピークP1となる。
【0085】
特定部216が、ピークP1とノッチN2との間の帯域におけるノッチポイントHNからノッチN1を選定する(S303)。ピークP1とノッチN2との間の帯域に含まれる複数のノッチポイントHNのうち、両隣のピークポイントHPとのレベル差が最大のノッチポイントHNがノッチN1となる。ただし、ノッチN1は、ノッチN2との周波数差が聴感の検出閾値を超えるデータとする。
【0086】
特定部216が、ノッチN1とノッチN2との間の帯域におけるピークポイントHPからピークP2を選定する(S304)。ノッチN1とノッチN2との間の帯域に含まれる複数のピークポイントHPのうち、両隣のノッチポイントHNとのレベル差が最大のピークポイントHPがピークP2となる。ただし、ピークP2は、ピークP1との周波数差が聴感の検出閾値を超えるデータとする。
【0087】
特定部216が、選定帯域SB3のピークポイントHPからピークP3を選定する(S305)。選定帯域SB3に含まれる複数のピークポイントHPのうち、ゲインが最大のピークポイントHPがピークP3となる。ただし、ピークP3は、ピークP2との周波数差が聴感の検出閾値を超えるデータとする。
【0088】
特定部216が、選定帯域SB3のノッチポイントHNからノッチN3を選定する(S306)。選定帯域SB3に含まれる複数のノッチポイントHNのうち、ゲインが最小のノッチポイントHNがノッチN3となる。また、特定部216は、ピークP3よりも高周波数側のノッチポイントHNからノッチN3を選定する。ただし、ノッチN3は、ノッチN2との周波数差が聴感の検出閾値を超えるデータとする。ノッチN3、及びピークP3は、ノッチN2よりも高周波数側、かつ、12kHz以下の帯域にある。
【0089】
このようにすることで、様々な被測定者の周波数振幅特性においても、特定部216が適切なピークとノッチを特定することができる。すなわち、取得された全ての周波数振幅特性について、特定部216が同数のピークを抽出することができる。取得された全ての周波数振幅特性について、特定部216が同数のノッチを抽出することができる。よって、第1特徴量算出部217が適切な第1特徴量を算出することができる。
【0090】
次に、クラスタリング結果を用いた頭外定位フィルタ決定装置300について
図9を用いて説明する。
図9は、頭外定位フィルタ決定装置300の構成を示すブロック図である。頭外定位フィルタ決定装置300は、受信部301と、比較部302と、データ格納部303と、抽出部304と、フィルタ決定部305と、送信部306と、を備えている。
【0091】
頭外定位フィルタ決定装置300はプロセッサやメモリなどを備えたコンピュータであり、プログラムにしたがって以下の処理を行う。また、頭外定位フィルタ決定装置300は単一な装置に限らず、2つ以上の装置の組み合わせにより実現してもよく、クラウドサーバ等の仮想サーバでもよい。データを格納するデータ格納部303と、データ処理を行う比較部302、フィルタ決定部305等は物理的に異なる装置であってもよい。頭外定位フィルタ決定装置300は処理装置201と同一の装置であってもよい。
【0092】
データ格納部303は、クラスタリング結果のデータを格納している。データ格納部303は複数の被測定者に対する事前測定の測定結果に基づくデータを格納している。
図10は、データ格納部303に格納されたデータの一例を示す図である。データ格納部303は、それぞれのクラスタに関する代表特性を格納している。データ格納部303は,
図3で示したデータ格納部225と同一の装置であってもよく、異なる装置であってもよい。
【0093】
さらに、データ格納部303は、各クラスタに属する被測定者のIDとその外耳道伝達特性を格納している。外耳道伝達特性をプリセットデータともいう。外耳道伝達特性は被測定者の左右の耳毎に測定されている。よって、被測定者IDと外耳道伝達特性には耳の左右を示す情報が付されている。例えば、被測定者IDがID_Aの被測定者について、左耳の外耳道伝達特性ECTFL_Aと右耳の外耳道伝達特性ECTFR_Aが格納されている。データ格納部303は、被測定者のIDと、外耳道伝達特性と、耳の左右が対応付けられて、記憶されている。データ格納部303では、1人の被測定者に対して、左耳の外耳道伝達特性と、右耳の外耳道伝達特性を記録されている。
【0094】
なお、外耳道伝達特性はヘッドホンとマイクとを用いた測定により予め測定されている。例えば、被測定者がヘッドホンとマイクとを装着した状態でのインパルス応答測定等により、外耳道伝達特性が測定される。つまり、ヘッドホンからのインパルス音をユーザが左右の耳に装着したマイクにより収音することで、外耳道伝達特性が測定される。また、外耳道伝達特性は、周波数特性であってもよく、時間特性であってもよい、さらに、外耳道伝達特性は、周波数特性などから抽出された特徴量であってもよい。換言すると、外耳道伝達特性は、後述する比較部302でのマッチング処理に利用されるプリセットデータであればよい。
【0095】
さらに、それぞれの被測定者について、
図2に示した測定装置200が、空間音響伝達特性を測定している。空間音響伝達特性に対して、処理装置201がクラスタリング処理を行っている。よって、データ格納部303が、各クラスタの代表特性を格納している。データ格納部303は、一方の耳に関する空間音響伝達特性のペアを代表特性として記録している。例えば、左のスピーカ5Lから左マイク2Lまでの空間音響伝達特性と、右のスピーカ5Rから左マイク2Lまでの空間音響伝達特性のペアが代表特性となっている。
【0096】
例えば、1番目のクラスタの代表特性は、被測定者ID_Aの空間音響伝達特性Hls_A、Hro_Aとなっている。空間音響伝達特性Hls_A、Hro_Aは被測定者ID_Aの左耳に関するデータである。
図2に示したように、空間音響伝達特性Hls_Aは左スピーカ5Lから被測定者ID_Aの左耳9Lのマイク2Lまでの空間音響伝達特性である。空間音響伝達特性Hro_Aは右スピーカ5Rから被測定者ID_Aの左耳9Lのマイク2Lまでの空間音響伝達特性である。例えば、被測定者ID_Aの左耳に関する空間音響伝達特性から得られた特徴量が、クラスタの重心に最も近いデータとなっている。データ格納部303は、他のクラスタについても同様に代表特性を格納している。
【0097】
受信部301は、頭外定位受聴を行うユーザUのユーザ端末などから送信されたユーザデータを受信する。ユーザデータは、例えば、ユーザUの外耳道伝達特性の測定データである。また、ユーザデータは、外耳道伝達特性の周波数特性などであってもよく、外耳道伝達特性から抽出された特徴量であってもよい。ユーザ端末は、
図1に示す頭外定位処理装置100であってもよく、ユーザ端末は外耳道伝達特性の測定装置であってもよい。
【0098】
比較部302は、ユーザUの外耳道伝達特性と被測定者の外耳道伝達特性とを比較する。比較部302は、公知のマッチング処理で、複数の被測定者のデータの中から特徴量ベクトルが最も類似するデータを探索する。比較部302は、ユーザの外耳道伝達特性と最も類似する被測定者を特定し、その被測定者が属するクラスタを求める。抽出部304は、その被測定者が属するクラスタの代表特性を抽出する。
【0099】
フィルタ決定部305は抽出されたクラスタの代表特性に基づいて、空間音響フィルタを決定する。フィルタ決定部305は、代表特性に基づいて、空間音響フィルタを生成してもよい。あるいは、代表特性が空間音響フィルタであってもよい。送信部306は、空間音響フィルタをユーザ端末に送信する。これにより、ユーザ端末が代表特性に応じた空間音響フィルタのデータを取得することができる。
【0100】
例えば、ユーザUの左耳の外耳道伝達特性と最も類似するデータが、被測定者ID_Bの左耳の外耳道伝達特性ECTFL_Dである場合、抽出部304は、クラスタ2の代表特性Hls_C、Hro_Cを抽出する。よって、
図1の畳み込み演算部11、21には、代表特性Hls_C、Hro_Cに応じた空間音響フィルタが設定される。
【0101】
ユーザUの右耳の外耳道伝達特性と最も類似するデータが、被測定者ID_Bの左耳の外耳道伝達特性ECTFL_Bである場合、抽出部304は、クラスタ1の代表特性Hls_A、Hro_Aを抽出する。
図1の畳み込み演算部12、21には、代表特性Hls_A、Hro_Aに応じた空間音響フィルタが設定される。
【0102】
このようにすることで、ユーザUに対して空間音響伝達特性の測定を行うことなく、適切な空間音響フィルタを設定することができる。例えば、クラスタ毎に適切な代表特性が設定されている。よって,ユーザの外耳道伝達特性から類似する被測定者を特定することで、適切な空間音響フィルタを頭外定位処理装置100に設定することができる。よって、適切な頭外定位処理を行うことができ、頭外定位効果を高くすることができる。
【0103】
ユーザUに適した空間音響伝達特性を示す空間音響フィルタを決定することができる。よって、頭外定位処理装置100は、適切なフィルタを生成することができるため、効果的な頭外定位処理を行うことができる。
【0104】
なお、頭外定位処理装置100、処理装置201、頭外定位フィルタ決定装置300の処理の少なくも一部は、他の装置で行ってもよい。つまり、上記の処理は複数の装置によって分散処理してもよい。頭外定位フィルタ決定装置300と、処理装置201は、物理的に異なる装置となっていてもよく、同じ装置であってもよい。別の装置の場合、頭外定位フィルタ決定装置300が決定した空間音響フィルタを頭外定位処理装置100に送信すればよい。処理装置201とクラスタリングを行う装置は、物理的に別の装置であってもよい。つまり、クラスタリングを行う装置は処理装置201と同一の装置であってもよく、処理装置201からデータを収集するサーバ装置であってもよい。
【0105】
上記処理のうちの一部又は全部は、コンピュータプログラムによって実行されてもよい。上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0106】
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は上記実施の形態に限られたものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
【符号の説明】
【0107】
U ユーザ
1 被測定者
2L 左マイク
2R 右マイク
5L 左スピーカ
5R 右スピーカ
9L 左耳
9R 右耳
10 頭外定位処理部
11 畳み込み演算部
12 畳み込み演算部
21 畳み込み演算部
22 畳み込み演算部
24 加算器
25 加算器
41 逆フィルタ部
42 逆フィルタ部
43 ヘッドホン
100 頭外定位処理装置
200 測定装置
201 処理装置
211 測定信号生成部
212 収音信号取得部
213 周波数特性取得部
214 平滑化処理部
215 極値抽出部
216 特定部
217 第1特徴量算出部
218 形状特性算出部
219 第2特徴量算出部
220 クラスタリング部
221 第1クラスタリング部
222 第2クラスタリング部
225 データ格納部
226 代表特性算出部
300 頭外定位フィルタ決定装置
301 受信部
302 比較部
303 データ格納部
304 抽出部
306 送信部
SB1 選定帯域
SB2 選定帯域
SB3 選定帯域
B1~B3 分割帯域