(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022161076
(43)【公開日】2022-10-21
(54)【発明の名称】フィルタ生成装置、音声処理方法、及びプログラム
(51)【国際特許分類】
H04R 3/00 20060101AFI20221014BHJP
H04R 1/00 20060101ALI20221014BHJP
【FI】
H04R3/00 320
H04R1/00 327Z
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2021065612
(22)【出願日】2021-04-08
(71)【出願人】
【識別番号】308036402
【氏名又は名称】株式会社JVCケンウッド
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】高田 規
(72)【発明者】
【氏名】鶴 秀生
【テーマコード(参考)】
5D220
【Fターム(参考)】
5D220BA21
5D220BC01
(57)【要約】 (修正有)
【課題】適切に処理を行うことができるフィルタ生成装置、音声処理方法及びプログラムを提供する。
【解決手段】フィルタ生成装置200は、骨伝導マイク5と、口腔外の第1の位置にあるスピーカ7が測定信号を出力した時に、骨伝導マイク5が収音した第1収音信号を取得する第1収音信号取得部51と、被測定者の口腔内の第2の位置にあるスピーカ8が測定信号を出力した時に、骨伝導マイク5が収音した第2収音信号を取得する第2収音信号取得部52と、第1収音信号及び第2収音信号をそれぞれ周波数領域に変換することで、第1周波数特性及び第2周波数特性を算出する周波数特性算出部14と、第1周波数特性及び第2周波数特性に基づいて、フィルタを生成するフィルタ生成部15と、を備えている。
【選択図】
図3
【特許請求の範囲】
【請求項1】
骨伝導マイクで収音された信号に対して処理を行うためのフィルタを生成するフィルタ生成装置であって、
被測定者に装着された骨伝導マイクと、
音源データを再生して、測定信号を生成する測定信号生成部と、
被測定者の口腔外の第1の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第1収音信号を取得する第1収音信号取得部と、
前記被測定者の口腔内の第2の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第2収音信号を取得する第2収音信号取得部と、
前記第1収音信号及び第2収音信号をそれぞれ周波数領域に変換することで、第1周波数特性及び第2周波数特性を算出する周波数特性算出部と、
前記第1周波数特性及び第2周波数特性に基づいて、フィルタを生成するフィルタ生成部と、を備えたフィルタ生成装置。
【請求項2】
前記フィルタ生成部は、第1周波数特性の振幅値が第2周波数特性の振幅値より所定の値以上高い周波数帯域の振幅値を抑圧し、第1周波数特性の振幅値が第2周波数特性の振幅値より所定の値以上低い周波数帯域の振幅値を強調するフィルタを生成する請求項1に記載のフィルタ生成装置。
【請求項3】
前記第1収音信号取得部は、前記骨伝導マイクの位置を変えて、前記骨伝導マイクが複数回収音した複数の第1収音信号を取得し、
前記第2収音信号取得部は、前記骨伝導マイクの位置を変えて、前記骨伝導マイクが複数回収音した複数の第2収音信号を取得し、
前記周波数特性算出部は、前記複数の第1収音信号に基づいて前記第1周波数特性を算出し、前記複数の第2収音信号に基づいて前記第2周波数特性を算出する請求項1、又は2に記載のフィルタ生成装置。
【請求項4】
骨伝導マイクで収音された信号に対して処理を行う音声処理方法であって、
音源データを再生して、測定信号を生成するステップと、
被測定者に装着された骨伝導マイクで測定信号を収音するステップと、
被測定者の口腔外の第1の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第1収音信号を取得するステップと、
前記被測定者の口腔内の第2の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第2収音信号を取得するステップと、
前記第1収音信号及び第2収音信号をそれぞれ周波数領域に変換することで、第1周波数特性及び第2周波数特性を算出するステップと、
前記第1周波数特性及び第2周波数特性に基づいて、フィルタを生成するステップと、を備えた音声処理方法。
【請求項5】
骨伝導マイクで収音された信号を処理する音声処理方法をコンピュータに実行させるプログラムであって、
前記音声処理方法は、
音源データを再生して、測定信号を生成するステップと、
被測定者に装着された骨伝導マイクで測定信号を収音するステップと、
被測定者の口腔外の第1の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第1収音信号を取得するステップと、
前記被測定者の口腔内の第2の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第2収音信号を取得するステップと、
前記第1収音信号及び第2収音信号をそれぞれ周波数領域に変換することで、第1周波数特性及び第2周波数特性を算出するステップと、
前記第1周波数特性及び第2周波数特性に基づいて、フィルタを生成するステップと、を備えた、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、フィルタ生成装置、音声処理方法、及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、骨導マイクロフォンと、骨導スピーカとを有する騒音低減装置が開示されている。この騒音低減装置は、骨導マイクロフォンからの入力信号を、同振幅で逆位相の信号に変換処理するディジタルフィルタを有している。騒音低減装置は、変換処理後の信号に基づいて、骨導干渉音を生成している。
【0003】
特許文献2では骨導音マイクと気道音マイクとを用いた気道音推定装置が開示されている。この装置では、気道音マイクがサンプル気導音を収音し、骨伝導マイクがサンプル骨導音を収音している。そして、フィルタ関数生成部が、サンプル気道音とサンプル骨導音の各々の長時間スペクトルを求める。フィルタ関数生成部は、サンプル気導音の長時間スペクトルの絶対値をサンプル骨導音の長時間スペクトルの絶対値で割ったものをフィルタ関数として導出している。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006-325895号公報
【特許文献2】特開2004-279768号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
このような骨伝導マイクでは、ノイズ低減などの処理を適切に行うことが望まれる。しかしながら、特許文献1,2ではユーザが発した音声がどのような伝達特性で体内を伝搬して聴覚器官に到達するかを計測することができない。したがって、ノイズ低減などの処理を適切に行うことが困難である。
【0006】
本開示は上記の点に鑑みなされたものであり、骨伝導マイクで収音した収音信号に対して適切に処理を行うことができるフィルタ生成装置、音声処理方法、及びプログラムを提供する。
【課題を解決するための手段】
【0007】
本実施形態にかかるフィルタ生成装置は、骨伝導マイクで収音された信号に対して処理を行うためのフィルタを生成するフィルタ生成装置であって、被測定者に装着された骨伝導マイクと、音源データを再生して、測定信号を生成する測定信号生成部と、被測定者の口腔外の第1の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第1収音信号を取得する第1収音信号取得部と、前記被測定者の口腔内の第2の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第2収音信号を取得する第2収音信号取得部と、前記第1収音信号及び第2収音信号をそれぞれ周波数領域に変換することで、第1周波数特性及び第2周波数特性を算出する周波数特性算出部と、前記第1周波数特性及び第2周波数特性に基づいて、フィルタを生成するフィルタ生成部と、を備えている。
【0008】
本実施形態にかかる音声処理方法は、骨伝導マイクで収音された信号に対して処理を行う音声処理方法であって、音源データを再生して、測定信号を生成するステップと、被測定者に装着された骨伝導マイクで測定信号を収音するステップと、被測定者の口腔外の第1の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第1収音信号を取得するステップと、前記被測定者の口腔内の第2の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第2収音信号を取得するステップと、前記第1収音信号及び第2収音信号をそれぞれ周波数領域に変換することで、第1周波数特性及び第2周波数特性を算出するステップと、前記第1周波数特性及び第2周波数特性に基づいて、フィルタを生成するステップと、を備えている。
【0009】
本実施形態にかかるプログラムは、骨伝導マイクで収音された信号を処理する音声処理方法をコンピュータに実行させるプログラムであって、前記音声処理方法は、音源データを再生して、測定信号を生成するステップと、被測定者に装着された骨伝導マイクで測定信号を収音するステップと、被測定者の口腔外の第1の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第1収音信号を取得するステップと、前記被測定者の口腔内の第2の位置にあるスピーカが測定信号を出力した時に、前記骨伝導マイクが収音した第2収音信号を取得するステップと、前記第1収音信号及び第2収音信号をそれぞれ周波数領域に変換することで、第1周波数特性及び第2周波数特性を算出するステップと、前記第1周波数特性及び第2周波数特性に基づいて、フィルタを生成するステップと、を備えている。
【発明の効果】
【0010】
本開示によれば、適切に処理を行うことができるフィルタ生成装置、音声処理方法、及びプログラムを提供することを目的とする。
【図面の簡単な説明】
【0011】
【
図1】骨伝導マイクを用いた音声変換システムの構成を示す模式図である。
【
図2】フィルタ生成装置200の構成を示す図である。
【
図3】フィルタ生成を行うシステムの構成とその処理フローを示す図ある。
【発明を実施するための形態】
【0012】
以下、本発明を適用した具体的な実施形態について、図面を参照しながら詳細に説明する。ただし、本開示が以下の実施形態に限定される訳ではない。また、説明を明確にするため、以下の記載及び図面は、適宜、簡略化されている。
【0013】
実施の形態1.
本実施の形態にかかる音声変換システムの構成について、
図1を用いて説明する。
図1は、音声変換システム100の構成を示す模式図である。音声変換システム100は、骨伝導マイク150を用いた骨伝導マイクシステムである。
【0014】
音声変換システム100は、骨伝導マイク150と、音声変換装置160とを備えている。骨伝導マイク150は、発話者であるユーザU1に装着されている。ユーザU1は音声Voを発話する。骨伝導マイク150は発話による振動Viを検出する。骨伝導マイク150は、体内を伝搬した声帯の振動Viを検出して、電気信号に変換する。つまり、骨伝導マイク150は、頭蓋骨などの骨等を伝わってきた振動Viを検出する。
【0015】
なお、
図1では、ユーザU1は、骨伝導マイク150を耳周辺に装着しているが、喉周辺に装着してもよいし、頭蓋骨などの骨等の振動を検出可能なその他の部分でもよい。骨伝導マイク150は空間を伝搬した気道音ではなく、振動Viに基づく骨伝導音を収音している。したがって、ユーザU1が口Mを覆った状態でも、ユーザU1の発話を収音することができる。
【0016】
骨伝導マイク150は、発話に応じた骨伝導音を収音して、電気信号に変換する。骨伝導マイク150はこの電気信号を発話信号として、音声変換装置160に出力する。なお、骨伝導マイク150と音声変換装置160の接続方法は、有線接続に限らず、Bluetooth(登録商標)等の無線接続であってもよい。
【0017】
音声変換装置160は、フィルタ処理を行うためのフィルタを格納している。音声変換装置160は、該フィルタを用いて、発話信号に対してフィルタ処理を行う。例えば、音声変換装置160は、時間領域の発話信号に対してフィルタを畳み込むことで、フィルタ処理を行う。音声変換装置160は、フィルタ処理後の発話信号を音声信号170として出力する。音声変換装置160は、発話信号を音声信号170に変換する。
【0018】
このように、音声変換装置160は、骨伝導マイク150からの発話信号を取得して、フィルタ処理を行う。音声変換装置160は、フィルタ処理後の音声信号を外部機器に送信する。音声変換装置160は、フィルタ処理以外の処理を発話信号に対して行ってもよい。例えば、音声変換装置160は、音声信号を送信するための変調処理等を行ってもよい。
【0019】
音声変換装置160は、メモリ、及びプロセッサを備えている。メモリは、処理プログラムや各種パラメータや測定データなどを記憶している。プロセッサは、メモリに格納された処理プログラムを実行する。プロセッサが処理プログラムを実行することで、各処理が実行される。プロセッサは、例えば、CPU(Central Processing Unit)、FPGA(Field-Programmable Gate Array)、DSP(Digital Signal Processor),ASIC(Application Specific Integrated Circuit)、又は、GPU(Graphics Processing Unit)等であってもよい。メモリは、例えば、不揮発性のフラッシュメモリであってもよい。
【0020】
音声変換装置160は、音声専用の処理装置に限らず、パーソナルコンピュータ、スマートフォン、タブレットPC(Personal Computer)などの汎用処理装置であってもよい。例えば、音声変換装置160がスマートフォンなどの場合、骨伝導マイク150を用いた音声通話やリモート会議などが可能となる。例えば、音声変換装置160は、音声信号170をIP(Internet Protocol)パケットにして送信する。
【0021】
なお、
図1では、音声変換装置160と骨伝導マイク150とが別の装置として示されているが、骨伝導マイク150と音声変換装置160とは一体の装置であってもよい。例えば、骨伝導マイク150が、DSPなどのプロセッサを内蔵していてもよい。そして、骨伝導マイク150が内蔵されたプロセッサが、音声変換装置160の処理の一部又は全てを行ってもよい。
【0022】
図1では、音声変換装置160は、骨伝導マイク150からの発話信号に対して、フィルタ処理を行っている。このようにすることで、発話信号に対して、ノイズ低減等の処理を適切に行うことができる。音声変換装置160は、骨伝導マイク150の音声信号が、気道音マイクの音声信号と同等になるようにフィルタ処理を行っている。よって、音声信号を受信した受話者が、ユーザU1の発話を容易に聞くことができるようになる。つまり、音声変換装置160は、フィルタ処理を行うことで、受話者が聞き取りやすい音声信号に変換する。これにより、気道音マイクを用いた場合と同等に、受話者がユーザU1の発話を聞くことができる。
【0023】
音声変換装置160には、発話信号に処理を行うためのフィルタが予め設定されている。以下、このフィルタを生成するための装置、及び処理について、
図2、及び
図3を用いて説明する。
図2は、フィルタ生成装置200の構成を示す模式図であり、
図3は音声処理のフローを示す図である。
図3では、
図1に示す音声変換システム100での処理と、
図2に示すフィルタ生成装置200での処理が示されている。例えば、
図1に示す音声変換システム100の音声変換装置160は、発話信号取得部162、フィルタ処理部163の処理を行う。また、
図2に示すフィルタ生成装置200の音声処理装置2は、測定音源10、増幅器11、第1収音信号取得部51、第2収音信号取得部52、周波数特性算出部14、フィルタ生成部15、補正部16の処理を行う。なお、
図1に示すユーザU1と
図2に示す被測定者U2とは同一人物であることが望ましい。もちろん、ユーザU1と被測定者U2は同一人物に限らず、異なる人物であってもよい。
【0024】
図2に示すように、フィルタ生成装置200は、音声処理装置2と、骨伝導マイク5と、第1スピーカ7と、第2スピーカ8と、を備えている。
図3に示すように、音声処理装置2は、測定音源10、増幅器11、周波数特性算出部14、フィルタ生成部15、補正部16、第1収音信号取得部51,第2収音信号取得部52等を備えている。
【0025】
音声処理装置2は、メモリ、及びプロセッサを備えている。メモリは、処理プログラムや各種パラメータや測定データなどを記憶している。プロセッサは、メモリに格納された処理プログラムを実行する。プロセッサが処理プログラムを実行することで、各処理が実行される。プロセッサは、例えば、CPU、FPGA、DSP,ASIC、又は、GPU等であってもよい。メモリは、例えば、不揮発性のフラッシュメモリであってもよい。測定音源10、増幅器11、周波数特性算出部14、フィルタ生成部15、補正部16、第1収音信号取得部51,第2収音信号取得部52は、例えば、プログラムと協調し、CPU等で構成される。
【0026】
音声処理装置2は、音声の入出力機能を有している。つまり、音声処理装置2は、第1スピーカ7、第2スピーカ8及び骨伝導マイク5と接続するための入出力ポート(接続用端子など)を有している。音声処理装置2は、音声処理専用の装置に限らず、スマートフォン等の汎用処理装置であってもよい。
【0027】
図2に示すように、被測定者である被測定者U2が骨伝導マイク5を装着している。音声処理装置2の入力ポートには、骨伝導マイク5が接続される。したがって、音声処理装置2は、骨伝導マイク5で収音された収音信号を取得することができる。骨伝導マイク5と音声処理装置2の接続方法は、有線接続に限らず、Bluetooth(登録商標)等の無線接続であってもよい。
【0028】
図2の骨伝導マイク5は、
図1の骨伝導マイク150と同じものであることが好ましい。もちろん、骨伝導マイク5とは骨伝導マイク150と物理的に同じものに限らず、同じタイプなどのものであってもよい。つまり、骨伝導マイク5は骨伝導マイク150と同じ型番で有り、材料や構成が一致していることが好ましい。骨伝導マイク5は骨伝導マイク150を同等のものとすることで、より適切な処理を行うことができる。なお、
図2のフィルタ生成に用いられる骨伝導マイク5と、
図1の音声処理に用いられる骨伝導マイク150とは同じタイプのものに限らず、異なるタイプのものであってもよい。
【0029】
第1スピーカ7は被測定者U2の口腔Ma外に配置された外部スピーカである。ここで、第1スピーカ7が配置されている位置を第1の位置とする。第1の位置は、口腔Maの外側の空間にある位置である。第1スピーカ7は、被測定者U2に向けて、測定信号を出力する。よって、第1スピーカ7からの測定信号(測定音)は空間を伝搬して、被測定者U2まで到達する。そして、骨伝導マイク5は、被測定者U2の体内を伝搬した測定信号を検出する。第1スピーカ7からの測定信号(測定音)を発した場合、骨伝導マイク5が収音する収音信号は、骨伝導する外部ノイズNである。
【0030】
第2スピーカ8は被測定者U2の口腔Maの内部に配置された口腔内スピーカである。ここで、第2スピーカ8が配置されている位置を第2の位置とする。第2の位置は、口腔Ma内にある位置である。第2スピーカ8は、口腔内に配置できるような小型のスピーカとなっている。第2スピーカ8からの測定信号(測定音)は被測定者U2の体内(口腔内)を伝搬して、骨伝導マイク5で検出される。第2スピーカ8から発した測定信号により、被測定者U2の頭蓋骨などの骨が振動する。骨伝導マイク5は、骨伝導による振動Viを検出する。つまり、骨伝導マイク5は第2スピーカ8が発した測定信号を骨伝導音として収音する。
【0031】
フィルタ生成装置200におけるフィルタ生成方法について説明する。
図3に示すように、フィルタ生成装置200の音声処理装置2は、測定音源10を備えている。測定音源10は、測定信号を発生するための音源データを格納している。つまり、測定音源10は、音源データを再生することで測定信号を生成する測定信号生成部となる。測定信号に含まれる測定音は、様々な周波数成分を含むことが好ましい。例えば、測定音源10は、広い周波数帯域に渡る測定音の音源データを記憶する。
【0032】
測定音源10は測定音となる測定信号を増幅器11に出力する。増幅器11は、測定音源10からの測定信号を増幅して、第1スピーカ7、又は第2スピーカ8に出力する。測定音源10はデジタルデータとして音源データを記憶している場合、D/A(Digital to Analog)変換してもよい。第1スピーカ7、又は第2スピーカ8は測定信号を出力する。なお、第1スピーカ7と被測定者U2までの距離に応じて、増幅器11の増幅率を調整してもよい。
【0033】
骨伝導マイク5は、第1スピーカ7から発生した測定信号を検出する。つまり、第1スピーカ7から発した測定音は、空間を伝搬して、さらに被測定者U2の体内を伝搬して、骨伝導マイク5に到達する。同様に、骨伝導マイク5は、第2スピーカ8から発生した測定信号を検出する。つまり、第2スピーカ8から発した測定音は、被測定者U2の体内(口腔内)を伝搬して、骨伝導マイク5に到達する。骨伝導マイク5は、第1スピーカ7、又は第2スピーカ8から発せられた測定音を骨伝導音として収音する。
【0034】
フィルタ生成装置200は、第1スピーカ7を用いた測定と、第2スピーカ8とを用いた測定とをそれぞれ行う。つまり、フィルタ生成装置200は、第1スピーカ7と第2スピーカ8を切替えて測定を行う。第1スピーカ7を用いた測定を第1測定とし、第2スピーカ8を用いた測定を第2測定とする。なお、第1測定と第2測定との測定順番は特に限定されるものではない。第1測定の後に第2測定が行われてもよく、第2測定の後に第1測定が行われてもよい。
【0035】
また、第1測定で骨伝導マイク5が収音した信号を第1収音信号とし、第2測定で骨伝導マイク5が収音した信号を第2収音信号とする。第1収音信号は、第1スピーカ7からの測定信号を骨伝導マイク5で収音した信号となる。第2収音信号は、第2スピーカ8からの測定信号を骨伝導マイク5で収音した信号となる。
【0036】
第1収音信号取得部51は、第1測定による第1収音信号を取得する。第2収音信号取得部52は、第2測定による第2収音信号を取得する。第1収音信号取得部51は、第1収音信号を周波数特性算出部14に出力する。第2収音信号取得部52は、第2収音信号を周波数特性算出部14に出力する。第1収音信号取得部51、及び第2収音信号取得部52は、それぞれ第1収音信号及び第2収音信号をA/D(Analog To Digital)変換するAD変換器を有していてもよい。第1収音信号取得部51及び第2収音信号取得部52は、第1収音信号及び第2収音信号をメモリなどに記憶しても良い。
【0037】
周波数特性算出部14は、第1収音信号と第2収音信号のそれぞれの周波数特性を算出する。例えば、周波数特性算出部14は、離散フーリエ変換を行うことで、周波数振幅特性(振幅スペクトル)及び周波数位相特性(位相スペクトル)を算出する。また、周波数特性算出部14は、離散フーリエ変換に限らず、離散コサイン変換などの離散信号を周波数領域に変換する手段により、周波数振幅特性及び周波数位相特性を算出してもよい。周波数振幅特性の代わりに、周波数パワー特性が用いられていてもよい。周波数特性算出部14は、周波数特性をメモリ等に記憶しても良い。
【0038】
第1収音信号の周波数特性を第1周波数特性F1とし、第2収音信号の周波数特性を第2周波数特性F2とする。周波数特性算出部14は、第1周波数特性F1及び第2周波数特性F2をフィルタ生成部15に出力する。フィルタ生成部15は、第1周波数特性F1及び第2周波数特性F2に基づいて、フィルタを生成する。フィルタ生成部15は、第1周波数特性F1及び第2周波数特性F2を比較することで、フィルタを生成する。
【0039】
図4は、第1周波数特性F1と第2周波数特性F2とを示すグラフである。
図4は、第1周波数特性F1と、第2周波数特性F2として、周波数振幅特性を示している。
図4において横軸は周波数、縦軸はゲイン(dB)である。また、
図4では帯域B1は、周波数が低い低域であり、帯域B3は周波数が高い高域となっている。帯域B2は、帯域B1より高い周波数、かつ、帯域B3より低い周波数の中域となっている。
【0040】
測定音が伝搬する経路が異なることによって、第1周波数特性F1と第2周波数特性F2とは異なる特性を示している。
図4に示すように、帯域B1、帯域B3において、第2周波数特性F2が第1周波数特性F1よりも高くなっている。帯域B2において、第1周波数特性F1が第2周波数特性F2よりも高くなっている。
【0041】
よって、フィルタ生成部15は、帯域B1,及び帯域B3では、振幅をべき乗的に増幅し、帯域B2では振幅をべき乗的に減衰するようなフィルタを生成する。つまり、フィルタ生成部15は、第1周波数特性F1の振幅値が第2周波数特性F2の振幅値より所定の値以上高い周波数帯域の振幅値を抑圧し、第1周波数特性F1の振幅値が第2周波数特性F2の振幅値より所定の値以上低い周波数帯域の振幅値を強調するためのフィルタを生成する。フィルタ生成部15は、第1周波数特性の振幅値が優位な周波数帯域の特徴を消し、第2周波数特性の振幅値が優位な周波数帯域の特徴を強調するためのフィルタ係数を生成する。フィルタ生成部15は、各周波数に対するフィルタ係数を算出する。例えば、フィルタ生成部15は、各周波数における第2周波数特性F2の振幅値と第1周波数特性の振幅値との差分に基づいて、フィルタ係数を算出する。このようにすることで、外部からの音響による影響を低減することができる。なお、所定の値は、例えば6dBである。また、所定の値は、第1周波数特性F1の振幅値が第2周波数特性F2の振幅値より所定の値以上高い場合と、第1周波数特性F1の振幅値が第2周波数特性F2の振幅値より所定の値以上低い場合とで異なる値を設定してもよい。
【0042】
なお、フィルタ生成部15は、位相特性については、第1周波数特性、及び第2周波数特性の位相特性をそのまま用いても良い。フィルタ生成部15は、離散フーリエ変換又は逆離散コサイン変換により、フィルタ係数(振幅特性)と位相特性から時間領域の信号を算出する。フィルタ生成部15は、フィルタ係数性と位相特性をIFFT(高速逆フーリエ変換)することで、時間信号を生成する。フィルタ生成部15は、生成した時間信号を所定のフィルタ長で切り出すことで、フィルタを算出する。なお、フィルタを求めるための処理は、公知の手法を用いることができるため、詳細な説明を省略する。
【0043】
フィルタ生成部15は、生成したフィルタを補正部16に出力する。補正部16は、フィルタ生成部15で生成されたフィルタを補正する。例えば、補正部16は、骨伝導マイク5の装着位置のずれなどによる影響を軽減するための補正を行う。例えば、上記の第1測定と第2測定とを1セットとして、骨伝導マイク5の装着位置を変えて複数セットの測定を行う。つまり、骨伝導マイク5の装着位置を変更して、複数セットの測定を行う。
【0044】
周波数特性算出部14又は補正部16は、複数回の第1測定で収音された複数の周波数特性に基づいて、第1周波数特性を算出する。周波数特性算出部14又は補正部16は、複数回の第2測定で収音された複数の周波数特性に基づいて、第2周波数特性を算出する。例えば、補正部16は、複数の周波数特性を平均化することで、補正を行う。あるいは、補正部16は複数の周波数特性に対して重み付けをして平均化を行ってもよい。骨伝導マイク5の位置を変えて測定を繰り返し行うことで、音声処理装置2が、複数の周波数特性を求めることができる。補正部16は、複数回の第1測定で測定された周波数特性の振幅値の単純平均又は重み付け平均を算出する。これにより、第1周波数特性F1が算出される。補正部16は、複数回の第2測定で得られた第2周波数特性の振幅値の単純平均又は重み付け平均を算出する。これにより、第2周波数特性F2が算出される。
【0045】
平均化により得られた第1周波数特性F1と、平均化により得られた第2周波数特性F2を用いて、フィルタ生成部15、又は補正部16がフィルタを生成又は補正する。このようにすることで、より適用範囲を広げることが可能になる。つまり、装着位置の位置ずれが生じた場合でも適切な処理を行うことができる。なお、補正部16の処理については公知の手法を用いることができるため、詳細な説明を省略する。また、補正部16の補正については省略可能である。
【0046】
補正部16は、補正後のフィルタを音声変換装置160のフィルタ処理部163に出力する。フィルタ処理部163は、メモリなどにフィルタを格納する。フィルタ処理部163は、発話信号に対してフィルタ処理を行う。具体的には、
図1に示すように、骨伝導マイク150を装着した被測定者U2が発話する。
【0047】
図3に示すように、音声変換装置160の発話信号取得部162が、骨伝導マイク150からの発話信号を取得する。フィルタ処理部163は、発話信号に対してフィルタ処理を施す。例えば、フィルタ処理部163が発話信号に対してフィルタを畳み込む。フィルタ処理部163はフィルタ処理を行った発話信号を音声信号170として出力する。なお、発話信号取得部162、フィルタ処理部163は、例えば、プログラムと協調し、CPU等で構成される。
【0048】
このように、フィルタ生成装置200は、骨伝導マイク5を用いて、実際に発話する口腔内からの音響と、外部からの音響との骨伝導マイク5への伝達特性を実際に計測している。フィルタ生成装置200は、これらの伝達特性を考慮したフィルタを生成している。
【0049】
そして、音声変換システム100がこのフィルタを用いてフィルタ処理を行っている。これにより、外部からの音響を減衰することができる。さらに、ユーザU1自身の発生する音声を増幅させることができるため、耐ノイズ性の高い、骨伝導マイクシステムを提供できる。
【0050】
図1に示すユーザU1と
図2に示す被測定者U2は同一人物であってもよい。つまり、フィルタを生成するための測定時において、骨伝導マイク5を装着する被測定者U2と、フィルタ処理時に骨伝導マイク150を装着するユーザU1とを同一人物とすることができる。これにより、ユーザ固有の伝達特性を反映したフィルタを生成することができる。つまり、ユーザU1の骨伝導音に処理に適したフィルタを用いることができる。
【0051】
あるいは、
図1に示すユーザU1と
図2に示す被測定者U2は別人物であってもよい。つまり、フィルタを生成するための測定時において、骨伝導マイク5を装着する被測定者U2が、フィルタ処理時に骨伝導マイク150を装着するユーザU1と異なる人物とすることができる。この場合、ユーザU1は、異なる人物である被測定者U2に対する測定で作成されたフィルタを利用する。これにより、骨伝導マイク150を用いるユーザU1に対する測定が不要となる。よって、より簡便にフィルタの適用範囲を広げることができる。例えば、一人の被測定者U2での測定で生成されたフィルタを、複数の発話者に適用することができる。これにより、測定を省略することができ、簡便にフィルタを生成することができる。
【0052】
上記の説明ではフィルタを生成する処理を行う音声処理装置2と、フィルタ処理を行う音声変換装置160を別の装置として示しているが、音声処理装置2と、音声変換装置160とは一体の装置としてもよい。また、フィルタを生成するための処理を行う音声処理装置2は単一の装置に限られるものではない。例えば、骨伝導マイク5又は音声変換装置160が音声処理装置2の一部の処理を行ってもよい。
【0053】
なお、
図2,
図3において、第1スピーカ7と第2スピーカ8とが異なるスピーカとして示されているが、第1スピーカ7と第2スピーカ8とは同じスピーカであってもよい。この場合、一つのスピーカを口腔Ma外に配置することで、第1スピーカ7として機能する。さらに、そのスピーカを口腔Ma内に配置することで、第2スピーカ8として機能する。
【0054】
第2測定では、第2スピーカ8が口腔Ma内に配置されているが、第2スピーカ8は口腔Ma内に配置されていなくてもよい。例えば、第2スピーカ8は完全に口腔Ma内に配置された状態に限らず、被測定者U2が第2スピーカ8の放音側のみを加えた状態で測定が行われてもよい。あるいは、第2スピーカ8は被測定者U2の口腔Maに近接して配置されていればよい。つまり、第2スピーカ8の配置位置である第2の位置は、第1スピーカ7の配置位置である第1の位置よりも口腔Maに近い位置であれば良い。
【0055】
上記処理のうちの一部又は全部は、コンピュータプログラムによって実行されてもよい。上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0056】
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は上記実施の形態に限られたものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。上記の実施の形態の2つ以上を適宜組み合わせることも可能である。
【符号の説明】
【0057】
2 音声処理装置
5 骨伝導マイク
7 第1スピーカ
8 第2スピーカ
10 測定音源
11 増幅器
14 周波数特性算出部
15 フィルタ生成部
16 補正部
51 第1収音信号取得部
52 第2収音信号取得部
100 音声変換システム
150 骨伝導マイク
160 音声変換装置
162 発話信号取得部
163 フィルタ処理部
170 音声信号
200 フィルタ生成装置
U1 ユーザ
U2 被測定者