(58)【調査した分野】(Int.Cl.,DB名)
音響障害物によって所定範囲の収音が阻害されるマイクの収音信号を複数の収音信号に分岐して、前記複数の収音信号のうち少なくともいずれか1つの収音信号に対して、帯域制限処理を行ない、
前記帯域制限処理がされた後の収音信号を含む、前記複数の収音信号の特徴量を比較し、該特徴量の比較結果に応じて前記マイクのゲイン制御を行なう、
収音方法。
【発明を実施するための形態】
【0013】
(第1実施形態)
図1は、第1実施形態に係る収音装置1の構成を示す概略図である。
図1においては、収音に係る主構成を記載して、その他の構成は記載していない。収音装置1は、円筒形状の筐体50と、マイク10と、を備えている。
【0014】
筐体50は、金属または樹脂等からなり、遮音性を有する。すなわち、筐体50は、本発明の音響障害物の一例である。筐体50は、平面視して、中央部分が音響的に開放されている。
【0015】
マイク10は、筐体50の該円筒内に配置されている。マイク10は、収音装置1が設置された設置面(例えば机上)の水平方向では筐体50に隠れるようになっている。マイク10は、収音装置1が設置された設置面の水平方向から所定角度以上で、筐体50から音響的に開放されるようになっている。
【0016】
筐体50は、
図2(A)および
図2(B)に示すように、例えば机上70に設置される。
図2(A)に示すように、収音装置1に近い位置にいる話者5が発した音声は、筐体50に阻害されずに、マイク10に直接到達する。しかし、
図2(B)に示すように、収音装置1から遠い位置にいる話者7が発した音声は、筐体50により阻害される。収音装置1から遠い位置にいる話者7が発した音声は、筐体50を回り込む成分(主に低域成分)だけがマイク10に到達する。
【0017】
図3は、マイク10、音響障害物である筐体50、および話者(音源)Sの位置関係を示す図である。
図3に示すように、収音装置1では、机上面(水平方向L)に対して、所定の角度θ以下では、音源Sの音が筐体50により阻害されるようになっている。
【0018】
音源Sの音が阻害される範囲は、マイク10の位置と筐体50との距離L1、および筐体50の高さV1の関係によって決まる。例えば、L1/V1=1とすれば、θ=45度となる。一般に、話者が椅子に座って会議等を行なう場合、話者の顔は、机上から約30cm程度の高さ(V2=30cm)に位置することになる。したがって、L1/V1=1=L2/V2とすれば、L2=V2となり、マイク10の位置を中心とする半径約30cmの範囲内の話者の音声は、筐体50に阻害されない。一方で、マイク10との距離が約30cmを超える範囲の話者の音声は、筐体50に阻害される。
【0019】
あるいは、L1/V1=3.33程度とすると、θ=16度となる。L1/V1=3.33=L2/V2とすれば、L2=3.33・V2となり、半径約100cmの範囲内の話者の音声は筐体50に阻害されない。一方で、マイク10との距離が約100cmを超える範囲の話者の音声は、筐体50に阻害される。
【0020】
一般に、会議等を行なう場合、話者は、机の直近位置から100cm程度の範囲内に位置する。したがって、L1とV1との比(L1/V1)は、1〜3.33程度に設定することが好ましい。これにより、半径約30cm〜100cm程度の範囲における音声は、筐体50に阻害されずにマイク10に到達し、半径約30cm〜100cm程度の範囲外の音声は、筐体50により阻害される。
【0021】
図4は、収音装置1のブロック図である。収音装置1は、マイク10、ゲイン調整部15、ゲイン計算部17、およびインタフェース(I/F)19を備えている。
【0022】
マイク10で取得された音声である収音信号は、ゲイン調整部15でゲイン調整され、I/F19に入力される。I/F19は、例えば通信I/Fであり、該収音信号を、外部の装置(遠隔地)に送信する。あるいは。I/F19は、該収音信号を、記憶部(不図示)に出力する。記憶部は、マイク10で取得された収音信号を録音データとして記録する。
【0023】
ゲイン計算部17は、ゲイン調整部15のゲインを設定する。ゲイン調整部15およびゲイン計算部17により、本発明のゲイン制御部が構成される。ゲイン計算部17には、収音信号が入力される。ただし、収音信号は、複数の収音信号(収音信号S1および収音信号S2)に分岐される。なお、ゲイン調整部15およびゲイン計算部17の機能は、パーソナルコンピュータ等の一般的な情報処理装置で実現することも可能である。この場合、情報処理装置は、フラッシュメモリ等の記憶媒体に記憶されたプログラムを読み出して実行することにより、ゲイン調整部15およびゲイン計算部17の機能を実現する。
【0024】
図5は、ゲイン計算部17の構成を示すブロック図(機能ブロック図)である。また、
図15は、ゲイン計算部17の動作を示すフローチャートである。ゲイン計算部17は、フィルタ部(Filter)171A、フィルタ部171B、絶対値計算部(Absolute)172A、絶対値計算部172B、平均化処理部(Average)173A、平均化処理部173B、比較部(Compare)174、およびゲイン算出部(Gain)175を備えている。
【0025】
フィルタ部171Aには、収音信号S1が入力され、フィルタ部171Bには、収音信号S2が入力される。フィルタ部171Aおよびフィルタ部171Bは、それぞれ帯域制限処理を行なう(S11)。
【0026】
フィルタ部171Aおよびフィルタ部171Bは、収音装置1に近い位置にいる話者が発した音声と、収音装置1から遠い位置にいる話者が発した音声と、で音響特徴量に差が生じる帯域の抽出処理を行なう。
【0027】
例えば、フィルタ部171Aは低域制限処理(ハイパスフィルタ)となり、フィルタ部171Bを全帯域通過処理(オールパスフィルタ)となる。上述した様に、収音装置1に近い位置にいる話者が発した音声は、筐体50に阻害されずにマイク10に到達し、収音装置1から遠い位置にいる話者が発した音声は、筐体50を回り込む成分(主に低域成分)がマイク10に到達する。したがって、収音装置1に近い位置にいる話者が発した音声は、フィルタ部171Aの出力信号も、フィルタ部171Bの出力信号も、大きなレベル差が生じない。一方で、収音装置1から遠い位置にいる話者が発した音声のうち、高域成分が筐体50により阻害され、マイク10に到達し難い。よって、フィルタ部171Aの出力信号のレベルは、著しく低下し、フィルタ部171Bの出力信号とのレベル差が大きくなる。
【0028】
フィルタ部171Aの出力信号(収音信号)S1−1は、絶対値計算部172Aで絶対値化されてパワー値S1−2として算出される(S12)。算出されたパワー値は、平均化処理部173Aで所定の時間範囲で平均化され、平均パワー値S1−3となる(S13)。フィルタ部171Bの出力信号(収音信号)S2−1は、絶対値計算部172Bで絶対値化されてパワー値S2−2として算出される(S12)。算出されたパワー値は、平均化処理部173Bで所定の時間範囲で平均化され、平均パワー値S2−3となる(S13)。
【0029】
比較部174は、平均化処理部173Aの出力値(平均パワー値)S1−3を平均化処理部173Bの出力値(平均パワー値)S2−3で除算した値である、値Rを求める(S14)。除算は、音響特徴量の比較方法の一例である。他にも、例えば、平均化処理部173Aの出力信号を平均化処理部173Bの出力信号で減算し、差分値をRとしてもよい。
図6は、距離と各収音信号のレベルとの関係を示す図である。収音信号S2−1のレベル(例えばパワー値)は、マイク10からの距離が長くなるにしたがって低下する。
図3に示したように、距離L2よりも遠い位置では、筐体50により音声の到達が阻害されるため、収音信号S2−1は、マイク10からの距離が長くなるにしたがってレベル低下の度合いがより大きくなる。
【0030】
一方で、収音信号S1−1は、距離L2までは、収音信号S2−1と同様に、マイク10からの距離が長くなるにしたがって低下する。そして、距離L2よりも遠い位置では、筐体50により音声の到達が阻害され、かつ、回り込み易い成分である低域成分がカットされているため、収音信号S1−1は、マイク10からの距離が長くなるにしたがってレベル低下の度合いがさらに大きくなる。よって、値Rは、距離L2よりも遠い位置の音源がある場合に、大きく低下する。
【0031】
また、収音装置1は、特徴量として、異なる周波数帯域における音声の立ち上がり時刻の分散の逆数を用いて値Rを算出してもよい。
図7は、特徴量として、異なる周波数帯域における音声の立ち上がり時刻の分散の逆数を用いる場合のゲイン計算部17の構成を示すブロック図(機能ブロック図)である。
【0032】
ゲイン計算部17は、フィルタ部171A、フィルタ部171B、帯域分割部182A、帯域分割部182B、立ち上がり時刻検出部183A、立ち上がり時刻検出部183B、分散計算部184A、分散計算部184B、逆数計算部185A、逆数計算部185B、比較部174、およびゲイン算出部175を備えている。
【0033】
この場合、フィルタ部171Aの出力信号S1−1は帯域分割部182Aに入力され、さらに細かい帯域に分割され、信号S1−4となる。信号S1−4は、立ち上がり時刻検出部182Aに入力される。フィルタ部171Bの出力信号S2−1は、帯域分割部182Bに入力され、さらに細かい帯域に分割され、信号S2−4となる。信号S2−4は、立ち上がり時刻検出部182Bに入力される。立ち上がり時刻検出部182Aは、信号S1−4のレベルが一定の閾値を超えた時刻を計算し、時刻値S1−5として出力する。時刻値S1−5は、分散計算部184Aに入力される。立ち上がり時刻検出部182Bは、信号S2−4のレベルが一定の閾値を超えた時刻を計算し、時刻値S2−5として出力する。時刻値S2−5は、分散計算部184Bに入力される。分散計算部184Aは時刻値S1−5の帯域に関する分散値を計算し、分散値S1−6として出力する。分散値S1−6は、逆数計算部185Aによって逆数S1−7となる。分散計算部184Bは時刻値S2−5の帯域に関する分散値を計算し、分散値S2−6として出力する。分散値S2−6は、逆数計算部185Bによって逆数S2−7となる。比較部174は、逆数S1−7を逆数S2−7から除算し、値Rを出力する。
【0034】
図8は、距離と逆数S1−7および逆数S2−7との関係を示す図である。出力信号S1−1は、フィルタ部171Aにてオールパスフィルタが適用されているため、障害物の影響を受けにくい低域成分を含んでいる。したがって、信号S1−1は、距離L2より近くでも遠くでも、部屋の反射などの間接音よりも直接音が支配的になる。直接音は、音源からマイク10までの最短経路を通ってくるので、音波の到達時刻を表す時刻値S1−5は、どの周波数もほぼ一致してほぼ同時刻となるため、立ち上がり時刻の分散S1−6は小さくなり、立ち上がり時刻の分散の逆数S1−7は大きい値となる。
【0035】
一方で、出力信号S2−1には、フィルタ部172Aにてハイパスフィルタが適用されるため、障害物の影響を受けやすい成分しか存在しない。
図3に示したように、距離L2よりも遠い位置では、筐体50により直接音の到達が阻害されるため、マイク10からの距離が長くなるにしたがって、出力信号S2−1における間接音の比率は、大きくなる。間接音は、部屋の中を何度も反射してからマイク10に到達するので、周波数によって到達時刻が大きく異なる。これより、立ち上がり時刻の分散S2−6は、より大きくなり、逆数S2−7は、大きく低下する。これより、逆数S1−7と逆数S2−7は、距離L2を超えると、大きく異なる値になる。よって、値Rは、距離L2よりも遠い位置の音源がある場合に、大きく低下する。
【0036】
ゲイン算出部175は、値Rに応じて、ゲインGを算出する(S15)。
図9(A)は、ゲインテーブルの一例を示す図である。ゲインテーブルは、
図9(A)に示すように、値Rが、所定の値R1以上では、減衰しない。所定の値R1からR2までは、値Rの低下にしたがって、ゲインが減衰するように設定されている。値RがR2よりも小さい場合には、最小ゲイン値で維持する。
【0037】
値Rは、音源の位置が距離L2よりも遠方である場合に、距離の増加に応じて減少する。所定値R1および所定値R2は、どの様な値に設定してもよいが、所定値R1は、減衰させずに収音したい最大範囲に応じて設定する。例えば、L1とV1との比(L1/V1)が1である場合、音源の位置が半径約30cmよりも遠い場合に、値Rの値が低下するが、距離が約40cmとなる時の値Rの値を、所定値R1に設定することで、半径約40cmまでは、減衰させずに収音することができる。また、所定値R2は、減衰させたい最小範囲に応じて設定する。例えば、距離が100cmとなる時の値Rの値を、所定値R2に設定することで、距離が100cm以上ではほとんど収音されず、距離が100cmよりも近くなると、徐々にゲインが上昇して収音されることになる。
【0038】
また、所定値R1および所定値R2は、固定値ではなく、動的に変化させてもよい。例えば、所定時間内の過去に算出された値Rのいつ、最も大きい値R0を求め、所定値R1=R0+0.1、所定値R2=R0−0.1とする。これにより、現在の音源の位置を基準として、該音源の位置よりもマイク10に近い範囲の音は収音され、音源の位置よりも遠い範囲の音が収音されない。
【0039】
図9(A)の例は、所定距離(例えば30cm)から急激にゲインが低下して、所定距離(例えば100cm)以上の音源はほとんど収音されない態様であり、リミッタの機能に類似する。しかし、ゲインテーブルは、他にも
図9(B)に示すように、様々な態様が考えられる。
図9(B)の例では、距離に応じて徐々にゲインが低下し、所定距離(例えば30cm)からゲインの低下度合いが大きくなり、所定距離(例えば100cm)以上では、再び徐々にゲインが低下する態様であり、コンプレッサの機能に類似する。
【0040】
以上のように、本実施形態の収音装置1は、マイク10からの距離が所定範囲内の音源の音を収音し、所定範囲外の音を収音しない態様となり、遠方の音源(例えばノイズ)を著しく低減させることができる。本実施形態の手法では、反射音等の部屋の大きさに依存することもなく、同じ方向からの音に対しても、距離に応じてゲインの調整を行なうことができる。
【0041】
(第2実施形態)
次に、
図10は、第2実施形態に係る収音装置1Aの構成を示す概略図である。
図10においても、収音に係る主構成を記載して、その他の構成は記載していない。収音装置1Aは、2つのマイク10Aおよびマイク10Bを備えている。
【0042】
この例の収音装置1Aでは、マイク10Aは、筐体50の該円筒内に配置されている。すなわち、マイク10Aは、
図1に示したマイク10と同じ構成である。そして、収音装置1Aでは、マイク10Bが筐体50の上面に配置されている。
【0043】
図11(A)および
図11(B)に示すように、マイク10Bは、収音装置1に近い位置にいる話者5が発した音声も、収音装置1から遠い位置にいる話者7が発した音声も、筐体50に阻害されずに取得することができる。
【0044】
なお、マイク10Bは、筐体50の上面に配置されることが必須ではない。例えば筐体50の外周側面に配置されていてもよいし、筐体50から離れた位置に配置されていてもよい。
【0045】
図12は、収音装置1Aのブロック図である。収音装置1Aは、マイク10A、マイク10B、ゲイン調整部15、ゲイン計算部17、およびインタフェース(I/F)19を備えている。
【0046】
マイク10Aの収音信号S1は、ゲイン計算部17に入力される。マイク10Bの収音信号S2は、ゲイン調整部15およびゲイン計算部17に入力される。マイク10Bの収音信号S2は、ゲイン調整部15でゲイン調整され、I/F19に入力される。
【0047】
なお、この例では、マイク10Bの収音信号S2のゲインを調整して、I/F19に出力する態様となっているが、マイク10Aの収音信号S1のゲインを調整して、I/F19に出力する態様としてもよい。ただし、マイク10Aは、円筒形状の筐体50の内部に配置されているため、筐体50の内部における反射音が収音され、所定の周波数においてディップまたはピークが生じる可能性がある。よって、マイク10Bの収音信号S2のゲインを調整して、I/F19に出力することが好ましい。
【0048】
ゲイン計算部17の構成は、
図5に示した第1実施形態のゲイン計算部と同じである。ただし、フィルタ部171Aおよびフィルタ部171Bの通過帯域は、収音装置1に近い位置にいる話者と、収音装置1から遠い位置にいる話者と、で、値Rが最も異なる帯域に設定される。例えば、フィルタ部171Aおよびフィルタ部171Bは、ともに1kHz以上の帯域を通過させる低域制限処理(ハイパスフィルタ)となる。その他の構成は全て第1実施形態と同じ処理を行なう。
【0049】
なお、第2実施形態においては、フィルタ部171Aおよびフィルタ部171Bによる帯域制限処理は必須ではない。フィルタ部171Aおよびフィルタ部171Bによる帯域制限処理を行なわずとも、遠方の音源に対して、マイク10Aは、筐体50で阻害され、マイク10Bは筐体50で阻害されることがないため、マイク10Aで収音される音とマイク10Bで収音される音とでは、物理的にレベルが異なることになる。よって、フィルタ部171Aおよびフィルタ部171Bによる帯域制限処理を行なわずとも、除算値Rは、所定の距離以上の遠方で、音源との距離が遠くなるほど低下する。
【0050】
これにより、第2実施形態の収音装置1Aも、第1実施形態と同様に、マイク10からの距離が所定範囲内の音源の音を収音し、所定範囲外の音を収音しない態様となり、遠方の音源(例えばノイズ)を著しく低減させることができる。第2実施形態の手法でも、反射音等の部屋の大きさに依存することもなく、同じ方向からの音に対しても、距離に応じてゲインの調整を行なうことができる。
【0051】
図13は、変形例1に係る収音装置1Bの構成を示す概略図である。収音装置1Bは、筐体50の円筒内部に吸音材75が配置されている。その他の構成は、収音装置1と同じである。
【0052】
収音装置1Bは、筐体50の円筒内部に吸音材75が配置されているため、該円筒内部における反射音を抑制することができる。よって、マイク10の収音信号の周波数特性において、不要なディップまたはピークが生じることを抑制することができる。
【0053】
なお、第2実施形態においても同様に、筐体50の円筒内部に吸音材75を配置してもよい。
【0054】
次に、
図14(A)は、変形例2に係る収音装置1Cの構成を示す概略図である。
図14(B)および
図14(C)は、収音装置1Cが設置される室内の横断面図の例である。
【0055】
変形例2の収音装置1Cは、直方体形状の音響障害物50Aと、マイク10と、を備えている。その他の構成は、
図4および
図5に示したブロック図と同じ構成である。収音装置1Aおよび収音装置1Bの音響障害物50は、円筒形状(平面視した形状が円形)であったが、音響障害物は、平面視した形状が長方形状であってもよいし、他にも、平面視した形状が半円形、楕円形、または多角形等、その他種々の形状が考えられる。
【0056】
音響障害物50Aは、マイク10の近傍に配置されている。マイク10は、収音装置1が設置された平面の水平方向では筐体50に隠れるようになっている。マイク10は、収音装置1が設置された平面の水平方向から所定角度以上で、筐体50から音響的に開放されるようになっている。
【0057】
ただし、音響障害物50Aは、平面視した形状が長方形状の一例(直方体形状)であるため、全周囲ではなく、特定の方向のみ、マイク10への収音を阻害する。例えば、
図14(B)の例では、収音装置1Cは、ディスプレイ(表示器)55の前方下部に設置されていて、該ディスプレイ55の前方方向のうち、所定の角度θ以下の範囲の音を収音しないようになっている。
【0058】
音響障害物50Aを備えた収音装置1Cは、天井に設置する場合も同様である。
図14(C)に示すように天井に設置する場合、天井面から所定の角度θ以下の範囲の音を収音しないようになる。
【0059】
このように、音響障害物は、収音を阻害する範囲に応じて、適宜種々の形状および配置態様が考えられる。
【0060】
本実施形態の説明は、すべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述の実施形態ではなく、特許請求の範囲によって示される。さらに、本発明の範囲は、特許請求の範囲と均等の範囲を含む。