(58)【調査した分野】(Int.Cl.,DB名)
第1伝達経路は前記第1音出力ユニットと前記第2集音ユニットとを直線で結ぶことにより得られる経路であることを特徴とする請求項1または2に記載の音響システム。
前記部分変更部は、前記部分抽出部によって抽出された変更対象部分の信号の搬送波成分に由来しない搬送波成分に、当該変更対象部分の信号の振幅成分の時間軸に沿った波形を適用して新たな変更対象部分の信号を得ることを特徴とする請求項7に記載の音響システム。
前記部分抽出部は、前記振幅波形抽出部によって抽出された波形のピークより前の第1時刻と当該ピークより後の第2時刻とで挟まれる区間の信号であって略1山状の信号を、前記変更対象部分の信号として決定することを特徴とする請求項7または8に記載の音響システム。
前記部分変更部によって得られる新たな変更対象部分の信号が前記出力部から出力されるタイミングを、第1領域から第2領域への音の伝搬にかかる時間に応じて調整するタイミング調整部をさらに備えることを特徴とする請求項7から9のいずれかに記載の音響システム。
【発明を実施するための形態】
【0014】
以下、各図面に示される同一または同等の構成要素、部材、処理には、同一の符号を付するものとし、適宜重複した説明は省略する。
【0015】
図1は、比較例に係るブース2の模式図である。ブース2はパーティション4で区画された領域であり、例えば銀行の相談カウンターである。ブース2は、マイクMicと、音変更ユニット10と、2つのパワーアンプPAと、2つのスピーカSPと、を備える。
【0016】
相談員と会話を行っている顧客6を発話者とする。この発話者が発話中の音声であるマスキー(原音声)H'(t)はカウンター部分またはその近傍に設けられたマイクMicによって集音される。マイクMicにより集音されたマスキーH'(t)は音声信号に変換され、音変更ユニット10に送られる。この音声信号が音変更ユニット10によって変更される。音変更ユニット10における処理を経た音声信号はパワーアンプPAを経てスピーカSPによって音声に変換され、そのように変換された音声は左右の隣接ブース2’に処理音声(以下、マスカーと称す)H(t)として出力される。
【0017】
隣接ブース2’にはマスキーH'(t)が空中を回り込んでくるので、顧客6が発話中の音声は隣接ブース2’内にいる受聴者8(顧客6とは異なる者)によって受聴されうる。しかしながら本比較例では、空中を回り込んで漏洩するマスキーH'(t)はマスカーH(t)と合成されて隣接ブース2’内の受聴者8に届く。したがってマスカーH(t)によるマスキングや擾乱により、受聴者8はマスキーH'(t)に含まれる会話の内容を理解することができない。
【0018】
音変更ユニット10における音声変更処理は、例えばマスキーH'(t)の有音区間に合わせて雑音を生成する処理であってもよく、あるいはまた雑音の代わりに音楽や音声から作成したHSL雑音(Human Speech-like noise)を生成する処理であってもよく、あるいはまた後述のSD(Speech Deformation)であってもよい。また、音変更ユニット10はANC(Active Noise Control)/PNC(Passive Noise Control)を行うユニットであってもよい。
【0019】
本発明者は、当業者としての経験および予備的な実験により、ブース2、隣接ブース2’を含む
図1に示されるような系において、ハウリングやエコーを生じさせうる音のループには少なくとも以下の2つがあることを認識した。
(1)マイクMic、音変更ユニット10、パワーアンプPA、スピーカSPと回って再度マイクMicに帰る第1ループLP1。この第1ループLP1は
図1において破線で示されている。スピーカSPからマイクMicへの音の伝達経路は、パーティション4を回り込む経路である。
(2)マイクMic、音変更ユニット10、パワーアンプPA、スピーカSP、マイクMic’、音変更ユニット10’、パワーアンプPA’スピーカSP’と回って再度マイクMicに帰る第2ループLP2。この第2ループLP2は
図1において一点鎖線で示されており、横八の字の循環ループである。
【0020】
従来では、マイクとスピーカとを含む音のループに、スピーチプライバシー保護装置による処理などの音声変更処理を挿入した場合、マイクに入力される音とスピーカから出力される音との相関が低くなるので、ハウリングやエコーは起こりにくくなるという考え方がある。しかしながら本発明者は、エネルギで見た場合に返りが1を超える場合は、通常のハウリングとは様態が異なるものの、何らかのハウリング現象がおきることは、論理的な当然の帰結であると考える。また、本発明者による予備的な実験によっても、上記(2)の第2ループLP2に起因するハウリングやエコーが生じることが確かめられた。因みに、このようなハウリングやエコーについては、ループゲインやオープンループゲインだけでなく、ループパワーゲイン(SPオフ時のMic出力の自乗実効値と、SPオンでループを形成した時のMic出力の自乗実効値の比。例えば、非特許文献1参照)、オープンループパワーゲイン(それぞれの自乗音圧の平均値、つまりそれらの実効値)等によっても測定・評価できる。
【0021】
ブース2、隣接ブース2’を含む
図1に示されるような系は、話者の音声を収音して話者周辺の人に対して話者の音声が伝わらないようにスピーカSPにてマスキング音(マスカーH(t))を提示する。このような系では、体育館、ホールなどの大空間とは異なり、話者と話者周辺の人との位置関係が近いこと、また位置関係もある程度特定されることにより、一般的なハウリング対策、例えばスピーカSPから出た音がマイクMic’で拾われないようにする対策を取ることが困難な場合が多い。
【0022】
また、第1ループLP1は音がパーティション4を回り込む経路を含み、そこでの減衰は大きいので、基本的には第1ループLP1よりも第2ループLP2のほうがハウリングやエコーの発生に寄与する。
【0023】
そこで本発明者は、ブース2、隣接ブース2’を含む
図1に示されるような系において、第2ループLP2に起因するハウリングやエコーを抑制できる下記の実施の形態を創作した。
【0024】
(第1の実施の形態)
図2は、隣接する第1ブース102、第2ブース104に跨って設けられた第1の実施の形態に係る音響システム100の構成を示す模式図である。第1ブース102、第2ブース104はそれぞれパーティション122で隔てられた領域であり、例えば銀行の相談カウンターである。音響システム100は、シリコンマイク、ダイナミックマイク、コンデンサマイクなどの第1顧客側マイク106aと、第1相談員側マイク106bと、第1音変更ユニット108と、第1パワーアンプ110と、第1スピーカ112と、第2顧客側マイク114aと、第2相談員側マイク114bと、第2音変更ユニット116と、第2パワーアンプ118と、第2スピーカ120と、を備える。
【0025】
第1スピーカ112や第2スピーカ120としては音を提示できるスピーカが採用されてもよく、例えばボードスピーカや平面スピーカやコーンスピーカやアクチュエータなどが採用されてもよい。スピーカの再生は、音声帯域を含む50Hz〜8kHzをバランスよく提示させる特性のスピーカが好ましい(250Hz以下の音が少ないスピーカでは、低音域が少なくなることによって、音声のマスキングの面で劣る場合がある)。
【0026】
第1顧客側マイク106aおよび第1相談員側マイク106bは第1ブース102内に配置され、第2顧客側マイク114aおよび第2相談員側マイク114bは第2ブース104内に配置される。第2スピーカ120は第1ブース102内に音を出力するようパーティション122に取り付けられ、第1スピーカ112は第2ブース104内に音を出力するようパーティション122に取り付けられる。第1音変更ユニット108、第1パワーアンプ110、第2音変更ユニット116、第2パワーアンプ118はどこに設置されてもよく、例えばブースのカウンター部分128の裏側やパーティション122内に設置されてもよい。
【0027】
第1顧客側マイク106a、第1相談員側マイク106bはそれぞれ、カウンター部分128の第1顧客126側、第1相談員124側に設けられる。なお、第1顧客側マイク106a、第1相談員側マイク106bはそれぞれ対応する話者の近くに配置されればよく、机先端、机裏面、または、パーティション4の第2スピーカ120の下部などに配置されてもよい。机裏面に配置された場合は、音を効率的に取り込む板などを設置してもよい。第2顧客側マイク114a、第2相談員側マイク114bについても同様である。
【0028】
第1顧客側マイク106a、第1相談員側マイク106bはそれぞれ、第1顧客126、第1相談員124によって発声される音声や第2スピーカ120から出力される音を受け、それらを表す電気信号である第1音信号S1、第2音信号S2を生成する。第2顧客側マイク114a、第2相談員側マイク114bも同様に第3音信号S3、第4音信号S4をそれぞれ生成する。
【0029】
第1音変更ユニット108は第1音信号S1および第2音信号S2を受け、それらを変更し、変更された音信号を第5音信号S5として出力する。第2音変更ユニット116は第3音信号S3および第4音信号S4を受け、それらを変更し、変更された音信号を第6音信号S6として出力する。第1音変更ユニット108、第2音変更ユニット116の詳細は後述する。
【0030】
第1スピーカ112、第2スピーカ120はそれぞれ、第5音信号S5、第6音信号S6を第1パワーアンプ110、第2パワーアンプ118を介して取得し、取得された音信号を音に変換し、第2ブース104、第1ブース102に出力する。
【0031】
第1ブース102内で第1相談員124と会話を行っている第1顧客126を発話者とする。この発話者が発話中の音声であるマスキーH'(t)は第1顧客側マイク106aによって集音される。第1顧客側マイク106aにより集音されたマスキーH'(t)は音声信号に変換され、第1音変更ユニット108に送られる。この音声信号は第1音変更ユニット108によって変更される。第1音変更ユニット108における処理を経た音声信号は第1パワーアンプ110を経て第1スピーカ112によって音声に変換され、そのように変換された音声は第2ブース104にマスカーH(t)として出力される。
【0032】
第2ブース104にはマスキーH'(t)が空中を回り込んでくるので、第1顧客126が発話中の音声は第2ブース104内にいる第2相談員130や第2顧客132によって受聴されうる。しかしながら本実施の形態では、空中を回り込んで漏洩するマスキーH'(t)はマスカーH(t)と合成されて第2ブース104内の第2相談員130や第2顧客132に届く。したがってマスカーH(t)によるマスキングや擾乱により、第2相談員130や第2顧客132はマスキーH'(t)に含まれる会話の内容を理解することができない。
【0033】
パーティション122は吸音処理されている。パーティション122は、第1吸音層42と、遮音層44と、第2吸音層46と、をこの順に積層してなる積層構造を有する。例えば、第1吸音層42および第2吸音層46はそれぞれ厚さが20mmのグラスウールの層である。遮音層44は厚さが12mmの石膏ボードである。
【0034】
音響システム100では、第1顧客側マイク106aおよび第1相談員側マイク106bをひとつの集音ユニットと見たとき、第2スピーカ120とその集音ユニットとの間には、経路長L1が略等しい音の第1伝達経路134と第2伝達経路136とが設けられる。特に、第1伝達経路134は第2スピーカ120と第1顧客側マイク106aとの間に設けられ、第2伝達経路136は第2スピーカ120と第1相談員側マイク106bとの間に設けられる。
【0035】
第1伝達経路134は第2スピーカ120と第1顧客側マイク106aとを結ぶ最短の経路、すなわち第2スピーカ120と第1顧客側マイク106aとを直線で結ぶことにより得られる経路である。したがって、第1伝達経路134は、第2スピーカ120と第1顧客側マイク106aとの間の伝達経路のなかで、第1顧客側マイク106aに到達する音が最も大きくなる経路である。特に、第1伝達経路134を経由して第1顧客側マイク106aに到達する音は、カウンター部分128やパーティション122による反射を含む他の伝達経路を経由して第1顧客側マイク106aに到達する音よりも大きくなる。
第2伝達経路136についても同様であり、第2伝達経路136は第2スピーカ120と第1相談員側マイク106bとを直線で結ぶことにより得られる経路である。
【0036】
第1顧客側マイク106aおよび第1相談員側マイク106bは、第1ブース102において想定される第1顧客126の位置138とそれぞれのマイクとの間の音の伝達経路の経路長が異なるように、第1ブース102に配置される。また、第1ブース102において想定される第1相談員124の位置140とそれぞれのマイクとの間の音の伝達経路の経路長もまた異なる。
【0037】
例えば、第1顧客側マイク106aを第1ブース102に設置する際、設置者は、第2スピーカ120を中心とし半径L1の球面上であって第1顧客126の位置138の近傍に第1顧客側マイク106aを設置する。言い換えると、設置者は、第1顧客側マイク106aおよび第1相談員側マイク106bを、第2スピーカ120からは略同距離(あるいは、第2スピーカ120に対し物理的条件ができるだけ相似になる位置)、話者からは異なった距離(各話者の至近の位置)に設置し、それらの2つのマイクを逆位相に接続する。
【0038】
第2顧客側マイク114a、第2相談員側マイク114b、第1スピーカ112についても同様であり、第1スピーカ112と第2顧客側マイク114aとの間に経路長L2の音の第3伝達経路144が設けられ、第1スピーカ112と第2相談員側マイク114bとの間に経路長L2の音の第4伝達経路146が設けられる。
【0039】
第1音信号S1は、第1顧客側マイク106aが第1伝達経路134を経由する音から生成する第7音信号S7と、第1顧客側マイク106aが第1顧客126の発話音声から生成する第8音信号S8と、第1顧客側マイク106aが第1相談員124の発話音声から生成する第9音信号S9と、を含む。
第2音信号S2は、第1相談員側マイク106bが第2伝達経路136を経由する音から生成する第10音信号S10と、第1相談員側マイク106bが第1顧客126の発話音声から生成する第11音信号S11と、第1相談員側マイク106bが第1相談員124の発話音声から生成する第12音信号S12と、を含む。
【0040】
音響システム100では、第1伝達経路134を経由する音に対応する第1音信号S1は第2伝達経路136を経由する音に対応する第2音信号S2と実質的に逆位相とされた上で足し合わされる。第1伝達経路134と第2伝達経路136とは経路長が略等しいので、第7音信号S7と第10音信号S10とは打ち消し合う。また、第3伝達経路144を経由する音に対応する第3音信号S3は第4伝達経路146を経由する音に対応する第4音信号S4と実質的に逆位相とされた上で足し合わされる。
【0041】
図3は、第2スピーカ120から第1音変更ユニット108に至るまでの音および音信号の流れを説明するための説明図である。音響システム100は、第1顧客側マイク106aと第1音変更ユニット108との間に、顧客側マイクプリアンプ148、顧客側カップリングキャパシタ152、顧客側シールド線156を備え、第1相談員側マイク106bと第1音変更ユニット108との間に、相談員側マイクプリアンプ150、相談員側カップリングキャパシタ154、相談員側シールド線158を備える。
【0042】
顧客側マイクプリアンプ148、相談員側マイクプリアンプ150はそれぞれ、第1顧客側マイク106a、第1相談員側マイク106bによって生成された音信号を増幅して出力する。
顧客側カップリングキャパシタ152、相談員側カップリングキャパシタ154はそれぞれ、顧客側マイクプリアンプ148、相談員側マイクプリアンプ150によって出力される音信号から直流成分を除去する。
顧客側シールド線156、相談員側シールド線158はそれぞれ、顧客側カップリングキャパシタ152、相談員側カップリングキャパシタ154で直流成分が除去された音信号を第1音変更ユニット108に伝達する。
【0043】
第1音変更ユニット108は、音声トランス160と、SDコントローラ部SDと、を含む。音声トランス160は、第1音信号S1と第2音信号S2との差に対応する差分音信号Scを生成する。SDコントローラ部SDは、そのように生成された差分音信号を変更する。
【0044】
音声トランス160の1次巻き線162の一端は相談員側シールド線158と接続される。1次巻き線162の一端には、第1相談員側マイク106bからの第2音信号S2が入力される。1次巻き線162の他端は顧客側シールド線156と接続される。1次巻き線162の他端には、第1顧客側マイク106aからの第1音信号S1が入力される。1次巻き線162のセンタータップは接地される。したがって、第1音信号S1が1次巻き線162と2次巻き線164との相互誘導を介して2次巻き線164に及ぼす誘導起電力の位相と、第2音信号S2が2次巻き線164に及ぼす誘導起電力の位相とは実質的に逆になる。2次巻き線164の両端には、第1音信号S1起因の誘導起電力と第2音信号S2起因の誘導起電力とが足し合わされた電圧が発生するので、結局、2次巻き線164の両端電圧Vdは、第1音信号S1と第2音信号S2との差に対応する電圧となる。この電圧がSDコントローラ部SDに入力される。差分音信号Scは電圧として2次巻き線164の両端電圧Vdを有する信号である。
【0045】
差分音信号Scは第1音信号S1と第2音信号S2との差に対応するので、第7音信号S7と第10音信号S10とは打ち消しあって、第7音信号S7および第10音信号S10からの差分音信号Scへの寄与は比較的小さい。また、第1顧客126から第1相談員側マイク106bまでの距離は、第1顧客126から第1顧客側マイク106aまでの距離より十分大きいので、第11音信号S11は第8音信号S8よりも十分に小さい。また、同様に、第9音信号S9は第12音信号S12よりも十分に小さい。結果として、差分音信号Scは主に第8音信号S8および第12音信号S12を含む。
【0046】
第2スピーカ120から同距離のため第1顧客側マイク106a、第1相談員側マイク106bには、第2スピーカ120からの音が略同位相、略同振幅で入力する。それらを逆位相にして接続するために第2スピーカ120からの音に起因する音信号はキャンセルされた形でSDコントローラ部SDに入力され、合成信号は最小化される。しかしながら、第1顧客側マイク106a、第1相談員側マイク106bへの話者の音声入力に関しては、各話者と2本のマイクとの距離が異なり相関が低いため、キャンセルされずSDコントローラ部SDに入力される。
【0047】
音源Sから2つのマイクP1、P2点まで波長l、周期T、振幅Aの音波が届くとする。SP1=d1、SP2=d2とすると、2つの音波は
【数1】
で表される。
音源Sから2つのマイクまでは、等距離なので波長l、周期T、振幅Aは同じであり、d1=d2となる。それらを逆位相でつなぐと
【数2】
となる。ここでd1=d2なので
【数3】
である。したがって、
【数4】
となる。
【0048】
このように2本のマイクに入った信号をmic−トランス接続することによって、第1顧客側マイク106aと第1相談員側マイク106bの信号が逆位相になるようにSDコントローラ部SDに入力される。したがって、第2スピーカ120の音はキャンセルされる。だたし、信号である話者の音声はキャンセルされずにSDコントローラ部SDに入力されることになる。また、各パーティションに囲まれるブースの空間は音響的に極小空間となり、室全体からの反射音や残響音に対し、スピーカからマイクに入力する音はほとんど直接音とパーティションからの1次〜初期反射音となり、上記のキャンセリングが合理的に成立する。
【0049】
因みに、ここではトランスを用いて逆相信号を得る場合について説明したが、実施にあたっては、これ以外に演算増幅器(OPアンプ=オペレーショナルアンプリファイアー)などの電子回路を用いて逆相信号を形成しても良い。
このように、本手段によれば顧客や相談員の音声の直接音は収音・変成された後、隣接ブース側へ効率よく伝達され、一方でスピーカーから出た音については、顧客と相談員の側に設置された2本のMicを経由して互いにキャンセルアウト(最小化)されるため、いわゆる横八の字型ループによるエコーやハウリングについては効果的に回避できるわけである。特に、後者はループ内を1回周回する間に、上記最小化を2度受けることになり、周回信号はほぼゼロ付近まで低減されることになる。
【0050】
SDコントローラ部SDについて説明する。
特にオフィスなどにおいては、オープンプランの空間が有する開放性やコミュニケーションの円滑性を損なわずに音声情報、つまり音声の内容だけが隠蔽されることが望ましい。しかしながら、従来のBGMやマスキングを使用する技術は、基本的には原音声とは性質の異なる、別過程で作成した音を原音声とは脈絡なく加えるので、聴覚的な違和感や室内の暗騒音を上昇させてしまうという嫌いがあった。本実施の形態はマイクなどにより集音した音声信号そのものの構造を実質的に実時間で変更することにより室内の暗騒音を上昇させることなく会話の内容を、理想的には会話の内容のみを、隠蔽し、円滑で快適な秘話環境を実現する。
【0051】
本実施の形態では、聴覚音声認識(HSR :Human Speech Recognition)が音声信号のキャリア(搬送波)より包絡線遷移などのアーティキュレーション(Articulation、音声学で言う発声法・調音法、つまりイントネーションなどの抑揚情報であり、ここでは搬送波以外の包絡線の時間変化)により強く依存することに基づき、まずマスキーの包絡線(自乗音圧波形を5msec〜数100msecの時定数で平均したもの、或いはその平方根をとったものであり、音声の強弱に合せて時間的に変化する、いわゆるエンベロープ波形)を抽出し、略5dB以上で上昇してから下降する「略一山」を処理対象単位としてその処理対象単位ごとにその搬送波を別の音響信号、例えばマスキーに準じたノイズ・累積本人原音声・変調ノイズ・「ヘリウム音声」・同性/異性他人の音声などに入れ替える。
【0052】
このようにして生成される処理音声(以下、マスカーと称す)の包絡線とマスキーの包絡線とはほぼ同じになるので、両者のイントネーションは類似となり、両者を実質的に実時間で受聴する受聴者への違和感はほとんど無くなる。加えて、違和感が無い、つまり聴覚上の差異は小さいにもかかわらずマスカーではマスキーの意味内容が消失しているので、受聴者は両音声を区別も理解もできないのであり、いわば受聴者の聴覚が翻弄される状態となる。これにより、効果的な会話内容の隠蔽・遮断が実現される。
【0053】
図4は、
図3のSDコントローラ部SDの機能および構成を示すブロック図である。SDコントローラ部SDは記憶装置を有してもよく、そのような記憶装置の例は、ハードディスクやメモリである。また、本明細書の記載に基づき、各ブロックを、図示しないCPUや、インストールされたアプリケーションプログラムのモジュールや、システムプログラムのモジュールや、ハードディスクから読み出したデータの内容を一時的に記憶するメモリなどにより実現できることは本明細書に触れた当業者には理解されるところである。
【0054】
SDコントローラ部SDは、A/D部20と、包絡線抽出部50と、変更対象部分抽出部30と、部分変更部90と、出力部72と、を備える。
【0055】
差分音信号Sc(電圧Vd)がA/D部20に入力される。A/D部20は、アナログ信号である差分音信号をデジタルデータに変換する。A/D部20でデジタル化された差分音信号は、例えば音圧の大きさに応じた電圧値が時刻と対応付けられたデジタルデータである。
【0056】
ここで、差分音信号Scは、振幅変調された信号として記述可能な音信号である。すなわちこの音信号は、比較的低い周波数で時間変化する振幅成分と比較的高い周波数で変化する搬送波成分との積の形で記述できる。以下では包絡線が、振幅成分の時間変化を示す線、特に振幅成分の時間軸に沿った波形として定義される場合を考える。
【0057】
包絡線抽出部50は、A/D部20でデジタル化された差分音信号から、その包絡線を示すデータを抽出する。このデータは、例えば振幅成分に応じた電圧値が時刻と対応付けられたデジタルデータである。以下、包絡線を示すデータを単に包絡線と称す。包絡線抽出部50は、自乗音圧取得部54と、ローパスフィルタ56と、を含む。
【0058】
自乗音圧取得部54は、A/D部20でデジタル化された差分音信号の自乗音圧波形を取得する。自乗音圧取得部54は、差分音信号を自乗し、必要に応じて所定の係数を乗ずることにより自乗音圧波形を得る。
【0059】
ローパスフィルタ56は、自乗音圧取得部54によって取得された自乗音圧波形を数msecから数100msecの時定数で平均化する。すなわちローパスフィルタ56は自乗音圧波形に対してローパスフィルタ処理をする。これにより、自乗音圧波形から時定数程度よりも速い変化が取り除かれ、振幅成分の時間変化に応じた滑らかな波形が得られる。 ローパスフィルタ56は、必要であればローパスフィルタ処理されたデータの平方根をとる。
なお、他の方法で差分音信号の包絡線を求めてもよいことは、本明細書に触れた当業者には理解される。他の方法としては例えば搬送波の絶対値の平均を取る方法や、搬送波を偶数乗して平均を取る方法、或いは、Hilbert変換により包絡線を得る方法などがある。
【0060】
変更対象部分抽出部30は、包絡線抽出部50によって抽出された包絡線の形状に基づいて、A/D部20でデジタル化された差分音信号からひとまとまりの信号を抽出し、変更対象部分の信号とする。差分音信号の包絡線は多くの場合、孤立した山が連続した形状を有する。変更対象部分抽出部30は、この略1山を変更対象部分とする。
【0061】
変更対象部分抽出部30は、ローパスフィルタ56によって得られた差分音信号の包絡線のうち、数dB〜数10dB、例えば5dB以上連続して上昇する上昇部分を検出する。次に変更対象部分抽出部30は、上昇部分の後で数dB〜数10dB、例えば5dB以上連続して下降する下降部分を検出する。変更対象部分抽出部30は、上昇部分とそれに対応する下降部分との間の信号を変更対象部分の信号として決定する。このようにして決定される変更対象部分の信号の包絡線は略1山状となることが多い。
【0062】
図5は、変更対象部分抽出部30における変更対象部分の信号の決定基準を説明するための説明図である。
図5(a)は、変更対象部分抽出部30において上昇部分と下降部分の検出に基づいて変更対象部分の信号が決定される場合を説明するための説明図である。
図5(a)は、例示としての差分音信号の波形211とその包絡線208とを示す。変更対象部分抽出部30は、包絡線208の変化率に基づき上昇部分202を検出する。次に変更対象部分抽出部30は上昇部分202の後の下降部分204を検出する。変更対象部分抽出部30は、上昇部分202と下降部分204とで挟まれる区間206(ピーク203より前の時刻t1とピーク203より後の時刻t2とで挟まれる区間)の信号を変更対象部分の信号として決定する。
【0063】
なお、変更対象部分抽出部30は、他の方法で変更対象部分の信号を決定してもよい。例えば、変更対象部分抽出部30は、包絡線が膨らんでいる部分を検出し、その部分に対応する信号を変更対象部分の信号として決定してもよい。あるいはまた、変更対象部分抽出部30は、包絡線のピークを検出し、その前後に所定の長さを有する区間の信号を変更対象部分の信号として決定してもよい。あるいはまた、変更対象部分抽出部30は、包絡線が所定のレベルを越えている連続的な区間の信号を変更対象部分の信号として決定してもよい。
【0064】
図5(b)は、変更対象部分抽出部30においてピークの検出に基づいて変更対象部分の信号が決定される場合を説明するための説明図である。
図5(b)は、例示としての差分音信号の波形212とその包絡線214とを示す。変更対象部分抽出部30は、包絡線214のピーク216を検出する。変更対象部分抽出部30は、ピーク216の前後に所定の長さを有する区間218の信号を変更対象部分の信号として決定する。
【0065】
図5(c)は、変更対象部分抽出部30において包絡線のレベルに基づいて変更対象部分の信号が決定される場合を説明するための説明図である。
図5(c)は、例示としての差分音信号の波形220とその包絡線222とを示す。変更対象部分抽出部30は、包絡線222が所定のレベル224を越えている連続的な区間226を検出し、その区間226の信号を変更対象部分の信号として決定する。この場合、所定のレベルの取り方によっては、変更対象部分の信号が2以上のピークを含む場合がある。
【0066】
以上のように変更対象部分の信号の決定手法は種々考えられる。このように選択肢が多いことは、SDによる会話内容の隠蔽をより効果的とするための大きな自由度を提供するという意味で好適である。
【0067】
また、これら種々の決定手法に通じて言えることは、差分音信号の波形に基づいて、特にその統計的な性質に基づいて信号のひとまとまりが判別され、そのように判別されたひとまとまりの信号が変更対象部分の信号として決定されていることである。すなわち、入来する差分音信号に応じて適応的に変更対象部分が決定される。この場合、本発明者の当業者としての経験および予備的な実験によると、例えば予め定められた一定の間隔で差分音信号を切り出す場合と比べてより会話内容撹乱効果が高く、かつ違和感が少なく自然性が高いことが見出された。特に、本発明者によって行われた実験によると、包絡線の略1山を変更単位として抽出する場合は、例えば一定周期で切り出す場合や子音や母音を変更単位とする場合と比べて撹乱効果が高く、かつ違和感が少なく自然性が高いことが見出された。
【0068】
図4に戻る。
変更対象部分抽出部30は、差分音信号のうち変更対象部分の信号として決定されなかった部分を遅延調整部68に出力する。
【0069】
部分変更部90は、変更対象部分抽出部30によって抽出された変更対象部分の信号の搬送波成分とは別の搬送波成分に、当該変更対象部分の信号の包絡線を適用して新たな変更対象部分の信号を得る。ここで使用される別の搬送波成分は、変更対象部分抽出部30によって抽出された変更対象部分の信号の搬送波成分に由来しない搬送波成分であっても由来する搬送波成分であってもよい。前者の例は、マスキーH'(t)に準じたノイズ、累積本人原音声、変調ノイズ、同性/異性の他人音声であり、後者の例は「ヘリウム音声」である。
部分変更部90は、変更対象部分抽出部30において抽出される変更対象部分の信号ごとに上記処理を繰り返し、そのように処理された信号を遅延調整部68に出力する。
【0070】
部分変更部90は、包絡線情報取得部92と、置換用搬送波生成部94と、包絡線情報適用部96と、を有する。包絡線情報取得部92は、変更対象部分抽出部30によって抽出された変更対象部分の信号からその包絡線に関する情報を取得する。置換用搬送波生成部94は、変更対象部分抽出部30によって抽出された変更対象部分の信号の搬送波成分とは別の置換用搬送波を生成する。包絡線情報適用部96は、包絡線情報取得部92によって取得された包絡線に関する情報を、置換用搬送波生成部94によって生成された置換用搬送波に対して適用する。部分変更部90は、適用後の新たな変更対象部分の信号を遅延調整部68に出力する。
【0071】
部分変更部90’が別の搬送波成分としてマスキーH'(t)に準じたノイズを使用する場合について説明する。
図6は、マスキーH'(t)に準じたノイズが使用される場合の部分変更部90’の機能および構成を示すブロック図である。部分変更部90’は、包絡線情報取得部92’と、置換用搬送波生成部94’と、包絡線情報適用部96’と、を含む。
【0072】
包絡線情報取得部92’は、変更対象部分抽出部30によって抽出された変更対象部分の信号から複数の周波数成分の大きさを取得する。この複数の周波数成分の各周波数は、包絡線(振幅成分)の周波数よりも高い周波数範囲で互いに異なるように選択される。特に、そのような周波数として、音声帯域である略300Hz〜5kHzの周波数範囲をオクターブバンドに分割し、各オクターブバンドを分割数n(nは自然数)で分割したときの1/nオクターブバンドの中心周波数が選択される。
【0073】
包絡線情報取得部92’は、第1バンドパスフィルタBPF1と、第2バンドパスフィルタBPF2と、第3バンドパスフィルタBPF3と、第1RMS回路RMS1と、第2RMS回路RMS2と、第3RMS回路RMS3と、を有する。ここでBPFはBand Pass Filterの略称であり、RMSはRoot Mean Squareの略称である。
図6は、音声帯域の1オクターブバンドをn=3分割する場合を示す。
図6はある1つのオクターブバンドに関連する部材を示し、他のオクターブバンドについては表示を省略する。なお、nは他の値であってもよい。
【0074】
第1バンドパスフィルタBPF1は中心周波数f1を有する1/3オクターブバンドパスフィルタであり、変更対象部分抽出部30によって抽出された変更対象部分の信号をバンドパスフィルタ処理する。第1RMS回路RMS1は、第1バンドパスフィルタBPF1によってバンドパスフィルタ処理された信号の実効値に応じたDC電圧、例えば実効値が大きいほど高くなるDC電圧を生成する。
【0075】
第2バンドパスフィルタBPF2、第3バンドパスフィルタBPF3は第1バンドパスフィルタBPF1と異なる中心周波数を有するが、それ以外は第1バンドパスフィルタBPF1と同様の構成を有する。第1バンドパスフィルタBPF1の中心周波数f1、第2バンドパスフィルタBPF2の中心周波数f2、第3バンドパスフィルタBPF3の中心周波数f3はそれぞれ異なる。上記の通り、中心周波数f1、f2、f3は、略300Hz〜5kHzの周波数範囲から、信号抽出において欠落する帯域幅が無いように、即ち、隣接帯域同士(fiとfi±1)がほぼ繋がるように選択される。また、各中心周波数fiは必ずしも等間隔である必要はなく、それぞれのフィルタの中心周波数と帯域幅が上記の条件を満たすように選べば良い。第2RMS回路RMS2、第3RMS回路RMS3は第1RMS回路RMS1と同様の構成を有する。
【0076】
置換用搬送波生成部94’は、PNG/FM生成部98と、第4バンドパスフィルタBPF4と、第5バンドパスフィルタBPF5と、第6バンドパスフィルタBPF6と、を有する。ここでPNGはPink Noise Generatorの略称であり、FMはFrequency Modulationの略称である。
【0077】
PNG/FM生成部98は、置換用搬送波生成部94’の音源(信号源)として機能し、ピンクノイズまたは深いFM変調をかけた正弦波を生成する。第4バンドパスフィルタBPF4は第1バンドパスフィルタBPF1と同じ中心周波数f4(=f1)を有し、PNG/FM生成部98によって生成された信号をバンドパスフィルタ処理する。第5バンドパスフィルタBPF5は第2バンドパスフィルタBPF2と同じ中心周波数f5(=f2)を有し、PNG/FM生成部98によって生成された信号をバンドパスフィルタ処理する。第6バンドパスフィルタBPF6は第3バンドパスフィルタBPF3と同じ中心周波数f6(=f3)を有し、PNG/FM生成部98によって生成された信号をバンドパスフィルタ処理する。
【0078】
以上は中心周波数f1、f2、f3がそれぞれ中心周波数f4、f5、f6に等しい例で説明したが、総合的な撹乱効果を挙げるため、対応する中心周波数を異ならせてもよい。あるいはまた、各中心周波数をそれぞれf1=f6、f2=f5、f3=f4、などのように異なるもの同士を対応させるようにしてもよい。
また、中心周波数f4、f5、f6に対応する各バンドパスフィルタの帯域幅は必ずしも抽出側のバンドパスフィルタの中心周波数f1、f2、f3のそれぞれと等しくする必要はない。また、周波数マスキングを確実にするため、帯域幅を広めに選び各バンドパスフィルタが周波数軸上でオーバーラップするように選んでも良い。抽出側のバンドパスフィルタの中心周波数f1、f2、f3が均等でなくてもよいことは上述のとおりである。
【0079】
包絡線情報適用部96’は、包絡線情報取得部92’によって取得された各周波数成分が大きいほど、置換用搬送波生成部94’によって生成された置換用搬送波の対応する周波数成分を大きくする。
包絡線情報適用部96’は、第1VCA回路VCA1と、第2VCA回路VCA2と、第3VCA回路VCA3と、加算器99と、を有する。ここでVCAはVoltage Controlled Amplifierの略称である。
【0080】
第1VCA回路VCA1は電圧制御型増幅器であり、第1RMS回路RMS1によって生成されるDC電圧を制御電圧とし、第4バンドパスフィルタBPF4によってバンドパスフィルタ処理された信号を増幅する。第1VCA回路VCA1では、制御電圧が高いほど増幅率が高くなるよう設定される。第2VCA回路VCA2も電圧制御型増幅器であり、第2RMS回路RMS2によって生成されるDC電圧を制御電圧とし、第5バンドパスフィルタBPF5によってバンドパスフィルタ処理された信号を増幅する。第2VCA回路VCA2では、制御電圧が高いほど増幅率が高くなるよう設定される。第3VCA回路VCA3も電圧制御型増幅器であり、第3RMS回路RMS3によって生成されるDC電圧を制御電圧とし、第6バンドパスフィルタBPF6によってバンドパスフィルタ処理された信号を増幅する。第3VCA回路VCA3では、制御電圧が高いほど増幅率が高くなるよう設定される。
【0081】
加算器99は、第1VCA回路VCA1によって増幅された信号と第2VCA回路VCA2によって増幅された信号と第3VCA回路VCA3によって増幅された信号とを足し合わせる。部分変更部90’は、加算器99によって足し合わされた信号を出力部72に出力する。出力部72はこの信号を第5音信号S5として、第1パワーアンプ110を介して第1スピーカ112に出力する。第1スピーカ112はその第5音信号S5を音声に変換して出力する。結果として得られたマスカーH(t)はマスキーH'(t)に重畳して受聴されるが、そのスペクトルはマスキーH'(t)に近く包絡線も類似するため効果的な情報撹乱が可能となる。
【0082】
また、1オクターブバンドを分割するバンドパスフィルタの数n(マスキーH'(t)の分割数nでもある)は、
図7のように決定する。
図7は、認識率γと分割数nとの関係を模式的に示すグラフである。
図7の横軸は1/nを示し、縦軸は認識率γ(%)を示す。認識率γ(%)は、マスカーH(t)または「マスキーH'(t)+マスカーH(t)」受聴の状態での、自立語の認識率(評価対象発話内で正しく認識された自立語数÷全自立語数×100)を充てる。分割数nは、例えば
図7において認識率γ(%)が最低になるように決定する。
【0083】
図7について、nが小さいと各バンドパスフィルタの帯域幅は拡がりマスカーH(t)は雑音に近づく。したがって、マスキーH'(t)との差異が大きくなり区別されやすくなる(情報撹乱が機能せず認識率γは上昇する)。一方、nが十分に大きいと、マスカーH(t)はマスキーH'(t)と意味内容的に区別がつかなくなる程度まで重なって認識率γは100%に近い値となる。したがって、マスカーH(t)がマスキーH'(t)から僅かに外れた領域で最も両者の区別がされにくくなり、認識率γが下がり撹乱効果は極大となる。この時、すなわち認識率が極小となるnの値をnの最適値とする。周波数マスキング理論に従えば、臨界帯域幅Δf(純音を有効にマスクする雑音の帯域幅)は1/4〜1/3オクターブとされており、nをこれに準じた値としてもよい。
【0084】
図6では、部分変更部90’が別の搬送波成分としてマスキーH'(t)に準じたノイズを使用する場合について説明したが、上記の通り別の搬送波成分としては他に累積本人原音声、変調ノイズ、同性/異性の他人音声、「ヘリウム音声」、或いは上述したHSL雑音などを使用してもよい。
累積本人原音声は、過去に発声された本人の原音声データを蓄積したものであり、本人が現在発話中の音声のスペクトルをカバーするようなスペクトルの信号源として用いられる。
変調ノイズが使用される場合は、置換用搬送波生成部94において、フィルタ(バンドパスフィルタ)を用いる替わりにその中心周波数に等しい正弦波に周波数変調をかけて置換用搬送波とする。この場合、バンドパスフィルタの数を半減できる利点がある。
累積本人原音声の替わりに、同性/異性の他人音声を用いれば本人原音声に準じる効果を得ながら本人原音声を累積するプロセスを省略することができるので、原音声発話/会話の初期時点から音声情報撹乱を機能させることができる。また、HSL雑音の場合はピンクノイズに準ずるが音声信号から生成しているので、聴覚的により自然である、という利点がある。
【0085】
ヘリウム音声は、ヘリウムを多量に含む空気を吸って発声したときの変形音声を電子的/ソフトウエア的に発生する技術、またはそれを元に戻すためのフォルマント変換処理技術により生成される音声であり、これを用いた場合、上記と同様の効果が期待できる。
【0086】
図4に戻る。
出力部72は、部分変更部90からは新たな変更対象部分の信号を、変更対象部分抽出部30からは変更対象部分でない信号を、取得する。出力部72は、それらをアナログ信号に変換し、第1パワーアンプ110を介して第1スピーカ112に出力する。出力部72は、遅延調整部68と、D/A部70と、を含む。
【0087】
遅延調整部68は、新たな変更対象部分の信号と変更対象部分でない信号とをつなぎ合わせて出力すべき出力音信号を生成する。遅延調整部68は、出力音信号が出力部72から出力されるタイミングを、マスキーH'(t)の伝搬にかかる時間に応じて調整する。特に遅延調整部68は、出力音信号に対して所定の遅延を与える。この遅延は、受聴者8位置におけるマスキーH'(t)に対するマスカーH(t)の遅れがマスキーH'(t)とマスカーH(t)とが実質的に実時間と言える程度の範囲内に収まるように設定される。
【0088】
マスキーH'(t)とマスカーH(t)とが実質的に実時間であることは、例えばマスキーH'(t)とマスカーH(t)とが第2ブース104内で少なくとも部分的に重畳することである。あるいはまた、出力部72から出力された変更対象部分の信号が第1スピーカ112によって音声に変換され、その変換された音声が、マスキーH'(t)が第2ブース104内で受聴されている間に第2ブース104に出力されることである。あるいはまた、出力部72から出力された変更対象部分の信号が第1スピーカ112によって音声に変換され、その変換された音声が、当該変更対象部分の信号に対応するマスキーH'(t)の部分が第2ブース104内で受聴されている間に第2ブース104に出力されることである。これは言い換えると、変更対象部分の信号に対応するマスキーH'(t)の部分と、当該変更対象部分の信号に対応するマスカーH(t)の部分とが第2ブース104内で少なくとも部分的に重畳することである。
【0089】
音響システム100を導入する際、マイクおよびスピーカの位置は決まり、想定される顧客の位置および想定される受聴者の位置もある程度は決まる。また、SDコントローラ部SDにおける処理時間もある程度見積もることができる。したがって、音響システム100の導入時に、顧客から受聴者へのマスキーH'(t)の伝搬時間およびマスカーH(t)の伝搬時間をある程度見積もることができる。遅延調整部68における遅延は、受聴者位置におけるマスキーH'(t)に対するマスカーH(t)の遅れの所望値から逆算して設定される。
【0090】
マスキーH'(t)に対するマスカーH(t)の遅れが大きいと、受聴者位置においてエコーや残響が生じる虞がある。したがって、遅延調整部68は、受聴者位置におけるマスキーH'(t)に対するマスカーH(t)の遅れがそのような違和感を生じさせない程度の値となるような遅延を出力音声信号に対して与える。この遅延は実験により定められるが、代表的には数100msec以下である。
【0091】
また、マイク、スピーカ、顧客、受聴者の位置関係によっては、遅延調整部68で遅延を付与しないとした場合でもマスカーH(t)がマスキーH'(t)よりもかなり遅く受聴者位置に到達することもある。この場合、マスキーH'(t)とマスカーH(t)とを受聴者位置で実質的に実時間で合成して情報隠蔽を行うためには、SDコントローラ部SDでのSD処理時間を短縮しなければならない。この時間的な制約の存在、つまりSD処理時間を短縮しなければならないことにより、処理の精度を犠牲にしなけらばならない場合もある。しかしながら本実施の形態の目的は音声の明瞭度・了解度の低減にあり、想定/予定した処理自体の正確さが目的ではない。したがって本実施の形態では、マスカーH(t)の重畳によりマスキーH'(t)の意味内容が理解し難くなるという条件が満たされれば処理の精度は大きな問題とはならない。これは「意味内容が理解し難くなるという条件」は無数にあるからである。
【0092】
D/A部70は、遅延調整部68によって遅延が付与された出力音信号を、第1スピーカ112を駆動するためのアナログの第5音信号S5に変換して第1パワーアンプ110に出力する。
第1スピーカ112から第2音変更ユニット116に至るまでの音および音信号の流れは、
図3およびそれに関連して説明されたものと同様である。第2音変更ユニット116の構成は、
図3、
図4、
図5、
図6、
図7およびそれに関連して説明された構成と同様である。
【0093】
第1顧客側マイク106aおよび第1相談員側マイク106bを第1集音ユニット、第2顧客側マイク114aおよび第2相談員側マイク114bを第2集音ユニットと見るとき、本実施の形態に係る音響システム100では、第1集音ユニット、第1音変更ユニット108、第1スピーカ112、第2集音ユニット、第2音変更ユニット116、第2スピーカ120、と回って再度第1集音ユニットに帰る音のループが形成される。しかしながら、音響システム100では、第1伝達経路134の経路長と第2伝達経路136の経路長とを略同一とし、さらに第1音信号S1と第2音信号S2との差に対応する差分音信号ScをSDコントローラ部SDに入力する。したがって、上記ループのなかの第2スピーカ120から第1音変更ユニット108に至る部分での減衰の度合いが強化される。その結果、上記ループに起因するハウリングやエコーを抑制できる。一方、第1顧客126や第1相談員124の発話音声は第1集音ユニットによってほぼ減衰されることなく集音され、SDコントローラ部SDに入力される。したがって、SDによる音声の明瞭度・了解度の低減効果は維持される。すなわち、音響システム100では、効果的な会話内容の隠蔽・遮断を実現しつつ、ハウリングやエコーを抑制できるのである。
【0094】
また、本実施の形態に係る音響システム100では、上記ループのなかの第1スピーカ112から第2音変更ユニット116に至る部分での減衰の度合いも同様に強化される。したがって、ハウリングやエコーの抑制効果はより高められている。会話内容を他人に知られないようにする
図2に示されるようなシステムでは、必然的にスピーカ−エア−マイクの部分が2つできる。本実施の形態では、そのような部分を両方とも利用して、より効果的にハウリングやエコーの抑制を実現している。
【0095】
2人以上の話者が会話をする空間にマスキングシステムを導入して会話内容の漏洩を抑える場合、複数人に対して1つのマイクを設けるのでは、話者の会話音をS/N良く収音することは難しい場合が多い。
【0096】
例えば、打合せスペースや銀行の相談カウンターでは、向かい合う話者の間に、作業用のカウンターや机などが設置してあり、ある程度の距離をおいて話者が向かい合わせに位置している。あるいはまた、会議スペースなどで大きな机の周りなどに多くの人がいる場合もある。これらの場合に、1つのマイクを設けるのでは、各話者から均等な距離にそのマイクを設置する必要があり、周囲の雑音なども含まれるため、会話音を効率よく収音することが難しい。
【0097】
テーブル上で向かい合った話者同士の場合では、テーブルは説明や作業のために書類を広げるのに使用されたりするので、テーブルの上にマイクを設置することはあまり現実的ではない。したがって、効率よく集音できるマイクの設置場所は比較的少ない。会議室などの大きなスペースなどでは、マイクを各話者から均等な位置に配置すれば音声が均等に入ってくるが、話者から遠いため話者の発話レベルが小さくなるとともに周辺の雑音を拾うので、S/Nが小さくなってしまう。
【0098】
そこで本実施の形態に係る音響システム100では、複数のマイクを使用し、各マイクを対応する各話者の想定位置の近傍に配置する。これにより、S/Nが良い状態で各話者の会話音を集音できる。
【0099】
本発明者は、スピーカから等距離に配置された2つのマイクを逆位相で接続し、スピーカからの音を収録する実験を行った。
図8は、スピーカ166からの音を収録する実験の実験系を示す模式図である。
図9は、
図8に示される実験系で行った実験結果を示す周波数スペクトルである。
図9において、マイク168を1つのみ使用した場合に、そのマイク168によって生成される信号の周波数スペクトル170は最も大きい。スピーカ166から同一距離(1.1m)にマイク172とマイク174とを設け、それらのマイク間を80cm程度とし、マイク172によって生成される信号とマイク174によって生成される信号とを逆位相で接続する場合、そのような接続により得られる信号の周波数スペクトル176は周波数スペクトル170と比較して低減されている。一方、話者からの音声は直近のマイクに大きなレベルで入力されるので他方のマイクからの逆相・低レベルの信号が重畳してもほとんど影響をしない。2つのマイク178、180を同じ場所にスピーカ166に向けて配置した場合、周波数スペクトル182はさらに低減される。2つのマイク184、186を同じ場所に対向させて配置した場合、周波数スペクトル188はさらに低減される。
【0100】
上記実験結果によると、1本のマイクに比べて、2本のマイクを逆位相でつないだ場合に(チャンネル当たり)4〜8dB程度の低減が見られる。これは、スピーカ166からの音が逆位相でつながることによりキャンセルされてループゲインが低減していることを示している。
【0101】
本実施の形態の適用例として、例えば、銀行などの相談スペースなどにおいて、衝立部分にスピーカを設置し、マイクを銀行員(マイク1)と来客(マイク2)のそれぞれの近傍に設置し、スピーカから等距離に設置する。
スピーカからマイクへ伝達される音は、等距離なので同振幅・同位相でマイク1とマイク2とに入力される。マイク1とマイク2の信号は、同振幅であるがトランスによって、逆位相でシステムに入力されるので、信号としてはキャンセルされた形で合成信号レベルが低減して入力される。
【0102】
しかしながら、話者の音声の場合の入力信号については異なる。例えば、通常、来客近傍(机上面近く)のマイク2から来客の口(信号発生源)までの距離は40cm程度である。行員側のマイク1へは、机をはさんで設置してあるので来客からは120cm程度ある場合がある。つまり、来客からマイク2への入力レベルを55dB程度とすると、来客からマイク1へは約3倍の距離があるので、来客からマイク1への入力レベルは、逆2乗則よりマイク2の入力レベルより9.5dB程度低くなる。したがって、来客からのマイク1への入力はほとんど無視できるレベルまで低減することになる。かつ振幅も異なり、位相も異なるので来客からの2本のマイクへの入力は、マイク2のレベルが優勢となりマイク1への入力はほとんどないので、信号的にもキャンセルされず、マイク2の信号レベルがそのままほとんどシステムに入力されることとなる。行員側のマイク1にも同様のことが言える。
【0103】
このようなマイクシステムを使用することにより、ハウリングやエコーの原因となるスピーカからの信号レベルは低減され、かつ、各マイクは各話者近傍に配置されるためシステムへの入力信号は各話者近傍のマイク信号が優位に入力されることとなり、話者の音声を効率良く収音することができる。
【0104】
また、1つのスピーカ−エア−マイク系で4〜8dBの低減となるが、もう1つのスピーカ−エア−マイク系を合わせると、全体では倍の8〜16dBの低減効果が得られる。ループは8の字に隣接2系統で発生するからである。
【0105】
なお、第1顧客側マイク106aおよび第1相談員側マイク106bは、第1伝達経路134の経路長と第2伝達経路136の経路長とが可聴域の音の波長と比較して略等しくなるように配置されればよい。一般的な可聴域である500Hzから3kHzは波長にして11cm〜68cm程度に相当する。したがって、多くの場合、マイクの設置位置の許容誤差は数ミリ程度であり、このレベルであれば設置者は問題なくマイクの位置合わせを行うことができる。
【0106】
また、本実施の形態に係る音響システム100では、第1伝達経路134の経路長と第2伝達経路136の経路長とは略等しくされる。これらが異なる場合、第7音信号S7と第10音信号S10との間にはその経路長の差に応じた位相差が生じる。そしてこの位相差は音の周波数に依存する。したがって、音の周波数の帯域分だけ位相差に幅が生じ、第7音信号S7と第10音信号S10との差をとったとしても、それらを打ち消し合うことが難しくなる。したがって、第1伝達経路134の経路長と第2伝達経路136の経路長とを略等しくすると、このような音の周波数によって変動する位相差が実質的に生じなくなるので、好適である。
【0107】
また、本実施の形態に係る音響システム100によると、会話の存在そのものの隠蔽や抹消ではなく、その内容、つまり会話音声に含まれる情報が隠蔽される。この点に関し本発明者は以下を認識した。
オープンプランのオフィスや銀行や証券会社のロビーカウンター、特に簡易パーティションにより仕切られた接客カウンターなどでは、会話している人以外の人にその会話の中身を理解不能とすれば、会話内容の隠蔽という点では十分にその目的が果たされる。つまり会話の内容さえ漏れなければ音声そのものは聞こえてもよい。むしろ発話者の存在が視認できる場合などは、音声のスペクトルや包絡線(音質やイントネーション、抑揚)が保存されたほうが自然である。本実施の形態に係る音響システム100は、以上の視点・ニーズに対応し、より自然な形で会話内容を隠蔽する。
【0108】
本実施の形態に係る音響システム100によると、変更対象部分抽出部30によって抽出された変更対象部分の信号の搬送波成分とは別の搬送波成分に、当該変更対象部分の信号の包絡線情報が適用される。したがって、結果として生成されるマスカーH(t)のアーティキュレーションはマスキーH'(t)のそれと類似し、受聴者の違和感は軽減される。さらに上記
図7に関して説明したように、マスカーH(t)とマスキーH'(t)との差異は情報攪乱効果がちょうど大きくなる程度の差異となり、効果的な会話内容の隠蔽が実現されうる。
【0109】
本実施の形態に係る音響システム100によると、変更対象部分抽出部30において、略1山状の信号が変更対象部分の信号として抽出される。したがって、マスキーH'(t)の信号レベルが小さい部分で切り取りや貼り付けが行われるので、SD処理によるクリック雑音などが低減される。すなわち、マスキーH'(t)が時間的に連続であればマスカーH(t)もほぼ連続となるので、一定時間で区画する場合には生じうる遮断部分におけるクリック雑音や、その低減を目的とした窓掛け処理による包絡線形状の崩壊(イントネーションの崩壊)も生じにくい。
【0110】
(第2の実施の形態)
第1の実施の形態ではマイクを2つ設けることで2つの音の伝達経路を設けたが、第2の実施の形態ではスピーカを2つ設けることで2つの音の伝達経路を設ける。
図10は、第2の実施の形態に係る音響システムの一部を示す模式的な斜視図である。本実施の形態に係る音響システムでは、1つのマイク250に対して、2つのスピーカ252、254を略等距離の位置(あるいは、マイク250に対し物理的条件ができるだけ相似になる位置)に設置する。2つのスピーカ252、254はいずれも衝立260に取り付けられる。
【0111】
音響システムは、第2ブース104に出力されるべくSDにより処理された音信号から、互いに実質的に逆位相となる2つの音信号を生成し、生成された2つの音信号のうちの一方を一方のスピーカ252に、他方を他方のスピーカ254に、それぞれ出力する信号分配部264を備える。信号分配部264は、第1音変更ユニット108(
図10では不図示)と2つのスピーカ252、254との間に設けられる。2つのスピーカ252、254および信号分配部264は音出力ユニットを形成している。2つのスピーカ252、254は実質的に逆位相の音を出力する。
【0112】
マイク250と一方のスピーカ252との間の音の第5伝達経路256は、マイク250と他方のスピーカ254との間の音の第6伝達経路258と経路長が略等しいので、マイク250には位相が実質的に逆となる2つの音が入力される。したがって、マイク250には、2つのスピーカ252、254からの音は信号的にはキャンセルされた形で入力される。
【0113】
本実施の形態に係る音響システムによると、第1の実施の形態に係る音響システム100によって奏される作用効果のうち、ハウリングやエコーの抑制に係る作用効果およびSDに係る作用効果と同様の作用効果が奏される。
【0114】
以上、実施の形態に係る音響システムについて説明した。これらの実施の形態は例示であり、その各構成要素や各処理の組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。また、実施の形態同士の組み合わせも可能である。
【0115】
第1の実施の形態では、音声トランス160が第1音信号S1と第2音信号S2との差に対応する差分音信号Scを生成する場合について説明したが、これに限られず、第1音信号S1と第2音信号S2との差に対応する信号を生成する他の電子回路が使用されてもよい。あるいはまた、第1音信号S1および第2音信号S2をデジタル化し、デジタル化されたそれらの信号を減算回路に入力してもよい。
【0116】
第1および第2の実施の形態において、反射による音の伝達の影響を低減するため、ブースの天井を高くするか、もしくは天井に吸音性のある材料を設置してもよい。あるいはまた、衝立の高さを高くしてもよい。あるいはまた、衝立を長くして、音声の回り込みの距離を多く取るなど、スピーカとマイクとの間の物理的な条件が等しく、かつブースの壁などからの反射音や残響音などの影響を低減する、などの対策を施してもよい。
【0117】
第1および第2の実施の形態において、ハウリングやエコーをさらに低減させるために、グラフィックイコライザ、パラメトリックイコライザ、ローカットフィルタ+バンドエリミネーションフィルタ+ハイカットフィルタ、などをループ中に挿入してもよい。
【0118】
第1および第2の実施の形態において、ラインマイクや指向性マイクなど指向性のあるマイクを使用してもよい。
【0119】
第1の実施の形態では、スピーカ1つに対してマイク2つを設ける場合について説明したが、これに限られない。例えば、キャンセルアウト対象の2系統の各一でマイクの数自体は何本に増えてもよく、またこの2系統のペアは何系統に増えてもよい。この場合、対象空間や収音エリアが広い場合に対応できる。それぞれのマイク、あるいは系統は電子的に加算され、スピーカ1つに対してマイク2つを設ける場合とと等価になる。また、第2の実施の形態についても同様である。
【0120】
第1および第2の実施の形態では、音響システム100を主に銀行の相談カウンターに適用する場合について説明したが、これに限られない。例えば、話者同士が下記のような比較的オープンな空間にも音響システム100を適用できる。電話ブースや薬局、事務所などのパーティションで区切られた執務スペース、オープン会議スペース、証券や保険相談窓口、百貨店をはじめとする相談窓口、喫茶店や飲食店など。
【0121】
また、話者同士が下記のような個室的な区切られている空間においても会話音を漏らさないために音響システム100を使用することができる。役員室、病院診察室、会議室、貸しオフィス、宴会場、TV会議室、区切られた執務室など。
【0122】
また、音響システム100を、それぞれの話者がいるスペースと話者がいるスペース(Local-to-Local)や、話者がいるスペースと待合や廊下など不特定多数がいる可能性がある場所(Local-to-Public)などにも使用できる。また、オープンオフィスなどで必要が生じ衝立とともに実施する場合や、宴会場などが隣接する系など(Public-to-Public)にも使用できる。
【0123】
図11は、音響システム100を宴会場190に適用した場合の構成を示す模式図である。宴会場190はパーティション122によって2つの小宴会場190a、190bに仕切られる。音響システム100を導入することにより、一方の小宴会場190aにいる人は、他方の宴会場190bで行われている会話の内容を理解することが困難となる。また、ハウリングやエコーも十分に抑えられる。
【0124】
このように、実施の形態に係る音響システム100を、Local-to-Local、Local-to-Public、Public-to-Publicなどさまざまな空間形態で使用することができる。
すなわち、実施の形態に係る音響システム100は、複数の話者もしくは、電話によって音声による情報伝達を使用とする空間において、その空間の音声情報を限られた範囲内で通じるようにして、その範囲以外において意味がわからなくなるようにするものであるので、使用場所が限定されるものではない。
【0125】
第1および第2の実施の形態では、音響システム100が設けられる2つのブースは隣接している場合について説明したが、これに限られず、一方のブースまたは領域における会話音が他方のブースまたは領域にいる人に到達しうるのであれば、それらのブースは隣接していなくてもよい。
【0126】
第1および第2の実施の形態では、隣接する2つのブースに跨って音響システム100が設けられる場合について説明したが、ブースまたは領域の数は2つに限られない。例えば、3つ以上のブースまたは領域が設けられている系において、それらのなかの任意の2つのブースまたは領域に音響システム100を適用してもよい。
【0127】
第1および第2の実施の形態では、スピーカとマイクとの間の音の伝達経路が、スピーカとマイクとを直線で結ぶことにより得られる経路である場合について説明したが、これに限られない。例えば、スピーカとマイクとを結ぶ直線上に障害物が存在する場合は、その障害物を回り込む経路が伝達経路となる。