(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024154133
(43)【公開日】2024-10-30
(54)【発明の名称】マスキング装置
(51)【国際特許分類】
G10K 11/175 20060101AFI20241023BHJP
【FI】
G10K11/175
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2023067786
(22)【出願日】2023-04-18
(71)【出願人】
【識別番号】000003562
【氏名又は名称】東芝テック株式会社
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(72)【発明者】
【氏名】山口 雅夫
【テーマコード(参考)】
5D061
【Fターム(参考)】
5D061FF02
(57)【要約】
【課題】 人に与える不快感が少なく、人の声を目立たなくさせるマスキング装置を提供することである。
【解決手段】 実施形態に係るマスキング装置は、人の声をマスキングするための音データを記憶した記憶部と、音データから音響信号を生成する生成部と、音響信号に従ってマスキング音を出力する出力部とを有する。音データは、広帯域の連続音であって、音圧レベルのピークが1000Hz以下にあり、且つ、0Hz~3000Hzの音圧レベルをSPL1、3000Hz以上の音圧レベルをSPL2としたときに、SPL1-SPL2≦19dBである音を出力部から出力させるデータである。
【選択図】
図1
【特許請求の範囲】
【請求項1】
人の声をマスキングするための音データを記憶した記憶部と、
前記音データから音響信号を生成する生成部と、
前記音響信号に従ってマスキング音を出力する出力部とを有し、
前記音データは、広帯域の連続音であって、音圧レベルのピークが1000Hz以下にあり、且つ、0Hz~3000Hzの音圧レベルをSPL1、3000Hz以上の音圧レベルをSPL2としたときに、SPL1-SPL2≦19dBである音を前記出力部から出力させるデータである、マスキング装置。
【請求項2】
前記音データは、複数の周波数の過渡音を含む音を前記出力部から同時に出力させるデータである、
請求項1に記載のマスキング装置。
【請求項3】
前記音データは、前記過渡音のリバーブの長さが0.15秒以上となる音を前記出力部から出力させるデータである、
請求項2に記載のマスキング装置。
【請求項4】
前記出力部は、スピーカである、
請求項1から3までのいずれかひとつに記載のマスキング装置。
【請求項5】
前記音データは、人の声の周波数特性に近い周波数特性を有する音を前記出力部から出力させるデータである、
請求項1から3までのいずれかひとつに記載のマスキング装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、ワークプレイスに置かれるマスキング装置に関する。
【背景技術】
【0002】
オフィスなどでは他人の声により、ワーカーの集中力が低減し、知的生産性が低減する問題がある。
【0003】
また、病院、オフィスなどでは、個人情報や機密情報の会話が漏れるスピーチプライバシーの問題がある。
【0004】
これらの対策として、人の声を音でかき消すマスキング装置が知られている。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来のマスキング装置が出力する一般的なマスキング音としてホワイトノイズがある。しかし、ホワイトノイズで人の声を目立たなくさせるには、ホワイトノイズの音量を非常に大きくする必要がある。ホワイトノイズは、高周波成分にまで同じ音量で広がるため、人に非常に不快感を与える。
【0007】
本発明が解決しようとする課題は、人に与える不快感が少なく、人の声を目立たなくさせるマスキング装置を提供することである。
【課題を解決するための手段】
【0008】
実施形態に係るマスキング装置は、人の声をマスキングするための音データを記憶した記憶部と、音データから音響信号を生成する生成部と、音響信号に従ってマスキング音を出力する出力部とを有する。音データは、広帯域の連続音であって、音圧レベルのピークが1000Hz以下にあり、且つ、0Hz~3000Hzの音圧レベルをSPL1、3000Hz以上の音圧レベルをSPL2としたときに、SPL1-SPL2≦19dBである音を出力部から出力させるデータである。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態に係るマスキング装置の機能構成を示すブロック図である。
【
図2】
図2は、実施形態に係るマスキング装置のハードウェア構成を示すブロック図である。
【
図3】
図3は、男性の声の周波数特性と女性の声の周波数特性を示すグラフである。
【
図4】
図4は、
図3の人の声の周波数特性に、人の声をかき消す音圧レベルのホワイトノイズを併記したグラフである。
【
図5】
図5は、マスキング装置の出力部が出力するマスキング音に含まれる広帯域の連続音の周波数特性を示す図である。
【
図6】
図6は、マスキング装置の出力部が出力するマスキング音に含まれる過渡音の周波数特性を示す図である。
【
図7】
図7は、マスキング装置の出力部が出力するマスキング音の周波数特性を示す図である。
【
図8】
図8は、
図5に示す周波数特性の一部(10~11秒の時間範囲と0~4kHzの周波数範囲)を拡大して示す図である。
【
図9】
図9は、
図6に示す周波数特性の一部(10~11秒の時間範囲と0~4kHzの周波数範囲)を拡大して示す図である。
【
図10】
図10は、
図7に示す周波数特性の一部(10~11秒の時間範囲と0~4kHzの周波数範囲)を拡大して示す図である。
【
図11】
図11は、
図7に示すマスキング音の周波数特性を、3000Hzを境に2つの周波数領域に分けて示す図である。
【
図12】
図12は、
図11に示すマスキング音の0~3000Hzの周波数領域だけを取り出した周波数特性を示す図である。
【
図13】
図13は、
図11に示すマスキング音の3000Hz以上の周波数領域だけを取り出した周波数特性を示す図である。
【発明を実施するための形態】
【0010】
以下、実施形態に係るマスキング装置について図面を参照して説明する。
【0011】
(装置構成)
図1は、実施形態に係るマスキング装置10の機能構成を示すブロック図である。
図1に示すように、マスキング装置10は、機能構成として、記憶部11と、D/A変換部12と、増幅部13と、出力部14とを有する。
【0012】
記憶部11は、人の声をマスキングするための音データを記憶している。音データは、デジタル信号である。
【0013】
D/A変換部12は、記憶部11からデジタル信号の音データを読み取り、アナログ信号の音響信号に変換し、増幅部13へ出力する。
【0014】
増幅部13は、D/A変換部12から入力される音響信号を増幅して、出力部14へ出力する。
【0015】
D/A変換部12と増幅部13は、音データから音響信号を生成する生成部を構成する。
【0016】
出力部14は、増幅部13から入力される音響信号に従ってマスキング音を出力する。言い換えれば、出力部14は、音響信号を空気振動に変換して出力する。
【0017】
図2は、マスキング装置10のハードウェア構成を示すブロック図である。
図1に示すように、マスキング装置10は、ハードウェア構成として、ストレージ21と、プロセッサ22と、メモリ23と、スピーカ24とを有する。ストレージ21とプロセッサ22とメモリ23は、相互に信号の送受信が可能である。
【0018】
ストレージ21は、補助記憶装置であり、HDDやSSD等の不揮発性メモリで構成される。ストレージ21は、記憶部11を構成する。すなわち、ストレージ21は、人の声をマスキングするための音データを記憶している。ストレージ21はまた、プロセッサ22にD/A変換部12と増幅部13の機能を実行させるプログラムを記憶している。
【0019】
メモリ23は、主記憶装置であり、ROMとRAMを有する。ROMは、不揮発性メモリであり、起動プログラムを記憶している。RAMは、揮発性メモリであり、プロセッサ22の動作に必要なプログラムとデータを一時的に記憶する。
【0020】
プロセッサ22は、CPU等を含む汎用ハードウェアプロセッサで構成される。プロセッサ22は、ROM内の起動プログラムを実行することにより、ストレージ21とメモリ23を制御する。プロセッサ22はまた、ストレージ21からプログラムをRAMに読み込み実行することにより、D/A変換部12と増幅部13の機能を実行する。
【0021】
スピーカ24は、入力される電気信号を空気振動に変換する機器であり、マスキング音を出力する出力部14を構成する。
【0022】
(音データおよびマスキング音)
以下、マスキング装置10の記憶部11が記憶している音データについて説明する。言い換えれば、マスキング装置10の出力部14が出力するマスキング音について説明する。
【0023】
まず、人の声の周波数特性について説明する。
図3は、男性の声の周波数特性と女性の声の周波数特性を示すグラフである。横軸は周波数を表し、縦軸は音圧レベルを表す。
図3に示すように、人の声の周波数特性は、男性も女性も、低周波数領域において音圧レベルが大きく、高周波数領域において音圧レベルが小さい。簡単に言えば、人の声は、低周波数成分が大きく、高周波数成分が小さい。
【0024】
従来、マスキング音には、多くの場合、ホワイトノイズが使用される。ホワイトノイズは、周波数に依らず音圧レベルが一定の音である。
図4は、
図3の人の声の周波数特性に、人の声をかき消す音圧レベルのホワイトノイズを併記したグラフである。
図3に示す周波数特性の人の声をホワイトノイズでかき消すには、
図4に示すように、マスキング音の音圧レベルを、人の声の周波数特性のピーク程度まで大きくする必要がある。ホワイトノイズは、一定の音圧で高周波成分にまで広がっているので、そのようなホワイトノイズを、人は非常に不快に感じる傾向がある。
【0025】
次に、ホワイトノイズではないマスキング音について考える。ここでは、ある周波数にピーク有し、末広がりに広がる周波数特性のマスキング音について考える。
【0026】
図3に示すように、人の声は低周波数成分が高いため、高周波数成分が高い音をマスキング音として使用すると、低周波数領域の音に対するマスキング効果が小さくなり、人の声が目立ってしまう。よって、この音で低周波数領域の音を目立たなくさせようとすると、マスキング音の音量を大きくする必要があり、人が不快に感じやすいマスキング音になる。
【0027】
一方、人の声は高周波数成分も含んでおり、マスキング音の周波数分布が低周波数に偏ると、人の声が目立ってしまう。特に、女性の声は、男性の声よも高周波数成分が大きく、3kHz以上で音圧レベルが大きいので、より聞き取りやすくなる。
【0028】
図5と
図6と
図7は、実施形態に係るマスキング装置10が出力するマスキング音に関する音の周波数特性を示す図である。下段の周波数特性において、横軸は周波数を表し、縦軸は音圧レベルを表す。上段の周波数特性は、時間変化に伴う各周波数成分の音圧レベルを示し、横軸は時間を表し、縦軸は周波数を表す。
【0029】
図5は、マスキング装置10の出力部14が出力するマスキング音に含まれる広帯域の連続音の周波数特性を示す図である。
図5に示す広帯域の連続音の周波数特性は、
図3に示す人の声の周波数特性に似ている。このため、この広帯域の連続音は、人の声を目立たなくすることができる。
【0030】
図6は、マスキング装置10の出力部14が出力するマスキング音に含まれる過渡音の周波数特性を示す図である。
図6に示す過渡音の周波数特性も、
図3に示す人の声の周波数特性に似ている。このため、この過度音も、人の声を目立たなくすることができる。
【0031】
図7は、マスキング装置10の出力部14が出力するマスキング音の周波数特性を示す図である。マスキング音は、
図5に示す広帯域の連続音と
図6に示す過度音とを混ぜた音である。このため、マスキング音は、
図3に示す人の声の周波数特性に似ている。このため、マスキング音は、人の声を目立たなくすることができる。
【0032】
図8と
図9と
図10は、それぞれ、
図5と
図6と
図7に示す周波数特性の一部(10~11秒の時間範囲と0~4kHzの周波数範囲)を拡大して示す図である。
【0033】
図9において、過度音は、範囲Aに示すように、同時に出力される複数の周波数の音を含む。これにより、広帯域の周波数の声に対してマスキング効果が向上する。
【0034】
また、
図9において、過度音は、矢印Bで示すように、リバーブ(残響)が長い。このように、過度音を音楽の音のように途切れることなく出すことにより、マスキング効果が向上する。また、過度音がオルゴールのような音色になり、快適性が向上する。さらに、人の意識がオルゴールのような音色の音に向くことで、人の声がより気にならなくなる。
【0035】
図5と
図8に示す広帯域の連続音は、たとえば、自然音である。自然音とは、自然界で発生する音のことである。たとえば、自然音は、波の音、小川のせせらぎ、鳥のさえずり等である。自然音は、リラックス効果など、人の心身に好ましい影響を与えるものが好ましい。これにより、快適性がより向上する。
【0036】
【0037】
表1は、60dBの人の声が聞こえる環境で、マスキング音のピーク周波数をシフトさせつつ、マスキング音を聞いた人の印象を主観評価した結果を示す。ここで、マスキング音の音量は60dBで評価した。表1より、ピーク周波数が1000Hz以下であれば、人の声が目立たなく、且つ、マスキング音を聞いた人の印象も快適であり、望ましいことがわかる。
【0038】
図11は、
図7に示すマスキング音の周波数特性を、3000Hzを境に2つの周波数領域に分けて示す図である。
図11に示すように、マスキング音の0Hz~3000Hzの周波数領域の音圧レベルをSPL1、3000Hz以上の周波数領域の音圧レベルをSPL2とし、60dBの人の声が聞こえる環境において、SPL1-SPL2を変化させつつ、マスキング音を聞いた人の印象を主観評価した結果を表2に示す。ここで、マスキング音の音量は60dBで評価した。表2より、SPL1-SPL2≦19dBが望ましいことがわかる。
【0039】
【0040】
マスキング音の音圧レベルのより具体的な例を示す。マスキング装置10が出力するマスキング音の全周波数特性は、表2に示す主観評価の環境においては、音圧レベルは60dBである。
図12は、
図11に示すマスキング音の0~3000Hzの周波数領域だけを取り出した周波数特性を示す。この周波数領域における音圧レベルSPL1は59.9dBである。
図13は、
図11に示すマスキング音の3000Hz以上の周波数領域だけを取り出した周波数特性を示す。この周波数領域における音圧レベルSPL2は40.9dBである。したがって、SPL1-SPL2は19dBとなる。
【0041】
また、マスキング音を自然音だけ、過渡音だけ、および自然音+過渡音とした場合におけるマスキング効果の主観評価結果を表3に示す。この評価では、60dBの人の声が聞こえる環境で、各マスキング音も60dBとした。また、自然音+過渡音は、自然音を57dB、過渡音を57dBで、合成音が60dBになるようにした。表3より、自然音と過渡音を混ぜることでマスキング効果が大きくなる結果が得られた。
【0042】
【0043】
【0044】
表4は、過渡音のリバーブの長さに応じたマスキング効果の主観評価結果を示す。表4より、リバーブの時間が0.15sより長いと、マスキング効果が大きくなるとともに、オルゴールのような音色になり、快適性が向上する結果が得られた。リバーブの時間が長くして、過度音を音楽の音のように途切れることなく出すことにより、マスキング効果が向上する。
【0045】
以上に説明した評価結果を考慮し、実施形態に係るマスキング装置10の出力部14は、広帯域の連続音であって、音圧レベルのピークが1000Hz以下にあり、且つ、0Hz~3000Hzの音圧レベルをSPL1、3000Hz以上の音圧レベルをSPL2としたときに、SPL1-SPL2≦19dBである音を出力する。
【0046】
言い換えれば、記憶部11が記憶している人の声をマスキングするための音データは、広帯域の連続音であって、音圧レベルのピークが1000Hz以下にあり、且つ、0Hz~3000Hzの音圧レベルをSPL1、3000Hz以上の音圧レベルをSPL2としたときに、SPL1-SPL2≦19dBである音を出力部14から出力させるデータである。
【0047】
また、音データは、複数の周波数の過渡音を含む音を出力部14から同時に出力させるデータである。また、音データは、過渡音のリバーブの長さが0.15秒以上となる音を出力部14から出力させるデータである。また、音データは、人の声の周波数特性に近い周波数特性を有する音を出力部14から出力させるデータである。
【0048】
(効果)
このような構成とすることにより、実施形態に係るマスキング装置10は、人に与える不快感が少なく、人の声を目立たなくさせることができる。
【0049】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0050】
10…マスキング装置、11…記憶部、12…D/A変換部、13…増幅部、14…出力部、21…ストレージ、22…プロセッサ、23…メモリ、24…スピーカ。