(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023027416
(43)【公開日】2023-03-02
(54)【発明の名称】音声処理装置、音声処理方法および音声処理用プログラム
(51)【国際特許分類】
H04R 3/00 20060101AFI20230222BHJP
G10K 11/175 20060101ALI20230222BHJP
【FI】
H04R3/00 310
G10K11/175
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2019219466
(22)【出願日】2019-12-04
(71)【出願人】
【識別番号】518372305
【氏名又は名称】株式会社ティーオースウィング
(74)【代理人】
【識別番号】100105784
【弁理士】
【氏名又は名称】橘 和之
(72)【発明者】
【氏名】鈴木 理絵子
(72)【発明者】
【氏名】佐藤 靖
【テーマコード(参考)】
5D061
5D220
【Fターム(参考)】
5D061FF05
5D220AB04
5D220AB08
(57)【要約】
【課題】非可聴音と可聴音とを両立させ、相乗効果を提供できるようにする。
【解決手段】可聴音に対して非可聴音を所定の方法によって適用し、制御する。一例として、非可聴音の音圧と可聴音の音量とを適切に比較調整して融合音を作成する。別例として、非可聴音の音圧を可聴音の音量よりも大きくすることにより、非可聴音によって可聴音をマスキングし、可聴音を非可聴化する。非可聴音は、例えば40Hz以下の低周波音声である。非可聴音は、例えばパワースポットの自然音から作成されたものである。
【選択図】
図1
【特許請求の範囲】
【請求項1】
可聴音に対して非可聴音を所定の方法によって適用し、制御することを特徴とする音声処理装置。
【請求項2】
上記非可聴音は、40Hz以下の低周波音声であることを特徴とする請求項1に記載の音声処理装置。
【請求項3】
上記非可聴音は、パワースポットの自然音から作成されたものであることを特徴とする請求項1または2に記載の音声処理装置。
【請求項4】
上記非可聴音の音圧と上記可聴音の音量とを適切に比較調整して融合音を作成することを特徴とする請求項1~3の何れか1項に記載の音声処理装置。
【請求項5】
上記可聴音を人の耳に届け、上記可聴音に埋め込まれた上記非可聴音を深層振動として人の身体に届けることを特徴とする請求項1~4の何れか1項に記載の音声処理装置。
【請求項6】
上記非可聴音の音圧を上記可聴音の音量よりも大きくすることにより、非可聴音によって可聴音をマスキングし、上記可聴音を非可聴化することを特徴とする請求項1~3の何れか1項に記載の音声処理装置。
【請求項7】
請求項1~6の何れか1項に記載の処理を行うことを特徴とする音声処理方法。
【請求項8】
請求項1~6の何れか1項に記載の処理をコンピュータに行わせることを特徴とする音声処理用プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声処理装置、音声処理方法および音声処理用プログラムに関するものである。
【背景技術】
【0002】
従来、非可聴音(非可聴周波数帯域の低周波音声)は、騒音の一種とされ、その防音または制振に関する研究および技術開発がなされてきた。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明は、非可聴音と可聴音とを両立させ、相乗効果を提供できるようにすることを目的とする。
【課題を解決するための手段】
【0004】
上記した課題を解決するために、本発明では、可聴音に対して非可聴音を所定の方法によって適用し、制御する。
【発明の効果】
【0005】
上記のように構成した本発明によれば、非可聴音と可聴音とを両立させ、相乗効果を提供することができる。
【図面の簡単な説明】
【0006】
【
図1】可聴音と非可聴音(深層振動)との融合について説明する図である。
【
図2】本実施形態の第1の応用例を説明する図である。
【
図3】本実施形態の第1の応用例を説明する図である。
【
図4】本実施形態の第2の応用例を説明する図である。
【
図5】可聴音と非可聴音とを融合させて成る融合音と、非可聴音を融合させていない可聴音との違いを説明する図である。
【
図6】パワースポットの自然音から非可聴音を得ることについて説明する図である。
【
図7】パワースポットの自然音を活用した本実施形態の第1の応用例を説明する図である。
【
図8】様々なパワースポットで採取した自然音の分析結果を示す図である。
【
図9】様々なパワースポットで採取した自然音の分析結果を示す図である。
【
図10】本実施形態による融合音をスマートフォンから出力したときの波形を示す図である。
【
図11】本実施形態による融合音をテレビから出力したときの波形を示す図である。
【発明を実施するための形態】
【0007】
以下、本発明の一実施形態を図面に基づいて説明する。本実施形態の音声処理装置、音声処理方法または音声処理用プログラムでは、可聴音に対して非可聴音(非可聴周波数帯域の低周波音声。本実施形態では、これを深層振動とも呼ぶ)を所定の方法によって適用し、制御する。非可聴音は、例えば40Hz以下の低周波音声である。
【0008】
図1は、可聴音と非可聴音(深層振動)との融合について説明する図である。以下では、可聴音と非可聴音とを融合した音声を「融合音」という。
【0009】
図2および
図3は、本実施形態の第1の応用例を説明する図である。
図2に示すように、人は、可聴音を耳から受け、当該可聴音に埋め込まれた非可聴音を深層振動として身体で受ける。ここで、非可聴音の音圧と可聴音の音量とを適切に比較調整して融合音を作成することにより、
図3に示すように、低周波音から発生する倍音が可聴音に付加され、音質がクリアで豊かになる。
【0010】
また、低周波音のエネルギーを利用して可聴音を遠くまで伝達することが可能となる。これを利用して、防災音声をより遠くまで届けたり、コンサート会場で演奏音や歌唱音を聴者に対してより強く響くように届けたりすることが可能である。
【0011】
また、深層振動を人間の身体に当てることにより、自律神経系の変化(リラックスまたは興奮)を促したり、人間の肉体的状態または精神的状態の改善または悪化抑止を誘起させたりすることも期待でき、その他様々な分野に本実施形態の融合音を応用することが可能である。
【0012】
図4は、本実施形態の第2の応用例を説明する図である。
図4では、公知技術であるサウンドマスキングやノイズキャンセリングと、第2の応用例である音声マスキングとの違いを示している。本実施形態の音声マスキングでは、非可聴音の音圧を可聴音の音量よりも大きくすることにより、音声(例えば、環境ノイズ)を消す(非可聴化する)ことが可能である(非可聴音が可聴音をマスクすることによる消音)。
【0013】
可聴音に融合する非可聴音の音圧が小さい場合は、非可聴音を加えた後の融合音は全体的にレベルが下がり、いわゆるサウンドマスキングが生じる。これに対し、非可聴音の音圧を上げていくと、非可聴音が融合音の全体の音圧を上げて、可聴音に倍音が加えられて音がクリアになる。さらに非可聴音の音圧を上げて、非可聴音の音圧が可聴音の音量より大きくなると、非可聴音によって可聴音が完全にマスキングされるので、無音化する。このようなことが可能なのは、非可聴音だからである。
【0014】
図5は、可聴音と非可聴音とを融合させて成る融合音と、非可聴音を融合させていない可聴音との違いを説明する図である。
図5では、周波数と振幅との対応関係を示した周波数スペクトルと、音声の波形を解析して作成したグラフとを示している。音声波形の解析は、例えば以下のようにして行う。まず、音声波形を複数の等区間に分割し、複数の等区間のそれぞれにおいて2種類の触質特徴量を算出する。そして、当該2種類の触質特徴量をそれぞれ座標軸とする座標空間上に、2種類の触質特徴量の組み合わせに基づく座標位置をマッピングすることによってグラフを作成する。2種類の触質特徴量は、例えば、WO2018/211767号公報に記載の方法によって算出する。
【0015】
本実施形態の非可聴音は、自然界に存在する音を解析することによって得ることが可能である。例えば、
図6に示すように、いわゆる「パワースポット」において発生している自然音の中には非可聴音が含まれている。このパワースポットの自然音を音響分析することにより、本実施形態の深層振動として使える非可聴音を得ることが可能である。
【0016】
パワースポットの自然音を解析したところ、人間の耳には聞こえない低域の音が強く出ていることが分かった。低域の音は身体を揺らすので、身体の揺れを伴い、景色を見たり、自然音を聞いたりするのが感動に繋がっている。本実施形態では、このようなパワースポットの自然音から作成した非可聴音を使って融合音を作成することも可能である。
【0017】
この場合、ユーザは、
図7に示すように、パワースポットの自然音を耳から受けると同時に、パワースポットの深層振動を身体で受けることができる。これにより、パワースポット以外の場所で、あたかもパワースポットにいるようなリアルな体験を楽しむことができる。融合音を聞くと同時に、パワースポットで撮影した映像を観ることにより、パワースポットでの感動的な体験を遠隔地に居ながら得ることも可能である。
【0018】
図8および
図9は、様々なパワースポットで採取した自然音の分析結果を示す図である。
図8では、様々なパワースポットで採取した自然音の周波数スペクトルを示している。
図9では、様々なパワースポットで採取した自然音から作成した非可聴音の波形に対して
図5と同様の解析を行うことによって作成したグラフを示している。電子的に作られた低周波音声と比べて、自然界に存在する自然音から作成した低周波音声は、触質が豊かであることが
図9のグラフから見て取れる。
【0019】
図10は、本実施形態による融合音をスマートフォンから出力したときの波形を示した図である。
図11は、本実施形態による融合音をテレビから出力したときの波形を示した図である。本実施形態の非可聴音は、スマートフォンからでもテレビからでも出力することができる。もちろん、他の電子機器から出力することも可能である。
【0020】
以上詳しく説明したように、本実施形態によれば、非可聴音と可聴音とを両立させ、相乗効果を提供することができる。
【0021】
なお、上記実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。