(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-15
(54)【発明の名称】オーディオノイズ低減方法及びシステム
(51)【国際特許分類】
G10L 21/0232 20130101AFI20231208BHJP
G10L 21/0208 20130101ALI20231208BHJP
【FI】
G10L21/0232
G10L21/0208 100B
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023533790
(86)(22)【出願日】2020-12-28
(85)【翻訳文提出日】2023-06-01
(86)【国際出願番号】 CN2020140214
(87)【国際公開番号】W WO2022140927
(87)【国際公開日】2022-07-07
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】514156013
【氏名又は名称】深▲セン▼市韶音科技有限公司
【氏名又は名称原語表記】SHENZHEN SHOKZ CO.,LTD.
【住所又は居所原語表記】Floors 1-4,Factory Building 26,Shancheng Industrial Park,Shiyan Street,Bao’an District,Shenzhen,Guangdong 518108,CHINA
(74)【代理人】
【識別番号】100205936
【氏名又は名称】崔 海龍
(74)【代理人】
【識別番号】100132805
【氏名又は名称】河合 貴之
(72)【発明者】
【氏名】鄭 金波
(72)【発明者】
【氏名】周 美林
(72)【発明者】
【氏名】廖 風云
(72)【発明者】
【氏名】齊 心
(57)【要約】
本明細書によるオーディオノイズ低減方法及びシステムは、オーディオ信号の周波数を単位とし、周波数に関連するパラメータに基づいて、各周波数ユニットに対応する利得係数を生成し、利得係数を用いて各周波数ユニットに対してそれぞれ利得処理を行うことができる。前記方法及びシステムは、有効なオーディオ信号をより多く含む周波数ユニットに対応する利得係数を大きくし、有効なオーディオ信号をより少なく含む周波数ユニットに対応する利得係数を小さくして、有効なオーディオ信号をより多く含む周波数部分に対応するオーディオ信号をより多く保持するが、有効なオーディオ信号をより少なく含む周波数部分に対応するオーディオ信号をより少なく保持することによって、オーディオ信号の品質を向上させ、ノイズを低減するとともに、オーディオ信号の忠実度と了解度を向上させることができる。
【選択図】
図2
【特許請求の範囲】
【請求項1】
オーディオノイズ低減方法であって、
処理対象オーディオ信号の周波数に関連する変調パラメータを取得することと、
前記変調パラメータに対応する利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することと、を含む、ことを特徴とするオーディオノイズ低減方法。
【請求項2】
前記変調パラメータは、前記処理対象オーディオ信号の複数の周波数ユニット及び前記複数の周波数ユニットに対応する複数の信号対ノイズ比のうちの少なくとも一つを含む、ことを特徴とする請求項1に記載のオーディオノイズ低減方法。
【請求項3】
前記処理対象オーディオ信号は、初期オーディオ信号を第1のオーディオノイズ低減アルゴリズムで処理した後のオーディオ信号を含む、ことを特徴とする請求項2に記載のオーディオノイズ低減方法。
【請求項4】
前記第1のオーディオノイズ低減アルゴリズムは、スペクトルサブトラクション法、ウィーナーフィルタリング法、MMSEアルゴリズム、及びMMSEに基づく改良アルゴリズムのうちの少なくとも一つを含む、ことを特徴とする請求項3に記載のオーディオノイズ低減方法。
【請求項5】
前記初期オーディオ信号は、第1のタイプのマイクロホンが出力した第1のオーディオ信号、第2のタイプのマイクロホンが出力した第2のオーディオ信号、及び前記第1のオーディオ信号と前記第2のオーディオ信号が融合されたオーディオ信号のうちの一つを含む、ことを特徴とする請求項3に記載のオーディオノイズ低減方法。
【請求項6】
前記の、前記変調パラメータに対応する利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することは、
前記変調パラメータ、及び前記利得係数と前記変調パラメータとの相関関係を含む予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成するここと、
前記利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することと、を含む、ことを特徴とする請求項2に記載のオーディオノイズ低減方法。
【請求項7】
前記利得関数は、単調関数である、ことを特徴とする請求項6に記載のオーディオノイズ低減方法。
【請求項8】
前記利得係数は、前記複数の信号対ノイズ比と正の相関を有する、ことを特徴とする請求項7に記載のオーディオノイズ低減方法。
【請求項9】
前記利得係数は、前記複数の周波数ユニットと負の相関を有する、ことを特徴とする請求項8に記載のオーディオノイズ低減方法。
【請求項10】
前記変調パラメータは、前記複数の周波数ユニットであり、
前記利得関数は、第1の利得関数であり、第1の利得係数と周波数との相関関係を含み、
前記利得係数は、前記第1の利得係数であり、及び
前記の、前記変調パラメータ及び予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成することは、
前記複数の周波数ユニット及び前記第1の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第1の利得係数を生成することを含む、ことを特徴とする請求項9に記載のオーディオノイズ低減方法。
【請求項11】
前記変調パラメータは、前記複数の周波数ユニットに対応する前記複数の信号対ノイズ比であり、
前記利得関数は、第2の利得関数であり、第2の利得係数と信号対ノイズ比との相関関係を含み、
前記利得係数は、前記第2の利得係数であり、及び
前記の、前記変調パラメータ及び予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成することは、
前記複数の信号対ノイズ比及び前記第2の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第2の利得係数を生成することを含む、ことを特徴とする請求項9に記載のオーディオノイズ低減方法。
【請求項12】
前記変調パラメータは、前記複数の周波数ユニット及び前記複数の周波数ユニットに対応する前記複数の信号対ノイズ比であり、
前記利得関数は、第3の利得関数であり、第3の利得係数と周波数及び信号対ノイズ比との相関関係を含み、
前記利得係数は、前記第3の利得係数であり、及び
前記の、前記変調パラメータ及び予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成することは、
前記複数の信号対ノイズ比、前記複数の周波数ユニット及び前記第3の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第3の利得係数を生成することを含む、ことを特徴とする請求項9に記載のオーディオノイズ低減方法。
【請求項13】
前記利得関数は、sigmoid関数に基づく関数である、ことを特徴とする請求項7に記載のオーディオノイズ低減方法。
【請求項14】
前記の、前記利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することは、
前記利得係数に基づいて前記複数の周波数ユニットのうちの各周波数ユニットを利得させて、前記ターゲットオーディオ信号を取得することを含む、ことを特徴とする請求項6に記載のオーディオノイズ低減方法。
【請求項15】
前記の、処理対象オーディオ信号の周波数に関連する変調パラメータを取得することは、
前記処理対象オーディオ信号の周波数に対応する初期変調パラメータを取得することと、
周波数を変数として前記初期変調パラメータの値を平滑化処理し、前記変調パラメータを取得することとを含む、ことを特徴とする請求項2に記載のオーディオノイズ低減方法。
【請求項16】
前記の、周波数を変数として前記初期変調パラメータの値を平滑化処理することは、
前記複数の周波数ユニットのうちの各周波数ユニットに対応する初期信号対ノイズ比と、現在の周波数ユニットの近傍の少なくとも一つの周波数ユニットに対応する初期信号対ノイズ比とを特徴融合処理して、前記現在の周波数に対応する信号対ノイズ比を得ることを含む、ことを特徴とする請求項15に記載のオーディオノイズ低減方法。
【請求項17】
オーディオノイズ低減システムであって、
オーディオノイズを低減するための少なくとも一つの命令セットが記憶されている少なくとも一つの記憶媒体と、
前記少なくとも一つの記憶媒体に通信的に接続される少なくとも一つのプロセッサと、を含み、
ここで、前記オーディオノイズ低減システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って請求項1~16のいずれか一項に記載のオーディオノイズ低減方法を実行する、ことを特徴とするオーディオノイズ低減システム。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書は、オーディオ信号処理分野に関し、特にオーディオノイズ低減方法及びシステムに関する。
【背景技術】
【0002】
多くの生活シーンでは、我々はノイズに囲まれており、より良い聴覚体験のために、音声を強調する必要がある。音声強調とは、ノイズをある程度低減又は抑圧し、ノイズに囲まれた音声の品質及び了解度などを向上させるノイズ抑圧とも言える。従来の方法では、信号源の収集デバイスは、一般的には、空気伝導素子であり、即ち空気伝導マイクロホンである。ノイズの多いシーンでは、空気伝導マイクロホンにより収集された有効なオーディオ信号は、ほぼノイズに完全に包まれる。
【0003】
現在、骨伝導マイクロホンは、イヤホンなどの電子製品に使用され、骨伝導マイクロホンとして音声信号を受信する用途が増えてきている。特性の異なる空気伝導マイクロホンと骨伝導マイクロホンを組み合わせて、空気伝導マイクロホンで外部オーディオ信号を収音し、骨伝導マイクロホンで発声部位の振動信号を収音し、収音した信号を音声強調処理し融合する電子機器が増えている。骨伝導素子は、空気伝導マイクロホンと異なり、発声部位の振動信号を直接収音することができ、環境ノイズの影響をある程度低減することができる。空気伝導マイクロホンと骨伝導マイクロホンを組み合わせる方式には、複数の空気伝導マイクロホンと一つの骨伝導マイクロホンを組み合わせるものがあり、一つの空気伝導マイクロホンと一つの骨伝導マイクロホンを組み合わせるものもある。一方、ノイズの多いシーンでは、シングル空気伝導マイクロホンの音声品質が悪く、骨伝導マイクロホンの音声品質も外部ノイズにある程度汚染される。
【0004】
現在、ノイズ抑圧には、様々なノイズ低減アルゴリズム、例えば、スペクトルサブトラクション法、ウィーナーフィルタリング法などのようなシングルマイクノイズ低減アルゴリズム、固定ビーム形成法、適応ビーム形成法などのようなマイクロホンアレイノイズ低減アルゴリズムがある。ノイズの多いシーンでは、シングルマイクロホンノイズ低減は非常に困難になり、従来のスペクトルサブトラクション、ウィーナーフィルタリングなどのノイズ低減アルゴリズムは、信号対ノイズ比の向上に対する効果が極めて限定的であり(ノイズ低減強度が不十分であり)、いくつかの改良されたアルゴリズムは、ノイズ低減強度を高めたが、音声歪が大きくなり、高周波数部分に顕著なノイズが残留している。従来のオーディオノイズ低減アルゴリズムに基づいて、如何にして、空気伝導マイクロホン信号、骨伝導マイクロホン信号又は両方融合後のオーディオ信号の音声品質をさらに向上させるかは、早急に解決すべき課題である。
【0005】
そのため、ノイズの多いシーンでノイズをフィルタ除去して信号対ノイズ比を向上させるとともに、音声の忠実度と了解度を維持するための新たなオーディオノイズ低減方法及びシステムを提供する必要がある。
【発明の概要】
【0006】
本明細書は、ノイズの多いシーンでノイズをフィルタ除去して信号対ノイズ比を向上させるとともに、音声の忠実度と了解度を維持するための新なオーディオノイズ低減方法及びシステムを提供する。
【0007】
第1の態様によれば、本明細書は、オーディオノイズ低減方法を提供し、前記方法は、処理対象オーディオ信号の周波数に関連する変調パラメータを取得することと、前記変調パラメータに対応する利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することとを含む。
【0008】
いくつかの実施例において、前記変調パラメータは、前記処理対象オーディオ信号の複数の周波数ユニット及び前記複数の周波数ユニットに対応する複数の信号対ノイズ比のうちの少なくとも一つを含む。
【0009】
いくつかの実施例において、前記処理対象オーディオ信号は、初期オーディオ信号を第1のオーディオノイズ低減アルゴリズムで処理した後のオーディオ信号を含む。
【0010】
いくつかの実施例において、前記第1のオーディオノイズ低減アルゴリズムは、スペクトルサブトラクション法、ウィーナーフィルタリング法、MMSEアルゴリズム、及びMMSEに基づく改良アルゴリズムのうちの少なくとも一つを含む。
【0011】
いくつかの実施例において、前記初期オーディオ信号は、第1のタイプのマイクロホンが出力した第1のオーディオ信号、第2のタイプのマイクロホンが出力した第2のオーディオ信号、及び前記第1のオーディオ信号と前記第2のオーディオ信号が融合されたオーディオ信号のうちの一つを含む。
【0012】
いくつかの実施例において、前記の、前記変調パラメータに対応する利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することは、前記変調パラメータ及び、前記利得係数と前記変調パラメータとの相関関係を含む予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成することと、前記利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することとを含む。
【0013】
いくつかの実施例において、前記利得関数は、単調関数である。
【0014】
いくつかの実施例において、前記利得係数は、前記複数の信号対ノイズ比と正の相関を有する。
【0015】
いくつかの実施例において、前記利得係数は、前記複数の周波数ユニットと負の相関を有する。
【0016】
いくつかの実施例において、前記変調パラメータは、前記複数の周波数ユニットであり、前記利得関数は、第1の利得関数であり、第1の利得係数と周波数との相関関係を含み、前記利得係数は、前記第1の利得係数であり、前記の、前記変調パラメータ及び予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成することは、前記複数の周波数ユニット及び前記第1の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第1の利得係数を生成することを含む。
【0017】
いくつかの実施例において、前記変調パラメータは、前記複数の周波数ユニットに対応する前記複数の信号対ノイズ比であり、前記利得関数は、第2の利得関数であり、第2の利得係数と信号対ノイズ比との相関関係を含み、前記利得係数は、前記第2の利得係数であり、前記の、前記変調パラメータ及び予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成することは、前記複数の信号対ノイズ比及び前記第2の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第2の利得係数を生成することを含む。
【0018】
いくつかの実施例において、前記変調パラメータは、前記複数の周波数ユニット及び前記複数の周波数ユニットに対応する前記複数の信号対ノイズ比であり、前記利得関数は、第3の利得関数であり、第3の利得係数と周波数及び信号対ノイズ比との相関関係を含み、前記利得係数は、前記第3の利得係数であり、前記の、前記変調パラメータ及び予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成することは、前記複数の信号対ノイズ比、前記複数の周波数ユニット及び前記第3の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第3の利得係数を生成することを含む。
【0019】
いくつかの実施例において、前記利得関数は、sigmoid関数に基づく関数である。
【0020】
いくつかの実施例において、前記の、前記利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することは、前記利得係数に基づいて前記複数の周波数ユニットのうちの各周波数ユニットを利得させて、前記ターゲットオーディオ信号を取得することを含む。
【0021】
いくつかの実施例において、前記の、処理対象オーディオ信号の周波数に関連する変調パラメータを取得することは、前記処理対象オーディオ信号の周波数に対応する初期変調パラメータを取得することと、周波数を変数として前記初期変調パラメータの値を平滑化処理し、前記変調パラメータを取得することとを含む。
【0022】
いくつかの実施例において、前記の、周波数を変数として前記初期変調パラメータの値を平滑化処理することは、前記複数の周波数ユニットのうちの各周波数ユニットに対応する初期信号対ノイズ比と、現在の周波数ユニットの近傍の少なくとも一つの周波数ユニットに対応する初期信号対ノイズ比とを特徴融合処理して、前記現在の周波数に対応する信号対ノイズ比を得ることを含む。
【0023】
第2の態様によれば、本明細書は、オーディオノイズ低減システムをさらに提供し、前記システムは、少なくとも一つの記憶媒体と、少なくとも一つのプロセッサとを含み、前記少なくとも一つの記憶媒体には、オーディオノイズを低減するための少なくとも一つの命令セットが記憶されており、前記少なくとも一つのプロセッサは、前記少なくとも一つの記憶媒体に通信的に接続され、ここで、前記オーディオノイズ低減システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って本明細書の第1の態様に記載のオーディオノイズ低減方法を実行する。
【0024】
以上の技術案から分かるように、本明細書によるオーディオノイズ低減方法及びシステムは、従来のオーディオノイズ低減方法に基づいて、周波数を単位としてオーディオ信号をさらに最適化処理することができる。前記方法及びシステムは、オーディオ信号の複数の周波数ユニット及び複数の周波数ユニットに対応する信号対ノイズ比のうちの少なくとも一つに基づいて、オーディオ信号を利得処理することができる。前記方法及びシステムは、オーディオ信号の複数の周波数ユニット及び複数の周波数ユニットに対応する信号対ノイズ比に基づいて、利得係数を生成し、利得係数を用いてオーディオ信号を利得処理することができる。ここで、信号対ノイズ比が高いほど、利得係数も高くなり、周波数が高いほど、利得係数は低くなる。前記方法及びシステムは、従来のオーディオノイズ低減方法に基づいて、オーディオ信号をさらに最適化し、有効なオーディオ信号をより多く含む周波数に対応するオーディオ信号をより多く保持するが、有効なオーディオ信号をより少なく含む周波数に対応するオーディオ信号をより少なく保持することによって、ノイズをフィルタ除去し信号対ノイズ比を向上させるとともに、音声の忠実度と了解度を維持することができる。
【0025】
本明細書によるオーディオノイズ低減方法及びシステムの他の機能は、以下に続く説明で部分的に記述される。説明によれば、以下の数字及び例に示される内容は、当業者にとって自明である。本明細書によるオーディオノイズ低減方法及びシステムの創造的な態様は、以下の詳細な例に記載の方法、装置及び組み合わせの実践又は使用によって十分に解釈され得る。
【図面の簡単な説明】
【0026】
本明細書の実施例における技術案をより明確に説明するために、以下では、実施例の説明で使用する必要がある図面を簡単に説明するが、明らかなことに、以下の説明における図面は、本明細書の一部の実施例に過ぎず、当業者にとっては、創造的な労力を払うことなく、これらの図面に基づいて他の図面を入手することができる。
【
図1】本明細書の実施例によるいくつかのオーディオノイズ低減システムの機器概略図である。
【
図2】本明細書の実施例によるいくつかのオーディオノイズ低減方法のフローチャートである。
【
図3】本明細書の実施例によるいくつかの第1の利得関数の概略図である。
【
図4】本明細書の実施例によるいくつかの第2の利得関数の概略図である。
【
図5】本明細書の実施例によるいくつかの第3の利得関数の概略図である。
【
図6】本明細書の実施例によるいくつかの第3の利得関数の概略図である。
【発明を実施するための形態】
【0027】
以下の説明は、当業者が本明細書における内容を作成及び使用することを可能にするために、本明細書の特定の適用シーンと要件を提供した。開示された実施例に対する様々な部分的な修正は、当業者には容易に明らかであり、且つここで定義された一般原理は、本明細書の精神及び範囲から逸脱することなく、他の実施例及び用途に適用され得る。そのため、本明細書は、示された実施例に限定されるものではなく、請求項と一致する最も広い範囲である。
【0028】
ここで使用される用語は、特定の例示的な実施例を説明する目的のためだけのものであり、限定するものではない。例えば、文脈が別途明確に指示しない限り、ここで使用される単数形「一」、「一つ」及び「該」は、複数形を含むものでもあり得る。本明細書で使用される場合、「含む」、「包含」及び/又は「含有」という用語は、関連する整数、ステップ、動作、要素及び/又はコンポーネントの存在を意味するが、一つ又は複数の他の特徴、整数、ステップ、動作、要素、コンポーネント及び/又はグループの存在を排除するものではなく、又は該システム/方法に他の特徴、整数、ステップ、動作、要素、コンポーネント及び/又はグループが追加されてもよい。
【0029】
以下の説明を考慮すると、本明細書のこれらの特徴及び他の特徴、並びに構造の関連素子の動作及び機能、並びに部品の組み合わせ及び製造の経済性を明らかに向上させることができる。図面を参照すると、その全ては本明細書の一部を形成する。しかしながら、図面は、例示及び説明のみを目的とし、本明細書の範囲を限定することを意図していないことが明確に理解されるべきである。図面は縮尺どおりに描かれていないことも理解されるべきである。
【0030】
本明細書で使用されるフローチャートは、本明細書のいくつかの実施例によるシステム実現の動作を示す。フローチャートの動作は順序を違えて実現されてもよいことが明確に理解されるべきである。逆に、動作は、逆順で、又は同時に実現され得る。なお、フローチャートに一つ又は複数の他の動作を追加してもよい。フローチャートから一つ又は複数の動作を除去してもよい。
【0031】
いくつかのノイズ低減アルゴリズムは、オーディオ信号に対してノイズ低減を行う時、各周波数のオーディオ信号に対する保持力がほぼ一様である。つまり、これらのノイズ低減アルゴリズムは、異なる周波数のオーディオ信号に対して同様なノイズ低減処理を行う。そのため、これらのノイズ低減アルゴリズムにより処理されたオーディオ信号は、各周波数の信号保持割合が一致する。しかしながら、ノイズ付きのオーディオ信号は、異なる周波数に含まれる有効なオーディオ信号が異なる。例えば、ノイズ信号付きのオーディオ信号における低周波数部分に含まれる有効なオーディオ信号(即ち人間の声の声紋)は、高周波数部分に含まれる有効なオーディオ信号より高い。これらのノイズ低減アルゴリズムは、オーディオ信号に対してノイズ低減処理を行う時、オーディオ信号の周波数要素を考慮していないため、異なる周波数に対するノイズ低減強度が実質的に一致する。例えば、高強度のノイズ低減アルゴリズムを用いて、ノイズ信号付きのオーディオ信号に対してノイズ低減処理を行う場合、高周波数部分のノイズ信号を低減するとともに、低周波数部分における有効なオーディオ信号を破棄することによって音声歪みを引き起こす可能性もある。低強度のノイズ低減アルゴリズムを用いて、ノイズ信号付きのオーディオ信号に対してノイズ低減処理を行う場合、高周波数部分に明らかなノイズが残り、オーディオノイズ低減の効果が薄くなる。
【0032】
前記有効なオーディオ信号は、オーディオ信号に付いている重要なオーディオ信号であってもよい。ノイズ信号は、前記有効なオーディオ信号以外の他のオーディオ信号であってもよい。例えば、音声通話を行う場合、前記有効なオーディオ信号は、通話ユーザが話している時の人間の声の信号であってもよく、前記ノイズ信号は、環境ノイズ、例えば、自動車の音、サイレン音などであってもよい。特殊な音、例えば、鳥の鳴き声を収集する場合、前記有効なオーディオ信号は、鳥の鳴き声のオーディオ信号であってもよく、前記ノイズ信号は、風の音、水の音などであってもよい。説明を容易にするために、以下の説明では、音声通話を例として説明し、ここで、前記有効なオーディオ信号は、通話ユーザが話している時の人間の声の信号であり、前記ノイズ信号は、環境ノイズであってもよい。
【0033】
説明すべきこととして、前記ノイズ信号と前記有効なオーディオ信号は、いずれも推定アルゴリズムによって得られた信号である。前記ノイズ信号は、ノイズ推定アルゴリズムによって推定され得る。前記有効なオーディオ信号は、元のオーディオ信号から前記ノイズ信号を減算して推定することによって得られ得る。
【0034】
以下の説明において本明細書による別のオーディオノイズ低減方法及びシステムは、オーディオ信号の周波数に関連するパラメータに基づいて、異なる周波数のオーディオ信号に対して異なる利得処理を行うことができる。つまり、本明細書によるオーディオノイズ低減方法及びシステムは、オーディオ信号の周波数を単位として、各周波数の特性に基づいて、各周波数に対してそれぞれ利得処理を行い、それにより各周波数におけるオーディオノイズ低減の割合を不均一にし、有効なオーディオ信号をより多く含む周波数部分に対応するオーディオ信号をより多く保持するが、有効なオーディオ信号をより少なく含む周波数部分に対応するオーディオ信号をより少なく保持することによって、オーディオ信号の品質を向上させ、ノイズを低減するとともに、オーディオ信号の忠実度と了解度を向上させることができる。
【0035】
前記忠実度は、機器が出力したオーディオ信号と機器が受信したオーディオ信号との類似度であってもよい。忠実度が高いほど、機器が出力したオーディオ信号と機器が受信したオーディオ信号との類似度が高くなる。前記了解度は、音声了解度であってもよい。前記音声了解度が高いほど、前記了解度が高くなる。
【0036】
図1は、いくつかのオーディオノイズ低減システム100(以下にシステム100と略称する)の機器概略図を示す。システム100は、電子機器200に用いることができる。
【0037】
いくつかの実施例において、電子機器200は、無線イヤホン、有線イヤホン、スマートウェアラブルデバイス、例えば、スマートグラス、スマートヘルメット又はスマートウォッチなどの、音声収集機能及び音声再生機能を有する機器であってもよい。電子機器200はまた、モバイル機器、タブレットコンピュータ、ノートパソコン、自動車の内蔵装置もしくは類似のもの、又はそれらの任意の組み合わせであってもよい。いくつかの実施例において、モバイル機器は、スマートホーム機器、スマートモバイル機器、仮想現実機器、拡張現実機器もしくは類似の機器、又はそれらの任意の組み合わせを含んでもよい。例えば、前記スマートモバイル機器は、携帯電話、パーソナルデジタルアシスタント、ゲーム機器、ナビゲーション機器、ウルトラモバイルパーソナルコンピュータ(Ultra-mobile Personal Computer、UMPC)など、又はそれらの任意の組み合わせを含んでもよい。いくつかの実施例において、前記スマートホーム装置は、スマートテレビ、デスクトップコンピュータなど、又は任意の組み合わせを含んでもよい。いくつかの実施例において、前記仮想現実機器又は拡張現実機器は、仮想現実ヘルメット、仮想現実グラス、仮想現実パッチ、拡張現実ヘルメット、拡張現実グラス、拡張現実パッチもしくは類似のもの、又はそのうちの任意の組み合わせを含み得る。いくつかの実施例において、自動車の内蔵装置は、車載コンピュータ、車載テレビなどを含んでもよい。
【0038】
電子機器200は、本明細書に記載のオーディオノイズ低減方法を実行するデータ又は命令を記憶することができ、前記データ及び/又は命令を実行することができる。電子機器200は、処理対象オーディオ信号を受信し、本明細書に記載のオーディオノイズ低減方法のデータ又は命令を実行し、前記処理対象オーディオ信号に対してオーディオノイズ低減処理を行い、ターゲットオーディオ信号を生成することができる。前記オーディオノイズ低減方法は、本明細書の他の部分で紹介される。例えば、前記オーディオノイズ低減方法は、
図2から
図6の説明において紹介されている。
【0039】
前記処理対象オーディオ信号には、少なくとも有効なオーディオ信号が含まれている。前記処理対象オーディオ信号には、ノイズ信号が含まれてもよい。前記処理対象オーディオ信号は、電子機器200によってローカルに記憶されたオーディオ信号であってもよいし、電子機器200のオーディオ収集機器が出力したオーディオ信号であってもよく、さらに他の機器により電子機器200に送信されたオーディオ信号などであってもよい。前記オーディオ収集機器は、電子機器200上に集積されてもよいし、電子機器200に通信的に接続される外付け型機器であってもよい。
【0040】
図1に示すように、電子機器200は、少なくとも一つの記憶媒体230と、少なくとも一つのプロセッサ220とを含んでもよい。いくつかの実施例において、電子機器200は、通信ポート250と、内部通信バス210とをさらに含んでもよい。それとともに、電子機器200は、I/Oコンポーネント260をさらに含んでもよい。いくつかの実施例において、電子機器200は、マイクロホンモジュール240をさらに含んでもよい。
【0041】
内部通信バス210は、記憶媒体230と、プロセッサ220と、マイクロホンモジュール240とを含む異なるシステムコンポーネントに接続されてもよい。
【0042】
I/Oコンポーネント260は、電子機器200と他のコンポーネントとの間の入力/出力をサポートする。例えば、電子機器200は、I/Oコンポーネント260を介して前記処理対象オーディオ信号を取得することができる。
【0043】
通信ポート250は、電子機器200が外部とデータ通信を行うためのものである。例えば、電子機器200はまた、通信ポート250を介して前記処理対象オーディオ信号を取得することができる。
【0044】
少なくとも一つの記憶媒体230は、データ記憶装置を含んでもよい。前記データ記憶装置は、非一時的な記憶媒体であってもよいし、一時的な記憶媒体であってもよい。例えば、前記データ記憶装置は、磁気ディスク232、読み取り専用記憶媒体(ROM)234又はランダムアクセス記憶媒体(RAM)236のうちの一つ又は複数を含んでもよい。記憶媒体230は、前記データ記憶装置に記憶されているオーディオノイズ低減のための少なくとも一つの命令セットをさらに含む。前記命令は、コンピュータプログラムコードであり、前記コンピュータプログラムコードは、本明細書によるオーディオノイズ低減方法を実行するプログラム、ルーチン、オブジェクト、コンポーネント、データ構造、プロセス、モジュールなどを含んでもよい。少なくとも一つの記憶媒体230には、前記処理対象オーディオ信号が記憶されていてもよい。少なくとも一つの記憶媒体230にはさらに、利得関数が予め記憶されていてもよく、前記利得関数は、後の説明で詳しく紹介される。
【0045】
少なくとも一つのプロセッサ220は、内部通信バス210を介して、少なくとも一つの記憶媒体230に通信的に接続することができる。前記通信的接続は、情報を直接又は間接的に受信できる任意の形の接続を指す。少なくとも一つのプロセッサ220は、上記少なくとも一つの命令セットを実行するためのものである。システム100が作動する場合、少なくとも一つのプロセッサ220は、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って本明細書によるオーディオノイズ低減方法を実行する。プロセッサ220は、オーディオノイズ低減方法に含まれる全てのステップを実行することができる。プロセッサ220は、一つ又は複数のプロセッサの形態であってもよく、いくつかの実施例において、プロセッサ220は、一つ又は複数のハードウェアプロセッサ、例えば、マイクロコントローラ、マイクロプロセッサ、縮小命令セットコンピュータ(RISC)、専用集積回路(ASIC)、特定用途向け命令セットプロセッサ(ASIP)、中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)、物理処理ユニット(PPU)、マイクロコントローラユニット、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、アドバンスドRISCマシン(ARM)、プログラマブルロジックデバイス(PLD)、一つ又は複数の機能を実行できる任意の回路もしくはプロセッサなど、又はそれらの任意の組み合わせを含んでもよい。単に問題を説明するために、本明細書では、電子機器200に一つのプロセッサ220のみが説明されている。しかしながら、注意すべきこととして、本明細書における電子機器200は、複数のプロセッサをさらに含んでもよく、そのため、本明細書に開示された動作及び/又は方法ステップは、本明細書に記載されるように一つのプロセッサによって実行されてもよいし、複数のプロセッサによって共同で実行されてもよい。例えば、本明細書において、電子機器200のプロセッサ220がステップAとステップBを実行する場合、理解すべきこととして、ステップAとステップBは、二つの異なるプロセッサ220によって共同で又は別々に実行されてもよい(例えば、第1のプロセッサがステップAを実行し、第2のプロセッサがステップBを実行し、又は第1と第2のプロセッサがステップAとBを共同で実行する)。
【0046】
いくつかの実施例において、電子機器200は、マイクロホンモジュール240をさらに含んでもよい。マイクロホンモジュール240は、電子機器200のオーディオ収集機器であってもよい。マイクロホンモジュール240は、ローカルオーディオ信号を取得し、マイクロホン信号、つまりオーディオ情報付きの電子信号を出力するように構成されてもよい。前記処理対象オーディオ信号は、マイクロホンモジュール240により出力された前記マイクロホン信号であってもよい。マイクロホンモジュール240は、少なくとも一つのプロセッサ220及び少なくとも一つの記憶媒体230に通信的に接続されてもよい。前記処理対象オーディオ信号が前記マイクロホン信号である場合、システム100が作動する時、少なくとも一つのプロセッサ220は、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って前記マイクロホン信号を取得し、本明細書によるオーディオノイズ低減方法を実行することができる。マイクロホンモジュール240は、電子機器200上に集積されてもよいし、電子機器200の外付け型機器であってもよい。
【0047】
マイクロホンモジュール240は、ローカルオーディオ信号を取得し、マイクロホン信号、つまりオーディオ情報付きの電子信号を出力するように構成されてもよい。マイクロホンモジュール240は、アウトイヤーマイクロホンモジュールであってもよいし、インイヤーマイクロホンモジュールであってもよい。例えば、マイクロホンモジュール240は、外耳道外に設置されるマイクロホンであってもよいし、外耳道内に設置されるマイクロホンであってもよい。マイクロホンモジュール240は、人体振動信号を直接収集するマイクロホン、例えば、骨伝導マイクロホンなどの第1のタイプのマイクロホンであってもよい。マイクロホンモジュール240はまた、空気振動信号を直接収集するマイクロホン、例えば、空気伝導マイクロホンなどの第2のタイプのマイクロホンであってもよい。マイクロホンモジュール240はさらに、第1のタイプのマイクロホンと第2のタイプのマイクロホンとの組み合わせであってもよい。無論、マイクロホンモジュール240は、他のタイプのマイクロホンであってもよい。例えば、マイクロホンモジュール240は、光学式マイクロホンであってもよいし、筋電位信号を受信するマイクロホンなどであってもよい。説明を容易にするために、本開示は、以下の記述では、第1のタイプのマイクロホンとして骨伝導マイクロホンを使用し、第2のタイプのマイクロホンとして空気伝導マイクロホンを使用する例について説明する。
【0048】
骨伝導マイクロホンは、振動センサ、例えば、光学式振動センサ、加速度センサなどを含んでもよい。前記振動センサは、機械的振動信号(例えば、ユーザが話している時に皮膚又は骨格により生成される振動による信号)を収集し、該機械的振動信号を電気信号に変換することができる。ここでいう機械的振動信号とは、主に固体を介して伝播する振動を指す。骨伝導マイクロホンは、前記振動センサ又は前記振動センサに接続される振動部品を介してユーザの皮膚又は骨格に接触することによって、ユーザが音声を発した時に皮膚又は骨格により生成される振動信号を収集し、振動信号を電気信号に変換する。いくつかの実施例において、前記振動センサは、機械的振動に敏感であるが空気振動敏感でない装置であってもよい(即ち機械的振動に対する前記振動センサの応答能力は、空気振動に対する前記振動センサの応答能力を上回る)。骨伝導マイクロホンは、発声部位の振動信号を直接収音することができるため、環境ノイズの影響を低減ことができる。
【0049】
空気伝導マイクロホンは、ユーザが音声を発した時に生じる空気振動信号を収集し、空気振動信号を電気信号に変換する。空気伝導マイクロホンは、一つの単独の空気伝導マイクロホンであってもよいし、二つ以上の空気伝導マイクロホンからなるマイクロホンアレイであってもよい。マイクロホンアレイは、ビーム形成マイクロホンアレイ又は他の類似のマイクロホンアレイであってもよい。マイクロホンアレイにより、空間的に異なる方向又は異なる位置からの音を収集することができる。
【0050】
第1のタイプのマイクロホンは、第1のオーディオ信号を出力することができる。第2のタイプのマイクロホンは、第2のオーディオ信号を出力することができる。
【0051】
システム100は、前記処理対象オーディオ信号を受信し、本明細書に記載のオーディオノイズ低減方法を実行し、前記処理対象オーディオ信号に対してオーディオノイズ低減処理を行い、前記ターゲットオーディオ信号を生成して出力することができる。前記処理対象オーディオ信号は、オーディオノイズ低減アルゴリズムによるノイズ低減が行われていない初期オーディオ信号であってもよいし、前記初期オーディオ信号が第1のオーディオノイズ低減アルゴリズムによって処理された後のオーディオ信号であってもよい。前記初期オーディオ信号は、前記第1のオーディオ信号であってもよいし、前記第2のオーディオ信号であってもよく、さらに前記第1のオーディオ信号と前記第2のオーディオ信号との融合オーディオ信号であってもよい。
【0052】
例えば、前記処理対象オーディオ信号は、前記第1のオーディオ信号が前記第1のオーディオノイズ低減方法によって処理された後のオーディオ信号であってもよいし、前記第2のオーディオ信号が前記第1のオーディオノイズ低減方法によって処理された後のオーディオ信号であってもよく、さらに前記第1のオーディオ信号と第2のオーディオ信号との融合オーディオ信号が前記第1のオーディオノイズ低減方法によって処理された後のオーディオ信号であってもよい。
【0053】
前記第1のオーディオノイズ低減アルゴリズムは、従来のオーディオノイズ低減アルゴリズム、例えば、スペクトルサブトラクション法、ウィーナーフィルタリング法、MMSEアルゴリズム、MMSEに基づく改良アルゴリズムのうちの一つ又は任意の組み合わせであってもよい。システム100によってノイズ低減処理された後に得られた前記ターゲットオーディオ信号には、有効なオーディオ信号をより多く含むオーディオ信号がより多く保持されるため、前記ターゲットオーディオ信号の音声品質を向上させ、音声の忠実度と了解度を向上させることができる。
【0054】
図2は、本明細書の実施例によるオーディオノイズ低減方法P100のフローチャートを示す。
図2に示すように、前記方法P100は、少なくとも一つのプロセッサ220によって以下のステップを実行することを含むもよく、
【0055】
S120:処理対象オーディオ信号の周波数に関連する変調パラメータを取得する。
【0056】
前述のように、前記方法P100及びシステム100は、周波数を単位として、前記処理対象オーディオ信号に対してオーディオノイズ低減を行うことができる。周波数領域において、一つのオーディオの周波数区間は、複数の周波数ユニット、即ち予め設定された帯域幅の周波数区間に分割されてもよく、複数の周波数ユニットは、複数の周波数ポイントで表現されてもよい。前記方法P100及びシステム100は、前記周波数区間における各周波数ユニット又は各ユニット周波数帯域に対応するオーディオ信号に対してそれぞれ利得処理を行って、有効なオーディオ信号をより多く含む周波数部分(例えば、信号対ノイズ比SNRが高い周波数区間)に対応するオーディオ信号をより多く保持するが、有効なオーディオ信号を少なく含む周波数部分(例えば、信号対ノイズ比SNRが低い周波数区間)に対応するオーディオ信号をより少なく保持することによって、オーディオ信号の品質を向上させることができる。例えば、一つの処理対象音声オーディオについて、その低周波数部分の信号対ノイズ比が高い(即ち有効なオーディオ信号は強いがノイズ信号は弱い)が、高周波数部分の信号対ノイズ比が低い(即ち有効なオーディオ信号は弱いがノイズ信号は強い)場合、前記方法P100及びシステム100は、前記オーディオにおける高周波数部分を抑圧し低周波数部分を増幅することによってオーディオ全体の信号品質を向上させることができる。その結果、前記オーディオ信号におけるノイズを低減するとともに、前記オーディオ信号における有効なオーディオ信号の了解度を向上させた。
【0057】
そのため、前記変調パラメータは、周波数領域における、周波数に関連するパラメータであってもよく、例えば、前記変調パラメータは、周波数ユニットであってもよいし、周波数ユニットに関連するパラメータであってもよく、その振幅が周波数の変化に伴って変化し得る。例えば、前記変調パラメータは、信号対ノイズ比(SNR)であってもよく、前記信号対ノイズ比は、周波数に関連するパラメータであってもよい。そのため、前記変調パラメータは、前記処理対象オーディオ信号に含まれる前記有効なオーディオ信号の程度を反映できるパラメータである。
【0058】
前記変調パラメータは、前記処理対象オーディオ信号の周波数に関連するパラメータであってもよい。周波数領域において、前記周波数は、連続的なパラメータであり、計算を容易にするために、前記処理対象オーディオ信号の周波数を複数の周波数ユニットに分割してもよい。各周波数ユニットは、予め設定された帯域幅の周波数区間を含んでもよい。各周波数ユニットは、周波数点の数で表現されてもよい。前記周波数点の数は、現在の周波数ユニットが位置する周波数区間の中間周波数値、又は平均周波数値などであってもよい。異なる周波数ユニットの前記周波数区間の帯域幅は、同じであってもよいし、異なってもよい。隣接する周波数点の数の間の距離は、同じであってもよいし、異なってもよい。システム100は、前記処理対象オーディオ信号のノイズ信号の特性に応じて、各周波数ユニットの前記周波数区間の帯域幅を確定することができる。例えば、前記ノイズ信号が平坦な場合、前記周波数ユニットの前記周波数区間の帯域幅はより大きくなり得る。前記ノイズ信号が平坦でない場合、前記周波数ユニットの前記周波数区間の帯域幅はより小さくなり得る。単なる例として、前記周波数点の数は、10Hz、100Hz、150Hz、200Hz、1000Hz、10000Hzなどであってもよい。
【0059】
説明を容易にするために、前記処理対象オーディオ信号の周波数は、低周波数、中周波数及び高周波数に大別される。前記低周波数領域は、[0、a]の間の周波数を含んでもよい。ここで、aは、前記低周波数領域の周波数下限である。例えば、aは、400~800のいずれか一つの周波数であってもよい。例えば、aは、400、450、500、550、600、650、700、750、800などであってもよい。前記中周波数領域は、(a、b]の間の周波数を含んでもよく、ここで、bは、前記中周波数領域の周波数上限である。例えば、bは、2000~4000のいずれか一つの周波数であってもよい。例えば、aは、2000、2500、3000、3500、4000などであってもよい。前記高周波数領域は、[b、c]の間の周波数を含んでもよい。ここで、cは、前記高周波数領域の周波数上限である。前記高周波数領域の周波数上限dは、400より大きい任意の周波数であってもよい。
【0060】
具体的には、前記変調パラメータは、前記処理対象オーディオ信号の複数の周波数ユニットであってもよいし、前記複数の周波数ユニットに対応する複数の信号対ノイズ比であってもよく、さらに前記複数の周波数ユニット及び前記複数の周波数ユニットに対応する複数の信号対ノイズ比であってもよい。音声通話を例として、低周波数における有効なオーディオ信号は、高周波数における有効なオーディオ信号よりも多い。前記信号対ノイズ比は、前記処理対象オーディオ信号における有効なオーディオ信号とノイズ信号との比であってもよい。前記周波数に対応する信号対ノイズ比が高いほど、現在の周波数における有効なオーディオ信号の割合が高くなることを示す。
【0061】
前記変調パラメータはさらに、周波数に関連する任意のパラメータであってもよい。例えば、前記変調パラメータは、前記複数の周波数ユニットに対応する複数の有効なオーディオ信号の強度であってもよく、さらに前記複数の周波数ユニットに対応する複数のノイズ信号の強度などであってもよい。ここで、前記複数の周波数ユニットは、前記複数の周波数点の数であってもよい。説明を容易にするために、以下の説明で、前記変調パラメータが前記処理対象オーディオ信号の複数の周波数ユニットと前記複数の周波数ユニットに対応する複数の信号対ノイズ比のうちの少なくとも一つであることを例とする。
【0062】
前記処理対象オーディオ信号の変調パラメータを取得するために、システム100は、まず、前記処理対象オーディオ信号に対してフレーム分割処理を行ってもよい。フレームは、オーディオ信号を構成する基本単位である。オーディオ信号のデータ処理を行う場合、フレームを基本単位として計算を行うことが多い。前記処理対象オーディオ信号は、一つ又は複数のオーディオフレームを含んでもよい。前記オーディオフレームは、予め設定された時間長のオーディオ信号を含む。各オーディオフレーム内のオーディオ信号は平坦である。隣接するオーディオフレームの間は部分的に重なってもよい。前記予め設定された時間長は、20~50ミリ秒、例えば、20ミリ秒、25ミリ秒、30ミリ秒、40ミリ秒、50ミリ秒などであってもよい。無論、前記予め設定された時間長はさらに、より長く、又はより短い時間であってもよい。異なるオーディオフレームの長さは、同じであってもよいし、異なってもよい。
【0063】
説明すべきこととして、異なるオーディオフレームにおける複数の周波数ユニットは、同じであってもよいし、異なってもよい。
【0064】
前記処理対象オーディオ信号のスペクトログラムを取得するために、システム100は、前記オーディオフレームに対してフーリエ変換を行って、前記オーディオフレームにおける各周波数の信号分布を取得してもよい。前記各周波数の信号分布は、前記オーディオフレームにおける各周波数に対応するオーディオ信号の強度であってもよい。
【0065】
システム100は、前記処理対象オーディオ信号の各オーディオフレームにおける各周波数の信号分布に基づいて、前記処理対象オーディオ信号の各オーディオフレームに対応する前記変調パラメータを取得することができる。即ち前記処理対象オーディオ信号の各オーディオフレームにおける複数の周波数ユニット及び前記複数の周波数ユニットに対応する複数の信号対ノイズ比である。前記複数の周波数ユニットにおける各周波数は、前記複数の信号対ノイズ比のうちの一つの信号対ノイズ比に対応する。異なる周波数のオーディオ信号に対応する信号対ノイズ比は、異なってもよい。
【0066】
説明すべきこととして、システム100は、前記処理対象オーディオ信号に対してオーディオノイズ低減処理を行う場合、全てのオーディオフレームに対して前記オーディオノイズ低減処理を行ってもよいし、一部のオーディオフレームに対して前記オーディオノイズ低減処理を行ってもよい。
【0067】
前記変調パラメータが前記複数の信号対ノイズ比を含む場合、ステップS120は、前記処理対象オーディオ信号の周波数に対応する初期変調パラメータを取得し、周波数を変数として前記初期変調パラメータの値を平滑化処理し、前記変調パラメータを取得することを含んでもよい。ここで、前記処理対象オーディオ信号に対応する初期変調パラメータは、前記処理対象オーディオ信号の各オーディオフレームにおける複数の周波数ユニットに対応する複数の初期信号対ノイズ比であってもよい。前記初期信号対ノイズ比は、各周波数ユニットに対応する信号対ノイズ比であってもよい。異なる周波数ユニットのオーディオ信号に対応する初期信号対ノイズ比は、異なる可能性がある。また、隣接する周波数ユニットのオーディオ信号に対応する初期信号対ノイズ比は、異なる可能性があり、さらに大きく変化する可能性もある。
【0068】
前記処理対象オーディオ信号の各オーディオフレームにおける複数の周波数ユニットに対応する複数の信号対ノイズ比を滑らかに遷移させるために、システム100は、周波数を変数として前記初期変調パラメータの値に対して前記平滑化処理を行って、前記変調パラメータを取得してもよい。前述のように、前記初期変調パラメータは、前記複数の周波数ユニットに対応する前記複数の初期信号対ノイズ比であってもよい。
【0069】
前記平滑化処理は、任意の適切な処理方式を用い得る。例えば、前記平滑化処理は、前記複数の周波数ユニットのうちの各周波数ユニットに対応する初期信号対ノイズ比と、現在の周波数ユニットの近傍の少なくとも一つの周波数ユニットに対応する初期信号対ノイズ比とを特徴融合処理して、前記現在の周波数に対応する信号対ノイズ比を得ることであってもよい。前述のように、各周波数ユニットは、周波数点の数で表現されてもよい。例えば、前記特徴融合は、信号対ノイズ比という特徴に対する平均化であってもよい。ある周波数ユニットの信号対ノイズ比に対する前記平滑化処理は、該周波数ユニットの前のいくつかの周波数ユニット及び該周波数ユニットの後のいくつかの周波数ユニットの信号対ノイズ比の平均をとることであってもよく、以下の式で表す。
【数1】
ここで、iは、周波数ユニットの標識であり、単位はHzであり、例えば、iは、現在の周波数ユニットに対応する周波数点の数であってもよい。SNR[i]は、周波数ユニットiに対応する信号対ノイズ比である。SNR
0[j]は、周波数ユニットjに対応する初期信号対ノイズ比である。nとmは、前記平滑化処理において特徴融合を行う隣接の周波数ユニットの数であり、平滑化された周波数ユニットの数と呼ばれてもよい。nとmは、0以上の任意の整数である。前記平滑化処理は、システム100による前記処理対象オーディオ信号に対するオーディオノイズ低減処理を最適化することができる。
【0070】
S140:前記変調パラメータに対応する利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得する。具体的には、ステップS140は、
前記変調パラメータ及び予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成するS142を含んでもよい。
【0071】
前述のように、システム100は、前記処理対象オーディオ信号の周波数に基づいて前記処理対象オーディオ信号に対してノイズ低減処理を行うことができる。具体的には、システム100は、前記処理対象オーディオ信号の前記複数の周波数ユニットを単位として、前記処理対象オーディオ信号の前記複数の周波数ユニットに対応するオーディオ信号に対して利得処理を行うことができる。
【0072】
システム100は、予め設定された前記利得関数によって、前記処理対象オーディオ信号に対して利得処理を行うことができる。前記利得関数は、前記利得係数と前記変調パラメータとの相関関係の関数であってもよい。
【0073】
前記利得係数は、0より大きい任意の数であってもよい。前記利得係数は、0と1を含む0~1の任意の数であってもよい。前記処理対象オーディオ信号の現在の周波数ユニットに含まれる有効なオーディオ信号が多く、ノイズが小さいほど、有効なオーディオ信号をより多く保持するために、前記現在の周波数ユニットに対応する利得係数は大きくなり、前記処理対象オーディオ信号の現在の周波数ユニットに含まれる有効なオーディオ信号が少なく、ノイズ信号が大きいほど、ノイズ信号を低減するために、前記現在の周波数ユニットに対応する利得係数は小さくなる。いくつかの実施例において、前記利得係数は、1より大きい任意の数であってもよい。前記処理対象オーディオ信号における一部の周波数ユニットに含まれる有効なオーディオ信号が多く、ノイズが少ない場合、現在の周波数ユニットに対応する利得係数は、前記有効なオーディオ信号を強調するために、1より大きい係数であってもよい。
【0074】
前述のように、前記処理対象オーディオ信号に含まれる有効なオーディオ信号を前記変調パラメータに反映させてもよい。そのため、前記利得関数は、前記変調パラメータに関連する単調関数であってもよい。例えば、前記有効なオーディオ信号が多く、前記ノイズ信号が少ないほど、前記利得係数は大きくなり、前記有効なオーディオ信号が少なく、前記ノイズ信号が多いほど、前記利得係数は小さくなる。
【0075】
前記利得関数は、任意の単調関数であってもよい。例えば、前記利得関数は、sigmoid関数に基づく単調関数であってもよいし、log関数に基づく単調関数であってもよく、前記利得関数はさらに、tan関数に基づく単調関数などであってもよい。説明を容易にするために、以下の説明では、前記利得関数がsigmoid関数に基づく単調関数であることを例として説明する。前記利得関数は、線形単調関数であってもよいし、非線形相関関数であってもよい。
【0076】
前記変調パラメータが、前記複数の周波数ユニットに対応する複数の信号対ノイズ比である場合、前記周波数ユニットに対応する信号対ノイズ比が高いほど、現在の周波数ユニットに含まれる有効なオーディオ信号が多くなることを示し、この時、現在の周波数ユニットに対応する信号をより多く保持するために、前記現在の周波数ユニットに対応する利得係数は高くなる必要があり、前記周波数ユニットに対応する信号対ノイズ比が低いほど、現在の周波数ユニットに含まれる有効なオーディオ信号が少なくなり、ノイズ信号が多くなることを示し、この時、現在の周波数ユニットに対応する信号をより多く破棄するために、前記現在の周波数ユニットに対応する利得係数は低くなる必要がある。そのため、前記利得係数は、前記複数の信号対ノイズ比と正の相関を有する。
【0077】
前記変調パラメータが前記複数の周波数ユニットである場合、高周波数部分をより多く破棄し、即ち高周波数部分に対応する利得係数を小さくし、低周波数部分をより多く保持し、即ち低周波数部分に対応する利得係数を大きくすることによって、より良好なオーディオノイズ低減効果を得ることができる。そのため、前記周波数ユニットに対応する周波数点の数が低いほど、現在の周波数に対応する信号をより多く保持するために、前記現在の周波数ユニットに対応する利得係数は高くなる必要があり、前記周波数ユニットに対応する周波数点の数が高いほど、現在の周波数に対応する信号をより多く破棄するために、前記当前周波数ユニットに対応する利得係数は低くなる必要がある。そのため、前記有効なオーディオ信号が人間の声の信号である場合、前記利得係数は、前記複数の周波数ユニットと負の相関を有する。
【0078】
前記利得関数は、第1の利得関数、第2の利得関数及び第3の利得関数のうちの一つであってもよい。ここで、前記第1の利得関数は、第1の利得係数と周波数との相関関係であってもよく、前記第1の利得係数は、前記周波数と負の相関を有し、前記第2の利得関数は、第2の利得係数と信号対ノイズ比との相関関係であってもよく、前記第2の利得係数は、前記信号対ノイズ比と正の相関を有し、前記第3の利得関数は、第3の利得係数と周波数及び信号対ノイズ比との相関関係であり、前記第3の利得係数は、前記周波数と負の相関を有し、前記信号対ノイズ比と正の相関を有する。前記利得係数は、前記第1の利得係数、前記第2の利得係数及び前記第3の利得係数のうちの一つを含んでもよい。
【0079】
前記変調パラメータが前記複数の周波数ユニットである場合、前記利得関数は前記第1の利得関数であってもよく、前記利得係数は前記第1の利得係数であってもよく、前記変調パラメータが、前記複数の周波数ユニットに対応する前記複数の信号対ノイズ比である場合、前記利得関数は前記第2の利得関数であってもよく、前記利得係数は前記第2の利得係数であってもよく、前記変調パラメータが、前記複数の周波数ユニット及び前記複数の周波数ユニットに対応する前記複数の信号対ノイズ比である場合、前記利得関数は前記第3の利得関数であってもよく、前記利得係数は前記第3の利得係数であってもよい。
【0080】
前記利得関数がsigmoid関数に基づく単調関数であることを例とし、前記第1の利得関数は、以下の式で表されてもよく、
【数2】
ここで、y
1は、前記第1の利得係数であってもよく、iは、周波数ユニットに対応する周波数点の数であってもよく、f
1(i)は、周波数ユニットの正規化関数であってもよく、cは定数である。
図3は、本明細書の実施例によるいくつかの第1の利得関数の概略図を示す。
図3に示すように、横軸は、周波数ユニットに対応する周波数点の数iであり、縦軸は、前記第1の利得係数y
1である。前記第1の利得係数y
1は、周波数ユニットに対応する周波数点の数iと負の相関を有する。
【0081】
前記利得関数がsigmoid関数に基づく単調関数であることを例とし、前記第2の利得関数は、以下の式で表されてもよく、
【数3】
ここで、y
2は、前記第2の利得係数であってもよく、SNR[i]は、周波数点の数iに対応する信号対ノイズ比であってもよく、f
2(SNR[i])は、信号対ノイズ比の正規化関数であってもよく、cは定数である。
図4は、本明細書の実施例によるいくつかの第2の利得関数の概略図を示す。
図4に示すように、横軸は、信号対ノイズ比SNRであり、縦軸は、前記第2の利得係数y
2である。前記第2の利得係数y
2は、信号対ノイズ比SNRと正の相関を有する。
【0082】
前記利得関数がsigmoid関数に基づく単調関数であることを例とし、前記第3の利得関数は、以下の式で表されてもよく、
【数4】
ここで、y
3は、前記第3の利得係数であってもよく、iは、周波数ユニットに対応する周波数点の数であってもよく、SNR[i]は、周波数点の数iに対応する信号対ノイズ比であってもよく、f
3(i,SNR[i])は、周波数ユニットに対応する周波数点の数の正規化関数であってもよい。
図5は、本明細書の実施例によるいくつかの第3の利得関数の概略図を示し、
図6は、本明細書の実施例による別の第3の利得関数の概略図を示す。
【0083】
図5に示すように、横軸は、信号対ノイズ比SNRであり、縦軸は、前記第3の利得係数y
3である。ここで、曲線1は、周波数ユニットに対応する周波数点の数i=i
1の場合、第3の利得係数y
3と信号対ノイズ比SNRとの関係である。曲線2は、周波数ユニットに対応する周波数点の数i=i
2の場合、第3の利得係数y
3と信号対ノイズ比SNRとの関係である。曲線3は、周波数ユニットに対応する周波数点の数i=i
3の場合、第3の利得係数y
3と信号対ノイズ比SNRとの関係である。ここで、i
1<i
2<i
3である。
図5に示すように、前記第3の利得係数y
3は、周波数ユニットに対応する周波数点の数iと負の相関を有し、信号対ノイズ比SNRと正の相関を有する。
【0084】
図6に示すように、横軸は、周波数ユニットに対応する周波数点の数iであり、縦軸は、前記第3の利得係数y
3である。ここで、曲線4は、信号対ノイズ比SNR=SNR
1の場合、第3の利得係数y
3と周波数ユニットに対応する周波数点の数iとの関係である。曲線5は、信号対ノイズ比SNR=SNR
2の場合、第3の利得係数y
3と周波数ユニットに対応する周波数点の数iとの関係である。曲線6は、信号対ノイズ比SNR=SNR
3の場合、第3の利得係数y
3と周波数ユニットに対応する周波数点の数iとの関係である。ここで、SNR
1<SNR
2<SNR
3である。
図6に示すように、前記第3の利得係数y
3は、周波数ユニットに対応する周波数点の数iと負の相関を有し、信号対ノイズ比SNRと正の相関を有する。
【0085】
前記第3の利得関数は、より高精度なオーディオノイズ低減効果を達成するために、さらに、以下の式で表されてもよく、
【数5】
説明すべきこととして、
図3から
図6は、例示的な説明に過ぎず、前記利得関数はさらに、他の単調関数であってもよい。当業者であれば分かるように、要件を満たす全ての単調関数は、いずれも本明細書に記載の利得関数であり得、本明細書の保護範囲内にある。
【0086】
ステップS142は、以下のケースのうちの一つを含んでもよく、
前記変調パラメータが前記複数の周波数ユニットである場合、前記複数の周波数ユニット及び前記第1の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第1の利得係数を生成し、
前記変調パラメータが前記複数の周波数ユニットに対応する複数の信号対ノイズ比である場合、前記複数の信号対ノイズ比及び前記第2の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第2の利得係数を生成し、
前記変調パラメータが前記複数の周波数ユニット及び前記複数の信号対ノイズ比である場合、前記複数の信号対ノイズ比、前記複数の周波数ユニット及び前記第3の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第3の利得係数を生成する。
【0087】
ステップS140は、
前記利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得するS144をさらに含んでもよい。具体的には、システム100は、前記複数の周波数ユニットに対応する複数の利得係数に基づいて、前記複数の周波数ユニットのうちの各周波数ユニットを利得させて、前記ターゲットオーディオ信号を取得することができる。具体的には、システム100は、各周波数ユニットに対応する利得係数を現在の周波数ユニットに対応するオーディオ信号強度に乗算して、現在の周波数ユニットに対応する利得オーディオ信号を取得し、前記複数の周波数ユニットに対応する複数の利得オーディオ信号を重畳して、前記ターゲットオーディオ信号を取得することができる。
【0088】
前記ターゲットオーディオ信号において、有効なオーディオ信号をより多く含む周波数に対応するオーディオ信号は、より多く又は完全に保持され、有効なオーディオ信号をより少なく含み、ノイズ信号をより多く含む周波数に対応するオーディオ信号は、より多く又は完全に破棄される。
【0089】
以上のように、本明細書によるオーディオノイズ低減方法P100及びシステム100は、オーディオ信号の周波数を単位とし、各周波数の特性に基づいて、各周波数ユニットに対してそれぞれ利得処理を行い、有効なオーディオ信号をより多く含む周波数ユニットに対応するオーディオ信号をより多く保持するが、有効なオーディオ信号をより少なく含む周波数ユニットに対応するオーディオ信号をより少なく保持することによって、オーディオ信号の品質を向上させ、ノイズを低減するとともに、オーディオ信号の忠実度と了解度を向上させることができる。
【0090】
説明すべきこととして、システム100及び方法P100は、第1のオーディオノイズ低減アルゴリズムにより処理されたオーディオ信号に対してノイズ低減処理を行うために用いられてもよいし、第1のオーディオノイズ低減アルゴリズムにより処理されていないオーディオ信号に対してノイズ低減処理を行うために用いられてもよい。システム100及び方法P100は、また、第1のオーディオノイズ低減アルゴリズムと組み合わせて、オーディオ信号に対して共同でノイズ低減処理を行ってもよい。具体的には、電子機器200は、方法P200によりオーディオ信号に対してノイズ低減処理を行ってターゲットオーディオ信号を得た後、第1のオーディオノイズ低減アルゴリズムを用いて、前記ターゲットオーディオ信号に対してノイズ低減処理を行ってもよい。電子機器200は、また、第1のオーディオノイズ低減アルゴリズムを用いて、前記処理対象オーディオ信号に対してノイズ低減処理を行った後、方法P200により、前記第1のオーディオノイズ低減アルゴリズムにより処理されたオーディオ信号に対してノイズ低減処理を行って、ターゲットオーディオ信号を得てもよい。
【0091】
本明細書の別の態様は、非一時的な記憶媒体を提供し、オーディオノイズを低減するための少なくとも一組の実行可能な命令が記憶されており、前記実行可能な命令は、プロセッサにより実行される場合、本明細書に記載のオーディオノイズ低減方法P100のステップを実施するように前記プロセッサに指示する。いくつかの可能な実施形態において、本明細書の各態様はさらに、プログラムコードを含むプログラムプロダクトの形態で実現され得る。前記プログラムプロダクトが電子機器200上で作動する場合、前記プログラムコードは、本明細書に記載されるオーディオノイズ低減のステップを電子機器200に実行させるためのものである。上記方法を実現するためのプログラムプロダクトは、携帯型コンパクトディスクリードオンリメモリ(CD-ROM)を用いてもよく、プログラムコードを含み、電子機器200上で作動可能である。しかしながら、本明細書のプログラムプロダクトは、これに限定されるものではなく、本明細書では、可読記憶媒体は、プログラムを含むか又は記憶する任意の有形媒体であってもよく、該プログラムは、命令実行システム(例えば、プロセッサ220)によって使用されてもよく、又はそれと組み合わせて使用されてもよい。前記プログラムプロダクトは、一つ又は複数の可読媒体の任意の組み合わせを用い得る。可読媒体は、可読信号媒体又は可読記憶媒体であってもよい。可読記憶媒体は、例えば、電気、磁気、光学、電磁、赤外線、又は半導体のシステム、装置もしくはデバイス、又は以上の任意の組み合わせであってもよいが、これらに限定されない。可読記憶媒体は、更なる具体例として、一つ又は複数の導線を有する電気接続、携帯型ディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、携帯型コンパクトディスクリードオンリメモリ(CD-ROM)、光学メモリデバイス、磁気メモリデバイス、又はこれらの任意の適切な組み合わせを含む。前記コンピュータ可読記憶媒体は、ベースバンドで又は搬送波の一部として伝搬され、可読性のプログラムコードが搭載されるデータ信号を含んでもよい。このように伝搬されるデータ信号は、電磁信号、光信号、又はこれらの任意の適切な組み合わせなどの様々な形態をとることができるが、これらに限定されない。可読記憶媒体はさらに、可読記憶媒体以外の任意の可読媒体であってもよく、該可読媒体は、命令実行システム、装置又はデバイスにより使用され、又はそれらと組み合わせて使用されるプログラムを送信、伝搬又は伝送することができる。可読記憶媒体に含まれるプログラムコードは、任意の好適な媒体で伝送することができ、無線、有線、光ケーブル、RFなど、又は上記の任意の適切な組み合わせを含むが、これらに限定されない。本明細書の動作を実行するためのプログラムコードは、Java、C++などのようなオブジェクト指向プログラミング言語、「C」言語などのような一般的な手続き型プログラミング言語又は類似のプログラミング言語を含む一つ又は複数のプログラミング言語の任意の組み合わせで記述され得る。プログラムコードは、全部が電子機器200に実行されたり、一部が電子機器200に実行されたり、独立したソフトウェアパケットとして実行されたり、一部が電子機器200に実行されるとともに他部がリモート計算機器に実行されたり、全部がリモート計算機器に実行されたりし得る。
【0092】
以上、本明細書の特定の実施例について説明した。他の実施例は、添付の特許請求の範囲内にある。いくつかの場合に、特許請求の範囲に記載される動作又はステップは、実施例とは異なる順序で実行されてもよく、且つ依然として所望の結果を実現することができる。また、図面に示されるプロセスは、所望の結果を実現するために、必ずしも特定の順序又は連続的な順序を示す必要はない。いくつかの実施形態において、マルチタスク処理及び並列処理も可能であり、又は有利であり得る。
【0093】
以上のように、本詳細な開示内容を読めば、当業者であれば分かるように、前記の詳細な開示内容は、単なる例として提示され得、且つ限定的なものではなくてもよい。ここでは明記されていないが、当業者であれば理解できるように、本明細書は、実施例に対する様々な合理的な変更、改良、及び修正を網羅する必要がある。これらの変更、改良、及び修正は、本明細書によって提示されることを意図しており、且つ本明細書の例示的な実施例の精神及び範囲内にある。
【0094】
なお、本明細書におけるいくつかの用語は、本明細書の実施例を説明するために用いられている。例えば、「一実施例」、「実施例」及び/又は「いくつかの実施例」は、該実施例に関連して説明された特定の特徴、構造又は特性が、本明細書の少なくとも一つの実施例に含まれ得ることを意味する。そのため、本明細書の各部分において、「実施例」又は「一実施例」又は「代替実施例」に対する二つ以上の引用が必ずしも同じ実施例を指すとは限らないことは、強調され理解されるべきである。なお、特定の特徴、構造又は特性は、本明細書の一つ又は複数の実施例において好適に組み合わされてもよい。
【0095】
理解すべきこととして、本明細書の実施例の前記の説明において、一つの特徴の理解を容易にするために、本明細書は、本明細書を簡略化する目的で、様々な特徴を単一の実施例、図面又はそれらの説明に組み合わせている。しかしながら、これらの特徴の組み合わせが必須であるとは言えず、当業者は、本明細書を読む時に、そのうちの一部の特徴を抽出して単独の実施例として理解することが十分に可能である。つまり、本明細書における実施例は、複数の二次的実施例の統合として理解され得る。各二次的実施例の内容は、単一の前記の開示された実施例の全ての特徴よりも少ない場合にも成立する。
【0096】
本明細書に引用される各特許、特許出願、特許出願の刊行物、及び他の資料、例えば、記事、書籍、明細書、刊行物、文書、物品などは、参照によりここに組み込まれ得る。あらゆる目的のための全ての内容は、それに関連する任意の訴求書履歴、本文書と一致しないかもしくは矛盾する任意の同一の訴求書履歴、又は請求項の最も広い範囲に対する制限効果を有する任意の同一の訴求書履歴を除いて、現在又は今後、本文書と関連付けられる。例えば、含まれる任意の資料に関連する用語の説明、定義及び/又は使用が、本文書の関連する用語の説明、定義及び/又は使用の間にいずれかの不一致又は矛盾が存在する場合には、本文書における用語が優先するものとする。
【0097】
最後に、本明細書に開示された出願の実施形態は、本明細書の実施形態の原理についての説明であることを理解されたい。他の修正された実施例も本明細書の範囲内にある。そのため、本明細書に開示された実施例は、単なる例に過ぎず、限定するものではない。当業者は、本明細書における実施例に基づいて、代替的な構成を用いて本明細書における出願を実現することができる。そのため、本明細書の実施例は、出願において正確に説明された実施例に限定されない。
【手続補正書】
【提出日】2023-06-01
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
オーディオノイズ低減方法であって、
処理対象オーディオ信号の周波数に関連する変調パラメータを取得することと、
前記変調パラメータに対応する利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することと、を含む、ことを特徴とするオーディオノイズ低減方法。
【請求項2】
前記変調パラメータは、前記処理対象オーディオ信号の複数の周波数ユニット及び前記複数の周波数ユニットに対応する複数の信号対ノイズ比のうちの少なくとも一つを含む、ことを特徴とする請求項1に記載のオーディオノイズ低減方法。
【請求項3】
前記処理対象オーディオ信号は、初期オーディオ信号を第1のオーディオノイズ低減アルゴリズムで処理した後のオーディオ信号を含む、ことを特徴とする請求項2に記載のオーディオノイズ低減方法。
【請求項4】
前記第1のオーディオノイズ低減アルゴリズムは、スペクトルサブトラクション法、ウィーナーフィルタリング法、MMSEアルゴリズム、及びMMSEに基づく改良アルゴリズムのうちの少なくとも一つを含
み、
前記初期オーディオ信号は、第1のタイプのマイクロホンが出力した第1のオーディオ信号、第2のタイプのマイクロホンが出力した第2のオーディオ信号、及び前記第1のオーディオ信号と前記第2のオーディオ信号が融合されたオーディオ信号のうちの一つを含む、ことを特徴とする請求項3に記載のオーディオノイズ低減方法。
【請求項5】
前記の、前記変調パラメータに対応する利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することは、
前記変調パラメータ、及び前記利得係数と前記変調パラメータとの相関関係を含む予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成するここと、
前記利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することと、を含む、ことを特徴とする請求項2に記載のオーディオノイズ低減方法。
【請求項6】
前記利得関数は、単調関数である、ことを特徴とする請求項
5に記載のオーディオノイズ低減方法。
【請求項7】
前記利得係数は、前記複数の信号対ノイズ比と正の相関を有する、ことを特徴とする請求項
6に記載のオーディオノイズ低減方法。
【請求項8】
前記利得係数は、前記複数の周波数ユニットと負の相関を有する、ことを特徴とする請求項
7に記載のオーディオノイズ低減方法。
【請求項9】
前記変調パラメータは、前記複数の周波数ユニットであり、
前記利得関数は、第1の利得関数であり、第1の利得係数と周波数との相関関係を含み、
前記利得係数は、前記第1の利得係数であり、及び
前記の、前記変調パラメータ及び予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成することは、
前記複数の周波数ユニット及び前記第1の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第1の利得係数を生成することを含む、ことを特徴とする請求項
8に記載のオーディオノイズ低減方法。
【請求項10】
前記変調パラメータは、前記複数の周波数ユニットに対応する前記複数の信号対ノイズ比であり、
前記利得関数は、第2の利得関数であり、第2の利得係数と信号対ノイズ比との相関関係を含み、
前記利得係数は、前記第2の利得係数であり、及び
前記の、前記変調パラメータ及び予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成することは、
前記複数の信号対ノイズ比及び前記第2の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第2の利得係数を生成することを含む、ことを特徴とする請求項
8に記載のオーディオノイズ低減方法。
【請求項11】
前記変調パラメータは、前記複数の周波数ユニット及び前記複数の周波数ユニットに対応する前記複数の信号対ノイズ比であり、
前記利得関数は、第3の利得関数であり、第3の利得係数と周波数及び信号対ノイズ比との相関関係を含み、
前記利得係数は、前記第3の利得係数であり、及び
前記の、前記変調パラメータ及び予め設定された利得関数に基づいて、前記変調パラメータに対応する利得係数を生成することは、
前記複数の信号対ノイズ比、前記複数の周波数ユニット及び前記第3の利得関数に基づいて、前記複数の周波数ユニットに対応する複数の第3の利得係数を生成することを含む、ことを特徴とする請求項
8に記載のオーディオノイズ低減方法。
【請求項12】
前記利得関数は、sigmoid関数に基づく関数である、ことを特徴とする請求項
6に記載のオーディオノイズ低減方法。
【請求項13】
前記の、前記利得係数に基づいて前記処理対象オーディオ信号を利得させて、ターゲットオーディオ信号を取得することは、
前記利得係数に基づいて前記複数の周波数ユニットのうちの各周波数ユニットを利得させて、前記ターゲットオーディオ信号を取得することを含む、ことを特徴とする請求項
5に記載のオーディオノイズ低減方法。
【請求項14】
前記の、処理対象オーディオ信号の周波数に関連する変調パラメータを取得することは、
前記処理対象オーディオ信号の周波数に対応する初期変調パラメータを取得することと、
周波数を変数として前記初期変調パラメータの値を平滑化処理し、前記変調パラメータを取得することとを含
み、
前記周波数を変数として前記初期変調パラメータの値を平滑化処理することは、
前記複数の周波数ユニットのうちの各周波数ユニットに対応する初期信号対ノイズ比と、現在の周波数ユニットの近傍の少なくとも一つの周波数ユニットに対応する初期信号対ノイズ比とを特徴融合処理して、前記現在の周波数に対応する信号対ノイズ比を得ることを含む、ことを特徴とする請求項2に記載のオーディオノイズ低減方法。
【請求項15】
オーディオノイズ低減システムであって、
オーディオノイズを低減するための少なくとも一つの命令セットが記憶されている少なくとも一つの記憶媒体と、
前記少なくとも一つの記憶媒体に通信的に接続される少なくとも一つのプロセッサと、を含み、
ここで、前記オーディオノイズ低減システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って請求項1~
14のいずれか一項に記載のオーディオノイズ低減方法を実行する、ことを特徴とするオーディオノイズ低減システム。
【国際調査報告】