IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 深▲セン▼市韶音科技有限公司の特許一覧

特表2023-551556エコーの抑制のためのオーディオ信号処理方法及びシステム
<>
  • 特表-エコーの抑制のためのオーディオ信号処理方法及びシステム 図1
  • 特表-エコーの抑制のためのオーディオ信号処理方法及びシステム 図2
  • 特表-エコーの抑制のためのオーディオ信号処理方法及びシステム 図3
  • 特表-エコーの抑制のためのオーディオ信号処理方法及びシステム 図4
  • 特表-エコーの抑制のためのオーディオ信号処理方法及びシステム 図5
  • 特表-エコーの抑制のためのオーディオ信号処理方法及びシステム 図6
  • 特表-エコーの抑制のためのオーディオ信号処理方法及びシステム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-08
(54)【発明の名称】エコーの抑制のためのオーディオ信号処理方法及びシステム
(51)【国際特許分類】
   H04R 3/02 20060101AFI20231201BHJP
【FI】
H04R3/02
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023533789
(86)(22)【出願日】2020-12-28
(85)【翻訳文提出日】2023-06-01
(86)【国際出願番号】 CN2020140215
(87)【国際公開番号】W WO2022140928
(87)【国際公開日】2022-07-07
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
(71)【出願人】
【識別番号】514156013
【氏名又は名称】深▲セン▼市韶音科技有限公司
【氏名又は名称原語表記】SHENZHEN SHOKZ CO.,LTD.
【住所又は居所原語表記】Floors 1-4,Factory Building 26,Shancheng Industrial Park,Shiyan Street,Bao’an District,Shenzhen,Guangdong 518108,CHINA
(74)【代理人】
【識別番号】100205936
【弁理士】
【氏名又は名称】崔 海龍
(74)【代理人】
【識別番号】100132805
【弁理士】
【氏名又は名称】河合 貴之
(72)【発明者】
【氏名】鄭 金波
(72)【発明者】
【氏名】周 美林
(72)【発明者】
【氏名】廖 風云
(72)【発明者】
【氏名】齊 心
【テーマコード(参考)】
5D220
【Fターム(参考)】
5D220BA01
5D220BA21
5D220CC01
(57)【要約】
本明細書によって提供されるエコーの抑制のためのオーディオ信号処理方法及びシステムは、スピーカ信号強度に基づいて目標オーディオ処理モードの選択を制御する。前記方法及びシステムは、スピーカ信号強度に基づいて対応する制御信号を生成し、制御信号に基づいて目標オーディオ処理モードを制御し、より優れる音声品質が得られるようにマイクロフォン信号を信号処理する。システムは、スピーカ信号が閾値を超えていない場合、第1のモードを選択し、第1の目標オーディオが得られるように第1のオーディオ信号及び第2のオーディオ信号を信号処理する。システムは、スピーカ信号が閾値を超えている場合、第2のモードを選択し、第2の目標オーディオが得られるように第2のオーディオ信号を信号処理する。前記方法及びシステムは、スピーカ信号に基づいて目標オーディオ処理モードを切り替え、異なるシーンでより良い音声品質が得られることを確保し、音声通信品質を向上させることができる。
【選択図】図1
【特許請求の範囲】
【請求項1】
エコーの抑制のためのオーディオ信号処理方法であって、
少なくともスピーカ信号に基づいて複数のオーディオ処理モードから電子機器の目標オーディオ処理モードを選択するステップであって、前記スピーカ信号は、制御機器が前記電子機器に送信するオーディオ信号であるステップと、
前記目標オーディオ処理モードによってマイクロフォン信号を処理して目標オーディオを生成することにより、少なくとも前記目標オーディオにおけるエコーを低減するステップであって、前記マイクロフォン信号は、前記電子機器が取得するマイクロフォンモジュールの出力信号であり、前記マイクロフォンモジュールは、少なくとも1つの第1のタイプのマイクロフォン及び少なくとも1つの第2のタイプのマイクロフォンを含むステップと、
前記目標オーディオ信号を出力するステップと、を含む、
ことを特徴とするエコーの抑制のためのオーディオ信号処理方法。
【請求項2】
前記少なくとも1つの第1のタイプのマイクロフォンは、第1のオーディオ信号を出力し、及び、
前記少なくとも1つの第2のタイプのマイクロフォンは、第2のオーディオ信号を出力し、
ここで、前記マイクロフォン信号は、前記第1のオーディオ信号及び前記第2のオーディオ信号を含む、
ことを特徴とする請求項1に記載のオーディオ信号処理方法。
【請求項3】
前記少なくとも1つの第1のタイプのマイクロフォンは、人体振動信号の収集に用いられ、及び、
前記少なくとも1つの第2のタイプのマイクロフォンは、空気振動信号の収集に用いられる、
ことを特徴とする請求項2に記載のオーディオ信号処理方法。
【請求項4】
前記複数のオーディオ処理モードは、少なくとも、
前記第1のオーディオ信号及び前記第2のオーディオ信号を信号処理する第1のモードと、
前記第2のオーディオ信号を信号処理する第2のモードと、を含む、
ことを特徴とする請求項2に記載のオーディオ信号処理方法。
【請求項5】
少なくともスピーカ信号に基づいて複数のオーディオ処理モードから電子機器の目標オーディオ処理モードを選択する前記ステップは、
少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成するステップであって、前記制御信号が第1の制御信号又は第2の制御信号を含むステップと、
前記制御信号に基づいて、前記制御信号に対応する目標オーディオ処理モードを選択するステップであって、ここで、前記第1のモードが前記第1の制御信号に対応し、前記第2のモードが前記第2の制御信号に対応するステップと、を含む、
ことを特徴とする請求項4に記載のオーディオ信号処理方法。
【請求項6】
少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成する前記ステップは、
前記スピーカ信号強度が予め設定されたスピーカ閾値より低いと決定し、前記第1の制御信号を生成するステップ、あるいは、
前記スピーカ信号強度が前記スピーカ閾値より高いと決定し、前記第2の制御信号を生成するステップを含む、
ことを特徴とする請求項5に記載のオーディオ信号処理方法。
【請求項7】
少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成する前記ステップは、
前記スピーカ信号強度及び前記マイクロフォン信号に基づいて、対応する制御信号を生成するステップを含む、
ことを特徴とする請求項5に記載のオーディオ信号処理方法。
【請求項8】
前記スピーカ信号強度及び前記マイクロフォン信号に基づいて、対応する制御信号を生成する前記ステップは、
前記マイクロフォン信号の評価パラメータを取得するステップであって、前記評価パラメータは、環境ノイズ評価パラメータを含み、前記環境ノイズ評価パラメータは、環境ノイズレベル及び信号対雑音比の少なくとも1つを含むステップと、
前記スピーカ信号強度及び前記評価パラメータに基づいて、前記制御信号を生成するステップと、を含む、
ことを特徴とする請求項7に記載のオーディオ信号処理方法。
【請求項9】
前記スピーカ信号強度及び前記評価パラメータに基づいて、前記制御信号を生成するステップは、
前記スピーカ信号強度が予め設定されたスピーカ閾値より高いと決定し、前記第2の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲外にあると決定し、前記第1の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第1の制御信号又は前記第2の制御信号を生成するステップとのいずれかの場合を含む、
ことを特徴とする請求項8に記載のオーディオ信号処理方法。
【請求項10】
前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあることは、
前記環境ノイズレベルが予め設定された環境ノイズ閾値より低いことと、
前記信号対雑音比が予め設定された信号対雑音比閾値より高いことと、の少なくとも1つを含む、
ことを特徴とする請求項9に記載のオーディオ信号処理方法。
【請求項11】
前記評価パラメータは、人間音声信号強度をさらに含み、前記スピーカ信号強度及び前記評価パラメータに基づいて、前記制御信号を生成する前記ステップは、
前記スピーカ信号強度が予め設定されたスピーカ閾値より高く、かつ前記人間音声信号強度が予め設定された人間音声閾値を超え、前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲外にあると決定し、前記第1の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値を超え、前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第2の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値より低いと決定し、前記第2の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲外にあると決定し、前記第1の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第1の制御信号又は前記第2の制御信号を生成するステップとのいずれかの場合を含む、
ことを特徴とする請求項8に記載のオーディオ信号処理方法。
【請求項12】
前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあることは、
前記環境ノイズレベルが予め設定された環境ノイズ閾値より低いことと、
前記信号対雑音比が予め設定された信号対雑音比閾値より高いことと、の少なくとも1つを含む、
ことを特徴とする請求項11に記載のオーディオ信号処理方法。
【請求項13】
目標オーディオを生成する前記ステップは、
前記第1のモードにおける第1のアルゴリズムにより、前記第1のオーディオ信号及び前記第2のオーディオ信号を信号処理し、第1の目標オーディオを生成するステップ、あるいは、
前記第2のモードにおける第2のアルゴリズムにより、前記第2のオーディオ信号を信号処理し、第2の目標オーディオを生成するステップを含み、
ここで、前記目標オーディオは、前記第1の目標オーディオと前記第2の目標オーディオとのうちの1つを含む、
ことを特徴とする請求項5に記載のオーディオ信号処理方法。
【請求項14】
前記目標オーディオを出力する前記ステップは、
前記目標オーディオに対して平滑化処理を行い、前記目標オーディオが前記第1の目標オーディオと前記第2の目標オーディオとの間で切り替えられる時、前記第1の目標オーディオと前記第2の目標オーディオとの接続箇所に対して前記平滑化処理を行うステップと、
前記平滑化処理された前記目標オーディオを出力するステップと、を含む、
ことを特徴とする請求項13に記載のオーディオ信号処理方法。
【請求項15】
前記方法は、
前記制御信号に基づいて、前記スピーカのスピーカ入力信号の強度を制御するステップをさらに含む、
ことを特徴とする請求項5に記載のオーディオ信号処理方法。
【請求項16】
前記制御信号に基づいて、前記スピーカのスピーカ入力信号の強度を制御する前記ステップは、
前記制御信号を前記第1の制御信号として決定し、前記スピーカに入力される前記スピーカ入力信号の強度を低減することにより、前記スピーカが出力する音響の強度を低減するステップを含む、
ことを特徴とする請求項15に記載のオーディオ信号処理方法。
【請求項17】
エコーの抑制のためのオーディオ信号処理のシステムであって、
エコーを抑制するオーディオ信号処理のための少なくとも1つの指令セットが記憶されている少なくとも1つの記憶媒体と、
前記少なくとも1つの記憶媒体と通信可能に接続されている少なくとも1つのプロセッサと、を含み、
ここで、前記少なくとも1つのプロセッサは、前記システムが動作する場合、前記少なくとも1つの指令セットを読み取り、前記少なくとも1つの指令セットの指示に基づいて請求項1~16のいずれかに記載のエコーの抑制のためのオーディオ信号処理方法を実行する、
ことを特徴とするエコーの抑制のためのオーディオ信号処理のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書は、オーディオ信号処理分野に関し、特に、エコーの抑制のためのオーディオ信号処理方法及びシステムに関する。
【背景技術】
【0002】
現在、振動センサは、イヤホンなどの電子製品に用いられ、骨伝導マイクロフォンとして音声信号を受信する応用が増えている。人が話している時、骨格及び皮膚の振動を同時に引き起こし、これらの振動は、骨伝導の音声信号であり、骨伝導マイクロフォンによってピックアップされて信号を発生させることができる。システムは、骨伝導マイクロフォンが収集した振動信号を電気信号又は他のタイプの信号に変換し、電子機器に伝達してピックアップ機能を実現する。現在、ますます多くの電子機器は、異なる特性を有する気伝導マイクロフォンと骨伝導マイクロフォンとを組み合わせて、気伝導マイクロフォンを利用して外部のオーディオ信号をピックアップし、骨伝導マイクロフォンを利用して発声部位の振動信号をピックアップし、ピックアップした信号に対して音声強調処理及び融合を行う。骨伝導マイクロフォンをイヤホン又はスピーカを有する他の電子機器内に配置すると、骨伝導マイクロフォンは、人の発話時の振動信号だけでなく、イヤホン又は他の電子機器のスピーカが音を再生している時に発生する振動信号も受信することにより、エコー信号を発生させることができる。この場合、エコー消去アルゴリズム処理が必要となる。スピーカのエコー信号が異なると、マイクロフォンの音声品質にも影響を与える。例えば、スピーカの入力信号が強い場合、骨伝導マイクロフォンが受信するスピーカ振動信号が比較的大きく、骨伝導マイクロフォンが受信する人の発話時に発生する振動信号より遥かに大きく、この時、従来のエコー消去アルゴリズムでは、骨伝導マイクロフォンにおけるエコーを消去することは困難である。この時、気伝導マイクロフォン及び骨伝導マイクロフォンから出力されるマイクロフォン信号を音源信号として得られる音声品質が比較的悪い。したがって、マイクロフォンの音源信号を選択する時にスピーカのエコー信号を考慮しないのは合理的ではない。
【0003】
したがって、異なるスピーカ入力信号に基づいて入力される音源信号を切り替え、エコー消去の効果を向上させ、音声品質を向上させるように、エコーの抑制のための新たなオーディオ信号処理方法及びシステムを提供する必要がある。
【発明の概要】
【0004】
本明細書は、エコー消去の効果を向上させ、音声品質を向上させるように、エコーの抑制のための新たなオーディオ信号処理方法及びシステムを提供する。
【課題を解決するための手段】
【0005】
第1の態様において、本明細書は、少なくともスピーカ信号に基づいて複数のオーディオ処理モードから電子機器の目標オーディオ処理モードを選択するステップであって、前記スピーカ信号は、制御機器が前記電子機器に送信するオーディオ信号であるステップと、前記目標オーディオ処理モードによってマイクロフォン信号を処理して目標オーディオを生成することにより、少なくとも前記目標オーディオにおけるエコーを低減するステップであって、前記マイクロフォン信号は、前記電子機器が取得するマイクロフォンモジュールの出力信号であり、前記マイクロフォンモジュールは、少なくとも1つの第1のタイプのマイクロフォン及び少なくとも1つの第2のタイプのマイクロフォンを含むステップと、前記目標オーディオ信号を出力するステップと、を含むエコーの抑制のためのオーディオ信号処理方法を提供する。
【0006】
いくつかの実施形態では、前記少なくとも1つの第1のタイプのマイクロフォンは、第1のオーディオ信号を出力し、及び、前記少なくとも1つの第2のタイプのマイクロフォンは、第2のオーディオ信号を出力し、ここで、前記マイクロフォン信号は、前記第1のオーディオ信号及び前記第2のオーディオ信号を含む。
【0007】
いくつかの実施形態では、前記少なくとも1つの第1のタイプのマイクロフォンは、人体振動信号の収集に用いられ、及び、前記少なくとも1つの第2のタイプのマイクロフォンは、空気振動信号の収集に用いられる。
【0008】
いくつかの実施形態では、前記複数のオーディオ処理モードは、少なくとも、前記第1のオーディオ信号及び前記第2のオーディオ信号を信号処理する第1のモードと、前記第2のオーディオ信号を信号処理する第2のモードと、を含む。
【0009】
いくつかの実施形態では、少なくともスピーカ信号に基づいて複数のオーディオ処理モードから電子機器の目標オーディオ処理モードを選択する前記ステップは、少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成するステップであって、前記制御信号が第1の制御信号又は第2の制御信号を含むステップと、前記制御信号に基づいて、前記制御信号に対応する目標オーディオ処理モードを選択するステップであって、ここで、前記第1のモードが前記第1の制御信号に対応し、前記第2のモードが前記第2の制御信号に対応するステップと、を含む。
【0010】
いくつかの実施形態では、少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成する前記ステップは、前記スピーカ信号強度が予め設定されたスピーカ閾値より低いと決定し、前記第1の制御信号を生成するステップ、あるいは、前記スピーカ信号強度が前記スピーカ閾値より高いと決定し、前記第2の制御信号を生成するステップを含む。
【0011】
いくつかの実施形態では、少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成する前記ステップは、前記スピーカ信号強度及び前記マイクロフォン信号に基づいて、対応する制御信号を生成するステップを含む。
【0012】
いくつかの実施形態では、前記スピーカ信号強度及び前記マイクロフォン信号に基づいて、対応する制御信号を生成する前記ステップは、前記マイクロフォン信号の評価パラメータを取得するステップであって、前記評価パラメータは、環境ノイズ評価パラメータを含み、前記環境ノイズ評価パラメータは、環境ノイズレベルと信号対雑音比とのうちの少なくとも1つを含むステップと、前記スピーカ信号強度及び前記評価パラメータに基づいて、前記制御信号を生成するステップと、を含む。
【0013】
いくつかの実施形態では、前記スピーカ信号強度及び前記評価パラメータに基づいて、前記制御信号を生成するステップは、前記スピーカ信号強度が予め設定されたスピーカ閾値より高いと決定し、前記第2の制御信号を生成するステップと、前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲外にあると決定し、前記第1の制御信号を生成するステップと、前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第1の制御信号又は前記第2の制御信号を生成するステップとのいずれかの場合を含む。
【0014】
いくつかの実施形態では、前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあることは、前記環境ノイズレベルが予め設定された環境ノイズ閾値より低いことと、前記信号対雑音比が予め設定された信号対雑音比閾値より高いことと、の少なくとも1つを含む。
【0015】
いくつかの実施形態では、前記評価パラメータは、人間音声信号強度をさらに含み、前記スピーカ信号強度及び前記評価パラメータに基づいて、前記制御信号を生成する前記ステップは、前記スピーカ信号強度が予め設定されたスピーカ閾値より高く、かつ前記人間音声信号強度が予め設定された人間音声閾値を超え、前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲外にあると決定し、前記第1の制御信号を生成するステップと、前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値を超え、前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第2の制御信号を生成するステップと、前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値より低いと決定し、前記第2の制御信号を生成するステップと、前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲外にあると決定し、前記第1の制御信号を生成するステップと、前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第1の制御信号又は前記第2の制御信号を生成するステップとのいずれかの場合を含む。
【0016】
いくつかの実施形態では、前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあることは、前記環境ノイズレベルが予め設定された環境ノイズ閾値より低いことと、前記信号対雑音比が予め設定された信号対雑音比閾値より高いことと、の少なくとも1つを含む。
【0017】
いくつかの実施形態では、目標オーディオを生成する前記ステップは、前記第1のモードにおける第1のアルゴリズムにより、前記第1のオーディオ信号及び前記第2のオーディオ信号を信号処理し、第1の目標オーディオを生成するステップ、あるいは、前記第2のモードにおける第2のアルゴリズムにより、前記第2のオーディオ信号を信号処理し、第2の目標オーディオを生成するステップを含み、ここで、前記目標オーディオは、前記第1の目標オーディオと前記第2の目標オーディオとのうちの1つを含む。
【0018】
いくつかの実施形態では、前記目標オーディオを出力する前記ステップは、前記目標オーディオに対して平滑化処理を行い、前記目標オーディオが前記第1の目標オーディオと前記第2の目標オーディオとの間で切り替えられる時、前記第1の目標オーディオと前記第2の目標オーディオとの接続箇所に対して前記平滑化処理を行うステップと、前記平滑化処理された前記目標オーディオを出力するステップと、を含む。
【0019】
いくつかの実施形態では、前記方法は、前記制御信号に基づいて、前記スピーカのスピーカ入力信号の強度を制御するステップをさらに含む。
【0020】
いくつかの実施形態では、前記制御信号に基づいて、前記スピーカのスピーカ入力信号の強度を制御する前記ステップは、前記制御信号を前記第1の制御信号として決定し、前記スピーカに入力される前記スピーカ入力信号の強度を低減することにより、前記スピーカが出力する音響の強度を低減するステップを含む。
【0021】
第2の態様において、本明細書は、エコーを抑制するオーディオ信号処理のための少なくとも1つの指令セットが記憶されている少なくとも1つの記憶媒体と、前記少なくとも1つの記憶媒体と通信可能に接続されている少なくとも1つのプロセッサと、を含むエコーの抑制のためのオーディオ信号処理のシステムであって、ここで、前記少なくとも1つのプロセッサは、前記システムが動作する場合、前記少なくとも1つの指令セットを読み取り、前記少なくとも1つの指令セットの指示に基づいて本明細書の第1の態様に記載のエコーの抑制のためのオーディオ信号処理方法を実行するエコーの抑制のためのオーディオ信号処理のシステムをさらに提供する。
【0022】
以上の技術案から分かるように、本明細書によって提供されるエコーの抑制のためのオーディオ信号処理方法及びシステムは、スピーカ信号強度に基づいて前記スピーカ信号に対応する制御信号を生成し、制御信号に基づいてオーディオ処理モードを制御又は切り替えることにより、オーディオ処理モードに対応する音源信号を信号処理し、より優れる音声品質を取得することができる。前記システムは、スピーカ信号が閾値を超えていない場合、第1の制御信号を生成し、第1のモードを選択し、第1のオーディオ信号及び第2のオーディオ信号を第1の音源信号とし、第1の目標オーディオが得られるように第1の音源信号を信号処理する。スピーカ信号が閾値を超えている場合、第1のオーディオ信号におけるスピーカエコーが大きい。この時、前記システムは、第2の制御信号を生成し、第2のモードを選択し、第2のオーディオ信号を第2の音源信号とし、第2の目標オーディオが得られるように、第2の音源信号を信号処理する。前記方法及びシステムは、スピーカ信号に基づいて異なるオーディオ処理モードを切り替えることにより、マイクロフォン信号の音源信号を切り替え、音声品質を向上させ、異なるシーンでより良い音声品質が得られることを確保することができる。
【0023】
本明細書によって提供されるエコーの抑制のためのオーディオ信号処理方法及びシステムのその他の機能の一部は、以下の説明に記載される。説明によると、以下の数字及び例で紹介されている内容は、当業者にとって自明なことである。本明細書によって提供されるエコーの抑制のためのオーディオ信号処理方法及びシステムの創造的な態様は、以下の詳細な例に記載の方法、装置及び組み合わせを実践するか又は使用することによって十分に説明することができる。
【図面の簡単な説明】
【0024】
本明細書の実施形態における技術案をより明確に説明するために、以下に、実施形態の説明において使用する必要がある図面を簡単に説明するが、以下の説明における図面は、本明細書のいくつかの実施形態に過ぎず、当業者にとって創造的な労力を払うことなく、これらの図面に基づいて他の図面を得ることもできることは明白である。
図1】本明細書の実施形態に従って提供されるエコーの抑制のためのオーディオ信号処理システムのいくつかの応用シーンの概略図を示す。
図2】本明細書の実施形態に従って提供されるいくつかの電子機器の機器概略図を示す。
図3】本明細書の実施形態に従って提供されるいくつかの第1のモードの動作概略図を示す。
図4】本明細書の実施形態に従って提供されるいくつかの第2のモードの動作概略図を示す。
図5】本明細書の実施形態に従って提供されるエコーの抑制のためのオーディオ信号処理方法のいくつかのフローチャートを示す。
図6】本明細書の実施形態に従って提供されるエコーの抑制のためのオーディオ信号処理方法のいくつかのフローチャートを示す。
図7】本明細書の実施形態に従って提供されるエコーの抑制のためのオーディオ信号処理方法のいくつかのフローチャートを示す。
【発明を実施するための形態】
【0025】
以下の説明は、当業者が本明細書の内容を製造して使用できるようにするために、本明細書の特定の応用シーン及び要件を提供する。当業者にとっては、開示される実施形態に対する様々な局所的な補正が自明であり、本明細書で定義された一般的な原理は、本明細書の精神及び範囲を逸脱することなく、他の実施形態及び応用に適用され得る。したがって、本明細書は、示された実施形態に限定されるものではなく、請求項と一致する最も広い範囲である。
【0026】
本明細書で使用される用語は、特定の例示的な実施形態を説明する目的のみに使用され、限定的なものではない。例えば、文脈で特に明記されていない限り、ここで使用される、単数形の「1」、「1つ」及び「当該」は、複数形を含むこともできる。本明細書で使用される場合、「含む」、「包含」及び/又は「含有」という用語は、関連する整数、ステップ、動作、要素及び/又は構成要素が存在するが、1つ又は複数の他の特徴、整数、ステップ、動作、要素、構成要素及び/又はグループの存在を排除するものではなく、又は当該システム/方法に他の特徴、整数、ステップ、動作、要素、構成要素及び/又はグループを追加してもよいことを意味する。
【0027】
以下の説明を考慮すると、本明細書のこれらの特徴及びその他の特徴、構造の関連要素の動作及び機能、ならびに部品の組み合わせ及び製造の経済性を著しく向上させることができる。図面を参照すると、これらはすべて本明細書の一部を形成する。しかしながら、図面は、説明及び記載の目的のためだけに使用され、本明細書の範囲を限定することを意図していないことは明確に理解すべきである。図面は比例して描かれていないことも理解すべきである。
【0028】
本明細書で使用されるフローチャートは、本明細書におけるいくつかの実施形態のシステムによって実現される動作を示す。フローチャートの動作は、順序通りに実現しなくてもよいことを明確に理解すべきである。逆に、動作は、順序を逆にしたり、同時に実現したりできる。なお、フローチャートに1つ又は複数の他の動作を追加することができる。フローチャートから1つ又は複数の動作を削除することができる。
【0029】
図1は、本明細書の実施形態に従って提供されるエコーの抑制のためのオーディオ信号処理システム100(以下に、単にシステム100という)の応用シーンの概略図を示す。システム100は、電子機器200及び制御機器400を含むことができる。
【0030】
電子機器200は、本明細書に記載のエコーの抑制のためのオーディオ信号処理方法を実行するデータ又は指令を記憶することができ、前記データ及び/又は指令を実行することができる。いくつかの実施形態では、電子機器200は、ワイヤレスイヤホン、有線イヤホン、スマートウェアラブルデバイス、例えば、スマートメガネ、スマートヘルメット、スマート腕時計などの音声収集機能及び音声再生機能を有する機器であってもよい。電子機器200は、モバイルデバイス、タブレット、ノートパソコン、自動車内蔵機器又は同様のコンテンツ、又はそれらの任意の組み合わせであってもよい。いくつかの実施形態では、モバイルデバイスは、スマートホームデバイス、スマートモバイルデバイス又は同様のデバイス、又はそれらの任意の組み合わせを含むことができる。例えば、前記スマートモバイルデバイスは、携帯電話、パーソナルデジタルアシスタント、ゲームデバイス、ナビゲーションデバイス、スーパーモバイルパーソナルコンピュータ(Ultra-mobile Personal Computer、UMPC)など、又はそれらの任意の組み合わせを含むことができる。いくつかの実施形態では、前記スマートホームデバイスは、スマートテレビ、デスクトップパソコンなど、又は任意の組み合わせを含むことができる。いくつかの実施形態では、自動車内の内蔵装置は、車載コンピュータ、車載テレビなどを含むことができる。
【0031】
制御機器400は、電子機器200と有線及び/又は無線オーディオ信号通信を行うリモートデバイスであってもよい。制御機器400は、電子機器200と通信可能に接続されている機器であってもよい。電子機器200は、ローカルのオーディオ信号を収集して制御機器400に出力することができる。電子機器200は、制御機器400が送信した遠端オーディオ信号を受信して出力することもできる。前記遠端オーディオ信号は、スピーカ信号とも呼ばれる。制御機器400は、音声収集機能及び音声再生機能を有する機器、例えば、携帯電話、タブレット、ノートパソコン、イヤホン、スマートウェアラブルデバイス、自動車内蔵装置又は類似のコンテンツ、又はそれらの任意の組み合わせであってもよい。例えば、電子機器200がイヤホンである場合、制御機器400は、前記イヤホンと通信可能に接続されている端末機器、例えば、携帯電話、パソコンなどであってもよい。
【0032】
図1に示すように、電子機器200は、マイクロフォンモジュール240及びスピーカ280を含むことができる。マイクロフォンモジュール240は、ローカルオーディオ信号を取得し、オーディオ情報が含まれている電子信号であるマイクロフォン信号を出力するように構成されてもよい。マイクロフォンモジュール240は、耳外マイクロフォンモジュールであってもよく、耳内マイクロフォンモジュールであってもよい。例えば、マイクロフォンモジュール240は、耳道外に設けられているマイクロフォンであってもよいし、耳道内に設けられているマイクロフォンであってもよい。マイクロフォンモジュール240は、少なくとも1つの第1のタイプのマイクロフォン242及び少なくとも1つの第2のタイプのマイクロフォン244を含むことができる。第1のタイプのマイクロフォン242は、第2のタイプのマイクロフォン244と異なる。第1のタイプのマイクロフォン242は、人体振動信号を直接収集するマイクロフォン、例えば、骨伝導マイクロフォンであってもよい。第2のタイプのマイクロフォン244は、空気振動信号を直接収集するマイクロフォン、例えば、気伝導マイクロフォンであってもよい。もちろん、第1のタイプのマイクロフォン242及び第2のタイプのマイクロフォン244は、他のタイプのマイクロフォンであってもよい。例えば、第1のタイプのマイクロフォン242は、光学式マイクロフォンであってもよく、第2のタイプのマイクロフォン244は、筋電信号を受信するマイクロフォンなどであってもよい。第1のタイプのマイクロフォン242が第2のタイプのマイクロフォン244と異なるため、知覚オーディオ信号の表現が異なり、対応するオーディオ信号におけるノイズ及びエコー成分が異なることになる。説明の便宜上、本開示は、以下の説明において、第1のタイプのマイクロフォン242の例として骨伝導マイクロフォンを使用し、第2のタイプのマイクロフォン244の例として気伝導マイクロフォンを使用する。
【0033】
骨伝導マイクロフォンは、光学振動センサ、加速度センサなどの振動センサを含むことができる。前記振動センサは、機械的な振動信号(例えば、ユーザ002が話している時に皮膚や骨格に発生する振動による信号)を収集し、当該機械的な振動信号を電気信号に変換することができる。ここでいう機械的な振動信号とは、主に固体を介して伝播する振動のことである。骨伝導マイクロフォンは、前記振動センサ又は前記振動センサに接続されている振動部品によってユーザ002の肌又は骨格に接触することにより、ユーザ002が音を発する時に骨格や皮膚に発生する振動信号を収集し、振動信号を電気信号に変換する。いくつかの実施形態では、前記振動センサは、機械的な振動に敏感であるが、空気振動に敏感ではない装置(すなわち、前記振動センサの機械的な振動に対する応答能力が前記振動センサの空気振動に対する応答能力を上回る)であってもよい。骨伝導マイクロフォンが発声部位の振動を直接ピックアップすることができるため、骨伝導マイクロフォンは、環境ノイズの影響を低減することができる。
【0034】
気伝導マイクロフォンは、ユーザ002が音を発する時に発生する空気振動信号を収集し、空気振動信号を電気信号に変換する。気伝導マイクロフォンは、単独の気伝導マイクロフォンであってもよいし、2つ以上の気伝導マイクロフォンからなるマイクロフォンアレイであってもよい。マイクロフォンアレイは、ビームからなるマイクロフォンアレイ又は他の同様のマイクロフォンアレイであってもよい。マイクロフォンアレイによって空間の異なる方向又は異なる位置からの音を収集することができる。
【0035】
第1のタイプのマイクロフォン242は、第1のオーディオ信号243を出力することができる。第2のタイプのマイクロフォン244は、第2のオーディオ信号245を出力することができる。前記マイクロフォン信号は、前記第1のオーディオ信号243及び前記第2のオーディオ信号245を含む。低ノイズシーンでは、第2のオーディオ信号245は、第1のオーディオ信号243よりも良好な音声品質を有する。環境ノイズが比較的大きいシーンでは、低周波数部で第1のオーディオ信号243の音声品質が高く、高周波数部で第2のオーディオ信号245の音声品質が高くなる。したがって、環境ノイズが比較的大きいシーンでは、第1のオーディオ信号243と第2のオーディオ信号245を特徴融合したオーディオ信号は、より良好な音声品質を有する。実際の使用中に、環境のノイズは常に変化し、前記低ノイズシーンと前記高ノイズシーンの間で繰り返して変換することがある。
【0036】
スピーカ280は、電気信号をオーディオ信号に変換することができる。スピーカ280は、制御機器400からの前記スピーカ信号を受信して出力するように構成されてもよい。説明の便宜上、スピーカ280に入力されるオーディオ信号をスピーカ入力信号と定義する。いくつかの実施形態では、前記スピーカ入力信号は、前記スピーカ信号であってもよい。いくつかの実施形態では、電子機器200は、前記スピーカ信号を信号処理し、信号処理されたオーディオ信号をスピーカ280に送信して出力することができる。この時、前記スピーカ入力信号は、電子機器200が前記スピーカ信号を信号処理して得られるオーディオ信号であってもよい。
【0037】
前記スピーカ入力信号がスピーカ280を介して出力された音は、気伝導又は骨伝導によってユーザ002に伝達されてもよい。スピーカ280は、人体に振動信号を伝達することにより、音を伝達するスピーカ、例えば、骨伝導スピーカであってもよいし、空気によって振動信号を伝達するスピーカ、例えば、気伝導スピーカであってもよい。骨伝導スピーカは、振動モジュールによって機械的な振動を発生し、骨格を介して前記機械的な振動を耳内に伝導する。例えば、スピーカ280は、直接又は特定の媒体(例えば、1つ又は複数のパネル)を介してユーザ002の頭部に接触し、前記オーディオ信号を頭蓋骨で振動することによってユーザの聴覚神経に伝達することができる。気伝導スピーカは、振動モジュールによって空気中に振動を発生し、前記空気振動を空気を介して耳内に伝導する。スピーカ280は、骨伝導スピーカと気伝導スピーカとの組み合わせであってもよい。スピーカ280は、他のタイプのスピーカであってもよい。前記スピーカ入力信号がスピーカ280を介して出力された音は、マイクロフォンモジュール240によって収集されてエコーとなる可能性がある。前記スピーカ入力信号の強度が大きいほど、スピーカ280が出力する音声強度が大きく、前記エコー信号は強くなる。
【0038】
なお、マイクロフォンモジュール240とスピーカ280は、電子機器200に一体化されていてもよいし、電子機器200の外部機器であってもよい。
【0039】
第1のタイプのマイクロフォン242及び第2のタイプのマイクロフォン244が動作している場合、ユーザ002が発する音だけではなく、環境ノイズも、スピーカ280が発する音も収集することができる。電子機器200は、マイクロフォンモジュール240によってオーディオ信号を収集して前記マイクロフォン信号を生成することができる。前記マイクロフォン信号は、第1のオーディオ信号243及び第2のオーディオ信号245を含むことができる。異なるシーンでは、第1のオーディオ信号243と第2のオーディオ信号245の音声品質は異なる。音声通信の品質を確保するために、電子機器200は、異なる応用シーンに応じて、複数のオーディオ処理モードから目標オーディオ処理モードを選択し、前記マイクロフォン信号から音声品質がより良いオーディオ信号を音源信号として選択し、前記目標オーディオ処理モードによって前記音源信号を信号処理して制御機器400に出力することができる。前記音源信号は、前記目標オーディオ処理モードの入力信号であってもよい。いくつかの実施形態では、前記信号処理は、ノイズ信号を低減するために、ノイズ抑制を含むことができる。いくつかの実施形態では、前記信号処理は、エコー信号を低減するためのエコー抑制を含むことができる。いくつかの実施形態では、前記信号処理は、前記ノイズ抑制を含むことができるし、前記エコー抑制を含むことができる。いくつかの実施形態では、前記信号処理は、前記音源信号を直接出力することもできる。説明の便宜上、以下の説明において、前記信号処理が前記エコー抑制を含むことについて説明する。当業者であれば、他の信号処理方式はいずれも本明細書の保護範囲内にあることを理解すべきである。
【0040】
電子機器200による前記目標オーディオ処理モードの選択は、環境ノーズのほか、前記スピーカ信号にも関係する。いくつかのシーンでは、例えば、前記スピーカ信号が比較的小さく、スピーカ280が出力する音も小さい場合、第1のタイプのマイクロフォン242が出力する第1のオーディオ信号243と第2のタイプのマイクロフォン244が出力する第2のオーディオ信号245を特徴融合したオーディオ信号の音声品質は、第2のタイプのマイクロフォン244が出力する第2のオーディオ信号245の音声品質より優れている。
【0041】
前記スピーカ信号が比較的大きく、スピーカ280が出力する音も比較的大きいなどいくつかの特別なシーンでは、第1のタイプのマイクロフォン242が出力する前記第1のオーディオ信号243に対する影響が比較的大きく、前記第1のオーディオ信号243におけるエコーが比較的大きい。いくつかの実施形態では、前記第1のオーディオ信号243におけるエコー信号がユーザ002の音声信号を超える。特に、スピーカ280が骨伝導スピーカである場合、前記第1のオーディオ信号243におけるエコー信号がより顕著である。従来のエコー消去アルゴリズムでは、前記第1のオーディオ信号243におけるエコー信号を消去することが困難であり、エコー消去の効果を確保することができない。この時、第2のタイプのマイクロフォン244が出力する第2のオーディオ信号245の音声品質は、第1のタイプのマイクロフォン242が出力する第1のオーディオ信号243と第2のタイプのマイクロフォン244が出力する第2のオーディオ信号245を特徴融合したオーディオ信号の音声品質より優れている。
【0042】
したがって、電子機器200は、前記スピーカ信号に基づいて前記複数のオーディオ処理モードから前記目標オーディオ処理モードを選択して前記マイクロフォン信号に対して前記信号処理を行うことができる。前記複数のオーディオ処理モードは、少なくとも第1のモード1及び第2のモード2を含むことができる。
【0043】
第1のモード1は、第1のオーディオ信号243及び第2のオーディオ信号245を信号処理することができる。前述したように、いくつかの実施形態では、前記信号処理は、ノイズ信号を低減するためのノイズ抑制を含むことができる。いくつかの実施形態では、前記信号処理は、エコー信号を低減するためのエコー抑制を含むことができる。いくつかの実施形態では、前記信号処理は、前記ノイズ抑制と前記エコー抑制の両方を含むことができる。説明の便宜上、以下の説明において、前記信号処理が前記エコー抑制を含むことについて説明する。当業者であれば、他の信号処理方式はいずれも本明細書の保護範囲内にあることを理解すべきである。
【0044】
第2のモード2は、第2のオーディオ信号245を信号処理することができる。いくつかの実施形態では、前記信号処理は、ノイズ信号を低減するためのノイズ抑制を含むことができる。いくつかの実施形態では、前記信号処理は、エコー信号を低減するためのエコー抑制を含むことができる。いくつかの実施形態では、前記信号処理は、前記ノイズ抑制と前記エコー抑制の両方を含むことができる。説明の便宜上、以下の説明において、前記信号処理が前記エコー抑制を含むことについて説明する。当業者であれば、他の信号処理方式はいずれも本明細書の保護範囲内にあることを理解すべきである。
【0045】
前記目標オーディオ処理モードは、第1のモード1及び第2のモード2の1つである。前記複数のオーディオ処理モードは、第1のオーディオ信号243を信号処理する処理モードなどの他のモードを含むことができる。
【0046】
したがって、前記スピーカ信号が比較的小さい場合、音声通信に適用される音声が比較的高い品質を有することを確保するために、電子機器200は、第1のモード1を選択し、第1のオーディオ信号243及び第2のオーディオ信号245を音源信号とし、前記音源信号を信号処理し、第1の目標オーディオ291を生成して出力し、音声通信に適用する。前記スピーカ信号が比較的大きい場合、音声通信に適用される音声が比較的高い品質を有することを確保するために、電子機器200は、第2のモード2を選択し、第2のオーディオ信号245を音源信号とし、前記音源信号を信号処理し、第2の目標オーディオ292を生成して出力し、音声通信に適用する。
【0047】
電子機器200は、本明細書に記載のエコーの抑制のためのオーディオ信号処理方法のデータ又は指令を実行し、前記マイクロフォン信号及び前記スピーカ信号を取得することができ、電子機器200は、前記スピーカ信号の信号強度に基づいて、対応する目標オーディオ処理モードを選択して前記マイクロフォン信号を信号処理することができる。具体的には、電子機器200は、前記スピーカ信号強度に基づいて、複数のオーディオ処理モードから前記スピーカ信号強度に対応する目標オーディオ処理モードを選択し、前記第1のオーディオ信号243及び前記第2のオーディオ信号245から音声品質がより良いオーディオ信号又はそれらの組み合わせを音源信号として選択し、対応する信号処理アルゴリズムを利用して前記音源信号を信号処理(例えば、エコー消去及びノイズ低減処理)し、目標オーディオを生成して出力し、前記目標オーディオにおけるエコーを低減する。前記目標オーディオは、第1の目標オーディオ291と第2の目標オーディオ292とのうちの1つを含むことができる。電子機器200は、前記目標オーディオを制御機器400に出力することができる。
【0048】
以上のようにして、通信の音声品質を確保するために、電子機器200は、前記スピーカ信号強度に基づいて、目標オーディオ処理モードを制御して選択することにより、音声品質がより良いオーディオ信号を電子機器200の音源信号として選択し、前記音源信号を信号処理し、異なる使用シーンに対して異なる目標オーディオを取得し、異なる使用シーンでは、前記目標オーディオの音声品質が最適であることを確保することができる。
【0049】
図2は、電子機器200の機器概略図を示す。電子機器200は、本明細書に記載のエコーの抑制のためのオーディオ信号処理方法を実行することができる。前記エコーの抑制のためのオーディオ信号処理方法は、本明細書の他の部分で紹介される。例えば、図5図7の説明において前記エコーの抑制のためのオーディオ信号処理方法を説明する。
【0050】
図2に示すように、電子機器200は、マイクロフォンモジュール240及びスピーカ280を含むことができる。いくつかの実施形態では、電子機器200は、少なくとも1つの記憶媒体230及び少なくとも1つのプロセッサ220を含むこともできる。
【0051】
記憶媒体230は、データ記憶装置を含むことができる。前記データ記憶装置は、非一時的な記憶媒体であってもよいが、一時的な記憶媒体であってもよい。例えば、前記データ記憶装置は、磁気ディスク、読み取り専用記憶媒体(ROM)、又はランダムアクセス記憶媒体(RAM)のうちの1つ又は複数を含むことができる。記憶媒体230は、エコーの抑制のためのオーディオ信号処理のために、前記データ記憶装置に記憶されている少なくとも1つの指令セットを含むこともできる。前記指令は、コンピュータプログラムコードであり、前記コンピュータプログラムコードは、本明細書によって提供されるエコーの抑制のためのオーディオ信号処理方法を実行するプログラム、ルーチン、オブジェクト、構成要素、データ構造、プロセス、モジュールなどを含むことができる。
【0052】
図2に示すように、前記少なくとも1つの指令セットは、前記スピーカ信号又は前記スピーカ信号及び前記マイクロフォン信号に基づいて前記スピーカ信号に対応する制御信号を生成するように構成される制御モジュール231によって発行される制御指令を含むことができる。前記制御信号は、第1の制御信号又は第2の制御信号を含む。ここで、前記第1の制御信号は、第1のモード1に対応する。前記第2の制御信号は、第2のモード2に対応する。前記制御信号は、任意の信号であってもよく、例えば、前記第1の制御信号は、信号1であってもよく、前記第2の制御信号は、信号2であってもよい。制御モジュール231が発行する制御指令は、前記スピーカ信号の信号強度又は前記スピーカ信号の信号強度及び前記マイクロフォンの評価パラメータに基づいて、対応する制御信号を生成することができる。前記制御信号と前記スピーカ信号又は前記スピーカ信号及び前記マイクロフォン信号との対応関係については後述する。制御モジュール231は、前記制御信号に基づいて前記制御信号に対応する目標オーディオ信号処理モードを選択することもできる。前記制御信号が前記第1の制御信号である場合、制御モジュール231は、第1のモード1を選択し、前記制御信号が前記第2の制御信号である場合、制御モジュール231は、第2のモード2を選択する。
【0053】
いくつかの実施形態では、前記少なくとも1つの指令セットは、前記制御信号に基づいて、電子機器200の前記目標オーディオ処理モードによって前記マイクロフォン信号を信号処理する(例えば、エコー抑制、ノイズ低減処理など)ように構成されるエコー処理モジュール233によって発行されるエコー処理指令を含むこともできる。エコー処理モジュール233は、前記制御信号が前記第1の制御信号である場合、第1のモード1を採用して前記マイクロフォン信号を信号処理する。エコー処理モジュール233は、前記制御信号が前記第2の制御信号である場合、第2のモード2を採用して前記マイクロフォン信号を信号処理する。
【0054】
前記エコー処理モジュール233は、第1のアルゴリズム233-1及び第2のアルゴリズム233-8を含むことができる。前記第1のアルゴリズム233-1は、前記第1の制御信号及び前記第1のモード1に対応する。前記第2のアルゴリズム233-8は、前記第2の制御信号及び前記第2のモード2に対応する。
【0055】
第1のモード1では、電子機器200は、第1のアルゴリズム233-1を採用して第1のオーディオ信号243及び第2のオーディオ信号245のそれぞれを信号処理し、前記信号処理された第1のオーディオ信号243と第2のオーディオ信号245を特徴融合し、前記第1の目標オーディオ291を出力する。
【0056】
図3は、本明細書の実施形態に従って提供される第1のモード1の動作概略図を示す。図3に示すように、第1のモード1では、第1のアルゴリズム233-1は、前記第1のオーディオ信号243と前記第2のオーディオ信号245及び前記スピーカ入力信号を受信することができる。第1のアルゴリズム233-1は、第1のエコー消去モジュール233-2を使用して前記スピーカ入力信号に基づいて前記第1のオーディオ信号243をエコー消去することができる。前記スピーカ入力信号は、ノイズ低減処理されたオーディオ信号であってもよい。第1のエコー消去モジュール233-2は、前記第1のオーディオ信号243及び前記スピーカ入力信号を受信し、エコー消去後の前記第1のオーディオ信号243を出力する。第1のエコー消去モジュール233-2は、シングルマイクロフォンエコー消去アルゴリズムであってもよい。
【0057】
いくつかの実施形態では、第1のアルゴリズム233-1は、第2のエコー消去モジュール233-2を使用して前記スピーカ入力信号に基づいて前記第2のオーディオ信号245をエコー消去することができる。第2のエコー消去モジュール233-3は、前記第2のオーディオ信号245及び前記スピーカ入力信号を受信し、エコー消去後の前記第2のオーディオ信号245を出力する。第2のエコー消去モジュール233-3は、シングルマイクロフォンエコー消去アルゴリズムであってもよいし、マルチマイクロフォンエコー消去アルゴリズムであってもよい。第1のエコー消去モジュール233-2と第2のエコー消去モジュール233-3は、同一であってもよいし、異なっていてもよい。
【0058】
いくつかの実施形態では、第1のアルゴリズム233-1は、第1のノイズ抑制モジュール233-4を使用してエコー消去後の前記第1のオーディオ信号243及び前記第2のオーディオ信号245をノイズ抑制することができる。第1のノイズ抑制モジュール233-4は、前記第1のオーディオ信号243及び前記第2のオーディオ信号245におけるノイズ信号を抑制するために使用される。第1のノイズ抑制モジュール233-4は、エコー消去後の前記第1のオーディオ信号243及び前記第2のオーディオ信号245を受信し、ノイズ抑制後の前記第1のオーディオ信号243及び前記第2のオーディオ信号245を出力する。第1のノイズ抑制モジュール233-4は、前記第1のオーディオ信号243と前記第2のオーディオ信号245を個別にノイズ低減してもよいし、前記第1のオーディオ信号243と前記第2のオーディオ信号245を同時にノイズ低減してもよい。
【0059】
いくつかの実施形態では、前記第1のアルゴリズム233-1は、特徴融合モジュール233-5を使用してノイズ抑制された前記第1のオーディオ信号243及び前記第2のオーディオ信号245に対して特徴融合処理を行うことができる。特徴融合モジュール233-5は、ノイズ低減処理された前記第1のオーディオ信号243及び前記第2のオーディオ信号245を受信する。特徴融合モジュール233-5は、前記第1のオーディオ信号243及び前記第2のオーディオ信号245の音声品質を分析することができる。例えば、特徴融合モジュール233-5は、前記第1のオーディオ信号243及び前記第2のオーディオ信号245における有効な音声信号強度、ノイズ信号強度、エコー信号強度及び信号対雑音比などを分析し、前記第1のオーディオ信号243及び前記第2のオーディオ信号245の音声品質を判断し、第1のオーディオ信号243と前記第2のオーディオ信号245を前記第1の目標オーディオ291に融合して出力することができる。
【0060】
いくつかの実施形態では、第1のアルゴリズム233-1は、第2のノイズ抑制モジュール233-6を使用して前記スピーカ信号をノイズ抑制することもできる。第2のノイズ抑制モジュール233-6は、前記スピーカ信号におけるノイズ信号を抑制するために使用される。第2のノイズ抑制モジュール233-6は、制御機器400が送信した前記スピーカ信号を受信し、前記スピーカ信号における遠端ノイズ、チャンネルノイズ及び電子機器200における電子ノイズなどのノイズ信号を除去し、ノイズ低減処理されたスピーカ処理信号を出力する。
【0061】
なお、図3は、例示的な説明にすぎない。当業者であれば、いくつかの実施形態では、第1のアルゴリズム233-1が特徴融合モジュール233-5を含むことができることを理解すべきである。別の実施形態では、第1のアルゴリズム233-1は、第1のエコー消去モジュール233-2、第2のエコー消去モジュール233-3、第1のノイズ抑制モジュール233-4及び第2のノイズ抑制モジュール233-6のうちのいずれか1つ又はそれらの任意の組み合わせを含むこともできる。
【0062】
第2のモード2では、電子機器200は、第2のアルゴリズム233-8を採用して第2のオーディオ信号245を信号処理し、前記第2の目標オーディオ292を出力する。
【0063】
図4は、本明細書の実施形態に従って提供される第2のモード2の動作概略図を示す。図4に示すように、第2のモード2では、第2のアルゴリズム233-8は、前記第2のオーディオ信号245及び前記スピーカ入力信号を受信することができる。第2のアルゴリズム233-8は、第3のエコー消去モジュール233-9を使用して前記スピーカ入力信号に基づいて前記第2のオーディオ信号245をエコー消去することができる。第3のエコー消去モジュール233-9は、前記第2のオーディオ信号245及び前記スピーカ入力信号を受信し、エコー消去後の前記第2のオーディオ信号245を出力する。第3のエコー消去モジュール233-9は、第2のエコー消去モジュール233-3と同一であってもよいし、異なっていてもよい。
【0064】
いくつかの実施形態では、第2のアルゴリズム233-8は、第3のノイズ抑制モジュール233-10を使用してエコー消去後の前記第2のオーディオ信号245をノイズ抑制することができる。第3のノイズ抑制モジュール233-10は、前記第2のオーディオ信号245におけるノイズ信号を抑制するために使用される。第3のノイズ抑制モジュール233-10は、エコー消去後の前記第2のオーディオ信号245を受信し、ノイズ抑制後の前記第2のオーディオ信号245を前記第2の目標オーディオ292として出力する。第3のノイズ抑制モジュール233-10は、第1のノイズ抑制モジュール233-4と同一であってもよいし、異なっていてもよい。
【0065】
いくつかの実施形態では、第2のアルゴリズム233-8は、第4のノイズ抑制モジュール233-11を使用して前記スピーカ信号をノイズ抑制することもできる。第4のノイズ抑制モジュール233-11は、前記スピーカ信号におけるノイズ信号を抑制するために使用される。第4のノイズ抑制モジュール233-11は、制御機器400が送信した前記スピーカ信号を受信し、前記スピーカ信号における遠端ノイズ、チャンネルノイズ及び電子機器200における電子ノイズなどのノイズ信号を除去し、ノイズ低減処理されたスピーカ処理信号を出力する。第4のノイズ抑制モジュール233-11は、第2のノイズ抑制モジュール233-6と同一であってもよいし、異なっていてもよい。
【0066】
なお、図4は、例示的な説明にすぎない。当業者であれば、いくつかの実施形態では、第2のアルゴリズム233-8は、第3のエコー消去モジュール233-9、第3のノイズ抑制モジュール233-10及び第4のノイズ抑制モジュール233-11のうちのいずれか又はそれらの組み合わせを含むことができることを理解すべきである。別の実施形態では、第2のアルゴリズム233-8は、上記のいずれの信号処理モジュールを含まずに、前記第2のオーディオ信号245を直接出力することもできる。
【0067】
第1のモード1及び第2のモード2は、計算リソースを節約するために一方のみを実行することができる。第2のモード2は、第1のモード1が実行されている間、オフにしてもよい。第1のモード1は、第2のモード2が実行されている間、オフにしてもよい。第1ンモード1及び第2のモード2は、同時に実行してもよく、そのうちの一方のモードが実行されると、他方のモードは、アルゴリズムパラメータを更新してもよい。電子機器200が第1のモード1と第2のモード2との間で切り替えられる時、第1のモード1及び第2のモード2内のパラメータの一部(例えば、ノイズ推定アルゴリズムによって得られるノイズパラメータ、人間音声推定アルゴリズムによって得られる人間音声パラメータ、信号対雑音比アルゴリズムによって得られる信号対雑音比パラメータなど)を共通化することにより、計算リソースを節約し、計算結果をより正確にすることができる。第1のモード1及び第2のモード2における第1のアルゴリズム233-1及び第2のアルゴリズム233-8は、制御モジュール231が発行する制御指令におけるパラメータの一部、例えば、ノイズ推定アルゴリズムによって得られるノイズパラメータ、人間音声推定アルゴリズムによって得られる人間音声パラメータ、信号対雑音比アルゴリズムによって得られる信号対雑音比パラメータなどと共通化することにより、計算リソースを節約し、計算結果をより正確にすることもできる。
【0068】
いくつかの実施形態では、前記少なくとも1つの指令セットは、前記目標オーディオに対して平滑化処理を行い、平滑化処理された前記目標オーディオを制御機器400に出力するように構成されるマイクロフォン制御モジュール235によって実行されるマイクロフォン制御指令を含むこともできる。マイクロフォン制御モジュール235は、制御モジュール231によって生成された制御信号及び前記目標オーディオを受信し、前記制御信号に基づいて前記目標オーディオに対して前記平滑化処理を行うことができる。前記制御信号が前記第1の制御信号である場合、第1のモード1を実行し、第1のアルゴリズム233-1が出力した前記第1の目標オーディオ291を入力信号として使用し、前記制御信号が前記第2の制御信号である場合、第2のモード2を実行し、第2のアルゴリズム233-8が出力した前記第2の目標オーディオ292を入力信号として使用する。マイクロフォン制御モジュール235は、前記制御信号を前記第1の制御信号と前記第2の制御信号との間で切り替えることにより、前記目標オーディオ処理モードを第1のモード1と第2のモード2との間で切り替える場合、前記第1の目標オーディオ291と前記第2の目標オーディオ292との切り替えによる信号の不連続性を回避するために、前記目標オーディオに対して平滑化処理を行うことができる。具体的には、マイクロフォン制御モジュール235は、前記第1の目標オーディオ291及び前記第1の目標オーディオ291のパラメータを、前記目標オーディオが連続するように調整することができる。前記パラメータは、前記少なくとも1つの記憶媒体230に予め記憶されていてもよい。前記パラメータは、振幅、位相、周波数応答などであってもよい。前記調整の内容は、前記目標オーディオの音量に対する調整、EQバランスの調整、残留ノイズの調整などを含むことができる。マイクロフォン制御モジュール235は、前記目標オーディオ処理モードを第1のモード1と第2のモード2との間で切り替える場合、前記目標オーディオを連続信号にし、ユーザ002が両者の間の切り替えを知覚しにくくすることができる。
【0069】
いくつかの実施形態では、前記少なくとも1つの指令セットは、前記スピーカ処理信号を調整して前記スピーカ入力信号を得て、前記スピーカ入力信号をスピーカ280に出力して音響を出力するように構成されるスピーカ制御モジュール237によって実行されるスピーカ制御指令を含むこともできる。スピーカ制御モジュール237は、第1のアルゴリズム233-1及び第2のアルゴリズム233-8が出力する前記スピーカ処理信号及び前記制御信号を受信することができる。前記制御信号が前記第1の制御信号である場合、スピーカ制御モジュール237は、第1のアルゴリズム233-1が出力する前記スピーカ処理信号を低減又はオフにしてからスピーカ280に出力するように制御することにより、スピーカ280が出力する音響を低減し、エコーを低減し、第1のアルゴリズム233-1のエコー消去の効果を向上させることができる。前記制御信号が前記第2の制御信号である場合、スピーカ制御モジュール237は、第2のアルゴリズム233-8が出力する前記スピーカ処理信号を調整しなくてもよい。前記制御信号が前記第1の制御信号と前記第2の制御信号との間で切り替えられる場合、スピーカ28が出力する音響が不連続にならないように、スピーカ制御モジュール237は、第1のアルゴリズム233-1及び第2のアルゴリズム233-8が出力する前記スピーカ処理信号に対して平滑化処理を行うことができる。前記第1の制御信号と第2の制御信号との間で切り替えられる場合、スピーカ制御モジュール237は、切り替えの連続性をできるだけ確保し、ユーザ002が両者の間の切り替えを知覚しにくくするようにする。
【0070】
第1のモード1では、第1のアルゴリズム233-1は、近端マイクロフォンモジュール240がピックアップするユーザ002の音声品質に偏っている。前記スピーカ処理信号が大きすぎる場合、スピーカ制御モジュール237によって前記スピーカ処理信号を処理して前記スピーカ入力信号を低減することにより、スピーカ280が出力する音響を低減し、エコーを低減して近端音声品質を確保する。第2のアルゴリズム233-8は、スピーカ280の前記スピーカ入力信号に偏っている。第1のタイプのマイクロフォン242が出力する前記第1のオーディオ信号243は、スピーカ280の前記スピーカ入力信号の音声品質及び理解度を確保するために使用されない。
【0071】
少なくとも1つのプロセッサ220は、少なくとも1つの記憶媒体230、マイクロフォンモジュール240及びスピーカ280と通信可能に接続されてもよい。前記通信接続とは、直接又は間接的に情報を受信できる任意の形式の接続である。少なくとも1つのプロセッサ220は、上記の少なくとも1つの指令セットを実行するために使用される。システム100が実行する時、少なくとも1つのプロセッサ220は、前記少なくとも1つの指令セットを読み取り、前記少なくとも1つの指令セットの指示に基づいてマイクロフォンモジュール240及びスピーカ280のデータを取得し、本明細書によって提供されるエコーの抑制のためのオーディオ信号処理方法を実行する。プロセッサ220は、エコーの抑制のためのオーディオ信号処理方法に含まれるすべてのステップを実行することができる。プロセッサ220は、1つ又は複数のプロセッサの形態であってもよく、いくつかの実施形態では、プロセッサ220は、1つ又は複数のハードウェアプロセッサ、例えば、マイクロコントローラ、マイクロプロセッサ、縮小指令セットコンピュータ(RISC)、特定用途向け集積回路(ASIC)、アプリケーション固有指令セットプロセッサ(ASIP)、中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)、物理処理ユニット(PPU)、マイクロコントローラユニット、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、アドバンストRISCマシン(ARM)、プログラマブルロジックデバイス(PLD)、1つ又は複数の機能を実行することができる任意の回路又はプロセッサなど、又はそれらの任意の組み合わせを含むことができる。問題を説明するためだけに、本明細書では電子機器200において1つのプロセッサ220のみが説明されている。しかしながら、なお、本明細書における電子機器200は、複数のプロセッサを含むこともでき、したがって、本明細書に開示されている動作及び/又は方法ステップは、本明細書に記載されるように、1つのプロセッサによって実行されてもよいし、複数のプロセッサによって共同で実行されてもよい。例えば、本明細書において電子機器200のプロセッサ220がステップA及びステップBを実行する場合、ステップA及びステップBは2つの異なるプロセッサ220によって共同で実行してもよいし、別々に実行してもよい(例えば、第1のプロセッサは、ステップAを実行し、第2のプロセッサは、ステップBを実行し、又は第1及び第2のプロセッサはステップA及びBを共同で実行する)ことを理解すべきである。
【0072】
いくつかの実施形態では、システム100は、前記スピーカ信号の信号強度に基づいて電子機器200の前記目標オーディオ処理モードを選択することができる。いくつかの実施形態では、システム100は、前記スピーカ信号の信号強度及び前記マイクロフォン信号に基づいて電子機器200の前記目標オーディオ処理モードを選択することができる。
【0073】
図5は、本明細書の実施形態に従って提供されるエコーの抑制のためのオーディオ信号処理方法P100のフローチャートを示す。前記方法P100は、システム100が前記スピーカ信号の信号強度に基づいて電子機器200の前記目標オーディオ処理モードを選択する方法のフローチャートである。図5に示すように、前記方法P100は、少なくとも1つのプロセッサ220によって実行される以下のステップを含むことができる。
【0074】
S120:少なくとも前記スピーカ信号に基づいて第1のモード1及び第2のモード2から電子機器200の目標オーディオ処理モードを選択する。前述したように、前記目標オーディオ処理モードは、第1のモード1と第2のモード2とのうちの1つを含むことができる。具体的には、ステップS120は、以下のステップを含むことができる。
【0075】
S121:前記スピーカ信号を取得する。
【0076】
S122:少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成する。前記制御信号は、第1の制御信号又は第2の制御信号を含む。具体的には、電子機器200は、制御機器400が送信する前記スピーカ信号を受信し、前記スピーカ信号強度を予め設定されたスピーカ閾値と比較し、比較結果に基づいて前記制御信号を生成することができる。ステップS122は、以下のいずれかの場合を含むことができる。
【0077】
S122-2:前記スピーカ信号強度が前記スピーカ閾値より低いと決定し、前記第1の制御信号を生成し、あるいは、
【0078】
S122-4:前記スピーカ信号強度が予め設定されたスピーカ閾値より高いと決定し、前記第2の制御信号を生成する。
【0079】
ステップS120は、以下のステップを含むこともできる。
【0080】
S124:前記制御信号に基づいて、前記制御信号に対応する前記目標オーディオ処理モードを選択する。ここで、前記第1の制御信号は、前記第1のモード1に対応する。前記第2の制御信号は、前記第2のモード2に対応する。前記制御信号が前記第1の制御信号である場合、第1のモード1を選択し、前記制御信号が前記第2の制御信号である場合、第2のモード2を選択する。
【0081】
前記スピーカ信号強度が前記スピーカ閾値より高い場合、第1のモード1における第1のアルゴリズム233-1を使用して前記第1のオーディオ信号243及び第2のオーディオ信号245を信号処理する時、比較的良好な人間音声信号を残しながら、信号におけるエコー信号を除去することができないため、得られた前記第1の目標オーディオ291の音声品質が比較的悪く、第2のモード2における第2のアルゴリズム233-8を使用して前記第2のオーディオ信号245を信号処理して得られる前記第2の目標オーディオ292の品質が比較的良い。したがって、電子機器200は、前記スピーカ信号強度が前記スピーカ閾値より高い場合、第2のモードに対応する前記第2の制御信号を生成する。
【0082】
前記スピーカ信号強度が前記スピーカ閾値より低い場合、第1のモード1における第1のアルゴリズム233-1を使用して前記第1のオーディオ信号243及び第2のオーディオ信号245を信号処理する時、比較的良好な人間音声信号を残しながら、信号におけるエコー信号を除去することができるため、得られた前記第1の目標オーディオ291の音声品質が比較的良く、第2のモード2における第2のアルゴリズム233-8を使用して前記第2のオーディオ信号245を信号処理して得られる前記第2の目標オーディオ292の品質も比較的良い。したがって、電子機器200は、前記スピーカ信号強度が前記スピーカ閾値より低い場合、第1のモード1に対応する前記第1の制御信号を生成し、第2のモード2に対応する前記第2の制御信号を生成することもできる。
【0083】
前記制御信号は制御モジュール231によって生成される。具体的には、電子機器200は、前記スピーカ信号強度をリアルタイムで監視し、前記スピーカ閾値と比較することができる。電子機器200は、前記スピーカ信号強度を定時に検出し、前記スピーカ閾値と比較することもできる。電子機器200は、前記スピーカ信号強度が著しく変化し、変化値が予め設定された範囲を超えることを監視する場合、前記スピーカ信号を前記スピーカ閾値と比較することもできる。
【0084】
電子機器200は、前記スピーカ信号強度が前記スピーカ閾値より高い場合、前記第2の制御信号を生成する。電子機器は、前記スピーカ信号が変化し、前記スピーカ信号強度が前記スピーカ閾値より低い場合、前記第1の制御信号を生成する。電子機器200は、前記スピーカ信号強度が前記スピーカ閾値より低い場合、前記第1の制御信号を生成し、電子機器は、前記スピーカ信号が変化し、前記スピーカ信号強度が前記スピーカ閾値より高い場合、前記第2の制御信号を生成する。
【0085】
前記制御信号が切り替わる時にユーザ002によって知覚されないことを確保するために、前記スピーカ閾値は範囲であってもよい。前記スピーカ閾値は、第1のスピーカ臨界値及び第2のスピーカ臨界値が存在する範囲内にあってもよい。前記第1のスピーカ臨界値は、第2のスピーカ臨界値より小さい。前記スピーカ信号強度が前記スピーカ閾値より高いということは、前記スピーカ信号強度が前記第2のスピーカ臨界値より高いということを含むことができる。前記スピーカ信号強度が前記スピーカ閾値より低いということは、前記スピーカ信号強度が前記第1のスピーカ臨界値より低いということを含むことができる。
【0086】
電子機器200は、前記スピーカ信号強度が前記スピーカ閾値に等しい場合、前記第1の制御信号又は前記第2の制御信号を生成することができる。電子機器200は、前記スピーカ信号強度が前記第2のスピーカ臨界値より高い場合、前記第2の制御信号を生成し、電子機器200は、前記スピーカ信号強度が前記第1のスピーカ臨界値と前記第2のスピーカ臨界値との間に低下したら、前記第2の制御信号を生成することができる。電子機器200は、前記スピーカ信号強度が前記第1のスピーカ臨界値より低い場合、前記第1の制御信号を生成し、電子機器200は、前記スピーカ信号強度が前記第1のスピーカ臨界値と前記第2のスピーカ臨界値との間に増強されると、前記第1の制御信号を生成することができる。
【0087】
電子機器200は、機械学習によって制御モデルを得て、前記制御信号を出力する制御モデルに前記スピーカ信号を入力することができる。
【0088】
前記方法P100は、少なくとも1つのプロセッサ220によって実行される以下のステップを含むことができる。
【0089】
S140:前記目標オーディオ処理モードによって前記マイクロフォン信号を処理して前記目標オーディオを生成し、少なくとも前記マイクロフォン信号におけるエコーを低減する。具体的には、ステップS140は、以下のいずれかの場合を含むことができる。
【0090】
S142:前記制御信号を前記第1の制御信号として決定し、前記第1の制御信号に対応する前記第1のモード1における第1のアルゴリズム233-1によって、前記スピーカ入力信号に基づいて、前記第1のオーディオ信号243及び第2のオーディオ信号245に対して信号処理及び特徴融合を行い、第1の目標オーディオ291を生成する。具体的なプロセスは前述したように、ここでは詳しく説明しない。
【0091】
S144:前記制御信号を前記第2の制御信号として決定し、前記第2の制御信号に対応する第2のモード2における第2のアルゴリズム233-8によって、前記スピーカ入力信号に基づいて、前記第2のオーディオ信号245を信号処理する。具体的なプロセスは前述したように、ここでは詳しく説明しない。
【0092】
S160:前記目標オーディオを出力する。電子機器200は、前記目標オーディオを直接出力することができる。電子機器200は、前記目標オーディオが前記第1の目標オーディオ291と前記第2の目標オーディオ292との間で切り替えられる時に、ユーザ002によって知覚されないように、前記目標オーディオに対して平滑化処理を行うこともできる。具体的には、ステップS160は、前記目標オーディオに対して平滑化処理を行って前記平滑化処理された前記目標オーディオを出力するステップを含むことができる。
【0093】
具体的には、電子機器200は、マイクロフォン制御モジュール235によって前記目標オーディオに対して平滑化処理を行うことができる。前記目標オーディオが前記第1の目標オーディオ291と前記第2の目標オーディオ292との間で切り替えられる時に、マイクロフォン制御モジュール235は、接続箇所が滑らかに遷移するように、前記第1の目標オーディオ291と前記第2の目標オーディオ292との接続箇所に対して前記平滑化処理を行い、すなわち、第1の目標オーディオ291及び前記第2の目標オーディオ292を信号調整することができる。
【0094】
前記方法P100は、以下のステップを含むこともできる。
【0095】
S180:前記制御信号に基づいて、前記スピーカ280の前記スピーカ入力信号の強度を制御する。具体的には、ステップS180は、スピーカ制御モジュール237によって実行することができる。ステップS180は、スピーカ制御モジュール237によって前記制御信号を前記第1の制御信号として決定することができ、スピーカ制御モジュール237は、前記スピーカ処理信号を処理し、スピーカ280に入力される前記スピーカ入力信号の強度を低減することにより、スピーカ280が出力する音響の強度を低減し、前記マイクロフォン入力信号におけるエコー信号を低減し、前記第1の目標オーディオの音声品質を向上させることができる。
【0096】
表1は、図5に対応する目標オーディオ処理モードの結果図を示す。表1に示すように、照合を容易にするために、シーンを4つのシーンに分けて、それぞれは、第1種:近端音声信号が閾値より小さく(例えば、ユーザ002が音を発しない)、前記スピーカ信号が前記スピーカ閾値を超えておらず、第2種:近端音声信号が閾値より大きく(例えば、ユーザ002が音を発する)、前記スピーカ信号が前記スピーカ閾値を超えておらず、第3種:近端音声信号が閾値より小さく(例えば、ユーザ002が音を発しない)、前記スピーカ信号が前記スピーカ閾値を超え、及び第4種:近端音声信号が閾値より大きく(例えば、ユーザ002が音を発する)、前記スピーカ信号が前記スピーカ閾値を超える。ここで、近端音声信号が閾値より大きいか否かは、制御モジュール231によって前記マイクロフォン信号に基づいて判断することができる。近端音声信号が閾値より大きいということは、ユーザ002が発するオーディオ信号強度が予め設定された閾値を超えることであってもよい。前記4つのシーンに対応する目標オーディオ処理モードは、それぞれ第1種及び第2種が第1のモード1に対応し、第3種及び第4種が第2のモード2に対応する。
【0097】
【表1】
【0098】
前記方法P100では、電子機器200は、どのようなシーンにおいても電子機器200が選択する目標オーディオ処理モードによって処理される音声品質が最適であることを確保し、通話品質を確保するために、前記スピーカ信号に基づいて電子機器200の目標オーディオ処理モードを選択することができる。
【0099】
いくつかの実施形態では、前記目標オーディオ処理モードの選択は、前記スピーカ信号のエコーだけではなく、環境ノイズにも関係する。前記環境ノイズは、前記マイクロフォン信号における環境ノイズレベルと信号対雑音比とのうちの少なくとも1つによって評価することができる。
【0100】
図6は、本明細書の実施形態に従って提供されるエコーの抑制のためのオーディオ信号処理方法P200のフローチャートを示す。前記方法P200は、システム100が前記スピーカ信号の信号強度及び前記マイクロフォン信号に基づいて電子機器200の前記目標オーディオ処理モードを選択する方法のフローチャートである。具体的には、前記方法おP200は、システム100が前記スピーカ信号及び前記マイクロフォン信号における環境ノイズレベルと信号対雑音比とのうちの少なくとも1つに基づいて前記目標オーディオ処理モードを選択する方法のフローチャートである。前記方法P200は、少なくとも1つのプロセッサ220によって実行される以下のステップを含むことができる。
【0101】
S220:少なくとも前記スピーカ信号に基づいて第1のモード1及び第2のモード2から電子機器200の目標オーディオ処理モードを選択する。具体的には、ステップS220は、以下のステップを含むことができる。
【0102】
S222:少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成する。前記制御信号は、第1の制御信号又は第2の制御信号を含む。具体的には、ステップS222は、電子機器200が前記スピーカ信号強度及び前記マイクロフォン信号におけるノイズに基づいて、対応する制御信号を生成することであってもよい。ステップS222は、以下のステップを含むことができる。
【0103】
S222-2:前記スピーカ信号及び前記マイクロフォン信号の評価パラメータを取得する。ここで、前記評価パラメータは、前記マイクロフォン信号における環境ノイズ評価パラメータであってもよい。前記環境ノイズ評価パラメータは、環境ノイズレベルと信号対雑音比とのうちの1つを含むことができる。電子機器200は、制御モジュール231によって前記マイクロフォン信号における環境ノイズ評価パラメータを取得することができる。具体的には、電子機器200は、第1のオーディオ信号243と第2のオーディオ信号245とのうちの少なくとも1つに基づいて前記環境ノイズ評価パラメータを取得することができる。電子機器200は、ノイズ推定アルゴリズムによって前記環境ノイズレベル又は前記信号対雑音比を取得することができ、本明細書はここでは詳しく説明しない。
【0104】
S222-4:前記スピーカ信号強度及び前記環境ノイズ評価パラメータに基づいて、前記制御信号を生成する。具体的には、電子機器200は、前記スピーカ信号強度を予め設定されたスピーカ閾値と比較し、及び前記環境ノイズ評価パラメータを予め設定されたノイズ評価範囲と比較し、比較結果に基づいて前記制御信号を生成することができる。ステップS222-4は、以下のいずれかの場合を含むことができる。
【0105】
S222-5:前記スピーカ信号強度が予め設定されたスピーカ閾値より高いと決定し、前記第2の制御信号を生成する。
【0106】
S222-6:前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲外にあると決定し、前記第1の制御信号を生成する。
【0107】
S222-7:前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第1の制御信号又は前記第2の制御信号を生成する。
【0108】
ここで、前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあることは、前記環境ノイズレベルが予め設定された環境ノイズ閾値より低いことと、前記信号対雑音比が予め設定された信号対雑音比閾値より高いことと、のうちの少なくとも1つを含むことができる。この時の環境ノイズが比較的小さい。前記環境ノイズ評価パラメータが前記ノイズ評価範囲外にあることは、前記環境ノイズレベルが予め設定された環境ノイズ閾値より高いことと、前記信号対雑音比が予め設定された信号対雑音比閾値より低いことと、のうちの少なくとも1つを含むことができる。この時の環境ノイズが比較的大きい。ここで、前記環境ノイズ評価パラメータが前記ノイズ評価範囲外にある場合、すなわち、大きいノイズ環境では、前記第1の目標オーディオ291の音声品質は前記第2の目標オーディオ292より優れている。前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にある場合、前記第1の目標オーディオ291の音声品質は前記第2の目標オーディオ292の音声品質とあまり変わらない。
【0109】
ステップS220は、以下のステップを含むこともできる。
【0110】
S224:前記制御信号に基づいて、前記制御信号に対応する前記目標オーディオ処理モードを選択する。ここで、前記第1の制御信号は、前記第1のモード1に対応する。前記第2の制御信号は、前記第2のモード2に対応する。前記制御信号が前記第1の制御信号である場合、第1のモード1を選択し、前記制御信号が前記第2の制御信号である場合、第2のモード2を選択する。
【0111】
前記スピーカ信号強度が前記スピーカ閾値より高い場合、第1のモード1における第1のアルゴリズム233-1が前記第1のオーディオ信号243及び第2のオーディオ信号245を信号処理する時、比較的良好な人間音声信号を残しながら、信号におけるエコー信号を除去することができないため、得られた前記第1の目標オーディオ291の音声品質が比較的悪く、第2のモード2における第2のアルゴリズム233-8が前記第2のオーディオ信号245を信号処理して得られる前記第2の目標オーディオ292の品質が比較的良い。したがって、電子機器200は、前記スピーカ信号強度が前記スピーカ閾値より高い場合、前記環境ノイズがどの範囲内にあるかにかかわらず、第2のモード2に対応する前記第2の制御信号を生成する。
【0112】
前記スピーカ信号強度が前記スピーカ閾値より低い場合、第1のモード1における第1のアルゴリズム233-1が前記第1のオーディオ信号243及び第2のオーディオ信号245を信号処理する時、比較的良好な人間音声信号を残しながら、信号におけるエコー信号を除去することができるため、得られた前記第1の目標オーディオ291の音声品質が比較的良く、第2のモード2における第2のアルゴリズム233-8が前記第2のオーディオ信号245を信号処理して得られる前記第2の目標オーディオ292の品質も比較的良い。したがって、前記スピーカ信号強度が前記スピーカ閾値より低い場合、電子機器200が生成する制御信号は、環境ノイズに関係する。
【0113】
前記環境ノイズレベルが前記環境ノイズ閾値より高い場合、又は前記信号対雑音比が前記信号対雑音比閾値より低い場合は、前記マイクロフォン信号における環境ノイズが比較的大きいことを表す。第1のモード1における第1のアルゴリズム233-1が前記第1のオーディオ信号243及び第2のオーディオ信号245を信号処理する時、比較的良好な人間音声信号を残しながら、信号におけるノイズを低減することができるため、得られた前記第1の目標オーディオ291の音声品質が比較的良く、第2のモード2における第2のアルゴリズム233-8が前記第2のオーディオ信号245を信号処理して得られる前記第2の目標オーディオ292の音声品質は、第1の目標オーディオ291の音声品質より悪い。したがって、電子機器200は、前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズレベルが前記環境ノイズ閾値より高く又は前記信号対雑音比が前記信号対雑音比閾値より低い場合、第1のモード1に対応する前記第1の制御信号を生成する。
【0114】
なお、環境ノイズが比較的小さい場合、すなわち、環境ノイズ評価パラメータが前記ノイズ評価範囲内にある場合、第1の目標オーディオ291の音声品質は、第2の目標オーディオ292の音声品質とあまり変わらない。この時、電子機器200は、常に前記第2の制御信号を生成し、前記第2のモード2における第2のアルゴリズム233-8を選択して第2のオーディオ信号245を信号処理し、目標オーディオ音声品質を確保した上で、計算量を減らし、リソースを節約することができる。
【0115】
前記環境ノイズレベルが前記環境ノイズ閾値より低く又は前記信号対雑音比が前記信号対雑音比閾値より高い場合は、前記マイクロフォン信号における環境ノイズが比較的小さいことを表す。第1のモード1における第1のアルゴリズム233-1が前記第1のオーディオ信号243及び第2のオーディオ信号245を信号処理する時に得られる前記第1の目標オーディオ291と、第2のモード2における第2のアルゴリズム233-8が前記第2のオーディオ信号245を信号処理する時に得られる前記第2の目標オーディオ292の両方の音声品質は良好である。したがって、電子機器200は、前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズレベルが前記環境ノイズ閾値より低く又は前記信号対雑音比が前記信号対雑音比閾値より高い場合、前記第1の制御信号又は前記第2の制御信号を生成する。具体的には、電子機器200は、前のシーンの制御信号に基づいて現在のシーンでの制御信号を決定することができる。つまり、前のシーンで電子機器が第1の制御信号を生成する場合、現在のシーンで電子機器も第1の制御信号を生成することにより、信号の連続性を確保する。逆も然りである。
【0116】
前記制御信号は制御モジュール231によって生成される。具体的には、電子機器200は、前記スピーカ信号強度及び前記環境ノイズ評価パラメータをリアルタイムで監視し、前記スピーカ閾値及び前記環境評価範囲と比較することができる。電子機器200は、前記スピーカ信号強度及び前記環境ノイズ評価パラメータを定時に検出し、前記スピーカ閾値及び前記ノイズ評価範囲と比較することもできる。電子機器200は、前記スピーカ信号強度又は前記環境ノイズ評価パラメータが著しく変化し、変化値が予め設定された範囲を超えることを監視する場合、前記スピーカ信号及び前記環境ノイズ評価パラメータを前記スピーカ閾値及び前記ノイズ評価範囲と比較することもできる。
【0117】
前記制御信号が切り替わる時にユーザ002によって知覚されないことを確保するために、前記スピーカ閾値、前記環境ノイズ閾値及び前記予め設定された信号対雑音比は範囲であってもよい。前記スピーカ閾値は、前述したように、ここでは詳しく説明しない。前記環境ノイズ閾値は、第1のノイズ臨界値及び第2のノイズ臨界値が存在する範囲内にあってもよい。前記第1のノイズ臨界値は、第2のノイズ臨界値より小さい。前記環境ノイズレベルが前記環境ノイズ閾値より高いということは、前記環境ノイズレベルが前記第2のノイズ臨界値より高いということを含むことができる。前記環境ノイズレベルが前記環境ノイズ閾値より低いということは、前記環境ノイズレベルが前記第1のノイズ臨界値より低いということを含むことができる。前記信号対雑音比閾値は、第1の信号対雑音比臨界値及び第2の信号対雑音比臨界値が存在する範囲内にあってもよい。前記第1の信号対雑音比臨界値は、第2の信号対雑音比臨界値より小さい。前記信号対雑音比が前記信号対雑音比閾値より高いということは、前記信号対雑音比が前記第2の信号対雑音比臨界値より高いということを含むことができる。前記信号対雑音比が前記信号対雑音比閾値より低いということは、前記信号対雑音比が前記第1の信号対雑音比臨界値より低いということを含むことができる。
【0118】
前記方法P200は、少なくとも1つのプロセッサ220によって実行される以下のステップを含むことができる。
【0119】
S240:前記目標オーディオ処理モードによって前記マイクロフォン信号を処理して目標オーディオを生成することにより、少なくとも前記マイクロフォン信号におけるエコーを低減する。具体的には、ステップS240は、以下のいずれかの場合を含むことができる。
【0120】
S242:前記制御信号を前記第1の制御信号として決定し、前記第1のモード1を選択し、前記第1のオーディオ信号243及び第2のオーディオ信号245を信号処理し、第1の目標オーディオ291を生成する。具体的には、ステップS242は、ステップS142と一致してもよいが、ここでは詳しく説明しない。
【0121】
S244:前記制御信号を前記第2の制御信号として決定し、前記第2のモード2を選択し、前記第2のオーディオ信号245に対してエコー抑制を行い、第2の目標オーディオ292を生成する。具体的には、ステップS244は、ステップS144と一致してもよいが、ここでは詳しく説明しない。
【0122】
S260:前記目標オーディオを出力する。具体的には、ステップS260は、ステップS160と一致してもよいが、ここでは詳しく説明しない。
【0123】
前記方法P200は、以下のステップを含むこともできる。
【0124】
S280:前記制御信号に基づいて、前記スピーカ280の前記スピーカ入力信号の強度を制御する。具体的には、ステップS280は、ステップS180と一致してもよいが、ここでは詳しく説明しない。
【0125】
表2は、図6に対応する目標オーディオ処理モード結果図を示す。表2に示すように、照合を容易にするために、シーンを8つのシーンに分けて、それぞれは、第1種:近端音声信号が閾値より小さく(例えば、ユーザ002が音を発しない)、前記スピーカ信号が前記スピーカ閾値を超えておらず、環境ノイズが比較的小さく、第2種:近端音声信号が閾値より大きく(例えば、ユーザ002が音を発する)、前記スピーカ信号が前記スピーカ閾値を超えておらず、環境ノイズが比較的小さく、第3種:近端音声信号が閾値より小さく(例えば、ユーザ002が音を発しない)、前記スピーカ信号が前記スピーカ閾値を超え、環境ノイズが比較的小さく、及び第4種:近端音声信号が閾値より大きく(例えば、ユーザ002が音を発する)、前記スピーカ信号が前記スピーカ閾値を超え、環境ノイズが比較的小さく、第5種:近端音声信号が閾値より小さく(例えば、ユーザ002が音を発しない)、前記スピーカ信号が前記スピーカ閾値を超えておらず、環境ノイズが比較的大きく、第6種:近端音声信号が閾値より大きく(例えば、ユーザ002が音を発する)、前記スピーカ信号が前記スピーカ閾値を超えておらず、環境ノイズが比較的大きく、第7種:近端音声信号が閾値より小さく(例えば、ユーザ002が音を発しない)、前記スピーカ信号が前記スピーカ閾値を超え、環境ノイズが比較的大きく、第8種:近端音声信号が閾値より大きく(例えば、ユーザ002が音を発する)、前記スピーカ信号が前記スピーカ閾値を超え、環境ノイズが比較的大きい。ここで、近端音声信号が閾値より大きいか否かは、制御モジュール231によって前記マイクロフォン信号に基づいて判断することができる。近端音声信号が閾値より大きいということは、ユーザ002が発するオーディオ信号強度が予め設定された閾値を超えることであってもよい。前記8つのシーンに対応する目標オーディオ処理モードは、それぞれ第5種及び第6種が第1のモード1に対応し、第3種、第4種、第7種及び第8種が第2のモード2に対応し、他のシーンが第1のモード1又は第2のモード2に対応する。
【0126】
【表2】
【0127】
前記方法P200は、スピーカ信号に基づいて電子機器200の前記目標オーディオ処理モードを制御することができるだけではなく、近端の環境ノイズ信号に基づいて前記目標オーディオ処理モードを制御することにより、異なるシーンでは、電子機器200が出力する音声信号の音声品質が最適であり、通話品質を確保することもできる。
【0128】
いくつかの実施形態では、前記目標オーディオ処理モードの選択は、前記スピーカ信号のエコー及び環境ノイズだけでなく、ユーザ002の発話時の音声信号にも関係する。前記環境ノイズ信号は、前記マイクロフォン信号における環境ノイズレベルと信号対雑音比とのうちの少なくとも1つによって評価することができる。ユーザ002の発話時の音声信号は、前記マイクロフォン信号における人間音声信号強度によって評価することができる。前記人間音声信号強度は、ノイズ推定アルゴリズムによって得られる人間音声信号強度であってもよく、前記人間音声信号強度は、ノイズ低減されて得られたオーディオ信号の強度であってもよい。
【0129】
図7は、本明細書の実施形態に従って提供されるエコーの抑制のためのオーディオ信号処理方法P300のフローチャートを示す。前記方法P300は、システム100が前記スピーカ信号の信号強度及び前記マイクロフォン信号に基づいて電子機器200の目標オーディオ処理モードを選択する方法のフローチャートである。具体的には、前記方法P300は、システムが前記スピーカ信号、前記マイクロフォン信号における人間音声信号強度及び環境ノイズレベルと信号対雑音比とのうちの少なくとも1つに基づいて前記目標オーディオ処理モードを選択する方法のフローチャートである。前記方法P300は、少なくとも1つのプロセッサ220によって実行される以下のステップを含むことができる。
【0130】
S320:少なくとも前記スピーカ信号に基づいて第1のモード1及び第2のモード2から電子機器2の目標オーディオ処理モードを選択する。具体的には、ステップS320は、以下のステップを含むことができる。
【0131】
S322:少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成する。前記制御信号は、第1の制御信号又は第2の制御信号を含む。ステップS320は、電子機器200が前記スピーカ信号強度、前記スピーカ信号におけるノイズ及び前記マイクロフォン信号における人間音声信号強度に基づいて、対応する制御信号を生成することができる。具体的には、ステップS322は、以下のステップを含むことができる。
【0132】
S322-2:前記スピーカ信号及び前記マイクロフォン信号の評価パラメータを取得する。ここで、前記評価パラメータは、前記マイクロフォン信号における環境ノイズ評価パラメータを含むことができ、前記マイクロフォン信号における人間音声信号強度を含むこともできる。前記環境ノイズ評価パラメータは、環境ノイズレベルと信号対雑音比とのうちの少なくとも1つを含むことができる。電子機器200は、制御モジュール231によって前記マイクロフォン信号における環境ノイズ評価パラメータ及び人間音声信号強度を取得することができる。具体的には、電子機器200は、第1のオーディオ信号243と第2のオーディオ信号245とのうちの少なくとも1つに基づいて前記評価パラメータを取得することができる。電子機器200は、ノイズ推定アルゴリズムによって前記人間音声信号及び前記環境ノイズレベルと前記信号対雑音比を取得することができ、本明細書は、ここで詳しく説明しない。
【0133】
S322-4:前記スピーカ信号強度及び前記評価パラメータに基づいて、前記制御信号を生成する。具体的には、電子機器200は、前記スピーカ信号強度を予め設定されたスピーカ閾値と比較し、前記環境ノイズ評価パラメータを予め設定されたノイズ評価範囲と比較し、及び前記人間音声信号強度を予め設定された人間音声閾値と比較し、比較結果に基づいて前記制御信号を生成することができる。ステップS322-4は、以下のいずれかの場合を含むことができる。
【0134】
S322-5:前記スピーカ信号強度が予め設定されたスピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値を超え、前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲外にあると決定し、前記第1の制御信号を生成する。
【0135】
S322-6:前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値を超え、前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第2の制御信号を生成する。
【0136】
S322-7:前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値より低いと決定し、前記第2の制御信号を生成する。
【0137】
S322-8:前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲外にあると決定し、前記第1の制御信号を生成する。
【0138】
S322-9:前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第1の制御信号又は前記第2の制御信号を生成する。
【0139】
前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあることは、前記環境ノイズレベルが予め設定された環境ノイズ閾値より低いことと、前記信号対雑音比が予め設定された信号対雑音比閾値より高いことと、のうちの少なくとも1つを含むことができる。この時の環境ノイズが比較的小さい。前記環境ノイズ評価パラメータが前記ノイズ評価範囲外にあることは、前記環境ノイズレベルが予め設定された環境ノイズ閾値より高いことと、前記信号対雑音比が予め設定された信号対雑音比閾値より低いことと、のうちの少なくとも1つを含むことができる。この時の環境ノイズが比較的大きい。ここで、前記環境ノイズ評価パラメータが前記ノイズ評価範囲外にある場合、すなわち、大きいノイズ環境では、前記第1の目標オーディオ291の音声品質は前記第2の目標オーディオ292より優れている。前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にある場合、前記第1の目標オーディオ291の音声品質は前記第2の目標オーディオ292の音声品質とあまり変わらない。前記スピーカ閾値、前記環境ノイズ閾値及び前記信号対雑音比閾値は、前述したように、ここでは詳しく説明しない。
【0140】
ここで、前記人間音声信号強度が前記人間音声閾値を超えるということは、ユーザ002が話していることを意味する。この時、ユーザ002の音声品質を確保するために、電子機器200は、前記第1の制御信号を生成し、前記第1の目標オーディオ292の音声品質を確保するように前記スピーカ信号を低減することができる。
【0141】
前記スピーカ信号、前記環境ノイズ閾値、前記信号対雑音比及び前記人間音声閾値は、電子機器200に予め記憶されていてもよい。
【0142】
ステップS320は、以下のステップを含むこともできる。
【0143】
S324:前記制御信号に基づいて、前記制御信号に対応する前記目標オーディオ処理モードを選択する。ここで、前記第1の制御信号は、前記第1のモード1に対応する。前記第2の制御信号は、前記第2のモード2に対応する。前記制御信号が前記第1の制御信号である場合、第1のモード1を選択し、前記制御信号が前記第2の制御信号である場合、第2のモード2を選択する。
【0144】
前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値を超え、前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲外にあることは、この時にユーザ002が話しており、エコーが大きく、ノイズも比較的大きいことが証明される。ユーザ002の音声品質及び理解度を確保するために、電子機器200は、スピーカ280に入力されるスピーカ入力信号を低減したり、オフにしたりすることができ、前記マイクロフォン信号におけるエコーを低減し、目標オーディオの音声品質を確保する。この時、第1のモード1における第1のアルゴリズム233-1が前記第1のオーディオ信号243及び第2のオーディオ信号245を信号処理して得られる前記第1の目標オーディオ291の音声品質は、第2のモード2における第2のアルゴリズム233-8が第2のオーディオ信号245を信号処理して得られる第2の目標オーディオ292より良い。したがって、電子機器200は、前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値を超え、前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲外にある場合、第1のモード1に対応する前記第1の制御信号を生成する。このような場合、電子機器200は、近端ユーザ002の音声品質の理解度を確保することができる。スピーカ入力信号の一部が欠けているが、電子機器200は、スピーカ入力信号の大部分の音声品質及び理解度を維持することにより、両方の音声通信品質を向上させることができる。
【0145】
前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値より低く、又は前記人間音声信号強度が前記人間音声閾値を超え、前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲内にあることは、この時にユーザ002が話していないか、又はユーザ002が話しているがノイズが比較的小さいことが証明される。この時、第1のモード1における第1のアルゴリズム233-1が前記第1のオーディオ信号243及び第2のオーディオ信号245を信号処理して得られる前記第1の目標オーディオ291の音声品質は、第2のモード2における第2のアルゴリズム233-8が第2のオーディオ信号245を信号処理して得られる第2の目標オーディオ292より悪い。したがって、電子機器200は、前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値より低く、又は前記人間音声信号強度が前記人間音声閾値を超え、前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲内にある場合、第2のモード2に対応する前記第2の制御信号を生成する。
ステップS322-4におけるその他の状況は、ステップS222-4とほぼ一致するので、ここでは詳しく説明しない。
【0146】
前記制御信号は、制御モジュール231によって生成される。具体的には、電子機器200は、前記スピーカ信号強度及び前記評価パラメータをリアルタイムで監視し、前記スピーカ閾値、前記ノイズ評価範囲及び前記人間音声閾値と比較することができる。電子機器200は、前記スピーカ信号強度及び前記評価パラメータを定時に検出し、前記スピーカ閾値、前記ノイズ評価範囲及び前記人間音声閾値と比較することもできる。電子機器200は、前記スピーカ信号強度又は前記評価パラメータが著しく変化し、変化値が予め設定された範囲を超えることを監視する場合、前記スピーカ信号及び前記評価パラメータを前記スピーカ閾値、前記評価範囲及び前記人間音声閾値と比較することもできる。
【0147】
前記方法P300は、少なくとも1つのプロセッサ220によって実行される以下のステップを含むことができる。
【0148】
S340:前記目標オーディオ処理モードによって前記マイクロフォン信号を処理して前記目標オーディオを生成することにより、少なくとも前記マイクロフォン信号におけるエコーを低減する。具体的には、ステップS340は、以下のいずれかの場合を含むことができる。
【0149】
S342:前記制御信号を前記第1の制御信号として決定し、前記第1のモード1を選択し、前記第1のオーディオ信号243及び第2のオーディオ信号245を信号処理し、第1の目標オーディオ291を生成する。具体的には、ステップS342は、ステップS142と一致してもよいが、ここでは詳しく説明しない。
【0150】
S344:前記制御信号を前記第2の制御信号として決定し、前記第2のモード2を選択し、前記第2のオーディオ信号245を信号処理し、第2の目標オーディオ292を生成する。具体的には、ステップS344は、ステップS144と一致してもよいが、ここでは詳しく説明しない。
【0151】
前記方法P300は、少なくとも1つのプロセッサ220によって実行される以下のステップを含むことができる。
【0152】
S360:前記目標オーディオを出力する。具体的には、ステップS360は、ステップS160と一致してもよいが、ここでは詳しく説明しない。
【0153】
前記方法P300は、以下のステップを含むこともできる。
【0154】
S380:前記制御信号に基づいて、前記スピーカ280の前記スピーカ入力信号の強度を制御する。具体的には、ステップS380は、ステップS180と一致してもよいが、ここでは詳しく説明しない。
【0155】
表3は、図7に対応する目標オーディオ処理モード結果図を示す。表3に示すように、照合を容易にするために、シーンを8つのシーンに分けて、それぞれは、第1種:近端音声信号が閾値より小さく(例えば、ユーザ002が音を発しない)、前記スピーカ信号が前記スピーカ閾値を超えておらず、環境ノイズが比較的小さく、第2種:近端音声信号が閾値より大きく(例えば、ユーザ002が音を発する)、前記スピーカ信号が前記スピーカ閾値を超えておらず、環境ノイズが比較的小さく、第3種:近端音声信号が閾値より小さく(例えば、ユーザ002が音を発しない)、前記スピーカ信号が前記スピーカ閾値を超え、環境ノイズが比較的小さく、及び第4種:近端音声信号が閾値より大きく(例えば、ユーザ002が音を発する)、前記スピーカ信号が前記スピーカ閾値を超え、環境ノイズが比較的小さく、第5種:近端音声信号が閾値より小さく(例えば、ユーザ002が音を発しない)、前記スピーカ信号が前記スピーカ閾値を超えておらず、環境ノイズが比較的大きく、第6種:近端音声信号が閾値より大きく(例えば、ユーザ002が音を発する)、前記スピーカ信号が前記スピーカ閾値を超えておらず、環境ノイズが比較的大きく、第7種:近端音声信号が閾値より小さく(例えば、ユーザ002が音を発しない)、前記スピーカ信号が前記スピーカ閾値を超え、環境ノイズが比較的大きく、第8種:近端音声信号が閾値より大きく(例えば、ユーザ002が音を発する)、前記スピーカ信号が前記スピーカ閾値を超え、環境ノイズが比較的大きい。ここで、近端音声信号が閾値より大きいか否かは、制御モジュール231によって前記マイクロフォン信号に基づいて判断することができる。近端音声信号が閾値より大きいということは、ユーザ002が発するオーディオ信号強度が予め設定された閾値を超えることであってもよい。前記8つのシーンに対応する目標オーディオ処理モードは、それぞれ第5種、第6種及び第8種が第1のモード1に対応し、第3種、第4種及び第7種が第2のモード2に対応し、他のシーンが第1のモード1又は第2のモード2に対応する。
【0156】
【表3】
【0157】
なお、方法P200及び方法P300は、異なる応用シーンに適用する。スピーカ信号が近端音声品質より重要なシーンでは、スピーカ信号の品質及びスピーカ信号の理解度を確保するために方法P200を選択することができる。近端音声品質がスピーカ信号より重要なシーンでは、近端音声の音声品質及び理解度を確保するために方法P300を選択することができる。
【0158】
以上のようにして、システム100、前記方法P100、前記方法P200及び前記方法P300は、異なるシーンに対して、スピーカ信号に基づいて電子機器200の目標オーディオ処理モードを制御することにより、目標オーディオがどのようなシーンにおいても音声品質が最適になり、音声通信の品質を向上させるように、電子機器200の音源信号を制御することができる。
【0159】
なお、環境ノイズの信号強度は周波数ごとに異なる。異なる周波数では、前記第1の目標オーディオ291及び前記第2の目標オーディオ292の音声品質も異なる。例えば、第1の周波数では、前記第1のオーディオ信号243及び第2のオーディオ信号245が第1のアルゴリズム233-1によって信号処理された前記第1の目標オーディオ291の音声品質は前記第2のオーディオ信号245が第2のアルゴリズム233-8によって信号処理された第2の目標オーディオ292の音声品質より優れている。前記第1の周波数以外の他の周波数では、前記第1のオーディオ信号243及び第2のオーディオ信号245が第1のアルゴリズム233-1によって信号処理された前記第1の目標オーディオ291の音声品質は前記第2のオーディオ信号245が第2のアルゴリズム233-8によって信号処理された第2の目標オーディオ292の音声品質に近い。この時、電子機器200は、前記環境ノイズの周波数に基づいて前記制御信号を生成することもできる。前記第1の周波数で前記第1の制御信号を生成し、前記第1の周波数以外の他の周波数で前記第2の制御信号を生成する。
【0160】
前記環境ノイズが低周波数ノイズ(例えば、地下鉄、バスなどの場合)である場合、第1のアルゴリズム233-1の信号処理で第1のオーディオ信号243及び第2のオーディオ信号245によって得られる第1の目標オーディオ291の低周波数での音声信号の品質が悪く、すなわち、第1の目標オーディオ291の低周波数での音声の理解度が比較的悪く、高周波数での音声の理解度が比較的高い場合がある。この時、電子機器200は、前記環境ノイズの周波数に基づいて目標オーディオ処理モードの選択を制御することができる。例えば、低周波数範囲において、電子機器200は、近端ユーザ002の音声がピックアップされることを確保し、近端音声品質を確保するように、前記方法P300を選択して前記目標オーディオ処理モードを制御することができ、高周波数範囲において、電子機器200は、近端ユーザ002が前記スピーカ信号を聞き取れることを確保するために、前記方法P200を選択して前記目標オーディオ処理モードを制御することができる。
【0161】
本明細書の他の態様は、音源信号制御に基づく少なくとも1群の実行可能な指令が記憶されている非一時的な記憶媒体であって、前記実行可能な指令がプロセッサによって実行される場合、前記実行可能な指令は、前記プロセッサが本明細書に記載のエコーの抑制のためのオーディオ信号処理方法のステップを実施するように指示する非一時的な記憶媒体を提供する。いくつかの可能な実施形態では、本明細書の各態様は、プログラムコードを含むプログラム製品の形態に実現することもできる。前記プログラム製品が電子機器200で実行される場合、前記プログラムコードは、電子機器200に本明細書に記載の音源信号制御に基づくステップを実行させるために使用される。上記方法を実現するためのプログラム製品は、プログラムコードを含むポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)を採用し、電子機器200で実行することができる。しかしながら、本明細書のプログラム製品はこれに限定されておらず、本明細書では、読み取り可能な記憶媒体は、プログラムを含むか、又は記憶する任意の有形媒体であってもよく、当該プログラムは、指令実行システム(例えば、プロセッサ220)によって使用されるか、又はそれと組み合わせて使用することができる。前記プログラム製品は、1つ又は複数の読み取り可能な媒体の任意の組み合わせを採用することができる。読み取り可能な媒体は、読み取り可能な信号媒体又は読み取り可能な記憶媒体であってもよい。読み取り可能な記憶媒体は、例えば、電気、磁気、光、電磁気、赤外線、又は半導体のシステム、装置又はデバイス、又は任意の以上の組み合わせであってもよいが、これらに限定されない。読み取り可能な記憶媒体のより具体的な例は、1つ又は複数のワイヤを有する電気的接続、ポータブルディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光記憶デバイス、磁気記憶デバイス、又は上記の任意の適切な組み合わせを含む。前記コンピュータ読み取り可能な記憶媒体は、搬送波の一部としてベースバンドを伝搬するデータ信号を含んでもよく、読み取り可能なプログラムコードが含まれている。このように伝搬されるデータ信号は、電磁信号、光信号、又は上記の任意の適切な組み合わせを含むが、これらに限定されない様々な形態をとることができる。読み取り可能な記憶媒体はまた、指令実行システム、装置、又はデバイスによって使用されるか、又はそれらと組み合わせて使用するためのプログラムを、送信、伝搬、又は伝送することができる読み取り可能な記憶媒体以外の任意の読み取り可能な媒体であってもよい。読み取り可能な記憶媒体に含まれるプログラムコードは、無線、有線、光ケーブル、RFなど、又は上記の任意の適切な組み合わせを含むが、これらに限定されない、任意の適切な媒体で伝送可能である。本明細書の操作を実行するためのプログラムコードは、Java、C++などのオブジェクト指向プログラミング言語と、「C」言語などの一般的な手続き型プログラミング言語や類似のプログラミング言語とを含む1つ又は複数のプログラミング言語の任意の組み合わせで記述することができる。プログラムコードは、電子機器200上で完全に実行されてもよいし、電子機器200上で部分的に実行されてもよいし、独立したソフトウェアパッケージとして実行されてもよいし、電子機器200上で部分的にリモートコンピューティングデバイス上で部分的に実行されてもよいし、リモートコンピューティングデバイス上で完全に実行されてもよい。
【0162】
以上は、本明細書の特定の実施形態について説明した。他の実施形態は、添付される特許請求の範囲の範囲内にある。いくつかの場合に、特許請求の範囲に記載の動作又はステップは、実施形態における順序と異なる順序で実行されてもよく、依然として所望の結果を実現することができる。また、図面に示すプロセスは、所望の結果を達成するために、必ずしも特定の順序又は連続する順序を示すことを必要としない。いくつかの実施形態では、マルチタスク処理及び並列処理も可能であるか、又は有利であるかもしれない。
【0163】
以上のようにして、この詳細な開示内容を閲読した後、上記の詳細な開示内容は、単なる例として提示してもよく、限定的でなくてもよいことを当業者は理解することができる。本明細書では明記されていないが、当業者であれば、本明細書の要件が実施形態の様々な合理的な変更、改善及び修正を網羅することを理解することができる。これらの変更、改善及び修正は、本明細書によって提出されることを意図しており、本明細書の例示的な実施形態の精神及び範囲内にある。
【0164】
なお、本明細書のいくつかの用語は、本明細書の実施形態を説明するために使用される。例えば、「1つの実施形態」、「実施形態」及び/又は「いくつかの実施形態」とは、当該実施形態と組み合わせて説明される特定の特徴、構造又は特性が本明細書の少なくとも1つの実施形態に含まれ得ることを意味する。したがって、本明細書の各部分における「実施形態」、「1つの実施形態」又は「代替実施形態」の2つ以上の参照は必ずしも同じ実施形態を指すわけではないことを強調し、理解することができる。なお、特定の特徴、構造又は特性は、本明細書の1つ又は複数の実施形態において適切に組み合わせることができる。
【0165】
なお、本明細書の実施形態の前述の説明では、特徴の理解を助けるために、本明細書を簡略化するために、本明細書は、様々な特徴を単一の実施形態、図面又はその説明に組み合わせる。しかしながら、これらの特徴の組み合わせが必須であるということではなく、当業者であれば、本明細書を閲読する時にその特徴の一部を抽出して単独の実施形態として理解することは十分可能である。つまり、本明細書における実施形態は、複数の二次的実施形態の整合として理解することができる。各二次的実施形態の内容は、前述の1つの開示実施形態のすべての特徴より少ない場合にも成り立つ。
【0166】
本明細書で引用する各特許、特許出願、特許出願の出版物及び他の資料、例えば、文章、書籍、明細書、出版物、文書、物品などは、引用によってここに組み合わせることができる。すべての目的のために使用されるすべての内容は、それに関連するいかなる起訴文書の履歴、この文書と一致しないか、又は矛盾する可能性があるいかなる同一のもの、又は特許請求の範囲の最も広い範囲に限定的な影響を及ぼす可能性があるいかなる同一の起訴文書の履歴を除く。現在又は今後この文書に関連する。例えば、この文書の用語は、含まれるいかなる資料に関連する用語の説明、定義、及び/又はこの文書に関連する用語、説明、定義、及び/又は間に矛盾や競合がある場合に使用される。
【0167】
最後に、本明細書に開示された出願の実施形態は、本明細書の実施形態の原理を説明するものであることを理解されたい。その他の修正された実施形態も本明細書の範囲内にある。したがって、本明細書に開示される実施形態は、単なる例であり、制限するものではない。当業者であれば、本明細書中の実施形態に基づいて代替的な構成をとって本明細書中の出願を実現することができる。したがって、本明細書の実施形態は、出願中に厳密に記載された実施形態に限定されるものではない。
図1
図2
図3
図4
図5
図6
図7
【手続補正書】
【提出日】2023-06-01
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
エコーの抑制のためのオーディオ信号処理方法であって、
少なくともスピーカ信号に基づいて複数のオーディオ処理モードから電子機器の目標オーディオ処理モードを選択するステップであって、前記スピーカ信号は、制御機器が前記電子機器に送信するオーディオ信号であるステップと、
前記目標オーディオ処理モードによってマイクロフォン信号を処理して目標オーディオを生成することにより、少なくとも前記目標オーディオにおけるエコーを低減するステップであって、前記マイクロフォン信号は、前記電子機器が取得するマイクロフォンモジュールの出力信号であり、前記マイクロフォンモジュールは、少なくとも1つの第1のタイプのマイクロフォン及び少なくとも1つの第2のタイプのマイクロフォンを含むステップと、
前記目標オーディオ信号を出力するステップと、を含む、
ことを特徴とするエコーの抑制のためのオーディオ信号処理方法。
【請求項2】
前記少なくとも1つの第1のタイプのマイクロフォンは、第1のオーディオ信号を出力し、及び、
前記少なくとも1つの第2のタイプのマイクロフォンは、第2のオーディオ信号を出力し、
ここで、前記マイクロフォン信号は、前記第1のオーディオ信号及び前記第2のオーディオ信号を含む、
ことを特徴とする請求項1に記載のオーディオ信号処理方法。
【請求項3】
前記少なくとも1つの第1のタイプのマイクロフォンは、人体振動信号の収集に用いられ、及び、
前記少なくとも1つの第2のタイプのマイクロフォンは、空気振動信号の収集に用いられる、
ことを特徴とする請求項2に記載のオーディオ信号処理方法。
【請求項4】
前記複数のオーディオ処理モードは、少なくとも、
前記第1のオーディオ信号及び前記第2のオーディオ信号を信号処理する第1のモードと、
前記第2のオーディオ信号を信号処理する第2のモードと、を含む、
ことを特徴とする請求項2に記載のオーディオ信号処理方法。
【請求項5】
少なくともスピーカ信号に基づいて複数のオーディオ処理モードから電子機器の目標オーディオ処理モードを選択する前記ステップは、
少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成するステップであって、前記制御信号が第1の制御信号又は第2の制御信号を含むステップと、
前記制御信号に基づいて、前記制御信号に対応する目標オーディオ処理モードを選択するステップであって、ここで、前記第1のモードが前記第1の制御信号に対応し、前記第2のモードが前記第2の制御信号に対応するステップと、を含む、
ことを特徴とする請求項4に記載のオーディオ信号処理方法。
【請求項6】
少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成する前記ステップは、
前記スピーカ信号強度が予め設定されたスピーカ閾値より低いと決定し、前記第1の制御信号を生成するステップ、あるいは、
前記スピーカ信号強度が前記スピーカ閾値より高いと決定し、前記第2の制御信号を生成するステップを含む、
ことを特徴とする請求項5に記載のオーディオ信号処理方法。
【請求項7】
少なくとも前記スピーカ信号強度に基づいて、前記スピーカ信号に対応する制御信号を生成する前記ステップは、
前記スピーカ信号強度及び前記マイクロフォン信号に基づいて、対応する制御信号を生成するステップを含む、
ことを特徴とする請求項5に記載のオーディオ信号処理方法。
【請求項8】
前記スピーカ信号強度及び前記マイクロフォン信号に基づいて、対応する制御信号を生成する前記ステップは、
前記マイクロフォン信号の評価パラメータを取得するステップであって、前記評価パラメータは、環境ノイズ評価パラメータを含み、前記環境ノイズ評価パラメータは、環境ノイズレベル及び信号対雑音比の少なくとも1つを含むステップと、
前記スピーカ信号強度及び前記評価パラメータに基づいて、前記制御信号を生成するステップと、を含む、
ことを特徴とする請求項7に記載のオーディオ信号処理方法。
【請求項9】
前記スピーカ信号強度及び前記評価パラメータに基づいて、前記制御信号を生成するステップは、
前記スピーカ信号強度が予め設定されたスピーカ閾値より高いと決定し、前記第2の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲外にあると決定し、前記第1の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第1の制御信号又は前記第2の制御信号を生成するステップとのいずれかの場合を含む、
ことを特徴とする請求項8に記載のオーディオ信号処理方法。
【請求項10】
前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあることは、
前記環境ノイズレベルが予め設定された環境ノイズ閾値より低いことと、
前記信号対雑音比が予め設定された信号対雑音比閾値より高いことと、の少なくとも1つを含む、
ことを特徴とする請求項9に記載のオーディオ信号処理方法。
【請求項11】
前記評価パラメータは、人間音声信号強度をさらに含み、前記スピーカ信号強度及び前記評価パラメータに基づいて、前記制御信号を生成する前記ステップは、
前記スピーカ信号強度が予め設定されたスピーカ閾値より高く、かつ前記人間音声信号強度が予め設定された人間音声閾値を超え、前記環境ノイズ評価パラメータが予め設定されたノイズ評価範囲外にあると決定し、前記第1の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値を超え、前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第2の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より高く、かつ前記人間音声信号強度が前記人間音声閾値より低いと決定し、前記第2の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲外にあると決定し、前記第1の制御信号を生成するステップと、
前記スピーカ信号強度が前記スピーカ閾値より低く、かつ前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあると決定し、前記第1の制御信号又は前記第2の制御信号を生成するステップとのいずれかの場合を含む、
ことを特徴とする請求項8に記載のオーディオ信号処理方法。
【請求項12】
前記環境ノイズ評価パラメータが前記ノイズ評価範囲内にあることは、
前記環境ノイズレベルが予め設定された環境ノイズ閾値より低いことと、
前記信号対雑音比が予め設定された信号対雑音比閾値より高いことと、の少なくとも1つを含む、
ことを特徴とする請求項11に記載のオーディオ信号処理方法。
【請求項13】
目標オーディオを生成する前記ステップは、
前記第1のモードにおける第1のアルゴリズムにより、前記第1のオーディオ信号及び前記第2のオーディオ信号を信号処理し、第1の目標オーディオを生成するステップ、あるいは、
前記第2のモードにおける第2のアルゴリズムにより、前記第2のオーディオ信号を信号処理し、第2の目標オーディオを生成するステップを含み、
ここで、前記目標オーディオは、前記第1の目標オーディオと前記第2の目標オーディオとのうちの1つを含み、
前記目標オーディオを出力する前記ステップは、
前記目標オーディオに対して平滑化処理を行い、前記目標オーディオが前記第1の目標オーディオと前記第2の目標オーディオとの間で切り替えられる時、前記第1の目標オーディオと前記第2の目標オーディオとの接続箇所に対して前記平滑化処理を行うステップと、
前記平滑化処理された前記目標オーディオを出力するステップと、を含む、
ことを特徴とする請求項5に記載のオーディオ信号処理方法。
【請求項14】
前記方法は、
前記制御信号に基づいて、前記スピーカのスピーカ入力信号の強度を制御するステップをさらに含み、具体的には、
前記制御信号を前記第1の制御信号として決定し、前記スピーカに入力される前記スピーカ入力信号の強度を低減することにより、前記スピーカが出力する音響の強度を低減するステップを含む、
ことを特徴とする請求項5に記載のオーディオ信号処理方法。
【請求項15】
エコーの抑制のためのオーディオ信号処理のシステムであって、
エコーを抑制するオーディオ信号処理のための少なくとも1つの指令セットが記憶されている少なくとも1つの記憶媒体と、
前記少なくとも1つの記憶媒体と通信可能に接続されている少なくとも1つのプロセッサと、を含み、
ここで、前記少なくとも1つのプロセッサは、前記システムが動作する場合、前記少なくとも1つの指令セットを読み取り、前記少なくとも1つの指令セットの指示に基づいて請求項1~14のいずれかに記載のエコーの抑制のためのオーディオ信号処理方法を実行する、
ことを特徴とするエコーの抑制のためのオーディオ信号処理のシステム。
【国際調査報告】