IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 深▲セン▼市韶音科技有限公司の特許一覧

特表2024-510225音声活動検出方法、システム、音声強調方法及びシステム
<>
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図1
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図2A
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図2B
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図2C
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図2D
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図2E
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図3
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図4
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図5
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図6
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図7
  • 特表-音声活動検出方法、システム、音声強調方法及びシステム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-06
(54)【発明の名称】音声活動検出方法、システム、音声強調方法及びシステム
(51)【国際特許分類】
   G10L 25/78 20130101AFI20240228BHJP
   H04R 3/00 20060101ALI20240228BHJP
   G10L 25/27 20130101ALI20240228BHJP
   G10L 21/0208 20130101ALI20240228BHJP
   G10L 21/0232 20130101ALI20240228BHJP
【FI】
G10L25/78
H04R3/00 320
G10L25/27
G10L21/0208 100B
G10L21/0232
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023555859
(86)(22)【出願日】2021-12-20
(85)【翻訳文提出日】2023-09-12
(86)【国際出願番号】 CN2021139747
(87)【国際公開番号】W WO2023115269
(87)【国際公開日】2023-06-29
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
(71)【出願人】
【識別番号】514156013
【氏名又は名称】深▲セン▼市韶音科技有限公司
【氏名又は名称原語表記】SHENZHEN SHOKZ CO.,LTD.
【住所又は居所原語表記】Floors 1-4,Factory Building 26,Shancheng Industrial Park,Shiyan Street,Bao’an District,Shenzhen,Guangdong 518108,CHINA
(74)【代理人】
【識別番号】100205936
【弁理士】
【氏名又は名称】崔 海龍
(74)【代理人】
【識別番号】100132805
【弁理士】
【氏名又は名称】河合 貴之
(72)【発明者】
【氏名】肖 楽
(72)【発明者】
【氏名】張 承乾
(72)【発明者】
【氏名】廖 風云
(72)【発明者】
【氏名】齊 心
【テーマコード(参考)】
5D220
【Fターム(参考)】
5D220BA06
5D220BB04
(57)【要約】
本明細書による音声活動検出方法、システム、音声強調方法及びシステムは、マイクロホン信号が所在する信号部分空間とターゲット音声信号が所在するターゲット部分空間との線形相関を計算することによって、マイクロホン信号にターゲット音声信号が存在する音声存在確率を確定する。前記音声強調方法及びシステムは、音声存在確率に基づいてフィルタリング係数を計算することによって、マイクロホン信号に対して音声強調を行うことができる。前記方法及びシステムは、音声存在確率の計算精度を向上させることによって、音声強調効果を向上させることができる。
【選択図】図3
【特許請求の範囲】
【請求項1】
音声活動検出方法であって、予め設定されたアレイ形状に分布しているM個のマイクロホンに用いられ、前記Mは1より大きい整数であり、
前記M個のマイクロホンにより出力されたマイクロホン信号を取得することと、
前記マイクロホン信号に基づいて、前記マイクロホン信号により構成される信号部分空間を確定することと、
ターゲット音声信号により構成されるターゲット部分空間を確定することと、
前記信号部分空間と前記ターゲット部分空間との線形相関に基づいて、前記マイクロホン信号に前記ターゲット音声信号が存在する音声存在確率を確定し出力することとを含む、ことを特徴とする音声活動検出方法。
【請求項2】
前記の、前記マイクロホン信号に基づいて、前記マイクロホン信号により構成される信号部分空間を確定することは、
前記マイクロホン信号に基づいて、前記マイクロホン信号のサンプリング共分散行列を確定することと、
前記サンプリング共分散行列に対して固有値分解を行い、前記サンプリング共分散行列の複数の固有ベクトルを確定することと、
前記複数の固有ベクトルのうちの少なくとも一部の固有ベクトルからなる行列を前記信号部分空間の基本行列とすることとを含む、ことを特徴とする請求項1に記載の音声活動検出方法。
【請求項3】
前記の、前記マイクロホン信号に基づいて、前記マイクロホン信号により構成される信号部分空間を確定することは、
前記マイクロホン信号に基づいて、DOA推定方法及び空間スペクトル推定方法のうちの少なくとも一つを含む空間推定方法で前記マイクロホン信号における信号源の方位角を確定することによって、前記マイクロホン信号の信号ステアリングベクトルを確定することと、
前記信号ステアリングベクトルが前記信号部分空間の基本行列であることを確定することとを含む、ことを特徴とする請求項1に記載の音声活動検出方法。
【請求項4】
前記の、ターゲット音声信号により構成されるターゲット部分空間を確定することは、
前記ターゲット音声信号に対応する、予め設定されたターゲットステアリングベクトルが前記ターゲット部分空間の基本行列であることを確定することを含む、ことを特徴とする請求項1に記載の音声活動検出方法。
【請求項5】
前記の、前記信号部分空間と前記ターゲット部分空間との線形相関に基づいて、前記マイクロホン信号に前記ターゲット音声信号が存在する音声存在確率を確定し出力することは、
前記信号部分空間と前記ターゲット部分空間との体積相関関数を確定することと、
前記体積相関関数に基づいて、前記信号部分空間と前記ターゲット部分空間との線形相関係数を確定することであって、ここで、前記線形相関係数が前記体積相関関数と負の相関があることと、
前記線形相関係数を前記音声存在確率として出力することとを含む、ことを特徴とする請求項1に記載の音声活動検出方法。
【請求項6】
前記の、前記体積相関関数に基づいて、前記信号部分空間と前記ターゲット部分空間との線形相関係数を確定することは、
前記体積相関関数が第1の閾値より大きいと確定し、前記線形相関係数が0であると確定するケース、
前記体積相関関数が第2の閾値より小さいと確定し、前記線形相関係数が1であると確定し、ここで、前記第2の閾値が前記第1の閾値より小さいケース、
前記体積相関関数が前記第1の閾値と前記第2の閾値との間にあると確定し、前記線形相関係数が0~1であり、前記線形相関係数が、前記体積相関関数と負の相関がある関数であると確定するケースのうちの一つを含む、ことを特徴とする請求項5に記載の音声活動検出方法。
【請求項7】
音声活動検出システムであって、
音声活動検出のための少なくとも一つの命令セットが記憶されている少なくとも一つの記憶媒体と、
前記少なくとも一つの記憶媒体と通信接続される少なくとも一つのプロセッサとを含み、
ここで、前記音声活動検出システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、請求項1~6のいずれか一項に記載の音声活動検出方法を実施する、ことを特徴とする音声活動検出システム。
【請求項8】
音声強調方法であって、予め設定されたアレイ形状に分布しているM個のマイクロホンに用いられ、前記Mは1より大きい整数であり、
前記M個のマイクロホンにより出力されたマイクロホン信号を取得することと、
請求項1~6のいずれか一項に記載の音声活動検出方法に基づいて、前記マイクロホン信号に前記ターゲット音声信号が存在する音声存在確率を確定することと、
前記音声存在確率に基づいて、前記マイクロホン信号に対応するフィルタリング係数ベクトルを確定することと、
前記フィルタリング係数ベクトルに基づいて、前記マイクロホン信号を統合し、ターゲットオーディオ信号を得て出力することとを含む、ことを特徴とする音声強調方法。
【請求項9】
前記の、前記音声存在確率に基づいて、前記マイクロホン信号に対応するフィルタリング係数ベクトルを確定することとは、
前記音声存在確率に基づいて、前記マイクロホン信号のノイズ共分散行列を確定することと、
MVDR方法及び前記ノイズ共分散行列に基づいて、前記フィルタリング係数ベクトルを確定することとを含む、ことを特徴とする請求項8に記載の音声強調方法。
【請求項10】
前記の、前記音声存在確率に基づいて、前記マイクロホン信号に対応するフィルタリング係数ベクトルを確定することは、
前記音声存在確率を、前記マイクロホン信号のうちのターゲットマイクロホン信号に対応するフィルタリング係数とすることであって、前記ターゲットマイクロホン信号が、前記マイクロホン信号のうちの、信号対ノイズ比が最も高い1ウェイマイクロホン信号を含むことと、
前記マイクロホン信号のうちの前記ターゲットマイクロホン信号以外の他のマイクロホン信号に対応するフィルタリング係数が0であることを確定することとを含み、
前記フィルタリング係数ベクトルは、前記ターゲットマイクロホン信号に対応するフィルタリング係数及び前記他のマイクロホン信号に対応するフィルタリング係数からなるベクトルを含む、ことを特徴とする請求項8に記載の音声強調方法。
【請求項11】
音声強調システムであって、
音声強調を行うための少なくとも一つの命令セットが記憶されている少なくとも一つの記憶媒体と、
前記少なくとも一つの記憶媒体と通信接続される少なくとも一つのプロセッサとを含み、
ここで、前記音声強調システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、請求項8~10のいずれか一項に記載の音声強調方法を実施する。ことを特徴とする音声強調システム。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書は、ターゲット音声信号処理技術分野に関し、特に音声活動検出方法、システム、音声強調方法及びシステムに関する。
【背景技術】
【0002】
ビームフォーミングアルゴリズムに基づく音声強調技術、特に最小分散無歪応答(Minimum Variance Distortionless Response、MVDRと略称される)の適応ビームフォーミングアルゴリズムにおいて、異なるマイクロホン間のノイズの統計的特性の関係を記述するパラメータ--ノイズ共分散行列をどのように解くことは極めて重要である。従来技術における主要な方法は音声存在確率の方法に基づいてノイズ共分散行列を計算し、例えば、音声活動検出方法(Voice Activity Detection、VADと略称される)により音声存在確率を推定し、さらにノイズ共分散行列を計算する。しかし、従来技術における音声存在確率の推定正確率が十分ではなく、それによりノイズ共分散行列の推定精度が低く、さらにMVDRアルゴリズムの音声強調効果が低い。特にマイクロホンの数が少なく、例えば、5個未満である場合、効果は急激に低下する。そのため、従来技術におけるMVDRアルゴリズムは、携帯電話、スマートスピーカーなどのマイクロホンの数が多く、間隔が大きいマイクロホンアレイ機器に用いられることが多いが、イヤホンのようなマイクロホンの数が少なく、間隔が小さい機器では音声強調効果が低い。
【0003】
そのため、精度のより高い音声活動検出方法、システム、音声強調方法及びシステムを提供する必要がある。
【発明の概要】
【0004】
本明細書は、精度のより高い音声活動検出方法、システム、音声強調方法及びシステムを提供する。
【0005】
第1の態様によれば、本明細書は、音声活動検出方法を提供し、予め設定されたアレイ形状に分布しているM個のマイクロホンに用いられ、前記Mは1より大きい整数であり、前記方法は、前記M個のマイクロホンにより出力されたマイクロホン信号を取得することと、前記マイクロホン信号に基づいて、前記マイクロホン信号により構成される信号部分空間を確定することと、ターゲット音声信号により構成されるターゲット部分空間を確定することと、前記信号部分空間と前記ターゲット部分空間との線形相関に基づいて、前記マイクロホン信号に前記ターゲット音声信号が存在する音声存在確率を確定し出力することとを含む。
【0006】
いくつかの実施例において、前記の、前記マイクロホン信号に基づいて、前記マイクロホン信号により構成される信号部分空間を確定することは、前記マイクロホン信号に基づいて、前記マイクロホン信号のサンプリング共分散行列を確定することと、前記サンプリング共分散行列に対して固有値分解を行い、前記サンプリング共分散行列の複数の固有ベクトルを確定することと、前記複数の固有ベクトルのうちの少なくとも一部の固有ベクトルからなる行列を前記信号部分空間の基本行列とすることとを含む。
【0007】
いくつかの実施例において、前記の、前記マイクロホン信号に基づいて、前記マイクロホン信号により構成される信号部分空間を確定することは、前記マイクロホン信号に基づいて、DOA推定方法及び空間スペクトル推定方法のうちの少なくとも一つを含む空間推定方法で前記マイクロホン信号における信号源の方位角を確定することによって、前記マイクロホン信号の信号ステアリングベクトルを確定することと、前記信号ステアリングベクトルが前記信号部分空間の基本行列であることを確定することとを含む。
【0008】
いくつかの実施例において、前記の、ターゲット音声信号により構成されるターゲット部分空間を確定することは、前記ターゲット音声信号に対応する、予め設定されたターゲットステアリングベクトルが前記ターゲット部分空間の基本行列であることを確定することを含む。
【0009】
いくつかの実施例において、前記、前記信号部分空間と前記ターゲット部分空間との線形相関に基づいて、前記マイクロホン信号に前記ターゲット音声信号が存在する音声存在確率を確定し出力することは、前記信号部分空間と前記ターゲット部分空間との体積相関関数を確定することと、前記体積相関関数に基づいて、前記信号部分空間と前記ターゲット部分空間との線形相関係数を確定することであって、ここで、前記線形相関係数が前記体積相関関数と負の相関があることと、前記線形相関係数を前記音声存在確率として出力することとを含む。
【0010】
いくつかの実施例において、前記の、前記体積相関関数に基づいて、前記信号部分空間と前記ターゲット部分空間との線形相関係数を確定することは、前記体積相関関数が第1の閾値より大きいと確定し、前記線形相関係数が0であると確定するケース、前記体積相関関数が第2の閾値より小さいと確定し、前記線形相関係数が1であると確定し、ここで、前記第2の閾値が前記第1の閾値より小さいケース、前記体積相関関数が前記第1の閾値と前記第2の閾値との間にあると確定し、前記線形相関係数が0~1であり、前記線形相関係数が、前記体積相関関数と負の相関がある関数であると確定するケースのうちの一つを含む。
【0011】
第2の態様によれば、本明細書は、音声活動検出システムをさらに提供し、前記システムは、少なくとも一つの記憶媒体と少なくとも一つのプロセッサとを含み、前記少なくとも一つの記憶媒体には、音声活動検出のための少なくとも一つの命令セットが記憶されており、前記少なくとも一つのプロセッサは、と、前記少なくとも一つの記憶媒体と通信接続され、ここで、前記音声活動検出システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、本明細書の第1の態様に記載の音声活動検出方法を実施する。
【0012】
第3の態様によれば、本明細書は、音声強調方法をさらに提供し、予め設定されたアレイ形状に分布しているM個のマイクロホンに用いられ、前記Mは1より大きい整数であり、前記方法は、前記M個のマイクロホンにより出力されたマイクロホン信号を取得することと、本明細書の第1の態様に記載の音声活動検出方法に基づいて、前記マイクロホン信号に前記ターゲット音声信号が存在する音声存在確率を確定することと、前記音声存在確率に基づいて、前記マイクロホン信号に対応するフィルタリング係数ベクトルを確定することと、前記フィルタリング係数ベクトルに基づいて、前記マイクロホン信号を統合し、ターゲットオーディオ信号を得て出力することとを含む。
【0013】
いくつかの実施例において、前記の、前記音声存在確率に基づいて、前記マイクロホン信号に対応するフィルタリング係数ベクトルを確定することは、前記音声存在確率に基づいて、前記マイクロホン信号のノイズ共分散行列を確定することと、MVDR方法及び前記ノイズ共分散行列に基づいて、前記フィルタリング係数ベクトルを確定することとを含む。
【0014】
いくつかの実施例において、前記の、前記音声存在確率に基づいて、前記マイクロホン信号に対応するフィルタリング係数ベクトルを確定することは、前記音声存在確率を、前記マイクロホン信号のうちのターゲットマイクロホン信号に対応するフィルタリング係数とすることであって、前記ターゲットマイクロホン信号が、前記マイクロホン信号のうちの、信号対ノイズ比が最も高い1ウェイマイクロホン信号を含むことと、前記マイクロホン信号のうちの前記ターゲットマイクロホン信号以外の他のマイクロホン信号に対応するフィルタリング係数が0であることを確定することとを含み、前記フィルタリング係数ベクトルは、前記ターゲットマイクロホン信号に対応するフィルタリング係数及び前記他のマイクロホン信号に対応するフィルタリング係数からなるベクトルを含む。
【0015】
第4の態様によれば、本明細書は、音声強調システムをさらに提供し、前記システムは、少なくとも一つの記憶媒体と少なくとも一つのプロセッサとを含み、前記少なくとも一つの記憶媒体には、音声強調を行うための少なくとも一つの命令セットが記憶されており、前記少なくとも一つのプロセッサは、前記少なくとも一つの記憶媒体と通信接続され、ここで、前記音声強調システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、本明細書の第2の態様に記載の音声強調方法を実施する。
【0016】
以上の技術案から分かるように、本明細書による音声活動検出方法、システム、音声強調方法及びシステムは、複数のマイクロホンからなるマイクロホンアレイに用いられる。ここで、マイクロホンアレイは、ノイズ信号を収集することもできるし、ターゲット音声信号を収集し、マイクロホン信号を出力することもできる。ターゲット音声信号とノイズ信号とは、クロスリンクのない二種類の信号である。ターゲット音声信号が所在するターゲット部分空間とノイズ信号が所在するノイズ部分空間とは、クロスリンクのない二つの部分空間である。マイクロホン信号にターゲット音声信号が存在しない場合、マイクロホン信号にはノイズ信号のみが含まれる。この場合、マイクロホン信号が所在する信号部分空間とターゲット音声信号が所在するターゲット部分空間とは、クロスリンクのない二つの部分空間であり、信号部分空間とターゲット部分空間との線形相関が低い。マイクロホン信号にターゲット音声信号が存在する場合、マイクロホン信号にはターゲット音声信号とノイズ信号の両方が含まれる。この場合、マイクロホン信号が所在する信号部分空間とターゲット音声信号が所在するターゲット部分空間とは、クロスリンクのある二つの部分空間であり、信号部分空間とターゲット部分空間との線形相関が高い。そのため、本明細書による音声活動検出方法及びシステムは、マイクロホン信号が所在する信号部分空間とターゲット音声信号が所在するターゲット部分空間との線形相関を計算することによって、マイクロホン信号にターゲット音声信号が存在する音声存在確率を確定することができる。前記音声強調方法及びシステムは、音声存在確率に基づいてフィルタリング係数を計算することによって、マイクロホン信号に対して音声強調を行うことができる。前記方法及びシステムは、音声存在確率の計算精度を向上させることによって、音声強調効果を向上させることができる。
【0017】
本明細書による音声活動検出方法、システム、音声強調方法及びシステムの他の機能は、以下に続く説明で部分的に記述される。説明によれば、以下の数字及び例に示される内容は、当業者にとって自明である。本明細書による音声活動検出方法、システム、音声強調方法及びシステムの創造的な態様は、以下の詳細な例に記載の方法、装置及び組み合わせの実践又は使用によって十分に解釈され得る。
【図面の簡単な説明】
【0018】
本明細書の実施例における技術案をより明確に説明するために、以下では、実施例の説明で使用する必要がある図面を簡単に説明するが、明らかなことに、以下の説明における図面は、本明細書の一部の実施例に過ぎず、当業者にとっては、創造的な労力を払うことなく、これらの図面に基づいて他の図面を入手することができる。
図1】本明細書の実施例による音声活動検出システムのハードウェア概略図である。
図2A】本明細書の実施例による電子機器の分解構造概略図である。
図2B】本明細書の実施例による第1のケースの正面図である。
図2C】本明細書の実施例による第1のケースの平面図である。
図2D】本明細書の実施例による第2のケースの正面図である。
図2E】本明細書の実施例による第2のケースの底面図である。
図3】本明細書の実施例による音声活動検出方法のフローチャートである。
図4】本明細書の実施例による信号部分空間の基本行列の確定のフローチャートである。
図5】本明細書の実施例による信号部分空間の基本行列の確定の別のフローチャートである。
図6】本明細書の実施例による音声存在確率の計算のフローチャートである。
図7】本明細書の実施例によるなす正準角の概略図である。
図8】本明細書の実施例による音声強調方法のフローチャートである。
【発明を実施するための形態】
【0019】
以下の説明は、当業者が本明細書における内容を作成及び使用することを可能にするために、本明細書の特定の適用シーンと要件を提供した。開示された実施例に対する様々な部分的な修正は、当業者にとって明らかであり、且つここで定義された一般原理は、本明細書の精神及び範囲から逸脱することなく、他の実施例及び用途に適用され得る。そのため、本明細書は、示された実施例に限定されるものではなく、請求項と一致する最も広い範囲である。
【0020】
ここで使用される用語は、特定の例示的な実施例を説明する目的のためだけのものであり、限定するものではない。例えば、文脈が別途明確に指示しない限り、ここで使用される単数形「一」、「一つ」及び「該」は、複数形を含むものでもあり得る。本明細書で使用される場合、「含む」、「包含」及び/又は「含有」という用語は、関連する整数、ステップ、動作、要素及び/又はコンポーネントの存在を意味するが、一つ又は複数の他の特徴、整数、ステップ、動作、要素、コンポーネント及び/又はグループの存在を排除するものではなく、又は該システム/方法に他の特徴、整数、ステップ、動作、要素、コンポーネント及び/又はグループが追加されてもよい。
【0021】
以下の説明を考慮すると、本明細書のこれらの特徴及び他の特徴、並びに構造の関連素子の動作及び機能、並びに部品の組み合わせ及び製造の経済性を明らかに向上させることができる。図面を参照すると、その全ては本明細書の一部を形成する。しかしながら、図面は、例示及び説明のみを目的とし、本明細書の範囲を限定することを意図していないことが明確に理解されるべきである。図面は縮尺どおりに描かれていないことも理解されるべきである。
【0022】
本明細書で使用されるフローチャートは、本明細書のいくつかの実施例によるシステム実現の動作を示す。フローチャートの動作は順序を違えて実現され得ることが明確に理解されるべきである。逆に、動作は、逆順で、又は同時に実現され得る。なお、フローチャートに一つ又は複数の他の動作を追加してもよい。フローチャートから一つ又は複数の動作を除去してもよい。
【0023】
説明を容易にするために、まず、本明細書に現れる用語を以下のように説明する。
<最小分散無歪応答(Minimum Variance Distortionless Response、MVDRと略称される)>
最大信号対干渉雑音比(SINR)基準に基づく適応ビームフォーミングアルゴリズムであり、MVDRアルゴリズムは、適応的に、アレイ出力の所望の方向におけるパワーを最小にするとともに、信号対干渉雑音比を最大にすることができる。記録信号の分散を最小化することを目標とする。ノイズ信号と所望の信号とが相関しなければ、記録信号の分散は所望の信号及びノイズ信号の分散の和となる。そのため、MVDRソリューションは、該総和を最小化することによって、ノイズ信号の影響を軽減することを求めている。その原理は、所望の信号に歪みがないという制約条件の下で、適切なフィルタ係数を選択し、アレイ出力の平均パワーを最小化することである。
【0024】
<音声活動検出>
ターゲット音声信号から発話音声区間と非発話区間を分割する処理手順である。
【0025】
<ガウス分布>
正規分布(Normal distribution)であり、「定常分布」とも呼ばれ、別名ガウス分布(Gaussian distribution)であり、正規曲線は、ベル型であり、両端が低く、中央が高く、左右対称であり、その曲線がベル型を呈するため、しばしばベル曲線と呼ばれる。ランダム変数Xは、期待値がμであり、方差がσである正規分布に従う場合、N(μ,σ)と記される。確率密度関数が正規分布であるその所望値μによりその位置が決定され、その標準偏差σにより分布の振幅が決定された。μ=0であり、σ=1である場合の正規分布は標準正規分布である。
【0026】
図1は、本明細書の実施例による音声活動検出システムのハードウェア概略図を示した。音声活動検出システムは、電子機器200に用いることができる。
【0027】
いくつかの実施例において、電子機器200は、無線イヤホン、有線イヤホン、スマートウェアラブルデバイス、例えば、スマートグラス、スマートヘルメット又はスマートウォッチなどの、オーディオ処理機能を有する機器であってもよい。電子機器200はまた、モバイル機器、タブレットコンピュータ、ノートパソコン、自動車の内蔵装置もしくは類似のもの、又はそれらの任意の組み合わせであってもよい。いくつかの実施例において、モバイル機器は、スマートホーム機器、スマートモバイル機器もしくは類似の機器、又はそれらの任意の組み合わせを含んでもよい。例えば、前記スマートモバイル機器は、携帯電話、パーソナルデジタルアシスタント、ゲーム機器、ナビゲーション機器、ウルトラモバイルパーソナルコンピュータ(Ultra-mobile Personal Computer、UMPC)など、又はそれらの任意の組み合わせを含んでもよい。いくつかの実施例において、前記スマートホーム装置は、スマートテレビ、デスクトップコンピュータなど、又は任意の組み合わせを含んでもよい。いくつかの実施例において、自動車の内蔵装置は、車載コンピュータ、車載テレビなどを含んでもよい。
【0028】
本明細書において、本発明者らは、電子機器200がイヤホンであることを例として説明する。前記イヤホンは、無線イヤホンであってもよいし、有線イヤホンであってもよい。図1に示すように、電子機器200は、マイクロホンアレイ220と計算装置240とを含んでもよい。
【0029】
マイクロホンアレイ220は、電子機器200のオーディオ収集機器であってもよい。マイクロホンアレイ220は、ローカルオーディオを取得し、マイクロホン信号、つまりオーディオ情報付きの電子信号を出力するように構成されてもよい。マイクロホンアレイ220は、予め設定されたアレイ形状に分布しているM個のマイクロホン222を含んでもよい。ここで、前記Mは1より大きい整数である。M個のマイクロホン222は、均一に分布してもよいし、不均一に分布してもよい。M個のマイクロホン222は、マイクロホン信号を出力することができる。M個のマイクロホン222は、M個のマイクロホン信号を出力することができる。各マイクロホン222は、一つのマイクロホン信号に対応する。前記M個のマイクロホン信号は、前記マイクロホン信号と総称される。いくつかの実施例において、M個のマイクロホン222は線形に分布してもよい。いくつかの実施例において、M個のマイクロホン222は、他の形状のアレイ、例えば、円形アレイ、矩形アレイなどとして分布してもよい。説明を容易にするために、以下の説明では、本発明者らは、M個のマイクロホン222が線形に分布することを例として説明する。いくつかの実施例において、Mは、1より大きい任意の整数であってもよく、例えば、2、3、4、5、又はそれ以上である。いくつかの実施例において、空間的制約により、Mは、例えば、イヤホンなどの製品において、1より大きく5以下の整数であってもよい。電子機器200がイヤホンである場合、M個のマイクロホン222のうちの隣接するマイクロホン222の間隔は20mm~40mmであってもよい。いくつかの実施例において、隣接するマイクロホン222の間隔は、10mm~20mmのように、より小さくてもよい。
【0030】
いくつかの実施例において、マイクロホン222は、人体振動信号を直接収集する骨伝導マイクロホンであってもよい。骨伝導マイクロホンは、振動センサ、例えば、光学式振動センサ、加速度センサなどを含んでもよい。前記振動センサは、機械的振動信号(例えば、ユーザが話している時に皮膚又は骨格により生成される振動による信号)を収集し、該機械的振動信号を電気信号に変換することができる。ここでいう機械的振動信号とは、主に固体を介して伝播する振動を指す。骨伝導マイクロホンは、前記振動センサ又は前記振動センサに接続される振動部品を介してユーザの皮膚又は骨格に接触することによって、ユーザが音声を発した時に皮膚又は骨格により生成される振動信号を収集し、振動信号を電気信号に変換する。いくつかの実施例において、前記振動センサは、機械的振動に敏感であるが空気振動に敏感でない装置であってもよい(即ち機械的振動に対する前記振動センサの応答能力は、空気振動に対する前記振動センサの応答能力を上回る)。骨伝導マイクロホンは、発声部位の振動信号を直接収音することができるため、環境ノイズの影響を低減ことができる。
【0031】
いくつかの実施例において、マイクロホン222は、空气振動信号を直接収集する空気伝導マイクロホンであってもよい。空気伝導マイクロホンは、ユーザが音声を発した時に生じる空気振動信号を収集し、空気振動信号を電気信号に変換する。
【0032】
いくつかの実施例において、M個のマイクロホン222は、M個の骨伝導マイクロホンであってもよい。いくつかの実施例において、M個のマイクロホン222は、M個の空気伝導マイクロホンであってもよい。いくつかの実施例において、M個のマイクロホン222は、骨伝導マイクロホンを含んでもよいし、空気伝導マイクロホンを含んでもよい。無論、マイクロホン222は、他のタイプのマイクロホンであってもよい。例えば、光学式マイクロホン、筋電位信号を受信するマイクロホンなどである。
【0033】
計算装置240は、マイクロホンアレイ220と通信接続されてもよい。前記通信接続は、情報を直接又は間接的に受信できる任意の形の接続を指す。いくつかの実施例において、計算装置240は、無線通信接続を介してマイクロホンアレイ220と互いにデータを通信することができ、いくつかの実施例において、計算装置240は、電線によってマイクロホンアレイ220に直接接続されて互いにデータを通信することもでき、いくつかの実施例において、計算装置240はまた、電線によって他の回路に直接接続されてマイクロホンアレイ220との間接的な接続を確立することによって、互いの間のデータ通信を実現することができる。本明細書において、計算装置240が電線によってマイクロホンアレイ220に直接接続されることを例として説明する。
【0034】
計算装置240は、データ情報処理機能を有するハードウェア機器であってもよい。いくつかの実施例において、音声活動検出システムは、計算装置240を含んでもよい。いくつかの実施例において、音声活動検出システムは、計算装置240に用いることができる。即ち音声活動検出システムは、計算装置240上で作動することができる。音声活動検出システムは、データ情報処理機能を有するハードウェア機器と、該ハードウェア機器の動作を駆動するために必要なプログラムとを含んでもよい。無論、音声活動検出システムは、データ処理機能を有するハードウェア機器のみであってもよく、又は、ハードウェア機器で作動するプログラムのみであってもよい。
【0035】
音声活動検出システムは、本明細書に記述されている音声活動検出方法を実行するデータ又は命令を記憶することができ、前記データ及び/又は命令を実行することもできる。音声活動検出システムが計算装置240上で作動する場合、音声活動検出システムは、前記通信接続に基づいてマイクロホンアレイ220から前記マイクロホン信号を取得し、本明細書に記述されている音声活動検出方法の数据又は命令を実行し、前記マイクロホン信号にターゲット音声信号が存在する音声存在確率を計算することができる。前記音声活動検出方法は、本明細書の他の部分で紹介される。例えば、前記音声活動検出方法は、図3図8の説明において紹介されている。
【0036】
図1に示すように、計算装置240は、少なくとも一つの記憶媒体243と、少なくとも一つのプロセッサ242とを含んでもよい。いくつかの実施例において、電子機器200は、通信ポート245と、内部通信バス241とをさらに含んでもよい。
【0037】
内部通信バス241は、記憶媒体243と、プロセッサ242と、通信ポート245とを含む異なるシステムコンポーネントに接続されてもよい。
【0038】
通信ポート245は、計算装置240と外部とのデータ通信に用いることができる。例えば、計算装置240は、通信ポート245を介してマイクロホンアレイ220から前記マイクロホン信号を取得することができる。
【0039】
少なくとも一つの記憶媒体243は、データ記憶装置を含んでもよい。前記データ記憶装置は、非一時的な記憶媒体であってもよいし、一時的な記憶媒体であってもよい。例えば、前記データ記憶装置は、磁気ディスク、読み取り専用記憶媒体(ROM)又はランダムアクセス記憶媒体(RAM)のうちの一つ又は複数を含んでもよい。音声活動検出システムが計算装置240上で作動可能である場合、記憶媒体243は、前記データ記憶装置に記憶されている、前記マイクロホン信号に対して音声活動検出を行うための少なくとも一つの命令セットをさらに含んでもよい。前記命令は、コンピュータプログラムコードであり、前記コンピュータプログラムコードは、本明細書による音声活動検出方法を実行するプログラム、ルーチン、オブジェクト、コンポーネント、データ構造、プロセス、モジュールなどを含んでもよい。
【0040】
少なくとも一つのプロセッサ242は、内部通信バス241を介して、少なくとも一つの記憶媒体243と通信接続することができる。前記通信接続は、情報を直接又は間接的に受信できる任意の形の接続を指す。少なくとも一つのプロセッサ242は、上記少なくとも一つの命令セットを実行するためのものである。音声活動検出システムが計算装置240上で作動可能である場合、少なくとも一つのプロセッサ242は、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って本明細書による音声活動検出方法を実行する。プロセッサ242は、音声活動検出方法に含まれる全てのステップを実行することができる。プロセッサ242は、一つ又は複数のプロセッサの形態であってもよく、いくつかの実施例において、プロセッサ242は、一つ又は複数のハードウェアプロセッサ、例えば、マイクロコントローラ、マイクロプロセッサ、縮小命令セットコンピュータ(RISC)、専用集積回路(ASIC)、特定用途向け命令セットプロセッサ(ASIP)、中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)、物理処理ユニット(PPU)、マイクロコントローラユニット、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、アドバンスドRISCマシン(ARM)、プログラマブルロジックデバイス(PLD)、一つ又は複数の機能を実行できる任意の回路もしくはプロセッサなど、又はそれらの任意の組み合わせを含んでもよい。単に問題を説明するために、本明細書では、計算装置240には一つのプロセッサ242のみが説明されている。しかしながら、注意すべきこととして、本明細書における計算装置240は、複数のプロセッサ242をさらに含んでもよく、そのため、本明細書に開示された動作及び/又は方法ステップは、本明細書に記載されるように一つのプロセッサによって実行されてもよいし、複数のプロセッサによって共同で実行されてもよい。例えば、本明細書において、計算装置240のプロセッサ242がステップA及びステップBを実行する場合、理解すべきこととして、ステップA及びステップBは、二つの異なるプロセッサ242によって共同で又は別々に実行されてもよい(例えば、第1のプロセッサがステップAを実行し、第2のプロセッサがステップBを実行し、又は第1の及び第2のプロセッサがステップA及びBを共同で実行する)。
【0041】
図2Aは、本明細書の実施例による電子機器200の分解構造概略図を示した。図2Aに示すように、電子機器200は、マイクロホンアレイ220、計算装置240、第1のケース260及び第2のケース280を含んでもよい。
【0042】
第1のケース260は、マイクロホンアレイ220の実装基材であってもよい。マイクロホンアレイ220は1のケース260の内部に実装されてもよい。第1のケース260の形状は、マイクロホンアレイ220の分布形状に応じて適応的に設計されてもよく、本明細書はこれについてあまり限定しない。第2のケース280は、計算装置240の実装基材であってもよい。計算装置240は第2のケース280の内部に実装されてもよい。第2のケース280の形状は、計算装置240の形状に応じて適応的に設計されてもよく、本明細書はこれについてあまり限定しない。電子機器200がイヤホンである場合、第2のケース280は着用部位に接続されてもよい。第2のケース280は第1のケース260に接続されてもよい。前述のように、マイクロホンアレイ220は計算装置240に電気的に接続されてもよい。具体的には、マイクロホンアレイ220は、第1のケース260と第2のケース280との接続を通じて、計算装置240との電気的接続を実現することができる。
【0043】
いくつかの実施例において、第1のケース260は、一体成形、溶接、かしめ接続、接着などの方式で第2のケース280に固定接続されてもよい。いくつかの実施例において、第1のケース260は、第2のケース280に取り外し可能に接続されてもよい。計算装置240は、異なるマイクロホンアレイ220と通信接続されてもよい。具体的には、異なるマイクロホンアレイ220は、マイクロホンアレイ220におけるマイクロホン222の数、アレイ形状、マイクロホン222の間隔、マイクロホンアレイ220の第1のケース260での実装角度、マイクロホンアレイ220の第1のケース260での実装位置などが異なっていてもよい。着用者は、応用シナリオの違いに応じて、対応するマイクロホンアレイ220を交換して、電子機器200をより広いシナリオに適用することができる。例えば、応用シナリオにおいて着用者と電子機器200との距離が短い場合、着用者は、間隔のより小さいマイクロホンアレイ220に交換することができる。さらに例えば、応用シナリオにおいて着用者と電子機器200との距離が長い場合、着用者は、間隔のより大きい、より多くの数のマイクロホンアレイ220に交換することができる、などが挙げられる。
【0044】
前記取り外し可能な接続は、任意の形態の物理的接続、例えば、ネジ接続、スナップ式接続、磁気吸着式接続などであってもよい。いくつかの実施例において、第1のケース260と第2のケース280との間は磁気吸着接続されてもよい。即ち第1のケース260と第2のケース280との間は、磁気装置の吸着力によって取り外し可能に接続される。
【0045】
図2Bは、本明細書の実施例による第1のケース260の正面図を示し、図2Cは、本明細書の実施例による第1のケース260の平面図を示した。図2B及び図2Cに示すように、第1のケース260は第1のインターフェース262を含んでもよい。いくつかの実施例において、第1のケース260はタッチポイント266をさらに含んでもよい。いくつかの実施例において、第1のケース260は角度センサ(図2B及び図2Cに図示されていない)をさらに含んでもよい。
【0046】
第1のインターフェース262は、第1のケース260及び第2のケース280の実装インターフェースであってもよい。いくつかの実施例において、第1のインターフェース262は円形であってもよい。第1のインターフェース262は第2のケース280に回転可能に接続されてもよい。第1のケース260が第2のケース280上に実装される場合、第1のケース260を第2のケース280に対して回転させ、第1のケース260の第2のケース280に対する角度を調整することによって、マイクロホンアレイ220の角度を調整することができる。
【0047】
第1のインターフェース262上には、第1の磁気装置263が設置されていてもよい。第1の磁気装置263は、第1のインターフェース262の第2のケース280に近い位置に設置されてもよい。第1の磁気装置263は、磁気吸着力を発生させることによって、第2のケース280との取り外し可能な接続を実現することができる。第1のケース260が第2のケース280に接近すると、前記吸着力によって、第1のケース260が第2のケース280に迅速に接続される。いくつかの実施例において、第1のケース260が第2のケース280に接続された後、第1のケース260が依然として第2のケース280に対して回転することができ、それによりマイクロホンアレイ220の角度を調整する。前記吸着力の作用により、第1のケース260が第2のケース280に対して回転しても、第1のケース260と第2のケース280との接続を維持することができる。
【0048】
いくつかの実施例において、第1のインターフェース262にはさらに第1の位置決め装置(図2B及び図2Cに図示されていない)が設置されていてもよい。前記第1の位置決め装置は、外側に突起する位置決め段部であってもよいし、内側に延伸する位置決め孔であってもよい。前記第1の位置決め装置は、第2のケース280と係合して、第1のケース260と第2のケース280の迅速な実装を実現することができる。
【0049】
図2B及び図2Cに示すように、いくつかの実施例において、第1のケース260はタッチポイント266をさらに含んでもよい。タッチポイント266は、第1のインターフェース262位置に実装されてもよい。タッチポイント266は、第1のインターフェース262位置から外側に突出することができる。タッチポイント266は、第1のインターフェース262に弾性的に接続されてもよい。タッチポイント266は、マイクロホンアレイ220におけるM個のマイクロホン222と通信接続することができる。タッチポイント266は、データ伝送を実現するために、弾性のある金属で製造されてもよい。第1のケース260が第2のケース280に接続される場合、マイクロホンアレイ220は、タッチポイント266を介して計算装置240との通信接続を実現することができる。いくつかの実施例において、タッチポイント266は円形に分布してもよい。第1のケース260が第2のケース280に接続された後、第1のケース260が第2のケース280に対して回転する時、タッチポイント266も第2のケース280に対して回転することができ、計算装置240との通信接続を維持する。
【0050】
いくつかの実施例において、第1のケース260上にはさらに、角度センサ(図2B及び図2Cに図示されていない)が設置されていてもよい。前記角度センサは、タッチポイント266と通信接続することによって、計算装置240との通信接続を実現することができる。前記角度センサは、第1のケース260の角度データを収集することによって、マイクロホンアレイ220が位置する角度を確定し、後続の音声存在確率の計算のために基準データを提供することができる。
【0051】
図2Dは、本明細書の実施例による第2のケース280の正面図を示し、図2Eは、本明細書の実施例による第2のケース280の底面図を示した。図2D及び図2Eに示すように、第2のケース280は第2のインターフェース282を含んでもよい。いくつかの実施例において、第2のケース280はガイドレール286をさらに含んでもよい。
【0052】
第2のインターフェース282は、第2のケース280及び第1のケース260の実装インターフェースであってもよい。いくつかの実施例において、第2のインターフェース282は円形であってもよい。第2のインターフェース282は、第1のケース260の第1のインターフェース262に回転可能に接続されてもよい。第1のケース260が第2のケース280上に実装される場合、第1のケース260を第2のケース280に対して回転させ、第1のケース260の第2のケース280に対する角度を調整することによって、マイクロホンアレイ220の角度を調整することができる。
【0053】
第2のインターフェース282上には、第2の磁気装置283が設置されていてもよい。第2の磁気装置283は、第2のインターフェース282の第1のケース260に近い位置に設置されてもよい。第2の磁気装置283は、磁気吸着力を発生させることによって、第1のインターフェース262との取り外し可能な接続を実現することができる。第2の磁気装置283は、第1の磁気装置263と係合して使用され得る。第1のケース260が第2のケース280に接近すると、第2の磁気装置283と第1の磁気装置263との間の吸着力によって、第1のケース260を第2のケース280上に迅速に実装することができる。第1のケース260が第2のケース280上に実装される場合、第2の磁気装置283は、第1の磁気装置263の位置と対向する。いくつかの実施例において、第1のケース260が第2のケース280に接続された後、第1のケース260が依然として第2のケース280に対して回転することができ、それによりマイクロホンアレイ220の角度を調整する。前記吸着力の作用により、第1のケース260が第2のケース280に対して回転しても、第1のケース260と第2のケース280との接続を維持することができる。
【0054】
いくつかの実施例において、第2のインターフェース282上にはさらに、第2の位置決め装置(図2D及び図2Eに図示されていない)が設置されていてもよい。前記第2の位置決め装置は、外側に突起する位置決め段部であってもよいし、内側に延伸する位置決め孔であってもよい。前記第2の位置決め装置は、第1のケース260の第1の位置決め装置と係合して、第1のケース260と第2のケース280との迅速な実装を実現することができる。前記第1の位置決め装置が前記位置決め段部である場合、前記第2の位置決め装置は前記位置決め孔であってもよい。前記第1の位置決め装置が前記位置決め孔である場合、前記第2の位置決め装置は前記位置決め段部であってもよい。
【0055】
図2D及び図2Eに示すように、いくつかの実施例において、第2のケース280はガイドレール286をさらに含んでもよい。ガイドレール286は、第2のインターフェース282位置に実装されてもよい。ガイドレール286は、計算装置240と通信接続することができる。ガイドレール286は、データ伝送を実現するために、金属材料で製造されてもよい。第1のケース260が第2のケース280に接続された場合、タッチポイント266がガイドレール286に接触して通信接続を形成することができ、それによってマイクロホンアレイ220と計算装置240との通信接続を実現して、データ伝送を実現する。前述のように、タッチポイント266は、第1のインターフェース262に弾性的に接続されてもよい。そのため、第1のケース260が第2のケース280に接続された後、前記弾性的接続の弾力作用により、タッチポイント266をガイドレール286に完全に接触させて、確実な通信接続を実現することができる。いくつかの実施例において、ガイドレール286は円形に分布してもよい。第1のケース260が第2のケース280に接続された後、第1のケース260が第2のケース280に対して回転する時、タッチポイント266もガイドレール286に対して回転することができ、ガイドレール286との通信接続を維持する。
【0056】
図3は、本明細書の実施例による音声活動検出方法P100のフローチャートを示した。前記方法P100は、前記マイクロホン信号にターゲット音声信号が存在する音声存在確率を計算することができる。具体的には、プロセッサ242は前記方法P100を実行することができる。
【0057】
図3に示すように、前記方法P100は、
S120:M個のマイクロホン222により出力されたマイクロホン信号を取得することを含んでもよい。
【0058】
前述のように、各マイクロホン222は、いずれも対応するマイクロホン信号を出力することができる。M個のマイクロホン222はM個のマイクロホン信号に対応する。前記方法P100は、前記マイクロホン信号にターゲット音声信号が存在する音声存在確率を計算する場合、M個のマイクロホン信号のうちの全てのマイクロホン信号に基づいて計算してもよいし、一部のマイクロホン信号に基づいて計算してもよい。そのため、前記マイクロホン信号は、M個のマイクロホン222に対応するM個のマイクロホン信号又は一部のマイクロホン信号を含んでもよい。本明細書の以下の説明において、前記マイクロホン信号がM個のマイクロホン222に対応するM個のマイクロホン信号を含み得ることを例として説明する。
【0059】
いくつかの実施例において、前記マイクロホン信号は時間領域信号であってもよい。説明を容易にするために、本発明者らは、時刻tのマイクロホン信号をx(t)と標識する。マイクロホン信号x(t)は、M個のマイクロホン信号からなる信号ベクトルであってもよい。この場合、マイクロホン信号x(t)は以下の式で表されてもよい。
【数1】
【0060】
マイクロホン信号x(t)は時間領域信号である。いくつかの実施例において、ステップS120において、計算装置240はさらに、前記マイクロホン信号x(t)に対してスペクトル分析を行うことができる。具体的には、計算装置240は、マイクロホン信号の時間領域信号x(t)に基づいてフーリエ変換を行って、前記マイクロホン信号の周波数領域信号xf,tを取得することができる。以下の説明では、周波数領域におけるマイクロホン信号xf,tを例として説明する。マイクロホン信号xf,tは、M個のマイクロホン信号からなるM次元の信号ベクトルであってもよい。この場合、マイクロホン信号xf,tは以下の式で表されてもよい。
【数2】
【0061】
前述のように、マイクロホン222は、周囲環境のノイズを収集しノイズ信号を出力することができ、ターゲットユーザの音声を収集し前記ターゲット音声信号を出力することもできる。ターゲットユーザが音声を発していない場合、前記マイクロホン信号は前記ノイズ信号のみを含む。ターゲットユーザが音声を発した場合、前記マイクロホン信号は、前記ターゲット音声信号と前記ノイズ信号とを含む。マイクロホン信号xf,tは以下の式で表されてもよい。
【数3】
【0062】
ここで、sf,tは、前記ターゲット音声信号の複素振幅である。Pは前記ターゲット音声信号のターゲットステアリングベクトルである。df,tはマイクロホン信号xf,tにおけるノイズ信号である。Qは前記ノイズ信号のノイズステアリングベクトルである。
【0063】
f,tはターゲット音声信号の複素振幅である。いくつかの実施例において、マイクロホン222の周囲に一つのターゲット音声信号源が存在する。いくつかの実施例において、マイクロホン222の周囲にL個のターゲット音声信号源が存在する。この場合、sf,tはL×1次元のベクトルであってもよい。sf,tは以下の式で表されてもよい。
【数4】
【0064】
ターゲットステアリングベクトルPはM×L次元の行列である。ターゲットステアリングベクトルPは以下の式で表されてもよい。
【数5】
【0065】
ここで、fはキャリア周波数である。dは隣接するマイクロホン222の間の距離である。cは音速である。θ、・・・・・・、θは、それぞれL個のターゲット音声信号源とマイクロホン222との間の入射角度である。いくつかの実施例において、ターゲット音声信号源sf,tの角度は、通常、特定の角度範囲内に分布する。そのため、θ、・・・・・・、θは既知である。計算装置240には、M個のマイクロホン222の相対距離又は相対座標のような相対位置関係が予め記憶されている。即ち計算装置240には、隣接するマイクロホン222の間の距離dが予め記憶されている。つまり、計算装置240には、ターゲットステアリングベクトルPが予め記憶されていてもよい。
【0066】
ノイズ信号df,tは、M個のマイクロホン222により収集されるM次元の信号ベクトルであってもよい。ノイズ信号df,tは以下の式で表されてもよく、df,tはノイズ信号の複素振幅である。いくつかの実施例において、マイクロホン222の周囲にN個のノイズ信号源が存在する。この場合、df,tはN×1次元のベクトルであってもよい。df,tは以下の式で表されてもよい。
【数6】
【0067】
前記ノイズステアリングベクトルQはM×N次元の行列である。ノイズ信号の不規則性のため、ノイズ信号df,t及びノイズステアリングベクトルQは未知である。
【0068】
いくつかの実施例において、式(3)はさらに、以下の式で表されてもよい。
【数7】
【0069】
ここで、[P,Q]は、マイクロホン信号xf,tの信号ステアリングベクトルである。
【0070】
前述のように、マイクロホン222は、ターゲット音声信号sf,tを収集することもできるし、ノイズ信号df,tを収集することもできる。ターゲット音声信号sf,tとノイズ信号df,tとは、クロスリンクのない二種類の信号である。そのため、ターゲット音声信号sf,tが所在するターゲット部分空間とノイズ信号df,tが所在するノイズ部分空間とは、クロスリンクのない二つの部分空間である。そのため、マイクロホン信号xf,tにターゲット音声信号sf,tが存在しない場合、マイクロホン信号xf,tにはノイズ信号df,tのみが含まれる。この場合、マイクロホン信号xf,tが所在する信号部分空間とターゲット音声信号sf,tが所在するターゲット部分空間とは、クロスリンクのない二つの部分空間であり、前記信号部分空間と前記ターゲット部分空間との線形相関が低いか又はゼロである。マイクロホン信号xf,tにターゲット音声信号sf,tが存在する場合、マイクロホン信号xf,tにはターゲット音声信号sf,tとノイズ信号df,tの両方が含まれる。この場合、マイクロホン信号xf,tが所在する信号部分空間とターゲット音声信号sf,tが所在するターゲット部分空間とは、クロスリンクのある二つの部分空間であり、前記信号部分空間と前記ターゲット部分空間との線形相関が高い。そのため、計算装置240は、マイクロホン信号xf,tが所在する信号部分空間とターゲット音声信号sf,tが所在するターゲット部分空間との線形相関を計算することによって、マイクロホン信号xf,tにターゲット音声信号sf,tが存在する音声存在確率を確定することができる。説明を容易にするために、本発明者らは、信号部分空間をspan(U)として定義し、ターゲット部分空間をspan(U)として定義する。
【0071】
図3に示すように、前記方法P100は、
S140:前記マイクロホン信号xf,tに基づいて、前記マイクロホン信号xf,tにより構成される信号部分空間span(U)を確定することをさらに含んでもよい。
【0072】
いくつかの実施例において、前記信号部分空間span(U)の確定は、前記信号部分空間span(U)の基本行列Uを確定することを指す。いくつかの実施例において、計算装置240は、マイクロホン信号xf,tのサンプリング共分散行列に基づいて、前記信号部分空間span(U)の基本行列Uを確定することができる。説明を容易にするために、本発明者らは、サンプリング共分散行列をMとして定義する。図4は、本明細書の実施例による信号部分空間span(U)の基本行列Uの確定のフローチャートを示した。図4に示すステップは、計算装置240が、マイクロホン信号xf,tのサンプリング共分散行列Mに基づいて、前記信号部分空間span(U)の基本行列Uを確定することに対応する。図4に示すように、ステップS140は以下を含んでもよい。
【0073】
S142:マイクロホン信号xf,tに基づいて、マイクロホン信号xf,tのサンプリング共分散行列Mを確定する。
【0074】
サンプリング共分散行列Mは以下の式で表されてもよい。
【数8】
【0075】
S144:サンプリング共分散行列Mに対して固有値分解を行い、サンプリング共分散行列Mの複数の固有ベクトルを確定する。
【0076】
さらに、サンプリング共分散行列Mに対して固有値分解を行い、サンプリング共分散行列Mの複数の特徴量を得る。サンプリング共分散行列MはM×M次元の行列である。サンプリング共分散行列Mの特徴量の数はMであり、M個の特徴量は以下の式で表されてもよい。
【数9】
ここで、1≦q≦Mである。
【0077】
M個の特徴量はM個の固有ベクトルに対応する。説明を容易にするために、本発明者らは、M個の固有ベクトルをu,u,・・・,u,uq+1,・・・,uとして定義する。ここで、M個の特徴量は、M個の固有ベクトルと一対一に対応する。
【0078】
S146:前記複数の固有ベクトルのうちの少なくとも一部の固有ベクトルからなる行列を、前記信号部分空間span(U)の基本行列Uとする。
【0079】
いくつかの実施例において、計算装置240は、M個の固有ベクトルからなる行列を、前記信号部分空間span(U)の基本行列Uとしてもよい。いくつかの実施例において、計算装置240は、M個の固有ベクトルのうちの一部の固有ベクトルからなる行列を、前記信号部分空間span(U)の基本行列Uとしてもよい。λ=λq+1=・・・=λのため、計算装置240は、q個の異なる特徴量λ,λ,・・・,λに対応するq個の固有ベクトルu,u,・・・,uからなる行列を、前記信号部分空間span(U)の基本行列Uとしてもよい。前記信号部分空間span(U)の基本行列UはM×qの列フルランク行列である。
【0080】
いくつかの実施例において、計算装置240は、マイクロホン信号xf,tの信号ステアリングベクトル[P,Q]に基づいて、前記信号部分空間span(U)の基本行列Uを確定することができる。図5は、本明細書の実施例による信号部分空間span(U)の基本行列Uの確定の別のフローチャートを示した。図5に示すステップは、計算装置240が、マイクロホン信号xf,tの信号ステアリングベクトル[P,Q]に基づいて、前記信号部分空間span(U)の基本行列Uを確定することに対応する。図5に示すように、ステップS140は以下を含んでもよい。
【0081】
S148:マイクロホン信号xf,tに基づいて、イクロホン信号xf,tにおける信号源の方位角を空間推定方法で確定することによって、マイクロホン信号xf,tの信号ステアリングベクトル[P,Q]を確定する。
【0082】
前述のように、ターゲットステアリングベクトルPは計算装置240に予め記憶されてもよく、ノイズステアリングベクトルQは未知である。計算装置240は、空間推定方法に基づいて、ノイズステアリングベクトルQを推定することによって、信号ステアリングベクトル[P,Q]を確定することができる。前記空間推定方法は、DOA推定方法(Direction Of Arrival、DOAと略称され、到来方向推定とも呼ばれる)及び空間スペクトル推定方法のうちの少なくとも一つを含んでもよい。前記DOA推定方法は、線スペクトル推定(例えば、ピリオドグラム方法など)、最尤スペクトル推定法、最大エントロピー法、MUSICアルゴリズム(Multiple Signal Classificationアルゴリズム、多重信号分類アルゴリズムとも呼ばれる)、ESPRITアルゴリズム(Estimating signal parameters viarotational invariance techniques、回転不変性法とも呼ばれる)などを含んでもよいが、それらに限らない。
【0083】
S149:信号ステアリングベクトル[P,Q]が信号部分空間span(U)の基本行列Uであることを確定する。
【0084】
この場合、信号部分空間span(U)の基本行列Uは、M×(L+N)次元の列フルランク行列である。
【0085】
図3に示すように、前記方法P100は、
S160:ターゲット音声信号により構成されるターゲット部分空間span(U)を確定することをさらに含んでもよい。
【0086】
いくつかの実施例において、ターゲット部分空間span(U)の確定は、前記ターゲット部分空間span(U)の基本行列Uを確定することを指す。前述のように、計算装置には、ターゲットステアリングベクトルPが予め記憶されていてもよい。ステップS160は、計算装置240により、前記ターゲット音声信号に対応する、予め設定されたターゲットステアリングベクトルPが前記ターゲット部分空間span(U)の基本行列Uであることを確定することであってもよい。ここで、前記ターゲット部分空間span(U)の基本行列Uは、M×L次元の列フルランク行列である。
【0087】
図3に示すように、前記方法P100は、
S180:信号部分空間span(U)とターゲット部分空間span(U)との線形相関に基づいて、マイクロホン信号xf,tに前記ターゲット音声信号が存在する音声存在確率λを確定し出力することをさらに含んでもよい。
【0088】
いくつかの実施例において、計算装置240は、信号部分空間span(U)とターゲット部分空間span(U)との体積相関関数を計算することによって、信号部分空間span(U)とターゲット部分空間span(U)との線形相関を計算することができる。図6は、本明細書の実施例による音声存在確率λの計算のフローチャートを示した。図6に示されるのはS180である。
【0089】
図6に示すように、ステップS180は、
S182:信号部分空間span(U)とターゲット部分空間span(U)との体積相関関数を確定することを含んでもよい。
【0090】
信号部分空間span(U)とターゲット部分空間span(U)との体積相関関数は、信号部分空間span(U)の基本行列Uとターゲット部分空間span(U)の基本行列Uとの体積相関関数vcc(U,U)であってもよい。
【0091】
信号部分空間span(U)の基本行列Uが、マイクロホン信号xf,tのサンプリング共分散行列Mに基づいて確定されたM×q次元の列フルランク行列である場合、体積相関関数vcc(U,U)は以下の式で表されてもよい。
【数10】
【0092】
ここで、vol(U)はM×q次元の基本行列Uのq次元の体積関数を表す。vol(U)はM×L次元の基本行列UのL次元の体積関数を表す。vol(U)は以下の式で表されてもよい。
【数11】
【0093】
ここで、γs,iは、Uの特異値であり、i=1,・・・,min{M,q}である。γs,1≧γs,2≧・・・≧γs,min{M,q}≧0である。vol(U)は、Uの各列のベクトルで張られる多面体の体積と見なされてもよい。
【0094】
vol(U)は以下の式で表されてもよい。
【数12】
【0095】
ここで、γt,jは、Uの特異値であり、j=1,・・・,min{M,L}である。γt,1≧γt,2≧・・・≧γt,min{M,L}≧0である。vol(U)は、Uの各列のベクトルで張られる多面体の体積と見なされてもよい。
【0096】
volq+L([U,U])は以下の式で表されてもよい。
【数13】
【0097】
ここで、0≦θ≦θ≦・・・≦θmin{q,L}≦π/2である。θは、Uで張られるターゲット部分空間span(U)とUで張られる信号部分空間span(U)とのなす正準角を表す。
【0098】
式(9)及び式(12)から分かるように、体積相関関数vcc(U,U)は、実際には、二つの部分空間(ターゲット部分空間span(U)と信号部分空間span(U))のなす正準角の正弦の積である。図7は、本明細書の実施例によるなす正準角の概略図を示した。図7に示すように、三次元空間において、交差する二つの平面(平面1と平面2)は、共通の基底ベクトル3を有する。そのため、その第1の正準角θは0である。第2の正準角θは、それぞれの別の基底ベクトル(基底ベクトル4と基底ベクトル5)の夾角に等しい。そのため、平面1と平面2との体積相関関数は0である。
【0099】
信号部分空間span(U)の基本行列Uが信号ステアリングベクトル[P,Q]である場合、体積相関関数vcc(U,U)の計算は上記方法と類似しており、本明細書ではこれ以上説明しない。
【0100】
上記分析に基づいて、体積相関関数vcc(U,U)が以下の性質を有することを発見した:基本行列U及び基本行列Uでそれぞれ張られる二つの部分空間(信号部分空間span(U)及びターゲット部分空間span(U))が線形相関を持ち、即ち信号部分空間span(U)とターゲット部分空間span(U)にゼロベクトル以外の他の共通基底ベクトルが存在する場合、θ,θ,・・・,θmin{q,L}には、正弦値が0であるなす正準角が少なくとも一つ存在し、この場合に体積相関関数vcc(U,U)は0である。二つの部分空間が線形独立であり、即ち信号部分空間span(U)とターゲット部分空間span(U)との共通基底ベクトルがゼロベクトルのみである場合、θ,θ,・・・,θmin{q,L}における全てのなす正準角の正弦値はいずれも0より大きく、この場合に体積相関関数vcc(U,U)は0より大きい。いくつかの実施例において、二つの部分空間が直交する場合、θ,θ,・・・,θmin{q,L}における全てのなす正準角の正弦値はいずれも最大値の1であり、この場合に体積相関関数vcc(U,U)は最大値の1に達した。
【0101】
上記分析に基づいて、体積相関関数vcc(U,U)は、二つの基本行列U及びUでそれぞれ張られる信号部分空間span(U)とターゲット部分空間span(U)との間の線形相関に対する尺度を提供した。これにより、ターゲット部分空間span(U)と、信号部分空間span(U)との間の固有の幾何学的構造を利用して、マイクロホン信号xf,tに対する音声活動検出問題を、信号部分空間span(U)及びターゲット部分空間span(U)の二つの基本行列U及びUの体積相関関数vcc(U,U)問題に変換することができる。
【0102】
S184:体積相関関数vcc(U,U)に基づいて、信号部分空間span(U)とターゲット部分空間span(U)との線形相関係数rを確定する。
【0103】
体積相関関数vcc(U,U)の定義及び性質から分かるように、体積相関関数vcc(U,U)値が1に近づくほど、信号部分空間span(U)とターゲット部分空間span(U)との一致度が低くなり、直交に近づくことになり、信号部分空間span(U)とターゲット部分空間span(U)との線形相関係数が低くなることを示し、この場合に、マイクロホン信号xf,tにおける信号がノイズ信号からのものである可能性が高いくなり、これらの成分は可能な限り抑制されるべきである。逆に、体積相関関数vcc(U,U)の値が0に近づくほど、信号部分空間span(U)とターゲット部分空間span(U)との一致度が高くなり、信号部分空間span(U)とターゲット部分空間span(U)との線形相関係数が高くなることを示し、この場合に、マイクロホン信号xf,tにおいてターゲット音声信号が支配的になる可能性が高くなり、これらの成分は保持してもよい。そのため、線形相関係数rと体積相関関数vcc(U,U)とは負の相関がある。
【0104】
具体的には、ステップS184は、
体積相関関数vcc(U,U)が第1の閾値aより大きいと確定し、線形相関係数r=0であると確定するケース、体積相関関数vcc(U,U)が第2の閾値bより小さいと確定し、線形相関係数r=1であると確定するケース、体積相関関数vcc(U,U)が第1の閾値aと第2の閾値bとの間にあると確定し、線形相関係数rが0~1であり、線形相関係数rが、体積相関関数vcc(U,U)と負の相関がある関数であると確定するケースのうちの一つを含んでもよい。ここで、第2の閾値bは前記第1の閾値aより小さい。
【0105】
具体的には、線形相関係数rは以下の式で表されてもよい。
【数14】
【0106】
ここで、f(vcc(U,U))は、vcc(U,U)と負の線形相関がある関数であってもよい。いくつかの実施例において、f(vcc(U,U))は以下の式で表されてもよい。
【数15】
【0107】
S186:前記線形相関係数rを前記音声存在確率λとして出力する。
【0108】
以上のように、本明細書による音声活動検出システム及び方法P100において、計算装置240は、基本行列UとUの体積相関関数vcc(U,U)を計算することによって、信号部分空間span(U)とターゲット部分空間span(U)との線形相関を計算することができる。体積相関関数vcc(U,U)が高いほど、信号部分空間span(U)とターゲット部分空間span(U)との線形相関が低くなることを示し、そうであれば信号部分空間span(U)とターゲット部分空間span(U)との一致度が低くなり、この場合に、つまりマイクロホン信号xf,tとターゲット音声信号との一致度が低くなり、この場合に、マイクロホン信号xf,tにターゲット音声信号が存在する音声存在確率λが低くなる。体積相関関数vcc(U,U)が低いほど、信号部分空間span(U)とターゲット部分空間span(U)との線形相関が高くなることを示し、そうであれば信号部分空間span(U)とターゲット部分空間span(U)との一致度が高くなり、この場合に、つまりマイクロホン信号xf,tとターゲット音声信号との一致度が高くなり、この場合に、マイクロホン信号xf,tにターゲット音声信号が存在する音声存在確率λが高くなる。本明細書による音声活動検出システム及び方法P100は、音声活動検出の正確性及び音声強調効果を向上させることができる。
【0109】
本明細書は、音声強調システムをさらに提供する。音声強調システムも電子機器200に用いることができる。いくつかの実施例において、音声強調システムは、計算装置240を含んでもよい。いくつかの実施例において、音声強調システムは、計算装置240に用いることができる。即ち音声強調システムは、計算装置240上で作動することができる。音声強調システムは、データ情報処理機能を有するハードウェア機器と、該ハードウェア機器の動作を駆動するために必要なプログラムとを含んでもよい。無論、音声強調システムはまた、データ処理機能を有するハードウェア機器のみであってもよく、又は、ハードウェア機器で作動するプログラムのみであってもよい。
【0110】
音声強調システムは、本明細書に記述されている音声強調方法を実行するデータ又は命令を記憶することができ、前記データ及び/又は命令を実行することもできる。音声強調システムが計算装置240上で作動する場合、音声強調システムは、前記通信接続に基づいてマイクロホンアレイ220から前記マイクロホン信号を取得し、本明細書に記述されている音声強調方法のデータ又は命令を実行することができる。前記音声強調方法は、本明細書の他の部分で紹介される。例えば、前記音声強調方法は、図8の説明において紹介されている。
【0111】
音声強調システムが計算装置240上で作動する場合、前記音声強調システムはマイクロホンアレイ220と通信接続される。記憶媒体243は、前記データ記憶装置に記憶されている、前記マイクロホン信号に対して音声強調計算を行うための少なくとも一つの命令セットをさらに含んでもよい。前記命令は、コンピュータプログラムコードであり、前記コンピュータプログラムコードは、本明細書による音声強調方法を実行するプログラム、ルーチン、オブジェクト、コンポーネント、データ構造、プロセス、モジュールなどを含んでもよい。プロセッサ242は、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って本明細書による音声強調方法を実行することができる。プロセッサ242は、音声強調方法に含まれる全てのステップを実行することができる。
【0112】
図8は、本明細書の実施例による音声強調方法P200のフローチャートを示した。前記方法P200は、前記マイクロホン信号に対して音声強調を行うことができる。具体的には、プロセッサ242は前記方法P200を実行することができる。
【0113】
図8に示すように、前記方法P200は以下を含んでもよい。
S220:前記M個のマイクロホンにより出力されたマイクロホン信号xf,tを取得する。
【0114】
ステップS120に記載されているとおりであり、ここでは説明を省略する。
【0115】
S240:前記音声活動検出方法P100に基づいて、マイクロホン信号xf,tにターゲット音声信号が存在する音声存在確率λを確定する。
【0116】
S260:音声存在確率λに基づいて、マイクロホン信号xf,tに対応するフィルタリング係数ベクトルωf,tを確定する。
【0117】
フィルタリング係数ベクトルωf,tは、M×1次元のベクトルであってもよい。フィルタリング係数ベクトルωf,tは以下の式で表されてもよい。
【数16】
【0118】
ここで、M番目のマイクロホン222に対応するフィルタリング係数はωm,f,tである。m=1,2,・・・,Mである。
【0119】
いくつかの実施例において、計算装置240は、MVDRの方法に基づいて、フィルタリング係数ベクトルωf,tを確定することができる。具体的には、ステップS260は、音声存在確率λに基づいて、マイクロホン信号xf,tのノイズ共分散行列Mf,t を確定することと、MVDR方法及びノイズ共分散行列Mf,t に基づいて、フィルタリング係数ベクトルωf,tを確定することとを含んでもよい。ノイズ共分散行列Mf,t は以下の式で表されてもよい。
【数17】
【0120】
フィルタリング係数ベクトルωf,tは以下の式で表されてもよい。
【数18】
ここで、Pは予め設定されたターゲットステアリングベクトルである。
【0121】
いくつかの実施例において、計算装置240は、固定ビームの方法に基づいて、フィルタリング係数ベクトルωf,tを確定することができる。具体的には、ステップS260は、音声存在確率λを、マイクロホン信号xf,tのうちのターゲットマイクロホン信号xk,f,tに対応するフィルタリング係数ωk,f,tとすることと、マイクロホン信号xf,tのうちのターゲットマイクロホン信号xk,f,t以外の他のマイクロホン信号に対応するフィルタリング係数が0であることを確定することとを含んでもよい。ここで、k=1,2,・・・,Mである。フィルタリング係数ベクトルωf,tは、ターゲットマイクロホン信号xk,f,tに対応するフィルタリング係数ωk,f,t及び他のマイクロホン信号に対応するフィルタリング係数からなるベクトルを含む。フィルタリング係数ベクトルωf,tは以下の式で表されてもよい。
【数19】
【0122】
いくつかの実施例において、ターゲットマイクロホン信号xk,f,tは、マイクロホン信号xf,tのうちの、信号対ノイズが最も高い1ウェイのマイクロホン信号を含んでもよい。いくつかの実施例において、ターゲットマイクロホン信号xk,f,tは、ターゲット音声信号源(例えば、口)に最も近い1ウェイのマイクロホン信号であってもよい。いくつかの実施例において、kは、計算装置240に予め記憶されていてもよい。
【0123】
S280:前記フィルタリング係数ベクトルωf,tに基づいてマイクロホン信号xf,tを統合し、ターゲットオーディオ信号yf,tを得て出力する。
【0124】
ターゲットオーディオ信号yf,tは以下の式で表されてもよい。
【数20】
【0125】
以上のように、本明細書による音声活動検出システム及び方法P100、音声強調システム及び方法P200は、複数のマイクロホン222からなるマイクロホンアレイ220に用いられる。前記音声活動検出システム及び方法P100、音声強調システム及び方法P200は、マイクロホンアレイ220により収集されたマイクロホン信号xf,tを取得することができる。マイクロホン信号xf,tは、ノイズ信号を含んでもよいし、ターゲット音声信号を含んでもよい。ターゲット音声信号とノイズ信号とは、クロスリンクのない二種類の信号である。ターゲット音声信号が所在するターゲット部分空間span(U)とノイズ信号が所在するノイズ部分空間とは、クロスリンクのない二つの部分空間である。マイクロホン信号xf,tにターゲット音声信号が存在しない場合、マイクロホン信号xf,tにはノイズ信号のみが含まれる。この場合、マイクロホン信号xf,tが所在する信号部分空間span(U)とターゲット音声信号が所在するターゲット部分空間span(U)とは、クロスリンクのない二つの部分空間であり、信号部分空間span(U)とターゲット部分空間span(U)との線形相関が低い。マイクロホン信号xf,tにターゲット音声信号が存在する場合、マイクロホン信号xf,tにはターゲット音声信号とノイズ信号の両方が含まれる。この場合、マイクロホン信号xf,tが所在する信号部分空間span(U)とターゲット音声信号が所在するターゲット部分空間span(U)とは、クロスリンクのある二つの部分空間であり、信号部分空間span(U)とターゲット部分空間span(U)との線形相関が高い。そのため、本明細書による音声活動検出方法P100及びシステムは、マイクロホン信号xf,tが所在する信号部分空間span(U)とターゲット音声信号が所在するターゲット部分空間span(U)との線形相関を計算することによって、マイクロホン信号xf,tにターゲット音声信号が存在する音声存在確率λを確定することができる。前記音声強調方法P200及びシステムは、音声存在確率λに基づいてフィルタリング係数ベクトルωf,tを計算することによって、マイクロホン信号xf,tに対して音声強調を行うことができる。以上のように、本明細書による音声活動検出システム及び方法P100、音声強調システム及び方法P200は、音声存在確率λの計算精度を向上させ、音声強調効果を向上させることができる。
【0126】
本明細書の別の態様は、非一時的な記憶媒体を提供し、音声活動検出のための実行可能な命令の少なくとも一つのセットが記憶されており、前記実行可能な命令は、プロセッサにより実行される場合、本明細書に記載の音声活動検出方法P100のステップを実施するように前記プロセッサに指示する。いくつかの可能な実施形態において、本明細書の各態様はさらに、プログラムコードを含むプログラムプロダクトの形態で実現され得る。前記プログラムプロダクトが計算機器(例えば、計算装置240)上で作動する場合、前記プログラムコードは、本明細書に記述されている音声活動検出ステップを計算機器に実行させるためのものである。上記方法を実現するためのプログラムプロダクトは、携帯型コンパクトディスクリードオンリメモリ(CD-ROM)を用いてもよく、プログラムコードを含み、計算機器上で作動可能である。しかしながら、本明細書のプログラムプロダクトは、これに限定されるものではなく、本明細書では、可読記憶媒体は、プログラムを含むか又は記憶する任意の有形媒体であってもよく、該プログラムは、命令実行システム(例えば、プロセッサ242)によって使用されてもよく、又はそれと組み合わせて使用されてもよい。前記プログラムプロダクトは、一つ又は複数の可読媒体の任意の組み合わせを用い得る。可読媒体は、可読信号媒体又は可読記憶媒体であってもよい。可読記憶媒体は、例えば、電気、磁気、光学、電磁、赤外線、又は半導体のシステム、装置もしくはデバイス、又は以上の任意の組み合わせであってもよいが、これらに限定されない。可読記憶媒体は、更なる具体例として、一つ又は複数の導線を有する電気接続、携帯型ディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、携帯型コンパクトディスクリードオンリメモリ(CD-ROM)、光学メモリデバイス、磁気メモリデバイス、又はこれらの任意の適切な組み合わせを含む。前記コンピュータ可読記憶媒体は、ベースバンドで又は搬送波の一部として伝搬され、可読性のプログラムコードが搭載されるデータ信号を含んでもよい。このように伝搬されるデータ信号は、電磁信号、光信号、又はこれらの任意の適切な組み合わせなどの様々な形態をとることができるが、これらに限定されない。可読記憶媒体はさらに、可読記憶媒体以外の任意の可読媒体であってもよく、該可読媒体は、命令実行システム、装置又はデバイスにより使用され、又はそれらと組み合わせて使用されるプログラムを送信、伝搬又は伝送することができる。可読記憶媒体に含まれるプログラムコードは、任意の好適な媒体で伝送することができ、無線、有線、光ケーブル、RFなど、又は上記の任意の適切な組み合わせを含むが、これらに限定されない。本明細書の動作を実行するためのプログラムコードは、Java、C++などのようなオブジェクト指向プログラミング言語、「C」言語などのような一般的な手続き型プログラミング言語又は類似のプログラミング言語を含む一つ又は複数のプログラミング言語の任意の組み合わせで記述され得る。プログラムコードは、全部が計算機器上で実行され、一部が計算機器上で実行され、独立したソフトウェアパケットとして実行され、一部が計算機器上で一部がリモート計算機器上で実行され、又は全部がリモート計算機器上で実行され得る。
【0127】
以上、本明細書の特定の実施例について説明した。他の実施例は、添付の特許請求の範囲内にある。いくつかの場合に、特許請求の範囲に記載される動作又はステップは、実施例とは異なる順序で実行されてもよく、且つ依然として所望の結果を実現することができる。また、図面に示されるプロセスは、所望の結果を実現するために、必ずしも特定の順序又は連続的な順序を示す必要はない。いくつかの実施形態において、マルチタスク処理及び並列処理も可能であり、又は有利であり得る。
【0128】
以上のように、本詳細な開示内容を読めば、当業者であれば分かるように、前記の詳細な開示内容は、単なる例として提示され得、且つ限定的なものではなくてもよい。ここでは明記されていないが、当業者であれば理解できるように、本明細書は、実施例に対する様々な合理的な変更、改良、及び修正を網羅する必要がある。これらの変更、改良、及び修正は、本明細書によって提示されることを意図しており、且つ本明細書の例示的な実施例の精神及び範囲内にある。
【0129】
なお、本明細書におけるいくつかの用語は、本明細書の実施例を説明するために用いられている。例えば、「一実施例」、「実施例」及び/又は「いくつかの実施例」は、該実施例に関連して説明された特定の特徴、構造又は特性が、本明細書の少なくとも一つの実施例に含まれ得ることを意味する。そのため、本明細書の各部分において、「実施例」又は「一実施例」又は「代替実施例」に対する二つ以上の引用が必ずしも同じ実施例を指すとは限らないことは、強調され理解されるべきである。なお、特定の特徴、構造又は特性は、本明細書の一つ又は複数の実施例において好適に組み合わされてもよい。
【0130】
理解すべきこととして、本明細書の実施例の前記の説明において、一つの特徴の理解を容易にするために、本明細書は、本明細書を簡略化する目的で、様々な特徴を単一の実施例、図面又はそれらの説明に組み合わせる。しかしながら、これらの特徴の組み合わせが必須であるとは言えず、当業者は、本明細書を読む時に、そのうちの一部の特徴を抽出して単独の実施例として理解することが十分に可能である。つまり、本明細書における実施例は、複数の二次的実施例の統合として理解され得る。各二次的実施例の内容は、前述の開示された単一の実施例の全ての特徴よりも少ない場合にも成立する。
【0131】
本明細書に引用される各特許、特許出願、特許出願の刊行物、及び他の資料、例えば、記事、書籍、明細書、刊行物、文書、物品などは、参照によりここに組み込まれ得る。あらゆる目的のための全ての内容は、それに関連する任意の訴求書履歴、本文書と一致しないかもしくは矛盾する任意の同一の訴求書履歴、又は請求項の最も広い範囲に対する制限効果を有する任意の同一の訴求書履歴を除いて、現在又は今後、本文書と関連付けられる。例えば、含まれる任意の資料に関連する用語の説明、定義及び/又は使用が、本文書の関連する用語の説明、定義及び/又は使用の間にいずれかの不一致又は矛盾が存在する場合には、本文書における用語が優先して適用するものとする。
【0132】
最後に、本明細書に開示された出願の実施形態は、本明細書の実施形態の原理についての説明であることを理解されたい。他の修正された実施例も本明細書の範囲内にある。そのため、本明細書に開示された実施例は、単なる例に過ぎず、限定するものではない。当業者は、本明細書における実施例に基づいて、代替的な構成を用いて本明細書における出願を実現することができる。そのため、本明細書の実施例は、出願において正確に説明された実施例に限定されない。
図1
図2A
図2B
図2C
図2D
図2E
図3
図4
図5
図6
図7
図8
【国際調査報告】