(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023180911
(43)【公開日】2023-12-21
(54)【発明の名称】音声信号処理装置
(51)【国際特許分類】
G10L 25/15 20130101AFI20231214BHJP
G10L 15/02 20060101ALI20231214BHJP
【FI】
G10L25/15
G10L15/02 300B
【審査請求】未請求
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2022094592
(22)【出願日】2022-06-10
(71)【出願人】
【識別番号】303046277
【氏名又は名称】旭化成エレクトロニクス株式会社
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】佐藤 健一
(72)【発明者】
【氏名】西尾 惇
(72)【発明者】
【氏名】笠原 聡
(57)【要約】 (修正有)
【課題】部品点数を削減する音声信号処理装置を提供する。
【解決手段】音声信号処理装置であるパターン検出器100は、音声信号から異なる設定周波数を含む複数の周波数帯域のそれぞれの周波数成分を示す複数の周波数信号を抽出する抽出部(第1帯域通過フィルタ101及び第2帯域通過フィルタ102)と、抽出部が抽出する異なる設定周波数の周波数信号の出力レベル同士の比較結果に基づいて抽出部の設定周波数を設定する設定部108と、抽出部が抽出する異なる設定周波数の周波数信号の出力レベル同士の比較結果と、設定部が設定する抽出部の設定周波数の設定内容と、抽出部の周波数特性とに基づいて音声信号におけるホルマント周波数を含むホルマント周波数帯域を検出する検出部110と、を備える。
【選択図】
図2
【特許請求の範囲】
【請求項1】
音声信号から、異なる設定周波数を含む複数の周波数帯域のそれぞれの周波数成分を示す複数の周波数信号を抽出する抽出部と、
前記抽出部により抽出される異なる設定周波数の周波数信号の出力レベル同士の比較結果に基づいて、前記抽出部の設定周波数を設定する設定部と、
前記抽出部により抽出される異なる設定周波数の周波数信号の出力レベル同士の比較結果と、前記設定部による前記抽出部の設定周波数の設定内容と、前記抽出部の周波数特性とに基づいて、前記音声信号におけるホルマント周波数を含むホルマント周波数帯域を検出する検出部と
を備える音声信号処理装置。
【請求項2】
前記検出部は、前記抽出部により抽出される2つの設定周波数の周波数信号の出力レベルの差が予め定められた差より小さい場合に、前記抽出部により抽出される2つの設定周波数の周波数信号の出力レベルのうち高い方の設定周波数に基づいて前記ホルマント周波数帯域を検出する、請求項1に記載の音声信号処理装置。
【請求項3】
前記抽出部は、前記音声信号から、前記設定部により設定された第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号、及び前記設定部により設定された前記第1設定周波数より高い第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出し、
前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより低い場合、前記抽出部は、前記音声信号から、前記設定部により設定された前記第2設定周波数より高い第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出し、
前記検出部は、前記第3周波数信号の出力レベルより前記第2周波数信号の出力レベルが高い場合、前記第2設定周波数に基づいて前記ホルマント周波数帯域を検出する、請求項1に記載の音声信号処理装置。
【請求項4】
前記抽出部は、前記音声信号から、前記設定部により設定された第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号、及び前記設定部により設定された前記第1設定周波数より低い第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出し、
前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより低い場合、前記抽出部は、前記音声信号から、前記設定部により設定された前記第2設定周波数より低い第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出し、
前記検出部は、前記第3周波数信号の出力レベルより前記第2周波数信号の出力レベルが高い場合、前記第2設定周波数に基づいて前記ホルマント周波数帯域を検出する、請求項1に記載の音声信号処理装置。
【請求項5】
前記抽出部は、設定周波数を変更可能な第1帯域通過フィルタ及び第2帯域通過フィルタを有し、
前記設定部は、前記第1帯域通過フィルタ及び前記第2帯域通過フィルタから出力される周波数信号の出力レベルの比較結果に基づいて、前記第1帯域通過フィルタ及び前記第2帯域通過フィルタのそれぞれの設定周波数を設定し、
前記検出部は、前記第1帯域通過フィルタ及び前記第2帯域通過フィルタから出力される周波数信号の出力レベルの比較結果と、前記設定部による前記第1帯域通過フィルタ及び前記第2帯域通過フィルタのそれぞれの設定周波数の設定内容と、前記第1帯域通過フィルタ及び前記第2帯域通過フィルタのそれぞれの周波数特性とに基づいて、前記ホルマント周波数帯域を検出する、請求項1に記載の音声信号処理装置。
【請求項6】
前記設定部により設定周波数が第1設定周波数に設定された前記第1帯域通過フィルタが、前記音声信号から前記第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号を抽出し、
前記設定部により設定周波数が前記第1設定周波数より高い第2設定周波数に設定された第2帯域通過フィルタが、前記音声信号から前記第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出し、
前記設定部は、前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより低い場合、前記第1帯域通過フィルタの設定周波数を前記第1設定周波数より高い第3設定周波数に設定し、前記第2帯域通過フィルタの設定周波数を前記第2設定周波数及び前記第3設定周波数より高い第4設定周波数に設定し、
前記設定部により設定周波数が前記第3設定周波数に設定された前記第1帯域通過フィルタが、前記音声信号から、前記第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出し、
前記設定部により設定周波数が前記第4設定周波数に設定された前記第2帯域通過フィルタが、前記音声信号から、前記第4設定周波数を含む第4周波数帯域の周波数成分を示す第4周波数信号を抽出し、
前記検出部は、前記第3周波数信号の出力レベルより前記第4周波数信号の出力レベルが低い場合、前記第1設定周波数に設定された前記第1帯域通過フィルタの周波数特性と前記第2設定周波数に設定された前記第2帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数と、前記第3設定周波数に設定された前記第1帯域通過フィルタの周波数特性と前記第4設定周波数に設定された前記第2帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出する、請求項5に記載の音声信号処理装置。
【請求項7】
前記設定部により設定周波数が第1設定周波数に設定された前記第1帯域通過フィルタが、音声信号から前記第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号を抽出し、
前記設定部により設定周波数が前記第1設定周波数より高い第2設定周波数に設定された第2帯域通過フィルタが、前記音声信号から前記第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出し、
前記設定部は、前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより高い場合、前記第1帯域通過フィルタの設定周波数を前記第1設定周波数より低い第3設定周波数に設定し、前記第2帯域通過フィルタの設定周波数を前記第2設定周波数より低く、かつ前記第3設定周波数より高い第4設定周波数に設定し、
前記設定部により設定周波数が前記第3設定周波数に設定された前記第1帯域通過フィルタが、前記音声信号から、前記第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出し、
前記設定部により設定周波数が前記第4設定周波数に設定された前記第2帯域通過フィルタが、前記音声信号から、前記第4設定周波数を含む第4周波数帯域の周波数成分を示す第4周波数信号を抽出し、
前記検出部は、前記第3周波数信号の出力レベルより前記第4周波数信号の出力レベルが高い場合、前記第1設定周波数に設定された前記第1帯域通過フィルタの周波数特性と前記第2設定周波数に設定された前記第2帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数と、前記第3設定周波数に設定された前記第1帯域通過フィルタの周波数特性と前記第4設定周波数に設定された前記第2帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出する、請求項5に記載の音声信号処理装置。
【請求項8】
前記抽出部は、設定周波数が変更可能な帯域通過フィルタを有し、
前記設定部は、前記帯域通過フィルタから出力される異なる期間における周波数信号の出力レベル同士の比較結果に基づいて、前記帯域通過フィルタの設定周波数を設定し、
前記検出部は、前記帯域通過フィルタの異なる期間における出力レベルの比較結果と、前記設定部による前記帯域通過フィルタの前記異なる期間における設定周波数の設定内容と、前記帯域通過フィルタの周波数特性とに基づいて、前記ホルマント周波数帯域を検出する、請求項1に記載の音声信号処理装置。
【請求項9】
前記設定部により設定周波数が第1設定周波数に設定された前記帯域通過フィルタが、第1期間の音声信号から前記第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号を抽出し、
前記設定部により設定周波数が前記第1設定周波数より高い第2設定周波数に設定された前記帯域通過フィルタが、第2期間の音声信号から前記第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出し、
前記設定部は、前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより低い場合、前記帯域通過フィルタの設定周波数を前記第2設定周波数より高い第3設定周波数に設定し、
前記設定部により設定周波数が前記第3設定周波数に設定された前記帯域通過フィルタが、第3期間の音声信号から前記第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出し、
前記検出部は、前記第2周波数信号の出力レベルが前記第3周波数信号の出力レベルより高い場合、前記第1設定周波数に設定された前記帯域通過フィルタの周波数特性と前記第2設定周波数に設定された前記帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数と、前記第2設定周波数に設定された前記帯域通過フィルタの周波数特性と前記第3設定周波数に設定された前記帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出する、請求項8に記載の音声信号処理装置。
【請求項10】
前記設定部により設定周波数が第1設定周波数に設定された前記帯域通過フィルタが、第1期間の音声信号から前記第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号を抽出し、
前記設定部により設定周波数が前記第1設定周波数より低い第2設定周波数に設定された前記帯域通過フィルタが、第2期間の音声信号から前記第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出し、
前記設定部は、前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより低い場合、前記帯域通過フィルタの設定周波数を前記第2設定周波数より低い第3設定周波数に設定し、
前記設定部により設定周波数が前記第3設定周波数に設定された前記帯域通過フィルタが、第3期間の音声信号から前記第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出し、
前記検出部は、前記第2周波数信号の出力レベルが前記第3周波数信号の出力レベルより高い場合、前記第1設定周波数に設定された前記帯域通過フィルタの周波数特性と前記第2設定周波数に設定された前記帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数と、前記第2設定周波数に設定された前記帯域通過フィルタの周波数特性と前記第3設定周波数に設定された前記帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出する、請求項8に記載の音声信号処理装置。
【請求項11】
前記抽出部は、
第1可変周波数発振器と、前記第1可変周波数発振器から発振される周波数信号と前記音声信号の入力に応じて、第1低域通過フィルタを介して中間周波数信号を出力する第1混合器と、第2可変周波数発振器と、前記第2可変周波数発振器から発振される周波数信号と前記音声信号の入力に応じて、第2低域通過フィルタを介して中間周波数信号を出力する第2混合器とを有し、
前記設定部は、前記第1混合器及び前記第2混合器の中間周波数信号の出力レベルの比較結果に基づいて、前記第1可変周波数発振器及び前記第2可変周波数発振器の発振周波数を設定し、
前記検出部は、前記第1混合器及び前記第2混合器の中間周波数信号の出力レベルの比較結果と、前記設定部による前記第1可変周波数発振器及び前記第2可変周波数発振器のそれぞれの設定周波数の設定内容と、前記第1低域通過フィルタ及び前記第2低域通過フィルタのそれぞれの周波数特性とに基づいて前記ホルマント周波数帯域を検出する、請求項1に記載の音声信号処理装置。
【請求項12】
前記設定部により発振周波数が第1設定周波数に設定された前記第1可変周波数発振器から発振された第1周波数信号と前記音声信号の入力を受けて前記第1混合器が第1中間周波数信号を出力し、
前記設定部により発振周波数が前記第1設定周波数より高い第2設定周波数に設定された前記第2可変周波数発振器から発振された第2周波数信号と前記音声信号の入力を受けて前記第2混合器が第2中間周波数信号を出力し、
前記設定部は、前記第1中間周波数信号の出力レベルが前記第2中間周波数信号の出力レベルより低い場合、前記第1可変周波数発振器の発振周波数を前記第1設定周波数より高い第3設定周波数に設定し、前記第2可変周波数発振器の発振周波数を前記第2設定周波数及び前記第3設定周波数より高い第4設定周波数に設定し、
前記設定部により発振周波数が前記第3設定周波数に設定された前記第1可変周波数発振器から発振された第3周波数信号と前記音声信号の入力を受けて前記第1混合器が第3中間周波数信号を出力し、
前記設定部により発振周波数が前記第4設定周波数に設定された前記第2可変周波数発振器から発振された第4周波数信号と前記音声信号の入力を受けて前記第2混合器が第4中間周波数信号を出力し、
前記検出部は、前記第3中間周波数信号の出力レベルより前記第4中間周波数信号の出力レベルが低い場合、前記第1設定周波数に設定された前記第1低域通過フィルタの周波数特性に基づく第1伝達関数に前記第1混合器に対して予め定められた第1係数を乗じた場合のゲインと前記第2設定周波数に設定された前記第2低域通過フィルタの周波数特性に基づく第2伝達関数に前記第2混合器に対して予め定められた第2係数を乗じた場合のゲインとが同一となる共通の周波数と、前記第3設定周波数に設定された前記第1低域通過フィルタの周波数特性に基づく第1伝達関数に前記第1係数を乗じた場合のゲインと前記第4設定周波数に設定された前記第2低域通過フィルタの周波数特性に基づく第2伝達関数に前記第2係数を乗じた場合のゲインとが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出する、請求項11に記載の音声信号処理装置。
【請求項13】
前記設定部により発振周波数が第1設定周波数に設定された前記第1可変周波数発振器から発振された第1周波数信号と前記音声信号の入力を受けて前記第1混合器が第1中間周波数信号を出力し、
前記設定部により発振周波数が前記第1設定周波数より高い第2設定周波数に設定された前記第2可変周波数発振器から発振された第2周波数信号と前記音声信号の入力を受けて前記第2混合器が第2中間周波数信号を出力し、
前記設定部は、前記第1中間周波数信号の出力レベルが前記第2中間周波数信号の出力レベルより高い場合、前記第1可変周波数発振器の発振周波数を前記第1設定周波数より低い第3設定周波数に設定し、前記第2可変周波数発振器の発振周波数を前記第2設定周波数より低く、かつ前記第3設定周波数より高い第4設定周波数に設定し、
前記設定部により発振周波数が前記第3設定周波数に設定された前記第1可変周波数発振器から発振された第3周波数信号と前記音声信号の入力を受けて前記第1混合器が第3中間周波数信号を出力し、
前記設定部により発振周波数が前記第4設定周波数に設定された前記第2可変周波数発振器から発振された第4周波数信号と前記音声信号の入力を受けて前記第2混合器が第4中間周波数信号を出力し、
前記検出部は、前記第3中間周波数信号の出力レベルより前記第4中間周波数信号の出力レベルが高い場合、前記第1設定周波数に設定された前記第1低域通過フィルタの周波数特性に基づく第1伝達関数に前記第1混合器に対して予め定められた第1係数を乗じた場合のゲインと前記第2設定周波数に設定された前記第2低域通過フィルタの周波数特性に基づく第2伝達関数に前記第2混合器に対して予め定められた第2係数を乗じた場合のゲインとが同一となる共通の周波数と、前記第3設定周波数に設定された前記第1低域通過フィルタの周波数特性に基づく第1伝達関数に前記第1係数を乗じた場合のゲインと前記第4設定周波数に設定された前記第2低域通過フィルタの周波数特性に基づく第2伝達関数に前記第2係数を乗じた場合のゲインとが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出する、請求項11に記載の音声信号処理装置。
【請求項14】
前記第2設定周波数と前記第3設定周波数とは同一である、請求項6または12に記載の音声信号処理装置。
【請求項15】
前記第1設定周波数と前記第4設定周波数とは同一である、請求項7または13に記載の音声信号処理装置。
【請求項16】
前記検出部により検出された前記ホルマント周波数帯域の時間的な変化パターンと、予め定められた処理を装置に開始させるための予め定められた音声におけるホルマント周波数帯域の時間的な変化パターンとを照合することで、前記予め定められた処理を前記装置に開始させるためのトリガ信号を出力する照合部をさらに備える、請求項1から13の何れか1つに記載の音声信号処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号処理装置に関する。
【背景技術】
【0002】
特許文献1には、予め格納されている所定の特徴パラメータパターンと、この所定の特徴パラメータパターンに対応した入力音声から得られた特徴パラメータパターンとに基づいて、各バンドパスフィルタの中心周波数を最適化する音声認識装置が開示されている。
[先行技術文献]
[特許文献]
[特許文献1] 特開平05-134697号公報
【発明の概要】
【発明が解決しようとする課題】
【0003】
音声信号を処理する装置において、部品点数を削減することが望まれている。
【課題を解決するための手段】
【0004】
本発明の一態様に係る音声信号処理装置は、音声信号から、異なる設定周波数を含む複数の周波数帯域のそれぞれの周波数成分を示す複数の周波数信号を抽出する抽出部を備えてよい。音声信号処理装置は、前記抽出部により抽出される異なる設定周波数の周波数信号の出力レベル同士の比較結果に基づいて、前記抽出部の設定周波数を設定する設定部を備えてよい。音声信号処理装置は、前記抽出部により抽出される異なる設定周波数の周波数信号の出力レベル同士の比較結果と、前記設定部による前記抽出部の設定周波数の設定内容と、前記抽出部の周波数特性とに基づいて、前記音声信号におけるホルマント周波数を含むホルマント周波数帯域を検出する検出部を備えてよい。
【0005】
前記音声信号処理装置において、前記検出部は、前記抽出部により抽出される2つの設定周波数の周波数信号の出力レベルの差が予め定められた差より小さい場合に、前記抽出部により抽出される2つの設定周波数の周波数信号の出力レベルのうち高い方の設定周波数に基づいて前記ホルマント周波数帯域を検出してよい。
【0006】
いずれかの前記音声信号処理装置において、前記抽出部は、前記音声信号から、前記設定部により設定された第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号、及び前記設定部により設定された前記第1設定周波数より高い第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出してよい。前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより低い場合、前記抽出部は、前記音声信号から、前記設定部により設定された前記第2設定周波数より高い第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出してよい。前記検出部は、前記第3周波数信号の出力レベルより前記第2周波数信号の出力レベルが高い場合、前記第2設定周波数に基づいて前記ホルマント周波数帯域を検出してよい。
【0007】
いずれかの前記音声信号処理装置において、前記抽出部は、前記音声信号から、前記設定部により設定された第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号、及び前記設定部により設定された前記第1設定周波数より低い第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出してよい。前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより低い場合、前記抽出部は、前記音声信号から、前記設定部により設定された前記第2設定周波数より低い第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出してよい。前記検出部は、前記第3周波数信号の出力レベルより前記第2周波数信号の出力レベルが高い場合、前記第2設定周波数に基づいて前記ホルマント周波数帯域を検出してよい。
【0008】
いずれかの前記音声信号処理装置において、前記抽出部は、設定周波数を変更可能な第1帯域通過フィルタ及び第2帯域通過フィルタを有してよい。前記設定部は、前記第1帯域通過フィルタ及び前記第2帯域通過フィルタから出力される周波数信号の出力レベルの比較結果に基づいて、前記第1帯域通過フィルタ及び前記第2帯域通過フィルタのそれぞれの設定周波数を設定してよい。前記検出部は、前記第1帯域通過フィルタ及び前記第2帯域通過フィルタから出力される周波数信号の出力レベルの比較結果と、前記設定部による前記第1帯域通過フィルタ及び前記第2帯域通過フィルタのそれぞれの設定周波数の設定内容と、前記第1帯域通過フィルタ及び前記第2帯域通過フィルタのそれぞれの周波数特性とに基づいて、前記ホルマント周波数帯域を検出してよい。
【0009】
いずれかの前記音声信号処理装置において、前記設定部により設定周波数が第1設定周波数に設定された前記第1帯域通過フィルタが、前記音声信号から前記第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号を抽出してよい。前記設定部により設定周波数が前記第1設定周波数より高い第2設定周波数に設定された第2帯域通過フィルタが、前記音声信号から前記第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出してよい。前記設定部は、前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより低い場合、前記第1帯域通過フィルタの設定周波数を前記第1設定周波数より高い第3設定周波数に設定し、前記第2帯域通過フィルタの設定周波数を前記第2設定周波数及び前記第3設定周波数より高い第4設定周波数に設定してよい。前記設定部により設定周波数が前記第3設定周波数に設定された前記第1帯域通過フィルタが、前記音声信号から、前記第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出してよい。前記設定部により設定周波数が前記第4設定周波数に設定された前記第2帯域通過フィルタが、前記音声信号から、前記第4設定周波数を含む第4周波数帯域の周波数成分を示す第4周波数信号を抽出してよい。前記検出部は、前記第3周波数信号の出力レベルより前記第4周波数信号の出力レベルが低い場合、前記第1設定周波数に設定された前記第1帯域通過フィルタの周波数特性と前記第2設定周波数に設定された前記第2帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数と、前記第3設定周波数に設定された前記第1帯域通過フィルタの周波数特性と前記第4設定周波数に設定された前記第2帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出してよい。
【0010】
いずれかの前記音声信号処理装置において、前記設定部により設定周波数が第1設定周波数に設定された前記第1帯域通過フィルタが、音声信号から前記第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号を抽出してよい。前記設定部により設定周波数が前記第1設定周波数より高い第2設定周波数に設定された第2帯域通過フィルタが、前記音声信号から前記第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出してよい。前記設定部は、前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより高い場合、前記第1帯域通過フィルタの設定周波数を前記第1設定周波数より低い第3設定周波数に設定し、前記第2帯域通過フィルタの設定周波数を前記第2設定周波数より低く、かつ前記第3設定周波数より高い第4設定周波数に設定してよい。前記設定部により設定周波数が前記第3設定周波数に設定された前記第1帯域通過フィルタが、前記音声信号から、前記第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出してよい。前記設定部により設定周波数が前記第4設定周波数に設定された前記第2帯域通過フィルタが、前記音声信号から、前記第4設定周波数を含む第4周波数帯域の周波数成分を示す第4周波数信号を抽出してよい。前記検出部は、前記第3周波数信号の出力レベルより前記第4周波数信号の出力レベルが高い場合、前記第1設定周波数に設定された前記第1帯域通過フィルタの周波数特性と前記第2設定周波数に設定された前記第2帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数と、前記第3設定周波数に設定された前記第1帯域通過フィルタの周波数特性と前記第4設定周波数に設定された前記第2帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出してよい。
【0011】
いずれかの前記音声信号処理装置において、前記抽出部は、設定周波数が変更可能な帯域通過フィルタを有してよい。前記設定部は、前記帯域通過フィルタから出力される異なる期間における周波数信号の出力レベル同士の比較結果に基づいて、前記帯域通過フィルタの設定周波数を設定してよい。前記検出部は、前記帯域通過フィルタの異なる期間における出力レベルの比較結果と、前記設定部による前記帯域通過フィルタの前記異なる期間における設定周波数の設定内容と、前記帯域通過フィルタの周波数特性とに基づいて、前記ホルマント周波数帯域を検出してよい。
【0012】
いずれかの前記音声信号処理装置において、前記設定部により設定周波数が第1設定周波数に設定された前記帯域通過フィルタが、第1期間の音声信号から前記第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号を抽出してよい。前記設定部により設定周波数が前記第1設定周波数より高い第2設定周波数に設定された前記帯域通過フィルタが、第2期間の音声信号から前記第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出してよい。前記設定部は、前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより低い場合、前記帯域通過フィルタの設定周波数を前記第2設定周波数より高い第3設定周波数に設定してよい。前記設定部により設定周波数が前記第3設定周波数に設定された前記帯域通過フィルタが、第3期間の音声信号から前記第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出してよい。前記検出部は、前記第2周波数信号の出力レベルが前記第3周波数信号の出力レベルより高い場合、前記第1設定周波数に設定された前記帯域通過フィルタの周波数特性と前記第2設定周波数に設定された前記帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数と、前記第2設定周波数に設定された前記帯域通過フィルタの周波数特性と前記第3設定周波数に設定された前記帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出してよい。
【0013】
いずれかの前記音声信号処理装置において、前記設定部により設定周波数が第1設定周波数に設定された前記帯域通過フィルタが、第1期間の音声信号から前記第1設定周波数を含む第1周波数帯域の周波数成分を示す第1周波数信号を抽出してよい。前記設定部により設定周波数が前記第1設定周波数より低い第2設定周波数に設定された前記帯域通過フィルタが、第2期間の音声信号から前記第2設定周波数を含む第2周波数帯域の周波数成分を示す第2周波数信号を抽出してよい。前記設定部は、前記第1周波数信号の出力レベルが前記第2周波数信号の出力レベルより低い場合、前記帯域通過フィルタの設定周波数を前記第2設定周波数より低い第3設定周波数に設定してよい。前記設定部により設定周波数が前記第3設定周波数に設定された前記帯域通過フィルタが、第3期間の音声信号から前記第3設定周波数を含む第3周波数帯域の周波数成分を示す第3周波数信号を抽出してよい。前記検出部は、前記第2周波数信号の出力レベルが前記第3周波数信号の出力レベルより高い場合、前記第1設定周波数に設定された前記帯域通過フィルタの周波数特性と前記第2設定周波数に設定された前記帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数と、前記第2設定周波数に設定された前記帯域通過フィルタの周波数特性と前記第3設定周波数に設定された前記帯域通過フィルタの周波数特性とでゲインが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出してよい。
【0014】
いずれかの前記音声信号処理装置において、前記抽出部は、第1可変周波数発振器と、前記第1可変周波数発振器から発振される周波数信号と前記音声信号の入力に応じて、第1低域通過フィルタを介して中間周波数信号を出力する第1混合器と、第2可変周波数発振器と、前記第2可変周波数発振器から発振される周波数信号と前記音声信号の入力に応じて、第2低域通過フィルタを介して中間周波数信号を出力する第2混合器とを有してよい。前記設定部は、前記第1混合器及び前記第2混合器の中間周波数信号の出力レベルの比較結果に基づいて、前記第1可変周波数発振器及び前記第2可変周波数発振器の発振周波数を設定してよい。前記検出部は、前記第1混合器及び前記第2混合器の中間周波数信号の出力レベルの比較結果と、前記設定部による前記第1可変周波数発振器及び前記第2可変周波数発振器のそれぞれの設定周波数の設定内容と、前記第1低域通過フィルタ及び前記第2低域通過フィルタのそれぞれの周波数特性とに基づいて前記ホルマント周波数帯域を検出してよい。
【0015】
いずれかの前記音声信号処理装置において、前記設定部により発振周波数が第1設定周波数に設定された前記第1可変周波数発振器から発振された第1周波数信号と前記音声信号の入力を受けて前記第1混合器が第1中間周波数信号を出力してよい。前記設定部により発振周波数が前記第1設定周波数より高い第2設定周波数に設定された前記第2可変周波数発振器から発振された第2周波数信号と前記音声信号の入力を受けて前記第2混合器が第2中間周波数信号を出力してよい。前記設定部は、前記第1中間周波数信号の出力レベルが前記第2中間周波数信号の出力レベルより低い場合、前記第1可変周波数発振器の発振周波数を前記第1設定周波数より高い第3設定周波数に設定し、前記第2可変周波数発振器の発振周波数を前記第2設定周波数及び前記第3設定周波数より高い第4設定周波数に設定してよい。前記設定部により発振周波数が前記第3設定周波数に設定された前記第1可変周波数発振器から発振された第3周波数信号と前記音声信号の入力を受けて前記第1混合器が第3中間周波数信号を出力してよい。前記設定部により発振周波数が前記第4設定周波数に設定された前記第2可変周波数発振器から発振された第4周波数信号と前記音声信号の入力を受けて前記第2混合器が第4中間周波数信号を出力してよい。前記検出部は、前記第3中間周波数信号の出力レベルより前記第4中間周波数信号の出力レベルが低い場合、前記第1設定周波数に設定された前記第1低域通過フィルタの周波数特性に基づく第1伝達関数に前記第1混合器に対して予め定められた第1係数を乗じた場合のゲインと前記第2設定周波数に設定された前記第2低域通過フィルタの周波数特性に基づく第2伝達関数に前記第2混合器に対して予め定められた第2係数を乗じた場合のゲインとが同一となる共通の周波数と、前記第3設定周波数に設定された前記第1低域通過フィルタの周波数特性に基づく第1伝達関数に前記第1係数を乗じた場合のゲインと前記第4設定周波数に設定された前記第2低域通過フィルタの周波数特性に基づく第2伝達関数に前記第2係数を乗じた場合のゲインとが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出してよい。
【0016】
いずれかの前記音声信号処理装置において、前記設定部により発振周波数が第1設定周波数に設定された前記第1可変周波数発振器から発振された第1周波数信号と前記音声信号の入力を受けて前記第1混合器が第1中間周波数信号を出力してよい。前記設定部により発振周波数が前記第1設定周波数より高い第2設定周波数に設定された前記第2可変周波数発振器から発振された第2周波数信号と前記音声信号の入力を受けて前記第2混合器が第2中間周波数信号を出力してよい。前記設定部は、前記第1中間周波数信号の出力レベルが前記第2中間周波数信号の出力レベルより高い場合、前記第1可変周波数発振器の発振周波数を前記第1設定周波数より低い第3設定周波数に設定し、前記第2可変周波数発振器の発振周波数を前記第2設定周波数より低く、かつ前記第3設定周波数より高い第4設定周波数に設定してよい。前記設定部により発振周波数が前記第3設定周波数に設定された前記第1可変周波数発振器から発振された第3周波数信号と前記音声信号の入力を受けて前記第1混合器が第3中間周波数信号を出力してよい。前記設定部により発振周波数が前記第4設定周波数に設定された前記第2可変周波数発振器から発振された第4周波数信号と前記音声信号の入力を受けて前記第2混合器が第4中間周波数信号を出力してよい。前記検出部は、前記第3中間周波数信号の出力レベルより前記第4中間周波数信号の出力レベルが高い場合、前記第1設定周波数に設定された前記第1低域通過フィルタの周波数特性に基づく第1伝達関数に前記第1混合器に対して予め定められた第1係数を乗じた場合のゲインと前記第2設定周波数に設定された前記第2低域通過フィルタの周波数特性に基づく第2伝達関数に前記第2混合器に対して予め定められた第2係数を乗じた場合のゲインとが同一となる共通の周波数と、前記第3設定周波数に設定された前記第1低域通過フィルタの周波数特性に基づく第1伝達関数に前記第1係数を乗じた場合のゲインと前記第4設定周波数に設定された前記第2低域通過フィルタの周波数特性に基づく第2伝達関数に前記第2係数を乗じた場合のゲインとが同一となる共通の周波数との間の周波数帯域を前記ホルマント周波数帯域として検出してよい。
【0017】
いずれかの前記音声信号処理装置において、前記第2設定周波数と前記第3設定周波数とは同一でよい。
【0018】
いずれかの前記音声信号処理装置において、前記第1設定周波数と前記第4設定周波数とは同一でよい。
【0019】
いずれかの前記音声信号処理装置において、前記検出部により検出された前記ホルマント周波数帯域の時間的な変化パターンと、予め定められた処理を装置に開始させるための予め定められた音声におけるホルマント周波数帯域の時間的な変化パターンとを照合することで、前記予め定められた処理を前記装置に開始させるためのトリガ信号を出力する照合部をさらに備えてよい。
【0020】
なお、上記の発明の概要は、本発明の特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0021】
【
図1】ウェイクワード検出器の機能ブロックの一例を示す図である。
【
図2】第1実施形態に係るパターン検出器の機能ブロックの一例を示す図である。
【
図3A】ホルマント周波数帯域を検出する手順の一例について説明するための図である。
【
図3B】ホルマント周波数帯域を検出する手順の一例について説明するための図である。
【
図4】ホルマント周波数帯域を検出する手順の一例について説明するための図である。
【
図5】第1実施形態における第1BPF及び第2BPFによるホルマント周波数帯域を検出する手順の一例を示すフローチャートである。
【
図6】第2実施形態に係るパターン検出器の機能ブロックの一例を示す図である。
【
図7】設定周波数について説明するための図である。
【
図8】設定周波数を決定するための条件テーブルの一例を示す図である。
【
図9】第1ホルマント周波数を含むホルマント周波数帯域を検出するための条件テーブルの一例を示す図である。
【
図10】第2実施形態における第1BPFによるホルマント周波数帯域を検出する手順の一例を示すフローチャートである。
【
図11】第3実施形態に係るパターン検出器の機能ブロックの一例を示す図である。
【
図12A】第3実施形態に係るパターン検出器におけるクロスポイント周波数について説明するための図である。
【
図12B】第3実施形態に係るパターン検出器におけるクロスポイント周波数について説明するための図である。
【
図13】第3実施形態に係るパターン検出器におけるクロスポイント周波数について説明するための図である。
【発明を実施するための形態】
【0022】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0023】
図1は、ウェイクワード検出器10の機能ブロックの一例を示す図である。ウェイクワード検出器10は、ユーザにより発せられた音声が予め登録された音声と認識した場合に、予め定められた処理を開始する。ウェイクワード検出器10は、例えば、スマートグラスなどのウェアラブル端末に内蔵されてよい。ウェイクワード検出器10は、音声信号処理装置の一例である。
【0024】
ウェイクワード検出器10は、パターン検出器100、パターンデータ記憶部130、及び照合部150を備える。
【0025】
パターン検出器100は、音声信号から5msごとに第1ホルマント周波数を含むホルマント周波数帯域として検出された周波数帯域の時間的な変化パターンを出力する。パターンデータ記憶部130は、ウェアラブル端末などの装置に予め定められた処理を開始させるためにユーザが発するべき音声であるウェイクワードにおける5msごとの第1ホルマント周波数を含むホルマント周波数帯域の時間的な変化パターンである基準変化パターンを記憶する。照合部150は、パターン検出器100から出力された変化パターンと、パターンデータ記憶部130に記憶された基準変化パターンとを照合することで、変化パターンと基準変化パターンとが一致する場合に、ウェアラブル端末などの装置に予め定められた処理を開始させるためのトリガ信号を出力する。
【0026】
図2は、第1実施形態に係るパターン検出器100の機能ブロックの一例を示す図である。パターン検出器100は、第1帯域通過フィルタ(第1BPF)101、第2帯域通過フィルタ(第2BPF)102、第1レベル検出器103、第2レベル検出器104、レベル比較器106、設定部108、及び検出部110を備える。なお、パターン検出器100は、3つ以上の帯域通過フィルタ(BPF)を備えてもよい。
【0027】
第1BPF101及び第2BPF102は、音声信号から、異なる設定周波数を含む複数の周波数帯域のそれぞれの周波数成分を示す複数の周波数信号を抽出する抽出部の一例である。設定周波数は、音声信号から抽出される周波数帯域の中心周波数でよい。
【0028】
第1BPF101及び第2BPF102は、通過させる周波数帯域の中心周波数である設定周波数を変更可能なフィルタ回路である。第1BPF101、及び第2BPF102は、音声信号から、それぞれ異なる中心周波数の周波数帯域の周波数成分を示す周波数信号を抽出し、出力する。第1BPF101の中心周波数は、第2BPF102の中心周波数より低くてよい。第1BPF101の中心周波数は、第2BPF102の中心周波数に対して予め定められた割合だけ低くてよい。例えば、第1BPF101の中心周波数が600Hzであれば、第2BPF102の中心周波数は、第1BPF101の中心周波数より20%だけ高い、720Hzでよい。
【0029】
第1レベル検出器103は、第1BPF101から出力される予め定められた期間(例えば、5ms)ごとの周波数信号の出力レベルの平均値を導出し、導出された平均値を示す第1出力レベル信号を出力する。第2レベル検出器104は、第2BPF102から出力される予め定められた期間(例えば、5ms)ごとの周波数信号の出力レベルの平均値を導出し、導出された平均値を示す第2出力レベル信号を出力する。
【0030】
レベル比較器106は、第1レベル検出器103から出力される第1出力レベル信号と、第2レベル検出器104から出力される第2出力レベル信号とを比較することで、第1BPF101から出力される周波数信号の出力レベル、及び第2BPF102から出力される周波数信号の出力レベルのどちらが高いかを判定し、比較結果を示す信号を出力する。
【0031】
設定部108は、レベル比較器106の比較結果に基づいて、第1BPF101及び第2BPF102のそれぞれに設定すべき中心周波数である設定周波数を決定し、決定された設定周波数を第1BPF101及び第2BPF102の中心周波数として設定する。設定部108は、予め定められた期間(例えば、5ms)ごとに、レベル比較器106の比較結果に基づいて、第1BPF101及び第2BPF102のそれぞれに設定すべき中心周波数である設定周波数を決定し、決定された設定周波数を第1BPF101及び第2BPF102の中心周波数として設定する。
【0032】
設定部108は、第1出力レベル信号の出力レベルが、第2出力レベル信号の出力レベルより高い場合、第1BPF101及び第2BPF102の設定周波数を、現在の設定周波数よりも予め定められた割合(例えば、20%)低くなるように、設定する。一方、設定部108は、第1出力レベル信号の出力レベルが、第2出力レベル信号の出力レベルより低い場合、第1BPF101及び第2BPF102の設定周波数を、現在の設定周波数よりも予め定められた割合(例えば、20%)高くなるように、設定する。
【0033】
検出部110は、レベル比較器106による出力レベルの比較結果と、設定部108による第1BPF101及び第2BPF102の設定周波数の設定内容と、第1BPF101及び第2BPF102の周波数特性とに基づいて、音声信号におけるホルマント周波数を含むホルマント周波数帯域を検出する。検出部110は、第1BPF101及び第2BPF102から出力される少なくとも3つの設定周波数の周波数信号の出力レベルを比較することで、ホルマント周波数帯域を検出してよい。ホルマント周波数帯域は、第1ホルマント周波数を中心に±10%程度の周波数幅を有してよい。設定周波数の設定内容は、設定部108による第1BPF101及び第2BPF102のそれぞれの設定周波数の設定履歴を示してよい。設定内容は、設定部108による第1BPF101及び第2BPF102のそれぞれの前々回、前回、及び今回の設定周波数を示してよい。設定内容は、設定部108による第1BPF101及び第2BPF102の前々回の設定周波数と比較して、前回の設定周波数が低くなったか、高くなったかと、設定部108による第1BPF101及び第2BPF102の前回の設定周波数と比較して、今回の設定周波数が低くなったか、高くなったかを示してよい。第1BPF101及び第2BPF102の周波数特性は、第1BPF101及び第2BPF102の伝達関数でよい。
【0034】
検出部110は、第1BPF101及び第2BPF102から出力される少なくとも2つの設定周波数の周波数信号の出力レベルを比較することで、ホルマント周波数帯域を検出してよい。検出部110が、2点の設定周波数の比較のみで、出力レベルが高い方の設定周波数に基づいてホルマント周波数帯域を検出する場合、第1ホルマント周波数を含む周波数帯域をホルマント周波数帯域として検出できない場合がある。すなわち、2点の設定周波数よりも高いまたは低い設定周波数付近に、第1ホルマント周波数が存在する可能性がある。そこで、検出部110は、2点の設定周波数の比較のみで、出力レベルが高い方の設定周波数に基づいてホルマント周波数帯域を検出する場合には、1点目の設定周波数の出力レベルと、2点目の設定周波数の出力レベルとの差が予め定められた差以上の場合には、2点の設定周波数の比較のみで、出力レベルが高い方の設定周波数に基づいてホルマント周波数帯域を検出しなくてよい。すなわち、検出部110は、第1BPF101及び第2BPF102から出力される2つの周波数信号の出力レベルの差が予め定められた差より小さい場合、2つの周波数信号の出力レベルのうち、高い方の周波数信号の設定周波数に基づいて、ホルマント周波数帯域を検出してよい。
【0035】
検出部110は、第1設定周波数の周波数信号の出力レベルより、第1設定周波数より高い第2設定周波数の周波数信号の出力レベルが高く、かつ第2設定周波数の周波数信号の出力レベルより、第2設定周波数より高い第3設定周波数の周波数信号の出力レベルが低い場合、第2設定周波数に基づいてホルマント周波数帯域を検出してよい。
【0036】
図3Aに示すように、設定部108により設定周波数が設定周波数f1に設定された伝達関数B1の第1BPF101が、音声信号200から周波数信号S1を抽出する。また、設定部108により設定周波数が設定周波数f1より高い設定周波数f2に設定された伝達関数B2の第2BPF102が、音声信号200から周波数信号S2を抽出する。
【0037】
第1レベル検出器103は、周波数信号S1の予め定められた期間の出力レベルの平均値を周波数信号S1の出力レベルとして示す出力レベル信号L1を出力する。第2レベル検出器104は、周波数信号S1の予め定められた期間の出力レベルの平均値を周波数信号S2の出力レベルとして示す出力レベル信号L2を出力する。レベル比較器106は、出力レベル信号L1と出力レベル信号L2とを比較することで、周波数信号S1の出力レベルが周波数信号S2の出力レベルより低いか高いかを判断して、その比較結果を出力する。
【0038】
第1レベル検出器103から出力される周波数信号S1の出力レベルが周波数信号S2の出力レベルより低いことを比較結果が示す場合、設定部108は、第1BPF101の設定周波数を設定周波数f1より高い設定周波数f3に設定する。さらに、設定部108は第2BPF102の設定周波数を設定周波数f2及び設定周波数f3より高い設定周波数f4に設定する。設定部108により設定周波数が設定周波数f3に設定された伝達関数B3の第1BPF101は、音声信号から周波数信号S3を抽出する。設定周波数f3は、設定周波数f2と同じでよい。
【0039】
設定部108により設定周波数が設定周波数f4に設定された伝達関数B4の第2BPF102は、音声信号から周波数信号S4を抽出する。そして、検出部110は、周波数信号S3の出力レベルより周波数信号S4の出力レベルが低い場合、伝達関数B1を示すGBPF(f1,f)と、伝達関数B2を示すGBPF(f2,f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc1と、伝達関数B3を示すGBPF(f3,f)と伝達関数B4を示すGBPF(f4,f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc2との間の周波数帯域をホルマント周波数帯域として検出する。すなわち、検出部110は、GBPF(f1,f)=GBPF(f2,f)となる周波数fをクロスポイント周波数fc1として導出し、GBPF(f3,f)=GBPF(f4,f)となる周波数fをクロスポイント周波数fc2として導出し、クロスポイント周波数fc1を一端、クロスポイント周波数fc2を他端とする周波数帯域をホルマント周波数帯域として検出する。
【0040】
一方、
図3Aに示すように、周波数信号S3の出力レベルより周波数信号S4の出力レベルが高い場合、設定部108は、第1BPF101の設定周波数を設定周波数f3より高い設定周波数f5に設定する。さらに、設定部108は第2BPF102の設定周波数を設定周波数f4及び設定周波数f5より高い設定周波数f6に設定する。設定部108により設定周波数が設定周波数f5に設定された伝達関数B5の第1BPF101が、音声信号200から周波数信号S5を抽出する。設定周波数f5は、設定周波数f4と同じでよい。設定部108により設定周波数が設定周波数f6に設定された伝達関数B6の第2BPF102が、音声信号200から周波数信号S6を抽出する。そして、検出部110は、周波数信号S5の出力レベルより周波数信号S6の出力レベルが低い場合、伝達関数B3を示すGBPF(f3,f)と、伝達関数B4を示すGBPF(f4,f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc2と、伝達関数B5を示すGBPF(f5,f)と伝達関数B6を示すGBPF(f6,f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc3との間の周波数帯域をホルマント周波数帯域として検出する。すなわち、検出部110は、GBPF(f3,f)=GBPF(f4,f)となる周波数fをクロスポイント周波数fc2として導出し、GBPF(f5,f)=GBPF(f6,f)となる周波数fをクロスポイント周波数fc3として導出し、クロスポイント周波数fc2を一端、クロスポイント周波数fc3を他端とする周波数帯域をホルマント周波数帯域として検出する。
【0041】
第1BPF101の周波数特性、及び第2BPF102の周波数特性は、
図3Bに示すように、
図3Aに示すよりも、ゲインの高い周波数帯域が広くてもよい。すなわち、設定部108により設定周波数が設定周波数f1に設定された伝達関数D1の第1BPF101が、音声信号200から周波数信号S1を抽出する。また、設定部108により設定周波数が設定周波数f1より高い設定周波数f2に設定された伝達関数D2の第2BPF102が、音声信号200から周波数信号S2を抽出する。
【0042】
第1レベル検出器103は、周波数信号S1の予め定められた期間の出力レベルの平均値を周波数信号S1の出力レベルとして示す出力レベル信号L1を出力する。第2レベル検出器104は、周波数信号S1の予め定められた期間の出力レベルの平均値を周波数信号S2の出力レベルとして示す出力レベル信号L2を出力する。レベル比較器106は、出力レベル信号L1と出力レベル信号L2とを比較することで、周波数信号S1の出力レベルが周波数信号S2の出力レベルより低いか高いかを判断して、その比較結果を出力する。
【0043】
第1レベル検出器103から出力される周波数信号S1の出力レベルが周波数信号S2の出力レベルより低いことを比較結果が示す場合、設定部108は、第1BPF101の設定周波数を設定周波数f1より高い設定周波数f3に設定する。さらに、設定部108は第2BPF102の設定周波数を設定周波数f2及び設定周波数f3より高い設定周波数f4に設定する。設定部108により設定周波数が設定周波数f3に設定された伝達関数D3の第1BPF101は、音声信号から周波数信号S3を抽出する。設定周波数f3は、設定周波数f2と同じでよい。設定部108により設定周波数が設定周波数f4に設定された伝達関数D4の第2BPF102は、音声信号から周波数信号S4を抽出する。
【0044】
ここで、設定周波数f1に設定された伝達関数D1の第1BPF101のローパスのカットオフ周波数fLPF1をfLPF1=α×f1(例えば、α=1.5)とする。設定周波数f2に設定された伝達関数D2の第2BPF102のハイパスのカットオフ周波数fHPF2をfHPF2=β×f2(例えば、β=0.7)とする。さらに、第1BPF101の伝達関数Dを示すGBPF1(f)における設定周波数f1以上の周波数におけるローパス周波数特性を示す伝達関数をGLPF1(fLPF1、f)とする。GLPF1(fLPF1、f)は、第1BPF101の伝達関数Dを示すGBPF1(f)における周波数f1以上におけるローパスのカットオフ周波数fLPF1、及び信号周波数fをパラメータとして有する。第2BPF102の伝達関数Dを示すGBPF2(f)における設定周波数f2以下の周波数におけるハイパス周波数特性を示す伝達関数をGHPF2(fHPF2、f)とする。GHPF2(fHPF2、f)は、第2BPF102の伝達関数Dを示すGBPF2(f)における周波数f2以下におけるハイパスのカットオフ周波数fHPF2、及び信号周波数fをパラメータとして有する。
【0045】
検出部110は、GBPF1(f)=GBPF2(f)を満たす周波数fをクロスポイント周波数fc1として検出する。よって、検出部110は、GLPF1(fLPF1、f)=GHPF2(fHPF2、f)を満たす周波数fをクロスポイント周波数fc1として検出できる。fLPF1とf1、及びfHPF2とf2との関係は既知なので、検出部110は、伝達関数D1を示すGBPF1(f)及び伝達関数D2を示すGBPF2(f)と、設定周波数f1及び設定周波数f2とに基づいて、クロスポイント周波数fc1を検出できる。
【0046】
第1BPF101が周波数信号S3を抽出し、第2BPF102が周波数信号S4を抽出した後、第1レベル検出器103は、周波数信号S3の予め定められた期間の出力レベルの平均値を周波数信号S3の出力レベルとして示す出力レベル信号L3を出力する。第2レベル検出器104は、周波数信号S4の予め定められた期間の出力レベルの平均値を周波数信号S4の出力レベルとして示す出力レベル信号L4を出力する。レベル比較器106は、出力レベル信号L3と出力レベル信号L4とを比較することで、周波数信号S3の出力レベルが周波数信号S4の出力レベルより低いか高いかを判断して、その比較結果を出力する。
【0047】
検出部110は、周波数信号S3の出力レベルより周波数信号S4の出力レベルが低い場合、伝達関数D1を示すGBPF(f1,f)と、伝達関数B2を示すGBPF(f2,f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc1と、伝達関数B3を示すGBPF(f3,f)と伝達関数B4を示すGBPF(f4,f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc2との間の周波数帯域をホルマント周波数帯域として検出する。すなわち、検出部110は、GBPF(f1,f)=GBPF(f2,f)となる周波数fをクロスポイント周波数fc1として導出し、GBPF(f3,f)=GBPF(f4,f)となる周波数fをクロスポイント周波数fc2として導出し、クロスポイント周波数fc1を一端、クロスポイント周波数fc2を他端とする周波数帯域をホルマント周波数帯域として検出する。
【0048】
一方、
図3Bに示すように、周波数信号S3の出力レベルより周波数信号S4の出力レベルが高い場合、設定部108は、第1BPF101の設定周波数を設定周波数f3より高い設定周波数f5に設定する。さらに、設定部108は第2BPF102の設定周波数を設定周波数f4及び設定周波数f5より高い設定周波数f6に設定する。設定部108により設定周波数が設定周波数f5に設定された伝達関数D5の第1BPF101が、音声信号200から周波数信号S5を抽出する。設定周波数f5は、設定周波数f4と同じでよい。設定部108により設定周波数が設定周波数f6に設定された伝達関数D6の第2BPF102が、音声信号200から周波数信号S6を抽出する。そして、検出部110は、周波数信号S5の出力レベルより周波数信号S6の出力レベルが低い場合、伝達関数D3を示すGBPF(f3,f)と、伝達関数D4を示すGBPF(f4,f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc2と、伝達関数D5を示すGBPF(f5、f)と、伝達関数D6を示すGBPF(f6,f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc3との間の周波数帯域をホルマント周波数帯域として検出する。
【0049】
あるいは、
図4に示すように、設定部108により設定周波数が設定周波数f11に設定された伝達関数B10の第1BPF101が、音声信号200から周波数信号S11を抽出する。また、設定部108により設定周波数が設定周波数f11より高い設定周波数f12に設定された伝達関数B12の第2BPF102が、音声信号200から周波数信号S12を抽出する。
【0050】
第1レベル検出器103は、周波数信号S11の予め定められた期間の出力レベルの平均値を周波数信号S11の出力レベルとして示す出力レベル信号L11を出力する。第2レベル検出器104は、周波数信号S12の予め定められた期間の出力レベルの平均値を周波数信号S12の出力レベルとして示す出力レベル信号L12を出力する。レベル比較器106は、出力レベル信号L11と出力レベル信号L12とを比較することで、周波数信号S11の出力レベルが周波数信号S12の出力レベルより低いか高いかを判断して、その比較結果を出力する。
【0051】
第1レベル検出器103から出力される周波数信号S11の出力レベルが周波数信号S12の出力レベルより高いことを比較結果が示す場合、設定部108は、第1BPF101の設定周波数を設定周波数f11より低い設定周波数f13に設定する。さらに、設定部108は第2BPF102の設定周波数を設定周波数f12より低く、かつ設定周波数f13より高い設定周波数f14に設定する。設定部108により設定周波数が設定周波数f13に設定された伝達関数B13の第1BPF101は、音声信号から周波数信号S13を抽出する。設定周波数f14は、設定周波数f11と同じでよい。
【0052】
設定部108により設定周波数が設定周波数f4に設定された伝達関数B14の第2BPF102は、音声信号から周波数信号S14を抽出する。そして、検出部110は、周波数信号S13の出力レベルより周波数信号S14の出力レベルが高い場合、伝達関数B10を示すGBPF(f11,f)と、伝達関数B12を示すGBPF(f12,f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc11と、伝達関数B13を示すGBPF(f13,f)と、伝達関数B14を示すGBPF(f14,f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc12との間の周波数帯域をホルマント周波数帯域として検出する。
【0053】
一方、
図4に示すように、周波数信号S13の出力レベルより周波数信号S14の出力レベルが低い場合、設定部108は、第1BPF101の設定周波数を設定周波数f13より低い設定周波数f15に設定する。さらに、設定部108は、第2BPF102の設定周波数を、設定周波数f14より低く、かつ設定周波数f15より高い設定周波数f16に設定する。設定部108により設定周波数が設定周波数f15に設定された伝達関数B15の第1BPF101は、音声信号200から周波数信号S15を抽出する。設定周波数f16は、設定周波数f13と同じでよい。設定部108により設定周波数が設定周波数f16に設定された伝達関数B16の第2BPF102は、音声信号200から周波数信号S16を抽出する。そして、検出部110は、周波数信号S15の出力レベルより周波数信号S16の出力レベルが高い場合、伝達関数B13を示すGBPF(f13,f)と、伝達関数B14を示すGBPF(f14,f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc12と、伝達関数B15を示すGBPF(f15、f)と、伝達関数B16を示すGBPF(f16、f)とでゲインが同一となる共通の周波数であるクロスポイント周波数fc13との間の周波数帯域をホルマント周波数帯域として検出する。
【0054】
図5は、第1実施形態におけるホルマント周波数帯域の検出手順の一例を示すフローチャートである。
【0055】
第1レベル検出器103は、第1BPF101から出力される第1周波数信号の出力レベルの5msの平均値を導出する。また、第2レベル検出器104は、第2BPF102から出力される第2周波数信号の出力レベルの5msの平均値を導出する(S100)。
【0056】
レベル比較器106は、今回の第1BPF101の出力レベルと今回の第2BPF102の出力レベルとを比較することで、今回の第1BPF101の出力レベルが、今回の第2BPF102の出力レベルより高いか低いかを判定する(S102)。検出部110は、第1BPF101及び第2BPF102の出力レベル同士の比較結果と第1BPF101及び第2BPF102の設定周波数の設定内容とに基づいて、音声信号のピーク判定を行うことで、音声信号における第1ホルマント周波数を含むホルマント周波数帯域を検出する(S104)。検出部110は、前回の第1BPF101の出力レベルが前回の第2BPF102の出力レベルより低く、かつ、第1BPF101及び第2BPF102の今回の設定周波数を前回の設定周波数より高く設定したことで、今回の第1BPF101の出力レベルが今回の第2BPF102の出力レベルより高い場合、前回の設定周波数に設定された第1BPF101及び第2BPF102のそれぞれの周波数特性でゲインが同一となる共通の周波数である前回のクロスポイント周波数と、今回の設定周波数に設定された第1BPF101及び第2BPF102のそれぞれの周波数特性(伝達関数)でゲインが同一となる共通の周波数である今回のクロスポイント周波数との間の周波数帯域をホルマント周波数帯域として検出して、検出処理を完了させる(S106)。
【0057】
一方、検出部110は、前回の第1BPF101の出力レベルが前回の第2BPF102の出力レベルより高く、かつ、第1BPF101及び第2BPF102の今回の設定周波数を前回の設定周波数より低く設定したことで、今回の第1BPF101の出力レベルが今回の第2BPF102の出力レベルより高い場合、音声信号のピークを検出できていないと判断し、設定部108は、第1BPF101及び第2BPF102の設定周波数を20%下げる(S108)。
【0058】
一方、今回の第1BPF101の出力レベルが今回の第2BPF102の出力レベルより低い場合、検出部110は、第1BPF101及び第2BPF102の出力レベル同士の比較結果、第1BPF101及び第2BPF102の設定周波数の設定内容、及び第1BPF101及第2BPF102の周波数特性に基づいて、音声信号のピーク判定を行うことで、音声信号における第1ホルマント周波数を含むホルマント周波数帯域を検出する(S110)。検出部110は、前回の第1BPF101の出力レベルが前回の第2BPF102の出力レベルより高く、かつ、第1BPF101及び第2BPF102の今回の設定周波数を前回の設定周波数より低く設定したことで、今回の第1BPF101の出力レベルが今回の第2BPF102の出力レベルより低い場合、前回の設定周波数に設定された第1BPF101及び第2BPF102のそれぞれの周波数特性(伝達関数)でゲインが同一となる共通の周波数である前回のクロスポイント周波数と、今回の設定周波数に設定された第1BPF101及び第2BPF102のそれぞれの周波数特性でゲインが同一となる共通の周波数である今回のクロスポイント周波数との間の周波数帯域をホルマント周波数帯域として検出して、検出処理を完了させる(S112)。
【0059】
検出部110は、前回の第1BPF101の出力レベルが前回の第2BPF102の出力レベルより低く、かつ、第1BPF101及び第2BPF102の今回の設定周波数を前回の設定周波数より高く設定したことで、今回の第1BPF101の出力レベルが今回の第2BPF102の出力レベルより低い場合、音声信号のピークを検出できていないと判断し、設定部108は、第1BPF101及び第2BPF102の設定周波数を20%上げる(S114)。
【0060】
パターン検出器100が上記の処理を繰り返すことで第1BPF101及び第2BPF102が、音声信号から出力レベルがピークとなるホルマント周波数付近の周波数帯域の周波数信号を抽出できるように、設定部108は、第1BPF101及び第2BPF102の設定周波数を設定できる。
【0061】
検出部110は、第1BPF101及び第2BPF102から出力される周波数信号の出力レベルの比較結果に基づいて第1BPF101及び第2BPF102の設定周波数を変化させながら、音声信号から出力レベルがピークとなる第1ホルマント周波数を含むホルマント周波数帯域を検出する。パターン検出器100は、第1BPF101及び第2BPF102の2つの帯域通過フィルタを利用して、音声信号から出力レベルがピークとなる第1ホルマント周波数を含むホルマント周波数帯域を検出できる。
【0062】
検出部110が、逐次出力レベルがピークとなる第1ホルマント周波数を含むホルマント周波数帯域を記録することで、音声信号における第1ホルマント周波数を含むホルマント周波数帯域の時間的な変化パターンを記録できる。
【0063】
例えば、第1ホルマント周波数として検出し得る周波数帯域の全域をカバーするように複数のBPFを用いて、第1ホルマント周波数の時間的な変化パターンを検出することはできる。しかしながら、この場合、例えば、人の音声の分析を行うためには、300Hzから2kHzの間を20%程度の間隔で、11個のBPFを配列し、それぞれのBPFの出力レベルを比較することで、出力レベルが最大となるBPFの中心周波数を第1ホルマント周波数として検出することになる。しかし、このような構成では、BPFの個数が多く、部品点数が増加するので、電力消費を抑制できず、コスト削減もできない。
【0064】
また、1個または複数のBPFを利用して、最低周波数から最高周波数まで、例えば、300Hzから2kHzに亘って、設定周波数を20%などの予め定められた割合ごとに出力レベルを検出しながら、スイープすることで出力レベルが最大となる設定周波数を検出することが考えられる。しかし、このような方法では、仮に、300Hzから2kHzまで20%ごとに例えば、1個のBPFを用いて設定周波数を変化させながらスイープするのに、5msの平均区間が11回必要であるため、出力レベルがピークとなる設定周波数を検出するまでに55msかかってしまう。また、55msごとにしかホルマント周波数のデータを取得することができない。
【0065】
一方、第1実施形態に係るパターン検出器100によれば、2つのBPFの出力レベルの比較結果に基づいて、2つのBPFの設定周波数を変化させながら、2つのクロスポイント周波数間に第1ホルマント周波数を含むホルマント周波数帯域を順次検出する。これにより、2つのBPFを用いて、例えば5ms間隔で第1ホルマント周波数を含むホルマント周波数帯域の時間的な変化パターンを検出でき、パターン検出器100の部品点数の削減、電力消費の削減、コスト削減なども実現できる。
【0066】
図6は、第2実施形態に係るパターン検出器100の機能ブロックの一例である。第2実施形態に係るパターン検出器100は、1つの帯域通過フィルタとして、第1BPF101を備える点で、第1実施形態に係る2つの帯域通過フィルタを備えるパターン検出器100と異なる。なお、第2実施形態に係るパターン検出器100は、2つ以上のBPFを備えてもよい。
【0067】
第2実施形態において、レベル比較器106は、第1BPF101の前回の出力レベルと、今回の出力レベルとの比較結果に基づいて、第1BPF101の設定周波数を変化させる。検出部110は、レベル比較器106による第1BPF101の異なる期間における出力レベルの比較結果と、設定部108による第1BPF101の異なる期間における設定周波数の設定内容とに基づいて、音声信号から出力レベルがピークとなる第1ホルマント周波数を含むホルマント周波数帯域を検出する。検出部110は、レベル比較器106による第1BPF101の少なくとも3つの異なる期間における出力レベルの比較結果と、設定部108による第1BPF101の少なくとも3つの期間における設定周波数の設定内容と、第1BPF101の周波数特性とに基づいて、音声信号からホルマント周波数帯域を検出してよい。
【0068】
検出部110は、第1BPF101ら出力される前回及び今回の周波数信号の出力レベルの差が予め定められた差より小さい場合、出力レベルの比較結果、設定周波数の設定内容、及び周波数特性に基づいてホルマント周波数帯域を検出してよい。検出部110は、第1BPF101ら出力される前回及び今回の周波数信号の出力レベルの差が予め定められた差以上の場合、出力レベルの比較結果、設定周波数の設定内容、及び周波数特性に基づいてホルマント周波数帯域を検出しなくてよい。
【0069】
第1BPF101は、
図7に示すように、期間Tごとに設定周波数fを変えながら、所望の周波数帯域の周波数信号を音声信号から抽出して出力する。設定部108は、
図8に示すような条件テーブルに従って、第1BPF101の次回の設定周波数を設定する。すなわち、設定部108は、前回の設定周波数に対して今回の設定周波数を20%上げていて(UP)、かつ今回の周波数信号S2の出力レベルが前回の周波数信号S1の出力レベルより高い(UP)場合、次回の設定周波数をさらに20%上げる(UP)ことを決定する。設定部108は、前回の設定周波数に対して今回の設定周波数を20%上げていて(UP)、かつ今回の周波数信号S2の出力レベルが前回の周波数信号S1の出力レベルより低い(DN)場合、次回の設定周波数を20%下げる(DN)ことを決定する。
【0070】
また、設定部108は、前回の設定周波数よりも今回の設定周波数を20%下げていて(DN)、かつ今回の周波数信号S2の出力レベルが前回の周波数信号S1の出力レベルより高い(UP)場合、次回の設定周波数をさらに20%下げる(DN)ことを決定する。設定部108は、前回の設定周波数に対して今回の設定周波数を20%下げていて(DN)、かつ今回の周波数信号S2の出力レベルが前回の周波数信号S1の出力レベルより低い(DN)場合、次回の設定周波数を20%上げる(UP)ことを決定する。
【0071】
検出部110は、
図9に示すような条件テーブルに従って、第1ホルマント周波数を含むホルマント周波数帯域を検出できたか否かを判定してよい。すなわち、検出部110は、前々回の設定周波数より前回の設定周波数が高く、前回の第1BPF101の出力レベルが前々回の第1BPF101の出力レベルより高く、前回の設定周波数より今回の設定周波数が高く、かつ今回の第1BPF101の出力レベルが前回の第1BPF101の出力レベルより低い場合、ピーク検出あり、すなわち、ホルマント周波数帯域を検出できたと判定する。検出部110は、前々回の設定周波数より前回の設定周波数が低く、前々回の第1BPF101の出力レベルが前回の第1BPF101の出力レベルより低く、前回の設定周波数より今回の設定周波数が低く、かつ今回の第1BPF101の出力レベルが前回の第1BPF101の出力レベルより低い場合、ピーク検出あり、すなわち、ホルマント周波数帯域を検出できたと判定する。
【0072】
例えば、第1BPF101は、期間Tn-1の音声信号から設定周波数fn-1を含む周波数帯域B1の周波数成分を示す周波数信号S1を抽出する。次いで、第1BPF101は、期間Tnの音声信号から設定周波数fn-1より20%高い設定周波数fnを含む周波数帯域B2の周波数成分を示す周波数信号S2を抽出する。レベル比較器106は、第1レベル検出器103により導出された前回の周波数信号S1の出力レベルと今回の周波数信号S2の出力レベルとを比較することで、今回の周波数信号S2の出力レベルが前回の周波数信号S1の出力レベルより高いか低いかを判定する。設定部108は、前回の周波数信号S1の出力レベルが今回の周波数信号S2の出力レベルより低い場合、第1BPF101の次回の設定周波数fn+1を今回の設定周波数fnより20%高く設定する。そして、設定周波数fn+1を設定された第1BPF101は、期間Tn+1の音声信号から、設定周波数fn+1を含む周波数帯域B3の周波数成分を示す周波数信号S3を抽出する。検出部110は、周波数信号S2の出力レベルが周波数信号S3の出力レベルより高い場合、設定周波数fn-1に設定された第1BPF101の周波数特性と設定周波数fnに設定された第1BPF101の周波数特性とでゲインが同一となる共通の周波数fcnと、設定周波数fnに設定された第1BPF101の周波数特性と設定周波数fn+1に設定された第1BPF101の周波数特性とでゲインが同一となる共通の周波数fcn+1との間の周波数帯域をホルマント周波数周波数帯域として検出する。
【0073】
あるいは、第1BPF101は、期間Tn-1の音声信号から設定周波数fn-1を含む周波数帯域B1の周波数成分を示す周波数信号S1を抽出する。ここで、設定部108が前回、設定周波数を20%下げていた場合で、前々回の周波数信号S0の出力レベルより周波数信号S1の出力レベルが高い場合、設定部108は、設定周波数fn-1より20%低い設定周波数に期間Tnの設定周波数fnを設定する。そして、第1BPF101は、期間Tnの音声信号から設定周波数fnを含む周波数帯域B2の周波数成分を示す周波数信号S2を抽出する。次いで、周波数信号S1の出力レベルが周波数信号S2の出力レベルより低い場合、設定部108は、設定周波数fnより20%低い設定周波数に期間Tn+1の設定周波数fn+1を設定する。そして、第1BPF101は、期間Tn+1の音声信号から設定周波数fn+1を含む周波数帯域B3の周波数成分を示す周波数信号S3を抽出する。検出部110は、周波数信号S2の出力レベルが周波数信号S3の出力レベルより高い場合、設定周波数fn-1に設定された第1BPF101の周波数特性と設定周波数fnに設定された第1BPF101の周波数特性とでゲインが同一となる共通の周波数fcnと、設定周波数fnに設定された第1BPF101の周波数特性と設定周波数fn+1に設定された第1BPF101の周波数特性とでゲインが同一となる共通の周波数fcn+1との間の周波数帯域をホルマント周波数帯域として検出する。
【0074】
図10は、第2実施形態における第1BPF101の設定周波数の設定手順の一例を示すフローチャートである。
【0075】
設定部108は、第1BPF101の設定周波数を20%上げる(S200)。第1レベル検出器103は、第1BPF101から出力される第1周波数信号の出力レベルの5msの平均値を導出する(S202)。レベル比較器106は、第1BPF101の今回の出力レベルが第1BPF101の前回の出力レベルより高いか低いかを判定する(S204)。
【0076】
第1BPF101の今回の出力レベルが第1BPF101の前回の出力レベルより高い場合、再度、設定部108は、第1BPF101の設定周波数を20%上げる(S200)。
【0077】
一方、第1BPF101の今回の出力レベルが第1BPF101の前回の出力レベルより低い場合、検出部110は、レベル比較器106による第1BPF101の異なる期間における出力レベルの比較結果と、設定部108による第1BPF101の異なる期間における設定周波数の設定内容と、第1BPF101の周波数特性とに基づいて、音声信号のピーク判定を行う(S206)。
【0078】
検出部110は、第1BPF101の前々回の出力レベルが第1BPF101の前回の出力レベルより低く、かつ第1BPF101の今回の出力レベルが第1BPF101の前回の出力レベルより低い場合、前々回の設定周波数に設定された第1BPF101の周波数特性と前回の設定周波数に設定された第1BPF101の周波数特性とでゲインが同一となる共通の周波数と、前回の設定周波数に設定された第1BPF101の周波数特性と今回の設定周波数に設定された第1BPF101の周波数特性とでゲインが同一となる共通の周波数との間の周波数帯域をホルマント周波数周波数帯域として検出して、検出処理を完了する(S208)。
【0079】
検出部110が音声信号のピークを検出できなかった場合、設定部108は、第1BPF101の設定周波数を20%下げる(S210)。第1レベル検出器103は、第1BPF101から出力される第1周波数信号の出力レベルの5msの平均値を導出する(S212)。
【0080】
レベル比較器106は、第1BPF101の今回の出力レベルが第1BPF101の前回の出力レベルより高いか低いかを判定する(S214)。第1BPF101の今回の出力レベルが第1BPF101の前回の出力レベルより高い場合、再度、設定部108は、第1BPF101の設定周波数を20%下げる(S210)。一方、第1BPF101の今回の出力レベルが第1BPF101の前回の出力レベルより低い場合、検出部110は、レベル比較器106による第1BPF101の異なる期間における出力レベルの比較結果と、設定部108による第1BPF101の異なる期間における設定周波数の設定内容と、第1BPF101の周波数特性とに基づいて、音声信号のピーク判定を行う(S216)。検出部110は、第1BPF101の前々回の出力レベルが第1BPF101の前回の出力レベルより低く、かつ第1BPF101の今回の出力レベルが第1BPF101の前回の出力レベルより低い場合、前々回の設定周波数に設定された第1BPF101の周波数特性と前回の設定周波数に設定された第1BPF101の周波数特性とでゲインが同一となる共通の周波数と、前回の設定周波数に設定された第1BPF101の周波数特性と今回の設定周波数に設定された第1BPF101の周波数特性とでゲインが同一となる共通の周波数との間の周波数帯域をホルマント周波数周波数帯域として検出して、検出処理を完了する(S218)。検出部110が音声信号のピークを検出できなかった場合、設定部108は、第1BPF101の設定周波数を20%上げる(S200)。
【0081】
第2の実施形態によれば、パターン検出器100が上記の処理を繰り返すことで第1BPF101が、音声信号から出力レベルがピークとなるホルマント周波数付近の周波数帯域の周波数信号を抽出できるように、設定部108は、第1BPF101の設定周波数を設定できる。
【0082】
検出部110は、第1BPF101の設定周波数を変化させながら、前回の周波数信号の出力レベルと今回の周波数信号の出力レベルとを比較して、音声信号から出力レベルがピークとなる第1ホルマント周波数を含むホルマント周波数帯域を検出できる。パターン検出器100は、1つの帯域通過フィルタを利用して、音声信号から出力レベルがピークとなる第1ホルマント周波数を含むホルマント周波数帯域を検出できる。
【0083】
検出部110が、逐次出力レベルがピークとなる第1ホルマント周波数を含むホルマント周波数帯域を記録していくことで、音声信号における第1ホルマント周波数を含むホルマント周波数帯域の時間的な変化パターンを記録できる。すなわち、第2実施形態に係るパターン検出器100によれば、1つのBPFで、第1ホルマント周波数を含むホルマント周波数帯域の時間的な変化パターンを検出でき、パターン検出器100の部品点数の削減、電力消費の削減、コスト削減などを実現できる。
【0084】
図11は、第3実施形態に係るウェイクワード検出器10の機能ブロックの一例を示す図である。第3実施形態に係るウェイクワード検出器10は、第1BPF101の代わりに、第1混合器111、第1可変周波数発振器113、及び第1低域通過フィルタ(第1LPF)115を備え、第2BPF102の代わりに、第2混合器112、第2可変周波数発振器114、及び第2LPF116を備える。
【0085】
第1可変周波数発振器113は、設定部108により設定された設定周波数fLO1に応じた周波数信号を発振する。第2可変周波数発振器114は、設定部108により設定された設定周波数fLO2に応じた周波数信号を発振する。
【0086】
第1混合器111は、第1可変周波数発振器113から発振される周波数信号S1と音声信号Vinの入力に応じて、周波数信号S1と音声信号Vinとの周波数の和及び差のそれぞれを示す第1周波数信号を出力する。第1LPF115は、第1周波数信号から予め定められた周波数帯域より高い周波数帯域の周波数信号をカットして、周波数信号と音声信号との差を示す第1中間周波数信号を出力する。
【0087】
例えば、第1混合器111に、音声信号Vin=A×cos(2π×fin×t)と、設定周波数fLO1の周波数信号とが入力されると、第1LPF115は、第1中間周波数信号Vout1=(2/π)×A×cos(2π×(fin-fLo1)×t)を出力する。
【0088】
第2混合器112は、第2可変周波数発振器114から発振される周波数信号S2と音声信号Vinの入力に応じて、周波数信号S2と音声信号Vinとの周波数の和及び差のそれぞれを示す第2周波数信号を出力する。第2LPF116は、第2周波数信号から予め定められた周波数帯域より高い周波数帯域の周波数信号をカットして、周波数信号と音声信号との差を示す第2中間周波数信号を出力する。例えば、第2混合器112に、音声信号Vin=A×cos(2π×fin×t)と、設定周波数fLO2の周波数信号とが入力されると、第2LPF116は、第2中間周波数信号Vout2=(2/π)×A×cos(2π×(fin-fLo2)×t)を出力する。ここで、Aは定数、tは時間である。設定周波数fLO1は、設定周波数fLO2より低い。
【0089】
設定部108は、第1混合器111及び第2混合器112の中間周波数信号の出力レベルの比較結果に基づいて、第1可変周波数発振器113及び第2可変周波数発振器114のそれぞれの設定周波数を設定する。検出部110は、第1混合器111及び第2混合器112の中間周波数信号の出力レベルの比較結果と、設定部108による第1可変周波数発振器113及び第2可変周波数発振器114のそれぞれの設定周波数の設定内容とに基づいて、音声信号における第1ホルマント周波数を含むホルマント周波数帯域を検出する。設定周波数の設定内容は、設定部108による第1可変周波数発振器113及び第2可変周波数発振器114のそれぞれの設定周波数の設定履歴を示す。設定内容は、設定部108による第1可変周波数発振器113及び第2可変周波数発振器114のそれぞれの前々回、前回、及び今回の設定周波数を示してよい。設定内容は、設定部108による第1可変周波数発振器113及び第2可変周波数発振器114の前回の設定周波数と比較して、今回の設定周波数が低くなったか、高くなったかを示すフラグでよい。
【0090】
設定部108は、第1中間周波数信号Vout1の出力レベルが第2中間周波数信号Vout2の出力レベルより低い場合、第1可変周波数発振器113の発振周波数を設定周波数fLo1(1)より高い設定周波数fLo1(2)に設定し、第2可変周波数発振器114の発振周波数を設定周波数fLo2(1)より高い設定周波数fLo2(2)に設定する。
【0091】
設定部108により発振周波数が設定周波数fLo1(2)に設定された第1可変周波数発振器113は、周波数信号S3を発振する。第1混合器111は、周波数信号S3と音声信号Vinとの入力を受けて、周波数信号S3と音声信号Vinとの周波数の和及び差のそれぞれを示す第3周波数信号を出力する。第1LPF115は、第3周波数信号から予め定められた周波数帯域より高い周波数帯域の周波数信号をカットして、周波数信号と音声信号との差を示す第3中間周波数信号を出力する。
【0092】
設定部108により発振周波数が設定周波数fLo2(2)に設定された第2可変周波数発振器114は、周波数信号S4を発振する。第2混合器112は、周波数信号S4と音声信号Vinとの入力を受けて、周波数信号S4と音声信号Vinとの周波数の和及び差のそれぞれを示す第4周波数信号を出力する。第2LPF116は、第4周波数信号から予め定められた周波数帯域より高い周波数帯域の周波数信号をカットして、周波数信号と音声信号との差を示す第4中間周波数信号を出力する。レベル比較器106は、第3中間周波数信号の出力レベルより第4中間周波数の出力レベルが高いか低いかを判定する。
【0093】
ここで、
図12Aに示すように、第1LPF115のカットオフ周波数を第1混合器111から出力される周波数信号の周波数fconv1軸上で、fLPF1とおくと、第1LPF115の周波数特性は、GLPF(fLPF1,fconv1)という伝達関数D1で表すことができる。
図12Bに示すように、第2LPF116のカットオフ周波数を第2混合器112から出力される周波数信号の周波数fconv2軸上で、fLPF2とおくと、第2LPF116の周波数特性は、GLPF(fLPF2,fconv2)という伝達関数D2で表すことができる。通常、fLPF1及びfLPF2は、中間周波数信号V
out1及びV
out2までを見た周波数特性において、帯域が分けられるようにするため、fLPF1及びfLPF2との差は、設定周波数f
Lo1と設定周波数f
Lo2との差よりも小さい差となるような値に設計する。
【0094】
入力から中間周波数信号V
out1及びV
out2までの周波数特性を、入力信号の周波数f軸上で表すと、
図13に示すように、2つのバンドパス(2つの伝達関数)が並んだように見える。
図13において、伝達関数E1は、入力からV
out1をみたときの設定周波数f
Lo1より高い入力信号の周波数fに対するV
out1の周波数特性を示す。伝達関数E2は、入力からV
out2をみたときの設定周波数f
Lo2より低い入力信号の周波数fに対するV
out1の周波数特性を示す。
【0095】
周波数fにおいて、設定周波数fLo1以上、設定周波数fLo2以下の周波数帯域に注目してみると、Vout1は、fconv1=f-fLo1に変換できる。よって、Vout1=K1×Vin×GLPF1(fLPF1,(f-fLo1))と表すことができる。K1は、第1混合器111の変換係数を示す。Vout2は、fconv2=f-fLo2に変換できる。よって、Vout2=K2×Vin×GLPF2(fLPF2,(f-fLo2))と表すことができる。K2は、第2混合器112の変換係数を示す。
【0096】
クロスポイント周波数fcは、Vout1=Vout2を満たす周波数fである。よって、検出部110は、K1×Vin×GLPF1(fLPF1,(f-fLo1))=K2×Vin×GLPF2(fLPF2,(f-fLo2))を満たす周波数fを導出することで、クロスポイント周波数fcを検出できる。すなわち、検出部110は、第1LPF115の伝達関数E1を示すGLPF1と、第2LPF116の伝達関数E2を示すGLPF2と、fLo1及びfLo2と、変換係数K1及び変換係数K2に基づいて、クロスポイント周波数fcを検出できる。検出部110は、第1可変周波数発振器113の発振周波数が設定周波数fLo1(1)に設定されているときの第1LPF115の周波数特性に基づく伝達関数GLPF1に第1混合器111の変換係数K1を乗じた場合のゲインと、第2可変周波数発振器114の発振周波数が設定周波数fLo2(1)に設定されているときの第2LPF116の周波数特性に基づく伝達関数GLPF2に第2混合器112の変換係数K2を乗じた場合のゲインとが同一となる共通の周波数と、第1可変周波数発振器113の発振周波数が設定周波数fLo1(2)に設定されているときの第1LPF115の周波数特性に基づく伝達関数GLPF1に変換係数K1を乗じた場合のゲインと、第2可変周波数発振器114の発振周波数が設定周波数fLo2(2)に設定されているときの第2LPF116の周波数特性に基づく伝達関数GLPF2に変換係数K2を乗じた場合のゲインとが同一となる共通の周波数との間の周波数帯域をホルマント周波数帯域として検出する。
【0097】
そこで、検出部110は、第3中間周波数信号より第4中間周波数信号の出力レベルが低い場合、通常行いうる設計の混合器ならK1=K2となるので、第1可変周波数発振器113の発振周波数が設定周波数fLo1(1)に設定されているときの第1LPF115の周波数特性に基づく伝達関数GLPF1と第2可変周波数発振器114の発振周波数が設定周波数fLo2(1)に設定されているときの第2LPF116の周波数特性に基づく伝達関数GLPF2とでゲインが同一となる共通の周波数と、第1可変周波数発振器113の発振周波数が設定周波数fLo1(2)に設定されているときの第1LPF115の周波数特性に基づく伝達関数GLPF1と第2可変周波数発振器114の発振周波数が設定周波数fLo2(2)に設定されているときの第2LPF116の周波数特性に基づく伝達関数GLPF2とでゲインが同一となる共通の周波数との間の周波数帯域をホルマント周波数帯域として検出する。
【0098】
一方、設定部108は、第1中間周波数信号Vout1の出力レベルが第2中間周波数信号Vout2の出力レベルより高い場合、第1可変周波数発振器113の発振周波数を設定周波数fLo1(1)より低い設定周波数fLo1(2)に設定し、第2可変周波数発振器114の発振周波数を設定周波数fLo2(1)より低く、設定周波数fLo1(2)より高い設定周波数fLo2(2)に設定する。
【0099】
設定部108により発振周波数が設定周波数fLo1(2)に設定された第1可変周波数発振器113は、周波数信号S3を発振する。第1混合器111は、周波数信号S3と音声信号Vinとの入力を受けて、周波数信号S3と音声信号Vinとの周波数の和及び差のそれぞれを示す第3周波数信号を出力する。第1LPF115は、第3周波数信号から予め定められた周波数帯域より高い周波数帯域の周波数信号をカットして、周波数信号と音声信号との差を示す第3中間周波数信号を出力する。
【0100】
設定部108により発振周波数が設定周波数fLo2(2)に設定された第2可変周波数発振器114は、周波数信号S4を発振する。第2混合器112は、周波数信号S4と音声信号Vinとの入力を受けて、周波数信号S4と音声信号Vinとの周波数の和及び差のそれぞれを示す第4周波数信号を出力する。第2LPF116は、第4周波数信号から予め定められた周波数帯域より高い周波数帯域の周波数信号をカットして、周波数信号と音声信号との差を示す第4中間周波数信号を出力する。
【0101】
レベル比較器106は、第3中間周波数信号の出力レベルより第4中間周波数の出力レベルが高いか低いかを判定する。検出部110は、第3中間周波数信号より第4中間周波数信号の出力レベルが高い場合、通常行いうる設計の混合器ならK1=K2となるので、第1可変周波数発振器113の発振周波数が設定周波数fLo1(1)に設定されているときの第1LPF115の周波数特性に基づく伝達関数GLPF1と第2可変周波数発振器114の発振周波数が設定周波数fLo2(1)に設定されているときの第2LPF116の周波数特性に基づく伝達関数GLPF2とでゲインが同一となる共通の周波数と、第1可変周波数発振器113の発振周波数が設定周波数fLo1(2)に設定されているときの第1LPF115の周波数特性に基づく伝達関数GLPF1と第2可変周波数発振器114の発振周波数が設定周波数fLo2(2)に設定されているときの第2LPF116の周波数特性に基づく伝達関数GLPF2とでゲインが同一となる共通の周波数との間の周波数帯域をホルマント周波数帯域として検出する。
【0102】
以上、第3実施形態によれば、第1実施形態と同様に、第1可変周波数発振器113及び第2可変周波数発振器114の設定周波数を変化させながら、音声信号から出力レベルがピークとなる第1ホルマント周波数を含むホルマント周波数帯域を検出できる。
【0103】
例えば、第1可変周波数発振器113の設定周波数を600Hzに設定し、50Hzの第1LPF115を第1混合器111の後段に設けることで、中心周波数として600Hzに設定され、600Hzを中心として±50Hzの周波数信号を出力する第1BPF101と同等の機能を実現できる。また、第2可変周波数発振器114の設定周波数を720Hzに設定し、50Hzの第2LPF116を第1混合器111の後段に設けることで、中心周波数として720Hzに設定され、720Hzを中心として±50Hzの周波数信号を出力する第2BPF102と同等の機能を実現できる。なお、第1混合器111及び第2混合器112の速応答性を鈍化させて、第1混合器111及び第2混合器112から出力される周波数帯域を制限することで、高周波をカットしてもよい。これにより、第1混合器111及び第2混合器112の後段に、第1LPF115及び第2LPF116を設ける必要がなくなる。
【0104】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0105】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0106】
10 ウェイクワード検出器
100 パターン検出器
101 第1BPF
102 第2BPF
103 第1レベル検出器
104 第2レベル検出器
106 レベル比較器
108 設定部
110 検出部
111 第1混合器
112 第2混合器
113 第1可変周波数発振器
114 第2可変周波数発振器
130 パターンデータ記憶部
150 照合部