特許第6157201号(P6157201)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特許6157201雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法
<>
  • 特許6157201-雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法 図000002
  • 特許6157201-雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法 図000003
  • 特許6157201-雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法 図000004
  • 特許6157201-雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法 図000005
  • 特許6157201-雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法 図000006
  • 特許6157201-雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法 図000007
  • 特許6157201-雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法 図000008
  • 特許6157201-雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法 図000009
  • 特許6157201-雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法 図000010
  • 特許6157201-雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6157201
(24)【登録日】2017年6月16日
(45)【発行日】2017年7月5日
(54)【発明の名称】雑音を含む音声信号からコードに対応する特定周波数を検出する装置、プログラム及び方法
(51)【国際特許分類】
   H04M 1/00 20060101AFI20170626BHJP
   H04Q 9/00 20060101ALI20170626BHJP
   H04M 11/00 20060101ALI20170626BHJP
【FI】
   H04M1/00 J
   H04Q9/00 301D
   H04M11/00 301
【請求項の数】9
【全頁数】17
(21)【出願番号】特願2013-96562(P2013-96562)
(22)【出願日】2013年5月1日
(65)【公開番号】特開2014-220568(P2014-220568A)
(43)【公開日】2014年11月20日
【審査請求日】2016年1月19日
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(72)【発明者】
【氏名】内藤 正樹
(72)【発明者】
【氏名】田坂 和之
(72)【発明者】
【氏名】加藤 恒夫
【審査官】 石田 紀之
(56)【参考文献】
【文献】 特開平04−318744(JP,A)
【文献】 特開平07−226779(JP,A)
【文献】 特開平02−094743(JP,A)
【文献】 特開平05−244645(JP,A)
【文献】 米国特許第04191862(US,A)
【文献】 特開平07−212802(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04M 1/00
H04M 11/00
H04Q 9/00
(57)【特許請求の範囲】
【請求項1】
コード毎に特定周波数が予め割り当てられており、音声信号に含まれた特定周波数のコードを検出する装置において、
コード毎に、当該特定周波数を含む特定周波数帯域が予め設定されており、
前記音声信号から、コード毎の各特定周波数帯域における周波数成分の電力を検出する周波数分析手段と、
コード毎の各特定周波数帯域の中で、当該特定周波数帯域における電力が、当該特定周波数帯域の両側周辺の他の周波数帯域における電力に対して、「極大」となるか否かを判定する極大判定手段と、
極大と判定された1つ以上の前記特定周波数帯域の中で、電力が最大となる特定周波数を検出する特定周波数検出手段と
検出された当該特定周波数に対応付けられたコードを出力するコード出力手段と
を有し、
前記特定周波数帯域、及び、当該特定周波数の両側周辺の他の周波数帯域は、サンプリング周波数に基づくフーリエ変換の周波数分解能である
ことを特徴とする装置。
【請求項2】
前記特定周波数検出手段は、電力が最大となる当該特定周波数について、その電力が所定閾値以上である場合にのみ検出することを特徴とする請求項1に記載の装置。
【請求項3】
前記コード毎に、互いに異なる複数の特定周波数が組み合わされており、
前記特定周波数検出手段は、電力が最大となる複数の特定周波数を検出し、
前記コード出力手段は、検出された複数の特定周波数の組み合わせに対応付けられたコードを出力する
ことを特徴とする請求項1又は2に記載の装置。
【請求項4】
前記特定周波数は、DTMF(Dual-Tone Multi-Frequency)であり、
コード毎に、高群トーン及び低群トーンそれぞれについて、各特定周波数を中心とした特定周波数帯域が予め設定されており、
前記極大判定手段は、高群トーン及び低群トーンそれぞれについて、コード毎の各特定周波数帯域の中で、当該特定周波数帯域における電力が、当該特定周波数帯域の両側周辺の他の周波数帯域における電力に対して、「極大」となるか否かを判定し、
前記特定周波数検出手段は、高群トーン及び低群トーンそれぞれについて、極大と判定された1つ以上の前記特定周波数帯域の中で、電力が最大となる特定周波数を検出し、
前記コード出力手段は、高群トーンで検出された特定周波数と、低群トーンで検出された特定周波数とに対応付けられたコードを出力することを特徴とする請求項3に記載の装置。
【請求項5】
前記特定周波数検出手段は、
高群トーン及び低群トーンそれぞれについて、極大と判定された1つ以上の前記特定周波数帯域の中で、電力が最大となる特定周波数を選択すると共に、
高群トーン及び低群トーンそれぞれについて選択された各特定周波数帯域の電力値が所定閾値以上である場合にのみ、その特定周波数を検出する
ことを特徴とする請求項4に記載の装置。
【請求項6】
前記特定周波数検出手段は、
高群トーン及び低群トーンそれぞれについて、極大と判定された1つ以上の前記特定周波数帯域の中で、電力が最大となる特定周波数を選択すると共に、
高群トーン及び低群トーンそれぞれについて選択された各特定周波数帯域の電力値と、高群トーン及び低群トーンを合わせて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較し、その差が所定閾値以上である場合にのみ、その特定周波数を検出する
ことを特徴とする請求項4に記載の装置。
【請求項7】
前記特定周波数検出手段は、
高群トーン及び低群トーンそれぞれについて、極大と判定された1つ以上の前記特定周波数帯域の中で、電力が最大となる特定周波数を選択すると共に、
高群トーンについて選択された特定周波数帯域の電力値と、高群トーンについて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較し、その差が所定閾値以上であって、
低群トーンについて選択された特定周波数帯域の電力値と、低群トーンについて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較し、その差が所定閾値以上である場合にのみ、その特定周波数を検出する
ことを特徴とする請求項4に記載の装置。
【請求項8】
コード毎に特定周波数が予め割り当てられており、音声信号に含まれた特定周波数のコードを検出する装置に搭載されたコンピュータを機能させるプログラムにおいて、
コード毎に、当該特定周波数を含む特定周波数帯域が予め設定されており、
前記音声信号から、コード毎の各特定周波数帯域における周波数成分の電力を検出する周波数分析手段と、
コード毎の各特定周波数帯域の中で、当該特定周波数帯域における電力が、当該特定周波数帯域の両側周辺の他の周波数帯域における電力に対して、「極大」となるか否かを判定する極大判定手段と、
極大と判定された1つ以上の前記特定周波数帯域の中で、電力が最大となる特定周波数を検出する特定周波数検出手段と
検出された当該特定周波数に対応付けられたコードを出力するコード出力手段と
してコンピュータを機能させ
前記特定周波数帯域、及び、当該特定周波数の両側周辺の他の周波数帯域は、サンプリング周波数に基づくフーリエ変換の周波数分解能である
ようにコンピュータを機能させることを特徴とするプログラム。
【請求項9】
コード毎に特定周波数が予め割り当てられており、音声信号に含まれた特定周波数のコードを検出する装置を用いたトーン信号検出方法において、
コード毎に、当該特定周波数を含む特定周波数帯域が予め設定されており、
前記音声信号から、コード毎の各特定周波数帯域における周波数成分の電力を検出する第1のステップと、
コード毎の各特定周波数帯域の中で、当該特定周波数帯域における電力が、当該特定周波数帯域の両側周辺の他の周波数帯域における電力に対して、「極大」となるか否かを判定する第2のステップと、
極大と判定された1つ以上の前記特定周波数帯域の中で、電力が最大となる特定周波数を検出する第3のステップと、
検出された当該特定周波数に対応付けられたコードを出力する第4のステップと
を有し、
前記特定周波数帯域、及び、当該特定周波数の両側周辺の他の周波数帯域は、サンプリング周波数に基づくフーリエ変換の周波数分解能である
ことを特徴とするトーン信号検出方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号からDTMF(Dual Tone Multi-Frequency)信号を検出する技術に関する。
【背景技術】
【0002】
古くは、ファクシミリ装置やパーソナルコンピュータのような通信端末について、DTMF信号を、電話(音声)回線を介して送受信する技術がある。DTMF信号とは、例えばトーン(プッシュ)方式の電話機で、各ボタンに割り当てられた信号音である。これは、1つのボタンに対して、2種類の特定周波数の音が発信されるようになっている。一般に、低群トーンの特定周波数4種類と高群トーンの特定周波数4種類とからそれぞれ、1音ずつが組み合わされる。
低群トーン:697Hz ,770Hz, 852Hz, 941Hz
高群トーン:1209Hz,1336Hz,1477Hz,1633Hz
例えば、ダイヤル「6」を示すDTMF信号は、770Hzのトーンと1477Hzのトーンとから構成される。
【0003】
DTMF信号は、発呼するための電話番号の送出に限られず、音声呼の確立後に、制御コードを送受信するためにも用いられる。制御コードは例えば英数字であって、DTMF信号を含む音声信号から、その英数字を検出することができる。そのような通信端末は、DTMF信号検出部を搭載する。また、電話回線を介して受信した音声信号に限られず、マイクによって外部から発声された音声信号を入力し、その音声信号に含まれるDTMF信号を検出する装置もある。また、DTMF信号に変換した制御コードを、電話回線を介して遠隔地に位置する装置へ送信し、当該装置を遠隔的に操作する技術もある(例えば特許文献1参照)。
【0004】
図1は、従来技術におけるDTMF信号検出器の機能構成図である。
【0005】
図1によれば、DTMF信号検出器は、高群トーン及び低群トーンを合わせて8種類の特定周波数毎に、8列の回路系列を有している。特定周波数毎の各回路系列は、バンドパスフィルタと、乗算器と、ローパスフィルタと、レベル検出器と、コーダ(符号化器)とを有する。バンドパスフィルタは、当該特定周波数を中心として所定幅の周波数帯域のみを通過させ、乗算器へ出力する。乗算器は、その信号を2乗化し、ローパスフィルタへ出力する。ローパスフィルタは、その信号を平滑化し、レベル検出器へ出力する。レベル検出器は、その信号のレベルを検出し、そのレベルをコーダへ出力する。コーダは、特定周波数毎の各回路系列から出力された信号の中から、高いレベルの高群トーン及び低群トーンの組み合わせを検出し、それらの組み合わせに対応したコードを出力する。勿論、バンドパスフィルタに代えて高速フーリエ変換のような周波数分析器を用いてもよい。また、他の実施形態としては、平滑用ローパスフィルタを用いる必要の無いものもある。
【0006】
一般に、DTMF信号検出器には、DTMF信号以外の雑音の影響を受けることによる誤検出を回避するために、様々な機能が搭載されている。
【0007】
従来、DTMF周波数帯域外のパワー(電力)と、DTMF周波数帯域内の高群の周波数帯域のパワーと、DTMF周波数帯域内の低群の周波数帯域のパワーとを比較する技術がある(例えば特許文献2参照)。この比較は、DTMF信号の特定周波数の電力と、DTMF信号の特定周波数以外の帯域の電力との差を基準とする。従って、DTMF信号の検出に用いる特定周波数の電力測定部に加えて、別途、DTMF信号の特定周波数以外の帯域の電力測定部も必要となる。
【0008】
また、全帯域のパワーと、DTMF検出周波数帯域内の高群の周波数帯域のパワーと、DTMF検出周波数帯域内の低群の周波数帯域のパワーを比較する技術もある(例えば特許文献3参照)。更に、全帯域のパワーと、高群トーン信号のパワーと、低群トーン信号のパワーを比較する技術もある(例えば特許文献4参照)。この比較は、DTMF信号の特定周波数の電力と、全帯域(DTMF信号の特定周波数を含む)の電力との差を基準とする。従って、それらの差が所定閾値よりも小さい場合に、入力信号はDTMF信号では無いと判定することによって、DTMF信号の誤検出を削減する。即ち、DTMF信号の特定周波数以外の帯域の電力が高い場合に、DTMF信号の検出が抑制される。従って、DTMF信号の特定周波数の電力は考慮されず、その他の帯域の雑音が大きい場合に常に検出が抑制される。
【0009】
また、4つの高群トーン及び4つの低群トーンそれぞれの中で、以下の3つの値を用いて、入力信号はDTMF信号では無いと判定することによって、DTMF信号の誤検出を削減する技術もある(例えば特許文献5参照)。
・最大のトーン信号のパワーと4つのトーン信号のパワーの合計値を比較した値
・4つのトーン信号の中でパワーが閾値を超える信号の個数
・最大のトーン信号のパワーと2番目に大きいトーン信号のパワーとを比較した値
【0010】
前述したいずれの従来技術も、DTMF信号が送信されていないにも拘わらず、雑音等の影響によって、DTMF信号が誤って検出されることを抑制するためのものである。即ち、DTMF信号に該当する特定周波数以外の帯域に雑音信号が含まれている場合に、DTMF信号の検出を抑制するように作用する。
【先行技術文献】
【特許文献】
【0011】
【特許文献1】特開2000−196768号公報
【特許文献2】特許第2853841号
【特許文献3】特許第2853842号
【特許文献4】特許第2856968号
【特許文献5】特許第2851974号
【特許文献6】特開2001−112033号公報
【特許文献7】特開平5−284213号公報
【発明の概要】
【発明が解決しようとする課題】
【0012】
しかしながら、前述したいずれの従来技術によれば、音声信号に雑音が混入すると、逆に、DTMF信号が送信されているにも拘わらず、DTMF信号が検出されない場合が増加する。特に、特許文献1に記載の技術によれば、通信端末は、電話回線を介して受信されたDTMF信号をそのまま、スピーカから発声させ、その音声をマイクによって受信している。そのために、スピーカからマイクとの間のエアで、雑音の影響を受けることなる。雑音によってDTMF信号が乱れ、適切な制御コードに変換できないという問題が生じる。
【0013】
図2は、従来技術におけるDTMF信号の周波数成分に対する電力を表すグラフである。
【0014】
図2(a)によれば、雑音が無い場合を表しており、送出されているDTMF信号における770Hz及び1477Hzの周波数成分に対して、高い電力が検出されている。そのために、770Hz及び1477Hzの組み合わせから、コード「6」が検出される。
【0015】
一方で、図2(b)によれば、音声信号に雑音が混入した場合を表しており、送出されているDTMF信号における770Hz及び1477Hzの周波数成分に対して、他の周波数成分についても高い電力が検出されてしまう。そのために、770Hz及び1477Hzの組み合わせ自体を検出することができない。
【0016】
そこで、本発明は、雑音を含む音声信号であっても、コードに対応する特定周波数をできる限り検出することができる装置、プログラム及び方法を提供することを目的とする。
【課題を解決するための手段】
【0017】
本発明によれば、コード毎に特定周波数が予め割り当てられており、音声信号に含まれた特定周波数のコードを検出する装置において、
コード毎に、当該特定周波数を含む特定周波数帯域が予め設定されており、
音声信号から、コード毎の各特定周波数帯域における周波数成分の電力を検出する周波数分析手段と、
コード毎の各特定周波数帯域の中で、当該特定周波数帯域における電力が、当該特定周波数帯域の両側周辺の他の周波数帯域における電力に対して、「極大」となるか否かを判定する極大判定手段と、
極大と判定された1つ以上の特定周波数帯域の中で、電力が最大となる特定周波数を検出する特定周波数検出手段と
検出された当該特定周波数に対応付けられたコードを出力するコード出力手段と
を有し、
前記特定周波数帯域、及び、当該特定周波数の両側周辺の他の周波数帯域は、サンプリング周波数に基づくフーリエ変換の周波数分解能である
ことを特徴とする。
【0018】
本発明の装置における他の実施形態によれば、
特定周波数検出手段は、電力が最大となる当該特定周波数について、その電力が所定閾値以上である場合にのみ検出することも好ましい。
【0019】
本発明の装置における他の実施形態によれば、
コード毎に、互いに異なる複数の特定周波数が組み合わされており、
特定周波数検出手段は、電力が最大となる複数の特定周波数を検出し、
コード出力手段は、検出された複数の特定周波数の組み合わせに対応付けられたコードを出力することも好ましい。
【0020】
本発明の装置における他の実施形態によれば、
特定周波数は、DTMF(Dual-Tone Multi-Frequency)であり、
コード毎に、高群トーン及び低群トーンそれぞれについて、各特定周波数を中心とした特定周波数帯域が予め設定されており、
極大判定手段は、高群トーン及び低群トーンそれぞれについて、コード毎の各特定周波数帯域の中で、当該特定周波数帯域における電力が、当該特定周波数帯域の両側周辺の他の周波数帯域における電力に対して、「極大」となるか否かを判定し、
特定周波数検出手段は、高群トーン及び低群トーンそれぞれについて、極大と判定された1つ以上の特定周波数帯域の中で、電力が最大となる特定周波数を検出し、
コード出力手段は、高群トーンで検出された特定周波数と、低群トーンで検出された特定周波数とに対応付けられたコードを出力することも好ましい。
【0021】
本発明の装置における他の実施形態によれば、
特定周波数検出手段は、
高群トーン及び低群トーンそれぞれについて、極大と判定された1つ以上の特定周波数帯域の中で、電力が最大となる特定周波数を選択すると共に、
高群トーン及び低群トーンそれぞれについて選択された各特定周波数帯域の電力値が所定閾値以上である場合にのみ、その特定周波数を検出することも好ましい。
【0022】
本発明の装置における他の実施形態によれば、
特定周波数検出手段は、
高群トーン及び低群トーンそれぞれについて、極大と判定された1つ以上の特定周波数帯域の中で、電力が最大となる特定周波数を選択すると共に、
高群トーン及び低群トーンそれぞれについて選択された各特定周波数帯域の電力値と、高群トーン及び低群トーンを合わせて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較し、その差が所定閾値以上である場合にのみ、その特定周波数を検出する
ことも好ましい。
【0023】
本発明の装置における他の実施形態によれば、
特定周波数検出手段は、
高群トーン及び低群トーンそれぞれについて、極大と判定された1つ以上の特定周波数帯域の中で、電力が最大となる特定周波数を選択すると共に、
高群トーンについて選択された特定周波数帯域の電力値と、高群トーンについて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較し、その差が所定閾値以上であって、
低群トーンについて選択された特定周波数帯域の電力値と、低群トーンについて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較し、その差が所定閾値以上である場合にのみ、その特定周波数を検出することも好ましい。
【0024】
本発明によれば、コード毎に特定周波数が予め割り当てられており、音声信号に含まれた特定周波数のコードを検出する装置に搭載されたコンピュータを機能させるプログラムにおいて、
コード毎に、当該特定周波数を含む特定周波数帯域が予め設定されており、
音声信号から、コード毎の各特定周波数帯域における周波数成分の電力を検出する周波数分析手段と、
コード毎の各特定周波数帯域の中で、当該特定周波数帯域における電力が、当該特定周波数帯域の両側周辺の他の周波数帯域における電力に対して、「極大」となるか否かを判定する極大判定手段と、
極大と判定された1つ以上の特定周波数帯域の中で、電力が最大となる特定周波数を検出する特定周波数検出手段と
検出された当該特定周波数に対応付けられたコードを出力するコード出力手段と
してコンピュータを機能させ、
前記特定周波数帯域、及び、当該特定周波数の両側周辺の他の周波数帯域は、サンプリング周波数に基づくフーリエ変換の周波数分解能である
ようにコンピュータを機能させることを特徴とする。
【0025】
本発明によれば、コード毎に特定周波数が予め割り当てられており、音声信号に含まれた特定周波数のコードを検出する装置を用いたトーン信号検出方法において、
コード毎に、当該特定周波数を含む特定周波数帯域が予め設定されており、
音声信号から、コード毎の各特定周波数帯域における周波数成分の電力を検出する第1のステップと、
コード毎の各特定周波数帯域の中で、当該特定周波数帯域における電力が、当該特定周波数帯域の両側周辺の他の周波数帯域における電力に対して、「極大」となるか否かを判定する第2のステップと、
極大と判定された1つ以上の特定周波数帯域の中で、電力が最大となる特定周波数を検出する第3のステップと、
検出された当該特定周波数に対応付けられたコードを出力する第4のステップと
を有し、
前記特定周波数帯域、及び、当該特定周波数の両側周辺の他の周波数帯域は、サンプリング周波数に基づくフーリエ変換の周波数分解能である
ことを特徴とする。
【発明の効果】
【0026】
本発明の装置、プログラム及び方法によれば、音声信号に混入した雑音の影響によって、送出されたDTMF信号以外の周波数成分で高い電力が検出される場合であっても、DTMF信号をできる限り検出することができる。
【図面の簡単な説明】
【0027】
図1】従来技術におけるDTMF信号検出器の機能構成図である。
図2】従来技術におけるDTMF信号の周波数成分に対する電力を表すグラフである。
図3】本発明におけるDTMF信号検出装置の機能構成図である。
図4】本発明における極大判定部の第1の判定を表す説明図である。
図5】本発明における極大判定部の第2の判定を表す説明図である。
図6】第1の特定周波数検出方法を表す説明図である。
図7】第2の特定周波数検出方法を表す説明図である。
図8】第3の特定周波数検出方法を表す説明図である。
図9】DTMF信号を用いた遠隔制御のシーケンス図である。
図10】本発明を用いた被制御側機器の機能構成図である。
【発明を実施するための形態】
【0028】
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
【0029】
図3は、本発明におけるDTMF信号検出装置の機能構成図である。
【0030】
図3によれば、DTMF信号検出装置1は、音声信号を入力し、その音声信号に含まれた特定周波数のコードを出力する。即ち、コード毎に特定周波数が予め割り当てられている。DTMF信号検出装置1は、周波数分析部11と、特定周波数毎の極大判定部12と、特定周波数検出部13と、コード出力部14とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現されるものであってもよい。また、これら機能構成の処理の流れは、DTMF信号検出方法としても理解できる。
【0031】
尚、以下では、DTMF信号検出装置として説明するが、本願発明は、「DTMF信号」への適用に限定されるものでもない。即ち、DTMF信号のように、コード毎に、互いに異なる複数の特定周波数が組み合わされたものではなく、コード毎に1つの特定周波数が対応付けられたものであってもよい。尚、「特定周波数」とは、当該コードに割り当てられた周波数を意味する。
【0032】
[周波数分析部11]
周波数分析部11は、音声信号から、コード毎の各特定周波数帯域における周波数成分の電力(パワー)を検出する。ここで、「特定周波数帯域」とは、コード毎に、当該特定周波数を含む周波数帯域であって、予め設定されるものである。例えば、サンプリング周波数8kHzの音声信号に対して512点の高速フーリエ変換を用いて分析した場合、その周波数分解能は15.625Hzとなる。即ち、特定周波数を含む15.625Hzが、特定周波数帯域となる。また、特定周波数帯域に加えて、極大判定部12で使用するその前後の周波数帯域の電力を検出する。即ち、周波数分析部11は、低群トーンの各特定周波数(697Hz、770Hz、852Hz、941Hz)と、高群トーンの各特定周波数(1209Hz、1336Hz、1477Hz、1633Hz)とを含む8種類の特定周波数帯域の電力値と、各特定周波数帯域両側周辺の周波数帯域の電力値とを、特定周波数毎の各極大判定部12へ出力する。尚、周波数分析方法としては、フーリエ変換によってパワースペクトルを算出する以外に、必要数分の帯域フィルタや、その他の周波数分析技術を用いてもよい。
【0033】
[極大判定部12]
極大判定部12は、特定周波数毎に設けられており、例えばDTMF信号の場合には8個設けられることとなる。極大判定部12は、当該特定周波数帯域における電力が、当該特定周波数帯域の両側周辺の他の周波数帯域における電力に対して、「極大」となるか否かを判定する。そして、判定結果(極大/非極大)と、極大と判定された場合の電力値とが、特定周波数検出部13へ出力される。これによって、雑音を含む音声信号であっても、非極大と判定された特定周波数は検出されず、DTMF信号以外の特定周波数の誤検出をできる限り削減することができる。
【0034】
また、極大判定部12は、DTMF信号の場合には、高群トーン及び低群トーンそれぞれについて、「極大」となるか否かを判定するものであってもよい。
【0035】
極大判定部12は、様々な極大判定が可能であって、以下では2つの具体的な判定方法について説明する。
<第1の極大判定方法>
図4は、本発明における極大判定部の第1の判定を表す説明図である。
【0036】
特定周波数を中心とする特定周波数帯域は、例えばサンプリング周波数8kHzの音声信号に対して512点の高速フーリエ変換を用いた場合、その周波数分解能は15.625Hzとなる。即ち、特定周波数fを含む周波数帯域中心として、15.625Hz低い周波数帯域の電力Pf-15.625、15.625Hz高い周波数帯域の電力Pf+15.625とを比較し、「極大」となるか否かを判定する。勿論、比較対象は、1つの周波数分解能分だけ離れた周波数帯域に限定されることなく、数個離れた周波数帯域の電力を比較するものであってもよい。
【0037】
極大判定部12は、当該特定周波数帯域における電力が、当該特定周波数帯域の両側周辺の他の周波数帯域における電力に対して、「極大」となるか否かを判定する。図4によれば、以下のように、少なくとも3点の周波数帯域における電力値が用いられる。
中心となる特定周波数fを含む帯域の電力:Pf
特定周波数fから所定値Δだけ低い第1の周波数を含む帯域の電力:Pf-Δ
特定周波数fから所定値Δだけ高い第2の周波数を含む帯域の電力:Pf+Δ
ここで、「極大」と判定されるには、以下の関係が成り立つことを要する。
f>Pf-Δ、且つ、Pf>Pf+Δ
尚、「特定周波数帯域」「他の周波数帯域」は、例えばスペクトル分析の帯域1つ分(又は数個分)であってもよい。
【0038】
<第2の極大判定方法>
図5は、本発明における極大判定部の第2の判定を表す説明図である。
【0039】
極大判定部12は、特定周波数fを含む帯域の電力Pfを中心として、Pf-Δ及びPf+Δに対する変化量が所定閾値以上である場合に、極大と判定する。ここでは、変化量を、特定周波数帯域の電力Pfに対するPf-Δ及びPf+Δそれぞれの差から算出する。
第1の閾値:θf-Δ
第2の閾値:θf+Δ
ここで、「極大」と判定されるには、以下の関係が成り立つことを要する。
(Pf−Pf-Δ)>θf-Δ、且つ、(Pf−Pf+Δ)>θf+Δ
これによって、特定周波数のパワースペクトルの変化が急峻でない場合、DTMF信号でないと判定する。即ち、パワースペクトルの変化が緩やかな場合、他の雑音の可能性が高いと判定する。
【0040】
[特定周波数検出部13]
特定周波数検出部13は、極大と判定された1つ以上の特定周波数の中で、電力が最大となる特定周波数を検出する。例えばDTMF信号の場合、高群トーン及び低群トーンからそれぞれ、電力が最大となる特定周波数が選択される。即ち、2つの特定周波数が検出される。尚、特定周波数検出部13は、極大と判定された特定周波数が無い場合、コード出力部14へ「特定周波数無し」を出力する。
【0041】
また、特定周波数検出部13は、電力が最大となる当該特定周波数について、その電力が所定閾値以上である場合にのみ検出するものであってもよい。これによって、DTMF信号が送出されていないにも拘わらず、雑音の影響によって電力が最大となる特定周波数を、できる限り選択しないようにすることができる。DTMF信号の電力レベルが既知の場合に、特に効果的である。
【0042】
特定周波数検出部13は、特定周波数の様々な検出が可能であって、以下では3つの具体的な検出方法について説明する。
<第1の特定周波数検出方法>
特定周波数検出部13は、以下の2つのステップを実行する。
(S11)高群トーン及び低群トーンそれぞれについて、極大と判定された1つ以上の特定周波数帯域の中で、電力が最大となる特定周波数を選択する。
(S12)高群トーン及び低群トーンそれぞれについて選択された各特定周波数帯域の電力値が所定閾値θH及びθL以上である場合にのみ、その特定周波数を検出する。例えば、以下のような関係が成立する。
maxx∈XLP(x)>θL XL={x∈TL | 周波数帯域xの電力が極大}
maxx∈XHP(x)>θH XH={x∈TH | 周波数帯域xの電力が極大}
L={697Hz, 770Hz, 852Hz, 941Hz}
H={1209Hz, 1336Hz, 1477Hz, 1633Hz}
max:複数の要素の中での最大値
θL:低群トーンにおける電力閾値
θH:高群トーンにおける電力閾値
【0043】
図6は、第1の特定周波数検出方法を表す説明図である。
【0044】
図6(a)によれば、高群トーン及び低群トーンそれぞれについて、所定閾値θH及びθL以上の電力の特定周波数が検出されている。そのために、結果的に1つのコードが検出される。一方で、図6(b)によれば、低群トーンについて、所定閾値θL以上の電力の特定周波数が検出されていない。そのために、結果的にコードは検出されない。
【0045】
<第2の特定周波数検出方法>
特定周波数検出部13は、以下の2つのステップを実行する。
(S21)高群トーン及び低群トーンそれぞれについて、極大と判定された1つ以上の特定周波数帯域の中で、電力が最大となる特定周波数を選択する。
(S22)高群トーン及び低群トーンそれぞれについて選択された各特定周波数帯域の電力値と、高群トーン及び低群トーンを合わせて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較し、その差が所定閾値θH及びθL以上である場合にのみ、その特定周波数を検出する。
P(FmaxL)−Pave >θL
maxL=argmaxx∈XLP(x)
XL={x∈TL | 周波数帯域xの電力が極大}
P(FmaxH)−Pave >θH
maxH=argmaxx∈XHP(x)
XH={x∈TH | 周波数帯域xの電力が極大}
ave=Σx∈FnotmaxP(x)/6
notmax={x∈TL∪TH|x≠FmaxLかつx≠FmaxH }
L={697Hz, 770Hz, 852Hz, 941Hz}
H={1209Hz, 1336Hz, 1477Hz, 1633Hz}
θL:低群トーンにおける電力閾値
θH:高群トーンにおける電力閾値
尚、ここで、P(x)は周波数帯域xの電力であり、「Pave=Σx∈FnotmaxP(x)/6」とは、DTMF信号の場合、高群トーンの中で最大電力値の特定周波数と、低群トーンの中で最大電力値の特定周波数とを除いた、他の6つの特定周波数帯域の電力の平均値Paveを意味する。
【0046】
図7は、第2の特定周波数検出方法を表す説明図である。
【0047】
図7(a)によれば、高群トーン及び低群トーンそれぞれについて選択された各特定周波数帯域の電力値と、高群トーン及び低群トーンを合わせて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較した差が所定閾値θH及びθL以上である。そのために、結果的に1つのコードが検出される。
一方で、図7(b)によれば、低群トーンから選択された特定周波数の電力値と、高群トーン及び低群トーンを合わせて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較した差が所定閾値θLよりも小さい。そのために、低群トーンについて特定周波数が検出されず、結果的にコードは検出されない。
【0048】
<第3の特定周波数検出方法>
特定周波数検出部13は、以下の2つのステップを実行する。
(S31)高群トーン及び低群トーンそれぞれについて、極大と判定された1つ以上の特定周波数帯域の中で、電力が最大となる特定周波数を選択する。
(S32)高群トーンについて選択された特定周波数帯域の電力値と、高群トーンについて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較し、その差が所定閾値θH以上であって、低群トーンについて選択された特定周波数帯域の電力値と、低群トーンについて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較し、その差が所定閾値θL以上である場合にのみ、その特定周波数を検出する。
P(FmaxL)−PaveL >θL
maxL=argmaxx∈XLP(x)
L={x∈TL|周波数帯域xの電力が極大}
aveL=Σx∈FnotmaxLP(x)/3
notmaxL={x∈TL|x≠FmaxL}
P(FmaxH)−PaveH >θH
maxH=argmaxx∈XHP(x)
H={x∈TH|周波数帯域xの電力が極大}
aveH=Σx∈FnotmaxHP(x)/3
notmaxH={x∈TH|x≠FmaxH}
L={697Hz, 770Hz, 852Hz, 941Hz}
H={1209Hz, 1336Hz, 1477Hz, 1633Hz}
θL:低群トーンにおける電力閾値
θH:高群トーンにおける電力閾値
尚、ここで「PaveL=Σx∈FnotmaxLP(x)/3」とは、DTMF信号の場合、低群トーンの中で、最大電力値の特定周波数帯域を除いた、他の3つの特定周波数帯域の電力の平均値PaveLを意味する。PaveHも、高群トーンについて同様である。
【0049】
図8は、第3の特定周波数検出方法を表す説明図である。
【0050】
図8(a)によれば、高群トーンについて選択された特定周波数帯域の電力値と、高群トーンについて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較した差が所定閾値θH以上である。また、低群トーンについて選択された特定周波数帯域の電力値と、低群トーンについて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較した差が所定閾値θL以上である。そのために、結果的に1つのコードが検出される。
一方で、図8(b)によれば、高群トーンについて選択された特定周波数帯域の電力値と、高群トーンについて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較した差は所定閾値θH以上である。しかしながら、低群トーンについて選択された特定周波数帯域の電力値と、低群トーンについて選択されなかったそれ以外の特定周波数帯域の平均電力値とを比較した差が所定閾値θLよりも小さい。そのために、低群トーンについて特定周波数が検出されず、結果的にコードは検出されない。
【0051】
[コード出力部14]
コード毎に、高群トーン及び低群トーンそれぞれについて、各特定周波数を中心とした特定周波数帯域が予め設定されている。ここで、コード出力部14は、検出された当該特定周波数に対応付けられたコードを出力する。DTMF信号の場合、コード出力部14は、高群トーンで検出された特定周波数と、低群トーンで検出された特定周波数との組み合わせに対応付けられたコードを出力する。
【0052】
図9は、DTMF信号を用いた遠隔操作のシーケンス図である。
【0053】
具体的な事例としては、ユーザが電話回線を介して被制御側端末1cを制御する場合を想定する。図9によれば、制御コードをDTMF信号に変換することによって、電話回線を介した遠隔操作を可能とする(例えば特許文献5参照)。DTMF信号を受信した通信端末は、そのDTMF信号から抽出した制御コードに基づいて、遠隔被操作用のアプリケーションの実行を制御する。
【0054】
音声呼としては、電話回線(携帯電話回線を含む)やパケット回線のいずれを介したものであってもよい。近年、携帯電話機やスマートフォンにおける端末は、複数の通信インタフェースを搭載し、用途に応じて使い分けることができる。電話回線の場合、アナログ信号帯域を用いて音声信号を送受信するのに対し、パケット回線の場合、デジタル信号帯域を用いてパケットを送受信するが、VoIP(Voice over Internet Protocol)を用いることによって音声通話も可能となる。
【0055】
(S1)制御側電話端末1aは、ユーザによって又は機械的に入力された制御コード要求(例えば”201”)を、DTMFの音声信号に変換する。DTMF信号の場合、信号送出時間とポーズ時間とからなる周期時間毎に1つのコードが割り当てられている。制御コード要求が”201”である場合、3つのコード(信号送出時間+ポーズ時間)が送出される。
信号送出時間:50ms以上
ポーズ時間 :80ms以上
周期 :120ms以上
(S2)そして、制御側電話端末1aは、そのDTMF信号を、音声呼を介して電話端末1bへ送信する。電話端末1bは、受信したそのDTMF信号をスピーカから発声し、被制御側機器1cは、マイクによってそのDTMF信号を受信する。
(S3)被制御側機器1cは、DTMF信号を一定周期(例えば10ms)毎に、コードを判定する。信号送出時間とポーズ時間との間に出力されたコードを複数個組み合わせて、1つの制御コードが決定されて出力される(例えば特許文献6及び7参照)。
(S4)被制御側機器1cは、その制御コードに基づく処理を実行する。
その後、制御コードについて順次、S1〜S4のシーケンスが繰り返し実行される。
【0056】
図10は、本発明を用いた被制御側機器の機能構成図である。
【0057】
図10によれば、端末1bは、例えば無線によって移動可能な携帯電話機やスマートフォンである。電話回線は、例えば携帯電話網や固定電話網であり、パケット回線は、例えばアクセスネットワークを介して接続されるインターネットである。端末1bは、相手方端末との間で音声信号を受信する一般的な電話端末であって、ユーザ同士が声で会話することができるものである。
【0058】
図10の端末1bは、ハードウェアとして、電話回線インタフェース1b1と、パケット回線インタフェース1b4と、スピーカ1b3と、マイク1b7とを有する。また、端末1bは、ソフトウェア的に、VoIP部1b5と、音声信号受信部1b2と、音声信号送信部1b6とを有する。VoIP部1b5は、リアルタイムに、音声信号を符号化/圧縮化してパケットに変換すると共に、パケットから復号/伸長化して音声信号に変換する。音声信号受信部1b2は、電話回線インタフェース1b1又はVoIP部1b5から音声信号を受信し、その音声信号をスピーカ1b3へ出力する。即ち、電話端末1bは、スピーカ1b3が、音声信号受信部1b2によって受信された音声信号をそのまま発声する。
【0059】
被制御側機器1cは、マイク1c7及び遠隔被制御アプリケーション1c8のみを有する。被制御側機器1cの機能構成は、本発明の基本的特徴のみを備えたものである。
【0060】
被制御側機器1cによれば、電話端末1bから発声されたその音声信号が、雑音と共に、被制御側機器1cのマイク1c7によって受信される。被制御側機器1cは、遠隔制御アプリケーション1c8のDTMF信号検出部1によって、その音声信号に含まれるDTMF信号のコードを検出する。即ち、制御側電話端末1aは、DTMF信号を用いて、電話端末1bを中継して、被制御側機器1cを制御することができる。被制御側機器1cとしては、家庭用電化製品やセンサ機器、通信用アクセスポイント等であってもよい。
【0061】
DTMF信号検出部1は、音声信号の中からDTMF信号を抽出する。そして、DTMF信号検出部1は、その周波数に対応する英数字を検出し、その英数字を制御コード実行部へ出力する。制御コード実行部は、検出されたコードに対応する制御を実行する。これによって、被制御側機器1cは、制御側電話端末1aから、電話端末1bを介して、音声信号を用いて遠隔制御を受け入れることができる。
【0062】
以上、詳細に説明したように、本発明の装置、プログラム及び方法によれば、雑音を含む音声信号であっても、コードに対応する特定周波数をできる限り検出することができる。特に音声信号に混入した雑音の影響によって、送出されたDTMF信号以外の周波数成分で高い電力が検出される場合であっても、DTMF信号をできる限り検出することができる。
【0063】
尚、特許文献1に記載の技術によれば、装置は、電話回線を介して受信されたDTMF信号をそのまま、スピーカから発声させ、その音声をマイクによって受信している。そのために、スピーカからマイクとの間のエアで、雑音の影響を受けることなる。雑音によってDTMF信号が乱れ、適切な制御コードに変換できないという問題が生じる。本発明のDTMF信号検出装置を適用することによって、オペレータから発信されたDTMF信号に雑音が含まれても、できる限り検出し、その遠隔制御が実行される。
【0064】
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0065】
1 DTMF信号検出器、DTMF信号検出部
11 周波数分析部
12 極大判定部
13 特定周波数検出部
14 コード出力部
1a 制御側電話端末
1b 被制御側電話端末
1c 被制御側機器
1b1 電話回線インタフェース
1b2 音声信号受信部
1b3 スピーカ
1b4 パケット回線インタフェース
1b5 VoIP部
1b6 音声信号送信部
1c7 マイク
1c8 遠隔被制御アプリケーション(制御コード実行部)
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10