特許第6445417号(P6445417)IP Force 特許公報掲載プロジェクト 2015.5.11 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧
特許6445417信号波形推定装置、信号波形推定方法、プログラム
<>
  • 特許6445417-信号波形推定装置、信号波形推定方法、プログラム 図000006
  • 特許6445417-信号波形推定装置、信号波形推定方法、プログラム 図000007
  • 特許6445417-信号波形推定装置、信号波形推定方法、プログラム 図000008
  • 特許6445417-信号波形推定装置、信号波形推定方法、プログラム 図000009
  • 特許6445417-信号波形推定装置、信号波形推定方法、プログラム 図000010
  • 特許6445417-信号波形推定装置、信号波形推定方法、プログラム 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6445417
(24)【登録日】2018年12月7日
(45)【発行日】2018年12月26日
(54)【発明の名称】信号波形推定装置、信号波形推定方法、プログラム
(51)【国際特許分類】
   G10L 25/27 20130101AFI20181217BHJP
【FI】
   G10L25/27
【請求項の数】7
【全頁数】13
(21)【出願番号】特願2015-213739(P2015-213739)
(22)【出願日】2015年10月30日
(65)【公開番号】特開2017-83736(P2017-83736A)
(43)【公開日】2017年5月18日
【審査請求日】2017年12月11日
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】100121706
【弁理士】
【氏名又は名称】中尾 直樹
(74)【代理人】
【識別番号】100128705
【弁理士】
【氏名又は名称】中村 幸雄
(74)【代理人】
【識別番号】100147773
【弁理士】
【氏名又は名称】義村 宗洋
(72)【発明者】
【氏名】島内 末廣
(72)【発明者】
【氏名】大室 仲
【審査官】 菊池 智紀
(56)【参考文献】
【文献】 特開2008−58480(JP,A)
【文献】 特開2013−57895(JP,A)
【文献】 特開2015−49354(JP,A)
【文献】 特表2018−510374(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00−25/93
(57)【特許請求の範囲】
【請求項1】
隣接するフレーム同士が互いに一部重複するように分割された音響信号の各フレームの周波数領域の表現である各フレームの周波数領域信号のうち、現在のフレームの周波数領域信号と、前記現在のフレームに隣接する過去のフレームの周波数領域信号を取得して、前記取得した周波数領域信号の振幅を所定の値に置換する振幅置換部と、
前記振幅を置換した周波数領域信号を、時間領域の表現である時間領域信号に逆変換するIDFT部と、
前記逆変換による現在のフレームの時間領域信号と、前記逆変換による過去のフレームの時間領域信号の互いに重複する部分の波形を平均化する平均化部と、
前記平均化された時間領域信号を周波数領域信号に変換するDFT部と、
前記変換による周波数領域信号の振幅値が予め設定された範囲内にあるか、または前記逆変換と変換のセットが所定の回数以上実行されたか、の少なくとも何れかを判定基準として、前記変換による周波数領域信号の振幅値の収束、未収束を判定する収束判定部と、
前記判定の結果が未収束であった場合に、前記変換による現在のフレームの周波数領域信号を、前記現在のフレームの周波数領域信号として出力し、前記変換による過去のフレームの周波数領域信号を、前記過去のフレームの周波数領域信号として出力する繰り返し処理指示部と、
を含む信号波形推定装置。
【請求項2】
請求項1に記載の信号波形推定装置であって、
前記振幅置換部は、前記現在のフレーム、前記過去のフレームに加え、前記現在のフレームに隣接する未来のフレームの周波数領域信号を取得し、
前記平均化部は、前記現在のフレームと前記過去のフレームの時間領域信号の互いに重複する部分の波形の平均化に加え、前記現在のフレームと前記未来のフレームの時間領域信号の互いに重複する部分の波形を平均化し、
前記繰り返し処理指示部は、前記判定の結果が未収束であった場合に、前記現在のフレームと前記過去のフレームの周波数領域信号の出力に加え、前記変換による未来のフレームの周波数領域信号を、前記未来のフレームの周波数領域信号として出力する信号波形推定装置。
【請求項3】
請求項1または2に記載の信号波形推定装置であって、
前記分割された音響信号の各フレームに所定値を要素としたデータ系列を結合した拡大系列から得られる周波数領域信号を前記各フレームの周波数領域信号として取得する信号取得部と、
前記逆変換による時間領域信号のうち、前記拡大系列に含まれる前記データ系列に該当する要素の値を、前記データ系列が有する所定値に基づく値に置換する要素置換部をさらに含む
信号波形推定装置。
【請求項4】
請求項1から3の何れかに記載の信号波形推定装置であって、
前記逆変換による時間領域信号の所定の周波数以上の帯域について、所定の閾値以下の振幅値で出現した波形を抑圧する高周波数帯域抑圧部をさらに含む
信号波形推定装置。
【請求項5】
請求項1から4の何れかに記載の信号波形推定装置であって、
前記逆変換による時間領域信号のフレーム境界位置において所定の閾値以上の振幅値で出現した波形を抑圧するフレーム境界抑圧部をさらに含む
信号波形推定装置。
【請求項6】
信号波形推定装置が実行する信号波形推定方法であって、
隣接するフレーム同士が互いに一部重複するように分割された音響信号の各フレームの周波数領域の表現である各フレームの周波数領域信号のうち、現在のフレームの周波数領域信号と、前記現在のフレームに隣接する過去のフレームの周波数領域信号を取得して、前記取得した周波数領域信号の振幅を所定の値に置換するステップと、
前記振幅を置換した周波数領域信号を、時間領域の表現である時間領域信号に逆変換するステップと、
前記逆変換による現在のフレームの時間領域信号と、前記逆変換による過去のフレームの時間領域信号の互いに重複する部分の波形を平均化するステップと、
前記平均化された時間領域信号を周波数領域信号に変換するステップと、
前記変換による周波数領域信号の振幅値が予め設定された範囲内にあるか、または前記逆変換と変換のセットが所定の回数以上実行されたか、の少なくとも何れかを判定基準として、前記変換による周波数領域信号の振幅値の収束、未収束を判定するステップと、
前記判定の結果が未収束であった場合に、前記変換による現在のフレームの周波数領域信号を、前記現在のフレームの周波数領域信号として出力し、前記変換による過去のフレームの周波数領域信号を、前記過去のフレームの周波数領域信号として出力するステップと、
を含む信号波形推定方法。
【請求項7】
コンピュータを請求項1から5の何れかに記載の信号波形推定装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声、音響信号などの波形を推定して復元する信号波形推定装置、信号波形推定方法、プログラムに関する。
【背景技術】
【0002】
従来、与えられた情報や制約条件に基づき、所望の信号波形等を推定して復元する信号波形推定技術がある。当該技術においては、雑音等に埋もれた観測信号に基づいて復元が行われる場合や、観測信号が与えられていない状況で復元が行われる場合がある。
【0003】
短時間フーリエ変換(STFT)等による、信号波形の周波数領域の表現である時間t、周波数ωの複素数信号X(t,ω)(以下、周波数領域信号ともいう)の絶対値である振幅|X(t,ω)|のみが与えられたとき、複素数信号X(t,ω)=|X(t,ω)|exp(jΦ(t,ω))を得るために位相Φ(t,ω)が必要となる。この位相Φ(t,ω)を推定して周波数領域信号を生成し、STFTの逆変換(ISTFT)等を経て、対応する時間領域信号を推定することが知られている。
【0004】
上記の位相Φ(t,ω)を推定するための従来技術として、例えば非特許文献1がある。非特許文献1の信号波形推定方法では、まず、観測信号のSTFTに基づくか、あるいは所定の定数や乱数に基づき、推定すべき位相Φ(t,ω)の初期値を設定する。このとき、位相ではなく複素数信号X(t,ω)の初期値を設定することとしてもよい。初期値は、雑音に埋もれた観測信号等に基づいて設定してもよいし、あるいはランダムな値を設定してもよい。
【0005】
次に、与えた位相Φ(t,ω)の初期値と、予め設定された所定振幅値に基づいて、各時間t、周波数ωに対応した複素数信号X(t,ω)の推定値を得る。次に、逆STFT(ISTFT)を実行して、複素数信号(周波数領域信号)を時間領域信号に逆変換した後、再度STFTを実行して、時間領域信号を周波数領域信号に変換する。
【0006】
このとき、変換により再度生成した周波数領域信号(複素数信号)は、ISTFT前の周波数領域信号とは異なる値となる場合がある。これは、本来、時間領域信号をSTFTにより逆変換して得られる周波数領域信号の振幅と位相の関係とは異なる振幅と位相を組み合わせて、周波数領域信号を合成したことに起因する。この不整合は、再度STFTして得られた周波数領域信号の振幅値のみを所定の振幅値に置換し、置換済みの周波数領域信号について再度ISTFTおよびSTFTを実行する操作を繰り返すことで減少し、適切な位相値へと収束する。なお、上記の不整合を解消する位相値は、一意に決定されるとは限らない点に注意が必要である。しかし、収束値として得られる位相値によって合成される信号は、例えばそれが音声や音響信号の場合、不整合を有する位相から合成される信号と比較して、聴感品質が高くなる場合が多い。
【0007】
非特許文献1の信号波形推定方法は、対象とする信号全体の時間区間に渡り、STFTと逆STFTを繰り返すことが必要であるため、逐次的にオンラインで信号波形を推定して出力することはできず、信号全体を蓄積して処理するオフラインでの処理に用途が限定される。また、与える所定振幅値と、所望の信号から生成されるべき振幅値との間に誤差があった場合に、その誤差の影響は、信号全体に拡散してしまう問題がある。
【0008】
一方、非特許文献2では、上記の非特許文献1の逐次的処理が困難となる問題を解決する信号波形推定方法が示されている。この信号波形推定方法では、時刻tに対応したフレーム単位で、離散時間フーリエ変換(DFTまたはFFT)とその逆変換(IDFTまたはIFFT)を繰り返し、該当するフレームにおける推定波形をオンラインで出力できるようにしている。非特許文献2では、IDFTで得られた時間領域信号を、直前のフレームとの重なり部分について、過去の時間領域信号と合成した後にDFTを施すことで、IDFT前の周波数領域信号とは異なる周波数領域信号を得る。そしてこの不整合に基づき、所定振幅値を置換し、IDFT、重なり部分の合成、DFT、振幅値の置換を繰り返し実行することにより、位相成分を推定する。この方法は、単一フレーム内で、位相の推定処理を実現するため、オンライン処理に適しているが、過去の推定波形との合成に基づくため、推定誤差が過去から引き継がれていく問題が残る。例えば、観測信号に基づいて位相の初期値を設定する場合、現在のフレームのSN比が高く、良好な初期値が得られる場合であっても、過去のフレームとの整合が優先され、推定精度が限定される場合がある。
【先行技術文献】
【非特許文献】
【0009】
【非特許文献1】D. Griffin, J.S. Lim: “Signal estimation from modified short-time Fourier transform”, IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 32 , No 2, pp. 236-243, 1984.
【非特許文献2】Xinglei Zhu, L. Wyse:“Real-Time Signal Estimation From Modified Short-Time Fourier Transform Magnitude Spectra”, IEEE Transactions on Audio, Speech, and Language Processing, Vol. 15 , No 5, pp. 1645-1653, 2007.
【発明の概要】
【発明が解決しようとする課題】
【0010】
前述したように、非特許文献1の信号波形推定方法では、逐次的処理が困難となる問題があり、非特許文献2の信号波形推定方法では、推定誤差が過去から引き継がれていく問題があった。そこで本発明では、過去のフレームにおける推定誤差の影響を抑えながら、オンライン処理により推定波形を出力することができる信号波形推定装置を提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明の信号波形推定装置は、振幅置換部と、IDFT部と、平均化部と、DFT部と、収束判定部と、繰り返し処理指示部を含む。
【0012】
振幅置換部は、隣接するフレーム同士が互いに一部重複するように分割された音響信号の各フレームの周波数領域の表現である各フレームの周波数領域信号のうち、現在のフレームの周波数領域信号と、現在のフレームに隣接する過去のフレームの周波数領域信号を取得して、取得した周波数領域信号の振幅を所定の値に置換する。IDFT部は、振幅を置換した周波数領域信号を、時間領域の表現である時間領域信号に逆変換する。平均化部は、逆変換による現在のフレームの時間領域信号と、逆変換による過去のフレームの時間領域信号の互いに重複する部分の波形を平均化する。DFT部は、平均化された時間領域信号を周波数領域信号に変換する。収束判定部は、変換による周波数領域信号の振幅値が予め設定された範囲内にあるか、または逆変換と変換のセットが所定の回数以上実行されたか、の少なくとも何れかを判定基準として、変換による周波数領域信号の振幅値の収束、未収束を判定する。繰り返し処理指示部は、判定の結果が未収束であった場合に、変換による現在のフレームの周波数領域信号を、現在のフレームの周波数領域信号として出力し、変換による過去のフレームの周波数領域信号を、過去のフレームの周波数領域信号として出力する。
【発明の効果】
【0013】
本発明の信号波形推定装置によれば、過去のフレームにおける推定誤差の影響を抑えながら、オンライン処理により推定波形を出力することができる。
【図面の簡単な説明】
【0014】
図1】実施例1の信号波形推定装置の構成を示すブロック図。
図2】実施例1の信号波形推定装置の動作を示すフローチャート。
図3】実施例2の信号波形推定装置の構成を示すブロック図。
図4】実施例2の信号波形推定装置の動作を示すフローチャート。
図5】実施例3の信号波形推定装置の構成を示すブロック図。
図6】実施例3の信号波形推定装置の動作を示すフローチャート。
【発明を実施するための形態】
【0015】
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【実施例1】
【0016】
非特許文献2の信号波形推定方法では、周波数領域での拘束として、所定の振幅値への置換処理を施し、時間領域での拘束として、直前のフレームの推定値との波形の重ね合わせ(平均化)を施しながら、単一フレーム内で、DFT、IDFTを繰り返している。以下の実施例1〜3の信号波形推定方法では、注目するフレームの推定波形を得るにあたり、隣接するフレームの波形も同時に再推定することを特徴とする。
【0017】
以下、図1図2を参照して実施例1の信号波形推定装置の構成及び動作を説明する。図1は、本実施例の信号波形推定装置1の構成を示すブロック図である。図2は、本実施例の信号波形推定装置1の動作を示すフローチャートである。
【0018】
図1に示すように本実施例の信号波形推定装置1は、振幅置換部11と、IDFT部12と、平均化部13と、DFT部14と、収束判定部15と、繰り返し処理指示部16と、信号出力部17と、信号取得部18と、判定用閾値記憶部19を含む。
【0019】
図2に示すように、振幅置換部11は、隣接するフレーム同士が互いに一部重複するように分割された音響信号の各フレームの周波数領域の表現である各フレームの周波数領域信号(DFT複素数信号ともいう)のうち、現在のフレームの周波数領域信号と、現在のフレームに隣接する過去のフレームの周波数領域信号の初期値を、観測信号や、過去の推定信号に基づいて取得(生成)して、取得した周波数領域信号の振幅を所定の値に置換する(S11)。なお、周波数領域信号の初期値は、観測信号が得られない場合は、所定の定数や乱数に基づいて生成してもよい。なお、ステップS11における置換は、周波数領域信号が、各フレームに対応した所定の振幅値を取るように実行される。ステップS11における置換は、必ずしも、当該のDFT複素数信号の振幅が予め設定した所定の振幅値と完全に一致するようにする必要はなく、DFT複素数信号の現時点での振幅値と所定の振幅値との重み付き平均を取るような緩和的処理としてもよい。
【0020】
IDFT部12は、IDFTにより、振幅を置換した周波数領域信号を、時間領域の表現である時間領域信号に逆変換する(S12)。
【0021】
平均化部13は、逆変換による現在のフレームの時間領域信号と、逆変換による過去のフレームの時間領域信号の互いに重複する部分の波形を平均化する(S13)。
【0022】
例えば、現在のフレームと1ステップ過去のフレームが、50%の重なりを持つ場合に、現在のフレームと1つ過去のフレームについてIDFTにより得られた時間領域信号の系列をそれぞれ、x(t,n)、x(t-1,n) (n=1,…,N、Nはフレームのサンプル数)とすると、STFTにおける分析窓関数wa(n)と合成窓関数ws(n)とを用いて、x(t,n)の前半分は、
【0023】
【数1】
【0024】
x(t-1,n)の後半分は、
【0025】
【数2】
【0026】
でそれぞれ置き換えることが上記の平均化に相当する。
【0027】
DFT部14は、平均化された(平均化による拘束をかけた)各フレームの時間領域信号をDFTにより、再び周波数領域信号に変換する(S14)。
【0028】
収束判定部15は、変換による周波数領域信号の振幅値が予め設定された範囲内(例えばフレームごとに予め設定された所望の振幅値との誤差が所定値以内)にあるか、または逆変換と変換のセットが所定の回数以上実行されたか、の少なくとも何れかを判定基準として、変換による周波数領域信号の振幅値の収束、未収束を判定する(S15)。なお、判定に必要な範囲の情報や、回数の情報は、閾値として判定用閾値記憶部19に予め記憶されているものとする。
【0029】
繰り返し処理指示部16は、判定の結果が未収束であった場合に(S15−未収束)、変換による現在のフレームの周波数領域信号を、現在のフレームの周波数領域信号として出力し、変換による過去のフレームの周波数領域信号を、過去のフレームの周波数領域信号として出力する(S16)。出力された現在、過去のフレームの周波数領域信号は、振幅置換部11に入力され、ステップS11〜S15が再度実行され、S15−未収束である場合には、S16が再度実行される。
【0030】
一方、信号出力部17は、ステップS15における判定の結果が収束(すなわち、繰り返し処理が不要)である場合に(S15−収束)、上述の合成窓関数ws(n)を用いて、1つ過去のフレームまでに得られた時間信号と重ね合わせ、現時刻までの信号推定値を取得して出力する(S17)。信号出力部17は信号取得部18に、次フレームの信号取得要求を送信する。信号取得部18は、次フレームの周波数領域信号、次フレームに隣接する過去のフレームの周波数領域信号を取得する(S18)。
【0031】
本実施例の信号波形推定装置1によれば、オンラインで推定された信号波形を出力可能である。また、過去のフレームにおいて、観測信号のSN比が悪く、推定された信号波形の誤差が大きくなってしまった場合においても、現在のフレームにおける推定においては、その影響をほとんど受けることなく、信号波形の推定が可能となる。また、ステップS11の置換において、重みづけ平均などの緩和的処理を実行した場合には、所定の振幅値が誤差を含んでいる場合であっても、その影響を緩和し、頑健な推定が可能である。
【実施例2】
【0032】
以下、図3図4を参照して実施例2の信号波形推定装置の構成及び動作を説明する。図3は、本実施例の信号波形推定装置2の構成を示すブロック図である。図4は、本実施例の信号波形推定装置2の動作を示すフローチャートである。
【0033】
図3に示すように本実施例の信号波形推定装置2は、振幅置換部21と、IDFT部22と、平均化部23と、DFT部24と、収束判定部25と、繰り返し処理指示部26と、信号出力部17と、信号取得部28と、判定用閾値記憶部29を含む。
【0034】
以下、実施例1との相違点を中心に説明する。本実施例の振幅置換部21は、現在のフレーム、過去のフレームに加え、現在のフレームに隣接する未来のフレームの周波数領域信号を取得し、取得した周波数領域信号の振幅を所定の値に置換する(S21)。
【0035】
IDFT部22は、IDFTにより、振幅を置換した周波数領域信号(未来のフレームの信号を含む)を、時間領域の表現である時間領域信号に逆変換する(S22)。
【0036】
平均化部23は、現在のフレームと過去のフレームの時間領域信号の互いに重複する部分の波形の平均化に加え、現在のフレームと未来のフレームの時間領域信号の互いに重複する部分の波形を平均化する(S23)。
この場合、x(t,n)の後半分は、
【0037】
【数3】
【0038】
x(t+1,n)の前半分は、
【0039】
【数4】
【0040】
で置き換えることができ、現在のフレーム信号x(t,n)については、前後のフレームとの重なりにより、全ての要素について、隣接フレームとの平均化による拘束を課すことができる。
【0041】
DFT部24は、平均化された各フレームの時間領域信号(未来のフレームの信号を含む)をDFTにより、再び周波数領域信号に変換する(S24)。
【0042】
収束判定部25は、変換による周波数領域信号(未来のフレームの信号を含む)の振幅値が予め設定された範囲内にあるか、または逆変換と変換のセットが所定の回数以上実行されたか、の少なくとも何れかを判定基準として、変換による周波数領域信号(未来のフレームの信号を含む)の振幅値の収束、未収束を判定する(S25)。
【0043】
繰り返し処理指示部26は、判定の結果が未収束であった場合に、現在のフレームと過去のフレームの周波数領域信号の出力に加え、変換による未来のフレームの周波数領域信号を、未来のフレームの周波数領域信号として出力する(S26)。信号出力部17は、ステップS25における判定の結果が収束(すなわち、繰り返し処理が不要)である場合に(S25−収束)、上述の合成窓関数ws(n)を用いて、時間領域信号を重ね合わせ、現時刻までの信号推定値を取得して出力する(S17)。信号出力部17は信号取得部28に、次フレームの信号取得要求を送信する。
【0044】
信号取得部28は、次フレームの周波数領域信号、次フレームに隣接する過去、未来のフレームの周波数領域信号を取得する(S28)。
【0045】
本実施例の信号波形推定装置2によれば、実施例1の信号波形推定装置1と同様の効果を奏する。また、現在のフレームと未来のフレームの時間領域信号の互いに重複する部分の波形を平均化するという拘束を新たに追加したため、収束性能が改善され得る。
【実施例3】
【0046】
以下、図5図6を参照して実施例3の信号波形推定装置の構成及び動作を説明する。図5は、本実施例の信号波形推定装置3の構成を示すブロック図である。図6は、本実施例の信号波形推定装置3の動作を示すフローチャートである。
【0047】
図5に示すように本実施例の信号波形推定装置3は、振幅置換部11と、IDFT部12と、要素置換部31と、高周波帯域抑圧部32と、フレーム境界抑圧部33と、平均化部13と、DFT部14と、収束判定部15と、繰り返し処理指示部16と、信号出力部17と、信号取得部38と、判定用閾値記憶部19を含む。要素置換部31と、高周波帯域抑圧部32と、フレーム境界抑圧部33と、信号取得部38以外の構成要件については、実施例1と同様であるため、説明を割愛する。
【0048】
信号取得部38は、分割された音響信号の各フレームに所定値(例えばM個の零)を要素としたデータ系列を結合した拡大系列から得られる周波数領域信号を各フレームの周波数領域信号として取得する(S38)。例えば、信号取得部38は、時間領域信号の系列(N点の離散データ)に、M個の零を要素としたデータ系列を結合し、N+M点の離散点を持つ時間領域信号(拡大系列)を生成し、当該時間領域信号(拡大系列)を周波数領域信号に変換することで、各フレームの周波数領域信号を取得する。
【0049】
要素置換部31は、逆変換(S12)による時間領域信号のうち、拡大系列に含まれるデータ系列に該当する要素の値を、データ系列が有する所定値(例えばM個の零)に基づく値(データ系列が有する所定値に等しいか、当該所定値に近似する値)に置換する(S31)。該当する要素の値を強制的に所定値(例えば零)、あるいは十分に所定値に近似する値(所定値をゼロとした場合十分に小さい値)に置き換える処理は、平均化部13が実行するステップS13における拘束条件の追加に該当する。
【0050】
高周波数帯域抑圧部32は、逆変換による時間領域信号の所定の周波数以上の帯域について、所定の閾値以下の振幅値で出現した波形を抑圧する(S32)。これは、時間領域信号のスパース性に着目した拘束条件の追加に該当する。
【0051】
例えば、音声信号を対象とした場合、低域の周波数成分は、時間方向に広がりを持ち、連続的に出現する場合が多いのに対し、高域の周波数成分ではパルス性(断続的、散発的)の波形が観測されることが多く、時間方向に連続的に出現する場合はさほど多くない。
【0052】
そこで高周波数帯域抑圧部32は、時間領域信号の所定の周波数以上の高域の周波数成分について、所定の閾値以下の小さな振幅値を強制的に零に近づける非線形処理(抑圧処理)を施すことで、スパース性の強調された信号を取得することができ、それを低周波帯の信号と再び合成することで、推定波形の精度を改善することができる。
【0053】
次に、フレーム境界抑圧部33は、逆変換による時間領域信号のフレーム境界位置において所定の閾値以上の振幅値で出現した波形を抑圧する(S33)。
【0054】
これは、時間領域信号がDFT処理される際に適用される分析窓関数wa(n)の形状に相応しい信号かどうかに着目した拘束条件の追加に該当する。分析窓関数wa(n)は、一般に、フレームの中心付近が大きな値をとり、両端では小さな値を取る。フレーム境界抑圧部33は、IDFT(ステップS12)により出力された時間領域信号が、フレームの両端の位置(フレーム境界位置)で大きな値を取っていた場合は、その値を強制的に抑圧することで、新たな拘束条件を追加し、推定波形の精度を改善することができる。
【0055】
本実施例の信号波形推定装置3は、実施例1の構成に要素置換部31と、高周波帯域抑圧部32と、フレーム境界抑圧部33を追加して構成したが、これに限らず、実施例2の構成に要素置換部31と、高周波帯域抑圧部32と、フレーム境界抑圧部33を追加して装置を構成してもよい。また、要素置換部31、高周波帯域抑圧部32、フレーム境界抑圧部33は互いに独立な構成要件であってそれぞれ独立に拘束条件を追加する構成要件であるから、これらのうちの何れか一つの構成要件のみを実施例1、2の何れかの装置に追加することとしてもよいし、何れか二つの構成要件を実施例1、2の何れかの装置に追加することとしてもよい。また、これらの構成要件の適用順序を入れ替えてもよい。
【0056】
<発明の要点>
従来のオンラインでの信号波形推定技術では、過去の推定値との連続性の整合を拘束として課していたため、過去の推定値が大きな誤差を含むと、その影響がその先の推定に長く影響する問題があったが、本発明では、過去の推定値は、現在の推定の初期値として使うのみである。本発明では、現在のフレームに対応した信号波形を推定するにあたり、過去の隣接フレームについても同時に再推定するようにした。すなわち、本発明では、過去のフレームについて再推定した信号は実際の推定波形の合成には使用しない。このため、現在と過去フレームの両者が修正可能であるため、過去のフレームにおける推定誤差が現在のフレームに与える影響を直接受けることはない。
【0057】
周波数領域と時間領域のそれぞれに拘束を課しながら、周波数領域変換、逆変換を繰り返して信号を推定する手法自体は、従来から知られているものの、本発明ではさらに、周波数領域の拘束については、所定振幅値そのものではなく重み付き平均等の緩和的処理で置換することも拘束の範囲に含め(S11)、時間領域の拘束については、複数フレームの重なりを利用した同時拘束(S13)、所定値の要素の結合(S31)、スパース性の考慮(S32)、分析窓の影響の考慮(S33)を採用した。
【0058】
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
【0059】
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
【0060】
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
【0061】
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
【0062】
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
【0063】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
【0064】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0065】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0066】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
図1
図2
図3
図4
図5
図6