(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5718251
(24)【登録日】2015年3月27日
(45)【発行日】2015年5月13日
(54)【発明の名称】分解されたオーディオ信号の再構成のためのシステムおよび方法
(51)【国際特許分類】
G10L 19/02 20130101AFI20150423BHJP
【FI】
G10L19/02 170Z
G10L19/02 160A
【請求項の数】17
【全頁数】15
(21)【出願番号】特願2011-544416(P2011-544416)
(86)(22)【出願日】2009年12月30日
(65)【公表番号】特表2012-514233(P2012-514233A)
(43)【公表日】2012年6月21日
(86)【国際出願番号】US2009006754
(87)【国際公開番号】WO2010077361
(87)【国際公開日】20100708
【審査請求日】2012年10月10日
(31)【優先権主張番号】12/319,107
(32)【優先日】2008年12月31日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】511001873
【氏名又は名称】オーディエンス,インコーポレイテッド
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(72)【発明者】
【氏名】アヴェンダノ,カーロス
(72)【発明者】
【氏名】ソルバッハ,ルドガー
【審査官】
金田 孝之
(56)【参考文献】
【文献】
米国特許第05956674(US,A)
【文献】
国際公開第2007/140003(WO,A2)
【文献】
特表2008−518257(JP,A)
【文献】
Kambiz Nayebi, et al.,Low delay FIR filter banks: design and evaluation ,IEEE Transactions on Signal Processing,米国,IEEE,1994年 1月,Vol.42, No.1,pp.24-31
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00−19/26
(57)【特許請求の範囲】
【請求項1】
分解されたオーディオ信号を再構成する方法であって:
複数の周波数サブバンド信号を含む分解されたオーディオ信号を、メモリに記憶された命令を実行するプロセッサによって受領する段階であって、前記複数の周波数サブバンド信号は:
第一周波数サブバンド信号、
前記第一周波数サブバンド信号から所定の時間遅れている第二周波数サブバンド信号、
前記第二周波数サブバンド信号から前記所定の時間遅れている第三周波数サブバンド信号および
前記周波数サブバンド信号のうち別のものからそれぞれ前記所定の時間遅れている追加的な周波数サブバンド信号を含む、段階と;
前記複数の周波数サブバンド信号を前記プロセッサによって二つ以上のグループにグループ分けする段階と;
前記二つ以上のグループのうちの少なくとも一つに対して遅延関数を前記プロセッサによって適用する段階であって、前記遅延関数は前記二つ以上のグループのうちの前記少なくとも一つのうちの各グループ内の周波数サブバンド信号を、ゼロ遅延を含む複数の遅延のうちの異なる遅延によって遅延させて、前記二つ以上のグループのうちの前記少なくとも一つのうちの各グループ内の周波数サブバンド信号が、当該グループ内の最大遅れ時間をもつ周波数サブバンド信号と整列されるようにするものである、段階と;
前記プロセッサによって諸グループを組み合わせてオーディオ信号を再構成する段階と;
該オーディオ信号を出力する段階とを含む、
方法。
【請求項2】
前記複数の周波数サブバンド信号のうちの少なくとも一つの周波数サブバンド信号の位相または振幅の一つまたは複数を前記プロセッサによって調整する段階をさらに含む、請求項1記載の方法。
【請求項3】
前記遅延関数が、少なくとも部分的に、音響心理学モデルに基づく、請求項1記載の方法。
【請求項4】
前記遅延関数を遅延テーブルを使って定義する段階をさらに含む、請求項1記載の方法。
【請求項5】
前記二つ以上のグループが重なり合わない、請求項1記載の方法。
【請求項6】
前記組み合わせることが、前記二つ以上のグループを足し合わせることを含む、請求項1記載の方法。
【請求項7】
分解されたオーディオ信号を再構成するシステムであって:
複数の周波数サブバンド信号を含む分解されたオーディオ信号を受領するよう構成された、メモリに記憶されプロセッサ上で実行される再構成モジュールを有しており、前記複数の周波数サブバンド信号は:
第一周波数サブバンド信号、
前記第一周波数サブバンド信号から所定の時間遅れている第二周波数サブバンド信号、
前記第二周波数サブバンド信号から前記所定の時間遅れている第三周波数サブバンド信号および
前記周波数サブバンド信号のうち別のものからそれぞれ前記所定の時間遅れている追加的な周波数サブバンド信号を含み、
前記再構成モジュールが、
前記複数の周波数サブバンド信号を二つ以上のグループにグループ分けするよう構成されたグループ分けサブモジュールと;
前記二つ以上のグループに対して遅延関数を適用するよう構成された遅延サブモジュールであって、前記遅延関数は前記二つ以上のグループの各グループ内の周波数サブバンド信号を、ゼロ遅延を含む複数の遅延のうちの異なる遅延によって遅延させて、前記二つ以上のグループの各グループ内の周波数サブバンド信号が、当該グループ内の最大遅れ時間をもつ周波数サブバンド信号と整列されるようにするものである、遅延サブモジュールと;
諸グループを組み合わせてオーディオ信号を再構成するよう構成された組み合わせサブモジュールと;
該オーディオ信号を出力するよう構成されたシンク・モジュールとを有する、
システム。
【請求項8】
前記再構成モジュールがさらに、前記複数の周波数サブバンド信号のうちの少なくとも一つの周波数サブバンド信号の位相または振幅の一つまたは複数を調整するよう構成された調整サブモジュールを有する、請求項7記載のシステム。
【請求項9】
前記遅延関数が、少なくとも部分的に、音響心理学モデルに基づく、請求項7記載のシステム。
【請求項10】
前記遅延関数が遅延テーブルを使って定義されている、請求項7記載のシステム。
【請求項11】
前記組み合わせサブモジュールがさらに、前記二つ以上のグループを足し合わせるよう構成されている、請求項7記載のシステム。
【請求項12】
メモリに記憶されプロセッサ上で実行され、前記分解されたオーディオ信号を与える高速蝸牛変換フィルタバンクをさらに有する、請求項7記載のシステム。
【請求項13】
メモリに記憶されプロセッサ上で実行され、前記分解されたオーディオ信号を与える線形位相フィルタバンクをさらに有する、請求項7記載のシステム。
【請求項14】
メモリに記憶されプロセッサ上で実行され、前記分解されたオーディオ信号を与える複素数値のフィルタバンクをさらに有する、請求項7記載のシステム。
【請求項15】
プログラムが具現されているコンピュータ可読媒体であって、前記プログラムは、プロセッサによって実行されて、分解されたオーディオ信号を再構成する方法であって:
複数の周波数サブバンド信号を含む分解されたオーディオ信号を受領する段階であって、前記複数の周波数サブバンド信号は:
第一周波数サブバンド信号、
前記第一周波数サブバンド信号から所定の時間遅れている第二周波数サブバンド信号、
前記第二周波数サブバンド信号から前記所定の時間遅れている第三周波数サブバンド信号および
前記周波数サブバンド信号のうち別のものからそれぞれ前記所定の時間遅れている追加的な周波数サブバンド信号を含む、段階と;
前記複数の周波数サブバンド信号を二つ以上のグループにグループ分けする段階と;
前記二つ以上のグループに対して遅延関数を適用する段階であって、前記遅延関数は前記二つ以上のグループの各グループ内の周波数サブバンド信号を、ゼロ遅延を含む複数の遅延のうちの異なる遅延によって遅延させて、前記二つ以上のグループの各グループ内の周波数サブバンド信号が、当該グループ内の最大遅れ時間をもつ周波数サブバンド信号と整列されるようにするものである、段階と;
諸グループを組み合わせてオーディオ信号を再構成する段階と;
該オーディオ信号を出力する段階とを含む、
方法を実行させることができる、コンピュータ可読媒体。
【請求項16】
前記複数の周波数サブバンド信号のうち各周波数サブバンド信号の位相または振幅の一つまたは複数を調整する段階をさらに含む、請求項15記載のコンピュータ可読媒体。
【請求項17】
前記遅延関数が、少なくとも部分的に、音響心理学モデルに基づく、請求項15記載のコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
〈関連出願への相互参照〉
本願は、一部継続出願であり、2006年5月25日に出願され、「オーディオ信号を処理するシステムおよび方法」という名称の米国特許出願第11/441,675号の優先権を主張するものである。該出願の開示はここに参照によって組み込まれる。
【0002】
〈発明の分野〉
本発明は、概括的にはオーディオ処理に関する。より詳細には、本発明は分解されたオーディオ信号を再構成することに関する。
【背景技術】
【0003】
現在のところ、信号を部分成分〔サブコンポーネント〕に分解する信号処理においてフィルタバンクが一般的に使われている。部分成分は別個に修正され、次いで修正された信号として再構成されてもよい。フィルタバンクのカスケードした性質のため、信号の部分成分は逐次的な遅れを有することがある。再構成のために部分成分を整列させ直すために、各部分成分に遅延を加えてもよい。よって、部分成分は最も大きな遅れをもつ部分成分と整列されうる。残念ながら、このプロセスは、修正された信号ともとの信号との間の、最低でもその最大の遅れに等しいレイテンシを導入する。
【発明の概要】
【発明が解決しようとする課題】
【0004】
たとえば遠隔通信のようなリアルタイムの用途では、過度なレイテンシは受け容れられないほどパフォーマンスを害する。第三世代パートナー・プロジェクト(3GPP: 3rd Generation Partner Project)によって規定されるような標準は、レイテンシが一定のレベル未満であることを要求する。レイテンシを短縮する努力において、従来技術のシステムでは、パフォーマンスを代償とする諸技法が開発されてきた。
【課題を解決するための手段】
【0005】
本発明の諸実施形態は、分解されたオーディオ信号を再構成するシステムおよび方法を提供する。例示的な実施形態では、分解されたオーディオ信号がフィルタバンクから受領される。分解されたオーディオ信号は、周波数の関数として逐次的にシフトされたグループ遅延をもつ複数のサブバンド信号を有していてもよい。複数のサブバンド信号は二つ以上のグループにグループ分けされてもよい。例示的な実施形態によれば、該二つ以上のグループは重なり合わなくてもよい。
【0006】
前記二つ以上のグループの少なくとも一つに対して遅延関数が適用されてもよい。例示的な実施形態では、前記遅延関数の適用は、前記二つ以上のグループのうちの少なくとも一つの中のサブバンド信号のグループ遅延を再整列させてもよい。いくつかの実施形態では、遅延関数は、少なくとも部分的に、音響心理学モデルに基づいていてもよい。さらに、遅延関数は遅延テーブルを使って定義されてもよい。
【0007】
次いで、諸グループが組み合わされてオーディオ信号を再構成してもよい。いくつかの実施形態では、前記複数のサブバンド信号のそれぞれの位相または振幅の一つまたは複数が調整されてもよい。組み合わせは、前記二つ以上のグループを足すことを含んでいてもよい。最後に、オーディオ信号が出力されてもよい。
【図面の簡単な説明】
【0008】
【
図1】本発明の諸実施形態を用いるシステムの例示的なブロック図である。
【
図2】例示的な再構成モジュールを詳細に示す図である。
【
図3】例示的な諸実施形態に基づく再構成モジュール内での信号フローを示す図である。
【
図5】再構成されたオーディオ信号の例示的な特性を示す図である。
【
図6】分解されたオーディオ信号を再構成するための例示的な方法のフローチャートである。
【発明を実施するための形態】
【0009】
本発明の諸実施形態は、分解されたオーディオ信号を再構成するシステムおよび方法を提供する。特に、これらのシステムおよび方法は、実質的にパフォーマンスを保持しつつ、レイテンシを軽減する。例示的な実施形態では、再構成に先立って、フィルタバンクから受領された信号の部分成分が諸グループに配置され、グループごとに不連続な仕方で遅延させられる。
【0010】
図1を参照するに、本発明の諸実施形態が実施されうる例示的なシステム100が示されている。システム100は、これに限られないが、携帯電話、補聴器、スピーカーホン、電話、コンピュータまたはオーディオ信号を処理する機能のある他の任意の装置など、いかなる装置であってもよい。システム100はまた、これらの装置のうち任意のもののオーディオ経路をも表しうる。
【0011】
例示的な実施形態では、システム100はオーディオ処理エンジン102、オーディオ源104、整形(conditioning)モジュール106およびオーディオ・シンク108を有する。オーディオ信号の再構成に関係しないさらなるコンポーネントがシステム100に設けられていてもよい。さらに、システム100は
図1の各コンポーネントから次のコンポーネントへのデータの論理的な進行を記述しているが、代替的な実施形態では、システム100の前記さまざまなコンポーネントが一つまたは複数のバスまたはその他の要素を介して結合されていてもよい。
【0012】
例示的なオーディオ処理エンジン102はオーディオ源104から受領された入力(オーディオ)信号を処理する。ある実施形態では、オーディオ処理エンジン102は、汎用プロセッサによって操作される、デバイスに記憶されたソフトウェアであってもよい。さまざまな実施形態において、オーディオ処理エンジン102は分解フィルタバンク・モジュール110、修正モジュール112および再構成モジュール114を有する。オーディオ処理エンジン102に、より多くの、より少ない、または機能的に等価なモジュールが設けられていてもよいことを注意しておくべきである。たとえば、モジュール110〜114のうちの一つまたは複数が少数のモジュールに組み合わされ、それでいて同じ機能を提供してもよい。
【0013】
オーディオ源104は、入力(オーディオ)信号を受領するいかなる装置であってもよい。いくつかの実施形態では、オーディオ源104はアナログ・オーディオ信号を受領するよう構成される。一例では、オーディオ源104は、アナログ‐デジタル(A/D)変換器に結合されたマイクロホンである。マイクロホンはアナログ・オーディオ信号を受領するよう構成され、A/D変換器が該アナログ・オーディオ信号をサンプリングして該アナログ・オーディオ信号をさらなる処理に好適なデジタル・オーディオ信号に変換する。他の例では、オーディオ源104はアナログ・オーディオ信号を受領するよう構成され、整形モジュール106が前記A/D変換器を含む。代替的な実施形態では、オーディオ源104はデジタル・オーディオ信号を受領するよう構成される。たとえば、オーディオ源104は、ハードディスクまたは他の形の媒体上に記憶されるオーディオ信号データを読み取る機能をもつ。さらなる実施形態は、他の形のオーディオ信号検知/捕捉装置を利用してもよい。
【0014】
例示的な整形モジュール106は入力信号を前処理(すなわち、入力信号の分解を必要としない任意の処理)する。ある実施形態では、整形モジュール106は自動利得制御を含む。整形モジュール106は誤り訂正およびノイズ・フィルタリングも実行してもよい。整形モジュール106は、オーディオ信号を前処理するための他のコンポーネントおよび機能を有していてもよい。
【0015】
分解フィルタバンク・モジュール110は受領された入力信号を複数の部分成分またはサブバンド信号に分解する。例示的な実施形態では、各サブバンド信号は周波数成分を表す。さまざまな実施形態によれば、分解フィルタバンク・モジュール110は多くの異なる型のフィルタバンクおよびフィルタを含んでいてもよい(
図1には示さず)。一例では、分解フィルタバンク・モジュール110は線形位相フィルタバンクを有していてもよい。
【0016】
いくつかの実施形態では、分解フィルタバンク・モジュール110は複数の複素値フィルタを含んでいてもよい。これらのフィルタは、二次およびより高次のフィルタに比べて計算コストを軽減するために、一次フィルタ(たとえば単一極、複素数値)であってもよい。さらに、これらのフィルタは、所望されるチャネル分解能を生じるよう設計されたカットオフ周波数をもつ無限インパルス応答(IIR: infinite impulse response)フィルタであってもよい。いくつかの実施形態では、これらのフィルタは、特定のサブバンド内の信号を抑制または出力するために、複素オーディオ信号に対して、多様な係数をもつヒルベルト変換を実行してもよい。他の実施形態では、これらのフィルタは高速蝸牛変換(fast cochlear transforms)を実行してもよい。さまざまな実施形態によれば、これらのフィルタは、一つのフィルタの出力がカスケード中で次のフィルタの入力となるフィルタ・カスケードに編成されていてもよい。カスケード中の諸フィルタの諸セットは、諸オクターブに分離されてもよい。これらのフィルタの出力がまとまって、オーディオ信号のサブバンド成分を表す。
【0017】
例示的な修正モジュール112は、分解フィルタバンク・モジュール110から、それぞれの分解経路上の各サブバンド信号を受領する。修正モジュール112は、それぞれの分解経路に基づいてサブバンド信号を修正/調整できる。一例では、修正モジュール112は、特定の分解経路上で受領されるサブバンド信号からのノイズを抑制する。別の例では、特定の分解経路から受領されるサブバンド信号が減衰され、抑制され、あるいは該サブバンド信号の不都合な部分をなくすためにさらなるフィルタを通されてもよい。
【0018】
再構成モジュール114は修正されたサブバンド信号を、出力のための再構成されたオーディオ信号に再構成する。例示的な実施形態では、再構成モジュール114は、再構成されたオーディオ信号の分解能を改善するために、再構成する間に、複素サブバンド信号に対して位相整列を実行し、振幅補償を実行し、複素部分を打ち消し、サブバンド信号の残りの実部分を遅延させる。再構成モジュール114は
図2との関連でより詳細に述べる。
【0019】
オーディオ・シンク108は再構成されたオーディオ信号を出力するための任意の装置を含む。いくつかの実施形態では、オーディオ・シンク108はアナログの再構成オーディオ信号を出力する。たとえば、オーディオ・シンク108はデジタル‐アナログ(D/A)変換器およびスピーカーを有していてもよい。この例では、D/A変換器は、オーディオ処理エンジン102からの再構成されたオーディオ信号を受け取り、それをアナログの再構成オーディオ信号に変換する。次いで、スピーカーが該アナログの再構成オーディオ信号を受け取って、出力することができる。オーディオ・シンク108は、これに限られないが、ヘッドホン、イヤホンまたは補聴器を含むいかなるアナログ出力装置を含むこともできる。あるいはまた、オーディオ・シンク108はD/A変換器と、外部オーディオ装置(たとえばスピーカー、ヘッドホン、イヤホン、補聴器)に結合されるよう構成されたオーディオ出力ポートとを有する。
【0020】
代替的な実施形態では、オーディオ・シンク108はデジタルの再構成オーディオ信号を出力する。たとえば、オーディオ・シンク108はディスク装置を有してもよく、再構成されたオーディオ信号はハードディスクまたは他の記憶媒体に記憶されてもよい。代替的な実施形態では、オーディオ・シンク108は任意的であり、オーディオ処理エンジン102は再構成されたオーディオ信号をさらなる処理(
図1には示さず)のために生成する。
【0021】
ここで
図2を参照するに、例示的な再構成モジュール114がより詳細に示されている。再構成モジュール114は、グループ分けサブモジュール202、遅延サブモジュール204、調整サブモジュール206および組み合わせサブモジュール208を有していてもよい。
図2は、さまざまなサブモジュールを含むものとして再構成モジュール114を記述しているが、再構成モジュール114にはより少数またはより多数のサブモジュールが含まれていてもよく、それでもさまざまな実施形態の範囲内である。さらに、再構成モジュール114のさまざまなサブモジュールは単一のサブモジュールに組み合わされてもよい。たとえば、グループ分けサブモジュール202と遅延サブモジュール204の機能が一つのサブモジュールに組み合わされてもよい。
【0022】
グループ分けサブモジュール202は、前記複数のサブバンド信号を二つ以上のグループにグループ分けするよう構成されていてもよい。例示的な実施形態では、各グループ内に具現されるサブバンド信号は隣り合う周波数帯からのサブバンド信号を含む。いくつかの実施形態では、グループどうしが重なり合ってもよい。すなわち、実施形態によっては、一つまたは複数のサブバンド信号が二つ以上のグループに含まれてもよい。他の実施形態では、グループどうしは重なり合わない。グループ分けサブモジュール202によって指定されるグループの数は、計算量、信号品質および他の考察に基づいて最適化されてもよい。さらに、各グループに含まれるサブバンドの数はグループによって変わってもよいし、各グループについて同一であってもよい。
【0023】
遅延サブモジュール204は、前記二つ以上のグループのうちの少なくとも一つに遅延関数を適用するよう構成されていてもよい。遅延関数は、前記二つ以上のグループに含まれる各サブバンド信号を遅延させる時間期間を決定してもよい。例示的な実施形態では、遅延関数は、前記二つ以上のグループのうちの少なくとも一つにおけるサブバンド信号のグループ遅延を再整列させるために適用される。遅延関数は、少なくとも部分的には、音響心理学モデルに基づいていてもよい。一般論として、音響心理学モデルは、オーディオ信号における位相偏移の知覚や人間の耳の感度など、音響現象の主観的または心理学的な側面を扱う。さらに、遅延関数は、
図3との関連でさらに述べるように、遅延テーブルを使って定義されてもよい。
【0024】
調整サブモジュール206は、前記サブバンド信号の位相または振幅のうちの一つまたは複数を調整するよう構成されていてもよい。例示的な実施形態では、これらの調整は再構成の間に生じるリプルを最小化してもよい。調整サブモジュール206によって、任意のサンプルについて位相および振幅が導出されてもよい。それにより、オーディオ信号の再構成は数学的により簡単にされる。このアプローチの結果として、任意のサンプルについての振幅および位相が、さらなる処理のためにすぐ利用可能となるのである。いくつかの実施形態によれば、調整サブモジュール206は、各サブバンド信号の虚部を、打ち消すまたは他の仕方で除去するよう構成される。
【0025】
組み合わせサブモジュール208は、諸グループを組み合わせてオーディオ信号を再構成するよう構成されていてもよい。例示的な実施形態によれば、サブバンド信号の実部が足し合わされて再構成されたオーディオ信号を生成する。しかしながら、代替的な実施形態では、オーディオ信号を再構成する他の方法が組み合わせサブモジュール208によって使用されてもよい。次いで、再構成されたオーディオ信号は、オーディオ・シンク108によって出力されたり、あるいはさらなる処理にかけられたりしてもよい。
【0026】
図3は、一例に基づく、再構成モジュール114内の信号フローを示す図である。本稿でさらに述べるように、図の左から右にかけて、サブバンド信号s
1〜s
nが受信され、グループ分けサブモジュール202によってグループ分けされ、遅延サブモジュール204によって遅延させられ、調整サブモジュール206によって調整され、組み合わせサブモジュール208によって再構成される。さまざまな実施形態によれば、サブバンド信号s
1〜s
nは分解フィルタバンク・モジュール110または修正モジュール112から受領されてもよい。
【0027】
グループ分けサブモジュール202によって受領されるサブバンド信号は、各サブバンド信号に関連付けられたプロットされた曲線によって示されるように、周波数の関数として逐次的にシフトされたグループ遅延をもつ。これらの曲線は、それぞれサブバンド信号s
1〜s
nについて時間τ
1〜τ
nを中心としている。サブバンド信号s
1に対して、逐次的な各サブバンド信号s
xは時間τ(s
x)=τ
x−τ
1だけ遅れる。ここで、x=2,3,4,…,nである。たとえば、サブバンド信号s
6はサブバンド信号s
1よりτ(s
6)=τ
6−τ
1だけ遅れる。遅れ時間τ(s
x)の実際の値は、さまざまな要因の一部を挙げると、どの型のフィルタが分解フィルタバンク・モジュール110に含められるか、フィルタがどのように配置されるか、およびサブバンド信号の総数に依存しうる。
【0028】
図3に描かれるように、グループ分けサブモジュール202はサブバンド信号を三つからなるグループにグループ化する。ここで、グループg
1、g
2、…、g
nはそれぞれ、サブバンド信号s
1〜s
3、サブバンド信号s
4〜s
6、…、サブバンド信号s
n-2〜s
nを含む。例示的な実施形態によれば、グループ分けサブモジュール202はサブバンド信号を何個のグループにグループ分けしてもよい。結果として、任意の所与の一つのグループに含められるサブバンド信号はいくつでもよく、グループどうしで同数のサブバンド信号を有する必要はない。さらに、グループどうしは重なり合っていてもよいし、重なり合わなくてもよく、グループは隣り合う周波数帯域からのサブバンド信号を含んでもよい。
【0029】
サブバンド信号s
1〜s
nがグループ分けサブモジュール202によってグループに分割されたのち、遅延サブモジュール204がサブバンド信号s
1〜s
nに遅延d
1〜d
nを適用してもよい。描かれるように、各グループに含まれるサブバンド信号は、グループ内で最大の遅れ時間τ(s
x)をもつサブバンド信号と整列されるよう遅延される。たとえば、サブバンド信号s
1およびs
2はサブバンド信号s
3と整列されるよう遅延させられる。サブバンド信号s
1〜s
nは表1に記載されるように遅延させられる。
【0030】
【表1】
図4は、例示的な遅延関数402を表示している。表1に記載されるように、遅延関数402は、サブバンド信号s
1〜s
3、サブバンド信号s
4〜s
6およびサブバンド信号s
n-2〜s
nにそれぞれ対応する遅延関数セグメント402a、遅延関数セグメント402bおよび遅延関数セグメント402cを有する。遅延関数セグメント402a〜402cは線形として描かれているが、さまざまな実施形態によれば、遅れ時間τ(s
x)の値に依存していかなる型の関数が適用されてもよい。
【0031】
サブバンド信号すべての完全な遅延補償のために、遅延関数404が呼び出されてもよいことを注意しておく。ここで、該遅延関数404は遅延関数402cに一致する。完全な遅延補償は、サブバンド信号s
1〜s
n-1をサブバンド信号s
nと整列されるよう遅延させるものである。
【0032】
再び
図3を参照するに、調整サブモジュール206はサブバンド信号s
1〜s
nに対して計算c
1〜c
nを実行してもよい。計算c
1〜c
nは、サブバンド信号s
1〜s
nの位相または振幅のうちの一つまたは複数を調整するために実行されてもよい。さまざまな実施形態によれば、計算c
1〜c
nは各サブバンド信号s
1〜s
nの、虚部の打ち消しとともに、位相および振幅の導出を含んでいてもよい。
【0033】
図3に描かれるように、組み合わせサブモジュール208は、サブバンド信号s
1〜s
nを組み合わせて、再構成された(reconstructed)オーディオ信号S
reconを生成する。例示的な実施形態によれば、サブバンド信号s
1〜s
nの実部が足し合わされて再構成されたオーディオ信号S
reconを生成する。最後に、再構成されたオーディオ信号S
reconが、オーディオ・シンク108などによって出力されたり、あるいはさらなる処理にかけられたりしてもよい。
【0034】
図5は、サブバンド信号の三つのグループから再構成された例示的なオーディオ信号の特性500を示している。特性500は周波数に対するグループ遅延502、周波数に対する大きさ504および時間に対するインパルス応答506を含んでいる。
【0035】
図6は、分解されたオーディオ信号を再構成する例示的な方法のフローチャート600である。フローチャート600によって記述される例示的な方法は、オーディオ処理エンジン102によって、あるいは後述するオーディオ処理エンジン内のモジュールまたはサブモジュールによって実行されてもよい。さらに、方法600のステップは、さまざまな順序で実行されたり、あるいは並行して実行されたりしてもよい。さらに、フローチャート600において記述される例示的な方法において、さまざまなステップが追加されたり、差し引かれたり、あるいは組み合わされたりしてもよく、それでも本発明の範囲内である。
【0036】
ステップ602では、分解されたオーディオ信号がフィルタバンクから受領される。ここで、分解されたオーディオ信号は、周波数の関数として逐次的にシフトされたグループ遅延をもつ複数のサブバンド信号を含む。逐次的にシフトされたグループ遅延の例は、
図3に示されるサブバンド信号s
1〜s
nに付随するプロットされた曲線によって例解されている。複数のサブバンド信号は再構成モジュール114によって、あるいはそこに含まれるサブモジュールによって受領されてもよい。さらに、複数のサブバンド信号は、さまざまな実施形態によれば、分解フィルタバンク・モジュール110または修正モジュール112から受領されてもよい。
【0037】
ステップ604では、複数のサブバンド信号が二つ以上のグループにグループ分けされる。例示的な実施形態によれば、グループ分けサブモジュール202がステップ604を実行してもよい。さらに、任意の所与の一つのグループに、複数のサブバンド信号のうちいくつが含められてもよい。さらに、さまざまな実施形態によれば、グループどうしが重なり合っていても、重なり合わなくてもよく、隣接周波数帯からのサブバンド信号を含んでいてもよい。
【0038】
ステップ606では、前記二つ以上のグループのうちの少なくとも一つに遅延関数が適用される。例示的な実施形態では、遅延サブモジュール204が、前記二つ以上のグループのうちの少なくとも一つに遅延関数を適用してもよい。
図3との関連で例解されたように、遅延関数は、複数のサブバンド信号の一部または全部のグループ遅延を再整列させるために、前記二つ以上のグループに含まれる各サブバンドを遅延させる時間期間を決定してもよい。一例では、複数のサブバンド信号は、前記二つ以上のグループのそれぞれの中のサブバンド信号のグループ遅延が、各グループにおいて最大の遅れ時間をもつサブバンド信号に揃えられるように遅延させられる。いくつかの実施形態では、遅延関数は、少なくとも部分的には、音響心理学モデルに基づいていてもよい。さらに、いくつかの実施形態において遅延関数を定義するために遅延テーブル(たとえば表1参照)が使用されてもよい。
【0039】
ステップ608では、これらのグループが組み合わされてオーディオ信号が再構成される。例示的な実施形態によれば、組み合わせサブモジュール208がステップ608を実行してもよい。いくつかの実施形態では、複数のサブバンド信号の実部が足し合わされてオーディオ信号を再構成してもよい。しかしながら、他の実施形態では、オーディオ信号を再構成するためのさまざまな方法が使用されてもよい。
【0040】
ステップ610では、オーディオ信号が出力される。いくつかの実施形態によれば、オーディオ信号はオーディオ・シンク108によって出力されてもよい。他の実施形態では、オーディオ信号はさらなる処理にかけられてもよい。
【0041】
上記のエンジン、モジュールおよびサブモジュールは、機械可読媒体(たとえばコンピュータ可読媒体)のような記憶媒体に記憶されている命令からなっていてもよい。該命令はプロセッサによって取得され、実行されてもよい。命令のいくつかの例は、ソフトウェア、プログラム・コードおよびファームウェアを含む。記憶媒体のいくつかの例は、メモリ・デバイスおよび集積回路を含む。命令は、プロセッサによって実行されたときに、本発明の諸実施形態に基づいて動作するようプロセッサに指令するよう機能する。命令、プロセッサおよび記憶媒体は当業者にはおなじみである。
【0042】
本発明について、例示的な実施形態を参照しつつ上記で記載してきた。当業者には、本発明の広義の範囲から外れることなく、さまざまな修正をなしてもよく、他の実施形態を使ってもよいことは明白であろう。したがって、例示的な実施形態に対するこれらおよびその他の変形は本発明によってカバーされることが意図されている。
いくつかの態様を記載しておく。
〔態様1〕
分解されたオーディオ信号を再構成する方法であって:
周波数の関数として逐次的にシフトされたグループ遅延をもつ複数のサブバンド信号を含む分解されたオーディオ信号を受領する段階と;
前記複数のサブバンド信号を二つ以上のグループにグループ分けする段階と;
前記二つ以上のグループのうちの少なくとも一つに対して遅延関数を適用する段階と;
諸グループを組み合わせてオーディオ信号を再構成する段階と;
該オーディオ信号を出力する段階とを含む、
方法。
〔態様2〕
前記複数のサブバンド信号のうちの少なくとも一つのサブバンド信号の位相または振幅の一つまたは複数を調整する段階をさらに含む、態様1記載の方法。
〔態様3〕
前記遅延関数を適用する段階が、前記二つ以上のグループのうちの少なくとも一つに含まれるサブバンド信号のグループ遅延を再整列させることを含む、態様1記載の方法。
〔態様4〕
前記遅延関数が、少なくとも部分的に、音響心理学モデルに基づく、態様1記載の方法。
〔態様5〕
前記遅延関数を遅延テーブルを使って定義する段階をさらに含む、態様1記載の方法。
〔態様6〕
前記二つ以上のグループが重なり合わない、態様1記載の方法。
〔態様7〕
前記組み合わせることが、前記二つ以上のグループを足し合わせることを含む、態様1記載の方法。
〔態様8〕
分解されたオーディオ信号を再構成するシステムであって:
周波数の関数として逐次的にシフトされたグループ遅延をもつ複数のサブバンド信号を含む分解されたオーディオ信号を受領するよう構成された再構成モジュールを有しており、前記再構成モジュールが、
前記複数のサブバンド信号を二つ以上のグループにグループ分けするよう構成されたグループ分けサブモジュールと;
前記二つ以上のグループのうちの少なくとも一つに対して遅延関数を適用するよう構成された遅延サブモジュールと;
諸グループを組み合わせてオーディオ信号を再構成するよう構成された組み合わせサブモジュールと;
該オーディオ信号を出力するよう構成されたシンク・モジュールとを有する、
システム。
〔態様9〕
前記再構成モジュールがさらに、前記複数のサブバンド信号のうちの少なくとも一つのサブバンド信号の位相または振幅の一つまたは複数を調整するよう構成された調整サブモジュールを有する、態様8記載のシステム。
〔態様10〕
前記遅延サブモジュールがさらに、前記二つ以上のグループのうちの少なくとも一つに含まれるサブバンド信号のグループ遅延を再整列させるよう構成されている、態様8記載のシステム。
〔態様11〕
前記遅延関数が、少なくとも部分的に、音響心理学モデルに基づく、態様8記載のシステム。
〔態様12〕
前記遅延関数が遅延テーブルを使って定義されている、態様8記載のシステム。
〔態様13〕
前記組み合わせサブモジュールがさらに、前記二つ以上のグループを足し合わせるよう構成されている、態様8記載のシステム。
〔態様14〕
前記分解されたオーディオ信号を与える高速蝸牛変換フィルタバンクをさらに有する、態様8記載のシステム。
〔態様15〕
前記分解されたオーディオ信号を与える線形位相フィルタバンクをさらに有する、態様8記載のシステム。
〔態様16〕
前記分解されたオーディオ信号を与える複素数値のフィルタバンクをさらに有する、態様8記載のシステム。
〔態様17〕
プログラムが具現されているコンピュータ可読記憶媒体であって、前記プログラムは、プロセッサによって実行されて、分解されたオーディオ信号を再構成する方法であって:
周波数の関数として逐次的にシフトされたグループ遅延をもつ複数のサブバンド信号を含む分解されたオーディオ信号を受領する段階と;
前記複数のサブバンド信号を二つ以上のグループにグループ分けする段階と;
前記二つ以上のグループのうちの少なくとも一つに対して遅延関数を適用する段階と;
諸グループを組み合わせてオーディオ信号を再構成する段階と;
該オーディオ信号を出力する段階とを含む、
方法を実行させることができる、コンピュータ可読記憶媒体。
〔態様18〕
前記複数のサブバンド信号のうち各サブバンド信号の位相または振幅の一つまたは複数を調整する段階をさらに含む、態様17記載のコンピュータ可読媒体。
〔態様19〕
前記遅延関数を適用する段階が、前記二つ以上のグループのうちの少なくとも一つに含まれるサブバンド信号のグループ遅延を再整列させることを含む、態様17記載のコンピュータ可読媒体。
〔態様20〕
前記遅延関数が、少なくとも部分的に、音響心理学モデルに基づく、態様17記載のコンピュータ可読媒体。