(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6805416
(24)【登録日】2020年12月8日
(45)【発行日】2020年12月23日
(54)【発明の名称】オーディオ信号に対するマスタリング改善
(51)【国際特許分類】
H03H 17/00 20060101AFI20201214BHJP
H03H 17/02 20060101ALI20201214BHJP
G11B 20/10 20060101ALI20201214BHJP
【FI】
H03H17/00 621G
H03H17/00 601G
H03H17/02 681G
G11B20/10 311
【請求項の数】17
【全頁数】17
(21)【出願番号】特願2017-529700(P2017-529700)
(86)(22)【出願日】2015年12月3日
(65)【公表番号】特表2018-503296(P2018-503296A)
(43)【公表日】2018年2月1日
(86)【国際出願番号】EP2015078513
(87)【国際公開番号】WO2016087583
(87)【国際公開日】20160609
【審査請求日】2018年11月26日
(31)【優先権主張番号】14196063.3
(32)【優先日】2014年12月3日
(33)【優先権主張国】EP
(31)【優先権主張番号】1421466.2
(32)【優先日】2014年12月3日
(33)【優先権主張国】GB
(73)【特許権者】
【識別番号】517416123
【氏名又は名称】エムキューエー リミテッド
(74)【代理人】
【識別番号】110001427
【氏名又は名称】特許業務法人前田特許事務所
(72)【発明者】
【氏名】ピーター グラハム クレイブン
(72)【発明者】
【氏名】スチュアート ジョン ロバート
【審査官】
志津木 康
(56)【参考文献】
【文献】
特開2008−252338(JP,A)
【文献】
欧州特許第00561881(EP,B1)
【文献】
米国特許出願公開第2009/0238380(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L13/00−13/10
G11B20/10−20/16
H03H17/00−17/08
(57)【特許請求の範囲】
【請求項1】
プリレスポンス周波数においてエネルギーを有するプリレスポンスの聴覚上の効果を低減する方法であって、
単位円の外の位置に位置する零点を含むz変換応答であって、前記単位円の外に位置する前記零点の前記位置の逆数である前記単位円内の位置における零点によってその位相応答が線形化されないz変換応答を有するデジタル非最小位相フィルタを用いて、デジタルオーディオ信号をフィルタリングすることによって、前記プリレスポンス周波数において群遅延を導入すること
を含む方法。
【請求項2】
プリレスポンス周波数においてエネルギーを有するプリレスポンスの聴覚上の効果を低減する方法であって、
単位円の外に位置する零点を含むz変換応答を有するデジタル非最小位相フィルタを用いて、デジタルオーディオ信号をフィルタリングすることによって、前記プリレスポンス周波数において群遅延を導入すること
を含み、
前記零点は、周波数0Hzにおけるよりも前記プリレスポンス周波数において、より大きい群遅延を発生するよう選択される、方法。
【請求項3】
前記デジタルオーディオ信号は、前記フィルタリングの前に前記プリレスポンスを含む、請求項1又は請求項2に記載の方法。
【請求項4】
前記フィルタリングは、前記デジタルオーディオ信号が、後続のアップサンプリングプロセスにおいて生成されるプリレスポンスを低減するよう処理する、請求項1〜3のいずれか1項に記載の方法。
【請求項5】
前記プリレスポンス周波数は、前記デジタルオーディオ信号のサンプリング周波数以下であるサンプリング周波数の半分に等しいナイキスト周波数の20%の範囲内に存在し、前記サンプリング周波数は、(i) 前記プリレスポンスを作ったプロセスのサンプリング周波数、(ii) 44.1kHz、(iii) 48kHz、(iv) 前記デジタルオーディオ信号のサンプリング周波数、及び(v) 前記デジタルオーディオ信号のサンプリング周波数の半分、から選択される
請求項1〜4のいずれか1項に記載の方法。
【請求項6】
前記デジタル非最小位相フィルタの前記z変換応答は、前記単位円の外にある少なくとも3つの零点を有し、それぞれの零点は、実部がマイナス0.5よりもより負である、z平面の逆数を有するよう選択され、zは、前記サンプリング周波数における1サンプリングの時間の進みを表現する、請求項5に記載の方法。
【請求項7】
前記デジタル非最小位相フィルタのz変換応答は、前記零点に対して逆数の位置において単位円内に位置する極を含み、前記極及び零点は、前記デジタル非最小位相フィルタの伝達関数においてオールパスファクタを作るように併せて選択される、請求項1〜6のいずれか1項に記載の方法。
【請求項8】
前記デジタル非最小位相フィルタのz変換応答は、1つ以上の零点及び1つ以上の極を含むことによって、零点及び極の組み合わせが0から16kHzの周波数範囲にわたって1dB以内の振幅応答を提供する、請求項1〜6のいずれか1項に記載の方法。
【請求項9】
前記零点は、前記プリレスポンス周波数よりも低い低周波数においてよりも、前記プリレスポンス周波数においてより大きな群遅延を作るよう選択される、請求項1に、又は請求項1に従属する請求項3〜8のいずれか1項に記載の方法。
【請求項10】
前記プリレスポンス周波数における前記群遅延は、前記低周波数における群遅延を、前記プリレスポンス周波数における少なくとも10周期分だけ超える、請求項9に記載の方法。
【請求項11】
前記低周波数は、500Hz以下である、請求項9又は請求項10に記載の方法。
【請求項12】
前記低周波数は、0Hzである、請求項11に記載の方法。
【請求項13】
プリレスポンス周波数において導入された前記群遅延は、前記デジタル非最小位相フィルタのインパルス応答の開始から、最も大きな絶対値を有するそのサンプリング値までの時間間隔を、前記プリレスポンス周波数における少なくとも10周期分だけ超える、請求項1に、又は請求項1に従属する請求項3〜8のいずれか1項に記載の方法。
【請求項14】
第1デジタルオーディオ信号を受け取り、分配のための第2デジタルオーディオ信号を作るよう構成されたマスタリングプロセッサであって、前記マスタリングプロセッサは、請求項1〜13のいずれか1項に記載の方法を実行するよう構成されることによって、リスナーに聴取されるよう前記第2デジタルオーディオ信号から生成された信号中のプリレスポンスの聴感上の効果を低減するマスタリングプロセッサ。
【請求項15】
デジタルオーディオ信号を受け取るよう構成された入力を有する消費者機器であって、前記消費者機器は、前記受け取られたデジタルオーディオ信号を請求項1〜13のいずれか1項に記載の方法に従って処理するよう構成される消費者機器。
【請求項16】
請求項1〜13のいずれか1項に記載の方法によって処理されたデジタルオーディオ信号を伝達する記録媒体。
【請求項17】
信号プロセッサによって実行されたときに、前記信号プロセッサに請求項1〜13のいずれか1項に記載の方法を実行させる命令を含むコンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、消費者によって聴かれる改善された音質のための商用配信の前のオーディオ信号の処理に関し、特にプリレスポンス(pre-responses)の聴感上の効果を低減することに関する。
【背景技術】
【0002】
1995年頃までは、コンパクトディスク(CD)の44.1kHzのサンプリングレートは、たいていの人には全く十分だとみなされていた。1995年から、「ハイレゾ」の動きは、96kHz、192kHz、又はそれより高いサンプリング周波数を採用し、40kHz、80kHz又はそれより広いオーディオ帯域幅を潜在的に可能にした。帯域幅拡張に聴感上のメリットがなぜ存在しなければならないのかについては、常にちょっとした難題であったが、それはCDのサンプリングレートである44.1kHzは、人間の聴力の一般に受け入れられている上限周波数である、20kHzまでのオーディオ周波数のほぼ完全な再生を可能とするからである。
【0003】
より優れた時間解像度は、見かけの逆説についての可能な説明として発達してきており、J.R. Stuart及びP.G. CravenによるA Hierarchical Approach to Archiving and Distribution” presented at the Audio Engineering Society Convention, Los Angeles, 11th October 2014 [AES preprint no. 9178]という最近の論文は、この考えを説明し、この見方を支持するいくつかの神経科学の文献を引用している。
【0004】
この見方によれば、録音及び再生のチェーンのインパルス応答は、なるべく時間についてコンパクトであるべきである。実験によれば、可聴のプリレスポンスは、特に望ましくなく、上で引用された文献は、なぜこれが問題になり得るかについての議論を呈する。
【0005】
44.1kHzで記録される多くの既存の録音は、一般には44.1kHz出力を提供するオーバーサンプリングアナログ/デジタル変換器を用いてなされるか、又はそれらは、より高いサンプリングレートでなされた録音から明示的にダウンサンプリングされている。いずれの場合においても、フィルタリングが要求され、リニアフェーズフィルタリングを用いるのがより良いと近年までは一般に考えられていた。残念ながら、リニアフェーズフィルタリングは、常にプリレスポンスを伴う。
【0006】
88.2kHz又はそれより高いサンプリングレートでなされた録音の場合、プリレスポンスは、Craven, P.G., “Antialias Filters and System Transient Response at High Sample Rates” J. Audio Eng. Soc. Volume 52 Issue 3 pp. 216-242; March 2004.において記載されるように、「アポダイジング」によって低減され得る。
【0007】
典型的には88.2kHzでサンプリングするシステムは、40kHz又はいくらかわずかにより高い周波数において急峻にカットするアンチエイリアスフィルタを有することになる。この論文で提案された解決法は「アポダイズする」ことであり、すなわち、20kHz又はわずかにそれより高い所から緩やかに始まり、約40kHzにおいてゼロになるよう徐々に下がっていくようにフィルタリングすることである。よって40kHzより上の急峻なバンドエッジは無害にされるが、これは、アポダイジングフィルタが、リンギング又はプリレスポンスを引き起こすであろう周波数における信号エネルギーを除去したからである。アポダイジングフィルタそのものからプリレスポンス及び/又はポストレスポンスがいくらかは残るものの、これは時間的にずっと短くなり得るが、それは、20kHzから40kHzまでの、その遷移帯域がずっと広いからである。
【0008】
44.1kHzの録音については、この状況はずっと悪くなる。これら録音については、20kHzまで平坦な応答をもち、それからナイキスト周波数である22.05kHzにおいて実質的にゼロになるよう急峻にカットするダウンサンプリング又はアンチエイリアスフィルタを用いるのが理想的であると一般に考えられてきた。よってアポダイジングフィルタが15kHzのようなより低い周波数で減少を始める(これが受容されるとは一般には考えられない)ことをしない限り、アポダイジングフィルタが応答を緩やかに減少させて、急峻なカットのフィルタの周波数でゼロにすることは可能ではなかった。20kHzにおいてロールオフが始まるフィルタによって音を改善することが可能なこともあるが、一般には、そのように制約を受けたアポダイザー(apodiser)は、ある帯域端を同じくらい急峻であるが、わずかに低い周波数の帯域端に単に置き換えることになるというおそれがある。
【発明の概要】
【発明が解決しようとする課題】
【0009】
したがって必要とされるのは、特に、44.1kHzのような比較的低いサンプリングレートで記録された又は伝送される信号のための、プリレスポンスの不要な聴感上の効果を最小化する改良された、又は代替の技術である。
【課題を解決するための手段】
【0010】
発明者は、プリレスポンスの可聴性は、直接的にプリレスポンスの振幅を低減することを試みるのではなく、非最小位相零点を用いて、プリレスポンスが最もエネルギーを有する周波数において群遅延を導入することによって低減され得ることに気付いた。
【0011】
よって、本発明の第1の局面によれば、プリレスポンス周波数においてエネルギーを有するプリレスポンスの聴覚上の効果を低減する方法が提供され、前記方法は、単位円の外に位置する零点を含むz変換応答を有するデジタル非最小位相フィルタを用いて、デジタルオーディオ信号をフィルタリングすることによって、前記プリレスポンス周波数において群遅延を導入することを含む。
【0012】
このような零点は、一般に、0Hzにおける、又は0Hzの近傍の低い周波数におけるよりもプリレスポンス周波数においてより大きな群遅延を作るために用いられ得る。零点は、従来の線形位相フィルタリングにおいて起こるような、単位円内の逆数の位置における他の零点とペアになされるべきではないが、それはそのようなペアリングは、零点によって提供される位相変化を線形化してしまい、プリレスポンス周波数の近傍におけるさらなる遅延を提供する手段としては効果的ではなくなるからである。
【0013】
単位円の外の零点は、「最大位相」要素をフィルタの伝達関数に導入し、結果として生じる群遅延は、それによってプリレスポンスを遅延させ、インパルス応答の主ピークに対するその時間進みが低減され、プリレスポンスはよってより聴感上少なくなる。このような零点が数個、協働して機能することで、時間進みはゼロにまで低減され得て、又は負にされ得て、よってプリレスポンスは、ポストレスポンスに変換され得て、これは聴感上より小さい。
【0014】
アーカイブから取得された信号は、プリレスポンスを既に含み得るが、この場合、本発明は既存のプリレスポンスを遅延させる。代替として、又は追加として、本発明は、後続の処理動作においてプリレスポンスの発生を引き起こし得る信号周波数要素を遅延させるためにプリエンプティブに用いられ得る。その場合、本発明によるフィルタリングは、プリレスポンスを引き起こす信号周波数要素をプリエンプティブに遅延させ、信号の低い周波数要素に対してプリレスポンスを遅延させる。線形フィルタリングは、可換な演算なので、2つの状況は、数学的に同一である。
【0015】
典型的には、プリレスポンスは、サンプリングレートの変化に関連して実行されるフィルタリング演算によって引き起こされ、ふつうは、「レファレンス」サンプリングレートに対応する「レファレンス」ナイキスト周波数のすぐ下の周波数において急峻なカットのフィルタを適用し、ここで「レファレンス」サンプリングレートとは、関係するサンプリングレートの中でより低いものである。それによってプリレスポンスは、前記レファレンスナイキスト周波数の20%の範囲内に主に位置するエネルギーを有することが期待され得る。
【0016】
本方法は、多くのz平面上の零点を有するフィルタを用いて実行され得るが、発明者らは、単位円の外に3つしか零点を有しないフィルタを用いて顕著な聴感上の優位性がしばしば得られることを見出したのであり、それぞれの零点は上述の群遅延特性を有する。具体的にはもし「z」が、ナイキスト周波数の2倍に等しいサンプリング周波数における1サンプリング点の時間進みを表現するなら、フィルタは、その実部がそれぞれ−0.5よりもより負である逆数を有する、少なくとも3つのz平面上の零点を有するのが好ましい。
【0017】
ある実施形態においては、本発明の方法は、より高い周波数からダウンサンプリングされた信号に適用される。その場合、適切なレファレンスサンプリングレートは、通常、デジタルオーディオ信号のサンプリング周波数である。
【0018】
本方法は、既に2倍にアップサンプリングされた信号、又は代替として後で2分の1にダウンサンプリングされる信号に適用すると便利なことがある。その場合、レファレンスサンプリングレートは、通常、デジタルオーディオ信号のサンプリング周波数の半分である。
【0019】
ますますコンテンツは、96kHzのような「2倍」のサンプリングレートで伝送のためにマスタリングされてきているが、そのようなコンテンツは、しばしば異種のソースからミックスされており、その中には44.1kHz又は48kHzのような「1倍」のレファレンスサンプリングレートにおいて録音され、又は処理されている。オーディオミックスのこれら要素は、対応するレファレンスナイキスト周波数22.05kHz又は24kHzにおいて、又はそのわずかに下において、エネルギーをもつプリレスポンスを含み得る。したがって96kHzでサンプリングされた信号は、そのようなプリレスポンスと共に、信号のナイキスト周波数である48kHzのわずかに下のエネルギーを有する、さらなるプリレスポンスを有し得る。そのような場合には、本発明に従って単位円の外に適切に配置されたさらなる零点を用いて、プリレスポンスの両方のグループを扱うのが優位性を持ち得る。もちろん、もし「1倍」のレファレンスサンプリングレートが信号のサンプリングレートとは明らかには区別されないなら、この二重処理は関係が少なくなり、「1倍」のプリレスポンスが信号のナイキスト周波数の60%を超えない周波数を有する場合に集中することが賢明かもしれない。
【0020】
ナイキスト周波数に近いz平面零点は、ナイキスト周波数の近傍において著しく落ち込む振幅応答を作ることになる。振幅応答は、z平面で逆数位置における極も組み入れることによって完全にフラットにされ得て、零点及び極の組み合わせは、フィルタの伝達関数においてオールパスファクタを形成する。
【0021】
代替として、振幅応答は、零点よりもわずかに低い周波数を有する極を追加することによって、より低い周波数においてフラットにされ得て、極は、0から16kHzのような耳にとって重要な周波数範囲にわたって1dBのような公差内でフラットな振幅応答を提供するよう構成される。
【0022】
第1局面のフィルタリング方法によって作られる遅延は、500Hz又は0Hzのようなより低い比較周波数における遅延であり得る、又は代替としてフィルタのインパルス応答における最も大きいピークに対する遅延であり得る「レファレンス遅延」との比較によって特徴付けられ得る。通常、プリレスポンス周波数における遅延は、有限のマージンだけ、例えばプリレスポンス周波数における10サイクルだけ、レファレンス遅延を超える。20kHz近くのプリレスポンスについては、これは0.5msのマージンになる。
【0023】
本発明の第2の局面によれば、第1デジタルオーディオ信号を受け取り、分配のための第2デジタルオーディオ信号を作るよう構成されたマスタリングプロセッサが提供され、前記マスタリングプロセッサは、本発明の第1の局面の方法を実行するよう構成されることによって、リスナーに聴取されるよう前記第2信号から生成された信号中のプリレスポンスの聴感上の効果を低減する。
【0024】
よって、第1の局面の方法は、アーカイブからオーディオ「トラック」を受け取り、商用リリースの前にそれらを調整するマスタリングプロセッサによって実行される。しばしば、アーカイブ内のトラックは、プリレスポンスを有し、本方法は、このプリレスポンスを遅延させることによってそれらの聴感上の効果を低減させる。マスタリングプロセッサは、リスナーの装置においてアップサンプリング又はダウンサンプリングによって作られたプリレスポンスをプリエンプティブに遅延させることもできる。
【0025】
本発明の第3の局面によれば、デジタルオーディオ信号を受け取るよう構成された入力を有する消費者機器であって、前記消費者機器は、前記受け取られたデジタルオーディオ信号を本発明の第1の局面の方法に従って処理するよう構成される。
【0026】
このようにして、家庭リスニング用に設計された機器は、第1の局面の方法を実行することによって、本発明に従ってマスタリングされていない既存のCD及び他のソースからの音質を改善し得る。本機器は、本方法を実行することによって、プリレスポンスを発生し得るデジタル・アナログ変換の前にデジタルオーディオ信号を予め調整することもできる。
【0027】
本発明は、ADC又はDACの中に組み込まれたカスタムロジックのようなハードウェアで実現され得て、又はソフトウェアでも実現され得て、又はこれらの組み合わせで実現され得ることに注意されたい。
【0028】
本発明の第4の局面によれば、第1の局面の方法によって処理されたデジタルオーディオ信号を伝達する記録された媒体が提供される。このような記録は、最小の潜在的プリレスポンスを有し、及び/又はそうでなければ再生時に可聴性であるプリレスポンスの発生を遅延させる。
【0029】
本発明の第5の局面によれば、信号プロセッサによって実行される時に、第1の局面の方法を信号プロセッサに実行させる命令を含むコンピュータプログラム製品が提供される。
【0030】
このようなプログラム製品は、本発明のマスタリングの振る舞いを実行するデジタルシグナルプロセッサ(DSP)を実現し得る。代替として、プログラム製品は、既存のDSPにアップグレードを実現し得て、このアップグレードは、既存のDSPが本発明のマスタリングの振る舞いを実行することを可能にする。同様のアップグレードは、エンドユーザーの消費者機器の処理能力に対して提供され得る。実際、本発明は、携帯電話等のためのソフトウェアの「アプリ」において、又はそれのためのアップグレードにおいて実現され得る。本発明を実現できるようにそのようなアップグレードを既存の機器に「レトロフィット」できることは、特に優位性のある特徴である。
【0031】
当業者には理解されるように、本発明は、オーディオ信号中のプリレスポンスの聴感上の効果を低減させる方法及び装置を提供し、これらは、オーディオ信号中の既存のプリレスポンスの聴感上の効果を低減するというコンテキストにおいて、及び/又は後続の処理によって導入されるプリレスポンスを予期してプリエンプティブな機能を施すことによって、これを行う。プリレスポンスは、デジタルの非最小位相フィルタを採用することによって実効的に遅延され、このフィルタは、そのz変換応答における単位円の外に位置する零点を含む。さらなる変化形及び修飾形は、本開示に照らせば当業者には明らかになろう。
【図面の簡単な説明】
【0032】
本発明の例は、添付の図面を参照して詳述される。
【
図1】全体の記録及び再生チェーンを概略的に示す。
【
図2】88.2kHzから44.1kHzへダウンサンプリングするときのAdobe ‘Audition 1.5’によって用いられるフィルタの遷移帯域(実線)と、CDを再生するときのArcam FMJ DV139プレーヤーの遷移帯域(破線)とを示す。
【
図3A】時間軸が88.2kHzのサンプリングレートにおけるサンプリング周期を参照する、
図2のAdobeのダウンサンプリングフィルタのインパルス応答(上側グラフ)と、
図2のArcamの再構築フィルタのインパルス応答(下側グラフ)とを示す。
【
図3B】
図3AのAdobeのプリレスポンスのさらなる詳細を示す。
【
図3C】
図3AのAdobeのプリレスポンスの一部のスペクトラムを示す。
【
図4A】3次のIIRローパスフィルタの極及び零点を示す。
【
図4C】Arcamのインパルス応答(上側グラフ)と、
図4Aの3次のIIRローパスフィルタによって処理されたArcamのインパルス応答(下側グラフ)とを示し、いずれも5倍に伸長された垂直スケールでプロットされている。
【
図5A】
図4Bと同じ周波数応答を有する最大位相3次IIRローパスフィルタの極及び零点を示す。
【
図5B】
図4Aの3次IIRローパスフィルタによって(上側グラフ)、及び
図5Aの最大位相フィルタによって(下側グラフ)前処理がされたArcamのインパルス応答を示し、いずれも10倍に伸長された垂直スケールでプロットされている。
【
図6A】
図5Aのフィルタと同じ零点を有するオールパスフィルタの極及び零点を示す。
【
図6B】
図3Aに示されるArcamのインパルス応答(上側グラフ)、及び
図6Aのオールパスフィルタによって前処理されたArcamのインパルス応答(下側グラフ)を示し、いずれも5倍に伸長された垂直スケールでプロットされている。
【
図7A】12次のオールパスフィルタの極及び零点のほとんどを示し、零点の2つはプロットの範囲外である。
【
図7B】Adobe ‘Audition 1.5’のダウンサンプリングフィルタのインパルス応答(上のグラフ)、Adobe ‘Audition 1.5’のダウンサンプリングフィルタの後にArcamの再構築フィルタを設けたインパルス応答(真ん中のグラフ)、及びAdobe ‘Audition 1.5’のダウンサンプリングフィルタの後に
図7Aの12次オールパスフィルタを置き、その後にArcamの再構築フィルタを設けたインパルス応答(下のグラフ)。
【
図8】
図7Aの12次のオールパスフィルタ(実線)及び
図6Aの3次のオールパスフィルタ(破線)の群遅延を示し、縦軸は88.2kHzのサンプリングレートにおけるサンプリング周期で較正されている。
【
図9】z=−1.5における単一の零点、すなわち半径1.5及び周波数22.05kHz(実線)、及び半径1.5及び周波数20kHz,16kHz,及び11.025kHzにおける零点の共役対(破線)のサンプリング周期における群遅延を示す。
【
図10A】より高いサンプリングレートにおける動作のために改変された、
図7Aのオールパスフィルタの極及び零点のほとんどを示し、零点のうちの2つは、プロットの範囲外にある。
【
図10B】サンプリングレート88.2kHzで動作されたときの、
図10Aのオールパスフィルタのサンプリング周期における群遅延(τ)を示す。
【発明を実施するための形態】
【0033】
図1は、音がマイクロフォン1によってキャプチャされ、アナログ・デジタル変換器(ADC)2によってデジタル形式に変換され、結果として生じる信号がアーカイブ3中に記録される、例示的な記録及び再生チェーンを示す。しばらくした後、信号は、アーカイブから取り出され、サンプリングレート変換器(SRC)4を通り得て、さらに処理(P1)5がなされてから、コンパクトディスク(CD)のような物理的媒体を介して、又はラジオ放送又はインターネット伝送のような無形媒体によってリスナーに配信される(6)。
【0034】
リスナーの装置7,8,9は、デジタル・アナログ変換器(DAC)8及びヘッドホン又はスピーカのようなトランスデューサ9を含み、オプションとしてさらに処理(P2)7を含む。
【0035】
後述するように、本発明による処理は、マスタリング装置5内のP1として、又はリスナーの受信装置7内のP2として提供され得る。両方の場合において、ADC2又はSRC4によって、又はリスナーのDAC8によって生成されたプリリング(pre-rings)が扱われる。実現例によっては、本発明の処理は、両方の場所において提供され得る。さらに実現例によっては、本発明による処理は、もし存在するならSRCの前に、又はアーカイブの前においてさえ、提供され得る。
【0036】
CDは、サンプリングレート44.1kHzを使用し、1980年代及び1990年代を通して多くの会社が全ての記録チェーンを44.1kHzで運用し、加えて44.1kHzでアーカイブを行い、その結果、SRC4は使用されなかった。最近では、ADC及びアーカイブを、44.1kHz,88.2kHz,176.4kHz,192kHz,又は1ビット「DSD」記録のための2.8224MHzのようなより高いレートで行なう傾向があり、よってサンプリングレート変換器4の必要が生じ、これは、別個のハードウェア又はデジタルオーディオワークステーション(DAW)のソフトウェアの一部のいずれかであり得る。
【0037】
サンプリングレート変換は、必要なフィルタリングのせいで、プリレスポンスを生成する強い可能性を有する。この問題は、全てのチェーンを44.1kHzで運用することによっても回避されないが、それは、44.1kHz出力を提供するたいていの商用ADCは、内部的にはより高い周波数で動作し、それからサンプリングレート変換プロセスを使用して所望の出力サンプリングレートを提供するからである。
【0038】
サンプリングレート変換については、さまざまなアーキテクチャが知られており、その選択は、関係する周波数が2:1のような単純な倍数比であるか、又は48:44.1のようなより「複雑な」比であるかのような要因に依存する。しかしエイリアスのない44.1kHzへのダウンサンプリングは、20kHzより上をかなり急峻にカットするローパスフィルタを常に要求する。フィルタの形状についての要件は、ソース信号のサンプリング周波数にはクリチカルには依存しない。これは、任意の新しいサンプリングレートにアップサンプリングすることにもあてはまる。よってダウンサンプリング及びアップサンプリング/再構築は、ダウンサンプリングするときの「アンチエイリアス」フィルタとして、又はアップサンプリングするときの「再構築」フィルタとして知られるデジタルローパスフィルタについての要件を生む。2つのフィルタについての技術的要件は、必ずしも大きくは異ならない。
【0039】
オーディオを44.1kHzにダウンサンプリングするとき、又は44.1kHzからアップサンプリングするときに、ローパスフィルタが、22.05kHzで90dBのような実質的な「ストップバンド」減衰を提供すべきか、又は88.2kHzで動作し、22.05kHzで6dBの減衰、及び24.1kHzまでに完全な減衰を提供するよう構成される「ハーフバンド」のようなフィルタを使用することが許容されるかについては意見が分かれている。歴史的には、ハードウェアトランスバーサル(「FIR」)の実現例におけるタップの個数を最小化するために、フィルタの遷移帯域を許容可能だと考えられる程度に広くすることがふつうだった。よって遷移帯域は、例えば20kHzから22.05kHzの約2kHzの幅、又は例えば20kHzから24.1kHzの約4kHzの幅だった。より最近のソフトウェアの実現例はずっと狭い遷移帯域を提供してきており、例えば、最近の「Adobe Audition CS 5.5」DAWは、ナイキスト周波数の約75Hz下から始まり、約100Hzの幅の帯域を有するSRC機能を提供する。
【0040】
おそらくより典型的なのは、21.5kHzから始まる約500Hz幅の遷移帯域を有するフィルタを提供するそれより前の「Adobe Audition 1.5」DAWである。多くの商業的に発行された録音は、処理のどこかの段階でこのようなフィルタが使用されたかもしれないことを示唆するナイキスト付近のノイズスペクトラムを呈する。
図2は、44.1kHzのCDを再生する時の、Adobeフィルタの遷移帯域、及びArcam製の定評のある「万能の」ディスクプレーヤーのアナログ出力の遷移帯域を示す。Arcamの応答は、ナイキスト周波数において約6dB下であり、これは、「ハーフバンド」フィルタを使用して最初に1:2のアップサンプリングが実行されたかもしれないことを示唆している。遷移帯域の他のグラフは、現在、http://infinitewave.ca/resources.htmにおいてアクセス可能である「Sample Rate Conversion Comparison Project」において示されている。
【0041】
Adobe及びArcamのインパルス応答は、
図3Aに示され、それぞれは、ほぼナイキスト周波数でのプリリンギング及びポストリンギングを有する。Adobeフィルタは、そのより狭い遷移帯域から予想されるように、より長いプリリンギング及びポストリンギングを有する。詳細に吟味すれば、Arcamの応答は、2つの垂直な線によって区切られた領域の外側では実質的にゼロであることがわかり、これは、44.1kHzから88.2kHzへの第1アップサンプリングが、88.2kHzでの約107サンプリング周期の長さを有するFIRフィルタを使用して実行されたことを示唆する。
【0042】
Adobeのプロットは、実際、44.1kHzのストリームにおける単一のインパルスを、「プリ/ポストフィルタ」及び「クオリティ=999」のオプションを選択し、88.2kHzにアップサンプリングする時の「Adobe Audition 1.5」の出力である。調べると、Auditionを使用して88.2kHzから44.1kHzへダウンサンプリングする時には、内部的に同じフィルタが使用されることがわかる。
図3Bでは、プリレスポンスの遠く離れた「末端」においては、「うなり」現象が見られ、
図3Cでは、末端を窓フーリエ変換すると、遷移帯域の2つのエッジにほぼ対応する、2つの別個の周波数21.5kHz及び22.05kHzが見られる。
【0043】
よってAuditionフィルタのプリリンギングを除去するためには、ダブルノッチフィルタの適応があるかもしれないが、これはAudition 1.5 SRCに特有であろう。我々は、より一般化された方法を必要とするが、これは、音楽のアーカイブは、さまざまな、ひょっとすると知られていない装置を使用してなされた、及び/又はダウンサンプリングされた44.1kHzの録音を含み得るからである。
【0044】
フィルタリングによるプリレスポンス抑圧
プリレスポンスが20kHz−22.05kHzの範囲のエネルギーを有し得ると仮定すれば、一つのアプローチは、この周波数範囲を減衰させることである。以下のz変換応答
【数1】
を有する3次IIRフィルタは、44.1kHzのサンプリングレートで動作させると20kHz−22.05kHzの領域を20dBだけ減衰させる。このIIRフィルタは、
図4Aに示されるように極(バツ)及び零点(円)を有し、
図4Bに示される周波数応答を有する。
図4Cは、単一のインパルスに対するArcamの応答と、上のフィルタを使用して前処理されたインパルスに対するArcamの応答とを示す。この処理は、より大きなポストレスポンス及び18kHzでの1dBの周波数応答のドループを犠牲にして、大幅にプリレスポンスを低減したことがわかるだろう。
【0045】
本発明によれば、プリレスポンスは、上に示された最小位相フィルタを、対応する以下の最大位相フィルタによって置き換えることによって、さらに低減され得る。
【数2】
【0046】
図5Aに示されるように、このフィルタは、同じ極を有するが、零点は単位円の外に有する。周波数応答は、
図4Bに示される応答と変わらない。
図5Bは、縦軸のスケールを10倍に拡大して2つの応答を比較しているが、最大位相フィルタは、メインパルスの直前の下への振れを最小位相フィルタに対して4dB低減し、他のプリレスポンスを6dB以上低減することを示している。
【0047】
単位円の外に零点があることで、単位円の中の極を調節することによって、オールパスフィルタを作ることができるようになる。
【数3】
この極及び零点は
図6Aに示される。このフィルタは、ゼロからナイキスト周波数までのフラットな周波数応答、すなわち権威者によっては非常に望ましいと考えるであろう特性を有する。
図6Bは、このフィルタが、プリレスポンスの周波数においては減衰を提供しないが、プリレスポンスを大きく低減できることを示す。
【0048】
プリレスポンスのより強力な抑圧は、以下の12次のオールパスフィルタによって提供される。
【数4】
この極及び零点は
図7Aに示される。
【0049】
図7Bを参照して、上のグラフは、「Adobe Audition 1.5」フィルタだけのインパルス応答を示し、真ん中のグラフは、
図1に示されるもののような信号チェーンをモデル化すべくArcam FMJ DV139のプレーヤーの応答において折り返す。中心のピークから離れたリンギング(rings)は、Auditionフィルタの鋭い遷移帯域に起因し、Arcam応答における折り返し(folding)は、
図7Bではあまりに小さく目では見えないが、そのナイキスト周波数における6dBまでの減衰によってそれらをわずかに低減する。
【0050】
図7Bの下のグラフは、44.1kHzの信号を上の12次のオールパスフィルタで処理することの効果を含む。プリレスポンスは、ほとんど完全に除去されている。この処理は、多くの商業的に発行された録音に対して、実質的な可聴の改善を提供することがわかっている。
【0051】
図8は、
図6A(3次)及び
図7A(12次)のオールパスフィルタの群遅延を示す。プリレスポンスのスペクトルエネルギーが主に20kHzより上に存在することを
図3Cから思い出せば、
図8のプロットは、これらオールパスフィルタの働きは、プリレスポンスを遅延させることであり、よってそれらをポストレスポンスに変換することであることを強く示唆する。
【0052】
プリレスポンス遅延を測定するためには、レファレンスが必要だが、これは、信号全体のあまり大きくはない遅延ならオーディオの質に影響を与えないからである。耳にとっては、レファレンスとして、フィルタリングされたインパルス応答又はフィルタリングされたエンベロープ応答の最も高いピークを用いることができると推測する人がいるかもしれない。実際には、低いオーディオ周波数ではなく、20kHzの近傍においてより大きな群遅延をそれぞれ有する非最小位相零点が、有用であることがわかる。周波数0Hzにおける群遅延は、数学的によく定義されていることに注意されたい。11.025kHz−22.1kHzの範囲にわたる群遅延対さまざまな周波数を有する非最小位相零点の周波数は、
図9にプロットされる。0Hz近傍の群遅延は、負であることがわかるだろう。
【0053】
図7Aを再び参照して、原点に最も近い2つの極のペア、すなわち−0.12±0.06i及び−0.4±0.16i(ここでi=√(−1))において、逆数の位置におけるこれらの対応する零点のペア
1/(−0.12±0.06i)=−6.46±3.43i、
及び
1/(−0.4±0.16i)=−2.15±0.87i
は、低い可聴周波数における群遅延に対して、20kHz近傍の群遅延にはほとんど寄与しないと推測され得る。実際、これら4つの零点及び4つの極は、削除され得るが、前記相対群遅延に5%しか影響を与えず、フィルタの複雑さを33%も減らし得ることが計算で確認される。
【0054】
よってオールパスフィルタの場合に、ナイキスト周波数近傍のプリレスポンスを遅延させるのに最も有用なのは、その実部が−0.5よりもより負である極と併せて、それらに対応する零点である。オールパスではないフィルタの場合に重要なのは零点であり、これは、零点は、対応する極が存在しなくても、有用な減衰を提供し得るからである。よって一般的には、プリレスポンスを低減するのに最も有用であるのは、その逆数が単位円の中に存在し、その実部が−0.5よりもより負である零点である。
【0055】
場合によっては、指数的に上昇する包絡線をもつ正弦波を入力することによって、フィルタリング装置における非最小位相零点の存在を推定することが可能である。例えば、
図6Aで提示されたフィルタの場合、それぞれのサンプリング周期で1.045倍に増加する包絡線をもつ20.2kHzの周波数における正弦波は、−1.0086+0.2723iにおける零点により、理論的にはゼロ出力をつくるはずである。
【0056】
もちろんそのようなテスト信号は、過負荷を引き起こさないために、制限された期間しか持ち得ず、処理遅延が減衰であると誤認されないよう注意がなされなければならない。適切なテスト信号は、非常に小さい振幅から始まり、増大する正弦波の終わりにおいて時刻レファレンスとしてインパルスを含むものであり得る。テストには、その信号に対する応答を、同じ周波数ではあるが一定の振幅をもつ正弦波に対する応答と比較することを含み得る。しかしこのようなやり方で、単位円から遠く離れた外にある零点についてテストすることは、実際的ではなく、他の零点と非常に近い零点の場合は、信号対ノイズ比の困難さがあるかもしれない。困難な場合は、代替として、チャープ励起のような手法を用いて精密に装置のインパルス応答をキャプチャし、それから求根アルゴリズムをインパルス応答に適用してもよい。
【0057】
図1に示された状況においては、本発明による処理は、マスタリング装置5内にP1として、又はリスナーの受信装置7内にP2として配置され得る。いずれの場合にも、SRC4によって又はリスナーのDAC8によって生成されたプリリンギングが処理される。
図7Bは、両方のデバイスからのプリリンギングが単一の動作において効果的に抑圧され得る実証を提供する。新しいレコーディングがリリースされるときは、全てのリスナーの利益のために処理をP1に配置することは自明であろう。しかしP2に配置することは、処理されていない録音を含む媒体6のコレクションを既に持っているかもしれないリスナーには値打ちがある。
【0058】
この処理は、48kHzに近い周波数を有するプリリンギングを含み得る96kHzのようなサンプリング周波数における「ハイレゾ」録音のためにも有用であることもわかっている。同じフィルタアーキテクチャ及び係数が用いられ、しかし96kHzでクロックが与えられることによって、44kHzから48kHzの範囲における周波数での、大きな群遅延が達成される。
【0059】
上記とは別個に、場合によっては、既にアップサンプリングされている信号を処理することが必要となるが、それは例えば、定格では88.2kHz又は96kHzの商業的に利用可能な録音が、時としてそれぞれ44.1kHz又は48kHzからアップサンプリングされていて、それによって20kHzよりわずかに上でプリレスポンスを含むという証拠がある。処理のために提示された信号のサンプリング周波数と、プリリンギングを作った、又はその後に作るプロセスに関連する「レファレンス」サンプリング周波数とを区別しなければならない場合においては、処理することが望ましい。「z変換」についても同様の注意が必要となる。すなわち、実現のためには、「z」は、処理のために提示された信号の1つのサンプリングの時間の進みを表現しなければならないが、零点の位置に関して前述された基準は、プリレスポンスを作った又はこれから作るプロセスの1つのサンプリング周期を表現する「z」を想定する。
【0060】
レファレンスサンプリング周波数が、信号のサンプリング周波数の半分である場合については、既に提示された改良型フィルタへの適切な改変は、zをz
2によって通して置き換え、よってz
2はz
4によって置き換えられる。したがって
図7Aに示される極及び零点は、
図10Aに示されるものによって置き換えされて、もし信号のサンプリングレートが88.2kHzであるなら、
図8に実線で示される群遅延は、
図10Bで示されるように22.05kHzについての折り返しによって延長される。
【0061】
このように改変されたフィルタは、代替として、奇数サンプリング点及び偶数サンプリング点からそれぞれなるサブストリームの別個の処理によって実現され得て、これはより経済的であり得る。
【0062】
これらの可能性は、網羅的ではなく、処理はデジタル的に実行され得るが、アナログ媒体が介在し得ることを除外するものではない。例えば、
図1のアーカイブ3は、アナログテープのライブラリであり得て、それらのうちのいくつかは、内部的には44.1kHzで動作するデジタルエフェクトユニットが信号を処理するために用いられたために、プリレスポンスを含み得る。アナログ媒体が線形であると想定され得る限り、マスタリングステージ5における処理は、全てがデジタルのシステムとちょうど同じ程度に、これらプリレスポンスを抑圧するのに効果的であろう。