(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-04-22
(45)【発行日】2022-05-06
(54)【発明の名称】トランスペアレントロスレスオーディオウォーターマーキング向上
(51)【国際特許分類】
G10L 19/018 20130101AFI20220425BHJP
【FI】
G10L19/018
(21)【出願番号】P 2018532433
(86)(22)【出願日】2016-12-22
(86)【国際出願番号】 GB2016054037
(87)【国際公開番号】W WO2017109498
(87)【国際公開日】2017-06-29
【審査請求日】2019-12-20
(32)【優先日】2015-12-23
(33)【優先権主張国・地域又は機関】GB
(73)【特許権者】
【識別番号】517416123
【氏名又は名称】エムキューエー リミテッド
(74)【代理人】
【識別番号】110001427
【氏名又は名称】特許業務法人前田特許事務所
(72)【発明者】
【氏名】マルコム ロー
【審査官】菊池 智紀
(56)【参考文献】
【文献】国際公開第2015/150746(WO,A1)
【文献】特表2015-519615(JP,A)
【文献】米国特許出願公開第2015/0279378(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00-19/26
(57)【特許請求の範囲】
【請求項1】
ロスレスでオーディオ信号にウォーターマーキングする方法であって、
前記オーディオ信号にノイズシェーピングされた量子化を実行して、量子化オーディオ信号を生成すること、
第1オフセットの加算、0.5による乗算、及び量子化の操作を実行することによって、前記オーディオ信号から上限を計算すること、
第2オフセットの減算、0.5による乗算、及び量子化の操作を実行することによって、前記オーディオ信号から下限を計算すること、及び
前記量子化オーディオ信号を、前記上限及び前記下限でクリッピングすること
を含み、
前記第1オフセット及び前記第2オフセットは、前記乗算の前に適用されるときは、前記オーディオ信号のピーク表現可能な値
に等しく、前記乗算の後に適用されるときは、前記オーディオ信号のピーク表現可能な値の半分
に等しい
方法。
【請求項2】
前記クリッピングは、ウォーターマークを改変しない、請求項1に記載の方法。
【請求項3】
ノイズシェーピングされた量子化のステップは、ウォーターマークデータを前記オーディオ信号に埋め込み、このデータは、前記オーディオ信号がピーク表現可能な値から一定量K内であるときはいつでも、ノイズシェーピングされた量子化に与えられたオーディオ信号のlsb(最下位ビット)を示すデータを含む、請求項1又は請求項2に記載の方法。
【請求項4】
Kは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの2倍より小さくはない、請求項3に記載の方法。
【請求項5】
Kは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの4倍より小さい、請求項3又は請求項4に記載の方法。
【請求項6】
前記ノイズシェーピングされた量子化を実行するステップは、クリッピングが前記量子化オーディオ信号を改変するときには、前記量子化オーディオ信号のサンプルに発生した誤差をシェーピングしない
請求項1-5のいずれか1項に記載の方法。
【請求項7】
前記オーディオ信号がピーク表現可能な値から定数M内に存在するときにはいつでも、lsbを標準化された値に強制することによって、前記オーディオ信号から得られたオーディオデータを含むデータに対するデジタルシグネチャを計算することをさらに含む
請求項1-6のいずれか1項に記載の方法。
【請求項8】
Mは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの2倍より小さくはない、請求項7に記載の方法。
【請求項9】
Mは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの4倍より小さい、請求項7又は請求項8に記載の方法。
【請求項10】
ロスレスでウォーターマーキングされたオーディオ信号を処理する方法であって、
前記ロスレスでウォーターマーキングされたオーディオ信号にノイズシェーピングされた量子化を実行して、量子化オーディオ信号値を有する量子化オーディオ信号を生成すること、
2による乗算、第1オフセットの加算、及び量子化の操作を実行することによって、前記ロスレスでウォーターマーキングされたオーディオ信号から第1値を計算すること、
2による乗算、第2オフセットの減算、及び量子化の操作を実行することによって、前記ロスレスでウォーターマーキングされたオーディオ信号から第2値を計算すること、及び
前記量子化オーディオ信号値、前記第1値、及び前記第2値からなる三者のうち、中央値を選択すること
を含み、
前記第1オフセット及び前記第2オフセットは、前記乗算の後に適用されるときは、前記ロスレスでウォーターマーキングされたオーディオ信号のピーク表現可能な値
に等しく、前記乗算の前に適用されるときは、前記ロスレスでウォーターマーキングされたオーディオ信号のピーク表現可能な値の半分
に等しい
方法。
【請求項11】
前記中央値がピーク表現可能な値から一定量K内に存在するときにはいつでも、前記中央値のlsbを強制された値に強制することをさらに含み、
前記強制された値は、前記ロスレスでウォーターマーキングされたオーディオ信号のオーディオウォーターマークに依存している
請求項10に記載の方法。
【請求項12】
Kは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの2倍より小さくはない、請求項11に記載の方法。
【請求項13】
Kは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの4倍より小さい、請求項11又は請求項12に記載の方法。
【請求項14】
前記中央値が前記量子化オーディオ信号値とは異なる場合、前記ノイズシェーピングされた量子化を実行するステップは、前記ロスレスでウォーターマーキングされたオーディオ信号のサンプルの誤差をシェーピングしない
請求項10-13のいずれか1項に記載の方法。
【請求項15】
前記強制されたlsbが前記量子化オーディオ信号値とは異なる場合、前記ノイズシェーピングされた量子化を実行するステップは、前記ロスレスでウォーターマーキングされたオーディオ信号のサンプルの誤差をシェーピングしない
請求項11-13のいずれか1項に記載の方法。
【請求項16】
前記中央値がピーク表現可能な値から定数M内に存在するときにはいつでも、lsbを標準化された値に強制することによって、前記中央値から得られたオーディオデータを含むデータに対して計算されたデジタルシグネチャをベリファイすることをさらに含む
請求項10-15のいずれか1項に記載の方法。
【請求項17】
Mは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの2倍より小さくはない、請求項16に記載の方法。
【請求項18】
Mは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの4倍より小さい、請求項16又は請求項17に記載の方法。
【請求項19】
請求項1-9のいずれか1項に記載の方法を用いてオーディオ信号にロスレスでウォーターマーキングするよう構成されたエンコーダ。
【請求項20】
請求項10-18のいずれか1項に記載の方法を用いてロスレスでウォーターマーキングされたオーディオ信号を処理するよう構成されたデコーダ。
【請求項21】
請求項19に記載のエンコーダ、及び請求項20に記載のデコーダを備えるコーデック装置。
【請求項22】
シグナルプロセッサによって実行されることで、請求項1-18のいずれか1項に記載の方法をシグナルプロセッサに実行させる命令を含むコンピュータで読み取り可能な媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号にウォーターマーキングすることに関連し、特に改良されたウォーターマーキングのトランスペアレンシ及びオリジナルのオーディオ信号の復元に関する。
【背景技術】
【0002】
WO2015150746A1は、ウォーターマーキングされたオーディオ信号がオリジナルの高品質版であり、元のオーディオ信号の正確な複製を復元するために、ウォーターマークが完全に除去され得るように、オーディオ信号にウォーターマーキングする方法を記載する。
【0003】
ここで
図1Aとして再掲されるWO2015150746A1の
図1Aを参照すれば、既知の方法は、信号104が既知の範囲を尊重することを確実にするクリップユニット133と、それに続く、制御データ141及びウォーターマークを備えるデータ143を埋め込み、出力信号102を生成するノイズシェーピングされる量子化器とを採用する。
図1Bは、WO2015150746A1の対応するデコーディング信号フローを示す。
【0004】
図1Cは、
図1Aのエンコーディング信号フローの簡略化されたモデルを示し、量子化グリッドO
3にある信号104の生成までは前処理として示され、装置の残りはデータ埋込器(Data Burier)114として示され、これはノイズを加えることによって量子化グリッドO
2上に出力102を作る。よって、オーディオ信号は、いくらかの前処理が施され、既知の制限値でクリップされる信号104を作る。データ埋込器114は、それから、既知のピークの大きさのデータ依存のノイズを加えて、量子化グリッドO
2において出力信号102を作る。このノイズは、埋め込まれるべきデータ143に依存し、これは、ウォーターマークデータ及び前処理によって作られた追加のデータ141を含む。
【0005】
図1Dは、同様に、
図1Bのデコーディング信号フローの簡略化されたモデルを示す。入力信号202(
図1Cのエンコーダからの出力102の複製であるよう意図される)は、埋込器114の動作を反転する抽出器214を通して与えられ、信号104を複製する信号204を作る。さらなる後処理は、エンコーダ前処理を反転する。
図1Dは、どのように抽出器が埋込器を反転するかについて説明のための内部を示し、ここでウォーターマーキングされた信号の調べることによって抽出器は、143を複製するデータ243を抽出する。ここでそれは、埋込器が加えたのと同じノイズを生成し、減ずることできる。
【0006】
しかし出力信号102が過負荷にならないことを確実にするためには、データ埋込ユニットにおいて追加されたノイズを考慮するためには、信号104がより厳しい制限値までクリップされなければならないという課題が存在する。
【発明の概要】
【発明が解決しようとする課題】
【0007】
より厳しい制限値は、実際のオーディオではトランスペアレンシを劣化させないが、フルレベルの正弦波を含むテスト信号でシステムのパフォーマンスを評価することがふつうの実務である。フルレベルの正弦波をクリップすることは、試験装置に対して可視の歪積を生じ、システム忠実度の批判を避けるために、これら歪積のレベルを最小化する必要がある。
【課題を解決するための手段】
【0008】
本発明の第1局面によれば、ロスレスでオーディオ信号にウォーターマーキングする方法であって、ノイズシェーピングされた量子化を実行すること、及びノイズシェーピングされた量子化からの出力を、ノイズシェーピングされた量子化への入力の傾き0.5を用いて量子化された線形関数のペアによって計算された制限値にクリッピングすることを含む方法が提供される。
【0009】
このようにして、本発明は、フルスケールテスト試料に対して、ウォーターマーキング操作を正確に逆転する能力を確保しながら、オリジナルのオーディオ信号の完全な複製物を復元するために、WO2015150746A1に記載された技術のトランスペアレンシを向上する。
【0010】
本発明は、大まかには以下によってこれを達成する。
【0011】
(i)データ埋込器への入力104が、ピーク表現可能な値を得ることを可能にすること、
(ii)ウォーターマーキングされた信号を、ノイズシェーピングされた量子化器への入力の量子化された線形関数である制限にクリッピングすることによって埋込器によって導入された過負荷を扱うことであって、ここで量子化は、制限が信号と同じウォーターマーキング情報を運ぶことを確実にし、線形関数は傾き0.5を有する、
(iii)データ埋込器への入力104を検査し、ピーク表現可能な値に近いときは再構築データの追加のビットを作り、これによりデコーダは、ユニティよりも小さい0.5の傾きによって、導入された曖昧さを解決することができる。
【0012】
本発明の第2局面によれば、ロスレスでウォーターマーキングされたオーディオ信号を処理する方法であって、ノイズシェーピングされた量子化を前記オーディオ信号に実行すること、及びノイズシェーピングされた量子化からの出力、及び前記オーディオ信号の傾き2を持つ量子化された線形関数のペアからなる三者のうち、中間値を選択することを含む方法が提供される。
【0013】
本発明の第3局面によれば、第1局面の方法を用いてオーディオ信号にロスレスでウォーターマーキングするよう構成されたエンコーダが提供される。
【0014】
本発明の第4局面によれば、第2局面の方法を用いてロスレスでウォーターマーキングされたオーディオ信号を処理するよう構成されたデコーダが提供される。
【0015】
本発明の第5局面によれば、第3局面によるエンコーダを第2局面によるデコーダと組み合わせて備えるコーデックが提供される。
【0016】
本発明の第6局面によれば、第1局面の方法を用いてロスレスでウォーターマーキングされたオーディオ信号を含むデータキャリヤが提供される。
【0017】
本発明の第7局面によれば、シグナルプロセッサによって実行されることで、第1又は第2局面の方法をシグナルプロセッサに実行させる命令を含むコンピュータプログラムプロダクトが提供される。
【0018】
当業者には理解されるように、本発明は、オーディオ信号のトランスペアレントなロスレスウォーターマーキングを向上させ、一方で、オリジナルのオーディオの完全な複製物を復元するために、ウォーターマーキング操作の逆転を可能にする技術及び装置を提供する。さらなる変形例及び装飾例が本開示を参酌すれば当業者には明らかになろう。
【図面の簡単な説明】
【0019】
本発明の例は、添付の図面を参照して詳細に説明される。
【
図1A】
図1Aは、トランスペアレントなロスレスオーディオウォーターマーキングのための既知のエンコーダの信号フロー図を示す。
【
図2】
図2は、本発明の実施形態によるエンコーダを示し、これは
図1Cの埋込器の周辺にインスペクタ及びクリップユニットを追加する。
【
図3】
図3は、正のクリップリミットLΔの領域における取り得る信号値を示す。
【
図4】
図4は、
図2のエンコーダに対応する本発明の実施形態によるデコーダを示し、
図1Dのデコーダにアンクリップユニット及びLsb強制ユニットを追加している。
【
図5】
図5は、本発明の第2実施形態によるエンコーダを示す。
【
図6】
図6は、
図5のエンコーダに対応する本発明の第2実施形態によるデコーダを示す。
【
図7】
図7は、本発明の第4実施形態においてクリッピングが起こったときにノイズシェーピングをディセーブルするための信号フローを示す。
【発明を実施するための形態】
【0020】
本発明の必要は、可逆性要件から来る。これがもしないなら、ウォーターマークを保存したいかなる形態のクリップもウォーターマーキングされた信号に対して実行され得ることになる。
【0021】
表記法
表現[a,b]は、端点a及びbの両方を含むa及びbの間の閉区間を意味するものとして用いる。表現[a,b)は、端点aは含むがbは含まないa及びbの間の半開区間を意味する。
【0022】
Δは、オーディオの量子化ステップサイズを意味するものとして用い、L(偶数であると想定する)は、エンコーダ出力105でのサンプル値の制限を[-LΔ,+LΔ)のように記すために用いる。±LΔは、ピークの表現可能な値の意味である。
【0023】
オーディオ値xのlsbというときは、(floor(x/Δ)modulo 2)を意味し、ここでfloor(y)はyを超えない最大の整数である。
【0024】
埋込器(Burier)114で加えられたノイズのピークレベルをkで表すと、ノイズの値は、範囲[-kΔ,+kΔ]に存在する。kは整数であることが要求されるので、ノイズの丸められたピークレベルを意味する。
【0025】
導入の実施形態
図1Cの信号104及び102がΔの整数倍であるときに使用するのに適した本発明の実施形態をまず説明する。これは、特に便利な実施形態というわけではないが、それは、制約条件がWO2015150746のウォーターマーキング方法を除外するからであるが、複雑さが増したものを扱う前に本発明の本質的な特徴を導入することができる。
【0026】
図2は、本発明によるエンコーダを示し、埋込器114の周辺で2つの要素を追加する。第1に、もしオーディオがピークの表現可能な値±LΔに近いならオーディオのlsbをデータ144として送るインスペクタ134である。第2に、クリッピング(最小動作171及び最大動作172によって実現される)が、線形関数151及び152及び量子化器161及び162によって入力104から埋込器114に得られた制限値にクリップするクリップユニット115である。
【0027】
信号104は、フルレンジ[-LΔ,+LΔ)を行使し、よって埋込器114がノイズを追加するので、その出力信号102は、このレンジを超え得る。結果として、信号105がレンジ[-LΔ,+LΔ)の中に存在することを確実にするために対策が取られなければならない。クリッパ115がこの対策を行う。
【0028】
しかしクリッピングは、クリップポイント付近の何個かの入力サンプル値をより少ない数の出力サンプル値に割り当てるのでオーディオストリームから情報を落としてしまう。この失われた情報のためのサイドパスが必要であり、これはオーディオデータを検査し、もし必要なら、クリッピングに本質的に存在する情報の損失にもかかわらずデコーダが元の信号を再構築することを可能にするデータ144を送信するインスペクタ134によって提供される。
【0029】
理想的にはこのデータ144は、クリッピングで廃棄された情報を正確に伝達するはずであり、よってクリッパ115が曖昧さを生じるときにだけ送られることになる。しかし、これは非実用的であるが、それは、デコーダにわたってデータを渡すのに利用可能な唯一のチャネルは、それをデータ143、及び(
図1Cに示されるように)埋込器114によって追加されたノイズにマルチプレクシングすることによってであり、その結果、クリッピングが具体的な場合に実際に起こるかは、データ143に依存する。この循環性のために、クリッピングがひょっとしたら起こるかもしれないことを信号104(データ143に依存しない)が示すときにはいつでも、データ144が送信される必要がある。
【0030】
これらの状況下では、どのようなものであれ発生する曖昧さを解決するのに、1ビットのデータがあれば十分であるようにし、それによってインスペクタは、デコーダがデータの曖昧さを解決する必要があるかもしれない±LΔに信号104が十分に近いときにはいつでも、オーディオのlsbを送信するよう、クリッパ115が設計されるのがデータ効率の点で良い。十分に近いとはどういう意味なのかについては後述する。
【0031】
クリッパ115の設計を説明することに移るが、デコーダは、曖昧さを解決するためにたかだか1ビットしか供給されていないので、クリッパは、いかなる出力値105も、信号104の2個より多い値にマッピングされないことを確実にしなければならない。またクリッピングは、信号に対する改変を最小化することも望まれる。したがって正のクリップポイントを考慮すれば、信号104の最も大きい2つの取り得る値が、信号105の最も大きい値にマッピングされることが好ましく、次の2つの最も大きい取り得る値が信号105の次に最も大きい値にマッピングされ、クリッパが信号を改変しない、クリッピングのためのさらなる必要がなくなるまで同様に続く。
【0032】
これは、まさにクリッパ115が実現することである。この実現例では、伝達関数161及び162は、Q(x)=Δfloor(x/Δ)であり、線形関数151及び152は、xを0.5(x+LΔ)及び0.5(x-LΔ)にそれぞれマッピングする。正のクリップポイントは、信号102を、信号104の量子化された線形関数にクリップする最小操作171によって達成される。線形関数151を見ると、傾き0.5は、信号104の2つの値が信号105のそれぞれの値にマッピングされることを確実にし、一方でオフセット0.5LΔは、信号104の最も大きい2つの値を信号105の最も大きい取り得る値にマッピングする。最後に、最小操作171は、クリッピングのためのさらなる必要がなくなったときに、信号104の2つの値を信号105のあらゆる値にマッピングすることを止めることを確実にする。
【0033】
これは
図3に示され、この図は、正のクリップリミットLΔの領域にある取り得る信号値を示す。信号104のピーク値に近いものについては、線形関数151の出力、及び最小操作171によって実現される正のクリッピングポイントをプロットする。データ埋込器114で導入されるノイズのせいで信号102が取り得る値の例示的範囲も示す。
【0034】
よって
図3は、信号102の範囲(例示的なk=4について)、線形関数151の出力、及び量子化161の後のクリップポイントを示す。信号104が変化すると、+LΔから離れる値は、埋込器114が何をしようともいかなる信号の改変をも意味しない。信号104が増加すると、ノイズのより大きい+ve値は、最も大きい取り得る信号104について、ノイズの全ての正の値がクリッピングにつながるまで、クリッピングにつながる。埋込器114によって加えられたノイズの瞬時値がどうであれ、任意の出力値105につながる信号104の値は、たかだか2つ存在するだけであり、サイドチャネルデータ144の1ビットがあれば曖昧さを解決するのには十分である。
【0035】
負のクリップポイントは、最大操作172、線形関数152、及び量子化器162によって実現され、正のクリップポイントについてのときと同様の特性を持つ。
【0036】
クリッパ115の形態を議論してきたので、ここでインスペクタ134における「十分に近い」ことを定義することに戻る。+veクリッピングによって改変され得る信号104の最も小さい値は、(L-2k+1)Δであり、このクリッピングは、(L-2k)Δと同じ出力を発生することにつながりえる。同様に、-veクリッピングによって影響され得る最も大きい値は、(-L+2k-2)Δであり、これは、(-L+2k-1)Δと同じ出力を発生し得る。その結果として、インスペクタ134は、信号104が
【0037】
【0038】
であるときはいつでもlsbを送信する。
【0039】
この計算において、kの正確な値を使う必要はなく、より大きい値でも、わずかにデータコストが高くなるだけで正確な操作ができる(lsbは、曖昧さが起こり得ないようなときでも送信され得るので)。しかしデータコストを上回る計算の便利さが2のべき乗を使えばひょっとすると得られるかもしれない。この場合、より大きな、おそらくは4kΔまでのガードバンドが用いられ得る。
【0040】
図4は、
図2のエンコーダに対応するデコーダを示し、これは、
図1Dのデコーダにアンクリップユニット215及びLsb強制ユニット234を加えている。アンクリップユニット215は、エンコーダクリップユニット115によってなされた任意の信号改変をおおまかには反転し、Lsb強制器(Forcer)は、オーディオのlsbを強制する(force)ために、補足データ244を用いて反転を完了する。
【0041】
よってエンコーダと同様に、
図1Dの抽出器214は、アンクリップ215及びLsb強制器234(抽出器214によって抽出されたデータ243からデマルチプレクシングされたデータ244によって駆動される)によって強化される。これらが組み合わさって、クリップ115によってなされた任意の信号改変を反転し、よって信号204は、エンコーダの信号104のロスレス複製物になる。
【0042】
これを把握するために、まず正のクリップリミット+LΔ付近の操作を考慮しよう。線形関数251及び252は、エンコーダにおける線形関数151及び152への逆転マッピング(inverse mappings)であり、xを2(x-LΔ)及び2(x+LΔ)にそれぞれマッピングする。
【0043】
もしエンコーダがクリッピングされると、信号105は、量子化器161からの出力と等しくなり、これは今度は0.5(x+LΔ)-εに等しく、ここで信号104はxとして表し、量子化器161からの改変はε(0又は0.5Δのいずれか一方である)として表す。
【0044】
線形関数251からの出力は、2(0.5(x+LΔ)-ε)-LΔ=x-2εとして計算され得て、これはΔと、x又はx-Δのいずれかとの偶数倍である。
【0045】
エンコーダがクリッピングされるので、信号102>信号105であることがわかっている。信号205は、信号105の複製であり、抽出器214は、埋込器114によって追加されたのと同じノイズを減じ、これは信号104>信号202を意味し、よって信号202≦信号104-Δ=x-Δである。その結果、最大操作271は、信号206が線形関数251の出力に等しいことを確実にし、よって信号206は、Δと、x又はx-Δのいずれかとの偶数倍である。234におけるlsbを復元することは、信号204が信号104の複製物となることを確実にする。
【0046】
もしエンコーダがクリッピングしないなら、最大操作271は、効果を有さず、信号206は、信号104の複製物となる。lsbを正しい値に強制すること(もし234で起これば)は、信号にはなんの影響も有さず、信号204も要求されるように信号104の複製物になる。同様に、操作252、272、及び234は、エンコーダ内で起こった負の制限への任意のクリッピングを逆転させ、そうでなければ効果を有しないことがわかろう。
【0047】
考慮すべき残っている一つの問題は、Lsb強制器234のデータ消費である。これは、1ビットのデータを消費し、もし信号206が「レールに近い」なら、インスペクタ134においてのものと同じ「レールに近い」の定義を用いる。信号206は、常に信号104の複製物となるわけではないから、「レールに近い」の定義は、ビットを送信するか送信しないかの判断点が、信号206が信号104の複製物になる領域に存在することを確実にするよう選ばれる。
【0048】
量子化グリッド
本発明の第2実施形態において、信号は、WO2015150746A1において議論されるように、量子化グリッドに存在するよう定義される。それらは、Δの整数倍である点から、サンプルごとによって変化し得るオフセットだけずらされる。
【0049】
信号104,202,204,206及び量子化器261及び262の出力は、全て同じ量子化グリッドの上に存在し、これはWO2015150746A1との互換性のためにO3と呼ぶ。信号102,105,205は、他の量子化グリッドO2上に全て存在する。グリッドO3は、全く同じにゼロ(オフセットがないことに対応する)であり得るが、ふつうは、エンコーダ及びデコーダ間で同期がとられる疑似ランダムシーケンスによって定義される。グリッドO2は、データ143に依存し、オーディオをウォーターマーキングするためのWO2015150746A1において記載されたメカニズムである。量子化グリッドを定義するオフセットは、範囲[0,Δ)に存在するよう正規化する。
【0050】
第2実施形態によるエンコーダは、
図5に示され、ここではオフセッタ116は、クリップ115がウォーターマークを改変しないことを確実にする。信号104のオフセットO
3は、実際には量子化器161又は162の出力に影響を与えず、εを0.5O
3だけ増加させる。しかし、クリップ115がウォーターマークを保存する(すなわち信号105はクリッピングが起こるときも依然としてO
2上に存在する)ことを確実にする必要がある。これは、オフセッタ116によってなされ、これは、オフセットO
2を量子化器161及び162の出力に加える。エンコーダは、O
2を知っているが、これは、もし必要があれば、信号102からそれ自身の量子化されたバージョンを引くことによって計算され得る。
【0051】
本発明の第2実施形態による対応するデコーダは、
図6に示される。量子化器217は、オフセットO
2を線形関数251及び252に与えられた信号から除去し、オフセッタ216は、オフセットO
3をその出力に加え、それが要求されたグリッドに存在するようにする。よって量子化器217は、エンコーダ内のオフセッタ116について補償し、オフセッタ216は、信号206が正しい量子化グリッド上に存在することを確実にする。
【0052】
ベクトル量子化
本発明の第3実施形態において、量子化グリッドO2及びO3の信号は、WO2015150746A1で示唆されるようにベクトル量子化され、この文献においては{[2-16,2-16],[2-16,-2-16]}によって定義される量子化格子が説明されている。
【0053】
この実施形態において、一方のチャネルのクリッピングが他方のチャネルに影響を与えないようにモノフォニック的に操作をするようクリッピングしたい。これは、Δをそれぞれのチャネルの格子点間の最も小さい距離であるように定義することによってなされ得る。この場合、[2-15,0]=[2-16,2-16]+[2-16,-2-16]及び[0,2-15]=[2-16,2-16]-[2-16,-2-16]であり、よってそれぞれのチャネルについてΔ=2-15であるように定義できる。これは、オーディオの量子化ステップサイズとしてのΔに関する我々の定義からのわずかなずれであるが、全てが意図されるようにモノラル的に動作するようにできる。
【0054】
唯一のわずかな例外は、オフセッタ116及び216によって加えられたオフセットが、量子化グリッドO2及びO3と共に、他方のチャネルのパリティも考慮しなければならないことである。しかし正しいオフセットは、信号102及び202を、オフセッタ内で用いるためのそれら自身の量子化されたバージョンからそれぞれ減じることによって得られる。
【0055】
ノイズシェーピングをディセーブルすること
本発明の第4実施形態において、埋込器114は、ノイズシェーピングされた量子化器(すなわち
図1Aにおける量子化器112及びフィルタ112)によって実際には実現されることに注意されたい。
【0056】
クリッピングが動作中である時は、ノイズシェーピングされていない信号105に瞬間的な変化を与える。我々はこれらの変化をノイズシェーピングするよう試みないが、それらの存在は、量子化器112によって作られたより小さい(かつ必ずしも同じ極性ではない)誤差をノイズシェーピングすることを無意味なものにする。
【0057】
本発明の第4実施形態によれば、
図7に示されるように、エンコーダ埋込器114におけるノイズシェーピングをディセーブルし、ここでマルチプレクサ115は通常、量子化器112の出力をフィードバックするが、代わりにクリッピングが起こるときにはその入力をフィードバックする。よってマルチプレクサ115は、量子化器112によって作られた誤差をシェーピングするか(右側位置で)、又はシェーピングしないか(左側位置で)を選択する。
【0058】
同様に、フィードバックは、デコーダ抽出器214において同期したやり方で改変される。
【0059】
デコーダは、信号202及び204を比較できる操作234が終わるまでクリッピングが起こったかをカテゴリ的には知らない。これは、実現するには不便になるはずなので、好ましくはデコーダは、代わりに信号206に基づいてフィードバックをディセーブルすることを決定する。エンコーダ及びデコーダ間の同期を維持するために、エンコーダは、ロックステップで動作しなければならず、これはデコーダ信号206をシミュレートし、同じロジックを適用することによってなされ得る。
【0060】
良く定義されたデジタルシグネチャ
本発明の第5実施形態において、デコーダは、データストリーム243において運ばれるオーディオのデジタルシグネチャをベリファイすることによってストリームを認証することが望ましい。
【0061】
シグネチャが計算されるオーディオは、埋め込まれたデータ143から独立していることが好ましいが、一方で、デコードなしで認証だけを実行する計算負荷を最小化するために、デコードプロセスの初期においてアクセスされ得ることも好ましい。信号206は、認証のための良い点を提供するが、この点においてオーディオのlsbは、もしクリッピングが起こったとしても、起こらなかったとしても、定義が不明確である。
【0062】
したがって本発明によるデコーダの第5実施形態では、オーディオストリームは、オーディオがレールに近いときに、信号206のlsbを強制する(forcing)ことによってデジタルシグネチャをベリファイするために作られる。これは、ちょうどLsb強制器234と同じであるが、それがデータを消費せず、代わりにlsbを便利なように選ばれた値に強制する(例えばそれをクリアする)点が異なる。
【0063】
対応するように、本発明によるエンコーダの第5実施形態では、オーディオストリームは、オーディオがレールの近くであるとき、信号104のlsbを強制することによってデジタルシグネチャを計算するために作られる。
【0064】
演算についての注記
クリップ及びアンクリップ操作を実行するための演算は、多くのやり方で再構成され得る。例えば、最大/最小操作171,172,271,及び272を実行する代わりに、調整が計算され得て(通常はゼロであるが、クリッピングが起こるときはΔの整数倍である)、信号102又は202に加えられる。
【0065】
計算された制限へのクリッピングは、3つの信号(102及びオフセッタ116の出力)のうちの中間を選択することと等価である。明らかではないが、アンクリッピングしているデコーダは、3つの信号(202及びオフセッタ216の出力)のうちの中間を選択することもしている。
【0066】
クリッピングもアンクリッピングも、線形関数の両方の計算を必ずしも必要としない。例えば、正の値を扱うときは、明らかに-LΔの周辺の操作に影響を与える線形関数は、信号を改変することはなく、負の値についても逆が言える。