特許7062590 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ エムキューエー　リミテッドの特許一覧

特許7062590トランスペアレントロスレスオーディオウォーターマーキング向上

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
1C
1D
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-04-22

(45)【発行日】2022-05-06

(54)【発明の名称】トランスペアレントロスレスオーディオウォーターマーキング向上

(51)【国際特許分類】

G10L 19/018 20130101AFI20220425BHJP

【ＦＩ】

G10L19/018

【請求項の数】 22

(21)【出願番号】P 2018532433

(86)(22)【出願日】2016-12-22

(65)【公表番号】

(43)【公表日】2019-02-14

(86)【国際出願番号】 GB2016054037

(87)【国際公開番号】W WO2017109498

(87)【国際公開日】2017-06-29

【審査請求日】2019-12-20

(31)【優先権主張番号】1522816.6

(32)【優先日】2015-12-23

(33)【優先権主張国・地域又は機関】GB

(73)【特許権者】

【識別番号】517416123

【氏名又は名称】エムキューエーリミテッド

(74)【代理人】

【識別番号】110001427

【氏名又は名称】特許業務法人前田特許事務所

(72)【発明者】

【氏名】マルコムロー

【審査官】菊池智紀

(56)【参考文献】

【文献】国際公開第２０１５／１５０７４６（ＷＯ，Ａ１）

【文献】特表２０１５－５１９６１５（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１５／０２７９３７８（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１０Ｌ１９／００－１９／２６

(57)【特許請求の範囲】

【請求項1】

ロスレスでオーディオ信号にウォーターマーキングする方法であって、
前記オーディオ信号にノイズシェーピングされた量子化を実行して、量子化オーディオ信号を生成すること、
第１オフセットの加算、０．５による乗算、及び量子化の操作を実行することによって、前記オーディオ信号から上限を計算すること、
第２オフセットの減算、０．５による乗算、及び量子化の操作を実行することによって、前記オーディオ信号から下限を計算すること、及び
前記量子化オーディオ信号を、前記上限及び前記下限でクリッピングすること
を含み、
前記第１オフセット及び前記第２オフセットは、前記乗算の前に適用されるときは、前記オーディオ信号のピーク表現可能な値に等しく、前記乗算の後に適用されるときは、前記オーディオ信号のピーク表現可能な値の半分に等しい
方法。

【請求項2】

前記クリッピングは、ウォーターマークを改変しない、請求項１に記載の方法。

【請求項3】

ノイズシェーピングされた量子化のステップは、ウォーターマークデータを前記オーディオ信号に埋め込み、このデータは、前記オーディオ信号がピーク表現可能な値から一定量K内であるときはいつでも、ノイズシェーピングされた量子化に与えられたオーディオ信号のlsb（最下位ビット）を示すデータを含む、請求項１又は請求項２に記載の方法。

【請求項4】

Kは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの２倍より小さくはない、請求項３に記載の方法。

【請求項5】

Kは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの４倍より小さい、請求項３又は請求項４に記載の方法。

【請求項6】

前記ノイズシェーピングされた量子化を実行するステップは、クリッピングが前記量子化オーディオ信号を改変するときには、前記量子化オーディオ信号のサンプルに発生した誤差をシェーピングしない
請求項１－５のいずれか１項に記載の方法。

【請求項7】

前記オーディオ信号がピーク表現可能な値から定数M内に存在するときにはいつでも、lsbを標準化された値に強制することによって、前記オーディオ信号から得られたオーディオデータを含むデータに対するデジタルシグネチャを計算することをさらに含む
請求項１－６のいずれか１項に記載の方法。

【請求項8】

Mは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの２倍より小さくはない、請求項７に記載の方法。

【請求項9】

Mは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの４倍より小さい、請求項７又は請求項８に記載の方法。

【請求項10】

ロスレスでウォーターマーキングされたオーディオ信号を処理する方法であって、
前記ロスレスでウォーターマーキングされたオーディオ信号にノイズシェーピングされた量子化を実行して、量子化オーディオ信号値を有する量子化オーディオ信号を生成すること、
２による乗算、第１オフセットの加算、及び量子化の操作を実行することによって、前記ロスレスでウォーターマーキングされたオーディオ信号から第１値を計算すること、
２による乗算、第２オフセットの減算、及び量子化の操作を実行することによって、前記ロスレスでウォーターマーキングされたオーディオ信号から第２値を計算すること、及び
前記量子化オーディオ信号値、前記第１値、及び前記第２値からなる三者のうち、中央値を選択すること
を含み、
前記第１オフセット及び前記第２オフセットは、前記乗算の後に適用されるときは、前記ロスレスでウォーターマーキングされたオーディオ信号のピーク表現可能な値に等しく、前記乗算の前に適用されるときは、前記ロスレスでウォーターマーキングされたオーディオ信号のピーク表現可能な値の半分に等しい
方法。

【請求項11】

前記中央値がピーク表現可能な値から一定量K内に存在するときにはいつでも、前記中央値のlsbを強制された値に強制することをさらに含み、
前記強制された値は、前記ロスレスでウォーターマーキングされたオーディオ信号のオーディオウォーターマークに依存している
請求項１０に記載の方法。

【請求項12】

Kは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの２倍より小さくはない、請求項１１に記載の方法。

【請求項13】

Kは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの４倍より小さい、請求項１１又は請求項１２に記載の方法。

【請求項14】

前記中央値が前記量子化オーディオ信号値とは異なる場合、前記ノイズシェーピングされた量子化を実行するステップは、前記ロスレスでウォーターマーキングされたオーディオ信号のサンプルの誤差をシェーピングしない
請求項１０－１３のいずれか１項に記載の方法。

【請求項15】

前記強制されたlsbが前記量子化オーディオ信号値とは異なる場合、前記ノイズシェーピングされた量子化を実行するステップは、前記ロスレスでウォーターマーキングされたオーディオ信号のサンプルの誤差をシェーピングしない
請求項１１－１３のいずれか１項に記載の方法。

【請求項16】

前記中央値がピーク表現可能な値から定数M内に存在するときにはいつでも、lsbを標準化された値に強制することによって、前記中央値から得られたオーディオデータを含むデータに対して計算されたデジタルシグネチャをベリファイすることをさらに含む
請求項１０－１５のいずれか１項に記載の方法。

【請求項17】

Mは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの２倍より小さくはない、請求項１６に記載の方法。

【請求項18】

Mは、ノイズシェーピングされた量子化が導入するかもしれない改変のピークレベルの４倍より小さい、請求項１６又は請求項１７に記載の方法。

【請求項19】

請求項１－９のいずれか１項に記載の方法を用いてオーディオ信号にロスレスでウォーターマーキングするよう構成されたエンコーダ。

【請求項20】

請求項１０－１８のいずれか１項に記載の方法を用いてロスレスでウォーターマーキングされたオーディオ信号を処理するよう構成されたデコーダ。

【請求項21】

請求項１９に記載のエンコーダ、及び請求項２０に記載のデコーダを備えるコーデック装置。

【請求項22】

シグナルプロセッサによって実行されることで、請求項１－１８のいずれか１項に記載の方法をシグナルプロセッサに実行させる命令を含むコンピュータで読み取り可能な媒体。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、オーディオ信号にウォーターマーキングすることに関連し、特に改良されたウォーターマーキングのトランスペアレンシ及びオリジナルのオーディオ信号の復元に関する。

【背景技術】

【0002】

WO2015150746A1は、ウォーターマーキングされたオーディオ信号がオリジナルの高品質版であり、元のオーディオ信号の正確な複製を復元するために、ウォーターマークが完全に除去され得るように、オーディオ信号にウォーターマーキングする方法を記載する。

【0003】

ここで図１Ａとして再掲されるWO2015150746A1の図１Ａを参照すれば、既知の方法は、信号１０４が既知の範囲を尊重することを確実にするクリップユニット１３３と、それに続く、制御データ１４１及びウォーターマークを備えるデータ１４３を埋め込み、出力信号１０２を生成するノイズシェーピングされる量子化器とを採用する。図１Ｂは、WO2015150746A1の対応するデコーディング信号フローを示す。

【0004】

図１Ｃは、図１Ａのエンコーディング信号フローの簡略化されたモデルを示し、量子化グリッドO₃にある信号１０４の生成までは前処理として示され、装置の残りはデータ埋込器（Data Burier）１１４として示され、これはノイズを加えることによって量子化グリッドO₂上に出力１０２を作る。よって、オーディオ信号は、いくらかの前処理が施され、既知の制限値でクリップされる信号１０４を作る。データ埋込器１１４は、それから、既知のピークの大きさのデータ依存のノイズを加えて、量子化グリッドO₂において出力信号１０２を作る。このノイズは、埋め込まれるべきデータ１４３に依存し、これは、ウォーターマークデータ及び前処理によって作られた追加のデータ１４１を含む。

【0005】

図１Ｄは、同様に、図１Ｂのデコーディング信号フローの簡略化されたモデルを示す。入力信号２０２（図１Ｃのエンコーダからの出力１０２の複製であるよう意図される）は、埋込器１１４の動作を反転する抽出器２１４を通して与えられ、信号１０４を複製する信号２０４を作る。さらなる後処理は、エンコーダ前処理を反転する。図１Ｄは、どのように抽出器が埋込器を反転するかについて説明のための内部を示し、ここでウォーターマーキングされた信号の調べることによって抽出器は、１４３を複製するデータ２４３を抽出する。ここでそれは、埋込器が加えたのと同じノイズを生成し、減ずることできる。

【0006】

しかし出力信号１０２が過負荷にならないことを確実にするためには、データ埋込ユニットにおいて追加されたノイズを考慮するためには、信号１０４がより厳しい制限値までクリップされなければならないという課題が存在する。

【発明の概要】

【発明が解決しようとする課題】

【0007】

より厳しい制限値は、実際のオーディオではトランスペアレンシを劣化させないが、フルレベルの正弦波を含むテスト信号でシステムのパフォーマンスを評価することがふつうの実務である。フルレベルの正弦波をクリップすることは、試験装置に対して可視の歪積を生じ、システム忠実度の批判を避けるために、これら歪積のレベルを最小化する必要がある。

【課題を解決するための手段】

【0008】

本発明の第１局面によれば、ロスレスでオーディオ信号にウォーターマーキングする方法であって、ノイズシェーピングされた量子化を実行すること、及びノイズシェーピングされた量子化からの出力を、ノイズシェーピングされた量子化への入力の傾き０．５を用いて量子化された線形関数のペアによって計算された制限値にクリッピングすることを含む方法が提供される。

【0009】

このようにして、本発明は、フルスケールテスト試料に対して、ウォーターマーキング操作を正確に逆転する能力を確保しながら、オリジナルのオーディオ信号の完全な複製物を復元するために、WO2015150746A1に記載された技術のトランスペアレンシを向上する。

【0010】

本発明は、大まかには以下によってこれを達成する。

【0011】

（ｉ）データ埋込器への入力１０４が、ピーク表現可能な値を得ることを可能にすること、
（ｉｉ）ウォーターマーキングされた信号を、ノイズシェーピングされた量子化器への入力の量子化された線形関数である制限にクリッピングすることによって埋込器によって導入された過負荷を扱うことであって、ここで量子化は、制限が信号と同じウォーターマーキング情報を運ぶことを確実にし、線形関数は傾き０．５を有する、
（ｉｉｉ）データ埋込器への入力１０４を検査し、ピーク表現可能な値に近いときは再構築データの追加のビットを作り、これによりデコーダは、ユニティよりも小さい０．５の傾きによって、導入された曖昧さを解決することができる。

【0012】

本発明の第２局面によれば、ロスレスでウォーターマーキングされたオーディオ信号を処理する方法であって、ノイズシェーピングされた量子化を前記オーディオ信号に実行すること、及びノイズシェーピングされた量子化からの出力、及び前記オーディオ信号の傾き２を持つ量子化された線形関数のペアからなる三者のうち、中間値を選択することを含む方法が提供される。

【0013】

本発明の第３局面によれば、第１局面の方法を用いてオーディオ信号にロスレスでウォーターマーキングするよう構成されたエンコーダが提供される。

【0014】

本発明の第４局面によれば、第２局面の方法を用いてロスレスでウォーターマーキングされたオーディオ信号を処理するよう構成されたデコーダが提供される。

【0015】

本発明の第５局面によれば、第３局面によるエンコーダを第２局面によるデコーダと組み合わせて備えるコーデックが提供される。

【0016】

本発明の第６局面によれば、第１局面の方法を用いてロスレスでウォーターマーキングされたオーディオ信号を含むデータキャリヤが提供される。

【0017】

本発明の第７局面によれば、シグナルプロセッサによって実行されることで、第１又は第２局面の方法をシグナルプロセッサに実行させる命令を含むコンピュータプログラムプロダクトが提供される。

【0018】

当業者には理解されるように、本発明は、オーディオ信号のトランスペアレントなロスレスウォーターマーキングを向上させ、一方で、オリジナルのオーディオの完全な複製物を復元するために、ウォーターマーキング操作の逆転を可能にする技術及び装置を提供する。さらなる変形例及び装飾例が本開示を参酌すれば当業者には明らかになろう。

【図面の簡単な説明】

【0019】

本発明の例は、添付の図面を参照して詳細に説明される。

【図1A】図１Ａは、トランスペアレントなロスレスオーディオウォーターマーキングのための既知のエンコーダの信号フロー図を示す。

【図1B】図１Ｂは、図１Ａのエンコーダに対応する既知のデコーダの信号フロー図を示す。

【図1C】図１Ｃは、図１Ａの信号フロー図の簡略化モデルを示す。

【図1D】図１Ｄは、図１Ｂの信号フロー図の簡略化モデルを示す。

【図2】図２は、本発明の実施形態によるエンコーダを示し、これは図１Ｃの埋込器の周辺にインスペクタ及びクリップユニットを追加する。

【図3】図３は、正のクリップリミットLΔの領域における取り得る信号値を示す。

【図4】図４は、図２のエンコーダに対応する本発明の実施形態によるデコーダを示し、図１Ｄのデコーダにアンクリップユニット及びLsb強制ユニットを追加している。

【図5】図５は、本発明の第２実施形態によるエンコーダを示す。

【図6】図６は、図５のエンコーダに対応する本発明の第２実施形態によるデコーダを示す。

【図7】図７は、本発明の第４実施形態においてクリッピングが起こったときにノイズシェーピングをディセーブルするための信号フローを示す。

【発明を実施するための形態】

【0020】

本発明の必要は、可逆性要件から来る。これがもしないなら、ウォーターマークを保存したいかなる形態のクリップもウォーターマーキングされた信号に対して実行され得ることになる。

【0021】

表記法
表現[a,b]は、端点a及びbの両方を含むa及びbの間の閉区間を意味するものとして用いる。表現[a,b)は、端点aは含むがbは含まないa及びbの間の半開区間を意味する。

【0022】

Δは、オーディオの量子化ステップサイズを意味するものとして用い、L（偶数であると想定する）は、エンコーダ出力１０５でのサンプル値の制限を[-LΔ,+LΔ)のように記すために用いる。±LΔは、ピークの表現可能な値の意味である。

【0023】

オーディオ値xのlsbというときは、(floor(x/Δ)modulo 2)を意味し、ここでfloor(y)はyを超えない最大の整数である。

【0024】

埋込器（Burier）１１４で加えられたノイズのピークレベルをkで表すと、ノイズの値は、範囲[-kΔ,+kΔ]に存在する。kは整数であることが要求されるので、ノイズの丸められたピークレベルを意味する。

【0025】

導入の実施形態
図１Ｃの信号１０４及び１０２がΔの整数倍であるときに使用するのに適した本発明の実施形態をまず説明する。これは、特に便利な実施形態というわけではないが、それは、制約条件がWO2015150746のウォーターマーキング方法を除外するからであるが、複雑さが増したものを扱う前に本発明の本質的な特徴を導入することができる。

【0026】

図２は、本発明によるエンコーダを示し、埋込器１１４の周辺で２つの要素を追加する。第１に、もしオーディオがピークの表現可能な値±LΔに近いならオーディオのlsbをデータ１４４として送るインスペクタ１３４である。第２に、クリッピング（最小動作１７１及び最大動作１７２によって実現される）が、線形関数１５１及び１５２及び量子化器１６１及び１６２によって入力１０４から埋込器１１４に得られた制限値にクリップするクリップユニット１１５である。

【0027】

信号１０４は、フルレンジ[-LΔ,+LΔ)を行使し、よって埋込器１１４がノイズを追加するので、その出力信号１０２は、このレンジを超え得る。結果として、信号１０５がレンジ[-LΔ,+LΔ)の中に存在することを確実にするために対策が取られなければならない。クリッパ１１５がこの対策を行う。

【0028】

しかしクリッピングは、クリップポイント付近の何個かの入力サンプル値をより少ない数の出力サンプル値に割り当てるのでオーディオストリームから情報を落としてしまう。この失われた情報のためのサイドパスが必要であり、これはオーディオデータを検査し、もし必要なら、クリッピングに本質的に存在する情報の損失にもかかわらずデコーダが元の信号を再構築することを可能にするデータ１４４を送信するインスペクタ１３４によって提供される。

【0029】

理想的にはこのデータ１４４は、クリッピングで廃棄された情報を正確に伝達するはずであり、よってクリッパ１１５が曖昧さを生じるときにだけ送られることになる。しかし、これは非実用的であるが、それは、デコーダにわたってデータを渡すのに利用可能な唯一のチャネルは、それをデータ１４３、及び（図１Ｃに示されるように）埋込器１１４によって追加されたノイズにマルチプレクシングすることによってであり、その結果、クリッピングが具体的な場合に実際に起こるかは、データ１４３に依存する。この循環性のために、クリッピングがひょっとしたら起こるかもしれないことを信号１０４（データ１４３に依存しない）が示すときにはいつでも、データ１４４が送信される必要がある。

【0030】

これらの状況下では、どのようなものであれ発生する曖昧さを解決するのに、１ビットのデータがあれば十分であるようにし、それによってインスペクタは、デコーダがデータの曖昧さを解決する必要があるかもしれない±LΔに信号１０４が十分に近いときにはいつでも、オーディオのlsbを送信するよう、クリッパ１１５が設計されるのがデータ効率の点で良い。十分に近いとはどういう意味なのかについては後述する。

【0031】

クリッパ１１５の設計を説明することに移るが、デコーダは、曖昧さを解決するためにたかだか１ビットしか供給されていないので、クリッパは、いかなる出力値１０５も、信号１０４の２個より多い値にマッピングされないことを確実にしなければならない。またクリッピングは、信号に対する改変を最小化することも望まれる。したがって正のクリップポイントを考慮すれば、信号１０４の最も大きい２つの取り得る値が、信号１０５の最も大きい値にマッピングされることが好ましく、次の２つの最も大きい取り得る値が信号１０５の次に最も大きい値にマッピングされ、クリッパが信号を改変しない、クリッピングのためのさらなる必要がなくなるまで同様に続く。

【0032】

これは、まさにクリッパ１１５が実現することである。この実現例では、伝達関数１６１及び１６２は、Q(x)=Δfloor(x/Δ)であり、線形関数１５１及び１５２は、xを0.5(x+LΔ)及び0.5(x-LΔ)にそれぞれマッピングする。正のクリップポイントは、信号１０２を、信号１０４の量子化された線形関数にクリップする最小操作１７１によって達成される。線形関数１５１を見ると、傾き0.5は、信号１０４の２つの値が信号１０５のそれぞれの値にマッピングされることを確実にし、一方でオフセット0.5LΔは、信号１０４の最も大きい２つの値を信号１０５の最も大きい取り得る値にマッピングする。最後に、最小操作１７１は、クリッピングのためのさらなる必要がなくなったときに、信号１０４の２つの値を信号１０５のあらゆる値にマッピングすることを止めることを確実にする。

【0033】

これは図３に示され、この図は、正のクリップリミットLΔの領域にある取り得る信号値を示す。信号１０４のピーク値に近いものについては、線形関数１５１の出力、及び最小操作１７１によって実現される正のクリッピングポイントをプロットする。データ埋込器１１４で導入されるノイズのせいで信号１０２が取り得る値の例示的範囲も示す。

【0034】

よって図３は、信号１０２の範囲（例示的なk=4について）、線形関数１５１の出力、及び量子化１６１の後のクリップポイントを示す。信号１０４が変化すると、+LΔから離れる値は、埋込器１１４が何をしようともいかなる信号の改変をも意味しない。信号１０４が増加すると、ノイズのより大きい+ve値は、最も大きい取り得る信号１０４について、ノイズの全ての正の値がクリッピングにつながるまで、クリッピングにつながる。埋込器１１４によって加えられたノイズの瞬時値がどうであれ、任意の出力値１０５につながる信号１０４の値は、たかだか２つ存在するだけであり、サイドチャネルデータ１４４の１ビットがあれば曖昧さを解決するのには十分である。

【0035】

負のクリップポイントは、最大操作１７２、線形関数１５２、及び量子化器１６２によって実現され、正のクリップポイントについてのときと同様の特性を持つ。

【0036】

クリッパ１１５の形態を議論してきたので、ここでインスペクタ１３４における「十分に近い」ことを定義することに戻る。+veクリッピングによって改変され得る信号１０４の最も小さい値は、(L-2k+1)Δであり、このクリッピングは、(L-2k)Δと同じ出力を発生することにつながりえる。同様に、-veクリッピングによって影響され得る最も大きい値は、(-L+2k-2)Δであり、これは、(-L+2k-1)Δと同じ出力を発生し得る。その結果として、インスペクタ１３４は、信号１０４が

【0037】

【数1】

【0038】

であるときはいつでもlsbを送信する。

【0039】

この計算において、kの正確な値を使う必要はなく、より大きい値でも、わずかにデータコストが高くなるだけで正確な操作ができる（lsbは、曖昧さが起こり得ないようなときでも送信され得るので）。しかしデータコストを上回る計算の便利さが２のべき乗を使えばひょっとすると得られるかもしれない。この場合、より大きな、おそらくは4kΔまでのガードバンドが用いられ得る。

【0040】

図４は、図２のエンコーダに対応するデコーダを示し、これは、図１Ｄのデコーダにアンクリップユニット２１５及びLsb強制ユニット２３４を加えている。アンクリップユニット２１５は、エンコーダクリップユニット１１５によってなされた任意の信号改変をおおまかには反転し、Lsb強制器(Forcer)は、オーディオのlsbを強制する(force)ために、補足データ２４４を用いて反転を完了する。

【0041】

よってエンコーダと同様に、図１Ｄの抽出器２１４は、アンクリップ２１５及びLsb強制器２３４（抽出器２１４によって抽出されたデータ２４３からデマルチプレクシングされたデータ２４４によって駆動される）によって強化される。これらが組み合わさって、クリップ１１５によってなされた任意の信号改変を反転し、よって信号２０４は、エンコーダの信号１０４のロスレス複製物になる。

【0042】

これを把握するために、まず正のクリップリミット+LΔ付近の操作を考慮しよう。線形関数２５１及び２５２は、エンコーダにおける線形関数１５１及び１５２への逆転マッピング（inverse mappings）であり、xを2(x-LΔ)及び2(x+LΔ)にそれぞれマッピングする。

【0043】

もしエンコーダがクリッピングされると、信号１０５は、量子化器１６１からの出力と等しくなり、これは今度は0.5(x+LΔ)-εに等しく、ここで信号１０４はxとして表し、量子化器１６１からの改変はε（0又は0.5Δのいずれか一方である）として表す。

【0044】

線形関数２５１からの出力は、2(0.5(x+LΔ)-ε)-LΔ=x-2εとして計算され得て、これはΔと、x又はx-Δのいずれかとの偶数倍である。

【0045】

エンコーダがクリッピングされるので、信号１０２＞信号１０５であることがわかっている。信号２０５は、信号１０５の複製であり、抽出器２１４は、埋込器１１４によって追加されたのと同じノイズを減じ、これは信号１０４＞信号２０２を意味し、よって信号２０２≦信号１０４-Δ＝x-Δである。その結果、最大操作２７１は、信号２０６が線形関数２５１の出力に等しいことを確実にし、よって信号２０６は、Δと、x又はx-Δのいずれかとの偶数倍である。２３４におけるlsbを復元することは、信号２０４が信号１０４の複製物となることを確実にする。

【0046】

もしエンコーダがクリッピングしないなら、最大操作２７１は、効果を有さず、信号２０６は、信号１０４の複製物となる。lsbを正しい値に強制すること（もし２３４で起これば）は、信号にはなんの影響も有さず、信号２０４も要求されるように信号１０４の複製物になる。同様に、操作２５２、２７２、及び２３４は、エンコーダ内で起こった負の制限への任意のクリッピングを逆転させ、そうでなければ効果を有しないことがわかろう。

【0047】

考慮すべき残っている一つの問題は、Lsb強制器２３４のデータ消費である。これは、１ビットのデータを消費し、もし信号２０６が「レールに近い」なら、インスペクタ１３４においてのものと同じ「レールに近い」の定義を用いる。信号２０６は、常に信号１０４の複製物となるわけではないから、「レールに近い」の定義は、ビットを送信するか送信しないかの判断点が、信号２０６が信号１０４の複製物になる領域に存在することを確実にするよう選ばれる。

【0048】

量子化グリッド
本発明の第２実施形態において、信号は、WO2015150746A1において議論されるように、量子化グリッドに存在するよう定義される。それらは、Δの整数倍である点から、サンプルごとによって変化し得るオフセットだけずらされる。

【0049】

信号１０４，２０２，２０４，２０６及び量子化器２６１及び２６２の出力は、全て同じ量子化グリッドの上に存在し、これはWO2015150746A1との互換性のためにO₃と呼ぶ。信号１０２，１０５，２０５は、他の量子化グリッドO₂上に全て存在する。グリッドO₃は、全く同じにゼロ（オフセットがないことに対応する）であり得るが、ふつうは、エンコーダ及びデコーダ間で同期がとられる疑似ランダムシーケンスによって定義される。グリッドO₂は、データ１４３に依存し、オーディオをウォーターマーキングするためのWO2015150746A1において記載されたメカニズムである。量子化グリッドを定義するオフセットは、範囲[0,Δ)に存在するよう正規化する。

【0050】

第２実施形態によるエンコーダは、図５に示され、ここではオフセッタ１１６は、クリップ１１５がウォーターマークを改変しないことを確実にする。信号１０４のオフセットO₃は、実際には量子化器１６１又は１６２の出力に影響を与えず、εを0.5O₃だけ増加させる。しかし、クリップ１１５がウォーターマークを保存する（すなわち信号１０５はクリッピングが起こるときも依然としてO₂上に存在する）ことを確実にする必要がある。これは、オフセッタ１１６によってなされ、これは、オフセットO₂を量子化器１６１及び１６２の出力に加える。エンコーダは、O₂を知っているが、これは、もし必要があれば、信号１０２からそれ自身の量子化されたバージョンを引くことによって計算され得る。

【0051】

本発明の第２実施形態による対応するデコーダは、図６に示される。量子化器２１７は、オフセットO₂を線形関数２５１及び２５２に与えられた信号から除去し、オフセッタ２１６は、オフセットO₃をその出力に加え、それが要求されたグリッドに存在するようにする。よって量子化器２１７は、エンコーダ内のオフセッタ１１６について補償し、オフセッタ２１６は、信号２０６が正しい量子化グリッド上に存在することを確実にする。

【0052】

ベクトル量子化
本発明の第３実施形態において、量子化グリッドO₂及びO₃の信号は、WO2015150746A1で示唆されるようにベクトル量子化され、この文献においては{[2^-16,2^-16],[2^-16,-2^-16]}によって定義される量子化格子が説明されている。

【0053】

この実施形態において、一方のチャネルのクリッピングが他方のチャネルに影響を与えないようにモノフォニック的に操作をするようクリッピングしたい。これは、Δをそれぞれのチャネルの格子点間の最も小さい距離であるように定義することによってなされ得る。この場合、[2^-15,0]=[2^-16,2^-16]+[2^-16,-2^-16]及び[0,2^-15]=[2^-16,2^-16]-[2^-16,-2^-16]であり、よってそれぞれのチャネルについてΔ=2^-15であるように定義できる。これは、オーディオの量子化ステップサイズとしてのΔに関する我々の定義からのわずかなずれであるが、全てが意図されるようにモノラル的に動作するようにできる。

【0054】

唯一のわずかな例外は、オフセッタ１１６及び２１６によって加えられたオフセットが、量子化グリッドO₂及びO₃と共に、他方のチャネルのパリティも考慮しなければならないことである。しかし正しいオフセットは、信号１０２及び２０２を、オフセッタ内で用いるためのそれら自身の量子化されたバージョンからそれぞれ減じることによって得られる。

【0055】

ノイズシェーピングをディセーブルすること
本発明の第４実施形態において、埋込器１１４は、ノイズシェーピングされた量子化器（すなわち図１Ａにおける量子化器１１２及びフィルタ１１２）によって実際には実現されることに注意されたい。

【0056】

クリッピングが動作中である時は、ノイズシェーピングされていない信号１０５に瞬間的な変化を与える。我々はこれらの変化をノイズシェーピングするよう試みないが、それらの存在は、量子化器１１２によって作られたより小さい（かつ必ずしも同じ極性ではない）誤差をノイズシェーピングすることを無意味なものにする。

【0057】

本発明の第４実施形態によれば、図７に示されるように、エンコーダ埋込器１１４におけるノイズシェーピングをディセーブルし、ここでマルチプレクサ１１５は通常、量子化器１１２の出力をフィードバックするが、代わりにクリッピングが起こるときにはその入力をフィードバックする。よってマルチプレクサ１１５は、量子化器１１２によって作られた誤差をシェーピングするか（右側位置で）、又はシェーピングしないか（左側位置で）を選択する。

【0058】

同様に、フィードバックは、デコーダ抽出器２１４において同期したやり方で改変される。

【0059】

デコーダは、信号２０２及び２０４を比較できる操作２３４が終わるまでクリッピングが起こったかをカテゴリ的には知らない。これは、実現するには不便になるはずなので、好ましくはデコーダは、代わりに信号２０６に基づいてフィードバックをディセーブルすることを決定する。エンコーダ及びデコーダ間の同期を維持するために、エンコーダは、ロックステップで動作しなければならず、これはデコーダ信号２０６をシミュレートし、同じロジックを適用することによってなされ得る。

【0060】

良く定義されたデジタルシグネチャ
本発明の第５実施形態において、デコーダは、データストリーム２４３において運ばれるオーディオのデジタルシグネチャをベリファイすることによってストリームを認証することが望ましい。

【0061】

シグネチャが計算されるオーディオは、埋め込まれたデータ１４３から独立していることが好ましいが、一方で、デコードなしで認証だけを実行する計算負荷を最小化するために、デコードプロセスの初期においてアクセスされ得ることも好ましい。信号２０６は、認証のための良い点を提供するが、この点においてオーディオのlsbは、もしクリッピングが起こったとしても、起こらなかったとしても、定義が不明確である。

【0062】

したがって本発明によるデコーダの第５実施形態では、オーディオストリームは、オーディオがレールに近いときに、信号２０６のlsbを強制する（forcing）ことによってデジタルシグネチャをベリファイするために作られる。これは、ちょうどLsb強制器２３４と同じであるが、それがデータを消費せず、代わりにlsbを便利なように選ばれた値に強制する（例えばそれをクリアする）点が異なる。

【0063】

対応するように、本発明によるエンコーダの第５実施形態では、オーディオストリームは、オーディオがレールの近くであるとき、信号１０４のlsbを強制することによってデジタルシグネチャを計算するために作られる。

【0064】

演算についての注記
クリップ及びアンクリップ操作を実行するための演算は、多くのやり方で再構成され得る。例えば、最大／最小操作１７１，１７２，２７１，及び２７２を実行する代わりに、調整が計算され得て（通常はゼロであるが、クリッピングが起こるときはΔの整数倍である）、信号１０２又は２０２に加えられる。

【0065】

計算された制限へのクリッピングは、３つの信号（１０２及びオフセッタ１１６の出力）のうちの中間を選択することと等価である。明らかではないが、アンクリッピングしているデコーダは、３つの信号（２０２及びオフセッタ２１６の出力）のうちの中間を選択することもしている。

【0066】

クリッピングもアンクリッピングも、線形関数の両方の計算を必ずしも必要としない。例えば、正の値を扱うときは、明らかに-LΔの周辺の操作に影響を与える線形関数は、信号を改変することはなく、負の値についても逆が言える。

【図1A】