IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ホアウェイ・テクノロジーズ・カンパニー・リミテッドの特許一覧

特許7477247ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置
<>
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図1
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図2
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図3
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図4
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図5
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図6
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図7
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図8
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図9
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図10
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図11
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図12
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図13
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図14
  • 特許-ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-22
(45)【発行日】2024-05-01
(54)【発明の名称】ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置
(51)【国際特許分類】
   G10L 19/008 20130101AFI20240423BHJP
   G10L 19/07 20130101ALI20240423BHJP
【FI】
G10L19/008
G10L19/07
【請求項の数】 8
【外国語出願】
(21)【出願番号】P 2022164615
(22)【出願日】2022-10-13
(62)【分割の表示】P 2020570100の分割
【原出願日】2019-06-27
(65)【公開番号】P2022188262
(43)【公開日】2022-12-20
【審査請求日】2022-10-17
(31)【優先権主張番号】201810701919.1
(32)【優先日】2018-06-29
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】504161984
【氏名又は名称】ホアウェイ・テクノロジーズ・カンパニー・リミテッド
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】シュロモット、エヤル
(72)【発明者】
【氏名】ギブス、ジョナサン アラステア
(72)【発明者】
【氏名】リ、ハイティン
【審査官】渡部 幸和
(56)【参考文献】
【文献】国際公開第2012/066727(WO,A1)
【文献】特表2007-529021(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00
(57)【特許請求の範囲】
【請求項1】
第1チャネルおよび第2チャネルの信号を有する音声信号のフレームを取得する段階と、
前記第1チャネルの信号の複数の第1イニシャル線スペクトル周波数(LSF)パラメータを取得する段階と、
前記第2チャネルの信号の複数の第2イニシャルLSFパラメータを取得する段階と、
前記複数の第2イニシャルLSFパラメータに対する平均ベクトルを用いて前記複数の第1イニシャルLSFパラメータのそれぞれにスペクトラム拡散を実行して、複数の第1拡散LSFパラメータを取得する段階と、
少なくとも前記複数の第1拡散LSFパラメータと、前記複数の第2イニシャルLSFパラメータとに応じて前記第2チャネルの信号の複数のLSF残差を取得する段階と、
前記複数のLSF残差を符号化して、前記フレームに対応する符号化されたビットストリームを取得する段階と、
前記符号化されたビットストリームを送信する段階と、
を備える方法。
【請求項2】
第1チャネルおよび第2チャネルの信号を有する音声信号のフレームを取得する段階と、
前記第1チャネルの信号の複数の第1イニシャル線スペクトル周波数(LSF)パラメータを取得する段階と、
前記第2チャネルの信号の複数の第2イニシャルLSFパラメータを取得する段階と、
前記複数の第1イニシャルLSFパラメータと、前記複数の第2イニシャルLSFパラメータとの間の差を取得する段階と、
前記差が予め設定された閾値以上である場合に前記複数の第1イニシャルLSFパラメータのそれぞれにスペクトラム拡散を実行して、複数の第1拡散LSFパラメータを取得する段階と、
少なくとも前記複数の第1拡散LSFパラメータと、前記複数の第2イニシャルLSFパラメータとに応じて前記第2チャネルの信号の複数のLSF残差を取得する段階と、
前記複数のLSF残差を符号化して、前記フレームに対応する符号化されたビットストリームを取得する段階と、
前記符号化されたビットストリームを送信する段階と、
を備える方法。
【請求項3】
前記複数の第1イニシャルLSFパラメータおよび前記複数の第1拡散LSFパラメータは、
【数1】
を満たし、
LSFSB(i)は、前記複数の第1拡散LSFパラメータのうち、i番目の第1拡散LSFパラメータを表し、
【数3】
は、前記複数の第1イニシャルLSFパラメータのうち、i番目の第1イニシャルLSFパラメータを表し、
βは、0<β<1の拡散率を表し、
【数4】
は、前記複数の第2イニシャルLSFパラメータに対応する平均ベクトルを表す、
請求項1または2に記載の方法。
【請求項4】
前記複数の第1拡散LSFパラメータと、前記複数の第2イニシャルLSFパラメータとの間の複数の第1の差を取得する段階をさらに備え、
前記複数の第1の差は、前記複数のLSF残差である、請求項1から3の何れか一項に記載の方法。
【請求項5】
前記複数の第1拡散LSFパラメータに対して2ステージ予測を実行して複数の予測されたLSFパラメータを取得する段階と、
前記複数の予測されたLSFパラメータと前記複数の第2イニシャルLSFパラメータとの間の複数の第2の差を取得する段階と、
をさらに備え、
前記複数の第2の差は、前記複数のLSF残差である、
請求項1から3の何れか一項に記載の方法。
【請求項6】
請求項1から5の何れか一項に記載の方法をコンピュータに実行させるプログラムを記録したコンピュータ可読記憶媒体。
【請求項7】
請求項1から5の何れか一項に記載の方法をコンピュータに実行させるコンピュータプログラム。
【請求項8】
メモリと、
前記メモリに接続されて請求項1から5の何れか一項に記載の方法を実行するよう構成された少なくとも1つのプロセッサと、
を備えるステレオ信号符号化装置。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、2018年6月29日に中国特許庁に出願された、参照によって全体として本明細書に組み込まれる「ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置」という名称の中国特許出願第201810701919.1号の優先権を主張するものである。
【0002】
本願は音声分野に関し、より具体的には、ステレオ信号符号化方法および装置、ならびに、ステレオ信号復号方法および装置に関する。
【背景技術】
【0003】
時間領域ステレオ符号化/復号方法において、エンコーダ側は最初にステレオ信号に対してチャネル間時間差推定を実行し、推定結果に基づいてタイムアライメントを実行してから、タイムアライメントされた信号に対して時間領域ダウンミックスを実行し、最後に、ダウンミックス後に取得されるプライマリチャネル信号およびセカンダリチャネル信号を別々に符号化して符号化ビットストリームを取得する。
【0004】
プライマリチャネル信号およびセカンダリチャネル信号の符号化は、プライマリチャネル信号の線形予測係数(linear prediction coefficient、LPC)およびセカンダリチャネル信号のLPCを決定し、それぞれ、プライマリチャネル信号のLPCおよびセカンダリチャネル信号のLPCをプライマリチャネル信号のLSFパラメータおよびセカンダリチャネル信号のLSFパラメータに変換してから、プライマリチャネル信号のLSFパラメータおよびセカンダリチャネル信号のLSFパラメータに対する量子化を実行することを含み得る。
【0005】
プライマリチャネル信号のLSFパラメータおよびセカンダリチャネル信号のLSFパラメータに対して量子化を実行するプロセスは、プライマリチャネル信号の元のLSFパラメータを量子化してプライマリチャネル信号の量子化されたLSFパラメータを取得すること、プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間の距離に基づいて再使用判定を実行し、プライマリチャネル信号のLSFパラメータと、セカンダリチャネル信号のLSFパラメータとの間の距離が閾値以上である場合、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさず、セカンダリチャネル信号の量子化されたLSFパラメータを取得するためにセカンダリチャネル信号の元のLSFパラメータを量子化する必要があると判定すること、および、プライマリチャネル信号の量子化されたLSFパラメータおよびセカンダリチャネル信号の量子化されたLSFパラメータをビットストリームに書き込むことを含み得る。プライマリチャネル信号のLSFパラメータと、セカンダリチャネル信号のLSFパラメータとの間の距離が閾値より小さい場合、プライマリチャネル信号の量子化されたLSFパラメータのみがビットストリームに書き込まれる。この場合、プライマリチャネル信号の量子化されたLSFパラメータは、セカンダリチャネル信号の量子化されたLSFパラメータとして使用され得る。
【0006】
この符号化プロセスにおいて、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさない場合、プライマリチャネル信号の量子化されたLSFパラメータおよびセカンダリチャネル信号の量子化されたLSFパラメータの両方がビットストリームに書き込まれる必要がある。したがって、比較的大きい数のビットが符号化のために必要となる。
【発明の概要】
【0007】
本願は、ステレオ信号符号化方法および装置、ならびに、ステレオ信号復号方法および装置を提供し、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさない場合に符号化に必要なビットの数を低減することを助ける。
【0008】
第1の態様によれば、本願はステレオ信号符号化方法を提供する。符号化方法は、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する段階と、セカンダリチャネル信号のLSFパラメータの予測残差に対して量子化を実行する段階とを備える。
【0009】
符号化方法において、スペクトラム拡散が最初にプライマリチャネル信号の量子化されたLSFパラメータに対して実行され、次に、スペクトラム拡散LSFパラメータ、および、セカンダリチャネル信号の元のLSFパラメータに基づいてセカンダリチャネル信号の予測残差が判定され、予測残差に対して量子化が実行される。予測残差の値はセカンダリチャネル信号のLSFパラメータの値より小さく、予測残差の値の桁は、セカンダリチャネル信号のLSFパラメータの値の桁より小さい。したがって、セカンダリチャネル信号のLSFパラメータに対して量子化を別々に実行することと比較して、予測残差に対して量子化を実行することは、符号化に必要なビットの数の低減に役立つ。
【0010】
第1の態様に関連して、第1の可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階は、プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、スペクトラム拡散LSFパラメータを取得する段階を含み、平均伸長処理は以下の式に従って実行される。
【数1】
【0011】
ここで、
【数2】
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
【数3】
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
【数4】
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
【0012】
第1の態様に関連して、第2の可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階は、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換する段階と、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得する段階と、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得されたLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータである、段階とを含む。
【0013】
第1の態様、または、第1もしくは第2の可能な実装に関連して、第3の可能な実装において、セカンダリチャネル信号のLSFパラメータの予測残差は、セカンダリチャネル信号の元のLSFパラメータと、プライマリチャネル信号のスペクトラム拡散LSFパラメータとの間の差である。
【0014】
第1の態様、または、第1もしくは第2の可能な実装に関連して、第4の可能な実装において、セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する段階は、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、セカンダリチャネル信号の予測されたLSFパラメータを取得する段階と、セカンダリチャネル信号の元のLSFパラメータと、予測されたLSFパラメータとの間の差をセカンダリチャネル信号の予測残差として使用する、段階とを含む。
【0015】
第1の態様、または、上述の可能な実装のいずれか1つに関連して、第5の可能な実装において、セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する段階の前に、符号化方法は更に、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないと判定する段階を備える。
【0016】
セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないかどうかは、従来技術、例えば、背景技術において説明される方式に従って判定され得る。
【0017】
第2の態様によれば、本願はステレオ信号復号方法を提供する。復号方法は、ビットストリームから現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータを取得する段階と、プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、ビットストリームから、ステレオ信号における現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を取得する段階と、セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号の量子化されたLSFパラメータを決定する段階とを備える。
【0018】
復号方法において、セカンダリチャネル信号の量子化されたLSFパラメータは、セカンダリチャネル信号の予測残差、および、プライマリチャネル信号の量子化されたLSFパラメータに基づいて決定され得る。したがって、セカンダリチャネル信号の量子化されたLSFパラメータは、ビットストリームにおいて記録される必要がないことがあり得るが、セカンダリチャネル信号の予測残差は記録される。このことは、符号化に必要なビットの数を低減することに役立つ。
【0019】
第2の態様に関連して、第1の可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階は、プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階を含み、平均伸長処理は以下の式に従って実行される。
【数1】
【0020】
ここで、
【数2】
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
【数3】
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
【数4】
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
【0021】
第2の態様に関連して、第2の可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階は、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換する段階と、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得する段階と、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得されたLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータである、段階とを含む。
【0022】
第2の態様、または、第1もしくは第2の可能な実装に関連して、第3の可能な実装において、セカンダリチャネル信号の量子化されたLSFパラメータは、スペクトラム拡散LSFパラメータと予測残差との和である。
【0023】
第2の態様、または、第1もしくは第2の可能な実装に関連して、第4の可能な実装において、セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号の量子化されたLSFパラメータを決定する段階は、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得する段階と、予測されたLSFパラメータと予測残差との和をセカンダリチャネル信号の量子化されたLSFパラメータとして使用する段階とを含む。
【0024】
第3の態様によれば、ステレオ信号符号化装置が提供される。符号化装置は、第1の態様、または、第1の態様の可能な実装のいずれか1つによる符号化方法を実行するよう構成されるモジュールを含む。
【0025】
第4の態様によれば、ステレオ信号復号装置が提供される。復号装置は、第2の態様、または、第2の態様の可能な実装のいずれか1つによる方法を実行するよう構成されるモジュールを含む。
【0026】
第5の態様によれば、ステレオ信号符号化装置が提供される。符号化装置はメモリおよびプロセッサを含む。メモリはプログラムを格納するよう構成される。プロセッサはプログラムを実行するよう構成される。プログラムをメモリにおいて実行する場合、プロセッサは、第1の態様、または、第1の態様の可能な実装のいずれか1つによる符号化方法を実装する。
【0027】
第6の態様によれば、ステレオ信号復号装置が提供される。復号装置はメモリおよびプロセッサを含む。メモリはプログラムを格納するよう構成される。プロセッサはプログラムを実行するよう構成される。プログラムをメモリにおいて実行する場合、プロセッサは、第2の態様、または、第2の態様の可能な実装のいずれか1つによる復号方法を実装する。
【0028】
第7の態様によれば、コンピュータ可読記憶媒体が提供される。コンピュータ可読記憶媒体は、装置またはデバイスによって実行されるプログラムコードを格納し、プログラムコードは、第1の態様、または、第1の態様の可能な実装のいずれか1つによる符号化方法を実装するために使用される命令を含む。
【0029】
第8の態様によれば、コンピュータ可読記憶媒体が提供される。コンピュータ可読記憶媒体は、装置またはデバイスによって実行されるプログラムコードを格納し、プログラムコードは、第2の態様、または、第2の態様の可能な実装のいずれか1つによる復号方法を実装するために使用される命令を含む。
【0030】
第9の態様によれば、チップが提供される。チップはプロセッサおよび通信インタフェースを含む。通信インタフェースは、外部デバイスと通信するよう構成される。プロセッサは、第1の態様、または、第1の態様の可能な実装のいずれか1つによる符号化方法を実装するよう構成される。
【0031】
任意選択で、チップはメモリを更に含み得る。メモリは命令を格納する。プロセッサは、メモリに格納される命令を実行するよう構成される。命令が実行されるとき、プロセッサは、第1の態様、または、第1の態様の可能な実装のいずれか1つによる符号化方法を実装するよう構成される。
【0032】
任意選択で、チップは端末デバイスまたはネットワークデバイスに統合され得る。
【0033】
第10の態様によれば、チップが提供される。チップはプロセッサおよび通信インタフェースを含む。通信インタフェースは外部デバイスと通信するよう構成される。プロセッサは、第2の態様、または、第2の態様の可能な実装のいずれか1つによる復号方法を実装するよう構成される。
【0034】
任意選択で、チップはメモリを更に含み得る。メモリは命令を格納する。プロセッサは、メモリに格納された命令を実行するよう構成される。命令が実行されるとき、プロセッサは、第2の態様、または、第2の態様の可能な実装のいずれか1つによる復号方法を実装するよう構成される。
【0035】
任意選択で、チップは端末デバイスまたはネットワークデバイスに統合され得る。
【0036】
第11の態様によれば、本願の実施形態は、命令を含むコンピュータプログラムプロダクトを提供する。コンピュータプログラムプロダクトがコンピュータ上で動作するとき、コンピュータは、第1の態様による符号化方法を実行することが可能となる。
【0037】
第12の態様によれば、本願の実施形態は、命令を含むコンピュータプログラムプロダクトを提供する。コンピュータプログラムプロダクトがコンピュータ上で動作するとき、コンピュータは、第2の態様による復号方法を実行することが可能となる。
【図面の簡単な説明】
【0038】
図1】本願の一実施形態による、時間領域におけるステレオ符号化および復号システムの概略構造図である。
【0039】
図2】本願の一実施形態による、移動端末の概略図である。
【0040】
図3】本願の一実施形態による、ネットワーク要素の概略図である。
【0041】
図4】プライマリチャネル信号のLSFパラメータ、および、セカンダリチャネル信号のLSFパラメータに対する量子化を実行する方法の概略フローチャートである。
【0042】
図5】本願の一実施形態によるステレオ信号符号化方法の概略フローチャートである。
【0043】
図6】本願の一実施形態による、ステレオ信号符号化方法の概略フローチャートである。
【0044】
図7】本願の一実施形態による、ステレオ信号符号化方法の概略フローチャートである。
【0045】
図8】本願の一実施形態によるステレオ信号符号化方法の概略フローチャートである。
【0046】
図9】本願の一実施形態によるステレオ信号符号化方法の概略フローチャートである。
【0047】
図10】本願の一実施形態によるステレオ信号復号方法の概略フローチャートである。
【0048】
図11】本願の一実施形態によるステレオ信号符号化装置の概略構造図である。
【0049】
図12】本願の一実施形態によるステレオ信号復号装置の概略構造図である。
【0050】
図13】本願の別の実施形態によるステレオ信号符号化装置の概略構造図である。
【0051】
図14】本願の別の実施形態によるステレオ信号復号装置の概略構造図である。
【0052】
図15】プライマリチャネル信号およびセカンダリチャネル信号の線形予測スペクトル包絡線の概略図である。
【発明を実施するための形態】
【0053】
図1は、本願の例示的な実施形態による、時間領域におけるステレオ符号化および復号システムの概略構造図である。ステレオ符号化および復号システムは、符号化コンポーネント110および復号コンポーネント120を含む。
【0054】
本願におけるステレオ信号は元のステレオ信号であり得、複数のチャネル上の信号に含まれる2つの信号を含むステレオ信号であり得、または、複数のチャネル上の信号に含まれる複数の信号から共同生成された2つの信号を含むステレオ信号であり得ることが理解されるべきである。
【0055】
符号化コンポーネント110は、時間領域においてステレオ信号を符号化するよう構成される。任意選択で、符号化コンポーネント110は、ソフトウェア、ハードウェア、またはソフトウェアおよびハードウェアの組み合わせの形式で実装され得る。これについては、本願の実施形態において限定されるものではない。
【0056】
符号化コンポーネント110が時間領域においてステレオ信号を符号化することは、以下の段階を含み得る。
【0057】
(1)取得されたステレオ信号に対して時間領域前処理を実行して、時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号を取得する。
【0058】
ステレオ信号は収集コンポーネントによって収集され、符号化コンポーネント110へ送信され得る。任意選択で、収集コンポーネントおよび符号化コンポーネント110は同一のデバイスに配置され得る。代替的に、収集コンポーネントおよび符号化コンポーネント110は異なるデバイスに配置され得る。
【0059】
時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号は、前処理されたステレオ信号における2つのチャネル上の信号である。
【0060】
任意選択で、時間領域前処理は、ハイパスフィルタリング処理、プリエンファシス処理、サンプリングレート変換、およびチャネル切り替えのうち少なくとも1つを含み得る。これについては、本願の実施形態において限定されるものではない。
【0061】
(2)時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号に基づいて時間推定を実行し、時間領域前処理された左チャネル信号と時間領域前処理された右チャネル信号との間のチャネル間時間差を取得する。
【0062】
例えば、左チャネル信号と右チャネル信号との間の相互相関関数は、時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号に基づいて計算され得る。次に、相互相関関数の最大値が検索され、最大値は時間領域前処理左チャネル信号と時間領域前処理右チャネル信号との間のチャネル間時間差として使用される。
【0063】
別の例として、左チャネル信号と右チャネル信号との間の相互相関関数は、時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号に基づいて計算され得る。次に、現在のフレームの前のLフレーム(Lは1以上の整数)の各々における左チャネル信号と右チャネル信号との間の相互相関関数に基づいて、現在のフレームにおける左チャネル信号と右チャネル信号との間の相互相関関数に対して長時間平滑化を実行し、平滑化された相互相関関数を取得する。その後、平滑化された相互相関関数の最大値が検索され、最大値に対応するインデックス値が、現在のフレームにおける時間領域前処理された左チャネル信号と時間領域前処理された右チャネル信号との間のチャネル間時間差として使用される。
【0064】
別の例として、現在のフレームの前のMフレーム(Mは1以上の整数)におけるチャネル間時間差に基づいて、現在のフレームにおける推定されたチャネル間時間差に対してフレーム間平滑化が実行され得、平滑化されたチャネル間時間差が、現在のフレームにおける時間領域前処理された左チャネル信号と時間領域前処理された右チャネル信号との間の最終的なチャネル間時間差として使用される。
【0065】
上述のチャネル間時間差推定方法は単に例であり、本願の実施形態は上述のチャネル間時間差推定方法に限定されないことを理解すべきである。
【0066】
(3)チャネル間時間差に基づいて、時間領域前処理された左チャネル信号および時間領域前処理された右チャネル信号のタイムアライメントを実行し、タイムアライメントされた左チャネル信号およびタイムアライメントされた右チャネル信号を取得する。
【0067】
例えば、現在のフレームにおける推定チャネル間時間差、および、前のフレームにおけるチャネル間時間差に基づいて、現在のフレームにおける左チャネル信号および右チャネル信号における1または2つの信号を圧縮または伸長して、タイムアライメントされた左チャネル信号とタイムアライメントされた右チャネル信号との間にチャネル間時間差が存在しないようにし得る。
【0068】
(4)チャネル間時間差を符号化して、チャネル間時間差の符号化インデックスを取得する。
【0069】
(5)時間領域ダウンミックスについてのステレオパラメータを計算し、時間領域ダウンミックスについてのステレオパラメータを符号化して、時間領域ダウンミックスについてのステレオパラメータの符号化インデックスを取得する。
【0070】
時間領域ダウンミックスについてのステレオパラメータは、タイムアライメントされた左チャネル信号、および、タイムアライメントされた右チャネル信号に対して時間領域ダウンミックスを実行するために使用される。
【0071】
(6)時間領域ダウンミックスについてのステレオパラメータに基づいて、タイムアライメントされた左チャネル信号、および、タイムアライメントされた右チャネル信号に対して時間領域ダウンミックスを実行し、プライマリチャネル信号およびセカンダリチャネル信号を取得する。
【0072】
プライマリチャネル信号は、チャネル間の関連情報を表すために使用され、ダウンミックスされた信号または中央チャネル信号とも称され得る。セカンダリチャネル信号は、チャネル間の差分情報を表すために使用され、残差信号またはサイドチャネル信号とも称され得る。
【0073】
タイムアライメントされた左チャネル信号、および、タイムアライメントされた右チャネル信号が時間領域において整合される場合、セカンダリチャネル信号が最も弱い。この場合、ステレオ信号は最高の効果を有する。
【0074】
(7)プライマリチャネル信号およびセカンダリチャネル信号を別々に符号化して、プライマリチャネル信号に対応する第1モノラル符号化ビットストリーム、および、セカンダリチャネル信号に対応する第2モノラル符号化ビットストリームを取得する。
【0075】
(8)チャネル間時間差の符号化インデックス、ステレオパラメータの符号化インデックス、第1モノラル符号化ビットストリーム、および第2モノラル符号化ビットストリームをステレオ符号化ビットストリームに書き込む。
【0076】
上述の段階すべてが必須とは限らないことに留意すべきである。例えば、段階(1)は必須ではない。段階(1)が無い場合、時間推定に使用される左チャネル信号および右チャネル信号は、元のステレオ信号における左チャネル信号および右チャネル信号であり得る。本明細書において、元のステレオ信号における左チャネル信号および右チャネル信号は、収集、および、アナログ-デジタル(A/D)変換の後に取得される信号である。
【0077】
復号コンポーネント120は、符号化コンポーネント110によって生成されたステレオ符号化ビットストリームを復号してステレオ信号を取得するよう構成される。
【0078】
任意選択で、符号化コンポーネント110は、有線または無線方式で復号コンポーネント120に接続され得、復号コンポーネント120は、復号コンポーネント120と符号化コンポーネント110との間の接続を通じて、符号化コンポーネント110によって生成されたステレオ符号化ビットストリームを取得し得る。代替的に、符号化コンポーネント110は、生成されたステレオ符号化ビットストリームをメモリに格納し得、復号コンポーネント120はメモリ内のステレオ符号化ビットストリームを読み込む。
【0079】
任意選択で、復号コンポーネント120は、ソフトウェア、ハードウェア、または、ソフトウェアおよびハードウェアの組み合わせの形式で実装され得る。これについては、本願の実施形態において限定されるものではない。
【0080】
復号コンポーネント120がステレオ符号化ビットストリームを復号してステレオ信号を取得するプロセスは以下の段階を含み得る。
【0081】
(1)ステレオ符号化ビットストリームにおける第1モノラル符号化ビットストリームおよび第2モノラル符号化ビットストリームを復号し、プライマリチャネル信号およびセカンダリチャネル信号を取得する。
【0082】
(2)ステレオ符号化ビットストリームに基づいて、時間領域アップミックスについてのステレオパラメータの符号化インデックスを取得し、プライマリチャネル信号およびセカンダリチャネル信号に対して時間領域アップミックスを実行して、時間領域アップミックスされた左チャネル信号、および、時間領域アップミックスされた右チャネル信号を取得する。
【0083】
(3)ステレオ符号化ビットストリームに基づいて、チャネル間時間差の符号化インデックスを取得し、時間領域アップミックスされた左チャネル信号、および、時間領域アップミックスされた右チャネル信号に対して実行時間調整を実行してステレオ信号を取得する。
【0084】
任意選択で、符号化コンポーネント110および復号コンポーネント120は、同一のデバイスに配置され得る、または、異なるデバイスに配置され得る。デバイスは、携帯電話、タブレットコンピュータ、ラップトップポータブルコンピュータ、デスクトップコンピュータ、Bluetooth(登録商標)サウンドボックス、録音ペン、またはウェアラブルデバイスなどの音声信号処理機能を有する移動端末であり得る、または、コアネットワークもしくは無線ネットワークにおける、音声信号処理能力を有するネットワーク要素であり得る。これについては、本願の実施形態において限定されるものではない。
【0085】
例えば、図2に示されるように、以下の例を使用して説明が提供される。符号化コンポーネント110は移動端末130に配置される。復号コンポーネント120は移動端末140に配置される。移動端末130および移動端末140は、互いに独立した、音声信号処理能力を有する電子デバイスである。例えば、移動端末130および移動端末140の各々は、携帯電話、ウェアラブルデバイス、仮想現実(virtual reality、VR)デバイス、拡張現実(augmented reality、AR)デバイスなどであり得る。加えて、移動端末130は、無線または有線ネットワークを通じて移動端末140に接続される。
【0086】
任意選択で、移動端末130は、収集コンポーネント131、符号化コンポーネント110、およびチャネル符号化コンポーネント132を含み得る。収集コンポーネント131は符号化コンポーネント110に接続され、符号化コンポーネント110は符号化コンポーネント132に接続される。
【0087】
任意選択で、移動端末140は、音声再生コンポーネント141、復号コンポーネント120、およびチャネル復号コンポーネント142を含み得る。音声再生コンポーネント141は、復号コンポーネント120に接続され、復号コンポーネント120は、チャネル復号コンポーネント142に接続される。
【0088】
収集コンポーネント131を使用してステレオ信号を収集した後に、移動端末130は、符号化コンポーネント110を使用してステレオ信号を符号化し、ステレオ符号化ビットストリームを取得する。次に、移動端末130は、チャネル符号化コンポーネント132を使用してステレオ符号化ビットストリームを符号化し、伝送信号を取得する。
【0089】
移動端末130は、無線または有線ネットワークを通じて伝送信号を移動端末140へ送信する。
【0090】
伝送信号を受信後、移動端末140は、チャネル復号コンポーネント142を使用することにより伝送信号を復号してステレオ符号化ビットストリームを取得し、復号コンポーネント120を使用することによりステレオ符号化ビットストリームを復号してステレオ信号を取得し、音声再生コンポーネント141を使用することによりステレオ信号を再生する。
【0091】
例えば、本願の本実施形態の説明では、図3に示されるように、符号化コンポーネント110および復号コンポーネント120が、コアネットワークまたは無線ネットワークにおける、音声信号処理能力を有する同一のネットワーク要素150に配置される例を使用する。
【0092】
任意選択で、ネットワーク要素150は、チャネル復号コンポーネント151、復号コンポーネント120、符号化コンポーネント110、およびチャネル符号化コンポーネント152を含む。チャネル復号コンポーネント151は復号コンポーネント120に接続され、復号コンポーネント120は符号化コンポーネント110に接続され、符号化コンポーネント110はチャネル符号化コンポーネント152に接続される。
【0093】
チャネル復号コンポーネント151は、別のデバイスによって送信された伝送信号を受信した後に、伝送信号を復号し、第1ステレオ符号化ビットストリームを取得する。復号コンポーネント120はステレオ符号化ビットストリームを復号し、ステレオ信号を取得する。符号化コンポーネント110はステレオ信号を符号化し、第2ステレオ符号化ビットストリームを取得する。チャネル符号化コンポーネント152は、第2ステレオ符号化ビットストリームを符号化し、伝送信号を取得する。
【0094】
別のデバイスは、音声信号処理能力を有する移動端末であり得る、または、音声信号処理能力を有する別のネットワーク要素であり得る。これについては、本願の実施形態において限定されるものではない。
【0095】
任意選択で、ネットワーク要素における符号化コンポーネント110および復号コンポーネント120は、移動端末によって送信されたステレオ符号化ビットストリームをトランスコードし得る。
【0096】
任意選択で、本願の実施形態において、符号化コンポーネント110が配置されるデバイスは、音声符号化デバイスと称され得る。実際の実装において、音声符号化デバイスは音声復号機能も有し得る。これについては、本願の実施形態において限定されるものではない。
【0097】
任意選択で、本願の実施形態において、ステレオ信号のみが説明のための例として使用される。本願において、音声符号化デバイスは更に、マルチチャネル信号を処理し得、マルチチャネル信号は少なくとも2つのチャネル信号を含む。
【0098】
符号化コンポーネント110は、代数符号励振線形予測(algebraic code excited linear prediction, ACELP)符号化方法を使用することによりプライマリチャネル信号およびセカンダリチャネル信号を符号化し得る。
【0099】
ACELP符号化方法は通常、プライマリチャネル信号のLPC係数、および、セカンダリチャネル信号のLPC係数を決定し、プライマリチャネル信号のLPC係数、および、セカンダリチャネル信号のLPC係数の各々をLSFパラメータに変換し、プライマリチャネル信号のLSFパラメータ、および、セカンダリチャネル信号のLSFパラメータに対して量子化を実行すること、適応符号励振を検索してピッチ周期および適応的コードブックゲインを決定し、ピッチ周期および適応的コードブックゲインに対して量子化を別々に実行すること、ならびに、代数符号励振を検索して代数符号励振のパルスインデックスおよび利得を決定し、代数符号励振のパルスインデックスおよび利得に対して量子化を別々に実行することを含む。
【0100】
図4は、符号化コンポーネント110が、プライマリチャネル信号のLSFパラメータ、および、セカンダリチャネル信号のLSFパラメータに対して量子化を実行する例示的な方法を示す。
【0101】
S410:プライマリチャネル信号に基づいてプライマリチャネル信号の元のLSFパラメータを決定する。
【0102】
S420:セカンダリチャネル信号に基づいてセカンダリチャネル信号の元のLSFパラメータを決定する。
【0103】
段階S410と段階S420との間には実行の順序が無い。
【0104】
S430:プライマリチャネル信号の元のLSFパラメータ、および、セカンダリチャネル信号の元のLSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たすかどうかを判定する。再使用判定条件は、簡潔に再使用条件とも称され得る。
【0105】
セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たさない場合、段階S440が実行される。セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たす場合、段階S450が実行される。
【0106】
再使用とは、セカンダリチャネル信号の量子化されたLSFパラメータが、プライマリチャネル信号の量子化されたLSFパラメータに基づいて取得され得ることを意味する。例えば、プライマリチャネル信号の量子化されたLSFパラメータは、セカンダリチャネル信号の量子化されたLSFパラメータとして使用される。換言すれば、プライマリチャネル信号の量子化されたLSFパラメータは、セカンダリチャネル信号の量子化されたLSFパラメータとして再使用される。
【0107】
セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たすかどうかを判定することは、セカンダリチャネル信号のLSFパラメータに対して再使用判定を実行すると称され得る。
【0108】
例えば、再使用判定条件が、プライマリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の元のLSFパラメータとの間の距離が予め設定された閾値以下であるとき、プライマリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の元のLSFパラメータとの間の距離が予め設定された閾値より大きい場合、セカンダリチャネル信号のLSFパラメータは再使用判定条件を満たさないと判定される。または、プライマリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の元のLSFパラメータとの間の距離が、予め設定された閾値以下である場合、セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たすと判定され得る。
【0109】
上述の再使用判定において使用される判定条件は単に例であり、これについては本願に限定されるものではないことが理解されるべきである。
【0110】
プライマリチャネル信号のLSFパラメータと、セカンダリチャネル信号のLSFパラメータとの間の距離は、プライマリチャネル信号のLSFパラメータと、セカンダリチャネル信号のLSFパラメータとの間の差を表すために使用され得る。
【0111】
プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間の距離は複数の方式で計算され得る。
【0112】
例えば、プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間の距離
【数22】
は、以下の式に従って計算され得る。
【数23】
【0113】
ここで、
【数3】
はプライマリチャネル信号のLSFパラメータベクトルであり、
【数8】
はセカンダリチャネル信号のLSFパラメータベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数であり、Wは第i加重係数である。
【0114】
【数22】
は加重距離とも称され得る。上述の式は単に、プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間の距離を計算するための例示的な方法であり、プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間の距離は代替的に、別の方法を使用することにより計算され得る。例えば、上述の式における加重係数は除去され得る、または、プライマリチャネル信号のLSFパラメータおよびセカンダリチャネル信号のLSFパラメータに対して減算が実行され得る。
【0115】
セカンダリチャネル信号の元のLSFパラメータに対して再使用判定を実行することは、セカンダリチャネル信号のLSFパラメータに対して量子化判定を実行するとも称され得る。判定結果がセカンダリチャネル信号のLSFパラメータを量子化することである場合、セカンダリチャネル信号の元のLSFパラメータを量子化してビットストリームに書き込み、セカンダリチャネル信号の量子化されたLSFパラメータを取得し得る。
【0116】
この段階における判定結果をビットストリームに書き込み、判定結果をデコーダ側へ送信し得る。
【0117】
S440:セカンダリチャネル信号の元のLSFパラメータを量子化してセカンダリチャネル信号の量子化されたLSFパラメータを取得し、プライマリチャネル信号のLSFパラメータを量子化してプライマリチャネル信号の量子化されたLSFパラメータを取得する。
【0118】
セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たす場合、プライマリチャネル信号の量子化されたLSFパラメータをセカンダリチャネル信号の量子化されたLSFパラメータとして直接使用することは単に例であることを理解すべきである。当然、別の方法を使用することによりプライマリチャネル信号の量子化されたLSFパラメータを再使用して、セカンダリチャネル信号の量子化されたLSFパラメータを取得し得る。これについては、本願の本実施形態において限定されるものではない。
【0119】
S450:セカンダリチャネル信号のLSFパラメータが再使用判定条件を満たす場合、プライマリチャネル信号の量子化されたLSFパラメータをセカンダリチャネル信号の量子化されたLSFパラメータとして直接使用する。
【0120】
プライマリチャネル信号の元のLSFパラメータおよびセカンダリチャネル信号の元のLSFパラメータを別々に量子化してビットストリームに書き込み、プライマリチャネル信号の量子化されたLSFパラメータおよびセカンダリチャネル信号の量子化されたLSFパラメータを取得する。この場合、比較的大きい数のビットが占有される。
【0121】
図5は、本願の一実施形態によるステレオ信号符号化方法の概略フローチャートである。再使用判定結果において、再使用判定条件が満たされないことが分かった場合、符号化コンポーネント110は図5に示される方法を実行し得る。
【0122】
S510:ステレオ信号における現在のフレーム内のプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行し、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する。
【0123】
S520:セカンダリチャネル信号の元のLSFパラメータおよびプライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する。
【0124】
図15に示されるように、プライマリチャネル信号の線形予測スペクトル包絡線とセカンダリチャネル信号の線形予測スペクトル包絡線との間には類似性がある。線形予測スペクトル包絡線はLPC係数によって表され、LPC係数はLSFパラメータに変換され得る。したがって、プライマリチャネル信号のLSFパラメータとセカンダリチャネル信号のLSFパラメータとの間には類似性がある。したがって、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいてセカンダリチャネル信号のLSFパラメータの予測残差を決定することは、予測残差の精度の改善に役立つ。
【0125】
セカンダリチャネル信号の元のLSFパラメータは、従来技術における方法を使用することによってセカンダリチャネル信号に基づいて取得されるLSFパラメータ、例えば、S420において取得される元のLSFパラメータとして理解され得る。
【0126】
セカンダリチャネル信号の元のLSFパラメータ、および、セカンダリチャネル信号の予測されたLSFパラメータに基づいてセカンダリチャネル信号のLSFパラメータの予測残差を決定することは、セカンダリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の予測されたLSFパラメータとの間の差をセカンダリチャネル信号のLSFパラメータの予測残差として使用することを含み得る。
【0127】
S530:セカンダリチャネル信号のLSFパラメータの予測残差に対して量子化を実行する。
【0128】
S540:プライマリチャネル信号の量子化されたLSFパラメータに対して量子化を実行する。
【0129】
本願の本実施形態における符号化方法において、セカンダリチャネル信号のLSFパラメータが符号化される必要がある場合、セカンダリチャネル信号のLSFパラメータの予測残差に対して量子化が実行される。セカンダリチャネル信号のLSFパラメータが別々に符号化される方法と比較して、この方法は、符号化に必要なビットの数の低減に役立つ。
【0130】
加えて、予測残差を決定するために使用される、セカンダリチャネル信号のLSFパラメータは、プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散が実行された後に取得されるLSFパラメータに基づく予測を通じて取得されるので、プライマリチャネル信号の線形予測スペクトル包絡線とセカンダリチャネル信号の線形予測スペクトル包絡線との間の類似の特徴を使用できる。このことは、プライマリチャネル信号の量子化されたLSFパラメータと比較して予測残差の精度を改善することに役立ち、デコーダ側が予測残差およびプライマリチャネル信号の量子化されたLSFパラメータに基づいてセカンダリチャネル信号の量子化されたLSFパラメータを決定する精度の改善に役立つ。
【0131】
S510、S520、S530は、複数の方式で実装され得る。以下では、図6から図9を参照して説明を提供する。
【0132】
図6に示されるように、S510はS610を含み得、S520はS620を含み得る。
【0133】
S610:プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長(pull-to-average)スペクトラム拡散を実行してプライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する。
【0134】
上述の平均伸長処理は、以下の式に従って実行され得る。
【数1】
【0135】
ここで、
【数2】
はプライマリチャネル信号のスペクトラム拡散LSFパラメータベクトルであり、βは拡散率(broadening factor)であり、
【数24】
はプライマリチャネル信号の量子化されたLSFパラメータベクトルであり、
【数4】
はセカンダリチャネル信号のLSFパラメータの平均ベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数である。
【0136】
通常、異なる符号化帯域幅には異なる線形予測階数が使用され得る。例えば、符号化帯域幅が16KHzである場合、20次線形予測が実行され得る。すなわちM=20である。符号化帯域幅が12.8KHzである場合、16次線形予測が実行され得る。すなわちM=16である。LSFパラメータベクトルは簡潔にLSFパラメータとも称され得る。
【0137】
拡散率βは予め設定された定数であり得る。例えば、βは0より大きく1より小さい予め設定された実定数であり得る。例えば、β=0.82、またはβ=0.91である。
【0138】
代替的に、拡散率βは適応的に取得され得る。例えば、異なる符号化モード、符号化帯域幅、または符号化レートなどの符号化パラメータに基づいて、異なる拡散率βが予め設定され得、次に、1または複数の現在の符号化パラメータに基づいて、対応する拡散率βが選択される。本明細書において説明される符号化モードは、音声起動検出結果、無声音および有声音の区別などを含み得る。
【0139】
例えば、以下の対応する拡散率βは、異なる符号化レートに設定され得る。
【数5】
【0140】
ここで、brateとは符号化レートを表す。
【0141】
次に、現在のフレームにおける符号化レートに対応する拡散率は、現在のフレームにおける符号化レート、および、符号化レートと拡散率との間の上述の対応関係に基づいて決定され得る。
【0142】
セカンダリチャネル信号のLSFパラメータの平均ベクトルは、大量のデータに基づく訓練を通じて取得され得るか、予め設定された定数ベクトルであり得るか、または、適応的に取得され得る。
【0143】
例えば、セカンダリチャネル信号のLSFパラメータの異なる平均ベクトルは、符号化モード、符号化帯域幅、または符号化レートなどの符号化パラメータに基づいて予め設定され得る。次に、セカンダリチャネル信号のLSFパラメータに対応する平均ベクトルは、現在のフレームにおける符号化パラメータに基づいて選択される。
【0144】
S620:セカンダリチャネル信号の元のLSFパラメータとプライマリチャネル信号のスペクトラム拡散LSFパラメータとの間の差をセカンダリチャネル信号のLSFパラメータの予測残差として使用する。
【0145】
具体的には、セカンダリチャネル信号のLSFパラメータの予測残差は以下の式を満たす。
【数6】
【0146】
ここで、
【数7】
はセカンダリチャネル信号のLSFパラメータの予測残差ベクトルであり、
【数8】
はセカンダリチャネル信号の元のLSFパラメータベクトルであり、
【数2】
はプライマリチャネル信号のスペクトラム拡散LSFパラメータベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数である。LSFパラメータベクトルは簡潔にLSFパラメータとも称され得る。
【0147】
換言すれば、プライマリチャネル信号のスペクトラム拡散LSFパラメータは、セカンダリチャネル信号の予測されたLSFパラメータとして直接使用され(この実装は、セカンダリチャネル信号のLSFパラメータに対してシングルステージ予測を実行すると称される)、セカンダリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の予測されたLSFパラメータとの間の差は、セカンダリチャネル信号のLSFパラメータの予測残差として使用され得る。
【0148】
図7に示されるように、S510はS710を含み得、S520はS720を含み得る。
【0149】
S710:プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長スペクトラム拡散を実行してプライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する。
【0150】
この段階についてはS610を参照されたい。詳細はここでは再び説明しない。
【0151】
S720:プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対してマルチステージ予測を実行してセカンダリチャネル信号の予測されたLSFパラメータを取得し、セカンダリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の予測されたLSFパラメータとの間の差をセカンダリチャネル信号の予測残差として使用する。
【0152】
セカンダリチャネル信号のLSFパラメータに対して実行された予測の回数の特定の数は、セカンダリチャネル信号のLSFパラメータに対して実行された予測のステージの特定の数と称され得る。
【0153】
マルチステージ予測は、プライマリチャネル信号のスペクトラム拡散LSFパラメータをセカンダリチャネル信号の予測されたLSFパラメータとして予測することを含み得る。予測はイントラ予測と称され得る。
【0154】
イントラ予測はマルチステージ予測の任意の位置で実行され得る。例えば、イントラ予測(すなわちステージ1予測)が最初に実行され得、次に、イントラ予測以外の予測(例えばステージ2予測およびステージ3予測)が実行される。代替的に、イントラ予測以外の予測(すなわちステージ1予測)が最初に実行され得、次に、イントラ予測(すなわちステージ2予測)が実行される。当然、イントラ予測以外の予測(すなわちステージ3予測)が更に実行され得る。
【0155】
セカンダリチャネル信号のLSFパラメータに対して2ステージ予測が実行され、ステージ1予測がイントラ予測である場合、ステージ2予測は、セカンダリチャネル信号のLSFパラメータのイントラ予測結果に基づいて(すなわち、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて)実行され得る、または、セカンダリチャネル信号の元のLSFパラメータに基づいて実行され得る。例えば、ステージ2予測は、前のフレームにおけるセカンダリチャネル信号の量子化されたLSFパラメータ、および、現在のフレームのセカンダリチャネル信号の元のLSFパラメータに基づいて、インター予測方法を使用することによって、セカンダリチャネル信号のLSFパラメータに対して実行され得る。
【0156】
2ステージ予測がセカンダリチャネル信号のLSFパラメータに対して実行され、ステージ1予測がイントラ予測であり、ステージ2予測がプライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて実行される場合、セカンダリチャネルのLSFパラメータの予測残差は以下の式を満たす。
【数9】
【数10】
【0157】
ここで、
【数7】
はセカンダリチャネル信号のLSFパラメータの予測残差ベクトルであり、
【数8】
はセカンダリチャネル信号の元のLSFパラメータベクトルであり、
【数2】
はプライマリチャネル信号のスペクトラム拡散LSFパラメータベクトルであり、
【数11】
はセカンダリチャネル信号のLSFパラメータの予測されたベクトルであり、
【数12】
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータベクトルに基づいてセカンダリチャネルのLSFパラメータに対してステージ2予測が実行された後に取得される、セカンダリチャネル信号のLSFパラメータの予測されたベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数である。LSFパラメータベクトルは簡潔にLSFパラメータとも称され得る。
【0158】
2ステージ予測がセカンダリチャネル信号のLSFパラメータに対して実行され、ステージ1予測がイントラ予測であり、ステージ2予測がセカンダリチャネル信号の元のLSFパラメータベクトルに基づいて実行される場合、セカンダリチャネル信号のLSFパラメータの予測残差は以下の式を満たす。
【数9】
【数13】
【0159】
ここで、
【数7】
はセカンダリチャネル信号のLSFパラメータの予測残差ベクトルであり、
【数8】
はセカンダリチャネル信号の元のLSFパラメータベクトルであり、
【数11】
はセカンダリチャネル信号のLSFパラメータの予測されたベクトルであり、
【数2】
はプライマリチャネル信号のスペクトラム拡散LSFパラメータベクトルであり、
【数14】
は、セカンダリチャネルのLSFパラメータのステージ2予測されたベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数である。LSFパラメータベクトルは簡潔に、LSFパラメータとも称され得る。
【0160】
図8に示されるように、S510はS810、S820、およびS830を含み得、S520はS840を含み得る。
【0161】
S810:プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換する。
【0162】
LSFパラメータを線形予測係数に変換する詳細については従来技術を参照されたい。詳細はここでは説明しない。プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換した後に取得される線形予測係数がαとして示され、変換に使用される伝達関数がA(z)として示される場合、以下の式が満たされる。
【数15】
ここで、a=1である。
【0163】
ここで、αは、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換した後に取得される線形予測係数であり、Mは線形予測階数である。
【0164】
S820:線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得する。
【0165】
修正された線形予測子の伝達関数は以下の式を満たす。
【数16】
ここで、a=1である。
【0166】
ここで、αは、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換した後に取得される線形予測係数であり、βは拡散率であり、Mは線形予測階数である。
【0167】
プライマリチャネル信号のスペクトラム拡散線形予測係数は以下の式を満たす。
【数17】
ここで、i=1,...,またはMであり、
【数18】
である。
【0168】
ここで、aは、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換した後に取得される線形予測係数であり、
【数19】
はスペクトラム拡散線形予測係数であり、βは拡散率であり、Mは線形予測階数である。
【0169】
この実装で拡散率βを取得する方式については、S610における拡散率βを取得する方式を参照されたい。詳細はここでは再び説明しない。
【0170】
S830:プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換する。ここで、変換を通じて取得されるLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータである。
【0171】
線形予測係数をLSFパラメータに変換する方法については、従来技術を参照されたい。詳細はここでは説明しない。プライマリチャネル信号のスペクトラム拡散LSFパラメータは
【数2】
として示され得る。
【0172】
S840:セカンダリチャネル信号の元のLSFパラメータとプライマリチャネル信号のスペクトラム拡散LSFパラメータとの間の差をセカンダリチャネル信号のLSFパラメータの予測残差として使用する。
【0173】
この段階については、S620を参照されたい。詳細はここでは再び説明しない。
【0174】
図9に示されるように、S510はS910、S920、S930を含み得、S520はS940を含み得る。
【0175】
S910:プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換する。
【0176】
この段階についてはS810を参照されたい。詳細はここでは再び説明しない。
【0177】
S920:線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得する。
【0178】
この段階についてはS820を参照されたい。詳細はここでは再び説明しない。
【0179】
S930:プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換する。ここで、変換を通じて取得されるLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータである。
【0180】
この段階についてはS830を参照されたい。詳細はここでは再び説明しない。
【0181】
S940:プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対してマルチステージ予測を実行してセカンダリチャネル信号の予測されたLSFパラメータを取得し、セカンダリチャネル信号の元のLSFパラメータとセカンダリチャネル信号の予測されたLSFパラメータとの間の差をセカンダリチャネル信号の予測残差として使用する。
【0182】
この段階についてはS720を参照されたい。詳細はここでは再び説明しない。
【0183】
本願の本実施形態におけるS530において、セカンダリチャネル信号のLSFパラメータの予測残差に対して量子化が実行される場合、従来技術における任意のLSFパラメータベクトル量子化方法、例えば、分割ベクトル量子化、マルチステージベクトル量子化、またはセーフネットベクトル量子化が参照され得る。
【0184】
セカンダリチャネル信号のLSFパラメータの予測残差を量子化した後に取得されるベクトルが
【数20】
として示される場合、セカンダリチャネル信号の量子化されたLSFパラメータは以下の式を満たす。
【数21】
【0185】
ここで、
【数11】
はセカンダリチャネル信号のLSFパラメータの予測されたベクトルであり、
【数20】
は、セカンダリチャネル信号のLSFパラメータの予測残差を量子化した後に取得されるベクトルであり、
【数25】
は、セカンダリチャネル信号の量子化されたLSFパラメータベクトルであり、iはベクトルインデックス、i=1,...,またはMであり、Mは線形予測階数である。LSFパラメータベクトルは簡潔にLSFパラメータとも称され得る。
【0186】
図10は、本願の一実施形態によるステレオ信号復号方法の概略フローチャートである。再使用判定結果において、再使用条件が満たされていないことが分かった場合、復号コンポーネント120は図10に示される方法を実行し得る。
【0187】
S1010:現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータをビットストリームから取得する。
【0188】
この段階については従来技術を参照されたい。詳細はここでは説明しない。
【0189】
S1020:プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行してプライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する。
【0190】
この段階についてはS510を参照されたい。詳細はここでは再び説明しない。
【0191】
S1030:ビットストリームからステレオ信号における現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を取得する。
【0192】
この段階については、従来技術におけるビットストリームからステレオ信号の任意のパラメータを取得するための実装方法を参照されたい。詳細はここでは説明しない。
【0193】
S1040:セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号の量子化されたLSFパラメータを決定する。
【0194】
本願の実施形態における復号方法において、セカンダリチャネル信号の量子化されたLSFパラメータは、セカンダリチャネル信号のLSFパラメータの予測残差に基づいて決定できる。これは、ビットストリームにおけるセカンダリチャネル信号のLSFパラメータによって占有されるビットの数を低減することに役立つ。
【0195】
加えて、セカンダリチャネル信号の量子化されたLSFパラメータは、プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散が実行された後に取得されたLSFパラメータに基づいて決定されるので、プライマリチャネル信号の線形予測スペクトル包絡線とセカンダリチャネル信号の線形予測スペクトル包絡線との間の類似の特徴を使用できる。これは、セカンダリチャネル信号の量子化されたLSFパラメータの精度の改善に役立つ。
【0196】
いくつかの可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行してプライマリチャネル信号のスペクトラム拡散LSFパラメータを取得することは、プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行してスペクトラム拡散LSFパラメータを取得することを含み、ここで、平均伸長処理は、以下の式に従って実行され得る。
【数1】
【0197】
ここで、
【数2】
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
【数3】
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
【数4】
は、セカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
【0198】
可能な実装において、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階は、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換する段階と、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得する段階と、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得されたLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータである、段階とを含む。
【0199】
いくつかの可能な実装において、セカンダリチャネル信号の量子化されたLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータと、セカンダリチャネル信号のLSFパラメータの予測残差との和である。
【0200】
いくつかの可能な実装において、セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいてセカンダリチャネル信号の量子化されたLSFパラメータを決定する段階は、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得する段階と、予測されたLSFパラメータと、セカンダリチャネル信号のLSFパラメータの予測残差との和をセカンダリチャネル信号の量子化されたLSFパラメータとして使用する段階とを含み得る。
【0201】
本実装において、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいてセカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得する実装については、S720を参照されたい。詳細はここでは再び説明しない。
【0202】
図11は、本願の一実施形態によるステレオ信号符号化装置1100の概略ブロック図である。符号化装置1100は単に例であることを理解すべきである。
【0203】
いくつかの実装において、スペクトラム拡散モジュール1110、決定モジュール1120、および量子化モジュール1130はすべて、移動端末130の符号化コンポーネント110、またはネットワーク要素150に含まれ得る。
【0204】
スペクトラム拡散モジュール1110は、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行し、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得するよう構成される。
【0205】
決定モジュール1120は、セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を判定するよう構成される。
【0206】
量子化モジュール1130は、予測残差に対して量子化を実行するよう構成される。
【0207】
任意選択で、スペクトラム拡散モジュールは、プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行し、スペクトラム拡散LSFパラメータを取得するよう構成され、平均伸長処理は以下の式に従って実行され得る。
【数1】
【0208】
ここで、
【数2】
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
【数3】
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
【数4】
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
【0209】
任意選択で、スペクトラム拡散モジュールは具体的には、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換すること、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得すること、および、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換することを行うよう構成され得、変換を通じて取得されるLSFパラメータはプライマリチャネル信号のスペクトラム拡散LSFパラメータである。
【0210】
任意選択で、セカンダリチャネル信号の予測残差は、セカンダリチャネル信号の元のLSFパラメータと、スペクトラム拡散LSFパラメータとの間の差である。
【0211】
任意選択で、決定モジュールは具体的には、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいてセカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、セカンダリチャネル信号の予測されたLSFパラメータを取得すること、および、セカンダリチャネル信号の元のLSFパラメータと、予測されたLSFパラメータとの間の差をセカンダリチャネル信号の予測残差として使用することを行うよう構成され得る。
【0212】
セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する前に、決定モジュールは更に、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないと判定するよう構成される。
【0213】
符号化装置1100は、図5に説明される符号化方法を実行するよう構成され得る。簡潔にするために、詳細はここでは再び説明しない。
【0214】
図12は、本願の一実施形態によるステレオ信号復号装置1200の概略ブロック図である。復号装置1200は単に例であることを理解すべきである。
【0215】
いくつかの実装において、取得モジュール1220、スペクトラム拡散モジュール1230、および決定モジュール1240はすべて、移動端末140またはネットワーク要素150の復号コンポーネント120に含まれ得る。
【0216】
取得モジュール1220は、現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータをビットストリームから取得するよう構成される。
【0217】
スペクトラム拡散モジュール1230は、プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得するよう構成される。
【0218】
取得モジュール1220は更に、ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差をビットストリームから取得するよう構成される。
【0219】
決定モジュール1240は、セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号の量子化されたLSFパラメータを決定するよう構成される。
【0220】
任意選択で、スペクトラム拡散モジュールは具体的には、
プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、スペクトラム拡散LSFパラメータを取得するよう構成され得、平均伸長処理は以下の式に従って実行され得る。
【数1】
【0221】
ここで、
【数2】
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
【数3】
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
【数4】
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
【0222】
任意選択で、スペクトラム拡散モジュールは具体的には、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換すること、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得すること、および、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換することを行うよう構成され得、変換を通じて取得されるLSFパラメータはプライマリチャネル信号のスペクトラム拡散LSFパラメータである。
【0223】
任意選択で、セカンダリチャネル信号の量子化されたLSFパラメータは、スペクトラム拡散LSFパラメータと予測残差との和である。
【0224】
任意選択で、決定モジュールは具体的には、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得すること、および、予測されたLSFパラメータと予測残差との和を、セカンダリチャネル信号の量子化されたLSFパラメータとして使用することを行うよう構成され得る。
【0225】
ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差をビットストリームから取得する前に、取得モジュールは更に、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないと判定するよう構成される。
【0226】
復号装置1200は、図10に説明される復号方法を実行するよう構成され得る。簡潔にするために、詳細はここでは再び説明しない。
【0227】
図13は、本願の一実施形態によるステレオ信号符号化装置1300の概略ブロック図である。符号化装置1300は単に例であることを理解すべきである。
【0228】
メモリ1310はプログラムを格納するよう構成される。
【0229】
プロセッサ1320は、メモリに格納されたプログラムを実行するよう構成される。メモリ内のプログラムが実行されるとき、プロセッサは、ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得すること、セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を判定すること、ならびに、予測残差に対して量子化を実行することを行うよう構成される。
【0230】
任意選択で、プロセッサ1320は具体的には、プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、スペクトラム拡散LSFパラメータを取得するよう構成され得、平均伸長処理は以下の式に従って実行され得る。
【数1】
【0231】
ここで、
【数2】
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
【数3】
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
【数4】
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
【0232】
任意選択で、プロセッサは具体的には、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換すること、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得すること、および、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換することを行うよう構成され得、変換を通じて取得されるLSFパラメータはプライマリチャネル信号のスペクトラム拡散LSFパラメータである。
【0233】
任意選択で、セカンダリチャネル信号の予測残差は、セカンダリチャネル信号の元のLSFパラメータと、スペクトラム拡散LSFパラメータとの間の差である。
【0234】
任意選択で、プロセッサは具体的には、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいてセカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、セカンダリチャネル信号の予測されたLSFパラメータを取得すること、および、セカンダリチャネル信号の元のLSFパラメータと、予測されたLSFパラメータとの間の差をセカンダリチャネル信号の予測残差として使用することを行うよう構成され得る。
【0235】
セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する前に、プロセッサは更に、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないと判定するよう構成される。
【0236】
符号化装置1300は、図5に説明される符号化方法を実行するよう構成され得る。簡潔にするために、詳細はここでは再び説明しない。
【0237】
図14は、本願の一実施形態によるステレオ信号復号装置1400の概略ブロック図である。復号装置1400は単に例であることを理解すべきである。
【0238】
メモリ1410はプログラムを格納するよう構成される。
【0239】
プロセッサ1420は、メモリに格納されたプログラムを実行するよう構成される。メモリ内のプログラムが実行されるとき、プロセッサは、現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータをビットストリームから取得すること、プライマリチャネル信号の量子化されたLSFパラメータに対してスペクトラム拡散を実行して、プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得すること、ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差をビットストリームから取得すること、および、セカンダリチャネル信号のLSFパラメータの予測残差、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号の量子化されたLSFパラメータを決定することを行うよう構成される。
【0240】
任意選択で、プロセッサは具体的には、
プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、スペクトラム拡散LSFパラメータを取得するよう構成され得、平均伸長処理は以下の式に従って実行され得る。
【数1】
【0241】
ここで、
【数2】
は、プライマリチャネル信号のスペクトラム拡散LSFパラメータのベクトルを表し、
【数3】
は、プライマリチャネル信号の量子化されたLSFパラメータのベクトルを表し、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
【数4】
はセカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す。
【0242】
任意選択で、プロセッサは具体的には、プライマリチャネル信号の量子化されたLSFパラメータを線形予測係数に変換すること、線形予測係数を修正して、プライマリチャネル信号の修正された線形予測係数を取得すること、および、プライマリチャネル信号の修正された線形予測係数をLSFパラメータに変換することを行うよう構成され得、変換を通じて取得されるLSFパラメータはプライマリチャネル信号のスペクトラム拡散LSFパラメータである。
【0243】
任意選択で、セカンダリチャネル信号の量子化されたLSFパラメータは、プライマリチャネル信号のスペクトラム拡散LSFパラメータと予測残差との和である。
【0244】
任意選択で、プロセッサは具体的には、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、セカンダリチャネル信号のLSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得すること、および、予測されたLSFパラメータと予測残差との和を、セカンダリチャネル信号の量子化されたLSFパラメータとして使用することを行うよう構成され得る。
【0245】
ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差をビットストリームから取得する前に、プロセッサは更に、セカンダリチャネル信号のLSFパラメータが再使用条件を満たさないと判定するよう構成される。
【0246】
復号装置1400は、図10に説明される復号方法を実行するよう構成され得る。簡潔にするために、詳細はここでは再び説明しない。
【0247】
当業者であれば、本明細書に開示された実施形態で説明された複数の例を組み合わせて、複数のユニット及び複数のアルゴリズム段階が、電子的ハードウェア又はコンピュータソフトウェアと電子的ハードウェアとの組み合わせによって実装され得ることを認識するであろう。これらの機能がハードウェアで実行されるのか、又はソフトウェアで実行されるのかは、特定の用途及び技術的解決手段の設計制約条件で決まる。当業者であれば、異なる方法を用いて、説明された機能を特定の用途ごとに実装するであろうが、この実装例が本願の範囲を超えるものとみなされるべきではない。
【0248】
当業者は明確に理解し得るように、説明を簡便かつ簡潔にする目的で、前述のシステム、装置、およびユニットの詳細な動作プロセスについては、前述の方法の実施形態における対応するプロセスを参照されたい。詳細はここでは再び説明しない。
【0249】
本願において提供されたいくつかの実施形態において、開示されたシステム、装置、および方法は、別の方式で実装され得ることが理解されるべきである。例えば、説明される装置の実施形態は単に例である。例えば、ユニットへの区分は単に、論理的な機能の区分である。実際の実装においては別の区分方式があってよい。例えば、複数のユニット又はコンポーネントが組み合わされても、別のシステムに統合されてもよく、一部の機能が無視されても、実行されなくてもよい。さらに、示された又は説明された相互結合又は直接結合又は通信接続は、いくつかのインタフェースを用いて実装されてよい。複数の装置間又は複数のユニット間の間接的な結合又は通信接続は、電子的形態、機械的形態、又は他の形態で実装されてよい。
【0250】
別個の部分として説明されているユニットは、物理的に別個のものであってもなくてもよい、かつ、ユニットとして表示されている部分は、物理的なユニットであってもなくてもよいし、1つの位置に配置されてもよいし、複数のネットワークユニットに分散されてもよい。これらのユニットの一部又は全部が、これらの実施形態の解決手段の目的を実現するために、実際の要件に基づいて選択されてよい。
【0251】
加えて、本願の実施形態における機能ユニットが1つの処理ユニットに統合されてもよく、当該ユニットの各々が物理的に単独で存在してもよく、2つまたはそれより多くのユニットが1つのユニットに統合されてもよい。
【0252】
本願の実施形態におけるプロセッサは、中央演算処理装置(central processing unit, CPU)であり得ることを理解すべきである。プロセッサは代替的に、別の汎用プロセッサ、デジタル信号プロセッサ(digital signal processor, DSP)、特定用途向け集積回路(application-specific integrated circuit, ASIC)、フィールドプログラマブルゲートアレイ(field programmable gate array, FPGA)、または、別のプログラマブル論理デバイス、ディスクリートゲートもしくはトランジスタ論理デバイス、ディスクリートハードウェアコンポーネントなどであり得る。汎用プロセッサはマイクロプロセッサであり得るか、または、プロセッサは任意の従来のプロセッサなどであり得る。
【0253】
機能がソフトウェア機能ユニットの形態で実装され、独立製品として販売または使用される場合、機能はコンピュータ可読記憶媒体に記憶されてよい。そのような理解に基づいて、基本的には本願の技術的解決手段、又は先行技術に寄与する部分、又は技術的解決手段の一部が、ソフトウェア製品の形態で実装されてよい。コンピュータソフトウェア製品は、記憶媒体に記憶されており、コンピュータ装置(パーソナルコンピュータ、サーバ、またはネットワーク装置であってもよい)に、本願の実施形態に記載された方法の全てまたはある段階を実行するように命令するためのいくつかの命令を含む。上述の記憶媒体は、USBフラッシュドライブ、リムーバブルハードディスク、リードオンリメモリ(read-only memory、ROM)、ランダムアクセスメモリ(random access memory、RAM)、磁気ディスク、またはコンパクトディスクなどのプログラムコードを記憶できる任意の媒体を含む。
【0254】
前述の説明は、本願の単なる特定の実装例にすぎず、本願の保護範囲を限定することを意図してはいない。本願に開示された技術的範囲内で当業者により容易に考え出される、あらゆる変形又は置換は、本願の保護範囲に含まれることになる。したがって、本願の保護範囲は特許請求の範囲の保護範囲に従うことになる。
他の可能な請求項
(項目1)
ステレオ信号の符号化方法であって、
上記ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、
セカンダリチャネル信号の元のLSFパラメータ、および、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する段階と、
上記予測残差に対して量子化を実行する段階と
を備える方法。
(項目2)
上記ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記スペクトラム拡散LSFパラメータを取得する段階
を含み、上記平均伸長処理は以下の式、すなわち
【数1】
に従って実行され、
【数2】
は上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータのベクトルを表し、
【数3】
は上記プライマリチャネル信号の上記量子化されたLSFパラメータのベクトルを表し、iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
【数4】
は上記セカンダリチャネル信号の上記元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す、
項目1に記載の符号化方法。
(項目3)
上記ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換する段階と、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得する段階と、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得される上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、段階と
を含む、項目1に記載の符号化方法。
(項目4)
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差は、上記セカンダリチャネル信号の上記元のLSFパラメータと、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータとの間の差である、項目1から3のいずれか一項に記載の符号化方法。
(項目5)
セカンダリチャネル信号の元のLSFパラメータ、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおける上記セカンダリチャネル信号のLSFパラメータの予測残差を決定する上記段階は、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、上記セカンダリチャネル信号の予測されたLSFパラメータを取得する段階と、
上記セカンダリチャネル信号の上記元のLSFパラメータと、上記予測されたLSFパラメータとの間の差を上記セカンダリチャネル信号の上記予測残差として使用する、段階と
を含む、項目1から3のいずれか一項に記載の符号化方法。
(項目6)
セカンダリチャネル信号の元のLSFパラメータ、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおける上記セカンダリチャネル信号のLSFパラメータの予測残差を決定する上記段階の前に、上記符号化方法は更に、
上記セカンダリチャネル信号の上記LSFパラメータが再使用条件を満たさないと判定する段階
を備える、項目1から5のいずれか一項に記載の符号化方法。
(項目7)
ステレオ信号の復号方法であって、
ビットストリームから上記現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータを取得する段階と、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、
上記ビットストリームから、上記ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差を取得する段階と、
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の量子化されたLSFパラメータを決定する段階と
を備える復号方法。
(項目8)
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータを取得する段階
を含み、上記平均伸長処理は、以下の式、すなわち、
【数1】
に従って実行され、
【数2】
は上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータのベクトルを表し、
【数3】
は上記プライマリチャネル信号の上記量子化されたLSFパラメータのベクトルを表し、iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
【数4】
は上記セカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す、
項目7に記載の復号方法。
(項目9)
上記ステレオ信号における上記現在のフレームにおける上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換する段階と、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得する段階と、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得された上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、段階と
を含む、項目7に記載の復号方法。
(項目10)
上記セカンダリチャネル信号の上記量子化されたLSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータと上記予測残差との和である、項目7から9のいずれか一項に記載の復号方法。
(項目11)
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の量子化されたLSFパラメータを決定する上記段階は、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得する段階と、
上記予測されたLSFパラメータと上記予測残差との和を上記セカンダリチャネル信号の上記量子化されたLSFパラメータとして使用する段階と
を含む、項目7から9のいずれか一項に記載の復号方法。
(項目12)
ステレオ信号符号化装置であって、メモリおよびプロセッサを備え、
上記メモリはプログラムを格納するよう構成され、
上記プロセッサは、上記メモリに格納された上記プログラムを実行するよう構成され。上記メモリ内の上記プログラムが実行されるとき、上記プロセッサは、
上記ステレオ信号における上記現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得すること、
セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定すること、ならびに、
上記予測残差に対して量子化を実行すること
を行うよう構成される、ステレオ信号符号化装置。
(項目13)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記スペクトラム拡散LSFパラメータを取得するよう構成され、上記平均伸長処理は、以下の式、すなわち、
【数1】
に従って実行され、
【数2】
は上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータのベクトルを表し、
【数3】
は上記プライマリチャネル信号の上記量子化されたLSFパラメータのベクトルを表し、iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
【数4】
は上記セカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す、
項目12に記載の符号化装置。
(項目14)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換し、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得し、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換するよう構成され、
変換を通じて取得された上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、
項目12に記載の符号化装置。
(項目15)
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差は、上記セカンダリチャネル信号の上記元のLSFパラメータと、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータとの間の差である、項目12から14のいずれか一項に記載の符号化装置。
(項目16)
上記プロセッサは、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、上記セカンダリチャネル信号の予測されたLSFパラメータを取得し、
上記セカンダリチャネル信号の上記元のLSFパラメータと、上記予測されたLSFパラメータとの間の差を、上記セカンダリチャネル信号の上記予測残差として使用するよう構成される、
項目12から14のいずれか一項に記載の符号化装置。
(項目17)
上記セカンダリチャネル信号の上記元のLSFパラメータ、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおける上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差を決定する前に、上記プロセッサは更に、上記セカンダリチャネル信号の上記LSFパラメータが再使用条件を満たさないと判定するよう構成される、項目12から16のいずれか一項に記載の符号化装置。
(項目18)
メモリおよびプロセッサを備えるステレオ信号復号装置であって、上記メモリはプログラムを格納するよう構成され、上記プロセッサは、上記メモリに格納された上記プログラムを実行するよう構成され、上記メモリにおける上記プログラムが実行される場合、上記プロセッサは、
上記現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータをビットストリームから取得すること、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得すること、
上記ステレオ信号における上記現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差を上記ビットストリームから取得すること、ならびに、
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の量子化されたLSFパラメータを決定すること
を行うよう構成される、ステレオ信号復号装置。
(項目19)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記スペクトラム拡散LSFパラメータを取得するよう構成され、上記平均伸長処理は、以下の式、すなわち、
【数1】
に従って実行され、
【数2】
は上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータのベクトルを表し、
【数3】
は上記プライマリチャネル信号の上記量子化されたLSFパラメータのベクトルを表し、iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
【数4】
は上記セカンダリチャネル信号の元のLSFパラメータの平均ベクトルを表し、1≦i≦Mであり、iは整数であり、Mは線形予測パラメータを表す、
項目18に記載の復号装置。
(項目20)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換し、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得し、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換するよう構成され、
変換を通じて取得された上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、
項目18に記載の復号装置。
(項目21)
上記セカンダリチャネル信号の上記量子化されたLSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータと上記予測残差との和である、
項目18から20のいずれか一項に記載の復号装置。
(項目22)
上記プロセッサは、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得し、
上記予測されたLSFパラメータと上記予測残差との和を上記セカンダリチャネル信号の上記量子化されたLSFパラメータとして使用する
よう構成される、項目18から20のいずれか一項に記載の復号装置。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15