IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 華為技術有限公司の特許一覧

特許7636516マルチ・チャネル・オーディオ信号符号化方法及び装置
<>
  • 特許-マルチ・チャネル・オーディオ信号符号化方法及び装置 図1
  • 特許-マルチ・チャネル・オーディオ信号符号化方法及び装置 図2
  • 特許-マルチ・チャネル・オーディオ信号符号化方法及び装置 図3
  • 特許-マルチ・チャネル・オーディオ信号符号化方法及び装置 図4
  • 特許-マルチ・チャネル・オーディオ信号符号化方法及び装置 図5
  • 特許-マルチ・チャネル・オーディオ信号符号化方法及び装置 図6
  • 特許-マルチ・チャネル・オーディオ信号符号化方法及び装置 図7
  • 特許-マルチ・チャネル・オーディオ信号符号化方法及び装置 図8
  • 特許-マルチ・チャネル・オーディオ信号符号化方法及び装置 図9
  • 特許-マルチ・チャネル・オーディオ信号符号化方法及び装置 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-02-17
(45)【発行日】2025-02-26
(54)【発明の名称】マルチ・チャネル・オーディオ信号符号化方法及び装置
(51)【国際特許分類】
   G10L 19/008 20130101AFI20250218BHJP
   G10L 19/002 20130101ALI20250218BHJP
【FI】
G10L19/008
G10L19/002
【請求項の数】 34
(21)【出願番号】P 2023502892
(86)(22)【出願日】2021-07-13
(65)【公表番号】
(43)【公表日】2023-08-02
(86)【国際出願番号】 CN2021106102
(87)【国際公開番号】W WO2022012554
(87)【国際公開日】2022-01-20
【審査請求日】2023-02-22
(31)【優先権主張番号】202010699775.8
(32)【優先日】2020-07-17
(33)【優先権主張国・地域又は機関】CN
【前置審査】
(73)【特許権者】
【識別番号】503433420
【氏名又は名称】華為技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian, Longgang District, Shenzhen, Guangdong 518129, P.R. China
(74)【代理人】
【識別番号】110004381
【氏名又は名称】弁理士法人ITOH
(72)【発明者】
【氏名】ワン,ジ
(72)【発明者】
【氏名】ディン,ジエンツォ
(72)【発明者】
【氏名】ワン,ビン
(72)【発明者】
【氏名】リ,ハイティン
(72)【発明者】
【氏名】ワン,ジョ
【審査官】菊池 智紀
(56)【参考文献】
【文献】米国特許出願公開第2015/0025894(US,A1)
【文献】特開平07-181996(JP,A)
【文献】特表2015-520872(JP,A)
【文献】国際公開第2020/007719(WO,A1)
【文献】国際公開第2007/116809(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00-19/26
(57)【特許請求の範囲】
【請求項1】
マルチ・チャネル・オーディオ信号符号化方法であって:
マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号を取得するステップであって、Pは1より大きい正の整数であり、前記P個のチャネルの前記オーディオ信号はK個のチャネル・ペアのオーディオ信号を含み、Kは正の整数である、ステップ;
前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅及びエネルギー/振幅合計を取得するステップ;
前記K個のチャネル・ペアのそれぞれのビット数を、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅の前記エネルギー/振幅合計に対する比率と利用可能なビット数とに基づいて決定するステップ;
前記P個のチャネルの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するステップ;
を含み、前記P個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は:
時間ドメインにおける前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、
時間-周波数変換後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、
時間-周波数変換及びホワイトニング後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、
エネルギー/振幅等化後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、又は
ステレオ処理後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅
のうちの少なくとも1つを含み、
前記K個のチャネル・ペアのそれぞれのビット数を、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅の前記エネルギー/振幅合計に対する比率と利用可能なビット数とに基づいて決定するステップは、
前記カレント・フレームの前記エネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定し、
前記K個のチャネル・ペアのそれぞれのビット係数を、前記カレント・フレームのエネルギー/振幅合計に対する、前記K個のチャネル・ペアの前記オーディオ信号のそれぞれのエネルギー/振幅の比とし、
前記K個のチャネル・ペアのそれぞれのビット数を、前記利用可能なビット数に、前記K個のチャネル・ペアの前記それぞれのビット係数を乗じたものとする処理を行うステップであり、
前記K個のチャネル・ペアはカレント・チャネル・ペアを含み、前記P個のチャネルの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するステップは、
前記カレント・チャネル・ペアのオーディオ信号を、前記カレント・チャネル・ペアのビット数に基づいて符号化するステップを含み、前記カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、前記カレント・チャネル・ペアの前記ビット数に第1割合を乗じたものとし、前記第1割合は、前記カレント・チャネル・ペアにおける前記2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の合計に対する、そのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の割合である、方法。
【請求項2】
請求項1に記載の方法において、前記カレント・チャネル・ペアのオーディオ信号を、前記カレント・チャネル・ペアのビット数に基づいて符号化するステップは、
前記カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、前記カレント・チャネル・ペアの前記ビット数と、ステレオ処理後の前記カレント・チャネル・ペアにおける前記2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅とに基づいて決定するステップ;及び
前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化するステップ;
を含む、方法。
【請求項3】
請求項1又は2に記載の方法において、前記K個のチャネル・ペアのそれぞれのビット数を、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅の前記エネルギー/振幅合計に対する比率と利用可能なビット数とに基づいて決定するステップは、
前記カレント・フレームのエネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップ;
前記K個のチャネル・ペアのそれぞれのビット係数を、前記K個のチャネル・ペアの前記オーディオ信号のそれぞれのエネルギー/振幅と前記カレント・フレームのエネルギー/振幅合計とに基づいて決定するステップ;及び
前記K個のチャネル・ペアのそれぞれのビット数を、前記K個のチャネル・ペアの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップ;
を含む、方法。
【請求項4】
請求項3に記載の方法において、前記カレント・フレームのエネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップは、
前記カレント・フレームの前記エネルギー/振幅合計を、ステレオ処理後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップ;
を含む、方法。
【請求項5】
請求項4に記載の方法において、前記カレント・フレームの前記エネルギー/振幅合計を、ステレオ処理後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップは、
前記カレント・フレームの前記エネルギー/振幅合計sum_Epostを、数式
【数18】
に従って計算するステップを含み、ここで、chはチャネル・インデックスを表し、Epost(ch)は、ステレオ処理後の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表し、sampleCoefpost(ch,i)は、ステレオ処理後の(ch)番目のチャネルの前記カレント・フレームのi番目のサンプルの係数を表し、Nは、前記カレント・フレームの係数の数を表し且つ1より大きい正の整数である、方法。
【請求項6】
請求項3に記載の方法において、前記カレント・フレームのエネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップは、
前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップを含み、
前記エネルギー振幅等化前のP個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は:
時間ドメインにおける前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、
時間-周波数変換後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、又は
時間-周波数変換及びホワイトニング後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅
を含む、方法。
【請求項7】
請求項6に記載の方法において、前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップは、
前記カレント・フレームの前記エネルギー/振幅合計sum_Epreを、数式
【数19】
に従って計算するステップを含み、ここで、chはチャネル・インデックスを表し、Epre(ch)は、エネルギー/振幅等化前の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表す、方法。
【請求項8】
請求項3に記載の方法において、前記カレント・フレームのエネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップは、
前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅と前記P個のチャネルのそれぞれの重み係数とに基づいて決定するステップを含み、前記重み係数は1以下である、方法。
【請求項9】
請求項8に記載の方法において、前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅と前記P個のチャネルのそれぞれの重み係数とに基づいて決定するステップは、
前記カレント・フレームの前記エネルギー/振幅合計sum_Epreを、数式
【数20】
に従って計算するステップを含み、ここで、chはチャネル・インデックスを表し、Epre(ch)は、エネルギー/振幅等化前の、(ch)番目のチャネルのオーディオ信号のエネルギー/振幅を表し、α(ch)は前記(ch)番目のチャネルの重み係数を表し、1つのチャネル・ペアにおける2つのチャネルの重み係数は同一であり、前記1つのチャネル・ペアにおける前記2つのチャネルの前記重み係数の値は、前記1つのチャネル・ペアにおける前記2つのチャネル間の正規化された相関値に逆比例する、方法。
【請求項10】
請求項1ないし9のうちの何れか1項に記載の方法において、前記P個のチャネルの前記オーディオ信号は、Q個のカップリングされていないチャネルのオーディオ信号を更に含み、P=2×K+Qであり、Qは正の整数であり;
前記K個のチャネル・ペアのそれぞれのビット数を、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅の前記エネルギー/振幅合計に対する比率と利用可能なビット数とに基づいて決定するステップは、
前記K個のチャネル・ペアの前記それぞれのビット数と前記Q個のチャネルのそれぞれのビット数とを、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と前記利用可能なビット数とに基づいて決定するステップ;
を含み、前記P個のチャネルの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化するステップは、
前記K個のチャネル・ペアの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化し、前記Q個のチャネルの前記オーディオ信号を、前記Q個のチャネルの前記それぞれのビット数に基づいて符号化するステップ;
を含む、方法。
【請求項11】
請求項10に記載の方法において、前記K個のチャネル・ペアの前記それぞれのビット数と前記Q個のチャネルのそれぞれのビット数とを、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と前記利用可能なビット数とに基づいて決定するステップは、
前記カレント・フレームの前記エネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップ;
前記K個のチャネル・ペアのそれぞれのビット係数を、前記K個のチャネル・ペアの前記オーディオ信号の前記それぞれのエネルギー/振幅と前記カレント・フレームの前記エネルギー/振幅合計とに基づいて決定するステップ;
前記Q個のチャネルのそれぞれのビット係数を、前記Q個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅と前記カレント・フレームの前記エネルギー/振幅合計とに基づいて決定するステップ;
前記K個のチャネル・ペアの前記それぞれのビット数を、前記K個のチャネル・ペアの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップ;及び
前記Q個のチャネルの前記それぞれのビット数を、前記Q個のチャネルの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップ;
を含む、方法。
【請求項12】
請求項1ないし11のうちの何れか1項に記載の方法において、前記P個のチャネルの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化するステップは、
前記K個のチャネル・ペアの前記それぞれのビット数に基づいて、エネルギー/振幅等化後の前記P個のチャネルの前記オーディオ信号を符号化するステップ;
を含む、方法。
【請求項13】
マルチ・チャネル・オーディオ信号符号化装置であって、当該装置は:
マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号と、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅及びエネルギー/振幅合計とを取得するように構成された取得モジュールであって、Pは1より大きい正の整数であり、前記P個のチャネルの前記オーディオ信号はK個のチャネル・ペアのオーディオ信号を含み、Kは正の整数である、取得モジュール;
前記K個のチャネル・ペアのそれぞれのビット数を、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅の前記エネルギー/振幅合計に対する比率と利用可能なビット数とに基づいて決定するように構成されたビット割当モジュール;及び
前記P個のチャネルの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するように構成された符号化モジュール;
を含み、前記P個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は:
時間ドメインにおける前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、
時間-周波数変換後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、
時間-周波数変換及びホワイトニング後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、
エネルギー/振幅等化後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、又は
ステレオ処理後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅
のうちの少なくとも1つを含み、
前記ビット割当モジュールは、
前記カレント・フレームの前記エネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定し、
前記K個のチャネル・ペアのそれぞれのビット係数を、前記カレント・フレームのエネルギー/振幅合計に対する、前記K個のチャネル・ペアの前記オーディオ信号のそれぞれのエネルギー/振幅の比とし、
前記K個のチャネル・ペアのそれぞれのビット数を、前記利用可能なビット数に、前記K個のチャネル・ペアの前記それぞれのビット係数を乗じたものとするように構成されており、
前記K個のチャネル・ペアはカレント・チャネル・ペアを含み、前記符号化モジュールは、前記カレント・チャネル・ペアのオーディオ信号を、前記カレント・チャネル・ペアのビット数に基づいて符号化するように構成されており、前記カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、前記カレント・チャネル・ペアの前記ビット数に第1割合を乗じたものとし、前記第1割合は、前記カレント・チャネル・ペアにおける前記2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の合計に対する、そのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の割合である、装置。
【請求項14】
請求項13に記載の装置において、前記符号化モジュールは:
前記カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、前記カレント・チャネル・ペアの前記ビット数と、ステレオ処理後の前記カレント・チャネル・ペアにおける前記2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅とに基づいて決定するステップ;及び
前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化するステップ;
を行うように構成されている、装置。
【請求項15】
請求項14に記載の装置において、前記ビット割当モジュールは:
前記カレント・フレームのエネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップ;
前記K個のチャネル・ペアのそれぞれのビット係数を、前記K個のチャネル・ペアの前記オーディオ信号のそれぞれのエネルギー/振幅と前記カレント・フレームのエネルギー/振幅合計とに基づいて決定するステップ;及び
前記K個のチャネル・ペアのそれぞれのビット数を、前記K個のチャネル・ペアの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップ;
を行うように構成されている、装置。
【請求項16】
請求項15に記載の装置において、前記ビット割当モジュールは、前記カレント・フレームの前記エネルギー/振幅合計を、ステレオ処理後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するように構成されている、装置。
【請求項17】
請求項16に記載の装置において、前記ビット割当モジュールは、
前記カレント・フレームの前記エネルギー/振幅合計sum_Epostを、数式
【数21】
に従って計算するように構成されており、ここで、chはチャネル・インデックスを表し、Epost(ch)は、ステレオ処理後の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表し、sampleCoefpost(ch,i)は、ステレオ処理後の(ch)番目のチャネルの前記カレント・フレームのi番目のサンプルの係数を表し、Nは、前記カレント・フレームの係数の数を表し且つ1より大きい正の整数である、装置。
【請求項18】
請求項15に記載の装置において、ビット割当モジュールは、前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するように構成されており、前記エネルギー振幅等化前のP個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は:
時間ドメインにおける前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、
時間-周波数変換後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、又は
時間-周波数変換及びホワイトニング後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅
を含む、装置。
【請求項19】
請求項18に記載の装置において、前記ビット割当モジュールは、
前記カレント・フレームの前記エネルギー/振幅合計sum_Epreを、数式
【数22】
に従って計算するように構成されており、ここで、chはチャネル・インデックスを表し、Epre(ch)は、エネルギー/振幅等化前の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表す、装置。
【請求項20】
請求項15に記載の装置において、前記ビット割当モジュールは、前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅と前記P個のチャネルのそれぞれの重み係数とに基づいて決定するように構成されており、前記重み係数は1以下である、装置。
【請求項21】
請求項20に記載の装置において、前記ビット割当モジュールは、前記カレント・フレームの前記エネルギー/振幅合計sum_Epreを、数式
【数23】
に従って計算するように構成されており、ここで、chはチャネル・インデックスを表し、Epre(ch)は、エネルギー/振幅等化前の、(ch)番目のチャネルのオーディオ信号のエネルギー/振幅を表し、α(ch)は前記(ch)番目のチャネルの重み係数を表し、1つのチャネル・ペアにおける2つのチャネルの重み係数は同一であり、前記1つのチャネル・ペアにおける前記2つのチャネルの前記重み係数の値は、前記1つのチャネル・ペアにおける前記2つのチャネル間の正規化された相関値に逆比例する、装置。
【請求項22】
請求項13ないし21のうちの何れか1項に記載の装置において、前記P個のチャネルの前記オーディオ信号は、Q個のカップリングされていないチャネルのオーディオ信号を更に含み、P=2×K+Qであり、Qは正の整数であり;前記ビット割当モジュールは、前記K個のチャネル・ペアの前記それぞれのビット数と前記Q個のチャネルのそれぞれのビット数とを、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と前記利用可能なビット数とに基づいて決定するように構成されており、
前記符号化モジュールは、前記K個のチャネル・ペアの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化し、前記Q個のチャネルの前記オーディオ信号を、前記Q個のチャネルの前記それぞれのビット数に基づいて符号化するように構成されている、装置。
【請求項23】
請求項22に記載の装置において、前記ビット割当モジュールは、
前記カレント・フレームの前記エネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップ;
前記K個のチャネル・ペアのそれぞれのビット係数を、前記K個のチャネル・ペアの前記オーディオ信号の前記それぞれのエネルギー/振幅と前記カレント・フレームの前記エネルギー/振幅合計とに基づいて決定するステップ;
前記Q個のチャネルのそれぞれのビット係数を、前記Q個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅と前記カレント・フレームの前記エネルギー/振幅合計とに基づいて決定するステップ;
前記K個のチャネル・ペアの前記それぞれのビット数を、前記K個のチャネル・ペアの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップ;及び
前記Q個のチャネルの前記それぞれのビット数を、前記Q個のチャネルの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップ;
を行うように構成されている、装置。
【請求項24】
請求項13ないし23のうちの何れか1項に記載の装置において、前記符号化モジュールは、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて、エネルギー/振幅等化後の前記P個のチャネルの前記オーディオ信号を符号化するように構成されている、装置。
【請求項25】
マルチ・チャネル・オーディオ信号符号化方法であって:
マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号を取得するステップであって、Pは1より大きい正の整数であり、前記P個のチャネルの前記オーディオ信号はK個のチャネル・ペアのオーディオ信号を含み、Kは正の整数である、ステップ;
カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて、前記K個のチャネル・ペアのカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号に対してエネルギー/振幅等化を実行して、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅及びエネルギー/振幅合計を取得するステップ;
前記カレント・チャネル・ペアにおける前記2つのチャネルのそれぞれのビット数を、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の前記エネルギー/振幅合計に対する比率と利用可能なビット数とに基づいて決定するステップ;及び
前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するステップ;
を含み、前記カレント・チャネル・ペアにおける前記2つのチャネルのそれぞれのビット数を、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の前記エネルギー/振幅合計に対する比率と利用可能なビット数とに基づいて決定するステップは、
前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定し、
前記カレント・フレームの前記エネルギー/振幅合計に対する、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号のエネルギー/振幅合計の比率を、前記利用可能なビット数に乗じることによって、前記カレント・チャネル・ペアにおけるビット数を決定するステップであり、
前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するステップにおいて、
前記カレント・チャネル・ペアにおける前記2つのチャネルのそれぞれのビット数は、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号のエネルギー/振幅合計に対する、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の比率を、前記カレント・チャネル・ペアにおけるビット数に乗じたものである、方法。
【請求項26】
請求項25に記載の方法において、P=2×Kであり、Kは正の整数であり、前記カレント・チャネル・ペアにおける前記2つのチャネルのそれぞれのビット数を、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の前記エネルギー/振幅合計に対する比率と利用可能なビット数とに基づいて決定するステップは:
前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップ;及び
前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅合計と、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップ;
を含む、方法。
【請求項27】
請求項25又は26に記載の方法において、前記P個のチャネルの前記オーディオ信号は、Q個のカップリングされていないチャネルのオーディオ信号を更に含み、P=2×K+Qであり、Kは正の整数であり、Qは正の整数であり;
前記カレント・チャネル・ペアにおける前記2つのチャネルのそれぞれのビット数を、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の前記エネルギー/振幅合計に対する比率と利用可能なビット数とに基づいて決定するステップは:
前記カレント・フレームの前記エネルギー/振幅合計を、前記エネルギー/振幅等化後の前記K個のチャネル・ペア各々における2つのチャネルのオーディオ信号のエネルギー/振幅と、前記エネルギー/振幅等化後の前記Q個のチャネルの前記オーディオ信号のエネルギー/振幅とに基づいて決定するステップ;
前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅合計と、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップ;及び
前記Q個のチャネルのそれぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅合計と、エネルギー/振幅等化後の前記Q個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップ;
を含み、前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するステップは:
前記K個のチャネル・ペアの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化し、前記Q個のチャネルの前記オーディオ信号を、前記Q個のチャネルの前記それぞれのビット数に基づいて符号化して、前記符号化されたビットストリームを取得するステップ;
を含む、方法。
【請求項28】
オーディオ信号符号化装置であって:
マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号を取得するように構成された取得モジュールあって、Pは1より大きい正の整数であり、前記P個のチャネルの前記オーディオ信号はK個のチャネル・ペアのオーディオ信号を含み、Kは正の整数である、取得モジュール;
カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて、前記K個のチャネル・ペアのカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号に対してエネルギー/振幅等化を実行して、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅及びエネルギー/振幅合計を取得するように構成されたエネルギー/振幅等化モジュール;
前記カレント・チャネル・ペアにおける前記2つのチャネルのそれぞれのビット数を、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の前記エネルギー/振幅合計に対する比率と利用可能なビット数とに基づいて決定するように構成されたビット割当モジュール;及び
前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するように構成された符号化モジュール;
を含み、前記ビット割当モジュールは、
前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定し、
前記カレント・フレームの前記エネルギー/振幅合計に対する、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号のエネルギー/振幅合計の比率を、前記利用可能なビット数に乗じることによって、前記カレント・チャネル・ペアにおけるビット数を決定するステップを行うように構成されており、
前記符号化モジュールが、前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化する場合に、前記カレント・チャネル・ペアにおける前記2つのチャネルのそれぞれのビット数は、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号のエネルギー/振幅合計に対する、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の比率を、前記カレント・チャネル・ペアにおけるビット数に乗じたものである、装置。
【請求項29】
請求項28に記載の装置において、P=2×Kであり、Kは正の整数であり、前記ビット割当モジュールは:
前記カレント・フレームのエネルギー/振幅合計を、エネルギー/振幅等化後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップ;及び
前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅合計と、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップ;
を行うように構成されている、装置。
【請求項30】
請求項28又は29に記載の装置において、前記P個のチャネルの前記オーディオ信号は、Q個のカップリングされていないチャネルのオーディオ信号を更に含み、P=2×K+Qであり、Kは正の整数であり、Qは正の整数であり;
前記ビット割当モジュールは:
前記カレント・フレームの前記エネルギー/振幅合計を、前記エネルギー/振幅等化後の前記K個のチャネル・ペア各々における2つのチャネルのオーディオ信号のエネルギー/振幅と、前記エネルギー/振幅等化後の前記Q個のチャネルの前記オーディオ信号のエネルギー/振幅とに基づいて決定するステップ;
前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅合計と、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップ;及び
前記Q個のチャネルのそれぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅合計と、エネルギー/振幅等化後の前記Q個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップを行うように構成されており;
前記符号化モジュールは:
前記K個のチャネル・ペアの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化し、前記Q個のチャネルの前記オーディオ信号を、前記Q個のチャネルの前記それぞれのビット数に基づいて符号化して、前記符号化されたビットストリームを取得するステップ;
を行うように構成されている、装置。
【請求項31】
互いに結合された不揮発性メモリ及びプロセッサを含むオーディオ信号符号化装置であって、前記プロセッサは、前記メモリに記憶されたプログラム・コードを起動して、請求項1ないし12のうちの何れか1項に記載の方法を実行するか、又は請求項25ないし27のうちの何れか1項に記載の方法を実行する、装置。
【請求項32】
エンコーダを含むオーディオ信号符号化デバイスであって、前記エンコーダは、請求項1ないし12のうちの何れか1項に記載の方法を実行するように構成されているか、又は請求項25ないし27のうちの何れか1項に記載の方法を実行するように構成されている、デバイス。
【請求項33】
コンピュータ・プログラムを含むコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ・プログラムがコンピュータ上で実行されると、前記コンピュータは、請求項1ないし12のうちの何れか1項に記載の方法を実行するように動作することが可能になるか、又は請求項25ないし27のうちの何れか1項に記載の方法を実行するように動作することが可能になる、記憶媒体。
【請求項34】
請求項1ないし12のうちの何れか1項に記載の方法又は請求項25ないし27のうちの何れか1項に記載の方法を実行することにより、符号化されたビットストリームを取得し、前記ビットストリームを記憶媒体に記憶するステップを含む記憶方法。
【発明の詳細な説明】
【技術分野】
【0001】
[0001] 本願は、2020年7月17日付で中国国家知識産権局に出願された「マルチ・チャネル・オーディオ信号符号化方法及び装置」と題する中国特許出願第202010699775.8号に対する優先権を主張しており、同出願の全体は本件に援用されている。
【0002】
[0002] 技術分野
本願は、オーディオ符号化及び復号化技術に関連し、特に、マルチ・チャネル・オーディオ信号符号化方法及び装置に関連する。
【背景技術】
【0003】
[0003] マルチメディア技術の継続的な発展により、オーディオは、マルチメディア通信、家電、仮想現実、ヒューマン・コンピュータ・インタラクションのような分野で幅広く使用されている。オーディオ符号化は、マルチメディア技術の重要な技術のうちの1つである。オーディオ符号化では、記憶又は伝送を促進するために、生のオーディオ信号内の冗長情報は除去されて、データ量を削減している。
【0004】
[0004] マルチ・チャネル・オーディオ符号化は、一般的な5.1チャネル、7.1チャネル、7.1.4チャネル、22.2チャネルなどを含む2つより多いチャネルの符号化である。マルチ・チャネル信号スクリーニング、カップリング、ステレオ処理、マルチ・チャネル・サイド情報生成、量子化処理、エントロピー符号化処理、及びビットストリーム多重化が、マルチ・チャネルの生のオーディオ信号に対して実行されて、シリアル・ビットストリーム(符号化されたビットストリーム)を形成し、チャネルにおける伝送やデジタル媒体における記憶を促進する。複数のチャネル間のエネルギー差は比較的大きいので、ステレオ処理の前に、複数のチャネルに対してエネルギー等化が実行され、ステレオ処理利得を増加させ、それによって符号化効率を向上させる必要がある。
【0005】
[0005] エネルギー等化に関し、通常、全てのチャネルのエネルギーを平均化する方法が使用される。この方法は、符号化されたオーディオ信号の品質に影響を与える。例えば、チャネル間のエネルギー差が比較的大きい場合、前述のエネルギー等化方法は、より大きなエネルギー/より大きな振幅を有するチャネル・フレームの不十分な符号化ビットを生じさせ、チャネル・フレームは貧弱な品質となり、また、より小さなエネルギーを有するチャネル・フレームの符号化ビットは冗長になり、リソースが浪費される。低ビット・レートの場合、トータルの利用可能なビットは不十分である。その結果、より大きなエネルギー/より大きな振幅を有するチャネル・フレームの品質は著しく低下する。
【発明の概要】
【0006】
[0006] 本願は、符号化されたオーディオ信号の品質を改善することを支援するために、マルチ・チャネル・オーディオ信号符号化方法及び装置を提供する。
【0007】
[0007] 第1態様によれば、本願の実施形態は、マルチ・チャネル・オーディオ信号符号化方法を提供する。方法は、マルチ・チャネル・オーディオ信号のカレント・フレーム(現在のフレーム)におけるP個のチャネルのオーディオ信号を取得するステップであって、Pは1より大きい正の整数であり、前記P個のチャネルの前記オーディオ信号はK個のチャネル・ペアのオーディオ信号を含み、Kは正の整数である、ステップ;前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅を取得するステップ;前記K個のチャネル・ペアのそれぞれのビット数を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定するステップ;及び前記P個のチャネルの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するステップを含む可能性がある。
【0008】
[0008] 前記P個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は:
時間ドメインにおける前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、
時間-周波数変換後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、
時間-周波数変換及びホワイトニング後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、
エネルギー/振幅等化後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、又は
ステレオ処理後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅
のうちの少なくとも1つを含む。
【0009】
[0009] この実装では、ビットは、時間ドメインにおけるP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換及びホワイトニング後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、エネルギー/振幅等化後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、又はステレオ処理後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅のうちの少なくとも1つに基づいて、チャネル・ペアに割り当てられて、K個のチャネル・ペアのそれぞれのビット数を決定する。このようにして、マルチ・チャネル信号符号化におけるチャネル・ペアのビット数は適切に割り当てられ、デコーダ側によって再構成されるオーディオ信号の品質を保証する。
【0010】
[0010] 可能な設計において、前記K個のチャネル・ペアはカレント・チャネル・ペアを含み、方法は、K個のチャネル・ペアのカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号に対してエネルギー/振幅等化を実行して、エネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅を取得するステップを更に含む可能性がある。
【0011】
[0011] この実装では、エネルギー/振幅等化は、単一チャネル・ペアにおける2つのチャネルのオーディオ信号に対して実行され、その結果、エネルギー/振幅等化がチャネル・ペアに対して実行された後でも、比較的大きなエネルギー/振幅差を有するチャネル・ペアの間で、比較的大きなエネルギー/振幅差を依然として維持することができる。このケースでは、エネルギー/振幅等化後のエネルギー/振幅に基づいてビットが割り当てられる場合に、より大きなエネルギー/より大きな振幅を有するチャネル・ペアに、より多くのビットが割り当てられるので、より大きなエネルギー/振幅を有するチャネル・ペアの符号化ビットが、チャネル・ペアの符号化条件に合うことを保証する。このようにして、デコーダ側で再構成されるオーディオ信号の品質は改善される。
【0012】
[0012] 可能な設計において、前記K個のチャネル・ペアはカレント・チャネル・ペアを含む。前記P個のチャネルの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化するステップは、前記カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、前記カレント・チャネル・ペアの前記ビット数と、ステレオ処理後の前記カレント・チャネル・ペアにおける前記2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅とに基づいて決定するステップ;及び前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化するステップを含む可能性がある。
【0013】
[0013] この実装では、K個のチャネル・ペアのそれぞれのビット数が得られた後に、チャネル・ペア内のビットは、K個のチャネル・ペアのそれぞれのビット数に基づいて割り当てられ、マルチ・チャネル信号符号化におけるチャネルのビット数を適切に割り当て、それによって、デコーダ側で再構成されるオーディオ信号の品質を保証する。
【0014】
[0014] 可能な設計において、前記K個のチャネル・ペアのそれぞれのビット数を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定するステップは、前記カレント・フレームのエネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップ;前記K個のチャネル・ペアのそれぞれのビット係数を、前記K個のチャネル・ペアの前記オーディオ信号のそれぞれのエネルギー/振幅と前記カレント・フレームのエネルギー/振幅合計とに基づいて決定するステップ;及び前記K個のチャネル・ペアのそれぞれのビット数を、前記K個のチャネル・ペアの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップを含む可能性がある。
【0015】
[0015] 可能な設計において、前記カレント・フレームのエネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップは、前記カレント・フレームの前記エネルギー/振幅合計を、ステレオ処理後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップを含む可能性がある。
【0016】
[0016] この実装では、エネルギー/振幅等化を、単一のチャネル・ペア内の2つのチャネルに対して実行することができ、その結果、エネルギー/振幅等化がチャネル・ペアに対して実行された後でも、比較的大きなエネルギー/振幅差を有するチャネル・ペアの間で、比較的大きなエネルギー/振幅差を維持することができる。このケースでは、エネルギー/振幅等化後のエネルギー/振幅に基づいてビットが割り当てられる場合に、より大きなエネルギー/振幅を有するチャネル・ペアに、より多くのビットが割り当てられるので、より大きなエネルギー/振幅を有するチャネル・ペアの符号化ビットが、チャネル・ペアの符号化要件を充足することを保証することができる。このようにして、デコーダ側で再構成されるオーディオ信号の品質が改善される。
【0017】
[0017] 可能な設計において、前記カレント・フレームの前記エネルギー/振幅合計を、ステレオ処理後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップは:
前記カレント・フレームの前記エネルギー/振幅合計sum_Epostを、数式
【0018】
【数1】

に従って計算するステップを含む可能性があり、この場合において、chはチャネル・インデックスを表し、Epost(ch)は、ステレオ処理後の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表し、sampleCoefpost(ch,i)は、ステレオ処理後の(ch)番目のチャネルの前記カレント・フレームのi番目の係数を表し、Nは、前記カレント・フレームの係数の数を表し且つ1より大きい正の整数である。
【0019】
[0018] 可能な設計において、前記カレント・フレームのエネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップは:前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップを含む可能性があり、この場合において、前記エネルギー振幅等化前のP個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は、時間ドメインにおける前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、時間-周波数変換後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、又は時間-周波数変換及びホワイトニング後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅 を含む。
【0020】
[0019] この実装では、カレント・フレームのエネルギー/振幅合計は、エネルギー/振幅等化前のカレント・フレームにおけるP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて決定され、カレント・フレームのエネルギー/振幅合計に基づいてビット割り当てを実行し、即ち、エネルギー/振幅等化前のエネルギー/振幅に基づいてビット割り当てを実行する。このようにして、マルチ・チャネル信号符号化におけるチャネルのビット数を適切に割り当てることができ、デコーダ側で再構成されるオーディオ信号の品質を保証する。この実装では、より大きなエネルギー/より大きな振幅を有するチャネル・ペアの信号のビットを符号化することでは不十分であるという問題を解決し、デコーダ側で再構成されるオーディオ信号の品質を保証することができる。
【0021】
[0020] エネルギー/振幅等化後のエネルギー/振幅に基づいて実行されるビット割り当てと比較すると、エネルギー/振幅等化前のエネルギー/振幅に基づいて実行されるビット割り当においては、マルチ・チャネル信号符号化におけるチャネルのビット数を適切に割り当てることができ、ビット割り当て処理をエネルギー/振幅等化処理から切り離すことができる。言い換えると、ビット割り当て処理は、エネルギー/振幅等化処理の影響を受けない。例えば、全チャネルのエネルギー/振幅を平均化する方法が、エネルギー/振幅等化処理プロシージャで使用される場合でさえ、この実装では、エネルギー/振幅等化前のエネルギー/振幅に基づいてビットが割り当てられ、その結果、マルチ・チャネル信号符号化におけるチャネルのビット数を適切に割り当てることができる。このようにして、より大きなエネルギー/より大きな振幅を有するチャネル信号に、より多くの符号化ビットが割り当てられ、デコーダ側で再構成されるオーディオ信号の品質を保証する。
【0022】
[0021] 可能な設計において、前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップは、
前記カレント・フレームの前記エネルギー/振幅合計sum_Epreを、数式
【0023】
【数2】

に従って計算するステップを含む可能性があり、この場合において、chはチャネル・インデックスを表し、Epre(ch)は、エネルギー/振幅等化前の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表す。
【0024】
[0022] 可能な設計において、前記カレント・フレームのエネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップは:前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅と前記P個のチャネルのそれぞれの重み係数とに基づいて決定するステップを含み、この場合において、前記重み係数は1以下である。
【0025】
[0023] この実装において、重み係数は、マルチ・チャネル信号符号化におけるチャネルのビット数を調整して、マルチ・チャネル信号符号化におけるチャネルのビット数を適切に割り当てるために使用される。
【0026】
[0024] 可能な設計において、前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅と前記P個のチャネルのそれぞれの重み係数とに基づいて決定するステップは、
前記カレント・フレームの前記エネルギー/振幅合計sum_Epreを、数式
【0027】
【数3】

に従って計算するステップを含む可能性があり、この場合において、chはチャネル・インデックスを表し、Epre(ch)は、エネルギー/振幅等化前の、(ch)番目のチャネルのオーディオ信号のエネルギー/振幅を表し、α(ch)は前記(ch)番目のチャネルの重み係数を表し、1つのチャネル・ペアにおける2つのチャネルの重み係数は同一であり、前記1つのチャネル・ペアにおける前記2つのチャネルの前記重み係数の値は、前記1つのチャネル・ペアにおける前記2つのチャネル間の正規化された相関値に逆比例する。
【0028】
[0025] この実装では、重み係数は、マルチ・チャネル信号符号化におけるチャネルのビット数を調整するために使用される。チャネル・ペアにおける2つのチャネルの重み係数の値は、1つのチャネル・ペアにおける2つのチャネルの正規化された相関値に逆比例し、即ち、重み係数は、相関の低いチャネル・ペアのビット数を増加させるために使用される。このようにして、符号化の効果が改善され、デコーダ側で再構成されるオーディオ信号の品質を保証する。
【0029】
[0026] 可能な設計において、前記P個のチャネルの前記オーディオ信号は、Q個のカップリングされていないチャネルのオーディオ信号を更に含み、P=2×K+Qであり、Qは正の整数である。前記K個のチャネル・ペアのそれぞれのビット数を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定するステップは:前記K個のチャネル・ペアの前記それぞれのビット数と前記Q個のチャネルのそれぞれのビット数とを、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と前記利用可能なビット数とに基づいて決定するステップを含む可能性がある。前記P個のチャネルの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化するステップは:前記K個のチャネル・ペアの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化し、前記Q個のチャネルの前記オーディオ信号を、前記Q個のチャネルの前記それぞれのビット数に基づいて符号化するステップを含む可能性がある。Q個のチャネルのうちの1つは、モノ・チャネルであってもよいし、或いはダウンミキシングによって得られたチャネルであってもよい。
【0030】
[0027] 可能な設計において、前記K個のチャネル・ペアの前記それぞれのビット数と前記Q個のチャネルのそれぞれのビット数とを、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と前記利用可能なビット数とに基づいて決定するステップは、前記カレント・フレームの前記エネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップ;前記K個のチャネル・ペアの前記それぞれのビット係数を、前記K個のチャネル・ペアの前記オーディオ信号の前記それぞれのエネルギー/振幅と前記カレント・フレームの前記エネルギー/振幅合計とに基づいて決定するステップ;前記Q個のチャネルのそれぞれのビット係数を、前記Q個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅と前記カレント・フレームの前記エネルギー/振幅合計とに基づいて決定するステップ;前記K個のチャネル・ペアの前記それぞれのビット数を、前記K個のチャネル・ペアの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップ;及び 前記Q個のチャネルの前記それぞれのビット数を、前記Q個のチャネルの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップを含む可能性がある。
【0031】
[0028] 可能な設計において、前記P個のチャネルの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化するステップは:前記K個のチャネル・ペアの前記それぞれのビット数に基づいて、エネルギー/振幅等化後の前記P個のチャネルの前記オーディオ信号を符号化するステップ を含む可能性がある。
【0032】
[0029] この実装では、エネルギー/振幅等化後のP個のチャネルのオーディオ信号を符号化することが化のであり、エネルギー/振幅等化後のP個のチャネルのオーディオ信号は、P個のチャネルのオーディオ信号に対してエネルギー/振幅等化を実行することによって得ることが可能である。符号化は、ステレオ処理、エントロピー符号化などを含む可能性がある。これは、符号化効率を改善し、符号化効果を高めることができる。
【0033】
[0030] 第2態様によれば、本願の実施形態はマルチ・チャネル・オーディオ信号符号化装置を提供する。マルチ・チャネル・オーディオ信号符号化装置は、オーディオ・エンコーダ、オーディオ符号化デバイスのチップ、又はチップにおけるシステムであってもよく;或いはオーディオ・エンコーダ内にある機能モジュールであって、第1の態様又は第1の態様の可能な設計のうちの任意の何れかで方法を実施するように構成されたものであってもよい。マルチ・チャネル・オーディオ信号符号化装置は、第1の態様又は第1の態様の可能な設計において実行される機能を実施することが可能であり、機能は、対応するソフトウェアを実行するハードウェアによって実現されてもよい。ハードウェア又はソフトウェアは、前述の機能に対応する1つ以上のモジュールを含む。例えば、可能な設計において、マルチ・チャネル・オーディオ信号符号化装置は:マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号と、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅とを取得するように構成された取得モジュールであって、Pは1より大きい正の整数であり、前記P個のチャネルの前記オーディオ信号はK個のチャネル・ペアのオーディオ信号を含み、Kは正の整数である、取得モジュール;前記K個のチャネル・ペアのそれぞれのビット数を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定するように構成されたビット割当モジュール;及び前記P個のチャネルの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するように構成された符号化モジュールを含む可能性がある。
【0034】
[0031] 前記P個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は:時間ドメインにおける前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、時間-周波数変換後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、時間-周波数変換及びホワイトニング後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、エネルギー/振幅等化後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、又は、ステレオ処理後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅のうちの少なくとも1つを含む。
【0035】
[0032] 可能な設計において、K個のチャネル・ペアはカレント・チャネル・ペアを含む。前記符号化モジュールは:前記カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、前記カレント・チャネル・ペアの前記ビット数と、ステレオ処理後の前記カレント・チャネル・ペアにおける前記2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅とに基づいて決定するステップ;及び前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化するステップを行うように構成されている。
【0036】
[0033] 可能な設計において、前記ビット割当モジュールは:前記カレント・フレームのエネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップ;前記K個のチャネル・ペアのそれぞれのビット係数を、前記K個のチャネル・ペアの前記オーディオ信号のそれぞれのエネルギー/振幅と前記カレント・フレームのエネルギー/振幅合計とに基づいて決定するステップ;及び前記K個のチャネル・ペアのそれぞれのビット数を、前記K個のチャネル・ペアの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップを行うように構成されている。
【0037】
[0034] 可能な設計において、前記ビット割当モジュールは、前記カレント・フレームの前記エネルギー/振幅合計を、ステレオ処理後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するように構成されている。
【0038】
[0035] 可能な設計において、前記ビット割当モジュールは、
前記カレント・フレームの前記エネルギー/振幅合計sum_Epostを、数式
【0039】
【数4】

に従って計算するように構成されており、この場合において、chはチャネル・インデックスを表し、Epost(ch)は、ステレオ処理後の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表し、sampleCoefpost(ch,i)は、ステレオ処理後の(ch)番目のチャネルの前記カレント・フレームのi番目の係数を表し、Nは、前記カレント・フレームの係数の数を表し且つ1より大きい正の整数である。
【0040】
[0036] 可能な設計において、ビット割当モジュールは、前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するように構成されており、前記エネルギー振幅等化前のP個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は、時間ドメインにおける前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、時間-周波数変換後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅、又は、時間-周波数変換及びホワイトニング後の前記1つのチャネルの前記オーディオ信号のエネルギー/振幅を含む。
【0041】
[0037] 可能な設計において、前記ビット割当モジュールは、
前記カレント・フレームの前記エネルギー/振幅合計sum_Epreを、数式
【0042】
【数5】

に従って計算するように構成されており、この場合において、chはチャネル・インデックスを表し、Epre(ch)は、エネルギー/振幅等化前の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表す。
【0043】
[0038] 可能な設計において、前記ビット割当モジュールは、前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化前の、前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅と前記P個のチャネルのそれぞれの重み係数とに基づいて決定するように構成されており、前記重み係数は1以下である。
【0044】
[0039] 可能な設計において、前記ビット割当モジュールは、前記カレント・フレームの前記エネルギー/振幅合計sum_Epreを、数式
【0045】
【数6】

に従って計算するように構成されており、この場合において、chはチャネル・インデックスを表し、Epre(ch)は、エネルギー/振幅等化前の、(ch)番目のチャネルのオーディオ信号のエネルギー/振幅を表し、α(ch)は前記(ch)番目のチャネルの重み係数を表し、1つのチャネル・ペアにおける2つのチャネルの重み係数は同一であり、前記1つのチャネル・ペアにおける前記2つのチャネルの前記重み係数の値は、前記1つのチャネル・ペアにおける前記2つのチャネル間の正規化された相関値に逆比例する。
【0046】
[0040] 可能な設計において、前記P個のチャネルの前記オーディオ信号は、Q個のカップリングされていないチャネルのオーディオ信号を更に含み、P=2×K+Qであり、Qは正の整数である。前記ビット割当モジュールは、前記K個のチャネル・ペアの前記それぞれのビット数と前記Q個のチャネルのそれぞれのビット数とを、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と前記利用可能なビット数とに基づいて決定するように構成されている。前記符号化モジュールは、前記K個のチャネル・ペアの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化し、前記Q個のチャネルの前記オーディオ信号を、前記Q個のチャネルの前記それぞれのビット数に基づいて符号化するように構成されている。
【0047】
[0041] 可能な設計において、前記ビット割当モジュールは、前記カレント・フレームの前記エネルギー/振幅合計を、前記P個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅に基づいて決定するステップ;前記K個のチャネル・ペアの前記それぞれのビット係数を、前記K個のチャネル・ペアの前記オーディオ信号の前記それぞれのエネルギー/振幅と前記カレント・フレームの前記エネルギー/振幅合計とに基づいて決定するステップ;前記Q個のチャネルのそれぞれのビット係数を、前記Q個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅と前記カレント・フレームの前記エネルギー/振幅合計とに基づいて決定するステップ;前記K個のチャネル・ペアの前記それぞれのビット数を、前記K個のチャネル・ペアの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップ;及び前記Q個のチャネルの前記それぞれのビット数を、前記Q個のチャネルの前記それぞれのビット係数と前記利用可能なビット数とに基づいて決定するステップを行うように構成されている。
【0048】
[0042] 可能な設計において、前記符号化モジュールは、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて、エネルギー/振幅等化後の前記P個のチャネルの前記オーディオ信号を符号化するように構成されている。
【0049】
[0043] ある実装において、装置はエネルギー/振幅等化モジュールを更に含むことが可能である。エネルギー/振幅等化モジュールは、P個のチャネルのオーディオ信号に基づいて、エネルギー/振幅等化後のP個のチャネルのオーディオ信号を得るように構成されている。
【0050】
[0044] 第3の態様によれば、本願の実施形態はマルチ・チャネル・オーディオ信号符号化方法を提供する。方法は:マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号を取得するステップであって、Pは1より大きい正の整数であり、前記P個のチャネルの前記オーディオ信号はK個のチャネル・ペアのオーディオ信号を含み、Kは正の整数である、ステップ;前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて、前記K個のチャネル・ペアのカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号に対してエネルギー/振幅等化を実行して、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅を取得するステップ;前記カレント・チャネル・ペアにおける前記2つのチャネルのそれぞれのビット数を、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定するステップ;及び前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するステップを含む可能性がある。
【0051】
[0045] この実装では、エネルギー/振幅等化は、単一チャネル・ペアにおける2つのチャネルのオーディオ信号に対して実行され、その結果、エネルギー/振幅等化がチャネル・ペアに対して実行された後でも、比較的大きなエネルギー/振幅差を有するチャネル・ペアの間で、比較的大きなエネルギー/振幅差を依然として維持することができる。このケースでは、エネルギー/振幅等化後のエネルギー/振幅に基づいてビットが割り当てられる場合に、より大きなエネルギー/より大きな振幅を有するチャネル・ペアに、より多くのビットが割り当てられるので、より大きなエネルギー/振幅を有するチャネル・ペアの符号化ビットが、チャネル・ペアの符号化条件に合うことを保証する。このようにして、デコーダ側で再構成されるオーディオ信号の品質は改善される。
【0052】
[0046] 可能な設計において、P=2×Kであり、Kは正の整数である。前記カレント・チャネル・ペアにおける前記2つのチャネルのそれぞれのビット数を、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定するステップは:前記カレント・フレームの前記エネルギー/振幅合計を、エネルギー/振幅等化後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップ;及び前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅合計と、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップを含む可能性がある。
【0053】
[0047] 可能な設計において、前記P個のチャネルの前記オーディオ信号は、Q個のカップリングされていないチャネルのオーディオ信号を更に含み、P=2×K+Qであり、Qは正の整数である。前記カレント・チャネル・ペアにおける前記2つのチャネルのそれぞれのビット数を、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定するステップは:前記カレント・フレームの前記エネルギー/振幅合計を、前記エネルギー/振幅等化後の前記K個のチャネル・ペア各々における2つのチャネルのオーディオ信号のエネルギー/振幅と、前記エネルギー/振幅等化後の前記Q個のチャネルの前記オーディオ信号のエネルギー/振幅とに基づいて決定するステップ;前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅と、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップ;及び前記Q個のチャネルのそれぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅合計と、エネルギー/振幅等化後の前記Q個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップを含む可能性がある。前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するステップは:前記K個のチャネル・ペアの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化し、前記Q個のチャネルの前記オーディオ信号を、前記Q個のチャネルの前記それぞれのビット数に基づいて符号化して、前記符号化されたビットストリームを取得するステップを含む可能性がある。
【0054】
[0048] 第4の態様によれば、本願の実施形態はオーディオ信号符号化装を提供する。マルチ・チャネル・オーディオ信号符号化装置は、オーディオ・エンコーダ、オーディオ符号化デバイスのチップ、又はチップにおけるシステムであってもよく;或いはオーディオ・エンコーダ内にある機能モジュールであって、第3の態様又は第3の態様の可能な設計のうちの任意の何れかで方法を実施するように構成されたものであってもよい。マルチ・チャネル・オーディオ信号符号化装置は、第3の態様又は第3の態様の可能な設計において実行される機能を実施することが可能であり、機能は、対応するソフトウェアを実行するハードウェアによって実現されてもよい。ハードウェア又はソフトウェアは、前述の機能に対応する1つ以上のモジュールを含む。例えば、可能な設計において、マルチ・チャネル・オーディオ信号符号化装置は:マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号を取得するように構成された取得モジュールあって、Pは1より大きい正の整数であり、前記P個のチャネルの前記オーディオ信号はK個のチャネル・ペアのオーディオ信号を含み、Kは正の整数である、取得モジュール;前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて、前記K個のチャネル・ペアのカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号に対してエネルギー/振幅等化を実行して、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅を取得するように構成されたエネルギー/振幅等化モジュール;前記カレント・チャネル・ペアにおける前記2つのチャネルのそれぞれのビット数を、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定するように構成されたビット割当モジュール;及び前記2つのチャネルの前記オーディオ信号を、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するように構成された符号化モジュールを含む可能性がある。
【0055】
[0049] 可能な設計において、P=2×Kであり、Kは正の整数である。前記ビット割当モジュールは:前記カレント・フレームのエネルギー/振幅合計を、エネルギー/振幅等化後の前記P個のチャネルの前記オーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップ;及び前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅合計と、エネルギー/振幅等化後の前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップを行うように構成されている。
【0056】
[0050] 可能な設計において、前記P個のチャネルの前記オーディオ信号は、Q個のカップリングされていないチャネルのオーディオ信号を更に含み、P=2×K+Qであり、Qは正の整数である。前記ビット割当モジュールは:前記カレント・フレームの前記エネルギー/振幅合計を、前記エネルギー/振幅等化後の前記K個のチャネル・ペア各々における2つのチャネルのオーディオ信号のエネルギー/振幅と、前記エネルギー/振幅等化後の前記Q個のチャネルの前記オーディオ信号のエネルギー/振幅とに基づいて決定するステップ;前記カレント・チャネル・ペアにおける前記2つのチャネルの前記それぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅と、前記カレント・チャネル・ペアにおける前記2つのチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップ;及び前記Q個のチャネルのそれぞれのビット数を、前記カレント・フレームの前記エネルギー/振幅合計と、エネルギー/振幅等化後の前記Q個のチャネルの前記オーディオ信号の前記それぞれのエネルギー/振幅と、前記利用可能なビット数とに基づいて決定するステップを行うように構成されている。前記符号化モジュールは:前記K個のチャネル・ペアの前記オーディオ信号を、前記K個のチャネル・ペアの前記それぞれのビット数に基づいて符号化し、前記Q個のチャネルの前記オーディオ信号を、前記Q個のチャネルの前記それぞれのビット数に基づいて符号化して、前記符号化されたビットストリームを取得するように構成されている。
【0057】
[0051] 第5の態様によれば、本願の実施形態は、互いに結合された不揮発性メモリ及びプロセッサを含むオーディオ信号符号化装置を提供する。前記プロセッサは、前記メモリに記憶されたプログラム・コードを起動して、第1の態様又は第1の態様の可能な設計のうちの任意の何れかによる方法を実行するか、又は第3の態様又は第3の態様の可能な設計のうちの任意の何れかによる方法を実行する。
【0058】
[0052] 第6の態様によれば、本願の実施形態は、エンコーダを含むオーディオ信号符号化デバイスを提供する。エンコーダは、第1の態様又は第1の態様の可能な設計のうちの任意の何れかによる方法を実行するか、又は第3の態様又は第3の態様の可能な設計のうちの任意の何れかによる方法を実行するように構成されている。
【0059】
[0053] 第7の態様によれば、本願の実施形態は、コンピュータ・プログラムを含むコンピュータ読み取り可能な記憶媒体を提供する。コンピュータ・プログラムがコンピュータ上で実行されると、コンピュータは、第1の態様又は第1の態様の可能な設計のうちの任意の何れかによる方法を実行するか、又は第3の態様又は第3の態様の可能な設計のうちの任意の何れかによる方法を実行するように動作することが可能である。
【0060】
[0054] 第8の態様によれば、本願の実施形態は、第1の態様又は第1の態様の可能な設計のうちの任意の何れかによる方法により取得された符号化されたビットストリーム、又は、第3の態様又は第3の態様の可能な設計のうちの任意の何れかによる方法により取得された符号化されたビットストリームを含むコンピュータ読み取り可能な記憶媒体を提供する。
【0061】
[0055] 第9の態様によれば、本願はコンピュータ・プログラム製品を提供する。コンピュータ・プログラム製品は、コンピュータ・プログラムを含み、コンピュータ・プログラムがコンピュータによって実行されると、コンピュータ・プログラムを使用して、第1の態様又は第1の態様の可能な設計のうちの任意の何れかによる方法を実行するか、又は、第3の態様又は第3の態様の可能な設計のうちの任意の何れかによる方法を実行する。
【0062】
[0056] 第10の態様によれば、本願の実施形態は、プロセッサ及びメモリを含むチップを提供する。メモリは、コンピュータ・プログラムを記憶するように構成され、プロセッサは、メモリに記憶されたプログラム・コードを起動及び実行して、第1の態様又は第1の態様の可能な設計のうちの任意の何れかによる方法を実行するか、又は、第3の態様又は第3の態様の可能な設計のうちの任意の何れかによる方法を実行するように構成されている。
【0063】
[0057] 本願の実施形態におけるマルチ・チャネル・オーディオ信号符号化方法及び装置によれば、マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号が取得され、ここで、P個のチャネルのオーディオ信号はK個のチャネル・ペアのオーディオ信号を含み;K個のチャネル・ペアのそれぞれのビット数は、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定され;P個のチャネルのオーディオ信号は、K個のチャネル・ペアのそれぞれのビット数に基づいて符号化され、符号化されたビットストリームを取得する。P個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は:時間ドメインにおける1つのチャネルのオーディオ信号のエネルギー/振幅、時間-周波数変換後の1つのチャネルのオーディオ信号のエネルギー/振幅、時間-周波数変換及びホワイトニング後の1つのチャネルのオーディオ信号のエネルギー/振幅、エネルギー/振幅等化後の1つのチャネルのオーディオ信号のエネルギー/振幅、又は、ステレオ処理後の1つのチャネルの前記オーディオ信号のエネルギー/振幅のうちの少なくとも1つを含む。ビットは、時間ドメインにおけるP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換及びホワイトニング後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、エネルギー/振幅等化後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、又はステレオ処理後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅のうちの少なくとも1つに基づいて、チャネル・ペアに割り当てられて、K個のチャネル・ペアのそれぞれのビット数を決定する。このようにして、マルチ・チャネル信号符号化におけるチャネル・ペアのビット数は適切に割り当てられ、デコーダによって再構成されるオーディオ信号の品質を保証する。例えば、チャネル・ペアの間のエネルギー/振幅差が比較的大きい場合、本願の実施形態における方法は、より大きなエネルギー/より大きな振幅を有するチャネル・ペアのビットを符号化することでは不十分であるという問題を解決するために使用され、デコーダ側で再構成されるオーディオ信号の品質を保証することができる。
【図面の簡単な説明】
【0064】
図1】[0058] 図1は、本願の一実施形態によるオーディオ符号化及び復号化システムの一例の概略図である。
図2】[0059] 図2は、本願の一実施形態によるマルチ・チャネル・オーディオ信号符号化方法のフローチャートである。
図3】[0060] 図3は、本願の一実施形態によるマルチ・チャネル・オーディオ信号符号化方法のフローチャートである。
図4】[0061] 図4は、本願の一実施形態によるチャネル・ペアのビットを割り当てる方法のフローチャートである。
図5】[0062] 図5は、本願の一実施形態によるエンコーダ側の処理手順の概略図である。
図6】[0063] 図6は、本願の一実施形態によるチャネル符号化ユニットの処理手順の概略図である。
図7】[0064] 図7は、本願の一実施形態によるチャネル符号化ユニットの処理手順の概略図である。
図8】[0065] 図8は、本願の一実施形態による別のマルチ・チャネル・オーディオ信号符号化方法のフローチャートである。
図9】[0066] 図9は、本願の一実施形態によるオーディオ信号符号化装置の概略構造図である。
図10】[0067] 図10は、本願の一実施形態によるオーディオ信号符号化デバイスの概略構造図である。
【発明を実施するための形態】
【0065】
[0068] 本願の実施態様における「第1の」及び「第2の」のような用語は、区別及び説明だけのために使用されており、相対的な重要性又は順番を示したり又は意味したりするものとして理解することはできない。更に、用語「含む」、「有する」、及びそれらの何らかの変形は、非排他的な包含をカバーするように意図されており、例えば、一連のステップ又はユニットを含む。方法、システム、製品、又はデバイスは、必ずしも、文字通りに列挙されたステップ又はユニットに限定されず、文字通りには列挙されていなかったり、又はそのようなプロセス、方法、製品、又はデバイスにとって本来備わっていたりする他のステップ又はユニットを含む可能性がある。
【0066】
[0069] 本願において、「少なくとも1つの」は1つ以上を意味し、「複数の」は2つ以上を意味することが理解されるべきである。用語「及び/又は」は、関連付けられるオブジェクトを記述するためのアソシエーション関係を記述するために使用され、また、3つの関係が存在し得ることを示す。例えば、「A及び/又はB」は、Aのみが存在すること、Bのみが存在すること、A及びBの両方が存在すること、という3つの場合を表す可能性があり、ここで、A及びBは単数又は複数である可能性がある。文字「/」は、一般に、関連するオブジェクト間の「又は」の関係を表す。「以下のうちの少なくとも1つ」又はその類似の表現は、以下の任意の組み合わせを意味し、以下のうちの1つ又は複数の任意の組み合わせを含む。例えば、a,b,又はcのうちの少なくとも1つは、a、b、c、「a及びb」、「a及びc」、「b及びc」、又は「a、b及びc」を表す可能性がある。a、b及びcの各々は、単数又は複数である可能性がある。代替的に、a、b及びcのうちの幾つかが単数であってもよく;a、b及びcの幾つかが複数であってもよい。
【0067】
[0070] 以下、本願の実施形態が適用されるシステム・アーキテクチャを説明する。図1は、本願の実施形態が適用されるオーディオ符号化及び復号化システム10の一例の概略ブロック図である。図1に示されるように、オーディオ符号化及び復号化システム10は、ソース・デバイス12と宛先デバイス14とを含むことが可能である。ソース・デバイス12は、符号化されたオーディオ・データを生成する。従って、ソース・デバイス12は、オーディオ符号化装置と呼ばれてもよい。宛先デバイス14は、ソース・デバイス12によって生成された符号化されたオーディオ・データを復号化することができる。従って、宛先デバイス14は、オーディオ復号化装置と呼ばれてもよい。様々な実装解決策において、ソース・デバイス12、宛先デバイス14、又は、ソース・デバイス12と宛先デバイス14の両方は、1つ以上のプロセッサ及び1つ以上のプロセッサに結合されたメモリを含む可能性がある。メモリは、RAM、ROM、EEPROM、フラッシュ・メモリ、又はその他の任意の媒体であって、本明細書で説明されるような、コンピュータによってアクセス可能な命令又はデータ構造の形式で所望のプログラム・コードを記憶するために使用されことが可能な任意の媒体を含む可能性があるが、これらに限定されない。ソース・デバイス12と宛先デバイス14は、デスクトップ・コンピュータ、モバイル演算装置、ノートブック(例えば、ラップトップ)コンピュータ、タブレット、セット・トップ・ボックス、「スマート」フォンのような電話ハンドセット、テレビジョン・セット、スピーカ、デジタル・メディア・プレーヤ、ビデオ・ゲーム・コンソール、車載コンピュータ、何らかのウェアラブル・デバイス、仮想現実(virtual reality,VR)デバイス、VRサービスを提供するサーバー、拡張現実(augmented reality,AR)デバイス、ARサービスを提供するサーバー、無線通信デバイス、及びそれらの同様なデバイスを含む様々な装置を含む可能性がある。
【0068】
[0071] 図1は、ソース・デバイス12と宛先装置14を別個のデバイスとして描いているが、デバイスの実施形態は、代替的に、ソース・デバイス12と宛先デバイス14の両方、又はソース・デバイス12と宛先デバイス14の両方の機能、即ち、ソース・デバイス12又は対応する機能と宛先デバイス14又は対応する機能を含んでもよい。このような実施形態では、ソース・デバイス12又は対応する機能及び宛先デバイス14又は対応する機能は、同一のハードウェア及び/又はソフトウェアを使用することによって、又は別個のハードウェア及び/又はソフトウェアを使用することによって、又はそれらの任意の組み合わせによって実施されてもよい。
【0069】
[0072] ソース・デバイス12と宛先デバイス14との間の通信コネクションは、リンク13を介して実行されてもよく、宛先デバイス14は、符号化されたオーディオ・データを、リンク13を介してソース・デバイス12から受信することができる。リンク13は、コード化されたオーディオ・データをソース・デバイス12から宛先デバイス14へ移動させることが可能な1つ以上の媒体又は装置を含む可能性がある。一例では、リンク13は、ソース・デバイス12が、符号化されたオーディオ・データを宛先デバイス14へリアル・タイムで直接的に送信することを可能にする1つ以上の通信媒体を含む可能性がある。この例では、ソース・デバイス12は、通信規格(例えば、無線通信プロトコル)に従って、符号化されたオーディオ・データを変調することが可能であり、変調されたオーディオ・データを宛先デバイス14へ送信することが可能である。1つ以上の通信媒体は、無線通信媒体及び/又は有線通信媒体、例えば、無線周波数(RF)スペクトル又は1つ以上の物理的伝送線路を含むことが可能である。1つ以上の通信媒体は、パケット・ベースのネットワークの一部を形成することが可能であり、パケット・ベースのネットワークは、例えば、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、又はグローバル・ネットワーク(例えば、インターネット)である。1つ以上の通信媒体は、ソース・デバイス12から宛先デバイス14への通信を促進するルータ、スイッチ、基地局、又はその他のデバイスを含んでもよい。
【0070】
[0073] ソース・デバイス12はエンコーダ20を含む。オプションとして、ソース・デバイス12は、オーディオ・ソース16、プリプロセッサ18、及び通信インターフェース22を更に含んでもよい。特定の実装では、エンコーダ20、オーディオ・ソース16、プリプロセッサ18、及び通信インターフェース22は、ソース・デバイス12内のハードウェア構成要素であってもよいし、又はソース・デバイス12内のソフトウェア・プログラムであってもよい。以下これらを別々に説明する。
【0071】
[0074] オーディオ・ソース16は、例えば、実世界からの音を取り込むように構成された任意のタイプのサウンド・キャプチャ・デバイス、及び/又は任意のタイプの音声生成デバイスを含むか又はそれらであってもよい。オーディオ・ソース16は、音を取り込むように構成されたマイクロホン、又はオーディオ・データを格納するように構成されたメモリであってもよく、オーディオ・ソース16は、事前に取り込まれた又は生成されたオーディオ・データを格納するため、及び/又は、オーディオ・データを取得又は受信するために、何らかのタイプの(内部又は外部の)インターフェースを更に含んでもよい。オーディオ・ソース16がマイクロホンである場合、オーディオ・ソース16は、例えば、ローカル・マイクロホン又はソース・デバイスに一体化されたマイクロホンであってもよい。オーディオ・ソース16がメモリである場合、オーディオ・ソース16は、例えば、ローカル・メモリ又はソース・デバイスに一体化されたメモリであってもよい。オーディオ・ソース16がインターフェースを含む場合、インターフェースは、例えば、外部オーディオ・ソースからオーディオ・データを受信するための外部インターフェースであってもよい。例えば、外部オーディオ・ソースは、マイクロホン、外部ストレージ、又は外部オーディオ生成デバイスのような外部サウンド・キャプチャ・デバイスである。インターフェースは、任意の独自の又は標準化されたインターフェース・プロトコルに従って、任意のタイプのインターフェース、例えば、有線又は無線インターフェース又は光インターフェースであるとすることが可能である。
【0072】
[0075] 本願のこの実施形態では、オーディオ・ソース16によってプリプロセッサ18へ伝送されるオーディオ・データは、生オーディオ・データ17とも呼ばれる。
【0073】
[0076] プリプロセッサ18は、生オーディオ・データ17を受信して前処理し、前処理されたオーディオ19又は前処理されたオーディオ・データ19を得るように構成される。例えば、プリプロセッサ18によって実行される前処理は、フィルタリング又はデノイジングを含んでもよい。
【0074】
[0077] エンコーダ20(又はオーディオ・エンコーダ20と呼ばれる)は、前処理されたオーディオ・データ19を受信するように構成され、以下に説明される実施形態を実行するように構成され、本願で説明されるオーディオ信号エンコーディング方法のエンコーダ側での適用を実施する。
【0075】
[0078] 通信インターフェース22は、符号化されたオーディオ・データ21を受け取り、符号化されたオーディオ・データ21を、記憶又は直接的な再構成のためにリンク13を介して宛先デバイス14へ又は任意の他のデバイス(例えば、メモリ)へ伝送するように構成されることが可能である。他のデバイスは、復号化又は記憶のために使用される任意のデバイスであってもよい。通信インターフェース22は、例えば、符号化されたオーディオ・データ21を、リンク13を介して伝送するための適切なフォーマットに、例えばデータ・パケットにカプセル化するように構成されてもよい。
【0076】
[0079] 宛先デバイス14はデコーダ30を含む。オプションとして、宛先デバイス14は、通信インターフェース28、オーディオ・ポスト・プロセッサ32、及びスピーカ・デバイス34を更に含んでもよい。以下、これらを別々に説明する。
【0077】
[0080] 通信インターフェース28は、ソース・デバイス12又は任意の他のソースから、符号化されたオーディオ・データ21を受信するように構成されることが可能である。任意の他のソースは、例えば、ストレージ・デバイスである。ストレージ・デバイスは、例えば、符号化されたオーディオ・データ・ストレージ・デバイスである。通信インターフェース28は、ソース・デバイス12と宛先デバイス14との間のリンク13を介して、又は任意のタイプのネットワークを介して、符号化されたオーディオ・データ21を送信又は受信するように構成されていてもよい。リンク13は、例えば、直接的な有線接続又は無線接続である。任意のタイプのネットワークは、例えば、有線又は無線ネットワーク、又はそれらの任意の組み合わせ、又は任意のタイプの私的又は公的なネットワーク、又はそれらの任意の組み合わせである。通信インターフェース28は、例えば、通信インターフェース22を介して伝送されたデータ・パケットのカプセル化を解除して、符号化されたオーディオ・データ21を得るように構成することが可能である。
【0078】
[0081] 通信インターフェース28及び通信インターフェース22の両方は、単方向通信インターフェース又は双方向通信インターフェースとして構成することが可能であり、例えば、接続を確立するためにメッセージを送信及び受信し、通信リンク及び/又は符号化オーディオ・データ伝送のようなデータ伝送に関連する何らかの他の情報を確認及び交換するように構成されてもよい。
【0079】
[0082] デコーダ30(又はデコーダ30と呼ばれる)は、符号化されたオーディオ・データ21を受け取り、復号化されたオーディオ・データ31又は復号化されたオーディオ31を提供するように構成される。
【0080】
[0083] オーディオ・ポスト・プロセッサ32は、デコードされたオーディオ・データ31(再構成されたオーディオ・データとも呼ばれる)を後処理して、後処理されたオーディオ・データ33を得るように構成されている。オーディオ・ポスト・プロセッサ32によって実行される後処理は、例えば、レンダリング又は任意の他の処理を含む可能性があり、後処理されたオーディオ・データ33をスピーカ・デバイス34へ送信するように更に構成されてもよい。
【0081】
[0084] スピーカ・デバイス34は、例えば、ユーザー又はビューアに対してオーディオを再生するために、後処理されたオーディオ・データ33を受け取るように構成される。スピーカ・デバイス34は、再構成された音を再生するように構成された任意のタイプの拡声器であってもよいし、又はそれを含んでいてもよい。
【0082】
[0085] 図1は、ソース・デバイス12と宛先デバイス14を別個のデバイスとして描いているが、デバイスの実施形態は、代替的に、ソース・デバイス12と宛先デバイス14の両方、又はソース・デバイス12と宛先デバイス14の両方の機能、即ち、ソース・デバイス12又は対応する機能と宛先デバイス14又は対応する機能を含む可能性がある。このような実施形態では、ソース・デバイス12又は対応する機能と宛先デバイス14又は対応する機能は、同一のハードウェア及び/又はソフトウェアを使用することによって、又は別個のハードウェア及び/又はソフトウェアを使用することによって、又はそれらの任意の組み合わせによって実施することができる。
【0083】
[0086] 明細書に基づいて当業者に明らかになるように、図1に示されるソース・デバイス12及び/又は宛先デバイス14の様々なユニット又は機能の存在及び(厳密な)分け方は、実際のデバイス及びアプリケーションに応じて相違する可能性がある。ソース・デバイス12及び宛先デバイス14は、例えば、ノートブック又はラップトップ・コンピュータ、携帯電話、スマートフォン、パッド又はタブレット・コンピュータ、ビデオ・カメラ、デスクトップ・コンピュータ、セット・トップ・ボックス、テレビジョン・セット、カメラ、車載デバイス、サウンド・ボックス、デジタル・メディア・プレーヤ、ビデオ・ゲーム・コンソール、ビデオ・ストリーミング伝送デバイス(コンテンツ・サービス・サーバー又はコンテンツ配信サーバー等)、放送受信デバイス、放送送信デバイス、スマート・グラス又はスマート・ウオッチ等の任意のタイプの携帯式又は固定式のデバイスを含む、広範囲に及ぶデバイスのうちの任意の何れであってもよく、何らかのタイプのオペレーティング・システムを使用しても使用しなくてもよい。
【0084】
[0087] エンコーダ20とデコーダ30はそれぞれ種々の適切な回路、例えば、1つ以上のマイクロプロセッサ、デジタル信号プロセッサ(digital signal processor,DSP)、特定用途向け集積回路(application-specific integrated circuit,ASIC)、フィールド・プログラマブル・ゲート・アレイ(field-programmable gate array,FPGA)、個別ロジック、ハードウェア、又はそれらの任意の組み合わせのうちの任意の何れかとして実装されてもよい。技術がソフトウェアを使用することにより部分的に実装される場合、デバイスは、適切で非一時的なコンピュータ読み取り可能な記憶媒体にソフトウェア命令を記憶し、本開示の技術を実行するために、1つ以上のプロセッサのようなハードウェアを使用することによって命令を実行することができる。前述のコンテンツ(ハードウェア、ソフトウェア、ハードウェアとソフトウェアの組み合わせ等を含む)のうちの任意の何れもが、1つ以上のプロセッサと考えられてよい。
【0085】
[0088] 場合によっては、図1に示されるオーディオ符号化及び復号化システム10は単なる一例であるに過ぎず、本願の技術は、必ずしも、符号化デバイスと復号化デバイスとの間の何らかのデータ通信を含まないオーディオ符号化セッティング(例えば、オーディオ符号化又は音声復号化)に適用可能である。他の例では、データは、ローカル・メモリから検索されたり、ネットワークを介してストリーミング方式で伝送されたりすること等が可能である。オーディオ符号化デバイスは、データを符号化し、データをメモリに格納することが可能であり、及び/又は音声復号化デバイスは、データをメモリから検索して復号化することが可能である。幾つかの例では、符号化及び復号化は、互いに通信せずに、単にメモリへのデータを符号化し、及び/又はメモリからデータを検索して復号化するデバイスによって実行される。
【0086】
[0089] エンコーダは、マルチ・チャネル・エンコーダ、例えば、ステレオ・エンコーダ、5.1チャネル・エンコーダ、又は7.1チャネル・エンコーダであってもよい。
【0087】
[0090] オーディオ・データはオーディオ信号とも呼ばれてもよい。本願のこの実施形態におけるオーディオ信号は、オーディオ符号化デバイスにおける入力信号であり、オーディオ信号は複数のフレームを含んでもよい。例えば、現在のフレームは、オーディオ信号内の特定のフレームであってもよい。本願のこの実施形態では、オーディオ信号の現在のフレームが符号化され復号化される例が、説明のために使用される。オーディオ信号中の現在のフレームの前のフレーム又は次のフレームは、現在のオーディオ信号のフレームのコーディング方式で符号化及び復号化されてもよく、オーディオ信号中の現在のフレームの前のフレーム又は次のフレームの符号化及び復号プロセスは、一つずつには説明されない。更に、本願のこの実施形態におけるオーディオ信号は、マルチ・チャネル信号、即ち、P個のチャネルのオーディオ信号を含むものであってもよい。本願のこの実施形態は、マルチ・チャネル・オーディオ信号符号化を実現するために使用される。
【0088】
[0091] 本願の実施形態における「エネルギー/振幅」は、エネルギー又は振幅を表していることに留意すべきである。また、実際の処理手順では、フレームに対してエネルギー処理が開始時に実行される場合には、後続の処理でエネルギー処理が実行され;或いはフレームに対して振幅処理が開始時に実行される場合には、後続の処理で振幅処理が実行される。
【0089】
[0092] 前述のエンコーダは、本願の実施形態におけるマルチ・チャネル・オーディオ信号符号化方法を実行し、マルチ・チャネル信号符号化におけるチャネルのビット数を適切に割り当てて、デコーダ側によって再構成されるオーディオ信号の品質を保証し、符号化品質を改善することができる。具体的な実施形態については、以下の実施形態の具体的な説明を参照されたい。
【0090】
[0093] 図2は、本願の実施形態によるマルチ・チャネル・オーディオ信号符号化方法のフローチャートである。本願のこの実施形態は、前述のエンコーダによって実行されてもよい。図2に示されるように、この実施形態における方法は、以下のステップを含んでもよい。
【0091】
[0094] ステップ101:マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号を取得し、この場合において、Pは1より大きい正の整数であり、P個のチャネルのオーディオ信号はK個のチャネル・ペアのオーディオ信号を含む。
【0092】
[0095] 1つのチャネル・ペア(channel pair)のオーディオ信号は、2つのチャネルのオーディオ信号を含む。本願のこの実施形態における1つのチャネル・ペアは、K個のチャネル・ペアの任意の1つである可能性がある。2つのカップリングされた(coupling)チャネルのオーディオ信号は、1つのチャネル・ペアのオーディオ信号である。
【0093】
[0096] 一部の実施態様において、P=2Kである。マルチ・チャネル信号スクリーニング、カップリング、ステレオ処理、及びマルチ・チャネル・サイド情報生成の後に、P個のチャネルのオーディオ信号、即ちK個のチャネル・ペアのオーディオ信号が取得されてもよい。
【0094】
[0097] 一部の実施形態では、P個のチャネルのオーディオ信号は、更に、Q個のカップリングされていないチャネルのオーディオ信号を含み、ここで、P=2×K+Qであり、Kは正の整数であり、Qは正の整数である。
【0095】
[0098] マルチ・チャネル信号スクリーニング、カップリング、ステレオ処理、及びマルチ・チャネル・サイド情報生成の後、ステレオ処理が行われていないQ個のチャネルのオーディオ信号と、K個のチャネル・ペアのオーディオ信号とを取得することが可能である。5.1チャネルの信号を例として使用すると、5.1チャネルは、左(L)チャネル、右(R)チャネル、中央(C)チャネル、低周波エフェクト(low frequency effects,LFE)チャネル、左サラウンド(LS)チャネル、及び右サラウンド(RS)チャネルを含む。Lチャネル信号とRチャネル信号は、カップリングされて第1のチャネル・ペアを形成する。ステレオ処理が、第1のチャネル・ペアに対して実行され、ミドル・チャネルM1チャネル信号とサイド・チャネルS1チャネル信号とを得る。LSチャネル信号とRSチャネル信号は、カップリングされて第2のチャネル・ペアを形成する。ステレオ処理が、第2のチャネル・ペアに対して実行され、ミドル・チャネルM2チャネル信号とサイド・チャネルS2チャネル信号とを得る。LFEチャネル信号とCチャネル信号は、カップリングされないオーディオ信号である。即ち、P=6,K=2,及びQ=2である。P個のチャネルのオーディオ信号は、第1のチャネル・ペアのオーディオ信号と、第2のチャネル・ペアのオーディオ信号と、ステレオ処理が実行されていないLFEチャネル信号及びCチャネル信号とを含む。第1のチャネル・ペアのオーディオ信号は、ミドル・チャネルM1チャネル信号とサイド・チャネルS1チャネル信号とを含み、第2のチャネル・ペアのオーディオ信号は、ミドル・チャネルM2チャネル信号とサイド・チャネルS2チャネル信号とを含む。ミドル・チャネルM1及びM2並びにサイド・チャネルS1及びS2は、ダウンミキシング処理によって得られるチャネル、即ち、ダウンミックスされたチャネルであると考えることができる。
【0096】
[0099] 一部の実施形態では、P個のチャネルは、LFEチャネルを含まない。これらの実施形態では、LFEチャネルのエネルギー/振幅値が高いか低いかにかかわらず、固定されたビット数がLFEチャネルに割り当てられることが可能である。例えば、固定された数量は、事前に設定された値であってもよい。具体的には、マルチ・チャネル信号に含まれるチャネルの数及びマルチ・チャネル信号の符号化ビット・レートによらず、固定された数量は不変であり、例えば、80、100、又は120である。あるいは、固定された数量は、代替的に、以下のうちの少なくとも1つ:マルチ・チャネル信号に含まれるチャネルの数量、及びマルチ・チャネル信号の符号化ビット・レート、に基づいて決定されてもよい。一般に、より多数のチャネルはより少ない固定数量を示し;より高い符号化ビット・レートはより多数の固定数量を示す。例えば、マルチ・チャネル信号が5.1チャネルの信号である場合、即ち、6個のチャネルが含まれる場合、符号化ビット・レートが192 kbpsであるならば、固定された数量は80であってもよく、具体的には、80ビットがLFEチャネルに割り当てられる。符号化ビット・レートが256 kbpsであるならば、固定された数量は120であってもよく、具体的には、120ビットがLFEチャネルに割り当てられる。例えば、符号化ビット・レートが192 kbpsである場合に、マルチ・チャネル信号が7.1チャネルの信号であるならば、即ち、8個のチャネルが含まれる場合、固定された数量は60であってもよく、具体的には、60ビットがLFEチャネルに割り当てられる。
【0097】
[0100] ステップ102:K個のチャネル・ペアのそれぞれのビット数を、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定する。
【0098】
[0101] P個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は:時間ドメインにおける1つのチャネルのオーディオ信号のエネルギー/振幅、時間-周波数変換後の1つのチャネルのオーディオ信号のエネルギー/振幅、時間-周波数変換及びホワイトニング後の1つのチャネルのオーディオ信号のエネルギー/振幅、エネルギー/振幅等化後の1つのチャネルのオーディオ信号のエネルギー/振幅、又は、ステレオ処理後の1つのチャネルのオーディオ信号のエネルギー/振幅のうちの少なくとも1つを含む。時間ドメインにおけるエネルギー/振幅、時間-周波数変換後のエネルギー/振幅、時間-周波数変換及びホワイトニング後のエネルギー/振幅は、エネルギー/振幅等化前のエネルギー/振幅である。換言すれば、ビット割当プロセスでは、前述のエネルギー/振幅のうちの任意の1つ以上が、ビット割り当てのために選択される可能性がある。
【0099】
[0102] P個のチャネルがLFEチャネルを含まない場合、利用可能なビット数は固定ビット数を含まない。
【0100】
[0103] 時間-周波数変換及びホワイトニング後の1つのチャネルのオーディオ信号のエネルギー/振幅は、時間-周波数変換及びホワイトニング処理が、その1つのチャネルのオーディオ信号に対して実行された後に得られるエネルギー/振幅であり、ホワイトニング処理は、以後の符号化を促進するために、その1つのチャネルのオーディオ信号の周波数ドメイン係数を、より平坦にするために実行される。
【0101】
[0104] 1ビット割り当てが、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて実行される。この場合における1ビット割り当ては、チャネル・ペアに対するビット割り当てである。具体的には、対応するビット数が異なるチャネル・ペアに割り当てられる。
【0102】
[0105] P=2Kの場合、K個のチャネル・ペアのそれぞれのビット数は、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定される。ビット数は、当初に割り当てられたビット数と呼ばれてもよい。チャネル・ペアは、基本ユニットとして使用されてもよい。1ビット割り当ては、全ての基本ユニット(K個の基本ユニット)内の基本ユニットのエネルギー/振幅の比率に基づいて、基本ユニットに対して実行される。任意の基本ユニットのエネルギー/振幅が、基本ユニット内の2つのチャネルのオーディオ信号のエネルギー/振幅に基づいて決定されることが可能である。例えば、基本ユニットのエネルギー/振幅は、基本ユニット内の2つのチャネルのオーディオ信号のエネルギー/振幅の合計であってもよい。各々の基本ユニットのビット数を得るために、1ビット割り当てによって、異なる基本ユニット間でビットが割り当てられてもよい。ビット数は、当初に割り当てられるビット数と呼ばれてもよい。
【0103】
[0106] P=2×K+Qである場合、K個のチャネル・ペアのそれぞれのビット数とQ個のチャネルのそれぞれのビット数とは、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定される。チャネル・ペアが基本ユニットとして使用されてもよく、また、カップリングされていないモノラル・チャネルが基本ユニットとして使用してもよい。1ビット割り当ては、全ての基本ユニット(K+Q個の基本ユニット)のエネルギー/振幅における基本ユニットのエネルギー/振幅の割合に基づいて、基本ユニットに対して実行される。カップリングされたチャネルに対応する基本ユニットに関し、基本ユニットのエネルギー/振幅は、基本ユニット内の2つのチャネルのオーディオ信号のエネルギー/振幅に基づいて決定されてもよい。カップリングされていないチャネルに対応する基本ユニットに関し、基本ユニットのエネルギー/振幅は、単一チャネルのオーディオ信号のエネルギー/振幅に基づいて決定されてもよい。各々の基本ユニットのビット数を得るために、1ビット割り当てによって、基本ユニット(K+Q個の基本ユニット)の間でビットが割り当てられてもよい。言い換えると、K個のチャネル・ペアのそれぞれのビット数とQ個のチャネルのそれぞれのビット数である。Q個のチャネルのうちの1つは、モノ・チャネルであってもよいし、或いは、ダウンミキシング処理によって得られるチャネル、即ち、ダウンミックスされたチャネルであってもよい。
【0104】
[0107] P=2Kであるか、又はP=2×K+Qであるかによらず、ある実装ではK個のチャネル・ペアのそれぞれのビット数は、利用可能なビット数と以下の内の任意の1つとに基づいて決定されてもよい:時間ドメインにおけるK個のチャネル・ペアのそれぞれのエネルギー/振幅、時間-周波数変換後のK個のチャネル・ペアのそれぞれのエネルギー/振幅、又は、時間-周波数変換及びホワイトニング後のK個のチャネル・ペアのそれぞれのエネルギー/振幅。この実装では、エネルギー/振幅等化は、ビット割り当て前のK個のチャネル・ペアのオーディオ信号に対して実行され、符号化効率及び符号化効果を改善することが可能である。K個のチャネル・ペアのオーディオ信号に対してエネルギー/振幅等化を実行する方法は、複数のチャネル・ペアのオーディオ信号に対して、又は、複数のチャネル・ペア及び1つ以上のカップリングされていないチャネルの全てのオーディオ信号に対して、エネルギー/振幅等化を実行するものであってもよい。この実装では、K個のチャネル・ペアのオーディオ信号に対してエネルギー/振幅等化を実行する方法は、代替的に、単一のチャネル・ペア内の2つのチャネルのオーディオ信号に対してエネルギー/振幅等化を実行するものであってもよい。
【0105】
[0108] 別の実装では、K個のチャネル・ペアのそれぞれのビット数は、利用可能なビット数と、以下のうちの任意の1つとに基づいて決定されることが可能である:エネルギー/振幅等化後のK個のチャネル・ペアのオーディオ信号のそれぞれのエネルギー/振幅、又はステレオ処理後のK個のチャネル・ペアのオーディオ信号のそれぞれのエネルギー/振幅。この実装では、エネルギー/振幅等化は、ビット割り当て前のK個のチャネル・ペアのオーディオ信号に対して実行され、符号化効率及び符号化効果を改善することが可能である。K個のチャネル・ペアのオーディオ信号に対してエネルギー/振幅等化を実行する方法は、単一のチャネル・ペアにおける2つのチャネルのオーディオ信号に対してエネルギー/振幅等化を実行するものであってもよい。エネルギー/振幅等化後のK個のチャネル・ペアのオーディオ信号のそれぞれのエネルギー/振幅、又はステレオ処理後のK個のチャネル・ペアのオーディオ信号のそれぞれのエネルギー/振幅は、単一のチャネル・ペアにおける2つのチャネルのオーディオ信号に対してエネルギー/振幅等化が実行された後に全て取得される。
【0106】
[0109] K個のチャネル・ペアのそれぞれのビット数の決定と同様に、P=2×K+Qである場合、ある実装では、Q個のチャネルのそれぞれのビット数は、利用可能なビット数と、以下のうちの任意の1つとに基づいて決定されることが可能である:時間ドメインにおけるQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換後のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、又は、時間-周波数変換及びホワイトニング後のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅。別の実装では、Q個のチャネルのそれぞれのビット数は、利用可能なビット数と、以下のうちの任意の1つとに基づいて決定されることが可能である:エネルギー/振幅等化後のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、又は、ステレオ処理後のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅。エネルギー/振幅等化後のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、又は、ステレオ処理後のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅は、エネルギー/振幅等化又はステレオ処理前のエネルギー/振幅に等しい。
【0107】
[0110] 一部の実施形態では、単一チャネルの符号化品質は、チャネルに割り当てられたビット数が閾値よりも大きい場合には改善されない。従って、閾値が事前に設定されることが可能である。この場合、単一チャネルのエネルギー/振幅値が高いかどうかにかかわらず、単一チャネルに割り当てられたビット数は閾値を超えないように、閾値は、チャネル上でビット割り当てを実行するプロセスにおいて考慮される。このようにして、より多くのビットが他のチャネルに割り当てられ、他のチャネルの符号化品質を改善することを、単一チャネルの符号化品質を劣化させることなく行い、且つ、信号全体の符号化品質を改善することができる。
【0108】
[0111] 相応に、一部の実施形態では、K個のチャネル・ペアのそれぞれのビット数を決定することは、以下のステップ:
P個のチャネル内のM番目のチャネルを決定するステップであって、M番目のチャネルの当初に割り当てられたビット数は閾値より大きく、Mは0以上P未満である、ステップ;
M番目のチャネルの冗長ビット数を求めるステップであって、ここで、
M番目のチャネルの冗長ビット数 = M番目チャネルの当初に割り当てられたビット数 - 閾値
である、ステップ;及び
M番目のチャネルが、P個のチャネル内で第1に決定されたチャネルであって該チャネルの当初に割り当てられたビット数は閾値より大きいチャネルである場合、P個のチャネル内でM番目のチャネル以外の(P-1)個のチャネルに冗長ビットを割り当てて、(P-1)個のチャネルの更新されたビット数を求めるステップであって、M番目のチャネルの更新されたビット数は閾値である、ステップ;又は
M番目のオーディオ・チャネルが、第1に決定されてはいないチャネルであって該チャネルの当初に割り当てられたビット数は閾値より大きいチャネルである場合、M番目のチャネルと、当初に割り当てられたビット数が閾値より大きいと決定されたチャネルとを除く、P個のチャネル内のチャネルに、冗長ビットを割り当てて、他のチャネルの更新されたビット数を求めるステップを更に含んでもよい。例えば、当初に割り当てられたビット数が閾値より大きいと決定されたチャネルがN番目のチャネルであった場合、他のチャネルは、M番目のチャネルとN番目のチャネル以外の、P個のチャネル内の(P-2)個のチャネルを含む。LFEチャネルに固定されたビット数が割り当てられる場合、P個のチャネルはLFEチャネルを含まないことに留意すべきである。
【0109】
[0112] 単一チャネルのビット数閾値がfrmBitMaxである場合、frmBitMaxは、次式に従って、単一チャネルの飽和符号化ビット・レート、フレーム長、及び符号化サンプリング・レートに基づいて計算されることが可能である:
frmBitMax=rateMax×frameLen/fs
ここで、rateMaxは単一チャネルの飽和符号化ビット・レートを表し、frameLenはフレーム長を表し、fsは符号化サンプリング・レートを表す。通常、rateMaxは、256000 bps, 240000 bps,224000 bps,192000 bps等であってもよい。rateMaxの値は、エンコーダの符号化効率に基づいて選択されてもよいし、又は、経験的な値に基づいて設定されてもよい。これは本件で限定されない。
【0110】
[0113] 例えば、マルチ・チャネル信号は5.1チャネルの信号である。LチャネルとRチャネルは、M1チャネルとS1チャネルを得るためにカップリング及びダウンミックスされ、LSチャネルとRSチャネルは、M2チャネルとS2チャネルを得るためにカップリング及びダウンミックスされる。Bits(M1)はM1チャネルの当初に割り当てられたビット数を表し、Bits(S1)はS1チャネルの当初に割り当てられたビット数を表し、Bits(M2)はM2チャネルの当初に割り当てられたビット数を表し、Bits(S2)はS2チャネルの当初に割り当てられたビット数を表し、カップリングに関与しないチャネルの当初に割り当てられたビット数は、Bits(C)とBits(LFE)である。LFEチャネルに固定ビット数が割り当てられる場合、
利用可能なビット数=Bits(M1)+Bits(S1)+Bits(M2)+Bits(S2)+Bits(C) であり;或いは、LFEチャネルに可変ビット数が割り当てられる場合、
利用可能なビット数=Bits(M1)+Bits(S1)+Bits(M2)+Bits(S2)+Bits(C)+Bits(LFE) である。
【0111】
[0114] 以下、LFEチャネルに固定ビット数が割り当てられる例を用いて説明を行う。
【0112】
[0115] 利用可能なビット数はtotalBitsとして表現され、閾値はfrmBitMaxとして表現される。allocFlag[5]={0,0,0,0,0} とする。このケースにおいて、5.1チャネルが、M1=0,S1=1,C=2,M2=3,及びS2=4 のように区別されている場合、以下の手順が実行される:
[0116] ステップ1: Bits(i)≦frmBitMax であるならば、ステップ5に向かう。ここで、allocFlag[i]は、Bits(i)=frmBitMax,0≦i<5 である場合には、1に設定されることを更に必要とする。
【0113】
[0117] ステップ2: Bits(i)>frmBitMax であるならば、allocFlag[i]=1 に設定し、diffBits=Bits(ch)-frmBitMax を計算し、次いで、ステップ3ないし5を実行する。
【0114】
[0118] ステップ3: sumBits=ΣBits(j),0≦j<5 を計算する。Bits(j)は、allocFlag[j]=1である場合には、sumBits に累積されない。
【0115】
[0119] ステップ4: allocFlag[j]≠1 を満たすチャネルに、diffBits を割り当てる。詳細は次のとおりである:
Bits(j)=Bits(j)+diffBits×Bits(j)/sumBits
[0120] ステップ5: i=4 である場合には手順は終了し;或いは i<3 であるならば、i++ とし、ステップ1に向かう。
【0116】
[0121] ある実装において、ステップ4が実行された後、以下のステップが更に実行されてもよい:
Bits(j)がfrmBitMax以上であるかどうかを判定し、Bits(j)がfrmBitMax以上である場合、allocFlag[j] を1に設定する。
【0117】
[0122] 以下は、固定ビット数がLFEチャネルに割り当てられる別の例である:
[0123] 利用可能なビット数はtotalBitsとして表現され、閾値はfrmBitMaxとして表現される。allocFlag[6]={0,0,0,0,0,0} とする。このケースにおいて、5.1チャネルが、M1=0,S1=1,C=2,M2=3,S2=4,及びLFE=5 のように区別されている場合、以下の手順が実行される:
[0124] ステップ1: Bits(i)≦frmBitMax であるならば、ステップ5に向かう。ここで、allocFlag[i]は、Bits(i)=frmBitMax,0≦i≦6 である場合には、1に設定されることを更に必要とする。
【0118】
[0125] ステップ2: Bits(i)>frmBitMax であるならば、allocFlag[i]=1 に設定し、diffBits=Bits(ch)-frmBitMax を計算し、次いで、ステップ3ないし5を実行する。
【0119】
[0126] ステップ3: sumBits=ΣBits(j),0≦j<4 を計算する。Bits(j)は、allocFlag[j]=1である場合には、sumBits に累積されない。
【0120】
[0127] ステップ4: allocFlag[j]≠1 を満たすチャネルに、diffBits を割り当てる。詳細は次のとおりである:
Bits(j)=Bits(j)+diffBits×Bits(j)/sumBits
[0128] ステップ5: i=4 である場合には手順は終了し;或いは i<3 であるならば、i++ とし、ステップ1に向かう。
【0121】
[0129] ある実装において、ステップ4が実行された後、以下のステップが更に実行されてもよい:
Bits(j)がfrmBitMax以上であるかどうかを判定し、Bits(j)がfrmBitMax以上である場合、allocFlag[j] を1に設定する。
【0122】
[0130] ステップS103:P個のチャネルのオーディオ信号を、K個のチャネル・ペアのそれぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得する。
【0123】
[0131] ビット数は、当初に割り当てられたビット数であるかもしれないし、或いは更新されたビット数であるかもしれない。
【0124】
[0132] P個のチャネルのオーディオ信号を符号化することは、量子化、エントロピー符号化、及びビットストリーム多重化をP個のチャネルのオーディオ信号に対して行い、符号化されたビットストリームを得ることを含む可能性がある。
【0125】
[0133] P=2K である場合、量子化、エントロピー符号化、及びビットストリーム多重化は、K個のチャネル・ペアのそれぞれのビット数に基づいて、P個のチャネルのオーディオ信号に対して実行され、符号化されたビットストリームを取得する。
【0126】
[0134] P=2×K+Q である場合、量子化、エントロピー符号化、及びビットストリーム多重化が、K個のチャネル・ペアのそれぞれのビット数と、Q個のチャネルのそれぞれのビット数とに基づいて、P個のチャネルのオーディオ信号に対して実行され、符号化されたビットストリームが得られる。
【0127】
[0135] この実施形態では、マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号が取得され、P個のチャネルのオーディオ信号はK個のチャネル・ペアのオーディオ信号を含み;K個のチャネル・ペアのそれぞれのビット数は、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定され;及びP個のチャネルのオーディオ信号は、K個のチャネル・ペアのそれぞれのビット数に基づいて符号化されて、符号化されたビットストリームが取得される。P個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は:時間ドメインにおける1つのチャネルのオーディオ信号のエネルギー/振幅、時間-周波数変換後の1つのチャネルのオーディオ信号のエネルギー/振幅、時間-周波数変換及びホワイトニング後の1つのチャネルのオーディオ信号のエネルギー/振幅、エネルギー/振幅等化後の1つのチャネルのオーディオ信号のエネルギー/振幅、又は、ステレオ処理後の1つのチャネルのオーディオ信号のエネルギー/振幅のうちの少なくとも1つを含む。ビットは、時間ドメインにおけるP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換及びホワイトニング後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、エネルギー/振幅等化後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、又はステレオ処理後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅のうちの少なくとも1つに基づいて、チャネル・ペアに割り当てられて、K個のチャネル・ペアのそれぞれのビット数を決定する。このようにして、マルチ・チャネル信号符号化におけるチャネル・ペアのビット数は適切に割り当てられ、デコーダ側によって再構成されるオーディオ信号の品質を保証する。例えば、チャネル・ペアの間のエネルギー/振幅差が比較的大きい場合、本願のこの実施形態における方法は、より大きなエネルギー/より大きな振幅を有するチャネル・ペアのビットを符号化することでは不十分であるという問題を解決するために使用され、デコーダ側で再構成されるオーディオ信号の品質を保証することができる。
【0128】
[0136] 図3は、本願の実施形態によるマルチ・チャネル・オーディオ信号符号化方法のフローチャートである。本願のこの実施形態は、前述のエンコーダによって実行されてもよい。図3に示されるように、この実施形態における方法は、以下のステップを含んでもよい。
【0129】
[0137] ステップS201:マルチ・チャネル・オーディオ信号のカレント・フレーム内のP個のチャネルのオーディオ信号を取得する。ここで、Pは1より大きい正の整数であり、P個のチャネルのオーディオ信号はK個のチャネル・ペアのオーディオ信号を含む。
【0130】
[0138] ステップ201の具体的な説明については、図2に示されている実施形態のステップ101を参照されたい。詳細は、ここで再び説明しない。
【0131】
[0139] ステップ202:K個のチャネル・ペアのそれぞれのビット数を、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定する。
【0132】
[0140] 1ビット割り当てが、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて実行される。
【0133】
[0141] P=2×K である場合、本件のこの実施形態における方法に従って、K個のチャネル・ペアのそれぞれのビット数は、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定されることが可能である。
【0134】
[0142] P=2×K+Q である場合、1ビット割り当てプロセスにおいて、本件のこの実施形態における方法に従って、K個のチャネル・ペアのそれぞれのビット数とQ個のチャネルのそれぞれのビット数とは、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定されることが可能である。
【0135】
[0143] P=2Kである場合、又はP=2×K+Qである場合にかかわらず、K個のチャネル・ペアのそれぞれのビット数及びQ個のチャネルのそれぞれのビット数をステップ202において決定するための説明については、図1に示される実施形態のステップ102を参照されたい。詳細はここでは再び説明しない。
【0136】
[0144] ステップ203:K個のチャネル・ペアのうちのカレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、カレント・チャネル・ペアのビット数と、ステレオ処理後のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅とに基づいて決定する。
【0137】
[0145] K個のチャネル・ペアにおけるカレント・チャネル・ペアを一例として使用する。K個のチャネル・ペアのうちのカレント・チャネル・ペアのビット数と、ステレオ処理後のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅とに基づいて、カレント・チャネル・ペアに対して2ビット割り当てが実行される。2ビット割り当ては、カレント・チャネル・ペアの2つのチャネルのビット数を割り当てることである。即ち、基本ユニット内のビットが、基本ユニット内の2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅比に基づいて、カップリングされたチャネルに対応する基本ユニットに割り当てられる。カレント・チャネル・ペアは、K個のチャネル・ペアのうちの任意の1つである可能性がある。本件における2ビット割り当ては、チャネル・ペア内の2つのチャネルに対するビット割り当てであり、即ち、チャネル・ペア内の2つのチャネルに対応するビット数を割り当てるものである。
【0138】
[0146] P=2K である場合又はP=2×K+Q である場合にかかわらず、前述のステップ203の方法で、ビットがチャネル・ペアに割り当てられ、チャネル・ペア内の2つのチャネルのそれぞれのビット数を取得することができる。
【0139】
[0147] ステップ204:カレント・チャネル・ペアのうちの2つのチャネルのオーディオ信号を、2つのチャネルのそれぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得する。
【0140】
[0148] カレント・チャネル・ペア内の2つのチャネルのオーディオ信号を符号化することは:量子化、エントロピー符号化、及びビットストリーム多重化を、カレント・チャネル・ペア内の2つのチャネルのオーディオ信号に対して別々に実行して、符号化されたビットストリームを取得することを含む可能性がある。
【0141】
[0149] P=2K である場合、量子化、エントロピー符号化、及びビットストリーム多重化は、K個のチャネル・ペアのそれぞれのビット数に基づいて、P個のチャネルのオーディオ信号に対して別々に実行され、符号化ビットストリームを得る。
【0142】
[0150] P=2×K+Q である場合、量子化、エントロピー符号化、及びビットストリーム多重化は、K個のチャネル・ペアのそれぞれのビット数に基づいて、K個のチャネル・ペアのオーディオ信号に対して別々に実行され、量子化、エントロピー符号化、及びビットストリーム多重化は、Q個のチャネルのそれぞれのビット数に基づいて、Q個のチャネルのオーディオ信号に対して別々に実行され、符号化されたビットストリームを得る。
【0143】
[0151] この実施形態では、マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号が取得され、P個のチャネルのオーディオ信号はK個のチャネル・ペアのオーディオ信号を含み;K個のチャネル・ペアのそれぞれのビット数は、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定され;K個のチャネル・ペア内のカレント・チャネル・ペアの2つのチャネルのそれぞれのビット数は、K個のチャネル・ペアのそれぞれのビット数、カレント・チャネル・ペアのビット数、及びステレオ処理後のカレント・チャネル・ペア内の2つのチャネルのオーディオ信号のそれぞれのエネル/振幅に基づいて決定され;及び2つのチャネルのオーディオ信号は、カレント・チャネル・ペア内の2つのチャネルのそれぞれのビット数に基づいて別々に符号化されて、符号化されたビットストリームが得られる。ビットは、時間ドメインにおけるP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換及びホワイトニング後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、エネルギー/振幅等化後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、又はステレオ処理後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅のうちの少なくとも1つに基づいて、チャネル・ペアに割り当てられて、K個のチャネル・ペアのそれぞれのビット数を決定する。次いで、チャネル・ペア内のビットは、K個のチャネル・ペアのそれぞれのビット数に基づいて割り当てられる。このようにして、マルチ・チャネル信号符号化におけるチャネルのビット数は適切に割り当てられ、デコーダ側によって再構成されるオーディオ信号の品質を保証する。例えば、チャネル・ペアの間のエネルギー/振幅差が比較的大きい場合、本願のこの実施形態における方法は、より大きなエネルギー/より大きな振幅を有するチャネル・ペアの信号のビットを符号化することでは不十分であるという問題を解決するために使用され、デコーダ側で再構成されるオーディオ信号の品質を保証することができる。
【0144】
[0152] 図4は、本願の実施形態によるチャネル・ペアのビット割当方法のフローチャートである。本願のこの実施形態は、前述のエンコーダによって実行されてもよい。この実施形態は、図2に示される実施形態におけるステップ102の具体的な実装である。図4に示されるように、この実施形態における方法は、以下のステップを含んでもよい。
【0145】
[0153] ステップ1021:カレント・フレームのエネルギー/振幅合計を、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて決定する。
【0146】
[0154] 例えば、P個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は:時間ドメインにおけるP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換及びホワイトニング後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、エネルギー/振幅等化後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、又はステレオ処理後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅のうちの少なくとも1つを含む。
【0147】
[0155] 異なるエネルギー/振幅タイプに対するカレント・フレームのエネルギー/振幅合計を決定する方法を説明する。
【0148】
[0156] 方法1:カレント・フレームのエネルギー/振幅合計を、ステレオ処理後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて決定する。カレント・フレームのエネルギー/振幅合計は、ステレオ処理後のエネルギー/振幅合計 sum_Epos であってもよい。
【0149】
[0157] 例えば、ステレオ処理後のエネルギー/振幅合計 sum_Epos は、以下の数式(1)及び数式(2)に従って決定されてもよい:
【0150】
【数7】

ここで、chはチャネル・インデックスを表し、Epost(ch)は、ステレオ処理後の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表し、sampleCoefpost(ch,i)は、ステレオ処理後のチャネル(ch)のカレント・フレームのi番目の係数を表し、Nは、カレント・フレームの係数の数を表し、Nは1より大きい正の整数である。チャネル・インデックスchを有するチャネルは、上記のP個のチャネルのうちの任意の何れであってもよい。
【0151】
[0158] 即ち、カレント・フレームのエネルギー/振幅合計は、前述の方法1で決定することが可能であり、次いで、以後のステップ1022及びステップ1023を実行することによって、前述の1ビット割り当てが完了する。
【0152】
[0159] 方法2:カレント・フレームのエネルギー/振幅合計を、エネルギー/振幅等化前のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて決定する。エネルギー/振幅合計は、エネルギー/振幅等化前のエネルギー/振幅合計 sum_Epre であってもよい。
【0153】
[0160] 例えば、エネルギー/振幅等化前のエネルギー/振幅合計 sum_Epre は、以下の数式(3)及び数式(4)に従って決定されてもよい:
【0154】
【数8】

ここで、Epre(ch)は、エネルギー/振幅等化前の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表し、sampleCoefpost(ch,i)は、エネルギー/振幅等化前のチャネルchのカレント・フレームのi番目の係数を表し、Nはカレント・フレームの係数の数を表し、Nは1より大きい正の整数である。
【0155】
[0161] 即ち、カレント・フレームのエネルギー/振幅合計は、前述の方法2で決定することが可能であり、次いで、以後のステップ1022及びステップ1023を実行することによって、前述の1ビット割り当てが完了する。
【0156】
[0162] 方法3:カレント・フレームのエネルギー/振幅合計を、エネルギー/振幅等化前の、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅とP個のチャネルのそれぞれの重み係数とに基づいて決定する。P個のチャネルのうちの任意の1つの重み係数は1以下である。エネルギー/振幅合計は、エネルギー/振幅等化前のエネルギー/振幅合計 sum_Epre であってもよい。
【0157】
[0163] 例えば、エネルギー/振幅等化前のエネルギー/振幅合計 sum_Epre は、以下の数式(5)に従って決定されてもよい:
【0158】
【数9】

ここで、α(ch)はチャネル・インデックスchを有するチャネルの重み係数を表し、1つのチャネル・ペアにおける2つのチャネルの重み係数は同一であり、1つのチャネル・ペアにおける2つのチャネルの重み係数の値は、1つのチャネル・ペアにおける2つのチャネル間の正規化された相関値に逆比例する。
【0159】
[0164] 実装において、チャネル・インデックスchを有するチャネルが、カップリングに関わっていない場合、α(ch)は1である。チャネル・インデックスchを有するチャネルがカップリングに関わっている場合に、チャネル・インデックスch1を有するチャネル(以下、略称してch1とする)、チャネル・インデックスch2を有するチャネル(以下、略称してch2とする)、チャネル・インデックスch3を有するチャネル(以下、略称してch3とする)、及びチャネル・インデックスch4を有するチャネル(以下、略称してch4とする)を一例として使用し、ここで、ch1とch2はカップリングしており、ch3とch4はカップリングしている。この場合、α(ch1)とα(ch2)は等しく且つ両方とも1未満であり、α(ch3)とα(ch4)は等しく且つ両方とも1未満である。α(ch1)及びα(ch2)は、ch1及びch2の正規化された相関値Corr_norm(ch1,ch2)に基づいて決定されてもよい。α(ch3)及びα(ch4)は、正規化された相関値Corr_norm(ch3,ch4)に基づいて決定されてもよい。より大きな正規化された相関値Corr_norm(ch3,ch4)を有するα(ch3)及びα(ch4)の値は、より小さな正規化された相関値Corr_norm(ch1,ch2)を有するα(ch1)及びα(ch2)の値より小さい。換言すれば、α(ch1)及びα(ch2)は、ch1及びch2の正規化された相関値Corr_norm(ch1,ch2)に反比例する。
【0160】
[0165] 例えば、ch1とch2がカップリングしている場合、α(ch1)とα(ch2)は、次式(6)に従って計算されてもよい:
【0161】
【数10】

ここで、Cは定数、C∈[0,1]であり、thresholdはch1とch2の正規化されたカップリング閾値を表し、threshold∈[0,1]であり、Corr_norm(ch1,ch2)はch1とch2の正規化された相関値を表し、coeff(ch1,ch2)∈[0,1]である。一部の実施形態において、Cは0.707であってもよく、thresholdは0.2,0.25,0.28等であってもよい。
【0162】
[0166] 2つのチャネルの相関値は、次式(7)に従って計算されてもよい。ch1とch2を一例として使用している。
【0163】
【数11】

ここで、Corr_norm(ch1,ch2)はch1とch2の正規化された相関値を表し、spec_ch1(i)はch1の時間ドメイン又は周波数ドメインの係数を表し、spec_ch2(i)はch2の時間ドメイン又は周波数ドメインの係数を表し、Nはカレント・フレームの数の数量を表す。
【0164】
[0167] 例えば、LチャネルとRチャネルは第1のチャネル・ペアであり、LチャネルとRチャネルの正規化された相関値はcorr_norm(L,R)であり、LSチャネルとRSチャネルは第2のチャネル・ペア、LSチャネルとRSチャネルの正規化された相関値はcorr_norm(LS,RS)である。
【0165】
[0168] 他のチャネル・ペアの2つのチャネルの相関値も、数式(7)に従って計算することが可能であり、チャネル・ペアのチャネルの重み係数は、数式(6)に従って計算されてもよい。
【0166】
[0169] ステレオ処理は、ステレオ処理に関与する2つのチャネルのエネルギー/振幅合計を減少させ;2つのチャネルのエネルギー/振幅合計の減少値は、2つのチャネルのオーディオ信号間の類似性に関係しており、即ち、2つのチャネルのオーディオ信号の間のより高い相関は、ステレオ処理後の2つのチャネルのエネルギー/振幅合計のより大きな減少値を示す。
【0167】
[0170] 従って、ステレオ処理前のエネルギー/振幅が1ビット割り当てで使用される場合、重み係数は1ビット割り当ての際に加算される。大きく相関する2つのチャネルの重み係数は、小さく相関する2つのチャネルの重み係数よりも小さい。カップリングされていないチャネルの重み係数は、カップリングされているチャネルの重み係数よりも大きい。同じペアの2つのチャネルの重み係数は同じである。具体的には、エネルギー/振幅合計は、前述の方法3で決定することが可能であり、次いで、以後のステップ1022及びステップ1023を実行することによって、前述の1ビット割り当てが完了する。
【0168】
[0171] ステップ1022:K個のチャネル・ペアのそれぞれのビット係数を、K個のチャネル・ペアのオーディオ信号のそれぞれのエネルギー/振幅とカレント・フレームのエネルギー/振幅合計とに基づいて決定する。
【0169】
[0172] エネルギー/振幅合計が前述の方法1、方法2、又は方法3で決定された後、P=2K である場合、K個のチャネル・ペアのそれぞれのビット係数は、K個のチャネル・ペアのオーディオ信号のそれぞれのエネルギー/振幅と前述のステップ1021で決定されたエネルギー/振幅合計とに基づいて決定されてもよい。
【0170】
[0173] エネルギー/振幅合計が前述の方法1、方法2、又は方法3で決定された後、P=2K+Q である場合、K個のチャネル・ペアのそれぞれのビット係数は、K個のチャネル・ペアのオーディオ信号のそれぞれのエネルギー/振幅と前述のステップ1021で決定されたエネルギー/振幅合計とに基づいて決定されてもよく、Q個のチャネルのそれぞれのビット係数は、Q個のチャネルのそれぞれのエネルギー/振幅と、ステップ1021で決定されたエネルギー/振幅合計とに基づいて決定されてもよい。
【0171】
[0174] K個のチャネル・ペアのそれぞれのビット係数は、前述のステップ1021で決定されたエネルギー/振幅合計におけるK個のチャネル・ペアのそれぞれのエネルギー/振幅の比率であってもよい。チャネル・ペアのエネルギー/振幅は、チャネル・ペア内の2つのチャネルのエネルギー/振幅の合計であってもよい。Q個のカップリングされていないチャネルのそれぞれのビット係数は、前述のステップ1021で決定されたエネルギー/振幅合計におけるQ個のチャネルのそれぞれのエネルギー/振幅の比率である。
【0172】
[0175] ステップ1023:K個のチャネル・ペアのそれぞれのビット数を、K個のチャネル・ペアのそれぞれのビット係数と利用可能なビット数とに基づいて決定する。
【0173】
[0176] P=2K である場合、K個のチャネル・ペアのそれぞれのビット数は、K個のチャネル・ペアのそれぞれのビット係数と利用可能なビット数とに基づいて決定されてもよい。
【0174】
[0177] P=2×K+Q である場合、K個のチャネル・ペアのそれぞれのビット数は、K個のチャネル・ペアのそれぞれのビット係数と利用可能なビット数とに基づいて決定されてもよく、Q個のチャネルのそれぞれのビット数は、Q個のチャネルのそれぞれのビット係数と利用可能なビット数とに基づいて決定されてもよい。
【0175】
[0178] この実施形態では、マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号が取得され、P個のチャネルのオーディオ信号はK個のチャネル・ペアのオーディオ信号を含む。カレント・フレームのエネルギー/振幅合計は、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて決定される。K個のチャネル・ペアのそれぞれのビット係数は、K個のチャネル・ペアのオーディオ信号のそれぞれのエネルギー/振幅とカレント・フレームのエネルギー/振幅とに基づいて決定される。K個のチャネル・ペアのそれぞれのビット数は、K個のチャネル・ペアのそれぞれのビット係数と利用可能なビット数とに基づいて決定される。P個のチャネルのオーディオ信号は、K個のチャネル・ペアのそれぞれのビット数に基づいて符号化され、符号化されたビットストリームを得る。カレント・フレームのエネルギー/振幅合計は、時間ドメインにおけるP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、時間-周波数変換及びホワイトニング後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、エネルギー/振幅等化後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅、又はステレオ処理後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅のうちの少なくとも1つに基づいて決定される。K個のチャネル・ペアのそれぞれのビット数を決定するために、エネルギー/振幅合計におけるチャネル・ペアのオーディオ信号のそれぞれのエネルギー/振幅の比率に基づいて、ビットがチャネル・ペアに割り当てられる。このようにして、マルチ・チャネル信号符号化におけるチャネル・ペアのビット数は適切に割り当てられ、デコーダ側によって再構成されるオーディオ信号の品質を保証する。例えば、チャネル・ペアの間のエネルギー/振幅差が比較的大きい場合、本願のこの実施形態における方法は、より大きなエネルギー/より大きな振幅を有するチャネル・ペアのビットを符号化することでは不十分であるという問題を解決するために使用され、デコーダ側で再構成されるオーディオ信号の品質を保証することができる。
【0176】
[0179] 以下の実施形態では、5.1チャネルの信号を例として用いて、本願の実施形態におけるマルチ・チャネル・オーディオ信号符号化方法の一例を説明する。
【0177】
[0180] 図5は、本願の実施形態によるエンコーダ側の処理手順の概略図である。図5に示されるように、エンコーダ側は、マルチ・チャネル符号化処理ユニット401と、チャネル符号化ユニット402と、ビットストリーム多重化インターフェース403とを含む可能性がある。エンコーダ側は、前述のエンコーダであってもよい。
【0178】
[0181] マルチ・チャネル符号化処理ユニット401は、マルチ・チャネル信号スクリーニング、カップリング、ステレオ処理、及びマルチ・チャネル・サイド情報生成を、入力信号に対して実行するように構成される。この実施形態では、入力信号は5.1チャネルの信号である(具体的には、Lチャネル、Rチャネル、Cチャネル、LFEチャネル、LSチャネル、及びRSチャネルである)。
【0179】
[0182] 例えば、マルチ・チャネル符号化処理ユニット401は、Lチャネル信号とRチャネル信号とを結合して第1のチャネル・ペアを形成し、第1のチャネル・ペアに対してステレオ処理を実行して、ミドル・チャネルM1チャネル信号とサイド・チャネルS1チャネル信号を取得し、LSチャネル信号とRSチャネル信号とを結合して第2のチャネル・ペアを形成し、第2のチャネル・ペアに対してステレオ処理を実行して、ミドル・チャネルM2チャネル信号とサイド・チャネルS2チャネル信号を取得する。
【0180】
[0183] 複数のチャネルの間の比較的大きなエネルギー/振幅差に起因して、ステレオ処理が実行される前に、エネルギー/振幅等化が複数のチャネルに対して実行され、ステレオ処理利得を増加させ、即ち、エネルギー/振幅をミドル・チャネルに集中させ、チャネル符号化ユニットが符号化効率を改善することを支援する。本願のこの実施形態では、チャネル間のエネルギー/振幅トレードオフを得るために、カップリングされたチャネルに対して等化が実行される。エネルギー/振幅等化前の入力チャネルのカレント・フレームのエネルギー/振幅は、energy_L,energy_R,energy_C,energy_LS,及びenergy_RSであると仮定する。energy_Lはエネルギー/振幅等化前のLチャネル信号のエネルギー/振幅を表し、energy_R はエネルギー/振幅等化前のRチャネル信号のエネルギー/振幅を表し、energy_C はエネルギー/振幅等化前のCチャネル信号のエネルギー/振幅を表し、energy_LSはエネルギー/振幅等化前のLSチャネル信号のエネルギー/振幅を表し、energy_RSはエネルギー/振幅等化前のRSチャネル信号のエネルギー/振幅を表す。
【0181】
[0184] エネルギー/振幅等化後の第1のチャネル・ペアにおけるLチャネル及びRチャネル各々のエネルギー/振幅は、energy_avg_LRであり、energy_avg_LRは次式(8)に従って計算されてもよい:
energy_avg_LR=avg(energy_L,energy_R) (8)

[0185] エネルギー/振幅等化後の第2のチャネル・ペアにおけるLSチャネル及びRSチャネル各々のエネルギー/振幅は、energy_avg_LSRSであり、energy_avg_LSRSは次式(9)に従って計算されてもよい:
energy_avg_LSRS=avg(energy_LS,energy_RS) (9)

ここで、avg(a1,a2)関数は、2つの入力パラメータa1とa2の平均化を実行する。a1はenergy_Lに設定され、a2はenergy_Rに設定されてもよい。a1はenergy_LSに設定され、a2はenergy_RSに設定されてもよい。
【0182】
[0186] (energy_L,energy_R,energy_C,energy_LS,及びenergy_RSを含む)エネルギー/振幅等化前のチャネルのエネルギー/振幅エネルギー(ch)を計算するための計算式は、以下のとおりである:
【0183】
【数12】

ここで、sampleCoef(ch,i)はチャネル・インデックスchを有するチャネルのカレント・フレームのi番目の係数を表し;Nはカレント・フレームの係数の数を表し;chの様々な値は、Lチャネル、Rチャネル、Cチャネル、LFEチャネル、LSチャネル、及びRSチャネルに対応する可能性がある。
【0184】
[0187] 本願のこの実施態様において、energy_LはEpre(L)に等しく、energy_RはEpre(R)に等しく、energy_LSはEpre(LS)に等しく、energy_RSはEpre(RS)に等しく、energy_CはEpre(C)に等しい。Epost(L)=Epost(R)=energy_avg_LRである。Epost(LS)=Epost(RS)=energy_avg_LSRSである。
【0185】
[0188] マルチ・チャネル符号化処理ユニット401は、ステレオ処理が実行されるM1チャネル信号、S1チャネル信号、M2チャネル信号、及びS2チャネル信号と、ステレオ処理が実行されないLFEチャネル信号及びCチャネル信号と、マルチ・チャネル・サイド情報とを出力する。
【0186】
[0189] チャネル符号化ユニット402は、ステレオ処理が実行されるM1チャネル信号、S1チャネル信号、M2チャネル信号、及びS2チャネル信号と、ステレオ処理が実行されないLFEチャネル信号及びCチャネル信号と、マルチ・チャネル・サイド情報とを符号化して、符号化されたチャネルE1ないしE6を出力するように構成されている。チャネル符号化ユニット402は、複数の処理ボックスを含んでもよく、処理ボックスは、より小さなエネルギー/振幅を有するチャネルよりも、より大きなエネルギー/振幅を有するチャネルに、より多くのビットを割り当てる。チャネル符号化ユニット402は、量子化及びエントロピー符号化を実行して、エンコーダ側から冗長性を除去し、次いで、符号化されたチャネルE1ないしE6を、ビットストリーム多重化インターフェース403に送る。
【0187】
[0190] ビットストリーム多重化インターフェース403は、6つの符号化されたチャネルE1ないしE6を多重化してシリアル・ビットストリーム(bitStream)を形成し、チャネルにおけるマルチ・チャネル・オーディオ信号の伝送や、デジタル媒体におけるマルチ・チャネル・オーディオ信号の記憶を促進する。
【0188】
[0191] 図6は、本願の実施形態によるチャネル符号化ユニットの処理手順の概略図である。図6に示されるように、チャネル符号化ユニット402は、ビット割当ユニット4021と、量子化及びエントロピー符号化ユニット4023とを含む可能性がある。この実施形態は前述の方法1を一例として使用することにより説明される。
【0189】
[0192] ビット割当ユニット4021は、前述の実施形態における1ビット割り当て及び2ビット割り当てを実行して、チャネルのビット数を取得するように構成されている。
【0190】
[0193] 例えば、ビット割当ユニット4021は、前述の数式(1)及び数式(2)に従って、ステレオ処理後のエネルギー/振幅合計 sum_Epost を決定する。次いで、チャネル・ペアのビット係数と、カップリングされていないチャネルのビット係数とが、以下の数式(11)ないし数式(14)に従って決定される。この実施形態では、第1のチャネル・ペアのビット係数はRatio(L,R)で表現され、第2のチャネル・ペアのビット係数はRatio(LS,RS)で表現され、カップリングされていないCチャネルのビット係数はRatio(C)で表現され、カップリングされていないLFEチャネルのビット係数はRatio(LFE)で表現される:
Ratio(L,R)=(Epost(M1)+Epost(S1))/sum_Epost (11)
Ratio(LS,RS)=(Epost(M2)+Epost(S2))/sum_Epost (12)
Ratio(C)=Epost(C)/sum_Epost (13)
Ratio(LFE)=Epost(LFE)/sum_Epost (14)

[0194] ビット割当ユニットは、Ratio(L,R),Ratio(LS,RS),Ratio(C),Ratio (LFE),利用可能なビット数bAvail,チャネル・ペア・インデックスpairIdx1,pairIdx2,及びステレオ処理後のチャネルのエネルギー/振幅Epost(ch) に基づく計算により、チャネルのビット数を取得する。チャネル・ペア・インデックスpairIdx1,pairIdx2は、マルチ・チャネル符号化処理ユニット401によって出力されてもよい。チャネル・ペア・インデックスpairIdx1は、LチャネルとRチャネルがカップリングしていることを示すために使用され、チャネル・ペア・インデックスpairIdx2は、LSチャネルとRSチャネル・グループがカップリングしていることを示すために使用される。
【0191】
[0195] 例えば、チャネルのビット数は、以下の数式(15)ないし数式(22)に従って決定されてもよい。
【0192】
[0196] チャネル・ペアのビット割り当てについては、以下のとおりである:
Bits(M1,S1)=bAvail×Ratio(L,R) (15)
Bits(M2,S2)=bAvail×Ratio(LS,RS) (16)

ここで、Bits(M1,S1)は第1のチャネル・ペアのビット数を表し、Bits(M2,S2)は第2のチャネル・ペアのビット数を表す。
【0193】
[0197] チャネル・ペア内のチャネル間のビット割り当てと、カップリングに関わらないチャネルのビット割り当てに関し、カップリングしているチャネル間のビット割り当ては以下のように行われる:
Bits(M1)=Bits(M1,S1)×Epost(M1)/(Epost(M1)+Epost(S1)) (17)
Bits(S1)=Bits(M1,S1)×Epost(S1)/(Epost(M1)+Epost(S1)) (18)
Bits(M2)=Bits(M2,S2)×Epost(M2)/(Epost(M2)+Epost(S2)) (19)
Bits(S2)=Bits(M2,S2)×Epost(S2)/(Epost(M2)+Epost(S2)) (20)

ここで、Bits(M1)はM1チャネルのビット数を表し、Bits(S1)はS1チャネルのビット数を表し、Bits(M2)はM2チャネルのビット数を表し、Bits(S2)はS2チャネルのビット数を表す。
【0194】
[0198] カップリングに関与しないチャネルに対するビット割り当ては、以下の通りである:
Bits(C)=bAvail×Ratio(C) (21)
Bits(LFE)=bAvail×Ratio(LFE) (22)

ここで、Bits(C)はCチャネルのビット数を表し、Bits(LFE)はLFEチャネルのビット数を表す。
【0195】
[0199] 量子化及びエントロピー符号化ユニット4023は、ステレオ処理が実行されるM1チャネル信号、S1チャネル信号、M2チャネル信号、及びS2チャネル信号と、Cチャネル信号と、LFEチャネル信号と、マルチ・チャネル・サイド情報とに対して、チャネルのビット数に基づいて量子化及びエントロピー符号化を実行して、符号化されたチャネルE1信号ないし符号化されたチャネルE6信号を取得する。
【0196】
[0200] この実施形態では、エネルギー/振幅等化は、チャネル・ペアを粒度として使用することによって、チャネル・ペアの2つのチャネルに対して実行される。ステレオ処理前のチャネル・ペアの相違するエネルギー/振幅比率に起因して、ステレオ処理後のチャネル・ペアのエネルギー/振幅比率も相違し;そして、チャネル・ペア間のビット割り当ては、ステレオ処理後のチャネル・ペアのエネルギー/振幅比率に基づいて実行され;最終的に、ビットはチャネル・ペア内で割り当てられる。このようにして、マルチ・チャネル信号符号化におけるチャネルのビット数を適切に割り当てて、デコーダ側によって再構成されるオーディオ信号の品質を保証することができる。例えば、チャネル・ペア間のエネルギー/振幅差が比較的大きい場合、本願のこの実施形態の方法は、より大きなエネルギー/より大きな振幅を有するチャネル・ペアの信号のビットを符号化することでは不十分であるという問題を解決するために使用され、デコーダ側によって再構成されるオーディオ信号の品質を保証することができる。
【0197】
[0201] 図5に示される実施形態におけるマルチ・チャネル符号化処理ユニット401のエネルギー/振幅等化の具体的な実装に加えて、本願のこの実施形態は、別のエネルギー/振幅等化方法を更に提供する。5.1チャネルの前述の信号が、更なる説明のための例として使用される。
【0198】
[0202] エネルギー/振幅等化後の各チャネルのエネルギー/振幅は、energy_avgである。energy_avgの値は、次式(23)に従って決定することが可能である:
energy_avg=avg(energy_L,energy_R,energy_C,energy_LS,energy_RS) (23)

ここで、Avg(a1,a2,...,an) 関数は、入力パラメータa1,a2,...,anの平均化を実行する。
【0199】
[0203] 図7は、本願の実施形態によるチャネル符号化ユニットの処理手順の概略図である。図7に示されるように、チャネル符号化ユニット402は、ビット割当ユニット4021と、量子化及びエントロピー符号化ユニット4023と、ビット計算ユニット4022とを含む可能性がある。本実施形態は、上述した方法2を例として使用することにより説明される。
【0200】
[0204] ビット割当ユニット4021は、前述の実施形態における1ビット割り当て及び2ビット割り当てを実行して、チャネルのビット数を得るように構成されている。
【0201】
[0205] 例えば、ビット計算ユニット4022は、前述の数式(3)及び数式(4)に従い、エネルギー/振幅等化前のエネルギー/振幅合計を決定する。次いで、チャネル・ペアのビット係数と、カップリングされていないチャネルのビット係数とが、以下の数式(24)ないし数式(27)に従って決定される。この実施形態では、第1のチャネル・ペアのビット係数はRatio(L, R)で表され、第2のチャネル・ペアのビット係数はRatio(LS, RS)で表され、カップリングされていないCチャネルのビット係数はRatio(C)で表され、カップリングされていないLFEチャネルのビット係数はRatio(LFE)で表される:
Ratio(L,R)=(Epre(L)+Epre(R))/sum_Epre (24)
Ratio(LS,RS)=(Epre(LS)+Epre(RS))/sum_Epre (25)
Ratio(C)=Epre(C)/sum_Epre (26)
Ratio(LFE)=Epre(LFE)/sum_Epre (27)

[0206] ビット割当ユニット4022は、Ratio(L,R),Ratio(LS,RS),Ratio(C),Ratio (LFE),利用可能なビット数bAvail,チャネル・ペア・インデックスpairIdx1,pairIdx2,及びステレオ処理後のチャネルのエネルギー/振幅Epost(ch) に基づく計算により、チャネルのビット数を取得する。チャネル・ペア・インデックスpairIdx1,pairIdx2は、マルチ・チャネル符号化処理ユニット401によって出力されてもよい。チャネル・ペア・インデックスpairIdx1は、LチャネルとRチャネルがカップリングしていることを示すために使用され、チャネル・ペア・インデックスpairIdx2は、LSチャネルとRSチャネル・グループがカップリングしていることを示すために使用される。
【0202】
[0207] 例えば、チャネルのビット数は、前述の数式(24)ないし数式(27)において及び前述の数式(15)ないし数式(22)に従って決定されるビット数に基づいて決定されてもよい。
【0203】
[0208] 量子化及びエントロピー符号化ユニット4023は、ステレオ処理が実行されるM1チャネル信号、S1チャネル信号、M2チャネル信号、及びS2チャネル信号と、Cチャネル信号と、LFEチャネル信号と、マルチ・チャネル・サイド情報とに対して、チャネルのビット数に基づいて量子化及びエントロピー符号化を実行して、符号化されたチャネルE1信号ないし符号化されたチャネルE6信号を取得する。
【0204】
[0209] この実施形態では、エネルギー/振幅等化が全てのチャネルで実行された後に、ステレオ処理が実行される。チャネルのエネルギー/振幅の比率はステレオ処理の後に同様であるが、本願のこの実施形態では、ステレオ処理の後に、チャネル・ペア間のビット割り当てが、ステレオ処理前のチャネル・ペアのエネルギー/振幅の比率に基づいて実行され、次いで、チャネル・ペア内のビットは、ステレオ処理後のエネルギー/振幅に基づいて割り当てられる。チャネル・ペアの間のビット割り当ては、ステレオ処理前のチャネル・ペアのエネルギー/振幅比に基づいてガイドされる。ステレオ処理前のチャネル・ペアの異なるエネルギー/振幅比率に起因して、チャネル・ペア間のビット割り当ては、異なるエネルギー/振幅比率に基づいて実行される。このようにして、マルチ・チャネル信号符号化におけるチャネルのビット数が適切に割り当てられ、デコーダ側によって再構成されるオーディオ信号の品質を保証することができる。例えば、チャネル・ペアの間のエネルギー/振幅差が比較的大きい場合、本願のこの実施形態における方法は、より大きなエネルギー/より大きな振幅を有するチャネル・ペアの信号のビットを符号化することでは不十分であるという問題を解決するために使用され、デコーダ側で再構成されるオーディオ信号の品質を保証することができる。
【0205】
[0210] 一部の実施形態では、チャネル符号化ユニット402は、ビット割当ユニット4021と、量子化及びエントロピー符号化ユニット4023と、ビット計算ユニット4022とを含む可能性があり、また、方法3のステップの機能を実現するように構成されていてもよい。
【0206】
[0211] ビット割当ユニット4021は、前述の実施形態における1ビット割り当て及び2ビット割り当てを実行して、チャネルのビット数を取得するように構成されている。
【0207】
[0212] 例えば、ビット割当ユニット4021は、前述の数式(5)ないし数式(7)を使用することにより、エネルギー/振幅等化前のエネルギー/振幅合計 sum_Epre を決定する。次いで、チャネル・ペアのビット係数と、カップリングされていないチャネルのビット係数とが、以下の数式(28)ないし数式(31)に従って決定される。この実施形態では、第1のチャネル・ペアのビット係数はRatio(L,R)で表現され、第2のチャネル・ペアのビット係数はRatio(LS,RS)で表現され、カップリングされていないCチャネルのビット係数はRatio(C)で表現され、カップリングされていないLFEチャネルのビット係数はRatio(LFE)で表現される:
【0208】
【数13】

ここで、α(L)はLチャネルの重み係数を表し、α(R)はRチャネルの重み係数を表し、α(LS)はLSチャネルの重み係数を表し、α(RS)はRSチャネルの重み係数を表し、α(C)はCチャネルの重み係数を表し、α(LFE)はLFEチャネルの重み係数を表す。
【0209】
[0213] 例えば、チャネルのビット数は、前述の数式(28)ないし数式(31)において及び前述の数式(15)ないし数式(22)に従って決定されるビット数に基づいて決定されてもよい。
【0210】
[0214] 量子化及びエントロピー符号化ユニットは、ステレオ処理が実行されるM1チャネル信号、S1チャネル信号、M2チャネル信号、及びS2チャネル信号と、Cチャネル信号と、LFEチャネル信号と、マルチ・チャネル・サイド情報とに対して、チャネルのビット数に基づいて量子化及びエントロピー符号化を実行して、符号化されたチャネルE1信号ないし符号化されたチャネルE6信号を取得する。
【0211】
[0215] この実施例では、ビット割り当ては重み係数に基づいて調整される。このようにして、マルチ・チャネル信号符号化におけるチャネルのビット数を適切に割り当てることができ、デコーダ側によって再構成されるオーディオ信号の品質を保証する。
【0212】
[0216] 図8は、本願の実施形態によるマルチ・チャネル・オーディオ信号符号化方法のフローチャートである。本願のこの実施形態は、前述のエンコーダによって実行されてもよい。図8に示されるように、この実施形態における方法は、以下のステップを含んでもよい。
【0213】
[0217] ステップ501:マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号を取得する。ここで、Pは1より大きい正の整数であり、P個のチャネルのオーディオ信号はK個のチャネル・ペアのオーディオ信号を含む。
【0214】
[0218] 1つのチャネル・ペア(channel pair)のオーディオ信号は、2つのチャネルのオーディオ信号を含む。
【0215】
[0219] 本願のこの実施形態における1つのチャネル・ペアは、K個のチャネル・ペアのうちの任意の1つである可能性がある。2つのカップリングされた(coupling)チャネルのオーディオ信号は、1つのチャネル・ペアのオーディオ信号である。
【0216】
[0220] 一部の実施態様では、P=2K である。マルチ・チャネル信号スクリーニング、カップリング、ステレオ処理、及びマルチ・チャネル・サイド情報生成の後に、P個のチャネルのオーディオ信号、即ちK個のチャネル・ペアのオーディオ信号が取得されてもよい。
【0217】
[0221] 一部の実施形態では、P個のチャネルのオーディオ信号は、Q個のカップリングされていないチャネルのオーディオ信号を更に含み、ここで、P=2×K+Qであり、Kは正の整数であり、Qは正の整数である。
【0218】
[0222] ステップ501の具体的な説明については、図2に示される実施形態のステップ101を参照されたい。詳細はここで再び説明しない。
【0219】
[0223] ステップ502:カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて、K個のチャネル・ペアのカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号に対してエネルギー/振幅等化を実行して、エネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅を取得する。
【0220】
[0224] 本願のこの実施形態では、エネルギー/振幅等化はチャネル・ペアに対して実行され、即ち、チャネル・ペア内のエネルギー/振幅等化はチャネル・ペアに対して実行される。K個のチャネル・ペアのカレント・チャネル・ペアを一例として使用する。エネルギー/振幅等化は、カレント・チャネル・ペアにおける2つチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて、K個のチャネル・ペア内のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号に対して実行され、エネルギー/振幅等化後にカレント・チャネル・ペアにおける2つのチャネルのそれぞれのエネル/振幅が得られる。
【0221】
[0225] P=2K である場合又はP=2×K+Q である場合にかかわらず、エネルギー/振幅等化が、ステップ502における方法でチャネル・ペア内で実行され、エネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのそれぞれのエネルギー/振幅が得られる。
【0222】
[0226] 例えば、エネルギー/振幅等化後のカレント・チャネル・ペア内の2つのチャネルのエネルギー/振幅は、前述の数式(8)に従って決定されてもよい。具体的には、数式(8)におけるLとRは、カレント・チャネル・ペアにおける2つのチャネルに置き換えられる。
【0223】
[0227] ステップ503:カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、エネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定する。
【0224】
[0228] K個のチャネル・ペア内のカレント・チャネル・ペアを一例として使用する。カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数は、エネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定される。カレント・チャネル・ペアは、K個のチャネル・ペアのうちの任意の1つである可能性がある。
【0225】
[0229] P=2×K である場合、本願のこの実施形態の方法では、カレント・フレームのエネルギー/振幅合計は、エネルギー/振幅等化後のK個のチャネル・ペアの各々における2つのチャネルのオーディオ信号のエネルギー/振幅に基づいて決定されてもよい。カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数は、カレント・フレームのエネルギー/振幅合計と、エネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅と、利用可能なビット数とに基づいて決定される。
【0226】
[0230] 例えば、カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数は、エネルギー/振幅合計におけるエネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の比率と、利用可能なビット数とに基づいて決定される。
【0227】
[0231] P=2×K+Q である場合、本願のこの実施形態の方法では、カレント・フレームのエネルギー/振幅合計は、エネルギー/振幅等化後のK個のチャネル・ペア各々の2つのチャネルのエネルギー/振幅と、エネルギー/振幅等化後のQ個のチャネルのオーディオ信号のエネルギー/振幅とに基づいて決定されることが可能である。カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数は、エネルギー/振幅合計と、カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅と、利用可能なビット数とに基づいて決定される。Q個のチャネルのそれぞれのビット数は、エネルギー/振幅合計と、エネルギー/振幅等化後のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と、利用可能なビット数とに基づいて決定される。
【0228】
[0232] 例えば、カレント・チャネル・ペアにおける2つのチャネルのビット数は、エネルギー/振幅合計におけるカレント・チャネル・ペア内の2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅の比率と、利用可能なビット数とに基づいて決定される。Q個のチャネルのそれぞれのビット数は、エネルギー/振幅合計におけるエネルギー/振幅等化後のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅の比率と、利用可能なビット数とに基づいて決定される。
【0229】
[0233] エネルギー/振幅等化後のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅は、エネルギー/振幅等化前のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅に等しい可能性があり、また、ステレオ処理後のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅にほぼ等しい。エネルギー/振幅等化後のK個のチャネル・ペア各々の2つのチャネルのオーディオ信号のエネルギー/振幅は、ステレオ処理後のK個のチャネル・ペア各々の2つのチャネルのオーディオ信号のエネルギー/振幅にほぼ等しい可能性がある。
【0230】
[0234] 例えば、エネルギー/振幅合計は、前述の数式(1)に従って決定されてもよく、具体的には、数式(1)におけるステレオ処理後のエネルギー/振幅は、この実施形態では、エネルギー/振幅等化後の各チャネルのエネルギー/振幅によって置き換えられる。
【0231】
[0235] ステップ504:カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号を、2つのチャネルのそれぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得する。
【0232】
[0236] カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号を符号化することは、量子化、エントロピー符号化、及びビットストリーム多重化を、カレント・チャネル・ペア内の2つのチャネルのオーディオ信号に対して別々に実行して、符号化されたビットストリームを得ることを含む可能性がある。
【0233】
[0237] P=2K である場合、量子化、エントロピー符号化、及びビットストリーム多重化は、K個のチャネル・ペアのそれぞれのビット数に基づいて、P個のチャネルのオーディオ信号に対して別々に実行されて、符号化ビットストリームを得る。
【0234】
[0238] P=2×K+Q である場合、量子化、エントロピー符号化、及びビットストリーム多重化は、K個のチャネル・ペアのそれぞれのビット数に基づいて、K個のチャネル・ペアのオーディオ信号に対して別々に実行され;また、量子化、エントロピー符号化、及びビットストリーム多重化は、Q個のチャネルのそれぞれのビット数に基づいて、Q個のチャネルのオーディオ信号に対して別々に実行されて、符号化されたビットストリームが得られる。
【0235】
[0239] この実施形態では、マルチ・チャネル・オーディオ信号のカレント・フレーム内のP個のチャネルのオーディオ信号が取得され、P個のチャネルのオーディオ信号はK個のチャネル・ペアのオーディオ信号を含む。カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて、K個のチャネル・ペアのカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号に対してエネルギー/振幅等化が実行されて、エネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのエネルギー/振幅を取得する。カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数は、エネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定される。カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号は、2つのチャネルのそれぞれのビット数に基づいて符号化されて、符号化されたビットストリームを取得する。チャネル・ペアの中でのエネルギー/振幅等化を経て、ビットは、エネルギー/振幅等化後のエネルギー/振幅に基づいて割り当てられる。このようにして、マルチ・チャネル信号符号化におけるチャネルのビット数が適切に割り当てられ、デコーダ側によって再構成されるオーディオ信号の品質を保証することができる。例えば、チャネル・ペアの間のエネルギー/振幅差が比較的大きい場合、本願のこの実施形態における方法は、より大きなエネルギー/より大きな振幅を有するチャネル・ペアの信号のビットを符号化することでは不十分であるという問題を解決するために使用され、デコーダ側で再構成されるオーディオ信号の品質を保証することができる。
【0236】
[0240] 図5及び図6に示される実施形態を、図8に示される実施形態を説明するための例として使用する。
【0237】
[0241] 図5に示される実施形態のマルチ・チャネル符号化処理ユニット401は、図8に示される実施形態におけるステップ501及びステップ502を実行することが可能であり、チャネル符号化ユニット402は、図8に示される実施形態のステップ503を実行することが可能である。図8に示される実施形態において、チャネル符号化ユニット402がステップ503を実行することが可能である場合に、図5及び図6に示される実施形態との相違点は、ビット割当ユニット4021が、以下の方法でチャネルのビット数を決定できる点にある。
【0238】
[0242] 本願のこの実施形態におけるビット割当ユニット4021は、エネルギー/振幅等化後のP個のチャネルのそれぞれのエネルギー/振幅に基づいて、ビット割り当てを実行することができる。具体的には、チャネルのビット数は、以下の数式(32)ないし数式(37)を使用することにより決定されてもよい:
Bits(M1)=bAvail×Epost(M1)/sum_Epost (32)
Bits(S1)=bAvail×Epost(S1)/sum_Epost (33)
Bits(M2)=bAvail×Epost(M2)/sum_Epost (34)
Bits(S2)=bAvail×Epost(S2)/sum_Epost (35)
Bits(C)=bAvail×Epost(C)/sum_Epost (36)
Bits(LFE)=bAvail×Epost(LFE)/sum_Epost (37)

[0243] ビットが数式(32)ないし数式(37)に従って割り当てられる場合、マルチ・チャネル符号化処理ユニット401は、チャネル・ペアのエネルギー/振幅等化方式、即ち、チャネル・ペア内でのエネルギー/振幅等化を使用する必要がある。sum_Epostは、前述の数式(1)に従って決定されてもよい。
【0239】
[0244] エネルギー/振幅等化前のLチャネルとRチャネルのエネルギー/振幅合計は、E(L,R)である。エネルギー/振幅等化の後に、LチャネルとRチャネルのエネルギー/振幅合計は変化せず、依然としてE(L,R)である。ステレオ処理がLチャネルとRチャネルに対して実行された後、ステレオ処理後のLチャネルとRチャネルのエネルギー/振幅合計は、Epost(M1,S1)に変化する。これは、ステレオ処理がLチャネルとRチャネルの間の冗長性を若干減らし、Epost(M1,S1)≒E(L,R)を満足するからである。換言すれば、LチャネルとRチャネルとのエネルギー/振幅合計及びE(L,R)>>(遙かに大きい)LSチャネルとRSチャネルとのエネルギー/振幅合計E(LS,RS)である場合、本願の実施形態におけるマルチ・チャネル符号化処理ユニット401と本願のビット割当ユニット4021とによる処理により、
E(L,R)に基づいて割り当てられるBits(M1)+Bits(S1)は、Bits(M2)+Bits(S2)より遙かに大きくなる可能性がある。このようにして、ビットは、チャネル・ペア間でエネルギー/振幅に基づいて割り当てられる。
【0240】
【数14】

[0245] この実施形態では、チャネル・ペア内でのエネルギー/振幅等化により、ビットは、エネルギー/振幅等化後のエネルギー/振幅に基づいて割り当てられる。このようにして、マルチ・チャネル信号符号化におけるチャネルのビット数が適切に割り当てられ、デコーダ側によって再構成されるオーディオ信号の品質を保証する。例えば、チャネル・ペアの間のエネルギー/振幅差が比較的大きい場合、本願のこの実施形態における方法は、より大きなエネルギー/より大きな振幅を有するチャネル・ペアの信号のビットを符号化することでは不十分であるという問題を解決するために使用され、デコーダ側で再構成されるオーディオ信号の品質を保証することができる。
【0241】
[0246] 前述の方法と同じ発明の概念に基づいて、本願の実施形態は、オーディオ信号符号化装置を更に提供する。オーディオ信号符号化装置は、音声エンコーダで使用されることが可能である。
【0242】
[0247] 図9は、本願の実施形態によるオーディオ信号符号化装置の概略構造図である。図9に示されるように、オーディオ信号符号化装置700は、取得モジュール701と、ビット割当モジュール702と、符号化モジュール703とを含む。
【0243】
[0248] 取得モジュール701は、マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号と、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅とを取得するように構成されており、Pは1より大きい正の整数であり、P個のチャネルのオーディオ信号はK個のチャネル・ペアのオーディオ信号を含み、Kは正の整数である。
【0244】
[0249] ビット割当モジュール702は、K個のチャネル・ペアのそれぞれのビット数を、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定するように構成されている。
【0245】
[0250] 符号化モジュール703は、P個のチャネルのオーディオ信号を、K個のチャネル・ペアのそれぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するように構成されている。
【0246】
[0251] P個のチャネルのうちの1つのチャネルのオーディオ信号のエネルギー/振幅は:時間ドメインにおける1つのチャネルのオーディオ信号のエネルギー/振幅、時間-周波数変換後の1つのチャネルのオーディオ信号のエネルギー/振幅、時間-周波数変換及びホワイトニング後の1つのチャネルのオーディオ信号のエネルギー/振幅、エネルギー/振幅等化後の1つのチャネルのオーディオ信号のエネルギー/振幅、又は、ステレオ処理後の1つのチャネルのオーディオ信号のエネルギー/振幅のうちの少なくとも1つを含む。
【0247】
[0252] 一部の実施形態において、符号化モジュール703は:K個のチャネル・ペア内のカレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、カレント・チャネル・ペアのビット数と、ステレオ処理後のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅とに基づいて決定するステップ;及び2つのチャネルのオーディオ信号を、カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数に基づいて符号化するステップを行うように構成されている。
【0248】
[0253] 一部の実施形態において、ビット割当モジュール702は、カレント・フレームのエネルギー/振幅合計を、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップ;K個のチャネル・ペアのそれぞれのビット係数を、K個のチャネル・ペアのオーディオ信号のそれぞれのエネルギー/振幅とカレント・フレームのエネルギー/振幅合計とに基づいて決定するステップ;及びK個のチャネル・ペアのそれぞれのビット数を、K個のチャネル・ペアのそれぞれのビット係数と利用可能なビット数とに基づいて決定するステップを行うように構成されている。
【0249】
[0254] 一部の実施形態において、ビット割当モジュール702は、カレント・フレームのエネルギー/振幅合計を、ステレオ処理後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するように構成されている。
【0250】
[0255] 一部の実施形態において、ビット割当モジュールは、カレント・フレームのエネルギー/振幅合計sum_Epostを、数式
【0251】
【数15】

に従って計算するように構成されており、ここで、chはチャネル・インデックスを表し、Epost(ch)は、ステレオ処理後の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表し、sampleCoefpost(ch,i)は、ステレオ処理後の(ch)番目のチャネルのカレント・フレームのi番目の係数を表し、Nは、カレント・フレームの係数の数を表し且つ1より大きい正の整数である。
【0252】
[0256] 一部の実施形態において、ビット割当モジュール702は、カレント・フレームのエネルギー/振幅合計を、エネルギー/振幅等化前の、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するように構成されている。
【0253】
[0257] 一部の実施形態において、ビット割当モジュール702は、カレント・フレームのエネルギー/振幅合計sum_Epreを、数式
【0254】
【数16】

に従って計算するように構成されており、ここで、chはチャネル・インデックスを表し、Epre(ch)は、エネルギー/振幅等化前の、チャネル・インデックスchを有するチャネルのオーディオ信号のエネルギー/振幅を表す。
【0255】
[0258] 一部の実施形態において、ビット割当モジュール702は、カレント・フレームのエネルギー/振幅合計を、エネルギー/振幅等化前の、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅とP個のチャネルのそれぞれの重み係数とに基づいて決定するように構成されており、重み係数は1以下である。
【0256】
[0259] 一部の実施形態において、ビット割当モジュール702は、カレント・フレームのエネルギー/振幅合計sum_Epreを、数式
【0257】
【数17】

ここで、α(ch)は(ch)番目のチャネルの重み係数を表し、1つのチャネル・ペアにおける2つのチャネルの重み係数は同一であり、1つのチャネル・ペアにおける2つのチャネルの重み係数の値は、2つのチャネル間の正規化された相関値に逆比例する。
【0258】
[0260] 一部の実施形態において、P個のチャネルのオーディオ信号は、Q個のカップリングされていないチャネルのオーディオ信号を更に含み、ここで、P=2×K+Qであり、Kは正の整数であり、Qは正の整数である。ビット割当モジュール702は、K個のチャネル・ペアのそれぞれのビット数とQ個のチャネルのそれぞれのビット数とを、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定するように構成されている。符号化モジュール703は、K個のチャネル・ペアのオーディオ信号を、K個のチャネル・ペアのそれぞれのビット数に基づいて符号化し、Q個のチャネルのオーディオ信号を、Q個のそれぞれのビット数に基づいて符号化するように構成されている。
【0259】
[0261] 一部の実施形態において、ビット割当モジュール702は、カレント・フレームのエネルギー/振幅合計を、P個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップ;K個のチャネル・ペアのそれぞれのビット係数を、K個のチャネル・ペアのオーディオ信号のそれぞれのエネルギー/振幅とカレント・フレームのエネルギー/振幅合計とに基づいて決定するステップ;Q個のチャネルのそれぞれのビット係数を、Q個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅とカレント・フレームのエネルギー/振幅合計とに基づいて決定するステップ;K個のチャネル・ペアのそれぞれのビット数を、K個のチャネル・ペアの前記それぞれのビット係数と利用可能なビット数とに基づいて決定するステップ;及びQ個のチャネルのそれぞれのビット数を、Q個のチャネルのそれぞれのビット係数と利用可能なビット数とに基づいて決定するステップを行うように構成されている。
【0260】
[0262] 一部の実施形態において、装置は、エネルギー/振幅等化モジュール704を更に含む可能性がある。エネルギー/振幅等化モジュール704は、P個のチャネルのオーディオ信号に基づいて、エネルギー/振幅等化後のP個のチャネルのオーディオ信号を取得するように構成されている。エネルギー/振幅等化後の1つのチャネルのオーディオ信号のエネルギー/振幅は、エネルギー/振幅等化後の1つのチャネルのオーディオ信号を使用することにより取得される。
【0261】
[0263] 符号化モジュール703は、K個のチャネル・ペアのそれぞれのビット数に基づいて、エネルギー/振幅等化後のP個のチャネルのオーディオ信号を符号化するように構成されている。
【0262】
[0264] 取得モジュール701、ビット割当モジュール702、及び符号化モジュール703は、エンコーダ側のオーディオ信号符号化プロセスにおいて使用される可能性があることに留意すべきである。
【0263】
[0265] 取得モジュール701、ビット割当モジュール702、及び符号化モジュール703の具体的な実装プロセスについては、前述の方法の実施形態における詳細な説明を参照されたい、ということに更に留意すべきである。明細書の簡潔性のために、詳細はここで再び説明されない。
【0264】
[0266] 本願の実施形態は別のオーディオ信号符号化装置を更に提供する。オーディオ信号符号化装置は、図9に示される概略構造図を使用する可能性がある。この実施形態におけるオーディオ信号符号化装置は、図8に示される実施形態の方法を実行するように構成されている。
【0265】
[0267] 一部の実施形態において、図9に示す実施形態のモジュールの機能とは異なり、この実施形態では、取得モジュール701は、マルチ・チャネル・オーディオ信号のカレント・フレームにおけるP個のチャネルのオーディオ信号を取得するように構成されており、ここで、Pは1より大きい正の整数であり、P個のチャネルのオーディオ信号はK個のチャネル・ペアのオーディオ信号を含み、Kは正の整数である。
【0266】
[0268] エネルギー/振幅等化モジュール704は、カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて、K個のチャネル・ペアのカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号に対してエネルギー/振幅等化を実行して、エネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅を取得するように構成されている。
【0267】
[0269] ビット割当モジュール702は、カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、エネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅と利用可能なビット数とに基づいて決定するように構成されている。
【0268】
[0270] 符号化モジュール703は、2つのチャネルのオーディオ信号を、カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するように構成されている。
【0269】
[0271] 一部の実施形態において、ビット割当モジュール702は、カレント・フレームのエネルギー/振幅合計を、エネルギー/振幅等化後のP個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅に基づいて決定するステップ;及びカレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、カレント・フレームのエネルギー/振幅合計と、エネルギー/振幅等化後のカレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅と、利用可能なビット数とに基づいて決定するステップを行うように構成されている。
【0270】
[0272] 一部の実施形態において、P個のチャネルのオーディオ信号は、Q個のカップリングされていないチャネルのオーディオ信号を更に含み、ここで、P=2×K+Qであり、Kは正の整数であり、Qは正の整数である。
【0271】
[0273] ビット割当モジュール702は:カレント・フレームのエネルギー/振幅合計を、エネルギー/振幅等化後のK個のチャネル・ペア各々における2つのチャネルのオーディオ信号のエネルギー/振幅と、エネルギー/振幅等化後のQ個のチャネルのオーディオ信号のエネルギー/振幅とに基づいて決定するステップ;カレント・チャネル・ペアにおける2つのチャネルのそれぞれのビット数を、カレント・フレームのエネルギー/振幅合計と、カレント・チャネル・ペアにおける2つのチャネルのオーディオ信号のそれぞれのエネルギー/振幅と、利用可能なビット数とに基づいて決定するステップ;及びQ個のチャネルのそれぞれのビット数を、カレント・フレームのエネルギー/振幅合計と、エネルギー/振幅等化後のQ個のチャネルのオーディオ信号のそれぞれのエネルギー/振幅と、利用可能なビット数とに基づいて決定するステップを行うように構成されている。
【0272】
[0274] 符号化モジュール703は:K個のチャネル・ペアのオーディオ信号を、K個のチャネル・ペアのそれぞれのビット数に基づいて符号化し、Q個のチャネルのオーディオ信号を、Q個のチャネルのそれぞれのビット数に基づいて符号化して、符号化されたビットストリームを取得するステップを行うように構成されている。
【0273】
[0275] 取得モジュール701、ビット割当モジュール702、エネルギー/振幅等化モジュール704、及び符号化モジュール703は、エンコーダ側のオーディオ信号符号化プロセスにおいて使用される可能性があることに留意すべきである。
【0274】
[0276] 取得モジュール701、ビット割当モジュール702、エネルギー/振幅等化モジュール704、及び符号化モジュール703の具体的な実装プロセスについては、図8に示されるの方法の実施形態の詳細な説明を参照されたい、ということに更に留意すべきである。明細書の簡潔性のために、詳細はここで再び説明されない。
【0275】
[0277] 前述の方法と同じ発明の概念に基づいて、本願の実施形態は、オーディオ信号エンコーダを提供する。オーディオ信号エンコーダは、オーディオ信号を符号化するように構成されており、例えば、前述の1つ以上の実施形態で説明されたエンコーダを含む。オーディオ信号符号化装置は、対応するビットストリームを生成するために符号化を実行するように構成されている。
【0276】
[0278] 前述の方法と同じ発明の概念に基づいて、本願の実施形態は、オーディオ信号を符号化するためのデバイス、例えばオーディオ信号符号化デバイスを提供する。図10に示されるように、オーディオ信号符号化デバイス800は:
プロセッサ801と、メモリ802と、通信インターフェース803とを含む(オーディオ信号符号化デバイス800内に1つ以上のプロセッサ801が存在してもよく、1つのプロセッサが図10で一例として使用されている)。本願の一部の実施形態では、プロセッサ801と、メモリ802と、通信インターフェース803とは、バスを介して又は別の方法で接続されていてもよい。図10は、プロセッサ801と、メモリ802と、通信インターフェース803とがバスを介して接続されている例を示す。
【0277】
[0279] メモリ802は、リード・オンリー・メモリとランダム・アクセス・メモリとを含み、命令及びデータをプロセッサ801に提供することが可能である。メモリ802の一部は、不揮発性ランダム・アクセス・メモリ(non-volatile random access memory,NVRAM)を更に含んでいてもよい。メモリ802は、オペレーティング・システム及び処理命令、実行可能モジュール若しくはデータ構造、それらのサブセット、又はそれらの拡張されたセットを記憶する。処理命令は、種々の処理命令を実施するための種々の処理命令を含む可能性がある。オペレーティング・システムは、種々の基本サービスを実装し、ハードウェア・ベースのタスクを処理するために、種々のシステム・プログラムを含む可能性がある。
【0278】
[0280] プロセッサ801は、オーディオ符号化デバイスの動作を制御し、プロセッサ801は中央処理ユニット(central processing unit,CPU)とも呼ばれてもよい。特定のアプリケーションでは、オーディオ符号化デバイスの構成要素は、バス・システムを使用することによって互いに結合される。バス・システムは、データ・バスに加えて、電力バス、制御バス、ステータス信号バスなどを更に含むことが可能である。しかしながら、説明の明確性のために、図中で各種のバスはバス・システムとしてマーキングされている。
【0279】
[0281] 本願の前述の実施形態において開示される方法は、プロセッサ801に適用されてもよいし、又はプロセッサ801によって実施されてもよい。プロセッサ801は、集積回路チップであってもよく、信号処理能力を有する。実施プロセスにおいて、前述の方法におけるステップは、プロセッサ801内のハードウェア集積論理回路によって、又はソフトウェア形式の命令を使用することによって、実施されることが可能である。プロセッサ801は、汎用プロセッサ、デジタル信号プロセッサ(digital signal processing,DSP)、特定用途向け集積回路(application specific integrated circuit,ASIC)、フィールド・プログラマブル・ゲート・アレイ(field-programmable gate array, FPGA)又はその他のプログラマブル論理デバイス、個別ゲート又はトランジスタ論理デバイス、又は個別ハードウェア構成要素であってもよい。プロセッサ801は、本願の実施形態で開示される方法、ステップ、及び論理ブロック図を実装又は実行することが可能である。汎用プロセッサは、マイクロプロセッサであってもよいし、又は任意の従来のプロセッサ等であってもよい。本願の実施形態に関連して開示された方法のステップは、ハードウェア復号化プロセッサによって直接的に実行され及び完了させることが可能であり、或いは、復号化プロセッサ内のハードウェア・モジュール及びソフトウェア・モジュールの組み合わせを使用することにより実行され及び完了させることが可能である。ソフトウェア・モジュールは、ランダム・アクセス・メモリ、フラッシュ・メモリ、リード・オンリー・メモリ、プログラマブル・リード・オンリー・メモリ、電気的に消去可能なプログラマブル・メモリ、レジスタ等のような、当該技術分野で成熟している記憶媒体に配置されてもよい。記憶媒体はメモリ802に配置され、プロセッサ801は、プロセッサ801のハードウェアとの組み合わせにおいて、メモリ802内の情報を読み込み、前述の方法のステップを完了する。
【0280】
[0282] 通信インターフェース803は、デジタル又はキャラクタ情報を受信又は送信するように構成されることが可能であり、例えば、入力/出力インターフェース、ピン、又は回路であってもよい。例えば、前述の符号化ビットストリームは、通信インターフェース803を介して送信される。
【0281】
[0283] 前述の方法と同じ発明の概念に基づいて、本願の実施形態は、互いに結合された不揮発性メモリ及びプロセッサを含むオーディオ符号化デバイスを提供する。プロセッサは、メモリに記憶されたプログラム・コードを呼び出して、前述の1つ以上の実施形態で説明されたマルチ・チャネル・オーディオ信号符号化方法のステップの一部又は全部を実行する。
【0282】
[0284] 前述の方法と同じ発明の概念に基づいて、本願の実施形態は、コンピュータ読み取り可能な記憶媒体を提供する。コンピュータ読み取り可能な記憶媒体は、プログラム・コードを記憶し、プログラム・コードは、前述の1つ以上の実施形態におけるマルチ・チャネル・オーディオ信号符号化方法のステップの一部又は全部を実行するために使用される命令を含む。
【0283】
[0285] 前述の方法と同じ発明概念に基づいて、本願の実施形態は、コンピュータ・プログラム製品を提供する。コンピュータ・プログラム製品がコンピュータにおいて動作すると、コンピュータは、前述の1つ以上の実施形態におけるマルチ・チャネル・オーディオ信号符号化方法のステップの一部又は全部を実行することが可能である。
【0284】
[0286] 前述の実施形態で言及されたプロセッサは、集積回路チップであってもよく、信号処理能力を有する。実装プロセスにおいて、前述の方法の実施形態のステップは、プロセッサ内のハードウェア集積論理回路によって、又はソフトウェア形式で命令を使用することによって、実装されることが可能である。プロセッサは、汎用プロセッサ、デジタル信号プロセッサ(digital signal processor,DSP)、特定用途向け集積回路(application-specific integrated circuit,ASIC)、フィールド・プログラマブル・ゲート・アレイ(field programmable gate array,FPGA)、又は別のプログラマブル論理デバイス、個別ゲート又はトランジスタ論理デバイス、又は個別ハードウェア構成要素であってもよい。汎用プロセッサは、マイクロプロセッサであってもよいし、又は任意の従来のプロセッサ等であってもよい。本願の実施形態で開示される方法のステップは、ハードウェア符号化プロセッサによって直接的に実行及び完了させることが可能であり、或いは、符号化プロセッサ内のハードウェア及びソフトウェア・モジュールの組み合わせによって実行及び完了させることが可能である。ソフトウェア・モジュールは、ランダム・アクセス・メモリ、フラッシュ・メモリ、リード・オンリー・メモリ、プログラマブル・リード・オンリー・メモリ、電気的に消去可能なプログラマブル・メモリ、レジスタ等のような、当該技術分野で成熟した記憶媒体に配置されてもよい。記憶媒体はメモリ内に配置され、プロセッサはメモリ内の情報を読み込み、プロセッサのハードウェアとの組み合わせにおいて前述の方法におけるステップを完了する。
【0285】
[0287] 前述の実施形態におけるメモリは、揮発性メモリ又は不揮発性メモリであってもよいし、或いは、揮発性メモリ及び不揮発性メモリの両方を含んでいてもよい。不揮発性メモリは、リード・オンリー・メモリ(read-only memory,ROM)、プログラマブル・リード・オンリー・メモリ(programmable ROM,PROM)、消去可能プログラマブル・リード・オンリー・メモリ(erasable PROM,EPROM)、電気的に消去可能なプログラマブル・リード・オンリー・メモリ(electrically EPROM,EEPROM)、又はフラッシュ・メモリであってもよい。揮発性メモリは、外部キャッシュとして使用されるランダム・アクセス・メモリ(random access memory,RAM)であってもよい。限定的な説明ではなく、例示として、多くの形態のRAMが利用可能であり、例えば、スタティック・ランダム・アクセス・メモリ(static RAM,SRAM)、ダイナミック・ランダム・アクセス・メモリ(dynamic RAM, DRAM)、同期ダイナミック・ランダム・アクセス・メモリ(synchronous DRAM,SDRAM)、二重データ・レート同期ダイナミック・ランダム・アクセス・メモリ(double data rate SDRAM,DDR SDRAM)、エンハンスト同期ダイナミック・ランダム・アクセス・メモリ(enhanced SDRAM,ESDRAM)、同期リンク・ダイナミック・ランダム・アクセス・メモリ(synchlink DRAM,SLDRAM)、及びダイレクト・ランバス・ランダム・アクセス・メモリ(direct rambus RAM,DR RAM)であってもよい。本明細書に記載されている方法やシステムのメモリは、これらのメモリ及び別の適切なタイプの任意のメモリを、限定することなく包含するように意図されていることに留意すべきである。
【0286】
[0288] 当業者は、本明細書に開示される実施形態で説明される例との組み合わせにおいて、ユニット及びアルゴリズム・ステップは、電子ハードウェア又はコンピュータ・ソフトウェアと電子ハードウェアの組み合わせによって実施されてもよい、ということを認識するであろう。機能がハードウェア又はソフトウェアを使用して実行されるかどうかは、特定のアプリケーション及び技術的解決策の設計制約に依存する。当業者は、特定のアプリケーションの各々について、説明された機能を実現するために様々な方法を使用する可能性があるが、その実現が本願の範囲を超えて行くものであると考えるべきではない。
【0287】
[0289] 説明の簡便性の目的で、前述のシステム、装置、又はユニットの詳細な動作プロセスについては、前述の方法の実施形態における対応するプロセスを参照されたい、ということは当業者によって明確に理解されるであろう。詳細はここで再び説明しない。
【0288】
[0290] 本願で提供される幾つもの実施形態において、開示されるシステム、装置、及び方法は、他の方法で実施されてもよい、ということは理解されるはずである。例えば、説明された装置の実施形態は単なる例である。例えば、ユニットへの分割は、単なる論理的な機能分割であるに過ぎず、実際の実装では他の分割であってもよい。例えば、複数のユニット又は構成要素は、別のシステムに結合又は統合されてもよいし、或いは幾つかの特徴は、無視されたり或いは実行されなかったりしてもよい。更に、図示又は議論された相互カップリング、直接的なカップリング、又は通信コネクションは、何らかのインターフェースを介して実装されてもよい。装置又はユニット間の間接的なカップリング又は通信コネクションは、電気的な形態、機械的な形態、又はその他の形態で実施されてもよい。
【0289】
[0291] 別個のパーツとして記載されているユニットは、物理的に分離されていてもいなくてもよく、ユニットとして示されているパーツは、物理的なユニットであってもなくてもよく、一カ所に配置されていてもよく、又は複数のネットワーク・ユニット上に分散されていてもよい。ユニットの一部又は全部は、実施形態の解決策の目的を達成するために、実際の要件に基づいて選択されてもよい。
【0290】
[0292] 更に、本願の実施形態における機能ユニットは、1つの処理ユニットに統合されてもよいし、又は各ユニットは、物理的に単独で存在してもよいし、又は2つ以上のユニットは、1つのユニットに統合されてもよい。
【0291】
[0293] 機能がソフトウェア機能ユニットの形態で実装され、独立した製品として販売又は使用される場合、機能は、コンピュータ読み取り可能な記憶媒体に記憶される可能性がある。このような理解に基づいて、本願の技術的解決策は本質的に、先行技術に寄与する部分は、又は何らかの技術的解決策は、ソフトウェア製品の形態で実施される可能性がある。ソフトウェア製品は、記憶媒体に記憶され、コンピュータ・デバイス(パーソナルコンピュータ、サーバー、ネットワーク・デバイスなど)に、本願の実施形態で説明された方法の全部又は一部のステップを実行するように指示するための幾つかの命令を含む。前述の記憶媒体は、USBフラッシュ・ドライブ、リムーバブル・ハード・ディスク、リード・オンリー・メモリ(read-only memory,ROM)、ランダム・アクセス・メモリ(random access memory,RAM)、磁気ディスク、又は光ディスクのようなプログラム・コードを記憶することが可能な任意の媒体を含む。
【0292】
[0294] 前述の説明は、本願の単なる具体的な実装であるに過ぎず、本願の保護範囲を制限するようには意図されていない。本願で開示される技術的範囲内で、当業者により容易に把握される如何なる変形や代替も、本願の保護範囲に含まれるものとする。従って、本願の保護範囲はクレームの保護範囲に従うものとする。

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10