IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 華為技術有限公司の特許一覧

特許7443423マルチチャネル信号の符号化方法およびエンコーダ
<>
  • 特許-マルチチャネル信号の符号化方法およびエンコーダ 図1
  • 特許-マルチチャネル信号の符号化方法およびエンコーダ 図2
  • 特許-マルチチャネル信号の符号化方法およびエンコーダ 図3
  • 特許-マルチチャネル信号の符号化方法およびエンコーダ 図4
  • 特許-マルチチャネル信号の符号化方法およびエンコーダ 図5
  • 特許-マルチチャネル信号の符号化方法およびエンコーダ 図6
  • 特許-マルチチャネル信号の符号化方法およびエンコーダ 図7
  • 特許-マルチチャネル信号の符号化方法およびエンコーダ 図8
  • 特許-マルチチャネル信号の符号化方法およびエンコーダ 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-26
(45)【発行日】2024-03-05
(54)【発明の名称】マルチチャネル信号の符号化方法およびエンコーダ
(51)【国際特許分類】
   G10L 19/008 20130101AFI20240227BHJP
【FI】
G10L19/008 100
【請求項の数】 25
【外国語出願】
(21)【出願番号】P 2022096616
(22)【出願日】2022-06-15
(62)【分割の表示】P 2020158348の分割
【原出願日】2017-02-22
(65)【公開番号】P2022137052
(43)【公開日】2022-09-21
【審査請求日】2022-07-14
(31)【優先権主張番号】201610652506.X
(32)【優先日】2016-08-10
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】503433420
【氏名又は名称】華為技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian, Longgang District, Shenzhen, Guangdong 518129, P.R. China
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133569
【弁理士】
【氏名又は名称】野村 進
(72)【発明者】
【氏名】▲劉▼ ▲澤▼新
(72)【発明者】
【氏名】▲張▼ ▲興▼涛
(72)【発明者】
【氏名】李 ▲海▼▲ティン▼
(72)【発明者】
【氏名】苗 磊
【審査官】中村 天真
(56)【参考文献】
【文献】特表2015-514234(JP,A)
【文献】特表2014-529101(JP,A)
【文献】特表2013-524267(JP,A)
【文献】特表2008-519301(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00-19/26
G10L 25/00-25/93
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
マルチチャネル信号符号化方法であって、
現フレームのマルチチャネル信号を取得するステップと、
前記現フレームの初期マルチチャネルパラメータを決定するステップであって、前記現フレームの前記初期マルチチャネルパラメータが、前記現フレームの初期チャネル時間差(ITD)値を含み、前記初期ITD値が、ハイブリッド領域において以下の式に基づいて決定され、
【数1】
ここで、Li(f)は第1のマルチチャネル信号の左チャネルの周波数領域信号の周波数領域係数を表し、
【数2】
は前記第1のマルチチャネル信号の右チャネルの周波数領域信号の周波数領域係数の共役を表し、arg max()は複数の値から最大値を選択することを意味し、IDFT()は逆離散フーリエ変換を表す、ステップと、
前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定するステップであって、前記差分パラメータが前記現フレームの前記初期マルチチャネルパラメータと前記前のK個のフレームの前記マルチチャネルパラメータとの間の差を表すために使用され、Kが1以上の整数である、ステップと、
前記現フレームの前記差分パラメータおよび特性パラメータに基づいて前記現フレームのマルチチャネルパラメータを決定するステップと、
前記現フレームの前記マルチチャネルパラメータに基づいて前記マルチチャネル信号を符号化するステップと
を含む、方法。
【請求項2】
前記現フレームの前記差分パラメータおよび特性パラメータに基づいて前記現フレームのマルチチャネルパラメータを決定する前記ステップが、
前記差分パラメータが第1の事前設定条件を満たす場合、前記現フレームの前記特性パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するステップ
を含む、請求項1に記載の方法。
【請求項3】
前記差分パラメータが、前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のフレームのマルチチャネルパラメータとの間の差の絶対値であり、前記第1の事前設定条件は、前記差分パラメータが予め設定された第1の閾値より大きいということである、
または、
前記差分パラメータが、前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のフレームのマルチチャネルパラメータとの積であり、前記第1の事前設定条件は前記差分パラメータが0以下であることである、請求項2に記載の方法。
【請求項4】
前記現フレームの前記特性パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定する前記ステップが、
前記現フレームの相関パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するステップであって、前記相関パラメータが、前記現フレームと前記現フレームの前記前のフレームとの間の相関度を表すために使用される、ステップ
を含む、請求項2または3に記載の方法。
【請求項5】
前記方法が、
前記現フレームの前記マルチチャネル信号内のターゲットチャネル信号と前記前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて前記相関パラメータを決定するステップ
をさらに含む、請求項4に記載の方法。
【請求項6】
前記現フレームの前記マルチチャネル信号内のターゲットチャネル信号と前記前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて前記相関パラメータを決定する前記ステップが、
前記現フレームの前記マルチチャネル信号内の前記ターゲットチャネル信号の周波数領域パラメータと前記前のフレームの前記マルチチャネル信号内の前記ターゲットチャネル信号の周波数領域パラメータとに基づいて前記相関パラメータを決定するステップであって、前記周波数領域パラメータが、前記ターゲットチャネル信号の周波数領域振幅値および周波数領域係数のうちの少なくとも一方である、ステップ
を含む、請求項5に記載の方法。
【請求項7】
前記方法が、
前記現フレームのピッチ周期と前記前のフレームのピッチ周期とに基づいて前記相関パラメータを決定するステップ
をさらに含む、請求項4に記載の方法。
【請求項8】
前記現フレームの前記特性パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定する前記ステップが、
前記特性パラメータが第2の事前設定条件を満たす場合、前記現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するステップであって、Tが1以上の整数である、ステップ
を含む、請求項2から7のいずれか一項に記載の方法。
【請求項9】
前記現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定する前記ステップが、
前記前のT個のフレームの前記マルチチャネルパラメータを前記現フレームの前記マルチチャネルパラメータとして決定するステップであって、Tが1に等しい、ステップ、
または、
前記前のT個のフレームの前記マルチチャネルパラメータの変化傾向に基づいて前記現フレームの前記マルチチャネルパラメータを決定するステップであって、Tが2以上である、ステップ
を含む、請求項8に記載の方法。
【請求項10】
前記現フレームの前記特性パラメータが、前記現フレームの相関パラメータおよびピーク対平均比パラメータのうちの少なくとも一方を含み、前記相関パラメータが前記現フレームと前記現フレームの前記前のフレームとの間の相関度を表すために使用され、前記ピーク対平均比パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、前記第2の事前設定条件は、前記特性パラメータが予め設定された閾値より大きいことである、請求項8または9に記載の方法。
【請求項11】
前記現フレームの前記特性パラメータが、前記現フレームのパラメータ、すなわち、相関パラメータ、ピーク対平均比パラメータ、信号対雑音比パラメータ、およびスペクトル傾斜パラメータ、のうちの少なくとも1つを含み、前記相関パラメータが、前記現フレームと前記前のフレームとの間の相関度を表すために使用され、前記ピーク対平均比パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの前記信号のピーク対平均比を表すために使用され、前記信号対雑音比パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号の信号対雑音比を表すために使用され、前記スペクトル傾斜パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号のスペクトル傾斜度を表すために使用される、請求項1から10のいずれか一項に記載の方法。
【請求項12】
現フレームのマルチチャネル信号を取得するように構成された取得ユニットと、
前記現フレームの初期マルチチャネルパラメータを決定するように構成された第1の決定ユニットであって、前記現フレームの前記初期マルチチャネルパラメータが、前記現フレームの初期チャネル時間差(ITD)値を含み、前記初期ITD値が、ハイブリッド領域において以下の式に基づいて決定され、
【数3】
ここで、Li(f)は第1のマルチチャネル信号の左チャネルの周波数領域信号の周波数領域係数を表し、
【数4】
は前記第1のマルチチャネル信号の右チャネルの周波数領域信号の周波数領域係数の共役を表し、arg max()は複数の値から最大値を選択することを意味し、IDFT()は逆離散フーリエ変換を表す、第1の決定ユニットと、
前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定するように構成された第2の決定ユニットであって、前記差分パラメータが前記現フレームの前記初期マルチチャネルパラメータと前記前のK個のフレームの前記マルチチャネルパラメータとの間の差を表すために使用され、Kが1以上の整数である、第2の決定ユニットと、
前記現フレームの前記差分パラメータと特性パラメータとに基づいて前記現フレームのマルチチャネルパラメータを決定するように構成された第3の決定ユニットと、
前記現フレームの前記マルチチャネルパラメータに基づいて前記マルチチャネル信号を符号化するように構成された符号化ユニットと
を備える、エンコーダ。
【請求項13】
前記第3の決定ユニットは、前記差分パラメータが第1の事前設定条件を満たす場合、前記現フレームの前記特性パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するように特に構成される、請求項12に記載のエンコーダ。
【請求項14】
前記差分パラメータが、前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のフレームのマルチチャネルパラメータとの間の差の絶対値であり、前記第1の事前設定条件は、前記差分パラメータが予め設定された第1の閾値より大きいということである、
または、
前記差分パラメータが、前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のフレームのマルチチャネルパラメータとの積であり、前記第1の事前設定条件は前記差分パラメータが0以下であることである、請求項13に記載のエンコーダ。
【請求項15】
前記第3の決定ユニットが、前記現フレームの相関パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するように特に構成され、前記相関パラメータが前記現フレームと前記現フレームの前記前のフレームとの間の相関度を表すために使用される、請求項13または14のいずれか一項に記載のエンコーダ。
【請求項16】
前記エンコーダが、
前記現フレームの前記マルチチャネル信号内のターゲットチャネル信号と前記前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて前記相関パラメータを決定するように構成された第4の決定ユニット
をさらに備える、請求項15に記載のエンコーダ。
【請求項17】
前記第4の決定ユニットが、前記現フレームの前記マルチチャネル信号内の前記ターゲットチャネル信号の周波数領域パラメータと、前記前のフレームの前記マルチチャネル信号内の前記ターゲットチャネル信号の周波数領域パラメータとに基づいて前記相関パラメータを決定するように特に構成され、前記周波数領域パラメータが、前記ターゲットチャネル信号の周波数領域振幅値および周波数領域係数のうちの少なくとも一方である、請求項16に記載のエンコーダ。
【請求項18】
前記エンコーダが、
前記現フレームのピッチ周期と前記前のフレームのピッチ周期とに基づいて前記相関パラメータを決定するように構成された第5の決定ユニット
をさらに備える、請求項15に記載のエンコーダ。
【請求項19】
前記第3の決定ユニットは、前記特性パラメータが第2の事前設定条件を満たす場合、前記現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するように特に構成され、Tが1以上の整数である、請求項13から18のいずれか一項に記載のエンコーダ。
【請求項20】
前記第3の決定ユニットが、前記前のT個のフレームの前記マルチチャネルパラメータを前記現フレームの前記マルチチャネルパラメータとして決定するように特に構成され、Tが1に等しい、
または、
前記第3の決定ユニットが、前記前のT個のフレームの前記マルチチャネルパラメータの変化傾向に基づいて前記現フレームの前記マルチチャネルパラメータを決定するように特に構成され、Tが2以上である、請求項19に記載のエンコーダ。
【請求項21】
前記特性パラメータが、前記現フレームの相関パラメータおよびピーク対平均比パラメータのうちの少なくとも一方を含み、前記相関パラメータが前記現フレームと前記現フレームの前記前のフレームとの間の相関度を表すために使用され、前記ピーク対平均比パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、前記第2の事前設定条件は、前記特性パラメータが予め設定された閾値より大きいことである、請求項19または20に記載のエンコーダ。
【請求項22】
前記現フレームの前記特性パラメータが、前記現フレームのパラメータ、すなわち、相関パラメータ、ピーク対平均比パラメータ、信号対雑音比パラメータ、およびスペクトル傾斜パラメータ、のうちの少なくとも1つを含み、前記相関パラメータが、前記現フレームと前記前のフレームとの間の相関度を表すために使用され、前記ピーク対平均比パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの前記信号のピーク対平均比を表すために使用され、前記信号対雑音比パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号の信号対雑音比を表すために使用され、前記スペクトル傾斜パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号のスペクトル傾斜度を表すために使用される、請求項13から21のいずれか一項に記載のエンコーダ。
【請求項23】
コンピュータに請求項1から11のいずれか一項に記載の方法を実行させるプログラムを記録したコンピュータ読み取り可能な記憶媒体。
【請求項24】
コンピュータに請求項1から11のいずれか一項に記載の方法を実行させるように構成されたコンピュータプログラム。
【請求項25】
メモリとプロセッサとを備えるエンコーダであって、前記メモリはプログラムを格納するように構成され、前記プロセッサは前記プログラムを実行するように構成され、前記プログラムが実行される時、前記プロセッサは請求項1から11のいずれか一項に記載の方法を実行する、エンコーダ。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2016年8月10日に中国特許庁に提出され、「MULTI-CHANNEL SIGNAL ENCODING METHOD AND ENCODER」と題された中国特許出願第201610652506.X号の優先権を主張し、その全体が参照により本明細書に組み込まれる。
【0002】
本出願は、オーディオ信号の符号化分野に関し、特にマルチチャネル信号の符号化方法およびエンコーダに関する。
【背景技術】
【0003】
生活の質の向上は、高品質オーディオに対する人々の要求の高まりを伴っている。モノラル信号と比較すると、ステレオは音源の方向性や分布感があり、明瞭度、了解度、音の即時性を向上させることができるため、人々に人気がある。
【0004】
ステレオ処理技術は、主に、ミッド/サイド(Mid/Sid、MS)符号化、インテンシティステレオ(Intensity Stereo、IS)符号化、およびパラメトリックステレオ(Parametric Stereo、PS)符号化を含む。
【0005】
MS符号化では、チャネル間コヒーレンスに基づいて2つの信号に対してミッド/サイド変換が行われ、チャネルのエネルギーは主にミッドチャネルに集中するため、チャネル間の冗長性が排除される。MS符号化技術では、符号化率の低減は入力信号間のコヒーレンスに依存する。左チャネル信号と右チャネル信号との間のコヒーレンスが悪い場合、左チャネル信号と右チャネル信号とは別々に送信される必要がある。
【0006】
IS符号化では、人間の聴覚系がチャネルの高周波成分(例えば、2kHzを超える成分)間の位相差に敏感でないという特徴に基づいて、左チャネル信号および右チャネル信号の高周波成分が単純化される。しかしながら、IS符号化技術は高周波成分に対してのみ有効である。IS符号化技術が低周波数に拡張されると、深刻な人工雑音が発生する。
【0007】
PS符号化は、バイノーラル聴覚モデルに基づく符号化方式である。図1に示すように(図1において、xLは左チャネルの時間領域信号であり、xRは右チャネルの時間領域信号である)、PS符号化プロセスにおいて、エンコーダ側はステレオ信号をモノラル信号および空間音場を記述するいくつかの空間パラメータ(または空間知覚パラメータ)に変換する。図2に示すように、モノラル信号と空間パラメータを取得した後、デコーダ側は、空間パラメータを参照してステレオ信号を復元する。MS符号化と比較して、PS符号化はより高い圧縮率を有する。したがって、PS符号化においては、比較的良好な音質が維持されることを前提として、より高い符号化利得を得ることができる。さらに、PS符号化は全オーディオ帯域幅で実行することができ、ステレオの空間知覚効果をうまく回復することができる。
【0008】
PS符号化では、マルチチャネルパラメータ(空間パラメータとも呼ばれる)は、チャネル間コヒーレンス(Inter-channel Coherence、IC)、チャネル間レベル差(Inter-channel Level Difference、ILD)、チャネル間時間差(Inter-channel Time Difference、ITD)、全体位相差(Overall Phase Difference、OPD)、チャネル間位相差(Inter-channel Phase Difference、IPD)などを含む。ICはチャネル間相互相関またはコヒーレンスを表す。このパラメータは、音場範囲の知覚を決定し、オーディオ信号の空間感および音の安定性を向上させることができる。ILDは、ステレオ音源の水平方位を区別するために使用され、チャネル間のエネルギー差を表す。このパラメータはスペクトル全体の周波数成分に影響する。ITDとIPDは、音源の水平方向を表す空間パラメータであり、チャネル間の時間差と位相差を表す。ILD、ITD、およびIPDは、音源の位置に対する人間の耳の知覚を決定することができ、音場位置を効果的に決定するために使用され得、ステレオ信号の復元において重要な役割を果たす。
【0009】
ステレオ録音プロセスでは、背景雑音、残響、および多人数会話などの要因の影響のために、既存のPS符号化方式に従って計算されたマルチチャネルパラメータは常に不安定である(マルチチャネルパラメータ値は頻繁かつ急激に変化する)。そのようなマルチチャネルパラメータに基づいて計算されたダウンミックス信号は不連続である。その結果、デコーダ側で得られるステレオの品質は悪くなる。例えば、デコーダ側で再生されるステレオの音響画像は頻繁にジッタし、そして聴覚凍結さえも生じる。
【発明の概要】
【課題を解決するための手段】
【0010】
この出願は、PS符号化におけるマルチチャネルパラメータの安定性を改善し、それによってオーディオ信号の符号化品質を改善するための、マルチチャネル信号の符号化方法およびエンコーダを提供する。
【0011】
第1の態様によれば、マルチチャネル信号符号化方法が提供され、この方法は、
現フレームのマルチチャネル信号を取得するステップと、
現フレームの初期マルチチャネルパラメータを決定するステップと、
現フレームの初期マルチチャネルパラメータと現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定するステップであって、差分パラメータは現フレームの初期マルチチャネルパラメータと前のK個のフレームのマルチチャネルパラメータとの間の差を表すために使用され、Kは1以上の整数である、ステップと、
現フレームの差分パラメータおよび特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップと、
現フレームのマルチチャネルパラメータに基づいてマルチチャネル信号を符号化するステップと
を含む。
【0012】
現フレームのマルチチャネルパラメータは、現フレームの特性パラメータ、および現フレームと前のK個のフレームとの間の差を総合的に考慮して決定される。この決定方法はより適切である。現フレームに対して前のフレームのマルチチャネルパラメータを直接再利用する方法と比較して、この方法は、マルチチャネル信号のチャネル間情報の精度をより確実に保証することができる。
【0013】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、現フレームの差分パラメータおよび特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップは、
差分パラメータが第1の事前設定条件を満たす場合、現フレームの特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップ
を含む。
【0014】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、差分パラメータは、現フレームの初期マルチチャネルパラメータと現フレームの前のフレームのマルチチャネルパラメータとの間の差の絶対値であり、第1の事前設定条件は、差分パラメータが予め設定された第1の閾値より大きいということである。
【0015】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、差分パラメータは、現フレームの初期マルチチャネルパラメータと現フレームの前のフレームのマルチチャネルパラメータとの積であり、第1の事前設定条件は、差分パラメータが0以下であることである。
【0016】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、現フレームの特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップは、
現フレームの相関パラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップであって、相関パラメータは、現フレームと現フレームの前のフレームとの間の相関度を表すために使用される、ステップ
を含む。
【0017】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、方法は、
現フレームのマルチチャネル信号内のターゲットチャネル信号と前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて相関パラメータを決定するステップ
をさらに含む。
【0018】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、現フレームのマルチチャネル信号内のターゲットチャネル信号と前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて相関パラメータを決定するステップは、
現フレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータと前のフレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータとに基づいて相関パラメータを決定するステップであって、周波数領域パラメータは、ターゲットチャネル信号の周波数領域振幅値および周波数領域係数のうちの少なくとも一方である、ステップ
を含む。
【0019】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、方法は、
現フレームのピッチ周期と前のフレームのピッチ周期とに基づいて相関パラメータを決定するステップ
をさらに含む。
【0020】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、現フレームの特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップは、
特性パラメータが第2の事前設定条件を満たす場合、現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップであって、Tは1以上の整数である、ステップ
を含む。
【0021】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップは、
前のT個のフレームのマルチチャネルパラメータを現フレームのマルチチャネルパラメータとして決定するステップであって、Tは1に等しい、ステップ
を含む。
【0022】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップは、
前のT個のフレームのマルチチャネルパラメータの変化傾向に基づいて現フレームのマルチチャネルパラメータを決定するステップであって、Tは2以上である、ステップ
を含む。
【0023】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、特性パラメータは、現フレームの相関パラメータおよびピーク対平均比パラメータのうちの少なくとも一方を含み、相関パラメータは現フレームと現フレームの前のフレームとの間の相関度を表すために使用され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、第2の事前設定条件は、特性パラメータが予め設定された閾値より大きいことである。
【0024】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、現フレームの初期マルチチャネルパラメータは、現フレームの初期チャネル間コヒーレンスIC値、現フレームの初期チャネル時間差ITD値、現フレームの初期チャネル間位相差IPD値、現フレームの初期全体位相差OPD値、および現フレームの初期チャネル間レベル差ILD値、のうちの少なくとも1つを含む。
【0025】
第1の態様を参照すると、第1の態様のいくつかの実装形態では、現フレームの特性パラメータは、現フレームのパラメータ、すなわち、相関パラメータ、ピーク対平均比パラメータ、信号対雑音比パラメータ、およびスペクトル傾斜パラメータ、のうちの少なくとも1つを含み、相関パラメータは、現フレームと前のフレームとの間の相関度を表すために使用され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、信号対雑音比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号の信号対雑音比を表すために使用され、スペクトル傾斜パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のスペクトル傾斜度を表すために使用される。
【0026】
第2の態様によれば、エンコーダが提供され、エンコーダは、
現フレームのマルチチャネル信号を取得するように構成された取得ユニットと、
現フレームの初期マルチチャネルパラメータを決定するように構成された第1の決定ユニットと、
現フレームの初期マルチチャネルパラメータと現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定するように構成された第2の決定ユニットであって、差分パラメータは現フレームの初期マルチチャネルパラメータと前のK個のフレームのマルチチャネルパラメータとの間の差を表すために使用され、Kは1以上の整数である、第2の決定ユニットと、
現フレームの差分パラメータと特性パラメータとに基づいて現フレームのマルチチャネルパラメータを決定するように構成された第3の決定ユニットと、
現フレームのマルチチャネルパラメータに基づいてマルチチャネル信号を符号化するように構成された符号化ユニットと
を含む。
【0027】
現フレームのマルチチャネルパラメータは、現フレームの特性パラメータ、および現フレームと前のK個のフレームとの間の差を総合的に考慮して決定される。この決定方法はより適切である。現フレームに対して前のフレームのマルチチャネルパラメータを直接再利用する方法と比較して、この方法は、マルチチャネル信号のチャネル間情報の精度をより確実に保証することができる。
【0028】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第3の決定ユニットは、差分パラメータが第1の事前設定条件を満たす場合、現フレームの特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成される。
【0029】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、差分パラメータは、現フレームの初期マルチチャネルパラメータと現フレームの前のフレームのマルチチャネルパラメータとの間の差の絶対値であり、第1の事前設定条件は、差分パラメータが予め設定された第1の閾値より大きいということである。
【0030】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、差分パラメータは、現フレームの初期マルチチャネルパラメータと現フレームの前のフレームのマルチチャネルパラメータとの積であり、第1の事前設定条件は、差分パラメータが0以下であることである。
【0031】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第3の決定ユニットは、現フレームの相関パラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、相関パラメータは現フレームと現フレームの前のフレームとの間の相関度を表すために使用される。
【0032】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、エンコーダは、
現フレームのマルチチャネル信号内のターゲットチャネル信号と前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて相関パラメータを決定するように構成された第4の決定ユニット
をさらに含む。
【0033】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第4の決定ユニットは、現フレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータと、前のフレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータとに基づいて相関パラメータを決定するように特に構成され、周波数領域パラメータは、ターゲットチャネル信号の周波数領域振幅値および周波数領域係数のうちの少なくとも一方である。
【0034】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、エンコーダは、
現フレームのピッチ周期と前のフレームのピッチ周期とに基づいて相関パラメータを決定するように構成された第5の決定ユニット
をさらに含む。
【0035】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第3の決定ユニットは、特性パラメータが第2の事前設定条件を満たす場合、現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、Tは1以上の整数である。
【0036】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第3の決定ユニットは、前のT個のフレームのマルチチャネルパラメータを現フレームのマルチチャネルパラメータとして決定するように特に構成され、Tは1に等しい。
【0037】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第3の決定ユニットは、前のT個のフレームのマルチチャネルパラメータの変化傾向に基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、Tは2以上である。
【0038】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、特性パラメータは、現フレームの相関パラメータおよびピーク対平均比パラメータのうちの少なくとも一方を含み、相関パラメータは現フレームと現フレームの前のフレームとの間の相関度を表すために使用され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、第2の事前設定条件は、特性パラメータが予め設定された閾値より大きいことである。
【0039】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、現フレームの初期マルチチャネルパラメータは、現フレームの初期チャネル間コヒーレンスIC値、現フレームの初期チャネル時間差ITD値、現フレームの初期チャネル間位相差IPD値、現フレームの初期全体位相差OPD値、および現フレームの初期チャネル間レベル差ILD値、のうちの少なくとも1つを含む。
【0040】
第2の態様を参照すると、第2の態様のいくつかの実装形態では、現フレームの特性パラメータは、現フレームのパラメータ、すなわち、相関パラメータ、ピーク対平均比パラメータ、信号対雑音比パラメータ、およびスペクトル傾斜パラメータ、のうちの少なくとも1つを含み、相関パラメータは、現フレームと前のフレームとの間の相関度を表すために使用され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、信号対雑音比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号の信号対雑音比を表すために使用され、スペクトル傾斜パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のスペクトル傾斜度を表すために使用される。
【0041】
第3の態様によれば、メモリとプロセッサとを含むエンコーダが提供される。メモリはプログラムを格納するように構成され、プロセッサはプログラムを実行するように構成される。プログラムが実行されると、プロセッサは第1の態様における方法を実行する。
【0042】
第4の態様によれば、コンピュータ可読媒体が提供される。コンピュータ可読媒体は、エンコーダによって実行されるプログラムコードを格納する。プログラムコードは、第1の態様における方法を実行するために使用される命令を含む。
【0043】
本出願では、現フレームのマルチチャネルパラメータは、現フレームの特性パラメータ、および現フレームと前のK個のフレームとの間の差を総合的に考慮して決定される。この決定方法はより適切である。現フレームに対して前のフレームのマルチチャネルパラメータを直接再利用する方法と比較して、この方法は、マルチチャネル信号のチャネル間情報の精度をより確実に保証することができる。
【図面の簡単な説明】
【0044】
図1】従来技術におけるPS符号化のフローチャートである。
図2】従来技術におけるPS復号のフローチャートである。
図3】従来技術における時間領域ベースのITDパラメータ抽出方法の概略フローチャートである。
図4】従来技術における周波数領域ベースのITDパラメータ抽出方法の概略フローチャートである。
図5】本出願の一実施形態によるマルチチャネル信号符号化方法の概略フローチャートである。
図6図5のステップ540の詳細フローチャートである。
図7】本出願の一実施形態によるマルチチャネル信号符号化方法の概略フローチャートである。
図8】本出願の一実施形態によるエンコーダの概略ブロック図である。
図9】本出願の一実施形態によるエンコーダの概略構造図である。
【発明を実施するための形態】
【0045】
ステレオ信号はマルチチャネル信号とも呼ばれることに留意されたい。以上、マルチチャネル信号のマルチチャネルパラメータであるILD、ITD、およびIPDの機能と意味について簡単に説明した。理解を容易にするために、以下では、第1のマイクロフォンによって拾われた信号が第1チャネルの信号であり、第2のマイクロフォンによって拾われた信号が第2のチャネルの信号である例を用いてより詳細にILD、ITD、およびIPDについて説明する。
【0046】
ILDは、第1チャネルの信号と第2チャネルの信号との間のエネルギー差を表す。通常、右チャネルのエネルギーに対する左チャネルのエネルギーの比率が計算され、その後、その比率が対数領域値に変換される。例えば、ILD値が0より大きい場合、それは第1チャネルの信号のエネルギーが第2チャネルの信号のエネルギーより高いことを示し;ILD値が0に等しい場合、それは第1チャネルの信号のエネルギーが第2チャネルの信号のエネルギーに等しいことを示し;あるいは、ILD値が0より小さい場合、それは第1チャネルの信号のエネルギーが第2チャネルの信号のエネルギーより小さいことを示している。別の例では、ILDが0未満である場合、それは第1チャネルの信号のエネルギーが第2チャネルの信号のエネルギーより高いことを示し;ILDが0に等しい場合、それは第1チャネルの信号のエネルギーが第2チャネルの信号のエネルギーに等しいことを示し;あるいは、ILDが0より大きい場合、それは第1チャネルの信号のエネルギーが第2チャネルの信号のエネルギーより小さいことを示している。前述の値は単なる例であり、ILD値と、第1チャネルの信号と第2チャネルの信号との間のエネルギー差との間の関係は経験または実際の要求に基づいて定義され得ることを理解されたい。
【0047】
ITDは、第1チャネルの信号と第2チャネルの信号との間の時間差、すなわち、音源によって生成された音が第1のマイクロフォンに到達する時間と、音源によって生成された音が第2のマイクロフォンに到達する時間との間の差を表す。例えば、ITD値が0より大きい場合、それは、音源によって生成された音が第1のマイクロフォンに到達する時間が、音源によって生成された音が第2のマイクロフォンに到達する時間より早いことを示し;ITD値が0に等しい場合、それは、音源によって生成された音が第1のマイクロフォンと第2のマイクロフォンとに同時に到達することを示し;あるいは、ITD値が0未満である場合、それは、音源によって生成された音が第1のマイクロフォンに到達する時間が、音源によって生成された音が第2のマイクロフォンに到達する時間より遅いことを示している。別の例では、ITDが0未満である場合、それは、音源によって生成された音が第1のマイクロフォンに到達する時間が、音源によって生成された音が第2のマイクロフォンに到達する時間より早いことを示し;ITDが0に等しい場合、それは、音源によって生成された音が第1のマイクロフォンと第2のマイクロフォンとに同時に到達することを示し;あるいは、ITDが0より大きい場合、それは、音源によって生成された音が第1のマイクロフォンに到達する時間が、音源によって生成された音が第2のマイクロフォンに到達する時間より遅いことを示している。前述の値は単なる例であり、ITD値と、第1チャネルの信号と第2チャネルの信号との間の時間差との間の関係は経験または実際の要求に基づいて定義され得ることを理解されたい。
【0048】
IPDは、第1チャネルの信号と第2チャネルの信号との間の位相差を表す。このパラメータは通常、デコーダ側でマルチチャネル信号の位相情報を復元するためにITDと一緒に使用される。
【0049】
前述の説明から、既存のマルチチャネルパラメータ計算方法はマルチチャネルパラメータの不連続性を引き起こすことを理解することができる。理解を容易にするために、図3および図4を参照して、以下に、マルチチャネル信号が左チャネル信号および右チャネル信号を含み、マルチチャネルパラメータはITD値である例を用いて、既存のマルチチャネルパラメータ計算方法および既存のマルチチャネルパラメータ計算方法の欠点を詳細に説明する。
【0050】
従来技術では、ITD値を複数の方法で計算することができる。例えば、ITD値は時間領域で計算されてもよく、またはITD値は周波数領域で計算されてもよい。
【0051】
図3は、時間領域ベースのITD値計算方法の概略フローチャートである。図3の方法は、以下のステップを含む。
【0052】
310:左チャネルの時間領域信号と右チャネルの時間領域信号とに基づいてITD値を計算する。
【0053】
具体的には、時間領域相互相関関数を用いて、左チャネルの時間領域信号と右チャネルの時間領域信号とに基づいてITDパラメータを計算することができる。例えば、0≦i≦Tmaxの範囲内で計算が行われる:
【0054】
【数1】
【0055】
【数2】
【0056】
の場合、T1はmax(Cn(i))に対応するインデックス値の逆数であり;そうでなければ、T1はmax(Cp(i))に対応するインデックス値であり、ここで、iは相互相関関数のインデックス値であり、xRは右チャネルの時間領域信号であり、xLは左チャネルの時間領域信号であり、Tmaxは異なるサンプリングレートにおける最大ITD値に対応し、Lengthはフレーム長である。
【0057】
320:ITD値に対して量子化処理を実行する。
【0058】
図4は、周波数領域ベースのITD値計算方法の概略フローチャートである。図4の方法は、以下のステップを含む。
【0059】
410:左チャネルの周波数領域信号および右チャネルの周波数領域信号を得るために、左チャネルの時間領域信号および右チャネルの時間領域信号に対して時間周波数変換を実行する。
【0060】
具体的には、時間周波数変換では、離散フーリエ変換(Discrete Fourier Transform、DFT)または修正離散コサイン変換(Modified Discrete Cosine Transform、MDCT)などの技術を使用することによって、時間領域信号を周波数領域信号に変換することができる。
【0061】
例えば、DFT変換を用いて、入力された左チャネルの時間領域信号と右チャネルの時間領域信号に対して時間周波数変換を行ってもよい。具体的には、以下の式を用いてDFT変換を行うことができる:
【0062】
【数3】
【0063】
ここで、nは時間領域信号のサンプルのインデックス値であり、kは周波数領域信号の周波数ビンのインデックス値であり、Lは時間周波数変換長であり、x(n)は左チャネルの時間領域信号または右チャネルの時間領域信号である。
【0064】
420:左チャネルの周波数領域信号と右チャネルの周波数領域信号とに基づいてITD値を計算する。
【0065】
具体的には、周波数領域信号のL個の周波数ビン(Frequency Bin)を複数のサブバンドに分割することができる。b番目のサブバンドに含まれる周波数ビンのインデックス値は、Ab-1≦k≦Ab-1である。探索範囲:-Tmax≦j≦Tmax内では、振幅値を、以下の式を用いて計算することができる:
【0066】
【数4】
【0067】
この場合、b番目のサブバンドのITD値は、
【0068】
【数5】
【0069】
すなわち、上式に基づいて計算された最大値に対応するサンプルのインデックス値であり得る。
【0070】
430:ITD値に対して量子化処理を実行する。
【0071】
従来技術では、現フレームのマルチチャネル信号の相互相関係数のピーク値が比較的小さい場合、計算されたITD値は不正確であると考えられ得る。この場合、現フレームのITD値はゼロになる。背景雑音、残響、および多人数会話などの要因の影響により、既存のPS符号化方式に従って計算されたITD値は、ゼロになることが多い。その結果、ITD値が頻繁にかつ急激に変化し、このようなITD値に基づいて計算されたダウンミックス信号についてフレーム間の不連続性が生じ、結果としてマルチチャネル信号の音響品質が悪くなる。
【0072】
マルチチャネルパラメータが頻繁かつ急激に変化するという問題を解決するために、実行可能な処理方法は次の通りである:現フレームの計算されたマルチチャネルパラメータが不正確であると考えられる場合、現フレームの前のフレームのマルチチャネルパラメータが再利用され得る。この処理方法では、マルチチャネルパラメータが頻繁かつ急激に変化するという問題を良好に解決することができる。しかしながら、この処理方法は以下の問題を引き起こす可能性がある:現フレームの信号品質が比較的良好である場合、現フレームの計算されたマルチチャネルパラメータは通常比較的正確である。この場合、処理方法が依然として使用されている場合、前のフレームのマルチチャネルパラメータは現フレームのマルチチャネルパラメータとして依然として再利用され得、現フレームの比較的正確なマルチチャネルパラメータは破棄される。その結果、マルチチャネル信号のチャネル間情報が不正確になる。
【0073】
以下に、図5および図6を参照して、本出願の実施形態によるオーディオ信号の符号化方法について詳細に説明する。
【0074】
図5は、本出願の一実施形態によるマルチチャネル信号符号化方法の概略フローチャートである。図5の方法は、以下のステップを含む。
【0075】
510.現フレームのマルチチャネル信号を取得する。
【0076】
本出願のこの実施形態では、マルチチャネル信号の量は特に限定されないことに留意されたい。具体的には、マルチチャネル信号は、デュアルチャネル信号、3チャネル信号、または3チャネルを超える信号であり得る。例えば、マルチチャネル信号は、左チャネル信号と右チャネル信号とを含むことができる。別の例では、マルチチャネル信号は、左チャネル信号、中間チャネル信号、右チャネル信号、および後チャネル信号を含み得る。
【0077】
520.現フレームの初期マルチチャネルパラメータを決定する。
【0078】
いくつかの実施形態では、現フレームの初期マルチチャネルパラメータは、マルチチャネル信号間の相関を表すために使用され得る。
【0079】
いくつかの実施形態では、現フレームの初期マルチチャネルパラメータは、現フレームの初期IC値、現フレームの初期ITD値、現フレームの初期IPD値、現フレームの初期OPD値、現フレームの初期ILD値など、のうちの少なくとも1つを含む。
【0080】
現フレームの初期マルチチャネルパラメータを、複数の方法で計算することができる。詳細は、従来技術を参照されたい。例えば、マルチチャネルパラメータはITD値である。ステップ520では、図3に示した時間領域ベースのITD値計算方法または図4の周波数領域ベースのITD値計算方法を使用することができる。あるいは、ハイブリッド領域(時間領域+周波数領域)ベースのITD値計算方法を、以下の式に基づいて使用することができる:
【0081】
【数6】
【0082】
ここで、Li(f)は左チャネルの周波数領域信号の周波数領域係数を表し、
【0083】
【数7】
【0084】
は右チャネルの周波数領域信号の周波数領域係数の共役を表し、arg max()は複数の値から最大値を選択することを意味し、IDFT()は逆離散フーリエ変換を表す。
【0085】
530.現フレームの初期マルチチャネルパラメータと現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定し、ここで、差分パラメータは現フレームの初期マルチチャネルパラメータと前のK個のフレームのマルチチャネルパラメータとの間の差を表すために使用され、Kは1以上の整数である。
【0086】
現フレームの前のK個のフレームは、符号化対象のオーディオ信号のすべてのフレームにおいて現フレームに近接した前のK個のフレームであることを理解されたい。例えば、符号化対象のオーディオ信号が10個のフレームを含み、K=1であると仮定すると、現フレームが10個のフレームのうち5番目のフレームである場合、現フレームの前のK個のフレームは10個のフレームのうちの4番目のフレームになる。別の例では、符号化対象のオーディオ信号が10個のフレームを含み、K=2であると仮定すると、現フレームが10個のフレームのうち7番目のフレームである場合、現フレームの前のK個のフレームは10個のフレームのうちの5番目のフレームと6番目のフレームになる。
【0087】
特に明記しない限り、以下に現れる前のK個のフレームは現フレームの前のKフレームであり、以下に現れる前のフレームは現フレームの前のフレームである。
【0088】
540.現フレームの差分パラメータおよび特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定する。
【0089】
なお、マルチチャネルパラメータ(初期マルチチャネルパラメータを含む)は、数値の形で表現されてもよい。したがって、マルチチャネルパラメータは、マルチチャネルパラメータ値とも呼ばれる。
【0090】
いくつかの実施形態では、現フレームの特性パラメータは、現フレームのモノラルパラメータを含み得る。モノラルパラメータは、現フレームのマルチチャネル信号内のチャネルの信号の特徴を表すために使用され得る。
【0091】
いくつかの実施形態では、ステップ540において現フレームのマルチチャネルパラメータを決定することは、現フレームのマルチチャネルパラメータを取得するために初期マルチチャネルパラメータを修正することを含み得る。例えば、現フレームの特性パラメータは現フレームのモノラルパラメータである。ステップ540は、現フレームのマルチチャネルパラメータを取得するために、現フレームの差分パラメータおよびモノラルパラメータに基づいて現フレームの初期マルチチャネルパラメータを修正することを含み得る。
【0092】
いくつかの実施形態では、現フレームの特性パラメータは、現フレームの相関パラメータ、ピーク対平均比パラメータ、信号対雑音比パラメータ、およびスペクトル傾斜パラメータのうちの少なくとも1つを含む。相関パラメータは、現フレームと前のフレームとの間の相関度を表すために使用される。ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用される。信号対雑音比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号の信号対雑音比を表すために使用される。スペクトル傾斜パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のスペクトル傾斜度またはスペクトルエネルギー変化傾向を表すために使用される。
【0093】
550.現フレームのマルチチャネルパラメータに基づいてマルチチャネル信号を符号化する。
【0094】
例えば、図1に示すモノラルオーディオ符号化、空間パラメータ符号化、およびビットストリーム多重化などの動作を実行することができる。具体的な符号化方式については、従来技術を参照されたい。
【0095】
本出願のこの実施形態では、現フレームのマルチチャネルパラメータは、現フレームの特性パラメータ、および現フレームと前のK個のフレームとの間の差を総合的に考慮して決定される。この決定方法はより適切である。現フレームに対して前のフレームのマルチチャネルパラメータを直接再利用する方法と比較して、この方法は、マルチチャネル信号のチャネル間情報の精度をより確実に保証することができる。
【0096】
以下に、ステップ540の実施例を詳細に説明する。
【0097】
任意選択で、いくつかの実施形態では、ステップ540は、差分パラメータが第1の事前設定条件を満たす場合、現フレームのマルチチャネルパラメータを取得するために、現フレームの特性パラメータの値に基づいて現フレームの初期マルチチャネルパラメータの値を調整するステップを含み得る。
【0098】
任意選択で、いくつかの実施形態では、ステップ540は、現フレームの特性パラメータが第1の事前設定条件を満たす場合、現フレームのマルチチャネルパラメータを取得するために、差分パラメータの値に基づいて現フレームの初期マルチチャネルパラメータの値を調整するステップを含み得る。
【0099】
第1の事前設定条件は、1つの条件でもよく、または複数の条件の組み合わせでもよいことを理解されたい。さらに、第1の事前設定条件が満たされる場合、決定は他の条件に基づいてさらに実行され得る。すべての条件が満たされると、次のステップが実行される。
【0100】
任意選択で、いくつかの実施形態では、図6に示すように、ステップ540は以下のサブステップを含み得る。
【0101】
542.差分パラメータが第1の事前設定条件を満たしているかどうかを決定する。
【0102】
544.差分パラメータが第1の事前設定条件を満たす場合、現フレームの特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定する。
【0103】
差分パラメータは複数の方法で定義され得ることを理解されたい。差分パラメータを定義する異なる方法は、異なる第1の事前設定条件に対応し得る。以下に、差分パラメータと、差分パラメータに対応する第1の事前設定条件について詳細に説明する。
【0104】
任意選択で、いくつかの実施形態では、差分パラメータは、現フレームの初期マルチチャネルパラメータと前のフレームのマルチチャネルパラメータとの間の差、または差の絶対値であり得る。第1の事前設定条件は、差分パラメータが予め設定された第1の閾値より大きいことであり得る。第1の閾値は、目標値の0.3~0.7倍であってもよい。例えば、第1の閾値は、目標値の0.5倍であってもよい。目標値は、前のフレームのマルチチャネルパラメータと現フレームの初期マルチチャネルパラメータにおいて絶対値が大きい方のマルチチャネルパラメータである。
【0105】
任意選択で、いくつかの実施形態では、差分パラメータは、現フレームの初期マルチチャネルパラメータと前のK個のフレームのマルチチャネルパラメータの平均値との間の差、または差の絶対値であり得る。第1の事前設定条件は、差分パラメータが予め設定された第1の閾値より大きいことであり得る。第1の閾値は、目標値の0.3~0.7倍であってもよい。例えば、第1の閾値は、目標値の0.5倍であってもよい。目標値は、前のフレームのマルチチャネルパラメータと現フレームの初期マルチチャネルパラメータにおいて絶対値が大きい方のマルチチャネルパラメータである。
【0106】
任意選択で、いくつかの実施形態では、差分パラメータは現フレームの初期マルチチャネルパラメータと前のフレームのマルチチャネルパラメータとの積であってもよく、第1の事前設定条件は差分パラメータが0以下であることであってもよい。
【0107】
以下に、ステップ544の特定の実施例を詳細に説明する。
【0108】
任意選択で、いくつかの実施形態では、ステップ544は、現フレームの相関パラメータおよび/またはスペクトル傾斜パラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップを含み得、ここで、相関パラメータは現フレームと前のフレームとの間の相関度を表すために使用され、スペクトル傾斜パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のスペクトル傾斜度またはスペクトルエネルギー変化傾向を表すために使用される。
【0109】
任意選択で、いくつかの実施形態では、ステップ544は、現フレームの相関パラメータおよび/またはピーク対平均比パラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップを含み得、ここで、相関パラメータは現フレームと前のフレームとの間の相関度を表すために使用され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用される。
【0110】
以下に、現フレームの相関パラメータについて詳細に説明する。
【0111】
具体的には、相関パラメータは、現フレームと前のフレームとの間の相関度を表すために使用され得る。現フレームと前のフレームとの間の相関度を、複数の方法で表すことができる。異なる表現方法は、相関パラメータを計算する異なる方法に対応し得る。以下は、特定の実施形態を参照して詳細な説明を提供する。
【0112】
任意選択で、いくつかの実施形態では、現フレームと前のフレームとの間の相関度を、現フレームのマルチチャネル信号内のターゲットチャネル信号と前のフレームのマルチチャネル信号内のターゲットチャネル信号との間の相関度を用いて表すことができる。現フレームのターゲットチャネル信号は前のフレームのターゲットチャネル信号に対応することを理解されたい。具体的には、現フレームのターゲットチャネル信号が左チャネル信号である場合、前のフレームのターゲットチャネル信号は左チャネル信号であり;現フレームのターゲットチャネル信号が右チャネル信号である場合、前のフレームのターゲットチャネル信号は右チャネル信号であり;あるいは、現フレームのターゲットチャネル信号が左チャネル信号と右チャネル信号とを含む場合、前のフレームのターゲットチャネル信号は左チャネル信号と右チャネル信号とを含む。ターゲットチャネル信号は、ターゲットチャネル時間領域信号またはターゲットチャネル周波数領域信号であり得ることをさらに理解されたい。
【0113】
例えば、ターゲットチャネル信号は周波数領域信号である。現フレームのマルチチャネル信号内のターゲットチャネル信号と前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて相関パラメータを決定するステップは、具体的には、現フレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータと前のフレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータとに基づいて相関パラメータを決定するステップであって、ターゲットチャネル信号の周波数領域パラメータは、ターゲットチャネル信号の周波数領域振幅値および/または周波数領域係数を含む、ステップを含み得る。
【0114】
いくつかの実施形態では、ターゲットチャネル信号の周波数領域振幅値は、ターゲットチャネル信号のいくつかまたはすべてのサブバンドの周波数領域振幅値であり得る。例えば、ターゲットチャネル信号の周波数領域振幅値は、ターゲットチャネル信号の低周波数部分におけるサブバンドの周波数領域振幅値であり得る。
【0115】
具体的には、例えば、ターゲットチャネル信号は、左チャネルの周波数領域信号である。左チャネルの周波数領域信号の低周波数部分がM個のサブバンドを含み、各サブバンドがN個の周波数領域振幅値を含むと仮定すると、現フレームおよび前のフレームのサブバンドの周波数領域振幅値の正規化相互相関値は、M個のサブバンドと1対1に対応するM個の正規化相互相関値を得るために、以下の式に基づいて計算され得る:
【0116】
【数8】
【0117】
ここで、|L(i*N+j)|は、現フレームの左チャネルの周波数領域信号の低周波数部分におけるi番目のサブバンドのj番目の周波数領域振幅値を表し、|L(-1)(i*N+j)|は、前のフレームの左チャネルの周波数領域信号の低周波数部分におけるi番目のサブバンドのj番目の周波数領域振幅値を表し、cor(i)は、M個のサブバンドにおけるi番目のサブバンドの正規化相互相関値を表す。
【0118】
次に、M個の正規化相互相関値は、現フレームと前のフレームの相関パラメータとして決定され得る;あるいは、M個の正規化相互相関値の和またはM個の正規化相互相関値の平均値は、現フレームの相関パラメータとして決定され得る。
【0119】
いくつかの実施形態では、周波数領域振幅値に基づいて相関パラメータを計算する前述の方法は、周波数領域係数に基づいて相関パラメータを計算する方法と置き換えられてもよい。
【0120】
いくつかの実施形態では、周波数領域振幅値に基づいて相関パラメータを計算する前述の方法は、周波数領域係数の絶対値に基づいて相関パラメータを計算する方法と置き換えられてもよい。
【0121】
現フレームのマルチチャネル信号は、現フレームの1つまたは複数のサブフレームのマルチチャネル信号であり得ることを理解されたい。同様に、前のフレームのマルチチャネル信号は、前のフレームの1つまたは複数のサブフレームのマルチチャネル信号であり得る。言い換えれば、相関パラメータは、現フレームのすべてのマルチチャネル信号および前のフレームのすべてのマルチチャネル信号に基づいて計算されてもよいし、またはの現フレームの1つまたは複数のサブフレームのマルチチャネル信号および前のフレームの1つまたは複数のサブフレームのマルチチャネル信号に基づいて計算されてもよい。
【0122】
例えば、ターゲットチャネル信号は、左チャネルの時間領域信号と右チャネルの時間領域信号とを含む。各サンプルでの現フレームの左チャネルの時間領域信号および右チャネルの時間領域信号ならびに前のフレームの左チャネルの時間領域信号および右チャネルの時間領域信号の正規化相互相関値は、N個の正規化相互相関値を得るために、以下の式に基づいて計算され得、N個の正規化相互相関値は最大正規化相互相関値について検索される:
【0123】
【数9】
【0124】
ここで、L(n)は左チャネルの時間領域信号を表し、R(n)は右チャネルの時間領域信号を表し、Nは左チャネルの時間領域信号のサンプルの総数であり、Lは、右チャネルの時間領域信号のn番目のサンプルと左チャネルの時間領域信号のn番目のサンプルとの間のオフセットサンプルの数である。
【0125】
いくつかの実施形態では、上記の式で計算された最大正規化相互相関値は、現フレームの相関パラメータとして使用され得る。
【0126】
現フレームのマルチチャネル信号は、現フレームの1つまたは複数のサブフレームのマルチチャネル信号であり得ることを理解されたい。同様に、前のフレームのマルチチャネル信号は、前のフレームの1つまたは複数のサブフレームのマルチチャネル信号であり得る。例えば、サブフレームを単位として、上式に基づいて、複数のサブフレームと1対1に対応する複数の最大正規化相互相関値を計算してもよい。次に、複数の最大正規化相互相関値、複数の最大正規化相互相関値の和、または複数の最大正規化相互相関値の平均値のうちの1つまたは複数が、現フレームの相関パラメータとして使用される。
【0127】
以上は、時間領域信号に基づいて相関パラメータを計算する方法を提供した。以下に、ピッチ周期に基づく相関パラメータの計算方法について詳細に説明する。
【0128】
任意選択で、いくつかの実施形態では、現フレームと前のフレームとの間の相関度は、現フレームのピッチ周期と前のフレームのピッチ周期との間の相関度を使用することによって表すことができる。この場合、相関パラメータは、現フレームのピッチ周期と前のフレームのピッチ周期とに基づいて決定されてもよい。
【0129】
いくつかの実施形態では、現フレームまたは前のフレームのピッチ周期は、現フレームまたは前のフレームの各サブフレームのピッチ周期を含み得る。
【0130】
具体的には、現フレームのピッチ周期または現フレームの各サブフレームのピッチ周期、および前のフレームのピッチ周期または前のフレームの各サブフレームのピッチ周期は、既存のピッチ周期アルゴリズムに基づいて計算され得る。次に、現フレームのピッチ周期と前のフレームの各サブフレームのピッチ周期と間の偏差値、または現フレームの各サブフレームのピッチ周期と前のフレームの各サブフレームのピッチ周期との間の偏差値が計算される。次に、計算したピッチ周期偏差値が現フレームと前のフレームの相関パラメータとして使用され得る。
【0131】
以下に、現フレームのピーク対平均比パラメータについて詳細に説明する。
【0132】
現フレームのピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され得る。
【0133】
例えば、マルチチャネル信号は、左チャネル信号と右チャネル信号とを含む。ピーク対平均比パラメータは、左チャネル信号のピーク対平均比であってもよく、または右チャネル信号のピーク対平均比であってもよく、または左チャネル信号のピーク対平均比と右チャネル信号のピーク対平均比との組み合わせであってもよい。
【0134】
ピーク対平均比パラメータを、複数の方法で計算することができる。例えば、ピーク対平均比パラメータは、周波数領域信号の周波数領域振幅値に基づいて計算され得る。別の例では、ピーク対平均比パラメータは、周波数領域信号の周波数領域係数または周波数領域係数の絶対値に基づいて計算され得る。
【0135】
いくつかの実施形態では、周波数領域信号の周波数領域振幅値は、周波数領域信号のいくつかまたはすべてのサブバンドの周波数領域振幅値であり得る。例えば、周波数領域信号の周波数領域振幅値は、周波数領域信号の低周波数部分におけるサブバンドの周波数領域振幅値であり得る。
【0136】
一例として、左チャネルの周波数領域信号が使用される。左チャネルの周波数領域信号の低周波数部分がM個のサブバンドを含み、各サブバンドがN個の周波数領域振幅値を含むと仮定すると、M個のサブバンドと1対1に対応するM個のピーク対平均比を得るために、各サブバンドのN個の周波数領域振幅値のピーク対平均比を計算することができる。次に、M個のピーク対平均比、M個のピーク対平均比の合計、またはM個のピーク対平均比の平均値が、現フレームのピーク対平均比パラメータとして使用される。各サブバンドのピーク対平均比を計算する過程において、計算の複雑さを減らすために、各サブバンドのN個の周波数領域振幅値の合計に対する各サブバンドの最大周波数領域振幅値の比は、ピーク対平均比として使用され得ることに留意されたい。ピーク対平均比が予め設定された閾値と比較されるとき、最大周波数領域振幅値は、予め設定された閾値と各サブバンドのN個の周波数領域振幅値の合計との積と比較されてもよく、または最大周波数領域振幅値は、予め設定された閾値と各サブバンドのN個の周波数領域振幅値の平均値との積と比較されてもよい。
【0137】
いくつかの実施形態では、現フレームのマルチチャネル信号は、現フレームの1つまたは複数のサブフレームのマルチチャネル信号であり得る。
【0138】
現フレームの特性パラメータは、現フレームの信号対雑音比パラメータをさらに含み得る。以下に、信号対雑音比パラメータについて詳細に説明する。
【0139】
現フレームの信号対雑音比パラメータを使用して、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号の信号対雑音比または信号対雑音比の特徴を表すことができる。
【0140】
現フレームの信号対雑音比パラメータは1つまたは複数のパラメータを含み得ることを理解されたい。特定のパラメータ選択方法は、本出願のこの実施形態において限定されない。例えば、現フレームの信号対雑音比パラメータは、マルチチャネル信号のサブバンド信号対雑音比、修正されたサブバンド信号対雑音比、セグメント信号対雑音比、修正されたセグメント信号対雑音比、フルバンド信号対雑音比、および修正されたフルバンド信号対雑音比、ならびにマルチチャネル信号の信号対雑音比の特徴を表すことができる別のパラメータのうちの少なくとも1つを含み得る。
【0141】
信号対雑音比パラメータを決定する方法は、本出願のこの実施形態において特に限定されないことに留意されたい。
【0142】
例えば、現フレームの信号対雑音比パラメータは、マルチチャネル信号内のすべての信号を使用することによって計算され得る。
【0143】
別の例では、現フレームの信号対雑音比パラメータは、マルチチャネル信号内のいくつかの信号を使用することによって計算され得る。
【0144】
別の例では、現フレームの信号対雑音比パラメータは、マルチチャネル信号内の任意のチャネルの信号を適応的に選択することによって計算され得る。
【0145】
別の例では、最初にマルチチャネル信号を表すデータに対して加重平均を実行して新しい信号を形成し、次に現フレームの信号対雑音比パラメータを新しい信号の信号対雑音比を用いて表すことができる。
【0146】
現フレームの特性パラメータは、現フレームのスペクトル傾斜パラメータをさらに含み得る。以下に、スペクトル傾斜パラメータについて詳細に説明する。
【0147】
現フレームのスペクトル傾斜パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のスペクトル傾斜度またはスペクトルエネルギー変化傾向を表すために使用され得る。より大きなスペクトル傾斜度はより弱い信号発声を示し、より小さなスペクトル傾斜度はより強い信号発声を示すことを理解されたい。
【0148】
以下に、ステップ544において現フレームの特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定する方法を詳細に説明する。
【0149】
任意選択で、いくつかの実施形態では、現フレームの特性パラメータに基づいて、現フレームに対して前のフレームのマルチチャネルパラメータを再利用するかどうかを決定することができる。
【0150】
例えば、特性パラメータが第2の事前設定条件を満たす場合、前のフレームのマルチチャネルパラメータは現フレームについて再利用される。あるいは、特性パラメータが第2の事前設定条件を満たさない場合、現フレームの初期マルチチャネルパラメータが現フレームのマルチチャネルパラメータとして使用される。特性パラメータが第2の事前設定条件を満たさない場合に使用される処理方法は、本出願のこの実施形態において特に限定されないことを理解されたい。例えば、初期マルチチャネルパラメータは他の既存の方法で修正されてもよい。
【0151】
任意選択で、いくつかの実施形態では、現フレームの特性パラメータに基づいて、前のT個のフレームのマルチチャネルパラメータの変化傾向に基づいて現フレームのマルチチャネルパラメータを決定するかどうかを決定することができ、ここで、Tは2以上である。
【0152】
例えば、特性パラメータが第2の事前設定条件を満たす場合、現フレームのマルチチャネルパラメータは、前のT個のフレームのマルチチャネルパラメータの変化傾向に基づいて決定される。あるいは、特性パラメータが第2の事前設定条件を満たさない場合、現フレームの初期マルチチャネルパラメータが現フレームのマルチチャネルパラメータとして使用される。特性パラメータが第2の事前設定条件を満たさない場合に使用される処理方法は、本出願のこの実施形態において特に限定されないことを理解されたい。例えば、初期マルチチャネルパラメータは他の既存の方法で修正されてもよい。
【0153】
第2の事前設定条件は、1つの条件でもよく、または複数の条件の組み合わせでもよいことを理解されたい。さらに、第2の事前設定条件が満たされる場合、決定は他の条件に基づいてさらに実行され得る。すべての条件が満たされると、次のステップが実行される。
【0154】
現フレームの前のT個のフレームは、符号化対象のオーディオ信号のすべてのフレームにおいて現フレームに近接した前のT個のフレームであることを理解されたい。例えば、符号化対象のオーディオ信号が10個のフレームを含み、T=2であり、かつ現フレームが10個のフレームのうち5番目のフレームである場合、現フレームの前のT個のフレームは10個のフレームのうちの3番目のフレームと4番目のフレームになる。
【0155】
現フレームのマルチチャネルパラメータは、前のT個のフレームのマルチチャネルパラメータの変化傾向に基づいて複数の方法で決定され得ることを理解されたい。例えば、マルチチャネルパラメータはITD値である。現フレームのITD値ITD[i]は、以下の方法で計算され得る:
ITD[i]=ITD[i-1]+delta、ここで
delta=ITD[i-1]-ITD[i-2]であり、ITD[i-1]は現フレームの前のフレームのITD値を表し、ITD[i-2]は現フレームの前のフレームの前のフレームのITD値を表す。
【0156】
以下に、上述した第2の事前設定条件について詳細に説明する。
【0157】
第2の事前設定条件を複数の方法で定義することができ、第2の事前設定条件の設定は特性パラメータの選択に関連することを理解されたい。これは、本出願のこの実施形態において特に限定されない。
【0158】
例えば、特性パラメータは相関パラメータおよび/またはピーク対平均比パラメータであり、相関パラメータはサブバンドにおける現フレームのマルチチャネル信号と前のフレームのマルチチャネル信号との相関値の平均値であり、ピーク対平均比パラメータは、サブバンド内の現フレームのマルチチャネル信号のピーク対平均比の平均値である。第2の事前設定条件は、以下の条件のうちの1つまたは複数であり得る:
相関パラメータは第2の閾値よりも大きく、第2の閾値の値の範囲は、例えば0.6~0.95であり得、例えば、第2の閾値は0.85であり得る;
ピーク対平均比パラメータは第3の閾値よりも大きく、第3の閾値の値の範囲は、例えば0.4~0.8であり得、例えば、第3の閾値は0.6であり得る;
相関パラメータは第4の閾値より大きく、サブバンド内の相関値は第5の閾値より大きく、第4の閾値の値の範囲は0.6~0.85であり得、例えば第4の閾値は0.7であり得;第5の閾値の値の範囲は、0.8~0.95であり得、例えば、第5の閾値は、0.9であり得る;
ピーク対平均比パラメータは第6の閾値よりも大きく、サブバンド内のピーク対平均比は第7の閾値よりも大きく、第6の閾値の値の範囲は0.4~0.75であり得、例えば、第6の閾値は0.55であり得、第7の閾値の値の範囲は、0.6~0.9であり得、例えば、第7の閾値は0.7であり得る。
【0159】
第2の閾値は第4の閾値より大きくてもよく、第4の閾値は第5の閾値より小さくてもよく;または、第3の閾値は第6の閾値より大きくてもよく、第6の閾値は第7の閾値より小さくてもよい。
【0160】
なお、特性パラメータがピーク対平均比パラメータを含み、かつ第2の事前設定条件はピーク対平均比パラメータが予め設定された閾値以上であることを含む場合、ピーク対平均比パラメータと予め設定された閾値との間の値関係を決定する必要がある。計算を単純化するために、ピーク対平均比パラメータを予め設定された閾値と比較するプロセスは、ピーク対平均比のピーク値と目標値との間の比較に変換されてもよい。目標値は、予め設定された閾値とピーク対平均比の平均値との積でもよいし、あるいは予め設定された閾値とピーク対平均比を計算するために使用されるパラメータの合計との積でもよい。例えば、ピーク対平均比を計算するために使用されるパラメータはサブバンドの周波数領域振幅値であり、各サブバンドはN個の周波数領域振幅値を含む。ピーク対平均比が予め設定された閾値と比較されるとき、各サブバンドの最大周波数領域振幅値は、予め設定された閾値と各サブバンドのN個の周波数領域振幅値の合計との積と比較され得るか、または、各サブバンドの最大周波数領域振幅値は、予め設定された閾値と各サブバンドのN個の周波数領域振幅値の平均値との積と比較され得る。
【0161】
以下に、図7の例を参照しながら、本出願の実施形態についてさらに詳細に説明する。図7では、主に、現フレームのマルチチャネル信号が、左チャネル信号と右チャネル信号とを含み、マルチチャネルパラメータがITD値である例を用いて説明する。図7の例は、当業者が本出願の実施形態を理解するのを助けることを単に意図するものであり、本出願の実施形態を例として挙げられた特定の値または特定のシナリオに限定することを意図するものではない。明らかに、当業者は、図7に提供された例に基づいて様々な等価の修正または変形を実行することができ、そのような修正または変形もまた本出願の実施形態の範囲内に含まれる。
【0162】
図7は、本出願の一実施形態によるマルチチャネル信号符号化方法の概略フローチャートである。図7に示す処理ステップまたは動作は単なる例であり、他の動作または図7の動作の変形形態を本出願のこの実施形態でさらに実行することができることを理解されたい。さらに、図7のステップは、図7に示すものとは異なるシーケンスで実行されてもよく、図7のいくつかの動作は実行される必要がない場合がある。
【0163】
図7の方法は、以下のステップを含む。
【0164】
710:左チャネルの周波数領域信号および右チャネルの周波数領域信号を得るために、現フレームの左チャネルの時間領域信号および右チャネルの時間領域信号に対して時間周波数変換を実行する。
【0165】
720:ターゲット周波数領域信号を得るために、左チャネルの周波数領域信号および右チャネルの周波数領域信号に対して正規化相互相関演算を実行する。
【0166】
730:ターゲット時間領域信号を取得するために、ターゲット周波数領域信号に対して周波数時間変換を実行する。
【0167】
740:ターゲット時間領域信号に基づいて現フレームの初期ITD値を決定する。
【0168】
ステップ720~740に記載の処理は、以下の式を用いて表すことができる:
【0169】
【数10】
【0170】
ここで、Li(f)は左チャネルの周波数領域信号の周波数領域係数を表し、
【0171】
【数11】
【0172】
は右チャネルの周波数領域信号の周波数領域係数の共役を表し、arg max()は複数の値から最大値を選択することを意味し、IDFT()は逆離散フーリエ変換を表す。
【0173】
750:現フレームのITD値を計算するために、きめ細かいITD制御を実行する。
【0174】
760:現フレームのITD値に基づいて、左チャネルの時間領域信号と右チャネルの時間領域信号に対して位相オフセットを実行する。
【0175】
770:左チャネルの時間領域信号と右チャネルの時間領域信号に対してダウンミックスを実行する。
【0176】
ステップ760および770の実施については、従来技術を参照されたい。詳細はここでは説明しない。
【0177】
ステップ750は、図5のステップ540に対応する。ステップ530で提供された任意の実施例はステップ750に使用されてもよい。以下にいくつかの任意選択の実施例を挙げる。
【0178】
実施例1:
【0179】
ステップ1:現フレームの左チャネルの周波数領域信号の低周波数部分をM個のサブバンドに分割し、各サブバンドはN個の周波数領域振幅値を含む。
【0180】
ステップ2:以下の式に基づいて現フレームと前のフレームとの相関パラメータを計算する。
【0181】
【数12】
【0182】
ここで、|L(i*N+j)|は、現フレームの左チャネルの周波数領域信号の低周波数部分におけるi番目のサブバンドのj番目の周波数領域振幅値を表し、|L(-1)(i*N+j)|は、前のフレームの左チャネルの周波数領域信号の低周波数部分におけるi番目のサブバンドのj番目の周波数領域振幅値を表し、cor(i)は、M個のサブバンドにおけるi番目のサブバンドに対応する正規化相互相関値を表す。
【0183】
現フレームと前のフレームとの相関パラメータは、ステップ2の計算によって得られることを理解されたい。相関パラメータは、各サブバンドの正規化相互相関値でもよいし、サブバンドの正規化相互相関値の平均値でもよい。
【0184】
ステップ3:現フレームの各サブバンドのピーク対平均比を計算する。
【0185】
ステップ2およびステップ3は同時に実行されてもよく、または順次実行されてもよいことを理解されたい。また、各サブバンドの周波数領域振幅値のピーク値と各サブバンドの周波数領域振幅値の平均値との比を用いて、あるいは、各サブバンドの周波数領域振幅値のピーク値とサブバンドの周波数領域振幅値の合計との比を用いて、各サブバンドのピーク対平均比を表すことができる。これにより計算の複雑さを軽減できる。
【0186】
現フレームのマルチチャネル信号のピーク対平均比パラメータはステップ3の計算を通じて取得され得ることを理解されたい。ピーク対平均比パラメータは、各サブバンドのピーク対平均比、サブバンドのピーク対平均比の合計、またはサブバンドのピーク対平均比の平均値であり得る。
【0187】
ステップ4:現フレームの初期ITD値および前のフレームのITD値が第1の事前設定条件を満たす場合、現フレームの相関パラメータおよび/またはピーク対平均比パラメータに基づいて、現フレームについて前のフレームのITD値を再利用するかどうかを決定する。
【0188】
例えば、第1の事前設定条件は次の通りであり得る:
前のフレームのITD値と現フレームの初期ITD値との積が0である;
前のフレームのITD値と現フレームの初期ITD値との積が負である;または
前のフレームのITD値と現フレームの初期ITD値との間の差の絶対値が、目標値の半分よりも大きく、目標値は、その絶対値が前のフレームのITD値と現フレームの初期ITD値とのうちでより大きい方のITD値である。
【0189】
第1の事前設定条件は、1つの条件でもよく、または複数の条件の組み合わせでもよいことに留意されたい。さらに、第1の事前設定条件が満たされる場合、決定は他の条件に基づいてさらに実行され得る。すべての条件が満たされると、次のステップが実行される。
【0190】
現フレームの相関パラメータおよび/またはピーク対平均比パラメータに基づいて、現フレームについて前のフレームのITD値を再利用するかどうかを決定するステップは、具体的には、現フレームの相関パラメータおよび/またはピーク対平均比パラメータが、第2の事前設定条件を満たすかどうかを決定するステップ;および、現フレームの相関パラメータおよび/またはピーク対平均比パラメータが第2の事前設定条件を満たす場合、現フレームについて前のフレームのITD値を再利用するステップであり得る。
【0191】
例えば、第2の事前設定条件は、次の通りであり得る:
サブバンドの正規化相互相関値の平均値が第1の閾値より大きい;
サブバンドのピーク対平均比の平均値が第2の閾値より大きい;
サブバンドの正規化相互相関値の平均値が第3の閾値よりも大きく、サブバンドの正規化相互相関値が第4の閾値よりも大きい;または
サブバンドのピーク対平均比の平均値が第5の閾値より大きく、サブバンドのピーク対平均比が第6の閾値より大きい。
【0192】
第1の閾値が第3の閾値より大きく、第3の閾値は第4の閾値より小さい;または、第2の閾値が第5の閾値よりも大きく、第5の閾値は第6の閾値よりも小さい。
【0193】
第2の事前設定条件は、1つの条件でもよく、または複数の条件の組み合わせでもよいことに留意されたい。さらに、第2の事前設定条件が満たされる場合、決定は他の条件に基づいてさらに実行され得る。すべての条件が満たされると、次のステップが実行される。
【0194】
前述の現フレームの左チャネルの周波数領域信号は、現フレームの1つまたは複数のサブフレームの左チャネルの周波数領域信号であってもよく、前述の前のフレームの左チャネルの周波数領域信号は、前のフレームの1つまたは複数のサブフレームの左チャネルの周波数領域信号であってもよいことに留意されたい。言い換えれば、相関パラメータは、現フレームのパラメータと前のフレームのパラメータとを用いて計算されてもよいし、現フレームの1つまたは複数のサブフレームのパラメータと、前のフレームの1つまたは複数のサブフレームのパラメータとのパラメータとを用いて計算されてもよい。同様に、ピーク対平均比パラメータは、現フレームのパラメータを用いて計算されてもよく、または現フレームの1つまたは複数のサブフレームのパラメータを用いて計算されてもよい。
【0195】
実施例2:
【0196】
実施例2と前述の実施例との違いは、前述の実施例では、現フレームと前のフレームとの相関パラメータは、サブバンドの周波数領域振幅値に基づいて計算されるが、実施例2では、現フレームと前のフレームとの相関パラメータは、サブバンドの周波数領域係数または周波数領域係数の絶対値に基づいて計算されることである。実施例2の具体的な実施プロセスは、前述の実施例の実施プロセスと同様である。詳細はここでは説明しない。
【0197】
実施例3:
【0198】
実施例3と前述の実施例との違いは、前述の実装例では、ピーク対平均比パラメータは、サブバンドの周波数領域振幅値に基づいて計算されるが、実施例3では、ピーク対平均比パラメータは、サブバンドの周波数領域係数の絶対値に基づいて計算されることである。実施例3の具体的な実施プロセスは、前述の実施例の実施プロセスと同様である。詳細はここでは説明しない。
【0199】
実施例4:
【0200】
実施例4と前述の実施例との違いは、前述の実施例では、相関パラメータおよび/またはピーク対平均比パラメータは左チャネルの周波数領域信号に基づいて計算されるが、実施例4では、相関パラメータおよび/またはピーク対平均比パラメータは、右チャネルの周波数領域信号に基づいて計算されることである。実施例4の具体的な実施プロセスは、前述の実施例の実施プロセスと同様である。詳細はここでは説明しない。
【0201】
実施例5:
【0202】
実施例5と前述の実施例との違いは、前述の実施例では、相関パラメータおよび/またはピーク対平均比パラメータは、左チャネルの周波数領域信号または右チャネルの周波数領域信号に基づいて計算されるが、実施例5では、相関パラメータおよび/またはピーク対平均比パラメータは、左チャネルの周波数領域信号および右チャネルの周波数領域信号に基づいて計算されることである。
【0203】
特定の実施中に、相関パラメータおよび/またはピーク対平均比パラメータ群が左チャネルの周波数領域信号に基づいて計算され得、次に相関パラメータおよび/またはピーク対平均比パラメータ群が、右チャネルの周波数領域信号を使用して計算される。次に、2つのパラメータ群のうち大きい方を最終相関パラメータおよび/またはピーク対平均比パラメータとして選択することができる。実施例5の他のプロセスは、前述の実施例のプロセスと同様である。詳細はここでは説明しない。
【0204】
実施例6:
【0205】
実施例6と前述の実施例との違いは、前述の実施例では、相関パラメータは周波数領域信号に基づいて計算されるが、実施例6では、相関パラメータは時間領域信号に基づいて計算されることである。
【0206】
具体的には、現フレームと前のフレームの相関パラメータは、以下の式を用いて計算され得る:
【0207】
【数13】
【0208】
ここで、L(n)は左チャネルの時間領域信号を表し、R(n)は右チャネルの時間領域信号を表し、Nは左チャネルの時間領域信号のサンプルの総数であり、Lは、右チャネル信号のn番目のサンプルと左チャネルのn番目のサンプルとの間のオフセットサンプルの数である。
【0209】
本明細書における左チャネルの時間領域信号および右チャネルの時間領域信号は、現フレームのすべての左チャネル信号および右チャネル信号であってもよく、または現フレームの1つまたは複数のサブフレームの左チャネル信号および右チャネル信号であってもよいことを理解されたい。
【0210】
実施例6の別の実施プロセスは、前述の実施例の実施プロセスと同様である。詳細はここでは説明しない。
【0211】
実施例7:
【0212】
実施例7と前述の実施例との間の違いは、前述の実施例では、現フレームについて前のフレームのITD値を再利用するかどうかを決定する必要があるが、実施例7では、Tは2以上の整数である場合に現フレームの前のT個のフレームのITD値の変化傾向に基づいて現フレームのITD値を推定するかどうかを決定する必要があることである。
【0213】
現フレームのITD値ITD[i]は、以下の方法で計算され得る:
ITD[i]=ITD[i-1]+delta、ここで
delta=ITD[i-1]-ITD[i-2]であり、ITD[i-1]は現フレームの前のフレームのITD値を表し、ITD[i-2]は現フレームの前のフレームの前のフレームのITD値を表す。
【0214】
実施例8:
【0215】
実施例8と前述の実施例との違いは、前述の実施例では、現フレームと前のフレームの相関パラメータは、現フレームと前のフレームの時間/周波数信号に基づいて計算されるが、実施例8では、相関パラメータは、現フレームと前のフレームのピッチ周期に基づいて計算されることである。
【0216】
具体的には、現フレームのピッチ周期および対応する前のフレームのピッチ周期は、既存のピッチ周期アルゴリズムに基づいて計算され得;現フレームのピッチ周期と前のフレームのピッチ周期との間の偏差が計算され;および、現フレームのピッチ周期と前のフレームのピッチ周期との間の偏差は、現フレームと前のフレームとの相関パラメータとして使用される。
【0217】
現フレームのピッチ周期と前のフレームのピッチ周期との間の偏差は、現フレームの全ピッチ周期と前のフレームの全ピッチ周期との間の偏差であってもよく、または現フレームの1つまたは複数のサブフレームのピッチ周期と前のフレームの1つまたは複数のサブフレームのピッチ周期との間の偏差であってもよく、または現フレームのいくつかのサブフレームのピッチ周期と前のフレームのいくつかのサブフレームのピッチ周期との間の偏差の合計であってもよく、または、現フレームのいくつかのサブフレームのピッチ周期と前のフレームのいくつかのサブフレームのピッチ周期との間の偏差の平均値であってもよいことを理解されたい。
【0218】
実施例9:
【0219】
実施例9と前述の実施例との違いは、前述の実施例では、現フレームのITD値は、相関パラメータおよび/またはピーク対平均比パラメータに基づいて決定されるが、実施例9では、現フレームのITD値は、相関パラメータおよび/またはスペクトル傾斜パラメータに基づいて決定されることである。
【0220】
この場合、第2の事前設定条件は、現フレームと前のフレームとの相関パラメータの相関値が閾値よりも大きい、および/またはスペクトル傾斜パラメータのスペクトル傾斜値が閾値よりも小さいことであり得る(より大きなスペクトル傾斜値はより弱い信号発声を示し、より小さなスペクトル傾斜値はより強い信号発声を示すことを理解されたい)。
【0221】
実施例9の他のプロセスは、前述の実施例のプロセスと同様である。詳細はここでは説明しない。
【0222】
実施例10:
【0223】
実施例10と前述の実施例との違いは、前述の実施例では、現フレームのITD値が計算されるが、実施例10では、現フレームのIPD値が計算されることである。ステップ710から770におけるITD値関連の計算プロセスは、IPD値関連のプロセスと取り替えられる必要があることを理解されたい。IPD値の計算方法については、従来技術を参照されたい。詳細はここでは説明しない。
【0224】
実施例10の他のプロセスは、前述の実施例のプロセスとほぼ同様である。詳細はここでは説明しない。
【0225】
前述の10個の実施例は説明のための単なる例であることを理解されたい。実際には、これらの実施例は、新しい実施例を得るために互いに交換または結合され得る。簡潔さのために、例は、本明細書において一つずつ列挙されない。
【0226】
以下に、本出願の装置の実施形態を説明する。装置の実施形態は、前述の方法を実行するために使用され得る。したがって、詳細に説明されていない部分については、前述の方法の実施形態を参照されたい。
【0227】
図8は、本出願の一実施形態によるエンコーダの概略ブロック図である。図8のエンコーダ800は、
現フレームのマルチチャネル信号を取得するように構成された取得ユニット810と、
現フレームの初期マルチチャネルパラメータを決定するように構成された第1の決定ユニット820と、
現フレームの初期マルチチャネルパラメータと現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定するように構成された第2の決定ユニット830であって、差分パラメータは現フレームの初期マルチチャネルパラメータと前のK個のフレームのマルチチャネルパラメータとの間の差を表すために使用され、Kは1以上の整数である、第2の決定ユニット830と、
現フレームの差分パラメータと特性パラメータとに基づいて現フレームのマルチチャネルパラメータを決定するように構成された第3の決定ユニット840と、
現フレームのマルチチャネルパラメータに基づいてマルチチャネル信号を符号化するように構成された符号化ユニット850と
含む。
【0228】
本出願のこの実施形態では、現フレームのマルチチャネルパラメータは、現フレームの特性パラメータ、および現フレームと前のK個のフレームとの間の差を総合的に考慮して決定される。この決定方法はより適切である。現フレームに対して前のフレームのマルチチャネルパラメータを直接再利用する方法と比較して、この方法は、マルチチャネル信号のチャネル間情報の精度をより確実に保証することができる。
【0229】
任意選択で、いくつかの実施形態では、第3の決定ユニット840は、差分パラメータが第1の事前設定条件を満たす場合、現フレームの特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成される。
【0230】
任意選択で、いくつかの実施形態では、差分パラメータは、現フレームの初期マルチチャネルパラメータと現フレームの前のフレームのマルチチャネルパラメータとの間の差の絶対値であり、第1の事前設定条件は、差分パラメータが予め設定された第1の閾値より大きいということである。
【0231】
任意選択で、いくつかの実施形態では、差分パラメータは現フレームの初期マルチチャネルパラメータと現フレームの前のフレームのマルチチャネルパラメータとの積であり、第1の事前設定条件は差分パラメータが0以下であることである。
【0232】
任意選択で、いくつかの実施形態では、第3の決定ユニット840は、現フレームの相関パラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、相関パラメータは現フレームと現フレームの前のフレームとの間の相関度を表すために使用される。
【0233】
任意選択で、いくつかの実施形態では、第3の決定ユニット840は、現フレームのピーク対平均比パラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用される。
【0234】
任意選択で、いくつかの実施形態では、第3の決定ユニット840は、現フレームの相関パラメータおよびピーク対平均比パラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、相関パラメータは現フレームと現フレームの前のフレームとの間の相関度を表すために使用され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用される。
【0235】
任意選択で、いくつかの実施形態では、エンコーダは、
現フレームのマルチチャネル信号内のターゲットチャネル信号と前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて相関パラメータを決定するように構成された第4の決定ユニット
をさらに含む。
【0236】
任意選択で、いくつかの実施形態では、第4の決定ユニットは、現フレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータと、前のフレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータとに基づいて相関パラメータを決定するように特に構成され、周波数領域パラメータは、ターゲットチャネル信号の周波数領域振幅値および周波数領域係数のうちの少なくとも一方である。
【0237】
任意選択で、いくつかの実施形態では、エンコーダは、
現フレームのピッチ周期と前のフレームのピッチ周期とに基づいて相関パラメータを決定するように構成された第5の決定ユニット
をさらに含む。
【0238】
任意選択で、いくつかの実施形態では、第3の決定ユニット840は、特性パラメータが第2の事前設定条件を満たす場合、現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、Tは1以上の整数である。
【0239】
任意選択で、いくつかの実施形態では、第3の決定ユニット840は、前のT個のフレームのマルチチャネルパラメータを現フレームのマルチチャネルパラメータとして決定するように特に構成され、Tは1に等しい。
【0240】
任意選択で、いくつかの実施形態では、第3の決定ユニット840は、前のT個のフレームのマルチチャネルパラメータの変化傾向に基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、Tは2以上である。
【0241】
任意選択で、いくつかの実施形態では、特性パラメータは、現フレームの相関パラメータおよび/またはピーク対平均比パラメータを含み、相関パラメータは現フレームと現フレームの前のフレームとの間の相関度を表すために使用され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、第2の事前設定条件は、特性パラメータが予め設定された閾値より大きいことである。
【0242】
任意選択で、いくつかの実施形態では、現フレームの初期マルチチャネルパラメータは、現フレームの初期チャネル間コヒーレンスIC値、現フレームの初期チャネル時間差ITD値、現フレームの初期チャネル間位相差IPD値、現フレームの初期全体位相差OPD値、および現フレームの初期チャネル間レベル差ILD値、のうちの少なくとも1つを含む。
【0243】
任意選択で、いくつかの実施形態では、現フレームの特性パラメータは、現フレームのパラメータ、すなわち、相関パラメータ、ピーク対平均比パラメータ、信号対雑音比パラメータ、およびスペクトル傾斜パラメータ、のうちの少なくとも1つを含み、相関パラメータは、現フレームと前のフレームとの間の相関度を表すために使用され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、信号対雑音比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号の信号対雑音比を表すために使用され、スペクトル傾斜パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のスペクトル傾斜度を表すために使用される。
【0244】
図9は、本出願の一実施形態によるエンコーダの概略ブロック図である。図9のエンコーダ900は、
プログラムを格納するように構成されたメモリ910と
プログラムを実行するように構成されたプロセッサ920と
を含む。プログラムが実行されると、プロセッサ920は、現フレームのマルチチャネル信号を取得し;現フレームの初期マルチチャネルパラメータを決定し;現フレームの初期マルチチャネルパラメータと現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定し、差分パラメータは現フレームの初期マルチチャネルパラメータと前のK個のフレームのマルチチャネルパラメータとの間の差を表すために使用され、Kは1以上の整数であり;現フレームの差分パラメータおよび特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定し;現フレームのマルチチャネルパラメータに基づいてマルチチャネル信号を符号化する、ように構成される。
【0245】
本出願のこの実施形態では、現フレームのマルチチャネルパラメータは、現フレームの特性パラメータ、および現フレームと前のK個のフレームとの間の差を総合的に考慮して決定される。この決定方法はより適切である。現フレームに対して前のフレームのマルチチャネルパラメータを直接再利用する方法と比較して、この方法は、マルチチャネル信号のチャネル間情報の精度をより確実に保証することができる。
【0246】
任意選択で、いくつかの実施形態では、プロセッサ920は、差分パラメータが第1の事前設定条件を満たす場合、現フレームの特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成される。
【0247】
任意選択で、いくつかの実施形態では、差分パラメータは、現フレームの初期マルチチャネルパラメータと現フレームの前のフレームのマルチチャネルパラメータとの間の差の絶対値であり、第1の事前設定条件は、差分パラメータが予め設定された第1の閾値より大きいということである。
【0248】
任意選択で、いくつかの実施形態では、差分パラメータは現フレームの初期マルチチャネルパラメータと現フレームの前のフレームのマルチチャネルパラメータとの積であり、第1の事前設定条件は差分パラメータが0以下であることである。
【0249】
任意選択で、いくつかの実施形態では、プロセッサ920は、現フレームの相関パラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、相関パラメータは現フレームと現フレームの前のフレームとの間の相関度を表すために使用される。
【0250】
任意選択で、いくつかの実施形態では、プロセッサ920は、現フレームのピーク対平均比パラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用される。
【0251】
任意選択で、いくつかの実施形態では、プロセッサ920は、現フレームの相関パラメータおよびピーク対平均比パラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、相関パラメータは現フレームと現フレームの前のフレームとの間の相関度を表すために使用され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用される。
【0252】
任意選択で、いくつかの実施形態では、プロセッサ920は、現フレームのマルチチャネル信号内のターゲットチャネル信号と前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて相関パラメータを決定するようにさらに構成される。
【0253】
任意選択で、いくつかの実施形態では、プロセッサ920は、現フレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータと、前のフレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータとに基づいて相関パラメータを決定するように特に構成され、周波数領域パラメータは、ターゲットチャネル信号の周波数領域振幅値である。
【0254】
任意選択で、いくつかの実施形態では、プロセッサ920は、現フレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータと、前のフレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータとに基づいて相関パラメータを決定するように特に構成され、周波数領域パラメータは、ターゲットチャネル信号の周波数領域係数である。
【0255】
任意選択で、いくつかの実施形態では、プロセッサ920は、現フレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータと、前のフレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータとに基づいて相関パラメータを決定するように特に構成され、周波数領域パラメータは、ターゲットチャネル信号の周波数領域振幅値および周波数領域係数である。
【0256】
任意選択で、いくつかの実施形態では、プロセッサ920は、現フレームのピッチ周期および前のフレームのピッチ周期に基づいて相関パラメータを決定するようにさらに構成される。
【0257】
任意選択で、いくつかの実施形態では、プロセッサ920は、特性パラメータが第2の事前設定条件を満たす場合、現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、Tは1以上の整数である。
【0258】
任意選択で、いくつかの実施形態では、プロセッサ920は、前のT個のフレームのマルチチャネルパラメータを現フレームのマルチチャネルパラメータとして決定するように特に構成され、Tは1に等しい。
【0259】
任意選択で、いくつかの実施形態では、プロセッサ920は、前のT個のフレームのマルチチャネルパラメータの変化傾向に基づいて現フレームのマルチチャネルパラメータを決定するように特に構成され、Tは2以上である。
【0260】
任意選択で、いくつかの実施形態では、特性パラメータは、現フレームの相関パラメータおよび/またはピーク対平均比パラメータを含み、相関パラメータは現フレームと現フレームの前のフレームとの間の相関度を表すために使用され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、第2の事前設定条件は、特性パラメータが予め設定された閾値より大きいことである。
【0261】
任意選択で、いくつかの実施形態では、現フレームの初期マルチチャネルパラメータは、現フレームの初期チャネル間コヒーレンスIC値、現フレームの初期チャネル時間差ITD値、現フレームの初期チャネル間位相差IPD値、現フレームの初期全体位相差OPD値、および現フレームの初期チャネル間レベル差ILD値、のうちの少なくとも1つを含む。
【0262】
任意選択で、いくつかの実施形態では、現フレームの特性パラメータは、現フレームのパラメータ、すなわち、相関パラメータ、ピーク対平均比パラメータ、信号対雑音比パラメータ、およびスペクトル傾斜パラメータ、のうちの少なくとも1つを含み、相関パラメータは、現フレームと前のフレームとの間の相関度を表すために使用され、ピーク対平均比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、信号対雑音比パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号の信号対雑音比を表すために使用され、スペクトル傾斜パラメータは、現フレームのマルチチャネル信号における少なくとも1つのチャネルの信号のスペクトル傾斜度を表すために使用される。
【0263】
本明細書における用語「および/または」は、3つの関係が存在し得ることを示している。例えば、Aおよび/またはBは、3つの場合、すなわちAが単独で存在する場合、AとBの両方が存在する場合、そしてBが単独で存在する場合を示すことができる。さらに、本明細書中の文字「/」は通常、関連するオブジェクトが「または」の関係にあることを示している。
【0264】
当業者であれば、本明細書で開示された実施形態で説明した例を参照して、ユニットやアルゴリズムステップが、電子ハードウェア、またはコンピュータソフトウェアと電子ハードウェアの組み合わせによって実施され得ることを認識することができる。機能がハードウェアまたはソフトウェアによって実行されるかどうかは、特定のアプリケーションおよび技術的解決策の設計制約に依存している。当業者は、特定の各アプリケーションのために説明した機能を実装するために異なる方法を使用することができるが、実装が本出願の範囲外であると考えられるべきではない。
【0265】
前述のシステム、装置、およびユニットの詳細な作動プロセスのための、簡便な説明の目的で、前述の方法の実施形態に対応するプロセスが参照され得ることは、当業者であれば明確に理解することができ、詳細はここでは再度説明しない。
【0266】
本出願で提供されるいくつかの実施形態では、開示されたシステム、装置、および方法は、他の態様で実現されてもよいことが理解されるべきである。例えば、説明した装置の実施形態は単なる例に過ぎない。例えば、ユニットの部分は単に論理機能の部分であり、実際の実装中は他の部分であってもよい。例えば、複数のユニットまたはコンポーネントが組み合わされてもよく、または別のシステムに統合されてもよく、あるいは、一部の機能が無視されて、実行されなくてもよい。また、表示されたまたは議論された相互結合または直接的な結合もしくは通信接続は、いくつかのインタフェースを使用することによって実現されてもよい。装置またはユニット間の間接的な結合または通信接続は、電気的に、機械的に、または他の形式で実現されてもよい。
【0267】
別々の部分として記載されたユニットは、物理的に分離されていてもいなくてもよく、ユニットとして表示された部分は、物理的なユニットであってもなくてもよく、言い換えれば、1つの位置に配置されていてもよく、または複数のネットワークユニットに分散されていてもよい。ユニットの一部またはすべては、本実施形態の解決策の目的を達成するために実際のニーズに基づいて選択されてもよい。
【0268】
また、本出願の実施形態における機能ユニットは、1つの処理ユニットに組み込まれてもよく、または各ユニットは、単独で、物理的に存在してもよく、または2つ以上のユニットが1つのユニットに統合されてもよい。
【0269】
機能が、ソフトウェア機能ユニットの形態で実装され、独立した製品として販売または使用される場合、機能は、コンピュータ読み取り可能な記憶媒体に格納され得る。このような理解に基づいて、基本的に本出願の技術的解決策、または従来技術に寄与する部分、または技術的解決策のいくつかは、ソフトウェア製品の形態で実現され得る。コンピュータソフトウェア製品は、記憶媒体に格納され、本出願の実施形態に記載の方法のステップのすべてまたは一部を実行するために、コンピュータデバイス(パーソナルコンピュータ、サーバ、またはネットワークデバイスなどであってもよい)を指示するためのいくつかの命令を含む。記憶媒体は、例えば、USBフラッシュドライブ、リムーバブルハードディスク、読み取り専用メモリ(ROM、Read-Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、磁気ディスク、または光ディスクなどの、プログラムコードを格納することができる任意の媒体を含む。
【0270】
前述の説明は、本出願の単なる特定の実装形態であり、本出願の保護範囲を限定することを意図されていない。本出願で開示された技術的範囲内で当業者が容易に考え出す任意の変化または置換は、本出願の保護範囲内に入るものとする。したがって、本出願の保護範囲は、特許請求の範囲の保護範囲に従うものとする。
【符号の説明】
【0271】
800 エンコーダ
810 取得ユニット
820 第1の決定ユニット
830 第2の決定ユニット
840 第3の決定ユニット
850 符号化ユニット
900 エンコーダ
910 メモリ
920 プロセッサ
図1
図2
図3
図4
図5
図6
図7
図8
図9