(58)【調査した分野】(Int.Cl.,DB名)
種々の符号化モードが種々のチャネルに対して選定可能である、マルチチャネルオーディオ信号符号化のための符号化モードの選択を支援するための方法であって、前記方法は、オーディオエンコーダにおいて行われ、
複数のオーディオ信号チャネルを取得することと、
前記取得された複数のオーディオ信号チャネルに対して異なる符号化モードが選択されることによる、アンマスキング効果を含む不要な効果のリスクのために、前記符号化モードの選択の調整が必要とされるかどうかを判断することと、
前記調整が必要とされる場合に、同一のコーデックモード、または同様の歪み特性を有するコーデックモードが、前記取得された複数のオーディオ信号チャネルの全てに対して選択されるように、前記複数の取得されたチャネルに対する前記符号化モードの選択を調整することと、を含み、
前記調整は、前記取得されたチャネルのうちの1つに対して、または前記取得されたチャネルのグループに対して選択された符号化モードに基づく、方法。
前記オーディオ信号を分類するための前記命令は、前記プロセッサによって実行されると、前記装置に、前記取得されたオーディオチャネルのうちのいずれが調整を必要とするのかを判断させる命令を含む、請求項7から9のいずれか一項に記載の装置。
オーディオ用の符号化モードの選択を支援するためのコンピュータプログラムであって、前記コンピュータプログラムは、コンピュータプログラムコードを含み、前記コンピュータプログラムコードは、装置上で実行されると、前記装置に、
複数のオーディオ信号チャネルを取得させ、
前記取得された複数のオーディオ信号チャネルに対して異なる符号化モードが選択されることによる、アンマスキング効果を含む不要な効果のリスクのために、前記符号化モードの選択の調整が必要とされるかどうかを判断させ、
前記調整が必要とされる場合に、同一のコーデックモード、または同様の歪み特性を有するコーデックモードが、前記取得された複数のオーディオ信号チャネルの全てに対して選択されるように、前記複数の取得されたチャネルのための前記符号化モードの選択を調整させ、前記調整は、前記取得されたチャネルのうちの1つに対して、または前記取得されたチャネルのグループに対して選択された符号化モードに基づく、コンピュータプログラム。
【背景技術】
【0002】
セルラー通信ネットワークは、より高いデータレート、容量の改善、およびカバレッジの改善に向かって進化している。第3世代パートナーシッププロジェクト(3GPP)標準化団体において、いくつかの技術が開発されてきており、現在も開発されている。
【0003】
LTE(Long Term Evolution)は、標準化技術の一例である。LTEでは、ダウンリンクには、OFDM(直交周波数分割多重)に基づくアクセス技術が使用され、アップリングには、シングルキャリアFDMA(SC−FDMA)が使用される。ダウンリンクおよびアップリング両方に対する、ユーザ機器(UE)としても知られるワイヤレス端末へのリソース割り当ては、一般的に、高速スケジューリングを使用して、それぞれのワイヤレス端末の瞬間的なトラフィックパターンおよび電波伝播特性を考慮に入れて、適応的に行われる。LTE上の1つのタイプのデータは、例えば、音声による会話またはストリーミングオーディオ用のオーディオデータである。
【0004】
低ビットレートスピーチおよびオーディオコード化の性能を改善するために、信号特性についてのアプリオリ知識を活用し、信号モデル化を用いることが知られている。より多くの複素信号によって、いくつかのコード化モデル、またはコード化モードが、種々の信号タイプおよび信号の種々の部分に使用されてよい。どの時点においても適切なコード化モードを選択することは有益である。
【0005】
ステレオ信号またはマルチチャネル信号が送信されるが、利用可能なまたは好ましいコーデックが専用ステレオモードを含まないシステムでは、当面のコーデックの別個のインスタンスによって、信号のそれぞれのチャネルを符号化し、送信することができる。これは、例えば、ステレオのケースにおいて2つのチャネルがある場合、コーデックは、左チャネルに対して一度実行され、右チャネルに対して一度実行されることを意味する。別個のインスタンスは、左および右チャネル符号化の結合がないことを意味する。「異なるインスタンス」による符号化は、並列であってよく、例えば、好ましいケースでは、同時に行われ得るが、代替的には直列であってよい。ステレオのケースについて、左/右表現および中央/サイド表現は、ステレオ信号の2つのチャネルと考えられ得る。同様に、マルチチャネルのケースについて、チャネルは、レンダリングされ、またはキャプチャされる際に異なる手法でコード化に対して表現可能である。受信側での復号信号の時間整合時に、このチャネルは、ステレオまたはマルチチャネル信号をレンダリングするまたは再構成するために使用可能である。ステレオのケースについて、これは、デュアルモノコード化と呼ばれることが多い。
【0006】
典型的な状況では、それぞれのマイクロフォンは、符号化され、かつ、復号後、1つのスピーカによって展開される1つのチャネルを表すことができる。しかしながら、マイクロフォン信号の種々の組み合わせに基づいて仮想入力チャネルを生成することも可能である。例えば、ステレオのケースにおいて、中央/サイド表現が左/右表現の代わりに選定される場合が多い。最も簡易なケースでは、中央信号は、左および右チャネル信号を追加することによって生成されるが、サイド信号は、差を取ることによって取得される。逆に言えば、デコーダにおいて、再び、例えば、中央/サイド表現から左/右表現までの同様の再マッピングがあり得る。(例えば、一定の倍率を除いて)左信号は、中央信号およびサイド信号を追加することによって取得されてよく、右信号は、これらの信号を取り去ることによって取得されてよい。一般に、コード化されるM仮想入力チャネルへの、かつ、デコーダからKスピーカまで受信されたM仮想出力チャネルからの、Nマイクロフォン信号の対応するマッピングがある場合がある。これらのマッピングは、マッピングのそれぞれの入力信号の一次結合によって取得されてよく、このマッピングは、入力信号とマッピングマトリクスとの乗算によって数学的に定式化されることが可能である。
【0007】
最近開発された多くのコーデックは、例えば、符号化/復号される信号の特性に基づいて選択可能である複数の種々のコード化モードを含む。最良の符号化/復号モードを選択するために、エンコーダおよび/またはデコーダは、閉ループ式とも呼ばれる合成による解析における全ての利用可能なモードを試すことができる、または、開ループ決定とも呼ばれる信号解析に基づいてコード化モードの決定を行う信号分類器に頼ることができる。種々の選択可能なコード化モードを含むコーデックの例は、ACELP(スピーチ)符号化方式またはモード、および、MDCT(音楽)符号化方式またはモードの両方を包含するコーデックとすることができる。さらに、主コード化モードの重要な例は、コンフォートノイズ生成による、間欠送信(DTX)手法に対するアクティブ信号コード化である。そのケースについて、典型的には、音声活動検出器または信号活動検出器は、これらのコード化モードのうちの1つを選択するために使用される。さらに、検出されたオーディオ帯域幅に応じて、コード化モードが選定可能である。例えば、入力オーディオ帯域幅が狭帯域のみである(4khzを上回る信号エネルギーがない)場合、信号が、例えば、広帯域(最高8kHzまでの信号エネルギー)、超広帯域(最高16khzまでの信号エネルギー)、または全帯域(全可聴スペクトルに対するエネルギー)である場合と比較して、狭帯域コード化モードが選定可能である。種々のコード化モードのさらなる例は、符号化に対して使用されるビットレートに関連している。レートセレクタは、オーディオ入力信号または送信ネットワークの要件のどちらかに基づいて符号化するために種々のビットレートを選択することができる。
【0008】
次に、多くの場合、主コード化手法は、例えば信号分類器に基づいて選択可能でもある複数の副次的手法を含む。このような副次的手法の例は、(主な手法がMDCTコード化およびACELPコード化であるとき)例えば、ノイズ状信号のMDCTコード化、および高調波信号のMDCTコード化、ならびに/または、種々のACELP励起表現とすることができる。
【0009】
オーディオ信号分類に関して、スピーチ信号に対する典型的な信号クラスは、有声発話および無声発話である。一般的なオーディオ信号については、スピーチ、音楽、および、場合によっては背景ノイズ信号との間で区別することが一般的である。
【発明を実施するための形態】
【0015】
開示された主題は、さまざまな実施形態を参照して後述される。これらの実施形態は、教示する例として提示されており、開示される主題を限定するものとして解釈されるべきではない。
【0016】
ステレオ信号の2つのチャネルに対して別個に、または、マルチチャネル信号の種々のチャネルに対して別個に、複数のコード化方式またはモードによるコーデックを使用する場合、種々のコーデックモードが、種々のチャネルに対して選定可能である。これは、コーデックの種々のインスタンスのモード決定が独立していることに起因する。種々のコード化モードが信号の異なるチャネルに対して選択可能である場合の1つのシナリオ例は、例えば、ABマイクロフォンによってキャプチャされるステレオ信号であり、この場合、1つのチャネルは話者によって独占されるが、他のチャネルは背景音楽によって独占される。このような状況では、例えば、ACELPおよびMDCTコード化モードの両方を含むコーデックは、スピーチによって独占される1つのチャネルに対してACELPモードを、および、音楽によって独占される他のチャネルに対してMDCTモードを選定する可能性が高い。2つのコード化方式から生じるコード化歪みのシグネチャまたは特性はかなり異なっている可能性がある。1つのケースでは、例えば、コード化歪みのシグネチャは、ノイズ状である場合があり、異なるコード化モードによって引き起こされる別のシグネチャは、時にはMDCTコード化モードに対して観測されることがあるプリエコー歪みである場合がある。このような種々の歪みシグネチャによる信号のレンダリングは、アンマスキング効果につながる可能性がある。すなわち、1つの信号のみがリスナーに対して提示されるときには合理的に良好にマスクされる歪みが、それぞれの異なる歪み特性を有する2つの信号が、リスナーに対して、例えば、左耳および右耳それぞれに対して同時に提示されるときには、明確になり、または不快なものになる。
【0017】
提案された解決策の一実施形態によると、ステレオまたはマルチチャネル信号を符号化するために使用されるコーデックの種々のインスタンスのモード決定は、調整される。調整は、典型的には、モード決定が一致させられることを意味する場合があるが、このようなモードは(異なっていても)コード化歪みおよびアンマスキング効果が最小化されるように選択されることも意味する場合がある。コーデックの種々のインスタンスにおけるマルチチャネル信号の種々のチャネルの符号化のための、コーデックモード、および、場合によってはコーデックサブモードの選択は、例えば、同じコーデックモードが全てのチャネルに対して選択されるように、または、少なくとも、同様の歪み特性を有する関連のコーデックモードがマルチチャネル信号の全てのチャネルに対してコーデックインスタンスによって選択されるように、一致させられてよい。マルチチャネル信号の種々のチャネルに対するコーデックモードの選択を一致させることまたは調整することによって、コード化アーティファクトのシグネチャまたは特性は、全てのチャネルに対して同様となる。よって、マルチチャネル信号を再構成し、それらを展開する場合、アンマスキング効果はないか、または少なくともアンマスキングは低減されることになる。解決策の実施形態は、モード決定の一致が必要であるか否かを判断するまたは測定する決定アルゴリズムを含むことができる。例えば、かかるアルゴリズムは、上述されるようなアンマスキング効果が当面のマルチチャネル信号の種々のチャネルに対して現れる可能性があるまたは現れることになるかどうかの予測を与えることができる。このようなアルゴリズムを適用する場合、コーデックの種々のインスタンスにおけるモード決定の一致または調整は、例えば、これが必要であるおよび/または有利であると決定アルゴリズムが判定または指示するときのみに、選択的にアクティブにされてよい。
【0018】
本明細書に説明される一致されたまたは調整されたモード決定に関連している一実施形態を適用することによって、ステレオまたはマルチチャネル信号の種々のチャネルにおいてコード化歪みシグネチャを逸脱させることは、回避、または少なくとも軽減可能である。これによって、信号の音質および空間表現が改善されることになり、このことは有利である。さらに、解決策の実施形態は、例えば、コーデックの全てのインスタンスに対して、1つのモード決定のみが採用される必要があるとき、計算複雑性の節減を可能にする。
【0019】
例示のネットワークコンテキストは、
図1に示され、これは、本明細書に提示される実施形態が適用可能であるワイヤレスネットワーク8を示す図である。ワイヤレスネットワーク8は、コアネットワーク3、および、ここでは、eNodeBまたはeNBとしても知られるエボルブドノードBの形態の1つまたは複数の無線アクセスノード1を含む。無線基地局1は、ノードB、BTS(携帯電話基地局)および/またはBSS(基地局サブシステム)などの形態とすることもできる。無線基地局1は、複数のワイヤレスデバイス2に対する無線接続性をもたらす。ワイヤレスデバイスという用語は、UEなどの、ワイヤレス通信デバイスまたは無線通信デバイスとしても知られる。このデバイスは、例えば、携帯端末、ワイヤレス端末、移動局、携帯電話、セルラー電話、スマートフォン、および/またはターゲットデバイスとしても知られている。種々のワイヤレスデバイスのさらなる例は、いくつか挙げると、無線能力を有するラップトップ、ラップトップ組み込み機器(LEE)、ラップトップ搭載機器(LME)、USBドングル、宅内機器(CPE)、モデム、携帯情報端末(PDA)、または、ワイヤレス能力を有するサーフプレートと呼ばれるときもあるタブレットコンピュータ、もしくは単に、タブレット、マシンツーマシン(M2M)対応デバイスまたはUE、デバイスツーデバイス(D2D)UEもしくはワイヤレスデバイス、プリンタまたはファイル格納デバイスなど、ワイヤレスインターフェースを装備したデバイス、センサ、例えば、UEを装備したセンサなど、マシン型通信(MTC)デバイスを含む。
【0020】
ワイヤレスネットワーク8は、以降で説明される原理が適用可能である限りは、例えば、LTE(Long−Term Evolution)、W−CDMA(広帯域符号分割多重送信方式)、EDGE(拡張データ速度用GSM(汎欧州デジタル移動通信システム)エボリューション)、GPRS(汎用パケット無線サービス)、CDMA2000(符号分割多重アクセス2000)、または、LTE−Advancedなどの任意の他の現在のもしくは将来のワイヤレスネットワークの任意の1つまたはこれらの組み合わせに準拠することができる。
【0021】
ワイヤレス端末2と無線基地局1との間の、ワイヤレス端末2からのアップリンク(UL)4a通信およびワイヤレス端末2へのダウンリンク(DL)4b通信は、ワイヤレス無線インターフェース上で行われる。それぞれのワイヤレス端末2へのワイヤレス無線インターフェースの品質は、フェージング、多重伝搬、干渉といった影響によって、時間と共に、およびワイヤレス端末2の位置に応じて変化する可能性がある。
【0022】
無線基地局1はまた、中心的機能、および、公衆交換電話網(PSTN)および/またはインターネットといった外部ネットワーク7に対する接続性のためにコアネットワーク3に接続される。
【0023】
マルチチャネル信号などのオーディオデータは、例えば、ワイヤレス端末2、および、オーディオのトランスコーディングを行うために配置されるネットワークノードであるトランスコーディングノード5によって、符号化および復号可能である。トランスコーディングノード5は、例えば、MGW(メディアゲートウェイ)、SBG(セッションボーダーゲートウェイ)/BGF(ボーダーゲートウェイ機能)、または、MRFP(メディアリソース機能プロセッサ)において実装可能である。よって、ワイヤレス端末2およびトランスコーディングノード5は両方共、それぞれオーディオエンコーダおよびデコーダを含むホストデバイスである。明らかに、本明細書に開示される解決策は、マルチチャネルオーディオ信号を符号化することが所望される場合、任意のデバイスまたはノードにおいて適用されてよい。
【0024】
本明細書に説明される解決策は、少なくとも、マルチチャネルまたはステレオ信号がチャネルごとの同じコーデックの1つのインスタンスで符号化される場合の、および、インスタンスのそれぞれが、例えばMDCTおよびACELPコード化に関連している複数の種々の動作モードから選択する場合のシステムに関係する。
図2および
図3は、解決策の実施形態を適用することが有益であると思われるかかるシステムの一例を示す。
図2は、各入力オーディオチャネルがコーデックの1つのインスタンスによって別個に符号化される場合の先行技術の状況を示す。
図3は、主モードおよびサブモードを含む多数の選択可能なコード化モードによるコーデックのインスタンスの一例を示す。種々のモードは信号特性に応じて選択可能であり、種々のモード決定アルゴリズムが、正確なモードを選択するために仮定できる。
【0025】
図4および
図5は、提案された解決策の実施形態を示す。
図4において、外部(すなわち、インスタンスの外部)のモード決定アルゴリズムは、コーデックインスタンス全てのモード選択を制御する。別の実施形態またはシナリオでは、外部のモード決定アルゴリズムは、一致/調整されるべきチャネルのセットを検出するまたは特定することができる。このことが有意義である可能性がある1つの例は、種々の音源信号によって独占されるチャネルのグループがあるときである。また、外部モード決定ユニットにおいてモード決定のサブセットのみを行うこと、およびサブモードのいくつかに対してローカルに決定することが可能である。例えば、
図3において示されるものと同様のいくつかのエンティティを含むコーデックまたは配置構成において、主モード決定は一致/調整可能であるが、サブモード決定はローカルに行われる可能性がある。
図5では、コーデックインスタンスのうちの1つからの(内部の)モード決定アルゴリズムを使用して、コーデックインスタンス全てを制御し、外部ユニットは、マスタコーデックインスタンス、すなわち、そのモード決定を他のコーデックインスタンスに対して課すべきであるコーデックインスタンスを選択する。
【0026】
図3〜
図5の決定ブロックに対する入力は、全てのチャネル信号またはこのサブセットである。この決定は、例えば、信号エネルギー、または、信号の知覚複雑度、または符号化がどのように要求されることになるかの尺度とすることができる知覚エントロピーといった他のより精巧な基準に基づいて、1つまたはいくつかの支配的チャネルを特定することを伴う場合がある。決定はまた、入力チャネル信号のある特定の組み合わせに基づくことができる。1つの可能性は、ある特定のチャネルを使用して、(例えば、背景ノイズフロアを補償する)他のチャネルにおける信号成分を補償すること、および、前記補償後のかかるチャネルが決定のために使用されることになることである。
【0027】
マスタ決定がコーデックインスタンスの外部にある場合の、
図4による実施形態に関して、1つの特殊な実施形態として、コーデックの単一のインスタンスのみが使用される場合も含むことが重要であり、これによって、単一(モノ)チャネル信号のみの符号化を可能にする。その特定の実施形態において、補足のステレオまたはマルチチャネルコード化情報が、生成され、別個のステレオまたはマルチチャネルコーデックインスタンスによって伝達されてよく、これは、例えば、ステレオまたはマルチチャネルコード化がパラメータに関する場合に当てはまり得る。この実施形態では、単一モノコーデックのモード決定が外部モード決定ブロックによって置き換えられ/制御され得ることは重要である。
【0028】
解決策の少なくともいくつかの実施形態によると、1つのエンコーダインスタンスのコーデックまたはエンコーダモード決定は、例えば並列の同じコーデックのいくつかのインスタンスを使用して、ステレオまたは他のマルチチャネル信号を符号化する状況において他のエンコーダインスタンスに適用される、または課せられる。
【0029】
図6〜
図7のさらなる実施形態
以下に、例えば、マルチチャネルオーディオ信号、例えばステレオ信号の符号化をサポートするための方法に関連している実施形態について、
図6を参照して説明する。方法は、複数のインスタンスを含み、それぞれのインスタンス内に、ACELPおよびMDCTコード化などの複数の種々の選択可能なコード化モードを含むコーデックまたはエンコーダによって行われるものである。代替的には、この方法は、それぞれが複数の選択可能なコード化モードを含む複数のコーデックまたはエンコーダを含むコーデック配置とすることができる。エンコーダまたはコーデックは、オーディオコード化のための1つまたは複数の標準に従うように構成されてよい。
図6に示される方法は、オーディオ信号の多重チャネルを取得すること601を含む。この取得することは、例えば、マイクロフォンまたは何らかの他のエンティティからオーディオ信号チャネルを受信すること、またはこれらのチャネルをストレージから取り出すことを含むことが可能である。オーディオ信号は、ステレオ信号とすることができる、または2つ以上のチャネルを含むことができる。マルチチャネルオーディオ信号は、本明細書において全般的に意味するものとして、2つ以上のチャネル、すなわち少なくとも2つのチャネルを含むオーディオ信号である。種々の取得されたチャネルは、エンコーダの別個のインスタンス(または、専門用語および/または実装形態に応じて、別個のエンコーダ)に提供される。方法は、1つまたは多数のチャネルに基づいて符号化モードを選択すること602をさらに含む。この場合、選択された符号化モードは、少なくとも複数の取得された多重チャネルを符号化するために、すなわち、選択される符号化モードに基づく1つのチャネルに対してだけでなく、使用されるものとする。方法は、複数の取得されたチャネル、例えば、チャネルの全てまたはサブセットに対して選択されたコード化モードを適用すること603をさらに含む。これは、代替的には、方法が、多重チャネルのうちの1つに対して選択された符号化モードを、取得された多重チャネルの符号化に課することを含むとして説明可能である、および/または実装可能である。代替的には、このことは、エンコーダインスタンスのうちの1つによって、取得されたチャネルのうちの1つに対して選択された符号化モードに基づいて、複数のエンコーダインスタンスの符号化モード選択を制御することとして説明できる。チャネルのうちの1つに基づいて(またはこれに対して)なされる符号化モード選択に基づいてマルチチャネルオーディオ信号の多重チャネルを符号化するような一実施形態について、代替的には説明可能である。
【0030】
ここで、
図7を参照して、より綿密な方法の実施形態について説明する。
図7に示される方法は、オーディオ信号の多重チャネルを取得することを含む。
【0031】
チャネルは、既に述べたように、符号化するために対応するエンコーダインスタンスに与えられるものとする。方法は、前述されるように、例えば、種々のチャネルに対する種々の符号化モードの選択によって、取得された多重チャネルに対するアンマスキング効果または他の不要な効果のリスクがあるかどうかを判断すること702をさらに含む。多重チャネルを符号化する複数のインスタンスの符号化モード選択を調整する必要があるかどうかを判断するようなアクション702が、代替的には説明可能である。この判断することは、例えば、種々のチャネルが、音楽またはスピーチといった種々のオーディオ信号タイプに属するまたはこれらに独占されるかどうかを判断することを伴う可能性があり、この場合、種々のタイプが典型的には種々の符号化モードの選択をもたらすことになる。例えば、符号化モード選択を分化することによる、不要な効果またはアーティファクトのリスクまたは見込みがない場合、種々のエンティティに対する符号化モード選択の調整の必要性はなく、符号化手順は正規の手順に従って続行することができる。しかしながら、例えばアクション702において、種々のオーディオ信号チャネルに対する符号化モード選択を調整する必要性があると判断される場合、かかる調整は行われるべきである。方法は、どのチャネルが実際に符号化モード選択に関して調整される必要があるかを判断する703オプションのアクションをさらに含むことができる。このアクションは、チャネルが、音楽またはスピーチといった種々のオーディオ信号タイプに属するまたはこれらに独占されるかどうかに基づいて、チャネルを種々のグループに分類することを伴う可能性がある。第1のグループに分類されたチャネルの符号化に対するコード化モード選択は、次いで、第2のグループにおけるチャネルに対して選択された符号化モードが第1のグループに対しても使用されるように、制御されるまたは調整される704可能性がある。信号の2つ以上のグループがある可能性がある。オーディオ信号チャネルは次いで、チャネルのうちの1つまたはチャネルのグループに対して選択された調整済み符号化モードを使用して、符号化705されてよい。
【0032】
例示の実装形態
上述された方法および技法は、例えば、通信デバイスまたは他のホストデバイスの一部とすることができる、エンコーダおよび/またはデコーダにおいて実装可能である。
【0033】
図8a〜
図8cのエンコーダまたはコーデック
エンコーダは、
図8aにおいて一般的様式で示される。エンコーダは、オーディオ信号を符号化するように構成されており、マルチチャネルオーディオ信号のいくつかのチャネルといった複数の信号の符号化(例えば、エンコーダの複数のインスタンスによる並列符号化)をサポートする。エンコーダは、前述されるように、例えば、ACELPおよびMDCTコード化といった複数の種々の選択可能な符号化モード、およびこのサブモードをさらに含むことができる。エンコーダは、他のタイプの信号を符号化するようにさらに構成されてよい。エンコーダ800は、例えば
図4〜
図7のいずれかを参照して上述される方法の実施形態の少なくとも1つを行うように構成される。エンコーダ800は、前述される方法の実施形態と同じ技術的特徴、目的、および利点に関連付けられる。デコーダは、オーディオコード化/復号に対する1つまたは複数の標準に従うように構成可能である。不必要な繰り返しを回避するために、エンコーダについて簡潔に説明する。
【0034】
エンコーダは、下記のように実装および/または説明可能である。
【0035】
エンコーダ800は、複数のチャネルを含むオーディオ信号を符号化するように構成される。エンコーダ800は、処理回路構成または処理構成要素801、および通信インターフェース802を含む。処理回路構成801は、例えば、エンコーダ800にオーディオ信号の多重チャネルを取得させるように、さらに、符号化モードの選択を調整または一致させるように構成されてよい。処理回路構成801は、エンコーダに、取得された複数のチャネルの全てまたは少なくとも複数を符号化するために調整済み符号化モードを適用させるように、さらに構成可能である。例えば、入力/出力(I/O)インターフェースと表記される場合もある通信インターフェース802は、他のエンティティまたはモジュールに対してデータを送信およびデータを受信するためのインターフェースを含む。
【0036】
処理回路構成801は、
図8bに示されるように、例えばCPUといったプロセッサ803と、命令を格納し保持するためのメモリ804などの1つまたは複数の処理構成要素とを含む。したがって、メモリは、プロセッサ803によって実行されると、エンコーダ800に、上述されるアクションを行わせる、例えばコンピュータプログラム805の形式の命令を含むことになる。
【0037】
処理回路構成801の代替的な実装形態は、
図8cに示されている。処理回路構成は、ここで、エンコーダ800に複数のオーディオ信号チャネルを取得させるように構成される取得ユニット806を含むことができる。処理回路構成は、エンコーダに、オーディオ信号チャネルのうちの1つに基づいて複数の符号化モードの中から符号化モードを選択させるように構成される選択ユニット807をさらに含むことができる。処理回路構成は、エンコーダに、少なくとも複数のチャネルに対して選択された符号化モードを適用させるように構成される適用ユニットまたは制御ユニット808をさらに含んでよい。処理回路構成801は、エンコーダに、符号化モード選択の調整が当該オーディオ信号チャネルに対して必要とされるかどうかを判断させるように構成される判断ユニット809などのより多くのユニットを含むことが可能である。処理回路構成は、エンコーダに、調整した符号化モードを使用してチャネルを実際に符号化させるように構成されるコード化ユニット810をさらに含むことができる。これら判断ユニット809およびコード化ユニット810は、他のユニットよりも一層任意的なものであることを強調するために、
図8cにおいて破線の外郭線で示されている。このユニットは、適切な実装形態を実現するための必要性または好みに従って組み合わせられてよい。
【0038】
上述されるエンコーダまたはコーデックは、本明細書に説明される種々の方法の実施形態に対して構成可能である。
【0039】
エンコーダ800は、必要とされる場合に正規のエンコーダ機能を実施するためのさらなる機能性を備えると仮定され得る。
【0040】
図9は、
図1のワイヤレス端末2のいくつかの構成要素を示す図である。プロセッサ70は、メモリ74に格納されたソフトウェア命令76を実行可能である、適した中央処理装置(CPU)、マルチプロセッサ、マイクロコントローラ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路など、ひいてはコンピュータプログラム製品とすることができるもののうちの1つまたは複数の任意の組み合わせを使用して、設けられる。プロセッサ70は、ソフトウェア命令76を実行して、上記の
図4〜
図7を参照して説明される方法の任意の1つまたは複数の実施形態を行うことができる。
【0041】
メモリ74は、読み書き用メモリ(RAM)および読み出し専用メモリ(ROM)の任意の組み合わせとすることができる。メモリ74はまた、例えば、磁気メモリ、光メモリ、ソリッドステートメモリ、またはさらにはリモートでマウントされたメモリの任意のただ1つまたは組み合わせとすることができる永続的ストレージを含む。
【0042】
プロセッサ70においてソフトウェア命令の実行中にデータを読み出すおよび/または格納するためのデータメモリ72も、設けられる。データメモリ72は、読み書き用メモリ(RAM)および読み出し専用メモリ(ROM)の任意の組み合わせとすることができる。
【0043】
ワイヤレス端末2は、他の外部エンティティと通信するためのI/Oインターフェース73をさらに含む。I/Oインターフェース73は、マイクロフォン、スピーカ、ディスプレイなどを含むユーザインターフェースも含む。オプションとして、外付けのマイクロフォンおよび/またはスピーカ/ヘッドフォンは、ワイヤレス端末に接続可能である。
【0044】
ワイヤレス端末2は、アナログ構成要素およびデジタル構成要素を含む1つまたは複数のトランシーバ71、および、
図1に示されるようにワイヤレス端末とワイヤレス通信するための適した数のアンテナ75も含む。
【0045】
ワイヤレス端末2は、オーディオエンコーダおよびオーディオデコーダを含む。これらは、プロセッサ70によってまたは別個のハードウェア(図示せず)を使用して実行可能であるソフトウェア命令76で実装可能である。
【0046】
ワイヤレス端末2の他の構成要素は、本明細書で提示された概念を不明瞭にしないために省略される。
【0047】
図10は、
図1のトランスコーディングノード5のいくつかの構成要素を示す図である。プロセッサ80は、メモリ84に格納されたソフトウェア命令86を実行可能である、適した中央処理装置(CPU)、マルチプロセッサ、マイクロコントローラ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路など、ひいてはコンピュータプログラム製品とすることができるもののうちの1つまたは複数の任意の組み合わせを使用して、設けられる。プロセッサ80は、ソフトウェア命令86を実行して、上記の
図4〜
図7を参照して説明される方法の任意の1つまたは複数の実施形態を行うように構成できる。
【0048】
メモリ84は、読み書き用メモリ(RAM)および読み出し専用メモリ(ROM)の任意の組み合わせとすることができる。メモリ84はまた、例えば、磁気メモリ、光メモリ、ソリッドステートメモリ、またはさらにはリモートでマウントされたメモリの任意のただ1つまたは組み合わせとすることができる永続的ストレージを含む。
【0049】
プロセッサ80においてソフトウェア命令の実行中にデータを読み出すおよび/または格納するためのデータメモリ82も、設けられる。データメモリ82は、読み書き用メモリ(RAM)および読み出し専用メモリ(ROM)の任意の組み合わせとすることができる。
【0050】
トランスコーディングノード5は、無線基地局1を介して、
図1のワイヤレス端末といった、他の外部エンティティと通信するためのI/Oインターフェース83をさらに含む。
【0051】
トランスコーディングノード5は、オーディオエンコーダおよびオーディオデコーダを含む。これらは、プロセッサ80によってまたは別個のハードウェア(図示せず)を使用して実行可能であるソフトウェア命令86で実装可能である。
【0052】
トランスコーディングノード5の他の構成要素は、本明細書で提示された概念を不明瞭にしないために省略される。
【0053】
本明細書において説明された解決策はまた、コンピュータ可読媒体を含むコンピュータプログラム製品に関する。コンピュータプログラムは、このコンピュータ可読媒体上に格納可能であり、このコンピュータプログラムは、プロセッサに、本明細書に説明される実施形態による方法を実行させることができる。コンピュータプログラム製品は、CD(コンパクトディスク)、DVD(デジタル多用途ディスク)、またはブルーレイディスクなどの光ディスクとすることができる。上で説明したように、コンピュータプログラム製品はまた、
図8bのコンピュータプログラム製品804などのデバイスのメモリで具現化可能である。コンピュータプログラムは、コンピュータプログラム製品に適している任意の手法で格納できる。コンピュータプログラム製品は、例えばユニバーサルシリアルバス(USB)スティックといった、取り外し可能なソリッドステートメモリであってよい。
【0054】
本明細書において説明された解決策は、さらに、少なくとも1つのプロセッサ上で実行されると、少なくとも1つのプロセッサに、例えば、本明細書において説明された一実施形態による方法を実施させる、コンピュータプログラムを包含するキャリアに関する。キャリアは、例えば、電子信号、光信号、無線信号、またはコンピュータ可読記憶媒体のうちの1つとすることができる。
【0055】
下記は、開示された主題のさまざまな態様をさらに示す、ある特定の列挙される実施形態である。
【0056】
1.オーディオ用の符号化モードの選択を支援するための方法であって、オーディオエンコーダにおいて行われ、複数のオーディオ信号チャネルを取得することと、複数の取得されたチャネルに対する符号化モードの選択を調整することまたは一致させることとを含み、この調整は、取得されたチャネルのうちの1つ、または取得されたチャネルのグループに対して選択された符号化モードに基づくことができる、方法。
【0057】
2.複数の取得されたチャネルを符号化するために、取得されたチャネルのうちの1つに対して選択されたコード化モードを適用することをさらに含む、実施形態1による方法。
【0058】
3.符号化モードの選択の調整が必要とされるかどうかを判断することと、この調整が必要とされる場合にこの調整を行うこととをさらに含む、実施形態1または2による方法。
【0059】
4.チャネルのうちのいずれが調整される必要があるのかを判断することをさらに含む、前述の実施形態のいずれか1つによる方法。
【0060】
5.調整された符号化モード選択に従って、オーディオ信号チャネルを符号化することをさらに含む、前述の実施形態のいずれか1つによる方法。
【0061】
6.オーディオ用の符号化モードの選択を支援するためのホストデバイス(2、5)および/またはエンコーダであって、プロセッサ(70、80)と、命令(76、86)を格納するメモリ(74、84)とを備え、この命令は、プロセッサによって実行されると、ホストデバイス(2、5)および/またはエンコーダに、オーディオ信号チャネルを取得させ、チャネルのための符号化モードの選択を調整させる、ホストデバイスおよび/またはエンコーダ。
【0062】
7.プロセッサによって実行されると、ホストデバイス(2、5)および/またはエンコーダに、複数の取得されたチャネルを符号化するために、取得されたチャネルのうちの1つに対して選択されたコード化モードを適用させる命令をさらに含む、実施形態6によるホストデバイス(2、5)および/またはエンコーダ。
【0063】
8.プロセッサによって実行されると、ホストデバイス(2、5)および/またはエンコーダに、符号化モードの選択の調整が必要とされるかどうかを判断させ、この調整が必要とされる場合にこの調整を行わせる命令をさらに含む、実施形態6によるホストデバイス(2、5)および/またはエンコーダ。
【0064】
9.オーディオ信号を分類するための命令は、プロセッサによって実行されると、ホストデバイス(2、5)および/またはエンコーダに、取得されたオーディオチャネルののうちのいずれが調整を必要とするのかを判断させる命令を含む、実施形態6から8のいずれか1つによるホストデバイス(2、5)および/またはエンコーダ。
【0065】
10.オーディオ用の符号化モードの選択を支援するためのコンピュータプログラムであって、コンピュータプログラムは、コンピュータプログラムコードを含み、コンピュータプログラムコードは、ホストデバイス(2、5)および/またはエンコーダ上で実行されると、ホストデバイス(2、5)および/またはエンコーダに、オーディオ信号チャネルを取得させ、チャネルのための符号化モードの選択を調整させる、コンピュータプログラム。
【0066】
11.実施形態10によるコンピュータプログラムと、このコンピュータプログラムが格納されたコンピュータ可読媒体とを含む、コンピュータプログラム製品。
【0067】
本明細書において説明したステップ、機能、手順、モジュール、ユニット、および/またはブロックは、汎用電子回路構成および特定用途向け回路構成の両方を含む、ディスクリート回路または集積回路といった、任意の従来の技術を使用したハードウェアにおいて実装可能である。
【0068】
特定の例は、1つまたは複数の適切に構成された、デジタル信号プロセッサ、および、例えば、特殊機能を果たすように相互接続されるディスクリート論理ゲートといった他の知られる電子回路、または特定用途向け集積回路(ASIC)を含む。
【0069】
代替的には、上述されたステップ、機能、手順、モジュール、ユニット、および/またはブロックの少なくともいくつは、1つまたは複数の処理ユニットを含む、適した処理回路構成によって実行するために、コンピュータプログラムといったソフトウェアにおいて実装されてよい。ソフトウェアは、ネットワークノードにおけるコンピュータプログラムの使用前および/または使用中に、電子信号、光信号、無線信号、またはコンピュータ可読記憶媒体といったキャリアによって搬送可能である。上述されるネットワークノードおよびインデックスサーバは、実装形態が分散されることに言及するいわゆるクラウドソルーションにおいて実装されてよいため、ネットワークノードおよびインデックスサーバは、いわゆる仮想ノードまたは仮想マシンであってよい。
【0070】
本明細書に提示される1つまたは複数のフロー図は、1つまたは複数のプロセッサによって行われる場合、1つまたは複数のコンピュータフロー図と見なされてよい。対応する装置は、機能モジュールのグループとして規定されてよく、ここで、プロセッサによって行われるそれぞれのステップは、機能モジュールに対応する。この場合、機能モジュールは、プロセッサ上で実行されるコンピュータプログラムとして実装される。
【0071】
処理回路構成の例は、1つもしくは複数のマイクロプロセッサ、1つもしくは複数のデジタル信号プロセッサ(DSP)、1つもしくは複数の中央処理装置(CPU)、および/または、1つもしくは複数のフィールドプログラマブルゲートアレイ(FPGA)、または1つもしくは複数のプログラマブル論理制御装置(PLC)などの任意の適したプログラマブル論理回路構成を含むがこれらに限定されない。すなわち、上述される種々のノードにおける配置構成のユニットまたはモジュールは、アナログ回路およびデジタル回路の組み合わせ、および/または、例えばメモリに格納されるソフトウェアおよび/またはファームウェアで構成される1つもしくは複数のプロセッサによって実装可能である。これらのプロセッサの1つまたは複数のみならず、他のデジタルハードウェアは、単一の特定用途向け集積回路構成(ASIC)に含まれてよいか、または、いくつかのプロセッサおよびさまざまなデジタルハードウェアは、システムオンチップ(SoC)に個々にパッケージ化されるまたはアセンブルされるかどうかにかかわらず、いくつかの別個の構成要素の中で分散されてよい。
【0072】
提案された技術が実装される任意の従来のデバイスまたはユニットの一般的な処理能力を再利用可能とすることができることも、理解されるべきである。また、例えば、既存のソフトウェアを再プログラミングすること、または新しいソフトウェア構成要素を追加することによって、既存のソフトウェアを再利用可能とすることができる。
【0073】
上述される実施形態は、単に例として挙げられたものであり、提案された技術がこれに限定されないことは、理解されるべきである。本発明の範囲から逸脱することなく、さまざまな修正、組み合わせ、および変更が実施形態に対してなされてよいことは、当業者には理解されるであろう。特に、種々の実施形態における種々の部分的な解決策は、技術的に可能である場合、他の構成において組み合わせ可能である。
【0074】
いくつかの代替的な実装形態では、ブロックに記した機能/作用は、フローチャートに記した順序から外れて生じる場合がある。例えば、連続して示される2つのブロックは、関わる機能性/作用に応じて、実際は、実質的に同時に実行されてよく、または、ブロックは、時には逆の順序で実行されてよい。さらに、フローチャートおよび/またはブロック図の所与のブロックの機能性は、複数のブロックに分離されてよく、ならびに/または、フローチャートおよび/もしくはブロック図の2つ以上のブロックの機能性は、少なくとも部分的に統合されてよい。最後に、他のブロックは、示されるブロックの間に追加/挿入されてよく、および/または、ブロック/動作は、開示された主題の範囲から逸脱することなく省略されてよい。
【0075】
本開示の範囲内の相互作用するユニットの選択およびユニットの命名は、例示の目的のためのものに過ぎず、上述される方法のいずれかを実行するのに適したノードは、提案された手順のアクションを実行できるように、複数の代替的な手法方で構成可能であることは理解されたい。
【0076】
本開示に説明されるユニットが、論理エンティティと見なされるものとし、別個の物理エンティティとしての必要性はないことも、留意されるべきである。
【0077】
開示された主題はさまざまな実施形態を参照して上に提示されているが、開示された主題の範囲全体から逸脱することなく、説明した実施形態に形式および細部のさまざまな変更がなされてよいことは、理解されるであろう。