特許第5775227号(P5775227)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ モトローラ モビリティ エルエルシーの特許一覧

特許5775227オーディオ符号化のための方法および装置
<>
  • 特許5775227-オーディオ符号化のための方法および装置 図000003
  • 特許5775227-オーディオ符号化のための方法および装置 図000004
  • 特許5775227-オーディオ符号化のための方法および装置 図000005
  • 特許5775227-オーディオ符号化のための方法および装置 図000006
  • 特許5775227-オーディオ符号化のための方法および装置 図000007
  • 特許5775227-オーディオ符号化のための方法および装置 図000008
  • 特許5775227-オーディオ符号化のための方法および装置 図000009
  • 特許5775227-オーディオ符号化のための方法および装置 図000010
  • 特許5775227-オーディオ符号化のための方法および装置 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5775227
(24)【登録日】2015年7月10日
(45)【発行日】2015年9月9日
(54)【発明の名称】オーディオ符号化のための方法および装置
(51)【国際特許分類】
   G10L 19/035 20130101AFI20150820BHJP
【FI】
   G10L19/035 D
【請求項の数】12
【全頁数】20
(21)【出願番号】特願2014-547268(P2014-547268)
(86)(22)【出願日】2012年12月3日
(65)【公表番号】特表2015-505991(P2015-505991A)
(43)【公表日】2015年2月26日
(86)【国際出願番号】US2012067532
(87)【国際公開番号】WO2013090039
(87)【国際公開日】20130620
【審査請求日】2014年7月25日
(31)【優先権主張番号】13/316,895
(32)【優先日】2011年12月12日
(33)【優先権主張国】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】510284071
【氏名又は名称】モトローラ モビリティ エルエルシー
【氏名又は名称原語表記】MOTOROLA MOBILITY LLC
(74)【代理人】
【識別番号】100142907
【弁理士】
【氏名又は名称】本田 淳
(72)【発明者】
【氏名】フランソワ、ホリー エル.
【審査官】 山下 剛史
(56)【参考文献】
【文献】 特表平10−512423(JP,A)
【文献】 特表平9−504124(JP,A)
【文献】 特表2010−503881(JP,A)
【文献】 国際公開第2009/068084(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00−19/26
(57)【特許請求の範囲】
【請求項1】
通信装置においてオーディオ信号を符号化する方法であって、
前記通信装置においてビット・レート値を受信すること、
通信装置の処理システムによって前記ビット・レート値に基づいて一組のエネルギー閾値を選択することであって、前記一組のエネルギー閾値は、複数の組のエネルギー閾値のうちの一組のエネルギー閾値であり、各組のエネルギー閾値の前記エネルギー閾値は、1対1で前記オーディオ信号の一組のサブバンドに対応する、前記一組のエネルギー閾値を選択すること、
前記通信装置において前記オーディオ信号を受信すること、
前記処理システムによって一組のサブバンドを構成する各サブバンドのエネルギー決定すること、
前記処理システムによって前記対応する閾値を上回るエネルギーを有する最高周波数サブバンドを決定すること、
前記対応する閾値を上回るエネルギーを有する前記最高周波数サブバンドにある前記オーディオ信号の周波数、および高域カットオフ周波数よりも高いオーディオ信号の前記最高周波数サブバンドの最高周波数より低い周波数の全てを含む前記オーディオ信号の選択された帯域幅を、前記処理システムによって決定すること、
前記通信装置のオーディオ符号化関数によって、選択帯域幅を符号化することを備える、方法。
【請求項2】
前記処理システムによって、前記選択帯域幅を、最大許容送信データ・レートを上回る送信データ・レートをもたらさない帯域幅に限定することをさらに備える、請求項1に記載の方法。
【請求項3】
前記処理システムによって、前記オーディオ信号の前記一組のサブバンドに対応するビット・レート値に基づいて一組のヒステリシス値を選択することをさらに備え、
前記ヒステリシス値が、より低い選択帯域幅からより高い選択帯域幅に変わるためのヒステリシス遅延と、より高い選択帯域幅からより低い選択帯域幅に変わるためのヒステリシス遅延との少なくとも1つを含む、請求項1に記載の方法。
【請求項4】
前記処理システムによって、前記オーディオ信号の符号化中に各周期基準で、前記エネルギーを決定すること、前記最高周波数サブバンドを決定すること、および符号化することの工程を実施することを備える、請求項1に記載の方法。
【請求項5】
2組以上のエネルギー閾値の閾値には2つ以上の条件が存在し、該条件が、より低いオーディオ帯域幅符号化プロトコルが有利であること、選択される符号化プロトコルのオーディオ帯域幅が入力信号の変動帯域幅を追跡すること、およびより高いオーディオ帯域幅符号化プロトコルが有利であることを含む、請求項1に記載の方法。
【請求項6】
前記オーディオ信号中のビット・レート値の変化が、前記複数組から前記一組の閾値の選択を変更する、請求項1に記載の方法。
【請求項7】
オーディオ信号を符号化するための装置であって、
ビット・レート値を受信する通信装置の受信機と、
前記通信装置の処理システムであって、
前記ビット・レート値に基づいて一組のエネルギー閾値を選択することであって、前記一組のエネルギー閾値は、複数の組のエネルギー閾値のうちの一組のエネルギー閾値であり、各組のエネルギー閾値の前記エネルギー閾値は、1対1で前記オーディオ信号の一組のサブバンドに対応する、前記一組のエネルギー閾値を選択すること、
前記オーディオ信号を受信すること、
前記一組のサブバンドを構成する各サブバンドのエネルギーを決定すること、
前記対応する閾値を上回るエネルギーを有する最高周波数サブバンドを決定すること、
前記対応する閾値を上回るエネルギーを有する前記最高周波数サブバンドにある前記オーディオ信号の周波数、および高域カットオフ周波数よりも高いオーディオ信号の前記最高周波数サブバンドの最高周波数より低い周波数の全てを含む前記オーディオ信号の選択された帯域幅を決定すること、
選択帯域幅を符号化することを実行する前記処理システムとを備える、装置。
【請求項8】
前記通信装置の処理システムは、前記選択帯域幅を、最大許容送信データ・レートを上回る送信データ・レートをもたらさない帯域幅に限定するようにさらに構成されている、請求項7に記載の装置。
【請求項9】
前記通信装置の処理システムは、前記オーディオ信号の前記一組のサブバンドに対応するビット・レート値に基づいて一組のヒステリシス値を選択するようにさらに構成され、
ヒステリシス値は、より低い選択帯域幅からより高い選択帯域幅に変わるためのヒステリシス遅延と、より高い選択帯域幅からより低い選択帯域幅に変わるためのヒステリシス遅延との少なくとも1つを有している、請求項7に記載の装置。
【請求項10】
前記通信装置の処理システムは、前記オーディオ信号の符号化中に各周期基準で、前記エネルギーを決定すること、前記最高周波数サブバンドを決定すること、および前記符号化することを実行するように構成されている、請求項7に記載の装置。
【請求項11】
2組以上のエネルギー閾値の閾値には2つ以上の条件が存在し、該条件が、より低いオーディオ帯域幅符号化プロトコルが有利であること、選択される符号化プロトコルのオーディオ帯域幅が入力信号の変動帯域幅を追跡すること、およびより高いオーディオ帯域幅符号化プロトコルが有利であることを含む、請求項7に記載の装置。
【請求項12】
前記オーディオ信号中のビット・レート値の変化が、前記複数組から前記一組の閾値のセットの選択を変更する、請求項7に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、概ねプロセッサ・リソースの効率的なデジタル符号化および復号化に関する。
【背景技術】
【0002】
過去20年間で、マイクロプロセッサの速度は数桁増加し、デジタル信号プロセッサ(DSP)が広く普及するようになった。アナログ通信からデジタル通信へ移行が実現可能になるとともに魅力的なものとなった。デジタル通信には、帯域幅をより効率的に利用することができるという大きな長所があり、エラー訂正技術の使用が可能である。このようにデジタル技術を用いて、所定の割当周波数幅によってより多くの情報を送り、より確実に情報を送ることができる。デジタル通信は、無線リンク(無線)または物理ネットワーク媒体(例えば、光ファイバー、銅線ネットワーク)を使用することができる。
【0003】
デジタル通信は、例えば、スピーチ、オーディオ、画像、ビデオ、またはテレメトリ等の異なるタイプの通信に用いることができる。デジタル通信システムは、送信装置と受信装置とを有する。双方向通信が可能なシステムでは、各々の装置には送信回路および受信回路の両方が備わっている。デジタル送信装置またはデジタル受信装置には、複数の段階的なプロセスがあり、これらのプロセスを通して、信号および結果として生ずるデータが、該信号が入力(例えば、マイクロフォン、カメラ、センサ)で受信される段階とデジタル化された信号が搬送波の変調に用いられて送信される段階との間で、受け渡しされる。(1)信号が入力で受信されてデジタル化された後、(2)何らかの初期雑音フィルタ処理が施されてもよく、その後に(3)ソース・符号化、そして(4)最後にチャンネル・符号化が施されてもよい。受信装置では、チャンネル復号化、ソース・リカバリ、そしてアナログへの変換という逆の順番でプロセスが稼働する。本発明は、この後の頁で説明されるように、本質的にソース符号化段階にあてはまると考えられる。
【0004】
ソース符号化の主な目的は、知覚される品質を可能な限り維持しながらビット・レートを少なくすることである。異なる種類の媒体に対しては、異なる種類の規格が開発されている。
【図面の簡単な説明】
【0005】
図1】特定の実施形態にもとづく通信装置のブロック図である。
図2】特定の実施形態にもとづく通信装置のオーディオ符号化関数のブロック図である。
図3】特定の実施形態にもとづくオーディオ符号化関数のサブバンド・スペクトル分析関数のブロック図である。
図4】特定実施形態にもとづく通信装置におけるいくつかの典型的な信号のタイミング図を示す。
図5】特定の実施形態にもとづく、図4のタイミング図の拡大図を示す。
図6】は、様々な実施形態にもとづくオーディオ符号化関数の操作を示すフローチャートである。
図7】は、様々な実施形態にもとづくオーディオ符号化関数の操作を示すフローチャートである。
図8】は、様々な実施形態にもとづくオーディオ符号化関数の操作を示すフローチャートである。
図9】は、様々な実施形態にもとづくオーディオ符号化関数の操作を示すフローチャートである。
【発明を実施するための形態】
【0006】
当業者は、図中の要素が平易かつ明確さを目的として図示されており、正寸である必要はないことを、容易に理解するであろう。例えば、本発明の実施形態の理解を容易にするために、図中の要素の一部の寸法を他の要素に比べて誇張してもよい。
【0007】
新規と考えられる本発明の特徴は、添付の請求の範囲で詳細に述べられている。しかし、本発明自体は、構成および作用の方法の両方に関して、その目的および利点とともに、本発明を含む概念の特定の例示的実施形態を説明する以下の詳細な説明を参照することによって、最も理解されると考えられる。説明は、以下のような添付された図面とともに用いられることを意図している。
【0008】
本発明が多くの異なる形態で実施可能であるが、本開示が本発明の原理の一例として考えられ、図示および説明される特定の実施形態に本発明が限定されることを意図していないということを理解した上で、具体的な実施形態を図示し、本明細書において詳細に説明する。以下の説明において、同様の参照符号は、図面のいくつかの図において、同一、類似または対応する部分を説明するために用いられる。
【0009】
この明細書では、第1と第2や上と下等の関係語を、1つの実体または作用を他の実体または作用と区別することのみに使用することが可能であり、そのような実体間または作用間でなんらかの実際の関係または順番を要求または意味することを必要としない。用語「含む」またはその用語の他のバリエーションは、列挙される複数の要素を含むプロセス、方法、物、または装置がそれらの要素のみを含むものではなく、はっきりと列挙されていない、またはそのようなプロセス、方法、物、もしくは装置にとって固有のものではない他の要素を含んでもよいように、非排他的包含を範囲とすることを意図している。「〜を含む」によって先行される要素は、その要素を含むプロセス、方法、物、または装置での追加の同一要素の存在を、より多くの制限を伴うことなく、排除するものではない。
【0010】
「一実施形態」、「特定の実施形態」、「実施形態」あるいは類似の用語は、実施形態に関する特定の機能、構造、または特徴が本発明の少なくとも1つの実施形態に含まれることを意味している。したがって、そのような句の、または、この明細書全体にわたる様々な場所での出現は、同一の実施形態に対して必ずしも全てが言及しているわけではない。さらに、特定の機能、構造、または特性は、制限されることなく任意の適切な方法で、1つ以上の実施形態で組み合わされてもよい。
【0011】
本明細書で使用される用語「または(あるいは)」は、全部含めて、または1つまたは任意の複合として、解釈されるものとする。したがって、「A、B、またはC」は、「A、B、C、AおよびB、AおよびC、BおよびC、AおよびBおよびCのいずれか」を意味する。この定義の例外は、要素、機能、ステップ、または作用の複合が何らかの方法で、本質的に相互に排他的である場合のみ、生じるものとする。
【0012】
本明細書中で説明される実施形態は、信号を符号化することに関係する。信号は、デジタル情報に変換され、かつ有線または無線により通信される、スピーチ、または音楽等のオーディオである。
【0013】
ここで、同様の符号は同様の構成要素を示している図面を見てみると、図1は、特定の実施形態による無線電子通信装置100のブロック図である。無線電子通信装置100は、移動携帯電話、個人用移動通信装置、セルラ基地局、およびパーソナル・コンピュータ等、無線通信機能を備えた多くの種類の無線通信装置を代表する。いくつかの実施形態によれば、無線電子通信装置100は、無線システム199、ヒューマン・インターフェース・システム120および無線周波数(RF)アンテナ108を含む。
【0014】
ヒューマン・インターフェース・システム120は、処理システム、該処理システムをサポートする電子構成要素(周辺I/O回路および電力制御回線等)、およびユーザに対するインターフェースとなる電子構成要素(マイクロホン102、ディスプレイ/タッチ・キーボード104、およびスピーカー106スピー等)を含むシステムである。処理システムは、中央処理装置(CPU)およびメモリーを含む。CPUは、メモリーに格納されているソフトウェア命令を処理するもので、このような命令は、表示/キーボード104に情報を提示すること(リスト、メニュー、グラフィックス等)、人間による入力をディスプレイ/キーボード104のタッチ面で検出すること等、主に移動通信装置100のヒューマン・インターフェイスの態様に、主に関する。これらの関数は、一組のヒューマン・インターフェース・アプリケーション(HIA)130として示される。HIA130は、アナログ/デジタル(A/D)コンバータ125を介してマイクロホン102からスピーチオーディオを受け取り、次にこのスピーチを音声認識し、スピーチによってなされた命令に対して応答することも可能である。HIA130は、デジタル/アナログ変換器(D/A)135によって、スピーカー106に着信音のような音を送ることも可能である。ヒューマン・インターフェース・システム120は、触覚装置およびカメラ等のヒューマン・インターフェイス装置(図1では不図示)を含んでもよい。
【0015】
無線システム199は、処理システム、該処理システムをサポートする電子構成要素(周辺I/O回路および電力制御回線等)、およびアンテナに対するインターフェースとなる電子構成要素(RF増幅器等)を含むシステムである。処理システムは、中央処理装置(CPU)およびメモリーを含む。CPUは、メモリーに格納されているソフトウェア命令を処理するもので、該命令は、データ・パケットに符号化されたデジタル化された信号を送信すること(送信機システム170として示される)やデジタル化された信号に復号化されるデータ・パケットを受信すること(受信機システム140として示される)等、主に移動通信装置100の無線インターフェースの態様に、主に関する。しかし、アンテナ108と受信機システム140と送信機システム170(明確にでなく、図1に示される)の特定の無線周波数インターフェース部分を除けば、無線電子通信装置100は、多くの有線の通信装置(例えばケーブル・ノード)も表すだろう。以下に続く実施形態は、個人通信装置である。
【0016】
受信機システム140にはアンテナ108が結合されている。アンテナ108は、デジタル的に符号化された信号があるチャネルを含む場合もあるラジオ周波数(RF)信号を遮断する。遮断された信号は、受信機システム140に結合する。この受信機システム140では、該信号が復号化され、これらの実施形態の回復されたデジタル信号がヒューマン・インターフェース・システム120に結合される。このヒューマン・インターフェース・システム120は該信号をアナログ信号に変換してスピーカーを駆動させる。他の実施形態では、回復されたデジタル信号を、ヒューマン・インターフェース・システム120のディスプレイで画像またはビデオを発表するのに用いることが可能である。送信機システム170は、ヒューマン・インターフェース・システム120からデジタル化された信号126を受け入れる。この信号126は、例えば、デジタル化されたスピーチ信号、デジタル化された音楽信号、デジタル化された画像信号、またはデジタル化されたビデオ信号であってもよく、受信機システム140から結合されたり、無線電子通信装置100に格納されたり、または該電子通信装置100に結合している電子装置(不図示)から供給されるものであってもよい。デジタル化された信号は、周期的デジタル化サンプリング・レートでサンプリングされたものである。デジタル化サンプリング・レートは、例えば、8KHz、16KHz、32KHz、48KHz、あるいは、必ずしも8KHzの倍数ではない他のサンプリング・レートであってもよい。当然のことながら、サンプリングされている信号の帯域幅が1/2未満であってもよい。例えば、いくつかの実施形態では、帯域幅が12KHzである信号は、48KHzのサンプリング・レートでサンプリングされてもよい。送信機システム170は、デジタル化された信号126を分析して符号化し、アンテナ108によってRFチャンネルに送信されるデジタル・パケットに送信する。
【0017】
送信機システム170は、デジタル化された信号のサンプルを周期的に分析し、それらを帯域幅効率的符号語182へ符号化するオーディオ符号化関数181を含む。符号語182は、ネットワーク・デバイスからメッセージのかたちで受信されて受信機システム140からオーディオ符号化関数181に結合されるビット・レート値141とデジタル化された信号126の周波数分析とによって決定されたビット・レートで、生成される。いくつかの実施形態において、ネットワークから受信されたビット・レート値141は、許容ビット・レートを規定するものであり、この許容ビット・レートは、装置100がネットワークへの送信のために上回らなくてもよく、現在のネットワーク・トラフィック荷重に基づいてネットワーク・オペレータまたはネットワーク・デバイスによって通常決定される。いくつかの実施形態では、ビット・レート値は、装置100によって、瞬時値が多少の許容範囲(例えば、平均値よりも10%以上高くならない)内である平均値として取り扱わなくてはならない許容ビット・レートを定義してもよい。この種のビット・レート値の一例は、料金体系に従って装置100により用いられる送信ビット・レートを制限するものであってもよい。いくつかの実施形態では、ビット・レート値141は、受信機システム140の代わりにヒューマン・インターフェース・システム120により結合されてもよい。パケット・ジェネレータ187は、符号語182を用いて、増幅用のRF送信機190に結合してアンテナ108により発せられるパケットを形成する。
【0018】
ここで図2を参照すると、特定の実施形態にもとづくオーディオ符号化関数181のブロック図が示されている。オーディオ符号化関数181は、コンバータ205、サブバンド・スペクトル分析関数210、閾値論理関数215、およびオーディオ符号化関数220を含む。いくつかの実施形態では、コンバータ205を使用しなくてもよい。コンバータ205は、デジタル化された信号126をデジタル化された信号126のサンプリング・レートに関係なく一定の周期的なレートで値を提供する変換された信号206に、変換する。例えば、8KHz、12KHz、および16KHz等の異なるサンプリング・レートを有するデジタル化された信号126を、すべてが48KHzの周期的なレートで変換された信号206に変換してもよい。この変換を、多くの補間法のうちの1つを用いる等、標準的な方法によっておこなってもよい。いくつかの実施形態では、デジタル化された信号126のサンプリング・レートを変えなくてもよいので、コンバータ205を作る必要がなくなる。これらの実施形態では、デジタル化された信号126を、サブバンド・スペクトル分析関数210およびオーディオ符号化関数220に直接結合してもよい。いくつかの実施形態では、デジタル化された信号126を、サブバンド・スペクトル分析関数210およびオーディオ符号化関数220に直接結合してもよく、また、この変換関数を、サブバンド・スペクトル分析関数210およびオーディオ符号化関数220の両方または一方でおこなってもよい。サブバンド・スペクトル分析関数210は、順序づけられたサブバンドの組の各々のエネルギーを分析し、そのサブバンド・エネルギー結果211を、複数のプロトコルのうちの1つを決定する閾値論理関数215に結合させるもので、プロトコルの各々は、サブバンド・エネルギー結果211およびビット・レート値141に基づいて、符号語182が符号化される特定の帯域幅を有する。決定されたプロトコル216(選択された帯域幅または選択されたプロトコルであるとも確認される)は、オーディオ符号化関数220に結合され、サブバンド・エネルギー結果211とサブバンド・スペクトル分析関数210に結合するビット・レート値141とに応じて、時間とともに変動する。オーディオ符号化関数220は、選択帯域幅216を用いて、デジタル化126オーディオ信号の符号化を実行し、かつ符号語182を生成することにより、符号化リソースを最小化するとともにオーディオ信号を伝えるのに必要な平均帯域幅を減少させる。当然のことながら、複数のプロトコルの低周波数カットオフ値(高域周波数)は、上限カットオフ周波数の次数がプロトコルの帯域幅の次数と同じである値に、十分に近似している(すなわち、高帯域幅は、より高い上限カットオフ周波数に相関する)。
【0019】
ここで図3図5を参照すると、特定の実施形態にもとづいて、サブバンド・スペクトル分析関数210のブロック図が図3に示されており、いくつかの典型的な信号のタイミング図が図4および図5に示されている。サブバンド・スペクトル分析関数210は、サブフレーム高速フーリエ変換(FFT)関数305、エネルギー分析関数308、一組のN個のバンド分割関数310〜325、対応する一組のN個の平滑化フィルタ330〜345、および対応する一組のN個のヒステリシス閾値関数(threshold-with-hysteresis-functions)350〜365を含む。デジタル化された信号126または変換された信号206は、サブフレームFFT関数305に結合される。このサブフレームFFT関数305は、デジタル化された信号126または変換された信号206のレートに相当するフレーム・レートのある倍数(例えば、4)で、高速フーリエ変換をおこなう。例えば、デジタル化された信号126または変換された信号206の160個の値が、各々のフレームまたはサブフレームに含まれていてもよい。従来の技術(例えば、テーパ化オーバーラップ等)を、フレームまたはサブフレーム・ウィンドウィングに使用してもよく、またFFTの実行に使用してもよい。各々のフレームまたはサブフレームのFFTにより生じた値の組をエネルギー分析関数308に結合させる。このエネルギー分析関数308はFFT値の各々の組を、従来の方法(FFT値の絶対値の平方を用いて)で、対応するエネルギー・スペクトル分布値の組に変換する。一連のフレームまたはサブフレームに関するエネルギー・スペクトル分布は、FFTからなる組のように、周期的なフレームまたはサブフレーム・レートで生成される周波数ベースの分布である。一例では、バンド分割310〜325、平滑化フィルタ330〜345、および閾値350〜365の量を確定する際に用いられる値Nは、4である。デジタル化されたオーディオ信号126または変換された信号206を、図4において、オーディオ・プロット405として示す。ここでは、オーディオ・プロット405は連続的に見える。なぜなら、デジタル化された値(例えば、デジタル化された電圧サンプル)がプロット内で相対的にまとまって近接しているからである。オーディオ・プロット405の下には、オーディオ・スペクトルを表すプロット410がある。各々の縦線には、多くのグレー・スケール値(ピクセルまたはスポット)が含まれ、これらの値は0 から24KHzまでの周波数に対する1つのフレームのエネルギー密度を表す。ゼロではないエネルギー値を持つピーク周波数は、プロット411により近似される。プロット410の領域の約半分に対する各々のフレームの最大エネルギー密度は、ピーク値よりもかなり低い。このことの一例は、図5の拡大図に示されるプロット410の領域413である。他の領域は、よりいっそう一様に分布しているエネルギーを有しおり、例えばプロット410の領域412がそうである。
【0020】
エネルギー分析は、各々のサブバンドにおけるエネルギーの総量を決定するバンド分割関数310〜325に結合している。本明細書中で用いられる一例のサブバンド範囲は、バンド分割#1 310に対して0〜7KHz、バンド分割#2 315に対して7〜8KHz、バンド分割#3 320に対して8〜16KHz、およびバンド分割#4(図3で不図示)に対して16〜20KHzである バンド分割#1〜#4の典型的な周波数範囲は、図4上で周波数サブバンド415〜418として、確認される。当然のことながら、この例によって表わされる実施形態に関して、この組のサブバンドが、重なることなく0から24KHzまでの全周波数範囲をカバーする一組のサブバンドである。他の実施形態では、サブバンドの組は、0〜24kHzの十分な帯域幅を満たさなくてもよく、サブバンド間にギャップがあってもよい。いくつかの実施形態では、サブバンドは重複してもよい。バンド分割関数310〜325の出力を、平滑化フィルタ330〜345に結合する。これらのフィルタは、あまりにも急激であろうヒステリシス閾値関数350〜365の出力での変化を生じ得る高周波数の影響を削除する。平滑化フィルタ330〜345の出力を、ヒステリシス閾値関数350〜365に結合する。また、ヒステリシス閾値関数350〜365を、バイアス・テーブル370由来の閾値信号371に結合する。閾値信号は、ビット・レート値141によって決定されるヒステリシス閾値関数350〜365のバイアスおよびヒステリシス値を含む。ビット・レート値141は、M個ある値の1つである値であり、これらの値の各々がN個のヒステリシス閾値関数350〜365内のレベルの設定に用いられ、またこれらの関数は、信号126、206を符号化するために用いられるN個のプロトコルのうちの1つを選択するために、1つの関数として用いられる。ある実施形態では、各々のプロトコルは、信号126、206の異なる帯域幅を符号化する。本明細書中で用いられる例では、Mは3である。また、3つの値が低、中、および高値として、確認される。ビット・レート値141は、ヒステリシス閾値関数350〜365の各々についてM個の閾値の1つを選択する。したがって、可能なM個のビット・レート値の各々は、サブバンドに相当するN個の閾値からなる一組を選択する。各々のヒステリシス閾値関数350〜365は、信号211の一部である出力値を生成する。入力が第1のヒステリシス値を上回る持続時間の閾値を上回る場合、出力値は第1の状態(TRUE)にある。また、入力が第2のヒステリシス値を上回る持続時間の閾値未満である場合、それは第2の状態(FALSE)である。ヒステリシス値はサブバンドの全てに対して同一のものであってもよく、または固定されたものであってもよい。いくつかの実施形態では、ヒステリシス閾値関数350〜365の第1および第2のヒステリシス値は2N個の異なる値であってもよく、また、いくつかの実施形態では、第1および第2のNヒステリシス値はビット・レート値141によってM個の値からなる一組から選択されてもよい。本明細書中で説明される例にもとづいて、第1のヒステリシス値はゼロであり、第2のヒステリシス値はヒステリシス閾値関数350〜365間で異なるものではなく、ビット・レート値141に応じて変化しない。(しかしながら、閾値はビット・レート値141に応じて変わる。)
ここで再び図2を参照すると、サブバンド・スペクトル分析関数210からの出力信号211が閾値論理関数215に結合する。閾値論理関数215は信号211を分析し、第1の状態にあるN個のサブバンドの最高周波数を示す出力信号211の値に基づいた符号化プロトコルを選択する。この周波数未満のサブバンドも信号検出のためのこの第1の状態にあると仮定される。選択された符号化プロトコルは、信号126、206の帯域幅を符号化する。この信号126、206の帯域幅は、最高周波数サブバンドまでのオーディオ信号(デジタル化された信号126または変換された信号206)のそれらの周波数を含んでおり、この最高周波数サブバンドは、対応する閾値を上回るエネルギーとオーディオ信号のより低い周波数成分とを有し、またこのような周波数成分は、オーディオ符号化関数220に対して選択された符号化プロトコルの高域カットオフ周波数よりも高い。いくつかの実施形態では、高域カットオフ周波数よりも高い、オーディオ信号のより低い周波数成分はすべて、選択された符号化プロトコルの帯域幅に含まれている。いくつかの実施形態では、サブバンド・スペクトル分析210および/またはオーディオ符号化220に先立って、受信信号126に対して高領域(high pass)またはバンド・パス・フィルタリングが施される必要性または要求があってもよいが、このことによって処理ステップまたは処理ロジックが著しくは影響されないと考えられる。本明細書中で説明される例では、選択された符号化プロトコルは、名目上、7KHzの帯域幅、8KHzの帯域幅、12KHzの帯域幅、および20KHzの帯域幅のうちの1つである選択帯域幅を有するプロトコルである。しかし、このことは、実際には、10Hzから500Hzまでの間で開始され最大7KHzまで拡大するバンド、10Hzから500Hzまでの間で開始され最大8KHzまで拡大するバンド、および10Hzから500Hzまでの間で開始され最大12KHzまで拡大するバンド、または10Hzから500Hzまでの間で開始され最大20KHzまで拡大するバンドにそれぞれ対応してもよい。言うまでも無く、選択された符号化プロトコルを識別する他の方法を用いることができよう。まさしくその2つの例として、符号化ビット・レート、または指標付きのプロトコル値(例えば、1ないし4)がある。
【0021】
表1を参照すると、特定の実施形態にもとづいて、一組の閾値が示されている。この組は、本明細書で上記されている例に使用し得るものであり、またバイアス・テーブル370(図 3)に含まれてもよいものである。この例については、閾値の最大値が100であり、信号126、206のエネルギー合計が100の値を有している。
【0022】
【表1】
当然のことながら、エネルギー密度が一定の場合、各々のサブバンド中のエネルギーの合計は、最低のサブバンドから最も高いサブバンドまで、それぞれ35、5、20および40と考えられる。ビット・レート値141が低で、かつエネルギー密度が一定の場合、ヒステリシス閾値関数350〜365の各々の出力値(最低から最高まで)は、超過する唯一の閾値が0〜7KHzの閾値だからであることから、TRUE、FALSE、FALSE、およびFALSEであると考えられる。閾値がTRUEである最も高いサブバンドが0〜7kHzサブバンドであることから、選択されたバンド幅は7kHzである。エネルギー密度が一定で、ビット・レート値141が高である場合、ヒステリシス閾値関数350〜365の各々の出力値(最高から最低まで)は、TRUE、TRUE、FALSE、およびTRUEであると考えられる。閾値がTRUEである最も高いサブバンドが12〜20kHzサブバンドであることから、閾値論理関数215は、20kHzの帯域幅を提供するプロトコルを選択する。図4のプロット405、410よりも下に、3つのプロット420、425、430が示されている。これらのプロットは、受信信号126、206が図5のプロット405として受信信号126、206が表1に類似した一組の閾値について示される信号である場合、ビット・レート値141の3つの値(低、中、高)に関する閾値論理関数215対出力216時間を示している。プロット420はビット・レート値が低の場合に生成され、プロット425はビット・レート値が中の場合に生成され、そしてプロット430はビット・レート値が高の場合に生成される。プロット420がプロット425、430よりも時間の割合が高い最低帯域幅値(7KHz)を有し、プロット430がプロット420、425よりも時間の割合が高い最高帯域幅を有していることが見てとれる。この差は、適切に閾値の値を修正することにより容易に拡大または縮小することができる。第2のヒステリシス値の影響は、プロットの領域460で明らかである。このことは、最高帯域幅からより低い帯域幅へのゆっくりとした変化を示している一方で、第1のヒステリシス値がゼロの値をとることが最低帯域幅から最高帯域幅への素早い変化をもたらすことを示しており、またこのことはプロットの領域450で明らかである。平滑化フィルタ330〜345により実行されるフィルタ処理の利点は、約10フレーム未満の値の変化の間の持続時間を有する出力216(プロット420〜430により図示された例で)の入射がかなり小さいという事実によって、明白である。
【0023】
特定の実施形態において、選択可能な帯域幅のうちのいずれかを用いることにより超過する最大許容送信データ・レートがある場合、送信機システム170は、そのような帯域幅を有するプロトコルが用いられるのを防ぐために、常に最大許容送信データ・レートを下回る送信データ・レートを維持するより低い帯域幅プロトコルに帯域幅の選択を制限することによって、論理を含んでもよい。この追加の制限を、受信機システム140により受信されたプロトコル・メッセージ内で受け取られた指示に基づいて、閾値論理関数215に取り込んでもよい。例えば、この指示を用いて、いくつかの異なる数値表の1つを選択することができると思われ、そのような表のいくつかは、高帯域の使用を妨げるために選ばれる閾値を有する。あるいは、選択帯域幅が過度の送信データ・レートに帰着する場合、より低い帯域幅にそれを変更する論理であってもよい。
【0024】
当然のことながら、ビット・レート値を選ぶことにより選択される閾値(および、いくつかの実施形態において、対応するヒステリシス値)からなる一組の定義の柔軟性を有することによって、平均送信ビット・レートをチャンネル状態にもとづいて引き下げることができ、その一方で、ビット・レート制限が従来の技術を用いるシステムに課せられる場合よりも、オーディオ品質がより最良に維持される。いくつかの実施形態では、当然のことながら、符号化プロトコルのオーディオ帯域幅を可能な限り入力信号の帯域幅に一致させる一方で入力信号の帯域幅を時間とともに変化させることが望ましい。言いかえれば、入力信号の間に連続して選択される符号化プロトコルのオーディオ帯域幅が入力信号の変動帯域幅を追跡するようにして、閾値値が経験的に決定される。用いられる入力信号は符号化されると予想されるものに典型的な1つ以上のオーディオ・シーケンスである。そのような構成は中(medium)チャネル・ビット・レート(いわゆる中(Med)ビット・レート・セッティング)を達成するのに適切であると考えられる。いくつかの実施形態では、例えば、符号化プロトコルに入手可能なチャンネル・ビット・レートが制限されて、入力信号帯域幅が縮小される場合によりよいサウンディング合成オーディオが生産される場合、より低いオーディオ帯域幅符号化プロトコルが有効であるように、サブバンド・スペクトル分析関数210に対してバイアスがかけられてもよく、このことはいわゆる低(Low)ビット・レート・セッティングである。ある実施形態では、より高いチャンネル・ビット・レートが符号化プロトコルに対して利用可能である場合、より高いオーディオ帯域幅符号化プロトコルが有効であるように、サブバンド・スペクトル分析関数210に対してバイアスがかけられてもよく、このことはいわゆる高(High)ビット・レート・セッティングである。いくつかの実施形態では、オーディオ信号中のビット・レート値の変化は、使用される符号化プロトコルという制約の中で実行可能になったらすぐに、利用可能な複数の組からの閾値の組の選択を変え、平均チャンネル・ビット・レートのより迅速な変更をもたらす。このことによって、共有帯域幅を使用しているいくつかの装置の複合帯域幅よりも良好な制御が可能になる。
【0025】
「有効」であるより低いオーディオ帯域幅符号化プロトコルが意味することは、限られた期間、低オーディオ帯域幅符号化プロトコルのチャンネル・ビット・レートと類似(例えば、いくつかの実施形態では10%以内、他の実施形態では類似許容範囲が50%高くてもよい)のチャンネル・ビット・レートを有するより高い帯域幅符号化プロトコルへ単にスイッチングすることで、デフォルト出力が低いオーディオ帯域幅符号化プロトコルを用いて符号化されるように、閾値が経験的に設定されることである。このスイッチングが生ずるのは、より低いオーディオ帯域幅内のオーディオ信号に割り付けられた符号化ビットの数を減らすことにより引き起こされる低下よりも、より高いオーディオ帯域幅を符号化するという知覚的利点が重要であるのに十分なほど、より高いサブバンド中のエネルギーが大きい場合である。低いオーディオ帯域幅符号化プロトコルは、最低オーディオ・サブバンドを含む帯域幅を符号化するものであり、また、特定のより高いオーディオ・サブバンド(しかし最も高いサブバンドではない)に至り、かつそれをも含むより高いサブバンドを含むものであってもよい。低いオーディオ帯域幅は、符号化されると予想される種類の入力信号に基づいて決定されるものであり、また、理論的な方法(例えば精度)、経験的方法(例えば、エキスパート・リスニングまたは平均オピニオン評点(MOS)試験)に基づいて決定されてもよく、あるいは、特定の時間にシステムにおいて使用可能な最低の符号化プロトコル帯域幅であってもよい。「有効」であるより高いオーディオ帯域幅が意味することは、高周波エネルギー(例えば入力信号中の最高サブバンドに対応するエネルギー)が平均的なリスナーに感知できない期間、より低い帯域幅符号化プロトコルへ単にスイッチングすることで、出力値が高いオーディオ帯域幅符号化プロトコルを用いて符号化されるように、閾値が経験的に設定されることである。高いオーディオ帯域幅符号化プロトコルは、最も高いオーディオ・サブバンドを含むものであり、あるいは、特定のより低いオーディオ・サブバンドまで、または、それを含むより低いサブバンドを含むものであってもよい。高いオーディオ帯域幅は、符号化されると予想される種類の入力信号に基づいて決定されるものであり、また、理論的な方法(例えば精度)、経験的方法(例えば、エキスパート・リスニングまたは平均オピニオン評点(MOS)試験)に基づいて決定されてもよく、あるいは、特定の時間にシステムにおいて使用可能な最高の符号化プロトコル帯域幅であってもよい。上記中、低、および高ビット・レートに対する経験的に決定された閾値セッティングを、表1に示すような対応の表の形態(しかし、経験的に決定された値を有する)の一実施形態で使用し得る。第1および第2のヒステリシス値もまた、一実施形態において、中、低、および高ビット・レートに対して、経験的に決定し得る。第1および第のヒステリシス値は、中、低、および高ビット・レートの各々において移行(transition)に関して同じであってもよい。
【0026】
ここで図6を参照すると、特定の実施形態にもとづいて、オーディオ信号を符号化する方法600のいくつかのステップが示されている。符号化は、個人用通信装置(例えば、携帯電話もしくはネット・パド)、または遠隔測定装置、あるいは固定ネットワーク・デバイスでおこなわれもよい。ステップは、必ずしも示された順序で実行する必要はない。ステップ605で、ビット・レート値が受信される。ビット・レート値は、一組のMビット・レート値のうちの1つである。ビット・レート値には同一性があってもよい。そのような同一性の非限定的な例は、Mが3の場合、低、中、および高であり、あるいは指標値(第1、第2等)である。一組のエネルギー閾値は、ビット・レート値に基づいて、ステップ610で選択されている。エネルギー閾値の組は、エネルギー閾値の複数の組(N個)の1つである。エネルギー閾値の各々の組のエネルギー閾値は、オーディオ信号の一組のサブバンドに対して、1対1で対応している。(したがって、オーディオ信号のN個のサブバンドもある)。ステップ615で、オーディオ信号が受信される。N個のサブバンドの組の各々のサブバンドのエネルギーは、ステップ620で決定される。ステップ625では、対応する閾値を越えるエネルギーを有する最高周波数サブバンドが決定される。オーディオ信号の選択帯域幅はステップ630で符号化される。選択帯域幅には、対応する閾値を上回るエネルギーを有する最高周波数サブバンドにあるオーディオ信号の周波数と、オーディオ信号の実質的により低い周波数とのみが、含まれる。当然のことながら、ステップ605〜610を、ステップ615〜620を参照前、後、またはほぼ同時に、実行することができる。本明細書中に説明されるステップと、図2を参照して説明される機能的ブロックとの間の相互関係は、ステップ615および620がサブバンド・スペクトル分析関数210により実行してもよい。ステップ605、610、625を、閾値論理関数215によって行ってもよく、また、ステップ630をオーディオ符号化関数220によっておこなってもよい。
【0027】
ここで図7図9を参照すると、特定の実施形態にもとづいて、オーディオ信号を符号化する方法600のいくつかのステップが示されている。ステップ705(図7)では、選択帯域幅は、最大許容送信データ・レートを上回る送信データ・レートをもたらさない帯域幅に限定されている。ステップ805(図8)では、一組のヒステリシス値がビット・レート値に基づいて選択される。その値は、オーディオ信号のサブバンドに相当する。ヒステリシス値は、より低い選択帯域幅からより高い選択帯域幅に変わるためのヒステリシス遅延と、より高い選択帯域幅からより低い選択帯域幅に変わるためのヒステリシス遅延との少なくとも1つを有している。ステップ905(図9)では、1つのイベントまたは複数のイベントが用いられて、エネルギー620を決定するステップ、最高周波数サブバンド625を決定するステップ、および符号化630のステップを、それぞれの周期基準(periodic bases)で、少なくとも実行するよう対応されている。イベントは、他のイベントの割り込みまたはカウントである。いくつかの実施形態では、それらは共通の期間を用いて、実行されてもよい。特定の実施形態では、周期基準は必ずしも同じでなくてもよい。例えば、エネルギー620を決定するステップは、最高周波数サブバンド625を決定するステップよりも高いレートで実行可能である。このことは、いくつかの帯域幅決定のための遅延を加えるという効果があると考えられる。さらに、ステップ615でオーディオ信号を受信することは、サブバンド・スペクトル分析関数210によっておこなわれる各々のサブバンドのエネルギーを決定するために使用される周期基準(例えば、オーディオ・フレーム・レート)よりもかなり大きい周期基準(例えば、デジタル化オーディオ・サンプリング・レート)で通常実行される。
【0028】
この明細書に示されたプロセス、例えば(限定されるものではないが)、図 6〜9に説明された方法ステップを、CPUのプロセッサにより読まれるコンピュータ可読媒体に格納された、プログラム化された命令を用いて、実行してもよい。コンピュータ可読媒体は、マイクロプロセッサにより実行される命令を格納することができる有形の媒体であってもよい。媒体は、CDディスク、DVDディスク、磁気または光ディスク、テープ、およびシリコンをベースとしたリムーバブルまたは非リムーバブル・メモリーのうちの1つであってもよく、あるいはそれらの1つ以上を含むものであってもよい。プログラミング命令もまた、パケット化または非パケット化された有線あるいは無線送信信号の形態で,運ばれることが可能である。
【0029】
前述の明細書において、本発明の具体的な実施形態を説明した。しかしながら、以下の特許請求の範囲に記載される本発明の範囲から逸脱することなく、種々の修飾および変更を加えることを当業者ができることは、いうまでもない。例として、いくつかの実施形態では、方法ステップを、説明された順番とは異なる順番で実行してもよく、また機能的ブロック内で説明される関数の配置を異なるようにしてもよい(例えば、サブバンド・スペクトル分析関数210の代わりに、バイアス・テーブル370とヒステレシス・ブロック350〜365を閾値論理関数215の一部とすることが考えられる)。別の例として、当業者に知られている任意の特定の組織化およびアクセス方法を、バイアス・テーブル370等のテーブルに使用してもよい。したがって、明細書および図面は、制限を加える意味よりも例示を考えており、そのような修飾の全てが本発明の範囲内に含まれることを意図している。利益、利点、問題の解決、および、利益、利点、問題の解決が生じたりより明確になったりする要素のいずれも、請求の範囲のいずれかまたはすべての決定的な、必要な、もしくは必須の特徴もしくは要素として解釈されるものではない。本発明は、この出願の係属中に出された補正や発行されるそれらの請求の範囲の等価物全てを含む添付の請求の範囲によってのみ定義される。
図1
図2
図3
図4
図5
図6
図7
図8
図9