特許第5922121号(P5922121)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ クゥアルコム・インコーポレイテッドの特許一覧

特許5922121高速復元コーディング中に量子化予測メモリを使用すること
<>
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000002
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000003
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000004
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000005
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000006
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000007
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000008
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000009
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000010
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000011
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000012
  • 特許5922121-高速復元コーディング中に量子化予測メモリを使用すること 図000013
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5922121
(24)【登録日】2016年4月22日
(45)【発行日】2016年5月24日
(54)【発明の名称】高速復元コーディング中に量子化予測メモリを使用すること
(51)【国際特許分類】
   G10L 19/005 20130101AFI20160510BHJP
   G10L 19/12 20130101ALI20160510BHJP
【FI】
   G10L19/005
   G10L19/12
【請求項の数】52
【全頁数】33
(21)【出願番号】特願2013-524135(P2013-524135)
(86)(22)【出願日】2011年8月5日
(65)【公表番号】特表2013-541027(P2013-541027A)
(43)【公表日】2013年11月7日
(86)【国際出願番号】US2011046833
(87)【国際公開番号】WO2012021416
(87)【国際公開日】20120216
【審査請求日】2013年4月12日
(31)【優先権主張番号】13/198,322
(32)【優先日】2011年8月4日
(33)【優先権主張国】US
(31)【優先権主張番号】61/376,602
(32)【優先日】2010年8月24日
(33)【優先権主張国】US
(31)【優先権主張番号】61/372,398
(32)【優先日】2010年8月10日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】595020643
【氏名又は名称】クゥアルコム・インコーポレイテッド
【氏名又は名称原語表記】QUALCOMM INCORPORATED
(74)【代理人】
【識別番号】100108855
【弁理士】
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100109830
【弁理士】
【氏名又は名称】福原 淑弘
(74)【代理人】
【識別番号】100088683
【弁理士】
【氏名又は名称】中村 誠
(74)【代理人】
【識別番号】100103034
【弁理士】
【氏名又は名称】野河 信久
(74)【代理人】
【識別番号】100095441
【弁理士】
【氏名又は名称】白根 俊郎
(74)【代理人】
【識別番号】100075672
【弁理士】
【氏名又は名称】峰 隆司
(74)【代理人】
【識別番号】100119976
【弁理士】
【氏名又は名称】幸長 保次郎
(74)【代理人】
【識別番号】100153051
【弁理士】
【氏名又は名称】河野 直樹
(74)【代理人】
【識別番号】100140176
【弁理士】
【氏名又は名称】砂川 克
(74)【代理人】
【識別番号】100158805
【弁理士】
【氏名又は名称】井関 守三
(74)【代理人】
【識別番号】100172580
【弁理士】
【氏名又は名称】赤穂 隆雄
(74)【代理人】
【識別番号】100179062
【弁理士】
【氏名又は名称】井上 正
(74)【代理人】
【識別番号】100124394
【弁理士】
【氏名又は名称】佐藤 立志
(74)【代理人】
【識別番号】100112807
【弁理士】
【氏名又は名称】岡田 貴志
(74)【代理人】
【識別番号】100111073
【弁理士】
【氏名又は名称】堀内 美保子
(74)【代理人】
【識別番号】100134290
【弁理士】
【氏名又は名称】竹内 将訓
(72)【発明者】
【氏名】ファン、ジェン
(72)【発明者】
【氏名】シンダー、ダニエル・ジェイ.
【審査官】 山下 剛史
(56)【参考文献】
【文献】 特表2008−546021(JP,A)
【文献】 特開2004−138756(JP,A)
【文献】 特開2002−268696(JP,A)
【文献】 国際公開第2007/132750(WO,A1)
【文献】 江原宏幸他,"G.729音声符号化における移動平均予測符号化パラメータの内挿的フレーム消失隠蔽処理",日本音響学会誌,2008年 3月,Vol.64,No.3,pp.150-155
【文献】 Niranjan SHETTY, et al.,"IMPROVING THE ROBUSTNESS OF THE G.722 WIDEBAND SPEECH CODEC TO PACKET LOSSES FOR VOICE OVER WLANS",Proceedings of the 2006 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2006),2006年 5月,Vol.V,pp.365-368
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00−19/26
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
高速復元コーディング中に予測メモリを量子化するための方法であって、
現在フレームのための予測メモリを表す最良形状ベクトルを量子化することと、
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの指示を判断することと、
前記量子化された最良形状ベクトルを送るべきかどうかを判断することと、
前記判断に基づいて前記量子化された最良形状ベクトルを送ることと、
符号化現在フレームを送ることと
を備える、方法。
【請求項2】
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの前記指示の前記判断に基づいて、前記指示を送ることと
をさらに備える、請求項1に記載の方法。
【請求項3】
前記量子化された最良形状ベクトルを送るべきかどうかの前記判断に基づいて、前記現在フレームのための前記予測メモリの量子化ロケーションと量子化エネルギーとを送ることをさらに備える、請求項2に記載の方法。
【請求項4】
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とがあらゆるフレームについて送られる、請求項3に記載の方法。
【請求項5】
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とが、ソース制御型パラメータまたはチャネル制御型パラメータまたはその両方に基づいて送られる、請求項3に記載の方法。
【請求項6】
前記ソース制御型パラメータが、前記符号化現在フレームにおける固定コードブック寄与に対する前記符号化現在フレームにおける適応コードブック寄与の比を備える、請求項5に記載の方法。
【請求項7】
前記チャネル制御型パラメータが、送信チャネルにおける利用可能な帯域幅、またはワイヤレス通信システムにおけるパケットロス率を備える、請求項5に記載の方法。
【請求項8】
前記指示は、1つまたは複数の前のフレームのための前記前の予測メモリに対応する1つまたは複数のビットを備え、前記1つまたは複数のビットの各々は、前記対応する前の予測メモリが前記最良形状ベクトルよりも正確であるかどうかを示す、請求項1に記載の方法。
【請求項9】
前記指示を判断することが、
前記符号化現在フレームに対する固定コードブック寄与と、前記最良形状ベクトルに基づく高速復元適応コードブック寄与とを使用して最良残差信号を再構成することと、
前の予測メモリを選択し、各前の予測メモリに基づいて前の予測メモリ残差信号を判断することと、
前記前の予測メモリ残差信号と前記最良残差信号との比較に基づいて、前の予測メモリ比較ビット中の各選択された前の予測メモリのためのビットを変更することと、
前記量子化された形状ベクトルとの前記前の予測メモリ比較ビットを含めることとを備える、請求項2に記載の方法。
【請求項10】
前記最良残差信号が、最大重み付け信号対雑音比(SNR)をもつ残差信号である、請求項9に記載の方法。
【請求項11】
前記予測メモリのロケーションが、前のフレームの一部分において最大振幅をもつ相対ロケーションである、請求項3に記載の方法。
【請求項12】
プロセッサと、
前記プロセッサと電子通信しているメモリと、
前記メモリに記憶された命令と
を備える、高速復元コーディング中に予測メモリを量子化するための送信端末であって、前記命令が、前記プロセッサによって、
現在フレームのための予測メモリを表す最良形状ベクトルを量子化することと、
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの指示を判断することと、
前記量子化された最良形状ベクトルを送るべきかどうかを判断することと、
前記判断に基づいて前記量子化された最良形状ベクトルを送ることと、
符号化現在フレームを送ることと
を行うように実行可能である、送信端末。
【請求項13】
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの前記指示の前記判断に基づいて、前記指示を送ることと
を行うように実行可能な命令をさらに備える、請求項12に記載の送信端末。
【請求項14】
前記量子化された最良形状ベクトルを送るべきかどうかの前記判断に基づいて、前記現在フレームのための前記予測メモリの量子化ロケーションと量子化エネルギーとを送るように実行可能な命令をさらに備える、請求項13に記載の送信端末。
【請求項15】
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とがあらゆるフレームについて送られる、請求項14に記載の送信端末。
【請求項16】
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とが、ソース制御型パラメータまたはチャネル制御型パラメータまたはその両方に基づいて送られる、請求項14に記載の送信端末。
【請求項17】
前記ソース制御型パラメータが、前記符号化現在フレームにおける固定コードブック寄与に対する前記符号化現在フレームにおける適応コードブック寄与の比を備える、請求項16に記載の送信端末。
【請求項18】
前記チャネル制御型パラメータが、送信チャネルにおける利用可能な帯域幅、またはワイヤレス通信システムにおけるパケットロス率を備える、請求項16に記載の送信端末。
【請求項19】
前記指示は、1つまたは複数の前のフレームのための前記前の予測メモリに対応する1つまたは複数のビットを備え、前記1つまたは複数のビットの各々は、前記対応する前の予測メモリが前記最良形状ベクトルよりも正確であるかどうかを示す、請求項12に記載の送信端末。
【請求項20】
前記指示を判断するように実行可能な命令が、
前記符号化現在フレームに対する固定コードブック寄与と、前記最良形状ベクトルに基づく高速復元適応コードブック寄与とを使用して最良残差信号を再構成することと、
前の予測メモリを選択し、各前の予測メモリに基づいて前の予測メモリ残差信号を判断することと、
前記前の予測メモリ残差信号と前記最良残差信号との比較に基づいて、前の予測メモリ比較ビット中の各選択された前の予測メモリのためのビットを変更することと、
前記量子化された形状ベクトルとの前記前の予測メモリ比較ビットを含めることとを行うように実行可能な命令を備える、請求項13に記載の送信端末。
【請求項21】
前記最良残差信号が、最大重み付け信号対雑音比(SNR)をもつ残差信号である、請求項20に記載の送信端末。
【請求項22】
前記予測メモリのロケーションが、前のフレームの一部分において最大振幅をもつ相対ロケーションである、請求項14に記載の送信端末。
【請求項23】
高速復元コーディング中に予測メモリを量子化するための送信端末であって、
現在フレームのための予測メモリを表す最良形状ベクトルを量子化するための手段と、
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの指示を判断するための手段と、
前記量子化された最良形状ベクトルを送るべきかどうかを判断するための手段と、
前記判断に基づいて前記量子化された最良形状ベクトルを送るための手段と、
符号化現在フレームを送るための手段と
を備える、送信端末。
【請求項24】
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの前記指示の前記判断に基づいて、前記指示を送るための手段と
をさらに備える、請求項23に記載の送信端末。
【請求項25】
前記量子化された最良形状ベクトルを送るべきかどうかの前記判断に基づいて、前記現在フレームのための前記予測メモリの量子化ロケーションと量子化エネルギーとを送るための手段をさらに備える、請求項24に記載の送信端末。
【請求項26】
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とがあらゆるフレームについて送られる、請求項25に記載の送信端末。
【請求項27】
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とが、ソース制御型パラメータまたはチャネル制御型パラメータまたはその両方に基づいて送られる、請求項25に記載の送信端末。
【請求項28】
前記ソース制御型パラメータが、前記符号化現在フレームにおける固定コードブック寄与に対する前記符号化現在フレームにおける適応コードブック寄与の比を備える、請求項27に記載の送信端末。
【請求項29】
高速復元コーディング中に予測メモリを量子化するためのコンピュータプログラムであって、
現在フレームのための予測メモリを表す最良形状ベクトルを量子化するためのコードと、
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの指示を判断するためのコードと、
前記量子化された最良形状ベクトルを送るべきかどうかを判断するためのコードと、
前記判断に基づいて前記量子化された最良形状ベクトルを送るためのコードと、
符号化現在フレームを送るためのコードと
を含み、コンピュータによって実行可能な複数の命令を備える、コンピュータプログラム。
【請求項30】
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの前記指示の前記判断に基づいて、前記指示を送るためのコードと
をさらに備える、請求項29に記載のコンピュータプログラム。
【請求項31】
送信端末に、前記量子化された最良形状ベクトルを送るべきかどうかの前記判断に基づいて、前記現在フレームのための前記予測メモリの量子化ロケーションと量子化エネルギーとを送らせるためのコードをさらに備える、請求項30に記載のコンピュータプログラム。
【請求項32】
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とがあらゆるフレームについて送られる、請求項31に記載のコンピュータプログラム。
【請求項33】
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とが、ソース制御型パラメータまたはチャネル制御型パラメータまたはその両方に基づいて送られる、請求項31に記載のコンピュータプログラム。
【請求項34】
前記ソース制御型パラメータが、前記符号化現在フレームにおける固定コードブック寄与に対する前記符号化現在フレームにおける適応コードブック寄与の比を備える、請求項33に記載のコンピュータプログラム。
【請求項35】
高速復元コーディング中に量子化予測メモリを使用するための方法であって、
符号化現在フレームと、ロケーション、形状およびエネルギーを備える符号化予測メモリとを受信することと、
前のフレームが消去であった場合、前記受信した符号化予測メモリを復号することと、
前記復号された受信した予測メモリと、1つまたは複数の前の受信したフレームのための前の予測メモリとの中から最良予測メモリを判断することと、
前記前のフレームが消去であった場合、最良予測メモリを使用して前記符号化現在フレームを復号することと
を備える、方法。
【請求項36】
前記最良予測メモリを判断することは、受信した前の予測メモリの予測メモリ比較ビットに基づく、請求項35に記載の方法。
【請求項37】
前記前のフレームが消去でなかった場合、前記前のフレームから判断された予測メモリを使用して前記符号化現在フレームを復号することをさらに備える、請求項35に記載の方法。
【請求項38】
前記符号化予測メモリの前記ロケーションが、前のフレームの一部分において最大振幅をもつ相対ロケーションである、請求項35に記載の方法。
【請求項39】
前記形状が前のフレームの一部分を表す、請求項35に記載の方法。
【請求項40】
前記エネルギーが前のフレームのエネルギーを表す、請求項35に記載の方法。
【請求項41】
プロセッサと、
前記プロセッサと電子通信しているメモリと、
前記メモリに記憶された命令と
を備える、高速復元コーディング中に量子化予測メモリを使用するための受信端末であって、前記命令が、前記プロセッサによって、
符号化現在フレームと、ロケーション、形状およびエネルギーを備える符号化予測メモリとを受信することと、
前のフレームが消去であった場合、前記受信した符号化予測メモリを復号することと、
前記復号された受信した予測メモリと、1つまたは複数の前の受信したフレームのための前の予測メモリとの中から最良予測メモリを判断することと、
前記前のフレームが消去であった場合、最良予測メモリを使用して前記符号化現在フレームを復号することと
を行うように実行可能である、受信端末。
【請求項42】
前記最良予測メモリを判断することは、受信した前の予測メモリの予測メモリ比較ビットに基づく、請求項41に記載の受信端末。
【請求項43】
前記前のフレームが消去でなかった場合、前記前のフレームから判断された予測メモリ使用して前記符号化現在フレームを復号するように実行可能である命令をさらに備える、請求項41に記載の受信端末。
【請求項44】
前記符号化予測メモリの前記ロケーションが、前のフレームの一部分において最大振幅をもつ相対ロケーションである、請求項41に記載の受信端末。
【請求項45】
前記形状が前のフレームの一部分を表す、請求項41に記載の受信端末。
【請求項46】
前記エネルギーが前のフレームのエネルギーを表す、請求項41に記載の受信端末。
【請求項47】
高速復元コーディング中に量子化予測メモリを使用するための受信端末であって、
符号化現在フレームと、ロケーション、形状およびエネルギーを備える符号化予測メモリとを受信するための手段と、
前のフレームが消去であった場合、前記受信した符号化予測メモリを復号するための手段と、
前記復号された受信した予測メモリと、1つまたは複数の前の受信したフレームのための前の予測メモリとの中から最良予測メモリを判断するための手段と、
前記前のフレームが消去であった場合、最良予測メモリを使用して前記符号化現在フレームを復号するための手段と
を備える、受信端末。
【請求項48】
前記最良予測メモリを判断することは、受信した前の予測メモリの予測メモリ比較ビットに基づく、請求項47に記載の受信端末。
【請求項49】
前記前のフレームが消去でなかった場合、前記前のフレームから判断された予測メモリを使用して前記符号化現在フレームを復号することをさらに備える、請求項47に記載の受信端末。
【請求項50】
高速復元コーディング中に量子化予測メモリを使用するためのコンピュータプログラムであって、
受信端末に、符号化現在フレームと、ロケーション、形状およびエネルギーを備える符号化予測メモリとを受信させるためのコードと、
前記受信端末に、前のフレームが消去であった場合、前記受信した符号化予測メモリを復号させるためのコードと、
前記受信端末に、前記復号された受信した予測メモリと、1つまたは複数の前の受信したフレームのための前の予測メモリとの中から最良予測メモリを判断させるためのコードと、
前記受信端末に、前記前のフレームが消去であった場合、最良予測メモリを使用して前記符号化現在フレームを復号させるためのコードと
を含み、コンピュータによって実行可能な複数の命令を備える、コンピュータプログラム。
【請求項51】
前記最良予測メモリを判断することは、受信した前の予測メモリの予測メモリ比較ビットに基づく、請求項50に記載のコンピュータプログラム。
【請求項52】
前記受信端末に、前記前のフレームが消去でなかった場合、前記前のフレームから判断された予測メモリを使用して前記符号化現在フレームを復号させるためのコードをさらに備える、請求項50に記載のコンピュータプログラム。
【発明の詳細な説明】
【関連出願】
【0001】
本出願は、「Systems, Methods, and Apparatus for Error Resilience for Predictive Speech Codecs」と題する2010年8月10日に出願された米国仮特許出願第61/372,398号、および「Using Quantized Prediction Memory During Fast Recovery Coding」と題する2010年8月24日に出願された米国仮特許出願第61/376,602号に関し、その優先権を主張する。
【技術分野】
【0002】
本開示は、一般に、通信システムのための電子デバイスに関する。より詳細には、本開示は、高速復元コーディング中に量子化予測メモリを使用することに関する。
【背景技術】
【0003】
電子デバイス(セルラー電話、ワイヤレスモデム、コンピュータ、デジタル音楽プレーヤ、全地球測位システムユニット、携帯情報端末、ゲームデバイスなど)は、日常生活の一部になっている。現在、自動車からハウジングロックまで、あらゆるものに小型コンピューティングデバイスが入っている。電子デバイスの複雑さは、ここ数年で劇的に増加した。たとえば、多くの電子デバイスは、デバイスを制御するのを助ける1つまたは複数のプロセッサ、ならびにプロセッサとデバイスの他の部分とをサポートするためのいくつかのデジタル回路を有する。
【0004】
ワイヤレス通信システムは、ボイス、ビデオ、データなど、様々なタイプの通信コンテンツを提供するために広く展開されている。これらのシステムは、1つまたは複数の基地局との複数のワイヤレス通信デバイスの同時通信をサポートすることが可能な多元接続システムであり得る。
【0005】
いくつかの構成では、音声の復号の成功は前の音声に依存し得る。これにより、前に受信した音声が破損されていたときに問題が生じることがある。従って、高速復元コーディング中に量子化予測メモリを使用するためのシステムおよび方法によって利益が実現され得る。
【発明の概要】
【0006】
高速復元コーディング中に予測メモリを量子化するための方法を開示する。現在フレームのための予測メモリを表す最良形状ベクトルを量子化する。上記量子化された最良形状ベクトルを送るべきかどうかを判断する。上記判断に基づいて上記量子化された最良形状ベクトルを送る。符号化現在フレームを送る。
【0007】
上記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの指示を判断し得る。上記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの上記判断に基づいて、上記指示を送り得る。上記量子化された最良形状ベクトルを送るべきかどうかの上記判断に基づいて、現在フレームのための予測メモリの量子化ロケーションと量子化エネルギーとを送り得る。
【0008】
上記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、上記指示とが、あらゆるフレームについて送られ得る。代替的に、上記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、上記指示とは、ソース制御型(source-controlled)パラメータまたはチャネル制御型(channel-controlled)パラメータまたはその両方に基づいて送られ得る。ソース制御型パラメータは、符号化現在フレームにおける固定コードブック寄与に対する符号化現在フレームにおける適応コードブック寄与の比を含み得る。チャネル制御型パラメータは、送信チャネルにおける利用可能な帯域幅、またはワイヤレス通信システムにおけるパケットロス率を含み得る。
【0009】
上記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの上記指示を判断し得る。この判断は、符号化現在フレームに対する固定コードブック寄与と、上記形状ベクトルに基づく高速復元適応コードブック寄与とを使用して最良残差信号を再構成することを含み得る。この判断はまた、前の予測メモリを選択し、各前の予測メモリに基づいて前の予測メモリ残差信号を判断することを含み得る。この判断はまた、前の予測メモリ残差信号と上記最良残差信号との比較に基づいて、前の予測メモリ比較ビット中の各選択された前の予測メモリのためのビットを変更することを含み得る。この判断はまた、上記最良形状ベクトルのインデックスと前の予測メモリ比較ビットとを符号化形状ビット中に含めることを含み得る。上記最良残差信号は、最大重み付け信号対雑音比(SNR)をもつ残差信号であり得る。予測メモリのロケーションは、前のフレームの一部分において最大振幅をもつ相対ロケーションであり得る。
【0010】
また、高速復元コーディング中に予測メモリを量子化するための送信端末を開示する。本送信端末は、プロセッサと、プロセッサと電子通信しているメモリとを含む。メモリには実行可能命令が記憶される。本命令は、現在フレームのための予測メモリを表す最良形状ベクトルを量子化するように実行可能である。本命令はまた、上記量子化された最良形状ベクトルを送るべきかどうかを判断するように実行可能である。本命令はまた、上記判断に基づいて上記量子化された最良形状ベクトルを送るように実行可能である。本命令はまた、符号化現在フレームを送るように実行可能である。
【0011】
また、高速復元コーディング中に予測メモリを量子化するための送信端末を開示する。本送信端末は、現在フレームのための予測メモリを表す最良形状ベクトルを量子化するための手段を含む。本送信端末はまた、上記量子化された最良形状ベクトルを送るべきかどうかを判断するための手段を含む。本送信端末はまた、上記判断に基づいて上記量子化された最良形状ベクトルを送るための手段を含む。本送信端末はまた、符号化現在フレームを送るための手段を含む。
【0012】
また、高速復元コーディング中に予測メモリを量子化するためのコンピュータプログラム製品を開示する。コンピュータプログラム製品は、その上に命令を有するコンピュータ可読媒体を備える。本命令は、現在フレームのための予測メモリを表す最良形状ベクトルを量子化するためのコードを含む。本命令はまた、上記量子化された最良形状ベクトルを送るべきかどうかを判断するためのコードを含む。本命令はまた、上記判断に基づいて上記量子化された最良形状ベクトルを送るためのコードを含む。本命令はまた、符号化現在フレームを送るためのコードを含む。
【0013】
また、高速復元コーディング中に量子化予測メモリを使用するための方法を開示する。符号化現在フレームと、ロケーション、形状およびエネルギーを含む符号化予測メモリとを受信する。前のフレームが消去であった場合、受信した符号化予測メモリを復号する。前のフレームが消去であった場合、最良予測メモリを使用して符号化現在フレームを復号する。
【0014】
上記復号された受信した予測メモリと、1つまたは複数の前の受信したフレームのための前の予測メモリとの中から最良予測メモリを判断し得る。前のフレームが消去でなかった場合、記憶された予測メモリを使用して符号化現在フレームを復号し得る。予測メモリの上記ロケーションは、前のフレームの一部分において最大振幅をもつ相対ロケーションであり得る。上記形状は、前のフレームの一部分を表し得る。上記エネルギーは、前のフレームのエネルギーを表し得る。
【0015】
また、高速復元コーディング中に予測メモリを量子化するための受信端末を開示する。本受信端末は、プロセッサと、プロセッサと電子通信しているメモリとを含む。メモリには実行可能命令が記憶される。本命令は、符号化現在フレームと、ロケーション、形状およびエネルギーを備える符号化予測メモリとを受信するように実行可能である。本命令はまた、前のフレームが消去であった場合、受信した符号化予測メモリを復号するように実行可能である。本命令はまた、前のフレームが消去であった場合、最良予測メモリを使用して符号化現在フレームを復号するように実行可能である。
【0016】
また、高速復元コーディング中に量子化予測メモリを使用するための受信端末を開示する。本受信端末は、符号化現在フレームと、ロケーション、形状およびエネルギーを備える符号化予測メモリとを受信するための手段を含む。本受信端末はまた、前のフレームが消去であった場合、受信した符号化予測メモリを復号するための手段を含む。本受信端末はまた、前のフレームが消去であった場合、最良予測メモリを使用して符号化現在フレームを復号するための手段を含む。
【0017】
また、高速復元コーディング中に量子化予測メモリを使用するためのコンピュータプログラム製品を開示する。コンピュータプログラム製品は、その上に命令を有するコンピュータ可読媒体を備える。本命令は、受信端末に、符号化現在フレームと、ロケーション、形状およびエネルギーを備える符号化予測メモリとを受信させるためのコードを含む。本命令はまた、受信端末に、前のフレームが消去であった場合、受信した符号化予測メモリを復号させるためのコードを含む。本命令はまた、受信端末に、前のフレームが消去であった場合、最良予測メモリを使用して符号化現在フレームを復号させるためのコードを含む。
【図面の簡単な説明】
【0018】
図1】高速復元コーディング中に量子化予測メモリを使用するシステムを示すブロック図。
図2】コード励振線形予測(CELP:Code Excited Linear Prediction)を使用する符号化および復号を示す波形のセット。
図3】高速復元コーディング中に予測メモリを量子化するための方法を示す流れ図。
図4】高速復元コーディング中に量子化予測メモリを使用するための方法を示す流れ図。
図5】高速復元ビットを使用する復号を示す波形のセット。
図6】予測メモリモジュールを示すブロック図。
図7】最良予測メモリを探索するための方法を示す流れ図。
図8】送信端末における最良形状ベクトルの探索を示す波形のセット。
図9】高速復元ビットにおいて量子化され得る形状ベクトル候補を示す波形のセット。
図10】たとえば、受信端末における、予測メモリモジュールを示す別のブロック図。
図11】送信端末内に含まれ得るいくつかの構成要素を示す図。
図12】受信端末内に含まれ得るいくつかの構成要素を示す図。
【発明を実施するための形態】
【0019】
詳細な説明
ボイス通信には、パケットロスとフレーム消去とによって品質劣化が生じるという欠点があり得る。拡張可変レートコーデック(EVRC:Enhanced Variable Rate CODEC)または適応マルチレート(AMR:Adaptive Multi-Rate)オーディオコーデックなど、いくつかの音声コーデックは、予測コーデックである。これらのコーデックでは、ビットレートを低減するために、隣接するフレーム間の依存性が活用される。しかしながら、この依存性により、フレーム消去があるときに性能の劣化が生じることがある。言い換えれば、後のフレームの復号はフレームに依拠し得るので、そのフレームの不正確な復号または破損は後のフレームの品質に影響を及ぼし得る。
【0020】
本システムおよび方法は、1つまたは複数のフレーム消去が起こったときに、音声復号がより高速に復元することを可能にするために、誤り耐性(error-resilience)技法を使用し得る。この高速復元コーディングは、(閉ループ量子化方式を使用することによって)品質と、(ソースおよびチャネル制御型方式を使用することによって)ビットレートの両方において最適であり得る。言い換えれば、本システムおよび方法は、ボイス通信においてパケットロスまたはフレーム消去によって生じる品質劣化を緩和し得る。より詳細には、高速復元コーディングは、予測メモリを量子化し、それを通常のコード化ビットとともに送り得る。この予測メモリは、前のフレームが消去であるときに、現在フレームを復号するために使用され得る。さらに、提案する誤り耐性技術は、ソース制御型であるか、チャネル制御型であるか、またはその両方であり得る。
【0021】
図1は、高速復元コーディング中に量子化予測メモリを使用するシステム100を示すブロック図である。システム100は、データを受信端末104に送る送信端末102を含み得る。送信端末102および受信端末104は、フォン、コンピュータ、オーディオブロードキャストおよび受信機器、ビデオ会議機器などを含む、ボイス通信をサポートすることが可能な任意のデバイスであり得る。
【0022】
一構成では、送信端末102または受信端末104は、ワイヤレス通信デバイスまたは基地局であり得る。システム100は、符号分割多元接続(CDMA)機能など、ワイヤレス多元接続技術を用いて実装され得る。CDMAは、スペクトラム拡散通信に基づく変調および多元接続方式である。本明細書で使用する「ワイヤレス通信デバイス」という用語は、ワイヤレスボイス通信、データ通信またはその両方のために使用され得る電子デバイスを指す。ワイヤレス通信デバイスの例には、セルラー電話、携帯情報端末(PDA)、ハンドヘルドデバイス、ワイヤレスモデム、ラップトップコンピュータ、パーソナルコンピュータなどがある。ワイヤレス通信デバイスは、代替的に、アクセス端末、モバイル端末、移動局、リモート局、ユーザ端末、端末、加入者ユニット、加入者局、モバイルデバイス、ワイヤレスデバイス、ユーザ機器(UE)、または何らかの他の同様の用語で呼ばれることがある。「基地局」という用語は、固定ロケーションに設置され、ワイヤレス通信デバイスと通信するために使用される無線通信局を指す。基地局は、代替的に、アクセスポイント、ノードB、発展型ノードB、または何らかの他の同様の用語で呼ばれることがある。
【0023】
送信端末102および受信端末104は、それぞれボコーダ106a〜bを含み得る。ボコーダ106a〜bは、送信端末102においてワイヤレス送信のためのオーディオを符号化または圧縮し、受信端末104においてそのオーディオを復号または非圧縮し得る。送信端末102の少なくとも1つの構成では、音声は、フレーム単位でボコーダ106a〜bに入力され得、各フレームは、サブフレーム、たとえば、20msにさらに区分される。これらの任意のフレーム境界は、いくつかのブロック処理が実行される場合に使用され得る。しかしながら、ブロック処理ではなく連続処理が実装された場合、音声サンプルはフレーム(およびサブフレーム)に区分されないことがある。
【0024】
ボコーダ106a〜bは線形予測符号(LPC)モジュール108a〜bを含み得る。送信端末102にあるLPCモジュール108aは、ホルマント(formant)を推定し、それらの影響を音声から除去することによって音声を分析し得る。その後、残差信号がコーディングされ得る。受信端末104にあるLPCモジュール108bは、プロセスを逆転させることによって音声を合成し得る。特に、受信端末104にあるLPCモジュール108bは、残差音声を使用して音声ソースを作成し、ホルマントを使用して(声道を表す)フィルタを作成し、音声ソースをフィルタにかけて音声を合成し得る。
【0025】
送信端末102におけるLPC分析の後、残差信号がコーディングされ得る。一構成では、コーディングモード110a〜bは、オーディオフレームを符号化および復号するための特定のオーディオフレームの特性、たとえば、プロトタイプピッチ周期(PPP:Prototype Pitch Period)モード、コード励振線形予測(CELP)モード、または雑音励振線形予測(NELP:Noise Excited Linear Prediction)モードに基づいて選定される。たとえば、EVRC−Bは、PPP、CELPおよびNELPを使用し得る。一方、EVRC−WBは、CELPおよびNELPのみを使用し得る。さらに、AMRおよびAMR−WB(2つのユニバーサルモバイル電気通信システム(UMTS:Universal Mobile Telecommunications System)コーデック)は、CELPのみを使用し得る。従って、コーディングのタイプは、使用される特定のシステムに依存し得る。本システムおよび方法についてCELPを使用して説明するが、本明細書で説明する高速復元コーディングは、現在フレームを復号するために前のフレームに依拠する任意の予測コーディング方式を用いて使用され得る。
【0026】
CELPモジュール112a〜bは、不十分な周期性をもつ音声、またはある周期セグメントから別の周期セグメントに変化することを伴う音声を符号化するために使用され得る。従って、CELPは、過渡(transient)音声として分類されるフレームをコーディングするために使用され得る。ただ1つのプロトタイプピッチ周期からそのようなフレームを正確に再構成することは困難であり得るので、CELPモジュール112a〜bは完全な音声フレームの特性を符号化し得る。これは、正確な音声再生をもたらすが、より高いビットレートを使用し得る。CELPコーディングは、適応コードブック114a〜b寄与と固定コードブック116a〜b寄与とを使用し得る。いくつかのコーデックでは、CELPは、有声(voiced)音声フレーム、無声(unvoiced)音声フレームおよび過渡音声フレーム、たとえば、AMR、EVRC、AMR−WBなど、異なる特性をもつすべての音声フレームを符号化するために使用され得る。
【0027】
ボコーダ106a〜bは、他のモジュール118a〜bをも含み得る。たとえば、緩やかに時間変動する周期成分を含む有声音声として分類されるフレームをコーディングするために、プロトタイプピッチ周期(PPP)モジュール(図示せず)が使用され得る。有声音声の周期性を活用することによって、PPPは、CELPよりも低いビットレートを達成し、さらに、知覚的に正確な形で音声信号を再生し得る。さらに、NELPモジュール(図示せず)は、無声音声として分類されるフレームをコーディングし得る。より詳細には、NELPモジュールは、無声音声または背景雑音など、性質が雑音様である音声を符号化するために使用され得る。NELPは、コード化音声について最も単純なモデルを使用し得、従って、より低いビットレートを達成し得る。
【0028】
生成されると、符号化オーディオフレーム120a〜bは受信端末104に送信され得る。しかしながら、符号化オーディオフレーム120a〜bの一部が正しく受信されないことがあり、すなわち、受信端末104においてフレーム消去が宣言されることがある。一構成では、ボコーダ106a〜bは、現在フレームがモデムまたはボイスアプリケーションから消去されるかどうかの指示を受信し得る。いくつかのコーディング技法は、現在フレームを復号するために前のフレームに依拠する。たとえば、CELP復号は、現在フレームにおける適応コードブック114a〜b寄与を判断するために、前のフレームから判断された予測メモリを使用し得る。従って、単一のフレーム消去は、後続のフレームにも悪影響を及ぼし得る。
【0029】
本システムおよび方法は、1つまたは複数のフレーム消去に続く復号された音声の高速復元を可能にするために、本明細書で「高速復元」と呼ぶ、誤り耐性技法を使用し得る。言い換えれば、「高速復元コーディング」という用語は、フレーム消去からのデコーダにおける高速復元を可能にするコーディング方法を指す。予測メモリモジュール122a〜bは、予測メモリを量子化および逆量子化するために使用され得る。予測メモリは、現在フレームを復号するために使用される前のフレームからのデータであり得、すなわち、フレームNのための予測メモリは、フレームN−1の一部または全部を表すデータであり得る。CELPでは、予測メモリはピッチメモリと呼ばれることがある。
【0030】
高速復元コーディング中に、予測メモリは、予測メモリエンコーダ124a〜bによって高速復元ビット128aに量子化され、他の通常の符号化ビットとともに、すなわち、(1つまたは複数の)符号化オーディオフレーム120a〜bとともに送られ得る。消去がない場合、高速復元ビット128bは受信端末104において使用されないことがある。しかしながら、消去に続く第1の良好なフレームにおいて、消去が起こった場合、予測メモリは、(予測メモリデコーダ126a〜bを使用して)高速復元ビット128a〜bから逆量子化され、消去により破損された既存の予測メモリを交換するために使用され得る。量子化予測メモリを使用することによって、現在フレーム中の音声波形は、より正確な形で再構成され得る。
【0031】
高速復元ビット128a〜bは、閉ループ最適基準に基づいて量子化される、ロケーションビット130a〜bと、形状ビット132a〜bと、エネルギービット134a〜bとを含み得る。予測メモリの量子化は、品質とビットレートとの間の最良トレードオフを達成するためにソース制御型およびチャネル制御型であり得る。本明細書で使用する「ソース制御型」という用語は、送信端末102におけるソースオーディオの特性に基づいて行為(たとえば、予測メモリを量子化すること)を制限することを表す。一構成では、予測メモリの量子化は、符号化オーディオフレーム120a〜bにおける固定コードブック116a〜b寄与に対する適応コードブック114a〜b寄与の比に少なくとも部分的に依存し得、たとえば、その比が所定のしきい値よりも高い場合、予測メモリを量子化する。言い換えれば、この比が高い場合、現在フレームは前のフレームに大きく依存し得、従って、予測メモリは、高速復元ビット128a〜bに量子化され、送信され得る。対照的に、比が低いとき、すなわち、現在フレームが前のフレームに大きく依存しないとき、高速復元ビット128a〜bは送られ得ない。代替的に、高速復元ビット128a〜bは、あらゆるフレームについて送られ得るが、それが高速復元ビット128a〜bなしの場合よりも良好な再構成を与えるときのみ使用され得る。本明細書で使用する「チャネル制御型」という用語は、伝送特性に基づいて行為を制限することを表す。たとえば、送信チャネル中に利用可能な帯域幅がある場合、またはパケットロス率が高い場合、予測メモリは、量子化され、送信される可能性がより高くなり得る。
【0032】
図2は、コード励振線形予測(CELP)を使用する符号化および復号を示す波形のセットである。詳細には、図2の上半分は、フレームのインデックスによるLPC分析後の残差音声フレーム248、すなわち、フレーム(N−2)236a、後続のフレーム(N−1)238a、後続の現在フレームN240aを示す。CELPを使用して示しているが、本システムおよび方法は、任意の予測コーディング方法を使用するシステムにおける消去からの高速復元のために使用され得る。CELPでは、エンコーダは、一連のフレーム236a、238a、240aを受信し得る。現在フレームN240aの復号は、フレーム(N−1)238aから判断された(CELPではピッチメモリ246a〜bと呼ばれる)予測メモリに依拠し得る。言い換えれば、フレームN246のためのピッチメモリは、フレーム(N−1)238aから判断され得る。たとえば、フレームN246aのためのピッチメモリは、フレーム(N−1)238a中の最後のピッチサイクルのための残差信号から構築され得る。(フレーム(N−1)238aから判断された)フレームN246aのためのピッチメモリは、適応コードブック寄与242aを判断するために使用され得る。適応コードブック寄与242aと残差音声信号248との間の差は、固定コードブック寄与244aに量子化され得、すなわち、固定コードブック寄与244aは、適応コードブック寄与242a中の量子化誤差を表し得る。従って、符号化オーディオフレームは、適応コードブック寄与242aと固定コードブック寄与244aとを含み得る。
【0033】
図2の下半分は、復号された残差音声信号250を表す。言い換えれば、復号された残差音声信号250は、受信端末104において復号される受信した符号化オーディオフレームを表し得る。復号された残差音声信号250は、復号されたフレーム(N−2)236bと、後続の復号されたフレーム(N−1)238bと、後続の復号された現在フレームN240bとを含み得る。復号されたフレーム(N−1)238bは、正しく復号されていないことがあり、受信端末104においてフレーム消去が宣言されることがある。しかしながら、一構成では、デコーダは、現在フレームN240bの適応コードブック寄与242bを判断するとき、復号されたフレーム(N−1)238bから予測メモリ246bをさらに判断し得る。復号されたフレーム(N−1)238bが破損されているので、復号されたフレーム(N−1)238b中の誤りは、復号された適応コードブック寄与242bに伝搬され得る。従って、最終の復号された現在フレームN240bは、固定コードブック寄与244bが追加された後でも、元の現在フレームN240aの正確な表現でないことがある。
【0034】
受信端末104においてフレームN246bのためのピッチメモリを判断する代わりに、高速復元コーディングでは、送信端末102は、フレームN246aのためのピッチメモリを高速復元ビットに量子化し、それらを受信端末104に送信し得る。受信端末104は、高速復元ビットを予測メモリ(すなわち、CELPでのピッチメモリ)に復号し、現在フレームN240bを復号するために、フレームN246bのためのピッチメモリの代わりに、受信したピッチメモリを使用し得る。これは、フレーム消去に続く誤りの伝搬を低減し得る。
【0035】
図3は、高速復元コーディング中に予測メモリを量子化するための方法300を示す流れ図である。方法300は送信端末102によって実行され得る。302において、送信端末102は、予測コーディング方式、すなわち、CELPなど、現在フレームを復号するために前のフレームに依拠するコーディング方式を使用して現在フレームを符号化する。304において、送信端末102はまた、符号化フレームにおける固定コードブック寄与244aに対する符号化現在フレームにおける適応コードブック寄与242aの比を判断する。この比は、現在フレームが前のフレームに大きく依存するかどうか、すなわち、ソース制御型パラメータを示し得る。306において、送信端末102はまた、ワイヤレス通信システムにおける帯域幅利用可能性またはチャネル状態(またはその両方)、すなわち、チャネル制御型パラメータを判断する。308において、送信端末102はまた、ソース制御型パラメータまたはチャネル制御型パラメータまたはその両方に基づいて、符号化現在フレームとともに予測メモリを送るべきかどうかを判断する。予測メモリは、前のフレーム、すなわち、フレームN−1から判断されたピッチメモリであり得る。予測メモリの送信は、ソース制御型であり得、すなわち、ソース制御型パラメータを使用して判断され得る。たとえば、固定コードブック寄与244aに対する適応コードブック寄与242aの高い比は、前のフレームに大きく依存するフレームを示し得、従って予測メモリは量子化および送信されるべきである。対照的に、低い比は、現在フレームが前のフレームに大きく依存しないことを示し得、従って予測メモリは量子化および送信されるべきでない。同様に、高速復元はまた、帯域幅利用可能性またはチャネル状態に基づいて、すなわち、チャネル制御型パラメータに基づいて適応させられ得る。たとえば、高速復元技法は、任意の指定された平均ビットレートを達成するために適応的に使用可能および使用不能にされ得る。
【0036】
一構成では、予測メモリは、フレームごとに量子化され、受信端末に送られ得、受信端末104はその量子化予測メモリを選択的に使用し得る。この構成では、受信端末104は、高速復元ビット128bが送信端末102によって示される最も正確な再構成された現在フレームを与える場合、すなわち、高速復元ビット128bが最良予測メモリを生成する場合、高速復元ビット128bのみを使用し得る。
【0037】
従って、エンコーダは、常に高速復元ビット128a〜bを送るか、または単に、ソース制御型パラメータまたはチャネル制御型パラメータに基づいて高速復元ビット128a〜bを送り得る。しかしながら、高速復元ビット128a〜bが送られる条件にかかわらず、受信端末は、それらが復元するための最良オプションであるとき、すなわち、高速復元ビット128bが最も正確な予測メモリを生成する場合、高速復元ビット128a〜bのみを使用し得る。
【0038】
308において、送信端末102が、予測メモリを送らないことを判断した場合、310において、送信端末102は、予測メモリなしに符号化現在フレームを送信する。しかしながら、308において、送信端末102が、予測メモリを送ることを判断した場合、312において、送信端末102は、予測メモリのロケーション、形状およびエネルギーを、すなわち、高速復元ビット128a〜bに符号化する。形状ビット132a〜bはピッチメモリの形状を表し得る。エネルギービット134a〜bは、ピッチメモリのエネルギー、またはボリュームを表し得る。非量子化形状は、ピッチメモリに等しいか、それよりも短くなり得る。従って、ロケーションビット130a〜bはいくつかのロケーション情報を記述でき、デコーダが正確な非量子化ピッチメモリを生成するために形状をどこに置くべきかを判断してロケーション情報を使用し得るようにする。一構成では、ロケーションビット130a〜bは、ピッチメモリ内の最大振幅の相対ロケーションを示し得る。言い換えれば、符号化は、高速復元ビットを生成するために予測メモリを量子化することを含み得る。314において、送信端末102はまた、予測メモリの符号化されたロケーション130a〜bと、形状132a〜bと、エネルギー134a〜bとを符号化現在フレームとともに送る。
【0039】
図4は、高速復元コーディング中に量子化予測メモリを使用するための方法400を示す流れ図である。方法400は受信端末104によって実行され得る。402において、受信端末104は、符号化現在フレームと、ロケーションビット130a〜b、形状ビット132a〜b、およびエネルギービット134a〜bを含む符号化予測メモリ(すなわち、高速復元ビット128b)とを受信する。受信端末104は、符号化予測メモリのないフレームとは異なるタイプのフレーム中で符号化予測メモリの知識が受信され得るので、符号化予測メモリの知識を有し得る。404において、受信端末104は、前のフレームが消去であったかどうかを判断する。そうでない場合、412において、受信端末104は、記憶された予測メモリ、すなわち、復号された前のフレームから判断された予測メモリを使用して符号化現在フレームを復号する。言い換えれば、受信端末104は、前のフレームが消去でなかったとき、受信した符号化予測メモリを無視し得る。しかしながら、前のフレームが消去であった場合、406において、受信端末104は、受信した符号化予測メモリを復号する。408において、受信端末104はまた、復号された予測メモリと、1つまたは複数の前の受信したフレームのための前の予測メモリとの中から最良予測メモリを判断する。たとえば、フレームNが現在フレームであるが、フレームN−2(すなわち、消去の前のフレーム)から判断された予測メモリが、高速復元ビット128bよりも正確なフレームNを生成した場合、フレームN−2から判断された予測メモリは、受信した高速復元ビット128bの代わりに使用され得る。一構成では、高速復元ビット128bは、受信端末104が408において、最良予測メモリ、たとえば、高速復元ビット128bが消去の前のフレームのための予測メモリよりも正確な予測メモリを生成するかどうかを判断するのを助けるために、前の予測メモリ比較ビットを含み得る。
【0040】
410において、受信端末104はまた、最良予測メモリを使用して符号化現在フレームを復号する。言い換えれば、前のフレームが消去であったとき、受信端末は、復号された前のフレームから予測メモリを判断するのではなく、受信した予測メモリ(すなわち、高速復元ビット128b)を使用し得る。
【0041】
図5は、高速復元ビットを使用する復号を示す波形のセットである。一番上の波形は、受信端末104において復号された残差音声信号550であり得る。詳細には、フレーム(N−2)536は、受信され、(たとえば、CELPを使用して)正しく復号され得る。しかしながら、フレーム(N−1)538は破損されていることがあり、受信端末104において消去が宣言されることがある。フレーム(N−1)538は、再構成され得るが、それほど正確ではないことがあり、すなわち、最初に符号化されたフレーム(N−1)(図示せず)に一致しないことがある。従って、現在フレームN540のためのピッチメモリが再構成されたフレーム(N−1)538に基づいて判断された場合、フレーム(N−1)538中の誤りは現在フレームN540に伝搬され得る。
【0042】
代わりに、受信端末104は、高速復元ビットに基づくピッチメモリ552を判断し得る。言い換えれば、前のフレーム(N−1)538からピッチメモリを判断するのではなく、受信端末104は、現在フレームN540のためのピッチメモリを判断するために、受信した高速復元ビット128bを使用し得る。適応コードブック寄与542は、高速復元ビット、すなわち、符号化現在フレームNとともに送られた高速復元ビットに基づくピッチメモリ552を使用して判断され得る。次いで、適応コードブック量子化における誤りを表す固定コードブック寄与544は、復号された現在フレームN540を形成するために適応コードブック寄与542に追加され得る。
【0043】
図6は、予測メモリモジュール622を示すブロック図である。予測メモリモジュール622は、予測メモリエンコーダ624と予測メモリデコーダ626とを含み得る。予測メモリエンコーダ624は、受信端末104に送信され得る高速復元ビット628中のロケーションビット630と、形状ビット632と、エネルギービット634とを判断し得る。一構成では、予測メモリの量子化は、CELPコーデック中で利用可能な合成による分析(analysis-by-synthesis)フレームワークを再利用することによる閉ループであり得る。現在のオーディオフレームは、最初に通常の方法でコーディングされ得る。次いで、予測メモリは量子化され得る。
【0044】
LPCモジュール608は、オーディオフレーム/励振信号656から残差信号648を判断し得る。残差信号648の一部分から適応コードブック(ACB)寄与642を判断するために、適応コードブック(ACB)が使用され得、たとえば、現在フレームのための適応コードブック寄与642を判断するために、前のフレームに対応する残差信号648の一部分が使用され得る。適応コードブック寄与642と残差音声信号648との間の差は、固定コードブック616を使用して固定コードブック寄与644に量子化され得、すなわち、固定コードブック寄与644は、適応コードブック寄与642中の量子化誤差を表し得る。従って、符号化されたオーディオフレームは、適応コードブック寄与642と固定コードブック寄与644とを含み得る。
【0045】
予測コーディングを使用するときにデコーダがフレーム消去から復元するのを助ける1つの可能な方法は、エンコーダから予測メモリのロケーション630(たとえば、位相情報)とエネルギー634とを量子化し、送ることであり得る。次いで、デコーダにおいて、人工波形は、送信されたロケーション630とエネルギー634とを使用して作成され、スケーリングされ得る。言い換えれば、この構成は、エンコーダにおいて予測メモリの実際の形状632を量子化しないか、または送らないが、代わりに、デコーダにおいて、たとえば、信号の信号対雑音比などの信号分類パラメータに基づいて人工波形を作成する。しかしながら、人工波形は、予測メモリの実際の形状632に基づかないので、それほど正確でないことがある。対照的に、本システムおよび方法は、形状ベクトルコードブック664を使用して予測メモリの形状632を量子化し得る。従って、本システムおよび方法は、デコーダにおいて、信号分類パラメータに基づく人工波形を使用する構成よりも正確である予測メモリを生成し得る。
【0046】
高速復元ビット628中のロケーションビット630は、残差信号648の一部分において最大振幅の相対ロケーションを判断する最大振幅検出器654を使用して判断され得る。エネルギービット634は、残差信号648に基づいてエネルギー検出器658を使用して判断され得る。たとえば、残差信号648のエネルギーは、スカラー量子化器を使用して量子化され得る。
【0047】
形状ベクトル探索モジュール660は、最良予測メモリを最適に探索するために閉ループ探索を使用し得る。最良予測メモリは、(前のフレームより前の)前のピッチメモリ信号662のセットと形状ベクトルコードブック664との中から判断され得る。最良形状ベクトル670は、形状ベクトルコードブック664における形状ベクトル候補678の間で予測メモリを最も正確に表す形状ベクトルを指すことがある。しかしながら、最良形状ベクトル670は、最良予測メモリを生成しないことがあり、すなわち、前のピッチメモリ信号662のうちの1つがより良好であり得る。最良予測メモリは、最良形状ベクトル670が1つまたは複数の前のフレームのための前の予測メモリ信号662よりも正確であるかどうかを示す前の予測メモリ比較ビット668を使用して示され得る。
【0048】
形状ベクトルコードブック664は、新しいコードブックであり得るか、または他の目的のために使用された既存のコードブックを再利用し得る。「コードベクトル」と「形状ベクトル」という用語は、本明細書では互換的に使用され得る。形状ベクトルは、ピッチメモリの形状を表し得る。たとえば、符号化されている現在フレームがフレームNである場合、形状ベクトルは、フレームN−1の一部分である、現在フレームNのためのピッチメモリを表し得る。形状ベクトルは、直前でない1つまたは複数の前のピッチメモリ信号662から判断され得る。たとえば、フレームNのためのピッチメモリは、フレームN−2またはフレームN−3の一部分から判断され得る。
【0049】
形状ベクトルビット632は、2つの部分を含み得る。第1の部分は、形状ベクトルコードブック664において最良形状ベクトル670のインデックス665を示すビットであり得る。第2の部分は、前のピッチメモリの各々が形状ベクトルコードブック664からの最良形状ベクトル670よりも良好な性能を与えるかどうかを示すビット、すなわち、前の予測メモリ比較ビット668であり得る。たとえば、符号化されている現在フレームがフレームNである場合、前のピッチメモリ(フレームN−2の一部分である、フレームN−1のためのピッチメモリ、およびフレームN−3の一部分である、フレームN−2のためのピッチメモリ)は、現在フレームNのための最良予測メモリの候補として使用され得る。各前のピッチメモリ信号662が形状ベクトルコードブック664からの最良形状ベクトル670よりも正確であるかどうかを示すために、各前のピッチメモリ信号662のための1ビットが前の予測メモリ比較ビット668中に含まれ得る。前のピッチメモリ662は、形状ベクトルコードブックからの最良形状ベクトル670よりも良好な性能を与え得る。しかしながら、現在フレームの前に連続する複数の消去があり得るので、前のピッチメモリ662は、受信端末104において利用可能でないことがある。
【0050】
最良形状ベクトル670を探索するために、形状ベクトル探索モジュール660は、フレームを復号するときのデコーダの行為、すなわち、合成による分析をシミュレートし得る。最初に、形状ベクトル探索モジュール660は、形状ベクトルコードブック664から最良形状ベクトル670を判断し得る。これを行うために、異なる高速復元適応コードブック寄与676が、各形状ベクトル候補678について、すなわち、形状ベクトルコードブック664中の形状ベクトルごとに判断され得る。言い換えれば、高速復元適応コードブック寄与676は、それぞれ、異なる形状ベクトル候補678を使用して、あたかもそれが高速復元ビット628中で受信されたかのように判断され得る。再構成された残差信号672は、各高速復元適応コードブック寄与676を固定コードブック寄与644と組み合わせることによって形成され得る。最良の(最大の)重み付けされた信号対雑音比(SNR)をもつ再構成された残差信号672は、非量子化固定コードブック寄与644が与えられれば、最良形状ベクトル670を見つけるために使用され得、すなわち、元の残差信号648との差が最小である再構成された残差信号672は、最良形状ベクトル670を識別し得る。言い換えれば、最も正確な再構成された残差信号672を形成した高速復元適応コードブック寄与676に関連する形状ベクトル候補678が、最良形状ベクトル670であり得る。一構成では、最良形状ベクトル670を探索するために、たとえば、相関または平均2乗誤差に基づいて各形状ベクトル候補678をピッチメモリと比較するために、より単純な開ループ基準が使用され得る。
【0051】
上記で説明した形状ベクトル探索プロシージャは、形状ベクトルコードブック664における最良形状ベクトル670、すなわち、最良形状ベクトル670を判断するために、最初に使用され得る。高速復元形状ビット128bの第1の部分は、最良形状ベクトル670の形状ベクトルコードブック664内のインデックス665を表し得、すなわち、インデックス665は、量子化形状ベクトル670であり得る。次いで、同じ探索プロシージャは、前のピッチメモリ信号662の各々が最良形状ベクトル670よりも良好な性能を与えるかどうかを判断するために適用され得る。言い換えれば、最良形状ベクトル670は最良予測メモリを生成しないことがあり、たとえば、フレームN−2から判断された予測メモリは、最良形状ベクトル670よりも正確であり得る。従って、高速復元形状ビット632の第2の部分(すなわち、前の予測メモリ比較ビット668)では、前のピッチメモリ信号662の各々について、前のフレームが失われたときに現在フレームの再構成のために、前のピッチメモリ信号662が最良形状ベクトル670よりも正確であるかどうかを示すために1ビットが使用され得る。たとえば、フレームN−1のための前のピッチメモリ信号662とフレームN−2のためのピッチメモリ信号とが、前のフレームが失われたときに現在フレームNの再構成のために、最良形状ベクトル670よりも良好な予測メモリを与えるかどうかを表すために、2ビットが使用され得る。
【0052】
一構成では、符号化フレームは、適応コードブック寄与642と、固定コードブック寄与644と、LPCパラメータ(図示せず)とを含み得る。これらの3つのものは、前のフレームが消去でないときに現在フレームを復号するために受信端末104において使用され得る。しかしながら、さらに、送信端末102は、前のフレームが消去であるときに現在フレームを復号するのを助けるために高速復元ビット628を送り得る。符号化フレームデータは常に送られ得る。しかしながら、高速復元ビット628は、ソース制御型パラメータおよび/またはチャネル制御型パラメータに基づいて条件付きで送られ得る。代替的に、高速復元ビット628はまた、あらゆるフレームについて送られ得る。
【0053】
図7は、最良予測メモリを探索するための方法700を示す流れ図である。方法700は送信端末102によって実行され得る。最良予測メモリは、最良形状ベクトル670または前のピッチメモリ662のいずれかによるものであり得る。
【0054】
702において、送信端末102は、励振信号656(または残差信号648)と適応コードブック614とに基づいて符号化オーディオフレームに対する適応コードブック寄与642を判断する。704において、送信端末102はまた、適応コードブック寄与642を励振信号656(または残差信号648)と比較することによって、固定コードブック寄与644を判断する。706において、送信端末102はまた、形状ベクトルコードブック664から最良形状ベクトル670を選択する。これは、最良の重み付けされた信号対雑音比(SNR)をもつ再構成された残差信号672を生成する形状ベクトル候補678を(形状ベクトルコードブック664から)選択することを含み得る。708において、送信端末102はまた、固定コードブック寄与644と最良形状ベクトル670に基づく高速復元適応コードブック寄与676とに基づいて最良残差信号を再構成し、すなわち、最良残差信号は、最良形状ベクトル670を使用して再構成された残差信号672であり得る。710において、送信端末102はまた、前のピッチメモリ信号662を選択し、前のピッチメモリ信号662に基づいて前のピッチメモリ残差信号を判断し、すなわち、最良形状ベクトル670を使用する代わりに、選択された前のピッチメモリ信号を使用して残差信号を再構成する。
【0055】
712において、送信端末102はまた、前のピッチメモリ残差信号と最良残差信号(すなわち、最良形状ベクトル670に関連する再構成された残差信号672)との比較に基づく前の予測メモリ比較ビット668中の選択された前のピッチメモリ信号662のためのビットを変更する。一構成では、この比較は、前のピッチメモリ残差信号が最良残差信号よりもより良い(最大の)重み付けされた信号対雑音比(SNR)を有するかどうかを判断することを含み得る。前のピッチメモリ信号662の各々のための1ビットは、対応する前のピッチメモリ信号662が最良形状ベクトル670よりも良好であるどうかを示すための前の予測メモリ比較ビット668において送信され得る。より詳細には、形状ベクトルコードブック664における最良形状ベクトル670よりも良好である前のピッチメモリ信号662のための前の予測メモリ比較ビット668中に1が挿入され得、最良形状ベクトル670よりも不良である前のピッチメモリ信号662のために0が挿入され得る。714において、送信端末102はまた、テストされるべきそれ以外の前のピッチメモリ信号662があるかどうかを判断する。はいの場合、送信端末102は、テストすべき新しい前のピッチメモリ信号662を選択し得る。そうでない場合、716において、送信端末102は、形状ベクトルコードブック664からの最良形状ベクトル670のインデックス665と、前の予測メモリ比較ビット668とを高速復元形状ビット628中に含める。
【0056】
図8は、送信端末102における最良形状ベクトル670の探索を示す波形のセットである。一番上の波形は、励振信号656または残差信号848におけるフレームを表す。現在フレームN840のための適応コードブック(ACB)寄与842は、フレーム(N−2)836に続く前のフレーム(N−1)838に基づいて判断され得る。固定コードブック寄与844は、適応コードブック寄与842を励振信号656または残差信号848と比較することによって判断され得、すなわち、固定コードブック寄与844は、適応コードブック寄与842中の誤りを表し得る。これは、従来のCELP符号化に従い得る。
【0057】
しかしながら、高速復元適応コードブック寄与876は各形状ベクトル候補878について判断され得、すなわち、高速復元適応コードブック寄与876は、各形状ベクトル候補878(形状ベクトルコードブック664における各ベクトル)について再び判断される。各高速復元適応コードブック寄与876は、再構成された、すなわち、高速復元に基づく残差信号872を判断するために、固定コードブック寄与844と組み合わせられ得る。最も正確な(すなわち、最良の)再構成された残差信号872は、最良形状ベクトル670を識別するために使用され得る。一構成では、最良の再構成された残差信号872は、最大の重み付けされたSNRをもつ再構成された残差信号872であり得る。最良の再構成された残差信号872における高速復元適応コードブック寄与876を作成するために使用される形状ベクトル候補878は、最良形状ベクトル670であり得る。
【0058】
図9は、高速復元ビットにおいて量子化され得る形状ベクトル候補を示す波形のセットである。一番上の波形は、フレーム(N−2)936と、フレーム(N−1)938と、現在フレームN940とを含み得る残差音声信号948(または励振信号656)を示す。CELPを使用して現在フレームN940を復号するとき、フレームNのためのピッチメモリ946は、フレーム(N−1)938から判断され得る。最良予測メモリを選択するときに、エンコーダは、フレームN−1の前から(たとえば、フレーム(N−2)936、フレーム(N−3)(図示せず)から)の前のピッチメモリ信号962、または事前トレーニングされたコードベクトル(すなわち、形状ベクトル候補978)からの前のピッチメモリ信号962を使用し得る。従って、最良ピッチメモリは、最良形状ベクトル670(すなわち、形状ベクトル候補978のうちの1つ)、または前のピッチメモリ信号962のいずれかから判断され得る。
【0059】
図10は、たとえば、受信端末104における、予測メモリモジュール1022を示す別のブロック図である。予測メモリモジュール1022は、図6に示す予測メモリモジュール622と同様の機能を含み、それと同様のデータを使用し得る。詳細には、予測メモリエンコーダ1024、高速復元ビット1028、ロケーションビット1030、形状ビット1032、形状インデックス1065、前の予測メモリ比較ビット1068、エネルギービット1034、形状ベクトルコードブック1064、適応コードブック1014、固定コードブック1016、およびLPCモジュール1008は、図6に示す予測メモリエンコーダ624、高速復元ビット628、ロケーションビット630、形状ビット632、形状インデックス665、前の予測メモリ比較ビット668、エネルギービット634、形状ベクトルコードブック664、適応コードブック614、固定コードブック616、およびLPCモジュール608に対応し、それらと同様の機能を有し得る。
【0060】
予測メモリモジュール1022は、現在フレームの復号のための最良ピッチメモリ1080を判断する予測メモリデコーダ1026をも含み得る。予測メモリデコーダ1026は、送信端末102から、高速復元ビット1028と、前のピッチメモリ信号1062と、固定コードブックインデックス1084と、LPCパラメータ1086とを受信し得る。消去が前のフレームについて宣言されなかった場合、受信端末104は高速復元ビット1028を使用しないことがある。そうではなく、受信端末104は、前のピッチメモリ信号1062(すなわち、前に受信したフレームから判断されたピッチメモリ信号)を使用して、現在フレームを復号し得る。
【0061】
前のフレームが消去である場合、高速復元ビット1028は、最良ピッチメモリ1080を判断するために使用され得、次いで、最良ピッチメモリ1080は、現在フレームを復号するために、すなわち、現在フレームにおける適応コードブック寄与1042を判断するために使用され得る。最良形状ベクトル1070は、形状ベクトルコードブック1064を使用してインデックスビット1065から判断され得る。最良形状ベクトル1070と、ロケーションビット1030と、エネルギービット1034とは、高速復元ビット1028を使用して、高速復元ピッチメモリ1089、すなわち、現在フレームのために再構成されたピッチメモリを判断するために、高速復元ピッチメモリモジュール1088に入力され得る。
【0062】
次いで、最良ピッチメモリモジュール1082が、高速復元ピッチメモリ1089と(前のフレームから判断された)前のピッチメモリ信号1062とを使用して最良ピッチメモリ1080を判断し得る。これは、前の予測メモリ信号1062が最良形状ベクトル1070よりも良好であり、利用可能であるかどうか、すなわち、消去されていないかどうかを示す高速復元ビット1028中の前の予測メモリ比較ビット1068を使用することを含み得る。比較ビット1068が、前のピッチメモリ信号1062のいずれも(最良形状ベクトル1070から判断された)高速復元ピッチメモリ1089よりも正確でないことを示す場合、高速復元ピッチメモリ1089は、最良ピッチメモリ1080として使用され得る。一方、比較ビット1068が、前のピッチメモリ信号1062のうちの少なくとも1つが(最良形状ベクトル1070から判断された)高速復元ピッチメモリ1089よりも正確であることを示す場合、前のピッチメモリ信号1062のうちの1つは、最良ピッチメモリ1080として使用され得る。高速復元ピッチメモリ1089よりも良好である複数の前のピッチメモリ信号1062がある場合、現在フレームに最も近い前のピッチメモリ信号1062が使用される。
【0063】
最良ピッチメモリ1080が判断されると、最良ピッチメモリ1080は、適応コードブック1014を使用して適応コードブック寄与1042を判断するために使用され得る。固定コードブックインデックス1084は、現在フレームのための再構成された残差信号1072を生成するために、残差信号モジュール1090において適応コードブック寄与1042と組み合わせられる固定コードブック寄与を判断し得る。LPCモジュール1008は、現在フレームのために送信されたLPCパラメータ1086を使用して、再構成された現在フレーム1092を合成し得る。
【0064】
図11は、送信端末1102内に含まれ得るいくつかの構成要素を示す図である。送信端末1102は、ワイヤレス通信デバイスまたは基地局などとも呼ばれることがあり、それらの機能の一部または全部を含み得る。たとえば、送信端末1102は、図1に示す送信端末102であり得る。送信端末1102はプロセッサ1103を含む。プロセッサ1103は、汎用シングルまたはマルチチップマイクロプロセッサ(たとえば、ARM)、特殊目的マイクロプロセッサ(たとえば、デジタル信号プロセッサ(DSP))、マイクロコントローラ、プログラマブルゲートアレイなどであり得る。プロセッサ1103は中央処理ユニット(CPU)と呼ばれることがある。図11の送信端末1102には単一のプロセッサ1103のみが示されるが、代替構成では、プロセッサ(たとえば、ARMとDSP)の組合せが使用され得る。
【0065】
送信端末1102はまたメモリ1105を含む。メモリ1105は、電子情報を記憶することが可能な任意の電子構成要素であり得る。メモリ1105は、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、磁気ディスク記憶メディア、光記憶メディア、RAM中のフラッシュメモリデバイス、プロセッサに含まれるオンボードメモリ、EPROMメモリ、EEPROMメモリ、レジスタなど、およびそれらの組合せとして実施され得る。
【0066】
データ1107aおよび命令1109aは、メモリ1105に記憶され得る。命令1109aは、本明細書で開示する方法を実装するためにプロセッサ1103によって実行可能であり得る。命令1109aを実行することは、メモリ1105に記憶されたデータ1107aの使用を含み得る。プロセッサ1103が命令1109aを実行すると、命令1109bの様々な部分がプロセッサ1103上にロードされ得、様々ないくつかのデータ1107bがプロセッサ1103上にロードされ得る。
【0067】
送信端末1102はまた、送信端末1102との間での信号の送信および受信を可能にするために、送信機1111と受信機1113とを含み得る。送信機1111と受信機1113とはトランシーバ1115と総称され得る。複数のアンテナ1117a〜bはトランシーバ1115に電気的に結合され得る。送信端末1102はまた、複数の送信機、複数の受信機、複数のトランシーバおよび/または追加のアンテナ(図示せず)を含み得る。
【0068】
送信端末1102はデジタル信号プロセッサ(DSP)1121を含み得る。送信端末1102は通信インターフェース1123をも含み得る。通信インターフェース1123は、ユーザが送信端末1102と対話することを可能にし得る。
【0069】
送信端末1102の様々な構成要素は、電力バス、制御信号バス、ステータス信号バス、データバスなどを含み得る1つまたは複数のバスによって互いに結合され得る。明快のために、図11では、様々なバスはバスシステム1119として示してある。
【0070】
図12は、受信端末1204内に含まれ得るいくつかの構成要素を示す図である。受信端末1204は、ワイヤレス通信デバイスまたは基地局であり得る。たとえば、受信端末1204は、図1に示す受信端末104であり得る。受信端末1204はプロセッサ1203を含む。プロセッサ1203は、汎用シングルまたはマルチチップマイクロプロセッサ(たとえば、ARM)、特殊目的マイクロプロセッサ(たとえば、デジタル信号プロセッサ(DSP))、マイクロコントローラ、プログラマブルゲートアレイなどであり得る。プロセッサ1203は中央処理ユニット(CPU)と呼ばれることがある。図12の受信端末1204には単一のプロセッサ1203のみが示されるが、代替構成では、プロセッサ(たとえば、ARMとDSP)の組合せが使用され得る。
【0071】
受信端末1204はメモリ1205も含む。メモリ1205は、電子情報を記憶することが可能な任意の電子構成要素であり得る。メモリ1205は、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、磁気ディスク記憶メディア、光記憶メディア、RAM中のフラッシュメモリデバイス、プロセッサに含まれるオンボードメモリ、EPROMメモリ、EEPROMメモリ、レジスタなど、およびそれらの組合せとして実施され得る。
【0072】
データ1207aおよび命令1209aは、メモリ1205に記憶され得る。命令1209aは、本明細書で開示する方法を実装するためにプロセッサ1203によって実行可能であり得る。命令1209aを実行することは、メモリ1205に記憶されたデータ1207aの使用を含み得る。プロセッサ1203が命令1209aを実行すると、命令1209bの様々な部分がプロセッサ1203上にロードされ得、様々ないくつかのデータ1207bがプロセッサ1203上にロードされ得る。
【0073】
受信端末1204はまた、受信端末1204との間での信号の送信および受信を可能にするために、送信機1211と受信機1213とを含み得る。送信機1211と受信機1213とはトランシーバ1215と総称され得る。複数のアンテナ1217a〜bはトランシーバ1215に電気的に結合され得る。受信端末1204はまた、複数の送信機、複数の受信機、複数のトランシーバおよび/または追加のアンテナ(図示せず)を含み得る。
【0074】
受信端末1204はデジタル信号プロセッサ(DSP)1221を含み得る。受信端末1204は通信インターフェース1223をも含み得る。通信インターフェース1223は、ユーザが受信端末1204と対話することを可能にし得る。
【0075】
受信端末1204の様々な構成要素は、電力バス、制御信号バス、ステータス信号バス、データバスなどを含み得る1つまたは複数のバスによって互いに結合され得る。明快のために、図12では、様々なバスはバスシステム1219として示してある。
【0076】
本明細書に記載の技法は、直交多重化方式に基づく通信システムを含む様々な通信システムに使用され得る。そのような通信システムの例には、直交周波数分割多元接続(OFDMA)システム、シングルキャリア周波数分割多元接続(SC−FDMA)システムなどがある。OFDMAシステムは、全システム帯域幅を複数の直交サブキャリアに区分する変調技法である、直交周波数分割多重(OFDM)を利用する。これらのサブキャリアは、トーン、ビンなどと呼ばれることもある。OFDMでは、各サブキャリアはデータで独立して変調され得る。SC−FDMAシステムは、システム帯域幅にわたって分散されたサブキャリア上で送信するためのインターリーブされたFDMA(IFDMA)、隣接するサブキャリアのブロック上で送信するための局所FDMA(LFDMA)、または隣接するサブキャリアの複数のブロック上で送信するための拡張FDMA(EFDMA)を利用し得る。一般に、変調シンボルは、OFDMでは周波数領域で、SC−FDMAでは時間領域で送られる。
【0077】
「判断」という用語は、多種多様なアクションを包含し、従って、「判断」は、計算、算出、処理、導出、調査、探索(たとえば、テーブル、データベースまたは別のデータ構造での探索)、確認などを含むことができる。また、「判断」は、受信(たとえば、情報を受信すること)、アクセス(たとえば、メモリ中のデータにアクセスすること)などを含むことができる。また、「判断」は、解決、選択、選出、確立などを含むことができる。
【0078】
「に基づいて」という句は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という句は、「のみに基づいて」と「に少なくとも基づいて」の両方を表す。
【0079】
「プロセッサ」という用語は、汎用プロセッサ、中央処理ユニット(CPU)、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、コントローラ、マイクロコントローラ、状態機械などを包含するものと広く解釈されたい。いくつかの状況下では、「プロセッサ」は、特定用途向け集積回路(ASIC)、プログラマブル論理デバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)などを指すことがある。「プロセッサ」という用語は、処理デバイスの組合せ、たとえば、DSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアと連携する1つまたは複数のマイクロプロセッサ、あるいは他のそのような構成を指すことがある。
【0080】
「メモリ」という用語は、電子情報を記憶することが可能な任意の電子構成要素を包含するものと広く解釈されたい。メモリという用語は、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、不揮発性ランダムアクセスメモリ(NVRAM)、プログラマブル読取り専用メモリ(PROM)、消去可能プログラマブル読取り専用メモリ(EPROM)、電気的消去可能PROM(EEPROM)、フラッシュメモリ、磁気または光学データストレージ、レジスタなど、様々なタイプのプロセッサ可読媒体を指すことがある。プロセッサがメモリから情報を読み取り、および/または情報をメモリに書き込むことができる場合、メモリはプロセッサと電子通信していると言われる。プロセッサに一体化されたメモリは、プロセッサと電子通信している。
【0081】
「命令」および「コード」という用語は、任意のタイプの(1つまたは複数の)コンピュータ可読ステートメントを含むものと広く解釈されたい。たとえば、「命令」および「コード」という用語は、1つまたは複数のプログラム、ルーチン、サブルーチン、関数、プロシージャなどを指すことがある。「命令」および「コード」は、単一のコンピュータ可読ステートメントまたは多くのコンピュータ可読ステートメントを備え得る。
【0082】
本明細書で説明する機能は、ハードウェアによって実行されているソフトウェアまたはファームウェアで実装され得る。機能は、1つまたは複数の命令としてコンピュータ可読媒体上に記憶され得る。「コンピュータ可読媒体」という用語は、コンピュータまたはプロセッサによってアクセスされ得る任意の有形記憶媒体を指す。限定ではなく例として、コンピュータ可読媒体は、RAM、ROM、EEPROM、CD−ROM、または他の光ディスクストレージ、磁気ディスクストレージもしくは他の磁気ストレージデバイス、あるいは命令またはデータ構造の形態で所望のプログラムコードを搬送または記憶するために使用され得、コンピュータによってアクセスされ得る任意の他の媒体を備え得る。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザディスク(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびブルーレイ(登録商標)ディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザで光学的に再生する。
【0083】
本明細書で開示する方法は、説明した方法を達成するための1つまたは複数のステップまたはアクションを備える。本方法のステップおよび/またはアクションは、特許請求の範囲の範囲から逸脱することなく互いに交換され得る。言い換えれば、本明細書で説明する方法の適切な動作のためにステップまたはアクションの特定の順序が必要とされない限り、特定のステップおよび/またはアクションの順序および/または使用は、特許請求の範囲から逸脱することなく修正され得る。
【0084】
さらに、図3図4、および図7によって示されたものなど、本明細書で説明する方法および技法を実行するためのモジュールおよび/または他の適切な手段は、デバイスによってダウンロードされ、および/または他の方法で取得され得ることを諒解されたい。たとえば、デバイスは、本明細書で説明する方法を実行するための手段の転送を可能にするために、サーバに結合され得る。代替的に、本明細書で説明する様々な方法は、記憶手段をデバイスに結合するかまたは与えるときにデバイスが様々な方法を獲得し得るように、記憶手段(たとえば、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、コンパクトディスク(disc)(CD)またはフロッピーディスク(disk)などの物理的記憶媒体など)によって提供され得る。
【0085】
特許請求の範囲は、上記に示した正確な構成および構成要素に限定されないことを理解されたい。特許請求の範囲から逸脱することなく、本明細書で説明したシステム、方法、および装置の構成、動作および詳細において、様々な改変、変更および変形が行われ得る。
以下に、出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
高速復元コーディング中に予測メモリを量子化するための方法であって、
現在フレームのための予測メモリを表す最良形状ベクトルを量子化することと、
前記量子化された最良形状ベクトルを送るべきかどうかを判断することと、
前記判断に基づいて前記量子化された最良形状ベクトルを送ることと、
符号化現在フレームを送ることと
を備える、方法。
[C2]
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの指示を判断することと、
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの前記判断に基づいて、前記指示を送ることと
をさらに備える、C1に記載の方法。
[C3]
前記量子化された最良形状ベクトルを送るべきかどうかの前記判断に基づいて、前記現在フレームのための前記予測メモリの量子化ロケーションと量子化エネルギーとを送ることをさらに備える、C2に記載の方法。
[C4]
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とがあらゆるフレームについて送られる、C3に記載の方法。
[C5]
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とが、ソース制御型パラメータまたはチャネル制御型パラメータまたはその両方に基づいて送られる、C3に記載の方法。
[C6]
前記ソース制御型パラメータが、前記符号化現在フレームにおける固定コードブック寄与に対する前記符号化現在フレームにおける適応コードブック寄与の比を備える、C5に記載の方法。
[C7]
前記チャネル制御型パラメータが、送信チャネルにおける利用可能な帯域幅、またはワイヤレス通信システムにおけるパケットロス率を備える、C5に記載の方法。
[C8]
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの前記指示を判断することをさらに備える、C2に記載の方法。
[C9]
前記指示を判断することが、
前記符号化現在フレームに対する固定コードブック寄与と、前記最良形状ベクトルに基づく高速復元適応コードブック寄与とを使用して最良残差信号を再構成することと、
前の予測メモリを選択し、各前の予測メモリに基づいて前の予測メモリ残差信号を判断することと、
前記前の予測メモリ残差信号と前記最良残差信号との比較に基づいて、前の予測メモリ比較ビット中の各選択された前の予測メモリのためのビットを変更することと、
前記量子化された形状ベクトルとの前記前の予測メモリ比較ビットを含めることとを備える、C8に記載の方法。
[C10]
前記最良残差信号が、最大重み付け信号対雑音比(SNR)をもつ残差信号である、C9に記載の方法。
[C11]
前記予測メモリのロケーションが、前のフレームの一部分において最大振幅をもつ相対ロケーションである、C3に記載の方法。
[C12]
プロセッサと、
前記プロセッサと電子通信しているメモリと、
前記メモリに記憶された命令と
を備える、高速復元コーディング中に予測メモリを量子化するための送信端末であって、前記命令が、前記プロセッサによって、
現在フレームのための予測メモリを表す最良形状ベクトルを量子化することと、
前記量子化された最良形状ベクトルを送るべきかどうかを判断することと、
前記判断に基づいて前記量子化された最良形状ベクトルを送ることと、
符号化現在フレームを送ることと
を行うように実行可能である、送信端末。
[C13]
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの指示を判断することと、
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの前記判断に基づいて、前記指示を送ることと
を行うように実行可能な命令をさらに備える、C12に記載の送信端末。
[C14]
前記量子化された最良形状ベクトルを送るべきかどうかの前記判断に基づいて、前記現在フレームのための前記予測メモリの量子化ロケーションと量子化エネルギーとを送るように実行可能な命令をさらに備える、C13に記載の送信端末。
[C15]
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とがあらゆるフレームについて送られる、C14に記載の送信端末。
[C16]
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とが、ソース制御型パラメータまたはチャネル制御型パラメータまたはその両方に基づいて送られる、C14に記載の送信端末。
[C17]
前記ソース制御型パラメータが、前記符号化現在フレームにおける固定コードブック寄与に対する前記符号化現在フレームにおける適応コードブック寄与の比を備える、C16に記載の送信端末。
[C18]
前記チャネル制御型パラメータが、送信チャネルにおける利用可能な帯域幅、またはワイヤレス通信システムにおけるパケットロス率を備える、C16に記載の送信端末。
[C19]
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの前記指示を判断するように実行可能な命令をさらに備える、C13に記載の送信端末。
[C20]
前記指示を判断するように実行可能な命令が、
前記符号化現在フレームに対する固定コードブック寄与と、前記最良形状ベクトルに基づく高速復元適応コードブック寄与とを使用して最良残差信号を再構成することと、
前の予測メモリを選択し、各前の予測メモリに基づいて前の予測メモリ残差信号を判断することと、
前記前の予測メモリ残差信号と前記最良残差信号との比較に基づいて、前の予測メモリ比較ビット中の各選択された前の予測メモリのためのビットを変更することと、
前記量子化された形状ベクトルとの前記前の予測メモリ比較ビットを含めることとを行うように実行可能な命令を備える、C19に記載の送信端末。
[C21]
前記最良残差信号が、最大重み付け信号対雑音比(SNR)をもつ残差信号である、C20に記載の送信端末。
[C22]
前記予測メモリのロケーションが、前のフレームの一部分において最大振幅をもつ相対ロケーションである、C14に記載の送信端末。
[C23]
高速復元コーディング中に予測メモリを量子化するための送信端末であって、
現在フレームのための予測メモリを表す最良形状ベクトルを量子化するための手段と、
前記量子化された最良形状ベクトルを送るべきかどうかを判断するための手段と、
前記判断に基づいて前記量子化された最良形状ベクトルを送るための手段と、
符号化現在フレームを送るための手段と
を備える、送信端末。
[C24]
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの指示を判断するための手段と、
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの前記判断に基づいて、前記指示を送るための手段と
をさらに備える、C23に記載の送信端末。
[C25]
前記量子化された最良形状ベクトルを送るべきかどうかの前記判断に基づいて、前記現在フレームのための前記予測メモリの量子化ロケーションと量子化エネルギーとを送るための手段をさらに備える、C24に記載の送信端末。
[C26]
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とがあらゆるフレームについて送られる、C25に記載の送信端末。
[C27]
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とが、ソース制御型パラメータまたはチャネル制御型パラメータまたはその両方に基づいて送られる、C25に記載の送信端末。
[C28]
前記ソース制御型パラメータが、前記符号化現在フレームにおける固定コードブック寄与に対する前記符号化現在フレームにおける適応コードブック寄与の比を備える、C27に記載の送信端末。
[C29]
高速復元コーディング中に予測メモリを量子化するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品が、命令をその上に有する非一時的コンピュータ可読媒体を備え、前記命令が、
現在フレームのための予測メモリを表す最良形状ベクトルを量子化するためのコードと、
前記量子化された最良形状ベクトルを送るべきかどうかを判断するためのコードと、
前記判断に基づいて前記量子化された最良形状ベクトルを送るためのコードと、
符号化現在フレームを送るためのコードと
を備える、コンピュータプログラム製品。
[C30]
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの指示を判断するためのコードと、
前記最良形状ベクトルが1つまたは複数の前のフレームのための前の予測メモリよりも正確であるかどうかの前記判断に基づいて、前記指示を送るためのコードと
をさらに備える、C23に記載のコンピュータプログラム製品。
[C31]
送信端末に、前記量子化された最良形状ベクトルを送るべきかどうかの前記判断に基づいて、前記現在フレームのための前記予測メモリの量子化ロケーションと量子化エネルギーとを送らせるためのコードをさらに備える、C30に記載のコンピュータプログラム製品。
[C32]
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とがあらゆるフレームについて送られる、C31に記載のコンピュータプログラム製品。
[C33]
前記量子化された最良形状ベクトルと、量子化ロケーションと、量子化エネルギーと、前記指示とが、ソース制御型パラメータまたはチャネル制御型パラメータまたはその両方に基づいて送られる、C31に記載のコンピュータプログラム製品。
[C34]
前記ソース制御型パラメータが、前記符号化現在フレームにおける固定コードブック寄与に対する前記符号化現在フレームにおける適応コードブック寄与の比を備える、C33に記載のコンピュータプログラム製品。
[C35]
高速復元コーディング中に量子化予測メモリを使用するための方法であって、
符号化現在フレームと、ロケーション、形状およびエネルギーを備える符号化予測メモリとを受信することと、
前のフレームが消去であった場合、前記受信した符号化予測メモリを復号することと、
前記前のフレームが消去であった場合、最良予測メモリを使用して前記符号化現在フレームを復号することと
を備える、方法。
[C36]
前記復号された受信した予測メモリと、1つまたは複数の前の受信したフレームのための前の予測メモリとの中から前記最良予測メモリを判断することをさらに備える、C35に記載の方法。
[C37]
前記前のフレームが消去でなかった場合、記憶された予測メモリを使用して前記符号化現在フレームを復号することをさらに備える、C35に記載の方法。
[C38]
前記予測メモリの前記ロケーションが、前のフレームの一部分において最大振幅をもつ相対ロケーションである、C35に記載の方法。
[C39]
前記形状が前のフレームの一部分を表す、C35に記載の方法。
[C40]
前記エネルギーが前のフレームのエネルギーを表す、C35に記載の方法。
[C41]
プロセッサと、
前記プロセッサと電子通信しているメモリと、
前記メモリに記憶された命令と
を備える、高速復元コーディング中に量子化予測メモリを使用するための受信端末であって、前記命令が、前記プロセッサによって、
符号化現在フレームと、ロケーション、形状およびエネルギーを備える符号化予測メモリとを受信することと、
前のフレームが消去であった場合、前記受信した符号化予測メモリを復号することと、
前記前のフレームが消去であった場合、最良予測メモリを使用して前記符号化現在フレームを復号することと
を行うように実行可能である、受信端末。
[C42]
前記復号された受信した予測メモリと、1つまたは複数の前の受信したフレームのための前の予測メモリとの中から前記最良予測メモリを判断するように実行可能である命令をさらに備える、C41に記載の受信端末。
[C43]
前記前のフレームが消去でなかった場合、記憶された予測メモリを使用して前記符号化現在フレームを復号するように実行可能である命令をさらに備える、C41に記載の受信端末。
[C44]
前記予測メモリの前記ロケーションが、前のフレームの一部分において最大振幅をもつ相対ロケーションである、C41に記載の受信端末。
[C45]
前記形状が前のフレームの一部分を表す、C41に記載の受信端末。
[C46]
前記エネルギーが前のフレームのエネルギーを表す、C41に記載の受信端末。
[C47]
高速復元コーディング中に量子化予測メモリを使用するための受信端末であって、
符号化現在フレームと、ロケーション、形状およびエネルギーを備える符号化予測メモリとを受信するための手段と、
前のフレームが消去であった場合、前記受信した符号化予測メモリを復号するための手段と、
前記前のフレームが消去であった場合、最良予測メモリを使用して前記符号化現在フレームを復号するための手段と
を備える、受信端末。
[C48]
前記復号された受信した予測メモリと、1つまたは複数の前の受信したフレームのための前の予測メモリとの中から前記最良予測メモリを判断することをさらに備える、C47に記載の受信端末。
[C49]
前記前のフレームが消去でなかった場合、記憶された予測メモリを使用して前記符号化現在フレームを復号することをさらに備える、C47に記載の受信端末。
[C50]
高速復元コーディング中に量子化予測メモリを使用するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品が、命令をその上に有する非一時的コンピュータ可読媒体を備え、前記命令が、
受信端末に、符号化現在フレームと、ロケーション、形状およびエネルギーを備える符号化予測メモリとを受信させるためのコードと、
受信端末に、前のフレームが消去であった場合、前記受信した符号化予測メモリを復号させるためのコードと、
受信端末に、前記前のフレームが消去であった場合、最良予測メモリを使用して前記符号化現在フレームを復号させるためのコードと
を備える、コンピュータプログラム製品。
[C51]
受信端末に、前記復号された受信した予測メモリと、1つまたは複数の前の受信したフレームのための前の予測メモリとの中から前記最良予測メモリを判断させるためのコードをさらに備える、C50に記載のコンピュータプログラム製品。
[C52]
受信端末に、前記前のフレームが消去でなかった場合、記憶された予測メモリを使用して前記符号化現在フレームを復号させるためのコードをさらに備える、C50に記載のコンピュータプログラム製品。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12