特許6053145 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧

特許6053145符号化装置、復号装置、これらの方法、プログラム、および記録媒体

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6053145

(24)【登録日】2016年12月9日

(45)【発行日】2016年12月27日

(54)【発明の名称】符号化装置、復号装置、これらの方法、プログラム、および記録媒体

(51)【国際特許分類】

G10L 19/08 20130101AFI20161219BHJP

G10L 19/09 20130101ALI20161219BHJP

H03M 7/30 20060101ALI20161219BHJP

【ＦＩ】

G10L19/08 G

G10L19/09

H03M7/30 B

【請求項の数】24

【全頁数】22

(21)【出願番号】特願2013-34554(P2013-34554)

(22)【出願日】2013年2月25日

(65)【公開番号】特開2014-164091(P2014-164091A)

(43)【公開日】2014年9月8日

【審査請求日】2015年6月2日

(73)【特許権者】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(74)【代理人】

【識別番号】100121706

【弁理士】

【氏名又は名称】中尾直樹

(74)【代理人】

【識別番号】100128705

【弁理士】

【氏名又は名称】中村幸雄

(74)【代理人】

【識別番号】100147773

【弁理士】

【氏名又は名称】義村宗洋

(72)【発明者】

【氏名】守谷健弘

(72)【発明者】

【氏名】鎌本優

(72)【発明者】

【氏名】原田登

(72)【発明者】

【氏名】千葉大将

【審査官】大野弘

(56)【参考文献】

【文献】特開平０５−０１９７９６（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ１９／０８

Ｇ１０Ｌ１９／０９

Ｈ０３Ｍ７／３０

(57)【特許請求の範囲】

【請求項1】

所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの１個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
各時間区間について、前記周期化処理部で求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索部と、
を有することを特徴とする符号化装置。

【請求項2】

前記ピッチシャープニング係数決定部は、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項１記載の符号化装置。

【請求項3】

前記ピッチシャープニング係数決定部は、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項１記載の符号化装置。

【請求項4】

所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの１個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列求める周期化処理部と、
各時間区間について、前記周期化処理部で求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索部と、
を有することを特徴とする符号化装置。

【請求項5】

処理対象の時間区間の入力音響信号を線形予測分析し、処理対象の時間区間の入力音響信号に対応する線形予測係数を算出する線形予測分析部をさらに有し、
前記ピッチシャープニング係数決定部は、前記線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項４記載の符号化装置。

【請求項6】

所定時間区間ごとに、ピッチ符号を復号して復号ピッチ周期を得るピッチ符号復号部と、
処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの１個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
を有することを特徴とする復号装置。

【請求項7】

前記ピッチシャープニング係数決定部は、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項６記載の復号装置。

【請求項8】

【請求項9】

処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの１個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
を有することを特徴とする復号装置。

【請求項10】

前記ピッチシャープニング係数決定部は、処理対象の時間区間の線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項９記載の復号装置。

【請求項11】

所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの１個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理ステップと、
各時間区間について、前記周期化処理ステップで求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索ステップと、
を有することを特徴とする符号化方法。

【請求項12】

前記ピッチシャープニング係数決定ステップは、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項１１記載の符号化方法。

【請求項13】

前記ピッチシャープニング係数決定ステップは、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項１１記載の符号化方法。

【請求項14】

所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの１個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理ステップと、
各時間区間について、前記周期化処理ステップで求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索ステップと、
を有することを特徴とする符号化方法。

【請求項15】

処理対象の時間区間の入力音響信号を線形予測分析し、処理対象の時間区間の入力音響信号に対応する線形予測係数を算出する線形予測分析ステップをさらに有し、
前記ピッチシャープニング係数決定ステップは、前記線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項１４記載の符号化方法。

【請求項16】

所定時間区間ごとに、ピッチ符号を復号して復号ピッチ周期を得るピッチ符号復号ステップと、
処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの１個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理ステップと、
を有することを特徴とする復号方法。

【請求項17】

前記ピッチシャープニング係数決定ステップは、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項１６記載の復号方法。

【請求項18】

【請求項19】

処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの１個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列求める周期化処理ステップと、
を有することを特徴とする復号方法。

【請求項20】

前記ピッチシャープニング係数決定ステップは、処理対象の時間区間の線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項１９記載の復号方法。

【請求項21】

請求項１１から１５の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラム。

【請求項22】

請求項１６から２０の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラム。

【請求項23】

請求項１１から１５の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。

【請求項24】

請求項１６から２０の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。

【発明の詳細な説明】

【技術分野】

【0001】

この発明は、音声、音楽等の音信号を符号化または復号する技術に関する。特に、ＣＥＬＰ等の符号化技術において、パルス励振信号をピッチ周期で繰り返して合成するピッチシャープニング技術に関する。

【背景技術】

【0002】

従来は、ＣＥＬＰ（Code Excited Linear Prediction）の符号化および復号において、音声の周期性の表現力を強化するために、固定符号帳から出力されるパルス系列の一部または全部について、基本周期の長さ分を切り出し、切り出し部分をフレーム長に達するまで繰り返し配列することで得られる周期化済みパルス系列を、固定符号帳から出力されるサンプル列の代わりに用いることにより、符号化された信号の符号化歪みを小さくする（符号化品質を向上する）ピッチシャープニング技術がもちいられている（例えば、非特許文献１参照）。例えば、ｊ番目のフレームを処理対象のフレームとしたときに固定符号帳から出力されるパルス系列をｃ_ｆｊとし、ｊ番目のフレームの基本周期の長さをＦ_ｊとしたとき、周期化済みパルス系列ｃ_ｆｊ＝ｃ_ｆｎ（ｎ＝１，・・・，Ｄ_ｊ；Ｄ_ｊはｃ_ｆｊのサンプル数）は

【数1】

と表せる。γは周期化の度合いを決める係数（ピッチシャープニング係数）であり、γの値が大きいほど周期性成分の影響が大きくなることを意味する。
非特許文献１では、γの値として、直前のサブフレームで量子化されたピッチ利得を利用していた（非特許文献１の式(48)参照）。

【0003】

また、特許文献１では、現在のフレームのピッチ利得、または、入力音響信号のスペクトル包絡の傾き（１次の線形予測係数）とパワーを用いて入力音響信号の周期性の程度を推定し、その推定した周期性の程度に応じて周期性が高いほどγの値が大きくなるようにしていた。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】US Patent No. 5,396,576

【非特許文献】

【0005】

【非特許文献1】ITU-T Recommendation G.729 Coding of Speech at 8kbits/s using Conjugate-Structure Algebraic-Code-Excited-Linear-Prediction (CS-ACELP), 1996.

【発明の概要】

【発明が解決しようとする課題】

【0006】

非特許文献１や特許文献１で用いられている現在もしくは過去のフレーム（サブフレーム）のピッチ利得のみ、または、入力音響信号スペクトル包絡の傾きとパワーのみを基準として周期性の高さを判断する方法では、周期化処理による品質向上効果の高さが精度よく判定できない場合があり、十分な品質改善ができないことがあった。

【0007】

この発明の課題は、従来よりも符号化品質を改善できるピッチシャープニング技術を用いた符号化装置、復号装置、これらの方法、プログラムおよび記録媒体を提供することである。

【課題を解決するための手段】

【0008】

本発明では、ピッチシャープニング係数を、処理対象の時間区間と処理対象よりも前の時間区間との間のピッチ周期の差、あるいは、有声音時間区間である可能性の推定値、あるいは、予測利得に基づく値とする。

【発明の効果】

【0009】

本発明では、入力音響信号の周期性を従来よりも精度よく推定し、周期性をより反映したピッチシャープニング係数をもちいることができるので、従来よりも符号化品質を改善できる。

【図面の簡単な説明】

【0010】

【図1】実施形態の符号化装置を説明するためのブロック図。

【図2】実施形態の復号装置を説明するためのブロック図。

【発明を実施するための形態】

【0011】

以下、この発明の実施形態について、詳細に説明する。
［第一実施形態］
＜構成＞
図１に例示するように、第一実施形態の符号化装置１１は、線形予測分析部１１１、適応符号帳１１２、固定符号帳１１３、周期化処理部１１４、周期化済み固定符号帳記憶部１１５、探索制御部１１６、合成フィルタ１１７、ピッチシャープニング係数決定部１１８、およびパラメータ符号化部１１９を有する。探索制御部１１６は、ピッチ分析部１１６１、探索部１１６２、聴覚重み付けフィルタ１１６３、および利得量子化部１１６４を含む。

【0012】

図２に例示するように、第一実施形態の復号装置１２は、適応符号帳１２２、固定符号帳１２３、選択部１２５、合成フィルタ１２７、パラメータ復号部１２９、周期化処理部１２４、およびピッチシャープニング係数決定部１２８を有する。

【0013】

本形態の符号化装置１１および復号装置１２は、例えば、ＣＰＵ(central processing unit)、ＲＡＭ(random-access memory)、ＲＯＭ(read-only memory)等を備えた公知のコンピュータまたは専用のコンピュータにプログラムやデータが読み込まれることで構成された特別な装置である。また、符号化装置１１および復号装置１２の処理部の少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。

【0014】

＜符号化＞
符号化装置１１には、デジタル化され、所定時間区間であるフレームの単位で区分された時系列信号である入力音響信号ｘ（ｎ）（ｎ＝０，...，Ｌ−１、Ｌは２以上の整数、各ｎを「サンプル点」と呼ぶ）が入力される。入力音響信号の例は、音声信号、音楽信号、雑音信号などである。符号化装置１１は、入力音響信号ｘ（ｎ）（ｎ＝０，...，Ｌ−１）を以下のようにフレームごとに符号化する。

【0015】

≪線形予測分析部１１１≫
線形予測分析部１１１は、処理対象のフレーム（「現フレーム」と呼ぶ）に属する各サンプル点ｎ＝０，...，Ｌ−１での入力音響信号ｘ（ｎ）（ｎ＝０，...，Ｌ−１）の線形予測分析を行い、当該現フレームでの全極型の合成フィルタ１１７を特定するための係数の量子化値に対応する符号である線形予測情報ＬＰＣｉｎｆｏ（「予測パラメータ」に含まれる）を出力する。すなわち、線形予測分析部１１１は、フレームごとに、入力音響信号ｘ（ｎ）（ｎ＝０，...，Ｌ−１）に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報ＬＰＣｉｎｆｏを得て出力する。例えば、線形予測分析部１１１は、現フレームの入力音響信号ｘ（ｎ）（ｎ＝０，...，Ｌ−１）に対応する線形予測係数ａ（ｍ）（ｍ＝１，...，Ｐ、Ｐは正の整数である線形予測次数）を算出し、線形予測係数ａ（ｍ）（ｍ＝１，...，Ｐ）を線スペクトル対係数ＬＳＰに変換し、量子化した線スペクトル対係数ＬＳＰに対応する符号を線形予測情報ＬＰＣｉｎｆｏとして出力する。

【0016】

≪固定符号帳１１３≫
固定符号帳１１３には、零でない単位パルスとその極性との組み合わせからなる値を持つ１個以上の信号と零値を持つ１個以上の信号とから構成される複数個のパルス系列（「サンプル列」に相当）を特定するための情報が格納される。ここでは１フレームが４個のサブフレームに等区分される例を示す。すなわち、Ｌ個のサンプル点０，...，Ｌ−１からなるフレームは、サンプル点Ｌ_ｆ（０），...，Ｌ_ｆ（１）−１からなる１番目のサブフレーム（第１サブフレーム）、サンプル点Ｌ_ｆ（１），...，Ｌ_ｆ（２）−１からなる２番目のサブフレーム（第２サブフレーム）、サンプル点Ｌ_ｆ（２），...，Ｌ_ｆ（３）−１からなる３番目のサブフレーム（第３サブフレーム）、およびサンプル点Ｌ_ｆ（３），...，Ｌ_ｆ（４）−１からなる４番目のサブフレーム（第４サブフレーム）に区分される。Ｌ_ｆ（０），Ｌ_ｆ（１），Ｌ_ｆ（２），Ｌ_ｆ（３），Ｌ_ｆ（４）は、Ｌ_ｆ（０）＝０，Ｌ_ｆ（４）＝Ｌ，Ｌ_ｆ（０）＜Ｌ_ｆ（１）＜Ｌ_ｆ（２）＜Ｌ_ｆ（３）＜Ｌ_ｆ（４）を満たす正整数である。第１−４サブフレームに対応するパルス系列ｃ_ｆ１，ｃ_ｆ２，ｃ_ｆ３，ｃ_ｆ４はそれぞれ以下のように表現される。
c_f1=(c_f1(L_f(0)),...,c_f1(L_f(1)-1))
c_f2=(c_f2(L_f(1)),...,c_f2(L_f(2)-1))
c_f3=(c_f3(L_f(2)),...,c_f3(L_f(3)-1))
c_f4=(c_f4(L_f(3)),...,c_f4(L_f(4)-1))

【0017】

≪適応符号帳１１２≫
適応符号帳１１２には、過去の各時点で生成された励振信号が記憶されている。適応符号帳１１２は、第１−４サブフレームの各サブフレームで得られるピッチ周期Ｔ_１，Ｔ_２，Ｔ_３，Ｔ_４に応じて励振信号を遅延させて得られる適応信号成分ｖ（ｎ）（ｎ＝０，...，Ｌ−１）を出力する。小数精度のピッチ周期を用いて適応信号成分ｖ（ｎ）を表現する場合には、ピッチ周期に応じて遅延させた複数の励振信号に重み付き平均操作を行う補間フィルタが用いられる。

【0018】

≪ピッチ分析部１１６１≫
ピッチ分析部１１６１は、サブフレームごとに、入力音響信号ｘ（ｎ）（ｎ＝０，...，Ｌ−１）に対応するピッチ周期Ｔ_１，Ｔ_２，Ｔ_３，Ｔ_４を得て、当該ピッチ周期Ｔ_１，Ｔ_２，Ｔ_３，Ｔ_４と、当該ピッチ周期Ｔ_１，Ｔ_２，Ｔ_３，Ｔ_４を特定するピッチ符号（周期性成分符号）ＣＴ_１，ＣＴ_２，ＣＴ_３，ＣＴ_４と、を出力する。各サブフレームのピッチ符号ＣＴ_１，ＣＴ_２，ＣＴ_３，ＣＴ_４はそれぞれ均一長である。ＣＴ_１，ＣＴ_２，ＣＴ_３，ＣＴ_４それぞれのビット数は、互いに同一であってもよいし、互いに異なっていてもよい。なお、ピッチ周期はピッチ符号を復号することにより得られるのでピッチ分析部１１６１が出力することは必須ではない。ピッチ周期は、サンプル点の間隔の整数倍のみで表現される場合（整数精度）のみならず、サンプル点の間隔の整数倍と小数値（分数値）とを用いて表現される場合（小数精度）もある。また、ピッチ分析部１１６１は、探索部１１６２で用いるために、サブフレームごとに、ピッチ利得ｇ_ｐ１，ｇ_ｐ２，ｇ_ｐ３，ｇ_ｐ４を求めて出力してもよい。

【0019】

入力音響信号ｘ（ｎ）（ｎ＝０，...，Ｌ−１）に対応するピッチ周期Ｔ_１，Ｔ_２，Ｔ_３，Ｔ_４、当該ピッチ周期Ｔ_１，Ｔ_２，Ｔ_３，Ｔ_４を特定するピッチ符号ＣＴ_１，ＣＴ_２，ＣＴ_３，ＣＴ_４の探索は、例えば、サブフレームごとに、適応符号帳１１２に記憶されている過去の各時点で生成された励振信号をピッチ周期の候補で遅延させて得られる信号に線形予測情報ＬＰＣｉｎｆｏによって特定される全極型の合成フィルタ１１７を適用して得られる合成信号と、入力された入力音響信号との差分に、聴覚重み付けフィルタ１１６４を適用した値が最小となるように行われる。

【0020】

ピッチ利得ｇ_ｐ１，ｇ_ｐ２，ｇ_ｐ３，ｇ_ｐ４は、例えば、サブフレームごとに、探索された当該ピッチ周期Ｔ_１，Ｔ_２，Ｔ_３，Ｔ_４に対応する合成信号と入力された入力音響信号との相互相関値を合成信号の自己相関値で除算した値として求められる。

【0021】

≪ピッチシャープニング係数決定部１１８≫
ピッチシャープニング係数決定部１１８は、ピッチ周期が安定している度合いの高いサブフレームのピッチシャープニング係数が、ピッチ周期が安定している度合いの低いサブフレームのピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数を決定する。ピッチ周期が安定している度合いが高い場合は周期性が高いことが想定されるので、ピッチシャープニング係数を大きくし周期化の程度を大きくすることで、品質の向上が期待できる。例えば、処理対象のサブフレーム（現在のサブフレーム）のピッチ周期と処理対象よりも前のサブフレーム（過去のサブフレーム）のピッチ周期との差が小さいほど、ピッチ周期が安定している度合いが高いと言える。

【0022】

そこで、ピッチシャープニング係数決定部１１８は、処理対象のサブフレームをｉ番目のサブフレームとしたとき、ピッチシャープニング係数の値が、ｉ番目のサブフレームのピッチ周期Ｔ_ｉと過去のサブフレームのピッチ周期Ｔ_ｉ-τ（τは１以上の正整数）との差（Ｔ_ｉ−Ｔ_ｉ-τ）の絶対値｜Ｔ_ｉ−Ｔ_ｉ-τ｜に対して単調非増加の関係となるように、ピッチシャープニング係数を決定する。すなわち、｜Ｔ_ｉ−Ｔ_ｉ−τ｜＜｜Ｔ_ｊ−Ｔ_ｊ−τ｜（ｉ≠ｊ）であれば、ｉ番目のサブフレームに対するピッチシャープニング係数が、ｊ番目のサブフレームに対するピッチシャープニング係数よりも大きいか同じ値になる。

【0023】

ピッチシャープニング係数の決定は、上記の関係を維持するように、予め取りうるピッチ周期の差に対応する値（もしくはその範囲）とピッチシャープニング係数との値を対応付けた対応表を用いて決定することができる。このような対応表を例示する。この例では、サブフレーム間のピッチ周期の差の絶対値とシャープニング係数とが対応付けられている。

【0024】

【表1】

【0025】

あるいは、ピッチシャープニング係数決定部１１８は、予め定めたピッチ周期の差に対応する値を引数とする単調非増加関数を用いてピッチシャープニング係数を決定してもよい。ここで、ピッチ周期の差に対応する値としては、例えば、上述のピッチ周期の差の絶対値（｜Ｔ_ｉ−Ｔ_ｉ-τ｜あるいは｜Ｔ_ｉ-τ−Ｔ_ｉ｜）や、絶対値｜Ｔ_ｉ-τ−Ｔ_ｉ｜あるいは｜Ｔ_ｉ-τ−Ｔ_ｉ｜に対して単調非減少の関係にある値などが例示できる。ピッチ周期の差の絶対値｜Ｔ_ｉ−Ｔ_ｉ-τ｜あるいは｜Ｔ_ｉ-τ−Ｔ_ｉ｜が小さい場合は、過去のサブフレームと現在のサブフレームとのピッチ周期が近く、つまり、ピッチ周期の差の絶対値｜Ｔ_ｉ−Ｔ_ｉ-τ｜あるいは｜Ｔ_ｉ-τ−Ｔ_ｉ｜が小さいほどピッチ周期が安定していることを示す。また、ピッチシャープニング係数決定部１１８が、現在のサブフレーム及び過去のサブフレームのピッチ周期の代わりに、現在のフレーム及び過去のフレームのピッチ周期を用いてピッチシャープニング係数を決定しても良い。

【0026】

なお、フレームの先頭のサブフレームについては、過去のフレームの最終サブフレームのピッチ周期を利用して差を計算することもできるし、フレームの先頭のサブフレームだけはピッチ周期の差に無関係に固定のシャープニング係数を設定することもできる。一般には、前のフレーム情報が復号装置１２では入手できない場合に対応できるよう、過去のフレームに依存しない方法が好ましい。例えば、符号化装置１１で符号化した情報をネットワーク等を介して復号装置１２に送信し、復号する状況を考える。このとき、符号化装置１１からは、フレーム毎に符号化された信号が逐次出力され、ネットワーク等を通して復号装置１２に伝送される。復号装置１２では、受け取ったフレームの信号を逐次復号するが、途中で通信が切断されたりすると、前のフレームと連続しているかどうかが分からない状況で、途中のフレームから復号処理を再開する状況も想定される。前のフレームの情報を用いずにフレームごとに独立して復号処理ができるようにすることで、このような状況でも復号装置１２が入力された信号を正しく復号できる。

【0027】

なお、本発明については、符号化装置１１ではフレームの先頭のサブフレームについては過去のフレームの最終サブフレームのピッチ周期を利用して差を計算する構成を採用し、復号装置１２側ではフレームの先頭のサブフレームについては過去のフレームの情報を利用せず独立して復号する構成にすることも、原理的には可能である。この場合、符号化装置１１が意図した係数（符号化装置で用いたピッチシャープニング係数）とは異なる値が復号装置１２で用いられることになるが、これにより出力される最終的な合成波形と正しいピッチシャープニング係数を用いて復号したときの最終的な合成波形との歪みは非常に小さく、この構成でも従来技術よりも高い品質を実現することができる。

【0028】

≪周期化処理部１１４≫
周期化処理部１１４は、ピッチシャープニング係数決定部１１８で決定されたピッチシャープニング係数を用いて、固定符号帳１１３からのパルス系列ｃ_ｆ１，ｃ_ｆ２，ｃ_ｆ３，ｃ_ｆ４を適応プリフィルタP(z)に通すことによりピッチの高調波成分が強調されるように補正し、補正後のパルス系列を周期化済みパルス系列として出力する。つまり、固定符号帳１１３からのパルス系列ｃ_ｆjは以下に従って補正される。

【数2】

ここで、Ｄ_ｊ＋１はパルス系列ｃ_ｆｊの次元数である。ここで、Ｆ_ｊはｊ番目（ｊ＝１，２，３，４）のサブフレームの基本周期の長さであり、γはピッチシャープニング係数決定部１１８で決定されたピッチシャープニング係数である。なお、固定符号帳１１３からのパルス系列ｃ_ｆjが以下に従って補正されてもよい。ただし、以下の例ではピッチシャープニング係数γが０≦γ≦１となる。

【数3】

【0029】

すなわち、周期化処理部１１４は、固定符号帳１１３からのパルス系列ｃ_ｆ１，ｃ_ｆ２，ｃ_ｆ３，ｃ_ｆ４に対し、ピッチシャープニング係数決定部１１８で決定されたピッチシャープニング係数に対応する周期化を行って（ピッチシャープニング係数に対応する度合いの周期化を行って）周期化済みパルス系列を求めて出力する。具体的には、この例の周期化処理部１１４は、Ｄ_ｊ＋１次元のパルス系列（ｃ_ｆｊ（０），・・・，ｃ_ｆｊ（Ｄ_ｊ））と、当該パルス系列（ｃ_ｆｊ（０），・・・，ｃ_ｆｊ（Ｄ_ｊ））をＦ_ｊ（処理対象の時間区間の基本周期Ｆ_ｊに対応する長さ分）遅延させて得られるＤ_ｊ＋１次元の遅延系列（０，・・・，０，ｃ_ｆｊ（０），・・・，ｃ_ｆｊ（Ｄ_ｊ−Ｆ_ｊ））とを、ピッチシャープニング係数γに対応する重み係数で重み付け加算して得られる周期化済みパルス系列^〜ｃ_ｆｊを求めて出力する。なお、遅延系列の先頭の要素からＦ_ｊ番目の要素まではすべて０である。

【0030】

このように、周期化処理部１１４は、固定符号帳１１３の１つのパルス系列ｃ_ｆｊから、適応符号帳１１２において得られるサブフレームの基本周期の長さＦ_ｊを切り出し、切り出し分をサブフレーム長に達するまで繰り返し配列して得られる周期化済みパルス系列^〜ｃ_ｆｊを求めて出力する。これを固定符号帳１１３から出力されるパルス系列の少なくとも一部のパルス系列について行い、周期化済みパルス系列の候補を出力する。なお、周期化しないパルス系列については、γ＝０として得られる~ｃ_ｆｊ（周期化していないパルス系列そのもの）を周期化済みパルス系列の候補として用いてもよい。また、「ｃ」の上付き添え字の「~」は本来「ｃ」の真上に配置されるものであるが、表記上の制約から「~ｃ」と表記する。

【0031】

なお、上述の説明では、適応符号帳１１２において得られる現サブフレームの基本周期の長さＦ_ｊを基準として周期化処理を行う例を示したが、過去のサブフレームの基本周期Ｆ_ｋ（ｊ≠ｋ）や基本周期の定数倍（Ｆ_ｊ／２，Ｆ_ｋ／２，２Ｆ_ｊ，２Ｆ_ｋ等）のように、基本周期と対応した値を基準として周期化処理を行っても良い。なお、基本周期としては、例えば、ピッチ周期の整数部分を用いることができる。

【0032】

≪周期化済み固定符号帳記憶部１１５≫
周期化済み固定符号帳記憶部１１５には、周期化処理部１１４から出力された周期化済みパルス系列（サンプル列）の候補と、当該周期化済みパルス系列の候補に対応する周期化前の固定符号帳中のパルス系列の候補を特定するための情報（コードインデックス）が格納される。

【0033】

≪探索部１１６２≫
探索部１１６２は、サブフレームごとに、周期化済み固定符号帳記憶部１１５を探索し、入力音響信号ｘ（ｎ）（ｎ＝０，...，Ｌ−１）に対応する周期化済みパルス系列~ｃ_ｆ１，~ｃ_ｆ２，~ｃ_ｆ３，~ｃ_ｆ４（周期化済み固定符号帳記憶部１１５からのサンプル列）と、当該周期化済みパルス系列~ｃ_ｆ１，~ｃ_ｆ２，~ｃ_ｆ３，~ｃ_ｆ４に対応するコードインデックスＣ_ｆ１，Ｃ_ｆ２，Ｃ_ｆ３，Ｃ_ｆ４（周期化済みパルス系列~ｃ_ｆ１，~ｃ_ｆ２，~ｃ_ｆ３，~ｃ_ｆ４に対応する周期化前の固定符号帳中のパルス系列を特定するためのコードインデックス）と、を得て出力する。

【0034】

言い換えると、第ｊサブフレーム（ｊ＝１，２，３，４）では、探索部１１６２は、周期化済み固定符号帳記憶部１１５から得られる複数のサンプル列のうち入力音響信号ｘ（ｎ）（ｎ＝Ｌ_{ｆ（ｊ-１）}，...，Ｌ_ｆ（ｊ）−１）に対応する周期化済みパルス系列~ｃ_ｆｊと当該周期化済みパルス系列~ｃ_ｆｊに対応するコードインデックスＣ_ｆｊと、を得て出力する。

【0035】

入力音響信号ｘ（ｎ）（ｎ＝０，...，Ｌ−１）に対応する周期化済みパルス系列~ｃ_ｆ１，~ｃ_ｆ２，~ｃ_ｆ３，~ｃ_ｆ４、および当該周期化済みパルス系列~ｃ_ｆ１，~ｃ_ｆ２，~ｃ_ｆ３，~ｃ_ｆ４に対応するコードインデックスＣ_ｆ１，Ｃ_ｆ２，Ｃ_ｆ３，Ｃ_ｆ４の探索は、例えば、サブフレームごとに、適応信号成分の各サンプルにピッチ利得を乗算して得られるサンプル列と周期化済み固定符号帳記憶部１１５から得られる周期化済みパルス系列の候補とにより得られる励振信号の仮信号に線形予測情報ＬＰＣｉｎｆｏによって特定される全極型の合成フィルタ１１７を適用して得られる合成信号と、入力された入力音響信号との差に、聴覚重み付けフィルタ１１６４を適用した値が最小となるように行われる。

【0036】

≪利得量子化部１１６４≫
利得量子化部１１６４には、ピッチ符号ＣＴ_１，ＣＴ_２，ＣＴ_３，ＣＴ_４、およびコードインデックスＣ_ｆ１，Ｃ_ｆ２，Ｃ_ｆ３，Ｃ_ｆ４が入力される。利得量子化部１１６４は、これらを用いてベクトル量子化を行い、サブフレームごとに、量子化されたピッチ利得と量子化された固定符号帳利得との組に対応する符号を得て出力する。以下では、量子化されたピッチ利得を「量子化済ピッチ利得」と表現し、量子化された固定符号帳利得を「量子化済固定符号帳利得」と表現する。また量子化済ピッチ利得ｇ_ｐ１＾と量子化済固定符号帳利得ｇ_ｃ１＾の組に対応する符号、量子化済ピッチ利得ｇ_ｐ２＾と量子化済固定符号帳利得ｇ_ｃ２＾の組に対応する符号、量子化済ピッチ利得ｇ_ｐ３＾と量子化済固定符号帳利得ｇ_ｃ３＾の組に対応する符号、量子化済ピッチ利得ｇ_ｐ４＾と量子化済固定符号帳利得ｇ_ｃ４＾の組に対応する符号を「利得符号ＧＡ_ｆ１，ＧＡ_ｆ２，ＧＡ_ｆ３，ＧＡ_ｆ４」と表現する。すなわち、利得量子化部１１６４は、第１から第４のサブフレームのそれぞれ（第ｊサブフレーム）について、ピッチ利得ｇ_ｐｊと固定符号帳利得ｇ_ｃｊの組をベクトル量子化し、量子化済ピッチ利得ｇ_ｐｊ＾と量子化済固定符号帳利得ｇ_ｃｊ＾の組を特定する利得符号ＧＡ_ｆｊを得て出力する。

【0037】

このようなベクトル量子化には、例えば、量子化済ピッチ利得と量子化済固定符号帳利得との組に対応する利得符号を特定するためのテーブルである利得符号帳が用いられる。利得符号帳の例は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスとの組が複数個格納されたテーブルである。なお、量子化済ピッチ利得に代えて量子化済ピッチ利得の関数値をベクトル量子化の対象としてもよいし、量子化済固定符号帳利得に代えて量子化済固定符号帳利得の関数値をベクトル量子化の対象としてもよいが、以下では量子化済ピッチ利得そのものと量子化済固定符号帳利得そのものをベクトル量子化の対象とする例について説明する。

【0038】

量子化済固定符号帳利得の関数値の一例は、過去または現在のサブフレーム（又はフレーム）での周期化済み固定符号帳記憶部１１５からの信号成分のエネルギーを基に予測された現在のサブフレーム（又はフレーム）での固定符号帳利得の推定値と、現在のサブフレーム（又はフレーム）での固定符号帳利得との比を表す補正係数（correction factor）などである。補正係数の例は、非特許文献１の「5.8.2 Quantization of codebook gains」の欄に記載されたγ_ｇｃである。例えば、ｊ（ｊ＝１，...，４）番目のサブフレームでの量子化済固定符号帳利得ｇ_ｃｊ＾、補正係数γ_ｇｃの量子化値γ_ｇｃ＾、ｊ（ｊ＝１，...，４）番目のサブフレームでの固定符号帳利得の推定値の量子化値ｐｇ_ｃｊ＾の間には、以下の関係が成り立つ。
g_cj^=γ_gc^×pg_cj^

【0039】

＜利得量子化部１１６４が行うベクトル量子化＞
本発明の利得量子化部１１６４が行うベクトル量子化では、利得符号帳のインデックスとして可変長符号が割り当てられる。インデックスの選択は、例えば、従来技術と同じく符号化歪み（以下「歪み」という）を最小とする基準に基づいてなされる。つまり、利得量子化部１１６４は、入力されたピッチ周期Ｔ_ｊまたはピッチ符号ＣＴ_ｊと、周期化済みパルス系列~ｃ_ｆｊまたはコードインデックスＣ_ｆｊと、に対して、利得符号帳に格納された複数個の符号帳インデックスのうちの何れか１つを選択し、それを利得符号とする。

【0040】

利得符号帳から符号帳インデックスを探す方法は、従来技術と同じでよい。例えば、利得量子化部１１６４は、Ｎ個（Ｎは所定の正整数）のサンプル点からなるサブフレーム（時間区間）ごとに、周期化済み固定符号帳記憶部１１５からの周期化済みパルス系列（周期化済みサンプル列）を合成フィルタ１１７に通して得られるサンプル列Ｚのそれぞれのサンプルに、量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βＺと、過去の励振信号を合成フィルタ１１７に通して得られるサンプル列Ｙのそれぞれのサンプルに、量子化済ピッチ利得の候補αを乗算して得られるサンプル列αＹと、を対応するサンプル毎に加算して得られる合成信号サンプル列αＹ＋βＺと入力音響信号Ｘとの歪みを指標値Ｄとし、指標値Ｄが最も小さくなるインデックスを、利得符号として得て出力する。なお、合成フィルタ１１７に通してサンプル列Ｚを得るための「周期化済み固定符号帳記憶部からの周期化済みパルス系列」は、利得量子化部１１６４に入力されたコードインデックスに対応し、合成フィルタ１１７に通してサンプル列Ｙを得るための「過去の励振信号」は、利得量子化部１１６４に入力されたピッチ符号に対応するピッチ周期に対応するサンプル数だけ過去の励振信号である。各指標値Ｄに対応する量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補と符号帳インデックスとの組は、それぞれ、選択された利得符号帳に格納された量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補と符号帳インデックスとの組の何れかである。サンプル列Ｚに含まれるサンプルの個数、サンプル列Ｙに含まれるサンプルの個数、および合成信号サンプル列αＹ＋βＺに含まれるサンプルの個数は、すべてＮ個である。合成フィルタ１１７は、あるサンプル点ｎのサンプルυ（ｎ）を、そのサンプル点ｎよりも過去のＰ個のサンプル点ｎ−１，ｎ−２，...，ｎ−Ｐのサンプルχ（ｎ−１），χ（ｎ−２），...，χ（ｎ−Ｐ）に線形予測係数ａ（ｎ−１），ａ（ｎ−２），...，ａ（ｎ−Ｐ）を乗算した値ａ（ｎ−１）×χ（ｎ−１），ａ（ｎ−２）×χ（ｎ−２），...，ａ（ｎ−Ｐ）×χ（ｎ−Ｐ）の和で表す線形ＦＩＲ(Finite Impulse Response)フィルタである。なお、Ｐは正の整数である予測次数である。以下に合成フィルタ１１７を表す。
υ(n)=a(1)×χ(n-1)+a(2)×χ(n-2)+...+a(P)×χ(n-P)

【0041】

例えば、サンプル列Ａを合成フィルタ１１７に通してサンプル列Ｃが得られる場合、サンプル列Ａに含まれるサンプルがχ（ｎ−１），χ（ｎ−２），...，χ（ｎ−Ｐ）の少なくとも一部となり、υ（ｎ）がサンプル列Ｃのサンプル点ｎでのサンプルとなる。χ（ｎ−１），χ（ｎ−２），...，χ（ｎ−Ｐ）の少なくとも一部がサンプル列Ａよりも過去のサンプル点に対応する場合、例えば、当該χ（ｎ−１），χ（ｎ−２），...，χ（ｎ−Ｐ）の少なくとも一部はサンプル列Ａより過去のサンプル列に含まれるサンプルとされる。あるいは、サンプル列Ａよりも過去のサンプル列が存在しない場合、当該当該χ（ｎ−１），χ（ｎ−２），...，χ（ｎ−Ｐ）の少なくとも一部は０などの定数とされる。

【0042】

以下に指標値Ｄの具体例を示す。
サブフレームがＮ個のサンプル点Ｓ，...，Ｓ＋Ｎ−１（Ｓは０以上の整数）からなり、サブフレームに属する入力音響信号ＸをベクトルＸ＝（ｘ（Ｓ），...，ｘ（Ｓ＋Ｎ−１））と表現し、サンプル列ＺをベクトルＺ＝（ｚ（Ｓ），...，ｚ（Ｓ＋Ｎ−１））と表現し、サンプル列ＹをベクトルＹ＝（ｙ（Ｓ），...，ｙ（Ｓ＋Ｎ−１））と表現し、サンプル列αＹ＋βＺと入力音響信号Ｘとの二乗誤差を指標値Ｄ（歪み）と定義すると、指標値Ｄは以下のように表される。ただし、σ^Ｔはσの転置を表す。

【数4】

【0043】

例えば、前述した１フレームが４個のサブフレームに等区分される例の場合、第ｊサブフレーム（ｊ＝１，...，４）は、Ｎ＝Ｌ_ｆ（ｊ）−Ｌ_{ｆ（ｊ−１）}個のサンプル点Ｌ_{ｆ（ｊ−１）}，...，Ｌ_ｆ（ｊ）−１からなる。ここで、第ｊサブフレームでの入力音響信号ＸをベクトルＸ_ｊ＝（ｘ（Ｌ_{ｆ（ｊ−１）}），...，ｘ（Ｌ_ｆ（ｊ）−１））と表現する。また、第ｊサブフレームでの周期化済み固定符号帳記憶部１１５からの周期化済みパルス系列~ｃ_ｆｊ＝（~ｃ_ｆｊ（Ｌ_{ｆ（ｊ−１）}），...，~ｃ_ｆｊ（Ｌ_ｆ（ｊ）−１））を合成フィルタ１１７に通して得られるサンプル列ＺをＺ_ｊ＝（ｚ（Ｌ_{ｆ（ｊ−１）}），...，ｚ（Ｌ_ｆ（ｊ）−１））と表現する。さらに、第ｊサブフレームでの適応信号成分（過去の励振信号）ｖ（Ｌ_{ｆ（ｊ−１）}），...，ｖ（Ｌ_ｆ（ｊ）−１）を合成フィルタ１１７に通して得られるサンプル列ＹをベクトルＹ＝（ｙ（Ｌ_{ｆ（ｊ−１）}），...，ｙ（Ｌ_ｆ（ｊ）−１））と表現する。すると、第ｊサブフレームでの指標値Ｄは以下のように表される。

【数5】

ここでは、上述の指標値Ｄが最小となる量子化済ピッチ利得と量子化済固定符号帳利得を選択する例を示したが、他の尺度による歪みや別の方法を用いて量子化済ピッチ利得と量子化済固定符号帳利得を決定する構成としてもよい（＜利得量子化部１１６４が行うベクトル量子化＞の説明終わり）。

【0044】

≪適応符号帳１１２の記憶内容の更新≫
適応符号帳１１２は、利得量子化部１１６４で各サブフレームでの利得符号ＧＡ_ｆ１，ＧＡ_ｆ２，ＧＡ_ｆ３，ＧＡ_ｆ４が得られると、コードインデックスＣ_ｆ１，Ｃ_ｆ２，Ｃ_ｆ３，Ｃ_ｆ４に対応する周期化済みパルス系列~ｃ_ｆ１，~ｃ_ｆ２，~ｃ_ｆ３，~ｃ_ｆ４（周期化済み固定符号帳記憶部１１５からのサンプル列）の各サンプルに量子化済固定符号帳利得ｇ_ｃ１＾，ｇ_ｃ２＾，ｇ_ｃ３＾，ｇ_ｃ４＾を乗算して得られるサンプル列と、サブフレームごとにピッチ周期Ｔ_１，Ｔ_２，Ｔ_３，Ｔ_４に対応するサンプル数だけ過去の励振信号である適応信号成分ｖ（ｎ）（ｎ＝０，...，Ｌ−１）の各サンプルに量子化済ピッチ利得ｇ_ｐ１＾，ｇ_ｐ２＾，ｇ_ｐ３＾，ｇ_ｐ４＾を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号ｕ'（ｎ）（ｎ＝０，...，Ｌ−１）を得て、適応符号帳１１２内に記憶する。
u'(n)=g_p1^×v(n)+g_c1^×~c_f1(n)(n=L_f(0),...,L_f(1)-1)
u'(n)=g_p2^×v(n)+g_c2^×~c_f2(n)(n=L_f(1),...,L_f(2)-1)
u'(n)=g_p3^×v(n)+g_c3^×~c_f3(n)(n=L_f(2),...,L_f(3)-1)
u'(n)=g_p4^×v(n)+g_c4^×~c_f4(n)(n=L_f(3),...,L_f(4)-1)

【0045】

≪パラメータ符号化部１１９≫
また、線形予測情報ＬＰＣｉｎｆｏ、ピッチ周期符号ＣＴ_１，ＣＴ_２，ＣＴ_３，ＣＴ_４、コードインデックスＣ_ｆ１，Ｃ_ｆ２，Ｃ_ｆ３，Ｃ_ｆ４、および利得符号ＧＡ_ｆ１，ＧＡ_ｆ２，ＧＡ_ｆ３，ＧＡ_ｆ４を含む「励振パラメータ」がパラメータ符号化部１１９に入力される。パラメータ符号化部１１９は、励振パラメータに対応する符号であるビットストリームＢＳ（符号）を生成して出力する。

【0046】

＜復号装置１２＞
符号化装置１１（図１）のパラメータ符号化部１１９から出力されたビットストリームＢＳは、入力符号として復号装置１２（図２）のパラメータ復号部１２９に入力される。

【0047】

≪パラメータ復号部１２９≫
パラメータ復号部１２９は、図２に示すように、例えば、パラメータ復号部１２９ａ、ピッチ符号復号部１２９ｂ、および利得符号復号部１２９ｃを含む。

【0048】

≪パラメータ復号部１２９ａ≫
パラメータ復号部１２９ａは、ビットストリームＢＳを入力とし、ビットストリームＢＳに含まれる線形予測情報ＬＰＣｉｎｆｏ、ピッチ符号ＣＴ_１，ＣＴ_２，ＣＴ_３，ＣＴ_４、コードインデックスＣ_ｆ１，Ｃ_ｆ２，Ｃ_ｆ３，Ｃ_ｆ４、および利得符号ＧＡ_ｆ１，ＧＡ_ｆ２，ＧＡ_ｆ３，ＧＡ_ｆ４を得る。得られたＬＰＣｉｎｆｏは合成フィルタ１２７に入力される。また、ピッチ符号ＣＴ_１，ＣＴ_２，ＣＴ_３，ＣＴ_４はピッチ符号復号部１２９ｂに入力される。コードインデックスＣ_ｆ１，Ｃ_ｆ２，Ｃ_ｆ３，Ｃ_ｆ４は選択部１２５に入力される。利得符号ＧＡ_ｆ１，ＧＡ_ｆ２，ＧＡ_ｆ３，ＧＡ_ｆ４は、利得符号復号部１２９ｃに入力される。

【0049】

≪ピッチ符号復号部１２９ｂ≫
ピッチ符号復号部１２９ｂは、得られたピッチ符号（周期性成分符号）ＣＴ_１，ＣＴ_２，ＣＴ_３，ＣＴ_４を復号し、復号ピッチ周期Ｔ_１’，Ｔ_２’，Ｔ_３’，Ｔ_４’を出力する。復号ピッチ周期Ｔ_１’，Ｔ_２’，Ｔ_３’，Ｔ_４’は、適応符号帳１２２およびピッチシャープニング係数決定部１２８に入力される。

【0050】

≪利得符号復号部１２９ｃ≫
利得符号復号部１２９ｃは、入力された利得符号ＧＡ_ｆ１，ＧＡ_ｆ２，ＧＡ_ｆ３，ＧＡ_ｆ４を復号し、復号ピッチ利得ｇ_ｐ１＾，ｇ_ｐ２＾，ｇ_ｐ３＾，ｇ_ｐ４＾および復号固定符号帳利得ｇ_ｃ１＾，ｇ_ｃ２＾，ｇ_ｃ３＾，ｇ_ｃ４＾を得て出力する。具体的には、利得符号復号部１２９ｃは、例えば、符号化装置１１の利得量子化部１１６４が備えるのと同一の利得符号帳を備える。利得符号復号部１２９ｃは、利得符号帳を参照し、入力された利得符号（現在のサブフレームに対応する利得符号）に対応する量子化済ピッチ利得と量子化済固定符号帳利得を復号ピッチ利得ｇ_ｐj＾および復号固定符号帳利得ｇ_ｃj＾として出力する。

【0051】

≪選択部１２５≫
選択部１２５には、コードインデックスＣ_ｆ１，Ｃ_ｆ２，Ｃ_ｆ３，Ｃ_ｆ４が入力される。選択部１２５は、入力されたコードインデックスＣ_ｆ１，Ｃ_ｆ２，Ｃ_ｆ３，Ｃ_ｆ４を用い、固定符号帳１２３に基づき、サブフレームごとに、コードインデックスＣ_ｆ１，Ｃ_ｆ２，Ｃ_ｆ３，Ｃ_ｆ４を復号してパルス系列ｃ_ｆ１，ｃ_ｆ２，ｃ_ｆ３，ｃ_ｆ４を得て出力する。固定符号帳１２３は、符号化装置１１が備える固定符号帳１１３と同一である。

【0052】

≪ピッチシャープニング係数決定部１２８≫
ピッチシャープニング係数決定部１２８は、符号化装置１１のピッチシャープニング係数決定部１１８と同様の処理により、ピッチシャープニング係数の値を決定する。つまり、ピッチシャープニング係数決定部１２８は、符号化装置１１で用いたものと同じ対応表、もしくは関数を用いてピッチシャープニング係数の値を決定する。ただし、ピッチ周期としては、復号装置１２で得た復号ピッチ周期を用いる。その他は、ピッチシャープニング係数決定部１１８と同じである。

【0053】

≪周期化処理部１２４≫
周期化処理部１２４は、符号化装置１１の周期化処理部１１４と同様の処理により、固定符号帳１２３からのパルス系列ｃ_ｆ１，ｃ_ｆ２，ｃ_ｆ３，ｃ_ｆ４を周期化した周期化済みパルス系列~ｃ’_ｆ１，~ｃ’_ｆ２，~ｃ’_ｆ３，~ｃ’_ｆ４を出力する。ただし、ピッチシャープニング係数としては、ピッチシャープニング係数決定部１２８で決定されたピッチシャープニング係数を用いる。なお、周期化の基準としては、符号化装置１１で用いたものと同じ基準を用いるものとする。つまり、符号化装置１１において現サブフレームのパルス周期Ｔ_ｊの２倍の周期（２Ｔ_ｊ）で周期化処理をした場合（２Ｆ_ｊ＝２Ｔ_ｊで周期化処理をした場合）は、復号化装置１２においても、ピッチ符号復号部１２９ｂで得られた復号ピッチ周期Ｔ_ｊ’の２倍の周期（２Ｔ_ｊ’）で周期化処理を行うものとする。

【0054】

≪適応符号帳１２２≫
適応符号帳１２２は、入力された復号ピッチ周期Ｔ_１’，Ｔ_２’，Ｔ_３’，Ｔ_４’で特定される適応信号成分ｖ’（ｎ）（ｎ＝０，...，Ｌ−１）を出力する。

【0055】

周期化処理部１２４から出力された周期化済みパルス系列~ｃ’_ｆ１，~ｃ’_ｆ２，~ｃ’_ｆ３，~ｃ’_ｆ４に復号固定符号帳利得ｇ_ｃ１＾，ｇ_ｃ２＾，ｇ_ｃ３＾，ｇ_ｃ４＾を乗算して得られるサンプル列と、適応信号成分ｖ’（ｎ）（ｎ＝０，...，Ｌ−１）に復号ピッチ利得ｇ_ｐ１＾，ｇ_ｐ２＾，ｇ_ｐ３＾，ｇ_ｐ４＾を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号ｕ’（ｎ）（ｎ＝０，...，Ｌ−１）が、適応符号帳１２２に追加される。
u'(n)=g_p1^×v'(n)+g_c1^×~c’_f1(n)(n=L_f(0),...,L_f(1)-1)
u'(n)=g_p2^×v'(n)+g_c2^×~c’_f2(n)(n=L_f(1),...,L_f(2)-1)
u'(n)=g_p3^×v'(n)+g_c3^×~c’_f3(n)(n=L_f(2),...,L_f(3)-1)
u'(n)=g_p4^×v'(n)+g_c4^×~c’_f4(n)(n=L_f(3),...,L_f(4)-1)

【0056】

≪合成フィルタ１２７≫
励振信号ｕ’（ｎ）（ｎ＝０，...，Ｌ−１）に、線形予測情報ＬＰＣｉｎｆｏによって特定される全極型の合成フィルタ１２７が適用され、それによって生成された合成信号ｘ’（ｎ）（ｎ＝０，...，Ｌ−１）が出力される。

【0057】

［第二実施形態］
＜構成＞
図１に例示するように、第二実施形態の符号化装置２１は、ピッチシャープニング係数決定部１１８に代えてピッチシャープニング係数決定部２１８を備え、ピッチシャープニング係数決定部２１８において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置１１と同じである。

【0058】

図２に例示するように、第二実施形態の復号装置２２は、ピッチシャープニング係数決定部１２８に代えてピッチシャープニング係数決定部２２８を備え、ピッチシャープニング係数決定部２２８において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の復号装置１２と同じである。

【0059】

＜符号化＞
ピッチシャープニング係数決定部２１８の処理以外は、第一実施形態の符号化装置１１と同じである。

【0060】

≪ピッチシャープニング係数決定部２１８≫
ピッチシャープニング係数決定部２１８は、現在のサブフレームの音声波形の振幅が大きい時のピッチシャープニング係数が、振幅が小さい時のピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数の値を決定する。音声波形の振幅が大きい時は、入力音響信号の周期性が高く、周期化処理による品質向上効果が高くなることが期待される。音声波形の振幅が大きいか否かは、例えば、現在のサブフレームのピッチ周期と過去のサブフレームのピッチ周期との差の符号、すなわち、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも大きいか否かを用いて判断することができる。差の極性（正負の符号）が負（Ｔ_ｉ−Ｔ_ｉ−τ＜０）の場合は、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも小さい、すなわち、ピッチ周期が次第に短くなることを示す。差の正負符号が正の場合（Ｔ_ｉ−Ｔ_ｉ−τ＞０）は、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも大きい、すなわち、ピッチ周期が次第に長くなることを示す。ピッチ周期が次第に短くなるときは音声が高くなる時であり、音声波形の振幅もやや大きくなる傾向にある。反対に次第に長くなるときは音声が低くなる時であるので、音声波形の振幅も小さくなる場合が多い。この現象を反映して、ピッチシャープニング係数決定部は２１８、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期より短い場合のピッチシャープニング係数が、長い場合のピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数の値を決定する。これにより、歪が小さくなり、品質の向上が期待できる。このようなピッチシャープニング係数の決定は、上記の関係を維持するように、予め取りうるピッチ周期の差に対応する値（もしくはその範囲）と、或るサブフレーム（例えば現在のサブフレーム）のピッチ周期の長さとそれよりも過去のサブフレームのピッチ周期の長さとの差に対応するピッチシャープニング係数との値を対応付けた対応表を用いて決定することができる。対応表の例を以下に示す。

【表2】

あるいは、ピッチシャープニング係数決定部２１８は、予め定めたピッチ周期の差に対応する値、および、或るサブフレームのピッチ周期の長さとそれよりも過去のサブフレームのピッチ周期の長さとの差に対応する値を引数としてピッチシャープニング係数を得る関数を用い、上記の関係を維持するピッチシャープニング係数を決定してもよい。

【0061】

＜復号＞
第二実施形態の復号装置２２におけるピッチシャープニング係数決定部２２８は、第二実施形態の符号化装置２１のピッチシャープニング係数決定部２１８と同じ基準（関数値、もしくは、対応表）を用いて、ピッチシャープニング係数を決定する。ただし、ピッチ周期としては、復号装置２２で得た復号ピッチ周期を用いる。その他は、第一実施形態と同じである。

【0062】

［第三実施形態］
＜構成＞
図１に例示するように、第三実施形態の符号化装置３１は、ピッチシャープニング係数決定部１１８に代えてピッチシャープニング係数決定部３１８を備え、ピッチシャープニング係数決定部３１８において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置１１と同じである。

【0063】

図２に例示するように、第三実施形態の復号装置３２は、ピッチシャープニング係数決定部１２８に代えてピッチシャープニング係数決定部３２８を備え、ピッチシャープニング係数決定部３２８において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の復号装置１２と同じである。

【0064】

＜符号化＞
第三実施形態の符号化装置３１の処理は、ピッチシャープニング係数決定部３１８の処理以外、第一実施形態と同じである。

【0065】

≪ピッチシャープニング係数決定部３１８≫
ピッチシャープニング係数決定部３１８は、有声音サブフレームである可能性の高いサブフレームのピッチシャープニング係数が、そうでないサブフレームのピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数を決定する。人の声は周期性が高いので、有声サブフレームの方がそうでないサブフレームと比較して周期性成分が多く含まれる可能性が高い。そのため、人の声を符号化する場合には、周期化処理による品質向上効果が高いことが期待できる。有声サブフレームである可能性の高さは、例えば、線形予測分析部１１１で得た現在のフレームに対する線形予測係数から算出される予測利得により判断できる。入力音響信号が有声音の場合、波形の予測利得が大きくなる傾向が強い。予測利得ｇは、k_ｉを予測次数ｉでのPARCOR係数とし、ｐを最高予測次数として

【数6】

で与えられる。ACELPではｐ次の線形予測係数はパルス位置を探索する前にフレームごとに計算され、LSPパラメータなどによって量子化される。符号化装置３１および復号装置３２は、合成フィルタ１１７，１２７を構成するために用いる量子化後の線形予測係数から同じPARCOR係数を算出することができる。

【0066】

なお、予測利得ｇそのものではなく、予測利得の単調非減少関数値（例えばlog(g)や(g/(g+1))のように、予測利得に対応する値を用いても良い。また、予測利得に対応する値として、或る次数のPARCOR係数の大きさ（例えば、１次のPARCOR係数の絶対値｜k_１｜）やそれに対応する値（例えば｜k_１｜^２やk_１^２）を用いてもよい。

【0067】

ピッチシャープニング係数決定部３１８は、予測利得に対応する値が大きい場合のピッチシャープニング係数が、予測利得に対応する値が小さい場合のピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数を決定する。例えば、予測利得に対応する値に対して単調非減少の関係となるようにピッチシャープニング係数を決定すればよい。あるいは、上記の関係を維持するように、予め取りうる予測利得に対応する値（またはその範囲）とピッチシャープニング係数との値を対応付けた対応表を用いて決定しても良い。

【0068】

＜復号＞
第三実施形態の復号装置３２におけるピッチシャープニング係数決定部３２８は、第三実施形態の符号化装置３１のピッチシャープニング係数決定部３１８と同じ基準（関数値、もしくは、対応表）を用いて、ピッチシャープニング係数を決定する。ただし、ピッチ周期としては、復号装置３２で得た復号ピッチ周期を用いる。その他は、第一実施形態と同じである。

【0069】

［第四実施形態］
＜構成＞
図１に例示するように、第四実施形態の符号化装置４１は、ピッチシャープニング係数決定部１１８に代えてピッチシャープニング係数決定部４１８を備え、ピッチシャープニング係数決定部４１８において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置１１と同じである。

【0070】

図２に例示するように、第四実施形態の復号装置４２は、ピッチシャープニング係数決定部１２８に代えてピッチシャープニング係数決定部４２８を備え、ピッチシャープニング係数決定部４２８において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の復号装置１２と同じである。

【0071】

＜符号化＞
第四実施形態の符号化装置４１のピッチシャープニング係数決定部４１８の処理は、第一実施形態から第三実施形態のピッチシャープニング係数決定部１１８〜３１８で用いた処理を組み合わせたものである。その他の処理は、第一実施形態と同じである。

【0072】

≪ピッチシャープニング係数決定部４１８≫
ピッチシャープニング係数決定部４１８は、第１実施形態から第３実施形態を組み合わせた方法で、ピッチシャープニング係数を決定する。例えば、ピッチシャープニング係数決定部４１８は、現在のサブフレームのピッチ周期の安定している度合いが高いときのピッチシャープニング係数が、ピッチ周期の安定している度合いが低いときのピッチシャープニング係数より小さくならないように、かつ、有声音サブフレームである可能性が高いときのピッチシャープニング係数がそうでないサブフレームのピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数の値を決定する。例えば、ピッチシャープニング係数決定部４１８は、現在のサブフレームと過去のサブフレームとのピッチ周期の差の絶対値が小さく、かつ、線形予測分析部で得た予測利得の値に対して単調非減少の関係となる値をピッチシャープニング係数として決定する。対応表の例を表３に示す。予測利得は１以上で現実的には1000程度までの値を取りうる。(g/(g+1))は0.5から約1の値をとる。

【表3】

【0073】

あるいは、予測利得の取りうる範囲毎に別の対応表を用意し、シャープニング係数決定部４１８が、予測利得の値に応じて対応表を選択し、選択した対応表に基づいてピッチシャープニング係数を決定しても良い。なお、各対応表は、或るサブフレーム（例えば現在のサブフレーム）と過去のサブフレームのピッチ周期の差に対応する値（もしくはその範囲）とピッチシャープニング係数とが対応付けられているものとする。対応表の例を示す。この例では、サブフレーム間のピッチ周期の差の絶対値と、典型的有声フレームでのシャープニング係数と、通常フレームでのシャープニング係数とが対応付けられている。

【表4】

【0074】

なお、上記の例では、典型的有声フレームと通常フレームの場合のピッチ周期の差の粒度（対応表の粒度）を同じにしているが、各対応表で粒度が異なっていても良い。また、或るサブフレーム（例えば現在のサブフレーム）と過去のサブフレームのピッチ周期の差の絶対値の取りうる範囲毎に別の対応表を用意し、ピッチ周期の差の絶対値に応じて対応表を選択し、選択した対応表に基づいてピッチシャープニング係数を決定しても良い。この場合、各対応表は、予測利得の取りうる値（またはその範囲）とピッチシャープニング係数とが対応付け有れているものとする。この場合も、各対応表で予測利得の分類の粒度を変えても良い。また、ピッチ周期の差の粒度に応じて、予測利得の分類の粒度を変えてもよい。たとえば差が0の場合のみ、予測利得の分類をさらに細かくして係数を変化させ、その他の差については予測利得と無関係に係数を設定することも可能である。

【0075】

また、上記の実施形態では、サブフレーム単位でピッチシャープニング係数を決定する構成としたが、フレーム単位でピッチシャープニング係数を決定してもよい。つまり、フレーム単位で、周期性に応じて決定されたピッチシャープニング係数を用いて、周期化済みパルス系列を得る構成としてもよい。すなわち、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差に基づいてピッチシャープニング係数を決定してもよい。また、有声音フレームである可能性の高いフレームのピッチシャープニング係数が、そうでないフレームのピッチシャープニング係数よりも小さくならないように、フレーム単位でピッチシャープニング係数を決定してもよい。すなわち、有声音時間区間である可能性の高いフレームのピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、時間区間単位でピッチシャープニング係数を決定してもよい。

【0076】

また、入力音響信号の周期性が高い場合にはその定常性も高いため、上述の各実施形態における「周期性」を「定常性」に置き換えてもよい。

【0077】

また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

【0078】

また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。

【0079】

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な（non-transitory）記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。

【0080】

このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

【0081】

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。

【0082】

上記実施形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部がハードウェアで実現されてもよい。

【符号の説明】

【0083】

符号化装置１１〜４１
復号装置１２〜４２

【図1】

【図2】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第6053145号(P6053145)IP Force 特許公報掲載プロジェクト 2022.1.31 β版