特許5994073 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社アクセルの特許一覧

特許5994073音声信号圧縮装置及び音声信号圧縮方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5994073

(24)【登録日】2016年9月2日

(45)【発行日】2016年9月21日

(54)【発明の名称】音声信号圧縮装置及び音声信号圧縮方法

(51)【国際特許分類】

G10L 19/00 20130101AFI20160908BHJP

【ＦＩ】

G10L19/00 220F

【請求項の数】6

【全頁数】20

(21)【出願番号】特願2013-16764(P2013-16764)

(22)【出願日】2013年1月31日

(65)【公開番号】特開2014-149342(P2014-149342A)

(43)【公開日】2014年8月21日

【審査請求日】2014年11月18日

(73)【特許権者】

【識別番号】398034168

【氏名又は名称】株式会社アクセル

(74)【代理人】

【識別番号】100104776

【弁理士】

【氏名又は名称】佐野弘

(74)【代理人】

【識別番号】100119194

【弁理士】

【氏名又は名称】石井明夫

(72)【発明者】

【氏名】小島悠貴

(72)【発明者】

【氏名】倉成智久

【審査官】安田勇太

(56)【参考文献】

【文献】特開平０５−１０２８６０（ＪＰ，Ａ）

【文献】特開２００４−２４１８３９（ＪＰ，Ａ）

【文献】特表２００７−５３４２２９（ＪＰ，Ａ）

【文献】特開平１０−０６５９２５（ＪＰ，Ａ）

【文献】特表２０１１−５２８８０７（ＪＰ，Ａ）

【文献】特開平０９−１０２７４４（ＪＰ，Ａ）

【文献】特表２００５−５２２７２１（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ１９／００ −１９／２６

Ｈ０３Ｍ７／３８

(57)【特許請求の範囲】

【請求項1】

音声信号の予測符号化において、任意の処理により前記音声信号の符号量を削減する音声信号圧縮装置であって、
前記音声信号の信号成分の特徴を検出する特徴検出手段と、
前記特徴検出手段によって検出された複数の前記特徴の相違を誤差として検出する誤差検出手段とを備え、
該誤差検出手段は、既に検出済の前記特徴に基づいて記録された、前記信号成分の予測情報である前記特徴の標本と、前記特徴検出手段によって検出され対比対象として着目する前記特徴としての対比特徴とを対比して、前記標本と前記対比特徴との差分を誤差として検出し、該検出された前記誤差を前記標本に加えて新たな前記標本を生成し、該新たに生成された前記標本を該生成後の前記対比特徴との対比に用いることを特徴とする音声信号圧縮装置。

【請求項2】

前記誤差検出手段は、検出された複数の前記誤差の平均値を算出し、該算出された誤差の平均値を前記標本に加えて新たな前記標本を生成することを特徴とする請求項１に記載の音声信号圧縮装置。

【請求項3】

前記誤差検出手段は、直前二つの前記標本に対する前記誤差の値に基づいて、次の前記標本を算出することを特徴とする請求項１又は２に記載の音声信号圧縮装置。

【請求項4】

前記誤差検出手段によって検出された前記誤差に対し、出現頻度の高い数値ほど短い信号値を割り当てる信号値割り当て手段を備えたことを特徴とする請求項１乃至３の何れか一つに記載の音声信号圧縮装置。

【請求項5】

前記誤差検出手段によって検出された前記誤差について、任意の範囲内の数値を任意の数値に置き換える丸め処理を行う丸め処理手段を備えたことを特徴とする請求項１乃至４の何れか一つに記載の音声信号圧縮装置。

【請求項6】

音声信号の予測符号化において、任意の処理により前記音声信号の符号量を削減する音声信号圧縮方法であって、
前記音声信号の信号成分の特徴を検出する特徴検出手順と、
前記特徴検出手順において検出された複数の前記特徴の相違を誤差として検出する誤差検出手順とを備え、
該誤差検出手順においては、既に検出済の前記特徴に基づいて記録された、前記信号成分の予測情報である前記特徴の標本と、前記特徴検出手順において検出され対比対象として着目する前記特徴としての対比特徴とを対比して、前記標本と前記対比特徴との差分を誤差として検出し、該検出された前記誤差を前記標本に加えて新たな前記標本を生成し、該新たに生成された前記標本を該生成後の前記対比特徴との対比に用いることを特徴とする音声信号圧縮方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、音声信号の符号化や復号に関する処理を行う音声信号圧縮装置に関する。

【背景技術】

【0002】

従来より、ネットワークを介した音声信号の送受信を行うための様々な技術が存在する。音声信号は、送受信にあたって符号化（エンコード）や復号（デコード）が行われるが、性質上、情報量が大きくなりがちなので、符号化は圧縮処理を伴う形で行われる場合が多い。従来、この圧縮処理として、いわゆるＭＰ３（ＭＰＥＧＡｕｄｉｏＬａｙｅｒ−３）を用いる技術（例えば、非特許文献１参照）が知られている。また、同じく圧縮処理として、ＡＤＰＣＭ（ＡｄａｐｔｉｖｅＤｉｆｆｅｒｅｎｔｉａｌＰｕｌｓｅＣｏｄｅＭｏｄｕｌａｔｉｏｎ）を用いる技術（例えば、非特許文献２参照）も存在する。

【先行技術文献】

【特許文献】

【0003】

【非特許文献1】Ｃｏｄｉｎｇｏｆｍｏｖｉｎｇｐｉｃｔｕｒｅｓａｎｄａｓｓｏｃｉａｔｅｄａｕｄｉｏａｔｕｐｔｏａｂｏｕｔ１．５ｍｂｉｔ／ｓｐａｒｔ３：ａｕｄｉｏ．ＩＳＯ／ＩＥＣ１１１７２−３，１９９３

【非特許文献2】ＩＴＵ−Ｔ．４０，３２，２４，１６ｋｂｉｔ／ｓａｄａｐｔｉｖｅｄｉｆｆｅｒｅｎｔｉａｌｐｕｌｓｅｃｏｄｅｍｏｄｕｌａｔｉｏｎ（ａｄｐｃｍ）．ＲｅｃｏｍｍｅｎｄａｔｉｏｎＧ．７２６，Ｄｅｃｅｍｂｅｒ１９９０

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、ＭＰ３においては、人間が聴き取り難い周波数帯域で信号量を多く削減することで音声圧縮を行う。そして、この圧縮方式においては、必ず周波数変換を行わねばならない。周波数変換が行われる際は、ＣＰＵやメモリ等のハードウェア資源が多く消費される。そのため、非特許文献１に記載の発明は、ハードウェア資源にかかる処理負荷が過大になり、回路規模も大きくならざるを得ず、処理の実行速度が遅くなるという問題がある。また、ＡＤＰＣＭは、音声圧縮において予測符号化方式を用い、周波数変換のように負荷の大きい処理を伴わないため、組み込みシステムのような制約の厳しい環境にて用いられることが多い。しかし、予測符号化方式は、精度の高い予測を行うことが難しい。そのため、非特許文献２においては、圧縮率に対し、復号された音声信号の音質を良好に保つことが難しいという問題がある。

【0005】

本発明はこのような問題に鑑みてなされたものであり、回路規模や処理負荷が小さいもので足り、圧縮率に対して復号された音声信号の音質を良好に保つことのできる音声信号圧縮装置、及び音声信号圧縮方法を提供することを課題としている。

【課題を解決するための手段】

【0006】

かかる課題を解決するために、請求項１に記載の発明は、音声信号の予測符号化において、任意の処理により前記音声信号の符号量を削減する音声信号圧縮装置であって、前記音声信号の信号成分の特徴を検出する特徴検出手段と、前記特徴検出手段によって検出された複数の前記特徴の相違を誤差として検出する誤差検出手段とを備え、該誤差検出手段は、既に検出済の前記特徴に基づいて記録された、前記信号成分の予測情報である前記特徴の標本と、前記特徴検出手段によって検出され対比対象として着目する前記特徴としての対比特徴とを対比して、前記標本と前記対比特徴との差分を誤差として検出し、該検出された前記誤差を前記標本に加えて新たな前記標本を生成し、該新たに生成された前記標本を該生成後の前記対比特徴との対比に用いることを特徴とする。

【0007】

請求項２に記載の発明は、請求項１に記載の構成に加え、前記誤差検出手段は、検出された複数の前記誤差の平均値を算出し、該算出された誤差の平均値を前記標本に加えて新たな前記標本を生成することを特徴とする。

【0008】

請求項３に記載の発明は、請求項１又は２に記載の構成に加え、前記誤差検出手段は、直前二つの前記標本に対する前記誤差の値に基づいて、次の前記標本を算出することを特徴とする。

【0009】

請求項４に記載の発明は、請求項１乃至３の何れか一つに記載の構成に加え、前記誤差検出手段によって検出された前記誤差に対し、出現頻度の高い数値ほど短い信号値を割り当てる信号値割り当て手段を備えたことを特徴とする。

【0010】

請求項５に記載の発明は、請求項１乃至４の何れか一つに記載の構成に加え、前記誤差検出手段によって検出された前記誤差について、任意の範囲内の数値を任意の数値に置き換える丸め処理を行う丸め処理手段を備えたことを特徴とする。

【0015】

請求項６に記載の発明は、音声信号の予測符号化において、任意の処理により前記音声信号の符号量を削減する音声信号圧縮方法であって、前記音声信号の信号成分の特徴を検出する特徴検出手順と、前記特徴検出手順において検出された複数の前記特徴の相違を誤差として検出する誤差検出手順とを備え、該誤差検出手順においては、既に検出済の前記特徴に基づいて記録された、前記信号成分の予測情報である前記特徴の標本と、前記特徴検出手順において検出され対比対象として着目する前記特徴としての対比特徴とを対比して、前記標本と前記対比特徴との差分を誤差として検出し、該検出された前記誤差を前記標本に加えて新たな前記標本を生成し、該新たに生成された前記標本を該生成後の前記対比特徴との対比に用いることを特徴とする。

【発明の効果】

【0018】

請求項１、及び請求項６に記載の発明によれば、音声信号に現れる特徴について、既に検出済の特徴に基づいて記録された、信号成分の予測情報である特徴の標本と、対比対象として着目する特徴としての対比特徴とを対比して、差分を誤差として検出し、検出された誤差を標本に加えて新たな標本を生成することにより、既存の標本を対比特徴に一層近似させることができる。そして、新たに生成された標本を生成後の対比特徴との対比に用いることにより、現実の音声信号の特徴により近似した標本と音声信号の対比特徴とを対比させ、信号成分の予測情報と現実の音声信号の対比による誤差をより小さいものとすることができる。そして、信号成分の予測情報である標本の情報と誤差の情報に基づいて符号化を行うことで、周波数変換のような負荷の大きい処理を伴わずに音声信号を圧縮できる。これにより、回路規模や処理負荷が小さいもので足り、圧縮率に対して復号された音声信号の音質を良好に保つことができる。

【0019】

請求項２に記載の発明によれば、誤差検出手段は、検出された複数の誤差の平均値を算出し、算出された誤差の平均値を標本に加えて新たな標本を生成することにより、標本と対比特徴との対比を繰り返すごとに、標本と対比特徴との誤差とを徐々に小さくすることができる。これにより、誤差の値を徐々に小さくし、符号量を減少させることができる。

【0020】

請求項３に記載の発明によれば、直前二つの標本に対する誤差の値に基づいて、次の標本を算出することにより、着目している信号に相関の高い直前の誤差の値に基づいて生成した標本に基づいて次の予測を行い、精度の高い予測を行い、符号量を減少させることができる。

【0021】

請求項４に記載の発明によれば、検出された誤差に対し、出現頻度の高い数値ほど短い信号値を割り当てることにより、処理後の信号値を全体として短くして符号量を少なくすることができる。

【0022】

請求項５に記載の発明によれば、誤差について、任意の範囲内の数値を任意の数値に置き換える丸め処理を行うことにより、誤差の記録に用いる符号の数を減らし、処理後の信号値を全体として短くして符号量を少なくすることができる。

【図面の簡単な説明】

【0027】

【図1】本発明の実施の形態に係る音声信号圧縮装置の全体構成を示す機能ブロック図である。

【図2】同上実施の形態に係る第一の音声信号圧縮方式の原理（１）における、標本の信号値と対比特徴の信号値との対比を示す概念図である。

【図3】同上実施の形態に係る第一の音声信号圧縮方式の原理（１）における、標本の信号値と対比特徴の信号値との対比を示す概念図である。

【図4】同上実施の形態に係る第一の音声信号圧縮方式の原理（２）における、標本の信号値と対比特徴の信号値との対比を示す概念図である。

【図5】同上実施の形態に係る第一の音声信号圧縮方式の原理（３）における、標本の生成方法を示す概念図である。

【図6】同上実施の形態に係る第一の音声信号圧縮方式の原理（４）において用いられる、第二のテーブルの概念図である。

【図7】同上実施の形態に係る第一の音声信号圧縮方式の原理（５）において用いられる、第三のテーブルの概念図である。

【図8】同上実施の形態に係る第一の音声信号圧縮方式の具体的手順を示すフローチャートである。

【図9】同上実施の形態に係る第二の音声信号圧縮方式の原理としての、信号と誤差との関係を示す概念図である。

【図10】同上実施の形態に係る第二の音声信号圧縮方式の原理としての、周波数領域における信号と誤差との関係を示す概念図である。

【図11】同上実施の形態に係る第二の音声信号圧縮方式の原理としての、時間領域における信号と誤差との関係を示す概念図である。

【図12】同上実施の形態に係る第二の音声信号圧縮方式の具体的手順を示すフローチャートである。

【図13】同上実施の形態に係る第三の音声信号圧縮方式の原理としての、座標空間と座標空間に存在する音声信号のとの関係を示す概念図である。

【図14】同上実施の形態に係る第三の音声信号圧縮方式の原理としての、座標空間と座標空間に存在する音声信号のとの関係を示す概念図である。

【図15】同上実施の形態に係る第三の音声信号圧縮方式の具体的手順を示すフローチャートである。

【図16】この発明の第一の実施例における結果を示す図である。

【図17】この発明の第二の実施例における結果を示す図である。

【図18】この発明の第三の実施例における結果を示す図である。

【図19】この発明の第四の実施例における結果を示す図である。

【発明を実施するための形態】

【0028】

図１乃至図１５に本発明の実施の形態を示す。

【0029】

＜基本構成＞
図１は、この実施の形態に係る音声信号圧縮システム及び音声信号圧縮装置の全体構成を示す機能ブロック図である。音声信号圧縮システム１Ａは、音声信号の圧縮を含む符号化に用いられる。ここでいう音声信号は、単音（一人の人間の発話や、一つの楽器の鳴らした音等）であってもよいし、複音（複数の人間の発話や複数の楽器を一度に鳴らした音等）であってもよい。また、音楽であってもよいし機械の動作音や列車の走行音のような音であってもよい。さらに、ここでいう音声信号は、基本的にディジタル信号を指すが、アナログ信号であってもよい。

【0030】

音声信号圧縮システム１Ａは、少なくとも一のＣＰＵを備え、この実施の形態の音声信号圧縮装置１と、各種処理部２とを備えている。

【0031】

音声信号圧縮装置１は音声信号の符号化を行う。ここでいう符号化には、音声信号の符号量を削減する圧縮処理も含まれる。

【0032】

各種処理部２は、音声の各種処理、記録、外部に対する入出力等を行う。具体的には、音声情報の座標変換や階調補正や圧縮展開等の各種音声処理を行うための構成、ＲＡＭ、ＥＥＰＲＯＭ、ハードディスク等の記憶媒体であって、圧縮されていない音声情報を一時的又は半永久的に記憶したり音声信号圧縮装置１との間で音声情報を入出力するための構成、各種インターフェースであって外部の機器等との間で音声情報の入出力を行うための構成等である。

【0033】

図１に示す通り、音声信号圧縮装置１は、機能手段として、「特徴検出手段」としての特徴検出部１１、「誤差検出手段」としての誤差検出部１２、「信号値割り当て手段」としての信号値割り当て部１３、「丸め処理手段」としての丸め処理部１４、「フィルタ手段」としてのフィルタ部１５、「置換手段」としての置換部１６、「分布領域確認手段」としての分布領域確認部１７、「座標回転手段」としての座標回転部１８、記憶部１９を備える。音声信号圧縮装置１は、少なくとも１のＣＰＵを備え、該ＣＰＵの処理により上記の各機能手段が実現される。ただしこのＣＰＵは音声信号圧縮システム１Ａと共用のものであってもよい。

【0034】

特徴検出部１１は、音声信号の特徴を検出する。ここでいう「特徴」は、音声信号に現れる特徴で、例えば音声信号の波形の特徴（複数のディジタル信号によって形成された波形の特徴も含む）が該当する。この特徴は、音声信号に周期的に現れるものであってもよいし、不定期的に現れるものであってもよい。検出された特徴は、標本として記憶部１９に一時的に記録されて、誤差検出部１２における処理に用いられる。この「標本」とは、音声信号を形成する信号成分の予測情報であり、任意の時点以前に出現した音声信号から検出された一又は複数の特徴により生成されるものである。

【0035】

誤差検出部１２は、特徴検出部１１により検出された複数の特徴の相違を誤差として検出する。具体的には、誤差検出部１２は、記憶部１９に記憶された、特徴の標本と、特徴検出部１１によって検出され対比対象として着目する特徴としての対比特徴とを対比して、標本と対比特徴との差分を誤差として検出する。後述する通り、検出された誤差は、既存の標本に加えられる。これにより新たな標本が生成され、新たに生成された標本は、生成後の対比特徴との対比に用いられることになる。なお、標本は、特徴検出部１１によって検出された特徴以外のもの、例えば、既存の正弦波や三角波やパルスに基づいて人工的に生成されたものであってもよい。

【0036】

信号値割り当て部１３は、誤差検出部１２によって検出された誤差に対してそれぞれ信号値を割り当てる。具体的には、信号値割り当て部１３は、特定の規則、例えばハフマン符号化、等のエントロピー符号化を用い、出現頻度の高い数値ほど短い信号値を割り当てる。

【0037】

丸め処理部１４は、誤差検出部１２によって検出された誤差について、任意の範囲内の数値を任意の数値に置き換える。この丸め処理は、ある範囲の整数値をその中の特定の整数値に置き換える処理（例えば「１」「２」「３」を「２」に、「４」「５」「６」を「５」に置き換える処理）や、任意の位以下の値を切り上げる処理や切り捨てる処理（例えば少数点以下の値を全て切り上げ、又は切り捨てて整数値にする処理）などが含まれる。

【0038】

フィルタ部１５は、予測符号化の処理において発生した誤差が存在しうる任意の帯域又は領域の信号を除去するフィルタリング処理、又はフィルタリング処理と同等の処理を行う。ここでいうフィルタリング処理は、たとえばローパスフィルタやバンドパスフィルタによるフィルタリングが考えられる。フィルタ部１５を構成するフィルタは、フィルタリング帯域を変換可能なものが望ましい。また、フィルタ部１５を構成するフィルタは、フィルタリングの対象となる音声信号の時間領域と周波数変換との変換（例えばフーリエ変換）のような、負荷の重い処理を伴わずにフィルタリングできるものが望ましい。また、フィルタ部１５による処理の対象となる誤差は、主として、予測符号化の処理の結果発生した誤差であるが、予測符号化の処理以外の処理によって発生した誤差が対象であってもよい。また、ここでいうフィルタリングと同等の処理とは、例えば、信号値がとるべき特定の範囲にない信号について、それらを除去する処理や、それらを予め設定された規則に基づいて特定の範囲内の値に修正する処理が考えられる。

【0039】

置換部１６は、任意のパラメータからなる座標空間にある音声信号の値を、他のパラメータからなる座標空間にある音声信号の値に置換する。具体的には、第一の音声信号の値（例えばステレオ２チャンネルのうち左チャンネルの値）及び第二の音声信号（例えばステレオ２チャンネルのうち右チャンネルの値）について、第一の音声信号の値と第二の音声信号との和からなる第一のパラメータと、第一の音声信号の値と第二の音声信号の値との差の絶対値からなる第二のパラメータとからなる置換座標空間に音声信号を置換する。ただし、置換部１６は、２チャンネルより多い（又は少ない）チャンネルの音声信号を、２チャンネルより多い（又は少ない）チャンネルに変換してもよいし、変換の態様について、上記に例示したもの以外のいかなるものを用いてもよい。

【0040】

分布領域確認部１７は、置換部１６によって置換された音声信号の、置換座標空間における分布領域を確認する。分布領域確認部１７による確認の結果は、表示画面（図示せず）にグラフィック表示等されてもよいし、置換部１６に送られて、置換部１６において、変換前の音声信号を別のパラメータからなる座標空間に再度置換されるように設定されてもよい。

【0041】

座標回転部１８は、分布領域確認部１７によって確認された分布領域に基づいて、置換座標空間の座標軸を回転変換させる。この回転変換は、置換座標空間を、原点を中心に回転するものであってもよいし、予め設定された条件を満たす原点以外の任意の点（例えば原点から最も離れた位置に信号値が存在する点）を中心に回転するものであってもよい。また、回転は、予め設定された任意の角度（例えば反時計回りに４５°）回転するものであってもよいし、予め設定された条件を満たす任意の点（例えば回転中心から最も遠い距離に信号値が存在する点）が予め設定された任意の点（例えばＸ軸とＹ軸とからなる座標空間における、Ｙ＝Ｘの直線上の任意の点）にくるように回転するようなものであってもよい。

【0042】

この実施の形態における音声信号の圧縮処理は、この音声信号圧縮システム１Ａ及び音声信号圧縮装置１を用い、以下、第一の音声信号圧縮方式乃至第三の音声信号圧縮方式に示すように行われる。なお、第一の音声信号圧縮方式乃至第三の音声信号圧縮方式は、それぞれを連携させて用いることもできるし、それぞれを独立して用いることもできる。以下、音声信号圧縮の態様について、それぞれの原理と具体的手順をそれぞれ説明する。

【0043】

＜１−１．第一の音声信号圧縮方式の原理（１）：予測符号化その１＞
図２乃至図７に、第一の音声信号圧縮方式の原理を示す。

【0044】

第一の音声信号圧縮方式は、予測符号化に基づくものである。第一の音声信号圧縮は、主として音声信号圧縮装置１の特徴検出部１１、誤差検出部１２、信号値割り当て部１３、丸め処理部１４の処理に基づいて行われる。

【0045】

図２は、第一の音声信号圧縮方式の原理を示す概念図である。図２の（ｂ）に示す、ｎ個（ｎ＞１）の標本３１（１），３１（２），・・・３１（ｎ）は、音声信号１００から検出された離散信号に基づいて生成されたものであり、記憶部１９に記録されている。なお、以下は説明の簡単のため、特に区別の必要がある場合を除き、標本３１（１），３１（２），・・・３１（ｎ）は標本３１と記載する。またここで、特徴検出部１１は、音声信号１００から、離散信号としてのｍ個（ｍ＞１）の対比特徴４１（１），４１（２），・・・４１（ｍ）を検出する。なお、以下は説明の簡単のため、特に区別の必要がある場合を除き、対比特徴４１（１），４１（２），・・・４１（ｍ）は対比特徴４１と記載する。

【0046】

ここで、音声信号圧縮装置１にディジタルの音声信号１００が入力された場合を考える。そしてさらに、特徴検出部１１において、図２の（ａ）（ｂ）に示す、音声信号１００の部分１０１における信号Ｓ１０１，Ｓ１０２の信号値を検出し、次に信号Ｓ１０３の値を検出しようとしている場合を考える。この場合、たとえば図２の（ｂ）においては、直前２つのＳ１０１，Ｓ１０２の信号値がそれぞれ“−１”，“１”であり、その延長線上にある標本３１（１）の信号値が“３”である（単位はそれぞれｍＶ。以下同じ。）。そこで、誤差検出部１２は、記憶部１９から、値が“３”である標本３１（１）を取得する。

【0047】

この状態で、特徴検出部１１は、次の信号Ｓ１０３の値（音声信号１００を構成する一の離散信号の値）を検出し、これを対比特徴４１（１）とする。

【0048】

誤差検出部１２は、標本３１（１）の信号値と対比特徴４１（１）の信号値とを対比する。そして、対比の結果、図２の（ｂ）に示すように、標本３１（１）の信号値が“３”であるのに対し、対比特徴４１（１）の信号値が“１”であったとする。この場合、対比特徴４１（１）の信号値と標本３１（１）の信号値の誤差（対比特徴４１（１）の信号値から標本３１（１）の信号値を引いた値）は“−２”になる。そして、標本３１を構成する信号の信号値の情報と、標本３１（１）と対比特徴４１（１）の誤差の情報によって、音声信号１００が圧縮され、符号化される。

【0049】

ここで、誤差検出部１２は、この誤差の値“−２”を標本３１（１）の信号値に加える。その結果、新たな標本３１（２）の信号値は、図２の（ｂ）に示すように、標本３１（１）の信号値“３”に誤差の値“−２”を加えた“１”になる。

【0050】

このようにして、誤差検出部１２は、新たな標本３１（２）を生成する。新たに生成された標本３１（２）は、図３に示すように、次の対比特徴４１（２）との対比に用いられる。具体的には、図３に示すように、音声信号１００における、部分１０１と同様の波形になっている部分１０２において、直前２つのＳ１０４，Ｓ１０５の信号値がそれぞれ“−１”，“１”であるときに、標本３１（２）が、対比特徴４１（２）との対比に用いられることになる。

【0051】

上述した通り、誤差の情報は、音声信号１００の圧縮に用いられるため、標本３１に対する信号値の誤差は小さい方が圧縮率が高くなる。そして、音声信号１００に近似した特徴が繰り返し出現する場合、図２の（ｂ）及び図３に示す通り、標本３１（１）と対比特徴４１（２）とを対比した場合の誤差（誤差−２）よりも、新たに生成された標本３１（２）と対比特徴４１（２）とを対比した場合の誤差（誤差０）の方が、誤差の値が小さくなる。そのため、標本３１（１）の延長にある標本３１（３）を対比特徴４１（２）と対比させた場合に比べ、標本３１（２）を対比特徴４１（２）と対比させた場合の方が、符号量が少なくなる。

【0052】

このようにすることで、音声信号１００の圧縮率を向上させることができる。

【0053】

＜１−２．第一の音声信号圧縮方式の原理（２）：予測符号化その２＞
誤差検出部１２が、上記＜１−１＞に示すような誤差の検出を複数回繰り返して行った場合を考える。

【0054】

例えば、図４の（ａ）に示すように、誤差検出部１２が複数回例えば３回の誤差検出を繰り返し行い、それぞれ、同じ並びの信号値を順次（信号値−１、信号値１）を検出した場合を考える。この場合、最初に信号Ｓ１１１（信号値−１）、次に信号Ｓ１１２（信号値１）が検出された場合、誤差検出部１２は、まず、特徴検出部１１によって検出された、信号Ｓ１１３による対比特徴４１（１１）の信号値と標本３１（１１）との対比を行う。ここで、対比特徴４１（１１）の信号値と標本３１（１１）の信号値との間に誤差“−２”がある場合、標本３１（１１）の信号値に誤差“−２”を加え、信号値“１”の新たな標本３１（１２）を生成する。図４の（ｄ）に示す通り、対比の回数、２つ前の信号値、１つ前の信号値、検出された誤差の値、新たな標本、新たな信号値は記憶部１９の第一のテーブル１９１（の「対比回数」が“１”の行）に記録される。

【0055】

次に、２回目に同じ並びの信号値である信号Ｓ１１４（信号値−１），Ｓ１１５（信号値１）が検出された場合、誤差検出部１２は、標本３１（１２）の信号値と、信号Ｓ１１６による新たな対比特徴４１（１２）の信号値とを対比する。対比の結果、標本３１（１２）の信号値と対比特徴４１（１２）の信号値との間に誤差“１”が発生している場合、誤差の平均として、誤差の総和“−２＋１＝−１”を検出の回数“２”で割った値“−１÷２＝−０．５”を算出し、算出された値を標本３１（１２）の信号値に加え、信号値“１．５”の新たな標本３１（１３）を生成する。図４の（ｄ）に示す通り、記憶部１９の第一のテーブル１９１（の「対比回数」が“２”の行）には、この手順に基づき、１回目と同様の情報が記録される。

【0056】

更に、３回目に同じ並びの信号値である信号Ｓ１１７（信号値−１），Ｓ１１８（信号値１）が検出された場合、誤差検出部１２は、標本３１（１３）の信号値と、信号Ｓ１１９による新たな対比特徴４１（３）の信号値とを対比する。対比の結果、標本３１（１３）の信号値と対比特徴４１（３）の信号値との間に誤差“−２”が発生している場合、誤差の平均として、誤差の総和“（−０．５）＋（−０．５）−２＝−３”を検出の回数“３”で割った値“−３÷３＝−１”を算出し、算出された値を標本３１（１３）の信号値に加え、信号値“１”の新たな標本（図示せず）を生成する。図４の（ｄ）に示す通り、記憶部１９の第一のテーブル１９１（の「対比回数」が“３”の行）には、この手順に基づき、１回目、２回目と同様の情報が記録される。

【0057】

誤差検出部１２は、このように、誤差の平均値を標本に加えることにより、標本と対比特徴との誤差を一層小さくし、符号量を削減させることができる。

【0058】

＜１−３．第一の音声信号圧縮方式の原理（３）：標本の生成方法＞
誤差検出部１２は、過去に検出した直前２つの誤差の値に基づいて次の標本を生成することができる。

【0059】

例えば、図５において、標本を生成するために信号Ｓ１２３に着目している場合を考える。そして、この場合に、着目している信号Ｓ１２３の２つ前の信号Ｓ１２１について、誤差検出部１２が上記＜１−１＞に示すような誤差の検出（対比特徴４１と標本３１との対比、及び、対比特徴４１の信号値から標本３１の信号値を引いた値の算出）を行った結果、検出された誤差が“１”であり、同様に、着目している信号Ｓ１２３の１つ前の信号Ｓ１２２について、誤差検出部１２によって検出された誤差が“−１”であった場合を考える。この場合、着目している信号Ｓ１２３の値の可能性として、（Ａ）（Ｂ）の２つが考えられる。
（Ａ）第一の可能性：直前２つの信号Ｓ１２１，Ｓ１２２誤差の延長線上の値である“３（つまり誤差“−２”）”・・・図５の符号（Ａ）
（Ｂ）第二の可能性：直前の信号Ｓ１２２の誤差と同じ値である“１（つまり誤差“０”）”・・・図５の符号（Ｂ）
そこで、誤差検出部１２は、この、符号（Ａ）の信号値と、符号（Ｂ）の信号値の平均、即ち、（３＋１）÷２＝２、を次の標本３１（２１）の信号値として生成する。ただし、過去の統計情報等により、符号値（Ａ）の信号値と符号（Ｂ）の信号値のいずれかの発生可能性が高いことが判っている場合には、誤差検出部１２は、符号（Ａ）の信号値と符号（Ｂ）の信号値に対し、発生可能性の高さに依存した重み付けを行って、標本３１（２１）の信号値を生成することもできる。このようにすることで、着目している信号に相関の高い直前の誤差の値に基づいて生成した標本３１（２１）に基づいて次の予測（信号値Ｓ１２３の予測）を行い、精度の高い予測を行い、符号量を減少させることができる。

【0060】

＜１−４．第一の音声信号圧縮方式の原理（４）：信号値の割り当て＞
図６に示すように、誤差検出部１２において複数、例えば“２”，“１”，“０”，“−１”，“−２”の５つ、の誤差の値が検出され、検出回数はそれぞれ２回、４回、２０回、３回、１回である場合を考える。この場合、信号値割り当て部１３は、エントロピー符号化、例えばハフマン符号化を適用し、検出回数の多いものから順に短い信号値を割り当てる。具体的には、前述の場合、誤差０に信号値“０１”、誤差１に信号値“０１１”、誤差−１に信号値“０１１１”、誤差２に信号値“０１１１１”、誤差−２に信号値“０１１１１１”を付与する。誤差の値、出現回数、それぞれの誤差に付与される信号値は、図６に示す、記憶部１９の第二のテーブル１９２に記録され、信号値割り当て部１３は、この第二のテーブル１９２を参照して符号化や復号を行う。これにより、全体としての音声信号１００の符号量を減らすことができる。

【0061】

なお、この＜１−４＞の処理を効率的に行うためには、音声信号圧縮装置１において、符号化の対象である音声信号１００の、標本３１に対する誤差を全て検出し、それぞれの誤差の値の出現頻度に関する統計情報を形成することが望ましい。

【0062】

＜１−５．第一の音声信号圧縮方式の原理（５）：丸め処理＞
例えば、誤差検出部１２において複数、例えば“２”，“１”，“０”，“−１”，“−２”の５つ、の誤差の値が検出された場合を考える。この場合、丸め処理部１４は、任意の範囲内の数値を任意の数値に置き換える丸め処理を行う。具体的には、丸め処理部１４は、図７に示すように、「−１を越えて１未満」の値を全て「０」に、「１以上３未満」の値を全て「２」に、「−３を越えて−１以下」の値を全て「−２」に、それぞれ丸め処理により置き換える。丸め処理の対象となる値の範囲、丸め処理後の値は、図７に示す、記憶部１９の第三のテーブル１９３に記録され、丸め処理部１４は、この第三のテーブル１９３を参照して符号化や復号を行う。これにより、誤差を示す情報の数を減らし、音声信号の符号量を減らすことができる。

【0063】

＜１−６．第一の音声信号圧縮方式の手順＞
図８は、上記＜１−１＞〜＜１−５＞を用いた第一の音声信号圧縮方式の具体的手順を示すフローチャートである。以下、同フローチャートに基づいて、音声信号圧縮装置１における、第一の音声信号圧縮の手順を説明する。

【0064】

まず、音声信号圧縮装置１は、音声信号１００を取得する（ステップＳ１）。ＡＤ変換等の必要な処理は、この段階で、各種処理部２において行われる。量子化は４４０００Ｈｚ程度のサンプリング周波数にて行うが、これ以外のサンプリング周波数を用いてもよい。

【0065】

次に、取得された音声信号１００は、任意の処理ブロック（例えば、予め設定された数秒〜数分単位の処理単位）に区分される（ステップＳ２）。ただし、音声信号１００を処理ブロックに区分することなく、ファイル全体が一度に処理される態様であってもよい。

【0066】

次に、処理ブロック毎に、特徴検出部１１による音声信号１００の特徴検出（ステップＳ３、特徴検出手順）と、誤差検出部１２による、対比特徴４１と標本３１との対比による誤差の検出（ステップＳ４、誤差検出手順）とが行われる。なお、音声信号１００を構成する離散信号のうち、最初から３つ目の信号以降の標本３１を生成する場合は、上記＜１−３＞に記載したように、直前２つの信号の誤差に基づいて標本３１を生成することもできる。

【0067】

ステップＳ４においては、誤差検出部１２は、誤差が検出された信号の信号値に、検出された誤差を加え、新たな標本３１を生成する。

【0068】

ステップＳ３とステップＳ４とが複数回繰り返され、誤差が複数回検出された場合には、誤差検出部１２は、誤差の平均値を算出し、標本３１の信号値に、算出された誤差の平均値を加えて新たな標本３１を生成する（ステップＳ５）。

【0069】

ステップＳ４において算出された誤差に対しては、丸め処理部１４が、予め設定された規則に基づいて数値の丸め処理を行う（ステップＳ６）。

【0070】

ステップＳ３〜Ｓ６の処理は、処理ブロック全体の音声信号１００について繰り返し行われる（ステップＳ７の“Ｎｏ”）。処理ブロック全体について、ステップＳ３〜Ｓ６の処理が完了した場合（ステップＳ７の“Ｙｅｓ”）、信号値割り当て部１３は、処理ファイル全体における、検出された誤差の値について統計情報を作成し、出現頻度の高い誤差の値ほど短い信号値を割り当てる（ステップＳ８）。なお、処理が完了して圧縮された音声信号１００は、各種処理部２に送られ、その後外部への出力等が行われる。

【0071】

以上示したように、この実施の形態の第一の音声信号圧縮方式においては、音声信号１００に現れる特徴について、既に検出済の特徴に基づいて記録された、信号成分の予測情報である特徴の標本３１と、対比対象として着目する特徴としての対比特徴４１とを対比して、差分を誤差として検出し、検出された誤差を標本に加えて新たな標本３１を生成することにより、既存の標本３１を対比特徴４１に一層近似させることができる。そして、新たに生成された標本３１を生成後の対比特徴４１との対比に用いることにより、現実の音声信号１００の特徴により近似した標本３１と音声信号１００の対比特徴４１とを対比させ、信号成分の予測情報と現実の音声信号１００の対比による誤差をより小さいものとすることができる。そして、信号成分の予測情報である標本３１の情報と誤差の情報に基づいて符号化を行うことで、周波数変換のような負荷の大きい処理を伴わずに音声信号を圧縮できる。これにより、回路規模や処理負荷が小さいもので足り、圧縮率に対して復号された音声信号１００の音質を良好に保つことができる。

【0072】

この実施の形態の第一の音声信号圧縮方式においては、誤差検出部１２は、検出された複数の誤差の平均値を算出し、算出された誤差の平均値を標本に加えて新たな標本３１を生成することにより、標本３１と対比特徴４１との対比を繰り返すごとに、標本３１と対比特徴４１との誤差とを徐々に小さくすることができる。これにより、誤差の値を徐々に小さくし、符号量を減少させることができる。

【0073】

この実施の形態の第一の音声信号圧縮方式においては、直前二つの標本３１に対する誤差の値に基づいて、次の標本３１を算出することにより、着目している信号に相関の高い直前の誤差の値に基づいて生成した標本３１に基づいて次の予測を行い、精度の高い予測を行い、符号量を減少させることができる。

【0074】

この実施の形態の第一の音声信号圧縮方式においては、検出された誤差に対し、出現頻度の高い数値ほど短い信号値を割り当てることにより、処理後の信号値を全体として短くして符号量を少なくすることができる。

【0075】

この実施の形態の第一の音声信号圧縮方式においては、誤差について、任意の範囲内の数値を任意の数値に置き換える丸め処理を行うことにより、誤差の記録に用いる符号の数を減らし、処理後の信号値を全体として短くして符号量を少なくすることができる。

【0076】

＜２−１．第二の音声信号圧縮方式の原理＞
図９乃至図１１に、第一の音声信号圧縮方式の原理を示す。

【0077】

第二の音声信号圧縮方式の原理は、音声信号のフィルタリングによるものである。第二の音声信号圧縮方式は、主として、音声信号圧縮装置１のフィルタ部１５の処理に基づいて行われる。なお、第二の音声信号圧縮方式は、主として第一の音声信号圧縮である予測符号化と併用されるが、予測符号化とは独立して用いられてもよい。

【0078】

例えば、予測符号化による音声圧縮が行われた場合などにおいては、その音声信号１００を（圧縮処理を含む）符号化を行った後に復号された音声信号１００は、元の音声信号１００に対する誤差が発生しうる。図９の（ａ）の概念図に示す通り、この誤差１０５が、ランダムに発生するものであった場合は、図９の（ｂ）の概念図に示す通り、その誤差１０５は、全周波数帯域において均等に発生しうるものと同じことになる。即ち、図９の（ｂ）の概念図に示す通り、この誤差１０５が含まれて復号された音声信号１００は、符号化前の元の音声信号１００にホワイトノイズ１１０が付加されたものと同様になる。

【0079】

ここで、ホワイトノイズ１１０は全周波数帯域で均等な信号値である。一方、一般の音声信号１００は、その性質上、高域ほど減衰が大きく、図１０の概念図に示すように、信号値は低域から中域が大きく、高域は小さくなる場合が多い。つまり、高域にいくほど、音声信号１００よりもホワイトノイズ１１０が増加することになる。

【0080】

第二の音声信号圧縮方式においては、このような音声信号１００の特質とホワイトノイズ１１０の特質に鑑み、図１０の概念図に示す通り、フィルタ部１５が、誤差が存在しうる任意の帯域（周波数帯域）又は領域の信号を除去するフィルタリング処理、又はフィルタリング処理と同等の処理を行う。

【0081】

フィルタリング処理としては、フィルタ部１５において、符号化された音声信号１００が復号されたのち、図１０に示すように、ローパスフィルタ（ＬＰＦ）やバンドパスフィルタ（ＢＰＦ）をかけて高域成分を除去することで誤差の除去を行うことが考えられる。ただし、この実施の形態においては、音声信号１００の周波数変換のような負荷の大きい処理を行わずに当該処理を行うことが望ましい。

【0082】

また、特定の周波数帯域の信号を除去したり修正したりする処理は、図１１の念図に示す通り、本来値が存在しうる信号値の範囲１２０（信号値の取り得る範囲）以外の存在する音声信号１００について、削除したり、本来値が存在しうる信号値の範囲１２０に移動させる処理を行うことに等しい。そこで、フィルタリング処理と同等の処理としては、フィルタ部１５において、図１１に示すように、本来値が存在しうる範囲１２０以外の値として存在する、音声信号１００を構成する信号Ｓ１３１を除去することや、本来値が存在しうる信号値の範囲１２０以外の存在する音声信号１００の値を、本来値が存在しうる信号値の範囲１２０に移動させて信号Ｓ１３２とする処理を行うことが考えられる。この処理は、符号化された音声信号１００について行うこともできるし、復号された音声信号１００について行うこともできる。このようにすることで、周波数変換のような負荷の大きい処理を行わずに、フィルタリング処理と同じ効果を得ることができる。フィルタリング処理と同等の処理を行うにあたり、フィルタ部１５は、符号化前の音声信号に基づいて、音声信号１００の本来値が存在しうる信号値の範囲１２０を確認し、この帯域の情報を基準にフィルタリング処理を行う。

【0083】

ここで、符号化される前の信号に基づいて、図１０に示すような、符号化の対象である音声信号１００の存在しうる周波数帯域等の帯域や、図１１に示すような、符号化の対象である音声信号１００の値の取り得る範囲１２０は、特定することができる。従って、これらの帯域や範囲をフィルタリング処理やフィルタリング処理と同等の処理を行う際の基準として用いることで、音声信号１００と、ホワイトノイズ１１０と同等の性質を有する誤差とを区別し、誤差の処理（即ち誤差の削除や修正等）を適切に行うことができる。第二の音声信号圧縮においては、このような特質に基づいて、フィルタリング処理やフィルタリング処理と同等の処理を行う。即ち、フィルタリング処理にあたり、フィルタ部１５は、符号化前の音声信号１００に基づいて、音声信号１００の存在しうる帯域（周波数帯域）を確認し、この帯域の情報を基準にフィルタリング処理を行う。

【0084】

このように、フィルタリング処理や、フィルタリング処理と同等の処理を行うことにより、符号化等によって発生した音声信号の歪みを除去することができる。

【0085】

＜２−２．第二の音声信号圧縮方式の手順＞
図１２は、第二の音声信号圧縮の具体的手順を示すフローチャートである。同図に示す通り、フィルタ部１５は、ステップＳ１〜Ｓ８の処理のうち一部又は全部などが行われる音声信号１００について、符号化前の音声信号１００が存在しうる帯域又は領域を確認する（ステップＳ１１）。そして、フィルタ部１５は、ステップＳ１〜Ｓ８の処理のうち一部又は全部などにより歪みが生じた音声信号１００（符号化された音声信号１００でもよいし、復号された後の音声信号１００でもよい）に対し、符号化前の音声信号１００が存在しうる帯域を基準としたフィルタリング処理や、符号化前の音声信号１００が存在しうる領域を基準とした、フィルタリング処理と同等の処理を行う（ステップＳ１２、フィルタリング手順）。

【0086】

以上示したように、この実施の形態の第二の音声信号圧縮方式においては、フィルタリング処理又はフィルタリング処理と同等の処理を行うにあたり、音声信号１００ごとの存在しうる帯域又は領域に依存して、それぞれの音声信号１００から除去する任意の帯域又は領域を変化させることにより、それぞれの音声信号１００の特質や誤差の特質に適合したフィルタリング処理又はフィルタリング処理と同等の処理を行い、復号後の音声信号１００に歪みが生じることを防止できる。これにより、復号された音声信号１００の音質を一層良好に保つことができる。

【0087】

この実施の形態の第二の音声信号圧縮方式においては、フィルタ部１５はローパスフィルタ又はバンドパスフィルタであることにより、音声信号１００の存在する領域のみに対してフィルタリング処理又はフィルタリング処理と同等の処理を行い、適正な音声信号１００が多い帯域と誤差の多い帯域とを適切に分離することができる。これにより、復号された音声信号１００の音質を一層良好に保つことができる。

【0088】

この実施の形態の第二の音声信号圧縮方式においては、本来存在しうる値以外の値として存在する音声信号１００の値を、音声信号１００が本来存在しうる値に移動させる処理を行うことにより、フィルタリングと同等の処理を、周波数変換等の負荷の高い処理を伴わずに、適切に行うことができる。

【0089】

＜３−１．第三の音声信号圧縮方式の原理＞
図１３及び図１４に、第三の音声信号圧縮方式の原理を示す。

【0090】

第三の音声信号圧縮方式の原理は、音声信号１００の座標を別の座標に置換することによるものである。第三の音声信号圧縮方式は、主として、音声信号圧縮装置１の置換部１６、分布領域確認部１７、座標回転部１８の処理に基づいて行われる。なお、第三の音声信号圧縮方式は、主として第一の音声信号圧縮方式等、予測符号化を用いた方式と併用されるが、予測符号化とは独立して用いられてもよい。

【0091】

第三の音声信号圧縮方式は、主としてステレオ音声等の２チャンネルの音声信号１００を対象に行われる。ただし、ステレオ音声以外の２チャンネルの音声信号１００に、第三の音声信号圧縮方式が用いられてもよい。

【0092】

たとえばステレオ音声は、第一の音声信号の値（例えばステレオ２チャンネルのうち左チャンネルの値）及び第二の音声信号（例えばステレオ２チャンネルのうち右チャンネルの値）の相関が高い。そのため、いわゆるＭＳステレオ（ＭｉｄｄｌｅＳｉｄｅＳｔｅｒｅｏ）方式においては、Ｌ（左チャンネルの音声信号の値）とＲ（右チャンネルの音声信号の値）をパラメータとする座標空間に展開できる音声信号１００を、以下式（１）、式（２）に示すような変換を行い、ＭとＳとをパラメータとする座標空間に置換することで、符号量を減らす。
Ｍ＝Ｌ＋Ｒ・・・（１）
Ｓ＝｜Ｌ−Ｒ｜・・・（２）
なお、式（２）は、“Ｓ＝Ｌ−Ｒ”であってもよい。
第三の音声信号圧縮方式においては、置換部１６が、上記式（１）と式（２）とに基づいて、図１３の（ａ）に示す、ＬＲ座標空間１３０の音声信号１００を、図１３の（ｂ）に示す「置換座標空間」としてのＭＳ座標空間１４０の音声信号１００に置換する。なお、図１３、図１４においては、それぞれ、ＬＲ座標空間１３０、及びＭＳ座標空間１４０において、音声信号１００の値が存在する領域を模式的に示している。

【0093】

上述したように、ステレオ音声の音声信号１００は左右の信号の相関が大きいので、図１３の（ｂ）に示すように、ＭＳ座標空間１４０に置換した後の音声信号１００の信号値は、式（２）の値が０に近づいた結果、Ｍ軸周辺に集中することになる。そこで、ＭＳステレオ方式においては、分散が最も大きい方向（即ち、音声信号１００同士の距離が最も長くなる方向。図１４における矢印Ｐの方向。）を第一軸に、第一軸に直行する方向（図１４に示す矢印Ｒの方向）を第二軸に、それぞれ置換したのちに処理を行う。

【0094】

しかし、このような座標変換は、音声信号１００がＭ軸周辺に均一に（略楕円形となるように）分布している場合には、置換後の音声信号１００を圧縮する際に高い圧縮効果が得られるものの、音声信号１００の場合には、図１４に示すように、音声信号１００はＭ軸周辺において不均一に分布する場合が多いため、最大分散方向を基準とする変換においては、良好な圧縮効果が得られず、良好な符号量削減の効果が得られない場合が多い。

【0095】

そこで、第三の音声信号圧縮方式においては、図１４に示すように、ＭＳ座標空間１４０に変換した音声信号１００について、分布領域確認部１７が分布領域の確認を行い、確認の結果に基づいて、座標回転部１８が、分散が最も小さい方向（即ち、音声信号１００同士の距離が最も短くなる方向。図１４における矢印Ｑの方向。）を第一軸に、第一軸に直交する方向（図１４における矢印Ｒの方向）を第二軸になるように、ＭＳ座標空間１４０の座標軸を回転変換する。これにより、良好な圧縮効果が得ることができ、良好な符号量削減の効果を得ることができる。

【0096】

＜３−２．第三の音声信号圧縮方式の手順＞
図１５は、第三の音声信号圧縮方式の手順を示すフローチャートである。同図に示す通り、置換部１６は、ＬＲ座標空間１３０に存在する音声信号１００の値を、ＭＳ座標空間１４０に存在する音声信号１００の値に置換する（ステップＳ２１、置換手順）。音声信号１００がＭＳ座標空間１４０に置換されたのち、分布領域確認部１７は、ＭＳ座標空間１４０における音声信号１００の分布領域を確認する（ステップＳ２２、分布領域確認手順）。分布領域確認部１７の確認により、音声信号１００の分散が最小となる方向が確認されたら、座標回転部１８は、音声信号１００の分散が最小となる方向が第一軸になり、第一軸に直交する方向を第二軸になるように座標を回転させる（ステップＳ２３、座標回転手順）。

【0097】

このようにすることで、第一の音声信号（左チャンネルの信号）の値と第二の音声信号（右チャンネルの信号）の値の相関関係が小さい場合であっても、効率良く音声信号１００の符号量を減少させることができる。

【0098】

以上、この実施の形態の第三の音声信号圧縮方式においては、第一の音声信号（左チャンネル：Ｌ）の値及び第二の音声信号の値（右チャンネル：Ｒ）の和からなる第一のパラメータＭと、第一の音声信号の値及び第二の音声信号の値の差からなる第二のパラメータＳとからなるＭＳ座標空間１４０に置換された音声信号１００を、音声信号１００の分散が最も小さい方向を基準に回転変換を行うことにより、第一の音声信号の値と第二の音声信号の値の相関関係が小さい場合であっても、効率良く符号量を減少させることができる。

【0099】

なお、上記実施の形態は本発明の例示であり、本発明が上記実施の形態のみに限定されることを意味するものではないことは、いうまでもない。

【0100】

＜実施例＞
図１６乃至図１９は、本発明の第一乃至第四の実施例における結果を示す図である。これらの図においては、それぞれ、同一の音声や音楽を、本発明に係る第一の音声信号圧縮、本発明に係る第二の音声信号圧縮、従来の音声信号圧縮によって圧縮した場合における、圧縮率と、復号後の音質との相関を示している。これらの図において、「１号（フィルタあり）」と「２号（フィルタあり）」とは、本発明に係る音声圧縮方式（第一の音声信号圧縮＋第二の音声信号圧縮）による結果を示す。また、「１号（フィルタなし）」と「２号（フィルタなし）」とは、本発明に係る音声圧縮方式（第一の音声信号圧縮）による結果を示す。なお、「１号」「２号」は、それぞれ、実験において、符号の割り当て方法、閾値の動的変化ルール等を任意条件に固定した場合の一例の実験（任意実験）の結果を示すものである。

【0101】

また、図１６乃至図１９に示す、「ＭＳ−ＡＤＰＣＭ」「ｏｇｇ」「ｍｐ３」は、それぞれ、従来の音声圧縮方式である、ＭＳ−ＡＤＰＣＭ、ｏｇｇ、ＭＰ３による結果を示す。縦軸は音質（単位はＥＡＱＵＡＬ（ＥｖａｌｕａｔｉｏｎＯｆＡｕｄｉｏＱｕａｌｉｔｙ）として示す。これは、例えばＩＴＵ−ＲＢＳ．１３８７に使用されている音質評価の単位が相当する。）を示し、値が大きくなるほど音質が良い。横軸は１サンプルあたりのビット数（単位はビット。値が大きくなる程圧縮率が小さい。）を示し、グラフの左上にいく程圧縮率に対する音質が良好であり、良好な結果であることを示している。

【0102】

これらのグラフに示す通り、本発明に係る音声圧縮方式は、ｏｇｇやＭＰ３とほぼ同等の良好な結果を示し、特に、“ｃｈｏｃｏｒａｔｅｆｏｒｙｏｕ”“ｍｙｂｌｏｏｍｄｕｓｔｓ”の結果においては、圧縮率の高い領域で、ｏｇｇやＭＰ３よりも良好な結果を示している。本発明に係る音声圧縮方式は負荷の大きい処理を伴わないのに対し、ｏｇｇやＭＰ３が周波数変換を伴い負荷の大きい処理であることに鑑みれば、本発明に係る音声圧縮方式は、負荷の小さい処理により、従来の負荷の大きい音声圧縮方式と同等以上の良好な結果を得られることが判る。

【0103】

また、本発明に係る音声圧縮方式は、圧縮率の比較的高い領域を中心に、ＭＳ−ＡＤＰＣＭよりも高い音質を得られていることが確認される。

【0104】

以上により、本発明に係る音声圧縮方式は、従来の音声圧縮方式に比べ、総合的に見て、回路規模や処理負荷が小さいもので足り、圧縮率に対して復号された音声信号の音質を良好に保つことができることが確認された。

【符号の説明】

【0105】

１・・・音声信号圧縮装置
１１・・・特徴検出部（特徴検出手段）
１２・・・誤差検出部（誤差検出手段）
１３・・・信号値割り当て部（信号値割り当て手段）
１４・・・丸め処理部（丸め処理手段）
１５・・・フィルタ部（フィルタ手段）
１６・・・置換部（置換手段）
１７・・・分布領域確認部（分布領域確認手段）
１８・・・座標回転部（座標回転手段）
３１，３１（１），３１（２），・・・，３１（ｎ）・・・標本
４１，４１（１），４１（２），・・・，４１（ｍ）・・・対比特徴
１００・・・音声信号
１４０・・・ＭＳ座標空間（置換座標空間）

【図1】