特許5943982 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ソシオネクストの特許一覧

特許5943982オーディオ再生装置及びオーディオ再生方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5943982

(24)【登録日】2016年6月3日

(45)【発行日】2016年7月5日

(54)【発明の名称】オーディオ再生装置及びオーディオ再生方法

(51)【国際特許分類】

G10L 19/02 20130101AFI20160621BHJP

G10L 21/0388 20130101ALI20160621BHJP

G10L 19/008 20130101ALI20160621BHJP

【ＦＩ】

G10L19/02 170B

G10L21/0388 100

G10L19/008 100

【請求項の数】3

【全頁数】20

(21)【出願番号】特願2014-205836(P2014-205836)

(22)【出願日】2014年10月6日

(62)【分割の表示】特願2008-298809(P2008-298809)の分割

【原出願日】2008年11月21日

(65)【公開番号】特開2015-38623(P2015-38623A)

(43)【公開日】2015年2月26日

【審査請求日】2014年10月16日

(73)【特許権者】

【識別番号】514315159

【氏名又は名称】株式会社ソシオネクスト

(74)【代理人】

【識別番号】100189430

【弁理士】

【氏名又は名称】吉川修一

(74)【代理人】

【識別番号】100190805

【弁理士】

【氏名又は名称】傍島正朗

(72)【発明者】

【氏名】横山宇志

【審査官】安田勇太

(56)【参考文献】

【文献】 ETSI TS 126 401 V6.2.0 (2005-03) Universal Mobile Telecommunications System (UMTS);General audio codec audio processing functions;Enhanced aacPlus general audio codec;General description(3GPP TS 26.401 version 6.2.0 Release 6)，２００５年３月

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ１９／０２

Ｇ１０Ｌ１９／００８

Ｇ１０Ｌ２１／０３８８

(57)【特許請求の範囲】

【請求項1】

符号化されたオーディオ信号である基本コーデックを含むストリームを再生するオーディオ再生装置であって、
前記ストリームをフレーム単位で、前記基本コーデックと、当該基本コーデックの帯域を拡張するために用いられる帯域拡張情報と、当該基本コーデックをステレオ化するために用いられるステレオ拡張情報とに分離するストリーム分離部と、
前記ストリーム分離部によって分離された基本コーデックを解析することで、基本コーデックの性質を示す解析情報であり、当該基本コーデックのチャンネル数を示すチャンネル情報と、当該基本コーデックのサンプリング周波数を示すサンプリング周波数情報とを含む解析情報を生成する基本コーデック情報解析部と、
前記基本コーデック情報解析部によって生成された解析情報に従って前記基本コーデックを復号することで、基本コーデック復号信号を生成する基本コーデック復号部と、
前記基本コーデック復号部によって生成された基本コーデック復号信号の周波数帯域を、前記帯域拡張情報を用いて拡張する処理を、前記解析情報に基づいて、実数演算のＱＭＦ（ＱｕａｄｒａｔｕｒｅＭｉｒｒｏｒＦｉｌｔｅｒ）処理及び複素数演算のＱＭＦ処理のいずれか一方を用いて実行する帯域拡張処理部と、
前記帯域拡張処理部によって複素数演算のＱＭＦ処理を用いて周波数帯域が拡張された基本コーデック復号信号を、前記ステレオ拡張情報を用いてステレオ化するステレオ拡張処理部とを備え、
前記帯域拡張処理部は、前記チャンネル情報が示すチャンネル数が予め定められた第１閾値より大きいか否かと、前記サンプリング周波数情報が示すサンプリング周波数が予め定められた第２閾値より大きいか否かとを判定し、少なくとも一方が大きいと判定した場合、実数演算のＱＭＦ処理を用いて前記基本コーデック復号信号の周波数帯域を拡張する
オーディオ再生装置。

【請求項2】

前記基本コーデックは、ＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）方式に基づいて符号化されたオーディオ信号であり、
前記帯域拡張情報は、ＳＢＲ（ＳｐｅｃｔｒａｌＢａｎｄＲｅｐｌｉｃａｔｉｏｎ）方式に基づいて生成されたＳＢＲ情報であり、
前記ステレオ拡張情報は、ＰＳ（ＰａｒａｍｅｔｒｉｃＳｔｅｒｅｏ）方式に基づいて生成されたＰＳ情報であり、
前記帯域拡張処理部は、
実数演算のＱＭＦ処理を用いて前記基本コーデック復号信号の周波数帯域を拡張する場合、ＬＰ−ＳＢＲ（ＬｏｗＰｏｗｅｒ−ＳＢＲ）方式に基づいて、前記基本コーデック復号信号の周波数帯域を拡張し、
複素数演算のＱＭＦ処理を用いて前記基本コーデック復号信号の周波数帯域を拡張する場合、ＨＱ−ＳＢＲ（ＨｉｇｈＱｕａｒｉｔｙ−ＳＢＲ）方式に基づいて、前記基本コーデック復号信号の周波数帯域を拡張する
請求項１に記載のオーディオ再生装置。

【請求項3】

符号化されたオーディオ信号である基本コーデックを含むストリームを、オーディオ再生装置が再生するオーディオ再生方法であって、
前記オーディオ再生装置が、前記ストリームをフレーム単位で、前記基本コーデックと、当該基本コーデックの帯域を拡張するために用いられる帯域拡張情報と、当該基本コーデックをステレオ化するために用いられるステレオ拡張情報とに分離するストリーム分離ステップと、
前記オーディオ再生装置が、前記ストリーム分離ステップで分離された基本コーデックを解析することで、基本コーデックの性質を示す解析情報であり、当該基本コーデックのチャンネル数を示すチャンネル情報と、当該基本コーデックのサンプリング周波数を示すサンプリング周波数情報とを含む解析情報を生成する基本コーデック情報解析ステップと、
前記オーディオ再生装置が、前記基本コーデック情報解析ステップで生成された解析情報に従って前記基本コーデックを復号することで、基本コーデック復号信号を生成する基本コーデック復号ステップと、
前記オーディオ再生装置が、前記基本コーデック復号ステップで生成された基本コーデック復号信号の周波数帯域を、前記帯域拡張情報を用いて拡張する処理を、前記解析情報に基づいて、実数演算のＱＭＦ処理及び複素数演算のＱＭＦ処理のいずれか一方を用いて実行する帯域拡張処理ステップと、
前記オーディオ再生装置が、前記帯域拡張処理ステップで複素数演算のＱＭＦ処理を用いて周波数帯域が拡張された基本コーデック復号信号を、前記ステレオ拡張情報を用いてステレオ化するステレオ拡張処理ステップとを含み、
前記帯域拡張処理ステップでは、前記チャンネル情報が示すチャンネル数が予め定められた第１閾値より大きいか否かと、前記サンプリング周波数情報が示すサンプリング周波数が予め定められた第２閾値より大きいか否かとを判定し、少なくとも一方が大きいと判定した場合、実数演算のＱＭＦ処理を用いて前記基本コーデック復号信号の周波数帯域を拡張する
オーディオ再生方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、符号化されたオーディオ信号を復号し再生するオーディオ再生装置に関するものである。

【背景技術】

【0002】

従来、低域オーディオ信号と帯域拡張情報とが入力され、入力された帯域拡張情報に含まれるサイド情報を参照しながら予測して高域を再構成するスペクトルバンド複製（ＳｐｅｃｔｒａｌＢａｎｄＲｅｐｌｉｃａｔｉｏｎ、以下ではＳＢＲと呼ぶ）技術を用いて、高域拡張オーディオ信号を生成するオーディオ再生装置が知られている。このサイド情報の情報量はごく少なくて良いため、低いビットレートでの符号化オーディオ信号の音質を向上することができる。

【0003】

ＳＢＲの処理方法には、高音質版ＳＢＲ（Ｈｉｇｈ−ＱｕａｌｉｔｙＳＢＲ、以下ではＨＱ−ＳＢＲと呼ぶ）と低演算量版ＳＢＲ（Ｌｏｗ−ＰｏｗｅｒＳＢＲ、以下ではＬＰ−ＳＢＲと呼ぶ）との２種類が規定されている。

【0004】

ＨＱ−ＳＢＲは、サブバンド分析、高域生成、サブバンド合成に渡る全体の処理を複素数演算で行う。このため、高音質化処理に適しているが、演算量が多いという特徴がある。

【0005】

ＬＰ−ＳＢＲは、ＨＱ−ＳＢＲの複素数演算に代えて実数演算を用いており、また、その実数演算を用いることにより生じる折り返し歪みの発生を抑制するように改善されたものである。このため、演算量を大幅に削減し、かつ、低ビットレートではＨＱ−ＳＢＲと同等の音質を実現することができるという特徴がある。ＬＰ−ＳＢＲは、ＨＱ−ＳＢＲの約半分の処理量で処理できることが知られている（非特許文献１参照）。

【0006】

ＳＢＲは、ＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）と組み合わせて使用されることが知られており、その構成はＨＥ−ＡＡＣ（Ｈｉｇｈ−ＥｆｆｉｃｉｅｎｃｙＡＡＣ）プロファイルと呼ばれる。ＡＡＣと組み合わせた場合、ＡＡＣ＋ＬＰ−ＳＢＲは、ＡＡＣ＋ＨＱ−ＳＢＲの約７０％の処理量で処理できることが知られている（非特許文献１参照）。

【0007】

また、モノラルオーディオ信号とステレオ化情報とが入力され、モノラルオーディオ信号をステレオ化情報に基づいてステレオ化処理することで、ステレオオーディオ信号を生成する再生装置が知られている。このステレオ化処理はパラメトリック・ステレオ（ＰａｒａｍｅｔｒｉｃＳｔｅｒｅｏ、以下ではＰＳと呼ぶ）処理として知られ、上記ＳＢＲ処理と組み合わせて使用される。ＰＳ処理は、複素ＱＭＦ（ＱｕａｄｒａｔｕｒｅＭｉｒｒｏｒＦｉｌｔｅｒ）をＳＢＲ処理と共通に用いて、ステレオ化を実現する（非特許文献２参照）。

【0008】

ＰＳは、ＡＡＣとＳＢＲとの組み合わせで使用されることが知られており、その構成はＨＥ−ＡＡＣｖ２プロファイルと呼ばれ、ＰＳ処理を行うには複素ＱＭＦを用いるＨＱ−ＳＢＲと組み合わせて使用することが必須となる（非特許文献２及び非特許文献３参照）。なお、ＰＳデータがない場合は、ＨＱ−ＳＢＲ又はＬＰ−ＳＢＲのどちらと組み合わせて処理してもよい。

【0009】

なお、ＨＥ−ＡＡＣプロファイル及びＨＥ−ＡＡＣｖ２プロファイルにはレベルという概念が存在しており、レベルが高くなるほど、復号可能な信号の種類が多くなっていく特徴がある。種類とは、入力符号化オーディオ信号の最大サンプリング周波数、若しくは、最大チャンネル数、又は、出力復号オーディオ信号の最大サンプリング周波数などである（非特許文献３参照）。

【先行技術文献】

【非特許文献】

【0010】

【非特許文献1】羽鳥光俊、「１セグ放送教科書」、インプレス、２００５年６月１５日

【非特許文献2】野村俊之、「ＭＰＥＧオーディオの最新動向と応用」、［ｏｎｌｉｎｅ］、琉球大学総合情報処理センター広報第５号、２００８年４月、［平成２０年９月１７日検索］、インターネット＜ＵＲＬ：ｈｔｔｐ：／／ｗｗｗ．ｃｃ．ｕ−ｒｙｕｋｙｕ．ａｃ．ｊｐ／ｎｅｗｓ／ｋｏｕｈｏｕ／Ｎｏ５／２−５．ｐｄｆ＞

【非特許文献3】ＩＳＯ／ＩＥＣ１４４９６−３：２００５／ＦＤＡＭ２、「Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ−Ｃｏｄｉｎｇｏｆａｕｄｉｏ−ｖｉｓｕａｌｏｂｊｅｃｔｓ−Ｐａｒｔ３：Ａｕｄｉｏ、ＡＭＥＮＤＭＥＮＴ２：ＡｕｄｉｏＬｏｓｓｌｅｓｓＣｏｄｉｎｇ（ＡＬＳ）、ｎｅｗａｕｄｉｏｐｒｏｆｉｌｅｓａｎｄＢＳＡＣｅｘｔｅｎｓｉｏｎｓ」、２００５年８月

【発明の概要】

【発明が解決しようとする課題】

【0011】

しかしながら、上記従来の符号化オーディオ信号復号手段において、ＨＥ−ＡＡＣｖ２プロファイルに対応し、かつ、高レベルに対応するには演算量の多いＨＱ−ＳＢＲを用いることになり、例えば、入力符号化オーディオ信号がマルチチャンネルの場合、著しく演算量（処理量）が増加してしまうという課題を有している。さらに、この課題を、上記従来技術を用いて解決しようとすると、復号により得られたオーディオ信号に異音が発生するという課題を有している。具体的には、以下の通りである。

【0012】

非特許文献３によれば、上述したように、ＨＥ−ＡＡＣｖ２プロファイルに対応する場合で、ＰＳデータがある場合は、ＨＱ−ＳＢＲと組み合わせて処理することが必須とされているが、ＰＳデータがない場合は、ＨＱ−ＳＢＲ又はＬＰ−ＳＢＲのどちらと組み合わせて処理してもよいことになっている。

【0013】

例えば、上記のような演算量の増加の課題を回避する方法として、非特許文献３の記載内容を考慮し、復号ストリームの状態によってＳＢＲ処理を切り替える方法が考えられる。具体的には、ＨＱ−ＳＢＲを用いることが必須となる場合、すなわち、ＰＳデータがある場合は、ＨＱ−ＳＢＲを用いる。そして、それ以外の場合、すなわち、ＰＳデータがない場合は、演算量の増加を抑えるためにＬＰ−ＳＢＲを用いる。

【0014】

この場合、正常なＰＳデータが付加されているストリームの途中でＰＳデータが欠損していた場合、ＨＱ−ＳＢＲからＬＰ−ＳＢＲへの処理の切替が生じる。あるいは、ＰＳデータは付加されているが、ＳＢＲヘッダが未取得のためＳＢＲ処理とステレオ化処理とが実行できない状態からＳＢＲヘッダが取得された場合、ＬＰ−ＳＢＲからＨＱ−ＳＢＲへの処理の切替が生じる。

【0015】

前述の通り、ＨＱ−ＳＢＲでのＱＭＦフィルタ処理は複素数演算を行い、ＬＰ−ＳＢＲでのＱＭＦフィルタ処理は実数演算を行っている。このため、両者の遅延情報の形式は異なるので、両者のＱＭＦフィルタ遅延情報を共用することは困難である。これにより、ＳＢＲの切替が生じた時点でＱＭＦフィルタ遅延情報の不連続を引き起こし、異音が発生する。

【0016】

図７（ａ）は、時刻ｔ０、ｔ２でＳＢＲ処理が切り替わった場合の１チャンネル分の出力オーディオ信号を表している。ｔ０からｔ１、ｔ２からｔ３はＳＢＲ処理の切り替わりによって遅延情報が使用できなくなるため異音が発生することを表している（なお、正常なオーディオ信号は図７（ｂ）に示す）。このように、ＳＢＲの切替を行うことで演算量の増加を防ごうとすると、ＳＢＲの切替時に異音が発生する。

【0017】

そこで、本発明は、上記課題を解決するものであり、入力符号化オーディオ信号がマルチチャンネルの場合にも著しく演算量を増加させること無く、かつ、異音の発生を回避することができるオーディオ再生装置及びオーディオ再生方法を提供することを目的とする。

【課題を解決するための手段】

【0018】

上記課題を解決するために、本発明のオーディオ再生装置は、符号化されたオーディオ信号である基本コーデックを含むストリームを再生するオーディオ再生装置であって、前記ストリームをフレーム単位で、前記基本コーデックと、当該基本コーデックの帯域を拡張するために用いられる帯域拡張情報とに分離するストリーム分離部と、前記ストリーム分離部によって分離された基本コーデックを解析することで、基本コーデックの性質を示す解析情報を生成する基本コーデック情報解析部と、前記基本コーデック情報解析部によって生成された解析情報に従って前記基本コーデックを復号することで、基本コーデック復号信号を生成する基本コーデック復号部と、前記基本コーデック復号部によって生成された基本コーデック復号信号の周波数帯域を、前記帯域拡張情報を用いて拡張する処理を、前記解析情報に基づいて、実数演算のＱＭＦ処理及び複素数演算のＱＭＦ処理のいずれか一方を用いて実行する帯域拡張処理部とを備える。

【0019】

また、本発明のオーディオ再生装置は、符号化されたオーディオ信号である基本コーデックを含むストリームを再生するオーディオ再生装置であって、前記ストリームをフレーム単位で、前記基本コーデックと、当該基本コーデックの帯域を拡張するために用いられる帯域拡張情報とに分離するストリーム分離部と、前記ストリーム分離部によって分離された基本コーデックを解析することで、基本コーデックの性質を示す解析情報を生成する基本コーデック情報解析部と、前記基本コーデック情報解析部によって生成された解析情報に従って前記基本コーデックを復号することで、基本コーデック復号信号を生成する基本コーデック復号部と、前記基本コーデック復号部によって生成された基本コーデック復号信号の周波数帯域を、前記帯域拡張情報を用いて拡張する第１処理を実行する第１帯域拡張処理部と、前記基本コーデック復号部によって生成された基本コーデック復号信号の周波数帯域を、前記帯域拡張情報を用いて前記第１処理より高い精度で拡張する第２処理を実行する第２帯域拡張処理部と、前記解析情報に基づいて、前記第１帯域拡張処理部と前記第２帯域拡張処理部とを切り替える切替部とを備え、前記第１処理は、実数演算のＱＭＦ処理を用いる処理であり、前記第２処理は、複素数演算のＱＭＦを用いる処理であってもよい。

【0020】

これにより、処理量の異なる２つの処理の切り替えを、基本コーデックの性質を示す解析情報に基づいて実行することで、より適した処理を選択することができる。よって、例えば、入力符号化オーディオ信号がマルチチャンネルの場合にも著しく演算量（処理量）を増加させることがない。また、解析情報に基づいて処理を切り替えるので、基本コーデックの性質が一定である間は、処理が切り替わることはないので、処理の切り替わり時に生じる恐れのある異音の発生を防ぐことができる。

【0021】

また、前記ストリーム分離部は、前記ストリームをフレーム単位で、前記基本コーデックと、当該基本コーデックの帯域を拡張するために用いられる帯域拡張情報と、当該基本コーデックをステレオ化するために用いられるステレオ拡張情報とに分離し、前記オーディオ再生装置は、さらに、前記第２帯域拡張処理部によって周波数帯域が拡張された基本コーデック復号信号を、前記ステレオ拡張情報を用いてステレオ化するステレオ拡張処理部を備えてもよい。

【0022】

これにより、基本コーデックがモノラルオーディオ信号である場合に、正しくステレオ化することができる。

【0023】

また、前記基本コーデック情報解析部は、前記ストリーム分離部によって分離された基本コーデックを解析することで、当該基本コーデックのチャンネル数を示すチャンネル情報と、当該基本コーデックのサンプリング周波数を示すサンプリング周波数情報との少なくとも１つを含む解析情報を生成し、前記切替部は、前記チャンネル情報が示すチャンネル数が予め定められた第１閾値より大きいか否かと、前記サンプリング周波数情報が示すサンプリング周波数が予め定められた第２閾値より大きいか否かとの少なくとも一方を判定し、少なくとも一方が大きいと判定した場合、第１帯域拡張処理部を選択してもよい。

【0024】

これにより、基本コーデックのチャンネル数が多い場合、すなわち、基本コーデックがマルチチャンネルである場合は、精度が低い代わりに処理量の少ない第１処理を選択するので、１チャンネルの信号と比較して、処理量を著しく増加してしまうことを防ぐことができる。あるいは、基本コーデックのサンプリング周波数が大きい場合も、精度が低い代わりに処理量の少ない第１処理を選択するので、同様に、サンプリング周波数が小さい基本コーデックを処理する場合と比較して、処理量を著しく増加してしまうことを防ぐことができる。

【0025】

また、前記オーディオ再生装置は、さらに、第１フレームのステレオ拡張情報を保持するバッファを備え、前記ステレオ拡張処理部は、前記第１フレームより後のフレームであり、かつ、前記ステレオ拡張情報が欠損している第２フレームの基本コーデック復号信号を、前記バッファに保持されたステレオ拡張情報を用いてステレオ化してもよい。

【0026】

これにより、ステレオ化に用いたステレオ拡張情報をバッファに保持し、ステレオ拡張情報が得られない場合に、バッファに保持されたステレオ拡張情報を利用するので、ストリーム中にステレオ拡張データが欠損したフレームを含む場合であっても、当該フレームを正しくステレオ化することができる。

【0027】

また、前記第２帯域拡張処理部は、前記基本コーデック復号信号から前記帯域拡張情報を用いて高周波成分信号を生成し、前記ステレオ拡張処理部は、前記ステレオ拡張情報を用いて、前記基本コーデック復号信号と、前記第２帯域拡張処理部によって生成された高周波成分信号とをそれぞれステレオ化することで、第１チャンネルの基本コーデック復号信号と高周波成分信号と、第２チャンネルの基本コーデック復号信号と高周波成分信号とを生成し、前記第２帯域拡張処理部は、さらに、生成した高周波成分信号と前記基本コーデック復号信号とを合成する帯域合成フィルタを備え、前記ステレオ拡張情報が欠損している場合、前記第１チャンネルの帯域合成フィルタに保持される遅延情報を、前記第２チャンネルの帯域合成フィルタに保持される遅延情報として用いて第２チャンネルの帯域合成を行ってもよい。

【0028】

これにより、１チャンネル分の遅延情報しか得られていない場合でも、得られている遅延情報を他のチャンネルの遅延情報として利用するので、２つのチャンネルの信号を正しく帯域合成することができる。

【0029】

また、前記基本コーデックは、ＡＡＣ方式に基づいて符号化されたオーディオ信号であり、前記帯域拡張情報は、ＳＢＲ方式に基づいて生成されたＳＢＲ情報であり、前記ステレオ拡張情報は、ＰＳ方式に基づいて生成されたＰＳ情報であり、前記第１帯域拡張処理部は、ＬＰ−ＳＢＲ方式に基づいて、前記基本コーデック復号信号の周波数帯域を拡張し、前記第２帯域拡張処理部は、ＨＱ−ＳＢＲ方式に基づいて、前記基本コーデック復号信号の周波数帯域を拡張してもよい。

【0030】

なお、本発明は、オーディオ再生装置として実現できるだけではなく、当該オーディオ再生装置を構成する処理部をステップとするオーディオ再生方法として実現することもできる。また、これらステップをコンピュータに実行させるプログラムとして実現してもよい。さらに、当該プログラムを記録したコンピュータ読み取り可能なＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｃ−ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）などの記録媒体、並びに、当該プログラムを示す情報、データ又は信号として実現してもよい。そして、それらプログラム、情報、データ及び信号は、インターネットなどの通信ネットワークを介して配信してもよい。

【0031】

また、上記の各オーディオ再生装置を構成する構成要素の一部又は全部は、１個のシステムＬＳＩ（ＬａｒｇｅＳｃａｌｅＩｎｔｅｇｒａｔｉｏｎ：大規模集積回路）から構成されていてもよい。なお、システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ及びＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などを含んで構成されるコンピュータシステムである。

【発明の効果】

【0032】

本発明によれば、入力符号化オーディオ信号がマルチチャンネルの場合にも著しく演算量を増加させること無く、かつ、異音の発生を回避することができる。

【図面の簡単な説明】

【0033】

【図1】実施の形態１のオーディオ再生装置の構成を示すブロック図である。

【図2】実施の形態１のオーディオ再生装置の動作を示すフローチャートである。

【図3】実施の形態１の切替部の動作の具体例を示すフローチャートである。

【図4】ステレオ拡張データが付加された入力ストリームの一例を示す図である。

【図5】ステレオ拡張データが付加されていない入力ストリームの一例を示す図である。

【図6】ステレオ拡張データが欠損しているフレームを含む入力ストリームの一例を示す図である。

【図7】出力オーディオ信号の波形の一例を示す図である。

【図8】実施の形態２のオーディオ再生装置の構成を示すブロック図である。

【図9】実施の形態２のステレオ拡張処理部の動作を示すフローチャートである。

【図10】ステレオ化された出力オーディオ信号の波形の一例を示す図である。

【図11】本発明のオーディオ再生装置を搭載するオーディオ再生機器の一例を示す外観図である。

【発明を実施するための形態】

【0034】

以下、本発明のオーディオ再生装置などの実施の形態について図面を参照して説明する。

【0035】

（実施の形態１）
本実施の形態のオーディオ再生装置は、モノラルオーディオ信号をステレオ化するためのステレオ拡張情報の有効・無効に関わらず、基本コーデックの解析結果に基づいて互いに異なる特徴を有する２つの帯域拡張処理を切り替える。２つの帯域拡張処理は、処理量が多いが精度が高い処理、すなわち、音質が優れた出力オーディオ信号を出力する処理と、処理量は少ないが精度が低い処理とである。

【0036】

図１は、本実施の形態のオーディオ再生装置１００の構成を示すブロック図である。同図のオーディオ再生装置１００は、ストリーム分離部１０１と、基本コーデック解析部１０２と、基本コーデック復号部１０３と、帯域拡張データ解析部１０４と、ステレオ拡張データ解析部１０５と、第１帯域拡張処理部１０６と、第２帯域拡張処理部１０７と、ステレオ拡張処理部１０８と、切替部１０９とを備える。

【0037】

ストリーム分離部１０１は、入力されたストリームを、基本コーデックと帯域拡張データとステレオ拡張データとに分離する。なお、ストリームにステレオ拡張データが含まれない場合は、ストリーム分離部１０１は、入力されたストリームを基本コーデックと帯域拡張データとに分離する。そして、ストリーム分離部１０１は、分離した基本コーデックを基本コーデック解析部１０２に伝送し、帯域拡張データを帯域拡張データ解析部１０４に伝送し、ステレオ拡張データをステレオ拡張データ解析部１０５に伝送する。

【0038】

ここで、オーディオ再生装置１００に入力されるストリームは、例えば、ＨＥ−ＡＡＣｖ２プロファイルの構成を有するストリームである。また、基本コーデックは、符号化されたオーディオ信号であり、例えば、ＡＡＣ方式に基づいて符号化されたオーディオ信号である。帯域拡張データは、基本コーデックの帯域を拡張するために用いられるデータであり、例えば、ＳＢＲデータである。ステレオ拡張データは、モノラルオーディオ信号をステレオ化するために用いられるデータであり、例えば、ＰＳデータである。

【0039】

基本コーデック解析部１０２は、ストリーム分離部１０１から伝送された基本コーデックを解析することで基本コーデック解析情報を生成する。なお、基本コーデック解析情報は、基本コーデックのチャンネル数（ＣＨ）を示すチャンネル情報と、基本コーデックのサンプリング周波数（ＦＳ）を示すサンプリング周波数情報となどを含む。基本コーデック解析部１０２は、生成した基本コーデック解析情報を基本コーデック復号部１０３に伝送する。また、基本コーデック解析情報のうち、チャンネル情報とサンプリング周波数情報とを切替部１０９にも伝送する。

【0040】

基本コーデック復号部１０３は、基本コーデック解析部１０２から伝送された基本コーデック解析情報を使用して基本コーデックを復号し、基本コーデック復号信号を生成する。そして、基本コーデック復号部１０３は、生成した基本コーデック復号信号を切替部１０９に伝送する。

【0041】

帯域拡張データ解析部１０４は、ストリーム分離部１０１から伝送された帯域拡張データを解析することで帯域拡張情報を生成し、生成した帯域拡張情報を切替部１０９に伝送する。帯域拡張情報は、例えば、ＳＢＲ技術を用いて基本コーデック復号信号の高域を再構成するための予測に用いられるサイド情報などを含む。

【0042】

ステレオ拡張データ解析部１０５は、ストリーム分離部１０１から伝送されたステレオ拡張データを解析することでステレオ拡張情報を生成し、生成したステレオ拡張情報をステレオ拡張処理部１０８に伝送する。ステレオ拡張情報は、例えば、ＰＳ技術を用いて、モノラルオーディオ信号をステレオ化するためのステレオ拡張処理（ステレオ化処理とも記載）に用いられる情報である。

【0043】

第１帯域拡張処理部１０６は、切替部１０９から伝送された帯域拡張情報を使用し、基本コーデック復号信号の周波数帯域を拡張することで、出力オーディオ信号を出力する。具体的には、帯域拡張情報を用いて高周波成分を予測して生成し、生成した高周波成分信号と基本コーデック復号信号とを帯域合成することで、出力オーディオ信号を出力する。

【0044】

このとき、第１帯域拡張処理部１０６は、第２帯域拡張処理部１０７よりも処理量が少ないという利点がある。しかしながら、第１帯域拡張処理部１０６が出力する出力オーディオ信号の音質は、第２帯域拡張処理部１０７が出力する出力オーディオ信号の音質よりも劣っている。第１帯域拡張処理部１０６は、例えば、ＬＰ−ＳＢＲ方式に基づいて帯域拡張処理を行う。

【0045】

第２帯域拡張処理部１０７は、切替部１０９から伝送された帯域拡張情報を使用し、基本コーデック復号信号の周波数帯域を拡張することで、出力オーディオ信号を出力する。具体的には、帯域拡張情報を用いて高周波成分を予測して生成し、生成した高周波成分信号と基本コーデック復号信号とを帯域合成することで、出力オーディオ信号を出力する。

【0046】

このとき、第２帯域拡張処理部１０７が出力する出力オーディオ信号の音質は、第１帯域拡張処理部１０６が出力する出力オーディオ信号の音質よりも優れているという利点がある。しかしながら、第２帯域拡張処理部１０７は、第１帯域拡張処理部１０６よりも処理量が多くなる。第２帯域拡張処理部１０７は、例えば、ＨＱ−ＳＢＲ方式に基づいて帯域拡張処理を行う。

【0047】

なお、通常、オーディオ信号を符号化する（すなわち、基本コーデックを生成する）際に、符号量を削減するために高周波成分が除去される。このため、基本コーデック復号信号は、主に低周波成分を含むオーディオ信号である。第１帯域拡張処理部１０６及び第２帯域拡張処理部１０７が行う帯域拡張処理は、帯域拡張情報を用いて除去された高周波成分を予測し生成する処理である。

【0048】

具体的には、第１帯域拡張処理部１０６及び第２帯域拡張処理部１０７はそれぞれ、帯域合成フィルタを備え、基本コーデック復号部１０３によって生成された基本コーデック復号信号と、当該基本コーデック復号信号を元にして帯域拡張情報を用いて復元した高周波成分信号とを帯域合成することで、原音に近い出力オーディオ信号を復元する。

【0049】

ステレオ拡張処理部１０８は、ステレオ拡張データ解析部１０５から伝送されたステレオ拡張情報を使用して、第２帯域拡張処理部１０７によって周波数帯域が拡張されたモノラルオーディオ信号にステレオ化処理を行う。具体的には、ステレオ拡張情報を用いて、モノラルオーディオ信号である基本コーデック復号信号と、第２帯域拡張処理部１０７によって生成された高周波成分信号とをそれぞれステレオ化することで、Ｌｃｈの基本コーデック復号信号と高周波成分信号と、Ｒｃｈの基本コーデック復号信号と高周波成分信号とを生成する。ステレオ拡張処理部１０８は、例えば、ＰＳ方式に基づいてステレオ化処理を行う。このとき、ステレオ拡張処理部１０８は、必ず第２帯域拡張処理部１０７と組み合わされて使用されなければならない。すなわち、ステレオ拡張処理部１０８は、複素ＱＭＦを第２帯域拡張処理部１０７と共有する。

【0050】

第２帯域拡張処理部１０７は、ステレオ拡張されたＬｃｈとＲｃｈとの信号をそれぞれ、帯域合成する。この第２帯域拡張処理部１０７の帯域合成処理における遅延情報は、入力されたストリームにステレオ拡張データが欠損している場合は、Ｌｃｈの遅延情報をＲｃｈの遅延情報にコピーする。そして、ステレオ拡張データが得られた際に、以前のフレームでコピーしたＬｃｈの遅延情報をＲｃｈの遅延情報として用いて、Ｒｃｈの帯域合成処理を行う。なお、Ｌｃｈの遅延情報は、帯域合成処理において帯域合成フィルタ内にフレームをまたいで保持される情報である。

【0051】

切替部１０９は、基本コーデック解析部１０２から伝送されるチャンネル数ＣＨとサンプリング周波数ＦＳとによって、端子Ａ、又は、端子Ｂのどちらに接続するかを判定する。ここでの判定手順の具体例については、図３を用いて後述する。切替部１０９は、基本コーデック復号部１０３から伝送される基本コーデック復号信号と、帯域拡張データ解析部１０４から伝送される帯域拡張情報とを、判定結果に従って第１帯域拡張処理部１０６又は第２帯域拡張処理部１０７に伝送する。

【0052】

以上の構成に示すように、本実施の形態のオーディオ再生装置１００は、基本コーデックの解析結果に基づいて、互いに異なる特徴を有する２つの帯域拡張処理のいずれかを選択する切替部１０９を備える。２つの帯域拡張処理は、処理量は少ないが音質が劣っている第１処理と、処理量は多いが音質は優れている第２処理とである。

【0053】

続いて、本実施の形態のオーディオ再生装置１００の動作について説明する。

【0054】

図２は、本実施の形態のオーディオ再生装置１００の動作を示すフローチャートである。なお、以下の動作は、フレーム単位で行われるものとする。

【0055】

まず、ストリーム分離部１０１が、入力されたストリームを、基本コーデックと帯域拡張データとステレオ拡張データとに分離する（Ｓ１０１）。基本コーデックは基本コーデック解析部１０２に、帯域拡張データは帯域拡張データ解析部１０４に、ステレオ拡張データはステレオ拡張データ解析部１０５にそれぞれ伝送される。

【0056】

次に、分離した各データを解析する（Ｓ１０２）。具体的には、基本コーデック解析部１０２は、基本コーデックを解析することで基本コーデック解析情報を生成する。帯域拡張データ解析部１０４は、帯域拡張データを解析することで帯域拡張情報を生成する。ステレオ拡張データ解析部１０５は、ステレオ拡張データを解析することでステレオ拡張情報を生成する。なお、ステレオ拡張データが欠損している場合などステレオ拡張情報を生成できない場合は、ステレオ拡張データ解析部１０５は、ステレオ拡張情報がないことを示す情報をステレオ拡張処理部１０８に伝送する。

【0057】

次に、基本コーデック復号部１０３は、基本コーデック解析情報に従って基本コーデックを復号する（Ｓ１０３）。復号により生成された基本コーデック復号信号は、切替部１０９に伝送される。

【0058】

切替部１０９は、基本コーデック解析情報に基づいて、基本コーデック復号信号の伝送経路の接続先を判定し、判定結果に基づいて端子Ａと端子Ｂとの切替を行う（Ｓ１０４）。例えば、基本コーデック解析情報に含まれるチャンネル情報を参照し、基本コーデックのチャンネル数ＣＨが所定の閾値より大きい場合、切替部１０９は、端子Ａを選択する。あるいは、基本コーデック解析情報に含まれるサンプリング周波数情報を参照し、基本コーデックのサンプリング周波数ＦＳが所定の閾値以上の場合、切替部１０９は、端子Ａを選択する。そして、これら以外の場合、切替部１０９は、端子Ｂを選択する。

【0059】

端子Ａが選択された場合（Ｓ１０５で“Ａ”）、基本コーデック復号信号と帯域拡張情報とは第１帯域拡張処理部１０６に伝送される。第１帯域拡張処理部１０６は、基本コーデック復号信号の周波数帯域を拡張することで、出力オーディオ信号を生成する（Ｓ１０６）。なお、第１帯域拡張処理部１０６による処理は、処理量が少ないが、生成されるオーディオ信号の音質は劣ることを特徴とするようなＬＰ−ＳＢＲ方式などに基づいて実行される。

【0060】

端子Ｂが選択された場合（Ｓ１０５で“Ｂ”）、基本コーデック復号信号と帯域拡張情報とは第２帯域拡張処理部１０７に伝送される。第２帯域拡張処理部１０７は、基本コーデック復号信号の周波数帯域を拡張することで、出力オーディオ信号を生成する（Ｓ１０７）。なお、第２帯域拡張処理部１０７による処理は、処理量は多いが、生成されるオーディオ信号の音質が優れていることを特徴とするようなＨＱ−ＳＢＲ方式などに基づいて実行される。

【0061】

このとき、ステレオ拡張情報がある場合、ステレオ拡張処理部１０８は、第２帯域拡張処理部１０７によって周波数帯域が拡張された基本コーデック復号信号（モノラルオーディオ信号）にステレオ化処理を行う。

【0062】

最後に、第１帯域拡張処理部１０６又は第２帯域拡張処理部１０７によって生成された出力オーディオ信号を出力する（Ｓ１０８）。

【0063】

以上のようにして、基本コーデック復号信号の高周波成分を予測して復元し、より原音に近い出力オーディオ信号を生成することができる。このとき、基本コーデックの性質を示す基本コーデック解析情報に基づいて処理を選択する。これにより、例えば、マルチチャンネル、又は、サンプリング周波数が大きい場合などの処理量が増大する場合に、処理量の少ない第１帯域拡張処理部１０６を選択することで、処理量の増大を防ぐことができる。

【0064】

続いて、接続先の判定処理（Ｓ１０４）の具体例について説明する。

【0065】

図３は、本実施の形態の切替部１０９の動作の具体例を示すフローチャートである。

【0066】

まず、入力された基本コーデックのチャンネル数ＣＨとサンプリング周波数ＦＳとが、所定の条件を満たすか否かを判定する（Ｓ２０１）。ここでは、ＣＨが１であり、かつ、ＦＳが２４ｋＨｚ以下であるか否かを判定する。

【0067】

チャンネル数ＣＨが２以上であるか、又は、サンプリング周波数ＦＳが２４ｋＨｚより大きい場合（Ｓ２０１でＮｏ）、伝送経路を端子Ａに接続し、入力されている帯域拡張情報と基本コーデック復号信号とを第１帯域拡張処理部１０６へ伝送する（Ｓ２０２）。また、チャンネル数ＣＨが１であり、かつ、サンプリング周波数ＦＳが２４ｋＨｚ以下である場合（Ｓ２０１でＹｅｓ）、伝送経路を端子Ｂに接続し、入力されている帯域拡張情報と基本コーデック復号信号とを第２帯域拡張処理部１０７へ伝送する（Ｓ２０３）。

【0068】

以下では、具体的なストリームの例を挙げながら、本実施の形態のオーディオ再生装置１００の動作について説明する。

【0069】

図４は、ステレオ拡張データが付加された入力ストリームの一例を示す図である。

【0070】

例えば、オーディオ再生装置１００に、図４に示すようなストリームが入力された場合、基本コーデック解析部１０２は、基本コーデックを解析し、チャンネル数ＣＨ（＝１）とサンプリング周波数情報ＦＳ（＝２４ｋＨｚ）とを切替部１０９へ伝送する。切替部１０９は、図３に示す条件を満たすので（Ｓ２０１でＹｅｓ）、伝送経路を端子Ｂへ接続し、基本コーデック復号信号と帯域拡張情報とを第２帯域拡張処理部１０７へ伝送する（Ｓ２０３）。第２帯域拡張処理部１０７は、切替部１０９から伝送された基本コーデック復号信号を、帯域拡張情報を使用して帯域拡張処理する。このとき、併せてステレオ拡張処理部１０８がステレオ拡張情報を使用してステレオ拡張処理を行い、ステレオ拡張されたオーディオ信号を出力する。

【0071】

なお、図４に示すように、ステレオ拡張データが付加されている場合は、チャンネル数ＣＨは１である。ステレオ拡張データは、モノラルオーディオ信号をステレオ化するための情報であり、ＣＨ＝１は、基本コーデック復号信号がモノラルオーディオ信号であることを示す。

【0072】

また、図５は、ステレオ拡張データが付加されていない入力ストリームの一例を示す図である。オーディオ再生装置１００に、図５に示すようなストリームが入力された場合、基本コーデック解析部１０２は、基本コーデックを解析し、チャンネル数ＣＨ（＝５．１）とサンプリング周波数情報ＦＳ（＝２４ｋＨｚ）とを切替部１０９へ伝送する。切替部１０９は、図３に示す条件を満たさないので（Ｓ２０１でＮｏ）、伝送経路を端子Ａへ接続し、基本コーデック復号信号と帯域拡張情報とを第１帯域拡張処理部１０６へ伝送する（Ｓ２０２）。第１帯域拡張処理部１０６は、切替部１０９から伝送された基本コーデック復号信号を、帯域拡張情報を使用して帯域拡張処理を行い、オーディオ信号を出力する。

【0073】

次に、ステレオ拡張データが途中のフレームで欠損し、以降のフレームでまた現れるようなストリームをオーディオ再生装置１００に入力した場合について説明する。

【0074】

図６は、ステレオ拡張データが欠損しているフレームを含む入力ストリームの一例を示す図である。同図に示すように、フレーム２０１と２０３とは、ステレオ拡張データが含まれているのに対して、フレーム２０２のステレオ拡張データは欠損している。これに対して、フレーム２０１、２０２、２０３に含まれる基本コーデックを解析することで生成される基本コーデック解析情報は変化しない。すなわち、全フレーム２０１、２０２、２０３の基本コーデックのチャンネル数ＣＨは１であり、サンプリング周波数は２４ｋＨｚである。

【0075】

このため、切替部１０９は、フレームごとに図３に示す条件を満たすと判定し（Ｓ２０１でＹｅｓ）、伝送経路を端子Ｂへ接続する（Ｓ２０３）。第２帯域拡張処理部１０７は、各フレームの帯域拡張処理を行う。

【0076】

ここで、図７は、出力オーディオ信号の波形の一例を示す図である。図７（ａ）には、フレーム２０２でＰＳデータが欠損したために、従来では、時刻ｔ０で、処理がＨＱ−ＳＢＲ方式からＬＰ−ＳＢＲ方式に切り替わり、時刻ｔ２で、処理がＬＰ−ＳＢＲ方式からＨＱ−ＳＢＲ方式に切り替わった場合の出力オーディオ信号の波形を示す。従来では、このように処理が切り替わるために、時刻ｔ０からｔ１の間と、時刻ｔ２からｔ３の間とで、遅延情報が利用できなくなるために、異音が発生している。

【0077】

これに対して、上述したように、本実施の形態のオーディオ再生装置１００では、ストリーム内のステレオ拡張データの有無とは無関係に、第１帯域拡張処理部１０６と第２帯域拡張処理部１０７のいずれの処理部で処理を行うかを決定する。つまり、各フレーム間で基本コーデックの解析情報が同じであれば、常に同じ処理部で各フレームの基本コーデック復号信号を帯域拡張する。したがって、遅延データの不連続は生じないため、図７（ｂ）で示すとおり、異音の発生を防ぐことができる。

【0078】

以上のように、本実施の形態のオーディオ再生装置１００では、ステレオ拡張データを含むストリーム（すなわち、ＣＨ＝１のストリーム）に対する帯域拡張処理を第２帯域拡張処理部１０７が行うため、問題なくステレオ拡張処理を行うことが可能である。また、ステレオ拡張データを含まないマルチチャンネルのストリームに対する帯域拡張処理を第１帯域拡張処理部１０６が行うことで、処理量（演算量）を削減することが可能となる。

【0079】

これにより、例えば、マルチチャンネルのオーディオ信号を再生する際の演算量の増加を抑えつつ、ＨＥ−ＡＡＣｖ２プロファイルの構成を持つストリームを適切に復号したオーディオ信号を再生することができる。このとき、ＰＳデータが入力されない場合から、ＰＳデータが入力された場合でも、異音発生の無いオーディオ信号を再生することができる。

【0080】

（実施の形態２）
本実施の形態のオーディオ再生装置は、ステレオ拡張情報を保持するバッファを備え、例えば、放送受信などの影響でステレオ拡張データの欠損があった場合に、バッファに保持されたステレオ拡張情報を用いてステレオ化を実行する。

【0081】

図８は、本実施の形態のオーディオ再生装置３００の構成を示すブロック図である。同図のオーディオ再生装置３００は、図１のオーディオ再生装置１００と比べて、ステレオ拡張処理部１０８の代わりにステレオ拡張処理部３０８を備え、さらに、新たにバッファ３１０を備える点が異なる。以下では、異なる点を中心に説明し、同じ点は説明を省略する。

【0082】

ステレオ拡張処理部３０８は、ステレオ拡張処理部１０８の処理に加え、さらに、ステレオ化処理に用いたステレオ拡張情報をバッファ３１０に格納する。具体的には、ステレオ拡張処理部３０８は、第２帯域拡張処理部１０７によって周波数帯域が拡張された基本コーデック復号信号を、ステレオ拡張データ解析部１０５から伝送されるステレオ拡張情報を用いてステレオ化する。このとき用いたステレオ拡張情報をバッファ３１０に格納する。例えば、新たなステレオ拡張情報が得られるごとに、ステレオ拡張処理部３０８は、バッファ３１０に格納したステレオ拡張情報を最新のものに更新する。

【0083】

さらに、ステレオ拡張処理部３０８は、フレームのステレオ拡張情報が欠損している場合のようにステレオ拡張情報がない場合は、バッファ３１０からステレオ拡張情報を読み出し、読み出したステレオ拡張情報を用いて当該フレームの基本コーデック復号信号（モノラルオーディオ信号）をステレオ化する。

【0084】

バッファ３１０は、ステレオ拡張データ解析部１０５から伝送されたステレオ拡張情報を格納する。バッファ３１０は、最新のステレオ拡張情報を保持するだけでなく、複数のステレオ拡張情報を保持していてもよい。複数のステレオ拡張情報が保持されている場合は、ステレオ拡張処理部３０８は、例えば、基本コーデック拡張情報などを参照することで、処理対象の基本コーデック復号信号に類似する基本コーデック復号信号のステレオ化処理に用いたステレオ拡張情報を利用する。

【0085】

以上の構成に示すように、本実施の形態のオーディオ再生装置３００は、ステレオ拡張情報を保持するバッファ３１０を備え、ステレオ拡張情報がない場合に、バッファ３１０に保持されたステレオ拡張情報を用いて基本コーデック復号信号をステレオ化する。

【0086】

続いて、本実施の形態のオーディオ再生装置３００の動作のうち、ステレオ拡張処理部３０８の動作について説明する。なお、オーディオ再生装置３００は、図２及び図３に示すフローチャートに沿って入力されるストリームを復号する。本実施の形態のステレオ拡張処理部３０８は、第２帯域拡張処理部１０７が帯域拡張を行うとき（Ｓ１０７）に実行される。

【0087】

図９は、本実施の形態のステレオ拡張処理部３０８の動作を示すフローチャートである。

【0088】

まず、ステレオ拡張処理部３０８は、ストリームにステレオ拡張データが付加されているか否か、すなわち、ステレオ拡張情報がステレオ拡張データ解析部１０５から伝送されているか否かを判定する（Ｓ３０１）。ステレオ拡張情報が伝送されている場合（Ｓ３０１でＹｅｓ）、当該ステレオ拡張情報を用いてステレオ拡張処理を行う（Ｓ３０２）。さらに、ステレオ拡張処理部３０８は、このとき使用したステレオ拡張情報を保存する（Ｓ３０３）。

【0089】

ステレオ拡張情報が伝送されていない場合（Ｓ３０１でＮｏ）、以前のフレームを復号する際にステレオ拡張処理を行っているか否かを判定する（Ｓ３０４）。ステレオ拡張処理を行っている場合（Ｓ３０４でＹｅｓ）、以前のフレームを復号する際に保存されているステレオ拡張情報を使用してステレオ拡張処理を行う（Ｓ３０５）。ステレオ拡張処理を行っていない場合（Ｓ３０４でＮｏ）、何もせずに終了する。

【0090】

以上のように、本実施の形態のステレオ拡張処理部３０８は、以前のフレームを復号する際に用いたステレオ拡張情報をバッファ３１０に保存し、以降のフレームでステレオ拡張データの欠損があった場合、バッファ３１０に保存されたステレオ拡張情報を用いて基本コーデック復号信号をステレオ化する。

【0091】

以下では、図６に示すストリームが入力された場合の本実施の形態のオーディオ再生装置３００の動作について説明する。

【0092】

本実施の形態によれば、図６に示すように途中でステレオ拡張データが欠損するようなストリームが入力された場合、全てのフレーム２０１〜２０３はＣＨ＝１かつＦＳ≦２４ｋＨｚであるので、切替部１０９は伝送経路を端子Ｂに接続し、基本コーデック復号信号と帯域拡張情報とは第２帯域拡張処理部１０７に伝送される。これにより、全てのフレーム２０１〜２０３に対する帯域拡張処理は、第２帯域拡張処理部１０７によって行われるため遅延情報の連続性は保たれる。

【0093】

ここで、図１０は、ステレオ化された出力オーディオ信号の波形の一例を示す図である。従来は、ステレオ拡張データが欠損しているフレームの区間（ｔ４とｔ５の間の期間）は、ステレオ拡張処理が行われず、図１０（ａ）に示すようにＲｃｈが出力されないため、聞き手は違和感を感じる。この違和感を解消し、図１０（ｂ）に示すように、Ｒｃｈを正しく出力するため、ステレオ拡張処理部３０８は、以下のように動作する。

【0094】

フレーム２０１にはステレオ拡張データが存在するので（Ｓ３０１でＹｅｓ）、ステレオ拡張処理部３０８は、ステレオ拡張処理を行い（Ｓ３０２）、このとき用いたステレオ拡張情報を保存する（Ｓ３０３）。

【0095】

次に、ステレオ拡張データが欠損したフレーム２０２が入力される。ステレオ拡張処理部３０８は、フレーム２０２にはステレオ拡張データが欠損しており（Ｓ３０１でＮｏ）、さらに、フレーム２０１の復号時にステレオ拡張処理を行っているため（Ｓ３０４でＹｅｓ）、フレーム２０１のステレオ拡張情報を使用して、フレーム２０２のステレオ拡張処理を行う。

【0096】

続いて、次のステレオ拡張データが存在するフレーム２０３が入力される。フレーム２０３にはステレオ拡張データが存在するので（Ｓ３０１でＹｅｓ）、フレーム２０３から抽出したステレオ拡張情報を使用して、フレーム２０３のステレオ拡張処理を行う（Ｓ３０２）。

【0097】

以上のように、本実施の形態のオーディオ再生装置３００では、図１０（ｂ）に示すように、出力音の連続性を保つことができ、かつ、ステレオ拡張データが欠損したフレームでもステレオ拡張することが可能となる。

【0098】

これにより、例えば、マルチチャンネル再生の際の演算量の増加を抑えつつ、ＨＥ−ＡＡＣｖ２プロファイルの構成を持つストリームを適切に復号したオーディオ信号を再生することができる。このとき、ＰＳデータが入力されない場合から、ＰＳデータが入力された場合でも、異音発生の無いオーディオ信号を再生することができる。あるいは、ＰＳデータが入力された場合から、ＰＳデータが欠損することによって入力されない場合でも以前に用いたＰＳデータを用いて、ステレオオーディオ信号として再生することができる。

【0099】

なお、図１１は、本発明のオーディオ再生装置を搭載するオーディオ再生機器の一例を示す外観図である。同図には、記録メディア４０１と、オーディオ再生機器４０２と、イヤホン４０３とを示す。

【0100】

記録メディア４０１は、圧縮オーディオストリームを記録できる記録メディアである。図１１では、ＳＤカードのような機器から取り出せるメディアとして記載しているが、光ディスクや、機器に内蔵されたＨＤＤ等で実現してもよい。

【0101】

オーディオ再生機器４０２は、圧縮オーディオ再生機器であり、機器内部の構成要素は実施の形態１及び２に記載したオーディオ再生装置１００及び３００のうち、少なくとも１つを含むように構成される。

【0102】

イヤホン４０３は、オーディオ再生機器４０２から出力される出力オーディオ信号を外部に出力するスピーカー装置である。図１１では、ユーザの耳に取り付けるイヤホンを図示しているが、ユーザの頭に取り付けるヘッドフォンでもよく、又は、卓上式のスピーカー装置でもよい。

【0103】

このようにオーディオ再生機器４０２を構成することで、ステレオ拡張データが途中で欠損するストリームについても異音を発声させずに出力オーディオ信号を得ることができる。

【0104】

以上、本発明のオーディオ再生装置及びオーディオ再生方法について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を当該実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。

【0105】

例えば、切替部１０９は、判定条件をチャンネル数が１でありかつサンプリング周波数が２４ｋＨｚ以下としているが、これに限らず、例えば、チャンネル数が２以下の場合のみ第２帯域拡張処理部１０７を使用する（端子Ｂに接続する）としてもよい。この場合、基本コーデックのチャンネル数が１又は２のストリームが入力されれば、音質が良いが処理量の多い第２帯域拡張処理部１０７を使用して帯域拡張を行う。

【0106】

これに対して、３チャンネル以上のストリームが入力された場合には、全体の処理量削減のために音質の劣化はあるが、処理量の少ない第１帯域拡張処理部１０６を使用して帯域拡張を行うことが可能となる。このように、プロセッサ能力、及び、メモリリソースが許す限りマルチチャンネルに対しても高音質な出力を得られる構成にすることが可能である。

【0107】

なお、本発明は、上述したように、オーディオ再生装置及びオーディオ再生方法として実現できるだけではなく、本実施の形態のオーディオ再生方法をコンピュータに実行させるためのプログラムとして実現してもよい。また、当該プログラムを記録するコンピュータ読み取り可能なＣＤ−ＲＯＭなどの記録媒体として実現してもよい。さらに、当該プログラムを示す情報、データ又は信号として実現してもよい。そして、これらプログラム、情報、データ及び信号は、インターネットなどの通信ネットワークを介して配信されてもよい。

【0108】

また、本発明は、オーディオ再生装置を構成する構成要素の一部又は全部を、１個のシステムＬＳＩから構成してもよい。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ及びＲＡＭなどを含んで構成されるコンピュータシステムである。

【産業上の利用可能性】

【0109】

本発明は、処理量が著しく増加することを防ぎ、かつ、異音の発生を防ぐという効果を奏し、オーディオ再生装置などに利用できる。例えば、携帯型音楽プレーヤーなどのプロセッサ性能及びメモリリソースが限られているオーディオ再生機器などに利用することができる。

【符号の説明】

【0110】

１００、３００オーディオ再生装置
１０１ストリーム分離部
１０２基本コーデック解析部
１０３基本コーデック復号部
１０４帯域拡張データ解析部
１０５ステレオ拡張データ解析部
１０６第１帯域拡張処理部
１０７第２帯域拡張処理部
１０８、３０８ステレオ拡張処理部
１０９切替部
２０１、２０２、２０３フレーム
３１０バッファ
４０１記録メディア
４０２オーディオ再生機器
４０３イヤホン

【図1】