(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6621709
(24)【登録日】2019年11月29日
(45)【発行日】2019年12月18日
(54)【発明の名称】音声処理装置、音声処理方法及びコンピュータプログラム
(51)【国際特許分類】
G10L 21/0388 20130101AFI20191209BHJP
【FI】
G10L21/0388
【請求項の数】9
【全頁数】13
(21)【出願番号】特願2016-105691(P2016-105691)
(22)【出願日】2016年5月26日
(65)【公開番号】特開2017-211558(P2017-211558A)
(43)【公開日】2017年11月30日
【審査請求日】2018年12月25日
(73)【特許権者】
【識別番号】000101732
【氏名又は名称】アルパイン株式会社
(74)【代理人】
【識別番号】100099748
【弁理士】
【氏名又は名称】佐藤 克志
(72)【発明者】
【氏名】田地 良輔
【審査官】
岩田 淳
(56)【参考文献】
【文献】
国際公開第2008/129853(WO,A1)
【文献】
特開2006−119524(JP,A)
【文献】
特開2014−235274(JP,A)
【文献】
米国特許出願公開第2016/0104499(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 21/00−21/18
(57)【特許請求の範囲】
【請求項1】
オーディオデータの高域補間を行う音声処理装置であって、
前記高域補間の対象とするオーディオデータである入力オーディオデータが表す音声の周波数帯域の上限を検出する周波数帯域上限検出部と、
前記周波数帯域上限検出部が検出した上限の2倍以下のサンプリングレートとなるように、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成するダウンサンプリング部と、
前記ダウンサンプリング部が生成した中間オーディオデータを、FIF(Fractal Interpolation Functions)によってアップサンプリングして、高域補間後のオーディオデータを生成するアップサンプリング部とを有することを特徴とする音声処理装置。
【請求項2】
請求項1記載の音声処理装置であって、
前記ダウンサンプリング部は、前記入力オーディオデータのサンプリングレートの2のべき乗分の1のサンプリングレートのうちの、前記周波数帯域上限検出部が検出した上限の2倍以下のサンプリングレートとなる最大のサンプリングレートに、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成し、
前記アップサンプリング部は、前記中間オーディオデータを、FIF(Fractal Interpolation Functions)によって、当該中間オーディオデータのサンプリングレートの2のべき乗倍のサンプリングレートにアップサンプリングして、前記高域補間後のオーディオデータを生成することを特徴とする音声処理装置。
【請求項3】
請求項1または2記載の音声処理装置であって、
前記入力オーディオデータは、圧縮符号化されたオーディオデータを復号したオーディオデータであり、
前記周波数帯域上限検出部は、前記圧縮符号化されたオーディオデータの再生時に単位時間あたりに処理すべき当該圧縮符号化されたオーディオデータのビット数を表すビットレートに基づいて、前記入力オーディオデータが表す音声の周波数帯域の上限を検出することを特徴とする音声処理装置。
【請求項4】
音声処理を行う音声処理装置において、オーディオデータの高域補間を行う音声処理方法であって、
前記音声処置装置が、前記高域補間の対象とするオーディオデータである入力オーディオデータが表す音声の周波数帯域の上限を検出する周波数帯域上限検出ステップと、
前記音声処置装置が、前記周波数帯域上限検出ステップで検出した上限の2倍以下のサンプリングレートとなるように、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成するダウンサンプリングステップと、
前記音声処置装置が、前記ダウンサンプリングステップで生成した中間オーディオデータを、FIF(Fractal Interpolation Functions)によってアップサンプリングして、高域補間後のオーディオデータを生成するアップサンプリング部とを有することを特徴とする音声処理方法。
【請求項5】
請求項4記載の音声処理方法であって、
前記ダウンサンプリングステップにおいて、前記入力オーディオデータのサンプリングレートの2のべき乗分の1のサンプリングレートのうちの、前記周波数帯域上限検出ステップで検出した上限の2倍以下のサンプリングレートとなる最大のサンプリングレートに、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成し、
前記アップサンプリングステップにおいて、前記中間オーディオデータを、FIF(Fractal Interpolation Functions)によって、当該中間オーディオデータのサンプリングレートの2のべき乗倍のサンプリングレートにアップサンプリングして、前記高域補間後のオーディオデータを生成することを特徴とする音声処理方法。
【請求項6】
請求項4または5記載の音声処理方法であって、
前記入力オーディオデータは、圧縮符号化されたオーディオデータを復号したオーディオデータであり、
前記周波数帯域上限検出ステップにおいて、前記圧縮符号化されたオーディオデータの再生時に単位時間あたりに処理すべき当該圧縮符号化されたオーディオデータのビット数を表すビットレートに基づいて、前記入力オーディオデータが表す音声の周波数帯域の上限を検出することを特徴とする音声処理方法。
【請求項7】
コンピュータによって読み取られ実行されるコンピュータプログラムであって、
前記コンピュータを、
高域補間の対象とするオーディオデータである入力オーディオデータが表す音声の周波数帯域の上限を検出する周波数帯域上限検出部と、
前記周波数帯域上限検出部が検出した上限の2倍以下のサンプリングレートとなるように、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成するダウンサンプリング部と、
前記ダウンサンプリング部が生成した中間オーディオデータを、FIF(Fractal Interpolation Functions)によってアップサンプリングして、高域補間後のオーディオデータを生成するアップサンプリング部として機能させることを特徴とするコンピュータプログラム。
【請求項8】
請求項7記載のコンピュータプログラムであって、
前記ダウンサンプリング部は、前記入力オーディオデータのサンプリングレートの2のべき乗分の1のサンプリングレートのうちの、前記周波数帯域上限検出部が検出した上限の2倍以下のサンプリングレートとなる最大のサンプリングレートに、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成し、
前記アップサンプリング部は、前記中間オーディオデータを、FIF(Fractal Interpolation Functions)によって、当該中間オーディオデータのサンプリングレートの2のべき乗倍のサンプリングレートにアップサンプリングして、前記高域補間後のオーディオデータを生成することを特徴とするコンピュータプログラム。
【請求項9】
請求項7または8記載のコンピュータプログラムであって、
前記入力オーディオデータは、圧縮符号化されたオーディオデータを復号したオーディオデータであり、
前記周波数帯域上限検出部は、前記圧縮符号化されたオーディオデータの再生時に単位時間あたりに処理すべき当該圧縮符号化されたオーディオデータのビット数を表すビットレートに基づいて、前記入力オーディオデータが表す音声の周波数帯域の上限を検出することを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声の高域成分を補間する技術に関するものである。
【背景技術】
【0002】
音声の高域成分を補間する技術としては、FIF(Fractal Interpolation Functions/フラクタル補間機能)の技術が知られている(たとえば、特許文献1、2、3)。
ここで、FIFは、
図6に示すように、所定間隔のサンプルの時間位置Xiを分割点としてオーディオデータの時間区間Tを複数に分割した時間区間である補間区間ti の信号として、時間区間Tの信号Sの縮小写像ω
i(S)を補間することにより、オーディオデータをアップサンプリングして音声の高域成分を補間する技術である。
【0003】
また、このようなFIFによってオーディオデータをアップサンプリングして音声の高域成分を補間する技術としては、入力したオーディオデータが表す音声の周波数帯域の上限が、オーディオデータのサンプリングレートの1/2に満たない場合に、オーディオデータのサンプリングレートを1/2にダウンサンプリングした上で、FIFによってダウンサンプリングしたオーディオデータをアップサンプリングして音声の高域成分を補間する技術も知られている(特許文献4)。
【0004】
なお、サンプリングレートFsのオーディオデータが表す音声の周波数帯域の上限は、ナイキストの定理に従いFs/2となるが、圧縮符号化されて提供されるオーディオデータなどは、サンプリングレートFsのオーディオデータが表す音声の周波数帯域の上限がFs/2未満であることも多い。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2005-084370号公報
【特許文献2】特開2006-330144号公報
【特許文献3】特開2009-229492号公報
【特許文献4】特開2006-119524号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述した、入力したオーディオデータのサンプリングレートを1/2にダウンサンプリングした上でFIFによるアップサンプリングを行って音声の高域成分を補間する技術を適用した場合でも、入力したオーディオデータが表す音声の周波数帯域の上限Fmaxが、ダウンサンプリング後のオーディオデータのサンプリングレートFsの1/2未満である場合には、ダウンサンプリング後のオーディオデータに、FmaxとFs/2の間の周波数成分が含まれていないために、
図7aに示すように、オーディオデータが表す音声の周波数帯域の上限Fmax周辺の高域成分が補間されずに欠落してしまうという現象が生じる。
【0007】
なお、
図7aは、オーディオデータのサンプリングレートが96kHz、オーディオデータが表す音声の周波数帯域の上限が20kHz、ダウンサンプリング後のオーディオデータのサンプリングレートが48kHz、FIFによってアップサンプリングしたオーディオデータのサンプリングレートが96kHzである場合について表しており、図中、SIがオーディオデータの周波数特性を、SOがFIFによって高域を補間したオーディオデータの周波数特性を表している。
【0008】
そこで、本発明は、オーディオデータが表す音声の周波数帯域の上限によらずに、良好に高域を補間することができる音声処理装置を提供することを課題とする。
【課題を解決するための手段】
【0009】
前記課題達成のために、本発明は、オーディオデータの高域補間を行う音声処理装置に、前記高域補間の対象とするオーディオデータである入力オーディオデータが表す音声の周波数帯域の上限を検出する周波数帯域上限検出部と、前記周波数帯域上限検出部が検出した上限の2倍以下のサンプリングレートとなるように、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成するダウンサンプリング部と、前記ダウンサンプリング部が生成した中間オーディオデータを、FIF(Fractal Interpolation Functions)によってアップサンプリングして、高域補間後のオーディオデータを生成するアップサンプリング部とを備えたものである。
【0010】
ここで、このような音声処理装置は、前記ダウンサンプリング部において、前記入力オーディオデータのサンプリングレートの2のべき乗分の1のサンプリングレートのうちの、前記周波数帯域上限検出部が検出した上限の2倍以下のサンプリングレートとなる最大のサンプリングレートに、前記入力オーディオデータを当該入力オーディオデータからサンプルを間引くことによりダウンサンプリングして、中間オーディオデータを生成し、前記アップサンプリング部において、前記中間オーディオデータを、FIF(Fractal Interpolation Functions)によって、当該中間オーディオデータのサンプリングレートの2のべき乗倍のサンプリングレートにアップサンプリングして、前記高域補間後のオーディオデータを生成するように構成してもよい。
【0011】
また、以上の音声処理装置は、前記入力オーディオデータが、圧縮符号化されたオーディオデータを復号したオーディオデータである場合には、前記周波数帯域上限検出部において、前記圧縮符号化されたオーディオデータの再生時に単位時間あたりに処理すべき当該圧縮符号化されたオーディオデータのビット数を表すビットレートに基づいて、前記入力オーディオデータが表す音声の周波数帯域の上限を検出するように構成してもよい。
【0012】
このような音声処理装置によれば、オーディオデータが表す音声の周波数帯域の上限が低い場合であっても、FIF(Fractal Interpolation Functions)によるアップサンプリングによって補間されずに欠落してしまう周波数帯域が発生してしまうことを抑止して良好に高域を補間できるようになる。
【発明の効果】
【0013】
以上のように、本発明によれば、オーディオデータが表す音声の周波数帯域の上限によらずに、良好に高域を補間することができる音声処理装置を提供することができる。
【図面の簡単な説明】
【0014】
【
図1】本発明の実施形態に係る音声処理装置の構成を示すブロック図である。
【
図2】本発明の実施形態に係る音声処理装置において高域補間を行う機能ブロックを示す図である。
【
図3】本発明の実施形態に係る高域補間動作制御処理を示すフローチャートである。
【
図4】本発明の実施形態に係る高域補間動作の例を示す図である。
【
図5】本発明の実施形態に係る高域補間動作の例を示す図である。
【
図6】FIFによる高域補間の原理を示す図である。
【
図7】本発明の実施形態に係る高域補間の結果と従来の高域補間の結果の比較例を示す図である。
【発明を実施するための形態】
【0015】
以下、本発明の実施形態について説明する。
図1に、本実施形態に係る音声処理装置の構成を示す。
図示するように、音声処理装置は、オーディオソース1、入力処理部2、デジタルサウンドプロセッサ3、アンプ4、スピーカ5、以上各部を制御する制御部6を備えている。
このような構成において、オーディオソース1は、オーディオファイルを記録した記録メディアや、オーディオデータを受信する放送受信装置などのオーディオデータを出力する装置である。
また、入力処理部2は制御部6の制御に従ってオーディオソース1からのオーディオデータの取り込みを行い、必要に応じて取り込んだオーディオデータの復号などの前処理を行って、前処理を行ったオーディオデータを入力オーディオデータとしてデジタルサウンドプロセッサ3に出力する。
【0016】
また、入力処理部2は、入力オーディオデータのデジタルサウンドプロセッサ3への出力に先だって、入力オーディオデータのサンプリングレートと、当入力オーディオデータが表す音声の周波数帯域の上限を検出し、制御部6に通知する。ここで、オーディオデータが表す音声の周波数帯域の上限は、入力オーディオデータの周波数スペクトルを解析して検出するようにしてもよい。または、オーディオソース1から取り込むオーディオデータが圧縮符号化されたオーディオデータであれば、当該圧縮符号化されたオーディオデータのビットレート(再生時に1秒間あたりに処理すべき圧縮符号化されたオーディオデータのビット数)に応じて、入力オーディオデータが表す音声の周波数帯域の上限を検出するようにしてもよい。なお、圧縮符号化されたオーディオデータのビットレートに応じて、入力オーディオデータが表す音声の周波数帯域の上限を検出する場合には、予め、ビットレートとオーディオデータが表す音声の周波数帯域の上限との関係を登録しておき、当該登録した関係に応じて、入力オーディオデータが表す音声の周波数帯域の上限を検出するようにする。
次に、デジタルサウンドプロセッサ3は、予め設定されたプログラムに従った音声処理を行うプロセッサであり、制御部6の制御に従って、入力処理部2から入力する入力オーディオデータに対して高域補間などの音声処理を施し出力オーディオデータとしてアンプ4に出力する。
【0017】
そして、アンプ4はデジタルサウンドプロセッサ3から入力する出力オーディオデータを、制御部6から設定されたゲインで増幅し、スピーカ5に出力する。
次に、
図2に、デジタルサウンドプロセッサ3の高域補間を行う機能構成を示す。
図示するように、デジタルサウンドプロセッサ3は、代表点抽出部31、写像関数算出部32、補間処理部33とを備えている。ここで、これらの、代表点抽出部31、写像関数算出部32、補間処理部33の動作については後述する。
【0018】
なお、デジタルサウンドプロセッサ3の代表点抽出部31、写像関数算出部32、補間処理部33は、上述のようにデジタルサウンドプロセッサ3が、予め設定されたプログラムを実行することにより実現されるものである。
【0019】
次に、制御部6は予め設定されたプログラムに従った処理を行うプロセッサであり、予め設定されたプログラムに従った処理の一つとして高域補間動作制御処理を行う。
図3に、この高域補間動作制御処理の手順を示す。
図示するように、高域補間動作制御処理において制御部6は、入力処理部2からの入力オーディオデータのサンプリングレートと入力オーディオデータが表す音声の周波数帯域の上限の通知の発生を監視する(ステップ302)。
【0020】
そして、通知が発生したならば、入力オーディオデータが表す音声の周波数帯域の上限の2倍以下となるように、代表点オーディオデータのサンプリングレートを決定し、決定した代表点オーディオデータのサンプリングレートを代表点抽出部31に設定する(ステップ304)。
【0021】
ここで、代表点オーディオデータのサンプリングレートは、具体的には、たとえば、入力処理部2からの入力オーディオデータのサンプリングレートの2のべき乗分の1のサンプリングレートのうちの、入力オーディオデータが表す音声の周波数帯域の上限の2倍以下となる最大のサンプリングレートとする。
【0022】
さて、このようにして、代表点オーディオデータのサンプリングレートを設定された代表点抽出部31は、予め定めた時間長の時間区間である単位処理区間T毎に、入力オーディオデータを、代表点オーディオデータのサンプリングレートとして設定されたサンプリングレートのオーディオデータにダウンサンプリングし、ダウンサンプリングしたオーディオデータを、当該単位処理区間Tの代表点オーディオデータとして写像関数算出部32と補間処理部33に出力する。
【0023】
ここで、この入力オーディオデータの代表点オーディオデータへのダウンサンプリングは、代表点のサンプリングレートが設定された代表点オーディオデータのサンプリングレートとなるように、入力オーディオデータの単位処理区間T内のサンプルのうちから代表点とするサンプルを選定し、入力オーディオデータから、代表点として選定したサンプル以外のサンプルを間引いたオーディオデータを、当該単位処理区間T内の代表点オーディオデータとすることにより行う。
【0024】
すなわち、たとえば、代表点オーディオデータのサンプリングレートとして、入力オーディオデータのサンプリングレートの1/2のサンプリングレートが設定された場合には、
図4aに白丸で示す入力オーディオデータの単位処理区間T内のサンプルから、一つおきにサンプルを代表点として抽出して、
図4bに黒丸で示すように、代表点として抽出した入力オーディオデータのサンプルを代表点オーディオデータの単位処理区間T内のサンプルとする。
【0025】
また、たとえば、表点のサンプリングレートとして、入力オーディオデータの1/4のサンプリングレートが設定された場合には、
図4aに白丸で示す入力オーディオデータの単位処理区間T内のサンプルから、三つおきにサンプルを代表点として抽出して、
図4cに黒丸で示すように、代表点として抽出した入力オーディオデータのサンプルを代表点オーディオデータの単位処理区間T内のサンプルとする。
【0026】
さて、以下では、このようにして生成した代表点オーディオデータの単位処理区間T内の隣接するサンプル間の区間t
iを「補間区間」と呼んで説明を行う。
さて、以上のようにして、代表点オーディオデータを受け取った写像関数算出部32は、単位処理区間Tの各補間区間t
i毎に、入力オーディオデータの単位処理区間Tの信号を、補間区間t
iに縮小写像する写像関数ω
iを、当該補間区間t
iの写像関数ω
iとして算出し補間処理部33に設定する。
【0027】
ここで、補間区間t
iの写像関数ω
iの算出は次のように行う。
すなわち、 x
iを代表点オーディオデータの単位時間区間T内のi番目のサンプルの時間位置、y
iを単位時間区間T内のi番目のサンプルのサンプル値(大きさ)として、a
i、e
i、c
i、f
iを下式(1)-(4)によって定義する。なお、x
0は代表点オーディオデータの単位時間区間Tの始点となるサンプルの時間位置、y
0は単位時間区間Tの始点となるサンプルのサンプル値(大きさ)、x
Mは代表点オーディオデータの単位時間区間Tの終点となるサンプルの時間位置、y
Mは単位時間区間Tの終点となるサンプルのサンプル値(大きさ)を表している。
【0032】
但し、d
iとしては、μ
nを単位時間区間T内の入力オーディオデータのn番目のサンプルの時間位置、ν
nを単位時間区間T内の入力オーディオデータのn番目のサンプルのサンプル値(大きさ)として、
下式(5)を最小とする値を用いる。
【0034】
ここで、式(5)におけるmは、Dを入力オーディオデータの隣接するサンプル間の時間間隔として下式(6)によって定める。
【0036】
但し、式(6)において、 []はガウスの記号であり、 [X]はXを超えない最大の整数を表す。
なお、式(5)は、α
n、β
nを式(7)、(8)のように定義すると、式(9)のように変形することができる。
【0040】
そして、式(5)、式(9)を最小とするd
iは、式(10)によって求めることができる。
【0042】
そして、以上のようにして定まる、a
i、e
i、c
i、f
iを用いて、補間区間t
iの写像関数ω
iを下式(11)によって設定する。
【0044】
なお、式11において、p
nは、単位時間区間T内の入力オーディオデータのn番目のサンプルの写像関数ω
iによる写像後の時間位置を、q
nは単位時間区間T内の入力オーディオデータのn番目のサンプルの写像関数ω
iによる写像後のサンプル値(大きさ)を表す。
【0045】
ところで、以上の写像関数ω
iの算出は、計算を簡単にするために、単位時間区間Tの時間長が1となるように、各時間を正規化した上で行うようにしてもよい。
さて、
図3に戻り、代表点オーディオデータのサンプリングレートを代表点抽出部31に設定したならば(ステップ304)、制御部6は、高域補間後オーディオデータのサンプリングレートと代表点オーディオデータのサンプリングレートとの比に応じて写像元サンプル位置を算定して補間処理部33に設定し(ステップ306)、ステップ302からの処理に戻る。なお、高域補間後オーディオデータのサンプリングレートとは、デジタルサウンドプロセッサ3において高域補間したオーディオデータである高域補間後オーディオデータのサンプリングレートとして予め設定されているサンプリングレートである。
ただし、本実施形態では、高域補間後オーディオデータのサンプリングレートと入力オーディオデータのサンプリングレートとは、高域補間後オーディオデータのサンプリングレートが、入力オーディオデータのサンプリングレートと等しいか、入力オーディオデータのサンプリングレート2のべき乗倍となる関係にあり、高域補間後オーディオデータのサンプリングレートは、代表点オーディオデータのサンプリングレートの2のべき乗倍となるものとする。
【0046】
ここで、ステップ306の写像元サンプル位置の算定は次のように行う。
すなわち、高域補間後オーディオデータのサンプリングレートが、代表点オーディオデータのサンプリングレートの2のn乗倍であれば、単位処理区間Tを2
n個の等時間長の時間区間に分割したときの、分割位置となる時間位置を写像元サンプル位置として算定する。なお、単位処理区間Tの始点と終点は、写像元サンプル位置として算定されない。ただし、単位処理区間Tの終点も写像元サンプル位置として算定するようにしてもよい。
【0047】
結果、たとえば、高域補間後オーディオデータのサンプリングレートが、代表点オーディオデータのサンプリングレートの2倍であれば、
図5a1に入力オーディオデータの写像元サンプル位置のサンプルを二重丸で示すように、単位処理区間Tの中央の時間位置が写像元サンプル位置として算定され、高域補間後オーディオデータのサンプリングレートが、代表点オーディオデータのサンプリングレートの4倍であれば、
図5b1に入力オーディオデータの写像元サンプル位置のサンプルを二重丸で示すように、単位処理区間Tの始点から単位処理区間Tの時間長の1/4離れた時間位置と、単位処理区間Tの中央の時間位置と、単位処理区間Tの終点から単位処理区間Tの時間長の1/4離れた時間位置とが写像元サンプル位置として算定される。
【0048】
さて、このようにして写像元サンプル位置が設定された補間処理部33は、単位処理区間Tの補間区間t
iのそれぞれについて、当該補間区間t
iについて写像関数算出部32で算出された写像関数ω
iを用いて、単位処理区間Tの入力オーディオデータの各写像元サンプル位置にあるサンプルを、代表点オーディオデータの各代表点の間に写像することにより、代表点オーディオデータをアップサンプリングし、高域補間後オーディオデータとして出力する。
【0049】
すなわち、たとえば、
図5a1のように、単位処理区間Tの中央の時間位置が写像元サンプル位置として設定されている場合には、
図5a2に示すように、代表点オーディオデータの各補間区間t
iについて、入力オーディオデータの当該写像元サンプル位置にある一つの二重丸のサンプルが、当該補間区間t
iの写像関数ω
iを用いて当該補間区間t
iの中央の時間位置に写像されて、代表点オーディオデータがアップサンプリングされ、アップサンプリングされた代表点オーディオデータが高域補間後オーディオデータとして出力される。
【0050】
また、
図5b1のように、単位処理区間Tの始点から単位処理区間Tの1/4離れた時間位置と、単位処理区間Tの中央の時間位置と、単位処理区間Tの終点から単位処理区間Tの1/4離れた時間位置とが写像元サンプル位置として設定されている場合には、
図5b2に示すように、代表点オーディオデータの各補間区間t
iについて、入力オーディオデータの当該写像元サンプル位置にある3つの二重丸のサンプルが、当該補間区間t
iの写像関数ω
iを用いて当該補間区間の当該補間区間t
iの始点から補間区間の時間長の1/4離れた時間位置と、当該補間区間t
iの中央の時間位置と、当該補間区間t
iの終点から補間区間の時間長の1/4離れた時間位置に写像されて、代表点オーディオデータがアップサンプリングされ、アップサンプリングされた代表点オーディオデータが高域補間後オーディオデータとして出力される。
【0051】
なお、以上の補間処理部33の処理において、各写像元サンプル位置にある入力オーディオデータのサンプルが代表点オーディオデータのサンプルとして代表点オーディオデータに含まれている場合には、その代表点オーディオデータのサンプルを写像元サンプル位置にある入力オーディオデータのサンプルに代えて用いるようにしてもよい。
【0052】
さて、このようにして、補間処理部33から出力された高域補間後オーディオデータはそのまま、もしくは、デジタルサウンドプロセッサ3において周波数特性調整処理等の他の音声信号処理が施された後、出力オーディオデータとしてアンプ4に出力される。
【0053】
ここで、以上のようにして生成した高域補間後オーディオデータの周波数特性を
図7bに示す。
図7bは、オーディオデータのサンプリングレートが96kHz、オーディオデータが表す音声の周波数帯域の上限が20kHz、ダウンサンプリング後の代表点オーディオデータのサンプリングレートが48kHz、高域補間後オーディオデータのサンプリングレートが96kHzである場合について表しており、図中、SIがオーディオデータの周波数特性を、SOがFIFによって高域を補間したオーディオデータの周波数特性を表している。
【0054】
上述した
図7aの比較よりも示されるように、本実施形態で高域補間した高域補間後のオーディオデータでは、
図7bのように入力オーディオデータが表す音声の周波数帯域の上限Fmax周辺の高域成分も欠落なく補間されている。
【0055】
よって、本実施形態によれば、オーディオデータが表す音声の周波数帯域の上限に関わらずに、良好に高域を補間することができる。
【符号の説明】
【0056】
1…オーディオソース、2…入力処理部、3…デジタルサウンドプロセッサ、4…アンプ、5…スピーカ、6…制御部、31…代表点抽出部、32…写像関数算出部、33…補間処理部。