IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社タムラ製作所の特許一覧

特開2024-113798音声信号処理装置及び音声信号処理プログラム
<>
  • 特開-音声信号処理装置及び音声信号処理プログラム 図1
  • 特開-音声信号処理装置及び音声信号処理プログラム 図2
  • 特開-音声信号処理装置及び音声信号処理プログラム 図3
  • 特開-音声信号処理装置及び音声信号処理プログラム 図4
  • 特開-音声信号処理装置及び音声信号処理プログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024113798
(43)【公開日】2024-08-23
(54)【発明の名称】音声信号処理装置及び音声信号処理プログラム
(51)【国際特許分類】
   H04S 5/02 20060101AFI20240816BHJP
【FI】
H04S5/02
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2023018990
(22)【出願日】2023-02-10
(71)【出願人】
【識別番号】390005223
【氏名又は名称】株式会社タムラ製作所
(74)【代理人】
【識別番号】100081961
【弁理士】
【氏名又は名称】木内 光春
(74)【代理人】
【識別番号】100112564
【弁理士】
【氏名又は名称】大熊 考一
(74)【代理人】
【識別番号】100163500
【弁理士】
【氏名又は名称】片桐 貞典
(74)【代理人】
【識別番号】230115598
【弁護士】
【氏名又は名称】木内 加奈子
(72)【発明者】
【氏名】波多野 渉
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162AA05
5D162BA07
5D162CA01
5D162CB12
5D162CC32
5D162CC33
5D162DA22
5D162EE11
(57)【要約】
【課題】音源分離の処理時間を短くし、遅延の発生を軽減することを可能とすると共に、ステレオ音源からアップミックスしたものをダウンミックスした場合でも音源に歪みを生じさせることがない音声処理装置を提供する。
【解決手段】音声信号処理装置100は、ステレオ音源の入力部1と、入力部1から入力されたステレオ音源を直接音と間接音とに分離する分離部10を備える。分離部10は、入力部から入力されたステレオ音源を所定の帯域ごとに分割する分割部を有する。分割部12は、前段のフィルタLPF1~LPF3の出力信号が後段のフィルタLPF2~LPF4の入力信号となるように、複数段に設けられたフィルタLPF1~LPF4を備える。複数のフィルタLPF1~LPF4のそれぞれは、入力信号を所定の帯域において通過させて除去信号を生成すると共に、入力信号から除去信号を減算して分割信号を生成する。
【選択図】図1
【特許請求の範囲】
【請求項1】
音源の入力部と、
前記入力部から入力された前記音源を所定の帯域ごとに分割する分割部と、
前段のフィルタの出力信号が後段のフィルタの入力信号となるように、前記分割部に複数段に設けられたフィルタとを備え、
前記複数のフィルタのそれぞれは、前記入力信号を所定の帯域において通過させて除去信号を生成すると共に、前記入力信号から前記除去信号を減算して分割信号を生成する
ことを特徴とする音声信号処理装置。
【請求項2】
前記音声信号処理装置は、ステレオ音源をサラウンド音源にアップミックスするものであり、
前記分割部の後段には、前記ステレオ音源の左右のチャンネルから生成された同じ帯域の前記分割信号同士の相関を検出する相関検出部と、
前記相関検出部によって検出された左右のチャンネルの同じ帯域の前記分割信号同士を比較して、前記分割信号ごとに相関の高い成分を直接音として抽出し、相関の低い成分を間接音として抽出する直接音と間接音の抽出部と、
前記左右のチャンネルごとに、前記直接音と間接音の抽出部から出力された前記各分割信号の直接音と間接音を加算して、左右のチャンネルごとの直接音と間接音を生成する演算部を有する請求項1に記載の音声信号処理装置。
【請求項3】
前記分離部は、前記直接音または前記間接音の少なくとも一方を調整するためのパラメータを生成する設定部と、
前記パラメータに基づき、前記サラウンド音源におけるチャンネルごとに前記直接音及び前記間接音に乗算する係数を生成する係数生成部と、
前記直接音及び前記間接音に前記係数を乗算することにより、前記ステレオ音源を前記サラウンド音源にアップミックスする演算部を備える請求項2に記載の音声信号処理装置。
【請求項4】
音源からの入力信号を複数のフィルタによって所定の帯域ごとに分割するにあたり、
前記入力信号から前段のフィルタによって除去信号を生成し、前記入力信号から前記除去信号を減算して分割信号を生成するする第1処理と、
前記前段のフィルタから出力された前記分割信号を後段のフィルタの入力信号として、前記後段のフィルタの通過信号を前記前段のフィルタから出力された前記分割信号に対する新たな除去信号を生成し、前記後段のフィルタの入力信号から前記新たな除去信号を減算して新たな分割信号を生成する第2の処理を、
前記複数のフィルタの段数に応じて、コンピュータに実行させる音声信号処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、Nチャンネルの音声信号をMチャンネルの音声信号にアップミックスするために適した音声信号処理装置及び音声信号処理プログラムに関する。
【背景技術】
【0002】
放送などのメディアで取りあつかう音声フォーマットはステレオから5.1チャンネルサラウンド、現在では22.2chをはじめとする3Dオーディオに広がっている。オーディオミキシングコンソール(以下、音声調整卓という)等のオーディオ制作ツールでは様々な音声フォーマットに対応するため、他のフォーマットで制作したパッケージを簡単に変換できるツールが求められている。
【0003】
特に、NチャンネルからMチャンネルにアップミックスする機能は昔のステレオパッケージを3Dオーディオのフォーマットで制作、放送する需要が高まっていて、いくつかの製品がリリースされている。しかし、従来のアップミックスの制作ツールは、低遅延でリアルタイムに使用できるものが少ないことから、現状では、ユーザにとって使いやすく、音声処理の処理規模が少ないツールが求められている。また、従来の制作ツールは、拡散音生成のために使用するイコライザ、ディレイリバーブなどにより生成したマルチチャンネルの音声をサイマル放送用のためにステレオにダウンミックスした時に元のステレオ音源と異なってしまう。
【0004】
アップミックスの具体的な手法としては、特許文献1に記載されているように、ステレオ音源を左右それぞれで直接音と間接音とに分離し、これら4つの音源に対して遅延処理などの各種処理を行うことにより、サラウンドにおける各チャンネルの出力を生成する。また、特許文献2に記載されている技術は、ステレオ音源を左右それぞれで直接音と間接音とに分離した後に、HRIRを用いてアップミックスする手法として知られている。一方、ステレオ音源を直接音と間接音とに分離する手法としては、特許文献3に記載されているように、ステレオ音源からコヒーレント成分を抽出する方法が優れている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2017-163458号公報
【特許文献2】特開2015-076857号公報
【特許文献3】特許第6846822号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献3の発明では、音源分離のためにFFTを用いた手法を用いている。具体的には、FFTの変化形である変形離散コサイン変換(MDCT)を採用している。一般的にFFTを用いる方法は計算量とメモリの規模が大きく、他のアプリケーションと同時に多くの機能の実行が必要な例えば音声調整卓の様な装置ではコストが問題となってくる。特に、FFTを用いた音源分離の場合、低周波の分離の精度を得るには相応の音声データの評価が必要となり、遅延が発生すると共に、評価に使用する音声区間の連続性がなくなり、プログラム全体のうねり感が損なわれるという問題もある。また、分析や評価のために音声を取り込むと、その分遅延が増え、放送局の生放送の用途など特にリアルタイム性が必要な用途では実用上好ましくない。
【0007】
例えば、特許文献3の発明ではチャンネル当たり23バンドのフィルタバンクに分割しているが、このような多数のバンクに分割すると音源分離に大きな処理時間が必要となる問題が発生する。例えば、分割バンド数を3から4程度にまで削減したとしても、ステレオ音源を処理する場合の処理時間に100から200msの遅延が生じる。一般に、デジタル放送において、音源が数msの遅延が生じた場合、スムーズに会話ができなくなると言われていることから、このような大きな遅延時間は好ましくない。
【0008】
更に、近年ではステレオ音源からアップミックスして生成したサラウンド音源を、サイマル放送のために再びステレオ音源にダウンミックスするという需要もあるが、アップミックスの際に元の音源をイコライザや、DELAYなどを通して加工してしまうとステレオ音源にダウンミックスした際に元の音源に対して差異が発生するという問題もあった。
【0009】
本発明は、前記のような従来技術の問題点を解決するために提案されたものである。本発明の目的は、音源分離の処理時間を短くし、遅延の発生を軽減することを可能とすると共に、ステレオ音源からアップミックスしたものをダウンミックスした場合でも元の音源に対して差異を発生させることがない音声処理装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明の音声信号処理装置は、次のような構成を備える。
(1)音源の入力部。
(2)前記入力部から入力された前記音源を所定の帯域ごとに分割する分割部。
(2-1)前段のフィルタの出力信号が後段のフィルタの入力信号となるように、前記分割部に複数段に設けられたフィルタ。
(2-2)前記複数のフィルタのそれぞれは、前記入力信号を所定の帯域において通過させて除去信号を生成すると共に、前記入力信号から前記除去信号を減算して分割信号を生成する。
【0011】
本発明において、下記のような構成を採用することができる。
(1)前記音声信号処理装置は、ステレオ音源をサラウンド音源にアップミックスするものであり、
前記分割部の後段には、前記ステレオ音源の左右のチャンネルから生成された同じ帯域の前記分割信号同士の相関を検出する相関検出部と、
前記相関検出部によって検出された左右のチャンネルの同じ帯域の前記分割信号同士を比較して、前記分割信号ごとに相関の高い成分を直接音として抽出し、相関の低い成分を間接音として抽出する直接音と間接音の抽出部と、
前記左右のチャンネルごとに、前記直接音と間接音の抽出部から出力された前記各分割信号の直接音と間接音を加算して、左右のチャンネルごとの直接音と間接音を生成する演算部を有する。
(2)前記ステレオ音源を直接音と間接音とに分離された信号を、前記直接音または前記間接音の少なくとも一方を調整するためのパラメータを生成する設定部と、
前記パラメータに基づき、前記サラウンド音源におけるチャンネルごとに前記直接音及び前記間接音に乗算する係数を生成する係数生成部と、
前記直接音及び前記間接音に前記係数を乗算することにより、前記ステレオ音源を前記サラウンド音源にアップミックスする演算部を備える。
【0012】
本発明の音声信号処理プログラムは、次のような構成を備える。
音源からの入力信号を複数のフィルタによって所定の帯域ごとに分割するにあたり、
前記入力信号から前段のフィルタによって除去信号を生成し、前記入力信号から前記除去信号を減算して分割信号を生成するする第1処理と、
前記前段のフィルタから出力された前記分割信号を後段のフィルタの入力信号として、前記後段のフィルタの通過信号を前記前段のフィルタから出力された前記分割信号に対する新たな除去信号を生成し、前記後段のフィルタの入力信号から前記新たな除去信号を減算して新たな分割信号を生成する第2の処理を、
前記複数のフィルタの段数に応じて、コンピュータに実行させる。
【発明の効果】
【0013】
本発明によれば、音源分離の処理時間を短くし、遅延の発生を軽減することを可能とすると共に、ステレオ音源からアップミックスしたものをダウンミックスした場合でも音源に歪みを生じさせることがない音声処理装置及び音声処理プログラムを提供することが可能となる。
【図面の簡単な説明】
【0014】
図1】第1実施形態の音声信号処理装置の構成を示すブロック図。
図2】第1実施形態における分割部の構成を示すブロック図。
図3】第1実施形態における分割部における各段のフィルタと信号の流れを示す図。
図4】第1実施形態における設定部の構成を示すブロック図。
図5】第1実施形態の演算部における作用を示す回路図。
【発明を実施するための形態】
【0015】
[1.第1の実施形態]
[1-1.構成]
図1に示す本実施形態の音声信号処理装置100は、例えば、音声調整卓あるいはミキサーとして知られているものである。以下の説明においては、ステレオから22.2chサラウンドへのアップミックスを例に挙げ、音声信号処理装置100に入力される音声信号は、ステレオ音源のものとする。
【0016】
22.2chサラウンドは、チャンネル1~24の24のチャンネルにより構成される。具体的には、上層の9チャンネルと、中層の10チャンネルと、下層の3.2チャンネルとにより構成される。なお、下層の3.2チャンネルには、2つのLFE(低音増強(Low Frequency Effect)用チャンネル)が含まれる。また、22.2chサラウンドは、フロント側の11.2チャンネルとサイド側及びリア側の11チャンネルに分けて考えることもできる。説明を容易にするため、フロント側チャンネルからは主に直接音が、サイド側チャンネル及びリア側チャンネルからは主に間接音が、それぞれ出力されるものとして考えるが、間接音は、フロント側チャンネルから出力されても良い。
【0017】
音声信号処理装置100は、ステレオ音源の入力部1と、入力部1から入力された左右のチャンネルの信号のそれぞれについて、直接音と間接音に分離する分離部10と、分離部10によって抽出された直接音と間接音を調整するための各種パラメータを生成する設定部20と、生成したパラメータに基づいて係数を生成する係数生成部30と、この係数と分離した音源とからアップミックスされたサラウンド音源を生成する演算部40と、を備える。
【0018】
分離部10は、ステレオ信号の左右各チャンネルの信号をRチャンネル側の直接音RDと間接音RR、及びLチャンネル側の直接音LDと間接音LRに分離するものであり、一例として、図2に示すような構成のものが使用される。すなわち、図2において、符号11はステレオ信号の入力部、12はステレオ信号の左右のチャンネルの信号をそれぞれ所定の帯域ごとに分割する分割部、13は分割された各帯域の信号について、左右のチャンネルの同じ帯域の信号同士を比較して、その相関を検出する相関検出部である。相関検出部13は、一例として、左右のチャンネルの同帯域の信号同士がどの程度の相関を有するかを検出する係数検出部131と、相関検出部13に入力された各チャンネルのそれぞれの帯域の分割信号に対して、係数検出部131が検出した係数を乗じることによって、分割信号から直接音と間接音を抽出する乗算部132を有する。
【0019】
相関検出部13の後段には、帯域ごとに分割されている各チャンネルの分割信号の直接音と間接音をそれぞれ加算して、全帯域の信号に変換する加算器14が設けられている。この加算器14からは、左右のチャンネルごとに全帯域のステレオ信号がRチャンネル側の直接音RDと間接音RR、及びLチャンネル側の直接音LDと間接音LRに分離された状態で、出力部15から出力される。
【0020】
上記のような構成を有する分離部10における分割部12の構成の一例を、図3により説明する。この分割部12は、入力されたステレオ信号を左右のチャンネルごとに所定の帯域でN個に分割するために、複数のフィルタを多段に設けたものを使用する。なお、図3では、ステレオ信号のRチャンネル及びLチャンネルをそれぞれ5つに分割する構成を示している。これらのフィルタとしては、例えばローパスフィルタのように、入力信号の所定の帯域成分のみを除去するフィルタが使用される。また、各フィルタが除去する信号帯域は、分割するチャンネルに対応して適切な値に設定されている。本実施形態では、カット周波数fc=f1~f4を有する第1フィルタLPF1~第4フィルタLPF4が設けられ、これらのフィルタLPF1~LPF4によって1つのチャンネルの音源からの入力信号Xinが、それぞれ異なる周波数帯域fc1~fc5を有する5つの分割信号X0~X4に分割される。
【0021】
具体的には、図3において、ステレオ音源の左右いずれかのチャンネルの信号を入力する入力部1には、第1フィルタLPF1が接続されている。この第1フィルタLPF1は、入力部1からの入力信号Xinを所定の帯域において通過させるもので、その通過信号を入力信号Xinに対する第1除去信号LPF1aとする。第1フィルタLPF1の後段には減算器が設けられ、この減算器により、入力信号Xinから通過信号(第1除去信号LPF1a)を減算して第1分割信号LPF1bを生成する。
【0022】
第2フィルタLPF2は第1フィルタLPF1とは異なる帯域の信号を通過させるものである。第2フィルタLPF2は、第1フィルタLPF1から出力された第1分割信号LPF1bを入力信号として第2除去信号LPF2aを出力する。第2フィルタLPF2の後段には減算器が設けられ、この減算器により第1フィルタLPF1から出力された第1分割信号LPF1bから、第2フィルタLPF2の通過信号(第2除去信号LPF2a)を減算して第2分割信号LPF2bを生成する。
【0023】
以下同様にして、第3フィルタLPF3及び第4フィルタLPF4によって、それぞれ除去信号LPF3a及びLPF4aと、分割信号LPF3b及びLPF4bが生成される。また、最終段の第4フィルタLPF4については、その通過信号(第4分割信号LPF4aと同値)が、5つ目の分割信号LPF5bとして出力される。その結果、分離部10からは5つの分割信号X0(LPF1b)~~X4(LPF5b)が出力される。
【0024】
本実施形態において、ステレオ信号の左右2チャンネルに対して、それぞれ4つのフィルタLPF1~LPF4が設けられているが、フィルタ数は任意であり、アップミックスするチャンネル数に応じて1つあるいは複数個設けられる。本実施形態では、4つのフィルタを設けることにより、入力されたステレオ信号の1つのチャンネルの信号Xinが、結果として、以下のような5つの分割信号X0~X4に分割される。
分割信号X0 fc1=f1のハイパスフィルタを通過した信号
分割信号X1 fc2=(f1-f2)/2のバンドパスフィルタを通過した信号
分割信号X2 fc3=(f2-f3)/2のバンドパスフィルタを通過した信号
分割信号X3 fc4=(f3-f4)/2のバンドパスフィルタを通過した信号
分割信号X4 fc5=f4のローパスフィルタを通過した信号
【0025】
分離部10には、前記のようにしてRチャンネルとLチャンネルの5つに分割したそれぞれの信号について、その相関(コヒーレント)を検出することにより、直接音と間接音を分離する相関検出部CorL1~CorL5,CorR1~CorR5(図2の相関検出部13に相当する)が設けられている。これらの相関検出部は、Rチャンネル側の各分割信号X0~X4とLチャンネル側の各分割信号X0~X4とを入力して、その相関を検出し、各分割信号X0~X4中の相関の高い成分については、その成分を直接音として、直接音混合部MIX1に出力する。また、これらの相関検出部は、Rチャンネル側の各分割信号X0~X4とLチャンネル側の各分割信号X0~X4中の相関の低い成分については、元の分割信号X0~X4から相関の高い直接音成分を除去することで、相関の低い成分を間接音として、間接音混合部MIX2に出力する。図3の直接音混合部MIX1と間接音混合部MIX2は、図2の加算器14に相当する。
【0026】
なお、直接音と間接音を分離する手法としては、図示のものに限定されない。例えば、MIX2として、現信号からMIX1を引く構成とすれば、より簡単に間接音を生成することができる。
【0027】
本実施形態では、分割部12によって得られた5つの分割信号X0~X4と、各段のフィルタLPF1~LPF4の関係は次のとおりである。
X0=Xin-LPF1
X1=LPF1-LPF2
X2=LPF2-LPF3
X3=LPF3-LPF4
X4=LPF4
【0028】
そのため、これらの分割信号X0~X4を加算した場合に、得られる信号Xoutは、次のようになる。
Xout=X0+X1+X2+X3+X4
=(Xin-LPF1)+(LPF1-LPF2)+(LPF2-LPF3)+(LPF3-LPF4)+LPF4
=Xin
【0029】
このように、本実施形態では、分割部12で分割した分割信号X0~X4を加算した場合に、ステレオ音源から分割部12に対する入力信号Xinと同等の加算信号Xoutが得られるので、一旦フィルタで分割した信号を加算した場合でも音源に歪みを生じさせることがない。例えば、従来から知られているパンドパスフィルタの並列接続では、一度分割した信号をその後加算した場合につなぎ部分の連続性に課題があったが、本実施形態ではそのような問題点が解決される。このように、本実施形態によれば、原音に再帰可能な直接音と間接音を得ることができる。
【0030】
本実施形態によれば、5つの分割信号X0~X4をそのまま全て加算しても、また、相関を取った後に直接音と間接音に分離した後でも、それらを加算すれば元の音源に戻ることになる。しかし、直接音と間接音に基づいて生成したサラウンド音源の場合には、本実施形態では後述する演算部40において4つの係数をかける処理を実行しているので、生成したサラウンド音源からステレオ音源に戻す場合は単純な加算処理では元のステレオ音源に戻らない。その場合でも、演算部40で実施した処理を記憶しておき、加算時に演算部40の処理を相殺することで、元のステレオ音源に戻すことも可能である。
【0031】
このように図2の分割部12によって得られた分割信号X0~X4に基づいてRチャンネル側の直接音RDと間接音RR、及びLチャンネル側の直接音LDと間接音LRが得られる。これらの直接音と間接音は、出力部15を経由して分離部10からその後段に設けられた演算部40に出力され、設定部20及び係数生成部30からのパラメータおよび係数に基づいて、マルチチャンネルの音源に変換される。
【0032】
設定部20は、分離部10が分離した直接音と間接音を調整するためのパラメータを生成する。図4に示すように、設定部20は、直接音と間接音とのバランスを調整する直接音/間接音バランス調整部21と、直接音におけるセンター音源とセンター音源以外の音源とのバランスを調整するフロントバランス調整部22と、間接音におけるセンター音源とセンター音源以外の音源とのバランスを調整するリアバランス調整部23と、直接音と間接音とのミキシング量を調整するミキシング量調整部24と、直接音及び間接音における中層チャンネルからの出力と上下層チャンネルからの出力とのバランスを調整する層間バランス調整部25と、を備える。
【0033】
ミキシングエンジニアは、直接音/間接音バランス調整部21を操作することにより、アップミックス後のサラウンド音源における直接音と間接音とのバランスを調整する。この調整の度合いは、ROOM値として後段に設けられた演算部40に出力される。
【0034】
フロントバランス調整部22は、直接音のうち、センター音源とセンター音源以外の音源とのバランスを調整する。このセンター音源は、直接音のうちセンターに定位する成分である。また、このセンター音源以外の音源とは、直接音のうちセンター音源以外の成分である。ミキシングエンジニアは、フロントバランス調整部22を使用して、アップミックス後のサラウンド音源における、フロント側チャンネルから出力されるセンター音源とセンター音源以外の音源とのバランスを調整する。この調整の度合いは、Fdiv値として後段に設けられた係数生成部30に出力される。
【0035】
リアバランス調整部23は、間接音のうち、センター音源とセンター音源以外の音源とのバランスを調整する。このセンター音源は、間接音のうちセンターに定位する成分である。センター音源以外の音源とは、間接音のうちセンター音源以外の成分である。ミキシングエンジニアは、このリアバランス調整部23により、アップミックス後のサラウンド音源における、リア側チャンネルから出力されるセンター音源とセンター音源以外の音源とのバランスを調整する。この調整の度合いは、Rdiv値として後段に設けられた係数生成部30に出力される。
【0036】
ミキシング量調整部24は、フロント側チャンネルから出力される直接音に対する間接音のミキシング比率、及びリア側チャンネルから出力される間接音に対する直接音のミキシング比率を調整する。ミキシングエンジニアは、ミキシング量調整部24により、フロント側チャンネルから出力される直接音に対する間接音のミキシング比率、及び間接音に対する直接音のミキシング比率を調整する。この調整の度合いは、FRdiv値として後段に設けられた係数生成部30に出力される。
【0037】
アップミックス後のサラウンド音源が3Dオーディオに対応している場合、層間バランス調整部25は、中層チャンネルから出力される直接音及び間接音と、上下層チャンネルから出力される直接音及び間接音とのバランスを調整する。ミキシングエンジニアは、層間バランス調整部25により、中層チャンネルから出力される直接音及び間接音と、上下層チャンネルから出力される直接音及び間接音とのバランスを調整する。この調整の度合いは、ELdiv値として後段に設けられた係数生成部30に出力される。
【0038】
係数生成部30は、設定部20が生成した4つのパラメータFdiv、Rdiv、FRdiv、ELdivを任意に組み合わせて四則演算することにより、係数A、B、C、Dを生成する。この組み合わせ及び四則演算は、サラウンドにおける各チャンネルにより異なっている。すなわち、22.2chのそれぞれに対してFdiv、Rdiv、FRdiv、ELdivの各値が組み合わせられることにより、24組の係数A1~D1、・・・、A24~D24が生成される。生成された係数A1~D1、・・・、A24~D24は、後段に設けられた演算部40に出力される。
【0039】
図5に示すように、演算部40は、分離部10が分離した4つの音源DL、DR、RL、RRと、直接音/間接音バランス調整部21が生成したパラメータROOMと、係数生成部30が生成した係数A1~D1、・・・、A24~D24に基づいて、アップミックス後のサラウンドにおいて各チャンネルから出力する音声信号を演算する。演算部40は、各チャンネルからの出力Tを、以下の(式1)により演算する。なお、(式1)において出力T及び各係数A、B、C、Dに付されるnは、サラウンドにおけるチャンネル番号であり、例えばT1はチャンネル1の出力Tである。また、DL’、DR’、RL’、RR’は、それぞれDL、DR、RL、RRをROOM値で調整したものである。
Tn=An×DL’+Bn×DR’+Cn×RL’+Dn×RR’・・・(式1)
【0040】
これにより、演算部40は、図5に示すように、22.2chサラウンド音源における各チャンネル1~24からの出力T1~T24をそれぞれ生成する。アップミックスされたサラウンド音源は、各チャンネルに設けられた図示しないスピーカなどの出力装置から外部に出力される。
【0041】
[1-2.作用]
本実施形態によれば、図2に示すように、入力部11に入力されたステレオ音源の左右各チャンネルの信号Xinは、分割部12においてカット周波数fc=f1~f4を有する第1フィルタLPF1~第4フィルタLPF4によって5つの分割信号X0~X4に分割される。その後、左右各チャンネルの分割信号X0~X4について、相関検出部13のCorL1~CorL5,CorR1~CorR5においてその相関を検出することにより、左右各チャンネルの音源から入力されたステレオ信号を、左の直接音DL、右の直接音DR、左の間接音RL、右の間接音RRの4つの音源に分離することができる。
【0042】
一方、設定部20において、直接音/間接音バランス調整部21がROOM値を、フロントバランス調整部22がFdiv値を、リアバランス調整部23がRdiv値を、ミキシング量調整部24がFRdiv値を、層間バランス調整部25がELdiv値を、それぞれ生成し、後段に設けられた係数生成部30または演算部40に出力する。この調整の結果として、上述の各パラメータが生成される。ROOM値と4つのパラメータFdiv、Rdiv、FRdiv、ELdivに基づいて生成された係数とが演算部40に入力される。
【0043】
演算部40は、分割部12が生成した5つの分割信号X0~X4に基づいて生成された左右のチャンネルの直接音DL、DRと間接音RL、RRに対して、直接音/間接音バランス調整部21が生成したパラメータROOMと、係数生成部30が生成した24組の係数A1~D1、・・・、A24~D24とに基づいて、前記(式1)から、22.2chサラウンドにおける各チャンネルの出力T1~T24を演算する。演算された出力T1~T24は、サラウンドにおける各チャンネルに設けられた図示しないスピーカから出力される。
【0044】
[1-3.効果]
以上のような構成並びに作用を有する本実施形態の音声信号処理装置100によれば、次のような効果が発揮される。
【0045】
(1)分割部12に多段に設けたフィルタによって、入力信号を複数の帯域の信号に分割することが可能となり、FFTを使用した分割方法に比較して、直接音と間接音の分離に遅延が発生することがなく、音質の優れたアップミックス処理が可能となる。
【0046】
(2)複数のフィルタとして、汎用されているローパスフィルタを用いて音源を多数に分割することが可能となると共に、フィルタの接続構造も簡単なもので良いので、装置全体の構成も単純化できる。また、従来のコンプレッサに代表される帯域分割型の効果機器の場合、多くは帯域分割のために複数のBPFにて構成され、特定の音声処理後に一つの信号に加算される手法がとられているが、この方式の場合周波数帯域が隣り合ったBPF同士で干渉をおこし、音声のひずみを発生させる場合がある。しかしながら、本発明におけるフィルタ構造を取ると加算結果は必ず1となり入力信号に一致する。
【0047】
(3)分離部10が生成した左右のチャンネルの直接音DL、DRと間接音RL、RRに対して、直接音/間接音バランス調整部21が生成したROOM値により調整した上で、設定部20が生成した4つのパラメータFdiv、Rdiv、FRdiv、ELdivに基づいて係数生成部30が生成した係数を、演算部40が乗算することにより、ステレオ音源からサラウンド音源を生成しているので、単に音源を分離するだけでなく、分離した音源を基に種々の加工を施すことで、多数のスピーカを使用したシステムにおいても高品質のサラウンド効果を得ることが可能になる。
【0048】
(4)本実施形態では、分割部12で分割した分割信号X0~X4を加算した場合に、ステレオ音源から分割部12に対する入力信号Xinと同等の加算信号Xoutが得られるので、一旦フィルタで分割した信号を加算した場合でも音源に歪みを生じさせることがない。そのため、本実施形態でアップミックスして得られたマルチチャンネルの信号をステレオ信号などにダウンミックスする場合でも、原音に近い音源を得ることができる。
【0049】
[2.他の実施形態]
本発明は、前記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。具体的には、次のような他の実施形態も包含する。
【0050】
(1)前記の実施形態においては、ステレオから22.2chサラウンドへのアップミックスについて説明したが、例えばステレオから5.1chサラウンドへのアップミックスや、ステレオから3Dオーディオに対応する5.1.2chサラウンドへのアップミックスについても本発明を適用することができる。
【0051】
(2)前記の実施形態においては、各チャンネルの出力Tnをそれぞれ演算するものとしたが、これに限られない。例えば、フロント側の左右チャンネルやサイド側及びリア側の左右チャンネルの出力については、同じにしてもよい。これにより、係数生成部30や演算部40の演算量を削減することができる。また、分離対象となる音源はステレオ音源に限定されるものではなく、多チャンネルの音源であっても良い、
【0052】
(3)前記の実施形態の設定部20は、4つのパラメータFdiv、Rdiv、FRdiv、ELdivを生成するようにしたが、これに限られない。設定部20が1つでもパラメータを生成できるのであれば、係数An~Dnを生成するための四則演算を多様にすることで、各チャンネルnの出力Tnを細やかに調整することも可能である。
【0053】
(4)前記の実施形態の設定部20は、直接音/間接音バランス調整部21、フロントバランス調整部22、リアバランス調整部23、ミキシング量調整部24、層間バランス調整部25を備えるものとしたが、これらの構成に加えて、イコライザを備えてもよい。この場合、イコライザは、ステレオ音源を歪め過ぎない程度に利用される。また、これらの構成の幾つかあるいは全部を有しない音声信号処理装置、例えば音声信号の分離のみを目的とする装置にも本件発明は適用可能である。
【0054】
(5)実施形態に示した係数生成部30から演算部40に出力する係数としては、従来から公知の様々なものを適宜使用することができ、直接音と間接音はそれぞれの総和が1.0に調整する機能を有するPANを使用するものや、規格の係数の逆数を使用するものなどを採用できる。
【0055】
(6)前記の実施形態においては、音声信号処理装置100というハードウェアについて説明したが、コンピュータに音声信号処理装置100の各構成の作用を手順として実行させるプログラムなどのソフトウェアによっても同様の効果を奏することができる。例えば、記入力信号から前段のフィルタによって除去信号を生成し、前記入力信号から前記除去信号を減算して分割信号を生成するする第1処理と、前段のフィルタから出力された前記分割信号を後段のフィルタの入力信号として、前記後段のフィルタの通過信号を前記前段のフィルタから出力された前記分割信号に対する新たな除去信号を生成し、前記後段のフィルタの入力信号から前記新たな除去信号を減算して新たな分割信号を生成する第2の処理を、前記複数のフィルタの段数に応じて、コンピュータに実行させるプログラムも本発明の一態様である。
【符号の説明】
【0056】
100…音声信号処理装置
1…入力部
10…分離部
11…入力部
12…分割部
13…相関検出部
131…係数検出部
132…乗算部
14…加算器
15…出力部
20…設定部
21…直接音/間接音バランス調整部
22…フロントバランス調整部
23…リアバランス調整部
24…ミキシング量調整部
25…層間バランス調整部
30…係数生成部
40…演算部
LPF1~LPF4…フィルタ
図1
図2
図3
図4
図5