IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社タムラ製作所の特許一覧

特開2022-90727音声信号処理装置、音声信号処理プログラム
<>
  • 特開-音声信号処理装置、音声信号処理プログラム 図1
  • 特開-音声信号処理装置、音声信号処理プログラム 図2
  • 特開-音声信号処理装置、音声信号処理プログラム 図3
  • 特開-音声信号処理装置、音声信号処理プログラム 図4
  • 特開-音声信号処理装置、音声信号処理プログラム 図5
  • 特開-音声信号処理装置、音声信号処理プログラム 図6
  • 特開-音声信号処理装置、音声信号処理プログラム 図7
  • 特開-音声信号処理装置、音声信号処理プログラム 図8
  • 特開-音声信号処理装置、音声信号処理プログラム 図9
  • 特開-音声信号処理装置、音声信号処理プログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022090727
(43)【公開日】2022-06-20
(54)【発明の名称】音声信号処理装置、音声信号処理プログラム
(51)【国際特許分類】
   H04S 1/00 20060101AFI20220613BHJP
【FI】
H04S1/00 700
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2020203197
(22)【出願日】2020-12-08
(71)【出願人】
【識別番号】390005223
【氏名又は名称】株式会社タムラ製作所
(74)【代理人】
【識別番号】100081961
【弁理士】
【氏名又は名称】木内 光春
(74)【代理人】
【識別番号】100112564
【弁理士】
【氏名又は名称】大熊 考一
(74)【代理人】
【識別番号】100163500
【弁理士】
【氏名又は名称】片桐 貞典
(74)【代理人】
【識別番号】230115598
【弁護士】
【氏名又は名称】木内 加奈子
(72)【発明者】
【氏名】波多野 渉
【テーマコード(参考)】
5D162
【Fターム(参考)】
5D162AA07
5D162BA09
5D162BA10
5D162CB16
5D162CD05
5D162DA42
5D162EA07
(57)【要約】
【課題】ダウンミックス時にもセンターに定位される音源など直接音の音源が聴き易くなるような調整を容易に行うことの出来る音声信号処理装置を提供する。
【解決手段】サラウンドの音源をダウンミックスする音声信号処理装置100であって、サラウンドの音源を調整する調整部11と、調整部11の調整に基づいてダウンミックス係数を生成する係数生成部12と、ダウンミックス係数により、サラウンドの音源からダウンミックスされた音源を生成する演算部20と、を備える。調整部11は、サラウンドの音源の調整において、間接音の音源に比して直接音の音源を強調する。
【選択図】図1
【特許請求の範囲】
【請求項1】
サラウンドの音源をダウンミックスする音声信号処理装置であって、
前記サラウンドの音源を調整する調整部と、
前記調整部の調整に基づいてダウンミックス係数を生成する係数生成部と、
前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する演算部と、
を備え、
前記調整部は、前記サラウンドの音源の調整において、間接音の音源に比して直接音の音源を強調する、
音声信号処理装置。
【請求項2】
前記調整部は、前記サラウンドの音源の調整において、センター音源以外の音源に比して前記センター音源を強調する、
請求項1に記載の音声信号処理装置。
【請求項3】
前記調整部は、前記サラウンドの音源の調整において、Lch音源とRch音源とのミキシング量を調整してファンタムセンターの音像を強調することにより、センター音源を補強する、
請求項1に記載の音声信号処理装置。
【請求項4】
所定の周期に基づいて、前記係数生成部に前記ダウンミックス係数を生成させることにより、前記ダウンミックス係数を随時更新する係数更新部を更に備える、
請求項1乃至3のいずれかに記載の音声信号処理装置。
【請求項5】
前記サラウンドの音源に関する情報である付帯情報に紐付けて前記ダウンミックス係数を予め複数記憶する記憶部と、
前記付帯情報に基づいて、前記ダウンミックス係数を選択する選択部と、
を更に備え、
前記演算部は、前記選択部が選択した前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する、
請求項1乃至4のいずれかに記載の音声信号処理装置。
【請求項6】
コンピュータにサラウンドの音源をダウンミックスする処理を実行させる音声信号処理プログラムであって、
前記サラウンドの音源を調整する調整手順と、
前記調整手順における調整に基づいてダウンミックス係数を生成する係数生成手順と、
前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する演算手順と、
をコンピュータに実行させ、
前記調整手順は、前記サラウンドの音源の調整において、間接音の音源に比して直接音の音源を強調する、
音声信号処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音質の低下を抑制しつつ音声信号をダウンミックスする音声信号処理装置、音声信号処理プログラムに関する。
【背景技術】
【0002】
近年、8K放送や4K放送の実現に伴い、22.2chサラウンドや5.1chサラウンドの音声フォーマットが用いられている。生放送では、これらの音声フォーマットに加え、従来のステレオ(2ch)の音声フォーマットを用いて、8K放送や4K放送と同時に2K放送を行うことがある。この場合、ステレオの音声フォーマットは、22.2chサラウンドや5.1chサラウンドの音声フォーマットをダウンミックスすることによりリアルタイムで生成される。また、コンテンツのDVD制作などにおいても、22.2chサラウンドの音源を用いたコンテンツをステレオの音声フォーマットをダウンミックスすることがある。
【0003】
ダウンミックスの具体的な手法としては、ARIB STD-B32(22.2chサラウンド)やARIB STD-B21(5.1chサラウンド)といった規格に規定されているダウンミックス係数を用いることが出来る。22.2chサラウンドや5.1chサラウンドの音声フォーマットに対してダウンミックス係数による音声信号処理を行うことにより、ステレオの音声フォーマットが生成される。
【0004】
しかしながら、ARIBの規格に規定されているダウンミックス係数を用いてダウンミックスを行うと、元の音声フォーマットに比較して音が平面的に聞こえるという問題があった。そこで、HRIR(頭部インパルス応答)を用いたフィルタにより音声信号を処理する方法が提案されているが、この方法では演算量が大きくなるため、大規模なハードウェアリソースが要求される。また、演算量の増大に伴い遅延量も大きくなるため、リアルタイムの生放送には適していない。さらに、この方法においては、フィルタリングに伴い音声信号にひずみが生じるといった問題があった。
【0005】
特許文献1には、HRIRを用いたフィルタにより音声信号を処理する方法に代えて、HRIRを用いてダウンミックス係数を生成し、そのダウンミックス係数により音声信号を処理するアルゴリズムが記載されている。このアルゴリズムにおいては、HRIRを使用しつつ、しかもフィルタではなくダウンミックス係数で音声信号を処理するので、ダウンミックスに伴う音声信号の変質を最小限にとどめることが出来る。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】国際公開第2017/188141号
【発明の概要】
【発明が解決しようとする課題】
【0007】
ところで、ダウンミックスにおいては、優れたアルゴリズムを用いて音声信号の変質を抑えても、センターに定位されたコメントや音源が小さくなってしまい、他の音源に埋もれて聞こえづらくなるという問題があった。そこで、例えばDVD制作においては、音のバランス調整に加え、センターに定位されたコメントや音源が聴き易くなるような調整がなされる。しかしながら、このような調整においては、熟練のミキシングエンジニアがARIB規格のダウンミックス係数を手動で調整する手間と時間がかかっていた。そのため、DVD制作のように制作時間を確保できない生放送においては、センターに定位されたコメントや音源が聴き易くなるような調整を行うことは困難であった。また、DVD制作においても、熟練のミキシングエンジニアが現役を引退する場合に備えて、より容易なダウンミックス手法が要求されている。
【0008】
また、他の音源に埋もれて聞こえづらくなるという現象は、センターに定位されたコメントや音源に限らず、LchまたはRchに定位された音源など、いわゆる直接音の音源に共通する問題であった。
【0009】
本発明は、上記課題を解決すべく、ダウンミックス時にもセンターに定位される音源など直接音の音源が聴き易くなるような調整を容易に行うことの出来る音声信号処理装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明の音声信号処理装置は、次のような構成を備える。
(1)サラウンドの音源をダウンミックスする音声信号処理装置である。
(2)前記サラウンドの音源を調整する調整部。
(3)前記調整部の調整に基づいてダウンミックス係数を生成する係数生成部。
(4)前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する演算部。
(5)前記調整部は、前記サラウンドの音源の調整において、間接音の音源に比して直接音の音源を強調する。
【0011】
また、本発明の音声信号処理装置は、次のような構成を更に備えてもよい。
(1)前記調整部は、前記サラウンドの音源の調整において、センター音源以外の音源に比して前記センター音源を強調する。
(2)前記調整部は、前記サラウンドの音源の調整において、Lch音源とRch音源とのミキシング量を調整してファンタムセンターの音像を強調することにより、センター音源を補強する。
(3)所定の周期に基づいて、前記係数生成部に前記ダウンミックス係数を生成させることにより、前記ダウンミックス係数を随時更新する係数更新部。
(4)前記サラウンドの音源に関する情報である付帯情報に紐付けて前記ダウンミックス係数を予め複数記憶する記憶部と、前記付帯情報に基づいて、前記ダウンミックス係数を選択する選択部と、を更に備え、前記演算部は、前記選択部が選択した前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する。
【0012】
本発明の音声信号処理プログラムは、次のような構成を備える。
(1)コンピュータにサラウンドの音源をダウンミックスする処理を実行させる音声信号処理プログラムである。
(2)前記サラウンドの音源を調整する調整手順。
(3)前記調整手順における調整に基づいてダウンミックス係数を生成する係数生成手順。
(4)前記ダウンミックス係数により、前記サラウンドの音源からダウンミックスされた音源を生成する演算手順。
(5)前記調整手順は、前記サラウンドの音源の調整において、間接音の音源に比して直接音の音源を強調する。
【発明の効果】
【0013】
本発明によれば、ダウンミックス時にもセンターに定位される音源など直接音の音源が聴き易くなるような調整を容易に行うことが出来る。
【図面の簡単な説明】
【0014】
図1】第1の実施形態の音声信号処理装置の構成を示すブロック図。
図2】第1の実施形態の調整部の構成を示すブロック図。
図3】第1の実施形態の強調部における作用を示す図。
図4】第1の実施形態の補間部における作用を示す図。
図5】第1の実施形態のバランス調整部における作用を示す図。
図6】第1の実施形態の係数生成部における作用を示す図。
図7】第1の実施形態の音声信号処理装置の作用を示すフローチャート。
図8】第2の実施形態の音声信号処理装置の構成を示すブロック図。
図9】第2の実施形態の音声信号処理装置の作用を示すフローチャート。
図10】他の実施形態の係数生成部における作用を示す図。
【発明を実施するための形態】
【0015】
[第1の実施形態]
[構成]
図1に示す本実施形態の音声信号処理装置100は、例えば、音声調整卓あるいはミキサーとして知られているものである。以下では説明を容易にするために、5.1chサラウンドからステレオへのダウンミックスを例に挙げ、音声信号処理装置100に入力される音声信号は、5.1chサラウンドの音源のものとする。5.1chサラウンドは、センターに定位された音源を出力するスピーカと、Lchに定位された音源を出力するスピーカと、Rchに定位された音源を出力するスピーカと、後方Lchに定位された音源を出力するスピーカと、後方Rchに定位された音源を出力するスピーカと、低音を出力するサブウーファとにより構成される。以下では、センターに定位された音源をセンター音源、LchとRchに定位された音源をそれぞれLch音源、Rch音源、後方Lchと後方Rchに定位された音源をそれぞれ後方Lch音源、後方Rch音源ということもある。
【0016】
音声信号処理装置100は、入力された音声信号からダウンミックス係数を生成する生成部10と、入力された音声信号に対してダウンミックス係数によるダウンミックスを行い、ダウンミックスされた音声信号を生成する演算部20と、を備える。
【0017】
生成部10は、DSPなどにより構成され、入力された音声信号を調整する調整部11と、調整した音声信号のダウンミックス係数を生成し、さらに演算部20に出力する係数生成部12と、係数生成部12に再度係数を生成させる係数更新部13と、を備える。
【0018】
図2に示すように、調整部11は、5.1chサラウンドの音源のうちセンター音源を強調する強調部111と、5.1chサラウンドの音源のうちLch音源及びRch音源によりセンター音源を補完する補間部112と、5.1chサラウンドの音源のうち直接音と間接音とのバランスを調整するバランス調整部113と、を備える。調整部11においては、強調部111と補間部112とが並列して設けられ、その後段にバランス調整部113が設けられる。本実施形態においては、5.1chサラウンドの音源は、強調部111と補間部112のいずれか一方に入力されるものとする。いずれに入力されるかの設定は、例えば音声信号処理装置100に設けられたパネルなどの図示しない入力手段により行われる。
【0019】
図3に示すように、強調部111には、5.1chサラウンドの音源のうち、センター音源と、その他の音源とが識別可能に入力される。強調部111は、例えば1つの操作子を備え、この操作子を左に回転させるとセンター音源のミキシング量が増加し、右に回転させるとセンター音源以外の音源のミキシング量が増加する。ミキシングエンジニアは、この操作子を左に回転させることにより、他の音源に比してセンター音源を強調する。
【0020】
図4に示すように、補間部112には、5.1chサラウンドの音源のうち、Lch音源と、Rch音源と、その他の音源とが識別可能に入力される。補間部112においては、Lch音源に対するRch音源のミキシング比率、及びRch音源に対するLch音源のミキシング比率が調整される。このために、補間部112は、例えば主操作子Aと副操作子Bとを備える。
【0021】
主操作子Aは、Lch音源とRch音源とのバランスを調整する。例えば、主操作子Aを左に回転させるとLch音源及びRch音源のミキシング量が減少し、右に回転させるとLch音源及びRch音源のミキシング量が増加する。一方で、副操作子Bは、Rch音源に対してLch音源をミキシングする量と、Lch音源に対してRch音源をミキシングする量とを調整する。例えば、副操作子Bを左に回転させるとRch音源に対してミキシングするLch音源の量及びLch音源に対してミキシングするRch音源の量が減少し、右に回転させるとRch音源に対してミキシングするLch音源の量及びLch音源に対してミキシングするRch音源の量が増加する。ミキシングエンジニアは、主操作子Aと副操作子Bとを回転させることにより、Lch音源に対するRch音源のミキシング比率、及びRch音源に対するLch音源のミキシング比率を調整する。これにより、ファンタムセンターの音像が強調されるので、センター音源を補強することが出来る。なお、主操作子Aと副操作子Bは連動するようにしても良いし、主操作子Aは固定して副操作子Bだけが回転するようにしても良い。連動させる場合は、主操作子Aの回転方向と反対方向に副操作子Bが回転するようにすると良い。
【0022】
図5に示すように、バランス調整部113には、5.1chサラウンドの音源のうち、直接音の音源と、間接音の音源とが識別可能に入力される。ここで、直接音とは、直接耳に届く音であり、間接音とは、壁などに反射して耳に届く音である。本実施形態において、直接音の音源は、センター音源、Lch音源、Rch音源であり、間接音の音源は、これら以外の音源である。バランス調整部113は、例えば1つの操作子を備え、この操作子を左に回転させると直接音の音源のミキシング量が増加し、右に回転させると間接音の音源のミキシング量が増加する。ミキシングエンジニアは、この操作子を左に回転させることにより、間接音の音源に比して直接音の音源を強調する。
【0023】
係数生成部12は、調整部11の後段に設けられ、調整部11において調整された音声信号から、元の音声信号である5.1chサラウンドの音源をステレオの音源にダウンミックスするためのダウンミックス係数を生成する。係数生成部12は、生成したダウンミックス係数を演算部20に出力する。ミキシングエンジニアは、図示しない入力手段により手動で、または放送スケジュールがデータ化された番組キューシートを読み込ませることによりこの放送スケジュールに従い自動で、所望のタイミングで係数生成部12にダウンミックス係数を生成させることが出来る。所望のタイミングは、例えば、現在放送中の番組が次の番組に切り替わるタイミングである。また、後述の係数更新部13により、所定の周期で係数生成部12にダウンミックス係数を生成させることも出来る。
【0024】
ダウンミックス係数を生成するアルゴリズムとしては、例えば、背景技術で説明した特許文献1の技術を用いることが出来る。図6に示すように、特許文献1の技術では、調整部11において調整された音声信号から直接ダウンミックス係数を生成する。なお、特許文献1の技術は例に過ぎず、ダウンミックスに係る他の周知技術の係数を取り出して使用してもよい。
【0025】
係数更新部13は、所定の周期で係数生成部12にダウンミックス係数を生成させる。例えば、係数生成部12がダウンミックス係数を生成してから5分が経過すると、係数更新部13は、係数生成部12に対して、再度ダウンミックス係数を生成するように要求する。この所定の周期は、ミキシングエンジニアにより図示しない入力手段を介して予め設定しておくことが出来る。
【0026】
演算部20は、FPGAなどにより構成され、入力された音声信号に対して、係数生成部12から入力されたダウンミックス係数を乗算する。これにより、演算部20は、ダウンミックスされた音声信号を生成する。なお、ダウンミックスされた音声信号は、図示しないスピーカなどの出力装置から外部に出力される。
【0027】
[作用]
図7を参照しつつ、本実施形態における音声信号処理装置100の作用について説明する。まず、元の音声信号である5.1chサラウンドの音源が、調整部11と、演算部20とに入力される。調整部11において、5.1chサラウンドの音源は、強調部111または補間部112のいずれか一方に入力されるが、ここでは強調部111に入力されるものとして説明する。
【0028】
強調部111において、5.1chサラウンドの音源は、センター音源とそれ以外の音源とが識別可能となっている。ここで、ミキシングエンジニアは、強調部111が備える操作子を回転させることにより、センター音源を強調する(ステップS01)。強調部111は、センター音源が強調された5.1chサラウンドの音源を後段のバランス調整部113に出力する。
【0029】
バランス調整部113において、センター音源が強調された5.1chサラウンドの音源は、直接音の音源と、間接音の音源とが識別可能となっている。ここで、ミキシングエンジニアは、バランス調整部113が備える操作子を回転させることにより、直接音を強調する(ステップS02)。バランス調整部113は、直接音が強調された5.1chサラウンドの音源を後段の係数生成部12に出力する。
【0030】
係数生成部12は、特許文献1の技術を用いる場合、調整部11が調整した5.1chサラウンドの音源からダウンミックス係数を生成する(ステップS03)。係数生成部12は、生成したダウンミックス係数を演算部20に出力する。
【0031】
演算部20は、入力された元の音声信号である5.1chサラウンドの音源に対して、係数生成部12から入力されたダウンミックス係数を乗算する(ステップS04)。これにより、5.1chサラウンドの音源をダウンミックスしたステレオの音源が生成される。また、係数更新部13からの要求により、係数生成部12は、所定の周期でダウンミックス係数を再度生成することも出来る。ダウンミックス対象となる音源が現在放送中のものであるのに対し、ダウンミックス係数は過去の音源から生成されたものである。そのため、所定の周期でダウンミックス係数を更新することにより、現在放送中の音源に適したダウンミックス係数を使い続けることが出来る。
【0032】
[効果]
(1)本実施形態の音声信号処理装置100の調整部11は、バランス調整部113を備える。これにより、サラウンドの音源を直接調整して間接音の音源に比して直接音の音源を強調することが出来るので、この調整されたサラウンドの音源から生成されるダウンミックス係数を用いてダウンミックスすることにより、ダウンミックスされた音源においても直接音の音源が間接音の音源に埋もれて聞こえづらくなるという事態を回避することが出来る。また、従来技術のように、ARIB規格のダウンミックス係数を手動で調整する必要もないため、熟練のミキシングエンジニアでなくとも容易に調整を行うことが出来る。
【0033】
(2)本実施形態の音声信号処理装置100の調整部11は、バランス調整部113の前段に強調部111を備える。これにより、センター音源だけを他の音源に比較して強調することが出来るので、センター音源が他の音源に埋もれて聞こえづらくなるという事態を回避することが出来る。特に、センター音源にコメントなどの重要な情報が含まれている場合に、コメントが聞こえないという事態を回避することが出来る。
【0034】
(3)本実施形態の音声信号処理装置100の調整部11は、バランス調整部113の前段に補間部112を備える。これにより、センター音源が他の音源に比較して弱々しい場合であっても、Lch音源とRch音源とのミックスにより、センター音源を補強することが出来る。特に、センター音源にコメントなどの視聴者が認識し易い情報が含まれない場合に、音源が中抜けしているような印象を与えることがない。
【0035】
(4)本実施形態の音声信号処理装置100は、係数更新部13を備える。これにより、係数生成部12は、所定の周期でダウンミックス係数を再度生成することが出来るので、例えば番組の進行に伴う音源の変化に合わせてダウンミックス係数を随時更新することが出来るので、音源とダウンミックス係数のミスマッチがおきにくい。
【0036】
[第2の実施形態]
第2の実施形態は、第1の実施形態と基本構成が同じである。以下では、第1の実施形態と異なる点のみを説明し、第1の実施形態と同じ部分については同じ符号を付して詳細な説明は省略する。
【0037】
[構成]
図8に示すように、音声信号処理装置100は、ダウンミックス係数とダウンミックス係数に紐付けられている付帯情報とを記憶する記憶部30と、付帯情報に基づいて記憶部30に記憶されているダウンミックス係数を選択する選択部40と、を更に備える。
【0038】
記憶部30は、ストレージなどにより構成され、予め係数生成部12が生成しておいたダウンミックス係数を複数記憶する。記憶されたダウンミックス係数には、付帯情報が紐付けられる。付帯情報は、例えば、ダウンミックスされる元の音声信号に関する情報であって、放送される番組の名称やジャンル、出演者名、スタジオの場所、放送時の天候などである。付帯情報は、例えば図示しない記憶装置に予め記憶されており、元の音声信号からダウンミックス係数を生成する過程と並行して、記憶部30に入力される。記憶部30において、この付帯情報と同じ音声信号から生成されたダウンミックス係数とが紐付けられて記憶される。換言すると、記憶部30は、ダウンミックス係数とその付帯情報のデータベースである。
【0039】
選択部40は、メモリ及びCPUなどにより構成され、記憶部30に記憶されている付帯情報に基づいて、放送中の番組に最適なダウンミックス係数を選択する。例えば、選択部40に人工知能が搭載され、人工知能が現在放送中の番組の音声信号に関する付帯情報と記憶部30に記憶されている付帯情報とを照合することにより、このような選択が実行される。選択部40は、選択したダウンミックス係数を演算部20に出力する。なお、元の音声信号に関する付帯情報は、例えば番組の放送開始とともに選択部40に入力される。
【0040】
[作用]
図9を参照しつつ、本実施形態における音声信号処理装置100の作用について説明する。本実施形態の前提として、係数生成部12が生成したダウンミックス係数は、記憶部30に入力され、記憶部30に記憶されている(ステップS11)。また、このダウンミックス係数には、同じ元の音声信号に関する付帯情報が紐付けられている(ステップS12)。記憶部30には、このダウンミックス係数と付帯情報との組が複数記憶され、ダウンミックス係数のデータベースを構成している。
【0041】
本実施形態においては、選択部40が、元の音声信号に関する付帯情報と、記憶部30に記憶されている付帯情報とを照合する。これにより、選択部40は、元の音声信号に適したダウンミックス係数を選択し、選択したダウンミックス係数を演算部20に出力する(ステップS13)。演算部20は、入力された元の音声信号である5.1chサラウンドの音源に対して、選択部40が選択したダウンミックス係数を乗算する(ステップS14)。これにより、5.1chサラウンドの音源をダウンミックスしたステレオの音源が生成される。
【0042】
[効果]
本実施形態の音声信号処理装置100は、記憶部30と、選択部40と、を備える。これにより、予め係数生成部12が生成しておいたダウンミックス係数から、放送中の番組に適したものを選択することが出来る。このような選択は、ダウンミックス係数の生成よりも短い時間で行うことが出来るので、迅速にダウンミックスを行うことが出来る。また、係数生成部12がダウンミックス係数を生成した後は、このダウンミックス係数が演算部20に出力されることで、第1の実施形態と同様の効果を奏することが出来る。
【0043】
[他の実施形態]
本発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。具体的には、次のような他の実施形態も包含する。
【0044】
(1)上記の実施形態においては、センター音源を聞こえ易くしたが、他の音源を聞こえ易くしてもよい。例えば、Lch音源を聞こえ易くしてもよい。
【0045】
(2)上記の実施形態においては、5.1chサラウンドからステレオへのダウンミックスについて説明したが、例えば22.2chサラウンドからステレオへのダウンミックスや、22.2chサラウンドから5.1chサラウンドへのダウンミックスについても本発明を適用することが出来る。
【0046】
(3)上記の実施形態の調整部11は、強調部111と、補間部112と、バランス調整部113と、を備えるようにしたが、これらのうち少なくとも1つの構成を備えればよい。また、強調部111と補間部112とは代替的に機能することとしたが、例えば強調部111の後段に補間部112を設けることにより、両方が機能するようにしても良い。
【0047】
(4)上記の実施形態の調整部11においては、ミキシングエンジニアが各構成に設けられた操作子を操作することによってパラメータを生成したが、音声信号処理装置100に設けられたGUIを操作することによってパラメータを生成してもよい。
【0048】
(5)上記の実施形態の係数更新部13は、所定の周期で係数生成部12にダウンミックス係数を再度生成させることとした。この方法であれば、最新のダウンミックス係数によりダウンミックスすることになるが、例えば前回のダウンミックス係数と最新のダウンミックス係数との差分を一定の時定数で変化させ、連続的にダウンミックス係数を更新することも出来る。
【0049】
(6)上記の実施形態の係数更新部13は、所定の周期で係数生成部12にダウンミックス係数を再度生成させることとした。これと同様に、係数更新部13は、所定の周期で選択部40に再度ダウンミックス係数を選択させることも出来る。さらに、並行して所定の周期で係数生成部12に生成させたダウンミックス係数を記憶部30に出力させ続けることにより、選択部40が選択するダウンミックス係数の選択肢を増やすことも出来る。
【0050】
(7)上記の実施形態においては、係数更新部13を備えることとしたが、図示しない入力手段により係数生成部12にダウンミックス係数を生成させるのであれば、係数更新部13を省略することも出来る。
【0051】
(8)上記の実施形態の強調部111においては、センター音源とその他の音源とのバランスを調整するものとしたが、例えば、センター音源とLch音源、Rch音源とのバランスを調整するようにしてもよい。センター音源に含まれるコメントがLch音源、Rch音源にも含まれる場合、コメントの聞こえ方を細かく調整することが出来る。
【0052】
(9)上記の実施形態の補間部112においては、Lch音源とRch音源とのミキシングバランスを調整するものとしたが、例えば、元の音声信号が22.2chの音源である場合、上層の音源と下層の音源とのミキシングバランスを調整するものとしてもよい。
【0053】
(10)上記の実施形態においては、直接音の音源を、センター音源、Lch音源、Rch音源としたが、これに限られない。図示しない入力手段により、どの音源を直接音の音源とするかを任意に設定することが出来る。
【0054】
(11)上記の実施形態においては、特許文献1の技術を用いてダウンミックス係数を生成したが、ARIB規格のダウンミックス係数を用いて、係数生成部12が演算部20に出力するためのダウンミックス係数を生成することも出来る。この場合、調整部11の作用も上記実施形態とは異なるので、以下に説明する。
【0055】
図10に示すように、ARIBの規格を用いる場合には、サラウンドの音源は調整部11に入力されない。ミキシングエンジニアは、調整部11の各構成が備える操作子を回転させることにより、サラウンドの音源を直接調整するのではなく、サラウンドの音源を調整するための係数を生成する。例えば、バランス調整部113は、センター音源をどの程度強調するかを定める係数を生成する。このように、調整部11が生成した係数は、後段に設けられた係数生成部12に入力される。本実施形態の係数生成部12は、係数乗算部121を備える。係数乗算部121は、調整部11が生成した係数にARIB規格のダウンミックス係数を乗算することにより、演算部20に出力するダウンミックス係数を生成する。なお、特許請求の範囲におけるサラウンドの音源を調整するという記載は、サラウンドの音源を直接調整することだけでなく、サラウンドの音源を調整するための係数を生成することも含むものとする。
【0056】
(12)上記の実施形態においては、音声信号処理装置100というハードウェアについて説明したが、コンピュータに音声信号処理装置100の各構成の作用を手順として実行させるプログラムなどのソフトウェアによっても同様の効果を奏することが出来る。例えば、調整部11のバランス調整部113と、係数生成部12と、演算部20と、を構成として備える音声信号処理装置100の代わりに、サラウンドの音源の調整において、間接音の音源に比して直接音の音源を強調する調整手順と、調整手順における調整に基づいてダウンミックス係数を生成する係数生成手順と、ダウンミックス係数により、サラウンドの音源からダウンミックスされた音源を生成する演算手順と、をコンピュータに実行させる音声信号処理プログラムによっても、同様の効果を奏することが出来る。この手順は、例えば図7の説明と同様に行われる。
【符号の説明】
【0057】
100…音声信号処理装置
10…生成部
11…調整部
111…強調部
112…補間部
113…バランス調整部
12…係数生成部
121…係数乗算部
13…係数更新部
20…演算部
30…記憶部
40…選択部
A…主操作子
B…副操作子
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10