IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社タムラ製作所の特許一覧

<>
  • 特開-音声調整卓 図1
  • 特開-音声調整卓 図2
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022090405
(43)【公開日】2022-06-17
(54)【発明の名称】音声調整卓
(51)【国際特許分類】
   H04R 3/00 20060101AFI20220610BHJP
【FI】
H04R3/00
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2020202796
(22)【出願日】2020-12-07
(71)【出願人】
【識別番号】390005223
【氏名又は名称】株式会社タムラ製作所
(74)【代理人】
【識別番号】100081961
【弁理士】
【氏名又は名称】木内 光春
(74)【代理人】
【識別番号】100112564
【弁理士】
【氏名又は名称】大熊 考一
(74)【代理人】
【識別番号】100163500
【弁理士】
【氏名又は名称】片桐 貞典
(74)【代理人】
【識別番号】230115598
【弁護士】
【氏名又は名称】木内 加奈子
(72)【発明者】
【氏名】波多野 渉
【テーマコード(参考)】
5D220
【Fターム(参考)】
5D220EE25
5D220EE31
5D220EE41
(57)【要約】      (修正有)
【課題】各種の音声調整パラメータを自動的に呼び出すことにより、汎用性が高く、少ない操作で優れた音声調整を可能とした音声調整卓を提供する。
【解決手段】音声調整卓はにおいて、情報入力部7は、音声調整卓に接続された機器に関する情報と、機器に入出力された音声信号に関する情報と、音声信号調整部3a、3b~3nにより音声信号に対して実施された音声調整のパラメータに関する情報を入力する。情報セット生成部11は、情報入力部7に入力された各情報を互いに紐づけて情報セットを生成する。保存用キーワード生成部12は、各情報に関する複数の値を所定の基準で抽出し保存用キーワードとして設定する。情報セット検索部15は、検索用キーワードと保存用キーワードを用いて情報セットを抽出する。調整制御部20は、情報セットに含まれるパラメータに関する情報を取得する。音声信号調整部は、取得したパラメータに基づいて音声調整を実施する。
【選択図】図1
【特許請求の範囲】
【請求項1】
複数の音声信号が入力される音声信号入力部と、入力された前記複数の音声信号に対して、所定のパラメータに基づいて調整を行う複数の音声信号調整部と、前記複数の音声信号調整部から出力された音声信号を混合する音声信号混合部と、前記音声信号混合部で混合された音声信号を出力する音声信号出力部と、
音声調整卓に接続された機器に関する情報と、前記機器に入出力された音声信号に関する情報と、前記音声信号調整部により前記音声信号に対して実施された音声調整のパラメータに関する情報を入力する情報入力部と、
前記音声信号に対して実施された音声調整のパラメータに関する情報を含むように、前記情報入力部に入力された前記各情報を互いに紐づけて1つの情報セットを生成する情報セット生成部と、
前記情報入力部に入力された各情報及び/又は前記情報セット生成部によって生成された各情報セットに含まれる前記各情報に関する複数の値を所定の基準で抽出し、抽出された各値をその情報セットの保存用キーワードとして設定する保存用キーワード生成部と、
前記各情報セットとそのキーワードを紐づけて保存する記憶部と、
前記音声信号調整部が音声調整を実施する際に前記情報入力部に入力された、音声調整卓に接続された機器に関する情報と、前記機器に入出力された音声信号に関する情報の少なくとも一つ又はその組み合わせの中から、各情報に関する複数の値を所定の基準で抽出し、抽出された各値をその情報の検索用のキーワードとして設定する検索用キーワード生成部と、
前記検索用キーワードと前記保存用キーワードを用いて前記記憶部内に保存された情報セットを検索し、前記検索用キーワードと前記保存用キーワードとが所定の基準で一致した情報セットを抽出する情報セット検索部と、
前記情報セット検索部によって抽出された情報セットに含まれる音声調整のパラメータに関する情報を取得し、前記音声信号調整部に対して取得されたパラメータに基づいて音声調整を実施させる調整制御部と、
を有する音声調整卓。
【請求項2】
前記情報セット検索部は、前記検索用キーワードと前記保存用キーワードとが所定の基準で一致した情報セットを複数抽出し、
前記調整制御部は、前記複数抽出された情報セットに含まれる複数の音声調整のパラメータを演算処理して、その演算結果として得られたパラメータに基づいて前記音声信号調整部に音声調整を実施させる請求項1に記載の音声調整卓。
【請求項3】
前記情報入力部は、
前記音声信号調整部が音声調整を実施する対象となる番組の進行表を受け入れる進行表入力部と、
前記進行表に記載された情報中から、音声調整卓に接続された機器に関する情報と、前記機器に入出力された音声信号に関する情報と、番組進行の経時的変化を紐づけて抽出する番組進行状況抽出部を備え、
前記情報セット検索部は、前記進行表入力部から入力された番組進行の経時的変化に対応して、異なる情報セットを抽出するものであり、
前記調整制御部は、前記情報セット検索部によって抽出された異なる情報セットに含まれる音声調整のパラメータに基づいて、番組進行の経時的変化に従って異なる音声調整を実施させるものである請求項1又は請求項2に記載の音声調整卓。
【請求項4】
前記調整制御部の指示により、前記取得されたパラメータに基づいて前記音声信号調整部が入力された音声信号に対する調整処理を実施し、前記調整処理後の信号レベルが一定以上低くなっているかを検出する出力レベル検出部を備える請求項1から請求項3のいずれかに記載の音声調整卓。
【請求項5】
前記出力レベル検出部は、前記調整処理後の信号レベルがあらかじめ設定された閾値よりも低い場合に、前記音声入力部に対する前記音声信号の入力異常を知らせる機能を有する請求項4に記載の音声調整卓。
【請求項6】
前記出力レベル検出部は、前記調整処理後の信号レベルがあらかじめ設定された閾値よりも低い場合に、
前記複数の機器に入出力された音声信号に関する情報の中から、前記取得されたパラメータに基づいて調整処理を実施した音声信号と共通する検索用キーワードを有する前記機器に入力された音声信号に関する情報と、調整処理を実施した音声信号の出力レベルに関する情報とが紐づけられた複数の情報セットを検索し、
前記調整制御部は、抽出された複数の情報セットに含まれている前記音声信号の出力レベルに関する情報を演算処理して、演算結果として得られた出力レベルとなるように、前記調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて前記音声信号調整部に音声調整を実施させる請求項4に記載の音声調整卓。
【請求項7】
前記調整処理後の音声信号に関するコンプレッサのゲインリダクション値を検出するゲインリダクション値検出部を備え、
前記ゲインリダクション値検出部は、前記調整処理後のゲインリダクション値があらかじめ設定された閾値から外れている場合に、
前記複数の機器に入出力された音声信号に関する情報の中から、前記取得されたパラメータに基づいて調整処理を実施した音声信号と共通する検索用キーワードを有する前記機器に入力された音声信号に関する情報と、調整処理を実施した音声信号についてのゲインリダクション値に関する情報とが紐づけられた複数の情報セットを検索し、
前記調整制御部は、抽出された複数の情報セットに含まれている前記調整処理を実施した音声信号のゲインリダクション値に関する情報を演算処理し、演算結果として得られたゲインリダクション値となるように、前記閾値から外れたゲインリダクション値を補正したパラメータに基づいて前記音声信号調整部に音声調整を実施させる請求項1から請求項6のいずれかに記載の音声調整卓。
【請求項8】
前記調整処理後の音声信号の直接音と間接音を比較するバランス比較部を備え、
前記バランス比較部は、前記調整処理後の直接音と間接音のバランスがあらかじめ設定された閾値から外れている場合に、
前記複数の機器に入出力された音声信号に関する情報の中から、前記取得されたパラメータに基づいて調整処理を実施した音声信号と共通する検索用キーワードを有する前記機器に入力された音声信号に関する情報と、調整処理を実施した音声信号についての直接音と間接音のバランスに関する情報とが紐づけられた複数の情報セットを検索し、
前記調整制御部は、抽出された複数の情報セットに含まれている前記調整処理を実施した音声信号の直接音と間接音のバランスに関する情報を演算処理し、演算結果として得られたバランスとなるように、前記調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて前記音声信号調整部に音声調整を実施させる請求項1から請求項7のいずれかに記載の音声調整卓。
【請求項9】
前記音声信号混合部は、前記調整処理後の複数の音声信号の混合バランスを比較する混合バランス比較部を備え、
前記混合バランス比較部は、前記複数の機器に入出力された音声信号に関する情報の中から、前記取得されたパラメータに基づいて調整処理を実施した音声信号と共通する検索用キーワードを有する前記機器に入力された音声信号に関する情報と、調整処理を実施した複数の音声信号を前記音声信号混合部が混合した際の混合バランスに関する情報とが紐づけられた複数の情報セットを検索し、
前記調整制御部は、抽出された複数の情報セットに含まれている前記音声混合部による混合バランスに関する情報を演算処理し、演算結果として得られた混合バランスとなるように、前記調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて前記音声信号調整部に音声調整を実施させる請求項1から請求項8のいずれかに記載の音声調整卓。
【請求項10】
調整処理後の音声信号に対するイコライジング効果及び/又はフィルタ処理効果を検出するEQ・FIL検出部を備え、
前記EQ・FIL検出部は、調整処理後のイコライジング効果及び/又はフィルタ処理効果があらかじめ設定された閾値から外れているか否かを検出し、閾値から外れている場合に、複数の機器に入出力された音声信号に関する情報の中から、調整処理を実施した音声信号と共通する検索用キーワードを有する機器に入力された音声信号に関する情報と、調整処理を実施した音声信号についてのイコライジング効果及び/又はフィルタ処理効果に関する情報とが紐づけられた複数の情報セットを検索し、
前記調整制御部は、抽出された複数の情報セットに含まれているイコライジング効果及び/又はフィルタ処理効果に関する情報を演算処理し、その演算結果として得られたイコライジング効果やフィルタ処理効果となるように、調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて前記音声信号調整部に音声調整を実施させる請求項1から請求項9のいずれかに記載の音声調整卓。


【発明の詳細な説明】
【技術分野】
【0001】
本発明は、AI技術を利用した音声調整卓に関するものである。
【背景技術】
【0002】
ラジオやテレビジョンなどの放送スタジオや、音楽の録音スタジオなどには、入力された音声信号の音量や音質などを調整する音声調整卓が設けられている。音声信号の入力装置の一つとして、マイクロホンが用いられる。音声調整卓は、複数のマイクロホンやBGMの音源となるCDなどから入力された各音声信号について、音量や音質の調整を行った後、各音声信号をミキシングして出力する。音声調整卓は、ミキシング技術者と呼ばれるオペレータによって操作される。オペレータは、音声調整卓を操作して、音声信号のミキシングバランスが最適となるように手動で調整している。
【0003】
放送局の番組を制作現場では、制作コストの抑制のため、すくないスタッフで効率的な番組制作を求められている。スタジオの有効活用のため、スタジオに入る前に事前に番組で使用するツールの仕込みを行う。このことは、昨今のリモートワークの普及により重要性を増してきている。また、実際にスタジオを使用した番組制作の過程においても、操作ミスによる番組品質の低下や、録り直しによる制作時間の増大など防ぐことが重要になっている。
【0004】
同様に地方放送局での番組作りは、人員削減の影響で音声の専任のエンジニアがつかない番組もあり、番組の質の低下が問題となっている。さらに、昨今では、今まで番組制作を支えた熟練のノウハウを持つ団塊の世代が引退し、彼らの持つノウハウが消滅してしまう問題がある。これは、放送局の資産が消滅することであり、経営上問題となっている。
【0005】
音声調整卓において前記の課題を解決するべく、オフラインによる番組データの作成ツールや自動フェーダ、自動ミキシング機能などの制作ツールが提案されている。例えば、特許文献1から3に示すように、オペレータが調整或いは設定した各種のパラメータを記憶しておき、必要とする場合にそれを呼び出して利用する技術が提案されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2004-80735号公報
【特許文献2】特開2013-197764号公報
【特許文献3】特開2016-157996号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、前記の各特許文献に記載の発明は、リハーサル時に設定したパラメータを本番時に呼び出したり、ある特定のシーンについて調整或いは設定したパラメータを同様なシーンについて呼び出して使用するものであり、多種多様な状況に応じて適切なパラメータを呼び出して使用するものではなかった。
【0008】
特に、放送局などで使用されるマイクやスピーカ等の入出力機器にはその入出力特性が異なる多種多様なものがある。また、これらに入出力される個々の出演者の異なる音量や音質の音声、使用されるBGMの種類なども膨大な数に上る。しかも、それらの組み合わせが変わると、それに応じて調整或いは設定するパラメータも異なってくる。そのため、従来技術のように、特定のシーンや機器についてパラメータを記憶しておいても汎用性に乏しく、オペレータが使用したいと思う状況に応じて適切なデータを呼び出すことは困難であった。
【0009】
本発明は前記のような従来技術の問題点を解決するために提案されたものである。本発明の目的は、AI技術を利用することで、接続された各機器、入出力される音声信号、利用される各シーンなどの多種多様な状況に応じて、各種の音声調整パラメータを自動的に呼び出すことにより、汎用性が高く、操作性に優れた音声調整を可能とした音声調整卓を提供することである。
【課題を解決するための手段】
【0010】
前記の目的を達成するために、本発明の音声調整卓は、次のような構成を有する。
(1)複数の音声信号が入力される音声信号入力部と、入力された前記複数の音声信号に対して、所定のパラメータに基づいて調整を行う複数の音声信号調整部と、前記複数の音声信号調整部から出力された音声信号を混合する音声信号混合部と、前記音声信号混合部で混合された音声信号を出力する音声信号出力部。
(2)音声調整卓に接続された機器に関する情報と、前記機器に入出力された音声信号に関する情報と、前記音声信号調整部により前記音声信号に対して実施された音声調整のパラメータに関する情報を入力する情報入力部。
(3)音声信号に対して実施された音声調整のパラメータに関する情報を含むように、前記情報入力部に入力された前記各情報を互いに紐づけて1つの情報セットを生成する情報セット生成部。
(4)前記情報セット生成部によって生成された各情報セットに含まれる前記各情報に関する複数の値を所定の基準で抽出し、抽出された各値をその情報セットの保存用キーワードとして設定する保存用キーワード生成部。
(5)前記各情報セットとそのキーワードを紐づけて保存する記憶部。
(6)前記音声信号調整部が音声調整を実施する際に前記情報入力部に入力された、音声調整卓に接続された機器に関する情報と、前記機器に入出力された音声信号に関する情報の少なくとも一つ又はその組み合わせの中から、各情報に関する複数の値を所定の基準で抽出し、抽出された各値をその情報の検索用のキーワードとして設定する検索用キーワード生成部。
(7)前記検索用キーワードと前記保存用キーワードを用いて前記記憶部内に保存された情報セットを検索し、前記検索用キーワードと前記保存用キーワードとが所定の基準で一致した情報セットを抽出する情報セット検索部。
(8)前記情報セット検索部によって抽出された情報セットに含まれる音声調整のパラメータに関する情報を取得し、前記音声信号調整部に対して取得されたパラメータに基づいて音声調整を実施させる調整制御部。
【0011】
本発明の音声調整卓は、以下の構成も包含する。
(1)前記情報セット検索部は、前記検索用キーワードと前記保存用キーワードとが所定の基準で一致した情報セットを複数抽出し、
前記調整制御部は、前記複数抽出された情報セットに含まれる複数の音声調整のパラメータを演算処理して、その演算結果として得られたパラメータに基づいて前記音声信号調整部に音声調整を実施させる。
【0012】
(2)前記情報入力部が、前記音声信号調整部が音声調整を実施する対象となる番組の進行表を受け入れる進行表入力部と、
前記進行表に記載された情報中から、音声調整卓に接続された機器に関する情報と、前記機器に入出力された音声信号に関する情報と、番組進行の経時的変化を紐づけて抽出する番組進行状況抽出部を備え、
前記情報セット検索部は、前記進行表入力部から入力された番組進行の経時的変化に対応して、異なる情報セットを抽出するものであり、
前記調整制御部は、前記情報セット検索部によって抽出された異なる情報セットに含まれる音声調整のパラメータに基づいて、番組進行の経時的変化に従って異なる音声調整を実施させるものである。
【0013】
(3)前記調整制御部の指示により、前記取得されたパラメータに基づいて前記音声信号調整部が入力された音声信号に対する調整処理を実施し、前記調整処理後の信号レベルが一定以上低くなっているかを検出する出力レベル検出部。
(4)前記出力レベル検出部は、前記調整処理後の信号レベルがあらかじめ設定された閾値よりも低い場合に、前記音声入力部に対する前記音声信号の入力異常を知らせる機能を有する。
【0014】
(5)前記出力レベル検出部は、前記調整処理後の信号レベルがあらかじめ設定された閾値よりも低い場合に、
前記複数の機器に入出力された音声信号に関する情報の中から、前記取得されたパラメータに基づいて調整処理を実施した音声信号と共通する検索用キーワードを有する前記機器に入力された音声信号に関する情報と、調整処理を実施した音声信号の出力レベルに関する情報とが紐づけられた複数の情報セットを検索し、
前記調整制御部は、抽出された複数の情報セットに含まれている前記音声信号の出力レベルに関する情報を演算処理して、演算結果として得られた出力レベルとなるように、前記調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて前記音声信号調整部に音声調整を実施させる。
【0015】
(6)前記調整処理後の音声信号に関するコンプレッサのゲインリダクション値を検出するゲインリダクション値検出部を備え、
前記ゲインリダクション値検出部は、前記調整処理後のコンプレッサのゲインリダクション値があらかじめ設定された閾値から外れている場合に、
前記複数の機器に入出力された音声信号に関する情報の中から、前記取得されたパラメータに基づいて調整処理を実施した音声信号と共通する検索用キーワードを有する前記機器に入力された音声信号に関する情報と、調整処理を実施した音声信号についてのゲインリダクション値に関する情報とが紐づけられた複数の情報セットを検索し、
前記調整制御部は、抽出された複数の情報セットに含まれている前記調整処理を実施した音声信号のゲインリダクション値に関する情報を演算処理し、演算結果として得られたゲインリダクション値となるように、前記閾値から外れたゲインリダクション値を補正したパラメータに基づいて前記音声信号調整部に音声調整を実施させる。
【0016】
(7)前記調整処理後の音声信号の直接音と間接音を比較するバランス比較部を備え、
前記バランス比較部は、前記調整処理後の直接音と間接音のバランスがあらかじめ設定された閾値から外れている場合に、
前記複数の機器に入出力された音声信号に関する情報の中から、前記取得されたパラメータに基づいて調整処理を実施した音声信号と共通する検索用キーワードを有する前記機器に入力された音声信号に関する情報と、調整処理を実施した音声信号についての直接音と間接音のバランスに関する情報とが紐づけられた複数の情報セットを検索し、
前記調整制御部は、抽出された複数の情報セットに含まれている前記調整処理を実施した音声信号の直接音と間接音のバランスに関する情報を演算処理し、演算結果として得られたバランスとなるように、前記調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて前記音声信号調整部に音声調整を実施させる。
【0017】
(8)前記音声信号混合部は、前記調整処理後の複数の音声信号の混合バランスを比較する混合バランス比較部を備え、
前記混合バランス比較部は、
前記複数の機器に入出力された音声信号に関する情報の中から、前記取得されたパラメータに基づいて調整処理を実施した音声信号と共通する検索用キーワードを有する前記機器に入力された音声信号に関する情報と、調整処理を実施した複数の音声信号を前記音声信号混合部が混合した際の混合バランスに関する情報とが紐づけられた複数の情報セットを検索し、
前記調整制御部は、抽出された複数の情報セットに含まれている前記音声混合部による混合バランスに関する情報を演算処理し、その演算結果として得られた混合バランスとなるように、前記調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて前記音声信号調整部に音声調整を実施させる。
【0018】
(9)調整処理後の音声信号に対するイコライジング効果及び/又はフィルタ処理効果を検出するEQ・FIL検出部を備え、
前記EQ・FIL検出部は、調整処理後のイコライジング効果及び/又はフィルタ処理効果があらかじめ設定された閾値から外れているか否かを検出し、閾値から外れている場合に、複数の機器に入出力された音声信号に関する情報の中から、調整処理を実施した音声信号と共通する検索用キーワードを有する機器に入力された音声信号に関する情報と、調整処理を実施した音声信号についてのイコライジング効果及び/又はフィルタ処理効果に関する情報とが紐づけられた複数の情報セットを検索し、
前記調整制御部は、抽出された複数の情報セットに含まれているイコライジング効果及び/又はフィルタ処理効果に関する情報を演算処理し、その演算結果として得られたイコライジング効果やフィルタ処理効果となるように、調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて前記音声信号調整部に音声調整を実施させる。
【発明の効果】
【0019】
本発明によれば、汎用性が高く、少ない操作で優れた音声調整を可能とした音声調整卓を提供することが可能になる。
【図面の簡単な説明】
【0020】
図1】本発明の実施形態の構成を示すブロック図。
図2図1の実施形態において、情報入力部に入力する番組進行表の一例を示す図。
【発明を実施するための形態】
【0021】
[1.実施形態の構成]
[1-1.基本的構成]
以下、本発明の実施形態を図1に従って具体的に説明する。図1に示すとおり、本実施形態の音声調整卓は、複数の音声信号入力部2a,2b,…2nと、各音声信号入力部2a,2b,…2nから入力された音声信号を所定の周波数特性及びレベル、直接音比、各音声信号の混合バランスに調整する複数の音声信号調整部3a,3b,…3nと、各音声信号調整部3a,3b,…3nにより調整処理済みの音声信号を混合する音声信号混合部4と、音声信号混合部4により混合された音声信号を出力する音声信号出力部5を有する。
【0022】
音声信号入力部2a,2b,…2nは、マイクやCDなどの再生機器等の音源となる複数の入力機器1a,1b,…1nに接続され、これらの入力機器1a,1b,…1nが出力した音声信号が入力される。例えば、放送スタジオにおいては、男性アナウンサー、女性アナウンサー、複数のコメンテーターの音声など、また、バンド演奏の録音スタジオにおいては、ボーカルとその他の楽器の音声などが、各チャンネルの音声信号A、音声信号B、…音声信号Nとして、それぞれ音声信号入力部2a,2b,…2nに入力される。なお、入力機器として1a,1b,…1nとして、再生機器を使用した場合、再生機器は音声信号A、音声信号B、…音声信号Nを出力するのみである。
【0023】
音声信号調整部3a,3b,…3nは、各音声信号入力部2a,2b,…2nから入力された音声信号を検出し、所定の周波数特性に調整する。音声信号調整部3a,3b,…3nは、例えば、パラメトリックイコライザ(PEQ)であり、入力された音声信号の周波数特性が均一になるように、又は、音楽的に好適な周波数になるように中心周波数、等価量、Q値(Quality Factor)などの設定パラメータを調整する。また、出力レベル(ゲイン)、直接音と間接音の比率、ダイナミクス、各音声信号の混合バランスなどについても、その設定パラメータに基づいて、各音声信号の特性を調整したり、混合された出力音声の特性を調整する。音声信号混合部4は、各音声信号調整部3a,3b,…3nにより調整処理済みの音声信号を混合する。音声信号出力部5は、音声信号混合部4により混合された音声信号をスピーカや録音機器、生放送の場合にはテレビやラジオの送信機などの出力機器に出力する。
【0024】
本実施形態において、主要部の構成として、情報入力部7、情報セット生成部11、保存用キーワード生成部12、記憶部13、検索用キーワード生成部14、情報セット検索部15及び調整制御部20を備える。また、音声信号調整部3a,3b,…3nによる音声調整処理後の信号を解析して、その解析結果に応じて音声調整用のパラメータの補正などを自動的に実施するために、出力レベル検出部16、ゲインリダクション値検出部17、直接音と間接音のバランス比較部18及び混合バランス比較部19を有する。
【0025】
[1-2.主要部の構成]
[1-2-1.情報入力部7]
情報入力部7は、3種類の情報、すなわち、音声調整卓に接続された機器に関する情報と、機器に入出力された音声信号に関する情報と、音声信号調整部3a,3b,…3nにより音声信号に対して実施された音声調整のパラメータに関する情報を入力する。そのため、情報入力部7は、機器・音声信号・パラメータ情報入力部8を有する。
【0026】
機器・音声信号・パラメータ情報入力部8に情報を入力する方法としては、各種の情報を一覧表やCSVなどのデータ形式によって読み込む、あらかじめフォーマットを定めておいてそれに従って手作業やソートプログラムによって整理して読み込むなど、公知の方法を適宜使用できる。また、後述する番組進行表のような形で、3種類の情報に加えて、番組の経時的変化に関する情報も含めて読み込んだり、音声調整時に生じたアラームやオペレータのコメントなどの他の情報も読み込むこともできる。
【0027】
音声調整卓に接続された機器に関する情報には、マイクやスピーカ、VTR・CD、外線電話などの入力機器1a,1b,…1n,出力機器6の特性、データのフォーマット、BIT数、サンプリング周波数、楽器種別などが含まれる。
【0028】
機器に入出力された音声信号に関する情報には、音声調整卓に接続された機器の使用者に関する情報、音声信号の収録に関する情報が含まれる。例えば、次のようなものがある。
(1) 番組制作時に関する情報
・音声調整のパラメータの種別やその値
・オペレータが調整しなおしたパラメータの最適値
・キューシート
・番組コメント
・制作日時
・使用マイク
・出演者、収録場所
【0029】
(2) 音声信号の収録に関する情報
・録音日などの環境条件など(季節、天気、気温、湿度、場所、屋内・屋外、緯度、海抜など)
・録音の条件など(スタジオ、ライブハウス、ホール、人の入り)
・セッティング(人数、マイク位置など)
【0030】
(3) 使用者に関する情報
・使用する人(プロ・アマ、男性・女性、年代、アナウンサーの体調)
・録音したエンジニア
【0031】
(4) 放送局で求められる、複数のアナウンサーコメント、音楽、VTR、BGMなどに関する情報、例えば、曲名、作曲者、演奏者、製作者、解像度などの音声以外の音源に関する情報
【0032】
音声調整のパラメータに関する情報には、各種パラメータの種別や値、パラメータを設定したオペレータに関する情報、パラメータ設定時にオペレータにより或いは自動的に生成され、出力されたアラームに関する情報が含まれる。具体的には、次のようなパラメータの種別とその値について、本実施形態の音声調整卓がどのような処理を行うかの情報が含まれる。
【0033】
(1)マイクゲイン設定
・マイクの種類により最適なゲインを設定する。
・マイク+アナウンサーなどの条件で初期値を設定する。
・信号処理部の入力のレベルを監視し、その平均値とヘッドルームより最適ゲインを決定し微調整していく。
【0034】
(2)フィルタ設定
・マイクの種類により最適なカットオフ周波数を設定する。
・環境条件より最適な周波数を設定する。
【0035】
(3)イコライザ設定
・入力信号のFFTとリファレンスのFFTを比較し周波数特性がそろうようにEQの設定値を決定する。
・リファレンスは本実施形態の調整結果以外に、指定したエンジニアの設定も使用できる。
【0036】
(4) コンプレッサ設定
・現在のコンプレッサのゲインリダクション値とリファレンスのゲインリダクション値を比較し特性がそろうようにコンプレッサの設定値を決定する。
・リファレンスは本実施形態の調整結果以外に、指定したエンジニアの設定も使用できる。
【0037】
(5) フェーダ設定
・一人でしゃべる時、アナウンサーの声量によりフェーダを調整する。
・キューシートに合わせてBGレベルへの制御を可能とする。
・しゃべり始めでCDなどの音源を自動的にBGレベルにする。
【0038】
(6)エフェクタ設定(リバーブ)
・現在の音源の直接音と間接音のバランスとリファレンスの直接音と間接音のバランスを比較し、特性がそろうように設定値を決定する。
【0039】
[1-2-2.情報入力部7に対する進行表の入力]
情報入力部7は、音声信号調整部3a,3b,…3nが音声調整を実施する対象となる番組の進行表を受け入れる進行表入力部9を備える。すなわち、図2は、番組進行表の一例であって、そこには、番組の進行に伴って使用されるマイクと、その使用者(キャスター、コメンテイター、ゲスト)、マイクレベル、VTR音声、VTRレベル、BGM音声、BGMレベル、その他(コメントなど)が、経時的に記載されている。進行表入力部9は、例えば、このような形式の進行表を読み込むものである。なお、進行表の形式は図2のものに限定されず、EDLリストなど、他の形式のものも使用できる
【0040】
進行表の入力は、主として新たな音声調整を実施する場合に、対象となる音声調整卓に接続された機器に関する情報と、機器に入出力された音声信号に関する情報の入力のために実行される。その理由は、通常進行表には、音声調整のパラメータやその値を記入されていないからである。しかし、図2の進行表のように、番組進行と、その際の音声調整のパラメータに関する情報(図2のマイクレベル、VTRレベル、BGMレベル)が紐付けられて残されている場合には、教師データとなる情報セットの作成時における各情報の読み込みに使用することもできる。
【0041】
情報入力部7は、進行表入力部9に入力された進行表に記載された情報の中から、音声調整卓に接続された機器に関する情報と、機器に入出力された音声信号に関する情報と、番組進行の経時的変化を紐づけて抽出する番組進行状況抽出部10を備える。すなわち、図2のような進行表は、一覧表の形で用意されることが一般的であるため、その中に含まれている各種の情報は、本実施形態における3種類の情報に分けて整理されていない。そこで、番組進行状況抽出部10は、別途用意した辞書ファイルやソートプログラムなどを使用して、進行表に記載された情報中から、音声調整卓に接続された機器に関する情報と、機器に入出力された音声信号に関する情報を抽出する。同時に、番組進行に伴う経時的変化、例えば、表2におけるシーン番号と、番組開始時を基準とした各シーンの開始時間などの番組の経時的変化を確認できる情報も進行表から抽出する。
【0042】
[1-2-3.情報セット生成部11]
情報セット生成部11は、音声信号に対して実施された音声調整のパラメータに関する情報を含むように、情報入力部7に入力された各情報を互いに紐づけて1つの情報セットを生成する。本実施形態では、新たに音声調整を実施する場合に、作成された情報セットを教師データとして、必要とする新たな音声調整のパラメータとその値を自動的に取得する。そのため、新たに音声調整を実施する際の各機器や音声信号に関する情報を、教師データに含まれている各種の情報と比較して、最適な教師データを呼び出す必要がある。
【0043】
情報入力部7に入力された各種の情報は、入力されたデータ形式や入力方法によって必ずしも3種類の情報を均等に包含しているものではなく、教師データに必要な音声調整のパラメータに関する情報が欠落しているものもある。本実施形態では、情報セット生成部11により、新たな音声調整に不可欠な音声調整のパラメータに関する情報を含むように、3種類の情報を紐づけて、検索によって抽出可能な1つの情報セットを生成する。
【0044】
情報セット生成部11としては、いわゆる成長型の教師データとして、情報セットを生成するものを使用することができる。すなわち、情報セットを構成する3種類の情報には種々のものが含まれていることから、その情報が情報入力部7に入力された時点においては、音声調整処理に必要なものか否かが明確でないものも存在する。本実施形態においては、情報セット生成部11を生成する場合に、入力された情報をカットすることなくそのまま各情報セットに保存しておく。
【0045】
すなわち、従来の検索エンジンでは、生成された情報セットに含まれる言葉や値を直接検索用キーワードとすると処理する情報が膨大になることから、従来のAIタイプの検索装置では、情報セットの生成時に情報セットに含まれている各情報をオペレータや検索エンジンの作成者が適宜抽出している。そのため、入力時には情報セットに含まれていた一見すると無価値な情報が削除された状態で情報セットが生成され、記憶部に保存される。しかし、情報が蓄積されていくにつれ、ある時点では無価値と思われていた情報が多量に発生し、それが音声調整を実施する場合に重要になることも想定される。
【0046】
そのようなことを想定して、本実施形態では、情報セットには入力された各情報を極力削除することなくできる限り保存しておく。その代わりに、後述する保存用キーワード生成部12により、検索スピードを向上させるためのキーワードを各情報セットについて生成する。その結果、情報セットが多数蓄積され、当初は無価値と思われた情報が蓄積され、検索にあたって有意義なものに変化した場合であっても、保存用キーワード生成部12によって保存用キーワードの再構築を実施することにより、情報セットの更新、すなわち教師データを成長させることができる。
【0047】
もちろん、情報入力部7に入力される情報には、前記の3種類の情報以外にも教師データに反映させる必要のないデータも含まれることがあり、そのようなデータについては、適当なフィルタや辞書ファイルなどを使用することで、削除したり、あるいはオペレータなどにアラームを通知してもよい。
【0048】
[1-2-4.保存用キーワード生成部12]
保存用キーワード生成部12は、情報入力部7に入力された各情報及び/又は情報セット生成部11によって生成された各情報セットに含まれる各情報に関する複数の値を所定の基準で抽出し、抽出された各値をその情報セットの保存用キーワードとして設定する。すなわち、入力された3種類の情報に含まれている単語や値は膨大な数となるため、それらの単語や値をキーワードとすることは検索効率の上から好ましくない。本実施形態では、入力された3種類の情報を、辞書ファイルやソートプログラムにより上位概念化したり、数値などについては一定の範囲に区分けや平均化したりすることで、単純化された保存用キーワードを生成する。例えば、BGMの種類を各情報に含まれている曲目を参照してポップスとクラッシックに上位概念化したり、個々のアナウンサーやMCを女性と男性に分別したり、更には、パラメータの値を四捨五入するなどの演算処理を実行することで、保存用キーワードを生成する。
【0049】
保存用キーワードの生成は、情報セットの生成時にのみ実施されるものではなく、前記のように情報セットが成長型の教師データとして機能するため、一定の基準、例えば、保存用キーワード生成部12に組み込まれたプログラムにより定期的に、あるいはオペレータの指示などに従って、逐次実施される。このように、保存用キーワード生成部12が各情報セットに付与するキーワードが変化することにより、検索時に抽出される情報セットが入力される各情報の変化に追従することができる。例えば、新人のアナウンサーや新たなマイク、音源など、最初に入力された時点では情報量がほとんどなく、通常の検索エンジンではキーワードとなり得ないような情報でも、本実施形態では、入力された生の情報を情報セットに保存しておき、定期的に保存用キーワードを見直すことで、情報量が蓄積された場合に検索対象として抽出が可能となる。
【0050】
[1-2-5.検索用キーワード生成部14]
検索用キーワード生成部14は、音声信号調整部3a,3b,…3nが音声調整を実施する際に情報入力部7に入力された、音声調整卓に接続された機器に関する情報と、機器に入出力された音声信号に関する情報の少なくとも一つ又はその組み合わせの中から、各情報に関する複数の値を所定の基準で抽出し、抽出された各値をその情報の検索用のキーワードとして設定する。すなわち、検索用キーワードについても、保存用キーワードと同様の理由により、本実施形態では、入力された3種類の情報を、辞書ファイルやソートプログラムにより上位概念化したり、数値などについては一定の範囲に区分けや平均化したりすることで、単純化された保存用キーワードを生成する。
【0051】
[1-2-6.情報セット検索部15]
情報セット検索部15は、検索用キーワードと保存用キーワードを用いて記憶部13内に保存された情報セットを検索し、検索用キーワードと保存用キーワードとが所定の基準で一致した情報セットを抽出する。すなわち、記憶部13に記憶されている情報セットは、教師データが蓄積されて行くに従い、膨大な数となるため、記憶部13内に保存された情報セットを検索した場合に、多量の情報セットが抽出される可能性がある。
【0052】
本実施形態では、所定の基準を設けることで、抽出する情報セットの最適化を図っている。例えば、抽出された情報セットの中から、最新の情報セット、経験値の高いオペレータが実施した音声調整、検索用と保存用のキーワードが一致した数、キーワードの持つ重み付けなどの基準で、最適な情報セットを一つ抽出する。
【0053】
情報セット検索部15において複数の情報セットを抽出することも可能であり、その場合は、抽出された複数の情報セットのデータを調整制御部20に出力し、調整制御部20において平均化その他の演算処理を実施することで、最適な音声調整用のパラメータとその値を決定する。
【0054】
進行表を入力することによって新たな音声調整を実施する場合は、情報セット検索部15は、検索用キーワードと保存用キーワードとが所定の基準で一致した情報セットを、番組の経時的変化に合わせて、複数抽出する。すなわち、番組進行の経時的変化に伴って、演目や出演者、使用機器など刻々と変化し、音声調整のパラメータやその値も異なるものが要求される。本実施形態では、それらの変化に対応した異なる情報セットを抽出する。
【0055】
[1-2-7.調整制御部20]
調整制御部20は、情報セット検索部15によって抽出された情報セットに含まれる音声調整のパラメータに関する情報を取得し、音声信号調整部3a,3b,…3nに対して取得されたパラメータに基づいて音声調整を実施させる。調整制御部20は、複数の情報セットが抽出された場合、複数抽出された情報セットに含まれる複数の音声調整のパラメータを演算処理して、その演算結果として得られたパラメータに基づいて、音声信号調整部3a,3b,…3nに音声調整を実施させる。演算処理の方法としては、平均化、中央値選択、重み付けなどが使用できるが、その他の方法でも良い。
【0056】
調整制御部20は、入力された進行表に従って経時的に異なる情報セットの検索を行った場合、抽出された異なる情報セットに含まれる音声調整のパラメータに基づいて、番組進行の経時的変化に従って異なる音声調整を実施させる。これにより、番組のシーンごとに適切な音声調整が可能となる。
【0057】
[1-2-8.記憶部13]
記憶部13は、各情報セットとそのキーワードを紐づけて保存する。それに加えて、本実施形態の他の部分に入力された情報や、他の部分が生成した各種のデータを保存する。新たな音声調整を行った際に、本実施形態の音声調整卓が生成した新たなパラメータとその値を、各種情報と紐づけて、教師データとして保存することもできる。また、決定された新たなパラメータとその値、更にはアラームなどを、オペレータや出演者が検証できるように、記憶した内容をリストや進行表の形で出力することも可能である。さらに、オペレータが自分で設定したパラメータなども、記憶部13に保存される。
【0058】
[1-3.自動化のための構成]
[1-3-1.出力レベルの検出]
出力レベル検出部16は、調整制御部20の指示に基づいて、取得されたパラメータに基づいて音声信号調整部3a,3b,…3nが入力された音声信号に対する調整処理を実施し、調整処理後の信号レベルが一定以上低くなっているかを検出する。出力レベル検出部16は、調整処理後の信号レベルがあらかじめ設定された閾値よりも低い場合に、音声信号入力部2a,2b,…2nに対する音声信号の入力異常を知らせる機能を有する。例えば、適切でないマイクセッテング(オフマイクの場合や、距離、角度などが不適切な場合)、声質、障害などにより、調整処理後の信号レベルが一定以上低くなっている場合に、アラームを出力する。
【0059】
出力レベル検出部16は、調整処理後の信号レベルがあらかじめ設定された閾値よりも低い場合、或いはあらかじめ設定された閾値よりもに高い場合に、自動的に適切な信号レベルを調整する機能を有する。その一つとして、閾値から外れた信号レベルの基礎になった情報セットのパラメータの代わりに、複数の情報セットのパラメータを平均化したり、中央値を取るなどの手法で演算処理することにより、より妥当な新たなパラメータを得る方法がある。その場合、出力レベル検出部16は、複数の機器に入出力された音声信号に関する情報の中から、調整処理を実施した音声信号と共通する検索用キーワードを有する機器に入力された音声信号に関する情報と、調整処理を実施した音声信号の出力レベルに関する情報とが紐づけられた複数の情報セットを検索し、その検索結果を調整制御部20に出力する。
【0060】
調整制御部20は、抽出された複数の情報セットに含まれている音声信号の出力レベルに関する情報を平均化その他の演算処理して、演算結果として得られた出力レベルとなるように、調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて音声信号調整部3a,3b,…3nに音声調整を実施させる。
【0061】
出力レベルを自動的に補正する他の手法としては、複数の情報セットのパラメータを演算処理する手法の代わりに、或いは演算処理の手法と併用して、例えば、次のようなものも採用できる。すなわち、各音声信号調整部3a,3b,…3nから入力された音声信号のレベルが、予め設定された閾値以下の場合にはそのレベル値を、音声信号のレベル値が閾値を超えた場合にはその音声信号の閾値を音声信号のレベル値とし、各音声信号のレベル値の総和に基づいてゲインシェア係数を算定し、そのゲイン係数に基づいて音声調整用のパラメータを補正する。
【0062】
[1-3-2.ゲインリダクション値検出部17]
調整処理後の音声信号に関するコンプレッサのゲインリダクション値を検出するゲインリダクション値検出部17を備える。ゲインリダクション値検出部17は、調整処理後のゲインリダクション値があらかじめ設定された閾値から外れている場合に、複数の機器に入出力された音声信号に関する情報の中から、調整処理を実施した音声信号と共通する検索用キーワードを有する機器に入力された音声信号に関する情報と、調整処理を実施した音声信号についてのゲインリダクション値に関する情報とが紐づけられた複数の情報セットを検索する。
【0063】
この場合、調整制御部20は、抽出された複数の情報セットに含まれている調整処理を実施した音声信号のゲインリダクション値に関する情報を演算処理し、演算結果として得られたゲインリダクション値となるように、閾値から外れたゲインリダクション値を補正したパラメータに基づいて音声信号調整部3a,3b,…3nに音声調整を実施させる。
【0064】
[1-3-3.直接音と間接音のバランス比較部18]
バランス比較部18は、調整処理後の音声信号の直接音と間接音を比較して、調整処理後の直接音と間接音のバランスがあらかじめ設定された閾値から外れているか否かを検出する。閾値から外れている場合に、バランス比較部18は、複数の機器に入出力された音声信号に関する情報の中から、調整処理を実施した音声信号と共通する検索用キーワードを有する機器に入力された音声信号に関する情報と、調整処理を実施した音声信号についての直接音と間接音のバランスに関する情報とが紐づけられた複数の情報セットを検索する。
【0065】
この場合、調整制御部20は、抽出された複数の情報セットに含まれている調整処理を実施した音声信号の直接音と間接音のバランスに関する情報を演算処理し、演算結果として得られたバランスとなるように、調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて音声信号調整部3a,3b,…3nに音声調整を実施させる。例えば、直接音を、抽出した情報セットに含まれている任意のインパルスデータで畳み込み、この特性になるように間接音のデレイやリバーブタイムを調整する。
【0066】
[1-3-4.複数の音声信号の混合バランス比較部19]
音声信号混合部4は、調整処理後の複数の音声信号の混合バランスを比較する混合バランス比較部19を備える。混合バランス比較部19は、複数の機器に入出力された音声信号に関する情報の中から、調整処理を実施した音声信号と共通する検索用キーワードを有する機器に入力された音声信号に関する情報と、調整処理を実施した複数の音声信号を音声信号混合部4が混合した際の混合バランスに関する情報とが紐づけられた複数の情報セットを検索する。
この場合、調整制御部20は、抽出された複数の情報セットに含まれている混合バランスに関する情報を演算処理し、その演算結果として得られた混合バランスとなるように、調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて音声信号調整部3a,3b,…3nに音声調整を実施させる。
【0067】
なお、混合バランス比較部19におけるパラメータの補正にあたっても、前記出力レベルの自動調整と同様に、複数の情報セットのパラメータを演算処理する手法の代わりに、或いは演算処理の手法と併用して、例えば、次のようなものも採用できる。すなわち、各音声信号調整部3a,3b,…3nから入力された音声信号の混合バランスが、予め設定された閾値以下の場合にはその混合比を、音声信号の混合バランスが閾値を超えた場合にはその音声信号の閾値を音声信号の混合比とし、各音声信号の混合比の総和に基づいて混合バランスを算定し、その混合バランスに基づいて音声調整用のパラメータを補正する。
【0068】
[1-3-5.EQ・FIL検出部21]
EQ・FIL検出部21は、調整処理後の音声信号に対するイコライジング効果やフィルタ処理効果を検出して、調整処理後の効果があらかじめ設定された閾値から外れているか否かを検出する。閾値から外れている場合に、EQ・FIL検出部21は、複数の機器に入出力された音声信号に関する情報の中から、調整処理を実施した音声信号と共通する検索用キーワードを有する機器に入力された音声信号に関する情報と、調整処理を実施した音声信号についてのイコライジング効果やフィルタ処理効果に関する情報とが紐づけられた複数の情報セットを検索する。
この場合、調整制御部20は、抽出された複数の情報セットに含まれているイコライジング効果やフィルタ処理効果に関する情報を演算処理し、その演算結果として得られたイコライジング効果やフィルタ処理効果となるように、調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて音声信号調整部3a,3b,…3nに音声調整を実施させる。
【0069】
[2.作用効果]
前記のような構成を有する実施形態によれば、次のような効果が発揮される。
【0070】
[2-1.基本的な作用効果]
(1)情報入力部7は、音声調整卓に接続された機器に関する情報と、機器に入出力された音声信号に関する情報と、音声信号調整部3a,3b,3nにより音声信号に対して実施された音声調整のパラメータに関する情報を入力する。すなわち、音声調整に当たっては、マイクなどの音源、出力側のスピーカや録音機器などの数や配置、機器自体の特性、出力された音声の用途など、音声調整卓に接続された機器に関する情報が必要である。また、音声調整の対象となる音声信号がどのような演目や出演者によって演じられたか、入力或いは出力される場所や環境であるか、人間の声か楽器やCD等の他の音源か、更には主たる音声かBGMかなどによって、音声調整のパラメータも異なる。
【0071】
本実施形態では、これらの音声調整卓に接続された機器に関する情報と、機器に入出力された音声信号に関する情報との組み合わせと、更にそのような組み合わせに対してオペレータや自動音声調整装置が音声調整を実施した際のパラメータを互いに紐づけて一つの情報セットとして保存する。そのため、記憶部13には、過去の音声調整に関する情報が多数蓄積されることになり、新たに音声調整を実施する際には、調整対象の音声信号の種別や状態と、その音声信号を入出力する機器に関する情報を音声調整卓に与えるだけで、過去に実施された音声調整と同様な音声調整を自動的に実施することができる。
【0072】
その結果、音声調整卓のライブラリ機能をAI化することで、適切な設定を呼び出すことが可能になる。また、多くのオペレータのノウハウ(例えば、視聴者にとって聞きやすい声など)を蓄積することにより、番組の品質のさらなる安定化を実現する。さらに、蓄積された多数の情報セットを解析し、統計化することで音声調整技術の見える化が可能となり、人材育成やアーカイブなどに有効である。これにより、番組品質の安定した視聴者サービスを確保しつつ、制作スタッフの働き方改革を実現しながらも、番組の制作効率を向上させることができる。
【0073】
(2)本実施形態では、情報セット生成部11によって生成された各情報セットに含まれる各情報に関する複数の値を所定の基準で抽出し、抽出された各値をその情報セットの保存用キーワードとして設定する保存用キーワード生成部12を備える。そのため、放送局などで日々実施されている多量の番組に関する情報と、その情報に関連して実施された音声調整のパラメータなどの情報とを自動的に抽出して保存用キーワードを作成できる。その結果、AIによる検索システムを構築するために必要な多量の教師データを容易に作成できる。
【0074】
(3)音声信号調整部3a,3b,…3nが音声調整を実施する際に情報入力部7に入力された各情報について、その情報が有する複数の値を所定の基準で抽出し、抽出された各値をその情報の検索用のキーワードとして設定する検索用キーワード生成部14を有する。
そのため、使用する機器の一覧表、出演者の名簿、番組進行表などの通常使用されている資料に記載された名称や数値などから、検索用キーワードを自動的に生成することができる。その結果、放送局などで日々実施されている多量の番組に関する情報の中から検索用キーワードを自動的に抽出することが可能となり、新たに音声調整を実施する場合に、人手によって検索用キーワードを選定して音声調整卓に入力する必要がなくなり、新たな音声調整に要する手間が削減される。
【0075】
(4)音声調整を行う場合、同じ出演者や演目であっても、使用機器の特性によって音声調整のパラメータは異なってくるが、本実施形態では、音声調整卓に接続された機器に関する情報として、マイクやスピーカなどの入力機器1a,1b,…1n,出力機器6の特性、データのフォーマット、BIT数、サンプリング周波数、楽器種別などについてもパラメータ決定の参考とするため、入力機器1a,1b,…1n,出力機器6に合わせた最適な音声調整を実施できる。
【0076】
(5)音声信号に関する情報には、音声調整卓に接続された機器の使用者に関する情報、音声信号の収録に関する情報が含まれているので、出演者の種類や性別、演目、使用されたスタジオやホールなどの環境など、入力される音声信号に付随する各種の情報を適宜登録或いは呼び出して使用することができる。特に、放送局で求められる、複数のアナウンサーコメント、音楽、VTRなどの複数音源を混合する際にも本実施形態を適用することができる。その結果、音声調整において必要とされる様々な要素を漏れなく総合的に反映させた音声調整を自動的に実施すること可能となり、経験の少ないオペレータであっても、熟練者に劣らない音声調整を実施することができる。
【0077】
(6)音声調整のパラメータに関する情報には、各種パラメータの種別や値、パラメータを設定したオペレータに関する情報、パラメータ設定時にオペレータにより或いは自動的に生成されたアラームに関する情報が含まれているので、音声調整時に設定されたパラメータの値だけでなく、そのパラメータがどのような状況で、どのようなオペレータによって設定されたものであるかを確認することが可能となる。その結果、新たなパラメータ値の設定や、設定されたパラメータ値の補正にあたって、各種の情報を参照することにより、より適切な指針を得ることができる。
【0078】
特に、音声調整のパラメータに関する情報として、従来の音声調整で採用されていたパラメータ(例えば、レシオ、スレッシュホールド、アタック、リリース、周波数など)に加えて、主観的なパラメータ(例えばクリア、抜け、厚み、コメント強調、シニア音声など)を新たに使用することが可能となり、人間の感覚と一致するように音声調整をアシストできる。
【0079】
(7)情報セット検索部15は、検索用キーワードと保存用キーワードとが所定の基準で一致した情報セットを複数抽出し、抽出された複数の情報セットに含まれる複数の音声調整のパラメータを演算処理して、その演算結果として得られたパラメータに基づいて調整制御部が音声調整を実施する。そのため、単一の情報セットのみを抽出した場合は、保存用キーワードと検索用キーワードとの一致度が高くても、不一致部分がパラメータ選定にあたって大きな影響を与える場合があり、そのため最適なパラメータを選定することができない可能性もある。しかし、本実施形態のように、複数の情報セットに含まれているパラメータを平均化、中央値採択、出演者や演目、過去のオペレータの氏名について重み付けをするなどの手段で演算することで、極端なパラメータが選定される可能性が低くなり、高品質の音声調整が可能となる。
【0080】
(8)進行表に記載された情報中から、音声調整卓に接続された機器に関する情報と、機器に入出力された音声信号に関する情報と、番組進行の経時的変化を紐づけて抽出する番組進行状況抽出部10を備えている。また、情報セット検索部15は、進行表入力部9から入力された番組進行の経時的変化に対応して、異なる情報セットを抽出するものである。そのため、番組進行の経時的変化に従って出演者や演目、入力機器1a,1b,…1n,出力機器6が異なった場合であっても、番組進行に合わせて異なる情報セットを自動的に選択することにより、オペレータが操作しなくても、番組進行に応じた適切な音声調整が自動的に実施できる。
【0081】
[2-2.自動化ための構成による作用効果]
(9)出力レベル検出部16は、調整処理後の信号レベルがあらかじめ設定された閾値よりも低い場合に、音声信号入力部2a,2b,…2nに対する音声信号の入力異常を知らせる機能を有するので、オペレータは、音声調整卓に接続されている各機器の状態や各機器を使用している出演者をチェックして、入力異常の原因を容易に発見することができる。
【0082】
(10)出力レベル検出部16は、抽出された複数の情報セットに含まれている音声信号の出力レベルに関する情報を演算処理して、その演算結果として得られた出力レベルとなるように、調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて音声信号調整部3a,3b,…3nに音声調整を実施させる。
【0083】
そのため、ある特定の情報セットに基づいて音声調整をした結果が出力レベルの低下に繋がったとしても、同様な複数の情報セットを抽出して、それらの情報セットに含まれているパラメータを平均化したり、中央値をとるなどの演算処理を行うことで、新たなパラメータを生成することができる。その結果、パラメータを補正することが可能になり、このような処理を繰り返すことにより、音声信号の出力レベルを適正な状態に自動的に修正することが可能になる。
【0084】
(11)ゲインリダクション値検出部17は、抽出された複数の情報セットに含まれている調整処理を実施した音声信号のコンプレッサのゲインリダクション値に関する情報を演算処理して、その演算結果として得られたゲインリダクション値となるように、閾値から外れたゲインリダクション値を補正したパラメータに基づいて音声信号調整部3a,3b,…3nに音声調整を実施させる。
【0085】
そのため、ある特定の情報セットに基づいて音声調整をした結果、コンプレッサのゲインリダクション値が閾値から外れることになったとしても、同様な複数の情報セットを抽出して、それらの情報セットに含まれているゲインリダクション値を平均化したり、中央値をとるなどの演算処理を行うことで、新たなゲインリダクション値を生成することができる。その結果、新たなゲインリダクション値に基づいてパラメータを補正することが可能になり、このような処理を繰り返すことにより、音声信号のパラメータを適正な状態に自動的に修正することが可能になる。
【0086】
(12)バランス比較部18は、調整処理後の直接音と間接音のバランスがあらかじめ設定された閾値から外れている場合に、調整処理を実施した音声信号の直接音と間接音のバランスに関する情報を演算処理して、その演算結果として得られたバランスとなるように、調整処理を実施したパラメータを補正し、補正されたパラメータに基づいて音声信号調整部3a,3b,…3nに音声調整を実施させる。
【0087】
そのため、ある特定の情報セットに基づいて音声調整をした結果、直接音と間接音のバランスがあらかじめ設定された閾値から外れることになったとしても、同様な複数の情報セットを抽出して、それらの情報セットに含まれている直接音と間接音のバランスを平均化したり、中央値をとるなどの演算処理を行うことで、新たな直接音と間接音のバランスを生成することができる。その結果、直接音と間接音のバランスを補正することが可能になり、このような処理を繰り返すことにより、音声信号の直接音と間接音のバランスを適正な状態に自動的に修正することが可能になる。
【0088】
(13)混合バランス比較部19は、調整処理を実施した複数の音声信号を音声信号混合部4が混合した際の混合バランスに関する情報と紐づけられた複数の情報セットを検索し、抽出された複数の情報セットに含まれている混合バランスに関する情報を平均化したり、中央値を取るなどして、音声混合時に使用する混合バランスを得る。そのため、音声調整処理に加えて、処理後の音声信号の混合する際にも蓄積された情報を利用して適切な混合バランスを得ることができ、音声調整から音声混合までの一連の処理を自動化することができる。
【0089】
(14)EQ・FIL検出部21は、調整処理後の音声信号に対するイコライジング効果やフィルタ処理効果があらかじめ設定された閾値から外れている場合に、複数の情報セット抽出し、それらに含まれているイコライジング効果やフィルタ処理効果に関する情報を演算処理して、その演算結果に基づいてパラメータを補正する。そのため、音声信号調整部3a,3b,…3nは補正されたパラメータに基づいて、イコライザやフィルタに対する制御を行うことで、適切なイコライジング効果やフィルタ処理効果を自動的に得ることができる。
【0090】
[3.他の実施形態]
本発明は、前記の実施形態に限定されるものではなく、次のような他の実施形態も包含する。
(1)実施形態では情報セット生成部11、保存用キーワード生成部12、検索用キーワード生成部14は、音声調整卓が自動的に情報セット、各キーワードを生成するようにしたが、それに加えて、人手によって情報セット、各キーワードを生成してもよい。
【0091】
(2)情報セットを、音声調整卓に接続された機器に関する情報と、機器に入出力された音声信号に関する情報と、音声信号調整部3a,3b,3nにより音声信号に対して実施された音声調整のパラメータに関する情報に基づいて生成しているが、これらの情報に加えて、オペレータのコメントや第三者の評価など、情報入力部7に他の情報を入力しておき、それに基づいて情報セットの生成や検索を実施してもよい。
【0092】
(3)教師データとしては、実施形態に記載したタイプの成長型以外に、情報セット生成部11及び保存用キーワード生成部12に与える条件を適宜設定することにより、特定条件成長型や単純成長型のものを使用することができる。
【符号の説明】
【0093】
1a,1b,1n…入力機器
2a,2b,2n…音声信号入力部
3a,3b,3n…音声信号調整部
4…音声信号混合部
5…音声信号出力部
6…出力機器
7…情報入力部
8…機器、音声信号、パラメータ情報入力部
9…進行表入力部
10…番組進行状況抽出部
11…情報セット生成部
12…保存用キーワード生成部
13…記憶部
14…検索用キーワード生成部
15…情報セット検索部
16…出力レベル検出部
17…ゲインリダクション値検出部
18…直接音と間接音のバランス比較部
19…混合バランス比較部
20…調整制御部
21…EQ・FIL検出部

図1
図2