(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024006206
(43)【公開日】2024-01-17
(54)【発明の名称】音信号処理方法及び音信号処理装置
(51)【国際特許分類】
H04R 3/00 20060101AFI20240110BHJP
【FI】
H04R3/00
【審査請求】未請求
【請求項の数】24
【出願形態】OL
(21)【出願番号】P 2022106886
(22)【出願日】2022-07-01
(71)【出願人】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】110000970
【氏名又は名称】弁理士法人 楓国際特許事務所
(72)【発明者】
【氏名】相馬 圭一郎
(72)【発明者】
【氏名】今井 新
(72)【発明者】
【氏名】野中 剛
(72)【発明者】
【氏名】岡林 昌明
(72)【発明者】
【氏名】高橋 祐
(72)【発明者】
【氏名】寺田 光太郎
(72)【発明者】
【氏名】石塚 健治
【テーマコード(参考)】
5D220
【Fターム(参考)】
5D220EE05
5D220EE21
5D220EE41
(57)【要約】
【課題】 ミキサエンジニアが手動でパラメータ調整を行う場合と同様のパラメータを、低計算負荷で自動的に求めることが出来る音信号処理方法、又は、ミキサエンジニアが、手動でチャンネル間の音量バランスを取る場合と同様のパラメータを自動的に求めることが出来る音信号処理方法を提供することを目的とする。
【解決手段】 一実施形態に係る音信号処理方法は、ミキシング装置に備わる複数のチャンネルの中から少なくとも1つの第1チャンネルを選択する操作を受け付けて、選択された第1チャンネルの音信号を入力し、入力された音信号に基づく時系列の音量データ、又は、複数のチャンネルのうち第1チャンネルとは異なる第2チャンネルに関するデータに基づいて、ミキシング装置に設定するためのセッティングデータを特定し、特定した前記セッティングデータを出力する。
【選択図】
図5
【特許請求の範囲】
【請求項1】
ミキシング装置に備わる複数のチャンネルの中から少なくとも1つの第1チャンネルを選択する操作を受け付けて、
選択された前記第1チャンネルの音信号を入力し、
入力された前記音信号に基づく時系列の音量データ、又は、前記複数のチャンネルのうち前記第1チャンネルとは異なる第2チャンネルに関するデータに基づいて、前記ミキシング装置に設定するためのセッティングデータを特定し、
特定した前記セッティングデータを出力する、
音信号処理方法。
【請求項2】
前記音信号のサンプリング周波数を低下する、又は、前記音信号の量子化ビット数を減少することで、前記時系列の音量データを取得する、
請求項1に記載の音信号処理方法。
【請求項3】
前記ミキシング装置は、前記時系列の音量データに基づいて前記入力された前記音信号のレベルを表示する表示器を備える、
請求項1又は請求項2に記載の音信号処理方法。
【請求項4】
前記複数のチャンネルのそれぞれの音信号に対して行う信号処理のパラメータをシーンデータとしてメモリに記憶し、
前記メモリに記憶されているシーンデータを読み出すシーンリコールを受け付けて、
前記シーンリコールを受け付けた場合に、読み出した前記シーンデータに基づいて前記セッティングデータを特定する、
請求項1又は請求項2に記載の音信号処理方法。
【請求項5】
前記第1チャンネルの音信号の音源の種別を識別し、
前記識別した音源の種別に応じて前記セッティングデータを特定する、
請求項1又は請求項2に記載の音信号処理方法。
【請求項6】
前記ミキシング装置は、ユーザの操作を受け付ける複数の操作子を備えており、
複数のチャンネルは、第1チャンネル群及び第2チャンネル群を含み、
前記複数の操作子に、前記第1チャンネル群を割り当て、
前記第2チャンネルは、前記複数の操作子に割り当てられていない前記第2チャンネル群のチャンネルを含んでいる、
請求項1又は請求項2に記載の音信号処理方法。
【請求項7】
前記ミキシング装置は、
前記複数のチャンネルに入力する音信号のゲイン調整を行うヘッドアンプと、
前記複数のチャンネルに入力した音信号のレベル調整量を受け付けるフェーダと、
を備えており、
前記セッティングデータは、前記ヘッドアンプのゲイン又はフェーダで受け付けるレベル調整量を含んでおり、
前記ヘッドアンプのゲインは、前記時系列の音量データに基づいて特定され、
前記レベル調整量は、前記第2チャンネルに関するデータに基づいて特定される、
請求項1又は請求項2に記載の音信号処理方法。
【請求項8】
ユーザから前記セッティングデータの調整を受け付けた場合、前記セッティングデータの出力を停止し、且つ、前記ユーザから受け付けた前記セッティングデータを前記ミキシング装置に設定する、
請求項1又は請求項2に記載の音信号処理方法。
【請求項9】
前記ユーザから前記セッティングデータの調整を受け付けていないと判定した場合、前記セッティングデータの出力を再開する、
請求項8に記載の音信号処理方法。
【請求項10】
出力した前記セッティングデータに基づいて、前記セッティングデータの内容を表示器に表示する、
請求項1又は請求項2に記載の音信号処理方法。
【請求項11】
前記セッティングデータの内容を表示した後、前記セッティングデータを設定するか否かの操作を受け付けて、
前記セッティングデータを設定する操作を受け付けた場合、前記セッティングデータを前記ミキシング装置に設定する、
請求項10に記載の音信号処理方法。
【請求項12】
前記時系列の音量データと前記セッティングデータとの関係を学習済の第1学習済モデルを用いて、又は、前記第2チャンネルに関するデータと前記セッティングデータとの関係を学習済の第2学習済モデルを用いて前記セッティングデータを特定する、
請求項1又は請求項2に記載の音信号処理方法。
【請求項13】
複数のチャンネルの中から少なくとも1つの第1チャンネルを選択する操作を受け付け、
選択された前記第1チャンネルの音信号を入力し、
入力された前記音信号に基づく時系列の音量データ、又は、前記複数のチャンネルのうち前記第1チャンネルとは異なる第2チャンネルに関するデータに基づいて、自装置に設定するためのセッティングデータを特定し、
特定した前記セッティングデータを出力する、
処理を行うプロセッサを備えている、
音信号処理装置。
【請求項14】
前記プロセッサは、前記音信号のサンプリング周波数を低下する、又は、前記音信号の量子化ビット数を減少することで、前記時系列の音量データを取得する、
請求項13に記載の音信号処理装置。
【請求項15】
前記時系列の音量データに基づいて前記入力された前記音信号のレベルを表示する表示器を更に備えている、
請求項13又は請求項14に記載の音信号処理装置。
【請求項16】
前記複数のチャンネルのそれぞれの音信号に対して行う信号処理のパラメータをシーンデータとして記憶するメモリを更に備えており、
前記プロセッサは、
前記メモリに記憶されているシーンデータを読み出すシーンリコールを受け付けて、
前記シーンリコールを受け付けた場合に、読み出した前記シーンデータに基づいて前記セッティングデータを特定する、
請求項13又は請求項14に記載の音信号処理装置。
【請求項17】
前記プロセッサは、
前記第1チャンネルの音信号の音源の種別を識別し、
前記識別した音源の種別に応じて前記セッティングデータを特定する、
請求項13又は請求項14に記載の音信号処理装置。
【請求項18】
ユーザの操作を受け付ける複数の操作子を更に備えており、
複数のチャンネルは、第1チャンネル群及び第2チャンネル群を含み、
前記プロセッサは、前記複数の操作子に、前記第1チャンネル群を割り当て、
前記第2チャンネルは、前記複数の操作子に割り当てられていない前記第2チャンネル群のチャンネルを含んでいる、
請求項13又は請求項14に記載の音信号処理装置。
【請求項19】
前記複数のチャンネルに入力する音信号のゲイン調整を行うヘッドアンプと、前記複数のチャンネルに入力した音信号のレベル調整量を受け付けるフェーダと、を更に備えており、
前記セッティングデータは、前記ヘッドアンプのゲイン又はフェーダで受け付けるレベル調整量を含んでおり、
前記プロセッサは、
前記ヘッドアンプのゲインを前記時系列の音量データに基づいて特定し、
前記レベル調整量を前記第2チャンネルに関するデータに基づいて特定する、
請求項13又は請求項14に記載の音信号処理装置。
【請求項20】
前記プロセッサは、ユーザから前記セッティングデータの調整を受け付けた場合、前記セッティングデータの出力を停止し、且つ、前記ユーザから受け付けた前記セッティングデータに基づいて設定を行う、
請求項13又は請求項14に記載の音信号処理装置。
【請求項21】
前記プロセッサは、前記ユーザから前記セッティングデータの調整を受け付けていないと判定した場合、前記セッティングデータの出力を再開する、
請求項20に記載の音信号処理装置。
【請求項22】
表示器を更に備えており、
前記表示器は、出力した前記セッティングデータに基づいて前記セッティングデータの内容を表示する、
請求項13又は請求項14に記載の音信号処理装置。
【請求項23】
前記プロセッサは、
前記セッティングデータの内容を前記表示器に表示した後、前記セッティングデータを設定するか否かの操作を受け付けて、
前記セッティングデータを設定する操作を受け付けた場合、前記セッティングデータを設定する、
請求項22に記載の音信号処理装置。
【請求項24】
前記プロセッサは、前記時系列の音量データと前記セッティングデータとの関係を学習済の第1学習済モデルを用いて、又は、前記第2チャンネルに関するデータと前記セッティングデータとの関係を学習済の第2学習済モデルを用いて前記セッティングデータを特定する、
請求項13又は請求項14に記載の音信号処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
この発明に係る一実施形態は、音信号処理方法及び音信号処理装置に関する。
【背景技術】
【0002】
特許文献1には、楽器から発せられる音を解析することによって当該楽器の種別を推測することと、推測した楽器を示すアイコンをタブレットの表示器に表示することと、が記載されている。
【0003】
特許文献2には、タブレット及びマイクが記載されている。タブレットは、マイクで入力したオーディオ信号を分析することによって楽器の種別を識別する。
【0004】
特許文献3には、イコライザ設定装置が記載されている。イコライザ設定装置は、イコライザにおける周波数特性の設定状態をグラフ表示する。イコライザ設定装置は、信号処理チャンネルに設定されているカテゴリに応じた音域を示す要素を表示する。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2017-073631号公報
【特許文献2】特開2021-125760号公報
【特許文献3】特開2016-201727号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ミキシング装置の操作者が手動でパラメータ調整を行う場合と同様のパラメータを、低計算負荷で自動的に求めることが出来る音信号処理方法、又は、ミキサエンジニアが、手動でチャンネル間の音量バランスを取る場合と同様のパラメータを自動的に求めることが出来る音信号処理方法が望まれている。
【0007】
本発明の一実施形態は、ミキシング装置の操作者が手動でパラメータ調整を行う場合と同様のパラメータを、低い計算負荷で自動的に求めることが出来る音信号処理方法、又は、ミキシング装置の操作者が、手動でチャンネル間の音量バランスを取る場合と同様のパラメータを自動的に求めることが出来る音信号処理方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の一実施形態に係る音信号処理方法は、
ミキシング装置に備わる複数のチャンネルの中から少なくとも1つの第1チャンネルを選択する操作を受け付けて、
選択された前記第1チャンネルの音信号を入力し、
入力された前記音信号に基づく時系列の音量データ、又は、前記複数のチャンネルのうち前記第1チャンネルとは異なる第2チャンネルに関するデータに基づいて、前記ミキシング装置に設定するためのセッティングデータを特定し、
特定した前記セッティングデータを出力する。
【発明の効果】
【0009】
この発明の一実施形態に係る音信号処理方法によれば、ミキシング装置の操作者が、手動でパラメータ調整を行う場合と同様のパラメータを、低い計算負荷で自動的に求めることが出来る、又は、ミキシング装置の操作者が、手動でチャンネル間の音量バランスを取る場合と同様のパラメータを自動的に求めることが出来る。
【図面の簡単な説明】
【0010】
【
図1】
図1は、ミキシング装置1aの構成を示すブロック図である。
【
図2】
図2は、ミキシング装置1aの外観を示す図である。
【
図3】
図3は、ミキシング装置1aで実行される信号処理のブロック図である。
【
図4】
図4は、入力パッチ21a、入力チャンネル22a、ミキシングバス23a、出力チャンネル24a及び出力パッチ25aの処理構成を示すブロック図である。
【
図5】
図5は、ミキシング装置1aの処理の一例を示すフローチャートである。
【
図6】
図6は、第1実施形態の変形例1に係るミキシング装置1bの外観を示す図である。
【
図7】
図7は、第1実施形態の変形例2に係るミキシング装置1cの外観を示す図である。
【
図8】
図8は、第1実施形態の変形例3に係るミキシング装置1dの処理の一例を示すフローチャートである。
【
図9】
図9は、第2実施形態の変形例1に係るミキシング装置1fのスクリーン16aに表示された画像を示す図である。
【発明を実施するための形態】
【0011】
[第1実施形態]
以下、第1実施形態に係る音信号処理方法を実行するミキシング装置1aについて図を参照して説明する。
図1は、ミキシング装置1aの構成を示すブロック図である。
図2は、ミキシング装置1aの外観を示す図である。
【0012】
ミキシング装置1aは、音信号処理装置の一例である。ミキシング装置1aは、音信号のレベル調整、又は、音信号のミックス等の信号処理を実行する。ミキシング装置1aは、
図1に示すように、オーディオインタフェース11、ネットワークインタフェース12、フラッシュメモリ13、RAM(Random Access Memory)14、CPU(Central Processing Unit)15、表示器16、ユーザインタフェース17、DSP(Digital Signal Processor)18及びバス19を備えている。オーディオインタフェース11、ネットワークインタフェース12、フラッシュメモリ13、RAM14、CPU15、表示器16、ユーザインタフェース17及びDSP18は、互いにバス19を介して接続されている。
【0013】
オーディオインタフェース11は、例えば、オーディオケーブルを介してマイク又は電子楽器等のオーディオ機器から音信号を受信する。オーディオインタフェース11は、例えば、オーディオケーブルを介して信号処理を施した音信号をスピーカ等のオーディオ機器に送信する。
【0014】
ネットワークインタフェース12は、通信回線を介してミキシング装置1aとは異なる他装置(例えば、PC等)と通信を行う。当該通信回線は、例えば、インターネット、又は、LAN(Local Area Network)である。ネットワークインタフェース12と、PC等の他装置とは、無線又は有線によって通信を行う。なお、ネットワークインタフェース12は、Dante(登録商標)等の規格に準じて音信号をネットワーク経由で送受信してもよい。
【0015】
フラッシュメモリ13は、種々のプログラムを記憶する。種々のプログラムとは、例えば、ミキシング装置1aを動作させるプログラム、又は、本発明の音信号処理方法に係る音処理を実行するためのプログラムである。なお、フラッシュメモリ13が、必ずしも、種々のプログラムを記憶しなくてよい。種々のプログラムは、例えば、サーバ等の他装置に記憶されていてもよい。この場合、ミキシング装置1aは、サーバ等の他装置から種々のプログラムを受信する。
【0016】
RAM14は、フラッシュメモリ13に記憶されたプログラムを読み出し、一時的に記憶する。
【0017】
CPU15(プロセッサの一例)は、フラッシュメモリ13に記憶されたプログラムをRAM14に読み出すことによって種々の処理を実行する。種々の処理とは、例えば、アナログの音信号をデジタルの音信号に変換する処理、本発明の音信号処理方法に係る音処理等である。CPU15は、予め設定されているサンプリング周波数及び量子化ビット数に基づいてアナログの音信号をデジタルの音信号に変換する。サンプリング周波数は、例えば、48kHzであり、量子化ビット数は、例えば、24bitである。
【0018】
DSP18は、オーディオインタフェース11又はネットワークインタフェース12を介して受信する音信号に対して信号処理を施す。信号処理とは、ミキシング又はエフェクト等の音響処理である。DSP18は、RAM14に記憶されているカレントデータに基づいて信号処理を行う。カレントデータは、DSP18により実行される音信号処理(ゲイン調整、エフェクト処理及びミキシング処理等)の現在の各種パラメータ値である。各種パラメータ値は、ユーザインタフェース17を介してユーザの操作により変更される。CPU15は、ユーザインタフェース17を介してユーザの操作を受け付けたとき、カレントデータを更新する。信号処理後の音信号は、バス19を介してオーディオインタフェース11へ送信される。なお、DSP18は、複数のDSPにより構成されていてもよい。
【0019】
表示器16は、CPU15の制御に基づいて種々の情報を表示する。例えば、表示器16は、音信号のレベルを表示する。表示器16は、スクリーン16a及びメーター16bを含んでいる。メーター16bは、チャンネルストリップ毎に複数設けられている。
図2に示す例では、メーター16bは、8個の入力チャンネルストリップに対応する8個のメーター16b1~16b8及び2個の出力チャンネルストリップに対応する2個のメーター16b9,16b10を含んでいる。なお、チャンネルストリップの数及びメーター16bの数は、10個に限定されない。
【0020】
スクリーン16aは、例えば、液晶ディスプレイ等である。スクリーン16aは、CPU15の制御に基づいて画像を表示する。
【0021】
メーター16bは、音信号のレベルを表示するための複数のLEDからなる。CPU15は、音信号のレベルに基づいてメーター16bの複数のLEDを点灯又は消灯させる。例えば、
図2に示す例において、メーター16b1~16b10のそれぞれは、紙面上下方向に並ぶ12個のLEDによって構成されている。12個のLEDそれぞれには、対応するレベル値が割り当てられている。例えば、
図2において、CPU15は、音信号のレベルが無音、つまり、-∞dBであれば、12個全てのLEDを消灯させる。CPU15は、音信号のレベルが最大、つまり、0dBであれば、12個全てのLEDを点灯させる。また、例えば、CPU15は、音信号のレベルが-12dBであれば、下から4個のLEDを点灯させる。これにより、ユーザは、各入力チャンネルに入力される音信号のレベルを視覚的に知ることが出来る。なお、メーター16bは、LEDに限らず、スクリーン16aに表示する画像であってもよい。
【0022】
ユーザインタフェース17は、ミキシング装置1aの使用者(以下、ユーザと称す)からミキシング装置1aに対する操作を受け付ける複数の操作子の一例である。ユーザインタフェース17は、例えば、
図2に示すように、ノブ17a、フェーダ17b、増減ボタン17c、ストアボタン17d、リコールボタン17e及びタッチパネル17f等を含んでいる。ノブ17a及びフェーダ17bは、チャンネルストリップ毎に設けられている。
【0023】
タッチパネル17fは、スクリーン16aに積層される。タッチパネル17fは、ユーザによるタッチパネル17fへのタッチ操作等を受け付ける。
【0024】
ノブ17aは、複数のチャンネルに入力する音信号のゲインの調整を受け付ける。
図2に示す例では、ノブ17aは、8個の入力チャンネルストリップに対応する8個のノブ17a1~17a8及び2個の出力チャンネルストリップに対応する2個のノブ17a9,17a10を含んでいる。なお、ノブ17aの数は、10個に限定されない。
【0025】
フェーダ17bは、複数のチャンネルに入力した音信号のレベル調整量を受け付ける。ユーザは、フェーダ17bをスライドさせることによって、各入力チャンネルから出力チャンネルへの音信号の送り量の調整を行う。
図2に示す例では、フェーダ17bは、8個の入力チャンネルストリップに対応する8個のフェーダ17b1~17b8及び2個の出力チャンネルストリップに対応する2個のフェーダ17b9,17b10を含んでいる。なお、フェーダ17bの数は、10個に限定されない。
【0026】
ストアボタン17dは、シーンメモリのデータ(シーンデータ)の記憶(ストア)を指示するボタンである。ユーザは、ストアボタン17dを操作(押下)することによってカレントデータを1つのシーンデータとしてフラッシュメモリ13に記憶させることが出来る。
【0027】
増減ボタン17cは、複数のシーンメモリの中から保存及び呼び出しの対象とするシーンメモリを選択する操作を受け付けるボタンである。
【0028】
リコールボタン17eは、フラッシュメモリ13に記憶されているシーンデータをカレントデータとしてRAM14に呼び出す指示(シーンリコール)を受け付けるボタンである。ユーザは、リコールボタン17eを操作(押下)することで、必要なシーンメモリのデータを呼び出すことにより、各種パラメータの設定値を呼び出すことが出来る。
【0029】
なお、増減ボタン17c、ストアボタン17d及びリコールボタン17eの機能は、タッチパネル17fを用いたGUI(Graphical User Interface)によって構成されていてもよい。
【0030】
以下、ミキシング装置1aで実行される信号処理について図を参照しながら説明する。
図3は、ミキシング装置1aで実行される信号処理のブロック図である。
図4は、入力パッチ21a、入力チャンネル22a、ミキシングバス23a、出力チャンネル24a及び出力パッチ25aの処理構成を示すブロック図である。なお、
図4では、入力チャンネル1における信号処理のみ記載し、入力チャンネル2-32における信号処理についての記載は、省略している。
【0031】
図3に示すように、ミキシング装置1aにおいて信号処理は、機能的に入力パッチ21a、入力チャンネル22a、ミキシングバス23a、出力チャンネル24a及び出力パッチ25aによって行われる。
【0032】
入力パッチ21aは、オーディオインタフェース11における複数の入力ポート(例えば、アナログポート又はデジタルポート)から音信号を受け付ける。入力パッチ21aは、複数の入力ポートの内の1つのポートを、入力チャンネル22aに含まれている複数の入力チャンネル(例えば、入力チャンネル1-32の計32チャンネル)の内の少なくとも1つの入力チャンネルに割り当てる。これにより、入力パッチ21aは、音信号を入力チャンネル22aの各入力チャンネルに送信する。
【0033】
各入力チャンネルには、対応する操作子が任意に割り当てられる。ミキシング装置1aは、例えば、8個のノブ17a及び8個のフェーダ17bを備えている場合、8個のノブ17a及び8個のフェーダ17bそれぞれに入力チャンネル1-8を割り当て出来る。例えば、入力チャンネル1には、
図2における、ノブ17a1及びフェーダ17b1が割り当てられる。この場合、ユーザは、ノブ17a1を操作することによって、入力チャンネル1に入力される音信号のゲインを調整することが出来る。同様にして、ユーザは、フェーダ17b1を操作することによって、入力チャンネル1から出力される音信号の送り量の調整を行うことが出来る。
【0034】
以下、入力チャンネル1における信号処理を例に説明する。入力チャンネル1は、
図4に示すように、ヘッドアンプ(HA)220、信号処理ブロック221、フェーダ部(FADER)222、パン部(PAN)223及び送り部(SEND)224を機能的に含んでいる。
【0035】
ヘッドアンプ220は、入力チャンネル1に入力する音信号のゲイン調整を行う。ヘッドアンプ220は、ゲイン調整後の音信号を信号処理ブロック221に送信する。
【0036】
信号処理ブロック221は、ヘッドアンプ220でゲイン調整された音信号に対してイコライザ又はコンプレッサ等の信号処理を行う。
【0037】
フェーダ部222は、操作子であるフェーダ17bで設定された送り量に基づいて、信号処理ブロック221で信号処理が行われた音信号のレベル調整を行う。
【0038】
ミキシングバス23aは、ステレオバス231及びMIXバス232を含んでいる。ステレオバス231は、マスタ出力となる2チャンネルのバスである。パン部223は、ステレオバス231の2チャンネルそれぞれに供給する音信号のバランスを調整する。
図4に示すように、パン部223は、バランス調整後の音信号をステレオバス231へ出力する。ステレオバス231は、出力チャンネル24aに接続されている。ステレオバス231は、パン部223から受信した音信号を、出力チャンネル24aへ送信する。
【0039】
MIXバス232は、複数のチャンネル(例えば、
図3又は
図4に示すように48チャンネル)を含んでいる。送り部224は、ユーザの操作に基づいてMIXバス232の各チャンネルに音信号を供給するか否かを切り替える。また、送り部224は、MIXバス232の各チャンネルに供給する音信号のレベルをユーザの設定した送り量に基づいて調整する。
図4に示すように、送り部224は、レベル調整後の音信号をMIXバス232へ出力する。MIXバス232は、出力チャンネル24aに接続されている。MIXバス232は、送り部224から入力した音信号を、出力チャンネル24aへ送信する。
【0040】
出力チャンネル24aは、複数のチャンネルを有する。出力チャンネル24aの各チャンネルは、ミキシングバス23aから受信した音信号に対して種々の信号処理を行う。出力チャンネル24aの各チャンネルは、信号処理後の音信号を出力パッチ25aへ送信する。
【0041】
出力パッチ25aは、複数の出力ポート(アナログ出力ポート又はデジタル出力ポート)の内の1つのポートを、出力チャンネル24aに含まれている複数チャンネルの内の少なくとも1つのチャンネルに割り当てる。これにより、信号処理後の音信号が、オーディオインタフェース11に送信される。
【0042】
以上に示す入力パッチ21a、入力チャンネル22a、ミキシングバス23a、出力チャンネル24a及び出力パッチ25aによって行われる処理は、各種パラメータの値に基づいて行われる。
【0043】
上記の処理において、CPU15は、ヘッドアンプ220においてゲイン調整された音信号のレベル(dB)に基づいて入力チャンネル1に対応しているメーター16b1を点灯させる。CPU15は、予め設定された所定時間(例えば、1/60秒等)における複数サンプルの音信号に基づいて、メーター16b1を制御するためのメーターデータを生成する。メーターデータは、時系列の音量データの一例である。CPU15は、メーターデータに基づいてメーター16b1を制御して音信号のレベルを表示する。
【0044】
一例として、音信号のサンプリング周波数は、48kHである一方で、メーターデータのサンプリング周波数は、音信号のサンプリング周波数よりも低い60Hzである。例えば、CPU15は、1/60秒に対応する800サンプルの音信号を取得する。CPU15は、例えば、800サンプルの音信号を平均化することでサンプリング周波数を低下して、1サンプルのメーターデータを生成する。
【0045】
一例として、音信号の量子化ビット数は、24bitである一方で、メーターデータの量子化ビット数は、12個のLEDを点灯又は消灯させるために必要な4bitであり、音信号の量子化ビット数よりも小さい。CPU15は、例えば、24bit(約1677万階調)で量子化されている音信号の量子化ビット数を減少し、4bitの12階調のメーターデータに丸め込む。
【0046】
以下、音信号処理(以下、処理Pと称す)について図を参照しながら説明する。
図5は、ミキシング装置1aの処理の一例を示すフローチャートである。
【0047】
ミキシング装置1aは、例えば、処理Pに係るプログラムを実行したときに、
図5の動作を開始する(
図5:START)。
【0048】
処理Pの開始後、CPU15は、複数の入力チャンネルの内の1つのチャンネル(第1チャンネル)を選択する操作を受け付ける(
図5:ステップS11)。例えば、CPU15は、スクリーン16aに、入力チャンネル22aにおける入力チャンネル1-32のうちの少なくとも1つに対応するボタン(以下、選択ボタンと称す)を表示する。ユーザは、例えば、入力チャンネル1に対応する選択ボタンをタッチして、入力チャンネル1を選択する。以下、入力チャンネル1が、選択された場合を説明する。
【0049】
次に、CPU15は、選択された入力チャンネル1(第1チャンネル)の音信号を入力する(
図5:ステップS12)。
【0050】
次に、CPU15は、ミキシング装置1aに設定するためのセッティングデータの特定を行う(
図5:ステップS13)。本実施形態において、セッティングデータは、ヘッドアンプ220におけるゲインの値を含む。CPU15は、時系列の音量データに基づいてヘッドアンプ220に設定すべきゲインの値(セッティングデータの一例)を特定する。例えば、CPU15は、選択された入力チャンネルに入力する音にクリッピング等が発生しないようなヘッドアンプ220のゲインを特定する(例えば、入力する音信号のピークのレベルが-6dBを超えないようにヘッドアンプ220のゲインを特定する)。
【0051】
本実施形態において、CPU15は、例えば、ニューラルネットワーク(DNN(Deep Neural Network)等)の人工知能による処理によってセッティングデータを特定する。熟練のミキサエンジニアは、メーター16b1を見て、入力する音信号のピークのレベルが-6dBを超えないようにヘッドアンプ220のゲインを設定する。つまり、熟練のミキサエンジニアは、メーターデータに基づいてヘッドアンプ220のゲインを設定する。従って、時系列の音量データと、ヘッドアンプ220のゲインと、の間には相関関係がある。このため、CPU15は、所定のモデルに対して、時系列の音量データとヘッドアンプ220のゲインとの関係を学習させることが可能である。CPU15は、時系列の音量データ(メーターデータ)とセッティングデータ(ヘッドアンプ220のゲイン)との関係を学習済の第1学習済モデルを用いてセッティングデータを特定する。
【0052】
熟練のミキサエンジニアは、例えば、3サンプル程度(1/60sec×3サンプル≒50msec程度)のメーターデータを見ることによってヘッドアンプ220のゲインを調整する。所定のモデルが時系列の音量データとヘッドアンプ220のゲインとの関係を学習した後、人工知能の実行段階においてCPU15は、例えば、3サンプルのメーターデータを用いることによって(1/60sec×3サンプル≒50msecの間、時系列の音量データを取得することによって)セッティングデータを特定することが可能である。
【0053】
なお、人工知能の実行段階において、CPU15は、ヘッドアンプ220のゲインの設定時に、熟練のミキサエンジニアが用いる音量の指標に応じたサンプル数を用いてもよい。熟練のミキサエンジニアは、例えば、VUメータ又はラウドネスメータを指標として用いてヘッドアンプ220のゲインを調整する。VUメータは、300msecの間における平均の音量を示す。CPU15は、例えば、300msecの間に複数サンプルのメーターデータを取得し、取得した複数サンプルのメーターデータを用いることによってセッティングデータを特定してもよい。ラウドネスメータは、400msecの間におけるラウドネスの値(モーメンタリーラウドネス)、又は、3secの間におけるラウドネスの値(ショートタームラウドネス)等を示す。CPU15は、例えば、400msec又は3secの間に複数サンプルのメーターデータを取得し、取得した複数サンプルのメーターデータを用いることによってセッティングデータを特定してもよい。なお、VUメータ及びラウドネスメータは音量の指標の一例であるため、VUメータ及びラウドネスメータ以外のメータが、音量の指標であってもいい。
【0054】
上記に示すように、熟練のエンジニアは、VUメータ又はラウドネスメータ等のメータを参考にして、適切な音量となるようにヘッドアンプ220のゲインを50msec~3sec程度の間に調整している。CPU15は、このような熟練のミキサエンジニアの調整を再現し、適切な音量となるようにヘッドアンプ220のゲインを50msec~3sec程度の間に調整する。これにより、CPU15は、熟練のミキサエンジニアが手動でゲイン調整を行う場合と同じ様に、自動的にヘッドアンプ220のゲイン調整を行うことが出来る。
【0055】
CPU15は、特定したセッティングデータ(ヘッドアンプ220のゲイン)をRAM14に出力する(
図5:ステップS14)。CPU15は、RAM14のカレントデータのうちヘッドアンプ220のゲインの値を、特定したゲインの値で更新する。これにより、DSP18は、更新されたカレントデータに基づいて音信号に対して信号処理を行う。
【0056】
以上の、ステップS11からステップS14の処理が行われることによって、処理Pの実行が完了する(
図5:END)。
【0057】
[効果]
熟練のミキサエンジニアは、クリッピングを発生させないように、メーター16bの表示に基づいてヘッドアンプ220のゲイン調整を行う。ミキシング装置1aは、このような熟練のミキサエンジニアの調整方法を、例えば人工知能によって再現する。ミキシング装置1aは、熟練のミキサエンジニアが手動でゲイン調整を行う場合と同じ様に、自動的にヘッドアンプ220のゲインを調整することが出来る。
【0058】
時系列の音量データは、複数サンプルの音信号であってもよいが、上記の様にメーターデータであることが好ましい。メーターデータのサンプリング周波数は、音信号のサンプリング周波数よりも著しく低い。また、メーターデータの量子化ビット数は、音信号の量子化ビット数よりも著しく低い。従って、ミキシング装置1aは、メーターデータで学習段階及び実行段階を行うことによって、音信号を用いて所定のモデルの学習段階及び実行段階を行うよりも、著しく低い計算量でヘッドアンプ220のゲインを特定することが出来る。
【0059】
[第1実施形態の変形例1]
以下、第1実施形態の変形例1に係るミキシング装置1bについて図を参照しながら説明する。
図6は、第1実施形態の変形例1に係るミキシング装置1bの外観を示す図である。
【0060】
ミキシング装置1bのスクリーン16aは、特定したヘッドアンプ220のゲインを表示する。例えば、ミキシング装置1bのCPU15は、
図6に示すように、ノブ17aを模した画像をスクリーン16aに表示する。例えば、CPU15は、特定したゲインを示すノブ40の画像(ノブ17a1を模した画像)と、特定したゲイン±α(αは任意の値)の範囲を示す画像とを、スクリーン16aに表示させる。ユーザは、スクリーン16aに表示されたノブ40を参考にしてノブ17a1を調整する。ユーザは、ヘッドアンプ220のゲインを学習済モデルによって特定されたヘッドアンプ220のゲインに設定するか否かを任意に決めることが出来る。
【0061】
なお、CPU15は、特定したゲイン±αの範囲を表示せずに、特定したヘッドアンプ220のゲインのみを示す画像を表示してもよい。例えば、特定したゲインの値を示すテキストメッセージ(例えば、「ノブ17a1を-3dBに設定して下さい」等のテキストメッセージ)を表示してもよい。
【0062】
[第1実施形態の変形例2]
以下、第1実施形態の変形例2に係るミキシング装置1cについて図を参照しながら説明する。
図7は、第1実施形態の変形例2に係るミキシング装置1cの外観を示す図である。
【0063】
ミキシング装置1cのCPU15は、特定したヘッドアンプ220のゲインを表示した後、当該ゲインをカレントデータに設定するか否かの操作を受け付ける。例えば、
図7に示すように、CPU15は、特定したヘッドアンプ220のゲインをカレントデータに設定する操作を受け付けるボタンYをスクリーン16aに表示する。ユーザは、スクリーン16aに表示されたヘッドアンプ220のゲインをカレントデータに設定したい場合、ボタンYをタッチ操作する。この場合、CPU15は、特定したヘッドアンプ220のゲインでカレントデータを更新する。一方、CPU15は、スクリーン16aに表示されているボタンNの操作を検出した場合、特定したヘッドアンプ220のゲインでカレントデータを更新しない。このように、ユーザは、特定したヘッドアンプ220のゲインの内容を確認した上で、当該ゲインに設定するか否かを決定出来る。
【0064】
[第1実施形態の変形例3]
以下、第1実施形態の変形例3に係るミキシング装置1dについて図を参照しながら説明する。
図8は、第1実施形態の変形例3に係るミキシング装置1dの処理の一例を示すフローチャートである。
【0065】
ミキシング装置1dのCPU15は、ユーザによる操作(例えば、ヘッドアンプ220のゲインの調整に係る操作)を受け付けているか否かを判定する(
図8:ステップS21)。CPU15は、ユーザからの操作を受け付けた場合(
図8:ステップS21 Yes)、特定したセッティングデータ(例えば、ヘッドアンプ220のゲイン)のRAM14への出力を停止する(
図8:ステップS22)。そして、CPU15は、ユーザから受け付けた操作に基づくセッティングデータをミキシング装置1dに設定する(
図8:ステップS23)。これにより、ユーザによる各種のパラメータの手動調整が、ミキシング装置1dによる自動調整によって阻害されない。
【0066】
一方、ステップS21において、CPU15は、ユーザからの操作を受け付けていない場合(
図8:ステップS21 No)、特定したセッティングデータの出力を再開する(
図8:ステップS24)。これにより、ミキシング装置1dは、ユーザによる操作がない場合は、自動でヘッドアンプ220のゲインの調整を行う。ミキシング装置1dは、ユーザの操作の有無に応じてヘッドアンプ220のゲインの調整を行うか否かを適切に切り替えることが出来る。
【0067】
[第2実施形態]
以下、第2実施形態に係るミキシング装置1eについて
図2を準用して説明する。説明において、第1実施形態と同様にして、ユーザによって入力チャンネル1が選択された場合を例に説明する。
【0068】
ミキシング装置1eのCPU15は、例えば、入力チャンネル1(第1チャンネル)とは異なる入力チャンネル2-32(第2チャンネル)のフェーダ値(第2チャンネルに関するデータ)に基づいてセッティングデータ(第1チャンネルのフェーダ値)を特定する。本実施形態において、セッティングデータとは、フェーダ17bで受け付けるレベル調整量である。例えば、CPU15は、入力チャンネル1-8のミキシングにおける音量バランスが適切となるように、入力チャンネル2-8のフェーダ値に基づいて入力チャンネル1のフェーダ値の調整を行う。
【0069】
本実施形態において、CPU15は、入力チャンネル2-32(第2チャンネル)に関するデータ(フェーダの値)と、セッティングデータ(第1チャンネルのフェーダ値)と、の関係を学習済の第2学習済モデルを用いてセッティングデータを特定する。熟練のミキサエンジニアは、入力チャンネル2-32のフェーダ17b2-17b8の値を見て、音量バランスを考えながら入力チャンネル1のフェーダ17b1の値を調整する。従って、入力チャンネル2-32に関するデータ(フェーダ17b2-17b8の値)と、フェーダ17b1の値と、の間には相関関係がある。このため、CPU15は、所定のモデルに、入力チャンネル2-32に関するデータと、フェーダ17b1の値と、の関係を学習させることが可能である。
【0070】
[効果]
例えば、熟練のミキサエンジニアは、フェーダ17b1の値を設定する場合に、他のフェーダ17b2-17b8の値を参考にして、音量バランスを考えながら調整する。ミキシング装置1eは、熟練のミキサエンジニアによって行われるチャンネル間の音量バランスの調整と同じ様な音量バランス調整(例えば、CD用の音源作成時の様な、熟練のミキサエンジニアによって時間をかけて行われる調整)を再現する。これにより、ミキシング装置1eは、熟練のミキサエンジニアが手動でチャンネル間の音量バランスを調整する場合と同じ様に、自動的にチャンネル間の音量バランスの調整を行うことが出来る。
【0071】
[第2実施形態の変形例1]
以下、第2実施形態の変形例1に係るミキシング装置1fについて、図を参照しながら説明する。
図9は、第2実施形態の変形例1に係るミキシング装置1fのスクリーン16aに表示された画像を示す図である。
【0072】
本変形例において、入力チャンネル1とは異なる入力チャンネル2-32に関するデータは、音源の種別(楽器名)に関するデータ(テキストデータ等)である。例えば、熟練のミキサエンジニアは、入力チャンネル1-32それぞれに対応する楽器の種類に応じて、チャンネル間のバランス調整を行う場合がある。CPU15は、この様な、熟練のミキサエンジニアの調整を再現する。一例として、CPU15は、入力チャンネル1(音源:ボーカル)に係る音量が、入力チャンネル2(音源:ギター)に係る音量よりも大きくなるように、入力チャンネル1のフェーダ値を調整する。このように、ミキシング装置1eは、熟練のミキサエンジニアによるチャンネル間のバランス調整を再現することが出来る。
【0073】
[第2実施形態の変形例2]
以下、第2実施形態の変形例2に係るミキシング装置1gについて、
図2を準用して説明する。ミキシング装置1gのCPU15は、シーンリコールを実行したとき、読み出したシーンデータでカレントデータを更新する。このため、CPU15は、学習済モデルによるチャンネル間の音量バランスの調整をやり直すことが好ましい。従って、CPU15は、シーンリコールを受け付けた場合に(ユーザによって
図2に示すリコールボタン17eが押下された場合に)、読み出したシーンデータに基づいて入力チャンネル1のレベル調整量(セッティングデータ)を特定する。シーンデータは、楽器の情報等のチャンネル間の音量バランスの調整を行う上で、有用な情報を含んでいる。従って、ミキシング装置1eは、読み出したシーンデータを用いることで、熟練のミキサエンジニアによって行われるチャンネル間の音量バランスの調整を、更に正確に再現することが出来る。
【0074】
[第2実施形態の変形例3]
以下、第2実施形態の変形例3に係るミキシング装置1hについて
図9を準用して説明する。ミキシング装置1hは、セッティングデータの特定において、操作子(ノブ17a,フェーダ17b)が割り当てられていない入力チャンネルに関するデータを用いる。
【0075】
図9に示す例において、ミキシング装置1hのCPU15は、操作子に入力チャンネル1-8(第1チャンネル群)を割り当てている。一方、ミキシング装置1hは、操作子に入力チャンネル9-32(第2チャンネル群)を割り当てていない。この場合でも、ミキシング装置1hは、例えば、入力チャンネル2-32の各フェーダ値に基づいて入力チャンネル1のフェーダ値の調整を行う。これにより、ミキシング装置1hは、表示されていないチャンネル(入力チャンネル9-32)のフェーダ値を確認しなくても、該表示されていないフェーダ値を考慮してチャンネル間の音量バランスを調整することが出来る。
【0076】
ミキシング装置のチャンネル数が膨大な場合、操作子に割り当てられていない入力チャンネルの数が膨大となる。この場合、ユーザは、全ての入力チャンネルのフェーダ値を考慮することが困難となる。しかし、ミキシング装置1hは、選択した入力チャンネル1のフェーダ値を、全ての入力チャンネルのフェーダ値に基づいて自動で設定する。
【0077】
ミキシング装置1eは、入力チャンネル1-32を第1信号処理系統である第1入力チャンネル1-16(第1チャンネル群)と、第2信号処理系統である第2入力チャンネル1-16とに分けるモード(スプリットモード)を有していてもよい。この場合、ミキシング装置1hのCPU15は、例えば、第1信号処理系統の第1入力チャンネル1-16の内の第1入力チャンネル1-8(第1チャンネル群)を操作子に割り当てる一方で、第1信号処理系統の第1入力チャンネル9-16及び第2信号処理系統の第2入力チャンネル1-16(第2チャンネル群)を操作子に割り当てない。このとき、ユーザは、例えば、第1信号処理系統の入力チャンネル1を選択する。ミキシング装置1hは、第1信号処理系統である第1入力チャンネル2-16の各フェーダ値及び第2信号処理系統である第2入力チャンネル1-16の各フェーダ値に基づいて、第1信号処理系統の第1入力チャンネル1のフェーダ値を特定する。但し、第1信号処理系統の第1入力チャンネル1に入力される音信号と、第2信号処理系統の第2入力チャンネル1に入力される信号とは、同じである。従って、ミキシング装置1hは、入力チャンネル1のフェーダ値の特定において、必ずしも、第2信号処理系統の第2入力チャンネル1のフェーダ値を用いなくてよい。
【0078】
なお、ミキシング装置1a~1hの構成を任意に組み合わせてもよい。
【符号の説明】
【0079】
1a~1h:ミキシング装置
11:オーディオインタフェース
12:ネットワークインタフェース
13:フラッシュメモリ
14:RAM
15:CPU
16:表示器
16a:スクリーン
16b,16b1,16b1-16b10:メーター
17:ユーザインタフェース
17a,17a1-17a10:ノブ
17b,17b1-17b10:フェーダ
18:DSP
19:バス
21a:入力パッチ
22a:入力チャンネル
23a:ミキシングバス
24a:出力チャンネル
25a:出力パッチ