IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤマハ株式会社の特許一覧

<>
  • 特許-オーディオ信号の処理方法 図1
  • 特許-オーディオ信号の処理方法 図2
  • 特許-オーディオ信号の処理方法 図3
  • 特許-オーディオ信号の処理方法 図4
  • 特許-オーディオ信号の処理方法 図5
  • 特許-オーディオ信号の処理方法 図6
  • 特許-オーディオ信号の処理方法 図7
  • 特許-オーディオ信号の処理方法 図8
  • 特許-オーディオ信号の処理方法 図9
  • 特許-オーディオ信号の処理方法 図10
  • 特許-オーディオ信号の処理方法 図11
  • 特許-オーディオ信号の処理方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-10
(45)【発行日】2023-05-18
(54)【発明の名称】オーディオ信号の処理方法
(51)【国際特許分類】
   G10L 25/21 20130101AFI20230511BHJP
   G10L 25/27 20130101ALI20230511BHJP
   G10L 21/034 20130101ALI20230511BHJP
【FI】
G10L25/21
G10L25/27
G10L21/034
【請求項の数】 10
(21)【出願番号】P 2019052733
(22)【出願日】2019-03-20
(65)【公開番号】P2020154149
(43)【公開日】2020-09-24
【審査請求日】2022-01-21
(73)【特許権者】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】100111763
【弁理士】
【氏名又は名称】松本 隆
(72)【発明者】
【氏名】石塚 健治
【審査官】岩田 淳
(56)【参考文献】
【文献】米国特許出願公開第2005/0234366(US,A1)
【文献】特開2015-200685(JP,A)
【文献】特開2010-251937(JP,A)
【文献】特表2008-542835(JP,A)
【文献】特表2016-536919(JP,A)
【文献】LYKARTSIS, Athanasios,Evaluation of Accenet-Based Rhythmic Descriptors for Genre Classification of Musical Signals,Technische Universitat Berlin, Fachgebiet Audiokommunikation, Masterarbeit, [online],2014年04月16日,pp. i-xv, 1-123,[2023年1月17日検索], <URL: http://www2.users.ak.tu-berlin.de/akgroup/ak_pub/abschlussarbeiten/2014/LykartsisAthanasiousMasA.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-99/00
(57)【特許請求の範囲】
【請求項1】
入力されたオーディオ信号に含まれる各アタック区間の1乃至複数のレベル値を検出し、検出されるレベル値の変域を複数のレンジに分け、各レンジに属するレベル値の度数を分布として表したヒストグラムを生成するオーディオ信号の処理方法。
【請求項2】
前記検出では、前記オーディオ信号から検出されたフレーム毎のピークから前記各アタック区間の1つのレベル値を検出する請求項1に記載の処理方法。
【請求項3】
前記検出では、前記オーディオ信号から検出されたエンベロープに基づいて、前記各アタック区間の複数のレベル値を検出する請求項1に記載の処理方法。
【請求項4】
前記検出では、前記オーディオ信号から検出されたエンベロープに基づいて、前記各アタック区間の1つのレベル値を検出する請求項1に記載の処理方法。
【請求項5】
前記ヒストグラムを表示器に表示し、
ユーザ操作に応じて、オーディオ信号の処理のためのパラメータを調整する請求項1に記載の処理方法。
【請求項6】
前記ヒストグラムに基づいて、オーディオ信号の処理のためのパラメータを自動調整する請求項1に記載の処理方法。
【請求項7】
時間区間のユーザ指定を受け付け、
前記ユーザ指定された時間区間のオーディオ信号について、前記ヒストグラムを生成する請求項1に記載の処理方法。
【請求項8】
時間軸に沿って所定時間長の窓を移動し、
前記移動する窓に入るオーディオ信号について、前記ヒストグラムを生成する請求項1に記載の処理方法。
【請求項9】
入力されたオーディオ信号に含まれる各アタック区間の1乃至複数のレベル値を検出し、検出されるレベル値の変域を複数のレンジに分け、各レンジに属するレベル値の度数を分布として表したヒストグラムを生成する生成部を有するオーディオ信号の処理装置。
【請求項10】
コンピュータを、
入力されたオーディオ信号に含まれる各アタック区間の1乃至複数のレベル値を検出し、検出されるレベル値の変域を複数のレンジに分け、各レンジに属するレベル値の度数を分布として表したヒストグラムを生成する生成部と
して機能させるプログラム。




【発明の詳細な説明】
【技術分野】
【0001】
この発明は、オーディオ信号処理に係り、特にオーディオ信号の入力レベルの指標となる情報を生成する方法に関する。
【背景技術】
【0002】
オーディオ信号処理において入力レベル制御やダイナミクス制御を適切に行うためには、信号処理のパラメータを入力レベルに適した値に設定する必要がある。非特許文献1に開示の技術では、入力音波形の全区間における瞬時サンプル値のヒストグラムを入力レベルの指標としてユーザに提供する。
【先行技術文献】
【非特許文献】
【0003】
【文献】Loudness Maximizer, [2019年1月8日検索]、インターネット<URL:http://help.izotope.com/docs/ozone4/pages/modules_loudness_maximizer.htm>
【0004】
【文献】A Tutorial on Onset Detection in Musical Signals, IEEE Transactionson Speech and Audio Processing ( Volume: 13 , Issue: 5 ),2005年8月15日刊行
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、入力されたオーディオ信号の全区間の瞬時サンプル値には、例えば音が減衰していく区間や演奏されていない区間等の瞬時サンプル値も含まれるため、これから得られるヒストグラムは入力レベルやダイナミクスの制御のための信号レベルの適切な指標にならない。
【0006】
この発明は以上のような事情に鑑みてなされたものであり、入力されたオーディオ信号から信号レベルの適切な指標を取得する方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
この発明は、入力されたオーディオ信号に含まれる各音符の波形の立ち上がり部分の1乃至複数のレベル値を検出し、検出されたレベル値のヒストグラムを作成するオーディオ信号の処理方法を提供する。
【図面の簡単な説明】
【0008】
図1】この発明の複数の実施形態に共通のオーディオ信号の処理装置の構成を示すブロック図である。
図2】この発明におけるオンセット、オンセットピークを説明する図である。
図3】この発明の第1実施形態におけるオンセットヒストグラムの生成部の構成例を示すブロック図である。
図4】同実施形態の動作例を示す波形図である。
図5】この発明の第2実施形態におけるオンセットヒストグラムの生成部の構成例を示すブロック図である。
図6】同実施形態の動作例を示す波形図である。
図7】この発明の第3実施形態におけるオンセットヒストグラムの生成部の構成例を示すブロック図である。
図8】この発明の第4実施形態におけるオンセットヒストグラムの生成部の構成例を示すブロック図である。
図9】この発明に係るオンセットヒストグラムの生成部を備えたオーディオ信号の処理装置のハードウェア構成を示すブロック図である。
図10】同処理装置の動作を示すフローチャートである。
図11】同処理装置の動作を示すフローチャートである。
図12】同処理装置の動作の変形例を示すフローチャートである。
【発明を実施するための形態】
【0009】
以下、図面を参照し、この発明の実施形態について説明する。
【0010】
<複数の実施形態に共通の機能構成>
図1に、後述する第1実施形態を始めとするこの発明の複数の実施形態に共通のオーディオ信号の処理装置100の機能構成を示す。ここでは、処理装置100にオーディオ信号を供給するマイク101と、処理装置100から出力されるオーディオ信号を音として出力するパワードスピーカ102が、処理装置100とともに示されている。処理装置100は、例えば、オーディオミキサ、信号処理エンジン、カラオケ装置、電子楽器、ビデオカメラ、タブレット端末、スマートフォンなどの何れでもよい。
【0011】
オーディオ信号の処理装置100は、ADC(Analog Digital Converter)1と、信号処理部2と、DAC(Digital Analog Converter)3と、オンセットヒストグラムの生成部4と、表示部5と、パラメータ推定部6と、入力部7とを有する。
【0012】
ADC1は、マイク101から供給されるアナログのオーディオ信号をA/D変換し、デジタルの信号SDとして出力する。信号処理部2は、信号SDに対して、例えば入力レベルやダイナミクスの制御等のための信号処理を施して出力する。DAC3は、信号処理部2から出力されるデジタルのオーディオ信号をD/A変換して、アナログの信号としてパワードスピーカ102に出力する。
【0013】
オンセットヒストグラムの生成部4は、信号SDにおいてオンセットから始まる波形の立ち上がり部分の1乃至複数のレベルを検出してヒストグラム化する装置である。ここで、オンセットは、入力オーディオ信号に含まれる各音符の波形の立ち上がり点である。非特許文献2によると、オンセットは、例えば図2のように、波形のエンベロープが増加するアタックの開始点である。なお、図2はオーディオ信号のエンベロープを模式的に示したものであり、オーディオ信号波形によってはアタックの区間内に複数のピークが発生する場合がある。図1の生成部4は、信号SDにおいて、1乃至複数のオンセットを検出し、各オンセットから始まるアタック区間内に現れるピークをオンセットピークとして検出し、オンセットピークをヒストグラム化したヒストグラムを生成する。
【0014】
オンセットヒストグラムは表示部5に表示される。ユーザは、表示されたオンセットヒストグラムに基づいて、入力ゲイン等のパラメータを決定し、そのパラメータを入力部6から入力する。パラメータ推定部6は、ユーザによって入力されたパラメータを信号処理部2に設定する。また別の例として、パラメータ推定部6に、AI(Artificial Intelligence)の機能を備えてもよい。パラメータ推定部6は、予め、オーディオ信号のオンセットヒストグラムとその信号に適したパラメータとの対応関係を学習したAIを有しており、入力されたオーディオ信号のオンセットヒストグラムに応じて、その信号に適したパラメータを決定する。
【0015】
<第1実施形態>
生成部4の一例として、図3に、この発明の第1実施形態におけるオンセットヒストグラムの生成部41の構成を示す。生成部41は、整流部411と、真数/対数変換部412と、ピークの検出部413と、オンセットピークの検出部414と、度数のカウント部415とを有する。
【0016】
整流部411は、サンプリング周期ごとに、信号SDの全波整流を行い、信号Srとして出力する。真数/対数変換部412は、信号Srのサンプル値を対数に変換し、サンプル値SIとして出力する。
【0017】
ピークの検出部413は、サンプル値SIを所定数nサンプリング周期に相当する一定時間長の時間フレームに区切り、時間フレーム毎に、サンプル値のピーク(最大値)を求める。
【0018】
オンセットピークの検出部414は、サンプル値SIの列の中からオンセットを検出し、このオンセットに基づき、検出部413が検出した一連のピークの中からオンセットピークを検出する。
【0019】
なお、オンセットの検出は、非特許文献2に開示された以下の方法を含む、公知の如何なる方法により行ってもよい。
方法1:サンプル値SIのエンベロープを求め、エンベロープが急激に立ち上がるタイミングをオンセットとする。
方法2:サンプル値SIを一定時間長のフレームに分割し、フレーム毎にSTFT係数を算出する。高域のSTFT係数が顕著に変化するタイミングをオンセットとする。
【0020】
方法3:サンプル値SIを一定時間長のフレームに分割し、フレーム毎にSTFT係数を算出し、STFT係数から位相情報を算出する。フレーム推移に伴う位相情報の変化の態様が顕著に変化するタイミングをオンセットとする。
方法4:サンプル値SIを一定時間長のフレームに分割し、フレーム毎にウェーブレット係数を算出する。フレーム推移に伴ってウェーブレット係数が顕著に変化するタイミングをオンセットとする。
【0021】
方法5:サンプル値SIが、2つのモデルAおよびBのいずれかから発生していると考える。サンプル値SIがモデルAから発生している対数尤度と、サンプル値SIがモデルBから発生している対数尤度との大小関係が逆転するタイミングをオンセットとする。
方法6:過去のサンプル値SIから現在のサンプル値SIを予測する予測困難度を算出し、予測困難度が顕著に高まるタイミングをオンセットとする。
【0022】
検出部414は、例えば、次のような方法でオンセットピークを決定する。
例1:図4に例示するように、検出されたオンセットから所定時間Ta(音符の立ち上がりの長さ。例えば、数百ミリ秒から1秒程度)をアタック区間として特定し、上記一連のピークうちのアタック区間の最大値Pmaxをオンセットピークとする。
例2:上記一連のピークに平滑化フィルタをかけ滑らかなカーブにして、そのカーブのアタック区間における最大値をオンセットピークにする。
【0023】
図3において、度数のカウント部415は、検出部414から出力されるオンセットピークの変域を複数のレンジに分け、各レンジに属するオンセットピークの度数をカウントすることによりオンセットヒストグラムを生成する。このようにして生成されたオンセットヒストグラムが図1の表示部5に表示され、或いは、パラメータ推定部6に供給される。ヒストグラム作成に使用するオンセットピーク検出の時間範囲は任意である。例えば、1ないし数曲の時間範囲、複数の各曲のクライマックスの時間範囲、直前の所定時間範囲、ユーザが指定した時間範囲など、それらの何れの時間範囲に検出されたオンセットピークでヒストグラムを作成してもよい。
【0024】
ここで、直前の所定時間範囲は、現在時刻を起点としてユーザが指定した時間幅遡った時刻から現在時刻までの、その指定された時間幅の窓の範囲である。生成部4(カウント部415)は、その窓を時間の経過につれて移動し、その窓の時間範囲に入るオーディオ信号に基づいてオンセットピークのヒストグラムを生成する。より具体的に、オンセットピークが検出されるごとに、そのオンセットピークの値が属するレンジの度数を増やす(+1する)とともに、そのオンセットピーク値とその検出された時刻とを履歴として記憶する。そして、その時刻から所定時間経過したとき、履歴からそのオンセットピーク値を読み出し、その値が属するレンジの度数を減らす(-1する)。
【0025】
或いは、ユーザが、窓の時間幅を指定する代わりに、ヒストグラムの忘却速度(減衰率)を指定するようにしてもよい。生成部4(カウント部415)は、各レンジの度数を、オンセットピークが検出されるごとに増やすとともに、時間が経過するごとにその忘却速度に応じた速さで減少させる。
【0026】
また、ユーザが指定した時間範囲は、ユーザにより指定された開始時刻から終了時刻までの過去の時間範囲である。オンセットピークのヒストグラムは、リアルタイムに作成されるのではなく、指定された過去の時間範囲のオーディオ信号について、作成される。この場合、過去の時間範囲のオンセットピークを入手するため、後述する第3実施形態の記録部や、第4実施形態のレコーダに例示される、過去のオーディオ信号に関する何らかの情報を記憶する情報記憶部が必要となる。
【0027】
本実施形態によれば、オンセットから始まる一定時間長のアタック区間内に発生するオンセットピークのヒストグラムが生成されるので、入力レベルに関する適切な指標として利用可能である。
【0028】
<第2実施形態>
生成部4の一例として、図5に、この発明の第2実施形態であるオンセットヒストグラムの生成部42の構成を示す。
【0029】
生成部42において、前処理部421は、サンプリング周期ごとに、オーディオ信号のサンプルSDの全波整流を行い、さらに対数に変換して、サンプルSIとして出力する。
【0030】
減算部424と、乗算部425と、加算部426と、遅延部427と、比較部428と、時定数部429とは、エンベロープフォロワとして、サンプリング周期ごとに、前処理部421の出力するサンプルSIから、そのエンベロープEdを生成する。
【0031】
詳述すると、減算部424は、サンプルSIからエンベロープEdの現在値を減算し、減算結果を示すサンプルを出力する。比較部428は、サンプルSIとエンベロープEdの現在値とを比較し、比較結果を示す信号を出力する。時定数部429は、サンプルSIがエンベロープEdの現在値より大きいことを比較部428の出力信号が示すとき短い時定数に対応した係数α1を出力し、サンプルSIがエンベロープEdの現在値以下であることを比較部428の出力信号が示すとき長い時定数に対応した係数α2<α1を出力する。乗算部425は、減算部424によって出力されるサンプルに時定数部429から出力される係数を乗算して出力する。加算部426は、乗算部425が出力するサンプルとエンベロープEdの現在値とを加算し、サンプルEcとして出力する。遅延部427は、サンプルEcを1サンプリング周期だけ遅延させたサンプルをエンベロープEdの現在値として出力する。なお、減算部424の減算結果の符号を、比較部428の出力の代わりに使用し、比較部428を省略してもよい。
【0032】
以上の構成によれば、サンプルSIがエンベロープEdの現在値より大きい期間、エンベロープEdは、係数α1に対応する第1時定数で、オーディオ信号のサンプルSIの立ち上がりに急速に追従して立ち上がる。また、サンプルSIがエンベロープEdの現在値以下である期間、エンベロープEdは、係数α2に対応し第1時定数より長い第2時定数で、緩やかに立ち下がる。
【0033】
ラッチ422は、あるサンプリング周期においてサンプルSIがエンベロープEdの現在値より大きいこと、すなわちオーディオ信号が立ち上がり区間にあることを比較部428の出力信号が示す場合は、その時点におけるサンプルSIをピーク候補Pcとしてラッチする。
【0034】
度数のカウント部423は、オンセットピークの変域を複数のレンジに分割し、各レンジに属するオンセットピークの度数をカウントする装置である。カウント部423は、ユーザの指示に応じて全度数をゼロリセットし、それ以降にオンセットピークを検出するごとに、そのオンセットピーク値が属するレンジの度数を増やす(+1する)。さらに詳述すると、カウント部423は、あるサンプリング周期において立ち上がり区間と判定され、ラッチ422にピーク候補Pcがラッチされた後、所定数mサンプリグ周期に相当する所定期間T0の間、次のピーク候補のラッチがなければ、その時点で、ラッチされたピーク候補PcをオンセットピークPoと判断し、そのオンセットピークPoが属するレンジの度数を増やす。第2実施形態における各アタック区間は、所定期間T0より短い間欠を含みつつ、連続して立ち上がり区間に入ると判定された一連のサンプリング周期である。そして、各アタック区間における先頭のサンプリング周期が、そのアタック区間に対応するオンセットのタイミングと見做される。
【0035】
図6は生成部42の動作例を示す波形図である。図6では、太線で示される立ち上がり区間における各サンプリング周期でサンプルSIがピーク候補Pcとして順次ラッチされる。左から5番目の太線区間の最後のサンプリング周期でサンプルSIがラッチされた後、SI>Edとなることなく時間T0が経過する。この時間T0が経過したサンプリング周期においてアタック区間が確定し、その時点でラッチされているサンプルSIがオンセットピークPoとして検出され、その値が属するレンジの度数が1だけカウントアップされる。
【0036】
本実施形態によれば、各アタック区間におけるオーディオ信号波形のピーク値がオンセットピークとして検出され、オンセットピークの分布を示すオンセットヒストグラムが生成される。このヒストグラムは、信号処理のパラメータ制御に有用な指標である。
【0037】
また、本実施形態によれば、音信号が立ち上がるアタック区間内のピークをオンセットピークとするため、アタック区間の長さに関わらず、適切にオンセットピークを検出できる。
【0038】
ここでは、ユーザによる度数リセットから現在までの時間範囲のオンセットピークでヒストグラムを生成したが、オンセットピーク検出の時間範囲は任意である。
【0039】
<第2実施形態の変形例>
本実施形態に関しては次の変形例が考えられる。
この変形例では、図6の太線で示される立ち上がり区間のサンプル全て、すなわち、ラッチ422にラッチされた全てのピーク候補Pcをオンセットピークとして取り扱い、ヒストグラムを生成する。一般に、オーディオ信号は、アタック区間においてそのピークまで短時間に立ち上がるので、この方法で作成したヒストグラムは、第1実施形態や第2実施形態のような、アタック区間のピークだけをオンセットピークとして作成したヒストグラムに比較的近い形状となる。この変形例では、第2実施形態と比較して短期間のサンプルで、かつ、より簡単な構成で、オンセットピークのヒストグラムを生成できる。
【0040】
<第3実施形態>
生成部4の一例として、図7に、この発明の第3実施形態であるオンセットヒストグラムの生成部43の構成を示す。前処理部431は、サンプリング周期ごとに、信号SDの全波整流を行い、さらに対数に変換して、サンプルSIとして出力する。信号SDからの一連のオンセットの検出も、この前処理部431が行う。ピークの検出部432は、前処理部431の出力するサンプルSIから、時間フレーム毎のピークを検出し、このピークの時系列を記録部433に記録する。これら前処理部431、検出部432、記録部433の処理は、処理装置100(例えばオーディオミキサ)がオーディオ信号を処理(例えばミキシング処理)中に、そのバックグラウンドで行われる。
【0041】
オンセットピークの検出部434は、記録部433に記録されたピークの時系列の中から、検出範囲の指定部436により指定された時間範囲内のピークの時系列を選択し、検出条件の指定部437により指定された検出条件に従い、オンセットピークを検出する。ここで、ユーザは、後述するUI部の表示器に表示されたピークの時系列(エンベロープ波形の形状)を見ながら、そのUI部を用いて、所望の時間範囲を指定する。なお、この場合のオンセットピークの検出方法は第1実施形態と同様である。また、検出条件とは、例えばアタック期間の時間長Taなどである。度数のカウント部435は、検出部434により検出されたオンセットピークの属するレンジの度数を増やす(+1する)。
【0042】
本実施形態においても上記第1実施形態と同様な効果が得られる。また、本実施形態によれば、記録部433に記録したピークを用い、任意の時間範囲を指定して、或いは、検出条件を変えながら、オンセットピーク検出や度数カウントを実行できる。
【0043】
<第4実施形態>
図8は、この発明の第4実施形態におけるオンセットヒストグラムの生成部44の構成を示すブロック図である。第4実施形態の処理装置100は、図1において、ADC1の直後にマルチトラックのレコーダ103(図示せず)を備える。処理装置100(例えば、オーディオミキサ)がADC1からの(複数チャンネルの)オーディオ信号を処理(例えば、ミキシング)しているとき、レコーダ103は、バックグラウンドでそのオーディオ信号を記憶媒体に記憶する。生成部44は、レコーダ103の記録媒体に録音された(所望のチャンネルの)オーディオ信号に基づいて、オンセットヒストグラムを作成する。
【0044】
オンセット処理部442は、上記第1実施形態や第2実施形態と同種の方法を用い、レコーダからオーディオ信号からオンセットピークを検出する。
【0045】
読出部441は、検出範囲の指定部444により指定された時間範囲内のオーディオ信号のサンプルSDの時系列を記録媒体から読み出して出力する。ユーザは、表示器に表示されたサンプルSDの時系列(オーディオ波形の形状)を見ながら、UI部を用いて、所望の時間範囲を指定する。
【0046】
オンセット処理部442は、指定部445により指定された検出条件に従い、読出部441の出力するオーディオ信号からオンセットピークを検出する。その検出には、これまで説明した何れの方法を用いてもよい。カウント部443は、検出されたオンセットピークのヒストグラムを生成する。ここでの検出条件の自由度は第3実施形態より高く、例えば、オンセットの検出アルゴリズムや、オンセットピークの検出アルゴリズムなどを指定することもできる。
【0047】
本実施形態においても上記第1または第2実施形態と同様な効果が得られる。また、本実施形態では、記録媒体に記録された録音波形から、任意の時間範囲を指定して、或いは、検出条件をより自由に変えながら、オンセットピークを検出してヒストグラムを生成できる。
【0048】
<複数の実施形態に共通のハード構成>
図9は、この発明の複数の実施形態に共通するオーディオ信号の処理装置100の構成を示す。処理装置100は、制御部111と、UI部112と、記憶部113と、ADC114と、信号処理部115と、DAC116と、これらの各要素を接続するバス117とを有する。
【0049】
制御部111は、処理装置100全体の制御回路であり、例えば、1乃至複数のCPUにより構成される。UI部112は、ユーザの操作に応じて、その操作情報を制御部111に供給する操作部と、制御部111から受け取った情報を表示する表示部とを含む。記憶部113は、制御部111に実行される各種のプログラム、処理装置100の制御に用いられる各種の制御情報を記憶するメモリである。ADC114は、図示しないマイク等から供給されるアナログのオーディオ信号をA/D変換し、デジタルのオーディオ信号として出力する。
【0050】
信号処理部115は、2つの機能を有する。1つは、制御部111による制御の下、ADC114などから供給されるデジタル信号に基づいてオンセットヒストグラムを作成する機能である。つまり、制御部111は、記憶部113内のプログラムを実行することにより、信号処理部115を図1の生成部4として機能させる。
【0051】
信号処理部115のもう1つの機能は、制御部111による制御の下、ADC114などから供給されるデジタル信号に対し、信号処理を施し、その結果であるデジタル信号をDAC116に供給する機能である。つまり、制御部111は、信号処理部115を図1の信号処理部2として動作させる。
【0052】
DAC116は、信号処理部115から出力されるデジタル信号をD/A変換し、図9には図示しないスピーカ102等に出力する。
【0053】
次に本実施形態の動作を説明する。処理装置100の電源が投入されると、制御部111は記憶部113に記憶されたメインルーチンを実行する。図10はこのメインルーチンのフローチャートである。制御部111は、まず、初期設定を行う(S101)。この初期設定において、制御部111は、信号処理部115を図1の生成部4及び信号処理部2として機能させるプログラムを記憶部113から読み出し、信号処理部115に設定する。次に制御部111は、処理装置100における種々のイベント(例えば、UI部112のユーザ操作など)の発生を検出する(S102)。次に制御部111は、S102において何らかのイベントが検出されたか否かを判断する(S103)。このS103の判断結果が「NO」である場合、制御部111は、イベントの検出(S102)およびイベントの有無の判断(S103)を繰り返す。S103の判断結果が「YES」である場合、制御部111は検出されたイベントに対応するイベント処理(S104)を実行し、その後、再びイベントの検出(S102)およびイベントの有無の判断(S103)を繰り返す。
【0054】
イベント処理(S104)では、S102において検出されたイベントの種類に応じた処理が実行される。第1、第2実施形態に関して、例えば、S103において、オンセットヒストグラムの作成開始を指示するユーザ操作が検出された場合、制御部111は、オンセットヒストグラムの作成開始を、信号処理部115に対して指示する。信号処理部115の生成部4は、この作成開始の指示に応じて、以降にADC114から供給されるデジタルのオーディオ信号に基づくオンセットピークの検出およびオンセットヒストグラムの作成を開始する。
【0055】
また、S103において、オンセットヒストグラムの表示指示のユーザ操作が検出された場合、制御部111は、S104において、この表示指示に応じて、図11に示すイベント処理を実行する。この表示指示は、例えば、オンセットヒストグラムのグラフ表示を含む、コンプレッサ等の設定画面を、UI部112の表示器に表示させる指示である。
【0056】
まず、制御部111は、その時点に作成済みのオンセットヒストグラムOHを、信号処理部115の生成部4から受け取る(S201)。次に制御部111は、オンセットヒストグラムOHを、UI部112の表示器に表示する(S202)。そして、このイベント処理を終了する。第3ないし第4実施形態についても、同様に、信号処理部115を、生成部43ないし生成部44として動作させてもよい。
【0057】
処理装置100における、制御部111と信号処理部115との役割分担に関しては各種の変形例が考えられる。例えばオンセットヒストグラムOHの生成処理(生成部4)の全部ないし一部を、信号処理部115ではなく、制御部111が実行してもよい。図12は、第4実施形態(ないし第3実施形態)に関して、オンセットヒストグラムの表示指示のユーザ操作が検出された場合に、制御部111が実行するイベント処理のフローチャートである。
【0058】
まず、制御部111は、信号処理部115がADC114から取得したサンプル値SDのうちオンセットヒストグラムの作成対象となる区間内のサンプル値を信号処理部115から受け取る(S301)。例えば、信号処理部115のレコーダ(ないし記録部433)から、指定された時間範囲内のオーディオ信号のサンプルSD(ないし時間フレームごとのピーク)の時系列を受け取る。次に制御部111は、受け取ったサンプル値SD(またはピーク)の時系列に基づいて一連のオンセットピークPoを検出し、検出されたオンセットピークPoに応じてオンセットヒストグラムOHを作成する(S302)。次に制御部111は、オンセットヒストグラムOHをUI部112の表示部に表示する(S303)。そして、このイベント処理を終了する。第1ないし第2実施形態に関しても、同様に、生成部4の処理の全部ないし一部を、制御部111が実行するようにしてもよい。
【0059】
以上、この発明の第1~第4実施形態について説明したが、この発明には他にも実施形態があり得る。例えば次の通りである。
【0060】
(1)上記各実施形態において、処理対象であるオーディオ信号は、1つの楽器の演奏音のオーディオ信号であってもよく、同じ又は異なる種類の複数の楽器の演奏音を混合したオーディオ信号でもよい。
【0061】
(2)オンセットピークの検出に用いるオンセットを、処理装置100が、外部から取得してもよい。例えばMIDI楽器がMIDIデータに基づいて演奏する演奏音など、オーディオ信号とタイミングが揃ったMIDIデータの時系列が取得できる場合、そのMIDIデータの時系列に含まれるノートオンイベントのタイミングを、オンセットのタイミングとしてオンセットピークの検出に用いることができる。
【0062】
(3)オンセットヒストグラムの生成部4の一部ないし全部を、制御部111の管理の下で処理装置100に実装された生成部4以外の処理部と共用してもよい。例えば、コンプレッサ等のオーディオ信号のダイナミクス処理部はエンベロープフォロワを含む場合が多く、その場合、それを上記第2実施形態の生成部4のエンベロープフォロワとして使用できる。
【符号の説明】
【0063】
100,110……オーディオ信号の処理装置、101……マイク、102……パワードスピーカ、103……マルチトラックのレコーダ、111……制御部、112……UI部、113……記憶部、1,114……ADC、2,115……信号処理部、3,116……DAC、4,41,42,43,44……オンセットヒストグラムの生成部、5……表示部、6……パラメータの推定部、7……入力部、411……整流部、412……真数/対数変換部、413,432……ピークの検出部、414,434……オンセットピークの検出部、415,423,435,443……度数のカウント部、421,431……前処理部、422……ラッチ、424……減算部、425……乗算部、426……加算部、427……遅延部、428……比較部、429……時定数部、433……記録部、436,444……検出範囲の指定部、437,445……検出条件の指定部、441……読出部、442……オンセットの処理部。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12