【文献】
中野 倫靖、外2名,MiruSinger:歌を「歌って/聴いて/描いて」見る歌唱力向上支援インタフェース,インタラクション2007予稿集,日本,社団法人情報処理学会,2007年 3月15日
(58)【調査した分野】(Int.Cl.,DB名)
前記軌跡設定手段は、既存の一の選択軌跡を周波数軸方向に移動することが利用者から指示された場合に、当該一の選択軌跡に対して倍音関係にある候補軌跡に沿う選択軌跡を設定する
請求項1から請求項3の何れかの音響解析装置。
【発明を実施するための形態】
【0016】
<第1実施形態>
図1は、本発明の第1実施形態に係る音響解析装置100のブロック図である。
図1に示すように、音響解析装置100は、演算処理装置10と記憶装置12と表示装置14と入力装置16と放音装置18とを具備するコンピュータシステムで実現される。
【0017】
記憶装置12は、演算処理装置10が実行するプログラムPGMや演算処理装置10が使用する各種のデータを記憶する。第1実施形態の記憶装置12は、音響信号Xを記憶する。音響信号Xは、ピッチ(基本周波数)が相違し得る複数の音響成分の混合音を示すサンプル系列である。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置12として任意に採用される。第1実施形態の音響解析装置100は、記憶装置12に記憶された音響信号Xのピッチを解析する信号処理装置である。
【0018】
表示装置14(例えば液晶表示パネル)は、演算処理装置10から指示された画像を表示する。入力装置16は、音響解析装置100に対する利用者からの指示を受付ける機器であり、例えば利用者が操作する複数の操作子を含んで構成される。放音装置18(スピーカやヘッドホン)は、演算処理装置10が生成した分離信号Yに応じた音波を再生する。分離信号Yは、音響信号Xのうち特定の音響成分を強調(理想的には抽出)した信号である。なお、演算処理装置10が生成した分離信号Yをデジタルからアナログに変換するD/A変換器の図示は便宜的に省略した。
【0019】
演算処理装置10は、記憶装置12に記憶されたプログラムPGMを実行することで、音響信号Xを解析するための複数の機能(解析処理部22,表示制御部24,指示受付部26,軌跡設定部28,音響処理部30)を実現する。なお、演算処理装置10の各機能を複数の装置に分散した構成や、演算処理装置10の一部の機能を専用の電子回路(DSP)が実現する構成も採用され得る。
【0020】
解析処理部22は、周波数軸上の各周波数のピッチ尤度L(k,m)を時間軸上の単位期間毎(フレーム毎)に音響信号Xから算定する。記号kは、周波数軸上の任意の1個の周波数(周波数帯域)を意味し、記号mは、時間軸上の任意の1個の単位期間(フレーム)を意味する。1個のピッチ尤度L(k,m)は、第m番目の単位期間にて周波数軸上の第k番目の周波数が音響信号Xのピッチ(基本周波数)に該当する確度(尤度)に相当する。解析処理部22によるピッチ尤度L(k,m)の算定には公知の技術(例えば非特許文献1や特許文献1の技術)が任意に採用され得る。
【0021】
表示制御部24は、音響信号Xから推定されるピッチの時間変化を利用者が視認するための
図2の画像(以下「解析画像」という)50を表示装置14に表示させる。
図2に示すように、解析画像50は、周波数-時間領域52が配置されたGUI(Graphical User Interface)である。周波数-時間領域52は、相互に交差する周波数軸AFと時間軸ATとが設定された座標平面である。
【0022】
表示制御部24は、解析処理部22による解析結果を周波数-時間領域52内に表示する。すなわち、表示制御部24は、
図2に示すように、解析処理部22が単位期間毎に算定する各ピッチ尤度L(k,m)の分布を周波数-時間領域52内に表示させる。具体的には、利用者が周波数-時間領域52内での各ピッチ尤度L(k,m)の高低を視覚的に把握できるように、周波数-時間領域52内の各地点の表示態様(例えば明度,彩度,色相)がピッチ尤度L(k,m)に応じて可変に設定される。例えば、周波数-時間領域52内でピッチ尤度L(k,m)が高い地点ほど高階調で表示される。したがって、
図2から理解されるように、単位期間毎のピッチ尤度L(k,m)のピークを時間軸ATの方向に配列した軌跡(以下「候補軌跡」という)P0が、利用者により視覚的に識別可能な状態で周波数-時間領域52内に表示される。音響信号Xは複数の音響成分の混合音の信号であるから、周波数軸AFの方向の位置と時間軸ATの方向の位置とが相違する複数の候補軌跡P0が周波数-時間領域52内に配置される。各候補軌跡P0は時間軸AT上で相互に重複し得る。周波数軸AF上でピッチ尤度L(k,m)がピークとなる周波数(候補軌跡P0上の各周波数)は音響信号Xのピッチに該当する可能性が高い。
【0023】
表示制御部24は、入力装置16に対する利用者からの指示に応じて周波数-時間領域52の表示倍率を可変に制御する。また、表示制御部24は、音響信号Xのうち時間軸上の一部の区間に対応するピッチ尤度L(k,m)の分布を解析画像50内に表示し、音響信号Xのうちピッチ尤度L(k,m)が解析画像50内に表示される区間を、利用者からの指示に応じて変更(周波数-時間領域52を時間軸ATの方向にスクロール)する。
【0024】
利用者は、周波数-時間領域52内の各ピッチ尤度L(k,m)の分布(各候補軌跡P0)を参照しながら入力装置16を適宜に操作することで、
図3の部分(A)に示すように、周波数-時間領域52内の任意の位置に所望の軌跡(以下「指示軌跡」という)PAを指定することが可能である。具体的には、利用者は、音響信号Xのうち分離対象となる所望の音響成分の周波数に近い候補軌跡P0に概略的に沿うように入力装置16のマウスをドラッグすることで指示軌跡PAを指定する。利用者は、所望の候補軌跡P0に概略的に沿うように指示軌跡PAを指定すれば足り、候補軌跡P0に厳密に合致するように指示軌跡PAを指定する必要はない。
図1の指示受付部26は、周波数-時間領域52に対する指示軌跡PAの指定を利用者から受付ける要素である。なお、
図3の部分(A)では便宜的に指示軌跡PAを図示したが、実際の解析画像50では指示軌跡PAは表示されない。ただし、指示軌跡PAを候補軌跡P0とともに表示することも可能である。
【0025】
図1の軌跡設定部28は、表示装置14に表示された各候補軌跡P0と指示受付部26が利用者から受付けた指示軌跡PAとに応じた選択軌跡PBを設定して周波数-時間領域52内に配置する。選択軌跡PBと候補軌跡P0とは、利用者が両軌跡を視覚的に区別できるように相異なる表示態様(例えば明度,彩度,色相)で表示される。
【0026】
第1実施形態の選択軌跡PBは、周波数-時間領域52内で指示軌跡PAに対応した位置の候補軌跡P0に沿う軌跡(曲線または折線)である。第1実施形態の軌跡設定部28は、
図3の部分(B)に示すように、指示受付部26が利用者から受付けた指示軌跡PA上の1個の地点pAを包含する周波数軸AFの方向の所定の範囲R内でピッチ尤度L(k,m)が最大となる候補軌跡P0上の地点p0を、指示軌跡PA上の各地点pAについて配列した軌跡を、選択軌跡PBとして設定する。したがって、選択軌跡PBは、時間軸上で指示軌跡PAと同等の区間(指示軌跡PAの端点間の区間)にわたる。
【0027】
以上の説明から理解されるように、周波数-時間領域52内に利用者が概略的に指定した指示軌跡PAが既定の候補軌跡P0にスナップされる。ただし、指示軌跡PA上の地点pAを含む範囲R内に候補軌跡P0が存在しない場合(指示軌跡PAが何れの候補軌跡P0からも離れている場合)には、軌跡設定部28は、利用者が指定した指示軌跡PA自体を選択軌跡PBとして確定する。指示軌跡PAの指定毎に軌跡設定部28が選択軌跡PBを設定することで、周波数-時間領域52内には複数の選択軌跡PBが配置される。
【0028】
利用者は、周波数-時間領域52内に配置された1個以上の選択軌跡PBを処理対象に選択して編集を指示することが可能である。具体的には、軌跡設定部28は、利用者が選択した選択軌跡PBに対して、選択軌跡PBの延長(付足し)や短縮,削除,複製,貼付等の編集作業を実行する。なお、編集対象の選択軌跡PBを利用者からの指示に応じて選択する方法は任意である。例えば、周波数-時間領域52のうち利用者がラバーバンド(矩形領域の対角線長を制御)やフリーハンドで指定した領域内の各選択軌跡PBを軌跡設定部28が選択する構成が採用される。また、周波数軸AFや時間軸ATの軸上に利用者が指定した範囲内の各選択軌跡PBを軌跡設定部28が選択する構成や、利用者が指定した数値範囲内の時間長の選択軌跡PBを軌跡設定部28が選択する構成も好適である。また、入力装置16の所定の操作子を押下しながら各選択軌跡PBを順次に指定することで複数の選択軌跡PBを選択することも可能である。
【0029】
利用者が入力装置16を適宜に操作して選択軌跡PBの保存(エクスポート)を指示すると、軌跡設定部28は、現段階で周波数-時間領域52内に設定されている各選択軌跡PBを指定するファイル(以下「軌跡ファイル」という)を生成して記憶装置12に格納する。他方、利用者が入力装置16を操作して軌跡ファイルの読込(インポート)を指示すると、軌跡設定部28は、記憶装置12に記憶された軌跡ファイルで指定された各選択軌跡PBを周波数-時間領域52内に配置する。なお、以上の説明では、解析処理部22による解析結果に対して指定および保存(エクスポート)された軌跡ファイルの読込を例示したが、公知の各種のピッチ推定技術で特定されたピッチの時間軌跡を示す軌跡ファイル(すなわち、軌跡設定部28が生成した軌跡ファイル以外の軌跡ファイル)を読込むことも可能である。
【0030】
図1の音響処理部30は、軌跡設定部28が設定した選択軌跡PBに対応するピッチの分離信号Yを生成する。具体的には、音響処理部30は、利用者が入力装置16の操作で音響信号Xの分離を音響解析装置100に指示した場合に分離信号Yの生成を開始する。第1実施形態の分離信号Yは、音響信号Xのうち選択軌跡PBが示すピッチの音響成分を強調した音響信号である。
【0031】
具体的には、音響処理部30は、各選択軌跡PBに対応した音響成分を強調するためのフィルタ(以下「分離フィルタ」という)を単位期間毎に生成して音響信号Xに順次に作用させることで分離信号Yを生成する。分離フィルタは、周波数軸上の相異なる周波数に対応する複数の係数値の系列である。第1実施形態の分離フィルタは、選択軌跡PBが示すピッチとその倍音周波数とに対応する係数値を1に設定するとともに残余の係数値を0に設定したバイナリマスクである。音響処理部30は、音響信号Xの各単位期間の周波数スペクトルに分離フィルタを乗算して時間領域に変換することで分離信号Yを生成する。音響処理部30が生成した分離信号Yが放音装置18に供給されて音波として再生される。したがって、利用者は、自身が指定した指示軌跡PAに対応する選択軌跡PBのピッチの音響成分が強調された再生音を聴取することが可能である。
【0032】
他方、表示制御部24は、
図2に示すように、現在の再生地点を示す再生指示子(カーソル)54を周波数-時間領域52内に配置し、分離信号Yの再生の進行とともに再生指示子54の時間軸上の位置を変化させる。利用者は、分離信号Yの再生音を聴取するとともに解析画像50(各選択軌跡PBと再生指示子54との関係)を視認することで、周波数-時間領域52内の各候補軌跡P0や各選択軌跡PBと、音響信号Xの各音響成分の発音および消音の時点や音高との関係を直観的に把握することが可能である。また、分離信号Yの再生音の聴取や解析画像50の視認に並行して、利用者は、各選択軌跡PBの編集や新規な選択軌跡PBの追加(指示軌跡PAの指定)を音響解析装置100に指示することが可能である。
【0033】
以上に説明した第1実施形態では、周波数-時間領域52内に配置された候補軌跡P0が利用者からの指示(指示軌跡PAの指定)に応じて選択軌跡PBとして選択されるから、音響信号Xの特定の音響成分のピッチを利用者が直観的かつ容易に選択することが可能である。第1実施形態では特に、利用者が指定した指示軌跡PAを候補軌跡P0にスナップすることで選択軌跡PBが設定されるから、所望の選択軌跡PBを利用者が容易に選択できるという効果は格別に顕著である。
【0034】
<第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
【0035】
図4は、第2実施形態における音響解析装置100のブロック図である。
図4に示すように、第2実施形態の音響解析装置100は、第1実施形態に軌跡分類部32を追加した構成である。軌跡分類部32は、軌跡設定部28が周波数-時間領域52内に設定した複数の選択軌跡PBを複数のグループ(以下「軌跡グループ」という)Gに区分する。1個の軌跡グループGには1個以上の選択軌跡PBが包含される。具体的には、軌跡分類部32は、利用者が入力装置16の操作で任意に指定した複数の選択軌跡PBをひとつの軌跡グループGに分類する。例えば、利用者は、所望の楽器の音響成分に該当すると推定される複数の選択軌跡PB(例えば利用者の所望の楽器の音域内に存在する複数の選択軌跡PB)を1個の軌跡グループGの要素として選択することが可能である。なお、各軌跡グループGに分類される選択軌跡PBの選択には第1実施形態と同様の方法(例えば利用者が周波数-時間領域52内にラバーバンドやフリーハンドで指定した領域内の選択軌跡PBを選択する構成)が採用され得る。
【0036】
表示制御部24は、周波数-時間領域52内に配置された複数の選択軌跡PBの各々の表示態様を軌跡グループG毎に相違させる。また、利用者は、各選択軌跡PBについて実行され得る処理の有無(有効/無効)を軌跡グループG毎に個別に指示することが可能である。具体的には、表示制御部24は、選択軌跡PBの表示の有無を軌跡グループG毎に利用者からの指示に応じて制御する。したがって、例えば利用者が指示した軌跡グループGの各選択軌跡PBのみが周波数-時間領域52内に表示され、残余の軌跡グループGの各選択軌跡PBは非表示に制御される。以上の説明から理解されるように、各選択軌跡PBの表示に着目すると、軌跡グループG毎に別個のレイヤが設定されるとも換言され得る。各軌跡グループGの選択軌跡PBが配置された複数のレイヤを相互に重ねることで解析画像50が形成される。また、音響処理部30は、分離信号Yでの強調の有無を軌跡グループG毎に利用者からの指示に応じて制御する。例えば、音響処理部30は、音響信号Xのうち利用者が指示した軌跡グループGの各選択軌跡PBに対応する音響成分のみを選択的に強調することで分離信号Yを生成する。
【0037】
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、各選択軌跡PBが複数の軌跡グループGに分類されて軌跡グループG毎に相異なる表示態様で表示されるから、特定の軌跡グループGの各選択軌跡PB(例えば特定の楽器の音響成分に対応する選択軌跡PB)のみを利用者が直観的に把握できるという利点がある。また、軌跡グループG毎に各種の処理の有無が個別に制御されるから、特定の軌跡グループGの選択軌跡PBに対応する音響成分の再生音を聴取しながらその軌跡グループGの選択軌跡PBのみを選択的に表示および編集するという具合に、多様かつ容易な操作が実現されるという利点もある。
【0038】
<第3実施形態>
図5は、第3実施形態における軌跡設定部28の動作の説明図である。
図5の部分(A)に示すように、第3実施形態の表示制御部24は、音響信号Xの各ピッチ尤度L(k,m)に対応する候補軌跡P0の各端点e0を特定する。端点e0は、周波数-時間領域52内でピッチ尤度L(k,m)が時間方向に不連続または急激に変化(増加または減少)する地点である。以上の説明から理解されるように、音響信号Xの各音響成分の発音の始点および終点が端点e0に相当する。
【0039】
図5の部分(A)に示すように、候補軌跡P0の端点e0の周辺領域(例えば端点e0を中心とする所定径の円形領域)C内に利用者が指示軌跡PAの端点eAを指定した場合、軌跡設定部28は、
図5の部分(B)に示すように、候補軌跡P0の端点e0を端点としてその候補軌跡P0に沿う選択軌跡PBを設定する。すなわち、利用者が指定した指示軌跡PAの端点eAが候補軌跡P0の端点e0にスナップされる。なお、各候補軌跡P0の端点e0の周辺領域Cの外側に指示軌跡PAの端点eAが指定された場合、指示軌跡PAの端点eAを端点とする選択軌跡PBが設定される。
【0040】
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態では、選択軌跡PBの端点が候補軌跡P0の端点e0に自動的に調整されるから、音響信号Xの各音響成分の発音の始点から終点までの選択軌跡PBを利用者が容易に設定できる。したがって、音響信号Xの各音響成分を発音の始点から終点まで分離信号Yにて高精度に強調できるという利点がある。なお、第3実施形態を第2実施形態に適用することも可能である。
【0041】
<第4実施形態>
図6は、第4実施形態における解析画像50の模式図である。なお、
図6では、選択軌跡PBの図示は便宜的に省略されている。
図6に示すように、第4実施形態の表示制御部24は、周波数-時間領域52内の各候補軌跡P0のうち時間軸ATに略平行に延在する部分(以下「定常部分」という)Q1と定常部分Q1以外の部分(以下「変動部分」という)Q2とを相異なる表示態様(
図6では実線/破線)で表示する。具体的には、各候補軌跡P0の定常部分Q1は変動部分Q2に対して強調表示(例えば太線や高階調で表示)される。表示制御部24が定常部分Q1と変動部分Q2とを区別する方法は任意であるが、例えば、候補軌跡P0のうち所定長にわたり連続して周波数が所定幅の帯域内に維持される区間を定常部分Q1と判定する方法が好適である。利用者が指定した指示軌跡PAに応じて候補軌跡P0に沿った選択軌跡PBが設定される点は前述の各形態と同様である。
【0042】
各音響成分のピッチの時間変動の度合は音響成分毎(楽曲のパート毎)に相違する。例えば、歌唱曲の主旋律を担当する歌唱音はビブラートやポルタメント等によりピッチが変動し易いが、歌唱曲の伴奏を担当する楽器音(例えばピアノやギターやベース等の演奏音)は、1回の発音の間でピッチが変動し難いという概略的な傾向がある。第4実施形態では、定常部分Q1(例えば伴奏の演奏音である可能性が高い部分)と変動部分Q2(例えば主旋律の歌唱音である可能性が高い部分)とを利用者が視覚的に区別しながら指示軌跡PA(更には選択軌跡PB)を指定できるという利点がある。
【0043】
<第5実施形態>
第5実施形態の音響解析装置100に対し、利用者は、入力装置16を適宜に操作することで特定の調波構造を指定することが可能である。例えば、クラリネット等の閉管楽器の調波構造が指定され得る。
【0044】
表示制御部24が表示装置14に表示させる解析画像50の周波数-時間領域52内には、音響信号Xの各音響成分のピッチに対応する候補軌跡P0に加えて各ピッチの倍音周波数に対応する周波数軸AF上の位置にも候補軌跡P0が表示され得る。表示制御部24は、周波数-時間領域52内の複数の候補軌跡P0のうち利用者が指定した調波構造に対応する候補軌跡P0を強調表示する。例えば、閉管楽器の調波構造には、奇数次倍音が偶数次倍音と比較して顕著であるという傾向がある。したがって、利用者が閉管楽器の調波構造を指定した場合、表示制御部24は、特定の候補軌跡P0(例えば選択軌跡PBが設定された候補軌跡P0)に対して奇数倍の周波数に位置する候補軌跡P0を強調表示する。また、オーボエ等の管楽器の調波構造には、低次側の倍音成分が基音成分と比較して顕著であるという傾向がある。したがって、利用者がオーボエ等の管楽器の調波構造を指定した場合、表示制御部24は、低次側の倍音成分のピッチ尤度L(k,m)が基音成分のピッチ尤度L(k,m)と比較して高い関係にある各候補軌跡P0を強調表示する。
【0045】
第5実施形態においても第1実施形態と同様の効果が実現される。また、第5実施形態では、周波数-時間領域52内の複数の候補軌跡P0のうち特定の調波構造に対応する候補軌跡P0が強調表示されるから、所望の調波構造に対応する選択軌跡PBを利用者が容易に選択できるという利点がある。なお、第5実施形態を第2実施形態から第4実施形態に適用することも可能である。
【0046】
<第6実施形態>
図7は、第6実施形態における軌跡設定部28の動作の説明図である。利用者は、入力装置16を操作することで、周波数-時間領域52内の所望の選択軌跡PBについて周波数軸AF方向に対する移動を指示する(例えば既存の選択軌跡PBを入力装置16のマウスでドラッグする)ことが可能である。
【0047】
図7の部分(A)に例示された選択軌跡PB[1]について周波数軸AF方向への移動が指示された場合、軌跡設定部28は、
図7の部分(B)に例示されるように、選択軌跡PB[1]に対して倍音関係(選択軌跡PB[1]が示すピッチの整数倍の関係)にある候補軌跡P0に沿う選択軌跡PB[2]を設定する。具体的には、軌跡設定部28は、移動前の選択軌跡PB[1]が示すピッチの整数倍の各周波数に対応する複数の候補軌跡P0のうち、利用者が指定した移動先の近傍に位置する候補軌跡P0に沿うように選択軌跡PB[2]を設定する。すなわち、選択軌跡PB[1]が移動先の候補軌跡P0にスナップされるとも換言され得る。選択軌跡PB[2]の時間軸AT上の区間は選択軌跡PB[1]と同様である。ただし、第3実施形態と同様に、選択軌跡PB[2]の端点を移動先の候補軌跡P0の端点e0に調整することも可能である。また、
図7の部分(B)から理解されるように、移動先の選択軌跡PB[2]が設定されると移動元の選択軌跡PB[1]は消去される。なお、以上の例示では選択軌跡PB[1]を移動先の候補軌跡P0に自動的にスナップしたが、選択軌跡PB[1]を倍音関係の周波数に単純に平行移動させる構成(すなわち、選択軌跡PBの形状が移動の前後で変化しない構成)も採用され得る。
【0048】
第6実施形態においても第1実施形態と同様の効果が実現される。また、第6実施形態では、既存の選択軌跡PB[1]が倍音関係にある選択軌跡PB[2]に移動されるから、利用者の所望のピッチから1オクターブだけずれた周波数に選択軌跡PBが設定された場合(例えば、利用者が所望の音響成分のピッチから1オクターブずれた位置に指示軌跡PAを指定した場合)に、選択軌跡PBの位置を利用者の所望の周波数に容易に修正できるという利点がある。なお、第6実施形態を第2実施形態から第5実施形態に適用することも可能である。
【0049】
以上の例示では、移動前の選択軌跡PB[1]を消去する形式の移動を例示したが、移動前の選択軌跡PB[1]を維持したまま移動後の選択軌跡PB[2]を設定すること(複製)も可能である。また、選択軌跡PBの複製を複数回にわたり反復することで、基音成分と各倍音成分とに対応する選択軌跡PBを容易に設定することが可能である。また、第2実施形態の軌跡分類部32が、選択軌跡PB[1]とこれを複製した各選択軌跡PB[2]とを1個の軌跡グループG(第2実施形態)に分類する構成も好適である。以上の説明から理解されるように、選択軌跡PBの「移動」は、操作前の選択軌跡PBが消去される狭義の「移動」と、移動前の選択軌跡PBが維持される「複製」との双方を包含する概念である。
【0050】
また、以上の例示では、選択軌跡PB[1]に対して任意の次数の倍音関係にある選択軌跡PB[2]を設定可能な構成を例示したが、選択軌跡PB[1]に対する倍音成分の次数毎に選択軌跡PB[1]の移動の可否を利用者からの指示に応じて設定可能な構成も採用され得る。例えば、クラリネット等の閉管楽器については、選択軌跡PB[1]の周波数に対して奇数次倍音の周波数の位置に移動後の選択軌跡PB[2]を設定することは許可されるが、偶数次倍音の周波数の位置に選択軌跡PB[2]を設定することは禁止されるという具合である。以上の構成によれば、特定の調波構造に対応する複数の選択軌跡PBを容易に設定できるという利点がある。
【0051】
<変形例>
以上に例示した各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から選択された2以上の態様は相互に矛盾しない範囲で適宜に併合され得る。
【0052】
(1)前述の各形態では、各選択軌跡PBに対応した分離フィルタを音響信号Xに作用させて分離信号Yを生成したが、音響処理部30が分離信号Yを生成する方法は適宜に変更される。例えば、前述の各形態では、各係数値が2値に設定されたバイナリフィルタを分離フィルタとして例示したが、各係数値が多値的に設定されたフィルタ(例えばウィーナフィルタ)を分離フィルタとして利用することも可能である。
【0053】
また、選択軌跡PBに対応する周波数の純音(ビープ音)を示す分離信号Yを音響処理部30が音響信号Xとは独立に生成する構成も採用される。選択軌跡PBに対応する周波数の純音とその倍音周波数の各純音との混合音の分離信号Yを音響処理部30が音響信号Xとは独立に生成することも可能である。以上のように分離信号Yを簡易的に生成する構成(音響信号Xに対する音響処理を実行しない構成)によれば、分離フィルタを生成して音響信号Xに作用させる構成と比較して音響処理部30の処理負荷が軽減されるという利点がある。また、分離フィルタを利用した分離信号Yの生成と純音の分離信号Yの簡易的な生成とを、利用者からの指示に応じて音響処理部30が選択的に実行することも可能である。以上の説明から理解されるように、音響処理部30は、選択軌跡PBに対応するピッチの分離信号Yを生成する要素として包括される。
【0054】
(2)前述の各形態では、
図3を参照して説明した通り、利用者が指定した指示軌跡PA上の1個の地点pAを包含する範囲R内でピッチ尤度L(k,m)が最大となる候補軌跡P0上の各地点p0の配列を選択軌跡PBとして設定したが、軌跡設定部28が選択軌跡PBを設定する方法は以上の例示に限定されない。例えば、
図8に示すように、指示軌跡PA上の各地点pAに対して周波数軸AF方向に加重値w(w[1],w[2])の分布Dを設定し、周波数-時間領域52内の各候補軌跡P0上の地点p0のピッチ尤度L(k,m)に対して分布Dのうちその地点p0での加重値wを付加(例えば乗算)した数値が最大となる候補軌跡P0上の地点p0の配列を、軌跡設定部28が選択軌跡PBとして設定することも可能である。
【0055】
例えば、
図8に例示された候補軌跡P0[1]と候補軌跡P0[2]とに着目すると、候補軌跡P0[1]上の地点p0のピッチ尤度L(k1,m)にその地点p0での加重値w[1]を乗算した数値w[1]・L(k1,m)と、候補軌跡P0[2]上の地点p0のピッチ尤度L(k2,m)にその地点p0での加重値w[2]を乗算した数値w[2]・L(k2,m)とを比較して、大きい方に対応する地点p0(候補軌跡P0[1]および候補軌跡P0[2]の一方の地点p0)が選択軌跡PB上の地点として採択される。加重値wの分布Dは、指示軌跡PA上の地点pAで加重値wが最大となり、地点pAから離れるほど加重値wが小さい数値となるように選定される。例えば正規分布等の公知の確率分布が加重値の分布Dとして好適に採用され得る。以上の構成では、ピッチ尤度L(k,m)は低いが指示軌跡PA上の地点pAに近い候補軌跡P0が選択軌跡PBとして選択されるから、利用者の意図(指示軌跡PA)を充分に反映した選択軌跡PBを設定できるという利点がある。
【0056】
(3)周波数-時間領域52内に設定された複数の選択軌跡PBの各々について分離信号Yを個別に生成して記憶装置12に格納する構成が採用され得る。例えば、音響処理部30は、音響信号Xのうち各選択軌跡PBに対応する区間にその選択軌跡PBに応じた分離フィルタを作用させることで選択軌跡PB毎に分離信号Yを生成して記憶装置12に格納する。
【0057】
そして、音響処理部30は、周波数-時間領域52に対する利用者からの指示に応じて各選択軌跡PBの分離信号Yを放音装置18に供給して再生する。例えば、周波数-時間領域52内の指定点(例えばマウスポインタの位置やタッチパネルを入力装置16として利用した場合のタッチ位置)を利用者が入力装置16の操作で特定の選択軌跡PBに沿って移動させると、音響処理部30は、その選択軌跡PBに対応した分離信号Yを指定点の移動速度に応じた再生速度で放音装置18に供給する。なお、再生速度の制御には公知の技術が任意に採用され得るが、再生音のピッチが音響信号Xでのピッチに維持されるように再生速度を変化させる技術(例えばフェーズボコーダ)が好適である。以上の構成によれば、音響信号Xのうち利用者の所望の音響成分(例えば特定の楽器音)を任意の速度で再生できるという利点がある。
【0058】
また、分離信号Yの再生方向(順方向/逆方向)を指定点の移動方向に応じて制御することも可能である。例えば、音響処理部30は、時間軸ATの下流側(時間が経過する方向)に指定点を移動させた場合には分離信号Yを順方向に再生し、時間軸ATの上流側(時間が遡及する方向)に指定点を移動させた場合には分離信号Yを逆方向に再生する。
【0059】
(4)前述の各形態では表示装置14とは別体の入力装置16を例示したが、表示装置14と一体に構成されたタッチパネルを入力装置16として採用することも可能である。例えば、利用者は、表示装置14の表示面(操作面)に対するドラッグ操作(表示面を指でなぞる操作)で指示軌跡PAを指定することが可能である。ただし、表示面に対するドラッグ操作を周波数-時間領域52のスクロールに割当てた場合、指示軌跡PAを指定するドラッグ操作と周波数-時間領域52をスクロールさせるドラッグ操作とを区別する必要がある。例えば、周波数-時間領域52に対して所定のタップ操作(例えばダブルタップやロングタップ)が付与された場合に指示軌跡PAの指定を受付ける受付状態に遷移し、指示受付部26は、利用者によるドラッグ操作に応じた指示軌跡PAの指定を受付ける。受付状態では、各候補軌跡P0の表示態様を変化させる(例えば各候補軌跡P0を点滅させる)構成が好適である。また、周波数軸AFのうち表示面に接触した2本の指の間に対応する帯域内に限定して選択軌跡PBの設定(指示軌跡PAの指定)を許可することも可能である。表示面に接触した2本の指の間隔を変化させるピンチイン操作やピンチアウト操作に応じて表示制御部24が周波数-時間領域52の表示倍率を変化(ズームイン/ズームアウト)させる構成も好適である。
【0060】
また、周波数-時間領域52内に設定された選択軌跡PBに対する所定のタッチ操作(例えばダブルタップやロングタップ)でその選択軌跡PBを選択状態に遷移させ、選択状態の選択軌跡PBに関連する処理を表示面に対するタッチ操作で指示することも可能である。例えば、選択状態の選択軌跡PBに対してタップ操作(表示面を指で叩く操作)が付与された場合にその選択軌跡PBの音響成分が再生される構成や、表示面に接触する2本の指の間隔に応じて選択状態の選択軌跡PBを時間軸ATの方向に伸縮する構成、あるいは、選択状態の選択軌跡PBに対してフリック操作(表示面に接触した指を弾く操作)が付与された場合にその選択軌跡PBを削除する構成が採用される。また、指2本でのドラッグ操作が選択軌跡PBに対して付与された場合にはその選択軌跡PBを移動し、指1本でのドラッグ操作が選択軌跡PBに対して付与された場合にはその選択軌跡PBを複製するという具合に、表示面に対するタッチ操作の種類に応じて選択状態の選択軌跡PBに対する編集内容を相違させることも可能である。なお、表示面に所定のタップ操作(例えば選択状態の選択軌跡PBから離れた位置のタップ操作)が付与された場合に選択軌跡PBの選択状態は解除される。
【0061】
周波数-時間領域52内に設定された任意の選択軌跡PBを表示面に対するタッチ操作に応じて選択する構成も好適である。例えば、表示面に接触する2本の指を対角とする矩形領域(ラバーバンド)内の選択軌跡PBを選択する構成や、表示面に対する3個以上の接触点を通過する閉領域内の選択軌跡PBを選択する構成が採用される。
【0062】
(5)前述の各形態では、音響信号Xのうち選択軌跡PBに対応する音響成分を強調する構成を例示したが、音響信号Xのうち選択軌跡PBに対応する音響成分を抑圧することで分離信号Yを生成することも可能である。例えば、音響処理部30は、相異なる周波数に対応する複数の係数値のうち選択軌跡PBが示すピッチとその倍音周波数とに対応する係数値を0に設定するとともに残余の係数値を1に設定した分離フィルタを音響信号Xに作用させる。
【0063】
(6)前述の各形態では、音響信号Xから算定されたピッチ尤度L(k,m)を周波数-時間領域52内に表示したが、例えば公知のピッチ検出技術(単音ピッチ検出または複音ピッチ検出)を利用して音響信号Xから検出されたピッチの時間変化を周波数-時間領域52内に候補軌跡P0として表示することも可能である。以上の説明から理解されるように、候補軌跡P0は、音響信号Xから特定(典型的には推定または検出)されたピッチの時間変化を表現する軌跡として包括される。
【0064】
(7)前述の各形態では、音響処理部30を具備する音響解析装置100を例示したが、周波数-時間領域52内の各候補軌跡P0について利用者からの指示(指示軌跡PA)に応じた選択軌跡PBを設定するという機能のみに着目すると、音響処理部30は省略され得る。また、ピッチ尤度L(k,m)が外部装置から通知される構成では解析処理部22が省略される。