(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-16
(45)【発行日】2024-12-24
(54)【発明の名称】音響処理システム、音響処理方法およびプログラム
(51)【国際特許分類】
G10H 1/00 20060101AFI20241217BHJP
G10G 1/00 20060101ALI20241217BHJP
【FI】
G10H1/00 102Z
G10G1/00
(21)【出願番号】P 2020185740
(22)【出願日】2020-11-06
【審査請求日】2023-09-21
(73)【特許権者】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】110003177
【氏名又は名称】弁理士法人旺知国際特許事務所
(72)【発明者】
【氏名】前澤 陽
(72)【発明者】
【氏名】磯崎 善政
【審査官】土井 悠生
(56)【参考文献】
【文献】国際公開第2018/016638(WO,A1)
【文献】特開2013-003205(JP,A)
【文献】特開2018-063295(JP,A)
【文献】特開2014-056232(JP,A)
【文献】特開2004-258564(JP,A)
【文献】特開2009-216873(JP,A)
【文献】特開2010-134790(JP,A)
【文献】特開2017-207615(JP,A)
【文献】国際公開第2019/058942(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10H 1/00-7/12
G10G 1/00-7/02
(57)【特許請求の範囲】
【請求項1】
第1音源の音響
と第2音源の音響とを収録した音響信号を解析する解析処理を実行する音響解析部であって、前記解析処理は、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む音響解析部と、
前記発音指標の時系列と前記音高の時系列とを共通の時間軸のもとで表示装置に表示させる表示制御部と
を具備
し、
前記第1処理は、
前記音響信号の強度に応じた第1指標を算定する処理と、
前記第2音源について音符毎の発音強度を指定する演奏データから、前記第2音源の音響成分の強度に応じた第2指標を算定する処理と、
前記第1指標から第2指標を減算する処理とを含み、
前記発音指標は、前記減算の結果に応じた指標である
音響処理システム。
【請求項2】
前記第2指標を算定する処理には、利用者からの指示に応じて設定された第1変数が適用され、
前記第1変数に応じて前記第2指標が変化する
請求項
1の音響処理システム。
【請求項3】
第1音源の音響を収録した音響信号を解析する解析処理を実行する音響解析部であって、前記解析処理は、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、
前記第1音源の音響成分が存在する発音期間を特定する第2処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む音響解析部と、
前記発音指標の時系列と
前記発音期間と前記音高の時系列とを共通の時間軸のもとで表示装置に表示させる表示制御部と
を具備
し、
前記第2処理には、利用者からの指示に応じて設定された第2変数が適用され、
前記第2変数に応じて前記発音期間が変化する
音響処理システム。
【請求項4】
第1音源の音響を収録した音響信号を解析する解析処理を実行する音響解析部であって、前記解析処理は、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、
前記第1音源の音響成分の音高の時系列を特定する第3処理とを含む音響解析部と、
前記発音指標の時系列と前記音高の時系列と
前記音高が変化する時点である発音点とを共通の時間軸のもとで表示装置に表示させる表示制御部と
を具備
し、
前記第3処理には、利用者からの指示に応じて設定された第3変数が適用され、
前記第3変数に応じて前記発音点の個数が変化する
音響処理システム。
【請求項5】
第1音源の音響
と第2音源の音響とを収録した音響信号を解析する解析処理であって、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む解析処理を実行し、
前記発音指標の時系列と前記音高の時系列とを共通の時間軸のもとで表示装置に表示
し、
前記第1処理は、
前記音響信号の強度に応じた第1指標を算定する処理と、
前記第2音源について音符毎の発音強度を指定する演奏データから、前記第2音源の音響成分の強度に応じた第2指標を算定する処理と、
前記第1指標から第2指標を減算する処理とを含み、
前記発音指標は、前記減算の結果に応じた指標である
コンピュータシステムにより実現される音響処理方法。
【請求項6】
第1音源の音響を収録した音響信号を解析する解析処理であって、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、
前記第1音源の音響成分が存在する発音期間を特定する第2処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む解析処理を実行し、
前記発音指標の時系列と
前記発音期間と前記音高の時系列とを共通の時間軸のもとで表示装置に表示
し、
前記第2処理には、利用者からの指示に応じて設定された第2変数が適用され、
前記第2変数に応じて前記発音期間が変化する
コンピュータシステムにより実現される音響処理方法。
【請求項7】
第1音源の音響を収録した音響信号を解析する解析処理であって、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、
前記第1音源の音響成分の音高の時系列を特定する第3処理とを含む解析処理を実行し、
前記発音指標の時系列と前記音高の時系列と
前記音高が変化する時点である発音点とを共通の時間軸のもとで表示装置に表示
し、
前記第3処理には、利用者からの指示に応じて設定された第3変数が適用され、
前記第3変数に応じて前記発音点の個数が変化する
コンピュータシステムにより実現される音響処理方法。
【請求項8】
第1音源の音響
と第2音源の音響とを収録した音響信号を解析する解析処理を実行する音響解析部であって、前記解析処理は、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む音響解析部、および、
前記発音指標の時系列と前記音高の時系列とを共通の時間軸のもとで表示装置に表示させる表示制御部
、
としてコンピュータシステムを機能させるプログラムであって、
前記第1処理は、
前記音響信号の強度に応じた第1指標を算定する処理と、
前記第2音源について音符毎の発音強度を指定する演奏データから、前記第2音源の音響成分の強度に応じた第2指標を算定する処理と、
前記第1指標から第2指標を減算する処理とを含み、
前記発音指標は、前記減算の結果に応じた指標である
プログラム。
【請求項9】
第1音源の音響を収録した音響信号を解析する解析処理を実行する音響解析部であって、前記解析処理は、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、
前記第1音源の音響成分が存在する発音期間を特定する第2処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む音響解析部、および、
前記発音指標の時系列と
前記発音期間と前記音高の時系列とを共通の時間軸のもとで表示装置に表示させる表示制御部
、
としてコンピュータシステムを機能させるプログラムであって、
前記第2処理には、利用者からの指示に応じて設定された第2変数が適用され、
前記第2変数に応じて前記発音期間が変化する
プログラム。
【請求項10】
第1音源の音響を収録した音響信号を解析する解析処理を実行する音響解析部であって、前記解析処理は、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、
前記第1音源の音響成分の音高の時系列を特定する第3処理とを含む音響解析部、および、
前記発音指標の時系列と前記音高の時系列と
前記音高が変化する時点である発音点とを共通の時間軸のもとで表示装置に表示させる表示制御部
、
としてコンピュータシステムを機能させるプログラムであって、
前記第3処理には、利用者からの指示に応じて設定された第3変数が適用され、
前記第3変数に応じて前記発音点の個数が変化する
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、音響信号を解析する技術に関する。
【背景技術】
【0002】
楽曲の再生を演奏者による演奏に追従させる技術が従来から提案されている。例えば特許文献1には、楽曲の演奏により発音される楽音を表す音響信号の解析により楽曲内の演奏位置を推定し、推定結果に応じて楽曲の自動演奏を制御する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
演奏位置の推定には、音響信号との照合に利用される参照データを事前に用意する必要がある。参照データの生成には、事前の演奏により発音される楽音を表す参照信号の解析と、利用者からの指示に応じて解析結果を修正する処理とが必要である。以上の状況を背景として、参照データを生成する過程における参照信号の解析結果を利用者が容易に確認および修正するための技術の実現が要求されている。
【課題を解決するための手段】
【0005】
以上の課題を解決するために、本開示のひとつの態様に係る音響処理システムは、第1音源の音響を収録した音響信号を解析する解析処理を実行する音響解析部であって、前記解析処理は、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む音響解析部と、前記発音指標の時系列と前記音高の時系列とを共通の時間軸のもとで表示装置に表示させる表示制御部とを具備する。
【0006】
本開示のひとつの態様に係る音響処理方法は、第1音源の音響を収録した音響信号を解析する解析処理であって、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む解析処理を実行し、前記発音指標の時系列と前記音高の時系列とを共通の時間軸のもとで表示装置に表示させる。
【0007】
本開示のひとつの態様に係るプログラムは、第1音源の音響を収録した音響信号を解析する解析処理を実行する音響解析部であって、前記解析処理は、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む音響解析部、および、前記発音指標の時系列と前記音高の時系列とを共通の時間軸のもとで表示装置に表示させる表示制御部、としてコンピュータシステムを機能させる。
【図面の簡単な説明】
【0008】
【
図1】第1実施形態に係る再生システムの構成を例示するブロック図である。
【
図4】音響処理システムの機能的な構成を例示するブロック図である。
【
図5】演奏装置による再生パートの再生と第1指示および第2指示との関係の説明図である。
【
図6】再生制御処理の具体的な手順を例示するフローチャートである。
【
図7】第2実施形態における操作装置の状態に関する説明図である。
【
図8】第3実施形態における操作装置の状態に関する説明図である。
【
図9】第4実施形態における音響処理システムの機能的な構成を例示するブロック図である。
【
図11】編集処理の具体的な手順を例示するフローチャートである。
【
図12】第5実施形態における再生システムの構成を例示するブロック図である。
【
図13】第5実施形態における音響処理システムの機能的な構成を例示するブロック図である。
【
図14】音響解析部の具体的な構成を例示するブロック図である。
【
図16】確認画面が変化する様子を示す模式図である。
【
図17】確認画面が変化する様子を示す模式図である。
【
図18】確認画面が変化する様子を示す模式図である。
【
図19】調整処理の具体的な手順を例示するフローチャートである。
【発明を実施するための形態】
【0009】
A:第1実施形態
図1は、第1実施形態に係る再生システム100の構成を例示するブロック図である。再生システム100は、利用者Uが所在する音響空間に設置される。利用者Uは、例えば弦楽器等の楽器80を利用して楽曲の特定のパート(以下「演奏パート」という)を演奏する演奏者である。
【0010】
再生システム100は、利用者Uによる演奏パートの演奏に並行して当該楽曲を再生するコンピュータシステムである。具体的には、再生システム100は、楽曲を構成する複数のパートのうち演奏パート以外のパート(以下「再生パート」という)を再生する。演奏パートは、例えば楽曲の主旋律を構成する1以上のパートである。再生パートは、例えば楽曲の伴奏を構成する1以上のパートである。以上の説明から理解される通り、利用者Uによる演奏パートの演奏と再生システム100による再生パートの再生とが並行に実行されることで楽曲の演奏が実現される。なお、演奏パートと再生パートとは、楽曲の共通のパートでもよい。また、演奏パートが楽曲の伴奏を構成し、再生パートが当該楽曲の主旋律を構成してもよい。
【0011】
再生システム100は、音響処理システム10と演奏装置20とを具備する。音響処理システム10と演奏装置20とは別体で構成され、有線または無線により相互に通信する。なお、音響処理システム10と演奏装置20とを一体に構成してもよい。
【0012】
演奏装置20は、音響処理システム10による制御のもとで楽曲の再生パートを再生する再生装置である。具体的には、演奏装置20は、再生パートの自動演奏を実行する自動演奏楽器である。例えば、利用者Uが演奏する楽器80とは別種の自動演奏楽器(例えば自動演奏ピアノ)が演奏装置20として利用される。以上の説明から理解される通り、自動演奏は、「再生」の一態様である。
【0013】
第1実施形態の演奏装置20は、駆動機構21と発音機構22とを具備する。発音機構22は、楽音を発生する機構である。具体的には、発音機構22は、自然楽器の鍵盤楽器と同様に、鍵盤の各鍵の変位に連動して弦(発音源)を発音させる打弦機構を鍵毎に具備する。駆動機構21は、発音機構22を駆動することで楽曲の自動演奏を実行する。音響処理システム10からの指示に応じて駆動機構21が発音機構22を駆動することで、再生パートの自動演奏が実現される。
【0014】
音響処理システム10は、演奏装置20による再生パートの再生を制御するコンピュータシステムであり、制御装置11と記憶装置12と収音装置13と操作装置14とを具備する。音響処理システム10は、例えばスマートフォンまたはタブレット端末等の可搬型の端末装置、またはパーソナルコンピュータ等の可搬型または据置型の端末装置により実現される。なお、音響処理システム10は、単体の装置で実現されるほか、相互に別体で構成された複数の装置でも実現される。
【0015】
制御装置11は、音響処理システム10の各要素を制御する単数または複数のプロセッサである。具体的には、例えばCPU(Central Processing Unit)、SPU(Sound Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、またはASIC(Application Specific Integrated Circuit)等の1種類以上のプロセッサにより、制御装置11が構成される。
【0016】
記憶装置12は、制御装置11が実行するプログラムと制御装置11が使用する各種のデータとを記憶する単数または複数のメモリである。記憶装置12は、例えば磁気記録媒体もしくは半導体記録媒体等の公知の記録媒体、または、複数種の記録媒体の組合せで構成される。また、音響処理システム10に対して着脱される可搬型の記録媒体、または通信網を介した書込または読出が可能な記録媒体(例えばクラウドストレージ)を、記憶装置12として利用してもよい。
【0017】
記憶装置12は、楽曲を構成する複数の音符の時系列を指定する楽曲データDを楽曲毎に記憶する。
図2は、楽曲データDの模式図である。楽曲データDは、参照データDaと演奏データDbとを含む。参照データDaは、利用者Uが演奏する演奏パートの音符の時系列を指定する。具体的には、参照データDaは、演奏パートの複数の音符の各々について音高と発音期間と発音強度(ベロシティ)とを指定する。他方、演奏データDbは、演奏装置20が再生する再生パートの音符の時系列を指定する。具体的には、演奏データDbは、再生パートの複数の音符の各々について音高と発音期間と発音強度とを指定する。
【0018】
参照データDaおよび演奏データDbの各々は、例えば、楽音の発音または消音を指示する指示データと、指示データが指示する動作の時点を指定する時間データとが時系列に配列されたMIDI(Musical Instrument Digital Interface)形式の時系列データである。指示データは、例えば音高と強度とを指定して発音または消音等の動作を指示する。時間データは、例えば相前後する指示データの間隔を指定する。指示データにより特定の音高の発音が指示されてから、当該指示データの後方の指示データにより当該音高の消音が指示されるまでの期間が、当該音高の音符に関する発音期間である。
【0019】
図1の収音装置13は、利用者Uによる演奏で楽器80から発音される楽音を収音し、当該楽音の波形を表す音響信号Zを生成する。例えばマイクロホンが収音装置13として利用される。収音装置13が生成した音響信号Zをアナログからデジタルに変換するA/D変換器の図示は便宜的に省略されている。なお、利用者Uは、収音装置13に対して楽曲の演奏パートを歌唱してもよい。利用者Uが演奏パートを歌唱する場合、利用者Uが発音する歌唱音の波形を表す音響信号Zが、収音装置13により生成される。以上の説明から理解される通り、「演奏」には、楽器80を利用した狭義の演奏のほか、利用者Uによる楽曲の歌唱も包含される。
【0020】
なお、第1実施形態においては収音装置13が音響処理システム10に搭載された構成を例示するが、音響処理システム10とは別体の収音装置13を有線または無線により音響処理システム10に接続してもよい。また、電気弦楽器等の電気楽器からの出力信号を音響信号Zとして音響処理システム10が受信してもよい。以上の説明から理解される通り、収音装置13は音響処理システム10から省略されてもよい。
【0021】
操作装置14は、利用者Uからの指示を受付ける入力機器である。
図3に例示される通り、第1実施形態の操作装置14は、利用者Uによる操作で移動する可動部141を具備する。可動部141は、利用者Uが足で操作可能な操作ペダルである。例えばペダル型のMIDIコントローラが操作装置14として利用される。利用者Uは、楽器80を両手で演奏しながら、当該演奏に並行した所望の時点で操作装置14を操作することが可能である。なお、利用者Uによる接触を検知するタッチパネルを操作装置14として利用してもよい。
【0022】
操作装置14は、利用者Uによる操作に応じて解放状態および操作状態の一方から他方に遷移する。解放状態は、操作装置14が利用者Uにより操作されていない状態である。具体的には、解放状態は、利用者Uが可動部141を踏込んでいない状態である。解放状態は、可動部141が位置H1にある状態とも表現される。他方、操作状態は、操作装置14が利用者Uにより操作されている状態である。具体的には、操作状態は、利用者Uが可動部141を踏込んだ状態である。操作状態は、位置H1とは相違する位置H2に可動部141がある状態とも表現される。解放状態は「第1状態」の一例であり、操作状態は「第2状態」の一例である。
【0023】
図4は、音響処理システム10の機能的な構成を例示するブロック図である。制御装置11は、記憶装置12に記憶されたプログラムを実行することで、演奏装置20による再生パートの再生を制御するための複数の機能(演奏解析部31、再生制御部32および指示受付部33)を実現する。
【0024】
演奏解析部31は、収音装置13から供給される音響信号Zを解析することで、楽曲内の演奏位置Xを推定する。演奏位置Xは、楽曲内において利用者Uが現に演奏している時点である。演奏位置Xの推定は、利用者Uによる演奏パートの演奏と演奏装置20による再生パートの再生とに並行して反復的に実行される。すなわち、時間軸上の複数の時点の各々において演奏位置Xが推定される。演奏位置Xは、時間の経過とともに楽曲内の後方に移動する。
【0025】
具体的には、演奏解析部31は、楽曲データDの参照データDaと音響信号Zとを相互に照合することで演奏位置Xを算定する。演奏解析部31による演奏位置Xの推定には、公知の解析技術(スコアアライメント技術)が任意に採用され得る。例えば、特開2016-099512号公報に開示された解析技術が、演奏位置Xの推定に利用される。また、演奏解析部31は、深層ニューラルネットワークまたは隠れマルコフモデル等の統計的推定モデルを利用して演奏位置Xを推定してもよい。
【0026】
再生制御部32は、演奏データDbが指定する各音符を演奏装置20に再生させる。すなわち、再生制御部32は、再生パートの自動演奏を演奏装置20に実行させる。具体的には、再生制御部32は、楽曲内において再生すべき位置(以下「再生位置」という)Yを経時的に後方に移動し、演奏データDbのうち再生位置Yに対応する指示データを演奏装置20に対して順次に供給する。すなわち、再生制御部32は、演奏データDbに含まれる各指示データを演奏装置20に対して順次に供給するシーケンサとして機能する。再生制御部32が演奏装置20に再生パートを再生させる処理は、利用者Uによる演奏パートの演奏に並行して実行される。
【0027】
再生制御部32は、演奏解析部31による演奏位置Xの推定の結果に応じて、演奏装置20による再生パートの再生を利用者Uによる楽曲の演奏に追従させる。すなわち、利用者Uによる演奏パートの演奏と同等のテンポで演奏装置20による再生パートの自動演奏が進行する。例えば、再生制御部32は、演奏位置Xの進行(すなわち利用者Uによる演奏速度)が速い場合には、再生位置Yの進行の速度(演奏装置20による再生速度)を上昇させ、演奏位置Xの進行が遅い場合には再生位置Yの進行の速度を低下させる。すなわち、演奏位置Xの進行に同期するように、利用者Uによる演奏と同等の演奏速度で再生パートの自動演奏が実行される。したがって、利用者Uは、演奏装置20が自分の演奏に合わせて再生パートを演奏しているような感覚で演奏パートを演奏できる。
【0028】
以上の通り、第1実施形態においては、再生パートの複数の音符の再生が利用者Uによる楽器80の演奏に追従するから、利用者Uの意図(例えば演奏表現)または嗜好を、再生パートの再生に適切に反映させることが可能である。
【0029】
指示受付部33は、第1指示Q1および第2指示Q2を利用者Uから受付ける。第1指示Q1および第2指示Q2は、操作装置14に対する利用者Uの操作により発生する。第1指示Q1は、演奏装置20による再生パートの再生を一時的に停止させる指示である。第2指示Q2は、第1指示Q1により停止した再生パートの再生を再開させる指示である。
【0030】
具体的には、指示受付部33は、利用者Uが操作装置14を解放状態から操作状態に遷移させる操作を第1指示Q1として受付ける。すなわち、利用者Uは、操作装置14の可動部141を踏込むことで第1指示Q1を音響処理システム10に付与する。例えば、指示受付部33は、可動部141が位置H1(解放状態)から位置H2(操作状態)に向けて移動を開始した時点を第1指示Q1の時点として特定する。なお、位置H1から位置H2までの途中の位置に可動部141が到達した時点を指示受付部33が第1指示Q1の時点として特定する構成、または、可動部141が位置H2に到達した時点を指示受付部33が第1指示Q1の時点として特定する構成も想定される。
【0031】
また、指示受付部33は、利用者Uが操作装置14を操作状態から解放状態に遷移させる操作を第2指示Q2として受付ける。すなわち、利用者Uは、操作装置14の可動部141を踏込んだ状態から当該可動部141を解放することで、第2指示Q2を音響処理システム10に付与する。例えば、指示受付部33は、可動部141が位置H2(操作状態)から位置H1(解放状態)に向けて移動を開始した時点を第2指示Q2の時点として特定する。なお、位置H2から位置H1までの途中の位置に可動部141が到達した時点を指示受付部33が第2指示Q2の時点として特定する構成、または、可動部141が位置H1に到達した時点を指示受付部33が第2指示Q2の時点として特定する構成も想定される。
【0032】
利用者Uは、演奏パートの演奏中における任意の時点において第1指示Q1および第2指示Q2を付与できる。したがって、第1指示Q1と第2指示Q2との間隔は、利用者Uの意図に応じた可変長である。例えば、利用者Uは、楽曲内の休符期間の開始前に第1指示Q1を付与し、利用者Uの所望の時間長の休符期間が経過した時点で第2指示Q2を付与する。
【0033】
図5は、演奏装置20による再生パートの再生と第1指示Q1および第2指示Q2との関係の説明図である。演奏データDbが指定する各音符の発音期間と、演奏装置20が実際に再生する各音符の発音期間とが、
図5には併記されている。
【0034】
図5の音符N1は、演奏データDbが指定する複数の音符のうち第1指示Q1に対応する音符である。具体的には、音符N1は、再生パートの複数の音符のうち第1指示Q1の時点で演奏装置20が再生している音符である。再生制御部32は、第1指示Q1の発生後に、演奏データDbが音符N1について指定する発音期間の終点まで、当該音符N1の再生を演奏装置20に継続させる。例えば、再生制御部32は、音符N1の発音期間の終点において、当該音符N1の消音を指示する指示データを演奏装置20に供給する。以上の説明から理解される通り、音符N1の再生は、第1指示Q1の時点で直ちに停止するのではなく、第1指示Q1の発生後も演奏データDbが指定する終点まで継続される。なお、音符N1は「第1音」の一例である。
【0035】
図5の音符N2は、演奏データDbが指定する複数の音符のうち音符N1の直後の音符である。再生制御部32は、音符N1の再生の停止後に、利用者Uによる第2指示Q2を契機として、演奏装置20に音符N2の再生を開始させる。すなわち、演奏データDbが音符N2について指定する発音期間の始点の位置、および、演奏データDbが指定する音符N1と音符N2との間隔の時間長とは無関係に、第2指示Q2の発生を条件として音符N2の再生が開始される。具体的には、再生制御部32は、指示受付部33が第2指示Q2を受付けた場合に、演奏データDbにおける音符N2の指示データを演奏装置20に供給する。したがって、第2指示Q2の直後に音符N2の再生が開始される。なお、音符N2は「第2音」の一例である。
【0036】
図6は、制御装置11が演奏装置20を制御する動作(以下「再生制御処理」という)Saの具体的な手順を例示するフローチャートである。利用者Uからの指示を契機として再生制御処理Saが開始される。
【0037】
再生制御処理Saが開始されると、制御装置11は、待機データWが有効状態にあるか否かを判定する(Sa1)。待機データWは、第1指示Q1により再生パートの再生が一時的に停止された状態であることを表すデータ(例えばフラグ)であり、記憶装置12に記憶される。具体的には、待機データWは、第1指示Q1が発生した場合に有効状態(例えばW=1)に設定され、第2指示Q2が発生した場合に無効状態(例えばW=0)に設定される。待機データWは、再生パートの再生の再開を待機する状態を表すデータとも換言される。
【0038】
待機データWが有効状態でない場合(Sa1:NO)、制御装置11(演奏解析部31)は、収音装置13から供給される音響信号Zを解析することで演奏位置Xを推定する(Sa2)。制御装置11(再生制御部32)は、演奏位置Xの推定の結果に応じて、演奏装置20による再生パートの再生を進行させる(Sa3)。すなわち、制御装置11は、利用者Uによる演奏パートの演奏に追従するように演奏装置20による再生パートの再生を制御する。
【0039】
制御装置11(指示受付部33)は、利用者Uから第1指示Q1を受付けたか否かを判定する(Sa4)。第1指示Q1を受付けた場合(Sa4:YES)、制御装置11(再生制御部32)は、第1指示Q1の受付の時点で再生されている音符N1の再生を、演奏データDbが指定する発音期間の終点まで演奏装置20に継続させる(Sa5)。具体的には、制御装置11は、第1指示Q1が発生した時点と同等の速度(テンポ)で再生位置Yを進行させ、再生位置Yが音符N1の発音期間の終点に到達した場合に、当該音符N1の消音を表す指示データを演奏装置20に供給する。以上の処理を実行すると、制御装置11は、待機データWを無効状態から有効状態(W=1)に変更する(Sa6)。なお、ステップSa5の実行前に待機データWの更新(Sa6)が実行されてもよい。
【0040】
待機データWが有効状態に設定されると、ステップSa1における判定の結果が肯定となる。待機データWが有効状態にある場合(Sa1:YES)、演奏位置Xの推定(Sa2)と再生パートの再生制御(Sa3)と音符N1に関する処理(Sa4-Sa6)とは実行されない。すなわち、利用者Uからの第1指示Q1を契機として、演奏位置Xに連動した再生パートの再生制御は停止される。また、第1指示Q1を受付けない場合(Sa4:NO)、音符N1に関する処理(Sa5,Sa6)は実行されない。
【0041】
制御装置11(指示受付部33)は、利用者Uから第2指示Q2を受付けたか否かを判定する(Sa7)。第2指示Q2を受付けた場合(Sa7:YES)、制御装置11(再生制御部32)は、音符N1の直後の音符N2を演奏装置20に再生させる(Sa8)。具体的には、制御装置11は、再生位置Yを音符N2の始点に更新する。すなわち、第1指示Q1により停止された再生パートの再生が第2指示Q2により再開される。制御装置11は、待機データWを有効状態から無効状態(W=0)に変更する(Sa9)。前述の通り、待機データWが無効状態に設定されると、ステップSa1における判定の結果が否定となる。したがって、第2指示Q2を契機として、演奏位置Xの推定(Sa2)と再生パートの再生制御(Sa3)とが再開される。なお、ステップSa8の実行前に待機データWの更新(Sa8)が実行されてもよい。
【0042】
制御装置11は、演奏装置20による再生パートの再生を終了するか否かを判定する(Sa10)。例えば、再生パートの終点まで再生が完了した場合、または利用者Uから終了が指示された場合に、制御装置11は再生パートの再生を終了すると判定する。再生パートの再生を終了しない場合(Sa10:NO)、制御装置11は、処理をステップSa1に移行し、以上に例示した処理(Sa1-Sa9)を反復する。他方、再生パートの再生を終了すると制御装置11が判定した場合(Sa10:YES)には、再生制御処理Saが終了される。
【0043】
以上に説明した通り、第1実施形態においては、第1指示Q1に対応する音符N1が再生され、かつ、音符N1の再生の停止後に、利用者Uによる第2指示Q2を契機として、音符N1の直後の音符N2の再生が開始される。したがって、音符N1の再生と音符N2の再生との間隔(例えば楽曲内の休符期間の時間長)を、第1指示Q1および第2指示Q2の各時点に応じて変更できる。
【0044】
また、第1実施形態においては、第1指示Q1の発生の時点において再生されている音符N1の再生が、第1指示Q1の発生後も、演奏データDbが指定する音符N1の終点まで継続される。したがって、第1指示Q1の発生の時点で音符N1の再生が停止される構成と比較して、演奏データDbの内容に応じて音符N1の再生を適切に継続させることが可能である。
【0045】
第1実施形態においては、利用者Uが操作装置14を操作することで、音符N1と音符N2との間隔を利用者Uの意図または嗜好に応じた適切な時間長に変更できる。第1実施形態においては特に、操作装置14を解放状態から操作状態に遷移させることで第1指示Q1が発生し、当該操作状態が維持された後、第1指示Q1の発生後における所望の時点で操作装置14を操作状態から解放状態に遷移させることで第2指示Q2が発生する。すなわち、操作状態を解放状態から操作状態に遷移させて再び解放状態に遷移させる一連の操作により、第1指示Q1および第2指示Q2が発生する。したがって、操作装置14を解放状態から操作状態に遷移させる操作が第1指示Q1および第2指示Q2の各々について必要である構成と比較して、操作装置14に対する利用者Uの操作が簡素化される。
【0046】
B:第2実施形態
第2実施形態を説明する。なお、以下に例示する各形態において機能が第1実施形態と同様である要素については、第1実施形態の説明で使用したのと同様の符号を流用して各々の詳細な説明を適宜に省略する。
【0047】
第1実施形態においては、第1指示Q1が発生した場合に、第1指示Q1の時点と同等の速度で再生位置Yを進行させ、再生位置Yが音符N1の終点に到達した場合に当該音符N1の再生を停止した。第2実施形態の再生制御部32は、第1指示Q1の発生後における再生位置Yの進行速度(すなわち再生パートの再生速度)を可動部141の操作速度V1に応じて可変に制御する。操作速度V1は、解放状態に対応する位置H1から操作状態に対応する位置H2に向けて可動部141が移動する速度である。例えば、可動部141が位置H1から位置H2に移動するまでの期間内に算定される複数の速度の平均値が操作速度V1である。
【0048】
図7は、第2実施形態における操作装置14の状態に関する説明図である。
図7に例示される通り、位置H1から位置H2に向けて可動部141が移動を開始する時点において指示受付部33は第1指示Q1を受付ける。再生制御部32は、第1指示Q1の発生後における再生位置Yの進行速度を可動部141の操作速度V1に応じて制御する。
【0049】
具体的には、再生制御部32は、操作速度V1が速いほど再生位置Yの進行速度を上昇させる。例えば、
図7に例示される通り、操作速度V1が速度V1_Hである場合の再生位置Yの進行速度は、操作速度V1が速度V1_L(V1_L<V1_H)である場合の再生位置Yの進行速度を上回る。したがって、操作速度V1が速いほど、音符N1の継続長は短縮される。例えば、操作速度V1が速度V1_Hである場合の音符N1の継続長は、操作速度V1が速度V1_Lである場合の音符N1の継続長よりも短い。
【0050】
第2実施形態においても第1実施形態と同様の効果が実現される。第2実施形態においては、音符N1の継続長が操作速度V1に応じて制御されるから、音符N1の継続長を利用者Uが調整できるという利点がある。また、第2実施形態においては、第1指示Q1および第2指示Q2を付与するための操作装置14が、音符N1の継続長の調整にも兼用される。したがって、第1指示Q1および第2指示Q2の付与と音符N1の継続長の調整との各々について利用者Uが別個の機器を操作する構成と比較して、利用者Uによる操作が簡素化されるという利点もある。
【0051】
C:第3実施形態
第1実施形態においては、第2指示Q2の直後に音符N2の再生を開始した。第2実施形態においては、第2指示Q2から音符N2の再生が開始されるまでの時間(以下「遅延時間」という)を操作速度V2に応じて可変に制御する。操作速度V2は、操作状態に対応する位置H2から解放状態に対応する位置H1に向けて可動部141が移動する速度である。例えば、可動部141が位置H2から位置H1に移動するまでの期間内に算定される複数の速度の平均値が操作速度V2である。
【0052】
図8は、第3実施形態における操作装置14の状態に関する説明図である。
図8に例示される通り、位置H2から位置H1に向けて可動部141が移動を開始する時点において指示受付部33は第2指示Q2を受付ける。再生制御部32は、遅延時間を操作速度V2に応じて可変に制御する。
【0053】
具体的には、再生制御部32は、操作速度V2が速いほど遅延時間を短縮させる。例えば、
図8に例示される通り、操作速度V2が速度V2_Lである場合の遅延時間は、操作速度V2が速度V2_H(V2_H>V2_L)である場合の遅延時間よりも長い。したがって、操作速度V2が遅いほど、音符N2の再生が開始される時点は時間軸上で後方の時点となる。
【0054】
第3実施形態においても第1実施形態と同様の効果が実現される。第3実施形態においては、音符N2の再生が開始される時点が操作速度V2に応じて制御されるから、再生パートの再開後の最初の音符N2の始点を、利用者Uが調整できるという利点がある。また、第3実施形態においては、第1指示Q1および第2指示Q2を付与するための操作装置14が、音符N2の始点の調整にも兼用される。したがって、第1指示Q1および第2指示Q2の付与と音符N2の始点の調整との各々について利用者Uが別個の機器を操作する構成と比較して、利用者Uによる操作が簡素化されるという利点もある。なお、第2実施形態の構成を第3実施形態に適用してもよい。
【0055】
D:第4実施形態
図9は、第4実施形態における音響処理システム10の機能的な構成を例示するブロック図である。第4実施形態の制御装置11は、第1実施形態と同様の要素(演奏解析部31、再生制御部32および指示受付部33)に加えて編集処理部34としても機能する。編集処理部34は、記憶装置12に記憶された演奏データDbを、利用者Uからの指示に応じて編集する。編集処理部34以外の要素の動作は第1実施形態と同様である。したがって、第4実施形態においても第1実施形態と同様の効果が実現される。なお、第2実施形態または第3実施形態の構成を第4実施形態に適用してもよい。
【0056】
図10は、編集処理部34の動作の説明図である。
図10には、再生パートの演奏データDbが指定する音符N1および音符N2が図示されている。前述の各形態と同様に、第1指示Q1および第2指示Q2は、利用者Uの任意の時点で発生する。したがって、演奏データDbが指定する音符N2の始点と第2指示Q2の時点との間には、時間差Lが発生する。編集処理部34は、時間差Lが低減されるように演奏データDbを編集する。
【0057】
図11は、編集処理部34が演奏データDbを編集する処理(以下「編集処理」という)Sbの具体的な手順を例示するフローチャートである。例えば演奏装置20による再生パートの再生(前述の再生制御処理Sa)が所定回にわたり反復されるたびに編集処理Sbが実行される。なお、利用者Uからの指示を契機として編集処理Sbが開始されてもよい。
【0058】
編集処理Sbが開始されると、編集処理部34は、過去の所定回の再生制御処理Saにおける時間差Lの散布度Δを算定する(Sb1)。散布度Δは、複数の時間差Lに関する散らばりの度合を表す統計量である。例えば、複数の時間差Lの分散、標準偏差または分布範囲等が散布度Δとして利用される。
【0059】
編集処理部34は、散布度Δが閾値Δthを上回るか否かを判定する(Sb2)。散布度Δが閾値Δthを上回る場合には、音符N2の再生が再開されるまでの待機時間を、利用者Uが意識的に変動させながら楽曲の演奏を練習していると推定される。したがって、複数の時間差Lに応じて演奏データDbを編集するのは妥当でない。他方、散布度Δが閾値Δthを下回る場合には、複数の時間差Lが、利用者Uの意図または嗜好に沿った数値(すなわち利用者Uに固有の好適値)であると推定される。
【0060】
以上の傾向を考慮して、編集処理部34は、散布度Δが閾値Δthを下回る場合に(Sb2:NO)、複数の時間差Lに応じて演奏データDbを編集する(Sb3-Sb4)。他方、散布度Δが閾値Δthを上回る場合(Sb2:YES)、編集処理部34は、演奏データDbの編集(Sb3,Sb4)を実行することなく編集処理Sbを終了する。
【0061】
演奏データDbの編集において、編集処理部34は、複数の時間差Lを平均することで平均時間差Laを算定する(Sb3)。そして、編集処理部34は、演奏データDbが指定する音符N2の始点を平均時間差Laだけ変化させる(Sb4)。例えば、平均時間差Laが負数である場合、編集処理部34は、演奏データDbが指定する音符N2の始点を当該平均時間差Laに相当する時間だけ前方に移動する。また、平均時間差Laが正数である場合、編集処理部34は、演奏データDbが指定する音符N2の始点を当該平均時間差Laに相当する時間だけ後方に移動する。すなわち、音符N2の直前の待機時間を利用者Uが充分に確保する傾向がある場合には、演奏データDbが指定する音符N2の始点が後方に変更され、待機時間が短い傾向がある場合には、演奏データDbが指定する音符N2の始点が前方に変更される。
【0062】
以上の説明から理解される通り、第4実施形態においては、利用者Uによる演奏パートの演奏における時間差Lに応じて演奏データDbが編集される。したがって、各利用者Uに固有の傾向を演奏データDbに反映させることが可能である。
【0063】
E:第5実施形態
図12は、第5実施形態に係る再生システム100の構成を例示するブロック図である。第5実施形態の音響処理システム10は、第1実施形態の音響処理システム10と同様の要素(制御装置11,記憶装置12,収音装置13および操作装置14)に加えて表示装置15を具備する。表示装置15は、制御装置11から指示された画像を表示する。表示装置15は、例えば液晶表示パネルまたは有機EL表示パネルである。
【0064】
利用者U1は、第1実施形態と同様に楽器80を演奏する。楽器80は、利用者U1による演奏で発音する弦楽器等の自然楽器である。他方、第5実施形態の演奏装置20は、楽曲の再生パートの自動演奏を実行する再生装置として機能するほか、利用者U2による手動の演奏が可能な電子楽器としても機能する自動演奏楽器である。具体的には、演奏装置20は、前述の各形態における演奏装置20と同様に、駆動機構21と発音機構22とを具備する。
【0065】
利用者U2による手動の演奏は、例えば鍵盤の押鍵等、利用者U2の身体の動作による演奏である。利用者U2による演奏に連動して発音機構22が動作することで、演奏装置20から楽音が発音される。また、演奏装置20は、利用者U2による演奏に並行して、当該演奏の指示を表す指示データdを音響処理システム10に対して順次に出力する。指示データdは、例えば音高と発音強度とを指定して発音または消音等の動作を指定する。
【0066】
図13は、第5実施形態における音響処理システム10の機能的な構成を例示するブロック図である。第5実施形態の制御装置11は、記憶装置12に記憶されたプログラムを実行することで、第1実施形態と同様の要素(演奏解析部31、再生制御部32および指示受付部33)に加えて、準備処理部35および表示制御部36として機能する。
【0067】
準備処理部35は、再生制御処理Saに利用される楽曲データD(参照データDaおよび演奏データDb)を生成する。具体的には、準備処理部35は、利用者U1による楽器80の演奏と利用者U2による演奏装置20の演奏とに応じた楽曲データDを生成する。表示制御部36は、表示装置15に各種の画像を表示させる。
【0068】
準備処理部35は、第1収録部41と第2収録部42と音響解析部43とを具備する。音響解析部43は、再生制御処理Saに利用される参照データDaを生成する。具体的には、音響解析部43は、再生制御処理Saの開始前に調整処理Sc(
図15)を実行することで参照データDaを生成する。音響解析部43が生成した参照データDaは記憶装置12に記憶される。
【0069】
調整処理Scの実行前の期間(以下「準備期間」という)において、利用者U1および利用者U2は楽曲を合奏する。具体的には、準備期間において、利用者U1は楽器80により当該楽曲の演奏パートを演奏し、利用者U2は演奏装置20により楽曲の再生パートを演奏する。調整処理Scは、準備期間内において利用者U1および利用者U2が楽曲を演奏した結果を利用して参照データDaを生成する処理である。なお、利用者U1は、収音装置13に対して楽曲の演奏パートを歌唱してもよい。
【0070】
第1収録部41は、準備期間内において収音装置13が生成する音響信号Zを取得する。なお、準備期間内に第1収録部41が取得する音響信号Zを以下では便宜的に「参照信号Zr」と表記する。第1収録部41は、参照信号Zrを記憶装置12に保存する。
【0071】
準備期間内においては、利用者U1による演奏で楽器80から発音される楽音のほか、利用者U2による演奏で演奏装置20から発音される楽音が、収音装置13に到達する。したがって、参照信号Zrは、楽器80の音響成分と演奏装置20の音響成分とを含む音響信号である。なお、楽器80は「第1音源」の一例であり、演奏装置20は「第2音源」の一例である。利用者U1が演奏パートを歌唱する場合、当該利用者U1が「第1音源」に相当する。
【0072】
第2収録部42は、準備期間内における演奏装置20の演奏を表す演奏データDbを取得する。具体的には、第2収録部42は、利用者U2による演奏に応じて演奏装置20から順次に供給される指示データdと、相前後する指示データdの間隔を指定する時間データとが時系列に配列されたMIDI形式の演奏データDbを生成する。第2収録部42は、演奏データDbを記憶装置12に保存する。記憶装置12に記憶された演奏データDbは、前述の各形態において例示した通り、再生制御処理Saに利用される。なお、第2収録部42が取得した演奏データDbを、第4実施形態に例示した編集処理部34が編集してもよい。
【0073】
以上の説明から理解される通り、準備期間においては参照信号Zrと演奏データDbとが記憶装置12に保存される。音響解析部43は、第1収録部41が取得した参照信号Zrと第2収録部42が取得した演奏データDbとを利用した調整処理Scにより参照データDaを生成する。
【0074】
図14は、音響解析部43の具体的な構成を例示するブロック図である。
図14に例示される通り、音響解析部43は、指標算定部51と期間推定部52と音高推定部53と情報生成部54とを具備する。なお、第5実施形態の操作装置14は、調整処理Scに適用される複数の変数(α,β,γ)の各々の数値に関する指示を利用者U(U1またはU2)から受付ける。すなわち、利用者Uは、操作装置14を操作することで各変数の数値を設定または変更することが可能である。
【0075】
[指標算定部51]
指標算定部51は、発音指標C(t)を算定する。記号tは、時間軸上の1個の時点を意味する。すなわち、指標算定部51は、時間軸上の相異なる時点tに対応する発音指標C(t)の時系列を特定する。発音指標C(t)は、参照信号Zrに楽器80の音響成分が含まれる確度(尤度または確率)の指標である。すなわち、時間軸上の時点tにおいて楽器80の音響成分が参照信号Zrに含まれる確度が高いほど、発音指標C(t)は大きい数値に設定される。第1実施形態の指標算定部51は、第1解析部511と第2解析部512と第1演算部513と第2演算部514とを具備する。
【0076】
第1解析部511は、参照信号Zrを解析することで第1指標B1(t,n)を算定する。記号nは、N個の音高P1~PNのうちの何れか(n=1~N)を意味する。具体的には、第1解析部511は、相異なる音高Pnに対応するN個の第1指標B1(t,1)~B1(t,N)を時間軸上の時点t毎に算定する。すなわち、第1解析部511は、第1指標B1(t,n)の時系列を算定する。
【0077】
音高Pnに対応する第1指標B1(t,n)は、演奏装置20または楽器80における当該音高Pnの音響成分が参照信号Zrに含まれる確度の指標であり、0以上かつ1以下の範囲内の数値に設定される。演奏装置20および楽器80の一方または双方について音高Pnの音響成分の強度が大きいほど、第1指標B1(t,n)は大きい数値に設定される。以上の説明から理解される通り、第1指標B1(t,n)は、参照信号Zrにおける各音高Pnの音響成分の強度に関する指標とも換言される。第1解析部511による第1指標B1(t,n)の算定には、公知の音響解析技術(特に音高推定技術)が任意に採用される。
【0078】
第2解析部512は、演奏データDbを解析することで第2指標B2(t,n)を算定する。具体的には、第2解析部512は、相異なる音高Pnに対応するN個の第2指標B2(t,1)~B2(t,N)を時間軸上の時点t毎に算定する。すなわち、第2解析部512は、第2指標B2(t,n)の時系列を算定する。
【0079】
音高Pnに対応する第2指標B2(t,n)は、演奏データDbが時点tにおいて音高Pnの音符に指定する発音強度に応じた指標であり、0以上かつ1以下の範囲内の数値に設定される。演奏データDbが音高Pnの音符に指定する発音強度が大きいほど、第2指標B2(t,n)は大きい数値となる。時点tに音高Pnの音符が存在しない場合、第2指標B2(t,n)は0に設定される。
【0080】
第2指標B2(t,n)の算定には、利用者Uからの指示に応じて設定された変数αが適用される。例えば、第2解析部512は、以下の数式(1)の演算により第2指標B2(t,n)を算定する。
【数1】
【0081】
数式(1)における記号ν(t,n)は、時間軸上の時点tにおいて演奏データDbが音高Pnに指定する発音強度に対応する数値である。時間軸上の時点tが音高Pnの音符の発音期間内にある場合、強度ν(t,n)は、演奏データDbが当該音符に指定する発音強度に設定される。他方、時間軸上の時点tが音高Pnの発音期間外にある場合、強度ν(t,n)は0に設定される。数式(1)の記号cは係数であり、所定の正数に設定される。
【0082】
数式(1)から理解される通り、変数αが小さい場合には、強度ν(t,n)が大きい数値でも、第2指標B2(t,n)は小さい数値に設定される。他方、変数αが大きい場合には、強度ν(t,n)が小さい数値でも、第2指標B2(t,n)は大きい数値に設定される。すなわち、変数αが小さいほど第2指標B2(t,n)は小さい数値になるという傾向がある。
【0083】
図14の第1演算部513は、第1指標B1(t,n)から第2指標B2(t,n)を減算することで発音指標E(t,n)を算定する。発音指標E(t,n)は、楽器80が発音する音高Pnの音響成分が時点tにおいて参照信号Zrに含まれる確度(尤度または確率)の指標である。具体的には、第1演算部513は、以下の数式(2)の演算により発音指標E(t,n)を算定する。
【数2】
【0084】
数式(2)のmax{a,b}は、数値aおよび数値bのうち大きい方を選択する演算を意味する。数式(2)から理解される通り、発音指標E(t,n)は、0以上かつ1以下の範囲内の数値である。楽器80が発音する音高Pnの音響成分の強度が大きいほど、発音指標E(t,n)は大きい数値に設定される。すなわち、発音指標E(t,n)は、参照信号Zrにおける楽器80の音響成分(音高Pn)の強度に関する指標とも換言される。
【0085】
前述の通り、第1指標B1(t,n)には、演奏装置20および楽器80の双方の音響成分が影響する。他方、第2指標B2(t,n)には、演奏装置20の音響成分のみが影響する。したがって、数式(2)において第1指標B1(t,n)から第2指標B2(t,n)を減算する演算は、第1指標B1(t,n)から演奏装置20の音響成分の影響を抑圧する処理に相当する。すなわち、発音指標E(t,n)は、参照信号Zrの音響成分のうち楽器80の音響成分(音高Pn)の強度に関する指標に相当する。前述の通り、変数αが大きいほど、第2指標B2(t,n)は大きい数値に設定されるという傾向がある。したがって、変数αは、第1指標B1(t,n)から演奏装置20の音響成分の影響を抑圧する度合を制御するための変数である。すなわち、変数αが大きいほど(第2指標B2(t,n)が大きいほど)、発音指標E(t,n)において演奏装置20の音響成分の影響が抑圧される。
【0086】
第2演算部514は、第1演算部513が算定する発音指標E(t,n)から発音指標C(t)を算定する。具体的には、第2演算部514は、以下の数式(3)により発音指標C(t)を算定する。
【数3】
数式(3)から理解される通り、相異なる音高Pnに対応するN個の発音指標E(t,1)~E(t,N)の最大値が、時点tにおける発音指標C(t)として選択される。以上の説明から理解される通り、発音指標C(t)は、N個の音高P1~PNの何れかに対応する楽器80の音響成分が参照信号Zrに含まれる確度の指標である。変数αの数値が大きいほど(第2指標B2(t,n)が大きいほど)、発音指標C(t)に対する演奏装置20の音響成分の影響が抑圧される。すなわち、演奏装置20の音響成分が優勢に存在する期間内の発音指標C(t)は小さい数値となる。他方、演奏装置20の音響成分が存在しない期間内の発音指標C(t)は、変数αの数値が変更された場合でも殆ど変化しない。
【0087】
[期間推定部52]
図14の期間推定部52は、時間軸上において楽器80の音響成分が存在する期間(以下「演奏期間」という)を推定する。具体的には、期間推定部52は、指標算定部51が算定する発音指標C(t)を利用して有音指標G(t)を算定する。有音指標G(t)は、時点tにおいて楽器80の音響成分が存在するか否か(有音/無音)を示す指標である。楽器80の音響成分が存在する時点tの有音指標G(t)は数値g1(例えばg1=1)に設定され、楽器80の音響成分が存在しない時点tの有音指標G(t)は数値g0(例えばg0=0)に設定される。有音指標G(t)が数値g1である1以上の時点tで構成される期間が演奏期間に相当する。演奏期間は「発音期間」の一例である。
【0088】
演奏期間の推定には、第1HMM(Hidden Markov Model)が利用される。第1HMMは、有音(数値g1)に相当する有音状態と、無音(数値g0)に相当する無音状態とで構成される状態遷移モデルである。具体的には、期間推定部52は、第1HMMにより生起される最尤の状態の系列をビタビ探索により有音指標G(t)として算定する。
【0089】
第1HMMにおいて有音状態が生起する確率(以下「有音確率」という)Λは、以下の数式(4)で表現される。数式(4)の記号σはシグモイド関数である。無音状態が生起する確率は(1-Λ)である。また、時間軸上で隣合う2個の時点tの間で有音状態または無音状態が維持される確率は、所定の定数(例えば0.9)に設定される。
【数4】
【0090】
数式(4)から理解される通り、有音確率Λの算定には、利用者Uからの指示に応じて設定された変数βが適用される。具体的には、変数βが大きいほど、有音確率Λは小さい数値に設定される。したがって、変数βが大きいほど、有音指標G(t)は数値g0に設定され易く、結果的に演奏期間は短い期間になり易いという傾向がある。他方、変数βが小さいほど、有音確率Λは大きい数値に設定される。したがって、有音指標G(t)は数値g1に設定され易く、結果的に演奏期間は長い期間になり易いという傾向がある。
【0091】
また、前述の通り、変数αが大きいほど、演奏装置20の音響成分が優勢な期間内における発音指標C(t)は小さい数値となる。数式(4)から理解される通り、発音指標C(t)が小さいほど有音確率Λは小さい数値に設定される。したがって、変数αが大きいほど、有音指標G(t)は数値g0に設定され易く、結果的に演奏期間は短い期間になり易いという傾向がある。以上の説明から理解される通り、変数αは、発音指標C(t)だけでなく演奏期間にも影響する。すなわち、変数αは発音指標C(t)および有音指標G(t)の双方に影響する一方、変数βは有音指標G(t)のみに影響する。
【0092】
[音高推定部53]
音高推定部53は、楽器80の音響成分の音高K(t)を特定する。すなわち、音高推定部53は、時間軸上の相異なる時点tに対応する音高K(t)の時系列を特定する。音高K(t)は、N個の音高P1~PNの何れかに設定される。
【0093】
音高K(t)の推定には第2HMMが利用される。第2HMMは、相異なる音高Pnに対応するN個の状態で構成される状態遷移モデルである。音高Pnの観測確率xの確率密度関数ρ(x|μn,κn)は、以下の数式(5)で表現されるフォンミーゼス・フィッシャー(Von Mises-Fisher)分布である。
【数5】
数式(5)の記号Tは行列の転置を意味し、記号|| ||はノルムを意味する。数式(5)の記号μnは位置パラメータを意味し、記号κnは集中度パラメータを意味する。位置パラメータμnおよび集中度パラメータκnは、発音指標E(t,n)を利用した機械学習により設定される。
【0094】
第2HMMにおいて、音高Pn1から音高Pn2への遷移確率λ(n1,n2)は、以下の数式(6)で表現される(n1=1~N,n2=1~N,n1≠n2)。N個の音高P1~PNから2個の音高Pn(Pn1,Pn2)を選択する全通りの組合せについて、数式(6)により遷移確率λ(n1,n2)が設定される。
【数6】
数式(6)の記号IはN次元の単位行列を意味する。記号τ(n1,n2)は、音高Pn1から音高Pn2への遷移の確率を意味し、既知の楽譜を利用した機械学習により設定される。なお、有音指標G(t)が数値g0(無音)である時点tにおいては、音高Pn1から音高Pn2への遷移確率が単位行列Iに設定され、かつ、観測確率xは所定の定数に設定される。
【0095】
数式(6)から理解される通り、音高K(t)の推定には、利用者Uからの指示に応じて設定された変数γが適用される。具体的には、変数γが小さいほど、遷移確率λ(n1,n2)は単位行列Iに近付くから、音高Pn1から音高Pn2への遷移は発生し難くなる。他方、変数γが大きいほど、遷移確率λ(n1,n2)に対する遷移確率τ(n1,n2)の影響が増加するから、音高Pn1から音高Pn2への遷移が発生し易くなる。
【0096】
[情報生成部54]
情報生成部54は、時間軸上のM個の発音点T1~TMと、各発音点Tm(m=1~M)における音高Fm(F1~FM)とを特定する。楽曲内における発音点Tmの個数Mは可変値である。具体的には、情報生成部54は、有音指標G(t)が数値g1である演奏期間内において音高K(t)が変化する時点tを発音点Tmとして特定する。また、情報生成部54は、各発音点Tmにおける音高K(Tm)を音高Fmとして特定する。
【0097】
前述の通り、変数γが小さいほど音高Pnの遷移が発生し難いから、発音点Tmおよび音高Fmの個数Mは少なくなる。他方、変数γが大きいほど音高Pnの遷移が発生し易いから、発音点Tmおよび音高Fmの個数Mは多くなる。すなわち、変数γは、発音点Tmおよび音高Fmの個数Mを制御するためのパラメータとも換言される。
【0098】
また、情報生成部54は、指標算定部51(第2演算部514)が算定した発音指標E(t,n)と、時間軸上の各発音点Tmと、期間推定部52が算定した有音指標G(t)とを含む参照データDaを、記憶装置12に格納する。
【0099】
図13の表示制御部36は、以上に説明した音響解析部43による解析の結果を表示装置15に表示させる。具体的には、表示制御部36は、
図15に例示された確認画面60を表示装置15に表示させる。確認画面60は、音響解析部43による解析の結果を利用者Uが確認するための画像である。
【0100】
確認画面60は、第1領域61と第2領域62とを含む。第1領域61および第2領域62には共通の時間軸Atが設定される。時間軸Atは横方向に延在する軸線である。なお、時間軸Atは、利用者Uが視認可能な画像として表示されてもよいし、確認画面60に表示されなくてもよい。楽曲のうち確認画面60の表示される区間は、操作装置14に対する利用者Uからの指示(例えば拡大/縮小の指示)に応じて変更される。
【0101】
第2領域62のうち時間軸At上における演奏期間621と演奏期間621以外の期間(以下「非演奏期間」という)622とは相異なる表示態様で表示される。例えば、演奏期間621と非演奏期間622とは相異なる色相で表示される。演奏期間621は、時間軸At上において有音指標G(t)が数値g1に設定される範囲である。他方、非演奏期間622は、時間軸At上において有音指標G(t)が数値g0に設定される範囲である。以上の説明から理解される通り、確認画面60には、期間推定部52が推定した演奏期間621が表示される。
【0102】
第1領域61には遷移画像64が表示される。遷移画像64は、指標算定部51が算定する発音指標C(t)の時系列を時間軸Atのもとで表示する画像である。具体的には、遷移画像64のうち時間軸At上の時点tに対応する部分は、発音指標C(t)に応じた表示態様で表示される。「表示態様」とは、観察者が視覚的に弁別可能な画像の性状を意味する。例えば、色の3属性である色相(色調),彩度および明度(階調)のほか、模様または形状も、「表示態様」の概念に包含される。例えば、遷移画像64のうち時点tに対応する部分の階調の濃淡が、発音指標C(t)に応じて制御される。具体的には、遷移画像64のうち発音指標C(t)が大きい時点tに対応する部分は濃階調で表示され、遷移画像64のうち発音指標C(t)が小さい時点tに対応する部分は淡階調で表示される。
【0103】
第2領域62には、五線譜65と複数の指示画像67と複数の音符画像68とが表示される。五線譜65は、時間軸Atに平行な5本の直線で構成される。五線譜65を構成する各直線は相異なる音高を表す。すなわち、第2領域62には、音高を表す音高軸Apが設定される。音高軸Apは、時間軸Atに直交する縦方向に延在する軸線である。なお、音高軸Apは、利用者Uが視認可能な画像として表示されてもよいし、確認画面60に表示されなくてもよい。
【0104】
各指示画像67は、情報生成部54が生成する1個の発音点Tmを表す画像である。すなわち、複数の指示画像67により発音点Tmの時系列が表現される。具体的には、発音点Tmに対応する指示画像67は、時間軸At上において当該発音点Tmに対応する位置に配置された縦線である。したがって、相異なる発音点Tmに対応する複数の指示画像67が時間軸At上に配置される。
【0105】
各音符画像68は、情報生成部54が生成する1個の音高Fmを表す画像である。例えば音符の符頭を表す画像が音符画像68として例示されている。複数の音符画像68により音高Fmの時系列が表現される。音高Fmは発音点Tm毎に設定されるから、音符画像68は発音点Tm毎(すなわち指示画像67毎)に配置される。具体的には、発音点Tmでの音高Fmを表す音符画像68は、時間軸Atの方向において、当該発音点Tmを表す指示画像67の線上に配置される。また、音高Fmを表す音符画像68は、音高軸Apの方向において当該音高Fmに対応する位置に配置される。すなわち、各音符画像68は、五線譜65に重複または近接する位置に配置される。
【0106】
以上に例示した通り、確認画面60には、発音指標C(t)の時系列(遷移画像64)と発音点Tmの時系列(指示画像67)と音高Fmの時系列(音符画像68)とが共通の時間軸Atのもとで表示される。したがって、利用者Uは、発音指標C(t)と発音点Tmと音高Fmとの時間的な関係を視覚的および直観的に確認できる。
【0107】
また、確認画面60は、複数の操作画像71(71a,71b,71c)と操作画像72とを含む。各操作画像71は、利用者Uが操作装置14により操作可能な操作子である。具体的には、操作画像71aは、変数αの変更の指示を利用者Uから受付ける画像である。操作画像71bは、変数βの変更の指示を利用者Uから受付ける画像である。操作画像71cは、変数γの変更の指示を利用者Uから受付ける画像である。
【0108】
指標算定部51(第2解析部512)は、操作画像71aに対する利用者Uからの指示に応じて変数αを変更する。指標算定部51は、変更後の変数αを適用した演算により発音指標C(t)を算定する。表示制御部36は、発音指標C(t)の算定毎に、確認画面60の遷移画像64を更新する。前述の通り、変数αが増加するほど、演奏装置20の音響成分が優勢に存在する期間内の発音指標C(t)は小さい数値となり、結果的に有音指標G(t)は数値g0に設定され易いという傾向がある。したがって、
図16に例示される通り、変数αが増加するほど、遷移画像64のうち演奏装置20の音響成分が優勢に存在する期間内の階調が淡階調に変化し、かつ、非演奏期間622が拡大する。準備期間にて利用者U1が楽器80を演奏した期間に演奏期間621が近付くように、利用者Uは確認画面60を確認しながら操作画像71aを操作する。
【0109】
期間推定部52は、操作画像71bに対する利用者Uからの指示に応じて変数βを変更する。期間推定部52は、変更後の変数βを適用した演算により有音確率Λを算定する。表示制御部36は、有音確率Λの算定毎に、確認画面60の演奏期間621を更新する。前述の通り、変数βが増加するほど、有音指標G(t)は数値g0に設定され易いという傾向がある。したがって、
図17に例示される通り、変数βが増加するほど、非演奏期間622が拡大する。準備期間にて利用者U1が楽器80を演奏した期間に演奏期間621が近付くように、利用者Uは確認画面60を確認しながら操作画像71bを操作する。
【0110】
音高推定部53は、操作画像71cに対する利用者Uからの指示に応じて変数γを変更する。音高推定部53は、変更後の変数γを適用した演算により遷移確率λ(n1,n2)を算定する。表示制御部36は、遷移確率λ(n1,n2)の算定毎に、確認画面60の指示画像67および音符画像68を更新する。前述の通り、変数γが増加するほど、遷移確率λ(n1,n2)が増加する。したがって、
図18に例示される通り、変数γが増加するほど、指示画像67(発音点Tm)の個数および音符画像68(音高Fm)の個数は増加する。準備期間における利用者U1の演奏内容に近付くように、利用者Uは確認画面60を確認しながら操作画像71bを操作する。
【0111】
操作画像72は、参照データDaの保存の指示を利用者Uから受付ける画像である。情報生成部54は、操作画像72が操作された時点における解析の内容(発音指標E(t,n),各発音点Tmおよび有音指標G(t))を参照データDaとして記憶装置12に保存する。
【0112】
図19は、調整処理Scの具体的な手順を例示するフローチャートである。準備期間における演奏データDbおよび参照信号Zrの取得後に、例えば操作装置14に対する利用者Uからの指示を契機として、調整処理Scが開始される。
【0113】
調整処理Scが開始されると、音響解析部43は、参照信号Zrを解析する解析処理Sc1を実行する。解析処理Sc1は、指標算定処理Sc11と期間推定処理Sc12と音高推定処理Sc13と情報生成処理Sc14を含む。指標算定処理Sc11は「第1処理」の一例であり、期間推定処理Sc12は「第2処理」の一例であり、音高推定処理Sc13は「第3処理」の一例である。また、変数αは「第1変数」の一例であり、変数βは「第2変数」の一例であり、変数γは「第3変数」の一例である。
【0114】
指標算定部51は、演奏データDbと参照信号Zrとを利用して発音指標C(t)を算定する(指標算定処理Sc11)。指標算定処理Sc11は、前述の通り、第1解析部511による第1指標B1(t,n)の算定と、第2解析部512による第2指標B2(t,n)の算定と、第1演算部513による発音指標E(t,n)の算定と、第2演算部514による発音指標C(t)の算定とを含む。指標算定処理Sc11には、利用者Uからの指示に応じて設定された変数αが適用される。
【0115】
期間推定部52は、発音指標C(t)を利用した有音指標G(t)の算定により演奏期間621を推定する(期間推定処理Sc12)。期間推定処理Sc12には、利用者Uからの指示に応じて設定された変数βが適用される。また、音高推定部53は、楽器80の音響成分の音高K(t)を推定する(音高推定処理Sc13)。音高推定処理Sc13には、利用者Uからの指示に応じて設定された変数γが適用される。そして、情報生成部54は、時間軸上の複数の発音点Tmと発音点Tm毎の音高Fmとを特定する(情報生成処理Sc4)。
【0116】
表示制御部36は、以上に例示した解析処理Sc1の結果を表す確認画面60を表示装置15に表示させる(Sc2)。具体的には、時間軸At上の演奏期間621と、発音指標C(t)を表す遷移画像64と、各発音点Tmを表す指示画像67と、各音高Fmを表す音符画像68とが、確認画面60に表示される。
【0117】
音響解析部43は、操作画像71(71a,71b,71c)が操作されたか否かを判定する(Sc3)。すなわち、変数(α,βまたはγ)の変更が利用者Uから指示されたか否かが判定される。操作画像71が操作された場合(Sc3:YES)、音響解析部43は、変更後の各変数(α,βまたはγ)を適用した解析処理Sc1と、当該解析処理Sc1の結果に応じた確認画面60の更新(Sc2)とを実行する。なお、第1解析部511による第1指標B1(t,n)の算定は、解析処理Sc1の開始直後の指標算定処理Sc11において1回だけ実行されればよい。
【0118】
操作画像71が操作されない場合(Sc3:NO)、音響解析部43は、操作画像72が操作されたか否かを判定する(Sc4)。すなわち、参照データDaの確定が利用者Uから指示されたか否かが判定される。操作画像72が操作されない場合(Sc4:NO)、音響解析部43は、処理をステップSc3に移行する。他方、操作画像72が操作された場合(Sc4:YES)、情報生成部54は、現時点における解析処理Sc1の結果(発音指標E(t,n),各発音点Tmおよび有音指標G(t))を参照データDaとして記憶装置12に保存する(Sc5)。参照データDaの保存により調整処理Scは終了する。
【0119】
以上に説明した通り、第1実施形態においては、発音指標C(t)の時系列(遷移画像64)と音高Fmの時系列(音符画像68)とが共通の時間軸Atのもとで表示されるから、参照データDaを生成する過程における参照信号Zrの解析結果を利用者Uが容易に確認および修正できる。具体的には、発音指標C(t)と音高Fmとの時間的な関係を利用者Uが視覚的および直観的に確認できる。
【0120】
また、第1実施形態においては、参照信号Zrの解析で算定される第1指標B1(t,n)から、演奏データDbの解析で算定される第2指標B2(t,n)を減算することで発音指標C(t)が算定される。したがって、演奏装置20の音響成分の影響が低減された発音指標C(t)を算定できる。すなわち、楽器80の音響成分が強調された発音指標C(t)を算定できる。また、利用者Uからの指示に応じて設定される変数αが第2指標B2(t,n)の算定に適用されるから、利用者Uは、準備期間における楽器80の演奏に適合するように発音指標C(t)を調整できる。
【0121】
第1実施形態においては、発音指標C(t)の時系列(遷移画像64)と音高Fmの時系列(音符画像68)とに加えて演奏期間621が共通の時間軸Atのもとで表示される。したがって、発音指標C(t)と音高Fmと演奏期間621との時間的な関係を利用者Uが視覚的および直観的に確認できる。また、利用者Uからの指示に応じて設定される変数βが期間推定処理Sc12に適用されるから、利用者Uは、準備期間における楽器80の演奏に適合するように演奏期間621を調整できる。
【0122】
第1実施形態においては、発音指標C(t)の時系列(遷移画像64)と音高Fmの時系列(音符画像68)とに加えて発音点Tmの時系列(指示画像67)が共通の時間軸Atのもとで表示される。したがって、発音指標C(t)と音高Fmと発音点Tmとの時間的な関係を利用者Uが視覚的および直観的に確認できる。また、利用者Uからの指示に応じて設定される変数γが音高推定処理Sc13に適用されるから、利用者Uは、準備期間における楽器80の演奏に適合するように発音点Tmを調整できる。
【0123】
F:変形例
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
【0124】
(1)前述の各形態においては、操作装置14を解放状態から操作状態に遷移させる操作を第1指示Q1として指示受付部33が受付けたが、第1指示Q1の態様は以上の例示に限定されない。例えば、利用者Uによる特定の動作が第1指示Q1として検出される。利用者Uの動作の検出には、例えば撮像装置または加速度センサ等の各種の検出装置が利用される。例えば、利用者Uが片手を上昇させる動作、楽器80を持上げる動作、または呼吸する動作(例えば息を吸う動作)等の各種の動作を、指示受付部33は第1指示Q1として特定する。利用者Uによる呼吸は、例えば、管楽器を楽器80として演奏する場合におけるブレス(息継ぎ)である。第2実施形態における操作速度V1は、第1指示Q1として特定される利用者Uの動作の速度として包括的に表現される。
【0125】
第1指示Q1を意味する特定のデータ(以下「第1データ」という)を演奏データDbに含ませてもよい。第1データは、例えば楽曲内のフェルマータを意味するデータである。指示受付部33は、再生位置Yが第1データの時点に到達した場合に第1指示Q1が発生したと判定する。以上の説明から理解される通り、第1指示Q1は、利用者Uからの指示には限定されない。なお、編集処理Sbにおいて散布度Δが閾値Δthを上回る場合に、編集処理部34が音符N1に第1データを付加してもよい。
【0126】
(2)前述の各形態においては、操作装置14を操作状態から解放状態に遷移させる操作を第2指示Q2として指示受付部33が受付けたが、第2指示Q2の態様は以上の例示に限定されない。例えば、第1実施形態における第1指示Q1と同様に、操作装置14を解放状態から操作状態に遷移させる操作を第2指示Q2として指示受付部33が受付けてもよい。すなわち、可動部141の踏込および解放を含む2回の操作を、第1指示Q1および第2指示Q2として検出してもよい。
【0127】
また、利用者Uの特定の動作が第2指示Q2として検出されてもよい。利用者Uの動作の検出には、例えば撮像装置または加速度センサ等の各種の検出装置が利用される。例えば、利用者Uが片手を降下させる動作、楽器80を低下させる動作、または呼吸する動作(例えば息を吐く動作)等の各種の動作を、指示受付部33は第2指示Q2として特定する。利用者Uによる呼吸は、例えば、管楽器を楽器80として演奏する場合におけるブレス(息継ぎ)である。第2実施形態における操作速度V2は、第2指示Q2として特定される利用者Uの動作の速度として包括的に表現される。
【0128】
第2指示Q2を意味する特定のデータ(以下「第2データ」という)を演奏データDbに含ませてもよい。第2データは、例えば楽曲内のフェルマータを意味するデータである。指示受付部33は、再生位置Yが第2データの時点に到達した場合に第2指示Q2が発生したと判定する。以上の説明から理解される通り、第2指示Q2は、利用者Uからの指示には限定されない。
【0129】
以上の例示の通り、相互に対となる利用者Uの一連の動作の一方を第1指示Q1として受付け、他方を第2指示Q2として受付ける構成が想定される。例えば、利用者Uが片手を上昇させる動作が第1指示Q1として受付けられ、当該動作に引続いて片手を降下させる動作が第2指示Q2として受付けられる。また、利用者Uが楽器80を持上げる動作が第1指示Q1として受付けられ、当該動作に引続いて楽器80を降下させる動作が第2指示Q2として受付けられる。同様に、利用者Uが息を吸う動作が第1指示Q1として受付けられ、当該動作に引続いて息を吐く動作が第2指示Q2として受付けられる。
【0130】
ただし、第1指示Q1および第2指示Q2は、利用者Uによる同種の動作である必要はない。すなわち、利用者Uが相互に独立に実行可能な別個の動作を第1指示Q1および第2指示Q2として検出してもよい。例えば、指示受付部33は、操作装置14に対する操作を第1指示Q1として検出し、楽器80を持上げる動作または呼吸する動作等の他の動作を第2指示Q2として検出してもよい。
【0131】
(3)前述の各形態においては、自動演奏楽器を演奏装置20として例示したが、演奏装置20の構成は以上の例示に限定されない。例えば、音響処理システム10からの指示に応じて楽音の音響信号を生成する音源装置と、当該音響信号が表す楽音を再生する放音装置とを具備する音源システムを、演奏装置20として採用してもよい。音源装置は、ハードウェア音源またはソフトウェア音源として実現される。なお、第5実施形態における演奏装置20についても同様である。
【0132】
(4)第5実施形態においては、利用者Uによる変数の変更毎(Sc3:YES)に解析処理Sc1の全部を実行したが、解析処理Sc1に含まれる各処理(Sc11-Sc14)が実行される条件は以上の例示に限定されない。以下の説明においては、操作画像71(71a,71b,71c)に対する操作で利用者Uが変数を変更する場合を想定する。具体的には、利用者Uは、操作装置14に対する操作で操作画像71を選択し、選択を維持したまま当該操作画像71を移動する。変数の数値は、選択が解除された時点における操作画像71の位置に応じた数値に変更される。すなわち、操作画像71の選択の解除は、変数の数値の確定を意味する。
【0133】
操作画像71aの操作により利用者Uが変数αを変更する場合を想定する。選択状態の操作画像71aが移動する過程において、指標算定部51は、指標算定処理Sc11を反復することで発音指標C(t)を随時に更新する。表示制御部36は、指標算定処理Sc11の実行毎に、更新後の発音指標C(t)に応じて遷移画像64を更新する。すなわち、操作画像71aの移動(変数αの変更)に並行して、指標算定処理Sc11と遷移画像64の更新とが実行される。操作画像71aが選択された状態では、期間推定処理Sc12と音高推定処理Sc13と情報生成処理Sc14とは実行されない。操作画像71aの選択が解除された場合、当該時点における発音指標C(t)を利用して、期間推定処理Sc12と音高推定処理Sc13と情報生成処理Sc14とが実行され、処理結果に応じて確認画面60が更新される。以上の構成においては、操作画像71aが選択された状態では、期間推定処理Sc12と音高推定処理Sc13と情報生成処理Sc14とが実行されないから、調整処理Scの処理負荷が軽減される。
【0134】
操作画像71bの操作により利用者Uが変数βを変更する場合を想定する。選択状態の操作画像71bが移動する過程において、期間推定部52は、期間推定処理Sc12を反復することで有音指標G(t)を随時に更新する。表示制御部36は、期間推定処理Sc12の実行毎に、確認画面60における演奏期間621を更新する。操作画像71aが選択された状態では、指標算定処理Sc11と音高推定処理Sc13と情報生成処理Sc14とは実行されない。操作画像71bの選択が解除された場合、当該時点における有音指標G(t)を利用して、音高推定処理Sc13と情報生成処理Sc14とが実行され、処理結果に応じて確認画面60が更新される。
【0135】
操作画像71cの操作により利用者Uが変数γを変更する場合を想定する。選択状態の操作画像71cが移動する過程においては、解析処理Sc1および確認画面60の更新(Sc2)は実行されない。操作画像71cの選択が解除された場合に、変更後の変数γを適用した音高推定処理Sc13と、当該音高推定処理Sc13で算定された音高K(t)を適用した情報生成処理Sc14とが実行される。以上の構成によれば、音高推定処理Sc13および情報生成処理Sc14の回数が削減されるから、調整処理Scの処理負荷が軽減される。
【0136】
(5)発音指標C(t)を表す遷移画像64の態様は以上の例示に限定されない。例えば、
図20に例示される通り、時間軸上の波形が遷移画像64として表示装置15に表示されてもよい。遷移画像64の波形のうち時間軸At上の時点tにおける振幅が、発音指標C(t)に応じて設定される。例えば、発音指標C(t)が大きい時点tにおいて大振幅となる波形が遷移画像64として表示される。なお、遷移画像64を五線譜65に重複して表示してもよい。
【0137】
(6)指標算定部51が発音指標C(t)を算定する処理は、第5実施形態において例示した処理に限定されない。例えば、指標算定部51は、演奏装置20の楽音の振幅スペクトルを参照信号Zrの振幅スペクトルから減算することで発音指標E(t,n)を算定してもよい。演奏装置20の楽音の振幅スペクトルは、例えば、演奏データDbが指定する楽音を表す楽音信号を生成する公知の音源処理と、当該楽音信号に対する離散フーリエ変換等の周波数解析とにより生成される。減算後の振幅スペクトルが、相異なる音高Pnに対応するN個の発音指標E(t,n)の系列に相当する。演奏装置20の楽音の振幅スペクトログラムを減算する度合が変数αに応じて調整される。
【0138】
(7)期間推定部52が演奏期間を推定する処理は、第5実施形態において例示した処理に限定されない。例えば、期間推定部52は、参照信号Zrのうち信号強度が閾値を上回る期間を演奏期間として推定する。閾値は変数βに応じて調整される。また、音高推定部53が音高K(t)を推定する処理も、前述の例示に限定されない。
【0139】
(8)例えばスマートフォンまたはタブレット端末等の端末装置との間で通信するサーバ装置により音響処理システム10が実現されてもよい。例えば、端末装置は、利用者Uによる演奏に応じた音響信号Zを生成する収音装置13と、音響処理システム10からの指示に応じて楽曲を再生する演奏装置20とを具備する。端末装置は、収音装置13が生成する音響信号Zと、利用者Uの動作に応じた第1指示Q1および第2指示Q2とを、通信網を介して音響処理システム10に送信する。音響処理システム10は、音響信号Zから推定される演奏位置Xと、端末装置から受信する第1指示Q1および第2指示Q2とに応じて、端末装置の演奏装置20に楽曲の再生パートを再生させる。なお、演奏解析部31は端末装置に搭載されてもよい。端末装置は、演奏解析部31が推定した演奏位置Xを音響処理システム10に送信する。以上の構成においては、音響処理システム10から演奏解析部31が省略される。第5実施形態の音響処理システム10も同様にサーバ装置により実現される。例えば、音響処理システム10は、端末装置から受信した参照信号Zrおよび演奏データDbを適用した解析処理Sc1により参照データDaを生成し、当該参照データDaを端末装置に送信する。
【0140】
(9)以上に例示した音響処理システム10の機能は、前述の通り、制御装置11を構成する単数または複数のプロセッサと、記憶装置12に記憶されたプログラムとの協働により実現される。本開示に係るプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体も包含される。なお、非一過性の記録媒体とは、一過性の伝搬信号(transitory, propagating signal)を除く任意の記録媒体を含み、揮発性の記録媒体も除外されない。また、配信装置が通信網を介してプログラムを配信する構成では、当該配信装置においてプログラムを記憶する記憶装置が、前述の非一過性の記録媒体に相当する。
【0141】
G:付記
以上に例示した形態から、例えば以下の構成が把握される。
【0142】
本開示のひとつの態様(態様1)に係る音響処理システムは、第1音源の音響を収録した音響信号を解析する解析処理を実行する音響解析部であって、前記解析処理は、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む音響解析部と、前記発音指標の時系列と前記音高の時系列とを共通の時間軸のもとで表示装置に表示させる表示制御部とを具備する。以上の態様においては、発音指標の時系列と音高の時系列とが共通の時間軸のもとで表示されるから、参照データを生成する過程における音響信号の解析結果を利用者が容易に確認および修正できる。具体的には、発音指標と音高との時間的な関係を利用者が視覚的および直観的に確認できる。
【0143】
態様1の具体例(態様2)において、前記音響信号は、前記第1音源の音響成分と第2音源の音響成分とを含み、前記第1処理は、前記音響信号の強度に応じた第1指標を算定する処理と、前記第2音源について音符毎の発音強度を指定する演奏データから、前記第2音源の音響成分の強度に応じた第2指標を算定する処理と、前記第1指標から第2指標を減算する処理とを含み、前記発音指標は、前記減算の結果に応じた指標である。以上の態様においては、第1音源の音響成分と第2音源の音響成分とを含む音響信号の強度に応じた第1指標から、演奏データに応じて算定される第2指標を減算した結果から、発音指標が算定される。したがって、第2音源の音響成分の影響が低減された発音指標(すなわち、第1音源の音響成分が強調された発音指標)を算定できる。
【0144】
態様2の具体例(態様3)において、前記第2指標を算定する処理には、利用者からの指示に応じて設定された第1変数が適用され、前記第1変数に応じて前記第2指標が変化する。以上の態様によれば、第1音源の既知の発音内容(例えば演奏内容)に適合するように利用者が発音指標を調整できる。
【0145】
態様1から態様3の何れかの具体例(態様4)において、前記解析処理は、前記第1音源の音響成分が存在する発音期間を特定する第2処理をさらに含み、前記表示制御部は、前記時間軸のもとで前記発音期間を表示させる。以上の態様によれば、発音指標および音高と第1音源の発音期間との時間的な関係を、利用者が視覚的および直観的に確認できる。
【0146】
態様4の具体例(態様5)において、前記第2処理には、利用者からの指示に応じて設定された第2変数が適用され、前記第2変数に応じて前記発音期間が変化する。以上の態様によれば、第1音源の既知の発音内容(例えば演奏内容)に適合するように利用者が発音期間を調整できる。
【0147】
態様1から態様5の何れかの具体例(態様6)において、前記解析処理は、前記第1音源の音響成分の音高の時系列を特定する第3処理をさらに含み、前記表示制御部は、前記音高が変化する時点である発音点を前記時間軸のもとで表示させる。以上の態様によれば、発音指標および音高と第1音源の発音点との時間的な関係を、利用者が視覚的および直観的に確認できる。
【0148】
態様6の具体例(態様7)において、前記第3処理には、利用者からの指示に応じて設定された第3変数が適用され、前記第3変数に応じて前記発音点の個数が変化する。以上の態様によれば、第1音源の既知の発音内容(例えば演奏内容)に適合するように利用者が発音点を調整できる。
【0149】
本開示のひとつの態様(態様8)に係る音響処理方法は、第1音源の音響を収録した音響信号を解析する解析処理であって、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む解析処理を実行し、前記発音指標の時系列と前記音高の時系列とを共通の時間軸のもとで表示装置に表示させる。なお、
図19の解析処理Sc1は、態様8における「解析処理」の一例である。また、
図19のステップSc2は、態様8における「発音指標の時系列と音高の時系列とを共通の時間軸のもとで表示装置に表示させる処理」の一例である。
【0150】
本開示のひとつの態様(態様9)に係るプログラムは、第1音源の音響を収録した音響信号を解析する解析処理を実行する音響解析部であって、前記解析処理は、前記音響信号に前記第1音源の音響成分が含まれる確度の指標である発音指標の時系列を特定する第1処理と、前記第1音源の音響成分に関する音高の時系列を特定する処理とを含む音響解析部、および、前記発音指標の時系列と前記音高の時系列とを共通の時間軸のもとで表示装置に表示させる表示制御部、としてコンピュータシステムを機能させる。
【符号の説明】
【0151】
100…再生システム、10…音響処理システム、11…制御装置、12…記憶装置、13…収音装置、14…操作装置、15…表示装置、20…演奏装置、21…駆動機構、22…発音機構、31…演奏解析部、32…再生制御部、33…指示受付部、34…編集処理部、35…準備処理部、36…表示制御部、41…第1収録部、42…第2収録部、43…音響解析部、51…指標算定部、52…期間推定部、53…音高推定部、54…情報生成部、60…確認画面、61…第1領域、62…第2領域、64…遷移画像、65…五線譜、67…指示画像、68…音符画像、71(71a,71b,71c),72…操作画像、80…楽器、141…可動部、511…第1解析部、512…第2解析部、513…第1演算部、514…第2演算部、621…演奏期間、622…非演奏期間。