IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ Pioneer DJ株式会社の特許一覧

特許7175395楽曲構造解析装置および楽曲構造解析プログラム
<>
  • 特許-楽曲構造解析装置および楽曲構造解析プログラム 図1
  • 特許-楽曲構造解析装置および楽曲構造解析プログラム 図2
  • 特許-楽曲構造解析装置および楽曲構造解析プログラム 図3
  • 特許-楽曲構造解析装置および楽曲構造解析プログラム 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-10
(45)【発行日】2022-11-18
(54)【発明の名称】楽曲構造解析装置および楽曲構造解析プログラム
(51)【国際特許分類】
   G10L 25/51 20130101AFI20221111BHJP
   G10G 3/04 20060101ALI20221111BHJP
【FI】
G10L25/51 300
G10G3/04
【請求項の数】 4
(21)【出願番号】P 2021528065
(86)(22)【出願日】2019-06-17
(86)【国際出願番号】 JP2019023928
(87)【国際公開番号】W WO2020255213
(87)【国際公開日】2020-12-24
【審査請求日】2021-12-01
(73)【特許権者】
【識別番号】315017409
【氏名又は名称】AlphaTheta株式会社
(74)【代理人】
【識別番号】110000637
【氏名又は名称】特許業務法人樹之下知的財産事務所
(72)【発明者】
【氏名】鈴木 四郎
(72)【発明者】
【氏名】佐飛 利尚
【審査官】大野 弘
(56)【参考文献】
【文献】特開2008-159252(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 25/51
G10G 3/04
(57)【特許請求の範囲】
【請求項1】
楽曲データを構成する所定の周波数以下の信号の信号強度のうち、所定区間内の最大レベルのピーク信号を検出するピーク信号検出手段と、
前記ピーク信号検出手段により検出されたピーク信号の信号強度について、前記楽曲データを構成する単位区間毎に平滑化処理を行う平滑化処理手段と、
前記平滑化処理手段により平滑化された単位区間毎のピーク信号の信号強度について、時間的に前後する単位区間とのピーク信号の信号強度の差分量を算出する差分量算出手段と、
前記差分量算出手段により算出された単位区間毎のピーク信号の信号強度の差分量のうち、ピーク信号の信号強度の差分量が、最も高い信号強度の差分量に対して所定の閾値の範囲内となるピーク信号を抽出するピーク信号抽出手段と、
前記ピーク信号抽出手段により抽出されたピーク信号のうち、その後のピーク信号の信号強度の時間的変化が所定時間継続して所定の閾値の範囲内にあるときに、当該ピーク信号の時間的位置を楽曲データの区切り点と判定する区切り点判定手段と、
を備える楽曲構造解析装置。
【請求項2】
請求項1に記載の楽曲構造解析装置において、
前記区切り点判定手段における所定の閾値は、抽出されたピーク信号の信号強度の±30%であり、継続時間は2小節以上である楽曲構造解析装置。
【請求項3】
請求項1または請求項2に記載の楽曲構造解析装置において、
前記ピーク信号抽出手段における閾値は、最も高い信号強度の差分量に対して60%以上である楽曲構造解析装置。
【請求項4】
コンピュータを請求項1から請求項3のいずれか一項に記載の楽曲構造解析装置として機能させるコンピュータ読取可能な楽曲構造解析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、楽曲構造解析装置および楽曲構造解析プログラムに関する。
【背景技術】
【0002】
従来、楽曲データの構造解析では、FFT(Fast Fourier Transform)等の周波数分析を行い、楽曲データの周波数スペクトル、低域、中域、高域の周波数成分のパワースペクトル、低域の周波数成分の出現頻度等を利用して、楽曲データの構造解析が行われている。
たとえば、特許文献1には、楽曲データのテンポの変化点を検出することにより、楽曲データのサビ(hook)の展開点を判別する技術が開示されている。
また、特許文献2には、STFT(Short Time Fourier Transform)変換によって生成されたパワースペクトルから得られたクロマベクトル情報のコードの推移から楽曲データのサビの展開位置を推定する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2008-65153号公報
【文献】特開2004-233965号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、前記特許文献1に開示された技術では、楽曲データの展開点の判別にテンポの変化点を利用しているに過ぎないため、正しい展開点を高精度に検出することが困難であるという課題がある。
また、前記特許文献2に開示された技術では、楽曲データの低域、中域、高域周波数すべての周波数スペクトルからクロマベクトル情報を取得しているため、音域毎の判別が難しく、Aメロ、Bメロ、サビ等の展開位置を精度よく推定することが困難であるという課題がある。
【0005】
本発明の目的は、楽曲データの展開位置等の区切り点を高精度に判定することのできる楽曲構造解析装置および楽曲構造解析プログラムを提供することにある。
【課題を解決するための手段】
【0006】
本発明の楽曲構造解析装置は、楽曲データを構成する所定の周波数以下の信号の信号強度のうち、所定区間内の最大レベルのピーク信号を検出するピーク信号検出手段と、前記ピーク信号検出手段により検出されたピーク信号の信号強度について、前記楽曲データを構成する単位区間毎に平滑化処理を行う平滑化処理手段と、前記平滑化処理手段により平滑化された単位区間毎のピーク信号の信号強度について、時間的に前後する単位区間とのピーク信号の信号強度の差分量を算出する差分量算出手段と、前記差分量算出手段により算出された単位区間毎のピーク信号の信号強度の差分量のうち、ピーク信号の信号強度の差分量が、最も高い信号強度の差分量に対して処理の閾値の範囲内となるピーク信号抽出手段と、前記ピーク信号抽出手段により抽出されたピーク信号のうち、その後のピーク信号の信号強度の時間的変化が所定の閾値の範囲内にあり、かつ所定時間継続するピーク信号の時間的位置を前記楽曲データの区切り点と判定する区切り点判定手段と、を備える。
本発明のコンピュータ読取可能なプログラムは、コンピュータを前述した楽曲構造解析装置として機能させる。
【図面の簡単な説明】
【0007】
図1】本発明の実施の形態に係る楽曲構造解析装置の構造を示す機能ブロック図。
図2】前記実施の形態における平滑化処理、差分量の算出を説明するためのグラフ。
図3】前記実施の形態における区切り点の判定を説明するためのグラフ。
図4】前記実施の形態における作用を説明するためのフローチャート。
【発明を実施するための形態】
【0008】
図1には、本発明の実施の一形態に係る楽曲構造解析装置1が示されている。楽曲構造解析装置1は、入力された楽曲データの解析を行って、楽曲データの構造を特徴付けるイントロ(intro)、Aメロ(verse)、サビ(hook)、アウトロ(outro)等の特徴区間の展開位置、すなわち楽曲データの区切り点を判定する装置である。
【0009】
楽曲構造解析装置1は、LPF(Low Pass Filter)処理手段2、ピーク信号検出手段4、平滑化処理手段5、差分量算出手段6、ピーク信号抽出手段7、区切り点判定手段8、および判定結果出力手段9を備える。これらの各機能的手段は、コンピュータのCPU上で実行されるコンピュータ読取可能なプログラムとして構成される。
【0010】
楽曲構造解析装置1により解析された楽曲データの区切り点は、判定結果出力手段9を介しコンピュータ上のディスプレイ10、照明制御手段11に出力される。楽曲データの区切り点は、コンピュータのディスプレイ10において、楽曲の進行を表示する波形グラフ上に重畳表示され等の特徴を表す画像として表示され、DJプレイヤー等の演奏者に再生中の楽曲の区切れ点、すなわち展開位置を認識させる。
【0011】
DJプレイヤーは、推定された楽曲データの展開位置から、DJコントローラ等で現在再生中の楽曲から、次に再生する楽曲の適否を判断して、違和感のない最適なDJパフォーマンスを行うことができる。
また、楽曲データの区切れ点は、照明制御手段11に出力され、楽曲データの展開に応じた照明制御が実行され、DJパフォーマンスにおける照明演出が行われる。
【0012】
LPF処理手段2は、楽曲データの低域周波数の信号のみを通過させ、中域周波数、高域周波数の信号をカットする。カットオフ周波数は、バスドラム、ベース等のリズムセクションの信号の周波数に相当し、たとえば200Hz以下、好ましくは100Hz以下である。
低域周波数の信号の信号強度のピークを、所定間隔、たとえば拍毎に検出することにより、展開区間毎に変化することが多いリズムセクションの音量感の変化を把握することができる。
【0013】
ピーク信号検出手段4は、LPF処理後のレベルをある所定区間毎、たとえば拍単位での最大レベルの信号値を検出し、さらに、別のある単位区間、例えば小節毎に、その区間内の最大レベルの信号値をピーク信号として検出する。
【0014】
平滑化処理手段5は、ピーク信号検出手段4により検出されたピーク信号の信号強度について、楽曲データを構成する単位区間毎に平滑化処理を行う。ここで、本実施形態における単位区間は1小節を単位区間としている。
具体的には、平滑化処理手段5は、拍毎に検出された低域周波数の信号の信号強度を、小節毎に平滑化処理する。
まず、平滑化処理手段5は、1小節中に検出された低域周波数の信号のピーク信号の信号強度のうち、時間的に最初のピーク信号の信号強度を最初の処理値として設定する。
【0015】
次に、平滑化処理手段5は、時系列的に次に検出されたピーク信号の信号強度が、最初に設定された処理値の所定の閾値の範囲内に含まれているか否かを判定する。所定の閾値の範囲としては、たとえば、次のピーク信号の信号強度が処理値に対して±10%の範囲内にあるか否かに基づいて判定する。
【0016】
次のピーク信号が所定の閾値の範囲内に含まれていると判定された場合、平滑化処理手段5は、次のピーク信号の信号強度を処理値に書き替える。
次のピーク信号が所定の閾値の範囲内に含まれていないと判定された場合、平滑化処理手段5は、処理値を当該ピーク信号の信号強度に書き替える。
以後、平滑化処理手段5は、同様の判定を行って、時系列順で検出されたピーク信号の平滑化処理を小節毎に実施する。
【0017】
差分量算出手段6は、時間的に前後する小節間のピーク信号の信号強度の差分量を算出する。
具値的には、図2に示すように、平滑化処理手段5により平滑化された波形グラフG1の時間的に前後する小節間の信号強度の差分量を算出して、小節毎の差分量を表すグラフG2を得る。
【0018】
ピーク信号抽出手段7は、単位区間毎のピーク信号の信号強度の差分量のうち、ピーク信号の信号強度の差分量が、最高値をとるピーク信号の信号強度の差分量に対して所定の閾値の範囲内となる差分量のピーク信号を抽出する。
具体的には、ピーク信号抽出手段7は、図2に示されるように、ピーク信号Pmax、P1、P2の信号強度の差分量を表すグラフG2が、所定の閾値TH1、TH2の範囲内にあるか否かによってピーク信号を抽出する。
ピーク信号抽出手段7により抽出されたピーク信号は、楽曲データの展開位置等の区切り点の候補とされる。
【0019】
本実施の形態では、ピーク信号抽出手段7は、2つの閾値TH1、TH2によってピーク信号を抽出している。
第1の閾値TH1は、ピーク信号の信号強度の差分量がピーク信号として認識される下限値として設定され、たとえば、検出可能な信号強度の限界値(100%)に対して、たとえば15%の信号強度が第1の閾値TH1とされる。したがって、信号強度が15%未満のピーク信号は、抽出の対象から除外される。
【0020】
第2の閾値TH2は、差分量算出手段6により算出されたピーク信号Pmaxの差分量の最大値と比較して、一定の大きさの信号強度を有するピーク信号の信号強度として設定され、たとえば差分量の最大値に対して、60%とされる。したがって、図2において、信号強度の差分量が第2の閾値TH2に至らないピーク信号P1は、抽出の対象から除外され、第2の閾値TH2を超えるピーク信号P2は抽出の対象となる。
【0021】
区切り点判定手段8は、ピーク信号抽出手段7により抽出されたピーク信号のうち、その後のピーク信号の信号強度の時間的変化が所定時間継続して所定の閾値の範囲内にあるときに、当該ピーク信号の時間的位置を楽曲データの区切り点と判定する。
具体的には、区切り点判定手段8は、図3に示すように、抽出されたピーク信号P2がその後、ピーク信号P2の信号強度PLに対して、閾値TH3の範囲内を、所定の継続時間、たとえば2小節以上維持する場合、ピーク信号P2を区切り点として判定する。閾値TH3は、たとえばピーク信号P2の信号強度PLに対して±30%に設定される。
【0022】
ピーク信号P2が上記の条件を満たす場合、区切り点判定手段8は、ピーク信号P2を楽曲データの区切り点と判定する。
一方、ピーク信号P2が上記の条件を満たさない場合、区切り点判定手段8は、ピーク信号P2を楽曲データの区切り点とは判定せず、時系列的に次のピーク信号の判定を行う。
区切り点判定手段8により判定された結果は、判定結果出力手段9を介してディスプレイ10、照明制御手段11に出力される。
【0023】
次に、前述した本実施の形態の作用について、図4に示すフローチャートに基づいて説明する。
楽曲構造解析装置1は、HDD等の記憶装置から楽曲データの読み出しを行う(手順S1)。LPF処理手段2は、読み出された楽曲データに対してLPF処理を行って、楽曲データの中域および高域の周波数成分を除去する(手順S2)。
【0024】
ピーク信号検出手段4は、FFT解析によって生成された周波数スペクトルに基づいて、時間的に前後する信号の信号強度よりも信号強度の大きな信号をピーク信号として検出する(手順S3)。
平滑化処理手段5は、検出されたピーク信号の時間的変化について平滑化処理を行って、小節毎のピーク信号の処理値を算出する(手順S4)。
差分量算出手段6は、算出された小節毎のピーク信号の平滑化した処理値について、時間的に前後する小節間のピーク信号の信号強度の差分量を算出する(手順S5)。
【0025】
ピーク信号抽出手段7は、ピーク信号の信号強度の差分量が閾値TH1よりも大きく、かつ閾値TH2よりも大きいかを判定する(手順S6)。
判定の結果、差分量が閾値TH1および閾値TH2のいずれかを満たさない場合、次のピーク信号について手順S6の判定を行う。
判定の結果、差分量が閾値TH1および閾値TH2の両方を満たす場合、当該差分量のピーク信号を区切り点の候補として抽出する(手順S7)。
以後、すべての差分量が算出されたピーク信号について、手順S6の判定を繰り返す(手順S8)。
【0026】
区切り点の候補となるピーク信号がすべて抽出されたら、区切り点判定手段8は、抽出されたピーク信号について、その後のピーク信号の信号強度が所定時間継続して閾値TH3の範囲内にあるか否かを判定する(手順S9)。
判定条件を満たさない場合、区切り点判定手段8は、次の抽出されたピーク信号について、手順S9の判定を行う。
【0027】
判定条件を満たす場合、区切り点判定手段8は、当該ピーク信号を楽曲データの区切り点と設定する(手順S10)。
区切り点判定手段8は、次の抽出されたピーク信号について、手順S9の判定を行い、抽出されたすべてのピーク信号についての手順S10の判定を繰り返す(手順S11)。
【0028】
このような本実施の形態によれば、以下のような効果がある。
本実施の形態では、区切り点判定手段8が所定の周波数以下の信号の信号強度を対象として、楽曲データの区切り点の判定を行っている。したがって、低域周波数の変化のみを対象として楽曲データの区切り点を判定できるため、中域、高域周波数のノイズが入りにくい状態で区切り点の判定を行って、区切り点を高精度に判定できる。
【0029】
本実施の形態では、区切り点判定手段8が区切り点の候補となるピーク信号のうち、ピーク信号の信号強度が閾値TH3の範囲内にあり、これを2小節間継続するピーク信号を楽曲データの区切り点として判定している。したがって、安定して大きな変化を有するピーク信号の時間的位置を区切り点として判定しているため、楽曲データの区切り点を誤りなく判定することができる。
本実施の形態では、区切り点判定手段8による判定の前に、平滑化処理手段5による平滑化処理を行っている。したがって、区切り点判定手段8による判定が、ノイズ等に妨害されることを防止して、確実に楽曲データの区切り点を判定できる。
【0030】
本実施の形態では、ピーク信号抽出手段7によるピーク信号の抽出が、信号強度が最高値のピーク信号に対して、60%以上の信号強度を有するピーク信号を区切り点の候補として抽出している。したがって、信号強度が十分に大きなピーク信号を区切り点の候補として抽出できるため、区切り点判定手段8による区切り点の判定を高精度に行うことができる。
【0031】
なお、本発明は、前述した実施の形態に限定されるものではなく、以下に示すような変形も含むものである。
前述の実施の形態では、区切り点判定手段8による区切り点の判定は、ピーク信号の信号強度が±30%の範囲内にあり、これを2小節以上継続することを条件として判定していたが、本発明は限らない。閾値の条件は、解析の対象となる楽曲データのジャンル、テンポ等によって適宜変更してもよい。
【0032】
前述の実施の形態では、ピーク信号抽出手段7による区切り点の候補となるピーク信号の抽出を、ピーク信号の信号強度の最高値に対して、60%以上の信号強度を閾値TH2としてピーク信号を抽出していたが、本発明はこれに限られない。たとえば、閾値TH2をもっと高く設定してもよく、低く設定してもよい。要するに、閾値の条件は、解析の対象となる楽曲データのジャンル、テンポ等によって適宜変更してもよい。
その他、本発明の実施の際の具体的な構造および形状等は、本発明の目的を達成できる範囲で他の構造等としてもよい。
【符号の説明】
【0033】
1…楽曲構造解析装置、2…LPF処理手段、4…ピーク信号検出手段、5…平滑化処理手段、6…差分量算出手段、7…ピーク信号抽出手段、8…区切り点判定手段、9…判定結果出力手段、10…ディスプレイ、11…照明制御手段、G1…グラフ、G2…グラフ、P1…ピーク信号、P2…ピーク信号、PL…信号強度、PL…信号強度、Pmax…ピーク信号、TH1…第1の閾値、TH2…第2の閾値、TH3…閾値。
図1
図2
図3
図4