(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-11
(45)【発行日】2022-11-21
(54)【発明の名称】楽曲解析装置、プログラムおよび楽曲解析方法
(51)【国際特許分類】
G10G 3/04 20060101AFI20221114BHJP
G10L 25/51 20130101ALI20221114BHJP
G10H 1/38 20060101ALI20221114BHJP
【FI】
G10G3/04
G10L25/51 300
G10H1/38 Z
(21)【出願番号】P 2021528066
(86)(22)【出願日】2019-06-17
(86)【国際出願番号】 JP2019023929
(87)【国際公開番号】W WO2020255214
(87)【国際公開日】2020-12-24
【審査請求日】2021-11-24
(73)【特許権者】
【識別番号】315017409
【氏名又は名称】AlphaTheta株式会社
(74)【代理人】
【識別番号】110000637
【氏名又は名称】特許業務法人樹之下知的財産事務所
(72)【発明者】
【氏名】鈴木 四郎
(72)【発明者】
【氏名】佐飛 利尚
【審査官】大野 弘
(56)【参考文献】
【文献】特開平05-273976(JP,A)
【文献】国際公開第2010/137074(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10G 3/04
G10L 25/51
G10H 1/38
(57)【特許請求の範囲】
【請求項1】
楽曲データを解析することによって複数のキー候補を決定するキー候補決定部と、
前記複数のキー候補から抽出される1のキーについて、前記複数のキー候補の残りのキーから前記1のキーを主調とした場合の近親調に該当するキーを検出する処理を前記複数のキー候補のそれぞれについて実行し、前記近親調に該当するキーの数に応じて算出される近親調スコアに従って前記複数のキー候補から前記楽曲のキーを選定するキー選定部と
を備える楽曲解析装置。
【請求項2】
前記近親調は、属調、下属調、同主調、および平行調の一部または全部を含む、請求項1に記載の楽曲解析装置。
【請求項3】
前記キー選定部は、前記近親調の種類ごとに重み付けられた点数を加算することによって前記近親調スコアを算出する、請求項2に記載の楽曲解析装置。
【請求項4】
前記キー候補決定部は、前記楽曲データの周波数解析によって生成される音響クロマベクトルに各キーの所定の度数の音について高くなる係数をかけ合わせることによって各キーの候補スコアを算出し、前記候補スコアに従って前記複数のキー候補を決定する、請求項1から請求項3のいずれか1項に記載の楽曲解析装置。
【請求項5】
前記キー選定部は、前記複数のキー候補の中に前記近親調スコアが等しい複数のキーがある場合に、前記候補スコアが相対的に高いキーを前記楽曲のキーとして選定する、請求項4に記載の楽曲解析装置。
【請求項6】
前記楽曲のキーを示す楽曲キー情報をユーザーに提示するか、または前記楽曲データに関連付けて記録するために出力する楽曲キー情報出力部をさらに備える、請求項1から請求項5のいずれか1項に記載の楽曲解析装置。
【請求項7】
請求項1から請求項6のいずれか1項に記載の楽曲解析装置としてコンピュータを動作させるように構成されたプログラム。
【請求項8】
楽曲データを解析することによって複数のキー候補を決定するステップと、
前記複数のキー候補から抽出される1のキーについて、前記複数のキー候補の残りのキーから前記1のキーを主調とした場合の近親調に該当するキーを検出する処理を前記複数のキー候補のそれぞれについて実行し、前記近親調に該当するキーの数に応じて算出される近親調スコアに従って前記複数のキー候補から前記楽曲のキーを選定するステップと
を含む楽曲解析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、楽曲解析装置、プログラムおよび楽曲解析方法に関する。
【背景技術】
【0002】
楽曲のキーを自動的に特定する技術が提案されている。例えば、特許文献1には、楽曲の音声データを取得する音声データ取得部と、キーと音階の組み合わせとの対応を示すキー情報を格納する記憶部と、所定区間の音声データを周波数解析してクロマベクトルを求め、クロマベクトルに含まれる音階の中から複数の音階を選択し、選択した複数の音階の組み合わせとキー情報とに基づいてキー候補を決定し、決定したキー候補の中から楽曲のキーを特定するキー推定部とを含む楽曲キー推定装置が記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記の特許文献1では、キー候補間の音階における距離や、各キー候補に含まれる音階の強度、各キー候補を示す音階の1つ前の音階の強度に基づいて、キー候補の中から楽曲のキーを特定している。しかしながら、この方法では、必ずしも楽曲のキーが高い精度で適切に推定されない場合がある。
【0005】
そこで、本発明は、楽曲のキーをより高い精度で適切に推定することが可能な楽曲解析装置、プログラムおよび楽曲解析方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明のある観点によれば、楽曲データを解析することによって複数のキー候補を決定するキー候補決定部と、複数のキー候補から抽出される1のキーについて、複数のキー候補の残りのキーから1のキーを主調とした場合の近親調に該当するキーを検出する処理を複数のキー候補のそれぞれについて実行し、近親調に該当するキーの数に応じて算出される近親調スコアに従って複数のキー候補から楽曲のキーを選定するキー選定部とを備える楽曲解析装置が提供される。
【0007】
本発明の別の観点によれば、上記の楽曲解析装置としてコンピュータを動作させるように構成されたプログラムが提供される。
【0008】
本発明のさらに別の観点によれば、楽曲データを解析することによって複数のキー候補を決定するステップと、複数のキー候補から抽出される1のキーについて、複数のキー候補の残りのキーから1のキーを主調とした場合の近親調に該当するキーを検出する処理を複数のキー候補のそれぞれについて実行し、近親調に該当するキーの数に応じて算出される近親調スコアに従って複数のキー候補から楽曲のキーを選定するステップとを含む楽曲解析方法が提供される。
【0009】
上記の構成によれば、近親調を用いた判定によって楽曲のキーをより高い精度で適切に推定することができる。
【図面の簡単な説明】
【0010】
【
図1】本発明の一実施形態に係る楽曲解析装置の概略的な機能構成を示すブロック図である。
【
図4】本発明の一実施形態に係る楽曲解析方法の処理の例を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0012】
図1は、本発明の一実施形態に係る楽曲解析装置の概略的な機能構成を示すブロック図である。図示された例において、楽曲解析装置100は、クロマベクトル生成部110、キー候補決定部120、キー選定部130、および楽曲キー情報出力部140を含む。楽曲解析装置100は、例えば通信インターフェース、プロセッサ、およびメモリを有するコンピュータによって実装され、クロマベクトル生成部110、キー候補決定部120、キー選定部130、および楽曲キー情報出力部140の機能はプロセッサがメモリに格納された、または通信インターフェースを介して受信されたプログラムに従って動作することによって実現される。以下、各部の機能についてさらに説明する。
【0013】
クロマベクトル生成部110は、楽曲データ111、具体的には例えばPCM(pulse code modulation)データについて周波数解析、具体的にはFFT(fast Fourier transform)112、ピッチ検出113、および1/12オクターブバンド化114の処理を実行し、さらにクロマベクトル生成115の処理、具体的には1/12オクターブバンド化114の結果を1オクターブの12音に集約し、さらに12音それぞれの成分を時間軸方向に積算する処理によってクロマベクトル116(音響クロマベクトル)を生成する。本実施形態において、クロマベクトル116は、12音のそれぞれが楽曲内に現れる頻度に対応する12の要素からなる。
【0014】
キー候補決定部120は、上記のように楽曲データを解析することによって生成されたクロマベクトル116に基づいてキー候補121を決定する。具体的には、キー候補決定部120は、クロマベクトル116を必要に応じて正規化した上で、
図2に例示するような全24キーのキーテーブル122を参照してキー候補121を決定する。例えば、キー候補決定部120は、キーテーブル122に示される各キーの所定の度数(図示された例ではI度、III度、およびV度)の音について高くなる係数をクロマベクトル116にかけ合わせることによって算出される各キーの候補スコアに従ってキー候補121を決定してもよい。
【0015】
一例として、クロマベクトルV=(vA,vB♭,vB,vC,vD♭,vD,vE♭,vE,vF,vG♭,vG,vA♭)である場合、各キーのスコアベクトルS=(sAmajor,sB♭major,sBmajor,sCmajor,sD♭major,sDmajor,sE♭major,sEmajor,sFmajor,sG♭major,sGmajor,sA♭major,sAminor,sB♭minor,sBminor,sCminor,sD♭minor,sDminor,sE♭minor,sEminor,sFminor,sG♭minor,sGminor,sA♭minor)は、以下のように係数行列MをクロマベクトルVにかけ合わせることによって算出される。
【0016】
【0017】
ここで、係数行列の係数kI,kII,kIII,…,kVIIは、各キーのI度からVII度までの音に対応して設定される。楽曲の中では、キーのI度の音が最も多く用いられ、次いでIII度およびV度の音が多く用いられ、II度、IV度、VI度、およびVII度の音は用いられるが頻度は少ない。従って、キー候補決定部120は、例えばkI=3、kIII=kV=2、kII=kIV=kVI=kVII=1、といったような割合で係数kI,kII,kIII,…,kVIIを設定して各キーの候補スコアを算出してもよい。他の例として、キー候補決定部120は、クロマベクトルVに係数をかけ合わせる代わりに、クロマベクトルVにおける要素の大きさを順位点に換算したもの(例えば、最大の要素に12、次に大きい要素に11、以下同様で、最も小さい要素に1を与えたもの)に係数をかけ合わせてもよい。
【0018】
キー候補決定部120は、例えば上記のように各キーの候補スコアを算出した上で、候補スコアが相対的に高いか、または候補スコアが所定の閾値を超えるキーをキー候補121に決定する。より具体的には、例えば、キー候補決定部120は、候補スコアが相対的に高い所定の数(例えば、スコアが高い方から5つ)のキーをキー候補121に決定してもよい。あるいは、キー候補決定部120は、候補スコアが閾値を超えたキーをすべてキー候補121に決定するか、または候補スコアが閾値を超え、かつ候補スコアが相対的に高い所定の数のキーをキー候補121に決定してもよい。なお、キー候補決定部120は複数のキー候補121を決定するように構成されるが、例えば候補スコアに大きな差がある場合は、キー候補決定部120が単一のキー候補121を決定することもありうる。
【0019】
キー選定部130は、キー候補決定部120が決定した複数のキー候補121に対して、以下で説明するような近親調判定を実行し、楽曲のキーを選定する。選定された楽曲のキーは、楽曲キー情報出力部140によって楽曲キー情報141として出力される。近親調判定は、例えば
図3に示すような近親調の関係に基づく判定である。図示された例では、主調のキー(C
major)に対して、主音(I度の音)が同じである同主調(C
minor)、主音が完全V度上の属調(G
major)、主音が完全V度下の下属調(F
major)、主調、属調、および下属調のそれぞれと主音が異なるが構成音が同じである平行調(A
minor、E
minor、およびD
minor)が近親調であり、共通音が多く主調との関係性が近いことが知られている。キー選定部130は、例えば上記の属調、下属調、同主調、および平行調の全部を近親調として扱ってもよいし、特に関係性の近い一部の調、具体的には例えば属調、下属調、および同主調を近親調として扱ってもよい。
【0020】
より具体的には、キー選定部130は、キー候補決定部120が決定した複数のキー候補から抽出される1のキーについて、複数のキー候補の残りのキーから当該1のキーを主調とした場合の近親調に該当するキーを検出する処理を複数のキー候補のそれぞれについて実行し、近親調に該当するキーの数に応じて算出される近親調スコアに従って複数のキー候補から楽曲のキーを選定する。例えば、キー候補決定部120が{C
major,C
minor,G
major,F
major,A
minor}の5つのキーをキー候補に決定した場合に、キー選定部130は、(i)C
majorを主調とした場合、(ii)C
minorを主調とした場合、(iii)G
majorを主調とした場合、(iv)F
majorを主調とした場合、および(v)A
minorを主調とした場合の5通りについて、キー候補の残りのキーから近親調に該当するキーを検出する。近親調に該当するキーの数をnとすると、(i)の場合にはn=4(
図3の例に示すように、他のキー候補がすべて近親調に該当する)、(ii)の場合にはn=1、(iii)および(iv)の場合にはn=2、(v)の場合にはn=3となる。
【0021】
上記の例において、キー選定部130は、例えば数nをそのまま近親調スコアとして用いて、nが最大になる(i)の場合の主調、すなわちCmajorを楽曲のキーとして選定してもよい。あるいは、キー選定部130は、特定の種類の近親調が含まれる場合に相対的に高くなるように近親調スコアを算出してもよい。例えば、キー選定部130は、候補キーの残りのキーから検出された近親調に該当するキーが同主調であった場合は3点、属調および下属調であった場合は2点、平行調については1点、といったように、近親調の種類ごとに重み付けされた点数を加算することによって近親調スコアを算出してもよい。
【0022】
なお、キー候補決定部120が単一のキー候補を決定した場合、キー選定部130の処理は実行されず、決定されたキー候補がそのまま楽曲のキーとして選定される。また、キー候補決定部120が決定しキー候補が2つの場合、どちらのキーを主調にした場合も近親調スコアは同じになる。このような場合、および決定されたキー候補が3つ以上であって複数のキーで近親調スコアが等しい場合において、キー選定部130は、例えばキー候補決定部120で算出された候補スコアが相対的に高いキーを楽曲のキーとして選定してもよい。
【0023】
楽曲キー情報出力部140は、例えば楽曲キー情報141をディスプレイへの表示などによってユーザーに提示するために出力する。あるいは、楽曲キー情報出力部140は、楽曲キー情報141を、例えば楽曲データ111のメタデータとして楽曲に関連付けて記録するために出力してもよい。楽曲に関連付けて記録された楽曲キー情報141を用いて、例えば楽曲データ111を用いた楽曲の再生時に楽曲のキーをユーザーに提示することができる。また、DJ機器を用いて楽曲同士をつなぎ合わせてミックスを作成する際に、楽曲に関連付けて記録された楽曲キー情報141に基づいてミックスの候補になる楽曲を自動的にユーザーに提示してもよい。
【0024】
本実施形態では、近親調判定によって楽曲のキーがより高い精度で適切に推定されるため、例えば上記の例のようにDJ機器を用いてミックスを作成する際に、ユーザーに正確な楽曲のキーが提示されたり、正確な楽曲のキーに基づいて自動的に候補になる楽曲が提示されたりすることによって、品質の高いミックスを作成することができる。その他の用途、具体的には例えばカラオケや楽曲製作などにおいても、正確な楽曲のキーが推定されることは有用である。
【0025】
図4は、本発明の一実施形態に係る楽曲解析方法の処理の例を示すフローチャートである。図示された処理は、例えば上記で説明した楽曲解析装置100において実行される。まず、クロマベクトル生成部110が、楽曲データの周波数解析によってクロマベクトル116を生成する(ステップS110)。次に、キー候補決定部120が、クロマベクトル116から算出される候補スコアに従って複数のキー候補を決定する(ステップS120)。さらに、キー選定部130が、複数のキー候補のそれぞれについて上述したような近親調スコアを算出し、近親調スコアに従って複数のキー候補から楽曲のキーを選定する(ステップS130)。続いて、楽曲キー情報出力部140が、楽曲キー情報141をユーザーに提示するか、または楽曲データ111に関連付けて記録するために出力する(ステップS140)。
【0026】
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範囲内において、各種の変形例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【符号の説明】
【0027】
100…楽曲解析装置、110…クロマベクトル生成部、111…楽曲データ、113…ピッチ検出、114…1/12オクターブバンド化、115…クロマベクトル生成、116…クロマベクトル、120…キー候補決定部、121…キー候補、122…キーテーブル、130…キー選定部、140…楽曲キー情報出力部、141…楽曲キー情報。