IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤマハ株式会社の特許一覧

<>
  • 特開-楽曲生成方法、およびプログラム 図1
  • 特開-楽曲生成方法、およびプログラム 図2
  • 特開-楽曲生成方法、およびプログラム 図3
  • 特開-楽曲生成方法、およびプログラム 図4
  • 特開-楽曲生成方法、およびプログラム 図5
  • 特開-楽曲生成方法、およびプログラム 図6
  • 特開-楽曲生成方法、およびプログラム 図7
  • 特開-楽曲生成方法、およびプログラム 図8
  • 特開-楽曲生成方法、およびプログラム 図9
  • 特開-楽曲生成方法、およびプログラム 図10
  • 特開-楽曲生成方法、およびプログラム 図11
  • 特開-楽曲生成方法、およびプログラム 図12
  • 特開-楽曲生成方法、およびプログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024055146
(43)【公開日】2024-04-18
(54)【発明の名称】楽曲生成方法、およびプログラム
(51)【国際特許分類】
   G10H 1/00 20060101AFI20240411BHJP
   G10G 3/04 20060101ALI20240411BHJP
【FI】
G10H1/00 102Z
G10G3/04
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022161836
(22)【出願日】2022-10-06
(71)【出願人】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】110000408
【氏名又は名称】弁理士法人高橋・林アンドパートナーズ
(72)【発明者】
【氏名】下薗 大樹
(72)【発明者】
【氏名】石浦 亮佑
(72)【発明者】
【氏名】上田 拓
(72)【発明者】
【氏名】沼野 俊亮
(72)【発明者】
【氏名】上原 美咲
【テーマコード(参考)】
5D182
5D478
【Fターム(参考)】
5D182AC03
5D182AC10
5D182AD05
5D478GG01
5D478GG03
(57)【要約】
【課題】コンテンツにマッチした楽曲を自動的に生成することができる楽曲生成方法が提供する。
【解決手段】一実施形態によれば、入力されたコンテンツから、当該コンテンツに含まれる特徴情報を抽出し、複数の属性のうち、前記抽出された特徴情報に対応する少なくとも1つの属性を決定し、前記決定された属性に対応する伴奏パターンおよびコード進行パターンを決定し、前記決定された伴奏パターンおよびコード進行パターンに基づく楽曲を生成することを含む、楽曲生成方法が提供される。
【選択図】図1
【特許請求の範囲】
【請求項1】
入力されたコンテンツから、当該コンテンツに含まれる特徴情報を抽出し、
複数の属性のうち、前記抽出された特徴情報に対応する少なくとも1つの属性を決定し、
前記決定された属性に対応する伴奏パターンおよびコード進行パターンを決定し、
前記決定された伴奏パターンおよびコード進行パターンに基づく楽曲を生成する、
ことを含む、楽曲生成方法。
【請求項2】
前記コンテンツは画像を含み、
前記特徴情報は、前記画像から抽出されるオブジェクトを含む、
請求項1に記載の楽曲生成方法。
【請求項3】
前記コンテンツは文章を含み、
前記特徴情報は、前記文章から抽出される形態素を含む、
請求項1に記載の楽曲生成方法。
【請求項4】
前記複数の属性は、第1属性グループと第2属性グループとを含む複数のグループのいずれかに区分され、
前記決定される属性は、前記第1属性グループに含まれる属性と前記第2属性グループに含まれる属性とを含む、
請求項1に記載の楽曲生成方法。
【請求項5】
前記決定される属性は、特徴情報と属性との関係を学習させた学習済モデルに対して、前記抽出された特徴情報を入力することによって当該学習済モデルから得られた情報に基づいて決定される、請求項1に記載の楽曲生成方法。
【請求項6】
前記伴奏パターンおよび前記コード進行パターンを決定することは、
前記決定された属性に対応する複数の前記伴奏パターンを特定し、
前記特定された複数の伴奏パターンから少なくとも1つをユーザに選択させるためのユーザインターフェースを提供し、
前記選択された伴奏パターンを前記決定された属性に対応する伴奏パターンとして決定すること、
を含む、
請求項1に記載の楽曲生成方法。
【請求項7】
前記決定された属性に対応する複数の前記伴奏パターンを特定することは、
前記所定のアルゴリズムにしたがって前記複数の伴奏パターンを特定することを含み、
前記所定のアルゴリズムによって第1属性に対して特定される前記複数の伴奏パターンが、第1組み合わせとなる場合と第2組み合わせとなる場合とを含む、
請求項6に記載の楽曲生成方法。
【請求項8】
前記伴奏パターンおよび前記コード進行パターンを決定することは、
前記決定された属性に対応する複数の前記コード進行パターンを特定し、
前記特定された複数のコード進行パターンから少なくとも1つをユーザに選択させるためのユーザインターフェースを提供し、
前記選択されたコード進行パターンを前記決定された属性に対応するコード進行パターンして決定すること、
を含む、
請求項1に記載の楽曲生成方法。
【請求項9】
前記決定された属性に対応する複数の前記コード進行パターンを特定することは、
前記所定のアルゴリズムにしたがって前記複数のコード進行パターンを特定することを含み、
前記所定のアルゴリズムによって第1属性に対して特定される前記複数のコード進行パターンが、第1組み合わせとなる場合と第2組み合わせとなる場合とを含む、
請求項8に記載の楽曲生成方法。
【請求項10】
前記楽曲の付加情報をユーザに設定させるためのユーザインターフェースを提供することをさらに含み、
前記楽曲は、さらに前記設定された付加情報に基づいて生成される、
請求項1に記載の楽曲生成方法。
【請求項11】
前記生成した楽曲と前記入力されたコンテンツとを同期して再生するためデータを出力することをさらに含む、請求項1に記載の楽曲生成方法。
【請求項12】
入力されたコンテンツから、当該コンテンツに含まれる特徴情報を抽出し、
複数の属性のうち、前記抽出された特徴情報に対応する少なくとも1つの属性を決定し、
前記決定された属性に対応する伴奏パターンおよびコード進行パターンを決定し、
前記決定された伴奏パターンおよびコード進行パターンに基づく楽曲を生成すること、
をコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、楽曲生成方法およびプログラムに関する。
【背景技術】
【0002】
近年、楽曲を自動的に生成する様々な方法が提案されている。例えば、SNSなどで画像などのコンテンツを再生する際に、画像とともに流すBGMの自動生成方法に対する需要が高まっている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2016-161774号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1では、利用者からの指示に応じて相異なる複数の楽曲の楽曲データを生成する方法が開示されている。しかしながら、特許文献1に開示された技術では、利用者のコンテンツに対する主観のみに基づいて楽曲データが生成されるため、コンテンツにマッチした楽曲が生成されないことがある。
【0005】
本発明の目的の一つは、コンテンツにマッチした楽曲を自動的に生成することができる楽曲生成方法を提供することにある。
【課題を解決するための手段】
【0006】
本発明の一実施形態によれば、入力されたコンテンツから、当該コンテンツに含まれる特徴情報を抽出し、複数の属性のうち、前記抽出された特徴情報に対応する少なくとも1つの属性を決定し、前記決定された属性に対応する伴奏パターンおよびコード進行パターンを決定し、前記決定された伴奏パターンおよびコード進行パターンに基づく楽曲を生成することを含む、楽曲生成方法が提供される。
【発明の効果】
【0007】
本発明によれば、コンテンツにマッチした楽曲を自動的に生成することができる楽曲生成方法を提供することができる。
【図面の簡単な説明】
【0008】
図1】一実施形態における楽曲生成システムを示す図である。
図2】一実施形態に係る通信端末の構成を示すブロック図である。
図3】一実施形態に係るサーバの記憶部の構成を示すブロック図である。
図4】一実施形態に係るサーバの制御部の機能構成を示すブロック図である。
図5】学習済モデルから出力される、第1属性グループを構成する第1属性の一覧を示す表の一例である。
図6】学習済モデルから出力される、第2属性グループを構成する第2属性の一覧を示す表の一例である。
図7】所定の楽曲に対応するジャンル情報、スタイル情報、及びスコア情報の一例を示す表である。
図8】所定の楽曲に対応するジャンル情報ごとのスコア情報合算値を示す表である。
図9】所定の楽曲に対応するイメージラベルの一例を示した表である。
図10】一実施形態におけるシチュエーションテーブルの一例を示す表である。
図11】一実施形態におけるユーザインターフェースの一例を示す概略図である。
図12】一実施形態におけるユーザインターフェースの一例を示す概略図である。
図13】一実施形態における楽曲生成処理を示すフローチャートである。
【発明を実施するための形態】
【0009】
以下、本発明の一実施形態について、図面を参照しながら詳細に説明する。以下に示す実施形態は一例であって、本発明はこれらの実施形態に限定して解釈されるものではない。本実施形態で参照する図面において、同一部分または同様な機能を有する部分には同一の符号または類似の符号(数字の後にA、Bなど付しただけの符号)を付し、その繰り返しの説明は省略する場合がある。
【0010】
[楽曲生成システム]
図1は、一実施形態における楽曲生成システムを示す図である。楽曲生成システム1000は、インターネットなどのネットワークNWに接続された一つ以上の通信端末1およびサーバ2を含む。通信端末1は、スマートフォン、タブレットパソコン、ラップトップパソコンおよびデスクトップパソコンなどであり、ネットワークNWに接続して、他の装置とデータ通信を行う。
【0011】
サーバ2は、ネットワークNWを介して通信端末1からコンテンツを受信し、そのコンテンツの内容に応じた楽曲を生成して通信端末1に提供する。通信端末1は、コンテンツとともに再生する楽曲を生成するための情報を指定する。また、通信端末1は、コンテンツとともに、サーバ2で生成された楽曲を再生することができる。サーバ2は、機械学習によって得られた学習済モデルを用いて、コンテンツを解析し、解析結果に基づいて、楽曲を生成する。以下、通信端末1およびサーバ2について説明する。
【0012】
[通信端末]
図2は、通信端末1の構成を示すブロック図である。通信端末1は、制御部11、記憶部12、通信部13、表示部14、操作部15、及びスピーカ16を含む。これらの各構成はバス17を介して接続されている。
【0013】
制御部11は、CPU(プロセッサ)などの演算処理回路を含む。制御部11は、記憶部12に記憶されたプログラムをCPUにより実行して、楽曲指定処理、楽曲再生処理などを行うための機能を実現する。これらの機能を実現する構成の一部または全部は、プログラムの実行によってソフトウエアによって実現される場合に限られず、ハードウエアによって実現されてもよい。尚、制御部11によって実現される機能は、上述した処理を行う機能以外にも、通信端末1の各部を制御する機能を含む。
【0014】
記憶部12は、不揮発性メモリ、ハードディスク等の記憶装置である。記憶部12は、上述したプログラムなど、様々な機能を実現するためのアプリケーションプログラムを記憶する記憶領域、楽曲指定処理、楽曲再生処理などの通信端末1で実行される各処理に用いられる情報を記憶する記憶領域を含む。プログラムは、コンピュータにより実行可能であればよく、磁気記録媒体、光記録媒体、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供されてもよい。この場合には、通信端末1は、記録媒体を読み取る装置を備えていてもよい。また、プログラムは、ネットワーク経由でダウンロードされてもよい。
【0015】
また、記憶部12は、コンテンツを記憶する記憶領域を含む。コンテンツは、画像および文章(文字列)のうちの少なくとも1つを含む。画像は、動画であってもよく、静止画であってもよい。画像は、通信端末1のカメラ(図示せず)を使用して取得した画像であってもよく、通信部13を介して外部からダウンロードした画像であってもよい。文章(文字列)は、通信端末1の操作部15を介して入力された文章(文字列)であってもよく、通信部13を介して外部からダウンロードした文章(文字列)であってもよい。
【0016】
通信部13は、制御部11の制御に基づいて、図1に示したネットワークNWに接続して外部のサーバ2と情報の送受信を行う。
【0017】
表示部14は、液晶ディスプレイ、有機ELディスプレイ等の表示装置であり、制御部11の制御に基づいた画像(動画又は静止画)を表示する。操作部15は、表示部14に表示されたタッチパネル、操作ボタンなどによりユーザが入力した操作に応じた信号を制御部11に出力する。操作ボタンは、例えば、電源スイッチ、カーソルキーなどを含み、ユーザの指示を受け付ける操作子であればよい。スピーカ16は、図1に示したネットワークNWを介してサーバ2から取得した楽曲データを再生する。
【0018】
通信端末1は、通信部13からネットワークNWを介してコンテンツをサーバ2に送信する。サーバ2に送信されるコンテンツは、ユーザがBGM(Back-ground Music)の付与を所望するコンテンツである。BGMは、ユーザがコンテンツとともに再生することを所望する楽曲に対応する。
【0019】
[サーバ]
図1を参照して、サーバ2の構成について説明する。サーバ2は、制御部21、記憶部23、および通信部25を含む。
【0020】
制御部21は、CPU(プロセッサ)などの演算処理回路を含む。制御部21は、記憶部23に記憶されたプログラムをCPUにより実行して、楽曲生成処理を行うための機能を実現する。この機能を実現する構成の一部または全部は、プログラムの実行によってソフトウエアによって実現される場合に限られず、ハードウエアによって実現されてもよい。
【0021】
記憶部23は、不揮発性メモリなどの記憶装置を含む。図3は、記憶部23の構成を示すブロック図である。記憶部23は、プログラム231、学習済モデル233、楽曲データベース235およびシチュエーションテーブル237を記憶する。
【0022】
プログラム231は、楽曲生成処理などのサーバ2で実行される各処理に用いられるプログラムを含む。プログラム231は、コンピュータにより実行可能であればよく、磁気記録媒体、光記録媒体、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶された状態でサーバ2に提供されてもよい。この場合、サーバ2は、記録媒体を読み取る装置を備えていればよい。プログラム231は、通信部25を介してダウンロードされてもよい。
【0023】
学習済モデル233は、機械学習によって生成され、サーバ2に提供される。学習済モデル233は、ニューラルネットワークを用いた演算処理によって、通信端末1から提供されたコンテンツの属性を決定する。具体的には、学習済モデル233は、外部のサーバ等のコンピュータにおいて、事前に訓練データを用いて訓練し、コンテンツの特徴情報と属性との相関関係を機械学習させることによって生成されるニューラルネットワークを有するモデル(訓練済モデル)である。本実施形態において、学習済モデル233は、N次元変換Word2vecを利用したモデルである。学習済モデル233は、図1に示すネットワークNWを介して接続された別の外部装置に記憶されてもよい。この場合、サーバ2は、ネットワークNWを介して学習済モデル233に接続してもよい。コンテンツの特徴情報および属性については、後述する。
【0024】
楽曲データベース235には、複数の楽曲に関する楽曲情報が登録されている。楽曲情報は、複数の楽曲に対応する、互いに関連付けられたジャンル情報、スタイル情報、スコア情報、イメージラベルおよびコード進行データを含む。楽曲データベース235の詳細は後述する。
【0025】
シチュエーションテーブル237は、コンテンツの属性と楽曲のジャンルとが関連付けられたテーブルである。シチュエーションテーブル237の詳細は後述する。
【0026】
図1に戻ると、サーバ2の通信部25は、通信モジュールを含み、ネットワークNWに接続して、通信端末1などの外部装置と各種データの送受信を行う。
【0027】
[楽曲生成処理]
次に、サーバ2の制御部21で実行される楽曲生成処理について説明する。楽曲生成処理は、例えば、通信端末1からのリクエストに応じて開始される。
【0028】
図4は、サーバ2の制御部21の機能構成を示すブロック図である。制御部21は、特徴情報抽出部211、属性決定部213、楽曲決定部215、楽曲提供部217、楽曲生成部219を含む。
【0029】
特徴情報抽出部211は、通信部25を介して、通信端末1からコンテンツを取得する。特徴情報抽出部211は、取得したコンテンツから、該コンテンツの特徴情報を抽出する。コンテンツが動画である場合、特徴情報抽出部211は、動画を所定の数の静止画に変換し、得られた静止画から特徴情報を抽出する。
【0030】
特徴情報とは、コンテンツに含まれるコンテンツの特徴を意味する。コンテンツが文章の場合、コンテンツの特徴は、文章中に含まれる1つ以上の単語である。単語は、名詞、形容詞、動詞などを含む。特徴情報抽出部211は、コンテンツが文章の場合、形態素解析によって文章を解析して特徴情報を抽出する。例えば、コンテンツが「海辺の明るいバルコニー」という文章である場合、該コンテンツからは、「海辺」、「バルコニー」、及び「明るい」という形態素が特徴情報として抽出されてもよい。コンテンツが画像の場合、コンテンツの特徴は、画像に含まれるオブジェクトである。コンテンツが画像の場合、特徴情報抽出部211は、公知の画像解析技術(例えば、OpenCVなどを用いた技術)を用いて画像処理および画像解析を行って特徴情報を抽出する。例えば、画像が、晴れの日のビーチを映した画像である場合、例えば、「海」、「空」、「砂浜」などが該画像に含まれるオブジェクトとして抽出されてもよい。特徴情報抽出部211は、コンテンツの特徴情報を属性決定部213に提供する。
【0031】
属性決定部213は、特徴情報抽出部211からコンテンツの特徴情報を取得し、学習済モデル233を用いて取得した特徴情報の属性を決定する。属性は、第1属性グループおよび第2属性グループを含む。第1属性グループは、印象で分類された属性(第1属性)から構成され、第2属性グループは、シチュエーションで分類された属性(第2属性)から構成される。
【0032】
図5は、学習済モデル233から出力される、第1属性グループを構成する第1属性の一覧を示す表(以下、印象リストと呼ぶ)の一例である。図6は、学習済モデル233から出力される、第2属性グループを構成する第2属性の一覧を示す表(以下、シチュエーションリストと呼ぶ)の一例である。図5に示す印象リストは、29個の属性(第1属性)を含む。第1属性は、例えば、「しっとりとした」、「上品な」、「荘厳な」、「穏やかな」などの印象で分類された属性を含む。尚、印象リストに含まれる属性の数は、29個に限定されるわけではない。また、印象リストに含まれる属性は、図5に示した属性に限定されるわけではない。図6に示すシチュエーションリストは、24個の属性(第2属性)を含む。第2属性は、例えば、「スポーツ観戦」、「晴天」、「駅」、「南国」、「映画館」などのシチュエーションで分類された属性を含む。尚、シチュエーションリストに含まれる属性の数は、24個に限定されるわけではない。また、シチュエーションリストに含まれる属性は、図6に示した属性に限定されるわけではない。
【0033】
属性決定部213は、特徴情報を学習済モデル233の入力層に入力する。特徴情報が入力された学習済モデル233は、中間層において演算した結果として、図5に示した印象リストから選択された1つの属性(第1属性)と、図6に示したシチュエーションリストから選択された1つの属性(第2属性)とを出力層に出力する。属性決定部213は、学習済モデル233から出力された第1属性および第2属性を取得し、これらをコンテンツの属性として決定する。属性決定部213は、コンテンツの属性を楽曲決定部215に提供する。
【0034】
楽曲決定部215は、取得した属性に対応する楽曲の候補を決定する。楽曲決定部215は、取得した属性に基づいて、楽曲データベース235およびシチュエーションテーブル237を参照して楽曲の候補を決定する。
【0035】
以下、楽曲データベース235について説明する。楽曲データベース235には、予め準備された複数の楽曲に関する楽曲情報が登録されている。楽曲情報は、互いに関連付けられたジャンル情報、スタイル情報、スコア情報、イメージラベルおよびコード進行データを含む。楽曲情報は、複数の楽曲それぞれに関連付けられて登録されている。例えば、楽曲データベース235に登録された楽曲が500個である場合、500曲それぞれに対応する楽曲情報が、対応する楽曲に関連付けられて登録されている。尚、楽曲データベース235に登録された楽曲の数は、500個に限定されるわけではない。以下、楽曲情報について説明する。
【0036】
コード進行データは、楽曲を構成する複数のコードを時系列に並べて記述されたコード進行パターンを示すデータである。コード進行データは、例えば、「CM7-Dm7-Em7-・・・」として記述されている。時系列に並べるときには、各コードは、所定の単位期間(例えば、1小節、1拍など)を単位として並べられてもよいし、単位期間を考慮せずに順番に並べられてもよい。例えば、上述の例で各コードが1小節を単位として並べられる場合を想定すると、上記の例における最初のコードが2小節続くときには、楽曲コードデータは「CM7-CM7-Dm7・・・」として記述される。一方、小節数を考慮しない場合を想定すると、楽曲コードデータは上記の例のように「CM7-Dm7-・・・」として記述される。コード進行データは、各楽曲のサビ部分を含む一部の期間に対応するデータであってもよい。しかしながら、これに限定されず、コード進行データは、各楽曲の曲全体に対応するデータであってもよい。
【0037】
ジャンル情報は楽曲のジャンルを示す情報であり、例えば、「ポップ」、「ロック」、「ラテン」・・・という楽曲のジャンルを示す情報である。スタイル情報は、当該ジャンルにおけるより細かな分類、即ちスタイル(伴奏パターン)を示す情報である。例えば、ある楽曲のジャンル情報がポップミュージックを示す「ポップ」である場合、当該楽曲のスタイル情報は、例えば、「80年代ポップ」、「イージーポップ」、「バラード」などを含む。また、ある楽曲のジャンル情報がラテンミュージックを示す「ラテン」である場合、当該楽曲のスタイル情報は、例えば、「レゲエ」、「ボサノヴァ」、「タンゴ」、「サンバ」などを含む。スコア情報は、当該楽曲が所定のジャンル及びスタイルであることを示す確率を示す情報である。ジャンル情報およびスタイル情報の種類は、予め決められている。尚、楽曲ごとのジャンル情報、スタイル情報、およびスコア情報は、公知の楽曲解析技術を用いて楽曲を解析することにより得ることができる。
【0038】
図7は、所定の楽曲(以下、A曲と称する)を解析することにより得られたジャンル情報、スタイル情報、及びスコア情報の一例を示す表である。図7を参照すると、A曲のジャンル情報およびスタイル情報は、スコア順に1位~10位まで示されている。例えば、ジャンル情報が「Pop」、スタイル情報が「Easy Pop」に対応するスコア情報は「0.218」である。これは、A曲を解析した結果、A曲のジャンルが「ポップ」であり、スタイルが「イージーポップ」である確率が0.218であることを意味している。また、ジャンル情報が「Pop」、スタイル情報が「80’ Pop」に対応するスコア情報は、「0.195」である。これは、A曲を解析した結果、A曲のジャンルが「ポップ」であり、スタイルが「80年代ポップ」である確率が0.195であることを意味している。また、ジャンル情報が「Rock」、スタイル情報が「80’ Pop Rock」に対応するスコア情報は「0.102」である。これは、A曲を解析した結果、A曲のジャンルが「ロック」であり、スタイルが「80年代ポップロック」である確率が0.102であることを意味している。
【0039】
図7に示すとおり、A曲のスコア情報の最大値が0.218である場合、スコア順位は1位である。これは、A曲のジャンルが「ポップ」であり、且つスタイルが「イージーポップ」である確率が1番高いことを示している。スコア順位が2位であるスコア情報0.195に対応するジャンルは「ポップ」であり、且つスタイルは「80年代ポップ」である。これは、A曲のジャンルが「ポップ」であり、且つスタイルが「80年代ポップ」である確率が2番目に高いことを示している。図7では、A曲のジャンル情報およびスタイル情報が、スコア順に1位~10位まで登録されている例を示している。しかしながら、楽曲ごとに登録されるジャンル情報、スタイル情報およびスコア情報の数は10個に限定されるわけではない。例えば、楽曲ごとに、予め決められた全ての種類のジャンル情報およびスタイル情報についてスコア情報が算出されて登録されてもよい。
【0040】
また、楽曲データベース235には、楽曲ごとに、ジャンル情報ごとのスコア情報の合算値が登録されている。図8は、図7に示したA曲のジャンル情報ごとのスコア情報合算値を示す表である。図8において、スコア情報合算値は、スコア順位が1位から所定の順位までのスコア情報を、予め決められたジャンルごとに合算した値である。図8では、一例として、スコア順位が1位~10位までのスコア情報をジャンルごとに合算した場合のスコア情報合算値を示している。
【0041】
図8を参照すると、ジャンルが「ポップ(Pop)」である場合、スコア情報合算値は、0.413である。これは、図7における、「Pop(ポップ)」ジャンルに対応する「Easy Pop(イージーポップ)」スタイル及び「80’ Pop(80年代ポップ)」スタイルの各スコア情報の合算値である(即ち、0.218+0.195=0.413)。上述したように、このようなスコア情報合算値は、予め決められているジャンルごとに算出される。例えば、A曲の場合、図8に示すように、「Rock(ロック)」ジャンルに対応するスコア情報合算値は、0.102であってもよく、「Latin(ラテン)」ジャンルに対応するスコア情報合算値は0であってもよい。スコア情報合算値が0である場合、A曲について、図7に示したスコア順位1位~10位に「Latin(ラテンミュージック)」ジャンルが入っていないことを示している。換言すると、A曲が「Latin(ラテンミュージック)」ジャンルに該当する可能性が低いことを意味している。一方、スコア情報合算値が最大であるジャンルは、A曲が当該ジャンルに該当する可能性が最も高いことを示している。以上が、ジャンル情報、スタイル情報、およびスコア情報に関する説明である。
【0042】
以下、楽曲情報に含まれるイメージラベルについて説明する。イメージラベルは、楽曲の印象を数値化したものを意味する。各曲のイメージラベルは、予め2名以上の有識者達によって決定されて、対応する楽曲に関連付けられて登録される。
【0043】
図9は、A曲に対応するイメージラベルの一例を示した表である。図9において、ラベル付与数は、有識者達がA曲を聴いた際に、図5に示した印象リストに含まれる29個の属性ごとにA曲を評価して付与した数値である。有識者達は、属性ごとに楽曲を多段階評価してもよい。例えば、有識者達が所定の属性についてA曲を評価した場合、当該属性の印象が特に強い場合に付与する数値を「2」とし、当該属性の印象が特に弱い場合に付与する数値を「0」とし、中間の場合(当該属性の印象が特に強くはないが、特に弱くもない場合)に付与する数値を「1」としてもよい。これらの数値は、2名以上の有識者達がそれぞれの属性ごとに決定したラベル付与数の平均値であってもよく、この平均値は、四捨五入されてもよい。
【0044】
図9を参照すると、「しっとりとした」という属性に対応するラベル付与数は「1」である。これは、有識者達がA曲を聴いた際に、A曲に「しっとりとした」印象を強くは感じなかったが、特に弱い印象も感じなかったことを示している。また、図9を参照すると、「上品な」という属性に対応するラベル付与数は「2」である。これは、有識者達がA曲を聴いた際に、A曲に「上品な」印象を強く感じたことを示している。また、図9を参照すると、「荘厳な」という属性に対応するラベル付与数は、「0」である。これは、有識者達がA曲を聴いた際に、A曲に「荘厳な」印象を特に弱く感じたことを示している。換言すると、有識者達がA曲から「荘厳な」印象を得られなかったことを示している。以上がイメージラベルの説明である。
【0045】
図4に戻り、説明を続ける。上述したように、楽曲決定部215は、楽曲データベース235及びシチュエーションテーブル237を参照して、取得したコンテンツの属性に対応する楽曲の候補を決定する。楽曲決定部215は、コンテンツから抽出された特徴情報の属性を属性決定部213から取得する。上述したように、属性には、第1属性および第2属性が含まれる。
【0046】
楽曲決定部215は、楽曲データベース235に登録された複数の楽曲それぞれについて、取得した属性に対応するスコアを決定する。スコアは、以下の手順で算出される。
【0047】
まず、楽曲決定部215は、シチュエーションテーブル237を参照して、取得した属性に含まれる第2属性に対応する楽曲のジャンルを決定する。図10は、シチュエーションテーブル237の一例を示す表である。シチュエーションテーブル237に登録されたシチュエーションは、図6に示したシチュエーションリストに示した24個の属性に対応している。シチュエーションテーブル237では、各シチュエーションと予め決められた楽曲のジャンルとが対応付けられている。
【0048】
図10を参照すると、例えば、シチュエーションが「リビング」である場合、対応付けられた楽曲のジャンルは、「Pop(ポップ)」である。また、シチュエーションが「南国」である場合、対応付けられた楽曲のジャンルは「Latin(ラテン)」である。以下では、取得した属性に含まれる第2属性が「リビング」であり、第1属性が「上品な」である場合を一例として説明する。楽曲決定部215は、シチュエーションテーブル237を参照して、「リビング」というシチュエーションに対応する楽曲のジャンルが「Pop(ポップ)」であると決定する。
【0049】
次に、楽曲決定部215は、楽曲データベース235を参照して、決定した楽曲のジャンルに対応するスコア情報合算値を取得する。楽曲決定部215は、決定された楽曲のジャンルが「Pop(ポップ)」である場合、楽曲データベース235に登録された各楽曲について、「Pop(ポップ)」ジャンルに対応するスコア情報合算値を取得する。例えば、楽曲データベース235に登録されたA曲の場合、「Pop(ポップ)」ジャンルに対応するスコア情報合算値は、「0.413」である(図8参照)。楽曲決定部215は、楽曲データベース235に登録された各楽曲についてスコア情報合算値を取得する。
【0050】
次に、楽曲決定部215は、楽曲データベース235を参照して、取得した第1属性に対応するラベル付与数を取得する。取得した第1属性が「上品な」である場合、楽曲決定部215は、各楽曲に関連付けられているイメージラベルを参照して、各楽曲の当該第1属性に対応するラベル付与数を取得する。例えば、A曲の場合、「上品な」に対応するラベル付与数は「2」である(図9参照)。楽曲決定部215は、楽曲データベース235に登録された各楽曲についてラベル付与数を取得する。
【0051】
次に、楽曲決定部215は、取得したスコア情報合算値と取得したラベル付与数とを乗算することによって、楽曲データベース235に登録された複数の楽曲それぞれについて、取得した属性に対応するスコアを算出する。例えば、取得した属性に含まれる第2属性が「リビング」であり、第1属性が「上品な」である場合、A曲のスコアは、0.413×2(「スコア情報合算値」×「ラベル付与数」)=0.826である。楽曲決定部215は、楽曲データベース235に登録された全ての楽曲について、取得した属性に対応するスコアを算出する。楽曲データベース235に登録された楽曲が500個の場合、500曲全てについて、取得した属性に対応するスコアが算出される。
【0052】
楽曲決定部215は、算出されたスコアの数値に基づいて、楽曲データベース235に登録された複数の楽曲から、コンテンツの属性に対応する楽曲の候補を選択する。具体的には、楽曲決定部215は、算出されたスコアの数値が大きな順に1番目~n番目までの楽曲をコンテンツの属性に対応する楽曲の候補として決定してもよい。ここで、nは1以上500以下の任意の整数であり、例えば20であってもよい。楽曲決定部215は、コンテンツの属性に対応する楽曲の候補として決定した楽曲それぞれに対応する楽曲情報を楽曲提供部217に提供する。楽曲提供部217に提供される楽曲情報は、コード進行データおよびスタイル情報の少なくとも1つを含む。
【0053】
具体的には、楽曲決定部215は、楽曲データベース235及びシチュエーションテーブル237を参照して、各楽曲に対応するスタイル情報を取得する。上述したように、楽曲決定部215は、シチュエーションテーブル237を参照して、コンテンツの属性に含まれる第2属性に対応するジャンルを得る。楽曲決定部215は、楽曲データベース235を参照して、得られたジャンルに対応するスタイル情報のうち、スコア情報の値が最も大きなスタイル情報を楽曲提供部217に提供するスタイル情報として決定する。楽曲決定部215は、コンテンツの属性に対応する楽曲の候補として決定された各楽曲について、楽曲提供部217に提供するスタイル情報を決定する。例えば、コンテンツの属性に対応する楽曲の候補にA曲が含まれている場合を説明する。図10を参照して説明したように、コンテンツの属性に含まれる第2属性に対応するジャンルが「Pop(ポップ)」である場合、楽曲決定部215は、楽曲データベース235におけるA曲の「Pop(ポップ)」ジャンルに対応するスタイル情報を参照し、スコア情報の値が最も大きなスタイル情報をA曲のスタイル情報として決定する。
【0054】
例えば、図7を参照すると、A曲の「Pop(ポップ)」ジャンルに対応するスタイルは、「Easy Pop(イージーポップ)」及び「80’ Pop(80年代ポップ)」を含む。この中から、最も大きなスコア情報の値を有する「Easy Pop(イージーポップ)」がA曲に対応するスタイル情報として決定される。
【0055】
また、例えば、コンテンツの属性に含まれる第2属性に対応する楽曲のジャンルが「Rock(ロック)」の場合、A曲の「Rock(ロック)」ジャンルに対応するスタイルのうち、スコア情報の値が最も大きなスタイルがA曲のスタイル情報として決定される。例えば、A曲の「Rock(ロック)」ジャンルに対応する「80’ Pop Rock(80年代ポップロック)」スタイルに対応するスコア情報の値が最も大きい場合、「80’ Pop Rock(80年代ポップロック)」がA曲に対応するスタイル情報として決定される。
【0056】
楽曲提供部217は、楽曲決定部215から取得した、コンテンツの属性に対応する楽曲の候補として決定されたn個の楽曲それぞれに対応する楽曲情報を通信端末1に提供する。楽曲提供部217は、図1に示すネットワークNWを介して通信端末1に提供する。通信端末1は、コンテンツをサーバ2に提供した通信端末1であってもよい。上述したように、通信端末1に提供される楽曲情報は、コード進行データおよびスタイル情報の少なくとも1つを含む。
【0057】
通信端末1の制御部11は、取得したn個の楽曲の楽曲情報に基づいて、ユーザがコンテンツのBGMを決定するためのユーザインターフェースを表示部14に提供して、楽曲指定処理を実行する。楽曲指定処理は、n個の楽曲それぞれに対応する楽曲情報の中から、ユーザがコンテンツのBGMとして所望する楽曲のスタイルおよびコード進行パターンの少なくとも1つを選択する処理である。
【0058】
制御部11は、コンテンツのBGMのスタイルをユーザが選択するためのユーザインターフェースを表示部14に提供してもよい。図11は、制御部11によって表示部14に提供される、コンテンツのBGMのスタイルをユーザが選択するためのユーザインターフェースの一例である。
【0059】
図11に示すように、通信端末1の表示部14には、n個の楽曲それぞれに対応するスタイル情報を示す複数のアイコン1101が表示されてもよい。ユーザは、所望のスタイル情報を示すアイコン1101をタップしてコンテンツのBGMのスタイルを選択することができる。また、n個の楽曲の楽曲情報とともに、スタイル情報に対応するスタイルを再生するためのオーディオデータがサーバ2から提供されてもよい。この場合、各スタイル情報に対応するスタイルを再生するための再生ボタン1103が、スタイル情報を示すアイコン1101とともに表示されてもよい。ユーザは、所望のスタイル情報に対応する再生ボタン1103をタップすることによって、所望のスタイル情報に対応するスタイルを聴いて確認することができる。ユーザは、スタイルを試聴して、コンテンツのBGMに所望するスタイルを選択してもよい。
【0060】
また、制御部11は、コンテンツのBGMのコード進行パターンをユーザが選択するためのユーザインターフェースを表示部14に提供してもよい。図12は、制御部11によって表示部14に提供される、コンテンツのBGMのコード進行パターンをユーザが選択するためのユーザインターフェースの一例である。
【0061】
図12では、ユーザインターフェースに4つのコード進行パターン(パターンA、パターンB、パターンC、パターンD)を示すアイコン1201が表示されている例を示している。コード進行パターンを示すアイコン1201は、コード進行パターンの印象を示す情報とともに表示されてもよい。ユーザは、コード進行パターンの印象を示す情報に基づいて、コード進行パターンに対応する楽曲の印象を想定することができる。コード進行パターンの印象を示す情報は、コード進行パターンごとに異なってもよい。ユーザは、コード進行パターンを示すアイコン1201をタップしてコンテンツのBGMに所望するコード進行パターンを選択することができる。また、n個の楽曲の楽曲情報とともに、コード進行パターンを再生するためのオーディオデータがサーバ2から提供されてもよい。この場合、各コード進行パターンを再生するための再生ボタン1203が、コード進行パターンを示すアイコン1201とともに表示されてもよい。ユーザは、所望のコード進行パターンに対応する再生ボタン1203をタップすることによって、所望のコード進行パターンを聴いて確認することができる。ユーザは、コード進行パターンを試聴して、コンテンツのBGMに所望するコード進行パターンを選択してもよい。
【0062】
制御部11は、コンテンツのBGMのスタイルをユーザが選択するためのユーザインターフェース、およびコンテンツのBGMのコード進行パターンをユーザが選択するためのユーザインターフェースの少なくとも1つを、ユーザがコンテンツのBGMを決定するためのユーザインターフェースとして提供する。
【0063】
制御部11は、コンテンツのBGMのスタイルをユーザが選択するためのユーザインターフェース、およびコンテンツのBGMのコード進行パターンをユーザが選択するためのユーザインターフェースの両方を提供してもよい。n個の楽曲のうち、複数の楽曲でスタイル情報又はコード進行パターンが重複している場合がある。ユーザが選択したスタイル又はコード進行パターンが複数の楽曲で重複している場合、制御部11によって、ユーザがコンテンツのBGMのスタイルおよびコード進行パターンの両方を選択することによって、最終的に生成される楽曲をユーザの所望の楽曲により近づけることができる。
【0064】
制御部11は、ユーザによって選択されたスタイル情報およびコード進行パターンの少なくとも1つを、通信部13から図1に示すネットワークNWを介してサーバ2に提供する。
【0065】
図4に戻り、サーバ2による楽曲生成処理について説明を続ける。ユーザによって選択されたスタイル情報およびコード進行パターンの少なくとも1つは、サーバ2の制御部21の楽曲生成部219に提供される。楽曲生成部219は、取得したスタイル情報およびコード進行パターンの少なくとも1つに基づいて、公知の楽曲生成技術を用いてコンテンツに付与される楽曲に対応する楽曲データを生成する。さらに、楽曲生成部219は、生成した楽曲データを用いて、楽曲と該楽曲に対応するコンテンツとを同期して再生するためコンテンツ再生データを生成する。
【0066】
サーバ2は、楽曲生成部219によって生成されたコンテンツ再生データを、通信部25からネットワークNWを介して通信端末1に提供する。コンテンツ再生データは、通信端末1からのリクエストに応じて提供されてもよい。
【0067】
[楽曲生成処理フロー]
図13は、一実施形態における楽曲生成処理を示すフローチャートである。楽曲生成処理は、以上に説明したように、サーバ2の制御部21によって実行される。
【0068】
制御部21は、通信端末1からコンテンツを受信するまで待機する(S1301;NO)。ユーザが通信端末1を操作して、コンテンツの送信を指示すると、通信端末1は、コンテンツをサーバ2に送信する。サーバ2がコンテンツを受信すると(S1301;YES)、制御部21は、受信したコンテンツの特徴情報を抽出する(S1303)。制御部21は、公知の画像解析技術、形態素解析を利用してコンテンツから特徴情報を抽出する。
【0069】
制御部21は、抽出した特徴情報を学習済モデル233に提供する(S1305)。制御部21は、学習済モデル233による演算処理を実行して、学習済モデル233からコンテンツの属性を取得する(S1307)。コンテンツの属性は、図5に示した印象リストから選択された1つの属性(第1属性)と、図6に示したシチュエーションリストから選択された1つの属性(第2属性)とを含む。
【0070】
制御部21は、取得したコンテンツの属性に基づいて、コンテンツに対応する楽曲の候補を決定する(S1309)。制御部21は、楽曲データベース235およびシチュエーションテーブル237を参照し、楽曲の候補を決定する。制御部21は、決定した楽曲の候補に対応する楽曲情報を通信端末1に提供する(S1311)。ここで、楽曲情報は、楽曲の候補として決定され各楽曲に関連付けられた、スタイル情報およびコード進行パターンのうち少なくとも1つを含む。
【0071】
楽曲の候補に対応する楽曲情報を取得した通信端末1は、ユーザインターフェース提供する。ユーザは、ユーザインターフェースを介してコンテンツにBGMとして付与する楽曲の楽曲情報を選択して、サーバ2に送信する。
【0072】
制御部21は、ユーザによって選択された楽曲情報を取得する(S1313)。取得された楽曲情報は、ユーザによって選択されたスタイル情報およびコード進行パターンの少なくとも1つを含む。
【0073】
制御部21は、取得した楽曲情報に基づいて楽曲データを生成する(S1315)。制御部21は、公知の楽曲生成技術を用いて楽曲データを生成する。制御部21は、生成された楽曲データを用いて、楽曲と該楽曲に対応するコンテンツとを同期して再生するためコンテンツ再生データを生成する(S1317)。
【0074】
制御部21は、生成されたコンテンツ再生データを、通信端末1からのリクエストに応じて通信端末1に提供してもよい。以上が、制御部21によって実行される楽曲生成処理の一連のフローである。
【0075】
[楽曲再生処理]
通信端末1は、ユーザの指示に応じて、サーバ2からコンテンツ再生データを取得して、楽曲再生処理を実行することができる。通信端末1は、ネットワークNWを介してサーバ2からコンテンツ再生データを取得する。ユーザが、通信端末1の操作部15を介して、コンテンツの再生指示を入力すると、通信端末1において、コンテンツとともに楽曲が再生される。コンテンツは、サーバ2に提供された動画および静止画を含む画像であってもよい。サーバ2に提供されたコンテンツが文章(文字列)である場合、通信端末1において再生されるコンテンツは、該文章(文字列)を含む画像であってもよい。コンテンツとともに再生される楽曲は、通信端末1のスピーカ16を介して放音される。以上が、通信端末1によって実行される楽曲再生処理である。
【0076】
このようにして、通信端末1から提供されたコンテンツから特徴情報を抽出し、抽出した特徴情報を学習済モデル233に提供することによって、サーバ2は、コンテンツの属性を自動的に取得することができる。得られた属性に基づいて、楽曲を生成することにより、サーバ2は、コンテンツにマッチした楽曲を生成して提供することができる。また、ユーザは、BGMの付与を所望するコンテンツを入力すると、自動的に生成された該コンテンツに適した楽曲と、該コンテンツとを同期して再生させるためのコンテンツ再生データを取得することができるという顧客体験を享受することができる。
【0077】
[変形例]
本開示は、上述した実施形態に限定されるものではなく、他の様々な変形例が含まれる。例えば、上述した実施形態は本開示を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。実施形態の構成の一部について、他の構成を追加、削除、置換してもよい。以下、一部の変形例について説明する。
【0078】
(1)上述した実施形態においては、サーバ2の楽曲決定部215は、算出されたスコアの数値が大きなランキング順に1番目~n番目(nは、1以上500以下の任意の整数。例えば20)までの楽曲をコンテンツの属性に対応する楽曲の候補として決定した。しかしながら、楽曲決定部215は、所定のアルゴリズムに基づいて、算出されたスコアの数値が大きなランキング順に1番目~m番目(mは、1以上500以下の任意の整数であり、且つm>nである。例えば40であってもよい。)までの楽曲を抽出し、その中からランダムにn個(例えば20個)の楽曲を選択し、選択された楽曲をコンテンツの属性に対応する楽曲の候補として決定してもよい。
【0079】
(2)上述した実施形態においては、ユーザは、通信端末1に提供されたユーザインターフェースを介して、コンテンツにBGMとして付与する楽曲のスタイル情報およびコード進行パターンのうちの少なくとも1つを選択した。通信端末1の制御部11は、スタイル情報およびコード進行パターンに加え、さらなる付加情報をユーザに設定させるためのユーザインターフェースを通信端末1の表示部14に提供してもよい。
【0080】
さらなる付加情報としては、例えば、コンテンツのBGMとして付与する楽曲のテンポ、楽曲の再生時間、楽曲の抑揚、メロディー、歌詞などが挙げられる。通信端末1は、ユーザが設定した付加情報をサーバ2に提供してもよい。サーバ2の制御部21は、通信端末1から提供された付加情報を楽曲データに反映することができる。
【0081】
(3)上述した実施形態では、ユーザは、通信端末1に提供されたユーザインターフェースを介して、コンテンツにBGMとして付与する楽曲のコード進行パターンを選択することができる。しかしながら、ユーザは、通信端末1に提供されたユーザインターフェースを介して、コンテンツにBGMとして付与する楽曲のコード進行パターンを編集してもよい。さらに、ユーザは、編集したコード進行パターンを試聴することができてもよい。ユーザは、編集したコード進行パターンを試聴して、さらにコード進行パターンを編集することができる。
【0082】
通信端末1は、ユーザが設定したコード進行パターンをサーバ2に提供してもよい。サーバ2の制御部21は、通信端末1から取得した、ユーザによって設定されたコード進行パターンに基づいて楽曲データを生成してもよい。
【0083】
(4)サーバ2によって生成されたコンテンツ再生データは、コンテンツをサーバ2に提供した通信端末1だけではなく、ネットワークNWを介してサーバ2に接続することができる他の通信端末1も取得することができる。
【0084】
以上が変形例に関する説明である。
【0085】
以上のとおり、本発明の一実施形態によれば、入力されたコンテンツから、当該コンテンツに含まれる特徴情報を抽出し、複数の属性のうち、前記抽出された特徴情報に対応する少なくとも1つの属性を決定し、前記決定された属性に対応する伴奏パターンおよびコード進行パターンを決定し、前記決定された伴奏パターンおよびコード進行パターンに基づく楽曲を生成することを含む、楽曲生成方法が提供される。
【0086】
前記コンテンツは画像を含み、前記特徴情報は、前記画像から抽出されるオブジェクトを含んでもよい。
【0087】
前記コンテンツは文章を含み、前記特徴情報は、前記文章から抽出される形態素を含んでもよい。
【0088】
前記複数の属性は、第1属性グループと第2属性グループとを含む複数のグループのいずれかに区分され、前記決定される属性は、前記第1属性グループに含まれる属性と前記第2属性グループに含まれる属性とを含んでもよい。
【0089】
前記決定される属性は、特徴情報と属性との関係を学習させた学習済モデルに対して、前記抽出された特徴情報を入力することによって当該学習済モデルから得られた情報に基づいて決定されてもよい。
【0090】
前記伴奏パターンおよび前記コード進行パターンを決定することは、前記決定された属性に対応する複数の前記伴奏パターンを特定し、前記特定された複数の伴奏パターンから少なくとも1つをユーザに選択させるためのユーザインターフェースを提供し、前記選択された伴奏パターンを前記決定された属性に対応する伴奏パターンとして決定すること、を含んでもよい。
【0091】
前記決定された属性に対応する複数の前記伴奏パターンを特定することは、前記所定のアルゴリズムにしたがって前記複数の伴奏パターンを特定することを含み、前記所定のアルゴリズムによって第1属性に対して特定される前記複数の伴奏パターンが、第1組み合わせとなる場合と第2組み合わせとなる場合とを含んでもよい。
【0092】
前記伴奏パターンおよび前記コード進行パターンを決定することは、前記決定された属性に対応する複数の前記コード進行パターンを特定し、前記特定された複数のコード進行パターンから少なくとも1つをユーザに選択させるためのユーザインターフェースを提供し、前記選択されたコード進行パターンを前記決定された属性に対応するコード進行パターンして決定すること、を含んでもよい。
【0093】
前記決定された属性に対応する複数の前記コード進行パターンを特定することは、前記所定のアルゴリズムにしたがって前記複数のコード進行パターンを特定することを含み、前記所定のアルゴリズムによって第1属性に対して特定される前記複数のコード進行パターンが、第1組み合わせとなる場合と第2組み合わせとなる場合とを含んでもよい。
【0094】
前記楽曲の付加情報をユーザに設定させるためのユーザインターフェースを提供することをさらに含み、前記楽曲は、さらに前記設定された付加情報に基づいて生成されてもよい。
【0095】
前記生成した楽曲と前記入力されたコンテンツとを同期して再生するためデータを出力することをさらに含んでもよい。
【0096】
また、本発明の一実施形態によれば、入力されたコンテンツから、当該コンテンツに含まれる特徴情報を抽出し、複数の属性のうち、前記抽出された特徴情報に対応する少なくとも1つの属性を決定し、前記決定された属性に対応する伴奏パターンおよびコード進行パターンを決定し、前記決定された伴奏パターンおよびコード進行パターンに基づく楽曲を生成すること、をコンピュータに実行させるためのプログラムが提供されてもよい。
【0097】
尚、一実施形態に係るプログラム(プログラム製品)は、コンピュータで読み取り可能な記録媒体で提供されてもよく、外部のサーバなどネットワーク経由で配信される形態で提供されてもよい。
【0098】
また、本発明の一実施形態によれば、通信端末からコンテンツを受信する通信部と、受信したコンテンツに基づいて楽曲を生成する制御部と、を含む楽曲生成装置(サーバ)が提供されてもよい。制御部は、楽曲生成処理を実行する。制御部は、受信したコンテンツから、当該コンテンツに含まれる特徴情報を抽出し、複数の属性のうち、抽出された特徴情報に対応する少なくとも1つの属性を決定する。さらに制御部は、決定された属性に対応する伴奏パターンおよびコード進行パターンを決定し、決定された伴奏パターンおよびコード進行パターンに基づいて楽曲を生成する。
【0099】
また、本発明の一実施形態によれば、一つ以上の通信端末と、サーバと、を含む楽曲生成システムが提供されてもよい。一つ以上の通信端末とサーバとは、インターネットなどのネットワークを介して接続されている。各通信端末は、ネットワークを介してコンテンツをサーバに送信する。コンテンツは、ユーザがBGMの付与を所望するコンテンツである。サーバは、通信端末からコンテンツを受信する通信部と、受信したコンテンツに基づいて楽曲を生成する制御部と、を含む。制御部は、受信したコンテンツから、当該コンテンツに含まれる特徴情報を抽出し、複数の属性のうち、抽出された特徴情報に対応する少なくとも1つの属性を決定する。さらに制御部は、決定された属性に対応する伴奏パターンおよびコード進行パターンを決定し、決定された伴奏パターンおよびコード進行パターンに基づいて楽曲を生成する。
【符号の説明】
【0100】
1:通信端末、2:サーバ、11:制御部、12:記憶部、13:通信部、14:表示部、15:操作部、16:スピーカ、17:バス、21:制御部、23:記憶部、25:通信部、211:特徴抽出部、213:属性決定部、215:楽曲決定部、217:楽曲提供部、219:楽曲生成部、231:プログラム、233:学習済モデル、235:楽曲データベース、237:シチュエーションテーブル、1000:楽曲生成システム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13