(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024004372
(43)【公開日】2024-01-16
(54)【発明の名称】サーバ装置
(51)【国際特許分類】
G10K 15/04 20060101AFI20240109BHJP
G10K 15/02 20060101ALI20240109BHJP
【FI】
G10K15/04 302D
G10K15/02
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2022104005
(22)【出願日】2022-06-28
(71)【出願人】
【識別番号】390004710
【氏名又は名称】株式会社第一興商
(74)【代理人】
【識別番号】110000176
【氏名又は名称】弁理士法人一色国際特許事務所
(72)【発明者】
【氏名】執行 里恵
【テーマコード(参考)】
5D208
【Fターム(参考)】
5D208CA02
5D208CA11
5D208CG04
(57)【要約】
【課題】歌唱動画の撮影開始が遅れた場合であっても、前奏全てのカラオケ演奏音を含む歌唱動画データの生成を可能とするサーバ装置を提供する。
【解決手段】歌唱動画に対応する歌唱動画データを、携帯端末から取得する取得部、取得された歌唱動画データに対応する歌唱動画においてカラオケ演奏されている楽曲の楽曲識別情報を特定する特定部、特定された楽曲識別情報に対応する楽曲の伴奏データから、前奏に対応する伴奏データを抽出する抽出部、取得された歌唱動画データを、抽出された伴奏データを用いて編集することにより、編集動画データを生成する編集処理部を有するサーバ装置。
【選択図】
図2
【特許請求の範囲】
【請求項1】
複数のカラオケ装置と通信可能に接続されたサーバ装置であって、
カラオケ歌唱を行う利用者を携帯端末で撮影して得られた歌唱動画に対応する歌唱動画データを、当該携帯端末から取得する取得部と、
取得された前記歌唱動画データに対応する歌唱動画においてカラオケ演奏されている楽曲の楽曲識別情報を特定する特定部と、
特定された前記楽曲識別情報に対応する楽曲の伴奏データから、前奏に対応する伴奏データを抽出する抽出部と、
取得された前記歌唱動画データを、抽出された前記伴奏データを用いて編集することにより、編集動画データを生成する編集処理部と、
を有するサーバ装置。
【請求項2】
前記編集処理部は、生成した前記編集動画データを、前記携帯端末に送信することを特徴とする請求項1記載のサーバ装置。
【請求項3】
前記取得部は、前記携帯端末から、当該携帯端末の位置を示す位置情報、及び前記歌唱動画の撮影開始時刻を含む撮影時刻情報を取得し、
前記特定部は、取得された前記位置情報に基づいて一のカラオケ装置を特定し、取得された前記撮影時刻情報及び当該一のカラオケ装置に記憶されている演奏履歴情報に基づいて、前記楽曲識別情報を特定することを特徴とする請求項1記載のサーバ装置。
【請求項4】
前記編集処理部は、取得された前記歌唱動画データを、特定された前記楽曲識別情報に対応する楽曲の背景映像データを用いて編集することを特徴とする請求項1から3のいずれか一つに記載のサーバ装置。
【請求項5】
前記編集処理部は、取得された前記歌唱動画データから、複数のフラッシュカット映像に対応する複数のフラッシュカット映像データを抽出し、取得された前記歌唱動画データを、抽出した複数のフラッシュカット映像データを用いて編集することを特徴とする請求項1から3のいずれか一つに記載のサーバ装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はサーバ装置に関する。
【背景技術】
【0002】
カラオケ装置の利用者は、カラオケ歌唱を行いながら、スマートフォン等の携帯端末を用いて歌唱動画を撮影することがある。
【0003】
たとえば、特許文献1には、楽曲の演奏データに基づくカラオケ演奏音と、集音手段により集音された歌唱音声と、撮影手段によりカラオケ歌唱を行う歌唱者を撮影して得られる動画像とに基づいて歌唱動画を生成する携帯端末が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、ある利用者は、自己の携帯端末を用い、カラオケ歌唱を行う他の利用者の歌唱動画を撮影することができる。しかしながら、自らがカラオケ歌唱を行う場合と比べ、他の利用者がカラオケ歌唱を行う場合、カラオケ演奏が開始されるタイミングを把握し難いため、楽曲の前奏が始まった後に歌唱動画の撮影を開始することがありうる。このようにして得られた歌唱動画は、前奏の一部が欠けたものとなっている。
【0006】
本発明の目的は、歌唱動画の撮影開始が遅れた場合であっても、前奏全てのカラオケ演奏音を含む歌唱動画データの生成を可能とするサーバ装置を提供することにある。
【課題を解決するための手段】
【0007】
上記目的を達成するための一の発明は、複数のカラオケ装置と通信可能に接続されたサーバ装置であって、カラオケ歌唱を行う利用者を携帯端末で撮影して得られた歌唱動画に対応する歌唱動画データを、当該携帯端末から取得する取得部と、取得された前記歌唱動画データに対応する歌唱動画においてカラオケ演奏されている楽曲の楽曲識別情報を特定する特定部と、特定された前記楽曲識別情報に対応する楽曲の伴奏データから、前奏に対応する伴奏データを抽出する抽出部と、取得された前記歌唱動画データを、抽出された前記伴奏データを用いて編集することにより、編集動画データを生成する編集処理部と、を有するサーバ装置である。
本発明の他の特徴については、後述する明細書及び図面の記載により明らかにする。
【発明の効果】
【0008】
本発明によれば、歌唱動画の撮影開始が遅れた場合であっても、前奏全てのカラオケ演奏音を含む歌唱動画データを生成できる。
【図面の簡単な説明】
【0009】
【
図1】実施形態に係る通信カラオケシステムを示す図である。
【
図3】実施形態に係るサーバ装置の処理を示すフローチャートである。
【発明を実施するための形態】
【0010】
<実施形態>
図1から
図3を参照して、本実施形態に係るサーバ装置について説明する。
【0011】
==通信カラオケシステム==
通信カラオケシステムは、複数のカラオケ装置及びサーバ装置を含む。各カラオケ装置とサーバ装置とはネットワークを介して通信可能に接続されている。
【0012】
カラオケ装置は、楽曲のカラオケ演奏及びカラオケ歌唱を行うための機能を有する。カラオケ装置は、マイク、ディスプレイ、スピーカ、リモコン装置等の各種構成を有する。カラオケ装置は、装置識別情報が付与されている。装置識別情報は、カラオケ装置を識別するための装置ID等、各カラオケ装置に固有の情報である。
【0013】
サーバ装置は、各種情報を管理したり、各種処理を実行するコンピュータである。本実施形態に係るサーバ装置は、携帯端末で撮影して得られた歌唱動画に対応する歌唱動画データを編集することができる(詳細は後述)。歌唱動画は、楽曲の伴奏データ(後述)に基づくカラオケ演奏音、カラオケ歌唱を行う利用者の歌唱音声、及びカラオケ歌唱を行う利用者を撮影して得られる動画像を含む。
【0014】
携帯端末は、カラオケ装置を利用する利用者が所有するスマートフォンやタブレット端末等である。携帯端末は、カラオケ演奏音や歌唱音声を集音するためのマイクや、カラオケ歌唱を行う利用者を撮影するためのカメラを有している。携帯端末は、端末識別情報が付与されている。端末識別情報は、携帯端末を識別するための端末ID等、各携帯端末に固有の情報である。
【0015】
本実施形態に係る携帯端末には、サーバ装置において歌唱動画の編集を行うための専用のアプリケーションソフトウェア(以下、「歌唱動画編集アプリ」)がインストールされている。歌唱動画編集アプリは、たとえば、サーバ装置が提供する所定のWebサイトからダウンロードすることで入手できる。携帯端末において歌唱動画編集アプリを起動させることにより、携帯端末とサーバ装置との通信が確立する。
【0016】
図1に示すように、本実施形態に係る通信カラオケシステム1は、カラオケ装置K1~カラオケ装置Kn、及びサーバ装置Sを含む。各カラオケ装置とサーバ装置SとはネットワークNを介して通信可能に接続されている。
【0017】
カラオケ装置K1はカラオケ店舗L1に設置されており、カラオケ装置Knはカラオケ店舗Lnに設置されている。カラオケ店舗L1には、2名の利用者U1及び利用者U2が滞在している。利用者U1は、携帯端末M1を所有している。携帯端末M1には歌唱動画編集アプリがインストールされている。
【0018】
なお、カラオケ装置の数やカラオケ装置を利用する利用者の人数等は
図1の例に限られない。
【0019】
==サーバ装置==
図2に示すように、サーバ装置Sは、記憶手段10、通信手段20、及び制御手段30を備える。各構成はインターフェース(図示なし)を介してバスBに接続されている。
【0020】
[記憶手段]
記憶手段10は、各種のデータを記憶する大容量の記憶装置である。本実施形態に係る記憶手段10は、楽曲データを記憶する。楽曲データは、楽曲識別情報が付与されている。楽曲識別情報は、楽曲を識別するための楽曲ID等、各楽曲に固有の情報である。楽曲データは、伴奏データ、リファレンスデータ、区間情報等を含む。伴奏データは、カラオケ演奏音の元となるMIDI形式のデータである。リファレンスデータは、カラオケ演奏された楽曲の主旋律を示すデータである。区間情報は、演奏区間を示す。演奏区間は、カラオケ演奏が行われる区間である。演奏区間は、歌唱区間及び非歌唱区間を含む。歌唱区間は、ある楽曲において歌唱すべき歌詞が設定されている区間(たとえば、1番のAメロ、Bメロ、サビ)である。非歌唱区間は、たとえば前奏、間奏、後奏のような、ある楽曲において歌唱すべき歌詞が設定されていない区間である。楽曲データは、ネットワークNを介して接続された各カラオケ装置に配信される。
【0021】
また、記憶手段10は、楽曲毎に、カラオケ演奏時に表示される背景映像に対応する背景映像データ、楽曲の歌詞を表示するための歌詞テロップデータ、及び楽曲の属性情報(楽曲名、歌手名、ジャンル等)を記憶する。
【0022】
[通信手段]
通信手段20は、カラオケ装置や携帯端末との通信を行うためのインターフェースを提供する。
【0023】
[制御手段]
制御手段30は、サーバ装置Sにおける各種の制御を行う。制御手段30は、CPUおよびメモリ(いずれも図示無し)を備える。CPUは、メモリに記憶されたプログラムを実行することにより各種の機能を実現する。
【0024】
本実施形態においてはCPUがメモリに記憶されるプログラムを実行することにより、制御手段30は、取得部100、特定部200、抽出部300、及び編集処理部400として機能する。
【0025】
(取得部)
取得部100は、カラオケ歌唱を行う利用者を携帯端末で撮影して得られた歌唱動画に対応する歌唱動画データを、当該携帯端末から取得する。
【0026】
携帯端末を用いて歌唱動画を撮影した利用者は、携帯端末にインストールされている歌唱動画編集アプリを起動する。サーバ装置Sは、歌唱動画編集アプリを起動した携帯端末に対し、編集を希望する歌唱動画に対応する歌唱動画データを送信するよう指示を行う。
【0027】
指示を受けた携帯端末は、編集を希望する歌唱動画に対応する歌唱動画データ、及び端末識別情報をサーバ装置Sに送信する。取得部100は、送信された歌唱動画データ及び端末識別情報を取得する。
【0028】
なお、上記説明ではサーバ装置Sからの指示に基づいて携帯端末が歌唱動画データをサーバ装置Sに送信する例について述べた。一方、サーバ装置Sからの指示がない場合であっても、携帯端末から歌唱動画データをサーバ装置Sに送信できる構成としてもよい。具体的に、利用者は、携帯端末で歌唱動画編集アプリを起動した後、携帯端末を操作して編集を希望する歌唱動画を選択し、サーバ装置Sに編集の要求を行う。携帯端末は、選択された歌唱動画に対応する歌唱動画データ及び端末識別情報を、編集の要求信号と合わせてサーバ装置Sに送信する。この場合も、取得部100は、送信された歌唱動画データ及び端末識別情報を取得することができる。
【0029】
また、歌唱動画編集アプリを利用する代わりに、携帯端末は、利用者からの操作入力に基づいて、サーバ装置Sが提供する専用のWebサイトにアクセスし、歌唱動画データ及び端末識別情報をアップロードすることも可能である。この場合、取得部100は、アップロードされた歌唱動画データ及び端末識別情報を取得する。
【0030】
(特定部)
特定部200は、取得された歌唱動画データに対応する歌唱動画においてカラオケ演奏されている楽曲の楽曲識別情報を特定する。
【0031】
楽曲識別情報の特定は様々な方法で行うことができる。たとえば、ある歌唱動画データが取得された場合、特定部200は、カラオケ演奏音に対応するオーディオデータから楽曲名の検索が可能な公知の外部サイトに接続する。特定部200は、取得されたある歌唱動画データに含まれるカラオケ演奏音に対応するオーディオデータを外部サイトに送信する。外部サイトは、受信したオーディオデータを用いて楽曲名の検索を行い、検索結果(すなわち、歌唱動画においてカラオケ演奏されている楽曲の楽曲名)を特定部200に送信する。特定部200は、記憶手段10に記憶されている各楽曲の属性情報を参照し、外部サイトから受信した楽曲名と一致する楽曲を抽出する。特定部200は、抽出した楽曲の楽曲識別情報を、取得された歌唱動画データに対応する歌唱動画においてカラオケ演奏されている楽曲の楽曲識別情報として特定する。
【0032】
或いは、サーバ装置Sにおいて、外部サイトと同様の処理を行ってもよい。この場合、特定部200は、外部サイトへの接続を行うことなく、楽曲の楽曲識別情報を特定できる。また、外部サイトを利用しない場合、特定部200は、楽曲名に基づくことなく、楽曲識別情報を特定することも可能である。具体的に、特定部200は、歌唱動画データに含まれるカラオケ演奏音に対応するオーディオデータと、記憶手段10に記憶されている各楽曲の楽曲データ(具体的には、伴奏データをソフトウェアによりレンダリングしたオーディオデータ)とを対比する。特定部200は、歌唱動画に含まれるカラオケ演奏音に対応するオーディオデータと最も類似する楽曲データに付与されている楽曲識別情報を、取得された歌唱動画データに対応する歌唱動画においてカラオケ演奏されている楽曲の楽曲識別情報として特定する。
【0033】
(抽出部)
抽出部300は、特定された楽曲識別情報に対応する楽曲の伴奏データから、前奏に対応する伴奏データを抽出する。
【0034】
抽出部300は、特定された楽曲識別情報が付与された楽曲データから、伴奏データ及び区間情報を読み出す。抽出部300は、区間情報に基づいて、読み出した伴奏データのうち、前奏に対応する伴奏データを抽出する。なお、本実施形態において、抽出部300は、前奏に対応する伴奏データ(MIDI形式のデータ)を、ソフトウェアによりレンダリングしたオーディオデータの形式で抽出する。
【0035】
(編集処理部)
編集処理部400は、取得された歌唱動画データを、抽出された伴奏データを用いて編集することにより、編集動画データを生成する。編集動画データは、前奏全てのカラオケ演奏音を含む歌唱動画データである。
【0036】
編集動画データの生成は様々な方法により行うことができる。たとえば、編集処理部400は、取得された歌唱動画データに含まれるカラオケ演奏音のオーディオデータの先頭から所定期間(たとえば、0msec~100msec)の波形を、抽出された伴奏データの先頭からの波形と順次対比し、波形が一致するタイミングを求める。波形の対比は公知の技術を用いて行うことができる。編集処理部400は、波形が一致するタイミングを、歌唱動画データに対応する歌唱動画の撮影を開始したタイミングとして判定する。
【0037】
ここで、取得された歌唱動画データには、前奏開始(0msec)から判定したタイミングまでのカラオケ演奏音が含まれていない。そこで、編集処理部400は、抽出された伴奏データのうち、前奏開始(0msec)から判定したタイミングまでの伴奏データを、取得された歌唱動画データに含まれるカラオケ演奏音に対応するオーディオデータの先頭に挿入することにより、歌唱動画データの編集を行う。この場合、前奏全てのカラオケ演奏音を含む編集動画データが生成される。
【0038】
また、編集処理部400は、取得された歌唱動画データを、特定された楽曲識別情報に対応する楽曲の背景映像データを用いて編集することができる。
【0039】
編集処理部400は、取得された歌唱動画データに対応する歌唱動画においてカラオケ演奏されている楽曲の背景映像データを読み出す。編集処理部400は、読み出した背景映像データから、取得された歌唱動画データに含まれるカラオケ演奏音に対応するオーディオデータの先頭に挿入された伴奏データに対応する背景映像データのみを抽出する。編集処理部400は、抽出した背景映像データを、取得された歌唱動画データに含まれる動画像データの先頭に挿入することで歌唱動画データの編集を行う。この場合、前奏全てのカラオケ演奏音及び挿入された伴奏データに対応する背景映像を含む編集動画データが生成される。
【0040】
また、編集処理部400は、生成した編集動画データを、歌唱動画を撮影した携帯端末に送信することができる。送信は、取得した端末識別情報に基づいて行われる。或いは、編集処理部400は、生成した編集動画データを、専用のサイトにアップロードし、編集後の歌唱動画を公開することもできる。編集後の歌唱動画の公開は、歌唱動画の撮影を行った利用者及び歌唱動画に映るカラオケ歌唱を行っている利用者の許可を予め得ることが好ましい。たとえば、利用者は、歌唱動画編集アプリを介して、編集後の歌唱動画の公開を許可する旨の選択を予め行うことができる。
【0041】
==カラオケシステムの動作について==
次に、
図3を参照して本実施形態に係るサーバ装置Sの動作の具体例について述べる。
図3は、サーバ装置Sにおける動作を示すフローチャートである。この例では、
図1に示すように、カラオケ店舗L1において利用者U1及び利用者U2がカラオケ装置K1を利用しているとする。また、利用者U1が所有する携帯端末M1には、歌唱動画編集アプリがインストールされているとする。
【0042】
取得部100は、カラオケ歌唱を行う利用者U2を携帯端末M1で撮影して得られた歌唱動画Vに対応する歌唱動画データVDを、携帯端末M1から取得する(携帯端末から歌唱動画データを取得。ステップ10)。
【0043】
特定部200は、取得された歌唱動画データVDに対応する歌唱動画Vにおいてカラオケ演奏されている楽曲の楽曲識別情報を特定する(楽曲識別情報を特定。ステップ11)。
【0044】
抽出部300は、ステップ11で特定された楽曲識別情報に対応する楽曲の伴奏データから、前奏に対応する伴奏データを抽出する(前奏に対応する伴奏データを抽出。ステップ12)。
【0045】
編集処理部400は、ステップ10で取得された歌唱動画データVDを、ステップ12で抽出された伴奏データを用いて編集する(抽出された伴奏データを用いて歌唱動画データを編集。ステップ13)。
【0046】
また、編集処理部400は、ステップ10で取得された歌唱動画データVDを、ステップ11で特定された楽曲識別情報に対応する楽曲の背景映像データを用いて編集する(背景映像データを用いて歌唱動画データを編集。ステップ14)。
【0047】
編集処理部400は、ステップ13及びステップ14の処理を実行することにより、編集動画データVD´を生成する(編集動画データを生成。ステップ15)。
【0048】
編集処理部400は、ステップ15で生成した編集動画データVD´を、携帯端末M1に送信する(編集動画データを携帯端末に送信。ステップ16)。
【0049】
具体的に、利用者U2は、カラオケ装置K1のリモコン装置を操作し、カラオケ歌唱を希望する楽曲Xを選曲する。カラオケ装置K1は、利用者U2が選曲した楽曲Xのカラオケ演奏を開始する。利用者U2は、カラオケ演奏に合わせてカラオケ歌唱を行う。一方、利用者U1は、楽曲Xの前奏を聴いて楽曲Xのカラオケ演奏が開始されたことを知った後、携帯端末M1で歌唱動画の撮影を開始する。この場合に得られる歌唱動画Vは、楽曲Xの前奏の一部が欠けたものとなっている。
【0050】
そこで、利用者U1は、歌唱動画の撮影が終了した後、携帯端末M1にインストールされている歌唱動画編集アプリを起動する。サーバ装置Sは、歌唱動画編集アプリを起動した携帯端末M1に対し、編集を希望する歌唱動画Vに対応する歌唱動画データVDを送信するよう指示を行う。
【0051】
指示を受けた携帯端末M1は、利用者U1からの操作入力に基づいて、編集を希望する歌唱動画Vに対応する歌唱動画データVD、及び端末ID***M1をサーバ装置Sに送信する。
【0052】
取得部100は、送信された歌唱動画データVD及び端末ID***M1を取得する。
【0053】
歌唱動画データVDが取得された場合、特定部200は、カラオケ演奏音に対応するオーディオデータから楽曲名の検索が可能な公知の外部サイトに接続する。特定部200は、歌唱動画データVDに含まれるカラオケ演奏音に対応するオーディオデータを外部サイトに送信する。外部サイトは、受信したオーディオデータを用いて楽曲名の検索を行い、検索結果として楽曲Xの楽曲名を特定部200に送信する。特定部200は、記憶手段10に記憶されている各楽曲の属性情報を参照し、外部サイトから受信した楽曲名と一致する楽曲Xを抽出する。特定部200は、抽出した楽曲Xの楽曲ID***Xを、歌唱動画データVDに対応する歌唱動画Vにおいてカラオケ演奏されている楽曲の楽曲識別情報として特定する。
【0054】
抽出部300は、特定された楽曲ID***Xが付与された楽曲データから、伴奏データ及び区間情報を読み出す。抽出部300は、区間情報に基づいて、読み出した伴奏データのうち、前奏に対応する伴奏データを抽出する。
【0055】
編集処理部400は、歌唱動画データVDに含まれるカラオケ演奏音のオーディオデータの先頭(0mse)から100msecまでの波形Wを、抽出された伴奏データの波形の先頭から100msec毎に順次対比し、波形が一致するタイミングを求める。
【0056】
ここで、波形Wが、抽出された伴奏データの4,500msecから4,600msecまでの波形Wnと一致したとする。この場合、編集処理部400は、前奏開始から4,500msecのタイミングを、歌唱動画データVDに対応する歌唱動画Vの撮影を開始したタイミングとして判定する。
【0057】
編集処理部400は、抽出された伴奏データのうち、前奏開始(0msec)から4,500msecまでの伴奏データを、歌唱動画データVDに含まれるカラオケ演奏音に対応するオーディオデータの先頭に挿入することにより、歌唱動画データVDの編集を行う。
【0058】
また、編集処理部400は、歌唱動画Vにおいてカラオケ演奏されている楽曲Xの背景映像データを記憶手段10から読み出す。編集処理部400は、読み出した背景映像データから、歌唱動画データVDに含まれるカラオケ演奏音に対応するオーディオデータの先頭に挿入された伴奏データ(0msecから4,500msecまでのデータ)に対応する背景映像データ(0msecから4,500msecまでに表示される背景映像に対応するデータ)のみを抽出する。編集処理部400は、抽出した背景映像データを、歌唱動画データVDに含まれる動画像データの先頭に挿入することで歌唱動画データVDの編集を行う。
【0059】
編集処理部400は、上記2つの編集処理を実行することにより、編集動画データVD´を生成する。
【0060】
編集処理部400は、生成した編集動画データVD´を、歌唱動画Vを撮影した携帯端末M1に送信する。
【0061】
なお、編集処理部400は、歌唱動画データに含まれるカラオケ演奏音に対応するオーディオデータの先頭に抽出した伴奏データの一部を挿入する際に、クロスフェード演奏がなされるような処理を行うことも可能である。たとえば、上記例において、編集処理部400は、歌唱動画Vの撮影開始後、4,500msecから4,800msecまでの300msecの間に、抽出した伴奏データの音量レベルを100%から0%まで徐々に減少させ、且つ歌唱動画データに含まれるカラオケ演奏音のオーディオデータの音量レベルを0%から100%まで徐々に増加するよう、編集を行ってもよい。
【0062】
以上から明らかなように、本実施形態に係るサーバ装置Sは、複数のカラオケ装置K1~Knと通信可能に接続されている。サーバ装置Sは、カラオケ歌唱を行う利用者を携帯端末で撮影して得られた歌唱動画に対応する歌唱動画データを、当該携帯端末から取得する取得部100と、取得された歌唱動画データに対応する歌唱動画においてカラオケ演奏されている楽曲の楽曲識別情報を特定する特定部200と、特定された楽曲識別情報に対応する楽曲の伴奏データから、前奏に対応する伴奏データを抽出する抽出部300と、取得された歌唱動画データを、抽出された伴奏データを用いて編集することにより、編集動画データを生成する編集処理部400と、を有する。
【0063】
このようなサーバ装置Sによれば、携帯端末から前奏の一部が欠けた歌唱動画データを取得した場合であっても、楽曲の伴奏データを用いて、欠けている部分の前奏を補った編集動画データを生成することができる。すなわち、本実施形態に係るサーバ装置Sによれば、歌唱動画の撮影開始が遅れた場合であっても、前奏全てのカラオケ演奏音を含む歌唱動画データを生成できる。
【0064】
また、本実施形態に係るサーバ装置Sにおいて、編集処理部400は、生成した編集動画データを、携帯端末に送信することができる。よって、前奏の一部が欠けた歌唱動画を撮影した携帯端末は、前奏全てのカラオケ演奏音を含む歌唱動画データを取得することができる。
【0065】
また、本実施形態に係るサーバ装置Sにおいて、編集処理部400は、取得された歌唱動画データを、特定された楽曲識別情報に対応する楽曲の背景映像データを用いて編集することができる。このようなサーバ装置Sによれば、前奏全てのカラオケ演奏音及び補った前奏に対応する背景映像を含む編集動画データを生成できる。
【0066】
<変形例1>
実施形態で述べたように、楽曲識別情報の特定は様々な方法で行うことができる。たとえば、特定部200は、カラオケ装置毎に記憶されている演奏履歴情報に基づいて、楽曲識別情報を特定することができる。演奏履歴情報は、カラオケ装置において行われたカラオケ演奏に関する各種の情報である。具体的に、演奏履歴情報は、カラオケ演奏を行った楽曲の楽曲識別情報、当該カラオケ演奏の演奏開始時刻及び演奏時間実績(演奏開始タイミングと実際に演奏が終了したタイミングとの差分値)、当該カラオケ演奏において設定されていたキーの値を示すキー情報、当該カラオケ演奏において設定されていたテンポの値を示すテンポ情報等を含む。
【0067】
(取得部)
本変形例に係る取得部100は、携帯端末から、当該携帯端末の位置を示す位置情報、及び歌唱動画の撮影開始時刻を含む撮影時刻情報を取得する。位置情報は、一般的な携帯端末が備えるGPS機能を利用して求めることができる。
【0068】
たとえば、実施形態の例において、利用者U1は、携帯端末M1にインストールされている歌唱動画編集アプリを起動する。サーバ装置Sは、歌唱動画編集アプリを起動した携帯端末M1に対し、編集を希望する歌唱動画Vに対応する歌唱動画データVD、位置情報、及び撮影時刻情報を送信するよう指示を行う。
【0069】
指示を受けた携帯端末M1は、編集を希望する歌唱動画Vに対応する歌唱動画データVD、及び端末ID***M1と合わせて、GPS機能を利用して求めた位置情報P、及び歌唱動画Vの撮影開始時刻tを含む撮影時刻情報Tをサーバ装置Sに送信する。
【0070】
取得部100は、送信された歌唱動画データVD、端末ID***M1、位置情報P、及び撮影時刻情報Tを取得する。なお、この場合の位置情報Pは、歌唱動画Vを撮影した位置、すなわち、カラオケ装置K1が設置されているカラオケ店舗の位置とほぼ等しい。
【0071】
(特定部)
本変形例に係る特定部200は、取得された位置情報に基づいて一のカラオケ装置を特定し、取得された撮影時刻情報及び当該一のカラオケ装置に記憶されている演奏履歴情報に基づいて、楽曲識別情報を特定する。本変形例において、サーバ装置Sは、通信可能な各カラオケ装置が設置されている位置を示す装置位置情報(たとえばカラオケ店舗の住所)を予め記憶している。
【0072】
上述の通り、歌唱動画データVDが取得された場合、特定部200は、サーバ装置Sに記憶されているカラオケ装置毎の装置位置情報を参照し、受信した位置情報Pと一致または最も近似する一の装置位置情報を求める。特定部200は、一の装置位置情報に対応するカラオケ装置を一のカラオケ装置として特定する。
【0073】
特定部200は、一のカラオケ装置から取得した演奏履歴情報(具体的には、演奏開始時刻及び演奏時間実績)を参照し、撮影時刻情報に含まれる撮影開始時刻の時点でカラオケ演奏が行われていた楽曲を抽出する。特定部200は、抽出した楽曲の楽曲識別情報を、取得した歌唱動画データに対応する歌唱動画においてカラオケ演奏されている楽曲の楽曲識別情報として特定する。
【0074】
たとえば、一のカラオケ装置としてカラオケ装置K1が特定されたとする。この場合、特定部200は、カラオケ装置K1から取得した演奏履歴情報を参照し、撮影時刻情報Tに含まれる撮影開始時刻tの時点でカラオケ演奏が行われていた楽曲として楽曲Xを抽出する。特定部200は、抽出した楽曲Xの楽曲ID***Xを、取得した歌唱動画データVDに対応する歌唱動画Vにおいてカラオケ演奏されている楽曲の楽曲識別情報として特定する。
【0075】
以上から明らかなように、本変形例に係るサーバ装置Sにおいて、取得部100は、携帯端末から、当該携帯端末の位置を示す位置情報、及び歌唱動画の撮影開始時刻を含む撮影時刻情報を取得する。特定部200は、取得された位置情報に基づいて一のカラオケ装置を特定し、取得された撮影時刻情報及び当該一のカラオケ装置に記憶されている演奏履歴情報に基づいて、楽曲識別情報を特定する。このようなサーバ装置Sによれば、あるカラオケ装置に記憶されている演奏履歴情報に基づいて楽曲識別情報を特定することができる。なお、サーバ装置Sの記憶手段が、接続された各カラオケ装置の演奏履歴情報を記憶することでもよい。この場合、サーバ装置Sは、各カラオケ装置から送信される演奏履歴情報に基づいて、記憶手段に記憶されれている情報を随時更新する。
【0076】
<変形例2>
歌唱動画データに対応する歌唱動画の撮影を開始したタイミングの判定は、実施形態の例に限られない。たとえば、編集処理部400は、取得された撮影時刻情報及び演奏履歴情報に基づいて、歌唱動画データに対応する歌唱動画の撮影を開始したタイミングを判定することができる。
【0077】
本変形例においては、変形例1と同様、取得部100は、携帯端末から位置情報及び撮影時刻情報を取得する。特定部200は、取得された位置情報に基づいて一のカラオケ装置を特定し、取得された撮影時刻情報及び当該一のカラオケ装置に記憶されている演奏履歴情報に基づいて、楽曲識別情報を特定する。
【0078】
編集処理部400は、取得した撮影時刻情報に含まれる歌唱動画の撮影開始時刻と、特定された楽曲識別情報に対応する楽曲の演奏開始時刻との差分に基づいて、歌唱動画の撮影を開始したタイミングを判定する。
【0079】
たとえば、変形例1で述べたように、取得部100は、歌唱動画データVD、端末ID***M1、位置情報P、及び撮影時刻情報Tを取得したとする。また、特定部200は、歌唱動画データVDに対応する歌唱動画Vにおいてカラオケ演奏されている楽曲Xの楽曲ID***Xを特定したとする。
【0080】
この場合、編集処理部400は、撮影時刻情報Tに含まれる歌唱動画Vの撮影開始時刻tと、楽曲Xの演奏開始時刻t´との差分Dを求める。編集処理部400は、差分Dが示す時刻を歌唱動画Vの撮影を開始したタイミングとして判定する。
【0081】
<変形例3>
抽出部300は、前奏に対応する伴奏データ(MIDI形式のデータ)を、ソフトウェアによりレンダリングする際、キーやテンポの値を考慮してよい。たとえば、抽出部300は、特定された一のカラオケ装置に記憶されている演奏履歴情報に含まれるキー情報及び/またはテンポ情報に基づいて、前奏に対応する伴奏データのレンダリングを行うことができる。
【0082】
本変形例においては、変形例1及び2と同様、取得部100は、携帯端末から位置情報及び撮影時刻情報を取得する。特定部200は、取得された位置情報に基づいて一のカラオケ装置を特定し、取得された撮影時刻情報及び当該一のカラオケ装置に記憶されている演奏履歴情報に基づいて、楽曲識別情報を特定する。
【0083】
抽出部300は、特定された一のカラオケ装置の演奏履歴情報から、撮影時刻情報Tが示す撮影開始時刻tにおいて設定されているキー情報KS及び/またはテンポ情報TPを取得する。
【0084】
抽出部300は、ソフトウェアを用い、前奏に対応するMIDI形式の伴奏データを、キー情報KS及び/またはテンポ情報TPに基づいてレンダリングする。
【0085】
このような処理を行うことにより、編集処理部400は、歌唱動画中のカラオケ演奏において設定されているキーやテンポの値に合わせた伴奏データを挿入することができる、
【0086】
<変形例4>
編集処理部400は、取得された歌唱動画データを編集する際、実施形態で述べた背景映像データを用いる代わりに、歌唱動画から抽出したフラッシュカット映像データを用いることができる。
【0087】
(編集処理部)
本変形例に係る編集処理部400は、取得された歌唱動画データから、複数のフラッシュカット映像に対応する複数のフラッシュカット映像データを抽出し、取得された歌唱動画データを、抽出した複数のフラッシュカット映像データを用いて編集する。
【0088】
フラッシュカット映像は、フラッシュカットに用いる映像である。編集処理部400は、歌唱動画データに含まれる動画像のデータから複数のフラッシュカット映像データを抽出する。フラッシュカット映像データの数、及び対応するフラッシュカット映像の長さは特に限定されないが、歌唱動画データに挿入される伴奏データの長さに応じて決定されることが好ましい。
【0089】
編集処理部400は、抽出した複数のフラッシュカット映像データを、歌唱動画データに含まれる動画像データの先頭から順次挿入することで歌唱動画データの編集を行う。
【0090】
たとえば、実施形態で述べたように、編集処理部400が、前奏開始から4,500msecのタイミングを、歌唱動画データVDに対応する歌唱動画Vの撮影を開始したタイミングとして判定したとする。
【0091】
この場合、編集処理部400は、歌唱動画データVDに含まれる動画像データから、楽曲Xの1番のAメロの冒頭500msecのデータをフラッシュカット映像データFCD1として抽出し、楽曲Xの1番のBメロの冒頭500msecのデータをフラッシュカット映像データFCD2として抽出し、楽曲Xの1番のサビの冒頭1,000msecのデータをフラッシュカット映像データFCD3として抽出し、楽曲Xの2番のAメロの冒頭500msecのデータをフラッシュカット映像データFCD4として抽出し、楽曲Xの2番のBメロの冒頭500msecのデータをフラッシュカット映像データFCD5として抽出し、楽曲Xの2番のサビの冒頭1,000msecのデータをフラッシュカット映像データFCD6として抽出し、楽曲Xの3番のAメロの冒頭500msecのデータをフラッシュカット映像データFCD7として抽出する。
【0092】
そして、編集処理部400は、前奏開始(0msec)から4,500msecまでの伴奏データに対し、前奏開始時にフラッシュカット映像データFCD1を割り当て、演奏開始後500msecの時点でフラッシュカット映像データFCD2を割り当て、演奏開始後1,000msecの時点でフラッシュカット映像データFCD3を割り当て、演奏開始後2,000msecの時点でフラッシュカット映像データFCD4を割り当て、演奏開始後2,500msecの時点でフラッシュカット映像データFCD5を割り当て、演奏開始後3,000msecの時点でフラッシュカット映像データFCD6を割り当て、演奏開始後4,000msecの時点でフラッシュカット映像データFCD7を割り当てることで歌唱動画データVDの編集を行う。
【0093】
なお、上記例では、一の歌唱区間から一のフラッシュカット映像を抽出する例について述べたがこれに限られない。たとえば、編集処理部400は、歌唱動画データVDに含まれる動画像データから、楽曲Xの1番のAメロの冒頭500msecのデータをフラッシュカット映像データFCD1として抽出し、且つ楽曲Xの1番のAメロの2,000msecから2,500msecのデータをフラッシュカット映像データFCD2として抽出してもよい。また、編集処理部400は、前奏と同じ非歌唱区間である間奏や後奏からフラッシュカット映像を抽出してもよい。また、編集処理部400は、実施形態で述べた背景映像データと歌唱動画から抽出したフラッシュカット映像データを組合せて用いてもよい。具体的に、編集処理部400は、前奏開始から1,500msecのタイミングまでは、タイトル画像を含む背景映像データを用い、1,500msecのタイミングから4,500msecのタイミングまでは抽出したフラッシュカット映像データを用いることができる。
【0094】
以上から明らかなように、本変形例に係るサーバ装置Sにおいて、編集処理部400は、取得された歌唱動画データから、複数のフラッシュカット映像に対応する複数のフラッシュカット映像データを抽出し、取得された歌唱動画データを、抽出した複数のフラッシュカット映像データを用いて編集することができる。フラッシュカット映像は、携帯端末から取得した歌唱動画から抽出した映像である。このような映像を用いて編集された歌唱動画は、前奏を補った部分においてもカラオケ歌唱を行った利用者の映像が表示される。よって、編集動画データに基づく歌唱動画を視聴する利用者の違和感を低減できる。
【0095】
<その他>
上記実施形態は、例として提示したものであり、発明の範囲を限定するものではない。上記の構成は、適宜組み合わせて実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0096】
1 通信カラオケシステム
100 取得部
200 特定部
300 抽出部
400 編集処理部
M1 携帯端末
K1、Kn カラオケ装置
S サーバ装置