(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-18
(45)【発行日】2024-10-28
(54)【発明の名称】カラオケシステム
(51)【国際特許分類】
G10K 15/04 20060101AFI20241021BHJP
G10L 15/00 20130101ALI20241021BHJP
G10L 15/10 20060101ALI20241021BHJP
【FI】
G10K15/04 302D
G10L15/00 200B
G10L15/10 200W
(21)【出願番号】P 2021057114
(22)【出願日】2021-03-30
【審査請求日】2024-01-22
(73)【特許権者】
【識別番号】390004710
【氏名又は名称】株式会社第一興商
(74)【代理人】
【識別番号】100111202
【氏名又は名称】北村 周彦
(74)【代理人】
【識別番号】100150304
【氏名又は名称】溝口 勉
(72)【発明者】
【氏名】野村 直孝
【審査官】堀 洋介
(56)【参考文献】
【文献】特開2006-276550(JP,A)
【文献】特開平08-044380(JP,A)
【文献】特開2012-108414(JP,A)
【文献】特開2017-049285(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10K 15/04
G10L 15/00-15/34
(57)【特許請求の範囲】
【請求項1】
楽曲の演奏前に入力された歌唱者のナレーションを録音する録音手段と、
音声認識処理によってナレーションに含まれるワードを特定する特定手段と、
前記特定手段に特定されたワードと楽曲の歌詞データに含まれる所定ワード及び/又は楽曲の曲調を表現した所定ワードの比較結果に基づいてナレーションを評価する評価手段と、
ナレーションの評価結果が登録条件を満たすか否かを判定する判定手段と、
登録条件を満たしたナレーションの録音データを楽曲の楽曲識別子に対応付けて登録する登録手段と、
楽曲の予約時にナレーション再生が指示された場合に、当該楽曲の楽曲識別子に対応付けられたナレーションの録音データのうち選択条件を満たす録音データを選択する選択手段と、
前記選択手段に選択されたナレーションの録音データを楽曲の演奏前に再生する再生手段と、を備えていることを特徴とするカラオケシステム。
【請求項2】
前記登録手段は、登録条件を満たしたナレーションの録音データとナレーションの評価結果を楽曲の楽曲識別子に対応付けて登録し、
前記選択手段は、楽曲の予約時にナレーション再生が指示された場合に、当該楽曲を予約した歌唱者の歌唱音声の採点履歴に応じたナレーションの評価基準を選択条件とし、当該楽曲の楽曲識別子に対応付けられたナレーションの録音データのうち、ナレーションの評価基準を満たす評価結果の録音データを選択することを特徴とする請求項1に記載のカラオケシステム。
【請求項3】
ナレーションの録音時間を計測する計測手段と、
演奏済み楽曲についてナレーションの録音又は再生の有無情報を演奏済み楽曲の演奏順に生成する生成手段と、を備え、
前記登録手段は、登録条件を満たしたナレーションの録音データと当該ナレーションの録音時間を楽曲の楽曲識別子に対応付けて登録し、
前記選択手段は、楽曲の予約時にナレーション再生が指示された場合に、有無情報に応じたナレーションの適正再生時間を選択条件とし、当該楽曲の楽曲識別子に対応付けられたナレーションの録音データのうち、ナレーションの適正再生時間に収まる録音時間の録音データを選択することを特徴とする請求項1又は請求項2に記載のカラオケシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、カラオケシステムに関する。
【背景技術】
【0002】
カラオケ装置の利用場面では、予約楽曲の歌唱前に司会者のナレーションが入ることによって、歌謡ショーのような臨場感が醸し出されて歌唱者の歌唱意欲が高められる。このため、カラオケ装置として、予約楽曲の演奏前にナレーションを自動的に入れるものが提案されている(例えば、特許文献1参照)。特許文献1に記載のカラオケ装置には、演奏内容に応じたナレーションの音声データが記憶されている。演奏開始前に予約楽曲に付与されたジャンル等の属性情報から歌唱内容が分析され、予約楽曲に最適なナレーションが選択されて再生されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、歌唱前に歌唱者自身が楽曲の説明等のナレーションを行うことがある。ナレーションの上手さによっては、ライブのような臨場感が得られ、曲調や歌詞情報が事前に同席者に伝わって雰囲気が盛り上がる。ナレーションが苦手な歌唱者にとっては自動的にナレーションが入ることが好ましいが、特許文献1のような機械的なナレーションでは雰囲気が十分に盛り上がらない場合がある。
【0005】
本発明の目的は、ナレーションが苦手な歌唱者であっても、個性的なナレーションによって雰囲気を盛り上げることができるカラオケシステムを提供することである。
【課題を解決するための手段】
【0006】
上記目的を達成するための主たる発明は、楽曲の演奏前に入力された歌唱者のナレーションを録音する録音手段と、音声認識処理によってナレーションに含まれるワードを特定する特定手段と、前記特定手段に特定されたワードと楽曲の歌詞データに含まれる所定ワード及び/又は楽曲の曲調を表現した所定ワードの比較結果に基づいてナレーションを評価する評価手段と、ナレーションの評価結果が登録条件を満たすか否かを判定する判定手段と、登録条件を満たしたナレーションの録音データを楽曲の楽曲識別子に対応付けて登録する登録手段と、楽曲の予約時にナレーション再生が指示された場合に、当該楽曲の楽曲識別子に対応付けられたナレーションの録音データのうち選択条件を満たす録音データを選択する選択手段と、前記選択手段に選択されたナレーションの録音データを楽曲の演奏前に再生する再生手段と、を備えているカラオケシステムである。
【発明の効果】
【0007】
本発明によれば、ナレーションから特定されたワードと楽曲の歌詞データに含まれる所定ワードや楽曲の曲調を表現した所定ワードが比較される。ナレーションの内容が歌詞や曲調に合っているか否かによってナレーションが評価され、高評価のナレーションの録音データが登録される。楽曲の予約時にナレーション再生が指示された場合に、選択条件を満たすナレーションの録音データが再生される。よって、ナレーションが苦手な歌唱者であっても、他の歌唱者の個性的なナレーションによって歌唱前に場の雰囲気を盛り上げることができる。
【図面の簡単な説明】
【0008】
【
図1】第1実施形態のカラオケシステムの構成図である。
【
図2】第1実施形態のカラオケシステムの機能ブロック図である。
【
図3】ナレーションデータベース及び評価基準テーブルの一例である。
【
図4】第1実施形態のカラオケ装置の処理動作を示すフロー図である。
【
図5】第1実施形態のサーバ装置の処理動作を示すフロー図である。
【
図6】第2実施形態のカラオケシステムの機能ブロック図である。
【
図7】ナレーションデータベース、ナレーション履歴、適正時間テーブルの一例である。
【
図8】第2実施形態のカラオケ装置の処理動作を示すフロー図である。
【
図9】第2実施形態のサーバ装置の処理動作を示すフロー図である。
【発明を実施するための形態】
【0009】
<第1実施形態>
図1及び
図2を参照して、第1実施形態のカラオケシステムについて説明する。
図1は、第1実施形態のカラオケシステムの構成図である。
図2は、第1実施形態のカラオケシステムの機能ブロック図である。
図3は、ナレーションデータベース及び評価基準テーブルの一例である。なお、
図2の機能ブロック図には、説明の便宜上、特定処理を実現するための機能ブロックを図示しているが、カラオケシステムが通常備える構成については備えているものとする。
【0010】
図1に示すように、カラオケシステム10には、データセンタ等に設置されたサーバ装置30と、カラオケルーム等に設置された複数のカラオケ装置20と、が設けられている。サーバ装置30と複数のカラオケ装置20はネットワーク15を介して通信可能に接続されている。サーバ装置30には利用者ID及びパスワード等のログイン情報が管理されている。カラオケ装置20のリモコン装置19が操作されて、カラオケ装置20からサーバ装置30にログイン情報が送られることでカラオケシステム10へのログインが許可される。また、サーバ装置30には歌唱者の採点履歴やナレーションの録音データが管理されている。
【0011】
カラオケ装置20には、モニタ16と、スピーカ17と、マイクロフォン18と、リモコン装置19と、が接続されている。モニタ16は、カラオケ装置20からの映像信号等に基づいて背景映像と共に歌詞テロップ等を表示する。マイクロフォン18は、歌唱音声を歌唱音声信号に変換してカラオケ装置20に入力する。スピーカ17は、カラオケ装置20からの演奏音信号及びマイクロフォン18からの歌唱音声信号に基づいて演奏音と共に歌唱音声を放音する。リモコン装置19は、カラオケ装置20に対する楽曲の予約操作やログイン操作等の利用者による各種操作を受け付けている。
【0012】
カラオケ装置20によってカラオケ演奏が開始されると、カラオケ演奏に合わせて歌詞テロップと背景映像がモニタ16に表示される。カラオケ装置20ではカラオケ演奏の演奏音信号とマイクロフォン18から入力された歌唱音声信号がミキサによってミキシングされて、このミキシング信号がアンプによって増幅されてスピーカ17から放音される。このように、歌唱者がカラオケ演奏に合わせて歌唱すると、スピーカ17から演奏音と共に歌唱音声が放音される。また、カラオケ装置20によって歌唱者の歌唱音声が採点されて採点結果がモニタ16に表示される。
【0013】
図2に示すように、カラオケシステム10では、楽曲の演奏前に録音された歌唱者のナレーションが管理されており、別の歌唱者でも当該楽曲を予約すればナレーションの録音データが再生可能に構成されている。本実施形態のカラオケシステム10では、歌唱者の歌唱レベルにマッチしたナレーションの録音データが再生可能になっている。カラオケ装置20には、録音手段21と、特定手段22と、評価手段23と、演奏手段24と、判定手段25と、再生手段26と、が設けられている。サーバ装置30には、登録手段31と、選択手段32と、が設けられている。
【0014】
カラオケ装置20のメモリには、楽曲ID毎に楽曲データ等のカラオケ歌唱に関する各種データが記憶されている。楽曲データには、演奏音の元になる演奏データ、歌唱音声の採点基準となるリファレンスデータ、歌詞テロップの元になる歌詞データが含まれている。歌詞データに含まれる所定ワードはナレーションの評価基準として使用される。また、楽曲データには、楽曲の曲調を表現した所定ワードが設定されている。この曲調を表現した所定ワードは、楽曲の歌詞データに含まれる所定ワードと共にナレーションの評価基準として使用される。
【0015】
例えば、メジャーキーのメロディやコード、高音を多く含んだり、親しみやすい音階を含んだりする楽曲データには「明るい」、「賑やか」、「楽しい」等の所定ワードが設定されている。マイナーキーのメロディやコード、低音を多く含んだり、怪しげな音階を含んだりする楽曲データには「暗い」、「寂しい」、「辛い」等の所定ワードが設定されている。テンポが速かったり、音の使用数が多かったりする楽曲データには「慌しい」、「激しい」等の所定ワードが設定され、テンポが遅かったり、音の使用数が少なかったりする楽曲データには「のどか」、「穏やか」等の所定ワードが設定されている。
【0016】
また、カラオケ装置20は、楽曲の演奏中に歌唱音声のピッチと楽曲のリファレンスデータのピッチとの比較結果に基づいて歌唱音声を採点している。具体的には、メモリから楽曲データ内のリファレンスデータが読み出され、マイクロフォン18からカラオケ装置20に歌唱者の歌唱音声信号が入力される。リファレンスデータの各ノートのノートオン期間で、歌唱音声のピッチとノートのピッチが比較されて歌唱音声が採点される。歌唱音声の採点結果は利用者IDと共にカラオケ装置20からサーバ装置30に送信され、サーバ装置30の採点履歴データベースに蓄積されている。
【0017】
カラオケ装置20の録音手段21は、楽曲の演奏前に入力された歌唱者のナレーションを録音する。具体的には、演奏手段24によって楽曲の演奏が終了してから所定時間(例えば、10秒)が経過するまで次の予約楽曲の演奏が待機される。この演奏待機中の所定時間内にマイクロフォン18から音声が入力されると、録音手段21によってナレーションの録音が開始される。そして、次の予約楽曲の演奏開始と共に録音手段21によるナレーションの録音が終了される。録音手段21によってナレーションが録音されることで録音データが生成される。
【0018】
特定手段22は、音声認識処理によってナレーションに含まれるワードを特定する。具体的には、楽曲の演奏終了後から次の予約楽曲の演奏開始前の演奏待機中の所定時間内に、マイクロフォン18から入力された音声信号に音声認識処理が施されることで音声信号がテキスト化される。これにより、歌唱者のナレーションに応じたテキストデータが生成され、自然言語解析(形態素解析)によってテキストデータが品詞分解されて「愛しい」、「悲しい」等のワードが特定される。なお、音声認識処理及び自然言語解析には公知の技術を用いることができる。
【0019】
評価手段23は、特定手段22に特定されたワードと楽曲の歌詞データに含まれる所定ワード及び/又は楽曲の曲調を表現した所定ワードの比較結果に基づいてナレーションを評価する。具体的には、評価手段23によってメモリから楽曲データ内の歌詞データが読み出され、ナレーションから特定されたワードと楽曲の歌詞データに含まれる所定ワードとが比較される。歌詞データ内に「愛しい」、「悲しい」等のワードが含まれていた場合には、歌詞データに含まれたワード数が評価手段23によってカウントされることでナレーションが評価される。
【0020】
同様に、評価手段23によってメモリから楽曲の曲調を表現した所定ワードが読み出され、ナレーションから特定されたワードと楽曲の曲調を表現した所定ワードとが比較される。楽曲の曲調を表現した所定ワードに、「愛しい」、「悲しい」等のワードが含まれていた場合には、このワード数が評価手段23によってカウントされることでナレーションが評価される。楽曲の歌詞データに含まれる所定ワード及び楽曲の曲調を表現した所定ワードのいずれか一方又は両方がナレーションの評価に用いられる。次の予約楽曲の演奏開始と共に評価手段23によるナレーションの評価が終了される。
【0021】
演奏手段24は、歌唱者のナレーションの終了後に、演奏待ちの予約楽曲の演奏を開始する。具体的には、カラオケ装置20やリモコン装置19から演奏開始の指示コマンドが入力されたり、「それでは聞いて下さい」等の特定フレーズが音声入力されたりした場合に、演奏手段24によってナレーションの終了が検知される。そして、演奏手段24によってメモリから楽曲データ内の演奏データが読み出されて再生される。なお、演奏待機中の所定時間が経過するまでに、歌唱者からの音声入力が無かった場合には、ナレーション無しとして演奏手段24によって自動的に演奏待ちの予約楽曲の演奏が開始される。
【0022】
判定手段25は、ナレーションの評価結果が登録条件を満たすか否かを判定する。具体的には、基準ワード数(例えば8)以上のワード数が評価手段23にカウントされることが登録条件になっている。評価手段23にカウントされたワード数が基準ワード数以上(例えば10)の場合に登録条件を満たすと判定され、評価手段23にカウントされたワード数が基準ワード数未満(例えば6)の場合に登録条件を満たさないと判定される。登録条件を満たしたナレーションの録音データは、ナレーションの評価結果と楽曲ID(楽曲識別子)と共にサーバ装置30に向けて送信される。
【0023】
サーバ装置30の登録手段31は、登録条件を満たしたナレーションの録音データとナレーションの評価結果を楽曲IDに対応付けてナレーションデータベースに登録する。ナレーションデータベースには、カラオケ装置20から送信されたナレーションの録音データ、ナレーションの評価結果が楽曲ID毎に蓄積されている。ナレーションの録音データは音声ファイルであるため、ナレーションデータベースには音声ファイル名や音声ファイルの格納先を示すパス情報が登録されていてもよい。ナレーションの評価結果としては、評価手段23にカウントされたワード数が登録されている。
【0024】
図3(A)に示すナレーションデータベースでは、同じ楽曲ID****B1に3つのナレーションの録音データと評価結果が対応付けられている。1行目の楽曲ID****B1に録音データID****N1.MP3とワード数「10」が対応付けられている。2行目の楽曲ID****B1に録音データID****N2.MP3とワード数「16」が対応付けられている。3行目の楽曲ID****B1に録音データID****N3.MP3とワード数「22」が対応付けられている。4行目の楽曲ID****C1に録音データID****N4.MP3とワード数「9」が対応付けられている。
【0025】
選択手段32は、楽曲の予約時にナレーション再生が指示された場合に、楽曲IDに対応付けられたナレーションの録音データのうち、選択条件を満たす録音データを選択する。本実施形態では、楽曲を予約した歌唱者の歌唱音声の採点履歴に応じたナレーションの評価基準が選択条件に設定されている。楽曲IDに対応付けられたナレーションの録音データのうち、選択手段32によってナレーションの評価基準を満たす評価結果の録音データが選択される。これにより、歌唱者の歌唱レベルに応じたナレーションの録音データが選択される。
【0026】
例えば、利用者U1によってリモコン装置19が操作されて、ログイン中の利用者のアイコンの中から自分のアイコンが選択された後に楽曲B1が検索される。リモコン装置19には、楽曲B1の曲名、歌手名、歌い出し、予約指示用のアイコンを含む詳細画面が表示される。このとき、リモコン装置19によってサーバ装置30に対して、楽曲B1のナレーションの録音データがナレーションデータベースに登録されているか否かが問い合わせされる。サーバ装置30から登録有りの回答があると、詳細画面に「ナレーションあり。再生しますか?」の文字列と「はい」、「いいえ」のアイコンが表示される。
【0027】
利用者によって「はい」のアイコンがタッチされ、楽曲B1の予約指示用のアイコンがタッチされると、リモコン装置19からカラオケ装置20にナレーション再生フラグ、楽曲B1の楽曲ID****B1、利用者U1の利用者ID****U1が予約信号として送信される。カラオケ装置20がリモコン装置19から予約信号を受信すると、楽曲ID****B1、利用者ID****U1にナレーション再生フラグが対応付けられて予約リストに登録される。カラオケ装置20の演奏手段24によって予約リストから登録順に楽曲のカラオケ演奏が実施される。
【0028】
楽曲ID****B1、利用者ID****U1が予約リストの先頭になると、ナレーション再生フラグに基づいてカラオケ装置20からサーバ装置30に楽曲ID****B1、利用者ID****U1を含むナレーション配信要求が送信される。サーバ装置30がナレーション配信要求を受信すると、選択手段32によって採点履歴データベースが参照されて、利用者ID****U1の採点履歴が抽出されて採点履歴の平均値が算出される。サーバ装置30には、歌唱音声の採点履歴とナレーションの評価基準を対応付けた評価基準テーブルが設けられている。
【0029】
図3(B)に示す評価基準テーブルには、採点履歴の平均値の範囲とナレーションの評価基準が対応付けられている。採点履歴の平均値「90以上」に評価基準「ワード数22以上」が対応付けられている。採点履歴の平均値「80以上90未満」に評価基準「ワード数18以上22未満」が対応付けられている。採点履歴の平均値「70以上80未満」に評価基準「ワード数14以上18未満」が対応付けられている。採点履歴の平均値「60以上70未満」に評価基準「ワード数10以上14未満」が対応付けられている。採点履歴の平均値「60未満」に評価基準「ワード数10未満」が対応付けられている。
【0030】
利用者ID****U1の採点履歴の平均値が76.5であったときには、選択手段32によって評価基準テーブルが参照されて、ナレーションの評価基準「ワード数14以上18未満」が設定される。そして、選択手段32によってナレーションデータベースが参照されて、3つの楽曲ID****B1に対応付けられた録音データID****N1.MP3、ID****N2.MP3、ID****N3.MP3のうちワード数「16」に対応付けられたID****N2.MP3が選択される。そして、サーバ装置30からカラオケ装置20にID****N2.MP3が配信される。
【0031】
このように、楽曲の予約時にナレーション再生が指示されると、カラオケ装置20からサーバ装置30にナレーション配信要求が送信される。サーバ装置30では、選択手段32によって評価基準テーブルが参照されて、楽曲を予約した歌唱者の歌唱音声の採点履歴の平均値からナレーションの評価基準が設定される。また、選択手段32によってナレーションデータベースが参照されて、予約された楽曲のナレーションの録音データのうち、ナレーションの評価基準を満たした録音データが選択される。選択手段32に選択されたナレーションの録音データがサーバ装置30からカラオケ装置20に配信される。
【0032】
カラオケ装置20の再生手段26は、選択手段32に選択されたナレーションの録音データを楽曲の演奏前に再生する。具体的には、サーバ装置30からナレーションの録音データが配信されると、再生手段26によってナレーションの録音データが楽曲ID、利用者IDに対応付けられてメモリに記憶される。予約リスト内の楽曲ID(例えば楽曲ID****B1)、利用者ID(例えば利用者ID****U1)にナレーション再生フラグが対応付けられていると、楽曲の演奏前にナレーションの録音データ(例えばID****N2.MP3)が再生される。
【0033】
なお、カラオケ装置20及びサーバ装置30の各種処理は、プロセッサを用いてソフトウェアによって実現されてもよいし、集積回路等に形成された論理回路(ハードウェア)によって実現されてもよい。プロセッサを用いる場合には、プロセッサがメモリに記憶されているプログラムを読み出して実行することで各種処理が実施される。プロセッサとしては、例えば、CPU(Central Processing Unit)が使用される。また、メモリは、用途に応じてROM(Read Only Memory)、RAM(Random Access Memory)等の一つ又は複数の記憶媒体によって構成されている。
【0034】
図4及び
図5を参照して、第1実施形態のカラオケシステムの処理動作について説明する。
図4は、第1実施形態のカラオケ装置の処理動作を示すフロー図である。
図5は、第1実施形態のサーバ装置の処理動作を示すフロー図である。なお、ここでは、
図2の符号を適宜使用して説明する。また、以下の処理動作は一例に過ぎず、適宜変更が可能である。
【0035】
図4に示すように、カラオケ装置20では、先行楽曲のカラオケ演奏が終了すると、後続楽曲のカラオケ演奏の開始前の所定時間内に録音手段21によってナレーションの録音が開始される(ステップS01)。ナレーションの録音が開始されると、特定手段22によってナレーションに音声認識処理等が施され、ナレーションに応じたテキストデータからワードが特定される(ステップS02)。歌唱者によるリモコン装置19の操作や音声入力に応じて後続楽曲のカラオケ演奏が開始されると(ステップS03)、録音手段21によるナレーションの録音が終了される(ステップS04)。
【0036】
ナレーションの録音が終了すると、特定手段22に特定されたワードに一致する歌詞データ内の所定ワードや曲調を表現した所定ワードのワード数が評価手段23にカウントされてナレーションが評価される(ステップS05)。次に、判定手段25によってナレーションの評価結果が登録条件を満たすか否かが判定される(ステップS06)。評価手段23にカウントされたワード数が基準ワード数未満の場合には、判定手段25によって登録条件を満たさないと判定されて(ステップS06でNo)、ステップS08に処理が移行する。
【0037】
評価手段23にカウントされたワード数が基準ワード数以上の場合には、判定手段25によって登録条件を満たすと判定される(ステップS06でYes)。登録条件を満たしたナレーションの録音データは、ナレーションの評価結果と楽曲IDと共にサーバ装置30へ送信される(ステップS07)。サーバ装置30のナレーションデータベースには、楽曲IDに対応付けてナレーションの録音データとナレーションの評価結果が登録される。カラオケ演奏が終了すると(ステップS08)、予約リストの登録楽曲がなくなるまでステップS01-S08までの処理が繰り返される(ステップS09)。
【0038】
図5に示すように、サーバ装置30がカラオケ装置20からナレーション配信要求を受信すると(ステップS11でYes)、選択手段32によって採点履歴データベースが参照されて歌唱者の採点履歴の平均値が算出される(ステップS12)。この場合、ナレーション配信要求に含まれる利用者IDに基づいて、採点履歴データベースから利用者IDに対応付けられた採点履歴が抽出されることで平均値が算出される。次に、選択手段32によって評価基準テーブルが参照されて、採点履歴の平均値に応じたナレーションの評価基準が設定される(ステップS13)。
【0039】
次に、選択手段32によってナレーションデータベースが参照されて、ナレーションデータベースに登録されたナレーションの録音データのうち、評価基準を満たした録音データが選択される(ステップS14)。この場合、ナレーション配信要求に含まれる楽曲IDに基づいて、ナレーションデータベースから全てのナレーションの録音データが抽出され、各ナレーションの評価結果と評価基準が比較されることで録音データが選択される。そして、ナレーションの録音データがカラオケ装置20へ配信され(ステップS15)、カラオケ装置20では楽曲演奏の開始前に録音データが再生される。
【0040】
以上、第1実施形態によれば、ナレーションから特定されたワードと楽曲の歌詞データに含まれる所定ワードや楽曲の曲調を表現した所定ワードが比較される。ナレーションの内容が歌詞や曲調に合っているか否かによってナレーションが評価され、高評価のナレーションの録音データが登録される。楽曲の予約時にナレーション再生が指示された場合に、選択条件を満たすナレーションの録音データが再生される。よって、ナレーションが苦手な歌唱者であっても、他の歌唱者の個性的なナレーションによって歌唱前に場の雰囲気を盛り上げることができる。また、歌唱者の採点履歴に応じたナレーションの録音データが選択されるため、歌唱者の歌唱レベルにマッチしたナレーションを再生することができる。
【0041】
<第2実施形態>
次に、第2実施形態のカラオケシステムについて説明する。
図6は、第2実施形態のカラオケシステムの機能ブロック図である。
図7は、ナレーションデータベース、ナレーション履歴、適正時間テーブルの一例である。第2実施形態のカラオケシステムは、ナレーション時間に応じてナレーションの録音データを選択する点で第1実施形態のカラオケ装置と相違している。したがって、第2実施形態については第1実施形態と同様な構成については説明を省略する。
【0042】
図6に示すように、第2実施形態のカラオケシステム40では、カラオケ装置50とサーバ装置60が通信可能に接続されている。カラオケ装置50には、モニタ46と、スピーカ47と、マイクロフォン48と、リモコン装置49と、が接続されている。また、カラオケ装置50には、録音手段51と、特定手段52と、評価手段53と、演奏手段54と、判定手段55と、再生手段56と、計測手段57と、生成手段58と、が設けられている。サーバ装置60には、登録手段61と、選択手段62と、が設けられている。また、サーバ装置60では、ナレーションデータベースによってナレーションの録音データが管理されている。
【0043】
カラオケ装置50の計測手段57は、ナレーションの録音時間を計測する。具体的には、録音手段51によるナレーションの録音開始から録音終了までの録音時間が計測されている。判定手段55によってナレーションの評価結果が登録条件を満たすか否かが判定されると、登録条件を満たしたナレーションの録音データが録音時間と楽曲IDと共にカラオケ装置50からサーバ装置60に送信される。すなわち、第2実施形態では、評価手段53に評価されたナレーションの評価結果の代わりに、計測手段57に計測されたナレーションの録音時間が送信される。
【0044】
サーバ装置60の登録手段61は、登録条件を満たしたナレーションの録音データとナレーションの録音時間を楽曲ID毎にナレーションデータベースに登録する。
図7(A)に示すナレーションデータベースでは、1行目の楽曲ID****B1に録音データID****N1.MP3と録音時間「62秒」が対応付けられている。2行目の楽曲ID****B1に録音データID****N2.MP3と録音時間「48秒」が対応付けられている。3行目の楽曲ID****B1に録音データID****N3.MP3と録音時間「22秒」が対応付けられている。4行目の楽曲ID****C1に録音データID****N4.MP3と録音時間「18秒」が対応付けられている。
【0045】
カラオケ装置50の生成手段58は、演奏済み楽曲についてナレーションの録音又は再生の有無情報を演奏済み楽曲の演奏順に生成する。具体的には、生成手段58によってナレーションの録音又は再生の有無、すなわちナレーションの有無が演奏順序に対応付けられてナレーション履歴が生成される。演奏済み楽曲についてナレーションがあった場合には、生成手段58によって当該楽曲の演奏順序に有無情報として「有り」が対応付けられる。演奏済み楽曲についてナレーションがない場合には、生成手段58によって当該楽曲の演奏順序に有無情報として「無し」が対応付けられる。
【0046】
例えば、
図7(B)に示すナレーション履歴には、現在の楽曲を基準にして何曲前に演奏された楽曲であるかを示す演奏順序と、各楽曲に対するナレーションの有無情報とが対応付けられている。現在までに既に3曲が歌唱されており、1曲前及び2曲前の歌唱ではナレーション有りと判定され、3曲前の歌唱ではナレーション無しと判定されている。なお、ナレーション履歴は、現在までに演奏された全ての楽曲について生成されてもよいし、現在の楽曲を基準にして所定数曲前(例えば、5曲前)までの楽曲について更新されながら生成されてもよい。
【0047】
選択手段62は、楽曲の予約時にナレーション再生が指示された場合に、楽曲IDに対応付けられたナレーションの録音データのうち、選択条件を満たす録音データを選択する。本実施形態では、ナレーションの有無情報に応じたナレーションの適正再生時間が選択条件に設定されている。楽曲IDに対応付けられたナレーションの録音データのうち、選択手段62によってナレーションの適正再生時間に収まる録音時間の録音データが選択される。これにより、場の雰囲気を考慮した適正な長さのナレーションの録音データが選択される。
【0048】
例えば、利用者U1によってリモコン装置49が操作されて、リモコン装置49からカラオケ装置50にナレーション再生フラグ、楽曲B1の楽曲ID****B1、利用者U1の利用者ID****U1が予約信号として送信される。カラオケ装置50がリモコン装置49から予約信号を受信すると、楽曲ID****B1、利用者ID****U1にナレーション再生フラグが対応付けられて予約リストに登録される。カラオケ装置50の演奏手段54によって予約リストから登録順に楽曲のカラオケ演奏が実施されて、カラオケ演奏の度に生成手段58によってナレーション履歴が更新される。
【0049】
楽曲ID****B1、利用者ID****U1が予約リストの先頭になると、ナレーション再生フラグに基づいてカラオケ装置50からサーバ装置60に楽曲ID****B1、利用者ID****U1、ナレーション履歴を含むナレーション配信要求が送信される。サーバ装置60がナレーション配信要求を受信すると、選択手段62によって適正時間テーブルが参照されることでナレーションの適正再生時間が設定される。適正時間テーブルには、現在の楽曲を基準にして2曲前までのナレーションの有無の組み合わせとナレーションの適正再生時間が対応付けられている。
【0050】
例えば、
図7(C)に示す適正時間テーブルでは、2曲前及び1曲前のナレーションの組み合わせ「無し」、「無し」には、適正再生時間「45秒以上」が対応付けられている。2曲前及び1曲前のナレーションの組み合わせ「有り」、「無し」には、適正再生時間「30秒以上45秒未満」が対応付けられている。2曲前及び1曲前のナレーションの組み合わせ「無し」、「有り」には、適正再生時間「15秒以上30秒以下」が対応付けられている。2曲前及び1曲前のナレーションの組み合わせ「有り」、「有り」には、適正再生時間「15秒未満」が対応付けられている。
【0051】
2曲連続してナレーションが無かった場合には、同席者が休憩したい状況であるから適正再生時間が長めに設定されてもよい。また、2曲連続してナレーションが有った場合には、同席者がナレーションを鬱陶しいと感じている状況であるから適正再生時間が短めに設定されてもよい。ここで、ナレーション履歴の2曲前、1曲前のナレーションの有無情報が「無し」、「有り」の組み合わせであった場合には、選択手段62によって適正時間テーブルが参照されて、ナレーションの適正再生時間として「15秒以上30秒未満」が設定される。
【0052】
そして、選択手段62によってナレーションデータベースが参照されて、3つの楽曲ID****B1に対応付けられた録音データID****N1.MP3、ID****N2.MP3、ID****N3.MP3のうち録音時間「22秒」に対応付けられたID****N3.MP3が選択される。そして、サーバ装置60からカラオケ装置50にID****N3.MP3が配信される。
【0053】
このように、楽曲の予約時にナレーション再生が指示されると、カラオケ装置50からサーバ装置60にナレーション配信要求が送信される。サーバ装置60では、選択手段62によって適正時間テーブルが参照されて、2曲前及び1曲前のナレーションの有無からナレーションの適正再生時間が設定される。また、選択手段62によってナレーションデータベースが参照されて、予約された楽曲のナレーションの録音データのうち、ナレーションの適正再生時間に収まる録音データが選択される。選択手段62に選択されたナレーションの録音データがサーバ装置60からカラオケ装置50に配信される。
【0054】
図8及び
図9を参照して、第2実施形態のカラオケシステムの処理動作について説明する。
図8は、第2実施形態のカラオケ装置の処理動作を示すフロー図である。
図9は、第2実施形態のサーバ装置の処理動作を示すフロー図である。なお、ここでは、
図6の符号を適宜使用して説明する。また、以下の処理動作は一例に過ぎず、適宜変更が可能である。
【0055】
図8に示すように、カラオケ装置50では、先行楽曲のカラオケ演奏が終了すると、後続楽曲のカラオケ演奏の開始前の所定時間内に録音手段51によるナレーションの録音が開始されると共に計測手段57による録音時間の計測が開始される(ステップS21)。ナレーションの録音が開始されると、特定手段52によってナレーションに音声認識処理等が施され、ナレーションに応じたテキストデータからワードが特定される(ステップS22)。歌唱者によるリモコン装置49の操作や音声入力に応じて後続楽曲のカラオケ演奏が開始されると(ステップS23)、録音手段51によるナレーションの録音及び計測手段57による録音時間の計測が終了される(ステップS24)。
【0056】
ナレーションの録音が終了すると、生成手段58によって有無情報が生成されてナレーション履歴が更新される(ステップS25)。特定手段52に特定されたワードに一致する歌詞データ内の所定ワードや曲調を表現した所定ワードのワード数が評価手段53にカウントされてナレーションが評価される(ステップS26)。次に、判定手段55によってナレーションの評価結果が登録条件を満たすか否かが判定される(ステップS27)。評価手段53にカウントされたワード数が基準ワード数未満の場合には、判定手段55によって登録条件を満たさないと判定されて(ステップS27でNo)、ステップS29に処理が移行する。
【0057】
評価手段53にカウントされたワード数が基準ワード数以上の場合には、判定手段55によって登録条件を満たすと判定される(ステップS27でYes)。登録条件を満たしたナレーションの録音データは、ナレーションの録音時間と楽曲IDと共にサーバ装置60へ送信される(ステップS28)。サーバ装置60のナレーションデータベースには、楽曲IDに対応付けてナレーションの録音データとナレーションの録音時間が登録される。カラオケ演奏が終了すると(ステップS29)、予約リストの登録楽曲がなくなるまでステップS21-S29までの処理が繰り返される(ステップS30)。
【0058】
図9に示すように、サーバ装置60がカラオケ装置50からナレーション配信要求を受信すると(ステップS31でYes)、選択手段62によってナレーション配信要求に含まれるナレーション履歴が抽出される(ステップS32)。例えば、ナレーション履歴には、現在の楽曲を基準にして所定数曲前(例えば2曲前)までのナレーションの有無情報が含まれている。次に、選択手段62によって適正時間テーブルが参照されて、ナレーション履歴内の有無情報に応じたナレーションの適正再生時間が設定される(ステップS33)。
【0059】
次に、選択手段62によってナレーションデータベースが参照されて、ナレーションデータベースに登録されたナレーションの録音データのうち、ナレーションの適正再生時間に収まる録音データが選択される(ステップS34)。この場合、ナレーション配信要求に含まれる楽曲IDに基づいて、ナレーションデータベースから全てのナレーションの録音データが抽出され、各ナレーションの録音時間と適正再生時間が比較されることで録音データが選択される。そして、ナレーションの録音データがカラオケ装置50へ配信され(ステップS35)、カラオケ装置50では楽曲演奏の開始前に録音データが再生される。ナレーションの再生が終了すると、生成手段58によって有無情報が生成されてナレーション履歴が更新される。
【0060】
以上、第2実施形態によれば、ナレーションが苦手な歌唱者であっても、他の歌唱者の個性的なナレーションによって歌唱前に場の雰囲気を盛り上げることができる。また、適正な再生時間のナレーションの録音データが選択されるため、場の雰囲気を考慮した適正な長さのナレーションを再生することができる。
【0061】
なお、第1実施形態ではナレーションの評価基準が選択条件に設定され、第2実施形態ではナレーションの適正再生時間が選択条件に設定されたが、選択条件はナレーションの録音データを選択可能な条件であれば特に限定されない。例えば、最も高評価のナレーションであること、録音時間が最も長いナレーションであることが選択条件として設定されてもよい。さらに、単一の選択条件に限定されずに、複数の選択条件が設定されていてもよい。例えば、楽曲を予約した歌唱者の歌唱音声の採点履歴に応じた評価基準を満たすナレーションであること、且つ、有無情報に応じた適正再生時間に収まる録音時間であるナレーションであることが選択条件として設定されてもよい。また、例えば、最も高評価のナレーションであること、且つ、録音時間が最も長いナレーションであることが選択条件として設定されてもよい。
【0062】
また、第1実施形態では登録手段がナレーションの録音データと評価結果を楽曲IDに対応付けて登録し、第2実施形態では登録手段がナレーションの録音データと録音時間を楽曲IDに対応付けて登録したが、登録手段はナレーションの録音データと共に複数の情報を楽曲IDに対応付けて登録してもよい。例えば、登録手段は、ナレーションの録音データ、評価結果、録音時間を楽曲IDに対応付けて登録してもよい。
【0063】
また、第1、第2実施形態では、カラオケシステムがカラオケ装置及びサーバ装置を備えているが、カラオケシステムはカラオケ装置を備えていればよい。すなわち、カラオケ装置が、サーバ装置の代わりにナレーションの録音データの登録や録音データの選択を実施してもよい。
【0064】
また、各実施形態及び変形例において、カラオケシステムにプログラムをインストールすることによって、カラオケシステムに対してナレーションの録音機能及び再生機能が追加されてもよい。このプログラムは記憶媒体に記憶されている。記憶媒体は特に限定されないが、光ディスク、光磁気ディスク、フラッシュメモリ等の非一過性の記憶媒体であってもよい。
【0065】
また、本実施形態を説明したが、他の実施形態として、上記実施形態及び変形例を全体的又は部分的に組み合わせたものでもよい。
【0066】
また、本発明の技術は上記の実施形態に限定されるものではなく、技術的思想の趣旨を逸脱しない範囲において様々に変更、置換、変形されてもよい。さらには、技術の進歩又は派生する別技術によって、技術的思想を別の仕方によって実現することができれば、その方法を用いて実施されてもよい。したがって、特許請求の範囲は、技術的思想の範囲内に含まれ得る全ての実施態様をカバーしている。
【符号の説明】
【0067】
10、40:カラオケシステム
21、51:録音手段
22、52:特定手段
23、53:評価手段
25、55:判定手段
26、56:再生手段
31、61:登録手段
32、62:選択手段
57 :計測手段
58 :生成手段