IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社第一興商の特許一覧

<>
  • 特許-カラオケ装置 図1
  • 特許-カラオケ装置 図2
  • 特許-カラオケ装置 図3
  • 特許-カラオケ装置 図4
  • 特許-カラオケ装置 図5
  • 特許-カラオケ装置 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-06
(45)【発行日】2024-12-16
(54)【発明の名称】カラオケ装置
(51)【国際特許分類】
   G10K 15/04 20060101AFI20241209BHJP
   G10L 15/10 20060101ALI20241209BHJP
   G10L 25/51 20130101ALI20241209BHJP
【FI】
G10K15/04 302D
G10L15/10 200W
G10L25/51 100
G10L15/10 500Z
【請求項の数】 2
(21)【出願番号】P 2021029588
(22)【出願日】2021-02-26
(65)【公開番号】P2022130930
(43)【公開日】2022-09-07
【審査請求日】2024-01-22
(73)【特許権者】
【識別番号】390004710
【氏名又は名称】株式会社第一興商
(74)【代理人】
【識別番号】100111202
【弁理士】
【氏名又は名称】北村 周彦
(74)【代理人】
【識別番号】100150304
【弁理士】
【氏名又は名称】溝口 勉
(72)【発明者】
【氏名】関森 英雄
【審査官】堀 洋介
(56)【参考文献】
【文献】特開2012-108414(JP,A)
【文献】特開平11-296182(JP,A)
【文献】特開2017-058527(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10K 15/00-15/12
G10L 15/00-15/34
G10L 25/51
(57)【特許請求の範囲】
【請求項1】
楽曲演奏前の所定時間内の音声入力に応じてナレーション音声が入力されたか否かを判定する判定手段と、
ナレーション音声が入力された場合に、音声認識処理によってナレーション音声からワードを特定する特定手段と、
前記特定手段に特定されたワードと一致する楽曲の歌詞データ内の所定ワードのワード数及び/又は前記特定手段に特定されたワードと一致する楽曲の曲調を表現した所定ワードのワード数からナレーション音声を評価するナレーション評価手段と、
ナレーション音声の終了を検知することで楽曲の演奏を開始する演奏手段と、
歌唱音声の音高と楽曲のリファレンスデータに含まれるノートの音高との比較結果に基づいて歌唱音声を評価する歌唱評価手段と、
ナレーション音声の評価と歌唱音声の評価に基づいて総合評価を表示する表示手段と、を備えていることを特徴とするカラオケ装置。
【請求項2】
前記判定手段の判定結果に基づいてナレーション音声の入力の有無情報を楽曲の演奏順に生成する生成手段と、
前記生成手段に生成された有無情報に基づいてナレーション音声の適正時間を設定する設定手段と、
ナレーション音声の入力開始から楽曲の演奏開始までのナレーション実時間を計測する計測手段と、
ナレーション実時間とナレーション適正時間との比較結果に基づいてナレーション時間を評価するナレーション時間評価手段と、を備え、
前記表示手段は、ナレーション音声の評価とナレーション時間の評価と歌唱音声の評価に基づいて総合評価を表示することを特徴とする請求項1に記載のカラオケ装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、カラオケ装置に関する。
【背景技術】
【0002】
カラオケ装置の利用場面では、予約楽曲の歌唱前に司会者のナレーションが入ることによって、歌唱ショーのような臨場感が醸し出されて歌唱者の歌唱意欲が高められる。このため、カラオケ装置として、予約楽曲の演奏前にナレーションを自動的に入れるものが提案されている(例えば、特許文献1参照)。特許文献1に記載のカラオケ装置には、演奏内容に応じたナレーションの音声データが記憶されている。演奏開始前に予約楽曲に付与されたジャンル等の属性情報から歌唱内容が分析され、予約楽曲に最適なナレーションが選択されて再生されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開平11-167388号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、歌唱前に歌唱者自身が楽曲の説明等のナレーションを行うことがある。このナレーションの上手さによっては、ライブのような臨場感が得られ、曲調や歌詞情報が事前に同席者に伝わって雰囲気が盛り上がる。このため、歌唱力を評価するだけではなく、歌唱者のナレーションの技量も評価することが望ましい。
【0005】
本発明の目的は、歌唱者自身が語ったナレーションの内容を歌唱者の歌唱評価に反映させることができるカラオケ装置を提供することである。
【課題を解決するための手段】
【0006】
上記目的を達成するための主たる発明は、楽曲演奏前の所定時間内の音声入力に応じてナレーション音声が入力されたか否かを判定する判定手段と、ナレーション音声が入力された場合に、音声認識処理によってナレーション音声からワードを特定する特定手段と、前記特定手段に特定されたワードと一致する楽曲の歌詞データ内の所定ワードのワード数及び/又は前記特定手段に特定されたワードと一致する楽曲の曲調を表現した所定ワードのワード数からナレーション音声を評価するナレーション評価手段と、ナレーション音声の終了を検知することで楽曲の演奏を開始する演奏手段と、歌唱音声の音高と楽曲のリファレンスデータに含まれるノートの音高との比較結果に基づいて歌唱音声を評価する歌唱評価手段と、ナレーション音声の評価と歌唱音声の評価に基づいて総合評価を表示する表示手段と、を備えているカラオケ装置である。
【発明の効果】
【0007】
本発明によれば、楽曲演奏前に音声入力された場合に歌唱者によるナレーション音声の入力と判定され、ナレーション音声から特定されたワードと所定ワードからナレーション音声の内容が評価される。また、歌唱者の歌唱音声の音高と楽曲のノートの音高から歌唱音声が評価される。そして、ナレーション音声の評価と歌唱音声の評価から総合評価が求められる。よって、歌唱者の歌唱力だけでなく、歌唱者が語ったナレーションの内容も考慮してカラオケ歌唱を総合的に評価することができる。
【図面の簡単な説明】
【0008】
図1】第1実施形態のカラオケ装置の構成図である。
図2】第1実施形態のカラオケ装置の機能ブロック図である。
図3】第1実施形態のカラオケ装置の処理動作の一例を示すフロー図である。
図4】第3実施形態のカラオケ装置の機能ブロック図である。
図5】ナレーション履歴、適正時間テーブル、評価テーブルの一例を示す図である。
図6】第3実施形態のカラオケ装置の処理動作の一例を示すフロー図である。
【発明を実施するための形態】
【0009】
<第1実施形態>
図1及び図2を参照して、第1実施形態のカラオケ装置について説明する。図1は、第1実施形態のカラオケ装置の構成図である。図2は、第1実施形態のカラオケ装置の機能ブロック図である。なお、図2の機能ブロック図には、説明の便宜上、特定処理を実現するための機能ブロックを図示しているが、カラオケ装置が通常備える構成については備えているものとする。
【0010】
図1に示すように、カラオケ装置10には、装置本体11と、モニタ12と、スピーカ13と、マイクロフォン14と、リモコン装置15と、が設けられている。モニタ12は、装置本体11からの映像信号等に基づいて背景映像と共に歌詞テロップ等を表示する。マイクロフォン14は、歌唱音声を歌唱音声信号に変換して装置本体11に入力する。スピーカ13は、装置本体11からの演奏音信号及びマイクロフォン14からの歌唱音声信号に基づいて演奏音と共に歌唱音声を放音する。リモコン装置15は、装置本体11に対する楽曲予約等の利用者による各種操作を受け付けている。
【0011】
装置本体11によってカラオケ演奏が開始されると、カラオケ演奏に合わせて歌詞テロップと背景映像がモニタ12に表示される。装置本体11ではカラオケ演奏の演奏音信号とマイクロフォン14から入力された歌唱音声信号がミキサによってミキシングされて、このミキシング信号がアンプによって増幅されてスピーカ13から放音される。このように、歌唱者がカラオケ演奏に合わせて歌唱すると、スピーカ13から演奏音と共に歌唱音声が放音される。また、装置本体11によって歌唱者の歌唱力等が評価されて、歌唱者の評価結果がモニタ12に表示される。
【0012】
図2に示すように、装置本体11は、歌唱者の歌唱力を評価するだけでなく、歌唱者自身のナレーションの技量を評価するように構成されている。装置本体11には、記憶手段21と、判定手段22と、特定手段23と、ナレーション評価手段24と、演奏手段25と、歌唱評価手段26と、表示手段27と、が設けられている。記憶手段21には、楽曲ID毎に楽曲データ等のカラオケ歌唱に関する各種データが記憶されている。楽曲データには、演奏音の元になる演奏データ、歌唱音声の評価基準となるリファレンスデータ、歌詞テロップの元になると共にナレーション音声の評価基準になる歌詞データが含まれている。
【0013】
判定手段22は、楽曲演奏前の所定時間内の音声入力に応じてナレーション音声が入力されたか否かを判定する。具体的には、演奏手段25によって楽曲の演奏が終了してから所定時間(例えば、10秒)が経過するまで次の予約楽曲の演奏が待機される。この待機中の所定時間内にマイクロフォン14から判定手段22に音声信号が入力された場合には、判定手段22によってナレーション音声の入力有りと判定される。マイクロフォン14から判定手段22に音声信号が入力されずに所定時間が経過した場合には、判定手段22によってナレーション音声の入力無しと判定される。
【0014】
特定手段23は、ナレーション音声が入力された場合に、音声認識処理によってナレーション音声からワードを特定する。具体的には、ナレーション音声の入力有りと判定された時点から、マイクロフォン14から出力された音声信号に音声認識処理が施されることで音声信号がテキスト化される。これにより、歌唱者のナレーション音声に応じたテキストデータが生成され、自然言語解析(形態素解析)によってテキストデータが品詞分解されて「愛しい」、「悲しい」等のワードが特定される。なお、音声認識処理及び自然言語解析には公知の技術を用いることができる。
【0015】
ナレーション評価手段24は、特定手段23に特定されたワードと楽曲の歌詞データに含まれる所定ワードとの比較結果に基づいてナレーション音声を評価する。具体的には、ナレーション評価手段24によって記憶手段21から楽曲データ内の歌詞データが読み出され、ナレーション音声から特定されたワードと歌詞データ内の所定ワードとが比較される。歌詞データ内に「愛しい」、「悲しい」等のワードが含まれていた場合には、歌詞データに含まれたワード数がカウントされることでナレーション音声が評価される。例えば、ワード数が12であれば12点がナレーション音声の評価として算出される。
【0016】
演奏手段25は、ナレーション音声の終了を検知することで、演奏待ちの次の予約楽曲の演奏を開始する。具体的には、カラオケ装置10やリモコン装置15からの演奏開始の指示コマンドが入力されたり、「それでは聞いて下さい」等の特定フレーズが音声入力されたりした場合に、演奏手段25によってナレーション音声の終了が検知される。そして、演奏手段25によって記憶手段21から楽曲データ内の演奏データが読み出されて再生される。なお、判定手段22にナレーション音声の入力無しと判定された場合には、自動的に演奏待ちの次の予約楽曲の演奏が開始される。
【0017】
歌唱評価手段26は、歌唱音声の音高と楽曲のリファレンスデータに含まれるノートの音高との比較結果に基づいて歌唱音声を評価する。具体的には、歌唱評価手段26によって記憶手段21から楽曲データ内のリファレンスデータが読み出され、マイクロフォン14から歌唱評価手段26に歌唱者の歌唱音声信号が入力される。リファレンスデータの各ノートのノートオン期間で歌唱音声の音高とノートの音高が比較され、歌唱音声の音高とノートの音高の一致度に応じて、当該ノートに対する歌唱音声の合格・不合格が判定されて音高正確性を示す歌唱評価が行われる。
【0018】
より詳細には、特開2005-049410の記載の通り、サンプルタイミング毎(例えば、20ミリ秒毎)に歌唱周波数とリファレンス周波数が比較され、歌唱周波数とリファレンス周波数の差分(セント値)が算出される。ノートオン期間に差分が許容範囲内(例えば、±50セント以内)に入った回数が所定回数以上(例えば、1回以上)のノートは合格ノートと判定される。ノートオン期間に差分が許容範囲内に入った回数が所定回数未満のノートは不合格ノートと判定される。そして、歌唱すべき全ノート数が128であり、合格ノート数が96であれば75点が歌唱音声の評価として算出される。
【0019】
表示手段27は、ナレーション音声の評価と歌唱音声の評価に基づいて総合評価を表示する。例えば、ナレーション評価手段24によるナレーション音声の評価が12点であり、歌唱評価手段26による歌唱音声の評価が75点である場合には、ナレーション音声の評価と歌唱音声の評価が加算されて87点が総合評価としてモニタ12に表示される。これにより、歌唱者自身が語ったナレーションの内容を歌唱者の歌唱評価に反映させることができる。なお、表示手段27による総合評価の算出方法は、ナレーション音声の評価と歌唱音声の評価を加算して求める方法に限定されない。
【0020】
ナレーション評価手段24にカウントされたワード数から所定数が減算されてナレーション音声が評価され、このナレーション音声の評価と歌唱音声の評価が加算されて総合評価が求められてもよい。例えば、所定数として5が設定されており、ナレーション評価手段24にカウントされたワード数が1であるときには-4点がナレーション音声の評価として算出され、歌唱音声の評価の75点に-4点が加算されて71点が総合評価として算出される。これにより、歌唱者が語ったナレーションの内容が歌唱予定の楽曲に合わないときには総合評価が低くなる。判定手段22にナレーション音声の入力無しと判定された場合には、表示手段27は歌唱評価手段26の評価結果のみに基づいて総合評価をモニタ12に表示させる。
【0021】
なお、カラオケ装置10の各処理は、プロセッサを用いてソフトウェアによって実現されてもよいし、集積回路等に形成された論理回路(ハードウェア)によって実現されてもよい。プロセッサを用いる場合には、プロセッサがメモリに記憶されているプログラムを読み出して実行することで各種処理が実施される。プロセッサとしては、例えば、CPU(Central Processing Unit)が使用される。また、メモリは、用途に応じてROM(Read Only Memory)、RAM(Random Access Memory)等の一つ又は複数の記憶媒体によって構成されている。
【0022】
図3を参照して、第1実施形態のカラオケ装置の処理動作について説明する。図3は、第1実施形態のカラオケ装置の処理動作の一例を示すフロー図である。なお、ここでは、図2の符号を適宜使用して説明する。また、以下のフローは一例に過ぎず、特にナレーション音声の評価処理及び歌唱音声の評価処理の実施タイミングは適宜変更が可能である。
【0023】
図3に示すように、先行の楽曲演奏が終了すると、後続の楽曲演奏の開始前の所定時間内に判定手段22によって歌唱者の音声入力の有無が監視される(ステップS01)。音声入力がなかった場合には(ステップS01でNo)、判定手段22によってナレーション音声の入力無しと判定されてステップS04に処理が移行する。音声入力があった場合には(ステップS01でYes)、判定手段22によってナレーション音声の入力有りと判定される。特定手段23によってナレーション音声に音声認識処理等が施され、ナレーション音声に応じたテキストデータからワードが特定される(ステップS02)。
【0024】
次に、演奏手段25によってナレーション音声の終了が検知されると(ステップS03でYes)、演奏手段25によって楽曲のカラオケ演奏が開始される(ステップS04)。ナレーション音声の終了は、カラオケ装置10又はリモコン装置15からの演奏開始の指示コマンド又は歌唱者による演奏開始の指示が音声入力されたときに検知される。カラオケ演奏が開始されると、ナレーション評価手段24によるナレーション音声の評価処理と歌唱評価手段26による歌唱音声の評価処理が並行して実施される。ただし、判定手段22によってナレーション音声の入力無しと判定された場合には歌唱音声の評価処理のみが実施される。
【0025】
ナレーション音声の評価処理では、ナレーション評価手段24によって記憶手段21から楽曲の歌詞データが読み出され、特定手段23に特定されたワードと一致する歌詞データ内の所定ワードのワード数がカウントされてナレーション音声が評価される(ステップS05)。歌唱音声の評価処理では、歌唱評価手段26によって記憶手段21から楽曲のリファレンスデータが読み出され、リファレンスデータのノートの音高と歌唱音声の音高との比較結果に基づいて歌唱音声が評価される(ステップS06)。そして、演奏手段25によるカラオケ演奏が終了すると(ステップS07でYes)、表示手段27によってナレーション音声の評価と歌唱音声の評価に基づいて総合評価がモニタ12に表示される(ステップS08)。
【0026】
以上、第1実施形態によれば、楽曲演奏前に歌唱者による音声入力された場合にナレーション音声の入力と判定され、ナレーション音声から特定されたワードと歌詞データ内の所定ワードが比較される。これにより、ナレーションの内容が歌詞の内容に合っているか否かによってナレーション音声が評価される。また、歌唱者の歌唱音声の音高と楽曲のノートの音高から歌唱音声が評価される。そして、ナレーション音声の評価と歌唱音声の評価から総合評価が求められる。よって、歌唱者の歌唱力だけでなく、歌唱者が語ったナレーションの内容も考慮してカラオケ歌唱を総合的に評価され、ナレーションの内容を歌唱評価に反映させることができる。
【0027】
<第2実施形態>
次に、第2実施形態のカラオケ装置について説明する。第2実施形態のカラオケ装置は、ナレーションの内容が曲調に合っているか否かに基づいてナレーション音声を評価する点で第1実施形態のカラオケ装置と相違している。したがって、第2実施形態については第1実施形態と同様な構成については説明を省略する。また、ここでは、図2の符号を適宜使用して説明する。
【0028】
第2実施形態のカラオケ装置10の記憶手段21には、上記したように楽曲ID毎に楽曲データが記憶されている。この楽曲データには、演奏データ、リファレンスデータ、歌詞データの他にも、ナレーション音声の評価基準になる楽曲の曲調を表現した所定ワードが含まれている。すなわち、第2実施形態では歌詞データに含まれる所定ワードの代わりに、楽曲の曲調を表現した所定ワードがナレーション音声の評価処理に使用されている。この場合、楽曲のメロディ、コード、音高、テンポ、音数等に基づいて曲調を表現した所定ワードが設定される。
【0029】
例えば、メジャーキーのメロディやコード、高音を多く含んだり、親しみやすい音階を含んだりする楽曲データには「明るい」、「賑やか」、「楽しい」等の所定ワードが含まれている。マイナーキーのメロディやコード、低音を多く含んだり、怪しげな音階を含んだりする楽曲データには「暗い」、「寂しい」、「辛い」等の所定ワードが含まれている。テンポが速かったり、音の使用数が多かったりする楽曲データには「慌しい」、「激しい」等の所定ワードが含まれ、テンポが遅かったり、音の使用数が少なかったりする楽曲データには「のどか」、「穏やか」等の所定ワードが含まれている。
【0030】
なお、楽曲データには、楽曲の曲調を表現した所定ワードが含まれていなくてもよい。この場合、テンポ範囲に所定ワードが対応付けられたテーブルが用意されていてもよい。例えば、テンポ150~180には「疾走」、「スピード」等の所定ワードが対応付けられていてもよい。また、楽曲のマイナーコードとメジャーコードの割合に所定ワードが対応付けられたテーブルが用意されていてもよい。例えば、マイナーコード2:メジャーコード8には、「楽しい」、「爽やか」等の所定ワードが対応付けられていてもよい。そして、楽曲データのテンポやコード構成に基づいてテーブルから所定ワードが抽出されてもよい。
【0031】
ナレーション評価手段24は、特定手段23に特定されたワードと楽曲の曲調を表現した所定ワードとの比較結果に基づいてナレーション音声を評価する。具体的には、ナレーション音声から特定された「愛しい」、「悲しい」等のワードと楽曲の曲調を表現した所定ワードとが比較される。楽曲の曲調を表現した所定ワードに、「愛しい」、「悲しい」等のワードが含まれていた場合には、このワード数がカウントされることでナレーション音声が評価される。例えば、ワード数が12であれば12点がナレーション音声の評価として算出される。
【0032】
以上、第2実施形態によれば、ナレーション音声から特定されたワードと楽曲の曲調を表現した所定ワードが比較される。これにより、ナレーションの内容が曲調に合っているか否かによってナレーション音声が評価される。このナレーションの評価を歌唱評価に反映させてカラオケ歌唱を総合的に評価することができる。
【0033】
<第3実施形態>
次に、図4及び図5を参照して、第3実施形態のカラオケ装置について説明する。図4は、第3実施形態のカラオケ装置の機能ブロック図である。図5は、ナレーション履歴、適正時間テーブル、評価テーブルの一例を示す図である。第3実施形態のカラオケ装置は、歌唱音声の評価、ナレーション音声の評価に加えて、ナレーション時間を評価する点で第1実施形態のカラオケ装置と相違している。したがって、第3実施形態については第1実施形態と同様な構成については説明を省略する。
【0034】
図4に示すように、第3実施形態のカラオケ装置30には、第1実施形態のカラオケ装置10と同様に、装置本体31と、モニタ32と、スピーカ33と、マイクロフォン34と、リモコン装置35と、が設けられている。装置本体31には、記憶手段41と、判定手段42と、特定手段43と、ナレーション評価手段44と、演奏手段45と、歌唱評価手段46と、表示手段47と、が設けられている。さらに、装置本体31には、生成手段48と、設定手段49と、計測手段51と、ナレーション時間評価手段52と、が設けられている。さらに装置本体31には、後述するナレーション履歴、適正時間テーブル、評価テーブルが記憶されている。
【0035】
生成手段48は、判定手段42の判定結果に基づいてナレーション音声の入力の有無情報を楽曲の演奏順に生成する。具体的には、生成手段48によって判定手段42の判定結果が演奏順序に対応付けられてナレーション履歴が生成される。楽曲の演奏前に判定手段42によってナレーション音声の入力有りと判定されると、生成手段48によって当該楽曲の演奏順序に有無情報として「有り」が対応付けられる。楽曲の演奏前に判定手段42によってナレーション音声の入力無しと判定されると、生成手段48によって当該楽曲の演奏順序に有無情報として「無し」が対応付けられる。
【0036】
例えば、図5(A)に示すナレーション履歴には、現在の楽曲を基準にして何曲前に演奏された楽曲であるかを示す演奏順序と、各楽曲に対するナレーション音声の入力の有無情報とが対応付けられている。現在までに既に3曲の歌唱が行われており、1曲前及び2曲前の歌唱ではナレーション音声の入力が有りと判定され、3曲前の歌唱ではナレーション音声の入力が無しと判定されている。なお、ナレーション履歴は、現在までに演奏された全ての楽曲について生成されてもよいし、現在の楽曲を基準にして所定数曲前(例えば、5曲前)までの楽曲について更新されながら生成されてもよい。
【0037】
設定手段49は、生成手段48に生成された有無情報に基づいてナレーション音声の適正時間を設定する。具体的には、楽曲の演奏開始前に、設定手段49によって適正時間テーブルが参照されることでナレーション音声の適正時間が設定される。適正時間テーブルには、現在の楽曲を基準にして2曲前までのナレーション音声の入力の有無の組み合わせとナレーション適正時間が対応付けられている。このため、設定手段49によってナレーション履歴の2曲前までの有無情報と適正時間テーブルから、現在の楽曲に対するナレーション音声の適正時間が設定される。
【0038】
例えば、図5(B)に示す適正時間テーブルでは、2曲前及び1曲前のナレーションの組み合わせ「無し」、「無し」には、ナレーション適正時間60秒が対応付けられている。2曲前及び1曲前のナレーションの組み合わせ「有り」、「無し」には、ナレーション適正時間40秒が対応付けられている。2曲前及び1曲前のナレーションの組み合わせ「無し」、「有り」には、ナレーション適正時間20秒が対応付けられている。2曲前及び1曲前のナレーションの組み合わせ「有り」、「有り」には、ナレーション適正時間0秒が対応付けられている。
【0039】
2曲連続してナレーションが無かった場合には、同席者が休憩したい状況であるからナレーション適正時間が長めに設定されてもよい。また、2曲連続してナレーションが有った場合には、同席者がナレーションを鬱陶しいと感じている状況であるからナレーション適正時間が短めに設定されてもよい。ここで、ナレーション履歴の2曲前、1曲前のナレーション音声の有無情報が「無し」、「有り」の組み合わせであった場合には、設定手段49によって適正時間テーブルが参照されて、ナレーション適正時間として20秒が設定される。
【0040】
計測手段51は、ナレーション音声の入力開始から楽曲の演奏開始までのナレーション実時間を計測する。具体的には、判定手段42によってナレーション音声の入力有りと判定されてから演奏手段45によって演奏が開始されるまでのナレーション実時間が計測される。なお、ナレーション適正時間に基づいて最長ナレーション実時間が設定され、ナレーション音声の入力の終了が検知される前に、最長ナレーション実時間が経過したときに演奏手段45によって楽曲の演奏が開始されてもよい。この場合には、計測手段51によって最長ナレーション実時間がナレーション実時間として計測される。
【0041】
ナレーション時間評価手段52は、ナレーション実時間とナレーション適正時間との比較結果に基づいてナレーション時間を評価する。具体的には、ナレーション時間評価手段52によって評価テーブルが参照されることでナレーション時間が評価される。評価テーブルには、ナレーション適正時間に対するナレーション実時間の乖離率(誤差率)に評価値が対応付けられている。このため、ナレーション適正時間に対するナレーション実時間の乖離率が求められ、ナレーション実時間の乖離率と評価テーブルからナレーション時間が評価される。
【0042】
例えば、図5(C)に示す評価テーブルでは、乖離率「10%未満」には評価値「+5」が対応付けられ、乖離率「10%以上20%未満」には評価値「+2」が対応付けられている。乖離率「20%以上30%未満」には評価値「0」が対応付けられ、乖離率「30%未満」には評価値「-5」が対応付けられている。ここで、ナレーション適正時間が60秒、ナレーション実時間が52秒である場合には、乖離率が約13%になることからナレーション評価手段44によって評価値が+2と評価される。なお、乖離率は、(ナレーション適正時間-ナレーション実時間)/ナレーション適正時間×100で求められる。
【0043】
表示手段47は、ナレーション音声の評価とナレーション時間の評価と歌唱音声の評価に基づいて総合評価を表示する。例えば、ナレーション評価手段44によるナレーション音声の評価が8点であり、ナレーション時間評価手段52によるナレーション時間の評価が-5点であり、歌唱評価手段46による歌唱音声の評価が82点である場合には、それぞれを加算した85点が総合評価としてモニタ32に表示される。これにより、歌唱者自身が語ったナレーションの内容、場の雰囲気を考慮したナレーションの長さを歌唱者の歌唱評価に反映させることができる。
【0044】
図6を参照して、第3実施形態のカラオケ装置の処理動作について説明する。図6は、第3実施形態のカラオケ装置の処理動作の一例を示すフロー図である。なお、ここでは、図4の符号を適宜使用して説明する。また、カラオケ装置には、既に過去数回の演奏に対するナレーション履歴が生成されているものとする。さらに、以下のフローは一例に過ぎず、特にナレーション音声の評価処理、ナレーション時間の評価処理、歌唱音声の評価処理の実施タイミングは適宜変更が可能である。
【0045】
図6に示すように、先行の楽曲演奏が終了すると、後続の楽曲演奏の開始前の所定時間内に判定手段42によって歌唱者の音声入力の有無が監視される(ステップS11)。音声入力がなかった場合には(ステップS11でNo)、判定手段42によってナレーション音声の入力無しと判定されてステップS15に処理が移行する。音声入力があった場合には(ステップS11でYes)、判定手段42によってナレーション音声の入力有りと判定されて、計測手段51によって判定直後からナレーション実時間の計測が開始される(ステップS12)。
【0046】
次に、特定手段43によってナレーション音声に音声認識処理等が施され、ナレーション音声に応じたテキストデータからワードが特定される(ステップS13)。次に、演奏手段45によってナレーション音声の終了が検知されると(ステップS14でYes)、計測手段51によるナレーション実時間の計測が終了されると共に、演奏手段45によって楽曲のカラオケ演奏が開始される(ステップS15)。ナレーション音声の終了は、カラオケ装置30又はリモコン装置35からの演奏開始の指示コマンド又は歌唱者による演奏開始の指示が音声入力されたときに検知される。
【0047】
カラオケ演奏が開始されると、ナレーション評価手段44によるナレーション音声の評価処理、歌唱評価手段46による歌唱音声の評価処理、ナレーション時間評価手段52によるナレーション時間の評価処理が並行して実施される。ただし、判定手段42によってナレーション音声の入力無しと判定された場合には歌唱音声の評価処理のみが実施される。なお、この評価処理のタイミングで、さらに後続の楽曲演奏時にナレーション時間を評価するために、生成手段48によって今回の楽曲に対するナレーション履歴(ナレーション音声の入力の有無情報)が生成されてもよい。
【0048】
ナレーション音声の評価処理では、ナレーション評価手段44によって記憶手段41から楽曲の歌詞データが読み出され、特定手段43に特定されたワードと一致する歌詞データ内の所定ワードのワード数がカウントされてナレーション音声が評価される(ステップS16)。歌唱音声の評価処理では、歌唱評価手段46によって記憶手段41から楽曲のリファレンスデータが読み出され、リファレンスデータのノートの音高と歌唱音声の音高との比較結果に基づいて歌唱音声が評価される(ステップS17)。
【0049】
ナレーション時間の評価処理では、ナレーション時間評価手段52によってナレーション履歴から2曲前及び1曲前のナレーション音声の有無情報が読み出され、適正時間テーブルから楽曲に対するナレーション音声の適正時間が設定される(ステップS18)。次に、ナレーション時間評価手段52によってナレーション適正時間に対するナレーション実時間の乖離率が求められ、ナレーション実時間の乖離率と評価テーブルからナレーション時間が評価される(ステップS19)。そして、演奏手段45によるカラオケ演奏が終了すると(ステップS20でYes)、表示手段47によってナレーション音声の評価、歌唱音声の評価、ナレーション時間の評価に基づいて総合評価がモニタ32に表示される(ステップS21)。
【0050】
以上、第3実施形態によれば、楽曲の演奏順にナレーション音声の有無を示したナレーション履歴に基づいて、場の雰囲気に合ったナレーション音声の適正時間が求められ、ナレーション音声の実時間と適正時間からナレーションの適正な長さが評価される。歌唱者が語ったナレーションの内容やナレーションの適正な長さ歌唱評価に反映させてカラオケ歌唱を総合的に評価することができる。
【0051】
なお、ナレーション評価手段は、特定手段に特定されたワードと所定ワードとの比較結果に基づいてナレーション音声を評価する方法であれば評価方法は特に限定されない。例えば、ナレーション評価手段は、特定手段に特定されたワードと楽曲の歌詞データに含まれる所定ワードとの比較結果、特定手段に特定されたワードと楽曲の曲調を表現した所定ワードとの比較結果を組み合わせてナレーション音声を評価してもよい。これにより、歌唱者本人が語ったナレーションの内容をより詳細に評価することができる。
【0052】
また、表示手段は、ナレーション音声の評価、ナレーション時間の評価、歌唱音声の評価を個別に表示してもよい。これにより、歌唱者がナレーションの内容が適切であったか、場の雰囲気を考慮したナレーションであったかを把握することができる。
【0053】
また、各実施形態及び各変形例において、カラオケ装置にプログラムをインストールすることによって、カラオケ装置に対してナレーション音声及び/又はナレーション時間の評価機能がカラオケ装置に追加されてもよい。このプログラムは記憶媒体に記憶されている。記憶媒体は特に限定されないが、光ディスク、光磁気ディスク、フラッシュメモリ等の非一過性の記憶媒体であってもよい。
【0054】
また、本実施形態を説明したが、他の実施形態として、上記実施形態及び変形例を全体的又は部分的に組み合わせたものでもよい。
【0055】
また、本発明の技術は上記の実施形態に限定されるものではなく、技術的思想の趣旨を逸脱しない範囲において様々に変更、置換、変形されてもよい。さらには、技術の進歩又は派生する別技術によって、技術的思想を別の仕方によって実現することができれば、その方法を用いて実施されてもよい。したがって、特許請求の範囲は、技術的思想の範囲内に含まれ得る全ての実施態様をカバーしている。
【符号の説明】
【0056】
10、30:カラオケ装置
22、42:判定手段
23、43:特定手段
24、44:ナレーション評価手段
25、45:演奏手段
26、46:歌唱評価手段
27、47:表示手段
48 :生成手段
49 :設定手段
51 :計測手段
52 :ナレーション時間評価手段
図1
図2
図3
図4
図5
図6