(58)【調査した分野】(Int.Cl.,DB名)
カラオケ楽曲の歌詞である各単語の歌唱時間よりも短い時間となるように、歌唱採点の対象となる採点区間を設定し、各採点区間において歌唱採点値を算出する歌唱採点システムにおいて、
マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較して歌唱採点値を算出する歌唱採点手段と、
歌詞テロップ情報に基づき、子音が発生する採点区間を特定する子音採点区間特定手段と、
前記特定された子音採点区間において、前記入力された歌唱音声信号からピッチ検出を行うピッチ検出手段と、
前記ピッチ検出手段がピッチを検出できなかった時間が所定時間以上であるか否かを判定するピッチ検出判定手段と、
子音の発音態様を変更して歌唱する複数の特徴的な歌唱態様を記憶する特徴的歌唱態様記憶手段と、
前記子音採点区間において、マイクロホンから入力された歌唱音声信号に基づいて歌唱態様を特定する歌唱態様特定手段と、
前記特定した歌唱態様と、前記特徴的歌唱態様記憶手段に記憶された特徴的な歌唱態様とを比較する歌唱態様比較手段と、を備え、
前記歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、前記ピッチ検出判定手段により、前記ピッチを検出できなかった時間が所定時間以上であると判定され、かつ前記歌唱態様特定手段で特定された歌唱態様が前記特徴的な歌唱態様のいずれか一つと一致する場合に、前記ピッチが検出できなかったことに対する減点を行わずに修正歌唱採点値を算出する、
ことを特徴とする歌唱採点システム。
前記歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、前記ピッチ検出判定手段により、前記ピッチを検出できなかった時間が所定時間以上であると判定され、かつ前記歌唱態様特定手段で特定された歌唱態様が前記特徴的な歌唱態様のいずれか一つと一致する場合に、マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較してリズム評価を行い、ピッチ検出に基づく歌唱採点値を採用せずに、リズム評価に基づく歌唱採点値を基準とした補正を行って修正歌唱採点値を算出する、
ことを特徴とする請求項1に記載の歌唱採点システム。
前記歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、前記ピッチ検出判定手段により、前記ピッチを検出できなかった時間が所定時間以上であると判定され、かつ前記歌唱態様特定手段で特定された歌唱態様が前記特徴的な歌唱態様のいずれか一つと一致する場合に、ボーナス点を加算して、修正歌唱採点値を算出する、
ことを特徴とする請求項1または2に記載の歌唱採点システム。
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述したように、マイクロホンから入力され、A/Dコンバータによりデジタル変換された歌唱音声信号と、ガイドメロディ等の歌唱採点用リファレンスデータとを比較することにより、歌唱採点値を算出することができる。しかし、特に、カラオケ楽曲の歌詞である各単語の歌唱時間よりも短い時間となるように、歌唱採点の対象となる採点区間を設定し、各採点区間において、マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較して歌唱採点値を算出する歌唱採点システムでは、歌詞の単語の種類によっては、音高データ(ピッチデータ)を抽出できない場合がある。
【0007】
そして、音高データ(ピッチデータ)を抽出できない採点区間においては、歌唱者が上手に歌唱しているにも拘わらず、採点リファレンスデータと比較するデータを抽出できないため歌唱採点値が低くなってしまい、正確な歌唱採点を行うことができないという問題があった。
【0008】
すなわち、現在のカラオケシステムで利用されているピッチ検出方法では、歌詞に含まれる単語の中の子音部分(s、t、k等)は、原則としてピッチを検出することができない。また、子音の種類に応じて、発音する時間的な長さが異なる。具体的には、同じ長さの「す」と「き」を比較すると、「す」における子音部分「s」の方が、「き」における子音部分「k」よりも発音時間が長い。したがって、採点区間毎にピッチ検出を行うと、サ行の発音は当該区間で子音部分「s」が占める時間が長くなり、カ行の発音よりもピッチ検出の精度が低下してしまう。一方、カ行の発音は当該区間で子音部分「k」が占める時間が短いため、ピッチ検出の精度が低下することは殆どない。
【0009】
図面を参照して、「す」及び「き」を発音する際の子音部分の長さ、「す」における子音「s」のFFTによる周波数特性の解析結果(以下、FFTと略す、図面も同様)及び母音「u」のFFT、「き」における子音「k」のFFT及び母音「i」のFFTについて説明する。なお、通常の歌唱において、子音部分すなわち「す」の発音における「s」及び「き」の発音における「k」の長さは、それぞれほぼ一定であると考えてよい。一方、母音部分すなわち「す」の発音における「u」及び「き」の発音における「i」の長さに関しては、「す」と「きー」など全体の発音を短く歌唱するか長く歌唱するかで変化する。
図5は「す(su)」の発音における子音の長さを示す説明図、
図6は子音「s」のFFTを示す説明図、
図7は母音「u」のFFTを示す説明図、
図8は「き(ki)」の発音における子音の長さを示す説明図、
図9は子音「k」のFFTを示す説明図、
図10は母音「i」のFFTを示す説明図である。
【0010】
図5に示すように、「す(su)」を発音すると、子音「s」の発音部分は約110msec続く。また、
図6に示すように、子音「s」を発音した場合にははっきりとした基音や倍音列が認められず、ピッチを検出することは困難である。一方、
図7に示すように、母音「u」を発音した場合には、周波数が約310Hzで相対的に高いレベルを持つ基音とその略整数倍の周波数を持つ倍音列を含んでおり、ピッチを検出することが可能となる。このように、サ行の発音(例えば「す」の発音)では、採点区間において子音部分「s」が占める時間が長いため、正確なピッチ検出を行うことができない。したがって、サ行の音声を含む採点区間において採点の精度を上げるためには、採点方法に工夫を施す必要がある。
【0011】
これに対して、
図8に示すように、「き(ki)」を発音すると、子音「k」の発音部分は約25msecであり、子音「s」の発音部分の4分の1以下である。また、
図9に示すように、子音「k」を発音した場合には、はっきりとした基音や倍音列が認められず、ピッチを検出することは困難である。一方、
図10に示すように、母音「i」を発音した場合には、周波数が約300Hzで相対的に高いレベルを持つ基音とその略整数倍の周波数を持つ倍音列を含んでおり、ピッチを検出することが可能となる。このように、カ行の発音(例えば、「き」の発音)では、所定時間長の採点区間において子音部分「k」が占める時間が極めて短いため、当該子音部分「k」でピッチ検出を行うことができなくても、母音部分「i」において、歌唱採点に必要なピッチ検出を行うことができる。したがって、カ行の音声を含む採点区間では、採点方法の精度が極端に低下することはない。
【0012】
図5〜
図10から明らかなように、サ行及びカ行のいずれの場合であっても、母音部分は整数倍音のピークがきれいに出ており、基音でピッチ検出が可能であるのに対して、子音部分は基音の周波数域でピッチ検出しようとしてもピークが無いため、ピッチ検出(一波長の測定)ができない。さらに、カ行はサ行と比較して、子音部分「k」の発音時間が短いため、子音部分「k」を無視してピッチ検出を行うことができる。
【0013】
ところで、上述したように、子音部分「s」を発音した場合のように、ピッチを検出することができない時間が比較的長いと、歌唱採点において音程の評価値が下がる原因となる。一方、ピッチを検出することができない子音部分「s」を含む採点区間であっても、子音の発音態様を変更する等、特徴的な歌唱方法を行うことにより、聴者にとって上手に歌唱しているように聞こえる歌唱テクニックが存在する。
【0014】
しかし、このような特徴的な歌唱方法を行った場合であっても、ピッチを検出することができなければ歌唱採点値が低くなってしまい、実際の歌唱採点値と聴者の感覚とに乖離が生じることになり、歌唱採点に対して聴者が違和感を覚える原因となる。
【0015】
したがって、特徴的な歌唱方法を行っている場合に、歌唱採点値が高くなるような補正を行うことにより、実際の歌唱採点値と聴者の感覚とが一致し、聴者に対する違和感を与えないだけではなく、特徴的な歌唱テクニックを有している歌唱者にとっても歌唱の楽しさを十分に味わうことができる。
【0016】
本発明は、上述した事情に鑑み提案されたもので、歌詞の単語が含む子音の種類に応じて音高データ(ピッチデータ)を抽出できない採点区間が存在する場合であっても、聴者にとって違和感を与えない特徴的な歌唱テクニックを行っている場合には、歌唱採点値に対する補正を行って、歌唱者及び聴者双方がカラオケを楽しむことが可能な歌唱採点システムを提供することを目的とする。
【課題を解決するための手段】
【0017】
本発明の歌唱採点システムは、上述した事情に鑑み提案されたもので、以下の特徴点を有している。すなわち、本発明の歌唱採点システムは、カラオケ楽曲の歌詞である各単語の歌唱時間よりも短い時間となるように、歌唱採点の対象となる採点区間を設定し、各採点区間において歌唱採点値を算出する歌唱採点システムであって、歌唱採点手段と、子音採点区間特定手段と、ピッチ検出手段と、ピッチ検出判定手段と、特徴的歌唱態様記憶手段と、歌唱態様特定手段と、歌唱態様比較手段とを備えたことを特徴とするものである。
【0018】
子音採点区間特定手段は、歌詞テロップ情報に基づき、子音が発生する採点区間を特定するための手段である。歌唱採点手段は、マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較して歌唱採点値を算出するための手段である。ピッチ検出手段は、特定された子音採点区間において、入力された歌唱音声信号からピッチ検出を行うための手段である。ピッチ検出判定手段は、ピッチ検出手段がピッチを検出できなかった時間が所定時間以上であるか否かを判定するための手段である。
【0019】
特徴的歌唱態様記憶手段は、子音の発音態様を変更して歌唱する複数の特徴的な歌唱態様を記憶するための手段である。歌唱態様特定手段は、子音採点区間において、マイクロホンから入力された歌唱音声信号に基づいて歌唱態様を特定するための手段である。歌唱態様比較手段は、特定した歌唱態様と、特徴的歌唱態様記憶手段に記憶された特徴的な歌唱態様とを比較するための手段である。
【0020】
そして、歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段により、ピッチを検出できなかった時間が所定時間以上であると判定され、かつ特定した歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、ピッチが検出できなかったことに対する減点を行わずに修正歌唱採点値を算出する。
【0021】
また、上述した構成において、歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段により、ピッチを検出できなかった時間が所定時間以上であると判定され、かつ歌唱態様特定手段で特定された歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、マイクロホンから入力された歌唱音声信号と採点リファレンスデータとを比較してリズム評価を行い、ピッチ検出に基づく歌唱採点値を採用せずに、リズム評価に基づく歌唱採点値を基準とした補正を行って修正歌唱採点値を算出することが可能である。
【0022】
また、上述した構成において、歌唱採点手段は、マイクロホンから歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段により、ピッチを検出できなかった時間が所定時間以上であると判定され、かつ歌唱態様特定手段で特定された歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、ボーナス点を加算して、修正歌唱採点値を算出することが可能である。
【0023】
このような構成からなる歌唱採点システムでは、カラオケ楽曲の演奏に合わせて利用者が歌唱を行うと、マイクロホンから入力された歌唱音声信号をA/Dコンバータによりデジタル変換して、歌唱採点対象となる採点対象データを生成する。そして、歌唱採点手段により、所定の歌唱採点区間毎に、採点対象データと採点リファレンスデータとを比較して歌唱採点値を算出する。
【0024】
また、カラオケ楽曲の進行に伴い出力される歌詞テロップ情報に基づき、子音が発生する採点区間を逐次特定して、当該子音採点区間においてピッチを検出できたか否かで歌唱採点値を修正する。すなわち、ピッチ検出手段により、子音が発生する採点区間として特定された子音採点区間において、歌唱音声信号からピッチ検出を行い、ピッチ検出判定手段により、ピッチを検出できなかった時間が所定時間以上であるか否かを判定する。ここで、子音採点区間において、聴者が違和感を覚えるようなイレギュラーな歌唱方法で歌唱していない限り、所定時間(例えば、200msec)以上、ピッチを検出できないことになる。
【0025】
ところで、子音の発音態様を変更する等、特徴的な歌唱方法を行うことにより、聴者にとって上手に歌唱しているように聞こえる歌唱テクニックが存在するため、この歌唱テクニックに相当する特徴的な歌唱態様を記憶しておき、歌唱態様特定手段により、子音採点区間において、マイクロホンから入力された歌唱音声信号に基づいて歌唱態様を特定し、歌唱態様比較手段により、特定した歌唱態様と、特徴的な歌唱態様とを比較することにより、特徴的な歌唱方法で歌唱しているか否かを特定することができる。このため、特徴的歌唱態様記憶手段により、子音の発音態様を変更して歌唱する複数の特徴的な歌唱態様を記憶しておく。具体的には、一般的発音と、特徴的な歌唱態様における特徴的発音とを紐付けしたデータテーブル(特徴的歌唱態様データテーブル)を作成し、これをHDD等の記憶手段に記憶する。
【0026】
そして、歌唱採点手段は、実際に歌唱が行われており、マイクロホンから歌唱音声信号の入力があるにもかかわらず、ピッチが検出できなかった時間が所定時間以上あり、かつ、子音の発音態様を変更する等、特徴的な歌唱方法を行うことにより、聴者にとって上手に歌唱しているように聞こえる歌唱テクニックを用いて歌唱を行っていると判定した場合に、ピッチが検出できなかったことに対する減点を行わずに修正歌唱採点値を算出する。
【発明の効果】
【0027】
本発明の歌唱採点システムによれば、子音が発生する採点区間として特定された子音採点区間において、マイクロホンから入力された歌唱音声信号からピッチを検出することができない時間が所定時間以上の場合であっても、予め定めた特徴的な歌唱方法により歌唱を行っている場合には、ピッチを検出することができない時間が所定時間以上であったことに対する減点を行わずに修正歌唱採点値を算出する。
【0028】
したがって、ピッチを検出することができない時間が所定時間以上の子音採点区間であっても、歌唱者が自らの歌唱テクニックを駆使して、聴者にとって上手に歌唱していると認識できる特徴的な歌唱方法で歌唱を行っている場合には、歌唱採点値に対する補正を行って歌唱採点値を減点せず、あるいは、さらに加点を行うことにより、聴者に違和感を与えることなく、歌唱者及び聴者双方がカラオケを楽しむことが可能となる。
【0029】
また、カラオケ楽曲の歌詞である各単語の歌唱時間よりも短い時間となるように、歌唱採点の対象となる採点区間を設定すると、音高データ(ピッチデータ)を抽出できない場合があるが、本発明の歌唱採点システムでは、このような歌唱採点区間が存在した場合であっても、歌唱者が特徴的な歌唱方法(歌唱テクニック)を駆使して歌唱を行っている場合には、歌唱者の歌唱テクニックを評価して、聴者の感覚と乖離していない歌唱採点を行うことができる。
【発明を実施するための形態】
【0031】
図面を参照して、本発明の歌唱採点システムの実施形態について説明する。
図1〜
図4は本発明の実施形態に係る歌唱採点システムを示すもので、
図1は歌唱採点システムを適用したカラオケシステムの構成を示すブロック図、
図2は特徴的歌唱態様データテーブルの構成を示す説明図、
図3及び
図4は歌唱採点方法の実施例を示す説明図である。
【0032】
<歌唱採点システムの概要>
本発明の実施形態に係る歌唱採点システムは、カラオケ楽曲の歌詞である各単語の歌唱時間よりも短い時間となるように、歌唱採点の対象となる採点区間を設定し、各採点区間において歌唱採点値を算出するシステムに関するものである。この歌唱採点システム10は、
図1に示すようにカラオケシステム(カラオケ演奏装置20を含むシステム)に組み込まれてその機能を実現するものであり、歌唱採点機能の一部として構成される。
【0033】
本実施形態の歌唱採点システム10では、
図1に示すように、歌唱採点機能を実現するための機能手段として、歌唱採点手段37と、子音採点区間特定手段38と、ピッチ検出手段39と、ピッチ検出判定手段40と、特徴的歌唱態様記憶手段(特徴的歌唱態様データテーブル35c)と、歌唱態様特定手段41と、歌唱態様比較手段42とを備えている。
【0034】
なお、以下の説明において、プログラムとは、RAM等に記憶され、CPU等のハードウェアで実行されることにより、その機能を発揮するソフトウェアだけではなく、同等の機能を発揮することが可能な論理回路も含む概念である。
【0035】
<カラオケ演奏装置>
本発明の実施形態に係る歌唱採点システム10を適用するカラオケ演奏装置20は、
図1に示すように、カラオケ本体21、スピーカ22、マイクロホン23、表示装置24、ミキシングアンプ25、カラオケリモコン装置26を備えている。また、カラオケ演奏装置20は、ルータ50及びデータ通信回線60を介して、管理サーバ70とネットワーク接続されている。
【0036】
<カラオケリモコン装置>
カラオケリモコン装置26は、ユーザインタフェース機能を備えており、ルータ50を介してカラオケ本体21とデータ通信を行うようになっている。このカラオケリモコン装置26は、楽曲検索手段26aとして機能するプログラム、楽曲索引データベース26b、種々のデータを記憶するためのデータ記憶部26c、データの入出力を行うための入出力表示部26d等を備えている。このカラオケリモコン装置26に付帯するスイッチ類や、入出力表示部26dに表示される各種のアイコン等を操作することにより、選曲操作等が行われる。
【0037】
なお、カラオケ本体21にローカル送受信手段(図示せず)を設け、このローカル送受信手段とカラオケリモコン装置26との間で有線方式又は無線方式(例えば、赤外線通信)によりデータの送受信を行うようにしてもよい。さらに、利用者が所持する携帯情報端末(例えば、スマートフォン)等に、選曲プログラムをインストールすることにより、携帯情報端末に選曲装置としての機能を持たせ、管理サーバ70を経由して、携帯情報端末とペアリングしたカラオケ演奏装置20に対して選曲情報を送信するようにしてもよい。
【0038】
<楽曲検索手段/楽曲索引データベース>
楽曲検索手段26aは、利用者の指示に基づき、楽曲索引データベース26bを参照して楽曲を検索するためのプログラムからなる。楽曲索引データベース26bは、カラオケ演奏装置20で演奏に供されるカラオケ楽曲について、その属性情報を記述したデータベースであり、例えば、楽曲番号・曲名・アーティスト名・歌い出し部分の歌詞・流行時期・音楽ジャンル区分・デュエット曲か否かなど、種々の属性情報がこれに含まれている。
【0039】
<マイクロホン>
マイクロホン23は、歌唱音声の入力を行うための装置である。マイクロホン23から入力された歌唱音声信号は、ミキシングアンプ25により、音楽再生制御手段43から送出される演奏音声信号とミキシングされると共に増幅され、スピーカ22へ出力される。なお、マイクロホン23からの音声入力信号は、A/Dコンバータ44によりデジタル変換され、歌唱採点手段37における歌唱採点等に使用される。
【0040】
<表示装置>
表示装置24は、カラオケ楽曲に関連した背景映像や歌詞テロップ等を表示するための装置で、例えば、液晶ディスプレイ等により構成される。
【0041】
<カラオケ本体>
カラオケ本体21は、
図1に示すように、ネットワーク送受信手段31、中央制御手段32、ROM33、RAM34、HDD35、予約管理手段36、歌唱採点手段37、子音採点区間特定手段38、ピッチ検出手段39、ピッチ検出判定手段40、特徴的歌唱態様記憶手段(特徴的歌唱態様データテーブル35c)、歌唱態様特定手段41、歌唱態様比較手段42、音楽再生制御手段43、A/Dコンバータ44、映像再生制御手段45を備えている。
【0042】
<ネットワーク送受信手段>
ネットワーク送受信手段31は、ルータ50及びデータ通信回線60を介して管理サーバ70、カラオケリモコン装置26、他のカラオケ演奏装置20との間でデータの送受信を行うための電子回路及びプログラムからなる。データ通信回線60は、データの送受信を行うことができればどのような回線であってもよいが、例えば、光回線、専用電話回線、一般電話回線、インターネット等を利用することができる。本実施形態では、光回線、専用電話回線、一般電話回線等の通信回線と、インターネットとを組み合わせて、データ通信回線60を構成している。
【0043】
<中央制御手段>
中央制御手段32は、カラオケ本体21を総合的に制御するための手段であり、例えばCPU及びその周辺機器により構成されており、CPU等がROM33等に記憶されたプログラムに従って動作することにより、制御機能を発揮することができるようになっている。
【0044】
<ROM/RAM>
ROM33は、カラオケ本体21を構成する各機器を制御するためのプログラムデータや数値データを記憶するための機器で、例えば半導体メモリ等で構成される。また、RAM34は、プログラムや各種データを一時的に記憶する一時記憶領域として機能するもので、例えば半導体メモリ等で構成される。
【0045】
本実施形態では、RAM34に、予約待ち行列34aが記憶されるようになっている。なお、予約待ち行列34aは、選曲予約されたカラオケ楽曲について、演奏順に楽曲IDを並べて構成されたデータテーブルであり、選曲予約者の利用者ID等、他の識別データが紐付けされている場合もある。また、RAM34に、歌唱採点値を記憶するようにしてもよい。
【0046】
<HDD>
HDD35は、大容量記憶装置として機能するもので、楽曲データベース35a、映像データベース35b、特徴的歌唱態様データテーブル35cが格納されている。なお、HDD35に替えて、あるいはHDD35と共に、データを書き替え可能なDVD等の大容量記憶装置を用いてもよい。
【0047】
<楽曲データベース/映像データベース>
楽曲データベース35aは、演奏制御データ(MIDI規格のデータ)及び歌詞テロップ情報が同期されて構成される楽曲データと、歌唱採点に用いる採点リファレンスデータとが、楽曲IDと対応付けてそれぞれ構成されたデータベースである。演奏制御データは、各楽曲の演奏を制御するためのデジタルデータであり、歌詞テロップ情報は演奏に同期した歌詞文字の表示タイミングデータ及び色変わりデータを含んでいる。採点リファレンスデータは、歌唱採点手段37における歌唱採点において、マイクロホン23から入力された歌唱音声信号と比較することにより、歌唱採点値を算出するためのデータである。また、子音採点区間特定手段38は、歌詞テロップ情報に基づいて、子音を含む歌唱区間及び子音の種類を特定する。
【0048】
映像データベース35bは、演奏されるカラオケ楽曲に対応した背景映像を、当該カラオケ楽曲の楽曲IDに対応させた映像ファイルとして所定数格納したデータベースである。特徴的歌唱態様データテーブル35cについては、後述する。
【0049】
<予約管理手段>
予約管理手段36は、任意の利用者が選曲予約する際に、当該選曲されたカラオケ楽曲の楽曲IDを含む予約待ち行列34aを作成して管理するためのプログラムからなる。すなわち、予約管理手段36は、利用者により楽曲検索手段26aの機能を用いて選曲された楽曲IDを演奏順に並べて予約待ち行列34aを作成し、この予約待ち行列34aをRAM34に格納して管理する。また、予約待ち行列34aに選曲者の利用者IDを含める場合には、利用者IDの取得が必要となる。
【0050】
利用者IDは、利用者IDカードに記憶された利用者IDをカードリーダにより読み取り、あるいは、カラオケリモコン装置26の入出力表示部26dを用いて入力された利用者ID及びパスワードに基づいて取得すればよい。さらに、利用者が携帯する携帯情報端末を用いて予約を行う機能を有する場合には、当該携帯情報端末の機器IDに紐付けされた利用者IDを取得してもよい。また、カラオケ演奏装置20を使用する際に、利用者に対して一時的に利用者IDを付与してもよい。
【0051】
<音楽再生制御手段>
音楽再生制御手段43は、楽曲IDに基づいて演奏データから抽出された演奏制御データに基づいて、音源データをデジタル再生すると共にアナログ変換してミキシングアンプ25に出力するための電子回路である。上述したように、ミキシングアンプ25は、マイクロホン23から入力された歌唱者の歌唱音声信号と、音楽再生制御手段43から送出される演奏音声信号とをミキシングすると共に、アンプ機能により増幅してスピーカ22より出力するための装置である。
【0052】
<映像再生制御手段>
映像再生制御手段45は、カラオケ楽曲の演奏中に、映像データベース35bから抽出した背景映像データと、演奏データに含まれる歌詞テロップ情報に基づいて作成される歌詞文字とを、当該カラオケ楽曲の演奏データに同期させて表示装置24に出力する。
【0053】
<歌唱採点手段>
歌唱採点手段37は、マイクロホン23から入力された歌唱音声信号と採点リファレンスデータとを比較して歌唱採点値を算出するためのプログラムからなる。そして、マイクロホン23から歌唱音声信号の入力があるにもかかわらず、ピッチが検出できなかった時間が所定時間(例えば、200msec)以上であり、かつ特定した歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、ピッチが検出できなかったことに対する減点を行わずに修正歌唱採点値を算出する。
【0054】
マイクロホン23から歌唱音声信号の入力があるにもかかわらず、ピッチが検出できなかった時間が所定時間(例えば、200msec)以上であるという条件は、歌唱者が歌唱している場合であっても、子音採点区間であるためピッチを検出できず、さらに、本来の歌唱方法とは異なるイレギュラーな歌唱方法で、無理矢理ピッチを検出させるような歌唱をしていないことを確認するためである。
【0055】
イレギュラーな歌唱方法とは、子音の発音時間を極端に短くしたり、子音を発音せずに母音のみを発音したりすることにより、聴者の感覚とかけ離れて歌唱採点値が高くなってしまう歌唱方法のことである。このようなイレギュラーな歌唱方法を許して歌唱採点値が高くなった場合には、歌唱採点値と聴者の感覚とが乖離してしまい、聴者が違和感を覚えることになる。この場合には、イレギュラーな歌唱方法により歌唱採点値が上昇することを防止する工夫が必要となる。イレギュラーな歌唱方法に対応するには、例えば、子音採点区間であるにもかかわらずピッチを検出できた場合に、減点を行えばよい。
【0056】
また、歌唱採点手段37は、マイクロホン23から歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段40により、ピッチを検出できなかった時間が所定時間(例えば、200msec)以上であると判定され、かつ歌唱態様特定手段41で特定された歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、マイクロホン23から入力された歌唱音声信号と採点リファレンスデータとを比較してリズム評価を行い、ピッチ検出に基づく歌唱採点値を採用せずに、リズム評価に基づく歌唱採点値を基準とした補正を行って修正歌唱採点値を算出してもよい。
【0057】
さらに、歌唱採点手段37は、マイクロホン23から歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段40により、ピッチを検出できなかった時間が所定時間(例えば、200msec)以上であると判定され、かつ歌唱態様特定手段41で特定された歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、ボーナス点を加算して、修正歌唱採点値を算出してもよい。
【0058】
<子音採点区間特定手段>
子音採点区間特定手段38は、歌詞テロップ情報に基づき、子音が発生する採点区間を特定するためのプログラムからなる。すなわち、歌詞テロップ情報には、表示装置24に表示する歌詞文字情報が含まれており、この歌詞文字情報に基づいて、子音が発生する採点区間を特定することができる。
【0059】
<ピッチ検出手段>
ピッチ検出手段39は、特定された子音採点区間において、入力された歌唱音声信号からピッチ検出を行うためのプログラムからなる。
【0060】
<ピッチ検出判定手段>
ピッチ検出判定手段40は、ピッチ検出手段39がピッチを検出できなかった時間が所定時間以上であるか否かを判定するためのプログラムからなる。すなわち、子音採点区間では、子音の種類にもよるが、本来の歌唱方法で歌唱するとピッチを検出できないことが一般的である。しかし、子音採点区間においてピッチを検出できない場合であっても、歌唱者の歌唱テクニックにより、子音の発音態様を変更して歌唱する特徴的な歌唱態様で歌唱している場合には、これを評価することにより、カラオケの楽しさを高めることができる。そこで、本実施形態では、子音の発音態様を変更して歌唱する特徴的な歌唱態様で歌唱しているためピッチを検出できない場合と、本来の歌唱方法とは異なるイレギュラーな歌唱方法で、無理矢理ピッチを検出させるような歌唱をしている場合を区別するため、ピッチを検出できなかった時間が所定時間以上であるか否かを判定する。
【0061】
<特徴的歌唱態様記憶手段>
特徴的歌唱態様記憶手段は、子音の発音態様を変更して歌唱する複数の特徴的な歌唱態様を記憶するための手段であり、例えば、特徴的歌唱態様データテーブル35cを作成して、HDD35等の記憶手段に記憶する。
【0062】
子音の発音態様を変更して歌唱する特徴的な歌唱態様とは、一般的な発音とは相違するが、聴者にとって上手に歌唱しているように聞こえる歌唱テクニックのことである。具体的には、「待ってて」を「ンマッテテ」と発音するように「マ」の発音前に「ン」を発音することにより歌い始めを強調する歌唱態様、「乾いた」を「クァワイタ」と発音するように「カ」をカ行の別音及び母音で発音する歌唱態様、「眠っていた」を「ネムッテイツァ」と発音するように「タ」をタ行の別音及び母音で発音する歌唱態様、「揺られて」を「ユラレツェ」と発音するように「テ」をタ行の別音及び母音で発音する歌唱態様、「誇らしげ」を「ホコゥラシゲ」と発音するように「ラ」の発音前に「ゥ」を発音したり、「ラ」を巻き舌で発音したりする歌唱態様、「マシーン」の「シ」の発音前に歯擦音等を発音する歌唱態様等のことである。なお、特徴的な歌唱態様は上述したものに限られず、子音の発音態様を変更する等、特徴的な歌唱方法を行うことにより、一般的な発音とは相違するが、聴者にとって上手に歌唱しているように聞こえる歌唱態様であれば、どのような態様であってもよい。
【0063】
特徴的歌唱態様データテーブル35cは、
図2に示すように、一般的発音と、特徴的な歌唱態様における特徴的発音とを紐付けしたデータテーブルであり、例えば、上述したような一般的発音に対応する特徴的な歌唱態様が述されている。
【0064】
子音の発音態様を変更して歌唱する歌唱方法(特徴的歌唱態様)は、聴者に対してインパクトを与えたり、アタック感を弱めてメロディーを強調したりする等、聴者にとって違和感を生じさせるものではなく、歌唱者の歌唱テクニックを評価する必要がある。したがって、本発明では、このような特徴的歌唱態様に対して、たとえピッチを検出できない時間が所定時間以上であっても減点を行わず、あるいは、さらにボーナス点を与えるようにしている。
【0065】
<歌唱態様特定手段>
歌唱態様特定手段41は、子音採点区間において、マイクロホン23から入力された歌唱音声信号に基づいて歌唱態様を特定するためのプログラムからなる。歌唱態様とは、歌詞文字の発音態様のことであり、歌詞文字を一般的な発音で歌唱する場合と、上述したように、一般的な発音とは相違するが、聴者にとって上手に歌唱しているように聞こえる発音で歌唱する場合と、イレギュラーな方法で歌唱することにより、歌唱採点値は高くなるが、聴者にとって違和感を覚える場合とがある。歌唱態様特定手段41は、一般的な歌唱態様、特徴的な歌唱態様、イレギュラーな歌唱態様を区別するために、マイクロホン23から入力された歌唱音声信号に基づいて歌唱態様を特定する。
【0066】
歌唱態様を特定するには、例えば、子音採点区間において、ピッチが検出されていなかった時間と歌唱音量の変化を確認したり、音声認識技術を適用したりすることができる。すなわち、マイクロホン23から入力された歌唱音声信号に基づいて、ピッチが検出されていなかった時間と歌唱音量の変化を判定したり、音声認識を行ったりすることにより、歌唱態様を特定する。
【0067】
<歌唱態様比較手段>
歌唱態様比較手段42は、特定した歌唱態様と、特徴的歌唱態様記憶手段(特徴的歌唱態様データテーブル35c)に記憶された特徴的な歌唱態様とを比較するためのプログラムからなる。上述したように、歌唱態様には、一般的な歌唱態様、特徴的な歌唱態様、イレギュラーな歌唱態様とがあり、歌唱態様比較手段42は、歌唱態様特定手段41で特定した歌唱態様と、予め設定されている特徴的な歌唱態様とを比較して、比較結果を歌唱採点手段37における歌唱採点に反映させる。
【0068】
歌唱態様比較手段42では、子音採点区間特定手段38により特定した子音の一般的発音に対応する特徴的発音と、歌唱態様特定手段41で特定した歌唱態様による発音とを比較する。すなわち、
図2に示す特徴的歌唱態様データテーブル35cを参照して、子音採点区間において、歌唱態様特定手段41で特定した歌唱態様による発音が、子音採点区間特定手段38により特定した子音に対応する特徴的発音であるか否かを比較する。そして、両者が一致した場合には、歌唱採点手段37において、特徴的歌唱態様に対する優遇採点処理を行う。
【0069】
<採点方法(実施例1)>
図3を参照して、採点方法の実施例1を説明する。採点方法の実施例1は、マイクロホン23から歌唱音声信号の入力があるにもかかわらず、ピッチ検出判定手段40により、ピッチを検出できなかった時間が所定時間(例えば、200msec)以上であると判定され、かつ特定した歌唱態様が特徴的な歌唱態様のいずれか一つと一致する場合に、ピッチが検出できなかったことに対する減点を行わない採点方法である。さらに、歌唱者が歌唱テクニックを駆使して、聴者にとって上手に歌唱しているように聞こえる特徴的歌唱態様であるため、ボーナス点を加算する。なお、加算するボーナス点は、特徴的歌唱態様の種類に応じて増減してもよい。
【0070】
すなわち、
図3に示すように、子音採点区間(1)において、マイクロホン23から歌唱音声信号の入力があり、ピッチ検出判定手段40により、ピッチを検出できなかった時間が200msec以上であると判定され、かつ特徴的な歌唱態様で歌唱している場合に、ピッチを検出できなかったことに対する減点を行わない。例えば、ピッチ検出に対する採点値の満点が30点の場合に、ピッチを検出できなければ30点の減点となるが、実施例1の子音採点区間(1)では、30点の減点を行わずに、実際の歌唱採点値に対して補正値としての30点と、ボーナス点としての5点を加算した90点が修正歌唱採点値となる。
【0071】
また、ピッチを検出した子音採点区間(2)、あるいはピッチを検出できない場合であっても、ピッチを検出できなかった時間が所定値(例えば、200msec)未満であり、または特徴的な歌唱態様を行っていない子音採点区間(3)では、実際の歌唱採点値を修正歌唱採点値とする。
【0072】
<採点方法(実施例2)>
図4を参照して、採点方法の実施例2を説明する。採点方法の実施例2は、子音採点区間において、マイクロホン23から入力された歌唱音声信号と採点リファレンスデータとを比較してリズム評価を行い、ピッチ検出に基づく歌唱採点値を採用せずに、リズム評価に基づく歌唱採点値を基準とした補正を行って修正歌唱採点値を算出する採点方法である。さらに、歌唱者が歌唱テクニックを駆使して、聴者にとって上手に歌唱しているように聞こえる特徴的な歌唱態様であるため、ボーナス点を加算する。なお、加算するボーナス点は、特徴的歌唱態様の種類に応じて増減してもよい。
【0073】
すなわち、
図4に示すように、子音採点区間において、マイクロホン23から歌唱音声信号の入力があり、ピッチが検出できなかった時間が200msec以上であり、さらに、特徴的な歌唱態様である場合に、ピッチ検出に基づく歌唱採点値を採用せずに、リズム評価に基づく歌唱採点を行い、ピッチ検出に基づく歌唱採点値を補うために、リズム評価に基づく歌唱採点値を基準とした補正値を加算して、修正歌唱採点値を算出する。
【0074】
ここで、例えば、歌唱採点値の総合満点が100点であり、ピッチ検出に基づく歌唱採点値の満点が30点であり、リズム評価に基づく歌唱採点値の満点が40点であり、その他の基準に基づく歌唱採点値の満点が30点であったとする。
【0075】
図4に示す例では、子音歌唱区間(1)において、ピッチが検出できなかった時間が200msec以上であり、さらに、特徴的な歌唱態様で歌唱している。そして、子音歌唱区間(1)では、ピッチを検出できないため、ピッチ検出に基づく歌唱採点値は0点であるが、リズム評価に基づく歌唱採点値が35点であり、その他の基準に基づく歌唱採点値が25点である。そこで、ピッチ検出に基づく歌唱採点値を補正するため、リズム評価を基準として算出した補正値を加算する。
【0076】
すなわち、リズム評価については40点満点中35点を獲得していることになり、その得点比率は35/40である。そこで、ピッチ検出に基づく歌唱採点値の満点である30点に対して、リズム評価に基づく得点比率である35/40を乗算して、ピッチ検出に基づく歌唱採点値に対する補正値を算出し、さらに、歌唱者が歌唱テクニックを駆使して、聴者にとって上手に歌唱しているように聞こえる特徴的な歌唱態様であるため、ボーナス点として加点を行う。この場合、リズム評価に基づく歌唱採点値が35点であり、その他の基準に基づく歌唱採点値が25点であり、補正値が26点であり、ボーナス点が5点であるため、修正歌唱採点値は91点となる。
【0077】
また、ピッチを検出した子音採点区間(2)、あるいはピッチを検出できない場合であっても、ピッチを検出できなかった時間が所定値(例えば、200msec)未満であり、または特徴的な歌唱態様ではない子音歌唱区間(3)では、実際の歌唱採点値を修正歌唱採点値とする。
【0078】
<他の実施形態>
本発明のシステム及びその周辺装置を構成する機器や手段は上述したものに限定されず、その利用目的に応じて、必要な機器や手段のみの構成としたり、適宜他の機器や手段を付加したりすることができる。また、各手段をそれぞれ別個のものとして構成するのではなく、複数の機能を統合した手段として構成してもよい。