IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社第一興商の特許一覧

<>
  • 特開-カラオケ装置 図1
  • 特開-カラオケ装置 図2
  • 特開-カラオケ装置 図3
  • 特開-カラオケ装置 図4
  • 特開-カラオケ装置 図5
  • 特開-カラオケ装置 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023162962
(43)【公開日】2023-11-09
(54)【発明の名称】カラオケ装置
(51)【国際特許分類】
   G10K 15/04 20060101AFI20231101BHJP
【FI】
G10K15/04 302D
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2022073702
(22)【出願日】2022-04-27
(71)【出願人】
【識別番号】390004710
【氏名又は名称】株式会社第一興商
(74)【代理人】
【識別番号】110000176
【氏名又は名称】弁理士法人一色国際特許事務所
(72)【発明者】
【氏名】佐々木 優太
【テーマコード(参考)】
5D208
【Fターム(参考)】
5D208CA09
5D208CB04
(57)【要約】
【課題】利用者の動作に基づいて、カラオケ歌唱を推奨する楽曲を提示可能なカラオケ装置を提供する。
【解決手段】楽曲の属性情報と、当該楽曲の楽曲識別情報とを対応付けて記憶する情報記憶部、利用者の動作を撮影して得られた動作映像に基づいて、楽曲の属性情報に対応する特徴情報を抽出する抽出部、抽出された特徴情報と一致する属性情報が対応付けられた楽曲識別情報を特定する特定部、特定された楽曲識別情報が示す楽曲を、レコメンド楽曲として利用者に対して提示する提示部を有するカラオケ装置。
【選択図】図2
【特許請求の範囲】
【請求項1】
楽曲の属性情報と、当該楽曲の楽曲識別情報とを対応付けて記憶する情報記憶部と、
利用者の動作を撮影して得られた動作映像に基づいて、楽曲の属性情報に対応する特徴情報を抽出する抽出部と、
抽出された前記特徴情報と一致する属性情報が対応付けられた楽曲識別情報を特定する特定部と、
特定された前記楽曲識別情報が示す楽曲を、レコメンド楽曲として前記利用者に対して提示する提示部と、
を有するカラオケ装置。
【請求項2】
前記抽出部は、利用者からの要求に応じて当該利用者の動作を撮影して得られる動作映像に基づいて、前記特徴情報を抽出し、
前記特定部は、抽出された前記特徴情報と一致する属性情報が対応付けられた楽曲識別情報のうち、所定条件を満たす楽曲識別情報を特定することを特徴とする請求項1記載のカラオケ装置。
【請求項3】
前記抽出部は、利用者がカラオケ装置を利用している間に当該利用者の動作を撮影して得られた動作映像に基づいて、前記特徴情報を複数抽出し、
前記特定部は、カラオケ演奏が行われていない状態が所定時間継続した場合、カラオケ装置の利用開始からその時点までに抽出された複数の特徴情報に基づいて一の特徴情報を決定し、当該一の特徴情報と一致する属性情報が対応付けられた楽曲識別情報のうち、所定条件を満たす楽曲識別情報を特定することを特徴とする請求項1記載のカラオケ装置。
【請求項4】
前記情報記憶部は、前記属性情報として、楽曲のジャンルを示すジャンル情報を記憶することを特徴とする請求項1から3のいずれか一つに記載のカラオケ装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はカラオケ装置に関する。
【背景技術】
【0002】
一般に、カラオケ装置の利用者は、カラオケ装置に付属するリモコン装置を操作し、カラオケ歌唱を行う楽曲を選曲する。
【0003】
一方、利用者に対してカラオケ歌唱を行う楽曲を推奨するカラオケ装置が提案されている。
【0004】
たとえば、特許文献1には、利用者が発声したハミングやスキャットを含む歌声の音声に基づいて楽曲を検索し、利用者に対して曲名を提示する技術が開示されている。また、特許文献2には、利用者がBGMを聴取した際の集中度から嗜好情報を決定し、決定した嗜好情報に基づいて、利用者に対してレコメンド楽曲を提示する技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2003-108165号公報
【特許文献2】特開2021-135383号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の目的は、利用者の動作に基づいて、カラオケ歌唱を推奨する楽曲を提示可能なカラオケ装置を提供することにある。
【課題を解決するための手段】
【0007】
上記目的を達成するための一の発明は、楽曲の属性情報と、当該楽曲の楽曲識別情報とを対応付けて記憶する情報記憶部と、利用者の動作を撮影して得られた動作映像に基づいて、楽曲の属性情報に対応する特徴情報を抽出する抽出部と、抽出された前記特徴情報と一致する属性情報が対応付けられた楽曲識別情報を特定する特定部と、特定された前記楽曲識別情報が示す楽曲を、レコメンド楽曲として前記利用者に対して提示する提示部と、を有するカラオケ装置である。
本発明の他の特徴については、後述する明細書及び図面の記載により明らかにする。
【発明の効果】
【0008】
本発明によれば、利用者の動作に基づいて、カラオケ歌唱を推奨する楽曲を提示できる。
【図面の簡単な説明】
【0009】
図1】第1実施形態に係るカラオケ装置を示す図である。
図2】第1実施形態に係るカラオケ本体を示す図である。
図3】第1実施形態に係る情報記憶部に記憶されているテーブルを示した図である。
図4】第1実施形態に係るカラオケ装置の処理を示すフローチャートである。
図5】第2実施形態において抽出した利用者毎の特徴情報の割合を示した図である。
図6】第2実施形態に係るカラオケ装置の処理を示すフローチャートである。
【発明を実施するための形態】
【0010】
<第1実施形態>
図1図4を参照して、第1実施形態に係るカラオケ装置について説明する。
【0011】
==カラオケ装置==
カラオケ装置Kは、楽曲のカラオケ演奏、及び利用者がカラオケ歌唱を行うための装置である。図1に示すように、カラオケ装置Kは、カラオケ本体10、スピーカ20、表示装置30、マイク40、リモコン装置50、及び撮影手段60を備える。
【0012】
カラオケ本体10は、選曲された楽曲のカラオケ演奏制御、歌詞や背景映像等の表示制御、マイク40を通じて入力された音声信号の処理といった、カラオケ演奏やカラオケ歌唱に関する各種の制御を行う。スピーカ20は、カラオケ本体10からの放音信号に基づいて放音するための構成である。表示装置30は、カラオケ本体10からの信号に基づいて映像や画像を画面に表示するための構成である。マイク40は、利用者のカラオケ歌唱の歌唱音声をアナログの音声信号に変換してカラオケ本体10に入力するための構成である。リモコン装置50は、カラオケ本体10に対する各種操作をおこなうための装置である。撮影手段60は、カラオケ装置Kを利用する利用者を撮影可能なカメラである。
【0013】
図2に示すように、本実施形態に係るカラオケ本体10は、記憶手段10a、通信手段10b、入力手段10c、演奏手段10d、及び制御手段10eを備える。各構成はインターフェース(図示なし)を介してバスBに接続されている。
【0014】
[記憶手段]
記憶手段10aは、各種のデータを記憶する大容量の記憶装置であり、たとえばハードディスクドライブなどである。記憶手段10aは、楽曲データを記憶する。
【0015】
楽曲データは、個々の楽曲を特定するための楽曲識別情報が付与されている。楽曲識別情報は、楽曲を識別するための楽曲ID等、各楽曲に固有の情報である。楽曲データは、伴奏データ、リファレンスデータ等を含む。伴奏データは、カラオケ演奏音の元となるデータである。リファレンスデータは、カラオケ演奏された楽曲の主旋律を示すデータであって、利用者によるカラオケ歌唱を採点する際に用いられるデータである。
【0016】
記憶手段10aは、各楽曲に対応する歌詞テロップをカラオケ演奏に合わせて表示装置30等に表示させるための歌詞テロップデータ、及びカラオケ演奏時に表示装置30等に表示される背景映像等の背景映像データを記憶する。
【0017】
(情報記憶部)
本実施形態において、記憶手段10aの記憶領域の一部は、情報記憶部100として機能する。情報記憶部100は、楽曲の属性情報と、当該楽曲の楽曲識別情報とを対応付けて記憶する。
【0018】
属性情報は、楽曲に付帯する様々な情報である。具体的に、属性情報は、楽曲のジャンルを示すジャンル情報、楽曲のテンポを示すテンポ情報、楽曲のビートを示すビート情報等である。本実施形態においては、属性情報がジャンル情報である場合を例に説明を行う。
【0019】
図3は、情報記憶部100が記憶している属性情報と楽曲識別情報とのテーブルを示している。この例では、4つのジャンル情報(「バラード」、「ロック」、「アイドル」、「その他」)それぞれに対し、当該ジャンル情報が示すジャンルに区分できる楽曲の楽曲識別情報が対応づけられている。具体的に、ジャンル情報「バラード」には、楽曲X1~楽曲Xpの楽曲IDであるID***X1~ID***Xpが対応付けられている。すなわち、楽曲X1~楽曲Xpのジャンルは「バラード」である。また、ジャンル情報「ロック」には、楽曲Y1~楽曲Yqの楽曲IDであるID***Y1~ID***Yqが対応付けられている。すなわち、楽曲Y1~楽曲Yqのジャンルは「ロック」である。また、ジャンル情報「アイドル」には、楽曲Z1~楽曲Zrの楽曲IDであるID***Z1~ID***Zrが対応付けられている。すなわち、楽曲Z1~楽曲Zrのジャンルは「アイドル」である。一方、ジャンル情報「その他」には、「バラード」、「ロック」、及び「アイドル」以外のジャンルの楽曲の楽曲IDが対応付けられている。すなわち、楽曲X1~楽曲Xp、楽曲Y1~楽曲Yq、楽曲Z1~楽曲Zr以外の楽曲のジャンルは「その他」である。
【0020】
なお、属性情報の種類や数は、上記例に特に限定されるものではない。たとえば、情報記憶部100は、ジャンル情報として、「バラード」、「ロック」、「アイドル」、「演歌」、「その他」の5つを記憶していてもよい。
【0021】
[通信手段・入力手段]
通信手段10bは、リモコン装置50との通信を行うためのインターフェースを提供する。入力手段10cは、利用者が各種の指示入力を行うための構成である。入力手段10cは、カラオケ本体10に設けられたボタン等である。或いは、リモコン装置50が入力手段10cとして機能してもよい。
【0022】
[演奏手段]
演奏手段10dは、制御手段10eの制御に基づき、楽曲のカラオケ演奏、及びマイク40を通じて入力された歌唱音声に基づく信号の処理を行う。演奏手段10dは、音源、ミキサ、アンプ等を含む(いずれも図示なし)。
【0023】
[制御手段]
制御手段10eは、カラオケ装置Kにおける各種の制御を行う。制御手段10eは、CPUおよびメモリ(いずれも図示無し)を備える。CPUは、メモリに記憶されたプログラムを実行することにより各種の機能を実現する。
【0024】
本実施形態においてはCPUがメモリに記憶されるプログラムを実行することにより、制御手段10eは、抽出部200、特定部300、及び提示部400として機能する。
【0025】
(抽出部)
抽出部200は、利用者の動作を撮影して得られた動作映像に基づいて、楽曲の属性情報に対応する特徴情報を抽出する。
【0026】
特徴情報は、動作映像を解析した結果として得られる情報であって、楽曲の属性情報に対応する情報である。たとえば、属性情報がジャンル情報の場合、楽曲のジャンルが特徴情報として抽出される。
【0027】
特徴情報の抽出は、様々な方法を用いることができる。たとえば、抽出部200は、構築済みの学習モデルを用いて特徴情報を抽出することができる。
【0028】
学習済みモデルは、動作映像を解析して求めた利用者の動作の特徴と、所定の属性情報とを紐付けた教師データで構成される。動作映像を解析し、利用者の動作の特徴を求める方法は公知の技術を用いることができる。
【0029】
たとえば、動作映像を解析した結果、「利用者の姿勢や位置の変化が少なく、上半身だけがゆったり動く」という動作の特徴が求められた場合、カラオケ装置Kは、当該動作の特徴に対して、ジャンル情報「バラード」を紐付けて学習させる。同様に、「ヘッドバンギング及びこぶしを挙げるような大きな動きがある」という動作の特徴が求められた場合、カラオケ装置Kは、当該動作の特徴に対して、ジャンル情報「ロック」を紐付けて学習させる。また、「全体的にダンサンブルな動きであって、肘から先を軽く動かす動作がある」という動作の特徴が求められた場合、カラオケ装置Kは、当該動作の特徴に対して、ジャンル情報「アイドル」を紐付けて学習させる。一方、「動きに統一感がなくランダムである」という動作の特徴が求められた場合、カラオケ装置Kは、当該動作の特徴に対して、ジャンル情報「その他」を紐付けて学習させる。カラオケ装置Kは、このような処理を繰り返し行うことにより学習済みモデルを構築する。なお、学習済みモデルの構築は、カラオケ装置Kとは別の外部サーバ装置(図示なし)で行われてもよい。この場合、外部サーバ装置は、カラオケ装置Kに対して学習済みモデルを提供することができる。
【0030】
学習済みモデルが構築された後、抽出部200が、撮影手段60から新たな動作映像を取得したとする。この場合、抽出部200は、新たな動作映像を解析し、当該動作映像に含まれる動作の特徴を求める。抽出部200は、求めた動作の特徴を学習済みモデルに入力する。学習済みモデルは、入力された動作の特徴と一致または類似する動作の特徴に紐付けられている属性情報を出力する。抽出部200は、学習済みモデルから出力された属性情報を、特徴情報として抽出する。
【0031】
ここで、本実施形態に係る抽出部200は、利用者からの要求に応じて当該利用者の動作を撮影して得られる動作映像に基づいて、特徴情報を抽出する。
【0032】
たとえば、カラオケ装置Kを利用する利用者は、リモコン装置50を操作して「動作検索モード」を選択することにより、撮影手段60による撮影の要求を行う。リモコン装置50は、動作検索モードの選択に応じて、撮影手段60に利用者の撮影を開始するよう指示する。
【0033】
利用者は、撮影手段60に向かってカラオケ歌唱を行いたい楽曲の属性情報に対応付けられている可能性のある特徴的な動作を行う。撮影手段60は、当該利用者の動作を撮影して動作映像を取得する。撮影手段60は、取得した動作映像のデータを抽出部200に出力する。抽出部200は、学習済みモデルを利用して上述の処理を行うことにより、特徴情報を抽出する。
【0034】
(特定部)
特定部300は、抽出された特徴情報と一致する属性情報が対応付けられた楽曲識別情報を特定する。
【0035】
特定部300は、情報記憶部100に記憶されている複数の属性情報の中から、抽出された特徴情報と一致する属性情報を選択する。更に、特定部300は、情報記憶部100を参照し、選択した属性情報に対応付けられた楽曲識別情報を特定する。たとえば、選択した属性情報に対応付けられた楽曲識別情報が10個の場合、特定部300は、当該10個の楽曲識別情報を特定する。
【0036】
一方、本実施形態に係る特定部300は、抽出された特徴情報と一致する属性情報が対応付けられた楽曲識別情報のうち、所定条件を満たす楽曲識別情報を特定することができる。
【0037】
所定条件は、複数の楽曲識別情報の中から、一部の楽曲識別情報を選択するための条件である。たとえば、「全国のカラオケ装置においてカラオケ演奏がされた合計回数の多い順から5曲」、「利用者の歌唱履歴の中でカラオケ歌唱の回数が多い順から3曲」、または「利用者の採点履歴の中で採点値が高い順から10曲」を所定条件とすることができる。所定条件は、カラオケ装置毎に予め一の条件が設定されていてもよいし、利用者が動作検索モードを選択する際に任意の条件を選択してもよい。
【0038】
ここで、所定条件が「全国のカラオケ装置においてカラオケ演奏がされた合計回数の多い順から5曲」であるとする。また、カラオケ装置Kは、各楽曲のカラオケ演奏がされた合計回数を予め記憶しているとする。
【0039】
特定部300は、情報記憶部100に記憶されている複数の属性情報の中から、抽出された特徴情報と一致する属性情報を選択する。更に、特定部300は、情報記憶部100を参照し、選択した属性情報に対応付けられた楽曲識別情報のうち、カラオケ演奏がされた合計回数の多い順から5曲を選択し、当該5曲の楽曲識別情報を特定する。
【0040】
(提示部)
提示部400は、特定された楽曲識別情報が示す楽曲を、レコメンド楽曲として利用者に対して提示する。
【0041】
レコメンド楽曲は、利用者に対してカラオケ歌唱を推奨する楽曲である。レコメンド楽曲の提示は様々な方法で行うことができる。たとえば、提示部400は、特定された楽曲識別情報が示す楽曲の曲名を表示装置30やリモコン装置50に表示させることができる。或いは、提示部400は、スピーカ20を介して特定された楽曲識別情報が示す楽曲の曲名を放音させてもよい。
【0042】
==カラオケ装置Kの動作について==
次に、図4を参照して本実施形態におけるカラオケ装置Kの動作の具体例について述べる。図4は、カラオケ装置Kの動作例を示すフローチャートである。この例では、利用者Uがカラオケ装置Kを利用するとする。また、情報記憶部100は、図3に示すテーブルを記憶しているとする。また、この例における属性情報はジャンル情報であり、所定条件は「全国のカラオケ装置においてカラオケ演奏がされた合計回数の多い順から5曲」であるとする。
【0043】
利用者Uは、リモコン装置50を操作して「動作検索モード」を選択することにより、撮影手段60による撮影の要求を行う(動作の撮影を要求。ステップ10)。リモコン装置50は、撮影手段60に利用者Uの撮影を開始するよう指示する。撮影手段60は、利用者Uの動作を撮影して動作映像を取得する(動作映像を取得。ステップ11)。撮影手段60は、取得した動作映像のデータを抽出部200に出力する。
【0044】
抽出部200は、ステップ11で取得した動作映像に基づいて、特徴情報を抽出する(動作映像に基づいて特徴情報を抽出。ステップ12)。
【0045】
特定部300は、ステップ12で抽出された特徴情報と一致する属性情報が対応付けられた楽曲識別情報のうち、所定条件を満たす楽曲識別情報を特定する(所定条件を満たす楽曲識別情報を特定。ステップ13)。
【0046】
提示部400は、ステップ13で特定された楽曲識別情報が示す楽曲を、レコメンド楽曲として利用者に対して提示する(レコメンド楽曲を提示。ステップ14)。
【0047】
具体的に、抽出部200は、利用者Uの動作を撮影して得られた動作映像を解析し、動作の特徴Fを求める。抽出部200は、求めた動作の特徴Fを学習済みモデルに入力する。学習済みモデルは、入力された動作の特徴Fと一致または類似する動作の特徴Fsに紐付けられているジャンル情報「ロック」を出力する。抽出部200は、学習済みモデルから出力されたジャンル情報「ロック」を、一の特徴情報として抽出する。
【0048】
特定部300は、情報記憶部100に記憶されている複数のジャンル情報の中から、抽出された特徴情報と一致するジャンル情報「ロック」を選択する。特定部300は、情報記憶部100に記憶されている図3のテーブルを参照し、選択したジャンル情報「ロック」に対応付けられた楽曲IDとしてID***Y1~ID***Yqを特定する。
【0049】
ここで、全国のカラオケ装置においてカラオケ演奏がされた、楽曲Y1~楽曲Yqそれぞれの合計回数が、楽曲Y1、楽曲Y2、楽曲Y3、楽曲Y4、楽曲Y5、楽曲Y6、・・・・の順で多いとする。この場合、特定部300は、特定した楽曲IDのうち、所定条件を満たす楽曲IDとして、楽曲Y1~楽曲Y5の楽曲ID(ID***Y1~ID***Y5)を特定する。
【0050】
提示部400は、特定されたID***Y1~ID***Y5が示す5曲(楽曲Y1~楽曲Y5)の曲名を表示装置30に表示させることにより、それらの楽曲をレコメンド楽曲として利用者Uに対して提示する。
【0051】
以上から明らかなように、本実施形態に係るカラオケ装置Kは、楽曲の属性情報と、当該楽曲の楽曲識別情報とを対応付けて記憶する情報記憶部100と、利用者の動作を撮影して得られた動作映像に基づいて、楽曲の属性情報に対応する特徴情報を抽出する抽出部200と、抽出された特徴情報と一致する属性情報が対応付けられた楽曲識別情報を特定する特定部300と、特定された楽曲識別情報が示す楽曲を、レコメンド楽曲として利用者に対して提示する提示部400と、を有する。
【0052】
このようなカラオケ装置Kによれば、動作映像に基づいて抽出した特徴情報と一致する属性情報が対応付けられた楽曲識別情報を特定することができる。そして、カラオケ装置Kは、特定された楽曲識別情報が示す楽曲を利用者に対して提示することができる。利用者は、カラオケ歌唱を行いたい楽曲の属性情報に対応付けられた特徴的な動き(または特徴的な動きに類似する動き)を行うだけで、リモコン装置50等を操作して楽曲を選曲することなく、適当なレコメンド楽曲の提示を受けることができる。すなわち、本実施形態に係るカラオケ装置Kによれば、利用者の動作に基づいて、カラオケ歌唱を推奨する楽曲を提示できる。
【0053】
また、本実施形態に係るカラオケ装置Kにおける抽出部200は、利用者からの要求に応じて当該利用者の動作を撮影して得られる動作映像に基づいて、特徴情報を抽出し、特定部300は、抽出された特徴情報と一致する属性情報が対応付けられた楽曲識別情報のうち、所定条件を満たす楽曲識別情報を特定することができる。このようなカラオケ装置Kによれば、利用者からの要求に応じて、複数の楽曲識別情報のうち、所定条件を満たす楽曲識別情報が示す楽曲をレコメンド楽曲として提示できる。
【0054】
なお、属性情報がテンポ情報の場合、情報記憶部100は、楽曲のテンポ情報と当該楽曲の楽曲識別情報とを対応付けて記憶し、楽曲のテンポが特徴情報として抽出される。具体的に、抽出部200は、動作映像を解析して、利用者の反復動作の周期からテンポ(たとえば「BPM=120」)を抽出することができる。特定部300は、情報記憶部100に記憶されている複数のテンポ情報の中から、抽出された特徴情報と一致するテンポ情報(たとえば「BPM=116~123」)を選択し、選択したテンポ情報に対応付けられた楽曲識別情報を特定する。
【0055】
<第2実施形態>
次に、図5及び図6を参照して、第2実施形態に係るカラオケ装置について説明する。本実施形態では、カラオケ演奏が行われていない状態が所定時間継続した場合に、所定条件を満たす楽曲識別情報を特定する例について説明を行う。なお、第1実施形態と同様の構成については詳細な説明を省略する。
【0056】
(抽出部)
本実施形態に係る抽出部200は、利用者がカラオケ装置Kを利用している間に当該利用者の動作を撮影して得られた動作映像に基づいて、特徴情報を複数抽出する。特徴情報を抽出する処理は第1実施形態と同様である。
【0057】
本実施形態において、撮影手段60は、利用者がカラオケ装置Kを利用している間、常に利用者の撮影を行い、動作映像を取得する。たとえば、撮影手段60は、利用者がリモコン装置50を操作して自己の利用者識別情報の入力を行った場合(後述)に撮影を開始する。撮影手段60は、取得した動作映像のデータを、順次抽出部200に出力する。
【0058】
抽出部200は、所定のタイミング毎(たとえば、30秒毎)に動作映像を解析し、当該動作映像に含まれる動作の特徴を求める。抽出部200は、求めた動作の特徴を学習済みモデルに入力する。学習済みモデルは、入力された動作の特徴と一致または類似する動作の特徴に紐付けられている属性情報を出力する。抽出部200は、学習済みモデルから出力された属性情報を、特徴情報として抽出する。なお、本実施形態においては、利用者が常に特徴的な動作を行っているとは限らない。よって、抽出部200が動作映像を解析した結果、特徴的な動作が含まれないとなる場合もありうる。
【0059】
また、複数の利用者でカラオケ装置Kを利用する場合もありうる。この場合、抽出部200は、抽出した特徴情報と利用者との対応付けを行う。
【0060】
たとえば、カラオケ装置Kを利用する際、各利用者は、リモコン装置50を操作し、自己の利用者識別情報を入力する。利用者識別情報は、利用者を識別するための利用者ID等、各利用者に固有の情報である。カラオケ装置Kは、入力された利用者の利用者IDを記憶手段10aに記憶させることにより(すなわち、ログイン処理を行うことにより)、カラオケ装置Kに対する利用者のログインを完了させる。カラオケ装置Kは、ログイン処理を行った利用者の利用者IDを外部のサーバ装置に送信し、当該利用者の履歴情報を取得する。履歴情報は歌唱履歴や採点履歴といった過去に行ったカラオケ歌唱の記録の他、利用者の名前、年齢、性別、住所、顔画像等の情報を含む。
【0061】
ここで、利用者が複数いる場合、抽出部200は、動作映像に含まれる動作の特徴を求める際、当該動作を行った利用者の顔画像も併せて抽出する。抽出部200は、抽出した顔画像と履歴情報に含まれる顔画像とを対比することにより、当該動作を行った利用者を特定することができる。抽出部200は、抽出した特徴情報を、特定した利用者の利用者識別情報と対応付けて記憶手段10aに記憶させる。
【0062】
(特定部)
本実施形態に係る特定部300は、カラオケ演奏が行われていない状態が所定時間継続した場合、カラオケ装置の利用開始からその時点までに抽出された複数の特徴情報に基づいて一の特徴情報を決定し、当該一の特徴情報と一致する属性情報が対応付けられた楽曲識別情報のうち、所定条件を満たす楽曲識別情報を特定する。
【0063】
所定時間は、たとえば5分、10分のように予め一の値が設定されている。特定部300は、カラオケ演奏が行われていない状態が発生した後、経過時間のカウントを開始する。
【0064】
カラオケ演奏が行われていない状態が所定時間継続した場合、特定部300は、カラオケ装置の利用開始からその時点までに抽出された複数の特徴情報に基づいて一の特徴情報を決定する。
【0065】
一の特徴情報の決定は、様々な方法により行うことができる。たとえば、特定部300は、カラオケ装置Kの利用開始から、カラオケ演奏が行われていない状態が所定時間継続した時点までに抽出された複数の特徴情報を種類毎に分類し、最も数が多い特徴情報を、一の特徴情報として決定することができる。
【0066】
或いは、特定部300は、複数の特徴情報それぞれの割合に基づいて、一の特徴情報を決定してもよい。
【0067】
たとえば、特定部300は、複数の利用者それぞれについて、抽出した特徴情報の割合を求めたテーブルを作成する。図5は、利用者U1~利用者U4によるカラオケ装置Kの利用開始から、カラオケ演奏が行われていない状態が所定時間継続した時点までに抽出された、利用者毎の特徴情報の割合を示したテーブルである。たとえば、利用者U1の動作を解析した結果得られた特徴情報は、「バラード」が30%であり、「アイドル」が40%であり、「その他」が30%である。また、利用者U1~利用者U4のいずれも「アイドル」の特徴情報が抽出されている一方、「ロック」の特徴情報は、利用者U2のみとなっている。
【0068】
特定部300は、特徴情報毎に割合の平均を求める。図5のテーブルに基づく場合、「バラード」は17.5%であり、「ロック」は12.5%であり、「アイドル」は37.5%であり、「その他」は32.5%となる。特定部300は、たとえば、割合の平均が最も高い「アイドル」を一の特徴情報として決定する。なお、「その他」の割合の平均が最も高くなる場合、特定部300は、「その他」の次に割合の平均が高いジャンルを一の特徴情報として決定してもよい。
【0069】
所定条件は、第1実施形態と同様の条件を設定することができる。また、利用者が複数の場合、たとえば、「各利用者の歌唱履歴の中でカラオケ歌唱の回数の合計値が多い順から3曲」、または「各利用者の採点履歴の中で採点値の平均が高い順から10曲」を所定条件とすることができる。
【0070】
ここで、利用者が複数であり、所定条件が「各利用者の歌唱履歴の中でカラオケ歌唱の回数の合計値が多い順から3曲」であるとする。また、カラオケ装置Kは、各利用者の歌唱履歴を含む履歴情報を外部のサーバ装置から取得しているとする。
【0071】
特定部300は、情報記憶部100に記憶されている複数の属性情報の中から、抽出された特徴情報と一致する属性情報を選択する。また、特定部300は、各利用者の歌唱履歴を参照し、楽曲毎のカラオケ歌唱の合計回数を求める。更に、特定部300は、情報記憶部100を参照し、選択した属性情報に対応付けられた楽曲識別情報のうち、カラオケ歌唱の回数の合計回数の多い順から3曲を選択し、当該3曲の楽曲識別情報を特定する。
【0072】
==カラオケ装置Kの動作について==
次に、図6を参照して本実施形態におけるカラオケ装置Kの動作の具体例について述べる。図6は、カラオケ装置Kの動作例を示すフローチャートである。この例では、利用者U1~利用者U4がカラオケ装置Kを利用するとする。また、情報記憶部100は、図3に示すテーブルを記憶しているとする。また、この例における属性情報はジャンル情報であり、所定条件は「全国のカラオケ装置においてカラオケ演奏がされた合計回数の多い順から5曲」であるとする。
【0073】
利用者U1~利用者U4がカラオケ装置Kの利用を開始した場合(カラオケ装置の利用開始。ステップ20)、撮影手段60は各利用者の撮影を開始する(利用者の撮影を開始。ステップ21)。撮影手段60は、取得した動作映像のデータを抽出部200に出力する。
【0074】
抽出部200は、利用者U1~利用者U4がカラオケ装置Kを利用している間に当該利用者の動作を撮影して得られた動作映像に基づいて、特徴情報を複数抽出する(動作映像に基づいて特徴情報を複数抽出。ステップ22)。
【0075】
カラオケ演奏が行われていない状態が所定時間継続した場合(ステップ23でYの場合)、特定部300は、カラオケ装置Kの利用開始からその時点までに抽出された複数の特徴情報に基づいて一の特徴情報を決定する(複数の特徴情報に基づいて一の特徴情報を決定。ステップ24)。
【0076】
特定部300は、ステップ24で決定した一の特徴情報と一致する属性情報が対応付けられた楽曲識別情報のうち、所定条件を満たす楽曲識別情報を特定する(所定条件を満たす楽曲識別情報を特定。ステップ25)。
【0077】
提示部400は、ステップ25で特定された楽曲識別情報が示す楽曲を、レコメンド楽曲として利用者に対して提示する(レコメンド楽曲を提示。ステップ26)。カラオケ装置Kは、利用者U1~利用者U4がカラオケ装置Kの利用を終了するまで(ステップ27でYの場合)、ステップ21からステップ26の処理を繰り返し行う。
【0078】
具体的に、たとえば抽出部200は、利用者U1がカラオケ歌唱中に行った動作を撮影して得られた動作映像を解析し、利用者U1の動作の特徴F1を求める。抽出部200は、求めた動作の特徴F1を学習済みモデルに入力する。学習済みモデルは、動作の特徴F1と一致または類似する動作の特徴Fs1に紐付けられているジャンル情報「アイドル」を出力する。抽出部200は、学習済みモデルから出力されたジャンル情報「アイドル」を、一の特徴情報として抽出し、利用者U1の利用者IDと対応付けて記憶手段10aに記憶させる。
【0079】
同様に、抽出部200は、利用者U2によるカラオケ歌唱を聴きながら利用者U3が行った動作を撮影して得られた動作映像を解析し、利用者U3の動作の特徴F3を求める。抽出部200は、求めた動作の特徴F3を学習済みモデルに入力する。学習済みモデルは、動作の特徴F3と一致または類似する動作の特徴Fs1に紐付けられているジャンル情報「アイドル」を出力する。抽出部200は、学習済みモデルから出力されたジャンル情報「アイドル」を、一の特徴情報として抽出し、利用者U3の利用者IDと対応付けて記憶手段10aに記憶させる。
【0080】
また、抽出部200は、曲間において、利用者U4がBGMに合わせて行った動作を撮影して得られた動作映像を解析し、利用者U4の動作の特徴F4を求める。抽出部200は、求めた動作の特徴F4を学習済みモデルに入力する。学習済みモデルは、動作の特徴F4と一致また類似する動作の特徴Fs2に紐付けられているジャンル情報「バラード」を出力する。抽出部200は、学習済みモデルから出力されたジャンル情報「バラード」を、一の特徴情報として抽出し、利用者U4の利用者IDと対応付けて記憶手段10aに記憶させる。
【0081】
抽出部200は、所定のタイミング毎に同様の処理を繰り返し行う。なお、一のタイミングにおける動作映像中において複数の利用者がそれぞれ特徴的な動作を行っている場合もありうる。この場合、抽出部200は、利用者毎に動作映像の解析を行い、それぞれの特徴情報を抽出する。
【0082】
一方、カラオケ演奏が行われていない状態が所定時間継続した場合、特定部300は、カラオケ装置Kの利用開始からその時点までに抽出された複数の特徴情報に基づいて一の特徴情報を決定する。この例では、特定部300が、図5に示したテーブルを作成し、割合の平均が最も高い「アイドル」を一の特徴情報として決定したとする。
【0083】
この場合、特定部300は、情報記憶部100に記憶されている図3のテーブルを参照し、選択したジャンル情報「アイドル」に対応付けられた楽曲IDとしてID***Z1~ID***Zrを特定する。
【0084】
ここで、全国のカラオケ装置においてカラオケ演奏がされた、楽曲Z1~楽曲Zrそれぞれの合計回数が、楽曲Z1、楽曲Z2、楽曲Z3、楽曲Z4、楽曲Z5、楽曲Z6、・・・・の順で多いとする。この場合、特定部300は、特定した楽曲IDのうち、所定条件を満たす楽曲IDとして、楽曲Z1~楽曲Z5の楽曲ID(ID***Z1~ID***Z5)を特定する。
【0085】
提示部400は、特定されたID***Z1~ID***Z5が示す5曲(楽曲Z1~楽曲Z5)の曲名を表示装置30に表示させることにより、それらの楽曲をレコメンド楽曲として利用者U1~利用者U4に対して提示する。
【0086】
なお、提示部400は、利用者U1~利用者U4のうち、特徴情報「アイドル」の割合が最も高い利用者U4に対して、レコメンド楽曲を提示してもよい。たとえば、提示部400は、「利用者U4にお勧めの楽曲は、楽曲Z1~楽曲Z5です」といった文章を表示装置30に表示させることができる。
【0087】
以上から明らかなように、本実施形態に係るカラオケ装置Kにおける抽出部200は、利用者がカラオケ装置Kを利用している間に当該利用者の動作を撮影して得られた動作映像に基づいて、特徴情報を複数抽出し、特定部300は、カラオケ演奏が行われていない状態が所定時間継続した場合、カラオケ装置Kの利用開始からその時点までに抽出された複数の特徴情報に基づいて一の特徴情報を決定し、当該一の特徴情報と一致する属性情報が対応付けられた楽曲識別情報のうち、所定条件を満たす楽曲識別情報を特定する。
【0088】
このようなカラオケ装置Kによれば、カラオケ演奏が行われていない状態が所定時間継続した場合に、カラオケ装置Kの利用開始からその時点までに抽出された複数の特徴情報に基づいて、楽曲識別情報を特定することができる。すなわち、本実施形態に係るカラオケ装置Kによれば、利用者の動作に基づいて、カラオケ歌唱を推奨する楽曲を提示できる。
【0089】
<その他>
上記実施形態は、例として提示したものであり、発明の範囲を限定するものではない。上記の構成は、適宜組み合わせて実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0090】
100 情報記憶部
200 抽出部
300 特定部
400 提示部
K カラオケ装置
図1
図2
図3
図4
図5
図6