(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024108036
(43)【公開日】2024-08-09
(54)【発明の名称】カラオケ装置
(51)【国際特許分類】
G10K 15/04 20060101AFI20240802BHJP
【FI】
G10K15/04 302D
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2023012290
(22)【出願日】2023-01-30
(71)【出願人】
【識別番号】390004710
【氏名又は名称】株式会社第一興商
(74)【代理人】
【識別番号】110000176
【氏名又は名称】弁理士法人一色国際特許事務所
(72)【発明者】
【氏名】石川 雅康
【テーマコード(参考)】
5D208
【Fターム(参考)】
5D208CA09
5D208CC15
5D208CE04
(57)【要約】
【課題】支援コンテンツを再生する際に、指導者のサポートが可能なカラオケ装置を提供する。
【解決手段】利用者の集中度を取得する集中度取得部と、支援コンテンツの再生中に指導者が発話した場合、集中度が第1の所定条件を満たすかどうかを判定する判定部、発話に対応するテキスト情報を生成する生成部、サポート情報とコンテンツ識別情報とを対応付けて記憶させる記憶処理部、ある支援コンテンツのコンテンツ識別情報が対応付けられたサポート情報を読み出し、当該ある支援コンテンツの再生中に、読み出した当該サポート情報に含まれる発話を開始した時刻が到来した場合、当該サポート情報に含まれるテキスト情報に対応する発話を放音手段から放音させるサポート処理部を有するカラオケ装置。
【選択図】
図2
【特許請求の範囲】
【請求項1】
利用者の身体に関する能力の維持または改善を支援するための支援コンテンツを再生可能なカラオケ装置であって、
支援コンテンツの再生中に撮影手段により撮影された利用者の映像から、利用者の集中度を取得する集中度取得部と、
支援コンテンツの再生中に指導者が発話した場合、当該発話した期間において取得された前記集中度が第1の所定条件を満たすかどうかを判定する判定部と、
取得された前記集中度が前記第1の所定条件を満たすと判定された場合、前記発話に対応するテキスト情報を生成する生成部と、
生成された前記テキスト情報及び前記支援コンテンツの再生時間における前記発話を開始した時刻を含むサポート情報と、当該支援コンテンツのコンテンツ識別情報とを対応付けて記憶手段に記憶させる記憶処理部と、
ある支援コンテンツを再生する場合、前記記憶手段から当該ある支援コンテンツのコンテンツ識別情報が対応付けられたサポート情報を読み出し、当該ある支援コンテンツの再生中に、読み出した当該サポート情報に含まれる発話を開始した時刻が到来した場合、当該サポート情報に含まれるテキスト情報に対応する発話を放音手段から放音させるサポート処理部と、
を有するカラオケ装置。
【請求項2】
前記集中度取得部は、前記ある支援コンテンツの再生中に撮影手段により撮影された利用者の映像から、利用者の集中度を取得し、
前記サポート処理部は、前記ある支援コンテンツの再生中に、読み出した前記サポート情報に含まれる発話を開始した時刻が到来した場合、且つ取得した前記集中度が第2の所定条件を満たした場合、前記サポート情報に含まれるテキスト情報に対応する発話を放音手段から放音させることを特徴とする請求項1記載のカラオケ装置。
【請求項3】
利用者の身体に関する能力の維持または改善を支援するための支援コンテンツを再生可能なカラオケ装置であって、
支援コンテンツの再生中に撮影手段により撮影された利用者の映像から、利用者の集中度を取得する集中度取得部と、
支援コンテンツの再生中に指導者が動作をした場合、当該動作をした期間において取得された前記集中度が第3の所定条件を満たすかどうかを判定する判定部と、
取得された前記集中度が前記第3の所定条件を満たすと判定された場合、支援コンテンツの再生中に撮影手段により撮影された指導者の映像に基づき、指導者の動きに対応するジェスチャー情報を生成する生成部と、
生成された前記ジェスチャー情報及び前記支援コンテンツの再生時間における前記動作を開始した時刻を含むサポート情報と、当該支援コンテンツのコンテンツ識別情報とを対応付けて記憶手段に記憶させる記憶処理部と、
ある支援コンテンツを再生する場合、前記記憶手段から当該ある支援コンテンツのコンテンツ識別情報が対応付けられたサポート情報を読み出し、当該ある支援コンテンツの再生中に、読み出した当該サポート情報に含まれる動作を開始した時刻が到来した場合、当該サポート情報に含まれるジェスチャー情報に対応する動作を表示手段に表示させ、及び/または当該サポート情報に含まれるジェスチャー情報に対応する動作を外部機器に実行させるための制御信号を生成し、当該外部機器に送信するサポート処理部と、
を有するカラオケ装置。
【請求項4】
前記集中度取得部は、前記ある支援コンテンツの再生中に撮影手段により撮影された利用者の映像から、利用者の集中度を取得し、
前記サポート処理部は、前記ある支援コンテンツの再生中に、読み出した前記サポート情報に含まれる動作を開始した時刻が到来した場合、且つ取得した前記集中度が第4の所定条件を満たした場合、前記サポート情報に含まれるジェスチャー情報に対応する動作を表示手段に表示させ、及び/または当該サポート情報に含まれるジェスチャー情報に対応する動作を外部機器に実行させるための制御信号を生成し、当該外部機器に送信することを特徴とする請求項3記載のカラオケ装置。
【請求項5】
支援コンテンツの再生中に撮影手段により撮影された利用者の属性情報を取得する属性情報取得部を有し、
前記記憶処理部は、取得した前記属性情報を含む前記サポート情報を前記記憶手段に記憶させ、
前記サポート処理部は、前記ある支援コンテンツを再生する場合、当該ある支援コンテンツのコンテンツ識別情報が対応付けられた複数のサポート情報のうち、属性情報が第5の所定条件を満たすサポート情報を読み出すことを特徴とする請求項1から4のいずれか一つに記載のカラオケ装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はカラオケ装置に関する。
【背景技術】
【0002】
カラオケ装置は、様々なコンテンツを備える。コンテンツの中には、利用者の身体に関する能力の維持または改善を支援するための支援コンテンツ(たとえば、介護予防、健康増進、機能訓練を目的としたコンテンツ)がある。
【0003】
非特許文献1には、介護予防を支援するための様々なコンテンツを再生可能な生活総合機能改善機器が開示されている。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】「DK ELDER SYSTEM」、株式会社第一興商、[令和5年1月28日検索]、インターネット、<URL:https://dk-eldersystem.com/>
【発明の概要】
【発明が解決しようとする課題】
【0005】
ここで、カラオケ装置を用いて支援コンテンツを再生する場合、施設のスタッフやトレーナー(以下、「指導者」)は、利用者に対して支援コンテンツの実施を促すような発話や動作を行う。この場合、ベテランの指導者は、利用者に対して適切なタイミングで効果的な発話や動作を行うことができる。一方で、経験の浅い指導者や発話に苦手意識を持つ指導者にとっては、ベテランの指導者等と同様の対応を行うことが困難である。
【0006】
本発明の目的は、支援コンテンツを再生する際に、指導者のサポートが可能なカラオケ装置を提供することにある。
【課題を解決するための手段】
【0007】
上記目的を達成するための一の発明は、利用者の身体に関する能力の維持または改善を支援するための支援コンテンツを再生可能なカラオケ装置であって、支援コンテンツの再生中に撮影手段により撮影された利用者の映像から、利用者の集中度を取得する集中度取得部と、支援コンテンツの再生中に指導者が発話した場合、当該発話した期間において取得された前記集中度が第1の所定条件を満たすかどうかを判定する判定部と、取得された前記集中度が前記第1の所定条件を満たすと判定された場合、前記発話に対応するテキスト情報を生成する生成部と、生成された前記テキスト情報及び前記支援コンテンツの再生時間における前記発話を開始した時刻を含むサポート情報と、当該支援コンテンツのコンテンツ識別情報とを対応付けて記憶手段に記憶させる記憶処理部と、ある支援コンテンツを再生する場合、前記記憶手段から当該ある支援コンテンツのコンテンツ識別情報が対応付けられたサポート情報を読み出し、当該ある支援コンテンツの再生中に、読み出した当該サポート情報に含まれる発話を開始した時刻が到来した場合、当該サポート情報に含まれるテキスト情報に対応する発話を放音手段から放音させるサポート処理部と、を有するカラオケ装置である。
また、上記目的を達成するための他の発明は、利用者の身体に関する能力の維持または改善を支援するための支援コンテンツを再生可能なカラオケ装置であって、支援コンテンツの再生中に撮影手段により撮影された利用者の映像から、利用者の集中度を取得する集中度取得部と、支援コンテンツの再生中に指導者が動作をした場合、当該動作をした期間において取得された前記集中度が第3の所定条件を満たすかどうかを判定する判定部と、取得された前記集中度が前記第3の所定条件を満たすと判定された場合、支援コンテンツの再生中に撮影手段により撮影された指導者の映像に基づき、指導者の動きに対応するジェスチャー情報を生成する生成部と、生成された前記ジェスチャー情報及び前記支援コンテンツの再生時間における前記動作を開始した時刻を含むサポート情報と、当該支援コンテンツのコンテンツ識別情報とを対応付けて記憶手段に記憶させる記憶処理部と、ある支援コンテンツを再生する場合、前記記憶手段から当該ある支援コンテンツのコンテンツ識別情報が対応付けられたサポート情報を読み出し、当該ある支援コンテンツの再生中に、読み出した当該サポート情報に含まれる動作を開始した時刻が到来した場合、当該サポート情報に含まれるジェスチャー情報に対応する動作を表示手段に表示させ、及び/または当該サポート情報に含まれるジェスチャー情報に対応する動作を外部機器に実行させるための制御信号を生成し、当該外部機器に送信するサポート処理部と、を有するカラオケ装置である。
本発明の他の特徴については、後述する明細書及び図面の記載により明らかにする。
【発明の効果】
【0008】
本発明によれば、支援コンテンツを再生する際に、指導者のサポートができる。
【図面の簡単な説明】
【0009】
【
図1】第1実施形態に係るカラオケ装置を示す図である。
【
図2】第1実施形態に係るカラオケ本体を示す図である。
【
図3】第1実施形態に係るカラオケ装置の処理を示すフローチャートである。
【
図4】第1実施形態に係るカラオケ装置の処理を示すフローチャートである。
【
図5】第1実施形態に係る記憶手段に記憶されているテーブルを示す図である。
【
図6】第2実施形態に係るカラオケ装置を示す図である。
【
図7】第2実施形態に係るカラオケ装置の処理を示すフローチャートである。
【
図8】第2実施形態に係るカラオケ装置の処理を示すフローチャートである。
【
図9】第2実施形態に係る記憶手段に記憶されているテーブルを示す図である。
【
図10】変形例2に係るカラオケ本体を示す図である。
【
図11】変形例2に係る記憶手段に記憶されているテーブルを示す図である。
【発明を実施するための形態】
【0010】
<第1実施形態>
図1~
図5を参照して、第1実施形態に係るカラオケ装置について説明する。
【0011】
==カラオケ装置==
図1に示すように、カラオケ装置Kは、カラオケ本体10、スピーカ20、表示装置30、マイク40、リモコン装置50、及び撮影手段60を備える。カラオケ本体10は、カラオケ装置Kに関する各種の制御を行う。スピーカ20はカラオケ本体10からの放音信号に基づいて放音するための構成である。スピーカ20は、「放音手段」の一例である。表示装置30はカラオケ本体10からの信号に基づいて映像や画像を画面に表示するための構成である。マイク40は入力された音声をアナログの音声信号に変換してカラオケ本体10に入力するための構成である。リモコン装置50は、カラオケ本体10に対する各種操作をおこなうための装置である。撮影手段60は、静止画及び動画の撮影が可能なカメラである。
【0012】
カラオケ装置Kは、介護施設やデイサービス施設、レクリエーションを行うイベント会場等、利用者が介護予防、健康増進、機能訓練等を行う場所に設置される。カラオケ装置Kは、支援コンテンツを再生可能である。支援コンテンツは、利用者の身体に関する能力の維持または改善を支援するためのものである。具体的には、音楽に合わせて一緒に歌うコンテンツ、映像を見ながら体を動かすコンテンツ、映像を見ながら記憶を刺激するコンテンツ等、目的に応じた複数のコンテンツ等である。各コンテンツは、たとえば2分、5分のように、予め所定の再生時間が設定されている。身体に関する能力は、筋力、筋持久力、瞬発力、心肺持久力、敏捷性、平衡性、柔軟性のような身体能力、これらの総合である体力、記憶力や言語理解力のような認知力である。また身体に関する能力として、コミュニケーション力等を含んでもよい。
【0013】
カラオケ装置Kは、介護施設の職員やトレーナー等、利用者による支援コンテンツの実施をサポートする者(以下「指導者」)が操作を行う。指導者は、複数の支援コンテンツの中から利用者に適したコンテンツを選択する。カラオケ装置Kは、指導者が選択した支援コンテンツを再生する。利用者は、カラオケ装置Kのスピーカ20から放音される楽曲のカラオケ演奏音や表示装置30に表示される映像に合わせて支援コンテンツを実施する。支援コンテンツの実施とは、たとえば、映像に合わせて体を動かしたり、カラオケ演奏音に合わせて歌を歌ったりすることである。一方、指導者は、利用者に対して支援コンテンツの実施を促すような発話や動作を行う。
【0014】
また、カラオケ装置Kは、指導者の発話を記憶する「発話記憶モード」、及び支援コンテンツを再生する際に、記憶された発話を用いて指導者をサポートする「発話サポートモード」を備えている。各モードの選択は、リモコン装置50等を介して行うことができる。
【0015】
図2に示すように、本実施形態に係るカラオケ本体10は、記憶手段10a、通信手段10b、入力手段10c、演奏手段10d、及び制御手段10eを備える。各構成はインターフェース(図示なし)を介してバスBに接続されている。
【0016】
[記憶手段]
記憶手段10aは、各種のデータを記憶する大容量の記憶装置である。本実施形態において、記憶手段10aは、コンテンツデータをコンテンツ識別情報と対応付けて記憶している。
【0017】
コンテンツデータは、支援コンテンツを再生するためのデータである。具体的に、コンテンツデータは、コンテンツの内容に応じた映像データ、楽曲の演奏データ、音声データ等である。コンテンツ識別情報は、コンテンツを識別するためのコンテンツID等、各コンテンツに固有の情報である。
【0018】
[通信手段・入力手段]
通信手段10bは、リモコン装置50や外部の各種装置・機器(たとえばサーバ装置(図示なし)や人型ロボットのような外部機器(第2実施形態参照))との通信を行うためのインターフェースを提供する。入力手段10cは、指導者が各種の指示入力を行うための構成である。入力手段10cは、カラオケ本体10に設けられたボタン等である。或いは、リモコン装置50が入力手段10cとして機能してもよい。
【0019】
[演奏手段]
演奏手段10dは、制御手段10eの制御に基づき、コンテンツデータの再生処理、及びマイク40を通じて入力された音声に基づく信号の処理を行う。演奏手段10dは、音源、ミキサ、アンプ等を含む(いずれも図示なし)。
【0020】
[制御手段]
制御手段10eは、カラオケ装置Kにおける各種の制御を行う。制御手段10eは、CPUおよびメモリ(いずれも図示無し)を備える。CPUは、メモリに記憶されたプログラムを実行することにより各種の機能を実現する。
【0021】
本実施形態においてはCPUがメモリに記憶されるプログラムを実行することにより、制御手段10eは、集中度取得部100、判定部200、生成部300、記憶処理部400、及びサポート処理部500として機能する。
【0022】
(集中度取得部)
集中度取得部100は、支援コンテンツの再生中に撮影手段60により撮影された利用者の映像から、利用者の集中度を取得する。
【0023】
映像に含まれる人物の集中度を取得する方法は、公知の技術(たとえば、特開2016-032261号公報記載の技術)を利用できる。集中度は、たとえば1(最も集中していない)~10(最も集中している)のように、数値として取得できる。
【0024】
ここで、カラオケ装置Kを用いて支援コンテンツを再生する際、ある指導者が、自己の発話を他の指導者のサポート用に残しておきたいと考えたとする。この場合、指導者は、リモコン装置50等を介して、発話記憶モードを予め選択した後、支援コンテンツの選択を行う。その後、カラオケ装置Kは、選択された支援コンテンツの再生を開始する。撮影装置60は、支援コンテンツの再生開始に伴い、利用者の撮影を開始する。
【0025】
集中度取得部100は、支援コンテンツの再生開始後に集中度の取得を開始する。集中度取得部100は、撮影手段60から利用者の映像に対応するデータを取得し、映像に含まれる利用者の集中度を取得する。集中度の取得は、連続して行ってもよいし、所定のタイミング毎(たとえば5秒毎、10秒毎)に行ってもよい。たとえば、集中度取得部100は、支援コンテンツの再生開始から再生終了後まで5秒毎に集中度を取得する。集中度取得部100は、取得した集中度を判定部200に出力する。
【0026】
なお、撮影手段60が撮影した映像に複数の利用者が含まれている場合、集中度取得部100は、利用者毎に集中度を求めることができる。この場合、集中度取得部100は、利用者毎の集中度の平均や分散のような統計量を、利用者の集中度として取得する。
【0027】
(判定部)
判定部200は、支援コンテンツの再生中に指導者が発話した場合、当該発話した期間において取得された集中度が第1の所定条件を満たすかどうかを判定する。
【0028】
判定部200は、マイク40を介した音声入力があったかどうかにより、支援コンテンツの再生中に指導者が発話したかどうかを判断する。たとえば、判定部200は、支援コンテンツの再生開始後にマイク40を介した音声入力があった場合、指導者が発話したと判断する。一方、判定部200は、ある音声入力があった後、入力がない期間が所定時間(たとえば3秒以上)続いた場合、指導者の発話が終了したと判断する。
【0029】
第1の所定条件は、生成部300による処理(後述)を実行するかどうかを判断するための条件である。具体的に第1の所定条件は、「指導者がある発話を開始した時刻における利用者の集中度が3未満であり、且つ指導者が当該ある発話を終了した時刻における利用者の集中度が5以上」、「指導者がある発話を終了した時刻における利用者の集中度が、当該ある発話を開始した時刻における利用者の集中度よりも+2以上」、「発話した期間において取得された集中度の平均値が8以上」といったものである。ある発話を開始した時刻における集中度よりもある発話を終了した時刻における集中度の方が高くなっている場合や集中度が高い値を維持している場合、ある発話が支援コンテンツの実施に対して効果的であると判断できる。このような発話は、他の指導者のサポート用として有益である。
【0030】
たとえば、判定部200は、支援コンテンツの再生開始後にマイク40を介した音声入力があった時刻Tsにおける利用者の集中度Csを取得する。その後、判定部200は、マイク40を介した音声入力が終了した時刻Teにおける利用者の集中度Ceを参照する。なお、時刻Ts及び時刻Teは、支援コンテンツの再生開始を基準(0秒)とした場合の時刻である。
【0031】
判定部200は、集中度Cs及び集中度Ceが第1の所定条件を満たすかどうかを判断する。第1の所定条件を満たすと判定した場合、判定部200は、判定結果を生成部300に出力する。
【0032】
なお、判定部200が判定に使用する集中度は、発話がされた期間において取得された集中度であればよく、発話を開始した時刻及び終了した時刻における集中度に限られない。
【0033】
(生成部)
生成部300は、取得された集中度が第1の所定条件を満たすと判定された場合、発話に対応するテキスト情報を生成する。
【0034】
発話のような音声をテキスト化する方法は、公知の技術(たとえばGoogle音声のような音声から文字起こしを可能とするソフトウェア)を利用できる。
【0035】
上記例において、判定部200から集中度Cs及び集中度Ceが第1の所定条件を満たすという判定結果が出力された場合、生成部300は、時刻Tsから時刻Teまでに発話された音声をテキスト化することでテキスト情報を生成する。
【0036】
(記憶処理部)
記憶処理部400は、生成されたテキスト情報及び支援コンテンツの再生時間における発話を開始した時刻を含むサポート情報と、当該支援コンテンツのコンテンツ識別情報とを対応付けて記憶手段10aに記憶させる。
【0037】
上記例において、記憶処理部400は、時刻Tsから時刻Teまでに発話された音声をテキスト化したテキスト情報、及び発話を開始した時刻Tsを含むサポート情報を、コンテンツ識別情報と対応付けて記憶手段10aに記憶させる。
【0038】
このような処理を繰り返し行うことにより、一の支援コンテンツに対して種類の異なる複数のサポート情報が設定される。なお、記憶処理部400は、コンテンツ識別情報と対応付けたサポート情報を記憶手段10aに記憶させる代わりに、外部のサーバ装置の記憶手段に記憶させてもよい。
【0039】
(サポート処理部)
サポート処理部500は、ある支援コンテンツを再生する場合、記憶手段10aから当該ある支援コンテンツのコンテンツ識別情報が対応付けられたサポート情報を読み出し、当該ある支援コンテンツの再生中に、読み出した当該サポート情報に含まれる発話を開始した時刻が到来した場合、当該サポート情報に含まれるテキスト情報に対応する発話を放音手段から放音させる。
【0040】
テキスト情報を音声に変換する方法は、公知の技術(たとえば特開平8-087289号公報)を利用できる。
【0041】
たとえば、ある指導者が、カラオケ装置Kを用いて支援コンテンツを再生する際に、発話のサポートを得たいと考えたとする。この場合、指導者は、リモコン装置50等を介して、発話サポートモードを予め選択した後、支援コンテンツの選択を行う。サポート処理部500は、記憶手段10aから、指導者が選択した支援コンテンツのコンテンツ識別情報に対応付けられたサポート情報を読み出す。
【0042】
その後、カラオケ装置Kは、ある支援コンテンツの再生を開始する。サポート処理部500は、ある支援コンテンツの再生開始からの経過時間を参照する。
【0043】
ここで、ある支援コンテンツの再生中に、読み出したサポート情報に含まれる発話を開始した時刻が到来した場合、サポート処理部500は、当該サポート情報に含まれるテキスト情報を音声データに変換し、テキスト情報に対応する発話をスピーカ20から放音させる。なお、テキスト情報に対応する発話を放音させる放音手段は、カラオケ装置K自体が備えるものでなくともよい。たとえば、放音手段としては、カラオケ装置Kと有線または無線通信が可能な外付けのスピーカを用いることができる。
【0044】
==カラオケ装置Kの動作について==
次に、
図3から
図5を参照して本実施形態におけるカラオケ装置Kの動作の具体例について述べる。
図3は発話記憶モードの処理を示すフローチャートである。
図4は発話サポートモードの処理を示すフローチャートである。
図5は記憶手段10aに記憶されたサポート情報及びコンテンツIDのテーブルである。この例における集中度は、1(最も集中度が低い)~10(最も集中度が高い)の10段階であるとする。また、第1の所定条件は「指導者がある発話を開始した時刻における利用者の集中度が3未満であり、且つ指導者が当該ある発話を終了した時刻における利用者の集中度が5以上」であるとする。
【0045】
[発話記憶モードの処理]
指導者L1は、リモコン装置50を介して、発話記憶モードを選択した後、「口から健康!スタート編」の支援コンテンツSC1を選択する。カラオケ装置Kは、選択された支援コンテンツSC1のコンテンツデータを記憶手段10aから読み出し、再生を開始する(支援コンテンツの再生開始。ステップ10)。撮影装置60は、支援コンテンツSC1の再生開始に伴い、支援コンテンツSC1を実施する利用者の撮影を行う(利用者の撮影。ステップ11)。
【0046】
集中度取得部100は、支援コンテンツSC1の再生中に撮影手段60により撮影された利用者の映像から、利用者の集中度を取得する(利用者の集中度を取得。ステップ12)。
【0047】
ここで、支援コンテンツSC1の再生中に指導者L1が発話した場合(ステップ13でYの場合)、判定部200は、指導者L1が発話した期間において取得された集中度が第1の所定条件を満たすかどうかを判定する。第1の所定条件を満たすと判定した場合(ステップ14でYの場合)、判定部200は判定結果を生成部300に出力する。
【0048】
たとえば、判定部200は、支援コンテンツSC1の再生開始後、時刻Ts1(20秒)においてマイク40を介した音声入力があった場合、指導者L1が発話したと判断する。判定部200は、時刻Ts1における利用者の集中度Cs1(2.0)を取得する。一方、判定部200は、音声入力があった後、入力がない期間が3秒以上続いた場合、指導者L1の発話が終了したと判断する。判定部200は、マイク40を介した音声入力が終了した時刻Te1(28秒)における利用者の集中度Ce1(7.0)を取得する。
【0049】
判定部200は、利用者の集中度Cs1及びCe1が第1の所定条件を満たすかどうかを判定する。この例では、指導者L1が発話を開始した時刻Ts1における利用者の集中度が2.0であり、且つ指導者L1が発話を終了した時刻Te1における利用者の集中度が7.0であるため、第1の所定条件を満たしている。よって、判定部200は、判定結果を生成部300に出力する。
【0050】
生成部300は、ステップ12で取得された集中度が第1の所定条件を満たすと判定された場合、発話に対応するテキスト情報を生成する(テキスト情報を生成。ステップ15)。
【0051】
上述の通り、判定部200から利用者の集中度Cs1及び集中度Ce1が第1の所定条件を満たすという判定結果が出力された場合、生成部300は、時刻Ts1から時刻Te1までに指導者L1が発話した音声(この例では「一つ一つの言葉をしっかり発音し、口を大きく開けながら歌ってみましょう。表情が豊かになり、お話もスムーズにできるようになります」)をテキスト化することでテキスト情報Tx1を生成する。
【0052】
記憶処理部400は、ステップ15で生成されたテキスト情報及び支援コンテンツの再生時間における発話を開始した時刻を含むサポート情報と、支援コンテンツのコンテンツIDとを対応付けて記憶手段10aに記憶させる(サポート情報及びコンテンツIDを記憶。ステップ16)。カラオケ装置Kは、支援コンテンツSC1の再生終了まで(ステップ17でYの場合)、ステップ11からステップ16の処理を繰り返し行う。
【0053】
上述のテキスト情報Tx1が生成された場合、記憶処理部400は、テキスト情報Tx1及び支援コンテンツSC1の再生時間における発話を開始した時刻Ts1を含むサポート情報と、支援コンテンツSC1のコンテンツID***SC1とを対応付けて記憶手段10aに記憶させる。
図5に示すように、記憶手段10aには、支援コンテンツSC1のコンテンツID***SC1に対し、複数のサポート情報SP1~SP3が対応付けて記憶されている。
【0054】
[発話サポートモードの処理]
指導者L1に比べて経験の浅い指導者L2が利用者に対して「口から健康!スタート編」の支援コンテンツSC1を実施させようと考えたとする。指導者L2は、リモコン装置50を介して、発話サポートモードを選択した後、「口から健康!スタート編」の支援コンテンツSC1を選択する。
【0055】
サポート処理部500は、支援コンテンツSC1を再生する場合、記憶手段10aから支援コンテンツSC1のコンテンツID***SC1が対応付けられたサポート情報を読み出す(サポート情報の読み出し。ステップ20)。この例において、サポート処理部500は、コンテンツID***SC1に対応付けられているサポート情報SP1~SP3を読み出す。
【0056】
カラオケ装置Kは、選択された支援コンテンツSC1のコンテンツデータを記憶手段10aから読み出し、再生を開始する(支援コンテンツの再生開始。ステップ21)。
【0057】
サポート処理部500は、支援コンテンツSC1の再生中に、ステップ20で読み出したサポート情報に含まれる発話を開始した時刻が到来したかどうかを確認する。ステップ20で読み出したサポート情報に含まれる発話を開始した時刻が到来した場合(ステップ22でYの場合)、サポート処理部500は、サポート情報に含まれるテキスト情報に対応する発話をスピーカ20から放音させる(発話を放音。ステップ23)。カラオケ装置Kは、支援コンテンツSC1の再生終了まで(ステップ24でYの場合)、ステップ22及びステップ23の処理を繰り返し行う。
【0058】
上述の通り、カラオケ装置Kが支援コンテンツSC1の再生を開始した場合、サポート処理部500は、支援コンテンツSC1の再生開始からの経過時間を参照する。サポート情報SP1に含まれる発話を開始した時刻Ts1(20秒)が到来した場合、サポート処理部500は、サポート情報SP1に含まれるテキスト情報Tx1を音声データに変換し、テキスト情報Tx1に対応する発話(一つ一つの言葉をしっかり発音し、口を大きく開けながら歌ってみましょう。表情が豊かになり、お話もスムーズにできるようになります)をスピーカ20から放音させる。
【0059】
なお、サポート情報に含まれる発話を開始した時刻が到来した際に指導者が別の発話している場合、サポート処理部500は、当該サポート情報に含まれるテキスト情報に対応する発話の放音を中止することができる。このような処理を行うことにより、指導者の発話を妨げることを抑制できる。
【0060】
また、一の支援コンテンツに対して複数のサポート情報が記憶されている場合、発話を開始した時刻が同じサポート情報や発話した期間が重複するサポート情報もありうる。この場合、サポート処理部500は、ランダムに一のサポート情報を特定し、当該サポート情報に含まれるテキスト情報に対応する発話を放音手段から放音させることができる。
【0061】
==第1実施形態のまとめ==
以上から明らかなように、本実施形態に係るカラオケ装置Kは、利用者の身体に関する能力の維持または改善を支援するための支援コンテンツを再生可能である。カラオケ装置Kは、支援コンテンツの再生中に撮影手段60により撮影された利用者の映像から、利用者の集中度を取得する集中度取得部100と、支援コンテンツの再生中に指導者が発話した場合、当該発話した期間において取得された集中度が第1の所定条件を満たすかどうかを判定する判定部200と、取得された集中度が第1の所定条件を満たすと判定された場合、発話に対応するテキスト情報を生成する生成部300と、生成されたテキスト情報及び支援コンテンツの再生時間における発話を開始した時刻を含むサポート情報と、当該支援コンテンツのコンテンツ識別情報とを対応付けて記憶手段10aに記憶させる記憶処理部400と、ある支援コンテンツを再生する場合、記憶手段10aから当該ある支援コンテンツのコンテンツ識別情報が対応付けられたサポート情報を読み出し、当該ある支援コンテンツの再生中に、読み出した当該サポート情報に含まれる発話を開始した時刻が到来した場合、当該サポート情報に含まれるテキスト情報に対応する発話をスピーカ20から放音させるサポート処理部500と、を有する。
【0062】
このようなカラオケ装置Kによれば、利用者の集中度に応じたサポート情報を、支援コンテンツ毎に予め記憶しておくことができる。またこのようなカラオケ装置Kによれば、、支援コンテンツを再生する際に、当該支援コンテンツに対応するサポート情報に含まれる発話を開始した時刻で、当該サポート情報に含まれるテキスト情報に対応する発話を放音させることができる。サポート情報に含まれる発話を開始した時刻は、利用者の集中度を高める発話が開始された時刻、すなわち利用者に対して発話する適切なタイミングである。またサポート情報に含まれるテキスト情報に対応する発話は、利用者の集中度を高める発話、すなわち利用者に対して効果的な発話である。このような適切なタイミングで効果的な発話を放音させることにより、経験の浅い指導者であってもベテランの指導者と同様の対応を行うことができる。すなわち、本実施形態に係るカラオケ装置Kによれば、支援コンテンツを再生する際に、指導者のサポートができる。
【0063】
<第1実施形態の変形例>
指導者からコンテンツの実施を促すような発話がなくとも集中して取り組む利用者もいる。或いは、経験の浅い指導者であっても適切なタイミングで効果的な発話を行うことができる場合もありうる。これらの場合、記憶されているサポート情報に基づいて発話を放音させる必要はない。本変形例では所定の条件を満たした場合にのみサポート情報に含まれるテキスト情報に対応する発話を放音手段から放音させる例について述べる。
【0064】
(集中度取得部)
本変形例に係る集中度取得部100は、ある支援コンテンツの再生中に撮影手段60により撮影された利用者の映像から、利用者の集中度を取得する。
【0065】
たとえば、ある指導者が、カラオケ装置Kを用いて支援コンテンツを再生する際に、発話のサポートを得たいと考えたとする。この場合、指導者は、リモコン装置50等を介して、発話サポートモードを予め選択した後、支援コンテンツの選択を行う。サポート処理部500は、記憶手段10aから、指導者が選択した支援コンテンツのコンテンツ識別情報に対応付けられたサポート情報を読み出す。
【0066】
その後、カラオケ装置Kは、ある支援コンテンツの再生を開始する。撮影装置60は、支援コンテンツの再生開始に伴い、利用者の撮影を開始する。
【0067】
集中度取得部100は、支援コンテンツの再生開始後に集中度の取得を開始する。集中度取得部100は、撮影手段60から利用者の映像に対応するデータを取得し、映像に含まれる利用者の集中度を取得する。集中度取得部100は、取得した集中度をサポート処理部500に出力する。
【0068】
(サポート処理部)
本変形例に係るサポート処理部500は、ある支援コンテンツの再生中に、読み出したサポート情報に含まれる発話を開始した時刻が到来した場合、且つ取得した集中度が第2の所定条件を満たした場合、サポート情報に含まれるテキスト情報に対応する発話を放音手段から放音させる。
【0069】
第2の所定条件は、サポート情報に含まれるテキスト情報に対応する発話を放音するかどうかを判断するための条件である。具体的に第2の所定条件は、「読み出したサポート情報に含まれる発話を開始した時刻が到来した時点における利用者の集中度が3未満」といったものである。読み出したサポート情報に含まれる発話を開始した時刻が到来した時刻における集中度が低い場合、効果的な発話を放音させるメリットが生まれる。
【0070】
上記例において、サポート処理部500は、記憶手段10aから、指導者が選択した支援コンテンツのコンテンツ識別情報に対応付けられたサポート情報を読み出す。サポート処理部500は、ある支援コンテンツの再生開始からの経過時間を参照する。
【0071】
ここで、ある支援コンテンツの再生中に、読み出したサポート情報に含まれる発話を開始した時刻が到来した場合、サポート処理部500は、取得した集中度が第2の所定条件を満たすかどうかを判断する。取得した集中度が第2の所定条件を満たす場合、サポート処理部500は、読み出したサポート情報に含まれるテキスト情報を音声データに変換し、テキスト情報に対応する発話をスピーカ20から放音させる。一方、取得した集中度が第2の所定条件を満たさない場合、サポート処理部500は、読み出したサポート情報に含まれるテキスト情報を音声データに変換する処理を実行しない。すなわち、サポート処理部500は、テキスト情報に対応する発話をスピーカ20から放音させない。
【0072】
以上から明らかなように、本変形例に係るカラオケ装置Kにおいて集中度取得部100は、ある支援コンテンツの再生中に撮影手段60により撮影された利用者の映像から、利用者の集中度を取得し、サポート処理部500は、ある支援コンテンツの再生中に、読み出したサポート情報に含まれる発話を開始した時刻が到来した場合、且つ取得した集中度が第2の所定条件を満たした場合、サポート情報に含まれるテキスト情報に対応する発話を放音手段から放音させる。このようなカラオケ装置Kによれば、コンテンツを実施している利用者の集中度を考慮して指導者のサポートができる。
【0073】
<第2実施形態>
次に、
図6から
図9を参照して、第2実施形態に係るカラオケ装置について説明する。本実施形態では、ベテランの指導者による動作を用いてサポートを行う例について述べる。第1実施形態と同様の構成や処理については詳細な説明を省略する。
【0074】
==カラオケ装置==
図6に示すように、カラオケ装置Kは、外部機器Rと通信可能に接続されている。外部機器Rは、たとえば、介護向けの人型ロボットである。外部機器Rは、カラオケ装置Kから送信される制御信号に基づいて動作を行うことができる。
【0075】
本実施形態に係るカラオケ装置Kは、指導者の動作を記憶する「動作記憶モード」、及び支援コンテンツを再生する際に、記憶された動作を用いて指導者をサポートする「動作サポートモード」を備えている。
【0076】
[制御手段]
本実施形態においてはCPUがメモリに記憶されるプログラムを実行することにより、制御手段10eは、集中度取得部100、判定部200、生成部300、記憶処理部400、及びサポート処理部500として機能する。本実施形態に係る判定部200、生成部300、記憶処理部400、及びサポート処理部500は、第1実施形態で説明した処理とは異なる処理を行う。
【0077】
(判定部)
本実施形態に係る判定部200は、支援コンテンツの再生中に指導者が動作をした場合、当該動作をした期間において取得された集中度が第3の所定条件を満たすかどうかを判定する。
【0078】
判定部200は、撮影手段60により撮影された指導者の映像により、支援コンテンツの再生中に指導者が動作をしたかどうかを判断する。たとえば、判定部200は、支援コンテンツの再生開始後に撮影手段60により撮影された指導者の映像を解析し、所定の動作が含まれているかどうかを判断する。所定の動作は、「両手を大きく振る」、「首を回す」等、予めいくつかの動作が設定されている。映像から所定の動作を特定する方法は公知の画像解析技術を用いることができる。
【0079】
なお、一の撮影手段60を用いる場合、映像中に指導者と利用者の双方が含まれる可能性がある。この場合、判定部200は、たとえば特開2019-40162号公報に記載された技術を利用し、予め記憶しておいた指導者の顔画像データを用いて映像中の人物の中から指導者を特定することができる。或いは、カラオケ装置Kは、利用者を撮影するための第1の撮影手段及び指導者を撮影するための第2の撮影手段のような、複数の撮影手段を備えていてもよい。
【0080】
第3の所定条件は、生成部300による処理(後述)を実行するかどうかを判断するための条件である。具体的に第3の所定条件は、「指導者がある動作を開始した時刻における利用者の集中度が3未満であり、且つ指導者が当該ある動作を終了した時刻における利用者の集中度が5以上」、「指導者がある動作を終了した時刻における利用者の集中度が、当該ある動作を開始した時刻における利用者の集中度よりも+2以上」、「動作をした期間において取得された集中度の平均値が8以上」といったものである。ある動作を開始した時刻における集中度よりもある動作を終了した時刻における集中度の方が高くなっている場合や集中度が高い値を維持している場合、ある動作が支援コンテンツの実施に対して効果的であると判断できる。このような動作は、他の指導者のサポート用として有益である。
【0081】
たとえば、判定部200は、支援コンテンツの再生開始後に撮影手段60により撮影された指導者の映像を解析し、動作を開始した時刻Tsにおける利用者の集中度Csを取得する。その後、判定部200は、支援コンテンツの再生開始後に撮影手段60により撮影された指導者の映像を解析し、動作を終了した時刻Teにおける利用者の集中度Ceを取得する。
【0082】
判定部200は、集中度Cs及び集中度Ceが第3の所定条件を満たすかどうかを判断する。第3の所定条件を満たすと判定した場合、判定部200は、判定結果を生成部300に出力する。
【0083】
(生成部)
本実施形態に係る生成部300は、取得された集中度が第3の所定条件を満たすと判定された場合、支援コンテンツの再生中に撮影手段60により撮影された指導者の映像に基づき、指導者の動きに対応するジェスチャー情報を生成する。
【0084】
映像に含まれる人物の動きに対応するジェスチャー情報を生成する方法は、公知の技術(たとえば2次元/3次元ビデオ動作解析システム https://dkh.qsfix.com/product/framedias6/)を利用できる。
【0085】
上記例において、判定部200から集中度Cs及び集中度Ceが第3の所定条件を満たすという判定結果が出力された場合、生成部300は、指導者の映像に基づき、時刻Tsから時刻Teの間に行われた動作に対応するジェスチャー情報を生成する。
【0086】
(記憶処理部)
本実施形態に係る記憶処理部400は、生成されたジェスチャー情報及び支援コンテンツの再生時間における動作を開始した時刻を含むサポート情報と、当該支援コンテンツのコンテンツ識別情報とを対応付けて記憶手段10aに記憶させる。
【0087】
上記例において、記憶処理部400は、時刻Tsから時刻Teの間に行われた動作に対応するジェスチャー情報、及び動作を開始した時刻Tsを含むサポート情報を、コンテンツ識別情報と対応付けて記憶手段10aに記憶させる。
【0088】
(サポート処理部)
本実施形態に係るサポート処理部500は、ある支援コンテンツを再生する場合、記憶手段10aから当該ある支援コンテンツのコンテンツ識別情報が対応付けられたサポート情報を読み出し、当該ある支援コンテンツの再生中に、読み出した当該サポート情報に含まれる動作を開始した時刻が到来した場合、当該サポート情報に含まれるジェスチャー情報に対応する動作を表示装置30に表示させ、及び/または当該サポート情報に含まれるジェスチャー情報に対応する動作を外部機器Rに実行させるための制御信号を生成し、外部機器Rに送信する。
【0089】
たとえば、ある指導者が、カラオケ装置Kを用いて支援コンテンツを再生する際に、動作のサポートを得たいと考えたとする。この場合、指導者は、リモコン装置50等を介して、動作サポートモードを予め選択した後、支援コンテンツの選択を行う。サポート処理部500は、記憶手段10aから、指導者が選択した支援コンテンツのコンテンツ識別情報に対応付けられたサポート情報を読み出す。
【0090】
その後、カラオケ装置Kは、ある支援コンテンツの再生を開始する。サポート処理部500は、ある支援コンテンツの再生開始からの経過時間を参照する。
【0091】
ここで、ある支援コンテンツの再生中に、読み出したサポート情報に含まれる動作を開始した時刻が到来した場合、サポート処理部500は、当該サポート情報に含まれるジェスチャー情報を映像データに変換し、ジェスチャー情報に対応する動作を表示装置30に表示させる。なお、ジェスチャー情報に対応する動作を表示させる表示手段は、カラオケ装置K自体が備えるものでなくともよい。たとえば、表示手段としては、カラオケ装置Kと有線または無線通信が可能な外付けのディスプレイを用いることができる。
【0092】
また、ある支援コンテンツの再生中に、読み出したサポート情報に含まれる動作を開始した時刻が到来した場合、サポート処理部500は、当該サポート情報に含まれるジェスチャー情報に対応する動作を外部機器Rに実行させるための制御信号を生成し、外部機器Rに送信する。たとえば、ジェスチャー情報に対応する動作が「両手を大きく振る」である場合、サポート処理部500は、外部機器Rである人型ロボットに対して両手を大きく振る動作をさせるための制御信号を生成し、外部機器Rに送信する。外部機器Rは、制御信号に基づいてジェスチャー情報に対応する動作を実行する。
【0093】
なお、サポート処理部500は、ジェスチャー情報に対応する動作を表示手段に表示させる処理、及びジェスチャー情報に対応する動作を外部機器に実行させるための制御信号を生成し、当該外部機器に送信する処理の両方を行ってもよい。
【0094】
==カラオケ装置Kの動作について==
次に、
図7から
図9を参照して本実施形態におけるカラオケ装置Kの動作の具体例について述べる。
図7は動作記憶モードの処理を示すフローチャートである。
図8は動作サポートモードの処理を示すフローチャートである。
図9は記憶手段10aに記憶されたサポート情報及びコンテンツIDのテーブルである。この例における集中度は、1(最も集中度が低い)~10(最も集中度が高い)の10段階であるとする。また、第3の所定条件は「指導者がある動作を開始した時刻における利用者の集中度が3未満であり、且つ指導者が当該ある動作を終了した時刻における利用者の集中度が5以上」であるとする。また、この例におけるサポート処理部500は、サポート情報に含まれるジェスチャー情報に対応する動作を外部機器Rに実行させるための制御信号を生成し、外部機器Rに送信する処理を実行するとする。
【0095】
[動作記憶モードの処理]
指導者L3は、リモコン装置50を介して、動作記憶モードを選択した後、「口から健康!実践編」の支援コンテンツSC2を選択する。カラオケ装置Kは、選択された支援コンテンツSC2のコンテンツデータを記憶手段10aから読み出し、再生を開始する(支援コンテンツの再生開始。ステップ30)。撮影装置60は、支援コンテンツSC2の再生開始に伴い、指導者L2及び支援コンテンツSC2を実施する利用者の撮影を行う(指導者及び利用者の撮影。ステップ31)。
【0096】
集中度取得部100は、支援コンテンツSC2の再生中に撮影手段60により撮影された利用者の映像から、利用者の集中度を取得する(利用者の集中度を取得。ステップ32)。
【0097】
ここで、支援コンテンツSC2の再生中に指導者L3が動作をした場合(ステップ33でYの場合)、判定部200は、指導者L3が動作をした期間において取得された集中度が第3の所定条件を満たすかどうかを判定する。第3の所定条件を満たすと判定した場合(ステップ34でYの場合)、判定部200は判定結果を生成部300に出力する。
【0098】
たとえば、判定部200は、支援コンテンツSC2の再生開始後、撮影手段60により撮影された指導者L3の映像を解析し、動作を開始した時刻Ts2(15秒)における利用者の集中度Cs2(2.5)を取得する。その後、判定部200は、支援コンテンツSC2の再生開始後に撮影手段60により撮影された指導者L3の映像を解析し、動作を終了した時刻Te2(20秒)における利用者の集中度Ce2(8.0)を取得する。
【0099】
判定部200は、利用者の集中度Cs2及びCe2が第3の所定条件を満たすかどうかを判定する。この例では、指導者L3が動作を開始した時刻Ts2における利用者の集中度が2.5であり、且つ指導者L3が動作を終了した時刻Te2における利用者の集中度が8.0であるため、第3の所定条件を満たしている。よって、判定部200は、判定結果を生成部300に出力する。
【0100】
生成部300は、ステップ32で取得された集中度が第3の所定条件を満たすと判定された場合、支援コンテンツSC2の再生中に撮影手段60により撮影された指導者L3の映像に基づき、指導者L3の動きに対応するジェスチャー情報G2を生成する(ジェスチャー情報を生成。ステップ35)。
【0101】
上述の通り、判定部200から利用者の集中度Cs2及び集中度Ce2が第3の所定条件を満たすという判定結果が出力された場合、生成部300は、時刻Ts2から時刻Te2までの間に指導者L3が行った動作(この例では「両手を大きく振る」)をジェスチャー情報G2として生成する。
【0102】
記憶処理部400は、ステップ35で生成されたジェスチャー情報及び支援コンテンツの再生時間における動作を開始した時刻を含むサポート情報と、支援コンテンツのコンテンツIDとを対応付けて記憶手段10aに記憶させる(サポート情報及びコンテンツIDを記憶。ステップ36)。カラオケ装置Kは、支援コンテンツSC2の再生終了まで(ステップ37でYの場合)、ステップ31からステップ36の処理を繰り返し行う。
【0103】
上述のジェスチャー情報G2が生成された場合、記憶処理部400は、ジェスチャー情報G2及び支援コンテンツSC2の再生時間における動作を開始した時刻Ts2を含むサポート情報と、支援コンテンツSC2のコンテンツID***SC2とを対応付けて記憶手段10aに記憶させる。
図9に示すように、記憶手段10aには、支援コンテンツSC2のコンテンツID***SC2に対し、複数のサポート情報SP4~SP6が対応付けて記憶されている。
【0104】
[動作サポートモードの処理]
指導者L3に比べて経験の浅い指導者L4が利用者に対して「口から健康!実践編」の支援コンテンツSC2を実施させようと考えたとする。指導者L4は、リモコン装置50を介して、動作サポートモードを選択した後、「口から健康!実践編」の支援コンテンツSC2を選択する。
【0105】
サポート処理部500は、支援コンテンツSC2を再生する場合、記憶手段10aから支援コンテンツSC2のコンテンツID***SC2が対応付けられたサポート情報を読み出す(サポート情報の読み出し。ステップ40)。この例において、サポート処理部500は、コンテンツID***SC2に対応付けられているサポート情報SP4~SP6を読み出す。
【0106】
カラオケ装置Kは、選択された支援コンテンツSC2のコンテンツデータを記憶手段10aから読み出し、再生を開始する(支援コンテンツの再生開始。ステップ31)。
【0107】
サポート処理部500は、支援コンテンツSC2の再生中に、ステップ40で読み出したサポート情報に含まれる動作を開始した時刻が到来したかどうかを確認する。ステップ40で読み出したサポート情報に含まれる動作を開始した時刻が到来した場合(ステップ42でYの場合)、サポート処理部500は、サポート情報に含まれるジェスチャー情報に対応する動作を外部機器Rに実行させるための制御信号を生成し、外部機器Rに送信する(ジェスチャー情報に対応する動作を外部機器に実行させるための制御信号を生成・送信。ステップ43)。カラオケ装置Kは、支援コンテンツSC2の再生終了まで(ステップ44でYの場合)、ステップ42及びステップ43の処理を繰り返し行う。
【0108】
上述の通り、カラオケ装置Kが支援コンテンツSC2の再生を開始した場合、サポート処理部500は、支援コンテンツSC2の再生開始からの経過時間を参照する。サポート情報SP4に含まれる動作を開始した時刻Ts2(15秒)が到来した場合、サポート処理部500は、サポート情報SP4に含まれるジェスチャー情報G2に対応する動作(両手を大きく振る)を外部機器Rに実行させるための制御信号を生成する。サポート処理部500は、生成した制御信号を外部機器Rに送信する。外部機器Rは、受信した制御信号に基づいてジェスチャー情報G2に対応する動作を行う。
【0109】
なお、サポート情報に含まれる動作を開始した時刻が到来した際に指導者L4が別の動作をしている場合、サポート処理部500は、当該サポート情報に含まれるジェスチャー情報に対応する動作の表示等を中止することができる。このような処理を行うことにより、指導者の動作を妨げることを抑制できる。
【0110】
また、一の支援コンテンツに対して複数のサポート情報が記憶されている場合、動作を開始した時刻が同じサポート情報や動作をした期間が重複するサポート情報もありうる。この場合、サポート処理部500は、ランダムに一のサポート情報を特定し、当該サポート情報に含まれるジェスチャー情報に対応する動作の表示等を行うことができる。
【0111】
==第2実施形態のまとめ==
以上から明らかなように、本実施形態に係るカラオケ装置Kは、利用者の身体に関する能力の維持または改善を支援するための支援コンテンツを再生可能なカラオケ装置である。カラオケ装置Kは、支援コンテンツの再生中に撮影手段60により撮影された利用者の映像から、利用者の集中度を取得する集中度取得部100と、支援コンテンツの再生中に指導者が動作をした場合、当該動作をした期間において取得された集中度が第3の所定条件を満たすかどうかを判定する判定部200と、取得された集中度が第3の所定条件を満たすと判定された場合、支援コンテンツの再生中に撮影手段60により撮影された指導者の映像に基づき、指導者の動きに対応するジェスチャー情報を生成する生成部300と、生成されたジェスチャー情報及び支援コンテンツの再生時間における動作を開始した時刻を含むサポート情報と、当該支援コンテンツのコンテンツ識別情報とを対応付けて記憶手段10aに記憶させる記憶処理部400と、ある支援コンテンツを再生する場合、記憶手段10aから当該ある支援コンテンツのコンテンツ識別情報が対応付けられたサポート情報を読み出し、当該ある支援コンテンツの再生中に、読み出した当該サポート情報に含まれる動作を開始した時刻が到来した場合、当該サポート情報に含まれるジェスチャー情報に対応する動作を表示装置30に表示させ、及び/または当該サポート情報に含まれるジェスチャー情報に対応する動作を外部機器Rに実行させるための制御信号を生成し、外部機器Rに送信するサポート処理部500と、を有する。
【0112】
このようなカラオケ装置Kによれば、利用者の集中度に応じたサポート情報を、支援コンテンツ毎に予め記憶しておくことができる。またこのようなカラオケ装置Kによれば、支援コンテンツを再生する際に、読み出したサポート情報に含まれる動作を開始した時刻で、当該サポート情報に含まれるジェスチャー情報に対応する動作を表示等させることができる。サポート情報に含まれる動作を開始した時刻は、利用者の集中度を高める動作が開始された時刻、すなわち利用者に対して動作をする適切なタイミングである。またサポート情報に含まれるジェスチャー情報に対応する動作は、利用者の集中度を高める動作、すなわち利用者に対して効果的な動作である。このような適切なタイミングで効果的な動作を表示等させることにより、経験の浅い指導者であってもベテランの指導者と同様の対応を行うことができる。すなわち、本実施形態に係るカラオケ装置Kによれば、支援コンテンツを再生する際に、指導者のサポートができる。
【0113】
<第2実施形態の変形例>
指導者からコンテンツの実施を促すような動作がなくとも集中して取り組む利用者もいる。或いは、経験の浅い指導者であっても適切なタイミングで効果的な動作を行うことができる場合もありうる。これらの場合、記憶されているサポート情報に基づいて動作を表示等させる必要はない。本変形例では所定の条件を満たした場合にのみサポート情報に含まれるジェスチャー情報に対応する動作を表示等させる例について述べる。
【0114】
(集中度取得部)
本変形例に係る集中度取得部100は、ある支援コンテンツの再生中に撮影手段60により撮影された利用者の映像から、利用者の集中度を取得する。
【0115】
たとえば、ある指導者が、カラオケ装置Kを用いて支援コンテンツを再生する際に、発話のサポートを得たいと考えたとする。この場合、指導者は、リモコン装置50等を介して、動作サポートモードを予め選択した後、支援コンテンツの選択を行う。サポート処理部500は、記憶手段10aから、指導者が選択した支援コンテンツのコンテンツ識別情報に対応付けられたサポート情報を読み出す。
【0116】
その後、カラオケ装置Kは、ある支援コンテンツの再生を開始する。撮影装置60は、支援コンテンツの再生開始に伴い、利用者の撮影を開始する。
【0117】
集中度取得部100は、支援コンテンツの再生開始後に集中度の取得を開始する。集中度取得部100は、撮影手段60から利用者の映像に対応するデータを取得し、映像に含まれる利用者の集中度を取得する。集中度取得部100は、取得した集中度をサポート処理部500に出力する。
【0118】
(サポート処理部)
本変形例に係るサポート処理部500は、ある支援コンテンツの再生中に、読み出したサポート情報に含まれる発話を開始した時刻が到来した場合、且つ取得した集中度が第4の所定条件を満たした場合、サポート情報に含まれるジェスチャー情報に対応する動作を表示手段に表示させ、及び/または当該サポート情報に含まれるジェスチャー情報に対応する動作を外部機器に実行させるための制御信号を生成し、当該外部機器に送信する。
【0119】
第4の所定条件は、サポート情報に含まれるジェスチャー情報に対応する動作を表示等させるかどうかを判断するための条件である。具体的に第4の所定条件は、「読み出したサポート情報に含まれる動作を開始した時刻が到来した時点における利用者の集中度が3未満」といったものである。読み出したサポート情報に含まれる動作を開始した時刻が到来した時刻における集中度が低い場合、効果的な動作を表示等させるメリットが生まれる。
【0120】
上記例において、サポート処理部500は、記憶手段10aから、指導者が選択した支援コンテンツのコンテンツ識別情報に対応付けられたサポート情報を読み出す。サポート処理部500は、ある支援コンテンツの再生開始からの経過時間を参照する。
【0121】
ここで、ある支援コンテンツの再生中に、読み出したサポート情報に含まれる動作を開始した時刻が到来した場合、サポート処理部500は、取得した集中度が第4の所定条件を満たすかどうかを判断する。取得した集中度が第4の所定条件を満たす場合、サポート処理部500は、読み出したサポート情報に含まれるジェスチャー情報を映像データに変換し、ジェスチャー情報に対応する動作を表示装置30に表示させる。或いは、サポート処理部500は、サポート情報に含まれるジェスチャー情報に対応する動作を外部機器Rに実行させるための制御信号を生成し、外部機器Rに送信する。一方、取得した集中度が第4の所定条件を満たさない場合、サポート処理部500は、読み出したサポート情報に含まれるジャスチャー情報を映像データに変換する処理や制御信号を生成する処理を実行しない。
【0122】
以上から明らかなように、本変形例に係るカラオケ装置Kにおいて集中度取得部100は、ある支援コンテンツの再生中に撮影手段60により撮影された利用者の映像から、利用者の集中度を取得し、サポート処理部500は、ある支援コンテンツの再生中に、読み出したサポート情報に含まれる動作を開始した時刻が到来した場合、且つ取得した集中度が第4の所定条件を満たした場合、サポート情報に含まれるジェスチャー情報に対応する動作を表示装置30に表示させ、及び/または当該サポート情報に含まれるジェスチャー情報に対応する動作を外部機器Rに実行させるための制御信号を生成し、外部機器Rに送信する。このようなカラオケ装置Kによれば、コンテンツを実施している利用者の集中度を考慮して指導者のサポートができる。
【0123】
<変形例1>
上述の第1実施形態の処理及び第2実施形態の処理を組み合わせて行うこともできる。たとえば、判定部200は、支援コンテンツの再生中に指導者が発話した場合、当該発話した期間において取得された集中度が第1の所定条件を満たすかどうかを判定し、且つ支援コンテンツの再生中に指導者が動作をした場合、当該動作をした期間において取得された集中度が第3の所定条件を満たすかどうかを判定することができる。また、生成部300は、取得された集中度が第1の所定条件を満たすと判定された場合、発話に対応するテキスト情報を生成し、且つ取得された集中度が第3の所定条件を満たすと判定された場合、支援コンテンツの再生中に撮影手段60により撮影された指導者の映像に基づき、指導者の動きに対応するジェスチャー情報を生成することができる。また、記憶処理部400は、生成されたテキスト情報及び支援コンテンツの再生時間における発話を開始した時刻を含むサポート情報と、当該支援コンテンツのコンテンツ識別情報とを対応付けて記憶手段10aに記憶させ、且つ生成されたジェスチャー情報及び支援コンテンツの再生時間における動作を開始した時刻を含むサポート情報と、当該支援コンテンツのコンテンツ識別情報とを対応付けて記憶手段10aに記憶させることができる。また、サポート処理部500は、ある支援コンテンツを再生する場合、記憶手段10aから当該ある支援コンテンツのコンテンツ識別情報が対応付けられたサポート情報を読み出し、当該ある支援コンテンツの再生中に、読み出した当該サポート情報に含まれる発話を開始した時刻が到来した場合、当該サポート情報に含まれるテキスト情報に対応する発話をスピーカ20から放音させ、且つある支援コンテンツを再生する場合、記憶手段10aから当該ある支援コンテンツのコンテンツ識別情報が対応付けられたサポート情報を読み出し、当該ある支援コンテンツの再生中に、読み出した当該サポート情報に含まれる動作を開始した時刻が到来した場合、当該サポート情報に含まれるジェスチャー情報に対応する動作を表示装置30に表示させ、及び/または当該サポート情報に含まれるジェスチャー情報に対応する動作を外部機器Rに実行させるための制御信号を生成し、外部機器Rに送信することができる。
【0124】
<変形例2>
本変形例では、利用者の属性情報を用いることで、複数のサポート情報の中から、効果的な発話や動作を行うことが可能なサポート情報を特定する例について述べる。なお、以下では第1実施形態の構成を例に説明するが、第2実施形態の構成においても同様の処理を実行することができる。
【0125】
==カラオケ装置==
[制御手段]
本変形例においてはCPUがメモリに記憶されるプログラムを実行することにより、制御手段10eは、集中度取得部100、判定部200、生成部300、記憶処理部400、サポート処理部500、及び属性情報取得部600として機能する(
図10参照)。
【0126】
(属性情報取得部)
属性情報取得部600は、支援コンテンツの再生中に撮影手段60により撮影された利用者の属性情報を取得する。
【0127】
属性情報は、利用者の顔画像、年齢、性別、介護度等、利用者固有の情報である。属性情報は、予め記憶手段10aや外部のサーバ装置に記憶されている。
【0128】
属性情報取得部600は、撮影手段60から利用者の映像に対応するデータを取得し、映像に含まれる利用者を特定する。具体的に、属性情報取得部600は、公知の技術(たとえば、特開2019-40162号公報)を用いて映像に含まれる利用者の顔画像を抽出し、記憶手段10aに記憶されている顔画像と対比する。属性情報取得部600は、一致する顔画像が含まれる利用者の属性情報を記憶手段10aから取得する。
【0129】
(記憶処理部)
本変形例に係る記憶処理部400は、取得した属性情報を含むサポート情報を記憶手段10aに記憶させる。
【0130】
具体的に、記憶処理部400は、生成部300により生成されたテキスト情報、発話を開始した時刻、及び属性情報取得部600で取得された属性情報を含むサポート情報を、コンテンツ識別情報と対応付けて記憶手段10aに記憶させる。
【0131】
たとえば、カラオケ装置Kを用いて支援コンテンツを再生する際、ある指導者が、自己の発話を他の指導者のサポート用に残しておきたいと考えたとする。この場合、指導者は、リモコン装置50等を介して、発話記憶モードを予め選択した後、支援コンテンツの選択を行う。その後、カラオケ装置Kは、選択された支援コンテンツの再生を開始する。撮影装置60は、支援コンテンツの再生開始に伴い、利用者の撮影を開始する。
【0132】
属性情報取得部600は、撮影手段60から利用者の映像に対応するデータを取得し、映像に含まれる利用者を特定する。属性情報取得部600は、特定した利用者の属性情報ATn1としてたとえば「82歳」という情報を記憶手段10aから取得する。記憶処理部400は、生成されたテキスト情報Txn1及び発話を開始した時刻Tsn1に加え、取得された属性情報ATn1を含めたサポート情報SPn1を、コンテンツ識別情報と対応付けて記憶手段10aに記憶させる。たとえば、
図11に示すように、記憶手段10aには、支援コンテンツSC1のコンテンツID***SC1に対し、複数のサポート情報SPn1~SPn3が対応付けて記憶されている。
【0133】
(サポート処理部)
本変形例に係るサポート処理部500は、ある支援コンテンツを再生する場合、当該ある支援コンテンツのコンテンツ識別情報が対応付けられた複数のサポート情報のうち、属性情報が第5の所定条件を満たすサポート情報を読み出す。
【0134】
第5の所定条件は、複数のサポート情報の中から、ある支援コンテンツを実施する利用者の属性情報と近似する属性情報を含むサポート情報を特定するための条件である。具体的に第5の所定条件は、「取得した年齢の属性情報と、サポート情報に含まれる年齢の属性情報との差が±2歳以内」、「取得した性別の属性情報と、サポート情報に含まれる性別の属性情報が一致する」といったものである。属性情報が一致するような支援コンテンツは、利用者の集中度が高まる可能性が高く、より効果的である可能性が高い。
【0135】
サポート処理部500は、ある支援コンテンツを再生する場合、ある支援コンテンツのコンテンツ識別情報が対応付けられた複数のサポート情報を記憶手段10aから読み出す。一方、撮影装置60は、支援コンテンツの再生に伴い、利用者の撮影を開始する。属性情報取得部600は、撮影手段60から利用者の映像に対応するデータを取得し、映像に含まれる利用者を特定する。属性情報取得部600は、特定した利用者の属性情報を記憶手段10aから取得する。
【0136】
サポート処理部500は、取得した属性情報と、読み出したサポート情報に含まれる属性情報とを対比し、第5の所定条件を満たすサポート情報を特定する。サポート処理部500は、特定したサポート情報を記憶手段10aから読み出す。
【0137】
たとえば、ある指導者が、カラオケ装置Kを用いて支援コンテンツを再生する際に、発話のサポートを得たいと考えたとする。この場合、指導者は、リモコン装置50等を介して、発話サポートモードを予め選択した後、支援コンテンツの選択を行う。サポート処理部500は、記憶手段10aから、指導者が選択した支援コンテンツのコンテンツ識別情報に対応付けられたサポート情報SPn1~SPn3を読み出す。
【0138】
一方、撮影装置60は、支援コンテンツの再生に伴い、利用者の撮影を開始する。属性情報取得部600は、撮影手段60から利用者の映像に対応するデータを取得し、映像に含まれる利用者を特定する。属性情報取得部600は、特定した利用者の属性情報ATmとしてたとえば「84歳」という情報を記憶手段10aから取得する。
【0139】
サポート処理部500は、取得した属性情報ATmと、読み出したサポート情報SPn1~SPn3に含まれる属性情報ATn1~ATn3とを対比し、第5の所定条件を満たすサポート情報を特定する。ここで、第5の所定条件が「取得した年齢の属性情報と、サポート情報に含まれる年齢の属性情報との差が±2歳以内」である場合、第5の所定条件を満たすサポート情報はサポート情報SPn1となる。従って、サポート処理部500は、サポート情報SPn1を記憶手段10aから読み出す。
【0140】
以上から明らかなように、本変形例に係るカラオケ装置Kは、支援コンテンツの再生中に撮影手段60により撮影された利用者の属性情報を取得する属性情報取得部600を有する。また、本変形例に係る記憶処理部400は、取得した属性情報を含むサポート情報を記憶手段10aに記憶させ、サポート処理部500は、ある支援コンテンツを再生する場合、当該ある支援コンテンツのコンテンツ識別情報が対応付けられた複数のサポート情報のうち、属性情報が第5の所定条件を満たすサポート情報を読み出す。このようなカラオケ装置Kによれば、より効果的な発話や動作を行うことが可能なサポート情報に基づいて指導者のサポートを行うことができる。
【0141】
<その他>
上記実施形態は、例として提示したものであり、発明の範囲を限定するものではない。上記の構成は、適宜組み合わせて実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0142】
100 集中度取得部
200 判定部
300 生成部
400 記憶処理部
500 サポート処理部
600 属性情報取得部
K カラオケ装置
R 外部機器