(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-04-08
(45)【発行日】2022-04-18
(54)【発明の名称】情報処理装置、情報処理方法および情報処理プログラム
(51)【国際特許分類】
G10L 13/08 20130101AFI20220411BHJP
H04N 21/233 20110101ALI20220411BHJP
H04N 21/258 20110101ALI20220411BHJP
【FI】
G10L13/08 124
H04N21/233
H04N21/258
(21)【出願番号】P 2020178768
(22)【出願日】2020-10-26
【審査請求日】2020-10-26
(73)【特許権者】
【識別番号】520417768
【氏名又は名称】株式会社エイトリンクス
(74)【代理人】
【識別番号】100134430
【氏名又は名称】加藤 卓士
(72)【発明者】
【氏名】栗栖 浩二
【審査官】中村 天真
(56)【参考文献】
【文献】特開2003-153114(JP,A)
【文献】特開2003-339972(JP,A)
【文献】特開2019-166299(JP,A)
【文献】特開2004-069815(JP,A)
【文献】パソコン&ネットの“これまで”と“これから”を完全理解! 動画配信の“今”がわかる! 第18回,Windows 100%,2011年08月,第14巻,第9号,p.66-71
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-25/93
H04N 7/10- 7/56
H04N 21/00-21/858
(57)【特許請求の範囲】
【請求項1】
通信端末を介したライブ参加者との双方向ライブを
収録したコンテンツを提供する双方向ライブ提供部と、
前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録部と、
前記
コンテンツの
再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、前記呼び名登録部に登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御部と、
を備え
、
前記制御部は、前記呼び名登録部に登録された前記呼び名を用いて呼びかける場合に、前記ユーザの映像が前記通信端末に拡大して表示されるよう制御する情報処理装置。
【請求項2】
前記通信端末からの前記ユーザに関する情報を取得する情報取得部をさらに備え、
前記制御部は、前記ユーザに関する情報に対応する異なる呼びかけフレーズにより、前記呼び名を用いて前記ユーザに呼びかけるよう制御する請求項
1に記載の情報処理装置。
【請求項3】
通信端末を介したライブ参加者との双方向ライブを収録したコンテンツを提供する双方向ライブ提供部と、
前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録部と、
前記コンテンツの再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、前記呼び名登録部に登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御部と、
を備え、
前記通信端末からの前記ユーザに関する情報を取得する情報取得部をさらに備え、
前記制御部は、前記ユーザに関する情報に対応する異なる呼びかけフレーズにより、前記呼び名を用いて前記ユーザに呼びかけるよう制御する情報処理装置。
【請求項4】
前記情報取得部は、前記
コンテンツの再生中に、前記ユーザの顔画像から顔認識を行う顔認識部を有し、
前記制御部は、前記ユーザの顔認識に応じた異なる呼びかけフレーズにより、前記呼び名を用いて前記ユーザに呼びかけるよう制御する請求項
3に記載の情報処理装置。
【請求項5】
前記制御部は、前記ユーザの顔認識ができない場合に、前記呼び名を付して前記ユーザが見えないことを出力し、前記ユーザの顔認識ができた場合に、前記呼び名を付して前記ユーザが見えることを出力する請求項
4に記載の情報処理装置。
【請求項6】
前記情報取得部は、前記
コンテンツの再生中に、前記ユーザの声から音声認識を行う音声認識部を有し、
前記制御部は、前記ユーザの声の認識結果に応じた異なる呼びかけフレーズにより、前記呼び名を用いて前記ユーザに呼びかけるよう制御する請求項3に記載の情報処理装置。
【請求項7】
提供部が、通信端末を介したライブ参加者との双方向ライブを
収録したコンテンツを提供する双方向ライブ提供ステップと、
登録部が、前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録ステップと、
制御部が、前記
コンテンツの
再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御ステップと、
を含
み、
前記制御ステップでは、前記呼び名登録ステップで登録された前記呼び名を用いて呼びかける場合に、前記ユーザの映像が前記通信端末に拡大して表示されるよう制御する情報処理方法。
【請求項8】
提供部が、通信端末を介したライブ参加者との双方向ライブを収録したコンテンツを提供する双方向ライブ提供ステップと、
登録部が、前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録ステップと、
制御部が、前記コンテンツの再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御ステップと、
を含み、
情報取得部が、前記通信端末からの前記ユーザに関する情報を取得する情報取得ステップをさらに含み、
前記制御ステップでは、前記ユーザに関する情報に対応する異なる呼びかけフレーズにより、前記呼び名を用いて前記ユーザに呼びかけるよう制御する情報処理方法。
【請求項9】
通信端末を介したライブ参加者との双方向ライブを
収録したコンテンツを提供する双方向ライブ提供ステップと、
前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録ステップと、
前記
コンテンツの
再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御ステップと、
をコンピュータに実行させる情報処理プログラム
であって、
前記制御ステップでは、前記呼び名登録ステップにて登録された前記呼び名を用いて呼びかける場合に、前記ユーザの映像が前記通信端末に拡大して表示されるよう制御する情報処理プログラム。
【請求項10】
通信端末を介したライブ参加者との双方向ライブを収録したコンテンツを提供する双方向ライブ提供ステップと、
前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録ステップと、
前記コンテンツの再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御ステップと、
をコンピュータに実行させる情報処理プログラムであって、
前記通信端末からの前記ユーザに関する情報を取得する情報取得ステップをさらにコンピュータに実行させ、
前記制御ステップでは、前記ユーザに関する情報に対応する異なる呼びかけフレーズにより、前記呼び名を用いて前記ユーザに呼びかけるよう制御する情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。
【背景技術】
【0002】
上記技術分野において、特許文献1には、デジタル映画の上映において、シーン内の俳優の呼びかけ名を館内に居る観客の一人の呼び名に置換する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記文献に記載の技術では、双方向ライブ配信において、ライブに参加してないユーザそれぞれにおいて臨場感を高めることができなかった。
【0005】
本発明の目的は、上述の課題を解決する技術を提供することにある。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本発明に係る情報処理装置は、
通信端末を介したライブ参加者との双方向ライブを収録したコンテンツを提供する双方向ライブ提供部と、
前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録部と、
前記コンテンツの再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、前記呼び名登録部に登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御部と、
を備え、
前記制御部は、前記呼び名登録部に登録された前記呼び名を用いて呼びかける場合に、前記ユーザの映像が前記通信端末に拡大して表示されるよう制御する。
また、上記目的を達成するため、本発明に係る情報処理装置は、
通信端末を介したライブ参加者との双方向ライブを収録したコンテンツを提供する双方向ライブ提供部と、
前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録部と、
前記コンテンツの再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、前記呼び名登録部に登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御部と、
を備え、
前記通信端末からの前記ユーザに関する情報を取得する情報取得部をさらに備え、
前記制御部は、前記ユーザに関する情報に対応する異なる呼びかけフレーズにより、前記呼び名を用いて前記ユーザに呼びかけるよう制御する。
【0007】
上記目的を達成するため、本発明に係る情報処理方法は、
提供部が、通信端末を介したライブ参加者との双方向ライブを収録したコンテンツを提供する双方向ライブ提供ステップと、
登録部が、前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録ステップと、
制御部が、前記コンテンツの再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御ステップと、
を含み、
前記制御ステップでは、前記呼び名登録ステップで登録された前記呼び名を用いて呼びかける場合に、前記ユーザの映像が前記通信端末に拡大して表示されるよう制御する。
また、上記目的を達成するため、本発明に係る情報処理方法は、
提供部が、通信端末を介したライブ参加者との双方向ライブを収録したコンテンツを提供する双方向ライブ提供ステップと、
登録部が、前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録ステップと、
制御部が、前記コンテンツの再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御ステップと、
を含み、
情報取得部が、前記通信端末からの前記ユーザに関する情報を取得する情報取得ステップをさらに含み、
前記制御ステップでは、前記ユーザに関する情報に対応する異なる呼びかけフレーズにより、前記呼び名を用いて前記ユーザに呼びかけるよう制御する。
【0008】
上記目的を達成するため、本発明に係る情報処理プログラムは、
通信端末を介したライブ参加者との双方向ライブを収録したコンテンツを提供する双方向ライブ提供ステップと、
前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録ステップと、
前記コンテンツの再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御ステップと、
をコンピュータに実行させる情報処理プログラムであって、
前記制御ステップでは、前記呼び名登録ステップにて登録された前記呼び名を用いて呼びかける場合に、前記ユーザの映像が前記通信端末に拡大して表示されるよう制御する。
また、上記目的を達成するため、本発明に係る情報処理プログラムは、
通信端末を介したライブ参加者との双方向ライブを収録したコンテンツを提供する双方向ライブ提供ステップと、
前記ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録ステップと、
前記コンテンツの再生中に、前記コンテンツに含まれる前記ライブ参加者に呼びかける場面において、登録された前記呼び名を用いて前記ユーザに呼びかけるよう制御する制御ステップと、
をコンピュータに実行させる情報処理プログラムであって、
前記通信端末からの前記ユーザに関する情報を取得する情報取得ステップをさらにコンピュータに実行させ、
前記制御ステップでは、前記ユーザに関する情報に対応する異なる呼びかけフレーズにより、前記呼び名を用いて前記ユーザに呼びかけるよう制御する。
【発明の効果】
【0009】
本発明によれば、双方向ライブ配信において、ライブに参加してないユーザそれぞれにおいて臨場感を高めることができる。
【図面の簡単な説明】
【0010】
【
図1】第1実施形態に係る情報処理装置の構成を示すブロック図である。
【
図2】第2実施形態に係る情報処理装置を含む情報処理システムにおける動作概要を説明する図である。
【
図3】第2実施形態に係る情報処理装置を含む情報処理システムの構成を示すブロック図である。
【
図4】第2実施形態に係る情報処理装置を含む情報処理システムの動作手順を示すシーケンス図である。
【
図5】第2実施形態に係る情報処理装置の機能構成を示すブロック図である。
【
図6A】第2実施形態に係る双方向ライブコンテンツ記録部の構成を示す図である。
【
図6B】第2実施形態に係るユーザ呼び名登録部の構成を示す図である。
【
図7】第2実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。
【
図8A】第2実施形態に係る情報処理装置の処理手順を示すフローチャートである。
【
図8B】第2実施形態に係る仮想双方向ライブ配信処理の手順を示すフローチャートである。
【
図9】第3実施形態に係る情報処理装置を含む情報処理システムにおける動作概要を説明する図である。
【
図10】第3実施形態に係る情報処理装置を含む情報処理システムの動作手順を示すシーケンス図である。
【
図11】第3実施形態に係る情報処理装置の機能構成を示すブロック図である。
【
図12A】第3実施形態に係る双方向ライブコンテンツ記録部の構成を示す図である。
【
図12B】第3実施形態に係るユーザ呼び名および顔画像登録部の構成を示す図である。
【
図13A】第3実施形態に係る情報処理装置の処理手順を示すフローチャートである。
【
図13B】第3実施形態に係る仮想双方向ライブ配信処理の手順を示すフローチャートである。
【
図14】第4実施形態に係る双方向ライブコンテンツ記録部の構成を示す図である。
【
図15】第5実施形態に係る情報処理装置を含む情報処理システムの動作手順を示すシーケンス図である。
【発明を実施するための形態】
【0011】
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素は単なる例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
【0012】
[第1実施形態]
本発明の第1実施形態としての情報処理装置100について、
図1を用いて説明する。情報処理装置100は、双方向ライブが可能なコンテンツを提供する装置である。
【0013】
図1に示すように、情報処理装置100は、双方向ライブ提供部101と、呼び名登録部102と、制御部103と、を含む。双方向ライブ提供部101は、通信端末141を介したライブ参加者151との双方向ライブを含むコンテンツを提供する。呼び名登録部102は、ライブ参加者に含まれないユーザ152の呼び名121を通信端末142から受け付けて登録する。制御部103は、双方向ライブの提供中に、コンテンツに含まれるライブ参加者151に呼びかける場面において、呼び名登録部102に登録された呼び名121を用いてユーザ152に呼びかけるよう制御する。
【0014】
本実施形態によれば、ライブ参加者に含まれないユーザそれぞれに対して、ユーザの呼び名を用いて呼びかけることで、双方向ライブ配信において、ライブに参加してないユーザそれぞれにおいて臨場感を高めることができる。
【0015】
[第2実施形態]
次に、本発明の第2実施形態に係る情報処理装置を含む情報処理システムについて説明する。本実施形態に係る情報処理装置を含む情報処理システムにおいては、ライブ参加者に含まれないユーザそれぞれに対して、ライブ参加者名をあらかじめ登録されたユーザの呼び名に置換して呼びかけを行う。置換する呼び名としては、あらかじめ登録されたユーザの呼び名に対応する音声データが用いられたり、呼び名に対応して合成された音声データが用いられたりする。
【0016】
<情報処理システム>
以下、
図2から
図4を参照して、本実施形態に係る情報処理装置210を含む情報処理システム200の構成および動作を説明する。
【0017】
(動作概要)
図2は、本実施形態に係る情報処理装置210を含む情報処理システム200における動作概要を説明する図である。
【0018】
情報処理システム200は、情報処理装置210と通信端末220とを備える。情報処理装置210は双方向ライブコンテンツ211を格納しており、通信端末220に対して双方向ライブコンテンツを提供する。通信端末220では、提供された双方向ライブコンテンツを再生する。
【0019】
図2の左下の通信端末220の表示領域221からは、双方向ライブコンテンツに参加していないユーザの属性、特に呼び名が入力されて情報処理装置210に登録される。ユーザの属性には、呼び名の外に年齢や性別が含まれる。また、呼び名については、マイク222から家族が呼びかける音声入力を取得して情報処理装置210に登録してもよい。
図2の例では、双方向ライブコンテンツに参加していない5歳の男子“かいと”が登録されている。
【0020】
図2の右下の通信端末220では、“ひろゆき”と“れいな”を含む9人の子供が参加する双方向ライブコンテンツが再生されている。ここでは、音楽に合わせてみんなで踊っているシーンが表示されている。この時に、双方向ライブコンテンツには参加していないユーザ“かいと”に対して、スピーカ225から“かいとくん、しっかり踊れてるかなぁ?”との呼びかけが出力される。これは、例えば、双方向ライブコンテンツ内の“ひろゆきくん、しっかり踊れてるかなぁ?”との呼びかけにおいて、“ひろゆき”をユーザ登録された“かいと”に置き換えた出力である。ここで、双方向ライブコンテンツ内の呼びかけが“れいなちゃん、しっかり踊れてるかなぁ?”であった場合、性別を考慮して、“れいなちゃん”が“かいとくん”に置き換えられる。
【0021】
なお、本実施形態においては、あらかじめ双方向ライブコンテンツ内に有る呼びかけフレーズの呼び名を置換する処理を示すが、
図2のように呼びかけ者が表示されていない時間帯であれば、ユーザの呼び名を含む新しいフレーズで呼びかけてもよい。
【0022】
(構成)
図3は、本実施形態に係る情報処理装置210を含む情報処理システム200の構成を示すブロック図である。なお、
図3において、
図2と同様の構成要素には同じ参照番号を付して、重複する説明を省略する。
【0023】
図3の情報処理システム200は、情報処理装置210と、情報処理装置210とユーザの通信端末とを接続するネットワーク340と、を備える。ユーザの通信端末は、双方向ライブの参加者である“ひろゆき”341および“れいな”342の通信端末331および332と、双方向ライブの非参加者である“かいと”320および“みき”322の通信端末220および321と、を含む。
【0024】
情報処理装置210は、参加者名を含む双方向ライブコンテンツ211と、コンテンツに含まれないユーザの呼び名312と、を有する。情報処理装置210は、通信端末331および332を用いた双方向ライブを実行して、双方向ライブコンテンツ211を生成する。そして、情報処理装置210は、双方向ライブコンテンツ211の参加者名をコンテンツに含まれないユーザの呼び名312にそれぞれ置き換えた呼びかけを、通信端末220および221から出力する。すなわち、双方向ライブコンテンツ211内の“ひろゆき”や“れいな”の幾つかは“かいと”や“みき”に置き換えられて、通信端末220や321に出力される。
【0025】
これにより、双方向ライブに参加していないユーザに対し、あたかも参加しているかのような臨場感を提供できる。
【0026】
(動作シーケンス)
図4は、本実施形態に係る情報処理装置210を含む情報処理システム200の動作手順を示すシーケンス図である。
図4には、情報処理装置210と通信端末(かいと)220および通信端末(みき)321が示されているが、ユーザの通信端末は2つに限定されず、双方向ライブコンテンツ211を提供されるユーザ分接続される。なお、
図4には、双方向ライブコンテンツ211を収録する手順は省略されている。
【0027】
ステップS401において、情報処理装置210と通信端末(かいと)220、および、情報処理装置210と通信端末(みき)321、の間で双方向ライブアプリケーションが機能される。双方向ライブアプリケーションの開始時において、情報処理装置210は、ステップS403において、各ユーザの通信端末にユーザの呼び名を問い合わせる。通信端末(かいと)220からは、問い合わせに応答して、ステップS405において、呼び名“かいと(kaito)”が入力されて情報処理装置210に送信される。一方、通信端末(みき)321からは、問い合わせに応答して、ステップS407において、呼び名“みき(miki)”が入力されて情報処理装置210に送信される。情報処理装置210は、ステップS409において、受信した呼び名“かいと(kaito)”および“みき(miki)”を送信元の通信端末220、321の識別子に対応付けて登録する。なお、
図4では、呼び名のみの登録を示したが、実際には年齢や性別、嗜好などの他のユーザ属性も登録される。
【0028】
ステップS411において、双方向ライブコンテンツ211が再生されて開始される。情報処理装置210は、双方向ライブコンテンツ211に含まれるユーザへの呼びかけを検索して、検知する。なお、ユーザへの呼びかけの検知は、あらかじめ双方向ライブコンテンツ211にタグなどを挿入してそれを検知しても、双方向ライブコンテンツ211から実時間で検出してもよい。
【0029】
ユーザへの呼びかけが検知されると、情報処理装置210は、ステップS415において、呼びかけフレーズの呼び名を“かいと”に置換して、通信端末(かいと)220にユーザへの呼びかけを出力する。そして、通信端末(かいと)220は、ステップS417において、提供されたユーザへの呼びかけをスピーカから発声する。一方、情報処理装置210は、ステップS419において、呼びかけフレーズの呼び名を“みき”に置換して、通信端末(みき)321にユーザへの呼びかけを出力する。そして、通信端末(みき)321は、ステップS421において、提供されたユーザへの呼びかけをスピーカから発声する。
【0030】
双方向ライブコンテンツ211が終了する、あるいは、中止指示がされると、ステップS431において、情報処理装置210と通信端末(かいと)220、および、情報処理装置210と通信端末(みき)321、の間で双方向ライブコンテンツの提供が終了する。そして、双方向ライブアプリケーションが終了(停止)する。
【0031】
<情報処理装置の機能構成>
図5は、本実施形態に係る情報処理装置210の機能構成を示すブロック図である。
【0032】
情報処理装置210は、通信制御部510と、双方向ライブコンテンツ収録部502と、データベース503と、仮想双方向ライブ配信アプリケーション504と、を備える。
【0033】
通信制御部510は、ネットワーク340を介して、通信端末220、321、331、332などとの通信を制御する。双方向ライブコンテンツ収録部502は、通信端末331および332などにより双方向ライブの参加者と接続して、双方向ライブコンテンツを収録する。なお、双方向ライブコンテンツ収録部502についての詳説は省略する。
【0034】
データベース503は、双方向ライブコンテンツ記録部531と、ユーザ呼び名登録部532と、呼び名音声登録部533と、を備える。双方向ライブコンテンツ記録部531は、収録された双方向ライブコンテンツ211を記憶する。ユーザ呼び名登録部532は、双方向ライブコンテンツ211に含まれないユーザの呼び名を登録する。呼び名音声登録部533は、呼び名の音声データを登録する。かかる呼び名の音声データは、子供の名前トップ100ぐらいを予めリアル音声で録音した音声データであっても、ユーザの呼び名登録時にユーザ側から入力された音声データであってもよい。
【0035】
仮想双方向ライブ配信アプリケーション504は、ユーザ呼び名問い合せ部541と、ユーザ呼び名取得部542と、仮想双方向ライブ配信部543と、ユーザ呼び名置換制御部544と、オプションとしての呼び名音声合成部545と、を有する。ユーザ呼び名問い合せ部541は、通信端末(かいと)220および通信端末(みき)321に対してユーザの呼び名などを問い合わせる。ユーザ呼び名取得部542は、通信端末(かいと)220および通信端末(みき)321から返信されたユーザの呼び名などを取得する。
【0036】
仮想双方向ライブ配信部543は、双方向ライブコンテンツ記録部531に記録された双方向ライブコンテンツ211を仮想双方向ライブとして通信端末(かいと)220および通信端末(みき)321に配信する。ユーザ呼び名置換制御部544は、双方向ライブコンテンツ211に含まれるユーザ呼びかけフレーズを検知して、フレーズ中の双方向ライブ参加者名をユーザの呼び名に置換するよう、仮想双方向ライブ配信部543を制御する。オプションとしての呼び名音声合成部545は、呼び名音声登録部533に登録されていない呼び名音声を人工的に合成して、ユーザ呼び名置換制御部544に渡す。
【0037】
(双方向ライブコンテンツ記録部)
図6Aは、本実施形態に係る双方向ライブコンテンツ記録部531の構成を示す図である。双方向ライブコンテンツ記録部531は、参加者と共に収録した双方向ライブコンテンツを、呼びかけフレーズにおける呼び名置換のための情報と共に記録し、本実施形態の呼びかけフレーズにおける呼び名置換に使用される。
【0038】
双方向ライブコンテンツ記録部531は、双方向ライブコンテンツID611に対応付けて、少なくとも1つの置換位置情報612を記憶する。置換位置情報612は、双方向ライブコンテンツ中の呼びかけフレーズのタイミングと長さとを含む。なお、本実施形態においては、呼びかけフレーズのタイミングと長さとは、100分の1秒単位で調整できる。そのため、呼び名が決まったブランクの中に自然にはいるように再生できる。また、双方向ライブコンテンツ記録部531は、各置換位置情報612に対応付けて、呼びかけフレーズのデータ613と置換制御情報614とを記憶する。なお、呼びかけフレーズのデータ613としては、呼び名の置換(図中、[呼び名])と敬称の置換(図中、[敬称])が設定される。また、置換制御情報614は、フレーズ内の呼び名位置や音声整合用情報(高低、速度、…)などが含まれるが、これらに限定されない。
【0039】
(ユーザ呼び名登録部)
図6Bは、本実施形態に係るユーザ呼び名登録部532の構成を示す図である。ユーザ呼び名登録部532は、呼びかけフレーズにおける呼び名置換のためのユーザの呼び名を登録し、ユーザ呼び名置換制御部544が使用する。
【0040】
ユーザ呼び名登録部532は、双方向ライブコンテンツID621に対応付けて、仮想双方向ライブを提供する少なくとも1つの通信端末ID622を記憶する。そして、ユーザ呼び名登録部532は、各通信端末ID622に対応付けて、ユーザ呼び名登録情報623を記憶する。なお、ユーザ呼び名登録情報623には、ユーザの呼び名、ユーザの年齢、ユーザの性別、使用される敬称、呼び名音声が録音か合成か、呼び名の音声データなどが含まれるが、これに限定されるものではない。
【0041】
<情報処理装置のハードウェア構成>
図7は、本実施形態に係る情報処理装置210のハードウェア構成を示すブロック図である。
図7において、
図5と同様の構成要素には同じ参照番号を付して、重複する説明を省略する。
【0042】
図7で、CPU710は演算制御用のプロセッサであり、プログラムを実行することで
図5の機能構成を実現する。ROM720は、初期データおよびプログラムなどの固定データおよびプログラムを記憶する。ネットワークインタフェース730は、ネットワーク340を介して通信端末220、321、331、332との通信を制御する。
【0043】
RAM740は、CPU710が一時記憶のワークエリアとして使用するランダムアクセスメモリである。双方向ライブコンテンツ741は、仮想双方向ライブのコンテンツであり、本実施形態においては呼び名置換位置のフレーズを検出するための呼び名置換タグ742を含んでいる。なお、双方向ライブコンテンツ741から呼び名置換フレーズを実時間で検出する場合には、呼び名置換タグ742を必要としない。配信先ID/配信先呼び名743は、仮想双方向ライブの配信先の通信端末IDと、その通信端末IDに配信する時に置換する呼び名である。呼び名置換用フレーズ744は、双方向ライブコンテンツ741から検知された呼び名を置換する前の呼びかけフレーズである。呼び名置換後フレーズ745は、呼び名を置換した後の呼びかけフレーズである。送受信データ746は、ネットワークインタフェース730を介して送受信されるデータである。
【0044】
ストレージ750には、データベースや各種のパラメータ、あるいは本実施形態の実現に必要な以下のデータまたはプログラムが記憶されている。ストレージ750には、データベースとして、
図5で前出した、双方向ライブコンテンツ記録部531と、コンテンツに含まれないユーザ呼び名登録部532と、呼び名音声登録部533とが記憶される。
【0045】
ストレージ750には、以下のプログラムが格納される。情報処理装置の制御プログラム751は、情報処理装置210の全体を制御するプログラムである。双方向ライブコンテンツ生成モジュール752は、参加者を含む双方向ライブの収録に基づいて双方向ライブコンテンツを生成するモジュールである。仮想双方向ライブ配信モジュール753は、双方向ライブコンテンツを用いて仮想双方向ライブを配信するモジュールである。ユーザ呼び名登録モジュール754は、置換するユーザの呼び名を取得して登録するモジュールである。ユーザ呼び名置換モジュール755は、仮想双方向ライブの配信中に、双方向ライブの参加者名をユーザの呼び名に置き換えるモジュールである。呼び名音声合成モジュール756は、ユーザの呼び名で音声データが登録されていないものを合成するためのモジュールである。
【0046】
なお、
図7のRAM740やストレージ750には、情報処理装置210が有する汎用の機能や他の実現可能な機能に関連するプログラムやデータは図示されていない。
【0047】
<情報処理装置の処理手順>
図8Aは、本実施形態に係る情報処理装置210の処理手順を示すフローチャートである。このフローチャートは、
図7のCPU710がRAM740を使用して実行し、
図5の機能構成を実現する。
【0048】
情報処理装置210は、ステップS811において、コンテンツの収録か否かを判定する。コンテンツの収録であると判定すると、情報処理装置210は、ステップS813において、参加者を含む双方向ライブの収録を開始する。そして、情報処理装置210は、ステップS815において、双方向ライブのストーリーに沿って呼びかけをユーザの呼び名に置換するタイミングか否かを判定する。呼びかけをユーザの呼び名に置換するタイミングが来ると、情報処理装置210は、ステップS817において、再生時に呼び名の置換位置を検知するための呼び名置換タグを付与する。情報処理装置210は、ステップS819において、双方向ライブを収録する。情報処理装置210は、ステップS821において、ライブの収録終了であるか否かを判定し、収録終了でなければ、ステップS815に戻って収録を継続する。
【0049】
コンテンツの収録でないと判定すると、情報処理装置210は、ステップS831において、仮想双方向ライブの配信か否かを判定する。仮想双方向ライブの配信と判定すると、情報処理装置210は、ステップS833において、仮想双方向ライブ配信アプリケーションを起動する。そして、情報処理装置210は、ステップS835において、置換する呼び名をユーザの通信端末に問合せる。情報処理装置210は、ステップS837において、ユーザの通信端末からの返信を待って、返信があると、ステップS839において、受信した呼び名をユーザ呼び名登録部532に登録する。この場合に、呼び名の音声入力があると、呼び名音声登録部533に登録する。
【0050】
情報処理装置210は、ステップS841において、仮想双方向ライブ配信処理を実行する。そして、仮想双方向ライブ配信処理が終了すると、情報処理装置210は、ステップS843において、仮想双方向ライブ配信アプリケーションを終了する。なお、コンテンツの収録でなく仮想双方向ライブの配信でなければ、他の処理を実行する。
【0051】
(仮想双方向ライブ配信処理)
図8Bは、本実施形態に係る仮想双方向ライブ配信処理S841の手順を示すフローチャートである。
【0052】
情報処理装置210は、ステップS851において、仮想双方向ライブの配信を開始する。情報処理装置210は、ステップS853において、呼び名置換タグが有るか否かを判定する。呼び名置換タグが無ければ、情報処理装置210は、ステップS859に進む。呼び名置換タグが有れば、情報処理装置210は、ステップS855において、配信先の通信端末IDに対応する呼び名をユーザ呼び名登録部532から取得する。そして、情報処理装置210は、ステップS857において、呼び名置換タグの呼びかけフレーズ中の呼び名をユーザの呼び名に置換して、配信先の通信端末に出力する。情報処理装置210は、ステップS859において、仮想ライブ配信の終了か否かを判定し、終了でなければ、ステップS853に戻って配信を継続する。
【0053】
本実施形態によれば、ライブ参加者に含まれないユーザそれぞれに対して、ユーザの呼び名を用いて呼びかけることで、双方向ライブ配信において、ライブに参加してないユーザそれぞれにおいて臨場感を高めることができる。特に、登録されてない呼び名を合成して使用したり、ユーザの呼び名にユーザ側から登録した音声データを使用したりすることで、より臨場感を高めることができる。
【0054】
[第3実施形態]
次に、本発明の第3実施形態に係る情報処理装置を含む情報処理システムについて説明する。本実施形態に係る情報処理装置を含む情報処理システムは、上記第2実施形態と比べると、通信端末に搭載されたカメラで撮像した映像から、ユーザの顔認識をすることでユーザの状態に対応した呼びかけを行う点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
【0055】
<情報処理システム>
以下、
図9および
図10を参照して、本実施形態に係る情報処理装置910を含む情報処理システム900の構成および動作を説明する。
【0056】
(動作概要)
図9は、本実施形態に係る情報処理装置910を含む情報処理システム900における動作概要を説明する図である。なお、
図9において、
図2と同様の構成要素には同じ参照番号を付して、重複する説明を終了する。
【0057】
通信端末(かいと)220には、撮像部(カメラ)922が搭載され、ユーザの撮像が可能である。
図9の左図の表示領域921には、顔認識のためのユーザの顔画像入力が追加されている。
図9の中央図の表示画面932には、呼びかけフレーズがユーザの呼び名に置換されるタイミングで、拡大されたユーザ像が表示され、演者の表示領域924はピクチャー・イン・ピクチャー(PIP)により表示される。そして、拡大されたユーザ像が得られる場合には、顔認識部によってユーザの顔認識が登録した顔画像との比較で実行される。
【0058】
例えば、かくれんぼをするシーンであれば、
図9の中央図に示すユーザの顔認識において、一定時間、顔認識ができなければ、
図9の右上図のように、演者の表示領域925が表示されて、ユーザの呼び名に置換された“かいとくんどこにいるかなぁ?”とのフレーズが発声される。一方、
図9の中央図に示すユーザの顔認識において、顔認識が一致すれば、
図9の右下図のように、演者の表示領域925が表示されて、ユーザの呼び名に置換された“かいとくんちゃんとかくれてぇ~”とのフレーズが発声される。
【0059】
本実施形態により、ユーザの状態を顔認識に基づいて判定し、判定結果に応じたフレーズを選択し、かつ、ユーザの呼び名に置換した呼びかけを実現する。
【0060】
(動作シーケンス)
図10は、本実施形態に係る情報処理装置910を含む情報処理システム900の動作手順を示すシーケンス図である。なお、
図10において、
図4と同様のステップには同じステップ番号を付して、重複する説明は省略する。また、
図10において、
図4内で同様の複数の処理(例えば、S405とS407)は、1つの箱で省略して示している。また、
図10においては、
図4のステップS431の終了処理は省略されている。
【0061】
情報処理装置210は、ステップS1009において、通信端末220、3221からユーザの顔画像を取得する。そして、情報処理装置210は、ステップS1010において、取得したユーザの顔画像を提供先の通信端末に対応付けて登録する。
【0062】
仮想双方向ライブの開始後、情報処理装置210は、ステップS1011において、通信端末220、3221からユーザ映像を取得する。そして、情報処理装置210は、ステップS1012において、ユーザ映像から認識されたユーザ状態の応じて、少なくとも2つの呼びかけフレーズから適切な呼びかけフレーズを選択する。なお、択一的な呼びかけであれば、1つのフレーズをYESとNOとなるように変形してもよい。
【0063】
<情報処理装置の機能構成>
図11は、本実施形態に係る情報処理装置910の機能構成を示すブロック図である。なお、
図11において、
図5と同様の構成要素には同じ参照番号を付して、重複する説明を省略する。
【0064】
データベース1103は、選択する複数のフレーズを格納するフレーズ格納部1134を含む、双方向ライブコンテンツ記録部1131と、コンテンツに含まれないユーザ呼び名および顔画像登録部1132とを含む。
【0065】
仮想双方向ライブ配信アプリケーション1104は、さらに、ユーザ映像取得部1146と、フレーズ選択部1147と、を有する。ユーザに関する情報取得部としてのユーザ映像取得部1146は、通信端末が撮像したユーザ画像を取得し、ユーザ呼び名および顔画像登録部1132に格納し、フレーズ選択部1147に送付する。フレーズ選択部1147は、ユーザへの呼びかけタイミングにおいて、ユーザ映像取得部1146からのユーザ映像に基づいて、顔認識部による顔認識に基づいて認識されたユーザの状態に応じて、フレーズ格納部1134から適切なフレーズを選択して仮想双方向ライブ配信部543に出力する。その後は、
図5と同様に、仮想双方向ライブ配信部543では、ユーザ呼び名置換制御部544の制御により選択されたフレーズの呼び名をユーザの呼び名に置換して配信する。
【0066】
(双方向ライブコンテンツ記録部)
図12Aは、本実施形態に係る双方向ライブコンテンツ記録部1131の構成を示す図である。
図12Aにおいて、
図6Aと同様の構成要素には同じ参照番号を付して、重複する説明を省略する。
【0067】
呼びかけフレーズ格納部1134は、使用するフレーズを選択する条件と、条件を満たす場合のフレーズとを含む。例えば、一定時間にユーザの顔認識がなければ、“[呼び名][敬称]ちゃんとかくれてるね”が使用され、ユーザの顔認識があれば、“[呼び名][敬称]ちゃんとかくれてぇ~”が使用される。また、表示制御情報1215として、このタイミングでの通常と異なる表示が指示されている。
【0068】
(ユーザ呼び名および顔画像登録部)
図12Bは、本実施形態に係るユーザ呼び名および顔画像登録部1132の構成を示す図である。
図12Bにおいて、
図6Bと同様の構成要素には同じ参照番号を付して、重複する説明は省略する。
【0069】
顔画像情報1224は、ユーザが登録したユーザの顔画像であり、画像データとその特徴量とを含む。
【0070】
<情報処理装置の処理手順>
図13Aは、本実施形態に係る情報処理装置910の処理手順を示すフローチャートである。
図13Aにおいて、
図8Aと同様のステップには同じステップ番号を付して、重複する説明は省略する。
【0071】
情報処理装置910は、ステップS1335において、置換する呼び名とユーザ顔画像とをユーザの通信端末に問い合せる。情報処理装置910は、ステップS1337において、置換する呼び名とユーザ顔画像との応答をまって、応答があれば、ステップS1339において、呼び名とユーザ顔画像とをユーザ呼び名および顔画像登録部1132に登録する。そして、情報処理装置910は、ステップS1341において、仮想双方向ライブ配信処理を実行する。
【0072】
(仮想双方向ライブ配信処理)
図13Bは、本実施形態に係る仮想双方向ライブ配信処理S1341の手順を示すフローチャートである。
図13Bにおいて、
図8Bと同様のステップには同じステップ番号を付して、重複する説明は省略する。
【0073】
情報処理装置910は、ステップS1354において、ユーザ顔画像に基づいてユーザ状態を判別する。そして、情報処理装置910は、ステップS1355において、ユーザ状態に対応して呼びかけフレーズを選択する。
【0074】
本実施形態によれば、映像中のユーザの顔認識によりユーザの状態を判定して、ユーザの呼び名を用いて異なる呼びかけをするので、ライブに参加してないユーザそれぞれにおいてさらに臨場感を高めることができる。
【0075】
[第4実施形態]
次に、本発明の第4実施形態に係る情報処理装置を含む情報処理システムについて説明する。本実施形態に係る情報処理装置を含む情報処理システムは、上記第2実施形態および第3実施形態と比べると、ユーザの声の音声認識、じゃんけんの画像認識、通信端末の画面上のスイッチ選択などにより、ユーザの呼び名を用いた呼びかけを選択する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
【0076】
(双方向ライブコンテンツ記録部)
図14は、本実施形態に係る双方向ライブコンテンツ記録部1431の構成を示す図である。
図14において、
図6Aおよび
図12Aと同様の構成要素には同じ参照番号を付して、重複する説明を省略する。
【0077】
呼びかけフレーズのデータ1434は、使用するフレーズを選択する条件と、条件を満たす場合のフレーズとを含む。例えば、“[呼び名][敬称]これはなにかなぁ?”との問いかけへのユーザの答えを音声認識部により音声認識して正解と判定すると、“[呼び名][敬称]よくしってるね”が使用され、間違いであれば、“[呼び名][敬称]これは○○ですよ”が使用される。また、“[呼び名][敬称] じゃんけんしよう~”との呼びかけに応答したユーザの手を画像認識する。そして、ユーザの勝ちと判定すると、“[呼び名][敬称]つよいねぇ~”が使用され、ユーザの負けであれば、“[呼び名][敬称]ざんねん!”が使用され、相子であれば、“[呼び名][敬称]もういちどだよ”が使用される。また、“[呼び名][敬称]好きなのをえらんでね”との問いかけへのユーザの画面上のタッチ位置を判定して、“[呼び名][敬称]りんごがすきなんだぁ~”、あるいは、“[呼び名][敬称]いちごがすきなんだぁ~”などが使用される。
【0078】
また、何を条件とするかの条件入力1415として、音声認識部によるユーザの声の音声認識結果、画像認識部によるユーザの手の画像認識結果、表示画面からのスイッチ入力などが指示されている。条件入力1415は、これらに限定されるものではない。ここで、条件入力1415は、それぞれユーザに関する情報を取得する情報取得部により取得される。さらに、選択肢のボタンを押しながら名前を入力することによって、例えば、選択した“もの”とその“名前”とが一致しているか否かなどを伝えるような臨場感も生成できる。
【0079】
本実施形態によれば、ユーザによる能動的な動作に応じて、ユーザの呼び名を用いて異なる呼びかけをするので、ライブに参加してないユーザそれぞれにおいてより一層、臨場感を高めることができる。
【0080】
[第5実施形態]
次に、本発明の第5実施形態に係る情報処理装置を含む情報処理システムについて説明する。本実施形態に係る情報処理装置を含む情報処理システムは、上記第2実施形態から第4実施形態と比べると、ユーザの呼び名を用いた呼びかけを通信端末側で行う点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
【0081】
<情報処理システムの動作手順>
図15は、本実施形態に係る情報処理装置1510を含む情報処理システムの動作手順を示すシーケンス図である。なお、
図15において、
図4と同様のステップには同じステップ番号を付して、重複する説明を省略する。また、
図15において、複数の通信端末で同様の複数の処理(例えば、S1503~S1507)は、それぞれ1つの箱で省略して示している。また、
図15においては、
図4のステップS431の終了処理は省略されている。
【0082】
情報処理装置1510は、ステップS1502において、呼び名置換用のプログラムを通信端末1520および1521に提供する。呼び名置換用のプログラムに従って、通信端末1520および1521は、ステップS1503において、ユーザ(ユーザの保護者)に呼び名を問い合わせる。そして、通信端末1520および1521は、ステップS1505において、ユーザ(ユーザの保護者)からの呼び名の入力を取得して、ステップS1507において、取得した呼び名をユーザの通信端末IDに対応付けて登録する。
【0083】
仮想双方向ライブの開始後、情報処理装置1510がユーザへの呼びかけを検知して、呼びかけフレーズを通信端末1520、1521に出力する。すると、通信端末1520は、ステップ1515において、呼び名置換用のプログラムを用いて、フレーズの呼び名を“かいと”に置換する。一方、通信端末1520は、ステップ1519において、呼び名置換用のプログラムを用いて、フレーズの呼び名を“みき”に置換する。
【0084】
本実施形態によれば、情報処理装置側において各ユーザに対応した処理が必要なくなるので、情報処理装置の負荷を低減しつつ、ライブに参加してないユーザそれぞれにおいて臨場感を高めることができる。
【0085】
[他の実施形態]
なお、上記実施形態においては、呼びかけフレーズの呼び名を登録されたユーザの呼び名に置換して呼びかけたが、予めコンテンツに口パクの部分を設定しておいて、この部分にユーザの呼び名を挿入してもよい。さらに、ライブ参加者との会話の一部にユーザの呼び名に置換したフレーズを挟むことで、さらに参加の臨場感を増すことができる。また、ユーザの属性情報として、好きな食べ物やスポーツ(運動)などを登録しておき、ユーザにの呼び名のみでなく、例えば“○○ちゃんの好きな△△だよ!”と好きな食べ物(△△)にそれぞれ置き換えて呼びかけてもよい。さらに、折り紙や絵、なぞなぞ、九九などにも応用ができ、参加の臨場感を増すことができる。
【0086】
また、上記実施形態においては、1人のユーザが参加する例を示したが、複数のユーザが呼び名と属性を登録して、呼びかけフレーズに適切な呼び名を選択して呼びかけを行ってもよい。例えば、男子への呼びかけでは男子のユーザの呼び名に置換し、女子への呼びかけでは女子のユーザの呼び名に置換するなども可能である。また、第3実施形態や第4実施形態における、ユーザの呼び名を用いたフレーズの選択は、フレーズ部分のみとして記載したが、さらに、複数のシナリオが容易されており、選択の条件に応じてフレーズの選択後に異なるシナリオに進むような、コンテンツであってもよい。この場合には、一方の選択がミッションの成功、他方の選択がミッションの失敗などとすると、さらに達成感を提供することができる。
【0087】
また、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の技術的範囲で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の技術的範囲に含まれる。
【0088】
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に供給され、内蔵されたプロセッサによって実行される場合にも適用可能である。本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるサーバも、プログラムを実行するプロセッサも本発明の技術的範囲に含まれる。特に、少なくとも、上述した実施形態に含まれる処理ステップをコンピュータに実行させるプログラムを格納した非一時的コンピュータ可読媒体(non-transitory computer readable medium)は本発明の技術的範囲に含まれる。
【要約】
【課題】本発明によれば、双方向ライブ配信において、ライブに参加してないユーザそれぞれにおいて臨場感を高めることができる。
【解決手段】通信端末を介したライブ参加者との双方向ライブを含むコンテンツを提供する双方向ライブ提供部と、ライブ参加者に含まれないユーザの呼び名を受け付けて登録する呼び名登録部と、双方向ライブの提供中に、コンテンツに含まれるライブ参加者に呼びかける場面において、呼び名登録部に登録された呼び名を用いてユーザに呼びかけるよう制御する制御部と、を備える。
【選択図】
図1