(58)【調査した分野】(Int.Cl.,DB名)
前記決定部は、前記コンテンツの視聴者層、または前記視聴ユーザの属性の少なくともいずれかに応じた種類の感情表現データを決定する、請求項1に記載のクライアント装置。
【発明を実施するための形態】
【0016】
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0017】
また、説明は以下の順序で行うものとする。
1.本開示の一実施形態による視聴反応フィードバックシステムの概要
2.各実施形態
2−1.第1の実施形態
2−1−1.構成
2−1−2.動作処理
2−2.第2の実施形態
2−3.第3の実施形態
2−4.第4の実施形態
3.まとめ
【0018】
<<1.本開示の一実施形態による視聴反応フィードバックシステムの概要>>
まず、本開示の一実施形態による視聴反応フィードバックシステムの概要について
図1を参照して説明する。
図1は、本開示の一実施形態による視聴反応フィードバックシステムの概要について説明するための図である。
【0019】
図1に示すように、視聴環境Aでは、視聴ユーザ3Aが、クライアント装置1Aに接続されるテレビジョン装置30A(情報提示装置の一例)でコンテンツを視聴し、視聴環境Bでは、視聴ユーザ3Bがクライアント装置1Bに接続されるテレビジョン装置30Bで同じコンテンツを視聴している。また、同様に他の視聴環境C、Dでも他ユーザが各自のクライアント装置で同じコンテンツを視聴している。以下、各クライアント装置1A、1Bを個別に説明する必要がない場合は、クライアント装置1と称する。
【0020】
各クライアント装置1は、それぞれネットワークを介してサーバ2(クラウド)に接続している。
【0021】
各テレビジョン装置30A、30Bは、コンテンツを出力する情報提示装置の一例であって、
図1に示すような映像表示装置の他、音声再生装置(スピーカ)によって実現されてもよい。また、スピーカが内蔵された映像表示装置であってもよい。
【0022】
また、各テレビジョン装置30A、30Bには、視聴ユーザの反応を検出するためのセンサ11A、11Bが設けられている。以下、各センサ11A、11Bを個別に説明する必要がない場合は、センサ11と称する。
【0023】
センサ11は、例えばカメラ(撮像装置)やマイクロホン(収音装置)により実現され、視聴ユーザの動きや顔の表情、音声を取得する。カメラは、Microsoft社のKinectのように、被写体(視聴ユーザ)の深度情報を取得できる特殊なカメラであってもよいし、マイクロホン(以下、マイクと称す)はマイクアレイのように複数のマイクが設置されたものであってもよい。センサ11は、取得した視聴ユーザの反応を示す反応情報(検出結果)を、クライアント装置1に出力する。
【0024】
このような構成において、本開示の一実施形態による視聴反応フィードバックシステムは、他の視聴ユーザの視聴反応を示す感情表現データ(後述する非言語リアクションなど)を視聴ユーザにフィードバックすることで、感情の共感を提供することができる。
【0025】
例えば、お笑い番組を視聴している際に、会場の笑い声、拍手、笑った顔が出力されると、されない場合に比べて、ユーザは、より自分も面白い気持ちになる。また、科学番組を視聴している際に、頷く様子や納得している声、感心している声を聞くと、ユーザは、自分も納得したり、理解したりする気持ちが強まる。また、スポーツの試合を視聴している際に、歓声を聞くと盛り上がり、逆に落胆の声を聞くと残念な気持ちが強まる。また、感動的な番組を視聴している際に、鼻を啜る音や涙を流している顔を見ると、感動の気持ちが強まる。このように、ユーザは、コンテンツを視聴している他のユーザ(番組の出演者)の様子により感情が共有されると、その感情がより強まる。
【0026】
通常、リアルな人と人のコミュニケーションの場合、必ずしも言語(会話)が無くてもコミュニケーションが成り立っていることが多い。例えば、一緒にテレビ番組を観ている時など、会話が無くても笑い声や表情などのリアクションだけでも、その空間を共有することでコミュニケーションが成立している。したがって、遠隔地に居る人と同じコンテンツを視聴している際に、会話が無い場合でも相手の映像がコンテンツの画面の一部に重なった状態で表示されると、コンテンツ視聴の邪魔になってしまう。
【0027】
(背景)
ここで、複数のユーザが遠隔地で同じコンテンツを視聴して視聴反応を共有する方法としては、状況に応じて以下のような方法が考えられる。
【0028】
(a)面識あるユーザ同士でコンテンツ視聴する場合
友達や知人など面識ある特定のユーザ同士で同じコンテンツを視聴して感情を共有する状況が想定される。この場合、同じコンテンツを視聴しながら、ビデオ、音声、テキスト等を送受信可能な通信サービスを用いることで、感想を交換し合うことが可能である。しかし、テキストの場合、コンテンツを視聴しながら文字入力を行う必要があるので、コンテンツ視聴が妨げられてしまう。また、ビデオや音声を用いた場合、文字入力の手間は省けるが、お互いの会話や映像が全て筒抜けになってしまう。例えばコンテンツに関係のない家族の会話等も全て他のユーザに伝わってしまい、他のユーザのコンテンツ視聴の妨げとなってしまう。
【0029】
(b)面識のないユーザ同士でコンテンツ視聴する場合
例えばユーザが自宅でスポーツ観戦する際、ユーザが応援しているチームの他のサポータ等の不特定多数の他ユーザと感情を共有して一緒に盛り上がることができれば、コンテンツ視聴をより楽しむことができる。通常、テレビジョン装置でスポーツ観戦する場合、両方のチームのサポータの音声(試合会場で収音された音声)が聞こえてしまうので、ユーザが応援しているチームの他のサポータと一緒に盛り上がっている感覚を得ることが困難である。
【0030】
この場合、例えば
図2に示すように、他のサポータの映像120aや音声、自分(視聴ユーザ3A)の映像120bや音声を、テレビジョン装置100で通常放送されている歓声と共に、または相互にリアルタイムで提示することで、他のサポータと共感を強めることが可能となる。しかしながら、自分(視聴ユーザ3A)の音声や映像が不特定多数のユーザにそのまま伝わってしまい、プライバシーの問題が発生する。
【0031】
そこで、上記事情を一着眼点にして本開示の各実施形態による視聴反応フィードバックシステムを創作するに至った。本実施形態による視聴反応フィードバックシステムは、特定/不特定多数の他ユーザと同じコンテンツを視聴しながら、ユーザの視聴を妨げることなく、ユーザのプライバシーも保護できる方法で、他ユーザの視聴反応を示す感情表現データをフィードバックし、感情を共感させることができる。
【0032】
特に、ユーザの視聴を妨げないよう、また、ユーザのプライバシーも保護するために、他ユーザの視聴反応を示す感情表現データとして、例えば非言語リアクションを用いる。本明細書において、非言語リアクションとは、状態や心情など音が発生しないものを音で表す言葉である「擬態語」と、物が発する音や声を表した言葉である「擬音語」とを含む擬声語や、感嘆詞、笑い声、泣き声等、感情を表す言葉である。本実施形態による視聴反応フィードバックシステムでは、ユーザの生の音声を直接他ユーザに提示せず、ユーザの反応から推定される感情を表す非言語リアクションを例えば別の音源で提示するので、ユーザのプライバシーが保護される。また、視聴コンテンツとは関係のない家族の会話等は検出されず、視聴コンテンツに対する反応から推定される感情に基づいて非言語リアクションが提示されるので、ユーザの生の音声が他ユーザに筒抜けになって他ユーザの視聴を妨げるといったことがない。
【0033】
このような本開示による視聴反応フィードバックシステムについて、以下複数の実施形態を挙げて具体的に説明する。
【0034】
<<2.各実施形態>>
<2−1.第1の実施形態>
まず、第1の実施形態による視聴反応フィードバックシステムについて、
図3〜
図8を参照して説明する。
【0035】
(2−1−1.構成)
図3は、第1の実施形態による視聴反応フィードバックシステムを形成する各装置の内部構成の一例を示すブロック図である。
図3に示すように、本実施形態による視聴反応フィードバックシステムは、複数のクライアント装置1A−1、1B−1と、サーバ2−1を有する。
【0036】
・クライアント装置1A−1
クライアント装置1A−1は、
図1に示す視聴環境Aを制御する装置であって、具体的には、
図3に示すように、反応情報取得部12、感情推定部13、および送信部15を有する。
【0037】
反応情報取得部12は、カメラやマイクにより実現されるセンサ11A(
図1参照)から視聴ユーザの反応情報(撮像画像、音声データ)を取得し、感情推定部13に出力する。ここで、センサ11Aは、カメラやマイクに限定されず、視聴ユーザ3Aがポケットに入れているまたは手に持っている携帯電話端末やスマートフォンに内蔵されている加速度センサや角加速度センサであってもよい。この場合、反応情報取得部12は、加速度情報や角加速度情報を視聴ユーザの反応情報として取得することができる。また、反応情報取得部12は、視聴ユーザ3Aに装着された生体センサ(センサ11Aの一例)から、脈拍、発汗、体温等の生体情報を視聴ユーザの反応情報として取得することも可能である。
【0038】
感情推定部13は、反応情報取得部12により取得された視聴ユーザの反応情報に基づいて、視聴ユーザの感情を推定する。感情推定部13は、推定した視聴ユーザの感情情報(感情推定結果)を、送信部15を介してサーバ2−1に出力する。
【0039】
ここで推定される感情のモデルは様々な手法が考えられるが、例えばRobert Pluntchikにより提示された「感情の輪」を利用してもよい。感情の輪は、8つの基本感情(恐れ、驚き、悲しみ、嫌悪、怒り、予期、喜び、受容)と、2点の組み合わせからなる8つの応用感情(畏怖、失望、後悔、軽蔑、攻撃、楽観、愛、服従)から成り立ち、様々な種類の感情が定義される。
【0040】
感情推定部13による感情推定方法としては、例えば視聴ユーザ3Aの顔画像を画像処理して、顔の表情や身体の姿勢から感情を推定する方法や、マイクアレイを用いて特定ユーザの音声のみを音源分離で抽出し、その音声データから音声認識技術を用いて推定してもよい。例えば、笑顔や笑い声が検出された場合、感情推定部13は、「笑い」や「楽しさ」の感情を推定する。また、泣き顔や泣き声が検出された場合、感情推定部13は、「泣き」や「悲しみ」の感情を推定する。
【0041】
また、他にも、感情推定部13は、ユーザの瞳孔の大きさ、体温、発汗等に基づいて、ユーザの感情を推定してもよい。さらに、コンテンツ視聴時にユーザが入力したSNSのテキストデータが反応情報取得部12により取得されていた場合、入力されたテキストデータを解析することでユーザの感情を推定することもできる。
【0042】
・サーバ2−1
サーバ2−1は、複数の視聴環境に居る各視聴ユーザの感情推定結果を統合し、統合結果を各視聴環境のクライアント装置に送信する。具体的には、本実施形態によるサーバ2−1は、
図3に示すように、受信部21、統合部23、および送信部25を有する。
【0043】
受信部21は、ネットワークを介してクライアント装置1A−1から視聴ユーザ3Aの感情推定結果を受信し、統合部23に出力する。なお
図3に示す例ではクライアント装置1A−1からしか感情推定結果を受信していないが、受信部21は、他の視聴環境(例えば視聴環境B、C、D)からも各視聴ユーザ3B〜3Dの感情推定結果を受信する。
【0044】
統合部23は、複数の視聴ユーザの感情推定結果を統合し、統合結果を、送信部25を介して各クライアント装置(ここでは、一例としてクライアント装置1B−1)にネットワークを介して送信する。統合結果とは、具体的には、複数の視聴ユーザの感情推定結果の統計データである。統合部23は、特定視聴ユーザの感情推定結果を統合してもよいし、不特定多数の視聴ユーザの感情推定結果を統合してもよい。
【0045】
かかる統計データには、例えば統合したユーザの人数や、男女比率、年齢構成、統合した感情推定結果の割合(例えば、笑い60%、驚き20%、ノーリアクション20%等)、各感情推定結果のスコア等である。感情推定結果のスコアとは、例えば1.0を最大スコアとして、大笑いであればスコア0.8、軽い笑いであればスコア0.2等を付ける。
【0046】
また、後述するように、コンテンツの内容に応じて、感情表現データの種別(女性の声、男性の声等)を変更する場合もあるので、統合部23は、統合結果にコンテンツのメタデータを含めてもよい。メタデータの一例としては、例えばコンテンツ種別ID(例えばTV、ビデオ、動画サイト)、タイトル、放送時間、ジャンル、出演者、脚本家、プロデューサ等の情報、URL(ネット動画の場合)、コンテンツに関連付けられたツイートのリスト等が挙げられる。
【0047】
・クライアント装置1B−1
クライアント装置1B−1は、
図1に示す視聴環境Bを制御する装置であって、サーバ2−1から送信された統合結果に基づいて、感情表現データを決定し、情報提示装置(例えばテレビジョン装置30B)から出力する。
【0048】
具体的には、クライアント装置1B−1は、
図3に示すように、受信部16、決定部17、および出力制御部18を有する。受信部16は、ネットワークを介してサーバ2−1から複数の視聴ユーザの感情推定結果の統合結果(統計データ)を受信し、決定部17に出力する。
【0049】
決定部17は、統合結果に基づいて、感情表現データを決定する。例えば、「笑い」の感情の割合が多い場合、決定部17は、「笑い」の感情を表す感情表現データを決定する。かかる感情表現データは、例えば音声データまたはテキストデータにより形成されている。「笑い」の感情を表す感情表現データは、例えば上述した非言語リアクションであってもよい。具体的には、例えば予め登録された(視聴ユーザ3Aの生の声ではなく別の音源の)笑い声の音声データや、『あははは』『うふふふ』といった擬音語のテキストデータであってもよい。別の音源に差し替えることで、各ユーザのプライバシーが保護される。
【0050】
また、例えばサッカーのゴール付近のプレイに対するユーザの反応を示す感情として推定される可能性が高い「歓声」を表す感情表現データとしては、『おおー』といった擬音語のテキストデータ等で形成された感情表現データに決定され得る。また、ゴールを外した際のユーザの反応を示す感情として推定される可能性が高い「落胆」を表す感情表現データとしては『はぁ』、「苛立ち」を表す感情表現データとしては『くそっ』といった擬音語のテキストデータにより形成される感情表現データに決定され得る。
【0051】
また、ドキュメンタリー番組を視聴した際に推定される可能性が高い「悲しみ」を表す感情表現データとしては、『しくしく』、『ずるずる』(鼻をすする音)といった擬態語のテキストデータにより形成される感情表現データに決定され得る。また、教育番組を視聴した際に推定される可能性が高い「納得感」を表す感情表現データとしては、『ふむふむ』といった擬態語のテキストデータにより形成される感情表現データが決定され得る。また、男性アイドルや女性アイドル、アーティストのライブを視聴した際に推定される可能性が高い「喜び」を表す感情表現データとしては、『キャーキャー』といった擬音語のテキストデータにより形成された感情表現データが決定され得る。また、動物番組を視聴した際に推定される可能性が高い「癒し」を表す感情表現データとしては、『ホカホカ』といった擬態語のテキストデータにより形成された感情表現データが決定され得る。
【0052】
また、非言語リアクション(感情表現データの一例)の具体例は特に限定しないが、さらには、例えば「感嘆」の感情を表す、『やったー』、『すごい』、『うわっ』、『へー』、『わーい』、『素晴らしい』等の言葉も含まれる。
【0053】
以上、非言語リアクション(感情表現データの一例)の具体例についていくつか説明したが、決定部17は、一般的に知られている擬態語や擬音語の他、インターネット上や地方の特定のコミュニティで利用されている独自の表現や、流行語を用いてもよい。
【0054】
また、決定部17は、統合結果(統計データ)に応じて、非言語リアクション(感情表現データの一例)の提示方法を変更してもよい。例えば、決定部17は、「笑い」の感情の割合が多い場合、非言語リアクションとして決定する笑い声のトーンやボリュームを大きくしたり、「笑い」の割合に応じた人数(種類)の笑い声を重ねたりしてもよい。
【0055】
また、決定部17は、同じ感情であっても、状況や頻度に応じて決定する感情表現データの種類を切り替えてもよい。例えば、「笑い」の感情が継続的に推定されている場合、決定部17は、同じ笑い声に決定するのでなく、異なる種類の笑い声に変更して決定する。また、決定部17は、視聴されているコンテンツに応じて感情表現データの種類を変更してもよい。例えば、「喜び」の感情が推定されている場合、決定部17は、コンテンツが女性アイドルのライブである場合は、当該コンテンツの視聴者層は男性であると推定されるので、「おー」といった男性の音声による感情表現データを決定する。また、決定部17は、コンテンツが男性アイドルのライブである場合は、当該コンテンツの視聴者層は女性であると推定されるので、「キャー」といった女性の音声による感情表現データを決定する。また、決定部17は、コンテンツの視聴者層の他、統合結果に含まれる、視聴ユーザの男女比率等の視聴ユーザの属性に応じた種類の感情表現データを決定してもよい。なお、決定部17は、コンテンツの視聴者層および聴ユーザの属性のうち少なくともいずれかに応じて感情表現データを決定してもよい。
【0056】
出力制御部18は、決定部17によって決定された感情表現データを、情報提示装置から出力するよう制御する。例えば、出力制御部18は、感情表現データが笑い声の音声データである場合はスピーカ(情報提示装置の一例)から再生させ、感情表現データがテキストデータである場合はテレビジョン装置30B(情報提示装置の一例)においてコンテンツに重畳表示させる。以下、感情表現データの出力例について、
図4〜
図7を参照して説明する。
【0057】
図4は、テキストデータで形成された感情表現データ(非言語リアクション)をコンテンツに重畳表示させる出力例を示す図である。
図4左の表示画面180aに示すように、「歓声」の感情を表す『おおー!』『わー!』といった感情表現データや、「緊張」の感情を表す『ドキドキ』といった感情表現データがテキスト化され、テレビジョン装置30Aの表示画面において、コンテンツに重畳表示されて出力される。
【0058】
また、
図4右の表示画面180bに示すように、「笑い」の感情を表す『あははは!』『ワハハハハ』『クスクス』といった感情表現データがテキスト化され、テレビジョン装置30Aの表示画面において、コンテンツに重畳表示されて出力される。なお
図4右に示す例では、決定部17により、統計結果に基づいて「笑い」の割合が多いと判断され、複数種類の表現方法で感情表現データが出力されている。
【0059】
このように、遠隔地に居る他の視聴ユーザの反応が、視聴ユーザの生の声や、生の声をそのままテキスト変換したものではなく、視聴ユーザの反応に基づいて推定される感情を表す表現方法で提供される。
【0060】
なおテキストデータの字体は特に限定されず、例えば漫画のような表現方法であってもよい。ここで、
図5に、テキストデータで形成された感情表現データ(非言語リアクション)を漫画のような表現方法でコンテンツに重畳表示させる出力例を示す。
図5の表示画面180cに示すように、「笑い」の感情を表す感情表現データ(非言語リアクション)が、漫画のような表現方法で提示される。また、漫画のような表現方法を用いる場合、決定部17は、例えば漫画の効果線(描画データ)で形成された感情表現データに決定することも可能である。
【0061】
また、本実施形態による感情表現データの出力例は、
図4や
図5に示す例に限定されない。例えば、出力制御部18は、プロジェクタ(情報提示装置の一例)などの外部装置と連携して、テレビジョン装置30の周辺の壁に、テキストデータや描画データによる感情表現データを投影してもよい。これにより、コンテンツに感情表現データを重畳表示してコンテンツの一部が見えなくなることを回避することができる。ここで、
図6に、テキストデータで形成された感情表現データ(非言語リアクション)をプロジェクタで投影させる出力例を示す。
【0062】
出力制御部18は、プロジェクタ(不図示)にテキストデータで形成された感情表現データQ1〜Q3を送り、
図6に示すように、テレビジョン装置30Bの周辺の壁に投影する。感情表現データQ1〜Q3は、例えば「笑い」の感情を表現するための複数のテキストデータである。
【0063】
さらに、出力制御部18は、視聴ユーザ3Bが座るソファやヘッドホンに内蔵されたバイブレーションを振動させることで感情表現データを出力してもよい。
【0064】
また、出力制御部18は、各視聴ユーザの感情推定結果をサーバ2−1から取得した場合、各感情推定結果に基づいて感情表現データを決定し、各感情表現データを、それぞれ誰の感情表現データであるかを示す顔画像やアバター画像と共に出力してもよい。
【0065】
また、出力制御部18は、非言語リアクションを音声データで出力する場合、テレビジョン装置30Bに設けられているスピーカから出力してもよいが、前方に他の視聴ユーザが居ないのに声だけ聞こえても臨場感に欠ける。そこで、本実施形態による出力制御部18は、例えばサラウンドスピーカやバーチャルサウンドテクノロジー等を用いて視聴ユーザ3Bの隣や後ろに音像を定位し、あたかも他の視聴ユーザが周囲にいるような状況を再現してもよい。以下、
図7を参照して具体的に説明する。
【0066】
図7は、音声データで形成された感情表現データ(非言語リアクション)の出力例について説明するための図である。
図7に示すように、視聴環境Bには、複数のスピーカ(情報提示装置の一例)4が配置され、サラウンドスピーカシステムが実現される。複数のスピーカ4は、スピーカアレイにより構成されていてもよい。クライアント装置1Bの出力制御部18は、テレビジョン装置30Bに内蔵されているスピーカ(前方スピーカ)と、視聴ユーザ3Bの周囲に配置されているスピーカ4を用いて、音声データで形成された感情表現データを出力する。ここで、出力制御部18は、視聴ユーザ3Bの隣や後ろにあたかも他の視聴ユーザ31a、31bが実際にいるように音像定位制御を行い、臨場感を再現し、より強い共感体験を提供する。この際、出力制御部18は、視聴ユーザ3Bと面識のある特定の他の視聴ユーザに対応する感情表現データの音像を、視聴ユーザ3Bの隣(視聴ユーザ31aの位置)に定位してもよい。また、出力制御部18は、視聴ユーザ3Bと面識のない不特定多数の他の視聴ユーザに対応する感情表現データの音像を、視聴ユーザ3Bの後ろ(視聴ユーザ31bの位置)に定位してもよい。
【0067】
以上、本実施形態による各装置の構成について説明した。なお、
図3〜
図7では、視聴環境Bにおいて、感情表現データが視聴ユーザ3Bに提示される場合を例に説明したが、同様の処理は視聴環境Aや他の視聴環境C、Dでも行われる。これにより、遠隔地に各視聴ユーザ3A〜3Dが、互いに同じコンテンツを視聴しながら感情を共有して共感体験を得ることができる。
【0068】
また、
図3に示す各装置の内部構成は一例であって、本実施形態による構成は
図3に示す例に限定されない。例えば、クライアント装置1A−1に含まれる「感情推定部13」の処理や、クライアント装置1B−1に含まれる「決定部17」の処理は、サーバ2−1で実行されてもよい。
【0069】
また、上述した実施形態では、サーバ2−1は、同じコンテンツを視聴する各視聴環境A〜Dに居る視聴ユーザ3A〜3Dの視聴反応に基づく感情推定結果を収集しているが、本実施形態はこれに限定されない。例えばコンテンツがスポーツ大会や収録番組の場合、サーバ2−1は、コンテンツが生成されている現場に居るユーザの視聴反応に基づく感情推定結果を収集してもよい。具体的には、サーバ2−1は、サッカーや野球のスタジアムに設けられた各種センサ(カメラやマイク)により検出された情報(画像データ、音声データ)を受信し、感情を推定し、推定した感情推定結果を統合対象に含める。
【0070】
例えば各視聴環境においてサッカーの試合が視聴されている際、サーバ2−1は、各視聴ユーザ3が応援しているチームのサポータの感情を、サッカースタジアムのサポータ席から取得したサポータの反応に基づいてそれぞれ推定し、推定結果を各視聴環境に送信する。そして、例えば視聴環境Bにおいて、クライアント装置1B−1は、視聴ユーザ3Bが応援しているチームのサポータの感情を表す感情表現データを提示することができる。
【0071】
これにより、両サポータの声援がそのまま提示されることがなく、例えば視聴ユーザ3Bが応援しているチームが優勢の場合は、当該チームのサポータによる「驚き」や「喜び」の感情を表した感情表現データが提示される。また、当該チームが劣勢の場合は、当該チームのサポータによる「落胆」や「悲しみ」の感情を表した感情表現データが提示される。このように、視聴ユーザ3は、応援しているチームのサポータとの共感体験を実現することができる。なお視聴ユーザがどのチームを応援しているかについては、各クライアント装置1またはサーバ2−1により、ユーザのプロファイル情報に基づいて判断されてもよいし、試合観戦前にユーザが明示的に選択できるようにしてもよい。
【0072】
続いて、本実施形態による視聴反応フィードバックシステムの動作処理について
図8を参照して具体的に説明する。
【0073】
(2−1−2.動作処理)
図8は、本実施形態による視聴反応フィードバックシステムの動作処理を示すフローチャートである。
図8に示すように、まず、ステップS203において、クライアント装置1A−1の反応情報取得部12は、視聴ユーザ3Aの反応情報をセンサ11Aから取得する。
【0074】
次いで、ステップS206において、感情推定部13は、反応情報取得部12により取得された視聴ユーザの反応情報に基づいて、視聴ユーザ3Aの感情を推定する。
【0075】
次に、ステップS209において、送信部15は、感情推定部13により推定された視聴ユーザ3Aの感情推定結果をサーバ2−1にネットワークを介して送信する。
【0076】
次いで、ステップS212において、サーバ2−1の統合部23は、受信部21により各視聴環境から受信した複数視聴ユーザの感情推定結果を統合する。統合結果は、送信部25からネットワークを介してクライアント端末1B−1に送信される。
【0077】
次に、ステップS215において、クライアント装置1B−1の決定部17は、受信部16によりサーバ2−1から受信した統合結果(複数の感情推定結果の統計データ)に基づいて、感情表現データを決定する。感情表現データは、上述したように、擬音語や擬態語、感嘆詞等の非言語リアクションで表されてもよい。また、感情表現データは、上述したように、テキストデータ、音声データ、または描画データ等により形成されてもよい。
【0078】
そして、ステップS218において、クライアント装置1B−1の出力制御部18は、決定部17により決定された感情表現データを、視聴環境Bに配置されている各情報提示装置(例えばテレビジョン装置30B、スピーカ4)から出力するよう制御する。
【0079】
上述した処理は、コンテンツが視聴されている間、継続的に繰り返し行われる。
【0080】
以上説明したように、第1の実施形態による視聴反応フィードバックシステムによれば、他の視聴ユーザの視聴反応の感情を示す感情表現データが視聴ユーザに提示されることで、視聴ユーザは、複数のユーザと感情を共有し、共感体験を得ることができる。また、他の視聴ユーザの映像や音声がそのまま提示されたり、視聴反応とは関係ない家族の会話等がそのまま筒抜けになったりすることがないので、各視聴ユーザのプライバシーが保護され、また、ユーザの視聴の妨げも回避される。
【0081】
<2−2.第2の実施形態>
上述した第1の実施形態では、各視聴ユーザの反応が、感情表現データに差し替えられて提示されるので、コンテンツの視聴が妨げられず、不特定多数の各視聴ユーザのプライバシーも保護される。しかし、面識ある特定のユーザ同士で本実施形態による視聴反応フィードバックシステムを利用する場合は、視聴ユーザの生の音声を他の視聴ユーザに提示しても、視聴ユーザのプライバシーは特に問題にならない。
【0082】
そこで、第2の実施形態による視聴反応フィードバックシステムでは、視聴ユーザの発話から感情表現データを抽出できた場合、当該感情表現データを、特定の他ユーザ(視聴ユーザに許可されたユーザであって、視聴ユーザと面識のある友人や知人)に提示する。以下、
図9を参照して具体的に説明する。
【0083】
(2−2−1.構成)
図9は、第2の実施形態による視聴反応フィードバックシステムを形成する各装置の内部構成の一例を示すブロック図である。
図9に示すように、本実施形態による視聴反応フィードバックシステムは、複数のクライアント装置1A−2、1B−2と、サーバ2−2を有する。
【0084】
・クライアント装置1A−2
クライアント装置1A−2は、
図1に示す視聴環境Aを制御する装置であって、具体的には、
図9に示すように、反応情報取得部12、感情推定部13、抽出部14、および送信部15を有する。
【0085】
反応情報取得部12および感情推定部13は、
図3を参照して説明した第1の実施形態と同様の機能を有し、反応情報取得部12により取得された視聴ユーザ3Aの反応情報(撮像画像、音声データ)に基づいて、感情が推定される。
【0086】
抽出部14は、反応情報取得部12により取得された視聴ユーザ3Aの反応情報から感情表現データを抽出する。例えば、サッカーのゴールシーンのような盛り上がり時に、「このゴールすごいなぁ!これで同点だぁ!」といった視聴ユーザ3Aの発話が収音された音声データが反応情報取得部12により取得された場合、抽出部14は、音声データに対して音声認識を行い、発話内容を文字データとして解析する。そして、抽出部14は、解析された文字データから、感情を表現する感情表現データに相当する文字データを探す。例えば、上記発話からは、『すごい』という「感嘆」の感情を表す言葉(感嘆詞)が発見され得る。抽出部14は、発見した言葉部分(区間部分)のユーザ3Aの音声データ(生の声そのまま)を、音声による感情表現データとして抽出し(抜き出し)、送信部15に出力する。
【0087】
送信部15は、感情推定部13により推定された視聴ユーザ3Aの感情推定結果と、抽出部14により抽出された視聴ユーザ3Aの音声による感情表現データを、ネットワークを介してサーバ2−2に送信される。
【0088】
・サーバ2−2
サーバ2−2は、
図9に示すように、受信部21、統合部23、送信部25、およびユーザ情報DB(データベース)28を有する。受信部21、統合部23、および送信部25の機能は、
図3を参照して説明した第1の実施形態と同様である。ユーザ情報DB28には、どの視聴ユーザにとって誰が特定の視聴ユーザ(友人、知人等、面識のある他の視聴ユーザ)になるのか、または不特定多数の視聴ユーザ(面識のない他の視聴ユーザ)になるのかといったデータが格納されている。具体的には、例えば、互いに面識のある特定の視聴ユーザ同士には同じグループIDが対応付けられる(なお面識ある特定視聴ユーザ同士の組み合わせが複数ある場合は、組み合わせ毎に異なるグループIDが用いられる)。したがって、同じグループIDが対応付けられている他の視聴ユーザは面識のある特定の他の視聴ユーザであって、同じグループIDが対応付けられていない他の視聴ユーザは、面識のない不特定の他の視聴ユーザであるとされる。本実施形態によるサーバ2−2は、視聴ユーザ3Aと面識のある特定の他の視聴ユーザ(例えば視聴ユーザ3B)に対しては、統合部23による統合結果と共に、視聴ユーザ3Aの音声による感情表現データを送信する。一方、視聴ユーザ3Aと面識のない不特定多数の他の視聴ユーザ(例えば視聴ユーザ3C、3D)に対しては、サーバ2−2は、統合部23による統合結果のみを送信する。
【0089】
・クライアント装置1B−2
クライアント装置1B−2は、
図1に示す視聴環境Bを制御する装置であって、具体的には、
図9に示すように、受信部16および出力制御部18を有する。ここで、視聴環境Bは、視聴ユーザ3Aと面識のある友人、知人等の特定の他の視聴ユーザである視聴ユーザ3Bが居る環境であることを想定する。どの視聴ユーザにとって誰が特定の視聴ユーザになるのか、または不特定多数の視聴ユーザになるのかは、上述したように、サーバ2−2側で管理されている。視聴環境Bを制御するクライアント装置1B−2は、受信部16によりサーバ2−2から受信した視聴ユーザ3Aの音声による感情表現データを、出力制御部18により情報提示装置(例えばテレビジョン装置30B)から出力するよう制御する。
【0090】
これにより、視聴ユーザと面識がある特定の他の視聴ユーザに対しては、視聴ユーザのプライバシーが問題とはならないので、視聴ユーザの音声による感情表現データが提示される。なお、視聴ユーザと面識がない不特定多数の他の視聴ユーザに対しては、第1の実施形態によるクライアント装置1B−1と同様の構成を有するクライアント装置により、第1の実施形態と同様に、各視聴ユーザの感情推定結果の統合結果に基づいて決定された感情表現データが提示される。
【0091】
(2−2−2.変形例)
ここで、視聴しているコンテンツのシーン、例えばサッカーのゴールシーンやファールシーンのような盛り上がる場面によっては、親しいユーザ同士が直接コメントを伝えたいと思う場合もある。そこで、第2の実施形態の変形例として、盛り上がり(特定共感シーン)が検出された場合は、一時的に直接的なコミュニケーションを可能とする。なお直接的なコミュニケーションは、盛り上がり(特定共感シーン)が検出された際に一時的にだけ行えるようにすることで、ユーザの視聴を妨げずに利便性を向上させることができる。以下、
図10を参照して具体的に説明する。
【0092】
図10は、第2の実施形態の変形例による視聴反応フィードバックシステムを形成する各装置の内部構成の一例を示すブロック図である。
図10に示すように、本実施形態による視聴反応フィードバックシステムは、複数のクライアント装置1A−2’、1B−2’と、サーバ2−2’を有する。
【0093】
・クライアント装置1A−2’
クライアント装置1A−2’は、
図1に示す視聴環境Aを制御する装置であって、具体的には、
図10に示すように、反応情報取得部12A、感情推定部13、通信部10A、出力制御部18Aを有する。反応情報取得部12Aおよび感情推定部13は、
図3を参照して説明した第1の実施形態と同様の機能を有する。
【0094】
通信部10Aは、
図3を参照して説明した第1の実施形態による送信部15の機能と、サーバ2−2’から特定共感シーンの検出通知や特定の他の視聴ユーザ3の音声データ等を受信する受信部の機能を有する。
【0095】
出力制御部18Aは、通信部10Aが受信したデータを、視聴環境Aに配置された情報提示装置(テレビジョン装置30Aやスピーカ)から出力するよう制御する。
【0096】
・サーバ2−2’
サーバ2−2’は、
図10に示すように、通信部22、統合部23、および特定共感シーン検出部24を有する。
【0097】
通信部22は、
図3を参照して説明した第1の実施形態による受信部21の機能と、送信部25の機能を有する。
【0098】
統合部23は、
図3を参照して説明した第1の実施形態と同様である。また、統合部23は、統合結果を特定共感シーン検出部24に出力する。
【0099】
特定共感シーン検出部24は、統合部23による統合結果や、コンテンツのシーン解析結果に基づいて、例えばサッカーのゴールシーンのような盛り上がりのある特定のシーン(以下、特定共感シーンとも称する)を検出する。コンテンツのシーン解析は、特定共感シーン検出部24が行ってもよい。
【0100】
具体的には、例えば特定共感シーン検出部24は、統合部23による統合結果に基づいて、感情のスコアが所定値を上回っている場合、特定共感シーンとして検出する。また、特定共感シーン検出部24は、シーン解析に基づいて、例えばサッカーであればゴール付近でボールの奪い合いがある場合や、野球であればホームベースに走者が向かっている場合に、特定共感シーンとして検出する。
【0101】
特定共感シーン検出部24は、特定共感シーンを検出した場合、特定共感シーンを検出した旨を、通信部22を介して各クライアント装置1に通知する。特定共感シーンを検出では、当該通知を、例えばテレビジョン装置30にテキスト表示させたり、スピーカから音声出力させたりする。
【0102】
そして、サーバ2−2’は、特定の親しいユーザ同士の直接的なコミュニケーションを開始させる。ここで、どの視聴環境間で直接的なコミュニケーションを開始させるかは、ユーザのプロファイル情報等に基づいてサーバ2−2’が自動的に判断してもよいし、通知した際にどの視聴ユーザを直接的なコミュニケーションを開始するかを視聴ユーザに選択させてもよい。
【0103】
・クライアント装置1B−2’
クライアント装置1B−2’は、
図1に示す視聴環境Bを制御する装置であって、具体的には、
図10に示すように、反応情報取得部12B、通信部10B、および出力制御部18Bを有する。
【0104】
反応情報取得部12Bは、クライアント装置1A−2’が有する反応情報取得部12Aと同様に、視聴ユーザ3Bの反応情報(撮像画像、音声データ)をセンサ11B(不図示)から取得する。
【0105】
通信部10Bは、
図3を参照して説明した第1の実施形態による受信部16の機能と、サーバ2−2’に、反応情報取得部12Bにより取得した視聴ユーザ3Bの反応情報を送信する送信部の機能を有する。
【0106】
出力制御部18Bは、
図3を参照して説明した第1の実施形態による出力制御部18と同様である。また、本実施形態による出力制御部18Bは、サーバ2−2’から受信した特定共感シーンの検出通知を、視聴ユーザBに提示する。
【0107】
以上説明した構成により、サーバ2−2’で特定共感シーンが検出されると、検出通知がクライアント装置1A−2’、1B−2’に通知され、クライアント装置1A−2’、1B−2’間の直接的なコミュニケーションが開始される。
【0108】
直接的なコミュニケーションとは、例えば各反応情報取得部12Bにより取得された視聴ユーザ3Bの音声データや撮像画像が、そのまま特定の親しい他の視聴ユーザ3Aに送信され、視聴ユーザ3Aからの音声データや撮像画像も視聴ユーザ3Bに送信されることである。直接的なコミュニケーションを音声データのみで行うか、併せて撮像画像も送るかは、ユーザの設定によって決定され得る。
【0109】
以上、特定共感シーンが検出された場合に一時的に直接的なコミュニケーションが行える場合について具体的に説明した。なお、特定共感シーン以外では、各視聴ユーザの感情は、非言語リアクション等の感情表現データに変換して他の視聴ユーザに提示される。これにより、必要以上の会話や映像が他ユーザに送られることがないので、プライバシーの保護が保たれる。
【0110】
また、一時的に直接的なコミュニケーションを開始した後、直接的なコミュニケーションを終了するタイミングは様々考え得るが、例えばクライアント装置1A−2’、1B−2’またはサーバ2−2’は、一定時間通話が検出されない場合に終了してもよいし、視聴ユーザによる明示的な終了指示操作に応じて終了してもよい。明示的な終了指示操作とは、テレビジョン装置30と接続されるリモートコントローラや、視聴ユーザによるジェスチャ、音声、視線等を用いた操作である。クライアント装置1A−2’、1B−2’は、視聴ユーザによるこれら明示的な終了指示操作を検出した場合、視聴ユーザの音声や映像の送信を終了する。
【0111】
また、本実施形態の変形例による視聴反応フィードバックシステムは、特定共感シーンが検出されていない場合でも、一時的に直接的なコミュニケーションを行いたいという視聴ユーザによる明示的な指示に応じて、一時的に直接的なコミュニケーションを開始してもよい。明示的な指示とは、例えばリモートコントローラにおける特定の操作(ボタンの押下等)、スマートフォン等の情報処理端末のGUIにおける特定の操作、特定のジェスチャ、音声認識、または視線検出等を用いて、クライアント装置1に対して行われ得る。かかる指示を受け取ったクライアント装置1は、サーバ2−2’および、親しい特定の他の視聴ユーザが居る視聴環境のクライアント装置に対して、直接的なコミュニケーションの開始を通知する。
【0112】
なお、コンテンツに集中したいユーザによっては、非言語リアクション等の感情表現データに変換されていない他の視聴ユーザの映像や音声による直接的なコミュニケーションを拒否したい場合もある。この場合、特定共感シーンの検出通知や直接的なコミュニケーションを受信しないよう、クライアント装置1側で拒否設定することも可能である。
【0113】
<2−3.第3の実施形態>
以上説明したように、ネットワークを介してサーバ2に接続された複数の視聴環境に対して、各視聴ユーザの感情推定結果の統合結果に基づく感情表現データを提示することで、各視聴ユーザは、共感をより強めることが可能となる。このような感情表現データの提示により視聴ユーザの共感を強めるシステムは、視聴環境が1つの場合にも適用され得る。視聴環境が1つしかない場合、他の視聴ユーザの感情推定結果の統合結果を用いることができないが、ユーザ指示の感情推定結果に基づいて、非言語リアクション等による感情表現データを決定し、ユーザ自身に提示することで、ユーザが感じている感情をより強く、増幅することができる。このような単一の視聴環境による本開示によるシステムの適用を、以下、感情アンプリファとも称する。以下、本実施形態による感情アンプリファについて、
図11を参照して具体的に説明する。
【0114】
図11は、第3の実施形態によるクライアント装置1−3の内部構成の一例を示すブロック図である。
図11に示すように、本実施形態によるクライアント装置1−3は、反応情報取得部12、感情推定部13、決定部17、および出力制御部18を有する。これら各構成は、
図3を参照して説明した第1の実施形態の各構成と同様である。
【0115】
具体的には、まず、反応情報取得部12により、視聴ユーザの反応情報が取得される。例えば、サッカーのナイスプレーを見て盛り上がっている視聴ユーザの映像(ガッツポーズなど)が取得される。
【0116】
次いで、感情推定部13は、反応情報取得部12により取得された反応情報に基づいて、視聴ユーザの感情を推定する。例えば、感情推定部13は、ガッツポーズの映像に基づいて、「喜び」の感情を推定する。
【0117】
次に、決定部17は、推定された感情を表す感情表現データを決定する。例えば、「喜び」の感情の場合、『やったー!』『わーい』等の音声やテキストにより形成された感情表現データを決定する。
【0118】
そして、出力制御部18は、決定部17により決定された感情表現データを、情報提示装置(テレビジョン装置30やスピーカ)から出力し、視聴ユーザの盛り上がりを増幅させる。
【0119】
このように、単一の視聴環境においても、視聴ユーザ自身の感情に基づいて決定された感情表現データが視聴ユーザに提示することができ、視聴ユーザの感情を増幅させ、視聴ユーザは、より盛り上がったり、より泣けたり、より笑えたりすることができる。
【0120】
以上説明した第3の実施形態による感情アンプリファは、単一の視聴環境で利用されるが、本開示による感情アンプリファは、単一の視聴環境に限定されず、上記第1、第2の実施形態で説明したネットワークで接続された複数の視聴環境に併用して利用されてもよい。
【0121】
これにより、例えばマイナーだが自分の好きなアーティストが登場した瞬間や、マニアにしか分からないサッカーのナイスプレーのように、視聴ユーザだけが盛り上がる場合にも、視聴ユーザの盛り上がりに応じて、実際のコンテンツにはない歓声等が出力され、各ユーザに適した盛り上がりが演出される。
【0122】
また、サッカーの試合等リアルタイムのコンテンツを視聴している際に、サッカーのゴールシーンで盛り上がっているタイミングと、他の視聴ユーザの感情推定結果(の統合結果)に基づく感情表現データが提示されるタイミングとの間にディレイが生じる場合がある。この場合に、上述した第3の実施形態による感情アンプリファを併用することで、視聴ユーザ自身の感情に基づいて決定された感情表現データを即座に提示し、後から他の視聴ユーザの感情表現データを提示することで、ディレイを解消してリアルタイムな盛り上がりを演出することができる。
【0123】
また、本実施形態による視聴反応フィードバックシステムでは、視聴ユーザと親しい特定の他の視聴ユーザの感情を表す感情表現データを先に提示(出力)し、後から、不特定多数の他の視聴ユーザの感情を表す感情表現データを提示(出力)してもよい。これにより、親しい友人等の特定の他の視聴ユーザの反応を先に知ることができ、親しい友人同士で盛り上がりを共感して楽しむことができる。具体的には、例えば出力制御部18は、特定の他の視聴ユーザの感情を表す感情表現データ(以下第1の感情表現データとも称す)の出力を終了してから、不特定多数の他の視聴ユーザの感情を表す感情表現データ(以下第2の感情表現データとも称す)の出力を開始してもよい。また、出力制御部18は、第1の感情表現データの出力をフェードアウトさせながら、第2の感情表現データの出力をフェードインさせてもよい(クロスフェード)。また、出力制御部18は、第2の感情表現データの出力を開始する際、第1の感情表現データの出力値(音量や表示テキストの大きさ等)を第2の感情表現データの出力値より下げて第1の感情表現データの出力を継続させてもよい。
【0124】
<2−4.第4の実施形態>
以上第1〜第3の実施形態では、コンテンツをリアルタイムで視聴している視聴ユーザ間で感情表現データを提示し、各視聴ユーザの共感をより強めているが、本開示による視聴反応フィードバックシステムはこれに限定されない。例えば、各視聴ユーザの感情推定結果または統合結果を、コンテンツの該当シーンにタグ付け(以下、感情タグとも称す)することで、後から当該感情タグを用いてコンテンツを検索したり推薦したり感情表現データの提示を行ったりすることも可能である。
【0125】
通常、録画機器などにおいては、コンテンツ内にチャプタを付与する際に、「CM」、「後メタ(シーン別、俳優別など)」、「コンテンツ内の音量レベル」のような情報を元にチャプタを設定している。しかし、実際の視聴ユーザの反応は反映されていないので、コンテンツを視聴する際に、「世間一般で盛り上がったシーンは自分も見ておきたい」と思っても、世間一般で盛り上がったシーンを検索することが困難であった。
【0126】
そこで、本実施形態では、実際の視聴ユーザの感情推定結果に基づく感情タグをコンテンツのシーンに付加することで、実際の他の視聴ユーザの感情推定結果を用いて見たいシーンを選ぶことができる。また、実際の他の視聴ユーザの感情推定結果をコンテンツの推薦に用いることで、視聴ユーザに対して精度の高い推薦を行うことができる。以下、
図12を参照して具体的に説明する。
【0127】
図12は、第4の実施形態による視聴反応フィードバックシステムを形成する各装置の内部構成の一例を示すブロック図である。
図12に示すように、本実施形態による視聴反応フィードバックシステムは、複数のクライアント装置1A−4、1B−4と、サーバ2−4を有する。
【0128】
・クライアント装置1A−4
クライアント装置1A−4は、
図1に示す視聴環境Aを制御する装置であって、具体的には、
図12に示すように、反応情報取得部12A、感情推定部13A、通信部10A、およびコンテンツ処理部19Aを有する。反応情報取得部12A、感情推定部13A、および通信部10Aは、
図10を参照して説明した第2の実施形態と同様である。
【0129】
コンテンツ処理部19Aは、ユーザ操作に応じたコンテンツの再生制御や、感情タグに基づくコンテンツのシーン検索等を行う。また、コンテンツ処理部19は、ユーザが視聴しているコンテンツの情報(CH情報、番組情報、時刻情報など)を、通信部10Aを介してサーバ2−4に送信してもよい。
【0130】
・クライアント装置1B−4
クライアント装置1B−4は、
図1に示す視聴環境Bを制御する装置であって、具体的には、
図12に示すように、反応情報取得部12B、感情推定部13B、通信部10B、およびコンテンツ処理部19Bを有する。反応情報取得部12Bおよび通信部10Bは、
図10を参照して説明した第2の実施形態によると同様である。
【0131】
また、感情推定部13Bは、
図10を参照して説明した第2の実施形態による感情推定部13と同様の機能を有する。
【0132】
コンテンツ処理部19Bは、上述したコンテンツ処理部19Aと同様の機能を有する。
【0133】
・サーバ2−4
サーバ2−4は、
図12に示すように、受信部21、対応付け部26、感情タグ生成部27、および送信部25を有する。
【0134】
受信部21は、クライアント装置1A−4を含む複数のクライアント装置1から、感情推定結果を受信する。
【0135】
対応付け部26は、コンテンツと、受信部21で受信した各視聴ユーザの感情推定結果のマッピング(統合)を行う。具体的には、対応付け部26は、コンテンツに対して時系列で、各感情推定結果を対応付ける。この際、対応付け部26は、複数の感情推定結果を統合した統合結果を、対応するコンテンツのシーン(チャプタ)に対応付けてもよい。
【0136】
感情タグ生成部27は、対応付け部26により対応付けられた感情推定結果(または統合結果)に基づいて、コンテンツのどのシーンにどのような感情が対応付けられたかを示す情報を感情タグとして生成し、送信部25を介して各クライアント装置1A−4、1B−4に送信する。
【0137】
以上説明した構成により、各クライアント装置1A−4、1B−4のコンテンツ処理部19A、19B(以下、コンテンツ処理部19とも称す)は、コンテンツ再生時に、通信部10から受信した感情タグに基づいてコンテンツのシーン検索を行うことができる。
【0138】
例えば、ある番組Xが各ユーザにより視聴された際に、サーバ2−4において、複数のユーザがどこで盛り上がったか、笑ったか、悔しがったか等を示す感情タグが生成され、クライアント装置1に送信される。
【0139】
そして、クライアント装置1は、後でユーザがコンテンツを視聴する際に、実際の他ユーザがどこで盛り上がったか等を示す感情タグを用いて、コンテンツのシーン検索や、推薦を行う。
【0140】
これにより、コンテンツを視聴しようとするユーザは、実際に世間一般または特定のコミュニティで盛り上がったシーンを検索することが可能である。
【0141】
また、コンテンツを視聴しようとするユーザは、今の自分の気持ち(感情)に合うコンテンツを検索したりすることが可能である。例えば、ユーザが笑いたいと思った時に、タイトルから推測可能なお笑い番組以外にも、タイトルからは推測できないが笑える番組(コンテンツ)を検索することが可能である。
【0142】
また、クライアント装置1は、感情タグ生成に用いられた他の視聴ユーザの数や、感情推定結果のスコアを用いて、より視聴ユーザの希望に合ったコンテンツを推薦することが可能である。
【0143】
また、クライアント装置1は、録画されたある番組をタイムシフト再生する際に、感情タグを用いて、盛り上がったシーンや面白かったシーンのみを再生するといったシーン再生も可能である。
【0144】
なお、本実施形態による対象コンテンツとしては、放送中の番組以外にも、録画機に録画された番組、VODコンテンツ、ネット動画コンテンツ等も含む。
【0145】
また、クライアント装置1は、再生プログレスバー上に、アイコンや色などで感情タグを表現してもよい。
【0146】
なお、本実施形態では、サーバ2−4の対応付け部26において対象とする視聴ユーザの範囲を特に限定していないが、対象とする視聴ユーザの範囲は、全て(不特定多数)であってもよいし、視聴ユーザの設定に応じた特定のコミュニティやフレンドのみ(特定の他ユーザ)であってもよい。
【0147】
<<3.まとめ>>
上述したように、本実施形態では、視聴ユーザの視聴を妨げることなく、また、視聴ユーザのプライバシーも保護できる方法で、他の視聴ユーザまたは視聴ユーザ本人の視聴反応を示す感情表現データをフィードバックし、共感を強めさせることができる。
【0148】
また、従来のビジュアルコミュニケーションの場合、自分のカメラ映像とマイク音声が会話相手にそのまま提示されるため、意図せずに発したリアクション(言葉、表情、動きなど)がそのまま相手に伝わってしまうといったプライバシー観点での問題があった。また、リアクションを受け取る会話相手側としても、相手の生々しいリアクションによってコンテンツ視聴を妨げられてしまう問題があった。しかし、本実施形態によれば、視聴ユーザの反応が、感情を表す感情表現データ(例えば非言語リアクション)に変換されて提示されるので、プライバシーが保護され、また、コンテンツ視聴が妨げること無く、他人とコンテンツを共感する体験が可能となる。
【0149】
また、従来のコンテンツ視聴の場合、感情(笑い声、感嘆、残念など)や盛り上がりなどの演出をコンテンツ製作者側が行っている(例えば、お笑い番組での観客の笑い声の挿入など)。しかし、本実施形態によれば、実際の他の視聴ユーザや、特定のコミュニティ内(面識のある特定の他ユーザ等)や、自分自身の感情や盛り上がりによって、感情表現データが提示されるので、よりリアルな共感体験が可能となる。
【0150】
また、従来のビジュアルコミュニケーションを用いたコンテンツ共同視聴体験の場合、音声を伴わない感情表現が発生した場合に、画面上に映っている相手のカメラ映像に視線を向けないとその感情を共感することができず、コンテンツ視聴の妨げになっていた(例えば、お笑い番組を観ていて、声を出さずに笑顔になっている時など)。しかし、本実施形態によれば、音声を伴わない感情も(笑顔のみなど)、感情表現データに変換されるので、より豊かな共感体験を実現することが可能となる。
【0151】
また、実際に複数人でコンテンツを共同視聴する場合、他者のリアクションは自分の周辺で発生する。そのため、遠隔でのコンテンツ共同視聴の際に、ユーザの前方から他者の非言語リアクション(音声データ)が提示されると違和感が生じる可能性が高い。そこで、本実施形態によれば、ユーザの周囲に音像定位された非言語リアクション(音声データ)が提示されるので、遠隔でのコンテンツ共同視聴時でもより一体感のある環境を実現することが可能となる。
【0152】
また、本実施形態では、プロジェクタを用いてテレビジョン装置30の周辺領域に非言語リアクションを提示(投影)することで、コンテンツ視聴を妨げることなく共感体験を実現できる。
【0153】
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本技術はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
【0154】
例えば、クライアント装置1(1A−1〜1A−4、1B−1〜1B−4)、サーバ2(サーバ2−1〜サーバ2−4)に内蔵されるCPU、ROM、およびRAM等のハードウェアに、上述したクライアント装置1、サーバ2の機能を発揮させるためのコンピュータプログラムも作成可能である。また、当該コンピュータプログラムを記憶させたコンピュータ読み取り可能な記憶媒体も提供される。
【0155】
また、本明細書では、サッカーやアーティストのライブのようなコンテンツを用いて説明したが、コンテンツの種類はこれらに限定されず、ネットワークを介して複数のユーザ(プレイヤー)が参加できるゲームも含まれる。
例えば、ユーザ3Aが、あるゲームを不特定多数の他のユーザと一緒にプレイしている際に、非言語リアクションを用いてユーザ3Aと同じチームのユーザの感情を提示してもよい。
【0156】
また、各ユーザの感情推定結果や統合結果は、コンテンツの時系列に沿ったタイムスタンプとセットでサーバ2に保存されていてもよい。これにより、後からコンテンツを再生した際に、クライアント装置1は、サーバ2に保存された感情推定結果や統合結果を取得し、再生中のコンテンツのタイムスタンプを元に非言語リアクションを決定して提示してもよい。
【0157】
なお、本技術は以下のような構成も取ることができる。
(1)
コンテンツに対する視聴ユーザの反応を取得する取得部と、
前記取得部による取得された視聴ユーザの反応情報に基づいて、前記視聴ユーザの感情を推定する感情推定部と、
前記感情推定部による推定された感情を表す感情表現データを決定する決定部と、
前記決定部により決定された感情表現データを出力する出力部と、
を備える、クライアント装置。
(2)
前記決定部は、複数の視聴ユーザの感情推定結果が統合された感情に基づいて、前記感情表現データを決定する、前記(1)に記載のクライアント装置。
(3)
前記クライアント装置は、
前記感情推定部により推定した感情を示す情報を、サーバに送信する送信部と、
前記複数の視聴ユーザの感情推定結果が統合された感情を示す情報を、前記サーバから受信する受信部と、
をさらに備える、前記(2)に記載のクライアント装置。
(4)
前記複数の視聴ユーザの感情推定結果とは、特定視聴ユーザの感情推定結果である、前記(2)または(3)に記載のクライアント装置。
(5)
前記複数の視聴ユーザの感情推定結果とは、不特定多数の視聴ユーザの感情推定結果である、前記(2)または(3)に記載のクライアント装置。
(6)
前記出力部は、特定視聴ユーザの感情推定結果の統合に基づいて決定された第1の感情表現データの出力開始後、不特定多数の視聴ユーザの感情推定結果の統合に基づいて決定された第2の感情表現データの出力を開始する、前記(2)に記載のクライアント装置。
(7)
前記出力部は、前記第1の感情表現データの出力を終了した後、前記第2の感情表現データの出力を開始する、前記(6)に記載のクライアント装置。
(8)
前記出力部は、前記第1の感情表現データの出力をフェードアウトさせながら、前記第2の感情表現データの出力をフェードインさせる、前記(6)に記載のクライアント装置。
(9)
前記出力部は、前記第2の感情表現データの出力を開始する際、前記第1の感情表現データの出力値を前記第2の感情表現データの出力値より下げる、前記(6)に記載のクライアント装置。
(10)
前記決定部は、前記感情表現データを、音声データ、テキストデータ、または描画データにより生成する、前記(1)〜(9)のいずれか1項に記載のクライアント装置。
(11)
前記感情表現データは、所定の感情を表す擬声語、感嘆詞、効果音、または効果線である、前記(10)に記載のクライアント装置。
(12)
前記決定部は、前記コンテンツの視聴者層、または前記視聴ユーザの属性の少なくともいずれかに応じた種類の感情表現データを決定する、前記(1)〜(11)のいずれか1項に記載のクライアント装置。
(13)
前記取得部は、前記視聴ユーザの反応として前記視聴ユーザの音声を収音する、前記(1)〜(12)のいずれか1項に記載のクライアント装置。
(14)
前記クライアント装置は、
前記収音した視聴ユーザの音声から前記感情表現データを抽出する抽出部と、
前記抽出部により抽出した前記感情表現データをサーバに送信する送信部と、
をさらに備える、前記(13)に記載のクライアント装置。
(15)
前記取得部は、前記視聴ユーザの反応として前記視聴ユーザの顔画像を撮像する、前記(1)〜(14)のいずれか1項に記載のクライアント装置。
(16)
前記出力部は、前記感情表現データを音声および表示の少なくともいずれかにより出力する、前記(1)〜(15)のいずれか1項に記載のクライアント装置。
(17)
前記出力部は、外部装置と連携して前記感情表現データを出力する、前記(1)〜(16)のいずれか1項に記載のクライアント装置。
(18)
コンテンツに対する視聴ユーザの反応を取得するステップと、
前記取得された視聴ユーザの反応情報に基づいて、前記視聴ユーザの感情を推定するステップと、
前記推定された感情を表す感情表現データを決定するステップと、
前記決定された感情表現データを出力するステップと、
を含む、制御方法。
(19)
コンテンツに対する視聴ユーザの反応を取得する取得部と;
前記取得部による取得された視聴ユーザの反応情報に基づいて、前記視聴ユーザの感情を推定する感情推定部と;
サーバから受信した推定感情結果の統合結果に基づいて、感情表現データを決定する決定部と;
前記決定部により決定された感情表現データを出力する出力部と;
を有するクライアント装置と、
複数の前記クライアント装置から受信した前記視聴ユーザの感情推定結果を統合する統合部を有するサーバと、
を備える、システム。
(20)
コンピュータを、
コンテンツに対する視聴ユーザの反応を取得する取得部と、
前記取得部による取得された視聴ユーザの反応情報に基づいて、前記視聴ユーザの感情を推定する感情推定部と、
前記感情推定部による推定された感情を表す感情表現データを決定する決定部と、
前記決定部により決定された感情表現データを出力する出力部と、
として機能させるためのプログラム。