(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-06
(45)【発行日】2024-06-14
(54)【発明の名称】制御装置、制御方法、および、プログラム
(51)【国際特許分類】
H04N 21/431 20110101AFI20240607BHJP
H04N 21/438 20110101ALI20240607BHJP
G06N 20/00 20190101ALI20240607BHJP
G06F 16/75 20190101ALI20240607BHJP
H04N 5/262 20060101ALI20240607BHJP
【FI】
H04N21/431
H04N21/438
G06N20/00
G06F16/75
H04N5/262
(21)【出願番号】P 2023505092
(86)(22)【出願日】2021-10-08
(86)【国際出願番号】 JP2021037485
(87)【国際公開番号】W WO2022190446
(87)【国際公開日】2022-09-15
【審査請求日】2023-06-01
(31)【優先権主張番号】P 2021039093
(32)【優先日】2021-03-11
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】100109210
【氏名又は名称】新居 広守
(74)【代理人】
【識別番号】100137235
【氏名又は名称】寺谷 英作
(74)【代理人】
【識別番号】100131417
【氏名又は名称】道坂 伸一
(72)【発明者】
【氏名】一宮 永
(72)【発明者】
【氏名】前川 雄祐
(72)【発明者】
【氏名】中西 英雄
【審査官】鈴木 隆夫
(56)【参考文献】
【文献】国際公開第2011/037147(WO,A1)
【文献】特開2008-153895(JP,A)
【文献】特開2002-158941(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
G06N 20/00
G06F 16/75
H04N 5/262
(57)【特許請求の範囲】
【請求項1】
コンテンツを取得し、かつ、前記コンテンツの種別を示す第一種別情報を取得する取得部と、
前記取得部が取得した前記コンテンツに対して種別判定処理を行うことで、前記コンテンツの種別を示す第二種別情報を取得する判定部と、
前記第一種別情報と前記第二種別情報とが一致する場合に、前記第一種別情報と前記第二種別情報とが一致しない場合よりも、前記コンテンツを提示する際に付与する提示効果の強度を高くする制御情報を生成して出力する生成部とを備える
制御装置。
【請求項2】
前記判定部は、前記種別判定処理において、
機械学習によって構築された認識モデルに、前記コンテンツを入力し、
前記認識モデルに前記コンテンツを入力することで出力された前記コンテンツの種別情報を、前記第二種別情報として取得する
請求項1に記載の制御装置。
【請求項3】
前記第一種別情報は、前記コンテンツ全体の種別を示しており、
前記判定部は、前記コンテンツに含まれる複数の部分コンテンツそれぞれの種別を判定する
請求項2に記載の制御装置。
【請求項4】
前記取得部は、前記コンテンツの種別を示す情報として設定された情報を前記制御装置と異なる装置から、前記第一種別情報として取得する
請求項1~3のいずれか1項に記載の制御装置。
【請求項5】
前記取得部は、取得した前記コンテンツを分析することで得られる前記コンテンツの種別情報を、前記第一種別情報として取得する
請求項1~3のいずれか1項に記載の制御装置。
【請求項6】
前記制御情報は、前記コンテンツを提示する際の提示効果の強度を時系列で示す情報を含む
請求項1~5のいずれか1項に記載の制御装置。
【請求項7】
前記生成部は、前記制御情報を生成するときに、前記コンテンツを提示する際の提示効果の強度の急激な変化を抑制する処理を施す
請求項1~6のいずれか1項に記載の制御装置。
【請求項8】
前記生成部は、
コンテンツの種別を示す種別情報と、当該種別のコンテンツを提示する際に付与すべき提示効果とが予め対応付けられた対応付け情報を有しており、
前記制御情報を生成する際には、前記第一種別情報に予め対応付けられた提示効果を付与する制御情報を、前記制御情報として生成する
請求項1~7のいずれか1項に記載の制御装置。
【請求項9】
前記生成部は、前記コンテンツを提示する際の提示効果として、音響効果および映像効果の少なくとも一方の強度を高くする制御情報を、前記制御情報として生成する
請求項1~8のいずれか1項に記載の制御装置。
【請求項10】
前記生成部は、提示効果の強度の範囲を設定する操作をユーザから受け、
前記操作により設定される強度の範囲内で提示効果を制御する前記制御情報を生成する
請求項1~9のいずれか1項に記載の制御装置。
【請求項11】
コンテンツを取得し、かつ、前記コンテンツの種別を示す第一種別情報を取得し、
取得した前記コンテンツに対して種別判定処理を行うことで、前記コンテンツの種別を示す第二種別情報を取得し、
前記第一種別情報と前記第二種別情報とが一致する場合に、前記第一種別情報と前記第二種別情報とが一致しない場合よりも、前記コンテンツを提示する際に付与する提示効果の強度を高くする制御情報を生成して出力する
制御方法。
【請求項12】
請求項11に記載の制御方法をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、制御装置、制御方法、および、プログラムに関する。
【背景技術】
【0002】
従来、動画像データであるコンテンツを種別ごとに分類し、種別に基づいて提示効果を制御する技術がある。
【0003】
例えば、動画像データに含まれる画像の特徴を分析することで、画像を種別ごとに分類する技術がある(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、画像の特徴に基づく種別の分類に誤りが生じ、コンテンツの提示効果の制御が適切でなくなることがあるという問題がある。
【0006】
そこで、本開示は、コンテンツの種別に基づく提示効果の制御を適切に行う制御装置等を提供する。
【課題を解決するための手段】
【0007】
本開示における制御装置は、コンテンツを取得し、かつ、前記コンテンツの種別を示す第一種別情報を取得する取得部と、前記取得部が取得した前記コンテンツに対して種別判定処理を行うことで、前記コンテンツの種別を示す第二種別情報を取得する判定部と、前記第一種別情報と前記第二種別情報とが一致する場合に、前記第一種別情報と前記第二種別情報とが一致しない場合よりも、前記コンテンツを提示する際に付与する提示効果の強度を高くする制御情報を生成して出力する生成部とを備える制御装置である。
【0008】
本開示における制御方法は、コンテンツを取得し、かつ、前記コンテンツの種別を示す第一種別情報を取得し、取得した前記コンテンツに対して種別判定処理を行うことで、前記コンテンツの種別を示す第二種別情報を取得し、前記第一種別情報と前記第二種別情報とが一致する場合に、前記第一種別情報と前記第二種別情報とが一致しない場合よりも、前記コンテンツを提示する際に付与する提示効果の強度を高くする制御情報を生成して出力する制御方法である。
【発明の効果】
【0009】
本開示における制御装置は、コンテンツの種別に基づく提示効果の制御を適切に行うことができる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、実施の形態に係る制御装置を備える装置の外観を示す説明図である。
【
図2】
図2は、実施の形態に係る制御装置の機能構成を示すブロック図である。
【
図3】
図3は、実施の形態に係るコンテンツについて取得部が取得する種別と、判定部が判定する種別との一例を示す説明図である。
【
図4】
図4は、実施の形態に係る判定部による種別判定のための学習に用いられる訓練データの一例を示す説明図である。
【
図5】
図5は、実施の形態に係る判定部による種別判定の結果を示す種別情報の一例を示す説明図である。
【
図6】
図6は、実施の形態に係る、取得部による取得結果と判定部による種別判定の結果の一致または不一致の時間的変化の一例を示す説明図である。
【
図7】
図7は、実施の形態に係る生成部が制御情報に示される提示効果の強度の一例を示す説明図である。
【
図8】
図8は、実施の形態に係る生成部が実行するフィルタ処理の算出に用いられるフレームを示す説明図である。
【
図9】
図9は、実施の形態に係る生成部が実行するフィルタ処理に用いられる指標の例である。
【
図10】
図10は、実施の形態に係る生成部が実行するフィルタ処理により得られた提示効果の強度の例である。
【
図11】
図11は、実施の形態に係る提示効果のユーザ設定に用いられる操作バーの画像の一例を示す説明図である。
【
図12】
図12は、実施の形態に係る制御装置の制御方法を示すフロー図である。
【発明を実施するための形態】
【0011】
本願発明者は、従来のコンテンツの種別に基づく提示効果の制御に関し、以下の問題が生じることを見出した。
【0012】
コンテンツの種別は、例えば、放送番組に付与される公式番組情報(SI(Service Information)ともいう)に基づいて分類される。種別は、例えば、スポーツ、ミュージック、トークまたはシネマなどである。
【0013】
しかし、SIに基づいてコンテンツの種別の分類を行う場合、複数の種別に分類されるべき部分が一の放送番組に含まれているときに、適切な分類がなされないという問題がある。その場合、コンテンツの提示の際に適切な提示効果の制御がなされないという問題がある。
【0014】
例えば、サッカーの試合をメインに含む放送番組の一部に、サッカー選手がスタジオで話す場面が含まれることがある。この場合、放送番組は、全体としては、スポーツの種別に分類され、放送番組全体においてスポーツの種別の番組に適した提示効果が付与される。サッカー選手が話す場面では、トークの種別のコンテンツに適した提示効果が付与されるのが適切であるが、スポーツの種別のコンテンツに適した提示効果が付与されてしまい、言い換えれば、適切でない提示効果が付与されてしまう。
【0015】
そこで、本開示は、コンテンツの種別に基づく提示効果の制御を適切に行う制御装置等を提供する。
【0016】
本開示の一態様に係る制御装置は、コンテンツを取得し、かつ、前記コンテンツの種別を示す第一種別情報を取得する取得部と、前記取得部が取得した前記コンテンツに対して種別判定処理を行うことで、前記コンテンツの種別を示す第二種別情報を取得する判定部と、前記第一種別情報と前記第二種別情報とが一致する場合に、前記第一種別情報と前記第二種別情報とが一致しない場合よりも、前記コンテンツを提示する際に付与する提示効果の強度を高くする制御情報を生成して出力する生成部とを備える制御装置である。
【0017】
上記態様によれば、制御装置は、取得部が取得した種別情報と、判定部が種別判定処理によって取得した種別情報とを用いるので、より適切に判定された種別に応じた提示効果を、より高い強度で付与する制御をすることができる。よって、制御装置は、コンテンツの種別に基づく提示効果の制御を適切に行うことができる。
【0018】
例えば、前記判定部は、前記種別判定処理において、機械学習によって構築された認識モデルに、前記コンテンツを入力し、前記認識モデルに前記コンテンツを入力することで出力された前記コンテンツの種別情報を、前記第二種別情報として取得してもよい。
【0019】
上記態様によれば、制御装置は、判定部が機械学習によって構築された認識モデルを用いてコンテンツの種別を取得するので、コンテンツの種別をより適切に取得することができる。よって、制御装置は、コンテンツの種別に基づく提示効果の制御を、より適切に行うことができる。
【0020】
例えば、前記第一種別情報は、前記コンテンツ全体の種別を示しており、前記判定部は、前記コンテンツに含まれる複数の部分コンテンツそれぞれの種別を判定してもよい。
【0021】
上記態様によれば、制御装置は、コンテンツに含まれる複数の部分コンテンツのうち、コンテンツ全体の種別情報が当該部分コンテンツの種別と一致する部分コンテンツを提示する際に付与する提示効果の強度を高くする制御をする。よって、制御装置は、コンテンツの種別に基づく提示効果の制御を、部分コンテンツごとに適切に行うことができる。
【0022】
例えば、前記取得部は、前記コンテンツの種別を示す情報として設定された情報を前記制御装置と異なる装置から、前記第一種別情報として取得してもよい。
【0023】
上記態様によれば、制御装置は、コンテンツの種別を示す情報として設定された情報を第一種別情報として取得するので、より容易に、第一種別情報を得ることができる。言い換えれば、制御装置は、コンテンツの種別を判定する処理を行うことなく、第一種別情報を得ることができる。そのため、その処理をするとすれば必要となる消費電力、または、処理に用いられるハードウェアなどの資源が不要である。よって、制御装置は、より容易に、コンテンツの種別に基づく提示効果の制御を適切に行うことができる。
【0024】
例えば、前記取得部は、取得した前記コンテンツを分析することで得られる前記コンテンツの種別情報を、前記第一種別情報として取得してもよい。
【0025】
上記態様によれば、制御装置は、コンテンツを分析することで得られた情報を第一種別情報として取得するので、コンテンツの種別を示す情報を提供する装置が他に存在しない場合であっても、第一種別情報を得ることができる。よって、制御装置は、コンテンツの種別に基づく提示効果の制御を適切に行うことができる。
【0026】
例えば、前記制御情報は、前記コンテンツを提示する際の提示効果の強度を時系列で示す情報を含んでもよい。
【0027】
上記態様によれば、制御装置は、時系列で示されている制御情報を用いて、提示効果を時系列で制御することができる。よって、制御装置は、コンテンツの種別に基づく提示効果の制御を、より適切に行うことができる。
【0028】
例えば、前記生成部は、前記制御情報を生成するときに、前記コンテンツを提示する際の提示効果の強度の急激な変化を抑制する処理を施してもよい。
【0029】
上記態様によれば、制御装置は、提示効果の強度の急激な変化が抑制された制御情報を用いて提示効果を制御するので、付与される提示効果の強度が急激に変化することが抑制される。よって、制御装置は、コンテンツの種別に基づく提示効果の制御を、その急激な変化を抑制しながら、適切に行うことができる。
【0030】
例えば、前記生成部は、コンテンツの種別を示す種別情報と、当該種別のコンテンツを提示する際に付与すべき提示効果とが予め対応付けられた対応付け情報を有しており、前記制御情報を生成する際には、前記第一種別情報に予め対応付けられた提示効果を付与する制御情報を、前記制御情報として生成してもよい。
【0031】
上記態様によれば、制御装置は、コンテンツの種別に予め対応付けられた提示効果を、その強度を制御しながら付与することができる。よって、制御装置は、コンテンツの種別に対応する提示効果を適切に付与しながら、その提示効果の制御を適切に行うことができる。
【0032】
例えば、前記生成部は、前記コンテンツを提示する際の提示効果として、音響効果および映像効果の少なくとも一方の強度を高くする制御情報を、前記制御情報として生成してもよい。
【0033】
上記態様によれば、制御装置は、提示効果として、音響効果および映像効果の少なくとも一方を制御する。よって、制御装置は、コンテンツの種別に基づく音響効果または映像効果の制御を適切に行うことができる。
【0034】
例えば、前記生成部は、提示効果の強度の範囲を設定する操作をユーザから受け、前記操作により設定される強度の範囲内で提示効果を制御する前記制御情報を生成してもよい。
【0035】
上記態様によれば、制御装置は、ユーザから受けた範囲内で提示効果の強度を制御する。よって、制御装置は、提示効果の強弱についてのユーザの嗜好を反映した強度で、コンテンツの種別に基づく提示効果の制御をより適切に行うことができる。
【0036】
本開示の一態様に係る制御方法は、コンテンツを取得し、かつ、前記コンテンツの種別を示す第一種別情報を取得し、取得した前記コンテンツに対して種別判定処理を行うことで、前記コンテンツの種別を示す第二種別情報を取得し、前記第一種別情報と前記第二種別情報とが一致する場合に、前記第一種別情報と前記第二種別情報とが一致しない場合よりも、前記コンテンツを提示する際に付与する提示効果の強度を高くする制御情報を生成して出力する制御方法である。
【0037】
上記態様によれば、制御方法は、上記制御装置と同様の効果を奏する。
【0038】
本開示の一態様に係るプログラムは、上記の制御方法をコンピュータに実行させるプログラムである。
【0039】
上記態様によれば、制御方法は、上記制御装置と同様の効果を奏する。
【0040】
以下、適宜図面を参照しながら実施の形態を説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
【0041】
なお、本願発明者は、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
【0042】
(実施の形態)
本実施の形態において、コンテンツの種別に基づく提示効果の制御を適切に行う制御装置について説明する。
【0043】
図1は、本実施の形態に係る制御装置10を備える装置の外観を示す説明図である。制御装置10を備える装置の一例は、テレビジョン受像機1である。
【0044】
テレビジョン受像機1は、音および映像を含むコンテンツを含む信号を受信して、コンテンツに含まれる音および映像を提示する。上記信号は、例えば、放送局から放送波により送信される放送波に含まれる信号、各種送信源から通信回線を経由して送信される信号、または、外部装置が送信する信号を含む。各種送信源は、例えば、インターネット上の動画提供サービスのサーバ等を含む。外部装置は、例えば、録画装置、コンピュータまたはゲーム機等である。以降では、テレビジョン受像機1が放送波に含まれる信号を受信する場合を例として説明する。
【0045】
テレビジョン受像機1は、チューナ(不図示)とスピーカ5と画面6とを備え、放送波に含まれる信号からチューナを介して得られた音をスピーカ5により出力するとともに、放送波に含まれる信号からチューナを介して得られた画像を画面6に表示する。
【0046】
なお、コンテンツは、少なくとも映像を含む、ある時間長のデータまたは信号を含んでいる。また、コンテンツは、音および映像を含む、ある時間長のデータであってもよい。コンテンツは、一の放送番組に対応するものであってもよいし、一の放送番組に含まれる所定時間長の部分に対応するものであってもよい。コンテンツの時間長は、例えば、映像の1フレームに相当する時間以上であり、かつ、数秒~数時間以下の時間である。
【0047】
また、コンテンツは、さらにメタ情報を含んでもよい。メタ情報は、公式番組情報(SI(Service Information)ともいう)を含んでもよい。
【0048】
なお、制御装置10がテレビジョン受像機1に備えられる場合を例として説明するが、これに限られず、制御装置10は、放送波を受信してコンテンツを記憶し、その後にコンテンツを再生する録画機に備えられてもよい。
【0049】
制御装置10は、テレビジョン受像機1がコンテンツを再生するときに付与する提示効果を制御する制御情報を出力する。制御装置10は、テレビジョン受像機1が受信した放送波を取得し、放送波に含まれる信号から得られるコンテンツが、所定の複数の種別のうちのどの種別のコンテンツであるかを判定する。そして、制御装置10は、そのコンテンツを提示する際の提示効果を制御するための制御情報を生成して出力する。制御情報には、そのコンテンツの種別を示す情報と、そのコンテンツを提示する際の提示効果の強度を示す情報とが含まれている(後述)。コンテンツの種別には、例えばスポーツ、ミュージック、トークまたはシネマなどが含まれる。なお、上記のどの種別にも該当しないものの種別をデフォルトということにする。
【0050】
図2は、本実施の形態に係る制御装置10の機能構成を示すブロック図である。
【0051】
図2に示されるように、制御装置10は、取得部11と、判定部12と、生成部13とを備える。また、制御装置10は、テレビジョン受像機1が備える音制御部21と、映像制御部22とに接続されている。制御装置10が備える機能部は、制御装置10が備えるプロセッサ(例えばCPU(Central Processing Unit))(不図示)がメモリ(不図示)を用いて所定のプログラムを実行することで実現され得る。
【0052】
取得部11は、コンテンツを取得し、かつ、そのコンテンツの種別を示す種別情報(第一種別情報に相当)を取得する機能部である。
【0053】
取得部11が取得するコンテンツは、テレビジョン受像機1が放送波などから取得したコンテンツである。取得部11は、取得したコンテンツを、判定部12と生成部13とに提供する。
【0054】
取得部11が取得する種別情報は、取得部11が取得するコンテンツ全体の種別を示す情報であり、言い換えれば、コンテンツ全体に対して1つ付与される情報である。取得部11が取得する種別情報は、取得部11が取得するコンテンツの種別を示す情報として制御装置10の外部の装置により設定されたメタ情報(例えばSI)であってもよい。上記外部の装置は、放送番組を提供するテレビ局が有する装置であってもよいし、メタ情報を生成する第三者が有する装置であってもよいし、制御装置10にメタ情報を提供するための専用の装置であってもよい。
【0055】
なお、取得部11が取得するコンテンツが、テレビジョン受像機1がHDMI(登録商標)規格に従って受信したコンテンツである場合には、HDMI(登録商標)コンテンツタイプ(Content Type)から種別情報を取得してもよい。
【0056】
また、取得部11が取得する種別情報は、取得部11が取得したコンテンツを分析することで得られる種別情報であってもよい。その場合、取得部11は、コンテンツの映像データ、音データおよびメタ情報における特徴を分析する処理を実行する。具体的には、取得部11は、コンテンツの映像に含まれる人間の目線の検出処理、コンテンツの映像に含まれる物体の動きの検出処理、コンテンツの音に含まれる特定の音の検出処理、または、コンテンツの映像に含まれる物体のパターン検出処理などを実行することで、コンテンツの種別を特定する。映像データおよび音データの解析には、周知の画像認識技術、音認識技術(音声認識技術)が用いられ得る。取得部11は、コンテンツの映像、音またはメタ情報に、所定の情報またはデータが検出されることに基づいてコンテンツの種別を判定する。
【0057】
例えば、目線の検出処理において、出演者のカメラ目線を検出した場合には、コンテンツの種別を「トーク」と判定する。また、物体の動きの検出処理において、比較的速い動きを検出した場合には、コンテンツの種別を「スポーツ」と判定し、一方、比較的遅い動きを検出した場合には、コンテンツの種別を「トーク」と判定する。また、音の検出処理において、歌唱する歌声または楽器が奏でる音を検出した場合には、コンテンツの種別を「ミュージック」と判定する。また、物体のパターン検出処理において、ユニフォームの画像を検出した場合には、コンテンツの種別を「スポーツ」と判定し、一方、楽器の画像を検出した場合には、コンテンツの種別を「ミュージック」と判定する。
【0058】
判定部12は、取得部11が取得したコンテンツに対して種別判定処理を行うことで、コンテンツの種別を示す種別情報(第二種別情報に相当)を取得する機能部である。
【0059】
判定部12は、種別判定処理において、事前に機械学習によって構築された認識モデルにコンテンツを入力し、コンテンツを入力することで出力されたコンテンツの種別情報を、第二種別情報として取得してもよい。
【0060】
判定部12は、より具体的には、コンテンツに含まれる複数の部分コンテンツそれぞれの種別を判定する。ここで、部分コンテンツとは、コンテンツに含まれる所定のフレーム数を有する部分であり、例えば、1フレーム、10フレームまたは30フレームを有する部分である。なお、部分コンテンツは、コンテンツに含まれる所定の時間長(例えば、1秒間、5秒間または10秒間など)を有する部分としてもよい。
【0061】
判定部12は、種別判定処理により、取得部11がコンテンツの種別を取得する方法とは異なる方法で、取得部11が取得するコンテンツの種別を取得する、ともいえる。より具体的には、判定部12は、例えばメタ情報を用いることなく、取得部11が取得するコンテンツの種別を取得する、ともいえる。
【0062】
生成部13は、コンテンツを提示する際の提示効果の強度を制御するための制御情報を生成して出力する機能部である。生成部13は、取得部11が取得した第一種別情報と判定部12が取得した第二種別情報とが一致する場合に、第一種別情報と第二種別情報とが一致しない場合よりも、コンテンツを提示する際に付与する提示効果の強度を高くする制御情報を生成する。提示効果は、音響効果および映像効果の少なくとも一方を含む。制御情報は、音制御部21および映像制御部22に出力される。
【0063】
制御情報は、具体的には、コンテンツを提示する際に付与する提示効果の強度を時系列で示す情報を含む。制御情報は、コンテンツについての第一種別情報と、当該コンテンツに含まれる複数の部分コンテンツごとの第二種別情報とが一致する場合に、当該部分コンテンツの提示に際してより高い強度の提示効果を付与することを示している。
【0064】
生成部13は、コンテンツの種別を示す種別情報と、当該種別のコンテンツを提示する際に付与すべき提示効果とが予め対応付けられた対応付け情報を有している。そして、生成部13は、制御情報を生成する際には、第一種別情報に予め対応付けられた提示効果を付与する制御情報を生成する。
【0065】
対応付け情報は、例えば、種別情報と音響効果との対応付けとして以下の情報を有する。
【0066】
例えば、「スポーツ」の種別のコンテンツに対しては、音の広がりを大きくし、また、視聴者が音に包まれる感じを抱くように、音の出力方向を変更する音響効果が対応付けられる。また、例えば、「ミュージック」の種別のコンテンツに対しては、音の広がりを大きくするように、人が感じる音の聴こえ方を変更する音声信号処理を施し、また、ボーカルの声が強調されるように、出力される周波数帯域ごとに音声振幅を変化させる音響効果が対応付けられる。また、「トーク」の種別のコンテンツに対しては、視聴者が出演者の声を聞き取りやすいように、出力される周波数帯域ごとに音声振幅を変化させる音響効果が対応付けられる。
【0067】
また、対応付け情報は、例えば、種別情報と映像効果との対応付けとして以下の情報を有する。
【0068】
例えば、「スポーツ」の種別のコンテンツに対しては、映像を明るく鮮やかにするように、映像の輝度およびシャープネスを上げる映像効果が対応付けられる。例えば、「シネマ」の種別のコンテンツに対しては、質感が豊かに表現されるように、映像の輝度を抑えながらコントラストを上げる映像効果が対応付けられる。
【0069】
なお、生成部13は、制御情報を生成するときに、提示効果の強度の急激な変化を抑制する処理を施してもよい。上記処理をフィルタ処理ともいう。上記処理は、いわゆるローパスフィルタ処理であり、ノイズ除去処理または平滑化処理とも呼ばれ得る。
【0070】
音制御部21は、生成部13が出力した制御情報を取得し、制御情報に基づいてスピーカ5による音の出力を制御する機能部である。音制御部21は、取得部11が取得したコンテンツに含まれる音をスピーカ5により出力する制御をする。その際、音制御部21は、制御情報に含まれる提示効果の強度に従って音響効果を付与するように、出力する音を加工する。
【0071】
映像制御部22は、生成部13が出力した制御情報を取得し、制御情報に基づいて画面6による画像の表示を制御する機能部である。映像制御部22は、取得部11が取得したコンテンツに含まれる映像を画面6に表示する制御をする。その際、映像制御部22は、制御情報に含まれる強度に従って映像効果を付与するように、表示する映像を加工する。
【0072】
以降において、制御装置10の処理についてより詳細に説明する。
【0073】
図3は、本実施の形態に係るコンテンツについて取得部11が取得する種別と、判定部12が判定する種別との一例を示す説明図である。
【0074】
図3に示されるコンテンツは、取得部11が取得したコンテンツの一例であり、サッカーの試合の放送番組のコンテンツである。コンテンツは、より詳細には、オープニング、競技、CM(コマーシャルメッセージ)、競技、観衆、競技、および、インタビューの各部分コンテンツをこの順に含んでいる。
【0075】
このコンテンツのSIは、このコンテンツの種別が「スポーツ」であることを示しているとする。
【0076】
取得部11は、コンテンツのSIを取得することで、このコンテンツ全体の種別として「スポーツ」を示す情報(以降、単に「スポーツ」ともいう)を取得する。
【0077】
判定部12は、コンテンツに含まれる複数の部分コンテンツそれぞれの種別を判定することで、複数の部分コンテンツそれぞれの種別を示す情報を取得する。具体的には、判定部12は、オープニングまたはCMの部分コンテンツの種別として「デフォルト」を取得し、競技または観衆の部分コンテンツの種別として「スポーツ」を取得し、インタビューの部分コンテンツの種別として「トーク」を取得する。
【0078】
図4は、本実施の形態に係る判定部12による種別判定のための学習に用いられる訓練データの一例を示す説明図である。
【0079】
図4に示される訓練データは、1つの部分コンテンツと1つの種別とが対応付けられた訓練データである。
【0080】
例えば、
図4に示される訓練データ#1では、サッカーをプレイしている選手を示す画像を含む部分コンテンツと、当該部分コンテンツの種別としての「スポーツ」とが対応付けられている。
【0081】
また、訓練データ#2では、ステージで歌唱している歌手を示す画像を含む部分コンテンツと、当該部分コンテンツの種別としての「ミュージック」とが対応付けられている。
【0082】
また、訓練データ#3では、対話をしている出演者を示す画像を含む部分コンテンツと、当該部分コンテンツの種別としての「トーク」とが対応付けられている。
【0083】
なお、訓練データには、画像だけでなく、音声も含まれてよい。
【0084】
訓練データには、
図4に具体的に示される3つの部分コンテンツの他にも、数千~数万以上のコンテンツが含まれ得る。また、各部分コンテンツに対応付けられる種別は、所定の複数の種別のうちのいずれかの種別である。所定の複数の種別は、例えば「スポーツ」、「ミュージック」および「トーク」を含むが、これに限られない。
【0085】
判定部12は、訓練データを用いた機械学習によって、事前に認識モデルを構築しておく。認識モデルは、例えば、ニューラルネットワークによる認識モデルである。その場合、判定部12は、訓練データを用いた訓練によって、入力された部分コンテンツの画像または音声の特徴を抽出し、入力された部分コンテンツに対応する種別を出力するように、ニューラルネットワークにおける各ノードの係数を調整することで、認識モデルを構築する。
【0086】
このように訓練された認識モデルは、未知の部分コンテンツが入力された場合に、入力された部分コンテンツの画像および音の特徴に基づいて、そのコンテンツの種別を示す種別情報を出力する。
【0087】
認識モデルにより出力される種別情報は、一例として、入力された部分コンテンツが所定の複数の種別のうちのどの種別であるかを特定する情報であり、この場合を例として説明する。なお、出力される種別情報は、入力された部分コンテンツが所定の複数の種別それぞれに分類される確率であるスコアを含む情報であってもよい。
【0088】
図5は、本実施の形態に係る判定部12による種別判定の結果を示す種別情報の一例を示す説明図である。
【0089】
判定部12は、取得部11が取得したコンテンツに含まれる部分コンテンツを認識モデルに入力することで出力される種別情報を取得する。
【0090】
例えば、
図5に示される部分コンテンツ31が認識モデルに入力された場合、認識モデルは、入力された部分コンテンツ31の種別として「スポーツ」を出力する。
【0091】
図6は、本実施の形態に係る、取得部11による取得結果と判定部12による種別判定の結果の一致または不一致の時間的変化の一例を示す説明図である。具体的には、
図6は、取得部11が取得したコンテンツ全体の種別に、判定部12が判定した部分コンテンツの種別が一致するか、または、一致しないかを時系列で示すグラフである。
【0092】
例えば、コンテンツ全体の種別が「スポーツ」である場合、部分コンテンツの種別が判定部12によって「スポーツ」と判定されたときには、その部分コンテンツに対応する期間において種別が「一致」であり、部分コンテンツの種別が「スポーツ」以外の種別であると判定されたときには、その部分コンテンツに対応する期間において種別が「不一致」である。
【0093】
なお、
図6の横軸のスケールは任意であるが、例えば、1目盛りが20フレーム分の時間に相当する。
【0094】
図7は、本実施の形態に係る生成部13が制御情報に示される提示効果の強度Iの一例を示す説明図である。
【0095】
生成部13は、
図6に示される種別の一致または不一致に基づいて、提示効果の強度Iを示す制御情報を生成する。
【0096】
図7に示される強度情報において、種別が一致である期間における強度Iが100%と設定されており、種別が不一致である期間における強度Iが0%と設定されている。なお、0%の強度とは、特別の提示効果が付与されないことを意味しており、言い換えれば、通常の提示がなされることを意味している。なお、上記における100%および0%は例示であり、強度情報において、種別が一致である期間における強度Iが、種別が不一致である期間における強度Iより高く設定されていればよい。
【0097】
なお、種別が不一致の場合に、第一種別情報と第二種別情報の組み合わせにより強度を変えるようにしてもよい。
【0098】
図7に示される制御情報によって、音制御部21による音響効果の強度が制御され、制御された強度の音響効果が付与された音がスピーカ5により出力される。また、出力された制御情報によって、映像制御部22による映像効果の強度が制御され、制御された強度の映像効果が付与された映像が画面6に表示される。
【0099】
このようにして、制御装置10は、コンテンツの種別に基づく提示効果の制御を適切に行うことができる。
【0100】
以降において、生成部13が実行する、提示効果の強度の急激な変化を抑制するフィルタ処理を説明する。フィルタ処理は、加重移動平均を用いた方法が用いられ得る。
【0101】
図8は、本実施の形態に係る生成部13が実行するフィルタ処理の算出に用いられるフレームを示す説明図である。
図9は、本実施の形態に係る生成部13が実行するフィルタ処理に用いられる指標の例である。
図10は、本実施の形態に係る生成部13が実行するフィルタ処理により得られた提示効果の強度の例である。
【0102】
図8に示される時刻tのフレームが、種別の判定の対象である部分コンテンツであるフレームである。フィルタ処理において、時刻t-kから時刻tまでのk+1個のフレームを用いた加重移動平均
【数1】
に、0より大きな数値であるGainを乗じた
【数2】
を評価値Eとして用いる。ここで、kは1より大きな整数であり算出区間を示す。また、Gainは、提示効果の強度の変化の感度を調整するためのパラメータとして機能する。評価値Eが1を超える場合には、1とすることで、評価値Eを0より大きく1以下の範囲に収める。
【0103】
このように算出された評価値Eの時間的変化を
図9に示す。
【0104】
図9に示されるように評価値Eの時間的変化は、
図7に示される強度Iの時間的変化における急激な変化が抑制されたものに相当する。
【0105】
この評価値Eを用いて、時刻tにおける強度I(t)は、時刻tの直前つまり時刻t-1における強度I(t-1)を用いて以下のように表される。
【0106】
I(t)=E×p+I(t-1)×(1-p)
【0107】
ここで、pは、0より大きく1より小さい数値であり、時刻tにおける強度I(t)に、評価値Eと時刻t-1における強度I(t-1)とのどちらを重く反映するかを調整するパラメータとして機能する。
【0108】
このように算出された強度Iの時間的変化を
図10に示す。
【0109】
図10に示される強度Iの時間的変化は、
図9に示される評価値Eの時間的変化における急激な変化が、より一層抑制されたものに相当する。
【0110】
このように導出された強度Iを提示効果の強度として用いてコンテンツの提示をすることで、部分コンテンツごとの提示効果の制御を実現するとともに、提示効果の急激な変化を抑えることができる。
【0111】
なお、提示効果の強度は、ユーザによる設定を反映して制御することもできる。
【0112】
図11は、本実施の形態に係る提示効果のユーザ設定に用いられる操作バーの一例である画像40を示す説明図である。
【0113】
図11に示されるように操作バーの画像40は、左右に延びる操作バーを示す。画像40は、0を示す目盛り41と、10を示す目盛り42とを有し、また、これらの目盛りの間を移動可能である印43を有する。
【0114】
画像40がタッチパネルディスプレイに表示される場合、印43は、ユーザによるタッチ操作によって左右に移動され、印43の位置によって0から10までの範囲内の数値を示すようになっている。例えば、実線の印43の位置は、7の数値を示し、破線の印43の位置は、4の数値を示す。
【0115】
生成部13は、操作バーの印43の位置を読み取ることによって、提示効果の強度の範囲の設定をユーザから受ける。そして、生成部13は、上記操作により設定される強度の範囲内で提示効果を制御する制御情報を生成する。
【0116】
具体的には、生成部13は、操作バーの印43の位置として読み取った数値を提示効果の上限として用いる。例えば、0から10までの範囲を示す操作バーにおいて印43が7の数値を示す場合には、生成部13が算出した提示効果の強度を0.7倍した強度の提示効果を付与して、提示を行う。
【0117】
このようにすることで、制御装置10は、提示効果の強弱についてのユーザの嗜好を反映した強度で提示効果を付与することができる。
【0118】
なお、提示効果の強度を示す数値(上記における0、4、7および10)は例示であり、他の数値を用いることも可能である。
【0119】
なお、操作バーは、左右に延びて配置される例に限られず、上下または斜め方向に延びて配置されてもよい。また、操作バーの形状は、上記の例に限定されず、提示効果の強度の変更の操作の用に供される画像であることがユーザにわかるものであれば、どのようなものであってもよい。
【0120】
また、画像40がタッチパネルディスプレイではない、通常のディスプレイに表示される場合には、ユーザによるボタンまたはキーの操作によって上記と同様の操作がなされ得る。
【0121】
以上のように構成された制御装置10の処理を説明する。
【0122】
図12は、実施の形態に係る制御装置10の制御方法を示すフロー図である。
図12に示される制御方法は、コンテンツのフレームごとに実行され得る。
【0123】
ステップS101において、取得部11は、コンテンツを取得する。
【0124】
ステップS102において、取得部11は、ステップS101で取得したコンテンツの、コンテンツ全体の種別を示す種別情報を取得する。
【0125】
ステップS103において、判定部12は、ステップS101で取得したコンテンツに対して種別判定処理を行うことで、上記コンテンツに含まれる複数の部分コンテンツごとの種別情報を取得する。
【0126】
以降のステップS104、S105およびS111の処理は、複数の部分コンテンツそれぞれについて実行される。
【0127】
ステップS104において、生成部13は、ステップS101で取得したコンテンツ全体の種別情報と、ステップS102で取得した複数の部分コンテンツそれぞれの種別情報とが一致するか否かを判定する。上記2つの種別情報が一致する場合(ステップS104でYes)にはステップS105に進み、そうでない場合(ステップS104でNo)にはステップS111に進む。
【0128】
ステップS105において、生成部13は、処理の対象となっている部分コンテンツについて、提示効果の強度を高くする制御情報を生成する。提示効果の強度を高くする制御情報は、言い換えれば、提示効果の強度を通常とする場合(ステップS111)よりも高い提示効果の強度する制御情報である。提示効果の強度を高くする制御情報は、例えば、
図7における100%を示す制御情報である。
【0129】
ステップS111において、生成部13は、処理の対象となっている部分コンテンツについて、提示効果の強度を通常とする(つまり、特別の提示効果を付与しない)制御情報を生成する。提示効果の強度を通常とする制御情報は、言い換えれば、提示効果の強度を高くする場合(ステップS105)よりも低減された提示効果の強度とする制御情報である。提示効果の強度を通常とする制御情報は、例えば、
図7における0%を示す制御情報である。
【0130】
生成部13は、複数の部分コンテンツそれぞれについてステップS105またはステップS111を実行することで、
図7に例示される強度Iの時間的変化を取得する。
【0131】
ステップS106において、生成部13は、提示効果の強度の急激な変化を抑制するフィルタ処理を実行する。これにより、生成部13は、
図10に例示される強度Iの時間的変化を取得する。
【0132】
なお、ステップS106は、実行されなくてもよい。なお、ステップS106が実行される場合、処理の対象となっている部分コンテンツ以前の所定期間の提示効果の強度が算出されていることが必要である。
【0133】
ステップS107において、生成部13は、制御情報を出力する。出力される制御情報には、提示効果の種別を示す種別情報と、提示効果の強度Iを示す情報とが含まれている。強度Iは、ステップS105またはステップS111で取得された強度Iであり、ステップS106のフィルタ処理が実行された場合には、そのフィルタ処理が施された強度Iである。
【0134】
ステップS107で出力された制御情報によって、音制御部21による音響効果の強度が制御され、制御された強度の音響効果を伴った音がスピーカ5により出力される。また、出力された制御情報によって、映像制御部22による映像効果の強度が制御され、制御された強度の映像効果を伴った映像が画面6に表示される。
【0135】
図12に示される一連の処理により、コンテンツの種別に基づく提示効果の制御を適切に行うことができる。
【0136】
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
【0137】
したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
【0138】
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
【産業上の利用可能性】
【0139】
本開示は、テレビジョン受像機、または、録画装置などに適用可能である。
【符号の説明】
【0140】
1 テレビジョン受像機
5 スピーカ
6 画面
10 制御装置
11 取得部
12 判定部
13 生成部
21 音制御部
22 映像制御部
31 部分コンテンツ
40 画像
41、42 目盛り
43 印