(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0009】
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
【0010】
なお、添付図面および以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
【0011】
(実施の形態1)
以下、
図1〜
図12を用いて、実施の形態1を説明する。
【0012】
[1−1.構成]
[1−1−1.システム構成の概略]
図1は、実施の形態1における付加情報表示システム10の構成の一例を概略的に示す図である。付加情報表示システム10は、放送局12、映像送信装置であるSTB(Set Top Box)14、映像認識装置20、付加情報配信装置30、および映像受信装置40を備える。付加情報表示システム10は、映像認識装置20が有する映像認識技術を利用して、映像受信装置40が受信した映像がどのコンテンツのものかを特定し、そのコンテンツに関連する付加情報を、付加情報配信装置30から取得して映像受信装置40に表示する、ことができるように構成された通信システムである。
【0013】
映像受信装置40と、映像認識装置20および付加情報配信装置30とは、通信ネットワーク16を介して互いに接続されている。
【0014】
通信ネットワーク16は、有線、または無線、あるいはその双方が混在して構成されている。通信ネットワーク16は、例えばインターネットであるが、イントラネットや商業回線、あるいはその他の通信回線であってもよく、それらが混在していてもよい。
【0015】
映像受信装置40とSTB14とは、通信インターフェースを介して互いに接続されている。通信インターフェースは、例えばHDMI(登録商標)(High−Definition Multimedia Interfase)であるが、ビデオケーブルであってもよく、あるいはWi−Fi(登録商標)やBluetooth(登録商標)、無線LAN(Local Area Network)等の無線通信であってもよい。
【0016】
放送局12は、放送信号を送信(放送)するように構成された送信装置である。放送局12は、番組本体とコマーシャルメッセージ(CM)とを含むテレビ番組を映像信号にして放送信号に重畳し放送する。番組本体とCMとは時間の経過に伴って互いに切り替わる。以下、番組本体やCMを「コンテンツ」と記す。すなわち、放送局12は、時間の経過に伴って切り替わるコンテンツを放送する。なお、送信装置は何ら放送局12に限定されるものではなく、時間の経過に伴って切り替わるコンテンツを送信または放送するものであればよい。
【0017】
また、放送局12は、放送するコンテンツに特有の特徴があるときに、そのコンテンツやそのコンテンツの映像信号の特徴を示す情報(以下、「特徴情報」と記す)を含む情報を、映像信号とともに放送または送信することがある。以下、特徴情報を含むその情報を「コンテンツ関連情報」と記す。特有の特徴があるコンテンツとは、例えば、立体映像(3 Dimensional video images。以下、「3D映像」とも記す。また、3D映像の映像信号を「3D映像信号」とも記す)のコンテンツや、字幕が重畳されている映像を含むコンテンツ、等である。3D映像に関するコンテンツ関連情報には、例えば3D映像の映像信号伝送方式(サイド・バイ・サイド方式、トップ・アンド・ボトム方式、ライン・バイ・ライン方式、フレームシーケンシャル方式、等)に関する特徴情報が含まれていることがある。また、字幕に関するコンテンツ関連情報には、例えば、字幕の有無、字幕の位置や大きさ、字幕の色、字体、等に関する特徴情報が含まれていることがある。また、放送信号の放送形式に関する特徴情報がコンテンツ関連情報に含まれていることもある。
【0018】
STB14は、放送局12が放送する放送信号を受信して映像信号を取り出すように構成された受信機(チューナ)である。STB14は、例えば放送局12がデジタルの映像信号を放送する場合、受信した映像信号をデコードする機能を備えていてもよい。STB14は、放送局12が放送する複数のチャンネルの中から、ユーザ(User)の指示にもとづき選局したチャンネルを受信し、そのチャンネルの映像信号を通信インターフェース(例えば、HDMI(登録商標))を介して、映像受信装置40に出力する。また、STB14は、放送局12が映像信号とともにコンテンツ関連情報を送信するときには、そのコンテンツ関連情報を受信して映像受信装置40に出力することもできる。なお、映像送信装置は何らSTB14に限定されるものではなく、例えば録画機能と放送信号受信機能と映像信号出力機能とをあわせ持つ録画装置、等であってもよい。
【0019】
なお、STB14は、放送局12から特有の特徴があるコンテンツが放送されるときに、その特徴を検知し、その特徴を示す特徴情報を含むコンテンツ関連情報を生成して映像受信装置40に出力するように構成されていてもよい。例えば、放送局12から3D映像のコンテンツが放送されるときに、3D映像信号の伝送方式を検出し、検出した結果(3D映像信号の伝送方式)を示す特徴情報を生成して映像受信装置40に出力するように構成されていてもよい。あるいは、放送局12から字幕が重畳された映像を含むコンテンツが放送されるときに、その字幕を検出し、検出した字幕の表示位置や表示サイズを示す特徴情報を生成して映像受信装置40に出力するように構成されていてもよい。あるいは、STB14が映像信号に字幕またはOSD(On Screen Display)を重畳するとき、その字幕またはOSDの表示位置および表示サイズに関する特徴情報を生成して映像受信装置40に出力するように構成されていてもよい。なお、本実施の形態では、STB14等の映像送信装置が、放送局12から放送される映像信号から特徴を検出して生成し出力するそれらの特徴情報も、コンテンツ関連情報の一部として扱う。
【0020】
映像受信装置40は、外部から入力される映像信号にもとづく映像を表示部54に表示するように構成された映像受信デバイスであり、例えばテレビジョン受像機である。映像受信装置40は、通信ネットワーク16に接続されており、通信ネットワーク16を介して映像認識装置20および付加情報配信装置30とデータの送受信ができる。
【0021】
本実施の形態における映像受信装置40は、以下のことができるように構成されている。映像受信装置40は、映像送信装置(例えば、STB14)から通信インターフェースを介して入力される映像信号に関するコンテンツ特定処理(映像認識処理にもとづくコンテンツ特定処理)を映像認識装置20を利用して行う。コンテンツ特定処理とは、その映像信号が表すコンテンツを特定する処理のことである。映像受信装置40は、コンテンツ特定処理の結果として映像認識装置20から送信されてくる解析情報を受信し、その解析情報にもとづき、そのコンテンツに関連する付加情報(例えば、広告情報)を付加情報配信装置30から取得し、取得した付加情報をその映像信号に重畳して表示部54に表示する。
【0022】
具体的には、映像受信装置40は、入力される映像信号から一部を周期的に切り出すことで部分映像を周期的に抽出し、その部分映像から生成したコンテンツ認識情報とコンテンツ特定処理(映像認識処理にもとづくコンテンツ特定処理)の要求(以下、「映像認識要求」とも記す)を、通信ネットワーク16を介して映像認識装置20に送信する。そして、映像受信装置40は、そのコンテンツ認識情報に対するコンテンツ特定処理の結果(解析情報)を映像認識装置20から通信ネットワーク16を介して取得する。そして、取得したコンテンツ特定処理の結果(解析情報)に関連する付加情報を、付加情報配信装置30から通信ネットワーク16を介して取得する。そして、取得した付加情報にもとづく画像(
図1には、「付加情報51」として示す)を、表示部54に表示中の映像に重畳して表示する。これらの詳細は後述する。
【0023】
また、映像受信装置40は、STB14から出力されるコンテンツ関連情報を受け取ることもできる。このコンテンツ関連情報には、例えば、放送局12から3D映像のコンテンツが放送されるときに、その3D映像信号の伝送方式を示す特徴情報が含まれていることがあり、また、放送局12から放送されるコンテンツに字幕が重畳された映像が含まれているときに、字幕が重畳された領域の場所(座標)や大きさを表す特徴情報が含まれていることがある。また、STB14が映像信号に字幕やOSDを重畳するときに、その字幕やOSDが重畳された領域の場所(座標)や大きさを表す特徴情報が含まれていることがある。
【0024】
なお、本実施の形態では、コンテンツ認識情報をフィンガープリントとする例を説明する。コンテンツ認識情報は、映像を認識するための情報であり、フィンガープリントは、部分映像や動画を構成する各画像のハッシュ値である。しかし、コンテンツ認識情報は映像認識処理に使用できる情報(データ)であればよく、何らフィンガープリント(ハッシュ値)に限定されない。
【0025】
なお、本実施の形態では、付加情報を「コンテンツに関連する広告情報」とする例を説明するが、付加情報は何ら広告情報に限定されるものではなく、例えば観光情報、歴史情報、人物プロフィール情報、URL(Uniform Resource Locator)、公共公報情報、放送中の番組に関する情報、ツイッター(登録商標)等のソーシャル情報、等であってもよい。
【0026】
映像認識装置20は、通信ネットワーク16に接続されたサーバ装置であり、映像認識処理にもとづくコンテンツ特定処理を行うWebサイトである。コンテンツ特定処理とは、上述したように、受信したフィンガープリントにもとづき映像認識処理を行い、その映像認識処理の結果にもとづきそのフィンガープリントが表すコンテンツを特定する処理のことである。そのために、映像認識装置20は、放送局12が放送するコンテンツに対する解析と、その解析の結果を利用した映像認識処理を行う。
【0027】
映像認識装置20は、放送局12から放送される実質的に全てのコンテンツを取得する。そして、取得したコンテンツに対する解析を行い、コンテンツの時間、容量、放送形式、内容、ジャンル、登場人物、タイムテーブル、等を調べ、解析情報を作成する。また、映像認識装置20は、放送局12から取得したコンテンツの映像信号からフィンガープリントを作成する。映像認識装置20は、放送局から放送される放送信号を受信してコンテンツを取得してもよく、あるいは、専用の映像回線等を介して放送局12から送信される映像信号を受信してコンテンツを取得してもよい。また、この解析は、例えば、自動で行われてもよく、作業者が手作業で行ってもよい。この解析結果である解析情報は、そのコンテンツに関する情報とともに映像認識装置20の記憶部23に記憶される。
【0028】
映像認識装置20は、映像受信装置40から送信されてくるフィンガープリントを伴った映像認識要求を通信ネットワーク16を介して受信すると、そのフィンガープリントを、映像認識装置20があらかじめ生成し記憶部23に記憶しておいたフィンガープリントと照合し(映像認識処理)、そのフィンガープリントに対応するコンテンツを特定する。こうして、映像認識装置20は、映像受信装置40から送信されてくるフィンガープリントが何のコンテンツの部分映像から作成されたものかを判断してそのコンテンツを特定するコンテンツ特定処理を行う。そして、特定したコンテンツに関する解析結果(解析情報)を記憶部23から読み出し、読み出した情報をコンテンツ特定処理の結果として映像受信装置40に通信ネットワーク16を介して返信する。
【0029】
このような手法による映像認識処理(映像認識処理にもとづくコンテンツ特定処理)を「ACR(Automatic Content Recognition)」とも呼称する。
【0030】
付加情報配信装置30は、通信ネットワーク16に接続されたサーバ装置であり、様々な商品の広告情報を保持して配信するWebサイト(広告配信サイト)である。付加情報配信装置30は、映像受信装置40から送信されてくるコンテンツ特定処理の結果(映像受信装置40が映像認識装置20から取得した、コンテンツ特定処理の結果にもとづく解析情報)を通信ネットワーク16を介して受信すると、そのコンテンツ特定処理の結果(解析情報)に関連する付加情報を通信ネットワーク16を介して映像受信装置40に送信する。この付加情報は、例えば、コンテンツ特定処理により特定されたコンテンツに関連する広告情報である。
【0031】
[1−1−2.映像認識装置および映像受信装置の構成]
図2は、実施の形態1における映像認識装置20および映像受信装置40の構成の一例を概略的に示すブロック図である。
【0032】
なお、
図2には、本実施の形態に示す動作に関連する主な回路ブロックを示しており、他の動作に関する機能や回路ブロックは省略している。これは、本実施の形態で説明する動作を分かりやすく示すためである。また、
図2に示す各回路ブロックは、それぞれが独立した回路で構成されていてもよく、あるいは、
図2に示す回路ブロックの1つまたは複数を実現するように作成されたプログラムをプロセッサーで実行する構成であってもよい。
【0033】
映像認識装置20は、HTTP(Hypertext Transfer Protocol)送受信部21、検索部22、および記憶部23、を備えるサーバ装置である。映像認識装置20は、映像受信装置40に、通信ネットワーク16を介して映像認識処理にもとづくコンテンツ特定処理のサービスを提供するように構成されている。
【0034】
HTTP送受信部21は、通信用のインターフェースであり、例えば、イーサネット(登録商標)の規格に適合する通信アダプタである。HTTP送受信部21は、通信ネットワーク16を介して映像受信装置40とデータの送受信を行うことができるように構成されている。
【0035】
記憶部23は、例えばHDD(Hard Disk Drive)等で構成された記憶装置である。記憶部23は、放送局12から放送されるコンテンツのフィンガープリントと、そのコンテンツに対する解析結果の解析情報とを、そのコンテンツに対応付けて記憶するように構成されている。このフィンガープリントは、例えば、動画を構成する各画像のハッシュ値、等である。
【0036】
記憶部23は、例えば、放送局12から放送される全チャンネル(例えば、300チャンネル)について、放送からわずかな時間遅れ(例えば、10秒)で、コンテンツ(例えば、番組本体やCM)毎に、フィンガープリントと解析結果(解析情報)を対応付けて記憶する。この解析結果(解析情報)には、例えば、番組のタイトル、CMのタイトル、番組のあらすじ、CMのあらすじ、登場人物、映像に関連する場所、URL等が含まれていてもよい。
【0037】
検索部22は、映像受信装置40から送信されてくるフィンガープリントを伴う映像認識要求をHTTP送受信部21を介して受信すると、そのフィンガープリントを用いた映像認識処理にもとづくコンテンツ特定処理を行い、その結果(解析情報)をHTTP送受信部21を介して映像受信装置40に返信するように構成されている。
【0038】
具体的には、検索部22は、映像受信装置40から送信されてくるフィンガープリントを伴う映像認識要求を、通信ネットワーク16およびHTTP送受信部21を介して受信する。次に、受信したフィンガープリントを、記憶部23に記憶されているフィンガープリントと照合し、受信したフィンガープリントに対応するフィンガープリントを検索する(映像認識処理)。そして、その検索の結果により特定されたフィンガープリントに対応するコンテンツを、受信したフィンガープリントに対応するコンテンツとする(コンテンツ特定処理)。このようにして、検索部22は、受信したフィンガープリントに対応するコンテンツを特定する。そして、検索部22は、特定したコンテンツに対応付けられた解析結果(解析情報)を記憶部23から読み出し、読み出した解析結果(解析情報)を、コンテンツ特定処理の結果として、HTTP送受信部21および通信ネットワーク16を介して映像受信装置40に返信する。
【0039】
映像受信装置40は、制御部41、HTTP送受信部42、操作信号受信部43、映像出力部44、表示部54、映像抽出部45、付加情報表示制御部46、記憶部47、映像認識領域設定部66および映像入力部48を備える。映像受信装置40は、映像認識装置20を利用した映像認識処理にもとづくコンテンツ特定処理を行い、そのコンテンツ特定処理の結果としての解析情報を映像認識装置20から取得してその解析情報に関連する付加情報(例えば、広告情報)を付加情報配信装置30から取得し、受信した映像信号による映像(コンテンツ)に、その付加情報(例えば、その映像に関連する広告情報)による画像を重畳して表示部54に表示する、ように構成されている。
【0040】
HTTP送受信部42は、通信用のインターフェースであり、例えば、イーサネット(登録商標)の規格に適合する通信アダプタである。HTTP送受信部42は、通信ネットワーク16を介して映像認識装置20とデータの送受信を行うことができるように構成されている。
【0041】
操作信号受信部43は、ユーザ操作を受け付けたリモートコントロール装置(以下、「リモコン」と略記する)等の操作部(図示せず)が発信する操作信号(映像受信装置40に対する操作信号)を受信するように構成されている。操作信号受信部43は、ジャイロセンサを有するリモコンが、そのリモコンに生じる物理的な変動にもとづき発信する信号を受信するように構成されていてもよい。
【0042】
映像入力部48は、受信回路およびデコーダであり、放送局が送信する放送信号を受信するように構成された受信部49と、映像送信装置(例えば、STB14)が出力する映像信号およびコンテンツ関連情報を入力するように構成された入力部65とを有する。映像入力部48が受け取る映像信号には、時間の経過に伴って切り替わるコンテンツ(番組本体とCM、等)が含まれる。
【0043】
受信部49は、放送局12が送信する放送信号をアンテナ(図示せず)等を介して受信するように構成されている。
【0044】
入力部65は、外部に設置された映像送信装置から出力されてくる映像信号およびコンテンツ関連情報を入力するように構成されたインターフェースである。入力部65は、例えばHDMI(登録商標)の規格に適合するように構成されており、映像送信装置からHDMI(登録商標)を介して送信されてくる映像信号およびコンテンツ関連情報を受け取ることができる。この映像送信装置は、例えばSTB14であるが、映像記録再生装置等であってもよい。また、入力部は、ビデオケーブルを介して送信されてくる映像信号およびコンテンツ関連情報や、無線通信で送信されてくる映像信号およびコンテンツ関連情報を受け取るように構成されていてもよい。
【0045】
映像出力部44は、表示部54を制御する機能を有し、映像入力部48から入力される映像信号にもとづき表示部54を制御して、その映像信号にもとづく映像を表示部54に表示するように構成されている。映像出力部44は、制御部41から付加情報が入力されたときは、表示部54に表示中の映像に、付加情報にもとづく画像を重畳する。
【0046】
表示部54は、映像信号にもとづく映像を表示するように構成されたディスプレイであり、例えばLCD(Liquid Crystal Display)である。しかし、本実施の形態は何らこの構成に限定されるものではなく、表示部54は、PDP(Plasma Display Panel)やOLED(Organic Electro Luminescence Display)、等であってもよい。
【0047】
付加情報表示制御部46は、付加情報の表示制御を行うように構成されている。具体的には、付加情報表示制御部46は、映像抽出部45で抽出された部分映像からフィンガープリントを生成し、生成したフィンガープリントにもとづくコンテンツ特定処理(映像認識処理にもとづくコンテンツ特定処理)を、映像認識装置20を利用して行う。このフィンガープリントは、例えば、部分映像を構成する各画像のハッシュ値である。このとき、付加情報表示制御部46は、映像認識領域設定部66で設定された有効領域(映像認識領域または映像認識候補領域)でフィンガープリントを生成する。これらの処理の詳細は後述する。そして、映像認識装置20から取得したコンテンツ特定処理の結果にもとづき付加情報配信装置30から取得した付加情報を、表示部54に表示するか否か(映像信号に重畳するか否か)、または表示部54に表示中の付加情報を継続表示するか非表示にするか、を判断し、その判断にもとづく指示を制御部41に出力する。また、付加情報表示制御部46は、取得した付加情報にもとづく画像(または、文字列)を、表示部54に表示中の映像のどこに重畳するかを、映像認識領域設定部66における映像認識領域設定処理の結果にもとづき判断し、その判断にもとづく指示を制御部41に出力する。
【0048】
映像抽出部45は、映像入力部48から入力される映像信号から部分映像を抽出するように構成されている。映像抽出部45は、映像信号から、あらかじめ定められた周期で、映像信号の一部である部分映像を所定時間分抽出するように構成されている。例えば、あらかじめ定められた周期が3秒であり所定時間が3秒間であれば、映像抽出部45は、映像信号から、3秒毎に3秒間の部分映像を抽出する動作を繰り返す。すなわち、映像信号から3秒間の部分映像を3秒毎に隙間なく連続して抽出する動作を繰り返す。また、例えば、あらかじめ定められた周期が15秒であり所定時間が3秒間であれば、映像抽出部45は、映像信号から、15秒毎に3秒間の部分映像を抽出する動作を繰り返す。すなわち、映像信号から3秒間の部分映像を12秒の間隔をおいて抽出する動作を繰り返す。なお、映像信号から抽出する部分映像は秒単位での抽出に限定されるものではなく、例えば、映像フレームレートにおいて予め定められたフレーム数で部分映像を抽出してもよい。
【0049】
映像認識領域設定部66は、映像抽出部45で抽出された部分映像に対して、映像認識領域設定処理を実行する。映像認識領域設定処理では、部分映像に重畳された字幕やOSD(On Screen Display)等の重畳情報を検出し、その検出の結果にもとづき、または、コンテンツ関連情報に含まれた特徴情報にもとづき、有効領域を設定する。有効領域とは、映像認識領域または映像認識候補領域のことである。すなわち、映像認識領域設定部66は、重畳情報の検出結果にもとづき、またはコンテンツ関連情報に含まれた特徴情報にもとづき、映像認識領域または映像認識候補領域を設定する。
【0050】
映像認識領域設定部66で行う映像認識領域設定処理の概要を、
図3A〜
図4Dを用いて説明する。
【0051】
図3Aは、実施の形態1における映像受信装置40の表示部54に表示する映像の一例を概略的に示す図である。
図3Bは、実施の形態1における映像受信装置40の表示部54に表示する映像の他の一例を概略的に示す図である。
【0052】
図3Aには、STB14が放送局12から受信した映像信号をそのまま映像受信装置40に出力し、その映像信号にもとづく映像50が映像受信装置40の表示部54に表示されている例を示す。
【0053】
図3Bには、STB14が、放送局12から受信した映像信号に字幕94を重畳して映像受信装置40に出力し、その映像信号にもとづく映像(映像50に字幕94が重畳された映像)が、表示部54に表示されている例を示す。
【0054】
STB14等の映像送信装置には、放送局12から送信されてくる映像信号に、映像送信装置側で字幕やOSD等を重畳する機能を有するものがある。なお、映像送信装置が映像信号に重畳する字幕やOSD等を「重畳情報」とも記す。
【0055】
例えば、STB14が、放送局12から送信されてくる映像信号に字幕94を重畳して出力すると、映像受信装置40の表示部54には、
図3Bに示すように、映像50に字幕94を重畳した映像が表示される。
【0056】
この字幕94は、STB14が映像50に重畳したものなので、映像認識装置20が放送局12から取得する同コンテンツの映像は、
図3Aに示すように、字幕94が重畳されていない映像50となる。
【0057】
このように、STB14等の映像送信装置が、放送局12から送信されてくる映像信号に字幕94等の重畳情報を重畳すると、映像受信装置40の表示部54に表示される映像と、映像認識装置20が放送局12から取得する映像とは、同一のコンテンツであるにもかかわらず、映像の内容に差異が生じることになる。
【0058】
そこで、本実施の形態における映像受信装置40は、映像認識領域設定部66において、映像認識領域設定処理を行い、重畳情報の表示位置や表示サイズを検出してその重畳情報を除く領域に映像認識領域を設定し、またはコンテンツ関連情報に含まれた特徴情報にもとづいて映像認識領域を設定し、その映像認識領域でフィンガープリントを生成する。
【0059】
なお、映像受信装置40は、部分映像を構成する各画像のハッシュ値を、映像認識領域または映像認識候補領域で算出してフィンガープリントとする。
【0060】
なお、
図3Bに示す字幕94は、重畳情報の一例として挙げているものに過ぎず、重畳情報の表示位置や表示サイズ等が、何ら
図3Bに示す字幕94の表示位置や表示サイズ等に限定されるものではない。また、他の図面に示す字幕に関しても同様である。
【0061】
図4Aは、実施の形態1における映像受信装置40の映像認識領域設定部66が映像50に設定する映像認識領域71の一例を概略的に示す図である。
図4Bは、実施の形態1における映像認識装置20において、映像認識領域設定部66が設定した映像認識領域71にもとづき設定されたフィンガープリントの生成領域の一例を概略的に示す図である。
図4Cは、映像受信装置40において映像50の全面に設定された映像認識領域72の一例を概略的に示す図である。
図4Dは、映像認識装置20において映像50の全面に設定されたフィンガープリントの生成領域の一例を概略的に示す図である。
【0062】
なお、
図4A〜4Dでは、説明を分かりやすくするために、フィンガープリントの生成領域である映像認識領域71、72を太線で示すが、この太線が表示部54に実際に表示されるわけではない。
【0063】
図4Aには、STB14が映像50に重畳情報の一例である字幕94を重畳し、映像認識領域設定部66が、字幕94を除く領域に映像認識領域71を設定する例を示す。
図4Cには、STB14が映像50に字幕94を重畳しているにもかかわらず、字幕94を含めた領域(映像50の全面)に映像認識領域72が設定された例を示す。このとき、映像認識装置20が放送局12から取得する映像50には、
図4B、
図4Dに示すように字幕94は重畳されていない。
【0064】
なお、
図4Cは、
図4Aに示す動作例への対比のために示したものに過ぎず、映像認識領域設定部66が、字幕94等の重畳情報を検出しているにもかかわらず映像50の全面に映像認識領域を設定することを示したものではない。
【0065】
例えば、
図4Cに示すように、映像受信装置40において、字幕94を含めた領域に映像認識領域72が設定されると、付加情報表示制御部46では、字幕94を含めた領域でフィンガープリントを生成する。このとき、映像認識装置20では、
図4Dに示すように、映像50の映像認識領域72でフィンガープリントを生成する。この領域には字幕94は存在しない。そのため、映像受信装置40で生成されるフィンガープリントと、映像認識装置20で生成されるフィンガープリントとは互いに一致せず、映像認識装置20ではコンテンツ特定処理が失敗する可能性がある。
【0066】
そこで、本実施の形態の映像受信装置40では、
図4Aに示すように、映像認識領域設定部66において、字幕94等の重畳情報の表示領域(以下、「重畳領域」と記す)を検出し、またはコンテンツ関連情報に含まれた特徴情報にもとづいて重畳情報の重畳領域を特定し、重畳領域を除く領域に映像認識領域71を設定する。そして、映像受信装置40の付加情報表示制御部46では、重畳領域を除く映像認識領域71でフィンガープリントを生成する。映像認識装置20では、
図4Bに示すように、映像受信装置40と同様の映像認識領域71でフィンガープリントを生成する。これにより、映像受信装置40で生成されるフィンガープリントと、映像認識装置20で生成されるフィンガープリントとが互いに一致する可能性は相対的に高くなり、映像認識装置20でコンテンツ特定処理が成功する可能性は、
図4C、
図4Dに示した例と比較して相対的に高くなる。
【0067】
映像認識領域設定処理の詳細は、後述する。
【0068】
なお、
図4B、
図4Dに示すように、映像認識装置20においてフィンガープリントを生成する領域は、映像認識領域設定部66が設定した映像認識領域にもとづき設定されるものとする。
【0069】
映像受信装置40は、映像認識領域設定部66が設定した映像認識領域を示す情報を、例えば、フィンガープリントと共に映像認識装置20に送信するように構成されてもよい。
【0070】
記憶部47は、例えば不揮発性メモリ等で構成された記憶装置である。記憶部47は、映像入力部48で受信した電子番組表(Electronic Program Guide:EPG)等の番組メタ情報、HTTP送受信部42を介して付加情報配信装置30から取得した付加情報および付加情報の表示制御情報、等を記憶する。付加情報の表示制御情報とは、付加情報の表示を制御するための情報であり、例えば付加情報の表示期間を示す情報、等が含まれる。
【0071】
制御部41は、映像受信装置40が備える各回路ブロックを制御するように構成されている。制御部41は、例えば、プログラム(アプリケーションプログラム等)を記憶しているROM等の不揮発性メモリ、そのプログラムを実行するCPU、および、CPUがプログラムを実行するときに一時的にデータやパラメータ等を記憶するRAM等の揮発性メモリ、等から構成される。
【0072】
制御部41が行う制御には、例えば次のようなものがある。制御部41は、映像信号と共に入力されるコンテンツ関連情報を取得する。また、映像抽出部45が映像信号から部分映像を所定の周期で抽出するように、映像抽出部45を制御する。そして、映像抽出部45が部分映像を抽出する度に、映像認識領域設定部66はコンテンツ関連情報に含まれる特徴情報から映像認識領域を部分映像に設定し、付加情報表示制御部46は抽出された部分映像のフィンガープリントを映像認識領域で生成(算出)するように、各回路ブロックを制御する。そして、そのフィンガープリントを、映像認識要求とともに、HTTP送受信部42および通信ネットワーク16を介して映像認識装置20に送信し、そのフィンガープリントに対するコンテンツ特定処理(映像認識処理にもとづくコンテンツ特定処理)を映像認識装置20に依頼するように、各回路ブロックを制御する。そして、そのフィンガープリントに対するコンテンツ特定処理の結果(解析情報)を通信ネットワーク16およびHTTP送受信部42を介して映像認識装置20から取得し、そのコンテンツ特定処理の結果(解析情報)にもとづく付加情報を通信ネットワーク16およびHTTP送受信部42を介して付加情報配信装置30から取得するように、各回路ブロックを制御する。そして、取得した付加情報を記憶部47に記憶するとともに映像出力部44に出力し、表示部54に表示中の映像に付加情報を重畳して表示するように、各回路ブロックを制御する。このとき、制御部41は、付加情報表示制御部46が「付加情報を非表示にする」と判断すれば、表示部54に表示中の付加情報を非表示にするように、各回路ブロックを制御する。
【0073】
なお、映像受信装置40が映像認識装置20に映像認識処理にもとづくコンテンツ特定処理を依頼するときには、映像受信装置40がコンテンツ特定処理の依頼を表す信号(データ)を作成し、その信号を映像認識要求として映像認識装置20に送信するように付加情報表示システム10を構成してもよいが、例えば、そのような信号(データ)の送信は行わず、映像受信装置40がフィンガープリントを映像認識装置20に送信することで映像認識装置20に映像認識処理にもとづくコンテンツ特定処理を依頼したことになるように映像受信装置40と映像認識装置20との間であらかじめ取り決めをしておいてもよい。
【0074】
[1−2.動作]
以上のように構成された付加情報表示システム10の動作を、
図5〜
図13を用いて説明する。
【0075】
上述したように、映像受信装置40は、例えばSTB14等の映像送信装置から出力される映像信号が入力されると、その映像信号に対するコンテンツ特定処理を映像認識装置20を利用して行う。そして、そのコンテンツ特定処理の結果に関連する付加情報51(例えば、広告情報)を付加情報配信装置30から取得し、取得した付加情報51を映像信号に重畳して表示部54に表示する。また、映像受信装置40は、取得した付加情報51(例えば、広告情報)を、その付加情報51とともに取得した付加情報の表示制御情報に応じて表示または非表示にする。
【0076】
このとき、映像受信装置40は、コンテンツ特定処理に使用するフィンガープリントを、コンテンツ関連情報に含まれる特徴情報にもとづき映像認識領域設定部66が設定した映像認識領域で、または、映像認識領域設定部66が映像認識領域設定処理を行い設定した映像認識領域または映像認識候補領域で、部分映像から生成する。
【0077】
以下、このコンテンツ特定処理の概要を説明する。
【0078】
[1−2−1.コンテンツ特定処理の動作]
図5は、実施の形態1における映像受信装置40で行うコンテンツ特定処理の動作を概略的に示すフローチャートである。
【0079】
映像受信装置40の映像抽出部45は、STB14から出力され入力部65に入力される映像信号から部分映像を抽出する(ステップS10)。
【0080】
映像認識領域設定部66は、映像認識領域設定処理を行う(ステップS11)。
【0081】
映像認識領域設定処理とは、映像認識領域設定部66が、コンテンツ関連情報に含まれる特徴情報にもとづき映像認識領域を設定する処理、または、映像抽出部45で抽出された部分映像から、重畳情報が表示される領域(重畳領域)を検出し、重畳領域を除く領域に映像認識領域または映像認識候補領域を設定する処理、のことである。映像認識領域設定処理の詳細は後述する。
【0082】
付加情報表示制御部46は、以下のコンテンツ特定処理を行う(ステップS12)。付加情報表示制御部46は、映像抽出部45が抽出した部分映像と、映像認識領域設定部66が設定した映像認識領域または映像認識候補領域とにもとづき、フィンガープリントを生成する。生成されたフィンガープリントは、制御部41の指示により、HTTP送受信部42を介して映像認識装置20へ送信される。映像認識装置20は、そのフィンガープリントを用いた映像認識処理にもとづくコンテンツ特定処理を行い、特定したコンテンツに関連する解析情報(コンテンツ特定処理の結果)を通信ネットワーク16を介して映像受信装置40へ送信する。このとき、コンテンツ特定処理に失敗した場合には、例えば、映像認識装置20は解析情報として「NG」や「0」等の特定の情報を映像受信装置40へ送信するように動作してもよい。制御部41は、映像認識装置20から送信されてくる解析情報(コンテンツ特定処理の結果)を受信して付加情報表示制御部46に転送するように各回路ブロックを制御する。また、その解析情報は記憶部47に記憶される。これらのコンテンツ特定処理の詳細は後述する。
【0083】
付加情報表示制御部46は、取得した解析情報から、コンテンツ特定処理が成功したか否か(フィンガープリントからコンテンツを特定できたか否か)を判断する(ステップS13)。
【0084】
ステップS13において、コンテンツ特定処理が成功したと判断されたとき(Yes)は、制御部41は、付加情報表示制御部46からの指示にもとづき、映像認識装置20から受信した解析情報を、HTTP送受信部42および通信ネットワーク16を介して付加情報配信装置30に送信するように各回路ブロックを制御する。付加情報配信装置30は、受信した解析情報に関連する付加情報を通信ネットワーク16を通して映像受信装置40に送信する。制御部41は、付加情報配信装置30から送信されてくる付加情報を、HTTP送受信部42を介して受信するように、各回路ブロックを制御する。そして、受信した付加情報を映像出力部44に転送し、付加情報表示制御部46からの指示にもとづき、この付加情報を表示部54に表示中の映像に重畳して表示するように、各回路ブロックを制御する。そして、一連の処理を終了する。
【0085】
なお、映像認識装置20から取得する解析情報にURLが含まれ、制御部41は、そのURLを指定して付加情報配信装置30にアクセスし、そのURLに関連する情報を、その解析情報に関連する付加情報として付加情報配信装置30から取得する、ように各装置が構成されていてもよい。
【0086】
ステップS13において、コンテンツ特定処理が失敗したと判断されたとき(No)は、映像受信装置40は、次の部分映像に関して、上述したステップS10〜ステップS13の処理を繰り返す。
【0087】
なお、ステップS13において、例えば、連続する所定数(例えば、3つ)の部分映像に対して映像認識装置20が同一の解析結果(コンテンツ特定処理の結果)を返信してきたときに、コンテンツ特定処理が成功した、と判断するように付加情報表示制御部46を構成してもよい。
【0088】
映像受信装置40は、これら一連の動作を繰り返す。
【0089】
次に、ステップS11の映像認識領域設定処理について説明する。
【0090】
[1−2−2.映像認識領域設定処理の動作]
本実施の形態において、映像受信装置40が映像認識領域設定処理を行うのは、入力部65から入力される映像信号に関するコンテンツ特定処理の精度を高めるためである。そのために、映像受信装置40は、その映像信号の特徴を調べる。
【0091】
ここでは、字幕94等の重畳情報が、STB14等の映像送信装置において映像信号に重畳され、映像受信装置40に入力されているときの映像認識領域設定処理について説明する。
【0092】
映像認識領域設定処理の概要は、以下の通りである。
【0093】
映像受信装置40は、まず、特徴情報(例えば、字幕94の有無、字幕94の表示位置や表示サイズ、3D映像信号の伝送方式、等を示す特徴情報)が含まれたコンテンツ関連情報が、映像信号とともに入力部65を介して映像受信装置40に入力されているかどうかを検出する。特徴情報が入力されていれば、映像受信装置40は、それらの情報を利用して映像認識領域を設定し、その映像認識領域でフィンガープリントを生成してコンテンツ特定処理を行う。
【0094】
特徴情報がコンテンツ関連情報に含まれていない、またはコンテンツ関連情報そのものがない、等により特徴情報が映像受信装置40に入力されていなければ、映像受信装置40は、その映像信号の特徴(例えば、字幕94の有無、字幕94の表示位置や表示サイズ、等)を映像信号自身から検出する動作を行う。その後、その検出結果にもとづきコンテンツ特定処理を行う。
【0095】
図6は、実施の形態1における映像受信装置40で行う映像認識領域設定処理の動作を概略的に示すフローチャートである。
【0096】
映像受信装置40の映像認識領域設定部66は、まず、STB14から入力部65を介して映像受信装置40に入力される映像信号に関するコンテンツ関連情報を取得する(ステップS21)。
【0097】
次に、映像認識領域設定部66は、コンテンツ関連情報に、字幕94やOSD等の重畳情報の表示領域に関する特徴情報(表示位置や表示サイズ等を示す情報のこと。以下、「重畳領域情報」と記す)が含まれているか否かを調べる(ステップS22)。
【0098】
ステップS22において、コンテンツ関連情報に重畳領域情報が含まれていない、またはコンテンツ関連情報そのものがない、またはコンテンツ関連情報に含まれた特徴情報は3D映像に関する特徴情報である、と判断されたとき(No)は、映像認識領域設定部66は、重畳領域特定処理を行う(ステップS23)。
【0099】
重畳領域特定処理とは、入力部65を介して映像受信装置40に入力される映像信号から字幕94やOSD等(重畳情報)を検出し、それら重畳情報の表示位置や表示サイズ(重畳領域)を特定する処理のことである。重畳領域特定処理の詳細は、後述する。
【0100】
映像認識領域設定部66は、ステップS23の重畳領域特定処理において特定された重畳領域の情報(重畳領域情報)を用いて、映像認識領域特定処理を行う(ステップS24)。
【0101】
映像認識領域特定処理とは、重畳領域情報を用いて映像認識領域または映像認識候補領域を特定する処理のことである。映像認識領域特定処理の詳細は、後述する。
【0102】
ステップS22において、コンテンツ関連情報から重畳領域情報が検出されたとき(Yes)は、映像認識領域設定部66は、その重畳領域情報を用いて映像認識領域特定処理を行う(ステップS24)。
【0103】
ステップS24の映像認識領域設定処理の終了後は、
図5のステップS12に移行する。
【0104】
なお、コンテンツ関連情報に重畳領域情報が含まれているとき、映像認識領域設定部66は、字幕94等の重畳情報の表示位置や表示サイズ等を相対的に高い精度で把握することができ、かつステップS23の重畳領域特定処理を省略することができる。また、STB14等の映像送信装置から3D映像の映像信号が映像受信装置40に入力されるときは、映像認識領域設定部66は、3D映像信号の伝送方式にもとづき適切に映像認識領域を設定することができる。したがって、コンテンツ特定処理(映像認識領域特定処理にもとづくコンテンツ特定処理)および付加情報の取得を、より早く、より高い精度で行うことができる。
【0105】
次に、コンテンツ関連情報に重畳領域情報が含まれていないとき、または、コンテンツ関連情報が映像受信装置40に入力されないときの、ステップS23の重畳領域特定処理について説明する。
【0106】
[1−2−3.重畳領域特定処理の動作]
図7は、実施の形態1における映像受信装置40で行う重畳領域特定処理の動作を概略的に示すフローチャートである。
【0107】
映像認識領域設定部66は、映像抽出部45で抽出された部分映像に対して、文字検出処理を行う(ステップS31)。
【0108】
文字検出処理には、例えば、文字検出手法として一般に知られているOCR(Optical Character Reader)を用いることができる。
【0109】
次に、映像認識領域設定部66は、パターンマッチング処理によるOSD検出処理を行う(ステップS32)。OSD検出処理とは、OSDの表示領域(表示位置および表示サイズ)を検出する処理のことである。また、このパターンマッチング処理とは、例えば、STB14のOSD画像をテンプレート画像としてあらかじめ記憶部47に記憶しておき、部分映像をテンプレート画像と比較して、部分映像内にテンプレート画像(OSD画像)が含まれているか否かを探索するパターンマッチング手法を用いた処理のことである。
【0110】
映像認識領域設定部66は、ステップS31の文字検出処理で文字が検出されたときはその検出された領域(字幕94が表示される領域)を、ステップS32のOSD検出処理でOSDが検出されたときはその検出された領域(OSD画像が表示される領域)を、それぞれ重畳領域とし、その重畳領域の表示位置および表示サイズを表す重畳領域情報を生成する(ステップS33)。その後、
図6のステップS24に移行する。
【0111】
なお、映像受信装置40は、ステップS31の文字検出処理とステップS32のパターンマッチング処理のいずれか一方だけを行うように構成されてもよい。
【0112】
次に、ステップS24で行う映像認識領域特定処理について説明する。
【0113】
[1−2−4.映像認識領域特定処理の動作]
図8は、実施の形態1における映像受信装置40で行う映像認識領域特定処理の動作を概略的に示すフローチャートである。
【0114】
映像認識領域設定部66は、ステップS22またはステップS23で重畳領域情報が取得または特定されたか否かを判断する(ステップS41)。
【0115】
ステップS41において、重畳領域情報は取得または特定された、と判断されたとき(Yes)は、映像認識領域設定部66は、ステップS22で取得されたコンテンツ関連情報に含まれている重畳領域情報、またはステップS23で特定された重畳領域情報にもとづき、重畳外領域特定処理を行う(ステップS44)。
【0116】
重畳外領域特定処理とは、部分映像において、重畳領域情報にもとづき重畳領域を特定することで、重畳領域を除く領域(以下、「重畳外領域」とも記す)を特定する処理のことである。重畳外領域特定処理の詳細は、後述する。
【0117】
映像認識領域設定部66は、ステップS44の重畳外領域特定処理で特定された重畳外領域に映像認識領域を設定する。そして、その映像認識領域を表す情報を生成し、その情報を付加情報表示制御部46へ出力する(ステップS45)。その後、
図5のステップS12に移行する。
【0118】
なお、ステップS45で生成された映像認識領域を表す情報は、フィンガープリントと共に映像受信装置40から映像認識装置20へ送信されてもよい。
【0119】
なお、映像認識領域は、重畳外領域と一致してもよく、あるいは、重畳外領域の一部であってもよい。すなわち、映像認識領域は、重畳領域を除く全ての映像領域(部分映像の映像領域)に設定されてもよく、あるいは、重畳領域を除く映像領域の一部に設定されてもよい。映像認識領域は、コンテンツ特定処理における精度や映像受信装置40の仕様等に応じて適切に設定することが望ましい。
【0120】
ステップS41において、重畳領域情報は取得も特定もされていない、と判断されたとき(No)は、映像認識領域設定部66は、映像認識候補領域設定処理を行う(ステップS42)。
【0121】
映像認識候補領域設定処理とは、部分映像を複数の領域に分割する処理のことである。以下、映像認識候補領域設定処理により分割された部分映像を「映像認識候補領域」とも記す。映像認識候補領域設定処理は、以下の理由により行われる。ステップS41において、重畳領域情報は取得も特定もされていない、と判断されたとき、映像受信装置40は、映像信号に重畳情報が重畳されていないので重畳領域情報を取得も特定もできないのか、あるいは、映像信号に重畳情報が重畳されているにもかかわらず重畳領域情報を取得も特定もできないのか、の判断をすることは困難である。
【0122】
そこで、本実施の形態の映像受信装置40では、部分映像を複数の領域に分割して各領域(各映像認識候補領域)でフィンガープリントを生成し、それらの領域毎にコンテンツ特定処理を行う。映像信号に重畳情報が重畳されていたとしても、部分映像を複数の領域に分割し、部分映像を重畳情報が重畳された領域と重畳情報が重畳されていない領域とに分けることができれば、重畳情報が重畳された領域(重畳情報が重畳された映像認識候補領域)に関してはコンテンツ特定処理が失敗する可能性があっても、重畳情報が重畳されていない領域(重畳情報が重畳されていない映像認識候補領域)に関してはコンテンツ特定処理が成功する可能性を相対的に高めることができるからである。映像認識候補領域設定処理の詳細は、後述する。
【0123】
映像認識領域設定部66は、ステップS42の映像認識候補領域設定処理で設定された映像認識候補領域を表す情報を生成し、その情報を付加情報表示制御部46へ出力する(ステップS43)。その後、
図5のステップS12に移行する。
【0124】
なお、ステップS43で生成された映像認識候補領域を表す情報は、フィンガープリントと共に映像受信装置40から映像認識装置20へ送信されてもよい。
【0125】
次に、ステップS44で行う重畳外領域特定処理について
図9A〜
図11Cを用いて説明する。
【0126】
[1−2−5.重畳外領域特定処理の動作]
ここでは、重畳領域情報が含まれたコンテンツ関連情報が映像信号とともに映像受信装置40に入力されているときの映像受信装置40の動作と、コンテンツ関連情報に重畳領域情報が含まれていない(またはコンテンツ関連情報そのものがない)ために映像信号から重畳領域情報を検出するときの映像受信装置40の動作の、それぞれについて説明する。
【0127】
まず、重畳領域情報が含まれたコンテンツ関連情報が映像信号とともに映像受信装置40に入力されているときの映像受信装置40の動作について説明する。
【0128】
図9Aは、映像送信装置から出力され映像受信装置40に入力される映像信号91と重畳領域情報92との一例を概略的に示す図である。
図9Bは、実施の形態1における映像受信装置40の映像認識領域設定部66が設定した映像認識領域93の一例を概略的に示す図である。
図9Cは、実施の形態1における映像受信装置40の表示部54に表示された付加情報98の表示位置の一例を概略的に示す図である。
【0129】
なお、映像受信装置40は、コンテンツ関連情報を、例えば通信ネットワーク16を介して取得してもよい。
【0130】
例えば、
図9Aに概略的に示すように、放送局12から放送される映像信号にSTB14側で字幕94が重畳された映像信号91と、字幕94の重畳領域情報92を含むコンテンツ関連情報と、がSTB14から映像受信装置40に入力されたとする。
【0131】
そのような場合、映像認識領域設定部66は、取得した重畳領域情報92にもとづき重畳領域(例えば、字幕94の表示領域)を特定する。そして、その重畳領域を除く領域(例えば、字幕94を除く領域)を重畳外領域として特定する(ステップS44の重畳外領域特定処理)。
【0132】
そして、映像認識領域設定部66は、
図9Bに示すように、その重畳外領域に映像認識領域93を設定する(ステップS45)。付加情報表示制御部46は、その映像認識領域93でフィンガープリントを生成する。そして、付加情報表示制御部46は、生成したフィンガープリントおよび映像認識領域93を示す情報を映像認識装置20に送信するように制御部41に指示を出し、映像認識領域93に関するコンテンツ特定処理を行う(ステップS12)。
【0133】
なお、コンテンツ関連情報に、字幕は放送局12が放送する映像信号に重畳されたものである、ということを示す特徴情報が含まれているとき、映像認識領域設定部66は、その字幕を除く領域に映像認識領域を設定してフィンガープリントを生成してもよいが、映像認識装置20でも、その字幕が重畳された映像信号を放送局12から取得しているので、その字幕を含む領域に映像認識領域を設定してフィンガープリントを生成してもかまわない。
【0134】
なお、映像認識装置20は、映像受信装置40から取得した映像認識領域93を示す情報にもとづきフィンガープリントを生成してコンテンツ特定処理を行うものとする。
【0135】
なお、
図9Bでは、説明を分かりやすくするために、映像認識領域93を太線で示すが、この太線が映像受信装置40の表示部54に表示されるわけではない。
【0136】
そして、付加情報表示制御部46は、コンテンツ特定処理にもとづき付加情報配信装置30から取得した付加情報98を表示部54に表示するように、制御部41に指示する。このとき、付加情報表示制御部46は、付加情報98の表示位置を、映像認識領域設定部66で特定された重畳外領域にもとづき判断する。すなわち、付加情報表示制御部46は、字幕94等の重畳情報に付加情報98が重ならないように、重畳外領域に付加情報98の表示位置を設定する。そして、設定したその位置に付加情報98を表示するように制御部41に指示する。制御部41は、その指示を受け、付加情報表示制御部46に指示された位置に付加情報98を表示するように、映像出力部44等を制御する。
図9Cに示す例では、付加情報表示制御部46は、字幕94に重ならない表示部54の上部に付加情報98を表示させる。
【0137】
なお、ステップS22において、コンテンツ関連情報に含まれた特徴情報は3D映像に関する特徴情報である、と判断されたとき、映像認識領域設定部66は、その3D映像信号の伝送方式に応じて映像認識領域を部分映像に設定し、続いてステップS23に移行して重畳領域特定処理を行う。そして、3D映像信号の伝送方式に応じて設定された映像認識領域から、ステップS23で特定された重畳領域を除く領域に、フィンガープリントを生成する映像認識領域を設定する。
【0138】
3D映像信号の伝送方式に応じて設定される映像認識領域の一例を説明する。
【0139】
図9Dは、映像送信装置から出力され映像受信装置40に入力される3D映像の映像信号91L、91Rの一例を概略的に示す図である。
図9Eは、実施の形態1における映像受信装置40の映像認識領域設定部66が3D映像信号に設定した映像認識領域93L、93Rの一例を概略的に示す図である。
【0140】
例えば、
図9Dに示すように、1画面の左半分に左眼用の映像信号91Lが配置され、1画面の右半分に右眼用の映像信号91Rが配置されたサイド・バイ・サイド方式の3D映像の映像信号と、映像信号がサイド・バイ・サイド方式の3D映像であることを示す3D映像情報92LRを含むコンテンツ関連情報と、がSTB14から映像受信装置40に入力されたとする。
【0141】
そのような場合、映像認識領域設定部66は、その3D映像情報92LRにもとづき、例えば
図9Eに示すように、左眼用の映像信号91Lに映像認識領域93Lを、右眼用の映像信号91Rに映像認識領域93Rを、それぞれ設定する。
【0142】
なお、
図9D、9Eでは、説明を分かりやすくするために、映像認識領域93L、93Rを太線で示すが、この太線が映像受信装置40の表示部54に表示されるわけではない。
【0143】
次に、字幕194に関する重畳領域情報がSTB14から出力されず、字幕194が重畳された映像信号だけが映像受信装置40に入力されるときの映像受信装置40の動作について説明する。
【0144】
このとき、映像認識領域設定部66での動作は、映像信号から重畳情報の表示位置や表示サイズの検出ができたときとできないときとで、異なる。まず、映像信号から重畳情報の表示位置や表示サイズの検出ができたときの動作を説明する。
【0145】
図10Aは、映像送信装置から出力され映像受信装置40に入力される映像信号191の一例を概略的に示す図である。
図10Bは、実施の形態1における映像受信装置40の映像認識領域設定部66が設定した重畳領域195の一例を概略的に示す図である。
図10Cは、実施の形態1における映像受信装置40の映像認識領域設定部66が設定した映像認識領域193の一例を概略的に示す図である。
図10Dは、実施の形態1における映像受信装置40の表示部54に表示された付加情報98の表示位置の一例を概略的に示す図である。
【0146】
例えば、
図10Aに示すように、STB14から映像受信装置40に入力される映像信号191に字幕194が重畳されているにもかかわらず、その字幕194に関する重畳領域情報がSTB14から出力されない場合、映像認識領域設定部66は、映像信号191から字幕194の表示位置や表示サイズを検出し、
図10Bに示すように、その検出結果にもとづく重畳領域195を特定する(ステップS23の重畳領域特定処理)。
【0147】
そして、映像認識領域設定部66は、その重畳領域195を除く領域(すなわち、字幕194を除く領域)を重畳外領域として特定する(ステップS44の重畳外領域特定処理)。
【0148】
そして、映像認識領域設定部66は、
図10Cに示すように、その重畳外領域に映像認識領域193を設定する(ステップS45)。付加情報表示制御部46は、その映像認識領域193でフィンガープリントを生成する。そして、付加情報表示制御部46は、生成したフィンガープリントおよび映像認識領域193を示す情報を映像認識装置20に送信するように制御部41に指示を出し、映像認識領域193に関するコンテンツ特定処理を行う(ステップS12)。
【0149】
なお、コンテンツ関連情報から、放送局12が放送した映像信号に字幕が重畳されていることが判明したとき、映像受信装置40は、その字幕を除く領域に映像認識領域を設定してフィンガープリントを生成しても良いが、その字幕が重畳された映像信号は映像認識装置20でも取得されるので、映像受信装置40は、その字幕を含む領域でフィンガープリントを生成してもかまわない。
【0150】
なお、映像認識装置20は、映像受信装置40から取得した映像認識領域193を示す情報にもとづきフィンガープリントを生成してコンテンツ特定処理を行うものとする。
【0151】
なお、
図10Cでは、説明を分かりやすくするために、映像認識領域193を太線で示すが、この太線が映像受信装置40の表示部54に表示されるわけではない。また、説明を分かりやすくするために、
図10B、10Cに重畳領域195を示しているが、この重畳領域195が表示部54に表示されるわけではない。
【0152】
そして、付加情報表示制御部46は、コンテンツ特定処理にもとづき付加情報配信装置30から取得した付加情報98を表示部54に表示するように、制御部41に指示する。このとき、付加情報表示制御部46は、付加情報98が字幕194に重ならないように、映像認識領域設定部66で特定された重畳外領域に付加情報98の表示位置を設定し、その表示位置を制御部41に指示する。制御部41は、その指示を受け、例えば
図10Dに示すように、付加情報表示制御部46に指示された字幕194に重ならない表示部54の上部に、付加情報98を表示するように、映像出力部44等を制御する。
【0153】
次に、映像信号から重畳情報の表示位置や表示サイズの検出ができないときの動作を説明する。このとき、映像受信装置40は、ステップS42の映像認識候補領域設定処理を行う。映像認識候補領域設定処理は次の通りである。
【0154】
[1−2−6.映像認識候補領域設定処理の動作]
図11Aは、映像送信装置から出力され映像受信装置40に入力される映像信号291の一例を概略的に示す図である。
図11Bは、実施の形態1における映像受信装置40の映像認識領域設定部66が設定した映像認識候補領域295〜298の一例を概略的に示す図である。
図11Cは、実施の形態1における映像受信装置40が映像認識装置20から取得したコンテンツ特定処理の結果の一例を概略的に示す図である。
図11Dは、実施の形態1における映像受信装置40の表示部54に表示された付加情報98の表示位置の一例を概略的に示す図である。
【0155】
例えば、
図11Aに示すように、STB14から映像受信装置40に入力される映像信号291に字幕294が重畳されているにもかかわらず、その字幕294に関する重畳領域情報がSTB14から出力されず、また映像認識領域設定部66が映像信号291から字幕294の表示位置や表示サイズを検出できない場合、映像認識領域設定部66は、映像を複数の映像認識候補領域に分割する(ステップS42の映像認識候補領域設定処理)。
【0156】
図11Bには、映像認識領域設定部66が、部分映像を4つの映像認識候補領域295、296、297、298に分割する例を示す。
【0157】
なお、
図11Bでは、説明を分かりやすくするために、映像認識候補領域295〜298を太線で示すが、この太線が映像受信装置40の表示部54に表示されるわけではない。
【0158】
そして、付加情報表示制御部46は、複数の映像認識候補領域(
図11Bに示す例では、4つの映像認識候補領域295〜298)のそれぞれに関してフィンガープリントを生成する。そして、付加情報表示制御部46は、生成した複数のフィンガープリントおよび映像認識候補領域を示す情報(
図11Bに示す例では、4つの映像認識候補領域295〜298を示す情報)を映像認識装置20に送信するように制御部41に指示を出し、複数の映像認識候補領域(
図11Bに示す例では、4つの映像認識候補領域295〜298)のそれぞれに関するコンテンツ特定処理を行う(ステップS12)。
【0159】
図11Bに示す例では、映像認識候補領域297、298の2つの領域には字幕294が含まれ、映像認識候補領域295、296の2つの領域には字幕294は含まれていない。したがって、映像認識候補領域295、296の2つの領域では、映像認識候補領域297、298と比較して、コンテンツ特定処理が成功する可能性は高い。
【0160】
図11Cには、一例として、映像認識装置20が、映像認識候補領域295〜298の各領域で生成されたフィンガープリントを用いてコンテンツ特定処理(映像認識処理にもとづくコンテンツ特定処理)を行い、映像認識候補領域295、296に関してはコンテンツ特定処理に成功し、そのコンテンツ特定処理の結果として「Car」という解析情報101、102を映像受信装置40に返信し、映像認識候補領域297、298に関してはコンテンツ特定処理に失敗し、そのコンテンツ特定処理の結果として「NG」という解析情報103、104を映像受信装置40に返信した例を示す。
【0161】
なお、映像認識装置20は、映像受信装置40から取得した映像認識候補領域を示す情報(
図11Bに示す例では、4つの映像認識候補領域295〜298を示す情報)にもとづき各領域でフィンガープリントを生成し、それらの領域毎のコンテンツ特定処理を行うものとする。
【0162】
付加情報表示制御部46は、コンテンツ特定処理が成功した映像認識候補領域(例えば、映像認識候補領域295、296)におけるコンテンツ特定処理の結果にもとづき、付加情報配信装置30から付加情報を取得するように、制御部41に指示する。そして、取得した付加情報98を表示部54に表示するように、制御部41に指示する。
【0163】
このとき、付加情報表示制御部46では、コンテンツ特定処理が失敗した映像認識候補領域に重畳情報が表示され、コンテンツ特定処理が成功した映像認識候補領域には重畳情報は表示されていない、と判断することができる。したがって、付加情報98が重畳情報(例えば、字幕194)に重ならないようにするために、付加情報表示制御部46は、コンテンツ特定処理が成功した映像認識候補領域に付加情報98の表示位置を設定し、その位置を制御部41に指示する。制御部41は、その指示を受け、コンテンツ特定処理が成功した映像認識候補領域の指示された位置に付加情報98を表示するように、映像出力部44等を制御する。
【0164】
例えば
図11Cに示すように、映像認識候補領域295、296ではコンテンツ特定処理が成功し、映像認識候補領域297、298ではコンテンツ特定処理が失敗したときには、付加情報表示制御部46は、コンテンツ特定処理が成功した映像認識候補領域295、296に付加情報98を表示するように制御部41に指示する。この指示を受けた制御部41は、映像認識候補領域295、296に付加情報98を表示するように、映像出力部44等を制御する。これにより、付加情報98は、例えば
図11Dに示すように、字幕294に重ならない表示部54の上部に表示される。
【0165】
なお、
図9C、
図10D、
図11Dには、付加情報が表示部54の上部に表示される例を示したが、これは付加情報の表示位置の一例として挙げているものに過ぎず、付加情報の表示位置や表示サイズ等が、何ら
図9C、
図10D、
図11Dに示す付加情報の表示位置や表示サイズ等に限定されるものではない。
【0166】
次に、ステップS12で行う映像認識処理にもとづくコンテンツ特定処理について説明する。
【0167】
[1−2−7.コンテンツ特定処理の動作]
図12は、実施の形態1における映像受信装置40で行うコンテンツ特定処理の動作を概略的に示すフローチャートである。
【0168】
映像受信装置40の付加情報表示制御部46は、映像抽出部45が抽出した部分映像と、映像認識領域設定部66が設定した映像認識領域または映像認識候補領域を示す情報を取得する(ステップS51)。
【0169】
付加情報表示制御部46は、映像認識領域設定部66が設定したものが、映像認識領域なのか、または映像認識候補領域なのかを判断する(ステップS52)。
【0170】
ステップS52において、映像認識領域設定部66が設定したものは映像認識候補領域である、と判断されたとき(Yes)は、付加情報表示制御部46は、各映像認識候補領域でフィンガープリントを算出する(ステップS53)。付加情報表示制御部46は、全ての映像認識候補領域でフィンガープリントを算出するまでステップS53を繰り返す(ステップS54)。
【0171】
付加情報表示制御部46は、ステップS53で算出された全てのフィンガープリントを映像認識装置20に送信するように制御部41に指示する。その指示を受けた制御部41は、ステップS53で算出された全てのフィンガープリントを、映像認識要求とともに、HTTP送受信部42および通信ネットワーク16を介して映像認識装置20に送信するように各回路ブロックを制御する(ステップS55)。
【0172】
付加情報表示制御部46は、映像認識候補領域を示す情報を、フィンガープリントと共に映像認識装置20に送信するように制御部41に指示してもよい。
【0173】
フィンガープリントを受信した映像認識装置20は、それらのフィンガープリントを用いて、映像認識候補領域のそれぞれに関するコンテンツ特定処理(映像認識処理にもとづくコンテンツ特定処理)を行う。そして、映像認識装置20は、それらのコンテンツ特定処理の結果の解析情報を映像受信装置40に返信する。
【0174】
このとき、映像認識装置20は、映像受信装置40から取得した映像認識候補領域を示す情報にもとづき複数のフィンガープリントを生成し、それらのフィンガープリントを用いて映像認識候補領域のそれぞれに関するコンテンツ特定処理を行うものとする。
【0175】
ステップS52において、映像認識領域設定部66が設定したものは映像認識領域である、と判断されたとき(No)は、付加情報表示制御部46は、その映像認識領域でフィンガープリントを算出する(ステップS58)。
【0176】
付加情報表示制御部46は、ステップS58で算出されたフィンガープリントを映像認識装置20に送信するように制御部41に指示する。その指示を受けた制御部41は、ステップS58で算出されたフィンガープリントを、映像認識要求とともに、HTTP送受信部42および通信ネットワーク16を介して映像認識装置20に送信するように各回路ブロックを制御する(ステップS55)。
【0177】
付加情報表示制御部46は、映像認識領域を示す情報を、フィンガープリントと共に映像認識装置20に送信するように制御部41に指示してもよい。
【0178】
フィンガープリントを受信した映像認識装置20は、そのフィンガープリントを用いてコンテンツ特定処理(映像認識処理にもとづくコンテンツ特定処理)を行う。そして、映像認識装置20は、そのコンテンツ特定処理の結果の解析情報を映像受信装置40に返信する。
【0179】
このとき、映像認識装置20は、映像受信装置40から取得した映像認識領域を示す情報にもとづきフィンガープリントを生成してコンテンツ特定処理を行うものとする。
【0180】
映像受信装置40の制御部41は、ステップS55の結果として映像認識装置20から通信ネットワーク16を通して送信されてくる解析情報(コンテンツ特定処理の結果)を、HTTP送受信部42を介して受信するように各回路ブロックを制御し、受信した解析情報を付加情報表示制御部46に転送する(ステップS56)。
【0181】
解析情報を受け取った付加情報表示制御部46は、その解析情報を記憶部47に記憶するように制御部41に指示を出す。その指示を受けた制御部41は、その解析情報を記憶部47に記憶するように各回路ブロックを制御する(ステップS57)。その後、
図5のステップS13に移行する。
【0182】
[1−3.効果等]
以上のように、本実施の形態において、映像受信装置40は、通信ネットワーク16を介してデータの送受信を行えるように構成されており、入力部65、映像抽出部45、映像認識領域設定部66、制御部41、および付加情報表示制御部46、を備える。入力部65は、外部に設置された映像送信装置(例えば、STB14)から出力される映像信号と特徴情報を含むコンテンツ関連情報とを入力するように構成されている。映像抽出部45は、その映像信号から映像認識処理用の部分映像を抽出するように構成されている。映像認識領域設定部66は、コンテンツ関連情報に含まれた特徴情報に基づき部分映像に映像認識領域を設定するように構成されている。制御部41は、通信ネットワーク16に接続された映像認識装置20にフィンガープリントを送信して映像認識処理を依頼し、その映像認識処理の結果を映像認識装置20から取得し、その映像認識処理の結果に基づく付加情報(例えば、広告情報)を通信ネットワーク16に接続された付加情報配信装置30から取得する制御を行うように構成されている。付加情報表示制御部46は、部分映像の映像認識領域でフィンガープリントを生成するように構成されている。
【0183】
例えば、STB14等の映像送信装置では、放送局12から送信されてくる映像信号に、字幕やOSD等の重畳情報を重畳して出力することがある。しかし、そのような重畳情報は映像認識装置20が放送局12から取得するコンテンツの映像には含まれていない。そのため、重畳情報を含んだ映像信号からフィンガープリントが生成され、そのフィンガープリントによる映像認識処理が映像認識装置20に依頼されると、映像認識装置20では、そのフィンガープリントを用いた映像認識処理(映像認識処理にもとづくコンテンツ特定処理)に失敗する可能性がある。
【0184】
しかし、本実施の形態における映像受信装置40は、映像認識領域設定部66では、コンテンツ関連情報に含まれた特徴情報に基づき部分映像に映像認識領域を設定し、付加情報表示制御部46では部分映像の映像認識領域でフィンガープリントを生成するように構成されている。これにより、映像受信装置40では、映像送信装置から入力される映像信号に関して、字幕やOSD等の重畳情報を除く領域に設定された映像認識領域でフィンガープリントを生成することができるので、映像認識装置20を利用した映像認識処理(映像認識処理にもとづくコンテンツ特定処理)を精度良く行うことが可能になる。
【0185】
また、放送局12は3D映像のコンテンツを放送することがある。そして、本実施の形態における映像受信装置40は、コンテンツ関連情報に3D映像信号の伝送方式に関する特徴情報が含まれているとき、映像認識領域設定部66は、その情報に基づく映像認識領域を部分映像に設定できる。したがって、映像受信装置40は、3D映像のコンテンツに関しても、3D映像に応じたフィンガープリントを生成して精度の高い映像認識処理(映像認識処理にもとづくコンテンツ特定処理)を映像認識装置20を利用して行うことができる。
【0186】
そして、映像受信装置40は、その映像認識処理の結果にもとづく付加情報を付加情報配信装置30から取得して、その映像信号に重畳することができる。
【0187】
また、映像受信装置40は、映像信号に付加情報51を重畳した映像を表示するように構成された表示部54を備えていてもよい。
【0188】
また、映像認識領域設定部66は、コンテンツ関連情報に重畳情報に関する特徴情報が含まれているとき、その重畳情報が重畳された領域を除く領域に映像認識領域を設定するように構成されてもよい。
【0189】
これにより、映像認識領域設定部66は、字幕やOSD等の重畳情報を含まない領域に映像認識領域を設定することができる。すなわち、付加情報表示制御部46は、字幕やOSD等の重畳情報を除く領域に設定された映像認識領域でフィンガープリントを生成することができるので、映像受信装置40は、映像認識装置20を利用した映像認識処理(映像認識処理にもとづくコンテンツ特定処理)を精度良く行なうことが可能になる。
【0190】
また、付加情報表示制御部46は、映像信号の映像認識領域に付加情報を重畳する制御を行うように構成されてもよい。
【0191】
これにより、映像受信装置40は、付加情報を、重畳情報に重ならない位置に表示することが可能になる。したがって、映像受信装置40では、映像送信装置から入力される映像信号に、字幕やOSD等の重畳情報が重畳されていたとしても、それらの重畳情報が付加情報に隠れて視認性が損なわれることを防止することが可能となる。
【0192】
(他の実施の形態)
以上のように、本出願において開示する技術の例示として、実施の形態1を説明した。しかしながら、本開示における技術は、これに限定されず、変更、置き換え、付加、省略等を行った実施の形態にも適用できる。また、上記実施の形態1で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。
【0193】
そこで、以下、他の実施の形態を例示する。
【0194】
実施の形態1では、映像受信装置40が表示部54を備えている構成を説明したが、本実施の形態における映像受信装置は何らこの構成に限定されるものではない。映像受信装置は表示部を備えていなくてもかまわない。
【0195】
図13は、他の実施の形態における映像受信装置140の構成の一例を概略的に示すブロック図である。
図13に示す映像受信装置140は、主に以下の点が、実施の形態1で
図2に示した映像受信装置40と異なる。映像受信装置140は、表示部54を備えておらず、映像出力部144が、外部に設置された映像表示装置154に、有線または無線で、映像信号を出力するように構成されている。
【0196】
このような映像受信装置140の一例として、例えば、録画機能、放送信号受信機能、映像信号入力機能、および映像信号出力機能を備え、外部に設置された映像表示装置154に映像信号を送信するように構成された録画装置、等を挙げることができる。そのような録画装置には、例えばハードディスクレコーダや、DVDレコーダ、BDレコーダ、等がある。
【0197】
なお、
図13では、
図2に示した映像受信装置40を構成する構成要素と実質的に等しい動作をする構成要素には同じ符号を付与し、説明を省略する。また、
図13には、本実施の形態に示す動作に関連する主な回路ブロックを示し、他の動作に関する機能や回路ブロック(例えば、録画機能等)は省略している。
【0198】
映像受信装置140では、映像出力部144から映像表示装置154に出力される映像信号に付加情報51を重畳するか否かの判断が、付加情報表示制御部46においてなされる。なお、付加情報表示制御部46における動作は実施の形態1と実質的に等しい。このような構成の映像受信装置140においても、実施の形態1に示した映像受信装置40と同様の効果を得ることができる。
【0199】
なお、映像認識領域設定部66は、特徴情報がコンテンツ関連情報に含まれていないとき、または、コンテンツ関連情報が映像送信装置から出力されないとき、特徴情報を含むコンテンツ関連情報の出力を要求する信号を映像送信装置へ出力するように制御部41に指示する構成であってもよい。これにより、映像受信装置40、140は、字幕やOSD等の重畳情報に関する特徴情報が映像送信装置から出力されないとき、その特徴情報を含むコンテンツ関連情報を出力するように映像送信装置に要求することが可能になる。
【0200】
なお、本実施の形態に示した各構成要素は、それぞれを独立した専用の回路で構成してもよく、あるいは、それらの1つまたは複数の動作を実現するように作成されたプログラムをプロセッサーで実行する構成であってもよい。また、このときのプログラムは、サーバ等からのダウンロードにより取得されてもよく、所定の記録媒体(例えば、CD−ROM等の光ディスクや磁気ディスク、半導体メモリ等)を介して取得されてもよい。
【0201】
また、本実施の形態に示したサーバにおける各動作は、単数のサーバで集中処理されてもよく、複数のサーバで分散処理されてもよい。
【0202】
なお、実施の形態1に示した具体的な数値は、単に実施の形態における一例を示したものに過ぎず、本開示はこれらの数値に何ら限定されるものではない。各数値は映像受信装置の仕様等にあわせて最適な値に設定することが望ましい。