特許第6032093号(P6032093)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許6032093動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置
<>
  • 特許6032093-動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置 図000010
  • 特許6032093-動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置 図000011
  • 特許6032093-動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置 図000012
  • 特許6032093-動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置 図000013
  • 特許6032093-動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置 図000014
  • 特許6032093-動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置 図000015
  • 特許6032093-動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置 図000016
  • 特許6032093-動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置 図000017
  • 特許6032093-動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置 図000018
  • 特許6032093-動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置 図000019
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6032093
(24)【登録日】2016年11月4日
(45)【発行日】2016年11月24日
(54)【発明の名称】動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置
(51)【国際特許分類】
   G06F 17/30 20060101AFI20161114BHJP
【FI】
   G06F17/30 170D
   G06F17/30 350C
【請求項の数】6
【全頁数】19
(21)【出願番号】特願2013-65049(P2013-65049)
(22)【出願日】2013年3月26日
(65)【公開番号】特開2014-191495(P2014-191495A)
(43)【公開日】2014年10月6日
【審査請求日】2015年11月6日
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100113608
【弁理士】
【氏名又は名称】平川 明
(74)【代理人】
【識別番号】100105407
【弁理士】
【氏名又は名称】高田 大輔
(72)【発明者】
【氏名】此島 真喜子
【審査官】 早川 学
(56)【参考文献】
【文献】 特開2009−049666(JP,A)
【文献】 特開平09−322174(JP,A)
【文献】 特開平09−322119(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
コンピュータが、
複数のピクチャを有する動画像が符号化された第1動画像データから、前記ピクチャ毎のピクチャ種別、前記ピクチャ毎のピクチャサイズを抽出し、
抽出された前記第1動画像データの前記ピクチャ毎のピクチャ種別、前記第1動画像データの前記ピクチャ毎のピクチャサイズに基づいて、前記第1動画像データの前記ピクチャ毎の第1特徴量及び前記第1特徴量の変化点を示す第1変化点を算出し、
複数のピクチャを有する動画像が符号化された第2動画像データから前記ピクチャ毎のピクチャ種別、前記ピクチャ毎のピクチャサイズを抽出し、
出された前記第2動画像データの前記ピクチャ毎のピクチャ種別、前記第2動画像データの前記ピクチャ毎のピクチャサイズに基づいて、前記第2動画像データの前記ピクチャ毎の第2特徴量及び前記第2特徴量の変化点を示す第2変化点を算出し、
前記第1特徴量及び前記第1変化点と、前記第2特徴量及び前記第2変化点とを比較することにより、前記第1動画像データの動画像と前記第2動画像データの動画像とが類似しているか否かを判定する、
ことを実行する動画像データ比較方法。
【請求項2】
前記第1特徴量は、前記第1動画像データの符号化方法に基づく第1変換行列を使用して算出され、
前記第2特徴量は、前記第2動画像データの符号化方法に基づく第2変換行列を使用して算出される
請求項1に記載の動画像データ比較方法。
【請求項3】
コンピュータに、
複数のピクチャを有する動画像が符号化された第1動画像データから、前記ピクチャ毎のピクチャ種別、前記ピクチャ毎のピクチャサイズを抽出し、
抽出された前記第1動画像データの前記ピクチャ毎のピクチャ種別、前記第1動画像データの前記ピクチャ毎のピクチャサイズに基づいて、前記第1動画像データの前記ピクチャ毎の第1特徴量及び前記第1特徴量の変化点を示す第1変化点を算出し、
複数のピクチャを有する動画像が符号化された第2動画像データから前記ピクチャ毎の
ピクチャ種別、前記ピクチャ毎のピクチャサイズを抽出し、
出された前記第2動画像データの前記ピクチャ毎のピクチャ種別、前記第2動画像データの前記ピクチャ毎のピクチャサイズに基づいて、前記第2動画像データの前記ピクチャ毎の第2特徴量及び前記第2特徴量の変化点を示す第2変化点を算出し、
前記第1特徴量及び前記第1変化点と、前記第2特徴量及び前記第2変化点とを比較することにより、前記第1動画像データの動画像と前記第2動画像データの動画像とが類似しているか否かを判定する、
ことを実行させる動画像データ比較プログラム。
【請求項4】
前記第1特徴量は、前記第1動画像データの符号化方法に基づく第1変換行列を使用して算出され、
前記第2特徴量は、前記第2動画像データの符号化方法に基づく第2変換行列を使用して算出される
請求項3に記載の動画像データ比較プログラム。
【請求項5】
複数のピクチャを有する動画像が符号化された第1動画像データから、前記ピクチャ毎のピクチャ種別、前記ピクチャ毎のピクチャサイズを抽出する第1抽出部と、
前記第1抽出部で抽出された前記第1動画像データの前記ピクチャ毎のピクチャ種別、前記第1動画像データの前記ピクチャ毎のピクチャサイズに基づいて、前記第1動画像データの前記ピクチャ毎の第1特徴量及び前記第1特徴量の変化点を示す第1変化点を算出する第1特徴量演算部と、
複数のピクチャを有する動画像が符号化された第2動画像データから前記ピクチャ毎のピクチャ種別、前記ピクチャ毎のピクチャサイズを抽出する第2抽出部と、
前記第2抽出部で抽出された前記第2動画像データの前記ピクチャ毎のピクチャ種別、前記第2動画像データの前記ピクチャ毎のピクチャサイズに基づいて、前記第2動画像データの前記ピクチャ毎の第2特徴量及び前記第2特徴量の変化点を示す第2変化点を算出する第2特徴量演算部と、
前記第1特徴量及び前記第1変化点と、前記第2特徴量及び前記第2変化点とを比較することにより、前記第1動画像データの動画像と前記第2動画像データの動画像とが類似しているか否かを判定する比較部と、
を備える動画像データ比較装置。
【請求項6】
前記第1特徴量は、前記第1動画像データの符号化方法に基づく第1変換行列を使用して算出され、
前記第2特徴量は、前記第2動画像データの符号化方法に基づく第2変換行列を使用して算出される
請求項5に記載の動画像データ比較装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画像データ比較方法、動画像データ比較プログラム、動画像データ比較装置に関する。
【背景技術】
【0002】
情報漏えい防止等の観点から、ネットワーク上を流れる動画像データ等の内容(動画像)が、ゲートウェイ等で、所定の動画像データの内容と類似しているか否かを確認することが求められている。類似には、一致も含まれる。
【0003】
ほとんどのネットワーク上を流れる動画像データ(動画像ファイル)は、データ量を圧縮するために、符号化処理されている。また、ほとんどの記録媒体等によって提供される動画像データも、符号化処理されている。
【0004】
同一の動画像であっても、符号化方式や圧縮率等が異なれば、符号化処理された動画像データ同士は異なる。よって、符号化処理された動画像データ同士を比較することでは、動画像データの内容(動画像)が類似しているか否かを判断することは難しい。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2005−141758号公報
【特許文献2】国際公開第2008/132774号
【発明の概要】
【発明が解決しようとする課題】
【0006】
符号化処理された2つの動画像データの内容(動画像ファイルに含まれる動画像)が類似しているか否かを判定するためには、2つの動画像データを復号化処理して比較することが求められる。復号化処理された動画像データ(符号化されていない動画像データ)から動画像の特徴量が抽出され、特徴量同士を比較することで類似しているか否かが判定される。しかし、復号化処理は、演算負荷が大きく、符号化処理された大量の動画像ファイルの比較処理をすることは難しい。
【0007】
1つの側面では、本発明は、復号化処理をすることなく動画像データを比較する動画像データ比較方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
第1の態様は、
コンピュータが、
複数のピクチャを有する動画像が符号化された第1動画像データから、前記ピクチャ毎のピクチャ種別、前記ピクチャ毎のピクチャサイズを抽出し、
抽出された前記第1動画像データの前記ピクチャ毎のピクチャ種別、前記第1動画像データの前記ピクチャ毎のピクチャサイズに基づいて、前記第1動画像データの前記ピクチャ毎の第1特徴量及び前記第1特徴量の変化点を示す第1変化点を算出し、
複数のピクチャを有する動画像が符号化された第2動画像データから前記ピクチャ毎のピクチャ種別、前記ピクチャ毎のピクチャサイズを抽出し、
前記第2抽出部で抽出された前記第2動画像データの前記ピクチャ毎のピクチャ種別、前記第2動画像データの前記ピクチャ毎のピクチャサイズに基づいて、前記第2動画像デ
ータの前記ピクチャ毎の第2特徴量及び前記第2特徴量の変化点を示す第2変化点を算出し、
前記第1特徴量及び前記第1変化点と、前記第2特徴量及び前記第2変化点とを比較することにより、前記第1動画像データの動画像と前記第2動画像データの動画像とが類似しているか否かを判定する、
ことを実行する動画像データ比較方法である。
【0009】
1つの態様は、プログラムが情報処理装置によって実行されることによって実現されてもよい。即ち、上記した態様における各ステップが実行する処理を、情報処理装置に対して実行させるためのプログラム、或いは当該プログラムを記録したコンピュータ読み取り可能な記録媒体として特定することができる。また、開示の構成は、上記した各ステップを実行する情報処理装置をもって特定されてもよい。
【発明の効果】
【0010】
復号化処理をすることなく動画像データを比較する動画像データ比較方法を提供することができる。
【図面の簡単な説明】
【0011】
図1図1は、動画像データのストリーム構成の例(1)を示す図である。
図2図2は、動画像データのストリーム構成の例(2)を示す図である。
図3図3は、動画像データ比較装置の構成例を示す図である。
図4図4は、第1抽出部から第1特徴量演算部に送信される情報の例を示す図である。
図5図5は、動画像データ比較装置を実現する情報処理装置の例を示す図である。
図6図6は、第1抽出部の動作フローの例を示す図である。
図7図7は、第1特徴量演算部の動作フローの例を示す図である。
図8図8は、第2特徴量演算部の動作フローの例を示す図である。
図9図9は、比較部の動作フローの例を示す図である。
図10図10は、第1動画像データと第2動画像データとフレームレートが異なる場合について説明する図である。
【発明を実施するための形態】
【0012】
以下、図面を参照して実施形態について説明する。実施形態の構成は例示であり、開示の構成は、開示の実施形態の具体的構成に限定されない。開示の構成の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。
【0013】
〔実施形態〕
(動画像の性質)
動画像の性質として、「動きの大きさ」、「模様の複雑度」、「動きの複雑度」が挙げられる。「動きの大きさ」、「模様の複雑度」、「動きの複雑度」は、それぞれ、スカラー量である。これらの動画像の性質は、ほとんど、動画像の符号化の規格に依存しない。即ち、動画像の性質は、どのような符号化の規格で符号化されても変化しにくい。2つの動画像において、「動きの大きさ」、「模様の複雑度」、「動きの複雑度」が互いに類似していれば、当該2つの動画像が類似していると判断される。
【0014】
動画像が符号化処理されて作成される動画像データ(動画像ファイル)の各ピクチャは、Iピクチャ、Pピクチャ、Bピクチャに分けられる。符号化処理された動画像ファイルは、Iピクチャ、Pピクチャ、Bピクチャを有する。Iピクチャは、イントラ符号化画面である。イントラ符号化画面は、他の画面を参照せずに符号化される。Pピクチャは、予
測符号化画面である。予測符号化画面は、過去のイントラ符号化画面、または、予測符号化画面から動き補償予測を用いて、符号化される。予測符号化画面は、一般的に、さらなる予測の参照として使用される。Bピクチャは、双方向予測符号化画面である。双方向予測符号化画面は、過去と未来のイントラ符号化画面または予測符号化画面から動き補償予測を用いて、符号化される。双方向符号化予測画面は、予測のための参照画面として使用されることはない。
【0015】
符号化処理された動画像ファイルは、ピクチャ毎に符号化されている。従って、情報処理装置において、符号化処理された動画像ファイルに対して復号化処理をしなくても、符号化処理された動画像ファイルの各ピクチャのサイズ(各ピクチャの容量)が、取得され得る。
【0016】
動きの大きさが大きくなると、Bピクチャのサイズの比率が、より大きくなるという傾向がある。模様の複雑度が高くなると、Iピクチャのサイズの比率が、より大きくなるという傾向がある。動きの複雑度が高くなると、Pピクチャのサイズの比率が、より大きくなるという傾向がある。また、Iピクチャのサイズ、Pピクチャのサイズ、Bピクチャのサイズの比は、動画像の符号化の規格に依存する。
【0017】
よって、Iピクチャのサイズ、Pピクチャのサイズ、Bピクチャのサイズの比は、動画像の性質である「動きの大きさ」、「模様の複雑度」、「動きの複雑度」、符号化の規格に依存する。ここで、ある符号化された動画像の、Iピクチャのサイズ(Isize)、Pピクチャのサイズ(Psize)、Bピクチャのサイズ(Bsize)を3成分とするベクトルは、a、b、cを変数とする3つの関数を用いて次のように表されるとする。ここでは、符号化の規格は、規格pであるとする。3つの関数は、fI(a,b,c)、fP(a,b,c)、fB(a,b,c)である。Isize、Psize、Bsizeの3成分によるベクトルをサイ
ズベクトルと呼ぶ。ここで、a、b、cは、それぞれ、「動きの大きさ」、「模様の複雑度」、「動きの複雑度」である。
【0018】
【数1】
Xpは、符号化の規格pに依存する行列である。符号化の規格pに対して、Xpが単位行列になるように、fI(a,b,c)、fP(a,b,c)、fB(a,b,c)が定義
されてもよい。サイズベクトルの大きさは、符号化の際の圧縮率に依存する。サイズベクトルの方向は、サイズベクトルが「動きの大きさ」、「模様の複雑度」、「動きの複雑度」の関数で表わされることから、動画像の性質に依存する。即ち、サイズベクトルの方向が類似する2つの動画像データは、同一の動画像から符号化されたものである可能性が高いと判断される。
【0019】
一方、符号化の規格qで符号化された動画像のIピクチャのサイズをIqsize、Pピク
チャのサイズをPqsize、BピクチャのサイズをBqsizeとすると、次のように表される。
【数2】
【0020】
Xqは、符号化の規格qに依存する行列である。ここで、式(1)と式(2)において、a、b、cが同一であるとすると、次の関係式が導き出される。
【数3】
【0021】
式(3)は、a、b、cに依存しない。即ち、式(3)は、動画像の性質に依存しない。また、規格pと規格qとの間の関係は、行列XpXq-1によって、表現できる。既知の動画像を規格pと規格qとで符号化して、それぞれの動画像データのIピクチャ、Pピクチャ、Bピクチャのサイズを用いて、式(3)により、規格pと規格qとの間の関係が分かる。即ち、行列XpXq-1があらかじめ求まる。ここで、行列XpXq-1を、規格qから規格pへの変換行列と呼ぶ。行列Xpや行列Xqが求められなくても、既知の動画像を規格pと規格qとで符号化した動画像データを用いることで、変換行列XpXq-1が求められる。即ち、任意の規格間で、変換行列が算出され得る。変換行列は、ユーザによってあらかじめ与えられてもよい。また、変換行列は、規格ごとに、所定の1つの規格へ変換される行列として、用意されてもよい。このようにすることにより、1つの規格に対して1つの変換行列が用意されればよいことになる。
【0022】
式(3)から、次のような関係が導かれる。
【数4】
規格pによる動画像データのサイズベクトルの方向と、規格qによる動画像データのサイズベクトルに規格qから規格pへの変換行列を掛けたものの方向とが、類似している場合、この2つの動画像データによる動画像は類似していると判断される。
【0023】
変換行列XpXq-1は、対角成分以外が0である行列であってもよい。例えば、規格p
がMPEG2であり、規格qがH.264であるとき、変換行列XpXq-1は、次のように表される。
【数5】
【0024】
また、このとき、規格pから規格qへの変換行列XqXp-1は、次のように表される
【数6】
規格pと規格qとは、例えば、互いに符号化の規格が異なるものである。規格pと規格qとは、同一の符号化の規格であって、異なる圧縮率、解像度等を有するものであってもよい。規格pと規格qとは、同一の規格であってもよい。同一の規格間における変換行列は、単位行列になる。
【0025】
図1は、動画像データのストリーム構成の例(1)を示す図である。図1の例では、動画像データのストリーム構成は、シーケンスヘッダ、ピクチャヘッダ、ペイロード、ピクチャヘッダ、ペイロードの順である。シーケンスヘッダには、例えば、符号化方式、画像サイズ、アスペクト比、フレームレート、ビットレートなどの情報が含まれる。ピクチャヘッダには、後に続くペイロードに含まれるピクチャ(画像)データが、Iピクチャか、Pピクチャか、Bピクチャかの情報が含まれる。ペイロードには、画像データが含まれる。ペイロードの先頭の位置と次のピクチャヘッダの先頭の位置との差分により、ペイロードの大きさが分かる。即ち、1つの画像データの大きさが分かる。ペイロードのサイズは、可変長である。
【0026】
図2は、動画像データのストリーム構成の例(2)を示す図である。図2の例では、動画像データのストリーム構成は、シーケンスヘッダ、ピクチャヘッダ、ペイロード、ピクチャヘッダ、ペイロードの順である。図1の例と異なる点は、ペイロードが画像データと、スタッフビットとに区別できる点である。スタッフビットは、ペイロードの一部である。スタッフビット(スタッフコード)は、画像の情報を有さない。スタッフビットは、例えば、連続した0xffである。このような場合、スタッフビットは、ペイロードから容易に特定され得る。スタッフビットのパターンは、符号化方式から推定可能である。スタッフビットが特定される場合、ペイロードのサイズからスタッフビットのサイズを除いたものを、画像データのサイズとする。
【0027】
図1図2の例では、動画像データのストリーム構成の例を示したが、ストリーミング用ではない動画像ファイルであっても、同様にして、符号化方式、ピクチャの種類(I、P、B)、画像データの大きさ等が得られる。
【0028】
(構成例)
図3は、動画像データ比較装置の構成例を示す図である。図3の動画像データ比較装置100は、第1抽出部112、第1特徴量演算部114、第2抽出部122、第2特徴量抽出部124、比較部130、記憶部140を有する。
【0029】
動画像データ比較装置100は、参照元の動画像データから所定の情報を抽出し、抽出した情報に基づいて、特徴量等を算出する。また、動画像データ比較装置100は、検査対象の動画像データから所定の情報を抽出し、抽出した情報に基づいて、特徴量等を算出する。さらに、動画像データ比較装置100は、参照元の動画像データの特徴量等と検査対象の動画像データの特徴量等とを比較し、検査対象の動画像データの動画像が参照元の動画像データの動画像と類似しているか否かを判定する。ここで扱う動画像データは、符号化処理されており、Iピクチャ、Pピクチャ、Bピクチャを有するものとする。
【0030】
第1抽出部112は、参照元の動画像データである第1動画像データを取得する。第1動画像データは、ネットワーク上を流れるストリーミングデータであってもよいし、記録媒体に記録された動画像ファイルであってもよい。第1抽出部112は、第1動画像データからシーケンスヘッダを抽出する。第1抽出部112は、シーケンスヘッダに含まれる情報から、第1動画像データの符号化方式(規格)を推定する。第1抽出部112は、第1動画像データのピクチャヘッダのビット位置(または時刻)を取得する。第1抽出部112は、第1動画像データ内の各ピクチャヘッダからピクチャ種別(Iピクチャ、Pピクチャ、Bピクチャ)を抽出する。第1抽出部112は、各ピクチャに対応するペイロードのサイズを取得する。各ペイロードのサイズは、各ピクチャのサイズに相当する。また、ペイロードからスタッフビットが特定される場合、第1抽出部112は、ペイロードのサイズからスタッフビットのサイズを除いたものをピクチャのサイズとする。ピクチャ種別及びピクチャのサイズは、ピクチャ番号または時刻と対応付けられる。ピクチャ番号は、時間順に付けられたピクチャの通し番号である。第1抽出部112は、第1特徴量演算部114に、第1動画像データの符号化方式、ピクチャ番号、ピクチャ種別、ピクチャのサイズ等を、第1特徴量演算部114に送信する。1つのピクチャ番号は、1つのフレームに対応する。
【0031】
図4は、第1抽出部から第1特徴量演算部に送信される情報の例を示す図である。第1抽出部112は、図4のように、ピクチャ番号、ピクチャ種別、ピクチャのサイズを対応づけて、第1特徴量演算部114に送信する。ピクチャ番号の代わりに時刻が使用されてもよい。例えば、ピクチャ番号に1フレームあたりの時間(ビットレートの逆数)が乗算されることで、時刻が求まる。
【0032】
第1特徴量演算部114は、第1抽出部112から受信した情報に基づいて、第1動画像データの特徴量、変化点等を算出する。第1特徴量演算部114は、算出した特徴量、変化点等を、記憶部140に格納する。
【0033】
第2抽出部122は、検査対象の動画像データである第2動画像データを取得する。第2動画像データは、ネットワーク上を流れるストリーミングデータであってもよいし、記録媒体に記録された動画像ファイルであってもよい。第2抽出部122は、第1抽出部112と同様にして、第2動画像データから、符号化方式、ピクチャ番号、ピクチャ種別、ピクチャのサイズを取得し、第2特徴量演算部124に送信する。
【0034】
第2特徴量演算部124は、第2抽出部122から受信した情報に基づいて、第2動画像データの特徴量、変化点等を算出する。第2特徴量演算部124は、算出した特徴量、変化点等を、比較部130に送信する。第2特徴量演算部124は、算出した特徴量、変化点等を、記憶部140に格納してもよい。
【0035】
比較部130は、第1動画像データの特徴量、変化点等と、第2動画像データの特徴量、変化点等とを比較して、第2動画像データの動画像が第1動画像データの動画像と類似しているか否かを判定する。比較部130は、記憶部140から、第1動画像データの特徴量、変化点等を取得する。比較部130は、第2特徴量演算部124から、第2動画像データの特徴量、変化点等を取得する。比較部130は、記憶部140から、第2動画像データの特徴量、変化点等を取得してもよい。
【0036】
記憶部140は、第1動画像データの特徴量、変化点等、第2動画像データの特徴量、変化点等を格納する。
【0037】
動画像データ比較装置100は、パーソナルコンピュータ(PC、Personal Computer
)のような汎用のコンピュータまたはサーバマシンのような専用のコンピュータを使用して実現できる。また、動画像データ比較装置100は、スマートフォン、携帯電話、カーナビゲーション装置のような専用または汎用のコンピュータ、あるいは、コンピュータを搭載した電子機器を使用して実現できる。
【0038】
図5は、動画像データ比較装置を実現する情報処理装置の例を示す図である。コンピュータ、すなわち、情報処理装置1000は、プロセッサ1002、主記憶装置1004、及び、二次記憶装置1006や、通信インタフェース装置1012のような周辺装置とのインタフェース装置を含む。主記憶装置及び二次記憶装置は、コンピュータ読み取り可能な記録媒体である。情報処理装置1000は、入力装置1008、出力装置1010を含む。情報処理装置1000の各構成要素は、バス1020を介して接続される。
【0039】
コンピュータは、プロセッサが記録媒体に記憶されたプログラムを主記憶装置の作業領域にロードして実行し、プログラムの実行を通じて情報処理装置、周辺装置が制御されることによって、所定の目的に合致した機能を実現できる。
【0040】
プロセッサ1002は、例えば、CPU(Central Processing Unit)やDSP(Digital Signal Processor)である。主記憶装置1004は、例えば、RAM(Random Access
Memory)やROM(Read Only Memory)を含む。
【0041】
二次記憶装置1006は、例えば、EPROM(Erasable Programmable ROM)、ハー
ドディスクドライブ(HDD、Hard Disk Drive)である。また、二次記憶装置1006
は、リムーバブルメディア、即ち可搬記録媒体を含むことができる。リムーバブルメディアは、例えば、USB(Universal Serial Bus)メモリ、あるいは、CD(Compact Disc)やDVD(Digital Versatile Disc)のようなディスク記録媒体である。
【0042】
通信インタフェース装置1012は、例えば、LAN(Local Area Network)インタフェースボードや、無線通信のための無線通信回路である。通信インタフェース装置は、ネットワークに接続される。通信インタフェース装置は、ネットワークを介して、他のコンピュータや他の通信機器との間でデータの送受信を行う。
【0043】
周辺装置は、上記の二次記憶装置や通信インタフェース装置の他、キーボードやポインティングデバイスのような入力装置や、ディスプレイ装置やプリンタのような出力装置を含む。ポインティングデバイスには、マウス、タッチパネル、タッチパッド、トラックボ
ールなどが含まれる。また、入力装置は、カメラのような映像や画像の入力装置や、マイクロフォンのような音声の入力装置を含むことができる。また、出力装置は、スピーカのような音声の出力装置を含むことができる。
【0044】
動画像データ比較装置100を実現する情報処理装置1000は、プロセッサが二次記憶装置に記憶されているプログラムを主記憶装置にロードして実行することによって、第1抽出部112、第1特徴量演算部114、第2抽出部122、第2特徴量演算部124、比較部130としての機能を実現する。一方、記憶部140は、主記憶装置または二次記憶装置の記憶領域に設けられる。
【0045】
一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。
【0046】
プログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくても、並列的または個別に実行される処理を含む。
【0047】
ハードウェアの構成要素は、ハードウェア回路であり、例えば、FPGA(Field Programmable Gate Array)、特定用途向け集積回路(ASIC)、ゲートアレイ、論理ゲー
トの組み合わせ、アナログ回路等がある。
【0048】
ソフトウェアの構成要素は、ソフトウェアとして所定の処理を実現する部品である。ソフトウェアの構成要素は、ソフトウェアを実現する言語、開発環境等を限定する概念ではない。
【0049】
(動作例)
〈第1抽出部の動作例〉
第1抽出部112の動作例について説明する。
【0050】
図6は、第1抽出部の動作フローの例を示す図である。図6の動作フローは、第1抽出部112に、参照元の動画像データ(第1動画像データ)が入力されることにより開始される。第1動画像データには、図2または図1のように、シーケンスヘッダ、ピクチャヘッダ、ペイロード等が含まれる。第1動画像データは、何らかの符号化方式により符号化処理された動画像データである。
【0051】
第1抽出部112は、入力される第1動画像データから、シーケンスヘッダを検出する(S101)。シーケンスヘッダには、例えば、符号化方式、画像サイズ、アスペクト比、フレームレート、ビットレートなどの情報が含まれる。
【0052】
第1抽出部112は、シーケンスヘッダに含まれる情報から、第1動画像データの符号化方式(規格種別)を確定する(S102)。シーケンスヘッダには、固有の規格番号が含まれるため、第1抽出部112は、符号化方式(規格種別)を確定することができる。
【0053】
第1抽出部112は、シーケンスヘッダに続くピクチャヘッダを検出する(S103)。第1抽出部112は、各ピクチャヘッダのピット位置を検出し、各ピクチャヘッダを取得する。
【0054】
第1抽出部112は、ピクチャヘッダに含まれる情報から、ピクチャヘッダに続くペイロードに含まれるピクチャのピクチャ種別を確定する(S104)。ピクチャ種別は、Iピクチャ、Pピクチャ、Bピクチャのうちいずれかを示す情報である。各ピクチャ種別は
、各ピクチャに固有のピクチャ番号によって識別される。各ピクチャ種別は、ピクチャの時刻情報によって識別されてもよい。
【0055】
第1抽出部112は、各ピクチャに対応するペイロードのサイズを取得する。ペイロードのサイズは、例えば、ピクチャヘッダと次のピクチャヘッダとの間のビット数により求められる。第1抽出部112は、ペイロードのサイズをピクチャのサイズとして取得する(S105)。また、第1抽出部112は、ペイロードのスタッフビットを取得できる場合、ペイロードのサイズからスタッフビットのサイズを除いたものを、ピクチャのサイズとする。ピクチャのサイズは、ピクチャ番号、ピクチャ種別と対応付けられる。
【0056】
第1抽出部112は、符号化方式、ピクチャ番号、ピクチャ種別、ピクチャのサイズ等を、第1特徴量演算部114に送信する。
【0057】
第2抽出部122の動作は、第1抽出部112の動作とほぼ同様である。
【0058】
〈第1特徴量演算部の動作例〉
第1特徴量演算部114の動作例について説明する。
【0059】
図7は、第1特徴量演算部114の動作フローの例を示す図である。図7の動作フローは、第1特徴量演算部114に、第1抽出部112から、符号化方式、ピクチャ番号、ピクチャ種別、ピクチャのサイズ等が入力されることにより、開始される。
【0060】
第1特徴量演算部114は、符号化方式、ピクチャ番号、ピクチャ種別、ピクチャのサイズ等を取得する。また、第1特徴量演算部114は、参照元の動画像データの観測範囲等の特徴量等算出の条件を取得する(S201)。観測範囲とは、他の動画像データと比較対象とする範囲である。観測範囲は、例えば、ピクチャ番号の範囲として与えられる。観測範囲として、動画像データの特徴的部分、動画像データの重要部分などが選択される。観測範囲等の特徴量等算出の条件は、例えば、ユーザによって、与えられる。観測範囲等の特徴量等算出の条件は、記憶部140に格納されていてもよい。観測範囲は、例えば、数分分である。
【0061】
第1特徴量演算部114は、観測範囲内の各ピクチャ番号に対して、Iピクチャのサイズの平均、Pピクチャのサイズの平均、Bピクチャのサイズの平均を算出する。ピクチャ番号nにおける、Iピクチャのサイズの平均、Pピクチャのサイズの平均、Bピクチャのサイズの平均を、3成分とするベクトルを、特徴量Fonとする。ピクチャ番号nのIピクチャのサイズの平均は、ピクチャ種別がIピクチャのうちピクチャ番号nに近い方からk枚のIピクチャのサイズの平均とする。ピクチャ番号nのPピクチャのサイズの平均は、ピクチャ種別がPピクチャのうちピクチャ番号nに近い方からk枚のPピクチャのサイズの平均とする。ピクチャ番号nのBピクチャのサイズの平均は、ピクチャ種別がBピクチャのうちピクチャ番号nに近い方からk枚のBピクチャのサイズの平均とする。ここで、「k」は、特徴量等算出の条件の1つである。第1特徴量演算部114は、観測範囲内のすべてのピクチャ番号について、特徴量Foを算出する(S202)。特徴量Fo(ベクトル)は、大きさ1に正規化されてもよい。また、第1特徴量演算部114は、ピクチャ番号nのIピクチャのサイズの平均を、ピクチャ番号nの周辺の範囲mに含まれるすべてのIピクチャのサイズの平均としてもよい。Pピクチャ、Bピクチャについても同様である。1つの規格に対して、1つの変換行列が用意される場合、ここで求めた特徴量Foに第1動画像データの符号化方式に対応する変換行列が乗算されたものが、特徴量Foとなる。変換行列は、特徴量等算出の条件の1つである。
【0062】
第1特徴量演算部114は、特徴量Fの変換点Coを算出する(S203)。第1特徴
量演算部114は、ステップS202で算出したピクチャ番号nの特徴量Fonとピクチャ番号n+1の特徴量Fon+1との角度差を比較する。特徴量Fon及び特徴量Fon+1は、共に、ベクトルであるので、次のようにして、角度差θonが求められる。
【0063】
【数7】
第1特徴量演算部114は、角度差θonが所定値以上である場合、ピクチャ番号nが変化点であると判断する。ピクチャ番号nが変化点であるとは、ピクチャ番号nとピクチャ番号n+1との間に変化点があることを意味する。特徴量Foの方向は画像の性質に対応し、特徴量Foの方向が変化することは、画像の性質が変化することを表す。特徴量演算部114は、変化点をピクチャ番号が小さい方から、Co1、Co2、・・・として算出する。角度差の代わりに、余弦が使用されてもよい。余弦が使用されることで、計算負荷が減少する。
【0064】
第1特徴量演算部114は、特徴点Fo、変化点Coを記憶部140に格納する。
【0065】
〈第2特徴量演算部の動作例〉
第2特徴量演算部124の動作例について説明する。
【0066】
図8は、第2特徴量演算部124の動作フローの例を示す図である。図8の動作フローは、第2特徴量演算部124に、第2抽出部122から、符号化方式、ピクチャ番号、ピクチャ種別、ピクチャのサイズ等が入力されることにより、開始される。
【0067】
第2特徴量演算部124は、符号化方式、ピクチャ番号、ピクチャ種別、ピクチャのサイズ等を取得する。また、第2特徴量演算部124は、検査対象の動画像データの特徴量等算出の条件を取得する(S301)。特徴量等算出の条件は、例えば、ユーザによって、与えられる。特徴量等算出の条件は、記憶部140に格納されていてもよい。
【0068】
第2特徴量演算部124は、観測範囲内の各ピクチャ番号に対して、Iピクチャのサイズの平均、Pピクチャのサイズの平均、Bピクチャのサイズの平均を算出する。ピクチャ番号nにおける、Iピクチャのサイズの平均、Pピクチャのサイズの平均、Bピクチャのサイズの平均を、3成分とするベクトルを算出する。第2特徴量演算部124は、算出したベクトルに、変換行列を乗算する。変換行列は、第2動画像データの符号化方式から第1動画像データの符号化方式に変換する変換行列である。変換行列は、記憶部140に格納される。変換行列は、第2動画像データの符号化方式と第1動画像データの符号化方式とに基づいて選択される。変換行列は、特徴量等算出の条件の1つである。第2特徴量演算部124は、算出したベクトルに変換行列を乗算したものを、特徴量Frn(ベクトル)とする。ピクチャ番号nのIピクチャのサイズの平均は、ピクチャ種別がIピクチャのうちピクチャ番号nに近い方からk枚のIピクチャのサイズの平均とする。ピクチャ番号nのPピクチャのサイズの平均は、ピクチャ種別がPピクチャのうちピクチャ番号nに近い方からk枚のPピクチャのサイズの平均とする。ピクチャ番号nのBピクチャのサイズの平均は、ピクチャ種別がBピクチャのうちピクチャ番号nに近い方からk枚のBピクチャのサイズの平均とする。ここで、「k」は、特徴量等算出の条件の1つである。第2特徴量演算部124は、観測範囲内のすべてのピクチャ番号について、特徴量Frを算出す
る(S302)。特徴量Fr(ベクトル)は、大きさ1に正規化されてもよい。また、第2特徴量演算部124は、ピクチャ番号nのIピクチャのサイズの平均を、ピクチャ番号nの周辺の範囲mに含まれるすべてのIピクチャのサイズの平均としてもよい。Pピクチャ、Bピクチャについても同様である。第2動画像データについては、第2動画像データ内のすべてのピクチャ番号について、特徴点Frが算出される。第2動画像データ内の所定の範囲内のピクチャ番号について、特徴点Frが算出されるようにしてもよい。1つの規格に対して1つの変換行列が用意される場合、第2動画像データの符号化方式に対応する変換行列がここでの変換行列となる。
【0069】
第2特徴量演算部114は、特徴量Frの変換点Crを算出する(S303)。第2特徴量演算部124は、ステップS302で算出したピクチャ番号nの特徴量Frnとピクチャ番号n+1の特徴量Frn+1との角度差を比較する。特徴量Frn及び特徴量Frn+1は、共に、ベクトルであるので、次のようにして、角度差θrnが求められる。
【0070】
【数8】
第2特徴量演算部124は、角度差θrnが所定値以上である場合、ピクチャ番号nが変化点であると判断する。ピクチャ番号nが変化点であるとは、ピクチャ番号nとピクチャ番号n+1との間に変化点があることを意味する。特徴量Frの方向は画像の性質に対応し、特徴量Frの方向が変化することは、画像の性質が変化することを表す。特徴量演算部114は、変化点をピクチャ番号が小さい方から、Cr1、Cr2、・・・として算出する。角度差の代わりに、余弦が使用されてもよい。余弦が使用されることで、計算負荷が減少する。
【0071】
第2特徴量演算部124は、特徴点Fr、変化点Crを比較部130に出力する。第2特徴量演算部124は、特徴点Fr、変化点Crを、記憶部140に格納してもよい。
【0072】
〈比較部の動作例〉
比較部130の動作例について説明する。
【0073】
図9は、比較部の動作フローの例を示す図である。図9の動作フローは、比較部130に、第1動画像データの特徴量、変化点、第2動画像データの特徴量、変化点の上方が入力されることにより開始される。
【0074】
ステップS401では、比較部130は、参照元の動画像データである第1動画像データの特徴量、変化点を、記憶部140から取得する。比較部130は、検査対象の動画像データである第2動画像データの特徴量、変化点を、第2特徴量演算部124または記憶部140から取得する。
【0075】
ステップS402では、比較部130は、第1動画像データの変化点Co1と、第2動画像データの変化点Cr1とを基準として、第1動画像データ内の変化点の位置(観測範囲内の変化点の位置)と一致する第2動画像データ内の変化点の位置を探索する。比較部130は、ステップS405から戻ってきたときは、第2動画像データの基準の変化点をCr2、Cr3と順にずらしながら、変化点の位置を探索する。比較部130は、第2動
画像データの基準点を第2動画像データのピクチャ番号ごとに順にずらしてもよい。このとき、ステップS405では、第2動画像データのすべてのピクチャ番号について、探索
をしたか否かで判断される。
【0076】
ステップS403では、比較部130は、第1動画像データ内の変化点の数に対する、第1動画像データ内の変化点の位置と一致する第2動画像データ内の変化点の位置の数が、所定値以上であるか否かを判定する。第1動画像データ内の変化点の数に対する、第1動画像データ内の変化点の位置と一致する第2動画像データ内の変化点の位置の数の比が、所定値以上である場合(S403;YES)、処理がステップS404に進む。第1動画像データ内の変化点の数に対する、第1動画像データ内の変化点の位置と一致する第2動画像データ内の変化点の位置の数の比が、所定値未満である場合(S403;NO)、処理がステップS405に進む。
【0077】
ステップS404では、比較部130は、ステップS403で基準とした変化点を基準として、ピクチャ番号毎に第1動画像データ内の特徴量Foと第2動画像データ内の特徴量Frとを比較する。具体的には、比較部130は、ピクチャ番号毎に第1動画像データ内の特徴量Foと第2動画像データ内の特徴量Frとの角度差を算出し、当該角度差のうち最も小さいものが所定の閾値未満であるか否かを判定する。角度差のうち最も小さいものが所定の閾値未満である場合、比較部130は、第1動画像データの観測範囲の動画像と、これと変化点が類似した第2動画像データの範囲の動画像とが、類似していると判断する。角度差のうち最も小さいものが所定の閾値未満である場合、第1動画像データの観測範囲の動画像と、これと変化点が類似した第2動画像データの範囲の動画像とが、類似していないと判断する。
【0078】
ステップS405では、比較部130は、ステップS402での探索で、第2動画像データ内のすべての変化点を基準としたか否かを判定する。第2動画像データ内のすべての変化点を基準としていない場合(S405;NO)、処理がステップS402に戻る。第2動画像データ内のすべての変化点を基準とした場合(S405;YES)、処理がステップS406に進む。
【0079】
ステップS406では、比較部130は、ステップS404で、類似していると判断された、第2動画像データの範囲と、特徴量Foと特徴量Frとの角度差のうち最も小さいものとを出力する。ステップS404で、複数回、類似していると判断された場合、すべてについて、第2動画像データの範囲と、特徴量Foと特徴量Frとの角度差のうち最も小さいものとを出力する。
【0080】
以上により、比較部130は、第1動画像データの観測範囲と類似する第2動画像データ内の範囲を抽出することができる。
【0081】
抽出された第2動画像データの範囲についての動画像を、ユーザが、改めて目視で確認して、第1動画像データの観測範囲と抽出された第2動画像データの範囲とが類似しているか否かを判断してもよい。
【0082】
動画像データ比較装置100が、例えば、ネットワーク上のゲートウェイ装置に設置されることで、ネットワーク上を流れるストリーミングデータから、第1動画像データの観測範囲と類似する動画像を抽出することができる。
【0083】
(変形例)
図10は、第1動画像データと第2動画像データとフレームレートが異なる場合について説明する図である。
【0084】
先に説明した上記の例では、第1動画像データと第2動画像データとのフレームレート(一秒あたりのピクチャの数)が一致していることを前提としている。しかし、動画像データのフレームレートは、必ずしも一致するものではなく、異なる場合も考えられる。図10の動画像データMa及び動画像データNaのように、第1動画像データと第2動画像データとで、フレームレートが異なる場合について、説明する。
【0085】
図10のように、動画像データMaのフレームレートが30フレーム/秒、動画像データNaのフレームレートが24フレーム/秒であるとする。ここで、30と24の最小公倍数を算出すると、120である。よって、そこで、動画像データMa及び動画像データNaを、フレームレート120フレーム/秒の動画像データに変換する。動画像データMaでは、各ピクチャを4回ずつ繰り返すことで、120フレーム/秒の動画像データ(動画像データMb)とする。動画像データNaでは、各ピクチャを5回ずつ繰り返すことで、120フレーム/秒の動画像データ(動画像データNb)とする。動画像データ比較装置100は、これらの120フレーム/秒の動画像データを、第1動画像データまたは第2動画像データとして扱う。このようにすることで、動画像データ比較装置100は、特徴量Fや変化点Cを求めることにより、上記の例と同様にして、動画像データが類似する範囲を抽出することができる。
【0086】
(実施形態の作用、効果)
動画像データ比較装置100は、参照元の動画像データからピクチャ種別、各ピクチャのサイズを抽出し、抽出した情報に基づいて、特徴量、変化点を算出する。また、動画像データ比較装置100は、検査対象の動画像データからピクチャ種別、各ピクチャのサイズを抽出し、抽出した情報に基づいて、特徴量、変化点を算出する。さらに、動画像データ比較装置100は、参照元の動画像データの変化点と検査対象の動画像データの変化点とを比較し、参照元の動画像データの変化点と類似する検査対象の動画像データの範囲を抽出する。動画像データ比較装置100は、変化点が類似する範囲において、特徴量を比較し、検査対象の動画像データの動画像が参照元の動画像データの動画像と類似しているか否かを判定する。動画像データ比較装置100は、変換行列を用いて特徴量を算出することで、異なる符号化方法で符号化された動画像データ同士を比較することができる。
【0087】
動画像データ比較装置100は、動画像データの復号化処理をすることなく、2つの動画像データの内容(動画像)が類似しているか否かを判定することができる。動画像データ比較装置100は、動画像データの復号化処理をすることなく動画像データの比較をするので、演算負荷が小さく、短時間で動画像データの動画像が類似しているか否かを判断することができる。
【0088】
以上の構成は、可能な限りこれらを組み合わせて実施され得る。
【符号の説明】
【0089】
100 動画像データ比較装置
112 第1抽出部
114 第1特徴量演算部
122 第2抽出部
124 第2特徴量演算部
130 比較部
140 記憶部
1000 情報処理装置
1002 プロセッサ
1004 主記憶装置
1006 二次記憶装置
1008 入力装置
1010 出力装置
1012 通信インタフェース装置
1020 バス
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10