IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイトダンス ネットワーク テクノロジー カンパニー リミテッドの特許一覧

<>
  • 特許-ビデオ特徴抽出方法及び装置 図1
  • 特許-ビデオ特徴抽出方法及び装置 図2
  • 特許-ビデオ特徴抽出方法及び装置 図3
  • 特許-ビデオ特徴抽出方法及び装置 図4
  • 特許-ビデオ特徴抽出方法及び装置 図5
  • 特許-ビデオ特徴抽出方法及び装置 図6
  • 特許-ビデオ特徴抽出方法及び装置 図7
  • 特許-ビデオ特徴抽出方法及び装置 図8
  • 特許-ビデオ特徴抽出方法及び装置 図9
  • 特許-ビデオ特徴抽出方法及び装置 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-11
(45)【発行日】2022-01-24
(54)【発明の名称】ビデオ特徴抽出方法及び装置
(51)【国際特許分類】
   G06T 7/00 20170101AFI20220117BHJP
   G06F 16/783 20190101ALI20220117BHJP
   H04N 21/235 20110101ALI20220117BHJP
【FI】
G06T7/00 300F
G06F16/783
H04N21/235
【請求項の数】 11
(21)【出願番号】P 2020520052
(86)(22)【出願日】2018-12-29
(65)【公表番号】
(43)【公表日】2020-12-10
(86)【国際出願番号】 CN2018125499
(87)【国際公開番号】W WO2019184521
(87)【国際公開日】2019-10-03
【審査請求日】2020-04-06
(31)【優先権主張番号】201810271773.1
(32)【優先日】2018-03-29
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】520476341
【氏名又は名称】北京字節跳動網絡技術有限公司
【氏名又は名称原語表記】Beijing Bytedance Network Technology Co., Ltd.
【住所又は居所原語表記】Room B-0035, 2/F, No.3 Building, No.30, Shixing Road, Shijingshan District Beijing 100041 China
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】何 ▲軼▼
(72)【発明者】
【氏名】李 磊
(72)【発明者】
【氏名】▲楊▼ 成
(72)【発明者】
【氏名】李 根
(72)【発明者】
【氏名】李 亦▲タン▼
【審査官】岡本 俊威
(56)【参考文献】
【文献】国際公開第2013/018913(WO,A1)
【文献】特開2017-021606(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G06F 16/70 -16/783
H04N 21/00 -21/235
(57)【特許請求の範囲】
【請求項1】
ビデオ特徴抽出方法であって、
ビデオオブジェクトに対してフレームを抽出して1つ又は複数のフレーム画像を得ることと、
前記フレーム画像のそれぞれについて1つ又は複数の検出ベクトルを取得し、各前記検出ベクトルを用いて、前記フレーム画像内の任意のピクセルを始点とし、前記検出ベクトルが指す前記始点の終点を決定し、前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定することと、
前記1つ又は複数のフレーム画像の前記画像特徴に基づいて前記ビデオオブジェクトのビデオ特徴を決定することと、を含み、
前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定することは、
前記検出ベクトルのそれぞれについて1つの前記フレーム画像における各前記始点と対応する前記終点との差分を決定し、前記検出ベクトルのそれぞれの特徴ビットを得るために、同一の前記検出ベクトルのそれぞれの前記差分の総合に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することと、
前記1つ又は複数の検出ベクトルに基づく前記フレーム画像の前記特徴ビットに基づいて前記フレーム画像の画像特徴を決定することと、を含む、ビデオ特徴抽出方法。
【請求項2】
請求項1に記載のビデオ特徴抽出方法であって、
前記検出ベクトルの長さと方向は任意である、ビデオ特徴抽出方法。
【請求項3】
請求項に記載のビデオ特徴抽出方法であって、
記1つ又は複数の検出ベクトルを取得することは、さらに、前記検出ベクトルのそれぞれにカウンタを割り当てることを含み、
記同一の前記検出ベクトルのそれぞれの前記差分の総合に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することは、前記検出ベクトルごとの前記差分に基づいて、前記検出ベクトルに対応する前記カウンタの値を増減することと、前記カウンタの値と予め設定された設定値との間で大きさを比較し、前記比較結果に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することとを含む、ビデオ特徴抽出方法。
【請求項4】
請求項1からのいずれか一項に記載のビデオ特徴抽出方法であって、
前記始点と前記終点との差分は、前記始点の輝度情報と前記終点の輝度情報との差分を含む、ビデオ特徴抽出方法。
【請求項5】
ビデオ特徴ライブラリ構築方法であって、
請求項1~の何れか一項に記載のビデオ特徴抽出方法に基づいてビデオオブジェクトのビデオ特徴を抽出することと、
前記ビデオ特徴をビデオ特徴ライブラリに記憶することと、を含む、ビデオ特徴ライブラリ構築方法。
【請求項6】
ビデオ特徴抽出装置であって、
ビデオオブジェクトに対してフレームを抽出して1つ又は複数のフレーム画像を得るためのフレーム抽出モジュールと、
画像特徴決定モジュールであって、前記フレーム画像のそれぞれについて1つ又は複数の検出ベクトルを取得し、各前記検出ベクトルを用いて、前記フレーム画像内の任意のピクセルを始点とし、前記検出ベクトルが指す前記始点の終点を決定し、前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定するためのモジュールと、
前記1つ又は複数のフレーム画像の前記画像特徴に基づいて前記ビデオオブジェクトのビデオ特徴を決定するためのビデオ特徴決定モジュールと、を含み、
前記画像特徴決定モジュールは、前記検出ベクトルのそれぞれについて1つの前記フレーム画像における各前記始点と対応する前記終点との差分を決定し、前記検出ベクトルのそれぞれの特徴ビットを得るために、同一の前記検出ベクトルのそれぞれの前記差分の総合に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定し、前記1つ又は複数の検出ベクトルに基づく前記フレーム画像の前記特徴ビットに基づいて前記フレーム画像の画像特徴を決定する、ビデオ特徴抽出装置。
【請求項7】
請求項に記載のビデオ特徴抽出装置であって、
請求項のいずれか一項に記載のビデオ特徴抽出方法のステップを実行するモジュールをさらに含む、ビデオ特徴抽出装置。
【請求項8】
ビデオ特徴ライブラリ構築装置であって、
請求項1~のいずれか一項に記載のビデオ特徴抽出方法に従ってビデオオブジェクトのビデオ特徴を抽出するためのビデオ特徴抽出モジュールと、
前記ビデオ特徴をビデオ特徴ライブラリに記憶するためのビデオ特徴記憶モジュールと、
前記ビデオ特徴を記憶するためのビデオ特徴ライブラリと、を含む、ビデオ特徴ライブラリ構築装置。
【請求項9】
ビデオ特徴抽出ハードウェア装置であって、
非一時的なコンピュータ読み取り可能な命令を記憶するためのメモリと、
実行時に請求項1~のいずれか一項に記載のビデオ特徴抽出方法を実現するように前記コンピュータ読み取り可能な命令を実行するプロセッサと、を含む、ビデオ特徴抽出ハードウェア装置。
【請求項10】
非一時的なコンピュータ読み取り可能な命令を記憶するためのコンピュータ読み取り可能な記憶媒体であって、
前記非一時的なコンピュータ読み取り可能な命令がコンピュータによって実行される際に、前記コンピュータに請求項1~のいずれか一項に記載のビデオ特徴抽出方法を実行させる、コンピュータ読み取り可能な記憶媒体。
【請求項11】
端末機器であって、請求項またはに記載のビデオ特徴抽出装置を含む、端末機器。
【発明の詳細な説明】
【技術分野】
【0001】
「関連出願の相互参照」
本願は、2018年3月29日に中国専利局に提出された出願番号が201810271773.1である中国特許出願の優先権を主張し、その全ての内容を援用する形で本願に組み込む。
【0002】
本開示は、ビデオ処理技術の分野に関し、特に、ビデオ特徴の抽出方法及び装置に関する。
【背景技術】
【0003】
今日のマルチメディア情報社会では、ユーザは毎日大量のビデオをビデオプラットフォームにアップロードするが、これらのビデオのほとんどは通常の価値のあるビデオであるが、問題のあるビデオもあり、問題のあるビデオは主に、プラットフォームビデオデータベースにおける既存のビデオと重複するビデオ、著作権データベースにおけるビデオと重複するビデオ(例えば、著作権料を支払う必要のあるビデオ)、及び不適切なビデオ又は表示禁止のビデオを含む。そのためユーザがアップロードした大量のビデオに対して高速照合及びフィルタリングを行う必要がある。ビデオ照合速度及び正確性を向上させるコア技術はビデオフレームの特徴に対して合理的な抽出及び類似度判定を行うことである。
【0004】
照合速度及び正確性を向上させるために、1つのビデオに該ビデオを特徴付けるビデオ特徴を生成する必要があり、目的は2つのビデオの特徴を照合することによりビデオの類似度を判断することである。ビデオ特徴の抽出方法及びビデオ特徴の優良度はビデオ照合の効率と正確率を決定する。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示の目的は、新たなビデオ特徴抽出方法及び装置を提供することである。
【課題を解決するための手段】
【0006】
本開示の目的は、以下の技術的解決手段によって達成される。
【0007】
本開示にて提案されるビデオ特徴抽出方法は、ビデオオブジェクトに対してフレームを抽出して1つ又は複数のフレーム画像を得るステップと、前記フレーム画像のそれぞれについて1つ又は複数の検出ベクトルを取得し、各前記検出ベクトルを用いて、前記フレーム画像内の任意のピクセルを始点とし、前記検出ベクトルが指す前記始点の終点を決定し、前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定するステップと、前記1つ又は複数のフレーム画像の前記画像特徴に基づいて前記ビデオオブジェクトのビデオ特徴を決定するステップと、を含む。
【0008】
本開示の目的は、以下の技術的解決手段によってさらに達成され得る。
【0009】
上述したビデオ特徴抽出方法において、前記検出ベクトルの長さと方向は任意である。
【0010】
上述したビデオ特徴抽出方法において、前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定する前記ステップは、前記検出ベクトルのそれぞれについて1つの前記フレーム画像における各前記始点と対応する前記終点との差分を決定し、前記検出ベクトル毎の特徴ビットを得るために、同一の前記検出ベクトルのそれぞれの前記差分の総合に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することと、前記1つ又は複数の検出ベクトルに基づく前記フレーム画像の前記特徴ビットに基づいて前記フレーム画像の画像特徴を決定することと、を含む。
【0011】
上述したビデオ特徴抽出方法において、1つ又は複数の検出ベクトルを取得する前記ステップは、前記検出ベクトル毎にカウンタを割り当てることを含む。同一の前記検出ベクトルのそれぞれの前記差分の総合に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することは、前記検出ベクトルの各前記始点と前記終点との差分に基づいて、前記検出ベクトルに対応する前記カウンタの値を増減することと、前記カウンタの値と予め設定された設定値との間で大きさを比較し、前記比較結果に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することとを含む。
【0012】
上述したビデオ特徴抽出方法において、前記始点と前記終点との差分は、前記始点の輝度情報と前記終点の輝度情報との差分を含む。
【0013】
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案されるビデオ特徴ライブラリ構築方法は、上述したいずれかのビデオ特徴抽出方法に基づいてビデオオブジェクトのビデオ特徴を抽出するステップと、前記ビデオ特徴をビデオ特徴ライブラリに記憶するステップと、を含む。
【0014】
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案されるビデオ特徴抽出装置は、ビデオオブジェクトに対してフレームを抽出して1つ又は複数のフレーム画像を得るためのフレーム抽出モジュールと、画像特徴決定モジュールであって、前記フレーム画像のそれぞれについて1つ又は複数の検出ベクトルを取得し、各前記検出ベクトルを用いて、前記フレーム画像内の任意のピクセルを始点とし、前記検出ベクトルが指す前記始点の終点を決定し、前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定するためのモジュールと、前記1つ又は複数のフレーム画像の前記画像特徴に基づいて前記ビデオオブジェクトのビデオ特徴を決定するためのビデオ特徴決定モジュールと、を含む。
【0015】
本開示の目的は、以下の技術的解決手段によってさらに達成され得る。
【0016】
上述したビデオ特徴抽出装置は、上述したビデオ特徴抽出方法のいずれかのステップを実行するモジュールをさらに含む。
【0017】
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案されるオーディオ指紋ライブラリ構築装置は、上述したビデオ特徴抽出方法のいずれかに従ってビデオオブジェクトのビデオ特徴を抽出するためのビデオ特徴抽出モジュールと、前記ビデオ特徴をビデオ特徴ライブラリに記憶するためのビデオ特徴記憶モジュールと、前記ビデオ特徴を記憶するためのビデオ特徴ライブラリと、を含む。
【0018】
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案されるビデオ特徴抽出ハードウェア装置は、非一時的なコンピュータ読み取り可能な命令を記憶するためのメモリと、実行時に上述したビデオ特徴抽出方法のいずれかを実現するように前記コンピュータ読み取り可能な命令を実行するプロセッサと、を含む。
【0019】
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案される、非一時的なコンピュータ読み取り可能な命令を記憶するためのコンピュータ読み取り可能な記憶媒体は、前記非一時的なコンピュータ読み取り可能な命令がコンピュータによって実行される際に、前記コンピュータに前記ビデオ特徴抽出方法のいずれかを実行させる。
【0020】
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案される端末機器は、上述したビデオ特徴抽出装置のいずれかを含む。
【0021】
上記の説明は、本開示の技術的解決手段の概要に過ぎず、本開示の技術的手段をより明確に理解し、本明細書の内容に従って実施することができ、また本開示の上記及び他の目的、特徴、及び利点をより明確に理解するように、以下、添付図面を参照して、好適な実施例を挙げて詳細に説明する。
【図面の簡単な説明】
【0022】
図1】本開示の一実施例によるビデオ特徴抽出方法のフローを示すブロック図である。
図2】本開示の一実施例によるビデオ特徴抽出方法のフローチャートである。
図3】本開示の一実施例によるフレーム画像の画像特徴を決定するプロセスのフローを示すブロック図である。
図4】本開示の一実施例によるビデオ特徴ライブラリ構築方法のフローを示すブロック図である。
図5】本開示の一実施例によるビデオ特徴抽出装置の構造を示すブロック図である。
図6】本開示の一実施例による画像特徴決定モジュールの構造を示すブロック図である。
図7】本開示の一実施例によるビデオ特徴ライブラリ構築装置の構造を示すブロック図である。
図8】本開示の一実施例によるビデオ特徴抽出ハードウェア装置のハードウェアを示すブロック図である。
図9】本開示の一実施例によるコンピュータ読み取り可能な記憶媒体を示す概略図である。
図10】本開示の一実施例による端末機器の構造を示すブロック図である。
【発明を実施するための形態】
【0023】
発明の意図する目的を達成するための本開示の技術的手段及び効果をさらに説明するために、本開示によるビデオ特徴抽出方法及び装置の具体的な実施形態、構造、特徴、及び効果を、添付図面及び好適な実施例を参照して以下のように詳しく説明する。
【0024】
図1は本開示によるビデオ特徴抽出方法の一実施例を示すブロック図である。図2は本開示によるビデオ特徴抽出方法の一実施例を示すフローチャートである。図1図2に示すように、本開示の例示によるビデオ特徴抽出方法は主に、ステップS11~ステップS13を含む。
【0025】
ステップS11:ビデオオブジェクト(例えば、ビデオ信号又はビデオファイルであってもよい)に対してフレームを抽出して1つ又は複数のフレーム画像を取得する。抽出されたフレーム画像の具体的な数を設定することができ、例えば、1秒間のビデオから2つのフレーム画像を抽出してもよく、1秒間のビデオから1つのフレーム画像を抽出してもよい。なお、フレームを均一に抽出することができ、すなわち隣接する2つのフレーム画像間の時間間隔は同じである。その後、処理はステップS12に進む。
【0026】
ステップS12:フレーム画像のそれぞれについて1つ又は複数の検出ベクトル(shift vectors)を取得し、仮に取得された検出ベクトルの数はN個であり、ここでNは正の整数である。各検出ベクトルを用いて、該フレーム画像内の任意のピクセルを始点とし、該検出ベクトルが指す該始点の終点のピクセルを決定し、該始点と対応する該終点との差分に基づいて該フレーム画像の画像特徴を決定する。その後、処理はステップS13に進む。
【0027】
具体的に言えば、該N個の検出ベクトルは、事前に設定されてもよく、ランダムに生成されてもよい。取得された検出ベクトルは図2における001に示すとおりである。さらに、各検出ベクトルの長さと方向は任意である。また、それぞれの検出ベクトルは独立しており、関連付けを必要としない。なお、フレーム抽出によって取得された複数のフレーム画像では、一般に、同じ群の検出ベクトルを使用して各フレーム画像の画像特徴を決定できるが、異なる複数群の検出ベクトルを使用して各フレーム画像の画像特徴をそれぞれ決定することもできる。
【0028】
なお、任意のピクセルを始点とするとは、一般的には、フレーム画像内の全てのピクセルを起点として定義してもよく、あるいは、フレーム画像のうち、1つ又は複数の予め設定された位置のピクセルを始点として定義してもよく、具体的な位置が任意であり、例えば、1つのフレーム画像におけるエッジ上にない全ての点を始点としてもよいことをいう。
【0029】
本開示の一具体例では、1つのフレーム画像の画像特徴を決定するプロセスにおいて、各検出ベクトルを用いて、該フレーム画像における各ピクセルを始点とし、各始点ピクセルと対応する終点ピクセルとの差分を走査し、各検出ベクトルの特徴ビットを得るように、同一の検出ベクトルに基づく各差分の総合に基づいて該検出ベクトルに基づく該フレーム画像の特徴ビット(bit)を決定する。一例では、該各差分の総合を決定するように同一の検出ベクトルに基づく各差分を合計してもよい。そして、得られたN個の検出ベクトルに対応する該特徴ビットに基づいて、該フレーム画像に対応する長さがNである1つの画像特徴(ビデオ特徴単体ともいう)を決定する。得られた長さがNである画像特徴は、図2における004に示すとおりである。
【0030】
本開示のいくつかの実施例では、上述した始点と終点との差分は、始点の輝度情報と終点の輝度情報との差分を含む。
【0031】
ステップS13:該ビデオオブジェクトに対応する各フレーム画像の画像特徴に基づいて該ビデオオブジェクトのビデオ特徴を決定する。具体的には、画像特徴シーケンスを取得するように、対応するフレーム画像の時系列順に従って複数の画像特徴を配列し、そして該画像特徴シーケンスをビデオ特徴として決定する。
【0032】
本開示の例示によるビデオ特徴抽出方法は、ビデオオブジェクトから抽出されたフレーム画像に対して、長さ及び方向の任意な検出ベクトルに従ってフレーム画像内の始点ピクセル及び終点ピクセルを決定し、また始点ピクセルと終点ピクセルとの差分を比較してビデオ特徴を生成し、ビデオ特徴抽出の正確性と抽出効率を向上させ、取得したビデオ特徴の優良度を向上させることができる。さらに、本開示のビデオ特徴抽出方法によって得られたビデオ特徴に基づいて行われたビデオ照合、ビデオ検索、ビデオ重複排除、及びビデオコンテンツ監視においてより高い正確率及び効率を有する。
【0033】
図3は本開示のビデオ特徴抽出方法の一実施例によるフレーム画像の画像特徴を決定するフローを示すブロック図である。図2図3に示すように、本開示の一実施例では、ステップS12に記載のN個の検出ベクトルを用いて、フレーム画像の1つの画像特徴を決定するプロセスは具体的には、ステップS21~ステップS24を含む。
【0034】
ステップS21:N個の検出ベクトルのそれぞれに1つのカウンタ(counter)を割り当てる。その後、処理はステップS22に進む。
【0035】
ステップS22:1つの検出ベクトルに基づいて、1つのフレーム画像内の任意のピクセルに対して該ピクセルを始点とし、該検出ベクトルが指す終点のピクセルを決定し、該始点と該終点との輝度値の差分を決定するように該始点及び該終点の輝度値を取得し、例えば、該差分は始点がより明るい場合と、終点がより明るい場合とを含み、該検出ベクトルの各始点の該差分に基づいて、該検出ベクトルに対応するカウンタの値を増減する。その後、処理はステップS23に進む。
【0036】
具体的に言えば、図2における002に示すように、一例では、フレーム画像内の任意のピクセルを始点とし、1つの検出ベクトル(図2における001の中で最も右側の検出ベクトルを取っても構わない)に基づいて各始点が指す終点を決定し、対応する始点の輝度値と終点の輝度値を比較し、始点の輝度値が終点の輝度値よりも大きい場合(図2に示すように始点が終点よりも浅い場合)は、カウンタの値が+1となり、逆に始点の輝度値が終点の輝度値よりも小さい場合(図2に示すように始点の輝度値が終点の輝度値よりも黒い場合)は、カウンタの値が-1となる。全てのピクセルを統計し、カウンタの値を増減し、得られたカウンタは図2における003に示すとおりである。
【0037】
なお、検出ベクトルの終点がフレーム画像の範囲を超えれば、カウンタの値を変更しなくてもよく、該フレーム画像に対して周期的に遅延させ、該フレーム画像の4つの面に該フレーム画像と同様のフレーム画像を設定することで、検出ベクトルの終点に対応するピクセルが必ず存在するようにしてもよい。
【0038】
ステップS23:該カウンタの値と予め設定された設定値との間の大きさを比較して比較結果を取得し、該比較結果に基づいて該検出ベクトルに基づく該フレーム画像の特徴ビットを決定する。その後、処理はステップS24に進む。
【0039】
具体的に言えば、該設定値を0に予め設定してもよい。該カウンタの値が予め設定された設定値よりも大きいか否かを判断し、該カウンタの値が該設定値よりも大きい場合、値が1の特徴ビットを生成し、逆に値が0の特徴ビットを生成する。図2の003及び004に示すように、カウンタの値が+2であれば、値が1の特徴ビットを生成する。
【0040】
ステップS24:該N個の検出ベクトルに基づく1つのフレーム画像の特徴ビットに基づいて、該フレーム画像の画像特徴を決定する。取得された画像特徴は図2における004に示すとおりである。
【0041】
なお、ステップS22におけるカウンタの増加と減少の規則は上記の実施例の態様に限定されず、例えば始点輝度値が終点輝度値よりも小さい場合にカウンタの値が+1となり、逆にカウンタの値が-1となり、また、始点と終点の輝度値が等しい場合には、カウンタの値を+1に一律に設定してもよいし、カウンタの値を-1に一律に設定してもよいし、カウンタの値を変更しないように一律に設定してもよい。同様に、ステップS23について、他の方式を用いて特徴ビットの値を決定してもよく、例えば以下のようにしてもよい。ステップS22で値を変更した後のカウンタに基づき、カウンタの値が0よりも小さい場合に値が1の特徴ビットを生成し、逆に値が0の特徴ビットを生成する。
【0042】
図4は本開示によるビデオ特徴ライブラリ構築方法の一実施例を示すフローチャートである。図4に示すように、本開示の例示によるビデオ特徴ライブラリ構築方法は、主にステップS31とステップS32を含む。
【0043】
ステップS31:上記の本開示の例示によるビデオ特徴抽出方法のステップに従ってビデオオブジェクトのビデオ特徴を抽出する。その後、処理はステップS32に進む。
【0044】
ステップS32:ビデオオブジェクトのビデオ特徴をビデオ特徴ライブラリに記憶する。
【0045】
なお、1つのビデオ特徴ライブラリにおけるビデオ特徴は同様の特徴抽出方法に基づいて得られ、すなわちステップS31のビデオ特徴抽出のプロセスにおいて、ステップS11では同様の方法でフレームを抽出し、ステップS12で取得されたのは同様の検出ベクトルであり、また同様の方法で画像特徴を決定し、且つステップS13では同様の方法でビデオ特徴を決定する。また、時間の経過とともに、ビデオ特徴ライブラリを随時更新することができる。
【0046】
図5は本開示によるビデオ特徴抽出装置の一実施例の構造を示すブロック図である。図5に示すように、本開示の例示によるビデオ特徴抽出装置100は主に、
ビデオオブジェクトに対してフレームを抽出して1つ又は複数のフレーム画像を得るためのフレーム抽出モジュール110と、
画像特徴決定モジュール120であって、フレーム画像のそれぞれについて1つ又は複数の検出ベクトルを取得し、各検出ベクトルを用いて、該フレーム画像内の任意のピクセルを始点とし、該検出ベクトルが指す該始点の終点のピクセルを決定し、該始点と該終点との差分に基づいて該フレーム画像の画像特徴を決定するためのモジュールと、
該ビデオオブジェクトに対応する各フレーム画像の画像特徴に基づいて該ビデオオブジェクトのビデオ特徴を決定するためのビデオ特徴決定モジュール130と、を含む。
【0047】
図6は本開示のビデオ特徴抽出装置の一実施例による画像特徴決定モジュール120の構造を示すブロック図である。図6に示すように、本開示の一実施例では、画像特徴決定モジュール120は具体的に、
N個の検出ベクトルのそれぞれに1つのカウンタを割り当てるためのカウンタ生成ユニット121と、
カウントユニット122であって、1つの検出ベクトルに基づいて、1つのフレーム画像内の任意のピクセルに対して該ピクセルを始点とし、該検出ベクトルが指す終点のピクセルを決定し、該始点と該終点との輝度値の差分を決定するように該始点及び該終点の輝度値を取得し、該検出ベクトルの各始点の該差分に基づいて、該検出ベクトルに対応するカウンタの値を増減するためのユニットと、
該カウンタの値と予め設定された設定値との間の大きさを比較して比較結果を取得し、該比較結果に基づいて該検出ベクトルに基づく該フレーム画像の特徴ビットを決定するための特徴ビット決定ユニット123と、
該N個の検出ベクトルに基づく1つのフレーム画像の特徴ビットに基づいて、該フレーム画像の画像特徴を決定するための画像特徴決定ユニット124と、を含む。
【0048】
図7は本開示によるビデオ特徴ライブラリ構築装置の一実施例の構造を示す概略図である。図7に示すように、本開示の例示によるビデオ特徴ライブラリ構築装置200は主に、
ビデオ特徴抽出モジュール201であって、上述した本開示の例示によるビデオ特徴抽出装置のフレーム抽出モジュール110と、画像特徴決定モジュール120と、ビデオ特徴決定モジュール130とを含み、上述した本開示の例示によるビデオ特徴抽出方法のステップに従ってビデオオブジェクトのビデオ特徴を抽出するためのモジュールと、
ビデオ特徴をビデオ特徴ライブラリに記憶するためのビデオ特徴記憶モジュール202と、
各ビデオオブジェクトのビデオ特徴を記憶するためのビデオ特徴ライブラリ203と、を含む。
【0049】
図8は本開示の実施例によるビデオ特徴抽出ハードウェア装置のハードウェアを示すブロック図である。図8に示すように、本開示の実施例によるビデオ特徴抽出ハードウェア装置300はメモリ301と、プロセッサ302とを含む。ビデオ特徴抽出ハードウェア装置300のコンポーネントのそれぞれは、バスシステム及び/又は他の形態の接続機構(図示せず)によって相互接続される。
【0050】
該メモリ301は非一時的なコンピュータ読み取り可能な命令を記憶するために用いられる。具体的に言えば、メモリ301は、1つ又は複数のコンピュータプログラム製品を含むことができ、該コンピュータプログラム製品は揮発性メモリ及び/又は不揮発性メモリなどの様々な形態のコンピュータ読み取り可能な記憶媒体を含むことができる。該揮発性メモリは、例えば、ランダムアクセスメモリ(RAM)及び/又はキャッシュ(cache)などを含むことができる。該不揮発性メモリは、例えば、読み取り専用メモリ(ROM)、ハードディスク、フラッシュメモリなどを含むことができる。
【0051】
該プロセッサ302は、中央処理ユニット(CPU)又はデータ処理機能及び/又は命令実行機能を備えた他の形態の処理ユニットであってもよく、所望の機能を実行するためにビデオ特徴抽出ハードウェア装置300の他のコンポーネントを制御することができる。本開示の一実施例において、該プロセッサ302は該メモリ301に記憶された該コンピュータ読み取り可能な命令を実行し、該ビデオ特徴抽出ハードウェア装置300に上述した本開示の各実施例のビデオ特徴抽出方法のステップの全て又は一部を実行させる。
【0052】
図9は本開示の実施例によるコンピュータ読み取り可能な記憶媒体を示す概略図である。図9に示すように、本開示の実施例によるコンピュータ読み取り可能な記憶媒体400には、非一時的なコンピュータ読み取り可能な命令401が記憶されている。該非一時的なコンピュータ読み取り可能な命令401がプロセッサによって実行される際に、上述した本開示の各実施例のビデオ特徴抽出方法のステップの全て又は一部を実行する。
【0053】
図10は本開示の実施例による端末機器のハードウェアの構造を示す概略図である。端末機器はいくつかの形態で実施されることが可能であり、本開示における端末機器は、携帯電話、スマートフォン、ノートブックコンピュータ、デジタル放送受信機、PDA(パーソナルデジタルアシスタント)、PAD(タブレット)、PMP(ポータブルマルチメディアプレーヤー)、ナビゲーション装置、車載端末機器、車載表示端末、車載電子バックミラーなどの携帯端末機器及びデジタルTV、デスクトップコンピュータなどの固定端末機器などを含んでもよいが、これらに限定されない。
【0054】
図10に示すように、端末機器1100は、無線通信ユニット1110、A/V(オーディオ/ビデオ)入力ユニット1120、ユーザ入力ユニット1130、検知ユニット1140、出力ユニット1150、メモリ1160、インタフェースユニット1170、コントローラ1180及び電源ユニット1190などを含んでもよい。図10は、各種のコンポーネントを有する端末機器を示したが、図示されている全てのコンポーネントを実施する必要があるわけではないことを理解されたい。代わりに、より多く又はより少ないコンポーネントを実施できる。
【0055】
そのうち、無線通信ユニット1110は端末機器1100と無線通信システム又はネットワークとの間の無線通信を許可する。A/V入力ユニット1120は、オーディオ又はビデオ信号を受信する。ユーザ入力ユニット1130は、ユーザが入力した命令に応じてキー入力データを生成し、端末機器の各種の動作を制御することができる。検知ユニット1140は、端末機器1100の現在の状態、端末機器1100の位置、端末機器1100に対するユーザのタッチ入力の有無、端末機器1100の向き、端末機器1100の加減速や方向などを検出し、且つ端末機器1100の動作を制御するための命令や信号を生成する。インタフェースユニット1170は、少なくとも1つの外部装置と端末機器1100とを接続するためのインタフェースとして機能する。出力ユニット1150は、視覚的、音響的及び/又は触覚的に出力信号を提供するものである。メモリ1160は、コントローラ1180が実行する処理、動作を制御するソフトウェアプログラムなどを記憶してもよいし、出力されたデータ又は出力されるデータを一時的に記憶してもよい。メモリ1160は、少なくとも1種類の記憶媒体を含むことができる。また、端末機器1100は、ネットワーク接続によってメモリ1160の記憶機能を実行するネットワーク記憶装置と連携することができる。コントローラ1180は、通常、端末機器全体の動作を制御する。また、コントローラ1180は、マルチメディアデータを再生又は再放送するためのマルチメディアモジュールを含むことができる。コントローラ1180は、タッチスクリーン上での手書き入力又は描画入力を文字又は画像として認識するようにパターン認識処理を行うことができる。電源ユニット1190は、コントローラ1180の制御に基づいて、外部電力又は内部電力を受信し、各素子及びコンポーネントを動作させるために必要な電力を供給する。
【0056】
本開示にて提案されるビデオ特徴抽出方法の様々な実施形態は例えばコンピュータソフトウェア、ハードウェア又はそれらの任意の組み合わせのコンピュータ可読媒体を用いて実施することができる。ハードウェアによる実施について、本開示にて提案されるビデオ特徴抽出方法の様々な実施形態は特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理装置(DSPD)、プログラマブル論理装置(PLD)、現場でプログラム可能なゲートアレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサは、ここで説明した機能を実行する電子ユニットのうちの少なくとも1つを用いて実施し、いくつかの場合は、本開示にて提案されるビデオ特徴抽出方法の様々な実施形態はコントローラ1180において実施可能である。ソフトウェアによる実施について、本開示にて提案されるビデオ特徴抽出方法の様々な実施形態は、少なくとも1つの機能又は動作の実行を可能にする個別のソフトウェアモジュールで実施されてもよい。ソフトウェアコードは、任意の適切なプログラミング言語で書かれたソフトウェアアプリケーション(又はプログラム)によって実施することができ、ソフトウェアコードはメモリ1160に記憶され、コントローラ1180により実行されてもよい。
【0057】
以上、本開示の実施例によるビデオ特徴抽出方法、装置、ハードウェア装置、コンピュータ読み取り可能な記憶媒体及び端末機器は、任意の長さ及び任意の方向の複数の検出ベクトルを取得し、検出ベクトルの始点ピクセルと終点ピクセルとの差分を判断してビデオ特徴を生成し、ビデオ特徴抽出の正確性と抽出効率を向上させ、取得したビデオ特徴の優良度を向上させることができ、さらに、本開示のビデオ特徴抽出方法によって得られたビデオ特徴に基づいて行われたビデオ照合、ビデオ検索、ビデオ重複排除、及びビデオコンテンツ監視においてより高い正確率及び効率を有する。
【0058】
本開示の基本的な原理は、上記で具体的な実施例を参照しながら説明されたが、本開示で言及されている利点、長所、効果などは、限定ではなく例示に過ぎず、これらの利点、長所、効果などは本開示の様々な実施例に必要であると考えられるべきではない。また、上記の開示の特定の詳細は、例示と理解の容易化のためだけのものであり、限定ではなく、上記の詳細は、本開示を上記の特定の詳細に限定することを意図したものではない。
【0059】
本開示に係るデバイス、装置、機器、システムのブロック図は単なる例示であり、ブロック図に示されている方法で接続、配置、又は構造を意図又は要求するものではない。当業者には理解されるように、これらのデバイス、装置、機器、システムは任意の方法で接続、配置、及び構造することができる。「備える」、「含む」、「有する」などの言葉はオープンボキャブラリーであり、「含むが、これらに限定されない」ことを意味し、且つ交換可能に使用されてもよい。ここで使用される「又は」と「及び」とは「及び/又は」という用語であり、文脈からそうでないことが明確に示されていない限り交換可能に使用されてもよい。本明細書で使用される「~など」という用語は、「~などであるがこれらに限定されない」という語句を指し、それと交換可能に使用されてもよい。
【0060】
また、ここで使用されているように、「少なくとも1つ」で始まる項目の列挙で使用されている「又は」は、別々の列挙を示し、例えば「A、B、又はCの少なくとも1つ」の列挙とは、A、又はB、又はC、又はAB、又はAC、又はBC、又はABC(すなわちA、B、及びC)を意味する。さらに、「例示的な」という表現は、説明された例が他の例よりも好ましい又は優れていることを意味しない。
【0061】
また、本開示のシステム及び方法では、各部材又は各ステップが分解及び/又は再結合され得ることに留意されたい。これらの分解及び/又は再結合は、本開示と同等であると見なされるべきである。
【0062】
添付の特許請求の範囲で定義される本開示の教示から逸脱することなく、本明細書に記載の技術の様々な変更、置換、及び変更を行うことができる。さらに、本開示の特許請求の範囲は、上記のプロセス、機械、製造、イベントの組成、手段、方法、及び動作の特定の態様に限定されない。本明細書で説明する対応する態様を利用して実質的に同じ機能を実行し又は実質的に同じ結果の現在存在する、又は後に開発されるプロセス、機械、製造、イベントの組成、手段、方法、又は動作を実現することができる。従って、添付の特許請求の範囲はその範囲内のこのようなプロセス、機械、製造、イベントの組成、手段、方法又は動作を含む。
【0063】
開示された態様の上記の説明は、当業者が本開示を作成又は使用することを可能にするために提供される。これらの態様に対する様々な補正は、当業者には明らかであり、本明細書で定義される一般原理は、本開示の範囲から逸脱することなく他の態様に適用されてもよい。従って、本開示は、本明細書に示される態様に限定されるものではなく、本明細書に開示される原理及び新規の特徴の最も広い範囲内にあるものとする。
【0064】
上記の説明は、例示及び説明の目的で提案されたものである。さらに、本説明は、本開示の実施例を本明細書に開示された形態に限定することを意図するものではない。多くの例示的な態様及び実施例が上記で議論されたが、当業者は、それらの特定の変形、補正、変更、追加、及びサブコンビネーションを認識するであろう。
【符号の説明】
【0065】
100 ビデオ特徴抽出装置
110 フレーム抽出モジュール
120 画像特徴決定モジュール
121 カウンタ生成ユニット
122 カウントユニット
123 特徴ビット決定ユニット
124 画像特徴決定ユニット
130 ビデオ特徴決定モジュール
200 ビデオ特徴ライブラリ構築装置
201 ビデオ特徴抽出モジュール
202 ビデオ特徴記憶モジュール
203 ビデオ特徴ライブラリ
300 ビデオ特徴抽出ハードウェア装置
301 メモリ
302 プロセッサ
400 コンピュータ読み取り可能な記憶媒体
401 非一時的なコンピュータ読み取り可能な命令
1110 無線通信ユニット
1120 A/V入力ユニット
1130 ユーザ入力ユニット
1140 検知ユニット
1150 出力ユニット
1160 メモリ
1170 インタフェースユニット
1180 コントローラ
1190 電源ユニット
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10