特許第6378453号(P6378453)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ シャオミ・インコーポレイテッドの特許一覧

<>
  • 特許6378453-特徴抽出方法及び装置 図000011
  • 特許6378453-特徴抽出方法及び装置 図000012
  • 特許6378453-特徴抽出方法及び装置 図000013
  • 特許6378453-特徴抽出方法及び装置 図000014
  • 特許6378453-特徴抽出方法及び装置 図000015
  • 特許6378453-特徴抽出方法及び装置 図000016
  • 特許6378453-特徴抽出方法及び装置 図000017
  • 特許6378453-特徴抽出方法及び装置 図000018
  • 特許6378453-特徴抽出方法及び装置 図000019
  • 特許6378453-特徴抽出方法及び装置 図000020
  • 特許6378453-特徴抽出方法及び装置 図000021
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6378453
(24)【登録日】2018年8月3日
(45)【発行日】2018年8月22日
(54)【発明の名称】特徴抽出方法及び装置
(51)【国際特許分類】
   G06T 7/00 20170101AFI20180813BHJP
【FI】
   G06T7/00 300G
【請求項の数】11
【全頁数】19
(21)【出願番号】特願2017-552215(P2017-552215)
(86)(22)【出願日】2015年12月29日
(65)【公表番号】特表2018-504729(P2018-504729A)
(43)【公表日】2018年2月15日
(86)【国際出願番号】CN2015099310
(87)【国際公開番号】WO2017088249
(87)【国際公開日】20170601
【審査請求日】2016年2月26日
(31)【優先権主張番号】201510827886.1
(32)【優先日】2015年11月25日
(33)【優先権主張国】CN
(73)【特許権者】
【識別番号】513309030
【氏名又は名称】シャオミ・インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ロン,フェイ
(72)【発明者】
【氏名】チェン,チジュン
(72)【発明者】
【氏名】チャン,タオ
【審査官】 ▲広▼島 明芳
(56)【参考文献】
【文献】 特開平10−056570(JP,A)
【文献】 外谷 文人 Ayato Toya,ステレオ視とHOGを用いた歩行者認識手法 Pedestrian Recognition using Stereo Vision and Histogram of Oriented Gradients(HOG),情報処理学会研究報告 Vol.2008 No.25 IPSJ SIG Technical Reports,日本,社団法人情報処理学会 Information Processing Society of Japan,2008年,第2008巻,第21-27頁
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 − 7/90
(57)【特許請求の範囲】
【請求項1】
特徴抽出方法であって、
画像を複数のセルを含む複数のブロックに区分することと、
各前記セルを空間領域から周波数領域に転換することと、
前記画像の前記周波数領域における勾配方向ヒストグラムHOG特徴を抽出することと、を含み、
前記画像の前記周波数領域における勾配方向ヒストグラムHOG特徴を抽出することは、
前記周波数領域における各前記セルの勾配の大きさと勾配方向を計算し、各前記セルの記述子を取得することと、
前記周波数領域における各前記ブロックの各前記記述子を統計し、各前記ブロックのHOG特徴を取得することと、
前記画像の前記周波数領域における各前記ブロックのHOG特徴を統計し、前記画像のHOG特徴を取得することと、を含み、
前記画像における各前記ブロックのHOG特徴を統計し、前記画像のHOG特徴を取得することは、
前記画像における、M*N個の画素を含む各前記ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整することと、
各前記ブロックの調整後の前記HOG特徴と前記画像における各前記ブロックの対応する位置に基づき、前記画像のHOG特徴を取得することと、を含む
ことを特徴とする特徴抽出方法。
【請求項2】
前記各前記セルを空間領域から周波数領域に転換することは、
各前記セルに対して離散コサイン変換DCTを行うことを含むことを特徴とする請求項1に記載の方法。
【請求項3】
前記各前記セルを空間領域から周波数領域に転換することは、
各前記セルに対して離散フーリエ変換DFTを行うことを含むことを特徴とする請求項1に記載の方法。
【請求項4】
前記画像における各前記ブロックのHOG特徴を統計し、前記画像のHOG特徴を取得することは、
前記画像における各前記ブロックのHOG特徴を一つの列として一つの行列に直列接続し、前記画像のHOG特徴を取得することを含むことを特徴とする請求項に記載の方法。
【請求項5】
前記方法は、さらに、
前記画像に対して正規化処理を行い、所定のサイズの前記画像を取得することを含むことを特徴とする請求項1〜のいずれかに記載の方法。
【請求項6】
特徴抽出装置であって、
画像を複数のセルを含む複数のブロックに区分するように配置された区分モジュールと、
各前記セルを空間領域から周波数領域に転換するように配置された転換モジュールと、
前記画像の前記周波数領域における勾配方向ヒストグラムHOG特徴を抽出するように配置された抽出モジュールと、を含み、
前記抽出モジュールは、
前記周波数領域における各前記セルの勾配の大きさと勾配方向を計算し、各前記セルの記述子を取得するように配置された計算サブモジュールと、
前記周波数領域における各前記ブロックの各前記記述子を統計し、各前記ブロックのHOG特徴を取得するように配置された第1統計サブモジュールと、
前記画像の前記周波数領域における各前記ブロックのHOG特徴を統計し、前記画像のHOG特徴を取得するように配置された第2統計サブモジュールと、を含み、前記第2統計サブモジュールは、
前記画像における、M*N個の画素を含む各前記ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整するように配置された調整サブモジュールと、
各前記ブロックの調整後の前記HOG特徴と前記画像における各前記ブロックの対応する位置に基づき、前記画像のHOG特徴を取得するように配置された特徴抽出サブモジュールと、を含む
ことを特徴とする特徴抽出装置。
【請求項7】
前記転換モジュールは、
各前記セルに対して離散コサイン変換DCTを行うように配置されたことを特徴とする請求項に記載の装置。
【請求項8】
前記転換モジュールは、
各前記セルに対して離散フーリエ変換DFTを行うように配置されたことを特徴とする請求項に記載の装置。
【請求項9】
前記第2統計サブモジュールは、
前記画像における各前記ブロックのHOG特徴を一つの列として一つの行列に直列接続し、前記画像のHOG特徴を取得するように配置されたことを特徴とする請求項に記載の装置。
【請求項10】
前記装置は、さらに、
前記画像に対して正規化処理を行い、所定のサイズの前記画像を取得するように配置された処理モジュールを含むことを特徴とする請求項のいずれかに記載の装置。
【請求項11】
特徴抽出装置であって、
前記装置は、プロセッサと、前記プロセッサの実行可能なコマンドを記憶するメモリと、を含み、
前記プロセッサは、
画像を複数のセルを含む複数のブロックに区分し、
各前記セルを空間領域から周波数領域に転換し、
前記画像の前記周波数領域における勾配方向ヒストグラムHOG特徴を抽出し、
前記画像の前記周波数領域における勾配方向ヒストグラムHOG特徴を抽出することは、
前記周波数領域における各前記セルの勾配の大きさと勾配方向を計算し、各前記セルの記述子を取得することと、
前記周波数領域における各前記ブロックの各前記記述子を統計し、各前記ブロックのHOG特徴を取得することと、
前記画像の前記周波数領域における各前記ブロックのHOG特徴を統計し、前記画像のHOG特徴を取得することと、を含み、
前記画像における各前記ブロックのHOG特徴を統計し、前記画像のHOG特徴を取得することは、
前記画像における、M*N個の画素を含む各前記ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整することと、
各前記ブロックの調整後の前記HOG特徴と前記画像における各前記ブロックの対応する位置に基づき、前記画像のHOG特徴を取得することと、を含む
ことを特徴とする特徴抽出装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像処理技術分野に関し、特に特徴抽出方法及び装置に関する。
【0002】
本発明は出願番号201510827886.1であり、出願日2015年11月25日である中国特許出願に基づいて提出され、該中国特許出願の優先権を主張し、該中国特許出願の全ての内容はここで参考として本発明に引用される。
【背景技術】
【0003】
画像検出及び認識はコンピュータビジョンにおける一つの重要な研究分野である。画像検出及び認識技術において最もよく使われる方法は、画像におけるある特徴を抽出することにより、画像に対して検出及び認識を行う。
【0004】
関わる技術において、画像のHOG(Histogram of Oriented Gradient、勾配方向ヒストグラム)特徴を抽出することにより、画像に対して検出及び認識を行う。HOG特徴抽出方法は、画像における各画素の勾配を計算することと、画像を複数の画素を含む複数のセルに区分し、各隣接するn個のセルを一つのブロックに形成することと、各セルにおけるすべての画素の勾配ヒストグラムを統計し、各ブロックにおけるすべてのセルの勾配ヒストグラムに基づいて各ブロックのHOG特徴を取得することと、画像におけるすべてのブロックのHOG特徴を統計し画像のHOG特徴を取得することと、を含む。
【発明の概要】
【発明が解決しようとする課題】
【0005】
関わる技術に存在する問題を解決するために、本発明は特徴抽出方法及び装置を提供する。前記技術的解決手段は以下のとおりである。
【課題を解決するための手段】
【0006】
本発明の実施例の第1態様によれば、画像を複数のセルを含む複数のブロックに区分することと、各セルを空間領域から周波数領域に転換することと、画像の周波数領域における勾配方向ヒストグラムHOG特徴を抽出することとを含む特徴抽出方法を提供している。
【0007】
好ましい実施例において、各セルを空間領域から周波数領域に転換することは、各セルに対して離散コサイン変換DCTを行うことを含む。
【0008】
好ましい実施例において、各セルを空間領域から周波数領域に転換することは、各セルに対して離散フーリエ変換DFTを行うことを含む。
【0009】
好ましい実施例において、画像の周波数領域における勾配方向ヒストグラムHOG特徴を抽出することは、周波数領域における各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得することと、周波数領域における各ブロックの各記述子を統計し、各ブロックのHOG特徴を取得することと、画像の周波数領域における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得することと、を含む。
【0010】
好ましい実施例において、画像における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得することは、画像における各ブロックのHOG特徴を一つの列として一つの行列に直列接続し、画像のHOG特徴を取得することを含む。
【0011】
好ましい実施例において、画像における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得することは、画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整することと、各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像のHOG特徴を取得することと、を含む。
【0012】
好ましい実施例において、該方法は、さらに、画像に対して正規化処理を行い、所定のサイズの画像を取得することを含む。
【0013】
本発明の実施例の第2態様によれば、画像を複数のセルを含む複数のブロックに区分するように配置された区分モジュールと、各セルを空間領域から周波数領域に転換するように配置された転換モジュールと、画像の周波数領域における勾配方向ヒストグラムHOG特徴を抽出するように配置された抽出モジュールと、を含む特徴抽出装置を提供している。
【0014】
好ましい実施例において、転換モジュールは、各セルに対して離散コサイン変換DCTを行うように配置される。
【0015】
好ましい実施例において、転換モジュールは、各セルに対して離散フーリエ変換DFTを行うように配置される。
【0016】
好ましい実施例において、抽出モジュールは、周波数領域における各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得するように配置された計算サブモジュールと、周波数領域における各ブロックの各記述子を統計し、各ブロックのHOG特徴を取得するように配置された第1統計サブモジュールと、画像の周波数領域における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得するように配置された第2統計サブモジュールと、を含む。
【0017】
好ましい実施例において、第2統計サブモジュールは、画像における各ブロックのHOG特徴を一つの列として一つの行列に直列接続し、画像のHOG特徴を取得するように配置される。
【0018】
好ましい実施例において、第2統計サブモジュールは、画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整するように配置された調整サブモジュールと、各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像のHOG特徴を取得するように配置された特徴抽出サブモジュールと、を含む。
【0019】
好ましい実施例において、該装置は、さらに、画像に対して正規化処理を行い、所定のサイズの画像を取得するように配置された処理モジュールを含む。
【0020】
本発明の実施例の第3態様によれば、画像を複数のセルを含む複数のブロックに区分し、各セルを空間領域から周波数領域に転換し、画像の周波数領域における勾配方向ヒストグラムHOG特徴を抽出するように配置された、プロセッサと、プロセッサの実行可能なコマンドを記憶するメモリと、を含む特徴抽出装置を提供している。
【発明の効果】
【0021】
本発明の実施例により提供される技術的解決手段は以下の好適な効果を含むことができる。
【0022】
画像を複数のセルを含む複数のブロックに区分し、各セルを空間領域から周波数領域に転換し、画像の周波数領域における勾配方向ヒストグラムHOG特徴を抽出することにより、HOG特徴抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決する。周波数領域において画像のHOG特徴を抽出し、パターン認識における検出率及び正確度を向上させるという効果を達成している。
【0023】
理解すべきことは、以上の一般的な説明と後の詳細な説明は例示的なものに過ぎず、本発明を限定するものではない。
【図面の簡単な説明】
【0024】
ここの図面は明細書に合せられ本明細書の一部を構成し、本発明本発明に適合する実施例を示し、明細書と共に本発明の原理を解釈するのに用いられる。
図1】一例示的な実施例により示された特徴抽出方法のフローチャートである。
図2A】別の一例示的な実施例により示された特徴抽出方法のフローチャートである。
図2B】一例示的な実施例により示された画像区分を示す図である。
図2C】別の一例示的な実施例により示された画像区分を示す図である。
図2D】一例示的な実施例により示されたブロックのHOG特徴を統計することを示す図である。
図3A】一例示的な実施例により示された特徴抽出方法のフローチャートである。
図3B】一例示的な実施例により示された画像のHOG特徴を統計することを示す図である。
図4】一例示的な実施例により示された特徴抽出装置のブロック図である。
図5】別の一例示的な実施例により示された特徴抽出装置のブロック図である。
図6】一例示的な実施例により示された特徴抽出装置のサブモジュールのブロック図である。
図7】別の一例示的な実施例により示された特徴抽出装置のブロック図である。
【発明を実施するための形態】
【0025】
ここで例示的な実施例について詳しく説明し、その実例は図面に示す通りである。下記の説明が図面に関わる時、別途に表示されない限り、異なる図面における同じ数字は同じ又は類似する要素を表示する。以下の例示的な実施例に説明される実施形態は本発明と一致する全ての実施形態を代表するわけではない。逆に、それらは添付の特許請求の範囲に詳細に記載された本発明の一部の態様と一致する装置と方法の例に過ぎない。
【0026】
図1は一例示的な実施例により示された特徴抽出方法のフローチャートであり、図1に示すように、本実施例は該方法をパターン認識のハードウェアに用いることを例として説明し、該方法は以下のステップを含むことができる。
【0027】
ステップ102において、画像を複数のセルを含む複数のブロックに区分する。
【0028】
ステップ104において、各セルを空間領域から周波数領域に転換する。
【0029】
各セルに対して転換を行い、画像を空間領域から周波数領域に転換する。
【0030】
ステップ106において、画像の周波数領域におけるHOG特徴を抽出する。
【0031】
周波数領域において画像のHOG特徴を抽出する。
【0032】
上に述べたように、本発明の実施例により提供された特徴抽出方法は、画像を複数のセルを含む複数のブロックに区分し、各セルを空間領域から周波数領域に転換し、画像の周波数領域における勾配方向ヒストグラムHOG特徴を抽出することにより、HOG特徴抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決する。周波数領域における画像のHOG特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させるという効果を達成している。
【0033】
図2Aは別の一例示的な実施例により示された特徴抽出方法のフローチャートであり、図2Aに示すように、本実施例は該方法をパターン認識のハードウェアに用いることを例として説明し、該方法は以下のステップを含むことができる。
【0034】
ステップ201において、画像に対して正規化処理を行い、所定のサイズの画像を取得する。
【0035】
パターン認識において、一般的に複数の画像から特徴を抽出することが多い。
【0036】
画像に対する統一処理が便利であるように、画像に対して特徴抽出を行う前、まず端末により画像に対して正規化処理を行い、異なるサイズの画像を所定のサイズの画像に処理する。
【0037】
ステップ202において、画像を複数のセルを含む複数のブロックに区分する。
【0038】
好ましくは、端末が正規化処理後の画像を区分することは、画像を複数のブロックに区分し、各ブロックを複数のセルに区分することを含む。
【0039】
好ましくは、端末が正規化処理後の画像を区分することは、画像を複数のセルに区分し、接続されたセルを複数のセルを含む一つのブロックに組み合わせ、例えば、二つずつ隣接する四つの田字状に配列されたセルを一つのブロックに組み合わせることを含む。
【0040】
本実施例において、画像区分過程において、ブロックの区分とセルの区分の順序を詳しく限定せず、ブロックを区分してからセルを区分してもよく、セルを区分してからブロックに組み合わせてもよい。
【0041】
本実施例において、画像が区分されたブロックの間には重複領域が存在するか否かを詳しく限定せず、ブロックの間には重複領域が存在してもよく、存在しなくてもよい。
【0042】
例えば、図2Bに示すように、まず128画素*128画素の画像20を互いに重なっていない16画素*16画素のブロック21に区分し、さらに16画素*16画素の各ブロック21を8画素*8画素のセル22に区分する場合、画像には8個*8個=64個の互いに重なっていないブロック21が含まれ、各ブロックには2個*2個=4個のセルが含まれる。
【0043】
例えば、図2Cに示すように、まず128画素*128画素の画像20を重複領域が存在する16画素*16画素のブロック23に区分し、さらに16画素*16画素の各ブロック23を8画素*8画素のセル24に区分する場合、画像には16個*16個=256個の重複領域の存在するブロック23が含まれ、各ブロックには2個*2個=4個のセルが含まれる。
【0044】
ステップ203において、各セルに対してDCT変換を行う。
【0045】
画像における各セルについて、各セルの画素で配置される行列Aの大きさはM画素*N画素であると仮定する場合、行列AのDCT(Discrete Cosine Transformn、離散コサイン変換)変換係数は以下の式のとおりである。
【数1】
【0046】
pqは行列AのDCT係数であり、p=0、1、2…、M−1、m=0、1、2…、M−1、q=0、1、2…、N−1、n=0、1、2…、N−1。
【0047】
画像における各セルに対してDCT変換を行い、よって画像を空間領域から周波数領域に転換する。
【0048】
好ましくは、端末が各セルに対してDFT変換(Discrete Fourier Transform、離散フーリエ変換)を行う。
【0049】
画像における各セルについて、各セルの大きさはM画素*N画素であり、画素(x,y)で配置される関数はf(x,y)であると仮定する場合、関数f(x,y)のDFT係数F(u,v)は以下の式のとおりである。
【数2】
【0050】
u=0、1、2…、M−1、v=0、1、2…、N−1。
【0051】
端末が画像における各セルに対してDCT変換を行い、よって画像を空間領域から周波数領域に転換する。
【0052】
ステップ204において、周波数領域における各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得する。
【0053】
端末は勾配演算子を用いて、DCT変換又はDFT変換後の各セルにおける各画素の横方向勾配及び縦方向勾配を計算する。例示的に、一般的な勾配演算子は下記テーブル1に示すようである。
【表1】
【0054】
本実施例において、各セルにおける画素の勾配の大きさを計算する時、テーブル1におけるいずれかの勾配演算子を選択してもよく、他の勾配演算子を選択してもよく、本実施例において勾配演算子の選択を詳しく限定しない。
【0055】
画素 (x,y)の横方向勾配はH(x,y)であり、縦方向勾配はV(x,y)であると仮定する場合、各画素の勾配方向と勾配ゲインを下記の式(1)と式(2)で計算する。
【数3】

【数4】
【0056】
θ(x,y)は画素 (x,y)の勾配方向であり、m(x,y)は画素 (x,y)の勾配の大きさである。
【0057】
勾配方向θ(x,y)の値の範囲は−90度から90度までであり、勾配方向θ(x,y)をz個の部分に均等に区分し、各セルにおけるすべての画素に対して重み付けm(x,y)に従って勾配方向に区分された各部分を統計し、最後に各セルはz次元のベクトル、即ち、各セルに対応する記述子を取得する。
【0058】
例えば、勾配方向θ(x,y)を9部分に均等に区分し、各部分に対応する角度は20度であり、各セルにおけるすべての画素に対して重み付けm(x,y)に従って20度ごとに統計し、最後に各セルに対応して9次元のベクトルを取得する。
【0059】
本実施例において、勾配方向を何個の部分に区分するかを詳しく限定しない。
【0060】
ステップ205において、周波数領域における各ブロックの各記述子を統計し、各ブロックのHOG特徴を取得する。
【0061】
端末は各ブロックに含まれている各セルにおける計算により取得された記述子を統計し、各ブロックのHOG特徴を取得する。
【0062】
各セルにおける計算により取得された記述子を統計する時、端末は各セルに対応する記述子を直列接続し、各ブロックのHOG特徴が一つのベクトルであるようにして、該ベクトルの次元が該ブロックに含まれているセルに対応する記述子の次元のk倍である。
【0063】
例えば、各セルにおける記述子は9次元のベクトルであり、各ブロックに4個のセルが含まれる場合、4個のセルにおける9次元の記述子を直列接続し、36次元のベクトルを形成し、該36次元のベクトルを対応するブロックのHOG特徴とする。
【0064】
ステップ206において、画像の周波数領域における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得する。
【0065】
端末が各ブロックのHOG特徴を統計し、画像のHOG特徴を取得する。画像における各ブロックのHOG特徴を一つの列として一つの行列に直列接続し、画像のHOG特徴を取得する。
【0066】
例えば、図2Dに示すように、画像にはHOG特徴がKであるK個のブロックが含まれる場合、K個のHOG特徴を一つの行列25に直列接続し、Kを直列接続された行列の第1列26に置き、Kを直列接続された行列の第2列27に置き、これによって類推する。
【0067】
上に述べたように、本発明の実施例により提供される特徴抽出方法は、画像を複数のセルを含む複数のブロックに区分し、各セルに対してDCT変換又はDFT変換を行い、周波数領域における各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得し、周波数領域における各ブロックの各記述子を統計し、各ブロックのHOG特徴を取得し、画像の周波数領域における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得することにより、HOG特徴抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決する。周波数領域における画像のHOG特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させるという効果を達成している。
【0068】
図2Aに示すような好ましい実施例において、画像における各ブロックのHOG特徴を統計し画像のHOG特徴を取得する過程において、画像における対応する位置に従うように配列することができる。図3Aに示すように、ステップ206を下記ステップ206a及び206bで代替する。
【0069】
ステップ206aにおいて、画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整する。
【0070】
各ブロックのHOG特徴は各セルに対応する記述子を直列接続してL*1次元ベクトルを取得して、L*1次元ベクトルをM*Nの行列に調整するものであり、即ち、端末が各ブロックにおけるL*1次元ベクトルを含まれているセルに従って、各列が一つのセルの記述子である対応する行列に調整し、各セルの記述子を対応する画素に従って調整し、得られた調整後の行列の各列は対応するブロックにおける対応する列の画素に対応するHOG特徴である。
【0071】
ステップ206bにおいて、各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像のHOG特徴を取得する。
【0072】
各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像における画素位置に対応するHOG特徴を取得する。
【0073】
例えば、図3Bに示すように、画像にHOG特徴がKであるK個のブロックが含まれる場合、K個のHOG特徴をM*Nの行列に調整し、Kの調整後の行列31を画像における第1のブロック32の対応する位置に置き、Kの調整後の行列33を画像における第2のブロック34の対応する位置に置き、これによって類推し、行列MNを画像における最後のブロックMNの対応する位置に置く。
【0074】
上に述べたように、本実施例により提供される特徴抽出方法は、画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整し、各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像のHOG特徴を取得することにより、抽出後の画像のHOG特徴を画像における各ブロックの対応する位置に対応し、画像における各ブロックの特徴をより良く強調することができる。
【0075】
以下は本発明に関わる装置の実施例であり、本発明に関わる方法の実施例を実行するのに用いることができる。本発明に関わる装置の実施例に開示されていない詳細については、本発明に関わる方法の実施例を参照する。
【0076】
図4は一例示的な実施例により示された特徴抽出装置のブロック図であり、図4に示すように、該特徴抽出装置は、区分モジュール420と、転換モジュール440と、抽出モジュール460とを含むがそれに限定されない。
【0077】
前記区分モジュール420は、画像を複数のセルを含む複数のブロックに区分するように配置される。
【0078】
前記転換モジュール440は、各セルを空間領域から周波数領域に転換するように配置される。
【0079】
転換モジュール440は各セルに対して転換を行い、画像を空間領域から周波数領域に転換する。
【0080】
前記抽出モジュール460は、画像の周波数領域における勾配方向ヒストグラムHOG特徴を抽出するように配置される。
【0081】
上に述べたように、本発明の実施例により提供される特徴抽出装置は、画像を複数のセルを含む複数のブロックに区分し、各セルを空間領域から周波数領域に転換し、画像の周波数領域における勾配方向ヒストグラムHOG特徴を抽出することにより、HOG特徴抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決する。周波数領域における画像のHOG特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させるという効果を達成している。
【0082】
図5は別の一例示的な実施例により示された特徴抽出装置のブロック図であり、図5に示すように、該特徴抽出装置は、処理モジュール410と、区分モジュール420と、転換モジュール440と、前記抽出モジュール460とを含むがそれに限定されない。
【0083】
前記処理モジュール410は、画像に対して正規化処理を行い、所定のサイズの画像を取得するように配置される。
【0084】
パターン認識において、一般的に複数の画像から特徴を抽出することが多い。
【0085】
画像に対する統一処理が便利であるように、画像に対して特徴抽出を行う前、処理モジュール410は、画像に対して正規化処理を行い、異なるサイズの画像を所定のサイズの画像に処理する。
【0086】
前記区分モジュール420は、画像を複数のセルを含む複数のブロックに区分するように配置される。
【0087】
好ましくは、区分モジュール420が正規化処理後の画像を区分することは、画像を複数のブロックに区分し、各ブロックを複数のセルに区分することを含む。
【0088】
好ましくは、区分モジュール420が正規化処理後の画像を区分することは、画像を複数のセルに区分し、接続されたセルを複数のセルを含む一つのブロックに組み合わせ、例えば、二つずつ隣接する四つの田字状に配列されたセルを一つのブロックに組み合わせることを含む。
【0089】
本実施例において、区分モジュール420は画像区分過程において、ブロックの区分とセルの区分の順序を詳しく限定せず、ブロックを区分してからセルを区分してもよく、セルを区分してからブロックに組み合わせてもよい。
【0090】
本実施例において、区分モジュール420は画像が区分されたブロックの間には重複領域が存在するか否かを詳しく限定せず、ブロックの間には重複領域が存在してもよく、存在しなくてもよい。
【0091】
前記転換モジュール440は、各セルに対して離散コサイン変換DCTを行うように配置される。
【0092】
画像における各セルについて、各セルの画素で配置される行列Aの大きさはM画素*N画素であると仮定する場合、行列AのDCT(Discrete Cosine Transformn、離散コサイン変換)変換係数は以下の式のとおりである。
【数5】
【0093】
pqは行列AのDCT係数であり、p=0、1、2…、M−1、m=0、1、2…、M−1、q=0、1、2…、N−1、n=0、1、2…、N−1。
【0094】
転換モジュール440は画像における各セルに対してDCT変換を行い、よって画像を空間領域から周波数領域に転換する。
【0095】
好ましくは、転換モジュール440は、各セルに対してDFT変換(Discrete Fourier Transform、離散フーリエ変換)を行うように配置される。
【0096】
画像における各セルについて、各セルの大きさはM画素*N画素であり、配置される関数はf(x,y)であると仮定する場合、関数f(x,y)のDFT係数F(u,v)は以下の式のとおりである。
【数6】
【0097】
u=0、1、2…、M−1、v=0、1、2…、N−1、(x,y)は画素位置である。
【0098】
転換モジュール440は画像における各セルに対してDFT変換を行い、よって画像を空間領域から周波数領域に転換する。
【0099】
前記抽出モジュール460は、画像の周波数領域における勾配方向ヒストグラムHOG特徴を抽出するように配置される。
【0100】
本実施例において、抽出モジュール460は計算サブモジュール461と、第1統計サブモジュール462と、第2統計サブモジュール463を含むことができる。
【0101】
前記計算サブモジュール461は、周波数領域における各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得するように配置される。
【0102】
計算サブモジュール461は、勾配演算子を利用して、DCT変換又はDFT変換後の各セルにおける各画素の横方向勾配及び縦方向勾配を計算する。
【0103】
本実施例は勾配演算子の選択を詳しく限定しない。
【0104】
画素の横方向勾配はH(x,y)であり、縦方向勾配はV(x,y)であると仮定する場合、各画素の勾配方向と勾配ゲインを下記の式(1)と式(2)で計算する。
【数7】

【数8】
【0105】
θ(x,y)は画素 (x,y)の勾配方向であり、m(x,y)は画素 (x,y)の勾配の大きさである。
【0106】
勾配方向θ(x,y)の値の範囲は−90度から90度までであり、勾配方向θ(x,y)をz個の部分に均等に区分し、各セルにおけるすべての画素に対して重み付けm(x,y)に従って勾配方向に区分された各部分を統計し、最後に各セルは一つのz次元のベクトル、即ち、各セルに対応する記述子を取得する。
【0107】
本実施例において、勾配方向を何個の部分に区分するのを詳しく限定しない。
【0108】
前記第1統計サブモジュール462は、周波数領域における各ブロックの各記述子を統計し、各ブロックのHOG特徴を取得するように配置される。
【0109】
第1統計サブモジュール462は各ブロックに含まれている各セルにおける計算により取得された記述子を統計し、各ブロックのHOG特徴を取得する。
【0110】
各セルにおける計算により取得された記述子を統計する時、第1統計サブモジュール462は各セルに対応する記述子を直列接続し、各ブロックのHOG特徴を次元が一つのベクトルであるようにして、該ベクトルの次元が該ブロックに含まれたセルに対応する記述子の次元のk倍である。
【0111】
前記第2統計サブモジュール463は、画像の周波数領域における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得するように配置される。
【0112】
第2統計サブモジュール463が各ブロックのHOG特徴を統計し、画像のHOG特徴を取得する。
【0113】
好ましくは、第2統計サブモジュール463は、画像における各ブロックのHOG特徴を一つの列として一つの行列に直列接続し、画像のHOG特徴を取得するように配置される。
【0114】
上に述べたように、本発明の実施例により提供される特徴抽出装置は、画像を複数のセルを含む複数のブロックに区分し、各セルに対してDCT変換又はDFT変換を行い、周波数領域における各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得し、周波数領域における各ブロックの各記述子を統計し、各ブロックのHOG特徴を取得し、画像の周波数領域における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得することにより、HOG特徴抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決する。周波数領域における画像のHOG特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させるという効果を達成している。
【0115】
図5により示された好ましい実施例において、図6に示すように、第2統計サブモジュール463は調整サブモジュール610と、特徴抽出サブモジュール620とを含むことができる。
【0116】
前記調整サブモジュール610は、画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整するように配置される。
【0117】
各ブロックのHOG特徴は各セルに対応する記述子を直列接続しL*1次元ベクトルを取得して、調整サブモジュール610はL*1次元ベクトルをM*Nの行列に調整し、即ち、各ブロックにおけるL*1次元ベクトルを含まれているセルに従って各列が一つのセルの記述子である対応する行列に調整し、各セルの記述子を対応する画素従って調整し、得られた調整後行列の各列は対応するブロックにおける対応する列の画素に対応するHOG特徴である。
【0118】
前記特徴抽出サブモジュール620は、各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像のHOG特徴を取得するように配置される。
【0119】
特徴抽出サブモジュール620は各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像における画素位置に対応するHOG特徴を取得する。
【0120】
上に述べたように、本実施例により提供される特徴抽出装置は、画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整することにより、各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像のHOG特徴を取得し、抽出後の画像のHOG特徴を画像における各ブロックの対応する位置に対応し、画像における各ブロックの特徴をより良く強調することができる。
【0121】
上記実施例における装置について、各モジュールの操作を実行する具体的な形態は、すでに該方法に関する実施例において詳しく説明されたため、ここで詳細な説明を省略する。
【0122】
本発明の一例示的な実施例は特徴抽出装置を提供し、本発明により提供される特徴抽出方法を実現することができ、該特徴抽出装置は、画像を複数のセルを含む複数のブロックに区分し、各セルを空間領域から周波数領域に転換し、画像の周波数領域における勾配方向ヒストグラムHOG特徴を抽出するように配置された、プロセッサと、プロセッサの実行可能なコマンドを記憶するメモリと、を含む。
【0123】
図7は一例示的な実施例により示された特徴抽出装置のブロック図である。例えば、装置700は、携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信装置、ゲームコンソール、タブレット型装置、医療機器、フィットネス装置、パーソナルデジタルアシスタントなどであってもよい。
【0124】
図11に示すように、装置700は、処理部1102、メモリ1104、電源部1106、マルチメディア部1108、音声部1110、入力/出力(I/O)のインターフェース1112、センサ部1114、及び通信部1116のうちの一つ又は複数の部材を含むことができる。
【0125】
処理部702は、一般的に装置700の全体的操作、例えば、表示、電話呼び出し、データ通信、カメラ操作及び記録操作に関する操作を制御する。処理部702は、上記方法の全部又は一部のステップを完成するために、一つ又は複数のプロセッサ720を含んでコマンドを実行してもよい。さらに、処理部702は、その他のモジュールとのインタラクションを便利にするように、一つ又は複数のモジュールを含んでもよい。例えば、処理部702は、マルチメディア部708と処理部702とのインタラクションを便利にするように、マルチメディアモジュールを含んでもよい。
【0126】
メモリ704は、装置700の操作をサポートするために、様々な種類のデータを記憶するように配置される。これらのデータの実例は、装置700において操作される如何なるアプリケーション又は方法のコマンド、連絡先データ、電話帳データ、メッセージ、画像、ビデオなどを含む。メモリ704は、如何なる種類の揮発性又は不揮発性メモリ又はそれらの組合せ、例えば、スタティックランダムアクセスメモリ(SRAM)、電気的消去可能なプログラマブル読み取り専用メモリ(EEPROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM)、プログラマブル読み取り専用メモリ(PROM)、読み取り専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスク又は光ディスクにより実現することができる。
【0127】
電源部706は、装置700の様々な部材のために電力を供給する。電源部706は、電源管理システム、一つ又は複数の電源、及びその他の装置700のための電力の生成、管理及び供給に関連する部材を含むことができる。
【0128】
マルチメディア部708は、前記装置700とユーザーの間の一つの出力インターフェースを提供するスクリーンを含む。一部の実施例において、スクリーンは液晶ディスプレイ(LCD)とタッチパネル(TP)を含んでもよい。スクリーンにタッチパネルが含まれる場合、スクリーンはユーザーからの入力信号を受信するために、タッチスクリーンに実現されることができる。タッチパネルは、タッチ、スワイプ及びタッチパネルにおけるジェスチャーを感知するために、一つ又は複数のタッチセンサを含む。前記タッチセンサは、タッチ又はスワイプ動作の境界を感知するとともに、前記タッチ又はスワイプ動作に関わる持続時間及び圧力を検出することができる。一部の実施例において、マルチメディア部708は、フロントカメラ及び/又はバックカメラを含む。装置700が操作モードである場合、例えば、撮影モード又はビデオモードである場合、フロントカメラ及び/又はバックカメラは外部のマルチメディアデータを受信することができる。各フロントカメラ及びバックカメラは、固定された光学レンズシステムであってもよく、又は焦点距離と光学ズーム能力を有する。
【0129】
音声部710は、音声信号を出力及び/又は入力するように配置される。例えば、音声部710は、マイクロホン(MIC)を含み、装置700が操作モードである場合、例えば、呼び出しモード、記録モード及び音声認識モードである場合、マイクロホンは外部の音声信号を受信するように配置される。受信された音声信号は、さらにメモリ704に記憶され、又は通信部716を介して送信される。一部の実施例において、音声部710は、さらに音声信号を出力するスピーカーを含む。
【0130】
I/Oインターフェース712は、処理部702と周辺インターフェース部との間にインターフェースを提供し、上記周辺インターフェース部は、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンは、ホームボタン、ボリュームボタン、スタートボタン及びホールドボタンを含むことができるが、それに限定されない。
【0131】
センサ部714は、一つ又は複数のセンサを含み、装置700に各方面の状態評価を提供するためである。例えば、センサ部714は、装置700のオン/オフ状態、部材の相対的位置決めを検出することができ、例えば、前記部材が装置700のディスプレイ及びキーパッドであり、センサ部714は、さらに装置700又は装置700の一つの部材の位置変化、ユーザーと装置700との接触の有無、装置700の方角又は加速/減速及び装置700の温度変化を検出することができる。センサ部714は、近接センサを含むことができ、如何なる物理的接触がない時、近傍物体の存在を検出するように配置される。センサ部714は、さらに光学センサ、例えば、CMOS又はCCDイメージセンサを含むことができ、イメージングアプリケーションに用いられる。一部の実施例において、該センサ部714は、さらに加速度センサ、ジャイロセンサ、磁気センサ、圧力センサ又は温度センサを含むことができる。
【0132】
通信部716は、装置700とその他の装置との有線又は無線方式による通信を便利にするように配置される。装置700は、通信標準に基づく無線ネットワーク、例えば、Wi−Fi、2G又は3G、又はそれらの組み合わせにアクセスすることができる。一例示的な実施例において、通信部716は、放送チャネルを介して外部放送管理システムからの放送信号又は放送関連情報を受信する。一例示的な実施例において、通信部716は、狭域通信を促進するために、さらに近距離無線通信(NFC)モジュールを含む。例えば、NFCモジュールにおいて、無線周波数認識(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(BT)及びその他の技術に基づいて実現することができる。
【0133】
例示的な実施例において、装置700は、一つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理装置(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサ又はその他の電子部品により実現することができ、上記特徴抽出方法を実行するのに用いられる。
【0134】
例示的な実施例において、さらに、コマンドを含む非一時的コンピュータ可読記憶媒体、例えば、コマンドを含むメモリ704を提供し、上記方法を完成するために、上記コマンドは装置700のプロセッサ720により実行することができる。例えば、前記非一時的なコンピュータ可読記憶媒体は、ROM、ランダムアクセスメモリ(RAM)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク及び光データ記憶装置などであってもよい。
【0135】
当業者であれば、明細書を考慮しここに開示された発明を実践した後、本発明のその他の実施様態を容易に想到できる。本発明は、本発明の如何なる変形、用途又は適応的変化を含むためのものであり、これらの変形、用途又は適応的変化は本発明の一般的な原理に準じ、本発明の開示されていない当該技術分野における一般的知識又は慣用の技術手段を含む。明細書と実施例は例示的なものに過ぎず、本発明の実際の範囲と精神は下記特許請求の範囲により与えられる。
【0136】
理解すべきことは、本発明は既に上記のように説明され、図面に示された正確な構造に限定されず、その範囲を逸脱しない限りにおいて様々な修正や変更を行うことができる。本発明の範囲は特許請求の範囲のみにより限定される。
図1
図2A
図2B
図2C
図2D
図3A
図3B
図4
図5
図6
図7