IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機株式会社の特許一覧

<>
  • 特許-画像検索装置 図1
  • 特許-画像検索装置 図2
  • 特許-画像検索装置 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-04-04
(45)【発行日】2025-04-14
(54)【発明の名称】画像検索装置
(51)【国際特許分類】
   G06F 16/51 20190101AFI20250407BHJP
   G06T 7/00 20170101ALI20250407BHJP
【FI】
G06F16/51
G06T7/00 300F
【請求項の数】 5
(21)【出願番号】P 2024546257
(86)(22)【出願日】2022-10-14
(65)【公表番号】
(43)【公表日】2025-01-30
(86)【国際出願番号】 JP2022038291
(87)【国際公開番号】W WO2024079864
(87)【国際公開日】2024-04-18
【審査請求日】2024-08-05
【早期審査対象出願】
(73)【特許権者】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】110003166
【氏名又は名称】弁理士法人山王内外特許事務所
(72)【発明者】
【氏名】李 庭育
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】特開2013-069149(JP,A)
【文献】特開2015-064751(JP,A)
【文献】国際公開第2014/167880(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06T 1/00- 7/90
(57)【特許請求の範囲】
【請求項1】
行列演算器及び射影変換部を含む特徴量低減処理回路と、
第二射影変換部及び探索実行部を含む検索処理回路と、を備え、
前記行列演算器は、格納されたデータ(Xd-1)に基づいて、特徴量を低減する行列(C)を演算し、
前記射影変換部は、逐次的に取得する画像特徴量であるf(i=1,2,…,m)に対し、前記行列演算器により算出される行列(C)を乗算し、
前記第二射影変換部は、入力された検索対象の画像特徴量(ftarget)について、低次元化画像特徴量(gtarget_x)を算出し、
前記探索実行部は、特徴量空間において、前記射影変換部により算出され時間窓ごとに分けられたベクトルと前記低次元化画像特徴量(gtarget_x)との距離を計算し、もっともらしい画像特徴量の検索を実施する
画像検索装置。
【請求項2】
前記行列演算器により算出される行列(C)は、
格納された前記データ(Xd-1)を特異値分解して得られる特異ベクトルからなる行列である、
請求項1に記載の画像検索装置。
【請求項3】
前記行列演算器により算出される行列(C)は、
格納された前記データ(Xd-1)を特異値分解し、低次元化して得られる近似の特異ベクトルからなる行列である、
請求項1に記載の画像検索装置。
【請求項4】
格納された前記データは、隣接する直近の過去の時間窓において撮影された画像に関するものである、
請求項1から3のいずれか1項に記載の画像検索装置。
【請求項5】
格納された前記データは、経験上、画像データの特徴が類似すると予測できる過去の時間窓において撮影された画像に関するものである、
請求項1から3のいずれか1項に記載の画像検索装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示技術は、画像検索装置に関する。
【背景技術】
【0002】
画像検索の技術分野において、主成分分析、判別分析等の既知の統計解析の結果から得られる行列を用いて、画像特徴量を、高速検索に適するよう、次元削減する技術が知られている。ここで、画像特徴量とは、機械学習の技術分野において用いられる概念であり、画像に対して生成される、特徴量空間におけるベクトル量である。画像特徴量は、その名前が示すとおり、画像の特徴を表している。
【0003】
例えば、特許文献1には、第一の線形変換パラメータを統計解析の結果から得られる行列とし、第一の線形変換パラメータにより画像特徴量を変換することによって、分類問題を容易化する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】国際公開第 2014/167880号
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に例示される画像検索装置は、空港等の施設において、防犯カメラで撮影された動画像から、迷子又は不審者を見つけ出すシステムとして応用することが考えられる。本明細書において、空港等の施設において、防犯カメラで撮影された動画像から、迷子又は不審者を見つけ出すシステムは、「クエリシステム」と称されるものとする。
【0006】
本開示技術の発明者は、特許文献1に例示される画像検索装置をクエリシステムに適用すると、同一の防犯カメラから得られる画像であるにもかかわらず、例えば1日単位の時間窓で見た場合に、次元削減に用いるのに適した行列がゆるやかにではあるが変化してしまう、という課題を見出した。
本開示技術は、次元削減に用いるのに適した行列がゆるやかにではあるが変化してしまう、という課題を克服する画像検索装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本開示技術に係る画像検索装置は、行列演算器及び射影変換部を含む特徴量低減処理回路と、第二射影変換部及び探索実行部を含む検索処理回路と、を備え、行列演算器は、格納されたデータ(Xd-1)に基づいて、特徴量を低減する行列(C)を演算し、射影変換部は、逐次的に取得する画像特徴量であるf(i=1,2,…,m)に対し、行列演算器により算出される行列(C)を乗算し、第二射影変換部は、入力された検索対象の画像特徴量(ftarget)について、低次元化画像特徴量(gtarget_x)を算出し、探索実行部は、特徴量空間において、射影変換部により算出され時間窓ごとに分けられたベクトルと低次元化画像特徴量(gtarget_x)との距離を計算し、もっともらしい画像特徴量の検索を実施する、というものである。
【発明の効果】
【0008】
本開示技術に係る画像検索装置は上記構成を備えるため、次元削減に用いるのに適した行列がゆるやかにではあるが変化してしまう、という課題を克服できる。
【図面の簡単な説明】
【0009】
図1図1は、本開示技術に係る特徴量低減処理回路100の機能構成を示すブロック図である。
図2図2は、本開示技術に係る特徴量低減処理回路100の処理を時系列で表したタイムチャートである。
図3図3は、本開示技術に係る検索処理回路200の機能構成を示すブロック図である。
【発明を実施するための形態】
【0010】
本開示技術が前提としてる画像特徴量は、前述のとおり、機械学習の技術分野において用いられる概念であり、画像に対して生成される、特徴量空間におけるベクトル量である。本開示技術は、画像特徴量がどのような学習モデルにより生成されたベクトル量であるかという事項で限定されない。ただし、画像特徴量は、例えば、学習モデルをCNN(Convolutional Neural Network)としたときの中間生成物だ、と考えると理解が容易である。CNNは、特に画像解析の技術分野において有効な手段と認識されている人工ニューラルネットワークの一種である。
【0011】
実施の形態1.
本開示技術に係る画像検索装置は、特徴量低減処理回路100と、検索処理回路200と、を含む。
特徴量低減処理回路100は、画像特徴量を取得し、次元低減といった特徴量低減の処理を実施する処理回路である。
検索処理回路200は、検索対象の画像特徴量が入力されたときに、タイムスパン(以降、「時間窓」と称する)ごとに分けられたデータベースから、もっともらしい画像特徴量の検索を実施する処理回路である。
【0012】
図1は、本開示技術に係る特徴量低減処理回路100の機能構成を示すブロック図である。図1に示されるとおり、特徴量低減処理回路100は、データ格納部110と、行列演算器120と、射影変換部130と、を含む。
【0013】
図2は、本開示技術に係る特徴量低減処理回路100の処理を時系列で表したタイムチャートである。図2において、ST110と示された部分は、データ格納部110による処理が実施されるタイミングを表している。同様に、ST120と示された部分は、行列演算器120による処理が実施されるタイミングを表している。同様に、ST130と示された部分は、射影変換部130による処理が実施されるタイミングを表している。
【0014】
《特徴量低減処理回路100を構成するデータ格納部110》
特徴量低減処理回路100を構成するデータ格納部110は、逐次的に取得する画像特徴量を、データとして格納する構成要素である。逐次的に取得する画像特徴量をf(i=1,2,…,m)としたときに、格納するデータ(X)は、以下の数式で与えられる。


数式(1)に示されるように、逐次的に取得する画像特徴量(f)は、サイズが1×nの実ベクトルである。本明細書において画像特徴量(f)は、横ベクトルとして定義される。数式(1)に示されるように、画像特徴量は、実数を成分とする実ベクトルであることが一般的であるが、複素数を成分とする複素ベクトルに定義を拡張することもできる。
或る時間窓、例えば、d-1番目の時間窓、で逐次的に取得される画像特徴量(f)の総数をmとしたときに、データ格納部110に格納されるデータ(X)は、サイズがm×nの行列となる。数式(1)において、データ(X)は実行列として示されているが、画像特徴量の定義を複素ベクトルまで拡張した場合、データ(X)は複素行列となる。
本明細書において、データ格納部110に格納されるデータは、例えばd-1番目の時間窓に係るデータであることを強調する場合、右下添え字の態様でd-1を付加し、「Xd-1」と表されるものとする。
【0015】
《特徴量低減処理回路100を構成する行列演算器120》
特徴量低減処理回路100を構成する行列演算器120は、データ格納部110に格納されたデータ(Xd-1)に基づいて、特徴量を低減する行列(C)を演算する構成要素である。図2に示されるとおり、行列演算器120で算出される行列(C)は、d番目の時間窓に係る時刻において、取得される画像特徴量(f)の特徴量を、逐次的に低減する演算処理に用いられる。本開示技術に係る画像検索装置の技術的特徴は、d-1番目の時間窓に係るデータ(Xd-1)を用いて算出した行列(C)を、d番目の時間窓に係る演算処理に用いる点にある。
ここで、特徴量を低減する行列として用いられる文字の「C」におけるCは、Compressionの頭文字のCに由来する。
【0016】
行列演算器120で算出される行列(C)は、例えば、特許文献1に示されているように、主成分分析、判別分析等の既知の統計解析の結果から得られる行列であってよい。行列演算器120で算出される行列(C)は、具体例を挙げれば、特異値分解に基づいて得られる行列であってもよい。d-1番目の時間窓に係るデータ(Xd-1)の特異値分解が、以下の数式に示されるように与えられたとする。


数式(2)登場するUは、左特異ベクトル{u},i=1,2,…,rを列とする行列である。また、数式(2)に登場するVは、右特異ベクトル{v},i=1,2,…,rを列とする行列である。右上添え字のTは、転置を表す。数式(2)右辺に登場するSは、大きい順に特異値が並べられた対角行列である。
ここで、d-1番目の時間窓に係るデータ(Xd-1)の行の総数であるm、すなわち取得された画像特徴量(f)の数(m)は、列の総数であるn、すなわち画像特徴量(f)の要素数(n)よりも大きいと仮定する。数式(2)に登場する右下添え字のrは、rankの頭文字であり、Xd-1のrankを表している。Xd-1が列フルランクである場合、rはnと等しい。Xd-1のrankがrであるということは、d-1番目の時間窓において取得された画像特徴量であるベクトル(f,f,…f)が張る特徴量空間の次元がrであることと等しい。
【0017】
特異ベクトルから構成される行列のU及びVは、以下の性質を有する。


ただし、数式(3)の右辺に登場するI(r)は、サイズがr×rの単位行列である。
【0018】
d-1がゼロ行列でない場合、数式(2)に示された特異値分解の結果及び数式(3)の性質を用いて、Xd-1の一般逆行列を定義できる。Moore―Penrose typeの一般逆行列の定義に従えば、Xd-1の一般逆行列は、以下の数式により与えられる。


d-1が正則行列であれば、数式(4)で与えられる一般逆行列は、Xd-1の逆行列に一致する。
【0019】
行列であるXd-1のm本の行ベクトル(f,f,…f)が張るRの部分空間は、Xd-1の行空間(Row Domain)と称される。右特異ベクトル{v},i=1,2,…,rを転置したものは、行空間の正規直交基底を作る。
本開示技術に係る画像検索装置の一態様は、この行空間への射影行列を算出し、クエリシステムへ応用するものである。行空間への射影行列(P)は、以下の数式により与えられる。


数式(5)に示されるPは、サイズがn×nであり、ランクがrの射影行列である。ここで、数式(5)の右辺に示されるVVは、数式(3)に示されるVVとは異なることに留意されたい。
クエリシステムにおいて、クエリ対象の画像に関する画像特徴量(ftarget)が与えられたときに右から射影行列(P)を乗算すれば、画像特徴量(ftarget)を部分空間である行空間へ射影でき、探索の範囲を行空間に限定できる。なお、射影行列を表す文字のPは、Projectionの頭文字に由来する。
【0020】
数式(2)の両辺に右からVを乗算すると、数式(3)の性質から、数式(2)は以下のように変形できる。


ここで、g,g,…gは、低次元化された画像特徴量(以降、「低次元化画像特徴量」と称する)である。
数式(6)は、或る行ベクトル(f)が行空間に属せば、すなわちf,f,…fの線形結合で表すことができれば、その行ベクトル(f)の右からVを乗算して得られた行ベクトルが、g,g,…gの線形結合で表せることを示している。


ここで、g,g,…gはいずれもサイズが1×rの行ベクトルである。すなわち、g,g,…gの線形結合で表せるfVも、サイズが1×rの行ベクトルである。数式(7)に登場するa,a,…aは、それぞれ係数である。
【0021】
別の或る行ベクトル(f)が与えられ、fとは異なり、fは行空間に属さないとする。行空間に属していないfに対しては、まず、数式(5)で与えられる射影行列(P)を右から乗算し、行空間に射影した後に、右からVを乗算する試みが考えられる。fは、行空間に属する行ベクトルであるから、fとおける。この試みの結果は、以下の数式により与えられる。


結局のところ、行空間に属さないfに対しても、右から単にVを乗算すれば、乗算により得られた行ベクトル(fV)は、必ずg,g,…gの線形結合で表せる(数式(8)参照)。
【0022】
以上のように行列演算器120により算出される行列(C)は、特異ベクトルからなる行列であるVとしてもよい。なお、Xd-1が列フルランクであり、rがnと等しい場合、画像特徴量(f)に対してVを右から乗算しても、ベクトルのサイズは1×nのまま変わらない。このような場合には、特異値分解の結果、0と近似できる特異値を0とおき、近似により次元低減をする手法が考えられる。0と近似できる特異値を0とおく手法の詳細は、実施の形態2により明らかとなる。
【0023】
《特徴量低減処理回路100を構成する射影変換部130》
特徴量低減処理回路100を構成する射影変換部130は、逐次的に取得する画像特徴量であるf(i=1,2,…,m)に対し、行列演算器120により算出される行列(C)を乗算する構成要素である。本明細書において画像特徴量(f)は、横ベクトルとして定義されているため、射影変換部130における行列(C)の乗算は、画像特徴量(f)に対して右からの乗算(f)である。CをVとして考えれば、Cのサイズはn×r(r<n)である。このように射影変換部130は、画像特徴量(f)を低次元化画像特徴量(g)に変換する役割を担う構成要素である。
低次元化画像特徴量(g)は、数式(6)において、特異ベクトルからなる行列であるVを用いて算出されることが示されているが、本開示技術はこれに限定されない。本開示技術において、射影変換部130がVとは異なる行列(Cd、≠V)を用いる場合にも、低次元化された画像特徴量を低次元化画像特徴量とし、gで表されるものとする。
【0024】
図1に示されるように、射影変換部130により生成された低次元化画像特徴量(g)は、時間窓ごとのデータベースとして、画像検索装置がアクセス可能な記憶装置に格納される。また、射影変換部130が乗算に用いる行列(C)は、画像検索装置の検索処理回路200においても用いられるため、特徴量低減処理回路100と検索処理回路200とで共有される。
【0025】
図3は、本開示技術に係る検索処理回路200の機能構成を示すブロック図である。画像検索装置の特徴量低減処理回路100が、画像データを蓄積するフェーズにおいて用いられる構成要素であるのに対し、画像検索装置の検索処理回路200は、画像を検索するフェーズにおいて用いられる構成要素である。本開示技術に係る画像検索装置の処理内容を説明する上で、「画像データを蓄積するフェーズ」及び「画像を検索するフェーズ」と別々に定義されているが、画像検索装置が実用される場面において、両フェーズは同時に進行し得る。すなわち、特徴量低減処理回路100により画像データが蓄積されていることと並行して、検索処理回路200により画像が検索される、ということがあり得る。
図3に示されているftargetは、検索対象の画像に関する画像特徴量を表している。画像検索装置がクエリシステムの場合、ftargetは、クエリ対象の画像に関する画像特徴量である。
【0026】
図3に示されるとおり、検索処理回路200は、第二射影変換部210(210-0,210-1,…,210-x,…)と、探索実行部220(220-0,220-1,…,220-x,…)と、を含む。図3に示されるとおり、符号に「-0」と付された機能ブロックは、d番目の時間窓に係るデータベースを扱う機能ブロックである。同様にして、符号に「-1」と付された機能ブロックは、d-1番目の時間窓に係るデータベースを扱う機能ブロックである。また、一般化した表現として、符号に「-x」と付された機能ブロックが、d-x番目の時間窓に係るデータベースを扱う機能ブロックであることを表すものとする。画像検索装置の検索処理回路200がどの時間領域に係るデータベースまでを検索の対象とするかは、画像検索装置の設計事項であり、画像検索装置の使用目的及び仕様に基づいて決められるとよい。
【0027】
《検索処理回路200を構成する第二射影変換部210》
検索処理回路200を構成する第二射影変換部210は、入力されたftargetについて、低次元化画像特徴量を算出する構成要素である。検索処理回路200における第二射影変換部210は、特徴量低減処理回路100における射影変換部130に対応した構成要素である、と言える。前述のとおり、射影変換部130が乗算に用いる行列(C,Cd-1,Cd-2,…,Cd-x,…)は、検索処理回路200において共有されているが、具体的には、検索処理回路200の第二射影変換部210において共有されている。
第二射影変換部210において算出される低次元化画像特徴量(gtarget_x)は、以下の数式により与えられる。


射影変換部130が乗算に用いる行列(C,Cd-1,Cd-2,…,Cd-x,…)が特異ベクトルからなるVであるときは、第二射影変換部210が乗算に用いる(C,Cd-1,Cd-2,…,Cd-x,…)も、特異ベクトルからなるVである。
【0028】
《検索処理回路200を構成する探索実行部220》
検索処理回路200を構成する探索実行部220は、第二射影変換部210において算出される低次元化画像特徴量(gtarget_x)に基づいて、時間窓ごとに分けられたデータベースから、もっともらしい画像特徴量を探索する構成要素である。なお、ここで用いられる「探索」の用語は、コンピュータの技術分野で用いられるものと同じであり、希望するデータを取り出す処理、又は格納されている場所を決定する処理、を意味するものである。
探索実行部220は、具体的には、特徴量空間における距離を算出し、算出された距離の大きさに基づいて、もっともらしい画像特徴量を抽出する。探索実行部220が算出する距離は、ユークリッド距離、マハラノビス距離、Bhattacharyya距離、等の、類似性を評価する指標として用いられる距離である。
【0029】
数式(2)及び数式(6)に示されるように、特異値が大きい順に並べられた特異値分解を用いると、低次元化画像特徴量(gtarget_x)は、最も主要な要素が第一成分に、次に主要な要素が第二成分になるように(以下同様)、生成される。したがって、検索処理回路200を構成する探索実行部220は、例えば、第一成分のみを使って、又は第一成分から第k成分(kは2以上、かつr未満の自然数)までのみを使って、距離を計算し、もっともらしい画像特徴量の候補を抽出してもよい。あるいは、検索処理回路200を構成する探索実行部220は、例えば、第一成分のみを使って、又は第一成分から第k成分までのみを使って距離を計算し、探索の対象とすべきものと探索の対象から外すべきものとを分けるフィルタリングを実施してもよい。
第一成分から第k成分までのみを使って距離を計算する着想は、特異値分解において0と近似できる特異値を0とおき近似する低次元化の手法と共通する。前述のとおり、特異値分解において0と近似できる特異値を0とおき近似する低次元化の手法は、実施の形態2において明らかとなる。
【0030】
探索実行部220が行う探索は、検索対象の低次元化画像特徴量(gtarget_x)とデータベース化された低次元化画像特徴量(g)との間の距離を算出することにより行うが、すべての低次元化画像特徴量(g)についてまで距離を計算する必要はない。
探索実行部220が行う探索は、例えば、検索対象の低次元化画像特徴量(gtarget_x)の各成分の値と、時間窓ごとに分けられたデータベース化された低次元化画像特徴量(g)の各成分の値と、をそれぞれ二進法で表すとよい。二進法で表すことは、探索の候補を絞る作業(フィルタリングと称される)に役立つ。具体的に言えば、探索実行部220が行う探索は、二進法で表された2つのデータに対して、上位ビットから順に、一致するか否かを確認する。検索対象の低次元化画像特徴量(gtarget_x)の第一成分と、着目している或る低次元化画像特徴量(g)の第一成分と、を比較したとき、それぞれの最上位ビットが一致していなければ、距離が最短なペアである可能性は低い。このように、最上位ビットすら一致していないデータは、探索の候補から外すことが考えられる。最上位ビットによるフィルタリングの次は、2番目に上位のビットで同様のフィルタリングを行う。この探索手法は、二分法と称される探索手法と発想が類似している。
なお、2つのデータに対して、上位桁から順に一致するか否かを確認する手法は、二進法で表されたものに限定されない。一般のN進法で表されている2つのデータに対して、上位桁から順に一致するか否かを確認する方法も、探索におけるフィルタリングとして考えられる。
【0031】
探索実行部220が行う探索の処理は、前述のとおり、特徴量低減処理回路100により画像データが蓄積されていることと並行して実施される。例えば、現時刻がd番目の時間窓に属する場合、特徴量低減処理回路100により画像データがd番目のデータベースに蓄積されることと並行して、探索実行部220がd番目のデータベースの探索を実施することが考えられる。
図2が示すように、d番目の時間窓に係るデータベースのデータに基づいて行列演算器120が行列を演算する処理(ST120)は、d番目の時間窓において、データ格納部110が全ての画像特徴量を取得する(ST110)処理の後である。したがって、従来の考え方に従えば、画像検索装置は、データ格納部110が画像特徴量を取得する処理(ST110)を全て完了した後でなければ、射影変換部130による射影変換処理(ST130)を実施できない。すなわち、従来の考え方に従えば、特徴量低減処理回路100により画像データがd番目のデータベースに蓄積されることと並行して、探索実行部220がd番目のデータベースの探索を実施することもできない。
固定されたひとつの行列(C)を用いて、低次元化画像特徴量を生成する、ということも考えられる。しかし、前述のとおり、同一の防犯カメラから得られる画像であるにもかかわらず、例えば1日単位の時間窓で見た場合に、次元削減に用いるのに適した行列は変化してしまう。すなわち、時間が経過するにつれて、固定されたひとつの行列(C)による低次元化は、クエリシステムに適さなくなる。
【0032】
実施の形態1に係る画像検索装置の優れた効果のひとつは、データ格納部110が画像特徴量を取得する処理(ST110)の全てを完了する前であっても、射影変換部130が、逐次的に射影変換処理(ST130)を実施できる点にある。
実施の形態1に係る画像検索装置の他の優れた効果は、特徴量低減処理回路100により画像データがd番目のデータベースに蓄積されることと並行して、探索実行部220がd番目のデータベースの探索を実施することができる点にある。
総括的に言えば、実施の形態1に係る画像検索装置の優れた効果は、「次元削減に適した行列が変化する」という課題を克服し、異なる時間領域に係る複数のデータベースを対象とした高速検索を実施できる点にある。
これらの効果は、例えば1日単位という時間窓を設定した場合、次元削減に用いるのに適した行列の変化がゆるやかである、という性質を積極的に利用したことにより得られるものである。
変化がゆるやかであるという性質に着目し、実施の形態1に係る画像検索装置は、d-1番目の時間窓に係るデータ(Xd-1)を用いて算出した行列(C)を、d番目の時間窓に係る演算処理に用いる。この技術的特徴により、実施の形態1に係る画像検索装置は、上記の優れた効果を奏する。
【0033】
実施の形態2.
実施の形態2に係る画像検索装置は、本開示技術に係る画像検索装置の変形例である。実施の形態2に係る画像検索装置は、機能構成という観点から言えば、実施の形態1に係る画像検索装置と同じである。したがって、特に明記する場合を除き、実施の形態2において、実施の形態1で用いられた符号と同じものが使用される。また、実施の形態2において、実施の形態1と重複する説明は、適宜、省略される。
【0034】
実施の形態2に係る画像検索装置は、行列演算器120により算出される行列を具体化した態様のものである、と言える。実施の形態2に係る画像検索装置は、行列演算器120により算出される行列が、特異値分解において0と近似できる特異値を0とおく近似により次元低減をする手法に基づく、というものである。
【0035】
数式(2)に示される特異値分解は、以下の数式で与えられる近似式が成り立つ。


数式(10)の右辺は、大きい順から数えて、k+1番目からr番目の特異値を、0(ゼロ)と置き換えたものである。数式(10)右辺における対角行列は、Sにチルダのアクセント記号を付して表し、数式(10)左辺における対角行列(S)に類似していることを表している。数式(10)は、「0と近似できる特異値を0とおく近似」を表している。
数式(10)に示されるとおり、kは、ランクを示すrよりも小さい正の整数である。
【0036】
数式(10)の右辺は、以下の数式で示されるように変形できる。


ここで、数式(11)の右辺に登場する右下添え字のtruncは、truncationを由来とする。Utruncは、サイズがm×kの行列である。Struncは、サイズがk×kの対角行列である。Vtruncは、サイズがn×kの行列である。
【0037】
実施の形態2に係る画像検索装置は、数式(11)に係るVtruncを、行列演算器120により算出される行列とする。したがって、実施の形態2に係る画像検索装置において、特徴量低減処理回路100を構成する射影変換部130、及び検索処理回路200を構成する第二射影変換部210は、それぞれ、Vtruncを用いて射影変換を実施する。
truncを行列演算器120により算出される行列とする効果は、実施の形態1において開示された、低次元化画像特徴量(gtarget_x)の第一成分から第k成分までのみを使う効果と、同じである。
【0038】
実施の形態2に係る画像検索装置に特有の作用効果は、Xd-1が列フルランクでありrがnと等しい場合であっても、検索対象の画像に関する画像特徴量(ftarget)の次元をnからkへ低減する射影行列を生成できる、というものである。
この作用効果により、実施の形態2に係る画像検索装置は、実施の形態1に係る画像検索装置と同様に、「次元削減に適した行列が変化する」という課題を克服し、異なる時間領域に係る複数のデータベースを対象とした高速検索を実施できる。
【0039】
実施の形態3.
実施の形態3に係る画像検索装置は、本開示技術に係る画像検索装置の変形例である。特に明記する場合を除き、実施の形態3において、既出の実施の形態で用いられた符号と同じものが使用される。また、実施の形態3において、既出の実施の形態と重複する説明は、適宜、省略される。
【0040】
前述のとおり、実施の形態1及び2に係る画像検索装置の技術的特徴は、d-1番目の時間窓に係るデータ(Xd-1)を用いて算出した行列(C)を、d番目の時間窓に係る演算処理に用いる点にあった。このように、実施の形態1及び2に係る画像検索装置においては、時間軸でみたときに、隣接する直近の過去であるd-1番目の時間窓に係るデータ(Xd-1)が用いられている。
実施の形態3に係る画像検索装置は、「隣接する直近の過去」という部分を、「経験上、画像データの特徴が類似すると予測できる過去」に、一般化する。逆の言い方をすれば、1日単位の時間窓で見た場合に、隣接する直近の過去は、「経験上、画像データの特徴が類似すると予測できる過去」の具体例である。技術的に言っても、「隣接する直近の過去」であることは本質的なことではなく、「経験上、画像データの特徴が類似すると予測できる」ことが重要である。
【0041】
画像検索装置が用いるデータは、1日単位とは異なる、例えば、0時から6時、6時から12時、12時から18時、18時から24時、といった6時間単位の時間窓でのデータベース化が要求される場合がある。現時刻が「12時から18時」の時間窓に含まれているとする。このときに、経験上、この時間窓に係る画像データの特徴が、昨日の「12時から18時」のものと類似するとわかっていれば、実施の形態3に係る画像検索装置は、昨日の「12時から18時」に係るデータを用いて行列(C)を算出すればよい。
このように、人間に係る画像データの特徴は、人間の生活行動にあわせて周期的に変化することがある。
【0042】
画像データの特徴が変化する周期は、1日を単位としたもの、1週間を単位としたもの、1年を単位としたもの、等さまざまである。
例えば、平日と週末とでは、画像データの特徴が異なることがある。現時刻が、日曜日の時間窓に含まれているとする。このときに、経験上、この時間窓に係る画像データの特徴が、先週の日曜日のものと類似するとわかっていれば、実施の形態3に係る画像検索装置は、先週の日曜日に係るデータを用いて行列(C)を算出すればよい。このように1週間を単位とした変化周期も、人間の生活行動に由来すると考えられる。
また、例えば、夏と冬とでは、画像データの特徴が異なることがある。現時刻が、夏の時間窓に含まれているとする。このときに、経験上、この時間窓に係る画像データの特徴が、昨年の夏のものと類似するとわかっていれば、実施の形態3に係る画像検索装置は、昨年の夏に係るデータを用いて行列(C)を算出すればよい。このように1年を単位とした変化周期も、人間の生活行動に、特に服装などの違いに、由来すると考えられる。
【0043】
画像データの特徴は、特別なイベントがある日において、通常の日とは異なるということもあり得る。特別なイベントとは、各種のお祭り、人気アーティストが行うコンサート、国際的な会議、国際的なスポーツイベント、等が考えらる。
例えば、クリスマスイブにおける画像データの特徴は、通常の日における画像データとは異なることがある。現時刻が、クリスマスイブの時間窓に含まれているとする。このときに、経験上、この時間窓に係る画像データの特徴が、昨年のクリスマスイブのものと類似するとわかっていれば、実施の形態3に係る画像検索装置は、昨年のクリスマスイブに係るデータを用いて行列(C)を算出すればよい。このように、特別なイベントがある日における変化も、人間の生活行動に由来すると考えられる。
【0044】
このように、人間に係る画像データの特徴は、人間の生活行動と密接な関係がある、と言える。そして、人間の生活行動は、戦争、パンデミック、自然災害、といった災いによっても、大きく影響を受ける。
例えば、現時刻が、2022年のクリスマスイブの時間窓に含まれていると仮定する。新型コロナウイルスの感染拡大の影響を考慮して、実施の形態3に係る画像検索装置は、昨年ではなく、新型コロナウイルスの感染拡大前の2019年又は2018年のクリスマスイブに係るデータを用いて行列(C)を算出してもよい。
【0045】
実施の形態3に係る画像検索装置は、「経験上、画像データの特徴が類似すると予測できる過去」の時間窓に係るデータに基づいて、射影行列(C)を算出する、というものである。
この射影行列(C)の算出に関する事項の一般化により、実施の形態3に係る画像検索装置は、人間の生活行動を考慮して、異なる時間領域に係る複数のデータベースを対象とした高速検索を実施できる。
【産業上の利用可能性】
【0046】
本開示技術は、例えば、空港等の施設において、防犯カメラで撮影された動画像から、迷子又は不審者を見つけ出すシステムとして応用でき、産業上の利用可能性を有する。
【符号の説明】
【0047】
100 特徴量低減処理回路、110 データ格納部、120 行列演算器、130 射影変換部、200 検索処理回路、210 第二射影変換部、220 探索実行部。
図1
図2
図3