IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テンソル・コンサルティング株式会社の特許一覧

特許7248968画像識別装置、画像識別方法、および画像識別プログラム
<>
  • 特許-画像識別装置、画像識別方法、および画像識別プログラム 図1
  • 特許-画像識別装置、画像識別方法、および画像識別プログラム 図2
  • 特許-画像識別装置、画像識別方法、および画像識別プログラム 図3
  • 特許-画像識別装置、画像識別方法、および画像識別プログラム 図4
  • 特許-画像識別装置、画像識別方法、および画像識別プログラム 図5
  • 特許-画像識別装置、画像識別方法、および画像識別プログラム 図6
  • 特許-画像識別装置、画像識別方法、および画像識別プログラム 図7
  • 特許-画像識別装置、画像識別方法、および画像識別プログラム 図8
  • 特許-画像識別装置、画像識別方法、および画像識別プログラム 図9
  • 特許-画像識別装置、画像識別方法、および画像識別プログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-22
(45)【発行日】2023-03-30
(54)【発明の名称】画像識別装置、画像識別方法、および画像識別プログラム
(51)【国際特許分類】
   G06F 16/53 20190101AFI20230323BHJP
   G06T 7/00 20170101ALI20230323BHJP
【FI】
G06F16/53
G06T7/00 300F
【請求項の数】 14
(21)【出願番号】P 2018083891
(22)【出願日】2018-04-25
(65)【公開番号】P2019191923
(43)【公開日】2019-10-31
【審査請求日】2021-01-08
(73)【特許権者】
【識別番号】511108138
【氏名又は名称】テンソル・コンサルティング株式会社
(74)【代理人】
【識別番号】110000279
【氏名又は名称】弁理士法人ウィルフォート国際特許事務所
(72)【発明者】
【氏名】藤本 浩司
(72)【発明者】
【氏名】宮武 孝尚
【審査官】原 秀人
(56)【参考文献】
【文献】特開2004-258729(JP,A)
【文献】特開2008-257469(JP,A)
【文献】特開2009-282883(JP,A)
【文献】特開2018-022293(JP,A)
【文献】特開2015-022631(JP,A)
【文献】内山 俊郎 外,ベクトル量子化によるマルチスペクトル画像検索,電子情報通信学会論文誌,日本,社団法人電子情報通信学会,2003年11月01日, (J86-D-II) 第11号,pp. 1546-1555
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
複数の公開画像の各々画素値のヒストグラムのグラフ形状と対象画像の画素値のヒストグラムのグラフ形状とを比較することと、前記公開画像の各々の特徴点の統計量と前記 対象画像の特徴点の統計量とを比較することと、により算出される第1類似度が所定の閾値を超える対象画像と公開画像の組合せを選択する第1判定部と、
前記選択された対象画像と公開画像の組合せについて、該公開画像の特徴点の位置および特徴量と、前記対象画像の特徴点の位置および特徴量とを比較することにより算出される第2類似度が所定の閾値を超える対象画像と公開画像の組合せを選択する第2判定部と、
を有する画像識別装置。
【請求項3】
特徴点には複数の種類があり、
前記第1判定部は、前記第1類似度の算出において、前記公開画像の特徴点から種類毎に算出される統計量を、前記対象画像の特徴点から種類毎に算出される統計量と比較す
請求項1に記載の画像識別装置。
【請求項11】
前記第1判定部は、前記公開画像の特徴点の種類毎の個数を示す特徴点インデックスを 、前記対象画像の特徴点の種類毎の個数を示す特徴点インデックスと比較する、
請求項3に記載の画像識別装置。
【請求項12】
前記第1判定部は、前記公開画像の特徴点の統計量を表すベクトルを、前記対象画像の 特徴点の統計量を表すベクトルと比較する、
請求項3に記載の画像識別装置。
【請求項13】
複数の公開画像の中から対象画像に依拠する画像を発見するための画像識別方法であって、
前記複数の公開画像の中から、該公開画像の各々の画素値のヒストグラムのグラフ形状を前記対象画像のヒストグラムのグラフ形状と比較することと、前記公開画像の各々の特 徴点の統計量と前記対象画像の特徴点の統計量とを比較することと、により算出される第1類似度が所定値以上の公開画像を選択し、
前記選択された公開画像の中から、該公開画像の特徴点の位置および特徴量と、前記対象画像の特徴点の位置および特徴量とを比較することにより算出される第2類似度に基づき、公開画像を選択する、
ことをコンピュータが実行する画像識別方法。
【請求項14】
複数の公開画像の中から対象画像に依拠する画像を発見するための画像識別プログラムであって、
前記複数の公開画像の中から、該公開画像の各々の画素値のヒストグラムのグラフ形状を前記対象画像のヒストグラムのグラフ形状と比較することと、前記公開画像の各々の特 徴点の統計量と前記対象画像の特徴点の統計量とを比較することと、により算出される第1類似度が所定値以上の公開画像を選択し、
前記選択された公開画像の中から、該公開画像の特徴点の位置および特徴量と、前記対象画像の特徴点の位置および特徴量とを比較することにより算出される第2類似度に基づき、公開画像を選択する、
ことをコンピュータに実行させるための画像識別プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像の盗用を検出するための技術に関する。
【背景技術】
【0002】
特定のテーマに関する情報をインターネット上から収集し、収集した情報を整理し、1つのページにまとめて掲載するウェブサービスがある。インターネット上では他人のコンテンツを容易に盗用できるため、この種のウェブサービスで著作権侵害が生じやすいという問題が指摘されている。特に画像はそのままあるいは簡単な加工をするだけで容易に盗用できてしまう。
【0003】
原著作物画像と他の画像との類似度を判定する類似画像判定装置が特許文献1、2に開示されている。
【0004】
特許文献1には、電子化された原著作物画像を用意し、この原著作物画像と同一または類似の画像を含むことが推定されるコンテンツをコンテンツ保有装置から取得するとともに、当該コンテンツにおいて原著作物画像との比較対象となる対象画像を特定し、特定された対象画像と原著作物画像との特徴量を抽出し、抽出された対象画像の特徴量に基づいたヒストグラムを生成し、当該ヒストグラムを所定の単位幅で変化させて単位幅毎の単位ヒストグラム群を生成し、生成された単位ヒストグラム群と原著作物画像の特徴量とを比較して両画像間の類似度を判定する態様が記載されている。
【0005】
特許文献2には、電子化された所定の原著作物画像と、該原著作物画像と同一または類似の画像を含むことが推定されるコンテンツとを取得し、取得したコンテンツにおいて原著作物画像との比較対象となる対象画像を特定し、特定された対象画像と前記原著作物画像の特徴量を比較して画像間の類似度を表す情報を生成し、類似度を表す情報を当該対象画像の取得先情報と共に出力する態様が記載されている。
【0006】
また、特許文献2には、特定された対象画像及び原著作物画像の少なくとも一方に対して、拡大、縮小、回転、色調変換等の画像変換処理を施して両画像の特徴量をより近似させ、画像変換処理後の両画像の特徴量を比較する旨も記載されている。
【先行技術文献】
【特許文献】
【0007】
【文献】特開平11-110556号公報
【文献】特開平11-53541号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
インターネット上に膨大な数の画像が存在するため、その中から対象画像を盗用した画像を見つける処理の演算量は膨大となる。例えば、インターネット上の数千万個の公開画像の中から数百万個の対象画像の盗用を探索する場合、数百兆回の画像マッチングを行うことになる。さらに、インターネット上の画像は日々、変化したり、増加されたりしているので、インターネット上の画像から対象画像を盗用した画像を見つける処理は、ある程度の頻度で繰り返すことが求められる。そのため、インターネット上の画像を短い時間に高い精度で調査し、対象画像を盗用した画像を探索する処理が求められる。例えば、数日あるいは数週間という周期で、高い精度の画像マッチング処理を繰り返すことが求められる。
【0009】
特許文献1、2に記載の方法を用いれば、2つの画像がどの程度類似しているかを算出したり、2つの画像に同じ物体が写っていることを精度よく検出したりすることは可能である。しかしながら、それらの技術をもってしても精度と速度を両立することは困難である。
【0010】
本発明の目的は、対象画像を盗用した可能性のある公開画像を短時間かつ高精度で探索する技術を提供することである。
【課題を解決するための手段】
【0011】
本発明のひとつの態様に従う画像識別装置は、複数の公開画像の各々と対象画像とを画素値の統計量および/または特徴点の統計量により比較することにより算出される第1類似度が所定の閾値を超える対象画像と公開画像の組合せを選択する第1判定部と、その選択された対象画像と公開画像の組合せについて、公開画像の特徴点を、対象画像の特徴点および対象画像に所定の加工を施した加工画像の特徴点と比較することにより算出される第2類似度が所定の閾値を超える対象画像と公開画像の組合せを選択する第2判定部と、を有している。
【発明の効果】
【0012】
本発明によれば、対象画像を盗用した可能性のある公開画像を短時間かつ高精度で探索することができる。
【図面の簡単な説明】
【0013】
図1】画像識別装置の機能構成を示すブロック図である。
図2】画像識別装置のハードウェア構成を示すブロック図である。
図3】全体処理のフローチャートである。
図4】全体処理について説明するためのイメージ図である。
図5】グループ作成処理のフローチャートである。
図6】グループ作成処理について説明するためのイメージ図である。
図7】第1判定処理のフローチャートである。
図8】第1判定処理について説明するためのイメージ図である。
図9】第2判定処理のフローチャートである。
図10】第2判定処理について説明するためのイメージ図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施形態について図面を参照して説明する。
【0015】
図1は、本実施形態による画像識別装置の処理構成を示すブロック図である。図2は、画像識別装置のハードウェア構成を示すブロック図である。
【0016】
図1を参照すると、画像識別装置10は、グループ作成部11、公開画像収集部12、第1判定部13、第2判定部14、および表示部15を有している。
【0017】
画像識別装置10は、複数の公開画像の中から対象画像に依拠する画像を発見するための処理を行う装置である。公開画像は、ウェブサーバが提供するウェブページなどによって企業や個人などがインターネット上に公開している画像である。対象画像は、インターネット上で盗用されていないか探索する対象となる著作権のある画像である。公開画像の中には対象画像に依拠する画像が含まれていることが想定される。対象画像を基にして作成されている画像は対象画像に依拠するものとなりうる。対象画像に依拠する画像を、対象画像の著作権者に無断で作成すると盗用になりうる。画像識別装置10は、対象画像を盗用した公開画像を発見するために、対象画像と同一のものと推定される公開画像や対象画像に依拠していると推定される公開画像を探索する。
【0018】
本実施形態による画像識別装置10は、第1判定部13と第2判定部14による2段階の判定により、公開画像の中から対象画像を盗用したものと推定される画像を探索する。
【0019】
グループ作成部11は、対象画像に対して公開画像との比較の準備を行う。グループ作成部11の詳細な処理は後述する。
【0020】
公開画像収集部12は、公開画像を収集する。公開画像収集部12の詳細な処理は後述する。
【0021】
第1判定部13は、複数の公開画像と対象画像とを画素値の統計量および/または特徴点の統計量により比較することにより算出される第1類似度が所定の閾値を超える対象画像と公開画像の組合せを選択する。画素値の統計量および/または特徴点の統計量というのは、画素値の統計量と特徴点の統計量とのいずれか一方または両方のことである。第1類似度は公開画像の画素値の統計量と対象画像の画素値の統計量とを比較することにより算出される値であってもよい。あるいは、第1類似度は、公開画像の特徴点の統計量と対象画像の特徴点の統計量とを比較することにより算出される値であってもよい。あるいは、第1類似度は、公開画像の画素値の統計量と対象画像の画素値の統計量とを比較することにより算出される類似度と、公開画像の特徴点の統計量と対象画像の特徴点の統計量とを比較することにより算出される類似度とから算出される値であってもよい。
【0022】
第2判定部14は、第1判定部13で選択された対象画像と公開画像の組合せについて、その公開画像の特徴点を、その対象画像の特徴点およびその対象画像に所定の加工を施した加工画像の特徴点と比較することにより算出される第2類似度が所定の閾値を超える対象画像と公開画像の組合せを選択する。ここで選択される対象画像と公開画像の組合せは、対象画像と、その対象画像に依拠して作成されたと推定される公開画像との組み合わせである。
【0023】
本実施形態によれば、画素値の統計量および/または特徴点の統計量の比較により一次選択を行い、一次選択で残った画像のみ対象画像との詳細な比較を行う。詳細な比較においては、残った画像を、対象画像そのものだけでなく、盗用の態様となりうる対象画像を加工した加工画像とも、特徴点の比較を行う。その結果、高速かつ高精度で対象画像の盗用を調査することができる。
【0024】
特に、第2類似度の算出において、対象画像とその対象画像に依拠した加工画像の両方について公開画像と特徴点の比較を行うので、単に同一人物が写っている画像や同一物が写っている画像といった一般的な類似画像概念に属するような画像よりも、対象画像に依拠する加工画像の第2類似度が高く算出されうる。インターネット上には例えば同一の有名人や同一の有名観光スポットを撮影した公開画像が多数存在するが、それらの多くは類似画像であっても対象画像に依拠したものではなく、全く別個に撮影されたものである。そのような類似画像は、画像の盗用の推定を目的とする場合には検出しなくてよい。このような状況を考慮すると、単なる画像の類似判定ではなく、画像の盗用の推定を目的とする画像識別装置10においては本実施形態のように対象画像と加工画像の両方を用いる第2類似度の算出方法は特に有効である。
【0025】
また、本実施形態では、画素値の統計量は一例として画素値のヒストグラムであり、第1判定部13は、公開画像Piに含まれる画素値のヒストグラムを対象画像Oiの画素値のヒストグラムと比較することにより第1類似度を算出する。画素値のヒストグラムにより一次選択を行い、一次選択で残った画像のみ対象画像との詳細な比較を行う。詳細な比較においては、残った画像を、対象画像そのものだけでなく、盗用の態様となりうる対象画像を加工した加工画像とも、特徴点の比較を行う。その結果、高速かつ高精度で対象画像の盗用を調査することができる。
【0026】
また、第1判定部13が主に色合いに着目した画素値ヒストグラムに基づく第1類似度で類否を判定し、第2判定部14が主に形状に着目した特徴点に基づく第2類似度で類否を判定するので、色合いと形状のいずれか一方に偏ることのない類否の判定が可能である。
【0027】
また、本実施形態では、グループ作成部11は、複数の対象画像のそれぞれについて、複数の対象画像に共通する所定の加工方法で所定個の加工画像を作成し、対象画像の同一画像および加工画像を比較用画像としてグループ化して、複数の対象画像のそれぞれと紐づける。第2判定部14は、公開画像の特徴点と、対象画像に紐づくグループに含まれる比較用画像の特徴点との比較に基づき、その公開画像とその対象画像との第2類似度を算出することにしてもよい。画像の加工方法は無限にあるが、一般に画像の盗用時にはよく用いられる加工方法というのはある程度想定が可能である。その加工方法を複数ある対象画像に共通に適用することで、共通処理により処理を単純化することができる。
【0028】
また、本実施形態では、第2判定部14は、第1判定部13で選択された対象画像と公開画像の組合せにおける、その公開画像と、その対象画像のグループに含まれる複数の比較用画像のそれぞれとの特徴点に関する類似度を算出し、それらの類似度を加算することにより、公開画像の対象画像との第2類似度を算出することにしてもよい。公開画像を複数の比較用画像と比較し、それらの類似度を加算した値、例えば合計値に基づいて、第2類似度を算出するので、複数の比較用画像による総合判断となり、比較用画像の加工方法のいずれとも異なる加工方法で盗用がされた場合であっても総合判断により盗用の推定が可能となる。ここでいう加算には、単純な合計値を求める積算の他、加工方法あるいは比較用用画像にそれぞれ重みを付与し、類似度に重みづけして積算するものを含むものとする。例えば、対象画像に何も加工していない画像との類似度の重みを、何らかの加工がされた他の比較用画像の重みよりも大きく設定してもよい。
【0029】
あるいは、本実施形態では、第2判定部14は、第1判定部13で選択された対象画像と公開画像の組合せにおける、その公開画像と、その対象画像のグループに含まれる複数の比較用画像のそれぞれとの特徴点に関する類似度のうち最大値に基づいて、公開画像の前記対象画像との第2類似度を算出することにしてもよい。公開画像が、所定の加工方法のいずれかにより対象画像を加工したものであれば、いずれかの比較用画像(加工画像)と高い類似度を示すと考えられる。そのため、複数の比較用画像との類似度のうち最大値を示したものを基に第2類似度を算出すれば、想定される加工方法と同一の加工方法による盗用の推定が可能となる。例えば、複数の比較用画像との類似度のうち最大値を第2類似度とすれば、想定される加工方法と同一の加工方法による盗用の推定に有効である。
【0030】
また、本実施形態では、グループ作成部11は、各対象画像のグループの比較用画像を予め作成し、データベース化しておき、公開画像収集部12は、公開画像を予め収集してデータベース化しておき、第2判定部14は、データベースにアクセスし、予め収集された公開画像の特徴点と予め作成された比較用画像の特徴点とを比較することにしてもよい。比較用画像と公開画像とを予めデータベース化しておき、データベースにアクセスしながらそれらの特徴点を比較していくので、対象画像も公開画像もどちらも多数存在する場合に比較処理を効率よく実行して演算時間を短縮することができる。
【0031】
なお、本実施形態では、第1判定部13が対象画像の画素値ヒストグラムと公開画像の画素値ヒストグラムとを比較する例を示したが、これに限定されることはない。他の例として、対象画像の特徴点から種類毎に算出される統計量と、公開画像の特徴点から種類毎に算出される統計量とを比較してもよい。例えば、第1判定部13が、対象画像の特徴点の種類毎の個数を示す特徴点インデックスと、公開画像の特徴点の種類毎の個数を示す特徴点インデックスとを比較することにしてもよい。あるいは、第1判定部13は、対象画像の種類毎に特徴点があるか否かを2値で示す特徴点インデックスと、公開画像の種類毎にその特徴点があるか否かを2値で示す特徴点インデックスとを比較することにしてもよい。
【0032】
更に、他の例として、第1判定部13は、画素値ヒストグラムの比較と、特徴点インデックス比較の両方を用いて第1類似度を算出することにしてもよい。
【0033】
また、本実施形態では、第1判定部13は、画素値ヒストグラムあるいは特徴点インデックスを比較する前に対象画像と公開画像のサイズを一致させることにしてもよい。これにより、比較の演算が容易となる。
【0034】
第1判定部13および第2判定部14の詳細な処理と、第1判定部13あるいは第2判定部14の処理に関連する他の部分の詳細な処理とについては後述する。
【0035】
本実施形態による画像識別装置10は図1に示した各部の処理手順を規定したソフトウェアプログラムをコンピュータに実行させることにより実現することも可能である。図2には、画像識別装置10を実現するコンピュータのハードウェア構成の一例が示されている。
【0036】
図2を参照すると、画像識別装置10はインターネット等の通信ネットワーク90経由でウェブサーバ91と接続可能である。ハードウェア構成として、画像識別装置10は、処理装置21、メインメモリ22、記憶装置23、通信装置24、入力装置25、および表示装置26を有し、それらがバス27に接続されている。
【0037】
記憶装置23は、書込みおよび読み出しが可能にデータを記憶するものであって、この記憶装置23には画像識別装置10が処理に用いる画像のデータが記録される。例えば、複数のウェブサーバ91から収集した公開画像のデータは記憶装置23に蓄積される。また、その画像の盗用がされているか否か探索する対象となる対象画像のデータも記憶装置23に記録される。
【0038】
処理装置21は、記憶装置23に記憶されたデータをメインメモリ22に読み出し、メインメモリ22を利用してソフトウェアプログラムの処理を実行するプロセッサである。処理装置21によって、図1に示したグループ作成部11、公開画像収集部12、第1判定部13、第2判定部14、および表示部15が実現される。
【0039】
通信装置24は、処理装置21にて処理された情報を有線または無線あるいはそれら両方を含む通信ネットワーク90を介して送信し、また通信ネットワーク90を介して受信した情報を処理装置21に伝達する。受信した情報は処理装置21にてソフトウェアの処理に利用される。
【0040】
入力装置25は、キーボードやマウスなどオペレータによる操作入力による情報を受け付ける装置であり、入力された情報は処理装置21にてソフトウェア処理に利用される。例えば、対象画像は通信装置24や入力装置25を介して記憶装置23に入力される。
【0041】
表示装置26は、処理装置21によるソフトウェア処理に伴って画像やテキストの情報をディスプレイ画面に表示する装置である。
【0042】
図3は、全体処理のフローチャートである。図4は、全体処理について説明するためのイメージ図である。図3の全体処理が開始される前に記憶装置23には盗用を探索する対象画像のデータが保持されている。
【0043】
図3を参照すると、画像識別装置10は、まず、グループ作成部11によりグループ作成処理を行う(ステップS101)。グループ作成処理において、グループ作成部11は、記憶装置23に格納されている対象画像の加工画像の作成と、対象画像の画素値ヒストグラム作成と、対象画像および加工画像(比較用画像)の特徴点抽出と、を行っておく。
【0044】
加工画像は、対象画像を回転した画像、分割した画像、補正した画像、などである。対象画像を加工して盗用する場合に想定される加工方法で対象画像を加工した加工画像を準備しておくことが好ましい。対象画像とその対象画像を加工して作成した加工画像とを合わせた比較用画像がその対象画像に紐づくグループとなる。
【0045】
画素値ヒストグラムは、画像中の画素の画素値の分布を、横軸に画素値をとり縦軸に画素数をとってグラフにしたものである。ここでは画素値ヒストグラムを描画可能にする画素値の度数分布データを作成すればよい。
【0046】
次に、画像識別装置10は、公開画像収集部12により、公開画像収集処理を実行する(ステップS102)。公開画像収集処理にて、公開画像収集部12は、通信ネットワーク90経由でウェブサーバ91の各ウェブサイトを巡回し、ウェブサイトに含まれるウェブページで公開されている公開画像のデータを収集し、公開画像の画素値ヒストグラムを作成し、公開画像のデータおよび画素値ヒストグラムのデータを記憶装置23に蓄積する。
【0047】
なお、本実施形態では、一例としてグループ作成処理を行った後に公開画像収集処理を行う例を示すが、この処理順序に限定されることはない。公開画像収集処理をグループ作成処理の前に実行してもよい。
【0048】
次に、画像識別装置10は、第1判定部13により、第1判定処理を実行する(ステップS103)。第1判定処理にて、第1判定部13は、まず、公開画像の画素値ヒストグラムと対象画像の画素値ヒストグラムとを総当たりで比較し、それぞれの組合せの類似度(第1類似度)を算出する。次に、第1判定部13は、第1類似度を所定の閾値と比較し、第1類似度が閾値を越えている公開画像を対象画像に対応付け、対応づけ情報を記憶装置23に記録する。
【0049】
画素値ヒストグラム同士の類似度は、画素値ヒストグラムのグラフ形状の類似性に基づいて算出することにしてもよい。例えば、対象画像の画素値ヒストグラムの各ビンとそのビンに対応する公開画像の画素値ヒストグラムのビンとについて、当該ビンの画素数の全ビンの画素数の平均値からの偏差同士を比較する。それら偏差同士の差分の合計値が小さければ、対象画像と公開画像の第1類似度は高い。
【0050】
ここで、画素値のヒストグラムを比較しているので、対象画像や公開画像にどんな形状の物が写っているかとは関係なく、対象画像と、画像全体の色合い(画像全体としての色の傾向)が似ている公開画像が一次選択されることになる。
【0051】
なお、画像の画素値ヒストグラムを正規化してから、それらを比較することにしてもよい。そうすることで画像サイズが違っていても画像全体の色合いが似ているかどうかを判断することが可能となる。
【0052】
本実施形態では、第1判定部13は、対象画像と公開画像とを画素値のヒストグラムにより比較するものとしたが、上述のように、他の例として特徴量の統計量により比較してもよい。特徴点の統計量は所定次元数のベクトルにより表すことができ、第1判定部13は、対象画像の特徴点の統計量を表すベクトルと、公開画像の特徴点の統計量を表すベクトルとの類似度を算出すればよい。ベクトル間の類似度を算出する手法は特に限定されないが、例えばコサイン類似度をベクトル間の類似度として用いても良いし、ベクトルの要素を文字列と見たてて文字列間の非類似度を表すハミング距離からベクトル間の類似度を求めてもよい。
【0053】
次に、画像識別装置10は、第2判定部14により、第2判定処理を実行する(ステップS104)。第2判定処理にて、第2判定部14は、記憶装置23に記録されている対応づけ情報にて対応づけられている公開画像と対象画像の組合せについて、その公開画像の特徴点を、その対象画像に紐づけられたグループに属する各比較用画像の特徴点と比較する。
【0054】
画像の特徴点の比較は、例えば特徴点から算出される特徴量に基づいて行ってもよい。特徴点とは、画像内の特徴的な点のことである。例えば、画像に写っている物体の角や境界などに特徴点が存在する。特徴量は、特徴点から算出される値である。例えば、特徴点の種類により重み付けしたスコアを各特徴点に付与し、画像の中で位置と種類が一致した特徴点のスコアを積算した積算値を画像同士の第2類似度としてもよい。
【0055】
また、公開画像と対象画像のグループに属する比較用画像それぞれとの画像同士の特徴点の距離を算出し、特徴点同士の距離が近いほど類似度が高くなるように類似度を算出し、グループの類似度を総合して第2類似度を算出するように第2類似度の演算を定義してもよい。
【0056】
本実施形態で用いる特徴点の比較手法は特に限定されない。既存の様々な特徴点マッチングの手法を用いることもできる。
【0057】
なお、特徴点同士の距離で類似度を算出する特徴点マッチングは画像の回転に弱く、同じ画像でも画像が回転していると類似度が低下してしまう。そのため、そのような手法を用いる場合には、加工画像として、対象画像を回転させた画像を準備しておくことは、その点でも効果的である。
【0058】
上述の通り、この比較用画像には対象画像およびその対象画像を加工した加工画像が含まれている。例えば、公開画像の特徴点と、対象画像に紐づけられたグループに属する各比較用画像との類似度をそれぞれ算出し、それらの類似度に基づいて、公開画像と対象画像との類似度(第2類似度)を算出する。更に、第2判定部14は、比較結果に基づいて、その公開画像がその対象画像を盗用したものと推定されるか否か判定する。例えば、第2類似度が所定の閾値を越えていたら、その公開画像はその対象画像を盗用して作成されたと推定するものとしてもよい。
【0059】
次に、画像識別装置10は、表示部15により、第2判定部14による判定結果を画面に表示する。例えば、対象画像を盗用して作成したと推定される公開画像について、判定に用いた第2類似度を意味するスコアを表示してもよい。また、例えば、対象画像と、その対象画像を盗用して作成したと推定される公開画像とを並べて表示することにしてもよい。
【0060】
図4は、全体処理について説明するためのイメージ図である。ステップS101では、対象画像Oiの画素値ヒストグラムOhが作成される。また、対象画像Oiおよびその加工画像の特徴点Ofが抽出される。図4には、対象画像Oiが1つだけしか示されていないが、実際には多数の対象画像Oi1、Oi2、・・・が存在する。ステップS101では、それら多数の対象画像Oi1、Oi2、・・・に対して処理が行われる。
【0061】
ステップS102では、通信ネットワーク90経由でウェブサーバ91から、対象画像Oiよりも更に多数の公開画像Pi1~Pinが収集され、各公開画像Pi1~Pinの画素値ヒストグラムPh1~Phnが作成され、更に各公開画像Pi1~Pinの特徴点Pf1~Pfnが抽出される。
【0062】
ステップS103の第1判定処理では、対象画像Oiの画素値ヒストグラムOhと公開画像Pi1~Pinの画素値ヒストグラムPh1~Phnとの第1類似度が算出され、第1類似度が閾値を越えた対象画像Oiと公開画像Piの組合せが抽出される。ここで抽出される対象画像Oiと公開画像Piの組合せは、公開画像Piが対象画像Oiを盗用して作成されたものか否か更に第2判定処理で判定する必要があるとされたものである。
【0063】
ステップS104の第2判定処理では、ステップS103で抽出された対象画像Oiと公開画像Piの組合せについて、対象画像Oiおよびその加工画像の特徴点Ofと、公開画像Piの特徴点Pfとに基づいて第2類似度が算出され、第2類似度が閾値を越えた対象画像Oiと公開画像Piの組合せが抽出される。ここで抽出される対象画像Oiと公開画像Piの組合せは、その公開画像Piがその対象画像Oiを盗用して作成されたものと推定されたものである。
【0064】
図5は、グループ作成処理のフローチャートである。図5には、ステップS101によるグループ作成処理の詳細が示されている。
【0065】
図5を参照すると、グループ作成部11は、対象画像の加工画像を作成する(ステップS201)。ここでは、対象画像Oiを盗用し加工して公開画像Piとする場合に想定される各種加工方法で加工した加工画像を比較用画像として用意しておくのが良い。例えば、加工画像として、対象画像Oiの画像サイズを拡大した拡大画像、対象画像Oiの画像サイズを縮小した縮小画像、対象画像Oiを所定角度だけ回転させた回転画像、および対象画像Oiの一部を切り出した分割画像、の少なくとも1つを比較用画像に含むのが好ましい。盗用に利用される可能性がある容易な加工方法で対象画像Oiを加工した加工画像を公開画像Piと比較することができるので、少ない処理量で盗用の検出精度を確保することができる。
【0066】
なお、上記分割画像は、対象画像Oiを例えば、縦に2等分したり、横に2等分したり、縦横に4等分したりなど固定的な分割方法で対象画像Oiから加工画像を作成してもよいし、対象画像Oiから人の顔を検出し、人の顔の周辺を切り取るように加工画像を作成してもよい。
【0067】
次に、グループ作成部11は、対象画像Oiの画素値ヒストグラムを作成する(ステップS202)。画素値ヒストグラムの作成は、画素値毎に、その画素値に該当する画素の個数をカウントすれよばい。
【0068】
次に、グループ作成部11は、対象画像Oiおよびその加工画像、すなわち比較用画像のそれぞれの特徴点を抽出する(ステップS203)。特徴点の抽出方法は特に限定せず、既存の様々な方法を適用することができる。
【0069】
次に、グループ作成部11は、対象画像Oiとその対象画像Oiを加工した加工画像とを、その対象画像Oiに対応する比較用画像としてグループ化し、対象画像Oi、対象画像Oiの画素値ヒストグラムOh、対象画像Oiおよび加工画像の特徴点Ofのデータを記憶装置23に記録する(ステップS204)。
【0070】
図6は、グループ作成処理により記録装置に記録されるデータを示す図である。本実施形態の画像識別装置10は多数の対象画像Oiのそれぞれについてグループ作成処理が実施される。図6には、対象画像Oi1、Oi2、Oi3・・・のそれぞれに対応するグループのデータが示されている。対象画像Oi1に対応するグループOg1には、対象画像Oi1、画素値ヒストグラムOh1、特徴点Of1のデータが登録され、対象画像Oi2に対応するグループOg2には、対象画像Oi2、画素値ヒストグラムOh2、特徴点Of2のデータが登録され、対象画像Oi3に対応するグループOg3には、対象画像Oi3、画素値ヒストグラムOh3、特徴点Of3のデータが登録されている。
【0071】
図7は、第1判定処理のフローチャートである。図7を参照すると、第1判定部13は、記憶装置23から全対象画像Oiの画素値ヒストグラムのデータと、全公開画像Piの画素値ヒストグラムのデータとを取得する(ステップS301)。なお、本実施形態では、ステップ202の画素値ヒストグラム作成処理にて、予め対象画像の画素値ヒストグラムを作成しておくことにしているが、これに限定されることはない。他の例として、ステップS301にて画素値のヒストグラムを作成することにしてもよい。
【0072】
次に、第1判定部13は、対象画像Oiの画素値ヒストグラムと公開画像Piの画素値ヒストグラムとを比較し、それらの画素値ヒストグラムの類似度(第1類似度)を算出する(ステップS302)。第1判定部13は、全ての対象画像Oiの画素値ヒストグラムと、全ての公開画像Piの画素値ヒストグラムとを総当たりで比較する。
【0073】
次に、第1判定部13は、算出した第1類似度を所定の閾値と比較し、第1類似度が閾値を越えている対象画像Oiと公開画像Piの組合せを選択する(ステップS303)。第1判定部13は、画素値ヒストグラム同士の第1類似度が閾値を越えた対象画像Oiと公開画像Piとを対応づけた第1選択情報を記憶装置23に記録する。
【0074】
第1類似度と比較する閾値は、予め定めた固定値を用いても良いし、ユーザが設定したり変更したりできる値であってもよい。第1判定処理では、画素値ヒストグラムの類似性により、その後で更に比較処理を行う対象画像と公開画像の組合せを絞り込み、処理時間に要する時間を短縮すればよい。したがって、対象画像Oiを盗用したと推定される類似画像Piを抽出する処理を繰り返す1周期の間に、対象画像Oiを盗用したと推定される類似画像Piを抽出する一連の処理を完了できるだけの対象画像Oiと公開画像Piの組合せの個数に絞り込むことができ、かつ、対象画像Oiを盗用したと推定される公開画像Piを第1判定処理の段階でできるだけ見逃さないように閾値を決めるとよい。
【0075】
図8は、第1判定処理について説明するためのイメージ図である。第1判定処理では、対象画像Oi1、Oi2、Oi3、・・・の画素値ヒストグラムOh1、Oh2、Oh3、・・・と、公開画像Pi1、Pi2、Pi3、・・・の画素値ヒストグラムPh1、Ph2、Ph3、・・・とを総当たりで比較する。図8は、公開画像Pikの画素値ヒストグラムPhkと、対象画像Oi1、Oi2、Oi3の画素値ヒストグラムOh1、Oh2、Oh3とを比較する様子が示されている。対象画像Oiと公開画像Piとの比較が双方向矢印により示されている。また、その比較により算出された第1類似度が閾値を越えたか否かが丸印とバツ印で示されている。丸印は第1類似度が閾値を越えたことを示し、バツ印は第1類似度が閾値以下であったことを示している。
【0076】
図8の例では、画素値ヒストグラムPhkと画素値ヒストグラムOh1との第1類似度、および画素値ヒストグラムPhkと画素値ヒストグラムOh2との第1類似度が閾値を超え、画素値ヒストグラムPhkと画素値ヒストグラムOh3との第1類似度が閾値以下となっている。そのため、対象画像Oi1と公開画像Pikの組合せと、対象画像Oi2と公開画像Pikの組合せの情報は第1選択情報として記憶装置23に記録される。一方、対象画像Oi3と公開画像Pikの組合せの情報は第1選択情報として記憶装置23に記録されない。
【0077】
図9は、第2判定処理のフローチャートである。図9を参照すると、第2判定部14は、第1選択情報に対象画像Oiと公開画像Piの組合せの情報が記録されている公開画像Piのそれぞれの特徴点を抽出する(ステップS401)。第2判定部14は、抽出した特徴点の情報を記憶装置23に記録する。なお、本実施形態では、ステップ203の特徴点抽出処理にて、予め対象画像およびその加工画像の特徴点を抽出しておくことにしているが、これに限定されることはない。他の例として、ステップS401にて、対象画像および加工画像の特徴点を抽出することにしてもよい。
【0078】
次に、第2判定部14は、第1選択情報に記録されている対象画像Oiと公開画像Piの各組合せについて、その対象画像Oiに対応するグループに属する比較用画像の特徴点と、その公開画像Piの特徴点とを比較し、その対象画像Oiとその公開画像Piとの第2類似度を算出する(ステップS402)。
【0079】
処理の一例として、第2判定部14は、公開画像の各特徴点に所定のスコアを持たせ、特徴点と一致する特徴点を有する比較用画像にスコアを付与し、その付与されたスコアの合計を比較用画像のスコアとし、グループに属する複数の比較用画像のスコアに基づいて、グループに紐づく対象画像と公開画像との第2類似度を算出することにしてもよい。各特徴点に持たせるスコアは、特に限定されないが、例えば、画像内のスコアの合計値が一定になるように、各特徴点にスコアを均等分配することにしてもよい。あるいは特徴点の種類により、その特徴点に持たせるスコアに重み付けしてもよい。さらに、グループに属する複数の比較用画像のスコアの合計値を第2類似度としてもよい。あるいは、グループに属する比較用画像のスコアの最高値を第2類似度としてもよい。
【0080】
次に、第2判定部14は、算出した第2類似度を所定の閾値と比較し、第2類似度が閾値を越えている対象画像Oiと公開画像Piの組合せを選択する(ステップS403)。第2判定部14は、第2類似度が閾値を越えた対象画像Oiと公開画像Piとを対応づけた第2選択情報を記憶装置23に記録する。
【0081】
第2類似度と比較する閾値は、予め定めた固定値を用いても良いし、ユーザが設定したり変更したりできる値であってもよい。第2判定処理では、対象画像Oiを盗用したと推定される公開画像Piを抽出するのに適した閾値を設定するとよい。盗用の可能性が一定以上に高い画像のみを抽出するというポリシーであれば、第2類似度を比較する閾値を高めに設定すればよい。画像識別装置10が抽出した画像を人間が目視で盗用の有無を確認することが前提となっていれば、第2類似度と比較する閾値を低めに設定し、疑いのある画像を画像識別装置10でできるだけ見逃さないようにしてもよい。
【0082】
図10は、第2判定処理について説明するためのイメージ図である。第2判定処理では、第1判定処理で選択された対象画像Oiと公開画像Piとの全ての組み合わせについて、対象画像Oiのグループに属する全ての比較用画像の特徴点と公開画像Piの特徴点とを総当たりで比較する。図10には、対象画像Oi1のグループに属する比較用画像の特徴点Of1-1、Of1-2、・・・・と、公開画像Pi1の特徴点Pf1とを総当たりで比較することが示されている。
【0083】
なお、本実施形態では、グループ作成部11が予め対象画像Oiの特徴点を抽出することとしたが、これに限定されることはない。他の例として、グループ作成部11は対象画像Oiの特徴点の抽出を予め行わず、第2判定部14が、第1判定部13により選択された対象画像と公開画像の組合せのみについて、その対象画像のグループに属する比較用画像の特徴点を抽出し、その比較用画像の特徴点とその公開画像の特徴点とを比較することにしてもよい。第1判定部13で選択された対象画像と公開画像の組合せに挙がった対象画像のみについてその特徴点を抽出するので、処理を削減することができる。
【0084】
また、本実施形態では、盗用時に用いられることが想定される加工方法で対象画像を加工した比較用画像を公開画像と比較することとしたが、それとは異なる観点で比較用画像の加工方法を決めてもよい。例えば、第2類似度は、対象画像に対応する比較用画像の特徴点と公開画像の特徴点との距離が小さいほど類似度が高くなるような算出方法で算出するものとし、加工画像には、90度回転画像、180度回転画像、および270度回転画像を含めることにしてもよい。特徴点の距離から算出される第2類似度は、比較的簡易な処理で画像の類似を検知できるが画像を回転して盗用されると類似度が低下し検出が難しくなる。そこで、典型的に想定される回転角度の回転画像を用意し、公開画像との比較に用いることで、少ない処理量で盗用の検出精度を確保することができる。
【0085】
また、本実施形態では、図2に示したように、画像識別装置10が単体の装置により構成される例を示したが、これに実施形態が限定されることはない。図1に示した画像識別装置10の各部の処理を複数の装置により分担する構成も可能である。例えば、第1判定部13と第2判定部14が別個のコンピュータにより実現されてもよい。
【0086】
上述した本実施形態は、本発明の説明のための例示であり、本発明の範囲をこの実施形態のみに限定する趣旨ではない。当業者は、本発明の範囲を逸脱することなしに、他の様々な態様で本発明を実施することができる。
【符号の説明】
【0087】
10…画像識別装置、11…グループ作成部、12…公開画像収集部、13…第1判定部、14…第2判定部、15…表示部、21…処理装置、22…メインメモリ、23…記憶装置、24…通信装置、25…入力装置、26…表示装置、27…バス、90…通信ネットワーク、91…ウェブサーバ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10