(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022045801
(43)【公開日】2022-03-22
(54)【発明の名称】情報処理装置、画像照合方法、プログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20220314BHJP
G06T 7/90 20170101ALI20220314BHJP
G06T 1/00 20060101ALI20220314BHJP
【FI】
G06T7/00 130
G06T7/00 300E
G06T7/90 A
G06T1/00 510
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2020151586
(22)【出願日】2020-09-09
(71)【出願人】
【識別番号】304021831
【氏名又は名称】国立大学法人千葉大学
(71)【出願人】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】堀内 隆彦
(72)【発明者】
【氏名】中村 蓮
(72)【発明者】
【氏名】田中 緑
(72)【発明者】
【氏名】今泉 祥子
(72)【発明者】
【氏名】坂本 健
(72)【発明者】
【氏名】吉岡 達郎
(72)【発明者】
【氏名】宮部 和弘
【テーマコード(参考)】
5B057
5L096
【Fターム(参考)】
5B057AA11
5B057CA01
5B057CA08
5B057CA12
5B057CB01
5B057CB08
5B057CB12
5B057CE06
5B057CE18
5B057CH07
5B057DB02
5B057DB06
5B057DB09
5B057DC25
5L096AA02
5L096AA06
5L096BA18
5L096DA01
5L096EA03
5L096EA06
5L096FA32
5L096GA19
5L096GA41
5L096GA51
5L096GA55
5L096JA03
5L096JA11
(57)【要約】
【課題】二つの画像データが同一か否かの判定を人間の判定結果に近づけることができる情報処理装置を提供すること。
【解決手段】一つのカラー画像データから生成された二つの画像データを、人間の視覚特性に基づいた知覚画像にそれぞれ変換する知覚画像変換部12と、前記知覚画像変換部が変換した二つの知覚画像が同一か否かを判定する照合部13と、前記照合部による比較結果を出力する比較結果出力部14と、を有することを特徴とする情報処理装置10を提供得する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
一つのカラー画像データから生成された二つの画像データを、人間の視覚特性に基づいた知覚画像にそれぞれ変換する知覚画像変換部と、
前記知覚画像変換部が変換した二つの知覚画像が同一か否かを判定する照合部と、
前記照合部による比較結果を出力する比較結果出力部と、
を有することを特徴とする情報処理装置。
【請求項2】
前記照合部は、前記二つの知覚画像の色差画像を生成し、
前記色差画像の色差勾配平均が閾値以上の場合に、前記二つの画像データが同一でないと判定することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記照合部は、前記色差画像の色差平均が閾値以上の場合に、前記二つの画像データが同一でないと判定することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記照合部は、前記色差画像の色差勾配平均が閾値以上でなく、かつ、前記色差画像の色差平均が閾値以上でない場合に、前記二つの画像データが同一であると判定することを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記比較結果出力部は、前記二つの画像データ及び前記色差画像を一つの画面に表示することを特徴とする請求項3又は4のいずれか1項に記載の情報処理装置。
【請求項6】
前記照合部は前記色差画像の前記色差勾配平均及び前記色差平均をブロックごとに算出し、
前記比較結果出力部は、前記色差勾配平均又は前記色差平均が閾値以上のブロックを前記色差画像において強調して表示することを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記二つの画像データは、OSのビット数及びプリンタドライバの少なくとも一方が異なる状態で、カラー画像データの階調数を減らして擬似的に中間色を表現する処理により生成されたハーフトーン画像であることを特徴とする請求項1~6のいずれか1項に記載の情報処理装置。
【請求項8】
前記知覚画像変換部は、
前記二つの画像データをそれぞれ輝度O1と反対色O2、O3の信号に変換し、
Oj(j=1,2,3)の各信号に対して、下式で空間フィルターをかけることで前記知覚画像を生成し、
前記照合部は、前記知覚画像変換部が前記下式で変換した二つの知覚画像が同一か否かを判定することを特徴とする請求項1~7のいずれか1項に記載の情報処理装置。
【数5】
【請求項9】
知覚画像変換部が、一つのカラー画像データから生成された二つの画像データを、人間の視覚特性に基づいた知覚画像にそれぞれ変換するステップと、
照合部が、前記知覚画像変換部が変換した二つの知覚画像が同一か否かを判定するステップと、
比較結果出力部が、前記照合部による比較結果を出力するステップと、
を有することを特徴とする画像照合方法。
【請求項10】
情報処理装置を、
一つのカラー画像データから生成された二つの画像データを、人間の視覚特性に基づいた知覚画像にそれぞれ変換する知覚画像変換部と、
前記知覚画像変換部が変換した二つの知覚画像が同一か否かを判定する照合部と、
前記照合部による比較結果を出力する比較結果出力部、
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、画像照合方法、及び、プログラムに関する。
【背景技術】
【0002】
画像印刷において、印刷システムに画像データが入力された場合、一意の出力結果が得られることが重要である。高品質な印刷物が要求される商用印刷などの分野では、このことは特に重要である。同じ出力結果が得られるとユーザーが期待する印刷システムがこれを達成できない場合、印刷システムは顧客の要求する印刷品質を満たすことができないことになる。しかしながら、この課題を達成することは容易でない。画像印刷において、出力に違いが発生する原因の一つに、プリンタドライバの処理によってRGBデータがCMYKのハーフトーン画像に変換される過程がある。この過程で用いられる情報処理装置のOS又はプリンタドライバの違いが、画像処理の違いや計算精度の差をもたらし、異なるハーフトーン画像への変換となって現れる。
【0003】
二つの画像を比較する技術は従来から存在する(例えば、特許文献1参照。)。特許文献1には、印刷物の電子化データをマスター画像データとして、印刷された印刷物を電子化したデータと照合し、マスター画像データが印刷物の電子化データと一致しているか否かを判定する画像照合システムが開示されている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術は、二つの画像データの一致又は不一致の判定を信号処理的に実施することを目的としており、あいまい性を考慮した判定が困難であるという問題がある。すなわち、画像が完全に一致するか否かの照合は、プログラム等が差分画像を算出することにより容易に判定できる。したがって、一部でも出力結果が異なる画像を選別することは容易である。しかし、人間には違いがわからない差異をシステム側も許容するという、あいまいな判定は困難であった。また、従来の技術は、ハーフトーン画像に対し適用することができなかった。
【0005】
本発明は、二つの画像データが同一か否かの判定を人間の判定結果に近づけることができる情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題に鑑み、本発明は、一つのカラー画像データから生成された二つの画像データを、人間の視覚特性に基づいた知覚画像にそれぞれ変換する知覚画像変換部と、前記知覚画像変換部が変換した二つの知覚画像が同一か否かを判定する照合部と、前記照合部による比較結果を出力する比較結果出力部と、を有することを特徴とする情報処理装置を提供する。
【発明の効果】
【0007】
二つの画像データが同一か否かの判定を人間の判定結果に近づけることができる情報処理装置を提供することができる。
【図面の簡単な説明】
【0008】
【
図1】画像印刷において二つの画像に差異が生じる過程を説明する図である。
【
図2】OSの違いによるハーフトーン画像の違いの一例を説明する図である。
【
図3】二つの画像が一致するか否かの判定の概略を説明する図である。
【
図4】同一判定を行う情報処理装置又は情報処理システムの一例の構成図である。
【
図5】情報処理装置又はサーバの一例のハードウェア構成図である。
【
図6】情報処理装置の機能をブロック状に分けて説明する機能ブロック図の一例である。
【
図7】知覚画像への変換方法を説明する図の一例である。
【
図8】知覚画像変換部がハーフトーン画像を知覚画像に変換する手順を説明するフローチャート図の一例である。
【
図10】
図9のRGB画像から生成された知覚画像の一例を示す図である。
【
図11】二つの知覚画像の差分として求められた色差画像の一例を示す図である。
【
図12】色差画像の色差平均の算出方法を説明する図である。
【
図13】照合部が色差画像の色差平均を算出する手順を示すフローチャート図の一例である。
【
図14】色差画像の色差勾配平均の算出方法を説明する図である。
【
図15】照合部が色差画像の色差勾配平均を算出する手順を示すフローチャート図の一例である。
【
図16】色差平均と色差勾配平均に基づく比較結果の表示例を示す図である。
【
図17】情報処理装置が二つのハーフトーン画像を知覚画像に変換して、一致するか否かを判定する手順を示すフローチャート図の一例である。
【
図18】比較画像入力部がディスプレイに表示する比較画像指定画面の一例を示す図である。
【
図19】比較結果出力部がディスプレイに表示する比較結果画面の一例を示す図である。
【
図20】入力された2枚のハーフトーン画像の違いが、企業の目視判定員によっても視認されて不一致と判定された例を示す図である。
【
図21】入力された2枚のハーフトーン画像の違いが、企業の目視判定員には視認されずに一致と判定された例を示す図である。
【発明を実施するための形態】
【0009】
以下、本発明を実施するための形態の一例として、情報処理装置と情報処理装置が行う画像照合方法について図面を参照しながら説明する。
【0010】
<同一判定の補足>
本実施形態の判定方法を説明するにあたり、背景技術について補足する。
まず、
図1は、画像印刷において二つの画像に差異が生じる過程を説明する図である。
図1に示すように、例えば24ビットのRGBデータ250が情報処理装置1000に入力される。情報処理装置1000はRGBデータにディザ処理又は誤差拡散処理などを行いCMYKのハーフトーン画像251に変換する。ディザ処理又は誤差拡散処理は、画像の色数や階調数を減らして擬似的に中間色を表現する画像処理方法である。ディザ処理又は誤差拡散処理は、OSのビット数及びプリンタドライバの少なくとも一方が異なる状態で行われる。印刷装置252はCMYKのハーフトーン画像251をトナーやインクの点に対応させて用紙等に印刷する。
【0011】
しかし、RGBデータ→ハーフトーン画像の過程で用いられる情報処理装置1000のOS及びプリンタドライバの少なくとも一方の違いが、画像処理の違いや計算精度の差をもたらす。情報処理装置1000が使用するOS又はプリンタドライバが異なると、情報処理装置1000が異なるハーフトーン画像251に変換し得ることが知られている。
【0012】
図2は、OSの違いによるハーフトーン画像の違いの一例を説明する図である。
図2(a)は、ビット数が異なるOS(32ビットのWindows(登録商標)と64ビットのWindows(登録商標))が変換したハーフトーン画像を示す。
【0013】
図2(b)は
図2(a)の画像の丸253,254の部分を拡大した画像である。
図2(c)は
図2(b)の画像の丸253,254の部分を更に拡大した画像である。
図2(b)でもOSの違いによるハーフトーン画像の違いは明らかでない。しかし、
図2(c)の画像に示されるように、32ビットのOSで変換された画像では枠線が黒一色で表現されているのに対して、64ビットのOSで変換された画像では、CMYKが混在して枠線が表現されている。このことは
図2(c)を更に拡大した
図2(d)(e)及び
図2(f)(g)でも確認できる。
図2(d)(e)は32ビットのOSによるハーフトーン画像であり、
図2(f)(g)は64ビットのOSによるハーフトーン画像である。
【0014】
情報処理装置1000のOS及びプリンタドライバの少なくとも一方の違いは、
図1,
図2のような色の違いだけでなく、枠線の太さなど、様々な違いを生じさせることも確認されている。近年では、より新しいOSやプリンタドライバが次々と開発されており、新しいハードウェアも次々と更新されるため、一意の画像データが異なるハーフトーン画像に変換される機会も増えている。
【0015】
二つの画像が完全に一致するかどうかの照合は、画素ごとに画素値の差異が算出された差分画像を情報処理装置1000が生成することで容易に行うことができる。しかし、人間には違いがわからない差異まで品質基準を満たさないと印刷システムが判定すると、印刷システム(OS、プリンタドライバ、情報処理装置、印刷装置等、画質に影響する要素)に過剰品質が求められることになり現実的でない。
【0016】
人間が実際に視認し得る箇所のみを目視で観察し、違いを許容するか否かを人間が判定することも可能であるが、目視による照合は多大な労力を要する。そこで、人間の視覚モデルを再現したあいまい照合システムの構築が求められている。
【0017】
<本実施形態における画像の一致判定の概略>
そこで、本実施形態では、人間には違いがわからない差異をシステム側も許容するという、あいまいな判定を実現した。本実施形態では、情報処理装置が二つの画像の一致判定を以下のように行うことが特徴の一つとなっている。
(i)「知覚空間」で、(ii)「2段階のあいまい画像照合」を行うこと。
すなわち、(i) 本実施形態は、一般の信号空間ではなく、知覚空間を使う。
また、 (ii) 本実施形態は、注目領域ROI(Region Of Interest)の
(1)色差勾配
(2)色差平均
の2段階で二つの画像データを照合する。これにより、あいまい性を判定することができる。なお、一般的な信号空間とは、RGB、CMYK、XYZ等、画像を表す色空間をいう。
【0018】
一般的な画像照合は、指紋、顔画像、又は、印鑑(印影)などを対象として、情報処理装置が、比較の対象となる画像情報(形状、色などが変化している)を、マスターとなる画像と比較して真偽判定を行う。この方法は、人間の知覚的な一致度とは無関係に、信号処理的(画素値をそのまま比較する方法)に照合するため、本実施形態において目的とする人間の知覚的なあいまい照合に適用することができない。
【0019】
図3は、本実施形態において二つの画像が一致するか否かの判定の概略を説明する図である。本実施形態では、視覚モデルに基づいて、人間の知覚空間において二つの画像の照合を行い、視覚特性に基づいた照合判定(同一判定)を行う。
【0020】
入力画像は一つの同じRGB画像であるとする。OS又はプリンタドライバの少なくとも一方が異なる環境で変換された二つのCMYKハーフトーン画像(多値ハーフトーン画像)が用意される。入力画像が同一であるため、二つのハーフトーン画像は画像サイズも画像の中身も同一である。知覚画像変換部12は、人間の視覚フィルターをハーフトーン画像にかけることで、人間が脳で知覚している画像をそれぞれ生成する。このように、本実施形態は人のあいまい知覚に近い判定を行いたいので、画像信号空間ではなく、知覚空間を利用する。
【0021】
知覚画像変換部12には、既知の視覚フィルターを用いることとする。例えば、非特許文献1に視覚フィルターの一例が開示されている。非特許文献1は、人の視覚が、視距離と画像解像度に依存して変化することを利用している。すなわち、単位視野角あたりの画素数をパラメータとしており、例えば視距離50[cm]、解像度600[dpi] 等のパラメータを設定することによって、人間が脳で知覚している画像に変換する。
【0022】
次に、照合部13は、知覚画像変換部12で変換された二つの知覚画像にあいまい度を許容した2段階の照合を行う。照合は、二つの知覚画像間で対応する局所的な注目領域ROI(Region Of Interest)で行う。ROIの選択方法には任意性があるが、例えば人間の中心視野である2度視野とすればよい。本実施形態ではROIは矩形とするが、円形でもよい。
【0023】
知覚空間で色差が等しく変動している箇所は相対的に空間的な色変化が少ないため、人間は違いを視認しづらいという知見のもと、第1段階は、知覚画像変換部12が変換した二つの画像のROIが有する色差の勾配平均を照合に使用する。勾配の算出には、既知の方法を利用すればよい。例えば、照合部13はPrewittフィルターを利用すればよい。勾配平均が閾値以上のROIが一つでもあった場合には、照合部13は、二つのハーフトーン画像が不一致と判定する。
【0024】
第1段階で不一致とならなかった二つのハーフトーン画像に対して、照合部13は第2段階の照合を実施する。第1段階では空間的な色変化の大きい場合に不一致と判定したが、第2段階ではROI内の色差平均を用いることによって、第1段階の補完を行う。具体的には,色差平均が閾値以上のROIが一つでもあった場合には、照合部13は、二つのハーフトーン画像が不一致と判定する。
【0025】
以上のような処理により、本実施形態の情報処理装置は、人間の視覚認識に近いあいまい判定が可能になる。
【0026】
<用語について>
一つのカラー画像データから異なる処理で生成された二つの画像データとは、元の画像が同じだが、異なる画像処理で生成される画像データである。例えば、バージョンが異なっているプリンタドライバで生成された画像データ、又は、異なるOS上で動作するプリンタドライバで生成された画像データがある。二つの画像データがハーフトーン画像の場合、画像処理はディザ処理又は誤差拡散処理を含む場合がある。
【0027】
異なるOSとは、名称は同じだがOSのビット数が異なるOS、名称は同じだがバージョンが異なるOSなどである。異なるOSには、名称を含めて異なるOS(例えば、Windows(登録商標)とMAC OS(登録商標)、Linux(登録商標)とUNIX(登録商標)等)が含まれてもよい。
【0028】
また、異なるプリンタドライバには、バージョンが異なる他、機種共通ドライバと機種専用ドライバが含まれてよい。また、異なるプリンタドライバには、異なるOS(例えば、Windows(登録商標)とMAC OS(登録商標))向けのプリンタドライバが含まれてよい。
【0029】
知覚画像とは、人間の視覚特性に基づいて元の画像から変換された画像である。本実施形態では、S-CIELABという知覚画像を例にする。知覚画像は、この方法で作成されたものには限らない。
【0030】
<構成例>
図4は、同一判定を行う情報処理装置10又は情報処理システム100の一例の構成図である。本実施形態では、情報処理装置10が同一判定を行うシステム構成(
図4(a))と、サーバ30が同一判定を行うシステム構成(
図4(b))がある。
図4(a)のシステム構成では、情報処理装置10が記憶部に記憶されている二つの画像を取得して同一判定を行い、判定結果をディスプレイに出力する。判定結果はメールで送信してもよいし、記憶部に記憶しておいてもよい。また、クラウドに保存してもよい。
【0031】
情報処理装置10は、例えば、PC(Personal Computer)、タブレット端末、PDA(Personal Digital Assistant)、スマートフォン、電子黒板、印刷装置、又は、プロジェクタなど、ソフトウェアが動作するものであればよい。
【0032】
図4(b)の情報処理システム100では、情報処理装置10とサーバ30とがネットワークNを介して通信することができる。サーバとは、主にネットワーク上で情報処理を行う装置であり、ネットワークを介して受信した要求に対し処理結果を応答する装置をいう。
【0033】
図4(b)のシステム構成では、情報処理装置10が二つ以上の画像をサーバ30に送信する。サーバ30は画像の同一判定を行い、判定結果を情報処理装置10に送信する。判定結果はメールで送信してもよいし、クラウドに保存してもよい。
【0034】
図4(b)の構成では、サーバ30はいわゆるWebサーバとして、画像データを受け付けるポータル画面の画面情報(HTML、XML、スクリプト言語、及びCSS(Cascading Style Sheet)等で記述されており、主にブラウザソフトが解析して表示する情報)を生成して情報処理装置10に提供する。情報処理装置10でWebブラウザが動作しており、画面情報を受信してWebページを表示する。このWebページには情報処理装置10が保持する二つ以上の画像を登録するインターフェースがあり、ユーザーは二つ以上の画像をWebページに登録してサーバ30に送信する。
【0035】
なお、WebページはWebアプリにより提供されてもよい。Webアプリとは、ブラウザ上で動作するプログラミング言語(たとえばJavaScript(登録商標))によるプログラムとWebサーバ側のプログラムが協調することによって動作し、ブラウザ上で実行されるソフトウェア又はその仕組みを言う。WebアプリによりWebページを動的に変更できる。
【0036】
<ハードウェア構成例>
図5は、情報処理装置10又はサーバ30のハードウェア構成図である。ここでは、情報処理装置10のハードウェア構成であるとして説明する。
【0037】
図5に示されているように、情報処理装置10は、コンピュータによって構築されており、
図5に示されているように、CPU501、ROM502、RAM503、HD504、HDD(Hard Disk Drive)コントローラ505、ディスプレイ506、外部機器接続I/F(Interface)508、ネットワークI/F509、バスライン510、キーボード511、ポインティングデバイス512、DVD-RW(Digital Versatile Disk Rewritable)ドライブ514、メディアI/F516を備えている。
【0038】
これらのうち、CPU501は、情報処理装置10全体の動作を制御する。ROM502は、IPL等のCPU501の駆動に用いられるプログラムを記憶する。RAM503は、CPU501のワークエリアとして使用される。HD504は、プログラム等の各種データを記憶する。HDDコントローラ505は、CPU501の制御にしたがってHD504に対する各種データの読み出し又は書き込みを制御する。ディスプレイ506は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F508は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F509は、通信ネットワークを利用してデータ通信をするためのインターフェースである。バスライン510は、
図5に示されているCPU501等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
【0039】
また、キーボード511は、文字、数値、各種指示などの入力のために複数のキーを備えた入力手段の一種である。ポインティングデバイス512は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ514は、着脱可能な記録媒体の一例としてのDVD-RW513に対する各種データの読み出し又は書き込みを制御する。なお、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F516は、フラッシュメモリ等の記録メディア515に対するデータの読み出し又は書き込み(記憶)を制御する。
【0040】
<機能について>
図6は、情報処理装置10の機能をブロック状に分けて説明する機能ブロック図の一例である。なお、
図6では、特に断らない限り情報処理装置10の機能を想定して説明する。サーバ30の場合は更に通信部を有するという違いがあるものの、保持する機能は情報処理装置10と同様でよい。
【0041】
情報処理装置10は、比較画像入力部11、知覚画像変換部12、照合部13、及び、比較結果出力部14を有している。情報処理装置10が有するこれら各機能部は、
図5に示された各構成要素のいずれかが、HD504からRAM503に展開されたプログラムに従ったCPU501からの命令により動作することで実現される機能又は手段である。このプログラムは、専用のアプリでもよいし、Webブラウザでもよい。
【0042】
また、情報処理装置10は画像記憶領域19を有している。画像記憶領域19は
図5に示されたHD504やRAM503などにより実現される。画像記憶領域19は、比較元のハーフトーン画像、知覚画像、及び、比較結果の画像(後述する色差画像等)を記憶する。
【0043】
比較画像入力部11は、比較用の二つ以上の画像データを外部から受け取る。比較用の二つ以上の画像はハーフトーン画像でもよいし、そうでなくてもよい。本実施形態はハーフトーン画像に限らず適用できる。すなわち、次述の知覚画像変換部12はRGB、L*a*b*、又は、XYZ等を色空間とする画像データを知覚画像に変換できる。したがって、入力される画像はハーフトーン画像に限られない。
【0044】
なお、異なるOS又はプリンタドライバ等による画像処理を情報処理装置10が行い、比較用の二つ以上の画像データを生成できる場合、比較画像入力部11は入力画像(例えば、一つのRGB画像)を受け付けてもよい。
【0045】
二つ以上としたのは、例えば三つの画像から二つを取り出して比較することもできるためである。二つの画像データの提供元は、ネットワーク上の外部PC、ストレージサービス、NAS(Network Attached Storage)、可搬性の記憶媒体、又は、情報処理装置10内の別のモジュール(プリンタドライバ等)等、特に制限されない。また、入力される画像は、ユーザーが指定したものでも、提供元から送信されたものでもよい。比較画像入力部11は入力された二つの画像データを画像記憶領域19に保存する。
【0046】
知覚画像変換部12は、画像記憶領域19に保存された、比較対象の二つの画像データ(例えば、二つのハーフトーン画像)を取り出して、知覚画像に変換する。詳細は後述される。
【0047】
照合部13は、知覚画像の注目領域ROIにおいて、(1)色差勾配と(2)色差平均を比較して同一かどうかを判定する。
【0048】
比較結果出力部14は、照合部13の判定結果を外部に出力する。出力先は上記の提供元でもよいし、ネットワーク上のサーバでもよいし、情報処理装置10が有するディスプレイでもよい。
【0049】
<知覚画像への変換>
図7は、知覚画像への変換方法を説明する図である。
【0050】
S1:知覚画像変換部12は、入力された画像データ(ここではRGB画像とする)を、輝度(Lum)の画像と2種類の反対色画像(R/G 画像とB/Y 画像)に分解する。これは、網膜から入力された光の信号が、脳に至る経路で輝度信号と2種類の反対色信号に分解されるという学説に基づく。R/Gの反対色というのは、赤(R)と緑(G)の軸の信号である。人間はRとGを同時に知覚することはできないが、これは、全てのカラー信号はそれらの混合割合に分解できることを示す。B/Yの反対色も同様に、青(B)と黄(Y)の軸の混合割合を示す。赤(R)と緑(G)の軸と青(B)と黄(Y)の軸は直交する。更に、その2軸からなる平面に直交した軸として輝度信号の軸がある。
【0051】
S2:分解された3種類の画像信号に、知覚画像変換部12はそれぞれに空間フィルター260(spatial filter)をかけて、情報を圧縮する。これも、脳に至る経路に関する学説に基づく処理である。空間フィルター260はローパスフィルターだが、3種類の信号によってその形状が異なる。輝度信号は多くの情報がそのまま脳へ伝達されるので、ローパスフィルターの幅は狭く、反対色信号は情報が圧縮されてぼけた状態で脳に伝達されるので、フィルターの幅が広い。
図7では、この空間フィルター260のフィルター形状が、濃淡で示されている。Lumの白領域が狭いのは、フィルター幅が狭いことを意味している。
【0052】
S3:知覚画像変換部12は、3種類の信号を知覚的な表色系であるXYZ信号に変換する。
【0053】
S4:更に、知覚画像変換部12は、XYZ信号を、知覚的に均等とされる色空間であるCIELAB 空間に変換する。CIELAB 空間に変換された画像は、視覚系の空間フィルターを通した後の色という意味で、S-CIELAB と呼ばれる。本実施形態では、S-CIELABを知覚画像と称する。
【0054】
次に、
図8を参照して、知覚画像変換部12がハーフトーン画像を知覚画像に変換して出力するまでの過程を詳細に説明する。
図8は、知覚画像変換部12がハーフトーン画像を知覚画像に変換する手順を説明するフローチャート図の一例である。
【0055】
S11:まず、知覚画像変換部12は、CMYKのハーフトーンの各画素を式(1)でRGB 画像に変換する。
【数1】
【0056】
S12:次に、知覚画像変換部12は、式(2)(3)によって、RGB画像を輝度O1と反対色O2、O3の信号に変換する。
【数2】
【0057】
S13:次に、Oj(j=1,2,3)の各信号に対して、知覚画像変換部12が式(4)で空間フィルターをかける。
【数3】
【0058】
空間フィルターは、O1に対しては三つのガウシアン、O2とO3に対しては二つのガウシアンを加重混合した形になっている。式(4)の下式が一つのガウシアンフィルタである。x, yは画像座標、kj
iはEj
iの総和が1となるための正規化パラメータ、σj
iはガウシアンの標準偏差である。式(4)の上式が加重混合の式で、wj
iが重み、kjはフィルターfjの総和が1となるための正規化パラメータである。
【0059】
σ
j
iとw
j
iの値は人間の視覚特性から決定された値である。非特許文献1によれば、σ
j
iとw
j
iは表1の値を有する。
【表1】
【0060】
また、σ
j
iは視距離と印刷のdpiとの関係によって変化し、表1の値に以下を乗じることによって求められる。
【数4】
【0061】
式(5)は、視距離が大きい(離れる)ほど、またdpiが大きいほど、σが大きくなり、フィルター幅が大きいフィルターがかかるため、画像がぼけることを表す。
【0062】
以上を用いて、知覚画像変換部12は対応する空間フィルターをO1,O2,O3に畳み込み、XYZ色空間を経由して均等色空間であるCIELABに変換する。これが、S-CIELAB空間の画像(本実施形態では知覚画像という)である。
【0063】
情報処理装置10が二つのハーフトーン画像が同一かどうかを判定するためには、二つのハーフトーン画像をS-CIELAB空間に変換し、両者の色差画像を求める。
【0064】
<知覚画像>
図9はRGB画像を示し、
図10は
図9のRGB画像から求められた知覚画像の一例を示す。作図の制約上、
図9、
図10は白黒であるが、実際はカラー画像である。知覚画像は、RGB画像と比べて平坦化される傾向がある。
【0065】
<色差画像>
図11は、二つの知覚画像の差分として求められた色差画像の一例を示す。すなわち、一組の知覚画像に対して、照合部13が各画素(ドット)ごとに画素値の差分(色差値)を計算したものが色差画像である。色差値は0以上の値を取るので、照合部13が色差値をグレースケールの画素値に割り当てたものが色差画像である。
【0066】
図11では、色差値0(色差が無い部分)の画素が黒で表されている。色差がある画素(星型201の部分)がグレースケールに対応した灰色で表示されている。色差画像は、色が白に近いほど色差値が大きいことを意味する。
【0067】
次に、
図12を参照して、色差画像の色差平均について説明する。
図12は色差画像の色差平均の算出方法を説明する図である。
図13は照合部13が色差画像の色差平均を算出する手順を示すフローチャート図の一例である。
【0068】
まず、照合部13は色差画像に対してブロック202内の色差値の平均値を計算する(S101)。そのため一つのブロックで一つの色差平均値が算出される。ブロック202のサイズは任意である。このブロック202がROIに相当する。したがって、人間の官能試験などから実験的に定められるとよい。
【0069】
次に、照合部13はブロック202内の色差平均値が閾値を超えたかどうかを判定し、超えた場合はそのブロック202の判定結果としてNGを記憶する(S102)。超えない場合、照合部13はそのブロックの判定結果としてOKを記憶する。閾値は任意であるが、人間の官能試験などから実験的に定められる。
【0070】
次に、照合部13はブロック202の位置を縦又は横に一定距離移動させて同様に色差平均値を計算する(S103)。すなわち、左から右にブロック202を一定距離ずつ走査させ、右端に達したら左端に戻って右方向への走査を繰り返す。この一定距離は任意でよい。また、走査方向は左から右、上から下、又は、下から上でもよい。
【0071】
照合部13は色差画像の全体でブロック202の色差平均値を算出し、すべてのブロック202で判定結果がOKか否かを判定する(S104)。
【0072】
すべてのブロック202で判定結果がOKの場合、照合部13は、色差平均において色差画像全体の判定結果がOKであると判定する(S105)。
【0073】
一つのブロック202でも判定結果がNGの場合、照合部13は、色差平均において色差画像全体の判定結果がNGであると判定する(S106)。
【0074】
次に、
図14を参照して、色差画像の色差勾配平均について説明する。
図14は色差画像の色差勾配平均の算出方法を説明する図である。
図15は照合部13が色差画像の色差勾配平均を算出する手順を示すフローチャート図の一例である。
【0075】
まず、照合部13は色差画像に対してブロック203内の色差値の勾配を計算し、ブロック203内での勾配値の平均値を計算する(S201)。そのため一つのブロック203で一つの色差勾配平均値が算出される。ブロック203のサイズは任意である。勾配平均のブロック202と同じサイズでもよいし、異なってもよい。また、勾配の計算方法は任意であるが、例えばPrewittフィルター及びSobelフィルターなどが知られている。これらはグラディエント(勾配)フィルターや1次微分フィルターと呼ばれる場合があり、エッジ検出に使用される。照合部13はこれらを使用して縦方向と横方向のそれぞれで色差値の勾配を算出する。
【0076】
次に、照合部13はブロック203内の色差勾配平均値が閾値を超えたかどうかを判定し、超えた場合はそのブロック203の判定結果としてNGを記憶する(S202)。超えない場合はそのブロック203の判定結果としてOKを記憶する。閾値は任意であるが、人間の官能試験などから実験的に定められる。
【0077】
次に、照合部13はブロック203の位置を縦又は横に一定距離移動させて同様に色差勾配平均値を計算する(S203)。すなわち、左から右にブロック203を一定距離ずつ走査させ、右端に達したら左端に戻って右方向への走査を繰り返す。この一定距離は任意でよい。また、走査方向は左から右、上から下、又は、下から上でもよい。
【0078】
照合部13は色差画像の全体でブロック203の色差勾配平均値を算出し、すべてのブロック203で判定結果がOKか否かを判定する(S204)。
【0079】
すべてのブロック203で判定結果がOKの場合、照合部13は、色差勾配平均における色差画像全体の判定結果がOKであると判定する(S205)。
【0080】
一つのブロック203でも判定結果がNGの場合、照合部13は、色差勾配平均における色差画像全体の判定結果がNGであると判定する(S206)。
【0081】
図14は、例として勾配を計算した後の色差画像を示す。勾配が計算されているので色差が大きい部分である星型201の輪郭(エッジ)204が抽出されている。このようなエッジ部分ではブロックの判定結果としてNGが記憶される可能性が高い。
【0082】
<比較結果の表示例>
図16は、色差平均と色差勾配平均に基づく比較結果の表示例を示す図である。比較結果出力部14は、色差画像において、判定NGとなったブロックの領域を強調して表示する。
図16では、判定NGのブロックが赤い枠205で強調されている。
図16では、枠205内の色差平均値又は色差勾配平均値が閾値を超えたことを示している。
【0083】
図16では枠205が一つだが、複数のブロックで判定NGの場合、判定NGとなったブロックの数だけ複数の枠205が表示される。この場合、ブロックの移動距離とブロックサイズの設定次第で複数の枠205が一部重なることもあり得る。
【0084】
なお、比較結果出力部14は、色差平均で判定NGのブロックと色差勾配平均で判定NGのブロックを異なる色で強調してもよい。また、ユーザーの操作に応じて、色差平均で判定NGのブロックと色差勾配平均で判定NGのブロックの一方のみを比較結果出力部14が表示してもよい。
【0085】
<動作手順>
図17は、情報処理装置10が二つのハーフトーン画像を知覚画像に変換して、一致するか否かを判定する手順を示すフローチャート図の一例である。
【0086】
まず、比較画像入力部11が1組の比較画像(ハーフトーン画像でもよいし、そうでなくてもよい)を取得する(S21)。1組の比較画像は、例えば、32ビットのWindows(登録商標)でプリンタドライバが生成した画像データと、64ビットのWindows(登録商標)でプリンタドライバが生成した画像データである。あるいは、同じOS上でバージョンが異なるプリンタドライバが生成した画像データである。OSとプリンタドライバの両方が異なってもよい。
【0087】
次に、知覚画像変換部12は、受け取った1組の比較画像をそれぞれ知覚画像に変換する(S22)。
【0088】
次に、照合部13は二つの知覚画像から色差画像を生成する(S23)。色差画像とは、二つの知覚画像が有する各画素の差分である。
【0089】
照合部13は色差画像に対して下記をそれぞれ実施する(S24、S25)。
(ア) 色差画像の色差勾配平均算出
(イ) 色差画像の色差平均算出
【0090】
次に、照合部13は、それぞれ算出した値が閾値を超えるかどうか判定する(S26)。詳細は
図13,
図15で説明した。
【0091】
どちらの値も閾値を超えない場合、照合部13は、比較画像が同一と判定し、比較結果出力部14は判定OKを出力する(S27)。
【0092】
どちらか一方でも閾値を超える場合、照合部13は比較画像に差異有りと判定し(同一でない)、比較結果出力部14は判定NGを出力する(S28)。
【0093】
<画面例>
図18は、比較画像入力部11がディスプレイに表示する比較画像指定画面300の一例である。比較画像指定画面300は、比較元ファイル選択欄301、比較対象ファイル選択欄302、スタートボタン303、及び、キャンセルボタン304を有している。比較元ファイル選択欄301は、ユーザーが比較元の画像を指定する欄である。比較対象ファイル選択欄302は、ユーザーが比較対象の画像を指定する欄である。現行のOS又はプリンタドライバで作成された基準となる画像が比較元で、新しいOS又はプリンタドライバで作成された比較したい画像が比較対象である。ただし、どの画像を比較元又は比較対象とするかは、ユーザーの任意でよい。
【0094】
ユーザーは比較元画像と比較対象の画像ファイルを指定した後、スタートボタン303を押下する。これにより、
図17で説明した比較処理を開始することができる。また、ユーザーはキャンセルボタン304を押下することで比較処理を中止することができる。
【0095】
図19は、比較結果出力部14がディスプレイに表示する比較結果画面310の一例である。比較結果画面310は比較の対象となる二つの画像データ及び色差画像を一つの画面に表示する。比較結果画面310は、判定結果欄311、比較元画像欄312、比較対象画像欄313、及び、差分画像欄314を有している。
・判定結果欄311
比較画像が一致しているか不一致かをメッセージやアイコンなどで表示する。
・比較元画像欄312
比較元の画像を表示する。入力された画像データでも知覚画像でもよい。
・比較対象画像欄313
比較対象の画像を表示する。入力された画像データでも知覚画像でもよい。
・差分画像欄314(色差画像)
比較元の知覚画像と比較対象の知覚画像の色差画像である。色差画像は上記のブロックごとの判定結果によって色分けして表示される。
図19では黒の部分が差分なしを表す。白の部分が、差分はあるが人の目には判定がつかないため不一致としない箇所を表す。したがって、黒の部分は従来の信号処理(画素ごとに差分を算出する方法)で差異がないと判定された部分で、白の部分は従来の信号処理で差異があると判定された部分である。メッシュ部分315は色差画像に閾値以上の差分があるため、不一致と判定された箇所(ブロックの集まり)を示している。すなわち、メッシュ部分315はあいまい判定の結果、差異がある部分を示す。メッシュ部分315の各ブロックは赤色などで強調される。
【0096】
<あいまい判定の適用例>
図20,
図21を参照して、あいまい判定の適用例を説明する。
図20は、入力された2枚のハーフトーン画像の違いが、企業の目視判定員によっても視認されて不一致と判定された例である。
図20(a)(b)は異なる画像処理で生成されたハーフトーン画像である。
図20(c)は色差画像である。
図20(c)の箇所321が差分画像(信号処理的に双方で異なる部分)と判定された箇所であり、箇所320が、情報処理装置10があいまい判定を行った場合に同一でないと判定した場所である。この結果は、目視照合結果(箇所321は差異なし、箇所320は差異あり)と一致している。
【0097】
一方、
図21は、入力された2枚のハーフトーン画像の違いが、企業の目視判定員には視認されずに一致と判定された例である。
図21(a)(b)は異なる処理で生成されたハーフトーン画像である。
図21(c)は色差画像である。
図21(c)の箇所322が差分画像(信号処理的に双方で異なる部分)であり、信号処理的には違いが検出されて不一致となっている。また、
図21(c)では、情報処理装置10があいまい照合を行っても、不一致と判定した場所がない。これは、目視照合結果(箇所322は差異なし)と一致している。
【0098】
従来の信号処理に基づいた方法では、
図21の画像に対しては、いずれも不一致という結果となるが、視覚機能を考慮した本実施形態のあいまい照合では、人間の目視照合結果を実現できる。
【0099】
<その他の適用例>
以上、本発明を実施するための最良の形態について実施例を用いて説明したが、本発明はこうした実施例に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【0100】
例えば、
図6などの構成例は、情報処理装置10による処理の理解を容易にするために、主な機能に応じて分割したものである。処理単位の分割の仕方や名称によって本願発明が制限されることはない。情報処理装置10の処理は、処理内容に応じて更に多くの処理単位に分割することもできる。また、一つの処理単位が更に多くの処理を含むように分割することもできる。
【0101】
また、上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Dignal Processor)、FPGA(Field Programmable Gate Array)や従来の回路モジュール等のデバイスを含むものとする。
【符号の説明】
【0102】
10 情報処理装置
11 比較画像入力部
12 知覚画像変換部
13 照合部
14 比較結果出力部
【先行技術文献】
【特許文献】
【0103】
【非特許文献】
【0104】
【非特許文献1】Zhang Xuemei, and Brian A. Wandell, "A spatial extension of CIELAB for digital color image reproduction", SID International Symposium Digest of Technical Papers. Vol.27, 1996