(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024129379
(43)【公開日】2024-09-27
(54)【発明の名称】検証装置
(51)【国際特許分類】
G06V 30/418 20220101AFI20240919BHJP
G06V 30/194 20220101ALI20240919BHJP
G06V 30/14 20220101ALI20240919BHJP
G06V 30/12 20220101ALI20240919BHJP
【FI】
G06V30/418
G06V30/194
G06V30/14 340J
G06V30/12 C
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2023038549
(22)【出願日】2023-03-13
(71)【出願人】
【識別番号】000155469
【氏名又は名称】株式会社野村総合研究所
(74)【代理人】
【識別番号】100105924
【弁理士】
【氏名又は名称】森下 賢樹
(72)【発明者】
【氏名】矢野 康弘
(72)【発明者】
【氏名】谷 健司
【テーマコード(参考)】
5B029
5B064
5L096
【Fターム(参考)】
5B029CC27
5B064AA01
5B064AA10
5B064AB02
5B064CA08
5B064DA27
5B064EA29
5L096AA02
5L096AA06
5L096BA08
5L096BA17
5L096DA02
5L096FA12
5L096FA14
5L096FA44
5L096FA69
5L096GA51
5L096HA11
5L096JA11
(57)【要約】
【課題】複数種類のウェブブラウザの表示内容を示す複数の画像の同一性検証を支援する技術を提供する。
【解決手段】検証装置14は、比較すべき期待画像20と検証画像22とを取得する。検証装置14は、期待画像20と検証画像22それぞれの文字表示領域を検出する。検証装置14は、期待画像20と検証画像22それぞれの文字表示領域に表示された文字を認識する。検証装置14は、文字表示領域の位置の同一性と、文字表示領域に表示された文字の同一性とに基づいて、期待画像20と検証画像22とが一致するか否かを判定する。検証装置14は、期待画像20と検証画像22とが一致するか否かに関する検証結果24を提供する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
比較すべき第1画像と第2画像とを取得する画像取得部と、
前記第1画像と前記第2画像それぞれの文字表示領域を検出する文字検出部と、
前記第1画像と前記第2画像それぞれの文字表示領域に表示された文字を認識する文字認識部と、
前記文字表示領域の位置の同一性と、前記文字表示領域に表示された文字の同一性とに基づいて、前記第1画像と前記第2画像とが一致するか否かを判定する判定部と、
前記判定部による判定結果を出力する出力部と、
を備える検証装置。
【請求項2】
前記判定部は、前記第1画像の文字表示領域の位置と、前記第2画像の文字表示領域の位置とのずれが予め定められた許容範囲内である場合、前記第1画像の文字表示領域の位置と、前記第2画像の文字表示領域の位置とが同一であると判定する、
請求項1に記載の検証装置。
【請求項3】
縦方向の許容範囲は、横方向の許容範囲より大きく定められる、
請求項2に記載の検証装置。
【請求項4】
前記出力部は、前記判定結果を示す画像として、位置と文字の少なくとも一方が前記第1画像の文字表示領域と異なる前記第2画像の文字表示領域を、位置と文字の両方が前記第1画像の文字表示領域と同一である前記第2画像の文字表示領域と異なる態様で示す画像を出力する、
請求項1から3のいずれかに記載の検証装置。
【請求項5】
対応領域特定部をさらに備え、
前記第1画像と前記第2画像のそれぞれは、1つ以上の文字表示領域を含み、
前記対応領域特定部は、前記第1画像の各文字表示領域の位置および特徴点の情報と、前記第2画像の各文字表示領域の位置および特徴点の情報とに基づいて、前記第1画像の各文字表示領域と前記第2画像の各文字表示領域との対応関係を特定し、
前記判定部は、対応する前記第1画像の文字表示領域と前記第2画像の文字表示領域との間での位置の同一性と文字の同一性とに基づいて、前記第1画像と前記第2画像とが一致するか否かを判定する、
請求項1から3のいずれかに記載の検証装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示はデータ処理技術に関し、特に検証装置に関する。
【背景技術】
【0002】
近年、ウェブアプリケーションの要件として、複数種類のウェブブラウザへの対応が求められることが増加している。これまで、複数種類のウェブブラウザ間で表示内容の同一性を検証する場合、画像の左上から右下に向かって画素値を1つ1つ比較して、画素値の差分を得ることが行われていた(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
複数種類のウェブブラウザ間では、各ブラウザの仕様の違いによる表示のずれが恒常的に発生する。そのため、特許文献1のように画素単位で同一性を検証する方法では、複数種類のウェブブラウザ間での表示内容が常に不一致となる。そのため、複数種類のウェブブラウザの表示内容を示す複数の画像の同一性を検証する場合、画素単位で同一性を検証する方法は適切でない。
【0005】
本開示の技術はこうした課題に鑑みてなされたものであり、1つの目的は、複数種類のウェブブラウザの表示内容を示す複数の画像の同一性検証を支援する技術を提供することにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本開示のある態様の検証装置は、比較すべき第1画像と第2画像とを取得する画像取得部と、第1画像と第2画像それぞれの文字表示領域を検出する文字検出部と、第1画像と第2画像それぞれの文字表示領域に表示された文字を認識する文字認識部と、文字表示領域の位置の同一性と、文字表示領域に表示された文字の同一性とに基づいて、第1画像と第2画像とが一致するか否かを判定する判定部と、判定部による判定結果を出力する出力部とを備える。
【0007】
なお、以上の構成要素の任意の組合せ、本開示の表現をシステム、方法、コンピュータプログラム、コンピュータプログラムを格納した記録媒体などの間で変換したものもまた、本開示の態様として有効である。
【発明の効果】
【0008】
本開示の技術によれば、複数種類のウェブブラウザの表示内容を示す複数の画像の同一性検証を支援できる。
【図面の簡単な説明】
【0009】
【
図1】実施例のテスト検証支援システムの構成を示す図である。
【
図4】
図1の検証装置の機能ブロックを示すブロック図である。
【
図5】テスト検証支援システムの動作を示すフローチャートである。
【発明を実施するための形態】
【0010】
実施例の検証支援システムでは、比較すべき第1画像と第2画像のそれぞれに含まれる文字表示領域と、文字表示領域に表示された文字(文字列を含む)とを認識し、各画像で認識された文字表示領域と文字とに基づいて、第1画像と第2画像とが一致するか否かを判定する。これにより、複数のウェブブラウザ間での仕様の違いに基づく表示のずれ(変位量とも言える)を吸収し、複数のウェブブラウザ間での表示内容の同一性検証を支援できる。
【0011】
図1は、実施例の検証支援システム10の構成を示す。検証支援システム10は、ユーザ端末12と検証装置14を備える情報処理システムである。ユーザ端末12と検証装置14は、LAN・WAN・インターネット等を含み得る通信網を介して接続される。
【0012】
ユーザ端末12は、ウェブアプリケーションのテストの担当者(以下「ユーザ」と呼ぶ。)により操作される情報端末である。ユーザ端末12は、コンピュータ、タブレット端末またはスマートフォンであってもよい。ユーザ端末12は、ユーザの操作に応じて、比較すべき第1画像としての期待画像20と第2画像としての検証画像22とを検証装置14へ送信する。
【0013】
図2は、期待画像20の例を示す。期待画像20は、テスト対象のウェブアプリケーションが生成したウェブページの期待される表示内容を示す。期待画像20は、テスト対象のウェブアプリケーションが生成したウェブページを表示した第1のウェブブラウザのウィンドウのスクリーンショットでもよい。
【0014】
図3は、検証画像22の例を示す。検証画像22は、期待画像20と比較される画像であり、テスト対象のウェブアプリケーションが生成したウェブページの検証対象となる表示内容を示す。検証画像22は、期待画像20と一致することが期待される。検証画像22は、テスト対象のウェブアプリケーションが生成したウェブページを表示した、第1のウェブブラウザとは異なる第2のウェブブラウザのウィンドウのスクリーンショットでもよい。
【0015】
検証装置14は、期待画像20と検証画像22とが一致するか否かを判定する情報処理装置である。検証装置14は、期待画像20と検証画像22とが一致するか否かに関する検証結果24をユーザ端末12へ送信する。
【0016】
図4は、
図1の検証装置14の機能ブロックを示すブロック図である。本明細書のブロック図で示す各ブロックは、ハードウェア的には、コンピュータのプロセッサ、CPU、メモリをはじめとする素子や電子回路、機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組合せによっていろいろなかたちで実現できることは、当業者には理解されるところである。
【0017】
検証装置14は、データ処理部30、記憶部32、通信部34を備える。データ処理部30は、データ処理および演算処理を実行する。記憶部32は、データ処理部30により参照または更新されるデータを記憶する。通信部34は、所定の通信プロトコルにしたがって外部装置と通信する。データ処理部30は、通信部34を介して、外部装置(例えばユーザ端末12)から送信されたデータを取得し、また、外部装置に対してデータを送信する。
【0018】
記憶部32は、モデル記憶部36、画像記憶部38、検証結果記憶部40を含む。モデル記憶部36は、画像データから文字表示領域を検出する数理モデル(以下「文字検出モデル」とも呼ぶ。)を記憶する。文字表示領域は、画像において1つ以上の文字(例えば「部店コード」や「口座番号」等の文字列)が描かれた領域とも言え、バウンディングボックスとも言える。また、モデル記憶部36は、文字表示領域に表示された1つ以上の文字を認識する数理モデル(以下「文字認識モデル」とも呼ぶ。)をさらに記憶する。文字検出モデルと文字認識モデルのそれぞれは、機械学習に基づく関数近似器(例えばニューラルネットワーク)として実装されてもよい。
【0019】
文字検出モデルは、画像データの入力を受け付け、その画像に描かれた文字表示領域の位置とサイズを出力する。具体的には、文字検出モデルは、文字表示領域の中心位置の座標(X,Y)、幅(W)、高さ(H)を出力する。実施例の文字検出モデルでは、BackboneにCSPDarknet、NeckにPANet(Path Aggregation Network)を用いたアンカー方式の物体検出モデルアルゴリズムを採用した。
【0020】
文字認識モデルは、画像データと文字表示領域の位置とサイズの入力を受け付け、その文字表示領域に表示された1つ以上の文字を出力する。実施例の文字検出モデルでは、「An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition」アルゴリズムを採用した。文字認識においては、ディープラーニングベースのCRNN(Convolutional Recurrent Neural Network)が主流であるが、上記アルゴリズムでは、精度向上のため、RNNではなくLSTM(Long Short Term Memory)を採用している。なお、文字検出モデルと文字認識モデルの少なくとも一方に、公知のモデルを採用してもよい。
【0021】
画像記憶部38は、ユーザ端末12からアップロードされた期待画像20と検証画像22とを記憶する。検証結果記憶部40は、期待画像20と検証画像22とが一致するか否かに関する検証結果24を記憶する。検証結果24は、後述の判定部50による判定結果を含む。
【0022】
データ処理部30は、画像取得部42、文字検出部44、文字認識部46、対応領域特定部48、判定部50、検証結果出力部52を含む。これら複数の機能ブロックの機能は、コンピュータプログラムに実装されてもよく、このコンピュータプログラムは、記録媒体またはネットワークを介して、検証装置14のストレージにインストールされてもよい。検証装置14のプロセッサ(CPU等)は、このコンピュータプログラムをメインメモリに読み出して実行することにより、上記複数の機能ブロックの機能を発揮してもよい。
【0023】
画像取得部42は、ユーザ端末12から送信された期待画像20と検証画像22を取得して画像記憶部38に格納する。
【0024】
文字検出部44は、モデル記憶部36に記憶された文字検出モデルを用いて、期待画像20に含まれる1つ以上の文字表示領域を検出する。また、文字検出部44は、文字検出モデルを用いて、検証画像22に含まれる1つ以上の文字表示領域を検出する。文字検出部44は、公知の文字検出技術を用いて実現されてもよい。
【0025】
文字認識部46は、モデル記憶部36に記憶された文字認識モデルを用いて、期待画像20の各文字表示領域に表示された文字を認識する。また、文字認識部46は、文字認識モデルを用いて、検証画像22の各文字表示領域に表示された文字を認識する。文字認識部46は、公知の文字認識技術を用いて実現されてもよい。また、文字検出部44の機能と文字認識部46の機能の少なくとも一方は、公知のOCR(Optical character recognition)技術を用いて実現されてもよい。
【0026】
対応領域特定部48は、期待画像20の各文字表示領域に関する属性情報と、検証画像22の各文字表示領域に関する属性情報とに基づいて、期待画像20の各文字表示領域と検証画像22の各文字表示領域との対応関係を特定する。言い換えれば、対応領域特定部48は、対応する期待画像20の文字表示領域と検証画像22の文字表示領域との組を特定する。
【0027】
例えば、対応領域特定部48は、期待画像20の或る位置に配置された文字表示領域(例えば
図2の期待画像20における文字列「口座番号」が表示された文字表示領域)と、検証画像22の上記位置の近傍範囲に配置された文字表示領域(例えば
図3の検証画像22における文字列「口座番号」が表示された文字表示領域)とを対応するものとして特定する。各文字表示領域に関する属性情報は、各文字表示領域の位置、サイズおよび特徴点の情報を含む。
【0028】
判定部50は、期待画像20の文字表示領域の位置と検証画像22の文字表示領域の位置との同一性と、期待画像20の文字表示領域に表示された文字(文字列)と検証画像22の文字表示領域に表示された文字(文字列)の同一性とに基づいて、期待画像20と検証画像22とが一致するか否かを判定する。実施例では、判定部50は、対応領域特定部48により特定された、対応する期待画像20の文字表示領域と検証画像22の文字表示領域との間での位置の同一性と文字の同一性とに基づいて、期待画像20と検証画像22とが一致するか否かを判定する。
【0029】
検証結果出力部52は、判定部50による判定結果を出力する。実施例では、検証結果出力部52は、判定部50による判定結果のデータを含む検証結果24を検証結果記憶部40に格納する。検証結果出力部52は、ユーザ端末12からの要求に応じて、検証結果24をユーザ端末12へ送信してもよい。
【0030】
以上の構成による検証支援システム10の動作を説明する。
ウェブアプリケーションのテストでは、テスト対象のウェブアプリケーションが生成したウェブページのデータを第1のウェブブラウザに表示させた画面のスクリーンショット(第1画像)と、同じウェブページのデータを第2のウェブブラウザに表示させた画面のスクリーンショット(第2画像)とが成果物として保存される。
【0031】
ユーザは、テスト対象のウェブアプリケーションがマルチブラウザ対応の要件を満たしていることを確認するため、第1画像を期待画像20として検証装置14にアップロードし、第2画像を検証画像22として検証装置14にアップロードする。すなわち、ユーザ端末12は、ユーザの操作に応じて、期待画像20および検証画像22を含む検証要求を検証装置14へ送信する。
【0032】
図5は、検証装置14の動作を示すフローチャートである。検証装置14の画像取得部42は、ユーザ端末12から送信された、期待画像20および検証画像22を取得してモデル記憶部36に格納する(S10)。
【0033】
検証装置14の文字検出部44は、予めモデル記憶部36に記憶された文字検出モデルに期待画像20を入力し、文字検出モデルから出力された、期待画像20に含まれる1つ以上の文字表示領域それぞれの中心位置の座標、幅、高さの情報を取得する。また文字検出部44は、文字検出モデルに検証画像22を入力し、文字検出モデルから出力された、検証画像22に含まれる1つ以上の文字表示領域それぞれの中心位置の座標、幅、高さの情報を取得する(S12)。以下、文字表示領域の中心位置の座標、幅、高さの情報を、文字表示領域の属性情報とも呼ぶ。
【0034】
検証装置14の文字認識部46は、予めモデル記憶部36に記憶された文字認識モデルに期待画像20と、期待画像20の各文字表示領域の属性情報とを入力し、文字認識モデルから出力された、期待画像20の各文字表示領域に描かれた文字列の情報を取得する。また、文字認識部46は、文字認識モデルに検証画像22と、検証画像22の各文字表示領域の属性情報とを入力し、文字認識モデルから出力された、検証画像22の各文字表示領域に描かれた文字列の情報を取得する(S14)。
【0035】
検証装置14の対応領域特定部48は、期待画像20の各文字表示領域から特徴点を検出し、検出した特徴点の情報を取得する。特徴点は、角(コーナー)や輝度の勾配に基づいて検出されてもよい。特徴点の情報は、実施例では、AKAZE(Accelerated KAZE)特徴量とする。対応領域特定部48は、期待画像20の各文字表示領域の属性情報として、各文字表示領域の中心位置の座標、幅、高さ、AKAZE特徴量を特定する。同様に、対応領域特定部48は、検証画像22の書く文字表示領域の属性情報として、各文字表示領域の中心位置の座標、幅、高さ、AKAZE特徴量を特定する。
【0036】
対応領域特定部48は、期待画像20の各文字表示領域の中心位置の座標、幅、高さ、AKAZE特徴量と、検証画像22の各文字表示領域の中心位置の座標、幅、高さ、AKAZE特徴量とに基づいて、期待画像20と検証画像22との間で対応する文字表示領域の組を特定する(S16)。例えば、対応領域特定部48は、中心位置の座標、幅、高さ、AKAZE特徴量のそれぞれの差異が所定の閾値内の期待画像20の文字表示領域と検証画像22の文字表示領域を対応するものとして特定してもよい。
【0037】
検証装置14の判定部50は、対応する期待画像20の文字表示領域と検証画像22の文字表示領域の組ごとに、位置の同一性と表示された文字(文字列)の同一性とを判定する(S18)。実施例では、判定部50は、対応する期待画像20の文字表示領域と検証画像22の文字表示領域の全ての組に亘って、位置が同一でかつ文字も同一と判定される場合に、期待画像20と検証画像22が一致すると判定する。言い換えれば、判定部50は、対応する期待画像20の文字表示領域と検証画像22の文字表示領域の少なくとも1つの組において、位置と文字の少なくとも一方が異なる場合に、期待画像20と検証画像22が不一致と判定する。
【0038】
判定部50は、期待画像20の文字表示領域の位置と検証画像22の文字表示領域の位置とにずれがあっても、そのずれが予め定められた許容範囲内である場合、期待画像20の文字表示領域の位置と、検証画像22の文字表示領域の位置とを同一と判定する。言い換えれば、判定部50は、期待画像20の文字表示領域の位置と検証画像22の文字表示領域の位置とのずれの大きさが、許容範囲を超過した場合、期待画像20の文字表示領域の位置と、検証画像22の文字表示領域の位置とを不一致と判定する。
【0039】
判定部50は、期待画像20の文字表示領域の位置と検証画像22の文字表示領域の位置とのずれとして、期待画像20の文字表示領域の中心座標と、検証画像22の文字表示領域の中心座標とのずれを算出してもよい。許容範囲は、閾値とも言え、ピクセル単位で定められてもよい。期待画像20の文字表示領域の位置と検証画像22の文字表示領域の位置とのある程度のずれを許容することで、複数のウェブブラウザ間で文字表示領域の位置が厳密には異なる場合でも、実質的な位置の同一を判定することができる。
【0040】
実施例では、判定部50は、期待画像20の文字表示領域の位置と検証画像22の文字表示領域の位置との縦方向のずれが予め定められた縦方向のずれ許容範囲内であって、かつ、横方向のずれが予め定められた横方向のずれ許容範囲内である場合に、期待画像20の文字表示領域の位置と、検証画像22の文字表示領域の位置とを同一と判定する。
【0041】
縦方向のずれ許容範囲は、横方向のずれ許容範囲より大きく定められる。例えば、縦方向のずれ許容範囲が20ピクセルである一方、横方向のずれ許容範囲が10ピクセルであってもよい。縦方向のずれは、横方向のずれより、ウェブページのユーザビリティへの影響度が比較的小さい。そこで、横方向のずれ許容範囲より縦方向のずれ許容範囲を大きくすることにより、文字表示領域位置の同一範囲を、ユーザビリティを加味して一層適切に設定することができる。
【0042】
なお、縦方向のずれ許容範囲および横方向のずれ許容範囲は、ユーザの知見や検証支援システム10を用いた実験により適切な値が決定されてもよい。また、ユーザ端末12は、ユーザにより決定された許容範囲のデータを検証装置14に登録してもよい。検証装置14の判定部50は、ユーザ端末12から登録された許容範囲の値を用いて、上記の判定を実行してもよい。
【0043】
判定部50は、期待画像20と検証画像22が一致するか否かに関する検証結果(言い換えれば判定結果)を示すデータ(
図1の検証結果24)として、比較結果レポートおよび比較画像を生成して検証結果記憶部40に格納する(S20)。検証結果出力部52は、検証結果記憶部40に記憶された比較結果レポートおよび比較画像を、検証要求元のユーザ端末12に送信する(S22)。
【0044】
比較結果レポートは、検証実行日、期待画像20のファイル名、検証画像22のファイル名、比較画像のファイル名、期待画像20と検証画像22の比較結果(「一致」または「不一致」)を含む。
【0045】
比較画像は、期待画像20に対応する第1比較画像と、検証画像22に対応する第2比較画像を含む。
図6は、第1比較画像60の例を示す。第1比較画像60は、期待画像20の各文字表示領域にその外縁を示す画像(以下「文字枠62」と呼ぶ。)を付加したものである。判定部50は、期待画像20から検出された1つ以上の文字表示領域のそれぞれに文字枠62を付加することにより第1比較画像60を生成する。
【0046】
図7は、第2比較画像70の例を示す。判定部50は、検証画像22から検出された1つ以上の文字表示領域のそれぞれに文字枠を付加することにより第2比較画像70を生成する。ただし、判定部50は、位置と文字の少なくとも一方が期待画像20の文字表示領域と異なる検証画像22の文字表示領域を、位置と文字の両方が期待画像20の文字表示領域と同一である検証画像22の文字表示領域とは異なる態様で示す第2比較画像70を生成する。
【0047】
具体的には、判定部50は、検証画像22の複数の文字表示領域のそれぞれに対して、対応する期待画像20の文字表示領域と位置と文字の両方が一致する場合には一致文字枠72を付加し、対応する期待画像20の文字表示領域と位置と文字の少なくとも一方が不一致の場合には不一致文字枠74を付加する。言い換えれば、判定部50は、検証画像22の複数の文字表示領域のうち期待画像20の文字表示領域と一致するものには一致文字枠72を付加し、期待画像20の文字表示領域と不一致のものには不一致文字枠74を付加する。
図7では、文字列「200」を表示する文字表示領域の位置が、対応する期待画像20の文字表示領域と不一致である(具体的には横方向のずれが横方向の許容範囲を超過した)ため、「200」を表示する文字表示領域に不一致文字枠74が付加されている。
【0048】
また、判定部50は、対応する期待画像20の文字表示領域と位置が不一致である検証画像22の文字表示領域が存在する場合、上記対応する期待画像20の文字表示領域の位置に期待文字枠76を配置する。期待文字枠76は、不一致文字枠74が付加された文字表示領域が本来あるべき位置を示すものである。一致文字枠72、不一致文字枠74、期待文字枠76には、互いに異なる外観が設定される。例えば、枠線の色、種類(実線、破線等)、幅、または塗りつぶしの態様が異なってもよい。さらにまた、判定部50は、不一致文字枠74の中心と期待文字枠76の中心とを結ぶ線(差分線78)を配置する。
【0049】
図8も、第2比較画像70の例を示す。
図8は、文字の不一致が検出され、具体的には、期待される文字列「預託」とは異なる文字列「本人」を表示する文字表示領域が検出された場合の第2比較画像70を示している。判定部50は、対応する期待画像20の文字表示領域と文字が不一致の文字表示領域に対して不一致文字枠74を付加する。
【0050】
このように、検証結果として、
図6に示したような第1比較画像60と、
図7および
図8に示したような第2比較画像70を提供することにより、期待画像20と検証画像22との差異をユーザに分かり易く提示できる。なお、
図7の第2比較画像70で示す位置の不一致、または、
図8の第2比較画像70で示す文字の不一致が検出された場合、判定部50は、比較結果レポートの比較結果を「不一致」に設定する。
【0051】
実施例の検証装置14は、文字表示領域の位置の同一性と文字の同一性とに基づいて、期待画像20と検証画像22とが一致するか否かを判定する。複数のウェブブラウザ間では画素値レベルの差異がどうしても生じうるが、検証装置14は、文字表示領域が実質的に一致するならば期待画像20と検証画像22とを一致すると判定することで、期待画像20と検証画像22とが一致するか否かの検証を効果的に支援できる。また、検証装置14は、期待画像20と検証画像22の対応する文字表示領域間で同一性を判定することで、期待画像20と検証画像22とが一致するか否かの判定精度を高めることができる。
【0052】
以上、本開示を実施例をもとに説明した。実施例に記載の内容は例示であり、実施例の構成要素や処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本開示の範囲にあることは当業者に理解されるところである。
【0053】
上記実施例の検証装置14が備えた複数の機能ブロックの機能は、複数の情報処理装置(クラウド上のサーバを含む)に分散して実装されてもよい。この場合、複数の情報処理装置がシステムとして連携することにより、実施例の検証装置14と同様の処理が実行されてもよい。
【0054】
上述した実施例および変形例の任意の組み合わせもまた本発明の実施の形態として有用である。組み合わせによって生じる新たな実施の形態は、組み合わされる実施例および変形例それぞれの効果をあわせもつ。また、請求項に記載の各構成要件が果たすべき機能は、実施例および変形例において示された各構成要素の単体もしくはそれらの連携によって実現されることも当業者には理解されるところである。
【符号の説明】
【0055】
10 検証支援システム、 12 ユーザ端末、 14 検証装置、 42 画像取得部、 44 文字検出部、 46 文字認識部、 48 対応領域特定部、 50 判定部、 52 検証結果出力部。