【文献】
森 拓真 TAKUMA MORI,アモーダル補完を利用した動画CAPTCHAの提案 Proposal of MOVIE CAPTHCA Method using amodal completion,マルチメディア,分散,協調とモバイル(DICOMO2011)シンポジウム論文集 情報処理学会シンポジウムシリーズ Vol.2011 No.1 [CD−ROM] IPSJ Symposium Series,日本,一般社団法人情報処理学会,2011年 8月 3日,第2011巻,pp.1518〜1525
【文献】
Gossweiler, R., et al.,What's up CAPTCHA?: a CAPTCHA based on image orientation,In Proceedings of the 18th international conference on World wide web (WWW '09),2009年 4月,pp. 841-850,[retrieved on 2014-03-05.] Retrieved from the Internet,URL,http://dx.doi.org/10.1145/1526709.1526822
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0015】
以下、図面を参照し、本発明の実施形態について説明する。
【0016】
<試験システムの説明>
図1は、本発明の一実施形態に係る試験システム1の概略的な構成を示すブロック図である。
試験システム1は、コンテンツサーバ装置11と、画像収集装置12と、画像データベース13と、画像生成装置14と、認証サーバ装置15と、端末装置21を備える。
【0017】
ここで、
図1の例では、コンテンツサーバ装置11、画像収集装置12、画像データベース13、画像生成装置14、認証サーバ装置15および端末装置21に関し、主な接続関係を示してある。これらの装置11〜15、21は、例えば、同一の回線(ネットワーク)に接続されてもよい。回線としては、有線の回線が用いられてもよく、または、無線の回線が用いられてもよい。
端末装置21は、例えば、PC、または、スマートフォンなどである。端末装置21は、回線を介して、認証サーバ装置15と接続される。
なお、端末装置21が無線通信を行う場合には、例えば、認証サーバ装置15と端末装置21との間の通信を中継する基地局装置が備えられてもよい。この場合、基地局装置は、端末装置21との間で無線の回線を介して通信し、認証サーバ装置15との間で有線の回線を介して通信する。
【0018】
試験システム1において行われる動作の概要を示す。
コンテンツサーバ装置11は、画像を含むコンテンツの情報を提供する。
画像収集装置12は、コンテンツサーバ装置11により提供される画像の情報を取得して収集する。画像収集装置12は、取得された画像の情報を画像データベース13に記憶させる。ここで、画像収集装置12は、例えば、任意のカテゴリに属する画像の情報を収集してもよく、または、特定のカテゴリに属する画像の情報を収集してもよい。
画像データベース13は、画像の情報を記憶するデータベースである。
画像生成装置14は、画像データベース13に記憶された画像の情報を取得する。画像生成装置14は、取得された画像の情報を用いて、所定の処理を実行して、試験用の画像(試験用画像)の情報を生成する。画像生成装置14は、生成された試験用画像の情報を画像データベース13に記憶させる。
【0019】
認証サーバ装置15は、画像データベース13に記憶された試験用画像の情報を取得する。認証サーバ装置15は、取得された試験用画像の情報を用いて試験を行う情報(試験情報)を端末装置21に送信する。認証サーバ装置15は、端末装置21から回答情報を受信する。認証サーバ装置15は、受信された回答情報について正否(正解であるか否か)を判定する。認証サーバ装置15は、この判定の結果の情報(正否情報)を端末装置21に送信する。
端末装置21は、認証サーバ装置15から試験情報を受信する。端末装置21は、受信された試験情報に基づいて、ユーザに対して試験(問題の出題)を行う。端末装置21は、試験に対する回答をユーザから受け付ける。端末装置21は、受け付けられた回答の情報(回答情報)を認証サーバ装置15に送信する。端末装置21は、認証サーバ装置15から正否情報を受信する。端末装置21は、受信された正否情報に基づいて所定の処理を行う。
【0020】
試験は、例えば、端末装置21により所定の情報のダウンロードを実行するときに行われる。認証サーバ装置15は、試験に対する回答が正解であった場合に、端末装置21に対して当該ダウンロードを許可し、一方、試験に対する回答が正解でなかった(不正解であった)場合に、端末装置21に対して当該ダウンロードを許可しない(拒否する)。端末装置21および認証サーバ装置15では、一例として、正解である場合に、所定の処理として、当該ダウンロードを実行し、一方、不正解である場合に、所定の処理として、当該ダウンロードを実行しない(拒否する)。なお、試験は、ダウンロード以外の様々な場面で用いられてもよい。
【0021】
ここで、本実施形態では、認証サーバ装置15が、試験用画像の情報を用いて試験情報を生成する。他の構成例として、他の装置(一例として、画像生成装置14)が、試験用画像の情報を用いて試験情報を生成して、生成された試験情報を認証サーバ装置15に出力してもよい。
また、本実施形態では、認証サーバ装置15が正否情報を端末装置21に送信し、端末装置21が当該正否情報に基づいて所定の処理を行う。他の構成例として、認証サーバ装置15が、正否情報を送信する処理の代わりに、正否に基づいて所定の処理を行ってもよい。
【0022】
<端末装置および認証サーバ装置の構成例>
図2は、本発明の一実施形態に係る端末装置21の概略的な構成を示すブロック図である。
端末装置21は、通信部101と、記憶部102と、表示部103と、操作部104と、制御部105を備える。制御部105は、表示画像制御部121を備える。
通信部101は、外部の装置と通信を行う。本実施形態では、通信部101は、直接または間接に、認証サーバ装置15との間で情報の通信を行う。
記憶部102は、情報を記憶する。
表示部103は、情報を画面に表示する。
操作部104は、人間により行われる操作を受け付ける。操作部104は、例えば、キーあるいはマウスなどであってもよい。また、操作部104と表示部103とが一体化されたタッチパネルの画面が用いられてもよい。
制御部105は、端末装置21における各種の処理の制御を行う。一例として、制御部105は、CPU(Central Processing Unit)などのプロセッサを用いて構成され、記憶部102に記憶されたプログラムを読み出して実行することにより、各種の制御を行う。
制御部105の機能の一例として、表示画像制御部121は、表示部103により表示する画像を制御する。
【0023】
図3は、本発明の一実施形態に係る認証サーバ装置15の概略的な構成を示すブロック図である。
認証サーバ装置15は、通信部201と、記憶部202と、制御部203を備える。制御部203は、判定部221を備える。
通信部201は、外部の装置と通信を行う。本実施形態では、通信部201は、直接または間接に、端末装置21および画像データベース13との間で情報の通信を行う。
記憶部202は、情報を記憶する。
制御部203は、認証サーバ装置15における各種の処理の制御を行う。一例として、制御部203は、CPUなどのプロセッサを用いて構成され、記憶部202に記憶されたプログラムを読み出して実行することにより、各種の制御を行う。
制御部203の機能の一例として、判定部221は、試験に対する回答の正否を判定する。
【0024】
本実施形態では、認証サーバ装置15は、通信部201により、試験情報を送信し、回答情報を受信し、正否情報を送信する。
また、端末装置21は、通信部101により、試験情報を受信し、回答情報を送信し、正否情報を受信する。
【0025】
<試験の具体例>
図4は、本発明の一実施形態に係る画像1001の一例を示す図である。
本実施形態では、画像1001の情報を元の画像の情報として用いて試験用画像が生成された場合を示す。
【0026】
図5(A)および
図5(B)は、本発明の一実施形態に係る試験の画面表示の例を示す図である。端末装置21において、表示画像制御部121により行われる制御により、表示部103の画面に、試験の画面表示を行う。
図5(A)に示される画面表示1021では、上側に試験用画像1031が表示され、下側にバー1051、バー1051に対して左側のボタン1052、およびバー1051に対して右側のボタン1053が表示される。
試験用画像1031は、元の画像1001に複数(
図5(A)および
図5(B)の例では、7個)の円の領域A1〜A7が設けられ、各領域A1〜A7の内部の画像(元の画像1001における画像部分)だけを抽出して表示する画像である。試験用画像1031において、各領域A1〜A7の外部は、黒または白など、元の画像1001ではない画像部分となっている。また、各領域A1〜A7の内部の画像は、各領域A1〜A7の内部の中心点(本実施形態では、円の中心点)を中心軸として、同一の角度だけ回転させることが可能である。
【0027】
ここで、本実施形態では、複数の領域A1〜A7の内部の画像が元の画像1001と同一の配置となる状態が正解であるとする。そして、他の状態が不正解であるとする。
図5(A)に示される試験用画像1031の配置の状態は不正解の状態である。試験では、まず、不正解の状態にある試験用画像1031が問題として出題される。
図5(A)に示される試験用画像1031は、試験の問題の一例である。ユーザによりボタン1052またはボタン1053が操作されると、各領域A1〜A7の内部の画像が同時に同一の回転方向に同一の角度だけ回転させられる。一方のボタン1052と他方のボタン1053は、互いに逆の方向の回転を指示するボタンである。バー1051は、その長さで回転の状態(角度)を表す。なお、回転を指示する操作としては、他の任意の操作が用いられてもよい。
【0028】
図5(B)に示される画面表示1022では、試験用画像1032の配置の状態が正解の状態である。
例えば、問題の出題として、
図5(A)に示される画面表示1021が行われる。その後、人間の操作によって各領域A1〜A7の内部の画像が回転させられる。そして、人間により所定の操作(例えば、確定のボタンの操作)が行われると、そのときの画面表示の状態を示す回答情報が端末装置21から認証サーバ装置15に送信される。この回答情報が正解の状態を示す場合には認証サーバ装置15において判定部221により正解であることが判定され、一方、他の場合には認証サーバ装置15において判定部221により不正解であることが判定される。
【0029】
なお、人間の操作が完ぺきではない可能性があることを考慮して、例えば、
図5(B)に示される試験用画像1032の配置の状態(正解の状態)に対して、所定の量以内のズレがある状態についても、正解の状態であるとみなす構成が用いられてもよい。所定の量のズレとしては、任意の量のずれが用いられてもよく、一例として、回転角度に関して5度程度のズレが用いられてもよい。
【0030】
<画像生成装置の構成例>
図6は、本発明の一実施形態に係る画像生成装置14の概略的な構成を示すブロック図である。
画像生成装置14は、通信部301と、記憶部302と、制御部303を備える。制御部303は、領域設定部321と、画像選択部322と、相関検出部323を備える。
通信部301は、外部の装置と通信を行う。本実施形態では、通信部301は、直接または間接に、画像データベース13との間で情報の通信を行う。
記憶部302は、情報を記憶する。
制御部303は、画像生成装置14における各種の処理の制御を行う。一例として、制御部303は、CPUなどのプロセッサを用いて構成され、記憶部302に記憶されたプログラムを読み出して実行することにより、各種の制御を行う。
【0031】
制御部303の機能の一例として、領域設定部321は、所定の規則にしたがって、画像に所定の領域を設定し、試験用画像の情報(実際に試験に使用される情報以外に、候補が含まれてもよい。)を生成する。
制御部303の機能の一例として、画像選択部322は、所定の条件に基づいて、試験用画像の情報として採用する画像の情報を選択し、試験用画像の情報として採用しない画像の情報を対象から排除する。画像選択部322は、例えば、試験用画像の情報を生成するために使用される画像(元の画像)の情報、または、元の画像の情報から試験用画像の情報を生成するまでの途中の画像の情報(例えば、候補)に基づいて、画像を選択するか否かを決定する。
制御部303の機能の一例として、相関検出部323は、複数の領域に関して、所定の相関に関する情報を検出する。
【0032】
<試験用画像の情報の生成の説明>
画像生成装置14では、制御部303の領域設定部321が、画像(元の画像)の情報から試験用画像の情報を生成する。試験用画像を生成する手法(所定の規則)は、例えば、あらかじめ設定されている。
試験用画像の情報を生成する手法の一例を示す。
【0033】
まず、領域設定部321は、元の画像のサイズが所定のサイズより大きい場合には、当該元の画像の情報を当該所定のサイズを有する画像の情報に変換する。本実施形態では、画像のサイズは、水平方向(横方向)のピクセル(画素)の数(N個)と、垂直方向(縦方向)のピクセル(画素)の数(M個)で規定される。画像は、合計で(N×M)個のピクセルを含む。NおよびMは、それぞれ任意の値であってもよい。所定のサイズとしては、水平方向のピクセルの数と垂直方向のピクセルの数が異なってもよく、一例として、N=1920、M=1080が用いられる。
具体的には、領域設定部321は、元の画像のサイズ(水平方向のサイズおよび垂直方向のサイズの両方)が所定のサイズである場合には、当該元の画像の情報をそのまま使用して後続の処理を実行する。一方、領域設定部321は、元の画像のサイズ(水平方向のサイズおよび垂直方向のサイズのうちの一方または両方)が所定のサイズより大きい場合には、当該元の画像のサイズ(水平方向のサイズおよび垂直方向のサイズのうちの一方または両方)を当該所定のサイズに変換し、変換後の画像の情報を元の画像の情報とみなして使用して後続の処理を実行する。
【0034】
ここで、本実施形態では、元の画像のサイズ(水平方向のサイズおよび垂直方向のサイズのうちの少なくとも一方)が所定のサイズより小さい場合には、当該元の画像の情報を、試験用画像を生成するためには使用しない構成とする。他の構成例として、領域設定部321は、元の画像のサイズ(水平方向のサイズおよび垂直方向のサイズのうちの一方または両方)が所定のサイズより小さい場合には、当該元の画像のサイズ(水平方向のサイズおよび垂直方向のサイズのうちの一方または両方)を当該所定のサイズに変換し、変換後の画像の情報を元の画像の情報とみなして使用して後続の処理を実行する、構成が用いられてもよい。
また、他の構成例として、領域設定部321が元の画像のサイズを変換しない構成が用いられてもよい。
なお、画像のサイズを小さく変換する処理としては、例えば、隣接する複数のピクセル値をそれより少ないピクセル値(例えば、代表値あるいは平均値など)に置き換える処理、または、ピクセル値を間引く処理が用いられてもよい。画像のサイズを大きく変換する処理としては、例えば、1個以上のピクセル値をそれより多いピクセル値(例えば、同じ値あるいは平均値など)に置き換える処理が用いられてもよい。
【0035】
次に、領域設定部321は、元の画像(サイズが変換された場合には変換後の画像)における各ピクセルについて、画像の特徴量を検出(演算)する。画像の特徴量としては、様々な特徴量が用いられてもよい。例えば、画像の特徴量が大きい点は、人間が見たときに周囲との差異が大きいと感じられる点である傾向がある。
領域設定部321は、元の画像に含まれるピクセルについて、演算された特徴量が大きい方から小さい方への順に順位を設定する。この順位の情報は、例えば、記憶部302に記憶されてもよい。なお、順位の情報は、例えば、元の画像に含まれるすべてのピクセルについて設定されてもよく、または、上位から所定の数のピクセルについて設定されてもよい。
【0036】
本実施形態では、領域設定部321は、次の(領域設定の規則1)〜(領域設定の規則7)にしたがって、元の画像に領域を設定する。
(領域設定の規則1)は、円の形状を有する領域(円の領域)を設定する、規則である。
(領域設定の規則2)は、所定の値(最小値)以上の大きさ(円の領域の場合には、例えば、当該円の半径)を有する領域を設定する、規則である。なお、設定される複数の領域としては、例えば、異なる大きさの領域を含んでもよい。
(領域設定の規則3)は、各領域として、可能な限り大きい領域を設定する、規則である。他の構成例として、各領域として、所定の値(最大値)以下の大きさで、可能な限り大きい領域を設定する、規則が用いられてもよい。
(領域設定の規則4)は、複数の領域として、可能な限り多くの数の領域を設定する、規則である。他の構成例として、複数の領域として、所定の値(最大値)以下の数で、可能な限り多くの数の領域を設定する、規則が用いられてもよい。
【0037】
(領域設定の規則5)は、元の画像における所定のピクセルを中心点とする1個の領域を設定する、規則である。所定のピクセルとしては、任意のピクセルが用いられてもよく、例えば、元の画像における中心(または、それに近い位置)のピクセルが用いられる。当該領域の大きさとしては、例えば、固定的に設定されてもよく、または、他の規則にしたがって決定されてもよい。
なお、当該領域は、例えば、最初に固定的に設定されてもよく、または、前記した所定のピクセルが特徴量の順位付けの1番目であると(仮想的に)みなして、他の規則にしたがって設定されてもよい。
【0038】
(領域設定の規則6)は、設定する領域の配置位置として、元の画像におけるピクセルのうちで特徴量が大きいピクセルから小さいピクセルへの順で、領域の中心点(円の領域の場合には、当該円の中心点)の候補とする、規則である。例えば、既に領域の中心点として当該領域が設定されたピクセルは候補から除かれる。例えば、候補となっているピクセルを中心点とする領域の設定を試みた場合に、他の規則(他の条件)が満たされないときには、その候補の設定をせずに、次の順位のピクセルの候補について領域の設定を試みる。なお、候補となっているピクセルを中心点とする領域を設定すると、当該領域の一部が元の画像の範囲を超える場合には、例えば、その候補の設定をしない規則が用いられてもよく、または、その候補の設定をする規則が用いられてもよい。
【0039】
(領域設定の規則7)は、設定される複数の領域が重複部分を有しない、規則である。
例えば、設定される複数の領域に関し、すべての組み合わせの2個の異なる領域について、離隔距離を所定の値(最小値)を超える値とする、規則が用いられてもよい。2個の異なる領域の離隔距離としては、例えば、2個の異なる領域のそれぞれの端を結ぶ最短距離が用いられる。最小値としては、0以上の値が用いられる。
他の構成例として、2個の異なる領域の離隔距離として、2個の異なる領域のそれぞれの中心点を結ぶ距離が用いられてもよい。
【0040】
領域設定部321は、元の画像に領域を設定した場合、設定された領域以外の範囲の画像情報を排除した画像の情報を、試験用画像の情報として生成する。試験用画像において、排除された範囲の画像部分は、例えば、黒または白など(一例として、一色)の画像部分とされる。
また、領域設定部321は、生成された試験用画像の情報について、設定された複数のすべての領域の内部の画像(本実施形態では、円の内部の画像)を、それぞれの領域の中心点を中心軸として同一の回転方向に同一の角度だけ回転させた結果の画像の情報を、問題として提出する初期状態における試験用画像の情報とする。当該角度としては、例えば、あらかじめ設定された任意の固定値が用いられてもよく、または、ランダムな値が発生させられて当該ランダムな値が用いられてもよい。
【0041】
<試験用画像として採用する画像の選択の説明>
本実施形態では、画像選択部322は、次の(画像選択の条件1)〜(画像選択の条件7)に基づいて、試験用画像の情報として採用する画像の情報を選択する。
【0042】
(画像選択の条件1)は、元の画像のサイズ(水平方向のサイズおよび垂直方向のサイズのうちの少なくとも一方)が所定の閾値未満である場合には、当該元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択しないで排除する、条件である。所定の閾値としては、水平方向と垂直方向とで異なる値が用いられてもよく、一例として、水平方向のピクセルの数が1920で、垂直方向のピクセルの数が1080である構成が用いられてもよい。なお、元の画像のサイズが所定の閾値未満であるか否かを判定する手法としては、例えば、水平方向のピクセルの数と垂直方向のピクセルの数との両方が判定されてもよく、または、いずれか一方のみが判定されてもよい。この条件により、例えば、サイズが小さい画像の情報が排除される。
【0043】
(画像選択の条件2)は、元の画像の情報量を検出し、検出された情報量が所定の閾値未満である場合には、当該元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択しないで排除する、条件である。所定の閾値としては、任意の値が用いられてもよい。また、画像の情報量としては、一例として、1ピクセル辺りに含まれる平均的なビット(bit)量が用いられてもよい。この条件により、例えば、情報量が小さい画像の情報が排除される。
【0044】
(画像選択の条件3)は、元の画像の情報を所定の圧縮方式で圧縮したときに、圧縮効率が所定の閾値を超える場合には、当該元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択しないで排除する、条件である。所定の閾値としては、任意の値が用いられてもよい。所定の圧縮方式としては、任意の圧縮方式が用いられてもよい。この条件により、例えば、圧縮効率が高い(例えば、全体的に特徴が少ない)画像の情報が排除される。
なお、元の画像の情報としては、例えば、圧縮されていない画像の情報が用いられてもよく、または、既に圧縮されている画像の情報が用いられてもよい。元の画像の情報が既に圧縮されている場合には、例えば、さらに圧縮する場合における圧縮効率が用いられる。
【0045】
(画像選択の条件4)は、元の画像の情報を二値化したときに、当該元の画像を構成する複数のピクセル値のうちで、白に対応するピクセル値の数に対する黒に対応するピクセル値の数の割合が所定の閾値未満である場合には、当該元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択しないで排除する、条件である。所定の閾値としては、任意の値が用いられてもよく、一例として、4(%)が用いられてもよい。なお、本例では、白と黒の二値化について説明したが、二値化の色としては他の色が用いられてもよい。また、二値化の処理としては、例えば、輪郭線(エッジ)の抽出処理における二値化の処理が用いられてもよい。この条件により、例えば、輪郭線の表れが少ない画像の情報が排除される。
【0046】
(画像選択の条件5)は、元の画像の情報に設定される領域(領域設定部321により設定される領域)の数が所定の閾値未満である場合には、当該元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択しないで排除する、条件である。所定の閾値としては、例えば、2以上である任意の値が用いられてもよい。この条件により、例えば、設定される領域の数が少ない画像の情報が排除される。
【0047】
(画像選択の条件6)は、元の画像の情報に所定の処理を行って得られるラベリングの結果に基づいて、少なくとも1個のラベリング番号について、設定される領域(領域設定部321により設定される領域)の数が所定の閾値以上となることが満たされなければ、当該元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択しないで排除する、条件である。所定の閾値としては、任意の値が用いられてもよく、例えば、3以上の値が用いられる。この条件により、例えば、十分な数の領域が設定されるラベリング番号が存在しない画像の情報が排除される。
【0048】
(画像選択の条件7)は、元の画像の情報に設定される領域(領域設定部321により設定される領域)について、複数の領域の間における相関に関する所定値が相関が高いことを示す状態であるときに正解の状態となる場合に、当該元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択しないで排除する、条件である。相関に関する所定値としては、様々な値が用いられてもよい。相関に関する所定値が相関が高いことを示す状態としては、例えば、相関に関する所定値が取り得る状態のうちで最も相関が高いことを示す状態が用いられてもよく、または、相関に関する所定値が所定の閾値と比べて相関が高いことを示す状態が用いられてもよい。この条件により、例えば、機械によって問題が解かれ易いと予想される画像の情報が排除される。
【0049】
<(画像選択の条件6)の詳細な説明>
図7(A)、
図7(B)および
図7(C)は、本発明の一実施形態に係る画像選択手法の一例を説明するための図である。
図7(A)には、元の画像1201の一例を示してある。
図7(B)には、元の画像1201を二値化した画像(二値化画像1221)の一例を示してある。また、
図7(B)には、二値化画像1221に対してラベリングの処理を行った結果として得られた複数(
図7(B)の例では、3個)の同一ラベリング領域1251〜1253を示してある。
【0050】
ここで、ラベリングの処理としては、例えば、一般に知られた処理が用いられてもよい。本実施形態では、ラベリングの処理では、二値化画像1221に対して、同一のピクセル値が連続して互いに隣接する領域(同一ラベリング領域1251〜1253)を検出し、それぞれの同一ラベリング領域1251〜1253ごとに、特定の番号(ラベリング番号)を付与する処理を行う。本実施形態では、輪郭線に相当する同一ラベリング領域1251〜1253にはラベリング番号を付与するが、輪郭線ではない空白の部分にはラベリング番号を付与しない。
【0051】
図7(C)には、二値化画像1221に対して領域B1〜B7が設定された画像(領域設定画像1241)の一例を示してある。これらの領域B1〜B7を設定する手法は、領域設定部321が領域を設定する手法と同じ手法である。
画像選択部322は、それぞれの同一ラベリング領域1251〜1253ごとに、当該同一ラベリング領域1251〜1253に重複する領域の数を検出する。
図7(C)の例では、同一ラベリング領域1251には2個の領域(領域B3および領域B4)が重複し、同一ラベリング領域1252には1個の領域(領域B6)が重複し、同一ラベリング領域1253には3個の領域(領域B3、領域B5および領域B7)が重複する。本例では、当該重複の状態は、領域(領域B1〜B7)の内部に同一ラベリング領域(同一ラベリング領域1251〜1253)の少なくとも一部が含まれる状態である。
なお、領域(領域B1〜B7)と同一ラベリング領域(同一ラベリング領域1251〜1253)との同じ組み合わせについて2箇所以上の重複箇所が存在する場合には、例えば、これらをまとめて一つ(1箇所のみ)の重複とみなす。
【0052】
そして、画像選択部322は、少なくとも1個のラベリング番号(同一ラベリング領域1251〜1253)について、設定された領域の数が所定の閾値以上となることが満たされなければ、当該元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択しないで排除する。
図7(C)の例では、同一ラベリング領域1251〜1253のうちで、同一ラベリング領域1253が最も多い3個の領域(領域B3、領域B5および領域B7)と重複している。このため、所定の閾値が3またはそれより小さい場合には、元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択する。一方、所定の閾値が3より大きい場合には、元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択しない。
【0053】
このように、(画像選択の条件6)により選択される画像の情報では、所定の閾値以上の数の領域に少なくとも1個の特定の同一ラベリング領域(連続した輪郭線)が含まれることになる。これにより、これら複数の領域の内部の画像が相関性(関連性)を持つ可能性を高めることができ、人間にも解き易い問題とすることが図られる。
【0054】
<(画像選択の条件7)の詳細な説明>
図8(A)〜(E)は、本発明の一実施形態に係る画像選択手法の他の一例を説明するための図である。
画像選択部322は、例えば
図7(C)に示されるように元の画像の情報に対して領域が設定された画像(試験用画像と同じ画像でもよい。)の情報に基づいて、元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択するか否かを決定する。
【0055】
図8(A)には、同一の画像に設定された2個の異なる領域C1、C2(本実施形態では、円の領域)を示してある。また、それぞれの領域C1、C2の中心点D1、D2(本実施形態では、円の中心点)を示してある。なお、異なる領域C1、C2は、大きさ(本実施形態では、円の半径)が異なり得る。
まず、画像選択部322は、2個の領域C1、C2の中心点D1、D2どうしを線で結ぶ。なお、線で結ぶことは、実際に行われなくてもよく、そのような線が仮想的に想定されればよい。中心点D1、D2どうしを結ぶ線の長さをhとする。
【0056】
次に、画像選択部322は、それぞれの領域C1、C2に対して所定の調査角度θを設定する。
図8(B)には、それぞれの領域C1、C2に対して設定された調査角度θ(=θ/2+θ/2)を示してある。
本実施形態では、画像選択部322は、それぞれの領域C1、C2に対して、中心点D1、D2どうしを結ぶ線を中心線(起点)として、左右対称にそれぞれ一定の角度(角度θ/2)の幅を有する調査角度θを設定する。
ここで、調査角度θとしては、様々な角度が用いられてもよく、一例として、90度が用いられてもよい。なお、調査角度θとしては、2個の領域C1、C2の調査角度θ内の画像部分どうしの相関性が高いと予想される角度が用いられることが好ましく、例えば、90度前後の角度が用いられてもよい。
【0057】
次に、画像選択部322は、2個の領域C1、C2について、互いに対応するピクセル値の間の相関値の合計値を取得する。互いに対応するピクセル値としては、n(nは2以上の整数)組のピクセル値が用いられる。
図8(C)には、n組のピクセル値において相関値の合計値を算出する様子の一例を示してある。
本実施形態では、2個の領域C1、C2に設定された調査角度θについて、中心点D1、D2どうしを結ぶ線に対して互いに同じ側の最大開き角度(角度θ/2)の線と領域C1、C2の外枠(本実施形態では、円弧)との交点のピクセルP1、Q1を1番目とする。そして、ここから、中心点D1、D2どうしを結ぶ線に対して反対の側へ、開き角度を(n−1)回順にずらしていった線と領域C1、C2の外枠との交点のピクセルをとっていき、各ピクセルのピクセル値を用いる。この場合、最後のピクセルPn、Qnは、中心点D1、D2どうしを結ぶ線に対して反対の側の最大開き角度(角度θ/2)に対応するピクセルとなり、n番目となる。そして、これらn組のピクセル値について、相関値の合計値を取得する。なお、隣接する異なる開き角度に対応するピクセルが同一となる場合があってもよい。
ここで、nとしては、任意の値が用いられてもよく、一例として、91が用いられてもよい。例えば、調査角度θが90度であり、nが91である場合、1度ずつ回転させてずらした91組のピクセル値について相関値が取得される。
【0058】
本実施形態では、相関検出部323が、ピクセル値どうしの相関値の合計値を検出(演算)する。画像選択部322は相関検出部323に対して相関値の合計値の検出の要求を出力し、相関検出部323は当該要求にしたがって相関値の合計値を検出して画像選択部322に出力して通知し、画像選択部322は当該値を取得する。
【0059】
ここで、相関検出部323が検出する相関値の合計値Sum(総和結果)は、式(1)により表される。式(1)の例では、それぞれの相関値(または、相関値の合計値Sum)について、値が小さいほど相関が高いことを表す。
本実施形態では、RGB三原色を使用したピクセル値を用いている。式(1)において、(r1、g1、b1)および(r2、g2、b2)は、2個の領域C1、C2のそれぞれのピクセル値の(R(赤)の値、G(緑)の値、B(青)の値)を表す。Σは、n組の総和を表す。なお、総和対象の分子の項{(r1−r2)
2+(g1−g2)
2+(b1−b2)
2}は、例えば、平方根がとられてもよい。また、総和対象の分母であるhの代わりに、例えば、h
2、h
3などが用いられてもよい。本実施形態では、2個の領域C1、C2の中心点D1、D2どうしの距離hが小さい方が、総和対象に与える重みを大きくしており、総和結果(相関値の合計値Sum)を大きくしている。
【0061】
なお、本実施形態では、1個の調査角度θについて相関値の合計値Sumを検出する。他の構成例として、複数の異なる調査角度θについて相関値の合計値Sumを検出して、これら複数の合計値Sumの平均値あるいは総和値などを検出して用いる構成が用いられてもよい。
【0062】
次に、画像選択部322は、2個の領域C1、C2の内部の画像をそれぞれの中心点D1、D2を中心軸として同じ方向に同じ角度だけ順次回転させてずらしていって、それぞれの回転位置における相関値の合計値Sumを取得する。本実施形態では、0度から360度まで1度ずつ回転させた状態で、計360個の状態で、
図8(A)〜(C)に示される処理を繰り返し行って、それぞれの回転状態における相関値の合計値Sumを検出する。
図8(D)には、2個の領域C1、C2の内部の画像を同一の方向に回転させる様子の一例を示してある。
【0063】
図8(E)には、画像に設定されたすべての領域C1〜C7およびそれぞれの中心点D1〜D7を示してある。また、1個の領域C1と他のそれぞれの領域C2〜C7との中心点どうしを結ぶ線を示してある。
次に、画像選択部322は、画像に設定されたすべての領域C1〜C7における2個の領域の組み合わせのすべてについて、
図8(D)に示されるような各回転状態における相関値の合計値Sumを取得する。
ここで、2個の領域の組み合わせとしては、一構成例として、7個の領域C1〜C7のそれぞれについて他の領域の数が6個であり、(当該7個×当該6個)の組み合わせが用いられてもよい。他の構成例として、2個の領域の組み合わせとしては、2個の領域を入れ替えたときに同じ組み合わせとなるものを除いて、{(当該7個×当該6個)/2}の組み合わせが用いられてもよい。
【0064】
そして、画像選択部322は、
図8(D)に示されるような各回転状態ごとに、2個の領域の組み合わせのすべてについて、相関値の合計値Sumを総和した結果を検出(演算)する。画像選択部322は、複数の回転状態(例えば、0度〜360度の1度刻みの回転状態)のうちで、相関値の合計値Sumを総和した結果が最も小さくなる(最も相関が高くなる)回転状態が正解となるという条件を満たすか否かを判定する。画像選択部322は、当該条件を満たすと判定した場合には、元の画像の情報(当該元の画像の情報を使用して生成される試験用画像の情報)を選択しない。ここで、相関値の合計値Sumを総和した結果が最も小さくなる回転状態が正解となるという条件としては、例えば、所定の誤差(例えば、回転状態のズレの誤差)を許容する条件が用いられてもよい。
このように画像選択部322が選択しない(排除する)こととしている元の画像の情報は、試験用画像の情報が生成された場合に機械によって正解が導き出される(問題が解かれる)可能性が高いと予想される画像の情報である。
【0065】
ここで、(画像選択の条件7)を考慮しないで選択される試験用画像の情報では、例えば、複数の領域について、異なる領域の間のピクセル値どうしの相関を調査して、相関が最大となる画像の状態(回転状態)を探すアプローチを用いた攻撃により、解決される可能性(脅威)がある。これに対して、(画像選択の条件7)を考慮することで、あらかじめ想定される攻撃を(好ましくは、すべての通り)試すことで、機械によって解かれる可能性が高い問題を除外することができる。
【0066】
<画像の選択を行いつつ試験用画像の情報を生成する処理の手順の例>
画像選択部322により画像の選択を行いつつ、領域設定部321により元の画像の情報から試験用画像の情報を生成する処理の手順の一例を示す。
画像生成装置14では、まず、試験用画像の情報を生成するために使用される元の画像の情報の候補を1個以上取得する。次に、画像選択部322は、元の画像の情報の候補のうちで、(画像選択の条件1)〜(画像選択の条件4)に基づいて選択しないこととする画像の情報を排除し、他の画像の情報を選択する。次に、領域設定部321は、選択された元の画像の情報の候補について、採用するすべての(領域設定の規則)に基づいて領域を設定して、試験用画像の情報(この段階では、候補とする。)を生成する。次に、画像選択部322は、生成された試験用画像の情報の候補のうちで、(画像選択の条件5)〜(画像選択の条件7)に基づいて選択しないこととする画像の情報を排除し、他の画像の情報を選択する。これにより、選択された画像の情報(試験用画像の情報)が採用される。
【0067】
領域設定部321は、採用された試験用画像の情報について、設定された複数のすべての領域の内部の画像(本実施形態では、円の内部の画像)を同一の回転方向に所定の角度だけ回転させた結果の画像の情報を、問題として提出する初期状態における試験用画像の情報とする。
このように、本実施形態において採用される試験用画像の情報では、領域の内部の画像を回転するときに画像の歪曲を行わないため、画像の歪曲に基づいて機械により正解を判定することが困難となる。また、画像の歪曲によるエッジ量の増加をなくすことができる。
【0068】
<実施形態のまとめ>
以上のように、本実施形態に係る試験システム1では、端末装置21においてユーザ(本実施形態では、人間)に対して画像型キャプチャの試験を行うことができる。画像型キャプチャは、人間にとっては直感的に分かり易く解き易く、機械にとっては解きづらい傾向があり、人間と機械を判別することが可能である。本実施形態に係る試験用画像は、例えば、他の画像型キャプチャと比べて、耐画像認識技術が優れている。また、本実施形態に係る試験用画像は、ユーザビリティが優れており、人間にとって直観的に分かり易い。また、本実施形態に係る試験システム1では、認証サーバ装置15により、試験用画像の情報を用いた試験情報を端末装置21に提供して、試験の問題に対する回答の正否を判定することができる。また、本実施形態に係る試験システム1では、画像生成装置14において、試験用画像の情報を生成することができる。
このように、本実施形態に係る試験システム1では、実用的に有効な画像型キャプチャを実現することができる。
【0069】
ここで、(領域設定の規則)としては、必ずしも本実施形態の規則に限定されず、様々な規則が用いられてもよい。
また、(画像選択の条件)としては、必ずしも本実施形態の条件に限定されず、様々な条件が用いられてもよい。
また、領域の形状としては、必ずしも本実施形態のように円の形状が用いられなくてもよく、例えば、正方形、楕円などの形状が用いられてもよい。
また、試験用画像の情報を生成するために使用される元の画像の情報としては、様々な画像の情報が用いられてもよい。
【0070】
一構成例として、試験装置(本実施形態では、端末装置21)では、表示部103が複数の領域が設定された試験用画像の情報を表示し、操作部104が表示部103により表示された試験用画像の情報について、複数の領域の内部の画像を回転させる操作を人間から受け付ける。
一構成例として、画像生成装置14では、領域設定部321が、画像(元の画像)の情報に領域を設定する規則として、少なくとも、特徴量が大きいピクセルを優先させて領域を設定する規則を用いて、画像の情報に複数の領域を設定して試験用画像の情報を生成する。
一構成例として、画像生成装置14では、画像選択部322が、領域設定部321により生成される試験用画像の情報に関して、画像を選択する条件として、少なくとも、複数の領域の間における相関に関する所定値が相関が高いことを示す状態であるときに正解の状態となる画像を排除する条件を用いて、画像を選択する。
【0071】
一構成例として、試験方法では、複数の領域が設定された試験用画像の情報を表示し、表示された試験用画像の情報について、複数の領域の内部の画像を回転させる操作を人間から受け付ける。
一構成例として、画像生成方法では、画像の情報に領域を設定する規則として、少なくとも、特徴量が大きいピクセルを優先させて領域を設定する規則を用いて、画像の情報に複数の領域を設定して試験用画像の情報を生成する。
一構成例として、試験装置で用いられるプログラムは、複数の領域が設定された試験用画像の情報を表示するステップと、表示された試験用画像の情報について、複数の領域の内部の画像を回転させる操作を人間から受け付けるステップと、をコンピュータに実行させるためのプログラムである。
一構成例として、画像生成装置で用いられるプログラムは、画像の情報に領域を設定する規則として、少なくとも、特徴量が大きいピクセルを優先させて領域を設定する規則を用いて、画像の情報に複数の領域を設定して試験用画像の情報を生成するステップ、をコンピュータに実行させるためのプログラムである。
【0072】
一構成例として、試験システムでは、サーバ装置(本実施形態では、認証サーバ装置15)と、端末装置21を備える。サーバ装置は、複数の領域が設定された試験用画像の情報を送信する。端末装置21は、試験用画像の情報を受信して表示し、表示された試験用画像の情報について、複数の領域の内部の画像を回転させる操作を人間から受け付け、画像の回転の状態に関する情報を送信する。サーバ装置は、当該情報(画像の回転の状態に関する情報)を受信して、受信された情報に基づいて正否を判定する。
【0073】
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【0074】
また、以上に示した実施形態に係る各装置(例えば、端末装置21、認証サーバ装置15、画像生成装置14など)の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体(記憶媒体)に記録(記憶)して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、処理を行ってもよい。
なお、ここでいう「コンピュータシステム」とは、オペレーティングシステム(OS:Operating System)あるいは周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、フラッシュメモリ等の書き込み可能な不揮発性メモリ、DVD(Digital Versatile Disk)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに、「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークあるいは電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記のプログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)あるいは電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記のプログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、上記のプログラムは、前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。