(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0014】
1.実施形態
1−1.構成
図1は、本発明の一実施形態に係る偽サイト検出装置1の構成を示す図である。本偽サイト検出装置1は、本発明に係る「情報処理システム」の一例である。
この偽サイト検出装置1は、例えばパーソナルコンピュータである。より具体的には、スマートフォンやタブレット端末等の携帯端末や、据え置き型のコンピュータである。偽サイト検出装置1は、大まかに言うと、
図1に示されるように、処理部11と、記憶部12と、表示部13と、Webブラウザ14と、メーラ15と、通信部16とを備える。
【0015】
処理部11は、例えばCPU(Central Processing Unit)等の演算処理装置である。この処理部11は、
図1に示されるように、抽出処理部111と、関連付判断部112と、保存処理部113と、比較処理部114と、危険スコア判断部115という機能を有する。これらの機能は、処理部11により、記憶部12に記憶されるプログラムが実行されることにより実現される。これらの機能については後述する。
【0016】
記憶部12は、例えばハードディスクやフラッシュメモリ等の記憶装置である。この記憶部12は、処理部11により実行されるプログラムを記憶する。また、この記憶部12は、
図1に示されるように、シナリオDB(Database)121と、キーワードバリエーションDB122と、関連付抽出項目DB123と、ドメイン情報DB124と、抽出情報DB125と、危険スコアDB126とを記憶する。以下、各データベースについて説明する。
【0017】
図2は、シナリオDB121の一例を示す図である。本シナリオDB121は、シナリオ情報を格納するためのデータベースである。本シナリオDB121を構成する各レコードは、
図2に示されるように、「シナリオID」と、「シナリオ名」と、「抽出項目」と、「キーワードトリガ」と、「構成トリガ」の各フィールドにより構成される。
【0018】
ここで、シナリオIDは、シナリオ情報に対して一意に付与される識別情報である。抽出項目は、後述する偽サイト検出動作においてWebページやメールから抽出される情報の種類を示す情報である。この際に抽出される情報は、偽サイトを検出するために参照される。この抽出項目には例えば、支払方法や、連絡先や、担当者が含まれる。キーワードトリガは、後述する偽サイト検出動作において比較処理部114による処理のトリガとなるキーワードである。キーワードトリガには例えば、「支払方法」や「完了」といった文字列がある。構成トリガは、後述する偽サイト検出動作において比較処理部114による処理のトリガとなる構成である。構成トリガには例えば、ラジオボタンやプルダウンメニューといったフォーム部品がある。
【0019】
図3は、キーワードバリエーションDB122の一例を示す図である。本キーワードバリエーションDB122は、シナリオDB121に格納される抽出項目及びキーワードトリガのバリエーションを格納するデータベースである。このキーワードバリエーションDB122に格納されるバリエーションは、後述する偽サイト検出動作において抽出項目に該当する情報やキーワードトリガが抽出される際に、抽出漏れを防ぐために利用される。このキーワードバリエーションDB122を構成する各レコードは、
図3に示されるように、「キーワード」と「バリエーション」の各フィールドにより構成される。
【0020】
図4は、関連付抽出項目DB123の一例を示す図である。本関連付抽出項目DB123を構成する各レコードは、
図4に示されるように、「関連ID」と「関連付抽出項目」の各フィールドにより構成される。ここで、関連IDは、関連付抽出項目に対して一意に付与される識別情報である。関連付抽出項目は、後述する偽サイト検出動作においてWebページやメールから抽出される情報の種類を示す情報である。この際に抽出される情報は、後述する偽サイト検出動作において比較処理部114による比較の対象となる抽出情報を特定するために参照される。
【0021】
図5は、ドメイン情報DB124の一例を示す図である。本ドメイン情報DB124は、後述する偽サイト検出動作において上記の抽出項目に該当する情報が抽出されたWebページ又はメールのドメイン等の情報を記録するためのデータベースである。このドメイン情報DB124を構成する各レコードは、
図5に示されるように、「ドメイン」と、「IPアドレス」と、「サイト名」の各フィールドにより構成される。
【0022】
図6は、抽出情報DB125の一例を示す図である。本抽出情報DB125は、後述する偽サイト検出動作においてWebページやメールから抽出された上記の抽出項目に該当する情報を記録するためのデータベースである。本抽出情報DB125は、ドメイン単位でテーブルを有し、各テーブルを構成するレコードは、
図6に示されるように、「情報ID」と、「情報分類」と、「内容」と、「ページ名」と、「取得日時」の各フィールドにより構成される。
【0023】
ここで、情報IDは、抽出情報に対して一意に付与される識別情報である。情報分類は、抽出情報の分類を示す情報である。この情報分類には、上記の抽出項目と同様に、例えば、支払方法や、連絡先や、担当者が含まれる。ページ名は、抽出情報が抽出されたWebページの名称である。取得日時は、抽出情報が抽出された日時である。
【0024】
図7は、危険スコアDB126の一例を示す図である。本危険スコアDB126は、後述する偽サイト検出動作において算出され、累積された危険スコアをドメイン単位で記録するためのデータベースである。本危険スコアDB126を構成する各レコードは、
図7に示されるように、「ドメイン」と「累積危険スコア」の各フィールドにより構成される。ここで、危険スコアとは、偽サイトである可能性を示す点数である。
データベースについての説明は以上である。
【0025】
次に、表示部13は、例えば液晶ディスプレイ等の表示装置である。この表示部13は、
図1に示されるように、正常画面出力部131と、警告画面出力部132の各機能を有する。正常画面出力部131は、Webブラウザ14により取得されたWebページや、メーラ15により取得されたメールをそのまま出力する。一方、警告画面出力部132は、Webページやメールを表示する際に、偽サイトの関与を警告するメッセージを出力する。
【0026】
Webブラウザ14は、ユーザがWebページを閲覧するために実行されるアプリケーションソフトウェアである。このWebブラウザ14は、サイトを通じた商品又は役務の販売に際してユーザに提供されるデータを取得する機能を有する。ここで、本発明に係る「データ」は、Webページとメールとを含む概念である。当該機能は、本発明に係る「第1の取得部」及び「第2の取得部」の一例である。
本実施形態に係るWebブラウザ14にはプラグイン141が追加されており、そのためWebブラウザ14により取得されたWebページは、後述する偽サイト検出動作のために一旦処理部11に転送される。Webブラウザ14は、本発明に係る「第1のアプリケーション」及び「第2のアプリケーション」の一例である。
【0027】
メーラ15は、ユーザがメールを閲覧するために実行されるアプリケーションソフトウェアである。このメーラ15は、サイトを通じた商品又は役務の販売に際してユーザに提供されるデータを取得する機能を有する。当該機能は、本発明に係る「第1の取得部」及び「第2の取得部」の一例である。
本実施形態に係るメーラ15にはプラグイン151が追加されており、そのためメーラ15により取得されたメールは、後述する偽サイト検出動作のために一旦処理部11に転送される。メーラ15は、本発明に係る「第1のアプリケーション」及び「第2のアプリケーション」の一例である。
【0028】
通信部16は、例えばネットワークカードである。この通信部16は、
図1に示されるように、送信部161と受信部162の各機能を有する。送信部161は、Webブラウザ14から取得したWebページのリクエストをWebサーバ2に送信したり、メーラ15から取得したメールの受信要求をメールサーバ3に送信したりする。一方、受信部162は、Webサーバ2から受信したWebページをWebブラウザ14に転送したり、メールサーバ3から受信したメールをメーラ15に転送したりする。
次に、処理部11の各機能について説明する。
【0029】
抽出処理部111は、Webブラウザ14により取得されたWebページ又はメーラ15により取得されたメールから、サイトを通じた商品又は役務の一の販売に関連する情報である販売関連情報を抽出する。ここで、本発明に係る「販売関連情報」とは、支払方法と、販売者側の担当者の識別情報と、販売者の連絡先とを含む概念である。
抽出処理部111は、具体的には、Webブラウザ14により取得されたWebページ又はメーラ15により取得されたメールから、シナリオDB121に格納されるシナリオ情報の抽出項目に該当する情報を抽出する。
【0030】
また、抽出処理部111は、Webブラウザ14により取得されたWebページ又はメーラ15により取得されたメールから、シナリオDB121に格納されるシナリオ情報のキーワードトリガ及び構成トリガを抽出する。
この抽出処理部111は、本発明に係る「第1の抽出部」及び「第2の抽出部」の一例である。
【0031】
関連付判断部112は、Webブラウザ14により取得されたWebページ又はメーラ15により取得されたメールが、ドメイン情報DB124に記憶されているドメインと関連するものであるか否かについて判定を行う。具体的には、関連付判断部112は、当該Webページ又はメールから抽出処理部111により抽出された関連付抽出項目に該当する情報と、ドメイン情報DB124に記憶されているドメインに関する情報とを比較して、両者が一致するか否かを判定する。
【0032】
保存処理部113は、Webページ又はメールから抽出処理部111により抽出された抽出項目に該当する情報を抽出情報DB125に記憶する。この際、当該Webページ又はメールに関連するドメインが関連付判断部112により特定されている場合には、保存処理部113は、当該情報を、抽出情報DB125においてそのドメインのテーブルに格納する。
【0033】
比較処理部114は、抽出処理部111により抽出された第1の販売関連情報と、第2の販売関連情報とを比較する。具体的には、抽出処理部111は、Webページ又はメールから抽出処理部111により抽出された抽出項目に該当する情報と、抽出処理部111により抽出され、抽出情報DB125に格納された抽出情報とを比較する。そして、比較処理部114は、その比較結果を、サイトの信頼性を示す情報として出力する。
この比較処理部114は、本発明に係る「比較部」と「出力部」の一例である。
【0034】
危険スコア判断部115は、比較処理部114による比較処理の結果に基づいて危険スコアを算出する。また、危険スコア判断部115は、算出した危険スコアを、危険スコアDB126に格納される累積危険スコアに加算して、最新の累積危険スコアを算出する。また、危険スコア判断部115は、算出した最新の累積危険スコアを所定の閾値と比較する。
【0035】
1−2.動作
次に、偽サイト検出装置1の動作について説明する。具体的には、Webページやメールに基づいて偽サイトを検出する動作(以下、「偽サイト検出動作」という。)について説明する。以下の説明では、Webページに対して実行される偽サイト検出動作と、メールに対して実行される偽サイト検出動作とを分けて説明する。
【0036】
1−2−1.Webページに対して実行される偽サイト検出動作
図8及び9は、Webページに対して実行される偽サイト検出動作の一例を示すフローチャートである。まず、本動作のステップSa1において処理部11が起動すると、抽出処理部111は、本動作に必要な各種情報を記憶部12から呼び出す(ステップSa2及びSa3)。具体的には、抽出処理部111は、シナリオ情報をシナリオDB121から呼び出し、キーワードバリエーション情報をキーワードバリエーションDB122から呼び出し、関連付抽出項目情報を関連付抽出項目DB123から呼び出す。抽出処理部111は、これらの情報を取得すると、本動作の事前準備を完了する(ステップSa4)。
【0037】
次に、Webブラウザ14は、ユーザによる指示に応じてWebサーバ2に対してWebページのリクエストを送信する(ステップSa5)。Webサーバ2は、送信されたリクエストを受信すると、要求されたWebページをWebブラウザ14に返信する(ステップSa6)。Webブラウザ14は、この返信されたWebページを取得すると、当該Webページを処理部11に転送する(ステップSa7)。
【0038】
処理部11の抽出処理部111は、この転送されたWebページを取得すると、当該Webページに対して抽出処理を実行する(ステップSa8)。具体的には、抽出処理部111は、当該Webページにおいて、ステップSa4において取得したシナリオ情報の抽出項目に該当する情報を抽出する。以下、この抽出処理について図面を参照して説明する。
【0039】
図10は、表示部13に表示されるWebページの一例を示す図である。
図10(a)は、時計を販売するWebサイトのトップページの一例を示す図であり、
図10(b)は、同Webサイトの、支払方法を選択するためのページを示す図である。
図10(a)に示されるWebページが処理対象となっている場合において、例えば
図2に示されるシナリオID「001」のシナリオ情報の抽出項目「支払方法」に該当する情報が抽出される場合には、当該抽出項目の近傍に位置する「銀行振込」と「カード払い」という情報が抽出される。
【0040】
この際の情報の抽出方法については、例えば、当該Webページがタグ構造を有している場合には、当該Webページにおいて抽出項目と所定の構造的位置関係を有する情報を抽出するようにしてもよい(例えば、特開2007−47974号公報参照)。より具体的には、例えば、当該Webページが表構造を含み、その表の項目名として抽出項目が記述されている場合には、その項目名と対となっている項目値を抽出するようにしてもよい。また別の方法としては、当該Webページにおいて抽出項目を検索し、検索した抽出項目から所定の距離内であって、予め記憶されている候補に該当する情報を抽出するようにしてもよい(例えば、特開2002−175330号公報参照)。
【0041】
なお、当該抽出処理が行われる際には、ステップSa4において取得されたキーワードバリエーション情報が利用される。具体的には、例えば、
図2に示されるシナリオID「001」のシナリオ情報の抽出項目「支払方法」に該当する情報が抽出される場合には、この抽出項目のバリエーションである、
図3に示される「支払い方法」や「決済方法」や「支払い手段」等の抽出項目に該当する情報も抽出される。
よって、
図10(b)に示されるWebページが処理対象となっている場合において、同シナリオ情報の抽出項目「支払方法」に該当する情報が抽出される場合には、当該抽出項目のバリエーション「決済方法」の近傍に位置する「銀行振込」という情報が抽出される。
【0042】
ステップSa8の抽出処理の結果、情報が抽出されなかった場合には(ステップSa9:NO)、表示部13の正常画面出力部131が、当該Webページをそのまま表示する(ステップSa31)。一方、ステップSa8の抽出処理の結果、情報が抽出された場合には(ステップSa9:YES)、抽出処理部111はステップSa10を実行する。
【0043】
ステップSa10において抽出処理部111は、当該Webページから、ステップSa4において取得した関連付抽出項目情報に示される関連付抽出項目に該当する情報を抽出する。例えば、抽出処理部111は、当該Webページからドメインを抽出する。
【0044】
次に、関連付判断部112は、ドメイン情報DB124からドメイン情報を呼び出す(ステップSa11及びSa12)。そして、関連付判断部112は、当該Webページが、その呼び出したドメイン情報に示されるドメインと関連するものであるか否かについて判定する(ステップSa13)。具体的には、関連付判断部112は、ステップSa10において抽出した情報と、そのドメイン情報とを比較して、両者が一致するか否かを判定する。例えば、ステップSa10において抽出した情報がドメイン「xyz.com」であり、ドメイン情報のドメインに「xyz.com」が含まれる場合には、関連付判断部112は、当該Webページは関連付けされていると判定する。
【0045】
また例えば、ステップSa10において抽出したHTTPリファラ(referrer)のドメインが「xyz.com」かつサイト名が「時計shop」であり、ドメイン情報のドメインに「xyz.com」が含まれかつサイト名に「時計shop」が含まれる場合には、関連付判断部112は、当該Webページは関連付けされていると判定する。
このようにHTTPリファラとサイト名に基づいて関連付けを判断することにより、仮に当該Webページのドメインがドメイン情報DB124に記憶されるドメインと異なっていたとしても、両者の関連付けを行うことができる。なお、サイト名以外にも、例えば、購入した商品又は役務名や決済金額等の情報に基づいて、ドメインの異なるWebページ同士の関連付けを判断するようにしてもよい。
【0046】
ステップSa13の判定の結果、当該Webページが関連付けされていない場合には(ステップSa14:NO)、保存処理部113が、当該Webページの各種情報を抽出情報DB125とドメイン情報DB124とに記憶する(ステップSa30)。具体的には、保存処理部113は、ステップSa8において抽出された情報と、当該情報の情報分類と、当該情報の取得日時と、当該Webページのページ名とを含む新規のテーブルを作成して、抽出情報DB125に保存する。また、保存処理部113は、ステップSa10において抽出された情報(具体的には、ドメイン、IPアドレス及び/又はサイト名)を含む新規のレコードを作成して、ドメイン情報DB124に保存する。
そして、表示部13の正常画面出力部131が、当該Webページをそのまま表示する(ステップSa31)。
【0047】
一方、ステップSa13の判定の結果、当該Webページが関連付けされている場合には(ステップSa14:YES)、抽出処理部111が、当該Webページから、ステップSa4において取得したシナリオ情報のキーワードトリガ及び構成トリガを抽出する(ステップSa15)。例えば、
図10(a)に示されるWebページに対して本抽出処理が実行された場合には、
図2に示されるシナリオID「001」のシナリオ情報のキーワードトリガ「支払方法」が抽出される。また、例えば、
図10(b)に示されるWebページに対して本抽出処理が実行された場合には、
図2に示されるシナリオID「001」のシナリオ情報の構成トリガ「ラジオボタン」が抽出される。
【0048】
ステップSa15の抽出処理の結果、トリガが抽出されなかった場合には(ステップSa16:NO)、保存処理部113が、当該Webページの各種情報を抽出情報DB125に記憶する(ステップSa29)。具体的には、保存処理部113は、ステップSa8において抽出された情報と、当該情報の情報分類と、当該情報の取得日時と、当該Webページのページ名とを含む新規のレコードを、ステップSa13の判定において関連付けが確認されたドメインのテーブルに追加する。なお、当該Webページが、関連付けられるドメインとは異なるドメインを有するページである場合には、Webページのページ名として当該ページのURLが代用される。
そして、表示部13の正常画面出力部131が、当該Webページをそのまま表示する(ステップSa31)。
【0049】
一方、ステップSa15の抽出処理の結果、トリガが抽出された場合には(ステップSa16:YES)、比較処理部114が、抽出情報DB125から抽出情報を呼び出す(ステップSa17及びSa18)。この際、比較処理部114は、ステップSa13の判定において関連付けが確認されたドメインのテーブルに格納されている抽出情報を呼び出す。
【0050】
次に、比較処理部114は、ステップSa8において抽出された情報と、呼び出した抽出情報とを比較する(ステップSa19)。具体的には、比較処理部114は、ステップSa8において抽出された情報と、呼び出した抽出情報の抽出内容とを情報分類(又は抽出項目)ごとに比較する。例えば、ステップSa8において
図10(b)より抽出項目「支払方法」に該当する情報として「銀行振込」という情報が抽出された場合には、
図6に示される抽出情報の例の中では、当該抽出項目と
図10(a)より抽出された情報分類が共通する情報ID「001」の抽出情報のうち「銀行振込(XX銀行 XXX サギ タロウ);カード払い」がそれらの情報と比較される。
【0051】
この比較の結果、各情報分類について両情報が一致する場合には(ステップSa20:YES)、保存処理部113が、当該Webページの各種情報を抽出情報DB125に記憶する(ステップSa29)。具体的なステップSa29の処理内容については上記の通りである。そして、表示部13の正常画面出力部131が、当該Webページをそのまま表示する(ステップSa31)。
【0052】
一方、この比較の結果、いずれかの情報分類について両情報が一致しない場合には(ステップSa20:NO)、危険スコア判断部115が、危険スコアを算出する(ステップSa21)。ここで、本実施形態ではシナリオ情報ごとに危険スコアが設定されるため、危険スコア判断部115は、ステップSa19の比較において抽出情報と比較された情報を抽出するためにステップSa8において参照されたシナリオ情報に設定された危険スコアを特定する。情報の不整合が複数存在する場合には、各不整合につき特定した危険スコアを合算する。
【0053】
次に、危険スコア判断部115は、危険スコアDB126から累積危険スコアを呼び出す(ステップSa22及びSa23)。この際、危険スコア判断部115は、ステップSa13の判定において関連付けが確認されたドメインと対応づけられている累積危険スコアを呼び出す。そして、危険スコア判断部115は、ステップSa21において算出した危険スコアを、呼び出した累積危険スコアに加算して、最新の累積危険スコアを算出する。(ステップSa24)。
【0054】
次に、危険スコア判断部115は、ステップSa24において算出した累積危険スコアを所定の閾値と比較する(ステップSa25)。この比較の結果、累積危険スコアが閾値未満であった場合には(ステップSa26:NO)、保存処理部113が、危険スコアDB126に記憶されている危険スコアを更新する(ステップSa28)。具体的には、保存処理部113は、ステップSa22及びSa23において呼び出された累積危険スコアを、ステップSa24において算出した累積危険スコアにより更新する。また、保存処理部113は、当該Webページの各種情報を抽出情報DB125に記憶する(ステップSa29)。具体的なステップSa29の処理内容については上記の通りである。
そして、表示部13の正常画面出力部131が、当該Webページをそのまま表示する(ステップSa31)。
【0055】
一方、ステップSa25の比較の結果、累積危険スコアが閾値以上であった場合には(ステップSa26:YES)、表示部13の警告画面出力部132が、当該Webページを表示する際に、当該Webページが偽サイトのページである可能性があることを警告するメッセージとその理由を併せて表示する(ステップSa27)。
以上が、本偽サイト検出動作についての説明である。
【0056】
1−2−2.メールに対して実行される偽サイト検出動作
図11及び12は、メールに対して実行される偽サイト検出動作の一例を示すフローチャートである。本動作は、その実行対象がWebページではなくメールである点以外は、上記の
図8及び9に示される動作と同様である。よって、以下の説明では、
図8及び9に示される動作と同様の処理については同様の符号を付し、その詳細な説明を省略する。
【0057】
本動作において、抽出処理部111が事前準備を完了すると(ステップSa4)、メーラ15は、ユーザによる指示に応じて又は自動的にメールサーバ3に対してメールの受信要求を送信する(ステップSb1)。メールサーバ3は、送信された受信要求を受信すると、要求されたメールをメーラ15に配信する(ステップSb2)。メーラ15は、この配信されたメールを取得すると、当該メールを処理部11に転送する(ステップSb3)。
【0058】
処理部11の抽出処理部111は、この転送されたメールを取得すると、当該メールに対して抽出処理を実行する(ステップSa8)。以下、この抽出処理について図面を参照して補足的に説明する。
図13は、表示部13に表示されるメールの一例を示す図である。より具体的には、時計を販売するWebサイトを運営する業者から送信される、注文の完了を知らせるメールの一例を示す図である。本メールが処理対象となっている場合において、例えば
図2に示されるシナリオID「003」のシナリオ情報の抽出項目「担当者」に該当する情報が抽出される場合には、当該抽出項目の近傍に位置する「詐欺太郎」という情報が抽出される。
【0059】
ステップSa8の抽出処理の結果、情報が抽出されなかった場合には(ステップSa9:NO)、表示部13の正常画面出力部131が、当該メールをそのまま表示する(ステップSa31)。一方、ステップSa8の抽出処理の結果、情報が抽出された場合には(ステップSa9:YES)、抽出処理部111はステップSa10を実行する。
【0060】
ステップSa10において抽出処理部111は、当該メールから、ステップSa4において取得した関連付抽出項目情報に示される関連付抽出項目に該当する情報を抽出する。例えば、
図13に示されるメールが処理対象となっている場合には、抽出処理部111は、当該メールの送信元アドレスからドメイン「xyz.com」を抽出する。また、抽出処理部111は、当該メールの件名又は本文からサイト名「時計shop」を抽出する。
【0061】
次に、関連付判断部112は、ドメイン情報DB124からドメイン情報を呼び出す(ステップSa11及びSa12)。そして、関連付判断部112は、当該メールが、その呼び出したドメイン情報に示されるドメインと関連するものであるか否かについて判定する(ステップSa13)。例えば、ステップSa10において抽出した情報がドメイン「xyz.com」であり、ドメイン情報のドメインに「xyz.com」が含まれる場合には、関連付判断部112は、当該メールは関連付けされていると判定する。もしくは、ステップSa10において抽出した情報がサイト名「時計shop」であり、ドメイン情報のサイト名に「時計shop」が含まれる場合には、関連付判断部112は、当該メールは関連付けされていると判定する。
【0062】
ステップSa13の判定の結果、当該メールが関連付けされていない場合には(ステップSa14:NO)、表示部13の正常画面出力部131が、当該メールをそのまま表示する(ステップSa31)。一方、ステップSa13の判定の結果、当該メールが関連付けされている場合には(ステップSa14:YES)、抽出処理部111が、当該メールから、ステップSa4において取得したシナリオ情報のキーワードトリガ及び構成トリガを抽出する(ステップSa15)。例えば、
図13に示されるメールに対して本抽出処理が実行された場合には、
図2に示されるシナリオID「003」のシナリオ情報のキーワードトリガ「完了」が抽出される。
【0063】
ステップSa15の抽出処理の結果、トリガが抽出されなかった場合には(ステップSa16:NO)、保存処理部113が、当該メールの各種情報を抽出情報DB125に記憶する(ステップSa29)。この際、Webページのページ名として当該メールの件名が代用される。そして、表示部13の正常画面出力部131が、当該メールをそのまま表示する(ステップSa31)。
【0064】
一方、ステップSa15の抽出処理の結果、トリガが抽出された場合には(ステップSa16:YES)、比較処理部114が、抽出情報DB125から抽出情報を呼び出す(ステップSa17及びSa18)。
次に、比較処理部114は、ステップSa8において抽出された情報と、呼び出した抽出情報とを比較する(ステップSa19)。例えば、ステップSa8において抽出項目「支払方法」に該当する情報として
図13より「XX銀行 YY サ ギタ」という情報が抽出された場合には、
図6に示される抽出情報の例の中では、当該抽出項目と
図10(a)より抽出された情報分類が共通する情報ID「001」の抽出情報のうち「銀行振込(XX銀行 XXX サギ タロウ);カード払い」がその情報と比較される。
この比較の結果、各情報分類について両情報が一致する場合には(ステップSa20:YES)、保存処理部113が、当該メールの各種情報を抽出情報DB125に記憶する(ステップSa29)。そして、表示部13の正常画面出力部131が、当該メールをそのまま表示する(ステップSa31)。
【0065】
一方、この比較の結果、いずれかの情報分類について両情報が一致しない場合には(ステップSa20:NO)、危険スコア判断部115が、危険スコアを算出する(ステップSa21)。
次に、危険スコア判断部115は、危険スコアDB126から累積危険スコアを呼び出し(ステップSa22及びSa23)、ステップSa21において算出した危険スコアを、呼び出した累積危険スコアに加算して、最新の累積危険スコアを算出する。(ステップSa24)。
【0066】
次に、危険スコア判断部115は、ステップSa24において算出した累積危険スコアを所定の閾値と比較する(ステップSa25)。この比較の結果、累積危険スコアが閾値未満であった場合には(ステップSa26:NO)、保存処理部113が、危険スコアDB126に記憶されている危険スコアを更新する。また、保存処理部113は、当該メールの各種情報を抽出情報DB125に記憶する(ステップSa29)。
そして、表示部13の正常画面出力部131が、当該メールをそのまま表示する(ステップSa31)。
【0067】
一方、ステップSa25の比較の結果、累積危険スコアが閾値以上であった場合には(ステップSa26:YES)、表示部13の警告画面出力部132が、当該メールを表示する際に、当該メールが偽サイトの運営者から送信されたメールであることを警告するメッセージを併せて表示する(ステップSa31)。
以上が、本偽サイト検出動作についての説明である。
【0068】
以上説明した偽サイト検出装置1によれば、Webサイトを構成する複数ページ間の販売関連情報の整合性を検証することにより、当該Webサイトが偽サイトであるか否かを判定するという新たな偽サイト検出方法が提供される。この偽サイト検出方法は、Webサイトのトップページでは正規サイトと同様に各種の決済方法を選択可能である旨を謳う一方で、決済方法を実際に選択させるページでは販売者に都合のよい決済方法しか提示しないという偽サイトの特徴に鑑みて考えられたものである。
また、上記の偽サイト検出装置1によれば、Webブラウザ14により取得されるWebページだけでなく、メーラ15により取得されるメールについても上記偽サイト検出動作の対象となるため、Webページとメール間の情報の整合性についても検証することができる。
【0069】
2.変形例
上記の実施形態は、以下のように変形してもよい。また、以下の変形例は互いに組み合わせてもよい。
【0070】
2−1.変形例1
上記の実施形態に係る偽サイト検出動作において、従来の偽サイト検出方法も併せて用いられてもよい。例えば、上記動作のステップSa20において情報の不整合が検出された場合に、WebページのIPアドレスや、Webページやメールに記述されている値引率が、所定の条件に合致するか否かを判定するようにしてもよい。そして、IPアドレス又は値引率が所定の条件に合致した場合には、相応の危険スコアを、ステップSa24において算出される累積危険スコアに加算するようにしてもよい。
【0071】
2−2.変形例2
上記の実施形態に係る偽サイト検出動作のステップSa17及びSa18において、比較処理部114は、所定の期間内に抽出された抽出情報のみを抽出情報DB125から呼び出すようにしてもよい。例えば、比較処理部114は、現在日時から所定の期間(例えば、1日)内に抽出された抽出情報のみを抽出情報DB125から呼び出すようにしてもよい。これは、抽出からある程度の時間が経過すると正規サイトであっても支払方法等が変更される可能性があり、にも係わらず古い抽出情報を参照してしまうと正規サイトが誤って偽サイトとして検出される可能性があるからである。
【0072】
2−3.変形例3
上記の実施形態に係る偽サイト検出装置1は端末装置として想定されているが、上記の偽サイト検出動作は端末装置以外の装置において実行されてもよい。例えば、端末装置と、Webサーバ2又はメールサーバ3とを中継する中継装置において実行されてもよい。この中継装置は、本発明に係る「情報処理システム」の一例である。ここで中継装置とは、例えばプロキシサーバである。
【0073】
中継装置において上記の偽サイト検出動作が実行される場合には、中継装置は、上記のステップSa5において、端末装置から送信されたWebページのリクエストをWebサーバ2に送信し、上記のステップSa7において、端末装置に対して返信されたWebページを自機の処理部11に転送する。また、中継装置は、上記のステップSb1において、端末装置から送信されたメールの受信要求をメールサーバ3に送信し、上記のステップSb3において、端末装置に対して配信されたメールを自機の処理部11に転送する。ステップSa29、Sa30で抽出情報を記憶部に書き込む場合は、ユーザIDなどでユーザごとに区分された単位で保存を行う。
【0074】
また、中継装置は、上記のステップSa31において、Webページ又はメールをそのまま端末装置に転送する一方で、上記のステップSa27においては、Webページ又はメールとともに、偽サイトの検出を通知する情報を端末装置に送信する。
【0075】
2−4.変形例4
上記の実施形態に係る抽出情報DB125は、偽サイト検出装置1とは異なる別のサーバにより管理されてもよい。そして、上記の偽サイト検出動作のステップSa8において抽出された情報は、当該サーバの記憶部に記憶するようにし、同動作のステップSa19において比較される抽出情報は、当該サーバの記憶部から呼び出すようにしてもよい。このような実施形態によれば、偽サイト検出装置1が複数存在する場合に、その装置間で抽出情報を共有できるという利点がある。
【0076】
本変形例が採用される場合、偽サイト検出装置1の送信部161は、抽出処理部111により抽出された販売関連情報を当該サーバに送信する。また、受信部162は、当該サーバにより管理される販売関連情報を受信する。一方、サーバは、送信部161により送信される販売関連情報を記憶する記憶部を備える。
この変形例に係る偽サイト検出装置1は、本発明に係る「第1の情報処理装置」及び「第2の情報処理装置」の一例である。
【0077】
2−5.変形例5
図1に示される偽サイト検出装置1の機能群を実現するプログラムは、コンピュータ装置が読み取り可能な記録媒体を介して提供されてもよい。ここで、記録媒体とは、例えば、磁気テープや磁気ディスクなどの磁気記録媒体や、光ディスクなどの光記録媒体や、光磁気記録媒体や、半導体メモリ等である。また、このプログラムは、インターネット等のネットワークを介して提供されてもよい。
【0078】
2−6.その他の変形例
上記の実施形態に係る偽サイト検出動作では、Webページ又はメールからキーワードトリガ又は構成トリガが抽出された場合に、比較処理部114による比較処理が実行されている(ステップSa16〜Sa19参照)。しかし、これらのトリガの抽出の有無にかかわらず、比較処理部114による比較処理を実行するようにしてもよい。すなわち、上記の実施形態に係る偽サイト検出動作においてステップSa15及びSa16は省略されてもよい。
【0079】
また、上記の実施形態に係る偽サイト検出動作では、累積危険スコアが閾値以上になった場合に、偽サイトの検出を知らせるメッセージが表示部13に表示されている(ステップSa26及びSa27参照)。しかし、比較処理部114による比較処理の結果、情報の不整合が検出された時点で、偽サイトの検出を知らせるメッセージを表示部13に表示するようにしてもよい。