(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0011】
以下、実施の形態を図を用いて説明する。以下の実施の形態の説明及び図面において、同一の符号を付したものは、同一の部分又は相当する部分を示す。
【0012】
実施の形態1.
***構成の説明***
図1は、本実施の形態に係るセキュリティ水準検証システム1000の構成例を示す。
【0013】
情報処理装置10は、バイヤー30からの評価要求に従い、サプライヤー20の情報セキュリティ水準を評価する。
情報処理装置10はコンピュータである。情報処理装置10の動作手順は、情報処理方法に相当する。また、情報処理装置10の動作を実現するプログラムは、情報処理プログラムに相当する。
情報処理装置10は、例えば、セキュリティ水準検証機関に配置されている。
【0014】
サプライヤー20は、バイヤー30とは異なる企業である。
サプライヤー20は、バイヤー30の製品又はサービスに用いられる物品をバイヤー30に納入する企業である。サプライヤー20がバイヤー30に納入する物品を納入品という。
納入品は、原料、部品、半完成品、製造機器、包装、容器、ツール、ソフトウェア等、バイヤー30の製品又はサービスに用いられるあらゆる有体物又は無体物である。
サプライヤー20は、既にバイヤー30に納入品を納入していてもよいし、まだバイヤー30に納入品を納入していなくてもよい。つまり、サプライヤー20は、バイヤー30にとって潜在的な取引先であってもよい。
【0015】
バイヤー30は、サプライヤー20の納入品の納入先の企業である。
前述したように、バイヤー30は、サプライヤー20からの納入品の納入を既に受けていてもよいし、まだサプライヤー20からの納入品の納入を受けていなくてもよい。
バイヤー30では、バイヤー端末装置31が稼動する。バイヤー端末装置31はコンピュータである。
【0016】
評価機関40は、サプライヤー20の情報セキュリティ水準に関する評価を行い、評価値を算出する。
評価機関40は複数存在する。
各評価機関40には、評価機関サーバ装置41が設置されている。評価機関サーバ装置41は、評価値を情報処理装置10に送信する。
【0017】
インターネット50には、Webサイト情報51とSNS情報52が含まれる。Webサイト情報51とSNS情報52は公開情報の例である。なお、公開情報は、インターネット50において公開されている情報であれば、Webサイト情報51及びSNS情報52に限らず、どのような情報でもよい。
Webサイト情報51には、例えば、ニュースサイトでのニュース、セキュリティ関連サイトでのセキュリティ関連情報、Eコマースサイトでの商品レビュー、サプライヤー20の自社サイトでの製品情報等が含まれる。また、Webサイト情報51に、公的機関による事故事例情報が含まれていてもよい。
SNS情報52は、SNS(Social Networking Service)で共有される情報である。SNSは、コミュニティー型の情報共有サービスである。
以下では、Webサイト情報51とSNS情報52をまとめて公開情報と記す場合がある。
【0018】
ここで、
図1を参照して、本実施の形態に係るセキュリティ水準検証システム1000の概要を説明する。
【0019】
各評価機関40は、サプライヤー20の情報セキュリティに関する評価を行い、評価値を算出する。
なお、本実施の形態では、各評価機関40では、複数のサプライヤー20のうちの一部についての評価を行っているが、残りのサプライヤー20については評価を行っていないものとする。
以下では、いずれかの評価機関40により評価が行われているサプライヤー20を評価済みサプライヤー20という。また、いずれの評価機関40にも評価が行われていないサプライヤー20を未評価サプライヤー20という。
評価機関40により算出された評価値は評価機関サーバ装置41で記憶される。
【0020】
インターネット50では、Webサイト情報51として、サプライヤー20に関するニュース、サプライヤー20の納入品に関する商品レビュー等が生成される。また、SNS情報52として、サプライヤー20の納入品に関する情報が生成される。
【0021】
情報処理装置10の動作フェーズには、モデル生成フェーズと評価値算出フェーズとがある。
【0022】
モデル生成フェーズでは、情報処理装置10は、評価機関サーバ装置41から評価済みサプライヤー20の評価値を取得する。
また、情報処理装置10は、例えば、Webサイト情報51である、セキュリティ関連サイトでのセキュリティ関連情報を解析して、情報セキュリティに関するキーワードを複数選択する。
また、情報処理装置10は、Webサイト情報51及びSNS情報52を調査して、調査済みサプライヤー20についての各キーワードの出現数を取得する。
更に、情報処理装置10は、評価機関サーバ装置41から取得した評価済みサプライヤー20の評価値と、Webサイト情報51及びSNS情報52から取得した評価済みサプライヤー20についてのキーワードの出現数とを用いた重回帰分析を行って、回帰モデルを生成する。
より具体的には、情報処理装置10は、説明変数がキーワードの出現数であり、目的変数が評価値である回帰モデルを生成する。
【0023】
評価値算出フェーズでは、先ず、バイヤー端末装置31が情報処理装置10に対して評価要求を発行する。より具体的には、バイヤー端末装置31は、評価要求を発行して、未評価サプライヤー20の情報セキュリティに関する評価値を算出するよう情報処理装置10に要求する。
評価要求が発行されると、情報処理装置10は、Webサイト情報51及びSNS情報52を調査して、評価対象の未評価サプライヤー20(以下、評価対象サプライヤー20という)についてのキーワードの出現数を取得する。
次に、情報処理装置10は、取得した評価対象サプライヤー20についてのキーワードの出現数を回帰モデルに適用して、評価対象サプライヤー20の評価値を算出する。
そして、情報処理装置10は、評価結果として、評価対象サプライヤー20の評価値をバイヤー端末装置31に送信する。
【0024】
次に、
図2を参照して、情報処理装置10のハードウェア構成例を説明する。
図2は、情報処理装置10のハードウェア構成例を示す。
【0025】
情報処理装置10は、ハードウェアとして、プロセッサ901、主記憶装置902、補助記憶装置903及び通信装置904を備える。
また、情報処理装置10は、機能構成として、
図3に示す通信部101、評価値取得部102、キーワード抽出部103、キーワード選択部104、出現数取得部105、モデル生成部106、評価値算出部107、取得評価値記憶部108、キーワード記憶部109、出現数記憶部110、モデル記憶部111及び算出評価値記憶部112を備える。通信部101、評価値取得部102、キーワード抽出部103、キーワード選択部104、出現数取得部105、モデル生成部106、評価値算出部107、取得評価値記憶部108、キーワード記憶部109、出現数記憶部110、モデル記憶部111及び算出評価値記憶部112の詳細は後述する。
補助記憶装置903には、通信部101、評価値取得部102、キーワード抽出部103、キーワード選択部104、出現数取得部105、モデル生成部106及び評価値算出部107の機能を実現するプログラムが記憶されている。
これらプログラムは、補助記憶装置903から主記憶装置902にロードされる。そして、プロセッサ901がこれらプログラムを実行して、後述する通信部101、評価値取得部102、キーワード抽出部103、キーワード選択部104、出現数取得部105、モデル生成部106及び評価値算出部107の動作を行う。
図2では、プロセッサ901が通信部101、評価値取得部102、キーワード抽出部103、キーワード選択部104、出現数取得部105、モデル生成部106及び評価値算出部107の機能を実現するプログラムを実行している状態を模式的に表している。
また、取得評価値記憶部108、キーワード記憶部109、出現数記憶部110、モデル記憶部111及び算出評価値記憶部112は、主記憶装置902又は補助記憶装置903により実現される。
【0026】
次に、
図3を参照して、情報処理装置10の機能構成例を説明する。
図3は、情報処理装置10の機能構成例を示す。
【0027】
通信部101は、外部装置と通信を行う。
具体的には、通信部101は、例えば、評価機関40に設置されている評価機関サーバ装置41から、評価済みサプライヤー20の評価値を受信する。
また、通信部101は、例えば、インターネット50上のサーバ装置から、Webサイト情報51、SNS情報52等の公開情報、キーワードの影響度、キーワードの出現数を取得する。
また、通信部101は、バイヤー端末装置31から評価要求を受信し、また、バイヤー端末装置31に評価結果を送信する。
【0028】
評価値取得部102は、通信部101を介して評価済みサプライヤー20の評価値を取得する。評価値取得部102は、取得した評価値を取得評価値記憶部108に格納する。
評価値取得部102で行われる処理は、評価値取得処理に相当する。
【0029】
キーワード抽出部103は、通信部101を介して公開情報を取得し、取得した公開情報から頻出するキーワードを抽出する。より具体的には、キーワード抽出部103は、3以上のキーワードを抽出する。
そして、キーワード抽出部103は抽出した3以上のキーワードを取得評価値記憶部108に格納する。
【0030】
キーワード選択部104は、キーワード抽出部103から3以上のキーワードを取得し、通信部101を介して各キーワードの公開情報での影響度を調査し、各キーワードの影響度を通信部101を介して取得する。
そして、キーワード選択部104は、影響度に基づき、3以上のキーワードの中から2以上のキーワードを選択する。
キーワード選択部104は、選択した2以上のキーワードをキーワード記憶部109に格納する。
【0031】
出現数取得部105は、評価済みサプライヤー20についての、キーワード選択部104により選択された2以上のキーワードの各々の公開情報での出現数を通信部101を介して取得する。
また、出現数取得部105は、評価対象サプライヤー20についての、当該2以上のキーワードの各々の公開情報での出現数を通信部101を介して取得する。
そして、出現数取得部105は、取得した出現数を出現数記憶部110に格納する。
出現数取得部105で行われる処理は、出現数取得処理に相当する。
【0032】
モデル生成部106は、評価済みサプライヤー20の評価値と、評価済みサプライヤー20についての2以上のキーワードの各々の公開情報での出現数とを用いた重回帰分析を行って回帰モデルを生成する。回帰モデルは、説明変数が2以上のキーワードの各々の公開情報での出現数であり、目的変数が評価値であるモデルである。
モデル生成部106で行われる処理は、モデル生成処理に相当する。
【0033】
評価値算出部107は、バイヤー端末装置31から、未評価サプライヤー20についての評価要求を通信部101を介して取得した場合に、評価値を算出する。つまり、評価値算出部107は、評価対象サプライヤー20についての2以上のキーワードの各々の公開情報での出現数を回帰モデルに適用して、評価対象サプライヤー20の評価値を算出する。
そして、評価値算出部107は、通信部101を介して、評価値を評価結果としてバイヤー端末装置31に送信する。
【0034】
取得評価値記憶部108は、評価値取得部102により取得された評価済みサプライヤー20の評価値を記憶する。
キーワード記憶部109は、キーワード選択部104により選択された2以上のキーワードを記憶する。
出現数記憶部110は、出現数取得部105により取得された評価済みサプライヤー20についてのキーワードの出現数及び評価対象サプライヤー20についてのキーワードの出現数を記憶する。
モデル記憶部111は、モデル生成部106により生成された回帰モデルを記憶する。
算出評価値記憶部112は、評価値算出部107により算出された評価値を記憶する。
【0035】
***動作の説明***
次に、本実施の形態に係る情報処理装置10の動作例を説明する。
図4は、本実施の形態に係る情報処理装置10のモデル生成フェーズにおける動作例を示す。
【0036】
ステップS11において、モデル生成部106は、回帰モデルの生成のための学習に用いるサプライヤー20を決定する。具体的には、モデル生成部106は、評価済みサプライヤー20の中から学習に用いるサプライヤー20を決定する。モデル生成部106は、例えば定期的に各評価機関40から新たに評価された評価済みサプライヤー20の名称を通知されるものとする。
そして、モデル生成部106は、決定した学習対象の評価済みサプライヤー20の評価値を取得するよう評価値取得部102に指示する。
評価値取得部102は、通信部101を介して、各評価機関40の評価機関サーバ装置41から学習対象の評価済みサプライヤー20の評価値を受信する。そして、評価値取得部102は、受信した評価値を取得評価値記憶部108に格納する。
【0037】
ステップS12では、キーワード抽出部103がキーワードを抽出する。
より具体的には、キーワード抽出部103は、例えば、セキュリティ関連サイトでのセキュリティ関連情報を解析して、情報セキュリティに関する頻出キーワードを抽出する。キーワード抽出部103は、また、ニュースサイトから頻出キーワードを抽出してもよい。更には、キーワード抽出部103は、最新ニュースを形態素解析し、キーワード分布から頻出キーワードを導出してもよい。
最終的に、キーワード抽出部103は、3以上のキーワードを抽出する。
キーワード抽出部103は、抽出したキーワードをキーワード選択部104に出力する。
【0038】
なお、ステップS11とステップS12は順序が入れ替わってもよい。また、ステップS11とステップS12とを並行して行ってもよい。
【0039】
ステップS13では、キーワード選択部104が、キーワード抽出部103により抽出された3以上のキーワードから2以上のキーワードを選択する。例えば、キーワード選択部104は、各キーワードの影響度に基づいて、キーワードを選択する。具体的には、キーワード選択部104は、以下の手順で各キーワードの影響度を取得する。
キーワード選択部104は、各キーワードと学習対象の評価済みサプライヤー20の名称でニュースサイトを検索する。そして、キーワード選択部104は、キーワードごとに、キーワードと学習対象の評価済みサプライヤー20の名称とが示されるニュースを収集する。
更に、キーワード選択部104は、キーワードごとに、収集したニュースのヘッドラインを検索ワードとして、検索サイトでの「表示順序」、「ヒット数」を調査する。更に、キーワード選択部104は、キーワードごとに、収集したニュースのヘッドラインがSNS情報52において話題に上った回数を調査する。そして、検索サイトでの「表示順序」が高く、検索サイトでの「ヒット数」及びSNS情報52において話題に上った回数が多いキーワードを選択する。
キーワード選択部104は、選択した2以上のキーワードをキーワード記憶部109に格納する。
【0040】
なお、以上のような手順でキーワード選択部104がキーワードを選択するため、特定のサプライヤー20が自身に有利になるように情報を捏造したとしても、キーワード選択部104は真に影響力のあるキーワードを選択することができる。
【0041】
次に、ステップS14において、出現数取得部105が、学習対象の評価済みサプライヤー20についての各キーワードの出現数を取得する。
具体的には、モデル生成部106が、キーワード記憶部109から2以上のキーワードを読み出し、読み出した2以上のキーワードと学習対象の評価済みサプライヤー20の名称を出現数取得部105に通知する。
出現数取得部105は、キーワードごとに、キーワードと学習対象の評価済みサプライヤー20の名称を検索ワードとして用い、検索サイトでの「ヒット数」を出現数として取得する。
出現数取得部105は、取得した各キーワードの出現数をモデル生成部106に通知する。
【0042】
次に、ステップS15において、モデル生成部106が、学習対象の評価済みサプライヤー20の評価値と学習対象の評価済みサプライヤー20についての各キーワードの出現数を用いて、回帰モデルを生成する。
モデル生成部106は、取得評価値記憶部108から、学習対象の評価済みサプライヤー20の評価値を読み出す。また、モデル生成部106は、出現数取得部105から、学習対象の評価済みサプライヤー20についての各キーワードの出現数を取得する。
例えば、モデル生成部106は、
図5に示すように、学習対象の評価済みサプライヤー20の評価値と、学習対象の評価済みサプライヤー20についての各キーワードの出現数を得る。
【0043】
図5では、学習対象の評価済みサプライヤー20としてAAA社、BBB社及びCCC社が示される。
また、
図5では、評価機関XXX、評価機関YYY及び評価機関ZZZの各々による、AAA社、BBB社及びCCC社の各々の評価値が示される。
また、
図5では、AAA社、BBB社及びCCC社の各々についての、キーワード1、キーワード2及びキーワード3の出現数が示される。
図5に示すように、モデル生成部106は、複数の学習対象の評価済みサプライヤー20についての複数の評価機関40による評価値と、複数の学習対象の評価済みサプライヤー20についての複数のキーワードの出現数を用いて、回帰モデルを生成する。
【0044】
具体的には、モデル生成部106は、以下の重回帰式(式1)において、評価機関40ごとに、偏回帰係数β
0、β
1、β
2及びβ
3の各々の値を、最小二乗法により求める。
偏回帰係数β
0、β
1、β
2及びβ
3の各々の値が明らかになった後の式1が回帰モデルに相当する。
y=β
0+β
1x
1+β
2x
2+β
3x
3 式1
なお、yは評価機関40によるサプライヤー20の評点である。x
1は評価済みサプライヤー20(例えば、AAA社)についてのキーワード1の出現数である。x
2は評価済みサプライヤー20(例えば、AAA社)についてのキーワード2の出現数である。x
3は評価済みサプライヤー20(例えば、AAA社)についてのキーワード3の出現数である。
つまり、評価機関XXXによる評価値、評価機関YYYによる評価値及び評価機関ZZZによる評価値ごとに3つの重回帰式(式1)が作成される。
【0045】
モデル生成部106は、生成した回帰モデルをモデル記憶部111に格納する。
【0046】
次に、
図6を参照して、評価値算出フェーズにおける情報処理装置10の動作例を説明する。
【0047】
ステップS21において、評価値算出部107はバイヤー端末装置31から評価要求を受信したか否かを判定する。
評価要求が受信されている場合は、処理がステップS22に進む。評価要求が受信されていない場合は、処理がステップS27に進む。
【0048】
ステップS22では、評価値算出部107は、1年以内に評価対象サプライヤー20についての評価を行っているか否かを判定する。
1年以内に評価対象サプライヤー20についての評価を行っている場合は、処理がステップS23に進む。一方、1年以内に評価対象サプライヤー20についての評価を行っていない場合は、処理がステップS26に進む。
【0049】
ステップS23では、評価値算出部107は、評価対象サプライヤー20について回帰モデルを用いて評価値を算出する。
ステップS23の詳細は後述する。
【0050】
ステップS24では、評価値算出部107は、ステップS23で算出した評価対象サプライヤー20の評価値を算出評価値記憶部112に格納する。
【0051】
また、ステップS25で、評価値算出部107は、ステップS23で算出した評価対象サプライヤー20の評価値を通信部101を介してバイヤー端末装置31に送信する。
【0052】
ステップS26では、評価値算出部107は、過去の評価対象サプライヤー20の評価値を通信部101を介してバイヤー端末装置31に送信する。
具体的には、評価値算出部107は、評価対象サプライヤー20の評価値を算出評価値記憶部112から読み出し、読み出した評価値を通信部101を介してバイヤー端末装置31に送信する。
【0053】
ステップS27では、評価値算出部107は、最後に評価を行った時から1年が経過したか否かを判定する。
最後に評価を行った時から1年が経過している場合は、処理がステップS23に進む。一方、最後に評価を行った時から1年が経過していない場合は、評価値算出部107は処理を終了数する。
【0054】
次に、
図7を参照して、
図6のステップS23の詳細を説明する。
【0055】
ステップS231において、出現数取得部105が評価対象サプライヤー20についてのキーワードの出現数を取得する。
具体的には、評価値算出部107が出現数取得部105に評価対象サプライヤー20の名称を通知する。そして、出現数取得部105が回帰モデルにおいて説明変数として用いられているキーワードをキーワード記憶部109から読み出す。そして、出現数取得部105は、キーワードごとに、キーワードと学習対象の評価済みサプライヤー20の名称を検索ワードとして用い、検索サイトでの「ヒット数」を出現数として取得する。
出現数取得部105は、取得した各キーワードの出現数を評価値算出部107に通知する。
【0056】
次に、ステップS232において、評価値算出部107が回帰モデルに、評価対象サプライヤー20についてのキーワードの出現数を適用して、評価値候補を算出する。
具体的には、評価値算出部107は、モデル記憶部111から複数の回帰モデルを取得する。そして、評価値算出部107は、複数の回帰モデルの各々に評価対象サプライヤー20についてのキーワードの出現数を適用して、複数の評価値候補を算出する。
図5の例では、モデル生成部106により評価機関XXXによる評価値の回帰モデル、評価機関YYYによる評価値の回帰モデル及び評価機関ZZZによる評価値の回帰モデルが生成されている。このため、評価値算出部107は、モデル記憶部111から、評価機関XXXによる評価値の回帰モデル、評価機関YYYによる評価値の回帰モデル及び評価機関ZZZによる評価値の回帰モデルを取得する。
そして、評価値算出部107は、評価機関XXXによる評価値の回帰モデル、評価機関YYYによる評価値の回帰モデル及び評価機関ZZZによる評価値の回帰モデルに評価対象サプライヤー20についてのキーワードの出現数を適用(式1のx
1、x
2及びx
3の各々にキーワードの出現数を代入)して、3つの回帰モデルから3つの評価値候補(式1のy)を得る。
【0057】
次に、ステップS233において、評価値算出部107は、評価値候補の平均値を最終的な評価値として採用する。
なお、ステップS232に代えて、評価値算出部107は、評価機関XXXによる評価値の回帰モデル、評価機関YYYによる評価値の回帰モデル及び評価機関ZZZによる評価値の回帰モデルによる3つの評価値候補のうちのいずれかの評価値候補を最終的な評価値として採用してもよい。
その後、処理が
図6のステップS24に進む。
【0058】
***実施の形態の効果の説明***
以上のように、本実施の形態によれば、サプライヤーの情報セキュリティに関する評価を得ることができる。
つまり、本実施の形態によれば、評価機関40による評価が行われていないサプライヤーであっても、リアルタイムに情報セキュリティに関する評価を得ることができる。
【0059】
また、本実施の形態によれば、評価対象サプライヤー20が不正に評価を上げることを防止することができる。
評価対象サプライヤー20が意図的に情報を開示しない場合は、キーワードの出現数が低くなるため、回帰モデルの説明変数も低くなり、結果として、評価値も低くなる。また、評価対象サプライヤー20が虚偽の情報を流布している場合にも、虚偽の情報はWebサイト情報51及びSNS情報52での正しい情報にかき消される。このため、評価対象サプライヤー20は虚偽の情報によって高い評価値を得ることはできない。
【0060】
なお、以上では、キーワード選択部104が、キーワードの影響度に基づき、キーワード抽出部103により抽出されたキーワードから回帰モデルに用いるキーワードを選択する例を説明した。
しかしながら、キーワード選択部104を省略してもよい。この場合は、キーワード抽出部103により抽出されたキーワードがそのまま回帰モデルに用いられることになる。
【0061】
実施の形態2.
本実施の形態では、主に実施の形態1との差異を説明する。
なお、以下で説明していない事項は、実施の形態1と同様である。
【0062】
実施の形態1では、情報処理装置10は、肯定的なキーワードと否定的なキーワードを区別せずに回帰モデルを生成していた。本実施の形態では、情報処理装置10は、肯定的なキーワードと否定的なキーワードを区別して回帰モデルを生成する。
ここで、肯定的なキーワードとは、情報セキュリティ上好ましい事柄を表現するキーワードである。否定的なキーワードとは、情報セキュリティ上好ましくない事柄を表現するキーワードである。肯定的なキーワードとしては、例えば、「改善」、「アップデート」、「パッチ」等が考えられる。否定的なキーワードとしては、例えば、「脆弱性」、「バックドア」、「オーバーフロー」等が考えられる。
【0063】
本実施の形態では、
図4のステップS12において、キーワード抽出部103が、肯定的なキーワード及び否定的なキーワードを区別してキーワードを抽出する。
例えば、キーワード抽出部103は、肯定的なキーワードのみを3個以上抽出してもよい。また、キーワード抽出部103は、否定的なキーワードのみを3個以上抽出してもよい。更に、キーワード抽出部103は、肯定的なキーワード及び否定的なキーワードの各々で3個以上のキーワードを抽出してもよい。ここでは、キーワード抽出部103が肯定的なキーワード及び否定的なキーワードの各々で3個以上のキーワードを抽出する例を想定する。
本実施の形態では、キーワード抽出部103は、複数の肯定的なキーワード及び複数の否定的なキーワードを予め用意しておく。例えば、キーワード抽出部103は、肯定的なキーワード及び複数の否定的なキーワードを各々20個用意しておく。そして、キーワード抽出部103は、公開情報を取得し、肯定的なキーワードの各々の公開情報での出現数を計数し、出現数が多い順に3個以上の肯定的なキーワードを抽出する。同様に、キーワード抽出部103は、公開情報を取得し、否定的なキーワードの各々の公開情報での出現数を計数し、出現数が多い順に3個以上の否定的なキーワードの候補を抽出する。
【0064】
そして、
図4のステップS13において、キーワード選択部104が、肯定的なキーワード及び否定的なキーワードの各々で2個以上のキーワードを選択する。
キーワード選択部104によるキーワードの具体的な選択方法は実施の形態1で示した通りである。
【0065】
また、
図4のステップS14において、出現数取得部105が、肯定的なキーワード及び否定的なキーワードの各々で、学習対象の評価済みサプライヤー20についての、各キーワードの出現数を取得する。
出現数取得部105によるキーワードの出現数の具体的な取得方法は実施の形態1で示した通りである。
【0066】
そして、
図4のステップS15において、モデル生成部106が、肯定的なキーワード及び否定的なキーワードの各々で、学習済みの評価済みサプライヤー20の評価値とキーワードの出現数とを用いた重回帰分析を行って、肯定的なキーワード及び否定的なキーワードの各々で回帰モデルを生成する。
図5の例では、評価機関XXXによる評価値について、肯定的なキーワードの出現数がx
1、x
2及びx
3に用いられる重回帰式(式1)と、否定的なキーワードの出現数がx
1、x
2及びx
3に用いられる重回帰式(式1)とが生成される。
評価機関YYYによる評価値及び評価機関ZZZによる評価値についても2種類の回帰モデル(重回帰式)が生成される。
モデル生成部106による回帰モデルの具体的な生成方法は実施の形態1で示した通りである。
【0067】
また、
図7のステップS231において、出現数取得部105が、肯定的なキーワード及び否定的なキーワードの各々で、評価対象サプライヤー20についての、各キーワードの出現数を取得する。
出現数取得部105によるキーワードの出現数の具体的な取得方法は実施の形態1で示した通りである。
【0068】
また、
図7のステップS232において、評価値算出部107が、肯定的なキーワードの回帰モデル及び否定的なキーワードの回帰モデルを用いて、評価値候補を算出する。
評価値算出部107による評価値候補の具体的な算出方法は実施の形態1で示した通りである。
【0069】
そして、
図7のステップS233において、評価値算出部107が、肯定的なキーワードの回帰モデルによる評価値候補と否定的なキーワードの回帰モデルの評価候補値との平均をとって最終的な評価値を得る。
つまり、評価値算出部107は、以下の(1)〜(3)に示す6つの評価値候補の平均値を最終的な評価値として採用する。
(1)評価機関XXXによる評価値に基づく、肯定的なキーワードの回帰モデルによる評価値候補と、否定的なキーワードの回帰モデルの評価候補値
(2)評価機関YYYによる評価値に基づく、肯定的なキーワードの回帰モデルによる評価値候補と、否定的なキーワードの回帰モデルの評価候補値
(3)評価機関ZZZによる評価値に基づく、肯定的なキーワードの回帰モデルによる評価値候補と、否定的なキーワードの回帰モデルの評価候補値
【0070】
また、評価値算出部107は、上記の(1)〜(3)に示す6つの評価値候補のうちのいずれかの評価値候補を最終的な評価値として採用してもよい。
【0071】
このように、本実施の形態に係る情報処理装置10は、肯定的なキーワードと否定的なキーワードを区別して回帰モデルを生成し、また、肯定的なキーワードと否定的なキーワードを区別して評価対象サプライヤー20の評価値を算出する。
このため、本実施の形態によれば、より高精度のセキュリティ評価を得ることができる。
【0072】
実施の形態3.
本実施の形態では、主に実施の形態1との差異を説明する。
なお、以下で説明していない事項は、実施の形態1と同様である。
【0073】
実施の形態1では、情報処理装置10は、肯定的な公開情報と否定的な公開情報を区別せずに回帰モデルを生成していた。本実施の形態では、情報処理装置10は、肯定的な公開情報と否定的な公開情報を区別して回帰モデルを生成する。
ここで、肯定的な公開情報とは、否定的なキーワードが含まれていない公開情報である。否定的な公開情報とは、否定的なキーワードが含まれている公開情報である。否定的なキーワードは、実施の形態2で説明した通りである。
【0074】
図8は、本実施の形態に係る情報処理装置10のモデル生成フェーズでの動作例を示す。
図8では、
図4と比較して、ステップS16が追加されている。また、ステップS16の追加により、ステップS14とステップS15において実施の形態1と異なる動作が行われる。
【0075】
ステップS11〜S13は実施の形態1で説明したものと同様なので、説明を省略する。
【0076】
ステップS16において、キーワード選択部104が否定的なキーワードを選択する。
具体的には、評価値算出部107は、複数の否定的なキーワードを予め用意しておく。そして、評価値算出部107は、公開情報を取得し、否定的なキーワードの各々の公開情報での出現数を計数し、出現数が多い順に既定数の否定的なキーワードを選択する。
そして、評価値算出部107は、選択した否定的なキーワードをキーワード記憶部109に格納する。
【0077】
ステップS14では、出現数取得部105が、学習対象の評価済みサプライヤー20についての公開情報を、肯定的な公開情報と否定的な公開情報に分類する。そして、出現数取得部105は、肯定的な公開情報での各キーワード(回帰モデルの生成に用いられるキーワード)の出現数と、否定的な公開情報での各キーワードの出現数とを取得する。
出現数取得部105によるキーワードの出現数の具体的な取得方法は実施の形態1で示した通りである。
【0078】
ステップS15では、モデル生成部106が、肯定的な公開情報でのキーワードの出現数と否定的な公開情報でのキーワードの出現数の各々で、回帰モデルを生成する。
図5の例では、評価機関XXXによる評価値について、肯定的な公開情報でのキーワードの出現数がx
1、x
2及びx
3に用いられる重回帰式(式1)と、否定的な公開情報でのキーワードの出現数がx
1、x
2及びx
3に用いられる重回帰式(式1)とが生成される。
評価機関YYYによる評価値及び評価機関ZZZによる評価値についても2種類の回帰モデル(重回帰式)が生成される。
モデル生成部106による回帰モデルの具体的な生成方法は実施の形態1で示した通りである。
【0079】
評価値算出フェーズにおける情報処理装置10の動作例は
図6及び
図7に示す通りである。
図6に示す各ステップは、実施の形態1で説明したものと同じであるため、説明を省略する。
以下では、本実施の形態での
図7の動作を説明する。
【0080】
ステップS231では、出現数取得部105が、肯定的な公開情報及び否定的な公開情報の各々で、評価対象サプライヤー20についての、各キーワードの出現数を取得する。
より具体的には、出現数取得部105は、評価対象サプライヤー20についての公開情報を、肯定的な公開情報と否定的な公開情報に分類する。そして、出現数取得部105は、肯定的な公開情報での各キーワード(回帰モデルに含まれるキーワード)の出現数と、否定的な公開情報での各キーワードの出現数とを取得する。
出現数取得部105によるキーワードの出現数の具体的な取得方法は実施の形態1で示した通りである。
【0081】
ステップS232では、評価値算出部107が、肯定的な公開情報でのキーワードの出現数が用いられる回帰モデル及び否定的な公開情報でのキーワードの出現数が用いられる回帰モデルを用いて、評価値候補を算出する。
評価値算出部107による評価値候補の具体的な算出方法は実施の形態1で示した通りである。
【0082】
ステップS232では、評価値算出部107が、肯定的な公開情報でのキーワードの出現数が用いられる回帰モデルによる評価値候補及び否定的な公開情報でのキーワードの出現数が用いられる回帰モデルによる評価値候補との平均をとって最終的な評価値を得る。
つまり、評価値算出部107は、以下の(1)〜(3)に示す6つの評価値候補の平均値を最終的な評価値として採用する。
(1)評価機関XXXによる評価値に基づく、肯定的な公開情報でのキーワードの出現数が用いられる回帰モデルによる評価値候補と、否定的な公開情報でのキーワードの出現数が用いられる回帰モデルの評価候補値
(2)評価機関YYYによる評価値に基づく、肯定的な公開情報でのキーワードの出現数が用いられる回帰モデルによる評価値候補と、否定的な公開情報でのキーワードの出現数が用いられる回帰モデルの評価候補値
(3)評価機関ZZZによる評価値に基づく、肯定的な公開情報でのキーワードの出現数が用いられる回帰モデルによる評価値候補と、否定的な公開情報でのキーワードの出現数が用いられる回帰モデルの評価候補値
【0083】
また、評価値算出部107は、上記の(1)〜(3)に示す6つの評価値候補のうちのいずれかの評価値候補を最終的な評価値として採用してもよい。
【0084】
このように、本実施の形態に係る情報処理装置10は、肯定的な公開情報と否定的な公開情報を区別して回帰モデルを生成し、また、肯定的な公開情報と否定的な公開情報を区別して評価対象サプライヤー20の評価値を算出する。
このため、本実施の形態によれば、より高精度のセキュリティ評価を得ることができる。
【0085】
なお、上記では、否定的なキーワードが含まれない公開情報を肯定的な公開情報として取り扱い、否定的なキーワードが含まれる公開情報を否定的な公開情報として取り扱う例を説明した。これに代えて、肯定的なキーワードが含まれない公開情報を否定的な公開情報として取り扱い、否定的な公開情報以外の公開情報を肯定的な公開情報として取り扱ってもよい。
【0086】
また、機械学習により、肯定的な公開情報と否定的な公開情報とを分類する回帰式を得るようにしてもよい。
この場合は、公開情報に含まれるキーワードを説明変数とし、肯定的な公開情報と否定的な公開情報の分類結果を目的変数とする教師データを用意する。なお、肯定的な公開情報と否定的な公開情報の分類は、人手で行う。
そして、教師データを用いた機械学習により、肯定的な公開情報と否定的な公開情報とを分類する回帰式を求める。
以上の回帰式が得られた後に、
図4のステップS14において、出現数取得部105が分類対象の公開情報に含まれるキーワードを回帰式に適用し、分類対象の公開情報を肯定的な公開情報と否定的な公開情報とのいずれかに分類する。
また、
図7のステップS231において、出現数取得部105が分類対象の公開情報に含まれるキーワードを回帰式に適用し、分類対象の公開情報を肯定的な公開情報と否定的な公開情報とのいずれかに分類する。
【0087】
機械学習により得られた回帰式を用いることで、公開情報をより正確に肯定的な公開情報又は否定的な公開情報に分類することができる。
【0088】
以上、実施の形態1〜3を説明したが、これらの実施の形態のうち、2つ以上を組み合わせて実施しても構わない。
あるいは、これらの実施の形態のうち、1つを部分的に実施しても構わない。
あるいは、これらの実施の形態のうち、2つ以上を部分的に組み合わせて実施しても構わない。
また、これらの実施の形態に記載された構成及び手順を必要に応じて変更してもよい。
【0089】
***ハードウェア構成の補足説明***
最後に、情報処理装置10のハードウェア構成の補足説明を行う。
図2に示すプロセッサ901は、プロセッシングを行うIC(Integrated Circuit)である。
プロセッサ901は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)等である。
図2に示す主記憶装置902は、RAM(Random Access Memory)である。
図2に示す補助記憶装置903は、ROM(Read Only Memory)、フラッシュメモリ、HDD(Hard Disk Drive)等である。
図2に示す通信装置904は、データの通信処理を実行する電子回路である。
通信装置904は、例えば、通信チップ又はNIC(Network Interface Card)である。
【0090】
また、補助記憶装置903には、OS(Operating System)も記憶されている。
そして、OSの少なくとも一部がプロセッサ901により実行される。
プロセッサ901はOSの少なくとも一部を実行しながら、通信部101、評価値取得部102、キーワード抽出部103、キーワード選択部104、出現数取得部105、モデル生成部106及び評価値算出部107の機能を実現するプログラムを実行する。
プロセッサ901がOSを実行することで、タスク管理、メモリ管理、ファイル管理、通信制御等が行われる。
また、通信部101、評価値取得部102、キーワード抽出部103、キーワード選択部104、出現数取得部105、モデル生成部106及び評価値算出部107の処理の結果を示す情報、データ、信号値及び変数値の少なくともいずれかが、主記憶装置902、補助記憶装置903、プロセッサ901内のレジスタ及びキャッシュメモリの少なくともいずれかに記憶される。
また、通信部101、評価値取得部102、キーワード抽出部103、キーワード選択部104、出現数取得部105、モデル生成部106及び評価値算出部107の機能を実現するプログラムは、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ(登録商標)ディスク、DVD等の可搬記録媒体に格納されていてもよい。そして、通信部101、評価値取得部102、キーワード抽出部103、キーワード選択部104、出現数取得部105、モデル生成部106及び評価値算出部107の機能を実現するプログラムが格納された可搬記録媒体を流通させてもよい。
【0091】
また、通信部101、評価値取得部102、キーワード抽出部103、キーワード選択部104、出現数取得部105、モデル生成部106及び評価値算出部107の「部」を、「回路」又は「工程」又は「手順」又は「処理」に読み替えてもよい。
また、情報処理装置10は、処理回路により実現されてもよい。処理回路は、例えば、ロジックIC(Integrated Circuit)、GA(Gate Array)、ASIC(Application Specific Integrated Circuit)、FPGA(Field−Programmable Gate Array)である。
なお、本明細書では、プロセッサと処理回路との上位概念を、「プロセッシングサーキットリー」という。
つまり、プロセッサと処理回路とは、それぞれ「プロセッシングサーキットリー」の具体例である。