【文献】
櫻井 茂明,企業評判情報の分析に有効な風評テキストマイニング技術,東芝レビュー 第64巻 第2号,株式会社東芝,2009年 2月 1日,18〜21 ページ,ISSN 0372-0462
(58)【調査した分野】(Int.Cl.,DB名)
事業者の財務状況に関連する情報である第1のデータと、当該事業者に関連する情報であって、通信ネットワーク上におけるユーザ行動に基づく情報である第2のデータとを取得する取得部と、
前記取得部によって取得された前記第1のデータ及び第2のデータに基づいて、当該事業者の信用度を示す指標値を算出する算出部と、
を備え、
前記取得部は、
前記第2のデータとして、前記通信ネットワーク上の所定のドキュメントにおいて前記事業者と共起する単語に関する情報を少なくとも取得するとともに、前記事業者もしくは第三者が情報を提供することが可能な所定のプラットフォームであって、前記算出部によって算出された指標値が公開されるプラットフォームを介して、前記第1のデータを取得し、
前記算出部は、
前記プラットフォームを介して前記事業者もしくは第三者によって提供された情報に基づいて、当該事業者の信用度を示す指標値を算出する、
ことを特徴とする算出装置。
事業者の財務状況に関連する情報である第1のデータと、当該事業者に関連する情報であって、通信ネットワーク上におけるユーザ行動に基づく情報である第2のデータとを取得する取得手順と、
前記取得手順によって取得された前記第1のデータ及び第2のデータに基づいて、当該事業者の信用度を示す指標値を算出する算出手順と、
をコンピュータに実行させ、
前記取得手順は、
前記第2のデータとして、前記通信ネットワーク上の所定のドキュメントにおいて前記事業者と共起する単語に関する情報を少なくとも取得するとともに、前記事業者もしくは第三者が情報を提供することが可能な所定のプラットフォームであって、前記算出手順によって算出された指標値が公開されるプラットフォームを介して、前記第1のデータを取得し、
前記算出手順は、
前記プラットフォームを介して前記事業者もしくは第三者によって提供された情報に基づいて、当該事業者の信用度を示す指標値を算出する、
ことを特徴とする算出プログラム。
【発明を実施するための形態】
【0010】
以下に、本願に係る算出装置、算出方法及び算出プログラムを実施するための形態(以下、「実施形態」と表記する)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る算出装置、算出方法及び算出プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0011】
〔1.算出処理の一例〕
まず、
図1を用いて、実施形態に係る算出処理の一例について説明する。
図1は、実施形態に係る算出処理の一例を示す図である。
図1では、実施形態に係る算出システム1による算出処理について説明する。具体的には、
図1では、算出システム1に含まれる算出装置100によって、事業者の信用度を示す指標値(スコア)を出力する計算式(モデル)を用いた算出処理が行われる例について説明する。
【0012】
図1に示すように、算出システム1には、ユーザ端末10と、金融機関サーバ30と、ウェブサーバ40と、事業者データサーバ50と、算出装置100とが含まれる。算出装置100は、図示しない通信ネットワーク(例えば、インターネット)を介して、ユーザ端末10、金融機関サーバ30、ウェブサーバ40及び事業者データサーバ50と通信可能に接続される。なお、算出システム1に含まれるユーザ端末10や金融機関サーバ30やウェブサーバ40や事業者データサーバ50の台数は、
図1に示した例に限られない。例えば、算出システム1には、複数台の金融機関サーバ30や、複数台のウェブサーバ40や、複数台の事業者データサーバ50が含まれてもよい。
【0013】
ユーザ端末10は、一般ユーザによって利用される情報処理装置である。具体的には、ユーザ端末10は、ユーザがウェブページを閲覧するためや、ウェブサイトにおいて製品情報の評価を投稿するためなどに利用される。ユーザ端末10は、例えば、スマートフォンやタブレット端末やPDA(Personal Digital Assistant)、ウェアラブル端末等の移動端末や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。なお、一般ユーザとは、実施形態に係る算出処理に対して特定の意図を有した行動を実行しないユーザである。すなわち、実施形態では、専門的に企業情報の取得及び分析を行う者や、事業者に融資を行う者は、一般ユーザから除外される可能性がある。また、事業者自体も一般ユーザから除外されうるが、当該事業者の経営者や役員個人については、一般ユーザに含まれてもよい。
【0014】
金融機関サーバ30は、金融機関によって利用されるサーバ装置である。具体的には、金融機関サーバ30は、事業者から融資の申し入れを受け付けたり、申し入れの結果を事業者に通知したりする。また、金融機関サーバ30は、事業者への融資において、事業者の信用度を評価するために、算出装置100を利用する。
【0015】
ウェブサーバ40は、ユーザ端末10からアクセスされた場合に、各種ウェブページを提供するサーバ装置である。ウェブサーバ40は、例えば、ニュースサイト、天気予報サイト、ショッピングサイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、ウェブブログなどに関する各種ウェブページを提供する。
【0016】
また、ウェブサーバ40は、ネットワーク上におけるユーザ行動を記憶する。ユーザ行動の情報は、ユーザ行動データ42として、ウェブサーバ40内や、所定のストレージ装置内に格納される。ここで、ネットワーク上におけるユーザ行動とは、各種ウェブサイトから提供されるサービスの利用に際して、ユーザの操作に従いユーザ端末10から発信される情報を意味する。例えば、ネットワーク上におけるユーザ行動は、検索サイトにおける検索クエリの入力や、ショッピングサイトにおける購買行動や、製品評価サイトにおけるユーザからのレビューの投稿などである。また、ユーザ行動には、例えば、SNS(Social Networking Service)サイトにおけるメッセージのやりとりや、他者に対するフォロー行動なども含まれる。
【0017】
事業者データサーバ50は、事業者データ提供者によって管理されるサーバ装置である。事業者データ提供者とは、例えば、事業者の財務状況に関する情報(以下、「財務情報」と表記する)等を収集し、収集した情報に基づいて、事業者の信用度を算出することを専門とする企業である。事業者データ提供者は、算出した信用度など、事業者の信用情報を金融機関等に販売する事業を行う。事業者データサーバ50は、事業者の財務情報や、事業者に対する人為的な評価(例えば、経営者の人柄や統率力などの評価)に関する情報を、事業者データ52内に格納する。事業者データ52には、世間に対して公開された事業者の財務情報や、資本関係や、株価の動向など、事業者に関する種々の情報が記憶される。また、事業者データ52には、公開されている情報のみならず、例えば、事業者データ提供者に所属する調査員が独自に調査して取得する情報が含まれる。
【0018】
図1に示した算出装置100は、通信ネットワークを介して事業者に関する情報を取得し、取得した情報に基づいて事業者の信用度を示す指標値(以下、「スコア」と表記する場合がある)を出力するためのモデルを生成するサーバ装置である。具体的には、算出装置100は、事業者の財務情報と、事業者に関する情報のうち、インターネット上におけるユーザ行動に基づく情報(例えば、各事業者が提供する製品についてユーザが発信する製品評価や、ネット上の口コミや、検索サイトにおける検索情報など)とを取得する。そして、算出装置100は、財務情報と、インターネット上におけるユーザ行動に基づく情報とに基づいて、事業者のスコアを出力するモデルを生成する。そして、算出装置100は、生成したモデルを用いて、処理対象となる事業者のスコアを算出する。
【0019】
算出装置100は、算出システム1に含まれる各装置を介して、算出処理に用いる情報を取得する。以下、
図1を用いて、算出装置100によって行われる算出処理を流れに沿って説明する。
【0020】
まず、算出装置100は、事業者データサーバ50から、事業者データ52に含まれる事業者に関するデータを取得する(ステップS11)。例えば、算出装置100は、事業者に関するデータとして、事業者の財務情報を取得する。具体的には、算出装置100は、事業者の登記情報、資産情報、株価情報、売上、利益、社員数などの各種情報を取得する。
【0021】
続いて、算出装置100は、ウェブサーバ40から、ユーザ行動データ42に含まれるユーザに関する情報を取得する(ステップS12)。例えば、算出装置100は、ユーザに関するデータとして、事業者に関する情報のうち、インターネットにおけるユーザ行動に基づく情報であって、インターネットを介して取得可能な情報を取得する。具体的には、算出装置100は、ユーザ端末10が事業者の名称や事業者が提供する製品名などを検索クエリとして検索行動を行った回数や、事業者が提供するウェブサイトの訪問数や、事業者が提供する製品に対するレビュー投稿などに関する情報を取得する。
【0022】
そして、算出装置100は、取得した情報に基づいて、事業者の信用度を示す指標値を算出するためのモデルを生成する(ステップS13)。詳細は後述するが、算出装置100は、事業者の財務情報を用いて事業者の評価を行う既存のモデル(以下、「既存モデル」と表記する)を用いて、財務状況に基づく事業者の評価値(以下、「財務スコア」と表記する)を算定する。そして、算出装置100は、事業者データサーバ50から取得した情報及びウェブサーバ40から取得した情報と、財務スコアとの相関性を学習することにより、事業者のスコアを算出するためのモデルを生成する。生成されたモデルは、例えば、事業者データサーバ50から取得した情報及びウェブサーバ40から取得した情報を入力とし、事業者のスコア(もしくは、スコアを算出するための所定の数値)を出力とする。すなわち、算出装置100は、生成されたモデルに対して、処理対象となる事業者の情報であって、事業者データサーバ50から取得した情報及びウェブサーバ40から取得した情報を入力することにより、当該事業者のスコアを算出することができる。
【0023】
ここで、算出装置100は、金融機関サーバ30から、所定の事業者の信用情報の問い合わせを受け付ける(ステップS14)。例えば、金融機関サーバ30は、所定の事業者から融資の申し入れを受けた場合に、当該事業者の信用情報を取得するため、算出装置100に信用情報を問い合わせる。言い換えれば、金融機関サーバ30は、処理対象となる所定の事業者を特定する情報を算出装置100に送信し、当該事業者のスコアを算出するよう依頼する。この場合、算出装置100は、通信ネットワークを介して、所定の事業者の情報を事業者データサーバ50及びウェブサーバ40から取得する。そして、算出装置100は、取得した情報をモデルに入力することにより、所定の事業者のスコアを算出する(ステップS15)。
【0024】
そして、算出装置100は、算出したスコアを金融機関サーバ30に送信する(ステップS16)。上記の一連の流れにより、算出装置100は、金融機関サーバ30に事業者の信用情報を提供することができる。
【0025】
このように、実施形態に係る算出装置100は、事業者の財務状況に関連する情報と、当該事業者に関連する情報であって、通信ネットワーク上におけるユーザ行動に基づく情報とを取得する。そして、算出装置100は、取得した情報に基づいて、当該事業者の信用度を示す指標値を算出する。
【0026】
すなわち、実施形態に係る算出装置100は、一般に事業者の信用度を計るために用いられる企業の財務情報のみならず、インターネット上におけるユーザ行動に関する情報を加味して、事業者の使用度を示す指標値を算出する。また、算出装置100は、インターネット上における一般ユーザの行動に関する情報を取得することにより、膨大なサンプル数から構成される情報を用いて事業者の信用度を評価することとなる。このため、算出装置100は、公開される財務情報のみならず、多くの一般ユーザの行動情報に基づいて事業者の信用度を判定できるため、精度の高い信用度を算出することができる。
【0027】
また、一般に、事業者の財務情報は、最新のデータとして活用することが難しい。これは、事業者の財務情報は、株価などの情報を除いて、四半期や、半期に一度更新される情報が比較的多いことによる。すなわち、事業者の財務情報に基づいて信用度を算出する既存モデルでは、指標値を算出するためのデータの鮮度が劣ることから、リアルタイムで事業者の信用度を精度高く算出することが難しい。一方、算出装置100によれば、インターネット上におけるユーザ行動に関する情報をデータとして用いることから、リアルタイムに事業者の信用度を精度高く算出することが可能となる。
【0028】
また、事業者データ提供者などの専門企業であっても、上場している大企業や、一部の優良な中小企業などを除けば、事業者の財務情報を完全に取得することは難しい。このため、既存モデルを用いて企業の信用度を算出することができる対象となる事業者は、一部の有名企業に限られる。一方、算出装置100によれば、インターネット上におけるユーザ行動に関する情報をデータとして用いることにより、比較的多数のパラメータを用いてスコアを算出することができるため、一部の財務情報が欠けている事業者に対しても、スコアを精度高く算出することができる。
【0029】
なお、算出装置100によって算出されるスコアは、必ずしも金融支援や投資を目的として活用されるものではなく、例えば、事業者自身が行う種々の営業活動(広告を配信する広告主としての信用度や、ショッピングサイトの加盟店としての信用度など)に活用されてもよい。
【0030】
〔2.算出装置の構成〕
次に、
図2を用いて、実施形態に係る算出装置100の構成について説明する。
図2は、実施形態に係る算出装置100の構成例を示す図である。
図2に示すように、算出装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、算出装置100は、算出装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0031】
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。かかる通信部110は、通信ネットワークと有線又は無線で接続され、通信ネットワークを介して、ユーザ端末10等との間で情報の送受信を行う。
【0032】
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、事業者データ記憶部121と、ネットワーク情報記憶部122と、モデル記憶部129とを有する。以下、各記憶部について順に説明する。
【0033】
(事業者データ記憶部121について)
事業者データ記憶部121は、事業者に関する情報を記憶する。例えば、事業者データ記憶部121に記憶される情報は、事業者データサーバ50から提供される。ここで、
図3に、実施形態に係る事業者データ記憶部121の一例を示す。
図3に示すように、事業者データ記憶部121は、「事業者ID」、「情報更新日」、「業界」、「財務情報」、「財務スコア」といった項目を有する。また、「財務情報」の項目は、「総資産」、「総負債」、「売上高」、「営業利益」、「時価総額」といった小項目を含む。
【0034】
「事業者ID」は、事業者を識別するための識別情報を示す。「情報更新日」は、事業者に関する情報が更新された日付を示す。例えば、情報更新日は、事業者データサーバ50が事業者に関する財務情報を更新した日を示す。「業界」は、事業者が所属する業界、あるいは業種を示す。
【0035】
「財務情報」は、事業者の財務状況に関する情報を示す。例えば、財務情報は、四半期ごとに事業者から公表されるデータ等に基づいて更新される。また、
図3の例では、財務情報の小項目として、「総資産」、「総負債」、「売上高」、「営業利益」、「時価総額」を例示しているが、事業者データ記憶部121に記憶される財務情報は、
図3に示した例に限られない。例えば、財務情報には、「株価」など、一日ごとに更新される情報が含まれてもよい。また、財務情報には、事業者データ提供者から提供される各種情報が含まれてもよい。例えば、財務情報には、事業者の取引関係や、自己資本比率や、担保余力や、決済状況などの各種情報が含まれてもよい。
【0036】
なお、
図3に示す例では、「総資産」などの項目を「aaa」といった概念で表記しているが、実際には、各項目には、総資産に対応する金額などの具体的な情報が記憶される。
【0037】
「財務スコア」は、財務情報に基づいて算定された財務スコアを示す。財務スコアは、例えば、所定の既存モデルを利用して算定される。
図3の例では、財務スコアは、0から100までの数値により表され、例えば、財務スコアが100に近いほど倒産確率が低い、といった情報を示すものとする。なお、財務スコアは、後述するモデル生成の過程において、生成部132によって算定されてもよいし、事業者データ提供者によって予め算定されてもよい。
【0038】
すなわち、
図3では、記憶される情報の一例として、事業者ID「A01」で識別される事業者には、「2015年7月1日」に更新された情報として、業界が「製造(電機)」であり、財務情報として、例えば「総資産」が「aaa」であり、「総負債」が「bbb」であり、「売上高」が「ccc」であり、「営業利益」が「ddd」であり、「時価総額」が「eee」であり、それらの財務情報に基づいて算出される財務スコアが「80」であることを示している。
【0039】
なお、以下では、
図3に示した「事業者ID」に記憶されている識別情報を参照符号として用いる場合がある。例えば、以下では、事業者ID「A01」によって識別される事業者を「事業者A01」と表記する場合がある。
【0040】
(ネットワーク情報記憶部122について)
ネットワーク情報記憶部122は、通信ネットワークを介して取得されるユーザ情報を記憶する。具体的には、ネットワーク情報記憶部122は、事業者に関連する情報であって、通信ネットワーク上におけるユーザ行動に基づく情報を記憶する。
図2に示すように、ネットワーク情報記憶部122は、検索情報テーブル123と、サイト情報テーブル124と、単語情報テーブル125と、製品情報テーブル126と、ソーシャル情報テーブル127と、顧客情報テーブル128とを有する。なお、以下では、各データテーブルに記憶された、事業者に関連する情報であって、通信ネットワーク上におけるユーザ行動に基づく情報のことを「ネットワーク情報」と総称する場合がある。以下、各データテーブルについて順に説明する。
【0041】
(検索情報テーブル123について)
検索情報テーブル123は、インターネット上におけるユーザの検索行動に関する情報を記憶する。ここで、
図4に、実施形態に係る検索情報テーブル123の一例を示す。
図4に示すように、検索情報テーブル123は、「事業者ID」、「集計期間」、「検索数」、「上昇度」、「検索ランキング」、「対象ワード」といった項目を有する。
【0042】
「事業者ID」は、事業者を識別するための識別情報を示す。「集計期間」は、ユーザ端末10が行った行動を集計した期間を示す。
図4の例では、集計期間は一週間単位としているが、集計期間は異なる期間であってもよい。例えば、集計期間を一か月間とすることにより、算出装置100は、より長期にわたる検索の傾向を把握しやすくなる。
【0043】
「検索数」は、例えば、所定の検索サイトにおいて、検索エンジンによって事業者が検索された回数を示す。なお、検索数として計数される検索クエリには、事業者の名称そのものに限られず、事業者が提供する製品名や、事業者の経営者の氏名などが含まれてもよい。
【0044】
「上昇度」は、直前の集計期間における検索数に対する検索数の増減値を示す。「検索ランキング」は、所定の検索サイトにおける検索数のランキングを示す。なお、図示は省略しているが、検索ランキングの項目は、検索数によるランキングのみならず、上昇度によるランキングが記憶されてもよい。
【0045】
「対象ワード」は、記載されたワードが検索クエリとして送信された場合に、事業者に関する検索数として計数されるワードを示す。例えば、事業者の名称そのものよりも、事業者が提供する製品名の知名度が高い場合、ユーザは、かかる製品名で検索行動をすることが考えられる。この場合、製品名を検索クエリとして検索が行われた場合であっても、当該製品名が対象ワードに設定されていれば、当該製品を提供する事業者に対する検索数が計数される。対象ワードは、算出装置100の管理者や、事業者の申請によって人為的に設定されてもよいし、例えば、検索結果に基づくウェブサイトのリンクを分析すること等により、自動で設定されてもよい。具体的には、「製品B01」を検索した場合に、検索結果として「事業者名A01」に関連するウェブサイトが多数表示されるような場合には、事業者名A01とともに、「製品B01」が対象ワードに自動で設定される。
【0046】
すなわち、
図4では、データの一例として、事業者ID「A01」で識別される事業者が、集計期間「2015年6月15日〜2015年6月21日」の間に、「30000回」検索され、直前の検索数からの上昇度は「1000回」であり、検索ランキングは「12000位」であることを示している。また、事業者A01には、検索における対象ワードとして、「事業者名A01」、「製品B01」、「経営者C01」等が設定されていることを示している。
【0047】
また、他の例として、事業者A11は、集計期間「2015年6月30日〜2015年7月6日」の間には、「200000回」検索されており、「195500回」検索数が上昇していることを示している。これは、事業者A11にとって急速に知名度が上昇する出来事が起こったことが推測される。このような場合、検索情報テーブル123は、急速な上昇度に応じて、例えば、事業者A11を注目企業として認識するような印を記憶してもよい。かかる印は、例えば、後述するモデルの生成等に用いられる場合がある。
【0048】
(サイト情報テーブル124について)
サイト情報テーブル124は、事業者が運営または管理するウェブサイトに関する情報を記憶する。ここで、
図5に、実施形態に係るサイト情報テーブル124の一例を示す。
図5に示すように、サイト情報テーブル124は、「事業者ID」、「集計期間」、「PV」、「UU」、「CVR」といった項目を有する。
【0049】
「事業者ID」および「集計期間」は、検索情報テーブル123に記憶されている同一の項目に対応する。「PV」は、ウェブサイトにおけるページビュー(Page View)、すなわち閲覧数を示す。
【0050】
「UU」は、ユニークユーザ(unique user)の数を示す。ユニークユーザとは、ウェブサイトを訪問した人数を示す。同じユーザが何度も同じウェブサイトを訪問した場合であっても、UU数は「1」として計数される。
【0051】
「CVR」は、コンバージョンレート(Conversion Rate)を示す。CVRは、ウェブサイトの閲覧数に対して、何割がコンバージョンに至ったかの割合を示す。コンバージョンとは、ウェブサイト上で獲得できる最終的な成果を意味する。例えば、コンバージョンは、オンラインショッピングサイトにおける商品の購入や、情報提供サイトやコミュニティサイトにおける会員登録や、資料請求などである。なお、CVRは、閲覧数に対するコンバージョン率であってもよいし、ユニークユーザに対するコンバージョン率が採用されてもよい。
【0052】
すなわち、
図5では、データの一例として、事業者A01の提供するウェブサイトが、集計期間「2015年6月15日〜2015年6月21日」の間に、「11000回」閲覧され、また、閲覧したUU数は「3000人」であり、閲覧数のうち「1パーセント」の数だけコンバージョンに至ったことを示している。
【0053】
なお、
図5における集計期間は一例であり、PV等は一週間単位ではなく、一日単位や、一か月単位などで集計されてもよい。また、PV等の各項目は、絶対数としての数値のみならず、直前の集計期間からの変動数が集計されてもよい。
【0054】
(単語情報テーブル125について)
単語情報テーブル125は、インターネット上においてユーザから送信された単語に関する情報を記憶する。ここで、
図6に、実施形態に係る単語情報テーブル125の一例を示す。
図6に示すように、単語情報テーブル125は、「事業者ID」、「集計期間」、「キーワード出現数」、「共起ワード」、「共起ワード出現数」といった項目を有する。
【0055】
「事業者ID」および「集計期間」は、検索情報テーブル123に記憶されている同一の項目に対応する。
【0056】
「キーワード出現数」は、事業者に関する単語(キーワード)がインターネット上に出現した数を示す。事業者に関する単語は、例えば、検索情報テーブル123に記憶されている「対象ワード」に対応する。また、インターネット上に出現した数とは、例えば、ユーザ端末10からウェブサーバ40にキーワードが投稿された回数を示す。この場合、ウェブサーバ40が提供するウェブサイトは、検索サイトのみならず、短文投稿サイトや、ブログ提供サイトなど、各種ウェブサイトを含む。
【0057】
「共起ワード」は、キーワードが出現した際に、キーワードとともに用いられた単語を示す。例えば、共起ワードは、検索サイトにおいて、キーワードとともに検索クエリとして投稿された単語が該当する。また、共起ワードは、短文投稿サイトにおいて、1つの短文の中で、キーワードとともに出現する単語等も該当する。「共起ワード出現数」は、キーワードとともに所定の単語がインターネット上に出現した回数を示す。
【0058】
すなわち、
図6では、データの一例として、事業者ID「A01」で識別される事業者に関するキーワードが、集計期間「2015年6月15日〜2015年6月21日」の間に、「55000」回出現し、かかるキーワードに共起するワードは、「好調」、「決算」、「製品B01」等であることを示している。また、例えば、キーワードと共起する「好調」の出現数は「3000」回であったことを示している。
【0059】
なお、
図6での図示は省略したが、単語情報テーブル125には、検索情報テーブル123と同じく、キーワード出現数の推移を示す「上昇度」等の項目が設けられてもよい。すなわち、単語情報テーブル125には、キーワードがインターネット上に出現する数の変動に係る情報が記憶されてもよい。
【0060】
また、単語情報テーブル125は、単語の出現を所定の文書(ドキュメント)ごとに計数し、かかる文書に含まれる特徴情報を記憶してもよい。例えば、単語情報テーブル125は、短文投稿サイトに投稿される短文ごとに、短文を特徴付ける語として抽出された単語をキーワードとし、その出現数を記憶する。例えば、短文を特徴付けるキーワードは、tf−idf(Term Frequency−Inverse Document Frequency)など、短文中に出現する各単語をスコアリングするアルゴリズムを利用することにより求められる。この場合、無作為にインターネット上の単語の出現数が計数されるのではなく、ある短文において事業者に関する事項が述べられている場合に、かかる事業者に関するキーワードが計数されることが想定される。かかる手法によれば、ユーザによる一定の意図のもとで事業者に関する事項がインターネット上に投稿された場合に限り、当該事業者に関するキーワードの出現数が計数されるため、よりユーザの意図を反映したデータとして捉えることができる。なお、単語情報テーブル125には、所定のドキュメントにおける、キーワードに共起する共起ワードの重み等が記憶されてもよい。共起ワードの重みは、例えば、tf−idf等によりスコアリングされた数値や、共起ワードの出現率に基づく所定の指標値等が対応する。
【0061】
また、単語情報テーブル125は、共起する単語の特性を記憶してもよい。共起する単語の特性とは、例えば、「好調」や「黒字」など、事業者と共起することによりポジティブな印象を与える性質や、「不調」や「赤字」など、ネガティブな印象を与える性質など、共起する単語が持つ性質をいう。例えば、後述するスコアの算出処理において、特性がポジティブな単語と共起する割合が高い事業者は、信用度を示すスコアが高く算出される傾向となる。
【0062】
(製品情報テーブル126について)
製品情報テーブル126は、事業者が提供する製品に関する情報を記憶する。ここで、
図7に、実施形態に係る製品情報テーブル126の一例を示す。
図7に示すように、製品情報テーブル126は、「事業者ID」、「製品」、「利用者評価」、「レビュー数」、「ストアランキング」といった項目を有する。
【0063】
「事業者ID」は、検索情報テーブル123に記憶されている同様の項目に対応する。「製品」は、事業者が提供する製品の名称を示す。
【0064】
「利用者評価」は、インターネット上の製品評価サイトにおいて、一般ユーザから示された評価の値を示す。製品評価サイトとは、例えば、一般ユーザから製品のレビューや評価等の口コミ情報を受け付けるコミュニティサイトである。また、事業者が提供する製品が端末用のアプリである場合には、アプリのダウンロードサービスを提供するサイト(アプリストア等と呼ばれる)が製品評価サイトを兼ねることがある。ここでは、利用者評価は、ユーザから送信される「0」から「5」までの数値の平均値により示されるものとする。
【0065】
「レビュー数」は、インターネット上の製品評価サイトにおいて、ユーザから投稿されたレビューの数を示す。「ストアランキング」は、製品評価サイトにおいて扱う同類の製品中のランキングを示す。なお、ストアランキングは、利用者評価の数値の高低によってランク付けされてもよいし、製品の販売数の大小によってランク付けされてもよい。また、上記のように、製品評価サイトがアプリストアである場合には、ストアランキングは、当該アプリのダウンロード数であってもよい。
【0066】
すなわち、
図7では、データの一例として、事業者A01の提供する製品「B01」は、利用者評価が「4点」であり、投稿されたレビュー数は「4500」であり、ストアランキングが「10位」であることを示している。
【0067】
(ソーシャル情報テーブル127について)
ソーシャル情報テーブル127は、事業者の社会的評判や人脈度を評価しうる指標値を記憶する。具体的には、ソーシャル情報テーブル127は、事業者の経営者や役員が利用するSNSサイトから取得される情報を記憶する。ここで、
図8に、実施形態に係るソーシャル情報テーブル127の一例を示す。
図8に示すように、ソーシャル情報テーブル127は、「事業者ID」、「調査対象者」、「SNS連結数」といった項目を有する。
【0068】
「事業者ID」は、検索情報テーブル123に記憶されている同様の項目に対応する。「調査対象者」は、ソーシャル分析の対象となる個人名を示す。例えば、調査対象者は、当該事業者の経営者や、社長や、取締役などの役員が該当する。
【0069】
「SNS連結数」は、調査対象者がSNSを利用している場合に、SNS上において他者と連結している数値を示す。例えば、SNS上における互いのフォロー数などが該当する。なお、SNS連結数には、一般ユーザ数を含めず、互いに異なる事業者の経営者や役員同士の連結数のみを計数するようにしてもよい。これにより、SNS連結数は、調査対象者における人脈力を示す指標値として、より信頼性の高い数値となりうる。
【0070】
すなわち、
図8では、データの一例として、事業者A01における調査対象者は「C01」や、「C02」であり、「C01」が利用するSNSにおける連結数は「120」であり、「C02」が利用するSNSにおける連結数は「50」であることを示している。
【0071】
(顧客情報テーブル128について)
顧客情報テーブル128は、事業者の顧客に関する情報を記憶する。ここで、
図9に、実施形態に係る顧客情報テーブル128の一例を示す。
図9に示すように、顧客情報テーブル128は、「事業者ID」、「製品利用者数」、「継続利用率」、「顧客単価」といった項目を有する。
【0072】
「事業者ID」は、検索情報テーブル123に記憶されている同様の項目に対応する。「製品利用者数」は、事業者が提供する製品を利用している顧客の人数を示す。例えば、事業者が提供する製品がアプリである場合、事業者が提供するアプリの総ダウンロード数が該当する。
【0073】
「継続利用率」は、事業者に対する顧客の継続利用率を示す。例えば、事業者がインターネット上のショッピングサイトを運営している場合、サイトを閲覧する全ユーザ数に対して、定期的にかかるサイトを利用しているユーザ数の割合が該当する。また、継続利用率は、事業者がアプリを提供している場合、総ダウンロード数に対して、継続的に利用が確認されるユーザ端末10の台数などであってもよい。この場合、継続利用率は、アプリの稼働率(例えば、所定期間あたりの利用ユーザ数をダウンロードユーザ数で除算した値)として記憶される。
【0074】
「顧客単価」は、顧客一人当たりの単価を示す。例えば、事業者がショッピングサイトを提供している場合、顧客単価は、所定期間における1ユーザあたりの購買額が該当する。また、顧客単価は、事業者がアプリを提供している場合、アプリのダウンロード販売額や、継続利用にかかる費用などによっても算出されうる。
【0075】
すなわち、
図9では、データの一例として、事業者A01が提供する製品利用者は「300000人」であり、継続利用率は「0.25」であり、顧客単価は「8000円」であることを示している。
【0076】
(モデル記憶部129について)
モデル記憶部129は、算出装置100によって生成されたモデルに関する情報を記憶する。ここで、
図10に、実施形態に係るモデル記憶部129の一例を示す。
図10に示すように、モデル記憶部129は、「モデルID」、「情報更新日」、「業界」といった項目を有する。
【0077】
「モデルID」は、モデルを識別するための識別情報を示す。「情報更新日」は、モデルが更新された日付を示す。「業界」は、スコアが算出される事業者が所属する業界を示す。これは、モデルが、事業者の業界別に生成されていることを意味する。すなわち、モデルは、共通する所定の業界の事業者データを利用して生成される。これは、モデルの生成にあたり、同業の事業者データを用いた方が、比較対象とする項目における数値の共通性や、類似性を見出しやすいことによる。
【0078】
すなわち、
図10では、データの一例として、モデルM001は、「2015年7月13日」に情報が更新されており、モデルM001が適用される業界は「製造(電機)」であることを示している。
【0079】
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、算出装置100内部の記憶装置に記憶されている各種プログラム(検索プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0080】
実施形態に係る制御部130は、
図2に示すように、取得部131と、生成部132と、受付部133と、算出部134と、通知部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、
図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、
図2に示した接続関係に限られず、他の接続関係であってもよい。
【0081】
(取得部131について)
取得部131は、通信ネットワーク上の情報のうち、事業者に関連する情報を取得する。例えば、取得部131は、事業者データサーバ50を介して、事業者の財務状況に関連する情報を取得する。また、取得部131は、例えば既存モデルを利用することにより、事業者の財務情報に基づいて算定される評価値である財務スコアを取得する。また、取得部131は、事業者に関連する情報であって、通信ネットワーク上におけるユーザ行動に基づく情報を取得する。
【0082】
具体的には、実施形態に係る取得部131は、モデル生成のサンプルとなる事業者を特定し、特定された事業者に関する情報をインターネット上から探索する。そして、取得部131は、インターネット上におけるユーザ行動に基づく情報として、各種ウェブサイトから提供されるサービスのうち、事業者が関連するサービスの利用に際してユーザから発信された情報をウェブサーバ40から取得する。なお、インターネット上におけるユーザ行動に基づく情報とは、例えば、ユーザが検索サイトにおいて行う検索クエリの送信や、ユーザが製品評価サイトにおいて行う製品のレビュー投稿や、ユーザがSNSにおいて情報を公開することなど、各種ウェブサイトにおいてユーザがサービスを利用することに伴い発生する情報や、ユーザ端末10から送信される情報を意味する。また、事業者が関連するサービスとは、事業者が直接提供するショッピングサイト等のサービスに限られず、例えば、事業者を検索することのできる検索サイトによるサービスや、事業者の製品を評価することのできる評価サイトによるサービス等も含まれる。
【0083】
例えば、取得部131は、所定の検索サイトにおける事業者に関する検索情報を取得する。具体的には、取得部131は、事業者に関連する検索クエリを検索対象ワードとして、事業者がユーザから何回検索されたか等の検索情報を取得する。そして、取得部131は、取得した情報を検索情報テーブル123に格納する。
【0084】
また、取得部131は、情報の取得対象となる事業者が提供するウェブサイトにおけるサイト情報を取得する。具体的には、取得部131は、事業者が提供するウェブサイトのPV数や、UU数や、CVR等の情報を取得する。そして、取得部131は、取得した情報をサイト情報テーブル124に格納する。
【0085】
また、取得部131は、情報の取得対象となる事業者が提供するウェブサイトにおける単語の出現数を取得する。具体的には、取得部131は、事業者に関連するキーワードを特定し、特定されたキーワードの出現数や、キーワードと共起するワードの種類や、キーワードと共起するワードの出現数を取得する。そして、取得部131は、取得した情報を単語情報テーブル125に格納する。
【0086】
また、取得部131は、情報の取得対象となる事業者が提供する製品に関する情報を取得する。具体的には、取得部131は、事業者が提供する製品のインターネット上における利用者評価や、レビュー数や、ストアランキング等の情報を取得する。なお、取得部131は、利用者評価の変動や、ストアランキングの変動など、各情報の動向に関する情報(すなわち、変動率)を取得してもよい。また、事業者が提供する製品がアプリなどのプログラム製品である場合には、取得部131は、アプリのダウンロード数や、利用者数や、利用者一人あたりの平均利用時間や、所定期間におけるアプリの稼働率等の指標値を取得する。そして、取得部131は、取得した情報を製品情報テーブル126に格納する。
【0087】
また、取得部131は、情報の取得対象となる事業者の社会的評判や魅力度を評価しうる情報を取得する。具体的には、取得部131は、事業者の経営者や役員のSNSの連結数等の情報を取得する。なお、取得部131は、インターネット上における経営者個人の動向などを事業者の社会的評判や魅力度を評価しうる指標値として取得してもよい。例えば、取得部131は、SNS上において経営者と個人的につながりのある人物の情報(例えば、知名度、経営する会社の規模など)を取得する。すなわち、取得部131は、経営者の人脈力などを示すと想定される情報等について取得する。なお、取得部131は、上述したSNSの連結数とは別に、事業者の経営者や役員個人のSNSにおける一般ユーザからのアクセス数や、フォロワー数などを、事業者の経営者や役員個人の知名度や評判に関する情報として取得してもよい。そして、取得部131は、取得した情報をソーシャル情報テーブル127に格納する。
【0088】
また、取得部131は、情報の取得対象となる事業者の顧客に関する情報を取得する。具体的には、取得部131は、事業者が提供する製品の利用者数や、利用者の継続利用率や、顧客単価等の情報を取得する。例えば、アプリを提供する事業者に対しては、取得部131は、アプリストアからアプリのダウンロード数などを取得することにより、製品利用者数を取得することができる。また、ショッピングサイトを運営する事業者に対しては、取得部131は、ユーザのサイトへの訪問間隔や、購買額等の情報に基づいて、継続利用率や、顧客単価に関する情報を取得することができる。そして、取得部131は、取得した情報を顧客情報テーブル128に格納する。
【0089】
なお、取得部131は、情報を取得する事業者を特定せずに、種々の事業者の情報を無作為に取得してもよい。例えば、取得部131は、検索エンジン等に用いられる探索ロボットなどのプログラムを利用して、インターネット上をクロールさせることにより、事業者に関する情報を随時取得したり、取得した情報を更新したりすることができる。
【0090】
(生成部132について)
生成部132は、各種情報に基づいて、事業者の信用度を算出するためのモデルを生成する。具体的には、実施形態に係る生成部132は、取得部131によって取得された、事業者の財務状況に関連する情報(以下、「第1のデータ」と表記する場合がある)及び当該事業者に関連する情報であって、通信ネットワーク上におけるユーザ行動に基づく情報(以下、「第2のデータ」と表記する場合がある)に基づいて、事業者の信用度を示す指標値を予測するためのモデルを生成する。
【0091】
生成部132は、モデルの生成にあたり、既存モデルに基づいて予め算定された事業者の財務スコアを利用する。生成部132は、取得部131によって取得された、事業者データ提供者から提供される財務スコアを利用してもよいし、以下に説明するように、既存モデルを用いて財務スコアを算定し、処理に利用してもよい。生成部132は、事業者の財務スコアと、第1のデータ及び第2のデータとの相関性に基づいて、モデルを生成する。以下、モデルの生成処理について説明する。
【0092】
なお、生成部132は、既存モデルとして、既知の任意の企業評価モデルを用いることができる。例えば、財務情報に基づいて事業者の倒産確率を示すスコアを求める企業評価モデルとして、アルトマン(Edward Altman)のZ値等が広く知られている。生成部132は、このような既存モデルを用いて、取得部131によって取得された第1のデータから、事業者の財務スコアを算定する。この場合、事業者の財務スコアは、倒産確率を示すスコアや、事業者の財務上の信用度を示す所定のスコアなど、用いられる既存モデルによって任意に変更可能である。かかる算定を簡略化した式は、例えば、下記式(1)で示される。
【0093】
y
1 = α・(事業者の財務情報)・・・ (1)
【0094】
上記式(1)において、「y
1」は出力される事業者の財務スコア、「事業者の財務情報」は入力されるデータ、「α」は所定の重み値を示す。すなわち、生成部132は、事業者の財務情報を入力することにより、事業者の財務スコアである「y
1」を出力し、算定することができる。「事業者の財務情報」は、総資産や、総負債や、売上高や、留保利益等の数値を種々に組み合わせた項目に分けられるため、上記式(1)は、例えば、下記式(2)のように表記することができる。
【0095】
y
1 = α
1・x
1 + α
2・x
2 + α
3・x
3 + ・・・ + α
n・x
n (nは任意の数)・・・ (2)
【0096】
上記式(2)において、「x
n」は事業者の財務情報を示す各項目、「α
n」は各項目の重み値を示す。一例として、上述したアルトマンのZ値を求めるモデルでは、「x
1」は、(運転資本/総資産)であり、「α
1」は、「0.012」であることが知られている。続いて、生成部132は、生成するモデルとして、下記式(3)のような式を立てる。
【0097】
Y
1 = β・(事業者の財務情報)+γ・(事業者のネットワーク情報)・・・ (3)
【0098】
上記式(3)において、「Y
1」は本願における事業者の信用度を示す指標値(スコア)、「事業者のネットワーク情報」はネットワーク情報記憶部122に記憶されている事業者に関連する情報、「β」及び「γ」は所定の重み値を示す。すなわち、生成部132は、既存モデルにおける「事業者の財務情報」に加えて、通信ネットワーク上におけるユーザ行動に基づく情報である「事業者のネットワーク情報」を加えたモデルを生成する。
【0099】
例えば、生成部132は、回帰分析によってモデルを生成する場合、事業者の財務情報に基づいて算定された財務スコア(「y
n」)を正解データとして学習を行うことにより、モデルを生成する。一例として、生成部132は、下記式(4)〜(6)を用いた学習を行う。
【0100】
y
2 = α・(事業者の所定期間の財務情報)・・・ (4)
【0101】
Y
2 = β・(事業者の所定期間の財務情報)+γ・(財務情報に対応する所定期間から次期決算時までの事業者のネットワーク情報)・・・ (5)
【0102】
y
3 = α・(事業者の次期決算時の財務情報)・・・ (6)
【0103】
この場合、生成部132は、上記式(4)及び(6)の「y
2」及び「y
3」を正解データとして、上記式(5)の「Y
2」を当てるための学習を行う。このように、生成部132は、事業者の財務情報によって求められる財務スコアと、第1のデータ及び第2のデータとの相関性に基づく学習を行う。例えば、学習の結果、生成部132は、式(5)における「事業者の所定期間の財務情報」と「財務情報に対応する所定期間から次期決算時までの事業者のネットワーク情報」とに基づいて、次期決算時における事業者の財務スコアである「Y
2」を出力することのできるモデルを生成する。
【0104】
この場合、学習が進むにつれ、式(5)において、第1のデータ及び第2のデータが入力された場合に、将来の事業者の信用度を示す値を出力することができるようになると想定される。具体的には、式(5)における「事業者の所定期間の財務情報」に、「財務情報に対応する所定期間から次期決算時までの事業者のネットワーク情報」という入力が加わることにより、式(6)で出力される値である「y
3」に対応する(近似する)値が出力されることが想定される。これは、事業者の将来に渡る信用度を、モデルに入力するネットワーク情報が取得された時点において出力することができることを意味する。言い換えれば、生成部132は、リアルタイムで事業者のスコアを精度よく出力するモデルを生成することができる。
【0105】
なお、事業者のネットワーク情報については、ネットワーク情報記憶部122に記憶されているあらゆる情報が用いられてよい。すなわち、上記式(3)は、例えば、下記式(7)のように表記されてもよい。
【0106】
Y = β
1・x
1 + β
2・x
2 + β
3・x
3 + ・・・ + β
n・x
n ・・・ (7)
【0107】
上記式(7)において、例えば、「x
1〜x
5」においては「事業者の財務情報」に基づく項目が対応する。また、例えば、「x
6〜x
n」においては「事業者のネットワーク情報」が対応する。実際には、「事業者のネットワーク情報」には、取得部131が取得した情報を所定の基準で数値化した変数(例えば、検索数や、製品評価のランキングや、製品の利用者数などを、相互に比較できるように数値化した情報)により示される項目が対応する。例えば、「x
6」は、「検索数」に対応する項目であったり、「x
7」は、「製品評価」に対応する項目であったり、「x
8」は、「製品の利用者数」に対応する項目であったりしてよい。そして、学習が進むにつれ、生成部132は、各項目に対応する「α
n」の値を最適化する。すなわち、生成部132は、例えば、事業者の信用度を示すスコアを算出するにあたり「検索数」の高低がスコアに対してどのくらいの影響を与えるか、といった重み値「α
n」の値を求め、モデルに設定する。
【0108】
なお、上記で説明したモデルは一例であり、生成部132が生成するモデルは上記の例に限られない。すなわち、生成部132は、第1のデータ及び第2のデータを入力とし、事業者の信用度を示すスコアを出力するモデルであれば、既知の手法を組み合わせることによって、上記例とは異なるモデルを適宜生成してもよい。例えば、上記の例では、回帰分析によってモデルを生成する例を示したが、生成部132は、他の統計的処理によりモデルを生成してもよいし、また、ニューラルネットワークを利用したモデル等を生成してもよい。
【0109】
また、生成部132は、モデルにおいて用いるネットワーク情報について、算出装置100の管理者などの人為的入力を受けてもよい。例えば、算出装置100の管理者は、事業者のスコアを計るために用いる項目として、事業者が一般ユーザから検索されている数を示す「検索数」を用いることが適すると判定した場合には、かかる情報を算出装置100に入力する。そして、生成部132は、モデルの生成過程において、スコアを計るために用いる項目として有用でないと判定される項目(例えば、重み値が所定の閾値よりも低く算定される項目)については、自動的に除外していくよう学習を行う。これにより、生成部132は、生成されるモデルを最適化していくことができる。
【0110】
また、生成部132は、モデルの生成に用いるネットワーク情報の選択について、情報が取得された期間を適宜調整するようにしてもよい。例えば、検索数や、ウェブサイトのPV数などは、ポジティブ材料(注目製品の開発等でニュース報道された場合など)や、ネガティブ材料(不正発覚のニュース報道など)の影響により、急速に変動することがありうる。この場合、生成部132は、通常よりも長い期間にわたり取得された検索数等を用いることにより、かかる影響を抑制することができる。このような期間の判定については、算出装置100の管理者により手動で判定されてもよいし、ニュース記事の単語を分析することなどにより、自動で判定されてもよい。
【0111】
また、生成部132は、上記で説明した検索数などの他に、ネットワーク情報記憶部122に記憶されている情報を、適宜モデルの生成に用いることができる。例えば、生成部132は、製品情報の分析や、事業者のソーシャル関係による分析や、顧客分析などを用いることができる。具体的には、生成部132は、製品情報テーブル126における利用者評価や、レビュー数や、ストアランキングの項目に格納された値の大小や、事業者の経営者や役員の知名度や人脈等に関する情報について、適宜数値化し、変数として用いる。その他、生成部132は、アプリのダウンロード数、利用者数、利用者一人あたりの平均利用時間、もしくは所定期間における稼働率、または、これらの数値の所定期間における変動率などを用いて、適宜入力として用いることのできるモデルを生成してもよい。また、生成部132は、これらモデル生成に利用する素性に応じて、正規化処理を行ってもよい。生成部132は、例えば、検索数、PVやUU数、キーワード出現数、共起キーワード出現数、製品やアプリのレビューの数、SNS連結数、製品やアプリの利用者数、顧客単価等については、取得された数値自体を用いるのではなく、総資産などの会社の規模を示す値によって正規化された数値を用いることができる。なお、生成部132は、検索に係るランキングや、CVRや、利用者評価や、継続利用率など、数値自体が相対値や割合を含む素性に関しては、必ずしも正規化を行うことを要しない。また、生成部132は、事業者に関連する単語の重要度に基づき、モデルの生成を行ってもよい。例えば、生成部132は、事業者に関連する単語(例えば、
図4に示される対象ワード)の重要度を数値化することにより、ネットワークを介して取得された単語が事業者のスコアに与える影響を加味したモデルを生成することができる。生成部132は、例えば、事業者に関連する単語の出現数、事業者に共起する単語の出現数、事業者に共起する単語の特性、所定のドキュメントにおける事業者に共起する単語の重みなどの単語に関する各種情報、又はこれらの組合せから、事業者に関連する単語の重要度を判定する。具体的には、生成部132は、ネットワーク上において、事業者を示す単語や、事業者が提供する製品名などが多く出現する場合には、かかる単語の重要度(言い換えれば、事業者に関連する単語が示す所定の指標値)を高く判定し、判定された重要度に基づいて事業者のスコアが算出されるモデルを生成することができる。また、生成部132は、所定のドキュメント(ユーザから投稿された所定の短文や、所定のウェブページなど)における共起ワードのtf−idfや、共起ワードの出現率に基づく所定の指標値などに基づいて、事業者に関連する単語の重要度を判定してもよい。
【0112】
また、生成部132は、共通する業界に属する事業者に関する情報を用いてモデルを生成してもよい。例えば、製品レビューなどの情報は、異業種同士の製品を比較するよりも、同業者同士を比較する方が適切な情報が得られることが想定される。そのため、生成部132は、事業者を業界ごとに分類し、業界ごとにモデルを生成する。この場合、後述する算出部134は、処理対象となる事業者に対応する業界のモデルを用いて、スコアを算出する。なお、
図10は、生成部132がモデルを業界ごとに生成し、モデル記憶部129に格納した例を示している。
【0113】
(受付部133について)
受付部133は、事業者の信用度に関する要求を受け付ける。具体的には、実施形態に係る受付部133は、金融機関サーバ30から、融資条件の設定などに用いるための事業者の信用情報に関する問い合わせを受け付ける。この場合、受付部133は、申し入れとともに、事業者に関する情報を受け付けてもよい。例えば、受付部133は、事業者の名称や、事業者が提供する製品情報や、事業者の業種、経営者や役員に関する情報などを受け付ける。そして、受付部133は、受け付けた情報を後述する算出部134に送ることにより、事業者のスコアを算出させる。なお、受付部133は、事業者が提供する製品情報や、経営者や役員に関する情報を金融機関サーバ30が取得しておらず、金融機関サーバ30からこれらの情報を受け付けない場合や、ネットワーク情報記憶部122にこれらの情報が記憶されていない場合には、外部の情報処理装置(例えば、ウェブサーバ40)から新たに情報を取得してもよい。そして、受付部133は、受け付けた情報を算出部134に送る。
【0114】
(算出部134について)
算出部134は、取得部131によって取得された第1のデータ及び第2のデータに基づいて、当該事業者の信用度を示す指標値を算出する。具体的には、実施形態に係る算出部134は、受付部133が受け付けた事業者に関する第1のデータ及び第2のデータを、生成部132が生成したモデルに入力することにより、処理対象である事業者のスコアを出力させる。そして、算出部134は、出力されたスコアに基づいて、事業者の信用度を算出する。なお、算出部134は、出力されたスコアそのものを事業者の信用度としてもよい。
【0115】
例えば、算出部134は、受付部133が事業者A11の信用度に関する要求を受け付けた場合には、事業者A11の財務情報及びネットワーク情報を取得する。そして、算出部134は、事業者A11の財務情報及びネットワーク情報を生成部132が生成したモデルに入力する。そして、算出部134は、出力として、事業者A11のスコアを取得する。なお、算出部134は、事業者A11が所属する業界に対応したモデルがモデル記憶部129に存在する場合には、業界に対応するモデルを優先的に用いてスコアを算出するようにしてもよい。
【0116】
(通知部135について)
通知部135は、受け付けた要求に対する回答を通知する。具体的には、実施形態に係る通知部135は、受付部133が受け付けた金融機関サーバ30の要求に対して、評価対象となった事業者のスコアなどの信用度(信用情報)を通知する。
【0117】
〔3.処理手順〕
次に、
図11を用いて、実施形態に係る算出装置100による生成処理の手順について説明する。
図11は、実施形態に係る算出装置100による生成処理手順を示すフローチャートである。
【0118】
図11に示すように、算出装置100に係る取得部131は、事業者データサーバ50から事業者データを取得する(ステップS101)。また、取得部131は、通信ネットワークを介して、事業者に関するネットワーク情報を取得する(ステップS102)。
【0119】
そして、生成部132は、事業者の財務状況に関連する情報と、事業者に関するネットワーク情報とに基づいて、当該事業者の信用度を示すスコアを算出するためのモデルを生成する(ステップS103)。生成部132は、生成したモデルをモデル記憶部129に格納し、生成処理を終了する。
【0120】
次に、
図12を用いて、実施形態に係る算出装置100による算出処理の手順について説明する。
図12は、実施形態に係る算出装置100による算出処理手順を示すフローチャートである。
【0121】
図12に示すように、算出装置100に係る受付部133は、金融機関サーバ30から、信用度に関する要求を受け付けたか否かを判定する(ステップS201)。受付部133は、要求を受け付けていない場合には、受け付けるまで待機する(ステップS201;No)。
【0122】
一方、要求を受け付けた場合には(ステップS201;Yes)、受付部133は、処理対象となる事業者を特定する。そして、取得部131は、処理の対象となる事業者の財務情報及びネットワーク情報を取得する(ステップS202)。そして、算出部134は、取得部131が取得した事業者に関する財務情報及びネットワーク情報をモデルに入力する(ステップS203)。
【0123】
そして、算出部134は、モデルに事業者に関する情報を入力することにより、事業者のスコアを出力させる(ステップS204)。算出部134は、出力させたスコアに基づいて、事業者の信用度を算出する(ステップS205)。そして、通知部135は、算出した結果を金融機関サーバ30に通知し(ステップS206)、算出処理を終了する。
【0124】
〔4.変形例〕
上述した実施形態に係る算出装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、上記の算出装置100の他の実施形態について説明する。
【0125】
〔4−1.プラットフォームの提供〕
上述した実施形態において、算出装置100は、事業者の財務情報に基づいて算定される財務スコアを利用して、事業者のスコアを出力するモデルを生成する例を示した。また、算出装置100は、事業者の財務情報の取得先として、事業者データサーバ50を利用する例を示した。しかしながら、上場していない企業や、財務情報を公開していない事業者に関しては、算出装置100は、処理対象となる事業者の財務情報を取得できない可能性もある。
【0126】
そこで、算出装置100は、事業者や第三者が情報を提供することのできる所定のプラットフォームを公開し、事業者に関する情報を受け付けることができる。この点について、
図13を用いて説明する。
【0127】
図13は、変形例に係る受付処理の一例を説明する図である。
図13に示すように、算出装置100が提供する公開プラットフォームにおいて、事業者に関する情報(例えば、事業者データ記憶部121に記憶されている情報)が一般ユーザや事業者55に公開される。
【0128】
このとき、算出装置100は、事業者データ記憶部121に記憶される情報として、事業者ごとに算出したスコアを公開してもよい。そして、一般ユーザは、ユーザ端末10を介して、公開された情報を閲覧することができるものとする。すなわち、一般ユーザにとっては、リアルタイムで更新される事業者の評価(信用情報)を確認することができることになる。
【0129】
また、事業者55にとっては、自社のスコアが公開されるとともに、総資産等の財務情報が公開される。ここで、事業者55が上場していない場合には、財務情報の一部について、該当する情報が欠けている状態で自社情報が公開されている場合がありうる。このように、財務情報の一部が欠けている場合、事業者55にとっては、一般ユーザからの印象を悪くしたり、信用性に欠ける事業者と判断されたりするおそれがある。
【0130】
そこで、算出装置100は、事業者55から、事業者情報の提供を受け付ける。すなわち、公開プラットフォームにおいて、算出装置100は、事業者55が直接又は間接に、自社の情報を提供することができるような環境を提供する。これにより、算出装置100は、上場等をしておらず、財務情報を取得するのが困難な事業者からも、正確な財務情報を取得することができる。そして、算出装置100は、取得した情報に基づいて、事業者の信用情報を更新する。なお、算出装置100は、財務情報以外の情報を適宜受け付けてもよい。
【0131】
このように、算出装置100は、事業者もしくは第三者が情報を提供することが可能な所定のプラットフォームを介して、第1のデータ及び第2のデータを取得する。そして、算出装置100は、事業者もしくは第三者によって提供された情報に基づいて、当該事業者の信用度を示すスコアを算出する。
【0132】
これにより、算出装置100は、一般には取得しにくい事業者の情報を取得することができる。また、情報更新日が公開されることにより、一般ユーザは、事業者55が情報を適切に更新していることを把握することができる。かかる行動を通じて、事業者55は、一般ユーザに対する信用を高めることができる。また、事業者55は、公開プラットフォームにおいて情報を公開することで自社の信用を高めるとともに、自社が提供する適切な情報によってスコアを更新させることができるため、一般ユーザや金融機関に対する自社の信頼性を向上させることができる。
【0133】
〔4−2.モデルに入力するデータ〕
上述した実施形態において、算出装置100は、事業者に関するネットワーク情報を入力して、事業者のスコアを算出する例を示した。ここで、算出装置100は、事業者の財務スコアが算定されるために用いられた財務情報と、取得されたネットワーク情報との取得時期を対応させるようにしてもよい。
【0134】
すなわち、算出装置100は、財務スコアが算定された際の第1のデータと、当該第1のデータに対応する時期に集計された第2のデータとに基づいて、モデルを生成するようにしてもよい。
【0135】
具体的には、算出装置100は、モデルの生成に用いる財務スコアが「2015年1月」から「2015年3月」までに集計された財務情報を用いて算定されている場合には、対応する時期である「2015年1月」から「2015年3月」までに取得されたネットワーク情報を用いて、モデルを算出する。これにより、算出装置100は、一般ユーザから取得されるネットワーク情報が、財務情報に対してどのような相関性を有するのかを適切に反映したモデルを生成することができる。なお、算出装置100は、財務情報に対応する時期として、必ずしも同時期であることを要さず、例えば、財務情報が集計される期間を含む期間に取得されたネットワーク情報を用いるなど、柔軟に対応することが可能である。
【0136】
一方で、算出装置100は、財務スコアが算定された際の第1のデータと、任意の時期に集計された第2のデータとに基づいて、モデルを生成するようにしてもよい。これにより、算出装置100は、集計する時期にこだわらず、一般ユーザの事業者に対するネット上の反応、評価等を反映したモデルを生成することができる。
【0137】
また、算出装置100は、事業者の財務スコアが算定された際の第1のデータ及び第1のデータの推移に基づき予測される現時点の第1のデータと、第2のデータとに基づいてモデルを生成してもよい。すなわち、算出装置100は、所定の事業者に関して、過去の第1のデータの推移に基づいて、現時点での第1のデータを予測する。そして、算出装置100は、予測された第1のデータと、現時点で集計された第2のデータとを用いて、モデルを生成する。これにより、算出装置100は、より鮮度の高い事業者のスコアを算出するモデルを生成することができる。
【0138】
この場合、算出装置100は、事業者の財務スコアが算定された際の第1のデータに対応する時期に集計された第2のデータと、現時点の第2のデータとの差分に基づいて、現時点の第1のデータを予測するようにしてもよい。すなわち、算出装置100は、第2のデータに関してはリアルタイムに情報を取得することができるため、事業者の財務スコアが算定された際の第2のデータと、現時点の第2のデータとの差分を求めることができる。算出装置100は、かかる差分から、第1のデータと第2のデータとの相関性を求める。そして、算出装置100は、求めた相関性に基づいて、現時点の第1のデータを予測する。これにより、算出装置100は、信頼性の高い予測に基づく第1のデータを取得できる。このため、算出装置100は、信頼性の高いデータを用いてモデルを生成することができる。なお、算出装置100は、既知の任意の統計手法に基づき、第1のデータと第2のデータとの相関性を求めることができる。
【0139】
〔4−3.関係者情報の利用〕
上記実施形態において、算出装置100は、事業者の経営者や役員の知名度や人脈等に関する情報を利用して、モデルを生成する例を示した。ここで、算出装置100は、例えば、事業者の経営者や役員個人が利用するSNSなどから、さらに情報を取得し、モデルの生成に利用してもよい。
【0140】
例えば、取得部131は、SNSから、事業者の経営者や役員個人の購買行動に関する情報を取得する。この場合、取得部131は、経営者や役員個人からSNSに発信された情報のうち、経営者や役員個人が比較的高額な商品等を購入していることや、頻繁な投資活動を行っていることなどの情報を取得する。そして、生成部132は、取得された経営者や役員個人の活動情報を、当該事業者のネットワーク情報を数値化した情報として、モデルの生成に利用する。例えば、生成部132は、経営者や役員個人の購買活動や投資行動の頻度が高いほど、事業者の経営状態が良好なものと判定し、かかる情報に対する数値を高く判定する。
【0141】
また、取得部131は、事業者の経営者や役員個人が利用するSNSにおいて、つながりを有するとされる個人(SNS内で連結のある個人)についての情報を取得してもよい。例えば、取得部131は、事業者の経営者や役員個人とつながりのある個人の地位、個人が関係する企業の規模や経営状態、個人そのものの知名度や人脈、個人の前職の地位などの情報を取得する。生成部132は、事業者の経営者や役員個人とつながりのある人物の数や、各々の人物における上記の情報などに基づいて、事業者の経営者や役員個人の人脈力を判定する。そして、生成部132は、判定した事業者の経営者や役員個人の人脈力の大小に基づいて、ネットワーク情報を数値化する。このように、算出装置100は、事業者の関係者の人脈力を判定することによって事業者の成長性を図り、かかる成長性に基づいたモデルを生成することができる。
【0142】
また、取得部131は、事業者の経営者や役員個人が利用するSNSにおいて発信される情報のうち、事業者の人事的な動向に関する情報を取得してもよい。例えば、取得部131は、事業者における求人や離職に関する情報を取得する。そして、生成部132は、事業者における求人や離職に関する情報が頻繁に発信される場合には、事業者の事業継続性が不透明であると判定し、かかる情報の数値を低下させる。一方、生成部132は、求人に関する情報と、事業者の規模の拡大が長期的に観測される場合には、事業者の成長性において有望であるとして、かかる情報の数値を向上させる。
【0143】
また、取得部131は、SNSなどインターネット上に発信される情報について、例えば、予め評価の指標になると想定される単語等を登録し、自動的にSNSから情報を収集する手法等を採用することができる。また、取得部131は、機械学習により、予め登録した単語を更新すること等により、精度よく評価の指標となりうる情報を取得することができる。
【0144】
〔4−4.同業者〕
上記実施形態において、算出装置100は、同業者の製品の動向などに関する情報を用いて、モデルを生成してもよい。例えば、生成部132は、同業者の経営状況に関する情報などから、業界全体の規模が拡大していることや、需要者のニーズが高まっていること等を判定する。具体的には、生成部132は、同業者に関する検索数の向上や、ウェブサイトの閲覧数の向上などから、業界全体の注目度が向上していると判定する。この場合、生成部132は、回帰分析における変数の設定において、同業者に関する検索数の向上や、ウェブサイトの閲覧数の向上などを踏まえて情報を数値化することにより、かかる業界に所属する事業者のスコアが向上するようなモデルを生成することができる。
【0145】
〔4−5.情報量〕
上記実施形態において、算出装置100は、ネットワーク上で取得可能な種々の情報に基づいて、モデルを生成する例を示した。ここで、算出装置100は、各種ウェブサイトを利用する一般ユーザから取得される情報が一定の閾値を超えたもののみを用いて処理を行うようにしてもよい。
【0146】
例えば、製品評価サイトにおける製品に関するレビューや、利用者の評価等は、一定数以上のデータに基づかない場合、偏った傾向を示すことがありうる。この場合、算出装置100は、回帰式に偏った傾向のデータの影響が及ぶことで、事業者の信用度を精度よく算出することができないモデルを生成する場合がある。このため、算出装置100は、ユーザから送信されるレビューや利用者評価が一定数を超えたもののみを、モデルの算出処理で扱うデータとすることができる。これにより、算出装置100は、信頼性の高いスコアを算出するモデルを生成することができる。
【0147】
〔4−6.重み〕
算出装置100は、取得したネットワーク情報について、特定の情報に重み付けを行ってもよい。例えば、算出装置100は、特定の分野の専門家が製品を批評するウェブサイトなどにおいては、一般ユーザから投稿を受け付ける評価サイトなどよりも信頼性が高いものと判定する。すなわち、算出装置100は、専門家が製品を批評するウェブサイトにおける製品のレビューや利用者評価に関する情報について、他の一般的なサイトから取得できる情報よりも重みを重くして、モデルの算出処理に利用することができる。これにより、算出装置100は、信頼性の高いスコアを算出するモデルを生成することができる。
【0148】
〔4−7.補正〕
算出装置100は、現実の経済状態によって、出力されるスコアに補正をかけることのできるモデルを生成してもよい。例えば、算出装置100は、円高傾向のときに経営状態が良くなる事業者と、影響のない事業者と、経営状態が悪化する事業者とを分類する。そして、算出装置100は、事業者のスコアを算出する際に、所定期間における円の価値の動向についてもモデルに入力することにより、円の価値の動向が加味されて補正された事業者のスコアを出力させるモデルを生成する。このような補正は、例えば、長期的に事業者データを取得し、円の価値の動向などとの連動性に関するデータを蓄積することにより、生成するモデルに反映させることができる。
【0149】
〔4−8.通信ネットワーク上の情報〕
上記実施形態において、算出装置100は、通信ネットワーク上の情報であって事業者に関連する情報のうち、主として、ユーザ行動に基づく情報を取得する例について詳細に説明した。しかし、算出装置100が取得する通信ネットワーク上の情報は、上記例に限られない。
【0150】
例えば、算出装置100は、事業者に関連する通信ネットワーク上の情報として、通信ネットワークを利用する一般ユーザの行動が関与しない情報を取得してもよい。例えば、算出装置100は、気象情報など自然現象に関する情報を取得してもよい。一例としては、算出装置100は、ネットワーク上で取得可能な気象情報や災害情報のうち、事業者が所在する地域の気象情報や災害情報、または、事業者の名称に含まれる地域の気象情報や災害情報を、その事業者に関連する情報として取得する。これは、事業者が所在する地域の気象状況や災害状況に応じて、将来的に事業者の経営状況が変動する可能性もあるからである。算出装置100は、このように気象情報から導出される要素を含むことにより、事業者の信用度の評価をより精度よく算出するモデルを生成することができる。
【0151】
また、算出装置100は、ユーザ自身から発信される情報のみならず、ユーザの周辺に所在する通信可能な機器がセンサ等を用いて機器の状態を通信ネットワーク上にアップロードした情報(いわゆる、モノのインターネット(Internet of Things)による情報)などの、ユーザが関与しない情報を取得してもよい。一例としては、算出装置100は、ネットワーク上で取得可能な情報のうち、所定の事業者から提供される製品から発信される情報であって、多数の製品が幅広い地域をまたいで常時稼働しているという情報を取得する。これは、事業者から提供される製品の普及率や稼働率が、その事業者の経営安定性の指標となりうるからである。算出装置100は、このようにユーザから発信される情報に限られず、様々な物から発信される情報の要素を含むことにより、事業者の信用度の評価をより精度よく算出するモデルを生成することができる。上記のように、算出装置100は、ユーザが直接的、あるいは間接的に関与する情報に限定されず、通信ネットワーク上に存在する種々の情報に基づいてモデルを生成するので、幅広い対象の事業者に対して適用可能な汎用性の高いモデルを生成することが可能となる。
【0152】
〔4−9.事業者に関する情報〕
取得部131は、事業者データサーバ50を介して取得する事業者に関する情報として、財務情報以外の情報を取得してもよい。例えば、取得部131は、事業者データ提供者によって独自に収集された情報を適宜取得する。例えば、取得部131は、事業者の経営者に関する情報を取得する。事業者の経営者に関する情報は、例えば、事業者の経営者の氏名、経歴、資産担保力のみならず、人為的な観点から判定される、経営者の人柄や、経営者としての能力などの情報であってもよい。
【0153】
〔4−10.情報のバリエーション〕
上記実施形態において、算出装置100は、ネットワーク情報記憶部122に記憶される各種情報を用いて処理を行う例を示した。ここで、算出装置100が扱う情報のバリエーションに関して、より詳細に説明する。
【0154】
例えば、算出装置100は、単語情報テーブル125に記憶される単語に関して、さらに詳細な情報を取得してもよい。例えば、算出装置100は、取得された単語を形態素解析し、品詞ごとに集計された情報を取得してもよい。具体的には、算出装置100は、名詞のカテゴリを人、物、場所等へ分類した集計結果を取得する。また、算出装置100は、各単語がポジティブ属性を有するか、ネガティブ属性を有するかといった分類結果や、メッセージが対話形式である場合、かかる対話の意図判定などの判定結果を取得することができる。
【0155】
また、算出装置100は、メッセージの取得に関して、ユーザが検索サイトやSNSサイトを利用した場合に送信されるメッセージに限らず、例えば、ニュースサイトが発信するニュースをメッセージとして取得してもよい。また、算出装置100は、事業者名を含むウェブページ(例えば、事業者を紹介するサイトや、事業者を批評するサイト等)に含まれるテキストをメッセージとして取得してもよい。また、算出装置100は、ファイナンス関係の掲示板などに投稿されるメッセージを取得してもよい。また、算出装置100は、ユーザから送信される音声情報を、メッセージとして取得してもよい。すなわち、算出装置100は、音声検索などを利用するユーザから送信される音声を音声認識することにより、単語を含むテキスト情報として取得することができる。
【0156】
そして、算出装置100は、取得した情報を数値化したデータ(言い換えれば、単語の重要度として数値化されたデータ)等に基づいて、事業者のスコアを予測するためのモデルを生成する。例えば、算出装置100は、事業者に関連するメッセージを形態素解析することで単語に分割し、各単語に対してtf−idf等のアルゴリズムにより数値化させた情報を付与する。そして、算出装置100は、数値化させた情報をモデルの組成の1つとして用いることで、事業者に関して使用された単語を、当該事業者のスコア算出に利用することができる。
【0157】
なお、算出装置100は、取得された単語に関して、特定の品詞のみを抽出し、スコア算出の処理に用いてもよい。例えば、算出装置100は、名詞や形容詞など、事業者の状況を端的に表すことのできる品詞を処理に用いる。これにより、算出装置100は、スコア算出の精度を低下させず、かつ、処理の負担を軽減させることができる。
【0158】
また、算出装置100は、予め登録された単語のみをスコア算出の処理に用いてもよい。例えば、算出装置100は、「倒産」や、「成長」や、「良い」や、「悪い」等といった、事業者の状況を端的に表すことのできる単語を処理に用いる。かかる登録は、例えば、算出装置100の管理者により行われる。
【0159】
また、算出装置100は、単語を品詞として分類する他に、所定のカテゴリ毎に分類してもよい。例えば、算出装置100は、「人名」や、「場所」や、「金額」といったカテゴリを予め登録し、かかるカテゴリに該当する単語に関する情報を処理に用いる。
【0160】
また、算出装置100は、ポジティブ属性もしくはネガティブ属性に単語を分類し、ポジティブ属性もしくはネガティブ属性を有すると判定された単語を処理に用いてもよい。一例として、算出装置100は、1つのメッセージ中で、ポジティブ属性を有すると判定された単語の数、及びネガティブ属性を有すると判定された単語の数を計数する。そして、算出装置100は、ポジティブ属性の単語数をネガティブ属性の単語数で除算して、両者の割合を示す数値を算出する。これにより、算出装置100は、取得したメッセージにおいて、ユーザから事業者がポジティブに捉えられているか、あるいはネガティブに捉えられているか、といった情報を数値として処理に用いることができる。
【0161】
さらに、算出装置100は、上記で説明してきた単語に関する情報について、情報の変化率を取得し、処理に用いてもよい。一例として、算出装置100は、所定の事業者に関連する全メッセージのうち、全単語数に対する「倒産」の出現回数の変化率を取得する。そして、算出装置100は、取得された変化率に関する情報を事業者のスコア算出の処理に利用する。これにより、算出装置100は、所定の事業者に対して一般ユーザが「倒産」という語を用いる傾向を反映するようなモデルを生成することができる。結果として、算出装置100は、一般ユーザの反応や興味関心を事業者の信用度に反映させた、精度の高いスコアを算出することができる。
【0162】
なお、上述したような情報のバリエーションは一例であり、算出装置100は、単語以外の情報であっても、上述した処理と同様の処理を実行することができる。例えば、算出装置100は、事業者が提供する製品の評価の変化率を取得し、かかる変化率を処理に用いてもよい。
【0163】
〔4−11.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0164】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0165】
例えば、
図2に示した記憶部120内の情報は、算出装置100が保持せずに、外部のストレージサーバ等に保持されてもよい。この場合、算出装置100は、ストレージサーバにアクセスすることで、格納されている各種情報を取得する。
【0166】
また、例えば、上述してきた算出装置100は、事業者の信用情報に関する申し入れを受け付けたり、事業者の信用情報を通知するといった、外部装置とのやりとりを主に実行するフロントエンドサーバ側と、インターネット上の情報を取得したり、算出処理などを実行するバックエンドサーバ側とに分散されてもよい。この場合、例えば、フロントエンドサーバは、少なくとも、受付部133と通知部135とを有する。また、バックエンドサーバは、少なくとも、生成部132を有する。
【0167】
〔5.ハードウェア構成〕
また、上述してきた実施形態に係る算出装置100は、例えば
図14に示すような構成のコンピュータ1000によって実現される。
図14は、算出装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0168】
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0169】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(実施形態に係る通信ネットワークに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。
【0170】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
【0171】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0172】
例えば、コンピュータ1000が算出装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。
【0173】
〔6.効果〕
上述してきたように、実施形態に係る算出装置100は、事業者の財務状況に関連する情報である第1のデータと、当該事業者に関連する情報であって、通信ネットワーク上におけるユーザ行動に基づく情報である第2のデータとを取得する取得部131と、取得部131によって取得された第1のデータ及び第2のデータに基づいて、当該事業者の信用度を示すスコア(指標値)を算出する算出部134と、を有する。
【0174】
このように、実施形態に係る算出装置100は、一般的に事業者の信用度の評価に用いられる財務情報のみならず、ネットワークにおけるユーザ行動に基づいて、事業者の信用度を示すスコアを算出する。すなわち、算出装置100は、一般ユーザの行動情報のような多数の情報に基づいて信用度を算出することができるため、精度の高い信用度を算出することができる。また、算出装置100は、一般に、四半期ごとなどに更新される財務情報とともに、常に更新され続ける鮮度の高いネットワーク情報を算出処理に用いることで、時事に適した信用度を算出することができる。
【0175】
また、実施形態に係る算出装置100は、第1のデータ及び第2のデータに基づいて、事業者の信用度を示すスコアを予測するためのモデルを生成する生成部132をさらに有する。また、算出部134は、生成部132によって生成されたモデルを用いることにより、事業者の信用度を示す指標値を算出する。
【0176】
このように、算出装置100は、財務情報とともに、ネットワーク情報を入力とするモデルに基づいて、事業者のスコアを算出する。これにより、算出装置100は、処理対象とする事業者の情報を入力することで、ただちに事業者のスコアを出力することができるため、精度の高い信用度を算出することができるとともに、算出処理の負担を軽減することができる。
【0177】
また、取得部131は、第1のデータに基づいて予め算定された事業者の財務スコア(「評価値」の一例)を取得する。生成部132は、取得部131によって取得された財務スコアと、第1のデータ及び第2のデータとの相関性に基づいて、モデルを生成する。
【0178】
このように、算出装置100は、財務情報に基づいて算出された財務スコアと、取得したデータとの相関性に基づくことにより、財務スコアとネットワーク情報との相関性が反映されたモデルを生成する。これにより、算出装置100は、財務情報とネットワーク情報とを入力とするモデルを用いて、事業者の信用度を示すスコアを精度高く算出することができる。
【0179】
また、生成部132は、財務スコアが算定された際の第1のデータと、当該第1のデータに対応する時期に集計された第2のデータとに基づいて、モデルを生成する。
【0180】
このように、算出装置100は、財務情報に対応する時期のネットワーク情報を用いることで、一般ユーザから取得されるネットワーク情報が、財務情報に対してどのような相関性を有するのかを適切に反映したモデルを生成する。これにより、算出装置100は、精度高く事業者のスコアを算出することができる。
【0181】
また、生成部132は、事業者の財務スコアが算定された際の第1のデータ及び第1のデータの推移に基づき予測される現時点の第1のデータと、第2のデータとに基づいて、モデルを生成してもよい。
【0182】
このように、算出装置100は、現時点でのデータを用いることにより、鮮度の高い事業者のスコアを算出するモデルを生成することができる。
【0183】
また、生成部132は、事業者の財務スコアが算定された際の第1のデータに対応する時期に集計された第2のデータと、現時点の第2のデータとの差分に基づいて、現時点の第1のデータを予測してもよい。
【0184】
このように、算出装置100は、第1のデータに比べてリアルタイムに取得し易い第2のデータの差分を用いることにより、現時点の第1のデータを予測する。これにより、算出装置100は、信頼性の高いデータを用いてモデルを生成することができる。
【0185】
また、取得部131は、第2のデータとして、事業者に関連する検索クエリによる検索数、検索ランキング、所定の期間ごとの検索数の変動率の少なくともいずれか一つを取得する。生成部132は、取得部131によって取得された検索数、検索ランキング、所定の期間ごとの検索数の変動率の少なくともいずれか一つを数値化させた情報に基づいて、モデルを生成する。
【0186】
このように、算出装置100は、検索情報を分析することにより、評価対象の事業者に対する一般ユーザからの注目度を判定することができる。これにより、算出装置100は、一般ユーザからの注目度を事業者の信用度の判定要素の1つとした、精度の高いモデルを生成することができる。なお、算出装置100は、上述のように、扱う情報に応じて、適宜、正規化された数値を用いるようにしてもよい。
【0187】
また、取得部131は、第2のデータとして、事業者が提供するウェブサイトにおける閲覧数、閲覧者数、コンバージョン率の少なくともいずれか一つを取得する。生成部132は、取得部131によって取得された閲覧数、閲覧者数、コンバージョン率の少なくともいずれか一つを数値化させた情報に基づいて、モデルを生成する。
【0188】
このように、算出装置100は、事業者が提供するウェブサイトに関する情報を分析することにより、評価対象の事業者に対する一般ユーザからの興味関心を判定することができる。これにより、算出装置100は、一般ユーザからの興味関心を事業者の信用度の判定要素の1つとした、精度の高いモデルを生成することができる。
【0189】
また、取得部131は、第2のデータとして、事業者に関連する単語を取得する。生成部132は、取得部131によって取得された事業者に関連する単語の重要度に基づいて、モデルを生成する。
【0190】
このように、算出装置100は、ユーザから投稿されるテキスト情報を分析することにより、事業者に対する一般ユーザからの注目度を判定することができる。具体的には、算出装置100は、事業者に関連する単語の重要度(所定の指標値と読み替えることもできる)を判定することによって、ネットワーク上の単語情報を事業者の信用度を算出する要素として取り入れることができる。これにより、算出装置100は、事業者の信用度を精度よく算出することができる。
【0191】
また、取得部131は、事業者に関連する単語の出現数、事業者に共起する単語の出現数、事業者に共起する単語の特性、所定のドキュメントにおける事業者に共起する単語の重みの少なくともいずれか一つを取得する。生成部132は、取得部131によって取得された事業者に関連する単語の出現数、事業者に共起する単語の出現数、事業者に共起する単語の特性、所定のドキュメントにおける事業者に共起する単語の重みの少なくともいずれか一つを用いて事業者に関連する単語の重要度を判定し、モデルを生成する。
【0192】
このように、算出装置100は、事業者に関する単語の出現数や、事業者に関するキーワードと共起する単語を取得することで、ユーザが事業者に抱いている印象や、事業者に対する注目度をより正確に把握することができる。なお、算出装置100は、所定のドキュメントにおける共起する単語の重み等の指標値を用いることによって、事業者に関連する単語と共起する単語を正確に把握できる。これにより、算出装置100は、一般ユーザからの注目度や印象を事業者の信用度の判定要素の1つとした、精度の高いモデルを生成することができる。
【0193】
また、取得部131は、ユーザから送信されるテキストデータ、ニュースサイトから配信されるテキストデータ、ユーザから送信される音声から認識されるテキストデータ、事業者に関連するウェブサイトから配信されるテキストデータの少なくともいずれか一つから、事業者に関連する単語を取得する。
【0194】
このように、算出装置100は、様々な経路から事業者に関連する単語を取得することができる。これにより、算出装置100は、多数のデータを集計することによるデータの信頼性を向上させることができる。また、算出装置100によれば、処理対象となるデータが、ある特定のサイトやユーザに偏ることを防止できる。
【0195】
また、生成部132は、単語を品詞ごとに分類した結果、所定のカテゴリ毎に分類した結果、単語が有する意図毎(例えば、ポジティブ要素やネガティブ要素)に分類した結果、又は、これらの結果の変化率の少なくともいずれか一つを用いて、事業者に関連する単語の重要度を判定する。
【0196】
このように、生成部132は、取得された単語について様々な手法を用いて事業者に関連する単語の重要度を判定することができる。これにより、生成部132は、事業者のスコアを算出するためのモデルの多様化を図ることができる。
【0197】
また、取得部131は、第2のデータとして、事業者が提供する製品におけるユーザからの評価、製品の利用者数、製品についてのレビュー投稿数の少なくともいずれか一つを取得する。生成部132は、取得部131によって取得された、事業者が提供する製品におけるユーザからの評価、製品の利用者数、製品についてのレビュー投稿数の少なくともいずれか一つを数値化させた情報に基づいて、モデルを生成する。
【0198】
このように、算出装置100は、事業者が提供する製品に関する情報を分析することにより、一般ユーザから事業者(あるいは、提供する製品)に対する評価に関する情報を取得する。算出装置100は、事業者が有する製品の評価を反映することにより、事業者の事業継続性や成長性などをスコアとして適切に示すことができる。また、製品の評価に関するサイト等は、一般ユーザからの評価が即時に反映されるため、算出装置100は、一般ユーザからの事業者に対する反応をより直接的に取得することができる。このため、算出装置100は、よりユーザの評価が反映され、即時性に優れたスコアを算出することのできるモデルを生成することができる。
【0199】
また、取得部131は、第2のデータとして、事業者が提供するプログラム製品のダウンロード数、利用者数、利用者一人あたりの平均利用時間、もしくは所定期間における稼働率の少なくともいずれか一つを取得する。生成部132は、取得部131によって取得された当該プログラム製品のダウンロード数、利用者数、利用者一人あたりの平均利用時間、もしくは所定期間における稼働率の少なくともいずれか一つを数値化させた情報に基づいて、モデルを生成する。
【0200】
これにより、算出装置100は、製品評価と同じく、事業者の事業継続性や成長性などを判定することができる。また、算出装置100は、アプリストアなどに寄せられるリアルタイム性のあるユーザからの反応を判定要素に加えたモデルを生成することができる。
【0201】
また、取得部131は、第2のデータとして、事業者の顧客数、顧客の継続利用率、顧客単価の少なくともいずれか一つを取得する。生成部132は、取得部131によって取得された事業者の顧客数、顧客の継続利用率、顧客単価の少なくともいずれか一つを数値化させた情報に基づいて、モデルを生成する。
【0202】
このように、算出装置100は、事業者の顧客に関する情報を分析することにより、事業者の経営状況を判定することができる。これにより、算出装置100は、事業者の倒産確率や事業継続性などを判定要素に加えることができるため、より精度の高いスコアを算出するモデルを生成することができる。
【0203】
また、取得部131は、共通する業界に属する事業者について、第1のデータ及び第2のデータを取得する。算出部134は、共通する業界に属する事業者同士の第1のデータ及び第2のデータに基づいて、事業者の信用度を示す指標値を算出する。
【0204】
このように、算出装置100は、共通する業界に属する事業者に関する情報を用いてモデルを生成する。これにより、算出装置100は、業界で用いられる数字などの類似性を加味したモデルを生成できるので、より精度高く事業者の信用度を算出することができる。
【0205】
また、取得部131は、事業者もしくは第三者が情報を提供することが可能な所定のプラットフォームを介して、第1のデータを取得する。算出部134は、事業者もしくは第三者によって提供された情報に基づいて、当該事業者の信用度を示すスコアを算出する。
【0206】
このように、算出装置100は、プラットフォームを公開し、事業者自身や第三者から広く情報を受け付けることにより、通常では信用度を評価することのできないような、公開される財務情報が充分でないベンチャー企業などの中小企業に対しても、信用度を精度高く算出することができる。
【0207】
以上、本願の実施形態及び実施形態の変形例のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0208】
また、上述した算出装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
【0209】
また、特許請求の範囲に記載した「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。