(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023154367
(43)【公開日】2023-10-19
(54)【発明の名称】情報処理装置、情報処理システム及び情報処理方法
(51)【国際特許分類】
G06Q 10/04 20230101AFI20231012BHJP
G06N 20/00 20190101ALI20231012BHJP
【FI】
G06Q10/04
G06N20/00
【審査請求】未請求
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2022063688
(22)【出願日】2022-04-06
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110001689
【氏名又は名称】青稜弁理士法人
(72)【発明者】
【氏名】棚橋 直哉
(72)【発明者】
【氏名】松葉 浩也
(72)【発明者】
【氏名】末光 一成
(72)【発明者】
【氏名】本間 健
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049AA02
5L049AA04
5L049DD01
(57)【要約】
【課題】情報処理装置において、予測に効く特徴量を自動で抽出することにより恣意的な判断を防止する。
【解決手段】複数の第1の非構造化データと第1の非構造化データのそれぞれについての前記結果情報に基づいて結果を予測する特徴量抽出モデルを構築する特徴量抽出モデル構築部と、特徴量抽出モデルに複数の第2の非構造化データを入力して結果の予測精度に寄与する特徴量を抽出する特徴量抽出部と、特徴量と複数の第2の非構造化データのそれぞれの付帯情報と第2の非構造化データのそれぞれの前記結果情報に基づいて結果を予測する結果予測モデルを構築する結果予測モデル構築部とを有する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
記憶部と演算部とを有する情報処理装置であって、
前記記憶部は、
予測対象に関する非構造化情報と、
前記予測対象に関する結果情報と、
前記予測対象に関する付帯情報と、を記憶し、
前記演算部は、
前記非構造化情報の一部分である複数の第1の非構造化データと、前記第1の非構造化データのそれぞれについての前記結果情報に基づいて、結果を予測する特徴量抽出モデルを構築する特徴量抽出モデル構築部と、
前記特徴量抽出モデルに前記非構造化情報の残りの部分である複数の第2の非構造化データを入力して、前記結果の予測精度に寄与する特徴量を抽出する特徴量抽出部と、
前記特徴量と、複数の前記第2の非構造化データのそれぞれの前記付帯情報と、前記第2の非構造化データのそれぞれの前記結果情報に基づいて、前記結果を予測する結果予測モデルを構築する結果予測モデル構築部と、
を有することを特徴とする情報処理装置。
【請求項2】
前記特徴量抽出モデル構築部は、
前記特徴量抽出モデルとして、中間層をもつ機械学習モデルを構築することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記特徴量抽出部は、
複数の前記第2の非構造化データを前記特徴量抽出モデルに入力して、前記中間層の値を特徴量ベクトルとして取得して前記特徴量を抽出することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記結果予測モデル構築部は、
所定の前記予測精度を満たす前記特徴量を選択し、選択した前記特徴量を用いて前記結果予測モデルを構築することを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記結果予測モデル構築部は、
前記予測精度として、前記結果の予測正当率を用いて前記特徴量を選択することを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記特徴量抽出モデルに基づいて、前記非構造化情報から前記予測精度に寄与する予測寄与情報を選択する予測寄与情報選択部を更に有することを特徴とする請求項1に記載の情報処理装置。
【請求項7】
前記非構造化情報は、
所定の活動に関する複数の文書データを含み、
前記結果情報は、
前記所定の活動における案件成約可否の結果を含み、
前記付帯情報は、
少なくとも前記予測対象に関する構造化データを含むことを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記予測寄与情報選択部は、
前記第2の非構造化データとして複数の前記文書データを前記特徴量抽出モデルに入力して前記案件成約可否の案件成約可否確率を算出し、
前記文書データ内に含まれている各単語をマスクして、前記各単語をマスクした際の予測確率をそれぞれ算出し、
前記案件成約可否確率と比べた前記予測確率の変化幅が所定のしきい値を超えた前記単語を前記案件成約可否の予測に寄与する単語として選択し、
前記予測に寄与する単語が含まれる前記文章データを前前記特徴量抽出モデルに入力することを特徴とする請求項7に記載の情報処理装置。
【請求項9】
前記非構造化情報は、
前記所定の活動として、営業活動に関する前記文書データを含み、
前記結果情報は、
前記所定の活動として、前記営業活動における前記案件成約可否の結果を含むことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
情報処理装置とユーザー端末とがネットワークを介して接続された情報処理システムであって、
前記ユーザー端末は、
ユーザーが所定の情報を入力し、前記情報処理装置において演算された結果を出力し、
前記情報処理装置は、
記憶部と演算部と通信部を有し、
前記演算部は、
前記非構造化情報の一部分である複数の第1の非構造化データと、前記第1の非構造化データのそれぞれについての前記結果情報に基づいて、結果を予測する特徴量抽出モデルを構築する特徴量抽出モデル構築部と、
前記特徴量抽出モデルに前記非構造化情報の残りの部分である複数の第2の非構造化データを入力して、前記結果の予測精度に寄与する特徴量を抽出する特徴量抽出部と、
前記特徴量と、複数の前記第2の非構造化データのそれぞれの前記付帯情報と、前記第2の非構造化データのそれぞれの前記結果情報に基づいて、前記結果を予測する結果予測モデルを構築する結果予測モデル構築部と、を有し、
前記通信部は、
前記ネットワークを介して、前記情報処理装置と前記ユーザー端末との通信を行うことを特徴とする情報処理システム。
【請求項11】
前記情報処理装置の前記特徴量抽出モデル構築部は、
前記特徴量抽出モデルとして、中間層をもつ機械学習モデルを構築することを特徴とする請求項10に記載の情報処理システム。
【請求項12】
前記情報処理装置の前記特徴量抽出部は、
複数の前記第2の非構造化データを前記特徴量抽出モデルに入力して、前記中間層の値を特徴量ベクトルとして取得して前記特徴量を抽出することを特徴とする請求項11に記載の情報処理システム。
【請求項13】
予測対象に関する非構造化情報と、前記予測対象に関する結果情報と、前記予測対象に関する付帯情報と、を記憶する記憶ステップと、
前記非構造化情報の一部分である複数の第1の非構造化データと、前記第1の非構造化データのそれぞれについての前記結果情報に基づいて、結果を予測する特徴量抽出モデルを構築する特徴量抽出モデル構築ステップと、
前記特徴量抽出モデルに前記非構造化情報の残りの部分である複数の第2の非構造化データを入力して、前記結果の予測精度に寄与する特徴量を抽出する特徴量抽出ステップと、
前記特徴量と、複数の前記第2の非構造化データのそれぞれの前記付帯情報と、前記第2の非構造化データのそれぞれの前記結果情報に基づいて、前記結果を予測する結果予測モデルを構築する結果予測モデル構築ステップと、
を有することを特徴とする情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理システム及び情報処理方法に関する。
【背景技術】
【0002】
適切な予実管理は計画の立案や人員リソースの最適化を行うために必要な過程である。予実管理を適切に実施するには、現時点で獲得しようとしている案件が将来的に成約される確率や案件の進捗率などを正確に予測することが必要となる。
【0003】
しかし、案件の成約可否やその進捗度合いを正確に予測することは困難なため、適切な予実管理は様々な企業にとって課題となっており、売上の低下や機会損失を招いてしまっている。ここで、案件の成約可否や進捗度合いを予測するのが困難な理由は、対象顧客のその時の状況によってその成約率が変わってしまい、過去の類似案件のデータのみを参考にした予測アルゴリズムでは精度が悪くなってしまうことが主な理由である。
【0004】
ここでいう顧客状況とは、顧客が提案に前向きか否か、や競合他社の存在など、案件ごとに変化する顧客の状況を意味している。
【0005】
この顧客状況は日々、案件成約のために顧客と接している営業が最もよく把握している。したがって、日々の営業活動にて記録された営業の記録文書から顧客の状況情報を抽出することで、案件予測アルゴリズムの精度向上が見込める。
【0006】
特許文献1には、案件の成約可否等の結論を予測する場合に、案件のために作成された文書ファイル又はその案件に関して複数のユーザー間でやり取りされたメッセージ群を用いることができる情報処理装置を提供する方法について開示されている。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【発明が解決しようとする課題】
【0008】
特許文献1では、案件のために作成された文書ファイル又はメッセージ群から複数のルールをもとに情報を抽出し、案件毎の文書ファイル又はメッセージ群内の情報に対応した案件の結論を予測することを学習した人工知能によって、案件についての結論を予測する。
【0009】
しかし、上記技術では、人手で特徴量のルールを決めるため恣意的な判断基準になってしまうため、作成した特徴量が必ずしも予測に効くとは限らない。また、対象顧客や案件が増えるにつれ新たにルールを増やしていく必要があるため、かなりの工数が必要になってしまう。
【0010】
本発明の目的は、情報処理装置において、予測に効く特徴量を自動で抽出することにより、恣意的な判断を防止することにある。
【課題を解決するための手段】
【0011】
本発明の一態様の情報処理装置は、記憶部と演算部とを有する情報処理装置であって、前記記憶部は、予測対象に関する非構造化情報と、前記予測対象に関する結果情報と、前記予測対象に関する付帯情報とを記憶し、前記演算部は、前記非構造化情報の一部分である複数の第1の非構造化データと、前記第1の非構造化データのそれぞれについての前記結果情報に基づいて、結果を予測する特徴量抽出モデルを構築する特徴量抽出モデル構築部と、前記特徴量抽出モデルに前記非構造化情報の残りの部分である複数の第2の非構造化データを入力して、前記結果の予測精度に寄与する特徴量を抽出する特徴量抽出部と、前記特徴量と、複数の前記第2の非構造化データのそれぞれの前記付帯情報と、前記第2の非構造化データのそれぞれの前記結果情報に基づいて、前記結果を予測する結果予測モデルを構築する結果予測モデル構築部とを有することを特徴とする。
【発明の効果】
【0012】
本発明に一態様によれば、情報処理装置において、予測に効く特徴量を自動で抽出することにより、恣意的な判断を防止することができる。
【図面の簡単な説明】
【0013】
【
図1】実施例1に関する情報処理装置及び情報処理システムの構成の一例を示したブロック図である。
【
図2】情報処理装置における特徴量抽出モデル構築部での処理の一例を示すフローチャートである。
【
図3】非構造化情報のデータ構造の一例を示す図である。
【
図4】結果情報のデータ構造の一例を示す図である。
【
図6】情報処理装置における特徴量抽出部と結果予測モデル構築部での処理の一例を示すフローチャートである。
【
図7】その他付帯情報のデータ構造の一例を示す図である。
【
図8】結果予測モデルの入力データ構造の一例を示す図である。
【
図9】複数の特徴量セットをもとに算出された予測精度のデータ構造の一例を示す図である。
【
図10】実施例2に関する情報処理装置及び情報処理システムの構成の一例を示したブロック図である。
【
図11】情報処理装置における予測寄与情報選択部での処理の一例を示すフローチャートである。
【
図12A】予測に寄与する情報を選択する文書データの一例を示す図である。
【
図12B】予測寄与情報を選択するためのデータ構造の一例を示す図であるである。
【発明を実施するための形態】
【0014】
以下、本発明の実施例について図面を参照して説明する。
【実施例0015】
図1を参照して、実施例1に関する情報処理装置及び情報処理システムの構成について説明する。
情報処理システム100は、ネットワーク102を介して通信可能に接続された情報処理装置101と、ユーザーが使用するユーザー端末103と、予測対象の情報が格納されたデータベース104とを有する。
【0016】
ネットワーク102は、ユーザー端末103と、データベース装置104と、情報処理装置101と、を互いに通信可能にする。
【0017】
ユーザー端末103は、PC(Personal Computer)等の情報処理装置である。ユーザー端末103は、ユーザーが所定の情報を入力し、情報処理装置101において演算された結果を出力する。具体例として、営業活動における案件成約可否を予測する場合では、入力情報は予実管理を行いたい案件番号などであり、出力情報は案件の成約可否確率などである。ここで、情報処理装置101で処理する予実管理を行いたい案件に関するデータはデータベース装置104に格納されている。
【0018】
情報処理装置101は、非構造化データから結果予測の精度向上に寄与する特徴量を自動で抽出し、その特徴量をもとに結果を予測するモデルを構築する情報処理装置である。ここで、非構造化データとは、例えば、フリーフォーマットのデータである。
【0019】
情報処理装置101は、記憶部110と、演算部120と、通信部130とを有する。記憶部110は、予測対象に関する非構造化データである非構造化情報111と、予測対象に関する結果情報である結果情報112と、予測対象に関する少なくとも構造化データを含む情報であるその他付帯情報113とを記憶する。
【0020】
演算部120は、特徴量抽出モデル構築部121と、特徴量抽出部122と、結果予測モデル構築部123とを有する。
【0021】
特徴量抽出モデル構築部121は、第1の複数の非構造化データと、第1の非構造化データのそれぞれについての結果情報とから結果を予測する機械学習モデルを構築する。特徴量抽出部122は、機械学習モデルに第2の複数の非構造化データを入力し、中間層のデータを取得する。結果予測モデル構築部123は、中間層のデータと、第2の複数の非構造化データのそれぞれに関する少なくとも構造化データを含むデータと、第2の非構造化データのそれぞれについての結果情報とからその結果を予測する。ここで、第1の非構造化データとは、非構造化情報111の一部分であり、第2の非構造化データとは、非構造化情報111の残りの部分である。
【0022】
通信部130は、ネットワーク102を介して情報処理装置101と他の装置と通信を行う。
例えば、情報処理装置101は計算機で構成され、演算部120はプロセッサで構成され、記憶部110はメモリで構成されている。
【0023】
特徴量抽出モデル構築部121、特徴量抽出部122及び結果予測モデル構築部123はそれぞれプログラムで構成され、これらのプログラムをプロセッサが処理することにより、所定の機能を提供する機能部として稼働する。例えば、プロセッサは、特徴量抽出モデル構築プログラムに従って処理することで特徴量抽出モデル構築部121として機能する。他のプログラムについても同様である。
【0024】
本実施例1では、営業活動における案件成約可否を予測する場合を想定する。またそれに伴い、使用する非構造化データとして、営業担当者と顧客とのやりとりや営業担当者の所感などが記された文書データのみを使用する。
【0025】
ここで、非構造化データは文書データに限らず、画像や音声など他の形式のものを使用しても良い。また、これらの非構造化データを複数種類使用してもよい。その場合、特徴量抽出モデル構築部121で構築する機械学習モデルの数を非構造化データの分だけ増やすなど、適宜対応すればよい。
【0026】
図2に特徴量抽出モデル構築部121での処理フローを示す。以下実施例では本フローに従い、特徴量抽出モデル構築部121の機能を示す。
まず、ステップS202では、非構造化情報111に格納された過去案件の文書データを読み込む。その際、全データを読み込むのではなく、その一部の案件の文書データを読み込み、特徴量を抽出する機械学習モデルを構築するために使用する。また、残りの案件の文書データは、結果予測モデル構築部123において予測モデルを構築するために使用される。本実施例1ではこれらのデータをそれぞれ、第1の複数の文書データと第2の複数の文書データと呼ぶ。
【0027】
図3は、非構造化情報111に格納された、情報各案件における文書ファイルを格納したデータの例を示している。
各案件における文書ファイルを格納したデータ301は、案件番号欄311と、添付文書データ欄312と、から構成される。
【0028】
案件番号欄311には、案件を識別する案件番号に関する情報が格納される。添付文書ファイル欄312には、各案件に関する文書データが格納される。
【0029】
ここで、格納されている文書ファイルは、一種類でも複数種類でもよい。本実施例1では例として、営業担当者と顧客とのやりとりや営業担当者の所感などが記された一種類のデータでの処理方法を示す。複数種類を使用する場合は、複数の文書データを一つの文書データとなるように結合する方法や、複数の文書データをそれぞれ別のデータとみなして機械学習モデルを構築する方法など、適宜方法を選択すればよい。
【0030】
次に、ステップS203では、ステップS202で読み込んだ文書データと対応した案件の結果情報を結果情報112から読み込む。
【0031】
図4は、結果情報112に格納された、各案件の結果情報を格納したデータの例を示している。
各案件の結果情報を格納したデータ401は、案件番号欄411と、案件成約可否結果欄412と、から構成される。案件番号欄411には、案件を識別する案件番号に関する情報が格納される。案件成約可否結果412には、対象案件の成約可否の結果を示す情報が格納される。
【0032】
本実施例1では、営業活動に置ける案件成約可否を予測するため、対象の案件が成約したか否かの二値情報が格納されている。しかし、本情報処理装置で処理する結果情報の形式に制限はなく、例えば予測対象がプロジェクトの進捗率の場合などでは、実数や確率値のような連続値でもよい。
【0033】
次に、ステップS204では、ステップS202で読み込んだ文書データとステップS203で読み込んだ各案件の結果情報とから、案件成約可否結果を予測する機械学習モデルを構築する。
【0034】
本実施例1では、中間層をもつ機械学習モデルとして内部にニューラルネットワークを有した機械学習モデルを想定する。ニューラルネットワークとは、別名、マルチパーセプトロンとも呼ばれ、複数のパーセプトロンを多層的に重ねることで、線形分離不可能問題を解く能力をもたせた技術である。ここで、中間層は、予測結果を算出するために使用される複数のパーセプトロンの層のいずれであってもよい。
【0035】
図5に、本実施例1にて使用する各案件の文書データの例を示す。
各案件の文書データ501は案件番号欄511とデータ内容欄512によって構築されている。本実施例1では、非構造化データとして
図5に示したような文書データをもとに機械学習モデルを構築する。
【0036】
そこでまず、機械学習モデルが構築できるよう文書データの前処理を行う。本実施例1では、前処理方法として、文書を構成する文章ごとに文書を構成する単語に分割し、文書に含まれる全ての単語について単語の種類、単語情報に分割する形態素解析と、文書データの数値化を行うワンホットベクトル化を使用する。
【0037】
ワンホットベクトルとは、ベクトルの全要素のうち、1個の要素が1であり、それ以外の要素が全て0であるベクトルである。文書データをワンホットベクトル化する場合、ベクトルの各要素は単語や文字の種類に対応する。ワンホットベクトルの次元数は各言語に対応した文字の種類をもとに予め決定しておく方法や、処理する文書データの単語の種類を数えた後に決定する方法などがあるが、その時の分析に応じて適宜定めれば良い。
【0038】
また、文書データを機械学習モデルへの入力データとする前処理方法は埋め込みベクトル化など他にも多数あり、本実施例の方式に限られるものではない。
【0039】
また、非構造化データとして画像データを使用した場合には、色補正や画像の大きさの変更など、音声データを使用した場合は、音声信号の標準化やスペクトログラム形式への変換など、の前処理が考えられる。
【0040】
特徴量抽出モデル構築部121では、上記のフローによって非構造化データとその結果情報をもとに、中間層をもつ機械学習モデルを構築し、入力された非構造化データに対する結果を予測する予測モデルを構築する。本実施例1では本モデルを特徴量抽出モデルと呼び、本モデルは主に文書データなどの非構造化データから結果の予測の精度に寄与する特徴量を抽出するために使用される。
【0041】
図6に特徴量抽出部122と予測モデル構築部123での処理フローを示す。ここで
図6において、ステップS602とステップS603は特徴量抽出部122によって処理され、ステップS604とステップS605は予測モデル構築部123によって処理される。
【0042】
本実施例1では本フローに従い、特徴量抽出部122と予測モデル構築部123の機能を示す。
【0043】
まず、ステップS602では、非構造化情報111に格納された過去案件の文書データを読み込む。その際、特徴量抽出モデル構築部121での機械学習モデルの構築に使用しなかった第2の複数の文書データを読み込む。
【0044】
次に、ステップS603では、ステップS602にて読み込んだ文書データを特徴量抽出モデルに入力する。そして、そのモデルの中間層の値を特徴量ベクトルとして取得する。その際、読み込んだ文書データには特徴量抽出モデル構築時と同様の前処理を施す。
【0045】
取得した特徴量ベクトルは、特徴量抽出モデルにて結果を予測する際に使用されるベクトルであるため、その結果予測の精度に寄与する特徴量である。本発明の情報処理装置では、この方法により人手で特徴量のルールを決める必要なく、非構造化データから自動的に結果の予測精度の向上に寄与する特徴量を抽出することができる。
【0046】
次に、ステップS604では、ステップS602にて読み込んだ文書データと対応した案件の結果情報を結果情報112から、案件に関係したその他案件付帯情報をその他付帯情報113から読み込む。
【0047】
図7にその他付帯情報113に格納された、その他案件付帯情報が記録されたデータの例を示す。
その他案件付帯情報701は、案件番号欄711と、顧客業種欄712と、顧客本拠地欄713と、契約金額欄714と製品種別欄715と、から構成される。
【0048】
案件番号欄711には、案件を識別する案件番号の情報が格納される。顧客業種欄712には、顧客の業種に関する情報が格納される。業種は、「金融」、「自動車」、「医療」等、予め定められた区分を有する。顧客本拠地欄713には、顧客の拠点となる国に関する情報が格納される。本拠地は、「日本」、「アメリカ」、「中国」等、予め定められた区分を有する。
【0049】
契約金額欄714には、案件の契約金額に関する情報が格納される。製品種別欄715には、案件にて販売や提案した製品種別に関する情報が格納される。製品種別は、「X製品」、「Y製品」、「Z製品」等、予め定められた区分を有する。
【0050】
また、本データには非構造化データが含まれていても良い。その場合前述したワンホットベクトル化など、適宜非構造化データを数値データへと変換し、構造化データへと変換する処理を行えばよい。
【0051】
次に、ステップS605では、ステップS603にて取得した特徴量ベクトルとステップS604にて取得した案件の結果情報とその他案件付帯情報をもとに、案件の成約可否結果を予測する結果予測モデルを構築する。
【0052】
構築する予測モデルのアルゴリズムの種類として、例えば、決定木、ランダムフォレスト、サポートベクターマシン(Support Vector Machine)、ニューラルネットワークなどがある。
【0053】
上記のような予測モデルを構築するため、本ステップではまず特徴量ベクトルとその他案件付帯情報を、案件番号欄に記載された案件番号をキーとして結合し、予測モデルの入力データを作成する。
【0054】
図8に予測モデルの入力データである、特徴量ベクトルとその他案件付帯情報を案件番号ごとに結合したデータの例を示す。
予測モデルの入力データ801は、案件番号欄811と、顧客業種欄812と、顧客本拠地欄813と、契約金額欄814と製品種別欄815と、文書特徴量816から構成される。文書特徴量816は、S603にて抽出した各案件の文書データごとの特徴量ベクトルであり、その特徴量数Nは構築した特徴量抽出モデルの中間層の大きさによって変化する。
【0055】
次に、使用する予測モデルに適した前処理方法によって作成した入力データの前処理を行う。例えば、予測モデルとしてニューラルネットワークなど数値データを処理するアルゴリズムを使用する場合、入力データ801では、顧客業種欄に文字データが含まれているため、予め定められた区分をもとにしたラベル化などを実行する。ここで、前処理方法に制限はなく、適宜前処理方法を変更してもよい。その後、入力データと、案件の結果情報をもとに結果予測モデルを構築する。
【0056】
本モデルをもとにある案件の成約確率を予測する際には、予測したい案件の文書データを特徴量抽出部に入力し、特徴量ベクトルを取得し、該特徴量ベクトルと結果予測モデル構築時と同様の前処理を施したその他案件付帯情報を結合し、予測モデルに入力することでその案件の成約確率を計算することができる。
【0057】
本実施例1の情報処理装置101では、この方法により非構造化データから自動的に抽出した結果の予測精度の向上に寄与する特徴量をもとに、結果予測モデルを構築することができる。
【0058】
また、本実施例1では、予測モデル構築部123において、予測モデル構築時に、その予測精度を用いて、入力データとして使用する情報を選択する機能を備えてもよい。以下、入力データとして使用する情報を選択した後、予測モデルを構築する方法の実施例を示す。
【0059】
まず、予測精度を計算するために、入力データ801と、ステップS604にて取得した案件の結果情報を、訓練に使用するためのデータ(訓練用データ)と精度を計算するためのデータ(検証用データ)に分割する。
【0060】
その後、入力データに含まれている特徴量のうち、いくつかの特徴量を選択した特徴量セットを複数作成し、各特徴量セットについて、訓練用データを用いて予測モデルを構築した後、検証用データによって、その予測精度を算出する。ここで、特徴量セットの作成方法に制限はなく、ランダムに決定する方法や、その他案件付帯情報は必ず使用するなど予めルールを定めておいてもよい。
【0061】
図9は作成された複数の特徴量セットをもとに算出された予測精度を示した例である。本実施例1では、予測精度として案件成約可否の予測正当率を使用している。
各特徴量セットによって算出された案件成約可否の正当率表901は、特徴量セット番号欄911と、使用した特徴量欄912と、正当率欄913と、から構成される。
【0062】
例えば、表901の1行目は、入力データ801に含まれている全特徴量「顧客業種、顧客本拠地、...、文書特徴量1、...、文書特徴量(N-1)、文書特徴量N」を使用した場合の予測モデルの正当率は、90%であることを示している。
【0063】
また、表901の2行目は、入力データ801に含まれている特徴量のうち、文書特徴量Nを除いた、「顧客業種、顧客本拠地、...、文書特徴量1、...、文書特徴量(N-1)」を使用した場合の予測モデルの正当率は、95%であることを示している。
【0064】
また、表901の3行目は、入力データ801に含まれている特徴量のうち、顧客本拠地を除いた、「顧客業種、契約金額、...、文書特徴量1、...、文書特徴量(N-1)」を使用した場合の予測モデルの正当率は、75%であることを示している。
【0065】
したがって、本実施例1では、特徴量セットBをもとに構築した予測モデルの精度が高いことから、特徴量セットBを使用した結果予測モデルを構築し、使用する。
【0066】
このように、特徴量として使用する情報を選択することで、より精度の高く、高速な処理が可能な予測モデルの構築が可能となる。また、本実施例1では、精度計算方法として、単純に訓練用データと検証用データに分割し、予測精度を計算したが、精度計算方法に制限はなく、交差検証による精度計算などを行っても問題ない。
非構造化データには、結果の予測に寄与しないノイズのような情報が含まれることがありうる。このような情報を含んだまま結果予測モデルを構築してしまうと、結果予測モデル構築時間の長期化や予測精度の低下といった事象が発生してしまう。
そのため、実施例2の情報処理装置では、結果の予測に寄与しないノイズのような情報が結果予測モデルの訓練用データとして使用されないよう、特徴量抽出部122にて非構造化データから特徴量ベクトルを抽出する前に、結果予測モデルの訓練に使用すべき、予測に寄与する情報を非構造化データから選択することができる。
本処理では、結果予測モデルの訓練データからノイズのような情報が除去することできるため、結果予測モデルの訓練時間の削減や予測精度の向上などという効果がある。
ユーザー端末1003は、PC(Personal Computer)等の情報処理装置である。ユーザー端末1003は、ユーザーが所定の情報を入力し、情報処理装置1001において演算された結果を出力する。具体例として、営業活動における案件成約可否を予測する場合では、入力情報は予実管理を行いたい案件番号などであり、出力情報は案件の成約可否確率などである。ここで、情報処理装置1001で処理する予実管理を行いたい案件に関するデータはデータベース装置1004に格納されている。
情報処理装置1001は、非構造化データから結果予測の精度向上に寄与する特徴量を自動で抽出し、その特徴量をもとに結果を予測するモデルを構築する情報処理装置である。情報処理装置1001は、記憶部1010と、演算部1020と、通信部1030とを有する。
記憶部1010は、予測対象に関する非構造化データである非構造化情報1011と、予測対象に関する結果情報である結果情報1012と、予測対象に関する少なくとも構造化データを含む情報であるその他付帯情報1013とを記憶する。
新たに追加された予測寄与情報選択部1024は、特徴量抽出モデル構築部1021で構築した機械学習モデルをもとに非構造化データから予測精度に寄与する情報を選択する。
特徴量抽出モデル構築部1021、特徴量抽出部1022、結果予測モデル構築部1023及び予測寄与情報選択部1024はそれぞれプログラムで構成され、これらのプログラムをプロセッサが処理することにより、所定の機能を提供する機能部として稼働する。例えば、プロセッサは、予測寄与情報選択プログラムに従って処理することで予測寄与情報選択部1024として機能する。他のプログラムについても同様である。
本実施例2でも実施例1と同様に例として営業活動における案件成約可否を予測する場合を想定する。また、使用する非構造化データとして、営業担当者と顧客とのやりとりや営業担当者の所感などが記された文書データのみを使用する。
次に、ステップS1103では、ステップS1102にて読み込んだ文書データを特徴量抽出モデルに入力して、案件成約可否確率を算出する。その際、読み込んだ文書データには特徴量抽出モデル構築時と同様の前処理を施す。本実施例2では、ステップS1102にて読み込んだ文書データを特徴量抽出モデルに入力することによって算出された案件成約確率が95%であったとする。
次に、ステップS1104では、ステップS1103で入力データとして使用した文書データのうち、ある一つの単語をマスクした場合の案件成約確率を算出する。ここでマスクするという意味は、文章中のある単語を使用しないで特徴量抽出モデルへの入力データとすることである。
本実施例2では、ワンホットベクトル化を施しているため、マスクした単語についてワンホットベクトルは全ての要素が0であるベクトルとなる。その際、文書データにマスク対象の単語が2つ以上含まれている場合、それぞれ同時にマスクして、入力データとする。本処理により、文書データから、ある単語を除去した文章をもとに案件成約確率を算出することができる。本処理を文書データ内に含まれている各単語に対して実行し、各単語をマスクした際の予測確率を保持する。
文書データ1201に含まれる「提案に対して前向きな反応をいただいた。」という文章は、顧客が提案に納得していることを意味しており、案件成約可否の予測の精度には寄与すると考えられる。一方、「その後、私は別の会社との打合せに向かった。」という文章は、明らかに案件成約可否の予測の精度には寄与しない。本情報処理装置1001では、このような文章を除去することを目的とする。
表1202は、マスクした単語欄1211と、予測確率欄1212と、予測確率の変化幅欄1213と、から構成される。ここで、予測確率の変化幅欄1213には、ステップS1103にて算出したオリジナルの文章を入力データとして特徴量抽出モデルに入力することで算出された案件成約確率と、S1104にて算出したマスクした単語欄1211に記載された単語をマスクした文章を入力データとして特徴量抽出モデルに入力することで算出された案件成約確率との差の絶対値が格納される。
例えば、表1202の1行目は、文書データ1201に含まれた「提案」という単語をマスクした場合の案件成約確率と予測確率の変化幅を示している。「提案」をマスクした場合の案件成約確率が93%であったため、予測確率の変化幅は2%となる。
表1202の2行目は、文書データ1201に含まれた「前向き」という単語をマスクした場合の案件成約確率と予測確率の変化幅を示している。「前向き」をマスクした場合の案件成約確率が75%であったため、予測確率の変化幅は20%となる。
表1202の3行目は、文書データ1201に含まれた「反応」という単語をマスクした場合の案件成約確率と予測確率の変化幅を示している。「反応」をマスクした場合の案件成約確率が90%であったため、予測確率の変化幅は5%となる。
算出した予測確率の変化幅が大きい場合、その単語は案件成約の予測に寄与する単語であると判断ができる。なぜならその単語を文書データから除去するだけで、オリジナルの文章での予測から大きく予測確率が変化したということを意味するためである。
そこで、ステップS1105では、予測確率の変化幅のしきい値を設定し、そのしきい値を超えた単語を案件成約の予測に寄与する単語として選択し、その単語が含まれる文章を、特徴量抽出部1022の入力データとして出力する。
本実施例2では、予測確率の変化幅のしきい値を10%と設定する。その結果、表1202の結果より、「前向き」という単語のみが予測に寄与する単語として選択されたとする。
したがって、選択された単語が含まれる「提案に対して前向きな反応をいただいた。」という文章は、特徴量抽出部1022の入力データとして選択される。一方、「前向き」という単語が含まれない「その後、私は別の会社との打合せに向かった。」という文章は、案件成約可否の予測に寄与しない文章と判断され、特徴量抽出部1022の入力データとして選択されない。
また、本実施例2では、文書データを例として扱ったため、マスクする対象を単語とした。同様の手法でその他の非構造化データを扱う場合には、そのマスク対象を適宜変更することで対応可能である。例えば、非構造化データとして画像を扱う場合には、ある特定の範囲のピクセルや画像の一部分をマスクし、マスクされたピクセルやや画像の一部分の値を0として入力データとする方法が考えられる。
上記実施例によれば、文書データなど非構造化データを使用してある結果を予測するモデルを構築する場合に、非構造化データから結果予測の精度向上に寄与する特徴量を自動で抽出することができ、その特徴量をもとに結果を予測するモデルを構築することができる。