IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

<>
  • 特許-情報処理装置及び情報処理プログラム 図1
  • 特許-情報処理装置及び情報処理プログラム 図2
  • 特許-情報処理装置及び情報処理プログラム 図3
  • 特許-情報処理装置及び情報処理プログラム 図4
  • 特許-情報処理装置及び情報処理プログラム 図5
  • 特許-情報処理装置及び情報処理プログラム 図6
  • 特許-情報処理装置及び情報処理プログラム 図7
  • 特許-情報処理装置及び情報処理プログラム 図8
  • 特許-情報処理装置及び情報処理プログラム 図9
  • 特許-情報処理装置及び情報処理プログラム 図10
  • 特許-情報処理装置及び情報処理プログラム 図11
  • 特許-情報処理装置及び情報処理プログラム 図12
  • 特許-情報処理装置及び情報処理プログラム 図13
  • 特許-情報処理装置及び情報処理プログラム 図14
  • 特許-情報処理装置及び情報処理プログラム 図15
  • 特許-情報処理装置及び情報処理プログラム 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-02-25
(45)【発行日】2025-03-05
(54)【発明の名称】情報処理装置及び情報処理プログラム
(51)【国際特許分類】
   G06Q 10/0637 20230101AFI20250226BHJP
   G06Q 10/0639 20230101ALI20250226BHJP
   G06Q 30/06 20230101ALI20250226BHJP
   G06F 40/279 20200101ALI20250226BHJP
【FI】
G06Q10/0637
G06Q10/0639
G06Q30/06
G06F40/279
【請求項の数】 7
(21)【出願番号】P 2020051541
(22)【出願日】2020-03-23
(65)【公開番号】P2021149844
(43)【公開日】2021-09-27
【審査請求日】2023-02-28
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】100115129
【弁理士】
【氏名又は名称】清水 昇
(74)【代理人】
【識別番号】100102716
【弁理士】
【氏名又は名称】在原 元司
(74)【代理人】
【識別番号】100122275
【弁理士】
【氏名又は名称】竹居 信利
(72)【発明者】
【氏名】渡邉 岳人
【審査官】小原 正信
(56)【参考文献】
【文献】特開2008-117010(JP,A)
【文献】特開2004-213260(JP,A)
【文献】特開2007-287134(JP,A)
【文献】特開2019-079302(JP,A)
【文献】特開2019-117476(JP,A)
【文献】特開2020-004161(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 40/279
(57)【特許請求の範囲】
【請求項1】
メモリと一又は複数のプロセッサを備え、
前記メモリは、案件のために作成された文書ファイル又は該案件に関して複数のユーザ間でやり取りされたメッセージ群を記憶しており、
前記プロセッサは、
前記メモリに記憶されている、文書ファイル又はメッセージ群から対象とする案件について情報を抽出し、
予め機械学習により案件毎の文書ファイル又はメッセージ群内の情報に対応した該案件の結論を予測することを学習した人工知能によって、
抽出した前記情報から、前記対象とする案件についての結論を予測する、
前記複数のユーザとは、少なくとも営業担当者と顧客を含み、
前記結論とは、少なくとも成約の可否を含み、
前記機械学習として、成約の結論に達した場合に抽出された第1の情報と、成約の結論に達した場合と非成約の結論に達した場合のともに抽出された第2の情報がある場合、該第1の情報については予測精度が該第2の情報よりも高く設定して抽出するように機械学習する
情報処理装置。
【請求項2】
前記メモリは、前記メッセージ群を記憶しており、
前記プロセッサは、
前記メッセージ群を、一連のやり取りに分割してから、前記一連のやり取りごとに、前記情報を抽出する、
請求項1に記載の情報処理装置。
【請求項3】
前記プロセッサは、
前記一連のやり取りから抽出する情報として、「いつ」、「どこで」、「誰が」、「何を」、「なぜ」、「どのように」のうち、2つ以上の情報を関連させて、前記学習後の前記人工知能を用いる、
請求項2に記載の情報処理装置。
【請求項4】
前記プロセッサは、
複数の異なるルールに従って、複数の異なる種別の情報を抽出し、
抽出したそれぞれの種別の情報に対応する予測の精度を用いて、前記学習後の前記人工知能に用いる情報の種別を選択する、
請求項1から3のいずれか一項に記載の情報処理装置。
【請求項5】
前記プロセッサは、
前記抽出した情報に関連する第2情報を外部の情報処理装置から取得し、
前記抽出した情報と前記第2情報を関連付けて、前記学習後の前記人工知能を用いて、前記対象とする案件についての結論を予測する、
請求項1から4のいずれか一項に記載の情報処理装置。
【請求項6】
前記プロセッサは、
前記抽出した情報を相手に提供した順番又は間隔を抽出し、
前記抽出した情報と前記順番又は間隔を関連付けて、前記学習後の前記人工知能を用いて、前記対象とする案件についての結論を予測する、
請求項1から5のいずれか一項に記載の情報処理装置。
【請求項7】
メモリと一又は複数のプロセッサを備えたコンピュータの前記メモリは、
案件のために作成された文書ファイル又は該案件に関して複数のユーザ間でやり取りされたメッセージ群を記憶しており、
前記プロセッサに、
前記メモリに記憶されている、文書ファイル又はメッセージ群から対象とする案件について情報を抽出し、
予め機械学習により案件毎の文書ファイル又はメッセージ群内の情報に対応した該案件の結論を予測することを学習した人工知能によって、
抽出した前記情報から、前記対象とする案件についての結論を予測する、
前記複数のユーザとは、少なくとも営業担当者と顧客を含み、
前記結論とは、少なくとも成約の可否を含み、
前記機械学習として、成約の結論に達した場合に抽出された第1の情報と、成約の結論に達した場合と非成約の結論に達した場合のともに抽出された第2の情報がある場合、該第1の情報については予測精度が該第2の情報よりも高く設定して抽出するように機械学習する
処理を実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、生命保険の営業を支援するシステムであって、見込客ごとに、営業担当者が前記見込客にコンタクトした回数であるコンタクト量を取得するコンタクト量取得部と、前記見込客ごとに、前記営業担当者が前記見込客から収集した前記見込客に関する情報の情報量を取得する情報量取得部と、前記コンタクト量および前記情報量に応じて前記見込客について契約成立の見込度を決定する見込度決定部と、を備え、前記コンタクト量取得部は、前記営業担当者が前記見込客と面談した回数である第1のコンタクト量と、前記営業担当者が前記見込客に対して面談せずにコンタクトした回数である第2のコンタクト量を取得し、前記見込度決定部は、前記第1のコンタクト量が第1の所定値以上の場合には前記第1のコンタクト量に応じて第1の前記見込度を決定し、前記第1のコンタクト量が前記第1の所定値未満の場合に、前記第2のコンタクト量が第2の所定値以上のときには、前記情報量に応じて前記第1の見込度よりも低い第2の前記見込度を決定し、前記第1のコンタクト量が前記第1の所定値未満であり、かつ、前記第2のコンタクト量が前記第2の所定値未満である場合には、前記第2のコンタクト量に応じて前記第2の見込度よりも低い第3の前記見込度を決定することが開示されている。
【0003】
特許文献2には、営業元と営業先との接触の質と、営業先が営業元に対して割いた労力と、に基づいて、受注成否の客観的な判断を容易ならしめる受注判断可視化装置であって、接触の質を示す項目である接触項目と当該接触項目の評価点数とを対応づけて格納した接触点数格納手段と、労力内容を示す項目である労力項目と当該労力項目の評価点数とを対応づけて格納した労力点数格納手段と、営業先を指定する営業先指定手段と、接触項目または労力項目を指定する項目指定手段と、営業先指定手段により指定された営業先に関し、項目指定手段により指定された接触項目にかかる接触があった若しくはなくなった日時、または、労力項目にかかる労力が割かれた日時を入力する日時入力手段と、項目指定手段により指定された項目と日時入力手段により入力された日時とを対応させて営業先毎に記憶する項目日時記憶手段と、営業先を選択する営業先選択手段と、営業先選択手段により選択された営業先に関し、項目日時記憶手段に記憶された情報と、接触点数格納手段または労力点数格納手段に格納された評価点数と、に基づいて、接触項目に関する評価点の経時変化を示す質グラフ、労力項目に関する評価点の経時変化を示す労力グラフ、および、接触項目と労力項目に関する評価点の経時変化を示す総計グラフ、を作成するグラフ作成手段と、グラフ作成手段により作成された3グラフを時間軸と点数軸とを共通とした一図上に表示するグラフ表示手段と、を具備したことが開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特許第5759406号公報
【文献】特許第6224982号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
案件の成約可否等の結論を予測する場合に、予め定められた項目に対して担当者が改めて入力する構成においては、案件のために作成されたドキュメントは活用されていなかった。そこで、本発明は、案件の成約可否等の結論を予測する場合に、案件のために作成された文書ファイル又はその案件に関して複数のユーザ間でやり取りされたメッセージ群を用いることができる情報処理装置及び情報処理プログラムを提供することを目的としている。
【課題を解決するための手段】
【0006】
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。なお、以下の「請求項」とあるのは、出願当初の請求項である。
請求項1の発明は、メモリと一又は複数のプロセッサを備え、前記メモリは、案件のために作成された文書ファイル又は該案件に関して複数のユーザ間でやり取りされたメッセージ群を記憶しており、前記プロセッサは、前記メモリに記憶されている、文書ファイル又はメッセージ群から対象とする案件について情報を抽出し、予め機械学習により案件毎の文書ファイル又はメッセージ群内の情報に対応した該案件の結論を予測することを学習した人工知能によって、抽出した前記情報から、前記対象とする案件についての結論を予測する、情報処理装置である。
【0007】
請求項2の発明は、前記メモリは、前記メッセージ群を記憶しており、前記プロセッサは、前記メッセージ群を、一連のやり取りに分割してから、前記一連のやり取りごとに、前記情報を抽出する、請求項1に記載の情報処理装置である。
【0008】
請求項3の発明は、前記プロセッサは、前記一連のやり取りから抽出する情報として、「いつ」、「どこで」、「誰が」、「何を」、「なぜ」、「どのように」のうち、2つ以上の情報を関連させて、前記人工知能を用いる、請求項2に記載の情報処理装置である。
【0009】
請求項4の発明は、前記プロセッサは、複数の異なるルールに従って、複数の異なる種別の情報を抽出し、抽出したそれぞれの種別の情報に対応する予測の精度を用いて、前記人工知能に用いる情報の種別を選択する、請求項1から3のいずれか一項に記載の情報処理装置である。
【0010】
請求項5の発明は、前記プロセッサは、前記抽出した情報に関連する第2情報を外部の情報処理装置から取得し、前記抽出した情報と前記第2情報を関連付けて、前記人工知能を用いて、前記対象とする案件についての結論を予測する、請求項1から4のいずれか一項に記載の情報処理装置である。
【0011】
請求項6の発明は、前記プロセッサは、前記抽出した情報を相手に提供した順番又は間隔を抽出し、前記抽出した情報と前記順番又は間隔を関連付けて、前記人工知能を用いて、前記対象とする案件についての結論を予測する、請求項1から5のいずれか一項に記載の情報処理装置である。
【0012】
請求項7の発明は、メモリと一又は複数のプロセッサを備えたコンピュータの前記メモリは、案件のために作成された文書ファイル又は該案件に関して複数のユーザ間でやり取りされたメッセージ群を記憶しており、前記プロセッサに、前記メモリに記憶されている、文書ファイル又はメッセージ群から対象とする案件について情報を抽出し、予め機械学習により案件毎の文書ファイル又はメッセージ群内の情報に対応した該案件の結論を予測することを学習した人工知能によって、抽出した前記情報から、前記対象とする案件についての結論を予測する、処理を実行させるための情報処理プログラムである。
【発明の効果】
【0013】
請求項1の情報処理装置によれば、案件の成約可否等の結論を予測する場合に、案件のために作成された文書ファイル又はその案件に関して複数のユーザ間でやり取りされたメッセージ群を用いることができる。
【0014】
請求項2の情報処理装置によれば、一連のやり取りで発生したメッセージ群から、情報を抽出することができる。
【0015】
請求項3の情報処理装置によれば、「いつ」、「どこで」、「誰が」、「何を」、「なぜ」、「どのように」のうち、2つ以上の情報を関連させて、予測することができる。
【0016】
請求項4の情報処理装置によれば、予測の精度を用いて、予測に用いる情報を選択することができる。
【0017】
請求項5の情報処理装置によれば、抽出した情報に関連する第2情報を用いて、予測することができる。
【0018】
請求項6の情報処理装置によれば、抽出した情報を相手に提供した順番又は間隔を用いて、予測することができる。
【0019】
請求項7の情報処理プログラムによれば、案件の成約可否等の結論を予測する場合に、案件のために作成された文書ファイル又はその案件に関して複数のユーザ間でやり取りされたメッセージ群を用いることができる。
【図面の簡単な説明】
【0020】
図1】本実施の形態の構成例についての概念的なモジュール構成図である。
図2】本実施の形態を利用したシステム構成例を示す説明図である。
図3】本実施の形態の構成例についての詳細なモジュール構成図である。
図4】本実施の形態による処理例を示すフローチャートである。
図5】本実施の形態による処理例を示すフローチャートである。
図6】本実施の形態による処理例を示すフローチャートである。
図7】文書ファイル管理テーブルのデータ構造例を示す説明図である。
図8】メッセージ管理テーブルのデータ構造例を示す説明図である。
図9】情報要素抽出設定管理テーブルのデータ構造例を示す説明図である。
図10】本実施の形態による処理例を示す説明図である。
図11】メッセージグループ管理テーブルのデータ構造例を示す説明図である。
図12】本実施の形態による処理例を示すフローチャートである。
図13】予測・結論管理テーブルのデータ構造例を示す説明図である。
図14】文書ファイル順番管理テーブルのデータ構造例を示す説明図である。
図15】相手に提供した文書ファイルの順番、間隔の例を示す説明図である。
図16】情報要素抽出設定管理テーブルのデータ構造例を示す説明図である。
【発明を実施するための形態】
【0021】
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(「ソフトウェア」の解釈として、コンピュータ・プログラムを含む)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(例えば、コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(例えば、データの授受、指示、データ間の参照関係、ログイン等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(「2以上の値」には、もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。また、「A、B、C」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その1つのみを選んでいる場合(例えば、Aのみ)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(「ネットワーク」には、一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(つまり、社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。
【0022】
本実施の形態である情報処理装置100は、案件の成約可否等の結論を予測する処理を行う機能を有している。図1の例に示すように、情報処理装置100は、少なくともプロセッサ105、メモリ110を有しており、それらをつないでデータのやりとりをするためのバス198により構成されている。この他に、情報処理装置100は、出力装置185、受付装置190、通信装置195を有していてもよい。そして、バス198を介して、プロセッサ105、メモリ110、出力装置185、受付装置190、通信装置195の間でデータのやりとりが行われる。
【0023】
なお、図1の例に示すブロック図は、本実施の形態を実現するコンピュータのハードウェア構成例をも示している。本実施の形態としてのプログラムが実行されるコンピュータのハードウェア構成は、図1に例示するようなコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなり得るコンピュータ等である。具体例として、処理部としてプロセッサ105を用い、記憶装置としてメモリ110を用いている。
【0024】
プロセッサ105は、1つであってもよいし、複数あってもよい。プロセッサ105として、例えば、CPU(Central Processing Unitの略)、マイクロプロセッサ等を含む。複数のプロセッサ105を用いる場合は、密結合マルチプロセッサ、疎結合マルチプロセッサのいずれの形態であってもよい。例えば、1つのプロセッサ105内に複数のプロセッサ・コアが搭載されていてもよい。さらに、複数のコンピュータを通信路で結んで仮想的に一台のコンピュータのように振る舞わせるシステムとしてもよい。具体例として、疎結合マルチプロセッサであって、クラスタシステム、コンピュータクラスタとして構成してもよい。プロセッサ105は、プログラムメモリ120内のプログラムを実行する。
【0025】
メモリ110として、例えば、レジスタやキャッシュメモリ等のプロセッサ105内部の半導体メモリを含めてもよいし、RAM(Random Access Memoryの略)やROM(Read Only Memoryの略)等によって構成される主記憶装置であるメインメモリであってもよいし、永続性記憶装置としての機能を有するHDD(Hard Disk Driveの略)やSSD(Solid State Driveの略)の内部記憶装置、CD、DVD、Blu-ray(登録商標) Disc、USBメモリ、メモリーカード等の外部記憶装置又は補助記憶装置であってもよいし、また、通信回線を介して接続されたサーバー等の記憶装置を含めてもよい。
メモリ110は、主にプログラムを記憶するプログラムメモリ120と主にデータを記憶するデータメモリ115を有している。なお、プログラムメモリ120、データメモリ115には、図示しているモジュールのプログラムの他、本コンピュータを起動するためのOS等のプログラム、モジュールの実行において適宜変化するパラメータ等のデータが格納されていてもよい。
【0026】
出力装置185は、例えば、表示装置187、印刷装置189等を有している。液晶ディスプレイ、有機ELディスプレイ、3次元ディスプレイ等の表示装置187は、プロセッサ105による処理結果、データメモリ115内のデータ等を、テキストやイメージ情報等として表示する。プリンタ、複合機等の印刷装置189は、プロセッサ105による処理結果、データメモリ115内のデータ等を印刷する。また、出力装置185として、スピーカー、機器を振動させるアクチュエータ等を含んでいてもよい。
受付装置190は、例えば、指示受付装置192、文書ファイル読取装置194等を有している。キーボード、マウス、マイク、カメラ(視線検知カメラ等を含む)等の指示受付装置192は、これらに対する利用者の操作(動作、音声、視線等を含む)に基づいたデータを受け付ける。
また、タッチスクリーンのように、表示装置187と指示受付装置192の両方の機能を備えているものがあってもよい。その場合、キーボードの機能の実現について、物理的なキーが存在しなくても、タッチスクリーン上にソフトウエアでキーボード(いわゆるソフトウェアキーボード、スクリーンキーボード等ともいわれる)を描画して、キーボードの機能を実現するようにしてもよい。
なお、ユーザーインタフェースとして、主に、表示装置187、指示受付装置192が用いられる。
スキャナ、カメラ等の文書ファイル読取装置194は、文書を読み取り又は撮影して、発生する画像データを文書ファイルとして受け付ける。
通信装置195は、通信回線を介して他の装置と接続するためのネットワークカード等の通信回線インタフェースである。
【0027】
本実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のプログラムメモリ120にソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、本実施の形態が実現される。
なお、図1に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図1に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、プロセッサ105として、GPU(Graphics Processing Unitの略、GPGPU(General-Purpose computing on Graphics Processing Unitsの略)を含む)を用いてもよいし、一部のモジュールの実行を専用のハードウェア(例えば特定用途向け集積回路(具体例として、ASIC(Application Specific Integrated Circuitの略)等がある)や再構成可能な集積回路(具体例として、FPGA(Field-Programmable Gate Arrayの略)等がある)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図1に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等に組み込まれていてもよい。
【0028】
プロセッサ105は、バス198を介してメモリ110、出力装置185、受付装置190、通信装置195と接続されている。プロセッサ105は、プログラムメモリ120内のプログラムである各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する。例えば、指示受付装置192によってユーザの操作を受け付けたことを契機として、プログラムメモリ120内のその操作に対応するモジュールによる処理を実行し、その処理結果をデータメモリ115に記憶させたり、表示装置187に出力したり、通信装置195を制御して他の装置に送信したりする。
【0029】
メモリ110は、データメモリ115、プログラムメモリ120を有しており、バス198を介してプロセッサ105、出力装置185、受付装置190、通信装置195と接続されている。
データメモリ115には、文書ファイル記憶領域125、メッセージ記憶領域130がある。
文書ファイル記憶領域125は、案件のために作成された文書ファイルを記憶している。記憶している文書ファイルには、文書ファイルそのものの他に、後述するメタ情報を含んでいてもよい。
ここで「案件」とは、処理されるべき事柄であって、提案または申請をする者と、それに対して結論を出す者とを含む複数人がかかわるものである。例えば、提案をする者の例として営業担当者とそれに対して結論を出す者の例として顧客がいる。また、案件には最終的な結論がある。結論として、成約の可否、成功・不成功、許可・不許可、合格・不合格等がある。
また、案件は、前述の結論が発生する可能性のあるひとかたまりの活動として把握してもよい。例えば、コラボレーションツールのコミュニケーションにあって、複数人のグループ(部屋とも言われる)を作って、ひとかたまりの活動を行うことが多い。本実施の形態の説明の例示では、案件に対してコラボレーションツールの部屋などのなんらかの単位が対応する事を前提とする。
【0030】
メッセージ記憶領域130は、案件に関して複数のユーザ間でやり取りされたメッセージ群を記憶している。記憶しているメッセージには、メッセージそのものの他に、後述するメタ情報を含んでいてもよい。
なお、ここでの「案件に関して複数のユーザでやり取りされた」とは、案件にかかわるすべての人でのやり取りは必須ではなく、一部の複数人のユーザでのやり取りでよい。
【0031】
文書ファイル記憶領域125又はメッセージ記憶領域130に記憶されている「文書ファイル又はメッセージ群」は、情報抽出モジュール135によって文字列が抽出される対象である。「文書ファイル又はメッセージ群」は、文書ファイルの内容である文字列、メッセージの内容である文字列の他に、文書ファイル又はメッセージ群に付加されているメタ情報を含むようにしてもよい。ここでメタ情報とは、文書ファイル又はメッセージ群の内容以外の情報であるが、文書ファイル又はメッセージ群を構成するのに必要な情報をいう。例えば、文書ファイルのメタ情報として、ファイル名、登録日時、作成者等があり、メッセージ群のメタ情報として、メッセージ送信日時、送信者、受信者、メッセージの文字数、メッセージに添付されている文書ファイルの内容、その添付された文書ファイルのメタ情報等がある。
【0032】
プログラムメモリ120は、情報抽出モジュール135、学習モデルモジュール140、機械学習モジュール145を記憶している。
情報抽出モジュール135は、データメモリ115に記憶されている、文書ファイル又はメッセージ群から対象とする案件について情報を抽出する。抽出方法として、例えば、予め定められたルールを用いて抽出すればよい。また、1つの情報を抽出するのに、複数のルールを用いて抽出するようにしてもよい。
また、情報抽出モジュール135は、メッセージ記憶領域130に記憶されているメッセージ群を、一連のやり取りに分割してから、その一連のやり取りごとに情報を抽出するようにしてもよい。
ここで「一連のやり取り」とは、複数人の間で、あるテーマについて行われたメッセージの最初から最後までのやり取りである。例えば、メッセージのやり取りに予め定められた期間以上の空き(具体的には、メッセージの送受信が行われなかった期間)が生じた場合は、一連のやり取りが終了したとしてもよい。また、予め定められたキーワードがあった場合に、最初と最後を判断するようにしてもよい。例えば、「まず、~について議論します。」の文字列があった場合にやり取りの最初と判断し、「終了します。」の文字列があった場合にやり取りの最後と判断して、その間のメッセージ群を「一連のやり取り」としてもよい。
【0033】
さらに、情報抽出モジュール135は、一連のやり取りから抽出する情報として、「いつ」、「どこで」、「誰が」、「何を」、「なぜ」、「どのように」のうち、2つ以上の情報を関連させて、学習モデルモジュール140に入力し、予測を行わせるようにしてもよい。
「いつ」、「どこで」、「誰が」、「何を」、「なぜ」、「どのように」は、いわゆる5W1H(When(いつ)、Where(どこで)、Who(誰が)、What(何を)、Why(なぜ)、How(どのように))であり、形態素解析等の言語処理を行って抽出すればよい。
また、もちろんのことながら、人工知能の学習において、「いつ」、「どこで」、「誰が」、「何を」、「なぜ」、「どのように」のうち、2つ以上の情報を関連させた教師データを用いて学習を行っている。
【0034】
また、情報抽出モジュール135は、複数の異なるルールに従って、複数の異なる種別の情報を抽出し、抽出したそれぞれの種別の情報に対応する予測の精度を用いて、学習モデルモジュール140の入力に用いる情報の種別を選択するようにしてもよい。
案件について、最終的に確定した結論に達した場合は、抽出した情報とその結論を対応付けて記憶する。例えば、成約の結論に達した場合に多く抽出された情報Aと、成約の結論に達した場合と非成約の結論に達した場合のともに多く抽出された情報Bがある場合、情報Aについては予測精度が情報Bよりも高くなるように設定する。この場合、情報Aを選択して人工知能での予測に用いるようにする。
【0035】
また、情報抽出モジュール135は、抽出した情報に関連する第2情報を外部の情報処理装置から取得するようにしてもよい。そして、抽出した情報と第2情報を関連付けて、学習モデルモジュール140に入力するようにしてもよい。
ここで「外部の情報処理装置から取得する第2情報」として、例えば、相手である顧客の規模を示す情報等がある。顧客の規模を示す情報として、例えば、資本金額、社員数等がある。また、案件のフェーズ等を用いるようにしてもよいし、担当者の顧客へのコンタクト数等を用いるようにしてもよい。
【0036】
また、情報抽出モジュール135は、抽出した情報を相手に提供した順番又は間隔を抽出するようにしてもよい。そして、抽出した情報と順番又は間隔を関連付けて、学習モデルモジュール140に入力するようにしてもよい。
例えば、提供する順番が定められている場合に、一般的には最終段階で提供される情報が最初の段階で提供されたときは、成約の可能性が高くなる傾向がある。また、提供した間隔が長い場合は、短い場合に較べて、成約の可能性が低くなる傾向がある。そのために、情報と前記順番又は間隔を関連付けて、人工知能を用いるようにしている。
また、もちろんのことながら、人工知能の学習において、情報とその情報を提供した順番又は期間を関連させた教師データを用いて学習を行っている。
【0037】
学習モデルモジュール140は、情報抽出モジュール135が抽出した情報から、対象とする案件についての結論を予測する。学習モデルモジュール140は、予め機械学習により案件毎の文書ファイル又はメッセージ群内の情報に対応したその案件の結論を予測することを学習したモデルである。なお、「結論」は、「成約する」、「成約しない」のように2値としてもよいし、成約する割合を示す成約見込み度としてもよい。もちろんのことながら、成約しない割合を示す不成約見込み度としてもよい。
また、学習モデルモジュール140は、情報抽出モジュール135が抽出した情報と第2情報を関連付けて入力し、対象とする案件についての結論を予測するようにしてもよい。
また、学習モデルモジュール140は、情報抽出モジュール135が抽出した情報と順番又は間隔を関連付けて入力し、対象とする案件についての結論を予測するようにしてもよい。
【0038】
機械学習モジュール145は、予め機械学習により案件毎の文書ファイル又はメッセージ群内の情報に対応したその案件の結論を予測することを学習し、学習モデルモジュール140を生成する。例えば、結論が定まった過去の案件について、その案件のために作成された文書ファイル又はその案件に関して複数のユーザ間でやり取りされたメッセージ群とその案件における結論を組にした教師データを用いた機械学習によって、学習モデルモジュール140を生成する。機械学習は、データの集合から、未知のデータをあらかじめ定義されたいくつかのカテゴリに分類するモデルを自動的に学習する手法であり、例えば、決定木、Naive Bayes モデル、決定リスト、サポートベクターマシン、最大エントロピー法、条件付き確率場、畳み込みニューラルネットワーク、再起型ニューラルネットワーク等の機械学習方法を用いればよい。
機械学習モジュール145によって生成された学習モデルモジュール140は、目的とする結果を複数の要因となる情報から予測することになる。ここでは、目的とする結果は、案件の結果である。さらに、機械学習モジュール145は、案件の結果の実績と照らし合わせて、予測精度を改善する機械学習を行うようにしてもよい。
【0039】
図2は、本実施の形態を利用したシステム構成例を示す説明図である。
情報処理装置100、ユーザ端末210A、ユーザ端末210B、勤怠管理システム250、顧客情報管理システム260、営業支援システム270は、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、情報処理装置100による機能は、クラウドサービスとして実現してもよい。
【0040】
例えば、営業担当のユーザは、ユーザ端末210を用いて、ある案件について、顧客に対して提出する文書ファイルを作成する。また、そのユーザは、その案件の成約のために、顧客、上司、同僚等とメッセージのやり取りを行う。例えば、コラボレーションツールを用いて、メッセージのやり取りが行われ、文書ファイルの蓄積が行われる。
そして、そのユーザ又は上司が、その案件が成約できるか否かを予測したい場合に、情報処理装置100を用いる。
なお、ファイル管理型のコラボレーションツールでは、文書ファイルが対象となる。また、チャット型のコラボレーションツールでは、メッセージ及びメッセージに添付された文書ファイルが対象となる。また、コラボレーションツールの他に、掲示板システム、SNS(Social Networking Serviceの略)におけるメッセージ機能を用いるようにしてもよい。
【0041】
情報処理装置100は、対象となっている案件のために作成された文書ファイル又はメッセージ群から、予め定められたルールにしたがって情報を抽出し、機械学習を行った人工知能によって、その案件が成約できるか否かの予測を行って、その予測結果を依頼者であるユーザ又は上司に提示する。なお、機械学習は、過去に結論が出ている案件について、その結論、案件のために作成された文書ファイル又はメッセージ群から、前述のルールにしたがって抽出した情報の組を教師データとして用いている。
なお、ユーザは、この予測を行うにあたって、新たな情報の入力を要請されるものではない。つまり、案件に関して作成された文書ファイル、その案件に関してやり取りされたメッセージを用いて予測が行われており、予測にために改めて入力を行う必要はない。
【0042】
図3は、本実施の形態の構成例についての詳細なモジュール構成図である。
情報処理装置300は、情報抽出モジュール335、成約見込み度予測学習モデルモジュール340を有している。
情報抽出モジュール335は、メッセージ群作成モジュール302、情報要素抽出モジュール304、情報要素発生頻度算出モジュール306、他システム連携モジュール308、情報要素絞込みモジュール310を有している。
メッセージ群作成モジュール302は、情報要素抽出モジュール304、文書ファイルDB325、メッセージDB330と接続されている。
情報要素抽出モジュール304は、メッセージ群作成モジュール302、情報要素発生頻度算出モジュール306、情報要素絞込みモジュール310と接続されている。
情報要素発生頻度算出モジュール306は、情報要素抽出モジュール304、成約見込み度予測学習モデルモジュール340と接続されている。
他システム連携モジュール308は、情報要素絞込みモジュール310、勤怠管理システム250、顧客情報管理システム260、営業支援システム270、案件成否情報392と接続されている。
情報要素絞込みモジュール310は、情報要素抽出モジュール304、他システム連携モジュール308、成約見込み度予測学習モデルモジュール340と接続されている。
文書ファイルDB325は、メッセージ群作成モジュール302と接続されている。
メッセージDB330は、メッセージ群作成モジュール302と接続されている。
成約見込み度予測学習モデルモジュール340は、情報要素発生頻度算出モジュール306、情報要素絞込みモジュール310、ユーザ390、案件成否情報392と接続されている。
勤怠管理システム250、顧客情報管理システム260、営業支援システム270は、他システム連携モジュール308と接続されている。
【0043】
情報抽出モジュール335は、情報処理装置100の情報抽出モジュール135に該当し、成約見込み度予測学習モデルモジュール340は、情報処理装置100の学習モデルモジュール140と機械学習モジュール145に該当し、文書ファイルDB325は、情報処理装置100の文書ファイル記憶領域125に該当し、メッセージDB330は、情報処理装置100のメッセージ記憶領域130に該当する。
【0044】
案件成否情報392は、案件が成約したか否かを示す情報である。情報処理装置300は、例えば、ユーザ390による手動入力、又は、情報要素抽出モジュール304によって、案件成否情報392を取得する。
メッセージ群作成モジュール302は、メッセージDB330内のメッセージに対して、案件に関係する1つのやり取りに関する複数メッセージをメッセージ群としてまとめる。
【0045】
情報要素抽出モジュール304は、メッセージDB330と文書ファイルDB325からメッセージと文書ファイル(メッセージの添付文書ファイルを含む)から情報要素を抽出する。情報要素とは、対象となるメッセージまたは文書ファイルから予め定められたルールに従って抽出された情報の要素である。ここでは、案件の結論に関係する可能性がある情報要素を抽出するためのルールが予め定められている。また、複数のルールに従って、複数の異なる種別の情報要素(以下、情報要素種別)が抽出される。なお、1つの情報要素種別の情報要素を抽出するのに複数のルールが定められていてもよい。
情報要素絞込みモジュール310は、成約見込み度の予測をより精度よく行えるように、成約見込み度予測学習モデルモジュール340に渡す情報要素の絞り込みを行う。なお、情報要素絞込みモジュール310は、必須の構成ではなく、情報要素抽出モジュール304が抽出した情報要素を直接に成約見込み度予測学習モデルモジュール340に渡してもよい。
【0046】
情報要素発生頻度算出モジュール306は、情報要素の発生時刻情報と、情報要素の種別情報を利用して情報要素の発生頻度を算出する。なお、情報要素発生頻度算出モジュール306は、必須の構成ではなく、成約見込み度予測学習モデルモジュール340は、情報要素の発生頻度を用いずに、予測を行うようにしてもよい。
成約見込み度予測学習モデルモジュール340は、情報要素抽出モジュール304が抽出した情報要素から案件成約見込み度を予測する。さらに、情報要素絞込みモジュール310が絞り込んだ情報要素を用いるようにしてもよいし、情報要素発生頻度算出モジュール306が算出した情報要素の発生頻度を用いて予測するようにしてもよい。
また、成約見込み度予測学習モデルモジュール340は、案件成否情報392を用いて、更なる機械学習をし、予測精度を改善する。
【0047】
文書DB325は、コラボレーションツールでやり取りされる文書ファイルを蓄積する。
メッセージDB330は、コラボレーションツールでやり取りされるメッセージを蓄積する。
【0048】
他システム連携モジュール308は、他システム(勤怠管理システム250、顧客情報管理システム260、営業支援システム270)と連携して、情報要素を取得する。
他システムとして、例えば、案件の成否等を記録する基幹システムである営業支援システム270、営業担当者の勤怠情報を記録する勤怠管理システム250、顧客の情報を管理する顧客情報管理システム260等がある。顧客情報管理システム260として、例えば、CRM(Customer Relationship Managementの略)システムがある。営業支援システム270として、例えば、SFA(Sales Force Automationの略)システムがある。
他システムに項目化されて管理・記録されている情報要素を加味する例として、下記がある。
・新たに追加する情報要素の例
[顧客の規模]の情報要素は、文書ファイル又はメッセージからは得られなくとも、CRMシステム等の他システムから得られることもある。
・代替する情報要素の例
[案件のフェーズ]の情報要素は、文書ファイル又はメッセージから得られると同時にSFAシステムで管理されていて、SFAシステムから取得した場合のほうが正確な情報である場合がある。この場合は、文書ファイル又はメッセージから抽出せずに、SFAシステムの情報を利用することができる。
・付加による精度向上の例
[顧客とのコンタクト数]の情報要素について、文書ファイル又はメッセージから得られる内容に加えて、勤怠管理システム250から外出の情報を取得すれば、外出した日程を特定してより精度の高いコンタクト数を算出することができる。
また、CRMシステムでは立ち寄りレベルの訪問を記録しない状況であったとしても、文書ファイル又はメッセージから抽出したコンタクト数を採用することで、より精度高くコンタクト数を取り出すことができる。
【0049】
図4は、本実施の形態(主に、情報抽出モジュール135)による処理例を示すフローチャートである。対象としている案件について、このフローチャートによる処理を行う。
ステップS402では、情報要素抽出設定を読み込む。例えば、情報要素抽出設定管理テーブル900を読み込む。図9は、情報要素抽出設定管理テーブル900のデータ構造例を示す説明図である。情報要素抽出設定管理テーブル900は、情報要素種別欄905、検索単語欄910、抽出ルール欄915を有している。情報要素種別欄905は、情報要素の種別を記憶している。検索単語欄910は、その情報要素の種別を抽出するための検索用の単語を記憶している。例えば、文書ファイル若しくはメッセージのタイトル、又は、文書ファイル若しくはメッセージの全文を対象とした検索を行う場合の検索用の単語である。抽出ルール欄915は、その情報要素の種別を抽出するルールを記憶している。例えば、情報要素抽出設定管理テーブル900の1行目は、情報要素種別「訪問回数」は、検索単語が「訪問」、抽出ルールが「訪問回数.+(¥d+)」であることを示しており、2行目は、情報要素種別「競合情報」は、検索単語が「競合」、抽出ルールが「競合製品名[(.+)]」であることを示している。なお、抽出ルールとして、正規表現を用いている。前述の「訪問回数.+(¥d+)」は、「訪問回数」の後に任意の文字が1回以上繰り返され、その後の1文字以上の数字を検索することを意味している。例えば、「訪問回数 5」等の文字列が該当し、「5」を情報要素種別「訪問回数」の情報要素として抽出することになる。
【0050】
ステップS404では、未処理の設定があるか否かを判断し、ある場合はステップS406へ進み、それ以外の場合は処理を終了する(ステップS499)。
ステップS406では、未処理の設定を1つ取得し、検索単語、抽出ルール(正規表現)を読み込む。前述の情報要素抽出設定管理テーブル900の検索単語欄910、抽出ルール欄915が該当する。
【0051】
ステップS408では、検索単語で前回処理時刻以降に登録された文書ファイルを検索し、一致する文書ファイルを得る。
ステップS410では、未処理の文書ファイルがあるか否かを判断し、ある場合はステップS412へ進み、それ以外の場合はステップS404へ戻る。
【0052】
ステップS412では、未処理の文書ファイルを1つ取り出し、抽出ルールを適用し、情報要素を抽出する。
ステップS414では、後の処理で使うために、対象としている案件と情報要素を一時的に記憶し、ステップS410へ戻る。つまり、案件毎に、抽出した情報要素を記憶しておく。この記憶された情報要素は、その案件の成約可否の予測に用いられる。
【0053】
なお、図4の例に示したフローチャートでは、文書ファイルから情報要素を抽出する処理例を示しているが、メッセージから情報要素を抽出する処理例も同様に行うことができる。つまり、図4の例に示したフローチャート内の「文書ファイル」を「メッセージ」と読み替えればよい。
【0054】
図5は、本実施の形態(主に、機械学習モジュール145)による処理例を示すフローチャートである。
ステップS502では、案件の成否情報を読み込む。つまり、過去の成否が確定している案件について、その成否情報を読み込む。
ステップS504では、案件の成否情報と対応する案件の情報要素を入力して、学習を行う。つまり、案件の成否情報と対応する案件の情報要素の組を教師データとした学習を行う。もちろんのことながら、対象としている案件について、図4の例に示したフローチャートによって、情報要素を抽出すればよい。
【0055】
図6は、本実施の形態(主に、学習モデルモジュール140)による処理例を示すフローチャートである。
ステップS602では、案件の成否情報を読み込む。
ステップS604では、案件の成否情報と対応しなかった案件の情報要素を入力して、案件の成約見込み度を予測する。ここでの「案件の成否情報と対応しなかった案件」とは、成否が確定していない案件のことである。
なお、ステップS602の処理を「結果を予測したい案件を受け付ける。」とし、ステップS604の処理を「その案件の情報要素を入力して、案件の成約見込み度を予測する。」としてもよい。
ステップS606では、案件と成約見込み度のリストを出力する。
【0056】
対象とする文書ファイルは、例えば、文書ファイル管理テーブル700によって管理されている。図7は、文書ファイル管理テーブル700のデータ構造例を示す説明図である。文書ファイル管理テーブル700は、文書ファイルID欄705、文書ファイル名欄710、メッセージID欄715、コンテント欄720を有している。文書ファイルID欄705は、本実施の形態において、文書ファイルを一意に識別するための情報(具体的には文書ファイルID:IDentificationの略)を記憶している。文書ファイル名欄710は、その文書ファイルの名称を記憶している。メッセージID欄715は、本実施の形態において、メッセージを一意に識別するための情報(具体的にはメッセージID)を記憶している。例えば、その文書ファイルが添付されていたメッセージIDを記憶している。コンテント欄720は、その文書ファイルのコンテント(内容)を記憶している。
例えば、文書ファイル管理テーブル700の1行目は、文書ファイルID「文書ファイルa」は、文書ファイル名が「スケジュール案」、メッセージIDが「100」、コンテントが「2012年度の特許検討のスケジュールは、…」であることを示しており、2行目は、文書ID「文書ファイルb」は、文書ファイル名が「質問票」、メッセージIDが「100」、コンテントが「質問その1…」であることを示している。文書ファイルa、文書ファイルbは、ともに、メッセージID:100に添付されていた文書ファイルである。
この文書ファイル管理テーブル700では、メッセージID欄715の値「100」からメッセージ管理テーブル800のメッセージID欄805の値が「100」である行の案件ID欄825を参照して、文書ファイルがどの案件に対応付いているかを抽出することができるようになる。また、文書ファイル管理テーブル700に案件ID欄を設けて、文書ファイル毎に案件を対応付けるようにしてもよい。
【0057】
対象とするメッセージは、例えば、メッセージ管理テーブル800によって管理されている。図8は、メッセージ管理テーブル800のデータ構造例を示す説明図である。メッセージ管理テーブル800は、メッセージID欄805、メッセージ欄810、投稿者欄815、作成日欄820、案件ID欄825を有している。メッセージID欄805は、メッセージIDを記憶している。メッセージ欄810は、そのメッセージの内容を記憶している。投稿者欄815は、そのメッセージの投稿者を記憶している。作成日欄820は、そのメッセージの作成日(時分等を含めてもよい)を記憶している。案件ID欄825は、本実施の形態において、案件を一意に識別するための情報(具体的には、案件ID)を記憶している。
例えば、メッセージ管理テーブル800の1行目は、メッセージID「100」は、メッセージが「XX様に提案書を説明してきました。その場で…」、投稿者が「ユーザA」、作成日が「2019/10/10」、案件IDが「案件A」であることを示しており、2行目は、メッセージID「101」は、メッセージが「持ち帰りになっていた質問の件ですが、確認を行い…」、投稿者が「ユーザB」、作成日が「2019/11/20」、案件IDが「案件A」であることを示している。
【0058】
図10は、本実施の形態による処理例を示す説明図である。例えば、コラボレーションツールのコミュニケーションツールでは、ある1つの案件についてのメッセージのやり取りについてメッセージ表示画面1000のような表示を行う。
メッセージ表示画面1000には、タイトル欄1005、投稿者欄1010、日時欄1015、添付文書ファイル欄1020を表示する。タイトル欄1005には、メッセージのタイトルを表示し、投稿者欄1010には、そのメッセージの投稿者を表示し、日時欄1015には、投稿された日時を表示し、添付文書ファイル欄1020には、添付文書ファイルの有無を表す情報を表示する。
例えば、メッセージ表示画面1000の1行目は、タイトル「顧客訪問:10/1の報告です。」は、投稿者が「A」、日時が「2020/10/1 15:00」、添付文書ファイルが「無」であることを示しており、2行目は、タイトル「お客様に紹介した資料です。(添付ファイル)」は、投稿者が「A」、日時が「2020/10/1 15:02」、添付文書ファイルが「有」であることを示しており、3行目は、タイトル「受け取りました。」は、投稿者が「B」、日時が「2020/10/1 16:00」、添付文書ファイルが「無」であることを示しており、4行目は、タイトル「コメントです。」は、投稿者が「B」、日時が「2020/10/1 16:10」、添付文書ファイルが「無」であることを示しており、5行目は、タイトル「提案書を作成しました。(添付ファイル)」は、投稿者が「A」、日時が「2020/10/2 10:00」、添付文書ファイルが「有」であることを示しており、6行目は、タイトル「参考資料です。(添付ファイル)」は、投稿者が「C」、日時が「2020/10/2 10:30」、添付文書ファイルが「有」であることを示しており、7行目は、タイトル「修正しました。(添付ファイル)」は、投稿者が「A」、日時が「2020/10/2 11:15」、添付文書ファイルが「有」であることを示している。
【0059】
図10の例に示すようなメッセージのやり取りが行われた場合、これらのメッセージ群を、一連のやり取りに分割する。その分割結果を、例えば、メッセージグループ管理テーブル1100のように管理する。
図11は、メッセージグループ管理テーブル1100のデータ構造例を示す説明図である。メッセージグループ管理テーブル1100は、グループID欄1105a、グループID欄1105bを有している。各グループID欄1105には、メッセージID欄1110、添付文書ファイル欄1115がある。
メッセージグループ1には、メッセージ1~4があり、メッセージ2には添付文書ファイルがあることを示している。
メッセージグループ2には、メッセージ5~7があり、メッセージ5、メッセージ6、メッセージ7には添付文書ファイルがあることを示している。
なお、メッセージnは、図10の例で示したメッセージ表示画面1000の行に対応している。
【0060】
この例では、ある1つの案件に関わって投稿された複数のメッセージを、メッセージの投稿日時にしたがって、メッセージグループ1とメッセージグループ2に分割している。
例えば、チャット型のコラボレーションツールでは、1つの話題についての一連のやり取りが行われることがある。その一連のやり取りは、複数のメッセージ及びそのメッセージに添付された文書ファイルによって構成される。この例では、連続して投稿されているメッセージは同じ話題に属すると判断して、直前のメッセージから予め定められた時間以内にメッセージが投稿された場合は、その2つのメッセージは同じグループであるとして、複数メッセージをグループ化する。図11の例では、予め定められた時間を1時間として、グループ化を行っている。具体的には、メッセージ1~4は、それぞれ1時間以内に投稿されており、メッセージ5~7も、それぞれ1時間以内に投稿されており、メッセージ4とメッセージ5の間は、1時間より長い間隔があいていることから、図11の例に示すようなグループ化が行われている。
このようにすることで、例えば「顧客訪問:10/1の報告です。」「お客様に紹介した資料です。(添付ファイル)」といったようなメッセージが投稿されていた場合、事例紹介資料の添付ファイルには訪問日時が記載されていなくても、同じグループに属する直前のメッセージから10/1の訪問で展開した資料であることを抽出できるようになる。つまり、情報要素抽出設定管理テーブル900を用いて、文書ファイルから情報要素を抽出できなかった場合は、その文書ファイルに対応するメッセージが含まれている一連のやり取りのメッセージ群(グループ化されたうちの1つのメッセージ群)を対象として、その情報要素を抽出するようにしてもよい。
【0061】
図12は、本実施の形態による処理例を示すフローチャートである。
ステップS1202では、メッセージ群をグループに分割する。
ステップS1204では、グループ内のメッセージに対して、言語処理を行い、5W1Hの情報要素を抽出する。なお、5W1Hの全てを用いずに、これらのうち2つ以上を抽出すればよい。
【0062】
ステップS1206では、成約見込み度予測学習モデルモジュール340に入力する。その際に、ステップS1204で抽出した5W1Hを関連させて、成約見込み度予測学習モデルモジュール340に入力する。
ステップS1208では、成約見込み度予測学習モデルモジュール340による予測を行う。
ステップS1210では、予測結果を出力する。
【0063】
なお、機械学習にあっても、同様に、ステップS1202からステップS1206までの処理を行った後に、5W1Hの情報要素と結論を組にした教師データによって機械学習を行う。
【0064】
抽出した情報要素に対応する予測の精度を用いて、学習モデルモジュール140に入力する情報要素を選択する例を説明する。情報要素絞込みモジュール310による絞り込み処理の例を示すものである。
図13は、予測・結論管理テーブル1300のデータ構造例を示す説明図である。予測・結論管理テーブル1300は、入力した情報要素欄1305、予測結果欄1310、結論欄1315を有している。入力した情報要素欄1305は、学習モデルモジュール140に入力した情報要素を記憶している。予測結果欄1310は、その場合の学習モデルモジュール140による予測結果を記憶している。結論欄1315は、その案件の実際の結論を記憶している。
例えば、予測・結論管理テーブル1300の1行目は、入力した情報要素「情報要素A,C,D,E」の予測結果は「成約」、結論は「成約」であることを示しており、2行目は、入力した情報要素「情報要素A,F,G,H」の予測結果は「成約」、結論は「成約」であることを示しており、3行目は、入力した情報要素「情報要素B,C,G,H」の予測結果は「成約」、結論は「非成約」であることを示しており、4行目は、入力した情報要素「情報要素B,F,D,E」の予測結果は「成約」、結論は「非成約」であることを示している。なお、ここで、異なるアルファベットの情報要素は、それぞれ異なる情報要素種別の情報要素である。
【0065】
学習モデルモジュール140による予測結果が、実際の結論と異なった場合(例えば、予測結果が成約であるが、結論が非成約である場合、逆に、予測結果が非成約であるが、結論が成約である場合)の案件を収集し、それらの案件で予測に用いた情報要素の内、共通に用いられている情報要素を用いないようにする。図13の例では、3行目と4行目に共通に用いられている情報要素Bが該当し、次回からの予測には情報要素Bに対応する情報要素種別を用いないようにする。なお、「情報要素」は、例えば「顧客とのコンタクト数」における「5(回)」という値のことであり、ここでの絞り込みは、その値を用いない(5は用いない)ということではなく、「顧客とのコンタクト数」自体が成否に寄与しないから用いない、ということである。
また、学習モデルモジュール140による予測結果が、実際の結論と合致した場合(例えば、予測結果が成約であり、結論も成約である場合、逆に、予測結果が非成約であり、結論も非成約である場合)は、それらの案件で予測に用いた情報要素の内、共通に用いられている情報要素に対応する情報要素種別は削除しないようにする。図13の例では、1行目と2行目に共通に用いられている情報要素Aが該当し、次回からの予測には情報要素Aを削除しないようにする。つまり、学習モデルモジュール140による予測結果が、実際の結論と異なった場合に、削除対象となった情報要素であったとしても、学習モデルモジュール140による予測結果が、実際の結論と合致した場合に共通に用いられている情報要素であれば、削除対象とはしない。
【0066】
次に、抽出した情報要素を相手に提供した順番又は間隔を抽出する例を説明する。例えば、顧客から反応が遅いために、提供した文書ファイルの間隔が長くなってしまった場合は、商品に対する興味が低い状態である事が予測される。また、早めに見積書が提出された場合は、商品に対する興味が高い状態である事が予測される。
図14は、文書ファイル順番管理テーブル1400のデータ構造例を示す説明図である。文書ファイル順番管理テーブル1400は、文書ファイルID欄1405、グループID欄1410、グループ内順番欄1415、前間隔欄1420、後間隔欄1425を有している。文書ファイルID欄1405は、文書ファイルIDを記憶している。グループID欄1410は、グループIDを記憶している。グループ内順番欄1415は、グループ内順番を記憶している。前間隔欄1420は、前間隔を記憶している。後間隔欄1425は、後間隔を記憶している。
文書ファイル順番管理テーブル1400は、メッセージをグループ化した後に、そのグループ内のメッセージに添付された文書ファイルの発生した順番、そのグループ内で前後に発生した文書ファイルとの間隔を示している。
例えば、文書ファイル順番管理テーブル1400の1行目は、図15の例に示すように、文書ファイルID「00100」(文書ファイル1520)は、グループID「00070」に属しており、グループ内での発生順が「5」番目、前に発生した文書ファイル1510との間隔(前間隔1515)が「3日」、後に発生した文書ファイル1530との間隔(後間隔1525)が「10日」であることを示している。
そして、その抽出した情報と順番又は間隔を関連付けて、学習モデルモジュール140に入力し、予測を行う。
もちろんのことながら、機械学習においては、同様に情報要素のグループ内における順番又は間隔を抽出し、それらを関連付けて教師データを作成し、機械学習を行えばよい。
なお、文書ファイルを例示したが、メッセージを相手に提供したグループ内の順番又は間隔であってもよい。
【0067】
情報要素抽出設定管理テーブル900の代わりに、情報要素抽出設定管理テーブル1600を用いるようにしてもよい。
図16は、情報要素抽出設定管理テーブル1600のデータ構造例を示す説明図である。情報要素抽出設定管理テーブル1600は、情報要素種別欄1605、抽出元欄1610、抽出ルール欄1615を有している。情報要素種別欄1605は、情報要素種別を記憶している。抽出元欄1610は、抽出元を記憶している。抽出ルール欄1615は、抽出ルールを記憶している。
情報要素抽出設定管理テーブル1600の1行目は、情報要素種別として「顧客とのコンタクト数」としており、抽出元として「日報ファイル」とし、抽出ルールは、「正規表現とのマッチングにより訪問回数又は訪問日を抽出する。例えば、以下の正規表現がある。
・今週の訪問回数:(¥d+)回、
・今月の訪問回数:(¥d+)回、
・訪問日:¥d+/¥d+」としている。
2行目は、情報要素種別として「訪問時に提供した情報種別」としており、抽出元として「顧客に提供した提案書、事例集」とし、抽出ルールは、「情報種別として[提案][事例展開]などを抽出する。ファイル名の正規表現マッチングにより提供情報の種別を判定する。例えば、以下の正規表現がある。
・.*提案書、
・.*事例
また、ファイルを添付したメッセージ及びその前後のメッセージから、訪問日を取得する。」としている。
3行目は、情報要素種別として「訪問時に提供した情報量」としており、抽出元として「顧客に提供した提案書、事例集」とし、抽出ルールは、
「・ページ数により情報量を算出する。
・含むセンテンス数により情報量を算出する。
また、ファイルを添付したメッセージ及びその前後のメッセージから、訪問日を取得する。」としている。
4行目は、情報要素種別として「顧客から得た情報種別」としており、抽出元として「メッセージ、議事メモ、日報ファイル」とし、抽出ルールは、「顧客からの質問、顧客の抱えている課題などの情報種別を抽出する。下記の様なフレーズの辞書を作り、フレーズとのマッチングで情報種別を判定する。・顧客の質問→顧客からの質問、・ヒアリングした課題→顧客の抱えている課題。この様にしてマッチングしたフレーズの前後から情報要素を抽出する。」としている。
5行目は、情報要素種別として「顧客から得た情報量」としており、抽出元として「メッセージ、議事メモ、日報ファイル」とし、抽出ルールは、「含むセンテンス数により情報量を算出する。」としている。
6行目は、情報要素種別として「営業のフェーズ」としており、抽出元として「メッセージ、議事メモ、日報ファイル」とし、抽出ルールは、「営業活動は、その案件の進み具合によってフェーズが存在する。例えば、[問い合わせ][訪問][提案][見積り][契約]などの段階を経る。案件の進み具合によって、報告、コミュニケーションでやり取りされる情報も異なる。そこで、例えば、[問い合わせ]フェーズでよく使われるフレーズ(問い合わせ、製品情報を回答…)の辞書を作り、その単語が多く含まれていれば、[問い合わせ]フェーズであると判定する。」としている。
7行目は、情報要素種別として「コンタクトした相手企業担当者の役職」としており、抽出元として「メッセージ、議事メモ、日報ファイル」とし、抽出ルールは、「役職を表す単語とのマッチングにより役職を抽出する。
例えば、以下の文字列を抽出する。
・主任、
・専務、
・社長」としている。
8行目は、情報要素種別として「競合情報」としており、抽出元として「議事メモ、添付ファイル」とし、抽出ルールは、「顧客から得た他社の情報、類似の製品の情報を抽出する。例えば、
・競合する会社名の辞書、
・競合する製品名の辞書、
・競合製品に言及するフレーズの辞書[競合][他社の][.+社を検討中]を作っておいて、単語のマッチングにより競合情報を抽出する。」としている。
【0068】
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD-R、DVD-RW、DVD-RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD-ROM)、CDレコーダブル(CD-R)、CDリライタブル(CD-RW)等、ブルーレイ・ディスク(Blu-ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digitalの略)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
【符号の説明】
【0069】
100…情報処理装置
105…プロセッサ
110…メモリ
115…データメモリ
120…プログラムメモリ
125…文書ファイル記憶領域
130…メッセージ記憶領域
135…情報抽出モジュール
140…学習モデルモジュール
145…機械学習モジュール
185…出力装置
187…表示装置
189…印刷装置
190…受付装置
192…指示受付装置
194…文書ファイル読取装置
195…通信装置
198…バス
210…ユーザ端末
250…勤怠管理システム
260…顧客情報管理システム
270…営業支援システム
290…通信回線
300…情報処理装置
302…メッセージ群作成モジュール
304…情報要素抽出モジュール
306…情報要素発生頻度算出モジュール
308…他システム連携モジュール
310…情報要素絞込みモジュール
325…文書ファイルDB
330…メッセージDB
335…情報抽出モジュール
340…成約見込み度予測学習モデルモジュール
390…ユーザ
392…案件成否情報
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16