(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-19
(45)【発行日】2023-10-27
(54)【発明の名称】サーバおよびコンピュータプログラム
(51)【国際特許分類】
G06Q 10/06 20230101AFI20231020BHJP
G06F 16/907 20190101ALI20231020BHJP
H04L 51/04 20220101ALI20231020BHJP
H04L 67/00 20220101ALI20231020BHJP
【FI】
G06Q10/06
G06F16/907
H04L51/04
H04L67/00
(21)【出願番号】P 2019155930
(22)【出願日】2019-08-28
【審査請求日】2022-07-13
(73)【特許権者】
【識別番号】000155469
【氏名又は名称】株式会社野村総合研究所
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(74)【代理人】
【識別番号】100076428
【氏名又は名称】大塚 康徳
(74)【代理人】
【識別番号】100115071
【氏名又は名称】大塚 康弘
(74)【代理人】
【識別番号】100112508
【氏名又は名称】高柳 司郎
(74)【代理人】
【識別番号】100116894
【氏名又は名称】木村 秀二
(74)【代理人】
【識別番号】100130409
【氏名又は名称】下山 治
(74)【代理人】
【識別番号】100134175
【氏名又は名称】永川 行光
(74)【代理人】
【識別番号】100199277
【氏名又は名称】西守 有人
(72)【発明者】
【氏名】永島 淳
(72)【発明者】
【氏名】堀 宣男
(72)【発明者】
【氏名】張 韜
(72)【発明者】
【氏名】梅澤 香矢乃
【審査官】宮地 匡人
(56)【参考文献】
【文献】特開2002-014971(JP,A)
【文献】特開2002-312375(JP,A)
【文献】特開2003-167890(JP,A)
【文献】特開2002-351888(JP,A)
【文献】吉澤 政洋,知識共有への抵抗感を低減する相互支援システムの実装および評価,電子情報通信学会技術研究報告LOIS2009-11,2009年07月23日,Vol.109 No.160,pp.11-16
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 16/907
H04L 51/04
H04L 67/00
(57)【特許請求の範囲】
【請求項1】
企業内の情報を保持する情報源から当該情報を、ネットワークを介して取得する手段と、
取得された情報を分析することで、当該情報に関連付けられた人物を、当該情報に付けられたタグに関連付ける手段と、
ネットワークを介してユーザの端末から検索要求を受け付ける手段と、
受け付けた検索要求の検索内容にマッチするタグに関連付けられた人物の情報を含む検索結果を生成する手段と、
ネットワークを介して前記ユーザの端末に、生成された検索結果に含まれる人物との対話を促進するためのインタフェースを提供する手段と、
提供された前記インタフェースを介してなされた対話の内容を取得する手段と、
を備え、
前記生成する手段は、取得された対話の内容を機械学習アルゴリズムを用いて学習することにより生成または更新されるモデルを用いて、別の検索要求に対する検索結果を生成する、
サーバ。
【請求項2】
前記関連付ける手段は、ある分野に対応するタグであって所定のしきい値を超える数の当該タグに関連付けられた人物の専門領域は当該分野であると決定し、
前記生成する手段は、前記検索内容にマッチするタグに対応する専門領域を有する人物を前記検索結果に含める、請求項1に記載のサーバ。
【請求項3】
前記検索結果は、前記検索内容にマッチするタグに関連付けられた文書の情報および対応する人物の情報を含み、
前記生成する手段は、前記ユーザが閲覧権限を有している文書および前記ユーザが閲覧権限を有していない文書を検索の対象とし、
前記提供する手段は、前記検索結果が前記ユーザが閲覧権限を有していない文書の情報を含む場合に、前記検索結果を表示する画面において当該文書の情報を表示するものの、当該文書の内容を前記ユーザに閲覧させない、請求項
1に記載のサーバ。
【請求項4】
前記検索結果を表示する画面は、
前記文書
の情報と
前記人物の情報
とを対応付けて表示し、
前記画面は、表示された人物のなかから、ユーザが対話を行いたい人物を選択可能に構成される
、請求項
3に記載のサーバ。
【請求項5】
ユーザの端末の記録媒体に格納されるコンピュータプログラムであって、前記端末のコンピュータにより実行された場合に、前記端末において、
ネットワークを介してサーバに検索要求を送信する機能と、
送信された検索要求に対する検索結果として、検索要求の検索内容にマッチするタグが付けられた文書
の情報と、当該文書に関連付けられた人物の情報と、を対応付けて表示する画面をディスプレイに表示させる機能と、
前記画面に表示された人物のなかからユーザに選択された人物を、ユーザが対話を行いたい人物として受け付ける機能と、
選択された人物とのネットワークを介した対話のためのインタフェースをディスプレイに表示させる機能と、
表示された前記インタフェースを介してなされた対話の内容を前記サーバに送信して、別の検索要求に対する検索結果を生成する際に用いられるモデルを機械学習アルゴリズムを用いた学習により生成させまたは更新させる機能と、
を実現させ
るコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ナレッジマネジメントを実現するサーバおよびコンピュータプログラムに関する。
【背景技術】
【0002】
普通のビジネスパーソンが捜し物に費やす時間は、年間約150時間程度であると言われている。年間240日勤務(1日8時間)だとすると、捜し物をする時間の割合は、150時間/1920時間=7.8%となる。
【0003】
「平成28年分 民間給与実態統計調査」(国税庁)によると、サラリーマンの平均年収は、約422万円である。ビジネスパーソンを雇用するのに要する金額は年収の2倍と仮定すると、平均年収×2倍=約850万円である。
【0004】
したがって、ビジネスパーソン1人あたりにかかる、捜し物の年間コストは約850万×7.8%=約66万円と見積もられる。社員数が1000人の企業の場合、全社員の捜し物に費やすコストは、約66万円×1000人=約6億6000万円と見積もられる。社員数が5000人の企業の場合、全社員の捜し物に費やすコストは、約66万円×5000人=約33億円と見積もられる。
【0005】
このように、ビジネスパーソンが捜し物に費やすコストは比較的大きく、企業の規模が大きくなるほどそのコストも大きくなる。したがって、効率的に情報を捜せる仕組みが必要である。従来、企業内の情報を検索する仕組みとして企業内検索(エンタープライズサーチ)が知られている。また、文書の検索において、文書にタグ付けすることで検索の効率を高める手法が知られている(例えば、特許文献1参照)
【先行技術文献】
【特許文献】
【0006】
【文献】特開2018-195305号公報
【文献】特開2016-110607号公報
【非特許文献】
【0007】
【文献】https://www.traina.ai/solution/textmining/、2019年6月17日検索
【文献】https://www.traina.ai/solution/smartknowledge/、2019年6月17日検索
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、特許文献1に記載されるような従来の文書検索技術では、検索の対象が文書に限られている。また、エンタープライズサーチには、(1)SEOへの意識が低く、文書への適切なタグ付けが進みにくい、(2)捜し物に対する適切な回答はヒトから得られることが多い、などの特徴がある。
【0009】
本発明はこうした課題に鑑みてなされたものであり、その目的は、効率的に文書およびヒトを一元的に捜せるようにし、ナレッジ共有とコミュニケーションの活性化を促進することができるエンタープライズサーチの提供にある。
【課題を解決するための手段】
【0010】
本発明のある態様は、サーバに関する。このサーバは、企業内の情報を保持する情報源から当該情報を、ネットワークを介して取得する手段と、取得された情報を分析することで、当該情報に関連付けられた人物を、当該情報に付けられたタグに関連付ける手段と、ネットワークを介してユーザの端末から検索要求を受け付ける手段と、受け付けた検索要求の検索内容にマッチするタグに関連付けられた人物の情報を含む検索結果を生成する手段と、ネットワークを介して前記ユーザの端末に、生成された検索結果に含まれる人物との対話を促進するためのインタフェースを提供する手段と、提供された前記インタフェースを介してなされた対話の内容を取得する手段と、を備え、前記生成する手段は、取得された対話の内容を機械学習アルゴリズムを用いて学習することにより生成または更新されるモデルを用いて、別の検索要求に対する検索結果を生成する。
【0011】
なお、以上の構成要素の任意の組み合わせや、本発明の構成要素や表現を装置、方法、システム、コンピュータプログラム、コンピュータプログラムを格納した記録媒体などの間で相互に置換したものもまた、本発明の態様として有効である。
【発明の効果】
【0012】
本発明によれば、エンタープライズサーチにおいて、効率的に文書およびヒトを一元的に捜せるようにし、ナレッジ共有とコミュニケーションの活性化を促進することができる。
【図面の簡単な説明】
【0013】
【
図1】実施の形態に係るナレッジマネジメントシステムを説明するための模式図である。
【
図2】
図1のナレッジマネジメントシステムのシステム構成を示す模式図である。
【
図3】
図1のナレッジデータバンクサーバのハードウエア構成図である。
【
図4】
図1のナレッジデータバンクサーバの機能および構成を示すブロック図である。
【
図5】
図4の文書情報保持部の一例を示すデータ構造図である。
【
図6】
図4の社員情報保持部の一例を示すデータ構造図である。
【
図7】
図1のナレッジデータバンクサーバにおける一連の処理の流れを示すフローチャートである。
【
図8】ユーザの端末のディスプレイに表示される一元検索画面の代表画面図である。
【
図9】
図4の対話内容保持部の一例を示すデータ構造図である。
【
図10】ユーザの端末のディスプレイに表示されるチャットルーム画面の代表画面図である。
【
図11】ユーザの端末のディスプレイに表示される別の一元検索画面の代表画面図である。
【発明を実施するための形態】
【0014】
以下、各図面に示される同一または同等の構成要素、部材、処理には、同一の符号を付するものとし、適宜重複した説明は省略する。また、各図面において説明上重要ではない部材の一部は省略して表示する。
【0015】
図1は、実施の形態に係るナレッジマネジメントシステム2を説明するための模式図である。ナレッジマネジメントシステム2は、エンタープライズサーチにおいて、企業内の文書に付けられたタグと該企業の人物とを直接的にまたは間接的に関連付けることで、タグを介した人物の特定を可能とする。これにより、ナレッジマネジメントシステム2では単に文書を捜せるだけでなく、社内の人物とのナレッジ共有およびコミュニケーションの活性化を促進することができる。
【0016】
ナレッジマネジメントシステム2は、企業のポータルサイトを管理するポータルサイトサーバ4と、該企業のファイルサーバ6と、該企業のメールサーバ8と、該企業の社員基本情報およびアクセス権情報を管理するディレクトリサーバ10と、ナレッジデータバンクサーバ102と、を備える。
【0017】
ナレッジデータバンクサーバ102は、インターネットなどのネットワーク(不図示)を介して、ポータルサイトサーバ4やファイルサーバ6やメールサーバ8やディレクトリサーバ10などの企業内の情報を保持する情報源から、当該情報を自動的に取得する。より具体的には、ナレッジデータバンクサーバ102は、ポータルサイトサーバ4、ファイルサーバ6、メールサーバ8をクローリングし、収集した文書からテキストを抽出する。ナレッジデータバンクサーバ102は、ディレクトリサーバ10から社員基本情報およびアクセス権情報を取得する。
【0018】
ナレッジデータバンクサーバ102は、収集した情報を自動で分析して、タグを付与してナレッジ化する。ナレッジデータバンクサーバ102は、収集した文書の生のテキストを所定の言語処理エンジンに入力することで、文書へのタグ付けを行う。言語処理エンジンは、例えば株式会社野村総合研究所が提供する言語解析エンジン「辯天」およびそれを搭載したテキストデータ分析システム「TRAINAテキストマイニング」を用いて実現されてもよい(非特許文献1参照)。
【0019】
ナレッジデータバンクサーバ102は、文書に登場する人名などの人物を特定する情報をタグとして扱う(以下、人名タグという。人名タグ以外のタグを非人名タグという)。ナレッジデータバンクサーバ102は、人名タグを用いて企業の人物に非人名タグを付与し、また、企業の人物の間のソーシャルグラフを自動生成する。
【0020】
企業内の人物(社員など)であってもよいユーザ12は、自己の端末から、検索キーワードを指定した検索要求をナレッジデータバンクサーバ102に送信する。ナレッジデータバンクサーバ102は検索キーワードからタグを抽出し、抽出されたタグを有する文書、該文書に関連付けられた人物、抽出されたタグを有する人物等を特定する。ナレッジデータバンクサーバ102は、特定された文書および特定された人物の情報を含む検索結果を生成し、ユーザ12の端末に送信する。ユーザ12はその検索結果を通じて、関連するドキュメントや関連する有識者を知ることができる。
【0021】
ユーザ12の端末は、デスクトップPCなどの据え置き型の端末、またはスマートフォン、タブレット端末、ラップトップPCなどの携帯型の端末である。ユーザ12の端末にはナレッジマネジメントシステム2でのエンタープライズサーチを可能とするアプリケーションプログラムがインストールされている。このアプリケーションプログラムがユーザ12の端末により実行されることにより、端末は各種機能を実現する。あるいはまた、ナレッジマネジメントシステム2でのエンタープライズサーチは、ユーザ12の端末のブラウザ機能を用いて提供されてもよい。
【0022】
ユーザ12の端末に送信される検索結果には、検索結果に含まれる人物との対話を促進するためのインタフェースへの動線(リンクやボタンなど)が提供される。ユーザ12が検索結果に含まれる人物との対話を望む場合、ナレッジデータバンクサーバ102は仮想コミュニティ14を実現するインタフェースを生成すると共に、ネットワークを介して当該人物を当該仮想コミュニティに招待する。
【0023】
ナレッジデータバンクサーバ102は仮想コミュニティ14で行われた対話の内容を自動的に取得し、機械学習アルゴリズムに入力する。ナレッジデータバンクサーバ102は、この機械学習の結果を用いて、言語処理エンジンの辞書に、未知語や類似語を自動で登録する。対話内容の自動学習は、例えば株式会社野村総合研究所が提供する「TRAINAスマートナレッジ」を用いて実現されてもよい(非特許文献2参照)。
【0024】
図2は、ナレッジマネジメントシステム2のシステム構成を示す模式図である。ディレクトリサーバ10と、ポータルサイトサーバ4と、ファイルサーバ6と、は社内ネットワーク16内に設けられている。同じ社内ネットワーク16に設けられたクロールサーバ18は、ポータルサイトサーバ4に対してHTTP(S)等を用いてクローリングを行い、ファイルサーバ6に対してCIFS(Common Internet File System)プロトコル等を用いてクローリングを行い、ディレクトリサーバ10からLDAP(Lightweight Directory Access Protocol)等を用いて社員情報および権限情報を取得する。クロールサーバ18は、収集したテキスト情報、社員情報および権限情報を、HTTPSを用いて社内ネットワーク16の外のナレッジデータバンクサーバ102に送信する。ナレッジデータバンクサーバ102は、社内ネットワーク16の外のメールサーバ8に対してPOP、IMAP、HTTP(S)やGraph API等を用いてクローリングを行う。ナレッジデータバンクサーバ102は、社内ネットワーク16内のユーザ12の端末から、HTTP(S)等を用いた検索の要求を受ける。
【0025】
なお、他の実施の形態ではメールサーバ8は社内ネットワーク16の中にあってもよいし、ポータルサイトサーバ4、ファイルサーバ6、ディレクトリサーバ10、クロールサーバ18のうちの少なくともひとつが社内ネットワーク16の外にあってもよい。また、
図1、
図2では便宜上各サーバが一台のサーバからなる場合を説明しているが、サーバの台数に制限はない。
【0026】
図3は、
図1のナレッジデータバンクサーバ102のハードウエア構成図である。ナレッジデータバンクサーバ102は、メモリ110と、プロセッサ112と、通信インタフェース114と、ディスプレイ116と、入力インタフェース118と、を備える。これらの要素はそれぞれバス120に接続され、バス120を介して互いに通信する。
【0027】
メモリ110は、データやプログラムを記憶するための記憶領域である。データやプログラムは、メモリ110に恒久的に記憶されてもよいし、一時的に記憶されてもよい。プロセッサ112は、メモリ110に記憶されているプログラムを実行することにより、ナレッジデータバンクサーバ102の各種機能を実現する。通信インタフェース114は、ナレッジデータバンクサーバ102の外部との間でデータの送受信を行うためのインタフェースである。通信インタフェース114はネットワークと接続され、ネットワークを介して、クロールサーバ18やユーザ12の端末とデータをやりとりする。ディスプレイ116は、各種情報を表示するためのデバイスである。入力インタフェース118は、ナレッジマネジメントシステム2の管理者からの入力を受け付けるためのデバイスである。
【0028】
図4は、
図1のナレッジデータバンクサーバ102の機能および構成を示すブロック図である。ここに示す各ブロックは、ハードウエア的には、コンピュータのCPUをはじめとする素子や機械装置で実現でき、ソフトウエア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウエア、ソフトウエアの組合せによっていろいろなかたちで実現できることは、本明細書に触れた当業者には理解されるところである。
【0029】
ナレッジデータバンクサーバ102は、企業内情報収集部130と、文書タグ付け部132と、人物タグ付け部134と、ソーシャルグラフ生成部136と、検索要求受付部138と、検索処理部140と、自動回答生成部142と、検索結果提供部144と、コミュニティ生成部146と、学習部148と、生データ保持部150と、文書情報保持部152と、社員情報保持部154と、対話内容保持部155と、を備える。
【0030】
企業内情報収集部130は、ポータルサイトサーバ4やファイルサーバ6やメールサーバ8やディレクトリサーバ10から企業内情報を、ネットワークを介して取得する。企業内情報収集部130は、ネットワークを介してクロールサーバ18から、クロールサーバ18により収集された文書(ポータルサイトやファイルなど)およびそのテキスト情報を取得する。企業内情報収集部130は、ネットワークを介してメールサーバ8から、文書(メールなど)およびそのテキスト情報を取得する。企業内情報収集部130は、取得した文書およびそのテキスト情報を生データ保持部150に格納する。
【0031】
文書タグ付け部132は、企業内情報収集部130によって取得された文書を分析することで、当該文書に関連付けられた人物を、当該文書に付けられた非人名タグに関連付ける。文書タグ付け部132は、生データ保持部150に保持されている文書のテキスト情報やメタデータを上記の言語処理エンジンで処理することで、当該文書の人名タグおよび非人名タグを抽出する。文書タグ付け部132は、抽出された人名タグおよび非人名タグを当該文書に付与する(タグ付けする)。具体的には、文書タグ付け部132は、文書を特定する情報と、当該文書のテキスト情報から抽出された人名タグおよび非人名タグと、を対応付けて文書情報保持部152に登録する。文書タグ付け部132は、文書のテキスト情報から要約を自動生成し、生成された要約を文書に対応付けて文書情報保持部152に登録する。
【0032】
図5は、
図4の文書情報保持部152の一例を示すデータ構造図である。文書情報保持部152は、文書の文書名と、当該文書が格納されている位置を特定するパスと、当該文書のテキスト情報から抽出された人名タグと、当該文書のテキスト情報から抽出された非人名タグと、当該文書の要約と、を対応付けて保持する。文書情報保持部152において、文書を介して、人名タグすなわち人物と、非人名タグとが関連付けられているといえる。
【0033】
図4に戻り、人物タグ付け部134は、企業内の人物に非人名タグを付与する。人物タグ付け部134は、ディレクトリサーバ10から取得された社員情報に基づいて企業の社員を特定する。人物タグ付け部134は、社員それぞれについて、文書情報保持部152において該社員(に対応する人名タグ)に対応付けられている非人名タグを抽出し、抽出された非人名タグを社員情報保持部154に登録する。
【0034】
図6は、
図4の社員情報保持部154の一例を示すデータ構造図である。社員情報保持部154は、社員を特定する社員IDと、該社員の名前と、該社員について抽出された非人名タグと、該社員の専門領域と、該社員に関連する社員を特定する関連社員IDと、を対応付けて保持する。
【0035】
人物タグ付け部134は、ある社員について抽出された非人名タグをカウントする。人物タグ付け部134は、ある非人名タグの数が所定のしきい値を超えた場合、その非人名タグに対応する分野を、その社員の専門領域として決定する。例えば、社員ID「A001」の社員名「野村●●」について、文書情報保持部152から非人名タグ「音声認識」が20個抽出され、しきい値が15である場合、人物タグ付け部134は「野村●●」の専門領域が「音声認識」であると決定し、社員情報保持部154にそのように登録する。なお、社員の専門領域は、上記以外にもディレクトリサーバ10から得られる社員情報により決定されてもよいし、管理者により人手で登録されてもよい。あるいはまた、社員の専門領域は機械学習等のアルゴリズムを用いて決定されてもよい。
【0036】
なお、ユーザ12は社員情報保持部154を参照することで、自分にどのような非人名タグが付されているかを知ることができる。
【0037】
図4に戻り、ソーシャルグラフ生成部136は、文書情報保持部152を参照することで社員間のソーシャルグラフを生成する。ソーシャルグラフ生成部136は、文書情報保持部152において同じ文書に対して複数の人名タグが登録されている場合、それらの人名タグで特定される社員が関連すると決定する。ソーシャルグラフ生成部136は、決定された社員の間の関連性を、関連社員IDとして社員情報保持部154に登録する。例えば、ソーシャルグラフ生成部136は、ある文書に社員名「野村●●」と社員名「田中●●」とが記載されていることからその二名が関連すると決定された場合、社員情報保持部154の「野村●●」の関連社員IDに「田中●●」の社員IDを登録し、「田中●●」の関連社員IDに「野村●●」の社員IDを登録する。なお、ソーシャルグラフは、上記以外にもディレクトリサーバ10から得られる社員情報により決定されてもよいし、管理者により人手で登録されてもよい。
【0038】
検索要求受付部138は、ネットワークを介してユーザ12の端末から、検索キーワードや検索文などの検索内容を含む検索要求を受け付ける。検索内容は、ユーザ12が検索したいものをテキストで表現した情報を含む。
【0039】
検索処理部140は、検索要求受付部138が受け付けた検索要求に含まれる検索内容を分析することで検索内容にマッチする非人名タグを抽出する。この分析および抽出は、文書タグ付け部132で用いられている技術と同様の技術により実現されてもよい。検索処理部140は、抽出された非人名タグを用いて、(1)文書情報保持部152、(2)社員情報保持部154および(3)自動生成回答の三つのソースから対応する情報を取得し、検索結果を生成する。
【0040】
検索処理部140は、文書情報保持部152を参照し、抽出した非人名タグを有するエントリを特定する。検索処理部140は、特定したエントリに含まれる文書名、パス、人名タグ、要約を検索結果に含める。この際、人名タグは対応する社員の名前に変換される。
【0041】
検索処理部140は、社員情報保持部154を参照し、抽出した非人名タグに対応する専門領域を有する社員がいればその社員を特定し、検索結果に含める。例えば、検索処理部140は、
図6の社員情報保持部154を参照し、抽出した非人名タグ「音声認識」を専門領域とする社員ID「A001」の社員名「野村●●」を、専門家として特定し、検索結果に含める。
【0042】
検索処理部140は、後述の自動回答生成部142によって生成された回答を検索結果に含める。
【0043】
自動回答生成部142は、検索処理部140によって抽出された非人名タグに対応する情報を自動で生成する。自動回答生成部142は、例えば抽出された非人名タグに関連する過去の対話の要約を生成する。自動回答生成部142は、後述のチャットルームでなされた対話の内容を入力とする機械学習により生成、更新されるモデルを用いて、非人名タグに対応する適切な回答を生成する。このモデルは例えば非人名タグを入力とし、過去の回答またはその要約を出力とするモデルである。自動回答生成部142は、対話内容保持部155を参照して、出力された回答や要約に対応する過去の対話の参加者を特定してもよい。
【0044】
例えば、音声認識をキーワードとする検索要求があり、要求元と有識者との間でコミュニティが形成されて対話が行われたとする。後述の学習部148はこの対話を取得し、取得した対話の内容を機械的に学習することにより、モデルを更新する。次に音声認識をキーワードとする別の検索要求があった場合、自動回答生成部142は非人名タグ「音声認識」を更新されたモデルに入力することで、音声認識についての過去の対話または対話の要約を出力することができる。自動回答生成部142はこの過去の対話またはその要約を検索処理部140に渡し、検索処理部140はそれを別の検索要求に対する検索結果に含める。
【0045】
検索結果提供部144は、検索処理部140によって生成された検索結果を、ネットワークを介して要求元の端末に送信する。
【0046】
コミュニティ生成部146は、ネットワークを介してユーザ12の端末に、検索結果提供部144によって提供された検索結果に含まれる社員との対話を促進するためのインタフェースを提供する。検索結果提供部144によって提供された検索結果は、ユーザ12の端末において、検索要求の検索内容にマッチする非人名タグが付けられた文書と、当該文書に関連付けられた社員の情報と、を対応付けて表示する一元検索画面(後述)の形で提供される。この一元検索画面は、表示された社員のなかから、ユーザ12が対話を行いたい社員を選択可能に構成される。コミュニティ生成部146は、一元検索画面を通じて社員の選択を受け付け、選択された社員との対話を可能とするチャットルーム(後述)を生成する。コミュニティ生成部146は選択された社員をチャットルームに招待する。
【0047】
学習部148は、コミュニティ生成部146によって提供されたインタフェースを介してなされた対話の内容を取得し、対話内容保持部155に登録する。学習部148は、取得された対話の内容を機械的に学習することにより、自動回答生成部142で使用されるモデルを生成または更新する。
【0048】
図9は、
図4の対話内容保持部155の一例を示すデータ構造図である。対話内容保持部155は、過去のチャットルームでのチャットを特定するチャットIDと、該チャットの開始時刻および終了時刻と、該チャットの参加者を特定する参加者IDと、該チャットの内容と、該チャットに関連する非人名タグと、を対応付けて保持する。この非人名タグは、チャットルーム開設の原因となった検索の検索内容から抽出された非人名タグであってもよい。例えば、音声認識をキーワードとする検索要求があり、要求元と有識者とを参加者とするチャットルームでチャットが行われたとする。この場合、対話内容保持部155の参加者IDには要求元の社員IDおよび有識者の社員IDが登録され、非人名タグには「音声認識」が登録される。
【0049】
なお、本実施の形態では自動回答生成部142がモデルを用いて回答を自動生成する場合を説明したが、これに限られない。他の実施の形態では、モデルを用いた自動生成に代えて、自動回答生成部142は、対話内容保持部155を参照し、検索処理部140によって抽出された非人名タグに対応するチャットの内容および参加者IDを特定してもよい。この場合、自動回答生成部142は、機械学習により生成または更新されるモデルを用いて、特定されたチャットの内容の要約を生成してもよい。
【0050】
以上の構成によるナレッジデータバンクサーバ102の動作を説明する。
図7は、
図1のナレッジデータバンクサーバ102における一連の処理の流れを示すフローチャートである。ナレッジデータバンクサーバ102は、企業内の情報を収集する(S702)。ナレッジデータバンクサーバ102は、収集した情報を分析する(S704)。ナレッジデータバンクサーバ102は、分析結果に基づいて文書に非人名タグおよび人名タグをタグ付けする(S706)。ナレッジデータバンクサーバ102は、ステップS706の結果に基づいて、人物に非人名タグをタグ付けする(S708)。ナレッジデータバンクサーバ102は、ユーザの端末から検索要求を受け付ける(S710)。ナレッジデータバンクサーバ102は、検索内容にマッチする非人名タグを決定する(S712)。ナレッジデータバンクサーバ102は、決定された非人名タグに関連付けられている人物を特定する(S714)。ナレッジデータバンクサーバ102は、特定された人物の情報を含む検索結果を生成する(S716)。ナレッジデータバンクサーバ102は、生成された検索結果を要求元の端末に送信する(S718)。ナレッジデータバンクサーバ102は、人物を指定したチャットルームの生成要求を受け付ける(S720)。ナレッジデータバンクサーバ102は、チャットルームを生成する(S722)。ナレッジデータバンクサーバ102は、指定された人物にネットワークを介してチャットルームへの招待を送信する(S724)。ナレッジデータバンクサーバ102は、チャットルームでの対話の内容を取得する(S726)。ナレッジデータバンクサーバ102は、取得した対話の内容を機械的に学習する(S728)。
【0051】
図8は、ユーザ12の端末のディスプレイに表示される一元検索画面800の代表画面図である。一元検索画面800は、ユーザ12から検索要求を受け付け、ユーザ12に検索結果を提示する。一元検索画面800は、検索内容入力領域802と、検索ボタン804と、抽出タグ表示領域806と、第1検索結果808と、第2検索結果810と、第3検索結果812と、第4検索結果814と、招待ボタン816と、を有する。
【0052】
検索内容入力領域802および検索ボタン804は検索要求の生成に使用される。ユーザ12は検索内容入力領域802に所望の検索内容をキーワードや文で入力し、検索ボタン804を押し下げる。ユーザ12の端末は、検索ボタン804の押し下げを検出すると、検索内容入力領域802に入力されている情報を検索内容として取得し、取得した検索内容を含む検索要求を生成し、ネットワークを介してナレッジデータバンクサーバ102に送信する。
【0053】
抽出タグ表示領域806、第1検索結果808、第2検索結果810、第3検索結果812、第4検索結果814、は送信された検索要求に対する検索結果を表示する領域である。抽出タグ表示領域806は、ユーザ12の入力内容に関連するタグを推測して表示する領域であり、特に検索内容入力領域802に入力された検索内容から抽出された非人名タグを表示する。抽出タグ表示領域806は、ユーザ12による非人名タグの選択を受け付ける。ユーザ12は抽出タグ表示領域806に表示されている非人名タグのなかから所望の非人名タグを選択する。ユーザ12の端末または該選択を受け付けたナレッジデータバンクサーバ102は、選択された非人名タグによって検索結果を絞り込む。
図8の例では、抽出タグ表示領域806に表示されている6つの非人名タグ(「音声認識」、「音声合成」、「ディープラーニング」、「AI」、「ビッグデータ」、「統計言語処理」)のうち3つ(「音声認識」、「AI」、「ビッグデータ」)がユーザ12により選択されており、選択された3つの非人名タグに対応して絞り込まれた検索結果(第1検索結果808、第2検索結果810、第3検索結果812、第4検索結果814)が表示されている。
【0054】
第1検索結果808は、検索の結果特定された文書のイメージ818と、ユーザ12が当該文書の閲覧権限を有しているか否かを示す閲覧権限有無820と、当該文書の文書名822と、当該文書の要約824と、当該文書に付された非人名タグ826と、当該文書から抽出された人名タグで特定される社員の社員名828と、チェックボックス830と、を有する。閲覧権限有無820はディレクトリサーバ10から得られるユーザ12の情報から判定されてもよい。
図8の例では、ユーザ12は特定された文書「音声認識に関する調査」に対する閲覧権限を有しているので、文書名822は当該文書へのリンクを含むハイパーリンク形式で表示される。ユーザ12が当該ハイパーリンクを押し下げると、文書「音声認識に関する調査」が読み出されて表示される。
【0055】
第2検索結果810は、検索の結果特定されたもののユーザ12が閲覧権限を有していない文書を、第1検索結果808とは異なる態様で表示する。第2検索結果810において、イメージ832は「?」などのダミー画像で置き換えられ、閲覧権限有無834は閲覧権限が無いことを示す。文書名836はリンクを含まない。これら以外の要素すなわち要約838、非人名タグ840、社員名842、チェックボックス844は第1検索結果808と同様に表示される。
【0056】
通常、ユーザ12は例えば他人の電子メールに対する閲覧権限を有していない(電子メールだけでなく、資料でも閲覧権限を有していないものもあり、それにも適用可能)。したがって、従来のシステムではユーザが同じ会社の他の社員の電子メールを検索することはできなかった。本実施の形態では、他人の電子メールの全文検索は禁止するものの、当該電子メールから抽出された人名タグ、非人名タグおよび要約は検索可能とし、検索結果に表示される。したがって、秘密情報の秘匿性を維持しつつ、そのような秘密情報も検索に「引っかかる」ようにすることで、より精度の高い検索を実現できる。なお、電子メール又は資料から抽出された人名タグ、非人名タグおよび要約は検索可能として、要約は検索結果表示せずに、人名タグ及び非人名タグを検索結果表示する構成であってもよい。
【0057】
なお、第1検索結果808および第2検索結果810において、社員名828、842はそれぞれ「作成者」として表示されている。これは、対応する人名タグが文書のメタデータに含まれる文書作成者情報から抽出されたことに起因する。文書のテキスト情報から人名タグが抽出された場合は、「作成者」とは異なる表記、例えば「関連者」など、が用いられてもよい。
【0058】
また、本実施の形態では、検索の結果特定された文書に付されている人名タグで特定される社員が当該文書と共に検索結果に表示される場合を説明するが、これに限られない。例えば、ナレッジデータバンクサーバ102は、社員情報保持部154を参照し、検索を要求したユーザ12と、検索の結果特定された文書に付されている人名タグで特定される社員と、が関連社員IDを介して関連している場合にのみ、その社員を検索結果に含めてもよい。この場合、ユーザ12のいわゆる「お友達」の社員のみが検索結果に表示されるので、チャットに招待したときの承諾の確率を高めることができる。
【0059】
第3検索結果812は社員情報保持部154から抽出される有識者(専門家)に対応する。第3検索結果812は、検索の結果特定された有識者の名前や連絡先を表示するプロファイル846と、当該有識者に付された非人名タグ848と、当該有識者の有識者名850と、チェックボックス852と、を有する。
【0060】
第4検索結果814は自動回答生成部142によって生成される回答に対応する。第4検索結果814は、チャットボット854が過去の関連する対話の要約856を教える形式で表示される。第4検索結果814には、過去の関連する対話の要約856に対応する非人名タグ857と、過去の関連する対話の参加者の参加者名858と、チェックボックス860と、が表示される。自動回答生成部142が第4検索結果814を生成する際、対話内容保持部155を参照することで非人名タグ857および参加者名858を特定してもよい。
【0061】
ユーザ12は、第1検索結果808、第2検索結果810、第3検索結果812、第4検索結果814で提示されている社員(鈴木●●、田中●●、野村●●、佐々木●●、佐藤●●)のなかから、相談したい社員を選んで対応するチェックボックスにチェックを入れる。ユーザ12が招待ボタン816を押し下げると、端末はチェックボックスにチェックが入っている社員をユーザ12がチャットに招待したい社員として受け付ける。端末は、ユーザ12がチャットに招待したい社員の情報を含むチャットルーム生成要求をナレッジデータバンクサーバ102に送信する。ナレッジデータバンクサーバ102は、チャットルーム生成要求を受信すると、チャットルームを生成すると共に、招待対象の社員に該チャットルームへのリンクを含む電子メールを送信する。チャットルームの生成およびチャットルームへの招待のための処理自体は公知(例えば、特許文献2参照)であるから本明細書では詳述しない。
【0062】
図10は、ユーザ12の端末のディスプレイに表示されるチャットルーム画面862の代表画面図である。ユーザ12が
図8の一元検索画面800の招待ボタン816を押し下げると、チャットルーム画面862に遷移する。チャットルーム画面862は、チャットルームの参加者の一覧を表示する参加者一覧領域864と、参加者が投稿したチャットの内容を表示するチャット表示領域866と、投稿したいチャットの内容が入力されるチャット内容入力領域868と、送信ボタン870と、を有する。
【0063】
ナレッジデータバンクサーバ102はチャットルーム画面862におけるチャット(対話)を自動的に取得する。ナレッジデータバンクサーバ102は、招待された参加者のうちチャットで回答を提供した参加者に、ポイントなどのインセンティブを付与する処理を実行してもよい。これにより、コミュニケーションをより活性化することができる。
【0064】
また、
図8の第2検索結果810に表示される文書のように、ユーザが閲覧権限を有さない文書について、その文書に関連付けられた社員をチャットルームに招待することで、より素早く当該文書へのアクセスを求めることができる。さらに、
図8で、チャットルーム(仮想ルーム)招待候補者を選択可能に表示しているが、この表示に加え、各チャットルーム招待候補者のその時点でのチャットルームの招待回数、チャットルームの参加回数、チャットルームでの発言回数のいずれか一つを少なくとも表示する構成でもあってもよい。加えて、
図8の例では、チャットルーム招待候補者が重複して表示されている例はないが、重複して表示される場合もあり、重複表示された候補者が選択可能に表示され、ユーザにより重複表示された候補者が選択された場合には対象の重複表示された候補者の複数表示全てが選択された処理とすることもできる。
【0065】
上述の実施の形態において、保持部の例は、ハードディスクや半導体メモリである。また、本明細書の記載に基づき、各部を、図示しないCPUや、インストールされたアプリケーションプログラムのモジュールや、システムプログラムのモジュールや、ハードディスクから読み出したデータの内容を一時的に記憶する半導体メモリなどにより実現できることは本明細書に触れた当業者には理解される。
【0066】
本実施の形態に係るナレッジデータバンクサーバ102によると、企業内の文書と人物(ヒト)とを一元的に検索することが可能となる。これにより、ユーザは、文書(形式知)だけでなく人物とのコミュニケーション(活きた情報、暗黙知)を通じて、捜しものや知りたいことについてのより深く、正確で活きたナレッジを得ることができる。
【0067】
また本実施の形態に係るナレッジデータバンクサーバ102では、上記検索の結果から、チャットルームなどの仮想コミュニティへの動線が提供される。したがって、人物間のコミュニケーションをより活性化することができる。
【0068】
そして、本実施の形態では、そのような仮想コミュニティでなされた対話の内容が自動的に取得され、学習され、その結果はボットによる回答として将来の検索に反映される。したがって、過去の対話の内容を用いて、将来の検索の精度、的確性を高めることができる。
【0069】
以上、実施の形態に係るナレッジデータバンクサーバ102の構成と動作について説明した。この実施の形態は例示であり、各構成要素や各処理の組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解される。
【0070】
実施の形態では、検索要求受付部138は検索キーワードや検索文を検索内容として含む検索要求を受け付ける場合を説明したが、これに限られない。例えば、検索要求受付部138はユーザ12の端末からアップロードされる任意の文書を検索要求として受け付けてもよい。この場合、検索要求受付部138は当該文書全体を検索内容として処理し、そこから非人名タグを抽出する。その結果、ユーザ12が任意にアップロードした文書について、自動的に検索が行われて類似の文書や関連分野の専門家が一元検索画面800のような画面で提示されると共に、チャットルーム画面862のような仮想コミュニティが自動で形成される。これにより、ユーザ12は自分がアップロードした文書についての社内ナレッジを容易に収集して検討することができると共に、仮想コミュニティで当該文書について専門家などと議論することができる。
【0071】
実施の形態では、検索結果に含まれる人物との対話を促進するためのインタフェースの一例としてチャットルーム画面862を説明したが、これに限られず、例えば電子メールやインスタントメッセージや電話会議やテレビ会議などの他のインタフェースが採用されてもよい。
【0072】
実施の形態では、一元検索画面800でユーザ12が選択した社員をチャットルームに招待する場合を説明したが、これに限られず、例えばナレッジデータバンクサーバ102は社員情報保持部154を参照することでチャットルームの参加者を自動で選択してもよい。例えば、ナレッジデータバンクサーバ102は一元検索画面800の抽出タグ表示領域806で選択された非人名タグを取得し、取得された非人名タグが付された社員を社員情報保持部154で特定し、特定された社員をチャットルームに招待するための処理を実行してもよい。ナレッジデータバンクサーバ102は、特定された社員の関連社員を招待してもよい。あるいはまた、ナレッジデータバンクサーバ102は一元検索画面800でユーザ12が選択した社員およびその関連社員をチャットルームに招待してもよい。
【0073】
この際、社員に職位、所属などの属性が付与されている場合、特定の属性の社員は招待の対象から除く処理が行われてもよい(招待表示から除く処理でもよい)。例えば、一定以上の職位の社員は招待の対象から外れてもよい。また、社員自身が、チャットルームへの招待を自動的に拒否できるようにナレッジデータバンクサーバ102を構成してもよい。
あるいはまた、社員に職位、所属などの属性が付与されている場合、特定の属性の社員を招待の対象とする処理が行われてもよい(招待表示に入れる処理でもよい)。例えば、自分が所属する部署のみの社員を対象に招待の対象とする処理が行われてもよい。
【0074】
実施の形態において、文書タグ付け部132によって文書に自動的に付与される人名タグおよび非人名タグを監視する手段を設けてもよい。この監視する手段は、所定のタグ排除規則にしたがって、文書タグ付け部132によって生成されたタグを排除する。タグ排除規則は、例えば、個人情報、放送禁止用語、悪口、コンプライアンス、数値、金額、ユーザ定義などにより定義されてもよい。
【0075】
図11は、ユーザ12の端末のディスプレイに表示される別の一元検索画面900の代表画面図である。一元検索画面900は、検索結果の統計情報902を表示する。統計情報902は、企業の部署904と、当該部署に属する社員および文書のうち抽出タグ表示領域806で選択されている非人名タグにマッチする社員の人数および文書の数の合計を示す棒グラフ906と、当該合計908と、を対応づけて表示する。ユーザ12が企業の部署904のうち消耗の部署を押し下げると、その部署に属する社員および文書のうち抽出タグ表示領域806で選択されている非人名タグにマッチする社員および文書の詳細を確認する画面(例えば
図8の一元検索画面800と同様の画面)に遷移する。さらに、社員個人のレベルまで指定すると、その社員の詳細情報が表示される。
【符号の説明】
【0076】
2 ナレッジマネジメントシステム、 4 ポータルサイトサーバ、 6 ファイルサーバ、 8 メールサーバ、 10 ディレクトリサーバ、 12 ユーザ、 102 ナレッジデータバンクサーバ。