IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機株式会社の特許一覧

特開2024-125113ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム
<>
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図1
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図2
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図3
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図4
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図5
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図6
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図7
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図8
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図9
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図10
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図11
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図12
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図13
  • 特開-ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024125113
(43)【公開日】2024-09-13
(54)【発明の名称】ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラム
(51)【国際特許分類】
   G06F 16/38 20190101AFI20240906BHJP
【FI】
G06F16/38
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023033232
(22)【出願日】2023-03-03
(71)【出願人】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】100095407
【弁理士】
【氏名又は名称】木村 満
(74)【代理人】
【識別番号】100131152
【弁理士】
【氏名又は名称】八島 耕司
(74)【代理人】
【識別番号】100147924
【弁理士】
【氏名又は名称】美恵 英樹
(74)【代理人】
【識別番号】100148149
【弁理士】
【氏名又は名称】渡邉 幸男
(74)【代理人】
【識別番号】100181618
【弁理士】
【氏名又は名称】宮脇 良平
(74)【代理人】
【識別番号】100174388
【弁理士】
【氏名又は名称】龍竹 史朗
(72)【発明者】
【氏名】中野 智晴
(72)【発明者】
【氏名】田中 耀喬
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175HB03
5B175KA12
(57)【要約】
【課題】ユーザがナレッジグラフから曖昧なつながりを有する事例を検索することを可能にする。
【解決手段】ナレッジグラフ生成装置1は、事象に関連する文書に含まれる単語を数値化して単語ベクトルに変換する単語演算部12と、単語ベクトルを用いて、事象の事例を表す文章を文章ベクトルに変換する文章演算部13と、文章ベクトルに基づいて、事象の事例同士の類似度を算出する類似度演算部14と、事象の事例をエンティティ、事象の事例同士の類似度を関係性として、事象の事例のナレッジグラフを構築するナレッジグラフ構築部15と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
事象に関連する文書に含まれる単語を数値化して単語ベクトルに変換する単語演算部と、
前記単語ベクトルを用いて、前記事象の事例を表す文章を文章ベクトルに変換する文章演算部と、
前記文章ベクトルに基づいて、前記事象の事例同士の類似度を算出する類似度演算部と、
前記事象の事例をエンティティ、前記事象の事例同士の類似度を関係性として、前記事象の事例のナレッジグラフを構築するナレッジグラフ構築部と、
を備えるナレッジグラフ生成装置。
【請求項2】
前記事象は、機器の故障修理であって、
前記単語演算部は、
機器の故障修理に関連する故障修理文書に含まれる単語を数値化して単語ベクトルに変換し、
前記文章演算部は、
前記単語ベクトルを用いて、故障修理事例を表す文章を文章ベクトルに変換し、
前記類似度演算部は、
前記文章ベクトルに基づいて、前記故障修理事例同士の類似度を算出し、
前記ナレッジグラフ構築部は、
前記故障修理事例をエンティティ、前記故障修理事例同士の類似度を関係性として、前記故障修理事例のナレッジグラフを構築する、
請求項1に記載のナレッジグラフ生成装置。
【請求項3】
前記故障修理事例のナレッジグラフからユーザが入力した故障修理対象の特徴に近い前記故障修理事例を検索し、検索結果を前記ユーザに提示する検索部、
をさらに備える、
請求項2に記載のナレッジグラフ生成装置。
【請求項4】
前記検索部は、
前記ユーザが入力した前記故障修理対象の特徴を表す検索ワードの中の単語を前記単語ベクトルに変換し、変換した前記単語ベクトルの平均を検索ワード全体のベクトルとして算出し、前記故障修理事例の前記文章ベクトルの中から、最も前記検索ワード全体のベクトルに近い前記故障修理事例を特定し、特定した前記故障修理事例に基づいて検索クエリを作成し、作成した前記検索クエリを用いて前記故障修理事例のナレッジグラフを検索し、検索結果として抽出されたエンティティを示す検索結果情報を生成し、出力する、
請求項3に記載のナレッジグラフ生成装置。
【請求項5】
前記故障修理事例を表す文章を含む故障修理事例情報を取得する故障修理事例取得部をさらに備え、
前記文章演算部は、
前記単語ベクトルを用いて、前記故障修理事例情報に含まれる新たな故障修理事例を表す文章を文章ベクトルに変換し、
前記類似度演算部は、
前記文章ベクトルに基づいて、前記新たな故障修理事例間の類似度、および、前記新たな故障修理事例と既存の故障修理事例との間の類似度を算出し、
前記ナレッジグラフ構築部は、
前記新たな故障修理事例をエンティティとして追加し、前記新たな故障修理事例間の類似度、および、前記新たな故障修理事例と既存の故障修理事例との間の類似度を関係性として、前記故障修理事例のナレッジグラフを更新する、
請求項2から4のいずれか1項に記載のナレッジグラフ生成装置。
【請求項6】
ナレッジグラフを生成するナレッジグラフ生成装置と、ユーザが使用するユーザ端末とを備え、
前記ユーザ端末は、前記ユーザからの検索対象の特徴の入力を受け付け、前記検索対象の特徴を示す入力情報を前記ナレッジグラフ生成装置に送信し、
前記ナレッジグラフ生成装置は、
事象に関連する文書に含まれる単語を数値化して単語ベクトルに変換する単語演算部と、
前記単語ベクトルを用いて、前記事象の事例を表す文章を文章ベクトルに変換する文章演算部、
前記文章ベクトルに基づいて、前記事象の事例同士の類似度を算出する類似度演算部、
前記事象の事例をエンティティ、前記事象の事例同士の類似度を関係性として、前記事象の事例のナレッジグラフを構築するナレッジグラフ構築部、および、
前記事象の事例のナレッジグラフから、前記ユーザ端末から受信した前記入力情報が示す前記検索対象の特徴に近い前記事象の事例を検索し、検索結果を示す検索結果情報を前記ユーザに提示する検索部、
を備え、
前記ユーザ端末は、前記ナレッジグラフ生成装置から受信した前記検索結果情報を出力するナレッジグラフ生成システム。
【請求項7】
ナレッジグラフ生成装置が実行する、
事象に関連する文書に含まれる単語を数値化して単語ベクトルに変換するステップと、
前記単語ベクトルを用いて、前記事象の事例を表す文章を文章ベクトルに変換するステップと、
前記文章ベクトルに基づいて、前記事象の事例同士の類似度を算出するステップと、
前記事象の事例をエンティティ、前記事象の事例同士の類似度を関係性として、前記事象の事例のナレッジグラフを構築するステップと、
を備える、ナレッジグラフ生成方法。
【請求項8】
コンピュータを、
事象に関連する文書に含まれる単語を数値化して単語ベクトルに変換する単語演算部、
前記単語ベクトルを用いて、前記事象の事例を表す文章を文章ベクトルに変換する文章演算部、
前記文章ベクトルに基づいて、前記事象の事例同士の類似度を算出する類似度演算部、および、
前記事象の事例をエンティティ、前記事象の事例同士の類似度を関係性として、前記事象の事例のナレッジグラフを構築するナレッジグラフ構築部、
として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラムに関する。
【背景技術】
【0002】
機器の修理では、多くの場合、部品の交換が必要となる。修理を行う対象となる機器が客先の工場、研究所などに設置してある場合、客先からコールセンターに機器の故障状況の報告があり、コールセンターの担当者が、その内容から機器の故障原因、交換用部品を推測するケースが多い。コールセンターの担当者には高い製品技術知識が必要であり、労働人口減少が進む中、ノウハウの蓄積および活用が課題である。コールセンターで利用される事例検索システムは誰でも使えるよう検索ワードを入力して検索ワードが含まれる類似事例を検索できる仕組みとなっていることが多いが、このシステムでは検索ワードの表記ゆれ、過不足などが原因で経験の少ないユーザは使いこなすことができない。このような問題に対し、近年、検索ノウハウがなくてもユーザの意図により近い検索を実現する技術としてナレッジグラフが注目されている。
【0003】
特許文献1には、例えば、テレビドラマ、映画といったコンテンツの、作品名、演者、監督などのコンテンツ同士のつながりが明確なデータをリレーショナルデータベースでなくナレッジグラフとして生成して可視化することで、ユーザへの提示効果を高める技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2020-24698号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、故障修理事例には、例えば複数の故障修理事例が、ある1社の顧客に紐付いている、交換した部品が同じである、といったつながりが明確な一致するデータのほかに、故障時の現象が似ている、原因が似ている、処置が似ている、といったつながりが曖昧な類似するデータがあり、特許文献1に記載の技術では、これらの曖昧なつながりをナレッジグラフとして生成することはできない。従って、ユーザはナレッジグラフから曖昧なつながりを有する事例を検索することはできない。
【0006】
本開示は、上記のような問題点を解決するためになされたものであり、ユーザがナレッジグラフから曖昧なつながりを有する事例を検索することを可能にすることを目的とする。
【課題を解決するための手段】
【0007】
上記目的を達成するため、本開示に係るナレッジグラフ生成装置は、単語演算部と、文章演算部と、類似度演算部と、ナレッジグラフ構築部と、を備える。単語演算部は、事象に関連する文書に含まれる単語を数値化して単語ベクトルに変換する。文章演算部は、単語ベクトルを用いて、事象の事例を表す文章を文章ベクトルに変換する。類似度演算部は、文章ベクトルに基づいて、事象の事例同士の類似度を算出する。ナレッジグラフ構築部は、事象の事例をエンティティ、事象の事例同士の類似度を関係性として、事象の事例のナレッジグラフを構築する。
【発明の効果】
【0008】
本開示によれば、定量的に事象の事例を表す文章の類似度を算出し、事象の事例をエンティティ、事象の事例同士の類似度を関係性として、ナレッジグラフを構築することで、ユーザがナレッジグラフから曖昧なつながりを有する事例を検索することが可能になる。
【図面の簡単な説明】
【0009】
図1】実施の形態1に係るナレッジグラフ生成システムの構成例を示す図
図2】実施の形態1に係る故障修理文書情報の例を示す図
図3】実施の形態1に係る故障修理文書に含まれる単語の数値化の例を示す図
図4】実施の形態1に係るニューラルネットワークの例を示す図
図5】実施の形態1に係る単語変換テーブルの例を示す図
図6】実施の形態1に係る故障修理事例情報の例を示す図
図7】実施の形態1に係る文章ベクトル情報の例を示す図
図8】実施の形態1に係る類似度情報の例を示す図
図9】実施の形態1に係るナレッジグラフの例を示す図
図10】実施の形態1に係るナレッジグラフ生成処理を示すフローチャート
図11】実施の形態1に係るナレッジグラフ検索処理を示すフローチャート
図12】実施の形態2に係るナレッジグラフ生成システムの構成例を示す図
図13】実施の形態2に係るナレッジグラフ更新処理を示すフローチャート
図14】実施の形態1および2に係るナレッジグラフ生成装置のハードウェア構成の一例を示す図
【発明を実施するための形態】
【0010】
以下に、本実施の形態に係るナレッジグラフ生成装置、ナレッジグラフ生成システム、ナレッジグラフ生成方法およびプログラムについて図面を参照して詳細に説明する。なお、図中同一または相当する部分には同じ符号を付す。以下の実施の形態では、機器の故障修理の事例である故障修理事例のナレッジグラフを生成する例について説明する。
【0011】
(実施の形態1)
実施の形態1に係るナレッジグラフ生成システム100の構成について図1を用いて説明する。図1に示すように、ナレッジグラフ生成システム100は、ナレッジグラフを生成するナレッジグラフ生成装置1と、ユーザが使用するユーザ端末2と、を備える。
【0012】
ナレッジグラフ生成装置1は、各種情報を記憶する記憶部11と、機器の故障修理に関連する故障修理文書に含まれる単語を単語ベクトルに変換する単語演算部12と、単語ベクトルを用いて故障修理事例を表す文章を文章ベクトルに変換する文章演算部13と、故障修理事例同士の類似度を算出する類似度演算部14と、故障修理事例のナレッジグラフを構築するナレッジグラフ構築部15と、ナレッジグラフ構築部15が構築したナレッジグラフからユーザが入力した故障修理対象の特徴に近い故障修理事例を検索する検索部16とを備える。
【0013】
記憶部11は、故障修理文書を示す故障修理文書情報を記憶する故障修理文書記憶部111と、故障修理事例を表す文章を含む故障修理事例情報を記憶する故障修理事例記憶部112と、単語演算部12が故障修理文書に含まれる単語を数値化した単語ベクトルを示す単語変換テーブルを記憶する単語数値記憶部113と、文章演算部13が故障修理事例を変換した文章ベクトルを示す文章ベクトル情報を記憶する文章数値記憶部114と、類似度演算部14が算出した故障修理事例同士の類似度を示す類似度情報を記憶する類似度記憶部115と、ナレッジグラフ構築部15が構築した、故障修理事例のナレッジグラフを記憶するナレッジグラフ記憶部116と、を備える。故障修理文書は、故障修理対象となる機器の様々な技術文書であり、例えば、各種作業マニュアル、品質関連の資料などである。
【0014】
単語演算部12は、故障修理文書に含まれる単語を数値化し、単語ベクトルに変換する。単語演算部12は、まず、故障修理文書記憶部111から故障修理文書を示す故障修理文書情報を取得する。故障修理文書情報が示す故障修理文書の文章を形態素に分割する形態素解析処理を行う。図2に、故障修理文書情報の例を示す。
【0015】
図2の例では、故障修理文書情報は、故障修理文書を識別する文書IDと、故障修理文書の種類を示す分類と、故障修理文書が関連している機器の機種と、故障修理の内容を示す本文の項目を有する。例えば、文書IDがX00000001の故障修理文書は、コールセンターの受付履歴であって、関連している機器の機種はAAAであり、「操作画面がつかないため、線を交換した」という内容である。
【0016】
例えば、図3に示すように、単語演算部12が、「機器Aは操作画面の手前にレバーがあるので引く」という文章を含む故障修理文書情報を取得したとする。単語演算部12は、「機器Aは操作画面の手前にレバーがあるので引く」の文章を、「機器」、「A」、「は」、「操作画面」、「の」、「手前」、「に」、「レバー」、「が」、「ある」、「ので」、「引く」と、単語ごとに分割する形態素解析処理を行う。なお、文章に句読点が含まれる場合、句読点は1つの単語として分割する。また、重複する単語がある場合は、1つにまとめる。
【0017】
次に、単語演算部12は、ニューラルネットワークを利用して単語ごとの単語ベクトルを抽出する。しかし、ニューラルネットワークでは、テキストそのもの、すなわち単語そのものを直接処理することはできないので、処理の対象となる単語を、固定長のベクトルに変換する必要がある。単語を固定長のベクトルに変換する方法の一つとして、文字列をone-hotベクトルに変換する方法がある。one-hotベクトルとは、ベクトルの要素のうち一つだけが「1」であり、残りが全て「0」であるベクトルである。one-hotベクトルを生成するには、文章を分割した形態素の数分の要素を持つベクトルを用意し、形態素ごとに異なるベクトルの要素に「1」を割り当てる。
【0018】
例えば、分割された単語「機器」、「A」、「は」、「操作画面」、「の」、「手前」、「に」、「レバー」、「が」、「ある」、「ので」、「引く」は12個である。そこで、単語演算部12は、各単語を12個の要素を持つone-hotベクトルに変換する。例えば、「機器」は、第1要素を「1」とし、残りを「0」とする。また、「A」は、第2要素を「1」とし、残りを「0」とする。以下、順番に、全ての形態素をone-hotベクトルに変換する。
【0019】
続いて、単語演算部12は、生成したone-hotベクトルを、ニューラルネットワークの入力層に入力する。ニューラルネットワークの例について、図4を用いて説明する。図4に示すように、ニューラルネットワークは、任意の単語が入力層に入力されると、その値に重みW1を掛けて隠れ層に入力され、その結果にさらに重みW2を掛けて出力層から出力される。出力層の出力結果は、重みW1と重みW2の値によって変化する。単語演算部12が用いるニューラルネットワークは、いわゆる教師あり学習により、周辺語の確率を学習するものとする。周辺語とは、その単語の直近の前後に配置された単語をいう。ニューラルネットワークは、入力層に単語を入力して出力層から出力された結果として、その単語の周辺語が出る確率が最も高くなる値に、重みW1および重みW2を調整することで学習する。
【0020】
ニューラルネットワークの入力層に入力される単語は、one-hotベクトルの形で入力されるが、具体的には、入力層の各ニューロンに、one-hotベクトルの各要素が入力される。例えば、図4に示すように、入力層に「機器」が入力される場合、第1要素を「1」とし残りを「0」とするone-hotベクトル「100000000000」がそれぞれ、入力層の各ニューロンに入力される。
【0021】
故障修理文書の文章が「機器Aは操作画面の手前にレバーがあるので」である場合、「機器」の直近前後ある単語、すなわち周辺語となるのは、「A」である。このため、ニューラルネットワークは、入力層に「機器」が入力された場合、出力層に「A」が出る確率が最も高くなる値に、重みW1および重みW2を調整する。
【0022】
単語演算部12は、ニューラルネットワークに、故障修理文書の文章に含まれる全ての単語について、その単語の周辺語の確率を学習させる。ニューラルネットワークの隠れ層の重みは行列であり、単語を数値化するための単語ベクトルとすることができる。単語演算部12は、ニューラルネットワークの隠れ層の重みと、各単語のone-hotベクトルとを掛け合わせることにより、各単語に対応する単語ベクトルを抽出する。例えば、単語「機器」のone-hotベクトル「100000000000」とニューラルネットワークの隠れ層の重み行列とを掛け合わせると、one-hotベクトルの1に対応する箇所の重み行列の行を抽出することができ、これが単語「機器」に対応する単語ベクトルである。
【0023】
ニューラルネットワークは、故障修理文書の文章に含まれる全ての単語について学習し、中間層の重みW1を算出する。中間層の重みW1の各行が、各形態素の単語ベクトルとなる。単語演算部12は、各単語に対して単語ベクトルを紐付けた単語変換テーブルを生成し、単語数値記憶部113に記憶させる。単語数値記憶部113に記憶される単語変換テーブルの例を図5に示す。
【0024】
図5の例では、単語変換テーブルは、単語を識別する単語IDと、単語名と、n次元の単語ベクトルである数値1、数値2、・・・、数値nの項目を有する。例えば、単語IDがW0000001の単語は、「操作盤」であり、数値1は0.03126787、数値2は、0.39007127、数値3は、0.42622834、・・・、数値nは0.53359198である。
【0025】
図1に戻り、文章演算部13は、故障修理事例を表す文章を単語に分解し、単語変換テーブルを用いて、故障修理事例の文章ベクトルを算出する。故障修理事例を表す文章には複数の項目があってもよい。例えば、故障修理事例を表す文章に故障時の機器の状況、故障の原因、処置方法などの項目がある場合、文章演算部13は、それぞれの項目の文章ベクトルを算出する。
【0026】
文章演算部13は、まず、故障修理事例記憶部112から故障修理事例情報を取得する。故障修理事例記憶部112には、過去に発生した故障修理事例のうち、保守対象である全ての機種の故障修理事例情報が記憶されているものとする。図6に、故障修理事例情報の例を示す。
【0027】
図6の例では、故障修理事例情報は、故障修理事例を識別する報告書ID、故障修理を依頼した顧客を識別する顧客ID、故障修理を行った機器の機種、故障修理が完了した日付を指す作業終了日、故障したときの現象を自然文で記録した現象、現象を引き起こした原因を示す原因、故障を修理するために必要であった作業を示す処置の項目を有する。例えば、報告書IDがR0001の故障修理事例は、故障修理を依頼した顧客の顧客IDがC000001であり、故障修理を行った機器の機種がAAAであり、作業終了日は、2022/4/1である。また、故障したときの現象は、「操作画面がつかない」、現象を引き起こした原因は「ディスプレイ断線」、修理するために必要であった作業は「線を交換した」である。
【0028】
文章演算部13は、単語ベクトルを用いて、故障修理事例を表す文章を文章ベクトルに変換する。故障修理事例を表す文章を文章ベクトルに変換する方法には、例えば、取得した故障修理事例を表す文章を形態素に分割し、単語数値記憶部113が記憶する単語変換テーブルを用いて、単語ごとの単語ベクトルを算出し、単語ベクトルの平均を文章ベクトルとする方法がある。文章演算部13は、算出した故障修理事例ごとの文章ベクトルを示す文章ベクトル情報を文章数値記憶部114に記憶する。文章数値記憶部114に記憶される文章ベクトル情報の例を図7に示す。
【0029】
図7の例では、文章ベクトル情報は、報告書を識別する報告書IDと、現象、原因および処置のうちのどの文章であるかを示す文章種別と、n次元の文章ベクトルである数値1、数値2、・・・、数値nの項目を有する。例えば、報告書IDがR0001の故障修理事例の現象の文章ベクトルの数値1は0.73302134、数値2は、0.21229233、数値3は、0.74466248、・・・、数値nは0.72069494である。
【0030】
図1に戻り、類似度演算部14は、文章数値記憶部114が記憶する文章ベクトル情報に基づいて、ナレッジグラフにおける関係性となる故障修理事例間の類似度を算出する。ここでは、故障修理事例間の類似度の一例として、コサイン類似度を採用する。コサイン類似度は、n次元の2つのベクトルqおよびベクトルdに対して、以下の数1の計算式を用いて算出される。
【0031】
【数1】
【0032】
コサイン類似度を採用した場合、n次元の2つのベクトルqおよびベクトルdが、比較対象の故障修理事例の文章ベクトルである。故障修理事例間の類似度は最大値1を取る実数値であり、1に近いほど2つの故障修理事例が類似していることを意味する。故障修理事例には、現象、原因および処置の3つの文章が記載されており、類似度演算部14は、それぞれの文章について類似度を算出する。類似度演算部14は、算出した故障修理事例間の類似度を示す類似度情報を類似度記憶部115に記憶する。類似度記憶部115に記憶される類似度情報の例を図8に示す。
【0033】
図8の例では、類似度情報は、比較対象の2つの故障修理事例の報告書を識別する報告書ID-1および報告書ID-2と、現象、原因および処置のうちのどの文章の類似度であるかを示す文章種別と、故障修理事例間の類似度を示す類似度の項目を有する。例えば、報告書IDがR0001の故障修理事例と報告書IDがR0002の故障修理事例との原因の類似度は、0.74017679である。
【0034】
図1に戻り、ナレッジグラフ構築部15は、各故障修理事例をエンティティとし、故障修理事例間の類似度を関係性としたナレッジグラフを構築する。ナレッジグラフ構築部15は、まず、故障修理事例記憶部112から故障修理事例情報を取得し、類似度記憶部115から類似度情報を取得する。ナレッジグラフ構築部15は、故障修理事例記憶部112から取得した故障修理事例情報に基づいて、1つの故障修理事例を1つのエンティティとしてエンティティを定義する。ナレッジグラフ構築部15は、類似度記憶部115から取得した類似度情報に基づいて、各エンティティをつなぐ関係性を定義する。ナレッジグラフ構築部15は、すべての故障修理事例について、エンティティおよび関係性を定義して、ナレッジグラフを構築する。ナレッジグラフ構築部15は、構築したナレッジグラフをナレッジグラフ記憶部116に記憶する。
【0035】
ここで、ナレッジグラフについて、図9を用いて説明する。図9に示すように、ナレッジグラフ構築部15がエンティティを定義すると、各エンティティが円形のノードで表される。図9の例では、各エンティティには各故障修理事例の報告書IDが記載されているが、実際には故障修理事例記憶部112に存在するすべての項目の情報が1つ1つのノードに含まれる。ナレッジグラフ構築部15が各エンティティをつなぐ関係性を定義すると、各エンティティをつなぐ線が構築される。この関係性には具体的な故障修理事例間の類似度の数値が記録される。ナレッジグラフの関係性はエンティティの数の2乗のオーダとなるため、予め定められた閾値以下の類似度を持つ関係性をナレッジグラフに含まないことで、ナレッジグラフを活用する上で検索時間の短縮につながり、有効性が高まる。
【0036】
図9の例では、類似度0.8以上の故障修理事例間の関係性のみ類似するものとして表示している。例えば、報告書IDがR0003の故障修理事例と、報告書IDがR0004の故障修理事例とは、原因の文章ベクトルの類似度が0.8以上である。
【0037】
図1に戻り、ユーザは、ユーザ端末2に故障修理対象の特徴を入力する。故障修理対象は、検索対象の例である。ユーザ端末2は、ユーザが入力した故障修理対象の特徴を示す入力情報をナレッジグラフ生成装置1に送信する。検索部16は、ユーザ端末2から入力情報を受け取ると、ナレッジグラフ記憶部116が記憶するナレッジグラフから、入力情報が示す故障修理対象の特徴に近い故障修理事例を検索する。なお、検索部16は、ユーザによる故障修理対象の特徴の入力を受け付けてもよい。
【0038】
例えば、ユーザは、機器のコールセンターの故障修理窓口担当であり、ユーザ端末2は、コールセンターに設置された故障修理窓口担当が使用する端末である。この場合、顧客から問い合わせのあった故障修理対象に近い事例を検索するために、ユーザは顧客からの問い合わせを受けて故障修理対象の特徴を表す検索ワードをユーザ端末2に入力する。ユーザ端末2は、ユーザが入力した検索ワードを示す入力情報をナレッジグラフ生成装置1に送信する。
【0039】
検索部16は、ユーザ端末2から受け取った入力情報が示す検索ワードのうち、単語数値記憶部113に記憶されている単語変換テーブルに含まれる単語を全て単語ベクトルに変換し、その平均を検索ワード全体のベクトルとして算出する。次に、検索部16は、文章数値記憶部114に記憶された文章ベクトル情報が示す各故障修理事例の文章ベクトルの中から、最も検索ワード全体のベクトルに近い故障修理事例を特定する。故障修理事例の文章ベクトルと検索ワード全体のベクトルとの近さの判定には、例えば、コサイン類似度を採用する。
【0040】
検索部16は、ナレッジグラフを検索するためのクエリを作成する。検索部16が作成する検索クエリは、例えば、最も検索ワード全体のベクトルに近い事例を起点として、2HOP以内に存在するエンティティを抽出するといった単純な検索クエリでもよいし、関係性の類似度の乗算が予め決められた閾値以上になるエンティティを抽出するといった検索クエリでもよい。検索部16は、作成した検索クエリを用いてナレッジグラフ記憶部116が記憶するナレッジグラフを検索し、検索結果として抽出されたエンティティを示す検索結果情報を生成する。検索部16は、検索結果情報をユーザ端末2に送信する。ユーザ端末2は、受信した検索結果情報を出力し、ユーザに提示する。なお、検索結果情報の出力方法はこれに限らず、例えば、検索部16がユーザによる故障修理対象の特徴の入力を受け付ける場合は、検索結果情報を画面表示してもよい。
【0041】
ここで、ナレッジグラフ生成装置1が実行するナレッジグラフ生成処理の流れについて、図10を用いて説明する。図10に示すナレッジグラフ生成処理は、ナレッジグラフ生成装置1に電源が投入された時、あるいは、ナレッジグラフ生成装置1にナレッジグラフ生成指示が入力された時に開始する。ナレッジグラフ生成装置1の単語演算部12は、故障修理文書記憶部111から故障修理文書を示す故障修理文書情報を取得する(ステップS11)。単語演算部12は、故障修理文書情報が示す故障修理文書の文章を形態素に分割する(ステップS12)。例えば、ステップS11で、単語演算部12が「機器Aは操作画面の手前にレバーがあるので引く」という文章を含む故障修理文書情報を取得したとすると、ステップS12で、単語演算部12は、「機器」、「A」、「は」、「操作画面」、「の」、「手前」、「に」、「レバー」、「が」、「ある」、「ので」、「引く」と、単語ごとに分割する形態素解析処理を行う。
【0042】
単語演算部12は、ニューラルネットワークを利用して単語ごとの単語ベクトルを抽出する(ステップS13)。単語を固定長のベクトルに変換する方法の一つとして、文字列をone-hotベクトルに変換する方法がある。例えば、分割された単語「機器」、「A」、「は」、「操作画面」、「の」、「手前」、「に」、「レバー」、「が」、「ある」、「ので」、「引く」は12個であるので、各単語を12個の要素を持つone-hotベクトルに変換する。例えば、「機器」は、第1要素を「1」とし、残りを「0」とする。単語演算部12は、各単語をone-hotベクトルに変換し、ニューラルネットワークの入力層に入力する。単語演算部12は、ニューラルネットワークに、故障修理文書の文章に含まれる全ての単語について、その単語の周辺語の確率を学習させる。単語演算部12は、ニューラルネットワークの隠れ層の重みと、各単語のone-hotベクトルとを掛け合わせることにより、各単語に対応する単語ベクトルを抽出する。
【0043】
単語演算部12は、各単語に対して単語ベクトルを紐付けた単語変換テーブルを生成し(ステップS14)、単語数値記憶部113に記憶する(ステップS15)。文章演算部13は、故障修理事例記憶部112から故障修理事例情報を取得する(ステップS16)。文章演算部13は、故障修理事例情報に含まれる故障修理事例を表す文章を形態素に分割する(ステップS17)。文章演算部13は、単語数値記憶部113が記憶する単語変換テーブルを用いて、単語ごとの単語ベクトルを算出する(ステップS18)。文章演算部13は、単語ベクトルの平均を文章ベクトルとして算出し(ステップS19)、故障修理事例ごとの文章ベクトルを示す文章ベクトル情報を文章数値記憶部114に記憶する(ステップS20)。
【0044】
類似度演算部14は、文章数値記憶部114が記憶する文章ベクトル情報に基づいて、ナレッジグラフにおける関係性となる故障修理事例間の類似度を算出する(ステップS21)。故障修理事例間の類似度には、例えばコサイン類似度を採用する。ステップ21で、類似度演算部14は、故障修理事例に含まれるそれぞれの文章について類似度を算出する。類似度演算部14は、算出した故障修理事例間の類似度を示す類似度情報を類似度記憶部115に記憶する(ステップS22)。
【0045】
ナレッジグラフ構築部15は、故障修理事例記憶部112から故障修理事例情報を取得し(ステップS23)、類似度記憶部115から類似度情報を取得する。ナレッジグラフ構築部15は、故障修理事例記憶部112から取得した故障修理事例情報に基づいて、1つの故障修理事例を1つのエンティティとしてエンティティを定義する(ステップS24)。ナレッジグラフ構築部15は、類似度記憶部115から取得した類似度情報に基づいて、各エンティティをつなぐ関係性を定義する(ステップS25)。ナレッジグラフ構築部15は、構築したナレッジグラフをナレッジグラフ記憶部116に記憶し(ステップS26)、処理を終了する。予め定められた閾値以下の類似度を持つ関係性をナレッジグラフに含まない場合、ステップS25で、ナレッジグラフ構築部15は、予め定められた閾値より大きい類似度を持つ関係性のみ定義する。
【0046】
続いて、ナレッジグラフ生成装置1が実行するナレッジグラフ検索処理の流れについて、図11を用いて説明する。図11に示すナレッジグラフ検索処理は、図10に示すナレッジグラフ生成処理が実行された後に開始する。ナレッジグラフ生成装置1の検索部16がユーザ端末2からユーザが入力した検索ワードを示す入力情報を取得しない場合(ステップS31;NO)、処理はステップS38に移行する。
【0047】
検索部16がユーザ端末2からユーザが入力した検索ワードを示す入力情報を取得した場合(ステップS31;YES)、検索部16は、ユーザ端末2から受け取った入力情報が示す検索ワードのうち、単語数値記憶部113に記憶されている単語変換テーブルに含まれる単語を全て単語ベクトルに変換し、その平均を検索ワード全体のベクトルとして算出する(ステップS32)。次に、検索部16は、文章数値記憶部114に記憶された文章ベクトル情報が示す各故障修理事例の文章ベクトルの中から、最も検索ワード全体のベクトルに近い故障修理事例を特定する(ステップS33)。
【0048】
検索部16は、ナレッジグラフを検索するためのクエリを作成する(ステップS34)。ステップS34で、検索部16は、例えば、最も検索ワード全体のベクトルに近い事例を起点として、2HOP以内に存在するエンティティを抽出するという単純な検索クエリを作成する。検索部16は、作成した検索クエリを用いてナレッジグラフ記憶部116が記憶するナレッジグラフを検索する(ステップS35)。検索部16は、検索結果として抽出されたエンティティを示す検索結果情報を生成する(ステップS36)。検索部16は、ユーザ端末2に検索結果情報を送信する(ステップS37)。ナレッジグラフ生成装置1の電源がOFFになっていなければ(ステップS38;NO)、処理はステップS31に戻り、ステップS31~ステップS38を繰り返す。電源がOFFになると(ステップS38;YES)、処理は終了する。
【0049】
実施の形態1に係るナレッジグラフ生成装置1によれば、定量的に事象の事例を表す文章の類似度を算出し、事象の事例をエンティティ、事象の事例同士の類似度を関係性として、ナレッジグラフを構築することで、ユーザがナレッジグラフから曖昧なつながりを有する事例を検索することが可能になる。
【0050】
(実施の形態2)
実施の形態2では、ナレッジグラフ生成装置1が日々蓄積される故障修理事例を取得し、ナレッジグラフを更新する。実施の形態2に係るナレッジグラフ生成システム200の構成について、図12を用いて説明する。
【0051】
図12に示すように、ナレッジグラフ生成システム200は、ナレッジグラフを生成するナレッジグラフ生成装置1と、故障修理管理システム3と、を備える。故障修理管理システム3には、日々報告される故障修理事例を表す文章を含む故障修理事例情報が蓄積される。
【0052】
ナレッジグラフ生成装置1は、記憶部11と、単語演算部12と、文章演算部と、類似度演算部14と、ナレッジグラフ構築部15とに加え、故障修理管理システム3から故障修理事例情報を取得する故障修理事例取得部17を備える。
【0053】
故障修理事例取得部17は、故障修理管理システム3から取得した故障修理事例情報を故障修理事例記憶部112に記憶する。文章演算部13は、故障修理事例記憶部112に新たに故障修理事例情報が記憶されると、文章演算部13は、単語ベクトルを用いて、故障修理事例情報に含まれる新たな故障修理事例を表す文章を文章ベクトルに変換する。故障修理事例を表す文章を文章ベクトルに変換する方法の例としては、実施の形態1と同様に、取得した故障修理事例を表す文章を形態素に分割し、単語数値記憶部113が記憶する単語変換テーブルを用いて、単語ごとの単語ベクトルを算出し、単語ベクトルの平均を文章ベクトルとする方法がある。文章演算部13は、新たな故障修理事例の文章ベクトルを示す文章ベクトル情報を文章数値記憶部114に記憶する。
【0054】
類似度演算部14は、文章数値記憶部114に記憶された新たな故障修理事例の文章ベクトルを示す文章ベクトル情報と既存の故障修理事例の文章ベクトルを示す文章ベクトル情報とに基づいて、新たな故障修理事例間の類似度、および、新たな故障修理事例と既存の故障修理事例との間の類似度を算出する。新たな故障修理事例が1件である場合には、当然ながら、類似度演算部14は、新たな故障修理事例と既存の故障修理事例との間の類似度のみを算出する。類似度演算部14は、故障修理事例に含まれるそれぞれの文章(例えば、現象、原因および処置)について類似度を算出する。類似度演算部14は、算出した新たな故障修理事例間の類似度を示類似度情報および新たな故障修理事例と既存の故障修理事例との間の類似度を示す類似度情報を類似度記憶部115に記憶する。
【0055】
ナレッジグラフ構築部15は、まず、故障修理事例記憶部112から新たな故障修理事例を表す文章を含む故障修理事例情報を取得し、類似度記憶部115から新たな故障修理事例間の類似度を示類似度情報および新たな故障修理事例と既存の故障修理事例との間の類似度を示す類似度情報を取得する。ナレッジグラフ構築部15は、故障修理事例記憶部112から取得した新たな故障修理事例を表す文章を含む故障修理事例情報に基づいて、新たな故障修理事例を1つのエンティティとしてエンティティを、ナレッジグラフ記憶部116が記憶するナレッジグラフに追加する。ナレッジグラフ構築部15は、類似度記憶部115から取得した新たな故障修理事例間の類似度を示類似度情報および新たな故障修理事例と既存の故障修理事例との間の類似度を示す類似度情報に基づいて、既存のナレッジグラフには存在しない関係性を抽出し、ナレッジグラフに追加する。ナレッジグラフ構築部15は、すべての新たな故障修理事例について、エンティティおよび関係性を追加して、ナレッジグラフを更新する。その他の機能については、実施の形態1と同様である。
【0056】
ここで、ナレッジグラフ生成装置1が実行するナレッジグラフ更新処理の流れについて、図13を用いて説明する。図13に示すナレッジグラフ更新処理は、図10に示すナレッジグラフ生成処理が実行された後に実行される。ナレッジグラフ生成装置1の故障修理事例取得部17が、故障修理管理システム3から故障修理事例情報を取得していない場合(ステップS41;NO)、処理はステップS53に移行する。故障修理事例取得部17が、故障修理管理システム3から故障修理事例情報を取得した場合(ステップS41;YES)、故障修理事例取得部17は取得した故障修理事例情報を故障修理事例記憶部112に記憶する(ステップS42)。
【0057】
文章演算部13は、故障修理事例記憶部112に新たに故障修理事例情報が記憶されると、文章演算部13は、単語ベクトルを用いて、新たな故障修理事例情報に含まれる故障修理事例を表す文章を変換した文章ベクトルを算出する(ステップS43)。文章演算部13は、新たな故障修理事例の文章ベクトルを示す文章ベクトル情報を文章数値記憶部114に記憶する(ステップS44)。
【0058】
類似度演算部14は、文章数値記憶部114に記憶された新たな故障修理事例の文章ベクトルを示す文章ベクトル情報と既存の故障修理事例の文章ベクトルを示す文章ベクトル情報とに基づいて、新たな故障修理事例間の類似度、および、新たな故障修理事例と既存の故障修理事例との間の類似度を算出する(ステップS45)。新たな故障修理事例が1件である場合には、ステップS45で、類似度演算部14は、新たな故障修理事例と既存の故障修理事例との間の類似度のみを算出する。また、ステップS45で、類似度演算部14は、故障修理事例に含まれるそれぞれの文章(例えば、現象、原因および処置)について類似度を算出する。類似度演算部14は、算出した新たな故障修理事例間の類似度を示類似度情報および新たな故障修理事例と既存の故障修理事例との間の類似度を示す類似度情報を類似度記憶部115に記憶する(ステップS46)。
【0059】
ナレッジグラフ構築部15は、まず、故障修理事例記憶部112から新たな故障修理事例を表す文章を含む故障修理事例情報を取得し(ステップS47)、類似度記憶部115から新たな故障修理事例間の類似度を示類似度情報および新たな故障修理事例と既存の故障修理事例との間の類似度を示す類似度情報を取得する(ステップS48)。ナレッジグラフ構築部15は、故障修理事例記憶部112から取得した新たな故障修理事例を表す文章を含む故障修理事例情報に基づいて、新たな故障修理事例を1つのエンティティとしてエンティティを、ナレッジグラフ記憶部116が記憶するナレッジグラフに追加する(ステップS49)。ナレッジグラフ構築部15は、類似度記憶部115から取得した新たな故障修理事例間の類似度を示類似度情報および新たな故障修理事例と既存の故障修理事例との間の類似度を示す類似度情報に基づいて、既存のナレッジグラフには存在しない関係性を抽出し、ナレッジグラフに追加する(ステップS50)。すべての新たな故障修理事例について、エンティティおよび関係性を追加した場合(ステップS51;YES)、ナレッジグラフ構築部15は、ナレッジグラフを更新する(ステップS52)。新たな故障修理事例について、エンティティおよび関係性を追加していない故障修理事例がある場合(ステップS51;NO)、処理はステップS49に戻り、ステップS49~ステップS51を繰り返す。ナレッジグラフ生成装置1の電源がOFFになっていなければ(ステップS53;NO)、処理はステップS41に戻り、ステップS41~ステップS53を繰り返す。電源がOFFになると(ステップS53;YES)、処理は終了する。
【0060】
実施の形態2に係るナレッジグラフ生成装置1によれば、定量的に文章の類似度を算出し、類似度を関係性とするナレッジグラフを構築することで、ユーザがナレッジグラフから曖昧なつながりを有する事例を検索することが可能になる。また、定期的にナレッジグラフを更新することで、ナレッジグラフの陳腐化を防ぐことができる。
【0061】
ナレッジグラフ生成装置1のハードウェア構成について図14を用いて説明する。図14に示すように、ナレッジグラフ生成装置1は、一時記憶部101、記憶部102、計算部103、入力部104、送受信部105および表示部106を備える。一時記憶部101、記憶部102、入力部104、送受信部105および表示部106はいずれもBUSを介して計算部103に接続されている。
【0062】
計算部103は、例えばCPU(Central Processing Unit)である。計算部103は、記憶部102に記憶されている制御プログラムに従って、単語演算部12、文章演算部13、類似度演算部14、ナレッジグラフ構築部15、検索部16および故障修理事例取得部17の処理を実行する。
【0063】
一時記憶部101は、例えばRAM(Random-Access Memory)である。一時記憶部101は、記憶部102に記憶されている制御プログラムをロードし、計算部103の作業領域として用いられる。
【0064】
記憶部102は、フラッシュメモリ、ハードディスク、DVD-RAM(Digital Versatile Disc - Random Access Memory)、DVD-RW(Digital Versatile Disc - ReWritable)などの不揮発性メモリである。記憶部102は、ナレッジグラフ生成装置1の処理を計算部103に行わせるためのプログラムを予め記憶し、また、計算部103の指示に従って、このプログラムが記憶する情報を計算部103に供給し、計算部103から供給された情報を記憶する。記憶部11は、記憶部102に構成される。
【0065】
入力部104は、キーボード、ポインティングデバイス、音声入力機器などの入力装置と、入力装置をBUSに接続するインターフェース装置である。入力部104を介して、ユーザが入力した情報が計算部103に供給される。検索部16が、ユーザによる入力を受け付ける場合、入力部104は、検索部16として機能する。故障修理事例取得部17が、ユーザによる入力を受け付ける場合、入力部104は、故障修理事例取得部17として機能する。
【0066】
送受信部105は、ネットワークに接続する網終端装置または無線通信装置、およびそれらと接続するシリアルインターフェースまたはLAN(Local Area Network)インターフェースである。検索部16が、入力情報をユーザ端末2から受信する構成の場合、あるいは、検索結果情報をユーザ端末2に送信する構成の場合、送受信部105は、検索部16として機能する。故障修理事例取得部17が、故障修理事例情報を故障修理管理システム3から受信する構成の場合、送受信部105は、故障修理事例取得部17として機能する。
【0067】
表示部106は、LCD(Liquid Crystal Display)、有機EL(electroluminescence)ディスプレイなどの表示装置である。検索部16が、検索結果情報を画面表示する構成の場合、表示部106は、検索部16として機能する。
【0068】
図1および図12に示すナレッジグラフ生成装置1の記憶部11,単語演算部12、文章演算部13、類似度演算部14、ナレッジグラフ構築部15、検索部16および故障修理事例取得部17の処理は、制御プログラムが、一時記憶部101、計算部103、記憶部102、入力部104、送受信部105および表示部106などを資源として用いて処理することによって実行する。
【0069】
その他、前記のハードウェア構成およびフローチャートは一例であり、任意に変更および修正が可能である。
【0070】
計算部103、一時記憶部101、記憶部102、入力部104、送受信部105、表示部106などのナレッジグラフ生成装置1の処理を行う中心となる部分は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。例えば、前記の動作を実行するためのコンピュータプログラムを、フレキシブルディスク、CD-ROM(Compact Disc - Read Only Memory)、DVD-ROM(Digital Versatile Disc - Read Only Memory)などのコンピュータが読み取り可能な記録媒体に格納して配布し、当該コンピュータプログラムをコンピュータにインストールすることにより、前記の処理を実行するナレッジグラフ生成装置1を構成してもよい。また、インターネットに代表される通信ネットワーク上のサーバ装置が有する記憶装置に当該コンピュータプログラムを格納しておき、通常のコンピュータシステムがダウンロードすることでナレッジグラフ生成装置1を構成してもよい。
【0071】
また、ナレッジグラフ生成装置1の機能を、OS(Operating System)とアプリケーションプログラムの分担、またはOSとアプリケーションプログラムとの協働により実現する場合などには、アプリケーションプログラム部分のみを記録媒体、記憶装置に格納してもよい。
【0072】
また、搬送波にコンピュータプログラムを重畳し、通信ネットワークを介して提供することも可能である。例えば、通信ネットワーク上の掲示板(BBS, Bulletin Board System)に前記コンピュータプログラムを掲示し、通信ネットワークを介して前記コンピュータプログラムを提供してもよい。そして、このコンピュータプログラムを起動し、OSの制御下で、他のアプリケーションプログラムと同様に実行することにより、前記の処理を実行できる構成にしてもよい。
【0073】
上記の実施の形態1では、ナレッジグラフ生成装置1は検索部16を備えるが、これに限らない。ナレッジグラフ生成装置1は、検索部16を備えない構成にしてもよい。この場合、検索部16は、ユーザ端末2が備えてもよいし、他の装置またはシステムが備えてもよい。
【0074】
上記の実施の形態2では、ナレッジグラフ生成装置1の故障修理事例取得部17は、故障修理管理システム3から故障修理事例情報を取得したが、これに限らない。例えば、機器の故障修理の担当者が使用する担当者端末から故障修理事例情報を受信してもよい。担当者端末は、機器の故障修理を担当した担当者による故障修理事例の入力を受け付ける。担当者端末は、故障修理事例を示す故障修理事例情報をナレッジグラフ生成装置1に送信する。担当者端末は1台に限らず、複数の担当者端末から故障修理事例情報を収集してもよい。
【0075】
上記の実施の形態1および2について、別々に説明したが、実施の形態1および2を組み合わせてもよい。つまり、ナレッジグラフ生成装置1、ユーザ端末2および故障修理管理システム3を備えるナレッジグラフ生成システムを構成してもよい。
【0076】
上記の実施の形態1および2では、ナレッジグラフ生成装置1が故障修理事例のナレッジグラフを生成する例について説明したが、これに限らない。ナレッジグラフ生成装置1は、曖昧なつながりを有する様々な事象のナレッジグラフを生成することができる。
【0077】
上記の実施の形態1および2では、故障時の現象が似ている、原因が似ている、処置が似ている、といった曖昧なつながりを有する故障修理事例のナレッジグラフをナレッジグラフ生成装置1が生成する例について説明したが、これに限らない。ナレッジグラフ生成装置1は、曖昧なつながりだけでなく、故障修理を依頼した顧客が一致する、故障修理を行った機器の機種が一致する、といった明確なつながりも含むナレッジグラフを生成してもよい。
【0078】
以上、好ましい実施の形態について詳説したが、上述した実施の形態に制限されることはなく、特許請求の範囲に記載された範囲を逸脱することなく、上述した実施の形態に種々の変形及び置換を加えることができる。
【0079】
以下、本開示の諸態様を付記としてまとめて記載する。
【0080】
(付記1)
事象に関連する文書に含まれる単語を数値化して単語ベクトルに変換する単語演算部と、
前記単語ベクトルを用いて、前記事象の事例を表す文章を文章ベクトルに変換する文章演算部と、
前記文章ベクトルに基づいて、前記事象の事例同士の類似度を算出する類似度演算部と、
前記事象の事例をエンティティ、前記事象の事例同士の類似度を関係性として、前記事象の事例のナレッジグラフを構築するナレッジグラフ構築部と、
を備えるナレッジグラフ生成装置。
(付記2)
前記事象は、機器の故障修理であって、
前記単語演算部は、
機器の故障修理に関連する故障修理文書に含まれる単語を数値化して単語ベクトルに変換し、
前記文章演算部は、
前記単語ベクトルを用いて、故障修理事例を表す文章を文章ベクトルに変換し、
前記類似度演算部は、
前記文章ベクトルに基づいて、前記故障修理事例同士の類似度を算出し、
前記ナレッジグラフ構築部は、
前記故障修理事例をエンティティ、前記故障修理事例同士の類似度を関係性として、前記故障修理事例のナレッジグラフを構築する、
付記1に記載のナレッジグラフ生成装置。
(付記3)
前記故障修理事例のナレッジグラフからユーザが入力した故障修理対象の特徴に近い前記故障修理事例を検索し、検索結果を前記ユーザに提示する検索部、
をさらに備える、
付記2に記載のナレッジグラフ生成装置。
(付記4)
前記検索部は、
前記ユーザが入力した前記故障修理対象の特徴を表す検索ワードの中の単語を前記単語ベクトルに変換し、変換した前記単語ベクトルの平均を検索ワード全体のベクトルとして算出し、前記故障修理事例の前記文章ベクトルの中から、最も前記検索ワード全体のベクトルに近い前記故障修理事例を特定し、特定した前記故障修理事例に基づいて検索クエリを作成し、作成した前記検索クエリを用いて前記故障修理事例のナレッジグラフを検索し、検索結果として抽出されたエンティティを示す検索結果情報を生成し、出力する、
付記3に記載のナレッジグラフ生成装置。
(付記5)
前記故障修理事例を表す文章を含む故障修理事例情報を取得する故障修理事例取得部をさらに備え、
前記文章演算部は、
前記単語ベクトルを用いて、前記故障修理事例情報に含まれる新たな故障修理事例を表す文章を文章ベクトルに変換し、
前記類似度演算部は、
前記文章ベクトルに基づいて、前記新たな故障修理事例間の類似度、および、前記新たな故障修理事例と既存の故障修理事例との間の類似度を算出し、
前記ナレッジグラフ構築部は、
前記新たな故障修理事例をエンティティとして追加し、前記新たな故障修理事例間の類似度、および、前記新たな故障修理事例と既存の故障修理事例との間の類似度を関係性として、前記故障修理事例のナレッジグラフを更新する、
付記2から4のいずれかに記載のナレッジグラフ生成装置。
(付記6)
ナレッジグラフを生成するナレッジグラフ生成装置と、ユーザが使用するユーザ端末とを備え、
前記ユーザ端末は、前記ユーザからの検索対象の特徴の入力を受け付け、前記検索対象の特徴を示す入力情報を前記ナレッジグラフ生成装置に送信し、
前記ナレッジグラフ生成装置は、
事象に関連する文書に含まれる単語を数値化して単語ベクトルに変換する単語演算部と、
前記単語ベクトルを用いて、前記事象の事例を表す文章を文章ベクトルに変換する文章演算部、
前記文章ベクトルに基づいて、前記事象の事例同士の類似度を算出する類似度演算部、
前記事象の事例をエンティティ、前記事象の事例同士の類似度を関係性として、前記事象の事例のナレッジグラフを構築するナレッジグラフ構築部、および、
前記事象の事例のナレッジグラフから、前記ユーザ端末から受信した前記入力情報が示す前記検索対象の特徴に近い前記事象の事例を検索し、検索結果を示す検索結果情報を前記ユーザに提示する検索部、
を備え、
前記ユーザ端末は、前記ナレッジグラフ生成装置から受信した前記検索結果情報を出力するナレッジグラフ生成システム。
(付記7)
ナレッジグラフ生成装置が実行する、
事象に関連する文書に含まれる単語を数値化して単語ベクトルに変換するステップと、
前記単語ベクトルを用いて、前記事象の事例を表す文章を文章ベクトルに変換するステップと、
前記文章ベクトルに基づいて、前記事象の事例同士の類似度を算出するステップと、
前記事象の事例をエンティティ、前記事象の事例同士の類似度を関係性として、前記事象の事例のナレッジグラフを構築するステップと、
を備える、ナレッジグラフ生成方法。
(付記8)
コンピュータを、
事象に関連する文書に含まれる単語を数値化して単語ベクトルに変換する単語演算部、
前記単語ベクトルを用いて、前記事象の事例を表す文章を文章ベクトルに変換する文章演算部、
前記文章ベクトルに基づいて、前記事象の事例同士の類似度を算出する類似度演算部、および、
前記事象の事例をエンティティ、前記事象の事例同士の類似度を関係性として、前記事象の事例のナレッジグラフを構築するナレッジグラフ構築部、
として機能させるプログラム。
【符号の説明】
【0081】
1 ナレッジグラフ生成装置、2 ユーザ端末、3 故障修理管理システム、11 記憶部、12 単語演算部、13 文章演算部、14 類似度演算部、15 ナレッジグラフ構築部、16 検索部、17 故障修理事例取得部、100,200 ナレッジグラフ生成システム、101 一時記憶部、102 記憶部、103 計算部、104 入力部、105 送受信部、106 表示部、111 故障修理文書記憶部、112 故障修理事例記憶部、113 単語数値記憶部、114 文章数値記憶部、115 類似度記憶部、116 ナレッジグラフ記憶部。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14