(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023032128
(43)【公開日】2023-03-09
(54)【発明の名称】故障知識構築システム及び方法
(51)【国際特許分類】
G06Q 10/20 20230101AFI20230302BHJP
G06F 16/383 20190101ALI20230302BHJP
【FI】
G06Q10/00 300
G06F16/383
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2021138061
(22)【出願日】2021-08-26
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110000350
【氏名又は名称】ポレール弁理士法人
(72)【発明者】
【氏名】森岡 智陽
(72)【発明者】
【氏名】難波 康晴
(72)【発明者】
【氏名】人見 俊太郎
【テーマコード(参考)】
5B175
5L049
【Fターム(参考)】
5B175DA01
5B175HB03
5L049CC15
(57)【要約】
【課題】文書からの保全に関連する知識抽出の名寄せ精度の向上。
【解決手段】保全の対象機器についての保全情報として、故障,処置および保全の実施手順を蓄積し、記憶する故障知識データベースと,対象機器の保全情報を記述する保全文書から、故障表現と処置表現を抽出する表現抽出部と,表現抽出部の抽出結果と、故障知識データベースの保全の実施手順の情報をもとに,故障表現と処置表現の各表現の前後に実施される保全の実施手順の出現頻度を計算し、故障表現と処置表現の各表現同士の分布間距離を計算する名寄せ部と,名寄せ部の処理結果を名寄せ候補として描画し手動編集操作を可能とする入出力部と,入出力部の情報を編集した結果を故障知識データベースに保存するデータベース編集部を具備することを特徴とする故障知識構築システム。
【選択図】
図1
【特許請求の範囲】
【請求項1】
保全の対象機器についての保全情報として、故障,処置および保全の実施手順を蓄積し、記憶する故障知識データベースと,
対象機器の前記保全情報を記述する保全文書から、故障表現と処置表現を抽出する表現抽出部と,
前記表現抽出部の抽出結果と、前記故障知識データベースの保全の実施手順の情報をもとに,故障表現と処置表現の各表現の前後に実施される保全の実施手順の出現頻度を計算し、故障表現と処置表現の各表現同士の分布間距離を計算する名寄せ部と,
前記名寄せ部の処理結果を名寄せ候補として描画し手動編集操作を可能とする入出力部と,
前記入出力部の情報を編集した結果を前記故障知識データベースに保存するデータベース編集部を具備することを特徴とする故障知識構築システム。
【請求項2】
請求項1に記載の故障知識構築システムであって、
前記入出力部には、名寄せ処理の結果が表示され、再度の名寄せ処理の指示が入力でき、再度の名寄せ処理の指示に応じて、前記名寄せ部の処理を再度実施することを特徴とする故障知識構築システム。
【請求項3】
請求項1に記載の故障知識構築システムであって、
前記入出力部において、名寄せ候補および手動編集に有用な情報となる処理の際に活用した名寄せ周辺情報を描画することを特徴とする故障知識構築システム。
【請求項4】
請求項1に記載の故障知識構築システムであって、
前記名寄せ部において、前記表現抽出部で抽出できていなかった故障や処置を前記故障知識データベースの手順情報から補完することを特徴とする故障知識構築システム。
【請求項5】
対象機器の保全情報を記述する保全文書から、機器及び部品の故障内容を記述した故障表現と、当該故障内容の時に実施した処置内容を記述した処置表現を抽出し,
複数の前記故障表現と複数の前記処置表現について、その組み合わせを求め、特定の前記故障表現に対する前記処置表現の記述回数に応じた名寄せ処理を実施し、
名寄せ処理結果についての人的判断結果を反映した情報を故障知識として故障知識データベースに反映する故障知識構築方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は,故障知識構築システム及び方法に関する。
【背景技術】
【0002】
保全現場の人員不足解消のために,保全に関する知識を集積し活用することで効率的な保全を実現する方法が求められる。しかし,効率的な保全に必要となるデータベース化された知識を手動で構築することは工数がかかるため,導入コストが大きい。そのため,保全関連文書から保全に関する知識を自動で抽出する技術が必要となる。
【0003】
文書からの情報抽出に関する技術として,例えば特許文献1が知られている。特許文献1では、類似文字列の抽出対象のデータの増大による抽出処理負荷の増大を抑制することを目的として、「所定の文字列との間の編集距離が所定数(d)以下の文字列を文字列群から抽出する抽出プログラムは、前記所定の文字列内の連続する文字列である1または複数の部分文字列であって、前記所定の文字列において連続する文字数(n)が前記所定の文字列の文字数(m)を前記所定数(d)で除算した商よりも小さい、1または複数の部分文字列を抽出し、抽出された前記1または複数の部分文字列のいずれかを含む文字列を前記文字列群から抽出し、前記文字列群から抽出された文字列について、前記所定の文字列との間の編集距離が所定の距離(d)以下であるか否か判定する、処理をコンピュータに実行させる。」ものである。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
文書からの知識情報の抽出において,似たような意味の情報を一つの情報としてまとめる「名寄せ」は難しい課題とされており,様々な手法が提案されている。特許文献1では,文書からの情報の抽出において,抽出された二つの文字列の編集距離の大きさを判定し,距離が近いものは名寄せする,というやり方で名寄せを実現する。
【0006】
しかし,この手法では文字列的に大きく異なるものは名寄せできない。また,保全の分野においては,一般的な単語の使われ方と異なる単語の用いられ方があり,あるいは専門用語が存在しているため,一般的な自然言語処理で用いられるような名寄せ手法が適用することが難しい場合がある。
【0007】
以上のことから,名寄せをする際に保全に特徴的な情報の関係性を利用することで名寄せを実現するシステム及び方法が必要となっている。
【課題を解決するための手段】
【0008】
以上のことから本発明においては、「保全の対象機器についての保全情報として、故障,処置および保全の実施手順を蓄積し、記憶する故障知識データベースと,対象機器の保全情報を記述する保全文書から、故障表現と処置表現を抽出する表現抽出部と,表現抽出部の抽出結果と、故障知識データベースの保全の実施手順の情報をもとに,故障表現と処置表現の各表現の前後に実施される保全の実施手順の出現頻度を計算し、故障表現と処置表現の各表現同士の分布間距離を計算する名寄せ部と,名寄せ部の処理結果を名寄せ候補として描画し手動編集操作を可能とする入出力部と,入出力部の情報を編集した結果を故障知識データベースに保存するデータベース編集部を具備することを特徴とする故障知識構築システム。」としたものである。
【0009】
また本発明は、「対象機器の保全情報を記述する保全文書から、機器及び部品の故障内容を記述した故障表現と、当該故障内容の時に実施した処置内容を記述した処置表現を抽出し,複数の故障表現と複数の処置表現について、その組み合わせを求め、特定の故障表現に対する処置表現の記述回数に応じた名寄せ処理を実施し、名寄せ処理結果についての人的判断結果を反映した情報を故障知識として故障知識データベースに反映する故障知識構築方法。」としたものである。
【発明の効果】
【0010】
本発明にかかる故障知識構築システム及び方法によって,文書からの保全に関連する知識抽出の名寄せ精度が向上する。これにより,より品質の高い保全関連知識のデータが作成可能となる。また,このような保全関連の知識データの構築にかかる工数を削減する。
【図面の簡単な説明】
【0011】
【
図1】故障知識構築システム1の基本概念を説明するための図。
【
図2】故障知識データベースDBの構成例として、保全内容を模式的に示した図。
【
図6】故障と処置についての前後手順マップの例を示す図。
【
図7】本発明の実施例2に係る故障知識構築システムの全体構成例を示す図。
【
図9】本発明の実施例2に係る名寄せ部22の処理内容を詳細に示す図。
【
図10】名寄せ部22での処理を表すフローチャート。
【
図12】抽出結果追加後の故障前後手順マップの例を示す図。
【
図15】表現抽出部21で抽出したデータを編集したデータの例を示す図。
【
図16】本発明の実施例3に係る名寄せ部22の処理内容を詳細に示す図。
【
図17】手順欠損確率計算部1501の出力を示す図。
【
図18】抽出データ欠損補完部1502の出力を示す図。
【発明を実施するための形態】
【0012】
以下,本発明の実施例について図面を用いて説明する。
【実施例0013】
実施例1では、本発明の基本的な処理概念について説明する。本発明では、機器や部品に対して実行した保全の際に、保全員が作成した記録や報告書である保全実施ログに記載の情報を用いた名寄せ処理により、高精度の故障知識データベースを簡便に構築しようとしている。
【0014】
図1は故障知識構築システム1の基本概念を説明するための図である。故障知識構築システム1は、計算機を用いて構成されており、記憶部10内に一時記憶部Mと故障知識データベースDBを備え、演算部20において実行される各種処理機能として、表現抽出部21,名寄せ部22,データベース編集部23の各機能を備える。また、入出力部24を介してデータベース編集者19と連携している。
【0015】
図1の基本概念図において保全実施ログD1には、種々の内容が自由記述により記載されているが、この中には機器や部品に対して実行した保全の情報として、故障内容の情報D1aとその結果として行った処置についての情報D1bを含んでいる。故障内容の情報D1aは、日付、部品名の他に例えば磁気ヘッドについて故障内容が「汚れる」、「汚損」、「破損」などの表現で自由記載されている。また処置情報D1bは、日付、部品名の他に処置内容が「清掃」、「調整」、「交換」などの表現で自由記載されている。この例の場合に、「汚れる」、「汚損」、「破損」は、いずれも故障内容を表現したものであるが、この表現の仕方は保全員によりさまざまである。また、同義の他の用語で表現される可能性もある。
【0016】
表現抽出部21では,自由記述された保全実施ログD1の多くの用語の中から、故障内容の情報D1aにおける故障内容の表現である「汚れる」、「汚損」、「破損」を抽出し、また処置情報D1bにおける処置内容の表現である「清掃」、「交換」を抽出する。
【0017】
名寄せ部22では、まず故障内容の表現「汚れる」、「汚損」、「破損」と、処置内容の表現「清掃」、「調整」、「交換」の組み合わせD1cを作成する。次に名寄せ部22では、各表現での故障の時の各処置表現の出現頻度を計算し用語出現頻度情報D1dを求める。図示の例では故障用語が「汚れる」である場合に、処置用語が「清掃」、「調整」、「交換」である出現頻度が算出されている。同様に、「汚損」、「破損」のときの処置用語の出現頻度が求められる。さらに名寄せ部22では、この出現頻度が高い情報の組み合わせから最終的に名寄せ後情報D1eを得る。この例では例えば、磁気ヘッドについての故障表現「汚れる」、「汚損」は名寄せ処理により同義と解釈されてこの時の処置は「清掃」である確率が最も高く、他方「破損」は「汚れる」、「汚損」とは異なる故障事象であり、この時の処置は「交換」である確率が最も高いと判断される。
【0018】
名寄せ部22で求められた中間生成物としての各情報D1c,D1d,D1eなどは適宜入出力部24を介して外部出力することが可能とされ、データベース編集者19による修正後に故障知識データベースDBに故障知識Dとして格納される。
【0019】
このようにして名寄せにより構成された故障知識データベースDBの構成例が
図2から
図5に示されている。まず
図2は故障知識データベースDBの構成例である。保全内容を模式的に示した図であり、対象となる機器とその部品の構成、及び、故障と処置の関係の一例を示した図である。故障知識データベースDBには、保全の対象機器についての保全情報として、故障,処置および保全の手順を蓄積し、記憶している。
【0020】
図2の記述関係によれば、保全の対象となる機器Aは、部品B,部品Cから構成されており、さらに部品B,部品Cは、それぞれ部品D,部品Eを含んでいることを表している。また例えば部品Cにおける故障Fとこれに対する処置H,部品Eにおける故障Gとこれに対する処置i,j、さらには部品C,E間にまたがる処置Hと故障Gの関係などを表している。
【0021】
機器Aについてのこれらの情報を保存する故障知識データベースDBの記憶方式は、例えばノードNと、ノードN間の関係を表すエッジEによって表現されるグラフデータベースで実装されたものである。ノードNとエッジEは,
図2で示されているほかに,それぞれプロパティと呼ばれる付加情報を持つのがよい。
【0022】
図2においてノードNとは、楕円で示した機器Aやその部品B-E、ならびに四角で示した故障F,Gおよび処置H,I,jのことであり、これらは,部品ノード(N101-N105),故障ノード(N106、N108),処置ノード(N107,N109,N110)を表している。
【0023】
またエッジEとは、ノードN間の関係を示したものであり、部品間或は部品と機器の間の親子関係(E201-E206),部品と故障の間の部品-故障関係(E204,E208),部品と処置の間の部品-処置関係(E205,E209,E210),故障と処置の間の実施手順関係(E206,E207,E211,E212)というエッジによって故障知識データベースDBが構成されていることを示している。
【0024】
なお、故障知識データベースDBには、これらに付随したプロパティ情報として,他に知識として保存が必要な情報が含まれていてもよい。例えば,故障原因を調べる際に用いられる検査項目の情報をノードとして付加したり,故障同士の因果関係をエッジとして付加したりしてもよい。また,
図2で示されているノードの種類はさらに細分化してもよい。例えば,処置ノード(N107,N109,N110)を実施する作業のノードと故障を修理するための対策のノードに分けたり,故障ノード(N106、N108)を症状,外部原因,内部原因などに細分化したりしてもよい。
【0025】
このように、故障知識データベースDBは,保全の対象となる機器に関する保全知識Dをデータとして格納する。故障知識データベースDBに格納された故障知識Dは,各種保全サービスや設計・運用業務との連携において活用可能である。例えば,保全員に修理の手順を指示するシステムや,故障の原因を推定するシステムなどである。内部の情報は名寄せ部22で行われる処理の中で使用される。また,最終的にデータベース編集者19が編集した結果が故障知識データベースDBに保存される。故障知識データベースDBの実装形態はリレーショナルデータベースだけでなく,グラフデータベースでもよい。本実施例では,グラフデータベースでの実装について,
図2にて説明している。
【0026】
故障知識データベースDBによれば、以下のノードNおよびエッヂEが連携して使用されることで部品が定義されている。このうち部品ノード(N101-N105)は部品に関する情報を持つ。部品の親子関係は部品親子関係エッジ(E201-E206)で記述される。また,部品がどのような故障を起こすかに関する情報は部品-故障関係エッジ(E204,E208)に記述される。保全作業の手順の中で部品に対してどのような処置を行うかについては部品-処置関係エッジ(E205,E209,E210)で記載される。
【0027】
部品の主たる情報である部品ノード(N101-N105)のプロパティを
図3に示している。
図3は、部品ノードN103のときのプロパティ(DN301-DN304)の一例であり,
図3に示すもの以外が含まれていてもよい。部品ID(DN301)は,故障知識データベースDB内で部品を一意に特定するために保持されるものであり、この例ではP_003として定義されている。なお他の部品ノードの部品ID(DN301)と重複することはない。部品名称DN302は部品の名称を記載するものであり、この例では部品Cとして定義されている。なお他のノードの部品名称DN302と重複があってもよいが,その場合は表現抽出部21で抽出したものを名寄せ部22で部品ノード(N101-N105)に紐づける処理が必要となる。
【0028】
そのほか
図3ではプロパティとして,説明DN303や部品名称の同義表現DN304を持つこととする。説明DN303には、部品Cについての説明が説明Cとして記述され、さらに部品名称の同義表現DN304には、部品Cについての説明が説明C´あるいは説明C´´として記述されている。これは、これらの表現は、表現上の相違はあるものの、基本的に同じことの説明であることを示している。なお、同義表現DN304は表現抽出部21で抽出した部品名を部品ノード(N101-N105)に紐づける際に有用である。
【0029】
部品親子関係エッジ(E201-E206)は、
図2の矢印で示すように部品の親子関係を示す有向のエッジである。
図2の例では,機器Aの要素として部品Bと部品Cが存在し部品Bの中には部品Dがある,という機器Aの部品構造展開に関する知識を記述している。
【0030】
部品-故障関係エッジ(E204,E208)は,
図2の矢印で示すようにどの部品でどのような故障が生じるかを示す有向のエッジである。例えば,
図2では部品Cで故障Fという故障を発生するということを示している。
【0031】
部品-処置関係(E205,E209,E210)では,
図2の矢印で示すようにどの部品に対してどのような処置を行うかを示す有向のエッジである。例えば,
図2では部品Cの処置Hという作業について記述している。
【0032】
故障知識データベースDBによれば、以下のノードNおよびエッヂEが連携して使用されることで故障が定義されている。このうち故障ノード(N106、N108)は故障の情報を持つ。部品-故障関係エッジ(E204,E208)によって紐づく部品が示される。前後の保全実施手順については,実施手順関係エッジ(E206,E207,E211,E212)で記述し,これによって他の故障ノード(N106、N108)や処置ノード(N107,N109,N110)と紐づく。故障ノード(N106、N108)が持つプロパティを
図4で説明する。
【0033】
図4は、故障ノードN108のときのプロパティの一例を
図4に示す。プロパティ(DN401-DN406)は一例であり,
図4に示す以外のものが含まれていてもよい。故障ID(DN401)は故障ノードを一意に示すIDとなっている。他の故障ノードと重複することはない。故障名称DN402は故障の代表的な名称を記載する。
【0034】
説明DN403は故障に関して説明情報を記載する。また同義表現DN404は,故障ノード202が示す故障現象を言い表す際に故障名称DN402以外に用いられる表現を記載する。説明DN403には、故障Gについての説明が説明Gとして記述され、さらに同義表現DN404が存在する場合には、故障Gについての同義表現のものが記述されることになる。これは、これらの表現は、表現上の相違はあるものの、基本的に同じことの説明であることを示している。
図1の例では、故障表現「汚れる」と「汚損」がこれに該当している。本発明の名寄せ処理の結果得られる該当の故障とまとめるべき故障の表現はここに保存される。その後,新たに知識抽出する際は,名寄せ部22の処理の一環で,表現抽出部21で抽出した結果を故障ノード(N106、N108)に紐づけるときに使用される。
【0035】
出現頻度DN405は、故障ノードN108で表す故障現象が過去の保全実施ログD1からの知識抽出の際に何回出現したかを格納する。また,前後手順出現頻度DN406は,故障ノードN108(故障G)に相当する表現が保全実施ログD1から抽出されたときに,その前後に手順として他の故障ノード(N106、N108)や処置ノード(N107,N109,N110)が現れたか,という出現頻度を格納する。
【0036】
前後手順出現頻度DN406はテーブルデータのような形で保存する。
図4では縦軸の該当する故障ノードN108の故障F_019(故障G)に対して,その前後にどのような手順が記載されていたか横軸に記載されている。例えば,処置ノード(N107,N109,N110)の一つであるA_008(N107)は過去の保全実施ログD1の中でF_019の前の手順として15回記載されており、A_009(N110)は過去の保全実施ログD1の中でF_019の後の手順として30回記載されていた,というような形になっている。
【0037】
このように,前後の手順に該当するノードのIDとその表現が前後どちらの手順として記載されていたか,そしてその頻度という情報が示されている。前後手順出現頻度DN406が書かれる対象となる他のノードは,該当の故障ノード(N106、N108)と実施手順関係エッジ(E206,E207,E211,E212)で結ばれているノード,あるいは実施手順関係エッジ(E206,E207,E211,E212)をたどった先にあるノードである。例えば,
図2の部品Eの故障Gの場合,実施手順関係エッジE207でつながっている部品Cの処置H,という処置ノード以外に,その先にある部品Cの故障Fという故障ノードN106も前後手順出現頻度の対象ノードとなる。出現頻度DN405および前後手順出現頻度DN406は,名寄せ部22での分布計算のときに使用される。
【0038】
実施手順関係エッジ(E206,E207,E211,E212)は保全実施手順の情報を持つ有向のエッジである。
図2の例では,部品Cが故障Fとなったときに,部品Cの処置Hを行う,部品Eが故障Gのときには,部品Eに処置Iを行う,あるいは部品Eに処置Jを行う,というような作業手順を記載している。実施手順は分岐があってもよいため,一つのノードが複数のノードへ実施手順関係エッジ(E206,E207,E211,E212)を伸ばしていてもよいし,複数のノードから一つのノードへ実施手順関係エッジ(E206,E207,E211,E212)が向かっていてもよい。
【0039】
また故障知識データベースDBによれば、以下のノードNおよびエッヂEが連携して使用されることで処置が定義されている。このうち処置ノード(N107,N109,N110)は処置に関する情報を持つ。紐づく部品は部品-処置関係エッジ(E205,E209,E210)で記述される。前後の保全実施手順は実施手順関係エッジ(E206,E207,E211,E212)で記述し,故障ノード(N106、N108)や他の処置ノード(N107,N109,N110)との関係が記述される。
【0040】
処置の主たる情報である処置ノード(N107,N109,N110)のプロパティを
図5に示している。
図5は、処置ノードN107のときのプロパティ(DN501-DN506)の一例であり,
図5に示す以外のものが含まれていてもよい。処置ID(DN501)は処置ノード(N107,N109,N110)を一意に表すIDとなっている。他の処置ノード(N107,N109,N110)と重複することはない。処置名称DN502は処置の代表的な名称を表す。
【0041】
説明DN503は処置の説明を記す。また同義表現DN504は処置ノード(N107,N109,N110)が表す処置を言い表す際の処置名称DN502以外の表現を格納する。本発明の結果得られる該当の処置の同義表現はここに格納される。
図5の場合には、説明DN503には、処置Hについての説明が説明Hとして記述され、さらに処置Hの同義表現DN504には、処置Hについての説明が説明H´として記述されている。これは、これらの表現は、表現上の相違はあるものの、基本的に同じことの説明であることを示している。その後新たに知識抽出する際は,名寄せ部22の処理の一環で,表現抽出部21で抽出した結果を処置ノード(N107,N109,N110)に紐づけるときに使用される。
【0042】
出現頻度DN505は処置ノード(N107,N109,N110)で表す処置が過去の保全実施ログD1からの知識抽出の際に何回出現したかを格納する。また,前後手順出現頻度DN506は処置ノード(N107,N109,N110)に相当する表現が保全実施ログD1から抽出されたときに,その前後に手順として他の故障ノード(N106、N108)や処置ノード(N107,N109,N110)が現れたか,という出現頻度を格納する。前後手順出現頻度DN506はテーブルデータのような形で保存する。
【0043】
図5では縦軸の該当する処置ノードN107の処置A_008(処置H)に対して,その前後にどのような手順が記載されていたか横軸に記載されている。例えば,処置ノード(N107,N109,N110)の一つである処置ノードN109のA_009(処置I)は過去の保全実施ログD1の中でA_008の後の手順として10回記載されていた,というような形になっている。このように,前後の手順に該当するノードのIDとその表現が前後どちらの手順として記載されていたか,そしてその頻度という情報が示されている。前後手順出現頻度DN506が書かれる対象となる他のノードは,該当の処置ノード(N107,N109,N110)と実施手順関係エッジ(E206,E207,E211,E212)で結ばれているノード,あるいは実施手順関係エッジ(E206,E207,E211,E212)をたどった先にあるノードである。出現頻度DN505および前後手順出現頻度DN506は,後述する名寄せ部22での分布計算のときに使用される。
【0044】
以上、実施例1においては、本発明の基本的な処理概念とこの結果得られる故障知識データベースDBの格納データについて説明した。
図3、
図4、
図5のように纏められた、部品、故障、処置における説明は、名寄せ処理により同義表現を含んで把握されている。
【0045】
また本発明においては、故障知識データベースDB内に、
図6に一例を示す故障と処置についての前後手順マップを保持している。
図6の故障についての前後手順マップM901は、縦軸の故障F,Gを基準として、この事象の前後に横軸の各故障F,Gまたは処置H,I,Jが発生する経験回数をまとめたものである。同様に、
図6の処置についての前後手順マップM902は、縦軸の処置H,I,Jを基準として、この事象の前後に横軸の各故障F,Gまたは処置H,I,Jが発生する経験回数をまとめたものである。
【0046】
例えば過去の経験回数が120回のうち、その事象が前または後に発生した回数を整理したものであり、これによれば
図2の故障や処置の事象が発生する順序が明らかにされている。前後手順マップは、実施手順関係エッジ(E206,E207,E211,E212)を用いて生成することができる。
計算機で構成される故障知識構築システム1は、記憶部10として一時記憶部Mと故障知識データベースDBを備え、演算部20における処理として表現抽出部21、名寄せ部22、データベース編集部23の各機能を実行し、入出力部24を介して、データベース編集者19にデータを表示、提供し、データベース編集者19からの入力を取り込み、入力内容に応じた処理を実行し、人的見直し結果を故障知識データベースDBに反映、記憶する。
これらの保全に関連する各種の新たな情報Dのうち保全実施ログD1は、保全の対象となる機器Aに関する保全の実績を蓄積したログデータであり、テキストデータ,テーブルデータなど自然言語で記述されたものとする。保全実施ログD1には、機器や部品に対して実行した保全の情報として、故障内容の情報D1aとその結果として行った処置についての情報D1bを含んでいる。
処置の内容は,作業と対策の二つに大別されるものとする。作業とは,保全修理業務における手順の中で必要となる処置に関しての表現である。対策とは,保全修理業務において故障現象を修理するために行う処置の表現である。故障表現辞書D3に記述されている故障表現と処置表現辞書D4に記述されている処置表現が本発明で名寄せをして故障知識データベースDBに格納する情報の元となっているものである。そのため,格納されている表現は必ずしも故障知識データベースDBにすでに保存されている表現と一致している必要はない。
表現抽出部21は,保全実施ログD1を入力として,故障表現や処置表現などの故障知識データベースDBに格納する情報を抽出する。抽出する内容は、部品、機器名称及び、故障と処置を表現した記述(D1a、D1b)である。抽出の方法は,部品名辞書D2,故障表現辞書D3,処置表現辞書D4を利用して,ルールベースで実装してもよいし,入力情報の統計情報を利用した機械学習モデルとして実装してもよい。ルールベースの場合,例えば,辞書に記載されている文字列を検索し,検索された部品名と故障表現D1a,処置表現D1bのうち記述されている箇所が近いものをペアとして出力する,というようなやり方がありうる。
M802は、抽出IDを記述したものであり、これは,各ソースから抽出した表現を一意に示すIDとなっている。抽出ID内に,抽出した表現の手順が示されている必要がある。たとえば,EF_002_01は,ソースIDが002の文書から抽出された表現のうち手順が01番目のものを表し,EF_002_02は02番目のように、どの順序で保全修理業務が実施されたかがわかるようになっている必要がある。
M803の部品名は、抽出した部品名,M804の抽出名は抽出した故障または処置の表現,M805の抽出ラベルは抽出名(M804)が故障を示しているか処置を示しているかを表す。
名寄せ部22の処理により、名寄せをおこなった結果得られるまとめる表現候補および名寄せが正しいものかを判定する際に有用な情報である名寄せ周辺情報は、入出力部24に渡され、外部表示されてデータベース編集者19に提示される。また,データベース編集者19は入出力部24を介して,故障知識データベースDBの編集操作を入力する。
データベース編集者19は,故障知識データベースDBに格納する情報を編集し,名寄せ部22でおこなった名寄せが十分かを判定して処理を続行するか判定する。入出力部24で操作した編集情報はデータベース編集部602で実際の処理として実行される。
分布計算部603では、抽出データ編集部602で編集した抽出結果データと,DB手順取り込み部601で処理した故障知識データベース内から取り込んだ前後手順マップと合算することで,各故障表現や処置表現ごとの前後手順の分布を計算する。また,一度名寄せ処理を行い,入出力部108に提示された結果,名寄せが不十分であると判断されたときには,これまでのまとめ情報を元に分布を編集する処理を行う。
分布間距離計算部604では、分布計算部603で計算した各故障表現や処置表現ごとの前後手順の分布を元に,それぞれの故障表現同士や処置表現同士の距離を計算する。計算の結果,閾値より距離が小さかったものをまとめる候補とする。名寄せする候補は名寄せが正しいものかを判定する際に有用な情報である名寄せ周辺情報とともに入出力部24で描画される。
この処理は、要するに、抽出結果が新たに発生した時に既存の前後手順マップに新たな経験回数を所定の個所に回数追加していくものであり、これにより部品における故障とその時の処置の経験回数が蓄積されていくものである。この結果、出現頻度が高い故障と処置の組み合わせ、従って発生順序の関係が一層明確化されていくものである。
ステップS705では,描画情報編集部605においてステップS704で取得した名寄せ候補を描画用情報に編集する。故障知識データベースDBから部品の構造展開の情報を取得する。ステップS704で取得した故障や処置の表現,および名寄せするペアに関して紐づく部品ごとにまとめる。また,名寄せが正しいかどうかを判断する際に用いる名寄せ周辺情報をそれぞれの故障,処置表現に紐づける。名寄せ周辺情報とは例えば,前後に頻出する手順に関する情報や,他の表現との距離の値などである。
データベース編集者19は描画された名寄せ候補および名寄せ周辺情報を確認し,名寄せを再試行するか,手動での編集を開始するかを決定する。名寄せ再試行ボタン1205を押した場合は,名寄せを再試行する。編集開始ボタン1206を押した場合は,手動編集を開始する。
名寄せ再試行の場合,ステップS703に戻る。抽出結果追加後前後手順マップM1001,M1002の行・列それぞれに記載されている故障表現および処置表現のうち,名寄せ候補となっていたものは,行・列を結合し,手順出現頻度の値は足し合わせたものにする。以上を行い,再度ステップS704以降のステップを実行する。