IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

<>
  • 特開-故障知識構築システム及び方法 図1
  • 特開-故障知識構築システム及び方法 図2
  • 特開-故障知識構築システム及び方法 図3
  • 特開-故障知識構築システム及び方法 図4
  • 特開-故障知識構築システム及び方法 図5
  • 特開-故障知識構築システム及び方法 図6
  • 特開-故障知識構築システム及び方法 図7
  • 特開-故障知識構築システム及び方法 図8
  • 特開-故障知識構築システム及び方法 図9
  • 特開-故障知識構築システム及び方法 図10
  • 特開-故障知識構築システム及び方法 図11
  • 特開-故障知識構築システム及び方法 図12
  • 特開-故障知識構築システム及び方法 図13
  • 特開-故障知識構築システム及び方法 図14
  • 特開-故障知識構築システム及び方法 図15
  • 特開-故障知識構築システム及び方法 図16
  • 特開-故障知識構築システム及び方法 図17
  • 特開-故障知識構築システム及び方法 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023032128
(43)【公開日】2023-03-09
(54)【発明の名称】故障知識構築システム及び方法
(51)【国際特許分類】
   G06Q 10/20 20230101AFI20230302BHJP
   G06F 16/383 20190101ALI20230302BHJP
【FI】
G06Q10/00 300
G06F16/383
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2021138061
(22)【出願日】2021-08-26
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110000350
【氏名又は名称】ポレール弁理士法人
(72)【発明者】
【氏名】森岡 智陽
(72)【発明者】
【氏名】難波 康晴
(72)【発明者】
【氏名】人見 俊太郎
【テーマコード(参考)】
5B175
5L049
【Fターム(参考)】
5B175DA01
5B175HB03
5L049CC15
(57)【要約】
【課題】文書からの保全に関連する知識抽出の名寄せ精度の向上。
【解決手段】保全の対象機器についての保全情報として、故障,処置および保全の実施手順を蓄積し、記憶する故障知識データベースと,対象機器の保全情報を記述する保全文書から、故障表現と処置表現を抽出する表現抽出部と,表現抽出部の抽出結果と、故障知識データベースの保全の実施手順の情報をもとに,故障表現と処置表現の各表現の前後に実施される保全の実施手順の出現頻度を計算し、故障表現と処置表現の各表現同士の分布間距離を計算する名寄せ部と,名寄せ部の処理結果を名寄せ候補として描画し手動編集操作を可能とする入出力部と,入出力部の情報を編集した結果を故障知識データベースに保存するデータベース編集部を具備することを特徴とする故障知識構築システム。
【選択図】図1
【特許請求の範囲】
【請求項1】
保全の対象機器についての保全情報として、故障,処置および保全の実施手順を蓄積し、記憶する故障知識データベースと,
対象機器の前記保全情報を記述する保全文書から、故障表現と処置表現を抽出する表現抽出部と,
前記表現抽出部の抽出結果と、前記故障知識データベースの保全の実施手順の情報をもとに,故障表現と処置表現の各表現の前後に実施される保全の実施手順の出現頻度を計算し、故障表現と処置表現の各表現同士の分布間距離を計算する名寄せ部と,
前記名寄せ部の処理結果を名寄せ候補として描画し手動編集操作を可能とする入出力部と,
前記入出力部の情報を編集した結果を前記故障知識データベースに保存するデータベース編集部を具備することを特徴とする故障知識構築システム。
【請求項2】
請求項1に記載の故障知識構築システムであって、
前記入出力部には、名寄せ処理の結果が表示され、再度の名寄せ処理の指示が入力でき、再度の名寄せ処理の指示に応じて、前記名寄せ部の処理を再度実施することを特徴とする故障知識構築システム。
【請求項3】
請求項1に記載の故障知識構築システムであって、
前記入出力部において、名寄せ候補および手動編集に有用な情報となる処理の際に活用した名寄せ周辺情報を描画することを特徴とする故障知識構築システム。
【請求項4】
請求項1に記載の故障知識構築システムであって、
前記名寄せ部において、前記表現抽出部で抽出できていなかった故障や処置を前記故障知識データベースの手順情報から補完することを特徴とする故障知識構築システム。
【請求項5】
対象機器の保全情報を記述する保全文書から、機器及び部品の故障内容を記述した故障表現と、当該故障内容の時に実施した処置内容を記述した処置表現を抽出し,
複数の前記故障表現と複数の前記処置表現について、その組み合わせを求め、特定の前記故障表現に対する前記処置表現の記述回数に応じた名寄せ処理を実施し、
名寄せ処理結果についての人的判断結果を反映した情報を故障知識として故障知識データベースに反映する故障知識構築方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は,故障知識構築システム及び方法に関する。
【背景技術】
【0002】
保全現場の人員不足解消のために,保全に関する知識を集積し活用することで効率的な保全を実現する方法が求められる。しかし,効率的な保全に必要となるデータベース化された知識を手動で構築することは工数がかかるため,導入コストが大きい。そのため,保全関連文書から保全に関する知識を自動で抽出する技術が必要となる。
【0003】
文書からの情報抽出に関する技術として,例えば特許文献1が知られている。特許文献1では、類似文字列の抽出対象のデータの増大による抽出処理負荷の増大を抑制することを目的として、「所定の文字列との間の編集距離が所定数(d)以下の文字列を文字列群から抽出する抽出プログラムは、前記所定の文字列内の連続する文字列である1または複数の部分文字列であって、前記所定の文字列において連続する文字数(n)が前記所定の文字列の文字数(m)を前記所定数(d)で除算した商よりも小さい、1または複数の部分文字列を抽出し、抽出された前記1または複数の部分文字列のいずれかを含む文字列を前記文字列群から抽出し、前記文字列群から抽出された文字列について、前記所定の文字列との間の編集距離が所定の距離(d)以下であるか否か判定する、処理をコンピュータに実行させる。」ものである。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2013―29891号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
文書からの知識情報の抽出において,似たような意味の情報を一つの情報としてまとめる「名寄せ」は難しい課題とされており,様々な手法が提案されている。特許文献1では,文書からの情報の抽出において,抽出された二つの文字列の編集距離の大きさを判定し,距離が近いものは名寄せする,というやり方で名寄せを実現する。
【0006】
しかし,この手法では文字列的に大きく異なるものは名寄せできない。また,保全の分野においては,一般的な単語の使われ方と異なる単語の用いられ方があり,あるいは専門用語が存在しているため,一般的な自然言語処理で用いられるような名寄せ手法が適用することが難しい場合がある。
【0007】
以上のことから,名寄せをする際に保全に特徴的な情報の関係性を利用することで名寄せを実現するシステム及び方法が必要となっている。
【課題を解決するための手段】
【0008】
以上のことから本発明においては、「保全の対象機器についての保全情報として、故障,処置および保全の実施手順を蓄積し、記憶する故障知識データベースと,対象機器の保全情報を記述する保全文書から、故障表現と処置表現を抽出する表現抽出部と,表現抽出部の抽出結果と、故障知識データベースの保全の実施手順の情報をもとに,故障表現と処置表現の各表現の前後に実施される保全の実施手順の出現頻度を計算し、故障表現と処置表現の各表現同士の分布間距離を計算する名寄せ部と,名寄せ部の処理結果を名寄せ候補として描画し手動編集操作を可能とする入出力部と,入出力部の情報を編集した結果を故障知識データベースに保存するデータベース編集部を具備することを特徴とする故障知識構築システム。」としたものである。
【0009】
また本発明は、「対象機器の保全情報を記述する保全文書から、機器及び部品の故障内容を記述した故障表現と、当該故障内容の時に実施した処置内容を記述した処置表現を抽出し,複数の故障表現と複数の処置表現について、その組み合わせを求め、特定の故障表現に対する処置表現の記述回数に応じた名寄せ処理を実施し、名寄せ処理結果についての人的判断結果を反映した情報を故障知識として故障知識データベースに反映する故障知識構築方法。」としたものである。
【発明の効果】
【0010】
本発明にかかる故障知識構築システム及び方法によって,文書からの保全に関連する知識抽出の名寄せ精度が向上する。これにより,より品質の高い保全関連知識のデータが作成可能となる。また,このような保全関連の知識データの構築にかかる工数を削減する。
【図面の簡単な説明】
【0011】
図1】故障知識構築システム1の基本概念を説明するための図。
図2】故障知識データベースDBの構成例として、保全内容を模式的に示した図。
図3】部品ノードが持つプロパティの例を示す図。
図4】故障ノードが持つプロパティの例を示す図。
図5】処置ノードが持つプロパティの例を示す図。
図6】故障と処置についての前後手順マップの例を示す図。
図7】本発明の実施例2に係る故障知識構築システムの全体構成例を示す図。
図8】表現抽出部21の抽出結果の例を示す図。
図9】本発明の実施例2に係る名寄せ部22の処理内容を詳細に示す図。
図10】名寄せ部22での処理を表すフローチャート。
図11】抽出結果データの編集の結果を示す図。
図12】抽出結果追加後の故障前後手順マップの例を示す図。
図13】故障表現に関する描画の例を示す図。
図14】故障表現の手動編集画面の例を示す図。
図15】表現抽出部21で抽出したデータを編集したデータの例を示す図。
図16】本発明の実施例3に係る名寄せ部22の処理内容を詳細に示す図。
図17】手順欠損確率計算部1501の出力を示す図。
図18】抽出データ欠損補完部1502の出力を示す図。
【発明を実施するための形態】
【0012】
以下,本発明の実施例について図面を用いて説明する。
【実施例0013】
実施例1では、本発明の基本的な処理概念について説明する。本発明では、機器や部品に対して実行した保全の際に、保全員が作成した記録や報告書である保全実施ログに記載の情報を用いた名寄せ処理により、高精度の故障知識データベースを簡便に構築しようとしている。
【0014】
図1は故障知識構築システム1の基本概念を説明するための図である。故障知識構築システム1は、計算機を用いて構成されており、記憶部10内に一時記憶部Mと故障知識データベースDBを備え、演算部20において実行される各種処理機能として、表現抽出部21,名寄せ部22,データベース編集部23の各機能を備える。また、入出力部24を介してデータベース編集者19と連携している。
【0015】
図1の基本概念図において保全実施ログD1には、種々の内容が自由記述により記載されているが、この中には機器や部品に対して実行した保全の情報として、故障内容の情報D1aとその結果として行った処置についての情報D1bを含んでいる。故障内容の情報D1aは、日付、部品名の他に例えば磁気ヘッドについて故障内容が「汚れる」、「汚損」、「破損」などの表現で自由記載されている。また処置情報D1bは、日付、部品名の他に処置内容が「清掃」、「調整」、「交換」などの表現で自由記載されている。この例の場合に、「汚れる」、「汚損」、「破損」は、いずれも故障内容を表現したものであるが、この表現の仕方は保全員によりさまざまである。また、同義の他の用語で表現される可能性もある。
【0016】
表現抽出部21では,自由記述された保全実施ログD1の多くの用語の中から、故障内容の情報D1aにおける故障内容の表現である「汚れる」、「汚損」、「破損」を抽出し、また処置情報D1bにおける処置内容の表現である「清掃」、「交換」を抽出する。
【0017】
名寄せ部22では、まず故障内容の表現「汚れる」、「汚損」、「破損」と、処置内容の表現「清掃」、「調整」、「交換」の組み合わせD1cを作成する。次に名寄せ部22では、各表現での故障の時の各処置表現の出現頻度を計算し用語出現頻度情報D1dを求める。図示の例では故障用語が「汚れる」である場合に、処置用語が「清掃」、「調整」、「交換」である出現頻度が算出されている。同様に、「汚損」、「破損」のときの処置用語の出現頻度が求められる。さらに名寄せ部22では、この出現頻度が高い情報の組み合わせから最終的に名寄せ後情報D1eを得る。この例では例えば、磁気ヘッドについての故障表現「汚れる」、「汚損」は名寄せ処理により同義と解釈されてこの時の処置は「清掃」である確率が最も高く、他方「破損」は「汚れる」、「汚損」とは異なる故障事象であり、この時の処置は「交換」である確率が最も高いと判断される。
【0018】
名寄せ部22で求められた中間生成物としての各情報D1c,D1d,D1eなどは適宜入出力部24を介して外部出力することが可能とされ、データベース編集者19による修正後に故障知識データベースDBに故障知識Dとして格納される。
【0019】
このようにして名寄せにより構成された故障知識データベースDBの構成例が図2から図5に示されている。まず図2は故障知識データベースDBの構成例である。保全内容を模式的に示した図であり、対象となる機器とその部品の構成、及び、故障と処置の関係の一例を示した図である。故障知識データベースDBには、保全の対象機器についての保全情報として、故障,処置および保全の手順を蓄積し、記憶している。
【0020】
図2の記述関係によれば、保全の対象となる機器Aは、部品B,部品Cから構成されており、さらに部品B,部品Cは、それぞれ部品D,部品Eを含んでいることを表している。また例えば部品Cにおける故障Fとこれに対する処置H,部品Eにおける故障Gとこれに対する処置i,j、さらには部品C,E間にまたがる処置Hと故障Gの関係などを表している。
【0021】
機器Aについてのこれらの情報を保存する故障知識データベースDBの記憶方式は、例えばノードNと、ノードN間の関係を表すエッジEによって表現されるグラフデータベースで実装されたものである。ノードNとエッジEは,図2で示されているほかに,それぞれプロパティと呼ばれる付加情報を持つのがよい。
【0022】
図2においてノードNとは、楕円で示した機器Aやその部品B-E、ならびに四角で示した故障F,Gおよび処置H,I,jのことであり、これらは,部品ノード(N101-N105),故障ノード(N106、N108),処置ノード(N107,N109,N110)を表している。
【0023】
またエッジEとは、ノードN間の関係を示したものであり、部品間或は部品と機器の間の親子関係(E201-E206),部品と故障の間の部品-故障関係(E204,E208),部品と処置の間の部品-処置関係(E205,E209,E210),故障と処置の間の実施手順関係(E206,E207,E211,E212)というエッジによって故障知識データベースDBが構成されていることを示している。
【0024】
なお、故障知識データベースDBには、これらに付随したプロパティ情報として,他に知識として保存が必要な情報が含まれていてもよい。例えば,故障原因を調べる際に用いられる検査項目の情報をノードとして付加したり,故障同士の因果関係をエッジとして付加したりしてもよい。また,図2で示されているノードの種類はさらに細分化してもよい。例えば,処置ノード(N107,N109,N110)を実施する作業のノードと故障を修理するための対策のノードに分けたり,故障ノード(N106、N108)を症状,外部原因,内部原因などに細分化したりしてもよい。
【0025】
このように、故障知識データベースDBは,保全の対象となる機器に関する保全知識Dをデータとして格納する。故障知識データベースDBに格納された故障知識Dは,各種保全サービスや設計・運用業務との連携において活用可能である。例えば,保全員に修理の手順を指示するシステムや,故障の原因を推定するシステムなどである。内部の情報は名寄せ部22で行われる処理の中で使用される。また,最終的にデータベース編集者19が編集した結果が故障知識データベースDBに保存される。故障知識データベースDBの実装形態はリレーショナルデータベースだけでなく,グラフデータベースでもよい。本実施例では,グラフデータベースでの実装について,図2にて説明している。
【0026】
故障知識データベースDBによれば、以下のノードNおよびエッヂEが連携して使用されることで部品が定義されている。このうち部品ノード(N101-N105)は部品に関する情報を持つ。部品の親子関係は部品親子関係エッジ(E201-E206)で記述される。また,部品がどのような故障を起こすかに関する情報は部品-故障関係エッジ(E204,E208)に記述される。保全作業の手順の中で部品に対してどのような処置を行うかについては部品-処置関係エッジ(E205,E209,E210)で記載される。
【0027】
部品の主たる情報である部品ノード(N101-N105)のプロパティを図3に示している。図3は、部品ノードN103のときのプロパティ(DN301-DN304)の一例であり,図3に示すもの以外が含まれていてもよい。部品ID(DN301)は,故障知識データベースDB内で部品を一意に特定するために保持されるものであり、この例ではP_003として定義されている。なお他の部品ノードの部品ID(DN301)と重複することはない。部品名称DN302は部品の名称を記載するものであり、この例では部品Cとして定義されている。なお他のノードの部品名称DN302と重複があってもよいが,その場合は表現抽出部21で抽出したものを名寄せ部22で部品ノード(N101-N105)に紐づける処理が必要となる。
【0028】
そのほか図3ではプロパティとして,説明DN303や部品名称の同義表現DN304を持つこととする。説明DN303には、部品Cについての説明が説明Cとして記述され、さらに部品名称の同義表現DN304には、部品Cについての説明が説明C´あるいは説明C´´として記述されている。これは、これらの表現は、表現上の相違はあるものの、基本的に同じことの説明であることを示している。なお、同義表現DN304は表現抽出部21で抽出した部品名を部品ノード(N101-N105)に紐づける際に有用である。
【0029】
部品親子関係エッジ(E201-E206)は、図2の矢印で示すように部品の親子関係を示す有向のエッジである。図2の例では,機器Aの要素として部品Bと部品Cが存在し部品Bの中には部品Dがある,という機器Aの部品構造展開に関する知識を記述している。
【0030】
部品-故障関係エッジ(E204,E208)は,図2の矢印で示すようにどの部品でどのような故障が生じるかを示す有向のエッジである。例えば,図2では部品Cで故障Fという故障を発生するということを示している。
【0031】
部品-処置関係(E205,E209,E210)では,図2の矢印で示すようにどの部品に対してどのような処置を行うかを示す有向のエッジである。例えば,図2では部品Cの処置Hという作業について記述している。
【0032】
故障知識データベースDBによれば、以下のノードNおよびエッヂEが連携して使用されることで故障が定義されている。このうち故障ノード(N106、N108)は故障の情報を持つ。部品-故障関係エッジ(E204,E208)によって紐づく部品が示される。前後の保全実施手順については,実施手順関係エッジ(E206,E207,E211,E212)で記述し,これによって他の故障ノード(N106、N108)や処置ノード(N107,N109,N110)と紐づく。故障ノード(N106、N108)が持つプロパティを図4で説明する。
【0033】
図4は、故障ノードN108のときのプロパティの一例を図4に示す。プロパティ(DN401-DN406)は一例であり,図4に示す以外のものが含まれていてもよい。故障ID(DN401)は故障ノードを一意に示すIDとなっている。他の故障ノードと重複することはない。故障名称DN402は故障の代表的な名称を記載する。
【0034】
説明DN403は故障に関して説明情報を記載する。また同義表現DN404は,故障ノード202が示す故障現象を言い表す際に故障名称DN402以外に用いられる表現を記載する。説明DN403には、故障Gについての説明が説明Gとして記述され、さらに同義表現DN404が存在する場合には、故障Gについての同義表現のものが記述されることになる。これは、これらの表現は、表現上の相違はあるものの、基本的に同じことの説明であることを示している。図1の例では、故障表現「汚れる」と「汚損」がこれに該当している。本発明の名寄せ処理の結果得られる該当の故障とまとめるべき故障の表現はここに保存される。その後,新たに知識抽出する際は,名寄せ部22の処理の一環で,表現抽出部21で抽出した結果を故障ノード(N106、N108)に紐づけるときに使用される。
【0035】
出現頻度DN405は、故障ノードN108で表す故障現象が過去の保全実施ログD1からの知識抽出の際に何回出現したかを格納する。また,前後手順出現頻度DN406は,故障ノードN108(故障G)に相当する表現が保全実施ログD1から抽出されたときに,その前後に手順として他の故障ノード(N106、N108)や処置ノード(N107,N109,N110)が現れたか,という出現頻度を格納する。
【0036】
前後手順出現頻度DN406はテーブルデータのような形で保存する。図4では縦軸の該当する故障ノードN108の故障F_019(故障G)に対して,その前後にどのような手順が記載されていたか横軸に記載されている。例えば,処置ノード(N107,N109,N110)の一つであるA_008(N107)は過去の保全実施ログD1の中でF_019の前の手順として15回記載されており、A_009(N110)は過去の保全実施ログD1の中でF_019の後の手順として30回記載されていた,というような形になっている。
【0037】
このように,前後の手順に該当するノードのIDとその表現が前後どちらの手順として記載されていたか,そしてその頻度という情報が示されている。前後手順出現頻度DN406が書かれる対象となる他のノードは,該当の故障ノード(N106、N108)と実施手順関係エッジ(E206,E207,E211,E212)で結ばれているノード,あるいは実施手順関係エッジ(E206,E207,E211,E212)をたどった先にあるノードである。例えば,図2の部品Eの故障Gの場合,実施手順関係エッジE207でつながっている部品Cの処置H,という処置ノード以外に,その先にある部品Cの故障Fという故障ノードN106も前後手順出現頻度の対象ノードとなる。出現頻度DN405および前後手順出現頻度DN406は,名寄せ部22での分布計算のときに使用される。
【0038】
実施手順関係エッジ(E206,E207,E211,E212)は保全実施手順の情報を持つ有向のエッジである。図2の例では,部品Cが故障Fとなったときに,部品Cの処置Hを行う,部品Eが故障Gのときには,部品Eに処置Iを行う,あるいは部品Eに処置Jを行う,というような作業手順を記載している。実施手順は分岐があってもよいため,一つのノードが複数のノードへ実施手順関係エッジ(E206,E207,E211,E212)を伸ばしていてもよいし,複数のノードから一つのノードへ実施手順関係エッジ(E206,E207,E211,E212)が向かっていてもよい。
【0039】
また故障知識データベースDBによれば、以下のノードNおよびエッヂEが連携して使用されることで処置が定義されている。このうち処置ノード(N107,N109,N110)は処置に関する情報を持つ。紐づく部品は部品-処置関係エッジ(E205,E209,E210)で記述される。前後の保全実施手順は実施手順関係エッジ(E206,E207,E211,E212)で記述し,故障ノード(N106、N108)や他の処置ノード(N107,N109,N110)との関係が記述される。
【0040】
処置の主たる情報である処置ノード(N107,N109,N110)のプロパティを図5に示している。図5は、処置ノードN107のときのプロパティ(DN501-DN506)の一例であり,図5に示す以外のものが含まれていてもよい。処置ID(DN501)は処置ノード(N107,N109,N110)を一意に表すIDとなっている。他の処置ノード(N107,N109,N110)と重複することはない。処置名称DN502は処置の代表的な名称を表す。
【0041】
説明DN503は処置の説明を記す。また同義表現DN504は処置ノード(N107,N109,N110)が表す処置を言い表す際の処置名称DN502以外の表現を格納する。本発明の結果得られる該当の処置の同義表現はここに格納される。図5の場合には、説明DN503には、処置Hについての説明が説明Hとして記述され、さらに処置Hの同義表現DN504には、処置Hについての説明が説明H´として記述されている。これは、これらの表現は、表現上の相違はあるものの、基本的に同じことの説明であることを示している。その後新たに知識抽出する際は,名寄せ部22の処理の一環で,表現抽出部21で抽出した結果を処置ノード(N107,N109,N110)に紐づけるときに使用される。
【0042】
出現頻度DN505は処置ノード(N107,N109,N110)で表す処置が過去の保全実施ログD1からの知識抽出の際に何回出現したかを格納する。また,前後手順出現頻度DN506は処置ノード(N107,N109,N110)に相当する表現が保全実施ログD1から抽出されたときに,その前後に手順として他の故障ノード(N106、N108)や処置ノード(N107,N109,N110)が現れたか,という出現頻度を格納する。前後手順出現頻度DN506はテーブルデータのような形で保存する。
【0043】
図5では縦軸の該当する処置ノードN107の処置A_008(処置H)に対して,その前後にどのような手順が記載されていたか横軸に記載されている。例えば,処置ノード(N107,N109,N110)の一つである処置ノードN109のA_009(処置I)は過去の保全実施ログD1の中でA_008の後の手順として10回記載されていた,というような形になっている。このように,前後の手順に該当するノードのIDとその表現が前後どちらの手順として記載されていたか,そしてその頻度という情報が示されている。前後手順出現頻度DN506が書かれる対象となる他のノードは,該当の処置ノード(N107,N109,N110)と実施手順関係エッジ(E206,E207,E211,E212)で結ばれているノード,あるいは実施手順関係エッジ(E206,E207,E211,E212)をたどった先にあるノードである。出現頻度DN505および前後手順出現頻度DN506は,後述する名寄せ部22での分布計算のときに使用される。
【0044】
以上、実施例1においては、本発明の基本的な処理概念とこの結果得られる故障知識データベースDBの格納データについて説明した。図3図4図5のように纏められた、部品、故障、処置における説明は、名寄せ処理により同義表現を含んで把握されている。
【0045】
また本発明においては、故障知識データベースDB内に、図6に一例を示す故障と処置についての前後手順マップを保持している。図6の故障についての前後手順マップM901は、縦軸の故障F,Gを基準として、この事象の前後に横軸の各故障F,Gまたは処置H,I,Jが発生する経験回数をまとめたものである。同様に、図6の処置についての前後手順マップM902は、縦軸の処置H,I,Jを基準として、この事象の前後に横軸の各故障F,Gまたは処置H,I,Jが発生する経験回数をまとめたものである。
【0046】
例えば過去の経験回数が120回のうち、その事象が前または後に発生した回数を整理したものであり、これによれば図2の故障や処置の事象が発生する順序が明らかにされている。前後手順マップは、実施手順関係エッジ(E206,E207,E211,E212)を用いて生成することができる。
【実施例0047】
実施例2では、実施例1の基本概念を実現するための具体的な手法について説明する。まず、図7は、本発明の実施例2に係る故障知識構築システムの全体構成例を示す図である。
【0048】
計算機で構成される故障知識構築システム1は、記憶部10として一時記憶部Mと故障知識データベースDBを備え、演算部20における処理として表現抽出部21、名寄せ部22、データベース編集部23の各機能を実行し、入出力部24を介して、データベース編集者19にデータを表示、提供し、データベース編集者19からの入力を取り込み、入力内容に応じた処理を実行し、人的見直し結果を故障知識データベースDBに反映、記憶する。
【0049】
故障知識構築システム1は、故障知識データベースDB内に既存の保全機器Aについての上記図2の関係を予め準備し、記憶していてもよい。そのうえで、保全に関連する各種の新たな情報Dを用いて、故障知識データベースDB内の情報をより豊富化し、充実した内容のものに改良するための名寄せ処理を行っている。
【0050】
これらの保全に関連する各種の新たな情報Dのうち保全実施ログD1は、保全の対象となる機器Aに関する保全の実績を蓄積したログデータであり、テキストデータ,テーブルデータなど自然言語で記述されたものとする。保全実施ログD1には、機器や部品に対して実行した保全の情報として、故障内容の情報D1aとその結果として行った処置についての情報D1bを含んでいる。
【0051】
また保全に関連する各種の新たな情報Dとしては、部品名辞書D2,故障表現辞書D3,処置表現辞書D4を有しておくのがよい。これらは,図2の機器構成、故障および処置の対応関係において、それぞれ保全対象機器Aに関する部品B,C,D,Eの部品名,故障F,Gの表現,処置H,I,jに関する表現が列挙された辞書となるデータである。それぞれの辞書は,故障知識構築システム1内の表現抽出部21で、自然言語で記述された保全実施ログD1の記載内容から、機器に関する故障の表現や処置の表現を抽出する際に利用される。なお表現抽出部21が機械学習手法によって実装されているなどのために,モデルの内部に辞書に相当する情報が含まれている場合には外部で用意しなくてもよい。
【0052】
これらについてより詳細に述べると、部品名辞書D2は,例えば図2の「部品C」などの部品の名前を格納する。部品の名前は故障知識データベースDB内に保存されている部品名と一致している,あるいは,表記ゆれの情報などが故障知識データベースDB内に記述されているものとする。
【0053】
故障表現辞書D3は,例えば図2の「故障G」のような故障現象を説明する際に用いられる表現を格納する。処置表現辞書D4は,例えば図2の「処置H」のような保全修理業務における処置を説明する表現を格納する。
【0054】
処置の内容は,作業と対策の二つに大別されるものとする。作業とは,保全修理業務における手順の中で必要となる処置に関しての表現である。対策とは,保全修理業務において故障現象を修理するために行う処置の表現である。故障表現辞書D3に記述されている故障表現と処置表現辞書D4に記述されている処置表現が本発明で名寄せをして故障知識データベースDBに格納する情報の元となっているものである。そのため,格納されている表現は必ずしも故障知識データベースDBにすでに保存されている表現と一致している必要はない。
【0055】
表現抽出部21は,保全実施ログD1を入力として,故障表現や処置表現などの故障知識データベースDBに格納する情報を抽出する。抽出する内容は、部品、機器名称及び、故障と処置を表現した記述(D1a、D1b)である。抽出の方法は,部品名辞書D2,故障表現辞書D3,処置表現辞書D4を利用して,ルールベースで実装してもよいし,入力情報の統計情報を利用した機械学習モデルとして実装してもよい。ルールベースの場合,例えば,辞書に記載されている文字列を検索し,検索された部品名と故障表現D1a,処置表現D1bのうち記述されている箇所が近いものをペアとして出力する,というようなやり方がありうる。
【0056】
表現抽出部21の抽出結果は,一時記憶部M内に一時的に保存される。出力の結果として一時記憶部Mに保存される内容は、図8に例示されている。図8に示す一時記憶部Mに保存されるデータ内容は、M801-M805で定義される。M801は、ソースIDを記述したものであり、これは入力となった保全実施ログD1内の文書の番号を一意に表す。一つの保全修理業務に対して一つのソースIDが振られることを想定している。図8のデータ構成によれば、特にM803-M805の部分に、部品と故障と処置を表現した記述(D1a、D1b)が表現されている。
【0057】
M802は、抽出IDを記述したものであり、これは,各ソースから抽出した表現を一意に示すIDとなっている。抽出ID内に,抽出した表現の手順が示されている必要がある。たとえば,EF_002_01は,ソースIDが002の文書から抽出された表現のうち手順が01番目のものを表し,EF_002_02は02番目のように、どの順序で保全修理業務が実施されたかがわかるようになっている必要がある。
【0058】
M803の部品名は、抽出した部品名,M804の抽出名は抽出した故障または処置の表現,M805の抽出ラベルは抽出名(M804)が故障を示しているか処置を示しているかを表す。
【0059】
図9は、名寄せ部22の処理内容を詳細に示す図である。名寄せ部22では、一時記憶部Mに保存された表現抽出部21の抽出結果の故障表現D1aと処置表現D1bを名寄せする。ここでいう名寄せとは,表現抽出部21の抽出結果に含まれる表現同士,および抽出結果の表現と故障知識データベースDB内の表現が保全の観点で似た表現かどうかを判定することである。
【0060】
一時記憶部Mでは,抽出結果データと前後手順マップのふたつを一時的に保存する。図8の抽出結果データは、表現抽出部21からの出力結果として得られ、また,名寄せ部22の処理の中で編集される。図6の前後手順マップは,故障または処置表現が得られたときにその前後に書かれている手順として故障や処置がどれくらいの頻度で出現するかを表現している。この前後手順マップのデータは,故障知識データベースDBから取得され,あるいは抽出結果データを名寄せ部22で処理して計算していく過程で新たに取得された情報を含んで更新されている。
【0061】
名寄せ部22の処理により、名寄せをおこなった結果得られるまとめる表現候補および名寄せが正しいものかを判定する際に有用な情報である名寄せ周辺情報は、入出力部24に渡され、外部表示されてデータベース編集者19に提示される。また,データベース編集者19は入出力部24を介して,故障知識データベースDBの編集操作を入力する。
【0062】
データベース編集者19は,故障知識データベースDBに格納する情報を編集し,名寄せ部22でおこなった名寄せが十分かを判定して処理を続行するか判定する。入出力部24で操作した編集情報はデータベース編集部602で実際の処理として実行される。
【0063】
以下、名寄せ部22における詳細処理内容を説明する。まずDB手順取り込み部601では、故障知識データベースDBから名寄せ処理に必要となる保全実施手順の前後関係の情報(図6の前後手順マップM901,M902)を取り込む。取り込んだ情報は,前後手順マップとして一時記憶部Mに格納される。
【0064】
抽出データ編集部602では、表現抽出部21で抽出した抽出結果データ(図8)について,故障知識データベースDBの情報と一致するように編集を行う。
【0065】
分布計算部603では、抽出データ編集部602で編集した抽出結果データと,DB手順取り込み部601で処理した故障知識データベース内から取り込んだ前後手順マップと合算することで,各故障表現や処置表現ごとの前後手順の分布を計算する。また,一度名寄せ処理を行い,入出力部108に提示された結果,名寄せが不十分であると判断されたときには,これまでのまとめ情報を元に分布を編集する処理を行う。
【0066】
分布間距離計算部604では、分布計算部603で計算した各故障表現や処置表現ごとの前後手順の分布を元に,それぞれの故障表現同士や処置表現同士の距離を計算する。計算の結果,閾値より距離が小さかったものをまとめる候補とする。名寄せする候補は名寄せが正しいものかを判定する際に有用な情報である名寄せ周辺情報とともに入出力部24で描画される。
【0067】
図10は、名寄せ部22および入出力部24並びにデータベース編集での処理を表すフローチャートである。表現抽出部21での処理が完了した時点でスタートし,データベース編集者19が編集を完了し,故障知識データベースDBにデータが格納された時点で終了する。
【0068】
図10のステップS701では,DB手順取り込み部601で故障知識データベースDB内の保全実施手順に関する情報を取り込む。例えば図4に示した故障ノードN108内のプロパティである出現頻度DN405や前後手順出現頻度DN406,並びに例えば図5に示した処置ノードN107内のプロパティである出現頻度DN505や前後手順出現頻度DN506を利用して,図6に示した故障前後手順マップM901および処置前後手順マップM902を作成する。
【0069】
図6の故障前後手順マップM901および処置前後手順マップM902はそれぞれ故障,処置の前後に他の故障や処置がどの程度の頻度で存在するかを表現する行列である。図4の前後手順出現頻度DN406および図5のDN506と比較して,横軸が故障知識データベースDB内に格納されているすべての故障ノード(N106、N108)および処置ノード(N107,N109,N110)になっている,という点が異なる。また,各故障ノード(N106、N108)および処置ノード(N107,N109,N110)は手順として前に行われる場合と後に行われる場合に場合分けして頻度が記入される。前後手順出現頻度DN406,DN506に存在しなかった故障や処置は0埋めすることで対処する。縦軸方向に故障知識データベースDBに記載されている故障ノード(N106、N108)および処置ノード(N107,N109,N110)の前後手順出現頻度が結合されている形となる。以上の形で作成された故障前後手順マップM901,処置前後手順マップM902は一時記憶部Mに保存される。
【0070】
図10のステップS702では,抽出データ編集部602において抽出結果データを故障知識データベースDBに合う形に編集する。ステップS702の入力となる抽出結果データは図8で示されるものであり,一時記憶部Mに格納されている。
【0071】
編集の結果を図11に示す。編集するのは部品名M803,抽出名M804および故障知識ID(M806)である。部品名M803は,図3の故障知識データベースDB内の部品ノードN103のプロパティとして記載されている同義表現DN304を用いて,そこに記述されているものを部品名称DN302に置換する。
【0072】
抽出名M804は、部品名M803に紐づいている図4の故障ノードN108,および図5の処置ノードN107の同義表現DN404,DN504から一致する表現を探し,存在していた場合は故障名称DN402または処置名称DN502と置換する。
【0073】
図11の故障知識ID(M806)は,図8の部品名DN803と抽出名DN804に一致する部品ノード(N106、N108),処置ノード(N107,N109,N110)を検索し,存在していた場合は図4の故障ID(DN401),図5の処置ID(DN501)を格納する。存在していなかった場合は,故障知識IDから部品名と抽出名が一意に定まるように別途編集操作用IDを付与する。
【0074】
例えば図8の抽出ID(M802)において、2行目の抽出ID(M802)が「EF_002_01」のものは,部品名M803が図8で「部品C’」だったものを「部品C」に置換し,一致する故障ID「F_017」を故障知識ID(M806)に格納している。また,1行目の抽出名(M804)は故障知識データベース内に存在しないため,図11内に故障知識ID「NewF_001」を付与する。
【0075】
ステップS703では,保全実施ログD1から抽出した各表現および故障知識データベースDBから抽出した故障,処置の前後手順の表現の分布を分布計算部603で計算する。図12に抽出結果追加後の故障前後手順マップM1101および処置前後手順マップM1102を図示する。
【0076】
ここでの処理においてはまず,抽出結果をステップS702で編集した図11の結果のうち,故障知識ID(M806)を参照し,故障知識ID(M806)が図6の前後手順マップに一致するものは,図12の抽出結果追加後の故障前後手順マップの該当行の分母にその件数を加算する。例えば,図11の抽出結果のうち,故障知識ID(M806)を参照すると、故障Fに関する「F_018」は抽出結果の中に2件存在していたので,図12の抽出結果追加後故障前後手順マップM1101の、「F_018」を記述する一行目について、,元の分母の件数120件に2件加算して122件とする。
【0077】
また,図11の抽出結果のソースID(M801)および抽出ID(M802)を参照し,該当する故障および処置の前後に現れる故障,処置を見て,その件数を前後手順マップの分子に加算する。
【0078】
また,図8の故障知識ID(M806)のうち,故障知識データベースDB内に存在していないため,新たにIDを付与したものについては,前後手順マップ内に該当する行および列が存在していないため,マップ内でも新たに行・列を追加する。例えば,図12の抽出結果追加後故障前後手順マップM1001の3行目と横軸項目には,新たな故障であるLについて、NewF_001が追加されている。また,抽出結果追加後処置前後手順マップM1002の横軸項目にNewF_001が追加されている。前後手順マップに追加した行・列の要素も抽出結果の実績に応じて,分母および分子を格納する。以上の操作により,各故障表現および各処置表現の前後に現れている手順の表現の分布を前後手順マップという形で計算する。
【0079】
この処理は、要するに、抽出結果が新たに発生した時に既存の前後手順マップに新たな経験回数を所定の個所に回数追加していくものであり、これにより部品における故障とその時の処置の経験回数が蓄積されていくものである。この結果、出現頻度が高い故障と処置の組み合わせ、従って発生順序の関係が一層明確化されていくものである。
【0080】
ステップS704では,分布間距離計算部604で各故障表現及び処置表現の分布同士の距離を計算する。図12にまとめられた抽出結果追加後の故障前後手順マップM1001,M1002において、その各行に現れている故障表現及び処置表現同士の分布間距離を全ての表現の組み合わせで計算する。例えば,抽出結果追加後故障前後手順マップM1001におけるF_018とNewF_001の距離などを全組み合わせで計算する。距離の計算方法は,カルバックライブラー情報量やジェンセンシャノン情報量,L1ノルムやL2ノルムなど各分布での距離を定義できるものであればよい。距離の値と閾値として設定した値の比較を行い,距離が閾値より小さいものは名寄せする候補として表現のペアを保存する。
【0081】
ここまでの処理で、表現のペアというのが、図1に示したデータの組み合わせD1cのことであり、故障を表現した用語と処置を表現した用語の組み合わせを表しており、距離としているのが、用語出現頻度情報D1dの大きさ(回数)を意味している。また例えば2組の故障用語と処置用語の組み合わせが存在し、多数回の経験がある用語である場合に名寄せにより同義とされる可能性があることを意味している。
【0082】
ステップS705では,描画情報編集部605においてステップS704で取得した名寄せ候補を描画用情報に編集する。故障知識データベースDBから部品の構造展開の情報を取得する。ステップS704で取得した故障や処置の表現,および名寄せするペアに関して紐づく部品ごとにまとめる。また,名寄せが正しいかどうかを判断する際に用いる名寄せ周辺情報をそれぞれの故障,処置表現に紐づける。名寄せ周辺情報とは例えば,前後に頻出する手順に関する情報や,他の表現との距離の値などである。
【0083】
ステップS706では,名寄せ候補を入出力部24にて描画する。故障表現に関する描画の例を図13に示す。図13では、部品名にリンクして故障名の情報を表示する。部品名は故障表現が紐づく部品名であり、入出力部24の描画画面上に部品の構造展開の情報を描画し,そこから部品を選択できるようになっている。図13の例では,部品Eに関する故障の確認画面を描画する。故障情報1202には部品名Eに紐づく故障の情報が描画される。名寄せの候補となる故障表現群は同じ枠の中で列挙されている。図13では,「故障G」と「故障L」が名寄せの候補として示されており,「故障M」はそれとは別の故障表現群として描画されている。故障表現1202は故障表現の故障名1203以外に,名寄せが適切かどうかを手動チェックで判定するのに有効な名寄せ周辺情報1204を表示する。図13では,名寄せ周辺情報1204として故障表現の出現回数,故障表現の前に頻出する手順のリストを示している。処置表現の場合でも図13と同様の形で処置の表現を部品に紐づく形,かつ名寄せ候補をまとめ名寄せ周辺情報も記載する形で描画する。
【0084】
データベース編集者19は描画された名寄せ候補および名寄せ周辺情報を確認し,名寄せを再試行するか,手動での編集を開始するかを決定する。名寄せ再試行ボタン1205を押した場合は,名寄せを再試行する。編集開始ボタン1206を押した場合は,手動編集を開始する。
【0085】
名寄せ再試行の場合,ステップS703に戻る。抽出結果追加後前後手順マップM1001,M1002の行・列それぞれに記載されている故障表現および処置表現のうち,名寄せ候補となっていたものは,行・列を結合し,手順出現頻度の値は足し合わせたものにする。以上を行い,再度ステップS704以降のステップを実行する。
【0086】
編集開始ボタン1206を押した場合,ステップ707に遷移する。データベース編集者19が名寄せ結果を手動で編集する。故障表現の手動編集画面の例を図14に示す。図14は、図13と同じ画面構成による表記を行ったものであり、部品名1301を部品の構造展開から選択し,故障情報1302を描画する点,故障名1303と名寄せ周辺情報1304を描画する点は図13と同様である。編集後故障名1305の列が故障情報1302に追加されている。この列に手動で故障名を追記していく。名寄せ候補が正しい場合には,各行に同じ故障名を記載する。名寄せが正しくない場合には,正しい故障名称を記載する。処置表現の場合にも図14と同様の描画によって編集を行う。すべての表現に関して編集が終わったら保存ボタン1306を押す。
【0087】
保存ボタン1306を押すと,ステップS708に遷移する。ここでは,編集した結果をデータベース編集部23から故障知識データベースDBに反映する。故障表現の場合,新たに追加された故障表現には故障ノードを作成する。そのほか,既存の故障表現についても故障の出現頻度DN405や前後手順出現頻度DN406の値を更新すると同時に,同義表現DN404に名寄せによってまとめられるその他の表現を追加する。処置に関しても,新たに追加されるものは処置ノードを作成し,既存の処置については,同義表現DN504,出現頻度DN505,前後手順出現頻度を更新する。これにより,図10の名寄せ処理に関してのフローチャートは終了となる。以上で実施例の説明を完了する。
【実施例0088】
実施例2では,保全実施ログD1から情報を抽出し故障知識データベースDBに格納する際の名寄せ手法について説明したが,実際の保全実施ログD1には,実施した保全にもかかわらず記載されていない場合が多くある。
【0089】
図15に表現抽出部21で抽出したデータを抽出データ編集部602で編集したものを例示する。ソースID(M801)が002に該当するデータは,部品Cが故障Fとなった際に,部品Eの故障Lと推定し処置Jという処置を行っていることを示している。図2に示す故障知識データベースDBでは,部品Cが故障Fとなったとき,次に行う手順として,部品Cの処置H,という内容が書かれているため,この処置を保全実施ログD1には記載していなかったと推察される。このような場合に対応するため,名寄せ部22の処理を追加する。
【0090】
図16に本発明の実施例3に係る名寄せ部22の処理内容を詳細に示している。名寄せ部22の処理機構を示す。実施例2の図9にて説明した名寄せ部22に手順欠損確率計算部1501と抽出データ欠損補完部1502を追加した構成となっている。
【0091】
手順欠損確率計算部1501は故障知識データベースDB内に記載されている故障および処置に関する手順に基づき,どの内容が記載されているときにどの内容が欠損しやすいかを確率計算する。この結果は,一時記憶部Mに保存され,抽出データ欠損補完部1502に利用される。
【0092】
抽出データ欠損補完部1502は抽出データ編集部602によって編集された抽出データについて,手順欠損確率計算部の情報に基づき手順の補完を行う。この手順補完によって得られたデータが分布計算部603で利用される。
【0093】
手順欠損確率計算部1501の出力を図17に示す。出力は手順欠損確率テーブル1601のような形となる。縦軸と横軸に,故障知識データベースDB内に記述されている手順の順番で故障ノードと処置ノードの情報を列挙する。テーブル内の値には,その行の故障または処置が記述されていた場合に,その列の処置が記述されていない確率を記載する。この手順欠損確率テーブルは,本実施例では,前後手順出現頻度DN406,DN506と出現頻度DN406,DN506から計算しているが,故障ノードと処置ノードがそれぞれ別途欠損頻度に関するテーブルをプロパティとして保持しておいて,これを活用するのでもよい。この手順欠損確率テーブルを故障知識データベースDB内に保存されているすべての手順の組み合わせにおいて計算する。
【0094】
抽出データ欠損補完部1502は,図15に書かれた抽出データを入力として,手順欠損確率テーブル1601を元に手順の補完を行う。図15のソースID(M801)が002のものを例として処理を説明する。まず,ソースID(M801)が002となる故障知識ID(M806)のうち,故障知識データベースDB内に含まれているものを抜き出す。今回は,F_017とA_009となる。次に,手順欠損確率テーブル1601群の中で,最も抜き出した故障知識ID(M801)が多く含まれている手順の手順欠損確率テーブル1601を選び出す。
【0095】
今回は,図17に示されたテーブルが選ばれたとする。ここで,このテーブルの中で,抽出データに記載されていないものが補完されるべきかどうかを、要補完ポイントを計算することで判断する。例えば,A_008は,抽出データに記載されているF_017とA_009が記載されているときそれぞれ70/100,40/50の確率で記載されていないので,0.7×0.8=0.56を要補完ポイントとする。要補完ポイントがあらかじめ設定されている閾値より高かった場合は,補完を行うものとする。
【0096】
抽出データ欠損補完部1502の出力を図18に示す。ソースID(M801)が002のものに関して,前後の手順から抽出ID(M802)がEA_002_02の部品Cの処置Hという処置を追加している。どの行を補完したかが後で追えるように,補完フラグM807にフラグを立てる。得られたデータを分布計算部603に送り,以降実施例2と同様に分布の計算を行うことで名寄せを実現する。以上で実施例の説明を完了する。
【符号の説明】
【0097】
1:故障知識構築システム
19:データベース編集者
21:表現抽出部
22:名寄せ部
24:入出力部
DB:故障知識データベース
M:一時記憶部
601:DB手順取り込み部
602:抽出データ編集部
603:分布計算部
604:分布間距離計算部
605:描画情報編集部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18