(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-21
(45)【発行日】2022-11-30
(54)【発明の名称】故障診断装置、故障診断方法、及び故障診断プログラム
(51)【国際特許分類】
G06F 16/2457 20190101AFI20221122BHJP
G06F 16/28 20190101ALI20221122BHJP
G06F 16/335 20190101ALI20221122BHJP
【FI】
G06F16/2457
G06F16/28
G06F16/335
(21)【出願番号】P 2018190510
(22)【出願日】2018-10-05
【審査請求日】2021-06-01
(73)【特許権者】
【識別番号】000232955
【氏名又は名称】株式会社日立ビルシステム
(74)【代理人】
【識別番号】110002365
【氏名又は名称】特許業務法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】森本 康嗣
(72)【発明者】
【氏名】厚沢 輝佳
(72)【発明者】
【氏名】野中 久典
【審査官】三橋 竜太郎
(56)【参考文献】
【文献】特開2017-194727(JP,A)
【文献】特開平07-271599(JP,A)
【文献】特開2001-101197(JP,A)
【文献】特開2011-100190(JP,A)
【文献】特開2017-107261(JP,A)
【文献】特開2000-353094(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 40/274
(57)【特許請求の範囲】
【請求項1】
テキストデータによる事故報告書から故障原因を推定することが可能な故障診断装置であって、
前記テキストデータから不具合情報を抽出する不具合情報抽出手段と、
前記不具合情報間の因果関係を特定する因果関係抽出手段と、
前記因果関係に基づいて、入力された不具合事象の原因にあたる不具合事象を推定する故障原因推定手段と、
該故障原因推定手段により推定された不具合事象が、実際に発生しているかどうかの確認の容易さの程度を示す確認容易度を推定する確認容易度推定手段と、
前記推定された前記不具合事象に係る故障原因を絞り込み条件として提示する絞り込み条件提示手段と、
を備え
、
前記故障原因推定手段には、抽出された前記不具合情報が実際に故障の原因である可能性を示す確信度を計算する確信度計算手段をさらに備え、
前記絞り込み条件提示手段が、前記確信度と前記確認容易度を組み合わせて絞り込み条件を生成することを特徴とする故障診断装置。
【請求項2】
前記確認容易度推定手段は、実際に目視確認したことを示す表現を手掛かりとして用いることを特徴とする請求項1に記載の故障診断装置。
【請求項3】
前記確認容易度推定手段は、前記不具合情報の発生が推定であることを示唆する表現を手掛かりとして用いることを特徴とする請求項1に記載の故障診断装置。
【請求項4】
前記確認容易度推定手段は、表現が具体的であるか否かを示す表現を手掛かりとして用いることを特徴とする請求項1に記載の故障診断装置。
【請求項5】
前記確認容易度推定手段は、計量可能な項目であるか否かを手掛かりとして用いることを特徴とする請求項
4に記載の故障診断装置。
【請求項6】
前記確認容易度推定手段は、部品の構造上の階層関係に基づく、部品の粒度の大小を手掛かりとして用いることを特徴とする請求項
4に記載の故障診断装置。
【請求項7】
テキストデータによる事故報告書から故障原因を推定することが可能な故障診断装置であって、
前記テキストデータから不具合情報を抽出する不具合情報抽出手段と、
前記不具合情報間の因果関係を特定する因果関係抽出手段と、
前記因果関係に基づいて、入力された不具合事象の原因にあたる不具合事象を推定する故障原因推定手段と、
該故障原因推定手段により推定された不具合事象が、実際に発生しているかどうかの確認の容易さの程度を示す確認容易度を推定する確認容易度推定手段と、
前記推定された前記不具合事象に係る故障原因を絞り込み条件として提示する絞り込み条件提示手段と、
を備え、
前記不具合情報は不具合項目を確認すべく項目分けされて列挙され、それら各不具合項目を実際に確認したかどうかをYes/Noで選択可能に構成された絞り込み条件提示画面が形成され、
該絞り込み条件提示画面は、
ユーザが確認できなかった項目は、Yes/Noのどちらにも選択せずに次の項目へと選択肢をスキップ可能であるともに、
確認が容易な項目を優先して表示するかどうかを選択するためのチェックボックスが準備され、該チェックボックスからチェックを外すと、確認が困難な項目を含めて、全ての絞り込み条件が提示されることを特徴とする
故障診断装置。
【請求項8】
コンピュータがソフトウェアを実行することで、テキストデータによる事故報告書から故障原因を推定することが可能な故障診断方法であって、
前記テキストデータから不具合情報を抽出する不具合情報抽出処理と、
前記不具合情報間の因果関係を特定する因果関係抽出処理と、
前記因果関係に基づいて、入力された不具合事象の原因にあたる不具合事象を推定する故障原因推定処理と、
該故障原因推定処理により推定された不具合事象が、実際に発生しているかどうかの確認の容易さの程度を示す確認容易度を推定する確認容易度推定処理と、
前記推定された前記不具合事象に係る故障原因を絞り込み条件として提示する絞り込み条件提示処理と、
を有
し、
前記故障原因推定処理には、抽出された前記不具合情報が実際に故障の原因である可能性を示す確信度を計算する確信度計算処理をさらに有し、
前記絞り込み条件提示処理が、前記確信度と前記確認容易度を組み合わせて絞り込み条件を生成することを特徴とする故障診断方法。
【請求項9】
テキストデータによる事故報告書から故障原因を推定することが可能な故障診断プログラムであって、
前記テキストデータから不具合情報を抽出する不具合情報抽出処理と、
前記不具合情報間の因果関係を特定する因果関係抽出処理と、
前記因果関係に基づいて、入力された不具合事象の原因にあたる不具合事象を推定する故障原因推定処理と、
該故障原因推定処理により推定された不具合事象が、実際に発生しているかどうかの確認の容易さの程度を示す確認容易度を推定する確認容易度推定処理と、
前記推定された前記不具合事象に係る故障原因を絞り込み条件として提示する絞り込み条件提示処理と、
をコンピュータに実行させ
、
前記故障原因推定処理には、抽出された前記不具合情報が実際に故障の原因である可能性を示す確信度を計算する確信度計算処理をさらに有し、
前記絞り込み条件提示処理が、前記確信度と前記確認容易度を組み合わせて絞り込み条件を生成することを特徴とする故障診断プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テキストデータから不具合に関する情報を抽出する故障診断装置、故障診断方法、及び故障診断プログラムに関し、特に不具合情報を絞り込んで不具合の原因を究明する故障診断装置、故障診断方法、及び故障診断プログラムに関する。
【背景技術】
【0002】
近年、製品の故障診断や修理をする際に、症状や診断手順、対処法などを蓄積したデータベースを利用し、このデータベースから、類似した症状の事例を検索することで診断・修理作業を効率化することが行われている。
【0003】
以下に、事故報告書等のテキスト(文字)データによる不具合情報を取得して利用できるようにした、故障診断のための公知技術について説明する。
【0004】
例えば、車両の故障に関する診断・修理事例を検索、提示する技術として、診断・修理事例の検索装置を効率化できるように性能を向上させた事例登録/検索システムが知られている。この事例登録/検索システムは、提示優先スコアの算出に使用する加重値を適宜変更することによって、検索結果が提示される順位を変化させる機能を備えている。この機能によれば、作業者のスキルレベルに応じて、レポートを抽出する観点(効率性および類似性の重視度)を任意に変更することができる。その効果は、ベテラン整備士による効率的な手順を提示させることができる、というものである(特許文献1)。
【0005】
また、故障診断の用途において、事故報告書等のテキストデータに対し、「ため」や「ので」のような手掛かり語を用いてキーワード検索することにより、発生した不具合とその原因との因果関係を解明するために必要な語句や文章を抽出可能にする技術が知られている(非特許文献1)。
【0006】
また、このような手掛かり語が用いられている文章から読み取れる因果関係を示す語句や文章を正解データとする一方で、このような手掛かり語がことさら用いられていない場合であっても因果関係を解明するために必要な語句を抽出可能とする技術も知られている(非特許文献2)。
【0007】
また、故障診断の用途にとどまらず、故障診断で得られた品質向上への貴重なヒント等を新たな製品開発にフィードバックする用途も効果的であるため、フィードバックに値する語句や文章を先行製品の不具合事例文から抽出する手法も提案されている。(非特許文献3)。
【先行技術文献】
【特許文献】
【0008】
【非特許文献】
【0009】
【文献】乾 孝司, 乾健太郎, 松本, 接続標識「ため」に基づく文書集合からの因果関係知識の自動獲得, 情報処理学会論文誌 45(3), 919-933, 2004.
【文献】高橋, 目良, 黒澤, 竹澤, 大規模テキストコーパスを用いた因果関係の自動抽出手法, 言語処理学会 第22回年次大会 発表論文集 (2016年3月).
【文献】大森, 森, 不具合事例文からの製品・部品を示す語の抽出―語の実体性による分類―, 電子情報通信学会論文誌D Vol.J95-D, No.3, pp.697-706, 2012.
【発明の概要】
【発明が解決しようとする課題】
【0010】
機器を構成する何れかの部品に不具合がある場合、不具合の発生有無を容易に確認できる場合と、容易に確認できない場合がある。第1の例として、「機械部品のクリアランスが狭過ぎる」といった不具合は確認が容易である。第2に、電子部品の故障のような不具合は、見た目では不具合が発見できず、何らかの計測機器を用いることが必要で、確認が困難となる。さらに、「エンジンの故障」といった不具合の場合、不具合を解消するためには、「エンジン」を構成している複数の部品の中から、不具合が発生している部品を特定する必要があり、「エンジンの故障」という不具合自体を確認することには意味がない。
【0011】
また、故障診断や修理対応するための資源、すなわち、人材、設備、場所、時間、及び費用は有限である。さらに、原因究明よりも迅速な復旧を優先する場合もある。したがって、故障診断や修理対応には、簡易迅速性が求められる。また、故障診断のための再現実験のようなことを極力不要にするためにも、事故報告書等により原因究明すれば、経験則を有効利用できるので効率的である。特に、事故報告書等を熟練者が読めば、瞬時に原因究明できることが多い。
【0012】
事故報告書等を一読しただけで瞬時に原因究明できる熟練者は希少であるため、熟練者不在でも、その熟練者に代えたコンピュータ及びソフトウェアで構成された故障診断装置による支援が要望されていた。その故障診断装置は、テキストデータで形成された事故報告書から、必要な語句や文章を抽出して故障原因を推定するため、少ない労力で簡易迅速に効果的な検証(以下、「確認作業」ともいう)ができることが重要である。
【0013】
しかしながら、熟練者であれば、ほとんど無意識に行っている情報選別機能がある。すなわち、この情報選別機能は、雑多な情報に優先順位を付けて、故障診断の効率化に寄与する情報を加重して読み取る機能である。これについては、上述の先行技術文献に開示されているだけでは、不十分であり改善余地があった。
【0014】
本発明は、以上の点を考慮してなされたもので、故障原因の候補、あるいは故障原因を特定するために確認すべき項目を提示する際、確認が容易な不具合と、確認が困難、あるいは不可能である不具合と、を区別することで、確認作業を効率化することを目的とする。
【課題を解決するための手段】
【0015】
かかる課題を解決するために本発明は、テキストデータによる事故報告書から故障原因を推定することが可能な故障診断装置であって、前記テキストデータから不具合情報を抽出する不具合情報抽出手段と、前記不具合情報間の因果関係を特定する因果関係抽出手段と、前記因果関係に基づいて、入力された前記不具合事象の原因にあたる不具合事象を推定する故障原因推定手段と、該故障原因推定手段により推定された不具合事象が、実際に発生しているかどうかの確認の容易さの程度を示す確認容易度を推定する確認容易度推定手段と、前記推定された前記不具合事象に係る故障原因を絞り込み条件として提示する絞り込み条件提示手段と、を備えることを特徴とする。
【0016】
また、本発明の別の一例は、上述した故障診断装置において、前記故障原因推定手段には、抽出された前記不具合情報が実際に故障の原因である可能性を示す確信度を計算する確信度計算手段をさらに備え、前記絞り込み条件提示手段が、前記確信度と前記確認容易度を組み合わせて絞り込み条件を生成することを特徴とする。
【発明の効果】
【0017】
本発明によれば、テキストデータによる事故報告書から得られた不具合情報を、確認容易度にしたがって、確認が容易な不具合情報と確認が困難な不具合情報を判定できるため、確認作業が効率化できる。すなわち、本発明に係る故障診断装置によれば、故障原因の候補、あるいは故障原因を特定するために確認すべき項目を提示する際、確認容易度にしたがって、確認が容易な項目を重視し、確認が困難、又は不可能な不具合を後回しにするか無視することで確認作業を効率化できる。
【図面の簡単な説明】
【0018】
【
図1】本発明の一実施形態に係る故障診断装置(以下、「本装置」ともいう)の構成を示すブロック図である。
【
図2】本装置を構成する故障診断プログラムの概略を説明するためのブロック図である。
【
図3】本装置によって作成、利用しやすく、不具合事象が文書ID及び不具合IDに紐づけて記憶された不具合情報テーブルである。
【
図4】本装置において、確認表現の違いに対し、確認の容易さに応じて高得点が付与された確認表現辞書の概念図である。を示す。
【
図5】本装置において、推定表現の違いに対し、確認の困難さに応じて高得点が付与された推定表現辞書の概念図である。
【
図6】本装置において、計量可能表現の違いに対し、取り扱い数値が一般的に大きい表現に高得点が付与された計量可能表現辞書の概念図を示す。
【
図7】本装置において、部品の構造上の階層レベルに応じて得点が付与された部品粒度辞書の概念図である。
【
図8】本装置による故障診断手順を簡単に説明するためのフローチャートである。
【
図9】本装置による確認容易度計算処理の手順をより詳細に説明するためのフローチャートである。
【
図10】不具合事象を記録したテーブルであり、(a)Uタイプ、(b)Vタイプ、(c)Wタイプ、をそれぞれ示している。
【
図11】本装置の絞り込み条件提示サブプログラムによる絞り込み条件提示処理の手順を説明するためのフローチャートである。
【
図12】本装置の絞り込み条件提示サブプログラムによる絞り込み条件提示画面の一例を示す図である。
【発明を実施するための形態】
【0019】
以下、添付図面を参照して本発明の実施形態を説明する。本実施形態は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。各図において共通の構成については同一の参照符号が付されている。
【0020】
以下において、本開示の構成を具体的に説明する。
図1は、本発明の一実施形態に係る故障診断装置(本装置)の構成を示すブロック図である。
図1に示すように、本装置1は、CPU(中央処理装置、Central Processing Unit)2、主メモリ3、入出力装置4、及びディスク装置20を備えて構成されている。
【0021】
CPU2はプロセッサであって、主メモリ3に記憶されたプログラムを実行することによって各種処理を実行する。具体的には、CPU2は、ディスク装置20に記憶されたプログラムを主メモリ3にロードし、主メモリ3にロードされたプログラムを実行する。プログラムは、不図示のネットワークを介して外部サーバから主メモリ3にロードされても良い。
【0022】
主メモリ3は、CPU2によって実行されるプログラム及びCPU2によって必要とされるデータを記憶する。入出力装置4は、ユーザからの情報の入力を受け付けるとともに、CPU2の指示に応じて情報を出力する。例えば、入出力装置4は、キーボード及びマウス等の入力装置、並びに、ディスプレイ等の出力装置である。
【0023】
ディスク装置20は、計算機(コンピュータ)で読み取り可能な非一時的記憶媒体を含む補助メモリである。ディスク装置20は、各種プログラム及び各種データを記憶する。具体的には、ディスク装置20は、OS(operating system)5、故障診断プログラム6、事故報告書13、不具合情報テーブル14、確認表現辞書15、推定表現辞書16、計量可能表現辞書17、部品粒度辞書18を記憶する。
【0024】
故障診断プログラム6は、事故報告書13から不具合情報、不具合間の関係を抽出し、入力された不具合事象に対して、原因となる不具合事象を提示する。故障診断プログラム6は、不具合情報抽出サブプログラム(不具合情報抽出手段)7、因果関係抽出サブプログラム(因果関係抽出手段)8、表現揺れ集約サブプログラム9、確認容易度計算サブプログラム(確認容易度推定手段)10、故障原因推定サブプログラム(故障原因推定手段)11及び絞り込み条件提示サブプログラ(絞り込み条件提示手段)ム12を含む。これらのプログラムの処理については、
図2~
図12を用いて詳細を後述する。
【0025】
CPU2は、上述の各種プログラムを適宜実行することによって所定の機能を実現する。これらのプログラムはプロセッサで実行されることにより定められた処理を行う。そのため、全文にわたって、プログラムを主語とする説明は、CPU2又は故障診断装置(本装置)1を主語とした説明に読み替えても良い。
【0026】
CPU2は、プログラムに従って動作することによって、所定の機能を実現する機能部(手段)として動作する。例えば、CPU2は、不具合情報抽出サブプログラム7に従って動作することで不具合情報抽出部(不具合情報抽出手段)として機能する。本装置1は、これらの機能部(手段)を含む装置である。
【0027】
事故報告書13は、故障診断プログラム6へ入力されるデータであり、不具合情報及び不具合間の因果関係を抽出するために使用される。事故報告書13は、事故・故障・不具合に関する調査内容、調査結果、対策等が記載されたテキスト(文字)データであって、任意のフォーマット(書式、体裁等)により形成されている。
【0028】
不具合情報テーブル14(
図3)は、不具合情報抽出サブプログラム7、因果関係抽出サブプログラム8、表現揺れ集約サブプログラム9の処理結果として得られるデータである。
【0029】
確認表現辞書15(
図4)、推定表現辞書16(
図5)、計量可能表現辞書17(
図6)、部品粒度辞書18(
図7)は、抽出された不具合事象について、確認容易か否かを示す尺度(以下、単に「確認容易」ともいう)を計算するための辞書である。
【0030】
[本発明の要点]
ここで、本発明の要点を予め簡単に説明しておく。本装置1は、事故報告書13等のテキストデータから故障原因を推定することが可能である。本装置1は、故障診断プログラム6を実行することにより課題解決の手段を実現するコンピュータ装置である。上述のディスク装置20に記憶されている故障診断プログラム6は、下位を構成する不具合情報抽出サブプログラム7をはじめとする複数のサブプログラムを伴って実行されるほか、表現辞書15、及び推定表現辞書16も、適宜に動作可能である。
【0031】
不具合情報抽出サブプログラム17は、事故報告書13を構成するテキストデータから不具合情報を抽出する。確認表現辞書15(
図4)、及び推定表現辞書16(
図5)には、不具合情報が確認容易であるかどうかを判定するための手掛かりとなる表現が格納されている。確認表現辞書15、及び推定表現辞書16には、格納されている表現毎にスコアが付与されている。このスコアは、各表現がテキスト中に出現した場合に真に確認表現あるいは推定表現である可能性の高さを示す。例えば、「確認異常なし」のような表現がテキスト中に出現した場合には、ほぼ間違いなく確認表現であるため1.0が格納されている。一方、「正常」の場合には、確認表現ではない可能性があるため、低い値である0.8が格納されている。
【0032】
絞り込む絞り込み条件提示サブプログラム12は、抽出された不具合情報を所定の基準によって絞り込む、絞り込み条件を提示する。このとき、本装置1は、抽出された不具合事象をスコアに基づいて確認容易な順に項目を絞り込む。絞り込みが進行するにつれて、故障原因を推定して出力する。以下に、本装置1をより詳しく説明する。
【0033】
図2は、本装置1を構成する故障診断プログラム6(
図1)の概略を説明するためのブロック図である。なお、
図2の符号7~12は、
図8の符号S1~S4、
図11の符号S22,S24に対応している。
図2に示すように、不具合情報抽出サブプログラム7は、事故報告書13から不具合情報を抽出する。因果関係抽出サブプログラム8は、不具合情報間の因果関係を抽出する。
【0034】
表現揺れ集約サブプログラム9は、抽出した不具合情報の表現の揺れを解消し、同種の不具合情報を一つにまとめ(名寄せ集計)、集計して得られた不具合情報毎の件数に基づいて確信度を計算する。確認容易度計算サブプログラム(確認容易度推定手段)10は、抽出した不具合情報が確認容易であるかどうかを示す確認容易度を計算する。以上の処理によって、不具合情報テーブル14が作成される。なお、確認容易度の計算については詳細に後述する。
【0035】
なお、確認容易度計算サブプログラム(確認容易度推定手段)10は、第1~第5のことを手掛かりとして用いる。
[1]第1に、実際に目視確認したことを示す表現を手掛かりとして用いる(
図4、
図10(a))。
[2]第2に、不具合情報の発生が推定であることを示唆する表現を手掛かりとして用いる(
図5)。
[3]第3に、表現が具体的であるか否かを示す表現を手掛かりとして用いる(
図6、
図7)。
[4]第4に、計量可能な項目であるか否かを手掛かりとして用いる(
図6)。
[5]第5に、部品の構造上の階層関係に基づく、部品の粒度の大小を手掛かりとして用いる(
図7)。
【0036】
[不具合情報テーブル]
図3は、本装置1によって作成、利用しやすく、不具合事象が文書ID及び不具合IDに紐づけて記憶された不具合情報テーブルである。
図3に示すように、不具合情報テーブル14は、事故報告書に含まれる各報告書の文書ID毎に抽出された不具合情報、すなわち、不具合事象リストを、因果関係の情報とともに格納したものである。
図3の例では、文書ID”000001”である事故報告書に3個の不具合事象が記載されており、不具合IDの昇順に、原因/結果という因果関係があることを示している。
【0037】
例えば、文書ID”000001”の場合、不具合ID” 000001001”「部品Aで不具合aが発生」という不具合事象が根本原因であり、その結果、「部品Bで不具合bが発生」し(不具合ID” 000001002”)、最終的な結果として「部品Eで不具合eが発生」した(不具合ID” 000001003”)という順序関係となっている。確認容易度欄は、各不具合事象が確認容易であるかどうかを示す数値であり、数値が大きいほど確認が容易である。
【0038】
故障原因推定サブプログラム11は、故障原因の推定処理を行う(
図11のS22)。このとき、故障原因推定サブプログラム11は、入出力装置4から不具合現象を入力として読み込み、不具合情報テーブル14(
図3)を探索して、原因となり得る不具合情報を原因候補として提示する。不具合事象として、「部品Eで不具合eが発生」した場合にこれを入力として検索を行い、ヒットした文書IDに含まれる他の不具合事象を取得することで、原因の候補を取得することができる。取得された中から、原因の候補として可能性が高い順に不具合情報を選択する。この可能性が高い順について、取得された不具合事象の多い順に多数決で決めても良い。なお、故障原因推定サブプログラム11には、抽出された不具合情報が実際に故障の原因である可能性を示す確信度を計算する確信度計算手段(
図2の11)をさらに備えている。
【0039】
絞り込み条件提示サブプログラム12は、不具合情報テーブル14と確認表現辞書15、推定表現辞書16、計量可能表現辞書17、部品粒度辞書18を読み込み、絞り込み条件となる不具合情報を選択し、絞り込み条件として提示する。ユーザは、提示された条件に対して、Yes/No等の入力を行い、この情報は、故障原因推定サブプログラム11での原因の絞り込みに使用される。
【0040】
[辞書]
図4は、本装置において、確認表現の違いに対し、確認の容易さに応じて高得点が付与された確認表現辞書の概念図である。なお、事故報告書には、不具合があった箇所だけではなく、問題がなかった箇所を含め、調査のプロセス全体が記載されることが多い。不具合がなかった場合には、「部品Aを確認したところ異常がなかった」といった記載がなされる。確認表現辞書は、このような実際に不具合の有無の確認が行われたことを示す表現の辞書である。
【0041】
ある部品について、ある項目に関する不具合の有無の確認が行われる記載が多い場合には、その項目の確認は可能であると考えられる。よって、確認表現辞書の表現を含む、部品と項目の組を調査可能項目として抽出する。確認表現辞書には、確認表現の文字列と、当該確認表現が用いられた場合に、当該項目が確認容易である程度を示すスコアが格納されている。
【0042】
図5は、本装置において、推定表現の違いに対し、確認の困難さに応じて高得点が付与された推定表現辞書の概念図である。なお、事故報告書13では、直接確認ができない原因に関し、例えば消去法によって原因を推定することがある。
図5に示した推定表現辞書は、このような直接確認ができない不具合に関して推定が行われたことを示す表現の辞書である。
【0043】
ある部品について、故障原因の推定が行われる記載が多い場合には、その項目は直接の確認が困難であると考えられる。よって、推定表現辞書の表現を含む、部品と項目の組を調査困難項目として除外できる。推定表現辞書には、推定表現の文字列と、当該推定表現が用いられた場合に、当該項目が確認困難である程度を示すスコアが格納されている。
【0044】
図6は、計量可能表現の違いに対し、取り扱い数値が一般的に大きい表現に高得点が付与された計量可能表現辞書の概念図を示す。なお、絞り込み条件として提示される条件は、具体的である程に確認が容易である。
図6に示すように、長さ、重さのように計量が可能な項目は、具体的であり確認が容易である。また、「ギャップの幅が狭い」、「ギャップの長さが不足」のような表現は、「ギャップが不足」のように表現されることがある。
【0045】
そのため、長さのような計量可能な属性を持つ性質を辞書に追加することも可能である。このような語は、「Aの長さ」といった表現が行われるため、このようなパターンを集計することで、候補を容易に発見できる。計量可能表現辞書には、計量可能表現の文字列と、当該計量可能表現が用いられた場合に、当該項目が確認容易である程度を示すスコアが格納されている。
【0046】
図7は、本装置において、部品の構造上の階層レベルに応じて得点が付与された部品粒度辞書の概念図である。この部品粒度辞書は、粒度の小さい部品名を格納した辞書である。システム・機械を構成する部品は、エンジンのような大きな部品、エンジンの一部であるシリンダーのような小さな部品、さらにシリンダーの一部であるピストンのようなさらに小さな部品といった階層関係がある。部品の粒度とは、部品の大きさを示す概念である。一般に、粒度が小さい部品の方が具体性が高く、確認が容易である。部品の粒度は、システム・機械の設計図等から定めることもできるが、「AのB」といったパターンにおいて、A,Bがともに部品名であるような表現を事故報告書中で探索することで定めることもできる。部品粒度辞書には、部品名の文字列と、当該部品名が用いられた場合に、当該項目が確認容易である程度を示すスコアが格納されている。
【0047】
[故障診断手順]
図8は、本装置1による故障診断手順を簡単に説明するためのフローチャートである。この処理は、
図1に示した故障診断プログラム6による不具合情報テーブル14作成処理が大半を占める。まず、不具合情報抽出サブプログラム7は、不具合情報の抽出処理を行う(S1)。故障レポートから、「バッテリーの電圧が低下」といった不具合に関する情報を抽出する。抽出には、例えば、系列ラベリングのような技術を用いることで実現できるため説明は省略する。
【0048】
因果関係抽出サブプログラム8は、因果関係の抽出処理を行う(S2)。不具合情報間の因果関係を、「~ため」、「~ので」、「~により」等の接続詞、接続助詞を手掛かりとして抽出する。非特許文献1、非特許文献2に開示されている技術を用いることで実現できるため説明は省略する。
【0049】
表現揺れ集約サブプログラム9は、表現揺れの集約処理を行う(S3)。「バッテリー」と「バッテリ」、「電圧が低下」と「電圧が下がる」のような同じ意味を持つ表現の揺れを集約する。同種の不具合情報を集約することで、不具合情報の出現頻度、あるいは確率を計算する。同義語の抽出技術やsentence2vec等の技術を用いることで実現できるため、詳細な説明は省略する。確認容易度計算サブプログラム10は、各不具合情報の確認容易度の計算処理を行う(S4)。このステップS4については、詳細に後述する。
【0050】
図9は、本装置1による故障原因推定処理(故障診断)の手順をより詳細に説明するためのフローチャートである。この処理は、
図1に示した確認容易度計算サブプログラム10による確認容易度計算処理が大半を占める。まず、不具合情報テーブル14から全ての不具合事象を抽出し、同一の不具合事象を集約(名寄せ集計)して、不具合事象リストを作成する(S11)。不具合事象リストは、各不具合事象が出現した文書の文書ID一覧を含む(
図3)。
【0051】
つぎに、不具合事象リスト中の不具合事象を全て処理したかどうかを調べる(S12)。S12でYes、すなわち、全て処理していればS19に進む。しかし、S12でNo、すなわち、未処理の不具合情報があればS13に進んで、全ての出現箇所を処理したかどうかを調べる。
【0052】
つぎに、S14では、不具合事象リスト中の不具合事象が確認容易であるかどうかを判定する。不具合事象が確認容易であるかどうかは、以下のように判定する。例えば、「バッテリー電圧の低下」のような不具合事象について、確認表現辞書15を参照し、「バッテリー電圧の低下なし」「バッテリー電圧の低下確認異常なし」「バッテリー電圧確認異常なし」「バッテリー異常なし」のような不具合確認表現を自動生成する。
【0053】
つぎに、事故報告書13全体を探索し、不具合確認表現があるかどうかを探索する。発見された不具合確認表現について、確認表現辞書15中のスコアに基づいて確認表現に関わるスコアを計算する。スコアは、例えば、元の不具合事象「バッテリー電圧の低下」が10件、「バッテリー電圧確認異常なし」のような対応する不具合確認表現が10件あり、確認表現のスコアの合計が9.6であった場合、9.6/(10+10)=0.48のように計算する。
【0054】
[不具合事象テーブル]
図10は、不具合事象を記録したテーブルであり、(a)Uタイプ、(b)Vタイプ、(c)Wタイプ、をそれぞれ示している。
図10(a)に示すUタイプのテーブル(テーブルU)は、不具合事象そのものに関して、確認表現の件数を「頻度」として加算したものである。これにおいて、頻度欄には、当該不具合事象の出現頻度を格納し、出現箇所の中で確認表現が存在した箇所の件数を格納する。
【0055】
図10(b)に示すVタイプのテーブル(テーブルV)は、不具合事象を抽象化したものである。これにおいて、「低下」のような事象を示す表現を除外し、部品名と不具合が起きた属性の組によって不具合事象を表現している。属性には、「端子」のような電源の一部である部品の名称等も含める。また、「電源電圧の低下」「電源電圧が不安定」のような不具合事象に関しては、両者とも「電源の電圧」に関わる不具合事象であるため、部品が「電源」、属性が「電圧」であるレコードに格納する。
【0056】
図10(c)に示すWタイプのテーブル(テーブルW)は、不具合事象をさらに抽象化したものであり、不具合事象が発生した部品名のみで不具合事象を表現している。
【0057】
ここで、
図9に戻って確認容易度計算処理について、S15以降の手順を説明する。S15では、事故報告書13中の出現箇所を推定表現辞書16で参照し、不具合事象が推定表現を含むか否かを判定する。S14の確認表現辞書のチェックと同様の処理を行い、処理結果はテーブルの推定欄に格納する。
【0058】
計量可能表現辞書17を参照し、未処理の不具合情報が計量可能表現を含むか否かを判定する(S16)。含んでいれば
図10に示すテーブルUの計量欄に数字の1を書き込む。つぎに、部品粒度辞書18を参照し、未処理の不具合情報が具体部品表現を含むか否かを判定する(S17)。含んでいれば、テーブルUの具体欄に、含まれていた具体部品のスコアを書き込む。
【0059】
不具合事象の確認容易度を計算する(S18)。確認容易度の計算は、例えば、下記のように計算する。確認表現と推定表現の確認容易度への寄与をテーブルUにしたがって、下記のように定める。
(確認表現の寄与)=(確認表現の件数)/(出現箇所の総数)
(推定表現の寄与)=(推定表現の件数)/(推定表現の総数)
【0060】
そして、(確認表現の寄与-推定表現の寄与+計量表現の寄与+具体表現の寄与)を確認容易度とする。推定表現のみ、減算を行うのは、推定表現が存在することは、確認が容易ではないことを示すためである。
【0061】
また、テキスト中での不具合事象の出現頻度が低い場合、確認容易度を正しく推定することが困難となる。そのような場合には、
図10(b)のテーブルVを用いて、計算することもできる。「電源電圧が低下」のような不具合事象に対して、
図10(b)のテーブルVを用いる場合には、部品が「電源」であり、属性が「電圧」であるレコードを用いて、確認表現の寄与、推定表現の寄与を計算する。
【0062】
また、部品のみに着目して、
図10(c)のテーブルWを用いて、確認表現の寄与、推定表現の寄与を計算することもできる。また、各不具合事象が確認容易であるかどうかを示す2値のラベルを人手によって付与し、確認表現、推定表現の出現数や計量表現、具体表現であるかどうかを特徴量として用いて、教師あり学習(Supervised learning)によって、確認が容易であるかどうかを識別する方法を用いることも可能である。
【0063】
なお、以上の例では、S11で抽出された不具合事象のみを対象とする例を説明したが、事故報告書13には、直接故障には関係しなかった調査内容が記載されていることもある。例えば、「部品Aの属性Bには異常なし」、「部品Cを確認異常なし」、「部品D正常」といった内容である。確認表現辞書15を用いた確認容易度計算については、このような表現を利用することも可能である。
【0064】
図8に示した処理(S1)、すなわち、不具合情報抽出サブプログラム7で、不具合情報の抽出処理を行う処理(S1)と同様の処理により、異常がなかった正常確認項目を抽出し、正常確認項目から部品名および属性名を抽出し、同様のスコア計算をすれば良い。
【0065】
[絞り込み条件提示処理]
図11は、本装置1の故障原因推定サブプログラム11による故障原因推定処理、絞り込み条件提示サブプログラム12による絞り込み条件提示処理からなる故障診断手順を説明するためのフローチャートである。
図11に示すように、ユーザが、入出力装置4を介して、故障原因を推定したい不具合事象を入力する(S21)。
【0066】
故障原因推定サブプログラム11は、故障原因の推定処理を行う(S22)。この推定処理(S22)について、以下に詳述する。S21において入力された不具合事象を、不具合情報テーブル14の不具合事象欄で探索し、合致したレコードの文書IDを取得する。例えば、「部品Eで不具合eが発生」という事象が入力されたとすると、文書ID”000001”と”000003”が得られる。つぎに、得られた文書IDを不具合情報テーブル14の文書ID欄で探索し、合致したレコードの不具合事象を取得して原因候補とする。
【0067】
図3に示した不具合情報テーブル14において、文書ID”000001”から、「部品Aで不具合aが発生」、「部品Bで不具合bが発生」という2つの不具合事象が、文書ID”000003”から「部品Cで不具合cが発生」及び「部品Dで不具合dが発生」という2つの不具合事象が、原因候補として得られる。
【0068】
得られた原因候補は、集計された結果、同一の不具合事象が複数件あれば、件数が多い順に可能性の高い候補として提示する。すなわち、不具合情報テーブルに記録された不具合事象から読み取られた原因候補の件数を、当該の中から(多数決ではない。多数決は、多いもの1個を提示する。ランキングされるだけ。)故障原因を判定する。なお、多数決は多数決論理回路、又はそれに類するソフトウェアで実行する。所定の論理に基づく重み付けにより、原因候補に対して優先順位を決定する等でも良い。
【0069】
つぎに、故障原因が確定したどうか確認する(S23)。S23でYes、すなわち、故障原因が確定していれば処理を終了し、S23でNo、すなわち、確定していなければS24に進む。確定したかどうかの判断は、十分に少ない種類の不具合事象のみが残っている、あるいは、特定の不具合事象の件数のみが多い等の根拠によって行う。
【0070】
絞り込み条件提示サブプログラム12は、絞り込み条件の提示処理を行う(S24)。S24では、不具合事象の確認容易度を用いて、実際に確認すべき項目に絞り込みを行い、絞り込み条件として提示する。ユーザは、提示された条件について回答を行い、S22では回答に基づいて再度故障原因の推定が行われる。
【0071】
絞り込み条件の生成方法としては様々な方法が考えられるが、最も単純な一例としては、予め定められた閾値より確認容易度が大きい不具合事象を絞り込み条件として提示する方法が考えられる。また確認容易度によって候補を制限した後、確信度順に絞り込み条件をランキングする方法も考えられる。S22において取得された、原因候補である不具合事象に対し、確認容易度を取得し、予め定められた閾値以上の確認容易度を持つ不具合事象のみを、絞り込み条件に採用する不具合情報として採用する。
【0072】
その後、選択された不具合事象を確信度順にランキングし、絞り込み条件として提示すれば良い。それ以外にも、確信度と確認容易度を統合したスコアを用いる方法等も考えられる。スコアの統合には様々な方法が考えられるが、例えば、ランキング学習("Optimum polynomial retrieval functions based on the probability ranking principle", ACM Transactions on Information Systems, 7(3): 183-204.)等の技術を用いることが出来るため、詳細は省略する。
【0073】
図12は、本装置1の絞り込み条件提示サブプログラム12による絞り込み条件提示画面の一例を示す図である。
図12に示す絞り込み条件提示画面には、確認すべき不具合項目(
図3の不具合事象)が列挙され、各項目が示す不具合事象が実際に発生しているかどうかをYes/Noで選択して回答する。回答終了後、「確定」ボタンを押すと、新しい原因候補が表示される。
【0074】
確認できなかった項目は、どちらも選択しない。S21で、「部品Eで不具合eが発生している」という不具合事象が入力された場合、確認容易度が0.2より大きい不具合事象を表示するように設定されていたとすると、部品B、部品D、部品G、部品Hに関する不具合のみが表示される。
【0075】
また、
図12の下部には、確認が容易な項目を優先して表示するかどうかを選択するためのチェックボックスが準備されている。当該チェックボックスを外すと、確認が困難な項目を含めて、全ての不具合事象が提示される。表示の順序は、不具合事象の頻度順にソートして表示しても良いし、確認容易度の降順にソートしても良い。また、順序を切り替えても良い。
【0076】
[本方法及び本プログラムの要点]
ここで、本方法及び本プログラム(以下、「本方法/プログラム」ともいう)の要点を簡単に説明する。本方法/プログラムは、テキストデータによる事故報告書13から故障原因を推定するものである。本方法/プログラムは、不具合情報抽出処理(S1)と、因果関係抽出処理(S2)と、故障原因推定処理(S22)と、確認容易度推定処理(S4)と、絞り込み条件提示処理(S24)と、をコンピュータで構成された本装置1によって実行することによって目的とする効果を発揮する。上述のように、本装置1のディスク装置20には、これら各処理毎にサブプログラムが実行可能に記憶されている(
図1参照)。
【0077】
不具合情報抽出処理(S1)は、テキストデータから不具合情報を抽出する。因果関係抽出処理(S2)は、不具合情報間の因果関係について、「~ため」、「~ので」、「~により」と同等の接続詞又は接続助詞を手掛かりとして抽出する。表現揺れ集約処理(S3)と、不具合情報に実質同等の意味で異なる表現揺れがあればそれを集約(名寄せ集計)する。
【0078】
確認容易度推定処理(S4)は、確認容易度計算プログラム10の実行により、不具合情報が確認容易か否かを、確認表現辞書、推定表現辞書、計量可能表現辞書、部品粒度辞書に基づいて判定し、確認の容易さを数値化して計算する(S4)。各辞書は、それぞれの視点で確認容易さを判定するための表現と、その表現が出現した場合の確認容易さの程度を示すスコアを含む。故障原因推定処理(S22)では、抽出された不具合情報が実際に故障の原因である可能性を示す確信度を計算する確信度計算処理(S22)をさらに有する。絞り込み条件提示処理(S24)では、不具合事象の確認容易度と確信度を組み合わせて絞り込み条件を生成して提示する。
【0079】
[本発明の効果]
以上、説明したように、本発明によれば、事故報告書等のテキストデータにより複数の不具合が抽出された場合、それら相互の因果関係に基づいて故障診断を行う故障診断装置、その方法及びそのプログラムを提供できる。これらは、故障の原因を絞り込むための絞り込み条件を生成する際に、その絞り込み条件が示す現象が実際に発生しているか否かの確認容易さに基づいて優先順位を形成する。これにより、故障診断を少ない労力で簡易迅速かつ効率的に行うことが可能となる。
【0080】
また、本発明によれば、事故報告書のようなテキストデータを情報源として十分に活用させ易くする効果がある。例えば、自動車事故の原因を究明し、再発防止するための技術開発に役立てることも考えられる。
【産業上の利用可能性】
【0081】
本発明は、鉄道車両、航空機、船舶、自動車、エレベータやエスカレータ等の移動・交通・搬送手段、及びこれらに関連した鉄道設備、空港、港湾、道路、発送電設備、燃料・エネルギー補給設備等を含むインフラのほか、ほとんどの生産設備や電気製品に対する故障診断に利用することができる。
【符号の説明】
【0082】
1 故障診断(本装置)
2 CPU
3 主メモリ
4 入出力装置
5 OS
6 故障診断プログラム
7 不具合情報抽出サブプログラム
8 因果関係抽出サブプログラム
9 表現揺れ集約サブプログラム
10 確認容易度計算サブプログラム
11 故障原因推定サブプログラム
12 絞り込み条件提示サブプログラム
13 事故報告書
14 不具合情報テーブル
15 確認表現辞書
16 推定表現辞書
17 計量可能表現辞書
18 部品粒度辞書
20 ディスク装置