(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023163427
(43)【公開日】2023-11-10
(54)【発明の名称】原因部品特定装置およびそれを用いた原因部品特定方法
(51)【国際特許分類】
G06F 16/332 20190101AFI20231102BHJP
G06F 40/279 20200101ALI20231102BHJP
G06F 40/30 20200101ALI20231102BHJP
G06Q 10/20 20230101ALI20231102BHJP
【FI】
G06F16/332
G06F40/279
G06F40/30
G06Q10/00 300
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022074342
(22)【出願日】2022-04-28
(71)【出願人】
【識別番号】000232955
【氏名又は名称】株式会社日立ビルシステム
(74)【代理人】
【識別番号】110000350
【氏名又は名称】ポレール弁理士法人
(72)【発明者】
【氏名】森本 康嗣
【テーマコード(参考)】
5B091
5B175
5L049
【Fターム(参考)】
5B091AA15
5B091BA15
5B175DA01
5B175FA01
5L049CC15
(57)【要約】
【課題】一般的な意味的情報だけでは原因部品を十分絞り込めない解析対象テキストに対しても原因部品の特定を可能とする。
【解決手段】解析対象テキストから不具合事象を抽出する不具合事象抽出部と、解析対象テキストの表現に基づき、不具合事象抽出部により抽出された不具合事象について原因となる不具合事象である原因事象と症状となる不具合事象である症状事象とを特定する因果関係抽出部と、原因事象から特定される原因部品の親部品候補を解析対象テキストから抽出し、抽出された親部品候補のうち、症状事象から特定される症状部品と一致する親部品候補を当該原因部品の親部品として特定する親部品探索部とを有する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
解析対象テキストから不具合事象を抽出する不具合事象抽出部と、
前記解析対象テキストの表現に基づき、前記不具合事象抽出部により抽出された不具合事象について原因となる不具合事象である原因事象と症状となる不具合事象である症状事象とを特定する因果関係抽出部と、
前記原因事象から特定される原因部品の親部品候補を前記解析対象テキストから抽出し、抽出された親部品候補のうち、前記症状事象から特定される症状部品と一致する親部品候補を当該原因部品の親部品として特定する親部品探索部とを有する原因部品特定装置。
【請求項2】
請求項1において、
親部品の探索を要する部品が登録された親部品探索要否判定辞書を有し、
前記親部品探索部は、前記原因事象から特定される原因部品が前記親部品探索要否判定辞書に登録されている場合には当該原因部品の親部品の探索を行い、前記原因事象から特定される原因部品が前記親部品探索要否判定辞書に登録されていない場合には当該原因部品の親部品の探索を行わない原因部品特定装置。
【請求項3】
請求項1において、
単語文字列とその種別が登録された不具合事象抽出用辞書を有し、
前記種別として、少なくとも当該単語文字列が機器または部品であることを示す第1の種別と当該単語文字列が不具合の内容を示す第2の種別とを含み、
前記不具合事象抽出部は、前記解析対象テキストにおいて、前記第1の種別に該当する第1の単語と前記第2の種別に該当する第2の単語とが所定の距離内に現れている場合に、前記第1の単語と前記第2の単語との組を不具合事象として抽出する原因部品特定装置。
【請求項4】
請求項1において、
因果関係を示す接続表現が登録された因果関係パターン辞書を有し、
前記因果関係抽出部は、前記解析対象テキストにおいて、前記不具合事象抽出部により抽出された不具合事象が前記因果関係パターン辞書に登録された接続表現によって結びつけられたパターンに基づき、前記原因事象と前記症状事象とを特定する原因部品特定装置。
【請求項5】
請求項1において、
前記不具合事象抽出部により抽出される不具合事象は、機器または部品であることを示す第1の種別の単語と不具合の内容を表す第2の種別の単語とを含み、
前記原因部品は前記原因事象に含まれる前記第1の種別の単語として特定され、前記症状部品は前記症状事象に含まれる前記第1の種別の単語として特定される原因部品特定装置。
【請求項6】
請求項1において、
前記親部品探索部は、照応解析または省略解析により、前記解析対象テキストから前記原因事象から特定される原因部品の親部品候補を抽出する原因部品特定装置。
【請求項7】
不具合事象抽出部と、因果関係抽出部と、親部品探索部とを備える原因部品特定装置を用いて解析対象テキストから不具合事象についての原因部品を特定する原因部品特定方法であって、
前記不具合事象抽出部は、前記解析対象テキストから不具合事象を抽出し、
前記因果関係抽出部は、前記解析対象テキストの表現に基づき、前記不具合事象抽出部により抽出された不具合事象について原因となる不具合事象である原因事象と症状となる不具合事象である症状事象とを特定し、
前記親部品探索部は、前記原因事象から特定される原因部品の親部品候補を前記解析対象テキストから抽出し、抽出された親部品候補のうち、前記症状事象から特定される症状部品と一致する親部品候補を当該原因部品の親部品として特定する原因部品特定方法。
【請求項8】
請求項7において、
前記原因部品特定装置は、親部品の探索を要する部品が登録された親部品探索要否判定辞書を備え、
前記親部品探索部は、前記原因事象から特定される原因部品が前記親部品探索要否判定辞書に登録されている場合には当該原因部品の親部品の探索を行い、前記原因事象から特定される原因部品が前記親部品探索要否判定辞書に登録されていない場合には当該原因部品の親部品の探索を行わない原因部品特定方法。
【請求項9】
請求項7において、
前記原因部品特定装置は、単語文字列とその種別が登録された不具合事象抽出用辞書を備え、
前記種別として、少なくとも当該単語文字列が機器または部品であることを示す第1の種別と当該単語文字列が不具合の内容を示す第2の種別とを含み、
前記不具合事象抽出部は、前記解析対象テキストにおいて、前記第1の種別に該当する第1の単語と前記第2の種別に該当する第2の単語とが所定の距離内に現れている場合に、前記第1の単語と前記第2の単語との組を不具合事象として抽出する原因部品特定方法。
【請求項10】
請求項7において、
前記原因部品特定装置は、因果関係を示す接続表現が登録された因果関係パターン辞書を有し、
前記因果関係抽出部は、前記解析対象テキストにおいて、前記不具合事象抽出部により抽出された不具合事象が前記因果関係パターン辞書に登録された接続表現によって結びつけられたパターンに基づき、前記原因事象と前記症状事象とを特定する原因部品特定方法。
【請求項11】
請求項7において、
前記不具合事象抽出部により抽出される不具合事象は、機器または部品であることを示す第1の種別の単語と不具合の内容を表す第2の種別の単語とを含み、
前記原因部品は前記原因事象に含まれる前記第1の種別の単語として特定され、前記症状部品は前記症状事象に含まれる前記第1の種別の単語として特定される原因部品特定方法。
【請求項12】
請求項7において、
前記親部品探索部は、照応解析または省略解析により、前記解析対象テキストから前記原因事象から特定される原因部品の親部品候補を抽出する原因部品特定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、故障レポート等から不具合の原因部品を特定する原因部品特定装置およびそれを用いた原因部品特定方法に関する。
【背景技術】
【0002】
ICT(Information and Communication Technology)の普及に伴い個人や組織がアクセス可能な電子化文書の量が増大しており、自然言語処理を活用した電子化文書の有効利用に対する期待が高まっている。
【0003】
自然言語処理を活用した故障原因診断支援技術に関し、例えば、非特許文献1には、故障レポートに記載された不具合情報から因果モデルを抽出する方法が開示されている。故障の原因と症状の関係を抽出することにより、症状から原因を推定する支援を行う。
【先行技術文献】
【特許文献】
【0004】
【非特許文献】
【0005】
【非特許文献1】清水勇喜, 不具合情報からの因果モデル抽出技術の開発, 言語処理学会 第22回年次大会 発表論文集(2016年3月), pp.641-644
【発明の概要】
【発明が解決しようとする課題】
【0006】
故障レポートに記載された報告文から機械的に情報を抽出するために自然言語処理を活用するにあたり、記載されている内容から原因部品を特定することが困難になる場合がある。
【0007】
例えば、「接点が錆びていたことが原因と判明し、交換を実施した。」という報告文の場合、原因部品として「接点」、故障原因として「錆びた」を抽出することができる。しかしながら、「接点」は機器の多くの箇所に存在するため、実際に交換や修理といった保守作業を行うためには、「どの」接点であるかを特定する必要がある。しかしながら、故障レポートでは、そのような情報が機械処理し易い形で記載されていないことが多い。例えば、「ブザーの接点が錆びていた~」のように記載されていれば、「ブザー」の「接点」であるという情報を容易に抽出できる。しかしながら、実際には、「ブザーの調査を実施。接点が錆びていたことが原因と判明し、交換を実施した。」のように、2つの文に分かれて記述されていることも多い。1文単位の解析では、「ブザー」と「接点」とを結びつけることができない。特許文献1は複数文に跨る関係性を解析するための技術が開示されており、「ブザーが接点を構成部品として含む」という情報を用いることで、「ブザー」と「接点」の関係を推定する。これは、照応解析あるいは省略解析と呼ばれる技術の一種であり、「接点」と関係する語を、意味的な制約の知識、例えば「「接点」は「ブザー」の一部である」という知識を用いて絞り込むものである。
【0008】
しかしながら、これだけではまだ十分ではない。例えば、「A水槽とB水槽の調査を実施。配管の汚れにより~」のような例の場合、「A水槽」と「B水槽」はいずれも構成部品として「配管」を含むため、どちらも意味的な制約を満たしていることになる。部品間の親子関係という情報からは、どちらの「水槽」の「配管」に問題があったのかを推定することはできず、A水槽の配管なのか、B水槽の配管なのか、原因部品を特定することができない。
【0009】
本発明はこのような背景に基づきなされたものであり、一般的な意味的情報だけでは原因部品を十分絞り込めない解析対象テキストに対しても原因部品の特定を可能とする原因部品特定装置、及び原因部品特定方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明の一実施の態様である原因部品特定装置は、解析対象テキストから不具合事象を抽出する不具合事象抽出部と、解析対象テキストの表現に基づき、不具合事象抽出部により抽出された不具合事象について原因となる不具合事象である原因事象と症状となる不具合事象である症状事象とを特定する因果関係抽出部と、原因事象から特定される原因部品の親部品候補を解析対象テキストから抽出し、抽出された親部品候補のうち、症状事象から特定される症状部品と一致する親部品候補を当該原因部品の親部品として特定する親部品探索部とを有する。
【発明の効果】
【0011】
部品間の親子関係に関する意味制約が不十分な場合でも、原因部品を適切に特定することができる。
【0012】
その他、本願が開示する課題、およびその解決方法は、発明を実施するための形態の欄、および図面により明らかにされる。
【図面の簡単な説明】
【0013】
【
図1】原因部品特定装置(情報処理装置)のハードウェア構成例である。
【
図2】原因部品特定処理を説明するための文例である。
【
図3】本実施例の原因部品特定処理の特徴を説明するための図である。
【
図5】不具合事象抽出用辞書のデータ構造例である。
【
図7】親部品探索要否判定辞書のデータ構造例である。
【発明を実施するための形態】
【0014】
以下、実施形態について図面を参照しつつ説明する。以下の説明において、同一のまたは類似する構成について同一の符号を付して重複した説明を省略することがある。以下の説明において、符号の前に付した「S」の文字は処理ステップを意味する。
【0015】
図1に、原因部品特定装置10を構成する情報処理装置(コンピュータ)のハードウェア構成を示す。情報処理装置は、プロセッサ11、主記憶装置12、補助記憶装置13、入力装置14、出力装置15および通信装置16を備える。
図1に示した各機能は、情報処理装置のプロセッサ11が、補助記憶装置13からロードされて主記憶装置12に記憶しているプログラムを読み出して実行することにより実現される。なお、情報処理装置による処理は、情報処理装置が備えるハードウェア(AIチップ、FPGA、SoC、ASIC等)によって実行されてもよい。
【0016】
プロセッサ11は、CPU(Central Processing Unit)で構成される。MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、AI(Artificial Intelligence)チップ、FPGA(Field Programmable Gate Array)、SoC(System on Chip)、ASIC(Application Specific Integrated Circuit)等を用いて演算を実行するように構成されてもよい。
【0017】
主記憶装置12は、プログラムやデータを記憶する装置であり、RAM(Random Access Memory)等である。
【0018】
補助記憶装置13は、プログラムやデータを格納する装置であり、例えば、ROM(Read Only Memory)、不揮発メモリ、SSD(Solid State Drive)、ハードディスクドライブ、光学式記憶媒体(CD(Compact Disc)、DVD(Digital Versatile Disc)等)、ICカード、SDカード等である。補助記憶装置13の一部あるいは全部は、クラウドが提供する仮想的な記憶領域等であってもよい。補助記憶装置13には、情報処理装置の機能を実現するためのプログラムおよびデータが格納されている。補助記憶装置13は、記録媒体の読取装置や通信装置16を介してプログラムやデータの書き込み/読み出しが可能である。補助記憶装置13に格納(記憶)されているプログラムやデータは、主記憶装置12に随時読み出される。
【0019】
入力装置14は、外部からのユーザ入力やデータ入力を受け付ける、例えば、キーボード、マウス、タッチパネル、カードリーダ、音声入力装置(例えば、マイクロホン)等である。
【0020】
出力装置15は、各種情報を、画像によって出力する表示装置、音声によって出力する音声出力装置、紙媒体に印刷する印刷装置等である。
【0021】
通信装置16は、通信ネットワーク20(LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、専用線、公衆通信網等)を介して他の情報処理装置との間で通信を行う装置であり、無線又は有線の通信モジュール(無線通信モジュール、通信ネットワークアダプタ、USBモジュール等)である。
【0022】
情報処理装置は、例えば、スマートフォン、タブレット、パーソナルコンピュータ(デスクトップ型またはノートブック型)等である。情報処理装置は、例えば、クラウドシステムにより提供されるクラウドサーバのように仮想的な情報処理資源を用いて実現されるものであってもよい。情報処理装置は、通信ネットワーク上に分散配置された複数の情報処理装置によって構成されていてもよい。また、情報処理装置には、例えば、オペレーティングシステム、ファイルシステム、DBMS(DataBase Management System)(リレーショナルデータベース、NoSQL等)等のソフトウェアが導入されていてもよい。
【0023】
図1に示すように、補助記憶装置13は、原因部品特定プログラム30やプログラムの実行に必要な不具合事象抽出用辞書40、因果関係パターン辞書50、親部品探索要否判定辞書60の各情報(データ)を記憶する。補助記憶装置13は、例えば、DBMSが提供するデータベースのテーブルや、ファイルシステムが提供するファイルとして、各情報を記憶することができる。プログラムや辞書の詳細については後述する。
【0024】
図2に、本実施例の原因部品特定処理を説明するための文例を示す。故障診断支援システム構築のための故障レポートの解析においては、自然言語処理によって原因部品として抽出された部品が複数の機器に共通に使用される部品(例えば、「配管」、「接点」など)である場合には、抽出された原因部品が使用されている機器または親部品を特定することによって、1つの原因部品として特定する必要がある。
【0025】
図2の例文において、「配管の汚れ」、「水槽があふれた」は不具合事象であり、両者が「により」という因果関係を示す表現により接続されていることから、不具合事象「配管の汚れ」は原因事象であり、不具合事象「A水槽があふれた」は症状事象であることが分かる。したがって、原因事象の部品「配管」は原因部品、症状事象の部品「A水槽」は症状部品と呼ぶ。ここで、故障レポートのような機器の保全に関わる故障・機器の不具合に関するテキストでは、症状部品と原因部品との間に親子関係(部分-全体関係)が存在することが多い。これは以下のような理由による。
【0026】
図3に示すように機器・部品は、比較的大きな大部品の組み合わせで構成され、大部品は更に中部品の組み合わせで構成され、中部品は更に小部品で構成され、というように階層的な構造を持っている。例えば、機器A、Bはそれぞれ大部品1~3で構成され、大部品1は中部品1~3で構成され、中部品は小部品1~3で構成されているとする。ここで、小部品1で不具合が発生すると、小部品1を含む中部品1が不具合を起こし、更に大部品1が不具合を起こし、最終的に機器Aまたは機器Bが不具合を起こす、というように不具合が伝搬する。
【0027】
このように、機器・部品の階層関係と不具合事象の因果関係とは対応しており、因果関係を階層関係に読み替えることが可能である。すなわち、小部品1が機器Aと機器Bに共通に使用されている部品であっても、不具合が生じている機器が機器Aであるならば機器Aの小部品1であり、不具合が生じている機器が機器Bであるならば機器Bの小部品1であると推定することができる。本実施例では、この性質を用いて、不具合事象間の因果関係を部品の親子関係に読み替えることにより、原因部品を一意に特定する。
【0028】
図4に、原因部品特定装置10による原因部品特定処理の処理フローを示す。原因部品特定装置10は、解析対象とする故障レポート等のテキストを読み込むとともに、補助記憶装置13に格納されている原因部品特定プログラム30を主記憶装置12にロードし、プロセッサ11により実行することにより原因部品特定処理を実行する。なお、プロセッサ11は、プログラムに従って所定の処理を実行することによって、所定の機能を提供する機能部として機能する。例えば、プロセッサ11は、不具合事象抽出サブプログラムを実行することで不具合事象抽出部として機能する。他のサブプログラム、プログラムについても同様である。このように所定のプログラムを実行する情報処理装置について、プログラムが実行する機能に応じて機能部と表現することがある。
【0029】
不具合事象抽出サブプログラム31は、テキストから不具合事象を抽出する(S11)。不具合事象とは、解析対象テキストに含まれている「水槽があふれる」のような不具合を表すフレーズである。不具合事象の抽出は、様々な方法で実現できるが、ここでは故障レポートに出現する単語は比較的限定されていることから、
図5に示すような不具合事象抽出用辞書40をあらかじめ作成しておき、辞書40を参照して抽出を行う例について説明する。なお、活用語の語尾変化や類義語への対応等のような一般的な自然言語処理については、別途汎用の辞書やシソーラスを用いて処理することができるので、本実施例での詳細な説明では省略する。
【0030】
辞書40において、単語文字列41が辞書に格納されている単語であり、種別42は単語の種類を表している。単語の種類には、「機器・部品」、「不具合」がある。不具合事象の抽出では、辞書40と解析対象テキストとを照合し、辞書と合致する単語を探索する。
図2に示す文例の場合、「配管」、「水槽」が「機器・部品」として見つかり、「汚れ」、「あふれ」が「不具合」として見つかる。抽出された「機器・部品」単語と「不具合」単語とが一定の距離内に現れているかどうかを確認し、一定の距離内に現れている場合には、この「機器・部品」単語と「不具合」単語の組を不具合事象として抽出する。
【0031】
なお、辞書40における種別は例示のものに限定されない。例えば、種別として「属性」を加えてもよい。例えば、「水圧」や「回転数」を属性として辞書40に格納しておくことで、水圧の異常や回転数の異常といった不具合が属性によって記述されているような文章についても抽出が可能になる。
【0032】
さらに、辞書を用いた不具合事象の抽出方法の他にも、系列ラベリングのような教師あり学習を用いる方法などが適用可能である。系列ラベリングは、入力文の各単語に対してラベルを付与するものであり、「機器・部品」、「不具合」といったラベルを付した文を学習させて学習済みモデルを生成し、未知の解析対象テキスト中の各単語に対して、「機器・部品」、「不具合」といったラベルを出力することができる。
【0033】
次に、因果関係抽出サブプログラム32は、抽出された不具合事象間の因果関係を抽出する(S12)。これは、
図6に示すような因果関係パターン辞書50をあらかじめ保持することによって行える。因果関係パターン辞書50には、例えば、「AによりB」、「AのためB」、「Bが発生した原因はA」のような接続表現が登録されており、解析対象テキストから因果関係パターン辞書50に登録された接続表現で結びつけられた不具合事象を抽出する。不具合事象A、Bが辞書50に格納された接続表現で結ばれている場合には、Aが原因事象、Bが症状事象として特定される。
【0034】
次に、故障原因部品抽出サブプログラム33は、原因部品を抽出する(S13)。ステップS12で抽出された原因事象に含まれる部品を原因部品として抽出する。
図2の文例では「配管」が原因部品として抽出される。
【0035】
次に、親部品探索要否判定サブプログラム34は、ステップS13において抽出された原因部品に関し、親部品の探索が必要かどうかを判定する(S14)。判定については、例えば、
図7に示す親部品探索要否判定辞書60を用いる方法が考えられる。親部品探索要否判定辞書60は、「配管」のような多くの機器の部品として使用される部品の辞書を事前に作成したものである。辞書60に含まれている場合には親部品の探索が必要と判定する。親部品の探索が不要である、すなわち、ステップS13で抽出された原因部品により機器の故障原因部品が一意に特定されていると判定できる場合には、解析対象テキストの解析を終了する。
【0036】
親部品の探索が必要と判定された原因部品について、親部品探索サブプログラム35は親部品探索を行う(S15)。親部品探索は以下のように行う。まず、抽出された原因部品に対して、特許文献1に開示されるような照応解析または省略解析により、親部品候補を抽出する。
図2の文例では、解析対象テキストに「A水槽とB水槽の調査を実施した結果、」という文が含まれているため、「「配管」は「水槽」の一部である」という意味的制約についての知識を用いて、原因部品「配管」の親部品候補が「A水槽」、「B水槽」であると抽出される。続いて、ステップS12で抽出した症状事象に含まれる部品を症状部品として抽出する。これはステップS13における原因部品の抽出と同じ方法で行える。
図2の文例では「A水槽」が症状部品として抽出される。その結果、抽出した症状部品と一致する親部品候補が存在する場合には、これを親部品とする。これにより、
図2の文例では「A水槽」が親部品として特定されるので、原因部品を「A水槽の配管」として解析対象テキストの解析を終了する。
【0037】
以上、本発明の実施形態につき説明したが、本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。また例えば、上記した実施形態は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また各実施形態の構成の一部について、他の構成に追加、削除、置換することが可能である。
【0038】
また上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また実施形態で示した各機能を実現するソフトウェアのプログラムコードによっても実現できる。
【0039】
以上の実施形態において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。また以上では各種の情報を表形式で例示したが、これらの情報は表以外の形式で管理してもよい。
【符号の説明】
【0040】
10:原因部品特定装置、11:プロセッサ、12:主記憶装置、13:補助記憶装置、14:入力装置、15:出力装置、16:通信装置、20:通信ネットワーク、30:原因部品特定プログラム、31:不具合事象抽出サブプログラム、32:因果関係抽出サブプログラム、33:故障原因部品抽出サブプログラム、34:親部品探索要否判定サブプログラム、35:親部品探索サブプログラム、40:不具合事象抽出用辞書、41:単語文字列、42:種別、50:因果関係パターン辞書、60:親部品探索要否判定辞書。