【文献】
森下 真一,流通業におけるデータマイニングの応用,第29回人工知能セミナー講演テキスト,日本,社団法人人工知能学会,1995年 7月 4日,pp.53-62
【文献】
野地 幸一,サービスオーダ投入の効率化と品質向上を目指して SO入力支援システムの開発,NTT技術ジャーナル,社団法人電気通信協会,1992年 8月 1日,第4巻 第8号,pp.14-16
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0013】
以下,本発明の実施形態を,図面を参照して説明する。
【0014】
まず,
図1〜3を用いて,本発明により出力される表示形態を説明する。
【0015】
図1は事故・故障の要因分析結果の表示例である。事故・故障の情報である事故関連情報(111〜113)とその他の周辺要因(121〜124)が図示され,関連する情報が矢印等により結ばれている(101〜107)。例えば,周辺要因2(122)が事故関連情報2(112)と関連している場合は、周辺要因2から事故関連情報2への矢印(102)で表す。一方,三つ以上の情報である周辺要因1(121)と周辺要因2(122)と事故関連情報1(111)が互いに関連している場合には中心に丸印(101)を表示し,該周辺要因から該丸印への矢印(105,106)と該丸印から該事故関連情報1への矢印(107)で表す。また,
図3に示すように関連する情報を丸で囲み,要因から事故関連情報への矢印で表す(301)方法や,要因から事故関連情報への矢印(311,312)と要因を直線(310)で結んで表す方法も考えられる。ここで,周辺要因2(122),周辺要因3(123),事故関連情報2(112)は,該周辺要因2から該事故関連情報2への矢印(102)と該周辺要因3から該事故関連情報2への矢印(103)で結ばれているが,これらの三情報が互いに関連しているのではなく,該周辺要因2と該周辺要因3は別個に該事故関連情報2と関連していることを表す。また,事故関連情報同士に関連がある場合には直線で結ぶ(104)。
【0016】
次に,
図2は財務情報と非財務情報の関係分析結果の表示例である。
図1と同様に財務情報(211〜213)と非財務情報(221〜224)が図示され,関連する情報が矢印等により結ばれている(201〜204)。また,矢印若しくは直線の太さは関連の強さを表し,例えば非財務情報3(223)と財務情報2(212)との関係は非財務情報2(222)と該財務情報2との関係より強いことを表す。また,矢印若しくは直線の種類(実線/破線)は互いに負の影響を与えているか正の影響を与えているかを表し,例えば非財務情報2(222)は財務情報2(212)に正の影響を与えている(204)が,財務情報3(213)には負の影響を与えている(202)。また,
図3に示すように正の影響を与えている場合には「+」を矢印に記載し(321),負の影響を与えている場合には「−」を矢印に記載する(322)方法も考えられる。更に,正の影響を与えている場合には黒い矢印,負の影響を与えている場合には赤い矢印とする場合も考えられる。一方,矢印の太さではなく色の違いを使って関係の強さを表すことも考えられる。
【0017】
次に,本発明の実施形態の処理を,
図4,5,22を用いて説明する。
【0018】
まず,本発明の実施形態のシステムは,データを図示する表示部(2200),表示部に表示されたデータをマウス,キーボード等を用いて選択,データを入力するユーザ入力部(2210),他システムや他の記憶媒体よりデータを入力するデータ入力部(2220),本発明の方法を処理部に実行させるプログラム(2231),該プログラムにより生成されたデータ(2232),入力部(2210,2220)より入力されたデータ等を記録する記憶部(2230),プロセッサやメモリを有し該プログラムを実行する処理部(2240),各部分間のデータの通信を行うネットワーク(2250)から構成される。
図1〜3に示した表示形態は表示部(2200)に表示される。
次に,
図4は事故・故障の要因分析方法の一例である。まず,データ入力部(2220)から入力され入力データ記録部(2233)に記録された,事故・故障関連情報(411)と,要因の候補である運用・保全情報(412)や環境外部情報(413)を入力とし,処理部(2240)が,プログラム記録部(2231)に記録されたプログラムを用いて,
図1に示したような関係を求める因果関係生成を行う(400)。次に,データ入力部(2220)から入力され入力データ記録部(2233)に記録された業務知識(410)を用い,処理部(2240)が,プログラム記録部(2231)に記録されたプログラムを用いて因果関係を修正し表示部(2200)に表示する(401)。もし,誤った因果関係が表示されている場合には,表示部(2200)に表示された該関係に対応する矢印等を,ユーザ入力部(2210)のマウス,キーボード等のデバイスを用いて選択することにより,業務知識(410)へ該関係を保存する。
【0019】
次に,
図5は財務情報の要因分析方法の一例である。まず,データ入力部(2220)から入力され入力データ記録部(2233)に記録された財務情報(510)とそれ以外の非財務情報(511)を入力とし,処理部(2240)が,プログラム記録部(2231)に記録されたプログラムを用いて,
図2に示したような関係を求める因果関係生成を行う(500)。次に,処理部(2240)が,プログラム記録部(2231)に記録されたプログラムを用いて,因果関係毎に寄与率を算出し,
図2における矢印の太さや種類に反映し表示部(2200)に表示する(501)。次に,ユーザ入力部(2210)を用いてユーザが,非財務情報に新たな値を代入すると,処理部(2240)が,プログラム記録部(2231)に記録されたプログラムを用いて,影響を予測し表示部(2200)に表示する(502)。
【0020】
次に,事故・故障関連情報(411),要因の候補である運用・保全情報(412),環境外部情報(413), 財務情報(510),非財務情報(511)に関して,
図6,7を用いて説明する。各データベースには
図6に示すようなデータの形態が記録されたテーブルが1つ存在する。該テーブルには,データベースに格納されているデータ名(601),データの種類(602),及び種類に応じたパラメタ(603)が記録されている。ここで,データの種類(602)には,データの種類が環境外部情報(413)における気温や財務情報(510)における売上の様な実数データの場合には「1」,データの種類が運用・保全情報(412)における目視劣化度合いの様な値の順序のみが意味を持つ順序数の場合には「2」,データの種類が事故・故障関連情報(411)における事故種類のようなカテゴリ番号を表す場合には「3」が格納されている。また,パラメタ(603)はデータの種類(602)が「3」の場合のみ値が入力されており,該カテゴリ番号のカテゴリ数が格納される。例えば、事故種類のデータが「渇水(カテゴリ番号=1)」「水道管破裂(カテゴリ番号=2)」「洪水(カテゴリ番号=3)」の3種類あればカテゴリ数「3」が格納される。次に,
図6に記録されたデータ名毎に
図7に示したテーブルが格納される。該テーブルには値が発生若しくは計測された時刻(701)とその値(702)が記録されている。
【0021】
次に,因果関係生成処理(400,500)を,
図8を用いて示す。ここで,結果データは,事故・故障の要因分析(
図4)の場合には事故・故障関連情報(411),財務情報と非財務情報の関係分析(
図5)の場合には財務情報(510)であり,要因候補データは,事故・故障の要因分析(
図4)の場合には運用・保全情報(412)と環境外部情報(413),財務情報と非財務情報の関係分析(
図5)の場合には非財務情報(511)である。
【0022】
まず,因果関係生成処理(400,500)では、プログラム記録部(2231)に記録されたプログラムを用いて,処理部(2240)が,入力データ記録部(2233)に記録された,事故・故障の要因分析(
図4)の場合には事故・故障関連情報(411),運用・保全情報(412),及び,環境外部情報(413)を、財務情報と非財務情報の関係分析(
図5)の場合には財務情報(510)及び非財務情報(511)を読み込み、対象となるデータ全ての組み合わせに対して相関係数を求め生成データ記録部(2232)に記録する(801)。ここで,組み合わせにおける双方のデータの種類(602)がいずれも実数である場合(すなわち、データの種類が「1」を示す場合)には,ピアソンの積率相関係数を,いずれかが順序数である場合(すなわち、データの種類が「2」を示す場合)には,スピアマンの順位相関係数を求める。また,データの種類(602)のいずれかがカテゴリである場合(すなわち、データの種類が「3」を示す場合)には,該データのカテゴリ数(603)分のダミー変数法を用いてスピアマンの順位相関係数を求める。ここで,ダミー変数法とは,例えばカテゴリ数が3の場合,3つのデータとみなし,カテゴリの値(702)が1,2,3である場合,カテゴリの値1,2,3を、各々(1,0,0),(0,1,0),(0,0,1)であると考える方法である。
【0023】
次に,処理部(2240)は、求めた相関係数を基に因果関係があるデータのグルーピングを行う(802)。なお,本実施例では相関係数を用いた方法を示したが,データをベクトルとみなし,その角度に基づく類似度を用いる方法等も考えられる。更に,データから
図10に示す因果関係を出力するその他の方法を用いても良い。
【0024】
次に,因果関係グルーピング処理(802)を,
図9を用いて説明する。まず,プログラム記録部(2231)に記録されたプログラムを用いて,処理部(2240)が,全ての結果データに対して902〜903の処理を行う(901)。ここで結果データとは,因果関係の結果となるデータを表し,事故・故障関連情報(411)若しくは財務情報(510)に含まれるデータである。結果データRiは、
図6に示した1つのレコードに記載のデータであり,
図7に示すテーブルが1つのデータである。まず,結果データRiと強い相関(相関係数の絶対値が0.5より大きい)を持つデータの集合Siを求める(902)。本実施例では「相関係数の絶対値が0.5より大きい」として説明したが、0.5以外の値でもよい。次に,Siに含まれる全ての要因データに対し,強い相関を持つデータ同士を,結果データRiと共にグループGilとする(903)。
【0025】
因果関係グルーピング処理(802)の具体例を
図23〜26,10を用いて説明する。
図23は相関係数算出(801)によって求められた相関行列で,各行の左に記載されたデータ(2310)と各列の上に記載されたデータ(2311)の相関係数が記載されている。算出された相関係数が0.5より大きい値の場合には背景を灰色で表している。ここで,同じデータの相関は1.0で自明なので淡色で表でいる。また,相関行列は対象行列なので,i行j列の値とj行i列の値は等しい。結果データは「結果1」(2301)と「結果2」(2302)なので,それぞれに対し(901),強い相関を持つデータの集合を求める(902)。
図23の場合,第1行(2301)と第2行(2302)で0.5より大きな相関を持つデータ集合は
図24の2401,2402になる。次に,各データ集合(2401,2402)の相関行列(
図23の部分行列になる)で高い相関があるデータを同グループとする(903)。データ集合2401に含まれる要因「要因1」「要因2」に対応する相関行列が
図25であり,「要因1」「要因2」が強い相関を持つため,グループ化され,「結果1」「要因1」「要因2」が1つのグループとなる(1001〜1003)。一方,データ集合2402に含まれる「要因2」「要因3」に対応する相関行列が
図26であり,「要因2」「要因3」は強い相関を持たないため,別個のグループとなり,「結果2」「要因2」(1008,1009)と「結果2」「要因3」(1010,1011)のグループになる。更に,「結果1」「結果2」も強い相関を持つので,グループとなる(1004,1005)。
【0026】
処理部(2240)は、以上の処理により求められた因果関係データを生成データ記録部(2232)に出力する。因果関係データの例を
図10に示す。因果関係データは、例えば、因果関係生成(400,500)によりグループ化されたデータ名(1000)とグループ番号(1020)を含む。
【0027】
処理部(2240)は、因果関係データを用いて、表示部2200に因果関係を表示する。処理部(2240)は、生成データ記録部(2232)に記録された
図10の因果関係データを参照し、グループ1(1001〜1003)とグループ6(1012〜1014)のようにグループが3つ以上のデータから構成される場合は1101,1106のように、直線で各データを結ぶのではなく、例えば、各データからの線を1点に集約して表示する。さらに,データが要因ならば矢印の始点とし,結果ならば矢印の終点として表示する。グループ2(1004,1005),グループ3(1006,1007)のようにグループが2つの結果データから構成される場合は直線で結ぶ(1102,1103)。グループ4(1008,1009),グループ5(1010,1011),グループ7(1015,1016)のようにデータが要因データと結果データから構成される場合は,要因データから結果データへの矢印を表示する(1104,1105,1107)。
【0028】
次に,業務知識(410)のデータ例を,
図12を用いて説明する。該業務知識には,因果関係として誤りであるデータの組が記録されている。
図12の場合,「結果1」と「結果2」(1201),「結果2」と「結果3」(1202),「結果2」と「結果2」と「要因4」(1203)の因果関係は誤りである事を表す。
【0029】
次に,因果関係修正処理(401)を
図10〜13を用いて説明する。処理部(2240)は、プログラム記録部(2231)に記録されたプログラムを用いて,求められた因果関係(
図10,11)に対し,業務知識(
図12)に含まれる因果関係がある場合には,そのグループを削除する。
図10〜12の場合,1201に対応する因果関係はグループ2(1004,1005,1102),1202に対応する因果関係はグループ3(1006,1007,1103),1203に対応する因果関係はグループ6(1012〜1014,1106)なので,それらを削除する。これにより、
図10の因果関係データは
図13に示す通りとなり、処理部(2240)は、
図11に示した因果関係を、
図13の因果関係データに基づいて
図14に示すように修正して表示部2200に表示する。
【0030】
次に,誤関係選択処理(402)を,
図14〜16を用いて説明する。
図14の表示でユーザが誤関係である1400を選択した場合,ユーザ入力部2210を介して該選択情報を受け付けると、処理部(2240)は、グループ4の該関係を因果関係データから削除し、因果関係表示を
図15のように修正し表示部(2200)に表示する。また、処理部(2240)は、グループ4の組(1600)を業務知識(410)に追加する。
【0031】
次に,寄与率算出処理(501)を説明する。処理部(2240)は、プログラム記録部(2231)に記録されたプログラムを用いて,グループが2つのデータから構成される場合には801で求めた相関係数を寄与率として算出し,グループが3つ以上のデータから構成される場合には,グループ内の全てのデータの組み合わせにおける相関係数の平均を寄与率として算出する。処理部(2240)は、算出した寄与率の絶対値の値に比例して矢印の太さを変更し,寄与率の符号が正の場合には矢印を実線,負の場合には破線として表示部(2200)に表示する。例えば、
図2に示すように、矢印若しくは直線の太さを用いて寄与率を表す。例えば非財務情報3(223)と財務情報2(212)との関係は非財務情報2(222)と該財務情報2との関係より強い(寄与率が大きい)ことを表す。また,矢印若しくは直線の種類(実線/破線)は互いに負の影響を与えているか正の影響を与えているかを表し,例えば非財務情報2(222)は財務情報2(212)に正の影響を与えている(204)が,財務情報3(213)には負の影響を与えている(202)。また,
図3に示すように正の影響を与えている場合には「+」を矢印に記載し(321),負の影響を与えている場合には「−」を矢印に表示してもよい(322)。
【0032】
次に,影響予測処理(502)を,
図17〜21を用いて説明する。まず,処理部(2240)はは、事故・故障の要因分析(
図4)の場合には事故・故障関連情報(411),運用・保全情報(412),及び,環境外部情報(413)を、財務情報と非財務情報の関係分析(
図5)の場合には財務情報(510)及び非財務情報(511)を読み込み、全てのデータの組み合わせに関して,回帰係数を算出する(1801)。求められた回帰係数データ例を
図19に示す。回帰係数データは組み合わせた2つのデータ名(1901,1902)と回帰係数(1903)から構成される。次に,ユーザからの変更値の入力を受け付ける(1802)。例えば,ユーザからユーザ入力部(2210)を介して
図20の表示画面で「非財務情報2」(2000)の選択を受け付ける。すると変更値入力プロンプト2001を表示部(2200)に表示し(2001),ユーザ入力部(2210)を介してユーザから入力値「100」を受け付ける。次に,回帰係数データの中で選択された「非財務情報2」(1901)を含むデータ1911〜1912に基づき,関係するデータ(1902)への影響値を入力値×回帰係数の式に基づき算出する(1803)。算出結果を
図17に示す。
図17は、影響があるデータのデータ名と影響値とを含む。次に,
図17に基づいて、影響があるデータ名(1701)とその影響値(1702)を出力する(1803)。処理部(2240)、表示部(2200)にこれらの情報を表示する。出力結果例を
図21に示す。