IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱重工業株式会社の特許一覧

特許7491821要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム
<>
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図1
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図2
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図3
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図4
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図5
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図6
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図7
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図8
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図9
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図10
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図11
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図12
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図13
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図14
  • 特許-要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-20
(45)【発行日】2024-05-28
(54)【発明の名称】要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラム
(51)【国際特許分類】
   G06Q 10/04 20230101AFI20240521BHJP
【FI】
G06Q10/04
【請求項の数】 13
(21)【出願番号】P 2020199010
(22)【出願日】2020-11-30
(65)【公開番号】P2022086803
(43)【公開日】2022-06-09
【審査請求日】2023-02-16
(73)【特許権者】
【識別番号】000006208
【氏名又は名称】三菱重工業株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100162868
【弁理士】
【氏名又は名称】伊藤 英輔
(74)【代理人】
【識別番号】100161702
【弁理士】
【氏名又は名称】橋本 宏之
(74)【代理人】
【識別番号】100189348
【弁理士】
【氏名又は名称】古都 智
(74)【代理人】
【識別番号】100196689
【弁理士】
【氏名又は名称】鎌田 康一郎
(72)【発明者】
【氏名】円谷 信一
【審査官】山田 倍司
(56)【参考文献】
【文献】特開平05-114899(JP,A)
【文献】特開2006-048183(JP,A)
【文献】特開平10-124476(JP,A)
【文献】野本 多津,プリント基板実装における不良発生傾向抽出方式 実装不良対策支援システムの研究,日本経営工学会論文誌,日本,社団法人日本経営工学会,1998年12月,Vol.49, No.5,p.304-310
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
コンピュータによって実行される要因推定方法であって、
観測対象について複数のパラメータを設定し、各パラメータに前記観測対象の属性を示す属性値又は前記属性が不明な場合には仮の値を設定した前記観測対象の観測データを取得するステップと、
前記パラメータの組み合わせに基づいて、前記観測データをグルーピングするステップと、
前記観測対象に関係する事象の発生状況を評価するための評価項目を設定し、前記観測データに対して前記評価項目についての評価値を設定するステップと、
前記グルーピングによって生成されたグループごとにそのグループに属する前記観測データの前記評価値の代表値を算出し、前記グループに属する前記観測データの数を示す度数と前記代表値とを対応付けたグループ統計値を算出するステップと、
前記グループ統計値のうち、前記評価値の代表値が所定の閾値条件を満たし、かつ、前記度数が所定値以上のものを抽出するステップと、
前記抽出するステップにて抽出した前記グループ統計値に対応する前記グループに共通する前記パラメータの値を、前記事象の要因となるパラメータおよびその値として決定するステップと、
を有する要因推定方法。
【請求項2】
前記閾値条件を満たす前記評価値と満たさない前記評価値とを含む前記グループを、第2グループとして抽出し、
抽出した前記第2グループについて、新たなパラメータが前記事象の発生状況に関与すると仮定し、前記仮定したパラメータを、前記第2グループの前記パラメータに追加するとともに、
前記仮定したパラメータは、前記第2グループの前記パラメータおよびその値を有する観測対象に対して、前記第2グループの中で前記閾値条件を満足する前記評価値が占める割合に応じた確率で、前記事象を発生させる性質を持った要因であると推定する、
請求項に記載の要因推定方法。
【請求項3】
前記グループごとに前記事象の発生確率を推定するステップ、をさらに有する請求項1から請求項の何れか1項に記載の要因推定方法。
【請求項4】
コンピュータによって実行される予測方法であって、
請求項1から請求項の何れか1項に記載の要因推定方法で決定した前記パラメータおよびその値と前記事象との関係と、第2の前記観測データに対応する観察対象が有する前記属性値と、に基づいて、第2の前記観測データに対応する前記観測対象に生じる前記事象を予測する予測方法。
【請求項5】
請求項に記載の要因推定方法で前記パラメータおよびその値を決定した場合、当該パラメータおよびその値を持つ前記観測対象には、前記第2グループの中で前記閾値条件を満足する前記評価値が占める割合に応じた確率で、前記事象が発生すると予測する、
請求項を引用する場合の請求項に記載の予測方法。
【請求項6】
前記評価項目ごとに発生確率を予測する、
請求項または請求項に記載の予測方法。
【請求項7】
コンピュータによって実行される属性値推定方法であって、
前記事象が発生した観測対象の第3に係る前記観測データにおける前記パラメータの値を、請求項1から請求項の何れか1項に記載の要因推定方法で決定した前記パラメータおよびその値と前記事象との関係に基づいて推定する、
属性値推定方法。
【請求項8】
観測対象について複数のパラメータを設定し、各パラメータに前記観測対象の属性を示す属性値又は前記属性が不明な場合には仮の値を設定した前記観測対象の観測データを取得するデータ取得部と、
前記パラメータの組み合わせに基づいて、前記観測データをグルーピングし、前記観測対象に関係する事象の発生状況を評価するための評価項目を設定し、前記観測データに対して前記評価項目についての評価値を設定し、前記グルーピングによって生成されたグループごとにそのグループに属する前記観測データの前記評価値の代表値を算出し、前記グループに属する前記観測データの数を示す度数と前記代表値とを対応付けたグループ統計値を算出し、前記グループ統計値のうち、前記評価値の代表値が所定の閾値条件を満たし、かつ、前記度数が所定値以上のものを抽出し、前記抽出した前記グループ統計値に対応する前記グループに共通する前記パラメータの値を、前記事象の要因となるパラメータおよびその値として決定する要因推定部と、
を有する要因推定装置。
【請求項9】
請求項に記載の要因推定装置と、
前記要因推定部が決定した前記パラメータおよびその値と前記事象との関係と、前記データ取得部が取得した第2の前記観測データに対応する観察対象が有する前記属性値と、に基づいて、第2の前記観測データに対応する前記観測対象に生じる前記事象を予測する予測部と、
を備える予測装置。
【請求項10】
請求項に記載の要因推定装置と、
前記データ取得部が取得した、前記事象が発生した観測対象に係る第3の前記観測データにおける前記パラメータの値を、前記要因推定部が決定した前記パラメータおよびその値と前記事象との関係に基づいて推定する属性値推定部と、
を備える属性値推定装置。
【請求項11】
コンピュータに、
観測対象について複数のパラメータを設定し、各パラメータに前記観測対象の属性を示す属性値又は前記属性が不明な場合には仮の値を設定した前記観測対象の観測データを取得するステップと、
前記パラメータの組み合わせに基づいて、前記観測データをグルーピングするステップと、
前記観測対象に関係する事象の発生状況を評価するための評価項目を設定し、前記観測データに対して前記評価項目についての評価値を設定するステップと、
前記グルーピングによって生成されたグループごとにそのグループに属する前記観測データの前記評価値の代表値を算出し、前記グループに属する前記観測データの数を示す度数と前記代表値とを対応付けたグループ統計値を算出するステップと、
前記グループ統計値のうち、前記評価値の代表値が所定の閾値条件を満たし、かつ、前記度数が所定値以上のものを抽出するステップと、
前記抽出するステップにて抽出した前記グループ統計値に対応する前記グループに共通する前記パラメータの値を、前記事象の要因となるパラメータおよびその値として決定するステップと、
を実行させるプログラム。
【請求項12】
前記決定するステップにて決定した前記パラメータおよびその値と前記事象との関係と、第2の前記観測データに対応する観察対象が有する前記属性値と、に基づいて、第2の前記観測データに対応する前記観測対象に生じる前記事象を予測するステップ、
を更に実行させる請求項11に記載のプログラム。
【請求項13】
前記事象が発生した観測対象の第3に係る前記観測データにおける前記パラメータの値を、前記決定するステップにて決定した前記パラメータおよびその値と前記事象との関係に基づいて推定するステップ、
を更に実行させる請求項11に記載のプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラムに関する。
【背景技術】
【0002】
観測対象の属性値が判明していれば、観測値(観測対象に生じる事象や観測対象の挙動)を予測できることが多い。例えば、観測値が、感染症における症状変化の場合、基礎疾患の有無、年齢などの患者の属性値が判明していれば、過去の観測結果との関係から、確率的な予測が可能となる。確率的な予測に基づいて計画を立てるような場合、より高い予測の精度が求められることがある。例えば、複数の属性の組み合わせでグルーピングを行い、カテゴライズした観測対象のグループごとに観測値を絞り込むことで、観測値に影響する属性(つまり、観測値の要因)を解析する方法が存在する。感染症の場合であれば、感染者を肺の疾患を持つ患者のグループにカテゴライズし、肺の疾患と感染症が重症化しやすいこととの関係に絞り込んで両者の関係を解析し、予測精度の向上を図る。カテゴライズの際に観測値の要因を適切に抽出することができれば、予測精度を向上することができる。
【0003】
関連する技術として、特許文献1には、観測データを分析して、対象物の状態変化の因果関係を説明する因果モデルを複数作成し、全ての因果モデルに対して、原因の事後確率を求め、事後確率の大きさに基づいて因果モデルを順位付けし、さらに順位の高い因果モデルから順に妥当性の評価を行って、因果関係の探索を行う方法が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特許第6154523号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
グループを特徴付ける属性を増やし、グループを細分化すれば、データのバラつきは減少し、予測精度は見かけ上向上しているように見える。しかし、この場合、グループの母数が減少し、予測結果の信頼性は低下する可能性がある。予測精度と信頼性の向上のためには、属性の組み合わせを適切に設定する必要がある。
【0006】
そこでこの開示は、上述の課題を解決することのできる要因推定方法、予測方法、属性値推定方法、要因推定装置、予測装置、属性値推定装置およびプログラムを提供することを目的としている。
【課題を解決するための手段】
【0007】
本開示の一態様によれば、要因推定方法は、コンピュータによって実行される要因推定方法であって、観測対象について複数のパラメータを設定し、各パラメータに前記観測対象の属性を示す属性値又は前記属性が不明な場合には仮の値を設定した前記観測対象の観測データを取得するステップと、前記パラメータの組み合わせに基づいて、前記観測データをグルーピングするステップと、前記観測対象に関係する事象の発生状況を評価するための評価項目を設定し、前記観測データに対して前記評価項目についての評価値を設定するステップと、前記グルーピングによって生成されたグループごとにそのグループに属する前記観測データの前記評価値の代表値を算出し、前記グループに属する前記観測データの数を示す度数と前記代表値とを対応付けたグループ統計値を算出するステップと、前記グループ統計値のうち、前記評価値の代表値が所定の閾値条件を満たし、かつ、前記度数が所定値以上のものを抽出するステップと、前記抽出するステップにて抽出した前記グループ統計値に対応する前記グループに共通する前記パラメータの値を、前記事象の要因となるパラメータおよびその値として決定するステップと、を有する。
【0008】
本開示の一態様によれば、予測方法は、上記の要因推定方法で決定した前記パラメータおよびその値と前記事象との関係と、第2の前記観測データに対応する観測対象が有する前記属性値と、に基づいて、第2の前記観測データに対応する観測対象に生じる前記事象を予測する。
【0009】
本開示の一態様によれば、属性値推定方法は、前記事象が発生した観測対象に係る第3の前記観測データにおける前記パラメータの値を、上記の要因推定方法で決定した前記パラメータおよびその値と前記事象との関係に基づいて推定する。
【0010】
本開示の一態様によれば、要因推定装置は、観測対象について複数のパラメータを設定し、各パラメータに前記観測対象の属性を示す属性値又は前記属性が不明な場合には仮の値を設定した前記観測対象の観測データを取得するデータ取得部と、前記パラメータの組み合わせに基づいて、前記観測データをグルーピングし、前記観測対象に関係する事象の発生状況を評価するための評価項目を設定し、前記観測データに対して前記評価項目についての評価値を設定し、前記グルーピングによって生成されたグループごとにそのグループに属する前記観測データの前記評価値の代表値を算出し、前記グループに属する前記観測データの数を示す度数と前記代表値とを対応付けたグループ統計値を算出し、前記グループ統計値のうち、前記評価値の代表値が所定の閾値条件を満たし、かつ、前記度数が所定値以上のものを抽出し、前記抽出した前記グループ統計値に対応する前記グループに共通する前記パラメータの値を、前記事象の要因となるパラメータおよびその値として決定する要因推定部と、を有する。
【0011】
本開示の一態様によれば、予測装置は、上記の要因推定装置と、前記要因推定部が決定した前記パラメータおよびその値と前記事象との関係と、前記データ取得部が取得した第2の前記観測データに対応する観測対象が有する前記属性値と、に基づいて、第2の前記観測データに対応する観測対象に生じる前記事象を予測する予測部と、を備える。
【0012】
本開示の一態様によれば、属性値推定装置は、上記の要因推定装置と、前記データ取得部が取得した、前記事象が発生した観測対象に係る第3の前記観測データにおける前記パラメータの値を、前記要因推定部が決定した前記パラメータおよびその値と前記事象との関係に基づいて推定する属性値推定部と、を備える。
【0013】
本開示の一態様によれば、プログラムは、コンピュータに、観測対象について複数のパラメータを設定し、各パラメータに前記観測対象の属性を示す属性値又は前記属性が不明な場合には仮の値を設定した前記観測対象の観測データを取得するステップと、前記パラメータの組み合わせに基づいて、前記観測データをグルーピングするステップと、前記観測対象に関係する事象の発生状況を評価するための評価項目を設定し、前記観測データに対して前記評価項目についての評価値を設定するステップと、前記グルーピングによって生成されたグループごとにそのグループに属する前記観測データの前記評価値の代表値を算出し、前記グループに属する前記観測データの数を示す度数と前記代表値とを対応付けたグループ統計値を算出するステップと、前記グループ統計値のうち、前記評価値の代表値が所定の閾値条件を満たし、かつ、前記度数が所定値以上のものを抽出するステップと、前記抽出するステップにて抽出した前記グループ統計値に対応する前記グループに共通する前記パラメータの値を、前記事象の要因となるパラメータおよびその値として決定するステップと、を実行させる。
前記プログラムは、コンピュータに、前記決定するステップにて決定した前記パラメータおよびその値と前記事象との関係と、第2の前記観測データに対応する観測対象が有する前記属性値と、に基づいて、第2の前記観測データに対応する観測対象に生じる前記事象を予測するステップ、を更に実行させてもよい。
前記プログラムは、コンピュータに、前記事象が発生した観測対象に係る第3の前記観測データにおける前記パラメータの値を、前記決定するステップにて決定した前記パラメータおよびその値と前記事象との関係に基づいて推定するステップ、を更に実行させてもよい。
【発明の効果】
【0014】
本開示の要因推定方法、要因推定装置、プログラムによれば、観測対象に生じる事象の要因を推定することができる。本開示の予測方法、予測装置、プログラムによれば、観測対象への事象の発生を予測することができる。本開示の属性値推定方法、属性値推定装置、プログラムによれば、観測対象が有する属性値を推定することができる。
【図面の簡単な説明】
【0015】
図1】実施形態における解析装置の一例を示すブロック図である。
図2】実施形態における要因推定処理の一例を示すフローチャートである。
図3】実施形態におけるパラメータの一例を示す図である。
図4】実施形態における観測データの一例を示す図である。
図5】実施形態におけるパラメータの組み合わせの一例を示す図である。
図6】実施形態における評価項目の一例を示す図である。
図7】実施形態におけるグループごとの評価値と平均値の一例を示す図である。
図8】実施形態における評価値と度数の分布を示す図である。
図9】実施形態における評価値の分散について説明する図である。
図10】実施形態の未知のパラメータを仮定した処理について説明する図である。
図11】実施形態における要因推定方法について説明する図である。
図12】実施形態における要因推定処理による出力例を示す図である。
図13】実施形態における予測処理の一例を示すフローチャートである。
図14】実施形態における属性値推定処理の一例を示すフローチャートである。
図15】実施形態の解析装置のハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0016】
<実施形態>
以下、本開示の一実施形態による要因推定方法、予測方法、属性値推定方法について図1図15を参照して説明する。
(構成)
図1は、実施形態における解析装置の一例を示すブロック図である。
解析装置10は、観測対象が有する属性とその観測対象に生じる事象や観測対象の挙動との関係性(因果関係、相関関係など)を解析して、事象の要因を推定する。また、解析装置10は、観測対象に対して、その観測対象が有する属性と、推定した事象の要因に基づいて、観測対象に事象が生じる可能性を予測する。また、解析装置10は、属性が明確ではない観測対象に事象が発生したときに、その観測対象が有する属性を推定する。観測対象と事象の例を挙げると、例えば、観測対象が人で事象は感染症の発症、進展である。解析装置10は、感染症の発症者が有する年齢、性別、基礎疾患の有無などの属性と、感染症の進展状況との関係を解析する。例えば、解析装置10は、解析結果を、感染症の感染が疑われる人へ適用して、感染症の進展を予測する。解析装置10は、感染症を発症した人が有する属性が不明な場合に、その人の感染症の進展状況に基づいて、その人の属性を推定する。観測対象と事象の他の例としては、観測対象が量産品で事象が不良品であってもよいし、観測対象がプラントで事象が故障であってもよい。
【0017】
図1に示すように解析装置10は、データ取得部11と、設定受付部12と、要因推定部13と、予測部14と、属性値推定部15と、出力部16と、記憶部17とを備える。
データ取得部11は、観測対象の属性を示すパラメータを含む観測データを取得する。
設定受付部12は、閾値や評価値等の設定を受け付ける。
要因推定部13は、観測データを解析して事象の要因となるパラメータおよびその値を推定する。
予測部14は、観測対象の観測データと、要因推定部13が推定した要因とに基づいて、観測対象に生じる事象を予測する。
属性値推定部15は、事象が生じた観測対象が有する属性値を推定する。
出力部16は、要因推定部13が推定した要因、予測部14による予測結果、属性値推定部15が推定した属性値などを出力する。
記憶部17は、観測データなど諸々の情報を記憶する。
【0018】
(動作)
次に解析装置10の動作について説明する。解析装置10は、要因推定、予測、属性値推定の機能を有するが、まず、図2図11を用いて要因推定部13による要因推定処理ついて説明する。
【0019】
(要因推定処理)
図2は、実施形態における要因推定処理の一例を示すフローチャートである。
データ取得部11が、複数の観測対象の観測データを取得する(ステップS1)。観測データには、観測対象が有する様々な属性のうち、事象の要因として考えられる複数のパラメータが設定され、各パラメータには、その観測対象の属性値が設定されている。ここで、図3に観測データに設定されるパラメータの一例を示す。例えば、事象が感染症の進展の場合、パラメータは、基礎疾患、喫煙習慣、肥満、高脂血症、高血圧、血栓症歴の有無、高齢などである。例えば、事象が量産品の製造における不良品や遅延の発生の場合、パラメータは、工作機械の出力や溶接温度などの加工条件、量産品の製造に用いる部品のロット番号などである。例えば、事象がプラントの故障や停止の場合、パラメータは、プラントにて計測される圧力、温度、流量などである。各パラメータには、ON,OFFの何れかの値が設定される。例えば、基礎疾患であれば、観測対象に基礎疾患があればON、なければOFFが設定される。また、加工条件であれば、ある量産品が所定の条件を満たす環境で加工されたならばON,そうでなければOFFが設定される(この場合の条件は、製造条件は満たした上で課される付加的な条件を指す)。また、プラントの場合、圧力が所定の範囲内ならOFF、範囲外ならONが設定される。図4に観測データの一例を示す。観測データは、観測対象ID、日時、パラメータ1~N(図4の例ではN=7)の各項目を有する。ある1つの観測対象について、例えば、パラメータ1の属性値が分からない場合には、パラメータ1にONを設定したデータと、パラメータ1にOFFを設定したデータの2つの観測データを作成してもよい。このように本実施形態では、一部のパラメータの属性が不明であっても、属性値を仮定し、以降の処理を行うことで要因の推定が可能である。データ取得部11は、複数の観測データを取得し、記憶部17に記録する。
【0020】
次に要因推定部13は、パラメータの組み合わせに基づいて、観測データをグルーピングする(ステップS2)。図5にパラメータの組み合わせの一例を示す。例えば、観測データにパラメータ1~7が設定されているとする。要因推定部13は、パラメータ1~7の一部又は全部を組み合せてできるグループを複数パターン作成し、観測データを各グループにグルーピングする。例えば、要因推定部13は、パラメータ1~7のうち1つのみを用いたグループ、つまり、パラメータ1のみに注目したグループ、パラメータ2のみに注目したグループ、・・・の7通りのグループを作成してもよい。各パラメータはONまたはOFFの値をとるため、要因推定部13は、パラメータ1のグループについて、さらにパラメータ1の値がONのグループ(G-1-1)、パラメータ1の値がOFFのグループ(G-1-2)を作成する。同様に、要因推定部13は、パラメータ2の値がONのグループ(G-1-3)、パラメータ1の値がOFFのグループ(G-1-4)を作成する。さらに要因推定部13は、パラメータ1~7の中から2つを選択して、複数のグループを作成する。例えば、要因推定部13は、選択した2つのパラメータの値の組み合せごとにグループを作成する(例えば、G-2-1~G-2-8)。このようなグループは、全部で×2通り作成できる。要因推定部13は、パラメータ1~7の中から2つを組み合わせたグループを全パターン作成してもよいし、明らかに意味のない組み合わせを除いてグループを作成してもよいし、ユーザによって指定される組み合せのグループを作成してもよい。又は、要因推定部13は、特定のアルゴリズムによって、あるいはランダムに複数のグループを作成してもよい。要因推定部13は、3つのパラメータを組み合わせたグループについても複数パターン作成する。全パターン作成する場合には、×2通りのグループが作成できる。要因推定部13は、4~7つのパラメータを組み合わせたグループについても同様に複数パターンずつ作成する。要因推定部13は、データ取得部11が取得した観測データを、該当するグループに分類する(観測データのグルーピング)。例えば、図4の観測対象ID=001の観測データは、図5に例示するグループのうちG-1-1、G-1-3、G-2-1、G-3-2にグルーピングされる。観測対象ID=002の観測データは、図5のG-1-2、G-1-4、G-2-4にグルーピングされる。
【0021】
次に要因推定部13は、事象の発生状況を評価するための評価項目を設定する(ステップS3)。設定受付部12は、ユーザによる評価項目の設定を受け付け、要因推定部13は、観測データに評価項目を設定する。図6に評価項目の一例を示す。例えば、事象が、感染症の進展の場合、評価項目として、軽症から中等症への悪化、軽症から中等症への移行期間、軽症期間、軽症時の体温、中等症から重症への悪化などが設定される。例えば、事象が、量産品の製造における不良品や遅延の発生の場合、評価項目として、“不良1”の発生、“不良2”の発生、納期遅延の発生などが設定される。例えば、事象が、プラントの故障や停止の場合、評価項目として、“故障1”の発生、“故障2”の発生、プラントの停止などが設定される。
【0022】
次に要因推定部13は、設定した評価項目ごとに以下のステップS4~S14の処理を行う。
要因推定部13は、観測データごとに評価値を設定する(ステップS4)。例えば、評価項目が、軽症から中等症への悪化の場合、ユーザは、観測対象ID=001について、その人の軽症から中等症への悪化の程度を数値化した値を解析装置10へ入力する。設定受付部12は、入力された悪化程度を示す値を取得する。要因推定部13は、設定受付部12が受け付けた値を観測対象ID=001の観測データと対応付けて記憶部17に記録する。要因推定部13は、他の観測対象の観測データについても、評価項目1について軽症から中等症への悪化程度を示す値を設定する。
【0023】
次に要因推定部13は、グループごとに評価値の平均値を算出する(ステップS5)。例えば、グループG-1-1に観測対象IDが001、011、012のIDを持つ観測データがグルーピングされていて、各観測データの評価項目1の値が、70、60、50の場合、要因推定部13は、グループG-1-1の評価項目1についての評価値の平均値60を算出する。要因推定部13は、他のグループについても評価値の平均値を算出する。図7に、グループごとの評価値と平均値の一例を示す。
【0024】
次に要因推定部13は、評価値の平均値と度数の分布を算出する(ステップS6)。ここで、度数とは、グループに分類された観測データの数(観測対象の数)である。例えば、図7の例ではグループG-1-1の度数は3である。要因推定部13は、各グループの度数を算出し、グループごとの評価値の平均値と度数の分布を算出する。例えば、要因推定部13は、評価値の平均値と度数とを座標軸とする座標系に、各グループに対応する点をプロットする。1つの評価項目についてのグループごとの評価値の平均値と度数の分布をプロットした図を図8上段の分布図70に示す。
【0025】
次に要因推定部13は、評価項目についての評価値の高低を判定するためのHighとLowの閾値を設定する(ステップS7)。例えば、ユーザは、評価項目1の軽症から中等症への悪化の評価値についてHigh(中等症への悪化の程度が大きい)と判定する閾値Th1と、Low(中等症への悪化の程度が小さい)と判定する閾値Th2とを解析装置10へ入力する。設定受付部12は、入力された閾値Th1、Th2を取得する。要因推定部13は、設定受付部12が取得した閾値Th1、Th2をステップS6で算出した評価値と度数の分布に対して適用する。例えば、閾値Th1よりも評価値の平均値が大きいグループは、軽症から中等症への悪化程度が大きい観測対象が集められたグループである。このグループに集約された観測対象の観測データを解析することによって、軽症から中等症への悪化を促進する要因を特定できる可能性がある。要因推定部13は、後続の処理によって、軽症から中等症への悪化を促進する要因を推定する。反対に、閾値Th2よりも評価値の平均値が小さいグループは、軽症から中等症への悪化程度が小さい観測対象が集められたグループである。このグループに集約された観測データを解析することによって、軽症から中等症への悪化を抑制する要因を特定できる可能性がある。要因推定部13は、後続の処理によって、軽症から中等症への悪化を抑制する要因を推定する。
例えば、出力部16は、分布図70を表示装置へ出力してもよい。
【0026】
次に要因推定部13は、グループの整理を行う(ステップS8)。例えば、ユーザは、分布図70を参照して近くにある点を確認し、各点の属性値を比較する。そして各点の属性値が類似していれば、異なる属性値を無視して1つのグループにまとめることを検討する。例えば、図8の分布図70における評価値の平均値が類似するグループg1とグループg2がともにパラメータ1~7のうちのパラメータ2~5で構成されているとする。また、グループg1の属性値はパラメータ2=ON、パラメータ3=ON、パラメータ4=ON、パラメータ5=ONであり、グループg2の属性値はパラメータ2=ON、パラメータ3=ON、パラメータ4=ON、パラメータ5=OFFであるとする。また、グループg3はパラメータ2~4で構成されていて、グループg3の属性値はパラメータ2=ON、パラメータ3=ON、パラメータ4=ONであるとする。ユーザは、評価項目1の評価値にパラメータ5は影響ないと考え、パラメータ5の値をONでもOFFでもない値(例えば、ブランク)とするような指示情報を解析装置10へ入力する。設定受付部12は、この指示情報を受け付ける。要因推定部13は、評価項目1について、各観測データのパラメータ5にブランクを設定し、再度ステップS2と同様のグルーピングを行う。この処理により、グループg1~g3は1つの同じグループg4へとグルーピングされる。要因推定部13は、他のグループについても同様の処理を行う。グループ整理後の評価値と度数の分布を図8下段の分布図71に示す。
【0027】
次に要因推定部13は、各グループに分類された観測データの数が十分であることを判定するための度数の閾値を設定する(ステップS9)。グループに属する観測データの数が少なければ、そのグループの観測データを解析して、要因が推定できたとしても母数が少ないために信頼性の高い解析結果とならない可能性がある。従って、ステップS9では、観測データの数が閾値以上のグループだけを解析対象とするように度数の閾値を設定する。例えば、ユーザは、母数を担保できる度数の閾値Vを解析装置10へ入力する。設定受付部12は、入力された閾値Vを取得する。要因推定部13は、設定受付部12が取得した閾値VをステップS6~S8で算出した評価値と度数の分布に対して適用する(図8下段の分布図71)。例えば、出力部16は、分布図71を表示装置へ出力してもよい。
【0028】
次に要因推定部13は、評価値の分布が適切かどうかを判定する(ステップS10)。例えば、閾値Th1より高い平均値を有する整理後のグループ又は/及び閾値Th2より低い平均値を有する整理後のグループが存在すれば、要因推定部13は、評価値の分布が適切であると判定する。評価値の分布が適切ではない例を、図9上段の分布図72に示す。分布図72では、全てのグループが中央の範囲に集まっている。閾値を超過するグループが得られない場合、要因推定部13は、分布が適切では無いと判定する。又は、ユーザが、分布図72を参照して、分布が適切かどうかを判断し、その結果を解析装置10へ入力し、入力された判断結果に基づいて、要因推定部13が、分布が適切かどうかを判定してもよい。
【0029】
分布が適切な場合(ステップS10;Yes)、要因推定部13は、評価値の平均値が閾値Th1以上で、かつ、度数が閾値V以上のグループ(分布図71のg4)を抽出する。また、要因推定部13は、評価値の平均値が閾値Th2以下で、かつ、度数が閾値V以上のグループ(分布図71のg0)を抽出する。要因推定部13は、抽出したグループ(g0とg4)を処理対象として、後述するステップS14の処理へ進む。
【0030】
分布が適切では無い場合(ステップS10;No)、出力部16は、例えば、パラメータの追加を受け付ける設定画面などを生成し、表示装置へ出力する。例えば、図3に例示した感染症の進展のパラメータ1~7のうち、パラメータ4が影響の大きい属性である場合、パラメータ4を設定しない状態で、ステップS9までの処理を行っても各グループには、パラメータ4がONの観測データとOFFの観測データが混在し、グループごとの評価値の平均値を算出すると分布がHighとLowの間に集中する可能性がある。このような分散状況の場合、影響のあるパラメータ4を追加して、再度、グルーピング(ステップS2)、評価値の設定(ステップS4)、平均値の算出(ステップS5)、平均値と度数の分布の算出(ステップS6)を行うことにより、図9下段の分布図73に示す適切な分散状況に変化させることを試みる。ユーザは、評価項目1に関係のあるパラメータを探して、追加できそうなパラメータがあれば(ステップS11;Yes)、新たなパラメータとそのパラメータについての各観測対象の属性値を解析装置10へ入力する。また、ユーザは、観測データの各々について、新たに追加したパラメータの値(ON又はOFF)を設定する。設定受付部12は、新しいパラメータおよび各観測データに対する値の入力を受け付け、記憶部17が記憶する観測データに反映させる。要因推定部13は、パラメータ追加後の観測データについて、グルーピング、評価値の設定、平均値の算出、平均値と度数の分布の算出を実行する(ステップS13)。その後、要因推定部13は、ステップS10以降の処理を繰り返し実行する。
【0031】
追加するパラメータが見つからない場合(ステップS11)、ユーザは、追加パラメータ無しとの情報を解析装置10へ入力する。追加パラメータ無しが入力されると、要因推定部13は、未知のパラメータを仮定し、事象の発生確率を設定する(ステップS12)。図10を参照して、ステップS12の処理について説明する。要因推定部13は、整理後の各グループについて、あるいは、評価値の平均値と閾値Th1、Th2の何れかとの差が所定の範囲内にある整理後のグループについて、平均値ではなく、グループを構成する観測データ1つずつの評価値の分布を算出する。この処理を行う対象のグループは、ユーザによって選択されてもよい。例えば、要因推定部13は、図10上段の分布図74に示すグループg5、g6について、各観測データの評価値に分解して分布を算出する。図10下段の分布図75は、対象グループについて観測対象ごとの評価値に分解した場合の例である。(各観測データの度数は1だが、分布図75では度数は無視して記してある。)図10下段の分布図75に示すように、分解後の分布において、閾値Th1、Th2を超過する観測データが存在する場合、要因推定部13は、評価項目1の事象の要因となる1つ又は複数の未知のパラメータが存在すると仮定する。また、要因推定部13は、この未知のパラメータについて、当該未知パラメータの値がON又はOFFであることによって、グループg5に該当する属性値を有する観測対象について3/8の確率で、評価項目1の事象の発生を抑制し、グループg6に該当する属性値を有する観測対象について3/6の確率で、評価項目1の事象の発生を促進する効果があるパラメータであると認識する。
【0032】
次に要因推定部13は、対象とする評価項目の要因を推定する(ステップS14)。例えば、評価項目1について、Highに分類されたグループ(評価値の平均値が閾値Th1以上)をG-k、G-l、G-m、G-n、Lowに分類されたグループ(評価値の平均値が閾値Th2以下)を、G-p、G-q、・・・とする。評価項目1がHighとなる要因を推定する場合、要因推定部13は、G-k、G-l、G-m、G-nのパラメータの重なりを解析する。図11に解析結果の一例を示す。図11において、例えば、Go1とGo4はG-m、G-nに共通するパラメータおよびその値を示し、更にGo4はG-l、G-m、G-nに共通するパラメータおよびその値を示す。要因推定部13は、最も多くのグループが重なっているGo4に対応するパラメータとその値を評価項目1の評価値がHighとなることに最も影響するパラメータとその値(例えば、パラメータ1=ON、パラメータ2=ON)として評価する。要因推定部13は、重なるグループの数に応じて、副次的な要因を示すパラメータおよびその値を設定してもよい。例えば、要因推定部13は、Go1、Go2、Go3に対応するパラメータおよびその値を副次的な要因として設定してもよい。また、他のグループと重ならないグループG-kについて、要因推定部13は、G-kのパラメータおよびその値を評価項目1の要因として設定しなくてもよいし、G-kに属する観測データが多い場合には、Go4に対応するパラメータおよびその値とは別に、G-kのパラメータおよびその値を評価項目1の要因として設定してもよい。要因推定部13は、評価項目1の評価値がLowとなる要因についても同様の方法によって推定する。例えば、G-p、G-qに共通するGo5に対応するパラメータおよびその値を評価項目1の評価値がLowとなる要因として推定する。
【0033】
なお、要因推定部13は、ステップS12の処理を行った場合は、対象となるグループ(図10の例ではグループg5とg6のそれぞれ)について、上記処理を行って要因となるパラメータとその値を特定し、特定したパラメータに更に未知のパラメータを追加したものを評価項目1の要因として推定する。具体的には、要因推定部13は、グループg5のパラメータに未知パラメータを加えたものを評価項目1の評価値をLowにする要因として推定し、グループg6のパラメータに未知パラメータを加えたものを評価項目1の評価値をHighにする要因として推定する。
【0034】
また、要因推定部13は、グループごとに評価項目に設定した事象が発生する確率を推定する(ステップS15)。例えば、評価項目1について、Highに分類されたグループG-k、G-l、G-m、G-nについて、G-lに属する観測データの数(母数)が100個、その観測データのうち閾値Th1以上の評価値が設定された観測データの数が70個であれば、要因推定部13は、G-lと同様の属性値を有する観測データの場合、評価項目1の評価値がHighとなる確率は70%であると推定する。要因推定部13は、G-k、G-m、G-nについても同様に評価項目1の評価値がHighとなる確率の推定値を算出する。また、要因推定部13は、G-p、G-q等について、評価項目1の評価値がLowとなる確率の推定値を算出する。要因推定部13は、対象とする評価項目について、Highとなる要因と、Lowとなる要因と、グループごとの評価値がHighとなる確率と評価値がLowとなる確率と、を記憶部17に記録する(ステップS16)。
【0035】
要因推定部13は、ステップS3で設定された全ての評価項目について、ステップS4~ステップS16の処理を行う。全ての評価項目について要因推定等が終了すると、出力部16は、評価項目ごとの推定結果を表示装置や電子ファイルなどに出力する(ステップS17)。図12に推定結果の出力例を示す。図12に示すように、評価項目ごとの要因、評価値がHighまたはLowとなるグループごとの確率が表示される。例えば、ステップS2で作成した全グループについて評価項目ごとに評価値がHighまたはLowとなる確率が出力されてもよい。
【0036】
例えば、事象が感染症の進展の場合、解析装置10は、定期検査などによって観測データが取得できるたびに図2の処理を実行して評価結果の見直しを行ってもよい。事象が量産品の製造における不良品の発生やプラントの故障の場合、不良品や故障が発生するたびに図2の処理を実行して評価結果の見直しを行ってもよい。
【0037】
上記したように本実施形態の要因推定処理によれば、観測対象が有する複数の属性に注目し、属性の組み合せごとに同じ属性値を持つ観測対象をグルーピングし、グループごとに評価値を算出する。そして、グループ別の評価値の度数分布から、評価値が示す特性を反映したグループを1つまたは複数選択し、選択したグループが持つ属性値から、評価値が示す事象(例えば、軽症から中等症へ悪化する(High)又は悪化しない(Low))の要因を推定する。これにより、評価値に影響を与えるパラメータおよびその値を適切に抽出することができる。
【0038】
また、評価値が示す事象を反映したグループが抽出できない場合、未知のパラメータの存在を仮定し、未知のパラメータを加えることによって評価値が示す事象を反映したグループとなるであろうグループを選択する。そして、選択したグループ内の観測データ各々の評価値に基づいて、未知のパラメータの影響、効果を推定する。これにより、評価値の要因となる属性値が不明瞭な場合でも、現在分かっている属性値の組み合せに未知パラメータを加えた形式で要因を推定することができる。
【0039】
また、グループごとに評価値が所定の値(High、Low)となる確率を算出することで、後にそのグループと同様の属性値を有する観測対象が現れた場合に、その観測対象に生じる事象を予測することができる。
【0040】
(予測処理)
次に図13を用いて予測部14による予測処理ついて説明する。予測処理は、属性の少なくとも一部が判明している観測対象について、評価項目で設定した事象が発生する確率を予測する処理である。
図13は、実施形態における予測処理の一例を示すフローチャートである。
前提として、予測対象の事象について、既に図2図12を用いて説明した要因推定処理が実行されており、記憶部17には、図5で例示したグループの構成情報、図6で例示した評価項目の設定情報、図12の出力例と同様の情報が記録されているとする。
まず、ユーザが予測対象の観測データを解析装置10に入力する。観測データの各パラメータには、観測対象の属性値が設定されている。パラメータが不明な場合には、ブランクとしてもよいし、ONを仮設定した観測データとOFFを仮設定した観測データを作成してもよい。データ取得部11は、観測データを取得し(ステップS21)、予測部14へ出力する。次に予測部14は、予測対象の観測データに適合するグループを選択する(ステップS22)。例えば、予測対象の観測データのパラメータ1~パラメータ7の全てがONの場合、予測部14は、この観測データに適合するグループとして、図5に記載した範囲ではG-1-1、G-2-1、G-3-1、G-7-1を選択する。次に予測部14は、選択したグループに基づいて予測を行う(ステップS23)。例えば、評価項目が2つ設定され、図2の要因推定処理の結果、評価項目1~2について、以下のような結果が得られているとする。
【0041】
G-1-1と同様の属性値を持つ場合に評価項目1の評価値がHighとなる確率が80%、G-1-1と同様の属性値を持つ場合に評価項目1の評価値がLowとなる確率が0%、G-2-1と同様の属性値を持つ場合に評価項目1の評価値がHighとなる確率が20%、G-2-1と同様の属性値を持つ場合に評価項目1の評価値がLowとなる確率が50%、G-3-1と同様の属性値を持つ場合に評価項目1の評価値がHighとなる確率が30%、G-3-1と同様の属性値を持つ場合に評価項目1の評価値がLowとなる確率が30%、G-7-1と同様の属性値を持つ場合に評価項目1の評価値がHighとなる確率が10%、G-7-1と同様の属性値を持つ場合に評価項目1の評価値がLowとなる確率が10%
【0042】
G-1-1と同様の属性値を持つ場合に評価項目2の評価値がHighとなる確率が70%、G-1-1と同様の属性値を持つ場合に評価項目2の評価値がLowとなる確率が10%、G-2-1と同様の属性値を持つ場合に評価項目2の評価値がHighとなる確率が20%、G-2-1と同様の属性値を持つ場合に評価項目2の評価値がLowとなる確率が60%、G-3-1と同様の属性値を持つ場合に評価項目2の評価値がHighとなる確率が20%、G-3-1と同様の属性値を持つ場合に評価項目2の評価値がLowとなる確率が30%、G-7-1と同様の属性値を持つ場合に評価項目2の評価値がHighとなる確率が10%、G-7-1と同様の属性値を持つ場合に評価項目2の評価値がLowとなる確率が20%
【0043】
予測部14は、予測対象の観測データに対して、上記と同様の予測を行う。次に出力部16が予測結果を表示装置や電子ファイルへ出力する(ステップS24)。例えば、出力部16は、上記の16個の予測結果全てを出力してもよいし、最も多くの属性値が合致するグループG-7-1についての予測結果のみ(4個、又はHighのみ、Lowのみの2個など)を出力してもよい。例えば、感染症の場合、評価項目1に軽症から中等症へ悪化する確率を設定し、評価項目2に軽症から中等症へ悪化するまでの日数を設定し、評価項目3に中等症から重症へ悪化する確率を設定し、評価項目4に中等症から重症へ悪化するまでの日数を設定し、評価項目5に軽症から回復する確率を設定しておけば、現在軽症の予測対象者に対して、今後、中等症へと悪化する(評価項目1)、その場合の日数(評価項目2)、中等症から重症へさらに悪化する(評価項目3)、その場合の日数(評価項目4)、現在の軽症から悪化すること無く回復する(評価項目5)という5つの異なるシナリオについて、確率的に将来を予測することができる。この予測に基づいて、この感染者への治療方針の計画を立てたり、病床や医療機器、薬品の準備や調達計画を立てたりすることができる。プラントの故障の場合、故障Aが発生する確率、故障Bが発生する確率、プラントの停止に至る確率といったシナリオで将来を予測することができるので、プラントの運転員は、各事象のリスクに応じた運転を行うことができる。
【0044】
以上説明したように本実施形態の予測処理によれば、観測対象の属性に基づいて、複数のシナリオについて確率的な予測を行うことができる。
【0045】
(属性値推定処理)
次に図14を用いて属性値推定部15による属性値推定処理ついて説明する。属性値推定処理は、事象や挙動が近しいグループに基づいて観測対象の属性値を推定する処理である。
図14は、実施形態における属性値推定処理の一例を示すフローチャートである。
前提として、既に図2図12を用いて説明した要因推定処理が実行されており、記憶部17には、図5で例示したグループの構成情報、図6で例示した評価項目の設定情報、図12の出力例と同様の情報が記録されているとする。
まず、ユーザが観測対象に生じた事象を解析装置10に入力する。データ取得部11は、観測対象に生じた事象の情報を取得する(ステップS31)。例えば、事象が感染症の場合、感染者が中等症であれば、現在の症状(中等症)、軽症から中等症に移行するまでの日数(例えば、8日)などを入力する。データ取得部11は、事象の情報を属性値推定部15へ出力する。次に属性値推定部15は、事象に適合するグループを特定する(ステップS32)。例えば、図2の要因推定処理の結果、グループG-7-1について中等症に悪化する確率が80%、軽症から中等症までの移行期間が10日間と評価され、グループG-7-2について中等症に悪化する確率が70%、軽症から中等症までの移行期間が6日間と評価され、他のグループは、中等症に悪化する確率がこれら2つのグループよりもかなり小さい場合、属性値推定部15は、グループG-7-1とグループG-7-2を、観測対象の事象に合致するグループとして特定する。例えば、観測対象の軽症から中等症への移行期間が10日間だった場合、属性値推定部15は、グループG-7-1のみを適合するグループとして特定してもよい。次に属性値推定部15は、特定したグループに基づいて、観測対象の属性値を推定する(ステップS33)。例えば、グループG-7-1が、パラメータ1~7の値が全てONで構成されている場合、属性値推定部15は、観測対象のパラメータ1~7の値は全てONであると推定する。出力部16は、推定結果を表示装置や電子ファイル等へ出力する(ステップS34)。
【0046】
上記説明したように本実施形態の属性値推定方法によれば、属性値が判明しない観測対象についての属性値を推定することができる。例えば、観測対象がプラントで、プラントに“故障1”が発生し、さらに、あるセンサの計測値が、センサの故障や通信線の切断等により監視装置側で取得できなくなっているとする。また、このセンサの値が、故障からの復旧方針を定めるうえで重要であるとする。このような場合に属性値推定部15によって、センサの計測値が推定できれば、復旧作業に役立てることができる。また、感染症の場合、例えば、基礎疾患の有無、血栓症、高脂血症などの症状について患者が把握していなかったり、誤って認識していたりする可能性がある。そのような場合に属性値推定部15によって、基礎疾患の有無、血栓症、高脂血症などの属性値を推定することができれば、投薬の種類や治療方針の参考にすることができる。また、例えば、量産品の不良の場合、属性値の推定により、工作機械の故障が推定されるような場合、工作機械の点検を行う等の対策を行うことによって、不良品の発生率を改善することができる。
【0047】
図15は、実施形態の解析装置のハードウェア構成の一例を示す図である。
コンピュータ900は、CPU901、主記憶装置902、補助記憶装置903、入出力インタフェース904、通信インタフェース905を備える。
上述の解析装置10は、コンピュータ900に実装される。そして、上述した各機能(解析装置10、データ取得部11、設定受付部12、要因推定部13、予測部14、属性値推定部15、出力部16)は、プログラムの形式で補助記憶装置903に記憶されている。CPU901は、プログラムを補助記憶装置903から読み出して主記憶装置902に展開し、当該プログラムに従って上記処理を実行する。また、CPU901は、プログラムに従って、記憶領域を主記憶装置902に確保する。また、CPU901は、プログラムに従って、処理中のデータを記憶する記憶領域を補助記憶装置903に確保する。
【0048】
解析装置10の全部または一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各機能部による処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、CD、DVD、USB等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また、このプログラムが通信回線によってコンピュータ900に配信される場合、配信を受けたコンピュータ900が当該プログラムを主記憶装置902に展開し、上記処理を実行しても良い。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。また、解析装置10は、複数のコンピュータ900によって構成されていても良い。記憶部17は、コンピュータ900とは別体の外部記憶装置に記憶されていても良い。
【0049】
その他、本開示の趣旨を逸脱しない範囲で、上記した実施の形態における構成要素を周知の構成要素に置き換えることは適宜可能である。また、この開示の技術範囲は上記の実施形態に限られるものではなく、本開示の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。
【0050】
<付記>
各実施形態に記載の要因推定方法、予測方法、属性値推定方法、要因推定装置(解析装置10)、予測装置(解析装置10)、属性値推定装置(解析装置10)およびプログラムは、例えば以下のように把握される。
【0051】
(1)第1の態様に係る要因推定方法は、観測対象について複数のパラメータを設定し、各パラメータに前記観測対象の属性を示す属性値又は前記属性が不明な場合には仮の値を設定した前記観測対象の観測データを取得するステップと(ステップS1)、前記パラメータの組み合わせに基づいて、前記観測データをグルーピングするステップと(ステップS2)、前記観測対象に関係する事象の発生状況を評価するための評価項目を設定し(ステップS3)、前記観測データに対して前記評価項目についての評価値を設定するステップと(ステップS4)、前記グルーピングによって生成されたグループごとにそのグループに属する前記観測データの前記評価値の代表値を算出し(ステップS5)、前記グループに属する前記観測データの数を前記代表値の度数として対応付けたグループ統計値(図8の分布図70のg1~g3等)を算出するステップと(ステップS6)、任意の前記グループ統計値に対応する前記グループに共通する前記パラメータの値を、前記事象の要因となるパラメータおよびその値として決定するステップと(ステップS14)、を有する。
これにより、事象発生の要因となる属性値の組み合せを適切に抽出することができ、抽出した属性値の組み合せを事象発生の要因として推定することができる。
実施形態では評価値の代表値として、平均値を算出する例を挙げたが、中央値や最頻値を代表値として算出してもよい。また、例えば、複数個を1セットとして扱いを受ける評価値について、分散を代表値として用いてもよい。また、平均値と分散の2つを代表値として用いてもよい。
【0052】
(2)第2の態様に係る要因推定方法は、(1)の要因推定方法であって、前記グループ統計値のうち、前記評価値の代表値が所定の閾値条件を満たし、かつ、前記度数が所定値以上のものを抽出するステップ(ステップS10)、をさらに有し、前記決定するステップでは、前記抽出するステップにて抽出した前記グループ統計値について、前記事象の要因となるパラメータおよびその値を決定する。
閾値条件を満たすグループ統計値を抽出することにより、把握したい事象とその要因との関係性が強いサンプルを抽出することができ、このサンプルから要因を推定することにより、予測精度を高めることができる。前記度数が所定値以上のものを抽出することにより、予測の信頼性を確保することができる。
【0053】
(3)第3の態様に係る要因推定方法は、(1)~(2)の要因推定方法であって、前記閾値条件を満たす前記評価値と満たさない前記評価値とを含む前記グループを、第2グループとして抽出し、抽出した前記第2グループについて、新たなパラメータが前記事象の発生状況に関与すると仮定し、仮定したパラメータを、前記第2グループの前記パラメータに追加するとともに、前記仮定したパラメータは、前記第2グループの前記パラメータおよびその値を有する観測対象に対して、前記第2グループの中で前記閾値条件を満足する前記評価値が占める割合に応じた確率で、前記事象を発生させる性質を持った要因であると推定する。
現在判明しているパラメータだけでは、要因推定が難しい場合でも、未知のパラメータを仮定することで、未知のパラメータを含んだ形式で事象の要因を推定し、推定した要因に基づく事象の発生確率を推定することができる。
【0054】
(4)第4の態様に係る要因推定方法は、(1)~(3)の要因推定方法であって、前記グループごとの前記事象の発生確率を推定するステップ(ステップS15)、をさらに有する。
事象の発生の主な要因を推定するだけでなく、グループ(パラメータの組み合せ)ごとの事象の発生確率を把握することができる。
【0055】
(5)第5の態様に係る予測方法は、(1)~(3)の何れか1つに記載の要因推定方法で決定した前記パラメータおよびその値と前記事象との関係と、第2の前記観測データが有する前記属性値と、に基づいて、第2の前記観測データに対応する前記観測対象に生じる前記事象を予測する。
これにより、観測対象の属性値が把握できれば、その観測対象に生じる事象を予測することができる。
【0056】
(6)第6の態様に係る予測方法は、(5)の予測方法であって、(3)に記載の要因推定方法で前記パラメータおよびその値を決定した場合、当該パラメータおよびその値を持つ前記観測対象には、前記第2グループの中で前記閾値条件を満足する前記評価値が占める割合に応じた確率で、前記事象が発生すると予測する。
これにより、未知のパラメータを仮定して要因推定を行った場合でも、観測対象の判明しているパラメータについての属性値が把握できれば、その観測対象に生じる事象を予測することができる。
【0057】
(7)第7の態様に係る予測方法は、(5)~(6)の予測方法であって、前記評価項目ごとに前記評価値が所定の条件を満たす確率を予測する。
評価項目ごとに、評価項目に設定した事象が発生する確率を予測することができる。これにより、観測対象について、複数シナリオに沿った予測が可能になる。
【0058】
(8)第8の態様に係る属性値推定方法は、前記事象が発生した観測対象に係る第3の前記観測データにおける前記パラメータの値を、(1)~(4)の何れかに記載の要因推定方法で決定した前記パラメータおよびその値と前記事象との関係に基づいて推定する。
これにより、属性値が不明な観測対象に、要因推定を行った事象が発生した場合に、その観測対象の属性値を推定することができる。
【0059】
(9)第9の態様に係る要因推定装置(解析装置10)は、観測対象について複数のパラメータを設定し、各パラメータに前記観測対象の属性を示す属性値又は前記属性が不明な場合には仮の値を設定した前記観測対象の観測データを取得するデータ取得部11と、前記パラメータの組み合わせに基づいて、前記観測データをグルーピングし、事象の発生状況を評価するための評価項目を設定し、前記観測データに対して前記評価項目の評価値を設定し、前記グルーピングによって生成されたグループごとにそのグループに属する前記観測データの前記評価値の代表値を算出し、前記グループに属する前記観測データの数を前記代表値の度数として対応付けたグループ統計値を算出し、任意の前記グループ統計値に対応する前記グループに共通する前記パラメータの値を、前記事象の発生状況に関係する要因となるパラメータおよびその値として決定する要因推定部13と、を有する。
【0060】
(10)第10の態様に係る予測装置は、(9)に記載の要因推定装置と、前記要因推定部が決定した前記パラメータおよびその値と前記事象との関係と、前記データ取得部が取得した第2の前記観測データに対応する観察対象が有する前記属性値と、に基づいて、第2の前記観測データに対応する観測対象に生じる前記事象を予測する予測部と、を備える。
【0061】
(11)第11の態様に係る属性値推定装置は、(9)に記載の要因推定装置と、前記データ取得部が取得した、前記事象が発生した観測対象に係る第3の前記観測データにおける前記パラメータの値を、前記要因推定部が決定した前記パラメータおよびその値と前記事象との関係に基づいて推定する。
【0062】
(12)第12の態様に係るプログラムは、コンピュータに、観測対象について複数のパラメータを設定し、各パラメータに前記観測対象の属性を示す属性値又は前記属性が不明な場合には仮の値を設定した前記観測対象の観測データを取得するステップと、前記パラメータの組み合わせに基づいて、前記観測データをグルーピングするステップと、事象の発生状況を評価するための評価項目を設定し、前記観測データに対して前記評価項目の評価値を設定するステップと、前記グルーピングによって生成されたグループごとにそのグループに属する前記観測データの前記評価値の代表値を算出し、前記グループに属する前記観測データの数を前記代表値の度数として対応付けたグループ統計値を算出するステップと、任意の前記グループ統計値に対応する前記グループに共通する前記パラメータの値を、前記事象の発生状況に関係する要因となるパラメータおよびその値として決定するステップと、を実行させる。
【0063】
(13)第13の態様に係るプログラムは、(12)のプログラムであって、前記決定するステップにて決定した前記パラメータおよびその値と前記事象との関係と、第2の前記観測データに対応する観察対象が有する前記属性値と、に基づいて、第2の前記観測データに対応する前記観測対象に生じる前記事象を予測するステップ、を更に実行させる。
【0064】
(14)第14の態様に係るプログラムは、(12)のプログラムであって、前記事象が発生した観測対象に係る第3の前記観測データにおける前記パラメータの値を、前記決定するステップにて決定した前記パラメータおよびその値と前記事象との関係に基づいて推定するステップ、を更に実行させる。
【符号の説明】
【0065】
10・・・解析装置
11・・・データ取得部
12・・・設定受付部
13・・・要因推定部
14・・・予測部
15・・・属性値推定部
16・・・出力部
17・・・記憶部
900・・・コンピュータ
901・・・CPU
902・・・主記憶装置
903・・・補助記憶装置
904・・・入出力インタフェース
905・・・通信インタフェース
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15