IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ NECソリューションイノベータ株式会社の特許一覧

特開2024-171826因果分析支援装置、因果分析支援方法、プログラム及び記録媒体
<>
  • 特開-因果分析支援装置、因果分析支援方法、プログラム及び記録媒体 図1
  • 特開-因果分析支援装置、因果分析支援方法、プログラム及び記録媒体 図2
  • 特開-因果分析支援装置、因果分析支援方法、プログラム及び記録媒体 図3
  • 特開-因果分析支援装置、因果分析支援方法、プログラム及び記録媒体 図4
  • 特開-因果分析支援装置、因果分析支援方法、プログラム及び記録媒体 図5
  • 特開-因果分析支援装置、因果分析支援方法、プログラム及び記録媒体 図6
  • 特開-因果分析支援装置、因果分析支援方法、プログラム及び記録媒体 図7
  • 特開-因果分析支援装置、因果分析支援方法、プログラム及び記録媒体 図8
  • 特開-因果分析支援装置、因果分析支援方法、プログラム及び記録媒体 図9
  • 特開-因果分析支援装置、因果分析支援方法、プログラム及び記録媒体 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024171826
(43)【公開日】2024-12-12
(54)【発明の名称】因果分析支援装置、因果分析支援方法、プログラム及び記録媒体
(51)【国際特許分類】
   G06N 5/04 20230101AFI20241205BHJP
   G06Q 10/04 20230101ALI20241205BHJP
   G06N 20/00 20190101ALI20241205BHJP
【FI】
G06N5/04
G06Q10/04
G06N20/00
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023089069
(22)【出願日】2023-05-30
(71)【出願人】
【識別番号】000232092
【氏名又は名称】NECソリューションイノベータ株式会社
(74)【代理人】
【識別番号】100115255
【弁理士】
【氏名又は名称】辻丸 光一郎
(74)【代理人】
【識別番号】100201732
【弁理士】
【氏名又は名称】松縄 正登
(74)【代理人】
【識別番号】100154081
【弁理士】
【氏名又は名称】伊佐治 創
(74)【代理人】
【識別番号】100227019
【弁理士】
【氏名又は名称】安 修央
(72)【発明者】
【氏名】日室 聡仁
(72)【発明者】
【氏名】山本 純一
(72)【発明者】
【氏名】浅沼 爽汰
(72)【発明者】
【氏名】渡部 佳織
(72)【発明者】
【氏名】菅原 収吾
【テーマコード(参考)】
5L010
5L049
【Fターム(参考)】
5L010AA04
5L049AA04
(57)【要約】
【課題】 適合度の低下を抑制し、且つ、因果モデルの可読性を向上可能な因果分析支援装置を提供する。
【解決手段】 本開示の因果分析支援装置は、因果モデル取得部、重要度算出部、再構築部、および結果出力部を含み、
前記因果モデル取得部は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出部は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築部は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力部は、少なくとも一つの前記再構築モデルを出力する。
【選択図】 図1

【特許請求の範囲】
【請求項1】
因果モデル取得部、重要度算出部、再構築部、および結果出力部を含み、
前記因果モデル取得部は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出部は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築部は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力部は、少なくとも一つの前記再構築モデルを出力する、因果分析支援装置。
【請求項2】
前記重要度算出部は、前記変数の因果係数に基づいて前記重要度を算出する、請求項1記載の因果分析支援装置。
【請求項3】
前記重要度算出部は、前記因果係数の絶対値に基づいて前記重要度を算出する、請求項2記載の因果分析支援装置。
【請求項4】
前記重要度算出部は、前記重要度として、前記変数の中心性指数を算出する、請求項1から3のいずれか一項に記載の因果分析支援装置。
【請求項5】
前記再構築部は、
前記重要度に基づいて、前記因果モデルが含む前記変数から、少なくとも一つの変数を削除した候補変数を生成し、
前記候補変数に基づいて、少なくとも一つの再構築モデルを生成する、請求項1から3のいずれか一項に記載の因果分析支援装置。
【請求項6】
評価値算出部を含み、
前記評価値算出部は、前記因果モデルおよび前記再構築モデルの少なくとも一つの評価値を算出する、請求項1から3のいずれか一項に記載の因果分析支援装置。
【請求項7】
前記結果出力部は、前記評価値に基づいて少なくとも一つの前記再構築モデルおよび前記因果モデルを選択し、選択した前記再構築モデルおよび前記因果モデルを出力する、請求項6記載の因果分析支援装置。
【請求項8】
因果モデル取得工程、重要度算出工程、再構築工程、および結果出力工程を含み、
前記因果モデル取得工程は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出工程は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築工程は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力工程は、少なくとも一つの前記再構築モデルを出力する、因果分析支援方法。
【請求項9】
因果モデル取得手順、重要度算出手順、再構築手順、および結果出力手順を含み、
前記因果モデル取得手順は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出手順は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築手順は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力手順は、少なくとも一つの前記再構築モデルを出力し、
前記各手順をコンピュータに実行させるためのプログラム。
【請求項10】
因果モデル取得手順、重要度算出手順、再構築手順、および結果出力手順を含み、
前記因果モデル取得手順は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出手順は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築手順は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力手順は、少なくとも一つの前記再構築モデルを出力し、
前記各手順をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。

【発明の詳細な説明】
【技術分野】
【0001】
本開示は、因果分析支援装置、因果分析支援方法、プログラム及び記録媒体に関する。
【背景技術】
【0002】
近年、様々な事象の原因推定を行うため、複数の変数からなる事象の因果推定が試みられている。例えば、特許文献1には、生産ラインの実態を正確に反映した各機構間の因果関係の情報を得るための技術が記載されている(特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020-149303号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1のようなシステムを用いて多数の変数を用いた分析を行う場合、変数間の因果数が膨大になり、分析結果の解釈が困難になる。この際、例えば、因果係数に閾値を設けて因果数を抑制すると、分析モデルの適合度(CFI:Comparative Fit Index)が低下するという課題がある。
【0005】
そこで本開示は、適合度の低下を抑制し、且つ、因果モデルの可読性を向上可能な因果分析支援装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
前記目的を達成するために、本開示の因果分析支援装置は、
因果モデル取得部、重要度算出部、再構築部、および結果出力部を含み、
前記因果モデル取得部は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出部は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築部は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力部は、少なくとも一つの前記再構築モデルを出力する。
【0007】
本開示の因果分析支援方法は、
因果モデル取得工程、重要度算出工程、再構築工程、および結果出力工程を含み、
前記因果モデル取得工程は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出工程は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築工程は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力工程は、少なくとも一つの前記再構築モデルを出力する。
【0008】
本開示のプログラムは、
因果モデル取得手順、重要度算出手順、再構築手順、および結果出力手順を含み、
前記因果モデル取得手順は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出手順は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築手順は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力手順は、少なくとも一つの前記再構築モデルを出力し、
前記各手順をコンピュータに実行させるためのプログラムである。
【0009】
本開示の記録媒体は、
因果モデル取得手順、重要度算出手順、再構築手順、および結果出力手順を含み、
前記因果モデル取得手順は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出手順は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築手順は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力手順は、少なくとも一つの前記再構築モデルを出力し、
前記各手順をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0010】
本開示によれば、因果モデルの適合度の低下を抑制し、且つ、因果モデルの可読性を向上できる。
【図面の簡単な説明】
【0011】
図1図1は、本開示の因果分析支援装置の一例の構成を示すブロック図である。
図2図2は、本開示の因果分析支援装置のハードウェア構成の一例を示すブロック図である。
図3図3は、本開示の因果分析支援装置における処理の一例を示すフローチャートである。
図4図4は、因果モデルの例を示す模式図である。
図5図5は、本開示の因果分析支援装置の再構築部による処理の一例を示すフローチャートである。
図6図6は、実施例1における評価用因果モデルとその適合度を示す図である。
図7図7は、実施例1における再構築モデルとその適合度を示す図である。
図8図8は、実施例1における参考例の因果モデルとその適合度を示す図である。
図9図9は、本開示の因果分析支援装置の一例の構成を示すブロック図である。
図10図10は、本開示の因果分析支援装置における処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0012】
次に、本開示の実施形態について図を用いて説明する。本開示は、以下の実施形態には限定されない。以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用でき、各実施形態の構成は、特に言及がない限り、組合せ可能である。
【0013】
[実施形態1]
本実施形態の因果分析支援装置について、図1を用いて説明する。図1は、本実施形態の因果分析支援装置10の一例の構成を示すブロック図である。図1に示すように、因果分析支援装置10(以下、「本装置10」ともいう)は、因果モデル取得部11、重要度算出部12、再構築部13、および結果出力部14を含む。また、図示していないが、本装置10は、例えば、記憶部を含んでもよい。
【0014】
本装置10は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、通信回線網を介して接続可能な装置でもよい。また、本装置10は、通信回線網を介して、後述する外部装置と接続可能である。通信回線網は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。通信回線網は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、SAN(Storage Area Network)、DTN(Delay Tolerant Networking)、LPWA(Low Power Wide Area)、L5G(ローカル5G)、等があげられる。無線通信としては、例えば、Wi-Fi(登録商標)、Bluetooth(登録商標)、ローカル5G、LPWA等が挙げられる。前記無線通信としては、各装置が直接通信する形態(Ad Hoc通信)、インフラストラクチャ(infrastructure通信)、アクセスポイントを介した間接通信等であってもよい。本装置10は、例えば、システムとしてサーバに組み込まれていてもよい。また、本装置10は、例えば、本開示のプログラムがインストールされたパーソナルコンピュータ(PC、例えば、デスクトップ型、ノート型)、スマートフォン、タブレット端末等であってもよい。さらに、本装置10は、例えば、前記各部のうち少なくとも一つがサーバ上にあり、その他の前記各部が端末上にあるような、クラウドコンピューティングやエッジコンピューティング等の形態であってもよい。
【0015】
図2に、本装置10のハードウェア構成のブロック図を例示する。本装置10は、例えば、中央処理装置(CPU、GPU等)101、メモリ102、バス103、記憶装置104、入力装置105、出力装置106、通信デバイス107等を含む。本装置10の各部は、それぞれのインタフェース(I/F)により、バス103を介して相互に接続されている。
【0016】
中央処理装置101は、コントローラ(システムコントローラ、I/Oコントローラ等)等により、他の構成と連携動作し、本装置10の全体の制御を担う。本装置10において、中央処理装置101により、例えば、本開示のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、中央処理装置101が、因果モデル取得部11、重要度算出部12、再構築部13、および結果出力部14として機能する。本装置10は、演算装置として、CPU、GPU(Graphics Processing Unit)、APU(Accelerated Processing Unit)等の他の演算装置を備えてもよいし、これらの組合せを備えてもよい。
【0017】
バス103は、例えば、外部装置とも接続できる。前記外部装置は、例えば、後述する因果モデルを生成可能な装置、外部記憶装置(外部データベース等)、プリンタ、外部入力装置、外部表示装置、スピーカ等の音声出力装置、カメラ等の外部撮像装置、並びに、加速度センサ、地磁気センサ、及び方向センサ等の各種センサ等があげられる。本装置10は、例えば、バス103に接続された通信デバイス107により、外部ネットワーク(前記通信回線網)に接続でき、外部ネットワークを介して、ユーザの端末等の他の装置と接続することもできる。
【0018】
メモリ102は、例えば、メインメモリ(主記憶装置)が挙げられる。中央処理装置101が処理を行う際には、例えば、後述する記憶装置104に記憶されている本開示のプログラム等の種々の動作プログラムを、メモリ102が読み込み、中央処理装置101は、メモリ102からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。また、メモリ102は、例えば、ROM(読み出し専用メモリ)であってもよい。
【0019】
記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本開示のプログラムを含む動作プログラムが格納されている。記憶装置104は、例えば、記録媒体と、記録媒体に読み書きするドライブとの組合せであってもよい。前記記録媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられる。記憶装置104は、例えば、記録媒体とドライブとが一体化されたハードディスクドライブ(HDD)、及びソリッドステートドライブ(SSD)であってもよい。本装置10が前記記憶部を含む場合、例えば、記憶装置104は、前記記憶部として機能する。
【0020】
本装置10において、メモリ102及び記憶装置104は、ログ情報、外部データベース(図示せず)や外部の装置から取得した情報、本装置10によって生成した情報、本装置10が処理を実行する際に用いる情報等の種々の情報を記憶することも可能である。この場合、メモリ102及び記憶装置104は、例えば、前述の本装置のユーザの情報等を記憶していてもよい。なお、少なくとも一部の情報は、例えば、メモリ102及び記憶装置104以外の外部サーバに記憶されていてもよいし、複数の端末にブロックチェーン技術等を用いて分散して記憶されていてもよい。
【0021】
本装置10は、例えば、さらに、入力装置105、出力装置106を備える。入力装置105は、例えば、タッチパネル、トラックパッド、マウス等のポインティングデバイス;キーボード;カメラ、スキャナ等の撮像手段;ICカードリーダ、磁気カードリーダ等のカードリーダ;マイク等の音声入力手段;等があげられる。出力装置106は、例えば、LEDディスプレイ、液晶ディスプレイ等の表示装置;スピーカ等の音声出力装置;プリンタ;等があげられる。本実施形態において、入力装置105と出力装置106とは、別個に構成されているが、入力装置105と出力装置106とは、タッチパネルディスプレイのように、一体として構成されてもよい。
【0022】
つぎに、本実施形態の因果分析支援方法の一例を、図3のフローチャートに基づき説明する。本実施形態の因果分析支援方法は、例えば、図1または図2に示す因果分析支援装置10を用いて、次のように実施できる。なお、本実施形態の因果分析支援方法は、図1または図2の因果分析支援装置10の使用には限定されない。図3は、因果分析支援装置10による処理の一例を示すフローチャートである。
【0023】
まず、因果モデル取得部11により、少なくとも一つの変数の因果関係を含む因果モデルを取得する(S1、因果モデル取得工程)。前記因果モデルは、例えば、公知の因果探索手法により、少なくとも一つの変数(因子ともいう)における因果関係の有無やその方向を探索した結果を示すモデルである。前記因果モデルは、変数間の因果関係を示す矢印と(因果)と、前記因果の影響力を示す因果係数を含む。前記因果探索方法は、特に制限されず、例えば、LiNGAM(Liner Non-Gaussian Acyclic Model)、SAM(Structural Agnostic Modelling)、ベイジアンネットワーク、LiNG(Liner Non-Gaussian SEM)等があげられる。前記因果モデルは、例えば、図4に示すように、少なくとも一つの変数(例えば、変数A、B、C、及びD)について、因果関係を矢印で示した有向グラフで表すことができる。図4に示す因果モデルでは、例えば、変数Bは、変数C及びDに対して因果関係があり、変数Aは、変数Dに対して因果関係があることを示す。また、図4に示す因果モデルにおいて、各変数間の因果係数は、因果関係を示す矢印付近の数字として示すことができる。具体的に、図4に示す因果モデルにおいて、変数Aから変数Dへの因果係数は、-0.2であり、変数Bから変数Cへの因果係数は、0.6であり、変数Bから変数Dへの因果係数は、-2.6であり、変数Cから変数Dへの因果係数は、-2.3である。因果モデル取得部11は、例えば、前記因果モデルを1つ取得してもよいし、2以上の複数取得してもよい。因果モデル取得部11は、例えば、因果探索が可能な外部装置が分析した因果モデルを取得してもよいし、前記因果モデルを記録した外部のデータベース又はサーバから前記因果モデルを取得してもよい。なお、因果モデル取得部11は、例えば、本装置10が生成した因果モデルを取得してもよい。この場合、本装置10は、例えば、少なくとも一つの変数を含むデータを取得し、取得したデータを前記因果探索手法により分析し、入力されたデータが含む前記変数の因果関係を推定し、前記因果モデルを生成できる。なお、この際、例えば、入力されたデータが含む変数が1つである場合、本装置10は、処理を終了してもよい。この際、例えば、後述する結果出力部14により、変数が一つである旨の結果をあわせて出力してもよい。
【0024】
前記因果モデルは、例えば、ターゲット変数が指定されたモデルでもよいし、ターゲット変数が指定されていないモデルでもよい。前記ターゲット変数は、例えば、因果の始点または終点となる変数を意味する。前記ターゲット変数が前記因果の始点となる変数である場合、例えば、前記因果探索手法において、前記ターゲット変数から他の変数へ因果が発生するようにパラメータを設定することにより、ターゲット変数が始点となる因果モデルを生成できる。また、前記ターゲット変数が因果の終点となる変数である場合、例えば、前記因果探索手法において、他の変数から前記ターゲット変数に因果が収束するようにパラメータを設定することにより、ターゲット変数が終点となる因果モデルを生成できる。
【0025】
つぎに、重要度算出部12により、前記因果モデルが含む前記変数の重要度を算出する(S2、重要度算出工程)。前記重要度は、例えば、前記因果モデルが含む変数が、他の変数に与える影響を示す指標である。重要度算出部12は、例えば、前記変数の因果係数に基づいて前記重要度を算出できる。前記因果係数は、例えば、正の値であるとは限らず、負の値を含む場合がある。因果係数が負の値である場合、当該変数は、他の変数への負の影響が大きい変数であることが推定される。このため、重要度算出部12は、例えば、前記因果係数を絶対値に置換し、前記因果係数の絶対値に基づいて前記重要度を算出することが好ましい。重要度算出部12は、前記重要度として、前記変数の中心性指数を算出できる。具体的に、重要度算出部12は、例えば、前記因果モデルが含む各変数をノード、前記因果係数(またはその絶対値)をエッジとしてネットワーク中心性分析を行い、各変数の中心性指数を前記重要度として算出できる。前記ネットワーク中心性分析の手段は、特に制限されず、例えば、PageRankアルゴリズム、近接中心性、次数中心性、固有ベクトル中心性、ボナチッチのパワー中心性、媒介中心性、情報中心性等が利用できる。
【0026】
前記重要度算出工程の具体例について、図5を用いて説明する。以下の説明においては、図5(A)に示すように、図4に示す因果モデルにおいて、変数Aから変数Dへの因果係数が-0.2であり、変数Bから変数Cへの因果係数が0.6であり、変数Bから変数Dへの因果係数が-2.6であり、変数Cから変数Dへの因果係数が-2.3である場合を例に挙げて説明する。重要度算出部12は、例えば、図5(B)に示すように、各因果係数を絶対値に置換する。そして、重要度算出部12は、例えば、ネットワーク中心性分析を行い、各変数の中心性指数を重要度として算出する。図5(C)は、変数A~Dの重要度を示す表である。図5(C)に示すように、図4に示す因果モデルにおける変数Aの重要度は、0.83であり、変数Bの重要度は、3.45であり、変数Cの重要度は、2.89であり、変数Dの重要度は、7.75である。このため、図4に示す因果モデルにおいては、変数D、変数B、変数C、変数Aの順で他の変数への影響が大きいことがわかる。
【0027】
つぎに、再構築部13は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成する(S3、再構築工程)。具体的に、再構築部13は、前記重要度に基づいて、前記因果モデルが含む前記変数から、少なくとも一つの変数を削除した候補変数を生成する。再構築部13は、例えば、重要度が最も低い変数を削除して前記候補変数を生成してもよいし、前記重要度が閾値未満の変数を削除してもよい。前記閾値は、特に制限されず、分析の目的等に応じて適宜設定できる。再構築部13は、例えば、前記候補変数に基づいて、少なくとも一つの再構築モデルを生成する。再構築部13は、例えば、前記候補変数について、公知の因果探索手法により候補変数間の因果関係を分析して、前記再構築モデルを生成できる。前記因果探索方法は、特に制限されず、例えば、LiNGAM(Liner Non-Gaussian Acyclic Model)、SAM(Structural Agnostic Modelling)、ベイジアンネットワーク、LiNG(Liner Non-Gaussian SEM)等があげられる。また、再構築部13は、例えば、生成した再構築モデルの適合度を合わせて算出してもよい。前記適合度は、例えば、CFI(Comparative Fit Index)、RMSEA(Root Mean Square Error of Approximation)、GFI(Goodness of Fit Index)、AGFI(Adjusted Goodness of Fit Index)、AIC(Akaike's Information Criterion)、CAIC(Consistent Akaike's Information Criterion)、BIC(Bayesian Information Criterion)等があげられる。本装置10は、例えば、生成した前記再構築モデルを前記記憶部に保存してもよい。この際、前記適合度を前記再構築モデルに紐づけて保存することが好ましい。
【0028】
再構築部13は、例えば、ターゲット変数を終点とする少なくとも一つの再構築モデルを生成してもよいし、ターゲット変数を始点とする少なくとも一つの再構築モデルを生成してもよいし、ターゲット変数を指定しない少なくとも一つの再構築モデルを生成してもよい。前記ターゲット変数は、例えば、因果の始点または終点となる変数を意味する。前記ターゲット変数が前記因果の始点となる変数である場合、再構築部13は、例えば、前記因果探索手法において、前記ターゲット変数から他の変数へ因果が発生するようにパラメータを設定することにより、ターゲット変数が始点となる再構築モデルを生成できる。また、前記ターゲット変数が因果の終点となる変数である場合、再構築部13は、例えば、前記因果探索手法において、他の変数から前記ターゲット変数に因果が収束するようにパラメータを設定することにより、ターゲット変数が終点となる再構築モデルを生成できる。再構築部13は、例えば、前記ターゲット変数を指定しない再構築モデルを生成する場合、例えば、前記S1で取得した因果モデルが含む変数について、前記少なくとも一つの変数における中心となる因果モデルを生成できる。
【0029】
また、本装置10は、例えば、前記候補変数が所定数以下になるまでの間、S1で取得した因果モデルに代えて、前記再構築モデルを用いて、因果モデル取得部11、重要度算出部12、および再構築部13による処理を繰り返してもよい。前記所定数は、特に制限されず、例えば、任意の数が設定できる。前記所定の数は、例えば、1でもよいし、2以上の複数でもよいが、1が好ましい。また、前記所定の数は、例えば、前記S1で取得した因果モデルが含む変数数に対する割合であってもよい。前記割合は、特に制限されず、例えば、50%、25%、15%、10%等があげられる。
【0030】
そして、結果出力部14は、少なくとも一つの前記再構築モデルを出力する(S4、結果出力工程)。結果出力部14は、例えば、前記再構築モデルを本装置10の出力装置106(例えば、ディスプレイ)に出力してもよいし、外部装置に出力してもよい。前記外部装置は、特に制限されず、例えば、プリンタ、端末装置(例えば、ユーザのスマートフォン、PC、タブレット端末等)があげられる。
【0031】
本実施形態の因果分析支援装置によれば、因果モデル取得部により取得した因果モデルについて、重要度算出部により、前記因果モデルが含む変数の重要度を算出できる。そして、再構築部により、前記重要度に基づいて前記因果モデルを再構築した再構築モデルを少なくとも一つ生成し、結果出力部により、少なくとも一つの再構築モデルを出力できる。このため、本実施形態の因果分析支援装置によれば、因果モデルが含む変数の重要度を考慮した再構築モデルを生成できるため、適合度の低下を抑制し、且つ、因果モデルの可読性を向上できる。このため、本実施形態の因果分析支援装置は、例えば、心因果関係の分析を利用する分野において利用でき、特に、IT分野、経済分野、ライフサイエンス分野、環境分野、社会学分野等の、多数の変数間の因果関係の推定に特に好適に利用できる。
【0032】
[実施例1]
本開示の因果分析支援装置が、因果数の多い多変数データにおける因果分析に適していることを確認した。なお、本開示は以下の実施例にはなんら限定されない。
【0033】
まず、22変数(変数Q、変数C、変数I、変数K、変数G、変数R、変数O、変数D、変数L、変数T、変数J、変数U、変数B、変数N、変数V、変数A、変数P、変数S、変数M、変数E、変数H、変数F)のデータを用意し、LiNGAMにより、評価用因果モデルを用意した。図6(A)に、前記評価用因果モデルの全体図を示す。前記評価用因果モデルの適合度は、図6(B)に示すように、CFI(Comparative Fit Index)が0.990717、GFI(Goodness of Fit Index)が0.977986、AGFI(Adjusted Goodness of Fit Index)が0.960845、RMSEA(Root Mean Square Error of Approximation)が0.026482、AIC(Akaike's Information Criterion)が243.554451、BIC(Bayesian Information Criterion)が842.300595であった。図6(B)に示すように、図6(A)の評価用因果モデルは、適合度が高く、22変数間の因果関係としては妥当なモデルであると考えられるが、図6(A)に示すように、変数間の因果関係が非常に複雑であり、可読性が低い。
【0034】
図6(A)の評価用因果モデルを、本装置10に入力し、再構築した再構築モデルの一例を図7に示す。図7(A)に示すように、本装置10により再構築した再構築モデルは、変数が削減されており、可読性が向上している。また、図7(B)に示すように、前記再構築モデルは、CFI(Comparative Fit Index)が0.97844、GFI(Goodness of Fit Index)が0.95897、AGFI(Adjusted Goodness of Fit Index)が0.92740、RMSEA(Root Mean Square Error of Approximation)が0.03206、AIC(Akaike's Information Criterion)が29.94730、BIC(Bayesian Information Criterion)が103.56363であった。図7(A)および(B)に示すように、本装置10により再構築した再構築モデルは、モデルの適合度の低下を抑制し、且つ、変数を削減できる。このため、本装置10は、因果モデルの適合度の低下を抑制し、且つ、因果モデルの可読性を向上できることがわかった。
【0035】
因果モデルの可読性を単純に向上させる手法としては、例えば、分析対象となるターゲット変数周辺の関係性を抽出して解釈を試みるという手法が考えられる。そこで、参考例として、図6(A)の評価用因果モデルについて、ターゲット変数Eに隣接する変数と、前記隣接する変数にさらに隣接する変数をピックアップし、ピックアップした変数を用いて再構築した参考例の因果モデルの一例を図8に示す。図8(A)に示すように、参考例の手法によっても、因果モデルの可読性は向上するが、図8(B)に示すように、参考例の因果モデルは、CFI(Comparative Fit Index)が0.915675、GFI(Goodness of Fit Index)が0.897672、AGFI(Adjusted Goodness of Fit Index)が0.870684、RMSEA(Root Mean Square Error of Approximation)が0.063892、AIC(Akaike's Information Criterion)が57.075787、BIC(Bayesian Information Criterion)が199.400690であった。参考例の因果モデルは、モデル適合度の低下が著しく、CFI、GFI、AGFI、RMSEAの数値が図6の評価用因果モデルから低下し、特に、GFIおよびAGFIの低下レベルが許容できないレベルであることがわかった。
【0036】
[実施形態2]
実施形態2は、本開示の因果分析支援装置の例である。
【0037】
図9は、因果分析支援装置10Aの一例の構成を示すブロック図である。図9に示すように、因果分析支援装置10Aは、実施形態1の因果分析支援装置10の構成に加えて、評価値算出部15を含む。因果分析支援装置10Aのハードウェア構成は、図2の因果分析支援装置10のハードウェア構成において、中央処理装置101が、図1の因果分析支援装置10の構成に代えて、図9の因果分析支援装置10Aの構成を備える以外は同様である。以下、評価値算出部15の処理を説明する。評価値算出部15の処理は、例えば、前記実施形態1で説明した図3のフローチャートにおける任意の位置に適宜挿入できるが、図10に示すように、S3の後、且つ、S4の前に挿入されることが好ましい。
【0038】
評価値算出部15は、例えば、前記因果モデルおよび前記再構築モデルの少なくとも一つの評価値を算出する(S11、評価値算出工程)。前記評価値は、例えば、前記因果モデルおよび前記再構築モデルの適合度と可読性とを総合的に評価した指標である。評価値算出部15は、例えば、各モデルの適合度および変数数に基づき、任意のスコア関数を用いて前記評価値を算出できる。前記スコア関数は、特に制限されず、例えば、下記式(1)のような関数があげられる。なお、下記式(1)のスコア関数は一例であり、本開示は以下の例示にはなんら制限されない。評価値算出部15は、例えば、算出した前記評価値を対応する因果モデルまたは再構築モデルと紐づけて前記記憶部に記憶してもよい。
式(1):(0.97-CFI)^2 + 2*(0.04-RMSEA)^2 +0.3*(3-変数数)^2
【0039】
本実施形態において、結果出力部14は、例えば、S4の結果出力工程において、前記評価値に基づいて少なくとも一つの前記再構築モデルおよび前記因果モデルを選択し、選択した前記再構築モデルおよび前記因果モデルを出力してもよい。結果出力部14は、例えば、前記評価値が最も優れた再構築モデルまたは因果モデルを選択してもよいし、前記評価値が評価基準を超える少なくとも一つの再構築モデルまたは因果モデルを選択してもよい。結果出力部14による再構築モデルの選択基準は、特に制限されず、例えば、前記評価値の算出手法に応じて適切な基準が設定できる。
【0040】
本実施形態の因果分析支援装置によれば、因果モデル取得部により取得した因果モデルについて、重要度算出部により、前記因果モデルが含む変数の重要度を算出できる。そして、再構築部により、前記重要度に基づいて前記因果モデルを再構築した再構築モデルを少なくとも一つ生成し、前記評価値算出部により、前記因果モデルおよび前記再構築モデルの少なくとも一つの評価値を算出し、前記結果出力部により、前記評価値に基づいて少なくとも一つの前記再構築モデルおよび前記因果モデルを選択し、選択した前記再構築モデルおよび前記因果モデルを出力できる。このため、本実施形態の因果分析支援装置によれば、因果モデルが含む変数の重要度を考慮した再構築モデルを生成できるため、適合度の低下を抑制し、且つ、因果モデルの可読性を向上できる。また、本実施形態の因果分析支援装置によれば、前記評価値算出部により算出した評価値に基づいて、前記結果出力部が、少なくとも一つの前記再構築モデルおよび前記因果モデルを選択し、選択した前記再構築モデルおよび前記因果モデルを出力できる。このため、本実施形態の因果分析支援装置によれば、ユーザは、適合度の低下が抑制され、且つ、可読性が向上された因果モデルをより容易に閲覧することが可能になる。このため、本実施形態の因果分析支援装置は、例えば、心因果関係の分析を利用する分野において利用でき、特に、IT分野、経済分野、ライフサイエンス分野、環境分野、社会学分野等の、多数の変数間の因果関係の推定に特に好適に利用できる。
【0041】
[実施形態3]
本実施形態のプログラムは、前述の因果分析支援方法の各工程を、コンピュータに実行させるためのプログラムである。具体的に、本実施形態のプログラムは、コンピュータに、因果モデル取得手順、重要度算出手順、再構築手順、および結果出力手順を実行させるためのプログラムである。
【0042】
前記因果モデル取得手順は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出手順は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築手順は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力手順は、少なくとも一つの前記再構築モデルを出力する。
【0043】
また、本実施形態のプログラムは、コンピュータを、因果モデル取得手順、重要度算出手順、再構築手順、および結果出力手順として機能させるプログラムということもできる。
【0044】
本実施形態のプログラムは、前記本開示の因果分析支援装置および因果分析支援方法における記載を援用できる。前記各手順は、例えば、「手順」を「処理」と読み替え可能である。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体は、例えば、非一時的なコンピュータ可読記録媒体(non-transitory computer-readable storage medium)である。前記記録媒体は、特に制限されず、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、ハードディスク(HD)、フラッシュメモリー(例えば、SSD(Solid State Drive)、USBフラッシュメモリー、SD/SDHCカード等)、光ディスク(例えば、CD‐R/CD‐RW、DVD‐R/DVD‐RW、BD‐R/BD‐RE等)、光磁気ディスク(MO)、フロッピー(登録商標)ディスク(FD)等があげられる。また、本実施形態のプログラム(例えば、プログラミング製品、又はプログラム製品ともいう)は、例えば、外部のコンピュータから配信される形態であってもよい。前記「配信」は、例えば、通信回線網を介した配信でもよいし、有線で接続された装置を介した配信であってもよい。本実施形態のプログラムは、配信された装置にインストールされて実行されてもよいし、インストールされずに実行されてもよい。
【0045】
以上、実施形態を参照して本開示を説明したが、本開示は、上記実施形態に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解しうる様々な変更をできる。そして、各実施の形態は、適宜他の実施の形態と組み合わせることができる。
【0046】
<付記>
上記の実施形態の一部または全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
因果モデル取得部、重要度算出部、再構築部、および結果出力部を含み、
前記因果モデル取得部は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出部は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築部は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力部は、少なくとも一つの前記再構築モデルを出力する、因果分析支援装置。
(付記2)
前記重要度算出部は、前記変数の因果係数に基づいて前記重要度を算出する、付記1記載の因果分析支援装置。
(付記3)
前記重要度算出部は、前記因果係数の絶対値に基づいて前記重要度を算出する、付記2記載の因果分析支援装置。
(付記4)
前記重要度算出部は、前記重要度として、前記変数の中心性指数を算出する、付記1から3のいずれかに記載の因果分析支援装置。
(付記5)
前記再構築部は、
前記重要度に基づいて、前記因果モデルが含む前記変数から、少なくとも一つの変数を削除した候補変数を生成し、
前記候補変数に基づいて、少なくとも一つの再構築モデルを生成する、付記1から4のいずれかに記載の因果分析支援装置。
(付記6)
前記因果モデル生成部は、ターゲット変数を終点とする少なくとも一つの再構築モデルを生成する、付記5記載の因果分析支援装置。
(付記7)
前記因果モデル生成部は、ターゲット変数を始点とする少なくとも一つの再構築モデルを生成する、付記5または6記載の因果分析支援装置。
(付記8)
評価値算出部を含み、
前記評価値算出部は、前記因果モデルおよび前記再構築モデルの少なくとも一つの評価値を算出する、付記1から7のいずれかに記載の因果分析支援装置。
(付記9)
前記結果出力部は、前記評価値に基づいて少なくとも一つの前記再構築モデルおよび前記因果モデルを選択し、選択した前記再構築モデルおよび前記因果モデルを出力する、付記8記載の因果分析支援装置。
(付記10)
因果モデル取得工程、重要度算出工程、再構築工程、および結果出力工程を含み、
前記因果モデル取得工程は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出工程は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築工程は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力工程は、少なくとも一つの前記再構築モデルを出力する、因果分析支援方法。
(付記11)
前記重要度算出工程は、前記変数の因果係数に基づいて前記重要度を算出する、付記10記載の因果分析支援方法。
(付記12)
前記重要度算出工程は、前記因果係数の絶対値に基づいて前記重要度を算出する、付記11記載の因果分析支援方法。
(付記13)
前記重要度算出工程は、前記重要度として、前記変数の中心性指数を算出する、付記10から12のいずれかに記載の因果分析支援方法。
(付記14)
前記再構築工程は、
前記重要度に基づいて、前記因果モデルが含む前記変数から、少なくとも一つの変数を削除した候補変数を生成し、
前記候補変数に基づいて、少なくとも一つの再構築モデルを生成する、付記10から13のいずれかに記載の因果分析支援方法。
(付記15)
前記因果モデル生成工程は、ターゲット変数を終点とする少なくとも一つの再構築モデルを生成する、付記14記載の因果分析支援方法。
(付記16)
前記因果モデル生成工程は、ターゲット変数を始点とする少なくとも一つの再構築モデルを生成する、付記14または15記載の因果分析支援方法。
(付記17)
評価値算出工程を含み、
前記評価値算出工程は、前記因果モデルおよび前記再構築モデルの少なくとも一つの評価値を算出する、付記10から16のいずれかに記載の因果分析支援方法。
(付記18)
前記結果出力工程は、前記評価値に基づいて少なくとも一つの前記再構築モデルおよび前記因果モデルを選択し、選択した前記再構築モデルおよび前記因果モデルを出力する、付記17記載の因果分析支援方法。
(付記19)
因果モデル取得手順、重要度算出手順、再構築手順、および結果出力手順を含み、
前記因果モデル取得手順は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出手順は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築手順は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力手順は、少なくとも一つの前記再構築モデルを出力し、
前記各手順をコンピュータに実行させるためのプログラム。
(付記20)
前記重要度算出手順は、前記変数の因果係数に基づいて前記重要度を算出する、付記19記載のプログラム。
(付記21)
前記重要度算出手順は、前記因果係数の絶対値に基づいて前記重要度を算出する、付記20記載のプログラム。
(付記22)
前記重要度算出手順は、前記重要度として、前記変数の中心性指数を算出する、付記19から21のいずれかに記載のプログラム。
(付記23)
前記再構築手順は、
前記重要度に基づいて、前記因果モデルが含む前記変数から、少なくとも一つの変数を削除した候補変数を生成し、
前記候補変数に基づいて、少なくとも一つの再構築モデルを生成する、付記19から22のいずれかに記載のプログラム。
(付記24)
前記因果モデル生成手順は、ターゲット変数を終点とする少なくとも一つの再構築モデルを生成する、付記23記載のプログラム。
(付記25)
前記因果モデル生成手順は、ターゲット変数を始点とする少なくとも一つの再構築モデルを生成する、付記23または24記載のプログラム。
(付記26)
評価値算出手順を含み、
前記評価値算出手順は、前記因果モデルおよび前記再構築モデルの少なくとも一つの評価値を算出する、付記19から25のいずれかに記載のプログラム。
(付記27)
前記結果出力手順は、前記評価値に基づいて少なくとも一つの前記再構築モデルおよび前記因果モデルを選択し、選択した前記再構築モデルおよび前記因果モデルを出力する、付記26記載のプログラム。
(付記28)
因果モデル取得手順、重要度算出手順、再構築手順、および結果出力手順を含み、
前記因果モデル取得手順は、少なくとも一つの変数の因果関係を含む因果モデルを取得し、
前記重要度算出手順は、前記因果モデルが含む前記変数の重要度を算出し、
前記再構築手順は、前記重要度に基づいて前記因果モデルを再構築し、少なくとも一つの再構築モデルを生成し、
前記結果出力手順は、少なくとも一つの前記再構築モデルを出力し、
前記各手順をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
(付記29)
前記重要度算出手順は、前記変数の因果係数に基づいて前記重要度を算出する、付記28記載の記録媒体。
(付記30)
前記重要度算出手順は、前記因果係数の絶対値に基づいて前記重要度を算出する、付記20記載の記録媒体。
(付記31)
前記重要度算出手順は、前記重要度として、前記変数の中心性指数を算出する、付記28から30のいずれかに記載の記録媒体。
(付記32)
前記再構築手順は、
前記重要度に基づいて、前記因果モデルが含む前記変数から、少なくとも一つの変数を削除した候補変数を生成し、
前記候補変数に基づいて、少なくとも一つの再構築モデルを生成する、付記28から31のいずれかに記載の記録媒体。
(付記33)
前記因果モデル生成手順は、ターゲット変数を終点とする少なくとも一つの再構築モデルを生成する、付記32記載の記録媒体。
(付記34)
前記因果モデル生成手順は、ターゲット変数を始点とする少なくとも一つの再構築モデルを生成する、付記32または33記載の記録媒体。
(付記35)
評価値算出手順を含み、
前記評価値算出手順は、前記因果モデルおよび前記再構築モデルの少なくとも一つの評価値を算出する、付記28から34のいずれかに記載の記録媒体。
(付記36)
前記結果出力手順は、前記評価値に基づいて少なくとも一つの前記再構築モデルおよび前記因果モデルを選択し、選択した前記再構築モデルおよび前記因果モデルを出力する、付記35記載の記録媒体。
【産業上の利用可能性】
【0047】
このため、本開示は、例えば、因果関係の分析を利用する分野において利用でき、特に、IT分野、経済分野、ライフサイエンス分野、環境分野、社会学分野等の、多数の変数間の因果関係の推定に特に好適に利用できる。
【符号の説明】
【0048】
10、10A 因果分析支援装置
11 因果モデル取得部
12 重要度算出部
13 再構築部
14 結果出力部
15 評価値算出部
101 CPU
102 メモリ
103 バス
104 記憶装置
105 入力装置
106 出力装置
107 通信デバイス

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10