(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024034166
(43)【公開日】2024-03-13
(54)【発明の名称】因果分析支援装置、因果分析支援方法、プログラム及び記録媒体
(51)【国際特許分類】
G06N 3/126 20230101AFI20240306BHJP
G06N 5/04 20230101ALI20240306BHJP
【FI】
G06N3/12 160
G06N5/04
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022138234
(22)【出願日】2022-08-31
(71)【出願人】
【識別番号】000232092
【氏名又は名称】NECソリューションイノベータ株式会社
(74)【代理人】
【識別番号】100115255
【弁理士】
【氏名又は名称】辻丸 光一郎
(74)【代理人】
【識別番号】100201732
【弁理士】
【氏名又は名称】松縄 正登
(74)【代理人】
【識別番号】100154081
【弁理士】
【氏名又は名称】伊佐治 創
(74)【代理人】
【識別番号】100227019
【弁理士】
【氏名又は名称】安 修央
(72)【発明者】
【氏名】浅沼 爽汰
(72)【発明者】
【氏名】菅原 収吾
(72)【発明者】
【氏名】渡部(丸山) 佳織
(72)【発明者】
【氏名】山本 純一
(57)【要約】
【課題】 移適合度の低下を抑制し、且つ、因果数を削減可能な因果分析支援装置を提供する。
【解決手段】 本発明の因果分析支援装置は、初期因果モデル取得部及び候補因果モデル生成部を含み、
前記初期因果モデル取得部は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成部は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
初期因果モデル取得部及び候補因果モデル生成部を含み、
前記初期因果モデル取得部は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成部は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成する、因果分析支援装置。
【請求項2】
前記候補因果モデル生成部は、個体情報生成部、因果モデル群生成部、評価値算出部、次世代選択部、判定部、及び候補因果モデル出力部を含み、
前記個体情報生成部は、前記因果モデルが含む複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、
前記因果モデル群生成部は、前記因果モデルの個体情報に基づいて、複数の因果モデルを含む因果モデル群を生成し、
前記評価値算出部は、各因果モデルの評価値を算出し、
前記次世代選択部は、前記評価値に基づいて、前記因果モデル群から候補因果モデルを選択し、
前記判定部は、前記候補因果モデルが終了条件を満たすか否かを判定し、
前記候補因果モデルが前記終了条件を満たさない場合、前記個体情報生成部、前記因果モデル群生成部、前記評価値算出部、前記次世代選択部、及び前記判定部による処理を繰り返し、
前記候補因果モデルが前記終了条件を満たす場合、前記候補因果モデル出力部は、前記終了条件を満たす候補因果モデルを出力する、請求項1記載の因果分析支援装置。
【請求項3】
前記判定部は、前記次世代選択部により、同一の因果モデルが前記候補因果モデルとして所定回数選択された場合に、前記候補因果モデルが終了条件を満たすと判定する、請求項2記載の因果分析支援装置。
【請求項4】
前記次世代選択部は、確率的選択手法及びルール選択の少なくとも一方の手法を用いて、前記候補因果モデルを選択する、請求項2又は3記載の因果分析支援装置。
【請求項5】
前記因果モデル群生成部は、因果モデルの個体情報に対し、交差及び変異の少なくとも一方を行い、複数の因果モデルを生成する、請求項2又は3記載の因果分析支援装置。
【請求項6】
初期因果モデル取得工程及び候補因果モデル生成工程を含み、
前記初期因果モデル取得工程は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成工程は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成する、因果分析支援方法。
【請求項7】
前記候補因果モデル生成工程は、個体情報生成工程、因果モデル群生成工程、評価値算出工程、次世代選択工程、判定工程、及び候補因果モデル出力工程を含み、
前記個体情報生成工程は、前記因果モデルが含む複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、
前記因果モデル群生成工程は、前記因果モデルの個体情報に基づいて、因果モデルを含む複数の因果モデルを含む因果モデル群を生成し、
前記評価値算出工程は、各因果モデルの評価値を算出し、
前記次世代選択工程は、前記評価値に基づいて、前記因果モデル群から候補因果モデルを選択し、
前記判定工程は、前記候補因果モデルが終了条件を満たすか否かを判定し、
前記候補因果モデルが前記終了条件を満たさない場合、前記個体情報生成工程、前記因果モデル群生成工程、前記評価値算出工程、前記次世代選択工程、及び前記判定工程による処理を繰り返し、
前記候補因果モデルが前記終了条件を満たす場合、前記候補因果モデル出力工程は、前記終了条件を満たす候補因果モデルを出力する、
請求項6記載の因果分析支援方法。
【請求項8】
前記判定工程は、前記次世代選択工程により、同一の因果モデルが前記候補因果モデルとして所定回数選択された場合に、前記候補因果モデルが終了条件を満たすと判定する、請求項7記載の因果分析支援装置。
【請求項9】
初期因果モデル取得手順及び候補因果モデル生成手順を含み、
前記初期因果モデル取得手順は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成手順は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成し、
前記各手順をコンピュータに実行させるためのプログラム。
【請求項10】
初期因果モデル取得手順及び候補因果モデル生成手順を含み、
前記初期因果モデル取得手順は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成手順は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成し、
前記各手順をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、因果分析支援装置、因果分析支援方法、プログラム及び記録媒体に関する。
【背景技術】
【0002】
工場等の生産ラインにおける異常の原因推定等を行うために、LiNGAM(Liner Non-Gaussian Acyclic Model)、ベイジアンネットワーク、共分散構造分析等を用いた複数の変数からなる事象の因果推定手法が知られている(特許文献1、2等)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020-149303号公報
【特許文献2】特開2020-135591号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、これらの手法により、心理尺度分析のデータ分析等の多数の変数を用いた分析を行う場合、変数間の因果数が膨大になり、結果の解釈が困難になり、因果係数に閾値を設けて因果数を抑制すると、分析モデルの適合度(CFI:Comparative Fit Index)が低下するという課題がある。
【0005】
そこで本発明は、適合度の低下を抑制し、且つ、因果数を削減可能な因果分析支援装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
前記目的を達成するために、本発明の因果分析支援装置は、
初期因果モデル取得部及び候補因果モデル生成部を含み、
前記初期因果モデル取得部は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成部は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成する。
【0007】
本発明の因果分析支援方法は、
初期因果モデル取得工程及び候補因果モデル生成工程を含み、
前記初期因果モデル取得工程は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成工程は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成する。
【0008】
本発明のプログラムは、
初期因果モデル取得手順及び候補因果モデル生成手順を含み、
前記初期因果モデル取得手順は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成手順は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成し、
前記各手順をコンピュータに実行させるためのプログラムである。
【0009】
本発明の記録媒体は、
初期因果モデル取得手順及び候補因果モデル生成手順を含み、
前記初期因果モデル取得手順は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成手順は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成し、
前記各手順をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0010】
本発明によれば、因果分析において、適合度の低下を抑制し、且つ、因果数を削減可能となる。
【図面の簡単な説明】
【0011】
【
図1】
図1は、実施形態1の因果分析支援装置の一例の構成を示すブロック図である。
【
図2】
図2は、実施形態1の因果分析支援装置のハードウェア構成の一例を示すブロック図である。
【
図3】
図3は、実施形態1の因果分析支援装置における処理の一例を示すフローチャートである。
【
図4】
図4は、実施形態1の因果分析支援装置の候補因果モデル生成部による処理の一例を示すフローチャートである。
【
図5】
図5は、因果モデルの例を示す模式図である。
【
図6】
図6は、実施形態1の因果分析支援装置により出力された候補因果モデルの一例を示す模式図である。
【
図7】
図7は、実施例1の結果を示すグラフである。
【発明を実施するための形態】
【0012】
次に、本発明の実施形態について図を用いて説明する。本発明は、以下の実施形態には限定されない。以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用でき、各実施形態の構成は、特に言及がない限り、組合せ可能である。
【0013】
[実施形態1]
本実施形態の因果分析支援装置について、
図1を用いて説明する。
図1は、本実施形態の因果分析支援装置10の一例の構成を示すブロック図である。
図1に示すように、因果分析支援装置10(以下、「本装置10」ともいう)は、初期因果モデル取得部11及び候補因果モデル生成部12を含む。また、
図1に示すように、候補因果モデル生成部12は、例えば、個体情報生成部121、因果モデル群生成部122、評価値算出部123、次世代選択部124、判定部125、及び候補因果モデル出力部126を含んでもよい。また、図示していないが、本装置10は、例えば、記憶部を含んでもよい。
【0014】
本装置10は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、通信回線網を介して接続可能な装置でもよい。また、本装置10は、通信回線網を介して、後述する外部装置と接続可能である。通信回線網は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。通信回線網は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、SAN(Storage Area Network)、DTN(Delay Tolerant Networking)、LPWA(Low Power Wide Area)、L5G(ローカル5G)、等があげられる。無線通信としては、例えば、Wi-Fi(登録商標)、Bluetooth(登録商標)、ローカル5G、LPWA等が挙げられる。前記無線通信としては、各装置が直接通信する形態(Ad Hoc通信)、インフラストラクチャ(infrastructure通信)、アクセスポイントを介した間接通信等であってもよい。本装置10は、例えば、システムとしてサーバに組み込まれていてもよい。また、本装置10は、例えば、本発明のプログラムがインストールされたパーソナルコンピュータ(PC、例えば、デスクトップ型、ノート型)、スマートフォン、タブレット端末等であってもよい。さらに、本装置10は、例えば、前記各部のうち少なくとも一つがサーバ上にあり、その他の前記各部が端末上にあるような、クラウドコンピューティングやエッジコンピューティング等の形態であってもよい。
【0015】
図2に、本装置10のハードウェア構成のブロック図を例示する。本装置10は、例えば、中央処理装置(CPU、GPU等)101、メモリ102、バス103、記憶装置104、入力装置105、出力装置106、通信デバイス107等を含む。本装置10の各部は、それぞれのインタフェース(I/F)により、バス103を介して相互に接続されている。
【0016】
中央処理装置101は、コントローラ(システムコントローラ、I/Oコントローラ等)等により、他の構成と連携動作し、本装置10の全体の制御を担う。本装置10において、中央処理装置101により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、中央処理装置101が、因果分析支援装置10(以下、「本装置10」ともいう)は、初期因果モデル取得部11及び候補因果モデル生成部12として機能し、さらに、個体情報生成部121、因果モデル群生成部122、評価値算出部123、次世代選択部124、判定部125、及び候補因果モデル出力部126として機能する。本装置10は、演算装置として、CPU、GPU(Graphics Processing Unit)、APU(Accelerated Processing Unit)等の他の演算装置を備えてもよいし、これらの組合せを備えてもよい。
【0017】
バス103は、例えば、外部装置とも接続できる。前記外部装置は、例えば、後述する初期因果モデルを生成可能な装置、外部記憶装置(外部データベース等)、プリンタ、外部入力装置、外部表示装置、スピーカ等の音声出力装置、カメラ等の外部撮像装置、並びに、加速度センサ、地磁気センサ、及び方向センサ等の各種センサ等があげられる。本装置10は、例えば、バス103に接続された通信デバイス107により、外部ネットワーク(前記通信回線網)に接続でき、外部ネットワークを介して、ユーザの端末等の他の装置と接続することもできる。
【0018】
メモリ102は、例えば、メインメモリ(主記憶装置)が挙げられる。中央処理装置101が処理を行う際には、例えば、後述する記憶装置104に記憶されている本発明のプログラム等の種々の動作プログラムを、メモリ102が読み込み、中央処理装置101は、メモリ102からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。また、メモリ102は、例えば、ROM(読み出し専用メモリ)であってもよい。
【0019】
記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置104は、例えば、記録媒体と、記録媒体に読み書きするドライブとの組合せであってもよい。前記記録媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられる。記憶装置104は、例えば、記録媒体とドライブとが一体化されたハードディスクドライブ(HDD)、及びソリッドステートドライブ(SSD)であってもよい。本装置10が前記記憶部を含む場合、例えば、記憶装置104は、前記記憶部として機能する。
【0020】
本装置10において、メモリ102及び記憶装置104は、ログ情報、外部データベース(図示せず)や外部の装置から取得した情報、本装置10によって生成した情報、本装置10が処理を実行する際に用いる情報等の種々の情報を記憶することも可能である。この場合、メモリ102及び記憶装置104は、例えば、前述の本装置のユーザの情報等を記憶していてもよい。なお、少なくとも一部の情報は、例えば、メモリ102及び記憶装置104以外の外部サーバに記憶されていてもよいし、複数の端末にブロックチェーン技術等を用いて分散して記憶されていてもよい。
【0021】
本装置10は、例えば、さらに、入力装置105、出力装置106を備える。入力装置105は、例えば、タッチパネル、トラックパッド、マウス等のポインティングデバイス;キーボード;カメラ、スキャナ等の撮像手段;ICカードリーダ、磁気カードリーダ等のカードリーダ;マイク等の音声入力手段;等があげられる。出力装置106は、例えば、LEDディスプレイ、液晶ディスプレイ等の表示装置;スピーカ等の音声出力装置;プリンタ;等があげられる。本実施形態において、入力装置105と出力装置106とは、別個に構成されているが、入力装置105と出力装置106とは、タッチパネルディスプレイのように、一体として構成されてもよい。
【0022】
つぎに、本実施形態の因果分析支援方法の一例を、
図3及び
図4のフローチャートに基づき説明する。本実施形態の因果分析支援方法は、例えば、
図1または
図2に示す因果分析支援装置10を用いて、次のように実施できる。なお、本実施形態の因果分析支援方法は、
図1または
図2の因果分析支援装置10の使用には限定されない。
図3は、本実施形態の因果分析支援装置10による処理の一例を示すフローチャートである。
【0023】
まず、初期因果モデル取得部11により、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得する(S1、初期因果モデル取得工程)。前記因果モデルは、例えば、公知の因果探索手法により、複数の因子(変数ともいう)における因果関係の有無やその方向を探索した結果を示すモデルである。前記因果探索方法は、特に制限されず、例えば、LiNGAM(Liner Non-Gaussian Acyclic Model)、SAM(Structural Agnostic Modelling)、ベイジアンネットワーク、LiNG(Liner Non-Gaussian SEM)等があげられる。前記因果モデルは、例えば、
図5に示すように、複数の因子(例えば、因子A、B、C、及びD)について、因果関係を矢印で示した有向グラフで表すことができる。
図5に示す初期因果モデルでは、例えば、因子Aは、因子B、C、及びDに対して因果関係があり、因子Bは、因子Dに対して因果関係があることを示す。初期因果モデル取得部11は、例えば、前記初期因果モデルを1つ取得してもよいし、2以上の複数取得してもよい。初期因果モデル取得部11は、例えば、因果探索が可能な外部装置が分析した因果モデルを前記初期因果モデルとして取得してもよいし、前記因果モデルを記録した外部のデータベース又はサーバから前記初期因果モデルを取得してもよい。なお、前記初期因果モデルは、例えば、本装置10が生成した因果モデルでもよく、この場合、初期因果モデル取得部11は、例えば、前記因果探索手法により、入力されたデータの因果関係を推定し、前記初期因果モデルを生成できる。
【0024】
つぎに、候補因果モデル生成部12により、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成する(S2、候補因果モデル生成工程)。候補因果モデル生成部12による処理の具体例については、後述する。本装置10は、例えば、前記個体情報に基づく遺伝的アルゴリズムにより候補因果モデルを最適化できるため、適合度の低下を抑制し、且つ因果数を削減した候補因果モデルを生成できる。
【0025】
候補因果モデル生成工程の具体例について、
図4を用いて説明する。
図4は、因果分析支援装置10の候補因果モデル生成部12による処理(S2)の一例を示すフローチャートである。
【0026】
まず、個体情報生成部121は、例えば、前記因果モデルが含む複数の因子の因果関係に基づいて、因果モデルの個体情報を生成する(S21、個体情報生成工程)。具体的に、個体情報生成部121は、例えば、因果モデルが含む複数の因子毎に、他の因子に対する因果関係の有無を検出し、因果関係がある(すなわち、グラフにおける矢印が存在する)場合を1、因果関係がない(すなわち、グラフにおける矢印が存在しない)場合を0とし、各因子の因果関係を数値に変換する。具体例として、初期因果モデルが
図5に示すグラフである場合を例に挙げて説明する。この場合、因子Aは、因子B、C、Dすべてに因果関係がある(因子B、C、Dに矢印が伸びている)ため、因子Aの数値情報は、因子Bを1、因子Cを1、因子Dを1とした、(1,1,1)となる。因子Bは、因子Dにのみ因果関係がある(因子Dに矢印が伸びている)ため、因子Bの数値情報は、因子Aを0、因子Cを0、因子Dを1とした、(0,0,1)となる。因子CおよびDは、他の因子との因果関係がないため、因子CおよびDの数値情報は、いずれも(0,0,0)となる。このため、個体情報生成部121は、
図5に示す初期因果モデルの個体情報として、因子A、B、C、及びDの数値情報を結合した{(1,1,1)(0,0,1)(0,0,0)(0,0,0)}を生成できる。なお、上記の説明では、因果関係がある(すなわち、グラフにおける矢印が存在する)場合を1、因果関係がない(すなわち、グラフにおける矢印が存在しない)場合を0とし、各因子の因果関係を数値情報に変換する場合を例に挙げて説明したが、本発明はこれには限定されない。個体情報生成部121は、例えば、因果関係がある場合とない場合とを区別可能なように異なる変数に変換すればよく、因果関係がある場合を0に変換し、因果関係がない場合を1に変換してもよいし、1又は0以外のその他の数値に変換してもよいし、文字や記号等のその他の変数に変換してもよい。前記個体情報は、遺伝的アルゴリズムに利用することから、例えば、遺伝子情報ともいう。
【0027】
つぎに、因果モデル群生成部122は、例えば、前記因果モデルの個体情報に基づいて、因果モデルを含む複数の因果モデルを含む因果モデル群を生成する(S122、因果モデル群生成工程)。具体的に、因果モデル群生成部122は、例えば、前記因果モデルの個体情報に対し、前記因果モデル群として、前記初期因果モデルの個体情報に対し、交差及び変異の少なくとも一方を行い、複数の因果モデルを生成する。具体例として、初期因果モデルの個体情報が、前述の{(1,1,1)(0,0,1)(0,0,0)(0,0,0)}である場合を例に挙げて説明する。因果モデル群生成部122は、例えば、個体情報{(1,1,1)(0,0,1)(0,0,0)(0,0,0)}に対し、個体情報が含む数値情報について、任意の確率で変更した変異個体情報を生成することにより、複数の個体情報により表される因果モデル群を生成できる。また、因果モデル群生成部122は、例えば、前記生成した変異個体情報と、初期因果モデルの個体情報とから2個体を選択し、選択した個体同士の個体情報を交差した交差個体情報を生成してもよい。前記交差は、例えば、一点交差でもよいし、二点交差でもよいし、他点交差でもよいし、一様交差でもよい。因果モデル群生成部122は、例えば、前記因果モデルが1つの場合は、例えば、前記変異処理によって変異個体情報を生成し、その後、交差処理を行って交差個体情報を生成できるが、前記因果モデルが2以上の複数ある場合は、交差処理及び変異処理の少なくとも一方を実行すればよく、その実行順序も特に制限されない。このようにして、因果モデル群生成部122は、例えば、複数の因果モデルを含む因果モデル群を生成できる。
【0028】
つぎに、評価値算出部123は、例えば、各因果モデルの評価値を算出する(S23、評価値算出工程)。評価値算出部123は、例えば、各因果モデルの適合度を算出し、前記適合度を用いたスコア関数により、前記評価値として適応度を算出できる。前記適合度は、特に制限されず、例えば、CFI(Comparative Fit Index)、RMSEA(Root Mean Square Error of Approximation)、GFI(Goodness of Fit Index)、AGFI(Adjusted Goodness of Fit Index)、AIC(Akaike's Information Criterion)、CAIC(Consistent Akaike's Information Criterion)等があげられる。また、評価値算出部123は、例えば、前記評価値の算出に当たり、各因果モデルのエッジ数を考慮してもよい。
【0029】
つぎに、次世代選択部124は、例えば、前記評価値に基づいて、前記因果モデル群から候補因果モデルを選択する(S24、次世代選択工程)。次世代選択部124は、例えば、確率的選択手法及びルール選択の少なくとも一方の手法を用いて、前記候補因果モデルを選択できる。前記確率的選択手法は、例えば、ルーレット選択方式でもよいし、ランキング選択形式でもよい。前記ルーレット選択方式は、例えば、全因果モデルの評価値の割合を算出し、前記割合に応じて選択確率を割りあて、割り当てた確率に基づいて因果モデルを選択する方式である。前記ランキング選択形式は、例えば、前記評価値の順位と、選択される確率とを予め紐づけておき、各因果モデルの評価値の順序に応じた確率で次世代の因果モデルを選択する方式である。この場合において、前記評価値の順序ごとの確率は、特に制限されず、例えば、データ分析の目的などに応じて適宜設定できる。前記ルール選択手法は、例えば、トーナメント選択方式でもよいし、エリート選択方式でもよい。前記トーナメント選択形式は、例えば、ランダムに複数の因果モデルを選択し、選択した因果モデルの中で評価値が高い2個体を選択する方式である。前記エリート選択方式は、例えば、前記評価値が高い因果モデルを少なくとも1つ選択する選択方式である。また、次世代選択部124は、例えば、選択した候補因果モデル及びその評価値の組を、メモリ102又は記憶装置104に記憶しておき、次回の候補因果モデル選択時に、記憶した候補因果モデルと次世代の候補因果モデルとをさらに比較してもよい。
【0030】
つぎに、判定部125は、前記候補因果モデルが終了条件を満たすか否かを判定する(S25、判定工程)。前記終了条件は、特に制限されず、例えば、データ分析の目的等に応じて適宜設定できる。具体的に、判定部125は、次世代選択部124により、同一の因果モデルが前記候補因果モデルとして所定回数選択された場合に、前記候補因果モデルが終了条件を満たすと判定できる。前記所定回数は、特に制限されず、データ分析の目的や、所望する因果数等に応じて適宜設定でき、具体例として、例えば、10回、9回、8回、7回、6回、5回、4回、3回、2回、1回等があげられるが、これには制限されない。
【0031】
本装置10は、例えば、前記候補因果モデルが前記終了条件を満たさない場合(S25、No)、前記初期因果モデルに代えて、前記候補因果モデルを用いて、個体情報生成部121、因果モデル群生成部122、評価値算出部123、次世代選択部124、及び判定部125による処理を繰り返してもよい。この場合、個体情報生成部121および因果モデル群生成部122において、前記初期因果モデルに代えて、前記選択された候補次世代の因果モデルを使用すること以外は同様にして処理を実行できる。
【0032】
そして、候補因果モデル出力部126は、例えば、前記候補因果モデルが前記終了条件を満たす場合(S25、Yes)、前記終了条件を満たす候補因果モデルを出力し(S26、候補因果モデル出力工程)、処理を終了する(END)。候補因果モデル出力部126は、例えば、前記候補因果モデルと併せて、前記候補因果モデルの評価値を出力してもよい。候補因果モデル出力部126は、例えば、前記候補因果モデルを公知の因果推論処理が可能な装置に出力し、前記装置により、前記候補因果モデルの適応度を再計算させてもよい。この場合、前記装置により、前記候補因果モデルの適応度が再計算され、可視化された候補因果モデルと適応度とを確認することができる。
【0033】
図6を用いて、本装置10による候補因果モデルの例について説明する。
図6(A)は、LiNGにより生成した初期因果モデルであり、因果の重みの閾値を0.01に設定した場合の因果モデルであり、
図6(B)は、
図6(A)の初期因果モデルにおける因果の重みについて、閾値を0.3に設定し、閾値以下の因果関係について間引いた場合の因果モデルであり、
図6(C)は、
図6(A)の初期因果モデルを本装置10に入力して得られた候補因果モデルの例である。
図6(A)に示すように、LiNGにより生成した初期因果モデルは、多因子間の因果関係が非常に複雑で、解釈が困難である。閾値を0.01から0.3に変更し、因果関係を間引いた
図6(B)の因果モデルは、因果数が減って解釈が可能であるが、適合度(CFI)が0.822であり、
図6(A)の初期因果モデルの適合度(CFI)0.988から大幅に減少しており、適切なモデルからは離れている。これに対し、本発明の因果分析支援装置に
図6(A)の初期因果モデルを入力して得られた候補因果モデルは、
図6(C)に示すように、解釈が可能な程度に因果数が減少しており、且つ、適合度(CFI)も0.917と十分な値を維持していることがわかる。
【0034】
本実施形態の因果分析支援装置によれば、前記個体情報に基づく遺伝的アルゴリズムにより候補因果モデルを最適化できるため、適合度の低下を抑制し、且つ因果数を削減した候補因果モデルを生成できる。このため、本実施形態の因果分析支援装置は、例えば、心理尺度分析、顧客購買分析、製品特性分析、社会行動分析、ニーズ分析等の、多数の変数間の因果関係の推定に特に好適に利用できる。
【0035】
[実施例1]
本発明の因果分析支援装置が、因果数の多い多変数データにおける因果分析に適していることを確認した。
【0036】
まず、LiNGAMで生成した初期因果モデルを利用し、因果数を5~15まで変化させた因果モデルを用意した。そして、本発明の因果分析支援装置により、遺伝的アルゴリズムを用いて各因果モデルが最適化されるまでの処理時間を計測した(実施例1)。実施例の終了条件は、CFIが0.95以上、且つ、5回同じ結果が出るまでに設定した。また、比較例1として、総当たり因果探索により各因果モデルが最適化されるまでの処理時間を計測した。比較例の終了条件は、全パターンの最適化処理完了までとした。結果を
図7に示す。
【0037】
図7に示すように、総当たりを行った比較例1は、因果数に比例して処理時間が長くなったのに対し、遺伝的アルゴリズムにより処理を行った実施例1は、因果数が増加しても処理時間が変わらなかった。このため、本発明の因果分析支援装置は、因果数が多い因果モデルにおける最適化に適していることが示唆された。
【0038】
[実施形態2]
本実施形態のプログラムは、前述の因果分析支援方法の各工程を、コンピュータに実行させるためのプログラムである。具体的に、本実施形態のプログラムは、コンピュータに、初期因果モデル取得手順及び候補因果モデル生成手順を実行させるためのプログラムである。
【0039】
前記初期因果モデル取得手順は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成手順は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成する。
【0040】
また、本実施形態のプログラムは、コンピュータを、初期因果モデル取得手順及び候補因果モデル生成手順として機能させるプログラムということもできる。
【0041】
本実施形態のプログラムは、前記本発明の因果分析支援装置および因果分析支援方法における記載を援用できる。前記各手順は、例えば、「手順」を「処理」と読み替え可能である。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体は、例えば、非一時的なコンピュータ可読記録媒体(non-transitory computer-readable storage medium)である。前記記録媒体は、特に制限されず、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、ハードディスク(HD)、光ディスク、フロッピー(登録商標)ディスク(FD)等があげられる。
【0042】
以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。
【0043】
<付記>
上記の実施形態の一部または全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
初期因果モデル取得部及び候補因果モデル生成部を含み、
前記初期因果モデル取得部は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成部は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成する、因果分析支援装置。
(付記2)
前記候補因果モデル生成部は、個体情報生成部、因果モデル群生成部、評価値算出部、次世代選択部、判定部、及び候補因果モデル出力部を含み、
前記個体情報生成部は、前記因果モデルが含む複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、
前記因果モデル群生成部は、前記因果モデルの個体情報に基づいて、複数の因果モデルを含む因果モデル群を生成し、
前記評価値算出部は、各因果モデルの評価値を算出し、
前記次世代選択部は、前記評価値に基づいて、前記因果モデル群から候補因果モデルを選択し、
前記判定部は、前記候補因果モデルが終了条件を満たすか否かを判定し、
前記候補因果モデルが前記終了条件を満たさない場合、前記個体情報生成部、前記因果モデル群生成部、前記評価値算出部、前記次世代選択部、及び前記判定部による処理を繰り返し、
前記候補因果モデルが前記終了条件を満たす場合、前記候補因果モデル出力部は、前記終了条件を満たす候補因果モデルを出力する、付記1記載の因果分析支援装置。
(付記3)
前記判定部は、前記次世代選択部により、同一の因果モデルが前記候補因果モデルとして所定回数選択された場合に、前記候補因果モデルが終了条件を満たすと判定する、付記2記載の因果分析支援装置。
(付記4)
前記次世代選択部は、確率的選択手法及びルール選択の少なくとも一方の手法を用いて、前記候補因果モデルを選択する、付記2又は3記載の因果分析支援装置。
(付記5)
前記因果モデル群生成部は、因果モデルの個体情報に対し、交差及び変異の少なくとも一方を行い、複数の因果モデルを生成する、付記2から4のいずれかに記載の因果分析支援装置。
(付記6)
初期因果モデル取得工程及び候補因果モデル生成工程を含み、
前記初期因果モデル取得工程は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成工程は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成する、因果分析支援方法。
(付記7)
前記候補因果モデル生成工程は、個体情報生成工程、因果モデル群生成工程、評価値算出工程、次世代選択工程、判定工程、及び候補因果モデル出力工程を含み、
前記個体情報生成工程は、前記因果モデルが含む複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、
前記因果モデル群生成工程は、前記因果モデルの個体情報に基づいて、因果モデルを含む複数の因果モデルを含む因果モデル群を生成し、
前記評価値算出工程は、各因果モデルの評価値を算出し、
前記次世代選択工程は、前記評価値に基づいて、前記因果モデル群から候補因果モデルを選択し、
前記判定工程は、前記候補因果モデルが終了条件を満たすか否かを判定し、
前記候補因果モデルが前記終了条件を満たさない場合、前記個体情報生成工程、前記因果モデル群生成工程、前記 前記候補因果モデルが前記終了条件を満たす場合、評価値算出工程、前記次世代選択工程、及び前記判定工程による処理を繰り返し、
前記候補因果モデル出力工程は、前記終了条件を満たす候補因果モデルを出力する、
付記6記載の因果分析支援方法。
(付記8)
前記判定工程は、前記次世代選択工程により、同一の因果モデルが前記候補因果モデルとして所定回数選択された場合に、前記候補因果モデルが終了条件を満たすと判定する、付記7記載の因果分析支援装置。
(付記9)
前記次世代選択工程は、確率的選択手法及びルール選択の少なくとも一方の手法を用いて、前記候補因果モデルを選択する、付記7又は8記載の因果分析支援方法。
(付記10)
前記因果モデル群生成工程は、因果モデルの個体情報に対し、交差及び変異の少なくとも一方を行い、複数の因果モデルを生成する、付記7から9のいずれかに記載の因果分析支援方法。
(付記11)
初期因果モデル取得手順及び候補因果モデル生成手順を含み、
前記初期因果モデル取得手順は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成手順は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成し、
前記各手順をコンピュータに実行させるためのプログラム。
(付記12)
前記候補因果モデル生成手順は、個体情報生成手順、因果モデル群生成手順、評価値算出手順、次世代選択手順、判定手順、及び候補因果モデル出力手順を含み、
前記個体情報生成手順は、前記因果モデルが含む複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、
前記因果モデル群生成手順は、前記因果モデルの個体情報に基づいて、因果モデルを含む複数の因果モデルを含む因果モデル群を生成し、
前記評価値算出手順は、各因果モデルの評価値を算出し、
前記次世代選択手順は、前記評価値に基づいて、前記因果モデル群から候補因果モデルを選択し、
前記判定手順は、前記候補因果モデルが終了条件を満たすか否かを判定し、
前記候補因果モデルが前記終了条件を満たさない場合、前記個体情報生成手順、前記因果モデル群生成手順、前記評価値算出手順、前記次世代選択手順、及び前記判定手順による処理を繰り返し、
前記候補因果モデルが前記終了条件を満たす場合、前記候補因果モデル出力手順は、前記終了条件を満たす候補因果モデルを出力する、
付記11記載のプログラム。
(付記13)
前記判定手順は、前記次世代選択手順により、同一の因果モデルが前記候補因果モデルとして所定回数選択された場合に、前記候補因果モデルが終了条件を満たすと判定する、付記12記載のプログラム。
(付記14)
前記次世代選択手順は、確率的選択手法及びルール選択の少なくとも一方の手法を用いて、前記候補因果モデルを選択する、付記12又は13記載のプログラム。
(付記15)
前記因果モデル群生成手順は、因果モデルの個体情報に対し、交差及び変異の少なくとも一方を行い、複数の因果モデルを生成する、付記12から14のいずれかに記載のプログラム。
(付記16)
初期因果モデル取得手順及び候補因果モデル生成手順を含み、
前記初期因果モデル取得手順は、初期因果モデルとして、複数の因子の因果関係を含む因果モデルを取得し、
前記候補因果モデル生成手順は、前記因果モデルが含む前記複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、前記個体情報に基づいて、遺伝的アルゴリズムを用いて候補因果モデルを生成し、
前記各手順をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
(付記17)
前記候補因果モデル生成手順は、個体情報生成手順、因果モデル群生成手順、評価値算出手順、次世代選択手順、判定手順、及び候補因果モデル出力手順を含み、
前記個体情報生成手順は、前記因果モデルが含む複数の因子の因果関係に基づいて、因果モデルの個体情報を生成し、
前記因果モデル群生成手順は、前記因果モデルの個体情報に基づいて、因果モデルを含む複数の因果モデルを含む因果モデル群を生成し、
前記評価値算出手順は、各因果モデルの評価値を算出し、
前記次世代選択手順は、前記評価値に基づいて、前記因果モデル群から候補因果モデルを選択し、
前記判定手順は、前記候補因果モデルが終了条件を満たすか否かを判定し、
前記候補因果モデルが前記終了条件を満たさない場合、前記個体情報生成手順、前記因果モデル群生成手順、前記評価値算出手順、前記次世代選択手順、及び前記判定手順による処理を繰り返し、
前記候補因果モデルが前記終了条件を満たす場合、前記候補因果モデル出力手順は、前記終了条件を満たす候補因果モデルを出力する、
付記16記載の記録媒体。
(付記18)
前記判定手順は、前記次世代選択手順により、同一の因果モデルが前記候補因果モデルとして所定回数選択された場合に、前記候補因果モデルが終了条件を満たすと判定する、付記17記載の記録媒体。
(付記19)
前記次世代選択手順は、確率的選択手法及びルール選択の少なくとも一方の手法を用いて、前記候補因果モデルを選択する、付記17又は18記載の記録媒体。
(付記20)
前記因果モデル群生成手順は、因果モデルの個体情報に対し、交差及び変異の少なくとも一方を行い、複数の因果モデルを生成する、付記17から19のいずれかに記載の記録媒体。
【産業上の利用可能性】
【0044】
本発明によれば、因果モデルの個体情報に基づく遺伝的アルゴリズムにより候補因果モデルを最適化できるため、適合度の低下を抑制し、且つ因果数を削減した候補因果モデルを生成できる。このため、本実発明の因果分析支援装置は、例えば、因果関係の分析を利用する分野において利用でき、特に、心理尺度分析、顧客購買分析、製品特性分析、社会行動分析、ニーズ分析等の、多数の変数間の因果関係の推定に特に好適に利用できる。
【符号の説明】
【0045】
10 因果分析支援装置
11 初期因果モデル取得部
12 候補因果モデル生成部
121 個体情報生成部
122 因果モデル群生成部
123 評価値算出部
124 次世代選択部
125 判定部
126 候補因果モデル出力部
101 CPU
102 メモリ
103 バス
104 記憶装置
105 入力装置
106 出力装置
107 通信デバイス