特開2023-119369 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ エヌ・ティ・ティ・コミュニケーションズ株式会社の特許一覧

特開2023-119369分析装置、分析方法及び分析プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023119369

(43)【公開日】2023-08-28

(54)【発明の名称】分析装置、分析方法及び分析プログラム

(51)【国際特許分類】

G06N 3/08 20230101AFI20230821BHJP

【ＦＩ】

G06N3/08

【審査請求】未請求

【請求項の数】5

【出願形態】ＯＬ

(21)【出願番号】P 2022022241

(22)【出願日】2022-02-16

(71)【出願人】

【識別番号】399035766

【氏名又は名称】エヌ・ティ・ティ・コミュニケーションズ株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】小山和輝

(72)【発明者】

【氏名】藤原大悟

(72)【発明者】

【氏名】切通恵介

(72)【発明者】

【氏名】大川内智海

(72)【発明者】

【氏名】泉谷知範

(57)【要約】

【課題】特徴量間の因果関係の分析結果に、既知の因果関係を適切に反映させること。
【解決手段】分析装置は、ニューラルネットワークの入力層のノードであって、複数の特徴量のそれぞれが入力される複数のノードのうち、結果のデータとの因果関係があらかじめ指定された特徴量が入力されるノードの重みに、因果関係に応じた固定値を設定する。また、分析装置は、ニューラルネットワークの出力が、結果のデータに近付くように、ニューラルネットワークに含まれるノードの重みのうち、固定値が設定されていない重みを更新する。分析装置は、入力層のノードの重みを基に、複数の特徴量と結果のデータとの間の因果関係を示す情報を生成する。
【選択図】図１

【特許請求の範囲】

【請求項1】

ニューラルネットワークの入力層のノードであって、複数の特徴量のそれぞれが入力される複数のノードのうち、結果のデータとの因果関係があらかじめ指定された特徴量が入力されるノードの重みに、前記因果関係に応じた固定値を設定する設定部と、
前記ニューラルネットワークの出力が、前記結果のデータに近付くように、前記ニューラルネットワークに含まれるノードの重みのうち、前記設定部によって固定値が設定されていない重みを更新する更新部と、
前記入力層のノードの重みを基に、前記複数の特徴量と前記結果のデータとの間の因果関係を示す情報を生成する生成部と、
を有することを特徴とする分析装置。

【請求項2】

前記設定部は、前記複数の特徴量のうち、前記結果のデータとの間に因果があることが指定された特徴量が入力されるノードの重みに固定値を設定し、前記複数の特徴量のうち、前記結果のデータとの間に因果がないことが指定された特徴量が入力されるノードの重みに０を設定し、
前記更新部は、前記ニューラルネットワークのノードの重みのうち、前記設定部によって固定値が設定されていない重みを、前記固定値と０の間の範囲に含まれる値に更新することを特徴とする請求項１に記載の分析装置。

【請求項3】

前記設定部は、前記複数の特徴量のそれぞれが前記結果のデータとして対応付けられた複数のニューラルネットワークのそれぞれについて、入力層のノードであって、複数の特徴量のそれぞれが入力される複数のノードのうち、対応付けられた前記結果のデータとの因果関係があらかじめ指定された特徴量が入力されるノードの重みに、前記因果関係に応じた固定値を設定し、
前記更新部は、前記複数のニューラルネットワークの出力のそれぞれが、対応付けられた前記結果のデータに近付くように、前記ニューラルネットワークに含まれるノードの重みのうち、前記設定部によって固定値が設定されていない重みを更新することを特徴とする請求項１に記載の分析装置。

【請求項4】

分析装置によって実行される分析方法であって、
ニューラルネットワークの入力層のノードであって、複数の特徴量のそれぞれが入力される複数のノードのうち、結果のデータとの因果関係があらかじめ指定された特徴量が入力されるノードの重みに、前記因果関係に応じた固定値を設定する設定工程と、
前記ニューラルネットワークの出力が、前記結果のデータに近付くように、前記ニューラルネットワークに含まれるノードの重みのうち、前記設定工程によって固定値が設定されていない重みを更新する更新工程と、
前記入力層のノードの重みを基に、前記複数の特徴量と前記結果のデータとの間の因果関係を示す情報を生成する生成工程と、
含むことを特徴とする分析方法。

【請求項5】

コンピュータを、請求項１から３のいずれか１項に記載の分析装置として機能させるための分析プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、分析装置、分析方法及び分析プログラムに関する。

【背景技術】

【0002】

従来、人間の行動を機械学習モデルに学習させ、当該モデルを用いて人間又はロボット等に動作を教示する模倣学習という技術が知られている。

【0003】

例えば、化学プラントにおける模倣学習では、複数のセンサ値が特徴量として入力され、機器の操作に関する情報を出力する機械学習モデルが用いられる場合がある。

【0004】

さらに、特徴量間の因果関係を分析するための手法が提案されている。

【0005】

例えば、因果関係の表現として期待されるＤＡＧ（Directed Acyclic Graph：有向非巡回グラフ）を、数値計算により求めることができる手法が提案されている（例えば、非特許文献１を参照）。

【0006】

また、例えば、非特許文献１に記載の手法に、ニューラルネットワークの一種であるＭＬＰ（Multilayer perceptron：多層パーセプトロン）を組み合わせて、ＤＡＧによって非線形な因果関係を捉えられるようにする手法が提案されている（例えば、非特許文献２を参照）。

【先行技術文献】

【非特許文献】

【0007】

【非特許文献1】Zheng, Xun, et al. "DAGs with NO TEARS: Continuous Optimization for Structure Learning." Advances in Neural Information ProcessingSystems 31, 2018.

【非特許文献2】Zheng, Xun, et al. "Learning sparse nonparametric dags." International Conference on Artificial Intelligence and Statistics. PMLR, 2020.

【発明の概要】

【発明が解決しようとする課題】

【0008】

しかしながら、従来の因果関係の分析手法では、データ間の因果関係の分析結果に、既知の因果関係を適切に反映させることが困難な場合があるという問題がある。

【0009】

ここで、一部のデータ間の因果の有無が、事前知識としてユーザに知られている場合がある。なお、データは、例えば機械学習モデルに入力される特徴量である。

【0010】

一方で、従来の分析手法では、データ及びアルゴリズムによりデータ間の因果関係が一意に推定されるため、事前知識を分析結果に反映させることは難しい。

【課題を解決するための手段】

【0011】

上述した課題を解決し、目的を達成するために、分析装置は、ニューラルネットワークの入力層のノードであって、複数の特徴量のそれぞれが入力される複数のノードのうち、結果のデータとの因果関係があらかじめ指定された特徴量が入力されるノードの重みに、前記因果関係に応じた固定値を設定する設定部と、前記ニューラルネットワークの出力が、前記結果のデータに近付くように、前記ニューラルネットワークに含まれるノードの重みのうち、前記設定部によって固定値が設定されていない重みを更新する更新部と、前記入力層のノードの重みを基に、前記複数の特徴量と前記結果のデータとの間の因果関係を示す情報を生成する生成部と、を有することを特徴とする。

【発明の効果】

【0012】

本発明によれば、特徴量間の因果関係の分析結果に、既知の因果関係を適切に反映させることができる。

【図面の簡単な説明】

【0013】

【図1】図１は、プラント運用システムについて説明する図である。

【図2】図２は、第１の実施形態に係るサーバの構成例を示す図である。

【図3】図３は、特徴量情報の一例を示す図である。

【図4】図４は、モデルの構成例を示す図である。

【図5】図５は、データ間に因果がある場合の設定方法を説明する図である。

【図6】図６は、データ間に因果がない場合の設定方法を説明する図である。

【図7】図７は、データ間の因果が不明である場合の設定方法を説明する図である。

【図8】図８は、因果グラフの一例を示す図である。

【図9】図９は、第１の実施形態に係る分析処理の流れを示すフローチャートである。

【図10】図１０は、第１の実施形態に係る設定処理の流れを示すフローチャートである。

【図11】図１１は、分析プログラムを実行するコンピュータの構成例を示す図である。

【発明を実施するための形態】

【0014】

以下に、本願に係る分析装置、分析方法及び分析プログラムの実施形態を図面に基づいて詳細に説明する。なお、本発明は、以下に説明する実施形態により限定されるものではない。

【0015】

［第１の実施形態］
［第１の実施形態の構成］
まず、図１を用いて、プラント運用システムについて説明する。プラント運用システム１は、プラントにおける製品の生産工程の管理及び制御を行うためのシステムである。プラントには、化学製品を生産するための化学プラントが含まれる。

【0016】

図１に示すように、サーバ１０、端末装置２０及びプラントシステム３０を有する。

【0017】

また、サーバ１０、端末装置２０及びプラントシステム３０は、ネットワークＮを介して互いにデータ通信ができるように接続されている。例えば、ネットワークＮはインターネット又はイントラネットである。

【0018】

サーバ１０は、模倣学習に関する処理を行う。サーバ１０は、模倣学習のためのモデル（以下、模倣学習モデル）の学習処理及び当該模倣学習モデルを用いた推論処理を実行する。

【0019】

例えば、サーバ１０は、プラントシステム３０から各時刻のセンサ値及び対応する操作内容の履歴を取得する。センサ値及び操作内容は、それぞれ模倣学習モデルの説明変数及び目的変数に相当する。

【0020】

この場合、サーバ１０は、プラントシステム３０から取得したセンサ値及び操作内容を教師データとして用いて模倣学習モデルの学習処理を行う。

【0021】

また、サーバ１０は、プラントシステム３０から取得したセンサ値を学習済みの模倣学習モデルに入力し、推論処理を実行することで操作内容を得る。

【0022】

サーバ１０は、推論処理によって得られた操作内容をユーザに提供する。ユーザは、提供された操作内容に従ってプラントシステム３０の機器を操作することができる。

【0023】

例えば、ユーザは、操作により、機器内の温度、機器内の圧力、生産工程における生産量の目標値、機器に投入する原料の量等を設定する。

【0024】

端末装置２０は、パーソナルコンピュータ、タブレット型端末及びスマートフォン等の情報処理装置である。

【0025】

プラントシステム３０は、生産工程で使用される機器及び分散制御システム（ＤＣＳ：Distributed Control System）を含むものであってもよい。例えば、機器は、反応器、冷却器、気液分離器等である。

【0026】

さらに、サーバ１０は、模倣学習モデルの変数間の因果関係を分析する因果分析処理を行う。サーバ１０は、分析装置の一例である。図１を用いて、因果関係の分析に関する処理の流れを説明する。

【0027】

なお、模倣学習モデルの変数には、説明変数及び目的変数の両方が含まれる。また、以降の説明では、模倣学習モデルの変数を、特徴量又は単にデータと呼ぶ場合がある。

【0028】

まず、図１に示すように、サーバ１０は、プラントシステム３０から取得したデータを蓄積する（ステップＳ１）。例えば、サーバ１０は、時刻ごとの温度、濃度、圧力、流量といったセンサ値を取得し蓄積する。

【0029】

次に、サーバ１０は、ユーザから特徴量間の因果関係に関する事前知識を取得する（ステップＳ２）。

【0030】

例えば、事前知識は、例えばユーザが因果があると考えている特徴量の組及び因果の方向のリスト、又はユーザが因果がないと考えている特徴量の組のリストとしてサーバ１０に与えらる。

【0031】

端末装置２０は、分析者の操作に応じて、サーバ１０に因果分析処理の実行を指示する（ステップＳ３）。また、端末装置２０は、サーバ１０から因果分析結果を取得する。

【0032】

サーバ１０は、事前知識に基づき特徴量間の因果関係の追加及び削除を行った上で、アルゴリズムに従って因果関係を計算する。例えば、サーバ１０は、計算した因果関係を基に生成したＤＡＧ（Directed Acyclic Graph）を、因果分析結果として出力する。

【0033】

図２を用いて、サーバ１０について詳細に説明する。図２は、第１の実施形態に係るサーバの構成例を示す図である。

【0034】

ここでは、サーバ１０が因果分析処理を行う場合の構成を説明する。サーバ１０が学習処理及び推論処理を行う場合の構成については説明を省略する。

【0035】

図２に示すように、サーバ１０は、通信部１１、記憶部１２及び制御部１３を有する。

【0036】

通信部１１は、ネットワークを介して、他の装置との間でデータ通信を行う。例えば、通信部１１はＮＩＣ（Network Interface Card）である。

【0037】

記憶部１２は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、光ディスク等の記憶装置である。なお、記憶部１２は、ＲＡＭ（Random Access Memory）、フラッシュメモリ、ＮＶＳＲＡＭ（Non Volatile Static Random Access Memory）等のデータを書き換え可能な半導体メモリであってもよい。

【0038】

記憶部１２は、サーバ１０で実行されるＯＳ（Operating System）や各種プログラムを記憶する。記憶部１２は、履歴ＤＢ１２１及びモデル情報１２２を記憶する。

【0039】

履歴ＤＢ１２１は、プラントシステム３０から提供された履歴を含む情報である。図３は、履歴ＤＢの例を示す図である。

【0040】

図３に示すように、履歴ＤＢ１２１は、時刻、温度、濃度、圧力、流量及び設定値を含む。

【0041】

温度、濃度、圧力及び流量は、模倣学習モデルの説明変数に相当する。また、設定値は、模倣学習モデルの目的変数に相当する。なお、因果関係の分析対象である特徴量には、説明変数及び目的変数のいずれが含まれていてもよい。

【0042】

また、例えば、温度、濃度、圧力及び流量は、プラントシステム３０の各所に設置されたセンサのセンサ値である。なお、時刻は、温度、濃度、圧力及び流量が取得された時刻を示すタイムスタンプである。

【0043】

設定値は、端末装置２０からの操作によって設定される値である。設定値は、実際に設定された値を正規化した値であってもよい。設定値は機器の操作内容を特定するための値である。

【0044】

例えば、図３には、時刻「2021/11/5 13:30:01」における温度が「４０℃」であり、濃度が３．５％であり、圧力が「５０１ｈＰａ」であり、流量が「１２ｍ^３／ｓ」であり、設定値が「０．２」であることが示されている。

【0045】

モデル情報１２２は、因果分析のためのモデルを構築するためのパラメータ等の情報である。例えば、モデルがニューラルネットワークである場合、モデル情報１２２は、各層の重み及びバイアスである。

【0046】

制御部１３は、サーバ１０全体を制御する。制御部１３は、例えば、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＧＰＵ（Graphics Processing Unit）等の電子回路や、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）等の集積回路である。

【0047】

また、制御部１３は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、内部メモリを用いて各処理を実行する。また、制御部１３は、各種のプログラムが動作することにより各種の処理部として機能する。例えば、制御部１３は、設定部１３１、計算部１３２、更新部１３３及び生成部１３４を有する。

【0048】

ここで、実施形態における因果分析処理の概要、及び因果分析処理において用いられるモデルについて説明する。

【0049】

まず、非特許文献１には、ＤＡＧによりデータ間の因果関係を表現することが記載されている。

【0050】

また、非特許文献２には、ＤＡＧにより因果関係を表現する際の問題設定（（１）式）を、ニューラルネットワークの一種である多層パーセプトロンを使った問題設定（（２）式）に緩和することが記載されている。

【0051】

【数1】

【0052】

【数2】

【0053】

ただし、分析対象のデータをｘ_ｊ（１，…，ｄ）とする。また、Ｘはデータｘ_１，…，ｘ_ｄの集合である。ｘ_ｊ（１，…，ｄ）を要素数がｎ個のベクトルとすると、Ｘはｎ×ｄの行列として表される。

【0054】

また、関数ｌはベクトル間のかい離度（例えば、最小二乗法における二乗和、又は負の対数尤度）を出力する。また、関数Ｌは誤差関数である。また、関数ＧはＤＡＧを表す関数である。

【0055】

（２）式では、データｘ_ｊ（１，…，ｄ）のそれぞれに対応したｄ個の多層パーセプトロンＭＬＰが用いられる。θ_ｊ（１，…，ｄ）は、各ＭＬＰのパラメータである。

【0056】

Ａ_ｊ ^（１）は、ｘ_ｊに対応する多層パーセプトロンの入力層（第１層）の重みである。λはハイパーパラメータとしてあらかじめ設定される定数である。すなわち、（２）式の第２項は、ＭＬＰの第１層の重みに関するＬ１制約を意味する。

【0057】

また、ｈ（Ｗ（θ））＝０は、ＤＡＧを誘導する等式制約であり、行列Ｗ（θ）がＤＡＧの表現となるように、必要な成分（例えば、対角成分）を全て０に縮退させる制約を意味する。なお、Ｗ（θ）は、所定のノード間の重みを表す隣接行列である。

【0058】

ここで、隣接行列Ｗ（θ）の（ｉ，ｊ）成分は、データｘ_ｉからデータｘ_ｊへ（ｘ_ｉ→ｘ_ｊ）の因果を表現している。例えば、ｗ_４１は、データｘ_４からデータｘ_１への因果を表現している。

【0059】

特に、隣接行列Ｗ（θ）の（ｉ，ｊ）成分が０の場合、データｘ_ｉからデータｘ_ｊへの因果が存在しないことを意味する。逆に、隣接行列Ｗ（θ）の（ｉ，ｊ）成分が非０の場合、データｘ_ｉからデータｘ_ｊへの因果が存在することを意味する。

【0060】

制約ｈ（Ｗ（θ））は、ＭＬＰの学習が進んだ結果、隣接行列Ｗ（θ）に対応した因果グラフ（ネットワーク）が有向非巡回になるような制約ということができる。具体的には、制約ｈ（Ｗ（θ））は、隣接行列Ｗ（θ）が下三角行列又は上三角行列であって、かつ対角成分が０である行列になるような制約である。

【0061】

このとき、ＤＡＧの仮定より、各変数自身への因果（データｘ_ｉからデータｘ_ｉへの因果）は必ず存在しないので、隣接行列Ｗ（θ）の対角成分（ｉ＝ｊの場合のｗ_ｉｊ）の初期値には０が設定される。

【0062】

また、対角成分以外の成分（ｉ≠ｊの場合のｗ_ｉｊ）の初期値には任意の値が設定され、学習が進むに従って当該成分の一部は制約により０に縮退していく。

【0063】

実施形態において、サーバ１０は、事前知識としてユーザ等によりあらかじめ指定された因果関係を、（２）式の問題設定に反映させる。

【0064】

モデル情報１２２には、（２）式の問題設定に従って因果分析処理を行うためのモデルの情報が含まれる。なお、ここではｄ＝４の場合、すなわちデータがｘ_１、ｘ_２、ｘ_３、ｘ_４の場合の例を説明する。

【0065】

データｘ_１、ｘ_２、ｘ_３、ｘ_４は、履歴ＤＢに記憶される各変数であってもよい。また、データｘ_１、ｘ_２、ｘ_３、ｘ_４は、特徴量ということができる。

【0066】

サーバ１０は、モデル情報１２２を基に、図４に示すようなモデルを構築する。図４は、モデルの構成例を示す図である。

【0067】

図４に示すように、モデルには、ＭＬＰ５１、ＭＬＰ５２、ＭＬＰ５３、ＭＬＰ５４が含まれる。

【0068】

各ＭＬＰは、入力層の各変数を原因とし、出力層で指定される変数を結果とする因果分析に対応する。ＭＬＰ５１、ＭＬＰ５２、ＭＬＰ５３、ＭＬＰ５４は、それぞれデータｘ_１、ｘ_２、ｘ_３、ｘ_４を結果とする因果分析に対応付けられている。

【0069】

例えば、ＭＬＰ５１には、データｘ_２、ｘ_３、ｘ_４が入力される。そして、ＭＬＰ５１は、出力層から出力される値が結果であるデータｘ_１に近付くように最適化される。

【0070】

なお、図４ではＭＬＰの入力層にデータｘ_１に対応するノードが配置されているが、当該ノードは説明のためのものであり、実際には存在しないか、又は重み０として扱われる。

【0071】

ＭＬＰ５１と同様に、ＭＬＰ５２、ＭＬＰ５３、ＭＬＰ５４についても、対応付けられたデータに応じて同様の構成を有する。

【0072】

例えば、ＭＬＰ５２には、データｘ_１、ｘ_３、ｘ_４が入力される。そして、ＭＬＰ５２は、出力層から出力される値がｘ_２に近付くように最適化される。

【0073】

例えば、ＭＬＰ５３には、データｘ_１、ｘ_２、ｘ_４が入力される。そして、ＭＬＰ５３は、出力層から出力される値がｘ_３に近付くように最適化される。

【0074】

例えば、ＭＬＰ５４には、データｘ_１、ｘ_２、ｘ_３が入力される。そして、ＭＬＰ５４は、出力層から出力される値がｘ_４に近付くように最適化される。

【0075】

制御部１３の各部は、図４に示したモデルを用いて、データｘ_１、ｘ_２、ｘ_３、ｘ_４の間の因果関係を分析する処理を行う。

【0076】

設定部１３１は、ニューラルネットワークの入力層のノードであって、複数の特徴量のそれぞれが入力される複数のノードのうち、結果のデータとの因果関係があらかじめ指定された特徴量が入力されるノードの重みに、因果関係に応じた固定値を設定する。

【0077】

すなわち、設定部１３１は、ＭＬＰ５１、ＭＬＰ５２、ＭＬＰ５３、ＭＬＰ５４の入力層のノードから隠れ層の各ノードへの重みに、ユーザの事前知識に基づき固定値を設定する。

【0078】

各ＭＬＰは、ニューラルネットワークの一例である。また、データｘ_１、ｘ_２、ｘ_３、ｘ_４は、特徴量でもあり、結果のデータでもある。例えば、ＭＬＰ５２においては、データｘ_１、ｘ_３、ｘ_４が特徴量であり、データｘ_２が結果のデータである。

【0079】

図５は、データ間に因果がある場合の設定方法を説明する図である。ここでは、データｘ_３からデータｘ_２への因果があることが指定されているものとする。

【0080】

この場合、設定部１３１は、ＭＬＰ５２の入力層の、データｘ_３が入力される入力層のノードから隠れ層の各ノードへの重みを１／√ｍ_１に設定する。ただし、ｍ_１は入力層と接続される隠れ層のノード数である。

【0081】

図５の例では、入力層と接続される隠れ層のノード数は５である。この場合、設定部１３１は、［Ａ_２ ^（１）］_．，３＝１／√５のように設定を行う。

【0082】

ここで、［Ａ_ｊ ^（１）］_ｋ，ｉは、データｘ_ｊを結果とする因果分析に対応付けらたＭＬＰの１番目の層（入力層）の第ｉノードから２番目の層（隠れ層の第１層）の第ｋノードへの重みである。

【0083】

言い換えると、［Ａ_ｊ ^（１）］_ｋ，ｉは、データｘ_ｊを結果とする因果分析に対応付けらたＭＬＰの、入力層の第ｉノードから隠れ層の第１層の第ｋノードへの重みであるａ_{ｉ，ｋ，ｊ} ^（１）を要素として持つ３次元配列である。

【0084】

また、「．」は任意の値を意味する。このため、［Ａ_ｊ ^（１）］_．，ｉは、データｘ_ｊを結果とする因果分析に対応付けらたＭＬＰの１番目の層（入力層）の第ｉノードから２番目の層（隠れ層の第１層）の任意のノードへの重みである。

【0085】

このように、設定部１３１は、複数の特徴量のうち、結果のデータとの間に因果があることが指定された特徴量が入力されるノードの重みに固定値を設定する。１／√ｍ_１は固定値の一例である。

【0086】

図６は、データ間に因果がない場合の設定方法を説明する図である。ここでは、データｘ_３からデータｘ_２に対して因果がないことが指定されているものとする。

【0087】

この場合、設定部１３１は、ＭＬＰ５２の入力層の、データｘ_３が入力される入力層のノードから隠れ層の各ノードへの重みを０に設定する。

【0088】

図６の例では、設定部１３１は、［Ａ_２ ^（１）］_．，３＝０のように設定を行う。なお、重みを０に設定することは、ノード間の接続を削除することを意味する。

【0089】

このように、設定部１３１は、複数の特徴量のうち、結果のデータとの間に因果がないことが指定された特徴量が入力されるノードの重みに０を設定する。

【0090】

図７は、データ間の因果が不明である場合の設定方法を説明する図である。ここでは、データｘ_３からデータｘ_２への因果関係が指定されていないものとする。

【0091】

この場合、設定部１３１は、ＭＬＰ５２の入力層の、データｘ_３が入力される入力層のノードから隠れ層の各ノードへの重みに固定値を設定しない。

【0092】

その際、後述する更新部１３３による処理において、当該ノードの重みは［Ａ_２ ^（１）］_．，３∈［０，１／√５］の範囲で更新される。

【0093】

設定部１３１は、ＭＬＰ５１、ＭＬＰ５３、ＭＬＰ５４についても、図５、６、７で説明した方法により固定値の設定を行う。

【0094】

すなわち、設定部１３１は、複数の特徴量のそれぞれが結果のデータとして対応付けられた複数のニューラルネットワークのそれぞれについて、入力層のノードであって、複数の特徴量のそれぞれが入力される複数のノードのうち、対応付けられた結果のデータとの因果関係があらかじめ指定された特徴量が入力されるノードの重みに、因果関係に応じた固定値を設定する。

【0095】

計算部１３２は、ＭＬＰの計算を行う。すなわち、計算部１３２は、ＭＬＰ（Ｘ，θ_１）、ＭＬＰ（Ｘ，θ_２）、ＭＬＰ（Ｘ，θ_３）、ＭＬＰ（Ｘ，θ_４）を計算する。

【0096】

更新部１３３は各ＭＬＰの学習処理を行う。すなわち、更新部１３３は、計算部１３２による計算結果を基に、各ＭＬＰのパラメータを更新する。例えば、更新部１３３は、誤差逆伝播法によりパラメータを更新する。

【0097】

更新部１３３は、（２）式に示す誤差関数を最小化する。特にデータｘ_１、ｘ_２、ｘ_３、ｘ_４を対象とする場合、（２）式の誤差関数の第１項は、（３）式のＬ´のように表される。

【0098】

【数3】

【0099】

更新部１３３は、固定値が設定された重みは更新しない。つまり、更新部１３３は、ニューラルネットワークの出力が、結果のデータに近付くように、ニューラルネットワークに含まれるノードの重みのうち、設定部１３１によって固定値が設定されていない重みを更新する。

【0100】

固定値が設定されている場合、更新部１３３は、ニューラルネットワークのノードの重みのうち、設定部１３１によって固定値が設定されていない重みを、固定値と０の間の範囲に含まれる値に更新する。

【0101】

更新部１３３は、（３）式に示すように、ＭＬＰ５１、ＭＬＰ５２、ＭＬＰ５３、ＭＬＰ５４を、１つの誤差関数で同時に最適化することができる。

【0102】

すなわち、更新部１３３は、複数のニューラルネットワークの出力のそれぞれが、対応付けられた結果のデータに近付くように、ニューラルネットワークに含まれるノードの重みのうち、設定部１３１によって固定値が設定されていない重みを更新する。

【0103】

生成部１３４は、入力層のノードの重みを基に、複数の特徴量と結果のデータとの間の因果関係を示す情報を生成する。

【0104】

さらに、生成部１３４は、データ間の因果関係を表す隣接行列、又は隣接行列に基づくＤＡＧを生成する。

【0105】

生成部１３４は、例えば（４）式のように各ノード間の重みの隣接行列Ｗ（θ）を生成する。

【0106】

【数4】

【0107】

隣接行列Ｗ（θ）のｗ_ｉｊは、データｘ_ｊを結果とする因果分析に対応付けらたＭＬＰの、入力層の第ｉノードから隠れ層の第１層の各ノードへの重みのＬ２ノルムである。ｉ＝ｊの場合、ｗ_ｉｊ＝０である。

【0108】

例えば、ｗ_４１は、（５）式のように表される。また、例えば、ｗ_２４は、（６）式のように表される。

【0109】

【数5】

【0110】

【数6】

【0111】

前述の通り、ａ_{ｉ，ｋ，ｊ} ^（１）は、データｘ_ｊを結果とする因果分析に対応付けらたＭＬＰの、入力層の第ｉノードから隠れ層の第１層の第ｋノードへの重みである。

【0112】

なお、図５で説明したように、隠れ層の第１層のノードの数がｍ_１であり、各ノードの重みが１／√ｍ_１と設定された場合、ｗ_ｉｊ＝１となる。

【0113】

また、図６で説明したように、隠れ層の第１層のノードの数がｍ_１であり、各ノードの重みが０と設定された場合、ｗ_ｉｊ＝０となる。

【0114】

また、図７で説明したように、隠れ層の第１層のノードの数がｍ_１であり、各ノードの重みの範囲が［０，１／√ｍ_１］と設定された場合、ｗ_ｉｊの範囲は［０，１］となる。

【0115】

さらに、生成部１３４は、隣接行列Ｗ（θ）を基にＤＡＧを生成し、描画してもよい。生成部１３４によって生成されるＤＡＧを因果グラフと呼ぶ。図８は、因果グラフの一例を示す図である。

【0116】

また、描画された因果グラフにおいて、データ間の因果の強さ（隣接行列の要素の値の大きさ）は、ノード間のエッジの太さにより表現される。また、データ間に因果が存在しない場合（隣接行列の要素の値が０の場合）、ノード間のエッジは描画されない。

【0117】

［第１の実施形態の処理の流れ］
図９を用いて、サーバ１０による分析処理の流れを説明する。図９は、第１の実施形態に係る分析処理の流れを示すフローチャートである。

【0118】

図９に示すように、サーバ１０は、データｘ_ｊごとに多層パーセプトロンＭＬＰ（Ｘ；θ_ｊ）（ｊ＝１，…，ｄ）を定義する（ステップＳ１０１）。
入力層のノード数：ｍ_０（ｍ_０＝ｄ）
隠れ層の第１層のノード数：ｍ_１
出力層のノード数：１
入力：Ｘ＝（ｘ１，…，ｘ_ｄ）（ただし、入力層の第ｉノードにはデータｘ_ｉを入力）

【0119】

例えば、図４には、隠れ層が２層であり、隠れ層の第１層及び第２層のノードがそれぞれ５個であるＭＬＰが示されている。一方で、ＭＬＰの構成は図４に示すものに限られない。ＭＬＰの隠れ層の層の数、及び、隠れ層の各層のノードの数は１以上の任意の数であればよい。

【0120】

次に、サーバ１０は、指定された因果関係に応じて、各ＭＬＰの入力層から隠れ層への重みを設定する（ステップＳ１０２）。

【0121】

続いて、サーバ１０は、ＤＡＧを誘導する制約の元、ＭＬＰ（Ｘ；θ_ｊ）の出力がｘ_ｊに近付くように同時最適化を行う（ステップＳ１０３）。

【0122】

そして、サーバ１０は、各ＭＬＰの入力層から隠れ層の第１層への重みを基に隣接行列を生成する（ステップＳ１０４）。

【0123】

サーバ１０は、生成した隣接行列、又は隣接行列に基づくＤＡＧを出力する（ステップＳ１０５）。

【0124】

図１０は、第１の実施形態に係る設定処理の流れを示すフローチャートである。図１０の処理は、図９のステップＳ１０２の処理に相当する。

【0125】

図１０に示すように、まず、サーバ１０は、ｊに１を代入し（ステップＳ２０１）、ＭＬＰ（Ｘ；θ_ｊ）の設定を開始する（ステップＳ２０２）。

【0126】

ここで、サーバ１０は、ｉに１を代入する（ステップＳ２０３）。

【0127】

サーバ１０は、データｘ_ｉからデータｘ_ｊへの指定された因果関係を確認する（ステップＳ２０４）。

【0128】

データｘ_ｉからデータｘ_ｊへの因果関係に「因果あり」が指定されている場合（ステップＳ２０４、因果あり）、サーバ１０は、入力層の第ｉノードから隠れ層の第１層への重みを１／√ｍ_１（固定値）に設定する（ステップＳ２０５）。

【0129】

また、データｘ_ｉからデータｘ_ｊへの因果関係に「因果なし」が指定されている場合（ステップＳ２０４、因果なし）、サーバ１０は、入力層の第ｉノードから隠れ層の第１層への重みを０（固定値）に設定する（ステップＳ２０６）。

【0130】

なお、サーバ１０は、ｉ＝ｊの場合、因果関係が「因果なし」である場合と同様の処理を行う。

【0131】

また、データｘ_ｉからデータｘ_ｊへの因果関係が指定されていない場合（ステップＳ２０４、因果不明）、サーバ１０は、入力層の第ｉノードから隠れ層の第１層への重みを［０，１／√ｍ_１］の変動値に設定する（ステップＳ２０７）。

【0132】

続いて、サーバ１０は、ｉを１だけ増加させる（ステップＳ２０８）。

【0133】

ここで、ｉ＝ｄでない場合（ステップＳ２０９、Ｎｏ）、サーバ１０はステップＳ２０４へ戻り処理を繰り返す。

【0134】

一方、ｉ＝ｄである場合（ステップＳ２０９、Ｙｅｓ）、サーバ１０はＭＬＰ（Ｘ；θ_ｊ）の設定を終了する（ステップＳ２１０）。

【0135】

そして、サーバ１０は、ｊを１だけ増加させる（ステップＳ２１１）。

【0136】

ここで、ｊ＝ｄでない場合（ステップＳ２１２、Ｎｏ）、サーバ１０はステップＳ２０２へ戻り処理を繰り返す。

【0137】

一方、ｊ＝ｄである場合（ステップＳ２１２、Ｙｅｓ）、サーバ１０は設定処理を終了する。

【0138】

［第１の実施形態の効果］
これまで説明してきたように、設定部１３１は、ニューラルネットワークの入力層のノードであって、複数の特徴量のそれぞれが入力される複数のノードのうち、結果のデータとの因果関係があらかじめ指定された特徴量が入力されるノードの重みに、因果関係に応じた固定値を設定する。更新部１３３は、ニューラルネットワークの出力が、結果のデータに近付くように、ニューラルネットワークに含まれるノードの重みのうち、設定部１３１によって固定値が設定されていない重みを更新する。生成部１３４は、入力層のノードの重みを基に、複数の特徴量と結果のデータとの間の因果関係を示す情報を生成する。

【0139】

このように、サーバ１０は、因果関係が指定されたデータに対応するニューラルネットワークの重みに固定値を設定した上で、固定値が設定されていない重みの更新し、更新した重みを基にデータ間の因果関係を得ることができる。

【0140】

なお、指定される因果関係は、ユーザの現場における知見、長年蓄積されたノウハウに基づくものであってもよいし、理論保証がされたものであってもよい。

【0141】

その結果、実施形態によれば、特徴量間の因果関係の分析結果に、既知の因果関係を適切に反映させることができる。

【0142】

一般的に、因果分析の推定結果の真偽又は妥当性を検証する方法は十分に確立されておらず、統計的信頼性を担保することが難しい場合がある。一方、実施形態では、事前知識（指定された因果関係）を真とみなして因果分析を行うことにより、少なくとも事前知識の分だけ因果分析における統計的信頼性を高めることが可能になる。

【0143】

また、入力層の重みに固定値が設定された場合であっても、中間層以降の層で因果の強さ及びモデルの妥当性が調整されると考えられる。これにより、固定値が設定されなかった重みは、アルゴリズムに従って矛盾がないように更新されることになる。

【0144】

実施形態によれば、ＭＬＰを非特許文献２に記載の非線形なＳＥＭ（Structural equation model）の近似と捉えることができ、介入効果推定等の分析に応用できる（参考文献：「時系列データに対する予測モデルの介入効果の推定」（https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_1J4GS204/_pdf/-char/ja））。

【0145】

また、指定された事前知識が正しい場合、モデルを真の局所解に高速かつ高精度に誘導することができる。

【0146】

さらに、因果関係の分析結果を基に、模倣学習モデルの変数の再検討が可能になる。このため、実施形態は、模倣学習モデルの性能の向上という効果を生じさせる。

【0147】

［システム構成等］
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散及び統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散又は統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、ＣＰＵ（Central Processing Unit）及び当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。なお、プログラムは、ＣＰＵだけでなく、ＧＰＵ等の他のプロセッサによって実行されてもよい。

【0148】

また、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

【0149】

［プログラム］
一実施形態として、サーバ１０は、パッケージソフトウェアやオンラインソフトウェアとして上記の分析処理を実行する分析プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の分析プログラムを情報処理装置に実行させることにより、情報処理装置をサーバ１０として機能させることができる。ここで言う情報処理装置には、デスクトップ型又はノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置には、タブレット型端末、スマートフォン、携帯電話機やＰＨＳ（Personal Handyphone System）等の移動体通信端末、さらには、ＰＤＡ（Personal Digital Assistant）等のスレート端末等がその範疇に含まれる。

【0150】

また、サーバ１０は、ユーザが使用する端末装置をクライアントとし、当該クライアントに上記の分析処理に関するサービスを提供するサーバとして実装することもできる。例えば、サーバは、要求点の指定を入力とし、分析結果（例えば、隣接行列）を出力とする分析サービスを提供するサーバ装置として実装される。この場合、サーバは、Ｗｅｂサーバとして実装することとしてもよいし、アウトソーシングによって上記の分析処理に関するサービスを提供するクラウドとして実装することとしてもかまわない。

【0151】

図１１は、分析プログラムを実行するコンピュータの構成例を示す図である。コンピュータ１０００は、例えば、メモリ１０１０、ＣＰＵ１０２０を有する。また、コンピュータ１０００は、ハードディスクドライブインタフェース１０３０、ディスクドライブインタフェース１０４０、シリアルポートインタフェース１０５０、ビデオアダプタ１０６０、ネットワークインタフェース１０７０を有する。これらの各部は、バス１０８０によって接続される。

【0152】

メモリ１０１０は、ＲＯＭ（Read Only Memory）１０１１及びＲＡＭ（Random Access Memory）１０１２を含む。ＲＯＭ１０１１は、例えば、ＢＩＯＳ（Basic Input Output System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、例えばディスプレイ１１３０に接続される。

【0153】

ハードディスクドライブ１０９０は、例えば、ＯＳ１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、サーバ１０の各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール１０９３として実装される。プログラムモジュール１０９３は、例えばハードディスクドライブ１０９０に記憶される。例えば、サーバ１０における機能構成と同様の処理を実行するためのプログラムモジュール１０９３が、ハードディスクドライブ１０９０に記憶される。なお、ハードディスクドライブ１０９０は、ＳＳＤ（Solid State Drive）により代替されてもよい。

【0154】

また、上述した実施形態の処理で用いられる設定データは、プログラムデータ１０９４として、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、ＣＰＵ１０２０は、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出して、上述した実施形態の処理を実行する。

【0155】

なお、プログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ１１００等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、プログラムモジュール１０９３及びプログラムデータ１０９４は、ネットワーク（ＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）等）を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール１０９３及びプログラムデータ１０９４は、他のコンピュータから、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

【符号の説明】

【0156】

１プラント運用システム
１０サーバ
１１通信部
１２記憶部
１３制御部
２０端末装置
３０プラントシステム
５１、５２、５３、５４ＭＬＰ
１２１履歴ＤＢ
１２２モデル情報
１３１設定部
１３２計算部
１３３更新部
１３４生成部

【図1】