(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023158668
(43)【公開日】2023-10-31
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理装置を備えたプラント
(51)【国際特許分類】
G06N 3/04 20230101AFI20231024BHJP
G05B 23/02 20060101ALI20231024BHJP
【FI】
G06N3/04
G05B23/02 Z
【審査請求】未請求
【請求項の数】3
【出願形態】OL
(21)【出願番号】P 2022068570
(22)【出願日】2022-04-19
(71)【出願人】
【識別番号】000006105
【氏名又は名称】株式会社明電舎
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】金剌 泰宏
(72)【発明者】
【氏名】吉田 健人
【テーマコード(参考)】
3C223
【Fターム(参考)】
3C223AA01
3C223BA01
3C223CC01
3C223DD01
3C223EB01
3C223FF03
3C223FF22
3C223FF26
3C223FF42
3C223GG01
3C223GG03
3C223HH03
(57)【要約】
【課題】ある入出力データから特性を学習したニューラルネットワークあるいは、ある対象を制御することを目的としたニューラルネットワークを有するシステムにおける制御対象、及びニューラルネットワークを含んだ系において、線形特性による解析を可能とする情報処理装置、情報処理方法、及び情報処理装置を備えたプラントを提供する。
【解決手段】データの入力を受け付ける入力ノード3と、前記入力ノード3に接続されて中間層5を構成する複数の中間ノード5a、5b、5cと、前記中間ノード5a、5b、5cの最終段に接続されて計算結果を出力する出力ノード7と、を備え、前記中間ノード5a、5b、5cの一部または全部の活性化関数がReLUで構成され、それら以外の前記中間ノードが線形関数で構成され、前記ReLUを有する前記中間ノード5a、5b、5cの活性化状態に基づいてパターン分類される。
【選択図】
図1
【特許請求の範囲】
【請求項1】
データの入力を受け付ける入力ノードと、
前記入力ノードに接続されて中間層を構成する複数の中間ノードと、
前記中間ノードの最終段に接続されて計算結果を出力する出力ノードと、を備え、
前記中間ノードの一部または全部の活性化関数がReLUで構成され、それら以外の前記中間ノードが線形関数で構成され、
前記ReLUを有する前記中間ノードの活性化状態に基づいてパターン分類される、情報処理装置。
【請求項2】
データの入力を受け付ける入力ノードと、
前記入力ノードに接続されて中間層を構成する複数の中間ノードと、
前記中間ノードの最終段に接続されて計算結果を出力する出力ノードと、を備えるニューラルネットワークを処理する情報処理方法であって、
前記中間ノードの一部または全部の活性化関数がReLUで構成され、それら以外の前記中間ノードが線形関数で構成され、
前記ReLUを有する前記中間ノードの活性化状態に基づいてパターン分類をする、情報処理方法。
【請求項3】
制御対象のプラント本体と、
請求項1に記載の情報処理装置を含む制御装置と、を備え、
前記プラント本体は、前記制御装置で制御される情報処理装置を備えたプラント。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及び情報処理装置を備えたプラントに関する。
【背景技術】
【0002】
近年、機器を制御するに際し、AI(Artificial Intelligence)を利用した方法が用いられてきている。AIにおける制御方法では、予め機械学習によって制御方策が調整された学習モデルが用いられる。機器の外部環境や状況等に対応する入力データを、この学習モデルによって演算し機器に対する制御信号を決定する。学習モデルの機械学習には、これまでに蓄積した外的環境や状況に対応する入力データに対し、その時行われた好適な制御データを教師データとして機械学習を行う教師有り学習や、出力された制御信号に対する報酬を計算する評価関数を設定し、その報酬に基づいて学習モデルを強化学習する方法等がある。この学習モデルには、人間の脳の働きをモデルにしてコンピューターに応用したニューラルネットワークが用いられる。
【0003】
非特許文献1で示すURL内に記載の通り、ニューラルネットワークは入力に対して重みとバイアスによる線形変換と活性化関数による非線形変換が行われる。つまりニューラルネットワークは基本的に非線形特性を持つ。対してパワーエレクトロニクス分野などでは、ある対象の応答特性や安定性の確認をするために周波数解析を実施するが、後の解析のためには、対象が線形である必要がある。そのため、ニューラルネットワークを用いて対象の特性獲得を目的とした学習を行うと、学習結果のモデルに対して周波数領域等での必要な解析ができないという問題がある。
【0004】
ただし、ニューラルネットワークの活性化関数に線形性を有するものを使用すれば線形なニューラルネットワークの構築は可能である。しかしながら、現実のプラント等では制御対象が非線形特性を持つ事が多く、非線形特性を含めて学習できるニューラルネットワークの利点が低下してしまうためこの方法は現実的ではない。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】Chainer Tutorial,“ニューラルネットワークの基礎”,[online],[令和4年4月8日検索],インターネット<URL:https://tutorials.chainer.org/ja/13_Basics_of_Neural_Networks.html>
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、上述した実情に鑑みてなされたものであり、本発明が解決しようとする課題は、ある入出力データから特性を学習したニューラルネットワークあるいは、ある対象を制御することを目的としたニューラルネットワークを有するシステムにおける制御対象、及びニューラルネットワークを含んだ系において、線形特性による解析を可能とする情報処理装置、情報処理方法、及び情報処理装置を備えたプラントを提供することである。
【課題を解決するための手段】
【0007】
本発明は、上記課題を解決するため、以下の手段を採用する。
すなわち、本発明の情報処理装置は、データの入力を受け付ける入力ノードと、前記入力ノードに接続されて中間層を構成する複数の中間ノードと、前記中間ノードの最終段に接続されて計算結果を出力する出力ノードと、を備え、前記中間ノードの一部または全部の活性化関数がReLUで構成され、それら以外の前記中間ノードが線形関数で構成され、前記ReLUを有する前記中間ノードの活性化状態に基づいてパターン分類される。
本発明の情報処理装置では、中間ノードの一部または全部の活性化関数がReLUで構成され、それら以外の前記中間ノードが線形関数で構成されるので、ReLU関数の活性化状態により動作パターンを分類することができ、線形的解析が容易となる。
【0008】
本発明の情報処理方法は、データの入力を受け付ける入力ノードと、前記入力ノードに接続されて中間層を構成する複数の中間ノードと、前記中間ノードの最終段に接続されて計算結果を出力する出力ノードと、を備えるニューラルネットワークを処理する情報処理方法であって、前記中間ノードの一部または全部の活性化関数がReLUで構成され、それら以外の前記中間ノードが線形関数で構成され、前記ReLUを有する前記中間ノードの活性化状態に基づいてパターン分類をする。
本発明の情報処理方法では、中間ノードの一部または全部の活性化関数がReLUで構成され、それら以外の前記中間ノードが線形関数で構成されるので、ReLU関数の活性化状態により動作パターンを分類することができ、線形的解析が容易となる。
【0009】
本発明の別の側面は、前述の情報処理装置を備えたプラントであって、制御対象のプラント本体と、前述の情報処理装置を含む制御装置と、を備え、前記プラント本体は、前記制御装置で制御される。
本発明の別の側面では、制御対象のプラント本体が前述の情報処理装置を含む制御装置で制御されるので、プラントの制御の解析が容易となる。
【発明の効果】
【0010】
本発明によれば、ある入出力データから特性を学習したニューラルネットワークあるいは、ある対象を制御することを目的としたニューラルネットワークを有するシステムにおける制御対象、及びニューラルネットワークを含んだ系において、線形特性による解析を可能とする情報処理装置、情報処理方法、及び情報処理装置を備えたプラントを提供することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の実施形態における、情報処理装置の構成を示すブロック図である。
【
図2】本発明の実施形態における、情報処理装置の機械学習システムの概略を示すブロック図である。
【
図3】本発明の実施形態における、学習対象の非線形特性を持つモデルのグラフである。
【
図4】本発明の実施形態における、活性化関数ReLUの入出力特性を表すグラフである。
【
図5】本発明の実施形態における、学習後の情報処理装置のReLU層の活性状態を表すブロック図である。
【
図6】本発明の実施形態における、学習後の情報処理装置のReLU層の活性状態を表すブロック図である。
【
図7】本発明の実施形態における、プラントのブロック図である。
【発明を実施するための形態】
【0012】
以下、添付図面を参照して、本発明の実施の形態について説明する。
(第1実施形態)
図1は、本実施形態における情報処理装置の構成を示すブロック図である。情報処理装置1は、データの入力を受け付ける入力ノード3と、前記入力ノード3に接続されて中間層5を構成する複数の中間ノード5a、5b、5cと、前記中間ノード5a、5b、5cの最終段に接続されて計算結果を出力する出力ノード7と、を備え、前記中間ノード5a、5b、5cの一部または全部の活性化関数がReLUで構成され、それら以外の前記中間ノードが線形関数で構成され、前記ReLUを有する前記中間ノード5a、5b、5cの活性化状態に基づいてパターン分類される。
【0013】
図1に示す情報処理装置1は、機械学習の対象となる学習モデルのニューラルネットワークを表している。
図2は、情報処理装置1の機械学習システム20の概略を示すブロック図である。機械学習システム20は、学習部21と、制御部23と、被制御部25と、を備えている。ここで被制御部25とは、制御対象のプラントやロボット、システム等である。学習部21と制御部23と、及び制御部23と被制御部25と、はそれぞれの間を双方向に通信可能とされている(実線矢印)。学習部21では、過去の実施データ等の学習データに基づいて情報処理装置(学習モデル)1が機械学習される。学習部21で機械学習された情報処理装置(学習モデル)1は、制御部23に送信される(破線矢印)。制御部23では、被制御部25の状態を受信し、機械学習済みの情報処理装置(学習モデル)1に基づいて制御信号を推論し、推論した制御信号に基づいて、被制御部25を制御する。これら、情報処理装置1、学習部21、制御部23は、例えばコンピューターのCPUやGPUにより実行されるソフトウェア、プログラムであってよい。
【0014】
図3は、本実施形態において学習の対象とするモデルの入出力特性のグラフである。次に、上記の情報処理装置1において、
図3に示す特性を学習する例について説明する。
図1に示すように、本実施形態の情報処理装置1は、入出力数が1、中間層が1層でノード数3のニューラルネットワークである。また学習方法としては、教師あり学習であり、具体的にはニューラルネットワーク出力と教師の平均二乗誤差の最小化を行う。
【0015】
図4は、本実施形態におる活性化関数ReLUの入出力特性を示すグラフである。
図4に示すように、活性化関数ReLUは、入力値が0以下であれば0を出力し、それ以外は入力値と同値を出力する特性を持ち、本実施形態では、ReLUを持つ層の各ノードの出力値を監視する機能を有しており、0を出力するノードの状態を不活性、それ以外を活性と呼称する。
【0016】
図5と
図6とは、機械学習後の情報処理装置1を示す図である。機械学習後のニューラルネットワークを分析すると、
図5、
図6に示す通り活性状態が入力値によって2つの活性パターンに分類され、その分類境界は入力値0となっている。すなわち、
図5に示すとおり、x<=0の範囲では、中間ノード5aが活性状態、中間ノード5b、5cが不活性状態となる。また、
図6に示す通り、x>0の範囲では、中間ノード5b、5cが活性状態、中間ノード5aが不活性状態となる。
図5、
図6では、不活性状態の中間ノードは、破線で示されている。
【0017】
この学習済みニューラルネットワークの活性ノードのみに着目し、活性化関数ReLを考慮しない線形変換のみの入出力関係式は、以下の様に表される。
【0018】
【0019】
ここで、w1、w2、w3は、各中間ノード5a、5b、5cのそれぞれの重み付けであり、b1、b2、b3は、同様に各中間ノード5a、5b、5cのそれぞれのバイアスである。上記式[数1]に本実施形態での学習済みのパラメータを代入した式は、以下の様に表される。
【0020】
【0021】
従って、上記式[数2]に示すように、教師となるモデルの非線形点で分割された各線形特性を獲得することができる。つまり非線形特性を持つモデルに対して、活性化関数ReLUを用いたニューラルネットワークで教師あり学習をしたとき、ReLUを有する層の活性/不活性のパターンによりモデルを非線形点で分解することができ、それぞれの線形特性を取得することが可能となる。ここで、中間層の数が複数になる場合においては、全ての中間層が活性化関数ReLUの層である必要はなく、一部の層がReLUを用い、他の層が単純に重み付けwとバイアスbを有するLinear(線形な活性化関数)である構成も可能である。
【0022】
以上述べたように、本実施形態では、情報処理装置(学習モデル)1が、その中間ノード5a、5b、5cの一部または全部の活性化関数がReLUで構成され、それら以外の中間ノードが線形関数で構成され、ReLUを有する中間ノードの活性化状態に基づいてパターン分類されるので、ある入出力データから特性を学習したニューラルネットワークにおいて、線形特性による解析が可能となる。また、本実施形態では、中間層が1層の場合について説明したが、これに限定されず、中間層が複数層で構成されてもよい。
【0023】
(第2実施形態)
図7は、本実施形態における、プラントのブロック図である。本実施形態におけるプラント9は、制御対象のプラント本体11と、第1実施形態に記載の情報処理装置1を含む制御装置13と、を備え、プラント本体11は、制御装置13で制御される。
【0024】
第1実施形態では、学習する対象に非線形性が含まれており、その特性を教師あり学習により獲得した。対して本実施形態では、非線形性を持つプラント本体11と、プラント本体11を制御することを目的とした全部または一部がニューラルネットワークで構成される制御装置13とを備えている。制御装置13は、その動作を目標とする動作指令値refとプラント11で観測できる情報detを入力としてプラント本体11への動作を指示する信号13aを出力するように構成されている。
【0025】
本実施形態では、プラント本体11の制御行動を獲得するために強化学習によりニューラルネットワークすなわち情報処理装置1の学習を実施することを特徴とする。強化学習アルゴリズムについては特に指定しない(例えばPPO(Proximal Policy Optimization)等)が、行動出力を行うニューラルネットワークについては第1実施形態と同様となる。学習後の行動出力を行うニューラルネットワークは第1実施形態と同様にReLU層の各ノードの活性パターンに分類され、そのパターン毎に活性ノードのみで線形変換を実施することで、制御対象を含めた線形解析が実施可能となる。
【0026】
以上述べたように、本実施形態では、第1実施形態に記載の情報処理装置1を含む制御装置13を備え、プラント本体11は、制御装置13で制御されるので、ある対象を制御することを目的としたニューラルネットワークを有するシステムにおける制御対象、及びニューラルネットワークを含んだ系において、線形特性による解析が可能となる。
【符号の説明】
【0027】
1 情報処理装置
3 入力ノード
5 中間層
5a、5b、5c 中間ノード
7 出力ノード
9 プラント
11 プラント本体
13 制御装置