(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023163616
(43)【公開日】2023-11-10
(54)【発明の名称】異常予測システム、方法及びコンピュータプログラム
(51)【国際特許分類】
G06N 3/02 20060101AFI20231102BHJP
【FI】
G06N3/02
【審査請求】有
【請求項の数】31
【出願形態】OL
(21)【出願番号】P 2022074629
(22)【出願日】2022-04-28
(71)【出願人】
【識別番号】519346516
【氏名又は名称】一般社団法人クラインシュタイン医工学パースペクティブ
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【弁理士】
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【弁理士】
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100147991
【弁理士】
【氏名又は名称】鳥居 健一
(74)【代理人】
【識別番号】100201743
【弁理士】
【氏名又は名称】井上 和真
(72)【発明者】
【氏名】木村 洋紀
(72)【発明者】
【氏名】金 成泰
(57)【要約】
【課題】複数の測定器で得られた複数のデータ時系列の間に不整合が生じている場合でも、複数のデータ時系列からニューラルネットワークを用いて異常事象の発生を高い精度で予測し得る異常予測システムを提供する。
【解決手段】異常予測システムは、複数の測定器で得られた複数のデータ時系列から、複数の測定パラメータと当該複数の測定パラメータにそれぞれ割り当てられた複数の相対時間値とを配列要素として含む多次元配列データを再構成するように構成されたデータ再構成系と、前記多次元配列データを受け付ける入力層、1つまたは複数の再帰型ニューラルネットワークを含む中間層構造、及び、出力層を有するニューラルネットワーク構造に基づく演算を実行することにより異常事象に関する予測情報を算出するように構成された推論処理部とを備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数の測定器で得られた複数のデータ時系列から少なくとも1つの異常事象の発生を予測する異常予測システムであって、
前記複数のデータ時系列から、複数の測定パラメータと当該複数の測定パラメータにそれぞれ割り当てられた複数の相対時間値とを配列要素として含む多次元配列データを再構成するように構成されたデータ再構成系と、
前記多次元配列データを受容する入力層、1つまたは複数の再帰型ニューラルネットワークを含む中間層構造、及び出力層を有するニューラルネットワーク構造に基づく演算を実行することにより、前記異常事象に関する予測情報を算出するように構成された推論演算部と
を備える異常予測システム。
【請求項2】
請求項1に記載の異常予測システムであって、前記予測情報は、前記異常事象の度合いを示すリスク度と、前記異常事象が発生するであろう予測時間との組を示す情報である、異常予測システム。
【請求項3】
請求項1に記載の異常予測システムであって、
前記データ再構成系は、
前記複数の測定器からそれぞれ供給された前記複数のデータ時系列を受け付けるデータ入力部と、
前記データ入力部を介して入力された前記複数のデータ時系列から前記多次元配列データを再構成するように構成されたデータ再構成部と
を含む、異常予測システム。
【請求項4】
請求項3に記載の異常予測システムであって、
前記データ再構成部は、前記複数のデータ時系列から複数のベクトル系列を前記多次元配列データとして生成するように構成され、
前記複数のベクトル系列の各々は、前記複数の測定パラメータの各々を指定するための次元と、前記複数の相対時間値の各々を指定するための次元とを有し、
前記複数の再帰型ニューラルネットワークは、前記入力層を介して入力された前記複数のベクトル系列をそれぞれ並列に処理するように構成されている、異常予測システム。
【請求項5】
請求項1に記載の異常予測システムであって、
前記データ再構成系は、
前記複数のデータ時系列からそれぞれ複数のベクトル系列を生成するように構成された複数の系列生成器と、
前記複数の系列生成器からそれぞれ供給された前記複数のベクトル系列を受け付けるデータ入力部と、
前記データ入力部を介して入力された前記複数のベクトル系列を統合することにより、前記入力層に入力されるべき前記多次元配列データを生成するように構成された統合部と
を含み、
前記複数の系列生成器の各系列生成器は、各々が少なくとも1つの測定パラメータと当該少なくとも1つの測定パラメータに割り当てられた相対時間値とをベクトル要素として有する複数のベクトルからなるベクトル系列を生成するように構成されており、
前記複数の再帰型ニューラルネットワークは、前記入力層を介して入力された前記複数のベクトル系列をそれぞれ並列に処理するように構成されている、異常予測システム。
【請求項6】
請求項4または5に記載の異常予測システムであって、
前記中間層構造は、
前記複数の再帰型ニューラルネットワークの出力を連結するように構成された連結層と、
前記連結層の出力を処理するように構成された順伝播型ニューラルネットワークと
を含む、異常予測システム。
【請求項7】
請求項6に記載の異常予測システムであって、
前記順伝播型ニューラルネットワークは、
前記連結層の出力を処理するように構成された第1のサブニューラルネットワークと、
前記第1のサブニューラルネットワークと並列に配置され、前記連結層の出力を処理するように構成された第2のサブニューラルネットワークと
を含み、
前記推論演算部は、前記第1のサブニューラルネットワークの出力に基づいて前記異常事象の度合いを示すリスク度を生成し、前記第2のサブニューラルネットワークの出力に基づいて前記異常事象が発生するであろう予測時間を生成するように構成されている、異常予測システム。
【請求項8】
請求項4または5に記載の異常予測システムであって、
前記複数の測定器のうちの少なくとも1つは、対象物体の状態を測定するように構成されており、
前記連結層は、前記入力層を介して入力された前記対象物体の属性情報と、前記複数の再帰型ニューラルネットワークの出力とを連結するように構成されている、異常予測システム。
【請求項9】
請求項3に記載の異常予測システムであって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された1つまたは複数の畳み込みニューラルネットワークと、
前記1つまたは複数の畳み込みニューラルネットワークの出力を処理するように構成された前記1つまたは複数の再帰型ニューラルネットワークと
を含む、異常予測システム。
【請求項10】
請求項9に記載の異常予測システムであって、前記多次元配列データは、3階のテンソルで構成されている、異常予測システム。
【請求項11】
請求項9に記載の異常予測システムであって、
前記中間層構造は、
前記再帰型ニューラルネットワークの出力を処理するように構成された第1のサブニューラルネットワークと、
前記第1のサブニューラルネットワークと並列に配置され、前記再帰型ニューラルネットワークの出力を処理するように構成された第2のサブニューラルネットワークと
をさらに含み、
前記推論演算部は、前記第1のサブニューラルネットワークの出力に基づいて前記異常事象の度合いを示すリスク度を生成し、前記第2のサブニューラルネットワークの出力に基づいて前記異常事象が発生するであろう予測時間を生成するように構成されている、異常予測システム。
【請求項12】
請求項9に記載の異常予測システムであって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された第1のサブ中間層構造と、
前記第1のサブ中間層構造と並列に配置され、前記入力層を介して入力された前記多次元配列データを処理するように構成された第2のサブ中間層構造と
を含み、
前記第1のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの少なくとも1つとして設けられた第1の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの1つとして設けられ、前記第1の畳み込みニューラルネットワークの出力を処理するように構成された第1の再帰型ニューラルネットワークと
を含み、
前記第2のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの別の少なくとも1つとして設けられた第2の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの別の1つとして設けられ、前記第2の畳み込みニューラルネットワークの出力を処理するように構成された第2の再帰型ニューラルネットワークと
を含み、
前記推論演算部は、前記第1のサブ中間層構造の出力に基づいて前記異常事象の度合いを示すリスク度を生成し、前記第2のサブ中間層構造の出力に基づいて前記異常事象が発生するであろう予測時間を生成するように構成されている、異常予測システム。
【請求項13】
請求項9に記載の異常予測システムであって、
前記複数の測定器のうちの少なくとも1つは、対象物体の状態を測定するように構成されており、
前記中間層構造は、前記1つまたは複数の再帰型ニューラルネットワークの出力と、前記入力層を介して入力された前記対象物体の属性情報とを連結するように構成された1つまたは複数の連結層をさらに含む、異常予測システム。
【請求項14】
請求項13に記載の異常予測システムであって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された第1のサブ中間層構造と、
前記第1のサブ中間層構造と並列に配置され、前記入力層を介して入力された前記多次元配列データを処理するように構成された第2のサブ中間層構造と
を含み、
前記第1のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの少なくとも1つとして設けられた第1の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの1つとして設けられ、前記第1の畳み込みニューラルネットワークの出力を処理するように構成された第1の再帰型ニューラルネットワークと、
前記複数の連結層のうちの1つとして設けられ、前記第1の再帰型ニューラルネットワークの出力と前記属性情報とを連結するように構成された第1の連結層と、
前記第1の連結層の出力を処理するように構成された第1の順伝播型ニューラルネットワークと
を含み、
前記第2のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの別の少なくとも1つとして設けられた第2の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの別の1つとして設けられ、前記第2の畳み込みニューラルネットワークの出力を処理するように構成された第2の再帰型ニューラルネットワークと、
前記複数の連結層のうちの別の1つとして設けられ、前記第2の再帰型ニューラルネットワークの出力と前記属性情報とを連結するように構成された第2の連結層と、
前記第2の連結層の出力を処理するように構成された第2の順伝播型ニューラルネットワークと
を含む、異常予測システム。
【請求項15】
請求項1~5,9~14のうちのいずれか1項に記載の異常予測システムであって、前記予測情報に応じて、前記複数の測定器のうちの少なくとも1つを含む機器の動作条件を変更する制御を行うフィードバック制御部をさらに備える異常予測システム。
【請求項16】
複数の測定器で得られた複数のデータ時系列から少なくとも1つの異常事象の発生を予測する方法であって、
前記複数のデータ時系列から、複数の測定パラメータと当該複数の測定パラメータにそれぞれ割り当てられた複数の相対時間値とを配列要素として含む多次元配列データを再構成するステップと、
前記多次元配列データを受容する入力層、1つまたは複数の再帰型ニューラルネットワークを含む中間層構造、及び出力層を有するニューラルネットワーク構造に基づく演算を実行することにより、前記異常事象に関する予測情報を算出するステップと
を備える方法。
【請求項17】
請求項16に記載の方法であって、前記予測情報は、前記異常事象の度合いを示すリスク度と、前記異常事象が発生するであろう予測時間との組を示す情報である、方法。
【請求項18】
請求項16に記載の方法であって、
前記多次元配列データを再構成する当該ステップは、前記複数のデータ時系列から複数のベクトル系列を前記多次元配列データとして生成するステップからなり、
前記複数のベクトル系列の各々は、前記複数の測定パラメータの各々を指定するための次元と、前記複数の相対時間値の各々を指定するための次元とを有し、
前記複数の再帰型ニューラルネットワークは、前記入力層を介して入力された前記複数のベクトル系列をそれぞれ並列に処理するように構成されている、方法。
【請求項19】
請求項16に記載の方法であって、
前記多次元配列データを再構成する当該ステップは、
前記複数のデータ時系列から複数のベクトル系列を生成するステップと、
前記複数のベクトル系列を統合することにより、前記入力層に入力されるべき前記多次元配列データを生成するステップと
を含み、
前記複数のベクトル系列の各ベクトル系列は、各々が少なくとも1つの測定パラメータと当該少なくとも1つの測定パラメータに割り当てられた相対時間値とをベクトル要素として有する複数のベクトルからなり、
前記複数の再帰型ニューラルネットワークは、前記入力層を介して入力された前記複数のベクトル系列をそれぞれ並列に処理するように構成されている、方法。
【請求項20】
請求項18または19に記載の方法であって、
前記中間層構造は、
前記複数の再帰型ニューラルネットワークの出力を連結するように構成された連結層と、
前記連結層の出力を処理するように構成された順伝播型ニューラルネットワークと
を含む、方法。
【請求項21】
請求項20に記載の方法であって、
前記順伝播型ニューラルネットワークは、
前記連結層の出力を処理するように構成された第1のサブニューラルネットワークと、
前記第1のサブニューラルネットワークと並列に配置され、前記連結層の出力を処理するように構成された第2のサブニューラルネットワークと
を含み、
前記予測情報を算出する当該ステップは、前記第1のサブニューラルネットワークの出力に基づいて前記異常事象の度合いを示すリスク度を生成するステップと、前記第2のサブニューラルネットワークの出力に基づいて前記異常事象が発生するであろう予測時間を生成するステップとを含む、方法。
【請求項22】
請求項18または19に記載の方法であって、
前記複数の測定器のうちの少なくとも1つは、対象物体の状態を測定するように構成されており、
前記連結層は、前記入力層を介して入力された前記対象物体の属性情報と、前記複数の再帰型ニューラルネットワークの出力とを連結するように構成されている、方法。
【請求項23】
請求項16に記載の方法であって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された1つまたは複数の畳み込みニューラルネットワークと、
前記1つまたは複数の畳み込みニューラルネットワークの出力を処理するように構成された前記1つまたは複数の再帰型ニューラルネットワークと
を含む、方法。
【請求項24】
請求項23に記載の方法であって、前記多次元配列データは、3階のテンソルで構成されている、方法。
【請求項25】
請求項23に記載の方法であって、
前記中間層構造は、
前記再帰型ニューラルネットワークの出力を処理するように構成された第1のサブニューラルネットワークと、
前記第1のサブニューラルネットワークと並列に配置され、前記再帰型ニューラルネットワークの出力を処理するように構成された第2のサブニューラルネットワークと
をさらに含み、
前記予測情報を算出する当該ステップは、前記第1のサブニューラルネットワークの出力に基づいて前記異常事象の度合いを示すリスク度を生成するステップと、前記第2のサブニューラルネットワークの出力に基づいて前記異常事象が発生するであろう予測時間を生成するステップとを含む、方法。
【請求項26】
請求項23に記載の方法であって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された第1のサブ中間層構造と、
前記第1のサブ中間層構造と並列に配置され、前記入力層を介して入力された前記多次元配列データを処理するように構成された第2のサブ中間層構造と
を含み、
前記第1のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの少なくとも1つとして設けられた第1の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの1つとして設けられ、前記第1の畳み込みニューラルネットワークの出力を処理するように構成された第2の再帰型ニューラルネットワークと
を含み、
前記第2のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの別の少なくとも1つとして設けられた第2の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの別の1つとして設けられ、前記第2の畳み込みニューラルネットワークの出力を処理するように構成された第2の再帰型ニューラルネットワークと
を含み、
前記予測情報を算出する当該ステップは、前記第1のサブ中間層構造の出力に基づいて前記異常事象の度合いを示すリスク度を生成するステップと、前記第2のサブ中間層構造の出力に基づいて前記異常事象が発生するであろう予測時間を生成するステップとを含む、方法。
【請求項27】
請求項23に記載の方法であって、
前記複数の測定器のうちの少なくとも1つは、対象物体の状態を測定するように構成されており、
前記中間層構造は、前記1つまたは複数の再帰型ニューラルネットワークの出力と、前記入力層を介して入力された前記対象物体の属性情報とを連結するように構成された1つまたは複数の連結層をさらに含む、方法。
【請求項28】
請求項27に記載の方法であって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された第1のサブ中間層構造と、
前記第1のサブ中間層構造と並列に配置され、前記入力層を介して入力された前記多次元配列データを処理するように構成された第2のサブ中間層構造と
を含み、
前記第1のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの少なくとも1つとして設けられた第1の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの1つとして設けられ、前記第1の畳み込みニューラルネットワークの出力を処理するように構成された第1の再帰型ニューラルネットワークと、
前記複数の連結層のうちの1つとして設けられ、前記第1の再帰型ニューラルネットワークの出力と前記属性情報とを連結するように構成された第1の連結層と、
前記第1の連結層の出力を処理するように構成された第1の順伝播型ニューラルネットワークと
を含み、
前記第2のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの別の少なくとも1つとして設けられた第2の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの別の1つとして設けられ、前記第2の畳み込みニューラルネットワークの出力を処理するように構成された第2の再帰型ニューラルネットワークと、
前記複数の連結層のうちの別の1つとして設けられ、前記第2の再帰型ニューラルネットワークの出力と前記属性情報とを連結するように構成された第2の連結層と、
前記第2の連結層の出力を処理するように構成された第2の順伝播型ニューラルネットワークと
を含む、方法。
【請求項29】
請求項16~19,23~28のうちのいずれか1項に記載の方法であって、前記予測情報に応じて、前記複数の測定器のうちの少なくとも1つを含む機器の動作条件を変更する制御を行うステップをさらに備える方法。
【請求項30】
不揮発性メモリから読み出されて単数または複数のプロセッサにより実行されるべきコンピュータプログラムであって、請求項16~19,23~28のうちのいずれか1項に記載の方法を前記単数または複数のプロセッサに実施させるように構成されているコンピュータプログラム。
【請求項31】
不揮発性メモリから読み出されて単数または複数のプロセッサにより実行されるべきコンピュータプログラムであって、請求項29に記載の方法を前記単数または複数のプロセッサに実施させるように構成されているコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、機械学習モデルを用いて異常事象の発生を予測する技術に関し、特に、複数の測定器でそれぞれ得られた複数のデータ時系列から、機械学習によるニューラルネットワークモデルを用いて異常事象の発生を予測する技術に関するものである。
【背景技術】
【0002】
近年、機械学習の手法を用いて、1つまたは複数のパラメータで構成される入力データを解析することで、1つまたは複数のパラメータに関する予測、分類もしくは最適化を行う技術が提供されている。たとえば、機械学習の手法には、従来より決定木(decision tree)及びサポートベクターマシン(Support Vector Machine,SVM)が使用されているところ、近年、脳内の神経細胞のネットワーク構造を模したニューラルネットワークモデル(Neural Network Model)も多用されている。ニューラルネットワークモデルは、人工ニューラルネットワーク(Artificial Neural Network,ANN)、あるいは、単にニューラルネットワークと呼ばれることもある。機械学習に使用されるニューラルネットワークの多くは、複数の処理層の組合せからなる階層型のニューラルネットワークである。一般に、階層型のニューラルネットワークは、入力データを受け付ける入力層と、入力層の出力データを処理する1つまたは複数の中間層と、中間層の出力データに基づいて最終的な処理結果を出力する出力層とで構成されている。
【0003】
たとえば、特許文献1(特表2021-527906号公報)には、複数の時系列のシステム状態を示すシグネチャ行列を生成し、生成されたシグネチャ行列から、複数の畳み込みニューラルネットワークと複数の長短期記憶ニューラルネットワーク(LSTMネットワーク:Long Short-Term Memory networks)との組合せを用いて異常事象の発生を予測することができる技術が開示されている(特許文献1の
図1~
図4及び段落[0015]~[0047]参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特表2021-527906号公報(国際公開第2020/046806号)
【発明の概要】
【発明が解決しようとする課題】
【0005】
ニューラルネットワークを用いて異常事象の発生を予測するときは、システムに関係する1つの測定器で得られた1つのデータ時系列から異常事象の発生を予測する場合よりも、システムに関係する複数の異なる測定器で得られた複数のデータ時系列から異常事象の発生を予測する場合の方が、高い予測精度が期待できるようにみえる。
【0006】
しかしながら、複数のデータ時系列の間で測定時間の不整合や次元の不整合が生じている場合には、前処理により当該複数のデータ時系列を統合してNNモデルに使用されるべき入力データが生成されたとしても、生成された入力データが不整合を有していると、予測精度が向上しないことがある。
【0007】
測定時間の不整合の例としては、第1の測定器の測定間隔が数秒間隔である(すなわち、第1の測定器が数秒ごとに測定量を与える)のに対し、第2の測定器の測定間隔が数分間隔である(すなわち、第2の測定器が数分ごとに測定量を与える)という場合がある。測定時間の不整合の別の例として、第1の測定器が等時間間隔で測定量を与えるのに対し、第2の測定器が不等時間間隔で測定量を与えるという場合もある。一方、次元の不整合の例としては、第1の測定器が2次元の測定量[x(t),y(t)]のデータ時系列を与えるのに対し、第2の測定器が1次元の測定量z(t)のデータ時系列を与えるという場合がある。ここで、x(t),y(t),z(t)の各々は測定値(すなわちスカラー量)であり、tは、離散的な測定時間を表す変数である。
【0008】
上記に鑑みて本開示の目的は、複数の測定器で得られた複数のデータ時系列の間に不整合が生じている場合でも、ニューラルネットワークを用いて異常事象の発生を高い精度で予測することができる異常予測システム、方法及びコンピュータプログラムを提供することにある。
【課題を解決するための手段】
【0009】
本開示の第1の態様による異常予測システムは、複数の測定器で得られた複数のデータ時系列から少なくとも1つの異常事象の発生を予測する異常予測システムであって、前記複数のデータ時系列から、複数の測定パラメータと当該複数の測定パラメータにそれぞれ割り当てられた複数の相対時間値とを配列要素として含む多次元配列データを再構成するように構成されたデータ再構成系と、前記多次元配列データを受容する入力層、1つまたは複数の再帰型ニューラルネットワークを含む中間層構造、及び出力層を有するニューラルネットワーク構造に基づく演算を実行することにより、前記異常事象に関する予測情報を算出するように構成された推論演算部とを備えたものである。
【0010】
本開示の第2の態様による方法は、複数の測定器で得られた複数のデータ時系列から少なくとも1つの異常事象の発生を予測する方法であって、前記複数のデータ時系列から、複数の測定パラメータと当該複数の測定パラメータにそれぞれ割り当てられた複数の相対時間値とを配列要素として含む多次元配列データを再構成するステップと、前記多次元配列データを受容する入力層、1つまたは複数の再帰型ニューラルネットワークを含む中間層構造、及び出力層を有するニューラルネットワーク構造に基づく演算を実行することにより、前記異常事象に関する予測情報を算出するステップとを備えたものである。
【0011】
本開示の第3の態様によるコンピュータプログラムは、不揮発性メモリから読み出されて単数または複数のプロセッサにより実行されるべきコンピュータプログラムであって、第2の態様による方法を前記単数または複数のプロセッサに実施させるように構成されているものである。
【発明の効果】
【0012】
本開示の第1ないし第3の態様によれば、複数の測定器で得られた複数のデータ時系列から、複数の測定パラメータと当該複数の測定パラメータにそれぞれ割り当てられた複数の相対時間値とを配列要素として含む多次元配列データが再構成され、当該多次元配列データを入力としてニューラルネットワーク構造に基づく演算が実行される。これにより、複数のデータ時系列の間に次元の不整合や測定時間の不整合が生じていたとしても、ニューラルネットワーク構造で不整合が補償され得る構成をもつ多次元配列データを生成すること、または、不整合をもたない多次元配列データを生成することが可能となる。ここで、ニューラルネットワーク構造で不整合が補償され得る構成とは、ニューラルネットワーク構造が不整合をもつ多次元配列データを受容しても当該多次元配列データを正常に処理することが可能となるように再構成された構成をいう。このような多次元配列データには、複数の測定パラメータのみならず、これら測定パラメータにそれぞれ割り当てられた(言い換えれば、刻印された)複数の相対時間値が時間情報として組み込まれているので、時間情報が正確に対応付けされた測定パラメータ群を入力としてニューラルネットワーク構造に基づく演算を実行することができる。これにより、予測情報を高い精度で算出することが可能となる。
【図面の簡単な説明】
【0013】
【
図1】本開示に係る一実施形態の異常予測システムの構成を概略的に示すブロック図である。
【
図2】複数のデータ時系列の間に測定時間の不整合が生じている状況の例を表す図である。
【
図3】複数のデータ時系列の間に次元の不整合が生じている状況の例を表す図である。
【
図4】ニューラルネットワーク構造を概略的に示すブロック図である。
【
図5】実施形態に係る異常予測装置を実現するための情報処理装置の概略構成図である。
【
図6】異常事象の発生を予測するための処理手順の例を概略的に表すフローチャートである。
【
図7】ニューラルネットワーク構造で不整合が補償され得る構成をもつ多次元配列データを例示する図である。
【
図8】ニューラルネットワーク構造で不整合が補償され得る構成をもつ多次元配列データを例示する図である。
【
図9】ニューラルネットワーク構造を例示する図である。
【
図10】ニューラルネットワーク構造を例示する図である。
【
図11】ニューラルネットワーク構造を例示する図である。
【
図12】実施例で実際に使用された7種類の測定パラメータと2次元の入力ベクトル系列との間の関係をテーブル形式で表す図である。
【
図14】実施例の結果をテーブル形式で示す図である。
【
図15】ニューラルネットワーク構造を例示する図である。
【
図16】ニューラルネットワーク構造における順伝播型ニューラルネットワークの一例を表す図である。
【
図17】
図17A及び
図17Bは、測定時間の不整合及び次元の不整合の両方をもたない多次元配列データを例示する図である。
【
図18】ニューラルネットワーク構造を例示する図である。
【
図19】畳み込み及び非線形変換の方法を説明するための図である。
【
図20】ニューラルネットワーク構造を例示する図である。
【
図21】ニューラルネットワーク構造を例示する図である。
【
図22】ニューラルネットワーク構造を例示する図である。
【
図23】ニューラルネットワーク構造を例示する図である。
【
図24】ニューラルネットワーク構造を例示する図である。
【
図25】本開示に係る一実施形態の異常予測システムの構成を概略的に示すブロック図である。
【
図26】ループ制御の処理手順の例を概略的に表すフローチャートである。
【
図27】本開示に係る一実施形態の異常予測システムの構成を概略的に示すブロック図である。
【
図28】異常事象の発生を予測するための処理手順の一例を概略的に示すフローチャートである。
【
図29】本開示に係る一実施形態の異常予測システムの構成を概略的に示すブロック図である。
【
図30】ループ制御の処理手順の一例を概略的に表すフローチャートである。
【発明を実施するための形態】
【0014】
以下、図面を参照しつつ、本開示に係る種々の実施形態について詳細に説明する。なお、図面全体において同一の参照符号を付された構成要素は、同一構成及び同一機能を有するものとする。
【0015】
図1は、本開示に係る一実施形態の異常予測システム1の構成を概略的に示すブロック図である。
図1に示されるように、異常予測システム1は、各々が対象物体Tgtの観測または処理を行うための複数台の機器E
0,…,E
K-1と、これら機器E
0,…,E
K-1からそれぞれ供給された複数のデータ時系列D
0,…,D
K-1に基づいて少なくとも1つの異常事象の発生を予測するように構成された異常予測装置10とを備えている。ここで、Kは、機器E
0~E
K-1の台数を表す3以上の正整数である。なお、機器E
0,…,E
K-1の台数は3以上に限定されるものではなく、2台の機器を備えるように異常予測システム1の構成が適宜変更されてもよい。
【0016】
機器E0,…,EK-1は、それぞれ測定器S0,…,SK-1を有する。各測定器Skは、当該各測定器Skを有する機器Ekの状態または対象物体Tgtの状態を物理的(たとえば、光学的、電気的または音響的)に測定し、その結果得た測定量Dk(t)の時系列からなるデータ時系列Dkを出力するように構成されたモニタリングデバイスである。ここで、インデックスkは、0~K-1の範囲内の任意の整数であり、英字tは、離散的な測定時間を表す変数である。測定量Dk(t)は、スカラー量またはベクトル量として供給され得る。データ時系列Dkは、たとえば、以下のように表現される。
【0017】
Dk=[Dk(t0),Dk(t1),Dk(t2),…]
ここで、t0,t1,t2,…は、日付及び時刻の組または時刻のみを示す測定時間である。測定時間の情報については、測定器Snで計測された測定時間tが測定量Dk(t)とともに異常予測装置10に転送されてもよいし、あるいは、異常予測装置10内のタイマー(図示せず)を用いて、転送されてきた各測定量Dk(t)に測定時間tが割り当てられてもよい。
【0018】
対象物体Tgtとしては、たとえば、人の生体、動植物の生体、または製造ライン上における未完成品または完成品が挙げられる。機器E0~EK-1は、たとえば、医療機器、製造機器またはモニタリング機器であればよい。測定器S0,…,SK-1は、機器E0~EK-1の状態を監視する機能、または、対象物体Tgtの状態を監視する機能を備えていればよい。機器Ekが、人工透析機器、放射線治療機器、人工心肺機器(たとえば、ECMO:Extracorporeal Membrane Oxygenation)または電子血圧計などの医療機器として構成されている場合には、機器Ek内の測定器Skは、当該機器Ekの内部の電流もしくは電圧の変化量、血液回路圧または透析液回路圧といった機器Ekの動作状態を示す測定量Dk(t)を生成したり、あるいは、脈拍数、血液酸素飽和度または血圧といった対象物体Tgtの生体状態(バイタルサインなど)を示す測定量Dk(t)を生成したりすることができる。生体状態を示す測定量Dk(t)として、対象物体Tgtである人の血液のアミノグラム(たとえば、41種のアミノ酸及び代謝関連物質の濃度)の測定値から構成された多次元ベクトル量が使用されてもよい。たとえば、血液のアミノグラムの41種の物質に関する測定値から41次元のベクトル量を測定量Dk(t)として構成することができる。
【0019】
なお、
図1に示したように、測定器S
0,S
1,…,S
K-1は、それぞれ機器E
0,E
1,…,E
K-1に組み込まれている。
図1の例では、1台の機器E
kが1つの測定器S
kを有しているが、これに限定されるものではない。1台の機器E
kが複数の測定器を有するように制御システム1の構成が適宜変更されてもよい。
【0020】
異常予測装置10は、伝送ケーブルなどの有線伝送路または無線伝送路を介して機器E0,…,EK-1と接続されている。機器E0,…,EK-1は、測定器S0,…,SK-1でそれぞれ得られたデータ時系列D0,…,DK-1を有線伝送路または無線伝送路を介して異常予測装置10に送信する機能を有し、異常予測装置10は、機器E0,…,EK-1からデータ時系列D0,…,DK-1を受信する機能を有している。
【0021】
図1に示されるように、異常予測装置10は、機器E
0,…,E
K-1からそれぞれ供給されたデータ時系列D
0,…,D
K-1から多次元配列データを再構成するように構成されたデータ再構成系20と、当該多次元配列データを入力とするニューラルネットワーク構造(以下「NN構造」という。)30に基づく演算を実行することにより異常事象に関する予測情報を算出するように構成された推論演算部27とを備えている。データ再構成系20は、データ時系列D
0,…,D
K-1を受け付けて一時的に記憶するデータ入力部23と、データ入力部23を介して入力されたデータ時系列D
0,…,D
K-1から多次元配列データを生成するように構成されたデータ再構成部25とを有する。推論演算部27は、算出された予測情報を外部装置(図示せず)に出力することができる。
【0022】
データ再構成部25は、データ時系列D0~DK-1の間に次元の不整合や測定時間の不整合が生じていたとしても、推論演算部27のNN構造30で不整合が補償され得る構成をもつ多次元配列データを生成すること、または、不整合をもたない多次元配列データを生成することができる。ここで、NN構造30で不整合が補償され得る構成とは、NN構造30が不整合をもつ多次元配列データを受容しても当該多次元配列データを正常に処理することが可能となるようにデータ時系列D0~DK-1から再構成された構成をいう。
【0023】
図2は、データ時系列D
0,D
1,D
2,D
3の間に測定時間の不整合が生じている状況の例を表す図である。
図2の例では、データ時系列D
0は、等時間間隔で配列されている測定量D
0(t
0),D
0(t
1),D
0(t
2),D
0(t
3),D
0(t
4),D
0(t
5),D
0(t
6),…の系列からなる。データ時系列D
1は、等時間間隔で配列されている測定量D
1(t
0),D
1(t
2),D
1(t
4),D
1(t
6),…の系列からなるが、データ時系列D
1の測定間隔は、データ時系列D
0の測定間隔よりも長い。データ時系列D
2は、等時間間隔で配列されている測定量D
2(t
0),D
2(t
1),D
2(t
2),D
2(t
3),D
2(t
4),D
2(t
5),D
2(t
6),…の系列からなるが、データ時系列D
2の測定間隔は、データ時系列D
1の測定間隔よりもさらに長い。データ時系列D
3は、不等時間間隔で配列されている測定量D
3(t
0),D
3(t
4),D
3(t
6),…の系列からなる。
図2に示されるように、たとえば、データ時系列D
0,D
2間では、測定量D
0(t
0)に対応する測定量D
2(t
0)が欠落しており、データ時系列D
2,D
3間では、測定量D
2(t
1)に対応する測定量D
3(t
1)が欠落していることが分かる。仮に、このようなデータ時系列D
0~D
3をそのまま統合してNN構造30に使用されるべき入力データが生成されれば、当該入力データは測定時間の不整合を含むことから、所望の予測精度を得ることができないおそれがある。
【0024】
図3は、データ時系列D
0,D
1,D
2の間に次元の不整合が生じている状況の例を表す図である。
図3の例では、データ時系列D
0は、測定パラメータx
0(t),y
0(t)からなる2次元のベクトル量D
0(t)の時系列であり、データ時系列D
1は、測定パラメータx
1(t)からなる1次元のベクトル量(すなわちスカラー量)D
1(t)の時系列であり、データ時系列D
2は、測定パラメータx
2(t)からなる1次元のベクトル量(すなわちスカラー量)D
2(t)の時系列である。データ時系列D
0,D
1間に次元の不整合が生じており、データ時系列D
0,D
2間に次元の不整合が生じていることが分かる。仮に、このようなデータ時系列D
0~D
2をそのまま統合して、NN構造30に使用されるべき入力データが生成されれば、当該入力データは、NN構造30に適合しない次元の不整合を含むおそれがある。この場合、NN構造30に基づく演算が実行されたとしても所望の予測精度を得ることができないおそれがある。
【0025】
データ再構成部25は、データ時系列D0,…,DK-1から、複数の測定パラメータと当該測定パラメータにそれぞれ割り当てられた相対時間値τとを配列要素として含む多次元配列データを再構成することができる。ここで、ギリシャ文字で表される相対時間値τは、共通の時間基準に基づいて設定される値であり、離散的な時間を表す変数である。測定パラメータは、スカラー量の測定値である。
【0026】
多次元配列データの配列要素である測定パラメータの各々は、データ時系列D
0,…,D
K-1の中から選択されたスカラー量の測定値(たとえば、
図3の測定パラメータx
0(t),y
0(t),x
1(t)もしくはx
2(t))、または、補間もしくはゼロパディングにより付加されたスカラー量の値である。ゼロパディングとは、ゼロ値を付加することを意味する。このような測定パラメータの各々に相対時間値τが割り当てられる。多次元配列データは、推論演算部27のNN構造30に受容される必要があるので、欠落した配列要素を含まないように構成される。データ再構成部25は、データ時系列D
0,…,D
K-1の中から測定値を取捨選択することと相対時間値τの割り当てとにより、欠落した配列要素を含まない多次元配列データを再構成してもよいし、あるいは、データ時系列D
0,…,D
K-1の中から測定値を取捨選択することと、補間またはゼロパディングと、相対時間値τの割り当てとの組合せにより、欠落した配列要素を含まない多次元配列データを再構成してもよい。多次元配列データの具体例については後述する。
【0027】
図1を参照すると、推論演算部27は、データ再構成部25から入力された多次元配列データを用いてNN構造30に基づく演算を実行することにより、異常事象に関する予測情報を算出することができる。
図4は、NN構造30を概略的に示すブロック図である。
図4に示されるように、NN構造30は、多次元配列データを受容する入力層40と、入力層40を介して入力された多次元配列データを処理するための1つまたは複数の再帰型ニューラルネットワーク(Recurrent Neural Networks,RNNs)を含む中間層構造50と、中間層構造50の出力に基づいて予測情報を出力するように構成された出力層60とを有する。NN構造30は、確率的勾配降下法(Stochastic Gradient Descent,SGD)などの既知の機械学習(machine learning)アルゴリズムに従って、教師あり学習(supervised learning)または教師なし学習(unsupervised learning)により訓練可能な構造である。推論演算部27は、学習済みのNN構造30を用いて予測情報を算出することができる。予測情報は、少なくとも1つの異常事象の度合いを示すリスク度と、当該異常事象が発生するであろう予測時間との組を示す情報である。NN構造30の詳細については後述する。
【0028】
上記した異常予測装置10の構成要素の全部または一部は、1つ以上のプロセッサを含む1台のコンピュータで実現されてもよいし、あるいは、通信路を介して相互に接続された複数台のコンピュータで実現されてもよい。異常予測装置10の構成要素の全部または一部は、不揮発性メモリ(コンピュータ読み取り可能な記録媒体)から読み出されたソフトウェアまたはファームウェアのコード(命令群)による処理を実行する1つまたは複数の演算装置(Processing Units)を含む1つ以上のプロセッサで実現されればよい。たとえば、演算装置としては、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)またはNPU(Neural Network Processing Unt)が使用できる。GPU及びNPUは、人工ニューラルネットワーク(ANN)に基づく演算(たとえばテンソル演算)に適した構造をもつように設計された演算装置である。NPUとしては、グーグル(Google)社により開発されたTPU(Tensor Processing Unit)、インテル社により開発されたVPU(Vision Processing Unit)、または、グラフコア(Graphcore)社により開発されたIPU(Intelligent Processor Unit)が使用可能である。あるいは、異常予測装置10の構成要素の全部または一部は、FPGA(Field-Programmable Gate Array)などの半導体集積回路を有する1つ以上のプロセッサにより実現可能である。あるいは、FPGAなどの半導体集積回路と、CPUやGPUなどの演算装置との組合せを含む1以上のプロセッサによって、異常予測装置10の構成要素の全部または一部が実現されてもよい。
【0029】
図5は、異常予測装置10を実現するハードウェア構成例である情報処理装置(コンピュータ)300の概略構成図である。情報処理装置300は、プロセッサ301、ランダムアクセスメモリ(RAM:Random Access Memory)302、不揮発性メモリ303、大容量メモリ304、入出力インタフェース305及び信号路306を含んで構成されている。信号路306は、プロセッサ301、RAM302、不揮発性メモリ303、大容量メモリ304及び入出力インタフェース305を相互に接続するためのバスである。RAM302は、プロセッサ301がディジタル信号処理を実行する際に使用されるデータ記憶領域である。プロセッサ301がCPUやGPUなどの演算装置を内蔵する場合には、不揮発性メモリ303は、プロセッサ301により実行されるソフトウェアのコードが格納されているデータ記憶領域を有する。たとえば、
図1のデータ入力部23は、入出力インタフェース305により実現可能であり、
図1のデータ再構成部25及び推論演算部27は、プロセッサ301、RAM302及び不揮発性メモリ303により実現可能である。大容量メモリ304は、プロセッサ301で算出された予測情報を格納することができる。
【0030】
次に、
図6を参照しつつ、上記した異常予測装置10による処理手順について以下に説明する。
図6は、異常事象の発生を予測するための処理手順の一例を概略的に表すフローチャートである。
【0031】
図6を参照すると、データ再構成部25は、データ入力部23に一時的に記憶されているデータ群の中からデータ時系列D
0,…,D
K-1を読み込み(ステップS11)、当該データ時系列D
0,…,D
K-1から、複数の測定パラメータと当該複数の測定パラメータにそれぞれ割り当てられた複数の相対時間値τとを配列要素として含む多次元配列データを再構成する(ステップS12)。
【0032】
次いで、推論演算部27は、多次元配列データを入力としてニューラルネットワーク構造30に基づく演算を実行することにより、異常事象に関する予測情報を算出する(ステップS13)。
【0033】
その後、推論演算部27は、処理を続行すると判定したときは(ステップS20のYES)、ステップS11に処理を戻す。このとき、データ再構成部25は、データ入力部23に一時的に記憶されている一群のデータの中から新たなデータ時系列D0,…,DK-1を読み込み(ステップS11)、当該新たなデータ時系列D0,…,DK-1から多次元配列データを再構成する(ステップS12)。次いで、推論演算部27は、当該多次元配列データを入力としてニューラルネットワーク構造30に基づく演算を実行することにより、異常事象に関する予測情報を算出する(ステップS13)。このようにして異常予測装置10は、逐次的かつリアルタイムに異常事象の発生を予測することができる。最終的に、推論演算部27は、処理を続行しないと判定したときは(ステップS20のNO)、処理を終了させる。
【0034】
以下、データ再構成部25で生成される多次元配列データの種々の例について説明するとともに、多次元配列データを受容して処理し得るように構成されたNN構造30の種々の例について説明する。
【0035】
上記のとおり、データ再構成部25は、データ時系列D
0,…,D
K-1から、複数の測定パラメータと当該測定パラメータにそれぞれ割り当てられた相対時間値τとを配列要素として含む多次元配列データを再構成することができる。データ時系列D
0~D
K-1の間に次元の不整合や測定時間の不整合が生じていたとしても、データ再構成部25は、推論演算部27のNN構造30で不整合が補償され得る構成をもつ多次元配列データを生成することができる。
図7及び
図8は、NN構造30で不整合が補償され得る構成をもつ多次元配列データMD1,MD2を例示する図である。
図9~
図11の各図は、多次元配列データMD1,MD2の各々が不整合を有する場合であっても、その不整合を補償しつつ多次元配列データMD1,MD2の各々を処理できるように構成されたNN構造を例示する図である。
【0036】
図7に示される多次元配列データMD1は、複数のベクトル系列G
0,G
1,…,G
K-1で構成されている。k番目のベクトル系列G
kは、各々が測定パラメータp
k(τ)とこれに割り当てられた相対時間値τとを配列要素として有する複数の2次元ベクトルv
k(τ)の系列である(τ=τ
k,0,τ
k,1,τ
k,2,…,τ
k,N-1)。ここで、インデックスkは、0~K-1の範囲内の任意の整数であり、Nは、可変の系列長(すなわち、2次元ベクトルの個数)を示す正整数である。各ベクトル系列G
kは、測定パラメータp
k(τ
k,0),p
k(τ
k,1),p
k(τ
k,2),…,p
k(τ
k,N-1)を指定するための次元と、相対時間値τ
k,0,τ
k,1,τ
k,2,…,τ
k,N-1を指定するための次元とを有している。たとえば、データ入力部23から供給されたデータ時系列D
0,…,D
K-1の各々がスカラー量の時系列からなる場合には、データ再構成部25は、データ時系列D
0,…,D
K-1からそれぞれ2次元ベクトル系列G
0,G
1,…,G
K-1を再構成することができる。
【0037】
一方、
図8に示される多次元配列データMD2は、複数のベクトル系列G
0,G
1,…,G
K-1で構成されている。0番目のベクトル系列G
0は、各々が測定パラメータp
0(τ),q
0(τ)とこれらに割り当てられた相対時間値τとを配列要素として有する複数の3次元ベクトルv
0(τ)の系列である(τ=τ
0,0,τ
0,1,τ
0,2,…,τ
0,N-1)。このベクトル系列G
0は、測定パラメータp
0(τ
0,0),p
0(τ
0,1),p
0(τ
0,2),…,p
0(τ
0,N-1)を指定するための次元と、測定パラメータq
0(τ
0,0),q
0(τ
0,1),q
0(τ
0,2),…,q
0(τ
0,N-1)を指定するための次元と、相対時間値τ
0,0,τ
0,1,τ
0,2,…,τ
0,N-1を指定するための次元とを有している。0番目以外のk番目のベクトル系列G
kは、各々が測定パラメータp
k(τ)とこれに割り当てられた相対時間値τとを配列要素として有する複数の2次元ベクトルv
k(τ)の系列である(τ=τ
k,0,τ
k,1,τ
k,2,…,τ
k,N-1)。このベクトル系列G
kは、測定パラメータp
k(τ
k,0),p
k(τ
k,1),p
k(τ
k,2),…,p
k(τ
k,N-1)を指定するための次元と、相対時間値τ
k,0,τ
k,1,τ
k,2,…,τ
k,N-1を指定するための次元とを有している。よって、多次元配列データMD2は、0番目のベクトル系列G
0と0番目以外のk番目のベクトル系列G
kとの間に次元の不整合を有している。たとえば、
図3に示したように、0番目のデータ時系列D
0が2次元ベクトル量の時系列からなり、0番目以外のk番目のデータ時系列D
kがスカラー量の時系列からなる場合には、データ再構成部25は、データ時系列D
0から3次元ベクトル系列G
0を再構成するとともに、データ時系列D
1,…,D
K-1からそれぞれ2次元ベクトル系列G
1,…,G
K-1を再構成することができる。
【0038】
なお、
図7及び
図8の例では、K個のベクトル系列G
0,G
1,…,G
K-1の系列長はすべて同じ値(=N)であるが、これに限定されるものではない。i,jを1~Kの範囲内の互いに異なる任意整数(i≠j)とするとき、データ再構成部25は、i番目のベクトル系列G
iの系列長とj番目のベクトル系列G
jの系列長とが互いに異なるように多次元配列データMD1,MD2の各々を構成することができる。
【0039】
図9は、一例としてのNN構造31を表す図である。
図9を参照すると、NN構造31は、ベクトル系列G
0,…,G
K-1からなる多次元配列データMDxを受容する入力層41と、入力層41を介して入力されたベクトル系列G
0,G
1,…,G
K-1をそれぞれ並列に処理するように構成された再帰型ニューラルネットワーク(RNN)70
0,70
1,…,70
K-1を含む中間層構造51と、中間層構造51の出力に基づいて予測情報を出力するように構成された出力層61とを有する。NN構造31は、
図7及び
図8に示した多次元配列データMD1,MD2の各々を多次元配列データMDxとして受容し処理することができる。ただし、NN構造31で処理可能な多次元配列データは、
図7及び
図8に示したものに限定されるものではない。
【0040】
予測情報は、異常事象の度合いを示すリスク度Drと当該異常事象が発生するであろう予測時間Tpとの組(Dr,Tp)を示す情報である。リスク度Drは、およそ0~1の範囲内の値を有する。リスク度Drが0の値に近いほど異常事象の度合いが低く、リスク度Drが1の値に近いほど異常事象の度合いが高くなるように、NN構造31の機械学習を行うことが可能である。
【0041】
図9に示されるように中間層構造51は、RNN70
0,…,70
K-1に加えて、RNN70
0,…,70
K-1の出力を連結するように構成された連結層75と、連結層75の出力を処理するように構成された順伝播型ニューラルネットワーク81とをさらに含む。以下、説明の便宜上、「順伝播型ニューラルネットワーク」を「順伝播型NN」と呼ぶこととする。
【0042】
RNN700~70K-1は、それぞれ、入力されるベクトル系列G0~GK-1のサイズ(ベクトル次元)に適合するように構成されており、基本的に同じ構成を有している。k番目のRNN70kは、入力層41を介して入力されたk番目のベクトル系列Gkを処理するように構成された再帰層(RL)71kと、最終出力層(LO)72kとを含む。再帰層71kは、内部に有向閉路をもつニューラルネットワーク層であり、入力されたベクトル系列Gkから時間依存の特徴量を抽出することができる。再帰層71kとしては、たとえば、長短期記憶(Long Short-Term Memory,LSTM)層、LSTM層の改良版、ゲート付き再帰型ユニット(Gated Recurrent Unit,GRU)層、または疑似RNN(Quasi-RNN,QRNN)層を使用することが可能である。これらLSTM層、LSTM層の改良版、GRU層及びQRNN層の構成は、たとえば、下記の非特許文献1に開示されている。
【0043】
・非特許文献1:Nesma M. Rezk, Madhura Purnaprajna, Tomas Nordstrom, Zain Ul-Abdin: Recurrent Neural Networks: An Embedded Computing Perspective. IEEE Access 8: 57967-57996 (2020).
【0044】
今、k番目のベクトル系列Gkが、N個のベクトルvk(τ0),vk(τ1),vk(τ2),…,vk(τN-1)の系列(Nは、可変の系列長を示す正整数)からなるとすれば、再帰層71kは、N個のベクトルvk(τ0),…,vk(τN-1)を順次処理することにより、N個の出力ベクトルhk(τ0),…,hk(τN-1)の系列を生成するように構成されている。最終出力層72kは、当該出力ベクトルの系列のうちの最終の出力ベクトルhk(τN-1)を選択して出力するように構成されている。
【0045】
なお、RNN700~70K-1の各々は、任意サイズの入力ベクトルの系列を処理し、任意サイズの出力ベクトルを生成するように個別に構成され得る。ここで、ベクトルのサイズとは、当該ベクトルの要素数(ベクトル次元)を意味する。たとえば、0番目のRNN700が3次元ベクトル(サイズ3のベクトル)の系列を入力として40次元の出力ベクトル(サイズ40のベクトル)を生成するのに対し、1番目のRNN701が2次元ベクトル(サイズ2のベクトル)の系列を入力として50次元の出力ベクトル(サイズ50のベクトル)を生成するようにRNN700,701を構成することが可能である。
【0046】
連結層75は、RNN700,…,70K-1の出力ベクトルh0(τN-1),…,hK-1(τN-1)を連結することができる。たとえば、各出力ベクトルhk(τN-1)がサイズ40をもつ(すなわち、40次元ベクトルである)場合には、連結層75は、出力ベクトルh0(τN-1),…,hK-1(τN-1)を連結して40×Kのサイズをもつ連結ベクトル(すなわち、40×K次元ベクトル)を生成しこれを出力することができる。
【0047】
順伝播型NN81は、互いに並列に配置された2つのサブニューラルネットワーク90,100を有する。以下、説明の便宜上、「サブニューラルネットワーク」を「サブNN」と呼ぶこととする。
【0048】
サブNN90,100の各々は、連結層75から入力された連結ベクトルを処理するように構成されている。サブNN90は、非線形変換層(NLL)91、線形変換層(LL)92、非線形変換層(NLL)93、線形変換層(LL)94、正規化層(NL)95、線形変換層(LL)97、非線形変換層(NLL)98及び線形変換層(LL)99を有する。
【0049】
非線形変換層91は、連結層75から入力された連結ベクトルの各要素に対して、活性化関数を用いた非線形変換を行うように構成されている。活性化関数としては、たとえば、ランプ関数、または、ロジスティックシグモイド関数(logistic sigmoid function)もしくは双曲線正接関数などのシグモイド関数が使用可能である。ランプ関数は、ReLU(Rectified Linear Unit:正規化線形関数)とも呼ばれている。
【0050】
線形変換層92は、非線形変換層91から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。重み行列をWで表し、バイアスベクトルをbで表し、入力ベクトルをvinで表し、出力ベクトルをvoutで表すとすれば、一般に、線形変換は次式で表現できる。
vout=W・vin+b
【0051】
非線形変換層93は、線形変換層92の出力ベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。線形変換層94は、非線形変換層93から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。正規化層95は、線形変換層94から入力されたベクトルの各要素に正規化を施して正規化ベクトルを生成することができる。正規化としては、たとえば、減算正規化(subtractive normalization)または除算正規化(divisive normalization)といった公知の方法が適用可能である。線形変換層97は、その正規化ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。非線形変換層98は、線形変換層97から入力されたベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。そして、線形変換層99は、非線形変換層98から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことによりスカラー量のリスク度Drを生成する。リスク度Drは、出力層61のノードを介して外部に出力される。
【0052】
サブNN100の基本構成は、機械学習アルゴリズムにより更新されるパラメータ群(たとえば、重み行列の要素及びバイアスベクトルの要素)の値を除いて、サブNN90の基本構成と同じである。
図9に示されるように、サブNN100は、非線形変換層(NLL)101、線形変換層(LL)102、非線形変換層(NLL)103、線形変換層(LL)104、正規化層(NL)105、線形変換層(LL)107、非線形変換層(NLL)108及び線形変換層(LL)109を有する。
【0053】
非線形変換層101は、連結層75から入力された連結ベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。線形変換層102は、非線形変換層101から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。非線形変換層103は、線形変換層102の出力ベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。線形変換層104は、非線形変換層103から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。正規化層105は、線形変換層104から入力されたベクトルの各要素に正規化を施して正規化ベクトルを生成することができる。線形変換層107は、その正規化ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。非線形変換層108は、線形変換層107から入力されたベクトルに対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。そして、線形変換層109は、非線形変換層108から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことによりスカラー量の予測時間Tpを生成する。予測時間Tpは、出力層61のノードを介して外部に出力される。
【0054】
以上に説明したように
図9に示したNN構造31は、入力層41を介して入力されたベクトル系列G
0,G
1,…,G
K-1をそれぞれ並列に受容し処理することができるRNN70
0,70
1,…,70
K-1と、RNN70
0,70
1,…,70
K-1の出力を連結し得る連結層75とを有している。このため、ベクトル系列G
0,G
1,…,G
K-1の間で不整合が生じている場合(たとえば、
図8に示すような次元の不整合が生じている場合)でも、NN構造31はその不整合を補償することができるので、推論演算部27は、NN構造31に基づく信頼性の高い演算を実行することができる。また、各ベクトル系列G
kは、各々が少なくとも1つの測定パラメータとこれに割り当てられた相対時間値とを配列要素としてもつ複数のベクトルの系列からなるので、NN構造31は、時間情報が正確に対応付けされた測定パラメータ群を処理することができる。これにより、予測情報(Dr,Tp)を高い精度で算出することが可能となる。
【0055】
ところで、NN構造31は、1種類の異常事象の発生を予測できるように構成されているが、これに限定されず、2種類以上の異常事象の発生を予測できるようにNN構造31の構成を適宜変形することができる。
図10は、NN構造31の変形例であるNN構造32を表す図である。NN構造32は2種類の異常事象の発生を予測できるように構成されている。
【0056】
図10を参照すると、NN構造32は、ベクトル系列G
0,…,G
K-1からなる多次元配列データMDxを受容する入力層41と、入力層41を介して入力されたベクトル系列G
0,G
1,…,G
K-1をそれぞれ並列に処理するように構成されたRNN70
0,70
1,…,70
K-1を含む中間層構造52と、中間層構造52の出力に基づいて2種類の予測情報を出力するように構成された出力層62とを有する。中間層構造52は、RNN70
0,…,70
K-1の出力を連結するように構成された連結層75と、連結層75の出力を処理するように構成された順伝播型NN82とをさらに含む。
【0057】
順伝播型NN82は、互いに並列に配置された2つのサブNN90A,100Aを有し、サブNN90A,100Aの各々は、連結層75から入力された連結ベクトルを処理するように構成されている。
【0058】
サブNN90Aの構成は、
図9のサブNN90の線形変換層99に代えて2つの線形変換層(LL)99
1,99
2を有する点を除いて、サブNN90の構成と同じである。線形変換層99
1は、非線形変換層98から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより、第1の異常事象の度合いを示すスカラー量のリスク度Dr1を生成する。一方、線形変換層99
2は、非線形変換層98から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより、第2の異常事象の度合いを示すスカラー量のリスク度Dr2を生成する。リスク度Dr1,Dr2は、出力層62のノードを介して外部に出力される。
【0059】
サブNN100Aの構成は、
図9のサブNN100の線形変換層109に代えて2つの線形変換層(LL)109
1,109
2を有する点を除いて、サブNN100の構成と同じである。線形変換層109
1は、非線形変換層108から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより、第1の異常事象が発生するであろう予測時間Tp1を生成する。一方、線形変換層109
2は、非線形変換層108から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより、第2の異常事象が発生するであろう予測時間Tp2を生成する。予測時間Tp1,Tp2は、出力層62のノードを介して外部に出力される。
【0060】
なお、
図9のNN構造31において、サブNN90の線形変換層99に代えて3つ以上の線形変換層を有するようにサブNN90の構成を変更し、サブNN100の線形変換層109に代えて3つ以上の線形変換層を有するようにサブNN100の構成を変更してもよい。これにより、3種類以上の異常事象の発生を予測できるNN構造を構築することができる。
【0061】
図11は、NN構造31の他の変形例であるNN構造33を表す図である。NN構造33は、2種類の異常事象の発生を予測できるように構成されている。
【0062】
図11を参照すると、NN構造33は、ベクトル系列G
0,…,G
K-1からなる多次元配列データMDxを受容する入力層41と、入力層41を介して入力されたベクトル系列G
0,G
1,…,G
K-1をそれぞれ並列に処理するように構成されたRNN70
0,70
1,…,70
K-1を含む中間層構造53と、中間層構造53の出力に基づいて2種類の予測情報を出力するように構成された出力層63とを有する。中間層構造53は、RNN70
0,…,70
K-1の出力を連結するように構成された連結層75と、連結層75の出力を処理するように構成された順伝播型NN83とをさらに含む。
【0063】
順伝播型NN83は、互いに並列に配置された4つのサブNN90,100,110,120を有し、サブNN90,100,110,120の各々は、連結層75から入力された連結ベクトルを処理するように構成されている。
【0064】
図11に示されるサブNN90,100の構成は、それぞれ、
図9に示されるサブNN90,100の構成と同じである。サブNN90は、第1の異常事象の度合いを示すリスク度Dr1を生成し、サブNN100は、当該第1の異常事象が発生するであろう予測時間Tp1を生成することができる。リスク度Dr1及び予測時間Tp1は、出力層63のノードを介して外部に出力される。
【0065】
図11に示されるサブNN110,120の基本構成は、機械学習アルゴリズムにより更新されるパラメータ群(たとえば、重み行列の要素及びバイアスベクトルの要素)の値を除いて、サブNN90,100の基本構成とそれぞれ同じである。
【0066】
サブNN110は、
図11に示されるように、非線形変換層(NLL)111、線形変換層(LL)112、非線形変換層(NLL)113、線形変換層(LL)114、正規化層(NL)115、線形変換層(LL)117、非線形変換層(NLL)118及び線形変換層(LL)119を有する。非線形変換層111は、連結層75から入力された連結ベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。線形変換層112は、非線形変換層111から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。非線形変換層113は、線形変換層112の出力ベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。線形変換層114は、非線形変換層113から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。正規化層115は、線形変換層114から入力されたベクトルの各要素に正規化を施して正規化ベクトルを生成することができる。線形変換層117は、その正規化ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。非線形変換層118は、線形変換層117から入力されたベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。そして、線形変換層119は、非線形変換層118から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより、第2の異常事象の度合いを示すリスク度Dr2を生成する。リスク度Dr2は、出力層63のノードを介して外部に出力される。
【0067】
サブNN120は、
図11に示されるように、非線形変換層(NLL)121、線形変換層(LL)122、非線形変換層(NLL)123、線形変換層(LL)124、正規化層(NL)125、線形変換層(LL)127、非線形変換層(NLL)128及び線形変換層(LL)129を有する。非線形変換層121は、連結層75から入力された連結ベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。線形変換層122は、非線形変換層121から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。非線形変換層123は、線形変換層122の出力ベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。線形変換層124は、非線形変換層123から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。正規化層125は、線形変換層124から入力されたベクトルの各要素に正規化を施して正規化ベクトルを生成することができる。線形変換層127は、その正規化ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。非線形変換層128は、線形変換層127から入力されたベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。そして、線形変換層129は、非線形変換層128から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより、第2の異常事象が発生するであろう予測時間Tp2を生成する。予測時間Tp2は、出力層63のノードを介して外部に出力される。
【0068】
なお、
図9のNN構造31において、サブNN90,100の組と同じ基本構成を有するサブNNの組を2つ以上追加してもよい。これにより、3種類以上の異常事象の発生を予測できるNN構造を構築することができる。
【0069】
次に、
図12~
図14を参照しつつ、
図9に示したNN構造31に基づく演算の実施例について以下に説明する。
【0070】
この実施例は、人工透析機器が、対象物体Tgtである透析中の人の生体状態をモニタリング(監視)することにより得られた測定データ群を用いて行われた。予測対象となる異常事象は、血圧低下であり、予測情報は、血圧低下のリスク度Drと、血圧低下が発生するであろう予測時間Tp(単位:秒)との組である。リスク度Drは、およそ0~1の範囲内の値を有する。リスク度Drが0の値に近いほど血圧低下の度合いが低く、リスク度Drが1の値に近いほど血圧低下の度合いが高い。
【0071】
図12は、実施例で実際に使用された7種類の測定パラメータp
k(τ)と2次元の入力ベクトル系列G
kとの間の関係をテーブル形式で表す図である(インデックスkは、0~6の範囲内の整数である。)。血圧回路圧p
0(τ)、透析液回路圧p
1(τ)、除水達成量p
2(τ)、ヘマトクリット値p
3(τ)、脈拍数p
4(τ)、酸素飽和度p
5(τ)及び血圧値p
6(τ)が、監視パラメータとして実際に測定された。これら測定パラメータp
0(τ)~p
6(τ)はいずれもスカラー量である。ここで、除水達成量p
2(τ)は、人の体内から除去された水分の積算量であり、ヘマトクリット値p
3(τ)は、血液中の血球成分の容積の割合であり、血液濃縮度の指標となり得る値である。血圧値p
6(τ)は、マンシェット(manchette)を用いて血圧計で計測された値である。マンシェットとは、血圧測定時に血圧計と接続されて人の上腕部を包み込む細長い環状帯である。
【0072】
除水達成量p2(τ)は60秒ごと、血圧値p6(τ)は30分ごと、その他の測定パラメータp0(τ),p1(τ),p3(τ)~p5(τ)は20秒ごとにそれぞれ測定された。このように測定間隔が不揃いであるので、ベクトル系列G0~G6からなる多次元配列データは、測定時間の不整合を有する。これに対し、NN構造31のRNN700~706は、ベクトル系列G0~G6をそれぞれ並列に受容し処理することができるので、不整合を補償することができる。
【0073】
学習データ及びテストデータについては、異常事象(血圧低下)の発生有りを示す50個の測定データ群Λ1~Λ50と、異常事象の発生無しを示す125個の測定データ群Φ1~Φ125とが用意された。学習データは、50個の測定データ群Λ1~Λ50からランダムに選択された40個のデータ群λ1~λ40と、125個の測定データ群Φ1~Φ125からランダムに選択された100個のデータ群φ1~φ100である。この学習データを用いて、測定データと、異常事象の有無及び異常事象の発生時間との間の関連をNN構造31に学習させた。予測精度の検証用のテストデータとしては、50個の測定データ群Λ1~Λ50のうちの残りの10個のデータ群と、125個の測定データ群Φ1~Φ125のうちの残りの25個のデータ群とが使用された。
【0074】
具体的には、モニタリング開始時を起点として20分(=1200秒)刻みで区切り時刻が設定され、その起点から異常事象発生時点を含まない直前の区切り時刻までの時間区間の測定データ群が、学習の対象とされた。加えて、その時間区間より最後の20分及び40分だけ短い時間区間の測定データ群も学習の対象とされた。よって、学習データは、異常事象発生時点以降のデータを含まない。その理由は、異常事象発生前の測定データに起因する異常事象(血圧低下)の発生及びその発生時間の予見性を調べることが目的だからである。異常事象が観察されなかったデータについては、リスク度の値として0が割り当てられ、発生時間として、モニタリング工程のエンドポイントよりもさらに遠位の時点(=20000秒)が一律に割り当てられた。
【0075】
テストデータについては、モニタリング開始時から2時間(=7200秒)の時点までの時間区間が最初の時間区間として設定された。この最初の時間区間から20分(=1200秒)刻みで長さを延長して得られた複数の時間区間における測定データ群が、テストデータの対象とされた。このようにした理由は、実際の治療においてリアルタイムで測定データが増えていく状況を模した条件を実現するとともに、異常事象の予測が可能な最も早い段階を探るためである。このテストデータを用いて、学習済みのNN構造31に基づく演算が実行された。リスク度Drが0.5を超えたデータ群は、異常事象の発生有りと判定された。また、予測時間Tpについては、初めて5時間の治療時間(=1800秒)よりも小さい値をもつ時刻が採用された。
【0076】
図13は、上記した条件下での実施例の結果を示すグラフである。
図13のグラフにおいて、横軸は、異常事象が発生した実際の時間tに対応し(単位:秒)、縦軸は、異常事象が発生するであろう予測時間τに対応する。
図14は、実施例の結果をテーブル形式で示す図である。すなわち、真陽性の数(Naa)は9、偽陽性の数(Nab)は1、真陰性の数(Nbb)は24、偽陰性の数(Nba)は1であった。よって、感度(再現率)は90%(=Naa/(Naa+Nba))、特異度は96%(=Nbb/(Nab+Nbb))、陽性予測的中率は90%(=Naa/(Naa+Nab))、陰性予測的中率は96%(=Nbb/(Nbb+Nba))という良好な検出性能が確認された。
図13のグラフには示されていないが、予測時間Tpはすべて20分以上前に異常事象の発生を予測するものであった。よって、血圧低下を予防する措置をとる時間的猶予を確保できるので、実用上のメリットがあると思われる。
【0077】
上記のとおり、
図9~
図11に示したNN構造31,32,33の各々は、複数のベクトル系列G
0,G
1,…,G
K-1からなる多次元配列データMDxのみを受容するように構成されている。この代わりに、多次元配列データMDxと対象物体Tgtの属性情報とを受容するようにそれらNN構造の構成が変形されてもよい。
【0078】
対象物体Tgtの属性情報としては、たとえば、人などの生体の固有の情報から構成されるスカラー量またはベクトル量が使用可能である。より具体的には、たとえば、属性情報として、年齢、性別、肥満度(BMI:Body Mass Index)、及び、糖尿病などの特定の疾患の有無をそれぞれ示す数値が使用できる。この場合、
図1に示されるデータ再構成部25または推論演算部27は、属性情報があらかじめ格納された内部メモリ(図示せず)を有し、この内部メモリから読み出された属性情報をNN構造に供給するように構成されればよい。あるいは、データ再構成部25または推論演算部27は、外部の情報源(図示せず)から属性情報を取得し、取得された属性情報をNN構造に供給するように構成されてもよい。
【0079】
図15は、
図9に示したNN構造31の変形例であるNN構造31Bを表す図である。NN構造31Bは、ベクトル系列G
0,…,G
K-1からなる多次元配列データMDxと対象物体Tgtの属性情報ADとを受容する入力層42と、入力層42を介して入力されたベクトル系列G
0,…,G
K-1及び属性情報ADを処理するように構成された中間層構造51Bと、中間層構造51Bの出力に基づいて2種類の予測情報を出力するように構成された出力層62とを有する。中間層構造51Bは、ベクトル系列G
0,G
1,…,G
K-1をそれぞれ並列に処理するように構成されたRNN70
0,70
1,…,70
K-1と、連結層75Bと、互いに並列に配置されたサブNN90B,100Bからなる順伝播型NN81Bとを含む。
【0080】
連結層75Bは、RNN700,701,…,70K-1で生成されたK個のベクトルと属性情報ADのスカラー値またはベクトルとを連結することで連結ベクトルを生成するように構成されている。たとえば、連結層75Bは、RNN700,701,…,70K-1からそれぞれ入力されたK個の20次元ベクトルと属性情報ADの10次元ベクトルとを連結して、(K×20+10)次元の連結ベクトルを生成するように構成され得る。
【0081】
サブNN90B,100Bの各々は、連結層75Bから入力された連結ベクトルを処理するように構成されている。サブNN90Bは、
図9に示したサブNN90と同じ基本構成を有している。サブNN90Bは、非線形変換層(NLL)91B、線形変換層(LL)92B、非線形変換層(NLL)93B、線形変換層(LL)94B、正規化層(NL)95B、線形変換層(LL)97B、非線形変換層(NLL)98B及び線形変換層(LL)99Bを有する。これら非線形変換層91B、線形変換層92B、非線形変換層93B、線形変換層94B、正規化層95B、線形変換層97B、非線形変換層98B及び線形変換層99Bは、
図9に示したサブNN90における非線形変換層91、線形変換層92、非線形変換層93、線形変換層94、正規化層95、線形変換層97、非線形変換層98及び線形変換層99とそれぞれ同じ基本構成を有している。サブNN90Bはスカラー量のリスク度Drを生成し、リスク度Drは出力層61のノードを介して外部に出力される。
【0082】
一方、サブNN100Bも、
図9に示したサブNN100と同じ基本構成を有している。サブNN100Bは、非線形変換層(NLL)101B、線形変換層(LL)102B、非線形変換層(NLL)103B、線形変換層(LL)104B、正規化層(NL)105B、線形変換層(LL)107B、非線形変換層(NLL)108B及び線形変換層(LL)109Bを有する。これら非線形変換層101B、線形変換層102B、非線形変換層103B、線形変換層104B、正規化層105B、線形変換層107B、非線形変換層108B及び線形変換層109Bは、
図9に示したサブNN100における非線形変換層101、線形変換層102、非線形変換層103、線形変換層104、正規化層105、線形変換層107、非線形変換層108及び線形変換層109とそれぞれ同じ基本構成を有している。サブNN100Bはスカラー量の予測時間Tpを生成し、予測時間Tpは出力層61のノードを介して外部に出力される。
【0083】
以上に説明したように
図15に示したNN構造31Bは、測定パラメータとこれら測定パラメータに割り当てられた相対時間値とを配列要素としてもつ多次元配列データMDxに加えて、対象物体Tgtの属性情報ADを受容して処理することができるので、推論演算部27は、NN構造31Bに基づいて、対象物体Tgtに関する予測情報(Dr,Tp)をより高い精度で算出することができる。
【0084】
図9~
図11及び
図15に示した順伝播型NN81,82,83,81Bの各構成は例であり、これらに限定されるものではない。たとえば、
図9に示した順伝播型NN81に代えて、
図16に示す順伝播型NN81Cが使用されてもよい。
図16に示される順伝播型NN81Cは2つのサブNN90C,100Cを有している。サブNN90Cは、
図9のサブNN90における非線形変換層91を削除し、正規化層95と線形変換層97との間に非線形変換層(NLL)96を配置することにより構成されるものである。一方、サブNN100Cは、
図9のサブNN100における非線形変換層101を削除し、正規化層105と非線形変換層107との間に非線形変換層(NLL)106を配置することにより構成されるものである。
【0085】
また、
図9~
図11及び
図15に示したサブNN90,100,90A,100A,110,120,90B,100Bの各々は、互いに直列に結合された線形変換層、正規化層及び線形変換層の組合せ(たとえば、
図9に示したような線形変換層94、正規化層95及び線形変換層97の組合せ)を有している。このような組合せから、正規化層の後段の線形変換層を削除することで得られる、線形変換層及び正規化層の組合せが採用されてもよい(たとえば、
図9に示したような線形変換層94、正規化層95及び線形変換層97の組合せから線形変換層97を削除することで得られる、線形変換層94及び正規化層95の組合せが採用されてもよい)。
【0086】
次に、不整合をもたない多次元配列データの例について説明するとともに、不整合をもたない多次元配列データを受容して処理し得るように構成されたNN構造の種々の例について説明する。
【0087】
図17A及び
図17Bは、不整合をもたない多次元配列データMD3を例示する図である。
図18及び
図20~
図24の各図は、多次元配列データMD3を受容し処理できるように構成されたNN構造を例示する図である。
【0088】
図17Aに示される多次元配列データMD3は、3階のテンソルT1で構成されている。多次元配列データMD3は、測定パラメータp
j(τ
i)とこれに割り当てられた相対時間値τ
iとをテンソルT1の配列要素として有する。ここで、インデックスjは、0~J-1の範囲内の整数であり、Jは、2以上の正整数であり、インデックスiは、0~N-1の範囲内の整数であり、Nは、可変の正整数である。
図17Bに示されるように、多次元配列データMD3は、N×J×2のサイズを有する。たとえば、
図1に示されるデータ再構成部25は、j番目のデータ時系列D
jを構成するスカラー量(測定値)系列から、インデックスjをもつ測定パラメータp
j(τ
i)を再構成することができるが、これに限定されるものではない。また、j番目のデータ時系列D
jが多次元ベクトル量の系列からなる場合(たとえば、
図3に示したデータ時系列D
0の場合)には、データ再構成部25は、その多次元ベクトル量の系列を複数のスカラー量系列に分解し、各スカラー量系列からテンソルT1の測定パラメータを得ることができる。相対時間値τ
iが割り当てられるべき測定パラメータが欠落している場合には、データ再構成部25は、その欠落している測定パラメータを補間またはゼロパディングにより補充してもよい。
【0089】
なお、テンソルで構成される多次元配列データのサイズは、N×J×2に限定されるものではなく、N×J×(Hc+1)とすることができる。ここで、Hcは1以上の整数である。たとえば、複数の色センサの各々で得られた測定量の時系列の供給を受けた場合には、データ再構成部25は、N×J×(Hc+1)のサイズ(Hcは色センサの数)をもつ多次元配列データを再構成することが可能である。
【0090】
図18は、一例としてのNN構造34を表す図である。NN構造34は、3階のテンソルで構成された多次元配列データMDyを受容する入力層44と、入力層44を介して入力された多次元配列データMDyを処理するように構成された中間層構造54と、中間層構造54の出力に基づいて予測情報(Dr,Tp)を出力するように構成された出力層64とを有している。中間層構造54は、畳み込みニューラルネットワーク(Convolutional Neural Network,CNN)130,131及び再帰型ニューラルネットワーク(RNN)132を含む。NN構造34は、
図17に示した3階のテンソルT1で構成された多次元配列データMD3を多次元配列データMDyとして受容し処理できるように構成されている。
【0091】
中間層構造54は、CNN130,131及びRNN132に加えて、RNN132の出力を処理するように構成された順伝播型NN133をさらに含む。CNN130,131、RNN132及び順伝播型NN133は、直列に結合されている。
【0092】
CNN130は、畳込み層(CL)141、非線形変換層(NLL)142及びプーリング層(PL)143を有する。畳込み層141は、入力された3階のテンソルのデータに対して、M個のフィルタを用いた畳み込みを実行して2階または3階のテンソルのデータを生成するように構成されている。ここで、Mは、フィルタの数すなわちチャネル数を示す1以上の整数である。畳み込みは、フィルタを用いた畳込み演算とバイアスを用いた加算演算とで構成される。1個のフィルタが使用される場合(M=1の場合)には、畳込み層141は、2階のテンソル(すなわちマトリクス)のデータを出力し得、複数個のフィルタが使用される場合(Mが2以上の場合)には、畳込み層141は、3階のテンソルのデータを出力し得る。非線形変換層142は、畳込み層141から入力されたテンソルの各要素に対して、活性化関数を用いた非線形変換を行うように構成されている。活性化関数としては、たとえば、ランプ関数、または、ロジスティックシグモイド関数もしくは双曲線正接関数などのシグモイド関数が使用可能である。
【0093】
図19は、畳み込み及び非線形変換の方法を説明するための図である。
図19は、入力テンソルTy、フィルタF
0,F
1,…,F
M-1、畳込み演算子210
0,210
1,…,210
M-1、加算演算子211
0,211
1,…,211
M-1、活性化関数f
0(),f
1(),…,f
M-1()、及び、出力テンソルTzを表している。入力テンソルTyは、N×J×Hのサイズを有するテンソルである。ここで、N,Jはそれぞれ2以上の正整数であり、Hは1以上の整数である。H=1の場合は、入力テンソルTyは2階のテンソル(マトリクス)となり、Hの値が2以上の場合は、入力テンソルTyは3階のテンソルとなる。
図18に示されるCNN130の畳込み層141は、3階のテンソルを入力として畳み込みを行うように構成されている。入力テンソルTyの要素は、d
ijhと表すことができる。ここで、インデックスi,jは、入力テンソルTyにおける所定の正方領域を指定するための整数、インデックスhは、0~H-1の範囲内の整数である。Mは、フィルタF
0~F
M-1の数すなわちチャネル数を示す3以上の整数である。
図19の例では、チャネル数Mは3以上であるが、これに限定されるものではない。
【0094】
m番目チャネルのフィルタF
mは、P×Q×Hのサイズを有するテンソルで構成されている。ここで、Pは、Nよりも小さい2以上の正整数であり、Qは、Jよりも小さい2以上の整数である。H=1の場合は、フィルタF
mは2階のテンソル(マトリクス)で構成され、Hの値が2以上の場合は、フィルタF
mは3階のテンソルで構成される。
図18に示されるCNN130の畳込み層141は、3階のテンソルで構成された少なくとも1つのフィルタを用いて畳み込みを行うように構成されている。フィルタF
mの要素(重み係数)は、w
pqhmと表すことができる。ここで、インデックスpは、0~P-1の範囲内の整数、インデックスqは、0~Q-1の範囲内の整数、hは、0~H-1の範囲内の整数である。
【0095】
図19を参照すると、畳込み演算子210
0,210
1,…,210
M-1は、入力テンソルTyの要素d
ijhに対して並列に畳込み演算を行うことができる。加算演算子211
0,211
1,…,211
M-1は、畳込み演算子210
0,210
1,…,210
M-1の出力にバイアスb
ij0,b
ij1,…,b
i,j,M-1をそれぞれ加算する加算演算を並列に行うことができる。m番目チャネルのバイアスb
ijmは、2階のテンソル(マトリクス)として与えられる。
【0096】
具体的には、たとえば、次式に従って、各チャネルごとの畳み込みが実行可能である。
【数1】
【0097】
畳み込みの実行後は、次式に示されるように、各チャネルにおいて活性化関数f
m()を用いた非線形変換が実行される。
【数2】
【0098】
全てのチャネルの非線形変換により算出された要素z
ijmを統合することで出力テンソルTzが構成される。出力テンソルTzは、
図19に示されるように、R×L×Mのサイズを有している。ここで、Rは、N以下の正整数、Lは、J以下の正整数である。単一チャネルの場合(1つのフィルタが使用される場合)には、出力テンソルTzは2階のテンソル(マトリクス)で構成され、複数チャネルの場合(複数のフィルタが使用される場合)には、出力テンソルTzは3階のテンソルで構成される。
【0099】
図18を参照すると、CNN130のプーリング層143は、あらかじめ設定されたストライド(stride)の値に従い、非線形変換層142から入力されたテンソルのデータにプーリング処理(pooling operation)を施して出力テンソルを生成するように構成されている。プーリング処理としては、平均プーリング(average pooling)、最大プーリング(max pooling)またはLpプーリング(Lp pooling)といった公知の手法が適用可能である。
【0100】
CNN131は、畳込み層(CL)145、非線形変換層(NLL)146及びプーリング層(PL)147を有する。畳込み層145は、前段のCNN130から入力されたテンソルのデータに対して、1つまたは複数のフィルタを用いた畳み込み(すなわち、フィルタを用いた畳込み演算とバイアスを用いた加算演算)を実行するように構成されている。非線形変換層146は、畳込み層145から入力されたテンソルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。そして、プーリング層147は、あらかじめ設定されたストライドの値に従い、非線形変換層146の出力に平均プーリングなどのプーリング処理を施すように構成されている。
【0101】
RNN132は、平坦化層(FL)151、再帰層(RL)152及び最終出力層(LO)153を有する。平坦化層151は、前段のCNN131の出力から、ベクトル系列(すなわち、複数のベクトルの系列)からなるマトリクスデータを生成することができる。再帰層152は、内部に有向閉路をもつニューラルネットワーク層であり、入力されたベクトル系列から時間依存の特徴量を抽出することができる。再帰層152としては、たとえば、LSTM層、LSTM層の改良版、GRU層、またはQRNN層を使用することが可能である。再帰層152は、平坦化層151から入力されたベクトル系列を処理することにより出力ベクトル系列を生成するように構成されている。最終出力層153は、当該出力ベクトル系列のうちの最終の出力ベクトルを選択して出力するように構成されている。
【0102】
順伝播型NN133は、線形変換層(LL)161、正規化層(NL)162、非線形変換層(NLL)163及び線形変換層(LL)164A,164Bを有する。線形変換層161は、RNN132から入力されたベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。正規化層162は、線形変換層161から入力されたベクトルの各要素に減算正規化などの正規化を施して正規化ベクトルを生成することができる。非線形変換層163は、その正規化ベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。そして、線形変換層164Aは、非線形変換層163の出力に対して、重み行列とバイアスベクトルとを用いた線形変換を行うことによりスカラー量のリスク度Drを生成する。リスク度Drは、出力層64のノードを介して外部に出力される。一方、線形変換層164Bは、非線形変換層163の出力に対して、重み行列とバイアスベクトルとを用いた線形変換を行うことによりスカラー量の予測時間Tpを生成する。予測時間Tpは、出力層64のノードを介して外部に出力される。
【0103】
以上に説明したように
図18に示したNN構造34は、測定パラメータとこれら測定パラメータに割り当てられた相対時間値とを配列要素としてもつ多次元配列データMDyを受容して処理することができるので、推論演算部27は、NN構造34に基づいて予測情報(Dr,Tp)を高い精度で算出することができる。
【0104】
図20は、一例としてのNN構造35を表す図である。NN構造35は、3階のテンソルで構成された多次元配列データMDyを受容する入力層44と、入力層44を介して入力された多次元配列データMDyを処理するように構成されたCNN130,131及びRNN132を含む中間層構造55と、中間層構造55の出力に基づいて予測情報(Dr,Tp)を出力するように構成された出力層64とを有している。中間層構造55は、さらに、互いに並列に配置された2つのサブNN134A,134Bからなる順伝播型NN134を有する。サブNN134A,134Bの各々は、RNN132における最終出力層153の出力ベクトルを処理するように構成されている。
【0105】
サブNN134Aは、
図20に示されるように、線形変換層(LL)161A、正規化層(NL)162A、非線形変換層(NLL)163A、線形変換層(LL)164A、非線形変換層(NLL)165A及び線形変換層(LL)166Aを有する。線形変換層161Aは、RNN132の最終出力層153の出力ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。正規化層162Aは、線形変換層161Aから入力されたベクトルの各要素に減算正規化などの正規化を施して正規化ベクトルを生成することができる。非線形変換層163Aは、その正規化ベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。線形変換層164Aは、非線形変換層163Aの出力に対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。非線形変換層165Aは、線形変換層164Aから入力されたベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。そして、線形変換層166Aは、非線形変換層165Aの出力に対して、重み行列とバイアスベクトルとを用いた線形変換を行うことによりスカラー量のリスク度Drを生成する。リスク度Drは、出力層64のノードを介して外部に出力される。
【0106】
一方、サブNN134Bは、
図20に示されるように、線形変換層(LL)161B、正規化層(NL)162B、非線形変換層(NLL)163B、線形変換層(LL)164B、非線形変換層(NLL)165B及び線形変換層(LL)166Bを有する。線形変換層161Bは、RNN132の最終出力層153の出力ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。正規化層162Bは、線形変換層161Bから入力されたベクトルの各要素に減算正規化などの正規化を施して正規化ベクトルを生成することができる。非線形変換層163Bは、その正規化ベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。線形変換層164Bは、非線形変換層163Bの出力に対して、重み行列とバイアスベクトルとを用いた線形変換を行うように構成されている。非線形変換層165Bは、線形変換層164Bから入力されたベクトルの各要素に対して、ランプ関数などの活性化関数を用いた非線形変換を行うように構成されている。そして、線形変換層166Bは、非線形変換層165Bの出力に対して、重み行列とバイアスベクトルとを用いた線形変換を行うことによりスカラー量の予測時間Tpを生成する。予測時間Tpは、出力層64のノードを介して外部に出力される。
【0107】
以上に説明したように
図20に示したNN構造35も、測定パラメータとこれら測定パラメータに割り当てられた相対時間値とを配列要素としてもつ多次元配列データMDyを受容して処理することができるので、推論演算部27は、NN構造35に基づいて予測情報(Dr,Tp)を高い精度で算出することができる。
【0108】
ところで、上記したNN構造34,35の各々は1種類の異常事象の発生の発生を予測できるように構成されているが、これに限定されず、2種類以上の異常事象の発生を予測できるようにNN構造34またはNN構造35の構成を適宜変形することができる。
図21は、NN構造35の変形例であるNN構造36を表す図である。NN構造36は3種類の異常事象の発生を予測できるように構成されている。
【0109】
図21を参照すると、NN構造36は、3階のテンソルで構成された多次元配列データMDyを受容する入力層44と、入力層44を介して入力された多次元配列データMDyを処理するように構成されたCNN130,131及びRNN132を含む中間層構造56と、中間層構造56の出力に基づいて3種類の予測情報(Dr1,Tp1),(Dr2,Tp2),(Dr3,Tp3)を出力するように構成された出力層66とを有している。中間層構造56は、さらに、互いに並列に配置された2つのサブNN135A,135Bからなる順伝播型NN135を有する。サブNN135A,135Bの各々は、RNN132における最終出力層153の出力ベクトルを処理するように構成されている。
【0110】
サブNN135Aは、
図21に示されるように、線形変換層(LL)171A、正規化層(NL)172A、非線形変換層(NLL)173A、線形変換層(LL)174A、非線形変換層(NLL)175A、及び、互いに並列に配置された線形変換層(LL)176A
1,176A
2,176A
3を有する。機械学習アルゴリズムにより更新されるパラメータ群(たとえば、重み行列の要素及びバイアスベクトルの要素)の値を除いて、これら線形変換層171A、正規化層172A、非線形変換層173A、線形変換層174A及び非線形変換層175Aは、それぞれ、
図20に示した線形変換層161A、正規化層162A、非線形変換層163A、線形変換層164A及び非線形変換層165Aとそれぞれ同じ基本構成を有している。線形変換層176A
1~176A
3のうちのi番目の線形変換層176A
iは、非線形変換層175Aの出力ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより第iの異常事象の度合いを示すスカラー量のリスク度Driを生成することができる(iは1~3の範囲内の任意の整数である。)。リスク度Dr1,Dr2,Dr3は、出力層66のノードを介して外部に出力される。
【0111】
一方、サブNN135Bは、
図21に示されるように、線形変換層(LL)171B、正規化層(NL)172B、非線形変換層(NLL)173B、線形変換層(LL)174B、非線形変換層(NLL)175B、及び、互いに並列に配置された線形変換層(LL)176B
1,176B
2,176B
3を有する。機械学習アルゴリズムにより更新されるパラメータ群(たとえば、重み行列の要素及びバイアスベクトルの要素)の値を除いて、これら線形変換層171B、正規化層172B、非線形変換層173B、線形変換層174B及び非線形変換層175Bは、それぞれ、
図20に示した線形変換層161B、正規化層162B、非線形変換層163B、線形変換層164B及び非線形変換層165Bとそれぞれ同じ基本構成を有している。線形変換層176B
1~176B
3のうちのj番目の線形変換層176B
jは、非線形変換層175Bの出力ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより第jの異常事象が発生するであろう予測時間Tpjを生成することができる(jは1~3の範囲内の任意の整数である。)。予測時間Tp1,Tp2,Tp3は、出力層66のノードを介して外部に出力される。
【0112】
なお、
図21の例では、サブNN135Aにて非線形変換層175Aの出力を処理するように並列に配置された線形変換層176A
1~176A
3の数は3つであり、サブNN135Bにて非線形変換層175Bの出力を処理するように並列に配置された線形変換層176B
1~176B
3の数は3つであるが、これらに限定されるものではない。非線形変換層175Aの出力を処理するように並列に配置される線形変換層の数を4つ以上とし、非線形変換層175Bの出力を処理するように並列に配置される線形変換層の数を4つ以上とするようにサブNN135A,135Bの構成が適宜変更されてもよい。これにより、4種類以上の異常事象の発生を予測できるNN構造を構築することができる。
【0113】
図22は、NN構造35の他の変形例であるNN構造37を表す図である。NN構造37は3種類の異常事象の発生を予測できるように構成されている。
【0114】
図22を参照すると、NN構造37は、3階のテンソルで構成された多次元配列データMDyを受容する入力層44と、入力層44を介して入力された多次元配列データMDyを処理するように構成されたCNN130,131及びRNN132を含む中間層構造57と、中間層構造57の出力に基づいて3種類の予測情報(Dr1,Tp1),(Dr2,Tp2),(Dr3,Tp3)を出力するように構成された出力層66とを有している。中間層構造57は、さらに、互いに並列に配置された6つのサブNN136
1,136
2,136
3,136
4,136
5,136
6からなる順伝播型NN136を有する。サブNN136
1~136
6の各々は、RNN132における最終出力層153の出力ベクトルを処理するように構成されている。
【0115】
サブNN136
1~136
3のうちのi番目のサブNN136
iは、
図22に示されるように、線形変換層(LL)181
i、正規化層(NL)182
i、非線形変換層(NLL)183
i、線形変換層(LL)184
i、非線形変換層(NLL)185
i及び線形変換層(LL)186
iを有する(iは1~3の範囲内の任意の整数である。)。機械学習アルゴリズムにより更新されるパラメータ群(たとえば、重み行列の要素及びバイアスベクトルの要素)の値を除いて、これら線形変換層181
i、正規化層182
i、非線形変換層183
i、線形変換層184
i、非線形変換層185
i及び線形変換層186
iは、
図20に示した線形変換層161A、正規化層162A、非線形変換層163A、線形変換層164A、非線形変換層165A及び線形変換層166Aとそれぞれ同じ基本構成を有している。i番目の線形変換層186
iは、非線形変換層185
iの出力ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより第iの異常事象の度合いを示すスカラー量のリスク度Driを生成することができる。リスク度Dr1,Dr2,Dr3は、出力層66のノードを介して外部に出力される。
【0116】
サブNN136
4~136
6のうちのj番目のサブNN136
jは、
図22に示されるように、線形変換層(LL)181
j、正規化層(NL)182
j、非線形変換層(NLL)183
j、線形変換層(LL)184
j、非線形変換層(NLL)185
j及び線形変換層(LL)186
jを有する(jは4~6の範囲内の任意の整数である。)。機械学習アルゴリズムにより更新されるパラメータ群(たとえば、重み行列の要素及びバイアスベクトルの要素)の値を除いて、これら線形変換層181
j、正規化層182
j、非線形変換層183
j、線形変換層184
j、非線形変換層185
j及び線形変換層186
jは、
図20に示した線形変換層161B、正規化層162B、非線形変換層163B、線形変換層164B、非線形変換層165B及び線形変換層166Bとそれぞれ同じ基本構成を有している。j番目の線形変換層186
jは、非線形変換層185
jの出力ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより第(j-3)の異常事象が発生するであろう予測時間を生成することができる。予測時間Tp1,Tp2,Tp3は、出力層66のノードを介して外部に出力される。
【0117】
なお、
図22の例では、RNN132の出力ベクトルを処理するように並列に配置されたサブNN136
1~136
6の数は6つであるが、これに限定されるものではない。RNN132の出力ベクトルを処理するように並列に配置されるサブNNの数が8つ以上となるように順伝播型NN136の構成が適宜変更されてもよい。これにより、4種類以上の異常事象の発生を予測できるNN構造を構築することができる。
【0118】
図23は、一例としてのNN構造38を表す図である。
図23を参照すると、NN構造38は、3階のテンソルで構成された多次元配列データMDyを受容する入力層44と、互いに並列に配置されたサブ中間層構造58A,58Bからなる中間層構造と、この中間層構造の出力に基づいて予測情報(Dr,Tp)を出力するように構成された出力層64とを有している。
【0119】
サブ中間層構造58Aは、畳み込みニューラルネットワーク(CNN)130A,131A、再帰型ニューラルネットワーク(RNN)132A及び順伝播型NN137Aを有する。CNN130A,131A及びRNN132Aは、機械学習アルゴリズムにより更新されるパラメータ群(たとえば、重み行列の要素及びバイアスベクトルの要素)の値を除いて、
図18に示したCNN130,131及び132とそれぞれ同じ基本構成を有している。また、順伝播型NN137Aは、
図23に示されるように、線形変換層(LL)191A、正規化層(NL)192A、非線形変換層(NLL)193A、線形変換層(LL)194A、非線形変換層(NLL)195A及び線形変換層(LL)196Aを有する。機械学習アルゴリズムにより更新されるパラメータ群(たとえば、重み行列の要素及びバイアスベクトルの要素)の値を除いて、これら線形変換層191A、正規化層192A、非線形変換層193A、線形変換層194A、非線形変換層195A及び線形変換層196Aは、
図20に示した線形変換層161A、正規化層162A、非線形変換層163A、線形変換層164A、非線形変換層165A及び線形変換層166Aとそれぞれ同じ基本構成を有している。
【0120】
線形変換層196Aは、非線形変換層195Aの出力ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより異常事象の度合いを示すスカラー量のリスク度Drを生成することができる。リスク度Drは、出力層64のノードを介して外部に出力される。
【0121】
一方、サブ中間層構造58Bは、畳み込みニューラルネットワーク(CNN)130B,131B、再帰型ニューラルネットワーク(RNN)132B及び順伝播型NN137Bを有する。CNN130B,131B及びRNN132Bは、機械学習アルゴリズムにより更新されるパラメータ群(たとえば、重み行列の要素及びバイアスベクトルの要素)の値を除いて、
図18に示したCNN130,131及び132とそれぞれ同じ基本構成を有している。また、順伝播型NN137Bは、
図23に示されるように、線形変換層(LL)191B、正規化層(NL)192B、非線形変換層(NLL)193B、線形変換層(LL)194B、非線形変換層(NLL)195B及び線形変換層(LL)196Bを有する。機械学習アルゴリズムにより更新されるパラメータ群(たとえば、重み行列の要素及びバイアスベクトルの要素)の値を除いて、これら線形変換層191B、正規化層192B、非線形変換層193B、線形変換層194B、非線形変換層195B及び線形変換層196Bは、
図20に示した線形変換層161B、正規化層162B、非線形変換層163B、線形変換層164B、非線形変換層165B及び線形変換層166Bとそれぞれ同じ基本構成を有している。
【0122】
線形変換層196Bは、非線形変換層195Bの出力ベクトルに対して、重み行列とバイアスベクトルとを用いた線形変換を行うことにより異常事象が発生するであろう予測時間Tpを生成することができる。予測時間Tpは、出力層64のノードを介して外部に出力される。
【0123】
上記のとおり、
図18及び
図20~
図23に示したNN構造34,35,36,37,38の各々は、多次元配列データMDyのみを受容するように構成されている。この代わりに、多次元配列データMDyと対象物体Tgtの属性情報とを受容するようにそれらNN構造の構成が変形されてもよい。具体的には、NN構造34,35,36,37,38の各々において、入力層を介して入力された属性情報とRNN(再帰型ニューラルネットワーク)の出力とを連結するように構成された連結層を組み込むことで、NN構造の変形例を得ることができる。
【0124】
対象物体Tgtの属性情報としては、たとえば、人などの生体の固有の情報から構成されるスカラー量またはベクトル量が使用可能である。より具体的には、たとえば、属性情報として、年齢、性別、肥満度(BMI)、及び、糖尿病などの特定の疾患の有無をそれぞれ示す数値が使用できる。この場合、
図1に示されるデータ再構成部25または推論演算部27は、属性情報があらかじめ格納された内部メモリ(図示せず)を有し、この内部メモリから読み出された属性情報をNN構造に供給するように構成されればよい。あるいは、データ再構成部25または推論演算部27は、外部の情報源(図示せず)から属性情報を取得し、取得された属性情報をNN構造に供給するように構成されてもよい。
【0125】
図24は、
図23に示したNN構造38の変形例であるNN構造39を表す図である。
図23を参照すると、NN構造39は、3階のテンソルで構成された多次元配列データMDy及び対象物体Tgtの属性情報ADを受容する入力層49と、サブ中間層構造59A,59Bからなる中間層構造と、この中間層構造の出力に基づいて予測情報(Dr,Tp)を出力するように構成された出力層64とを有している。
【0126】
サブ中間層構造59Aは、CNN130A,131A、RNN132A、連結層76A及び順伝播型NN138Aを有する。連結層76Aは、RNN132Aの出力ベクトルと、入力層49を介して入力された属性情報ADのスカラー値またはベクトルとを連結することで連結ベクトルを生成することができる。たとえば、連結層76Aは、RNN132Aから入力された40次元のベクトルと、属性情報ADの10次元のベクトルとを連結して50次元の連結ベクトルを生成するように構成され得る。
【0127】
順伝播型NN138Aは、連結層76Aから入力された連結ベクトルを処理するように構成されており、
図23に示した順伝播型NN137Aと同じ基本構成を有する。
図24に示されるように、順伝播型NN138Aは、線形変換層(LL)201A、正規化層(NL)202A、非線形変換層(NLL)203A、線形変換層(LL)204A、非線形変換層(NLL)205A及び線形変換層(LL)206Aを有する。これら線形変換層201A、正規化層202A、非線形変換層203A、線形変換層204A、非線形変換層205A及び線形変換層206Aは、
図23に示した順伝播型NN137Aにおける線形変換層191A、正規化層192A、非線形変換層193A、線形変換層194A、非線形変換層195A及び線形変換層196Aとそれぞれ同じ基本構成を有している。線形変換層206Aは、非線形変換層205Aの出力に対して、重み行列とバイアスベクトルとを用いた線形変換を行うことによりスカラー量のリスク度Drを生成する。リスク度Drは、出力層64のノードを介して外部に出力される。
【0128】
一方、サブ中間層構造59Bは、CNN130B,131B、RNN132B、連結層76B及び順伝播型NN138Bを有する。連結層76Bは、RNN132Bの出力ベクトルと、入力層49を介して入力された属性情報ADのスカラー値またはベクトルとを連結することで連結ベクトルを生成することができる。たとえば、連結層76Bは、RNN132Bから入力された40次元のベクトルと、属性情報ADの10次元のベクトルとを連結して50次元の連結ベクトルを生成するように構成され得る。
【0129】
順伝播型NN138Bは、連結層76Bから入力された連結ベクトルを処理するように構成されており、
図23に示した順伝播型NN137Bと同じ基本構成を有する。
図24に示されるように、順伝播型NN138Bは、線形変換層(LL)201B、正規化層(NL)202B、非線形変換層(NLL)203B、線形変換層(LL)204B、非線形変換層(NLL)205B及び線形変換層(LL)206Bを有する。これら線形変換層201B、正規化層202B、非線形変換層203B、線形変換層204B、非線形変換層205B及び線形変換層206Bは、
図23に示した順伝播型NN138Bにおける線形変換層191B、正規化層192B、非線形変換層193B、線形変換層194B、非線形変換層195B及び線形変換層196Bとそれぞれ同じ基本構成を有している。線形変換層206Bは、非線形変換層205Bの出力に対して、重み行列とバイアスベクトルとを用いた線形変換を行うことによりスカラー量の予測時間Tpを生成する。予測時間Tpは、出力層64のノードを介して外部に出力される。
【0130】
以上に説明したように
図24に示したNN構造39は、測定パラメータとこれら測定パラメータに割り当てられた相対時間値とを配列要素としてもつ多次元配列データMDyに加えて、対象物体Tgtの属性情報ADを受容して処理することができるので、推論演算部27は、NN構造39に基づいて、対象物体Tgtに関する予測情報(Dr,Tp)をより高い精度で算出することができる。
【0131】
なお、
図23及び
図24の例では、多次元配列データMDyを並列に処理するように並列に配置されたサブ中間層構造の数は2つであるが、これに限定されるものではない。多次元配列データMDyを並列に処理するように並列に配置されるサブ中間層構造の数が4つ以上となるようにNN構造38,39の各構成が適宜変形されてもよい。これにより、2種類以上の異常事象の発生を予測できるNN構造を構築することができる。
【0132】
次に、上記した予測情報を用いたフィードバック制御システムについて説明する。
図25は、本開示に係る一実施形態の異常予測システム2の構成を概略的に示すブロック図である。
【0133】
図25に示されるように、異常予測システム2は、各々が対象物体Tgtの観測または処理を行うための複数台の機器E
0,…,E
K-1と、これら機器E
0,…,E
K-1からそれぞれ供給された複数のデータ時系列D
0,…,D
K-1に基づいて少なくとも1つの異常事象の発生の発生を予測するように構成された異常予測装置11とを備えている。ここで、Kは、機器E
0~E
K-1の台数を表す3以上の正整数である。機器E
0,…,E
K-1は、それぞれ測定器S
0,…,S
K-1を有する。
図25に示される各測定器S
kの機能は、
図1に示した測定器S
kの機能と同じである。なお、機器E
0,…,E
K-1の台数は3以上に限定されるものではなく、2台の機器を備えるように異常予測システム2の構成が適宜変更されてもよい。
【0134】
異常予測装置11は、
図1に示した異常予測装置10と同様に、機器E
0,…,E
K-1からそれぞれ供給されたデータ時系列D
0,…,D
K-1から多次元配列データを再構成するように構成されたデータ再構成系20と、当該多次元配列データを入力とするNN構造30に基づく演算を実行することにより異常事象に関する予測情報を算出するように構成された推論演算部27とを備えている。異常予測装置11は、さらに、推論演算部27で算出された予測情報に応じて、機器E
0,…,E
K-1の動作条件を変更するループ制御を行うように構成されたフィードバック制御部28を備える。
【0135】
フィードバック制御部28は、当該予測情報に応じて、機器E0,…,EK-1の動作条件を適応的に変更するための制御情報CTを生成し、制御情報CTを機器E0,…,EK-1に供給することができる。機器E0,…,EK-1は、制御情報CTに応じた動作を行うように構成されている。たとえば、リスク度Dr及び予測時間Tpの組が所定の条件に合致したとき(たとえば、リスク度Drがあらかじめ定めた閾値を超えたとき)をトリガとして、フィードバック制御部28は、制御情報CTを生成してもよい。これにより、異常事象が実際に発生することを未然に防ぐことが可能となる。
【0136】
上記のループ制御は、機器E0,…,EK-1の動作の強度が、特定の動作の強度を調節するための測定パラメータに依存する場合に有効である。たとえば、送液濃度及び運転温度など速度系のパラメータがこれにあたる。このループ制御が有効に機能するためには、異常事象発生の予測が早期になされること(たとえば、予測情報Tpが生成された時刻と予測時間Tpとの間の差が20分以上あること)が望ましい。すなわち、機器E0,…,EK-1の制御系による変更がモニタリングに反映されるための時間的猶予が必要である。
【0137】
次に、
図26を参照しつつ、上記した異常予測装置11による処理手順について以下に説明する。
図26は、ループ制御の処理手順の一例を概略的に表すフローチャートである。
図26に示されるステップS11~S13は、
図6に示したステップS11~S13と同様である。
【0138】
ステップS13の後は、フィードバック制御部28は、生成された予測情報(Dr,Tp)が所定の条件と合致するかどうかを判定する(ステップS14)。たとえば、機器Ekの運転温度が許容範囲を超えるという異常事象のリスク度Drが閾値を超えたかどうかに応じて、予測情報が所定の条件と合致したか否かを判定することができる。予測情報が所定の条件と合致しないときは(ステップS14のNO)、フィードバック制御部28は、処理をステップS11に戻す。
【0139】
一方、予測情報が所定の条件と合致したときは(ステップS14のYES)、フィードバック制御部28は、予測情報に応じて、機器E0,…,EK-1のうちの少なくとも1つの機器の動作条件を変更するための制御情報CTを生成し(ステップS15)、制御情報CTを送信する(ステップS16)。その後、フィードバック制御部28は、処理を続行すると判定したときは(ステップS20のYES)、ステップS11に処理を戻す。最終的に、処理を続行しないと判定したときは(ステップS20のNO)、フィードバック制御部28は処理を終了させる。
【0140】
以上に説明したように異常予測システム3は、データ再構成系20、推論演算部27及びフィードバック制御部28を備えているので、異常事象の発生を未然に防ぐことができ、機器E0,…,EK-1を安全に動作させることが可能となる。
【0141】
次に、他の実施形態の異常予測システムについて説明する。上記した異常予測システム1,2では、異常予測装置10,11内のデータ再構成部25が、測定パラメータに相対時間値τを割り当てる機能を有している。この代わりに、測定パラメータに相対時間値τを割り当てる機能を機器が備える実施形態もあり得る。
図27は、そのような実施形態の1つである異常予測システム3の構成を概略的に示すブロック図である。
【0142】
図27に示されるように、異常予測システム3は、各々が対象物体Tgtの観測または処理を行うための複数台の機器U
0,…,U
K-1と、これら機器U
0,…,U
K-1からそれぞれ供給された複数のベクトル系列G
0,…,G
K-1に基づいて少なくとも1つの異常事象の発生の発生を予測するように構成された異常予測装置12とを備えている。ここで、Kは、機器U
0~U
K-1の台数を表す3以上の正整数である。機器U
0~U
K-1は、たとえば、医療機器、製造機器またはモニタリング機器であればよい。なお、機器U
0,…,U
K-1の台数は3以上に限定されるものではなく、2台の機器を備えるように異常予測システム3の構成が適宜変更されてもよい。
【0143】
機器U
0,…,U
K-1は、それぞれ測定器S
0,…,S
K-1を有する。
図27に示される各測定器S
kの機能は、
図1に示した測定器S
kの機能と同じである。各測定器S
kは、当該各測定器S
kを有する機器U
kの状態または対象物体Tgtの状態を物理的(たとえば、光学的、電気的または音響的)に測定し、その結果得た測定量D
k(t)の時系列からなるデータ時系列D
kを出力するように構成されている。
【0144】
さらに機器U
0,…,U
K-1は、それぞれ系列生成器V
0,…,V
K-1を有している。系列生成器V
0,…,V
K-1は、測定器S
0,…,S
K-1から入力されたデータ時系列D
0,…,D
K-1からそれぞれベクトル系列G
0,…,G
K-1を並列に生成するように構成されている。1つのベクトル系列G
kは、各々が少なくとも1つの測定パラメータとこれに割り当てられた相対時間値τとをベクトル要素としてもつ複数のベクトルの系列からなる。系列生成器V
0,…,V
K-1は、機器U
0,…,U
K-1内のタイマー(図示せず)を用いて、共通の時間基準に基づく相対時間値τを測定パラメータに割り当てる機能を有している。具体的には、系列生成器V
0,…,V
K-1で生成されるベクトル系列G
0,…,G
K-1は、
図7または
図8に示したベクトル系列G
0,…,G
K-1であればよい。ただし、
図7及び
図8の例では、ベクトル系列G
0,…,G
K-1の系列長はすべて同じ値(=N)であるが、これに限定されるものではない。i,jを1~Kの範囲内の互いに異なる任意整数(i≠j)とするとき、i番目の系列生成器V
iで生成されるベクトル系列G
iの系列長と、j番目の系列生成器V
jで生成されるベクトル系列G
jの系列長とが互いに異なっていてもよい。
【0145】
異常予測装置12は、伝送ケーブルなどの有線伝送路または無線伝送路を介して機器U0,…,UK-1と接続されている。機器U0,…,UK-1は、系列生成器V0,…,VK-1でそれぞれ得られたベクトル系列G0,…,GK-1を有線伝送路または無線伝送路を介して異常予測装置12に送信する機能を有し、異常予測装置12は、機器U0,…,UK-1からベクトル系列G0,…,GK-1を受信する機能を有している。
【0146】
図27に示されるように、異常予測装置12は、機器U
0,…,U
K-1からそれぞれ供給されたベクトル系列G
0,…,G
K-1を受け付けて一時的に記憶するデータ入力部24と、データ入力部24を介して入力されたベクトル系列G
0,…,G
K-1を統合することにより、NN構造30の入力層に入力されるべき多次元配列データを生成するように構成された統合部26と、当該多次元配列データを入力とするNN構造30に基づく演算を実行することにより異常事象に関する予測情報を算出するように構成された推論演算部27とを備えている。
図27に示されるNN構造30は、
図9~
図11及び
図16に示したNN構造31~33,31Bのいずれかと同じ構成を有していればよい。よって、ベクトル系列G
0,…,G
K-1の間で不整合が生じている場合(たとえば、
図8に示すような次元の不整合が生じている場合)でも、NN構造30はその不整合を補償することができるので、推論演算部27は、NN構造30に基づく信頼性の高い演算を実行することができる。
【0147】
異常予測システム3では、
図27に示されるように、系列生成器V
0,…,V
K-1、データ入力部24及び統合部26の組合せによって、データ再構成系21が構成されている。
【0148】
次に、
図28を参照しつつ、上記した異常予測装置12による処理手順について以下に説明する。
図28は、異常事象の発生を予測するための処理手順の一例を概略的に示すフローチャートである。
【0149】
図28を参照すると、統合部26は、データ入力部24に一時的に記憶されているデータ群の中からベクトル系列G
0,…,G
K-1を読み込み(ステップS11A)、当該ベクトル系列G
0,…,G
K-1を統合することにより、推論演算部27(すなわちNN構造30の入力層)に入力されるべき多次元配列データを生成する(ステップS12A)。
【0150】
次いで、推論演算部27は、多次元配列データを入力としてニューラルネットワーク構造30に基づく演算を実行することにより、異常事象に関する予測情報を算出する(ステップS13)。
【0151】
その後、推論演算部27は、処理を続行すると判定したときは(ステップS20のYES)、ステップS11Aに処理を戻す。このとき、統合部26は、データ入力部24に一時的に記憶されている一群のデータの中から新たなベクトル系列G0,…,GK-1を読み込み(ステップS11A)、当該新たなベクトル系列G0,…,GK-1から多次元配列データを生成する(ステップS12A)。次いで、推論演算部27は、当該多次元配列データを入力としてニューラルネットワーク構造30に基づく演算を実行することにより、異常事象に関する予測情報を算出する(ステップS13)。このようにして異常予測装置12は、逐次的かつリアルタイムに異常事象の発生を予測することができる。最終的に、推論演算部27は、処理を続行しないと判定したときは(ステップS20のNO)、処理を終了させる。
【0152】
次に、上記した異常予測システム3の変形例であるフィードバック制御システムについて説明する。
図29は、本開示に係る一実施形態の異常予測システム4の構成を概略的に示すブロック図である。
【0153】
図29に示されるように、異常予測システム4は、各々が対象物体Tgtの観測または処理を行うための複数台の機器U
0,…,U
K-1と、これら機器U
0,…,U
K-1からそれぞれ供給された複数のベクトル系列G
0,…,G
K-1に基づいて少なくとも1つの異常事象の発生の発生を予測するように構成された異常予測装置13とを備えている。なお、機器U
0,…,U
K-1の台数は3以上に限定されるものではなく、2台の機器を備えるように異常予測システム4の構成が適宜変更されてもよい。
【0154】
異常予測装置13は、
図27に示した異常予測装置12と同様に、データ入力部24、統合部26及び推論演算部27を備えている。これらデータ入力部24、統合部26及び系列生成器V
0,…,V
K-1によって、データ再構成系21が構成される。異常予測装置13は、さらに、推論演算部27で算出された予測情報に応じて、機器U
0,…,U
K-1の動作条件を変更するループ制御を行うように構成されたフィードバック制御部28を備える。
【0155】
フィードバック制御部28は、当該予測情報に応じて、機器U0,…,UK-1の動作条件を適応的に変更するための制御情報CTを生成し、制御情報CTを機器U0,…,UK-1に供給することができる。機器U0,…,UK-1は、制御情報CTに応じた動作を行うように構成されている。たとえば、リスク度Dr及び予測時間Tpの組が所定の条件に合致したとき(たとえば、リスク度Drがあらかじめ定めた閾値を超えたとき)をトリガとして、フィードバック制御部28は、制御情報CTを生成してもよい。これにより、異常事象が実際に発生することを未然に防ぐことが可能となる。
【0156】
次に、
図30を参照しつつ、上記した異常予測装置13による処理手順について以下に説明する。
図30は、ループ制御の処理手順の一例を概略的に表すフローチャートである。
図30に示されるステップS11A~S13は、
図28に示したステップS11A~S13と同様であり、
図30に示されるステップS14~S20は、
図26に示したステップS14~S20と同様である。
【0157】
ステップS13の後は、フィードバック制御部28は、生成された予測情報(Dr,Tp)が所定の条件と合致するかどうかを判定する(ステップS14)。予測情報が所定の条件と合致しないときは(ステップS14のNO)、フィードバック制御部28は、処理をステップS11Aに戻す。一方、予測情報が所定の条件と合致したときは(ステップS14のYES)、フィードバック制御部28は、予測情報に応じて、機器U0,…,UK-1のうちの少なくとも1つの機器の動作条件を変更するための制御情報CTを生成し(ステップS15)、制御情報CTを送信する(ステップS16)。その後、フィードバック制御部28は、処理を続行すると判定したときは(ステップS20のYES)、ステップS11Aに処理を戻す。最終的に、処理を続行しないと判定したときは(ステップS20のNO)、フィードバック制御部28は処理を終了させる。
【0158】
以上に説明したように異常予測システム4は、データ再構成系21及び推論演算部27及びフィードバック制御部28を備えているので、異常事象の発生を未然に防ぐことができ、機器U0,…,UK-1を安全に動作させることが可能となる。
【0159】
図1に示した異常予測装置10の場合と同様に、上記した異常予測装置11~13における各異常予測装置の構成要素の全部または一部は、1つ以上のプロセッサを含む1台のコンピュータで実現されてもよいし、あるいは、通信路を介して相互に接続された複数台のコンピュータで実現されてもよい。各異常予測装置の構成要素の全部または一部は、不揮発性メモリ(コンピュータ読み取り可能な記録媒体)から読み出されたソフトウェアまたはファームウェアのコード(命令群)による処理を実行する1つまたは複数の演算装置(Processing Units)を含む1つ以上のプロセッサで実現されればよい。あるいは、各異常予測装置の構成要素の全部または一部は、FPGAなどの半導体集積回路を有する1つ以上のプロセッサにより実現可能である。あるいは、FPGAなどの半導体集積回路と、CPUやGPUなどの演算装置との組合せを含む1以上のプロセッサによって、各異常予測装置の構成要素の全部または一部が実現されてもよい。
【0160】
以上、図面を参照して本開示に係る種々の実施形態について述べたが、これら実施形態は例示であり、これら実施形態以外の様々な形態もあり得る。たとえば、
図18及び
図20~
図24の例では、各中間層構造または各サブ中間層構造における直列に結合されたCNN(畳み込みニューラルネットワーク)の数は2つであるが、これに限定されるものではない。CNNの数が1つまたは3つ以上となるように各中間層構造または各サブ中間層構造が適宜変更されてもよい。
【0161】
【0162】
また、上記したとおり、
図1及び
図25に示した異常予測システム1,2の各々は、複数台の機器E
0,…,E
K-1を含むように構成されているが、この代わりに、異常予測システム1,2の各々の外に機器E
0,…,E
K-1が配置されるように(言い換えれば、異常予測システム1,2が機器E
0,…,E
K-1を含まない形態で機器E
0,…,E
K-1の出力を利用するように)異常予測システム1,2の構成が変更されてもよい。
【0163】
本発明の趣旨及び範囲から逸脱することなく、上記実施形態の変更、追加及び改良を適宜行うことができることが理解されるべきである。本発明の範囲は、特許請求の範囲の記載に基づいて解釈されるべきであり、さらにその均等物を含むものと理解されるべきである。
【産業上の利用可能性】
【0164】
本開示に係る異常予測装置、方法及びコンピュータプログラムは、異常事象の発生を高い精度で予測することができるので、たとえば、工業生産における不良品の発生の予測、機器動作の障害発生の予測、医療監視における機器障害発生の予測、及び、医療監視における生体の有害事象発生の予測のために好適に使用することができる。
【符号の説明】
【0165】
1~4:異常予測システム、10~13:異常予測装置、20,21:データ再構成系、23,24:データ入力部、25:データ再構成部、26:統合部、27:推論演算部、28:フィードバック制御部、30~39:ニューラルネットワーク構造(NN構造)、40~42,44,48,49:入力層、50~57:中間層構造、58A,58B,59A,59B:サブ中間層構造、60~64,66:出力層、700~70K-1:再帰型ニューラルネットワーク(RNN)、81,81B,81C,82,83:順伝播型ニューラルネットワーク(順伝播型NN)、90,90A,90B,90C,100,100A,100B,100C,110,120:サブニューラルネットワーク(サブNN)、130,130A,130B,131,131A,131B:畳み込みニューラルネットワーク(CNN)、132,132A,132B:再帰型ニューラルネットワーク(RNN)、133,134,135,136,137A,137B,138A,138B:順伝播型ニューラルネットワーク(順伝播型NN)、134A,134B,135A,135B,1361~1366:サブニューラルネットワーク(サブNN)、300:情報処理装置、301:プロセッサ、302:RAM(Random Access Memory)、303:不揮発性メモリ、304:大容量メモリ、305:入出力インタフェース、306:信号路。
【手続補正書】
【提出日】2023-07-27
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
複数の測定器で得られた複数のデータ時系列から少なくとも1つの異常事象の発生を予測する異常予測システムであって、
前記複数のデータ時系列から、複数の測定パラメータと当該複数の測定パラメータにそれぞれ割り当てられた複数の相対時間値とを配列要素として含む多次元配列データを再構成するように構成されたデータ再構成系と、
前記多次元配列データを受容する入力層、1つまたは複数の再帰型ニューラルネットワークを含む中間層構造、及び出力層を有するニューラルネットワーク構造に基づく演算を実行することにより、前記異常事象に関する予測情報を算出するように構成された推論演算部と
を備える異常予測システム。
【請求項2】
請求項1に記載の異常予測システムであって、前記予測情報は、前記異常事象の度合いを示すリスク度と、前記異常事象が発生するであろう予測時間との組を示す情報である、異常予測システム。
【請求項3】
請求項1に記載の異常予測システムであって、
前記データ再構成系は、
前記複数の測定器からそれぞれ供給された前記複数のデータ時系列を受け付けるデータ入力部と、
前記データ入力部を介して入力された前記複数のデータ時系列から前記多次元配列データを再構成するように構成されたデータ再構成部と
を含む、異常予測システム。
【請求項4】
請求項3に記載の異常予測システムであって、
前記データ再構成部は、前記複数のデータ時系列から複数のベクトル系列を前記多次元配列データとして生成するように構成され、
前記複数のベクトル系列の各々は、前記複数の測定パラメータの各々を指定するための次元と、前記複数の相対時間値の各々を指定するための次元とを有し、
前記複数の再帰型ニューラルネットワークは、前記入力層を介して入力された前記複数のベクトル系列をそれぞれ並列に処理するように構成されている、異常予測システム。
【請求項5】
請求項1に記載の異常予測システムであって、
前記データ再構成系は、
前記複数のデータ時系列からそれぞれ複数のベクトル系列を生成するように構成された複数の系列生成器と、
前記複数の系列生成器からそれぞれ供給された前記複数のベクトル系列を受け付けるデータ入力部と、
前記データ入力部を介して入力された前記複数のベクトル系列を統合することにより、前記入力層に入力されるべき前記多次元配列データを生成するように構成された統合部とを含み、
前記複数の系列生成器の各系列生成器は、各々が少なくとも1つの測定パラメータと当該少なくとも1つの測定パラメータに割り当てられた相対時間値とをベクトル要素として有する複数のベクトルからなるベクトル系列を生成するように構成されており、
前記複数の再帰型ニューラルネットワークは、前記入力層を介して入力された前記複数のベクトル系列をそれぞれ並列に処理するように構成されている、異常予測システム。
【請求項6】
請求項4または5に記載の異常予測システムであって、
前記中間層構造は、
前記複数の再帰型ニューラルネットワークの出力を連結するように構成された連結層と、
前記連結層の出力を処理するように構成された順伝播型ニューラルネットワークと
を含む、異常予測システム。
【請求項7】
請求項6に記載の異常予測システムであって、
前記順伝播型ニューラルネットワークは、
前記連結層の出力を処理するように構成された第1のサブニューラルネットワークと、
前記第1のサブニューラルネットワークと並列に配置され、前記連結層の出力を処理するように構成された第2のサブニューラルネットワークと
を含み、
前記推論演算部は、前記第1のサブニューラルネットワークの出力に基づいて前記異常事象の度合いを示すリスク度を生成し、前記第2のサブニューラルネットワークの出力に基づいて前記異常事象が発生するであろう予測時間を生成するように構成されている、異常予測システム。
【請求項8】
請求項6または7に記載の異常予測システムであって、
前記複数の測定器のうちの少なくとも1つは、対象物体の状態を測定するように構成されており、
前記連結層は、前記入力層を介して入力された前記対象物体の属性情報と、前記複数の再帰型ニューラルネットワークの出力とを連結するように構成されている、異常予測システム。
【請求項9】
請求項3に記載の異常予測システムであって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された1つまたは複数の畳み込みニューラルネットワークと、
前記1つまたは複数の畳み込みニューラルネットワークの出力を処理するように構成された前記1つまたは複数の再帰型ニューラルネットワークと
を含む、異常予測システム。
【請求項10】
請求項9に記載の異常予測システムであって、前記多次元配列データは、3階のテンソルで構成されている、異常予測システム。
【請求項11】
請求項9に記載の異常予測システムであって、
前記中間層構造は、
前記再帰型ニューラルネットワークの出力を処理するように構成された第1のサブニューラルネットワークと、
前記第1のサブニューラルネットワークと並列に配置され、前記再帰型ニューラルネットワークの出力を処理するように構成された第2のサブニューラルネットワークと
をさらに含み、
前記推論演算部は、前記第1のサブニューラルネットワークの出力に基づいて前記異常事象の度合いを示すリスク度を生成し、前記第2のサブニューラルネットワークの出力に基づいて前記異常事象が発生するであろう予測時間を生成するように構成されている、異常予測システム。
【請求項12】
請求項9に記載の異常予測システムであって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された第1のサブ中間層構造と、
前記第1のサブ中間層構造と並列に配置され、前記入力層を介して入力された前記多次元配列データを処理するように構成された第2のサブ中間層構造と
を含み、
前記第1のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの少なくとも1つとして設けられた第1の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの1つとして設けられ、前記第1の畳み込みニューラルネットワークの出力を処理するように構成された第1の再帰型ニューラルネットワークと
を含み、
前記第2のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの別の少なくとも1つとして設けられた第2の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの別の1つとして設けられ、前記第2の畳み込みニューラルネットワークの出力を処理するように構成された第2の再帰型ニューラルネットワークと
を含み、
前記推論演算部は、前記第1のサブ中間層構造の出力に基づいて前記異常事象の度合いを示すリスク度を生成し、前記第2のサブ中間層構造の出力に基づいて前記異常事象が発生するであろう予測時間を生成するように構成されている、異常予測システム。
【請求項13】
請求項9に記載の異常予測システムであって、
前記複数の測定器のうちの少なくとも1つは、対象物体の状態を測定するように構成されており、
前記中間層構造は、前記1つまたは複数の再帰型ニューラルネットワークの出力と、前記入力層を介して入力された前記対象物体の属性情報とを連結するように構成された1つまたは複数の連結層をさらに含む、異常予測システム。
【請求項14】
請求項13に記載の異常予測システムであって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された第1のサブ中間層構造と、
前記第1のサブ中間層構造と並列に配置され、前記入力層を介して入力された前記多次元配列データを処理するように構成された第2のサブ中間層構造と
を含み、
前記第1のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの少なくとも1つとして設けられた第1の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの1つとして設けられ、前記第1の畳み込みニューラルネットワークの出力を処理するように構成された第1の再帰型ニューラルネットワークと、
前記複数の連結層のうちの1つとして設けられ、前記第1の再帰型ニューラルネットワークの出力と前記属性情報とを連結するように構成された第1の連結層と、
前記第1の連結層の出力を処理するように構成された第1の順伝播型ニューラルネットワークと
を含み、
前記第2のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの別の少なくとも1つとして設けられた第2の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの別の1つとして設けられ、前記第2の畳み込みニューラルネットワークの出力を処理するように構成された第2の再帰型ニューラルネットワークと、
前記複数の連結層のうちの別の1つとして設けられ、前記第2の再帰型ニューラルネットワークの出力と前記属性情報とを連結するように構成された第2の連結層と、
前記第2の連結層の出力を処理するように構成された第2の順伝播型ニューラルネットワークと
を含む、異常予測システム。
【請求項15】
請求項1~5,9~14のうちのいずれか1項に記載の異常予測システムであって、前記予測情報に応じて、前記複数の測定器のうちの少なくとも1つを含む機器の動作条件を変更する制御を行うフィードバック制御部をさらに備える異常予測システム。
【請求項16】
複数の測定器で得られた複数のデータ時系列から少なくとも1つの異常事象の発生を予測するためにコンピュータによって実行される方法であって、
前記複数のデータ時系列から、複数の測定パラメータと当該複数の測定パラメータにそれぞれ割り当てられた複数の相対時間値とを配列要素として含む多次元配列データを再構成するステップと、
前記多次元配列データを受容する入力層、1つまたは複数の再帰型ニューラルネットワークを含む中間層構造、及び出力層を有するニューラルネットワーク構造に基づく演算を実行することにより、前記異常事象に関する予測情報を算出するステップと
を備える方法。
【請求項17】
請求項16に記載の方法であって、前記予測情報は、前記異常事象の度合いを示すリスク度と、前記異常事象が発生するであろう予測時間との組を示す情報である、方法。
【請求項18】
請求項16に記載の方法であって、
前記多次元配列データを再構成する当該ステップは、前記複数のデータ時系列から複数のベクトル系列を前記多次元配列データとして生成するステップからなり、
前記複数のベクトル系列の各々は、前記複数の測定パラメータの各々を指定するための次元と、前記複数の相対時間値の各々を指定するための次元とを有し、
前記複数の再帰型ニューラルネットワークは、前記入力層を介して入力された前記複数のベクトル系列をそれぞれ並列に処理するように構成されている、方法。
【請求項19】
請求項16に記載の方法であって、
前記多次元配列データを再構成する当該ステップは、
前記複数のデータ時系列から複数のベクトル系列を生成するステップと、
前記複数のベクトル系列を統合することにより、前記入力層に入力されるべき前記多次元配列データを生成するステップと
を含み、
前記複数のベクトル系列の各ベクトル系列は、各々が少なくとも1つの測定パラメータと当該少なくとも1つの測定パラメータに割り当てられた相対時間値とをベクトル要素として有する複数のベクトルからなり、
前記複数の再帰型ニューラルネットワークは、前記入力層を介して入力された前記複数のベクトル系列をそれぞれ並列に処理するように構成されている、方法。
【請求項20】
請求項18または19に記載の方法であって、
前記中間層構造は、
前記複数の再帰型ニューラルネットワークの出力を連結するように構成された連結層と、
前記連結層の出力を処理するように構成された順伝播型ニューラルネットワークと
を含む、方法。
【請求項21】
請求項20に記載の方法であって、
前記順伝播型ニューラルネットワークは、
前記連結層の出力を処理するように構成された第1のサブニューラルネットワークと、
前記第1のサブニューラルネットワークと並列に配置され、前記連結層の出力を処理するように構成された第2のサブニューラルネットワークと
を含み、
前記予測情報を算出する当該ステップは、前記第1のサブニューラルネットワークの出力に基づいて前記異常事象の度合いを示すリスク度を生成するステップと、前記第2のサブニューラルネットワークの出力に基づいて前記異常事象が発生するであろう予測時間を生成するステップとを含む、方法。
【請求項22】
請求項20または21に記載の方法であって、
前記複数の測定器のうちの少なくとも1つは、対象物体の状態を測定するように構成されており、
前記連結層は、前記入力層を介して入力された前記対象物体の属性情報と、前記複数の再帰型ニューラルネットワークの出力とを連結するように構成されている、方法。
【請求項23】
請求項16に記載の方法であって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された1つまたは複数の畳み込みニューラルネットワークと、
前記1つまたは複数の畳み込みニューラルネットワークの出力を処理するように構成された前記1つまたは複数の再帰型ニューラルネットワークと
を含む、方法。
【請求項24】
請求項23に記載の方法であって、前記多次元配列データは、3階のテンソルで構成されている、方法。
【請求項25】
請求項23に記載の方法であって、
前記中間層構造は、
前記再帰型ニューラルネットワークの出力を処理するように構成された第1のサブニューラルネットワークと、
前記第1のサブニューラルネットワークと並列に配置され、前記再帰型ニューラルネットワークの出力を処理するように構成された第2のサブニューラルネットワークと
をさらに含み、
前記予測情報を算出する当該ステップは、前記第1のサブニューラルネットワークの出力に基づいて前記異常事象の度合いを示すリスク度を生成するステップと、前記第2のサブニューラルネットワークの出力に基づいて前記異常事象が発生するであろう予測時間を生成するステップとを含む、方法。
【請求項26】
請求項23に記載の方法であって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された第1のサブ中間層構造と、
前記第1のサブ中間層構造と並列に配置され、前記入力層を介して入力された前記多次元配列データを処理するように構成された第2のサブ中間層構造と
を含み、
前記第1のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの少なくとも1つとして設けられた第1の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの1つとして設けられ、前記第1の畳み込みニューラルネットワークの出力を処理するように構成された第2の再帰型ニューラルネットワークと
を含み、
前記第2のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの別の少なくとも1つとして設けられた第2の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの別の1つとして設けられ、前記第2の畳み込みニューラルネットワークの出力を処理するように構成された第2の再帰型ニューラルネットワークと
を含み、
前記予測情報を算出する当該ステップは、前記第1のサブ中間層構造の出力に基づいて前記異常事象の度合いを示すリスク度を生成するステップと、前記第2のサブ中間層構造の出力に基づいて前記異常事象が発生するであろう予測時間を生成するステップとを含む、方法。
【請求項27】
請求項23に記載の方法であって、
前記複数の測定器のうちの少なくとも1つは、対象物体の状態を測定するように構成されており、
前記中間層構造は、前記1つまたは複数の再帰型ニューラルネットワークの出力と、前記入力層を介して入力された前記対象物体の属性情報とを連結するように構成された1つまたは複数の連結層をさらに含む、方法。
【請求項28】
請求項27に記載の方法であって、
前記中間層構造は、
前記入力層を介して入力された前記多次元配列データを処理するように構成された第1のサブ中間層構造と、
前記第1のサブ中間層構造と並列に配置され、前記入力層を介して入力された前記多次元配列データを処理するように構成された第2のサブ中間層構造と
を含み、
前記第1のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの少なくとも1つとして設けられた第1の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの1つとして設けられ、前記第1の畳み込みニューラルネットワークの出力を処理するように構成された第1の再帰型ニューラルネットワークと、
前記複数の連結層のうちの1つとして設けられ、前記第1の再帰型ニューラルネットワークの出力と前記属性情報とを連結するように構成された第1の連結層と、
前記第1の連結層の出力を処理するように構成された第1の順伝播型ニューラルネットワークと
を含み、
前記第2のサブ中間層構造は、
前記複数の畳み込みニューラルネットワークのうちの別の少なくとも1つとして設けられた第2の畳み込みニューラルネットワークと、
前記複数の再帰型ニューラルネットワークのうちの別の1つとして設けられ、前記第2の畳み込みニューラルネットワークの出力を処理するように構成された第2の再帰型ニューラルネットワークと、
前記複数の連結層のうちの別の1つとして設けられ、前記第2の再帰型ニューラルネットワークの出力と前記属性情報とを連結するように構成された第2の連結層と、
前記第2の連結層の出力を処理するように構成された第2の順伝播型ニューラルネットワークと
を含む、方法。
【請求項29】
請求項16~19,23~28のうちのいずれか1項に記載の方法であって、前記予測情報に応じて、前記複数の測定器のうちの少なくとも1つを含む機器の動作条件を変更する制御を行うステップをさらに備える方法。
【請求項30】
不揮発性メモリから読み出されて単数または複数のプロセッサにより実行されるべきコンピュータプログラムであって、請求項16~19,23~28のうちのいずれか1項に記載の方法を前記単数または複数のプロセッサに実施させるように構成されているコンピュータプログラム。
【請求項31】
不揮発性メモリから読み出されて単数または複数のプロセッサにより実行されるべきコンピュータプログラムであって、請求項29に記載の方法を前記単数または複数のプロセッサに実施させるように構成されているコンピュータプログラム。