(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-29
(45)【発行日】2024-08-06
(54)【発明の名称】モデル更新方法及びモデル更新システム
(51)【国際特許分類】
G06N 20/00 20190101AFI20240730BHJP
【FI】
G06N20/00
(21)【出願番号】P 2022158848
(22)【出願日】2022-09-30
【審査請求日】2023-01-12
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110002365
【氏名又は名称】弁理士法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】幸左 絵美
(72)【発明者】
【氏名】中川 慎二
【審査官】渡辺 順哉
(56)【参考文献】
【文献】特開2020-177427(JP,A)
【文献】特開2022-173863(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
モデル更新装置が実行する、システムの出力又は実現象の観測値を推定するためのモデルを更新するモデル更新方法であって、
前記観測値と、第1入力情報を前記モデルに入力して出力された該観測値の推定値である第1出力情報と、の差分である第1誤差に基づくモデル誤差を演算するモデル誤差演算ステップと、
前記第1誤差と、前記第1入力情報とは異なる第2入力情報を所定パラメータを含む所定関数で表される追加モデル候補に入力して出力された第2出力情報と、の差分である第2誤差に基づく追加モデル誤差を演算する追加モデル誤差演算ステップと、
前記追加モデル誤差を最小化する前記所定パラメータの特定値及び該特定値のときの該追加モデル誤差の最小値を演算する追加モデル誤差最小値演算ステップと、
前記モデル誤差と、前記追加モデル誤差の前記最小値と、の差分であるモデル改善度を演算するモデル改善度演算ステップと、
前記モデル改善度が所定条件を充足するかを判定するモデル改善度判定ステップと、
前記モデル改善度が前記所定条件を充足すると判定された場合に、前記モデルが前記第1入力情報及び前記第2入力情報を入力として前記第1出力情報と前記第2出力情報の和を出力するように、前記特定値を代入した前記追加モデル候補を追加モデルとして該モデルに追加して更新するモデル更新ステップと、
を有することを特徴とするモデル更新方法。
【請求項2】
請求項1に記載のモデル更新方法であって、
前記所定パラメータは、線形結合の係数及びバイアス項であり、
前記追加モデル候補は、前記第2入力情報のそれぞれを入力した各関数の前記線形結合で表される、ことを特徴とするモデル更新方法。
【請求項3】
請求項2に記載のモデル更新方法であって、
前記追加モデル候補は、1つの前記第2入力情報を入力した関数の一次関数の形式で表され、
前記追加モデル誤差演算ステップにおいて前記第2入力情報を1つずつ選択し、選択した1つの前記第2入力情報をもとに前記追加モデル誤差を演算し、前記追加モデル誤差最小値演算ステップ、前記モデル改善度演算ステップ、前記モデル改善度判定ステップ、及び前記モデル更新ステップを繰り返し実行する、ことを特徴とするモデル更新方法。
【請求項4】
請求項3に記載のモデル更新方法であって、
ある前記第2入力情報についての前記追加モデル候補を前記モデルに追加した場合に一定以上のモデル精度の向上が得られた時点で、前記繰り返し実行を終了する、ことを特徴とするモデル更新方法。
【請求項5】
請求項1に記載のモデル更新方法であって、
前記所定条件は、前記モデル改善度が前記モデル誤差に対する所定割合を超過することである、ことを特徴とするモデル更新方法。
【請求項6】
請求項1に記載のモデル更新方法であって、
前記所定条件は、前記モデル改善度が、前記モデル誤差に対する所定割合を前回の前記モデルの更新からの経過時間で除算した値を超過することである、ことを特徴とするモデル更新方法。
【請求項7】
請求項1に記載のモデル更新方法であって、
前記第1誤差を演算する第1誤差演算ステップを有する、ことを特徴とするモデル更新方法。
【請求項8】
請求項1に記載のモデル更新方法であって、
前記モデル誤差は、前記観測値及び前記第1出力情報の時系列データのデータ期間にわたる前記第1誤差の二乗和誤差である、ことを特徴とするモデル更新方法。
【請求項9】
請求項1に記載のモデル更新方法であって、
前記追加モデル誤差は、前記観測値、前記第1出力情報、及び前記第2出力情報の時系列データのデータ期間にわたる前記第2誤差の二乗和誤差であり、
前記追加モデル誤差最小値演算ステップでは、
前記第2誤差の二乗和誤差を最小化する前記特定値と前記最小値を、正規方程式を用いて演算する、ことを特徴とするモデル更新方法。
【請求項10】
請求項1に記載のモデル更新方法であって、
前記モデルは、第1期間に取得及び加工された学習データに基づいて構築されたものであり、
前記追加モデル候補は、前記第1期間よりも後の第2期間に取得及び加工された学習データに基づいて構築されたものである、ことを特徴とするモデル更新方法。
【請求項11】
請求項10に記載のモデル更新方法であって、
前記学習データは、前記モデル及び前記追加モデル候補の構築の際に加工の工数が一定以上に大きいために、少なくとも前記第1期間と前記第2期間とに時期を分けて加工することが必要な業務記録である、ことを特徴とするモデル更新方法。
【請求項12】
請求項1に記載のモデル更新方法であって、
前記モデルは、第1期間に取得及び加工された学習データに基づいて構築されたものであり、
前記追加モデル候補は、前記第1期間よりも一定期間経過後の第2期間に、前記システム又は前記実現象の環境条件が変更又は変化したことに応じて取得及び加工された学習データに基づいて構築されたものである、ことを特徴とするモデル更新方法。
【請求項13】
請求項12に記載のモデル更新方法であって、
前記学習データは、製造現場における生産品の品質管理に関する情報である、ことを特徴とするモデル更新方法。
【請求項14】
請求項1に記載のモデル更新方法であって、
前記モデルは、第1期間に定義された要件定義に基づいて取得及び加工された学習データに基づいて構築されたものであり、
前記追加モデル候補は、前記第1期間よりも後の第2期間に、追加で定義された要件定義に基づいて取得及び加工された学習データに基づいて構築されたものである、ことを特徴とするモデル更新方法。
【請求項15】
請求項14に記載のモデル更新方法であって、
前記学習データは、生産業務における最適計画に関する情報である、ことを特徴とするモデル更新方法。
【請求項16】
システムの出力又は実現象の観測値を推定するためのモデルを更新するモデル更新
システムであって、
前記観測値と、第1入力情報を前記モデルに入力して出力された該観測値の推定値である第1出力情報と、の差分である第1誤差に基づくモデル誤差を演算するモデル誤差演算部と、
前記第1誤差と、前記第1入力情報とは異なる第2入力情報を所定パラメータを含む所定関数で表される追加モデル候補に入力して出力された第2出力情報と、の差分である第2誤差に基づく追加モデル誤差を演算する追加モデル誤差演算部と、
前記追加モデル誤差を最小化する前記所定パラメータの特定値及び該特定値のときの該追加モデル誤差の最小値を演算する追加モデル誤差最小値演算部と、
前記モデル誤差と、前記追加モデル誤差の前記最小値と、の差分であるモデル改善度を演算し、該モデル改善度が所定条件を充足するかを判定するモデル改善度判定部と、
前記モデル改善度が前記所定条件を充足すると判定された場合に、前記モデルが前記第1入力情報及び前記第2入力情報を入力として前記第1出力情報と前記第2出力情報の和を出力するように、前記特定値を代入した前記追加モデル候補を追加モデルとして該モデルに追加して更新するモデル更新部と、
を有することを特徴とするモデル更新
システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、モデル更新方法及びモデル更新システムに関する。
【背景技術】
【0002】
従来から、データの学習により構築された学習済みの学習モデルの精度を向上させるために、学習モデルの入力情報(特徴量、説明変数等)を追加して学習モデルを再学習して性能評価を行い、精度向上が確認されるまで、再学習と性能評価を繰り返すことが一般的に行われている。
【先行技術文献】
【非特許文献】
【0003】
【文献】Alice Zheng、Amanda Casari 著、株式会社ホクソエム訳、「機械学習のための特徴量エンジニアリング-その原理とPythonによる実践(オライリー・ジャパン)」、オーム社、2019年2月23日
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、上述の従来技術では、学習済みの学習モデルの精度を向上させるために、入力情報を追加して学習モデルを一から再構築するため、再構築のコスト(計算負荷及び計算時間)がかかる一方で、必ずしも学習モデルの精度が向上するとは限らなかった。また、複数のフェーズに跨る複雑な時系列データの分析において、複数のフェーズに跨る一定期間にわたって学習を行っても、十分な精度の学習モデルを構築できないというリスクが存在していた。すなわち、学習済みの学習モデルの精度を向上させるためのコストが高い一方で、コストに見合う十分な精度向上が必ずしも期待できないという問題があった。
【0005】
本発明は、上述の背景を鑑みてなされたもので、学習済みの学習モデルの精度を、低コストで十分に向上させるようにすることを目的とする。
【課題を解決するための手段】
【0006】
本発明の一側面では、モデル更新装置が実行する、システムの出力又は実現象の観測値を推定するためのモデルを更新するモデル更新方法であって、前記観測値と、第1入力情報を前記モデルに入力して出力された該観測値の推定値である第1出力情報と、の差分である第1誤差に基づくモデル誤差を演算するモデル誤差演算ステップと、前記第1誤差と、前記第1入力情報とは異なる第2入力情報を所定パラメータを含む所定関数で表される追加モデル候補に入力して出力された第2出力情報と、の差分である第2誤差に基づく追加モデル誤差を演算する追加モデル誤差演算ステップと、前記追加モデル誤差を最小化する前記所定パラメータの特定値及び該特定値のときの該追加モデル誤差の最小値を演算する追加モデル誤差最小値演算ステップと、前記モデル誤差と、前記追加モデル誤差の前記最小値と、の差分であるモデル改善度を演算するモデル改善度演算ステップと、前記モデル改善度が所定条件を充足するかを判定するモデル改善度判定ステップと、前記モデル改善度が前記所定条件を充足すると判定された場合に、前記モデルが前記第1入力情報及び前記第2入力情報を入力として前記第1出力情報と前記第2出力情報の和を出力するように、前記特定値を代入した前記追加モデル候補を追加モデルとして該モデルに追加して更新するモデル更新ステップと、を有することを特徴とする。
【発明の効果】
【0007】
本願の一側面によれば、学習済みの学習モデルの精度を、低コストで十分に向上させることができる。
【図面の簡単な説明】
【0008】
【
図1】実施形態のモデル更新の概要を説明するための図。
【
図2】実施形態に係るモデル生成システムの構成を示す図。
【
図3】実施形態に係るモデル生成処理を示すフローチャート。
【
図4】実施形態に係るモデル更新システムの構成を示す図。
【
図5】実施形態に係るモデル改善度判定条件の決定画面を示す図。
【
図6】実施形態に係るモデル更新処理を示すフローチャート。
【
図7】実施形態に係る予測システムの構成を示す図。
【
図8】実施例1に係る下水の汚染度の観測値の時系列データを示す図。
【
図9】実施例1に係る下水の汚染度と相関がある変数を示す図。
【
図10】実施例1に係る下水の汚染度と相関がある変数の時系列データを示す図。
【
図11】実施例1に係る既存モデルによる下水の汚染度の推定値の時系列データを示す図。
【
図12】実施例1に係る下水の汚染度との相関が推定される追加変数を示す図。
【
図13】実施例1に係る下水の汚染度との相関が推定される追加変数の時系列データを示す図。
【
図14】実施例2に係る有機樹脂の透明度の観測値の時系列データを示す図。
【
図15】実施例2に係る有機樹脂の透明度と相関がある変数を示す図。
【
図16】実施例2に係る有機樹脂の透明度と相関がある変数の時系列データを示す図。
【
図17】実施例2に係る既存モデルによる有機樹脂の透明度の推定値の時系列データを示す図。
【
図18】実施例2に係る有機樹脂の透明度との相関が推定される追加変数を示す図。
【
図19】実施例2に係る有機樹脂の透明度との相関が推定される追加変数の時系列データを示す図。
【
図20】実施例3に係る生産現場における人員配置計画の観測値の時系列データを示す図。
【
図21】実施例3に係る生産現場における人員配置計画と相関がある変数を示す図。
【
図22】実施例3に係る生産現場における人員配置計画と相関がある変数の時系列データを示す図。
【
図23】実施例3に係る既存モデルによる生産現場における人員配置計画の推定値の時系列データを示す図。
【
図24】実施例3に係る生産現場における人員配置計画との相関が推定される追加変数を示す図。
【
図25】実施例3に係る生産現場における人員配置計画との相関が推定される追加変数の時系列データを示す図。
【発明を実施するための形態】
【0009】
以下、図面を参照して本願の開示に係る実施形態を説明する。実施形態は、図面も含めて本願を説明するための例示である。実施形態では、説明の明確化のため、適宜、省略及び簡略化がされている。特に限定しない限り、実施形態の構成要素は単数でも複数でもよい。また、ある実施形態と他の実施形態を組み合わせた形態も、本願に係る実施形態に含まれる。
【0010】
同一又は類似の構成要素には、同一の符号を付与し、後出の実施形態及び実施例では、説明を省略する、又は差分を中心とした説明のみを行う場合がある。また、同一又は類似の構成要素が複数ある場合には、同一の符号に異なる添字を付して説明する場合がある。また、これらの複数の構成要素を区別する必要がない場合には、添字を省略して説明する場合がある。各構成要素の数は、特に断りがない限り単数でも複数でもよい。
【0011】
実施形態において、プログラムを実行して行う処理について説明する場合がある。コンピュータは、プロセッサ(例えばCPU(Central Processing Unit)、GPU(Graphics Processing Unit))により、主記憶装置のメモリや補助記憶装置のストレージ等を用いながら、プログラムで定められた処理を行う。そのため、プログラムを実行して行う処理の主体を、プロセッサとしてもよい。プロセッサがプログラムを実行することで、処理を行う機能部が実現される。
【0012】
同様に、プログラムを実行して行う処理の主体が、プロセッサを有するコントローラ、装置、システム、計算機、ノードであってもよい。プログラムを実行して行う処理の主体は、演算部であればよく、特定の処理を行う専用回路を含んでいてもよい。ここで、専用回路とは、例えばFPGA(Field Programmable Gate Array)やASIC(Application Specific Integrated Circuit)、CPLD(Complex Programmable Logic Device)等である。
【0013】
プログラムは、プログラムソースから計算機にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読取り可能な非一時的な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサと配布対象のプログラムを記憶する記憶資源(ストレージ)を含み、プログラム配布サーバのプロセッサが配布対象のプログラムを他の計算機に配布してもよい。また、実施形態において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。
【0014】
[実施形態]
図1は、実施形態のモデル更新の概要を説明するための図である。
図1では、疑似実現象100は、実現象101と、実現象101を疑似又は模擬する既存モデル102とを有する。実現象101は、観測対象の信号を出力する系である。実現象101に限らずシステムでもよい。また“信号”は、データとしてもよい。既存モデル102は、実現象101を疑似又は模擬する学習済みの既存モデルである。
【0015】
実現象101に関連する信号として、実現象101が出力する信号を観測した観測値y1と、1つ以上の既知の信号x1,x2,・・・,xnと、1つ以上の未知の信号u1,u2,・・・,umと、があるとする。観測値y1、信号x1,x2,・・・,xn,u1,u2,・・・,umは、時系列のデータ期間の各時刻1,2,…,Tにおける時系列の信号である。
【0016】
信号x1,x2,・・・,xn,u1,u2,・・・,umは、観測値y1との相関又は因果関係が推定される信号である。未知の信号u1,u2,・・・,umとは、既存モデル102の生成時には、取得されていないか観測が不可能である、あるいは観測値y1との相関又は因果関係が見出されていない信号である。
【0017】
信号x1,x2,・・・,xn,u1,u2,・・・,umを説明変数とし、観測値y1と目的変数とすると、説明変数と目的変数との間に何らかの相関を見い出せる場合がある。この相関に基づいて、観測値の予測や最適化分析が行われることが多い。既存モデル102の生成時に入手可能な既知の信号x1,x2,・・・,xnの時系列信号のみを学習し、信号x1,x2,・・・,xnを入力とし、観測値y1の推定値y2を出力とする既存モデル102を生成することができる。既存モデル102に対して信号x1,x2,・・・,xnを入力すると、観測値y1の推定値y2が出力される。
【0018】
第1誤差e1は、観測値y1から、観測値y1の推定値y2を差引いた差分である。モデル誤差J1は、関数gを用いて、第1誤差e1の関数として表される。第1誤差e1の演算又は取得とモデル誤差J1の演算は、後述のモデル誤差演算部213によって実行される(
図4)。モデル誤差J1は、例えば式(1)のように表される。
【数1】
【0019】
ここで関数g(e1)は、入力信号x1,…,xnの時系列データの期間Tにわたる第1誤差e1の二乗和誤差とするが、二乗和誤差に限らず、時系列データの期間Tにわたって第1誤差e1を評価できる関数であれば何れでもよい。
【0020】
なお実現象101及び既存モデル102は、ブラックボックスでもよい。また実現象101が出力する観測値y1及び既存モデル102が出力する推定値y2の各々は不明でも、第1誤差e1が得られれば十分である。
【0021】
信号u1,・・・,ukは、未知の信号u1,u2,・・・,umから選択された1つ以上の追加信号である。追加モデル103(追加モデル候補)は、例えば、θをパラメータとして、信号u1,・・・,ukを入力として推定値zを出力する線形又は非線形の関数F(u1,・・・,uk|θ)で表される。追加モデル103は、式(2)のように表される。(*)
tは、行列又はベクトルの転置を表す。
【数2】
【0022】
さらに式(2)の右辺の関数F(u1,・・・,uk|θ)は、式(3)のように関数f(ui)の線形結合で表されてもよい。ただし、ui=0のときf(ui)=0である。式(3)の右辺における“b”は、バイアス項である。
【数3】
【0023】
第2誤差e2は、第1誤差e1から、推定値zを差引いた差分である。追加モデル誤差J2は、関数hを用いて、第2誤差e2の関数として表される。第2誤差e2と追加モデル誤差J2の演算は、後述の追加モデル誤差演算部214によって実行される(
図4)。追加モデル誤差J2は、例えば式(4)のように表される。
【数4】
【0024】
ここで関数h(e2)は、入力信号x1,…,xn,u1,…,ukの時系列データの期間Tにわたる第2誤差e2の二乗和誤差とするが、二乗和誤差に限らず、時系列データの期間Tにわたって第2誤差e2を評価できる関数であれば何れでもよい。
【0025】
また追加モデル誤差J2の最小値J2´は、追加モデル誤差J2を最小化するパラメータθの時の追加モデル誤差J2の値である。追加モデル誤差J2の最小値J2´は、後述の追加モデル誤差最小値演算部215によって演算される(
図4)。追加モデル103が、式(3)のように線形式で表される場合には、追加モデル誤差J2を最小化するパラメータθは、式(5)の正規方程式から求められる。また追加モデル誤差J2を最小化するパラメータθを求めると、このパラメータθのときの追加モデル誤差J2の最小値も求まる。式(5)において、uj(t)は、期間T内の時系列データのうちの時刻tにおけるj番目の信号ujの値を表す。
【数5】
【0026】
モデル改善度Eは、モデル誤差J1から、追加モデル誤差の最小値J2´を差引いた差分である。モデル改善度Eは、所定閾値又は所定範囲と比較され、所定閾値以上となるか、又は所定範囲外となる場合に、既存モデル102に追加モデル103を追加した場合にモデル精度が有意に改善すると認められるとされる。モデル改善度Eが所定閾値以上又は所定範囲外となる場合に、既存モデル102に追加モデル103を追加してモデル132を更新する。更新後のモデル132は、信号x1,x2,・・・,xnの入力に対して既存モデル102が出力した推定値y2に、信号u1,・・・,ukの入力に対して追加モデル103が出力した推定値zを加算したyを、新たな推定値として出力する。推定値yは、後述の推定部311によって演算される(
図7)。
【0027】
なお式(3)において、追加信号u1,・・・,ukのうち、u1以外を0とおくと、式(6)のように、推定値zはf(u1)の一次関数で表される。
【数6】
【0028】
同様に、u2以外を0とおく、u3以外を0とおく、…、uk以外を0とおく、の何れにおいても、zjはf(uj)(j=2,…,k)の一次式となる。よって、u1→u2→…→ukと、追加信号を1つずつ選択しながら各追加信号に対応する追加モデル誤差J2の最小値J2´を取るパラメータθ=[uj,b]を求める。そして、このパラメータθを追加モデル103に代入した既存モデル102に追加してモデル132を順次更新できる。u1→u2→…→ukのうちのあるujで追加モデル103の追加によってモデル132の精度が一定以上向上すると、このujより後のul(l=j+1,j+2,…)についての追加モデル103の生成及び追加に関する処理の繰り返し実行を終了してもよい。
【0029】
(モデル生成システム1の構成)
図2は、実施形態に係るモデル生成システム1の構成を示す図である。モデル生成システム1は、既存モデル102を用いた推論処理に先立って既存モデル102を予め生成する。モデル生成システム1は、プロセッサ11、メモリ12、及びストレージ13を有する。
【0030】
ストレージ13は、モデル学習用データ131及びモデル132を格納する。モデル学習用データ131は、既存モデル102を生成する際の学習データである。モデル132は、既存モデル102を含む。
【0031】
プロセッサ11は、データ前処理部111、モデル生成部112、及びモデル適用部113を有する。これらの機能部は、プロセッサ11による所定プログラムの実行により実現される。
【0032】
データ前処理部111は、モデル学習用データ131を、既存モデル102の訓練に適した形式に加工する。モデル生成部112は、データ前処理部111によって加工されたモデル学習用データ131の学習を行って、既存モデル102を生成する。モデル適用部113は、モデル生成部112によって生成された既存モデル102をモデル132としてストレージ13に保存する。既存モデル102を含むモデル132は、ストレージ13に格納されることで、後述のモデル更新システム2及び予測システム3にデプロイ可能となる。ストレージ13及びモデル132は、モデル生成システム1、モデル更新システム2及び予測システム3の何れからもアクセス可能な共有ストレージであってもよい。
【0033】
(実施形態に係るモデル生成処理)
図3は、実施形態に係るモデル生成処理S1を示すフローチャートである。モデル生成処理S1は、例えばユーザ指示を契機として、モデル生成システム1によって実行される。
【0034】
先ずステップS11では、データ前処理部111は、入力信号x1,x2,…,xnの時系列データを取得する。次にステップS12では、データ前処理部111は、ステップS11で取得した入力信号x1,x2,…,xnの時系列データを、データ加工する。ステップS12は、人手で行われてもよい。
【0035】
次にステップS13では、モデル生成部112は、ステップS12でデータ加工された入力信号x1,x2,…,xnの時系列データを学習して既存モデル102を生成する。次にステップS14では、モデル適用部113は、ステップS13で生成された既存モデル102をストレージ13に保存する。
【0036】
(実施形態に係るモデル更新システム2の構成)
図4は、実施形態に係るモデル更新システム2の構成を示す図である。モデル更新システム2は、既存モデル102の生成後に、既存モデル102に追加する追加モデル103を生成する。モデル更新システム2は、プロセッサ21、メモリ22、ストレージ23、及び出力部24を有する。
【0037】
ストレージ23は、追加モデル学習用データ231、モデル132、及びモデル改善度判定条件232を格納する。追加モデル学習用データ231は、追加モデル103-1,…,103-rを生成する際の学習データである。
【0038】
モデル132には、既存モデル102及び追加モデル103-1,…,103-rが含まれる。既存モデル102は、
図2に示すモデル生成システム1によって生成された既存モデル102である。追加モデル103-1,…,103-rは、既存モデル102に対して、モデル精度を所定閾値Th1以上に改善するモデル改善度Eであるため追加された1つ以上の追加モデル103であり、追加数分だけモデル132に格納されている。
【0039】
プロセッサ21は、データ前処理部211、追加モデル候補生成部212、及びモデル誤差演算部213を有する。またプロセッサ21は、追加モデル誤差演算部214、追加モデル誤差最小値演算部215、モデル改善度判定部216、モデル更新部217、及びモデル改善度判定条件決定部218を有する。これらの機能部は、プロセッサ21による所定プログラムの実行により実現される。
【0040】
データ前処理部211は、追加モデル学習用データ231を、追加モデル103(追加モデル103-i(i=1,2,…,n))の生成に適した形式に加工する。
【0041】
追加モデル候補生成部212は、追加信号u1,・・・,ukに対して推定値zを出力する式(2)又は式(3)の形式のモデルを、ある関数とパラメータθを用いて生成する。追加モデル候補生成部212は、データ前処理部211によって加工された追加モデル学習用データ231を用いて、追加モデル103を生成する。
【0042】
モデル誤差演算部213は、式(1)で表されるモデル誤差J1を演算する。追加モデル誤差演算部214は、式(4)で表される追加モデル誤差J2を演算する。追加モデル誤差最小値演算部215は、式(5)を用いて追加モデル誤差J2を最小化するパラメータθを演算し、このパラメータθのときの追加モデル誤差J2の最小値を、式(4)を元に演算する。
【0043】
モデル改善度判定部216は、モデル誤差J1から、追加モデル誤差の最小値J2´を差引いて、モデル改善度Eを演算する。そしてモデル改善度判定部216は、モデル改善度Eを、所定閾値又は所定範囲と比較する。モデル改善度判定部216は、モデル改善度Eが、所定閾値以上であるか、又は所定範囲外である場合に、現在のモデル改善度Eの算出基礎であるパラメータθの下での追加モデル103を、既存モデル102に対して追加すると決定する。
【0044】
モデル更新部217は、モデル改善度判定部216によって、現在のモデル改善度Eの算出基礎であるパラメータθでの追加モデル103を既存モデル102に追加すると決定されると、この追加モデル103を既存モデル102に追加してモデル132を更新する。
【0045】
モデル改善度判定条件決定部218は、モデル改善度Eを比較する所定閾値又は所定範囲であるモデル改善度判定条件232を演算し、ストレージ23に保存する。モデル改善度判定条件232は、現在の既存モデル102の精度に対して、例えば1%、2.5%、5%といった所定割合だけ精度が向上するモデル改善度Eの値Th1を所定閾値とすることで決定される。
【0046】
あるいは、モデル改善度判定条件232は、現在の既存モデル102の精度に対して、例えば1%、2.5%、5%の所定割合を前回の追加モデル103の追加からの経過時間で除算した値だけ精度が向上するモデル改善度Eの値を所定閾値とすることで決定される。これにより既存モデル102の短時間での頻繁な更新を抑制できる。
【0047】
モデル改善度判定条件232が値Th1又は値Th2の場合、モデル改善度Eがモデル改善度判定条件232以上である場合に、モデル改善度Eの算出基礎であるパラメータθの下での追加モデル103を既存モデル102に対して追加すると決定される。
【0048】
またはモデル改善度判定条件232は、現在の既存モデル102の精度と同程度と見なせるモデル改善度Eの範囲を所定範囲とすることで決定される。この場合、モデル改善度Eが、モデル改善度判定条件232の範囲外である場合に、モデル改善度Eの算出基礎であるパラメータθの下での追加モデル103を既存モデル102に対して追加すると決定される。
【0049】
出力部24は、ディスプレイ等の各種情報を出力する出力装置である。
【0050】
図5は、実施形態に係るモデル改善度判定条件232の決定画面24Dを示す図である。決定画面24Dは、出力部24の表示画面に表示され、モデル改善度Eを増減した場合のモデル精度のシミュレート結果を表示する。現状の既存モデル102の精度24D1を元に、既存モデル102を更新する所定閾値Th1を設定し、それを上回るモデル改善度Eとなる追加モデル103を、現在の既存モデル102に追加して更新する追加モデルとする。
【0051】
現在の既存モデル102の精度24D1は、シミュレーション又は評価データを用いたモデル評価により算出できる。現在の既存モデル102の精度24D1は、算出結果にバラつきがあり幅を持ったデータである。例えば現在の既存モデル102の精度の最大値MにMのΔ%だけ加算した(1+Δ/100)Mを所定閾値Th1とできる。そしてスライディングスケール24D2を動かしてモデル改善度Eを変え、各モデル改善度Eにおけるモデル精度の範囲を確認する。モデル精度が所定閾値Th1以上となるモデル改善度Eを取る追加モデル103のみが、既存モデル102に追加される追加モデルとなる。
図5の例では、モデル改善度EがE1以上である場合に、現在の既存モデル102の精度に対してモデル精度が所定閾値Th1より大となり改善されることを示している。
【0052】
なお所定閾値Th1の算出の際には、現在の既存モデル102の精度の最大値Mに代えて、平均値、中央値、標準偏差等の各種統計値を用いてもよい。また所定閾値Th1の算出の際には、Δ%に代えてΔ%/T1(ただし、T1は前回の追加モデル103の追加からの経過時間を表す)としてもよい。
【0053】
(実施形態に係るモデル更新処理S2)
図6は、実施形態に係るモデル更新処理S2を示すフローチャートである。モデル更新処理S2では、例えば既存モデル102のデータドリフトの検知を契機として、モデル更新システム2によって実行される。モデル更新処理S2の実行時には、学習済みの既存モデル102がデプロイされていることを前提とする。
【0054】
先ずステップS21では、モデル誤差演算部213は、第1誤差e1の入力を受け付ける。モデル誤差演算部213は、実現象101の観測値y1と既存モデル102の推定値y2から第1誤差e1を演算してもよい。次にステップS22では、モデル誤差演算部213は、モデル誤差J1を演算する。次にステップS23では、モデル誤差演算部213は、モデル誤差J1が閾値Th0を超過したかを判定する。モデル誤差演算部213は、モデル誤差J1が閾値Th0を超過した場合(ステップS23YES)にステップS24に処理を移し、超過していない場合(ステップS23NO)にステップS21に処理を戻す。
【0055】
ステップS23は、既存モデル102のデータドリフト発生の有無を監視する処理である。従ってステップS23は、既存モデル102のデータドリフト発生の有無に関係なく、既存モデル102を含むモデル132のモデル精度を改善する目的である場合には、省略される。
【0056】
ステップS24では、データ前処理部211は、信号u1,u2,・・・,umからある組み合わせで追加信号u1,・・・,ukの時系列データを取得する。次にステップS25では、データ前処理部211は、ステップS24で取得した追加信号u1,・・・,ukを、追加モデル103の生成に適した形式に加工する。ステップS25は、人手で行われてもよい。
【0057】
次にステップS26では、追加モデル候補生成部212は、ステップS25で加工された追加信号u1,…,ukに対して推定値zを出力する式(2)又は式(3)の形式の追加モデル103(追加モデル候補)を、ある関数とパラメータθを用いて生成する。
【0058】
次にステップS27では、追加モデル誤差演算部214は、第2誤差e2を演算する。次にステップS28では、追加モデル誤差演算部214は、追加モデル誤差J2を演算する。次にステップS29では、モデル改善度判定部216は、モデル改善度Eを演算する。次にステップS30では、モデル改善度判定部216は、ステップS29で演算したモデル改善度Eが所定閾値Th1より大であるかを判定する。モデル改善度判定部216は、モデル改善度Eが所定閾値Th1より大である場合(ステップS30YES)にステップS31に処理を移し、モデル改善度Eが所定閾値Th1以下である場合(ステップS30NO)にステップS24に処理を戻す。ステップS20から処理が戻されたステップS24では、前回までのステップS24の実行時とは異なる組み合わせで信号u1,u2,・・・,umから追加信号を選択し、選択した追加信号の時系列データを取得する。
【0059】
ステップS31では、モデル更新部217は、ステップS3でモデル改善度Eが所定閾値Th1より大となる追加モデル103を追加することで既存モデル102更新する。
【0060】
(実施形態に係る予測システム3の構成)
図7は、実施形態に係る予測システム3の構成を示す図である。予測システム3は、既存モデル102及び追加モデル103-1,…,103-rを用いて、入力信号を基に観測信号y1の推定値を出力する。例えば追加モデル103-j(j=1,…,r)は、入力信号{u(j)}に対して観測値y1の推定値zjを出力するとする。ただし{u(j)}は信号u1,u2,・・・,umから選択した信号のある組み合わせからなる集合であり、j≠j´に対して{u(j)}∩{u(j´)}である。既存モデル102及び追加モデル103-jを含んで構成されるモデル132が出力する推定値yは、式(7)のようになる。式(7)において、推定値y2は、入力信号x1,…,xnに対して既存モデル102が出力する推定値である。推定値zjは、入力信号{u(j)}に対して追加モデル103-jが出力する推定値である。
【数7】
【0061】
予測システム3は、プロセッサ31、メモリ32、ストレージ33、及び出力部34を有する。
【0062】
ストレージ33は、モデル132を格納する。モデル132には、既存モデル102及び追加モデル103-1,…,103-rが含まれる。モデル132は、モデル更新システム2(
図4)のモデル132と同様である。
【0063】
プロセッサ31は、推定部311を有する。推定部311は、プロセッサ31による所定プログラムの実行により実現される。
【0064】
推定部311は、モデル132に含まれる既存モデル102及び追加モデル103-j(j=1,…,n)に対して入力信号x1,…,xn、{u(j)}(j=1,…,r)を入力する。また推定部311は、入力信号x1,…,xn、{u(j)}(j=1,…,r)に対して既存モデル102及び追加モデル103-jから出力された推定値y2,zj(j=1,…,r)を基に、モデル132の出力である推定値yを式(7)に基づいて出力する。
【0065】
出力部34は、入力信号x1,…,xn、{u(j)}(j=1,…,r)に対してモデル132が出力した推定値yを表示する。
【0066】
なお、モデル生成システム1、モデル更新システム2、及び予測システム3は、のうちの2つ以上が1つのシステムに統合されていてもよい。例えば、モデル更新システム2と予測システム3が1つのシステムに統合されていてもよい。
【0067】
(実施形態の効果)
本実施形態によれば、既存モデル102を含むモデル132のモデル精度を、変数追加を逐次試行し、モデル精度が向上する場合のみ追加モデル103を追加する更新を行うことで、既存モデル102の再学習を実行せず、低コストで十分に向上させることができる。また本実施形態は、既存モデル102に対して追加信号に基づく追加モデルを追加するモデルの更新方法のみならず、新規にモデルを作成する場合にも適用できる。すなわち、必要最低限の入力信号を基にコアとなる既存モデル102を構築後、追加変数を逐次追加して追加モデルを追加することで、低コストで高精度なモデルを新規に作成することができる。
【0068】
本実施形態では、予測システム3が予測に用いるモデル132の「学習データの入手時期が時間的に分散するケース」や、「データドリフトが発生したケース」、「入力情報の追加要望があるケース」等に対して、低コストで高精度なモデルを提供できる。
【0069】
本実施形態では、まずは既存モデルには手を加えず追加入力信号のみで学習及び推論を行う。追加変数により精度が向上することが確認できた場合のみ既存モデルに追加モデルを追加する更新を行う。追加モデルを線形式とすれば正規方程式を解くことに帰着するため学習及び推論の計算コストが低く短時間で結果を出力可能である。その上、追加モデルは、解析的な演算によって導き出されるので、説明性が高いという利点がある。
【0070】
上述の「学習データの入手時期が時間的に分散するケース」は、例えば、学習データの提供主体が複数存在する場合である。また例えば、学習データの前処理に多大な工数を必要とすることから全ての学習データを一斉に利用できず時期を分けて前処理し、順次利用可能になる場合である。あるいは、長期にわたる分析のため、時間を隔てて同一種類の観測値を取得する場合もある。
【0071】
「データドリフトが発生したケース」は、例えば、時間経過に応じて実現象101に経年劣化やその他の変動が生じた場合である。「入力情報の追加要望があるケース」は、例えば、予測システム3の運用において変数追加の要望があった場合である。
【0072】
以下、「学習データの入手時期が時間的に分散するケース」を実施例1、「データドリフトが発生したケース」を実施例2、「入力情報の追加要望があるケース」を実施例3として、上述の実施形態の適用例を説明する。
【実施例1】
【0073】
実施例1は、「学習データの入手時期が時間的に分散するケース」として、上述の実施形態を、モデルを用いた下水の汚染度の推定業務に適用した場合を示す。すなわち既存モデル102を含むモデル132は、下水の汚染度と相関がある変数を入力として、下水の汚染度の推定値を出力する。そして、既存モデル102の構築時から後日に、別の時系列データを取得して追加モデル103(追加モデル候補)を構築する。そして、新規追加の変数を入力とする追加モデル103のうちモデル改善度Eが所定閾値Th1以上となる追加モデル103を既存モデル102に追加してモデル132が更新される。
【0074】
実施例1では、既存モデル102及び追加モデル103の学習データは、モデル構築の際の加工処理の工数が一定以上に大きいために、少なくとも2つの期間にデータを分けて加工することが必要な業務記録である。
【0075】
図8は、実施例1に係る下水の汚染度の観測値y1の時系列データを示す図である。
図8は、業務上取得された実現象101である、ある観測点における下水の汚染度の観測値y1(%)の時系列データを示す。
【0076】
図9は、実施例1に係る下水の汚染度と相関がある変数を示す図である。
図10は、実施例1に係る下水の汚染度と相関がある変数の時系列データを示す図である。
図11は、実施例1に係る既存モデル102による下水の汚染度の推定値y2の時系列データを示す図である。
図9は、下水の汚染度と関係又は相関がある変数を列挙してる。
図10は、
図9に列挙する変数の時系列データを示す。
図11は、
図10に示す変数の時系列データを入力として既存モデル102が出力する下水の汚染度の推定値y2(%)の時系列データである。
【0077】
図12は、実施例1に係る下水の汚染度との相関が推定される追加変数を示す図である。
図13は、実施例1に係る下水の汚染度との相関が推定される追加変数の時系列データを示す図である。実施例1では、
図12に示す追加変数は、
図9に示す変数と比較して、同一種類であるが、取得日時が異なる。このため、「学習データの入手時期が時間的に分散するケース」となり、先に取得及び加工された時系列データを基に既存モデル102が構築され、後に取得及び加工された時系列データを基に追加モデル103が構築される。
【0078】
実施例1で対象とする時系列データは、既存モデル102及び追加モデル103(追加モデル候補)の構築の際に、データ加工の工数が一定以上に大きいために、少なくとも2つ以上に時期を分けて加工することが必要となる業務記録に基づく。
【0079】
実施例1では、実現象101が出力する観測値y1は、既に収集された業務記録上の時系列データである。既存モデル102は、既に学習済みのモデルであり、下水の汚染度と相関がある変数を含む業務記録上の時系列データのうちの観測値y1と同時に取得され加工された入力信号x1,x2,…,xnを入力として、観測値y1の推定値y2を演算し出力する。
【0080】
追加モデル103(追加モデル候補)は、出力信号zを演算する。追加モデル103(追加モデル候補)は、下水の汚染度と相関があると推定される追加変数を含む業務記録上の時系列データのうち入力信号x1,…,xnよりも後日取得され加工された追加の入力信号u1,…,ukを用いて出力信号zを演算し出力する。
【0081】
モデル更新システム2のモデル誤差演算部213は、観測値y1と推定値y2との第1誤差e1に基づくモデル誤差J1を演算することで、過去に整理された業務記録のみに基づいて構築された既存モデル102の精度を測定する。
【0082】
モデル更新システム2の追加モデル誤差演算部214は、第1誤差e1と出力信号zとの誤差である第2誤差e2に基づく追加モデル誤差J2を演算する。これにより、追加モデル誤差演算部214は、後日取得され加工された追加の業務記録に基づく追加モデル103(追加モデル候補)を既存モデル102に追加した場合の誤差を測定する。
【0083】
モデル更新システム2の追加モデル誤差最小値演算部215は、追加モデル誤差J2を最小化するパラメータθを求める。モデル更新システム2の追加モデル誤差最小値演算部215は、追加モデル誤差J2を最小化するパラメータθ及びそのときの追加モデル誤差J2の最小値J2´を演算する。上述のz=F(u1,…,uk|θ)が線形式であれば、最小値J2´は、正規方程式を用いて演算できる。
【0084】
モデル更新システム2のモデル改善度判定部216は、モデル誤差J1と最小値J2´の差であるモデル改善度Eを求めることで、追加の業務記録に基づく追加モデル103(追加モデル候補)の追加によって、予測精度が向上するかを判定する。モデル更新システム2のモデル更新部217は、モデル改善度判定部216によってモデル改善度Eが所定閾値Th1より大であると判定された場合に、予測精度が向上するとして、追加モデル103(追加モデル候補)を既存モデル102に追加する。
【0085】
予測システム3の推定部311は、追加モデル103(追加モデル候補)が既存モデル102に追加されると、観測値y1の推定値yを出力する。推定値yは、入力信号x1,…,xnに対して既存モデル102が出力する推定値y2と、追加の入力信号u1,…,ukに対して追加モデル103が出力する出力信号zとの合算値である。
【0086】
実施例1では、加工に時間がかかるような業務記録に基づく時系列データのうち、先に一部のデータを基に既存モデル102を構築した後、モデル精度が向上する場合に、残りの業務記録又は追加された業務記録に基づく追加モデル103及び追加変数を追加する。よって、モデルの構築及び予測システムの立上りを迅速化すると共に、業務記録に基づく時系列データの加工にかかる時間を抑制し、低コストで高精度なモデルを作成することができる。
【実施例2】
【0087】
実施例2は、「データドリフトが発生したケース」として、上述の実施形態を、製造現場におけるモデルを用いた有機樹脂の透明度の推定業務に適用した場合を示す。すなわち既存モデル102を含むモデル132は、有機樹脂の透明度と相関がある変数を入力として、有機樹脂の透明度の推定値を出力する。そして、既存モデル102の構築時から一定期間経過後に、データドリフトが発生した場合に、製造ラインに設置した新規センサから異なる種類の時系列データを取得して追加モデル103(追加モデル候補)を構築する。そして、新規追加の変数を入力とする追加モデル103のうちモデル改善度Eが所定閾値Th1以上となる追加モデル103を既存モデル102に追加してモデル132が更新される。
【0088】
実施例2では、既存モデル102及び追加モデル103の学習データは、製造現場における生産品の品質管理に関する情報である。
【0089】
図14は、実施例2に係る有機樹脂の透明度の観測値の時系列データを示す図である。
図14は、業務上取得された実現象101である、ある製造現場における有機樹脂の透明度の観測値y1(%)の時系列データを示す。
【0090】
図15は、実施例2に係る有機樹脂の透明度と相関がある変数を示す図である。
図16は、実施例2に係る有機樹脂の透明度と相関がある変数の時系列データを示す図である。
図17は、実施例2に係る既存モデルによる有機樹脂の透明度の推定値の時系列データを示す図である。
図15は、下水の汚染度と関係又は相関がある変数を列挙してる。
図16は、
図15に列挙する変数の時系列データを示す。
図17は、
図15に示す変数の時系列データを入力として既存モデル102が出力する有機樹脂の透明度の推定値y2(%)の時系列データである。
【0091】
図18は、実施例2に係る有機樹脂の透明度との相関が推定される追加変数を示す図である。
図19は、実施例2に係る有機樹脂の透明度との相関が推定される追加変数の時系列データを示す図である。実施例2では、
図18に示す追加変数は、
図15に示す変数と比較して、異なる種類である。このため、先に取得及び加工された時系列データを基に構築された既存モデル102に「データドリフトが発生したケース」において、後に新規設置された追加センサを介して取得及び加工された時系列データを基に追加モデル103が構築される。
【0092】
実施例2では、実現象101が出力する観測値y1は、製造現場での生産品の品質に関する時系列データである。既存モデル102は、既に学習済みのモデルである。既存モデル102は、有機樹脂の透明度と相関がある変数を含む製造現場での生産品の品質に関する時系列データのうちの観測値y1と同時に取得され加工された入力信号x1,…,xnを入力として、観測値y1の推定値y2を演算し出力する。
【0093】
追加モデル103(追加モデル候補)は、出力信号zを演算する。追加モデル103(追加モデル候補)は、有機樹脂の透明度と相関があると推定される追加変数を含む製造現場での生産品の品質に関する時系列データのうち入力信号x1,x2,…,xn以外の入力信号u1,…,ukを取得し加工して用いる。入力信号u1,…,ukは、センサ追加等により取得される。すなわち追加モデル103(追加モデル候補)は、一定時間経過後の設備劣化や気温変化等により出力信号y1と推定値y2に乖離が発生した場合に、出力信号zを演算し出力する。
【0094】
モデル更新システム2のモデル誤差演算部213は、観測値y1と推定値y2との第1誤差e1に基づくモデル誤差J1を演算する。これにより、モデル誤差演算部213は、データ分析開始時点までに取得された製造現場での生産品の品質に関する時系列データのみに基づいて構築された既存モデル102の精度を測定する。
【0095】
モデル更新システム2の追加モデル誤差演算部214は、第1誤差e1と出力信号zとの誤差である第2誤差e2に基づく追加モデル誤差J2を演算する。これにより、追加モデル誤差演算部214は、センサ追加等により取得され加工された追加の時系列データに基づく追加モデル103(追加モデル候補)を既存モデル102に追加した場合の誤差を測定する。
【0096】
モデル更新システム2の追加モデル誤差最小値演算部215は、追加モデル誤差J2を最小化するパラメータθを求める。モデル更新システム2の追加モデル誤差最小値演算部215は、追加モデル誤差J2を最小化するパラメータθ及びそのときの追加モデル誤差J2の最小値J2´を演算する。
【0097】
モデル更新システム2のモデル改善度判定部216は、モデル誤差J1と最小値J2´の差であるモデル改善度Eを求める。そして、モデル改善度判定部216は、モデル改善度Eを基に、追加のセンサ等により取得された時系列データに基づく追加モデル103(追加モデル候補)の追加によって、予測精度が向上するかを判定する。
【0098】
モデル更新システム2のモデル更新部217は、モデル改善度判定部216によってモデル改善度Eが所定閾値Th1より大であると判定された場合に、予測精度が向上するとして、追加モデル103(追加モデル候補)を既存モデル102に追加する。
【0099】
予測システム3の推定部311は、追加モデル103(追加モデル候補)が既存モデル102に追加されると、観測値y1の推定値yを出力する。推定値yは、入力信号x1,…,xnに対して既存モデル102が出力する推定値y2と、追加の入力信号u1,…,ukに対して追加モデル103が出力する出力信号zとの合算値である。
【0100】
実施例2によれば、一定時間経過後に環境条件が変化した場合おいても、条件変更後の変数追加により精度が向上する場合にのみ新しい変数を追加することにより、低コストで高精度なモデルを作成することができる。
【実施例3】
【0101】
実施例3は、「入力情報の追加要望があるケース」として、上述の実施形態を、モデルを用いた生産現場における人員配置計画業務に適用した場合を示す。すなわち既存モデル102を含むモデル132は、生産現場(例えば工程A)における人員配置数と相関がある変数を入力として、人員配置数の推定値を出力する。そして、既存モデル102の構築時から後日に、ユーザ等からの変数追加の要望に応じて別の時系列データを取得して追加モデル103(追加モデル候補)を構築する。そして、新規追加の変数を入力とする追加モデル103のうちモデル改善度Eが所定閾値Th1以上となる追加モデル103を既存モデル102に追加してモデル132が更新される。
【0102】
実施例3では、既存モデル102及び追加モデル103の学習データは、生産業務における最適計画に関する情報である。
【0103】
図20は、実施例3に係る生産現場における人員配置計画の観測値の時系列データを示す図である。
図20は、業務上の実現象101である、ある生産現場における実際の配置人員の最適人数の観測値y1(人)の時系列データを示す。
【0104】
図21は、実施例3に係る生産現場における人員配置計画と相関がある変数を示す図である。
図22は、実施例3に係る生産現場における人員配置計画と相関がある変数の時系列データを示す図である。
図23は、実施例3に係る既存モデル102による生産現場における人員配置計画の推定値の時系列データを示す図である。
図21は、生産現場における人員配置数と関係又は相関がある変数を列挙してる。
図22は、
図21に列挙する変数の時系列データを示す。
図23は、
図21に示す変数の時系列データを入力として既存モデル102が出力する生産現場における人員配置数の推定値y2(人)の時系列データである。
【0105】
図24は、実施例3に係る生産現場における人員配置計画との相関が推定される追加変数を示す図である。
図25は、実施例3に係る生産現場における人員配置計画との相関が推定される追加変数の時系列データを示す図である。実施例3では、
図24に示す追加変数は、
図21に示す変数と比較して、ユーザ等からの変数追加の要望に応じて追加された異なる種類の変数である。このため、「入力情報の追加要望があるケース」となり、先の要件定義に基づいて取得及び加工された時系列データを基に既存モデル102が構築され、後の追加の要件定義に基づいて取得及び加工された時系列データを基に追加モデル103が構築される。
【0106】
実施例3では、実現象101の観測値y1は、生産業務における最適計画上の時系列データである。既存モデル102は、既に学習済みのモデルである。既存モデル102は、生産現場における人員配置数と相関がある変数を含む最適計画上の時系列データのうちの観測値y1と同時に取得された入力信号x1,x2,…,xnを入力として、観測値y1の推定値y2を演算し出力する。
【0107】
追加モデル103(追加モデル候補)は、出力信号zを演算する。追加モデル103(追加モデル候補)は、生産現場における人員配置数と相関があると推定される追加変数を含む最適計画上の時系列データのうちの後日の要件定義において追加された入力信号u1,…,ukを用いて出力信号zを演算し出力する。
【0108】
モデル更新システム2のモデル誤差演算部213は、観測値y1と推定値y2との第1誤差e1に基づくモデル誤差J1を演算することで、先の要件定義のみに基づいて構築された既存モデル102の精度を測定する。
【0109】
モデル更新システム2の追加モデル誤差演算部214は、第1誤差e1と出力信号zとの誤差である第2誤差e2に基づく追加モデル誤差J2を演算する。これにより、追加モデル誤差演算部214は、後日の追加の要件定義に基づく追加モデル103(追加モデル候補)を既存モデル102に追加した場合の誤差を測定する。
【0110】
モデル更新システム2の追加モデル誤差最小値演算部215は、追加モデル誤差J2を最小化するパラメータθを求める。モデル更新システム2の追加モデル誤差最小値演算部215は、追加モデル誤差J2を最小化するパラメータθ及びそのときの追加モデル誤差J2の最小値J2´を演算する。
【0111】
モデル更新システム2のモデル改善度判定部216は、モデル誤差J1と最小値J2´の差であるモデル改善度Eを求めることで、追加の要件定義に基づく追加モデル103(追加モデル候補)の追加によって、予測精度が向上するかを判定する。モデル更新システム2のモデル更新部217は、モデル改善度判定部216によってモデル改善度Eが所定閾値Th1より大であると判定された場合に、予測精度が向上するとして、追加モデル103(追加モデル候補)を既存モデル102に追加する。
【0112】
予測システム3の推定部311は、追加モデル103(追加モデル候補)が既存モデル102に追加されると、観測値y1の推定値yを出力する。推定値yは、入力信号x1,…,xnに対して既存モデル102が出力する推定値y2と、追加の入力信号u1,…,ukに対して追加モデル103が出力する出力信号zとの合算値である。
【0113】
実施例3によれば、既存モデル102の構築後に追加で変数が要件定義された場合でも、既存モデル102を保持したまま、後に要件定義された追加変数のみで追加モデル103を構築する。そして追加モデル103を既存モデル102に追加することでモデル精度が向上する場合に、追加変数及び追加モデル103を追加することで、要件定義における変数追加に際しても、低コストで高精度なモデルを作成し、モデル精度の低下を抑制することができる。
【0114】
以上、本発明の一実施形態について詳述したが、本発明は上記の実施形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。例えば、上記の実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また上記実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0115】
また上記の各構成、機能部、処理部、処理手段等は、それらの一部または全部を、例えば、集積回路で設計する等によりハードウェアで実現してもよい。また上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録装置、ICカード、SDカード、DVD等の記録媒体に置くことができる。
【0116】
また上記の各図において、制御線や情報線は説明上必要と考えられるものを示しており、必ずしも実装上の全ての制御線や情報線を示しているとは限らない。例えば、実際には殆ど全ての構成が相互に接続されていると考えてもよい。
【0117】
また以上に説明したモデル生成システム1、モデル更新システム2、及び予測システム3の各種機能部、各種処理部、各種データベースの配置形態は一例に過ぎない。各種機能部、各種処理部、各種データベースの配置形態は、モデル生成システム1、モデル更新システム2、及び予測システム3が備えるハードウェアやソフトウェアの性能、処理効率、通信効率等の観点から最適な配置形態に変更し得る。
【0118】
また前述した各種のデータを格納するデータベースの構成(スキーマ(Schema)等)は、リソースの効率的な利用、処理効率向上、アクセス効率向上、検索効率向上等の観点から柔軟に変更し得る。
【符号の説明】
【0119】
1:モデル生成システム、2:モデル更新システム、3:予測システム、102:既存モデル、103,103-1,103-2,…:追加モデル、132:モデル、211:データ前処理部、212:追加モデル候補生成部、213:モデル誤差演算部、214:追加モデル誤差演算部、215:追加モデル誤差最小値演算部、216:モデル改善度判定部、217:モデル更新部、218:モデル改善度判定条件決定部、232:モデル改善度判定条件。