IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人 東京大学の特許一覧 ▶ 株式会社ダイセルの特許一覧

特開2024-102632回帰分析方法、回帰分析システム及び回帰分析プログラム
<>
  • 特開-回帰分析方法、回帰分析システム及び回帰分析プログラム 図1
  • 特開-回帰分析方法、回帰分析システム及び回帰分析プログラム 図2
  • 特開-回帰分析方法、回帰分析システム及び回帰分析プログラム 図3
  • 特開-回帰分析方法、回帰分析システム及び回帰分析プログラム 図4
  • 特開-回帰分析方法、回帰分析システム及び回帰分析プログラム 図5
  • 特開-回帰分析方法、回帰分析システム及び回帰分析プログラム 図6
  • 特開-回帰分析方法、回帰分析システム及び回帰分析プログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024102632
(43)【公開日】2024-07-31
(54)【発明の名称】回帰分析方法、回帰分析システム及び回帰分析プログラム
(51)【国際特許分類】
   G06Q 10/04 20230101AFI20240724BHJP
【FI】
G06Q10/04
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023006647
(22)【出願日】2023-01-19
(71)【出願人】
【識別番号】504137912
【氏名又は名称】国立大学法人 東京大学
(71)【出願人】
【識別番号】000002901
【氏名又は名称】株式会社ダイセル
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】岡本 洋
(72)【発明者】
【氏名】高橋 麻里奈
(72)【発明者】
【氏名】篠原 修二
(72)【発明者】
【氏名】灰塚 真浩
(72)【発明者】
【氏名】熊田 健司
(72)【発明者】
【氏名】小峰 佑介
(72)【発明者】
【氏名】武次 祐樹
(72)【発明者】
【氏名】仲井 義人
【テーマコード(参考)】
5L010
5L049
【Fターム(参考)】
5L010AA04
5L049AA04
(57)【要約】
【課題】説明変数の変動と目的変数の変動とに対応関係を有する回帰モデルを構築するための、より汎用的な技術を提供する。
【解決手段】回帰分析方法は、コンピュータが、回帰モデルの目的変数及び説明変数として用いられる訓練データを格納する記憶装置から、訓練データを読み出し、正則化項を含むコスト関数を最小化させるように、訓練データを用いて回帰モデルによる機械学習を行う。正則化項は、係数が正の区間において係数が負の区間よりもコストを増大させる第1の項と、係数が負の区間において係数が正の区間よりもコストを増大させる第2の項とを含む。
【選択図】図6
【特許請求の範囲】
【請求項1】
コンピュータが、
回帰モデルの目的変数及び説明変数として用いられる訓練データを格納する記憶装置から、前記訓練データを読み出し、
正則化項を含むコスト関数を最小化させるように、前記訓練データを用いて前記回帰モデルによる機械学習を行う
回帰分析方法であって、
前記正則化項は、前記説明変数の係数が正の区間において前記係数が負の区間よりもコストを増大させる第1の項と、前記係数が負の区間において前記係数が正の区間よりもコストを増大させる第2の項とを含む
回帰分析方法。
【請求項2】
前記第1の項及び前記第2の項は、前記第1の項及び前記第2の項のいずれかをゼロにする又はゼロに近似するためのパラメータを含み、
前記機械学習において、前記回帰モデルにおける回帰係数と、前記パラメータとを繰り返し更新する
請求項1に記載の回帰分析方法。
【請求項3】
前記パラメータは二値変数であり、且つ当該パラメータは、一方の値をとる場合に前記第1の項においてゼロになる因数を構成し、他方の値をとる場合に前記第2の項においてゼロになる因数を構成する
請求項2に記載の回帰分析方法。
【請求項4】
前記二値変数は成長曲線を近似した値として、前記コスト関数を最小化させるように前記回帰係数と、前記パラメータとが計算される
請求項3に記載の回帰分析方法。
【請求項5】
前記二値変数は、前記回帰係数を用いて表される所定値と、確率変数との大小関係に基づいて決まる値として、前記コスト関数を最小化させるように前記回帰係数と、前記パラメータとが計算される
請求項3に記載の回帰分析方法。
【請求項6】
請求項1から5の何れか一項に記載の回帰分析方法を実行する1以上のコンピュータを含む回帰分析システム。
【請求項7】
請求項1から5の何れか一項に記載の回帰分析方法を1以上のコンピュータに実行させるための回帰分析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、回帰分析方法、回帰分析システム及び回帰分析プログラムに関する。
【背景技術】
【0002】
従来、回帰モデルのパラメータを最小二乗法で推定するとき、例えばデータのサンプル数が少ないと適切な最小二乗推定量が求められないという問題があった。そこで、L1ノルムと呼ばれる制約条件を与える手法が提案されていた(例えば、非特許文献1)。L1ノルムを制約条件とするパラメータ推定手法であるLASSO(Least Absolute Shrinkage and Selection Operator)によれば、目的変数を説明するために適した説明変数の選
択及び係数の決定が併せて行われる。
【0003】
また、回帰モデルの目的変数及び説明変数として用いられる訓練データと、目的変数を正又は負の方向に変動させるために、説明変数を正及び負のいずれに変動させるべきかを予め定義する制約条件とを格納する記憶装置から、訓練データ及び制約条件を読み出すデータ取得部と、制約条件に反する場合にコストを増大させる正則化項を含むコスト関数を最小化させる(符号制約正則化)ように、訓練データを用いて、回帰モデルにおける説明変数の係数を繰り返し更新する係数更新部とを備える回帰分析装置も提案されている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】国際公開第2021/157670号
【非特許文献】
【0005】
【非特許文献1】Robert Tibshirani, “Regression Shrinkage and Selection via the Lasso”, Journal of the Royal Statistical Society. Series B (Methodological) Vol. 58, No. 1 (1996), pp. 267-288
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来、目的変数を正又は負の方向に変動させるために、説明変数を正及び負のいずれに変動させるべきかを予め定義する制約条件を定めておくことで、訓練データが比較的少ない場合にも精度よく機械学習を行うことができる回帰分析装置が提案されていた。しかしながら、回帰分析を行う対象に応じて適切な制約条件を準備するために手間がかかる。そこで、本技術は、説明変数の変動と目的変数の変動とに対応関係を有する回帰モデルを構築するための、より汎用的な技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
(態様1)
回帰分析方法は、コンピュータが、回帰モデルの目的変数及び説明変数として用いられる訓練データを格納する記憶装置から、訓練データを読み出し、正則化項を含むコスト関数を最小化させるように、訓練データを用いて回帰モデルによる機械学習を行う。正則化項は、説明変数の係数が正の区間において係数が負の区間よりもコストを増大させる第1の項と、係数が負の区間において係数が正の区間よりもコストを増大させる第2の項とを含む。
【0008】
(態様2)
上記態様1において、第1の項及び第2の項は、第1の項及び第2の項のいずれかをゼロにする又はゼロに近似するためのパラメータを含み、機械学習において、回帰モデルにおける回帰係数と、パラメータとを繰り返し更新するようにしてもよい。
【0009】
(態様3)
上記態様2において、パラメータは二値変数であり、且つ当該パラメータは、一方の値をとる場合に第1の項においてゼロになる因数を構成し、他方の値をとる場合に第2の項においてゼロになる因数を構成するようにしてもよい。
【0010】
(態様4)
上記態様3において、二値変数は成長曲線を近似した値として、コスト関数を最小化させるように回帰係数と、パラメータとが計算されるようにしてもよい。
【0011】
(態様5)
上記態様3又は4において、二値変数は、回帰係数を用いて表される所定値と、確率変数との大小関係に基づいて決まる値として、コスト関数を最小化させるように回帰係数と、パラメータとが計算されるようにしてもよい。
【0012】
回帰分析方法を適用する対象は、製造業又は非製造業における設備であってもよい。説明変数は、生産設備が出力するセンシングデータであってもよい。また、目的変数は、設備の運転条件、又は所定の特性値若しくは異常度であってもよい。なお、課題を解決するための手段に記載の内容は、本開示の課題や技術的思想を逸脱しない範囲で可能な限り組み合わせることができる。また、上記態様1から5は、コンピュータ等の装置若しくは複数の装置を含むシステム、コンピュータ若しくはシステムが実行する方法、又はコンピュータ若しくはシステムに実行させるためのプログラムとして提供することができる。なお、プログラムを保持する記録媒体を提供するようにしてもよい。
【発明の効果】
【0013】
開示の技術によれば、説明変数の変動と目的変数の変動とに対応関係を有する回帰モデルを構築するための、より汎用的な技術を提供することができる。
【図面の簡単な説明】
【0014】
図1図1は、回帰式の作成に用いる観測値の一例を示す図である。
図2図2は、因数「R(w)」を説明するための模式的な図である。
図3図3は、因数「R(w)」を説明するための模式的な図である。
図4図4は、スピン変数Sの近似を説明するための図である。
図5図5は、回帰分析装置の構成の一例を示すブロック図である。
図6図6は、回帰分析処理の一例を示す処理フロー図である。
図7図7は、検証結果を示す図である。
【発明を実施するための形態】
【0015】
以下、図面を参照しつつ回帰分析装置の実施形態について説明する。
【0016】
<第1の実施形態>
本実施形態に係る回帰分析装置は、1以上の説明変数(独立変数)と、1つの目的変数(従属変数)との関係を表す回帰式(回帰モデル)を構築する。回帰式の回帰係数を定める過程を、「学習」と呼ぶ。また、本実施形態においては、説明変数の変動の方向(正又は負)と、目的変数の変動の方向(正又は負)とが、所定の対応関係を有するような制約(「符号制約」と呼ぶ)が適応的に課されるように、回帰式を構築する。すなわち、回帰係数の符号が適切なものとなるように、学習を行う。なお、一般的に、訓練データの数が
十分存在すれば、これを用いて構築される回帰式は、説明変数の変動の方向と、目的変数の変動の方向とが、所定の対応関係を有するように回帰係数が収束する。一方、訓練データの数が比較的少ない場合は、対応関係が逆になるような回帰式が作成されることがある。本実施形態における「符号制約」は、訓練データの数が比較的少ない場合においても、作成される回帰式が適切な対応関係を有するように課せられる。
【0017】
図1は、回帰式の作成に用いる観測値の一例を示す図である。図1の表は、K個の入力x(x~x)の列と、出力yの列とを含む。入力xは説明変数として用いられ、出力yは目的変数として用いられる。また、個々の標本であるデータポイントt(t~t,・・・)を表す複数のレコードのうち、T個のレコード(訓練データ)を用いて回帰式を作成するとともに、作成された回帰式にデータポイントtT+1の値を入力し、未知である出力yを予測するものとする。
【0018】
回帰式は、例えば次の式(1)で表される。
【数1】

回帰式は線形モデルであり、出力yは、入力xの線形和として表される。wは回帰係数、wは定数項であり、それぞれ学習により定められる。
【0019】
回帰係数及び定数項の決定には、次の式(2)で表されるコスト関数(誤差関数)E(w,s)を用いることができる。
【数2】

コスト関数E(w,s)は、二乗誤差L(w)に正則化項(罰則項)S(w,s)を加えたものである。
【0020】
また、正則化項S(w,s)は、次の式(3)で表される。
【数3】

ASL(w,s)は、2つの項を含む。すなわち、RASL(w,s)は、第1の項「(1/2)(1+s)R(w)」と、第2の項「(1/2)(1-s)R(w)」との和で表される。また、sは、スピン変数であり、+1(up)又は-1(down)の二値をとり得る。S=+1の場合、上述した第2の項の因数「(1-s)」はゼロになるため、第1の項のみが残り、RASL(w,s)=R(w)となる。S=-1の場合、上述した第1の項の因数「(1+s)」はゼロになるため、第2の項のみが残り、RASL(w,s)=R(w)となる。換言すれば、第1の項及び第2の項は、第1の項及び第2の項のいずれかをゼロにするためのパラメータsを含む。また、二値変数であるパラメータsは、一方の値をとる場合に第1の項においてゼロになる因数を構成し、他方の値をとる場合に第2の項においてゼロになる因数を構成する。また、Lは、無限大の近似値である、有限の十分に大きな値とする。
【0021】
図2は、因数「R(w)」を説明するための模式的な図である。図2のグラフは、縦軸がR(w)を、横軸がwを表す。上述の式(3)は、入力xの係数wがゼロ以上のときはR(w)=wであり、wの増加に応じてE(w,s)も増加させる。一方、入力xの係数wがゼロ未満のときはR(w)=+∞でありコストを正の無限大に発散させる。すなわち、本実施形態の正則化項は、スピン変数S=+1の場合、入力xの係数wがゼロ未満のときはコストを無限大に発散させる。回帰分析装置による処理上は、十分大きな値とすればよい。一方、入力xの係数wがゼロ以上のときは回帰係数wの大きさに応じてコストを増大させる。すなわち、R(w)を含む第1の項は、係数が負の区間において係数が正の区間よりもコストを増大させる。ここで、係数wがゼロ以上のときは、式(1)に示した回帰式の入力xが増加するほど回帰式による予測値yも増加する。すなわち、スピン変数S=+1の場合は、入力xの値が増加するほど予測値yの値も増加するときに正則化項が小さく、入力xの値が増加するほど予測値yの値が減少するときに正則化項が大きくなるように、コスト関数が定義されている。
【0022】
図3は、因数「R(w)」を説明するための模式的な図である。図3のグラフは、縦軸がR(w)を、横軸がwを表す。上述の式(3)は、入力xの係数wがゼロ以上のときはR(w)=+∞でありコストを正の無限大に発散させる。回帰分析装置による処理上は、十分大きな値とすればよい。一方、入力xの係数wがゼロ未満のときはR
(w)=-wであり、wの減少に応じてE(w,s)を増加させる。すなわち、R(w)を含む第2の項は、係数が正の区間において係数が負の区間よりもコストを増大させる。ここで、係数wがゼロ未満のときは、式(1)に示した回帰式の入力xが増加するほど回帰式による予測値yは減少する。すなわち、スピン変数S=-1の場合は、入力xの値が増加するほど予測値yの値が減少するときに正則化項が小さく、入力xの値が増加するほど予測値yの値が増加するときに正則化項が大きくなるように、コスト関数が定義されている。
【0023】
すなわち、式(3)は、スピン変数Sの値に応じて、回帰係数wが非負又は非正をとる場合に十分大きな値をとる。そして、スピン変数Sの最適化は、式(2)をw={W,W,・・・,W}及びs={S,S,・・・,S}について最小化することにより達成される。E(w,s)を最小化するようなパラメータw等の更新は、例えば勾配法により行うことができる。すなわち、あるステップにおけるコスト関数E(w,s)の変数w等についての勾配に基づいて、後のステップにおける変数w等を更新し、このような処理をw等が収束するまで繰り返す。このようにすれば、事前に係数wの符号が定められていなくても、スピン変数Sの値が適切に定められ、適応的に符号制約が課せられる。以上のような正則化項によれば、説明変数の変動の方向と、目的変数の変動の方向とに、一定の対応関係を有するような制約を課して回帰分析を行うことができる。
【0024】
スピン変数Sは、連続変数u(-∞<u<+∞)により近似する。スピン変数Sは、以下の式(4)で近似することができる。
【数4】

スピン変数Sは、双曲線正接(ハイパボリックタンジェント)関数で表される。β(>0)は「逆温度パラメータ」である。図4は、スピン変数Sの近似を説明するための図である。図4のグラフは、縦軸がスピン変数S、横軸が連続変数uを表す。また、破線のグラフはβ=0.25、一点鎖線のグラフはβ=0.5、二点鎖線のグラフはβ=1.0、実線のグラフはβ=2である。βが+∞のとき、式(4)のスピン変数Sは+1または-1の二値をとる。βが有限のときは、スピン変数Sは原点付近で-1から+1までの間の値を連続的にとる
【0025】
式(3)に示した誤差関数は、wとu={u,u,・・・,u}を用いて以下のように書き直すことができる。
【数5】

正則化の強さを表すパラメータαの値は、交差検証等により定めることができる。式(5)はw及びuについて微分することができ、以下の勾配法(最急勾配法)の式を導くことができる。
【数6】

ηは1ステップ(1反復)において係数wを更新する大きさを決めるステップ幅である。R±(w)は、w=0で微分不能である。そこで、以下に示すような「劣微分」の値g(w)及びg(w)を用いる。なお、Lは十分に大きな値である。
【数7】
【0026】
最急勾配法の式に基づいてw及びuの更新を繰り返し、w及びuの値が変化しなくなったところ(最小化達成)で繰り返しを終了する。このとき、逆温度パラメータβの値は、「焼きなまし法(simulated annealing)」に従って調整する。すなわち、最急
勾配法の繰り返し計算において、図4に示したβを、はじめは十分小さな値に設定し、繰り返しを進めるにつれて徐々に値を大きくしてゆき、最終的には式(4)のスピン変数Sがほぼ±1の二値のみをとるようにする。βの値をどのように増加させるか(焼きなましスケジュール)は、例えば、繰り返しのステップごとに1より大きい固定の数γを乗じる(β←γβ)という方法を用いることができる。βの値を十分緩やかに増加させれば、確率1で局所解に陥らずに最適解が得られることが知られている。
【0027】
以上のようにすれば、係数wには適切な符号制約が課せられ、且つ目的変数に寄与する値に収束し、そのような値がなければ係数wはゼロに近づいてゆく。すなわち、符号制約を満たす値がない場合は、図2及び図3に示したように正則化による罰則効果が働いて符号制約に反する値を引き戻すことにより、結果的にゼロに収束してゆく。よって、いわゆるLASSOと同様に回帰係数の一部をゼロと推定し得る。このように、誤差関数(5)の最小化の解として、s(k=1,2,・・・,K)及びw(k=1,2,・・・,K)が求められる。
【0028】
また、求められたwを、回帰式(1)の回帰係数として使用することで、新たな入力xK+1に対する出力yを予測することができる。なお、誤差関数(5)の最小化の解として求められたs(k=1,2,・・・,K)に基づいて符号制約を定め、従来技術の符号制約正則化によりw(k=1,2,・・・,K)を求めるようにしてもよい。すなわち、スピン変数S>0ならば図2に示した非負の制約を課し、スピン変数S<0ならば図3に示した非正の制約を課して、回帰係数wを求める。
【0029】
<装置構成>
図5は、上述した回帰分析を行う回帰分析装置1の構成の一例を示すブロック図である。回帰分析装置1はコンピュータであり、通信インターフェース(I/F)11と、記憶装置12と、入出力装置13と、プロセッサ14とを備えており、以上の構成要素がバス等を介して接続されている。通信I/F11は、例えばネットワークカードや通信モジュールであってもよく、所定のプロトコルに基づき、他のコンピュータと通信を行う。記憶装置12は、RAM(Random Access Memory)やROM(Read Only Memory)等の主記憶装置、及びHDD(Hard-Disk Drive)やSSD(Solid State Drive)、フラッシュメモリ等の補助記憶装置(二次記憶装置)であってもよい。主記憶装置は、プロセッサ14が読み出すプログラムや当該プログラムが処理する情報を一時的に記憶する。補助記憶装置は、プロセッサ14が実行するプログラムや当該プログラムが処理する情報等を記憶する。本実施形態では、記憶装置12には、訓練データ及び制約条件を表す情報が、一時的に又は永続的に記憶されているものとする。入出力装置13は、例えば、キーボード、ポイ
ンティングデバイス等の入力装置、モニタ等の出力装置、タッチパネルのような入出力装置等のユーザインターフェースである。プロセッサ14は、CPU(Central Processing
Unit)等の演算処理装置であり、プログラムを実行することにより本実施形態に係る各
処理を行う。図1の例では、プロセッサ14内に機能ブロックを示している。すなわち、プロセッサ14は、所定のプログラムを実行することにより、データ取得部141、回帰分析部142、検証処理部143及び運用処理部144として機能する。
【0030】
データ取得部141は、記憶装置12から、訓練データ及び制約条件を表す情報を取得する。回帰分析部142は、回帰係数を上述した誤差関数の最小化の解として更新し、更新された回帰係数の値が収束したか判定する。なお、収束していないと判定された場合、回帰分析部142は、係数の更新を繰り返す。収束したと判定された場合、例えば回帰分析部142は、最終的に生成される係数を記憶装置12に記憶させる。また、検証処理部143は、所定の評価指標に基づいて作成された回帰式を評価する。例えば、検証処理部143は、交差検証を行った結果に付いて、決定係数Rを算出する。運用処理部144は、作成された回帰式と例えば新たに取得される観測値(例えば、図1のK+1番目のデータ)とを用いて、予測値を算出する。また、運用処理部144は、作成された回帰式と任意の値とを用いて、条件を変更した場合の予測値を算出してもよい。ここで、任意の値は、例えば通信I/F11又は入出力装置13を介してユーザが入力する値であってもよい。例えば、プラントの運転条件を変更する場合に、変更後のプロセス状態を予測することができるようになる。
【0031】
<回帰分析処理>
図6は、回帰分析装置が実行する回帰分析処理の一例を示す処理フロー図である。回帰分析装置1のデータ取得部141は、訓練データと制約条件を表す情報と記憶装置12から読み出す(図6:S1)。本ステップでは、例えば図1に示したような入力x及び出力yの値が訓練データとして読み出される。なお、入力xを説明変数として扱い、出力yを目的変数として扱うものとする。また、図1において、入力xに対応付けて登録されている正又は負の符号が、制約条件を表す情報として読み出される。回帰分析装置1は、読み出される符号を、上述した制約符号として用いる。なお、本実施形態では、式(1)に示したような回帰式を用いる。
【0032】
また、回帰分析装置1の回帰分析部142は、上述した符号制約の下で回帰係数を更新する(図6:S2)。本ステップでは、回帰分析部142は、例えば式(2)に示したコスト関数E(w,s)を最小化するように係数w及びパラメータs(具体的には例えば式(5)のパラメータ「u」)を更新する。具体的には、回帰分析部142は、上述した最急勾配法の式に基づいて係数w等を更新することができる。
【0033】
本実施形態に係るコスト関数E(w,s)の正則化項は、適応的に課される制約条件を満たさない場合にコストが増加するように定義されている。すなわち、正則化項は、説明変数の変動の方向と、目的変数の変動の方向とが、尤もらしい対応関係を有するときにコスト関数E(w,s)の値を減少させるものである。また、回帰分析部142は、係数wについては制約条件を満たす値に収束しない場合、係数をゼロにする。このように、説明変数の選択を行うようにしてもよい。
【0034】
また、回帰分析装置1の回帰分析部142は、すべての係数w等について収束したか又はゼロにされたか判定する(図6:S3)。本ステップでは、回帰分析部142は、更新される係数w等の勾配が充分ゼロに近づいた場合に収束したと判断する。具体的には、回帰分析部142は、上述した最急勾配法の式において係数w、パラメータuの値が変化しなくなったときに、収束したと判断する。
【0035】
係数w等が収束しておらず、ゼロにされてもいないと判定された場合(S3:NO)、S2に戻って処理を繰り返す。一方、係数w等が収束した、又はゼロにされたと判定された場合(S3:YES)、回帰分析部142は、回帰式を記憶装置12に格納する(図6:S4)。本ステップでは、回帰分析部142は、更新後の係数w等を記憶装置12に記憶させる。
【0036】
また、回帰分析装置1の検証処理部143は、作成された回帰式の精度を検証するようにしてもよい(図6:S5)。本ステップでは、検証処理部143は、例えば交差検証により、テストデータを用いて回帰式の精度を検証する。検証処理部143は、相関係数や決定係数等、所定の評価指標に基づいて検証することができる。なお、本ステップは省略してもよい。
【0037】
また、回帰分析装置1の運用処理部144は、作成された回帰式を用いて、運用処理を行う(図6:S6)。本ステップでは、運用処理部144は、例えば図1に示したデータ番号がtT+1のレコードのように、新たな入力xに対する出力yの予測値を算出する。なお、本ステップは、S4で記憶された回帰式を用いて、回帰分析装置1以外の装置(図示せず)が行うようにしてもよい。
【0038】
<実施例>
本技術に係る回帰分析処理を、化学プロセスプラントから得られるセンシングデータに適用した。学習データ数Nは14とし、14組の入力xおよび出力yを用意した。各組は、12個の入力x及び1つの出力yを含む。また、構築される回帰式を、一個抜き交差検証(leave-one-out cross validation, LOOCV)で評価した。すなわち、N個のうちN-1個を訓練データとして、残り1個を評価データとして用いた。14組のデータがすべて1回ずつ評価データとなるように検証をN回繰り返す。そして、N回の結果から、決定係数(R)を算出する。決定係数(R)は、予測の精度を表す一つの指標であり、次の式(8)で与えられる。
【数8】

w0(n),w1(n),・・・,wK(n)は、n番目のデータを評価データとしたときに学習で定められた回帰係数である。
【0039】
様々なαの値に対して、本実施形態を適用し、LOOCVで決定係数Rを算出した。また、同様の検証をL1正則化(Lasso)及び最小二乗法により行った。図7は、検証結果を示す図である。実線は、本実施形態により作成された回帰式の決定係数Rを示す。一点鎖線は、L1正則化により作成された回帰式の決定係数Rを示す。水平の破線は最小二乗法(パラメータαを含まない)による決定係数Rを示す。本実施形態の場合は、αが0.0001以下のときには、0.6以上という高いR値が得られた。L1正則化の場合はαが0.0001のときには、本実施形態と同等なR値(約0.8)が得られた。しかしながら、αがこれよりも大きい場合又は小さい場合は、L1正則化によるR値は急激にゼロ付近に落ち込む。以上から、本実施形態は、L1正則化よりも、高い予測性能(汎化性能)を安定に保証できることがわかる。また、本実施形態及びL1正則化は、最小二乗法よりも高い予測性能を得られた。
【0040】
なお、図7が示すように、L1正則化による予測性能は、αが特定の値(図7の例では0.00011付近)のときに最大になり、αの値がそれより大きく又は小さくなると、
急激に下がる。これは、L1正則化を用いた場合の予測性能がαの値に敏感に左右されることを意味する。このため、L1正則化により効果を得るためには交差検証等によるパラメータαのチューニングが不可欠といえる。
【0041】
一方、本実施形態を用いた場合の予測性能は、αが特定の値(図7の例では0.00011付近)のときに最大になるが、αの値をこれより小さくしても、L1正則化の場合ほどは下がらない。したがって、αの値を、交差検証を経ずに先験的にゼロにおいたとしても、十分に高い予測性能が担保できる。交差検証は多大な計算を要する手続きであるところ、本実施形態によれば、はじめからαの値をゼロにおくことにより、交差検証を経ずに十分な予測性能を得ることができるといえる。
【0042】
<第2の実施形態>
本実施形態においては、スピン変数sを連続変数により近似するのではなく、確率変数として扱う。すなわち、第1の実施形態における式(4)に代えて、スピン変数sは厳格に+1又は-1の値のみをとるものとし、何れの値をとるかは確率的に定めるものとする。以下では、第1の実施形態との相違点を説明する。
【0043】
最急降下法による学習において、次の式(9)で定められる量を定義する。
【数9】

ただし、β(>0)は「逆温度パラメータ」を表す。
【0044】
また、以下の規則でスピン変数s(k=1,2,・・・,K)を更新する。
(i)[0,1]の範囲で一様乱数rを発生させる。
(ii)If ρ≧r, s=1;
(iii)else if ρ<r, s=-1.
すなわち、第1に、0以上1以下の範囲で一様乱数rを生成する。第2に、式(9)で定められるρの値がr以上である場合、スピン変数sを+1とする。第3に、式(9)で定められるρの値がr未満である場合、スピン変数sを-1とする。
【0045】
また、式(2)に示した誤差関数の最小化(学習)を、以下の手順で行う。回帰係数wの最小化は、再急降下法で行うことができる。各ステップにおいて、回帰係数wは次の式(10)により更新する。これは、通常の最急降下法と同様である。
【数10】

ここで、g(w)及びg(w)は、第1の実施形態に示した「劣微分」である。次に、スピン変数sを上記規則(i)から(iii)に基づいて更新する。式(10)による回帰係数wの更新と、規則(i)から(iii)によるスピン変数sの更新をもって1回のステップ(図6におけるステップS2)とし、これを繰り返すことにより学習を実行する。
【0046】
なお、第1の実施形態と同様に、逆温度パラメータβの値は「焼きなまし法」に従って調整する。
【0047】
以上のような第2の実施形態も、予め制約条件を定めておく必要はなく、説明変数の変動と目的変数の変動とに対応関係を有する回帰モデルを構築するための、より汎用的な技術を提供することができるといえる。
【0048】
<変形例>
図5に示したコンピュータの構成は一例であり、このような例には限定されない。例えば、回帰分析装置1の機能の少なくとも一部を複数の装置に分散させ、上述した処理を全体として実現する回帰分析システムを提供するようにしてもよい。また、回帰分析装置1の機能の少なくとも一部について、同一の機能を複数の装置が並列に実行する回帰分析システムを提供するようにしてもよい。また、回帰分析装置1の機能の少なくとも一部は、いわゆるクラウド上に設けるようにしてもよい。また、回帰分析装置1は、例えば検証処理部143等、一部の構成を備えていなくてもよい。また、作成された学習済みモデルを保持し、運用処理部144のみを備えるシステムを提供するようにしてもよい。
【0049】
また、式(2)に示したコスト関数は、正又は負の片側でL1正則化を行うものとしたが、L2ノルムやその他の凸関数によっても動作する。すなわち、係数の絶対値の和に代えて、正又は負の片側で係数の二乗和やその他のペナルティを課す項を用いるようにしてもよい。
【0050】
正則化項に含まれるパラメータSは、スピン変数には限定されず、正則化項に含まれ
る第1の項「(1/2)(1+s)R(w)」と、第2の項「(1/2)(1-s)R(w)」の一方をゼロにする又はゼロに近似するための二値変数であればよい。例えば、パラメータSは0及び+1の何れかをとる二値変数であってもよい。この場合は、式(3)のRASL(w,s)を以下のように定義すればよい。
【数11】

この場合、二値変数を近似するための連続変数は、シグモイド関数を利用することができる。また、これ以外の2値をとる二値変数の場合も、例えばS字状の成長曲線を表す関数で近似することができる。ただし、上述した実施形態のように+1又は-1をとるスピン変数を用いた方が数式変形上の見通しがよく、本機能を実装するためのコードの可読性も向上する。
【0051】
また、回帰分析装置1によって分析されるデータの内容は、特に限定されない。実施例で述べた化学品その他を生産する製造業における品質等の特性値の予測のほか、加工などのプロセス制御、診断等に適用してもよいし、発電、排水処理などの非製造業やその他の様々な分野に適用してもよい。例えば、生産設備が出力するセンシングデータ等を含む情報を説明変数として、機械的、物理的又は化学的性質を表す所定の特性値や、状況に応じた好ましい運転条件、異常度等を目的変数として予測できるようにすることができる。また、非製造業においては、様々な情報を説明変数として、設備の好ましい運転条件等を予測できるようにしてもよい。
【0052】
また、本開示は、上述した処理を実行する方法やコンピュータプログラム、当該プログラムを記録した、コンピュータ読み取り可能な記録媒体を含む。当該プログラムが記録された記録媒体は、プログラムをコンピュータに実行させることにより、上述の処理が可能となる。
【0053】
ここで、コンピュータ読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータから読み取ることができる記録媒体をいう。このような記録媒体のうちコンピュータから取り外し可能なものとしては、フレキシブルディスク、光磁気ディスク、光ディスク、磁気テープ、メモリカード等がある。また、コンピュータに固定された記録媒体としては、HDDやSSD(Solid State Drive)、ROM等がある。
【0054】
各実施形態における各構成及びそれらの組み合わせ等は、一例であって、本開示の主旨から逸脱しない範囲内で、適宜、構成の付加、省略、置換、及びその他の変更が可能である。本開示は、実施形態によって限定されることはなく、クレームの範囲によってのみ限定される。また、本明細書に開示された各々の態様は、本明細書に開示された他のいかなる特徴とも組み合わせることができる。
【符号の説明】
【0055】
1: 回帰分析装置
11: 通信I/F
12: 記憶装置
13: 入出力装置
14: プロセッサ
141: データ取得部
142: 回帰分析部
143: 検証処理部
144: 運用処理部
図1
図2
図3
図4
図5
図6
図7