特許7662975 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社不二越の特許一覧

特許7662975情報処理装置及び情報処理プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2025-04-08

(45)【発行日】2025-04-16

(54)【発明の名称】情報処理装置及び情報処理プログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20250409BHJP

G06F 18/27 20230101ALI20250409BHJP

【ＦＩ】

G06N20/00 130

G06F18/27

【請求項の数】 8

(21)【出願番号】P 2024202354

(22)【出願日】2024-11-20

【審査請求日】2024-12-09

【早期審査対象出願】

(73)【特許権者】

【識別番号】000005197

【氏名又は名称】株式会社不二越

(74)【代理人】

【識別番号】100176072

【弁理士】

【氏名又は名称】小林功

(74)【代理人】

【識別番号】100169225

【弁理士】

【氏名又は名称】山野明

(72)【発明者】

【氏名】園部勝

【審査官】今城朋彬

(56)【参考文献】

【文献】パターン認識のMTシステムを説明してみた（概要編） #MT法 - Qiita，[online]，2022年12月22日，all 16 pages，https://qiita.com/b1307ro/items/c388309e41f3547cddf5

【文献】区分線形回帰モデル - 井出草平の研究ノート，[online]，2023年11月24日，all 4 pages，https://ides.hatenablog.com/entry/2023/11/24/101336

【文献】LU, Kuan et al.，Application of Multi-layer Forward Neural Network based Piecewise Linear Regressionin Simulation of Steam Turbine Valve Flow Curve，IOP Conf. Series: Earth and Environmental Science 512，IOP Publishing [online]，2020年，pp.1-5，https://iopscience.iop.org/article/10.1088/1755-1315/512/1/012170

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ２０／００

Ｇ０６Ｎ３／０２

Ｇ０６Ｆ１８／２７

(57)【特許請求の範囲】

【請求項1】

推定に用いられる複数の説明変数に対応する変数値セットを取得する取得部と、
前記説明変数に対する目的変数の分布を示す散布図を表示するとともに、前記散布図を介する入力操作を受け付けて前記説明変数の範囲を複数の区間に分割するためのＵＩ部と、
前記ＵＩ部を通じて分割された前記複数の区間に対応する複数の線分を連結してなる折れ線関数を回帰式とする前記説明変数毎の単回帰モデルを用いて、前記取得部により取得された前記変数値セットから単一の前記目的変数をそれぞれ推定し、前記目的変数の仮の推定値の集合体である中間値セットを求める第１推定処理と、前記中間値セットを用いて前記目的変数を推定し、前記目的変数の推定値を求める第２推定処理と、を実行する推定部と、
を備えることを特徴とする情報処理装置。

【請求項2】

推定に用いられる複数の説明変数に対応する変数値セットを取得する取得部と、
前記取得部により取得された前記変数値セットから前記説明変数毎の単回帰モデルを用いて単一の目的変数をそれぞれ推定し、前記目的変数の仮の推定値の集合体である中間値セットを求める第１推定処理と、前記中間値セットを用いて前記目的変数を推定し、前記目的変数の推定値を求める第２推定処理と、を実行する推定部と、
を備え、
前記第２推定処理は、前記中間値セット間の交互作用を示す複数の交互作用値を算出する第１演算と、前記第１演算により算出された前記複数の交互作用値に寄与率を作用して前記目的変数の前記推定値を求める第２演算と、を含むことを特徴とする情報処理装置。

【請求項3】

推定に用いられる複数の説明変数に対応する変数値セットを取得する取得部と、
前記取得部により取得された前記変数値セットから、複数の線分を連結してなる折れ線関数を回帰式とする前記説明変数毎の単回帰モデルを用いて単一の目的変数をそれぞれ推定し、前記目的変数の仮の推定値の集合体である中間値セットを求める第１推定処理と、前記中間値セットを用いて前記目的変数を推定し、前記目的変数の推定値を求める第２推定処理と、を実行する推定部と、
を備え、
前記推定部は、前記第１推定処理を実行するための第１推定器と、前記第２推定処理を実行するための第２推定器と、を直列的に接続した推定モデルを用いて前記目的変数を推定し、
前記第１推定器は、第１入力層、第１中間層、及び第１出力層を含む階層型ニューラルネットワークであり、
前記第１中間層を構成する演算ユニットの活性化関数は、直線状又は折れ線状の関数形状を有することを特徴とする情報処理装置。

【請求項4】

前記説明変数及び前記目的変数の集合体である学習用データセットを用いて、前記説明変数毎に複数の区間を定め、前記区間毎に単回帰演算を行い、前記説明変数毎かつ前記区間毎の単回帰係数である回帰係数セットを算出する回帰演算部と、
前記回帰演算部により得られた前記回帰係数セットを、前記第１推定器における演算規則を特定する可変パラメータの初期値として設定し、前記推定モデルに対して前記可変パラメータを更新する学習処理を行う学習処理部と、
をさらに備えることを特徴とする請求項３に記載の情報処理装置。

【請求項5】

推定に用いられる複数の説明変数に対応する変数値セットを取得する取得ステップと、
グラフィカル・ユーザ・インタフェースを通じて、前記説明変数に対する目的変数の分布を示す散布図を表示するとともに、前記散布図を介する入力操作を受け付けて前記説明変数の範囲を複数の区間に分割する分割ステップと、
分割された前記複数の区間に対応する複数の線分を連結してなる折れ線関数を回帰式とする前記説明変数毎の単回帰モデルを用いて、取得された前記変数値セットから単一の前記目的変数をそれぞれ推定し、前記目的変数の仮の推定値の集合体である中間値セットを求める第１推定処理と、前記中間値セットを用いて前記目的変数を推定し、前記目的変数の推定値を求める第２推定処理と、を実行する推定ステップと、
を１つ又は複数のコンピュータに実行させることを特徴とする情報処理プログラム。

【請求項6】

推定に用いられる複数の説明変数に対応する変数値セットを取得する取得ステップと、
取得された前記変数値セットから、複数の線分を連結してなる折れ線関数を回帰式とする前記説明変数毎の単回帰モデルを用いて単一の目的変数をそれぞれ推定し、前記目的変数の仮の推定値の集合体である中間値セットを求める第１推定処理と、前記中間値セットを用いて前記目的変数を推定し、前記目的変数の推定値を求める第２推定処理と、を実行する推定ステップと、
を１つ又は複数のコンピュータに実行させ、
前記第２推定処理は、前記中間値セット間の交互作用を示す複数の交互作用値を算出する第１演算と、前記第１演算により算出された前記複数の交互作用値に寄与率を作用して前記目的変数の前記推定値を求める第２演算と、を含むことを特徴とする情報処理プログラム。

【請求項7】

推定に用いられる複数の説明変数に対応する変数値セットを取得する取得ステップと、
取得された前記変数値セットから、複数の線分を連結してなる折れ線関数を回帰式とする前記説明変数毎の単回帰モデルを用いて単一の目的変数をそれぞれ推定し、前記目的変数の仮の推定値の集合体である中間値セットを求める第１推定処理と、前記中間値セットを用いて前記目的変数を推定し、前記目的変数の推定値を求める第２推定処理と、を実行する推定ステップと、
を１つ又は複数のコンピュータに実行させ、
前記推定ステップでは、前記第１推定処理を実行するための第１推定器と、前記第２推定処理を実行するための第２推定器と、を直列的に接続した推定モデルを用いて前記目的変数を推定し、
前記第１推定器は、第１入力層、第１中間層、及び第１出力層を含む階層型ニューラルネットワークであり、
前記第１中間層を構成する演算ユニットの活性化関数は、直線状又は折れ線状の関数形状を有することを特徴とする情報処理プログラム。
ることを特徴とする情報処理プログラム。

【請求項8】

前記説明変数及び前記目的変数の集合体である学習用データセットを用いて、前記説明変数毎に複数の区間を定め、前記区間毎に単回帰演算を行い、前記説明変数毎かつ前記区間毎の単回帰係数である回帰係数セットを算出する算出ステップと、
算出された前記回帰係数セットを、前記第１推定器における演算規則を特定する可変パラメータの初期値として設定し、前記推定モデルに対して前記可変パラメータを更新する学習処理を行う学習ステップと、
を前記１つ又は複数のコンピュータにさらに実行させることを特徴とする請求項７に記載の情報処理プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、複数の説明変数から単一の目的変数を推定する情報処理装置及び情報処理プログラムに関する。

【背景技術】

【0002】

従来から、ニューラルネットワークを含む学習器に対して学習処理を施し、学習パラメータ群の各値を最適化するための人工知能技術が知られている。

【0003】

特許文献１に、倒立振子制御系における制御パラメータを、ニューラルネットワークの学習アルゴリズム（例えば、平均二乗誤差を用いた誤差逆伝播法）を用いて最適化するコントローラが開示されている。また、特許文献１に、複数の説明変数から単一の目的変数を推定するための推定モデルとして、階層型ニューラルネットワークが示されている。

【先行技術文献】

【特許文献】

【0004】

【文献】特開平０６－０９５７０４号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

ところで、学習用データセットの性質、より詳しくは、説明変数同士の交互作用の大きさ又は傾向によって目的変数の推定精度が異なる場合がある。しかしながら、特許文献１に開示される推定モデルでは、交互作用の影響が何ら考慮されておらず、学習用データセットの性質によっては推定精度が低下することがある。

【0006】

本発明はこのような問題に鑑みてなされたものであり、その目的は、目的変数の推定精度をより向上可能な情報処理装置及び情報処理プログラムを提供することにある。

【課題を解決するための手段】

【0007】

本発明における情報処理装置は、推定に用いられる複数の説明変数に対応する変数値セットを取得する取得部と、前記取得部により取得された前記変数値セットから前記説明変数毎の単回帰モデルを用いて単一の目的変数をそれぞれ推定し、前記目的変数の仮の推定値の集合体である中間値セットを求める第１推定処理と、前記中間値セットを用いて前記目的変数を推定し、前記目的変数の推定値を求める第２推定処理と、を実行する推定部と、を備える。

【0008】

また、前記単回帰モデルが示す回帰式は、複数の線分を連結してなる折れ線関数であってもよい。

【0009】

また、当該情報処理装置は、前記説明変数に対する前記目的変数の分布を示す散布図を表示するとともに、前記散布図を介する入力操作を受け付けて前記複数の線分に対応する複数の区間に分割するためのＵＩ部をさらに備えてもよい。

【0010】

また、前記第２推定処理は、前記中間値セット間の交互作用を示す複数の交互作用値を算出する第１演算と、前記第１演算により算出された前記複数の交互作用値に寄与率を作用して前記目的変数の前記推定値を求める第２演算と、を含んでもよい。

【0011】

また、前記推定部は、前記第１推定処理を実行するための第１推定器と、前記第２推定処理を実行するための第２推定器と、を直列的に接続した推定モデルを用いて前記目的変数を推定し、前記第１推定器は、第１入力層、第１中間層、及び第１出力層を含む階層型ニューラルネットワークであり、前記第１中間層を構成する演算ユニットの活性化関数は、直線状又は折れ線状の関数形状を有してもよい。

【0012】

また、当該情報処理装置は、前記説明変数及び前記目的変数の集合体である学習用データセットを用いて、前記説明変数毎に複数の区間を定め、前記区間毎に単回帰演算を行い、前記説明変数毎かつ前記区間毎の単回帰係数である回帰係数セットを算出する回帰演算部と、前記回帰演算部により得られた前記回帰係数セットを、前記第１推定器における演算規則を特定する可変パラメータの初期値として設定し、前記推定モデルに対して前記可変パラメータを更新する学習処理を行う学習処理部と、をさらに備えてもよい。

【0013】

本発明における情報処理プログラムは、推定に用いられる複数の説明変数に対応する変数値セットを取得する取得ステップと、取得された前記変数値セットから前記説明変数毎の単回帰モデルを用いて単一の目的変数をそれぞれ推定し、前記目的変数の仮の推定値の集合体である中間値セットを求める第１推定処理と、前記中間値セットを用いて前記目的変数を推定し、前記目的変数の推定値を求める第２推定処理と、を実行する推定ステップと、を１つ又は複数のコンピュータに実行させる。

【発明の効果】

【0014】

本発明によれば、目的変数の推定精度をより向上させることができる。

【図面の簡単な説明】

【0015】

【図1】本発明の一実施形態における情報処理装置の構成の一例を示すブロック図である。

【図2】図１の推定モデルが有するネットワーク構造の一例を示す図である。

【図3】図１の情報処理装置による学習動作の一例を示す第１フローチャートである。

【図4】図１の情報処理装置による学習動作の一例を示す第２フローチャートである。

【図5】説明変数及び目的変数に関する散布図の一例を示す図である。

【図6】図４の散布図に対する単回帰演算により求められる回帰式の一例を示す図である。

【図7】図１のＵＩ部に表示される学習設定画面の一例を示す図である。

【図8】図６の折れ線関数に対応する可変パラメータの一例を示す図である。

【図9】図１の情報処理装置による推定動作の一例を示すフローチャートである。

【発明を実施するための形態】

【0016】

以下、添付図面を参照しながら本発明の実施形態について説明する。説明の理解を容易にするため、各図面において同一の構成要素に対しては可能な限り同一の符号を付して、重複する説明は省略する。また、「部」の文言は、例えば、ユニット、モジュール、デバイス、又は要素などの他の文言と置き換えられてもよい。

【0017】

［情報処理装置１０の構成］
＜全体構成＞
図１は、本発明の一実施形態における情報処理装置１０の構成の一例を示すブロック図である。この情報処理装置１０は、様々な用途向けに設計された「汎用コンピュータ」であってもよいし、特定の用途向けに設計された「専用コンピュータ」であってもよい。汎用コンピュータの一例として、パーソナルコンピュータを含む据置型の装置、又は、タブレット・ラップトップを含む携帯型の装置が挙げられる。専用コンピュータの一例として、組み込みコンピュータ又はＰＬＣ（Programmable Logic Controller）などが挙げられる。

【0018】

また、情報処理装置１０は、情報処理サービスを提供するサーバコンピュータであってもよい。サーバコンピュータは、クラウド型あるいはオンプレミス型のいずれであってもよい。また、図１では情報処理装置１０を単体のコンピュータとして示しているが、これに代わって、情報処理装置１０は、分散システムを構築するコンピュータ群であってもよい。

【0019】

この情報処理装置１０は、具体的には、通信部１２と、入力部１４と、表示部１６と、制御部１８と、記憶部２０と、を備える。

【0020】

通信部１２は、図示しない外部装置に対して電気信号を送受信するインターフェースである。これにより、情報処理装置１０は、学習用データセット４０を外部装置から取得するとともに、自身が生成した推定結果情報４６を外部装置に提供することができる。

【0021】

入力部１４は、例えば、マウス、キーボード、タッチセンサ、マイクロフォン、又はこれらを組み合わせた入力デバイスから構成される。表示部１６は、液晶パネル、有機ＥＬ（Electro Luminescence）パネル、又は電子ペーパを含む出力デバイスから構成される。入力部１４による入力機能及び表示部１６による表示機能を組み合わせることにより、グラフィカル・ユーザ・インターフェース（以下、ＵＩ部２２）が構築される。

【0022】

制御部１８は、［１］ＣＰＵ（Central Processing Unit）、ＧＰＧＰＵ（General-Purpose computing on Graphics Processing Unit）を含む汎用プロセッサ、［２］ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）を含む専用プロセッサによって構成される。制御部１８は、記憶部２０に格納されたプログラム及びデータを読み出して実行することで、取得部２４、回帰演算部２６、推定部２８、学習処理部３０、表示制御部３２、及び出力処理部３４として機能する。

【0023】

取得部２４は、学習処理又は推定処理に必要な様々なデータを取得する。取得部２４は、例えば、学習用データセット４０及び変数値セット５４を取得する。取得部２４は、外部装置から通信を介してデータを取得してもよいし、情報処理装置１０の各部（例えば、記憶部２０又はＵＩ部２２）を介してデータを取得してもよい。

【0024】

回帰演算部２６は、取得部２４により取得された学習用データセット４０を用いて、単一の説明変数から単一の目的変数を予測する回帰演算（いわゆる、単回帰演算）を行う。この単回帰演算では、複数の線分を連結してなる折れ線関数が回帰式として用いられる。すなわち、回帰演算部２６は、学習用データセット４０を用いて説明変数毎に複数の区間を定め、区間毎に単回帰演算を行い、説明変数毎かつ区間毎の単回帰係数（後述する回帰係数セット４２）を算出する。なお、複数の変数はそれぞれ定義が異なるので、回帰演算部２６は、標準化又は正規化を通じて各変数のスケールを合わせてもよい。

【0025】

推定部２８は、複数の説明変数から単一の目的変数を推定するための情報処理（以下、推定処理）を行う。この推定処理には、機械学習がなされた推定モデル３６が用いられる。推定モデル３６は、第１推定処理を行う第１推定器Ｅ１と、第２推定処理を行う第２推定器Ｅ２と、を直列的に接続した数理モデルである。第１推定処理は、推定に用いられる複数の説明変数に対応する変数値セット５４から説明変数毎の単回帰モデルを用いて目的変数をそれぞれ推定し、該目的変数の仮の推定値の集合体（以下、中間値セット５６）を求めるための情報処理である。第２推定処理は、中間値セット５６を用いて目的変数を推定し、該目的変数の推定値５８を求めるための情報処理である。第２推定処理は、例えば、中間値セット５６間の交互作用を示す複数の交互作用値を算出する「第１演算」と、複数の交互作用値に寄与率を作用して目的変数の推定値を求める「第２演算」と、を含む。なお、推定部２８は、回帰演算部２６の場合と同様に、標準化又は正規化を通じて各変数のスケールを合わせてもよい。また、この単回帰モデルは、回帰演算部２６による単回帰演算を完全に再現する数理モデルであってもよいし、当該単回帰演算を実質的に再現する数理モデル（いわゆる、派生モデル）であってもよい。

【0026】

第１推定器Ｅ１は、説明変数毎の単回帰モデルを再現するための演算器である。単回帰モデルが示す回帰式は、複数の線分を連結してなる折れ線関数である。つまり、第１推定器Ｅ１は、回帰演算部２６による説明変数毎の単回帰演算を並列的に配置し、当該単回帰演算を一括的に実行する演算器に相当する。この場合、第１推定器Ｅ１は、例えば、第１入力層、第１中間層、及び第１出力層を含む階層型ニューラルネットワークである。説明変数の個数をｎ個（ｎ≧２）、区間の個数をｍ個（ｎ≧２）とする場合、第１入力層における演算ユニット数は、例えば、（ｎ＋１）個である。第１中間層における演算ユニット数は、例えば、（ｎ・ｍ＋１）個である。第１出力層における演算ユニット数は、例えば、ｎ個である。なお、活性化関数の閾値が可変パラメータに含まれる場合、第１入力層における演算ユニット数をｎ個とし、第１中間層における演算ユニット数をｎ・ｍ個としてもよい。

【0027】

第１中間層を構成する演算ユニットの活性化関数は、単回帰演算における回帰式である折れ線関数を線形和によって表現可能な関数形状である。具体的には、活性化関数は、直線状又は折れ線状の関数形状を有する。この関数形状の一例として、ＲｅＬＵ（Rectified Linear Unit）関数、ＲｅＬＵ６関数、ＬｅａｋｙＲｅＬＵ関数、ハードハイパボリックタンジェント関数、ハードシグモイド関数、恒等関数、ソフトシュリンク関数、ハードシュリンク関数などが挙げられる。

【0028】

第２推定器Ｅ２は、少なくとも、仮の推定値同士の交互作用を考慮した演算器である。第２推定器Ｅ２は、例えば、第２入力層、少なくとも１層の第２中間層、及び第２出力層を含む階層型ニューラルネットワークである。説明変数の個数をｎ個（ｎ≧２）とする場合、第２入力層における演算ユニット数は、例えば、ｎ個である。第２中間層における演算ユニット数は、ｎ個であってもよいし、ｍ個（ｍ≠ｎ）であってもよい。第２出力層における演算ユニット数は、原則的に１個である。

【0029】

第２推定器Ｅ２は、上記した第１演算及び第２演算を一体的に実行してもよいし、第１演算及び第２演算を切り分けて順次実行してもよい。第１演算及び第２演算を切り分ける場合、第２推定器Ｅ２は、第１演算を行う第１演算器Ｅ２１と、第２演算を行う第２演算器Ｅ２２と、を直列的に接続した数理モデルである。

【0030】

第１演算器Ｅ２１は、仮の推定値同士の交互作用を示す交互作用値を算出するために設けられる。交互作用値は、２つの値の積であってもよいし、３つ以上の値の積であってもよい。また、交互作用の種類は、積に限られず、他の非線形演算子であってもよい。第１演算器Ｅ２１は、例えば、入力層及び出力層を含むニューラルネットワークである。説明変数の個数をｎ個（ｎ≧２）とする場合、入力層における演算ユニット数は、例えば、ｎ個である。出力層における演算ユニット数は、交互作用値の個数（ｍ）に等しい。例えば、すべての組み合わせにて２つの値の積を求める場合、ｍ＝ｎ（ｎ－１）／２である。

【0031】

第２演算器Ｅ２２は、複数の交互作用値に寄与率を作用して目的変数の推定値を求めるために設けられる。寄与率の作用の一例として、荷重和、ソフトマックス演算が挙げられる。第２演算器Ｅ２２は、例えば、入力層及び出力層を含むニューラルネットワークである。入力層における演算ユニット数は、交互作用値の個数（ｍ）に等しい。出力層における演算ユニット数は、原則的に１個である。

【0032】

学習処理部３０は、学習用データセット４０を用いて、推定モデル３６に対して学習処理（ここでは、教師あり学習）を行う。学習処理部３０は、推定モデル３６における演算規則を特定する可変パラメータの初期値を設定した後、予め定められた更新規則に従って可変パラメータの値を逐次的に更新する。学習パラメータの更新規則の一例として、確率的勾配降下法、モーメンタム法、ＡｄａＧｒａｄ法、Ａｄａｍ法が挙げられる。

【0033】

可変パラメータの初期値は、回帰演算部２６により得られた回帰係数セット４２を用いて設定される。例えば、第１推定器Ｅ１では、回帰演算部２６による単回帰演算と等価になるように重み係数が設定される。例えば、第２推定器Ｅ２では、説明変数同士の交互作用の大きさが略同じになるように重み係数が設定される。設定方法の具体例については、図８で詳しく述べる。

【0034】

表示制御部３２は、所望の画像又は映像を表示するように表示部１６の駆動動作を制御する。具体的には、表示制御部３２は、学習設定画面７０（図７）を含む様々な画面を表示するための表示用データを生成し、該表示用データを表示部１６に供給する。

【0035】

出力処理部３４は、推定部２８により得られた推定結果に基づいて出力処理を行う。出力対象は、推定値５８そのものであってもよいし、推定値５８から生成した生成物であってもよい。生成物の一例として、［１］推定値５８に基づく分析情報、又は［２］制御対象物を制御するための制御信号、などが挙げられる。

【0036】

記憶部２０は、制御部１８が各構成要素を制御するのに必要なプログラム及びデータを記憶している。記憶部２０は、非一過性であり、かつ、コンピュータ読み取り可能な記録媒体で構成されている。ここで、コンピュータ読み取り可能な記録媒体は、光磁気ディスク、ＲＯＭ（Read Only Memory）、ＣＤ（Compact Disc）－ＲＯＭ、フラッシュメモリなどの可搬媒体、コンピュータシステムに内蔵されるハードディスク（ＨＤＤ：Hard Disk Drive）、ソリッドステートドライブ（ＳＳＤ：Solid State Drive）などの記憶装置である。図１の例では、記憶部２０には、学習用データセット４０、回帰係数セット４２、学習パラメータ群４４、及び推定結果情報４６が記憶されている。

【0037】

学習用データセット４０は、学習処理に必要なデータであり、具体的には、変数値セット５０及び正解値５２をデータ単位とする学習データの集合体である。変数値セット５０は、複数の説明変数から構成される。正解値５２は、変数値セット５０に対応する目的変数の理想値（あるいは、教示値）に相当する。

【0038】

回帰係数セット４２は、回帰演算部２６により算出された単回帰係数の集合体である。単回帰係数は、説明変数毎かつ区間毎に求められる。すなわち、回帰係数セット４２は、説明変数毎の［１］１次回帰式の傾き、［２］１次回帰式の切片、［３］区間の下限値、及び［４］区間の上限値に相当する。

【0039】

学習パラメータ群４４は、推定モデル３６に対する学習処理を通じて決定された学習パラメータの集合体である。学習パラメータの一例として、［１］推定モデル３６が有するモデル構造を特定するための「ハイパーパラメータ」、又は［２］学習用データセット４０の母集団に応じて最適値が変化する「可変パラメータ」が挙げられる。可変パラメータの一例として、演算ユニット間の重み係数、活性化関数の係数などが挙げられる。

【0040】

推定結果情報４６は、推定部２８による推定結果に関する情報、具体的には、変数値セット５４と、中間値セット５６と、推定値５８と、を含む。変数値セット５４は、推定に用いられる説明変数に対応する複数の変数値である。中間値セット５６は、第１推定器Ｅ１からの出力値（つまり、目的変数の仮の推定値の集合体）である。推定値５８は、第２推定器Ｅ２からの出力値（つまり、目的変数の推定値）である。

【0041】

＜推定モデル３６のネットワーク構造＞
図２は、図１の推定モデル３６が有するネットワーク構造の一例を示す図である。図２の例では、説明変数の個数が４個であり、説明変数の区間数が３個であることを想定する。また、説明の便宜上、２番目の説明変数に関わるシナプス結合のみを図示している。他の説明変数についても、２番目の説明変数の場合と同様の接続構成を有する。

【0042】

推定モデル３６は、例えば、５つの層ＬＹ１，ＬＹ２，ＬＹ３，ＬＹ４，ＬＹ５からなる階層型ニューラルネットワークで構成される。推定モデル３６の演算規則は、学習パラメータの集合体である学習パラメータ群４４（図１）の各値によって定められる。

【0043】

層ＬＹ１は、第１推定器Ｅ１の第１入力層に対応する層であり、本図の例では５個の演算ユニットから構成される。上から１～４番目の演算ユニットには、１～４番目の説明変数がそれぞれ入力される。上から５番目の演算ユニットには、固定値（例えば、１）が入力される。

【0044】

層ＬＹ２は、第１推定器Ｅ１の第１中間層に対応する層であり、本図の例では、活性化関数がＲｅＬＵ関数である１３個の演算ユニットから構成される。上から１～３番目の演算ユニットには、１番目の説明変数に対応する３つの区間内での演算結果がそれぞれ出力される。上から４～６番目の演算ユニットには、２番目の説明変数に対応する３つの区間内での演算結果がそれぞれ出力される。上から７～９番目の演算ユニットには、３番目の説明変数に対応する３つの区間内での演算結果がそれぞれ出力される。上から１３番目の演算ユニットには、固定値（例えば、１）が入力される。

【0045】

層ＬＹ３は、第１推定器Ｅ１の第１出力層又は第２推定器Ｅ２の第２入力層（あるいは、第１演算器Ｅ２１の入力層）に対応する層であり、本図の例では４個の演算ユニットから構成される。上から１～４番目の演算ユニットには、１～４番目の説明変数に対応する仮の推定値（つまり、中間値セット５６）が出力される。

【0046】

層ＬＹ４は、第２推定器Ｅ２の第２中間層（あるいは、第１演算器Ｅ２１の出力層及び第２演算器Ｅ２２の入力層）に対応する層であり、本図の例では４個の演算ユニットから構成される。上から１～４番目の演算ユニットには、仮の推定値同士の交互作用を示す交互作用値がそれぞれ出力される。

【0047】

層ＬＹ５は、第２推定器Ｅ２の第２出力層（あるいは、第２演算器Ｅ２２の出力層）に対応する層であり、本図の例では１個の演算ユニットから構成される。この演算ユニットには、最終的な推定値が出力される。

【0048】

［情報処理装置１０の動作］
この実施形態における情報処理装置１０は、以上のように構成される。続いて、この情報処理装置１０による学習動作及び推定動作について、図１～図９を参照しながら説明する。

【0049】

＜学習動作＞
図３は、図１の情報処理装置１０による学習動作の一例を示す第１フローチャートである。図４は、図１の情報処理装置１０による学習動作の一例を示す第２フローチャートである。

【0050】

（ＳＰ１０：取得ステップ）
図３のステップＳＰ１０において、取得部２４は、学習処理に用いられる学習用データセット４０を取得する。

【0051】

（ＳＰ１２：正規化ステップ）
ステップＳＰ１２において、回帰演算部２６は、ステップＳＰ１０で取得された学習用データセット４０に含まれる変数値セット５０及び正解値５２をそれぞれ正規化する。

【0052】

図５は、説明変数及び目的変数に関する散布図の一例を示す図である。散布図の横軸は正規化された説明変数｛ｘ_ｉ｝（単位：無次元）を示すとともに、散布図の縦軸は正規化された目的変数（単位：無次元）を示している。各々の変数は、［０，１］の範囲内で正規化されている。図５から理解されるように、目的変数は、説明変数を引数とする３次元関数で近似できそうな関係性を有する。

【0053】

（ＳＰ１４：仮分割ステップ）
図３のステップＳＰ１４において、回帰演算部２６は、ステップＳＰ１２で正規化された各説明変数の区間を仮分割する。この仮分割により、説明変数毎に、区間の下限値及び上限値がそれぞれ決定される。

【0054】

（ＳＰ１６：単回帰ステップ）
ステップＳＰ１６において、回帰演算部２６は、ステップＳＰ１４で仮分割された区間に従って説明変数毎に単回帰演算を行い、説明変数毎の回帰係数（つまり、回帰係数セット４２）を算出する。

【0055】

図６は、図４の散布図に対する単回帰演算により求められる折れ線関数の一例を示す図である。この折れ線関数は、３本の線素Ｌ１，Ｌ２，Ｌ３からなる折れ線ＰＬで示されている。線素Ｌ１は、区間が［０，ｘ_１］であり、傾きがα（正）であり、切片がｙ_０である線分に相当する。線素Ｌ２は、区間が［ｘ_１，ｘ_２］であり、傾きがβ（負）であり、切片がｙ_１である線分に相当する。線素Ｌ３は、区間が［ｘ_２，１］であり、傾きがγ（正）であり、切片がｙ_２である線分に相当する。

【0056】

（ＳＰ１８：設定表示ステップ）
図３のステップＳＰ１８において、表示制御部３２は、学習処理の設定に関する情報を含む表示用データを生成し、該表示用データを表示部１６に供給する。これにより、情報処理装置１０のＵＩ部２２に、図７の学習設定画面７０が表示される。

【0057】

図７は、図１のＵＩ部２２に表示される学習設定画面７０の一例を示す図である。学習設定画面７０上には、グラフ欄７２と、４種類の情報入力部７４，７６，７８，８０と、［単回帰］と表記されたボタン８２と、［最適化］と表記されたボタン８４と、が設けられている。

【0058】

グラフ欄７２には、図４の散布図が可視化して表示されている。グラフ欄７２は、点群８６と、近似曲線８８と、１本又は複数本の分割線９０と、を含んで構成される。情報入力部７４，７６からの入力内容に応じて、点群８６の個数又は位置が変化する。情報入力部７４，７６，７８，８０からの入力内容に応じて、近似曲線８８の形状が変化する。情報入力部８０からの入力内容に応じて、分割線９０の本数が変化する。ユーザによるスライド操作に応じて、分割線９０の位置が変化する。

【0059】

情報入力部７４は、説明変数の種類を選択するためのユーザコントロール（例えば、プルダウンメニュー）から構成される。情報入力部７６は、点群８６のデータ数を選択するためのユーザコントロール（例えば、コンボボックス）から構成される。情報入力部７８は、近似曲線８８の次数を選択するためのユーザコントロール（例えば、プルダウンメニュー）から構成される。情報入力部８０は、区間の分割数を選択するためのユーザコントロール（例えば、プルダウンメニュー）から構成される。［単回帰］ボタン８２は、区間の変更操作を受け付けるためのユーザコントロールである。［最適化］ボタン８４は、区間の決定操作を受け付けるためのユーザコントロールである。

【0060】

（ＳＰ２０：決定受付ステップ）
図３のステップＳＰ２０において、制御部１８は、区間の決定操作を受け付けたか否かを確認する。決定操作をまだ受け付けていない場合（ステップＳＰ２０：ＮＯ）、制御部１８は、次のステップＳＰ２２に進む。

【0061】

（ＳＰ２２：変更受付ステップ）
ステップＳＰ２２において、制御部１８は、区間の変更操作を受け付けたか否かを確認する。変更操作をまだ受け付けていない場合（ステップＳＰ２２：ＮＯ）、制御部１８は、ステップＳＰ２０に戻り、以下、ステップＳＰ２０，ＳＰ２２を順次繰り返す。

【0062】

例えば、ユーザは、学習設定画面７０（図７）上のグラフ欄７２を視ながら、近似曲線８８の適合性、すなわち、点群８６の近似曲線８８が精度よく近似できているか否かを確認する。ユーザは、近似曲線８８の適合性がないと判断した場合、データ数、次数、分割数、又は分割線９０の位置を変更した後に、［単回帰］ボタン８２のタップ操作を行う。そうすると、制御部１８は、区間の変更操作を受け付けた後（ステップＳＰ２２：ＹＥＳ）、次のステップＳＰ２４に進む。

【0063】

（ＳＰ２４：再分割ステップ）
ステップＳＰ２４において、回帰演算部２６は、ステップＳＰ２２で変更操作を受け付けた時点で、ＵＩ部２２に入力されている内容から各説明変数の区間を再分割する。この再分割により、説明変数毎に、区間の下限値及び上限値がそれぞれ変更される。その後、制御部１８は、ステップＳＰ１６に戻って、以下、ステップＳＰ１６～ＳＰ２４を順次繰り返す。

【0064】

ユーザは、学習設定画面７０（図７）上のグラフ欄７２を視ながら、近似曲線８８の適合性があると判断した場合、［最適化］ボタン８４のタップ操作を行う。そうすると、制御部１８は、区間の決定操作を受け付けた後（ステップＳＰ２０：ＹＥＳ）、次のステップＳＰ２６に進む。

【0065】

（ステップＳＰ２６：構築ステップ）
ステップＳＰ２６において、学習処理部３０は、ステップＳＰ２４で決定操作を受け付けた時点で、ＵＩ部２２に入力されている内容（例えば、説明変数の個数、区間の分割数）から推定モデル３６を構築する。これにより、図２に示す推定モデル３６が構築される。

【0066】

（ステップＳＰ２８：初期化ステップ）
図４のステップＳＰ２８において、学習処理部３０は、ステップＳＰ２６で構築された推定モデル３６に関する学習パラメータ群４４を初期化する。学習処理部３０は、具体的には、学習パラメータ群４４を構成する学習パラメータを定義するとともに、各学習パラメータの初期値を付与する。

【0067】

図８は、図６の折れ線関数に対応する可変パラメータの一例を示す図である。図８の例では、演算ユニットの活性化関数がＲｅＬＵ関数である場合を想定する。１番目の区間に対応する活性化関数（Ｆ_１）では、閾値がθ＝０であり、乗数がＣ＝αであり、オフセット（あるいは、バイアス）がＳ＝ｙ_０である。２番目の区間に対応する活性化関数（Ｆ_２）では、閾値がθ＝ｘ_１であり、乗数がＣ＝β－αであり、オフセットがＳ＝ｙ_０－Ｆ_２（ｘ_１）である。３番目の区間に対応する活性化関数（Ｆ_３）では、閾値がθ＝ｘ_２であり、乗数がＣ＝γ－（α＋β）であり、オフセットがＳ＝ｙ_２－Ｆ_１（ｘ_２）－Ｆ_２（ｘ_２）である。

【0068】

図２の例では、第１推定器Ｅ１に関して、層ＬＹ１内のｉ番目の演算ユニットと、層ＬＹ２内の（３・ｉ＋ｊ）番目の演算ユニットとの間の重み係数は、すべて１に設定される。層ＬＹ１内の５番目の演算ユニットと、層ＬＹ２内の（３・ｉ＋ｊ）番目の演算ユニットとの間の重み係数は、閾値｛θ_ｉ,ｊ｝に設定される。層ＬＹ２内のｉ番目の演算ユニットと、層ＬＹ３内の（３・ｉ＋ｊ）番目の演算ユニットとの間の重み係数は、乗数｛Ｃ_ｉ,ｊ｝に設定される。層ＬＹ２内の１３番目の演算ユニットと、層ＬＹ３内のｉ番目の演算ユニットとの間の重み係数は、オフセット｛Ｓ_ｉ｝に設定される。

【0069】

図２の例では、第２推定器Ｅ２に関して、層ＬＹ３内のｉ番目の演算ユニットと、層ＬＹ４内のｊ番目の演算ユニットとの間の重み係数は、クロネッカのデルタ｛δ_ｉ,ｊ｝に設定される。

【0070】

（ＳＰ３０：学習ステップ）
図４のステップＳＰ３０において、学習処理部３０は、ステップＳＰ２８で初期化された状態から、推定モデル３６に対する学習処理を行う。この学習処理を通じて、学習パラメータ群４４の各値が決定される。

【0071】

（ＳＰ３２：結果表示ステップ）
ステップＳＰ３２において、表示制御部３２は、学習処理の結果に関する情報を含む表示用データを生成し、該表示用データを表示部１６に供給する。これにより、情報処理装置１０のＵＩ部２２に、図示しない学習結果画面が表示される。

【0072】

（ＳＰ３４：結果確認ステップ）
ステップＳＰ３４において、制御部１８は、学習の終了操作を受け付けたか否かを確認する。終了操作を受け付けなかった場合（ステップＳＰ３４：ＮＯ）、制御部１８は、図３のステップＳＰ２０に戻る。以下、制御部１８は、必要に応じて、区間の再分割（ＳＰ２２）及び決定（ＳＰ２０）を行った後、ステップＳＰ２６～ＳＰ３４を順次繰り返す。その一方、終了操作を受け付けた場合（ステップＳＰ３４：ＹＥＳ）、制御部１８は、次のステップＳＰ３６に進む。

【0073】

（ＳＰ３６：保存ステップ）
ステップＳＰ３６において、学習処理部３０は、ステップＳＰ３０で決定された学習パラメータ群４４を記憶部２０に保存させる。これにより、推定部２８は、この学習パラメータ群４４を読み出してセットすることにより、推定モデル３６を用いた推定処理を行うことができる。

【0074】

＜推定動作＞
図９は、図１の情報処理装置１０による推定動作の一例を示すフローチャートである。

【0075】

（ＳＰ４０：確認ステップ）
ステップＳＰ４０において、取得部２４は、データを取得するタイミング（つまり、取得タイミング）が到来したか否かを確認する。取得タイミングがまだ到来していない場合（ステップＳＰ４０：ＮＯ）、取得部２４は、取得タイミングが到来するまでの間、ステップＳＰ４０に留まる。その後、取得タイミングが到来した場合（ステップＳＰ４０：ＹＥＳ）、取得部２４は、次のステップＳＰ４２に進む。

【0076】

（ＳＰ４２：取得ステップ）
ステップＳＰ４２において、取得部２４は、推定に用いられる変数値セット５４を取得する。

【0077】

（ＳＰ４４：正規化ステップ）
ステップＳＰ４４において、推定部２８は、ステップＳＰ４０で取得された変数値セット５４の各値を、ステップＳＰ１２（図３）の場合と同じ演算規則に従って正規化する。

【0078】

（ＳＰ４６：推定ステップ）
ステップＳＰ４６において、推定部２８は、ステップＳＰ４４で正規化された変数値セット５４を推定モデル３６に入力することで目的変数を推定する。これにより、中間値セット５６が中間生成物として得られるとともに、推定値５８が成果物として得られる。

【0079】

（ＳＰ４８：出力ステップ）
ステップＳＰ４８において、出力処理部３４は、ステップＳＰ４６で得られた推定値５８又は推定値５８から生成した生成値を出力する。このようにして、情報処理装置１０による推定動作が終了する。

【0080】

［実施形態のまとめ］
以上のように、この実施形態における情報処理装置１０及び情報処理プログラムによれば、変数値セット５４から説明変数毎の単回帰モデルを用いて目的変数の仮の推定値の集合体（つまり、中間値セット５６）を求める第１推定処理と、中間値セット５６を用いて目的変数の推定値を求める第２推定処理と、を順次実行することにより、説明変数同士の交互作用による影響がない前段の推定と、仮の推定値同士の交互作用を考慮した後段の推定と、を明示的に分離することができる。これにより、交互作用の大きさ又は傾向に影響を受けにくい推定が可能となり、目的変数の推定精度をより向上させることができる。

【0081】

また、単回帰モデルは、複数の線分（線素Ｌ１～Ｌ３）を連結してなる折れ線関数を回帰式とする回帰モデルであってもよい。これにより、複雑な関数形状を有する非線形モデルであっても、より簡素な線形モデルの集合によって表現可能となるので、回帰式の適合性がより高まる。

【0082】

また、情報処理装置１０は、説明変数に対する目的変数の分布を示す散布図（ここでは、グラフ欄７２）を表示するとともに、グラフ欄７２を介する入力操作を受け付けて複数の線分（線素Ｌ１～Ｌ３）に対応する複数の区間に分割するためのＵＩ部２２をさらに備えてもよい。これにより、ユーザは、ＵＩ部２２を通じて、散布図を視認しながら区間を分割する操作を容易に行える。

【0083】

また、第２推定処理は、中間値セット５６間の交互作用を示す複数の交互作用値を算出する第１演算と、第１演算により算出された複数の交互作用値に寄与率を作用して目的変数の推定値を求める第２演算と、を含んでもよい。交互作用値の計算と寄与率の作用とを明示的に分離することで、交互作用の影響をさらに受けにくい推定が行える。

【0084】

また、推定部２８は、第１推定器Ｅ１と第２推定器Ｅ２とを直列的に接続した推定モデル３６を用いて目的変数を推定してもよい。この場合、第１推定器Ｅ１は、第１入力層（層ＬＹ１）、第１中間層（層ＬＹ２）及び第１出力層（層ＬＹ３）を含む階層型ニューラルネットワークであり、層ＬＹ２を構成する演算ユニットの活性化関数は、直線状又は折れ線状の関数形状を有する。第１推定器Ｅ１による推定を通じて、折れ線関数を回帰式とする推定演算を階層型ニューラルネットワーク内で再現することができる。

【0085】

また、情報処理装置１０は、学習用データセット４０を用いて、説明変数毎かつ区間毎の単回帰係数である回帰係数セット４２を算出する回帰演算部２６と、回帰係数セット４２を、第１推定器Ｅ１における演算規則を特定する可変パラメータの初期値として設定し、推定モデル３６に対して可変パラメータを更新する学習処理を行う学習処理部３０をさらに備えてもよい。これにより、第１推定器Ｅ１に対して最適解又は最適解に近い初期条件を付与可能となり、その分だけ学習処理の収束性及び精度が高まる。特に、推定モデル３６は、比較的少ない層数（５つの層ＬＹ１～ＬＹ５）から構成されるので、勾配消失問題あるいは過学習が発生しにくくなるという利点もある。

【0086】

［変形例］
なお、本発明は、上記した実施形態に限定されるものではなく、この発明の主旨を逸脱しない範囲で自由に変更できることは勿論である。あるいは、技術的に矛盾が生じない範囲で各々の構成を任意に組み合わせてもよい。あるいは、技術的に矛盾が生じない範囲で、フローチャートを構成するステップの実行順又は実行有無を変更してもよい。

【0087】

上記した実施形態では、情報処理装置１０が推定部２８及び学習処理部３０（図１）の両方を備える場合を例に挙げて説明したが、装置構成はこれに限られない。例えば、情報処理装置１０は、推定部２８の機能のみを備える場合、図示しない外部装置から学習パラメータ群４４をダウンロードし、学習パラメータ群４４を用いて推定処理を行ってもよい。あるいは、情報処理装置１０は、学習処理部３０の機能のみを備える場合、学習処理を通じて生成した学習パラメータ群４４を図示しない外部装置に供給してもよい。

【符号の説明】

【0088】

１０…情報処理装置、１８…制御部、２０…記憶部、２２…ＵＩ部、２４…取得部、２６…回帰演算部、２８…推定部、３０…学習処理部、３２…表示制御部、３４…出力処理部、３６…推定モデル、４０…学習用データセット、４２…回帰係数セット、４４…学習パラメータ群、４６…推定結果情報、５４…変数値セット、５６…中間値セット、５８…推定値、７０…学習設定画面、Ｅ１…第１推定器、Ｅ２…第２推定器、Ｅ２１…第１演算器、Ｅ２２…第２演算器、ＳＰ４２…取得ステップ、ＳＰ４６…推定ステップ

【要約】

【課題】目的変数の推定精度をより向上可能な情報処理装置及び情報処理プログラムを提供する。
【解決手段】情報処理装置１０は、推定に用いられる複数の説明変数に対応する変数値セット５４を取得する取得部２４と、変数値セット５４から説明変数毎の単回帰モデルを用いて単一の目的変数をそれぞれ推定し、目的変数の仮の推定値の集合体である中間値セット５６を求める第１推定処理と、中間値セット５６を用いて目的変数を推定し、目的変数の推定値５８を求める第２推定処理と、を実行する推定部２８と、を備える。
【選択図】図１