(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023020750
(43)【公開日】2023-02-09
(54)【発明の名称】データ解析方法、データ解析装置、及び、データ解析プログラム
(51)【国際特許分類】
G16Z 99/00 20190101AFI20230202BHJP
【FI】
G16Z99/00
【審査請求】有
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2021126294
(22)【出願日】2021-07-30
(11)【特許番号】
(45)【特許公報発行日】2022-02-04
(71)【出願人】
【識別番号】521338064
【氏名又は名称】ENJYN株式会社
(74)【代理人】
【識別番号】100214248
【弁理士】
【氏名又は名称】青山 純
(74)【代理人】
【識別番号】100214260
【弁理士】
【氏名又は名称】相羽 昌孝
(72)【発明者】
【氏名】枝光 敏章
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049DD01
5L049DD02
(57)【要約】
【課題】変量とパイナンバーとの間の方程式を閉じるための条件を付加せずに、パイナンバーの数値データであるパイナンバーデータベクトルを、変量の数値データである変量データベクトルに変換することを可能とするデータ解析方法を提供する。
【解決手段】データ解析方法におけるパイナンバー逆変換処理は、所定の現象にて観察される複数の変量からなる変量セットと、変量から変換可能な1又は複数のパイナンバーからなるパイナンバーセットとの関係を、パイナンバーに含まれる変量の指数で定めるパイナンバー変換情報Pに基づいて、パイナンバーの数値データであるパイナンバーデータベクトルπを、変量の数値データである変量データベクトルqに逆変換する。その際、変量データベクトルqにおける数値データの範囲が特定の変量領域Dに設定された数値解析により、パイナンバーデータベクトルπを、変量領域D内に存在する変量データベクトルqに逆変換する。
【選択図】
図6
【特許請求の範囲】
【請求項1】
コンピュータを用いて、所定の現象に関するデータを解析するデータ解析方法であって、
前記現象にて観察される複数の変量からなる変量セット(Qv)と、前記変量から変換可能な1又は複数のパイナンバーからなるパイナンバーセット(Πv)との関係を、前記パイナンバーに含まれる前記変量の指数で定めるパイナンバー変換情報(P)に基づいて、前記パイナンバーの数値データであるパイナンバーデータからなるパイナンバーデータベクトル(π)を、前記変量の数値データである変量データからなる変量データベクトル(q)に逆変換する際、
前記変量データベクトル(q)における前記数値データの範囲が特定の変量領域(D)に設定された数値解析により、前記変量領域(D)内に存在する前記変量データベクトル(q)に逆変換するパイナンバー逆変換処理(S2)を行う、
データ解析方法。
【請求項2】
前記パイナンバー変換情報(P)に基づいて、前記変量データベクトル(q)を前記パイナンバーデータベクトル(π)に変換するパイナンバー変換処理(S1)と、
前記パイナンバー変換処理により変換された変換後の前記パイナンバーデータベクトル(π)を、前記変量領域(D)内に存在する前記変量データベクトル(q’)に逆変換する前記パイナンバー逆変換処理(S2)とを行うことにより、
前記変量データベクトル(q)に対して相似な前記変量データベクトル(q’)を求めるパイナンバー変換・逆変換処理(S3)を行う、
請求項1に記載のデータ解析方法。
【請求項3】
処理対象の前記パイナンバー変換情報(Pconv)が入力されるとともに、
複数の前記変量が、目的変数と、1又は複数の説明変数からなる説明変数セットとに分類されて、前記目的変数の数値データである変量目的変数データ(y)と、前記説明変数の数値データである説明変数データからなる変量説明変数データベクトル(x)とを組とする前記変量データベクトル(q)の集合である変量データセット(Q)、及び、処理対象の前記変量説明変数データベクトル(x)が入力されて、
前記変量データセット(Q)に含まれる前記変量説明変数データベクトル(x)の集合の内挿範囲(D(X))を前記変量領域(D)として、前記処理対象の変量説明変数データベクトル(x)に対して、前記処理対象のパイナンバー変換情報(Pconv)及び前記変量領域(D)による前記パイナンバー変換・逆変換処理(S3)を行うことにより、前記処理対象の変量説明変数データベクトル(x)に対して前記相似な変量説明変数データベクトル(x’)を求める説明変数パイナンバー変換・逆変換処理(S4)を行う、
請求項2に記載のデータ解析方法。
【請求項4】
処理対象の前記パイナンバー変換情報(Ppred)が入力されるとともに、
複数の前記変量が、目的変数と、1又は複数の説明変数からなる説明変数セットとに分類されて、前記目的変数の数値データである変量目的変数データ(y)と、前記説明変数の数値データである説明変数データからなる変量説明変数データベクトル(x)とを組とする前記変量データベクトル(q)の集合である変量データセット(Q)、及び、予測対象の前記変量説明変数データベクトル(xout)が入力されて、
前記予測対象の変量説明変数データベクトル(xout)に対して未知の前記変量目的変数データ(yout)を予測する現象予測処理(S6)を行い、
前記現象予測処理(S6)は、
前記処理対象のパイナンバー変換情報(Ppred)、前記変量データセット(Q)及び前記予測対象の前記変量説明変数データベクトル(x)を入力として前記説明変数パイナンバー変換・逆変換処理(S4)を行うことにより、前記予測対象の変量説明変数デ
ータベクトルxoutに対して前記相似な変量説明変数データベクトル(x’out)を求め、
前記変量データセット(Q)から作成された予測モデル(freg)を用いて、前記相似な変量説明変数データベクトル(x’out)からモデル予測による前記変量目的変数データ(y’out)を求め、
前記モデル予測による変量目的変数データ(y’out)に対して、前記処理対象のパイナンバー変換情報(Ppred)による前記パイナンバー変換処理(S1)を行うことにより変換された変換後の前記パイナンバーデータベクトル(πout)に基づいて、前記未知の変量目的変数データ(yout)を求める、
請求項3に記載のデータ解析方法。
【請求項5】
前記現象予測処理(S6)は、
前記処理対象のパイナンバー変換情報(Ppred)を、前記パイナンバーに含まれる前記目的変数の指数が特定のパイナンバー(πv1)を除いて0となるように変形することで、変形後の前記パイナンバー変換情報(P’pred)を作成し、
前記変形後のパイナンバー変換情報(P’ pred)、前記変量データセット(Q
)及び前記予測対象の前記変量説明変数データベクトル(x)を入力として前記説明変数パイナンバー変換・逆変換処理(S4)を行うことにより、前記相似な変量説明変数データベクトル(x’out)を求め、
前記変量データセット(Q)に基づいて、前記説明変数セットを入力とし、前記目的変数を出力とする予測モデル(freg)を作成し、
前記相似な変量説明変数データベクトル(x’out)を前記予測モデル(freg)に入力することで、モデル予測による前記変量目的変数データ(y’out)を求め、
前記モデル予測による変量目的変数データ(y’out)と、前記相似な変量説明変数データベクトル(x’out)とを組とする前記変量データベクトル(q’out)に対して、前記変形後のパイナンバー変換情報(P’pred)による前記パイナンバー変換処理(S1)を行うことにより、変換後の前記パイナンバーデータベクトル(πout)を求め、
前記特定のパイナンバー(πv1)の定義式に、前記変換後のパイナンバーデータベクトル(πout)における前記特定のパイナンバー(πv1)に対するパイナンバーデータηoutと、前記予測対象の変量説明変数データベクトル(xout)とを代入することにより、前記未知の変量目的変数データ(yout)を求める、
請求項4に記載のデータ解析方法。
【請求項6】
処理対象の前記パイナンバー変換情報(Pconv)が入力されるとともに、
複数の前記変量が、目的変数と、1又は複数の説明変数からなる説明変数セットとに分類されて、前記目的変数の数値データである変量目的変数データ(y)と、前記説明変数の数値データである説明変数データからなる変量説明変数データベクトル(x)とを組とする前記変量データベクトル(q)の集合である変量データセット(Q)が入力されて、
前記変量データセット(Q)に含まれる前記変量説明変数データベクトル(x)の集合の内挿範囲(D(X))を前記変量領域(D)として、前記変量データセット(Q)に含まれる前記変量データベクトル(q)に対して、前記処理対象のパイナンバー変換情報(Pconv)及び前記変量領域(D)による前記パイナンバー変換・逆変換処理(S3)を行うことにより、前記変量データベクトル(q)に対して前記相似な変量データベクトル(q’)を求める自己空間パイナンバー変換・逆変換処理(S5)を行う、
請求項2に記載のデータ解析方法。
【請求項7】
前記自己空間パイナンバー変換・逆変換処理(S5)は、
前記内挿範囲(D(X))よりも狭い範囲に限定された限定領域を前記変量領域(D)として、前記変量データセット(Q)に含まれる前記変量データベクトル(q)に対し
て、前記処理対象のパイナンバー変換情報(Pconv)及び前記変量領域(D)による前記パイナンバー変換・逆変換処理(S3)を行うことにより、前記変量データベクトル(q)に対して前記相似な変量データベクトル(q’)を求める、
請求項6に記載のデータ解析方法。
【請求項8】
処理対象の前記パイナンバー変換情報(Peval)が入力されるとともに、
複数の前記変量が、目的変数と、1又は複数の説明変数からなる説明変数セットとに分類されて、前記目的変数の数値データである変量目的変数データ(y)と、前記説明変数の数値データである説明変数データからなる変量説明変数データベクトル(x)とを組とする前記変量データベクトル(q)の集合である変量データセット(Q)が入力されて、
前記処理対象のパイナンバー変換情報(Peval)の妥当性を評価するパイナンバー妥当性評価処理(S7)を行い、
前記パイナンバー妥当性評価処理(S7)は、
前記処理対象のパイナンバー変換情報(Peval)及び前記変量データセット(Q)を入力として前記自己空間パイナンバー変換・逆変換処理(S5)を行うことにより求められた前記相似な変量データセット(Q’)に基づいて、前記処理対象のパイナンバー変換情報(Peval)の相似変換妥当性を評価する相似変換妥当性評価処理(S71)を行い、
前記相似変換妥当性評価処理(S71)による前記相似変換妥当性の評価結果に基づいて、前記妥当性を評価し、
前記相似変換妥当性評価処理(S71)は、
前記変量データセット(Q)に基づいて、前記変量説明変数データベクトル(x)を入力とし、前記変量目的変数データ(y)を出力とする予測モデル(freg)を作成し、
前記相似な変量データセット(Q’)に含まれる前記変量説明変数データベクトル(x’)の集合である説明変数データセット(X’)を前記予測モデル(freg)に入力することで、前記変量目的変数データ(y)の集合として、モデル予測による変量目的変数データセット(Y’pred,reg)を求め、
前記相似な変量データセット(Q’)に含まれる前記変量目的変数データ(y’)の集合である前記変量目的変数データセット(Y’pred,P)と、前記モデル予測による変量目的変数データセット(Y’pred,reg)とに基づいて、前記相似変換妥当性を評価する、
請求項6又は請求項7に記載のデータ解析方法。
【請求項9】
前記パイナンバー妥当性評価処理(S7)は、
前記処理対象のパイナンバー変換情報(Peval)の関係式存在性を評価する関係式存在性評価処理(S72)を行い、
前記相似変換妥当性評価処理による前記相似変換妥当性の評価結果と、前記関係式存在性評価処理(S72)による前記関係式存在性の評価結果とに基づいて、前記妥当性を評価し、
前記関係式存在性評価処理(S72)は、
前記処理対象のパイナンバー変換情報(Peval)を、前記パイナンバーに含まれる前記目的変数の指数が特定のパイナンバー(πv1)を除いて0となるように変形することで、変形後の前記パイナンバー変換情報(P’eval)を作成し、
前記変量データセット(Q)に含まれる前記変量データベクトル(q)に対して、前記変形後のパイナンバー変換情報(P’eval)による前記パイナンバー変換処理(S1)をそれぞれ行うことにより、変換後の前記パイナンバーデータベクトル(π)からなるパイナンバーデータセット(Π)を求め、
前記パイナンバーデータセット(Π)を、学習用のパイナンバーデータセット(Πtrain)と、検証用のパイナンバーデータセット(Πtest)とに分割し、
前記学習用のパイナンバーデータセット(Πtrain)に基づいて、前記特定のパイナンバー(πv1)以外の他のパイナンバー(πvn)を入力とし、前記特定のパイナンバー(πv1)を出力とする予測モデル(freg,π)を作成し、
前記検証用のパイナンバーデータセット(Πtest)に含まれる前記他のパイナンバー(πvn)に対する前記パイナンバーデータの集合であるパイナンバー説明変数データセット(Ξtest)を前記予測モデル(freg,π)に入力することで、前記特定のパイナンバー(πv1)に対する前記パイナンバーデータの集合として、モデル予測によるパイナンバー目的変数データセット(Ηtest,pred)を求め、
前記検証用のパイナンバーデータセット(Πtest)に含まれる前記特定のパイナンバー(πv1)に対する前記パイナンバーデータの集合であるパイナンバー目的変数データセット(Ηtest)と、前記モデル予測によるパイナンバー目的変数データセット(Ηtest,pred)とに基づいて、前記関係式存在性を評価する、
請求項8に記載のデータ解析方法。
【請求項10】
処理対象の前記パイナンバー変換情報(P)の候補(PC)が入力されるとともに、
複数の前記変量が、目的変数と、1又は複数の説明変数からなる説明変数セットとに分類されて、前記目的変数の数値データである変量目的変数データ(y)と、前記説明変数の数値データである説明変数データからなる変量説明変数データベクトル(x)とを組とする前記変量データベクトル(q)の集合である変量データセット(Q)が入力されて、
前記候補(PC)から新たな候補(Pnew)を生成する新候補生成処理(S81)と、前記新候補生成処理(S81)により生成された前記新たな候補(Pnew)及び前記変量データセット(Q)を入力とする前記パイナンバー妥当性評価処理(S7)とを繰り返し行うことにより、所定の条件を満たす前記パイナンバー変換情報(Pbest)を探索するパイナンバー探索処理(S8)を行う、
請求項8又は請求項9に記載のデータ解析方法。
【請求項11】
前記新候補生成処理(S81)は、
前記候補(PC)に含まれる複数のパイナンバー変換ベクトルから1又は2の前記パイナンバー変換ベクトルを選択し、
前記1又は2のパイナンバー変換ベクトルの加重和の組み合わせに基づいて、新たな前記パイナンバー変換ベクトルを生成し、
前記新たなパイナンバー変換ベクトルを前記候補(PC)に追加することにより、前記新たな候補(Pnew)を生成する、
請求項10に記載のデータ解析方法。
【請求項12】
コンピュータであって、
請求項1乃至請求項11のいずれか一項に記載のデータ解析方法にて行われる各処理を実行する制御部を備える、
データ解析装置。
【請求項13】
コンピュータに、
請求項1乃至請求項11のいずれか一項に記載のデータ解析方法にて行われる各処理を実行させる、
データ解析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ解析方法、データ解析装置、及び、データ解析プログラムに関する。
【背景技術】
【0002】
従来、データの解析やシミュレーションにおいて、物理量から変換可能なパイナンバー(無次元量ともいう)を利用することで、単位系やスケールに依存することなく、一般化された尺度で数値データの取り扱いが可能になることが知られている。
【0003】
例えば、特許文献1には、流動層に含まれる粒子の個数を減らす粗視化による前後で無次元量は変化しないと条件の下で、所定の変換則により変換された変換後の物性値及び物理量を用いて、流動層の挙動を解析するシミュレーション方法が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に開示されたシミュレーション方法では、粗視化の前後にて無次元量を一定とする所定の変換則により、粗視化前の流動層と、粗視化後の流動層とが相似則を満たすようにしたものである。その際、変換前後では、例えば、粒子が充填された領域の見かけの体積は変化しない、粒子温度及びガス温度は変化しない、粒子全体の顕熱は変化しないという仮定を導入した上で、上記の変換則により物性値及び物理量を変換している。このような仮定の導入により、変換後の物性値及び物理量を求める方程式が閉じることになるため、相似則を満たす特定の解として、変換後の物性値及び物理量が得られることになる。
【0006】
しかしながら、上記のように、物理量の一部を固定するような仮定を導入しない又は導入できない状況では、方程式が閉じないため、パイナンバーを利用した変換により、相似則を満たす特定の解を一意に求めることができなかった。これは、所定の現象に関与する複数の変量(例えば、物理量)が存在する場合、その現象は、複数の変量の個数からそれらの変量を構成する基本単位の数を減算した数のパイナンバー(すなわち、変量の個数よ
りも少ない個数のパイナンバー)で表現されるというバッキンガムのパイ定理(後述の[
数7]式参照)に起因するためである。
【0007】
本発明は、上述した課題に鑑みてなされたものであって、変量とパイナンバーとの間の方程式を閉じるための条件を付加せずに、パイナンバーの数値データであるパイナンバーデータベクトルを、変量の数値データである変量データベクトルに変換することを可能とするデータ解析方法、データ解析装置、及び、データ解析プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、本発明の一態様に係るデータ解析方法は、
コンピュータを用いて、所定の現象に関するデータを解析するデータ解析方法であって、
前記現象にて観察される複数の変量からなる変量セット(Qv)と、前記変量から変換可能な1又は複数のパイナンバーからなるパイナンバーセット(Πv)との関係を、前記
パイナンバーに含まれる前記変量の指数で定めるパイナンバー変換情報(P)に基づいて、前記パイナンバーの数値データであるパイナンバーデータからなるパイナンバーデータベクトル(π)を、前記変量の数値データである変量データからなる変量データベクトル(q)に逆変換する際、
前記変量データベクトル(q)における前記数値データの範囲が特定の変量領域(D)に設定された数値解析により、前記変量領域(D)内に存在する前記変量データベクトル(q)に逆変換するパイナンバー逆変換処理を行う。
【発明の効果】
【0009】
本発明の一態様に係るデータ解析方法によれば、変量データベクトルにおける数値データの範囲が特定の変量領域に設定された数値解析を取り入れることで、パイナンバーデータベクトルは、その変量領域内に存在する変量データベクトルに変換されるので、変量とパイナンバーとの間の方程式を閉じるための条件を付加しなくても、パイナンバーデータベクトルを変量データベクトルに変換することができる。
【0010】
上記以外の課題、構成及び効果は、後述する発明を実施するための形態にて明らかにされる。
【図面の簡単な説明】
【0011】
【
図1】データ解析装置1の一例を示す構成図である。
【
図2】データ解析方法100にて行われる各処理S1~S8を示す概要図である。
【
図3】コンピュータ200の一例を示すハードウエア構成図である。
【
図4】等分布荷重を受ける円板の物理現象を示す模式図である。
【
図5】パイナンバー変換処理S1によるパイナンバー変換を示す模式図である。
【
図6】パイナンバー逆変換処理S2によるパイナンバー不定逆変換を示す模式図である。
【
図7】パイナンバー変換・逆変換処理S3によるパイナンバー変換・不定逆変換を示す模式図である。
【
図8】現象予測処理S6の一例を示すフローチャートである。
【
図9】学習用の物理量データセットAを示す散布図マトリックスである。
【
図10】
図10は、物理量データセットAから作成された回帰モデルfを示す図である。
【
図11】パイナンバー変換・不定逆変換により回帰モデルfの内挿範囲内に変換される物理量データセットBの物理量説明変数データベクトルxを示す散布図マトリックスである。
【
図12】パイナンバー変換・不定逆変換により回帰モデルfの内挿範囲内に変換された物理量データセットBの物理的相似な物理量説明変数データベクトルx’を示す散布図マトリックスである。
【
図13】物理量データセットBに含まれる説明変数に対して現象予測処理S6による目的変数の予測を行った結果を示す図である。
【
図14】物理量データセットBに含まれる説明変数に対して通常の回帰モデルfによる目的変数の予測を行ったときの結果を示す図である。
【
図15】現象予測処理S6による予測と、通常の回帰モデルfによる予測において、範囲拡大率R
rangeに対する予測可能率R
predの依存性を比較した比較結果を示す図である。
【
図16】現象予測処理S6による予測と、通常の回帰モデルfによる予測において、予測値と正解(真値)の決定係数を比較した比較結果を示す図である。
【
図17】相似変換妥当性評価処理S71の一例を示すフローチャートである。
【
図18】自己空間パイナンバー変換・逆変換処理S5による自己空間パイナンバー変換・不定逆変換を示す第1の模式図である。
【
図19】自己空間パイナンバー変換・逆変換処理S5による自己空間パイナンバー変換・不定逆変換を示す第2の模式図である。
【
図20】物理量説明変数データベクトルの補正方法の一例を示す図である。
【
図21】関係式存在性評価処理S72の一例を示すフローチャートである。
【
図22】パイナンバー探索処理S8の一例を示すフローチャートである。
【発明を実施するための形態】
【0012】
以下、図面を参照して本発明を実施するための実施形態について説明する。以下では、本発明の目的を達成するための説明に必要な範囲を模式的に示し、本発明の該当部分の説明に必要な範囲を主に説明することとし、説明を省略する箇所については公知技術によるものとする。
【0013】
(1)データ解析装置1の構成と、データ解析方法100の各処理S1~S8の概要
図1は、データ解析装置1の一例を示す構成図である。
図2は、データ解析方法100にて行われる各処理S1~S8を示す概要図である。
【0014】
データ解析装置1は、所定の現象に関するデータを解析するデータ解析方法100を実行可能な装置であり、例えば、汎用又は専用のコンピュータ(後述の
図3参照)で構成される。
【0015】
所定の現象では、所定の法則(規則やルールと呼ばれるものも含む)の下で相互に作用する複数の変量が観察され、その観察された変量を数値データとして数値化(デジタル化)し、収集することで、データ解析方法100の解析対象となるデータセットが生成される。所定の法則は、複数の変量が関与するものであれば任意の法則でよく、例えば、物理法則や数学的法則のような法則だけでなく、経済法則、市場法則、心理的法則のような法則も含まれる。
【0016】
データ解析装置1は、その主要な構成要素として、制御部10、記憶部11、入力部12、出力部13、及び、通信部14を備える。制御部10は、記憶部11に記憶されたデータ解析プログラム110を実行することで、データ解析部として機能し、データ解析方法100にて行われる各処理S1~S8を実行する。記憶部11は、データ解析プログラム110と、データ解析プログラム110で使用される各種のデータとを記憶する他に、例えば、オペレーティングシステム(OS)、他のプログラムやデータ等を記憶する。入力部12は、各種の入力操作を受け付けるとともに、出力部13は、表示画面や音声を介して各種の情報を出力することで、各処理S1~S8のユーザインターフェースとして機能する。通信部14は、有線又は無線のネットワークに接続されて、他の装置(不図示)との間で各種のデータを送受信する。
【0017】
データ解析方法100では、所定の現象に関するデータを解析する際、その現象に対応するパイナンバーを利用して各種の処理S1~S8(詳細は後述)が行われる。具体的には、処理対象とする現象で観察される変量と、その変量から変換可能なパイナンバーとの関係を定めるパイナンバー変換情報の一形式であるパイナンバー変換マトリックスP(詳細は後述)を利用して各種の処理S1~S8が行われる。パイナンバー変換情報は、相似則を保ちつつ、変量からパイナンバーへの変換、又は、パイナンバーから変量への逆変換を可能とする情報である。
【0018】
データ解析方法100に含まれる各種の処理S1~S8は、パイナンバーの性質を利用した基本機能を実現するものであり、基本機能として、パイナンバーを用いて所定の現象を予測する予測機能101と、パイナンバーの妥当性を評価する妥当性評価機能102と、パイナンバーを自動生成する自動生成機能103とに大別される。なお、上記の基本機
能は、密接に関連しているため、データ解析方法100は、上記の基本機能を実現する各種の処理S1~S8を体系的に行うことが好ましいが、各種の処理S1~S8のうち一部の処理(単独でもよいし、任意の組み合わせでもよい)だけを行うものでもよい。その場合には、データ解析装置1は、その一部の処理を実行する装置として構成され、データ解析プログラム110は、コンピュータ(制御部10)に、その一部の処理を実行させるプログラムとして構成される。
【0019】
基本機能において共通する処理として、データ解析方法100は、パイナンバー変換処理S1と、パイナンバー逆変換処理S2とのうち少なくとも一方を行う。パイナンバー変換処理S1及びパイナンバー逆変換処理S2は、いずれかが単独で行われてもよいし、両方が組み合わせられて行われてもよい。データ解析方法100は、パイナンバー変換処理S1及びパイナンバー逆変換処理S2を組み合わせて行う処理として、パイナンバー変換・逆変換処理S3と、パイナンバー変換・逆変換処理S3を利用した説明変数パイナンバー変換・逆変換処理S4及び自己空間パイナンバー変換・逆変換処理S5とを行う。
【0020】
予測機能101を実現する処理として、データ解析方法100は、現象予測処理S6を行う。現象予測処理S6は、その処理の過程において、パイナンバー変換処理S1及びパイナンバー変換・逆変換処理S3を行う。
【0021】
妥当性評価機能102を実現する処理として、データ解析方法100は、相似変換妥当性評価処理S71及び関係式存在性評価処理S72のうち少なくとも一方を含むパイナンバー妥当性評価処理S7を行う。相似変換妥当性評価処理S71は、その処理の過程において、自己空間パイナンバー変換・逆変換処理S5を行う。関係式存在性評価処理S72は、その処理の過程において、パイナンバー変換処理S1を行う。
【0022】
自動生成機能103を実現する処理として、データ解析方法100は、新候補生成処理S81を含むパイナンバー探索処理S8とを行う。パイナンバー探索処理S8は、その処理の過程において、パイナンバー妥当性評価処理S7を行う。
【0023】
図3は、コンピュータ200の一例を示すハードウエア構成図である。コンピュータ200は、データ解析装置1を構成する装置の一例であり、汎用又は専用のコンピュータとして構成される。
【0024】
コンピュータ200は、
図3に示すように、その主要な構成要素として、バス210、プロセッサ212、メモリ214、入力デバイス216、出力デバイス217、表示デバイス218、ストレージ装置220、通信I/F(インターフェース)部222、外部機器I/F部224、I/O(入出力)デバイスI/F部226、及び、メディア入出力部228を備える。なお、上記の構成要素は、コンピュータ200が使用される用途に応じて適宜省略されてもよい。
【0025】
プロセッサ212は、1つ又は複数の演算処理装置(CPU(Central Processing Unit)、MPU(Micro-processing unit)、DSP(digital signal processor)、GPU(Graphics Processing Unit)等)で構成され、コンピュータ200全体を統括する制御部10として動作する。メモリ214は、各種のデータ及びプログラム230を記憶し、例えば、メインメモリとして機能する揮発性メモリ(DRAM、SRAM等)と、不揮発性メモリ(ROM)、フラッシュメモリ等とで構成される。
【0026】
入力デバイス216は、例えば、キーボード、マウス、テンキー、電子ペン等で構成され、入力部12として機能する。出力デバイス217は、例えば、音(音声)出力装置、
バイブレーション装置等で構成され、出力部13として機能する。表示デバイス218は、例えば、液晶ディスプレイ、有機ELディスプレイ、電子ペーパー、プロジェクタ等で構成され、出力部13として機能する。入力デバイス216及び表示デバイス218は、タッチパネルディスプレイのように、一体的に構成されていてもよい。ストレージ装置220は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)等で構成され、記憶部11として機能する。ストレージ装置220は、オペレーティングシステムやプログラム230の実行に必要な各種のデータを記憶する。
【0027】
通信I/F部222は、インターネットやイントラネット等のネットワーク240に有線又は無線により接続され、所定の通信規格に従って他のコンピュータとの間でデータの送受信を行う通信部14として機能する。外部機器I/F部224は、カメラ、プリンタ、スキャナ、リーダライタ等の外部機器250に有線又は無線により接続され、所定の通信規格に従って外部機器250との間でデータの送受信を行う通信部14として機能する。I/OデバイスI/F部226は、各種のセンサ、アクチュエータ等のI/Oデバイス260に接続され、I/Oデバイス260との間で、例えば、センサによる検出信号やアクチュエータへの制御信号等の各種の信号やデータの送受信を行う通信部14として機能する。メディア入出力部228は、例えば、DVD(Digital Versatile Disc)ドライブ、CD(Compact Disc)ドライブ等のドライブ装置で構成され、DVD、CD等のメディア(非一時的な記憶媒体)270に対してデータの読み書きを行う。
【0028】
上記構成を有するコンピュータ200において、プロセッサ212は、ストレージ装置220に記憶されたプログラム230をメモリ214に呼び出して実行し、バス210を介してコンピュータ200の各部を制御する。なお、プログラム230は、ストレージ装置220に代えて、メモリ214に記憶されていてもよい。プログラム230は、インストール可能なファイル形式又は実行可能なファイル形式でメディア270に記録され、メディア入出力部228を介してコンピュータ200に提供されてもよい。プログラム230は、通信I/F部222を介してネットワーク240経由でダウンロードすることによりコンピュータ200に提供されてもよい。また、コンピュータ200は、プロセッサ212がプログラム230を実行することで実現する各種の機能を、例えば、FPGA(field-programmable gate array)、ASIC(application specific integrated circuit)等のハードウエアで実現するものでもよい。
【0029】
コンピュータ200は、例えば、据置型コンピュータや携帯型コンピュータで構成され、任意の形態の電子機器である。また、コンピュータ200は、クライアント型コンピュータでもよいし、サーバ型コンピュータやクラウド型コンピュータでもよい。
【0030】
次に、上記構成を有するデータ解析装置1により行われるデータ解析方法100の各処理S1~S8の詳細について、
図4乃至
図22を参照して説明する。本実施形態では、所定の現象として、後述の
図4に示す「等分布荷重を受ける円板の物理現象」を例にして、複数の変量として、複数の物理量が観察される場合を中心に説明する。
【0031】
(2)物理量及びパイナンバーと、パイナンバー変換マトリックスPについて
図4は、等分布荷重を受ける円板の物理現象を示す模式図である。
図4に示す円板の物理現象にて観察される複数の物理量q
vは、円板の最大変位w
max、円板が受ける等分布荷重p、円板の半径a、円板の板厚h、及び、円板のヤング率Eの5つである。これら5つの物理量q
v1~q
v5からなる物理量q
vの集合{q
v1,q
v2,q
v3,q
v4,q
v5}を、以下の[数1]式に示すように、「物理量セットQ
v」で表すものとす
る。
【0032】
【0033】
円板の物理現象における予測機能として、例えば、物理量の1つである最大変位wmaxを予測する場合、物理量wmaxを、「目的変数」、物理量wmax以外の他の物理量p、a、h、Eを、「説明変数」という。本実施形態では、目的変数(最大変位wmax)は、物理量セットQvの第1番目の要素qv1に配置されるものとして説明する。
【0034】
円板の物理現象における理論式として、大たわみ(非線形領域)を考慮する場合、最大変位wmaxは、以下の[数2]式で表される支配方程式に従うことが知られている。
【0035】
【0036】
[数2]式において、A、Bは、境界条件により決まる定数であり、例えば、たわみに対する境界条件が単純支持、半径方向の変位が自由である場合には、A=0.262、B=0.696となる。また、左辺の第1項は微小変形のときに支配的な線形項であり、第2項は大変形のときに無視できなくなる非線形項である。
【0037】
円板の物理現象において、物理量qv1~qv5と、それぞれの物理量qv1~qv5の基本単位の指数(次元)の関係は、以下の[表1]で表される。物理量qv1~qv5の基本単位は、N(ニュートン)及びm(メートル)であり、目的変数(最大変位wmax)は、[表1]の第1列(数値部分の左端の列)に配置されるものとして説明する。
【0038】
【0039】
[表1]における数値部分のみを抽出し、以下の[数3]式に示すように、行列の形式で表したものを、「次元マトリックスD」という。
【0040】
【0041】
ここで、バッキンガムのパイ定理に基づいて、[数3]式に示す次元マトリックスDに対して次元解析を行うことにより、以下の[数4]式に示すように、3個のパイナンバーπv1~πv3が求められる。これら3個のパイナンバーπv1~πv3からなるパイナンバーπvの集合{πv1,πv2,πv3}を、「パイナンバーセットΠv」で表すものとする。
【0042】
【0043】
バッキンガムのパイ定理は、支配方程式で支配される現象には、パイナンバーπvの関係式Fが存在することを保証する。すなわち、パイナンバーπvがk個である場合、以下の[数5]式を満たす関係式Fが存在する。
【0044】
【0045】
円板の物理現象において、[数2]式に、[数4]式に示す3個のパイナンバー{πv1,πv2,πv3}を代入すると、以下の[数6]式が得られる。[数6]式は、バッキンガムのパイ定理にて保証される[数5]式に相当する。
【0046】
【0047】
また、パイナンバーの個数kは、バッキンガムのパイ定理により、物理量の個数nと、次元マトリックスDの次元数rankDとから、以下の[数7]式により求められる。
【0048】
【0049】
円板の物理現象では、[数7]式にて、n=5、rankD=2として、パイナンバーπvの個数k=3と計算されるから、[数4]式に示すパイナンバーセットΠvに含まれるパイナンバーπvの個数(3個)と一致する。
【0050】
上記のように、物理現象にて観察される複数の物理量qvからなる物理量セットQvと、物理量から変換可能な1又は複数のパイナンバーπvからなるパイナンバーセットΠvとの関係は、パイナンバー変換情報として、以下の[表2]で表される。
【0051】
【0052】
パイナンバー変換情報が表形式で表された[表2]における数値部分のみを抽出し、以下の[数8]式に示すように、行列形式で表したものを、「パイナンバー変換マトリックスP」という。本実施形態では、パイナンバー変換情報の形式として、「パイナンバー変
換マトリックスP」を採用して説明するが、パイナンバー変換情報は、[表2]や[数8]式で表される情報と同等の情報を含むものであれば、表形式や行列形式以外の任意の形式で表現されるものでもよい。
【0053】
【0054】
パイナンバー変換マトリックスPは、物理量セットQvと、パイナンバーセットΠvとの関係を、パイナンバーπvに含まれる物理量qvの指数で定めるものである。また、パイナンバー変換マトリックスPのi行を、「パイナンバー変換ベクトルpi」という。なお、パイナンバーセットΠvの形は1つに定まらない。なぜなら、基本単位の個数は、物理量の個数よりも少なく、次元解析によりパイナンバーπvを求める際には、基本単位の個数と同じ数の制約式しか存在しないためである。例えば、[数4]式に示すパイナンバーセットΠvは、以下の[数9]式等に変形可能である。
【0055】
【0056】
[数9]式に示す変形は、パイナンバー変換マトリックスPにおける行基本変形を施すことに相当する。このような変形により、説明変数は、1つのパイナンバーπvにしか含まれない形に必ず変形可能であり、パイナンバー変換マトリックスPにおいて、目的変数を左端の列に置いた上で行基本変形により階段行列を作成する操作に相当する。本実施形態では、目的変数(Wmax)を含む特定のパイナンバー(πv1)は、[表2]の第1行目のみに配置されるものであり、パイナンバー変換マトリックスPでは、[数8]の第1行目のパイナンバー変換ベクトルp1のみに配置されるものとして説明する。
【0057】
ここで、上記のように、次元解析により求められたパイナンバーπv及びパイナンバーセットΠvを、「数学的パイナンバーπm」及び「数学的パイナンバーセットΠm」とそれぞれ呼ぶものとし、添え字mを付すものとする。
【0058】
また、物理現象を支配する支配方程式や物理法則に関する知見を活用することにより、パイナンバーの個数が「数学的パイナンバーπm」よりも少ない「物理的パイナンバーπp」を導出できる場合がある。
【0059】
例えば、円板の物理現象において、[数2]式は、支配方程式に相当するが、既に微分方程式の解の形をしているため、[数4]式に示した3個の数学的パイナンバー(Πm={πv1,πv2,πv3})が、[数2]式の中に存在していることが認識される。さらに、[数2]式の右辺に含まれる2つの数学的パイナンバーを1つにまとめることで新たなパイナンバーを導出できる可能性が認識される。したがって、上記のような認識に基づくと、以下の[数10]式に示すように、2個の物理的パイナンバー{πp1,πp2}が求められる。これら2個の物理的パイナンバー{πp1,πp2}からなる物理的パイナンバーπpの集合{πp1,πp2}を、「物理的パイナンバーセットΠp」で表すものとする。
【0060】
【0061】
物理的パイナンバーπpの関係式Fは、以下の[数11]式で表される。なお、数学的パイナンバーπmの関係式Fは、[数6]式で表される。
【0062】
【0063】
物理的パイナンバーπpの関係式F、すなわち、[数11]式を導出するためには、人の物理的知見が活用されている。その効果により、より凝縮されたパイナンバーが得られたと解釈できる。ただし、人の知見を活用してもパイナンバーの個数が減らない場合もあり、その場合には、数学的パイナンバーπm(πv)と物理的パイナンバーπpとは一致することになる。
【0064】
さらに、物理現象を特定の状況に近似することで、「近似的パイナンバーπa」を導出できる場合がある。
【0065】
例えば、円板の物理現象において、大変形(非線形領域)とみなせる現象のみを対象とする場合を想定し、[数2]式の線形項(左辺第1項)を消去すると、以下の[数12]式が得られる。
【0066】
【0067】
このとき、[数12]式の左辺は、パイナンバーを表しており、以下の[数13]式に示すように、1個の近似的パイナンバーπa1が求められる。近似的パイナンバーの集合{πa1}を、「近似的パイナンバーセットΠa」で表すものとする。
【0068】
【0069】
近似的パイナンバーπaの関係式Fは、以下の[数14]式で表される。
【0070】
【0071】
パイナンバーが1つの場合、物理量のデータが1セットあれば、パイナンバーは、[数14]式に示すように、定数として定まる。すなわち、パイナンバーは、変数ではなく、すべての相似な現象において一定値となる。
【0072】
(3)データ構造の定義について
各処理S1~S8にて取り扱われるデータに関するデータ構造の定義について説明する。
【0073】
複数(n個)の物理量qvからなる物理量セットQvに対して特定の物理現象(条件)を表す数値がそれぞれ代入された数値データを、以下の[数15]式に示すように定義する。具体的には、複数の物理量qvからなる物理量セットQvに対して数値データがそれぞれ代入された要素{q1,q2,…,qn}を持つベクトルを、「物理量データベクトルq」と定義する。そのため、物理量データベクトルqは、物理量セットQvに対応したデータであり、物理量qvの数値データである「物理量データ」からなる。複数の物理量データベクトルqの集合として、複数の物理量データベクトルqを縦に並べた二次元配列を、「物理量データセットQ」と定義する。
【0074】
また、複数の物理量qvが、目的変数と、1又は複数の説明変数からなる説明変数セットとに分類される場合、物理量データベクトルqは、目的変数の数値データである「物理量目的変数データy」と、説明変数の数値データである説明変数データからなる「物理量説明変数データベクトルx」とを組として構成される。物理量目的変数データyの集合として、複数の物理量目的変数データyを縦に並べた一次元配列を、「物理量目的変数データセットY」と定義する。物理量説明変数データベクトルxの集合として、複数の物理量説明変数データベクトルxを縦に並べた二次元配列を、「物理量説明変数データセットX」と定義する。
【0075】
【0076】
複数(k個)のパイナンバーπvからなるパイナンバーセットΠvに対しても、物理量qvと同様に、特定の物理現象(条件)を表す数値がそれぞれ代入された数値データを、以下の[数16]式に示すように定義する。具体的には、複数のパイナンバーπvからなるパイナンバーセットΠvに対して数値データがそれぞれ代入された要素{π1,π2,…,πk}を持つベクトルを、「パイナンバーデータベクトルπ」と定義する。そのため、パイナンバーデータベクトルπは、パイナンバーセットΠvに対応したデータであり、
パイナンバーπvの数値データである「パイナンバーデータ」からなる。複数のパイナンバーデータベクトルπの集合として、複数のパイナンバーデータベクトルπを縦に並べた二次元配列を、「パイナンバーデータセットΠ」と定義する。
【0077】
また、複数のパイナンバーπvが、目的変数と、1又は複数の説明変数からなる説明変数セットとに分類される場合、パイナンバーデータベクトルπは、目的変数の数値データである「パイナンバー目的変数データη」と、説明変数の数値データである説明変数データからなる「パイナンバー説明変数データベクトルξ」とを組として構成される。パイナンバー目的変数データηの集合として、複数のパイナンバー目的変数データηを縦に並べた一次元配列を、「パイナンバー目的変数データセットΗ」と定義する。パイナンバー説明変数データベクトルξの集合として、複数のパイナンバー説明変数データベクトルξを縦に並べた二次元配列を、「パイナンバー説明変数データセットΞ」と定義する。
【0078】
【0079】
n個の物理量qv、及び、k個のパイナンバーπvに対するパイナンバー変換マトリックスPを、以下の[数17]式に示すように定義する。また、パイナンバー変換マトリックスPのi行を、「パイナンバー変換ベクトルpi」と定義する。
【0080】
【0081】
(4)パイナンバー変換処理S1について
図5は、パイナンバー変換処理S1によるパイナンバー変換を示す模式図である。パイナンバー変換処理S1は、パイナンバー変換マトリックスPに基づいて、物理量データベ
クトルqをパイナンバーデータベクトルπに変換する処理である。パイナンバー変換処理S1によるパイナンバー変換を、以下の[数18]式で表すものとする。
【0082】
【0083】
パイナンバーデータベクトルπは、物理量データベクトルqを構成する物理量データの各値を、パイナンバーデータベクトルπを構成するパイナンバーデータの各定義式に代入することにより、一意に変換される。例えば、パイナンバーデータの定義式を示す[数4]式に対して、5個の物理量データの各値を代入することにより、全てのパイナンバーデータが一意に決定され、パイナンバーデータベクトルπに変換される。
【0084】
また、パイナンバー変換処理S1が、パイナンバー変換マトリックスPに基づいて、物理量データセットQに含まれる物理量データベクトルqの各々をパイナンバーデータベクトルπにそれぞれ変換する処理を、以下の[数19]式で表すものとする。
【0085】
【0086】
(5)パイナンバー逆変換処理S2について
図6は、パイナンバー逆変換処理S2によるパイナンバー不定逆変換を示す模式図である。パイナンバー逆変換処理S2は、パイナンバー変換マトリックスPに基づいて、パイナンバーデータベクトルπを物理量データベクトルqに変換する処理である。バッキンガムのパイ定理によれば、パイナンバーπ
vの個数kは、物理量q
vの個数nよりも少ないため、パイナンバー逆変換処理S2を行う際、パイナンバーデータベクトルπと、物理量データベクトルqとの間で方程式が閉じない。そのため、パイナンバーデータベクトルπは、一意に決定されず、無数の解を持つ。例えば、[数4]式において、3個のパイナンバーデータの各値を定数に固定した場合、3つの方程式が作られることになるが、それらの方程式に含まれる物理量q
vの個数nは5個であるため、物理量データは、一意に定まらない。
【0087】
そこで、パイナンバー逆変換処理S2では、物理量データベクトルqにおける数値データの範囲が特定の物理量領域Dに設定された数値解析により、その物理量領域D内に存在する物理量データベクトルqに逆変換する。数値解析の手法としては、特定の物理量領域D内に存在する方程式の解を数値的に探索するような任意のアルゴリズムが適用可能であり、例えば、ニュートン・ラフソン法、準ニュートン法等が適用される。物理量領域D内に方程式の解が存在する場合には、偶然的に1つの解に収束することで、物理量データベクトルqに逆変換される。上記のように、パイナンバー逆変換処理S2が、パイナンバー変換マトリックスPに基づいて、パイナンバーデータベクトルπを、数値解析により特定の物理量領域D内に存在する物理量データベクトルqに変換することを、「パイナンバー不定逆変換」と呼ぶものとし、パイナンバー逆変換処理S2によるパイナンバー不定逆変換を、以下の[数20]式で表すものとする。
【0088】
【0089】
また、パイナンバー逆変換処理S2が、パイナンバー変換マトリックスPに基づいて、
パイナンバーデータセットΠに含まれるパイナンバーデータベクトルπの各々を物理量データベクトルqにそれぞれ逆変換する処理を、以下の[数21]式で表すものとする。
【0090】
【0091】
以上のように、パイナンバー逆変換処理S2によれば、物理量データベクトルqにおける数値データの範囲が特定の物理量領域Dに設定された数値解析を取り入れることで、パイナンバーデータベクトルπは、その物理量領域D内に存在する物理量データベクトルqに変換されるので、物理量とパイナンバーとの間の方程式を閉じるための条件を付加しなくても、パイナンバーデータベクトルπを物理量データベクトルqに変換することができる。
【0092】
(6)パイナンバー変換・逆変換処理S3について
図7は、パイナンバー変換・逆変換処理S3によるパイナンバー変換・不定逆変換を示す模式図である。パイナンバー変換・逆変換処理S3は、
図7に示すように、パイナンバー変換処理S1と、パイナンバー逆変換処理S2とを行うことにより、物理量データベクトルqに対して相似則を満たす相似(本実施形態では、「物理的相似」という)な物理量データベクトルq’を求める処理である。
【0093】
パイナンバー変換処理S1が、物理量データベクトルqをパイナンバーデータベクトルπに変換し、さらに、パイナンバー逆変換処理S2が、パイナンバー変換処理S1により変換された変換後のパイナンバーデータベクトルπを、特定の物理量領域D内に存在する物理量データベクトルq’に逆変換することにより、物理量データベクトルqに対して物理的相似な物理量データベクトルq’が求められる。パイナンバー変換・逆変換処理S3により求められた物理量データベクトルq’は、無数の解の中から偶然的に収束した解であるため、変換前の物理量データベクトルqとは異なるが、同一のパイナンバーデータベクトルπを持つことから、変換前の物理量データベクトルqに対して物理的相似な関係にあるといえる。
【0094】
上記のように、パイナンバー変換・逆変換処理S3が、パイナンバー変換マトリックスPに基づいて、物理量データベクトルqを、物理的相似な物理量データベクトルq’に変換する。このような変換を、「パイナンバー変換・不定逆変換」と呼ぶものとし、パイナンバー変換・逆変換処理S3によるパイナンバー変換・不定逆変換を、以下の[数22]式で表すものとする。
【0095】
【0096】
なお、パイナンバー逆変換処理S2及びパイナンバー変換・逆変換処理S3における特定の物理量領域Dは、例えば、データ解析者により指定された領域でもよいし、解析対象となるデータセットから導出された領域でもよく、例えば、後述の説明変数パイナンバー変換・逆変換処理S4及び自己空間パイナンバー変換・逆変換処理S5のように、物理量データセットQの内挿範囲でもよいし、その内挿範囲よりも狭い範囲でもよい。また、パイナンバー変換処理S1、パイナンバー逆変換処理S2及びパイナンバー変換・逆変換処理S3における対象のデータ(変量データベクトル(q)に相当)は、物理量データベクトルqに代えて、物理量データベクトルqの一部としてもよく、例えば、物理量データベクトルqを構成する物理量説明変数データベクトルxでもよいし、その物理量説明変数デ
ータベクトルxの一部でもよい。
【0097】
以上のように、パイナンバー変換・逆変換処理S3によれば、物理量データベクトルqにおける数値データの範囲が特定の物理量領域Dに設定された数値解析を取り入れることで、物理量データベクトルqは、その物理量領域D内に存在する物理量データベクトルq’に変換されるので、物理量とパイナンバーとの間の方程式を閉じるための条件を付加しなくても、物理量データベクトルqに対して物理的相似な物理量データベクトルq’を求めることができる。
【0098】
(7-1)現象予測処理S6について
現象予測処理S6は、所定の現象にて成り立つ理論式(例えば、円板の物理現象では、[数2]式に示す支配方程式)は不明であるが、その現象にて観察された物理量データセットQと、その現象を表すパイナンバー(具体的には、処理対象のパイナンバー変換マトリックスPpred)が得られている状況において、そのパイナンバーを利用して、予測対象の説明変数(物理量説明変数データベクトルxout)に対して未知の目的変数(物理量目的変数データyout)を予測する処理である。その際、予測対象の説明変数は、物理量データセットQの内挿範囲に存在するものでもよいし、物理量データセットQの外挿範囲に存在するものでもよい。
【0099】
現象予測処理S6で利用されるパイナンバー、すなわち、処理対象のパイナンバー変換マトリックスPpredは、数学的パイナンバー、物理的パイナンバー、及び、近似的パイナンバーのいずれでもよいし、これら以外の任意のパイナンバーでもよい。また、処理対象のパイナンバー変換マトリックスPpredは、後述のパイナンバー探索処理S8で実現される自動生成機能を利用して生成されたものでもよいし、データ解析者の知見に基づいて生成されたものでもよい。
【0100】
現象予測処理S6では、物理量データセットQの内挿範囲又は外挿範囲に存在する予測対象の説明変数(物理量説明変数データベクトルxout)に対して、パイナンバー変換・逆変換処理S3を行うことにより、物理量データセットQの内挿範囲に、物理的相似な説明変数(物理量説明変数データベクトルx’out)を数値的に見つけ出す。物理的相似な説明変数が見つけ出された場合には、その物理的相似な説明変数から、物理量データセットQから作成された予測モデルを用いて目的変数の予測値(モデル予測による物理量目的変数データy’out)を求め、さらにその目的変数の予測値に対してパイナンバー変換処理S1を行うことにより変換された変換後のパイナンバーデータベクトル(πout)に基づいて、未知の目的変数(物理量目的変数データyout)に換算する。これにより、現象予測処理S6は、予測対象の説明変数が物理量データセットQの外挿範囲に存在する場合であっても、内挿の予測と近い精度で外挿の予測を実現する。
【0101】
図8は、現象予測処理S6の一例を示すフローチャートである。
【0102】
まず、ステップS600では、処理対象のパイナンバー変換マトリックスPpredが入力されるとともに、物理量データセットQ及び予測対象の物理量説明変数データベクトルxoutが入力される。なお、これらのデータは、記憶部11から読み出したものでもよいし、入力部12を介して入力されたものでもよいし、ネットワークに接続された他の装置から受信したものでもよい。
【0103】
ステップS600にて入力される物理量データセットQは、[数15]式に示すように、物理量目的変数データyと、物理量説明変数データベクトルxとを組とする物理量データベクトルqの集合である。また、後述のパイナンバー変換・不定逆変換にて数値解析の精度悪化を抑えるための前処理として、必要に応じて、物理量データセットQに含まれる
各数値データの桁を補正してもよい。
【0104】
次に、ステップS601では、処理対象のパイナンバー変換マトリックスPpredを、パイナンバーπvに含まれる目的変数の指数が特定のパイナンバーπv1を除いて0となるように変形することで、変形後のパイナンバー変換マトリックスP’predを作成する。本実施形態では、目的変数を含む特定のパイナンバーπv1が、例えば、[表2]に示すように、第1行目のみに配置されるように変形されるものとして説明する。すなわち、[数8]に示すように、第1行目のパイナンバー変換ベクトルp1では、第1番目の要素が0以外の整数となり、他のパイナンバー変換ベクトルp2、p3では、第1番目の要素が0となるように、変形される。
【0105】
なお、ステップS601は、ステップS600にて処理対象のパイナンバー変換マトリックスPpredが入力される前の前処理として実行されてもよいし、処理対象のパイナンバー変換マトリックスPpredが、変形後の形を元々有している場合には、ステップS601は省略されてもよい。その場合には、ステップS602以降の各ステップでは、ステップS600にて入力された処理対象のパイナンバー変換マトリックスPpredを、変形後のパイナンバー変換マトリックスP’predとみなして実行すればよい。
【0106】
次に、ステップS602では、以下の[数23]式に示すように、物理量データセットQに含まれる物理量説明変数データベクトルxの集合である物理量説明変数データセットXの内挿範囲D(X)を物理量領域Dとして、予測対象の物理量説明変数データベクトルxoutに対して、変形後のパイナンバー変換マトリックスP’pred及び物理量領域Dによるパイナンバー変換・逆変換処理S3を行うことにより、予測対象の物理量説明変数データベクトルxoutに対して物理的相似な物理量説明変数データベクトルx’outを求める。
【0107】
【0108】
ここで、上記のステップS600~S602(ステップS601は省略可)における処理が、説明変数パイナンバー変換・逆変換処理S4に相当する。すなわち、説明変数パイナンバー変換・逆変換処理S4は、処理対象のパイナンバー変換マトリックスPconv(=P’pred)が入力されるとともに、物理量データセットQ及び処理対象の物理量説明変数データベクトルx(=xout)が入力されたとき、物理量データセットQの内挿範囲D(X)を物理量領域Dとして、処理対象の物理量説明変数データベクトルxに対して、処理対象のパイナンバー変換マトリックスPconv及び物理量領域Dによるパイナンバー変換・逆変換処理S3を行うことにより、処理対象の物理量説明変数データベクトルxに対して物理的相似な物理量説明変数データベクトルx’に変換する処理である。
【0109】
上記の説明変数パイナンバー変換・逆変換処理S4では、目的変数を除いて説明変数だけを対象として、パイナンバー変換・逆変換処理S3を行うが、変換前の物理量説明変数データベクトルxが含まれる物理量データベクトルqと、変換後の物理量説明変数データベクトルx’が含まれる物理量データベクトルq’とは、相似な関係を満たすものと仮定して、説明変数パイナンバー変換・逆変換処理S4が行われる。そのため、説明変数パイナンバー変換・逆変換処理S4は、処理対象の物理量説明変数データベクトルxに対して
物理的相似な現象の物理量説明変数データベクトルx’に変換する処理であるといえる。本明細書では、「物理的相似な物理量説明変数データベクトル(相似な変量説明変数データベクトル)」は、「物理的相似な現象の物理量説明変数データベクトル(相似な現象の変量説明変数データベクトル)」を表す用語として使用する。
【0110】
なお、説明変数パイナンバー変換・逆変換処理S4における処理対象の物理量説明変数データベクトルxは、物理量データセットQの内挿範囲及び外挿範囲のいずれに存在するものでもよい。また、現象予測処理S6に組み込まれた説明変数パイナンバー変換・逆変換処理S4は、物理量目的変数データyoutが未知な状態で予測対象の物理量説明変数データベクトルxoutに対して行われることを基本とするが、物理量目的変数データyが既知な状態であっても、その既知の物理量目的変数データyと組とする物理量説明変数データベクトルxに対して行われてもよい。
【0111】
したがって、
図8に示すステップS602は、変形後のパイナンバー変換情報P’
pred、物理量データセットQ及び予測対象の物理量説明変数データベクトルxを入力として説明変数パイナンバー変換・逆変換処理S4を行うことにより、物理的相似な物理量説明変数データベクトルx’
outを求めるものである。
【0112】
次に、ステップS603では、物理量データセットQに基づいて、物理量説明変数データベクトルx(説明変数セット)を入力とし、物理量目的変数データy(目的変数)を出力とする予測モデルfregを作成する。予測モデルfregは、例えば、ニューラルネットワーク(ディープラーニングを含む)を用いた回帰モデルであり、物理量データセットQを学習データとして、物理量説明変数データベクトルxと、物理量目的変数データyとの間の相関関係を機械学習することで作成される。なお、予測モデルfregは、上記の例に限られず、他の手法やモデルにより作成されたものでもよい。
【0113】
次に、ステップS604では、以下の[数24]式で示すように、ステップS602で求められた物理的相似な物理量説明変数データベクトルx’outを、ステップS603で作成された予測モデルfregに入力することで、モデル予測による物理量目的変数データy’outを求める。
【0114】
【0115】
次に、ステップS605では、以下の[数25]式で示すように、ステップS604で求められたモデル予測による物理量目的変数データy’outと、ステップS602で求められた物理的相似な物理量説明変数データベクトルx’outとを組とする物理量データベクトルq’outに対して、変形後のパイナンバー変換マトリックスP’predによるパイナンバー変換処理S1を行うことにより、変換後のパイナンバーデータベクトルπoutを求める。
【0116】
【0117】
次に、ステップS606では、以下の[数26]式で示すように、特定のパイナンバー
πv1の定義式に、ステップS605で求められた変換後のパイナンバーデータベクトルπoutにおける特定のパイナンバーπv1に対するパイナンバーデータηout(=πout,1)と、予測対象の物理量説明変数データベクトルxoutとを代入することにより、未知の物理量目的変数データyoutを求める。なお、{p1,1,p1,2,…,
p1,n}は、変形後のパイナンバー変換マトリックスP’predにおける第1行目の
パイナンバー変換ベクトルp1の各要素を表す。
【0118】
【0119】
以上のようにして、
図8に示す現象予測処理S6では、パイナンバー変換マトリックスPを利用して、予測対象の説明変数(物理量説明変数データベクトルx
out)に対して未知の目的変数(物理量目的変数データy
out)を予測する。現象予測処理S6による一連の処理を、以下の[数27]で表すものとする。
【0120】
【0121】
(7-2)現象予測処理S6による予測性能の検証結果
以下の[表3]に示す物理量データセットQを用いて、現象予測処理S6による予測性能を検証した結果について説明する。各物理量データセットQに含まれる100条件の物理量説明変数データベクトルxは、[表3]に示す物理量領域内にてランダムな一様分布として作成した。物理量目的変数データy(wmax)の値は、物理量説明変数データベクトルxから、[数2]式の近似解として求めることで作成した。数学的パイナンバーπm([数4]式の3個)、又は、物理的パイナンバーπp([数10]式の2個)を表すパイナンバー変換マトリックスPをステップS600にて入力される処理対象のパイナンバー変換マトリックスPpredとし、物理量データセットAを現象予測処理ステップS600にて入力される物理量データセットQとし、物理量データセットB、C、D、Eに含まれる100条件の物理量説明変数データベクトルxの各々をステップS600にて入力される現象予測処理予測対象の物理量説明変数データベクトルとして現象予測処理S6を行い、その現象予測処理S6による物理量目的変数データの予測値と、物理量データセットB、C、D、Eに含まれる物理量目的変数データ(真値)とを比較することで、予測性能を検証した。
【0122】
【0123】
図9は、学習用の物理量データセットAを示す散布図マトリックスである。対角のグラフは、各物理量のヒストグラム、他のグラフは、物理量の全ての組み合わせについての散布図を表している。
【0124】
図10は、物理量データセットAから作成された回帰モデルfを示す図である。横軸が予測値、縦軸が正解(真値)をそれぞれ表す。機械学習ツールを用いて、多層ニューラルネットワーク(ディープラーニング)により、物理量データセットAから回帰モデルfを作成した。学習用に75条件、検証用に25条件を用いた。学習用と検証用のそれぞれにおける予測値と真値の決定係数は、1.000、0.999となった。
【0125】
ここで、データセットBに含まれる100条件の物理量説明変数データベクトルxの中には、全ての説明変数が、データセットAによる回帰モデルfの学習範囲である内挿範囲(物理量領域)内に存在するものがある。そこで、ランダムに分布した物理量説明変数データベクトルxのうち、回帰モデルfの内挿範囲内に存在する割合を「予測可能率Rpred」と定義する。例えば、物理量データセットBは、データセットAの説明変数の全ての分布範囲が2倍であるため、1つの説明変数が、内挿範囲内に含まれる確率は、0.5である。そのため、物理量データセットBの予測可能率Rpreddは、4つの全ての説明変数が内挿になる確率として計算されるため、予測可能率Rpred=0.54=0.063となる。すなわち、93.7%の物理量説明変数データベクトルxが、回帰モデルfに対して外挿になるため、通常の回帰モデルfでは予測困難であると考えられる。
【0126】
図11は、パイナンバー変換・不定逆変換により回帰モデルfの内挿範囲内に変換される物理量データセットBの物理量説明変数データベクトルxを示す散布図マトリックスである。
図11に示す各プロットは、物理量データセットBに含まれる物理量説明変数データベクトルxの各々に対して、[数4]式の数学的パイナンバーを表すパイナンバー変換マトリックスPによるパイナンバー変換・不定逆変換(具体的には、物理量説明変数データベクトルx、データセットA、及び、数学的パイナンバーを表すパイナンバー変換マトリックスPを入力とする説明変数パイナンバー変換・逆変換処理S4)が行われたときに、回帰モデルfの内挿範囲内に変換される変換前の物理量説明変数データベクトルxを表す点である。プロットの数、すなわち、物理量データセットBに含まれる100条件の物
理量説明変数データベクトルxのうち、説明変数パイナンバー変換・逆変換処理S4により回帰モデルf(データセットA)の内挿範囲内に変換可能な物理量説明変数データベクトルxの数は、68個であった。そのため、予測可能率R
predは、0.68(=68/100)となり、通常の回帰モデルfの値(上述の0.063)よりも格段に大きい。
【0127】
図12は、パイナンバー変換・不定逆変換により回帰モデルfの内挿範囲内に変換された物理量データセットBの物理的相似な物理量説明変数データベクトルx’を示す散布図マトリックスである。
図12に示す各プロットは、
図11の場合と同様のデータを入力とする説明変数パイナンバー変換・逆変換処理S4が行われたときに、回帰モデルfの内挿範囲内に変換された変換後の物理的相似な物理量説明変数データベクトルx’を表す点である。プロットの数は、
図11と同様に、68個である。
【0128】
図13は、物理量データセットBに含まれる説明変数に対して現象予測処理S6による目的変数の予測を行った結果を示す図である。
図14は、物理量データセットBに含まれる説明変数に対して通常の回帰モデルfによる目的変数の予測を行った結果を示す図である。横軸が予測値、縦軸が正解(真値)をそれぞれ表し、各プロットは、
図11及び
図12に示す68個に対応する。[数4]式の数学的パイナンバーπ
mを用いた現象予測処理S6による予測(
図13参照)では、予測値と正解の決定係数が0.995となり、物理量データセットBのように、学習用の物理量データセットAの外挿範囲に存在する説明変数を含むような外挿データに対しても、内挿データ(学習用の物理量データセットA)と近い精度で予測可能であることが分かった。一方、通常の回帰モデルfによる予測(
図14参照)では、決定係数は0.737となり、現象予測処理S6と比較して予測精度が大きく低下することが分かった。
【0129】
図15は、現象予測処理S6による予測と、通常の回帰モデルfによる予測において、範囲拡大率R
rangeに対する予測可能率R
predの依存性を比較した比較結果を示す図である。予測可能率R
predは、数学的パイナンバーπ
m([数4]式の3個)、及び、物理的パイナンバーπ
p([数10]式の2個)をそれぞれ用いた現象予測処理S6により計算した。また、範囲拡大率R
rangeが2、3、4、5のときの予測可能率R
predは、[表3]に示す物理量データセットB、C、D、Eをそれぞれ用いて計算した。
【0130】
通常の回帰モデルfの場合、予測可能率Rpredは、説明変数が4つのときの理論値であり、範囲拡大率Rrangeの逆数を説明変数の個数回掛け合わせた値である。したがって、通常の回帰モデルfのRpredは、範囲拡大率Rrangeの拡大に対して指数関数的に低下する。
【0131】
一方、パイナンバーを利用した現象予測処理S6による予測は、通常の回帰モデルfによる予測に比べて、予測可能率Rpredが格段に高いことが分かった。また、パイナンバーの個数が少ないほど、予測可能率Rpredが高いことが分かった。特に、近似的パイナンバーπaでは、パイナンバーの個数が1個であり、F(πa1)=0となるため、π1に変数としての自由度がなく、π1=const.となる。すなわち、全ての相似な物理現象においてパイナンバーの値は一定値となるため、説明変数の値が与えられれば直ちに目的変数の値が定まる。したがって、外挿範囲の設定に関わらず、予測可能率Rpredは常に1となる。
【0132】
図16は、現象予測処理S6による予測と、通常の回帰モデルfによる予測において、予測値と正解(真値)の決定係数を比較した比較結果を示す図である。
図16に示す通常の回帰モデルfの決定係数は、物理的パイナンバーを利用した現象予測処理S6により予測可能な条件に対して通常の回帰モデルfで予測した場合の決定係数と、数学的パイナン
バーを利用した現象予測処理S6により予測可能な条件に対して通常の回帰モデルfで予測した場合の決定係数のうち、より高い値を採用したものである。パイナンバーを利用した現象予測処理S6の決定係数は、通常の回帰モデルfの場合と異なり、範囲拡大率R
rangeが大きくなっても低下しないことが分かった。
【0133】
(8-1)パイナンバー妥当性評価処理S7について
パイナンバー妥当性評価処理S7は、所定の現象にて観察された物理量データセットQに対して何らかの新たなパイナンバー(具体的には、処理対象のパイナンバー変換マトリックスPeval)が得られたときに、そのパイナンバーの妥当性を物理量データセットQから評価する処理である。
【0134】
新たなパイナンバー、すなわち、処理対象のパイナンバー変換マトリックスPevalは、任意のものでよく、例えば、後述のパイナンバー探索処理S8で実現される自動生成機能を利用して生成されたものでもよいし、データ解析者により生成されたものでもよい。
【0135】
パイナンバー妥当性評価処理S7では、パイナンバーの妥当性を評価する指標として、「相似変換妥当性」及び「関係式存在性」の2つの指標を導入し、相似変換妥当性評価処理S71による相似変換妥当性の評価結果と、関係式存在性評価処理S72による関係式存在性の評価結果との少なくとも一方に基づいて、パイナンバーの妥当性を評価する。
【0136】
前者の「相似変換妥当性」は、処理対象のパイナンバー変換マトリックスPevalを用いたパイナンバー変換・不定逆変換(具体的には、自己空間パイナンバー変換・逆変換処理S5)により、変換前の物理量データベクトルqから変換後の物理的相似な物理量データベクトルq’を求めるときの正確性に基づいて、パイナンバーの妥当性を評価する。「相似変換妥当性」の評価では、自己空間パイナンバー変換・逆変換処理S5を利用することで、原理的に物理量データセットQの条件数(データ数)と同じ数だけの検証用データを作成して活用できるので、データの利用効率が高い。
【0137】
後者の「関係式存在性」は、処理対象のパイナンバー変換マトリックスPevalで定められる複数のパイナンバー間に、バッキンガムのパイ定理により保証されるパイナンバーの関係式F([数5]式参照)が存在する程度に基づいて、パイナンバーの妥当性を評価する。処理対象のパイナンバー変換マトリックスPevalが、所定の現象を表す正しいパイナンバーとは異なる場合、パイナンバーの関係式Fは成り立たず、そのような関係式Fを明確に特定できない。この性質を利用すると、パイナンバー間に、近似的に成り立つ関係式Fが存在する程度を、パイナンバーの妥当性を表す指標と見なすことができる。そこで、「関係式存在性」の評価では、関係式Fが存在する程度を、機械学習により物理量データセットQから作成した予測モデルfregの完成度で評価する。そのため、前者の「相似変換妥当性」の評価では、一部のパイナンバーの形に対して(例えば、物理量からパイナンバーを探索する際に、仮のパイナンバーとして物理量そのものを初期設定する場合など)、自己空間パイナンバー変換・逆変換処理S5の実行性が難しい場合があるが、後者の「関係式存在性」の評価では、そのようなパイナンバーの形による影響を受けることがない。
【0138】
(8-2)相似変換妥当性評価処理S71について
図17は、相似変換妥当性評価処理S71の一例を示すフローチャートである。
【0139】
まず、ステップS710では、処理対象のパイナンバー変換マトリックスPevalが入力されるとともに、物理量データセットQが入力される。ステップS710の詳細は、ステップS600と同様であるため、説明を省略する。
【0140】
次に、ステップS711では、処理対象のパイナンバー変換マトリックスPevalを、パイナンバーπvに含まれる目的変数の指数が特定のパイナンバーπv1を除いて0となるように変形することで、変形後のパイナンバー変換マトリックスP’evalを作成する。なお、ステップS711の詳細は、ステップS601と同様であるため、説明を省略する。
【0141】
次に、ステップS712では、以下の[数28]式に示すように、物理量データセットQに含まれる物理量説明変数データベクトルxの集合である物理量説明変数データセットXの内挿範囲D(X)を物理量領域Dとして、物理量データセットQに含まれる物理量データベクトルqに対して、変形後のパイナンバー変換マトリックスP’eval及び物理量領域Dによるパイナンバー変換・逆変換処理S3を行うことにより、物理量データベクトルqに対して物理的相似な物理量データベクトルq’を求める。
【0142】
【0143】
そして、ステップS712では、以下の[数29]式に示すように、物理量データセットQに含まれる全ての物理量データベクトルqに対して、変形後のパイナンバー変換マトリックスP’eval及び物理量領域Dによるパイナンバー変換・逆変換処理S3をそれぞれ行うことにより、物理量データセットQに対して物理的相似な物理量データセットQ’を求める。ステップS712で求められた物理的相似な物理量データセットQ’に含まれる物理量目的変数データセットY’を、「物理量目的変数データセットY’pred,P」と表すものとする。
【0144】
【0145】
ここで、上記のステップS710~S712(ステップS711は省略可)における処理が、自己空間パイナンバー変換・逆変換処理S5に相当する。
【0146】
図18は、自己空間パイナンバー変換・逆変換処理S5による自己空間パイナンバー変換・不定逆変換を示す第1の模式図である。
図19は、自己空間パイナンバー変換・逆変換処理S5による自己空間パイナンバー変換・不定逆変換を示す第2の模式図である。
【0147】
自己空間パイナンバー変換・逆変換処理S5は、処理対象のパイナンバー変換マトリックスPconv(=P’eval)が入力されるとともに、物理量データセットQが入力されたとき、物理量データセットQに含まれる物理量データベクトルqが、物理量データセットQにより定まる自己空間内に含まれるように、パイナンバー変換・逆変換処理S3を行うことにより、物理量データベクトルqに対して物理的相似な物理量データベクトルq’に変換する処理である。このような変換を、「自己空間パイナンバー変換・不定逆変換」と呼ぶものとし、自己空間パイナンバー変換・逆変換処理S5による自己空間パイナンバー変換・不定逆変換は、[数28]式又は[数29]式で表される。
【0148】
物理量データセットQにより定まる自己空間が、
図18(a)、(b)に示すように、
物理量説明変数データセットXの内挿範囲D(X)と同一の範囲である場合には、自己空間パイナンバー変換・逆変換処理S5は、その内挿範囲D(X)を物理量領域Dとして、処理対象のパイナンバー変換マトリックスP
conv及び物理量領域Dによるパイナンバー変換・逆変換処理S3を行う。なお、内挿範囲D(X)は、物理量データセットQに応じて、
図18(b)に示すように、複数に分割される場合も存在する。
【0149】
また、物理量データセットQにより定まる自己空間が、
図19(a)~(c)に示すように、物理量説明変数データセットXの内挿範囲D(X)よりも狭い範囲に限定された限定領域である場合には、自己空間パイナンバー変換・逆変換処理S5は、その限定領域を物理量領域Dとして、処理対象のパイナンバー変換マトリックスP
conv及び物理量領域Dによるパイナンバー変換・逆変換処理S3を行う。内挿範囲D(X)は、物理量データセットQに応じて、
図19(c)に示すように、複数に分割される場合も存在する。また、限定領域をどの範囲に限定するかは、データ解析の目的に応じて定められればよく、例えば、物理量説明変数データベクトルxが密に存在するような範囲に限定されてもよいし、データ解析者の指定に応じて限定されてもよい。
【0150】
なお、自己空間パイナンバー変換・逆変換処理S5に含まれるパイナンバー逆変換では、数値解析により解を求めるので、物理量データベクトルqとは異なる物理量データベクトルq’が基本的に得られるが、同じ解(q=q’)も存在するため、数値解析により同じ解に収束する可能性もある。その対策として、パイナンバー逆変換のときの初期分布を乱数で与えるようにしてもよい。
【0151】
したがって、
図17に示すステップS712は、変形後のパイナンバー変換情報P’
eval及び物理量データセットQを入力として自己空間パイナンバー変換・逆変換処理S5を行うことにより、物理的相似な物理量説明変数データベクトルx’
outを求めるものである。
【0152】
次に、ステップS713では、物理量データセットQに基づいて、物理量説明変数データベクトルx(説明変数セット)を入力とし、物理量目的変数データy(目的変数)を出力とする予測モデルfregを作成する。ステップS713の詳細は、ステップS603と同様であるため、説明を省略する。
【0153】
次に、ステップS714では、以下の[数30]式で示すように、物理量データセットQに対して物理的相似な物理量データセットQ’に含まれる物理的相似な物理量説明変数データベクトルx’outの集合である物理量説明変数データセットX’を、ステップS713で作成された予測モデルfregに入力することで、モデル予測による物理量目的変数データセットY’pred,regを求める。
【0154】
【0155】
次に、ステップS715では、ステップS712で求められた物理的相似な物理量目的変数データセットY’pred,Pと、ステップS714で求められたモデル予測による物理量目的変数データセットY’pred,regとに基づいて、以下の[数31]式に示すように、相似変換妥当性vtransを評価する。[数31]式において、R2は、引数の2つのデータセットの決定係数を表すものとする。
【0156】
【0157】
決定係数R2
Pが大きいほど、処理対象のパイナンバー変換マトリックスPevalの相似変換妥当性vtransが高いと考えられる。しかしながら、相似変換妥当性vtransは、予測モデルfregの完成度及び物理的相似な物理量説明変数データセットX’の分布の影響を受けるものと考えられる。
【0158】
例えば、決定係数R2
transが小さいほど、物理量説明変数データセットXの分布に対して、物理的相似な物理量説明変数データセットX’の分布の変化が大きく、検証用データに適しているといえる。また、予測モデルfregの完成度が低いほど、決定係数R2
modelは小さくなる。パイナンバー変換・不定逆変換が正確であったとしても、決定係数R2
modelの値を超えることは、誤差と確率的な要素を除くと起こりがたい。そのため、[数31]式の右辺分子は、検証用データを基準としたパイナンバー変換・不定逆変換の正確性を表しており、[数31]式の右辺分母は、検証用データの質を基準とした回帰モデルの完成度を表している。したがって、[数31]式で求められる相似変換妥当性vtransは、検証用データの質(R2
trans)及び予測モデルfregの完成度(R2
model)を基準としたときの、パイナンバー変換・逆変換の正確性を表している。そのため、決定係数R2
Pそのものよりも、予測モデルfregの完成度及び自己空間パイナンバー変換・不定逆変換の正確性の影響を受けにくい。
【0159】
以上のようにして、
図17に示す相似変換妥当性評価処理S71では、物理量データセットQに対して処理対象のパイナンバー変換マトリックスP
evalによる自己空間パイナンバー変換・逆変換処理S5が行われたときの変換の正確性を表す相似変換妥当性v
transに基づいて、パイナンバー変換マトリックスP
evalの妥当性を評価する。なお、相似変換妥当性v
transは、変換の正確性を表す評価値であればよく、決定係数R
2
Pをそのまま相似変換妥当性v
transとしてもよいし、[数31]式以外の方法で求められたものでもよい。
【0160】
また、相似変換妥当性評価処理S71では、パイナンバーπv1が、目的変数と等しい形(πv1=qv1)であって、パイナンバー変換・不定逆変換が正確(すなわち、パイナンバーが妥当)である場合、決定係数R2
transは機能しない。なぜなら、物理量説明変数データベクトルxiと、物理的相似な物理量説明変数データベクトルx’iとは異なるが、物理量目的変数データyiと、物理的相似な物理量目的変数データy’iがほぼ等しい物理量データベクトルq’iが得られるからである。パイナンバー変換・不定逆変換が正確である場合、物理量目的変数データセットYと、ステップS712で求められた物理的相似な物理量目的変数データセットY’pred,Pは、ほぼ等しくなるので、決定係数R2
Pと、決定係数R2
transはほぼ等しくなり、相似変換妥当性vtransは、ほぼ0となる。これを回避するために、決定係数R2
transを計算するときのみ、物理量説明変数データセットX’の全成分を、以下の[数32]式で変換した変換後の物理量説明変数データセットX’’を用いる。
【0161】
【0162】
ここで、δは、データ毎にランダムに確率0.5ずつで±1の値となる係数である。すなわち、パイナンバー変換・不定逆変換により動いた幅を維持したまま、方向を0.5の確率で変更するものである。決定係数R2
transの計算に用いるモデル予測による物理量目的変数データセットY’pred,regは、物理量説明変数データセットXから物理的相似な物理量説明変数データセットX’に変化した程度を物理量目的変数データセットYに反映させるための役割を持つので、動いた方向を変更してもその役割は達成される。この処理により、パイナンバーが妥当である場合でも、モデル予測による物理量目的変数データセットY’pred,regに反映される。
【0163】
図20は、物理量説明変数データベクトルx’
iの補正方法の一例を示す図である。逆向きの2つの矢印の長さは等しい。物理量説明変数データベクトルx’’
i,jが、物理量領域Dの上限に制限され、物理量説明変数データベクトルx
i,jからx’’
i,jへの移動量が、物理量説明変数データベクトルx
i,jからx’
i,jへの移動量よりも小さくなっている場合を表している。ランダムに振るのは、常にδ=-1とすると、パイナンバーに含まれる分子と分母にある1組の説明変数(q
v2/q
v3等の形)が含まれる
場合、それぞれが同方向に変化することにより、パイナンバーとしての変化が乏しくなり、パイナンバーが妥当である場合に、それが原因で決定係数R
2
transが大きくなってしまうことを避けたいためである。最大値maxと、最小値minの演算は、q’’
i,xが内挿範囲D(X)を超えないように制限している。しかし、制限しなければ動くはずだった距離(x’
i,j-x
i,j)の平均値が小さくなる。そこで、次式の係数cを決定係数R
2
transに乗じて補正する。
【0164】
【0165】
上記の係数cを用いることで、[数30]式及び[数31]式の代わりに、以下の[数34]式により、検証用データを基準としたパイナンバー変換・不定逆変換の決定係数R2
transを計算する。これにより、パイナンバーπv1が目的変数と等しい形(πv1=qv1)である場合であっても、パイナンバー変換・不定逆変換が正確な場合には、相似変換妥当性vtransが高い値として求められる。
【0166】
【0167】
(8-3)関係式存在性評価処理S72について
図21は、関係式存在性評価処理S72の一例を示すフローチャートである。
【0168】
まず、ステップS720では、処理対象のパイナンバー変換マトリックスPevalが入力されるとともに、物理量データセットQが入力される。ステップS720の詳細は、ステップS600と同様であるため、説明を省略する。
【0169】
次に、ステップS721では、処理対象のパイナンバー変換マトリックスPevalを、パイナンバーに含まれる目的変数の指数が特定のパイナンバーπv1を除いて0となるように変形することで、変形後のパイナンバー変換マトリックスP’evalを作成する。なお、ステップS721の詳細は、ステップS601と同様であるため、説明を省略する。
【0170】
次に、ステップS722では、以下の[数35]式に示すように、物理量データセットQに含まれる物理量データベクトルqに対して、変形後のパイナンバー変換マトリックスP’evalによるパイナンバー変換処理をそれぞれ行うことにより、変換後のパイナンバーデータベクトルπからなるパイナンバーデータセットΠを求める。
【0171】
【0172】
次に、ステップS723では、ステップS722で求められたパイナンバーデータセットΠを、学習用のパイナンバーデータセットΠtrainと、検証用のパイナンバーデータセットΠtestとに分割する。パイナンバーデータセットΠを分割する際の割合は、適宜決定されればよい。
【0173】
次に、ステップS724では、学習用のパイナンバーデータセットΠtrainに基づいて、特定のパイナンバーπv1以外の他のパイナンバーπvn(パイナンバー説明変数データベクトルξ)を入力とし、特定のパイナンバーπv1(パイナンバー目的変数データη)を出力とする予測モデルfreg,πを作成する。
【0174】
次に、ステップS725では、以下の[数36]式に示すように、検証用のパイナンバーデータセットΠtestに含まれる他のパイナンバーπvn(パイナンバー説明変数データベクトルξ)に対するパイナンバーデータの集合であるパイナンバー説明変数データセットΞtestを予測モデルfreg,πに入力することで、特定のパイナンバーπv1に対するパイナンバーデータの集合として、モデル予測によるパイナンバー目的変数データセットΗtest,predを求める。
【0175】
【0176】
次に、ステップS726では、以下の[数37]式に示すように、検証用のパイナンバーデータセットΠtestに含まれる特定のパイナンバーπv1(パイナンバー目的変数データη)に対するパイナンバーデータの集合であるパイナンバー目的変数データセットΗtestと、モデル予測によるパイナンバー目的変数データセットΗtest,predとに基づいて、関係式存在性vregを評価する。[数37]式において、R2は、引数の2つのデータセットの決定係数を表すものとする。
【0177】
【0178】
関係式存在性vregとしては、予測モデルfreg,πによる予測値(Ηtest,pred)と、真値(Ηtest)とから求められる決定係数等が挙げられる。決定係数R2が大きいほど、処理対象のパイナンバー変換マトリックスPevalの関係式存在性vregは高いと考えられる。なお、関係式存在性vregは、関係式Fが存在する程度を表す評価値であればよく、[数37]式以外の方法で求められたものでもよい。
【0179】
以上のようにして、
図21に示す関係式存在性評価処理S72では、処理対象のパイナンバー変換マトリックスP
evalで定められる複数のパイナンバー間に、バッキンガムのパイ定理により保証されるパイナンバーの関係式Fが存在する程度を表す関係式存在性v
regに基づいて、パイナンバー変換マトリックスP
evalの妥当性を評価する。
【0180】
(9)パイナンバー探索処理S8
パイナンバー探索処理S8は、所定の現象にて成り立つ理論式(例えば、円板の物理現象では、[数2]式に示す支配方程式)は不明であるが、その現象にて観察された物理量データセットQと、その現象を表すパイナンバーの候補(具体的には、処理対象のパイナンバー変換マトリックスの候補PC)が得られている状況において、その候補Pcから新たな候補Pnewを生成する新候補生成処理S81と、新候補生成処理S81により生成された新たな候補Pnew及び物理量データセットQを入力とするパイナンバー妥当性評価処理S7とを繰り返し行うことにより、所定の条件を満たすパイナンバー変換マトリックスPbestを探索する処理である。所定の条件としては、パイナンバー妥当性評価処理S7による妥当性の評価結果に基づくものでもよいし、パイナンバーの個数kや処理回数等の他の条件を考慮してもよい。
【0181】
パイナンバー探索処理S8におけるパイナンバーの初期段階の候補PCは、任意のものでよく、例えば、次元解析の結果として得られた数学的パイナンバーを表すパイナンバー変換マトリックスPでもよいし、物理量セットQvをそのままパイナンバーとして採用したパイナンバー変換マトリックスP(物理量の個数を次数とする単位行列)でもよいし、データ解析者により生成されたものでもよいし、これらを適宜組み合わせたものでもよい。
【0182】
パイナンバー探索処理S8では、新候補生成処理S81にて、パイナンバーの初期段階の候補PCを起点に、新たな候補Pnewを生成し、その生成された新たな候補Pnewに対して、パイナンバー妥当性評価処理S7を適用することで、新たな候補Pnewの妥当性を評価し、その評価結果に基づいて、新たな候補Pnewの採用の可否や、不要な候補Pcの削除の可否を判定する。このような一連の処理を繰り返すことで、最終的なパイナンバー変換マトリックスPbestを探索する。パイナンバー探索処理S8により探索された結果、最終的なパイナンバー変換マトリックスPbestとしては、例えば、数学的パイナンバーを初期段階の候補PCとした場合には、物理的パイナンバー、近似的パイ
ナンバー等が導出されたり、物理量セットQvの単位行列を初期段階の候補PCとした場合には、数学的パイナンバー、物理的パイナンバー、近似的パイナンバー等が導出されたりする。
【0183】
新候補生成処理S81では、候補PCに含まれる複数のパイナンバー変換ベクトルから1又は2のパイナンバー変換ベクトルを選択し、その1又は2のパイナンバー変換ベクトルの加重和の組み合わせに基づいて、新たなパイナンバー変換ベクトルpnewを生成し、その新たなパイナンバー変換ベクトルpnewを候補PCに追加することにより、新たな候補Pnewを生成する。
【0184】
図22は、パイナンバー探索処理S8の一例を示すフローチャートである。
【0185】
まず、ステップS800では、以降の各分岐ステップでの判断条件を設定する。
【0186】
次に、ステップS801では、初期段階の候補PCが入力されるとともに、物理量データセットQが入力される。初期段階の候補PCは、探索ループ用のパイナンバー変換マトリックスPn(一時変数n=0)に設定される。一時変数nは、探索ループ用の変数である。
【0187】
次に、ステップS802では、探索ループ用のパイナンバー変換マトリックスPnに含まれる複数のパイナンバー変換ベクトルから1又は2のパイナンバー変換ベクトルを選択し、新たなパイナンバー変換ベクトルpnewを生成する。新たなパイナンバー変換ベクトルpnewを生成する手法として、本実施形態では、2つのパイナンバー変換ベクトルから新たなパイナンバー変換ベクトルpnewを生成する第1の生成法と、1つのパイナンバー変換ベクトルから新たなパイナンバー変換ベクトルpnewを生成する第2の生成法とを併用する場合について説明する。
【0188】
第1の生成法では、以下の[数38]式に示すように、2つのパイナンバー変換ベクトルpi,pjの加重和の組み合わせに基づいて、新たなパイナンバー変換ベクトルpnewを生成する。
【0189】
【0190】
その際、[数38]式における係数α、βを、以下の[数39]式に示す条件に従って設定することで、2つのパイナンバー変換ベクトルpi、pjの加重和の組み合わせから新たなパイナンバー変換ベクトルpnewを生成する。これは、2つのパイナンバー変換ベクトルpi、pjに対応する2つのパイナンバーπi、πjについて、乗べき積の組み合わせを作成することに相当する。
【0191】
【0192】
[数39]式における変数kは、その時点でのPnに含まれるパイナンバーベクトルの数を表す。また、パイナンバーの逆数は、同じパイナンバーであるため、[数39]式にて、α=-1は考慮しない。
【0193】
第2の生成法では、第1行目のパイナンバー変換ベクトルp1の第1成分p1,1に1を加えたものを、新たなパイナンバー変換ベクトルpnewとする。これは、目的変数の指数が2以上のパイナンバーも探索されるようにするためである。
【0194】
なお、本実施形態では、上記の第1及び第2の生成法において、目的変数が、パイナンバーセットΠvの第1成分であるパイナンバーπv1の分子のみに含まれるように、新たなパイナンバー変換ベクトルpnewを生成する。すなわち、パイナンバー変換マトリックスPにおける第1行第1列の成分p1,1は、自然数であり、かつ、成分p2,1~pk,1(第1列の第2行目以降の成分)は、すべて0である。パイナンバーの逆数は、同一のパイナンバーとみなされることを考慮すると、目的変数は、パイナンバーセットΠvの第1成分であるパイナンバーπv1の分子にのみ含まれる形に限定しても差し支えない。
【0195】
次に、ステップS803では、第1及び第2の生成方法により生成された新たなパイナンバー変換ベクトルpnewを、パイナンバー変換マトリックスPの候補Pnに追加するか否かを判定する。新たなパイナンバー変換ベクトルpnewが、例えば、候補Pnに既に含まれている場合には、候補Pnに追加しないと判定する。そして、ステップS803で「Yes」と判定された場合には、ステップS804に進み、「No」と判定された場合には、ステップS802に戻る。
【0196】
次に、ステップS804では、第1及び第2の生成方法により生成された新たなパイナンバー変換ベクトルpnewを候補Pnに追加することにより、パイナンバー変換マトリックスPの新たな候補Pnewを生成する。
【0197】
その際、第1の生成法により新たなパイナンバー変換ベクトルpnewを生成したときの2つのパイナンバー変換ベクトルpi、pjの削除方法を異ならせることにより、新たな候補Pnewとして、例えば、(1)候補Pnに新たなパイナンバー変換ベクトルpnewを追加し、一方のパイナンバー変換ベクトルpiを削除したパイナンバー変換マトリックスP、(2)候補Pnに新たなパイナンバー変換ベクトルpnewを追加し、他方のパイナンバー変換ベクトルpjを削除したパイナンバー変換マトリックスP、(3)候補Pnに新たなパイナンバー変換ベクトルpnewを追加し、2つのパイナンバー変換ベクトルpi、pjの両方を削除したパイナンバー変換マトリックスPがそれぞれ生成される。ただし、i=1の場合には、目的変数を含むパイナンバーベクトルpi(=p1)が2つ存在しないようにするため、上記(2)のパイナンバー変換マトリックスPを生成しない。
【0198】
また、新たな候補Pnewとして、候補Pnに第2の生成法により生成された新たなパイナンバー変換ベクトルpnewを追加し、パイナンバー変換ベクトルp1を削除したパイナンバー変換マトリックスPが生成される。
【0199】
次に、ステップS805では、パイナンバー変換マトリックスPnに含まれる複数のパイナンバー変換ベクトルから1又は2のパイナンバー変換ベクトルを選択するときの組み合わせを全て実施したか否かを判定する。そして、ステップS805で「Yes」と判定された場合には、ステップS806に進み、「No」と判定された場合には、ステップS802に戻る。
【0200】
次に、ステップS806では、新たに生成された候補Pnewの各々及び物理量データセットQを入力として、パイナンバー妥当性評価処理S7を行うことにより、各候補Pnewの妥当性を評価する。
【0201】
次に、ステップS807では、パイナンバー妥当性評価処理S7にて各候補Pnewの妥当性を評価した評価結果に基づいて、新たな候補Pnewの採用の可否を判定する。妥当性の評価結果は、相似変換妥当性評価処理S71による相似変換妥当性vtrans、及び、関係式存在性評価処理S72による関係式存在性vregのうち少なくとも一方により評価されるものであるが、本実施形態では、両者の評価結果に対して、以下の[数40]、[数41]式に示す判定式に基づいて、新たな候補Pnewの採用の可否を判定する。[数40]式では、相似変換妥当性vtransが、所定の閾値Ttrans以上であるか否かを判定する。[数41]式では、関係式存在性vregが、直前に探索された候補Pnに対する関係式存在性vreg,before(n=0の場合は初期値)に所定の閾値Tregを乗算した値以上であるか否かを判定する。
【0202】
【0203】
【0204】
具体的な判定方法としては、例えば、相似変換妥当性vtransを優先的に採用する場場合には、似変換妥当性vtransが大きい順に[数40]式が満たされるか否かを判定し、[数40]式が満たされ、かつ「数41」式が満たされる場合に、その新たな候補Pnewを採用すると判定する。また、関係式存在性vregを優先的に採用する場合には、例えば、第1の生成法の上記(3)により生成された新たな候補Pnewを対象として、関係式存在性vregが大きい順に[数41]式が満たされるか否かを判定し、さらに、[数41]式が満たされ、かつ、「数40」式が満たされる場合に、その新たな候補Pnewを採用すると判定する。その結果、ステップS807で「Yes」と判定された場合には、ステップS808に進み、「No」と判定された場合には、ステップS802に戻る。
【0205】
次に、ステップS808では、各候補Pnewに対する妥当性の評価結果として、妥当性が最も高いと評価された新たな候補Pnewを、次の処理対象とする候補Pn+1に代入する。
【0206】
次に、ステップS809は、新たな候補Pnewの探索を終了するか否かを判定する。例えば、候補Pn+1に含まれるパイナンバー変換ベクトルとして、物理量単体のパイナンバーを表すものが存在しない場合や、一時変数nが所定の上限回数を超えた場合には、探索を終了すると判定する。そして、ステップS809で「Yes」と判定された場合には、一連のパイナンバー探索処理S8を終了し、「No」と判定された場合には、ステップS810にて、一時変数nをインクリメントし、ステップS802に戻る。
【0207】
また、ステップS811では、過去に探索した履歴を遡ってから探索するか否かを判定する。例えば、過去の規定回数の探索ループにて、妥当性の評価結果が連続して低下している場合には、履歴を遡ってから探索すると判定する。
【0208】
そして、ステップS811で「Yes」と判定された場合には、ステップS812にて、妥当性の評価結果が連続して低下する直前の候補Pnに戻し、ステップS802に戻る。これにより、局所最適解に陥ることを抑制する。一方、ステップS811で「No」と判定された場合には、ステップS813にて、探索の条件を緩和するか否かを判定し、ステップS813で「Yes」と判定された場合には、ステップS814にて、条件(例え
ば、閾値Ttrans、Treg)を緩和し、ステップS802に戻り、「No」と判定された場合には、一連のパイナンバー探索処理S8を終了する。
【0209】
以上のようにして、
図22に示すパイナンバー探索処理S8では、新候補生成処理S81により、パイナンバー変換マトリックスPの候補P
Cから新たな候補P
newを生成し、パイナンバー妥当性評価処理S7により、その新たな候補P
newに対する妥当性を物理量データセットQから評価することで、その物理量データセットQが観察された現象を表すパイナンバー変換マトリックスPとして、より適切なパイナンバー変換マトリックスP
bestを探索する。初期段階の候補P
Cとしては、任意のパイナンバー変換マトリックスPでよいため、物理量データセットQさえあれば、データ解析者が微分方程式を導出するだけでも多大な労力と深い知見を必要とするような現象や、そもそも微分方程式の見当も付かないような現象であっても、物理量データセットQに対応するパイナンバー変換マトリックスP
bestを探索することができる。
【0210】
(他の実施形態)
本発明は上述した実施形態に制約されるものではなく、本発明の主旨を逸脱しない範囲内で種々変更して実施することが可能である。そして、それらはすべて、本発明の技術思想に含まれるものである。
【0211】
上記実施形態では、所定の現象として、物理法則に従う物理現象を例にして説明したが、データ解析方法100による各処理S1~S8は、物理現象以外の所定の現象にも適用可能である。その場合には、上記実施形態における「物理量」という用語を、所定の現象で観察される「変量」として読み替えることで、データ解析方法100で使用されるデータの定義や各処理S1~S8の処理内容を適用することができる。
【0212】
上記実施形態では、現象予測処理S6は、物理量目的変数データyoutが未知な状態で予測対象の物理量説明変数データベクトルxoutに対して行われるものとして説明した。これに対し、現象予測処理S6は、物理量目的変数データyが既知な状態であっても、その既知の物理量目的変数データyを未知な状態であると仮定し、その未知(本来は既知であるものを未知と仮定)の物理量目的変数データyと組とする物理量説明変数データベクトルxに対して行われることで、その物理量説明変数データベクトルxに対して未知(本来は既知であるものを未知と仮定)の物理量目的変数データy’を予測してもよい。
【0213】
上記のように、既知の目的変数を未知な状態であると仮定して行う現象予測処理S6は、例えば、相似変換妥当性を評価する相似変換妥当性評価処理S71にて利用可能である。具体的には、物理量データセットQに含まれる物理量データベクトルqは、既知の物理量説明変数データベクトルxと、既知の物理量目的変数データyとを組とするが、その既知の物理量目的変数データyを未知な状態であると仮定し、処理対象のパイナンバー変換マトリックスPeval、物理量データセットQ及び既知の物理量説明変数データベクトルxを入力として現象予測処理S6を行うことにより、未知(本来は既知であるものを未知と仮定)の物理量目的変数データy’を予測する。そして、その現象予測処理S6による予測値である変量目的変数データy’と、既知の物理量目的変数データyとに基づいて、例えば、両者の決定係数等を求めることで、相似変換妥当性vtransを評価することができる。
【符号の説明】
【0214】
1…データ解析装置、10…制御部、11…記憶部、12…入力部、13…出力部、14…通信部、100…データ解析方法、101…予測機能、102…妥当性評価機能、103…自動生成機能、110…データ解析プログラム、200…コンピュータ