特許第6216294号(P6216294)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧

<>
  • 特許6216294-重回帰分析装置および重回帰分析方法 図000013
  • 特許6216294-重回帰分析装置および重回帰分析方法 図000014
  • 特許6216294-重回帰分析装置および重回帰分析方法 図000015
  • 特許6216294-重回帰分析装置および重回帰分析方法 図000016
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6216294
(24)【登録日】2017年9月29日
(45)【発行日】2017年10月18日
(54)【発明の名称】重回帰分析装置および重回帰分析方法
(51)【国際特許分類】
   G06Q 10/04 20120101AFI20171005BHJP
   G06F 17/17 20060101ALI20171005BHJP
【FI】
   G06Q10/04
   G06F17/17
【請求項の数】8
【全頁数】15
(21)【出願番号】特願2014-154743(P2014-154743)
(22)【出願日】2014年7月30日
(65)【公開番号】特開2016-31714(P2016-31714A)
(43)【公開日】2016年3月7日
【審査請求日】2016年9月15日
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】110001243
【氏名又は名称】特許業務法人 谷・阿部特許事務所
(72)【発明者】
【氏名】境野 英朋
【審査官】 佐藤 裕子
(56)【参考文献】
【文献】 特開2008−147812(JP,A)
【文献】 特開昭61−110026(JP,A)
【文献】 国際公開第2010/016110(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 − 99/00
G06F 17/17
(57)【特許請求の範囲】
【請求項1】
少なくとも2種類の説明変数から、時系列データの目的変数を予測する重回帰分析装置において、
重回帰係数の計算を含むデータ解析を行うことになる、前記2種類以上の説明変数のデータが入力されるデータ入力部と、
前記入力された少なくとも2種類以上の説明変数の前記データに対して、少なくとも1回以上の微分を施す微分演算を実行し、微分演算を施された微分説明変数を生成するよう構成された微分解析部であって、前記微分演算は、前記少なくとも2種類以上の説明変数の各々の時系列データに対する時間微分である微分解析部と、
前記少なくとも2種類以上の説明変数の各々および対応する重回帰係数の積の総和項と、前記微分演算を施された前記微分説明変数の各々および対応する重回帰係数の積の少なくとも1種類以上の総和項とを含む前記目的変数の予測式に対して、
最小二乗法によって、前記説明変数の前記各重回帰係数および前記微分説明変数の前記各重回帰係数をそれぞれ決定し、
前記決定された重回帰係数を戻した前記予測式に、前記少なくとも2種類以上の説明変数の実測値を代入して前記目的変数の予測値を求めるよう構成された重回帰予測計算部と
を備えたことを特徴とする装置。
【請求項2】
前記微分説明変数の各々および対応する重回帰係数の積の前記少なくとも1種類以上の総和項は、
前記少なくとも2種類以上の説明変数に、第1の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第1の総和項と、
前記少なくとも2種類以上の説明変数に、前記第1の階位数とは異なる第2の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第2の総和項と
を少なくとも含むことを特徴とする請求項1に記載の装置。
【請求項3】
前記第1の階位数の微分は、前記少なくとも2種類以上の説明変数の1次微分であり、
前記第2の階位数の微分は、前記少なくとも2種類以上の説明変数の2次微分であることを特徴とする請求項2に記載の装置。
【請求項4】
前記説明変数は、重回帰分析における独立変数に対応し、前記目的変数は重回帰分析における従属変数に対応し、
前記最小二乗法によって、前記目的変数の実測値と、前記説明変数の実測値および前記予測式によって得られる予測値との残差の二乗和を最小化するように、前記少なくとも2種類の説明変数および前記微分説明変数に対する前記重回帰係数がそれぞれ決定され、
前記決定された重回帰係数を戻した前記予測式に、前記少なくとも2種類の説明変数の新しい実測値を入れて、前記目的変数の時系列データの予測値を求めること
を特徴とする請求項1乃至3いずれかに記載の装置。
【請求項5】
前記入力されたデータを少なくとも一時的に保存するデータ蓄積部と、
前記重回帰予測計算部で求められた前記目的変数の予測値を出力する表示部と
をさらに備えたことを特徴とする請求項1乃至4いずれかに記載の装置。
【請求項6】
少なくとも2種類の説明変数から、時系列データの目的変数を予測する重回帰分析装置において、
重回帰係数の計算を含むデータ解析を行うことになる、前記2種類以上の説明変数のデータが入力されるデータ入力部と、
前記入力された少なくとも2種類以上の説明変数の前記データに対して、少なくとも1回以上の微分を施す微分演算を実行し、微分演算を施された微分説明変数を生成するよう構成された微分解析部であって、前記微分演算は、前記少なくとも2種類以上の説明変数の各々の時系列データに対する時間微分である微分解析部と、
前記少なくとも2種類以上の説明変数の各々および対応する重回帰係数の積の総和項と、前記微分演算を施された前記微分説明変数の各々および対応する重回帰係数の積の少なくとも1種類以上の総和項とを含む前記目的変数の予測式に対して、
最小二乗法によって、前記目的変数の実測値と、前記説明変数の実測値および前記予測式によって得られる予測値との残差の二乗和を最小化するように、前記少なくとも2種類の説明変数に対する前記各重回帰係数および前記微分説明変数に対する前記各重回帰係数をそれぞれ決定し、
前記決定された重回帰係数を戻した前記予測式に、前記少なくとも2種類以上の説明変数の実測値を代入して前記目的変数の予測値を求めるよう構成された重回帰予測計算部と
を備え、
前記総和項が2種類以上ある場合は、
前記少なくとも2種類以上の説明変数に、第1の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第1の総和項と、
前記少なくとも2種類以上の説明変数に、前記第1の階位数とは異なる第2の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第2の総和項と
を少なくとも含むことを特徴とする装置。
【請求項7】
中央制御装置(CPU)およびメモリを少なくとも含むコンピュータによって実行される、少なくとも2種類の説明変数から、時系列データの目的変数を予測する重回帰分析方法において、
重回帰係数の計算を含むデータ解析を行うことになる、前記2種類以上の説明変数のデータを入力するステップと、
前記入力された少なくとも2種類以上の説明変数の前記データに対して、少なくとも1回以上の微分を施す微分演算を実行し、微分演算を施された微分説明変数を生成するステップであって、前記微分演算は、前記少なくとも2種類以上の説明変数の各々の時系列データに対する時間微分である、生成するステップと、
前記少なくとも2種類以上の説明変数の各々および対応する重回帰係数の積の総和項と、前記微分演算を施された前記微分説明変数の各々および対応する重回帰係数の積の少なくとも1種類以上の総和項とを含む前記目的変数の予測式に対して、
最小二乗法によって前記説明変数の前記各重回帰係数および前記微分説明変数の前記各重回帰係数を決定するステップと、
前記決定された重回帰係数を戻した前記予測式に、前記少なくとも2種類以上の説明変数の実測値を代入して前記目的変数の予測値を求めるステップと
を含む重回帰分析を実行するステップと
を備えることを特徴とする方法。
【請求項8】
前記微分説明変数の各々および対応する重回帰係数の積の前記総和項は、
前記少なくとも2種類以上の説明変数に、第1の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第1の総和項と、
前記少なくとも2種類以上の説明変数に、前記第1の階位数とは異なる第2の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第2の総和項と
を少なくとも含むことを特徴とする請求項7に記載の方法。
【発明の詳細な説明】
【背景技術】
【0001】
本発明は、データ処理を行う方法および装置に関する。より詳細には、重回帰モデルを使って、ある事象についての因子の寄与度解析や目的変数の予測を行う分析装置および分析方法に関する。
【0002】
電力分野、エネルギー分野、通信分野、センシング分野などにおいては、実環境におけるモニタリングや画像センシングなどが行われている。一例を挙げれば、ビルディングにおける電力消費量を制御するためにビルディング内の様々な場所における室温、湿度またはそこに居る人間の数などのデータがモニタリングされている。また、幹線道路における交通量を最適調整するために、車両などの移動体の動きをセンシングして交通量を把握し、交通システムを制御するデータ処理が行われる。また、天候の予測のために雲の量を画像として検出して、何らかの特徴量を示すデータを抽出し、天候変動に対応した新たな動作を行うシステムを構築することもできる。
【0003】
このように、様々な実環境における物理量の観測結果や画像処理を介して得られるデータを、コンピュータに取り込んで、様々なデータ処理を行うシステムが広く利用されている。このようなシステムでデータ処理を行うにあたっては、所望の機能をより効果的に実現し、効率的なシステムを実現するために、観測される1つの事象について、その事象の原因となる要因を見出したり寄与度を求めたりするのが有効な場合がある。また、その事象に関する数や値を予測することが求められる場合もある。システムそれぞれの様々な目的に合った適切な動作を実現するために、利用される異なるデータ間の要因の寄与度を見出し、また予測値を求めることによって、より効率的なシステムの開発につながる。
【0004】
統計データ処理は、直観的には得られにくい、データの基本的かつ重要な特徴を見出す手段として広く用いられてきている。統計データ処理に基づくデータ解析においては、1つの事象が現れるとき、複数の要因がその事象に影響を及ぼしていることが少なくない。特に、自然現象においてはかなり多くの要因が、対象とする事象の発生または事象を表す数値、量に複雑に影響を及ぼすことが知られている。一例を挙げれば、あるビルディングの消費電力(目的変数、または従属変数とも言う)は、気温、湿度、居住人数などの複数の要因(説明変数、または独立変数とも言う)によって決定され得る。このような場合、過去の気温、湿度、居住人数のデータおよび実測された消費電力値から、消費電力の時間データを予測することが求められる。
【0005】
従来、このような複数の要因間における寄与度解析や目的変数の予測については、重回帰モデル(非特許文献1)が用いられる。時系列データの予測に対しても、重回帰モデルが予測モデルとしてもさまざまな分野で適用されている。重回帰モデルにおいては、影響を与える要因(説明変数)の数および要因ごとの寄与度について、自由度調整済み決定係数などを通じて推定することができる利点もある。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】野村友和、「重回帰モデル」計量分析演習、[online]、2011年11月5日、神戸大学、[2014年7月1日検索] http://www.econ.kobe-u.ac.jp/~nomura/lecture/11s/multiple_regression.pdf
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、時系列データに関して行われる重回帰分析おいては、時系列データそのものが、ある時間間隔ごとにサンプリングされた離散的なデータとして扱われる。このため、対象とするデータの時間変化という重要な関係性が重回帰分析の中に十分に含まれていない欠点があった。時系列データにおいて、ある説明変数に関するデータ観測時間間隔を短くすれば、時間変化をより見出しやすくなり予測精度も上がるものの、データ量が膨大となる。データ数を単に増やすだけでは時間変化自体を観測しているのと変わりがなく、限られた数のデータによって結果を予測する統計的データ処理ではなくなってしまう。実環境におけるモニタリングや画像センシングでも、モニタやセンサの数には制限があり、有限の時系列データに基づいて、効果的なシステムを構築することが求められるとき、利用可能な時系列データの数には自ずと制限がある。
【0008】
このように従来技術においては、時系列データの各々のデータ間で、時間軸上での因果関係が考慮された重回帰分析ができなかった。また、従来技術では、時系列データ解析に線形の重回帰モデルや非線形の重回帰モデルが適用されているが、観測されるデータの極値の細部まで近似精度を高めることには、限界があった。この結果、時系列データの解析は、例えば、クラスタリング手法に基づいたデータ特徴量分類などの、重回帰モデルとは別の統計解析手法が適用されており、個別的に解析される必要もあった。
【0009】
本発明は、このような問題に鑑みてなされたものであって、その目的とするところは、より精度の高い時系列データの目的変数の予測が可能であって、従来技術の重回帰分析の枠組みをそのまま利用できる重回帰分析装置および重回帰分析方法を提供するところにある。
【課題を解決するための手段】
【0010】
本発明は、このような目的を達成するために、請求項1に記載の発明は、少なくとも2種類の説明変数から、時系列データの目的変数を予測する重回帰分析装置において、重回帰係数の計算を含むデータ解析を行うことになる、前記2種類以上の説明変数のデータが入力されるデータ入力部と、前記入力された少なくとも2種類以上の説明変数の前記データに対して、少なくとも1回以上の微分を施す微分演算を実行し、微分演算を施された微分説明変数を生成するよう構成された微分解析部であって、前記微分演算は、前記少なくとも2種類以上の説明変数の各々の時系列データに対する時間微分である微分解析部と、前記少なくとも2種類以上の説明変数の各々および対応する重回帰係数の積の総和項と、前記微分演算を施された前記微分説明変数の各々および対応する重回帰係数の積の少なくとも1種類以上の総和項とを含む前記目的変数の予測式に対して、最小二乗法によって、前記説明変数の前記各重回帰係数および前記微分説明変数の前記各重回帰係数をそれぞれ決定し、前記決定された重回帰係数を戻した前記予測式に、前記少なくとも2種類以上の説明変数の実測値を代入して前記目的変数の予測値を求めるよう構成された重回帰予測計算部とを備えたことを特徴とする装置である。
【0011】
請求項2に記載の発明は、請求項1の装置であって、前記微分説明変数の各々および対応する重回帰係数の積の前記少なくとも1種類以上の総和項は、前記少なくとも2種類以上の説明変数に、第1の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第1の総和項と、前記少なくとも2種類以上の説明変数に、前記第1の階位数とは異なる第2の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第2の総和項とを少なくとも含むことを特徴とする。
【0012】
請求項3に記載の発明は、請求項2の装置であって、前記第1の階位数の微分は、前記少なくとも2種類以上の説明変数の1次微分であり、前記第2の階位数の微分は、前記少なくとも2種類以上の説明変数の2次微分であることを特徴とする。
【0013】
請求項4に記載の発明は、請求項1乃至3いずれかの装置であって、前記説明変数は、重回帰分析における独立変数に対応し、前記目的変数は重回帰分析における従属変数に対応し、前記最小二乗法によって、前記目的変数の実測値と、前記説明変数の実測値および前記予測式によって得られる予測値との残差の二乗和を最小化するように、前記少なくとも2種類の説明変数および前記微分説明変数に対する前記重回帰係数がそれぞれ決定され、前記決定された重回帰係数を戻した前記予測式に、前記少なくとも2種類の説明変数の新しい実測値を入れて、前記目的変数の時系列データの予測値を求めることを特徴とする。
【0014】
請求項5に記載の発明は、請求項1乃至4いずれかの装置であって、前記入力されたデータを少なくとも一時的に保存するデータ蓄積部と、前記重回帰予測計算部で求められた前記目的変数の予測値を出力する表示部とをさらに備えたことを特徴とする。
【0015】
請求項6に記載の発明は、少なくとも2種類の説明変数から、時系列データの目的変数を予測する重回帰分析装置において、重回帰係数の計算を含むデータ解析を行うことになる、前記2種類以上の説明変数のデータが入力されるデータ入力部と、前記入力された少なくとも2種類以上の説明変数の前記データに対して、少なくとも1回以上の微分を施す微分演算を実行し、微分演算を施された微分説明変数を生成するよう構成された微分解析部であって、前記微分演算は、前記少なくとも2種類以上の説明変数の各々の時系列データに対する時間微分である微分解析部と、前記少なくとも2種類以上の説明変数の各々および対応する重回帰係数の積の総和項と、前記微分演算を施された前記微分説明変数の各々および対応する重回帰係数の積の少なくとも1種類以上の総和項とを含む前記目的変数の予測式に対して、最小二乗法によって、前記目的変数の実測値と、前記説明変数の実測値および前記予測式によって得られる予測値との残差の二乗和を最小化するように、前記少なくとも2種類の説明変数に対する前記各重回帰係数および前記微分説明変数に対する前記各重回帰係数をそれぞれ決定し、前記決定された重回帰係数を戻した前記予測式に、前記少なくとも2種類以上の説明変数の実測値を代入して前記目的変数の予測値を求めるよう構成された重回帰予測計算部とを備え、前記総和項が2種類以上ある場合は、前記少なくとも2種類以上の説明変数に、第1の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第1の総和項と、前記少なくとも2種類以上の説明変数に、前記第1の階位数とは異なる第2の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第2の総和項とを少なくとも含むことを特徴とする装置である。
【0016】
請求項7に記載の発明は、中央制御装置(CPU)およびメモリを少なくとも含むコンピュータによって実行される、少なくとも2種類の説明変数から、時系列データの目的変数を予測する重回帰分析方法において、重回帰係数の計算を含むデータ解析を行うことになる、前記2種類以上の説明変数のデータを入力するステップと、前記入力された少なくとも2種類以上の説明変数の前記データに対して、少なくとも1回以上の微分を施す微分演算を実行し、微分演算を施された微分説明変数を生成するステップであって、前記微分演算は、前記少なくとも2種類以上の説明変数の各々の時系列データに対する時間微分である、生成するステップと、前記少なくとも2種類以上の説明変数の各々および対応する重回帰係数の積の総和項と、前記微分演算を施された前記微分説明変数の各々および対応する重回帰係数の積の少なくとも1種類以上の総和項とを含む前記目的変数の予測式に対して、最小二乗法によって前記説明変数の前記各重回帰係数および前記微分説明変数の前記各重回帰係数を決定するステップと、前記決定された重回帰係数を戻した前記予測式に、前記少なくとも2種類以上の説明変数の実測値を代入して前記目的変数の予測値を求めるステップとを含む重回帰分析を実行するステップとを備えることを特徴とする方法である。
【0017】
請求項8に記載の発明は、請求項7の方法であって、前記微分説明変数の各々および対応する重回帰係数の積の前記総和項は、前記少なくとも2種類以上の説明変数に、第1の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第1の総和項と、前記少なくとも2種類以上の説明変数に、前記第1の階位数とは異なる第2の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第2の総和項とを少なくとも含むことを特徴とする。
【発明の効果】
【0018】
以上説明したように、本発明によれば、説明変数である解析データに対して微分計算を行い、1種類以上の微分データを従来の説明変数に新たに追加するだけで、従来技術の重回帰計算の枠組みをそのまま流用して重回帰分析をすることができる。目的変数の時系列データの予測において、予測誤差を減少することができる。
【図面の簡単な説明】
【0019】
図1図1は、本発明の重回帰分析予測装置の構成を示す図である。
図2図2は、従来技術による重回帰モデルを使用した時系列データの予測値計算の例を示す図である。
図3図3は、本発明の微分重回帰分析方法および装置において用いられる微分重回帰予測モデルに基づいた時系列データの予測値計算の例を示す図である。
図4図4は、従来技術と本発明の微分重回帰モデルを使用した微分重回帰分析方法および装置における予測誤差を比較した結果を示す図である。
【発明を実施するための形態】
【0020】
本発明の重回帰分析予測装置および重回帰分析予測方法では、目的変数である時系列データを予測する際に用いられる説明変数に、その説明変数から微分解析によって派生的に求められる微分データを新たに加えることによって、時系列データの予測精度を向上させる。発明者は、重回帰分析における最小二乗法の枠組みで利用される説明変数だけでは、時系列データの時間変化を精度良く予測することに限界があると考えた。すなわち、従来技術の重回帰分析の説明変数を使用するだけでは、時系列データの特徴を強調することには数理的に限界があると認識した。説明変数に関するデータの取得頻度やセンサの増加などでデータ数を増加させることなく、時系列データの時間変化を強調する手段がないかを検討した。
【0021】
そこで、既存の説明変数をそのまま利用するともに、既存の説明変数から派生して得られる新たな説明変数を利用できないかという着想に至った。既存の説明変数のデータに微分解析を行って得られた微分データを新たに説明変数として追加するだけで、従来技術の重回帰分析の枠組みを維持したまま予測精度が向上できることを見出した。以下では、重回帰分析予測装置を例として本発明を説明するが、重回帰分析予測方法としても実施可能であり、また、重回帰分析予測方法を実施するコンピュータプログラムとしても実施できる。さらに、重回帰分析予測方法を実施するコンピュータ実行可能命令を含んだプログラムをストアした記憶媒体としても実施できる。
【0022】
図1は、本発明の重回帰分析予測装置の構成を示す図である。重回帰分析予測装置1は、各要素を制御する中央制御装置(CPU)150を含んでおり、CPU150は以下に述べる各要素を制御して、重回帰係数および予測値の計算を実行する。装置1は、データ解析する2つ以上のデータが入力されるデータ入力部100、データを少なくとも一時的に保存するデータ蓄積部110、データごとに、微分解析を施す微分解析部120、微分解析から得られた解析結果について重回帰係数を計算し、予測値を求める微分重回帰予測計算部130、および、入力データに対応する予測値を数値として出力する表示部140を備える。尚、微分重回帰予測計算部130では、例えば最小二乗法による重回帰係数の計算の他に正規化処理なども含まれる。さらに、最小二乗法によって決定された重回帰係数を適用した予測式に、説明変数の新しいデータを入力して予測値を求める算出処理も含まれる。
【0023】
図1に示した各要素は、コンピュータプログラムを使ってコンピュータ内のCPU150によって実行されるソフトウェア演算処理としても実現できる。すなわち、微分解析部120によるデータに対する微分処理、および、微分重回帰予測計算部130による重回帰係数を計算する処理、予測値の計算処理は、コンピュータで実行可能なコンピュータプログラムに基づくソフトウェアによる演算処理で実施することもできる。また、図1に示した本発明の装置の各要素を、それぞれの要素の機能を実行するステップに置き換えれば、本発明の重回帰係数および目的変数の予測値を求める重回帰分析の方法のフロー図となる。以下、まず従来技術による重回帰係数および目的変数の予測値の計算手順について説明する。
【0024】
図2は、従来技術による重回帰モデルを使用した時系列データの予測値計算の例を示す図である。図2では、従来技術による重回帰分析の一例として、あるビルディングにおける消費電力の時系列データを目的変数として、予測値および実測値の時間変化を同時に示したものである。説明変数としては、ビルディング内に滞在している人数、並びに、気温、雨量、湿度および日射量の4つの気象データを採用した。上記の各説明変数データとしては、10分間隔で2日間、連続して取得したものを用いた。したがって、1日分の説明変数の組(人数、気温、雨量、湿度、日射量)のデータ総数は144組となる。
【0025】
従来技術において重回帰分析に用いられる重回帰モデルは、以下のように説明される(非特許文献1)。K個の説明変数(因子)をx、説明変数xごとの重回帰係数をβ(ハット)とするとき、予測値をy(ハット)は次式によって定義される。
【0026】
【数1】
【0027】
ここで、説明変数の数Kは2以上であり、β0(ハット)は回帰定数で、εは誤差である。式(1)を、取り扱うデータが時系列データの場合に拡張すると、時刻jにおいて重回帰モデルは、次のように定義できる。
【0028】
【数2】
【0029】
式(2)において、重回帰係数β0, β1, ・・・βKを既知の一定時間長の時系列データyj(j=1.....J)を用いて推定すれば、時系列データに対する1つの重回帰式を得ることができる。実際の値(実測値)をyjとするとき、実測値yjと式(2)で求められた予測値yj(ハット)との間の残差ej(ハット)は、次式によって与えられる。
【0030】
【数3】
【0031】
重回帰分析においては、最小二乗法の枠組みの下で、式(3)によって求められる残差の二乗和Eが最小となるように、すなわち、次の操作によって各説明変数に対する重回帰係数βk(ハット)(k=0.....K)を推定する。
【0032】
【数4】
【0033】
ただし、Jは時系列データのデータ総数(組)である。一例を挙げれば、J個の消費電力の時系列データに対応する、ビルディング内の人数、ならびに、気温、雨量、湿度および日射量の5種類のデータ(説明変数)の組がJ個あることになる。式(4)が最小値を持つ必要条件は、次式によって与えられる。
【0034】
【数5】
【0035】
式(5)を満たすような各説明変数に対する重回帰係数β(ハット)を決定する。ここで決定された重回帰係数βを式(2)に戻して、説明変数の新しいデータを入力することによって目的変数の時系列データの予測値が得られる。
【0036】
なお、重回帰モデルには、式(1)の形式のほかにも、2つの説明変数の積を式(1)に交差項として加えて拡張したモデルや、線形の説明変数の2乗をとった項を式(1)に加えた非線形モデルも知られている。
【0037】
図2では、実線によって消費電力の実測値を示している。同時に、説明変数として、ビルディング内の人数、気温、雨量、湿度および日射量の実測データならびに決定された説明変数を使用した予測式の式(2)を用いて得られた時系列データの予測値を、点線で示した。実線の実測値と比べると、点線の予測値データは、全体的に実測値の滑らかな当てはめに止まっており、実測値の急峻な変化にはうまく追従できていないことが分かる。従来技術の重回帰分析では、観測されるデータの極値の細部まで近似精度を高めることには限界があったことが分かる。本発明の重回帰分析装置および重回帰分析方法は、従来技術におけるこの限界を越えることができる。
【0038】
図3は、本発明の重回帰分析装置および重回帰分析方法において用いられる微分重回帰予測モデルに基づいた時系列データの予測値計算の例を示す図である。図2に示した従来技術の例と同様に、ビルディングにおける消費電力の時系列データを目的変数として、予測値および実測値の時間変化を同時に示したものである。
【0039】
本発明の重回帰分析装置および重回帰分析方法において用いられる微分重回帰予測では、上述の従来技術における重回帰モデルでは考慮されていなかった、説明変数の時系列データの時間的な変化の影響を加味することを特徴とする。ここで、ある説明変数xjについて、その時系列データを{x1,x2,... xTj とする。ただし、離散時間は1からTまでとする。本発明では、時間変化を伴う時系列データである目的変数yを生成するために、説明変数xjに加えて、説明変数xjの1次微分値(後退差分)を次式によって計算する。
【0040】
【数6】
【0041】
さらに、式(5)と同様に、時間についての二次微分値(中心差分)を次式によって計算する。
【0042】
【数7】
【0043】
2次微分以上の高階の微分値は、差分法により容易に求めることができる。
【0044】
本発明において用いられる微分重回帰予測モデルでは、式(6)および式(7)で求めた時系列データの微分値、すなわち1次微分および2次微分を、新たな説明変数として予測式の式(2)に加える。すなわち、以下説明するように、1次微分を施された説明変数およびこれに対応する重回帰係数の積の総和項と、2次微分を施された説明変数およびこれに対応する重回帰係数の積の総和項とが式(2)に追加されることになる。
【0045】
式(2)に式(6)および式(7)を加えると、次式が得られる。
【0046】
【数8】
【0047】
従来技術の重回帰分析と同様に、次の操作によって、未知の説明変数の重回帰係数βk(ハット)(k=0, 1,.., K.., 2...,3K)を推定する。
【0048】
【数9】
【0049】
式(8)が最小値を持つ条件は、式(5)と同様に次式によって与えられる。
【0050】
【数10】
【0051】
最終的に、本発明の説明変数の時系列データの時間的な変化の影響を加味した重回帰式は次の通りとなる。
【0052】
【数11】
【0053】
式(11)から分かるように、本発明の微分重回帰分析方法および装置では、回帰定数β0(第1項)、従来の時系列データのK個の説明変数と重回帰係数βkとの積の総和項(Σ:k=1〜K、第2項)に加えて、K個の説明変数から派生した1次微分された説明変数と重回帰係数βkとの積の総和項(Σ:k=K+1〜2K、第3項)、または、K個の説明変数から派生した2次微分された説明変数と重回帰係数βkとの積の総和項(Σ:k=2K+1〜3K、第4項)を加えた予測式を用いるところに特徴がある。ここで簡単のため、元の説明変数に対し微分演算処理を施して得られる新しい説明変数を微分説明変数と呼ぶことにする。元の説明変数に1次微分を施した微分説明変数と、2次微分を施した微分説明変数とは、別個の説明変数となる。
【0054】
式(11)の予測式は、第3項および第4項が追加されている点で式(1)と異なっているだけで、上述のように、従来の重回帰分析の枠組みをそのまま使用して、説明変数および微分された説明変数の各重回帰係数βを求めることができる。
【0055】
したがって本発明は、少なくとも2種類の説明変数から、時系列データの目的変数を予測する重回帰分析装置として実現可能であって、重回帰係数の計算を含むデータ解析を行うことになる、前記2種類以上の説明変数のデータが入力されるデータ入力部と、前記入力された少なくとも2種類以上の説明変数の前記データに対して、少なくとも1回以上の微分を施す微分演算を実行し、微分演算を施された微分説明変数を生成するよう構成された微分解析部であって、前記微分演算は、前記少なくとも2種類以上の説明変数の各々の時系列データに対する時間微分である微分解析部と、前記少なくとも2種類以上の説明変数の各々および対応する重回帰係数の積の総和項と、前記微分演算を施された前記微分説明変数の各々および対応する重回帰係数の積の少なくとも1種類以上の総和項とを含む前記目的変数の予測式に対して、最小二乗法によって、前記説明変数の前記各重回帰係数および前記微分説明変数の前記各重回帰係数をそれぞれ決定し、前記決定された重回帰係数を戻した前記予測式に、前記少なくとも2種類以上の説明変数の実測値を代入して前記目的変数の予測値を求めるよう構成された重回帰予測計算部とを備える。
【0056】
図3は、図2に示した例と同様に、ビルディングにおける消費電力の時系列データを目的変数として、予測値および実測値の時間変化を同時に示したものである。説明変数として、ビルディング内に滞在している人数、ならびに、気温、雨量、湿度および日射量の4つの気象データを用い、さらに式(7)の予測式を用いて係数βを推定する。決定された係数βを戻した予測式に、説明変数の新たな実測値(人数、気温、雨量、湿度、日射量)を入れて消費電力の時系列データを予測した。実線が実測値であり、点線が本発明の微分重回帰分析方法および装置によって得られた予測値である。本発明によって求められた消費電力の時系列データの予測値は、実測値と比べると、局所的な急峻な変化にもよく追従しているのがわかる。予測誤差は、図2に示した従来技術の重回帰分析によって求めた予測値の場合よりも大幅に改善された。
【0057】
本発明の微分重回帰分析におけるこの予測精度の改善は、従来の説明変数に加えて、これらの説明変数から派生した1次微分または2次微分に対応する説明変数(微分説明変数)が予測式に新たに追加されたことによるものである。説明変数の実測データが持っている時間的な変化の特性が因子として重回帰分析に考慮されたためと考えられる。図3では、元の説明変数の1次微分に対応する微分説明変数および2次微分に対応する微分説明変数の両方を予測式に加えた例を示している。したがって、微分説明変数の各々および対応する重回帰係数の積の少なくとも1種類以上の総和項は、前記少なくとも2種類以上の説明変数に、第1の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第1の総和項と、前記少なくとも2種類以上の説明変数に、前記第1の階位数とは異なる第2の階位数の微分を施した微分説明変数および対応する重回帰係数の積の第2の総和項とを少なくとも含むのが好ましい。より具体的には、式(7)に例示したように、第1の階位数の微分は、前記少なくとも2種類以上の説明変数の1次微分であり、前記第2の階位数の微分は、前記少なくとも2種類以上の説明変数の2次微分であることができる。
【0058】
しかしながら、必ずしも両方の微分説明変数を加える必要なない。1次微分および2次微分のうちのいずれか一方の微分説明変数を加えただけでも、従来技術比で予測の精度の向上が期待できる。また、さらに第3次微分に対応する説明変数を加えたり、さらなる高次の微分項に対応する説明変数を加えたりすることもできる。また、1次微分または2次微分に対応する微分説明変数を省略して、より高階位(高次)の微分に対応する説明変数のみを予測式に加えても良い。目的変数および説明変数、相互の関係性に固有の性質に従って、予測精度をより上げることのできる階位の微分項を調べて、これを式(7)の予測式に追加をすれば良い。したがって、式(7)において新しく追加された第3項および第4項の総和項は例示的なものである。追加されるのが1つの項でも良いし、3つ以上でも良い。説明変数から派生して求められる微分説明変数を、1種類以上追加することによって、少なくとも従来技術の予測式よりも目的変数の予測精度の向上が期待できる。
【0059】
本発明は、最初に述べたように、時系列データの目的変数を予測する重回帰分析方法としても実施できる。すなわち、中央制御装置(CPU)およびメモリを少なくとも含むコンピュータによって実行される、少なくとも2種類の説明変数から、時系列データの目的変数を予測する重回帰分析方法において、重回帰係数の計算を含むデータ解析を行うことになる、前記2種類以上の説明変数のデータを入力するステップと、前記入力された少なくとも2種類以上の説明変数の前記データに対して、少なくとも1回以上の微分を施す微分演算を実行し、微分演算を施された微分説明変数を生成するステップであって、前記微分演算は、前記少なくとも2種類以上の説明変数の各々の時系列データに対する時間微分である、生成するステップと、前記少なくとも2種類以上の説明変数の各々および対応する重回帰係数の積の総和項と、前記微分演算を施された前記微分説明変数の各々および対応する重回帰係数の積の少なくとも1種類以上の総和項とを含む前記目的変数の予測式に対して、最小二乗法によって前記説明変数の前記各重回帰係数および前記微分説明変数の前記各重回帰係数を決定するステップと、前記決定された重回帰係数を戻した前記予測式に、前記少なくとも2種類以上の説明変数の実測値を代入して前記目的変数の予測値を求めるステップとを含む重回帰分析を実行するステップとを備えることを特徴とする方法として実施できる。
【0060】
図4は、従来技術と本発明の微分重回帰モデルを使用した微分重回帰分析方法および装置における予測誤差を比較した結果を示す図である。図2および図3で用いたビルディングにおける消費電力および説明変数のデータをテストデータとして用いた。ここで予測誤差は、次式によって定義される。
予測誤差=|実測値−重回帰予測値| 式(10)
【0061】
図4では、一定時間区間における単位時間当たりの平均予測誤差を次の各場合について求めた。従来技術の式(1)による線形重回帰モデルについての予測誤差を×(バツ)プロットで、本発明の微分重回帰分析方法および装置による予測で、1次微分の微分説明変数だけを式(7)に含めた場合を□(四角)プロットで、2次微分の微分説明変数だけを式(7)に含めた場合を△(三角)プロットで、1次微分および2次微分の微分説明変数を両方含めた場合を○(丸)プロットでそれぞれ示した。
【0062】
図4から明らかなように、従来技術と比べて、本発明による重回帰分析を用いた方が予測誤差は大幅に減少することが分かる。本例のビルディングにおける消費電量の時系列データを予測する場合については、1次微分および2次微分の両方の微分説明変数を用いることが効果的であることが示された。
【0063】
本発明の重回帰分析装置および重回帰分析方法では、従来技術で用いられていた説明変数だけではなく、既存の説明変数から派生して得られる微分演算を施したデータを新たな微分説明変数として加えることで、従来技術の重回帰分析の枠組みをそのまま使用したままで、予測精度を向上させることができる。したがって、目的変数の時系列データの予測においても、別個の解析手法を用いる必要はなく、従来技術の重回帰分析の枠組みを何ら変更することなしに予測精度を上げることができる。
【0064】
一般に時系列データの予測精度を上げるためには、説明変数のデータ数を増やすためにデータの取得頻度を増やしたり、センサの数を増やしたりすることが必要になる。しかし、本発明の重回帰分析装置および方法では、既存の説明変数データ(生データ)だけに基づいており、時系列データの予測精度を上げるために新たな生データの追加を必要としない。既存の説明変数データの微分値である派生的な微分説明変数を新たに追加して、目的変数の時系列データ予測の精度を上げることができる。本発明の重回帰分析装置および方法により、従来技術と連続性がある単一の重回帰モデルを用いながらも、時間変動特性を含めた統一的な解析が実現され、実測データの局所的に急峻な変化に追従した予測が可能となり、予測誤差の大幅な改善が可能となる。
【産業上の利用可能性】
【0065】
本発明は、データ処理に利用することができる。特に、電力分野、エネルギー分野、通信分野、センシング分野などにおいて、実環境におけるモニタリングや画像センシングに利用することができる。
【符号の説明】
【0066】
1 重回帰分析予測装置
100 データ入力部
110 データ蓄積部
120 微分解析部
130 微分重回帰予測計算部
140 表示部
150 中央制御装置(CPU)
図1
図2
図3
図4