(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024176843
(43)【公開日】2024-12-19
(54)【発明の名称】ノイズ除去付き予測装置、ノイズ除去付き予測方法、及びプログラム
(51)【国際特許分類】
G06N 3/0455 20230101AFI20241212BHJP
G06F 18/214 20230101ALI20241212BHJP
G06N 3/09 20230101ALI20241212BHJP
G06F 18/27 20230101ALI20241212BHJP
【FI】
G06N3/0455
G06F18/214
G06N3/09
G06F18/27
【審査請求】有
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2023095673
(22)【出願日】2023-06-09
(11)【特許番号】
(45)【特許公報発行日】2024-02-21
(71)【出願人】
【識別番号】000005234
【氏名又は名称】富士電機株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】金田 龍哉
(72)【発明者】
【氏名】島崎 祐一
(57)【要約】
【課題】予測モデルに入力される説明変数に存在するノイズを除去できる技術を提供すること。
【解決手段】本開示の一態様によるノイズ除去付き予測装置は、1つ以上の説明変数と目的変数とで構成されるデータを取得する第1のデータ取得部と、前記データに含まれる1つ以上の説明変数のうちの少なくとも一部の説明変数の値に対してノイズを付与して学習用データを作成する学習用データ作成部と、前記データを教師データとして、前記学習用データに含まれる1つ以上の説明変数の値を少なくとも入力とするデノイジングオートエンコーダを学習する学習部と、前記1つ以上の説明変数で構成される予測対象データを取得する第2のデータ取得部と、前記学習後のデノイジングオートエンコーダにより前記予測対象データに含まれる1つ以上の説明変数の値からノイズを除去するノイズ除去部と、前記ノイズ除去後の予測対象データを用いて、予測モデルにより、前記目的変数の値を予測する予測部と、を有する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
1つ以上の説明変数と目的変数とで構成されるデータを取得する第1のデータ取得部と、
前記データに含まれる1つ以上の説明変数のうちの少なくとも一部の説明変数の値に対してノイズを付与して学習用データを作成する学習用データ作成部と、
前記データを教師データとして、前記学習用データに含まれる1つ以上の説明変数の値を少なくとも入力とするデノイジングオートエンコーダを学習する学習部と、
前記1つ以上の説明変数で構成される予測対象データを取得する第2のデータ取得部と、
前記学習後のデノイジングオートエンコーダにより前記予測対象データに含まれる1つ以上の説明変数の値からノイズを除去するノイズ除去部と、
前記ノイズ除去後の予測対象データを用いて、予測モデルにより、前記目的変数の値を予測する予測部と、
を有するノイズ除去付き予測装置。
【請求項2】
前記デノイジングオートエンコーダは、
前記1つ以上の説明変数の値と、前記目的変数と相関がある変数を表すダミー目的変数の値とを入力とする、請求項1に記載のノイズ除去付き予測装置。
【請求項3】
前記ダミー目的変数は、
前記1つ以上の説明変数のうちのいずれかの説明変数、又は、前記1つ以上の説明変数の値を入力として前記目的変数の値を予測するモデルの予測値を表す変数、である、請求項2に記載のノイズ除去付き予測装置。
【請求項4】
前記モデルは、物理モデル、単回帰モデル、重回帰モデル、所定の予測アルゴリズムで実現されるモデルのいずれかである、請求項3に記載のノイズ除去付き予測装置。
【請求項5】
1つ以上の説明変数と目的変数とで構成されるデータを取得する第1のデータ取得手順と、
前記データに含まれる1つ以上の説明変数のうちの少なくとも一部の説明変数の値に対してノイズを付与して学習用データを作成する学習用データ作成手順と、
前記データを教師データとして、前記学習用データに含まれる1つ以上の説明変数の値を少なくとも入力とするデノイジングオートエンコーダを学習する学習手順と、
前記1つ以上の説明変数で構成される予測対象データを取得する第2のデータ取得手順と、
前記学習後のデノイジングオートエンコーダにより前記予測対象データに含まれる1つ以上の説明変数の値からノイズを除去するノイズ除去手順と、
前記ノイズ除去後の予測対象データを用いて、予測モデルにより、前記目的変数の値を予測する予測手順と、
をコンピュータが実行するノイズ除去付き予測方法。
【請求項6】
1つ以上の説明変数と目的変数とで構成されるデータを取得する第1のデータ取得手順と、
前記データに含まれる1つ以上の説明変数のうちの少なくとも一部の説明変数の値に対してノイズを付与して学習用データを作成する学習用データ作成手順と、
前記データを教師データとして、前記学習用データに含まれる1つ以上の説明変数の値を少なくとも入力とするデノイジングオートエンコーダを学習する学習手順と、
前記1つ以上の説明変数で構成される予測対象データを取得する第2のデータ取得手順と、
前記学習後のデノイジングオートエンコーダにより前記予測対象データに含まれる1つ以上の説明変数の値からノイズを除去するノイズ除去手順と、
前記ノイズ除去後の予測対象データを用いて、予測モデルにより、前記目的変数の値を予測する予測手順と、
をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ノイズ除去付き予測装置、ノイズ除去付き予測方法、及びプログラムに関する。
【背景技術】
【0002】
AI(artificial intelligence)等の予測・学習に用いられるデータには予測に関係しない情報が混在していることがあり、ノイズ等と呼ばれる。AI等の予測・学習に用いられるデータにノイズが混在している場合、予測モデルは、予測に関係しない情報も学習するため予測精度が低下することがある。これに対して、ラベルノイズが存在する状況下でモデルをロバストに訓練できる従来技術が知られている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、例えば、特許文献1に記載されている従来技術では、ラベル(つまり、目的変数)以外の説明変数にノイズが存在する場合が考慮されていなかった。
【0005】
本開示は、上記の点に鑑みてなされたもので、予測モデルに入力される説明変数に存在するノイズを除去できる技術を提供する。
【課題を解決するための手段】
【0006】
本開示の一態様によるノイズ除去付き予測装置は、1つ以上の説明変数と目的変数とで構成されるデータを取得する第1のデータ取得部と、前記データに含まれる1つ以上の説明変数のうちの少なくとも一部の説明変数の値に対してノイズを付与して学習用データを作成する学習用データ作成部と、前記データを教師データとして、前記学習用データに含まれる1つ以上の説明変数の値を少なくとも入力とするデノイジングオートエンコーダを学習する学習部と、前記1つ以上の説明変数で構成される予測対象データを取得する第2のデータ取得部と、前記学習後のデノイジングオートエンコーダにより前記予測対象データに含まれる1つ以上の説明変数の値からノイズを除去するノイズ除去部と、前記ノイズ除去後の予測対象データを用いて、予測モデルにより、前記目的変数の値を予測する予測部と、を有する。
【発明の効果】
【0007】
予測モデルに入力される説明変数に存在するノイズを除去できる技術が提供される。
【図面の簡単な説明】
【0008】
【
図1】本実施形態に係るノイズ除去付き予測装置のハードウェア構成の一例を示す図である。
【
図2】本実施形態に係るノイズ除去付き予測装置の機能構成の一例を示す図である。
【
図3】ノイズ除去モデルの一例(その1)を示す図である。
【
図4】ノイズ除去モデルの一例(その2)を示す図である。
【
図5】本実施形態に係るノイズ除去モデル学習処理の一例を示すフローチャートである。
【
図6】本実施形態に係るノイズ除去処理の一例を示すフローチャートである。
【
図7】「A)DAE実施なし」におけるデータ分布の一例を示す図である。
【
図8】「C)DAE実施あり(提案法)」におけるデータ分布の一例を示す図である。
【
図9】「A)DAE実施なし」と「C)DAE実施あり(提案法)」におけるデータ分布の比較例を示す図である。
【発明を実施するための形態】
【0009】
以下、本発明の一実施形態について説明する。以下の実施形態では、予測モデルに入力される説明変数に存在するノイズを除去した上で、この予測モデルによる予測を行うことができるノイズ除去付き予測装置10について説明する。以下、予測モデルをfとする。
【0010】
<ノイズ除去付き予測装置10のハードウェア構成例>
本実施形態に係るノイズ除去付き予測装置10のハードウェア構成例を
図1に示す。
図1に示すように、本実施形態に係るノイズ除去付き予測装置10は、入力装置101と、表示装置102と、外部I/F103と、通信I/F104と、RAM(Random Access Memory)105と、ROM(Read Only Memory)106と、補助記憶装置107と、プロセッサ108とを有する。これらの各ハードウェアは、それぞれがバス109を介して通信可能に接続される。
【0011】
入力装置101は、例えば、キーボード、マウス、タッチパネル、物理ボタン等である。表示装置102は、例えば、ディスプレイ、表示パネル等である。なお、ノイズ除去付き予測装置10は、入力装置101及び表示装置102のうちの少なくとも一方を有していなくてもよい。
【0012】
外部I/F103は、記録媒体103a等の外部装置とのインタフェースである。記録媒体103aとしては、例えば、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等が挙げられる。
【0013】
通信I/F104は、ノイズ除去付き予測装置10を通信ネットワークに接続するためのインタフェースである。RAM105は、プログラムやデータを一時保持する揮発性の半導体メモリ(記憶装置)である。ROM106は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリ(記憶装置)である。補助記憶装置107は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等の不揮発性の記憶装置である。プロセッサ108は、例えば、CPU(Central Processing Unit)やGPGPU(General Purpose computing with Graphic Processing Unit)等の各種演算装置である。
【0014】
なお、
図1に示すハードウェア構成は一例であって、ノイズ除去付き予測装置10は、複数の補助記憶装置107や複数のプロセッサ108を有していてもよいし、図示したハードウェアの一部を有していなくてもよいし、図示したハードウェア以外の種々のハードウェアを有していてもよい。
【0015】
<ノイズ除去付き予測装置10の機能構成例>
本実施形態に係るノイズ除去付き予測装置10の機能構成例を
図2に示す。
図2に示すように、本実施形態に係るノイズ除去付き予測装置10は、第1のデータ取得部201と、ノイズ作成部202と、学習用データ作成部203と、学習部204と、第2のデータ取得部205と、ノイズ除去部206と、予測部207とを有する。これら各部は、例えば、ノイズ除去付き予測装置10にインストールされた1以上のプログラムが、プロセッサ108等に実行させる処理により実現される。
【0016】
第1のデータ取得部201は、ノイズ除去付き予測装置10に与えられた第1のデータセットを取得する。第1のデータセットとは、予測モデルに入力される説明変数に存在するノイズを除去するためのノイズ除去モデルの学習に用いられるデータセットのことである。以下、第1のデータセットをD1={d(i)|i=1,・・・,N}とする。ここで、d(i)=(x1
(i),・・・,xn
(i),y(i))は第1のデータセットD1に含まれるi番目のデータ、Nは第1のデータセットD1に含まれるデータ数を表す。また、x1
(i),・・・,xn
(i)はi番目のデータの説明変数x1,・・・,xnの値をそれぞれ表し、y(i)はi番目のデータの目的変数yの値を表す。
【0017】
ここで、ノイズ除去モデルはDAE(Denoising Autoencoder;デノイジングオートエンコーダ)で実現されるモデルであるものとする。DAEとはノイズ除去のためにオートエンコーダ(自己符号化器)の入力にノイズを加えた状態で学習するものである。以下では、DAE(x;θ)=D(E(x;θE);θD)と表す。なお、D(・)はデコーダ、E(・)はエンコーダ、θはDAEの学習可能パラメータ、θDはデコーダの学習可能パラメータ、θEはエンコーダの学習可能パラメータを表す。ただし、各学習パラメータはその表記を省略することがある。なお、DAEの詳細については、例えば、参考文献1等を参照されたい。
【0018】
ノイズ作成部202は、第1のデータセットD1に含まれる各データd(i)の各説明変数値x1
(i),・・・,xn
(i)に付与するノイズε1
(i),・・・,εn
(i)を作成する。なお、ノイズ作成部202は、任意の手法によりノイズε1
(i),・・・,εn
(i)を作成すればよい。例えば、ガウス分布や一様分布等に従うランダムな値をサンプリングして或るノイズεj'
(i)(j'∈{1,・・・,n})を作成してもよいし、或る説明変数値xj
(i)を或るノイズεj'
(i)(j'∈{1,・・・,n})として作成してもよいし、或る説明変数値xj
(i)(i=1,・・・,N)の統計量(例えば、中央値、平均値、最大値、最小値等)を或るノイズεj'
(i)(j'∈{1,・・・,n})として作成してもよい。なお、ε1
(i),・・・,εn
(i)のうち一部のノイズが0であってもよい(つまり、ノイズが付与されない説明変数が存在してもよい。)。また、データd(i)毎にノイズε1
(i),・・・,εn
(i)が作成されてもよいし、すべてのデータd(i)で共通のノイズε1,・・・,εnが作成されてもよい。
【0019】
学習用データ作成部203は、第1のデータセットD1と、ノイズε1
(i),・・・,εn
(i)(i=1,・・・,N)とを用いて、各データd(i)の各説明変数値x1
(i),・・・,xn
(i)に対してノイズε1
(i),・・・,εn
(i)をそれぞれ付与して学習用データセットDを作成する。すなわち、学習用データ作成部203は、各i=1,・・・,Nに対して、xj
'(i)←xj
(i)+εj(j=1,・・・,n)とノイズを付与して学習用データセットD={d'(i)|i=1,・・・,N}を作成する。ここで、d'(i)=(x1
'(i),・・・,xn
'(i),y(i))である。
【0020】
学習部204は、第1のデータセットD1と学習用データセットDとを用いて、ノイズ除去モデルDAE(・)を学習する。ここで、学習部204は、以下の学習手法1又は2によりノイズ除去モデルDAE(・)を学習する。
【0021】
・学習手法1
(x1
'(i),・・・,xn
'(i),dy(i))をノイズ除去モデルDAE(・)の入力データ、(x1
(i),・・・,xn
(i),y(i))を教師データとして、ノイズ除去モデルDAE(・)を学習する。ここで、dyはダミーの目的変数(以下、ダミー目的変数という。)である。ダミー目的変数dyの値としては、例えば、目的変数yと相関が高いと考えられる説明変数の値をそのまま用いてもよいし、物理モデルや単回帰、重回帰、その他のアルゴリズムにて作成した予測モデルにより目的変数の値の予測した予測値を用いてもよい。
【0022】
具体例としては、例えば、目的変数yが「電力需要」を表し、或る説明変数xjが「気温」を表す場合、「電力需要」と「気温」は相関があると考えられるため、ダミー目的変数値dy(i)として、説明変数値xj
(i)又はxj
'(i)を用いることが考えられる。
【0023】
また、例えば、物理モデルや単回帰、重回帰、その他のアルゴリズムにて作成した予測モデルをy=g(x1,・・・,xn)としたとき、ダミー目的変数値dy(i)として、g(x1
(i),・・・,xn
(i))又はg(x1
'(i),・・・,xn
'(i))を用いることが考えられる。
【0024】
エンコーダE(・)の出力データを(z
1,・・・,z
m)として、学習手法1を用いる場合、ノイズ除去モデルDAE(・)は、
図3に示すDAEで与えられる。なお、出力データの次元数mはユーザ等が設定可能なハイパーパラメータである。これ以外にも、例えば、ノイズ除去モデルDAE(・)の活性化関数、学習の際のミニバッチ数やエポック数等もユーザ等が設定可能なハイパーパラメータである。
【0025】
・学習手法2
(x1
'(i),・・・,xn
'(i))をノイズ除去モデルDAE(・)の入力データ、(x1
(i),・・・,xn
(i),y(i))を教師データとして、ノイズ除去モデルDAE(・)を学習する。
【0026】
エンコーダE(・)の出力データを(z
1,・・・,z
m)として、学習手法2を用いる場合、ノイズ除去モデルDAE(・)は、
図4に示すDAEで与えられる。なお、出力データの次元数mはユーザ等が設定可能なハイパーパラメータである。これ以外にも、例えば、ノイズ除去モデルDAE(・)の活性化関数、学習の際のミニバッチ数やエポック数等もユーザ等が設定可能なハイパーパラメータである。
【0027】
上記の学習手法1及び2はいずれも教師データとして目的変数yを用いている。このため、上記の学習手法1及び2によれば、目的変数yも考慮したノイズ除去モデルDAE(・)を得ることが可能となる。
【0028】
第2のデータ取得部205は、ノイズ除去付き予測装置10に与えられた第2のデータセット又は予測対象データを取得する。ここで、第2のデータセットは予測モデルfの学習時に与えられ、予測対象データは予測モデルfの予測時(推論時)に与えられる。第2のデータセットとは、予測モデルfの学習に用いられるデータセットのことである。以下、第2のデータセットをD2={d(k)|k=1,・・・,K}とする。ここで、d(k)=(x1
(k),・・・,xn
(k),y(k))は第2のデータセットD2に含まれるk番目のデータ、Kは第2のデータセットD2に含まれるデータ数を表す。また、x1
(k),・・・,xn
(k)はk番目のデータの説明変数x1,・・・,xnの値をそれぞれ表し、y(k)はk番目のデータの目的変数yの値を表す。一方で、予測対象データをd(p)=(x1
(p),・・・,xn
(p))とする。ここで、x1
(p),・・・,xn
(p)は予測対象データd(p)の説明変数x1,・・・,xnの値をそれぞれ表す。
【0029】
ノイズ除去部206は、予測モデルfの学習時である場合、ノイズ除去モデルDAE(・)を用いて、第2のデータセットD2に含まれる各データd(k)の各説明変数値x1
(k),・・・,xn
(k)のノイズを除去する。すなわち、上記の学習手法1によりノイズ除去モデルDAE(・)が学習された場合、ノイズ除去部206は、各データd(k)の各説明変数値x1
(k),・・・,xn
(k)とダミー目的変数値dy(k)とをノイズ除去モデルDAE(・)に入力し、これらの各説明変数値x1
(k),・・・,xn
(k)のノイズを除去する。一方で、上記の学習手法2によりノイズ除去モデルDAE(・)が学習された場合、ノイズ除去部206は、各データd(k)の各説明変数値x1
(k),・・・,xn
(k)をノイズ除去モデルDAE(・)に入力し、これらの各説明変数値x1
(k),・・・,xn
(k)のノイズを除去する。
【0030】
ノイズ除去部206は、予測モデルfの予測時である場合、ノイズ除去モデルDAE(・)を用いて、予測対象データd(p)の各説明変数値x1
(p),・・・,xn
(p)のノイズを除去する。すなわち、上記の学習手法1によりノイズ除去モデルDAE(・)が学習された場合、ノイズ除去部206は、予測対象データd(p)の各説明変数値x1
(p),・・・,xn
(p)とダミー目的変数値dy(p)とをノイズ除去モデルDAE(・)に入力し、これらの各説明変数値x1
(p),・・・,xn
(p)のノイズを除去する。一方で、上記の学習手法2によりノイズ除去モデルDAE(・)が学習された場合、ノイズ除去部206は、予測対象データd(p)の各説明変数値x1
(p),・・・,xn
(p)をノイズ除去モデルDAE(・)に入力し、これらの各説明変数値x1
(p),・・・,xn
(p)のノイズを除去する。
【0031】
予測部207は、予測モデルfの学習時である場合、ノイズ除去後の第2のデータセットD2を用いて、予測モデルfを学習する。例えば、予測部207は、ノイズ除去後の各データd(k)の各説明変数値x1
(k),・・・,xn
(k)を予測モデルfに入力し、目的変数値y(k)を教師データとして当該予測モデルfを学習する。
【0032】
予測部207は、予測モデルfの予測時である場合、ノイズ除去後の予測対象データd(p)の各説明変数値x1
(p),・・・,xn
(p)を予測モデルfに入力し、目的変数値yの値を予測する。
【0033】
なお、上記では予測モデルfはノイズ除去後の説明変数値を入力として取るものとしたが、これは一例であって、予測モデルfの入力はこれに限られるものではない。例えば、予測モデルfは、ノイズ除去前の説明変数値とノイズ除去後の説明変数値との両方を入力として取るものであってもよい。また、例えば、予測モデルfは、ノイズ除去前の説明変数値をノイズ除去モデルDAE(・)に入力したときの隠れ状態(つまり、z1,・・・,zmの値)を入力として取るものであってもよい。
【0034】
<ノイズ除去モデル学習処理>
以下、本実施形態に係るノイズ除去モデル学習処理の一例について、
図5を参照しながら説明する。なお、以下では予測モデルfの学習時と予測時(推論時)とを同一のフローチャートを参照しながら説明するが、予測モデルfの学習時は予測時よりも前に実行される。
【0035】
まず、第1のデータ取得部201は、ノイズ除去付き予測装置10に与えられた第1のデータセットD1を取得する(ステップS101)。
【0036】
次に、ノイズ作成部202は、第1のデータセットD1に含まれる各データd(i)の各説明変数値x1
(i),・・・,xn
(i)に付与するノイズε1
(i),・・・,εn
(i)を作成する(ステップS102)。
【0037】
次に、学習用データ作成部203は、第1のデータセットD1と、ノイズε1
(i),・・・,εn
(i)(i=1,・・・,N)とを用いて、各データd(i)の各説明変数値x1
(i),・・・,xn
(i)に対してノイズε1
(i),・・・,εn
(i)をそれぞれ付与して学習用データセットDを作成する(ステップS103)。これにより、学習用データセットD={d'(i)|i=1,・・・,N}、d'(i)=(x1
'(i),・・・,xn
'(i),y(i))が得られる。
【0038】
そして、学習部204は、第1のデータセットD1と学習用データセットDとを用いて、上記の学習手法1又は2によりノイズ除去モデルDAE(・)を学習する(ステップS104)。なお、ノイズ除去モデルDAE(・)の学習には既知の教師あり学習の手法を用いればよく、また最適化手法としても既知の手法を用いることができる。例えば、最適化手法としてはAdam等を用いることができる。
【0039】
<ノイズ除去処理>
以下、本実施形態に係るノイズ除去処理の一例について、
図6を参照しながら説明する。
【0040】
まず、第2のデータ取得部205は、予測モデルfの学習時である場合は第2のデータセットD2、予測モデルfの予測時(推論時)である場合は予測対象データd(p)を取得する(ステップS201)。
【0041】
次に、ノイズ除去部206は、予測モデルfの学習時である場合はノイズ除去モデルDAE(・)により第2のデータセットD2に含まれる各データd(k)の各説明変数値x1
(k),・・・,xn
(k)のノイズを除去し、予測モデルfの予測時(推論時)である場合はノイズ除去モデルDAE(・)により予測対象データd(p)の各説明変数値x1
(p),・・・,xn
(p)のノイズを除去する(ステップS202)。
【0042】
そして、予測部207は、予測モデルfの学習時である場合はノイズ除去後の第2のデータセットD2を用いて予測モデルfを学習し、予測モデルfの予測時(推論時)である場合はノイズ除去後の予測対象データd(p)を用いて目的変数yの値を予測する(ステップS203)。
【0043】
<実施例及びその評価>
本実施例では、参考文献2に記載されている或る家庭の消費電力の1分毎の推移を示すデータセットを利用した。このデータセットから2007年1月1日~2009年12月31日までの1時間毎の平均値を算出し、予測モデルfの学習用・検証用データとした。以下の表1にデータ項目を示す。
【0044】
【表1】
ここで、tは現在時刻、t-iはi時間前を表す。また、目的変数は1時間後のGlobal_active_power(家庭全体の有効電力の分平均)とした。
【0045】
また、2007年1月1日~2008年12月31日の期間のデータを予測モデルfの学習用データとし、2009年1月1日~2009年12月31日のデータを予測モデルfの検証用データとした。このとき、学習用データ、検証用データは最小値が0、最大値が1に正規化した後に使用した。更に、予測モデルfとしては勾配ブースティングを用いた。
【0046】
比較のために、A)DAE実施なし、B)DAE実施あり(ただし、教師データに目的変数なし)、C)DAE実施あり(提案法)を実施した。なお、Cが本実施形態で提案した手法である。
【0047】
DAEを学習する際には、A)及びC)では-0.05~0.05の範囲を取る一様分布からサンプリングしたノイズを付与し、更にC)ではダミー目的変数として現在時刻のGlobal_active_powerを用いた。また、DAEの入力次元数はA)では108、C)では109とし、中間層の次元数は75、活性化関数はreluとして、エポック数50、ミニバッチ数80で最適化アルゴリズムとしてAdamを利用して学習した。
【0048】
以上の条件の下で、A、B、Cそれぞれで学習用データを利用して予測モデルfを学習した後、検証用データを利用して予測モデルfの予測精度を算出した。予測精度の指標値としては平均絶対誤差を採用した。このとき、A)では0.373、B)では0.388、C)では0.365となり、C)で最も良い予測精度が達成できた。
【0049】
また、C)の効果を確認するため、データ分布の一例としてVoltageと目的変数の分布を
図7~
図9に示す。
図7はA)DAE実施なしのデータ分布、
図8はC)DAE実施あり(提案法)のデータ分布、
図9はA)DAE実施なしのデータ分布とC)DAE実施あり(提案法)のデータ分布とを重ねたものをそれぞれ表している。
図7~
図9に示されるように、C)DAE実施あり(提案法)ではデータのばらつきが軽減されていることがわかる。
【0050】
<まとめ>
以上のように、本実施形態に係るノイズ除去付き予測装置10では、目的変数が含まれる教師データを用いて、DAEをノイズ除去モデルとして学習する。これにより、本実施形態に係るノイズ除去付き予測装置10では、目的変数との関係も考慮してノイズ除去を行うことが可能なノイズ除去モデルが得られ、その結果、このノイズ除去モデルによるノイズ除去によって予測モデルfの精度の良い予測を実現することが可能となる。
【0051】
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
【0052】
[参考文献]
参考文献1:Pascal Vincent,Hugo Larochelle,Yoshua Bengio,Pierre-Antoine Manzagol, "Extracting and Composing Robust Features with Denoising Autoencoders". 2008.
参考文献2:Georges Hebrail, Alice Berard, "Individual household electric power consumption Data Set", 2012-08-30.
【符号の説明】
【0053】
10 ノイズ除去付き予測装置
101 入力装置
102 表示装置
103 外部I/F
103a 記録媒体
104 通信I/F
105 RAM
106 ROM
107 補助記憶装置
108 プロセッサ
109 バス
201 第1のデータ取得部
202 ノイズ作成部
203 学習用データ作成部
204 学習部
205 第2のデータ取得部
206 ノイズ除去部
207 予測部
【手続補正書】
【提出日】2023-10-19
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
1つ以上の説明変数と目的変数とで構成されるデータを取得する第1のデータ取得部と、
前記データに含まれる1つ以上の説明変数のうちの少なくとも一部の説明変数の値に対してノイズを付与して学習用データを作成する学習用データ作成部と、
前記データを教師データとして、前記学習用データに含まれる1つ以上の説明変数の値と、前記目的変数と相関がある変数を表すダミー目的変数の値とを入力とするデノイジングオートエンコーダを学習する学習部と、
前記1つ以上の説明変数で構成される予測対象データを取得する第2のデータ取得部と、
前記学習後のデノイジングオートエンコーダにより前記予測対象データに含まれる1つ以上の説明変数の値からノイズを除去するノイズ除去部と、
前記ノイズ除去後の予測対象データを用いて、予測モデルにより、前記目的変数の値を予測する予測部と、
を有するノイズ除去付き予測装置。
【請求項2】
前記ダミー目的変数は、
前記1つ以上の説明変数のうちのいずれかの説明変数、又は、前記1つ以上の説明変数の値を入力として前記目的変数の値を予測するモデルの予測値を表す変数、である、請求項1に記載のノイズ除去付き予測装置。
【請求項3】
前記モデルは、物理モデル、単回帰モデル、重回帰モデル、所定の予測アルゴリズムで実現されるモデルのいずれかである、請求項2に記載のノイズ除去付き予測装置。
【請求項4】
1つ以上の説明変数と目的変数とで構成されるデータを取得する第1のデータ取得手順と、
前記データに含まれる1つ以上の説明変数のうちの少なくとも一部の説明変数の値に対してノイズを付与して学習用データを作成する学習用データ作成手順と、
前記データを教師データとして、前記学習用データに含まれる1つ以上の説明変数の値と、前記目的変数と相関がある変数を表すダミー目的変数の値とを入力とするデノイジングオートエンコーダを学習する学習手順と、
前記1つ以上の説明変数で構成される予測対象データを取得する第2のデータ取得手順と、
前記学習後のデノイジングオートエンコーダにより前記予測対象データに含まれる1つ以上の説明変数の値からノイズを除去するノイズ除去手順と、
前記ノイズ除去後の予測対象データを用いて、予測モデルにより、前記目的変数の値を予測する予測手順と、
をコンピュータが実行するノイズ除去付き予測方法。
【請求項5】
1つ以上の説明変数と目的変数とで構成されるデータを取得する第1のデータ取得手順と、
前記データに含まれる1つ以上の説明変数のうちの少なくとも一部の説明変数の値に対してノイズを付与して学習用データを作成する学習用データ作成手順と、
前記データを教師データとして、前記学習用データに含まれる1つ以上の説明変数の値と、前記目的変数と相関がある変数を表すダミー目的変数の値とを入力とするデノイジングオートエンコーダを学習する学習手順と、
前記1つ以上の説明変数で構成される予測対象データを取得する第2のデータ取得手順と、
前記学習後のデノイジングオートエンコーダにより前記予測対象データに含まれる1つ以上の説明変数の値からノイズを除去するノイズ除去手順と、
前記ノイズ除去後の予測対象データを用いて、予測モデルにより、前記目的変数の値を予測する予測手順と、
をコンピュータに実行させるプログラム。