(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2021-12-16
(45)【発行日】2022-01-14
(54)【発明の名称】複数のセンサの時系列の計測値群における欠損値を補完するプログラム、装置及び方法
(51)【国際特許分類】
G06N 3/04 20060101AFI20220106BHJP
【FI】
G06N3/04 145
G06N3/04 154
(21)【出願番号】P 2019082109
(22)【出願日】2019-04-23
【審査請求日】2021-02-16
【早期審査対象出願】
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【氏名又は名称】早原 茂樹
(72)【発明者】
【氏名】小島 亮一
(72)【発明者】
【氏名】吉原 貴仁
【審査官】多胡 滋
(56)【参考文献】
【文献】特開2019-162408(JP,A)
【文献】特開2017-207904(JP,A)
【文献】特開2008-304970(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00
(57)【特許請求の範囲】
【請求項1】
複数のセンサそれぞれから周期tm毎の計測値群を時系列に入力し、潜在表現を出力するエンコーダとしてコンピュータを機能させるプログラムであって、
前記エンコーダは、
各センサiについて、所定期間Tdにおける周期tm毎の計測値群x
iを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群x
i,jを作成する計測値群生成手段と、
各センサiについて、シフト計測値群x
i,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群x
i,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルh
i,jとを入力し、時系列後段へ隠れ層ベクトルh
i,j+1を出力する特徴抽出手段と、
各センサiについて、末端の再帰型ニューラルネットワークx
i,Jから出力された隠れ層ベクトルh
iから、正規化された確率分布の潜在表現z
iを生成する潜在表現生成エンジンと
してコンピュータを機能させることを特徴とするプログラム。
【請求項2】
前記潜在表現z
iを入力し、センサi毎に時系列の計測値群を出力するデコーダによってVAE(Variational Autoencoder)として機能させ、
前記デコーダは、
各センサiについて、前記潜在表現z
iからシフト計測値群x
i,jをサンプリング的に生成する
潜在表現サンプリング手段と、
各センサiについて、サンプリングされた前記シフト計測値群x
i,jを入力する、前記エンコーダの前記特徴抽出手段の逆処理となる特徴再生手段と、
各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群x
i,jから、所定期間Tdにおける周期tm毎の計測値群x
iを再生する計測値群再生手段と
してコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
【請求項3】
学習段階によれば、
前記エンコーダの前記潜在表現生成エンジンは、目的関数の要素として、
潜在表現z
iを標準正規分布に近づけると共に、
前記エンコーダに入力された訓練データの単位時間Thの計測値群x
iと、前記デコーダから出力された訓練データの単位時間Thの計測値群x
iとの誤差を小さくする
べく学習する
ようにコンピュータを機能させることを特徴とする請求項2に記載のプログラム。
【請求項4】
運用段階によれば、
前記エンコーダによれば、無効なセンサiについて、周期tm毎の計測値群に所定値を埋め込み、
前記デコーダによれば、無効なセンサiについて、前記計測値群再生手段から出力された所定期間Tdの計測値群x
iに補完する
ようにコンピュータを機能させることを特徴とする請求項2又は3に記載のプログラム。
【請求項5】
前記特徴抽出手段における前記再帰型ニューラルネットワーク(RNN(Recurrent Neural Network))は、GRU(Gated Recurrent Unit)又はLSTM(Long Short Term Memory)である
ようにコンピュータを機能させることを特徴とする請求項1から4のいずれか1項に記載のプログラム。
【請求項6】
前記特徴抽出手段は、
シフト計測値群x
i,j毎に、1次元畳み込みニューラルネットワーク(1D-CNN(One Dimensional - Convolutional Neural Network))を介して、前記再帰型ニューラルネットワークへ入力する
ようにコンピュータを機能させることを特徴とする請求項1から5のいずれか1項に記載のプログラム。
【請求項7】
前記特徴抽出手段における前記1次元畳み込みニューラルネットワークは、3次元フィルタで隣接3要素を畳み込む
ようにコンピュータを機能させることを特徴とする請求項6に記載のプログラム。
【請求項8】
前記特徴抽出手段における前記1次元畳み込みニューラルネットワークは、複数の1次元畳み込みニューラルネットワークを直列接続したものである
ようにコンピュータを機能させることを特徴とする請求項6又は7に記載のプログラム。
【請求項9】
前記エンコーダにおける前記潜在表現生成エンジンは、各センサiにおける前記潜在表現z
iを、3次元平均ベクトルμと3次元分散共分散行列の対角成分Σ
1によって表現する
ようにコンピュータを機能させることを特徴とする請求項1から8のいずれか1項に記載のプログラム。
【請求項10】
前記センサは、温度センサ、湿度センサ、照度センサ、動きセンサ及び/又は消費電力センサであり、
前記時系列の計測値群は、時系列マルチモーダルデータである
ようにコンピュータを機能させることを特徴とする請求項1から
9のいずれか1項に記載のプログラム。
【請求項11】
複数のセンサそれぞれから時系列の計測値群を入力し、潜在表現を出力するエンコーダを有する装置であって、
前記エンコーダは、
各センサiについて、所定期間Tdにおける周期tm毎の計測値群x
iを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群x
i,jを作成する計測値群生成手段と、
各センサiについて、シフト計測値群x
i,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群x
i,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルh
i,jとを入力し、時系列後段へ隠れ層ベクトルh
i,j+1を出力する特徴抽出手段と、
各センサiについて、末端の再帰型ニューラルネットワークx
i,Jから出力された隠れ層ベクトルh
iから、正規化された確率分布の潜在表現z
iを生成する潜在表現生成エンジンと
を有することを特徴とする装置。
【請求項12】
前記潜在表現z
iを入力し、センサi毎に時系列の計測値群を出力するデコーダによってVAEとして構成し、
前記デコーダは、
各センサiについて、前記潜在表現z
iからシフト計測値群x
i,jをサンプリング的に生成する
潜在表現サンプリング手段と、
各センサiについて、サンプリングされた前記シフト計測値群x
i,jを入力する、前記エンコーダの前記特徴抽出手段の逆処理となる特徴再生手段と、
各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群x
i,jから、所定期間Tdにおける周期tm毎の計測値群x
iを再生する計測値群再生手段と
を有することを特徴とする請求項11に記載の装置。
【請求項13】
複数のセンサそれぞれから時系列の計測値群を入力し、潜在表現を出力する装置のエンコード方法であって、
前記装置は、
各センサiについて、所定期間Tdにおける周期tm毎の計測値群x
iを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群x
i,jを作成する第1のステップと、
各センサiについて、シフト計測値群x
i,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群x
i,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルh
i,jとを入力し、時系列後段へ隠れ層ベクトルh
i,j+1を出力する第2のステップと、
各センサiについて、末端の再帰型ニューラルネットワークx
i,Jから出力された隠れ層ベクトルh
iから、正規化された確率分布の潜在表現z
iを生成する第3のステップと
を実行することを特徴とする装置のエンコード方法。
【請求項14】
請求項
13に記載の装置のエンコード方法に続いて実行され、前記潜在表現z
iを入力し、センサi毎に時系列の計測値群を出力するように、VAEとして構成した装置のデコード方法であって、
各センサiについて、前記潜在表現z
iからシフト計測値群x
i,jをサンプリング的に生成する第4のステップと、
各センサiについて、サンプリングされた前記シフト計測値群x
i,jを入力する、第2のステップの逆処理となる第5のステップと、
各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群x
i,jから、所定期間Tdにおける周期tm毎の計測値群x
iを再生する第6のステップと
してコンピュータを機能させることを特徴とする装置のデコード方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のセンサから出力された時系列の計測値群の中で、欠損値を補完する技術に関する。例えばスマートホームにおけるマルチモーダル(multi-modal)データに適する。
【背景技術】
【0002】
スマートホームとは、IoT(Internet of Things)やAI(Artificial Intelligence)の技術を用いて、住人にとってより安全・安心で快適な暮らしを実現するシステムをいう。このシステムは、住宅内に設置された複数のセンサからマルチモーダルデータを収集し、人が知覚可能な室内状態を分析する。
マルチモーダルデータには、時系列データと非時系列データとがある。時系列マルチモーダルデータとは、特徴に時間次元を持ち、周期的(例えば5分間隔)に取得された計測値群である。一方で、非時系列マルチモーダルデータは、特徴に時間次元を持たない。
時系列マルチモーダルデータとしては、例えば以下のようなものがある。
気温(触覚)、湿度(触覚)、照度(視覚)、動き(視覚)、
音声(聴覚)、映像(視覚)、消費電力
【0003】
スマートホームに設置されたセンサは、無線によってエッジコンピュータへ、逐次、その計測値を送信する。そのために、例えば以下のような場合に、計測値群からなる時系列マルチモーダルデータを収集できないという問題がある。
センサが、無線状態の劣化によってエッジコンピュータとの間で通信できない
センサが、低消費電力を維持するために、スリープ(無効状態)している
センサが、故障している
このような場合に、できる限り、時系列マルチモーダルデータにおける欠損値を補完する必要がある。
【0004】
従来、複数の計測器から定期的にデータを収集し、欠損したデータを再取得する技術がある(例えば特許文献1参照)。この技術によれば、欠損したデータの時刻値を起点として連続する所定回数分の再取得するグループを設定し、そのグループ毎に、当該計測器が保持するデータを再取得する。
【0005】
尚、非時系列マルチモーダルデータについては、深層生成モデルを用いて、画像及びテキストの欠損を高品質に補完する技術もある(例えば非特許文献1参照)。但し、この技術によれば、データの時系列変化を補完することはできない。
【先行技術文献】
【特許文献】
【0006】
【非特許文献】
【0007】
【文献】arXiv : 1801.0870, Improving Bi-directional Generation between Different Modalities with Variational Autoencoders、[online]、[平成31年4月15日検索]、インターネット<URL:https://arxiv.org/abs/1801.08702>
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、特許文献1に記載の技術によれば、データの再取得時にも通信環境が改善しなかった場合や、計測器自体がスリープ状態や故障となってる場合、結局、そのデータの欠損を補完することはできない。即ち、この技術は、センサ毎のデータを補完するに過ぎない。
【0009】
これに対し、本願の発明者らは、複数のセンサにおける時系列マルチモーダルデータの関連性の中で、一部のセンサの時系列データの欠損を補完することができないか、と考えた。
【0010】
そこで、本発明は、複数のセンサにおける時系列の計測値群同士の関連性に基づいて、一部のセンサにおける欠損値を補完するプログラム、装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明によれば、複数のセンサそれぞれから周期tm毎の計測値群を時系列に入力し、潜在表現を出力するエンコーダとしてコンピュータを機能させるプログラムであって、
エンコーダは、
各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する計測値群生成手段と、
各センサiについて、シフト計測値群xi,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群xi,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルhi,jとを入力し、時系列後段へ隠れ層ベクトルhi,j+1を出力する特徴抽出手段と、
各センサiについて、末端の再帰型ニューラルネットワークxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する潜在表現生成エンジンと
してコンピュータを機能させることを特徴とする。
【0012】
本発明のプログラムにおける他の実施形態によれば、
潜在表現ziを入力し、センサi毎に時系列の計測値群を出力するデコーダによってVAE(Variational Autoencoder)として機能させ、
デコーダは、
各センサiについて、潜在表現ziからシフト計測値群xi,jをサンプリング的に生成する潜在表現サンプリング手段と、
各センサiについて、サンプリングされたシフト計測値群xi,jを入力する、エンコーダと同一の特徴抽出手段と、
各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群xi,jから、所定期間Tdにおける周期tm毎の計測値群xiを再生する計測値群再生手段と
してコンピュータを機能させることも好ましい。
【0013】
本発明のプログラムにおける他の実施形態によれば、
学習段階によれば、
エンコーダの潜在表現生成エンジンは、目的関数の要素として、
潜在表現ziを標準正規分布に近づけると共に、
エンコーダに入力された訓練データの単位時間Thの計測値群xiと、デコーダから出力された訓練データの単位時間Thの計測値群xiとの誤差を小さくする
べく学習する
ようにコンピュータを機能させることも好ましい。
【0014】
本発明のプログラムにおける他の実施形態によれば、
運用段階によれば、
エンコーダによれば、無効なセンサiについて、周期tm毎の計測値群に所定値を埋め込み、
デコーダによれば、無効なセンサiについて、計測値群再生手段から出力された所定期間Tdの計測値群xiに補完する
ようにコンピュータを機能させることも好ましい。
【0015】
本発明のプログラムにおける他の実施形態によれば、
特徴抽出手段における再帰型ニューラルネットワーク(RNN(Recurrent Neural Network))は、GRU(Gated Recurrent Unit)又はLSTM(Long Short Term Memory)である
ようにコンピュータを機能させることも好ましい。
【0016】
本発明のプログラムにおける他の実施形態によれば、
特徴抽出手段は、
シフト計測値群xi,j毎に、1次元畳み込みニューラルネットワーク(1D-CNN(One Dimensional - Convolutional Neural Network))を介して、再帰型ニューラルネットワークへ入力する
ようにコンピュータを機能させることも好ましい。
【0017】
本発明のプログラムにおける他の実施形態によれば、
特徴抽出手段における1次元畳み込みニューラルネットワークは、3次元フィルタで隣接3要素を畳み込む
ようにコンピュータを機能させることも好ましい。
【0018】
本発明のプログラムにおける他の実施形態によれば、
特徴抽出手段における1次元畳み込みニューラルネットワークは、複数の1次元畳み込みニューラルネットワークを直列接続したものである
ようにコンピュータを機能させることも好ましい。
【0019】
本発明のプログラムにおける他の実施形態によれば、
エンコーダにおける潜在表現生成エンジンは、各センサiにおける潜在表現ziを、3次元平均ベクトルμと3次元分散共分散行列の対角成分Σ1によって表現する
ようにコンピュータを機能させることも好ましい。
【0021】
本発明のプログラムにおける他の実施形態によれば、
センサは、温度センサ、湿度センサ、照度センサ、動きセンサ及び/又は消費電力センサであり、
時系列の計測値群は、時系列マルチモーダルデータである
ようにコンピュータを機能させることも好ましい。
【0022】
本発明によれば、複数のセンサそれぞれから時系列の計測値群を入力し、潜在表現を出力するエンコーダを有する装置であって、
エンコーダは、
各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する計測値群生成手段と、
各センサiについて、シフト計測値群xi,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群xi,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルhi,jとを入力し、時系列後段へ隠れ層ベクトルhi,j+1を出力する特徴抽出手段と、
各センサiについて、末端の再帰型ニューラルネットワークxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する潜在表現生成エンジンと
を有することを特徴とする。
【0023】
本発明の装置における他の実施形態によれば、潜在表現ziを入力し、センサi毎に時系列の計測値群を出力するデコーダによってVAEとして構成し、
デコーダは、
各センサiについて、潜在表現ziからシフト計測値群xi,jをサンプリング的に生成する潜在表現サンプリング手段と、
各センサiについて、サンプリングされたシフト計測値群xi,jを入力する、エンコーダと同一の特徴抽出手段と、
各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群xi,jから、所定期間Tdにおける周期tm毎の計測値群xiを再生する計測値群再生手段と
を有することも好ましい。
【0024】
本発明によれば、複数のセンサそれぞれから時系列の計測値群を入力し、潜在表現を出力する装置のエンコード方法であって、
装置は、
各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する第1のステップと、
各センサiについて、シフト計測値群xi,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群xi,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルhi,jとを入力し、時系列後段へ隠れ層ベクトルhi,j+1を出力する第2のステップと、
各センサiについて、末端の再帰型ニューラルネットワークxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する第3のステップと
を実行することを特徴とする。
【0025】
前述の本発明の装置のエンコード方法に続いて実行され、潜在表現ziを入力し、センサi毎に時系列の計測値群を出力するように、VAEとして構成した装置のデコード方法であって、
各センサiについて、潜在表現ziからシフト計測値群xi,jをサンプリング的に生成する第4のステップと、
各センサiについて、サンプリングされたシフト計測値群xi,jを入力する、第2のステップと同一処理の第5のステップと、
各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群xi,jから、所定期間Tdにおける周期tm毎の計測値群xiを再生する第6のステップと
してコンピュータを機能させることを特徴とする。
【発明の効果】
【0026】
本発明のプログラム、装置及び方法によれば、複数のセンサにおける時系列の計測値群同士の関連性に基づいて、一部のセンサにおける欠損値を補完することができる。
【図面の簡単な説明】
【0027】
【
図1】本発明のオートエンコーダにおける学習段階の機能構成図である。
【
図2】本発明におけるエンコーダの機能説明図である。
【
図3】本発明における特徴抽出部のGRUの機能構成図である。
【
図4】本発明のエンコーダにおける特徴抽出部の機能構成図である。
【
図5】本発明の特徴抽出部における畳み込みニューラルネットワークの数値例である。
【
図6】本発明のオートエンコーダにおける運用段階の機能構成図である。
【
図7】本発明のデコーダにおける特徴再生部の機能構成図である。
【
図8】本発明におけるセンサの計測値群の補完を表す説明図である。
【発明を実施するための形態】
【0028】
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
【0029】
本発明は、複数のセンサからの時系列データの特徴を獲得するべく、深層学習モデルのオートエンコーダ(VAE(Variational Autoencoder))として構成したものである。
スマートホームのセンサとしては、例えば温度センサ、湿度センサ、照度センサ、動きセンサ、消費電力センサがある。これらセンサは、周期的に計測値群を出力し続ける。そして、これら計測値群は、時系列マルチモーダルデータとして収集される。
これら時系列マルチモーダルデータは、学習段階では訓練データとして、運用段階では運用データとして、オートエンコーダに入力される。
【0030】
<<学習段階>>
図1は、本発明のオートエンコーダにおける学習段階の機能構成図である。
【0031】
図1によれば、オートエンコーダ1は、エンコーダ11と、デコーダ12と、学習モデル構築部13とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
【0032】
<エンコーダ11>
エンコーダ11は、複数のセンサそれぞれから周期tm毎の計測値群(マルチモーダルデータ)を時系列に入力し、潜在表現を出力する。この潜在表現とは、多次元正規分布と仮定したものである。
【0033】
各センサiについて、例えば以下のような、所定期間Tdにおける周期tm毎の計測値群xiが入力される。
センサi :気温センサ、湿度センサ、照度センサ、動きセンサ、電力センサ
所定期間Td :1日(24時間)
周期tm :5分
この場合、計測値群xiは、5分周期で288次元ベクトル(1日分)となる。
【0034】
図1によれば、5つのセンサから、以下のような時系列マルチモーダルデータx=(x1, x2, x3, x4, x5)が入力されている。
気温 x1 = (22.6, 22.4, 22.3, 22.3, ..., 24.4, 24.5, 23.4)
湿度 x2 = (62.0, 62.4, 63.3, 62.1, ..., 52.6, 52.5, 52.5)
照度 x3 = (18, 20, 21, 9, ..., 325, 345, 338)
動き x4 = (0, 0.4, 0.2, 1.0, ..., 0.4, 0.2, 0)
消費電力 x5 = (43, 40, 56, 22, ..., 58, 78, 77)
【0035】
尚、「動き」センサについては、例えば以下の動きの1分値を、5分毎に平均したものであってもよい。
動きを検知した場合 :1
動きを検知しない場合:0
例えば、5分中3分で動きを検知していた場合、0.6 (=3/5)となる。
また、5分中5分で動きを検知していた場合、1.0 (=5/5))となる。
【0036】
図1によれば、エンコーダ11は、計測値群生成部111と、特徴抽出部112と、潜在表現生成エンジン113とを有する。
【0037】
[計測値群生成部111]
計測値群生成部111は、各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する。
【0038】
図2は、本発明におけるエンコーダの機能説明図である。
【0039】
図2によれば、温度センサにおける時系列の気温の計測値群x1を表す。
x1 = (22.6, 22.4, 22.3, 22.3, ..., 24.4, 24.5, 23.4)
x1(1) =00:00の気温22.6度
x1(2) =00:05の気温22.4度
x1(3) =00:10の気温22.3度
・・・・・
x1(287)=23:50の気温24.5度
x1(288)=23:55の気温23.4度
【0040】
ここから更に、12要素分(=5分周期で1時間分)の12次元ベクトルを生成する。そして、1要素ずつシフトさせて複数(j=277)のシフト計測値群xi,jを作成する。
x1,1,1=(22.6, 22.4, 22.3, 22.3, 22.2, 22.5, 22.3, 22.5, 22.5,
22.5, 23.5, 23.0)
x1,2,1=( 22.4, 22.3, 22.3, 22.2, 22.5, 22.3, 22.5, 22.5,
22.5, 23.5, 23.0, 22.9)
x1,3,1=( 22.3, 22.3, 22.2, 22.5, 22.3, 22.5, 22.5,
22.5, 23.5, 23.0, 22.9, 22.8)
・・・・・
x1,277,1=(
24.5, 24.6, 24.5,
24.4, 24.4, 24.7, 24.3, 24.7, 24.6, 24.4, 24.5, 23.4)
x1,1,1は、0:00~0:55の1時間(12要素分)の12次元ベクトルを表す。
x1,277,1は、23:00~23:55の1時間(12要素分)の12次元ベクトルを表す。
【0041】
[特徴抽出部112]
特徴抽出部112は、各センサiについて、シフト計測値群xi,j毎に、時系列直列に接続された複数のRNN(Recurrent Neural Network)(再帰型ニューラルネットワーク)を有する。
RNNとは、数値データにおける時系列パターンを認識するニューラルネットワークである。RNNは、内部に状態を持ち、各時点における入力値及び状態に基づいて、次の状態に遷移させることができる。
【0042】
図2によれば、特徴抽出部112は、シフト計測値群x
i,j毎に、RNNを有する。そして、各RNNは、各シフト計測値群x
i,jと、時系列前段のRNNの隠れ層ベクトルh
i,jとを入力し、時系列後段へ隠れ層ベクトルh
i,j+1を出力する。そのために、
図2によれば、RNN1,1~RNN1,277まで、277個のRNNが直列に接続されたものとなる。
【0043】
特徴抽出部112のRNNとしては、例えばGRU(Gated Recurrent Unit)又はLSTM(Long Short Term Memory)であってもよい。
【0044】
図3は、本発明における特徴抽出部のGRUの機能構成図である。
【0045】
図3によれば、GRUは、入力ゲートと忘却ゲートを「更新ゲート」として、1つのゲートに統合したものである。LSTMと同様に、忘却・更新ゲートを導入することによって、長いステップ前の計測値の特徴の記憶を維持しやすくする。これは、各時間ステップ間を迂回するショートカットパスが、効率的に生成されることに基づく。これによって、学習中に、誤差を容易に逆伝播することができる。
このように、GRUは、時系列データについて、誤差が浅い層に伝わらない勾配消失の問題を軽減することができる。
【0046】
図4は、本発明のエンコーダにおける特徴抽出部の機能構成図である。
【0047】
図4によれば、特徴抽出部112は、シフト計測値群x
i,j毎に、1次元畳み込みニューラルネットワーク(1D-CNN(One Dimensional - Convolutional Neural Network))を介して、RNNへ入力する。1D-CNNは、特徴抽出フィルタをして機能するオプション的なものであって、必須の構成要素とするものではない。
CNNとは、複数のユニットを持つ層が入力段から出力段へ向けて一方向に連結されており、出力層側のユニットが、隣接する入力層側の特定のユニットに結合された畳み込み層を有する順伝播型ネットワークをいう。
【0048】
特徴抽出部112における1D-CNNは、3次元フィルタで隣接3要素を畳み込むものであってもよい。これは、複数の1D-CNNを直列接続したものである。
【0049】
図5は、本発明の特徴抽出部における畳み込みニューラルネットワークの数値例である。
【0050】
図5によれば、例えば
図2で生成された時系列の計測値群x1,1,1が、CNNへ入力されている。
x1,1,1=(22.6, 22.4, 22.3, 22.3, 22.2, 22.5, 22.3, 22.5, 22.5,
22.5, 23.5, 23.0)
1D-CNNは、3次元フィルタ(1/3, 1/3, 1/3)で畳み込む。ここでの畳み込みは、左から順に隣接する3要素に1/3を掛けて足し合わせる。12次元を維持するために足りない要素は、隣接要素でパディングする。
【0051】
具体的には、1層目の1D-CNNに、x1,1,1を入力した場合、以下のようになる。
x1,1,2=(22.6*1/3+22.6*1/3+22.4*1/3, 22.6*1/3+22.4*1/3+22.3*1/3,
22.4*1/3+22.3*1/3+22.3*1/3, 22.3*1/3+22.3*1/3+22.2*1/3,
22.3*1/3+22.2*1/3+22.5*1/3, 22.2*1/3+22.5*1/3+22.3*1/3,
22.5*1/3+22.3*1/3+22.5*1/3, 22.3*1/3+22.5*1/3+22.5*1/3,
22.5*1/3+22.5*1/3+22.5*1/3, 22.5*1/3+22.5*1/3+23.5*1/3,
22.5*1/3+23.5*1/3+23.0*1/3, 23.5*1/3+23.0*1/3+23.0*1/3)
=(22.5, 22.4, 22.3, 22.3, 22.3, 22.3, 22.4, 22.4, 22.5,
22.8, 23.0, 23.2)
【0052】
次に、2層目の1D-CNNに、x1,1,2を入力した場合、1層目と同様の畳み込みによって、以下のように出力する。
x1,1,3=(22.5, 22.4, 22.3, 22.3, 22.3, 22.3, 22.4, 22.4, 22.6,
22.8, 23.0, 23.1)
【0053】
2層目の1D-CNNから出力されたx1,1,3は、GRU1,1へ入力される。
ここで、GRU1,1は、以下のように、x1の時系列的特徴を保持している10次元隠れ層h1,1ベクトルを出力する。
h1,1=(19.7, 19.4, 21.0, 20.8, 20.0, 20.6, 21.4, 20.3, 21.0, 19.3)
【0054】
以上の処理を、x1,2,1、x1,3,1、・・・、x1,277,1ついて同様に実行する。ここで、過去の時系列的特徴を伝えるために、2つ目以降のGRUへの入力は、直前の隠れ層の出力と1D-CNNの出力とを結合したものとなる。
【0055】
[潜在表現生成エンジン113]
潜在表現生成エンジン113は、各センサiについて、末端のRNNxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する。
潜在表現ziは、マルチモーダルデータ(各センサiの時系列の計測値群x)に共通して潜在的に存在すると仮定される表現を意味する。
【0056】
各センサiにおける潜在表現z
iは、多次元正規分布の平均ベクトルμと、分散共分散行列の対角成分Σ
1とによって表現される。
例えば、潜在表現zが3次元正規分布の場合、最後の隠れ層h1から3次元平均ベクトルμ1と、3次元分散共分散行列の対角成分Σ1とを、以下のように計算する。
μ1=(-0.17, -0.02, 0.32)
【数1】
対角成分Σ
1=(0.3, 0.07, 0.12)
z1 = μ1+e*Σ1 = (-0.32, 0.04, 0.27)
e~N(0,1)となる標準正規分布
z~N(μ, diag(Σ)) diag:対角行列
【0057】
そして、潜在表現生成エンジン113は、各センサiについて、例えば以下のような潜在表現ziを、デコーダ12へ出力する。
μ=(μ1, μ2, μ3, μ4, μ5)
=((-0.17, -0.02, 0.32), (0.1, 0.67, -0.12), (-0.21, 0.14, -0.11),
(0.22, -0.11, 0.18), (-0.31, 0.22, -0.12))
Σ=(Σ1, Σ2, Σ3, Σ4, Σ5)
=((0.3, 0.07, 0.12), (0.39, 0.2, 0.09), (0.4, 0.32, 0.34),
(0.15, 0.23, 0.43), (0.44, 0.22, 0.21))
z=(z1, z2, z3, z4, z5)
=((-0.32, 0.04, 0.27), (0.01, 0.12, -0.07), (0.06, -0.02, -0.12),
(0.21, 0.41, 0.33), (0.1, -0.31, -0.11))
【0058】
<デコーダ12>
デコーダ12は、潜在表現ziを入力し、センサi毎に時系列の計測値群を出力する。
デコーダ12は、潜在表現サンプリング部121と、特徴再生部122と、計測値群再生部123とを有する。
【0059】
[潜在表現サンプリング部121]
潜在表現サンプリング部121は、各センサiについて、潜在表現ziからシフト計測値群xi,jをサンプリング的に生成する。具体的には、以下のようにサンプリングされた計測値群xi,jを、センサi毎に、277個のGRUそれぞれに入力する。
x1,1,1~x1,277,1
x2,1,1~x2,277,1
x3,1,1~x3,277,1
x4,1,1~x4,277,1
x5,1,1~x5,277,1
【0060】
[特徴再生部122]
特徴再生部122は、エンコーダ11の特徴抽出部112の逆処理となるものであって、各センサiについて、サンプリングされたシフト計測値群xi,jを入力する。
そして、
【0061】
[計測値群再生部123]
計測値群再生部123は、各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群xi,jから、所定期間Tdにおける周期tm毎の計測値群xiを再生する。
具体的には、5モーダルとして、以下のように計測値群が再生される。
y=(y1, y2, y3, y4, y5)
=((22.3, 23.4, 22.0, 20.3, ..., 24.5, 24.4, 23.0),
(60, 61.3, 62.9, 62.3, ..., 51.9, 52.5, 52.5),
(10, 21, 21, 14, ..., 320, 320, 330),
(0, 0.2, 0.2, 1.0, ..., 0.6, 0.6, 0.6),
(40, 41, 42, 50, ..., 54, 70, 80))
【0062】
<学習モデル構築部13>
学習モデル構築部13は、エンコーダ11の潜在表現生成エンジン113を、以下のように目的関数を最大化する。
(1)潜在表現ziを標準正規分布に近づける
(2)エンコーダに入力された訓練データの単位時間Thの計測値群xiと、デコーダから出力された訓練データの単位時間Thの計測値群xiとの誤差を小さくする。
本発明の場合、潜在表現zからどれだけ尤もらしいxが生成されたかを、対数尤度の期待値E[logp(x|z)]で測る。そして、期待値Eが大きいほど好ましい。
【0063】
(1)潜在表現zは、標準正規分布に近づくほど小さくなる、以下のようなKLダイバージェンスである。
DKL(N(μ,Σ) || N(0,1))
最大化問題を考えるために、負にして5モーダル分を足し合わせると、以下のようになる。
L1=-(DKL(N(μ1,Σ1) || N(0,1))+DKL(N(μ2,Σ2) || N(0,1))
+DKL (N(μ3,Σ3) || N(0,1))+DKL(N(μ4,Σ4) || N(0,1))
+DKL(N(μ5,Σ5) || N(0,1)))
【0064】
(2)再構築誤差についても、5モーダル分を考慮すると、以下のようになる。
L2=E[logp(x1|z)]+E[logp(x2|z)]+E[logp(x3|z)]
+E[logp(x4|z)]+E[logp(x5|z)]
【0065】
学習モデル構築部13における学習は、L=L1+L2の最大化問題を誤差逆伝搬で解くことに相当する。その結果、潜在表現zのパラメタμ、Σを算出することができる。
【0066】
KLダイバージェンスとは、2つの確率分布PとQの差異を測る尺度である。P、Q を離散確率分布とするとき、PのQに対するカルバック・ライブラー情報量は、以下のように定義される。
DKL(P||Q)=∫∞
-∞P(x)log(p(x)/Q(x))dx
P(i)、Q(i):確率分布P、Qに従って選ばれた値がiの時の確率
P~N(μ,Σ)、Q~N(0,1)の場合、確率分布Pと標準正規分布の差異を表し、
Pが標準正規分布に近いほど小さくなる。
【0067】
前述のμ、Σについては、以下のように、カルバック・ライブラー情報量が算出される。
μ=(-0.17, -0.02, 0.32)
【数2】
D
KL(P||Q)=-1/2 Σ
j=1
3(1+log(diag(Σ)
j
2)-μ
j
2+diag(Σ)
j
2)
=4.49
【0068】
エンコーダ11及びデコーダ12は、潜在表現から、エンコーダに入力された時系列マルチモーダルデータを再生するように学習する。
【0069】
<<運用段階>>
図6は、本発明のオートエンコーダにおける運用段階の機能構成図である。
【0070】
運用段階によれば、以下のように機能する。
エンコーダ11は、無効なセンサiについて、周期tm毎の計測値群に所定値を埋め込む。
デコーダ12は、無効なセンサiについて、計測値群再生手段から出力された所定期間Tdの計測値群xiに補完する。
【0071】
また、エンコーダ11及びデコーダ12における運用段階の処理は、非常に軽いものである。そのために、エンコーダ11に5分計測値が入力される毎に、デコーダ12から補完された計測値が出力される。
【0072】
図7は、本発明のデコーダにおける特徴再生部の機能構成図である。
【0073】
図7によれば、デコーダ12の特徴再生部122は、前述したエンコーダ11の特徴抽出部112の逆処理となる。
特徴再生部122は、各センサiについて、サンプリングされた計測値群x
i,j,1を、時系列直列に接続された複数のRNN(例えばGRU)へ入力する。
そして、各RNNは、その出力計測値群を、それぞれの1D-CNNへ出力する。尚、1D-CNNは、特徴抽出フィルタをして機能するオプション的なものであって、必須の構成要素とするものではない。但し、特徴再生部122における1D-CNNは、特徴抽出部112と同じ畳み込みを実行する。
【0074】
図8は、本発明におけるセンサの計測値群の補完を表す説明図である。
【0075】
図8(a)によれば、エンコーダ11に、以下のような時系列モーダルデータが入力されている。
x1=(20.1, 20.0, 20.0, 20.1, ・・・, 20.1, 20.1, 20.1),
x2=(63, 64, 64, 68, ・・・, 72, 72, 73)
x3=(-, -, -, -, ・・・, -, -, -)
x4=(-, -, -, -, ・・・, -, -, -)
x5=(32, 32, 34, 54, ・・・, 53, 56, 62)
ここで、温度、湿度、消費電力は計測値が入力されているが、照度及び動きについて計測値が欠損している。このとき、エンコーダ11の計測値群生成部111は、欠損しているマルチモーダルデータの要素を0で埋める。そして、学習済みの特徴抽出部112へ入力する。
【0076】
例えば、スマートホームのシステムとして、家族の外出時を、照度センサ及び動きセンサによって観測しているとする。その場合、照度センサ300ルクス以上で、且つ、動きセンサ0.6以上である、家族が帰宅済みであると判断するとする。
ここで、
図7(a)によれば、照度センサ及び動きセンサにおける故障等の障害によって、計測値が欠損している。そのために、家族の帰宅も判断できない。
【0077】
これに対し、
図8(b)によれば、本発明のデコーダ12から、補完された時系列モーダルデータが出力されている。
y3=(19, 20, 20, 340, ・・・, 335, 340, 320)
y4=(0, 0, 0, 0.6, ・・・, 1, 1, 1)
このように、欠損していた照度及び動きの計測値が、補完される。
【0078】
本発明によれば、温度・湿度・消費電力の時系列マルチモーダルデータから、照度・動きの時系列モーダルデータが補完されている。
これによって、照度センサ及び動きセンサにおける故障等の障害が発生し、計測値が欠損していても、直ぐに家族の帰宅を判断することができる。
【0079】
以上、詳細に説明したように、本発明のプログラム、装置及び方法によれば、複数のセンサにおける時系列の計測値群同士の関連性に基づいて、一部のセンサにおける欠損値を補完することができる。
【0080】
本発明によれば、1つのセンサにける過去の計測値を単に用いるよりも、他のセンサにおける過去の時系列的特徴を用いるために、高い精度で計測値を補完することができる。即ち、欠損していない他の時系列モーダルデータから、欠損した時系列モーダルデータを補完することができる。
特に、欠損した時系列モーダルデータを、改めて再取得する必要もない。時系列マルチモーダルデータの欠損値の補完は、以下のような様々な障害に適用することができる。
・スマートホーム設置のセンサ故障、
・センサ通信先サーバの故障
・電子レンジ使用による電波干渉での無線通信エラー
・センサとサーバ間の通信エラー
また、本発明によれば、モーダル数を増加させることもでき、また、シミュレータとして新たにモーダルデータを生成することもできる。
【0081】
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0082】
11 エンコーダ
111 計測値群生成部
112 特徴抽出部
113 潜在表現生成エンジン
12 デコーダ
121 潜在表現サンプリング部
122 特徴再生部
123 計測値群再生部
13 学習モデル構築部