(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022155980
(43)【公開日】2022-10-14
(54)【発明の名称】時系列データ処理装置
(51)【国際特許分類】
G06N 3/04 20060101AFI20221006BHJP
【FI】
G06N3/04 190
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2021059456
(22)【出願日】2021-03-31
【国等の委託研究の成果に係る記載事項】(出願人による申告)2018年度、国立研究開発法人新エネルギー・産業技術総合開発機構「高効率・高速処理を可能とするAIチップ・次世代コンピューティングの技術開発 次世代コンピューティング技術の開発」委託研究、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】521136068
【氏名又は名称】合同会社リトルウイング
(74)【代理人】
【識別番号】100137338
【弁理士】
【氏名又は名称】辻田 朋子
(72)【発明者】
【氏名】菅 真樹
(57)【要約】 (修正有)
【課題】一層の高速化及び省消費電力を図る時系列データ処理装置及び方法を提供する。
【解決手段】方法は、分割時系列データが外れ値を含むとき、外れ値を除去した後に分類識別子を付与し、外れ値の実データ及び外れ値の時間情報を送出し、分類識別子と分割時系列データの発生源情報及び時間情報と外れ値の実データと外れ値の時間情報との対応関係を格納部に保存するための第1格納処理を遂行し、複数の分割時系列データの実データを用いてリザバーネットワークの学習処理を遂行し、学習処理により得られた出力層についての学習済重み情報と、分割時系列データの実データに基づいて得られた分割時系列データ毎の初期値と、を分類識別子に関係付けて格納部に保存するための第2格納処理を遂行し、要求に応じて、分類識別子と学習済重み情報と分割時系列データ毎の初期値とに基づいて時系列データを推論で生成し、時系列データに外れ値を反映して出力する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
バッファ領域に一時的に蓄積されている時系列データを取得して時間の流れに沿って区分する分割部と;
前記分割部により区分された複数の分割時系列データについて分割時系列データ毎に分類識別子を付与し、
付与した前記分類識別子と、分割時系列データの発生源情報と、分割時系列データの時間情報とを送出し、
前記分割時系列データが外れ値を含むときは、前記外れ値を除去した後に前記分類識別子を付与し、前記外れ値の実データ及び前記外れ値の時間情報を更に送出する分類部と;
前記分類部によりそれぞれ送出された前記分類識別子と、前記分割時系列データの発生源情報と、前記分割時系列データの時間情報と、前記外れ値の実データと、前記外れ値の時間情報との対応関係を少なくとも1つの格納部に保存するための第1格納処理を遂行し、
前記分類部により送出される前記複数の分割時系列データの実データを用いて、入力層、リザバー層及び出力層を含むリザバーネットワークの学習処理を遂行し、
前記学習処理により得られた前記出力層についての学習済重み情報と、前記分割時系列データの実データに基づいて得られた分割時系列データ毎の初期値とを前記分類識別子に関係付けて前記格納部に保存するための第2格納処理を更に遂行する第1の処理部と;
要求に応じて、前記格納部に保存されている前記分類識別子と前記学習済重み情報と前記分割時系列データ毎の初期値とに基づいて前記時系列データを推論で生成し、生成した前記時系列データに前記外れ値の実データと前記外れ値の時間情報とにより前記外れ値を反映して出力する第2の処理部と;
を備える時系列データ処理装置。
【請求項2】
前記リザバーネットワークにおける前記リザバー層が物理デバイスにより構成される物理リザバー層であるとき、
前記第1の処理部は、前記第2格納処理において、リザバー演算器の種類を特定する情報を前記分類識別子に関係付けて前記格納部に更に保存し、
前記第2の処理部は、前記リザバー演算器の種類を特定する情報を更に参照して前記時系列データを推論で生成する、
請求項1記載の時系列データ処理装置。
【請求項3】
前記分割部は、取得した前記時系列データを予め定めた時間毎にまたはセグメンテーション処理により区分する、
請求項1または2記載の時系列データ処理装置。
【請求項4】
前記要求は前記分割時系列データの発生源情報及び前記分割時系列データの時間情報を特定する情報を含む、
請求項1、2または3記載の時系列データ処理装置。
【請求項5】
バッファ領域に一時的に蓄積されている時系列データを取得して時間の流れに沿って区分する分割ステップと;
前記分割ステップにより区分された複数の分割時系列データについて分割時系列データ毎に分類識別子を付与し、
付与した前記分類識別子と、分割時系列データの発生源情報と、分割時系列データの時間情報とを送出し、
前記分割時系列データが外れ値を含むときは、前記外れ値を除去した後に前記分類識別子を付与し、前記外れ値の実データ及び前記外れ値の時間情報を更に送出する分類ステップと;
前記分類ステップによりそれぞれ送出された前記分類識別子と、前記分割時系列データの発生源情報と、前記分割時系列データの時間情報と、前記外れ値の実データと、前記外れ値の時間情報との対応関係を少なくとも1つの格納部に保存するための第1格納処理を遂行し、
前記分類ステップにより送出される前記複数の分割時系列データの実データを用いて、入力層、リザバー層及び出力層を含むリザバーネットワークの学習処理を遂行し、
前記学習処理により得られた前記出力層についての学習済重み情報と、前記分割時系列データの実データに基づいて得られた分割時系列データ毎の初期値とを前記分類識別子に関係付けて前記格納部に保存するための第2格納処理を更に遂行する第1の処理ステップと;
要求に応じて、前記格納部に保存されている前記分類識別子と前記学習済重み情報と前記分割時系列データ毎の初期値とに基づいて前記時系列データを推論で生成し、生成した前記時系列データに前記外れ値の実データと前記外れ値の時間情報とにより前記外れ値を反映して出力する第2の処理ステップと;
を備える時系列データ処理方法。
【請求項6】
バッファ領域に一時的に蓄積されている時系列データを取得して時間の流れに沿って区分する分割ステップと;
前記分割ステップにより区分された複数の分割時系列データについて分割時系列データ毎に分類識別子を付与し、
付与した前記分類識別子と、分割時系列データの発生源情報と、分割時系列データの時間情報とを送出し、
前記分割時系列データが外れ値を含むときは、前記外れ値を除去した後に前記分類識別子を付与し、前記外れ値の実データ及び前記外れ値の時間情報を更に送出する分類ステップと;
前記分類ステップによりそれぞれ送出された前記分類識別子と、前記分割時系列データの発生源情報と、前記分割時系列データの時間情報と、前記外れ値の実データと、前記外れ値の時間情報との対応関係を少なくとも1つの格納部に保存するための第1格納処理を遂行し、
前記分類ステップにより送出される前記複数の分割時系列データの実データを用いて、入力層、リザバー層及び出力層を含むリザバーネットワークの学習処理を遂行し、
前記学習処理により得られた前記出力層についての学習済重み情報と、前記分割時系列データの実データに基づいて得られた分割時系列データ毎の初期値とを前記分類識別子に関係付けて前記格納部に保存するための第2格納処理を更に遂行する第1の処理ステップと;
要求に応じて、前記格納部に保存されている前記分類識別子と前記学習済重み情報と前記分割時系列データ毎の初期値とに基づいて前記時系列データを推論で生成し、生成した前記時系列データに前記外れ値の実データと前記外れ値の時間情報とにより前記外れ値を反映して出力する第2の処理ステップと;
をコンピュータに実行させる時系列データ処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、時系列データ処理装置に関し、更には、時系列データ処理方法及び時系列データ処理プログラムに関する。
【背景技術】
【0002】
近年、時系列データベース(time series database)に関する研究開発が推進されている。時系列データベースは、特定の時間毎に取得した一連の値である時系列データの処理及び格納(保存)に特化したデータベースである。時系列データは、統計学や信号処理で時間経過に従って計測されるデータ列であり、時間情報(タイムスタンプ)を有する。
【0003】
大量のデータを処理及び格納する必要がある時系列データベースにおいては、時系列データの符号化手法(例えば、double-delta-encoding、XOR encoding)や、メモリもしくはストレージの使用法などのアーキテクチャを工夫することにより、ストレージ容量の節約や、データ解析時に使用するメモリ量の削減などを図っている。
【0004】
しかし、上述したような時系列データの符号化手法を適用し、データを圧縮して格納する方法では、圧縮効率には限界があるため、データの増加に比例して記憶領域を必要とすることは変わらない。
【0005】
上述したような時系列データベースに代替可能なリザバーコンピューティング(Reservoir Computing)技術を用いて時系列データを処理するニューラルネットワーク系情報処理装置の一例が、例えば、特許文献1において提案されている。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかし、上記特許文献1においては、リザバーコンピューティング技術との連携により、ある程度の精度の大まかな時系列データを推論で生成して出力する時系列データ処理については開示されていない。
【0008】
課題は、リザバーコンピューティング技術との連携により、処理の一層の高速化及び省消費電力を図るために、ある程度の精度の大まかな時系列データを推論で生成して出力する時系列データ処理技術を提供することにある。
【課題を解決するための手段】
【0009】
上記課題を解決するために、一態様の時系列データ処理装置は、バッファ領域に一時的に蓄積されている時系列データを取得して時間の流れに沿って区分する分割部と;前記分割部により区分された複数の分割時系列データについて分割時系列データ毎に分類識別子を付与し、付与した前記分類識別子と、分割時系列データの発生源情報と、分割時系列データの時間情報とを送出し、前記分割時系列データが外れ値を含むときは、前記外れ値を除去した後に前記分類識別子を付与し、前記外れ値の実データ及び前記外れ値の時間情報を更に送出する分類部と;前記分類部によりそれぞれ送出された前記分類識別子と、前記分割時系列データの発生源情報と、前記分割時系列データの時間情報と、前記外れ値の実データと、前記外れ値の時間情報との対応関係を少なくとも1つの格納部に保存するための第1格納処理を遂行し、前記分類部により送出される前記複数の分割時系列データの実データを用いて、入力層、リザバー層及び出力層を含むリザバーネットワークの学習処理を遂行し、前記学習処理により得られた前記出力層についての学習済重み情報と、前記分割時系列データの実データに基づいて得られた分割時系列データ毎の初期値とを前記分類識別子に関係付けて前記格納部に保存するための第2格納処理を更に遂行する第1の処理部と;要求に応じて、前記格納部に保存されている前記分類識別子と前記学習済重み情報と前記分割時系列データ毎の初期値とに基づいて前記時系列データを推論で生成し、生成した前記時系列データに前記外れ値の実データと前記外れ値の時間情報とにより前記外れ値を反映して出力する第2の処理部と;を備える。
【0010】
一態様において、前記リザバーネットワークにおける前記リザバー層が物理デバイスにより構成される物理リザバー層であるとき、前記第1の処理部は、前記第2格納処理において、リザバー演算器の種類を特定する情報を前記分類識別子に関係付けて前記格納部に更に保存し、前記第2の処理部は、前記リザバー演算器の種類を特定する情報を更に参照して前記時系列データを推論で生成する。
【0011】
一態様において、前記分割部は、取得した前記時系列データを予め定めた時間毎にまたはセグメンテーション処理により区分する。
【0012】
一態様において、前記要求は前記分割時系列データの発生源情報及び前記分割時系列データの時間情報を特定する情報を含む。
【0013】
他の態様の時系列データ処理方法は、バッファ領域に一時的に蓄積されている時系列データを取得して時間の流れに沿って区分する分割ステップと;前記分割ステップにより区分された複数の分割時系列データについて分割時系列データ毎に分類識別子を付与し、付与した前記分類識別子と、分割時系列データの発生源情報と、分割時系列データの時間情報とを送出し、前記分割時系列データが外れ値を含むときは、前記外れ値を除去した後に前記分類識別子を付与し、前記外れ値の実データ及び前記外れ値の時間情報を更に送出する分類ステップと;前記分類ステップによりそれぞれ送出された前記分類識別子と、前記分割時系列データの発生源情報と、前記分割時系列データの時間情報と、前記外れ値の実データと、前記外れ値の時間情報との対応関係を少なくとも1つの格納部に保存するための第1格納処理を遂行し、前記分類ステップにより送出される前記複数の分割時系列データの実データを用いて、入力層、リザバー層及び出力層を含むリザバーネットワークの学習処理を遂行し、前記学習処理により得られた前記出力層についての学習済重み情報と、前記分割時系列データの実データに基づいて得られた分割時系列データ毎の初期値とを前記分類識別子に関係付けて前記格納部に保存するための第2格納処理を更に遂行する第1の処理ステップと;要求に応じて、前記格納部に保存されている前記分類識別子と前記学習済重み情報と前記分割時系列データ毎の初期値とに基づいて前記時系列データを推論で生成し、生成した前記時系列データに前記外れ値の実データと前記外れ値の時間情報とにより前記外れ値を反映して出力する第2の処理ステップと;を備える。
【0014】
更に他の態様においては、時系列データ処理プログラムとして実施可能である。
【発明の効果】
【0015】
開示した技術によれば、リザバーコンピューティング技術と連携し、ある程度の精度の大まかな時系列データを推論で生成して出力することにより、処理の一層の高速化及び省消費電力を図れる時系列データ処理技術を提供することができる。
【0016】
他の課題、特徴及び利点は、図面及び特許請求の範囲とともに取り上げられる際に、以下に記載される発明を実施するための形態を読むことにより明らかになるであろう。
【図面の簡単な説明】
【0017】
【
図1】一実施の形態の時系列データ処理装置の構成を示すブロック図。
【
図2】一実施の形態における分割時系列データを説明するための図。
【
図3】一実施の形態における分割時系列データを説明するための図。
【
図4】一実施の形態における外れ値を説明するための図。
【
図5】一実施の形態におけるリザバーネットワークを説明するための図。
【
図6】一実施の形態におけるメタデータ格納部を説明するための図。
【
図7】一実施の形態における時系列データ処理を説明するための図。
【
図8】一実施の形態における時系列データ処理を説明するための図。
【発明を実施するための形態】
【0018】
以下、添付図面を参照して、さらに詳細に説明する。図面には好ましい実施形態が示されている。しかし、多くの異なる形態で実施されることが可能であり、本明細書に記載される実施形態に限定されない。
【0019】
[時系列データ処理装置]
一実施の形態における時系列データ処理装置1は、リザバーコンピューティング技術と連携し、ある程度の精度の大まかな時系列データを推論で生成して出力することにより、処理の一層の高速化及び省消費電力を図れる時系列データ処理技術を提供する装置である。
【0020】
一実施の形態における時系列データ処理装置1は、
図1に例示するように、機能構成要素を備えている。つまり、時系列データ処理装置1は、後に詳述する機能構成要素として、時系列データ受信部11、時系列データ処理部12、時系列データ格納部13、時系列データ分割部14、時系列データ分類部15、機械学習部16、メタデータ処理部17、メタデータ格納部18、重み処理部19、重み格納部20、外れ値処理部21、及び外れ値格納部22を含む。時系列データ処理装置1は、アクセス受付部23、重み取得部24、及び推論部25を更に含む。
【0021】
また、この時系列データ処理装置1は、情報処理装置として機能するパーソナルコンピュータなどと同様に通常のハードウェア構成要素を備えている。つまり、時系列データ処理装置1は、ハードウェア構成要素として、プロセッサとしてのCPU(Central Processing Unit)と、作業用メモリとしてのRAM(Random Access Memory)と、立ち上げのためのブートプログラムを格納したROM(Read Only Memory)とを含む。
【0022】
時系列データ処理装置1は、OS(Operating System)、アプリケーションプログラム、及び各種情報(データを含む)を書換え可能に格納する不揮発性メモリと、通信制御部と、通信インタフェース部とを更に含む。
【0023】
時系列データ処理装置1は、必要に応じて、表示制御部と、表示部と、情報入力・指定部などとを更に含んでもよい。なお、これらのハードウェア構成要素は、当業者が容易に理解でき、実施可能であるので、ここでは図示を省略している。
【0024】
一例であるが、時系列データ処理装置1において上述した機能構成要素を論理的に実現するには、不揮発性メモリに時系列データ処理プログラムをアプリケーションプログラムとしてインストールする。そして、時系列データ処理装置1においては、利用者による指示または電源投入を契機に、プロセッサ(CPU)が時系列データ処理プログラムをRAMに展開して実行する。この時系列データ処理プログラムが上述したハードウェア構成要素などと協働することにより、後に詳述する時系列データ処理が遂行される。
【0025】
図1及び関連図を参照して詳述すると、時系列データ処理装置1における時系列データ受信部11は、時系列データを生成する装置(単に、時系列データ生成装置と記載することもある)から外れ値を含む時系列データ(限定を要しないときは、単に、時系列データと記載する)を直接的にまたは間接的に収集するための通信インタフェースである。なお、外れ値(outlier)は、統計学において、他の値から大きく外れた値(離れた値)のことであり、時系列データとして推論するのが難しい(
図4参照)。
【0026】
ここでは、時系列データ受信部11は、例えば、複数の測定源を構成する各種センサーなどの時系列データ生成装置から送信された測定データ(音声データ、文字データ、及び画像データの少なくとも1つを含む)を時系列データ(入力時系列データ)として、時系列データ処理装置1におけるハードウェア構成要素であるネットワークインタフェースカード(NIC:Network Interface Card)などの通信インタフェース部により直接的に受信する。
【0027】
しかし、時系列データ受信部11は次に示すような数々の時系列データ受信形態などを変形として採ることが可能である。つまり、時系列データ受信部11は、同様の測定データを時系列データとして、ホストコンピュータを介して時系列データ処理装置1における通信インタフェース部により間接的に受信してもよい。また、時系列データが外部配置の記憶装置またはセンサーのローカル記憶装置などに格納されているときは、時系列データ受信部11はこれらの記憶装置にアクセスして時系列データを取得(受信)することも可能である。
【0028】
時系列データ受信部11がこれらの時系列データ受信形態のいずれを採るかは、時系列データ処理装置1を統括制御するプロセッサ実行の時系列データ処理プログラムにより予め定義可能である。
【0029】
時系列データ処理部12は時系列データ受信部11により受信された時系列データを時系列データ格納部13のバッファ領域に一時的に蓄積する。時系列データ処理部12は時系列データ格納部13のバッファ領域に蓄積される時系列データの滞留量を検知する機能を有する。
【0030】
ここでは、時系列データ処理部12は時系列データ処理装置1を統括制御するプロセッサ実行の時系列データ処理プログラムにより構成可能である。また、時系列データ格納部13は時系列データ処理装置1におけるハードウェア構成要素であるDRAM(Dynamic Random Access Memory)及びHDD(Hard Disk Drive)などのいずれかにより構成可能である。
【0031】
しかし、時系列データ格納部13については、ネットワークインタフェースカード(NIC)に搭載されているデバイスの記憶素子(DRAM、不揮発性メモリなど)を利用する、及び外部配置の記憶装置またはセンサーのローカル記憶装置を利用するなど、当業者が容易に実施可能な他の変形構成を採ってもよい。
【0032】
時系列データ分割部14は、時系列データ処理部12を介して時系列データ格納部13から時系列データを取得し、予め定めた時間毎にまたはセグメンテーション処理により、取得した時系列データを時間の流れに沿って区分(分割)する。
【0033】
時系列データ分類部15は、時系列データ分割部14により区分された複数の分割時系列データについて分割時系列データ毎に分類ラベルを分類識別子として付与する。また、時系列データ分類部15は、分割時系列データが外れ値を含むときは、外れ値を除去した後に分類し、分類ラベルを分類識別子として付与する。
【0034】
この時系列データ分類部15には、例えば、時系列データ同士の距離及び類似度を求めるための手法である動的時間伸縮法(DTW:Dynamic Time Warping)を適用可能である。つまり、時系列データ分類部15においては、時系列データを1次元ベクトル化してクラスタリングしておき、動的時間伸縮法で相違度を計算して一番近いものを選ぶことになる。
【0035】
図2に示すように、単純な例としては、時系列データ分割部14により時系列データを予め定めた時間毎に区切り、時系列データ分類部15により分割時系列データ毎に分類ラベルA,B,Cが付与される。
【0036】
また、
図3に示すように、複雑な例としては、時系列データ分割部14により時系列データの特徴パターンに応じてオーバラップして抽出してセグメンテーション処理した後、時系列データ分類部15により分割時系列データ毎に分類ラベルA,B,Cが付与される。
【0037】
時系列データ分割部14及び時系列データ分類部15がこれらの動作モードのいずれを採るかは、時系列データ処理装置1を統括制御するプロセッサ実行の時系列データ処理プログラムにより予め定義可能である。
【0038】
更に詳述すると、時系列データ分類部15は、時系列データ分割部14により区分された分割時系列データが外れ値を含むことを予め定めたルールに基づいて識別したときは、外れ値を除去した後に分類し、分類ラベルを分類識別子として付与する。ここで、予め定めたルールの例としては、データ期間の中間値からX倍以上異なる値、及び時系列データの傾向(上昇、下降など)からX倍以上異なる値などが適用可能である。また、データソースに対応する測定源の種類などによってそのルールを予め定めてもよい。
【0039】
時系列データ分類部15は、外れ値の除去に関わりなく、分割時系列データの発生源情報及び分割時系列データのタイミングを特定する時間情報を含む分割時系列データ特定情報と、分類識別子としての分類ラベルとをメタデータ(metadata)として機械学習部16に対して送出する。また、時系列データ分類部15は、分割時系列データから外れ値を除去したときは、外れ値の実データ及び外れ値のタイミングを指定する情報(外れ値の時間情報)をメタデータとして機械学習部16に対して更に送出する。
【0040】
上述したように、時系列データ分類部15は、分割時系列データが外れ値を含むときは、外れ値を除去した後に分類処理し、上記メタデータを機械学習部16に対して送出する。つまり、外れ値を学習及び推論して再現しようとすると、外れ値に引っ張られて学習済モデルに影響してしまうため、外れ値を別途保存しておく。これにより、推論で生成される時系列データの精度を向上することができる。また、分類識別子の種類を抑制するので、メタデータ格納部18の記憶容量を削減することができる。
【0041】
機械学習部16は、格納処理部16A、学習処理部16B、及びリザバーネットワーク16Cを含む。格納処理部16Aは、時系列データ分類部15によりそれぞれ送出された分類識別子としての分類ラベルと、分割時系列データの発生源情報と、分割時系列データの時間情報と、外れ値の実データと、外れ値の時間情報との対応関係をメタデータ格納部18及び外れ値格納部22に保存するための第1格納処理を遂行する。
【0042】
学習処理部16Bは、時系列データ分類部15により送出される複数の分割時系列データの実データを用いて、入力層、リザバー層及び出力層を含むリザバーネットワーク16Cの学習処理を遂行する。学習処理部16Bは、時系列データ格納部13に充分な時系列データが格納されたタイミングを契機に、一括で学習処理を行う。学習処理部16Bは、例えば、時系列データ格納部13における時系列データの滞留量を検知する時系列データ処理部12からの通知によりこのタイミングを認識する。なお、ハイパーパラメータの探索などはこの学習処理内で行い、それに合わせてリザバーネットワーク16を構築してもよい。
【0043】
格納処理部16Aは、学習処理部16Bの学習処理により得られたリザバーネットワーク16Cの出力層についての学習済重み情報と、分割時系列データの実データに基づいて得られた分割時系列データ毎の初期値(時系列データを推論で生成するための初期値)とを分類識別子としての分類ラベルに関係付けてメタデータ格納部18及び重み格納部20に保存するための第2格納処理を更に遂行する。格納処理部16A及び学習処理部16Bは、時系列データ処理装置1を統括制御するプロセッサ実行の時系列データ処理プログラムにより構成可能である。
【0044】
図5に例示するように、リザバーネットワーク16Cは、入力層、リザバー層(ため池とも称される)、及び出力層(リードアウト層とも称される)の3層から構成され、時系列データを教師信号(既知の望ましい手本データ)で高速に機械学習(深層学習)することに適したリザバーコンピューティングモデルである。
【0045】
つまり、リザバーネットワーク16Cは、入力層とリザバー層との間の重み(Win)及びリザバー層内の重み(Wres)を固定し、線形回帰法によってリザバー層と出力層との間の重み(Wout)だけをフィードバックされる誤差(Wback)により変更させて学習するリザバーコンピューティングのアルゴリズムを採用したエコーステートネットワークである。
【0046】
これにより、リザバーネットワーク16Cは、例えば、一般のリカレントニューラルネットワーク(再帰型ニューラルネットワーク)に対比して、重みを調整する箇所が少ないので高速な学習が可能になる。また、リザバーネットワーク16Cは、シンプルな構造であるので、専用デバイス化が容易であり、高速化及び省消費電力に寄与する。
【0047】
メタデータ処理部17は、機械学習部16から受信した、分割時系列データの発生源情報及び分割時系列データの時間情報を含む分割時系列データ特定情報と、分類ラベル(分類識別子)と、分割時系列データ毎の初期値と、外れ値情報と、学習済重み情報との対応関係をメタデータ格納部18に保存する(
図6参照)。このメタデータ処理部17は時系列データ処理装置1を統括制御するプロセッサ実行の時系列データ処理プログラムにより構成可能である。
【0048】
ここでは、機械学習部16は、重み格納部20における学習済重み情報(多次元変数情報)の記録位置(レコードなど)を示す識別子をメタデータ処理部17を介してメタデータ格納部18に保存させる。また、機械学習部16は、外れ値格納部22における外れ値情報(外れ値の実データ及び外れ値の時間情報を含む)の記録位置(レコードなど)を示す識別子をメタデータ処理部17を介してメタデータ格納部18に保存させる。
【0049】
図6に示すメタデータの格納例においては、分割時系列データ特定情報は、例えば、センサーAの時刻Aから時刻Bの間のデータを時系列データの発生源及び時系列データのタイミングを指定する時間情報として含む。また、分割時系列データ毎の初期値は、例えば、センサーAの時刻Aから時刻Bの間のデータである場合、時刻Aの時点での値である。なお、メタデータの格納方法については、当業者が容易に実施可能な他の変形構成を採ってもよい。
【0050】
図6に示すメタデータの格納例においては、分類ラベル毎に、リザバーネットワーク16Cにおける演算のためのリザバー種類及び学習済重み情報の対応を記録している。リザバー演算機能を汎用演算器で実現する際には、リザバー内部状態を記録しておく必要があるためこれを記録する。内部状態が変更されない物理リザバー演算器を用いる場合には、演算器の種類を特定する情報を記録することになる。
【0051】
重み処理部19は、機械学習部16におけるリザバーネットワーク16Cのリザバー演算器に渡す学習済みモデル(リザバー種類及び学習済重み情報を含む)を重み格納部20に格納する。学習済みモデルをファイルとして保存する場合には、ファイルシステムを備えた記憶装置によって実現する。ここでは、重み処理部19は時系列データ処理装置1を統括制御するプロセッサ実行の時系列データ処理プログラムにより構成可能である。
【0052】
外れ値処理部21は、機械学習部16から受信した外れ値の実データ及び外れ値の時間情報を含む外れ値情報を外れ値格納部22に保存する。この外れ値処理部21は時系列データ処理装置1を統括制御するプロセッサ実行の時系列データ処理プログラムにより構成可能である。
【0053】
時系列データ処理装置1におけるアクセス受付部23、重み取得部24、及び推論部25は、外部からのアクセスリクエスト(単に、要求と記載することもある)に応じて、各格納部に保存されている分類識別子(分類ラベル)と学習済重み情報と分割時系列データ毎の初期値とに基づいて時系列データを推論で生成し、該当するときは、生成した時系列データに外れ値の実データと外れ値の時間情報とにより外れ値を反映して出力する。
【0054】
詳述すると、アクセス受付部23は、クライアントコンピュータなどの時系列データを取得する装置(単に、時系列データ取得装置と記載することもある)から時系列データ読込系統のアクセスリクエストを受け付ける(受信する)。ここでは、このアクセス受付部23は時系列データ処理装置1を統括制御するプロセッサ実行の時系列データ処理プログラムにより構成可能である。
【0055】
このアクセスリクエストには、時系列データ読込系統に対応する分割時系列データ特定情報が含まれ、分割時系列データ特定情報は分割時系列データの発生源及び分割時系列データのタイミングを指定する時間情報を含む。つまり、例えば、センサーAのある時刻からある時刻までのデータという内容になる。なお、SQL(Structured Query Language)命令であれば、テーブルの種類や取得データ範囲を含むことになる。
【0056】
重み取得部24は、メタデータ処理部17を介してメタデータ格納部18にアクセスし、アクセス受付部23が受信したアクセスリクエストの分割時系列データ特定情報に対応する分類識別子を取得すると共に、対応する分割時系列データ毎の初期値及び対応する外れ値情報を取得する。
【0057】
また、重み取得部24は、この分類識別子を用いて重み処理部19を介して重み格納部20にアクセスし、時系列データ生成に必要な学習済重み情報を取得する。この学習済重み情報は、機械学習部16におけるリザバーネットワーク16Cの出力層についての重みである。ここでは、この重み取得部24は時系列データ処理装置1を統括制御するプロセッサ実行の時系列データ処理プログラムにより構成可能である。
【0058】
推論部25は、重み取得部24が取得したリザバーネットワーク16Cの学習済重み情報及び時系列データ生成に必要な分割時系列データ毎の初期値を受信し、推論処理を繰り返して遂行し、時系列データ(出力時系列データ)を生成する。
【0059】
また、推論部25は、重み取得部24が取得した外れ値情報に基づいて、外れ値処理部21を介して外れ値格納部22から外れ値の実データと外れ値の時間情報とを含む該当する外れ値を取得し、生成した時系列データに外れ値を反映して出力する。
【0060】
ここでは、推論部25は時系列データ処理装置1を統括制御するプロセッサ実行の時系列データ処理プログラムにより構成可能である。ただし、リザバー演算を実現可能な任意の特殊演算器を併用してもよい。
【0061】
[時系列データ処理]
次に、上述した時系列データ処理装置1における動作について、
図1、
図7及び
図8を参照して説明する。時系列データ処理装置1においては、利用者による指示または電源投入を契機に、時系列データ処理プログラムが起動され、次に述べる処理の遂行を統括制御する。
【0062】
図7は上述した時系列データ処理装置1における時系列データ格納処理及び学習処理のシーケンスの一例を示す。
【0063】
[処理S71]時系列データを受信してバッファ領域に一時的に蓄積する。
つまり、時系列データ受信部11が時系列データを受信し、時系列データ処理部12が受信された時系列データを時系列データ格納部13のバッファ領域に一時的に蓄積する。
【0064】
[処理S72]時系列データを取得して区分する。
つまり、時系列データ分割部14が時系列データ処理部12を介して時系列データ格納部13から時系列データを取得して区分する。
【0065】
[処理S73]分割時系列データ毎に分類ラベルを付与する。
つまり、時系列データ分類部15が時系列データ分割部14により区分された複数の分割時系列データについて分割時系列データ毎に分類ラベルを付与する。また、時系列データ分類部15は、分割時系列データが外れ値を含むときは、外れ値を除去した後に分類し、分類ラベルを付与する。
【0066】
[処理S74]第1格納処理を遂行する。
つまり、格納処理部16Aが、時系列データ分類部15によりそれぞれ送出された分類識別子としての分類ラベルと、分割時系列データの発生源情報と、分割時系列データの時間情報と、外れ値の実データと、外れ値の時間情報との対応関係をメタデータ格納部18及び外れ値格納部22に保存するための第1格納処理を遂行する。
【0067】
[処理S75]学習処理を遂行する。
つまり、学習処理部16Bが、時系列データ分類部15により送出される複数の分割時系列データの実データを用いて、リザバーネットワーク16Cの学習処理を遂行する。
【0068】
[処理S76]第2格納処理を遂行する。
つまり、格納処理部16Aが、学習処理部16Bの学習処理により得られたリザバーネットワーク16Cの出力層についての学習済重み情報と、分割時系列データの実データに基づいて得られた分割時系列データ毎の初期値とを分類ラベルに関係付けてメタデータ格納部18及び重み格納部20に保存するための第2格納処理を遂行する。
【0069】
[処理S77]情報の対応関係をメタデータ格納部に保存する。
つまり、メタデータ処理部17は、機械学習部16から受信した、分割時系列データの発生源情報及び分割時系列データの時間情報を含む分割時系列データ特定情報と、分類ラベルと、分割時系列データ毎の初期値と、外れ値情報と、学習済重み情報との対応関係をメタデータ格納部18に保存する。
【0070】
[処理S78]学習済みモデルを重み格納部に格納する。
つまり、重み処理部19が、リザバーネットワーク16Cのリザバー演算器に渡す学習済みモデル(リザバー種類及び学習済重み情報を含む)を重み格納部20に格納する。
【0071】
[処理S79]外れ値情報を外れ値格納部に保存する。
つまり、外れ値処理部21は、機械学習部16から受信した外れ値の実データ及び外れ値の時間情報を含む外れ値情報を外れ値格納部22に保存する。
【0072】
図8は上述した時系列データ処理装置1における時系列データ生成処理のシーケンスの一例を示す。
【0073】
[処理S81]アクセスリクエストを受信する。
つまり、アクセス受付部23が、時系列データ取得装置から時系列データ読込系統のアクセスリクエストを受信する。
【0074】
[処理S82]分類識別子、初期値及び外れ値情報を取得する。
つまり、重み取得部24が、メタデータ処理部17を介してメタデータ格納部18にアクセスし、アクセス受付部23が受信したアクセスリクエストの分割時系列データ特定情報に対応する分類識別子を取得すると共に、対応する分割時系列データ毎の初期値及び対応する外れ値情報を取得する。
【0075】
[処理S83]学習済重み情報を取得する。
つまり、重み取得部24が、この分類識別子を用いて重み処理部19を介して重み格納部20にアクセスし、時系列データ生成に必要な学習済重み情報を取得する。
【0076】
[処理S84]時系列データを生成する。
つまり、推論部25は、重み取得部24が取得したリザバーネットワーク16Cの学習済重み情報及び時系列データ生成に必要な分割時系列データ毎の初期値を受信し、推論処理を繰り返して遂行し、時系列データを生成する。
【0077】
[処理S85]生成した時系列データに外れ値を反映して出力する。
つまり、推論部25は、重み取得部24が取得した外れ値情報に基づいて、外れ値処理部21を介して外れ値格納部22から外れ値の実データと外れ値の時間情報とを含む該当する外れ値を取得し、生成した時系列データに外れ値を反映して出力する。
【0078】
[一実施の形態の効果]
上述した一実施の形態の時系列データ処理装置1によれば、リザバーコンピューティング技術と連携し、ある程度の精度の大まかな時系列データを推論で生成して出力することにより、処理の一層の高速化及び省消費電力を図ることができる。
【0079】
[他の変形例]
上述した一実施の形態における処理はコンピュータで実行可能なプログラムとして提供され、CD-ROMやフレキシブルディスクなどの非一時的コンピュータ可読記録媒体、さらには通信回線を経て提供可能である。
【0080】
また、上述した一実施の形態における各処理はその任意の複数または全てを選択し組合せて実施することもできる。
【符号の説明】
【0081】
1 時系列データ処理装置
11 時系列データ受信部
12 時系列データ処理部
13 時系列データ格納部
14 時系列データ分割部
15 時系列データ分類部
16 機械学習部
16A 格納処理部
16B 学習処理部
16C リザバーネットワーク
17 メタデータ処理部
18 メタデータ格納部
19 重み処理部
20 重み格納部
21 外れ値処理部
22 外れ値格納部
23 アクセス受付部
24 重み取得部
25 推論部