(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2023-11-07
(45)【発行日】2023-11-15
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20231108BHJP
G06F 17/17 20060101ALI20231108BHJP
【FI】
G06N20/00
G06F17/17
(21)【出願番号】P 2022125059
(22)【出願日】2022-08-04
【審査請求日】2022-08-04
(73)【特許権者】
【識別番号】399035766
【氏名又は名称】エヌ・ティ・ティ・コミュニケーションズ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】宇野 貴士
(72)【発明者】
【氏名】多田 駿介
(72)【発明者】
【氏名】古元 泰地
(72)【発明者】
【氏名】切通 恵介
(72)【発明者】
【氏名】丹野 良介
【審査官】児玉 崇晶
(56)【参考文献】
【文献】中国特許出願公開第111967509(CN,A)
【文献】中国特許出願公開第112765229(CN,A)
【文献】造酒 裕貴、切通 恵介、丹野 良介、内藤 理大、小川 通公、小澤 暖、伊藤 浩二,時系列データ分析支援ツールNode-AIによる時系列分析の効率化と製造業の実課題への適用,人工知能学会全国大会論文集 第34回全国大会(2020),2020年06月19日,pp.1-4
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G06F 17/17
(57)【特許請求の範囲】
【請求項1】
時系列データの取得間隔に基づいて、前記時系列データの欠落部分を補完する補完部と、
前記補完部により補完された部分を含む前記時系列データに対し、切り出し処理を行い、学習データと予測先データとからなるデータペアを作成する作成部と、
前記切り出し処理において、前記補完部により補完されたデータに基づいて作成された前記データペアを削除する削除部と
を備えることを特徴とする情報処理装置。
【請求項2】
前記取得間隔として、時系列データに付与されている時系列の等差数列の最頻値を算出する算出部をさらに備える
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記補完部は、前記時系列データにおいて、前記取得間隔以外の間隔が存在している場合、前記取得間隔以外の部分について、前記取得間隔以外の間隔が前記取得間隔となるように期間の拡張又は収縮を行い、拡張又は収縮された期間のデータに線形補間を行った値を挿入する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記補完部により補完されたデータについてフラグ系列を設定する設定部をさらに備え、
前記削除部は、前記設定部により設定されたフラグ系列に基づいて、削除する前記データペアを選択する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項5】
情報処理装置で実行される情報処理工程であって、
時系列データの取得間隔に基づいて、前記時系列データの欠落部分を補完する補完工程と、
前記補完工程により補完された部分を含む前記時系列データに対し、切り出し処理を行い、学習データと予測先データとからなるデータペアを作成する作成工程と、
前記切り出し処理において、前記補完工程により補完されたデータに基づいて作成された前記データペアを削除する削除工程と
を含むことを特徴とする情報処理方法。
【請求項6】
時系列データの取得間隔に基づいて、前記時系列データの欠落部分を補完する補完手順と、
前記補完手順により補完された部分を含む前記時系列データに対し、切り出し処理を行い、学習データと予測先データとからなるデータペアを作成する作成手順と、
前記切り出し処理において、前記補完手順により補完されたデータに基づいて作成された前記データペアを削除する削除手順と
をコンピュータに実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、多変量時系列データを想定し、それに最適化された分析・分類機能を提供し、多変量時系列信号に対する機械学習モデルを作成する装置が知られている(例えば、非特許文献1)。この装置は、多変量時系列解析に必要な高度な手続きをオーバーラップし、技術的障壁を排除することで、事前知識の乏しいユーザーであってもAIモデルの作成及び運用をすることを可能とする。
【0003】
前述の装置に組み込まれている処理の一つとして、時間窓切り出し処理がある(例えば、特許文献1)。時間窓切り出し処理とは、得られた信号データを一定間隔に切り出す処理に、多変量時系列データ向けの制約を加えた処理であり、この処理を長大な信号に対して複数回適用することで、前述の装置は、AIモデルの学習に必要な量の学習データと予測先データとのペアを得ることができる。
【先行技術文献】
【特許文献】
【0004】
【非特許文献】
【0005】
【文献】“イントロダクション|ユーザーマニュアル”、[online]、[令和4年7月22日検索]、インターネット〈https://manual.nodeai.io/〉
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、上記の従来技術では、何らかの影響で一定期間のデータが存在しない又は正しくデータを取得できない期間によりデータの欠落が生じた場合、欠落している部分でデータを分割し、それぞれに対して時間窓切り出し処理を行う必要があるという課題があった。また、データの欠落が時系列データ中に複数存在している場合や、データを分割する際に一部のエッジケースに対して正しく切り出すことができない場合に、個別に対応する必要があるという課題もあった。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本発明の情報処理装置は、時系列データの取得間隔に基づいて、時系列データの欠落部分を補完する補完部と、補完部により補完された部分を含む時系列データに対し、切り出し処理を行い、学習データと予測先データとからなるデータペアを作成する作成部と、切り出し処理において、補完部により補完されたデータに基づいて作成されたデータペアを削除する削除部とを備えることを特徴とする。
【発明の効果】
【0008】
本発明によれば、時系列データに欠落部分が生じている場合であっても、時間窓切り出し処理を適切に行うことができ、正常なデータのみが含まれたデータセットを作成することができるという効果を奏する。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態に係る情報処理の概要を示す図である。
【
図2】
図2は、実施形態に係る情報処理装置の構成を示すブロック図である。
【
図3】
図3は、実施形態に係る情報処理における時間窓切り出し処理の概要を示す図である。
【
図4】
図4は、実施形態に係る情報処理の具体例を示す図である。
【
図5】
図5は、実施形態に係る情報処理の具体例を示す図である。
【
図6】
図6は、実施形態に係る情報処理の具体例を示す図である。
【
図7】
図7は、実施形態に係る情報処理装置における情報処理の流れを示すフローチャートである。
【
図8】
図8は、情報処理プログラムを実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムの実施形態を図面に基づいて詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。
【0011】
〔1.システムの構成例〕
図1は、本実施形態に係る情報処理の概要を示す図である。情報処理装置10は、時系列データの取得間隔に基づき、データの欠落部分を補完する。そして、情報処理装置10は、補完後の時系列データについて時間窓切り出し処理を行うことで、学習データと予測先データからなるデータペアを作成する。その後、情報処理装置10は、作成されたデータペアの中から、補完後のデータに基づいて作成されたデータペアを削除する。
【0012】
情報処理装置10は、まず、時系列データの取得間隔に基づき、時系列データの欠落部分を補完する。例えば、情報処理装置10は、得られた時系列データのうち時系列データの取得間隔以外の間隔が存在している場合、その間隔はデータの欠落が発生していると判断することで、データの欠落部分を発見する。そして、発見されたデータの欠落部分について、拡張した期間の既存データに線形補間を行った値の挿入を行うことで、時系列データの欠落部分を補完する。
【0013】
次に、情報処理装置10は、補完後の時系列データに対し、時間窓切り出し処理を行う。例えば、情報処理装置10は、補完後の時系列データについて、後述する時間窓切り出し処理を行い、学習データと予測先データからなるデータペアを作成する。
【0014】
その後、情報処理装置10は、作成されたデータペアに対し、補完後のデータに基づいて作成されたデータペアを削除する。例えば、情報処理装置10は、補完されたデータに付与されたフラグ系列の値について、階段関数により階調化を行い、階調化後のフラグ系列の値に応じてデータペアを削除する。
【0015】
このようにして、情報処理装置10は、時系列データの欠落部分を補完し、時間窓切り出し処理を行った後、補完したデータに基づいて作成されたデータペアを削除する。その結果、情報処理装置10は、時系列データに欠落部分が生じている場合であっても、時間窓切り出し処理を適切に行うことができ、正常なデータペアのみが含まれたデータセットを作成することができる。
【0016】
〔2.情報処理装置10の構成〕
次に、
図2を参照し、
図1に示した情報処理装置10の構成を説明する。
図2は、実施形態に係る情報処理装置の構成例を示す図である。
図2に示すように、実施形態に係る情報処理装置10は、通信部11と、制御部12と、記憶部13とを有する。
【0017】
通信部11は、例えば、NIC(Network Interface Card)等によって実現される。通信部11は、外部の端末と有線又は無線で接続され、情報の送受信を行う。
【0018】
記憶部13は、例えば、RAM(Random Access Memory)やハードディスク等の記憶装置によって実現される。記憶部13は、制御部12による各種処理に必要なデータ及びプログラムを格納するが、特に本発明に密接に関連するものとしては、時系列データ記憶部13aと、補完後データ記憶部13bと、パラメータ記憶部13cと、データペア記憶部13dと、削除後データペア記憶部13eとを有する。
【0019】
時系列データ記憶部13aは、入力された時系列データを記憶する。例えば、時系列データ記憶部13aは、通信部11を介して、外部から入力された多変量時系列データについて記憶する。ここで、多変量時系列データとは、任意の多変量信号を標本化により離散値へと変換し、時系列情報と対応させたデータ形式をいう。
【0020】
補完後データ記憶部13bは、後述する補完部12aにより、データの欠落部分が補完された時系列データを記憶する。例えば、補完後データ記憶部13bは、後述する補完部12aにより時系列が取得間隔に統一され、データの欠落部分が補完された時系列データを記憶する。
【0021】
パラメータ記憶部13cは、後述する時間窓切り出し処理によって使用されるパラメータについて記憶する。例えば、パラメータ記憶部13cは、後述する時間窓切り出し処理の際に使用される4つのパラメータN(予測先)、M(窓幅)、L(丸め幅)、S(ストライド幅)について記憶する。なお、前述の4つのパラメータは、本実施形態に係る情報処理が行われる前に予め記憶されているものとする。
【0022】
データペア記憶部13dは、後述する作成部12bにより作成されたデータペアを記憶する。例えば、データペア記憶部13dは、後述する作成部12bにより、時系列データに対し時間窓切り出し処理が行われることで作成された、学習データと予測先データからなるデータペアについて記憶する。
【0023】
削除後データペア記憶部13eは、後述する削除部12cにより削除処理が行われた後の、残りのデータペアについて記憶する。例えば、削除後データペア記憶部13eは、データペア記憶部13dに記憶されたデータペアの中から、後述する削除部12cにより、補完されたデータに基づいて作成されたデータペアを削除した後の、残りのデータペアについて記憶する。
【0024】
制御部12は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置10内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部12は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現される。制御部12は、補完部12a、作成部12bと、削除部12cとを有し、必要に応じて、算出部12dと、設定部12eとを有してもよい。
【0025】
補完部12aは、時系列データの取得間隔に基づいて、時系列データの欠落部分を補完する。そして、補完部12aは、補完後の時系列データを補完後データ記憶部13bに格納する。例えば、補完部12aは、得られた時系列データの中から、データの欠落部分を発見し、発見されたデータの欠落部分について、拡張した期間の既存データに線形補間を行った値の挿入を行うことで、時系列データの欠落部分を補完し、補完後データ記憶部13bに格納する。
【0026】
なお、時系列データの取得間隔とは、時系列データを作成する際の、対象装置のモニタリング間隔等であり、予め設定されていてもよいし、対象装置のモニタリング装置から、時系列データの入力と共に通知されてもよいし、後述する算出部12dにより算出された最頻値を時系列データの取得間隔としてもよい。
【0027】
ここで、時系列データの取得間隔以外の間隔であり、かつ、取得間隔よりも短い区間は、補完部12aは、ダウンサンプリングにより、取得間隔に統一されるように時系列データを補完する。なお、補完部12aは、ダウンサンプリングとして、線形補間やドロップアウト等の手法を用いる。
【0028】
また、補完部12aは、時系列データにおいて、取得間隔以外の間隔が存在している場合、取得間隔以外の部分について、取得間隔以外の間隔が取得間隔となるように期間の拡張又は収縮を行い、拡張又は収縮された期間のデータに線形補間を行った値を挿入してもよい。そして、補完部12aは、補完後の時系列データを補完後データ記憶部13bに格納する。
【0029】
例えば、補完部12aは、得られた時系列データのうち時系列データの取得間隔以外の間隔が存在している場合、その間隔はデータの欠落が発生していると判断することで、データの欠落部分を発見する。そして、補完部12aは、時系列データ記憶部13aに記憶された時系列データの欠落部分について、取得間隔以外の間隔が取得間隔となるように期間の拡張又は収縮を行い、拡張又は収縮された期間のデータに線形補間を行った値を挿入することで、データの欠落部分について補完する。
【0030】
これにより、得られた時系列データの時系列が取得間隔に統一されることになるため、欠落部分が存在しない時系列データが作成され、補完部12aは、補完後の時系列データを補完後データ記憶部13bに格納する。
【0031】
作成部12bは、補完部12aにより補完された部分を含む時系列データに対し、切り出し処理を行い、学習データと予測先データとからなるデータペアを作成する。その後、作成部12bは、作成したデータペアをデータペア記憶部13dに格納する。例えば、作成部12bは、補完後データ記憶部13bに記憶された補完後の時系列データと、パラメータ記憶部13cに記憶された各パラメータとから、後述する時間窓切り出し処理により、学習データと予測先データとからなるデータペアを作成し、データペア記憶部13dに格納する。
【0032】
ここで、
図3を参照し、作成部12bが行う時間窓切り出し処理について説明する。
図3は、実施形態に係る情報処理における時間窓切り出し処理の概要を示す図である。時間窓切り出し処理では、4つのパラメータN(予測先)、M(窓幅)、L(丸め幅)、S(ストライド幅)が使用され、前述の通り、4つのパラメータは、本実施形態に係る情報処理が行われる前に予めパラメータ記憶部13cに記憶されている。
【0033】
パラメータNは予測先を示すパラメータであり、N分後の値が推定される。また、パラメータMは窓幅を示すパラメータであり、連続するM分間のデータが説明変数とされる。さらに、パラメータLは丸め幅を示すパラメータであり、窓幅MのデータがL分ごとに分割され、分割された区間内のデータの均値が算出される。なお、Lは、Mの約数となるように設定される。そして、パラメータSはストライド幅を示すパラメータであり、S分ごとにデータペアが作成される。
【0034】
図3の例では、多変量時系列データにおいて、1行を1分ごとのデータとした場合であり、カラムAからカラムEのそれぞれに対し、対応するデータが挿入され、N(予測先)=2、M(窓幅)=8、L(丸め幅)=2、S(ストライド幅)=3と設定されている。
【0035】
作成部12bは、例えば、学習データとして、基準となる時刻から過去8分間のデータを説明変数とし、8分間のデータを2分ごとに分割し平均値を求めることで、各カラムについて4つの値を得る。また、作成部12bは、予測先データとして、2分後の各カラムに挿入されたデータを得る。これにより、基準となる時刻について、学習データと予測先データとからなるデータペアが作成される。そして、作成部12bは、前述のデータペアを3分ごとに作成する。
【0036】
削除部12cは、切り出し処理において、補完部12aにより補完されたデータに基づいて作成されたデータペアを削除する。その後、削除部12cは、削除した後の残りのデータペアを削除後データペア記憶部13eに格納する。例えば、削除部12cは、データペア記憶部13dに記憶されたデータペアについて、補完されたデータに設定されたフラグ系列により削除するデータペアを判断することで、補完部12aにより補完されたデータを使用することにより作成されたデータペアを削除し、削除した後の残りのデータペアを削除後データペア記憶部13eに格納する。
【0037】
また、削除部12cは、設定部12eにより設定されたフラグ系列に基づいて、削除するデータペアを選択してもよい。例えば、削除部12cは、データペア記憶部13dに記憶されたデータペアの各データについて、後述する設定部12eにより時系列データに設定されたフラグ系列の値に対して、0以下は0、0以外は1とする階段関数により階調化を行う。そして、削除部12cは、データペアに含まれるデータの中で、一つでも階調化後のフラグ系列の値が「1」となっているデータが存在する場合、そのデータペアを削除する。
【0038】
算出部12dは、取得間隔として、時系列データに付与されている時系列の等差数列の最頻値を算出する。そして、算出部12dは、算出した最頻値を取得間隔として補完部12aに通知する。例えば、算出部12dは、時系列データ記憶部13aに記憶された、時系列データの時系列の等差数列を計算し、得られた等差数列の最頻値を算出する。その後、算出部12dは、得られた最頻値を取得間隔として補完部12aに通知する。
【0039】
設定部12eは、補完部12aにより補完されたデータについてフラグ系列を設定する。例えば、設定部12eは、補完後データ記憶部13bに記憶された補完後の時系列データについて、データの欠落により補完されたデータには「1」を設定し、それ以外のデータには「0」を設定する列であるフラグ系列を追加する。
【0040】
〔3.情報処理の具体例〕
ここで、
図4から
図6を参照し、情報処理装置10による時系列データの取得間隔である最頻値を算出する処理、時系列データを補完する処理及びフラグ系列を設定する処理を含む情報処理の具体例について説明する。
図4から
図6は、実施形態に係る情報処理の具体例を示す図である。
【0041】
まず、算出部12dは、入力された時系列データの時系列のみを抽出し、隣接する時系列の値の差を計算することで、等差数列を計算する。
図4の例では、[0:00:00]と隣接する[0:00:01]の差は「1」となり、算出部12dは、同様に各時系列に対し等差数列を求める。その結果、「1」が4つ、「6」が1つであるため、算出部12dは最頻値を「1」と算出し、補完部12aに取得間隔として通知する。
【0042】
次に、補完部12aは、前述の算出部12dから通知された取得間隔から、時系列データの欠落部分を補完する。
図5の例では、
図4において算出された等差数列の「6」の部分は、取得間隔「1」以外の部分であるため、補完部12aは、[0:00:01]と[0:00:07]の間にデータの欠落が存在すると判断する。
【0043】
そして、補完部12aは、欠落部分について、等差数列「6」の部分が取得間隔「1」となるように[0:00:01]と[0:00:07]の間の期間を拡張する。補完部12aは、拡張により補完された期間[0:00:02]から[0:00:06]の各データには[0:00:01]と[0:00:07]のデータに基づく線形補間により算出された値を挿入する。
【0044】
その後、設定部12eは、補完されたデータに対してフラグ系列を設定する。
図5の例では、設定部12eは、補完部12aにより補完された[0:00:02]から[0:00:06]のデータにはフラグ系列「1」を設定し、それ以外の[0:00:00]から[0:00:01]及び[0:00:07]から[0:00:10]のデータにはフラグ系列「0」を設定する。前述の補完部12aと設定部12eとの処理により、
図5上部の時系列データは
図5下部の時系列データとされ、補完後データ記憶部13bに格納される。
【0045】
次に、作成部12bは、補完後データ記憶部13bに記憶された、補完後の時系列データに対し、時間窓切り出し処理を行い、データペアを作成する。
図6の例では、作成部12bは、
図6上部の補完後の時系列データに対し、基準時刻[07]、パラメータM(窓幅)=2、パラメータL(丸め幅)=2、パラメータN(予測先)=2という条件で時間窓切り出し処理を行うが、特に、後の削除処理に関わるフラグ系列の値の変化について説明する。
【0046】
作成部12bは、M(窓幅)=2であるため、基準時刻[07]から[00]までの8分間のデータを使用し、L(丸め幅)=2であるため、8分間のデータを2分間ごとに分割し、それぞれの平均値を算出する。この処理により、[00]から[01]のフラグ系列は「0」、[02]から[03]及び[04]から[05]のフラグ系列は「1」、[06]から[07]のフラグ系列は「0.5」と算出される。
【0047】
作成部12bは、それぞれの列に挿入された数値に対して、前述の処理と同様の処理を行うことにより、2分間ごとの各列の数値の平均値からなるデータを作成する。つまり、
図6の例において、作成部12bは、フラグ系列を含めた4つの列に挿入された各数値について、2分間ごとにそれぞれの平均値を算出することで、2分間ごとに4つの平均値からなるデータを作成する。これにより、8分間のデータに対し、4つのデータが作成されることになる。
【0048】
そして、作成部12bは、前述の4つのデータを学習データとし、N(予測先)=2であることから、基準時刻[07]から2分後の[09]の行に挿入されている各数値を予測先データとする、学習データと予測先データとからなるデータペアを作成する。
【0049】
その後、削除部12cは、作成されたデータペアについて、設定部12eにより設定されたフラグ系列に対し、0以下は0、それ以外は1となるような階段関数による階調化を行い、階調化後のフラグ系列に基づきデータペアを削除する。
図6の例では、作成されたデータペアの学習データの一つである[06]から[07]のデータのフラグ系列は「0.5」であり0以外の値であることから、前述の階段関数の適用により、フラグ系列は「1」に変換される。
【0050】
そして、前述の作成部12bにより作成されたデータペアには、階調化後のフラグ系列が「1」となっているデータが三つ含まれているため、削除部12cは、当該データペアを削除する。前述の一連の処理により、情報処理装置10は、時系列データに欠落部分が存在する場合であっても、適切に時間窓切り出し処理を行い、作成されたデータペアの中から、補完されたデータに設定されたフラグ系列により、補完されたデータに基づいて作成されたデータペアを削除することができる。
【0051】
〔4.情報処理装置の情報処理の一例〕
次に、
図7を用いて、情報処理装置10の情報処理について説明する。
図7は、実施形態に係る情報処理装置における情報処理の流れを示すフローチャートである。情報処理装置10は、例えば、時系列データの入力を受付ける(ステップS101)。
【0052】
情報処理装置10が、時系列データの入力を受付けた場合(ステップS101;Yes)、補完部12aは、時系列データの取得間隔に基づいて、時系列データの欠落部分を補完する。(ステップS102)。一方、情報処理装置10は、時系列データの入力を受付けていない場合(ステップS101;No)、時系列データの入力を受付けるまで待機する。
【0053】
そして、作成部12bは、補完後の時系列データについて切り出し処理を行い、データペアを作成する(ステップS103)。その後、削除部12cは、補完されたデータペアに基づいて作成されたデータペアを削除する(ステップS104)。
【0054】
〔5.実施形態の効果〕
上述してきたように、本実施形態に係る情報処理装置10は、時系列データの取得間隔に基づいて、時系列データの欠落部分を補完する補完部12aと、補完部12aにより補完された部分を含む時系列データに対し、切り出し処理を行い、学習データと予測先データとからなるデータペアを作成する作成部12bと、切り出し処理において、補完部12aにより補完されたデータに基づいて作成されたデータペアを削除する削除部12cとを備える。
【0055】
補完部12aは、入力された時系列データの取得間隔に基づいて、時系列データの欠落部分を発見し、欠落部分を補完する。また、作成部12bは、補完された時系列データについて、時間窓切り出し処理を行い、学習データと予測先データとからなるデータペアを作成する。さらに、削除部12cは、作成されたデータペアの中から、補完されたデータに基づいて作成されたデータペアを削除する。
【0056】
これにより、情報処理装置10は、時系列データの欠落部分を補完することで、時系列データに欠落部分が生じている場合であっても、時間窓切り出し処理を適切に行うことができ、補完されたデータを使用して作成された不適切なデータペアを削除することで、正常なデータのみが含まれたデータセットを作成することができるという効果を奏する。
【0057】
また、情報処理装置10の算出部12dは、取得間隔として、時系列データに付与されている時系列の等差数列の最頻値を算出する。これにより、情報処理装置10は、時系列データの取得間隔を、入力された時系列データから算出することができ、時系列データの取得間隔が予め設定されていない場合であっても、算出した取得間隔(最頻値)により、時系列データの欠落部分を補完することができるという効果を奏する。
【0058】
さらに、情報処理装置10の補完部12aは、時系列データにおいて、取得間隔以外の間隔が存在している場合、取得間隔以外の部分について、取得間隔以外の間隔が取得間隔となるように期間の拡張又は収縮を行い、拡張又は収縮された期間のデータに線形補間を行った値を挿入する。
【0059】
これにより、情報処理装置10は、データの取得間隔から、データの欠落部分を発見することができ、欠落部分に線形補間を行った値を挿入することで、欠落部分についてデータの取得間隔となるようにデータの補完をすることができるという効果を奏する。
【0060】
また、情報処理装置10の設定部12eは、補完部により補完されたデータについてフラグ系列を設定し、削除部12cは、設定部により設定されたフラグ系列に基づいて、削除する前記データペアを選択する。これにより、情報処理装置10は、設定されたフラグ系列により、補完されたデータとそうでないデータとを判断することができ、補完された不適切なデータを含むデータペアを削除することができるという効果を奏する。
【0061】
〔6.システム構成等〕
上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の一部を手動的に行うこともできる。あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0062】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部又は任意の一部が、CPU及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
【0063】
例えば、
図2に示した記憶部13の一部又は全部は、情報処理装置10によって保持されるのではなく、ストレージサーバ等に保持されてもよい。この場合、情報処理装置10は、ストレージサーバにアクセスすることで、各種情報を取得する。
【0064】
〔7.ハードウェア構成〕
図8は、ハードウェア構成の一例を示す図である。上述してきた実施形態に係る情報処理装置10は、例えば
図8に示すような構成のコンピュータ1000によって実現される。
【0065】
図8は、試験プログラムを実行するコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010、CPU1020を有する。また、コンピュータ1000は、ハードディスクドライブインタフェース1030、ディスクドライブインタフェース1040、シリアルポートインタフェース1050、ビデオアダプタ1060、ネットワークインタフェース1070を有する。これらの各部は、バス1080によって接続される。
【0066】
メモリ1010は、ROM(Read Only Memory)1011及びRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1100に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1100に挿入される。シリアルポートインタフェース1050は、例えばマウス1110、キーボード1120に接続される。ビデオアダプタ1060は、例えばディスプレイ1130に接続される。
【0067】
ハードディスクドライブ1090は、例えば、OS(Operating System)1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち情報処理装置10の各処理を規定するプログラムは、コンピュータ1000により実行可能なコードが記述されたプログラムモジュール1093として実装される。プログラムモジュール1093は、例えばハードディスクドライブ1090に記憶される。例えば、情報処理装置10における機能構成と同様の処理を実行するためのプログラムモジュール1093が、ハードディスクドライブ1090に記憶される。なお、ハードディスクドライブ1090は、SSD(Solid State Drive)により代替されてもよい。
【0068】
また、上述した実施の形態の処理で用いられる設定データは、プログラムデータ1094として、例えばメモリ1010やハードディスクドライブ1090に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して実行する。
【0069】
なお、プログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ1100等を介してCPU1020によって読み出されてもよい。あるいは、プログラムモジュール1093及びプログラムデータ1094は、ネットワーク(LAN、WAN等)を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール1093及びプログラムデータ1094は、他のコンピュータから、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
【符号の説明】
【0070】
10 情報処理装置
11 通信部
12 制御部
12a 補完部
12b 作成部
12c 削除部
12d 算出部
12e 設定部
13 記憶部
13a 時系列データ記憶部
13b 補完後データ記憶部
13c パラメータ記憶部
13d データペア記憶部
13e 削除後データペア記憶部
【要約】
【課題】データセットに欠落部分が生じている場合であっても、時間窓切り出し処理を適切に行うこと。
【解決手段】情報処理装置10は、補完部12aと作成部12bと削除部12cとを備える。補完部12aは、時系列データの取得間隔に基づいて、時系列データの欠落部分を補完する。作成部12bは、補完部12aにより補完された部分を含む時系列データに対し、切り出し処理を行い、学習データと予測先データとからなるデータペアを作成する。削除部12cは、切り出し処理において、補完部により補完されたデータに基づいて作成されたデータペアを削除する。
【選択図】
図2