特開2024-67486 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-67486情報処理プログラム、情報処理方法及び情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024067486

(43)【公開日】2024-05-17

(54)【発明の名称】情報処理プログラム、情報処理方法及び情報処理装置

(51)【国際特許分類】

G06N 20/00 20190101AFI20240510BHJP

【ＦＩ】

G06N20/00

【審査請求】未請求

【請求項の数】7

【出願形態】ＯＬ

(21)【出願番号】P 2022177603

(22)【出願日】2022-11-04

(71)【出願人】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】浦晃

(57)【要約】

【課題】時系列データを用いる機械学習の効率を向上させる情報処理プログラム、情報処理方法及び情報処理装置を提供する。
【解決手段】時系列データの周波数成分のうち所定基準より強い周波数成分を特定し、時系列データの複数の時系列特徴量を生成する際に用いる１つ以上のパラメータと特定した周波数成分の周期との関係性を示す値を、パラメータに対する特徴量として算出し、時系列特徴量を用いた予測に対する、各パラメータを基に生成される時系列特徴量のそれぞれの重要度と、各パラメータに対する特徴量とを用いて、各パラメータに対する特徴量から時系列特徴量の重要度を予測する第１の機械学習モデルの学習を実行し、学習済みの第１の機械学習モデルを用いて新規の時系列データについて時系列特徴量の重要度を予測する処理をコンピュータに実行させる。
【選択図】図１１

【特許請求の範囲】

【請求項1】

時系列データの周波数成分のうち所定基準より強い周波数成分を特定し、
前記時系列データの複数の時系列特徴量を生成する際に用いる１つ以上のパラメータと特定した周波数成分の周期との関係性を示す値を、前記パラメータに対する特徴量として算出し、
前記時系列特徴量を用いた予測に対する、各前記パラメータを基に生成される前記時系列特徴量のそれぞれの重要度と、各前記パラメータに対する前記特徴量とを用いて、各前記パラメータに対する特徴量から前記時系列特徴量の前記重要度を予測する第１の機械学習モデルの学習を実行し、
学習済みの前記第１の機械学習モデルを用いて新規の時系列データについて時系列特徴量の重要度を予測する
処理をコンピュータに実行させることを特徴とする情報処理プログラム。

【請求項2】

前記周期の定数倍を前記パラメータのうちの時間幅で除算した結果を基に、前記パラメータと前記特定した周波数成分の周期との関係性を示す値を算出することを特徴とする請求項１に記載の情報処理プログラム。

【請求項3】

前記新規のデータについて前記パラメータに対する特徴量を算出し、算出した前記パラメータに対する特徴量を学習済みの前記第１の機械学習モデルに入力して、前記新規の時系列データについて前記時系列特徴量の前記重要度を予測することを特徴とする請求項１に記載の情報処理プログラム。

【請求項4】

前記予測した前記新規の時系列データについての前記時系列特徴量の前記重要度を基に、前記時系列特徴量を入力データとした予測を行う第２の機械学習モデルの学習に使用する特定の時系列特徴量を決定し、
前記時系列データについての前記特定の時系列特徴量を用いて前記第２の機械学習モデルの学習を実行する
処理を前記コンピュータにさらに実行させることを特徴とする請求項１に記載の情報処理プログラム。

【請求項5】

前記パラメータに含まれる時間幅に対する特徴量を前記パラメータに対する特徴量として算出し、
前記時間幅毎の重要度を前記時系列特徴量のそれぞれの重要度として算出し、
前記時間幅毎の重要度と各前記時間幅に対する前記特徴量とを用いて、前記第１の機械学習モデルの学習を実行する
ことを特徴とする請求項１に記載の情報処理プログラム。

【請求項6】

情報処理装置が、
時系列データの周波数成分のうち所定基準より強い周波数成分を特定し、
前記時系列データの複数の時系列特徴量を生成する際に用いる１つ以上のパラメータと特定した周波数成分の周期との関係性を示す値を、前記パラメータに対する特徴量として算出し、
前記時系列特徴量を用いた予測に対する、各前記パラメータを基に生成される前記時系列特徴量のそれぞれの重要度と、各前記パラメータに対する前記特徴量とを用いて、各前記パラメータに対する特徴量から前記時系列特徴量の前記重要度を予測する第１の機械学習モデルの学習を実行し、
学習済みの前記第１の機械学習モデルを用いて新規の時系列データについて時系列特徴量の重要度を予測する
処理を実行することを特徴とする情報処理方法。

【請求項7】

時系列データの周波数成分のうち所定基準より強い周波数成分を特定し、前記時系列データの複数の時系列特徴量を生成する際に用いる１つ以上のパラメータと特定した周波数成分の周期との関係性を示す値を、前記パラメータに対する特徴量として算出するメタ特徴量算出部と、
前記時系列特徴量を用いた予測に対する、各前記パラメータを基に生成される前記時系列特徴量のそれぞれの重要度と、各前記パラメータに対する前記特徴量とを用いて、各前記パラメータに対する特徴量から前記時系列特徴量の前記重要度を予測する第１の機械学習モデルの学習を実行するメタ機械学習実行部と、
学習済みの前記第１の機械学習モデルを用いて新規の時系列データについて時系列特徴量の重要度を予測する時系列特徴量決定部と
を備えたことを特徴とする情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理プログラム、情報処理方法及び情報処理装置に関する。

【背景技術】

【0002】

機械学習を用いた分析に含まれる様々なタスクのうち一部を自動化する技術は、自動機械学習（ＡｕｔｏＭＬ（Machine Leaning））と呼ばれる。自動機械学習では、機械学習のアルゴリズムに対してハイパーパラメータの設定値の最適化や、最も精度の高い結果をもたらすアルゴリズムの選択などの処理が自動化される。

【0003】

このような自動機械学習は、多方面で用いられるようになってきているが、時系列データに対する自動機械学習はまだ十分に研究されているとは言えない段階である。ここでの時系列データとは、データが取得された時刻情報を含むデータを指す。例えば、時刻を含むユーザのアクセスログは時系列データである。これに対して、誕生日を含むユーザデータは、誕生日は時刻ではあるがデータが取得された時刻情報ではないため、時系列データではない。

【0004】

時系列データに対する自動機械学習が進まない理由として、以下のようなものが挙げられる。時系列データを用いる機械学習では、適切な分析が行えるように時系列特徴量を生成することが求められることが多い。時系列特徴量とは、時系列データを特徴づける特徴量であり、時系列データが対応する時刻より前の時刻の情報を使用した特徴量である。

【0005】

このような時系列特徴量を自動的に生成する場合、膨大な数の時系列特徴量の候補が存在するため、時間やデータ量の観点から全ての時系列特徴量の候補を生成することが困難であることが１つの理由である。時系列データを用いる場合、例えば、どの時間幅を使用するかということが時系列特徴量の要素の１つとなり得るが、時間幅の決め方は多数存在する。時間幅とは、例えば、１時間、１日、１週間などの１まとめとする時系列データの時間範囲を決定する情報である。使用する時間幅を人為的に決める場合であれば、各時間範囲の意味を考慮して有望な時間幅の取捨選択が可能であるが、自動機械学習では、それらの意味を自動的に考慮することは難しいため、全ての時間幅について評価を行うことになる。

【0006】

なお、自働機械学習における技術として、特徴量のメタ特徴量から、各特徴量の重要度を算出する技術が提案されている。メタ特徴量とは、ある特徴量がどのような特徴量であるかを表現する情報である。また、時系列データを周波数領域データに変換し、周波数データから時系列データに設定する時間幅を決定し、決定した時間幅の時系列データを用いた機械学習結果から各時間幅の重要度を算出して、時間幅を選択する技術が提案されている。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】国際公開第２０２０／０５９４９８号

【発明の概要】

【発明が解決しようとする課題】

【0008】

しかしながら、メタ特徴量を用いて各特徴量の重要度を決定する技術を用いようとしても、時間幅などから生成される時系列特徴量に対するメタ特徴量が自明ではない。そのため、単にメタ特徴量を用いても、時系列特徴量の重要度を評価することは難しく、時系列特徴量を適切に選択することは困難である。例えば、時系列特徴量のメタ特徴量として、時間幅、時間幅に含まれる時系列データをまとめた範囲データに対して次の範囲データまでのずらす量にあたるずらし幅、範囲データの使用数、時系列特徴量を算出するための関数の組合せを用いる場合を考える。このようなメタ特徴量を用いた場合、時間軸のスケーリングに対してメタ特徴量が表現する内容が変化してしまうなどの理由から、各メタ特徴量を有する時系列データ毎の重要度を求めることが困難である。また、周波数データから時系列データに設定する時間幅を決定する技術では、各時間的特徴量の重要度を評価することが困難であり、時系列特徴量を適切に選択することは困難である。したがって、従来の自動機械学習の技術では、時系列データを用いる機械学習の効率を向上させることは困難であった。

【0009】

開示の技術は、上記に鑑みてなされたものであって、時系列データを用いる機械学習の効率を向上させる情報処理プログラム、情報処理方法及び情報処理装置を提供することを目的とする。

【課題を解決するための手段】

【0010】

本願の開示する情報処理プログラム、情報処理方法及び情報処理装置の一つの態様において、時系列データの周波数成分のうち所定基準より強い周波数成分を特定し、前記時系列データの複数の時系列特徴量を生成する際に用いる１つ以上のパラメータと特定した周波数成分の周期との関係性を示す値を、前記パラメータに対する特徴量として算出し、前記時系列特徴量を用いた予測に対する、各前記パラメータを基に生成される前記時系列特徴量のそれぞれの重要度と、各前記パラメータに対する前記特徴量とを用いて、各前記パラメータに対する特徴量から前記時系列特徴量の前記重要度を予測する第１の機械学習モデルの学習を実行し、前記学習済みの前記第１の機械学習モデルを用いて新規の時系列データについて時系列特徴量の重要度を予測する処理をコンピュータに実行させる。

【発明の効果】

【0011】

１つの側面では、本発明は、時系列データを用いる機械学習の効率を向上させることができる。

【図面の簡単な説明】

【0012】

【図1】図１は、実施例１に係る情報処理装置のブロック図である。

【図2】図２は、情報処理装置が用いるデータを説明するための図である。

【図3】図３は、メタ機械学習処理部のブロック図である。

【図4】図４は、時系列データ毎の要素の組合せ及び時系列特徴量と目的変数との対応を示す図である。

【図5】図５は、フーリエ変換を行う時系列データの一例を示す図である。

【図6】図６は、実施例１に係るメタ機械学習を説明するための図である。

【図7】図７は、機械学習処理部のブロック図である。

【図8】図８は、実施例１に係る要素の組合せの重要度の算出を説明するための図である。

【図9】図９は、実施例に係る情報処理装置による時系列データに対する機械学習を用いた予測処理の概要を示すフローチャートである。

【図10】図１０は、実施例１に係る情報処理装置によるメタ機械学習処理のフローチャートである。

【図11】図１１は、実施例１に係る情報処理装置による機械学習処理のフローチャートである。

【図12】図１２は、時間幅毎の重要度の算出を説明するための図である。

【図13】図１３は、実施例２に係るメタ機械学習を説明するための図である。

【図14】図１４は、実施例２に係る要素の組合せの重要度の算出を説明するための図である。

【図15】図１５は、実施例２に係る情報処理装置によるメタ機械学習処理のフローチャートである。

【図16】図１６は、実施例２に係る情報処理装置による機械学習処理のフローチャートである。

【図17】図１７は、変形例１における時系列データの一例を示す図である。

【図18】図１８は、変形例２における時系列データの一例を示す図である。

【図19】図１９は、情報処理装置のハードウェア構成図である。

【発明を実施するための形態】

【0013】

以下に、本願の開示する情報処理プログラム、情報処理方法及び情報処理装置の実施例を図面に基づいて詳細に説明する。なお、以下の実施例により本願の開示する情報処理プログラム、情報処理方法及び情報処理装置が限定されるものではない。

【実施例0014】

図１は、実施例１に係る情報処理装置のブロック図である。本実施例に係る情報処理装置１は、利用者端末装置２とネットワークで接続される。情報処理装置１は、図１に示すように、メタ機械学習処理部１１、機械学習処理部１２、予測部１３、予測性能評価用モデル１４、メタ機械学習モデル１５及び機械学習モデル１６を有する。

【0015】

本実施形態に係る情報処理装置１は、時系列データの複数の時系列特徴量のそれぞれのメタ特徴量を用いて各時系列特徴量の重要度を求めるメタ機械学習モデル１５の学習を実行する。次に、情報処理装置１は、新たな時系列データの時系列特徴量のメタ特徴量を学習済みのメタ機械学習モデル１５に用いて各時系列特徴量の重要度を算出し、算出した重要度を用いて新たな時系列データに基づく予測を行う場合の時系列特徴量を決定する。そして、情報処理装置１は、新たな時系列データの決定した時系列特徴量を用いて機械学習モデル１６の学習を行う。その後、情報処理装置１は、予測対象の時系列データを学習済みの機械学習モデル１６に入力して特定の予測を実行する。

【0016】

図２は、情報処理装置が用いるデータを説明するための図である。ここで、図２を参照して、情報処理装置１が用いる各種のデータについて説明する。

【0017】

情報処理装置１は、例えば、時系列データｄ１～ｄ３を用いる。時系列データｄ１～ｄ３は、データの取得の時間間隔が一定とみなすことが可能な時系列データである。すなわち、時系列データｄ１～ｄ３は、一定の時間間隔に得られた個別データの集合である。図２に示した時系列データｄ１～ｄ３は、複数の四角が一列に並べられて示されており、この１つの四角が１つの個別データにあたる。時系列データｄ１～ｄ３は、個別データが時間経過にしたがって並べられる。さらに、図２では、各個別データの四角内に記載された数字が、それぞれの個別データの値を表す。個別データは、一定間隔で取得されるため、時系列データｄ１～ｄ３における連続する個別データの個数により時間経過が表される。連続する個別データの数が同じであれば、同じ時間幅で取得された個別データといえる。以下の説明では、時間を個別データの数で表す。すなわち、ｎ個の個別データで表される時間をｎと呼ぶ。

【0018】

また、本実施例では、時系列データｄ１～ｄ３の特徴量である時系列特徴量を決定する要素の組合せという概念を用いる。要素の組合せは、例えば、１つの範囲データのサイズを決定する「時間幅」、範囲データ間の間隔である「ずらし幅」及び特徴量の算出に使用する範囲データの個数である「データ数」という要素を含む。

【0019】

例えば、時系列データｄ１における要則の組合せの例として範囲データ２０１～２０３を用いることができる。範囲データ２０１～２０３におけるそれぞれの時間経過が時間幅であり、範囲データ２０１～２０３で表される要素の組合せの時間幅は６である。また、範囲データ２０１の最も時刻が遅い個別データから範囲データ２０２の最も時刻が遅い個別データまでの時間経過２０４がずらし幅であり、範囲データ２０１～２０３で表される要素の組合せのずらし幅は６であり時間幅と一致する。さらに、範囲データ２０１～２０３は３つであるので、範囲データ２０１～２０３で表される要素の組合せのデータ数は３である。

【0020】

要素の組合せに含まれる時間幅、ずらし幅及びデータ数は、自由に決定される。また、時間幅とずらし幅とは異なってもよい。図２における時系列データｄ３に示した範囲データ２１１～２１３で表される要素の組合せは、時間幅が６であり、時間経過２１４で表されるずらし幅が３であり、データ数が３である。他にも、例えば、時間幅は４であってもよし、データ数は１０であってもよい。また、時間幅は時系列データの全データの数であり、データ数を１とすることもできる。

【0021】

ここで、データ数は、数値を直接決定しなくても、ある時点より時刻が後の範囲データの数として規定してもよい。また、要素の組合せに含まれる要素は、他の情報を用いることもできる。例えば、「一番最近の範囲データの最初の時刻」なども要素として用いることが可能であるが、通常は一番最近の範囲データは、一番新しいデータを含むように設定されるため、ここでは「一番最近の範囲データの最初の時刻」は要素には含めない。

【0022】

さらに、本実施例では、時系列特徴量は、時間幅、ずらし幅及びデータ数で規定される範囲データに対して特定の関数を用いて算出される。関数は、どの様な関数であってもよい。例えば、関数は、最大値を取得するｍａｘ関数、最小値を取得するｍｉｎ関数、平均値を算出するｍｅａｎ関数又は標準偏差を算出するｓｔｄｄｅｖ関数等の単純な関数でもよいし、フーリエ変換を行う関数等を用いることも可能である。

【0023】

すなわち、本実施例では、時系列特徴量は、時間幅、ずらし幅及びデータ数と関数との組合せにより算出される。したがって、本実施例に係る時系列特徴量を生成するための要素の組合せは、時間幅、ずらし幅、データ数及び関数を要素として有する。

【0024】

図１に戻って説明を続ける。予測性能評価用モデル１４は、時系列データに対する複数の時系列特徴量を用いて予測を行う機械学習モデルである。予測性能評価用モデル１４は、時系列特徴量の入力を受けて、予測結果を出力する。例えば、時系列データが毎日の売り上げのデータであり予測対象が明日の売り上げ予測である場合、予測評価用モデル１４は、売り上げのデータの入力を受けて、明日の売り上げを予測して出力する。

【0025】

メタ機械学習モデル１５は、メタ特徴量を用いて予測を行い予測結果として、入力されたメタ特徴量を有する時系列特徴量の重要度を予測する機械学習モデルである。例えば、メタ機械学習モデル１５は、特定の時間幅、ずらし幅、データ数及び関数の要素の組合せを有する時系列特徴量について、その時系列特徴量の要素の時間幅から得られるメタ特徴量を用いて予測を行い、その時系列特徴量の重要度を出力する。このメタ機械学習モデル１５が、「第１の機械学習モデル」の一例にあたる。

【0026】

機械学習モデル１６は、時系列データに対する機械学習処理部１２により選択された時系列特徴量を入力として予測を行う機械学習モデルである。機械学習モデル１６は、時系列データの入力を受けて、特定の予測による予測結果を出力する。例えば、時系列データが毎日の売り上げのデータであり予測対象が明日の売り上げ予測である場合、機械学習モデル１６は、売り上げのデータの入力を受けて、入力された時系列データに応じた時系列特徴量を用いて明日の売り上げを予測して出力する。なお、ここで例示する機械学習モデル１６を用いた予測は一例である。例えば、時系列データを入力データとして将来の時系列データの値や推移を予測する機械学習モデルや、時系列データに基づいて異常の有無等を予測する機械学習モデルも、機械学習モデル１６として採用可能である。この機械学習モデル１６が、「第２の機械学習モデル」の一例にあたる。

【0027】

メタ機械学習処理部１１は、時系列データにおける時系列特徴量の要素の組合せに対して予測性能評価用モデル１４から出力される予測結果の評価を行ない、時系列特徴量の要素の組合せそれぞれの重要度を求める。そして、メタ機械学習処理部１１は、要素の組合毎の時系列特徴量に対するメタ特徴量及び要素の組合せ毎の重要度を用いてメタ機械学習モデル１５の学習を行う。以下に、メタ機械学習処理部１１の詳細について説明する。

【0028】

図３は、メタ機械学習処理部のブロック図である。メタ機械学習処理部１１は、時系列データ格納部１１１、特徴量要素生成部１１２、時系列特徴量算出部１１３、学習実行部１１４、予測性能算出部１１５、重要度算出部１１６、メタ特徴量算出部１１７及びメタ機械学習実行部１１８を有する。

【0029】

時系列データ格納部１１１は、メタ機械学習モデル１５の学習に用いる複数の時系列データの集合を格納する。時系列データ格納部１１１は、管理者等により予め入力された時系列データを保持する。各時系列データは、タスク設定方法が予め指定される。

【0030】

特徴量要素生成部１１２は、時系列データ格納部１１１に格納された時系列データを確認して、時系列データに応じて時系列特徴量の要素である、時間幅、ずらし幅、データ数及び関数を決定して、時系列特徴量の要素の組合せを複数生成する。本実施例では、特徴量要素生成部１１２は、要素の中のデータ数を定数とする。その後、特徴量要素生成部１１２は、生成した時系列特徴量の要素の組合せを時系列特徴量算出部１１３へ出力する。

【0031】

例えば、特徴量要素生成部１１２は、「時間幅，ずらし幅，データ数，関数」＝「６，６，３，ｍａｘ関数」、「６，６，３，ｍｉｎ関数」、「４，４，３，ｍａｘ関数」、「４，４，３，ｍｉｎ関数」などとして要素の組合せを生成する。ここで、特徴量要素生成部１１２は、時間幅とずらし幅とを異ならせることも可能である。また、特徴量要素生成部１１２は、データ数を変数とすることも可能である。

【0032】

時系列特徴量算出部１１３、学習実行部１１４、予測性能算出部１１５、重要度算出部１１６及びメタ特徴量算出部１１７は、以下に説明する処理を、時系列データ格納部１１１に格納された時系列データの集合に含まれる全ての時系列データについて実行する。ここでは、時系列データの集合のうち時系列データｄｉについての処理を説明する。また、ここでは、要素の組合せの集合をＷとし、Ｗに含まれる要素の組合せそれぞれをｗｊとする。

【0033】

時系列特徴量算出部１１３は、要素の組合せの入力を特徴量要素生成部１１２から受ける。次に、時系列特徴量算出部１１３は、時系列データの集合に含まれる１つの時系列データｄｉを時系列データ格納部１１１から取得する。そして、時系列特徴量算出部１１３は、時系列データｄｉについて、要素の組合せｗｊ毎に時系列特徴量を算出する。例えば、時系列特徴量の要素の組合せが４つ存在する場合、時系列特徴量算出部１１３は、時系列データｄｉについて４つの要素の組合せ毎に時系列特徴量を算出する。時系列特徴量算出部１１３は、算出した時系列データｄｉの要素の組合せｗｊのそれぞれの時系列特徴量を学習実行部１１４へ出力する。

【0034】

学習実行部１１４は、時系列データｄｉの要素の組合せｗｊのそれぞれの時系列特徴量の入力を時系列特徴量算出部１１３から受ける。そして、学習実行部１１４は、取得した時系列特徴量を用いて予測性能評価用モデル１４の学習を実行する。例えば、時系列データを用いて将来の値の予測を行う場合、学習実行部１１４は、所定の時刻までの時系列データの時系列特徴量及びその所定の時刻に対する時系列データに含まれる予測値の正解を用いて予測性能評価用モデル１４の学習を行うことができる。これにより、学習済みの予測性能評価用モデル１４が生成される。

【0035】

ここで、学習実行部１１４は、ロジスティック回帰やランダムフォレストのように単一の学習器を用いて予測性能評価用モデル１４の学習を行っても良いし、自動機械学習のように複数の前処理や学習器を探索して予測性能評価用モデル１４の学習を行っても良い。

【0036】

予測性能算出部１１５は、時系列データｄｉを時系列データ格納部１１１から取得する。そして、予測性能算出部１１５は、時系列データｄｉから要素の組合せｗｊ毎の時系列特徴量を生成して学習済みの予測性能評価用モデル１４へ入力して、時系列データｄｉに対する予測結果を得る。その後、予測性能算出部１１５は、取得した予測結果を用いて予測性能評価用モデル１４の時系列データｄｉの予測性能ａ_ｄｉ，０を算出する。例えば、予測性能算出部１１５は、決定係数（Ｒ２）を用いて予測性能ａ_ｄｉ，０を算出することができる。

【0037】

ここで、予測性能算出部１１５は、時系列データの集合の中の評価用の時系列データを用いて予測性能を算出しても良いし、予測性能評価用モデル１４の学習に用いられた時系列データを用いて予測性能を算出しても良い。その後、予測性能算出部１１５は、時系列データｄｉについての、要素の組合せｗｊ毎の時系列特徴量、予測結果及び予測性能ａ_ｄｉ，０を重要度算出部１１６へ出力する。

【0038】

図４は、時系列データ毎の要素の組合せ及び時系列特徴量と予測結果との対応を示す図である。図４は、時系列データｄ１～ｄ３に対して、要素の組合せが、「６，６，３，ｍａｘ関数」、「６，６，３，ｍｉｎ関数」、「４，４，３，ｍａｘ関数」、「４，４，３，ｍｉｎ関数」の４つである場合を例に図示した。

【0039】

表２２０は、時系列データｄ１～ｄ３それぞれについての要素の組合せ毎の時系列特徴量とそれに対する目的変数との対応を示す。時系列特徴量２２１は、素の組合せが「６，６，３，ｍａｘ関数」である場合の時系列データｄ１の１つの範囲データの時系列特徴量を表す。また、目的変数へ予測するべき値であり、目的変数の値と予測した値とを比較して予測性能が算出される。すなわち、表２２０は、時系列データｄ１～ｄ３毎に、４つの要素の組合せ毎の時系列特徴量とそれに対する目的変数とを対応付けて示す。予測性能算出部１１５は、時系列データｄ１～ｄ３のそれぞれの予測結果について予測性能を算出する。

【0040】

図３に戻って説明を続ける。重要度算出部１１６は、時系列データｄｉについての、要素の組合せｗｊそれぞれの時系列特徴量、予測結果及び予測性能ａ_ｄｉ，０の入力を予測性能算出部１１５から受ける。次に、重要度算出部１１６は、以下のPermutation Importanceと呼ばれる特徴量の予測精度に対する各時系列特徴量の寄与度の評価手法を用いて要素の組合せｗｊのそれぞれの重要度を算出する。

【0041】

具体的には、重要度算出部１１６は、要素の組合せｗｊについて、要素の組合せｗｊ毎に、時系列データｄｉとランダムに選んだ他の時系列データとの間で時系列特徴量を入れ替えて予測性能評価用モデル１４を用いて予測を行う。そして、重要度算出部１１６は、入れ替えを行った場合のそれぞれの予測性能を算出する。

【0042】

例えば、重要度算出部１１６は、図４のグループ２２２における時系列データｄ１～ｄ３のそれぞれの「６，６，３，ｍａｘ関数」という要素の組合せの場合の時系列特徴量を列毎にランダムに入れ替えて、予測性能評価用モデル１４を用いて時系列データ毎に予測を行う。同様に、重要度算出部１１６は、「６，６，３，ｍｉｎ関数」、「４，４，３，ｍａｘ関数」、「６，６，３，ｍｉｎ関数」といった要素の組合せについても時系列データｄ１～ｄ３間でランダムに列毎に時系列特徴量を入れ替えて、予測性能評価用モデル１４を用いて時系列データ毎に予測を行う。そして、重要度算出部１１６は、「６，６，３，ｍａｘ関数」、「６，６，３，ｍｉｎ関数」、「４，４，３，ｍａｘ関数」、「６，６，３，ｍｉｎ関数」といった要素の組合せについてランダムに入れ替えた場合のそれぞれの時系列データ毎の予測性能を算出する。

【0043】

次に、重要度算出部１１６は、予測性能算出部１１５から取得した予測性能ａ_ｄｉ，０と、要素の組合せｗｊ毎に時系列データ間で各時系列特徴量をランダムに入れ替えた場合の予測性能とを比較する。そして、重要度算出部１１６は、比較結果を基に時系列データｄｉでの要素の組合せｗｊ毎の重要度Ｉ_{ｄｉ，ｗｊ}を算出する。より具体的には、重要度算出部１１６は、ある要素の組合せのデータを入れ替えた場合と、他の要素の組合せのデータを入れ替えた場合とで、入れ替えを行わない場合の予測性能よりもより予測性能が低くなった方を重要度が高いと判定する。予測性能が低くなるということは、データを入れ替えることでより予測が難しくなったことを意味する。

【0044】

その後、重要度算出部１１６は、算出した時系列データｄｉにおける要素の組合せｗｊ毎の重要度Ｉ_{ｄｉ，ｗｊ}の情報をメタ機械学習実行部１１８へ出力する。

【0045】

ここで、本実施例では、要素の組合せに含まれる時系列特徴量全てをまとめて入れ替えて重要度を求めたが、重要度の求め方はこれに限らない。例えば、重要度算出部１１６は、要素の組合せに含まれる時系列特徴量１つ１つについて入れ替えを行って重要度を求めて、それらの最大値や平均値を要素の組合せの重要度としてもよい。

【0046】

メタ特徴量算出部１１７は、時系列データｄｉを時系列データ格納部１１１から取得する。また、メタ特徴量算出部１１７は、全ての要素の組合せｗｊの情報を特徴量要素生成部１１２から受ける。

【0047】

次に、メタ特徴量算出部１１７は、時系列データｄｉに対してフーリエ変換を行う。そして、メタ特徴量算出部１１７は、成分が強い周期のうち上位から所定数の周期を抽出する。すなわち、メタ特徴量算出部１１７は、時系列データの周波数成分のうち所定基準より強い周波数成分を特定する。この場合、所定基準は、上位から所定数の周期の最下位の周期を有する周波数成分である。

【0048】

図５は、フーリエ変換を行う時系列データの一例を示す図である。グラフ２３１及び２３２ともに、横軸で時間経過を表し、縦軸でデータの値を表す。ただし、グラフ２３２は、グラフ２３１と比べて横軸の時間の表示単位が異なる。

【0049】

例えば、図５におけるグラフ２３１では、周期１０００の成分が１番強く、周期１００の成分が２番目に強い。グラフ２３２の場合、周期１００００の成分が１番強く、周期１０００の成分が２番目に強い。すなわち、２つの周期を抽出する場合、メタ特徴量算出部１１７は、フーリエ変換の結果がグラフ２３１であれば周期１０００及び周期１００を抽出し、フーリエ変換の結果がグラフ２３２であれば周期１００００及び周期１０００を抽出する。

【0050】

そして、メタ特徴量算出部１１７は、抽出した周波数を基に時系列データｄｉにおける要素の組合せｗｊ毎の時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｗｊ}を算出する。本実施例では、メタ特徴量算出部１１７は、要素の組合せｗｊ毎の時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｗｊ}として、データの周期の定数倍と時間幅との近さを示す情報を算出する。

【0051】

例えば、メタ特徴量算出部１１７は、時系列データｄｉに対してフーリエ変換を行なった場合の上位から所定数の強い成分の周期のそれぞれで時間幅を除算した値に一番近い整数及びその整数と商との差分をメタ特徴量ｆ_{ｄｉ，ｗｊ}とする。ここで、特定の要素の組合せｗｊにおける時間幅をｚとする。そして、１番強い成分の周期をＴ１とし、２番目に強い成分の周期とＴ２とした場合を考える。この場合、メタ特徴量算出部１１７は、ｚ／Ｔ１に最も近い整数ｎ１を算出する。また、メタ特徴量算出部１１７は、ｚ／Ｔ２に最も近い整数ｎ２を算出する。そして、メタ特徴量算出部１１７は、ｎ１、｜ｎ１－ｚ／Ｔ１｜、ｎ２、｜ｎ２－ｚ／Ｔ２｜を特定の要素の組合せの時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｗｊ}とする。

【0052】

そして、メタ特徴量算出部１１７は、算出した要素の組合せｗｊ毎の時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｗｊ}をメタ機械学習実行部１１８へ出力する。このように、メタ特徴量算出部１１７は、時系列データの複数の時系列特徴量を生成する際に用いる１つ以上のパラメータ（要素）と特定した周波数成分の周期との関係性を示す値を、パラメータに対する特徴量として算出する。

【0053】

メタ機械学習実行部１１８は、全ての時系列データｄｉにおける要素の組合せｗｊのそれぞれの重要度Ｉ_{ｄｉ，ｗｊ}の入力を重要度算出部１１６から受ける。また、メタ機械学習実行部１１８は、全ての時系列データｄｉにおける要素の組合せｗｊ毎の時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｗｊ}の入力をメタ特徴量算出部１１７から受ける。

【0054】

そして、メタ機械学習実行部１１８は、全ての時系列データｄｉにおける、要素の組合せｗｊのそれぞれの重要度Ｉ_{ｄｉ，ｗｊ}を回帰問題として、要素の組合せｗｊ毎の時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｗｊ}を用いてメタ機械学習モデル１５の学習を実行する。これにより、学習済みのメタ機械学習モデル１５が生成される。

【0055】

図６は、実施例１に係るメタ機械学習を説明するための図である。ここでは、時系列データｄ１、ｄ２、・・・が存在する。そして、表２４０における列群Ｗの部分が、各時系列データｄ１、ｄ２、・・・に対するそれぞれの時系列特徴量の要素の組合せを示す。本実施例ではデータ数は固定なので図示を省略した。さらに、枠２４１で囲われた部分が要素の組合せ毎のメタ特徴量を示す。枠２４２で囲われた部分が要素の組合せ毎の重要度を示す。メタ機械学習実行部１１８は、枠２４３で囲われた部分のデータをメタ学習データとしてメタ機械学習モデル１５の学習を実行する。

【0056】

機械学習処理部１２は、機械学習モデル１６の学習に用いる時系列データを取得して、その時系列データの学習に適する時系列特徴量の要素の組合せを決定し、決定した要素の組合せから得られる時系列特徴量を用いて機械学習モデル１６の学習を実行する。以下に、機械学習処理部１２の詳細について説明する。

【0057】

図７は、機械学習処理部のブロック図である。機械学習処理部１２は、入力データ生成部１２１、時系列特徴量決定部１２２、時系列データ取得部１２３及び機械学習実行部１２４を有する。

【0058】

時系列データ取得部１２３は、利用者が使用する新規の学習データである時系列データを利用者端末装置２から受信する。そして、時系列データ取得部１２３は、取得した新規の時系列データを入力データ生成部１２１及び機械学習実行部１２４へ出力する。

【0059】

入力データ生成部１２１は、新規の時系列データの入力を時系列データ取得部１２３から受ける。また、入力データ生成部１２１は要素の組合せの情報をメタ機械学習処理部１１から取得する。そして、入力データ生成部１２１は、新規の時系列データにフーリエ変換を行ない成分が強い周期のうち上位から所定数の周期を抽出する。次に、入力データ生成部１２１は、抽出した周期を用いて要素の組合せ毎の時系列特徴量のメタ特徴量として、要素の組合せ毎にデータの周期の定数倍と時間幅との近さを示す情報を算出する。その後、入力データ生成部１２１は、要素の組合せ毎の時系列特徴量に対するメタ特徴量を学習済みのメタ機械学習モデル１５へ入力する。

【0060】

図８は、実施例１に係る要素の組合せの重要度の算出を説明するための図である。例えば、時系列データ取得部１２３は、新規の時系列データｄ’を取得する。次に、入力データ生成部１２１は、列群Ｗ’で示される要素の組合せの情報をメタ機械学習処理部１１から取得する。次に、入力データ生成部１２１は、新規の時系列データｄ’について、要素の組合せ毎に時系列特徴量に対するメタ特徴量を算出して、表２５１に示す情報を得る。その後、メタ機械学習モデル１５は、入力データ生成部１２１からの表２５１に示す情報の入力を受けて、新規の時系列データｄ’における要素の組合せ毎の重要度２５２を出力する。

【0061】

図７に戻って説明を続ける。時系列特徴量決定部１２２は、メタ機械学習モデル１５から出力された新規の時系列データにおける要素の組合せ毎の重要度を取得する。そして、時系列特徴量決定部１２２は、重要度の高い要素の組合せを、新規の時系列データを用いた学習に使用する要素の組合せと決定する。例えば、時系列特徴量決定部１２２は、重要度の高い順に特定数の要素の組合せを抽出する。他にも、時系列特徴量決定部１２２は、予め決められた閾値よりも高い重要度の要素の組合せを抽出してもよい。その後、時系列特徴量決定部１２２は、決定した新規の時系列データを用いた学習に使用する要素の組合せの情報を機械学習実行部１２４へ出力する。

【0062】

機械学習実行部１２４は、新規の時系列データの入力を時系列データ取得部１２３から受ける。また、機械学習実行部１２４は、新規の時系列データを用いた学習に使用する要素の組合せの情報の入力を時系列特徴量決定部１２２から受ける。

【0063】

次に、機械学習実行部１２４は、新規の時系列データを用いた学習に使用する要素の組合せ毎に、新規の時系列データにおける時系列特徴量を算出する。そして、機械学習実行部１２４は、新規の時系列データ及び時系列特徴量を用いて機械学習モデル１６の学習を実行する。これにより、学習済みの機械学習モデル１６が生成される。

【0064】

予測部１３は、予測対象となる時系列データを利用者端末装置２から受信する。そして、予測部１３は、予測対象となる時系列データを学習済みの機械学習モデル１６に入力して出力される予測結果を取得する。そして、予測部１３は、予測対象となる時系列データに対する予測結果を利用者端末装置２へ送信する。

【0065】

図９は、実施例に係る情報処理装置による時系列データに対する機械学習を用いた予測処理の概要を示すフローチャートである。次に、図９を参照して、実施例に係る情報処理装置１による時系列データに対する機械学習を用いた予測処理の概要を説明する。

【0066】

メタ機械学習処理部１１は、時系列データにおける時系列特徴量の要素の組合せに対して予測性能評価用モデル１４を用いて予測結果の評価を行ない、時系列特徴量の要素の組合せそれぞれの重要度を求める。そして、メタ機械学習処理部１１は、時系列特徴量の要素の組合せ、メタ特徴量及び時系列特徴量の要素の組合せの重要度を用いてメタ機械学習モデル１５の学習を行うメタ機械学習処理を実行する（ステップＳ１）。

【0067】

機械学習処理部１２は、機械学習モデル１６の学習に用いる時系列データを取得して、その時系列データの学習に適する時系列特徴量の要素の組合せを決定する。そして、機械学習処理部１２は、決定した要素の組合せから得られる時系列特徴量を用いて機械学習モデル１６の学習を行う機械学習処理を実行する（ステップＳ２）。

【0068】

予測部１３は、予測に用いる時系列データを利用者端末装置２から受信する。そして、予測部１３は、予測に用いる時系列データを学習済みの機械学習モデル１６に入力して出力される予測結果を取得する。これにより、予測部１３は、利用者端末装置２から受信した時系列データに対する予測を実行する（ステップＳ３）。

【0069】

図１０は、実施例１に係る情報処理装置によるメタ機械学習処理のフローチャートである。次に、図１０を参照して、実施例１に係る情報処理装置１によるメタ機械学習処理の流れを説明する。図１０に示した各処理は、図９で示したフローにおけるステップＳ１で実行される処理の一例にあたる。

【0070】

特徴量要素生成部１１２は、時系列データ格納部１１１に格納された時系列データを確認して、時系列データに応じて時系列特徴量の要素である、時間幅、ずらし幅、データ数及び関数を決定して、時系列特徴量の要素の組合せを複数生成する（ステップＳ１０１）。

【0071】

時系列特徴量算出部１１３は、時系列データ格納部１１１に格納された時系列データの集合から時系列データを１つ選択する（ステップＳ１０２）。

【0072】

次に、時系列特徴量算出部１１３は、要素の組合せを特徴量要素生成部１１２から取得する。そして、時系列特徴量算出部１１３は、選択した時系列データについて、全ての要素の組合せについての時系列特徴量を算出する（ステップＳ１０３）。

【0073】

学習実行部１１４は、選択された時系列データの要素の組合せ毎の時系列特徴量を時系列特徴量算出部１１３から取得する。そして、学習実行部１１４は、取得した時系列特徴量を用いて予測性能評価用モデル１４の学習を実行する（ステップＳ１０４）。

【0074】

予測性能算出部１１５は、時系列特徴量算出部１１３により選択された時系列データを時系列データ格納部１１１から取得する。そして、予測性能算出部１１５は、時系列データから時系列特徴量の要素の組合せ毎の時系列特徴量を生成して学習済みの予測性能評価用モデル１４へ入力して、予測結果を得る。その後、予測性能算出部１１５は、取得した予測結果を用いて予測性能評価用モデル１４の選択された時系列データの予測性能を算出する（ステップＳ１０５）。

【0075】

重要度算出部１１６は、選択された時系列データについての、要素の組合せ毎の時系列特徴量、予測結果及び予測性能の入力を予測性能算出部１１５から受ける。次に、重要度算出部１１６は、Permutation Importanceを用いて選択された時系列データについて要素の組合せ毎の重要度を算出する（ステップＳ１０６）。

【0076】

メタ特徴量算出部１１７は、時系列特徴量算出部１１３により選択された時系列データを時系列データ格納部１１１から取得する。また、メタ特徴量算出部１１７は、要素の組合せの情報を特徴量要素生成部１１２から受ける。次に、メタ特徴量算出部１１７は、選択された時系列データに対してフーリエ変換を行う。そして、メタ特徴量算出部１１７は、抽出した周波数を基に要素の組合せ毎の時系列特徴量に対するメタ特徴量として、データの周期の定数倍と時間幅との近さを示す情報を算出する（ステップＳ１０７）。

【0077】

次に、時系列特徴量算出部１１３は、時系列データ格納部１１１に格納された時系列データの集合に含まれる全ての時系列データについてメタ特徴量の算出を実行したか否かを判定する（ステップＳ１０８）。メタ特徴量を算出していない時系列データが存在する場合（ステップＳ１０８：否定）、時系列特徴量算出部１１３は、ステップＳ１０２へ戻る。

【0078】

これに対して、全ての時系列データについてメタ特徴量の算出を実行した場合（ステップＳ１０８：肯定）、メタ機械学習実行部１１８は、要素の組合せのそれぞれの重要度を重要度算出部１１６から取得する。また、メタ機械学習実行部１１８は、要素の組合せ毎の時系列特徴量に対するメタ特徴量の入力をメタ特徴量算出部１１７から受ける。そして、メタ機械学習実行部１１８は、要素の組合せ毎の重要度を回帰問題として、要素の組合せ毎の時系列特徴量に対するメタ特徴量を用いてメタ機械学習モデル１５の学習を実行する（ステップＳ１０９）。

【0079】

これにより、情報処理装置１は、学習済みのメタ機械学習モデル１５を取得する（ステップＳ１１０）。

【0080】

図１１は、実施例１に係る情報処理装置による機械学習処理のフローチャートである。次に、図１１を参照して、実施例１に係る情報処理装置１による機械学習処理の流れを説明する。図１１に示した各処理は、図９で示したフローにおけるステップＳ２で実行される処理の一例にあたる。

【0081】

時系列データ取得部１２３は、利用者が使用する新規の学習データである時系列データを利用者端末装置２から受信する（ステップＳ２０１）。そして、時系列データ取得部１２３は、取得した新規の時系列データを入力データ生成部１２１及び機械学習実行部１２４へ出力する。

【0082】

入力データ生成部１２１は、新規の時系列データを時系列データ取得部１２３から取得する。また、入力データ生成部１２１は要素の組合せの情報をメタ機械学習処理部１１から取得する。そして、入力データ生成部１２１は、新規の時系列データに対してフーリエ変換を行ない成分が強い周期のうち上位から所定数の周期を抽出する。次に、入力データ生成部１２１は、抽出した周期を用いて要素の組合せ毎の時系列特徴量のメタ特徴量として、要素の組合せ毎の時間幅を算出する（ステップＳ２０２）。

【0083】

入力データ生成部１２１は、要素の組合せ毎の時系列特徴量に対するメタ特徴量を学習済みのメタ機械学習モデル１５へ入力する。時系列特徴量決定部１２２は、メタ機械学習モデル１５から出力された要素の組合せ毎の重要度を取得する（ステップＳ２０３）。

【0084】

次に、時系列特徴量決定部１２２は、重要度の高い要素の組合せを、新規の時系列データを用いた学習に使用する要素の組合せとして決定する（ステップＳ２０４）。

【0085】

機械学習実行部１２４は、新たな時系列データの入力を機械学習実行部１２４から受ける。また、機械学習実行部１２４は、新規の時系列データを用いた学習に使用する要素の組合せの情報の入力を時系列特徴量決定部１２２から受ける。次に、機械学習実行部１２４は、新規の時系列データを用いた学習に使用する要素の組合せ毎に、新規の時系列データにおける時系列特徴量を算出する（ステップＳ２０５）。

【0086】

そして、機械学習実行部１２４は、新規の時系列データ及び時系列特徴量を用いて機械学習モデル１６の学習を実行する（ステップＳ２０６）。

【0087】

これにより、情報処理装置１は、学習済みの機械学習モデル１６を取得する（ステップＳ２０７）。

【0088】

以上に説明したように、本実施例に係る情報処理装置は、Permutation Importanceを用いて予測性能の評価を行ない、要素の組合せ毎の重要度を求める。また、情報処理装置は、時系列データをフーリエ変換して強い成分の周期を特定し、特定した強い成分の周期を用いて要素の組合せ毎の時系列特徴量に対するメタ特徴量を生成する。そして、情報処理装置は、生成したメタ特徴量を用いて、時系列特徴量の要素の組合せ毎の時系列特徴量に対するメタ特徴量から要素の組合せ毎の重要度を予測するメタ機械学習モデルの学習を実行する。

【0089】

これにより、時系列データの時系列特徴量の要素の組合せを自動的に決定することができる。より具体的には、時系列データの時系列特徴量の重要な要素の１つである時間幅を自動的に決定することが可能となる。そのため、時系列データの分析を自動化した際の分析にかかる時間を短縮でき且つデータを格納する記憶容量を抑えることができる。したがって、時系列データを用いる機械学習の効率を向上させることが可能となる。

【実施例0090】

次に、実施例２について説明する。本実施例に係る情報処理装置１も図１のブロック図で示される。本実施例に係る情報処理装置１は、時系列特徴量の要素のうち時間幅の重要度を用いて学習に使用する時系列特徴量の要素の組合せを決定することが実施例１と異なる。以下の説明では、実施例１と同様の各部の動作については説明を省略する場合がある。また、以下では時間幅の集合をＺとし、Ｚに含まれる各時間幅をｚｊとして説明する。

【0091】

メタ機械学習処理部１１の動作について説明する。本実施例に係るメタ機械学習処理部１１も図３のブロック図で表される。

【0092】

特徴量要素生成部１１２は、実施例１と同様に時系列特徴量の要素の組合せを生成する。時系列特徴量算出部１１３は、実施例１と同様に、特徴量要素生成部１１２により生成された全ての要素の組合せ毎に時系列特徴量を算出する。学習実行部１１４は、実施例１と同様に、要素の組合せ毎の時系列特徴量を用いて予測性能評価用モデル１４の学習を実行する。予測性能算出部１１５は、実施例１と同様に、時系列データを用いて学習済みの予測性能評価用モデル１４の要素の組合せ毎の予測性能を算出する。

【0093】

重要度算出部１１６は、時系列データそれぞれについての、要素の組合せ毎の時系列特徴量、予測結果及び予測性能の入力を予測性能算出部１１５から受ける。次に、重要度算出部１１６は、各時系列データｄｊについてPermutation Importanceを用いて要素のうちの時間幅ｚｊ毎の重要度Ｉ_{ｄｉ，ｚｊ}を算出する。具体的には、重要度算出部１１６は、時間幅ｚｊ毎に、時系列データｄｊ間で時系列特徴量をランダムに入れ替えて予測性能評価用モデル１４を用いて予測を行い、各場合の予測性能を算出する。

【0094】

図１２は、時間幅毎の重要度の算出を説明するための図である。図１２は、時系列データｄ１～ｄ３に対して、要素の組合せが、「６，６，３，ｍａｘ関数」、「６，６，３，ｍｉｎ関数」、「４，４，３，ｍａｘ関数」、「４，４，３，ｍｉｎ関数」の４つである場合を例に図示した。例えば、重要度算出部１１６は、図１２のグループ３０１における時系列データｄ１～ｄ３のそれぞれの時間幅が６の場合の時系列特徴量を列毎にランダムに入れ替えて、予測性能評価用モデル１４を用いて予測を行う。同様に、重要度算出部１１６は、時間幅が４の場合ついても時系列データｄ１～ｄ３間でランダムに列毎に時系列特徴量を入れ替えて、予測性能評価用モデル１４を用いて予測を行う。そして、重要度算出部１１６は、時間幅が６の場合の時系列特徴量をランダムに入れ替えた場合及び時間幅が４の場合の時系列特徴量をランダムに入れ替えた場合のそれぞれの時系列データ毎の予測性能を算出する。

【0095】

次に、重要度算出部１１６は、予測性能算出部１１５から取得した、各時系列データｄｊの予測性能ａ_ｄｉ，０と、時間幅ｚｊ毎に時系列データ間で各時系列特徴量をランダムに入れ替えた場合の予測性能とを比較する。そして、重要度算出部１１６は、各時系列データｄｊにおける時間幅ｚｊそれぞれの重要度Ｉ_{ｄｉ，ｚｊ}を算出する。その後、重要度算出部１１６は、算出した各時系列データｄｊにおける時間幅ｚｊそれぞれの重要度Ｉ_{ｄｉ，ｚｊ}の情報をメタ機械学習実行部１１８へ出力する。

【0096】

ここで、本実施例では、時間幅毎に含まれる時系列特徴量全てをまとめて入れ替えて重要度を求めたが、重要度の求め方はこれに限らない。例えば、重要度算出部１１６は、時間幅毎に含まれる時系列特徴量１つ１つについて入れ替えを行って重要度を求めて、それらの最大値や平均値を時間幅の重要度としてもよい。

【0097】

メタ特徴量算出部１１７は、各時系列データｄｉを時系列データ格納部１１１から取得する。また、メタ特徴量算出部１１７は、時間幅ｚｊの情報を特徴量要素生成部１１２から受ける。

【0098】

次に、メタ特徴量算出部１１７は、各時系列データｄｊに対してフーリエ変換を行う。そして、メタ特徴量算出部１１７は、時系列データｄｊそれぞれについて成分が強い周期のうち上位から所定数の周期を抽出する。

【0099】

次に、メタ特徴量算出部１１７は、時系列データｄｊそれぞれについて、抽出した周波数を基に時間幅ｚｊ毎の時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｚｊ}を算出する。本実施例では、メタ特徴量算出部１１７は、時間幅ｚｊそれぞれの時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｚｊ}として、周期の定数倍と時間幅との近さを示す情報を算出する。例えば、メタ特徴量算出部１１７は、時系列データｄｉに対してフーリエ変換を行なった場合の上位から所定数の強い成分の周期のそれぞれで時間幅ｚｊを除算した値に一番近い整数及びその整数と商との差分を時間幅ｚｊの時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｚｊ}とする。そして、メタ特徴量算出部１１７は、算出した各時系列データｄｉについての時間幅ｚｊの時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｚｊ}をメタ機械学習実行部１１８へ出力する。

【0100】

メタ機械学習実行部１１８は、各時系列データｄｉについての時間幅ｚｊそれぞれの重要度Ｉ_{ｄｉ，ｚｊ}の入力を重要度算出部１１６から受ける。また、メタ機械学習実行部１１８は、各時系列データｄｉについての時間幅ｚｊそれぞれの時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｚｊ}の入力をメタ特徴量算出部１１７から受ける。

【0101】

そして、メタ機械学習実行部１１８は、各時系列データｄｉにおける、時間幅ｚｊそれぞれの重要度Ｉ_{ｄｉ，ｚｊ}を回帰問題として、時間幅ｚｊそれぞれの時系列特徴量に対するメタ特徴量ｆ_{ｄｉ，ｚｊ}を用いてメタ機械学習モデル１５の学習を実行する。これにより、学習済みのメタ機械学習モデル１５が生成される。

【0102】

図１３は、実施例２に係るメタ機械学習を説明するための図である。ここでは、時系列データｄ１、ｄ２、・・・が存在する。そして、表３１０における列３１１が、各時系列データｄ１、ｄ２、・・・のそれぞれにおける時間幅を示す。さらに、枠３１２で囲われた部分が時間幅毎のメタ特徴量を示す。枠３１３で囲われた部分が要素の組合せ毎の重要度を示す。メタ機械学習実行部１１８は、枠３１４で囲われた部分のデータをメタ学習データとしてメタ機械学習モデル１５の学習を実行する。

【0103】

次に、機械学習処理部１２の動作について説明する。本実施例に係る機械学習処理部１２も図７のブロック図で表される。

【0104】

入力データ生成部１２１は、新規の時系列データの入力を時系列データ取得部１２３から受ける。また、入力データ生成部１２１は要素の組合せの情報をメタ機械学習処理部１１から取得する。そして、入力データ生成部１２１は、新規の時系列データにフーリエ変換を行ない成分が強い周期のうち上位から所定数の周期を抽出する。次に、入力データ生成部１２１は、抽出した周期を用いて時系列特徴量の要素の中の時間幅毎の時系列特徴量のメタ特徴量として、データの周期の定数倍と時間幅との近さを示す情報を算出する。その後、入力データ生成部１２１は、時間幅毎の時系列特徴量に対するメタ特徴量を学習済みのメタ機械学習モデル１５へ入力する。

【0105】

図１４は、実施例２に係る要素の組合せの重要度の算出を説明するための図である。例えば、入力データ生成部１２１は、新規の時系列データｄ’について時間幅毎に時系列特徴量に対するメタ特徴量を算出して、表３２１に示す情報を得る。その後、メタ機械学習モデル１５は、入力データ生成部１２１からの表３２１に示す情報の入力を受けて、新規の時系列データｄ’における時間幅毎の重要度２４２を出力する。

【0106】

時系列特徴量決定部１２２は、メタ機械学習モデル１５から出力された時間幅毎の重要度を取得する。そして、時系列特徴量決定部１２２は、重要度の高い時間幅を、新規の時系列データを用いた学習に使用する要素の組合せと決定する。例えば、時系列特徴量決定部１２２は、重要度の高い順に特定数の時間幅を抽出する。他にも、時系列特徴量決定部１２２は、予め決められた閾値よりも高い重要度の時間幅を抽出してもよい。その後、時系列特徴量決定部１２２は、決定した新規の時系列データを用いた学習に使用する時間幅の情報を機械学習実行部１２４へ出力する。

【0107】

機械学習実行部１２４は、新規の時系列データの入力を機械学習実行部１２４から受ける。また、機械学習実行部１２４は、新規の時系列データを用いた学習に使用する時間幅の情報の入力を時系列特徴量決定部１２２から受ける。

【0108】

次に、機械学習実行部１２４は、新規の時系列データを用いた学習に使用する時間幅を含む要素の組合せ毎に、新規の時系列データにおける時系列特徴量を算出する。そして、機械学習実行部１２４は、新規の時系列データ及び時系列特徴量を用いて機械学習モデル１６の学習を実行する。これにより、学習済みの機械学習モデル１６が生成される。

【0109】

図１５は、実施例２に係る情報処理装置によるメタ機械学習処理のフローチャートである。次に、図１５を参照して、実施例２に係る情報処理装置１によるメタ機械学習処理の流れを説明する。

【0110】

特徴量要素生成部１１２は、時系列データ格納部１１１に格納された時系列データを確認して、時系列データに応じて時系列特徴量の要素である、時間幅、ずらし幅、データ数及び関数を決定して、時系列特徴量の要素の組合せを複数生成する（ステップＳ３０１）。

【0111】

時系列特徴量算出部１１３は、時系列データ格納部１１１に格納された時系列データの集合から時系列データを１つ選択する（ステップＳ３０２）。

【0112】

時系列特徴量算出部１１３は、要素の組合せを特徴量要素生成部１１２から取得する。次に、時系列特徴量算出部１１３は、時系列データの集合を時系列データ格納部１１１から取得する。そして、時系列特徴量算出部１１３は、各時系列データについて、要素のうちの時間幅の全てについて時系列特徴量を算出する（ステップＳ３０３）。

【0113】

学習実行部１１４は、選択された時系列データの時間幅毎の時系列特徴量を時系列特徴量算出部１１３から取得する。そして、学習実行部１１４は、取得した時系列特徴量を用いて予測性能評価用モデル１４の学習を実行する（ステップＳ３０４）。

【0114】

予測性能算出部１１５は、時系列特徴量算出部１１３により選択された系列データを時系列データ格納部１１１から取得する。そして、予測性能算出部１１５は、選択された時系列データについて要素の組合せのうちの時間幅毎の時系列特徴量を生成して学習済みの予測性能評価用モデル１４へ入力して、予測結果を得る。その後、予測性能算出部１１５は、取得した予測結果を用いて予測性能評価用モデル１４の選択された時系列データの予測性能を算出する（ステップＳ３０５）。

【0115】

重要度算出部１１６は、選択された時系列データについての、時間幅毎の時系列特徴量、予測結果及び予測性能の入力を予測性能算出部１１５から受ける。次に、重要度算出部１１６は、Permutation Importanceを用いて時間幅毎の重要度を算出する（ステップＳ３０６）。

【0116】

メタ特徴量算出部１１７は、時系列特徴量算出部１１３により選択された時系列データを時系列データ格納部１１１から取得する。また、メタ特徴量算出部１１７は、要素の組合せの情報を特徴量要素生成部１１２から受ける。次に、メタ特徴量算出部１１７は、選択された時系列データに対してフーリエ変換を行う。そして、メタ特徴量算出部１１７は、抽出した周波数を基に要素のうちの時間幅毎の時系列特徴量に対するメタ特徴量として、データの周期の定数倍と時間幅との近さを示す情報を算出する（ステップＳ３０７）。

【0117】

次に、時系列特徴量算出部１１３は、時系列データ格納部１１１に格納された時系列データの集合に含まれる全ての時系列データについてメタ特徴量の算出を実行したか否かを判定する（ステップＳ３０８）。メタ特徴量を算出していない時系列データが存在する場合（ステップＳ３０８：否定）、時系列特徴量算出部１１３は、ステップＳ３０２へ戻る。

【0118】

これに対して、全ての時系列データについてメタ特徴量の算出を実行した場合（ステップＳ３０８：肯定）、メタ機械学習実行部１１８は、時間幅毎の重要度を重要度算出部１１６から取得する。また、メタ機械学習実行部１１８は、時間幅毎の時系列特徴量に対するメタ特徴量の入力をメタ特徴量算出部１１７から受ける。そして、メタ機械学習実行部１１８は、時間幅毎の重要度を回帰問題として、時間幅毎の時系列特徴量に対するメタ特徴量を用いてメタ機械学習モデル１５の学習を実行する（ステップＳ３０９）。

【0119】

これにより、情報処理装置１は、学習済みのメタ機械学習モデル１５を取得する（ステップＳ３１０）。

【0120】

以上に説明したように、本実施例に係る情報処理装置は、時間幅の時系列特徴量に対するメタ特徴量を入力として時間幅の重要度を出力するメタ機械学習モデルの学習をじっこうする。そして、情報処理装置は、学習済みのメタ機械学習モデルを用いて新規の時系列データを用いた学習に使用する時間幅を決定して、決定した時間幅を含む要素の組合せの時系列特徴量を用いて機械学習モデルの学習を実行する。

【0121】

これにより、時系列データの時系列特徴量の重要な要素の１つである時間幅を自動的に決定することが可能となる。そのため、時系列データの分析を自動化した際の分析にかかる時間を短縮でき且つデータを格納する記憶容量を抑えることができる。したがって、時系列データを用いる機械学習の効率を向上させることが可能となる。

【0122】

また、本実施例では、時間幅を時系列特徴量の特徴的な要素として１つ選択して、時間幅の重要度を用いて時系列特徴量を選択した。ただし、情報処理装置１は、ずらし幅などについても周期との関係性を示す値をメタ特徴量としてメタ機械学習モデル１５の学習を実行することで、ずらし幅の重要度を算出でき、その値を用いて時系列特徴量を選択することも可能である。

【0123】

（変形例１）
図１７は、変形例１における時系列データの一例を示す図である。本変形例に係る情報処理装置１は、図１７に示すような複数の異なる系列のデータ４０１～４０３を含む時系列データ４００を取り扱う。時系列データ４００は、例えば、ｘ軸ｙ軸ｚ軸を有する速度センサで得られる情報であり、データ４０１がｘ軸の速度情報、データ４０２がｙ軸の速度情報、データ４０３がｚ軸の速度情報である。

【0124】

メタ機械学習処理部１１、機械学習処理部１２及び予測部１３いずれも、時系列データ４００の各系列のデータ４０１～４０３をそれぞれ異なる時系列データとしてみなし、系列毎にタスクを設定して学習及び予測を実行する。

【0125】

これにより、本変形例に係る情報処理装置は、複数の異なる系列のデータを含む時系列データについても、１つの系列を含む時系列データの場合と同様に処理することができ、適切な時系列特徴量を設定して予測を行うことが可能となる。したがって、複数の異なる系列のデータを含む時系列データについても、時系列データを用いる機械学習の効率を向上させることが可能となる。

【0126】

（変形例２）
図１８は、変形例２に係る時系列データの一例を示す図である。本変形例に係る情報処理装置１は、図１８に示すようなそれぞれに予め目的変数（ラベル）が設定されている時系列データ４１１～４１３を取り扱う。例えば、時系列データ４１１～４１３は６０秒間の人の動きを検出するセンサによって得られるデータである。そして、時系列データ４１１には「歩き」というラベルが与えられ、時系列データ４１２には「走り」というラベルが与えられ、時系列データ４１３には「ジャンプ」というラベルが与えられる。

【0127】

メタ機械学習処理部１１、機械学習処理部１２及び予測部１３いずれも、時系列データ４１１～４１３をそのままつなげて１列の時系列データとして学習及び予測を実行する。

【0128】

これにより、本変形例に係る情報処理装置は、予め目的変数が設定された時系列データの場合であっても各実施例の場合と同様に処理することができ、適切な時系列特徴量を設定して予測を行うことが可能となる。したがって、予め目的変数が設定された時系列データについても、時系列データを用いる機械学習の効率を向上させることが可能となる。

【0129】

（ハードウェア構成）
図１９は、情報処理装置のハードウェア構成図である。以上の各実施例及び各変型例で説明した情報処理装置１は、図１９のようなハードウェア構成で実現することが可能である。例えば、情報処理装置１は、プロセッサ９１、メモリ９２、ハードディスク９３及び通信装置９４を有する。プロセッサ９１は、バスを介して、メモリ９２、ハードディスク９３及び通信装置９４と接続される。

【0130】

通信装置９４は、情報処理装置１と外部装置との通信のためのインタフェースである。通信装置９４は、例えば、プロセッサ９１と利用者端末装置２との間の通信を中継する。

【0131】

ハードディスク９３は、補助記憶装置である。ハードディスク９３は、図１に例示した予測性能評価用モデル１４、メタ機械学習モデル１５及び機械学習モデル１６を格納する。また、ハードディスク９３は、図１に例示した、メタ機械学習処理部１１、機械学習処理部１２及び予測部１３の機能を実現するためのプログラムを含む各種プログラムを格納する。

【0132】

メモリ９２は、主記憶装置である。メモリ９２は、例えば、ＤＲＡＭ（Dynamic Random Access Memory）である。

【0133】

プロセッサ９１は、ハードディスク９３に格納された各種プログラムを読み出してメモリ９２に展開して実行する。これにより、プロセッサ９１は、図１に例示した、メタ機械学習処理部１１、機械学習処理部１２及び予測部１３の機能を実現する。

IP Force 特許公報掲載プロジェクト 2022.1.31 β版