IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-67486情報処理プログラム、情報処理方法及び情報処理装置
<>
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図1
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図2
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図3
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図4
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図5
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図6
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図7
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図8
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図9
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図10
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図11
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図12
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図13
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図14
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図15
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図16
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図17
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図18
  • 特開-情報処理プログラム、情報処理方法及び情報処理装置 図19
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024067486
(43)【公開日】2024-05-17
(54)【発明の名称】情報処理プログラム、情報処理方法及び情報処理装置
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240510BHJP
【FI】
G06N20/00
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022177603
(22)【出願日】2022-11-04
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】浦 晃
(57)【要約】
【課題】時系列データを用いる機械学習の効率を向上させる情報処理プログラム、情報処理方法及び情報処理装置を提供する。
【解決手段】時系列データの周波数成分のうち所定基準より強い周波数成分を特定し、時系列データの複数の時系列特徴量を生成する際に用いる1つ以上のパラメータと特定した周波数成分の周期との関係性を示す値を、パラメータに対する特徴量として算出し、時系列特徴量を用いた予測に対する、各パラメータを基に生成される時系列特徴量のそれぞれの重要度と、各パラメータに対する特徴量とを用いて、各パラメータに対する特徴量から時系列特徴量の重要度を予測する第1の機械学習モデルの学習を実行し、学習済みの第1の機械学習モデルを用いて新規の時系列データについて時系列特徴量の重要度を予測する処理をコンピュータに実行させる。
【選択図】図11
【特許請求の範囲】
【請求項1】
時系列データの周波数成分のうち所定基準より強い周波数成分を特定し、
前記時系列データの複数の時系列特徴量を生成する際に用いる1つ以上のパラメータと特定した周波数成分の周期との関係性を示す値を、前記パラメータに対する特徴量として算出し、
前記時系列特徴量を用いた予測に対する、各前記パラメータを基に生成される前記時系列特徴量のそれぞれの重要度と、各前記パラメータに対する前記特徴量とを用いて、各前記パラメータに対する特徴量から前記時系列特徴量の前記重要度を予測する第1の機械学習モデルの学習を実行し、
学習済みの前記第1の機械学習モデルを用いて新規の時系列データについて時系列特徴量の重要度を予測する
処理をコンピュータに実行させることを特徴とする情報処理プログラム。
【請求項2】
前記周期の定数倍を前記パラメータのうちの時間幅で除算した結果を基に、前記パラメータと前記特定した周波数成分の周期との関係性を示す値を算出することを特徴とする請求項1に記載の情報処理プログラム。
【請求項3】
前記新規のデータについて前記パラメータに対する特徴量を算出し、算出した前記パラメータに対する特徴量を学習済みの前記第1の機械学習モデルに入力して、前記新規の時系列データについて前記時系列特徴量の前記重要度を予測することを特徴とする請求項1に記載の情報処理プログラム。
【請求項4】
前記予測した前記新規の時系列データについての前記時系列特徴量の前記重要度を基に、前記時系列特徴量を入力データとした予測を行う第2の機械学習モデルの学習に使用する特定の時系列特徴量を決定し、
前記時系列データについての前記特定の時系列特徴量を用いて前記第2の機械学習モデルの学習を実行する
処理を前記コンピュータにさらに実行させることを特徴とする請求項1に記載の情報処理プログラム。
【請求項5】
前記パラメータに含まれる時間幅に対する特徴量を前記パラメータに対する特徴量として算出し、
前記時間幅毎の重要度を前記時系列特徴量のそれぞれの重要度として算出し、
前記時間幅毎の重要度と各前記時間幅に対する前記特徴量とを用いて、前記第1の機械学習モデルの学習を実行する
ことを特徴とする請求項1に記載の情報処理プログラム。
【請求項6】
情報処理装置が、
時系列データの周波数成分のうち所定基準より強い周波数成分を特定し、
前記時系列データの複数の時系列特徴量を生成する際に用いる1つ以上のパラメータと特定した周波数成分の周期との関係性を示す値を、前記パラメータに対する特徴量として算出し、
前記時系列特徴量を用いた予測に対する、各前記パラメータを基に生成される前記時系列特徴量のそれぞれの重要度と、各前記パラメータに対する前記特徴量とを用いて、各前記パラメータに対する特徴量から前記時系列特徴量の前記重要度を予測する第1の機械学習モデルの学習を実行し、
学習済みの前記第1の機械学習モデルを用いて新規の時系列データについて時系列特徴量の重要度を予測する
処理を実行することを特徴とする情報処理方法。
【請求項7】
時系列データの周波数成分のうち所定基準より強い周波数成分を特定し、前記時系列データの複数の時系列特徴量を生成する際に用いる1つ以上のパラメータと特定した周波数成分の周期との関係性を示す値を、前記パラメータに対する特徴量として算出するメタ特徴量算出部と、
前記時系列特徴量を用いた予測に対する、各前記パラメータを基に生成される前記時系列特徴量のそれぞれの重要度と、各前記パラメータに対する前記特徴量とを用いて、各前記パラメータに対する特徴量から前記時系列特徴量の前記重要度を予測する第1の機械学習モデルの学習を実行するメタ機械学習実行部と、
学習済みの前記第1の機械学習モデルを用いて新規の時系列データについて時系列特徴量の重要度を予測する時系列特徴量決定部と
を備えたことを特徴とする情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理プログラム、情報処理方法及び情報処理装置に関する。
【背景技術】
【0002】
機械学習を用いた分析に含まれる様々なタスクのうち一部を自動化する技術は、自動機械学習(AutoML(Machine Leaning))と呼ばれる。自動機械学習では、機械学習のアルゴリズムに対してハイパーパラメータの設定値の最適化や、最も精度の高い結果をもたらすアルゴリズムの選択などの処理が自動化される。
【0003】
このような自動機械学習は、多方面で用いられるようになってきているが、時系列データに対する自動機械学習はまだ十分に研究されているとは言えない段階である。ここでの時系列データとは、データが取得された時刻情報を含むデータを指す。例えば、時刻を含むユーザのアクセスログは時系列データである。これに対して、誕生日を含むユーザデータは、誕生日は時刻ではあるがデータが取得された時刻情報ではないため、時系列データではない。
【0004】
時系列データに対する自動機械学習が進まない理由として、以下のようなものが挙げられる。時系列データを用いる機械学習では、適切な分析が行えるように時系列特徴量を生成することが求められることが多い。時系列特徴量とは、時系列データを特徴づける特徴量であり、時系列データが対応する時刻より前の時刻の情報を使用した特徴量である。
【0005】
このような時系列特徴量を自動的に生成する場合、膨大な数の時系列特徴量の候補が存在するため、時間やデータ量の観点から全ての時系列特徴量の候補を生成することが困難であることが1つの理由である。時系列データを用いる場合、例えば、どの時間幅を使用するかということが時系列特徴量の要素の1つとなり得るが、時間幅の決め方は多数存在する。時間幅とは、例えば、1時間、1日、1週間などの1まとめとする時系列データの時間範囲を決定する情報である。使用する時間幅を人為的に決める場合であれば、各時間範囲の意味を考慮して有望な時間幅の取捨選択が可能であるが、自動機械学習では、それらの意味を自動的に考慮することは難しいため、全ての時間幅について評価を行うことになる。
【0006】
なお、自働機械学習における技術として、特徴量のメタ特徴量から、各特徴量の重要度を算出する技術が提案されている。メタ特徴量とは、ある特徴量がどのような特徴量であるかを表現する情報である。また、時系列データを周波数領域データに変換し、周波数データから時系列データに設定する時間幅を決定し、決定した時間幅の時系列データを用いた機械学習結果から各時間幅の重要度を算出して、時間幅を選択する技術が提案されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】国際公開第2020/059498号
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、メタ特徴量を用いて各特徴量の重要度を決定する技術を用いようとしても、時間幅などから生成される時系列特徴量に対するメタ特徴量が自明ではない。そのため、単にメタ特徴量を用いても、時系列特徴量の重要度を評価することは難しく、時系列特徴量を適切に選択することは困難である。例えば、時系列特徴量のメタ特徴量として、時間幅、時間幅に含まれる時系列データをまとめた範囲データに対して次の範囲データまでのずらす量にあたるずらし幅、範囲データの使用数、時系列特徴量を算出するための関数の組合せを用いる場合を考える。このようなメタ特徴量を用いた場合、時間軸のスケーリングに対してメタ特徴量が表現する内容が変化してしまうなどの理由から、各メタ特徴量を有する時系列データ毎の重要度を求めることが困難である。また、周波数データから時系列データに設定する時間幅を決定する技術では、各時間的特徴量の重要度を評価することが困難であり、時系列特徴量を適切に選択することは困難である。したがって、従来の自動機械学習の技術では、時系列データを用いる機械学習の効率を向上させることは困難であった。
【0009】
開示の技術は、上記に鑑みてなされたものであって、時系列データを用いる機械学習の効率を向上させる情報処理プログラム、情報処理方法及び情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
本願の開示する情報処理プログラム、情報処理方法及び情報処理装置の一つの態様において、時系列データの周波数成分のうち所定基準より強い周波数成分を特定し、前記時系列データの複数の時系列特徴量を生成する際に用いる1つ以上のパラメータと特定した周波数成分の周期との関係性を示す値を、前記パラメータに対する特徴量として算出し、前記時系列特徴量を用いた予測に対する、各前記パラメータを基に生成される前記時系列特徴量のそれぞれの重要度と、各前記パラメータに対する前記特徴量とを用いて、各前記パラメータに対する特徴量から前記時系列特徴量の前記重要度を予測する第1の機械学習モデルの学習を実行し、前記学習済みの前記第1の機械学習モデルを用いて新規の時系列データについて時系列特徴量の重要度を予測する処理をコンピュータに実行させる。
【発明の効果】
【0011】
1つの側面では、本発明は、時系列データを用いる機械学習の効率を向上させることができる。
【図面の簡単な説明】
【0012】
図1図1は、実施例1に係る情報処理装置のブロック図である。
図2図2は、情報処理装置が用いるデータを説明するための図である。
図3図3は、メタ機械学習処理部のブロック図である。
図4図4は、時系列データ毎の要素の組合せ及び時系列特徴量と目的変数との対応を示す図である。
図5図5は、フーリエ変換を行う時系列データの一例を示す図である。
図6図6は、実施例1に係るメタ機械学習を説明するための図である。
図7図7は、機械学習処理部のブロック図である。
図8図8は、実施例1に係る要素の組合せの重要度の算出を説明するための図である。
図9図9は、実施例に係る情報処理装置による時系列データに対する機械学習を用いた予測処理の概要を示すフローチャートである。
図10図10は、実施例1に係る情報処理装置によるメタ機械学習処理のフローチャートである。
図11図11は、実施例1に係る情報処理装置による機械学習処理のフローチャートである。
図12図12は、時間幅毎の重要度の算出を説明するための図である。
図13図13は、実施例2に係るメタ機械学習を説明するための図である。
図14図14は、実施例2に係る要素の組合せの重要度の算出を説明するための図である。
図15図15は、実施例2に係る情報処理装置によるメタ機械学習処理のフローチャートである。
図16図16は、実施例2に係る情報処理装置による機械学習処理のフローチャートである。
図17図17は、変形例1における時系列データの一例を示す図である。
図18図18は、変形例2における時系列データの一例を示す図である。
図19図19は、情報処理装置のハードウェア構成図である。
【発明を実施するための形態】
【0013】
以下に、本願の開示する情報処理プログラム、情報処理方法及び情報処理装置の実施例を図面に基づいて詳細に説明する。なお、以下の実施例により本願の開示する情報処理プログラム、情報処理方法及び情報処理装置が限定されるものではない。
【実施例0014】
図1は、実施例1に係る情報処理装置のブロック図である。本実施例に係る情報処理装置1は、利用者端末装置2とネットワークで接続される。情報処理装置1は、図1に示すように、メタ機械学習処理部11、機械学習処理部12、予測部13、予測性能評価用モデル14、メタ機械学習モデル15及び機械学習モデル16を有する。
【0015】
本実施形態に係る情報処理装置1は、時系列データの複数の時系列特徴量のそれぞれのメタ特徴量を用いて各時系列特徴量の重要度を求めるメタ機械学習モデル15の学習を実行する。次に、情報処理装置1は、新たな時系列データの時系列特徴量のメタ特徴量を学習済みのメタ機械学習モデル15に用いて各時系列特徴量の重要度を算出し、算出した重要度を用いて新たな時系列データに基づく予測を行う場合の時系列特徴量を決定する。そして、情報処理装置1は、新たな時系列データの決定した時系列特徴量を用いて機械学習モデル16の学習を行う。その後、情報処理装置1は、予測対象の時系列データを学習済みの機械学習モデル16に入力して特定の予測を実行する。
【0016】
図2は、情報処理装置が用いるデータを説明するための図である。ここで、図2を参照して、情報処理装置1が用いる各種のデータについて説明する。
【0017】
情報処理装置1は、例えば、時系列データd1~d3を用いる。時系列データd1~d3は、データの取得の時間間隔が一定とみなすことが可能な時系列データである。すなわち、時系列データd1~d3は、一定の時間間隔に得られた個別データの集合である。図2に示した時系列データd1~d3は、複数の四角が一列に並べられて示されており、この1つの四角が1つの個別データにあたる。時系列データd1~d3は、個別データが時間経過にしたがって並べられる。さらに、図2では、各個別データの四角内に記載された数字が、それぞれの個別データの値を表す。個別データは、一定間隔で取得されるため、時系列データd1~d3における連続する個別データの個数により時間経過が表される。連続する個別データの数が同じであれば、同じ時間幅で取得された個別データといえる。以下の説明では、時間を個別データの数で表す。すなわち、n個の個別データで表される時間をnと呼ぶ。
【0018】
また、本実施例では、時系列データd1~d3の特徴量である時系列特徴量を決定する要素の組合せという概念を用いる。要素の組合せは、例えば、1つの範囲データのサイズを決定する「時間幅」、範囲データ間の間隔である「ずらし幅」及び特徴量の算出に使用する範囲データの個数である「データ数」という要素を含む。
【0019】
例えば、時系列データd1における要則の組合せの例として範囲データ201~203を用いることができる。範囲データ201~203におけるそれぞれの時間経過が時間幅であり、範囲データ201~203で表される要素の組合せの時間幅は6である。また、範囲データ201の最も時刻が遅い個別データから範囲データ202の最も時刻が遅い個別データまでの時間経過204がずらし幅であり、範囲データ201~203で表される要素の組合せのずらし幅は6であり時間幅と一致する。さらに、範囲データ201~203は3つであるので、範囲データ201~203で表される要素の組合せのデータ数は3である。
【0020】
要素の組合せに含まれる時間幅、ずらし幅及びデータ数は、自由に決定される。また、時間幅とずらし幅とは異なってもよい。図2における時系列データd3に示した範囲データ211~213で表される要素の組合せは、時間幅が6であり、時間経過214で表されるずらし幅が3であり、データ数が3である。他にも、例えば、時間幅は4であってもよし、データ数は10であってもよい。また、時間幅は時系列データの全データの数であり、データ数を1とすることもできる。
【0021】
ここで、データ数は、数値を直接決定しなくても、ある時点より時刻が後の範囲データの数として規定してもよい。また、要素の組合せに含まれる要素は、他の情報を用いることもできる。例えば、「一番最近の範囲データの最初の時刻」なども要素として用いることが可能であるが、通常は一番最近の範囲データは、一番新しいデータを含むように設定されるため、ここでは「一番最近の範囲データの最初の時刻」は要素には含めない。
【0022】
さらに、本実施例では、時系列特徴量は、時間幅、ずらし幅及びデータ数で規定される範囲データに対して特定の関数を用いて算出される。関数は、どの様な関数であってもよい。例えば、関数は、最大値を取得するmax関数、最小値を取得するmin関数、平均値を算出するmean関数又は標準偏差を算出するstddev関数等の単純な関数でもよいし、フーリエ変換を行う関数等を用いることも可能である。
【0023】
すなわち、本実施例では、時系列特徴量は、時間幅、ずらし幅及びデータ数と関数との組合せにより算出される。したがって、本実施例に係る時系列特徴量を生成するための要素の組合せは、時間幅、ずらし幅、データ数及び関数を要素として有する。
【0024】
図1に戻って説明を続ける。予測性能評価用モデル14は、時系列データに対する複数の時系列特徴量を用いて予測を行う機械学習モデルである。予測性能評価用モデル14は、時系列特徴量の入力を受けて、予測結果を出力する。例えば、時系列データが毎日の売り上げのデータであり予測対象が明日の売り上げ予測である場合、予測評価用モデル14は、売り上げのデータの入力を受けて、明日の売り上げを予測して出力する。
【0025】
メタ機械学習モデル15は、メタ特徴量を用いて予測を行い予測結果として、入力されたメタ特徴量を有する時系列特徴量の重要度を予測する機械学習モデルである。例えば、メタ機械学習モデル15は、特定の時間幅、ずらし幅、データ数及び関数の要素の組合せを有する時系列特徴量について、その時系列特徴量の要素の時間幅から得られるメタ特徴量を用いて予測を行い、その時系列特徴量の重要度を出力する。このメタ機械学習モデル15が、「第1の機械学習モデル」の一例にあたる。
【0026】
機械学習モデル16は、時系列データに対する機械学習処理部12により選択された時系列特徴量を入力として予測を行う機械学習モデルである。機械学習モデル16は、時系列データの入力を受けて、特定の予測による予測結果を出力する。例えば、時系列データが毎日の売り上げのデータであり予測対象が明日の売り上げ予測である場合、機械学習モデル16は、売り上げのデータの入力を受けて、入力された時系列データに応じた時系列特徴量を用いて明日の売り上げを予測して出力する。なお、ここで例示する機械学習モデル16を用いた予測は一例である。例えば、時系列データを入力データとして将来の時系列データの値や推移を予測する機械学習モデルや、時系列データに基づいて異常の有無等を予測する機械学習モデルも、機械学習モデル16として採用可能である。この機械学習モデル16が、「第2の機械学習モデル」の一例にあたる。
【0027】
メタ機械学習処理部11は、時系列データにおける時系列特徴量の要素の組合せに対して予測性能評価用モデル14から出力される予測結果の評価を行ない、時系列特徴量の要素の組合せそれぞれの重要度を求める。そして、メタ機械学習処理部11は、要素の組合毎の時系列特徴量に対するメタ特徴量及び要素の組合せ毎の重要度を用いてメタ機械学習モデル15の学習を行う。以下に、メタ機械学習処理部11の詳細について説明する。
【0028】
図3は、メタ機械学習処理部のブロック図である。メタ機械学習処理部11は、時系列データ格納部111、特徴量要素生成部112、時系列特徴量算出部113、学習実行部114、予測性能算出部115、重要度算出部116、メタ特徴量算出部117及びメタ機械学習実行部118を有する。
【0029】
時系列データ格納部111は、メタ機械学習モデル15の学習に用いる複数の時系列データの集合を格納する。時系列データ格納部111は、管理者等により予め入力された時系列データを保持する。各時系列データは、タスク設定方法が予め指定される。
【0030】
特徴量要素生成部112は、時系列データ格納部111に格納された時系列データを確認して、時系列データに応じて時系列特徴量の要素である、時間幅、ずらし幅、データ数及び関数を決定して、時系列特徴量の要素の組合せを複数生成する。本実施例では、特徴量要素生成部112は、要素の中のデータ数を定数とする。その後、特徴量要素生成部112は、生成した時系列特徴量の要素の組合せを時系列特徴量算出部113へ出力する。
【0031】
例えば、特徴量要素生成部112は、「時間幅,ずらし幅,データ数,関数」=「6,6,3,max関数」、「6,6,3,min関数」、「4,4,3,max関数」、「4,4,3,min関数」などとして要素の組合せを生成する。ここで、特徴量要素生成部112は、時間幅とずらし幅とを異ならせることも可能である。また、特徴量要素生成部112は、データ数を変数とすることも可能である。
【0032】
時系列特徴量算出部113、学習実行部114、予測性能算出部115、重要度算出部116及びメタ特徴量算出部117は、以下に説明する処理を、時系列データ格納部111に格納された時系列データの集合に含まれる全ての時系列データについて実行する。ここでは、時系列データの集合のうち時系列データdiについての処理を説明する。また、ここでは、要素の組合せの集合をWとし、Wに含まれる要素の組合せそれぞれをwjとする。
【0033】
時系列特徴量算出部113は、要素の組合せの入力を特徴量要素生成部112から受ける。次に、時系列特徴量算出部113は、時系列データの集合に含まれる1つの時系列データdiを時系列データ格納部111から取得する。そして、時系列特徴量算出部113は、時系列データdiについて、要素の組合せwj毎に時系列特徴量を算出する。例えば、時系列特徴量の要素の組合せが4つ存在する場合、時系列特徴量算出部113は、時系列データdiについて4つの要素の組合せ毎に時系列特徴量を算出する。時系列特徴量算出部113は、算出した時系列データdiの要素の組合せwjのそれぞれの時系列特徴量を学習実行部114へ出力する。
【0034】
学習実行部114は、時系列データdiの要素の組合せwjのそれぞれの時系列特徴量の入力を時系列特徴量算出部113から受ける。そして、学習実行部114は、取得した時系列特徴量を用いて予測性能評価用モデル14の学習を実行する。例えば、時系列データを用いて将来の値の予測を行う場合、学習実行部114は、所定の時刻までの時系列データの時系列特徴量及びその所定の時刻に対する時系列データに含まれる予測値の正解を用いて予測性能評価用モデル14の学習を行うことができる。これにより、学習済みの予測性能評価用モデル14が生成される。
【0035】
ここで、学習実行部114は、ロジスティック回帰やランダムフォレストのように単一の学習器を用いて予測性能評価用モデル14の学習を行っても良いし、自動機械学習のように複数の前処理や学習器を探索して予測性能評価用モデル14の学習を行っても良い。
【0036】
予測性能算出部115は、時系列データdiを時系列データ格納部111から取得する。そして、予測性能算出部115は、時系列データdiから要素の組合せwj毎の時系列特徴量を生成して学習済みの予測性能評価用モデル14へ入力して、時系列データdiに対する予測結果を得る。その後、予測性能算出部115は、取得した予測結果を用いて予測性能評価用モデル14の時系列データdiの予測性能adi,0を算出する。例えば、予測性能算出部115は、決定係数(R2)を用いて予測性能adi,0を算出することができる。
【0037】
ここで、予測性能算出部115は、時系列データの集合の中の評価用の時系列データを用いて予測性能を算出しても良いし、予測性能評価用モデル14の学習に用いられた時系列データを用いて予測性能を算出しても良い。その後、予測性能算出部115は、時系列データdiについての、要素の組合せwj毎の時系列特徴量、予測結果及び予測性能adi,0を重要度算出部116へ出力する。
【0038】
図4は、時系列データ毎の要素の組合せ及び時系列特徴量と予測結果との対応を示す図である。図4は、時系列データd1~d3に対して、要素の組合せが、「6,6,3,max関数」、「6,6,3,min関数」、「4,4,3,max関数」、「4,4,3,min関数」の4つである場合を例に図示した。
【0039】
表220は、時系列データd1~d3それぞれについての要素の組合せ毎の時系列特徴量とそれに対する目的変数との対応を示す。時系列特徴量221は、素の組合せが「6,6,3,max関数」である場合の時系列データd1の1つの範囲データの時系列特徴量を表す。また、目的変数へ予測するべき値であり、目的変数の値と予測した値とを比較して予測性能が算出される。すなわち、表220は、時系列データd1~d3毎に、4つの要素の組合せ毎の時系列特徴量とそれに対する目的変数とを対応付けて示す。予測性能算出部115は、時系列データd1~d3のそれぞれの予測結果について予測性能を算出する。
【0040】
図3に戻って説明を続ける。重要度算出部116は、時系列データdiについての、要素の組合せwjそれぞれの時系列特徴量、予測結果及び予測性能adi,0の入力を予測性能算出部115から受ける。次に、重要度算出部116は、以下のPermutation Importanceと呼ばれる特徴量の予測精度に対する各時系列特徴量の寄与度の評価手法を用いて要素の組合せwjのそれぞれの重要度を算出する。
【0041】
具体的には、重要度算出部116は、要素の組合せwjについて、要素の組合せwj毎に、時系列データdiとランダムに選んだ他の時系列データとの間で時系列特徴量を入れ替えて予測性能評価用モデル14を用いて予測を行う。そして、重要度算出部116は、入れ替えを行った場合のそれぞれの予測性能を算出する。
【0042】
例えば、重要度算出部116は、図4のグループ222における時系列データd1~d3のそれぞれの「6,6,3,max関数」という要素の組合せの場合の時系列特徴量を列毎にランダムに入れ替えて、予測性能評価用モデル14を用いて時系列データ毎に予測を行う。同様に、重要度算出部116は、「6,6,3,min関数」、「4,4,3,max関数」、「6,6,3,min関数」といった要素の組合せについても時系列データd1~d3間でランダムに列毎に時系列特徴量を入れ替えて、予測性能評価用モデル14を用いて時系列データ毎に予測を行う。そして、重要度算出部116は、「6,6,3,max関数」、「6,6,3,min関数」、「4,4,3,max関数」、「6,6,3,min関数」といった要素の組合せについてランダムに入れ替えた場合のそれぞれの時系列データ毎の予測性能を算出する。
【0043】
次に、重要度算出部116は、予測性能算出部115から取得した予測性能adi,0と、要素の組合せwj毎に時系列データ間で各時系列特徴量をランダムに入れ替えた場合の予測性能とを比較する。そして、重要度算出部116は、比較結果を基に時系列データdiでの要素の組合せwj毎の重要度Idi,wjを算出する。より具体的には、重要度算出部116は、ある要素の組合せのデータを入れ替えた場合と、他の要素の組合せのデータを入れ替えた場合とで、入れ替えを行わない場合の予測性能よりもより予測性能が低くなった方を重要度が高いと判定する。予測性能が低くなるということは、データを入れ替えることでより予測が難しくなったことを意味する。
【0044】
その後、重要度算出部116は、算出した時系列データdiにおける要素の組合せwj毎の重要度Idi,wjの情報をメタ機械学習実行部118へ出力する。
【0045】
ここで、本実施例では、要素の組合せに含まれる時系列特徴量全てをまとめて入れ替えて重要度を求めたが、重要度の求め方はこれに限らない。例えば、重要度算出部116は、要素の組合せに含まれる時系列特徴量1つ1つについて入れ替えを行って重要度を求めて、それらの最大値や平均値を要素の組合せの重要度としてもよい。
【0046】
メタ特徴量算出部117は、時系列データdiを時系列データ格納部111から取得する。また、メタ特徴量算出部117は、全ての要素の組合せwjの情報を特徴量要素生成部112から受ける。
【0047】
次に、メタ特徴量算出部117は、時系列データdiに対してフーリエ変換を行う。そして、メタ特徴量算出部117は、成分が強い周期のうち上位から所定数の周期を抽出する。すなわち、メタ特徴量算出部117は、時系列データの周波数成分のうち所定基準より強い周波数成分を特定する。この場合、所定基準は、上位から所定数の周期の最下位の周期を有する周波数成分である。
【0048】
図5は、フーリエ変換を行う時系列データの一例を示す図である。グラフ231及び232ともに、横軸で時間経過を表し、縦軸でデータの値を表す。ただし、グラフ232は、グラフ231と比べて横軸の時間の表示単位が異なる。
【0049】
例えば、図5におけるグラフ231では、周期1000の成分が1番強く、周期100の成分が2番目に強い。グラフ232の場合、周期10000の成分が1番強く、周期1000の成分が2番目に強い。すなわち、2つの周期を抽出する場合、メタ特徴量算出部117は、フーリエ変換の結果がグラフ231であれば周期1000及び周期100を抽出し、フーリエ変換の結果がグラフ232であれば周期10000及び周期1000を抽出する。
【0050】
そして、メタ特徴量算出部117は、抽出した周波数を基に時系列データdiにおける要素の組合せwj毎の時系列特徴量に対するメタ特徴量fdi,wjを算出する。本実施例では、メタ特徴量算出部117は、要素の組合せwj毎の時系列特徴量に対するメタ特徴量fdi,wjとして、データの周期の定数倍と時間幅との近さを示す情報を算出する。
【0051】
例えば、メタ特徴量算出部117は、時系列データdiに対してフーリエ変換を行なった場合の上位から所定数の強い成分の周期のそれぞれで時間幅を除算した値に一番近い整数及びその整数と商との差分をメタ特徴量fdi,wjとする。ここで、特定の要素の組合せwjにおける時間幅をzとする。そして、1番強い成分の周期をT1とし、2番目に強い成分の周期とT2とした場合を考える。この場合、メタ特徴量算出部117は、z/T1に最も近い整数n1を算出する。また、メタ特徴量算出部117は、z/T2に最も近い整数n2を算出する。そして、メタ特徴量算出部117は、n1、|n1-z/T1|、n2、|n2-z/T2|を特定の要素の組合せの時系列特徴量に対するメタ特徴量fdi,wjとする。
【0052】
そして、メタ特徴量算出部117は、算出した要素の組合せwj毎の時系列特徴量に対するメタ特徴量fdi,wjをメタ機械学習実行部118へ出力する。このように、メタ特徴量算出部117は、時系列データの複数の時系列特徴量を生成する際に用いる1つ以上のパラメータ(要素)と特定した周波数成分の周期との関係性を示す値を、パラメータに対する特徴量として算出する。
【0053】
メタ機械学習実行部118は、全ての時系列データdiにおける要素の組合せwjのそれぞれの重要度Idi,wjの入力を重要度算出部116から受ける。また、メタ機械学習実行部118は、全ての時系列データdiにおける要素の組合せwj毎の時系列特徴量に対するメタ特徴量fdi,wjの入力をメタ特徴量算出部117から受ける。
【0054】
そして、メタ機械学習実行部118は、全ての時系列データdiにおける、要素の組合せwjのそれぞれの重要度Idi,wjを回帰問題として、要素の組合せwj毎の時系列特徴量に対するメタ特徴量fdi,wjを用いてメタ機械学習モデル15の学習を実行する。これにより、学習済みのメタ機械学習モデル15が生成される。
【0055】
図6は、実施例1に係るメタ機械学習を説明するための図である。ここでは、時系列データd1、d2、・・・が存在する。そして、表240における列群Wの部分が、各時系列データd1、d2、・・・に対するそれぞれの時系列特徴量の要素の組合せを示す。本実施例ではデータ数は固定なので図示を省略した。さらに、枠241で囲われた部分が要素の組合せ毎のメタ特徴量を示す。枠242で囲われた部分が要素の組合せ毎の重要度を示す。メタ機械学習実行部118は、枠243で囲われた部分のデータをメタ学習データとしてメタ機械学習モデル15の学習を実行する。
【0056】
機械学習処理部12は、機械学習モデル16の学習に用いる時系列データを取得して、その時系列データの学習に適する時系列特徴量の要素の組合せを決定し、決定した要素の組合せから得られる時系列特徴量を用いて機械学習モデル16の学習を実行する。以下に、機械学習処理部12の詳細について説明する。
【0057】
図7は、機械学習処理部のブロック図である。機械学習処理部12は、入力データ生成部121、時系列特徴量決定部122、時系列データ取得部123及び機械学習実行部124を有する。
【0058】
時系列データ取得部123は、利用者が使用する新規の学習データである時系列データを利用者端末装置2から受信する。そして、時系列データ取得部123は、取得した新規の時系列データを入力データ生成部121及び機械学習実行部124へ出力する。
【0059】
入力データ生成部121は、新規の時系列データの入力を時系列データ取得部123から受ける。また、入力データ生成部121は要素の組合せの情報をメタ機械学習処理部11から取得する。そして、入力データ生成部121は、新規の時系列データにフーリエ変換を行ない成分が強い周期のうち上位から所定数の周期を抽出する。次に、入力データ生成部121は、抽出した周期を用いて要素の組合せ毎の時系列特徴量のメタ特徴量として、要素の組合せ毎にデータの周期の定数倍と時間幅との近さを示す情報を算出する。その後、入力データ生成部121は、要素の組合せ毎の時系列特徴量に対するメタ特徴量を学習済みのメタ機械学習モデル15へ入力する。
【0060】
図8は、実施例1に係る要素の組合せの重要度の算出を説明するための図である。例えば、時系列データ取得部123は、新規の時系列データd’を取得する。次に、入力データ生成部121は、列群W’で示される要素の組合せの情報をメタ機械学習処理部11から取得する。次に、入力データ生成部121は、新規の時系列データd’について、要素の組合せ毎に時系列特徴量に対するメタ特徴量を算出して、表251に示す情報を得る。その後、メタ機械学習モデル15は、入力データ生成部121からの表251に示す情報の入力を受けて、新規の時系列データd’における要素の組合せ毎の重要度252を出力する。
【0061】
図7に戻って説明を続ける。時系列特徴量決定部122は、メタ機械学習モデル15から出力された新規の時系列データにおける要素の組合せ毎の重要度を取得する。そして、時系列特徴量決定部122は、重要度の高い要素の組合せを、新規の時系列データを用いた学習に使用する要素の組合せと決定する。例えば、時系列特徴量決定部122は、重要度の高い順に特定数の要素の組合せを抽出する。他にも、時系列特徴量決定部122は、予め決められた閾値よりも高い重要度の要素の組合せを抽出してもよい。その後、時系列特徴量決定部122は、決定した新規の時系列データを用いた学習に使用する要素の組合せの情報を機械学習実行部124へ出力する。
【0062】
機械学習実行部124は、新規の時系列データの入力を時系列データ取得部123から受ける。また、機械学習実行部124は、新規の時系列データを用いた学習に使用する要素の組合せの情報の入力を時系列特徴量決定部122から受ける。
【0063】
次に、機械学習実行部124は、新規の時系列データを用いた学習に使用する要素の組合せ毎に、新規の時系列データにおける時系列特徴量を算出する。そして、機械学習実行部124は、新規の時系列データ及び時系列特徴量を用いて機械学習モデル16の学習を実行する。これにより、学習済みの機械学習モデル16が生成される。
【0064】
予測部13は、予測対象となる時系列データを利用者端末装置2から受信する。そして、予測部13は、予測対象となる時系列データを学習済みの機械学習モデル16に入力して出力される予測結果を取得する。そして、予測部13は、予測対象となる時系列データに対する予測結果を利用者端末装置2へ送信する。
【0065】
図9は、実施例に係る情報処理装置による時系列データに対する機械学習を用いた予測処理の概要を示すフローチャートである。次に、図9を参照して、実施例に係る情報処理装置1による時系列データに対する機械学習を用いた予測処理の概要を説明する。
【0066】
メタ機械学習処理部11は、時系列データにおける時系列特徴量の要素の組合せに対して予測性能評価用モデル14を用いて予測結果の評価を行ない、時系列特徴量の要素の組合せそれぞれの重要度を求める。そして、メタ機械学習処理部11は、時系列特徴量の要素の組合せ、メタ特徴量及び時系列特徴量の要素の組合せの重要度を用いてメタ機械学習モデル15の学習を行うメタ機械学習処理を実行する(ステップS1)。
【0067】
機械学習処理部12は、機械学習モデル16の学習に用いる時系列データを取得して、その時系列データの学習に適する時系列特徴量の要素の組合せを決定する。そして、機械学習処理部12は、決定した要素の組合せから得られる時系列特徴量を用いて機械学習モデル16の学習を行う機械学習処理を実行する(ステップS2)。
【0068】
予測部13は、予測に用いる時系列データを利用者端末装置2から受信する。そして、予測部13は、予測に用いる時系列データを学習済みの機械学習モデル16に入力して出力される予測結果を取得する。これにより、予測部13は、利用者端末装置2から受信した時系列データに対する予測を実行する(ステップS3)。
【0069】
図10は、実施例1に係る情報処理装置によるメタ機械学習処理のフローチャートである。次に、図10を参照して、実施例1に係る情報処理装置1によるメタ機械学習処理の流れを説明する。図10に示した各処理は、図9で示したフローにおけるステップS1で実行される処理の一例にあたる。
【0070】
特徴量要素生成部112は、時系列データ格納部111に格納された時系列データを確認して、時系列データに応じて時系列特徴量の要素である、時間幅、ずらし幅、データ数及び関数を決定して、時系列特徴量の要素の組合せを複数生成する(ステップS101)。
【0071】
時系列特徴量算出部113は、時系列データ格納部111に格納された時系列データの集合から時系列データを1つ選択する(ステップS102)。
【0072】
次に、時系列特徴量算出部113は、要素の組合せを特徴量要素生成部112から取得する。そして、時系列特徴量算出部113は、選択した時系列データについて、全ての要素の組合せについての時系列特徴量を算出する(ステップS103)。
【0073】
学習実行部114は、選択された時系列データの要素の組合せ毎の時系列特徴量を時系列特徴量算出部113から取得する。そして、学習実行部114は、取得した時系列特徴量を用いて予測性能評価用モデル14の学習を実行する(ステップS104)。
【0074】
予測性能算出部115は、時系列特徴量算出部113により選択された時系列データを時系列データ格納部111から取得する。そして、予測性能算出部115は、時系列データから時系列特徴量の要素の組合せ毎の時系列特徴量を生成して学習済みの予測性能評価用モデル14へ入力して、予測結果を得る。その後、予測性能算出部115は、取得した予測結果を用いて予測性能評価用モデル14の選択された時系列データの予測性能を算出する(ステップS105)。
【0075】
重要度算出部116は、選択された時系列データについての、要素の組合せ毎の時系列特徴量、予測結果及び予測性能の入力を予測性能算出部115から受ける。次に、重要度算出部116は、Permutation Importanceを用いて選択された時系列データについて要素の組合せ毎の重要度を算出する(ステップS106)。
【0076】
メタ特徴量算出部117は、時系列特徴量算出部113により選択された時系列データを時系列データ格納部111から取得する。また、メタ特徴量算出部117は、要素の組合せの情報を特徴量要素生成部112から受ける。次に、メタ特徴量算出部117は、選択された時系列データに対してフーリエ変換を行う。そして、メタ特徴量算出部117は、抽出した周波数を基に要素の組合せ毎の時系列特徴量に対するメタ特徴量として、データの周期の定数倍と時間幅との近さを示す情報を算出する(ステップS107)。
【0077】
次に、時系列特徴量算出部113は、時系列データ格納部111に格納された時系列データの集合に含まれる全ての時系列データについてメタ特徴量の算出を実行したか否かを判定する(ステップS108)。メタ特徴量を算出していない時系列データが存在する場合(ステップS108:否定)、時系列特徴量算出部113は、ステップS102へ戻る。
【0078】
これに対して、全ての時系列データについてメタ特徴量の算出を実行した場合(ステップS108:肯定)、メタ機械学習実行部118は、要素の組合せのそれぞれの重要度を重要度算出部116から取得する。また、メタ機械学習実行部118は、要素の組合せ毎の時系列特徴量に対するメタ特徴量の入力をメタ特徴量算出部117から受ける。そして、メタ機械学習実行部118は、要素の組合せ毎の重要度を回帰問題として、要素の組合せ毎の時系列特徴量に対するメタ特徴量を用いてメタ機械学習モデル15の学習を実行する(ステップS109)。
【0079】
これにより、情報処理装置1は、学習済みのメタ機械学習モデル15を取得する(ステップS110)。
【0080】
図11は、実施例1に係る情報処理装置による機械学習処理のフローチャートである。次に、図11を参照して、実施例1に係る情報処理装置1による機械学習処理の流れを説明する。図11に示した各処理は、図9で示したフローにおけるステップS2で実行される処理の一例にあたる。
【0081】
時系列データ取得部123は、利用者が使用する新規の学習データである時系列データを利用者端末装置2から受信する(ステップS201)。そして、時系列データ取得部123は、取得した新規の時系列データを入力データ生成部121及び機械学習実行部124へ出力する。
【0082】
入力データ生成部121は、新規の時系列データを時系列データ取得部123から取得する。また、入力データ生成部121は要素の組合せの情報をメタ機械学習処理部11から取得する。そして、入力データ生成部121は、新規の時系列データに対してフーリエ変換を行ない成分が強い周期のうち上位から所定数の周期を抽出する。次に、入力データ生成部121は、抽出した周期を用いて要素の組合せ毎の時系列特徴量のメタ特徴量として、要素の組合せ毎の時間幅を算出する(ステップS202)。
【0083】
入力データ生成部121は、要素の組合せ毎の時系列特徴量に対するメタ特徴量を学習済みのメタ機械学習モデル15へ入力する。時系列特徴量決定部122は、メタ機械学習モデル15から出力された要素の組合せ毎の重要度を取得する(ステップS203)。
【0084】
次に、時系列特徴量決定部122は、重要度の高い要素の組合せを、新規の時系列データを用いた学習に使用する要素の組合せとして決定する(ステップS204)。
【0085】
機械学習実行部124は、新たな時系列データの入力を機械学習実行部124から受ける。また、機械学習実行部124は、新規の時系列データを用いた学習に使用する要素の組合せの情報の入力を時系列特徴量決定部122から受ける。次に、機械学習実行部124は、新規の時系列データを用いた学習に使用する要素の組合せ毎に、新規の時系列データにおける時系列特徴量を算出する(ステップS205)。
【0086】
そして、機械学習実行部124は、新規の時系列データ及び時系列特徴量を用いて機械学習モデル16の学習を実行する(ステップS206)。
【0087】
これにより、情報処理装置1は、学習済みの機械学習モデル16を取得する(ステップS207)。
【0088】
以上に説明したように、本実施例に係る情報処理装置は、Permutation Importanceを用いて予測性能の評価を行ない、要素の組合せ毎の重要度を求める。また、情報処理装置は、時系列データをフーリエ変換して強い成分の周期を特定し、特定した強い成分の周期を用いて要素の組合せ毎の時系列特徴量に対するメタ特徴量を生成する。そして、情報処理装置は、生成したメタ特徴量を用いて、時系列特徴量の要素の組合せ毎の時系列特徴量に対するメタ特徴量から要素の組合せ毎の重要度を予測するメタ機械学習モデルの学習を実行する。
【0089】
これにより、時系列データの時系列特徴量の要素の組合せを自動的に決定することができる。より具体的には、時系列データの時系列特徴量の重要な要素の1つである時間幅を自動的に決定することが可能となる。そのため、時系列データの分析を自動化した際の分析にかかる時間を短縮でき且つデータを格納する記憶容量を抑えることができる。したがって、時系列データを用いる機械学習の効率を向上させることが可能となる。
【実施例0090】
次に、実施例2について説明する。本実施例に係る情報処理装置1も図1のブロック図で示される。本実施例に係る情報処理装置1は、時系列特徴量の要素のうち時間幅の重要度を用いて学習に使用する時系列特徴量の要素の組合せを決定することが実施例1と異なる。以下の説明では、実施例1と同様の各部の動作については説明を省略する場合がある。また、以下では時間幅の集合をZとし、Zに含まれる各時間幅をzjとして説明する。
【0091】
メタ機械学習処理部11の動作について説明する。本実施例に係るメタ機械学習処理部11も図3のブロック図で表される。
【0092】
特徴量要素生成部112は、実施例1と同様に時系列特徴量の要素の組合せを生成する。時系列特徴量算出部113は、実施例1と同様に、特徴量要素生成部112により生成された全ての要素の組合せ毎に時系列特徴量を算出する。学習実行部114は、実施例1と同様に、要素の組合せ毎の時系列特徴量を用いて予測性能評価用モデル14の学習を実行する。予測性能算出部115は、実施例1と同様に、時系列データを用いて学習済みの予測性能評価用モデル14の要素の組合せ毎の予測性能を算出する。
【0093】
重要度算出部116は、時系列データそれぞれについての、要素の組合せ毎の時系列特徴量、予測結果及び予測性能の入力を予測性能算出部115から受ける。次に、重要度算出部116は、各時系列データdjについてPermutation Importanceを用いて要素のうちの時間幅zj毎の重要度Idi,zjを算出する。具体的には、重要度算出部116は、時間幅zj毎に、時系列データdj間で時系列特徴量をランダムに入れ替えて予測性能評価用モデル14を用いて予測を行い、各場合の予測性能を算出する。
【0094】
図12は、時間幅毎の重要度の算出を説明するための図である。図12は、時系列データd1~d3に対して、要素の組合せが、「6,6,3,max関数」、「6,6,3,min関数」、「4,4,3,max関数」、「4,4,3,min関数」の4つである場合を例に図示した。例えば、重要度算出部116は、図12のグループ301における時系列データd1~d3のそれぞれの時間幅が6の場合の時系列特徴量を列毎にランダムに入れ替えて、予測性能評価用モデル14を用いて予測を行う。同様に、重要度算出部116は、時間幅が4の場合ついても時系列データd1~d3間でランダムに列毎に時系列特徴量を入れ替えて、予測性能評価用モデル14を用いて予測を行う。そして、重要度算出部116は、時間幅が6の場合の時系列特徴量をランダムに入れ替えた場合及び時間幅が4の場合の時系列特徴量をランダムに入れ替えた場合のそれぞれの時系列データ毎の予測性能を算出する。
【0095】
次に、重要度算出部116は、予測性能算出部115から取得した、各時系列データdjの予測性能adi,0と、時間幅zj毎に時系列データ間で各時系列特徴量をランダムに入れ替えた場合の予測性能とを比較する。そして、重要度算出部116は、各時系列データdjにおける時間幅zjそれぞれの重要度Idi,zjを算出する。その後、重要度算出部116は、算出した各時系列データdjにおける時間幅zjそれぞれの重要度Idi,zjの情報をメタ機械学習実行部118へ出力する。
【0096】
ここで、本実施例では、時間幅毎に含まれる時系列特徴量全てをまとめて入れ替えて重要度を求めたが、重要度の求め方はこれに限らない。例えば、重要度算出部116は、時間幅毎に含まれる時系列特徴量1つ1つについて入れ替えを行って重要度を求めて、それらの最大値や平均値を時間幅の重要度としてもよい。
【0097】
メタ特徴量算出部117は、各時系列データdiを時系列データ格納部111から取得する。また、メタ特徴量算出部117は、時間幅zjの情報を特徴量要素生成部112から受ける。
【0098】
次に、メタ特徴量算出部117は、各時系列データdjに対してフーリエ変換を行う。そして、メタ特徴量算出部117は、時系列データdjそれぞれについて成分が強い周期のうち上位から所定数の周期を抽出する。
【0099】
次に、メタ特徴量算出部117は、時系列データdjそれぞれについて、抽出した周波数を基に時間幅zj毎の時系列特徴量に対するメタ特徴量fdi,zjを算出する。本実施例では、メタ特徴量算出部117は、時間幅zjそれぞれの時系列特徴量に対するメタ特徴量fdi,zjとして、周期の定数倍と時間幅との近さを示す情報を算出する。例えば、メタ特徴量算出部117は、時系列データdiに対してフーリエ変換を行なった場合の上位から所定数の強い成分の周期のそれぞれで時間幅zjを除算した値に一番近い整数及びその整数と商との差分を時間幅zjの時系列特徴量に対するメタ特徴量fdi,zjとする。そして、メタ特徴量算出部117は、算出した各時系列データdiについての時間幅zjの時系列特徴量に対するメタ特徴量fdi,zjをメタ機械学習実行部118へ出力する。
【0100】
メタ機械学習実行部118は、各時系列データdiについての時間幅zjそれぞれの重要度Idi,zjの入力を重要度算出部116から受ける。また、メタ機械学習実行部118は、各時系列データdiについての時間幅zjそれぞれの時系列特徴量に対するメタ特徴量fdi,zjの入力をメタ特徴量算出部117から受ける。
【0101】
そして、メタ機械学習実行部118は、各時系列データdiにおける、時間幅zjそれぞれの重要度Idi,zjを回帰問題として、時間幅zjそれぞれの時系列特徴量に対するメタ特徴量fdi,zjを用いてメタ機械学習モデル15の学習を実行する。これにより、学習済みのメタ機械学習モデル15が生成される。
【0102】
図13は、実施例2に係るメタ機械学習を説明するための図である。ここでは、時系列データd1、d2、・・・が存在する。そして、表310における列311が、各時系列データd1、d2、・・・のそれぞれにおける時間幅を示す。さらに、枠312で囲われた部分が時間幅毎のメタ特徴量を示す。枠313で囲われた部分が要素の組合せ毎の重要度を示す。メタ機械学習実行部118は、枠314で囲われた部分のデータをメタ学習データとしてメタ機械学習モデル15の学習を実行する。
【0103】
次に、機械学習処理部12の動作について説明する。本実施例に係る機械学習処理部12も図7のブロック図で表される。
【0104】
入力データ生成部121は、新規の時系列データの入力を時系列データ取得部123から受ける。また、入力データ生成部121は要素の組合せの情報をメタ機械学習処理部11から取得する。そして、入力データ生成部121は、新規の時系列データにフーリエ変換を行ない成分が強い周期のうち上位から所定数の周期を抽出する。次に、入力データ生成部121は、抽出した周期を用いて時系列特徴量の要素の中の時間幅毎の時系列特徴量のメタ特徴量として、データの周期の定数倍と時間幅との近さを示す情報を算出する。その後、入力データ生成部121は、時間幅毎の時系列特徴量に対するメタ特徴量を学習済みのメタ機械学習モデル15へ入力する。
【0105】
図14は、実施例2に係る要素の組合せの重要度の算出を説明するための図である。例えば、入力データ生成部121は、新規の時系列データd’について時間幅毎に時系列特徴量に対するメタ特徴量を算出して、表321に示す情報を得る。その後、メタ機械学習モデル15は、入力データ生成部121からの表321に示す情報の入力を受けて、新規の時系列データd’における時間幅毎の重要度242を出力する。
【0106】
時系列特徴量決定部122は、メタ機械学習モデル15から出力された時間幅毎の重要度を取得する。そして、時系列特徴量決定部122は、重要度の高い時間幅を、新規の時系列データを用いた学習に使用する要素の組合せと決定する。例えば、時系列特徴量決定部122は、重要度の高い順に特定数の時間幅を抽出する。他にも、時系列特徴量決定部122は、予め決められた閾値よりも高い重要度の時間幅を抽出してもよい。その後、時系列特徴量決定部122は、決定した新規の時系列データを用いた学習に使用する時間幅の情報を機械学習実行部124へ出力する。
【0107】
機械学習実行部124は、新規の時系列データの入力を機械学習実行部124から受ける。また、機械学習実行部124は、新規の時系列データを用いた学習に使用する時間幅の情報の入力を時系列特徴量決定部122から受ける。
【0108】
次に、機械学習実行部124は、新規の時系列データを用いた学習に使用する時間幅を含む要素の組合せ毎に、新規の時系列データにおける時系列特徴量を算出する。そして、機械学習実行部124は、新規の時系列データ及び時系列特徴量を用いて機械学習モデル16の学習を実行する。これにより、学習済みの機械学習モデル16が生成される。
【0109】
図15は、実施例2に係る情報処理装置によるメタ機械学習処理のフローチャートである。次に、図15を参照して、実施例2に係る情報処理装置1によるメタ機械学習処理の流れを説明する。
【0110】
特徴量要素生成部112は、時系列データ格納部111に格納された時系列データを確認して、時系列データに応じて時系列特徴量の要素である、時間幅、ずらし幅、データ数及び関数を決定して、時系列特徴量の要素の組合せを複数生成する(ステップS301)。
【0111】
時系列特徴量算出部113は、時系列データ格納部111に格納された時系列データの集合から時系列データを1つ選択する(ステップS302)。
【0112】
時系列特徴量算出部113は、要素の組合せを特徴量要素生成部112から取得する。次に、時系列特徴量算出部113は、時系列データの集合を時系列データ格納部111から取得する。そして、時系列特徴量算出部113は、各時系列データについて、要素のうちの時間幅の全てについて時系列特徴量を算出する(ステップS303)。
【0113】
学習実行部114は、選択された時系列データの時間幅毎の時系列特徴量を時系列特徴量算出部113から取得する。そして、学習実行部114は、取得した時系列特徴量を用いて予測性能評価用モデル14の学習を実行する(ステップS304)。
【0114】
予測性能算出部115は、時系列特徴量算出部113により選択された系列データを時系列データ格納部111から取得する。そして、予測性能算出部115は、選択された時系列データについて要素の組合せのうちの時間幅毎の時系列特徴量を生成して学習済みの予測性能評価用モデル14へ入力して、予測結果を得る。その後、予測性能算出部115は、取得した予測結果を用いて予測性能評価用モデル14の選択された時系列データの予測性能を算出する(ステップS305)。
【0115】
重要度算出部116は、選択された時系列データについての、時間幅毎の時系列特徴量、予測結果及び予測性能の入力を予測性能算出部115から受ける。次に、重要度算出部116は、Permutation Importanceを用いて時間幅毎の重要度を算出する(ステップS306)。
【0116】
メタ特徴量算出部117は、時系列特徴量算出部113により選択された時系列データを時系列データ格納部111から取得する。また、メタ特徴量算出部117は、要素の組合せの情報を特徴量要素生成部112から受ける。次に、メタ特徴量算出部117は、選択された時系列データに対してフーリエ変換を行う。そして、メタ特徴量算出部117は、抽出した周波数を基に要素のうちの時間幅毎の時系列特徴量に対するメタ特徴量として、データの周期の定数倍と時間幅との近さを示す情報を算出する(ステップS307)。
【0117】
次に、時系列特徴量算出部113は、時系列データ格納部111に格納された時系列データの集合に含まれる全ての時系列データについてメタ特徴量の算出を実行したか否かを判定する(ステップS308)。メタ特徴量を算出していない時系列データが存在する場合(ステップS308:否定)、時系列特徴量算出部113は、ステップS302へ戻る。
【0118】
これに対して、全ての時系列データについてメタ特徴量の算出を実行した場合(ステップS308:肯定)、メタ機械学習実行部118は、時間幅毎の重要度を重要度算出部116から取得する。また、メタ機械学習実行部118は、時間幅毎の時系列特徴量に対するメタ特徴量の入力をメタ特徴量算出部117から受ける。そして、メタ機械学習実行部118は、時間幅毎の重要度を回帰問題として、時間幅毎の時系列特徴量に対するメタ特徴量を用いてメタ機械学習モデル15の学習を実行する(ステップS309)。
【0119】
これにより、情報処理装置1は、学習済みのメタ機械学習モデル15を取得する(ステップS310)。
【0120】
以上に説明したように、本実施例に係る情報処理装置は、時間幅の時系列特徴量に対するメタ特徴量を入力として時間幅の重要度を出力するメタ機械学習モデルの学習をじっこうする。そして、情報処理装置は、学習済みのメタ機械学習モデルを用いて新規の時系列データを用いた学習に使用する時間幅を決定して、決定した時間幅を含む要素の組合せの時系列特徴量を用いて機械学習モデルの学習を実行する。
【0121】
これにより、時系列データの時系列特徴量の重要な要素の1つである時間幅を自動的に決定することが可能となる。そのため、時系列データの分析を自動化した際の分析にかかる時間を短縮でき且つデータを格納する記憶容量を抑えることができる。したがって、時系列データを用いる機械学習の効率を向上させることが可能となる。
【0122】
また、本実施例では、時間幅を時系列特徴量の特徴的な要素として1つ選択して、時間幅の重要度を用いて時系列特徴量を選択した。ただし、情報処理装置1は、ずらし幅などについても周期との関係性を示す値をメタ特徴量としてメタ機械学習モデル15の学習を実行することで、ずらし幅の重要度を算出でき、その値を用いて時系列特徴量を選択することも可能である。
【0123】
(変形例1)
図17は、変形例1における時系列データの一例を示す図である。本変形例に係る情報処理装置1は、図17に示すような複数の異なる系列のデータ401~403を含む時系列データ400を取り扱う。時系列データ400は、例えば、x軸y軸z軸を有する速度センサで得られる情報であり、データ401がx軸の速度情報、データ402がy軸の速度情報、データ403がz軸の速度情報である。
【0124】
メタ機械学習処理部11、機械学習処理部12及び予測部13いずれも、時系列データ400の各系列のデータ401~403をそれぞれ異なる時系列データとしてみなし、系列毎にタスクを設定して学習及び予測を実行する。
【0125】
これにより、本変形例に係る情報処理装置は、複数の異なる系列のデータを含む時系列データについても、1つの系列を含む時系列データの場合と同様に処理することができ、適切な時系列特徴量を設定して予測を行うことが可能となる。したがって、複数の異なる系列のデータを含む時系列データについても、時系列データを用いる機械学習の効率を向上させることが可能となる。
【0126】
(変形例2)
図18は、変形例2に係る時系列データの一例を示す図である。本変形例に係る情報処理装置1は、図18に示すようなそれぞれに予め目的変数(ラベル)が設定されている時系列データ411~413を取り扱う。例えば、時系列データ411~413は60秒間の人の動きを検出するセンサによって得られるデータである。そして、時系列データ411には「歩き」というラベルが与えられ、時系列データ412には「走り」というラベルが与えられ、時系列データ413には「ジャンプ」というラベルが与えられる。
【0127】
メタ機械学習処理部11、機械学習処理部12及び予測部13いずれも、時系列データ411~413をそのままつなげて1列の時系列データとして学習及び予測を実行する。
【0128】
これにより、本変形例に係る情報処理装置は、予め目的変数が設定された時系列データの場合であっても各実施例の場合と同様に処理することができ、適切な時系列特徴量を設定して予測を行うことが可能となる。したがって、予め目的変数が設定された時系列データについても、時系列データを用いる機械学習の効率を向上させることが可能となる。
【0129】
(ハードウェア構成)
図19は、情報処理装置のハードウェア構成図である。以上の各実施例及び各変型例で説明した情報処理装置1は、図19のようなハードウェア構成で実現することが可能である。例えば、情報処理装置1は、プロセッサ91、メモリ92、ハードディスク93及び通信装置94を有する。プロセッサ91は、バスを介して、メモリ92、ハードディスク93及び通信装置94と接続される。
【0130】
通信装置94は、情報処理装置1と外部装置との通信のためのインタフェースである。通信装置94は、例えば、プロセッサ91と利用者端末装置2との間の通信を中継する。
【0131】
ハードディスク93は、補助記憶装置である。ハードディスク93は、図1に例示した予測性能評価用モデル14、メタ機械学習モデル15及び機械学習モデル16を格納する。また、ハードディスク93は、図1に例示した、メタ機械学習処理部11、機械学習処理部12及び予測部13の機能を実現するためのプログラムを含む各種プログラムを格納する。
【0132】
メモリ92は、主記憶装置である。メモリ92は、例えば、DRAM(Dynamic Random Access Memory)である。
【0133】
プロセッサ91は、ハードディスク93に格納された各種プログラムを読み出してメモリ92に展開して実行する。これにより、プロセッサ91は、図1に例示した、メタ機械学習処理部11、機械学習処理部12及び予測部13の機能を実現する。
【符号の説明】
【0134】
1 情報処理装置
2 利用者端末装置
11 メタ機械学習処理部
12 機械学習処理部
13 予測部
14 予測性能評価用モデル
15 メタ機械学習モデル
16 機械学習モデル
111 時系列データ格納部
112 特徴量要素生成部
113 時系列特徴量算出部
114 学習実行部
115 予測性能算出部
116 重要度算出部
117 メタ特徴量算出部
118 メタ機械学習実行部
121 入力データ生成部
122 時系列特徴量決定部
123 時系列データ取得部
124 機械学習実行部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19