特許7462254 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＡＩ　ｉｎｓｉｄｅ株式会社の特許一覧

特許7462254プログラム、方法、情報処理装置、システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2024-03-28

(45)【発行日】2024-04-05

(54)【発明の名称】プログラム、方法、情報処理装置、システム

(51)【国際特許分類】

G06N 20/00 20190101AFI20240329BHJP

G06N 3/044 20230101ALI20240329BHJP

G06N 3/096 20230101ALI20240329BHJP

【ＦＩ】

G06N20/00

G06N3/044

G06N3/096

【請求項の数】 13

(21)【出願番号】P 2023191369

(22)【出願日】2023-11-09

【審査請求日】2023-11-09

【早期審査対象出願】

(73)【特許権者】

【識別番号】516092005

【氏名又は名称】ＡＩｉｎｓｉｄｅ株式会社

(74)【代理人】

【識別番号】110002815

【氏名又は名称】ＩＰＴｅｃｈ弁理士法人

(72)【発明者】

【氏名】渡辺康仁

(72)【発明者】

【氏名】東健太朗

【審査官】牛丸太希

(56)【参考文献】

【文献】特開２０２１－１５７６１９（ＪＰ，Ａ）

【文献】特開２０２０－００４３６０（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ２０／００

Ｇ０６Ｎ３／０４４

Ｇ０６Ｎ３／０９６

(57)【特許請求の範囲】

【請求項1】

プロセッサと、記憶部とを備えるコンピュータに実行させるためのプログラムであって、
前記プロセッサが、
時系列データである第１学習データを取得する第１学習データ取得ステップと、
複数の時系列予測モデルと、当該複数の時系列予測モデルの学習に用いられる時系列データである学習データと、当該複数の時系列予測モデルの学習パラメータと、をそれぞれ関連付けて記憶する記憶ステップと、
前記第１学習データ取得ステップにおいて取得した前記第１学習データに基づき、前記記憶ステップにおいて記憶した前記複数の学習データのうち、時系列推移が前記第１学習データと類似する第２学習データを特定するデータ特定ステップと、
前記記憶ステップにおいて、前記データ特定ステップにおいて特定した前記第２学習データと関連付けて記憶した第２学習パラメータを取得するパラメータ取得ステップと、
前記第１学習データに基づき、前記パラメータ取得ステップにおいて取得した前記第２学習パラメータに基づく初期パラメータを用いて学習モデルを学習させる学習ステップと、
前記第１学習データ取得ステップにおいて取得した前記第１学習データと、前記データ特定ステップにおいて特定した前記第２学習データとの類似度に基づき、前記パラメータ取得ステップにおいて取得した前記第２学習パラメータを修正する修正ステップと、
を実行し、
前記学習ステップは、前記修正ステップにおいて修正した前記第２学習パラメータに基づき初期パラメータを用いて前記学習モデルを学習させるステップである、
プログラム。

【請求項2】

前記記憶ステップは、前記複数の時系列予測モデルと、当該複数の時系列予測モデルの最適化後パラメータと、をそれぞれ関連付けて記憶するステップであり、
前記パラメータ取得ステップは、前記記憶ステップにおいて、前記データ特定ステップにおいて特定した前記第２学習データと関連付けて記憶した第２最適化後パラメータを取得するステップであり、
前記学習ステップは、前記第１学習データに基づき、前記パラメータ取得ステップにおいて取得した前記第２最適化後パラメータに基づく初期パラメータを用いて前記学習モデルを学習させるステップである、
請求項１記載のプログラム。

【請求項3】

前記記憶ステップは、前記複数の時系列予測モデルと、当該複数の時系列予測モデルの初期パラメータと、をそれぞれ関連付けて記憶するステップであり、
前記パラメータ取得ステップは、前記記憶ステップにおいて、前記データ特定ステップにおいて特定した前記第２学習データと関連付けて記憶した第２初期パラメータを取得するステップであり、
前記学習ステップは、前記第１学習データに基づき、前記パラメータ取得ステップにおいて取得した前記第２初期パラメータに基づく初期パラメータを用いて前記学習モデルを学習させるステップである、
請求項１記載のプログラム。

【請求項4】

前記データ特定ステップは、
前記第１学習データと、前記複数の学習データとの間のマンハッタン距離、ユークリッド距離、コサイン類似度および相関係数の少なくともいずれか１つの値を算定するステップと、
前記算定された値に基づく類似度に応じて前記第２学習データを特定するステップと、
を含む、
請求項１記載のプログラム。

【請求項5】

前記修正ステップは、前記第１学習データと前記第２学習データとの前記類似度に応じて定まる範囲の乱数に基づき、前記第２学習パラメータを修正するステップである、
請求項１記載のプログラム。

【請求項6】

前記データ特定ステップは、前記第１学習データ取得ステップにおいて取得した前記第１学習データの目的変数と、前記記憶ステップにおいて記憶した前記複数の学習データの目的変数と、に基づき算定される類似度に基づき前記第２学習データを特定するステップである、
請求項１記載のプログラム。

【請求項7】

プロセッサと、記憶部とを備えるコンピュータに実行させるためのプログラムであって、
前記プロセッサが、
時系列データである第１学習データを取得する第１学習データ取得ステップと、
複数の時系列予測モデルと、当該複数の時系列予測モデルの学習に用いられる時系列データである学習データと、当該複数の時系列予測モデルの学習パラメータと、をそれぞれ関連付けて記憶する記憶ステップと、
前記第１学習データ取得ステップにおいて取得した前記第１学習データに基づき、前記記憶ステップにおいて記憶した前記複数の学習データのうち、時系列推移が前記第１学習データと類似する第２学習データを特定するデータ特定ステップと、
前記記憶ステップにおいて、前記データ特定ステップにおいて特定した前記第２学習データと関連付けて記憶した第２学習パラメータを取得するパラメータ取得ステップと、
前記第１学習データに基づき、前記パラメータ取得ステップにおいて取得した前記第２学習パラメータに基づく初期パラメータを用いて学習モデルを学習させる学習ステップと、
を実行し、
前記データ特定ステップは、
前記第１学習データ取得ステップにおいて取得した前記第１学習データの目的変数と、前記記憶ステップにおいて記憶した前記複数の学習データの目的変数と、に基づき算定される類似度に基づき複数の第２学習データ候補を特定する第１ステップと、
前記第１学習データ取得ステップにおいて取得した前記第１学習データの説明変数と、前記複数の第２学習データ候補の説明変数と、に基づき算定される類似度に基づき前記第２学習データを特定する第２ステップと、
を含む、
プログラム。

【請求項8】

前記第１ステップは、前記第１学習データ取得ステップにおいて取得した前記第１学習データの説明変数と、前記記憶ステップにおいて記憶した前記複数の学習データの説明変数と、に基づき前記類似度を算定しないステップである、
請求項７記載のプログラム。

【請求項9】

前記プロセッサが、
目的変数の入力に応じて目的変数を出力可能な第２学習モデルを記憶するモデル記憶ステップと、
を実行し、
前記データ特定ステップは、前記第１学習データ取得ステップにおいて取得した前記第１学習データの目的変数を入力データとして、前記モデル記憶ステップにおいて記憶した前記第２学習モデルに適用することにより出力される目的変数に基づき、前記第２学習データを特定するステップである、
請求項１記載のプログラム。

【請求項10】

【請求項11】

プロセッサと、メモリとを備えるコンピュータに実行される方法であって、前記プロセッサが、請求項１から請求項１０のいずれかに係る発明において実行される全てのステップを実行する方法。

【請求項12】

制御部と、記憶部とを備える情報処理装置であって、前記制御部が、請求項１から請求項１０のいずれかに係る発明において実行される全てのステップを実行する情報処理装置。

【請求項13】

請求項１から請求項１０のいずれかに係る発明において実行される全てのステップを実行する手段を備えるシステム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、プログラム、方法、情報処理装置、システムに関する。

【背景技術】

【0002】

時系列データに基づき時系列予測モデルを学習させる技術が知られている。
特許文献１には、作業者ごとの収集データの傾向に応じた作業者ごとの最適な学習モデルを生成することが開示されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０２２－１３５１７８号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

学習モデルの学習プロセスの品質を向上できていないという課題がある。
そこで、本開示は、上記課題を解決すべくなされたものであって、その目的は、学習モデルの学習プロセスの品質を向上する技術を提供することである。

【課題を解決するための手段】

【0005】

プロセッサと、記憶部とを備えるコンピュータに実行させるためのプログラムであって、プロセッサが、時系列データである第１学習データを取得する第１学習データ取得ステップと、複数の時系列予測モデルと、当該複数の時系列予測モデルの学習に用いられる時系列データである学習データと、当該複数の時系列予測モデルの学習パラメータと、をそれぞれ関連付けて記憶する記憶ステップと、第１学習データ取得ステップにおいて取得した第１学習データに基づき、記憶ステップにおいて記憶した複数の学習データのうち、時系列推移が第１学習データと類似する第２学習データを特定するデータ特定ステップと、記憶ステップにおいて、データ特定ステップにおいて特定した第２学習データと関連付けて記憶した第２学習パラメータを取得するパラメータ取得ステップと、第１学習データに基づき、パラメータ取得ステップにおいて取得した第２学習パラメータに基づく初期パラメータを用いて学習モデルを学習させる学習ステップと、を実行するプログラム。

【発明の効果】

【0006】

本開示によれば、学習モデルの学習プロセスの品質を向上させることができる。

【図面の簡単な説明】

【0007】

【図1】システム１の機能構成を示すブロック図である。

【図2】サーバ１０の機能構成を示すブロック図である。

【図3】ユーザ端末２０の機能構成を示すブロック図である。

【図4】ユーザテーブル１０１２のデータ構造を示す図である。

【図5】主テーブル１０１３のデータ構造を示す図である。

【図6】補助テーブル１０１４のデータ構造を示す図である。

【図7】候補テーブル１０１５のデータ構造を示す図である。

【図8】モデルテーブル１０２１のデータ構造を示す図である。

【図9】データ拡張処理の動作を示すフローチャートである。

【図10】初期パラメータ設定処理の動作を示すフローチャートである。

【図11】データ拡張処理の概念を説明する第一概念図である。

【図12】データ拡張処理の概念を説明する第二概念図である。

【図13】コンピュータ９０の基本的なハードウェア構成を示すブロック図である。

【発明を実施するための形態】

【0008】

以下、本開示の実施形態について図面を参照して説明する。実施形態を説明する全図において、共通の構成要素には同一の符号を付し、繰り返しの説明を省略する。なお、以下の実施形態は、特許請求の範囲に記載された本開示の内容を不当に限定するものではない。また、実施形態に示される構成要素のすべてが、本開示の必須の構成要素であるとは限らない。また、各図は模式図であり、必ずしも厳密に図示されたものではない。

【0009】

＜システム１の構成＞
本開示におけるシステム１は、時系列データに基づく時系列予測モデルを学習する情報処理サービスを提供可能な情報処理システムである。
システム１は、ネットワークＮを介して接続された、サーバ１０、ユーザ端末２０の情報処理装置を備える。
図１は、システム１の機能構成を示すブロック図である。
図２は、サーバ１０の機能構成を示すブロック図である。
図３は、ユーザ端末２０の機能構成を示すブロック図である。

【0010】

各情報処理装置は演算装置と記憶装置とを備えたコンピュータにより構成されている。コンピュータの基本ハードウェア構成および、当該ハードウェア構成により実現されるコンピュータの基本機能構成は後述する。サーバ１０、ユーザ端末２０のそれぞれについて、後述するコンピュータの基本ハードウェア構成およびコンピュータの基本機能構成と重複する説明は省略する。

【0011】

＜サーバ１０の構成＞
サーバ１０は、時系列データに基づく時系列予測モデルを学習する情報処理サービスを提供する情報処理装置である。
サーバ１０は、記憶部１０１、制御部１０４を備える。

【0012】

＜サーバ１０の記憶部１０１の構成＞
サーバ１０の記憶部１０１は、アプリケーションプログラム１０１１、ユーザテーブル１０１２、主テーブル１０１３、補助テーブル１０１４、候補テーブル１０１５、モデルテーブル１０２１を備える。

【0013】

アプリケーションプログラム１０１１は、サーバ１０の制御部１０４を各機能ユニットとして機能させるためのプログラムである。
アプリケーションプログラム１０１１は、ウェブブラウザアプリケーションなどのアプリケーションを含む。

【0014】

ユーザテーブル１０１２は、サービスを利用する会員ユーザ（以下、ユーザ）の情報を記憶し管理するテーブルである。ユーザは、サービスの利用登録を行うことで、当該ユーザの情報がユーザテーブル１０１２の新しいレコードに記憶される。これにより、ユーザは本開示にかかるサービスを利用できるようになる。
ユーザテーブル１０１２は、ユーザＩＤを主キーとして、ユーザＩＤ、ユーザ名のカラムを有するテーブルである。
図４は、ユーザテーブル１０１２のデータ構造を示す図である。

【0015】

ユーザＩＤは、ユーザを識別するためのユーザ識別情報を記憶する項目である。ユーザ識別情報は、ユーザごとにユニークな値が設定されている項目である。
ユーザ名は、ユーザの氏名を記憶する項目である。ユーザ名は、氏名ではなく、ニックネームなど任意の文字列を設定しても良い。

【0016】

主テーブル１０１３は、主データに関する情報（主データ情報）を記憶し管理するためのテーブルである。
主テーブル１０１３は、主データＩＤを主キーとして、主データＩＤ、ユーザＩＤ、主データ、属性データのカラムを有するテーブルである。
図５は、主テーブル１０１３のデータ構造を示す図である。

【0017】

主データＩＤは、主データを識別するための主データ識別情報を記憶する項目である。主データＩＤは、主データごとにユニークな値が記憶される。
ユーザＩＤは、ユーザを識別するためのユーザ識別情報を記憶する項目である。
主データは、学習モデル（時系列予測モデル）を学習する際に用いる時系列データを記憶する項目である。時系列データは、一連の時間点または時間間隔にわたって順序付けられたデータポイントを示す。これは、特定の時間間隔（例: 毎日、毎週、毎月など）で収集されたデータから構成される。時系列データは、各データポイントが時間的に連続している点と、その順序がデータの意味を形成する。
例えば、主データは、特定の期間における株の終値を示す株価の時系列データを含む。このデータは日次、週次、月次などの頻度で収集される。
また、主データは、自動車やその他の商品の価格相場推移の時系列データを含む。このデータは、特定のモデルやブランドの車の平均販売価格の変動を時間の経過とともに追跡するデータが含まれる。
なお、本開示における時系列データは、一つの系列（指標）の時系列データである必要はなく複数の系列（指標）を含むデータセットを含む。例えば、株取引の時系列データは、株価の時系列データと、株価の出来高（株の売買の数量）との複数の系列（指標）を含むデータセットである。このようなデータセットも本開示における時系列データに含まれる。
属性データは、主データの内容に関するメタデータを記憶する項目である。属性データは、主データを理解し、解釈し、利用する際に用いられる情報である。具体的に、属性データは、以下の情報を含む。
・データの種類：例えば、気温、湿度、株価、売上高など、時系列データが何を示すのかの基本的な情報。
・データの源泉：どの組織や機関がデータを提供しているのか、またはどのような手段や方法でデータが収集されたのかを示す情報。
・収集周期：データが毎日収集されているのか、毎時なのか、それとも別の周期なのかを示す情報。
・地理的情報：データが特定の場所や地域に関連している場合、その場所や地域の情報。
・単位：データの数値が示す単位。例えば、気温ならば摂氏や華氏、株価ならば通貨の単位などの情報。

【0018】

補助テーブル１０１４は、補助データに関する情報（補助データ情報）を記憶し管理するためのテーブルである。
補助テーブル１０１４は、補助データＩＤを主キーとして、補助データＩＤ、ユーザＩＤ、補助データ、属性データのカラムを有するテーブルである。
図６は、補助テーブル１０１４のデータ構造を示す図である。

【0019】

補助データＩＤは、補助データを識別するための補助データ識別情報を記憶する項目である。補助データＩＤは、補助データごとにユニークな値が記憶される。
ユーザＩＤは、ユーザを識別するためのユーザ識別情報を記憶する項目である。
補助データは、主データを補完または拡張するために用いられる時系列データを記憶する項目である。なお、時系列データについては、主テーブル１０１３の主データの項目と同様である。
補助データは、主データを用いた機械学習モデル等の学習において、機械学習モデルの品質を向上させたり、解析精度の向上、また主データの被覆範囲（カバレッジ）を拡張するために用いる任意のデータを含む。
補助データは、主データとは異なるデータソースから取得したデータを含む。
補助データは、政府機関、政府関連組織等が収集・公開している人口統計、経済指標、健康情報等の政府統計に関する情報を含む。
補助データは、外部情報サービス、プラットフォームサービス等が提供するＡＰＩ（ＡｐｐｌｉｃａｔｉｏｎＰｒｏｇｒａｍｉｎｇＩｎｔｅｒｆａｃｅ）等を介して取得しても良いし、任意のウェブページからスクレイピングなどの手法を用いて自動的に収集しても良い。
属性データは、補助データの内容に関するメタデータを記憶する項目である。メタデータの説明は、主テーブル１０１３の属性データの項目と同様であるため説明を省略する。

【0020】

候補テーブル１０１５は、候補に関する情報（候補情報）を記憶し管理するためのテーブルである。
候補テーブル１０１５は、候補データＩＤを主キーとして、候補データＩＤ、補助データＩＤ、候補データ、抽出条件のカラムを有するテーブルである。
図７は、候補テーブル１０１５のデータ構造を示す図である。

【0021】

候補データＩＤは、候補データを識別するための候補データ識別情報を記憶する項目である。候補データＩＤは、候補データごとにユニークな値が記憶される。
補助データＩＤは、補助データを識別するための補助データ識別情報を記憶する項目である。
候補データは、補助データの一部であり、主データを補完または拡張するために用いられる時系列データを記憶する項目である。なお、時系列データについては、主テーブル１０１３の主データの項目と同様である。
抽出条件は、補助データ識別情報により特定される補助データから、候補データを抽出する際の抽出条件を記憶する項目である。例えば、抽出条件は、補助データから候補データを抽出する際の開始位置（開始行）と終了位置（終了行）に関する情報を記憶する。

【0022】

モデルテーブル１０２１は、学習モデルに関する情報（学習モデル情報）を記憶し管理するためのテーブルである。
モデルテーブル１０２１は、モデルＩＤを主キーとして、モデルＩＤ、学習モデル、初期パラメータ、学習後パラメータ、主データＩＤ、候補データＩＤ、拡張条件のカラムを有するテーブルである。
図８は、モデルテーブル１０２１のデータ構造を示す図である。

【0023】

モデルＩＤは、学習モデルを識別するためのモデル識別情報を記憶する項目である。
学習モデルは、時系列予測モデルに関する学習モデルを記憶する項目である。時系列予測モデルは、ＲＮＮ（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ）、ＬＳＴＭ（ＬｏｎｇＳｈｏｒｔ－ＴｅｒｍＭｅｍｏｒｙ）、ＧＲＵ（ＧａｔｅｄＲｅｃｕｒｒｅｎｔＵｎｉｔｓ）などの任意の時系列深層学習モデルを含む。
時系列予測モデルは、時系列データを入力データとして、未来の指数を出力（推論）する推論モデルである。例えば、時系列予測モデルは、過去の販売データや気候データなどのデータを入力データとして、未来の売上高や気温の指数を出力（推論）する推論モデルである。
入力データは、季節性や特定のイベント（セールなど）に関する情報を含んでも良い。
出力データは、確信度や分布の範囲に関する情報を含んでも良い。
時系列予測モデルの学習処理は、後述する。
時系列予測モデルは、例えば機械学習、人工知能、深層学習モデルなどの一種である。
時系列予測モデルは、単一の学習モデルである必要はなく、商品カテゴリーや地域情報ごとに複数の独立した学習モデルを切り替えて実現しても良い。
時系列予測モデルの一例として、深層学習におけるディープニューラルネットワークによる深層学習モデルを説明する。時系列予測モデルは、深層学習モデルである必要は必ずしもなく、任意の機械学習、人工知能モデルでも良い。
商品の売上履歴や気温の変動情報を入力データとして、時系列予測モデルを適用することにより、未来の市場動向や気温のトレンドが推計される。つまり、本開示にかかるサービスのユーザは、実際に、実店舗を訪れるや気象情報を調べることなしに、未来の売上や気温を推計することができる。
初期パラメータは、学習モデルを学習する際の学習開始時のパラメータを記憶する項目である。
例えば、深層学習モデルにおいては学習の品質や速度は、初期パラメータの選び方に大きく依存することが一般的である。不適切な初期パラメータを選択してしまうと、学習が遅くなったり、局所的な最適解に収束してしまう場合がある。
なお、初期パラメータは、複数の初期パラメータを、学習モデルの品質を示す指標（各種誤差、精度、適合率など）や、学習プロセスの品質を示す指標（収束速度、学習曲線など）と関連付けて記憶しても良い。また、初期パラメータは、複数の初期パラメータを、初期パラメータの優劣を示す指標（優先度）等の情報と関連付けて記憶しても良い。
学習後パラメータは、学習処理を通じて最適化されたパラメータである。初期パラメータは損失関数を最小化するようにパラメータが調整される。
主データＩＤは、学習モデルを学習する際の学習データとして用いる主データの主データ識別情報を記憶する項目である。
候補データＩＤは、学習モデルを学習する際の学習データとして用いる候補データの候補データ識別情報を記憶する項目である。本開示においては、主データは候補データによりデータ拡張（ＤａｔａＡｕｇｕｍｅｎｔａｔｉｏｎ）が行われ、学習モデルの学習に用いられる。
拡張条件は、主データを候補データによりデータ拡張する際の拡張条件を記憶する項目である。具体的に、拡張条件に記憶された情報に基づき、主データに候補データを結合する。

【0024】

＜サーバ１０の制御部１０４の構成＞
サーバ１０の制御部１０４は、ユーザ登録制御部１０４１、学習部１０４２を備える。制御部１０４は、記憶部１０１に記憶されたアプリケーションプログラム１０１１を実行することにより、各機能ユニットが実現される。

【0025】

ユーザ登録制御部１０４１は、本開示に係るサービスの利用を希望するユーザの情報をユーザテーブル１０１２に記憶する処理を行う。
ユーザテーブル１０１２に記憶される情報は、ユーザが任意の情報処理端末からサービス提供者が運営するウェブページなどを開き、所定の入力フォームに情報を入力しサーバ１０へ送信する。ユーザ登録制御部１０４１は、受信した情報をユーザテーブル１０１２の新しいレコードに記憶し、ユーザ登録が完了する。これにより、ユーザテーブル１０１２に記憶されたユーザはサービスを利用することができるようになる。
ユーザ登録制御部１０４１によるユーザ情報のユーザテーブル１０１２への登録に先立ち、サービス提供者は所定の審査を行いユーザによるサービス利用可否を制限しても良い。
ユーザＩＤは、ユーザを識別できる任意の文字列または数字で良く、ユーザが希望する任意の文字列または数字、もしくはユーザ登録制御部１０４１が自動的に任意の文字列または数字を設定しても良い。

【0026】

学習部１０４２は、学習処理を実行する。本開示における、学習部１０４２は、結合ステップにおいて作成した結合データに基づき学習モデルを学習させる学習ステップを実行することができる。

【0027】

＜ユーザ端末２０の構成＞
ユーザ端末２０は、サービスを利用するユーザが操作する情報処理装置である。ユーザ端末２０は、例えば、スマートフォン、タブレット等の携帯端末でもよいし、据え置き型のＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、ラップトップＰＣであってもよい。また、ＨＭＤ（ＨｅａｄＭｏｕｎｔＤｉｓｐｌａｙ）、腕時計型端末等のウェアラブル端末であってもよい。
ユーザ端末２０は、記憶部２０１、制御部２０４、入力装置２０６、出力装置２０８を備える。

【0028】

＜ユーザ端末２０の記憶部２０１の構成＞
ユーザ端末２０の記憶部２０１は、ユーザＩＤ２０１１、アプリケーションプログラム２０１２を備える。

【0029】

ユーザＩＤ２０１１はユーザのアカウントＩＤである。ユーザは、ユーザ端末２０からユーザＩＤ２０１１を、サーバ１０へ送信する。サーバ１０は、ユーザＩＤ２０１１に基づきユーザを識別し、本開示にかかるサービスをユーザに対して提供する。なお、ユーザＩＤ２０１１には、ユーザ端末２０を利用しているユーザを識別するにあたりサーバ１０から一時的に付与されるセッションＩＤなどの情報を含む。

【0030】

アプリケーションプログラム２０１２は、記憶部２０１に予め記憶されていても良いし、通信ＩＦを介してサービス提供者が運営するウェブサーバ等からダウンロードする構成としても良い。
アプリケーションプログラム２０１２は、ウェブブラウザアプリケーションなどのアプリケーションを含む。
アプリケーションプログラム２０１２は、ユーザ端末２０に記憶されているウェブブラウザアプリケーション上で実行されるＪａｖａＳｃｒｉｐｔ（登録商標）などのインタープリター型プログラミング言語を含む。

【0031】

＜ユーザ端末２０の制御部２０４の構成＞
ユーザ端末２０の制御部２０４は、入力制御部２０４１、出力制御部２０４２を備える。制御部２０４は、記憶部２０１に記憶されたアプリケーションプログラム２０１２を実行することにより、各機能ユニットが実現される。

【0032】

＜ユーザ端末２０の入力装置２０６の構成＞
ユーザ端末２０の入力装置２０６は、カメラ２０６１、マイク２０６２、位置情報センサ２０６３、モーションセンサ２０６４、タッチデバイス２０６５を備える。

【0033】

＜ユーザ端末２０の出力装置２０８の構成＞
ユーザ端末２０の出力装置２０８は、ディスプレイ２０８１、スピーカ２０８２を備える。

【0034】

＜システム１の動作＞
以下、システム１の各処理について説明する。
図９は、データ拡張処理の動作を示すフローチャートである。
図１０は、初期パラメータ設定処理の動作を示すフローチャートである。
図１１は、データ拡張処理の概念を説明する第一概念図である。
図１２は、データ拡張処理の概念を説明する第二概念図である。

【0035】

＜データ拡張処理＞
データ拡張処理は、主データを補助データにより拡張するための処理である

【0036】

＜データ拡張処理の概要＞
データ拡張処理は、データ拡張の対象となる主データの選択を受け付け、当該主データのデータ拡張に用いる補助データを選択し、補助データから１または複数の候補データを抽出し、１または複数の候補データから所定の候補データを選択し、主データと候補データとを結合することにより結合データを作成する一連の処理である。
本開示において、第１データ、第２データ、第３データは、１または複数の系列を有する時系列データである。

【0037】

＜データ拡張処理の詳細＞
以下に、データ拡張処理の詳細を説明する。

【0038】

ステップＳ１０１において、サーバ１０の制御部１０４は、時系列データである第１データを取得する第１データ取得ステップを実行する。
具体的に、ユーザは、ユーザ端末２０の入力装置２０６を操作し、ブラウザアプリケーション等を実行し、データ拡張処理を実行するためのウェブページ（データ拡張ページ）のＵＲＬ等を入力することによりデータ拡張ページＤ１を開く。ユーザ端末２０の制御部２０４は、データ拡張ページを開くためのユーザＩＤ２０１１を含むリクエストをサーバ１０へ送信する。

【0039】

サーバ１０は、リクエストを受信するとデータ拡張ページを生成しユーザ端末２０へ送信する。ユーザ端末２０の制御部２０４は、データ拡張ページをユーザ端末２０のディスプレイ２０８１に表示し、提示する。
サーバ１０の制御部１０４は、主テーブル１０１３に記憶された１または複数の主データ情報をユーザ端末２０へ送信し、ユーザ端末２０の制御部２０４は、受信した１または複数の主データ情報に基づき、１または複数の主データ情報を選択可能な態様でデータ拡張ページに一覧表示しても良い。
同様に、サーバ１０の制御部１０４は、補助テーブル１０１４に記憶された１または複数の補助データ情報をユーザ端末２０へ送信し、ユーザ端末２０の制御部２０４は、受信した１または複数の補助データに基づき、１または複数の補助データを選択可能な態様でデータ拡張ページに一覧表示しても良い。

【0040】

ユーザは、ユーザ端末２０の入力装置２０６を操作することにより、データ拡張ページに一覧表示された主データを選択する。ユーザ端末２０の制御部２０４は、選択された主データの主データＩＤをサーバ１０へ送信する。サーバ１０の制御部１０４は、主データＩＤを受信する。
サーバ１０の制御部１０４は、主データＩＤに基づき、主テーブル１０１３の主データＩＤの項目を検索し、主データ（第１データ）を取得し、受け付ける。なお、サーバ１０の制御部１０４は、複数の主データ（第１データ）を取得し、受け付けても良い。

【0041】

ステップＳ１０２において、サーバ１０の制御部１０４は、第１データ取得ステップにおいて取得した第１データの第１期間範囲よりも長い第３期間範囲を有する時系列データである第３データを取得する第３データ取得ステップを実行する。
具体的に、ユーザは、ユーザ端末２０の入力装置２０６を操作することにより、データ拡張ページに一覧表示された補助データを選択する。ユーザ端末２０の制御部２０４は、選択された補助データの補助データＩＤをサーバ１０へ送信する。サーバ１０の制御部１０４は、補助データＩＤを受信する。
サーバ１０の制御部１０４は、補助データＩＤに基づき、補助テーブル１０１４の補助データＩＤの項目を検索し、補助データ（第３データ）を取得し、受け付ける。

【0042】

なお、サーバ１０の制御部１０４は、ユーザからの選択操作を受け付けることなく、補助データを取得しても良い。
例えば、サーバ１０の制御部１０４は、ステップＳ１０１において取得した第１データ、第１データに関連付けて記憶されたメタデータ（属性データ）等の情報に基づき、第１データを拡張するために好適な第３データを補助テーブル１０１４から検索し、取得し、受け付けても良い。
サーバ１０の制御部１０４は、補助テーブル１０１４に記憶されたすべて、または一部の任意の補助データを取得し、受け付ける構成としても構わない。サーバ１０の制御部１０４は、複数の補助データ（第３データ）を取得し、受け付けても良い。
サーバ１０の制御部１０４は、第１データ、第１データに関連付けて記憶されたメタデータ（属性データ）等の情報を入力データとして、第３データを特定するための情報（第３データＩＤ）を出力する機械学習モデル、深層学習モデル、その他、任意の人工知能モデル等を用いることにより第３データを特定しても良い。

【0043】

ステップＳ１０３において、サーバ１０の制御部１０４は、第３データ取得ステップにおいて取得した第３データの一部であり、第３期間範囲に含まれる複数の時系列データである複数の候補データを抽出する候補抽出ステップを実行する。
具体的に、サーバ１０の制御部１０４は、取得した補助データから、当該補助データの期間範囲の一部に含まれる１または複数の候補データを抽出する。具体的に、サーバ１０の制御部１０４は、取得した補助データの期間範囲の一部を切り出して候補データとして抽出しても良いし、補助データの期間範囲の一部を除外して候補データとして抽出しても良い。
サーバ１０の制御部１０４は、補助データに含まれる複数の系列のうち一部の系列を取り出して候補データとして抽出しても良いし、系列のうち一部の系列を除外して候補データとして抽出しても良い。

【0044】

ステップＳ１０３において、候補抽出ステップは、第１期間範囲と略同一の期間範囲を有する複数の候補データを抽出するステップを実行する。
具体的に、サーバ１０の制御部１０４は、取得した補助データから、ステップＳ１０１において選択した主データの期間範囲（第１期間範囲）と略同一の期間範囲を有する１または複数の候補データを抽出することが好適である。
なお、主データと候補データとの間で期間範囲が略同一であったとしても、時間方向のデータ数が主データと候補データとの間で相違する場合がある。つまり、主データと、候補データ（補助データ）との時間方向のデータ数の密度（単位時間当たりのデータ数）が相違する場合がある。この場合、サーバ１０の制御部１０４は、任意の補完処理を主データ、候補データ（補助データ）に対して適用することにより、主データと、候補データ（補助データ）とのデータ数を揃える。補完処理は、主データではなく、候補データ（補助データ）に適用することが好適である。
補完処理は、複数の連続する時系列データの間の、欠損値や不足しているデータを埋めるための手法であり様々な手法が知られている。補完処理は、前方補完、後方補完、線形補完、平均値補完、中央値補完、最近傍補完、機械学習モデル、深層学習モデル等を用いた補完など任意の補完処理を適用することができる。

【0045】

ステップＳ１０３において、候補抽出ステップは、第３期間範囲よりも短い所定期間範囲の第１候補データを抽出するステップと、第１候補データから、第３データの時間方向において前方または後方に所定の周期期間ずつ逐次的にずらすことにより所定期間範囲に含まれる複数の候補データを抽出するステップと、を含む。
具体的に、サーバ１０の制御部１０４は、補助データのうち、時間方向において最も古い位置（開始位置）から時間方向において第１期間範囲までの期間範囲を切り出して第１候補データとして抽出する。サーバ１０の制御部１０４は、補助データのうち、時間方向において開始位置から所定の周期期間だけずらした位置（第２位置）から時間方向において第１期間範囲までの期間範囲を切り出して第２候補データとして抽出する。サーバ１０の制御部１０４は、補助データのうち、時間方向において第２位置から所定の周期期間だけずらした位置（第３位置）から時間方向において第１期間範囲までの期間範囲を切り出して第３候補データとして抽出する。サーバ１０の制御部１０４は、このように期間範囲の切り出し開始位置を所定の周期期間ごとに逐次的にずらすことにより複数の候補データを抽出する。周期期間は、１日、１週間、１ヶ月、１年など任意の期間を用いることができる。
なお、候補データの切り出しは、補助データの時間方向において最も古い位置から行う必要はなく、最も新しい位置または第３期間範囲に含まれる任意の位置から切り出しても良い。

【0046】

ステップＳ１０３において、候補抽出ステップは、第３データ取得ステップにおいて取得した第３データのうち、第１期間範囲よりも時間方向において前方または後方のデータを除外するステップと、除外した第３データから複数の候補データを抽出するステップと、を含む。
具体的に、サーバ１０の制御部１０４は、第１期間範囲よりも時間方向において第１期間範囲よりも時間方向において後方の期間範囲に含まれないように１または複数の候補データを抽出する。具体的に、サーバ１０の制御部１０４は、補助データのうち、第３期間範囲において時間方向において第１期間範囲よりも時間方向において後方の期間範囲を除外して、当該除外した補助データから候補データを抽出する構成としても良い。
第１データに基づき第１期間範囲よりも後方（未来）の事象を予測するための時系列予測モデルを構築する場合には、第３データのうち第１データの期間範囲よりも時間方向において後方（未来）のデータを学習データとして用いることは因果関係を考慮すると好適ではない。
なお、第１データに基づき第１期間範囲よりも前方（過去）の事象を推論するための時系列予測モデルを構築する場合も同様である。この場合、サーバ１０の制御部１０４は、第１期間範囲よりも時間方向において第１期間範囲よりも時間方向において前方の期間範囲に含まれないように１または複数の候補データを抽出する。

【0047】

ステップＳ１０３において、サーバ１０の制御部１０４は、ユーザから、所定の周期期間の入力を受け付ける周期入力ステップを実行する。
具体的に、周期期間は、データ拡張ページに設けられた周期期間入力欄等にユーザから入力された値に基づき周期期間の入力を受け付けても良い。
この場合、候補抽出ステップは、周期入力ステップにおいて入力を受け付けた周期期間に基づき、複数の候補データを抽出するステップを実行することになる。

【0048】

ステップＳ１０３において、候補抽出ステップは、ユーザから周期期間の入力を受けることなしに、第１データに基づき特定される周期期間に基づき、複数の候補データを抽出するステップを実行する。
具体的に、サーバ１０の制御部１０４は、ステップＳ１０１において取得した第１データ、第１データに関連付けて記憶されたメタデータ（属性データ）等の情報に基づき、第１データを拡張する際の補助データを切り出すのに好適な周期期間を、ユーザからの入力を受け付けることなしに自動的に特定しても良い。
例えば、第１データが所定の周期で変動するデータである場合は、第１データの主成分の周期に基づき、当該主成分の周期よりも短いまたは長い周期期間を特定しても良い。その他、第１データのデータの種類、内容等（人口動態、季節性の変動要因とうの周期的な要因が影響するデータ等）に応じて定まる周期に基づき特定しても良い。
サーバ１０の制御部１０４は、第１データ、第１データに関連付けて記憶されたメタデータ（属性データ）等の情報を入力データとして、周期期間を出力する機械学習モデル、深層学習モデル、その他、任意の人工知能モデル等を用いることにより周期期間を特定しても良い。

【0049】

図１１は、データ拡張処理の概念を説明する第一概念図である。第１データＤ１００（３．５年分、４２行のデータ）を、補助データＤ１１０（２０年分、２４０行のデータ）におけるデータ拡張処理を説明する。サーバ１０の制御部１０４は、補助データＤ１１０のうち、第１データＤ１０の時間方向において後方のデータＤ１１２（２年分、２４行のデータ）を除外して補助データＤ１１１（１８年分、２１６行のデータ）として特定する。
サーバ１０の制御部１０４は、第１候補データの時間方向において最も新しい位置Ｄ１３（開始位置）から、時間方向において第１期間範囲である３．５年分の期間範囲を切り出して第１候補データＤ１２１（３．５年分、４２行のデータ）として特定する。サーバ１０の制御部１０４は、位置Ｄ１３から周期期間１２ヶ月だけ時間方向にずらした位置（第２位置）から、時間方向において第１期間範囲である３．５年分の期間範囲を切り出して第２候補データＤ１２２（３．５年分、４２行のデータ）として特定する。同様に、サーバ１０の制御部１０４は、第２位置から周期期間１２ヶ月だけ時間方向にずらした位置（第３位置）から、時間方向において第１期間範囲である３．５年分の期間範囲を切り出して第３候補データＤ１２３（３．５年分、４２行のデータ）として特定する。このように、サーバ１０の制御部１０４は、周期期間ずつ逐次的にずらすことにより、補助データＤ１１１から１４個の候補データを抽出することができる。

【0050】

ステップＳ１０４において、サーバ１０の制御部１０４は、第１データ取得ステップにおいて取得した第１データに基づき、複数の時系列データから時系列推移が第１データと類似する第２データを取得する第２データ取得ステップを実行する。第２データ取得ステップは、第１データと、複数の候補データとの類似度に応じて、複数の候補データから第２データを取得するステップを実行する。
第２データ取得ステップは、第１データと、複数の候補データとの間のマンハッタン距離、ユークリッド距離、コサイン類似度および相関係数の少なくともいずれか１つの距離を算定するステップと、算定された距離に基づく類似度に応じて第２データを取得するステップと、を含む。
具体的に、サーバ１０の制御部１０４は、第１データの開始位置からｉ個目（データのインデックスがｉ）のデータの値をｘｉとして、ｊ番目の候補データの開始位置からのｉ個目の（データのインデックスがｉ）のデータの値をｙｉｊとして、ｘｉとｙｉｊとの差（ｘｉｊ－ｙｉｊ）や積（ｘｉｊ＊ｙｉｊ）等の距離要素を算定する（なお、候補データは既に補完処理が実行されているものとする）。すべてのｉについて距離要素を積算することにより第１データとｊ番目の候補データとの距離を算定することができる。距離は、マンハッタン距離（Ｌ１ノルム）、ユークリッド距離（Ｌ２ノルム）、コサイン類似度、相関係数等の距離を用いることができる。
サーバ１０の制御部１０４は、複数の候補データについて算定した距離のうち、最も距離が小さい候補データを第２データとして特定し、取得する。なお、必ずしも、最も距離が近い候補データを第２データとして特定する必要はなく、例えば距離に基づき算定される類似度（距離の逆数等により定まる）が所定値以上の複数の候補データから所定の候補データを第２データとして選択しても良い。また、サーバ１０の制御部１０４は、複数の候補データを複数の第２データとして選択しても良い。

【0051】

ステップＳ１０４において、第２データ取得ステップは、第１データに含まれるそれぞれの系列の時系列データと、複数の候補データに含まれるそれぞれの系列の時系列データとの類似度に応じて、複数の候補データから第２データを取得するステップを実行する。
具体的に、第１データ、候補データが複数の系列からなる時系列データである場合には、各系列に対して上述したマンハッタン距離（Ｌ１ノルム）、ユークリッド距離（Ｌ２ノルム）、コサイン類似度、相関係数等の距離を計算し、系列に対して計算したこれらの距離の組み合わせにより第１データおよび候補データとの類似度を算定する。
例えば、それぞれの系列に対して算出した距離や類似度の平均（平均値、中央値等）、重み付き平均、最大値および最小値の少なくともいずれかを、第１データおよび候補データとの類似度としても良い。
サーバ１０の制御部１０４は、複数の候補データについて算定した類似度のうち、最も類似度が大きい候補データを第２データとして特定し、取得する。なお、必ずしも、最も類似度が大きい候補データを第２データとして特定する必要はなく、例えば類似度が所定値以上の複数の候補データから所定の候補データを第２データとして選択しても良い。また、サーバ１０の制御部１０４は、複数の候補データを複数の第２データとして選択しても良い。

【0052】

ステップＳ１０４において、第２データ取得ステップは、第１データと、複数の候補データとの類似する系列の個数に応じて、複数の候補データから第２データを取得するステップを実行する。
具体的に、第１データ、候補データが第１系列、第２系列、第３系列の３つの系列を有する時系列データであるとする。この場合、複数の候補データについて、第１系列、第２系列、第３系列のそれぞれの系列ごとに距離（類似度）を算定する。複数の候補データのそれぞれについて、第１データと複数の候補データが有する系列のうち最も類似する系列の個数をカウントする。
例えば、第１候補データ、第２候補データ、第３候補データ、第４候補データ、第５候補データの５つの候補データがあるとする。第１候補データは、第１系列、第２系列、第３系列のそれぞれについて第１データと最も類似する系列の個数は０個とする。同様に、第２候補データは０個、第３候補データは２個、第４候補データは０個、第５候補データは１個である場合において、最も類似する候補データである第３候補データが第２データとして特定し、取得される。

【0053】

ステップＳ１０５において、サーバ１０の制御部１０４は、第１データの時間方向において前方および後方の少なくともいずれかに第２データを結合することにより結合データを作成する結合ステップを実行する。
結合ステップは、第１データの時間方向において前方に１または複数の第２データを結合することにより結合データを作成するステップを実行しても良い。
具体的に、サーバ１０の制御部１０４は、ステップＳ１０１において選択した主データ（第１データ）の時間方向において前方に、ステップＳ１０４において選択した候補データ（第２データ）を結合する。具体的に、時系列データである第１データの時間方向において最も前方のデータの前に、第２データの時間方向において最も後方のデータを結合する。これにより、時間方向において第２データ、第１データの順番に連続する時系列データ（結合データ）を作成することができる。

【0054】

結合ステップは、第１データの時間方向において後方に１または複数の第２データを結合することにより結合データを作成するステップを実行しても良い。
同様に、サーバ１０の制御部１０４は、ステップＳ１０１において選択した主データ（第１データ）の時間方向において後方に、ステップＳ１０４において選択した候補データ（第２データ）を結合しても良い。具体的に、時系列データである第１データの時間方向において最も後方のデータの後に、第２データの時間方向において最も前方のデータを結合する。これにより、時間方向において第１データ、第２データの順番に連続する時系列データ（結合データ）を作成することができる。

【0055】

ステップＳ１０５において、サーバ１０の制御部１０４は、ユーザから、第１データ取得ステップにおいて取得した第１データに対する拡張期間を受け付ける拡張期間受付ステップを実行する。
結合ステップは、結合データの期間範囲が拡張期間に達するまで第１データの時間方向において前方および後方の少なくともいずれかに１または複数の第２データを結合するステップを実行する。
具体的に、ユーザは、データ拡張ページに表示された拡張期間入力欄に、第１データの拡張を希望する第１期間範囲よりも長い期間（拡張期間）を入力可能な構成としても良い。この場合、サーバ１０の制御部１０４は、ユーザから受け付けた拡張期間に応じて、第１データの時間方向の前方に１または複数の第２データを結合させる。具体的に、結合データの期間範囲が拡張期間になるように所定個数の第２データを結合させる。なお、（（拡張期間－第１期間範囲）÷第１期間範囲）個の第２データを、第１データの時間方向の前方に結合させることにより、結合データの期間範囲を拡張期間とすることができる。
なお、結合データを拡張期間とするのに必要な所定個数の第２データが、ステップＳ１０４において選択できていない場合は、ステップＳ１０４において選択した第２データを反復して第１データに結合させることにより、第１データの期間範囲を拡張しても良い。

【0056】

なお、同様に、サーバ１０の制御部１０４は、ユーザから受け付けた拡張期間に応じて、第１データの時間方向の後方に１または複数の第２データを結合させることにより、拡張期間を有する結合データを作成しても良い。

【0057】

サーバ１０の制御部１０４は、第１データと１または複数の第２データとを結合することにより作成した結合データの期間範囲が拡張期間を超過した場合には、第２データのうち超過した期間範囲を除外することにより、結合データの期間範囲を拡張期間となるように処理を実行しても良い。

【0058】

図１２は、データ拡張処理の概念を説明する第二概念図である。
サーバ１０の制御部１０４は、主データである第１データＤ２１１（３．５年分、４２行のデータ）を、補助データから抽出した２つの第２候補データＤ２１２、Ｄ２１３（３．５年分、４２行のデータ）を結合することにより、拡張期間１０．５年分、１２６行の第１結合データＤ２２１（１０．５年分、１２６行のデータ）を作成する。なお、第２候補データＤ２１２、Ｄ２１３は一例として同じデータを結合する例を説明したが、必ずしも同じ候補データを結合する必要はない。
次に、サーバ１０の制御部１０４は、第１結合データＤ２２１を新たな主データ（第１データ）として、データ拡張処理を実行する。具体的に、第１結合データＤ２２１を新たな主データとして、補助データから第Ａ候補データＤ２２２（１０．５年分、１２６行のデータ）、・・・、第Ｚ候補データＤ２２９（１０．５年分、１２６行のデータ）を抽出する。なお、第Ａ候補データＤ２２２、・・・、第Ｚ候補データＤ２２９も、他の主データおよび候補データの結合により作成した結合データであっても良い。本開示においては、サーバ１０の制御部１０４は、拡張期間である２１０年分、２５２０行の結合データを得るために、第１結合データＤ２２１に対して、１９個の第Ａ候補データＤ２２２、・・・、第Ｚ候補データＤ２２９を結合し、第２結合データ（２１０年分、２５２０行のデータ）を作成する。
このように、サーバ１０の制御部１０４は、一度のデータ拡張処理により主データ（第１データ）を補助データにより結合データを作成することができる。さらに、サーバ１０の制御部１０４は、作成した結合データを主データまたは補助データとして扱い、逐次的にデータ拡張処理を実行することにより任意の期間（拡張期間）の結合データを作成することができる。
このようにして、手元にある事象に関する限定的な期間の時系列データしかない場合においても、データ拡張処理により品質の優れた長期的な時系列データを新たに作成することができる。長期的な事象に関して、長期的な学習データに基づき、品質良く学習モデルを学習させることができる。

【0059】

＜初期パラメータ設定処理＞
初期パラメータ設定処理は、学習モデルを学習する際の初期パラメータを設定するための処理である

【0060】

＜初期パラメータ設定処理の概要＞
初期パラメータ設定処理は、学習モデルの選択を受け付け、当該学習モデルを学習させるための学習データを取得し、当該取得した学習データに基づき初期パラメータを検索し、検索により特定した初期パラメータを学習モデルの初期パラメータとして設定する一連の処理である

【0061】

＜初期パラメータ設定処理の詳細＞
以下に、初期パラメータ設定処理の詳細を説明する。
なお、初期パラメータ設定処理に先立ち、サーバ１０の制御部１０４は、複数の時系列予測モデルと、当該複数の時系列予測モデルの学習に用いられる時系列データである学習データと、当該複数の時系列予測モデルの学習パラメータと、をそれぞれ関連付けて記憶する記憶ステップを実行する。
記憶ステップは、複数の時系列予測モデルと、当該複数の時系列予測モデルの最適化後パラメータと、をそれぞれ関連付けて記憶するステップである。
記憶ステップは、複数の時系列予測モデルと、当該複数の時系列予測モデルの初期パラメータと、をそれぞれ関連付けて記憶するステップである。
具体的に、サーバ１０の制御部１０４は、モデルテーブル１０２１に記憶された１または複数の学習モデルについて、主データまたは結合データを用いて、初期パラメータに基づく学習処理を実行し、最適化後の学習後パラメータを算出する。サーバ１０の制御部１０４は、学習モデル、初期パラメータ、学習後パラメータをそれぞれ、モデルテーブル１０２１の学習モデル、初期パラメータ、学習後パラメータの項目に関連付けて記憶しておくものとする。

【0062】

ステップＳ３０１において、サーバ１０の制御部は、学習モデルの選択を受け付ける学習モデル選択ステップを実行する。
ユーザは、ユーザ端末２０の入力装置２０６を操作し、ブラウザアプリケーション等を実行し、初期パラメータ設定処理を実行するためのウェブページ（初期パラメータ設定ページ）のＵＲＬ等を入力することにより初期パラメータ設定ページＤ３を開く。ユーザ端末２０の制御部２０４は、初期パラメータ設定ページを開くためのユーザＩＤ２０１１を含むリクエストをサーバ１０へ送信する。

【0063】

サーバ１０は、リクエストを受信すると初期パラメータ設定ページを生成しユーザ端末２０へ送信する。ユーザ端末２０の制御部２０４は、初期パラメータ設定ページをユーザ端末２０のディスプレイ２０８１に表示し、提示する。
サーバ１０の制御部１０４は、モデルテーブル１０２１に記憶された１または複数の学習モデル情報をユーザ端末２０へ送信し、ユーザ端末２０の制御部２０４は、受信した１または複数の学習モデル情報に基づき、１または複数の学習モデル情報を選択可能な態様で初期パラメータ設定ページに一覧表示しても良い。
ユーザは、ユーザ端末２０の入力装置２０６を操作することにより、初期パラメータ設定ページに一覧表示された学習モデルを選択する。ユーザ端末２０の制御部２０４は、選択された学習モデルのモデルＩＤをサーバ１０へ送信する。サーバ１０の制御部１０４は、モデルＩＤを受信し、受け付ける。

【0064】

ステップＳ３０２において、サーバ１０の制御部１０４は、時系列データである第１学習データを取得する第１学習データ取得ステップを実行する。
具体的に、サーバ１０の制御部１０４は、受信したモデルＩＤに基づき、モデルテーブル０２１のモデルＩＤの項目を検索し、主データＩＤ、候補データＩＤ、拡張条件の項目を取得する。サーバ１０の制御部１０４は、取得した主データＩＤに基づき、主テーブル１０１３の主データＩＤの項目を検索し、主データを取得する。サーバ１０の制御部１０４は、取得した候補データＩＤに基づき、候補テーブル１０１５の候補データＩＤの項目を検索し、候補データを取得する。
初期パラメータ設定処理において、第１学習データは、学習モデルに関連付けて記憶された主データ、補助データ、候補データ、結合データなどの任意のデータを含む。例えば、第１学習データは、取得した主データを含む。第１学習データは、取得した主データおよび候補データをデータ拡張処理のステップＳ１０５において結合した結合データを含む。

【0065】

また、サーバ１０の制御部１０４は、主テーブル１０１３に記憶された１または複数の主データ情報をユーザ端末２０へ送信し、ユーザ端末２０の制御部２０４は、受信した１または複数の主データ情報に基づき、１または複数の主データ情報を選択可能な態様で初期パラメータ設定ページに一覧表示しても良い。
ユーザは、ユーザ端末２０の入力装置２０６を操作することにより、初期パラメータを設定ページに一覧表示された主データを選択する。ユーザ端末２０の制御部２０４は、選択された主データの主データＩＤをサーバ１０へ送信する。サーバ１０の制御部１０４は、主データＩＤを受信する。
サーバ１０の制御部１０４は、主データＩＤに基づき、主テーブル１０１３の主データＩＤの項目を検索し、主データ（第１学習データ）を取得し、受け付ける。なお、サーバ１０の制御部１０４は、複数の主データ（第１学習データ）を取得し、受け付けても良い。
このように、サーバ１０の制御部１０４は、複数の学習モデルに対するユーザからの選択に応じて、当該選択された学習モデルに関連付けられた主データを特定し取得しても良いし、複数の主データに対するユーザからの直接的な選択に応じて、当該選択された主データを特定し取得しても構わない。
同様に、サーバ１０の制御部１０４は、複数の学習モデルに対するユーザからの選択に応じて、当該選択された学習モデルに関連付けられた結合データを特定し取得しても良いし、複数の結合データに対するユーザからの直接的な選択に応じて、当該選択された結合データを特定し取得しても構わない。

【0066】

ステップＳ３０３において、サーバ１０の制御部１０４は、第１学習データ取得ステップにおいて取得した第１学習データに基づき、記憶ステップにおいて記憶した複数の学習データのうち、時系列推移が第１学習データと類似する第２学習データを特定するデータ特定ステップを実行する。
データ特定ステップは、第１学習データと、複数の学習データとの間のマンハッタン距離、ユークリッド距離、コサイン類似度および相関係数の少なくともいずれか１つの距離を算定するステップと、算定された距離に基づく類似度に応じて第２学習データを特定するステップと、を含む。
具体的に、サーバ１０の制御部１０４は、第１学習データと、モデルテーブル１０２１に記憶された主データＩＤに基づき特定される主データ、候補データＩＤに基づき特定される候補データ、取得した主データおよび候補データをデータ拡張処理のステップＳ１０５において結合した結合データの少なくともいずれか１つと対比し、類似度を算定する。第１学習データが、主データ、候補データ、結合データのいずれかである場合は、対比対象も主データ、候補データ、結合データのいずれかであることが好適である。
具体的に、サーバ１０の制御部１０４は、第１学習データの期間範囲と略同一の期間範囲を有する主データ、候補データ、結合データの少なくともいずれか１つ（以下、対象データとよぶ）と対比し類似度を算定しても良い（主データは主データと、候補データは候補データと、結合データは結合データと対比される）。サーバ１０の制御部１０４は、モデルテーブル１０２１を参照して、複数の学習モデル、初期パラメータ、学習後パラメータと関連付けて記憶された複数の対象データを取得する。
具体的に、サーバ１０の制御部１０４は、第１学習データの開始位置からｉ個目（データのインデックスがｉ）のデータの値をｘｉとして、ｊ番目の対象データの開始位置からのｉ個目の（データのインデックスがｉ）のデータの値をｙｉｊとして、ｘｉとｙｉｊとの差（ｘｉｊ－ｙｉｊ）や積（ｘｉｊ＊ｙｉｊ）等の距離要素を算定する（なお、候補データは既に補完処理が実行されているものとする）。すべてのｉについて距離要素を積算することにより第１データとｊ番目の対象データとの距離を算定することができる。距離は、マンハッタン距離（Ｌ１ノルム）、ユークリッド距離（Ｌ２ノルム）、コサイン類似度、相関係数等の距離を用いることができる。
サーバ１０の制御部１０４は、複数の対象データについて算定した距離のうち、最も距離が小さい対象データを第２学習データとして特定し、取得する。なお、必ずしも、最も距離が近い対象データを第２データとして特定する必要はなく、例えば距離に基づき算定される類似度（距離の逆数等により定まる）が所定値以上の複数の対象データから所定の対象データを第２データとして選択しても良い。また、サーバ１０の制御部１０４は、複数の対象データを複数の第２データとして選択しても良い。

【0067】

データ特定ステップは、第１学習データ取得ステップにおいて取得した第１学習データの目的変数と、記憶ステップにおいて記憶した複数の学習データの目的変数と、に基づき算定される類似度に基づき第２学習データを特定するステップを実行する。データ特定ステップは、第１学習データ取得ステップにおいて取得した第１学習データの説明変数と、記憶ステップにおいて記憶した複数の学習データの説明変数と、に基づき類似度を算定しないステップを実行する。
具体的に、サーバ１０の制御部１０４は、第１学習データと１または複数の対象データとの間の距離を算定する際に、第１学習データおよび対象データの説明変数を考慮せずに、目的変数のみを考慮して距離を計算しても良い。
一般に、学習データの説明変数は高次元のデータ構造であるのに対して、目的変数は１次元または小数次元のデータ構造である。これにより、より短い処理時間、より低コストで第２学習データを特定することができる。

【0068】

データ特定ステップは、第１学習データ取得ステップにおいて取得した第１学習データの目的変数と、記憶ステップにおいて記憶した複数の学習データの目的変数と、に基づき算定される類似度に基づき複数の第２学習データ候補を特定する第１ステップと、第１学習データ取得ステップにおいて取得した第１学習データの説明変数と、複数の第２学習データ候補の説明変数と、に基づき算定される類似度に基づき第２学習データを特定する第２ステップと、を含む。
具体的に、サーバ１０の制御部１０４は、具体的に、サーバ１０の制御部１０４は、第１学習データと１または複数の対象データとの間の距離を算定する際に、第１学習データおよび対象データの説明変数を考慮せずに、目的変数のみを考慮して距離を計算し、当該計算した距離が所定値以下の複数の対象データを特定する。つまり、サーバ１０の制御部１０４は、第１学習データと複数の対象データとを説明変数について対比し、複数の対象データから比較的類似する複数の対象データを第２学習データの候補（第２学習データ候補）として絞り込む。
次に、サーバ１０の制御部１０４は、第１学習データと１または複数の第２学習データ候補との間の距離を算定する際に、第１学習データおよび第２学習データ候補の説明変数を考慮して距離を計算し、最も距離が小さい第２学習データ候補を第２学習データとして特定し、取得する。なお、サーバ１０の制御部１０４は、第１学習データおよび第２学習データ候補の目的変数および説明変数を考慮して距離を計算しても良い。
一般に、学習データの説明変数は高次元のデータ構造であるのに対して、目的変数は１次元または小数次元のデータ構造である。これにより、より短い処理時間、より低コストで第２学習データを絞り込みつつ、少数の第２データ学習データ候補については説明変数も考慮して類似度を計算することにより、精度高く好適な第２学習データを特定できる。

【0069】

ステップＳ３０３において、データ特定ステップは、第１学習データ取得ステップにおいて取得した第１学習データの目的変数を入力データとして、モデル記憶ステップにおいて記憶した第２学習モデルに適用することにより出力される目的変数に基づき、第２学習データを特定するステップを実行する。
また、サーバ１０の制御部１０４は、目的変数を入力データとして第２学習データを特定可能な機械学習モデル、深層学習モデル、人工知能モデル等を用いて、第１学習データの目的変数を入力データとして第２学習データを特定する構成とすることもできる。
これにより、より短い処理時間、より低コストで第２学習データを特定することができる。

【0070】

サーバ１０の制御部１０４は、記憶ステップにおいて、データ特定ステップにおいて特定した第２学習データと関連付けて記憶した第２学習パラメータ（第２最適化後パラメータ、第２初期パラメータ）を取得するパラメータ取得ステップを実行する。
具体的に、サーバ１０の制御部１０４は、モデルテーブル１０２１において第２データと関連付けて記憶（同じレコードに記憶）された初期パラメータ、学習パラメータの少なくともいずれか１つを取得する。
サーバ１０の制御部１０４は、取得した第２初期パラメータ、第２最適化後パラメータのそれぞれを、モデルテーブル１０２１のステップＳ３０１において選択されたモデルＩＤに基づき特定されるレコードの初期パラメータ、学習後パラメータの項目に記憶する。

【0071】

ステップＳ３０４において、サーバ１０の制御部１０４は、第１学習データに基づき、パラメータ取得ステップにおいて取得した第２学習パラメータ（第２最適化後パラメータまたは第２初期パラメータ）に基づく初期パラメータを用いて学習モデルを学習させる学習ステップを実行する。
具体的に、サーバ１０の制御部１０４は、ステップＳ３０１において選択を受け付けたモデルＩＤに基づき、モデルテーブル１０２１のモデルＩＤの項目を検索し、主データ、候補データ、拡張条件、初期パラメータ（第２初期パラメータ）、学習パラメータ（第２最適化後パラメータ）を取得する。
サーバ１０の制御部１０４は、取得した主データおよび候補データに基づき、データ拡張処理のステップＳ１０５における処理に従い結合した結合データを作成する。

【0072】

サーバ１０の制御部１０４は、学習モデルに含まれるディープニューラルネットワークの学習パラメータを深層学習による学習処理を実行する。
サーバ１０の制御部１０４は、結合データを学習データとし、初期パラメータとして第２初期パラメータまたは第２最適化後パラメータを用いて学習モデルを学習させる。
サーバ１０の制御部１０４は、結合データに基づき、学習モデルのディープニューラルネットワークを学習させるための訓練データ、テストデータ、検証データなどのデータセットを作成する。サーバ１０の学習部１０５１は、作成したデータセットに基づき学習モデルに含まれるディープニューラルネットワークの学習パラメータを深層学習により学習させる。

【0073】

なお、本開示において一例として、結合データによる学習モデルの学習の際の初期パラメータの設定において、当該結合データと類似する結合データにより学習された学習モデルの最適化後パラメータ、初期パラメータを、当該学習モデルを学習させる際の初期パラメータとして用いる例を説明したがこれに限られない。
例えば、主データによる学習モデルの学習の際の初期パラメータの設定において、当該主データと類似する主データにより学習された学習モデルの最適化後パラメータ、初期パラメータを、当該学習モデルを学習させる際の初期パラメータとして用いても良い。

【0074】

ステップＳ３０４において、サーバ１０の制御部１０４は、第１学習データ取得ステップにおいて取得した第１学習データと、データ特定ステップにおいて特定した第２学習データとの類似度に基づき、パラメータ取得ステップにおいて取得した第２学習パラメータを修正する修正ステップを実行する。
修正ステップは、第１学習データと第２学習データとの類似度に応じて定まる範囲の乱数に基づき、第２学習パラメータを修正するステップを実行する。
具体的に、サーバ１０の制御部１０４は、取得した第２学習パラメータの値に対して、ステップＳ１０４において候補データを選択する際に算出した第１学習データとの類似度（距離）に応じた処理を適用しても良い。
具体的に、類似度に応じた大きさを有する乱数を、第２学習パラメータに対して加えたり引いても良い。例えば、類似度をＳとして、－Ｓから＋Ｓまでの範囲を有する乱数値を、第２学習パラメータに加える。
第２学習パラメータが多次元量である場合には、各次元ごとに生成した異なる乱数値を第２学習パラメータに加えても良い。
これにより、第１学習データと第２学習データとが類似している場合には、第２学習パラメータに類似したパラメータを、第１学習データの学習処理に用いる。
一方、第１学習データと第２学習データとが類似していない場合には、第２学習パラメータに乱数の影響を加えたパラメータを、第１学習データの学習処理に用いる。
これにより、第１学習データと第２学習データとの類似度に応じて、第２学習パラメータが修正される。第１学習データと第２学習データとの類似度に応じて、学習プロセスの際の第２学習パラメータが影響を与える寄与割合を制御することができる。

【0075】

学習ステップは、修正ステップにおいて修正した第２学習パラメータに基づき初期パラメータを用いて学習モデルを学習させるステップを実行する。サーバ１０の制御部１０４は、第２学習パラメータを初期パラメータとして学習モデルの学習処理を実行する。

【0076】

＜コンピュータの基本ハードウェア構成＞
図１３は、コンピュータ９０の基本的なハードウェア構成を示すブロック図である。コンピュータ９０は、プロセッサ９０１、主記憶装置９０２、補助記憶装置９０３、通信ＩＦ９９１（インタフェース、Interface）を少なくとも備える。これらは通信バス９２１により相互に電気的に接続される。

【0077】

プロセッサ９０１とは、プログラムに記述された命令セットを実行するためのハードウェアである。プロセッサ９０１は、演算装置、レジスタ、周辺回路等から構成される。

【0078】

主記憶装置９０２とは、プログラム、及びプログラム等で処理されるデータ等を一時的に記憶するためのものである。例えば、ＤＲＡＭ（Dynamic Random Access Memory）等の揮発性のメモリである。

【0079】

補助記憶装置９０３とは、データ及びプログラムを保存するための記憶装置である。例えば、フラッシュメモリ、ＨＤＤ（Hard Disc Drive）、光磁気ディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、半導体メモリ等である。

【0080】

通信ＩＦ９９１とは、有線又は無線の通信規格を用いて、他のコンピュータとネットワークを介して通信するための信号を入出力するためのインタフェースである。
ネットワークは、インターネット、ＬＡＮ、無線基地局等によって構築される各種移動通信システム等で構成される。例えば、ネットワークには、３Ｇ、４Ｇ、５Ｇ移動通信システム、ＬＴＥ（Long Term Evolution）、所定のアクセスポイントによってインターネットに接続可能な無線ネットワーク（例えばWi-Fi（登録商標））等が含まれる。無線で接続する場合、通信プロトコルとして例えば、Ｚ－Ｗａｖｅ（登録商標）、ＺｉｇＢｅｅ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）等が含まれる。有線で接続する場合は、ネットワークには、ＵＳＢ（Universal Serial Bus）ケーブル等により直接接続するものも含む。

【0081】

なお、各ハードウェア構成の全部または一部を複数のコンピュータ９０に分散して設け、ネットワークを介して相互に接続することによりコンピュータ９０を仮想的に実現することができる。このように、コンピュータ９０は、単一の筐体、ケースに収納されたコンピュータ９０だけでなく、仮想化されたコンピュータシステムも含む概念である。

【0082】

＜コンピュータ９０の基本機能構成＞
コンピュータ９０の基本ハードウェア構成（図１３）により実現されるコンピュータの機能構成を説明する。コンピュータは、制御部、記憶部、通信部の機能ユニットを少なくとも備える。

【0083】

なお、コンピュータ９０が備える機能ユニットは、それぞれの機能ユニットの全部または一部を、ネットワークで相互に接続された複数のコンピュータ９０に分散して設けても実現することができる。コンピュータ９０は、単一のコンピュータ９０だけでなく、仮想化されたコンピュータシステムも含む概念である。

【0084】

制御部は、プロセッサ９０１が補助記憶装置９０３に記憶された各種プログラムを読み出して主記憶装置９０２に展開し、当該プログラムに従って処理を実行することにより実現される。制御部は、プログラムの種類に応じて様々な情報処理を行う機能ユニットを実現することができる。これにより、コンピュータは情報処理を行う情報処理装置として実現される。

【0085】

記憶部は、主記憶装置９０２、補助記憶装置９０３により実現される。記憶部は、データ、各種プログラム、各種データベースを記憶する。また、プロセッサ９０１は、プログラムに従って記憶部に対応する記憶領域を主記憶装置９０２または補助記憶装置９０３に確保することができる。また、制御部は、各種プログラムに従ってプロセッサ９０１に、記憶部に記憶されたデータの追加、更新、削除処理を実行させることができる。

【0086】

データベースは、リレーショナルデータベースを指し、行と列によって構造的に規定された表形式のテーブル、マスタと呼ばれるデータ集合を、互いに関連づけて管理するためのものである。データベースでは、表をテーブル、マスタ、表の列をカラム、表の行をレコードと呼ぶ。リレーショナルデータベースでは、テーブル、マスタ同士の関係を設定し、関連づけることができる。
通常、各テーブル、各マスタにはレコードを一意に特定するための主キーとなるカラムが設定されるが、カラムへの主キーの設定は必須ではない。制御部は、各種プログラムに従ってプロセッサ９０１に、記憶部に記憶された特定のテーブル、マスタにレコードを追加、削除、更新を実行させることができる。
また、記憶部に、データ、各種プログラム、各種データベースを記憶させることにより、本開示にかかる情報処理装置、情報処理システムが製造されたものとして捉えることができる。

【0087】

なお、本開示におけるデータベース、マスタは、情報が構造的に規定された任意のデータ構造体（リスト、辞書、連想配列、オブジェクトなど）を含み得る。データ構造体には、データと、任意のプログラミング言語により記述された関数、クラス、メソッドなどを組み合わせることにより、データ構造体と見なし得るデータも含むものとする。

【0088】

通信部は、通信ＩＦ９９１により実現される。通信部は、ネットワークを介して他のコンピュータ９０と通信を行う機能を実現する。通信部は、他のコンピュータ９０から送信された情報を受信し、制御部へ入力することができる。制御部は、各種プログラムに従ってプロセッサ９０１に、受信した情報に対する情報処理を実行させることができる。また、通信部は、制御部から出力された情報を他のコンピュータ９０へ送信することができる。

【0089】

＜付記＞
以上の各実施形態で説明した事項を以下に付記する。

【0090】

（付記１）
プロセッサと、記憶部とを備えるコンピュータに実行させるためのプログラムであって、プロセッサが、時系列データである第１学習データを取得する第１学習データ取得ステップ（Ｓ３０２）と、複数の時系列予測モデルと、当該複数の時系列予測モデルの学習に用いられる時系列データである学習データと、当該複数の時系列予測モデルの学習パラメータと、をそれぞれ関連付けて記憶する記憶ステップと、第１学習データ取得ステップにおいて取得した第１学習データに基づき、記憶ステップにおいて記憶した複数の学習データのうち、時系列推移が第１学習データと類似する第２学習データを特定するデータ特定ステップ（Ｓ３０３）と、記憶ステップにおいて、データ特定ステップにおいて特定した第２学習データと関連付けて記憶した第２学習パラメータを取得するパラメータ取得ステップ（Ｓ３０３）と、第１学習データに基づき、パラメータ取得ステップにおいて取得した第２学習パラメータに基づく初期パラメータを用いて学習モデルを学習させる学習ステップ（Ｓ３０４）と、を実行するプログラム。
これにより、学習データが類似する第２学習データにおいて時系列予測モデルの学習に用いた学習パラメータ（最適化後パラメータ、初期パラメータ等）を初期パラメータとして、学習モデルを学習させることができる。学習モデルの学習プロセスの収束速度や、学習モデルの品質を向上させることができる。

【0091】

（付記２）
記憶ステップは、複数の時系列予測モデルと、当該複数の時系列予測モデルの最適化後パラメータと、をそれぞれ関連付けて記憶するステップであり、パラメータ取得ステップ（Ｓ３０３）は、記憶ステップにおいて、データ特定ステップにおいて特定した第２学習データと関連付けて記憶した第２最適化後パラメータを取得するステップであり、学習ステップ（Ｓ３０４）は、第１学習データに基づき、パラメータ取得ステップにおいて取得した第２最適化後パラメータに基づく初期パラメータを用いて学習モデルを学習させるステップである、付記１記載のプログラム。
これにより、学習データが類似する第２学習データにおいて時系列予測モデルの学習に用いた最適化後パラメータを初期パラメータとして、学習モデルを学習させることができる。学習モデルの学習プロセスの収束速度や、学習モデルの品質を向上させることができる。

【0092】

（付記３）
記憶ステップは、複数の時系列予測モデルと、当該複数の時系列予測モデルの初期パラメータと、をそれぞれ関連付けて記憶するステップであり、パラメータ取得ステップ（Ｓ３０３）は、記憶ステップにおいて、データ特定ステップにおいて特定した第２学習データと関連付けて記憶した第２初期パラメータを取得するステップであり、学習ステップ（Ｓ３０４）は、第１学習データに基づき、パラメータ取得ステップにおいて取得した第２初期パラメータに基づく初期パラメータを用いて学習モデルを学習させるステップである、付記１記載のプログラム。
これにより、学習データが類似する第２学習データにおいて時系列予測モデルの学習に用いた初期パラメータを初期パラメータとして、学習モデルを学習させることができる。学習モデルの学習プロセスの収束速度や、学習モデルの品質を向上させることができる。

【0093】

（付記４）
データ特定ステップ（Ｓ３０３）は、第１学習データと、複数の学習データとの間のマンハッタン距離、ユークリッド距離、コサイン類似度および相関係数の少なくともいずれか１つの距離を算定するステップと、算定された距離に基づく類似度に応じて第２学習データを特定するステップと、を含む、付記１記載のプログラム。
これにより、学習データが類似する第２学習データにおいて時系列予測モデルの学習に用いた学習パラメータ（最適化後パラメータ、初期パラメータ等）を初期パラメータとして、学習モデルを学習させることができる。学習モデルの学習プロセスの収束速度や、学習モデルの品質を向上させることができる。

【0094】

（付記５）
プロセッサが、第１学習データ取得ステップにおいて取得した第１学習データと、データ特定ステップにおいて特定した第２学習データとの類似度に基づき、パラメータ取得ステップにおいて取得した第２学習パラメータを修正する修正ステップ（Ｓ３０４）と、を実行し、学習ステップ（Ｓ３０４）は、修正ステップにおいて修正した第２学習パラメータに基づき初期パラメータを用いて学習モデルを学習させるステップである、付記１記載のプログラム。
これにより、第１学習データと第２学習データとの類似度に応じて、第２学習パラメータが修正される。第１学習データと第２学習データとの類似度に応じて、学習プロセスの際の第２学習パラメータが影響を与える寄与割合を制御することができる。例えば、第１学習データと第２学習データとの類似度が高い場合には、第２学習データを初期パラメータとして用いる。第１学習データと第２学習データとの類似度が低い場合には、第２学習データが寄与しないランダムな値が初期パラメータとして用いられる。

【0095】

（付記６）
修正ステップ（Ｓ３０４）は、第１学習データと第２学習データとの類似度に応じて定まる範囲の乱数に基づき、第２学習パラメータを修正するステップである、付記５記載のプログラム。
これにより、第１学習データと第２学習データとの類似度に応じて、第２学習パラメータが修正される。第１学習データと第２学習データとの類似度に応じて、学習プロセスの際の第２学習パラメータが影響を与える寄与割合を制御することができる。

【0096】

（付記７）
データ特定ステップ（Ｓ３０３）は、第１学習データ取得ステップにおいて取得した第１学習データの目的変数と、記憶ステップにおいて記憶した複数の学習データの目的変数と、に基づき算定される類似度に基づき第２学習データを特定するステップである、付記１記載のプログラム。
一般に、学習データの説明変数は高次元のデータ構造であるのに対して、目的変数は１次元または小数次元のデータ構造である。これにより、より短い処理時間、より低コストで第２学習データを特定することができる。

【0097】

（付記８）
データ特定ステップ（Ｓ３０３）は、第１学習データ取得ステップにおいて取得した第１学習データの説明変数と、記憶ステップにおいて記憶した複数の学習データの説明変数と、に基づき類似度を算定しないステップである、付記７記載のプログラム。
これにより、より短い処理時間、より低コストで第２学習データを特定することができる。

【0098】

（付記９）
データ特定ステップ（Ｓ３０３）は、第１学習データ取得ステップにおいて取得した第１学習データの目的変数と、記憶ステップにおいて記憶した複数の学習データの目的変数と、に基づき算定される類似度に基づき複数の第２学習データ候補を特定する第１ステップと、第１学習データ取得ステップにおいて取得した第１学習データの説明変数と、複数の第２学習データ候補の説明変数と、に基づき算定される類似度に基づき第２学習データを特定する第２ステップと、を含む、付記８記載のプログラム。
一般に、学習データの説明変数は高次元のデータ構造であるのに対して、目的変数は１次元または小数次元のデータ構造である。これにより、より短い処理時間、より低コストで第２学習データを絞り込みつつ、少数の第２データ学習データ候補については説明変数も考慮して類似度を計算することにより、精度高く好適な第２学習データを特定できる。

【0099】

（付記１０）
プロセッサが、目的変数の入力に応じて目的変数を出力可能な第２学習モデルを記憶するモデル記憶ステップと、を実行し、データ特定ステップ（Ｓ３０３）は、第１学習データ取得ステップにおいて取得した第１学習データの目的変数を入力データとして、モデル記憶ステップにおいて記憶した第２学習モデルに適用することにより出力される目的変数に基づき、第２学習データを特定するステップである、付記１記載のプログラム。
これにより、より短い処理時間、より低コストで第２学習データを特定することができる。

【0100】

（付記１１）
プロセッサと、メモリとを備えるコンピュータに実行される方法であって、プロセッサが、付記１から付記１０のいずれかに係る発明において実行される全てのステップを実行する方法。
これにより、学習データが類似する第２学習データにおいて時系列予測モデルの学習に用いた学習パラメータ（最適化後パラメータ、初期パラメータ等）を初期パラメータとして、学習モデルを学習させることができる。学習モデルの学習プロセスの収束速度や、学習モデルの品質を向上させることができる。

【0101】

（付記１２）
制御部と、記憶部とを備える情報処理装置であって、制御部が、付記１から付記１０のいずれかに係る発明において実行される全てのステップを実行する情報処理装置。
これにより、学習データが類似する第２学習データにおいて時系列予測モデルの学習に用いた学習パラメータ（最適化後パラメータ、初期パラメータ等）を初期パラメータとして、学習モデルを学習させることができる。学習モデルの学習プロセスの収束速度や、学習モデルの品質を向上させることができる。

【0102】

（付記１３）
付記１から付記１０のいずれかに係る発明において実行される全てのステップを実行する手段を備えるシステム。
これにより、学習データが類似する第２学習データにおいて時系列予測モデルの学習に用いた学習パラメータ（最適化後パラメータ、初期パラメータ等）を初期パラメータとして、学習モデルを学習させることができる。学習モデルの学習プロセスの収束速度や、学習モデルの品質を向上させることができる。

【符号の説明】

【0103】

１システム、１０サーバ、１０１記憶部、１０４制御部、１０６入力装置、１０８出力装置、２０ユーザ端末、２０１記憶部、２０４制御部、２０６入力装置、２０８出力装置、３０管理者端末、３０１記憶部、３０４制御部、３０６入力装置、３０８出力装置

【要約】（修正有）

【課題】学習モデルの学習プロセスの品質を向上させるプログラム、方法、情報処理装置及びシステムを提供する。
【解決手段】時系列データである第１学習データを取得する第１学習データ取得し、複数の時系列予測モデルと、当該複数の時系列予測モデルの学習に用いられる時系列データである学習データと、当該複数の時系列予測モデルの学習パラメータとを、それぞれ関連付けて記憶し、第１学習データ取得ステップにおいて取得した第１学習データに基づき、記憶ステップにおいて記憶した複数の学習データのうち、時系列推移が第１学習データと類似する第２学習データを特定し、データ特定ステップにおいて特定した第２学習データと関連付けて記憶した第２学習パラメータを取得するパラメータ取得し、第１学習データに基づき、パラメータ取得ステップにおいて取得した第２学習パラメータに基づく初期パラメータを用いて学習モデルを学習させる。
【選択図】図１１