特許7616373 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7616373情報処理装置、方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2025-01-08

(45)【発行日】2025-01-17

(54)【発明の名称】情報処理装置、方法及びプログラム

(51)【国際特許分類】

G06F 16/2453 20190101AFI20250109BHJP

【ＦＩ】

G06F16/2453

【請求項の数】 9

(21)【出願番号】P 2023526708

(86)(22)【出願日】2021-06-09

(86)【国際出願番号】 JP2021021852

(87)【国際公開番号】W WO2022259400

(87)【国際公開日】2022-12-15

【審査請求日】2023-12-04

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100149548

【弁理士】

【氏名又は名称】松沼泰史

(74)【代理人】

【識別番号】100181135

【弁理士】

【氏名又は名称】橋本隆史

(72)【発明者】

【氏名】石坂一久

【審査官】原秀人

(56)【参考文献】

【文献】特開平０６－２０８４９１（ＪＰ，Ａ）

【文献】米国特許出願公開第２００９／０１７７６２１（ＵＳ，Ａ１）

【文献】特開２００７－０７３０２４（ＪＰ，Ａ）

【文献】特開２００７－３３４３８８（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１７／００６８８９１（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／２４５３

(57)【特許請求の範囲】

【請求項1】

変換対象のプログラム中で、テーブル結合命令である第１テーブル結合命令に続けて実行される前記テーブル結合命令である第２テーブル結合命令の１つ目の引数となるデータテーブルが、前記第１テーブル結合命令で生成されるデータテーブルであり、かつ、前記第２テーブル結合命令の２つ目の引数となるデータテーブルが、前記第１テーブル結合命令の１つ目の引数となるデータテーブルを引数とする中間テーブル生成命令である第１中間テーブル生成命令で生成されるデータテーブルである場合、前記第１テーブル結合命令の１つ目の引数となる前記データテーブルを、前記第２テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数となるデータテーブルを、前記第１テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数に前記第１中間テーブル生成命令で生成される前記データテーブルを設定し、前記第２テーブル結合命令の２つ目の引数に引数変更後の前記第１テーブル結合命令で生成されるデータテーブルを設定する結合変換手段、を備える
情報処理装置。

【請求項2】

前記結合変換手段は、前記第２テーブル結合命令の１つ目の引数となるデータテーブルが、前記第１テーブル結合命令で生成されるデータテーブルであり、前記第２テーブル結合命令の２つ目の引数となるデータテーブルが、前記第１中間テーブル生成命令で生成されるデータテーブルであり、かつ、前記第１テーブル結合命令の２つ目の引数となるデータテーブルが、前記第１中間テーブル生成命令でのデータテーブルの行に対するグループ分けによるグループと同じグループ、または、前記第１中間テーブル生成命令でのデータテーブルの行に対するグループ分けによるグループと包含関係のあるグループを形成するグループ分けを含む中間テーブル生成命令である第２中間テーブル生成命令で生成されるデータテーブルである場合に、前記第１テーブル結合命令の１つ目の引数となるデータテーブルを、前記第２テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数となるデータテーブルを、前記第１テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数に、前記第１中間テーブル生成命令で生成されるデータテーブルを設定し、前記第２テーブル結合命令の２つ目の引数に、引数変更後の前記第１テーブル結合命令で生成されるデータテーブルを設定する処理を行う、
請求項１に記載の情報処理装置。

【請求項3】

前記結合変換手段は、前記変換対象のプログラム中に含まれる複数の前記テーブル結合命令のうち、第３テーブル結合命令と、前記第３テーブル結合命令よりも後から実行される第４テーブル結合命令との間に１つ以上の中間テーブル生成命令が含まれ、それら中間テーブル生成命令の引数となるデータテーブルの何れも、前記第３テーブル結合命令で生成されるデータテーブルと異なる場合、前記第３テーブル結合命令を、前記１つ以上の中間テーブル生成命令と前記第４テーブル結合命令との間に設定する処理を行った後、前記第２テーブル結合命令の１つ目の引数となるデータテーブルが、前記第１テーブル結合命令で生成されるデータテーブルであり、かつ、前記第２テーブル結合命令の２つ目の引数となるデータテーブルが、前記第１中間テーブル生成命令で生成されるデータテーブルである場合に、前記第１テーブル結合命令の１つ目の引数となるデータテーブルを、前記第２テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数となるデータテーブルを、前記第１テーブル結合命令の１つ目の引数に移動させ、前記第１テーブル結合命令の２つ目の引数に、前記第１中間テーブル生成命令で生成されるデータテーブルを設定し、前記第２テーブル結合命令の２つ目の引数に、引数変更後の前記第１テーブル結合命令で生成されるデータテーブルを設定する処理を行う、
請求項１または請求項２に記載の情報処理装置。

【請求項4】

前記変換対象のプログラム中に含まれる中間テーブル生成命令である第３中間テーブル生成命令の引数となる前記データテーブルが前記テーブル結合命令である第５テーブル結合命令で生成され、前記第５テーブル結合命令の引数となる２つのデータテーブルのうち一方のデータテーブルが、前記２つのデータテーブルのうちもう一方のデータテーブルを引数とする中間テーブル生成命令である第４中間テーブル生成命令によって生成され、かつ、前記第５テーブル結合命令で生成される前記データテーブルの列のうち、前記第３中間テーブル生成命令で参照される列が、前記第４中間テーブル生成命令の引数となる前記データテーブルの列に含まれる場合、第３中間テーブル生成命令の引数に、前記第４中間テーブル生成命令の引数となる前記データテーブルを設定する集約変換手段をさらに備え、
前記結合変換手段は、前記集約変換手段による処理後の前記プログラムに対して、前記第２テーブル結合命令の１つ目の引数となるデータテーブルが、前記第１テーブル結合命令で生成されるデータテーブルであり、かつ、前記第２テーブル結合命令の２つ目の引数となるデータテーブルが、前記第１中間テーブル生成命令で生成されるデータテーブルである場合に、前記第１テーブル結合命令の１つ目の引数に、前記第２テーブル結合命令の１つ目の引数となるデータテーブルを設定し、前記第１テーブル結合命令の２つ目の引数となるデータテーブルを、前記第１テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数となるデータテーブルを前記第１中間テーブル生成命令で生成されるデータテーブルに入力するよう設定し、前記第２テーブル結合命令の２つ目の引数に、引数変更後の前記第１テーブル結合命令で生成されるデータテーブルを設定する処理を行う、
請求項１から３の何れか一項に記載の情報処理装置。

【請求項5】

前記第２テーブル結合命令によって生成されるデータテーブルは、機械学習において教師データとして用いられる特徴量を含む
請求項１から４の何れか一項に記載の情報処理装置。

【請求項6】

引数変更後の前記第２テーブル結合命令の１つ目の引数となるデータテーブルは、第１の複数の値と、前記第１の複数の値に対応する第２の複数の値を含む
請求項１から５の何れか一項に記載の情報処理装置。

【請求項7】

前記第１中間テーブル生成命令でのデータテーブルの行に対するグループ分けによるグループは、所定の基準に基づいてグループ化され、前記特徴量を含む
請求項５に記載の情報処理装置。

【請求項8】

コンピュータに用いられる方法であって、
変換対象のプログラム中で、テーブル結合命令である第１テーブル結合命令に続けて実行される前記テーブル結合命令である第２テーブル結合命令の１つ目の引数となるデータテーブルが、前記第１テーブル結合命令で生成されるデータテーブルであり、かつ、前記第２テーブル結合命令の２つ目の引数となるデータテーブルが、前記第１テーブル結合命令の１つ目の引数となるデータテーブルを引数とする中間テーブル生成命令である第１中間テーブル生成命令で生成されるデータテーブルである場合、前記第１テーブル結合命令の１つ目の引数となる前記データテーブルを、前記第２テーブル結合命令の１つ目の引数に入力するよう設定し、
前記第１テーブル結合命令の２つ目の引数となるデータテーブルを、前記第１テーブル結合命令の１つ目の引数に入力するよう設定し、
前記第１テーブル結合命令の２つ目の引数に前記第１中間テーブル生成命令で生成される前記データテーブルを設定し、
前記第２テーブル結合命令の２つ目の引数に引数変更後の前記第１テーブル結合命令で生成されるデータテーブルを設定するステップを有する
方法。

【請求項9】

コンピュータに、
変換対象のプログラム中で、テーブル結合命令である第１テーブル結合命令に続けて実行される前記テーブル結合命令である第２テーブル結合命令の１つ目の引数となるデータテーブルが、前記第１テーブル結合命令で生成されるデータテーブルであり、かつ、前記第２テーブル結合命令の２つ目の引数となるデータテーブルが、前記第１テーブル結合命令の１つ目の引数となるデータテーブルを引数とする中間テーブル生成命令である第１中間テーブル生成命令で生成されるデータテーブルである場合、前記第１テーブル結合命令の１つ目の引数となる前記データテーブルを、前記第２テーブル結合命令の１つ目の引数に入力するよう設定し、
前記第１テーブル結合命令の２つ目の引数となるデータテーブルを、前記第１テーブル結合命令の１つ目の引数に入力するよう設定し、
前記第１テーブル結合命令の２つ目の引数に前記第１中間テーブル生成命令で生成される前記データテーブルを設定し、
前記第２テーブル結合命令の２つ目の引数に引数変更後の前記第１テーブル結合命令で生成されるデータテーブルを設定するステップを実行させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、情報処理装置、方法及びプログラムに関する。

【背景技術】

【0002】

特許文献１において、膨大なデータからデータの特徴を効率よく抽出するために、互いに異種なテーブルＰＱＲが入力された場合、まずＰＲを結合し、その後にＱを結合することによって３テーブルを１テーブルに結合できること、また、さらに結合したテーブルを用いてフィールドＢとＤにあるデータ値同士の関係を分析できることが記載されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０１９－１６８８２０号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

特許文献１に記載された発明において、複数のテーブルを集約及び結合する際、その過程に生成される中間テーブルのサイズを小さくすることは記載されていない。

【0005】

上記事情に鑑み、この発明は、上述の課題を解決する情報処理装置、方法及びプログラムを提供することを目的としている。

【課題を解決するための手段】

【0006】

（１）本開示の一態様は、変換対象のプログラム中で、テーブル結合命令である第１テーブル結合命令に続けて実行される前記テーブル結合命令である第２テーブル結合命令の１つ目の引数となるデータテーブルが、前記第１テーブル結合命令で生成されるデータテーブルであり、かつ、前記第２テーブル結合命令の２つ目の引数となるデータテーブルが、前記第１テーブル結合命令の１つ目の引数となるデータテーブルを引数とする中間テーブル生成命令である第１中間テーブル生成命令で生成されるデータテーブルである場合、前記第１テーブル結合命令の１つ目の引数となる前記データテーブルを、前記第２テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数となるデータテーブルを、前記第１テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数に前記第１中間テーブル生成命令で生成される前記データテーブルを設定し、前記第２テーブル結合命令の２つ目の引数に引数変更後の前記第１テーブル結合命令で生成されるデータテーブルを設定する結合変換手段、を備える情報処理装置である。

【0007】

（２）本開示の一態様は、コンピュータに用いられる方法であって、変換対象のプログラム中で、テーブル結合命令である第１テーブル結合命令に続けて実行される前記テーブル結合命令である第２テーブル結合命令の１つ目の引数となるデータテーブルが、前記第１テーブル結合命令で生成されるデータテーブルであり、かつ、前記第２テーブル結合命令の２つ目の引数となるデータテーブルが、前記第１テーブル結合命令の１つ目の引数となるデータテーブルを引数とする中間テーブル生成命令である第１中間テーブル生成命令で生成されるデータテーブルである場合、前記第１テーブル結合命令の１つ目の引数となる前記データテーブルを、前記第２テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数となるデータテーブルを、前記第１テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数に前記第１中間テーブル生成命令で生成される前記データテーブルを設定し、前記第２テーブル結合命令の２つ目の引数に引数変更後の前記第１テーブル結合命令で生成されるデータテーブルを設定するステップを有する方法である。

【0008】

（３）本開示の一態様は、コンピュータに、変換対象のプログラム中で、テーブル結合命令である第１テーブル結合命令に続けて実行される前記テーブル結合命令である第２テーブル結合命令の１つ目の引数となるデータテーブルが、前記第１テーブル結合命令で生成されるデータテーブルであり、かつ、前記第２テーブル結合命令の２つ目の引数となるデータテーブルが、前記第１テーブル結合命令の１つ目の引数となるデータテーブルを引数とする中間テーブル生成命令である第１中間テーブル生成命令で生成されるデータテーブルである場合、前記第１テーブル結合命令の１つ目の引数となる前記データテーブルを、前記第２テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数となるデータテーブルを、前記第１テーブル結合命令の１つ目の引数に入力するよう設定し、前記第１テーブル結合命令の２つ目の引数に前記第１中間テーブル生成命令で生成される前記データテーブルを設定し、前記第２テーブル結合命令の２つ目の引数に引数変更後の前記第１テーブル結合命令で生成されるデータテーブルを設定するステップを実行させるプログラムが記録された記録媒体である。

【発明の効果】

【0009】

本開示によれば、中間テーブルの生成を経て、入力データの特徴量を集約した結果を含む最終テーブルを取得する際に、中間テーブルのサイズを削減することができるため、処理負荷を抑えることができる。

【図面の簡単な説明】

【0010】

【図1】第１の実施形態における情報処理装置１の動作概要を示す図である。

【図2】第１の実施形態における情報処理装置１のハードウェア構成を示すブロック図である。

【図3】第１の実施形態における情報処理装置１の機能ブロック図である。

【図4】第１の実施形態における集約及び結合処理を示す概略図である。

【図5】第１の実施形態における集約及び結合処理を示す概略図である。

【図6】第１の実施形態における処理フロー１の処理の流れを示すフローチャートである。

【図7】第１の実施形態における集約及び結合処理を示す概略図である。

【図8】第１の実施形態におけるプログラム変換処理の流れを示すフローチャートである。

【図9】第２の実施形態におけるプログラム変換処理の流れを示すフローチャートである。

【図10】第３の実施形態におけるプログラム変換処理の流れを示すフローチャートである。

【図11】第４の実施形態におけるプログラム変換処理の流れを示すフローチャートである。

【図12】第５の実施形態におけるプログラム変換処理の流れを示すフローチャートである。

【図13】第５の実施形態におけるプログラム変換処理の流れを示すフローチャートである。

【図14】本開示における情報処理装置１の最小構成を示す図である。

【発明を実施するための形態】

【0011】

以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態で説明されている特徴の組み合わせの全てが発明に必須のものとは限らない。実施形態で説明されている複数の特徴のうち二つ以上の特徴が任意に組み合わされてもよい。また、同一若しくは同様の構成には同一の参照番号を付し、重複した説明は省略する。

【0012】

（第１の実施形態）
図１は、第１の実施形態における情報処理装置１の動作概要を示す図である。本開示の情報処理は、入力したテーブルに対して、選択、グルーピング及び集約処理を行い、集約した結果得られたデータ（特徴量）を、入力したテーブルに対して結合する技術に関する。本開示の情報処理において、情報処理装置１が備える集約変換部１１３及び結合変換部１１４は、図１に示す第１の処理フロー（処理フロー１）を実行するためのプログラムを、第２の処理フロー（処理フロー２）を実行するためのプログラムに変換する。なお、プログラムの変換は、結合変換部１１４のみによって実現されてもよい。

【0013】

後述するように、処理フロー２の方が処理フロー１よりも処理負荷が軽い。そこで、処理負荷軽減のために、集約変換部１１３及び結合変換部１１４は上記のような変換処理を実行する。プログラムは、高級言語、低級言語及びアセンブリ言語を含むプログラム言語により記述される。集約変換部１１３及び結合変換部１１４による処理については後述する。

【0014】

本実施形態において、入力されるテーブルは、２行以上の要素と、少なくとも２列の要素と、を含む。１列目の要素は、時刻の情報を含む。２列目の要素は、１列目の各行に含まれる時刻に対応する価格の情報を含む。価格は、例えば仮想通貨の価格でもよいし、所定の銘柄の株価又は投資信託の基準価額でもよい。情報処理装置１が備える集約結合処理部１１２は、入力したテーブルに含まれる価格の列を選択（select）し、１時間ごとに時刻が区切られた時間帯ごとにグループ化（groupby）する。なお、行と列との記載内容は入れ替えられてもよい。つまり、例えば、１行目の各列に含まれる各々の時刻に対応する価格の情報が、２行目に含まれていてもよい。

【0015】

集約結合処理部１１２は、グループ化された各グループ内の価格を集約する（aggregate）ことにより、特徴量を生成する。特徴量は、各グループ内の価格の平均値、最大値又は最小値を含む。集約結合処理部１１２は、特徴量を、各グループに含まれる時刻が含まれる行の新たな列に結合する。

【0016】

図１において、初期テーブルＴ０は初期入力データを含むテーブルである。情報処理装置１が備える取得部１１１は、初期テーブルＴ０を取得する。中間テーブルＴ１は、初期テーブルＴ０に対して、集約結合処理部１１２が、初期テーブルＴ０から、集約処理を実行する対象列を選択（select）、グルーピング（groupby）及び集約（aggregation）処理を行った後に得られる中間テーブルである。これらの頭文字を取って、入力/選択、グルーピング及び集約に係る一連の処理を、ＳＧＡ処理（あるいは、単にＳＧＡ）とも称する。ＳＧＡの詳細については後述する。

【0017】

中間テーブルＴ０’は、集約結合処理部１１２が、初期テーブルＴ０に対して、中間テーブルＴ１を結合する１回目の結合（join）処理を行った際に得られる中間テーブルである。結合処理を、ＪＯＩＮとも称する。１回目の結合処理を、ＪＯＩＮ１とも称する。ＪＯＩＮ処理の詳細については後述する。集約結合処理部１１２が、中間テーブルＴ０’に対して２回目のＳＧＡ処理（ＳＧＡ２）を行うことにより、中間テーブルＴ２が得られる。集約結合処理部１１２は、初期テーブルＴ０’及び中間テーブルＴ２を用いて２回目のＪＯＩＮ処理（ＪＯＩＮ２）を行い、最終テーブルＴ０’’が得られる。

【0018】

初期テーブルＴ０は、複数行及び複数列の要素を含むテーブルである。中間テーブルＴ１及び中間テーブルＴ２は、入力されたテーブルの特徴量を含む。集約結合処理部１１２は、入力されたテーブルの特徴量を、入力されたテーブルに対してＳＧＡを実行することにより抽出する。特徴量が抽出される結果、中間テーブルＴ１及び中間テーブルＴ２に含まれる要素の行の数は、初期テーブルＴ０に含まれる要素の行の数より少ない。中間テーブルＴ１及び中間テーブルＴ２に含まれる要素の列の数は、初期テーブルＴ０に含まれる要素の列の数より少なくてもよいし、多くてもよい。

【0019】

例えば、初期テーブルＴ０は５行の要素を含み、中間テーブルＴ１及び中間テーブルＴ２は、３行の要素を含んでいてもよい。中間テーブルＴ０’は、ＪＯＩＮ１処理の後、５行の要素を含む。最終テーブルＴ０’’は、集約結合処理部１１２によるＪＯＩＮ処理２の後、５行の要素を含む。

【0020】

処理フロー２において、集約変換部１１３及び結合変換部１１４は、ＳＧＡ処理及びＪＯＩＮ処理の一部の入力及びその順序を、処理フロー１から変換している。ＳＧＡ１及びその結果得られる中間テーブルＴ１については処理フロー１と同様である。処理フロー２において、ＳＧＡ２の入力及び出力、ＪＯＩＮ１の入力及び出力、ＪＯＩＮ２の入力及び出力が処理フロー１と異なる。

【0021】

具体的には、処理フロー２のＳＧＡ２は、入力を初期テーブルＴ０とする点で処理フロー１と異なる。処理フロー２のＪＯＩＮ１において、入力は中間テーブルＴ１及び中間テーブルＴ２である。中間テーブルＴ１及び中間テーブルＴ２は、３行の要素を含む。ＪＯＩＮ１の入力及び出力は、ともに３行の行数を含む点で処理フロー１と異なる。つまり、処理フロー２におけるＪＯＩＮ１の入力及び出力に含まれる行数は、処理フロー１におけるＪＯＩＮ１の出力に含まれる行数よりも少ない。したがって、処理フロー２の方が処理フロー１よりも中間テーブルのサイズを小さくすることができる。

【0022】

図２は、第１の実施形態における情報処理装置１のハードウェア構成を示すブロック図である。情報処理装置１は、電子計算機である。情報処理装置１は、パーソナルコンピュータ（ＰＣ）でもよいし、ワークステーションでもよいし、スマートフォンでもよいし、タブレットコンピュータでもよい。情報処理装置１は、中央処理部（Ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ：ＣＰＵ）１０１、ランダムアクセスメモリ（Ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ：ＲＡＭ）１０２、リードオンリーメモリ（Ｒｅａｄｏｎｌｙｍｅｍｏｒｙ：ＲＯＭ）１０３及びハードディスクドライブ（Ｈａｒｄｄｉｓｃｄｒｉｖｅ：ＨＤＤ）１０４を備える。

【0023】

情報処理装置１は、通信インターフェイス（Ｉｎｔｅｒｆａｃｅ：ＩＦ）１０５、入力装置１０６及び出力装置１０７を備える。なお、図２において示されていないバス、配線、駆動装置等を介して、ＣＰＵ１０１、ＲＡＭ１０２、ＲＯＭ１０３、ＨＤＤ１０４、通信ＩＦ１０５、入力装置１０６及び出力装置１０７は相互に接続される。

【0024】

ＣＰＵ１０１は、ＲＯＭ１０３、ＨＤＤ１０４等に記憶されたプログラムに従って所定の演算を行う。ＣＰＵ１０１は、情報処理装置１の各部を制御する機能をも有する処理装置である。ＲＡＭ１０２は、揮発性記憶媒体から構成される。ＲＡＭ１０２は、一時的なメモリ領域を提供する。当該一時的なメモリ領域は、ＣＰＵ１０１の動作に必要である。

【0025】

ＲＯＭ１０３は、不揮発性記憶媒体から構成される。ＲＯＭ１０３は、情報処理装置１の動作に用いられるプログラム等の必要な情報を記憶する。ＨＤＤ１０４は、不揮発性記憶媒体から構成され、イヤホン２と送受信するデータの一時記憶、情報処理装置１の動作用プログラムの記憶等を行う記憶装置である。ＨＤＤ１０４は、ＨＤＤではなくてＳｏｌｉｄｓｔａｔｅｄｒｉｖｅ（ＳＳＤ）でもよい。

【0026】

通信ＩＦ１０５は、他の装置とデータ及び制御情報等の送受信を可能とする通信インターフェイスである。通信ＩＦ１０５は、例えばＢｌｕｅｔｏｏｔｈ（登録商標）、Ｗｉ－Ｆｉ（登録商標）等の規格に基づいている。

【0027】

入力装置１０６は、ユーザＨが情報処理装置１を操作するために用いられる装置である。入力装置１０６は、例えばタッチスクリーンパネルでもよいし、キーボード、マウス、トラックボール、ペン型入力装置でもよい。

【0028】

出力装置１０７は、情報の表示、操作入力用のグラフィカルユーザインターフェイス（Ｇｒａｐｈｉｃａｌｕｓｅｒｉｎｔｅｒｆａｃｅ：ＧＵＩ）等の表示に用いられる表示装置である。出力装置１０７は、液晶ディスプレイ、有機エレクトロルミネッセンス（Ｅｌｅｃｔｒｏ-Ｌｕｍｉｎｅｓｃｅｎｃｅ：ＥＬ）ディスプレイ等である。入力装置１０６及び出力装置１０７は、タッチパネルとして一体に形成されていてもよい。

【0029】

なお、図２に示されているハードウェア構成は例示である。図２に示された装置以外の装置が追加されていてもよいし、一部の装置が設けられていなくてもよい。また、図２に示された装置のうち、一部の装置は、同様の機能を有する別の装置に置換されていてもよい。更に、本実施形態の一部の機能がネットワークを介して他の装置により提供されてもよい。本実施形態の機能は、複数の装置に分散されて実現されるものであってもよい。図２に示されているハードウェア構成は適宜変更可能である。

【0030】

図３は、第１の実施形態における情報処理装置１の機能ブロック図である。情報処理装置１は、取得部１１１、集約結合処理部１１２、集約変換部１１３、結合変換部１１４、出力部１１５及び記憶部１１６を備える。取得部１１１の機能は、通信ＩＦ１０５及び／又は入力装置１０６により実現される。

【0031】

集約結合処理部１１２、集約変換部１１３及び結合変換部１１４の機能は、ＣＰＵ１０１が、ＲＯＭ１０３、ＨＤＤ１０４等に記憶されたプログラムをＲＡＭ１０２にロードして実行することにより実現される。出力部１１５の機能は、通信ＩＦ１０５及び／又は出力装置１０７により実現される。記憶部１１６は、ＲＡＭ１０２、ＲＯＭ１０３及びＨＤＤ１０４の少なくともいずれかである。記憶部１１６は、外付けＨＤＤあるいはフラッシュメモリ等でもよい。

【0032】

図４は、第１の実施形態における集約及び結合処理を示す概略図である。初期入力テーブル（t0）は、５行２列のテーブルにより表されるが、行数及び列数はこれに限られない。初期入力テーブルは、時刻と、その時刻に対応する仮想通貨の額とを表している。取得部１１１は時刻と、その時刻に対応する仮想通貨の額とを取得する。初期入力テーブルにおける時刻を第１の複数の値と称し、仮想通貨の額を第２の複数の値と称してもよい。

【0033】

まず、処理（１）として、時刻を１時間ごとに区切るというルール（第１の基準）により、集約結合処理部１１２は初期入力テーブルをグループ化し、各グループ仮想通貨の額をグループ化する。例えば、集約結合処理部１１２は、初期入力テーブルを、5月28日の10:00から11:00の間に取得した額と、5月28日の11:00から12:00の間に取得した額と、5月29日の9:00から10:00の間に取得した額にグループ化する。

【0034】

処理（２）において、集約結合処理部１１２は、第１の集約処理として、各時間帯（グループ）ごとに平均値を集約テーブル（t1）として集約する。第１の集約処理において、「平均値を取る」というルールを、第２の基準と称してもよい。集約結合処理部１１２は、取得部１１１が取得した時刻を１時間ごとにグループ化しているので、t1の行数は３となる。つまり、入力テーブルに対して、集約結合処理部１１２は１時間ごとの平均値（特徴量の一例）を抽出しているので、入力の行数５に対して、出力t1の行数が３に減る。本開示において、集約処理を集約命令と言い換えてもよいし、中間テーブル生成命令と言い換えてもよい。

【0035】

処理（３）において、集約結合処理部１１２は、第１の結合処理として、t1を、もとのテーブルの対応する時間に結合する。結合結果はt2として表される。t2において、集約結合処理部１１２は、10時台の平均値23522.5を、時刻10:23及び10:45の対応する欄に追加（結合）する。集約結合処理部１１２は、11時台の平均値23336.5を、時刻11:45及び11:52の対応する欄に追加（結合）する。集約結合処理部１１２は、5月29日9時台の平均値24468を、時刻9:42の対応する欄に追加（結合）する。ここで、第１の結合処理によって、結合後のテーブル（中間テーブルt2）の行数は５行になっている。

【0036】

本開示において、結合処理（結合命令）は、２つのテーブルを引数とする処理又は命令である。結合処理によって、１つ目の引数となるテーブルに対して、２つ目の引数となるテーブルに含まれるデータが追加される。初期入力テーブルを取得（選択）し、グループ化し、集約する処理をまとめて、ＳＧＡと表してもよい。

【0037】

図５は、第１の実施形態における集約及び結合処理を示す概略図である。図５に示す図は、図４に示した処理の続きを示すものである。図５に示す処理は、図４と同様に処理フロー１に関する。処理（４）として、集約結合処理部１１２は、結合テーブルt2の取得（選択）後、第２の集約処理を実行する。第２の集約処理において、集約結合処理部１１２は、仮想通貨の額を、時刻１時間ごとにグループ化する。集約結合処理部１１２は、各時間帯ごとに最大値を、集約テーブルt3として取得する。第２の集約処理において最大値を取るというルールを、第４の基準と称してもよい。入力テーブルに対して、集約結合処理部１１２は１時間ごとの最大値（特徴量の一例）を抽出しているので、入力の行数５に対して、出力t3の行数が３に減る。

【0038】

処理（５）において、第２の結合処理として、集約結合処理部１１２は、t3を、テーブルt2に結合する。結合結果は、結合テーブルt4として表される。結合テーブルt4として、初期入力テーブルt0に結合された集約処理の結果（つまり、各時間帯ごとの平均値及び最大値）を、入力テーブルの特徴量と称してもよい。特徴量は、機械学習における教師データとして用いられてもよい。

【0039】

図６は、第１の実施形態における特徴量抽出プログラムによる処理フロー１の処理の流れを示すフローチャートである。図６の例では、特徴量抽出プログラムは、処理フロー１の実行を命令する命令群を含む。図6に示すフローチャートは、図４及び５の処理フローに相当する。

【0040】

ステップＳ１０１において、特徴量抽出プログラムは、入力テーブル（初期入力テーブル）の取得を命令する。入力テーブルは、第１の複数の値と、第２の複数の値を含む。第２の複数の値のそれぞれは、第１の複数の値のそれぞれに対応する。入力テーブルは、複数の行及び列によって表される。入力テーブルは、初期テーブルＴ０でもよい。

【0041】

ステップＳ１０２において、特徴量抽出プログラムは、取得した入力テーブルに含まれるデータを所定のルール（第１の基準）によってグループ化することを命令する。第１の基準の詳細については後述する。

【0042】

ステップＳ１０３において、特徴量抽出プログラムは、グループ化（グループ分け）されたグループごとに、所定のルール(第２の基準)によって第１の集約処理を行うことを命令する。第１の集約処理を、t1 = sga1（t0, R2）と表してもよい。t0及びt1はそれぞれ入力及び出力を表す。t0を、第１の引数と表してもよい。R2は、第２の基準を示す。第１の集約処理の詳細、及び第２の基準については後述する。

【0043】

ステップＳ１０４において、特徴量抽出プログラムは、t0に対する第１の結合処理の実行を命令する。第１の結合処理は、t0に対してt1を結合する処理である。第１の結合処理を、t2 = join1（t0, t1）と表してもよい。結合する処理を、第３の基準と称してもよい。第１の結合処理の詳細については後述する。

【0044】

ステップＳ１０５において、特徴量抽出プログラムは、t2（第１の結合処理の出力）に対する第２の集約処理の実行を命令する。第２の集約処理を、t3 = sga2（t2, R4）と表してもよい。R4は第４の基準を表す。第２の集約処理の詳細、及び第４の基準については後述する。

【0045】

ステップＳ１０６において、特徴量抽出プログラムは、t2に対する第２の結合処理の実行を命令する。第２の結合処理は、t2に対してt3を結合する処理である。第２の結合処理を、t4 = join2（t2, t3）と表してもよい。第２の結合処理の詳細については後述する。特徴量抽出プログラムによる命令は以上で終了する。

【0046】

図７は、第１の実施形態における集約及び結合処理を示す概略図である。言い換えると、図７は、図１における処理フロー２の流れを示す。集約変換部１１３は、処理フロー１における第２の集約処理の入出力を変更するように集約変換処理を実行し、特徴量抽出プログラムを書き換える。図７の例では、特徴量抽出プログラムは、処理フロー２の実行を命令する命令群である。

【0047】

結合変換部１１４は、第１及び第２の結合処理の入力と、第１の結合処理の出力を変更するように、結合変換処理を実行し、特徴量抽出プログラムを書き換える。その結果、特徴量抽出プログラムが示す処理は、処理フロー２に相当する。集約変換部１１３及び結合変換部１１４の処理については後述する。

【0048】

初期入力テーブルt0の取得（選択）後、処理（１）として、集約結合処理部１１２は、第１の集約処理において、仮想通貨の額を時刻１時間ごとにグループ化した際の、各時間帯ごとの平均値を、集約テーブルt１として集約する。

【0049】

処理（２）として、第２の集約処理において、集約結合処理部１１２は、仮想通貨の額を時刻１時間ごとにグループ化する。集約結合処理部１１２は、各時間帯ごとに最大値を、集約テーブルt2として集約する。

【0050】

処理（３）として、集約結合処理部１１２は、第１の結合処理において、集約テーブルt1及びt2を結合し、結合テーブルt3を得る。第１の結合処理によって、結合後のテーブル（中間テーブルt3）の行数は３のままであり、この点において処理フロー２は処理フロー１と異なる。

【0051】

処理（４）として、集約結合処理部１１２は、第２の結合処理において、初期入力テーブルt0及び結合テーブルt3を結合し、結合テーブルt4を得る。

【0052】

図４及び５に示した処理フロー１により得られる最終的な結合テーブルt4と、図７に示した処理フロー２により得られる最終的な結合テーブルt4の中身は同一である。

【0053】

一方、図４及び５に示した処理フロー１において、集約結合処理部１１２が第１の結合処理を行う際、行数が５の初期入力テーブルt0に対して、行数が３の集約テーブルt1を結合する結果、中間テーブルとして結合テーブルt2を得る。この結果、中間テーブルt2は５行の要素を有する。一方、図７に示した処理フロー２において、集約結合処理部１１２が第１の結合処理を行う際、結合対象のt1及びt2の行数は３である。その結果、集約結合処理部１１２は、中間テーブルとして結合テーブルt3を得るが、t3の行数は３である。したがって、処理フロー２の方が処理フロー１よりも中間テーブルのサイズを小さくすることができる。言い換えると、処理フロー２への変換により、処理フロー１よりも処理負荷を軽減することができる。

【0054】

図８は、第１の実施形態におけるプログラム変換処理の流れを示すフローチャートである。プログラム変換処理は、結合変換部１１４が、処理フロー１を実行するプログラムを、処理フロー２を実行するプログラムに変換する処理である。

【0055】

ステップＳ１１０１において、取得部１１１は、特徴量抽出プログラムを取得する。図６及び７の例と同様、図８の例において、特徴量抽出プログラムは、処理フロー１に係る一連の処理の実行を命令する命令群である。取得部１１１は、特徴量抽出プログラムを、記憶部１１６から読み出してもよい。特徴量抽出プログラムは、第１テーブル結合命令、第２テーブル結合命令及び第１中間テーブル生成命令を含む。

【0056】

第１テーブル結合命令及び第２テーブル結合命令は、テーブル結合処理を実行する命令である。集約結合処理部１１２は、第２テーブル結合命令を、第１テーブル結合命令に続けて実行する。第１中間テーブル生成命令は、初期入力テーブルの生成後、最終的な結合テーブルの生成前に存在する中間テーブルの生成を命令するものである。第１中間テーブル生成命令は、集約処理（ＳＧＡ）を実行する命令でもよい。処理はステップＳ１１０２に進む。

【0057】

ステップＳ１１０２において、第２テーブル結合命令の１つ目の引数の１つ目の引数となるデータテーブルが第１テーブル結合命令で生成されるデータテーブルか否かを、結合変換部１１４は判定する。判定結果がYesの場合、処理はステップＳ１１０３に進む。判定結果がNoの場合、処理は終了する。

【0058】

ステップＳ１１０３において、第２テーブル結合命令の２つ目の引数となるデータテーブルが第１中間テーブル結合命令で生成されるデータテーブルか否かを、結合変換部１１４は判定する。判定結果がYesの場合、処理はステップＳ１１０４に進む。判定結果がNoの場合、処理は終了する。

【0059】

ステップＳ１１０４において、結合変換部１１４は、第１テーブル結合命令の１つ目の引数であるデータテーブルを、第２テーブル結合命令の１つ目の引数に設定する。ここで、第１テーブル結合命令の１つ目の引数であるデータテーブルは、初期入力テーブルでもよい。処理はステップＳ１１０５に進む。

【0060】

ステップＳ１１０５において、結合変換部１１４は、第１テーブル結合命令の２つ目の引数であるデータテーブルを、第１テーブル結合命令の１つ目の引数に設定する。第１テーブル結合命令の２つ目の引数であるデータテーブルは、ＳＧＡ処理によって生成されていてもよい。処理はステップＳ１１０６に進む。

【0061】

ステップＳ１１０６において、結合変換部１１４は、第１テーブル結合命令の２つ目の引数に、第１中間テーブル生成命令により生成されるデータテーブルを設定する。処理はステップＳ１１０７に進む。

【0062】

ステップＳ１１０７において、結合変換部１１４は、第２テーブル結合命令の２つ目の引数に、ステップＳ１１０５及びステップＳ１１０６における引数変更後の第１テーブル結合命令で生成されるデータテーブルを設定する。集約結合処理部１１２は、第２テーブル結合命令を実行することにより最終テーブルを得る。ここで、第１テーブル結合命令は第１の結合処理に対応し、第２テーブル結合命令は、第２の結合処理に対応している。引数変更後の第１テーブル結合命令における１つ目の引数は、初期入力テーブルでもよい。

【0063】

ステップＳ１１０５及びステップＳ１１０６において、第１テーブル結合命令における２つの引数は、いずれもＳＧＡ処理により得られる場合、第１テーブル結合命令で生成されるデータテーブル(つまり、中間テーブル)のサイズは小さくなっている。これにより、中間テーブルの生成を経て、入力データの特徴量を最終テーブルとして取得する際に、中間テーブルのサイズを削減することができるため、処理負荷を抑えることができる。

【0064】

（第２の実施形態）
図９は、第２の実施形態におけるプログラム変換処理の流れを示すフローチャートである。

【0065】

ステップＳ２１０１において、取得部１１１は、特徴量抽出プログラムを取得する。処理はステップＳ２１０２に進む。

【0066】

ステップＳ２１０２において、第２テーブル結合命令の１つ目の引数が、第１テーブル結合命令で生成されるデータテーブルであるか否かを結合変換部１１４は判定する。判定結果がYesの場合、処理はステップＳ２１０３に進む。判定結果がNoの場合、処理は終了する。

【0067】

ステップＳ２１０３において、第２テーブル結合命令の２つ目の引数が、第１中間テーブル生成命令で生成されるデータテーブルであるか否かを結合変換部１１４は判定する。判定結果がYesの場合、処理はステップＳ２１０４に進む。判定結果がNoの場合、処理は終了する。

【0068】

ステップＳ２１０４において、第１テーブル結合命令の２つ目の引数が、第２中間テーブル生成命令で生成されるか否かを、結合変換部１１４は判定する。第２中間テーブル生成命令は、第１中間テーブル生成命令でのデータテーブルの行に対するグループ分けによるグループと同じグループを形成するグループ分けを含む中間テーブル生成命令である。判定結果がYesの場合、処理はステップＳ２１０５に進む。この場合、第１実施形態のステップＳ１１０４以降の処理が実行される。判定結果がNoの場合、処理はステップＳ２１０６に進む。

【0069】

ステップＳ２１０６において、第１テーブル結合命令の２つ目の引数が、第２中間テーブル生成命令で生成されるか否かを結合変換部１１４は判定する。ここで、第２中間テーブル生成命令は、第１中間テーブル生成命令でのデータテーブルの行に対するグループ分けによるグループと包含関係のあるグループを形成するグループ分けを含む中間テーブル生成命令であってもよい。判定結果がYesの場合、処理はステップＳ２１０７に進む。この場合、第１実施形態のステップＳ１１０４以降の処理が実行される。集約結合処理部１１２は、第２テーブル結合命令を実行することにより最終テーブルを得る。

【0070】

ここで、「包含関係のある」とは、一方のグループ分けの単位が、他方のグループ分けの単位を包含する場合を指す。例えば一方のグループ分けの単位が、データテーブルに含まれる値を５分おきにグループ分けし、他方のグループ分けが、データテーブルに含まれる値を６０分おきにグループ分けする場合を考える。この場合、６０は５の倍数なので、一方のグループ分けの単位は、他方のグループ分けの単位を包含すると捉えることが出来る。

【0071】

【0072】

（第３の実施形態）
図１０は、第３の実施形態におけるプログラム変換処理の流れを示すフローチャートである。

【0073】

ステップＳ３１０１において、取得部１１１は、特徴量抽出プログラムを取得する。処理はステップＳ３１０２に進む。

【0074】

ステップＳ３１０２において、結合変換部１１４は、第３テーブル結合命令と、第４テーブル結合命令との間に１つ以上の中間テーブル生成命令が含まれるか否かを判定する。集約結合処理部１１２は、第３テーブル結合命令を実行した後に、第４テーブル結合命令を実行するよう構成される。判定結果がYesの場合、処理はステップＳ３１０３に進む。判定結果がNoの場合、処理は終了する。

【0075】

ステップＳ３１０３において、１つ以上の中間テーブル生成命令の引数となるデータテーブルの何れも、第３テーブル結合命令で生成されるデータテーブルと異なるか否かを結合変換部１１４は判定する。判定結果がYesの場合、処理はステップＳ３１０４に進む。判定結果がNoの場合、処理は終了する。

【0076】

ステップＳ３１０４において、結合変換部１１４は、第３テーブル結合命令を、中間テーブル生成命令と第４テーブル結合命令との間に設定する。第４テーブル結合命令は、最終テーブルを生成する命令でもよい。結合変換部１１４は、第２テーブル結合命令を、第１テーブル結合命令に置き換えてもよい。結合変換部１１４は、第４テーブル結合命令を、第２テーブル結合命令処理に置き換えてもよい。処理はステップＳ３１０５に進む。なお、第３テーブル結合命令は第１の結合処理に対応し、第４テーブル結合命令は第２の結合処理に対応する。

【0077】

ステップＳ３１０５において、結合変換部１１４は、ステップＳ１１０２以降の処理を実行する。その後、処理は終了する。ステップＳ１１０５及びステップＳ１１０６において、第１テーブル結合命令における２つの引数は、いずれもＳＧＡ処理により得られる場合、第１テーブル結合命令で生成されるデータテーブル(つまり、中間テーブル)のサイズは小さくなっている。これにより、中間テーブルの生成を経て、入力データの特徴量を最終テーブルとして取得する際に、中間テーブルのサイズを削減することができるため、処理負荷を抑えることができる。

【0078】

（第４の実施形態）
図１１は、第４の実施形態におけるプログラム変換処理の流れを示すフローチャートである。

【0079】

ステップＳ４１０１において、取得部１１１は、特徴量抽出プログラムを取得する。処理はステップＳ４１０２に進む。

【0080】

ステップＳ４１０２において、集約変換部１１３は、第３中間テーブル生成命令の引数となるデータテーブルが、第５テーブル結合命令で生成されているか否かを判定する。判定結果がYesの場合、処理はステップＳ４１０３に進む。判定結果がNoの場合、処理は終了する。

【0081】

ステップＳ４１０３において、第５テーブル結合命令の引数となる２つのデータテーブルのうち一方が、第４中間テーブル生成命令によって生成されているか否かを、集約変換部１１３は判定する。なお、第５テーブル結合命令の引数となる２つのデータテーブルのうちの他方は、第４中間テーブル生成命令の引数である。判定結果がYesの場合、処理はステップＳ４１０４に進む。判定結果がNoの場合、処理は終了する。

【0082】

ステップＳ４１０４において、第５テーブル結合命令で生成されるデータテーブルの列のうち、第３中間テーブル生成命令で参照される列が、第４中間テーブル生成命令の引数となるデータテーブルの列に含まれるか否かを、集約変換部１１３は判定する。なお、「列」とは、図４に示した「初期入力データ（初期入力テーブル）」における右の列の「price」に相当し、集約処理が行われる対象の列を示す。判定結果がYesの場合、処理はステップＳ４１０５に進む。判定結果がNoの場合、処理は終了する。

【0083】

ステップＳ４１０５において、集約変換部１１３は、第３中間テーブル生成命令の引数を、第４中間テーブル生成命令の引数となるデータテーブルに設定する。第３中間テーブル生成命令は、第２の集約処理（命令）でもよい。処理はステップＳ４１０６に進み、結合変換部１１４はステップＳ１１０２以降の処理を実行する。その後、処理は終了する。なお、第３中間テーブル生成命令は、第２の集約処理に対応し、第４中間テーブル生成命令は、第１の集約処理に対応する。第５テーブル結合命令は、第１の結合処理に対応する。

【0084】

【0085】

また、第２テーブル結合命令によって生成されるデータテーブルは、機械学習において教師データとして用いられる特徴量を含んでもよい。

【0086】

また、引数変更後の第２テーブル結合命令の１つ目の引数となるデータテーブルは、初期入力テーブルでもよいし、第１の複数の値と、第１の複数の値に対応する第２の複数の値を含んでもよい。

【0087】

また、第１中間テーブル生成命令でのデータテーブルの行に対するグループ分けによるグループは、所定の基準に基づいてグループ化され、特徴量を含む。

【0088】

（第５の実施形態）
図１２は、第５の実施形態におけるプログラム変換処理の流れを示すフローチャートである。

【0089】

ステップＳ５１０１において、取得部１１１は、特徴量抽出プログラムを取得する。図６及び７の例と同様、図１２の例において、特徴量抽出プログラムは、一連の処理の実行を命令する命令群である。取得部１１１は、特徴量抽出プログラムを、記憶部１１６から読み出してもよい。特徴量抽出プログラムは、第１の複数の値及び第２の複数の値を含む入力データ（初期入力データ、初期入力テーブル）を取得することを命令する。第１の複数の値は、例えば時刻である。第２の複数の値は、例えば、各時刻（第１の複数の値）に対応する仮想通貨の額である。

【0090】

また、特徴量抽出プログラムは、第１の集約処理（第１集約命令、第１中間テーブル生成命令）、第１の結合処理（第１結合命令、第１テーブル結合命令）、第２の集約処理（第２集約命令、第２中間テーブル生成命令）及び第２の結合処理（第２結合命令、第２テーブル結合命令）を実行することによって入力テーブルに含まれるデータの特徴量（最終テーブル）を生成することを命令する。

【0091】

第１の集約処理において、特徴量抽出プログラムは、第１の複数の値及び第２の複数の値を含む第１の引数（t0）と、第１の基準及び第２の基準とに基づいて、第１の集約値（集約データt1又は集約テーブルt1）を生成する。t0は、図４に記載されたものと同じであるとする。特徴量抽出プログラムは、第１の集約処理を実行するための関数sga1（）を含む。t0は、sga1（）の引数である。t1は、sga1（）の出力である。

【0092】

第１の結合処理において、特徴量抽出プログラムは、第１の複数の値及び第２の複数の値を含む第２の引数（t0）と、第１の集約値を含む第３の引数（t1）と、第３の基準とに基づいて第１の結合データ（中間データt2又は結合テーブルt2）を生成することを命令する。特徴量抽出プログラムは、第１の結合処理を実行するための関数join1（）を含む。t0及びt1は、join1（）の引数である。t2は、join1（）の出力である。

【0093】

第２の集約処理において、特徴量抽出プログラムは、第１の結合データ（t2）を含む第４の引数と、第４の基準とに基づいて、第２の集約値（集約データt3又は集約テーブルt3）を生成することを命令する。特徴量抽出プログラムは、第２の集約処理を実行するための関数sga2（）を含む。第4の引数は、sga2（）の引数である。第２の集約値は、sga2（）の出力である。

【0094】

第２の結合処理において、特徴量抽出プログラムは、第１の結合データ（t2）を含む第５の引数と、第２の集約値（t3）を含む第６の引数と、第３の基準とに基づいて、第２の結合データ（最終データt4又は最終テーブルt4）を生成することによって入力データの特徴量を生成することを命令する。特徴量抽出プログラムは、第２の結合処理を実行するための関数join2（）を含む。第５及び第６の引数は、join2（）の引数である。t4は、join2（）の出力である。

【0095】

なお、第１の集約処理において、特徴量抽出プログラムは、第２の複数の値を第１の基準（例えば、１時間ごとのグループ化）に基づいて複数のグループにグループ化し、複数のグループの各々に含まれる値と、第２の基準（例えば、各グループごとに第２の複数の値の平均値取得）とに基づいて第１の集約値を取得することを命令する。

【0096】

また、第２の集約処理において、特徴量抽出プログラムは、第２の複数の値を、複数のグループの各々に含まれる値と、第４の基準（例えば、各グループごとに第２の複数の値の最大値取得）とに基づいて第２の集約値を取得することを命令する。

【0097】

ステップＳ５１０２において、集約変換部１１３は、特徴量抽出プログラムに基づいて生成されるテーブルを取得する。処理はステップＳ５１０３に進む。

【0098】

ステップＳ５１０３において、集約変換部１１３は、取得したテーブルが集約処理によって得られるテーブルか否かを判定する。判定結果がYesの場合、集約変換部１１３は処理をステップＳ５１０４に進める。判定結果がNoの場合、処理は終了する。

【0099】

ステップＳ５１０４において、集約変換部１１３は、取得したテーブルが、結合処理により得られるテーブルを含むか否かを判定する。具体的には、ステップＳ５１０３に記載の集約処理の引数（第４の引数）が、第７の引数及び第８の引数を入力とする結合処理（第３の基準）によって得られるテーブルかどうかを集約変換部１１３は判定する。判定結果がYesの場合、処理はステップＳ５１０５に進む。判定結果がNoの場合、処理は終了する。このステップの処理は、第４の実施形態におけるステップＳ４１０２の処理に相当する。

【0100】

ステップＳ５１０５において、集約変換部１１３は、ステップＳ５１０４における結合処理時の２番目の引数（第８の引数）が、第９の引数と、集約処理（第２又は第４の基準）とにより得られるものかどうかを判定する。判定結果がYesの場合、処理はステップＳ５１０６に進む。判定結果がNoの場合、処理は終了する。

【0101】

ステップＳ５１０６において、集約変換部１１３は、ステップＳ５１０４に記載の結合処理における1番目の引数（第７の引数）のテーブルと、ステップＳ５１０５に記載の集約処理の対象（第９の引数）のテーブルとが第１の複数の値及び第２の複数の値を含む初期入力データ（t0）か否かを判定する。判定結果がYesの場合、ステップＳ５１０４に記載の結合処理は、初期入力データt0から集約した結果をt0に追加している結合処理（つまり、第１の結合処理）であると集約変換部１１３は判定し、処理をステップＳ５１０７に進める。判定結果がNoの場合、処理は終了する。ステップＳ５１０５及びステップＳ５１０６の処理は、第４の実施形態におけるステップＳ４１０３の処理に相当する。

【0102】

ステップＳ５１０７において、集約変換部１１３は、ステップＳ５１０３に記載の集約処理における引数（第４の引数、又は対象テーブル）が、初期入力データを全て含むか否かを判定する。つまり、ステップＳ５１０３に記載の集約処理における引数（対象テーブル）は、集約処理がなされていないテーブルを含むか、を集約変換部１１３は判定する。ステップＳ５１０７の処理は、第４の実施形態におけるステップＳ４１０４の処理に相当する。

【0103】

判定結果がYesの場合、集約変換部１１３は、ステップＳ５１０２において取得したテーブルは、第２の集約処理によって得られるテーブルと判定する。すなわち、ステップＳ５１０３に記載の集約処理が、第２の集約処理であると集約変換部１１３は判定する。集約変換部１１３は、特徴量抽出プログラムに示されるステップＳ５１０３に記載の集約処理における対象テーブル（第４の引数）を、t0（第１の引数）に置き換える。

【0104】

この結果、ステップＳ５１０３に記載の集約処理により生成される集約値（第３の集約値）は、初期入力データt0に対して第４の基準による集約処理を集約結合部処理部１１２が行った結果に相当することになる。これらの処理は、第４の実施形態におけるステップＳ４１０５の処理に相当する。集約変換部１１３は、特徴量抽出プログラムを更新して記憶部１１６に記憶させてもよい。出力部１１５は、更新された特徴量抽出プログラムを出力ないし表示してもよい。

【0105】

図１３は、第５の実施形態における結合変換処理の流れを示すフローチャートである。結合変換処理は、結合変換部１１４が、処理フロー１における第１及び第２の結合処理の入力を変換する処理である。その結果、処理フロー２において、第１の結合処理の出力つまり中間テーブルＴ１’の内容は、処理フロー１と異なることとなる。

【0106】

ステップＳ６１０１において、結合変換部１１４は、特徴量抽出プログラムによって生成されるテーブルを、記憶部１１６から読み出すことによって取得する。結合変換部１１４は、処理をステップＳ６１０２に進める。

【0107】

ステップＳ６１０２において、結合変換部１１４は、取得したテーブルが結合処理により得られるテーブルか否かを判定する。判定結果がYesの場合、処理はステップＳ６１０３に進む。判定結果がNoの場合、処理は終了する。

【0108】

ステップＳ６１０３において、ステップＳ６１０２の結合処理の１番目の引数（第５の引数）が、第１０の引数及び第１１の引数と、結合処理（第３の基準）によって得られるか否かを結合変換部１１４は判定する。このステップの処理は、第１の実施形態におけるステップＳ１１０２の処理に相当する。判定結果がYesの場合、処理はステップＳ６１０４に進む。判定結果がNoの場合、処理は終了する。

【0109】

ステップＳ６１０４において、ステップＳ６１０２の結合処理の２番目の引数（第６の引数）が、第１２の引数と、第１の基準と、集約処理（第２又は第４の基準）に基づいて生成されるか否かを結合変換部１１４は判定する。このステップは、第１の実施形態におけるステップＳ１１０３の処理に相当する。判定結果がYesの場合、処理はステップＳ６１０５に進む。判定結果がNoの場合、処理は終了する。

【0110】

ステップＳ６１０５において、第１０の引数及び第１２の引数が、同じテーブル（第１の複数の値及び第２の複数の値を含む初期入力データ）か否かを判定する。判定結果がYesの場合、処理はステップＳ６１０６に進む。判定結果がNoの場合、処理は終了する。

【0111】

ステップＳ６１０６において、第１１の引数が、初期入力データ（t0）と、第１の基準と、集約処理（第２又は第４の基準）とに基づいて生成されているか否かを判定する。このステップの処理は、第２の実施形態におけるステップＳ２１０５の処理に対応する。判定結果がYesの場合、処理はステップＳ６１０７に進む。判定結果がNoの場合、処理は終了する。

【0112】

ステップＳ６１０７において、結合変換部１１４は、ステップＳ６１０４の集約処理と、ステップＳ６１０６の集約処理とが、同じルール（第１の基準）によってグループ化されているか判定する。なお、同じルールでなく、一方のグループ化ルールが他方のグループ化ルールによって包含されていてもよい。このステップの処理は、第２の実施形態におけるステップＳ２１０６の処理に相当する。

【0113】

ここで、「包含される」とは、例えば、一方のグループ化ルールが、第１の複数の値を５分おきにグループ化し、各グループに含まれる第２の複数の値に対して第２又は第４の基準により集計処理を行うものでもよい。そして、他方のグループ化ルールは、第１の複数の値を６０分おきにグループ化し、各グループに含まれる第２の複数の値に対して第２又は第４の基準により集計処理を行うものでもよい。判定結果がYesの場合、処理はステップＳ６１０８に進む。判定結果がNoの場合、処理は終了する。

【0114】

ステップＳ６１０８において、結合変換部１１４は、ステップＳ６１０４に記載の結合処理を第１の結合処理と判定し、第１の結合処理を代替する処理として、第３の結合処理を定義し、特徴量抽出プログラムを書き換える。第３の結合処理は、第２の引数と、第３の集約値とを入力として、第３の結合データを生成する処理である。このステップの処理は、第１の実施形態におけるステップＳ１１０５及びステップＳ１１０６の処理に相当する。処理はステップＳ６１０９に進む。

【0115】

ステップＳ６１０９において、ステップＳ６１０２において取得したテーブルは第２の結合処理によって得られると結合変換部１１４は判定する。結合変換部１１４は、第２の結合処理において、第１の引数を第５の引数の代わりに（つまり１番目の引数として）用い、第３の結合データを、第６の引数の代わりに（つまり、２番目の引数として）用いて第２の結合データを生成するように、特徴量抽出プログラムを書き換える。これらの処理は、第１の実施形態におけるステップＳ１１０４及びステップＳ１１０７の処理に相当する。結合変換部１１４は、書き換えた特徴量抽出プログラムを記憶部１１６に記憶させてもよい。出力部１１５は、書き換えられた特徴量抽出プログラムを出力してもよい。ここで、ステップＳ６１０９において生成される第２の結合データは、処理フロー１の場合に最終的に生成される結合データと同じである。

【0116】

以上説明したように、本開示に係る情報処理装置は、第１の複数の値及び第２の複数の値を含む入力テーブルを取得し、第１の複数の値及び第２の複数の値を含む第１の引数と、第１の基準及び第２の基準とに基づく第１の集約処理と、第１の複数の値及び第２の複数の値を含む第２の引数と、第１の集約値を含む第３の引数と、第３の基準とに基づいて第１の結合データを生成する第１の結合処理と、第１の結合データを含む第４の引数と、第４の基準とに基づく第２の集約処理と、第１の結合データを含む第５の引数と、第２の集約値を含む第６の引数と、第３の基準とに基づいて第２の結合データを生成する第２の結合処理と、を実行することによって入力データの特徴量を生成することを命令する特徴量抽出プログラムを取得する取得手段と、第４の引数の生成プロセスに基づいて、第２の集約処理において、第１の引数を第４の引数の代わりに用いることにより第３の集約値として集約する処理に置き換える集約変換手段と、第５の引数及び第６の引数の生成プロセスに基づいて、第１の結合処理において、第３の集約値を第２の引数の代わりに用いることにより第３の結合データを生成する処理に置き換え、第２の結合処理において、第１の引数を第５の引数の代わりに用い、第３の結合データを第６の引数の代わりに用いることにより第２の結合データを生成する処理に置き換える結合変換手段を備える。

【0117】

これにより、中間テーブルの生成を経て、入力データの特徴量を最終テーブルとして取得する際に、中間テーブルのサイズを削減することができるため、処理負荷を抑えることができる。

【0118】

また、第１の集約処理において、第２の複数の値を第１の基準に基づいて複数のグループにグループ化し、複数のグループの各々に含まれる値と、第２の基準とに基づいて第１の集約値として集約することを特徴量抽出プログラムは示し、第２の集約処理において、第２の複数の値を、複数のグループの各々に含まれる値と、第４の基準とに基づいて第２の集約値として集約することを特徴量抽出プログラムは示し、第４の引数が、第７の引数及び第８の引数と、第３の基準とに基づいて生成され、第８の引数が、第９の引数と、第２又は第４の基準とに基づき生成され、第７の引数及び第９の引数が、第１の複数の値及び第２の複数の値を含み、第４の引数が、入力データを含むことを特徴量抽出プログラムが示す場合、集約変換手段は、第２の集約処理において、第１の引数を第４の引数の代わりに用いることにより第３の集約値として集約する処理に置き換え、第５の引数が、第１０の引数、第１１の引数及び第３の基準に基づいて生成され、第６の引数が、第１２の引数と、第１の基準と、第２又は第４の基準とに基づいて生成され、第１０の引数及び第１２の引数が、第１の複数の値及び第２の複数の値を含み、第１１の引数が、第１の引数と、第１の基準と、第２又は第４の基準とに基づいて生成されていることを特徴量抽出プログラムが示す場合、結合変換手段は、第１の結合処理において、第３の集約値を第２の引数の代わりに用いることにより第３の結合データを生成する処理に置き換え、第２の結合処理において、第１の引数を第５の引数の代わりに用い、第３の結合データを第６の引数の代わりに用いることにより第２の結合データを生成する処理に置き換える。

【0119】

【0120】

また、特徴量は、機械学習における教師データとして用いられてもよい。また、第２の複数の値の各々は、第１の複数の値の各々に対応する。

【0121】

また、第１の集約値は、複数のグループの各々に対応する集約値を含む。

【0122】

また、前記複数のグループの各々に対応する集約値は、前記複数のグループの各々に含まれる値の平均値、最小値又は最大値である。

【0123】

【0124】

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

【0125】

上述の実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記憶媒体に記録させ、記憶媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記憶媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記憶媒体だけでなく、そのプログラム自体も各実施形態に含まれる。また、上述の実施形態に含まれる１又は２以上の構成要素は、各構成要素の機能を実現するように構成されたＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）等の回路であってもよい。

【0126】

該記憶媒体としては例えばフロッピー（登録商標）ディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ（ＣｏｍｐａｃｔＤｉｓｋ）－ＲＯＭ、磁気テープ、不揮発性メモリカード、ＲＯＭを用いることができる。また該記憶媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）上で動作して処理を実行するものも各実施形態の範疇に含まれる。

【0127】

上述の各実施形態の機能により実現されるサービスは、ＳａａＳ（ＳｏｆｔｗａｒｅａｓａＳｅｒｖｉｃｅ）の形態でユーザに対して提供することもできる。

【0128】

なお、上述の実施形態は、いずれも本開示を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本開示の技術的範囲が限定的に解釈されてはならないものである。すなわち、本開示はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。

【0129】

図１４は、本開示における情報処理装置１の最小構成を示す図である。
本実施形態による情報処理装置１は、少なくとも結合変換部１１４を備えればよい。結合変換部１１４による処理の流れは、図８に記載したフローチャートにおけるステップＳ１１０２からステップＳ１１０７の処理の通りである。

【符号の説明】

【0130】

１情報処理装置
１０１ＣＰＵ
１０２ＲＡＭ
１０３ＲＯＭ
１０４ＨＤＤ
１０５通信ＩＦ
１０６入力装置
１０７出力装置
１１１取得部
１１２集約結合処理部
１１３集約変換部
１１４結合変換部
１１５出力部
１１６記憶部

【図1】