IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ブリヂストンの特許一覧

特許7532698データ処理装置、データ処理方法及びデータ処理プログラム
<>
  • 特許-データ処理装置、データ処理方法及びデータ処理プログラム 図1
  • 特許-データ処理装置、データ処理方法及びデータ処理プログラム 図2
  • 特許-データ処理装置、データ処理方法及びデータ処理プログラム 図3
  • 特許-データ処理装置、データ処理方法及びデータ処理プログラム 図4
  • 特許-データ処理装置、データ処理方法及びデータ処理プログラム 図5
  • 特許-データ処理装置、データ処理方法及びデータ処理プログラム 図6
  • 特許-データ処理装置、データ処理方法及びデータ処理プログラム 図7
  • 特許-データ処理装置、データ処理方法及びデータ処理プログラム 図8
  • 特許-データ処理装置、データ処理方法及びデータ処理プログラム 図9
  • 特許-データ処理装置、データ処理方法及びデータ処理プログラム 図10
  • 特許-データ処理装置、データ処理方法及びデータ処理プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-08-02
(45)【発行日】2024-08-13
(54)【発明の名称】データ処理装置、データ処理方法及びデータ処理プログラム
(51)【国際特許分類】
   G06Q 10/04 20230101AFI20240805BHJP
【FI】
G06Q10/04
【請求項の数】 7
(21)【出願番号】P 2024072837
(22)【出願日】2024-04-26
【審査請求日】2024-04-26
【早期審査対象出願】
(73)【特許権者】
【識別番号】000005278
【氏名又は名称】株式会社ブリヂストン
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】山本 拓
【審査官】阿部 圭子
(56)【参考文献】
【文献】特開2024-030856(JP,A)
【文献】特許第7419520(JP,B2)
【文献】特開2020-149230(JP,A)
【文献】国際公開第2021/235111(WO,A1)
【文献】特開2019-144022(JP,A)
【文献】米国特許出願公開第2018/0203918(US,A1)
【文献】米国特許出願公開第2020/0394542(US,A1)
【文献】米国特許出願公開第2024/0078224(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
解析対象のデータが格納された第1テーブルを複製して第2テーブルを生成する複製部と、
前記第1テーブルと前記第2テーブルとを、前記データの識別のための識別列に基づいて交差結合して新たな第3テーブルを生成する結合部と、
前記結合部が生成した前記第3テーブルにおける、前記第1テーブルの説明変数の列と前記第2テーブルの説明変数の列との差分を演算し、前記第3テーブルに新たに生成した列に格納する演算部と、
前記演算部が生成した列に対して特徴量を抽出する抽出部と、
を備える、データ処理装置。
【請求項2】
前記抽出部は、前記結合部が交差結合に用いた前記識別列に関連する情報を特徴量として抽出する、請求項1に記載のデータ処理装置。
【請求項3】
前記抽出部は、次元圧縮処理により特徴量を抽出する、請求項1に記載のデータ処理装置。
【請求項4】
前記抽出部は、潜在変数を生成する教師なし学習の結果を用いて特徴量を抽出する、請求項1に記載のデータ処理装置。
【請求項5】
前記抽出部は、教師あり学習の結果を用いて特徴量を抽出する、請求項1に記載のデータ処理装置。
【請求項6】
プロセッサが、
解析対象のデータが格納された第1テーブルを複製して第2テーブルを生成し、
前記第1テーブルと前記第2テーブルとを、前記データの識別のための識別列に基づいて交差結合して新たな第3テーブルを生成し、
生成した前記第3テーブルにおける、前記第1テーブルの説明変数の列と前記第2テーブルの説明変数の列との差分を演算し、前記第3テーブルに新たに生成した列に格納し、
生成した列に対して特徴量を抽出する
処理を実行する、データ処理装置。
【請求項7】
コンピュータに、
解析対象のデータが格納された第1テーブルを複製して第2テーブルを生成し、
前記第1テーブルと前記第2テーブルとを、前記データの識別のための識別列に基づいて交差結合して新たな第3テーブルを生成し、
生成した前記第3テーブルにおける、前記第1テーブルの説明変数の列と前記第2テーブルの説明変数の列との差分を演算し、前記第3テーブルに新たに生成した列に格納し、
生成した列に対して特徴量を抽出する
処理を実行させる、データ処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、データ処理装置、データ処理方法及びデータ処理プログラムに関する。
【背景技術】
【0002】
材料の設計は、材料開発者の経験に基づいて組成を調整しながら試作を繰り返すことによって行われる。例えば特許文献1には、所望の複数の材料物性を同時に満たすポリマー材料の材料設計装置、材料設計方法、及び材料設計プログラムが開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】国際公開第2021/045058号
【発明の概要】
【発明が解決しようとする課題】
【0004】
過去の材料の試作の際の実験データは、材料開発者の思考が込められたものである。材料を試作する際に、過去の実験データが材料開発者のどのような思考に基づいて作られたものであるか、言い換えれば、実験データのような処理対象データに、どのような特徴があるかを解析によって把握するための技術は存在しなかった。
【0005】
本開示は、上記の点に鑑みてなされたものであり、処理対象データにおけるデータの特徴を抽出できるデータ処理装置、データ処理方法及びデータ処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示の第1態様に係るデータ処理装置は、解析対象のデータが格納された第1テーブルを複製して第2テーブルを生成する複製部と、前記第1テーブルと前記第2テーブルとを、前記データの識別のための識別列に基づいて交差結合して新たな第3テーブルを生成する結合部と、前記結合部が生成した前記第3テーブルにおける、前記第1テーブルの説明変数の列と前記第2テーブルの説明変数の列との差分を演算し、前記第3テーブルに新たに生成した列に格納する演算部と、前記演算部が生成した列に対して特徴量を抽出する抽出部と、を備える。
【0007】
本開示の第2態様に係るデータ処理装置は、第1態様に係るデータ処理装置であって、前記抽出部は、前記結合部が交差結合に用いた前記識別列に関連する情報を特徴量として抽出する。
【0008】
本開示の第3態様に係るデータ処理装置は、第1態様に係るデータ処理装置であって、前記抽出部は、次元圧縮処理により特徴量を抽出する。
【0009】
本開示の第4態様に係るデータ処理装置は、第1態様に係るデータ処理装置であって、前記抽出部は、潜在変数を生成する教師なし学習の結果を用いて特徴量を抽出する。
【0010】
本開示の第5態様に係るデータ処理装置は、第1態様に係るデータ処理装置であって、前記抽出部は、教師あり学習の結果を用いて特徴量を抽出する。
【0011】
本開示の第6態様に係るデータ処理方法は、プロセッサが、解析対象のデータが格納された第1テーブルを複製して第2テーブルを生成し、前記第1テーブルと前記第2テーブルとを、前記データの識別のための識別列に基づいて交差結合して新たな第3テーブルを生成し、生成した前記第3テーブルにおける、前記第1テーブルの説明変数の列と前記第2テーブルの説明変数の列との差分を演算し、前記第3テーブルに新たに生成した列に格納し、生成した列に対して特徴量を抽出する処理を実行する。
【0012】
本開示の第7態様に係るデータ処理プログラムは、コンピュータに、解析対象のデータが格納された第1テーブルを複製して第2テーブルを生成し、前記第1テーブルと前記第2テーブルとを、前記データの識別のための識別列に基づいて交差結合して新たな第3テーブルを生成し、生成した前記第3テーブルにおける、前記第1テーブルの説明変数の列と前記第2テーブルの説明変数の列との差分を演算し、前記第3テーブルに新たに生成した列に格納し、生成した列に対して特徴量を抽出する処理を実行させる。
【発明の効果】
【0013】
本開示によれば、処理対象データにおけるデータの特徴を抽出できるデータ処理装置、データ処理方法及びデータ処理プログラムを提供することができる。
【図面の簡単な説明】
【0014】
図1】開示の技術の実施形態に係るデータ処理装置の概要を示す図である。
図2】データ処理装置のハードウェア構成を示すブロック図である。
図3】データ処理装置の機能構成の例を示すブロック図である。
図4】複製処理の例を示す図である。
図5】結合処理の例を示す図である。
図6】演算処理の例を示す図である。
図7】抽出処理の例を示す図である。
図8】データ処理装置によるデータ処理の効果を説明する図である。
図9】処理対象データに対して結合処理及び演算処理を行わず、いきなり抽出処理を行った場合の特徴量がテーブルに格納された状態を示す図である。
図10図9に示した特徴量の関係を示すグラフである。
図11】データ処理装置によるデータ処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0015】
以下、本開示の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一または等価な構成要素および部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。
【0016】
図1は、本実施形態に係るデータ処理装置の概要を示す図である。データ処理装置10は、処理対象データに対するデータ処理を実行して、処理結果を出力する装置である。データ処理装置10は、例えばデータ処理を実行するコンピュータプログラムが格納されたパーソナルコンピュータである。
【0017】
本実施形態では、データ処理装置10は、テーブル形式のデータを処理対象データとして受け付ける。テーブル形式のデータはどのようなものであってもよく、例えば、データベースに格納されたものであってもよく、スプレッドシートに記入されたものであってもよい。処理対象データとしては、例えば製品の試作のための過去のテストデータであり、ある製品を製造するための材料の配合量、分析等の実験結果又はシミュレーション結果から得られた材料の特徴量(分子量、軟化点、粒形など)、材料の加工時間、試作製品の試験結果等の情報が含まれうる。
【0018】
そしてデータ処理装置10は、処理対象データに対するデータ処理として、処理対象データの特徴量を抽出する処理を実行し、抽出した特徴量を処理済みデータとして出力する。
【0019】
データ処理装置10は、処理対象データに対するデータ処理として、処理対象データの特徴量を抽出する処理を実行し、抽出した特徴量を出力することで、処理対象データがどのような特徴量を有しているのかを提示できる。処理対象データが過去のテストデータであれば、その過去のテストデータがどのような特徴量を有しているのかを提示できる。なお、データ処理装置10は、後述するように、単に処理対象データに対して特徴量を抽出する処理を実行するのではなく、処理対象データに対する前処理を実行してから、特徴量を抽出する処理を実行する。
【0020】
次に、データ処理装置10のハードウェア構成を説明する。図2は、データ処理装置10のハードウェア構成を示すブロック図である。
【0021】
図2に示すように、データ処理装置10は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、ストレージ14、入力部15、表示部16及び通信インタフェース(I/F)17を有する。各構成は、バス19を介して相互に通信可能に接続されている。
【0022】
CPU11は、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、CPU11は、ROM12またはストレージ14からプログラムを読み出し、RAM13を作業領域としてプログラムを実行する。CPU11は、ROM12またはストレージ14に記録されているプログラムにしたがって、上記各構成の制御および各種の演算処理を行う。本実施形態では、ROM12またはストレージ14には、処理対象データに対するデータ処理を実行するデータ処理プログラムが格納されている。
【0023】
ROM12は、各種プログラムおよび各種データを格納する。RAM13は、作業領域として一時的にプログラムまたはデータを記憶する。ストレージ14は、HDD(Hard Disk Drive)、SSD(Solid State Drive)またはフラッシュメモリ等の記憶装置により構成され、オペレーティングシステムを含む各種プログラム、および各種データを格納する。
【0024】
入力部15は、マウス等のポインティングデバイス、およびキーボードを含み、各種の入力を行うために使用される。
【0025】
表示部16は、たとえば、液晶ディスプレイであり、各種の情報を表示する。表示部16は、タッチパネル方式を採用して、入力部15として機能しても良い。
【0026】
通信インタフェース17は、他の機器と通信するためのインタフェースであり、たとえば、イーサネット(登録商標)、FDDI、Wi-Fi(登録商標)等の規格が用いられる。
【0027】
上記のデータ処理プログラムを実行する際に、データ処理装置10は、上記のハードウェア資源を用いて、各種の機能を実現する。データ処理装置10が実現する機能構成について説明する。
【0028】
図3は、データ処理装置10の機能構成の例を示すブロック図である。
【0029】
図3に示すように、データ処理装置10は、機能構成として、複製部101、結合部102、演算部103及び抽出部104を有する。各機能構成は、CPU11がROM12またはストレージ14に記憶されたデータ処理プログラムを読み出し、実行することにより実現される。
【0030】
複製部101は、処理対象データを複製する複製処理を実行する。すなわち、複製部101は、テーブル形式の処理対象データを複製する。テーブル形式の処理対象データは、本開示の第1テーブルの一例であり、複製処理により生成されたテーブルは本開示の第2テーブルの一例である。複製部101は、複製処理により生成したテーブルを、RAM13又はストレージ14に格納してもよい。
【0031】
図4は、複製部101による複製処理の例を示す図である。複製部101は、テーブル200Aを複製して、全く同じデータを有するテーブル200Bを生成する。列「Test Set」及び列「#」は実験データを識別する情報が格納される列であり、そのうち、列「Test Set」は、後述の結合処理及び演算処理の際に用いられる識別情報が格納される識別列であり、列「NR」、列「BR」、列「BR分子量」は、それぞれ実験データの値が格納される列である。実験データの値は、本開示の説明変数の一例である。以下の説明では、テーブル200Aを「テーブルA」、テーブル200Bを「テーブルB」とも称する。また以下の説明では、列「Test Set」を列(a)、列「NR」を列(b1)、列「BR」を列(b2)、列「BR分子量」を列(b3)と称する。
【0032】
なお、処理対象データであるテーブル形式のデータの構造は、かかる例に限定されるものではない。図4には、テーブル200Aには「Test Set」という識別列が1つだけ存在しているが、例えば、処理対象データには識別列が複数存在してもよい。
【0033】
また、複製部101は、複製処理の前に、比率計算などの特徴量設計、正規化、非線形変換等の任意の前処理を行ってもよい。
【0034】
また、複製部101は、複製処理に先立って、複製処理の対象となる処理対象データをユーザに選択させるためのユーザインタフェースを表示部16に表示してもよい。
【0035】
結合部102は、処理対象データと、処理対象データを複製したデータとを、識別列を基準として交差結合する結合処理を実行する。具体的には、結合部102は、処理対象データにおける識別情報をキーとして、処理対象データと、処理対象データを複製したデータとを、識別列を基準として交差結合して新たなデータを生成する結合処理を実行する。結合処理によって生成されたテーブルは、本開示の第3テーブルの一例である。結合部102は、結合処理により生成したテーブルを、RAM13又はストレージ14に格納してもよい。
【0036】
図5は、結合部102による結合処理の例を示す図である。結合部102は、テーブル200A、200Bの、同一の列(a)を持つ行の全ての組み合わせにおいて、テーブル200A、200Bを交差結合して、新たなテーブル200Cを生成する。図示している例では、結合部102は、テーブル200Aの1行目のデータについて、テーブル200Bの列(a)が「A0001」の4行分のデータを結合する。同様に、テーブル200Aの2~4行目のデータについて、テーブル200Bの列(a)が「A0001」の4行分のデータを結合する。すなわち、図示している例では、結合部102は、列(a)が「A0001」のデータを、結合処理により16行分生成する。
【0037】
結合部102は、結合処理の際に、処理対象データの全てのデータに対して結合処理を実行してもよく、処理対象データの全てのデータに対して結合処理を実行しなくてもよい。
【0038】
また、結合部102は、結合処理の際に、キーとなる識別情報をユーザに選択させるためのユーザインタフェースを表示部16に表示してもよい。
【0039】
演算部103は、結合部102が結合処理で生成したデータに対し、任意の列に対して演算する演算処理を実行する。具体的には、演算部103は、演算処理として、結合処理で生成したデータに対し、元の2つのテーブルにおける同じ列に対する減算を行い、減算の結果を新たな列に格納する。減算の結果が格納される列を差分列とも称する。
【0040】
図6は、演算部103による演算処理の例を示す図である。「ΔNR」列は、テーブルA由来の「NR」列の値からテーブルB由来の「NR」列の値を減算した値が格納される差分列である。「ΔBR」列は、テーブルA由来の「BR」列の値からテーブルB由来の「BR」列の値を減算した値が格納される差分列である。「Δ分子量」列は、テーブルA由来の「BR分子量」列の値からテーブルB由来の「BR分子量」列の値を減算した値が格納される差分列である。
【0041】
演算部103は、テーブル200Cの同一の列に対して、テーブルA由来の値からテーブルB由来の値を減算し、新たな列に格納する演算処理を実行する。図6の例では、1行目は、テーブルA由来の値とテーブルB由来の値とは同一であるため、演算部103は、「ΔNR」列、「ΔBR」列、「Δ分子量」列にいずれも0を格納する。2行目以降は、テーブルA由来の値とテーブルB由来の値とに違いがあるため、演算部103は、「ΔNR」列、「ΔBR」列、「Δ分子量」列に、それぞれテーブルA由来の値からテーブルB由来の値を減算した値を格納する。
【0042】
なお、演算部103は、減算の前に比率計算などの特徴量設計、正規化、非線形変換等の任意の前処理を行ってもよい。
【0043】
抽出部104は、演算部103による演算処理の結果が格納される各差分列に対して、特徴量を抽出する抽出処理を実行する。具体的に、抽出部104は、各差分列に対して、結合部102が2つのテーブルの交差結合に用いた識別列に関連する情報を特徴量として抽出する。言い換えれば、抽出部104は、各差分列に対して、結合部102が2つのテーブルの交差結合に用いた識別列の違いを表現する情報を特徴量として抽出する。また言い換えれば、抽出部104は、各差分列に対して、結合部102が2つのテーブルの交差結合に用いた識別列の要素ごとに共通する情報を特徴量として抽出する。抽出部104は、任意の手法により特徴量を抽出することができるが、一例を挙げれば、次元圧縮処理(ICA(独立成分分析),PCA(主成分分析),LSI(潜在的意味インデキシング),LDA(線形判別分析),IA,MDS,NMFなど)、潜在変数を生成する教師なし学習(t-SNE)、教師あり学習(NN)などにより特徴量の抽出を行う。抽出された特徴量は、処理対象データに対するデータ解析に用いられうる。
【0044】
ここで、処理対象データに対して結合処理及び演算処理を行ってから抽出処理を行った例を示す。
【0045】
図7は、抽出部104による抽出処理の例を示す図である。図7のテーブル200Cにおける「IC成分1」列、「IC成分2」列、「IC成分3」列は、「ΔNR」列、「ΔBR」列及び「Δ分子量」列に格納された値に対する特徴量が格納される列である。本実施形態では、抽出部104は、ICAにより、「ΔNR」列、「ΔBR」列、「Δ分子量」列に格納された値から、上述したように任意の手法により特徴量を抽出し、抽出した特徴量を「IC成分1」列、「IC成分2」列、「IC成分3」列にそれぞれ格納している。
【0046】
なお、抽出部104は、抽出処理の前に、各差分列に対して正規化、非線形変換等の任意の前処理を行なって良い。
【0047】
図8は、データ処理装置10によるデータ処理の効果を説明する図である。図8は、図7に示したIC成分1列とIC成分3列との関係のグラフ、IC成分2列とIC成分3列との関係のグラフ、及びIC成分1列とIC成分2列との関係のグラフを示している。
【0048】
図8のグラフで示したように、データ処理装置10によるデータ処理の結果として抽出される特徴量には、所定の関係性があることが見て取れる。すなわち、処理対象データに対して結合処理及び演算処理を行って抽出処理を行った場合は、処理対象データから抽出された特徴量がどのような特徴を有するものであるかを把握することが容易となる。
【0049】
一方、処理対象データに対して結合処理及び演算処理を行わず、いきなり抽出処理を行った例を示す。
【0050】
図9は、処理対象データに対して結合処理及び演算処理を行わず、いきなり抽出処理を行った場合の特徴量がテーブル200Aに格納された状態を示す図である。この場合においても、ICAにより、「ΔNR」列、「ΔBR」列、「Δ分子量」列に格納された値に対する特徴量を抽出している。そして図10は、図9に示したIC成分1列とIC成分3列との関係のグラフ、IC成分2列とIC成分3列との関係のグラフ、及びIC成分1列とIC成分2列との関係のグラフを示している。
【0051】
図10のグラフで示したように、処理対象データに対して結合処理及び演算処理を行わず、いきなり抽出処理を行った場合は、抽出される特徴量に関係性が見出せないことがわかる。すなわち、処理対象データに対して結合処理及び演算処理を行わず、いきなり抽出処理を行った場合は、処理対象データから抽出された特徴量がどのような特徴を有するものであるかを把握することが困難である。
【0052】
本実施形態に係るデータ処理装置10は、処理対象データに対して結合処理及び演算処理を行った上で、抽出処理を実行して、特徴量を抽出することで、処理対象データにどのような技術的思考又は仮説がパラメータとして表現されているのかが把握可能となる。
【0053】
次に、データ処理装置10の作用について説明する。
【0054】
図11は、データ処理装置10によるデータ処理の流れを示すフローチャートである。CPU11がROM12又はストレージ14からデータ処理プログラムを読み出して、RAM13に展開して実行することにより、データ処理が行われる。
【0055】
CPU11は、ステップS101において、処理対象データを取得する。処理対象データとしては、テーブル形式のデータが用いられる。処理対象データは、例えば過去のテストデータであり、ある製品を製造するための材料の配合量、材料の加工時間等の情報が含まれうる。
【0056】
ステップS101に続いて、CPU11は、ステップS102において、処理対象データのテーブルを複製する複製処理を実行する。複製処理の詳細は、上述の複製部101の処理として説明した通りである。
【0057】
ステップS102に続いて、CPU11は、ステップS103において、処理対象データと、処理対象データを複製したデータとを交差結合する結合処理を実行する。結合処理の詳細は、上述の結合部102の処理として説明した通りである。
【0058】
ステップS103に続いて、CPU11は、ステップS104において、結合処理で生成したデータに対し、任意の列に対して演算する演算処理を実行する。演算処理の詳細は、上述の演算部103の処理として説明した通りである。
【0059】
ステップS104に続いて、CPU11は、ステップS105において、演算処理の結果が格納される各差分列に対して、特徴量を抽出する抽出処理を実行する。抽出処理の詳細は、上述の抽出部104の処理として説明した通りである。
【0060】
本実施形態に係るデータ処理装置10は、一連の処理を実行して、処理対象データにおける特徴量を抽出することで、処理対象データにどのような技術的思考又は仮説がパラメータとして表現されているのかが把握可能となる。
【0061】
以上、添付図面を参照しながら本開示の実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらの変更例または修正例についても、当然に本開示の技術的範囲に属するものと了解される。
【0062】
また、上記実施形態において記載された効果は、説明的又は例示的なものであり、上記実施形態において記載されたものに限定されない。つまり、本開示に係る技術は、上記実施形態において記載された効果とともに、又は上記実施形態において記載された効果に代えて、上記実施形態における記載から、本開示の技術分野における通常の知識を有する者には明らかな他の効果を奏しうる。
【0063】
なお、上記各実施形態でCPUがソフトウェア(プログラム)を読み込んで実行したデータ処理を、CPU以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、FPGA(Field-Programmable Gate Array)等の製造後に回路構成を変更可能なPLD(Programmable Logic Device)、及びASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、データ処理を、これらの各種のプロセッサのうちの1つで実行してもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGA、及びCPUとFPGAとの組み合わせ等)で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。
【0064】
また、上記各実施形態では、データ処理のプログラムがROMまたはストレージに予め記憶(インストール)されている態様を説明したが、これに限定されない。プログラムは、CD-ROM(Compact Disk Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の非一時的(non-transitory)記録媒体に記録された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
【符号の説明】
【0065】
10 データ処理装置
101 複製部
102 結合部
103 演算部
104 抽出部
【要約】
【課題】処理対象データにおけるデータの特徴を抽出できるデータ処理装置を提供する。
【解決手段】解析対象のデータが格納された第1テーブルを複製して第2テーブルを生成する複製部と、前記第1テーブルと前記第2テーブルとを、前記データの識別のための識別列に基づいて交差結合して新たな第3テーブルを生成する結合部と、前記結合部が生成した前記第3テーブルにおける、前記第1テーブルの説明変数の列と前記第2テーブルの説明変数の列との差分を演算し、前記第3テーブルに新たに生成した列に格納する演算部と、前記演算部が生成した列に対して特徴量を抽出する抽出部と、を備える、データ処理装置が提供される。
【選択図】図1
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11