IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機株式会社の特許一覧

特許7657382データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム
<>
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図1
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図2
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図3
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図4
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図5
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図6
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図7
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図8
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図9
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図10
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図11
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図12
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図13
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図14
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図15
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図16
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図17
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図18
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図19
  • 特許-データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム 図20
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2025-03-27
(45)【発行日】2025-04-04
(54)【発明の名称】データ加工方式流通装置、データ加工方式流通方法およびデータ加工方式流通プログラム
(51)【国際特許分類】
   G06F 18/22 20230101AFI20250328BHJP
【FI】
G06F18/22
【請求項の数】 10
(21)【出願番号】P 2024555971
(86)(22)【出願日】2023-07-28
(86)【国際出願番号】 JP2023027849
【審査請求日】2024-09-19
【早期審査対象出願】
(73)【特許権者】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】110002491
【氏名又は名称】弁理士法人クロスボーダー特許事務所
(72)【発明者】
【氏名】古跡 進
(72)【発明者】
【氏名】田中 覚
(72)【発明者】
【氏名】楓 仁志
【審査官】福西 章人
(56)【参考文献】
【文献】特開2019-133610(JP,A)
【文献】国際公開第2018/011895(WO,A1)
【文献】国際公開第2017/168967(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 18/00-18/40
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
データ加工の対象となる対象データの属性情報を取得する属性情報取得部と、
複数の加工方式のそれぞれの属性情報を含む加工方式情報を参照し、加工方式ごとに前記加工方式の前記属性情報と前記対象データの前記属性情報に基づいて前記対象データに対する前記加工方式の親和性スコアを算出する親和性スコア算出部と、
前記複数の加工方式のそれぞれの前記親和性スコアに基づいて前記複数の加工方式から前記対象データの前記データ加工のための推薦方式とする加工方式を選択し、前記推薦方式を示す推薦情報を出力する推薦情報出力部と、
を備えるデータ加工方式流通装置であり、
前記対象データの前記属性情報は、前記対象データのデータ形式として、前記対象データの大分類と前記対象データの小分類を示し、
加工方式ごとの前記属性情報は、前記加工方式の入力データのデータ形式として、前記入力データの大分類と前記入力データの小分類を示し、
前記親和性スコア算出部は、加工方式ごとに、前記入力データと前記対象データの大分類どうしの比較結果と、前記入力データと前記対象データの小分類どうしの比較結果と、に基づいて前記親和性スコアを算出する
データ加工方式流通装置。
【請求項2】
データ加工の対象となる対象データの属性情報を取得する属性情報取得部と、
複数の加工方式のそれぞれの属性情報を含む加工方式情報を参照し、加工方式ごとに前記加工方式の前記属性情報と前記対象データの前記属性情報に基づいて前記対象データに対する前記加工方式の親和性スコアを算出する親和性スコア算出部と、
前記複数の加工方式のそれぞれの前記親和性スコアに基づいて前記複数の加工方式から前記対象データの前記データ加工のための推薦方式とする加工方式を選択し、前記推薦方式を示す推薦情報を出力する推薦情報出力部と、
を備えるデータ加工方式流通装置であり、
前記対象データの前記属性情報は、前記対象データのデータ構造を示し、
加工方式ごとの前記属性情報は、前記加工方式の入力データのデータ構造を示し、
前記親和性スコア算出部は、加工方式ごとに、前記入力データの前記データ構造と前記対象データの前記データ構造に基づいて前記親和性スコアを算出する
データ加工方式流通装置。
【請求項3】
前記対象データの前記属性情報は、前記対象データの前記データ構造として、前記対象データを構成する複数のデータ要素を示し、
加工方式ごとの前記属性情報は、前記加工方式の前記入力データの前記データ構造として、前記入力データを構成する複数のデータ要素を示し、
前記親和性スコア算出部は、加工方式ごとに、前記入力データの前記複数のデータ要素と前記対象データの前記複数のデータ要素に基づいて前記親和性スコアを算出する
請求項2に記載のデータ加工方式流通装置。
【請求項4】
データ加工の対象となる対象データの属性情報を取得する属性情報取得部と、
複数の加工方式のそれぞれの属性情報を含む加工方式情報を参照し、加工方式ごとに前記加工方式の前記属性情報と前記対象データの前記属性情報に基づいて前記対象データに対する前記加工方式の親和性スコアを算出する親和性スコア算出部と、
前記複数の加工方式のそれぞれの前記親和性スコアに基づいて前記複数の加工方式から前記対象データの前記データ加工のための推薦方式とする加工方式を選択し、前記推薦方式を示す推薦情報を出力する推薦情報出力部と、
を備えるデータ加工方式流通装置であり、
加工方式ごとの前記属性情報は、前記加工方式の出力データの属性情報を含み、
前記属性情報取得部は、前記加工方式情報から、前記推薦方式の前記出力データの前記属性情報を、次の対象データの属性情報として取得し、
前記親和性スコア算出部は、加工方式ごとに、前記加工方式の前記属性情報と前記次の対象データの前記属性情報に基づいて、前記次の対象データに対する前記加工方式の親和性スコアを新たな親和性スコアとして算出し、
前記推薦情報出力部は、前記複数の加工方式のそれぞれの前記新たな親和性スコアに基づいて前記複数の加工方式から次の推薦方式とする加工方式を選択し、前記次の推薦方式を示す推薦情報を出力する
データ加工方式流通装置。
【請求項5】
データ加工方式流通装置が、
データ加工の対象となる対象データの属性情報を取得し、
複数の加工方式のそれぞれの属性情報を含む加工方式情報を参照し、加工方式ごとに前記加工方式の前記属性情報と前記対象データの前記属性情報に基づいて前記対象データに対する前記加工方式の親和性スコアを算出し、
前記複数の加工方式のそれぞれの前記親和性スコアに基づいて前記複数の加工方式から前記対象データの前記データ加工のための推薦方式とする加工方式を選択し、前記推薦方式を示す推薦情報を出力する
データ加工方式流通方法であり、
前記対象データの前記属性情報は、前記対象データのデータ形式として、前記対象データの大分類と前記対象データの小分類を示し、
加工方式ごとの前記属性情報は、前記加工方式の入力データのデータ形式として、前記入力データの大分類と前記入力データの小分類を示し、
前記データ加工方式流通装置は、加工方式ごとに、前記入力データと前記対象データの大分類どうしの比較結果と、前記入力データと前記対象データの小分類どうしの比較結果と、に基づいて前記親和性スコアを算出する
データ加工方式流通方法。
【請求項6】
データ加工方式流通装置が、
データ加工の対象となる対象データの属性情報を取得し、
複数の加工方式のそれぞれの属性情報を含む加工方式情報を参照し、加工方式ごとに前記加工方式の前記属性情報と前記対象データの前記属性情報に基づいて前記対象データに対する前記加工方式の親和性スコアを算出し、
前記複数の加工方式のそれぞれの前記親和性スコアに基づいて前記複数の加工方式から前記対象データの前記データ加工のための推薦方式とする加工方式を選択し、前記推薦方式を示す推薦情報を出力する
データ加工方式流通方法であり、
前記対象データの前記属性情報は、前記対象データのデータ構造を示し、
加工方式ごとの前記属性情報は、前記加工方式の入力データのデータ構造を示し、
前記データ加工方式流通装置は、加工方式ごとに、前記入力データの前記データ構造と前記対象データの前記データ構造に基づいて前記親和性スコアを算出する
データ加工方式流通方法。
【請求項7】
データ加工方式流通装置が、
データ加工の対象となる対象データの属性情報を取得し、
複数の加工方式のそれぞれの属性情報を含む加工方式情報を参照し、加工方式ごとに前記加工方式の前記属性情報と前記対象データの前記属性情報に基づいて前記対象データに対する前記加工方式の親和性スコアを算出し、
前記複数の加工方式のそれぞれの前記親和性スコアに基づいて前記複数の加工方式から前記対象データの前記データ加工のための推薦方式とする加工方式を選択し、前記推薦方式を示す推薦情報を出力する
データ加工方式流通方法であり、
加工方式ごとの前記属性情報は、前記加工方式の出力データの属性情報を含み、
前記データ加工方式流通装置は、
前記加工方式情報から、前記推薦方式の前記出力データの前記属性情報を、次の対象データの属性情報として取得し、
加工方式ごとに、前記加工方式の前記属性情報と前記次の対象データの前記属性情報に基づいて、前記次の対象データに対する前記加工方式の親和性スコアを新たな親和性スコアとして算出し、
前記複数の加工方式のそれぞれの前記新たな親和性スコアに基づいて前記複数の加工方式から次の推薦方式とする加工方式を選択し、前記次の推薦方式を示す推薦情報を出力する
データ加工方式流通方法。
【請求項8】
データ加工の対象となる対象データの属性情報を取得する属性情報取得処理と、
複数の加工方式のそれぞれの属性情報を含む加工方式情報を参照し、加工方式ごとに前記加工方式の前記属性情報と前記対象データの前記属性情報に基づいて前記対象データに対する前記加工方式の親和性スコアを算出する親和性スコア算出処理と、
前記複数の加工方式のそれぞれの前記親和性スコアに基づいて前記複数の加工方式から前記対象データの前記データ加工のための推薦方式とする加工方式を選択し、前記推薦方式を示す推薦情報を出力する推薦情報出力処理と、
をコンピュータに実行させるためのデータ加工方式流通プログラムであり、
前記対象データの前記属性情報は、前記対象データのデータ形式として、前記対象データの大分類と前記対象データの小分類を示し、
加工方式ごとの前記属性情報は、前記加工方式の入力データのデータ形式として、前記入力データの大分類と前記入力データの小分類を示し、
前記親和性スコア算出処理は、加工方式ごとに、前記入力データと前記対象データの大分類どうしの比較結果と、前記入力データと前記対象データの小分類どうしの比較結果と、に基づいて前記親和性スコアを算出する
データ加工方式流通プログラム。
【請求項9】
データ加工の対象となる対象データの属性情報を取得する属性情報取得処理と、
複数の加工方式のそれぞれの属性情報を含む加工方式情報を参照し、加工方式ごとに前記加工方式の前記属性情報と前記対象データの前記属性情報に基づいて前記対象データに対する前記加工方式の親和性スコアを算出する親和性スコア算出処理と、
前記複数の加工方式のそれぞれの前記親和性スコアに基づいて前記複数の加工方式から前記対象データの前記データ加工のための推薦方式とする加工方式を選択し、前記推薦方式を示す推薦情報を出力する推薦情報出力処理と、
をコンピュータに実行させるためのデータ加工方式流通プログラムであり、
前記対象データの前記属性情報は、前記対象データのデータ構造を示し、
加工方式ごとの前記属性情報は、前記加工方式の入力データのデータ構造を示し、
前記親和性スコア算出処理は、加工方式ごとに、前記入力データの前記データ構造と前記対象データの前記データ構造に基づいて前記親和性スコアを算出する
データ加工方式流通プログラム。
【請求項10】
データ加工の対象となる対象データの属性情報を取得する属性情報取得処理と、
複数の加工方式のそれぞれの属性情報を含む加工方式情報を参照し、加工方式ごとに前記加工方式の前記属性情報と前記対象データの前記属性情報に基づいて前記対象データに対する前記加工方式の親和性スコアを算出する親和性スコア算出処理と、
前記複数の加工方式のそれぞれの前記親和性スコアに基づいて前記複数の加工方式から前記対象データの前記データ加工のための推薦方式とする加工方式を選択し、前記推薦方式を示す推薦情報を出力する推薦情報出力処理と、
をコンピュータに実行させるためのデータ加工方式流通プログラムであり、
加工方式ごとの前記属性情報は、前記加工方式の出力データの属性情報を含み、
前記属性情報取得処理は、前記加工方式情報から、前記推薦方式の前記出力データの前記属性情報を、次の対象データの属性情報として取得し、
前記親和性スコア算出処理は、加工方式ごとに、前記加工方式の前記属性情報と前記次の対象データの前記属性情報に基づいて、前記次の対象データに対する前記加工方式の親和性スコアを新たな親和性スコアとして算出し、
前記推薦情報出力処理は、前記複数の加工方式のそれぞれの前記新たな親和性スコアに基づいて前記複数の加工方式から次の推薦方式とする加工方式を選択し、前記次の推薦方式を示す推薦情報を出力する
データ加工方式流通プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、データ加工方式を推薦するための技術に関するものである。
【背景技術】
【0002】
特許文献1は、加工データを流通するシステムを開示している。
このシステムは、加工元データ及び加工元データを加工するための加工方式を独立して管理し、データ加工の要求に対して加工データと加工方式の組み合わせを送信するものである。特許文献1には、加工データのサンプル等を広告することによって加工方式の推薦を行うことが記載されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2010-193506号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1のシステムは、特定のデータに対して専用の加工方式を流通させることを目的としている。
そのため、特許文献1のシステムでは、不特定のデータを加工する加工方式を推薦することはできない。
【0005】
本開示は、不特定のデータを加工する加工方式を推薦できるようにすることを目的とする。
【課題を解決するための手段】
【0006】
本開示のデータ加工方式流通装置は、
データ加工の対象となる対象データの属性情報を取得する属性情報取得部と、
複数の加工方式のそれぞれの属性情報を含む加工方式情報を参照し、加工方式ごとに前記加工方式の前記属性情報と前記対象データの前記属性情報に基づいて前記対象データに対する前記加工方式の親和性スコアを算出する親和性スコア算出部と、
前記複数の加工方式のそれぞれの前記親和性スコアに基づいて前記複数の加工方式から前記対象データの前記データ加工のための推薦方式とする加工方式を選択し、前記推薦方式を示す推薦情報を出力する推薦情報出力部と、
を備える。
【発明の効果】
【0007】
本開示によれば、不特定のデータを加工する加工方式を推薦することが可能となる。
【図面の簡単な説明】
【0008】
図1】実施の形態1におけるデータ加工方式流通装置100の構成図。
図2】実施の形態1におけるデータ加工方式流通装置100の機能構成図。
図3】実施の形態1におけるデータ加工方式流通方法のフローチャート。
図4】実施の形態1における対象データの属性情報199の例を示す図。
図5】実施の形態1における加工方式の属性情報192の例を示す図。
図6】実施の形態1におけるステップS120のフローチャートの例を示す図。
図7】実施の形態1におけるデータ形式分類表193の例を示す図。
図8】実施の形態1におけるステップS121のフローチャートの例を示す図。
図9】実施の形態1における親和性スコアの例を示す図。
図10】実施の形態1におけるステップS123のフローチャートの例を示す図。
図11】実施の形態1における表データの列の組み合わせの例を示す図。
図12】実施の形態2におけるデータ加工方式流通装置100の構成図。
図13】実施の形態2におけるデータ加工方式流通装置100の機能構成図。
図14】実施の形態2におけるデータ加工方式流通方法のフローチャート。
図15】実施の形態3におけるデータ加工方式流通装置100の構成図。
図16】実施の形態3におけるデータ加工方式流通装置100の機能構成図。
図17】実施の形態3におけるデータ加工方式流通方法のフローチャート。
図18】実施の形態3におけるステップS310のフローチャートの例を示す図。
図19】実施の形態3におけるデータ本体の解析の例を示す図。
図20】実施の形態におけるデータ加工方式流通装置100のハードウェア構成図。
【発明を実施するための形態】
【0009】
実施の形態および図面において、同じ要素または対応する要素には同じ符号を付している。説明した要素と同じ符号が付された要素の説明は適宜に省略または簡略化する。図中の矢印はデータの流れ又は処理の流れを主に示している。
【0010】
実施の形態1.
データ加工方式流通装置100について、図1から図11に基づいて説明する。
【0011】
***構成の説明***
図1に基づいて、データ加工方式流通装置100の構成を説明する。
データ加工方式流通装置100は、プロセッサ101とメモリ102と補助記憶装置103と入出力インタフェース104といったハードウェアを備えるコンピュータである。これらのハードウェアは、信号線を介して互いに接続されている。
【0012】
プロセッサ101は、演算処理を行うICであり、他のハードウェアを制御する。例えば、プロセッサ101はCPUである。
ICは、Integrated Circuitの略称である。
CPUは、Central Processing Unitの略称である。
【0013】
メモリ102は揮発性または不揮発性の記憶装置である。メモリ102は、主記憶装置またはメインメモリとも呼ばれる。例えば、メモリ102はRAMである。メモリ102に記憶されたデータは必要に応じて補助記憶装置103に保存される。
RAMは、Random Access Memoryの略称である。
【0014】
補助記憶装置103は不揮発性の記憶装置である。例えば、補助記憶装置103は、ROM、HDD、フラッシュメモリまたはこれらの組み合わせである。補助記憶装置103に記憶されたデータは必要に応じてメモリ102にロードされる。
ROMは、Read Only Memoryの略称である。
HDDは、Hard Disk Driveの略称である。
【0015】
入出力インタフェース104は、入力装置および出力装置が接続されるポートである。例えば、入出力インタフェース104はUSB端子であり、入力装置はキーボード、マウスおよび通信装置であり、出力装置はディスプレイおよび通信装置である。データ加工方式流通装置100の入出力は入出力インタフェース104を用いて行われる。
USBは、Universal Serial Busの略称である。
【0016】
データ加工方式流通装置100は、属性情報取得部110と親和性スコア算出部120と推薦情報出力部130といった要素を備える。これらの要素はソフトウェアで実現される。
属性情報取得部110は、データ情報受付部111という要素を備える。
推薦情報出力部130は、推薦方式出力部131という要素を備える。
【0017】
補助記憶装置103には、属性情報取得部110と親和性スコア算出部120と推薦情報出力部130としてコンピュータを機能させるためのデータ加工方式流通プログラムが記憶されている。データ加工方式流通プログラムは、メモリ102にロードされて、プロセッサ101によって実行される。
補助記憶装置103には、さらに、OSが記憶されている。OSの少なくとも一部は、メモリ102にロードされて、プロセッサ101によって実行される。
プロセッサ101は、OSを実行しながら、データ加工方式流通プログラムを実行する。
OSは、Operating Systemの略称である。
【0018】
データ加工方式流通プログラムの入出力データは記憶部190に記憶される。
補助記憶装置103は記憶部190として機能する。但し、メモリ102、プロセッサ101内のレジスタおよびプロセッサ101内のキャッシュメモリなどの記憶装置が、補助記憶装置103の代わりに、又は、補助記憶装置103と共に、記憶部190として機能してもよい。
【0019】
データ加工方式流通プログラムは、光ディスクまたはフラッシュメモリ等の不揮発性の記録媒体にコンピュータ読み取り可能に記録(格納)することができる。
【0020】
図2に、データ加工方式流通装置100の機能構成を示す。
加工方式情報191は、記憶部190に予め記憶される。加工方式情報191の内容について後述する。
【0021】
***動作の説明***
データ加工方式流通装置100の動作の手順はデータ加工方式流通方法に相当する。また、データ加工方式流通装置100の動作の手順はデータ加工方式流通プログラムによる処理の手順に相当する。
【0022】
図3に基づいて、データ加工方式流通方法を説明する。
データ加工方式流通方法は、対象データのデータ加工に適した加工方式を利用者に対して推薦するための方法である。
【0023】
ステップS110において、属性情報取得部110は、対象データの属性情報199を取得する。
【0024】
具体的には、利用者が対象データの属性情報199をデータ加工方式流通装置100に入力する。そして、データ情報受付部111が、入力された属性情報199を受け付ける。
【0025】
データ情報受付部111は、対象データの属性情報199の入力のための補助を行ってもよい。
例えば、属性情報一覧が記憶部190に予め記憶される。属性情報一覧は1つ以上のデータのそれぞれの属性情報を示す。各データの属性情報は事前に別の方法で収集される。データ情報受付部111は属性情報一覧をディスプレイに表示する。利用者は、表示された属性情報一覧の中のいずれかの属性情報を、対象データの属性情報199として指定する。データ情報受付部111は、属性情報一覧から、指定された属性情報を抽出する。
【0026】
対象データは、データ加工の対象となるデータである。
つまり、対象データは、利用者がデータ加工したいデータである。
【0027】
対象データの属性情報199は、対象データの各種属性を示す。
【0028】
図4に、対象データの属性情報199の例を示す。
対象データの例は、端末装置で計測された電力の時系列データである。
属性情報199は、対象データについてデータ名称、データ内容、データ形式およびデータ構造を示している。
データ名称の欄は、対象データの名称を示す。
データ内容の欄は、対象データの内容を示す。
データ形式の欄は、対象データのデータ形式を示す。例えば、対象データのデータ形式として対象データの大分類と対象データの小分類が示される。大分類および小分類について後述する。
データ構造の欄は、対象データのデータ構造を示す。具体的には、対象データを構成する複数のデータ要素が示される。対象データのデータ形式が表である場合、表の中の列ごとに番号と列名とデータ型が示される。
【0029】
図3に戻り、ステップS120から説明を続ける。
ステップS120において、親和性スコア算出部120は、加工方式情報191を参照する。
加工方式情報191は、複数の加工方式のそれぞれの属性情報192を含む。
【0030】
具体的には、親和性スコア算出部120は、加工方式情報191から各加工方式の属性情報192を読み込む。
一度に全件の属性情報192が読み込まれてもよいし、加工方式の件数が多い場合に小数の件数ずつ属性情報192が読み込まれてもよい。
【0031】
加工方式は、データ加工の方式である。
具体的には、加工方式は、データ加工を目的とするプログラムまたはアルゴリズムである。プログラムおよびアルゴリズムは、特定のデータに限らずに汎用的に利用できる。
データ加工の例は、データ分析およびデータ整形である。
【0032】
加工方式の属性情報192は、加工方式の各種属性を示す。
属性情報192は、利用者によって入力され加工方式情報191に登録されてもよいし、プログラム(加工方式)の中のアノテーションおよびプログラムの設定ファイルなどを解析して生成され加工方式情報191に登録されてもよい。
【0033】
図5に、加工方式の属性情報192の例を示す。
加工方式の例は、時系列データに対して状態遷移の検出を行うプログラムである。
属性情報192は、加工方式について加工名称、加工内容、入力データ形式、入力データ構造、出力データ形式、出力データ構造および提供形態を示している。
加工名称の欄は、加工方式の名称を示す。
加工内容の欄は、加工方式によるデータ加工の内容を示す。
入力データ形式の欄は、加工方式の入力データのデータ形式を示す。加工方式の入力データは、加工方式によるデータ加工が施される。
入力データ構造の欄は、加工方式の入力データのデータ構造を示す。
出力データ形式の欄は、加工方式の出力データのデータ形式を示す。加工方式の出力データは、加工方式によるデータ加工を入力データに施して得られる。
出力データ構造の欄は、加工方式の出力データのデータ構造を示す。
提供形態の欄は、加工方式によるデータ加工を提供する形態を示す。具体的には、提供形態はプログラムまたはアルゴリズムである。
【0034】
入力データと出力データのそれぞれのデータ形式は、例えば、大分類と小分類で表される。
大分類の例は、表、半構造化、画像、音声、動画およびテキストである。
小分類は、大分類より細かい粒度で表される。例えば、小分類は、ファイルの拡張子に相当する分類である。
大分類が表である場合、小分類を表す拡張子の例はCSVおよびTSVである。
CSVは、comma-separated valuesの略称である。
TSVは、tab-separated valuesの略称である。
【0035】
入力データと出力データのそれぞれのデータ構造は、データ形式に基づいて説明される。データ構造は、データを構成する複数のデータ要素で表される。データ形式が表である場合、データ構造は、表の列ごとに番号、列名およびデータ形式で表される。
【0036】
加工方式が複数パターンの入力データを加工できる場合、入力データ形式の欄は複数のデータ形式を示すことができ、入力データ構造の欄は複数のデータ構造を示すことができる。
【0037】
対象データの属性情報199の中のデータ形式の欄は、加工方式の属性情報192の中の入力データ形式の欄の情報と同様の情報を示す。
対象データの属性情報199の中のデータ構造の欄は、加工方式の属性情報192の中の入力データ構造の欄の情報と同様の情報を示す。
【0038】
図3に戻り、ステップS120の説明を続ける。
親和性スコア算出部120は、加工方式ごとに、加工方式の属性情報192と対象データの属性情報199に基づいて、対象データに対する加工方式の親和性スコアを算出する。
【0039】
親和性スコアは、加工方式が対象データに対して効果的に適用できる確率を数値化したものである。親和性スコアは、その確率に類する指標または度合いを数値化したものであってもよい。
【0040】
親和性スコアは、加工方式の属性情報192と対象データの属性情報199に基づいて以下のように算出される。
親和性スコア算出部120は、加工方式ごとに、加工方式の入力データのデータ形式と対象データのデータ形式に基づいて親和性スコアを算出する。特に、親和性スコア算出部120は、加工方式ごとに、加工方式の入力データと対象データの大分類どうしの比較結果と、加工方式の入力データと対象データの小分類どうしの比較結果と、に基づいて親和性スコアを算出する。
親和性スコア算出部120は、加工方式ごとに、加工方式の入力データのデータ構造と対象データのデータ構造に基づいて親和性スコアを算出する。特に、親和性スコア算出部120は、加工方式ごとに、加工方式の入力データの複数のデータ要素と対象データの複数のデータ要素に基づいて前記親和性スコアを算出する。
【0041】
親和性スコア算出部120は、データ形式とデータ構造の両方に基づいて親和性スコアを算出してもよいし、データ形式またはデータ構造に基づいて親和性スコアを算出してもよい。
親和性スコア算出部120は、属性情報のその他の属性要素を考慮して親和性スコアを算出してもよい。
【0042】
算出された親和性スコアが履歴データとして保存されてもよい。履歴データにおいて、親和性スコアは対象データと加工方式に対応付けられる。同じ対象データに対する同じ加工方式の親和性スコア(当該親和性スコア)の算出が行われる際に、親和性スコア算出部120は、当該親和性スコアを算出する代わりに、履歴データから当該親和性スコアを取得してもよい。
【0043】
図6に基づいて、ステップS120の詳細を説明する。
ステップS121からステップS125は、加工方式ごとに実行される。
【0044】
ステップS121において、親和性スコア算出部120は、加工方式の入力データのデータ形式と対象データのデータ形式に基づいて、データ形式に関する親和性スコアを算出する。
【0045】
データ形式に関する親和性スコアは以下のように算出される。
親和性スコア算出部120は、加工方式の入力データのデータ形式を対象データのデータ形式と比較し、加工方式の入力データのデータ形式と対象データのデータ形式の一致度に基づいてデータ形式に関する親和性スコアを算出する。
【0046】
データ形式に関する親和性スコアの算出には、例えば、データ形式分類表193が使用される。
データ形式分類表193は、大分類と小分類の関係を示す表であり、記憶部190に予め記憶される。
【0047】
図7に、データ形式分類表193の例を示す。
データ形式は、大分類と小分類により分類される。
大分類は、データの性質に基づいて分類される。大分類の「表データ」は「構造化データ」と読み替えてもよい。
小分類は、ファイルの拡張子に基づいて分類される。小分類の欄に示されている拡張子は一例である。ここに示されていない拡張子が小分類に追加されてもよい。また、拡張子以外にデータ形式を指定できる情報があれば、その情報が拡張子の代わりに又は拡張子と共に用いられてもよい。
【0048】
図8に基づいて、ステップS121の詳細を説明する。
ステップS1211において、親和性スコア算出部120は、加工方式の入力データの大分類を対象データの大分類と比較する。
【0049】
ステップS1212において、親和性スコア算出部120は、ステップS1211の比較結果に基づいて、加工方式の入力データの大分類が対象データの大分類と一致するか判定する。
加工方式の入力データの大分類が対象データの大分類と一致する場合、処理はステップS1213へ進む。
加工方式の入力データの大分類が対象データの大分類と一致しない場合、処理はステップS1217へ進む。
【0050】
ステップS1213において、親和性スコア算出部120は、加工方式の入力データの小分類を対象データの小分類と比較する。
【0051】
ステップS1214において、親和性スコア算出部120は、ステップS1213の比較結果に基づいて、加工方式の入力データの小分類が対象データの小分類を包含するか判定する。
【0052】
加工方式が複数のデータ形式に対応する場合、加工方式の入力データのデータ形式は複数の小分類を含むことがある。
そのため、小分類の一致ではなく小分類の包含が判定される。
【0053】
加工方式の入力データの小分類が対象データの小分類を包含する場合、処理はステップS1215へ進む。
加工方式の入力データの小分類が対象データの小分類を包含しない場合、処理はステップS1216へ進む。
【0054】
ステップS1215において、親和性スコア算出部120は、データ形式に関する親和性スコアを高得点とする。高得点は、予め決められた得点であり、低得点より高い。例えば、高得点は10点である。高得点は、三段階の得点のうちの最高の得点に相当する。
【0055】
ステップS1216において、親和性スコア算出部120は、データ形式に関する親和性スコアを低得点とする。低得点は、予め決められた得点であり、無得点より高く高得点より低い。例えば、低得点は5点である。高得点は、三段階の得点のうちの中間の得点に相当する。
この場合、対象データに対してデータ形式変換を行うことで加工方式を適用できる可能性がある。そのため、データ形式に関する親和性スコアを無得点ではなく低得点とする。
【0056】
ステップS1217において、親和性スコア算出部120は、データ形式に関する親和性スコアを無得点とする。無得点は0点である。無得点は、三段階の得点のうちの最低の得点に相当する。
ただし、加工方式の入力データの大分類が対象データの大分類と似た分類である場合、親和性スコア算出部120は、データ形式に関する親和性スコアを無得点ではなく大分類の類似度に応じた得点にしてもよい。大分類の類似関係は、予め決められ例えば表形式で管理される。例えば、大分類が表であるデータ形式は大分類が半構造化であるデータ形式と部分的に似ている。
【0057】
図9に、データ形式に関する親和性スコアの例を示す。
組み合わせAでは、加工方式の入力データの大分類が対象データの大分類と一致し、加工方式の入力データの小分類が対象データの小分類を包含する。そのため、データ形式に関する親和性スコアは高得点である。
組み合わせBでは、加工方式の入力データの大分類が対象データの大分類と一致し、加工方式の入力データの小分類が対象データの小分類を包含しない。そのため、データ形式に関する親和性スコアは低得点である。
組み合わせCでは、加工方式の入力データの大分類が対象データの大分類と一致しない。そのため、データ形式に関する親和性スコアは無得点である。
【0058】
図6に戻り、ステップS122から説明を続ける。
ステップS122において、親和性スコア算出部120は、データ形式に関する親和性スコアが閾値以上であるか判定する。
【0059】
この判定は、加工方式の入力データのデータ構造を対象データのデータ構造と比較することが可能かどうかを判断するために行われる。
【0060】
例えば、閾値は低得点である。この場合、データ形式に関する親和性スコアが高得点または低得点であれば、データ形式に関する親和性スコアは閾値以上である。
【0061】
データ形式に関する親和性スコアが閾値以上である場合、処理はステップS123へ進む。
データ形式に関する親和性スコアが閾値未満である場合、処理はステップS124へ進む。
【0062】
ステップS123において、親和性スコア算出部120は、加工方式の入力データのデータ構造と対象データのデータ構造に基づいて、データ構造に関する親和性スコアを算出する。
【0063】
データ構造に関する親和性スコアは以下のように算出される。
親和性スコア算出部120は、加工方式の入力データのデータ構造を対象データのデータ構造と比較し、加工方式の入力データのデータ構造と対象データのデータ構造の一致度に基づいてデータ構造に関する親和性スコアを算出する。
【0064】
データ構造はデータ形式ごとに異なる。そのため、データ構造に関する親和性スコアは、データ形式ごとに定められた手順にしたがって算出される。
データ構造に関する親和性スコアを算出するための手順は、例えば、データ形式の大分類ごとに用意される。
データ形式が表データである場合、各列の列名およびデータ型がデータ構造に関する親和性スコアに寄与する。その他の列がある場合、その他の列の情報もデータ構造に関する親和性スコアに寄与する。
データ形式が半構造化データである場合、タグまたは記号などによって区切られた各要素について要素の名称(キー名)および値(バリュー)のデータ型がデータ構造に関する親和性スコアに寄与する。これらの関係性を利用すれば、半構造化データを表データのように扱うことができる。
データ形式が非構造化データである場合、データ構造に関する親和性スコアに寄与する要素はない。そのため、ステップS123をスキップしてもよい。非構造化データの例はテキストデータ、画像データ、音声データおよび動画データである。
【0065】
図10に基づいて、加工方式の入力データのデータ形式と対象データのデータ形式が表データである場合のステップS123の詳細を説明する。
【0066】
ステップS1231からステップS1233は、加工方式の入力データの列ごとに実行される。
【0067】
ステップS1231において、親和性スコア算出部120は、加工方式の入力データの列を対象データの各列と比較する。
【0068】
具体的には、親和性スコア算出部120は、列名とデータ型のそれぞれについて、加工方式の入力データの列を対象データの各列と比較する。
【0069】
列名の比較について説明する。
列名の比較には、類語辞典による仕組みを利用することができる。
列名類語辞典は、列名に使われる単語ごとに、類似した単語と、包含関係にある単語と、を示す。列名類語辞典は、記憶部190に予め記憶される。
親和性スコア算出部120は、加工方式の入力データの列と対象データの列のそれぞれの列名群を列名類語辞典から抽出する。列名群は、対象の列名と、対象の列名に類似する列名(類似の列名)と、対象の列名と包含関係にある列名(包含関係の列名)と、から成る。
そして、親和性スコア算出部120は、加工方式の入力データの列名群を対象データの列名群と比較する。
【0070】
データ型の比較について説明する。
データ型の比較には、データ型関係表を利用することができる。
データ型関係表は、データ型ごとに包含関係にあるデータ型を示す。例えば、データ型の「数値」は「整数」と「実数」といったデータ型を含む。しかし、データ型の「整数」とデータ型の「実数」のそれぞれは、「数値」というデータ型を含まない。データ型関係表は、記憶部190に予め記憶される。
【0071】
ステップS1232において、親和性スコア算出部120は、ステップS1231の比較結果に基づいて、対象データの列ごとに対象データの列に対する加工方式の入力データの列の親和性スコアを算出する。
【0072】
具体的には、親和性スコア算出部120は、列名の比較結果とデータ型の比較結果に基づいて、対象データの各列に対する加工方式の入力データの列の親和性スコアを算出する。
例えば、親和性スコア算出部120は、列名の比較結果に基づく親和性スコアと、データ型の比較結果に基づく親和性スコアと、を算出する。そして、親和性スコア算出部120は、列名の比較結果に基づく親和性スコアとデータ型の比較結果に基づく親和性スコアに対して和または積などの演算を行って、対象データの列に対する加工方式の入力データの列の親和性スコアを算出する。
【0073】
列名の比較結果に基づく親和性スコアについて説明する。
親和性スコア算出部120は、対象データの列ごとに、対象データの列名に対する加工方式の列名の類似度および包含度を算出し、類似度および包含度に基づいて親和性スコアを算出する。親和性スコアは、類似度が高いほど高い。また、親和性スコアは、包含度が高いほど高い。
類似度の例を説明する。加工方式の入力データの列名が「電力値」であると仮定する。この場合、対象データの列名が「電流値」ならば類似度は高い。また、対象データの列名が「年齢」ならば類似度は低い。
包含度の例を説明する。加工方式の入力データの列名が「測定値」であると仮定する。「測定値」は意味の観点で「電流値」を包含する。この場合、対象データの列名が「電流値」ならば包含度は高い。
【0074】
データ型の比較結果に基づく親和性スコアについて説明する。
加工方式の入力データのデータ型が対象データのデータ型を包含する場合、親和性スコアは高い。
【0075】
ステップS1233において、親和性スコア算出部120は、対象データの各列に対する加工方式の入力データの列の親和性スコアから最大の親和性スコアを選択する。
これにより、対象データの列のうち最大の親和性スコアに対応する列が加工方式の入力データの列と組み合わされる。
【0076】
加工方式の入力データの列は、対象データの列のうち最大の親和性スコアに対応する列と最もマッチする。
つまり、対象データの列のうち加工方式の入力データの列と最もマッチする列が決定される。
【0077】
なお、親和性スコア算出部120は、対象データの1つの列に対して加工方式の入力データの2つ以上の列が組み合わされることを防ぐようにしてもよい。
つまり、親和性スコア算出部120は、対象データの1つの列に対して加工方式の入力データの1つの列が組み合わされるように工夫してもよい。
例えば、親和性スコア算出部120は、対象データの列から加工方式の入力データのいずれかの列と組み合わされた列を除いて、対象データの各列に対する加工方式の入力データの列の親和性スコアから最大の親和性スコアを選択する。
【0078】
ステップS1231からステップS1233により、加工方式の入力データの列と対象データの列の組ごとに親和性スコアが算出される。
【0079】
図11に、加工方式の入力データの列と対象データの列の組み合わせの例を示す。
図11の場合、加工方式の入力データの列1は対象データの列2と最もマッチし、加工方式の入力データの列1と対象データの列2の組の親和性スコアが算出される。
また、加工方式の入力データの列2は対象データの列1と最もマッチし、加工方式の入力データの列2と対象データの列1の組の親和性スコアが算出される。
また、加工方式の入力データの列3は対象データの列3と最もマッチし、加工方式の入力データの列3と対象データの列3の組の親和性スコアが算出される。
【0080】
図10に戻り、ステップS1234を説明する。
ステップS1234において、親和性スコア算出部120は、加工方式の入力データの列と対象データの列の各組の親和性スコアを用いて、データ構造に関する親和性スコアを算出する。
【0081】
例えば、親和性スコアは、加工方式の入力データの列と対象データの列の各組の親和性スコアに対して和または積などの演算を行うことで算出される。
【0082】
これにより、加工方式の入力データと対象データとの全列の比較結果に基づく親和性スコアをデータ構造に関する親和性スコアとして算出することができる。
【0083】
図6に戻り、ステップS124から説明を続ける。
ステップS124において、親和性スコア算出部120は、加工方式の入力データについての属性情報192と対象データの属性情報199に基づいて、その他の属性要素に関する親和性スコアを算出する。
その他の属性要素は、データ形式とデータ構造とを除いた残りの属性要素である。例えば、その他の属性要素は、データの取得状況、データの取得目的およびデータの品質などである。
【0084】
具体的には、親和性スコア算出部120は、加工方式の入力データのその他の属性要素を対象データのその他の属性要素を比較し、比較結果に基づいてその他の属性要素に関する親和性スコアを算出する。
【0085】
親和性スコア算出部120は、その他の属性要素のうちデータ形式に基づく特徴的な属性要素を利用して、その他の属性要素に関する親和性スコアを算出してもよい。
例えば、その他の属性要素に関する親和性スコアは以下のように算出される。
加工方式の入力データと対象データがテキストデータである場合、親和性スコア算出部120は、言語の種類と文字コードといった属性要素に基づいて、その他の属性要素に関する親和性スコアを算出する。
加工方式の入力データと対象データが画像データである場合、親和性スコア算出部120は、画素数とデータ形態の種類と被写体の種類といった属性要素に基づいて、その他の属性要素に関する親和性スコアを算出する。データ形態の種類の例はイラストおよび写真などである。被写体の種類の例は人間および物などである。
加工方式の入力データと対象データが音声データである場合、親和性スコア算出部120は、サンプリングレートと音声の種類といった属性要素に基づいて、その他の属性要素に関する親和性スコアを算出する。音声の種類の例は人の声および音楽などである。
【0086】
ステップS125において、親和性スコア算出部120は、データ形式に関する親和性スコアとデータ構造に関する親和性スコアとその他の属性要素に関する親和性スコアを用いて、最終的な親和性スコアを算出する。
【0087】
具体的には、親和性スコア算出部120は、データ形式に関する親和性スコアとデータ構造に関する親和性スコアとその他の属性要素に関する親和性スコアに対して特定の演算を行って、一つの親和性スコアを算出する。算出される一つの親和性スコアが最終的な親和性スコアである。
特定の演算の例は、和、積、平均、加重平均またはこれらの組み合わせである。
【0088】
図3に戻り、説明を続ける。
ステップS120により、加工方式ごとに対象データに対する親和性スコアが算出される。
【0089】
ステップS130において、推薦情報出力部130は、複数の加工方式のそれぞれの親和性スコアに基づいて、複数の加工方式から推薦方式とする加工方式を選択する。
推薦方式は、対象データのデータ加工のために推薦される加工方式である。
【0090】
例えば、推薦方式出力部131は、対象データに対する親和性スコアが最も高い加工方式を推薦方式として選択する。
【0091】
ステップS130の説明を続ける。
推薦情報出力部130は、推薦方式を示す推薦情報を出力する。
例えば、推薦方式出力部131は、推薦情報をディスプレイに表示する。
【0092】
推薦情報出力部130は、推薦方式によるデータ加工のためのプログラム等を推薦情報として出力してもよい。
例えば、推薦方式出力部131は、推薦情報を記憶媒体に記憶する。
ステップS130の後、処理は終了する。
【0093】
***実施の形態1の特徴***
データ加工方式流通装置100は、利用者が加工を希望する対象データと、本装置により流通される各加工方式と、についてそれぞれの属性情報を比較して親和性スコアを算出する。親和性スコアは、対象データに対して加工方式が効果的に適用できる確率または度合いを表す。
データ加工方式流通装置100は、対象データに対する利用の実績が無い加工方式であっても、対象データに対する親和性スコアが高ければ、その加工方式を推薦する。
【0094】
***実施の形態1の効果***
実施の形態1は、加工対象データに対して過去に利用された実績はないが加工対象データに対して効果的に適用できる可能性が高い加工方式を推薦することができる、という従来技術にはない効果を奏する。
これにより、利用者は、データ加工方式流通装置100を介して多くのデータ加工方式を利用できるようになる。その結果、利用者は、データを効果的に利活用できるようになる。
【0095】
実施の形態1では、加工対象データに対して各加工方式の属性が比較される。これにより、過去の利用実績が無いような加工方式であっても推薦することができる。
【0096】
実施の形態1では、加工対象データと加工方式の組み合わせについてデータ形式とデータ構造のそれぞれが比較される。これにより、推薦の精度が高まる。
【0097】
実施の形態2.
連鎖的に適用することが可能な2つ以上の加工方式を推薦する形態について、主に実施の形態1と異なる点を図12から図14に基づいて説明する。
【0098】
***構成の説明***
図12に基づいて、データ加工方式流通装置100の構成を説明する。
推薦情報出力部130は、さらに、連鎖方式出力部132という要素を備える。
【0099】
図13に、データ加工方式流通装置100の機能構成を示す。
【0100】
***動作の説明***
図14に基づいて、データ加工方式流通方法を説明する。
ステップS210において、属性情報取得部110は、対象データの属性情報199を取得する。
ステップS210は、実施の形態1のステップS110と同じである。
【0101】
ステップS220において、親和性スコア算出部120は、加工方式ごとに、対象データに対する親和性スコアを算出する。
ステップS220は、実施の形態1のステップS120と同じである。
【0102】
ステップS230において、推薦情報出力部130は、各加工方式の親和性スコアに基づいて、対象データに対する加工方式の推薦情報を出力する。
ステップS230は、実施の形態1のステップS130と同じである。
【0103】
ステップS240において、親和性スコア算出部120は、加工方式を連鎖的に推薦するか判定する。
【0104】
加工方式の連鎖的な推薦は、推薦方式の出力データ(次の対象データ)のデータ加工に適した加工方式(次の推薦方式)を推薦することを意味する。
【0105】
つまり、親和性スコア算出部120は、直前のステップS230での推薦方式について推薦方式よって生成される加工データ(出力データ)をさらに二次加工するための二次加工方式(次の推薦方式)を推薦するかどうかを判定する。
二次加工方式、三次加工方式、・・・と繰り返し加工方式が推薦される場合、ステップS210からステップS240が繰り返し実行されることとなる。
【0106】
例えば、親和性スコア算出部120は以下のように判定を行う。
親和性スコア算出部120は、利用者からの入力にしたがって判定を行う。
親和性スコア算出部120は、ステップS210からステップS240の繰り返し回数が上限回数に達していなければ、加工方式を連鎖的に推薦すると判定する。
親和性スコア算出部120は、直前のステップS230での推薦方式の親和性スコアに基づいて判定を行う。
【0107】
加工方式を連鎖的に推薦すると判定された場合、直前のステップS230での推薦方式の出力データを次の対象データにして、処理はステップS210に進む。
ステップS210では、属性情報取得部110が、加工方式情報191から推薦方式の出力データについての属性情報192を、次の対象データの属性情報199として取得する。
ステップS220では、親和性スコア算出部120が、加工方式ごとに、加工方式の属性情報192と次の対象データの属性情報199に基づいて、次の対象データに対する加工方式の親和性スコアを新たな親和性スコアとして算出する。
ステップS230では、推薦情報出力部130が、複数の加工方式のそれぞれの新たな親和性スコアに基づいて、複数の加工方式から次の推薦方式とする加工方式を選択する。そして、推薦情報出力部130が、次の推薦方式を示す推薦情報を出力する。
【0108】
加工方式を連鎖的に推薦しないと判定された場合、処理は終了する。
【0109】
***実施の形態2の効果***
実施の形態2により、加工対象データに対して、単一の加工方式ではなく、連鎖的に適用できる複数の加工方式を推薦することができる。
例えば、データ加工方式流通装置100は、ある加工対象データに対して、データ整形を行う一次加工方式を適用した後にデータ分析を行う二次加工方式を適用するような組み合わせで複数の加工方式を推薦できる。
そのため、利用者が利用できる加工方式の種類が増し、利用者は高度なデータ加工を行うことができる。
【0110】
実施の形態3.
対象データのデータ本体を解析して得られる属性情報199を利用するする形態について、主に実施の形態1と異なる点を図15から図19に基づいて説明する。
【0111】
***構成の説明***
図15に基づいて、データ加工方式流通装置100の構成を説明する。
属性情報取得部110は、さらに、データ情報解析部112という要素を備える。
【0112】
図16に、データ加工方式流通装置100の機能構成を示す。
【0113】
***動作の説明***
図17に基づいて、データ加工方式流通方法を説明する。
ステップS310において、属性情報取得部110は、対象データの属性情報199を取得する。
【0114】
対象データの属性情報199は以下のように取得される。
属性情報取得部110は、対象データの少なくとも一部をデータ本体として受け付け、データ本体を解析して対象データの属性情報199を生成する。
【0115】
図18に基づいて、ステップS310の詳細を説明する。
ステップS311において、利用者は、対象データのデータ本体と対象データの属性情報の少なくとも一方をデータ加工方式流通装置100に入力する。
対象データのデータ本体が入力された場合、データ情報受付部111は、入力されたデータ本体を受け付ける。
対象データの属性情報が入力された場合、データ情報受付部111は、入力された属性情報を受け付ける。
【0116】
対象データのデータ本体は、対象データとして管理されるコンテンツである。
対象データのデータ本体は、対象データの全体でもよいし、対象データから抽出された一部のデータ(サンプルデータ)でもよい。
【0117】
ステップS312において、データ情報受付部111は、データ本体が受け付けられたか判定する。
データ本体が受け付けられた場合、処理はステップS313に進む。
データ本体が受け付けられなかった場合、処理は終了する。
【0118】
ステップS313において、データ情報解析部112は、データ本体を解析して属性情報を生成する。
【0119】
データ本体は以下のように解析される。
データ情報解析部112は、データ本体のデータ形式を判定する。
例えば、データ本体として電子ファイルが受け付けられた場合、データ情報解析部112は、電子ファイルの拡張子を参照してデータ形式を特定する。
データ情報解析部112は、データ本体のデータ構造を以下のように判定する。
データ本体のデータ形式が構造化データ(または半構造化データ)である場合、データ情報解析部112は、データ本体のデータ構造を特定する。構造化データの例は表データである。
具体的には、データ情報解析部112は、データ本体のデータ形式のフォーマットにしたがってデータ本体をパースする。これにより、データ本体のデータ構造が特定される。
【0120】
図19に基づいて、データ本体の解析の例を説明する。
データ本体のファイル名は「電力測定値.csv」である。
まず、データ情報解析部112は、データ本体のファイル名の拡張子「csv」を参照し、データ本体のデータ形式がCSVファイルであると判定する。
さらに、データ情報解析部112は、データ本体の大分類を表データと判定し、データ本体の小分類をCSVと判定する。
次に、データ情報解析部112は、データ本体をCSVのフォーマットにしたがってパースする。
そして、データ情報解析部112は、データ本体の列ごとに列名とデータ型を判定する。
列名は、データ本体のファイルの中のヘッダー行を参照することで特定できる。
データ型は、データ本体のファイルの中の各列の値に対して型判定を行うことで判別できる。
複数のデータ型を判定できる場合、データ情報解析部112は、もっとも限定的なデータ型を選択する。
例えば、ある列の値が1,2,・・・のような場合、データ型は文字列ではなく数値として特定される。数値データは常に文字列データに変換できるが、文字列データは数値データに変換できるとは限らない。そのため、数値は文字列よりも限定的なデータ型であると言える。
【0121】
図18に戻り、説明を続ける。
ステップS313の後、処理は終了する。
【0122】
ステップS311でデータ本体のみが受け付けられた場合、ステップS313で生成された属性情報が、対象データの属性情報199として使用されることとなる。
ステップS311でデータ本体と属性情報が受け付けられた場合、ステップS311で受け付けられた属性情報とステップS313で生成された属性情報の集合が、対象データの属性情報199として使用されることとなる。
ステップS311で属性情報のみが受け付けられた場合、ステップS311で受け付けられた属性情報が、対象データの属性情報199として使用されることとなる。
【0123】
図17に戻り、ステップS320とステップS330を説明する。
ステップS320は、実施の形態1のステップS120と同じである。
ステップS330は、実施の形態1のステップS130と同じである。
【0124】
***実施の形態3の効果***
実施の形態3では、加工対象データのデータ本体を受け付けて解析することで加工対象データの属性情報が取得される。
これにより、利用者は、加工対象データの属性情報を全て入力する必要がなくなる。そして、利用者が加工方式を検索するための手間を省ける、という効果が得られる。なお、利用者が入力するデータ本体はサンプルデータのようにデータ全体のうちの一部でもよい。
【0125】
***実施の形態3の補足***
実施の形態3は実施の形態2と組み合わせて実施されてもよい。つまり、実施の形態3において、データ加工方式流通装置100は、実施の形態2のように、連鎖的に適用することが可能な2つ以上の加工方式を推薦してもよい。
【0126】
***実施の形態の補足***
図20に基づいて、データ加工方式流通装置100のハードウェア構成を説明する。
データ加工方式流通装置100は処理回路109を備える。
処理回路109は、属性情報取得部110と親和性スコア算出部120と推薦情報出力部130を実現するハードウェアである。
処理回路109は、専用のハードウェアであってもよいし、メモリ102に格納されるプログラムを実行するプロセッサ101であってもよい。
【0127】
処理回路109が専用のハードウェアである場合、処理回路109は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC、FPGAまたはこれらの組み合わせである。
ASICは、Application Specific Integrated Circuitの略称である。
FPGAは、Field Programmable Gate Arrayの略称である。
【0128】
データ加工方式流通装置100は、処理回路109を代替する複数の処理回路を備えてもよい。
【0129】
処理回路109において、一部の機能が専用のハードウェアで実現されて、残りの機能がソフトウェアまたはファームウェアで実現されてもよい。
【0130】
このように、データ加工方式流通装置100の機能はハードウェア、ソフトウェア、ファームウェアまたはこれらの組み合わせで実現することができる。
【0131】
各実施の形態は、好ましい形態の例示であり、本開示の技術的範囲を制限することを意図するものではない。各実施の形態は、部分的に実施してもよいし、他の形態と組み合わせて実施してもよい。フローチャート等を用いて説明した手順は、適宜に変更してもよい。
【0132】
データ加工方式流通装置100は、複数の装置(コンピュータ)で実現されてもよい。
つまり、データ加工方式流通装置100の機能が複数の装置(コンピュータ)に分散され、複数の装置(コンピュータ)がネットワークなどを通じて連携してデータ加工方式流通装置100の機能を実現してもよい。クラウド環境が利用されてもよい。
【0133】
データ加工方式流通装置100の各要素の「部」は、「処理」、「工程」、「回路」または「サーキットリ」と読み替えてもよい。
【符号の説明】
【0134】
100 データ加工方式流通装置、101 プロセッサ、102 メモリ、103 補助記憶装置、104 入出力インタフェース、109 処理回路、110 属性情報取得部、111 データ情報受付部、112 データ情報解析部、120 親和性スコア算出部、130 推薦情報出力部、131 推薦方式出力部、132 連鎖方式出力部、190 記憶部、191 加工方式情報、192 属性情報、193 データ形式分類表、199 属性情報。
【要約】
属性情報取得部(110)は、データ加工の対象となる対象データの属性情報を取得する。親和性スコア算出部(120)は、複数の加工方式のそれぞれの属性情報を含む加工方式情報を参照し、加工方式ごとに前記加工方式の前記属性情報と前記対象データの前記属性情報に基づいて前記対象データに対する前記加工方式の親和性スコアを算出する。推薦情報出力部(130)は、前記複数の加工方式のそれぞれの前記親和性スコアに基づいて前記複数の加工方式から前記対象データの前記データ加工のための推薦方式とする加工方式を選択し、前記推薦方式を示す推薦情報を出力する。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20