IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ NECソリューションイノベータ株式会社の特許一覧

特開2024-77309データ管理支援装置、データ管理支援方法、プログラム及び記録媒体
<>
  • 特開-データ管理支援装置、データ管理支援方法、プログラム及び記録媒体 図1
  • 特開-データ管理支援装置、データ管理支援方法、プログラム及び記録媒体 図2
  • 特開-データ管理支援装置、データ管理支援方法、プログラム及び記録媒体 図3
  • 特開-データ管理支援装置、データ管理支援方法、プログラム及び記録媒体 図4
  • 特開-データ管理支援装置、データ管理支援方法、プログラム及び記録媒体 図5
  • 特開-データ管理支援装置、データ管理支援方法、プログラム及び記録媒体 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024077309
(43)【公開日】2024-06-07
(54)【発明の名称】データ管理支援装置、データ管理支援方法、プログラム及び記録媒体
(51)【国際特許分類】
   G06F 16/2457 20190101AFI20240531BHJP
   G06F 16/28 20190101ALI20240531BHJP
【FI】
G06F16/2457
G06F16/28
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022189335
(22)【出願日】2022-11-28
(71)【出願人】
【識別番号】000232092
【氏名又は名称】NECソリューションイノベータ株式会社
(74)【代理人】
【識別番号】100115255
【弁理士】
【氏名又は名称】辻丸 光一郎
(74)【代理人】
【識別番号】100201732
【弁理士】
【氏名又は名称】松縄 正登
(74)【代理人】
【識別番号】100154081
【弁理士】
【氏名又は名称】伊佐治 創
(74)【代理人】
【識別番号】100227019
【弁理士】
【氏名又は名称】安 修央
(72)【発明者】
【氏名】三浦 和
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175FA03
5B175FB02
5B175HA01
(57)【要約】
【課題】 データセットに対し、簡便に付帯情報を付与可能なデータ管理支援装置を提供する。
【解決手段】 本発明のデータ管理支援装置は、データセット取得部、分類部、及び、付帯情報付与部を含み、
前記データセット取得部は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類部は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与部は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する。
【選択図】 図1

【特許請求の範囲】
【請求項1】
データセット取得部、分類部、及び、付帯情報付与部を含み、
前記データセット取得部は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類部は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与部は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する、データ管理支援装置。
【請求項2】
前記データセットは、前記テーブルデータの使用目的情報を含み、
前記分類部は、前記使用目的情報に基づいて前記テーブルデータを分類し、
前記付帯情報付与部は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する、請求項1記載のデータ管理支援装置。
【請求項3】
レコメンド部を含み、
前記レコメンド部は、前記分類結果及びレコメンド用情報に基づいて、前記テーブルデータの付帯情報の候補をレコメンドする、請求項1又は2記載のデータ管理支援装置。
【請求項4】
前記レコメンド部は、前記付帯情報の候補から選択された付帯情報と、前記分類結果との組を学習し、前記レコメンド用情報を更新する、請求項3記載のデータ管理支援装置。
【請求項5】
データセット取得工程、分類工程、及び、付帯情報付与工程を含み、
前記データセット取得工程は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類工程は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与工程は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する、データ管理支援方法。
【請求項6】
前記データセットは、前記テーブルデータの使用目的情報を含み、
前記分類工程は、前記使用目的情報に基づいて前記テーブルデータを分類し、
前記付帯情報付与工程は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する、請求項5記載のデータ管理支援方法。
【請求項7】
レコメンド工程を含み、
前記レコメンド工程は、前記分類結果及びレコメンド用情報に基づいて、前記テーブルデータの付帯情報の候補をレコメンドする、請求項5又は6記載のデータ管理支援方法。
【請求項8】
前記レコメンド工程は、前記付帯情報の候補から選択された付帯情報と、前記分類結果との組を学習し、前記レコメンド用情報を更新する、請求項7記載のデータ管理支援方法。
【請求項9】
データセット取得手順、分類手順、及び、付帯情報付与手順を含み、
前記データセット取得手順は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類手順は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与手順は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与し、
前記各手順をコンピュータに実行させるためのプログラム。
【請求項10】
データセット取得手順、分類手順、及び、付帯情報付与手順を含み、
前記データセット取得手順は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類手順は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与手順は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与し、
前記各手順をコンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ管理支援装置、データ管理支援方法、プログラム及び記録媒体に関する。
【背景技術】
【0002】
近年、IoT技術の発展等に伴い、様々なデータが流通の対象となっている。この際、流通対象となるデータの所在や内容等を示す情報として、データカタログが作成されている(非特許文献1)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】“データカタログ作成ガイドライン V2.1”、[online]、2021年6月18日、一般社団法人データ社会推進協議会、[令和4年11月7日検索]、インターネット <URL:https://data-society-alliance.org/wp-content/uploads/2021/06/210618-D23-DataCatalogGuidelineV21-gl-tecst.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0004】
データカタログを生成するためには、データ提供者が提供する大量のデータセットを分類し、タグなどの付帯情報を付与していく作業が必要になる。しかしながら、大量のデータに対し付帯情報を付与する作業は大変に煩雑であるという課題がある。
【0005】
そこで本発明は、データセットに対し、簡便に付帯情報を付与可能なデータ管理支援装置、データ管理支援方法、及び、プログラムの提供を目的とする。
【課題を解決するための手段】
【0006】
前記目的を達成するために、本発明のデータ管理支援装置は、
データセット取得部、分類部、及び、付帯情報付与部を含み、
前記データセット取得部は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類部は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与部は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する。
【0007】
本発明のデータ管理支援方法は、
データセット取得工程、分類工程、及び、付帯情報付与工程を含み、
前記データセット取得工程は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類工程は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与工程は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する。
【0008】
本発明のプログラムは、
データセット取得手順、分類手順、及び、付帯情報付与手順を含み、
前記データセット取得手順は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類手順は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与手順は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与し、
前記各手順をコンピュータに実行させるためのプログラムである。
【0009】
本発明の記録媒体は、
データセット取得手順、分類手順、及び、付帯情報付与手順を含み、
前記データセット取得手順は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類手順は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与手順は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与し、
前記各手順をコンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0010】
本発明によれば、データセットに対し、簡便に付帯情報を付与できる。
【図面の簡単な説明】
【0011】
図1図1は、実施形態1のデータ管理支援装置の一例の構成を示すブロック図である。
図2図2は、実施形態1のデータ管理支援装置のハードウェア構成の一例を示すブロック図である。
図3図3は、実施形態1のデータ管理支援装置における処理の一例を示すフローチャートである。
図4図4は、実施形態2のデータ管理支援装置の一例の構成を示すブロック図である。
図5図5は、実施形態3のデータ管理支援装置の一例の構成を示すブロック図である。
図6図6は、実施形態3のデータ管理支援装置における処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0012】
以下、本発明の実施形態について図を用いて説明する。本発明は、以下の実施形態には限定されない。以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用でき、各実施形態の構成は、特に言及がない限り、組合せ可能である。
げられる。
【0013】
[実施形態1]
図1は、本実施形態のデータ管理支援装置10の一例の構成を示すブロック図である。図1に示すように、本装置10は、データセット取得部11、分類部12、付帯情報付与部13を含む。また、本装置10は、図示していないが、入力部、出力部、表示部及び/又は記憶部を含んでもよい。
【0014】
本装置10は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、通信回線網を介して接続可能な装置でもよい。また、本装置10は、前記通信回線網を介して、後述する外部装置と接続可能である。前記通信回線網は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。前記通信回線網は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、SAN(Storage Area Network)、DTN(Delay Tolerant Networking)、LPWA(Low Power Wide Area)、L5G(ローカル5G)、等があげられる。無線通信としては、例えば、Wi-Fi(登録商標)、Bluetooth(登録商標)、ローカル5G、LPWA等が挙げられる。前記無線通信としては、各装置が直接通信する形態(Ad Hoc通信)、インフラストラクチャ(infrastructure通信)、アクセスポイントを介した間接通信等であってもよい。本装置10は、例えば、システムとしてサーバに組み込まれていてもよい。また、本装置10は、例えば、本発明のプログラムがインストールされたパーソナルコンピュータ(PC、例えば、デスクトップ型、ノート型)、スマートフォン、タブレット端末等であってもよい。本装置10は、例えば、前記各部のうち少なくとも一つがサーバ上にあり、その他の前記各部が端末上にあるような、クラウドコンピューティングやエッジコンピューティング等の形態であってもよい。
【0015】
図2に、本装置10のハードウェア構成のブロック図を例示する。本装置10は、例えば、中央処理装置(CPU、GPU等)101、メモリ102、バス103、記憶装置104、入力装置105、出力装置106、通信デバイス107等を含む。本装置10の各部は、それぞれのインタフェース(I/F)により、バス103を介して相互に接続されている。
【0016】
中央処理装置101は、コントローラ(システムコントローラ、I/Oコントローラ等)等により、他の構成と連携動作し、本装置10の全体の制御を担う。本装置10において、中央処理装置101により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、中央処理装置101が、データセット取得部11、分類部12、付帯情報付与部13として機能する。本装置10は、演算装置として、CPU、GPU(Graphics Processing Unit)、APU(Accelerated Processing Unit)等の他の演算装置を備えてもよいし、これらの組合せを備えてもよい。
【0017】
バス103は、例えば、外部装置とも接続できる。前記外部装置は、例えば、ユーザの端末、外部記憶装置(外部データベース等)、プリンタ、外部入力装置、外部表示装置、外部撮像装置等があげられる。本装置10は、例えば、バス103に接続された通信デバイス107により、外部ネットワーク(前記通信回線網)に接続でき、外部ネットワークを介して、他の装置と接続することもできる。
【0018】
メモリ102は、例えば、メインメモリ(主記憶装置)が挙げられる。中央処理装置101が処理を行う際には、例えば、後述する記憶装置104に記憶されている本発明のプログラム等の種々の動作プログラムを、メモリ102が読み込み、中央処理装置101は、メモリ102からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。また、メモリ102は、例えば、ROM(読み出し専用メモリ)であってもよい。
【0019】
記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置104は、例えば、記録媒体と、記録媒体に読み書きするドライブとの組合せであってもよい。前記記録媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられる。記憶装置104は、例えば、記録媒体とドライブとが一体化されたハードディスクドライブ(HDD)、及びソリッドステートドライブ(SSD)であってもよい。本装置10が前記記憶部を含む場合、例えば、記憶装置104は、前記記憶部として機能する。前記記憶部は、例えば、データセット、データセットの更新情報、使用目的情報、候補辞書情報等を記憶できる。
【0020】
本装置10において、メモリ102及び記憶装置104は、ログ情報、外部データベース(図示せず)や外部の装置から取得した情報、本装置10によって生成した情報、本装置10が処理を実行する際に用いる情報等の種々の情報を記憶することも可能である。この場合、メモリ102及び記憶装置104は、例えば、前述の本装置のユーザの情報等を記憶していてもよい。なお、少なくとも一部の情報は、例えば、メモリ102及び記憶装置104以外の外部サーバに記憶されていてもよいし、複数の端末にブロックチェーン技術等を用いて分散して記憶されていてもよい。
【0021】
本装置10は、例えば、さらに、入力装置105、出力装置106を備える。入力装置105は、例えば、タッチパネル、トラックパッド、マウス等のポインティングデバイス;キーボード;カメラ、スキャナ等の撮像手段;ICカードリーダ、磁気カードリーダ等のカードリーダ;マイク等の音声入力手段;等があげられる。出力装置106は、例えば、LEDディスプレー、液晶ディスプレー等の表示装置;スピーカ等の音声出力装置;プリンタ;等があげられる。本実施形態1において、入力装置105と出力装置106とは、別個に構成されているが、入力装置105と出力装置106とは、タッチパネルディスプレーのように、一体として構成されてもよい。
【0022】
つぎに、本実施形態のデータ管理支援方法の一例を、図3のフローチャートに基づき説明する。本実施形態のデータ管理支援方法は、例えば、図1又は図2の装置10を用いて、次のように実施する。なお、本実施形態のデータ管理支援方法は、図1又は図2の装置10の使用には限定されない。
【0023】
まず、データセット取得部11は、データセット及び前記データセットの更新情報を取得する(S1、データセット取得工程)。前記データセットは、テーブルデータを含む。前記テーブルデータは、例えば、データ管理の分野における所謂テーブルであり、含まれるデータの数及び/又は種類は特に制限されない。前記データセットが含むテーブルデータは、例えば、1つでもよいし、2以上の複数でもよい。また、前記データセットは、例えば、前記テーブルデータの使用目的情報を含んでもよい。前記使用目的情報は、例えば、前記データセットが使用されるシステムの種類(例えば、PLM:Product Lifecycle Management、MA:Marketing Automation、SFA:Sales Force Automation、CRM:Customer Relationship Management、ERP:Enterprise Resources Planning等)、及び/又は前記データセットを使用する業務の種類等の情報があげられる。前記データセットは、例えば、テーブルデータを含んでいる階層構造のデータであればその用途等は特に制限されない。前記データセットは、例えば、データカタログ用のデータセット、辞書用のデータセット、電話帳用のデータセット等があげられる。前記更新情報は、例えば、前記データセットが含むテーブルデータの更新統計情報である。前記更新情報は、例えば、前記データセットを保存しているデータベースがOracleデータベースである場合、前記データベースに対し、「Oracle:dba_tab_modifications」等の指示を行うことで取得可能な情報であってもよい。前記更新情報は、例えば、挿入(INSERT)、更新(UPDATE)、消去(DELETE)等の更新の種類と、種類ごとの頻度の情報を含む。データセット取得部11は、例えば、予め本装置10のメモリ102又は記憶装置104に記憶されたデータセット及び更新情報を取得してもよいし、通信回線網を介して外部装置(例えば、外部の端末、ストレージ、サーバ装置等)から前記データセット及び更新情報を取得してもよい。後者の場合、例えば、前記データセット及び更新情報は、同じ装置から取得してもよいし、異なる装置から取得してもよい。
【0024】
つぎに、分類部12は、前記更新情報に基づいて前記テーブルデータの種類を分類する(S2、分類工程)。具体的に、分類部12は、例えば、前記テーブルデータ毎に、前記テーブルデータの更新情報の種類毎の比率に基づいて、前記テーブルデータの種類を分類できる。前記テーブルデータの種類は、特に制限されず、例えば、任意のカテゴリに分類できるが、具体例として、マスターデータ、トランザクションデータ、参照データ、ログデータ(例えば、履歴データともいう)、一時用データ(例えば、ワークテーブル用データともいう)等に分類することが好ましい。分類部12は、例えば、前記データセットが前記テーブルデータの使用目的情報を含む場合、前記使用目的情報に基づいて前記テーブルデータを分類してもよい。
【0025】
図4を用いて、分類部12における分類処理(S2)の具体例を説明する。以下の説明においては、前記データセットがデータカタログ用のデータセットである場合を例に挙げて説明するが、本発明は以下の例には何ら制限されない。まず、分類部12は、分類対象となったテーブルデータにおいて、前記更新情報に更新処理(UPDATE)が記録されているか否か(UPDATE≒0件?)を判定する(S2A)。更新処理が記録されていない場合(S2A、Yes)、分類部12は、前記テーブルデータを一時データ又はログデータであると分類する(S2B)。前記更新処理が記録されている場合(S2A、No)、分類部12は、前記更新情報において、挿入処理(INSERT)が、更新処理(UPDATE)よりも少ないか(INSERT<UPDATE?)を判定する(S2C)。S2Cの判定において、分類部12は、例えば、単に挿入処理の回数が更新処理の回数よりも少ないか否かを判定してもよいし、挿入処理の回数と、更新処理の回数との比率を算出し、前記挿入処理の割合が更新処理の割合よりも少ないか否かを判定してもよく、後者の場合、さらに、割合の差が閾値よりも大きいか否かをさらに判定してもよい。前記閾値は、特に制限されず、例えば、10%以上、15%以上、20%以上、25%以上、30%以上、35%以上、50%以上等があげられる。分類部12は、挿入処理が更新処理よりも少ない場合(S2C、Yes)、前記テーブルデータをマスターデータであると分類する(S2D)。また、分類部12は、挿入処理が更新処理よりも多い場合(S2C、No)、前記テーブルデータをトランザクションデータに分類する(S2E)。また、分類部12は、挿入処理が更新処理よりも少ない場合(S2C、Yes)であっても、例えば、所定の期間において、閾値以上の挿入処理が発生している場合、前記テーブルデータをトランザクションデータに分類してもよい。前記所定の期間は、特に制限されず、例えば、過去3か月、過去半年、過去1年等があげられる。前記閾値は、特に制限されず、任意に設定できるが、例えば、全体の処理数の1/4以上等があげられる。前記「閾値以上の挿入処理の発生」とは、例えば、全処理中における挿入処理の発生回数でもよいし、発生割合でもよい。
【0026】
そして、付帯情報付与部13は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する(S3、付帯情報付与工程)。前記付帯情報は、例えば、前記テーブルデータのカテゴリ、分類、意味等の説明を付与する情報であり、いわゆるタグデータ、メタデータ等があげられる。付帯情報付与部13は、例えば、前記S2において、分類したテーブルデータの種類に対応するタグ情報を付与することにより、前記付帯情報を付与できる。具体例として、付帯情報付与部13は、例えば、前記S2において、マスターデータに分類されたテーブルデータに対しては、マスターデータである旨を示すタグ情報を付与できる。同様に、付帯情報付与部13は、トランザクションデータに分類されたテーブルデータに対しては、トランザクションデータである旨を示すタグ情報を付与できる。また、付帯情報付与部13は、例えば、一時データ又はログデータであると分類されたテーブルデータに対しては、一時データ又はログデータである旨を示すタグ情報を付与できる。また、付帯情報付与部13は、例えば、前記データセットが前記テーブルデータの使用目的情報を含む場合、前記使用目的情報に基づく分類結果に基づいて付帯情報を付与してもよい。この場合、付帯情報付与部13は、例えば、付帯情報として、前記テーブルデータに前記使用目的情報を特定するメタデータを付与できる。
【0027】
本装置10は、例えば、前記出力部により、前記付帯情報を付与したテーブルデータを含むデータセットを出力可能であってもよい。また、本装置10のメモリ102又は記憶装置104は、前記付帯情報を付与したテーブルデータを含むデータセットを記憶可能であってもよい。
【0028】
本実施形態のデータ管理支援装置は、データセットの更新情報に基づいてテーブルデータの種類を分類し、分類した種類に基づいて付帯情報を付与できる。このため、本実施形態のデータ管理支援装置によれば、データセットが含むテーブルデータに対し、簡便に付帯情報を付与できる。本実施形態のデータ管理支援装置は、テーブルデータに対し簡便に付帯情報を付与できるため、例えば、データセットを用いたデータカタログの作成を支援可能である。このため、本実施形態のデータ管理支援装置は、例えば、データカタログ生成支援装置ということもできる。
【0029】
[実施形態2]
実施形態2は、本発明のデータ管理支援装置の他の例である。
【0030】
本実施形態のデータ管理支援装置は、実施形態1のデータ管理支援装置10の構成に加えて、レコメンド部を含むこと以外は前記実施形態1のデータ管理支援装置10と同様であり、その説明を援用できる。本実施形態のデータ管理支援装置10Aは、例えば、レコメンド部を含み、前記レコメンド部は、レコメンド用情報に基づいて、前記テーブルデータの付帯情報の候補をレコメンドし、前記レコメンド用情報は、前記分類結果、テクニカルメタデータ及び候補辞書情報を含む。また、前記レコメンド部は、例えば、前記付帯情報の候補から選択された付帯情報と、前記レコメンド用情報との組を学習し、学習結果に基づいてレコメンドが可能であってもよい。
【0031】
図5は、本実施形態のデータ管理支援装置10Aの一例の構成を示すブロック図である。図5に示すように、データ管理支援装置10Aは、実施形態1のデータ管理支援装置10の構成に加えて、レコメンド部14を含む。データ管理支援装置10Aのハードウェア構成は、図2のデータ管理支援装置10のハードウェア構成において、中央処理装置101が、図1のデータ管理支援装置10の構成に代えて、図5のデータ管理支援装置10Aの構成を備える以外は同様である。以下、レコメンド部14の処理を説明する。レコメンド部14の処理は、例えば、前記実施形態1で説明した図3のフローチャートにおける任意の位置に適宜挿入できるが、図6に示すように、前記実施形態1のS1~S2を実行した後、レコメンド部14による処理(S4)を実行し、前記実施形態1のS3を実行することが好ましい。
【0032】
レコメンド部14は、前記分類結果及びレコメンド用情報に基づいて、前記テーブルデータの付帯情報の候補をレコメンドする(レコメンド工程)。前記レコメンド用情報は、例えば、レコメンド部14によりレコメンドされる付帯情報の用語の候補と、前記分類結果が紐づけられた情報である。レコメンド部14は、例えば、前記レコメンド用情報を参照し、前記テーブルデータの分類結果に紐づけられた付帯情報用語を、前記テーブルデータの付帯情報の候補をレコメンドできる。前記レコメンド用情報が含む用語の候補は、特に制限されず、例えば、前記テーブルデータについて説明する用語があげられ、具体例としては、顧客マスタ、企業マスタ、担当者マスタ、商談、商談詳細、購買、購買詳細等の用語があげられる。前記レコメンド用情報が含む用語の候補は、例えば、本装置10Aのユーザにより任意に追加・編集が可能であってもよい。前記レコメンド用情報は、例えば、予め本装置10Aのメモリ102又は記憶装置104に記憶されていてもよいし、本装置10A外の外部装置に記憶されていてもよい。後者の場合、レコメンド部14は、例えば、通信回線網を介して前記外部装置(例えば、外部の端末、ストレージ、サーバ装置等)から前記レコメンド用情報を取得できる。
【0033】
レコメンド部14は、例えば、前記付帯情報の候補から選択された付帯情報と、前記分類結果との組を学習し、前記レコメンド用情報を更新可能であってもよい。また、レコメンド部14は、例えば、前記選択された付帯情報と、分類結果とに加えて、前記テーブルデータに含まれるデータとを紐づけて記憶してもよい。前記紐づけるデータは、特に制限されず、例えば、テーブルデータの列名及び表名の少なくとも一方であることが好ましい。この場合、レコメンド部14は、用語の優先度を設定し、前記レコメンド用情報に前記優先度をさらに紐づけてもよい。具体例として、例えば、レコメンド部14は、例えば、同一の分類結果において複数回選択された用語については、優先度を高く設定できる。また、レコメンド部14は、例えば、ユーザが選択した用語及びテーブルデータの類似度に基づいて前記優先度を算出してもよい。この場合、レコメンド部14は、例えば、前記用語がテーブルデータの付帯情報として選択された場合に、前記テーブルデータが含む表名及び列名の組み合わせを、前記用語と紐づけて記憶しておく。そして、レコメンド部14は、取得したテーブルデータにおける表名及び列名と、記憶された表名及び列名との類似度を判定し、前記類似度が高い用語について優先度を高く設定できる。レコメンド部14は、前記優先度が設定された用語について、次回以降のレコメンドの際に他の用語よりも上位に表示できる。
【0034】
本装置10Aは、例えば、レコメンド部14により、テーブルデータの付帯情報の候補をレコメンドする。このため、本装置10Aのユーザは、例えば、レコメンドされた付帯情報から、任意に、前記テーブルデータの付帯情報を追加できる。これにより、前記データセットのテーブルデータについて、さらに詳細な情報を付加することが可能となる。
【0035】
[実施形態3]
本実施形態のプログラムは、前述のデータ管理支援方法の各工程を、コンピュータに実行させるためのプログラムである。具体的に、本実施形態のプログラムは、コンピュータに、データセット取得手順、分類手順、及び、付帯情報付与手順を実行させるためのプログラムである。
【0036】
前記データセット取得手順は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類手順は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与手順は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する。
【0037】
また、本実施形態のプログラムは、コンピュータを、データセット取得手順、分類手順、及び、付帯情報付与手順として機能させるプログラムということもできる。
【0038】
本実施形態のプログラムは、前記本発明のデータ管理支援装置及びデータ管理支援方法における記載を援用できる。前記各手順は、例えば、「手順」を「処理」と読み替え可能である。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体は、例えば、非一時的なコンピュータ可読記録媒体(non-transitory computer-readable storage medium)である。前記記録媒体は、特に制限されず、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、ハードディスク(HD)、フラッシュメモリー(例えば、SSD(Solid State Drive)、USBフラッシュメモリー、SD/SDHCカード等)、光ディスク(例えば、CD‐R/CD‐RW、DVD‐R/DVD‐RW、BD‐R/BD‐RE等)、光磁気ディスク(MO)、フロッピー(登録商標)ディスク(FD)等があげられる。また、本実施形態のプログラム(例えば、プログラミング製品、又はプログラム製品ともいう)は、例えば、外部のコンピュータから配信される形態であってもよい。前記「配信」は、例えば、通信回線網を介した配信でもよいし、有線で接続された装置を介した配信であってもよい。本実施形態のプログラムは、配信された装置にインストールされて実行されてもよいし、インストールされずに実行されてもよい。
【0039】
以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。
【0040】
<付記>
上記の実施形態の一部又は全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
データセット取得部、分類部、及び、付帯情報付与部を含み、
前記データセット取得部は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類部は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与部は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する、データ管理支援装置。
(付記2)
前記データセットは、前記テーブルデータの使用目的情報を含み、
前記分類部は、前記使用目的情報に基づいて前記テーブルデータを分類し、
前記付帯情報付与部は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する、付記1記載のデータ管理支援装置。
(付記3)
レコメンド部を含み、
前記レコメンド部は、前記分類結果及びレコメンド用情報に基づいて、前記テーブルデータの付帯情報の候補をレコメンドする、付記1又は2記載のデータ管理支援装置。
(付記4)
前記レコメンド部は、前記付帯情報の候補から選択された付帯情報と、前記分類結果との組を学習し、前記レコメンド用情報を更新する、付記3記載のデータ管理支援装置。
(付記5)
データセット取得工程、分類工程、及び、付帯情報付与工程を含み、
前記データセット取得工程は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類工程は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与工程は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する、データ管理支援方法。
(付記6)
前記データセットは、前記テーブルデータの使用目的情報を含み、
前記分類工程は、前記使用目的情報に基づいて前記テーブルデータを分類し、
前記付帯情報付与工程は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する、付記5記載のデータ管理支援方法。
(付記7)
レコメンド工程を含み、
前記レコメンド工程は、前記分類結果及びレコメンド用情報に基づいて、前記テーブルデータの付帯情報の候補をレコメンドする、付記5又は6記載のデータ管理支援方法。
(付記8)
前記レコメンド工程は、前記付帯情報の候補から選択された付帯情報と、前記分類結果との組を学習し、前記レコメンド用情報を更新する、付記7記載のデータ管理支援方法。
(付記9)
データセット取得手順、分類手順、及び、付帯情報付与手順を含み、
前記データセット取得手順は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類手順は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与手順は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与し、
前記各手順をコンピュータに実行させるためのプログラム。
(付記10)
前記データセットは、前記テーブルデータの使用目的情報を含み、
前記分類手順は、前記使用目的情報に基づいて前記テーブルデータを分類し、
前記付帯情報付与手順は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する、付記9記載のプログラム。
(付記11)
レコメンド手順を含み、
前記レコメンド手順は、前記分類結果及びレコメンド用情報に基づいて、前記テーブルデータの付帯情報の候補をレコメンドする、付記9又は8記載のプログラム。
(付記12)
前記レコメンド手順は、前記付帯情報の候補から選択された付帯情報と、前記分類結果との組を学習し、前記レコメンド用情報を更新する、付記11記載のプログラム。
(付記13)
データセット取得手順、分類手順、及び、付帯情報付与手順を含み、
前記データセット取得手順は、データセット及び前記データセットの更新情報を取得し、
前記データセットは、テーブルデータを含み、
前記分類手順は、前記更新情報に基づいて前記テーブルデータの種類を分類し、
前記付帯情報付与手順は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与し、
前記各手順をコンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体。
(付記14)
前記データセットは、前記テーブルデータの使用目的情報を含み、
前記分類手順は、前記使用目的情報に基づいて前記テーブルデータを分類し、
前記付帯情報付与手順は、前記分類結果に基づいて、前記データセットが含むテーブルデータに付帯情報を付与する、付記13記載の記録媒体。
(付記15)
レコメンド手順を含み、
前記レコメンド手順は、前記分類結果及びレコメンド用情報に基づいて、前記テーブルデータの付帯情報の候補をレコメンドする、付記13又は14記載の記録媒体。
(付記16)
前記レコメンド手順は、前記付帯情報の候補から選択された付帯情報と、前記分類結果との組を学習し、前記レコメンド用情報を更新する、付記16記載の記録媒体。
【産業上の利用可能性】
【0041】
本発明によれば、データセットに対し、簡便に付帯情報を付与できる。このため、本発明は、データ管理を行う様々な分野に利用可能であり、特に、データカタログの生成支援の分野において、特に好適に利用できる。
【符号の説明】
【0042】
10 データ管理支援装置
11 データセット取得部
12 分類部
13 付帯情報付与部
14 レコメンド部
101 中央処理装置
102 メモリ
103 バス
104 記憶装置
105 入力装置
106 出力装置
107 通信デバイス

図1
図2
図3
図4
図5
図6