特開2018-37069 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社　ビーアイマトリックスの特許一覧

特開2018-37069レポートの重要度を分析するメタデータ基盤のオンライン分析処理システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】特開2018-37069(P2018-37069A)

(43)【公開日】2018年3月8日

(54)【発明の名称】レポートの重要度を分析するメタデータ基盤のオンライン分析処理システム

(51)【国際特許分類】

G06F 12/00 20060101AFI20180209BHJP

【ＦＩ】

G06F12/00 513D

【審査請求】有

【請求項の数】5

【出願形態】ＯＬ

【全頁数】19

(21)【出願番号】特願2017-153551(P2017-153551)

(22)【出願日】2017年8月8日

(31)【優先権主張番号】10-2016-0110132

(32)【優先日】2016年8月29日

(33)【優先権主張国】KR

(71)【出願人】

【識別番号】512096861

【氏名又は名称】株式会社ビーアイマトリックス

【氏名又は名称原語表記】ＢＩＭＡＴＲＩＸＣＯ．，ＬＴＤ

(74)【代理人】

【識別番号】110001427

【氏名又は名称】特許業務法人前田特許事務所

(72)【発明者】

【氏名】ベヨングン

(72)【発明者】

【氏名】パクミンク

(72)【発明者】

【氏名】ハンジンス

(72)【発明者】

【氏名】ファンソンミン

(57)【要約】（修正有）

【課題】データベースのテーブル関係及び参照データをメタデータとして保存し、これを用いてレポートを作成するＯＬＡＰシステムにおいて、レポートの重要度を演算するオンライン分析処理システムを提供する。
【解決手段】ＯＬＡＰサーバ３０において、ビッグデータを保存するデータキューブのデータを参照するために作成されるテーブル関係図及び参照項目をメタデータとして構成して保存するメタデータ構成部３１と、一つの選択されたメタデータの参照項目だけでピボットテーブルを構成し、ピボットテーブルの結果を含むレポート作成をサポートするレポート作成部３４と、レポートのピボットテーブルに使用された参照項目が他のレポートに使用される割合に、当該参照項目を含むテーブルのリンクによる加重値を加重して当該参照項目の重要度を求め、レポート内の参照項目の重要度を合算して前記レポートの重要度を算出するレポート分析部３５とを含む。
【選択図】図２

【特許請求の範囲】

【請求項1】

ユーザ端末とネットワークにより接続され、ビッグデータを保存するデータキューブと接続される、メタデータ基盤のオンライン分析処理システムにおいて、
データキューブのビッグデータを参照するために作成されるテーブル関係図及び参照項目をメタデータとして構成して保存するメタデータ構成部と；
一つのメタデータが選択されると、選択されたメタデータの参照項目だけでピボットテーブルを構成し、前記ピボットテーブルの結果を含むレポートを作成するようにサポートするレポート作成部と；
前記レポートのピボットテーブルに使用された参照項目が他のレポートに使用される割合に、当該参照項目を含むテーブルのリンクによる加重値を加重して当該参照項目の重要度を求め、前記レポート内の参照項目の重要度を合算して前記レポートの重要度を算出するレポート分析部と；を含むことを特徴とする、メタデータ基盤のオンライン分析処理システム。

【請求項2】

前記レポート分析部は、当該参照項目の重要度を求めるとき、前記レポートに使用される全体参照項目の個数を反比例して算出することを特徴とする、請求項１に記載のメタデータ基盤のオンライン分析処理システム。

【請求項3】

前記レポート分析部は、前記レポートのピボットテーブルのデータ領域において値が表示されないセルの割合を加重して前記レポートの重要度を算出することを特徴とする、請求項１に記載のメタデータ基盤のオンライン分析処理システム。

【請求項4】

前記参照項目の重要度を下記数式１により求めることを特徴とする、請求項１に記載のメタデータ基盤のオンライン分析処理システム。

【数7】

但し、Ｔ_ｉ、Ｉ_ｊ、Ｒ_ｋはそれぞれテーブル、参照項目、レポートを示し、Ｔはテーブルの全体集合を示し、Ｉ_ｊ∈Ｔ_ｉは、参照項目Ｉ_ｊがＤＢテーブルＴ_ｉによる参照項目であることを示し、Ｉ_ｊ∈Ｒ_ｉは、参照項目Ｉ_ｊがレポートＲ_ｋによる参照項目であることを示し、Ｌ（Ｔ_ｉ）はテーブルＴ_ｉのリンクを意味し、Ｌ（Ｔ_ｉ、Ｔ_ｋ）はテーブルＴ_ｉとテーブルＴ_ｋとの間のリンクを意味し、ｎ（）は集合の個数を示す。

【請求項5】

前記レポートの重要度を下記数式２により求めることを特徴とする、請求項４に記載のメタデータ基盤のオンライン分析処理システム。

【数8】

但し、ＮＡセルは、ピボットテーブルのデータ領域のセルのうちで値が表示されないセルを示し、セルまたはＮＡセルは、レポートＲｋにおいてピボットテーブルのデータ領域のセルを示す。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、データベースのテーブ関係及び参照データをメタデータとして保存し、これを用いてレポートを作成するＯＬＡＰシステムにおいて、メタデータの頻度を用いてレポートの重要度を演算する、メタデータ基盤のオンライン分析処理システムに関する。

【背景技術】

【0002】

一般に、オンライン分析処理（ＯＬＡＰ：ｏｎ−ｌｉｎｅａｎａｌｙｔｉｃａｌｐｒｏｃｅｓｓｉｎｇ）システムとは、ビッグデータをデータウェアハウス（ＤＷ:ｄａｔａｗａｒｅｈｏｕｓｅ）またはデータキューブにより構成して蓄積し、蓄積されたビッグデータを用いてオンライン上で簡単に接続して分析するためのツールのことをいう。すなわち、企業の膨大なデータを統計分析などの定型的若しくは非定型的な方法を用いて様々に分析したり、分析された情報を理解し易い一目瞭然なレポートの形式に加工したりして、ビジネスをより合理的に行うようにサポートする一連のツールのことをいう。

【0003】

特に、最近、ソーシャル・ネットワーキング・サービス（ＳＮＳ）、ソーシャルメディアなどのデータに対する分析の重要性が次第に高くなるに伴い、企業体の製品に対する顧客管理や製品広報などのためのビッグデータ（Ｂｉｇｄａｔａ）を収集して分析を行おうとする企業が段々増えてきている。ビッグデータという用語は、ある程度経過した時間内に属するデータを収集、管理、保存、検索、共有、分析及び視覚化するための通常のソフトウェアツール及びコンピュータシステムでは取り扱い難いレベルのデータ量を有するデータセット（ｄａｔａｓｅｔ）に対して主として適用される。ビックデータのサイズは、テラバイト、エクサバイトまたはゼタバイトの範囲を有していてもよい。ビッグデータは様々な分野に存在するが、例えば、ウェブログ（ｗｅｂｌｏｇｓ）、無線周波数認識装置（ＲＦＩＤ）、センサーネットワーク、ソーシャルネットワーク、ソーシャルデータ、インターネットテキストと文書、インターネット検索インデキシング、販売時点（ＰＯＳ：ｐｏｉｎｔｏｆｓａｌｅｓ）データ、販売記録、医療記録、写真記録、ビデオ記録及び電子商取引などが挙げられる。

【0004】

上記のようなビッグデータを用いて分析を行うためにオンライン分析処理システムが多様に開発されてきた。例えば、ウェブ環境などのオンライン上においてデータベースを照会して分析するレポーティング技術が提案されている（下記の特許文献１,２）。しかし、上記先行技術は、開発者がレポートの枠組みを設計するために、レポートの作成ツールや言語を学ばなければならないという問題や、分析レポートを作成するたびに毎回データベースからデータベーステーブル（以下、「ＤＢテーブル」）を選択し、それらの間の関係を設定し、ＳＱＬなどのデータベース質問を作成しなければならないという問題がある。

【0005】

かかる問題を解決するために、過去に作成した分析レポートの結果物を再利用できる環境を提供する技術を提示した（下記の特許文献３）。ほとんどの一般的なユーザが作成する分析レポートは、過去に作成された分析レポートに比べてさほど異なってはおらず、少しずつ変形された形で作成される。したがって、過去に作成した分析レポートの結果をメタデータとして再利用できる環境を提供して、分析レポート作成作業をより簡単に行うようにサポートしている。

【0006】

即ち、ＯＬＡＰレポートは、メタデータ又はメタデータを用いてレポートを作成する。メタデータは、企業の全てのデータソースを同じ観点で標準化して設計した構造ファイルである。このように設計されたメタデータは、クエリに慣れていないユーザにとってデータアクセスの利便性を提供する。また、メタデータを用いて作成したレポートは、標準化された形で自動的に生成されたクエリにより生成されるため、管理面やデータの整合性の観点から一貫性を維持することができる。直接現業ユーザが様々な観点からデータを分析できる非定型分析のためのレポート生成時に、主としてメタデータを用いる。

【0007】

メタデータを用いたレポートの生成機能は、一般のユーザに対して利便性を提供するが、管理面からみると、次のような不都合が生じる可能性がある。

【0008】

第一に、メタデータを用いたレポートが多くなると、特定のユーザが所望するレポートを発見し難く、同じ結果を算出するレポートが多数存在することになる。このため、一層正確な検索機能が必要となる。

【0009】

第二に、レポートを客観的に評価する基準がない。すなわち、メタデータを用いたレポートがうまく作成されたかどうかを評価する客観的基準がない。また、レポート間の重要度を比較できる基準がないということである。

【先行技術文献】

【特許文献】

【0010】

【特許文献1】韓国登録特許第１０−０４９７８１１号（２００５年０７月０１日付け公告）

【特許文献2】韓国登録特許第１０−０９６９６５６号（２０１０年０７月１４日付公告）

【特許文献3】韓国登録特許第１０−１５０５８５８号（２０１５年０３月１９日付公告）

【発明の概要】

【発明が解決しようとする課題】

【0011】

本発明は、上記のような問題を解決するためのものであり、その目的は、データベースのテーブル関係及び参照データをメタデータとして保存し、これを用いてレポートを作成するＯＬＡＰシステムにおいて、メタデータの頻度を用いてレポートの重要度を演算する、メタデータ基盤のオンライン分析処理システムを提供することである。

【課題を解決するための手段】

【0012】

上記目的を達成するために、本発明は、ユーザ端末とネットワークにより接続され、ビッグデータを保存するデータキューブと接続される、メタデータ基盤のオンライン分析処理システムに関するものであり、データキューブのビッグデータを参照するために作成されるテーブル関係図及び参照項目をメタデータとして構成して保存するメタデータ構成部と；一つのメタデータが選択されると、選択されたメタデータの参照項目だけでピボットテーブルを構成し、前記ピボットテーブルの結果を含むレポートを作成するようにサポートするレポート作成部と；前記レポートのピボットテーブルに使用された参照項目が他のレポートに使用される割合に、当該参照項目を含むテーブルのリンクによる加重値を加重して当該参照項目の重要度を求め、前記レポート内の参照項目の重要度を合算して前記レポートの重要度を算出するレポート分析部と；を含むことを特徴とする。

【0013】

また、本発明は、メタデータ基盤のオンライン分析処理システムにおいて、前記レポート分析部は、当該参照項目の重要度を求めるとき、前記レポートに使用される全体参照項目の個数を反比例して算出することを特徴とする。

【0014】

また、本発明は、メタデータ基盤のオンライン分析処理システムにおいて、前記レポート分析部は、前記レポートのピボットテーブルのデータ領域において値が表示されないセルの割合を加重して前記レポートの重要度を算出することを特徴とする。

【0015】

また、本発明は、メタデータ基盤のオンライン分析処理システムにおいて、前記参照項目の重要度を下記数式１により求めることを特徴とする。

【0016】

【数1】

【0017】

【0018】

また、本発明は、メタデータ基盤のオンライン分析処理システムにおいて、前記レポートの重要度を下記数式２により求めることを特徴とする。

【0019】

【数2】

【0020】

但し、ＮＡセルは、ピボットテーブルのデータ領域のセルのうちで値が表示されないセルを示し、セルまたはＮＡセルは、レポートＲ_ｋにおいてピボットテーブルのデータ領域のセルを示す。

【発明の効果】

【0021】

上述したように、本発明に係るメタデータ基盤のオンライン分析処理システムによれば、メタデータの頻度などを用いてレポートの重要度を分析することにより、重要なレポートまたはメタデータを一層正確に検出することができるという効果が得られる。

【図面の簡単な説明】

【0022】

【図1】本発明に係るメタデータ基盤のオンライン分析処理システムを実施するためのシステム全体の構成のブロック図である。

【図2】本発明の一実施例に係るメタデータ基盤のオンライン分析処理システムの構成に対するブロック図である。

【図3】本発明に係るメタデータのテーブル関係図及び参照項目の一例である。

【図4】本発明の一実施例に基づいて、メタデータをデータベース化してテーブルで構成した一例である。

【図5】本発明に係るメタデータ基盤のオンライン分析処理システムのクエリデザイン画面の一例である。

【図6】本発明に係るメタデータ基盤のオンライン分析処理システムのデザイン画面において、参照項目を階層的なフォルダで構成する画面の一例である。

【図7】本発明に係るメタデータ基盤のオンライン分析処理システムのピボットデザイン画面の一例である。

【図8】本発明に係るメタデータ基盤のオンライン分析処理システムのピボットレポート画面の一例である。

【図9】本発明の一実施例に係るレポートの重要度を分析する方法を説明するフローチャートである。

【図10】本発明の一実施例に係るテーブル関係図の一例である。

【発明を実施するための形態】

【0023】

以下、本発明の実施のための具体的な内容を図面を参照して説明する。

【0024】

なお、本発明を説明する各図面において、同一の部材には同一の符号を付し、その繰り返しの説明は省略する。

【0025】

まず、本発明に係るメタデータ基盤のオンライン分析処理システムを実施するための全体システムを、図１を参照して説明する。

【0026】

図１に示すように、本発明を実施するための全体システムは、ユーザが使用するビッグデータを保存するデータキューブ６０と、メタデータを保存するメタデータベース（以下、「メタＤＢ」）４０と、ユーザ端末２０と、オンライン上でレポート作成サービスを提供し、レポートを分析するＯＬＡＰサーバ３０とで構成される。

【0027】

まず、データキューブ６０は、通常のデータベース（またはデータウェアハウス、データキューブ）であり、企業などがビジネスを行うことで蓄積されるデータを保存する。以下では、データキューブ６０に保存されるデータをビッグデータとして呼ぶことにする。好ましくは、データキューブ６０は、関係データベース（ＲＤＢ：ｒｅｌａｔｉｏｎａｌｄａｔａｂａｓｅ：リレーショナルデータベース）により構成されてもよい。

【0028】

好ましくは、データキューブ６０は多数のＤＢテーブルで構成され、各ＤＢテーブルは多数のレコードで構成され、各レコードが一つの情報または一連のデータを示す。すなわち、各レコードは多数のフィールドで構成され、各フィールドにフィールド値が保存される。一方、一つのＤＢテーブルに属する全てのレコードは、同一のフィールドを有する。すなわち、１つのＤＢテーブルは多数のフィールドを有し、ＤＢテーブルに記録されるレコードは、ＤＢテーブルのフィールドにフィールド値を保存する。

【0029】

また、データキューブ６０は、データ（またはビッグデータ）を管理するためのデータベース管理システム（ＤＢＭＳ：ｄａｔａｂａｓｅｍａｎａｇｅｍｅｎｔｓｙｓｔｅｍ）を備え、データの保存、削除、検索などの作業をクエリを用いて行う。特に、データキューブ６０は、商用化されたデータベースであり、データを処理するための一般的なクエリ機能を用いてデータクエリサービスを行う。すなわち、クエリは、ＤＢテーブルと、当該ＤＢテーブルに対する参照項目（フィールドなど）とにより定義されるか設定される。

【0030】

次に、メタＤＢ４０は、メタデータ（またはメタメタデータ、メタデータ）を保存するための通常のデータベース（ＤＢ）であり、データキューブ６０のビッグデータを参照するためのＤＢテーブル関係及び参照項目についての情報を示すメタデータ（またはメタメタデータ、メタデータ）を保存する。

【0031】

メタデータとは、クエリを作成するために参照すべきＤＢテーブル及び、当該参照項目、条件などを定義したデータのことをいう。特に、ＤＢテーブルが少なくとも２つである場合には、ＤＢテーブル間の関係も定義される。すなわち、メタデータは、クエリの作成に用いられるＤＢテーブル、テーブル間の関係、参照項目（参照するフィールド）、条件などを記録したデータである。

【0032】

ユーザは、データキューブ６０から自分が必要とするデータを抽出するために、メタデータを用いて簡単にクエリを作成することができる。すなわち、メタデータにおいてＤＢテーブル、テーブル間の関係、参照項目が定義されているので、ユーザは参照項目を自分が所望する出力形態として定義したり、一部の条件を簡単に訂正して所望のクエリを作成したりできる。なお、後述するＯＬＡＰサーバ３０は、グラフィカルユーザインタフェース(ＧＵＩ：ＧｒａｐｈｉｃａｌＵｓｅｒＩｎｔｅｒｆａｃｅ)を用いてドラッグ＆ドロップで簡単にクエリを作成するようにサポートしている。

【0033】

また、メタＤＢ４０は、当該メタデータによって生成されたレポート情報を保存する。ユーザは、メタデータを用いてクエリを作成し、クエリを用いて所望のデータ（またはビッグデータ）を取り込む。そして、ビッグデータの分析結果をレポートとして作成する。このように、メタデータによってレポートが生成されると、当該メタデータについて作成されたレポート情報を追加的に記録して保存する。

【0034】

ユーザ端末３０は、パーソナルコンピュータ（ＰＣ）、タブレットＰＣ、スマートフォンなどのコンピューティング機能を有するコンピュータ端末であり、ＯＬＡＰサーバ３０とネットワーク（図示せず）により接続されて、オンライン上でレポートの作成作業を行う。このとき、ユーザ端末３０には、ＯＬＡＰサーバ３０と連動してレポートの作成作業を処理するクライアント（図示せず）がインストールされ、クライアントによりレポートの作成作業が処理できる。

【0035】

また、ユーザ端末３０は、メタデータの検索、ビッグデータの要請、ビッグデータの分析などのオンライン上でビッグデータ関連作業をＯＬＡＰサーバ３０に要請し、その結果をＯＬＡＰサーバ３０から取得してＷｅｂブラウザ上に表示する。

【0036】

次に、ＯＬＡＰサーバ３０は、オンライン分析処理（ＯＬＡＰ）を行うサーバであり、ユーザ端末３０からメタデータ検索、ビッグデータクエリなどに対する要請を受信し、当該検索またはクエリ要請を処理してその結果をユーザ端末３０に送信するサーバである。

【0037】

特に、ＯＬＡＰサーバ３０は、ビッグデータを要請するクエリ（またはデータ参照質問）を用いて、データキューブ６０に保存されているビッグデータを取り込む。クエリとは、データキューブ６０に保存されているビッグデータの検索または更新時に発生する問い合わせを記述するデータ操作言語を意味する。データベースにおいて、クエリは、一種の命令語のような役割を果たす。関係データベースの構造化問い合わせ言語（ＳｔｒｕｃｔｕｒｅｄＱｕｅｒｙＬａｎｇｕａｇｅ：以下、「ＳＱＬ」）の形式で表現されるが、場合によっては、ＳＱＬ以外の他の形式で表現されてもよい。

【0038】

また、ＯＬＡＰサーバ３０は、メタデータをメタＤＢ４０から検索し、検索されたメタデータを取り込み、当該メタデータによりクエリ作成環境を設定する。すなわち、参照するＤＢテーブル、テーブル間の関係、及び参照する項目などを設定する。好ましくは、このようなクエリ作成環境をＧＵＩ形態で表示する。ユーザは、ＯＬＡＰサーバ３０に設定されたクエリ作成環境下で簡単な操作（ドラッグ＆ドロップなど）により自分が所望するデータを処理するクエリを作成することができる。

【0039】

また、ＯＬＡＰサーバ３０は、クエリを用いてデータキューブ６０から取り込んだビッグデータを使用することで、レポートを作成できる著作環境をサポートする。

【0040】

また、ＯＬＡＰサーバ３０は、メタデータの頻度を用いてレポートの重要度を演算する。メタデータは、クエリの作成と関連して、ＤＢテーブル、テーブル間の関係、参照項目、条件、作成されたレポートなどに対するデータを有する。ＯＬＡＰサーバ３０は、これらのデータを用いてレポートの重要度などを分析する。

【0041】

次に、本発明の一実施例に係るメタデータ基盤のオンライン分析処理システムの構成を、図２を参照して説明する。

【0042】

図２に示すように、本発明の一実施例に係るメタデータ基盤のオンライン分析処理システム３０は、メタデータ構成部３１と、クエリ作成部３３と、レポート作成部３４と、レポート分析部３５とで構成される。

【0043】

メタデータ構成部３１は、データキューブ６０のビッグデータを参照するために作成されるテーブル関係図及び参照項目をメタデータとして構成して保存する。好ましくは、前記メタデータをキーワードで検索するためにデータベース化して構築する。

【0044】

メタデータ構成部３１は、メタデータを管理者（デザイナー）により作成してもよく、メタデータを自動的に構成してもよい。

【0045】

例えば、メタデータ構成部３１は、データキューブ６０のデータを参照するために作成されるクエリ（テーブル関係図及び参照項目など）からメタデータを構成して保存する。ユーザは、レポート作成のための新しいクエリを作成してよく、検索されたメタデータを訂正して新しいクエリを作成してもよい。このとき、保存されているメタデータとは異なる形態のテーブル関係図及び参照項目などが構成されると、このテーブル関係図及び参照項目を新しいメタデータとして追加してもよい。また、メタデータは、他のオンライン分析処理（ＯＬＡＰ）で作成されるテーブル関係図及び参照項目のデータを収集して構成されてもよい。

【0046】

特に、メタデータは、データキューブ６０を参照するＤＢクエリ文（例えば、ＳＱＬ文など）から自動的に抽出できる。参照項目は、クエリ文の参照項目（例えば、ＳＥＬＥＣＴ文に記載された参照項目）から抽出し、テーブル関係図は、前記クエリ文において参照するＤＢテーブル及びＤＢテーブル間のフィールド条件から抽出できる。

【0047】

メタデータは、基本的にテーブル関係図及び参照項目で構成される。

【0048】

また、テーブル関係図は、ＤＢテーブル及びジョイン（ｊｏｉｎ）（またはリンク）関係により構成される。テーブル関係図は、通常の実体関連モデル（ＥＲＤ:Ｅｎｔｉｔｙ−ｒｅｌａｔｉｏｎｓｈｉｐＭｏｄｅｌ）と類似している。但し、特定の目的のデータ（データキューブのデータ）を参照するために、ＤＢテーブルのジョイン（ｊｏｉｎ）関係を予め定義して、自動的にＳＱＬを生成できるジョイン関係を設定しておく。

【0049】

ＤＢテーブルとは、データキューブ６０に構成されるテーブルのことをいう。ＤＢテーブルは、通常のデータベーステーブルであり、多数のカラム（またはフィールド）で構成され、ＤＢテーブルの各データは各フィールドの値を有する。

【0050】

ジョイン関係は、少なくとも２つのＤＢテーブル間のジョイン（ｊｏｉｎ）を行うための条件のことであり、ＤＢテーブルのフィールド間の条件として表示される。ジョイン関係は、通常のデータベースにおけるジョイン関係であり、具体的説明は省略する。

【0051】

図３は、テーブル関係図を例示している。図３に示すように、４つのＤＢテーブルで構成されている。すなわち、＜職員（Ｅｍｐｌｙｅｅ）＞、＜給与（Ｓａｌａｒｙ）＞、＜住所（Ａｄｄｒｅｓｓ）＞、および＜職位（Ｗｏｒｋｐｏｓｉｔｉｏｎ）＞の４つのＤＢテーブルで構成される。また、ジョイン関係として、＜職員−給与＞、＜職員−住所＞、＜職員−職位＞間にそれぞれの関係を有する。＜職員−給与＞関係では、社員番号フィールドが同一であることを条件とし、＜職員−住所＞の関係では、住所コードフィールドが同一であることを条件とし、＜職員−職位＞の関係では、職位コードフィールドが同一であることを条件とする。

【0052】

参照項目は、データキューブ６０のデータを参照するための項目であり、ＤＢテーブルのフィールド項目と、前記フィールド項目を加工して取得する派生項目とで構成される。すなわち、参照項目は、ユーザが参照項目として選択したテーブルのカラム名（フィールド名）、またはユーザがカラム名（フィールド名）などを利用して定義した参照項目（派生項目）で構成される。

【0053】

一方、参照項目は、次元（ｄｉｍｅｎｓｉｏｎ）形式と測定値（ｍｅａｓｕｒｅ）形式とに分けられる。好ましくは、参照項目（またはカラム）の値が文字である場合、次元形式で指定し、参照項目の値が数値である場合、測定値形式で指定する。

【0054】

ＯＬＡＰキューブ（ｃｕｂｅ）定義やデータウエアハウス（ＤＷ：Ｄａｔａｗａｒｅｈｏｕｓｅ）においてテーブルの各カラムは、次元（ｄｉｍｅｎｓｉｏｎ）形式と測定値（Ｍｅａｓｕｒｅ）形式とに事前に分類されて設定されてもよい。特に、次元は構造化されたラベル情報を提供する。前記のように、データキューブ６０に、ＤＢテーブルのフィールド（またはカラム）に対して事前に次元形式または測定値形式で設定されている場合は、当該設定に基づいて参照項目の形式が設定される。

【0055】

一方、測定値は、整列されていない数値、数値演算が可能な値を意味する。必ずしも全ての場合に文字列値が次元になり、数値が測定値になるわけではない。例えば、製品番号という項目は数値であるが次元形式として分類される（すなわち、製品番号を数値演算することができない）。また、文字列項目をカウント（ｃｏｕｎｔ）する場合（例えば、登録ユーザ数はユーザ名ｃｏｕｎｔ）、測定値形式として分類されるべきである。自動的に分類する基準は文字列または数値であり、ユーザまたは管理者により当該参照項目の形式が補正できる。

【0056】

図３の例を参照すると、カラム名＜職位名＞、＜氏名＞、＜マイナンバー１＞、＜年月＞、＜郵便番号＞、＜住所_都道府県＞、＜住所_市区町村＞は、次元形式の項目であり、カラム名＜基本給＞、＜手当＞は、測定値形式の項目である。

【0057】

参照項目を次元形式と測定値形式とに分ける理輔は、次元別に測定値がグループ（ａｇｇｒｅｇａｔｉｏｎ）となるからである。参照項目の定義によれば、測定値形式の参照項目はグループ関数（ＡｇｇｒｅｇａｔｉｏｎＦｕｎｃｔｉｏｎ）属性を有する。ここで、グループ関数とは、合計（ＳＵＭ）、最小値（ＭＩＮ）、最大値（ＭＡＸ）、平均（ＡＶＧ）、カウント（ｃｏｕｎｔ）,distinct count などをいう。また、ピボットテーブルにおけるデータ領域には、グループ関数により計算された値が表示される。

【0058】

例えば、２つの次元形式の参照項目が１つの測定値形式の参照項目を選択すると、クエリ文（ＳＱＬ）は、下記のように生成される。

【0059】

[クエリ文１]
Ｓｅｌｅｃｔｄｉｍ１、ｄｉｍ２ｓｕｍ（ｍｅａｓｕｒｅ）ｆｒｏｍｔａｂｌｅ
Ｇｒｏｕｐｂｙｄｉｍ１、ｄｉｍ２
図３の例において、＜人事及び給与情報＞メタデータの場合、＜基本給＞測定値の参照項目のみを選択した場合、結果データは、全職員の基本給となり、氏名（次元）、基本給（測定値）を選択した場合、氏名別基本給の合計となる。また、氏名（次元）、年月（次元）、基本給（測定値）を選択した場合、氏名別、年月別の基本給データが照会される。

【0060】

一方、データキューブのデータを参照するためのクエリにおいて、参照されたカラムだけを参照項目として選定される。すなわち、必ずしもＤＢテーブルの全てのカラムが参照項目として選定されるわけではない。図３の例において、参照項目としては、ＤＢのテーブルにおいてチェック表示されたフィールド、すなわち、＜職位名＞、＜氏名＞、＜マイナンバー１＞、＜年月＞、＜郵便番号＞、＜住所_都道府県＞、＜住所_市区町村＞、＜基本給＞、＜手当＞などだけが選定される。＜職員（Employee）＞テーブルの＜マイナンバー２＞、＜入社日付＞、＜部署コード＞などは、参照項目として選定されない。

【0061】

次に、派生項目とは、ＤＢテーブルのカラム（またはフィールド）に対する演算によりテーブル内にない項目を派生的に作り出したもののことをいう。派生項目も一つの参照項目であり、次元形式と測定値形式とに分けられる。

【0062】

次元形式として派生させた参照項目の例を挙げると、＜期間＞テーブル内に＜年月＞というカラムが存在する場合、下記のように＜年度＞、＜月＞などを派生項目として作成することができる。

【0063】

＜年度＞：ｓｕｂｓｔｒ（＜年月＞、１,４）
＜月＞：ｓｕｂｓｔｒ（＜年月＞、５,２）
また、測定値形式として派生させた参照項目の例として、計算式を用いた参照項目が生成できる。例えば、ＤＢテーブルに＜生産量＞、＜処理量＞カラムが存在する場合、＜実收率＞カラムを計算式を用いて派生項目として生成することができる。

【0064】

＜実收率＞：＜生産量＞／＜処理量＞×１００
好ましくは、メタデータの参照項目をテーブルで構成して保存してもよい。具体的には、図４に示すように、メタデータの参照項目は、メタデータの名前であるメタデータ名、参照項目の名前である参照項目名、ＤＢテーブルの名前であるテーブル名、テーブル内の参照フィールドであるカラム名、次元／測定値形式を示す形式、計算式を用いる派生項目である場合、当該計算式を表示する数式などで構成される。

【0065】

好ましくは、数式は、派生項目の数式（Ｆｏｒｍｕｌａ）属性として保存する。保存された数式は、後ほどメタデータを再利用して自動的にクエリ文（ＳＱＬ）を作成する際にそのまま用いられる。一方、数式は、ＳＱＬ文法のそのままの数式を使用してもよく、標準化された数式で管理して、データキューブ（またはデータベース）の種類に適したクエリ文（ＳＱＬ）に自動的に変更してもよい。ＤＢ種類別に提供される関数（ｆｕｎｃｔｉｏｎ）の文法が異なる場合があるからである。例えば、ＳＵＢＳＴＲＩＮＧ関数が、オラクル（商標ＯＲＡＣＬＥ）ではＳＵＢＳＴＲであり、ＭＳ−ＳＱＬではＭＩＤであるようにそれぞれ異なってもよい。

【0066】

次に、クエリ作成部３３は、ユーザにより選択されたメタデータの参照項目だけでクエリを構成できるインターフェース画面（以下、クエリデザイン画面）を表示する。特に、クエリデザイン画面は、ドラッグ・アンド・ドロップ（ｄｒａｇ＆ｄｒｏｐ）方式によるインタフェースを有する。

【0067】

図５に示すように、クエリデザイン画面は、メタデータの参照項目を表示する領域（以下、「項目表示領域」）と、選択された参照項目を表示する領域（以下、「選択表示領域」）とで構成される。選択された参照項目領域（または選択表示領域）は、次元形式（次元領域）と測定値形式（またはデータ領域）とに分けられて表示される。好ましくは、選択された参照項目の領域には、フィルタリングにより選択される参照項目を表示するフィルター領域がさらに含まれてもよい。

【0068】

クエリデザイン画面において、ドラッグ・アンド・ドロップ方式により項目表示領域に表示される参照項目が選択され、選択表示領域に選択された参照項目が表示される。

【0069】

クエリ作成部３３は、クエリデザイン画面上での選択表示領域に、選択された参照項目が表示されると、自動的にクエリ文を生成する。ユーザが＜氏名＞、＜年月＞、＜基本給＞を選択した場合について説明する。当該キーワードを参照項目として有しているテーブル関係のメタデータを用いて自動的にクエリ文（ＳＱＬ）が生成される。この時、参照項目の属性として、メタデータに定義された次元、測定値、グループ関数を基準としてグループ化し、データ件数を次元の固有値で最小化し、データキューブにデータを照会してレポートを作成する。ＳＱＬ文に必要なジョイン（ｊｏｉｎ）構文の場合、テーブル関係のメタデータに何百個のテーブルが定義されていても、選択した参照項目を有するテーブルだけが関係メタデータ関係図において最小全域木（Ｍｉｎｉｍｕｍｓｐａｎｉｎｇｔｒｅｅ）アルゴリズムであり、テーブル間の最小のジョイン（ｊｏiｎ）によりＳＱＬが生成される。

【0070】

図５の例において、メタデータのテーブル関係図により下記のようなクエリ文（ＳＱＬ）が自動的に生成され、データキューブ６０のデータを自動的に照会することができる。

【0071】

[クエリ文]
ＳＥＬＥＣＴＢ．氏名、Ｃ.年月、ｓｕｍ（Ｃ．基本給）ｆｒｏｍＦ_ｅｍｐｌｏｙｅｅＢ，Ｆ_ＳＡＬＡＲＹＣ
Ｗｈｅｒｅｂ．社員番号＝ｃ．社員番号
ＧｒｏｕｐｂｙＢ．氏名、Ｃ．年月
また、クエリデザイン画面の項目表示画面には、メタデータの参照項目だけが表示される。すなわち、参照項目を含むＤＢテーブル内の参照項目以外の他のカラム名は表示されない。これは、ＤＢのテーブル内には、エンドユーザ（ｅｎｄ−ｕｓｅｒ）に公開してはならない情報もあり得るからある。すなわち、本発明によってデータのセキュリティが強化できる。

【0072】

メタデータの参照項目は、実際のテーブルには存在しない論理的な束（フォルダ）により階層的に構成され、このような構成には、ユーザにとって項目を選択しやすいように分離して表示する機能も含まれてもよい。図６の例では、＜Ｄｉｍｅｎｓｉｏｎ＞、＜組織＞、＜期間＞、＜商品＞、＜担保＞などの論理的なグループをフォルダ形態に分けて参照項目を選択できるようにユーザに提供する。

【0073】

次に、レポート作成部３４は、ユーザによって一つのメタデータが選択されると、選択されたメタデータの参照項目だけでピボットテーブルを構成できるインターフェース画面（以下、「ピボットデザイン画面」）を表示する。特に、ピボットデザイン画面は、ドラッグ・アンド・ドロップ（ｄｒａｇ＆ｄｒｏｐ）方式によるインタフェースを有する。

【0074】

図７に示すように、ピボトデザイン画面は、メタデータの参照項目を表示する領域（以下、「項目表示領域」）と、選択された参照項目を表示する領域（以下、「選択表示領域」）とで構成される。選択された参照項目領域（または選択表示領域）は、カラム領域と、行領域と、データ領域とに区分される。または、ページ領域にさらに区分されてもよい。

【0075】

また、前述したクエリデザイン画面と同様に、ピボットデザイン画面の項目表示画面には、メタデータの参照項目だけが表示される。すなわち、参照項目を含むＤＢテーブル内の参照項目以外のカラム名は表示されない。また、メタデータの参照項目は、実際のテーブルには存在しない論理的な束（フォルダ）により階層的に構成され、このような構成には、ユーザにとって項目を選択しやすいように分離して表示する機能も含まれてもよい。

【0076】

ピボットデザイン画面では、ドラッグ・アンド・ドロップ方式により項目表示領域に表示される参照項目が選択され、選択表示領域に選択された参照項目が表示される。

【0077】

ページ領域において選択した参照項目の値により、現在表示された行、列、データ領域に表示された値をフィルタリングできる機能が提供される。たとえば、「年月」を参照項目をページ領域に配置した場合、ページ領域において「２０１３年１２月」を選択して当該年月のデータのみを確認する機能が行われ、この機能は、エクセルピボットテーブルのページ領域の機能と同様の機能である。

【0078】

また、カラム領域、行領域、データ領域は、ピボットテーブルにおいてそれぞれ列、行、データのフィールドに対応される。すなわち、カラム領域、行領域、データ領域としてそれぞれ選択された参照項目がそれぞれピボットテーブルのカラム、行、データフィールドとして定められる。ピボットテーブルは、通常のピボットテーブル（例えば、マイクロソフト社のエクセルにおけるピボットテーブルなど）の方法を使用するので、具体的な説明は省略する。

【0079】

このとき、カラム領域及び行領域には、次元形式の参照項目だけが選択されて表示され、データ領域には、測定値形式の参照項目だけが選択されて表示され得る。

【0080】

レポート作成部３４は、ピボットデザイン画面上での選択表示領域に、選択された参照項目が表示されると、自動的にピボットテーブルまたはピボットレポートを生成する。ピボットレポートの例は、図８に示されている。

【0081】

ユーザが選択した参照項目のうち測定値形式の参照項目は、データ領域に自動的に配置され、次元項目値のうちの２つは行領域、１つは列領域、残りの次元はページ領域に自動的に配置される。また、このような配置により、ピボットレポートを自動生成する。
自動生成の後には、既存の他のツールが提供する方法を用いて、ユーザ所望の配置に変更してＯＬＡＰ分析を行うことができる。その後、新規項目を追加して分析したい場合、編集モードに変更すると、既存のキーワードで検索し、自動配置された参照項目の表示領域（表示窓）が現れ、参照項目を追加することができる。

【0082】

すなわち、ユーザは、メタデータの参照項目（またはメタフィールドデータ）を照会し、当該参照項目を用いて様々な観点からデータを分析することができる。ＯＬＡＰサーバ３０は、クエリを自動的に作成し、内部的にキューブを作成して、その結果を多次元グリッドの形状としてユーザまたはユーザ端末２０に伝達する。

【0083】

次に、レポート分析部３５は、メタデータ、メタデータ内の参照項目、及び生成されたレポートに対するデータを用いて各レポートの重要度を算出する。

【0084】

図９に示すように、レポート分析部３５は、（ａ）ＤＢのテーブルの加重値算出ステップ（Ｓ１０）、（ｂ）メタデータの頻度計算ステップ（Ｓ２０）、及びレポートの評価ステップ（Ｓ３０）を行うことによりレポートを分析する。

【0085】

まず、ＤＢテーブルに対する加重値を算出する（Ｓ１０）。

【0086】

メタデータを構成するテーブル情報には、リンク（ジョイン）情報がある。メタデータは、図１０に示すようなＤＢテーブル構造のデータを有すると仮定する。

【0087】

図１０の例において、販売（Ｓａｌｅｓ）テーブルと、製品（Ｐｒｏｄｕｃｔ）テーブルのテーブル加重値（リンク加重値）を計算すると、以下の通りである。

【0088】

初期に全てのテーブルは数値１を有し、リンクに沿って連結されたテーブルに数値を伝播する。この時、接続されたリンクの数だけ分けて有する。販売（Ｓａｌｅｓ）テーブルと製品（Ｐｒｏｄｕｃｔ）テーブルの加重値は、下記のように計算する。

【0089】

Ｓａｌｅｓ加重値＝Ｐｒｏｄｕｃｔ（２／３）＋Ｓｔｏｒｅ（１／２）＋Ｐｅｒｉｏｄ（１／１）＋Ｐｒｏｍｏｔｉｏｎ（１／１）＝３.１６
Ｐｒｏｄｕｃｔ加重値＝Ｓａｌｅｓ（２／５）＋Ｃｌａｓｓ（１／１）＝１.４
ＤＢテーブルの全体集合Ｔを下記のように定義する。

【0090】

Ｔ＝{Ｔ_１、Ｔ_２、Ｔ_３、...、Ｔ_Ｎ}
また、メタデータ内に含まれている参照項目Iを下記のように定義する。

【0091】

I＝{I_１、I_２、I_３、...、Ｉ_Ｍ}
また、Ｉ_ｊ∈Ｔ_ｉは、参照項目Ｉ_ｊがＤＢテーブルＴ_ｉによる参照項目であることを示すものであると定義する。すなわち、参照項目Ｉ_ｊは、ＤＢテーブルＴ_ｉのフィールドであるか、これから生成された参照項目であることを示す。

【0092】

また、メタデータによって生成されたレポートＲを下記のように定義する。

【0093】

Ｒ={Ｒ_１、Ｒ_２、Ｒ_３、...、Ｒ_Ｋ}
また、Ｉ_ｊ∈Ｒ_ｉは、参照項目Ｉ_ｊがレポートＲ_ｋによる参照項目であることを示すものであると定義する。

【0094】

このとき、ＤＢテーブルＴ_ｉの加重値ω_ｉは、下記の数学式１により計算される。

【0095】

【数3】

【0096】

式中、{Ｌ（Ｔ_ｋ）}は、テーブルＴ_ｋのリンク集合を意味し、{Ｌ（Ｔｉ、Ｔ_ｋ）}は、テーブルＴ_ｉとテーブルＴ_ｋとの間のリンク集合を意味する。また、ｎ（）は、集合の個数を示す。

【0097】

また、リンクは、２つのＤＢテーブル間のジョイン（ｊｏｉｎ）のためのフィールド（参照項目）間の連結（条件）を意味する。前記図１０の例において、販売（Ｓａｌｅｓ）テーブルのリンク数は５つであり、製品（Ｐｒｏｄｕｃｔ）テーブルのリンク数は３つである。また、製品テーブルと販売テーブルとの間のリンク数は２つであることが確認される。すなわち、製品テーブルと販売テーブルとの間のジョインは、ｃｌａｓｓｋｅｙとｐｒｏｋｅｙの２つのフィールド（参照項目）により連結（リンク）される。
次に、レポートに使用される参照項目の頻度を計算する（Ｓ２０）。重要なメタデータの参照項目であるほど頻繁に使用されるであろう。参照項目が使用されたレポートの数及び全体レポートの数を用いて計算する。

【0098】

まず、参照項目のレポートへの使用割合を下記のように求める。

【0099】

【数4】

【0100】

すなわち、参照項目のレポートへの使用割合は、全体レポートの数に対する、当該参照項目が使用されたレポートの数の割合を示す。
また、参照項目の重要度は、下記の数学式３のように算出する。

【0101】

【数5】

【0102】

すなわち、参照項目の使用割合に、参照項目を含むテーブルの加重値の和を加重し、レポートに使用された全体参照項目の数で除算する。

【0103】

次に、レポートの重要度を算出する（Ｓ３０）。

【0104】

ピボットテーブルにおけるデータ領域において当該セルに結果がなければ、「−」と表示される。結果がないということは、レポートを間違って配置した場合に該当する。このような場合を最小限にするのが良いレポートであると言える。

【0105】

したがって、データ領域のセルに対する結果を考慮した上、下記の数学式４のように算出する。

【0106】

【数6】

【0107】

但し、式中、ＮＡセルは、データ領域のセルのうち値が表示されないセルを示す。セル又はＮＡセルは、レポートＲ_ｋにおいてピボットテーブルのデータ領域のセルを示す。

【0108】

そして、セルの結果がすべてＮＡであれば、レポートの重要度は０となる。

【0109】

以上、本発明者によってなされた発明を実施例に基づき具体的に説明したが、本発明は前記実施例に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。

【0110】

本発明は、以下のような国家研究開発事業の支援課題と関連しているものであることを明らかにする。
［この発明を支援した国家研究開発事業］
［課題固有番号］Ｒ０１１３−１５−０００５
［部処庁］韓国の未来創造科学部
［研究管理専門機関］韓国の情報通信技術振興センター
［研究事業名］情報通信、放送研究開発事業
［研究課題名］大規模なトランザクション処理とリアルタイム複合分析を統合した一体型データエンジニアリング技術開発
［寄与率］１／１
［主管機関］韓国電子通信研究院
［研究期間］２０１５年１０月０１日〜２０１９年０９月３０日

【符号の説明】

【0111】

２０ユーザ端末
３０ＯＬＡＰサーバ
４０メタＤＢ
６０データキューブ

【図1】