(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-12
(54)【発明の名称】分析データの自動洞察を生成するためのシステムおよび方法
(51)【国際特許分類】
G06F 16/28 20190101AFI20240905BHJP
G06Q 10/063 20230101ALI20240905BHJP
【FI】
G06F16/28
G06Q10/063
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024515424
(86)(22)【出願日】2022-09-09
(85)【翻訳文提出日】2024-04-25
(86)【国際出願番号】 US2022043135
(87)【国際公開番号】W WO2023039212
(87)【国際公開日】2023-03-16
(32)【優先日】2021-09-10
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】502303739
【氏名又は名称】オラクル・インターナショナル・コーポレイション
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】ライオンズ,フィリップ
(72)【発明者】
【氏名】バスデバン,ラメシュ
(72)【発明者】
【氏名】ジョシ,ルトゥジャ
(72)【発明者】
【氏名】ベンカタラマン,ラリサ
(72)【発明者】
【氏名】ビーマナパリ,カルヤン
(72)【発明者】
【氏名】サーブ,ニキル
(72)【発明者】
【氏名】マミラパリ,ラクシュミナグ
(72)【発明者】
【氏名】エング,ケネス
(72)【発明者】
【氏名】リチャードソン,アラン
【テーマコード(参考)】
5B175
5L010
【Fターム(参考)】
5B175FB04
5L010AA20
(57)【要約】
分析データの自動洞察を生成するためのシステムおよび方法が本明細書で説明される。一般に、データをアップロードするか、分析環境にリンクするかアクセスできるようにする場合、有意義なデータ視覚化を生成するには熟練したユーザが必要である。本明細書で説明されるシステムおよび方法は、表示および選択のために、意味のあるデータ視覚化のセットを生成するための自動機構を提供し、前記生成は、決定された指標のセット、スコア付けされたデータ列、およびスコア付けされた視覚化に基づく。
【特許請求の範囲】
【請求項1】
分析データの自動洞察を生成するためのシステムであって、
テナントによるデータの記憶のために、分析アプリケーション環境によるデータウェアハウスへのアクセスを提供する、1つまたは複数のプロセッサを含むコンピュータ、を備え、
前記コンピュータは、前記分析アプリケーション環境において、複数の列を含むデータセットを受信し、
前記データセットの前記複数の列のそれぞれに対して統計のセットが計算され、
前記複数の列の各々についての統計の各セットに基づいて、前記複数の列の各列についてスコアが生成され、
前記複数の列のセットが選択され、前記選択は各列の前記スコアに基づいて行われ、
前記複数の列の選択されたセットに対して複数のデータ視覚化が生成され、
前記複数のデータ視覚化のセットは、ユーザインターフェースを介して表示するために、ルールのセットに基づいて選択される、システム。
【請求項2】
前記複数の列の各列に対して生成される前記スコアは、前記データセットの前記複数の列のそれぞれの統計の各セットを操作する構成可能なルールのセットを利用する、請求項1に記載のシステム。
【請求項3】
前記ユーザインターフェースを介して表示する前記複数のデータ視覚化を選択するために利用される前記ルールのセットは、視覚的コントラストの高いデータ視覚化を視覚的コントラストの低いデータ視覚化よりも高くスコア付けするルールを含む、請求項1に記載のシステム。
【請求項4】
前記複数の列の前記選択されたセットの各々は、測定値および指標のうちの1つを含む、請求項1に記載のシステム。
【請求項5】
前記複数の列の各々の基数は、前記複数の列の各々についての前記スコアを生成する際に利用される、請求項1に記載のシステム。
【請求項6】
前記複数の列の各々について前記スコアを生成する際にNULLパーセンテージがさらに利用される、請求項5に記載のシステム。
【請求項7】
前記複数のデータ視覚化の前記生成は、複数のデータ視覚化タイプを含む、請求項1に記載のシステム。
【請求項8】
前記生成された複数のデータ視覚化のうちの少なくとも1つは、前記生成された複数のデータ視覚化のうちの少なくとも1つで表される列に対して計算された統計のセットに基づいて選択されるデータ視覚化タイプを含む、請求項7に記載のシステム。
【請求項9】
分析データの自動洞察を生成するための方法であって、
テナントによるデータの記憶のために、分析アプリケーション環境によるデータウェアハウスへのアクセスを提供する、1つまたは複数のプロセッサを含むコンピュータを提供することと、
前記分析アプリケーション環境において、複数の列を含むデータセットを受信することと、
前記データセットの前記複数の列の各々について一連の統計を計算することと、
前記複数の列のそれぞれの統計の各セットに基づいて、前記複数の列の各列のスコアを生成することと、
前記複数の列のセットを選択することとを含み、前記選択は前記各列のスコアに基づいて行われ、
前記方法はさらに、
前記複数の列の前記選択されたセットに対して複数のデータ視覚化を生成することと、
ユーザインターフェースを介して表示するために、一連のルールに基づいて前記複数のデータ視覚化のセットを選択することと、を含む、方法。
【請求項10】
前記複数の列の各列に対して生成される前記スコアは、前記データセットの前記複数の列の各々の統計の各セットを操作する構成可能なルールのセットを利用する、請求項9に記載の方法。
【請求項11】
前記ユーザインターフェースを介して表示する前記複数のデータ視覚化を選択するために利用される前記ルールのセットは、視覚的コントラストの高いデータ視覚化を視覚的コントラストの低いデータ視覚化よりも高くスコア付けするルールを含む、請求項9に記載の方法。
【請求項12】
前記複数の列の前記選択されたセットの各々は、測定値および指標のうちの1つを含む、請求項9に記載の方法。
【請求項13】
前記複数の列の各々の基数は、前記複数の列の各々についての前記スコアを生成する際に利用される、請求項9に記載の方法。
【請求項14】
前記複数の列の各々について前記スコアを生成する際にNULLパーセンテージがさらに利用される、請求項13に記載の方法。
【請求項15】
前記複数のデータ視覚化の前記生成は、複数のデータ視覚化タイプを含む、請求項9に記載の方法。
【請求項16】
前記生成された複数のデータ視覚化のうちの少なくとも1つは、前記生成された複数のデータ視覚化のうちの少なくとも1つで表される列に対して計算された統計のセットに基づいて選択されるデータ視覚化タイプを含む、請求項15に記載の方法。
【請求項17】
命令を有する非一時的なコンピュータ可読記憶媒体であって、前記命令は、1つまたは複数のプロセッサを含むコンピュータによって読み取られて実行されると、前記コンピュータに、
テナントによるデータの記憶のために、分析アプリケーション環境によるデータウェアハウスへのアクセスを提供する、1つまたは複数のプロセッサを含むコンピュータを提供することと、
前記分析アプリケーション環境において、複数の列を含むデータセットを受信することと、
前記データセットの前記複数の列の各々について一連の統計を計算することと、
前記複数の列のそれぞれの統計の各セットに基づいて、前記複数の列の各列のスコアを生成することと、
前記複数の列のセットを選択することとを含む方法を実行させ、前記選択は前記各列のスコアに基づいて行われ、
前記方法はさらに、
前記複数の列の前記選択されたセットに対して複数のデータ視覚化を生成することと、
ユーザインターフェースを介して表示するために、一連のルールに基づいて前記複数のデータ視覚化のセットを選択することと、を含む、非一時的なコンピュータ可読記憶媒体。
【請求項18】
前記複数の列の各列に対して生成される前記スコアは、前記データセットの前記複数の列の各々の統計の各セットを操作する構成可能なルールのセットを利用し、
前記ユーザインターフェースを介して表示する前記複数のデータ視覚化を選択するために利用される前記ルールのセットは、視覚的コントラストの高いデータ視覚化を視覚的コントラストの低いデータ視覚化よりも高くスコア付けするルールを含む、請求項17に記載の非一時的なコンピュータ可読記憶媒体。
【請求項19】
前記複数の列の各々の基数は、前記複数の列の各々についての前記スコアを生成する際に利用され、
前記複数の列の各々について前記スコアを生成する際にNULLパーセンテージがさらに利用される、請求項17に記載の非一時的なコンピュータ可読記憶媒体。
【請求項20】
前記複数のデータ視覚化の前記生成は、複数のデータ視覚化タイプを含み、
前記生成された複数のデータ視覚化のうちの少なくとも1つは、前記生成された複数のデータ視覚化のうちの少なくとも1つで表される列に対して計算された統計のセットに基づいて選択されるデータ視覚化タイプを含む、請求項17に記載の非一時的なコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
著作権表示
この特許文書の開示の一部には、著作権保護の対象となる内容が含まれている。著作権所有者は、特許商標庁の特許ファイルまたは記録に記載されている特許文書または特許開示のファクシミリ複製に異議を唱えないが、それ以外の場合はすべての著作権を留保する。
【0002】
優先権の主張
本出願は、2021年9月10日に提出された「分析データの自動洞察を生成するためのシステムおよび方法」と題する米国特許仮出願、出願番号63/243,012に対する優先権の利益を主張し、この出願およびその内容は、参照により本明細書に組み込まれる。
【0003】
技術分野
本明細書で説明される実施形態は、一般に、コンピュータデータ分析、ビジネスインテリジェンスデータを提供するコンピュータベースの方法、および分析データの自動洞察を生成するための分析アプリケーション環境で使用するためのシステムおよび方法に関する。
【背景技術】
【0004】
背景
データ分析により、大量のデータをコンピュータベースで調査でき、例えばデータから結論やその他の情報を導き出すことができる。例えば、ビジネスインテリジェンスツールを使用すると、ユーザが戦略的なビジネス上の意思決定を行える形式で、企業データを説明するビジネスインテリジェンスをユーザに提供できる。
【発明の概要】
【課題を解決するための手段】
【0005】
概要
一実施形態によれば、分析データの自動洞察を生成するためのシステムおよび方法が本明細書で説明される。一般に、データをアップロードするか、分析環境にリンクするかアクセスできるようにする場合、有意義なデータ視覚化(ビジュアリゼーション)を生成するには熟練したユーザが必要である。本明細書で説明されるシステムおよび方法は、表示および選択のために、意味のあるデータ視覚化のセットを生成するための自動機構を提供し、当該生成は、決定された指標のセット、スコア付けされたデータ列、およびスコア付けされた視覚化に基づく。
【図面の簡単な説明】
【0006】
【
図1】一実施形態によるデータ分析環境の例を示す図である。
【
図2】一実施形態によるデータ分析環境の例をさらに示す図である。
【
図3】一実施形態によるデータ分析環境の例をさらに示す図である。
【
図4】一実施形態によるデータ分析環境の例をさらに示す図である。
【
図5】一実施形態によるデータ分析環境の例をさらに示す図である。
【
図6】一実施形態による、データを変換、分析、または視覚化するためのシステムの使用を示す図である。
【
図7】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図8】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図9】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図10】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図11】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図12】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図13】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図14】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図15】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図16】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図17】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図18】一実施形態による、データ分析環境で使用するための例示的なユーザインターフェースを示す図である。
【
図19】一実施形態による、自動洞察機能の全体的なフローの図である。
【
図20】一実施形態による、自動洞察機能のユーザ体験のフローチャートである。
【
図21】一実施形態による、自動洞察機能のユーザ体験のフローチャートである。
【
図22】一実施形態による、自動洞察機能の例示的なデータ視覚化を示す図である。
【
図23】一実施形態による、分析データの自動洞察を生成する方法のフローチャートである。
【発明を実施するための形態】
【0007】
詳細な説明
一般に、組織内でのデータ分析により、大量のデータをコンピュータベースで調査し、データから結論やその他の情報を導き出すことができる。例えば、ビジネスインテリジェンス(BI:business intelligence)ツールを使用すると、ユーザが戦略的なビジネス上の意思決定を行える形式で、企業データを説明するビジネスインテリジェンスをユーザに提供できる。
【0008】
このようなビジネスインテリジェンスツール/サーバの例には、データマイニングや分析、分析アプリケーションなどの機能をサポートするためにデータベースと連携できるクエリ、レポート、分析サーバを提供するOracle Business Intelligence Applications(OBIA)、Oracle Business Intelligence Enterprise Edition(OBIEE)、またはOracle Business Intelligence Server(OBIS)が含まれる。
【0009】
データ分析は、Oracle Fusion Applications 環境などのエンタープライズソフトウェアアプリケーション環境のコンテキスト内で、またはサービスとしてのソフトウェア(SaaS:software-as-a-service)のコンテキスト内で、または、Oracle Analytics CloudやOracle Cloud Infrastructure環境などのクラウド環境で、または他のタイプの分析アプリケーションまたはクラウド環境で提供されることが増えている。
【0010】
導入
一実施形態によれば、データウェアハウス環境またはコンポーネント(Oracle Autonomous Data Warehouse(ADW)、Oracle Autonomous Data Warehouse Cloud(ADWC)など、または、大量のデータを記憶するのに適した他のタイプのデータウェアハウス環境やコンポーネント)は、1つまたは複数のビジネスアプリケーションによって収集されたデータを記憶するための中央リポジトリを提供できる。
【0011】
例えば、一実施形態によれば、データウェアハウス環境またはコンポーネントは、オンライン分析処理(OLAP:online analytical processing)または他の技術を使用して、複数の異なるデータソースからビジネス関連データを生成する多次元データベースとして提供され得る。組織は、そのようなビジネス関連データを1つまたは複数の垂直型および/または水平型ビジネスアプリケーションから抽出し、抽出されたデータをその組織に関連付けられたデータウェアハウスインスタンスに注入できる。
【0012】
水平型ビジネスアプリケーションの例には、上で説明したようにERP、HCM、CX、SCM、およびEPMが含まれ得、様々な企業組織にわたって広範な機能を提供する。
【0013】
垂直型ビジネスアプリケーションは通常、水平型ビジネスアプリケーションよりも範囲が狭いが、規定された範囲または業界内のデータチェーンのさらに上位または下位のデータへのアクセスを提供する。垂直型ビジネスアプリケーションの例には、特定の組織内で使用する医療ソフトウェアや銀行ソフトウェアなどが含まれ得る。
【0014】
Oracle ADWCなどの他のエンタープライズソフトウェア製品またはコンポーネントは、SaaS、サービスとしてのプラットフォーム(PaaS:platform-as-a-service)、またはハイブリッドサブスクリプションの1つまたは複数として提供できる一方で、ソフトウェアベンダは、エンタープライズソフトウェア製品やコンポーネントをSaaSまたはクラウド指向の製品(Oracle Fusion Applicationsなど)として提供することが増えているが、従来のビジネスインテリジェンスアプリケーションおよび処理を使用する企業ユーザは一般に、水平型および垂直型ビジネスアプリケーションからデータを抽出し、抽出したデータをデータウェアハウスに導入するというタスクに直面し、この処理は時間とリソースの両方を大量に消費する可能性がある。
【0015】
一実施形態によれば、分析アプリケーション環境により、顧客(テナント)は、BIコンポーネント(例えば、OBIS環境や、顧客(テナント)自体、または複数のサードパーティエンティティから調達される大量のデータを調べるのに適した他のタイプのBIコンポーネントなど)で使用するコンピュータ実行可能ソフトウェア分析アプリケーションを開発できる。
【0016】
別の例として、一実施形態によれば、例えば、事前規定されたダッシュボード、主要業績評価指標(KPI:key performance indicators)、または他のタイプのレポートを含めるために、分析アプリケーション環境を使用して、様々なビジネス生産性ソフトウェアアプリケーションのコンテキストでビジネス関連のデータオブジェクトを記述する関連メタデータをデータウェアハウスインスタンスのレポートインターフェースに事前設定することができる。
【0017】
データ分析
一般に、データ分析では、データから結論やその他の情報を導き出すために、大量のデータをコンピュータベースで検査または分析でき、一方、ビジネスインテリジェンスツール(BI:business intelligence tools)は、組織のビジネスユーザが戦略的なビジネス上の意思決定を行える形式でエンタープライズデータを説明する情報を組織のビジネスユーザに提供する。
【0018】
データ分析環境およびビジネスインテリジェンスツール/サーバの例には、データマイニングや分析、分析アプリケーションなどの機能をサポートするOracle Business Intelligence Server(OBIS)、Oracle Analytics Cloud(OAC)、Fusion Analytics Warehouse(FAW)などが含まれる。
【0019】
図1は、一実施形態によるデータ分析環境の例を示す。
図1に示される例示的な実施形態は、本明細書で説明される様々な実施形態を使用できるデータ分析環境の例を示す目的で提供される。他の実施形態および例によれば、本明細書で説明されるアプローチは、他のタイプのデータ分析、データベース、またはデータウェアハウス環境で使用することができる。
図1に示され、他の様々な実施形態に関して本明細書でさらに説明されるコンポーネントおよび処理は、例えば、クラウドコンピューティングシステム、または他の適切にプログラムされたコンピュータシステムによって実行可能なソフトウェアまたはプログラムコードとして提供され得る。
【0020】
図1に示すように、一実施形態によれば、データ分析環境100は、コンピュータハードウェア(例えば、プロセッサ、メモリ)101を有し、制御プレーン102およびデータプレーン104として動作する1つまたは複数のソフトウェアコンポーネントを含み、データウェアハウス、データウェアハウスインスタンス160(データベース161、または他のタイプのデータソース)へのアクセスを提供するコンピュータシステムによって提供されるか、またはそこで動作することができる。
【0021】
一実施形態によれば、制御プレーンは、例えば、Oracle Analytics Cloud環境、または他のタイプのクラウド環境など、SaaSまたはクラウド環境のコンテキスト内で提供されるクラウドまたは他のソフトウェア製品の制御を提供するように動作する。例えば、一実施形態によれば、制御プレーンは、顧客(テナント)によるアクセスを可能にするコンソールインターフェース110、および/またはプロビジョニングコンポーネント111を有するクラウド環境を含むことができる。
【0022】
一実施形態によれば、コンソールインターフェースは、グラフィカルユーザインターフェース(GUI:graphical user interface)および/またはコマンドラインインターフェース(CLI:command-line interface)または他のインターフェースを操作する顧客(テナント)によるアクセスを可能にすることができ、および/またはSaaSまたはクラウド環境のプロバイダとその顧客(テナント)が使用するインターフェースを含み得る。例えば、一実施形態によれば、コンソールインターフェースは、顧客がそのSaaS環境内で使用するためのサービスをプロビジョニングし、プロビジョニングされたサービスを構成できるようにするインターフェースを提供することができる。
【0023】
一実施形態によれば、顧客(テナント)は、データウェアハウス内の顧客スキーマのプロビジョニングを要求できる。顧客は、コンソールインターフェースを介して、必須属性(ログイン資格情報など)やオプションの属性(サイズや速度など)を含む、データウェアハウスインスタンスに関連付けられた多数の属性を提供することもできる。その後、プロビジョニングコンポーネントは、データウェアハウスの顧客スキーマを含む、要求されたデータウェアハウスインスタンスをプロビジョニングでき、顧客から提供された適切な情報をデータウェアハウスインスタンスに入力できる。
【0024】
一実施形態によれば、プロビジョニングコンポーネントは、例えば、特定の顧客(テナント)に対してETL処理の実行の要求頻度を変更または更新することにより、データウェアハウスインスタンスやデータプレーンで動作するETL処理を更新または編集するために使用することもできる。
【0025】
一実施形態によれば、データプレーンは、組織のエンタープライズソフトウェアアプリケーションまたはデータ環境(例えば、顧客(テナント)のSaaS環境でプロビジョニングされたビジネス生産性ソフトウェアアプリケーションなど)からの運用データまたはトランザクションデータを一緒に処理するデータパイプラインまたは処理層120およびデータ変換層134を含み得る。データパイプラインまたは処理は、SaaS環境でプロビジョニングされたビジネスアプリケーションやデータベースからトランザクションデータを抽出し、変換されたデータをデータウェアハウスにロードする様々な機能を含み得る。
【0026】
一実施形態によれば、データ変換層は、ビジネスアプリケーションおよびSaaS環境にプロビジョニングされた対応するトランザクションデータベースから受信したトランザクションデータを、データ分析環境が理解できるモデル形式に変換するためにシステムが使用する知識モデル(KM:knowledge model)などのデータモデルや他のタイプのデータモデルを含み得る。モデル形式は、データウェアハウスへの記憶に適した任意のデータ形式で提供され得る。一実施形態によれば、データプレーンは、データおよび構成ユーザインターフェース、およびマッピングおよび構成データベースも含み得る。
【0027】
一実施形態によれば、データプレーンは、組織のエンタープライズソフトウェアアプリケーションやデータ環境(例えば、SaaS環境で提供されるビジネス生産性ソフトウェアアプリケーションや対応するトランザクションデータベースなど)からトランザクションデータを抽出すること、抽出されたデータをモデル形式に変換すること、および変換されたデータをデータウェアハウスの顧客スキーマにロードすることを含む、抽出、変換、ロード(ETL:extract, transform, and load)操作の実行を担当する。
【0028】
例えば、一実施形態によれば、環境の各顧客(テナント)は、独自の顧客スキーマに関連付けられたデータウェアハウス内の独自の顧客テナントに関連付けられていてもよく、さらに、データ分析スキーマへの読み取り専用アクセスを提供できる。データ分析スキーマは、データパイプラインまたは処理(ETL処理など)によって定期的またはその他のベースで更新され得る。
【0029】
一実施形態によれば、データパイプラインまたは処理は、例えば、SaaS環境でプロビジョニングされるビジネス生産性ソフトウェアアプリケーションおよび対応するトランザクションデータベース106などのエンタープライズソフトウェアアプリケーションまたはデータ環境からトランザクションデータを抽出するために一定の間隔(例えば、毎時、毎日、毎週)で実行されるようにスケジュールされ得る。
【0030】
一実施形態によれば、抽出処理108はトランザクションデータを抽出することができ、データパイプラインまたは処理の抽出により、抽出されたデータをデータステージングエリアに挿入することができ、データステージングエリアは、抽出されたデータの一時的なステージングエリアとして機能することができる。抽出されたデータの整合性を確保するために、データ品質コンポーネントおよびデータ保護コンポーネントが使用され得る。例えば、一実施形態によれば、データ品質コンポーネントは、データがデータステージングエリアに一時的に保持されている間に、抽出されたデータの検証を実行することができる。
【0031】
一実施形態によれば、抽出処理が抽出を完了すると、データ変換層を使用して変換処理を開始し、抽出されたデータをデータウェアハウスの顧客スキーマにロードされるモデル形式に変換することができる。
【0032】
一実施形態によれば、データパイプラインまたは処理は、データ変換層と組み合わせて動作して、データをモデル形式に変換することができる。マッピングおよび構成データベースには、データ変換で使用されるデータモデルを規定するメタデータとデータマッピングを記憶できる。データおよび構成ユーザインターフェース(UI:user interface)により、マッピングおよび構成データベースへのアクセスと変更が容易になる。
【0033】
一実施形態によれば、データ変換層は、抽出されたデータを、例えばデータモデルに従って、データウェアハウスの顧客スキーマにロードするのに適した形式に変換することができる。変換中、データ変換では必要に応じてディメンションの生成、ファクトの生成、および集計の生成を実行できる。ディメンションの生成には、データウェアハウスインスタンスにロードするためのディメンションまたはフィールドの生成が含まれ得る。
【0034】
一実施形態によれば、抽出されたデータの変換後、データパイプラインまたは処理は、ウェアハウスロード手順150を実行して、変換されたデータをデータウェアハウスインスタンスの顧客スキーマにロードすることができる。変換されたデータを顧客スキーマにロードした後、変換されたデータを分析し、様々な追加のビジネスインテリジェンス処理で使用できる。
【0035】
データ分析環境の顧客が異なれば、データ分析やビジネスインテリジェンスデータの提供、またはソフトウェア分析アプリケーションの開発を目的としたデータの分類、集約、または変換方法に関して、異なる要件を有し得る。一実施形態によれば、このような様々な要件をサポートするために、セマンティック層180は、顧客データのセマンティックモデルを規定するデータを含んでいてもよく、これは、ユーザが一般的に理解されているビジネス用語を使用してそのデータを理解し、アクセスするのに役立ち、カスタムコンテンツをプレゼンテーション層190に提供する。
【0036】
一実施形態によれば、セマンティックモデルは、例えばOracle環境において、論理スキーマ、物理スキーマ、物理対論理マッピング、集約テーブルナビゲーション、および/またはセマンティックモデルの様々な物理層、ビジネスモデルとマッピング層、およびプレゼンテーション層の側面を実装するその他の構成要素を規定するメタデータを有するBIリポジトリ(RPD)ファイルとして規定することができる。
【0037】
一実施形態によれば、顧客は、特定の要件をサポートするために、データウェアハウスインスタンスに記憶されているデータに関連付けられたカスタムファクトやディメンションを追加するなど、データソースモデルに変更を加えることができ、システムはそれに応じてセマンティックモデルを拡張できる。
【0038】
一実施形態によれば、プレゼンテーション層は、例えば、ソフトウェア分析アプリケーション、ユーザインターフェース、ダッシュボード、主要業績評価指標(KPI:key performance indicators)、または、例えば、Oracle Analytics Cloud、Oracle Analytics for Applicationsなど製品によって提供される他の種類のレポートやインターフェースを使用して、データコンテンツへのアクセスを可能にする。
【0039】
ビジネスインテリジェンスサーバ
一実施形態によれば、クエリエンジン18(例えば、OBISインスタンス)は、フェデレーテッドクエリエンジンの方法で動作し、例えば、データベースに格納されたデータに向けられた、Oracle Analytics Cloud環境内のクライアントからの分析クエリまたはリクエストに対応する。
【0040】
一実施形態によれば、OBISインスタンスは、クエリ実行計画56に従って、サポートされているデータベースにオペレーションをプッシュダウンすることができ、物理クエリには、論理クエリの処理時にデータを取得するためにクエリエンジンがデータベースに送信するデータベース固有のステートメントが含まれる一方、論理クエリには、クライアントから受信した構造化クエリ言語(SQL:Structured Query Language)ステートメントを含めることができる。このようにして、OBISインスタンスはビジネスユーザのクエリを適切なデータベース固有のクエリ言語(Oracle SQL、SQL Server SQL、DB2 SQL、Essbase MDXなど)に変換する。クエリエンジン(OBISなど)は、データベースにプッシュダウンできないSQL演算子の内部実行もサポートし得る。
【0041】
一実施形態によれば、ユーザ/開発者は、コンピュータハードウェア11(例えば、プロセッサ、ストレージ、メモリ)、ユーザインターフェース12、およびアプリケーション14を含むクライアントコンピュータデバイス10と対話することができる。OBISなどのクエリンジンまたはビジネスインテリジェンスサーバは、通常、SQL、データベースモデルに対するリクエストなどのインバウンドを処理し、1つまたは複数の物理データベースクエリを構築して実行し、データを適切に処理して、リクエストに応じてデータを返すように動作する。
【0042】
これを達成するために、一実施形態によれば、クエリエンジンまたはビジネスインテリジェンスサーバは、クエリのサブジェクト領域として利用可能なデータを記述する論理モデルまたはビジネスモデルまたはメタデータ、受信クエリを取得し、接続されたデータソースで使用する物理クエリに変換するリクエストジェネレータ、受信クエリを受け取り、論理モデルをナビゲートし、特定のクエリに必要なデータを最適に返す物理クエリを生成するナビゲータなど、様々なコンポーネントまたは機能を含み得る。
【0043】
例えば、一実施形態によれば、クエリエンジンまたはビジネスインテリジェンスサーバは、様々なデータソースに対して単純化されたスタースキーマビジネスモデルを作成することにより、データウェアハウス内のデータにマップされた論理モデルを使用して、ユーザが単一ソースからのものであるかのようにデータをクエリできるようにすることができる。その後、ビジネスモデルレイヤのマッピングルールに従って、情報をサブジェクト領域としてプレゼンテーションレイヤに返すことができる。
【0044】
一実施形態によれば、クエリエンジン(例えば、OBIS)は、クエリ実行計画に従ってデータベースに対するクエリを処理することができ、クエリ実行計画には、様々な子(リーフ)ノードを含むことができ、例えば、本明細書では様々な実施形態において一般に以下のRqListと呼ばれる。
Execution plan:
[[
RqList <<191986>> [for database 0:0,0]
D102.c1 as c1 [for database 0:0,0],
sum(D102.c2 by [ D102.c1] ) as c2 [for database 0:0,0]
Child Nodes (RqJoinSpec): <<192970>> [for database 0:0,0]
RqJoinNode <<192969>> []
(
RqList <<193062>> [for database 0:0,0]
D2.c2 as c1 [for database 0:0,0],
D1.c2 as c2 [for database 0:0,0]
Child Nodes (RqJoinSpec): <<193065>> [for database 0:0,0]
RqJoinNode <<193061>> []
(
RqList <<192414>> [for database 0:0,118]
T1000003.Customer_ID as c1 [for database 0:0,118],
T1000003.TARGET as c2 [for database 0:0,118]
Child Nodes (RqJoinSpec): <<192424>> [for database 0:0,118]
RqJoinNode <<192423>> []
[users/administrator/dv_joins/multihub/input::##dataTarget]
as T1000003
) as D1 LeftOuterJoin (Eager) <<192381>> On D1.c1 = D2.c1;
actual join vectors: [ 0 ] = [ 0 ]
(
RqList <<192443>> [for database 0:0,0]
D104.c1 as c1 [for database 0:0,0],
nullifnotunique(D104.c2 by [ D104.c1] ) as c2 [for database 0:0,0]
Child Nodes (RqJoinSpec): <<192928>> [for database 0:0,0]
RqJoinNode <<192927>> []
(
RqList <<192852>> [for database 0:0,118]
T1000006.Customer_ID as c1 [for database 0:0,118],
T1000006.Customer_City as c2 [for database 0:0,118]
Child Nodes (RqJoinSpec): <<192862>> [for database 0:0,118]
RqJoinNode <<192861>> []
[users/administrator/dv_joins/my_customers/input::data]
as T1000006
) as D104
GroupBy: [ D104.c1] [for database 0:0,0] sort
OrderBy: c1, Aggs:[ nullifnotunique(D104.c2 by [ D104.c1] ) ]
[for database 0:0,0]
) as D2
) as D102
GroupBy: [ D102.c1] [for database 0:0,0] sort
OrderBy: c1 asc, Aggs:[ sum(D102.c2 by [ D102.c1] ) ] [for database 0:0,0]
クエリ実行計画内では、各実行計画コンポーネント(RqList)はクエリ実行計画内のクエリのブロックを表し、通常はSELECTステートメントに変換される。RqListには、SELECTステートメントがネストされたSELECTステートメントから選択する方法と同様に、ネストされた子RqListを含めることができる。
【0045】
一実施形態によれば、クエリエンジンは異なるデータベースと対話することができ、これらのデータベースのそれぞれに対してデータソース固有のコードジェネレータを使用することができる。一般的な戦略は、物理クエリの一部としてSQL実行を送信することで、できるだけ多くのSQL実行をデータベースに送信することであり、これにより、OBISサーバに返される情報の量が削減される。
【0046】
一実施形態によれば、動作中、クエリエンジンまたはビジネスインテリジェンスサーバは、例えばリクエストに応答するために必要なデータの集約を実行するためにさらに最適化できるクエリ実行計画を作成することができる。ODBCインターフェースなどを介して、結果が呼び出し側アプリケーションに返される前に、データを結合してさらに計算を適用できる。
【0047】
一実施形態によれば、複数のデータソースを必要とする複雑なマルチパスリクエストでは、クエリを分解し、どのソース、マルチパス計算、および集計を使用できるかを判定し、複数のデータベースと物理SQLステートメントにまたがる論理クエリ実行計画を生成するためにクエリエンジンまたはビジネスインテリジェンスサーバが必要になる場合があり、次いで結果は返され、クエリエンジンまたはビジネスインテリジェンスサーバよってさらに結合または集約される場合がある。
【0048】
図2は、一実施形態によるデータ分析環境の例をさらに示す。
図2に示すように、一実施形態によれば、プロビジョニングコンポーネントは、以下でさらに説明するように、プロビジョニングアプリケーションプログラミングインターフェース(API)112、多数のワーカ115、メータリングマネージャ116、およびデータプレーンAPI118を備えることもできる。コンソールインターフェースは、例えば、コマンド、指示、またはその他の入力がコンソールインターフェースで受信されたときに、API呼び出しを行うことによってプロビジョニングAPIと通信して、SaaS環境内でサービスをプロビジョニングしたり、プロビジョニングされたサービスの構成を変更したりすることができる。
【0049】
一実施形態によれば、データプレーンAPIはデータプレーンと通信できる。例えば、一実施形態によれば、データプレーンによって提供されるサービスに向けられたプロビジョニングおよび構成の変更は、データプレーンAPIを介してデータプレーンに通信することができる。
【0050】
一実施形態によれば、メータリングマネージャは、サービスおよび制御プレーンを介してプロビジョニングされるサービスの使用量を測定する様々な機能を含むことができる。例えば、一実施形態によれば、メータリングマネージャは、請求目的のために、特定の顧客(テナント)に対して、制御プレーンを介してプロビジョニングされたプロセッサの使用量を経時的に記録することができる。同様に、メータリングマネージャは、SaaS環境の顧客が使用するために分割されたデータウェアハウスのストレージスペースの量を請求目的で記録できる。
【0051】
一実施形態によれば、データプレーンによって提供されるデータパイプラインまたは処理は、以下でさらに説明するように、監視コンポーネント122、データステージングコンポーネント124、データ品質コンポーネント126、およびデータ投影コンポーネント128を含み得る。
【0052】
一実施形態によれば、データ変換層は、以下でさらに説明するように、ディメンション生成コンポーネント136、ファクト生成コンポーネント138、および集約生成コンポーネント140を含むことができる。データプレーンは、データおよび構成ユーザインターフェース130、およびマッピングおよび構成データベース132を含むこともできる。
【0053】
一実施形態によれば、データウェアハウスは、デフォルトのデータ分析スキーマ(本明細書では、いくつかの実施形態に従って分析ウェアハウススキーマと呼ぶ)162と、システムの顧客(テナント)ごとに、顧客スキーマ164を含むことができる。
【0054】
一実施形態によれば、複数のテナントをサポートするために、システムは複数のデータウェアハウスまたはデータウェアハウスインスタンスの使用を可能にし得る。例えば、一実施形態によれば、第1のテナントの第1のウェアハウス顧客テナントは、第1のデータベースインスタンス、第1のステージングエリア、および複数のデータウェアハウスまたはデータウェアハウスインスタンスのうちの第1のデータウェアハウスインスタンスを含むことができ、一方、第2のテナントに対する第2の顧客テナントは、第2のデータベースインスタンス、第2のステージングエリア、および複数のデータウェアハウスまたはデータウェアハウスインスタンスのうちの第2のデータウェアハウスインスタンスを含むことができる。
【0055】
一実施形態によれば、マッピングおよび構成データベースで定義されたデータモデルに基づいて、監視構成要素は、変換されるいくつかの異なるデータセット(本明細書では「データセット」とも呼ばれる)の依存関係を決定することができる。判定された依存関係に基づいて、監視コンポーネントは、いくつかの異なるデータセットのうちどれを最初にモデル形式に変換する必要があるかを判定できる。
【0056】
例えば、一実施形態によれば、第1のモデルデータセットに他のモデルデータセットへの依存関係が含まれていない場合、および第2のモデルデータセットに、第1のモデルデータセットへの依存関係が含まれる場合、その後、監視コンポーネントは、第1のデータセットに対する第2のデータセットの依存関係に対応するために、第2のデータセットの前に第1のデータセットを変換することを判定できる。
【0057】
例えば、一実施形態によれば、ディメンションは、例えば、「名前」、「住所」、または「年齢」などのデータのカテゴリを含み得る。ファクトの生成には、データが取り得る値、つまり「測定値」の生成が含まれる。ファクトはデータウェアハウスインスタンス内の適切なディメンションに関連付けることができる。集計生成には、データウェアハウスインスタンスの顧客スキーマ内の既存データに対する変換されたデータの集計を計算するデータマッピングの作成が含まれる。
【0058】
一実施形態によれば、(データモデルによって規定されたように)何らかの変換が実施されると、データパイプラインまたは処理は、ソースデータを読み取り、変換を適用し、その後、データをデータウェアハウスインスタンスにプッシュすることができる。
【0059】
一実施形態によれば、データ変換はルールで表現でき、変換が行われると、中間のステージングエリアに値を保持でき、ステージングエリアでは、データがデータウェアハウスインスタンスの顧客スキーマにアップロードされる前に、データ品質コンポーネントとデータ投影コンポーネントが、変換されたデータの整合性を検証および確認できる。例えば、多数のコンピューティングインスタンスや仮想マシンでの抽出、変換、ロード処理の実行時に監視を提供できる。抽出、変換、ロードの処理中に依存関係を維持することもでき、データパイプラインまたは処理はそのような順序付けの決定に対応できる。
【0060】
一実施形態によれば、抽出されたデータの変換後、データパイプラインまたは処理は、ウェアハウスロード手順を実行して、変換されたデータをデータウェアハウスインスタンスの顧客スキーマにロードすることができる。変換されたデータを顧客スキーマにロードした後、変換されたデータを分析し、様々な追加のビジネスインテリジェンス処理で使用できる。
【0061】
図3は、一実施形態によるデータ分析環境の例をさらに示す。
図3に示すように、一実施形態によれば、データは、例えば、データパイプライン処理を使用して、顧客(テナント)のエンタープライズソフトウェアアプリケーションまたはデータ環境(106)から供給されてもよく、または、1つまたは複数の顧客固有のアプリケーション107から得られるカスタムデータ109として供給されてもよく、いくつかの例では、データの記憶にオブジェクトストレージ105を使用することを含めて、データウェアハウスインスタンスにロードされる。
【0062】
Oracle Analytics Cloud(OAC)などの分析環境の実施形態によれば、ユーザは、異なる接続およびスキーマからのテーブルを使用するデータセットを作成できる。システムは、これらのテーブル間に規定された関係を使用して、データセット内に関係または結合を作成する。
【0063】
一実施形態によれば、顧客(テナント)ごとに、システムは、システム/クラウドテナント114内でシステムによって維持および更新されるデータ分析スキーマを、顧客のエンタープライズアプリケーション環境内および顧客テナント117内のデータの分析に基づいて、顧客のデータウェアハウスインスタンスを事前に設定するために使用する。そのため、システムによって維持されるデータ分析スキーマにより、データパイプラインまたは処理によって顧客の環境からデータを取得し、顧客のデータウェアハウスインスタンスにロードできるようになる。
【0064】
一実施形態によれば、システムはまた、環境の顧客ごとに、顧客によって容易に変更可能であり、顧客が自身のデータウェアハウスインスタンス内のデータを補足して利用できるようにする顧客スキーマを提供する。各顧客にとって、結果として得られるデータウェアハウスインスタンスはデータベースとして動作し、その内容は部分的に顧客によって制御され、部分的に環境(システム)によって制御される。
【0065】
例えば、一実施形態によれば、データウェアハウス(例えば、ADW)は、データ分析スキーマと、顧客/テナントごとに、エンタープライズソフトウェアアプリケーションまたはデータ環境から供給される顧客スキーマとを含み得る。データウェアハウステナント(ADWクラウドテナントなど)でプロビジョニングされたデータには、そのテナントのみがアクセスでき、同時に、共有環境の様々な機能(ETL関連機能やその他の機能など)へのアクセスを許可する。
【0066】
一実施形態によれば、複数の顧客/テナントをサポートするために、システムでは複数のデータウェアハウスインスタンスの使用が可能であり、例えば、第1の顧客テナントは、第1のデータベースインスタンス、第1のステージングエリア、および第1のデータウェアハウスインスタンスを含んでいてもよく、第2の顧客テナントは、第2のデータベースインスタンス、第2のステージングエリア、第2のデータウェアハウスインスタンスを含んでいてもよい。
【0067】
一実施形態によれば、特定の顧客/テナントについて、そのデータの抽出時に、データパイプラインまたは処理は、抽出されたデータをテナントのデータステージングエリアに挿入することができ、抽出されたデータの一時ステージングエリアとして機能することができる。例えば、データがデータステージングエリアに一時的に保持されている間に、抽出されたデータの検証を実行することにより、データ品質コンポーネントとデータ保護コンポーネントを使用して、抽出されたデータの整合性を確保できる。抽出処理が抽出を完了すると、データ変換レイヤを使用して変換処理を開始し、抽出されたデータをデータウェアハウスの顧客スキーマにロードするモデル形式に変換できる。
【0068】
図4は、一実施形態によるデータ分析環境の例をさらに示す。
図4に示すように、一実施形態によれば、例えば、上記のデータパイプライン処理を使用して、または、1つまたは複数の顧客固有のアプリケーションから取得したカスタムデータとして顧客(テナント)のエンタープライズソフトウェアアプリケーションまたはデータ環境からデータを抽出する処理、データをデータウェアハウスインスタンスにロードするか、データウェアハウス内のデータを更新することは、一般に、1つまたは複数の計算インスタンス170によって実行される1つまたは複数の抽出サービス163、変換サービス165、およびロード/公開サービス167を含む、ETPサービス160または処理によって実行される3つの大きな段階を含む。
【0069】
例えば、一実施形態によれば、抽出用のビューオブジェクトのリストを、例えばRESTコールを介してOracle BI Cloud Connector(BICC)コンポーネントに送信することができる。抽出されたファイルは、データを記憶するために、Oracle Storage Service(OSS)コンポーネントなどのオブジェクトストレージコンポーネントにアップロードできる。変換処理では、オブジェクトストレージコンポーネント(OSSなど)からデータファイルを取得し、そして、データパイプラインまたは処理の内部にあり、顧客(テナント)には公開されないターゲットデータウェアハウス(ADWデータベースなど)にデータをロードするときにビジネスロジックを適用する。ロード/公開サービスまたは処理は、ADWデータベースやウェアハウスなどからデータを取得し、それを顧客(テナント)がアクセス可能なデータウェアハウスインスタンスに公開する。
【0070】
図5は、一実施形態によるデータ分析環境の例をさらに示す。
一実施形態による複数のテナント(顧客)によるシステムの動作を示す
図5に示すように、データは、例えば、前述のデータパイプライン処理を使用して、複数の顧客(テナント)のエンタープライズソフトウェアアプリケーションまたはデータ環境のそれぞれから取得でき、そしてデータウェアハウスインスタンスにロードされる。
【0071】
一実施形態によれば、データパイプラインまたは処理は、特定の分析ユースケースのベストプラクティスに従ったシステムにより、複数の顧客(テナント)、例えば顧客A180、顧客B182の各々に対して、定期的に更新されるデータ分析スキーマを維持する。
【0072】
一実施形態によれば、複数の顧客(例えば、顧客A、顧客B)のそれぞれについて、システムは、データがデータパイプラインまたは処理によって顧客の環境から取得され、顧客のデータウェアハウスインスタンス160A、160Bにロードされるように、システムによって維持および更新されるデータ分析スキーマ162A、162Bを使用して、その顧客のエンタープライズアプリケーション環境106A、106B内、および各顧客のテナント(例えば、顧客Aのテナント181、顧客Bのテナント183)内のデータの分析に基づいて顧客のデータウェアハウスインスタンスを事前設定する。
【0073】
一実施形態によれば、データ分析環境はまた、環境の複数の顧客のそれぞれに対して、顧客によって容易に変更可能な顧客スキーマ(例えば、顧客Aスキーマ164A、顧客Bスキーマ164B)を提供し、これにより、顧客は独自のデータウェアハウスインスタンス内のデータを補完して利用できるようになる。
【0074】
上述のように、一実施形態によれば、データ分析環境の複数の顧客の各々について、結果として得られるデータウェアハウスインスタンスはデータベースとして動作し、その内容は顧客によって部分的に制御され、データ分析環境(システム)によって部分的に制御され、これには、様々な分析ユースケースに対応するためにエンタープライズアプリケーション環境から取得した適切なデータがデータベースに予め入力されているように見えることも含まれる。特定の顧客に対する抽出処理108A、108Bがその抽出を完了すると、データ変換層を使用して変換処理を開始し、抽出されたデータをデータウェアハウスの顧客スキーマにロードされるモデル形式に変換することができる。
【0075】
一実施形態によれば、アクティブ化計画186は、顧客(テナント)の特定のニーズに対処するために、特定の機能領域について、顧客のためのデータパイプラインまたは処理サービスの動作を制御するために使用することができる。
【0076】
例えば、一実施形態によれば、アクティブ化計画では、特定の順序で、特定の時刻に、特定の時間枠内で実行される多数の抽出、変換、ロード(公開)サービスまたはステップを規定できる。
【0077】
一実施形態によれば、各顧客を独自のアクティブ化計画に関連付けることができる。例えば、第1の顧客Aのアクティブ化計画では、その顧客のエンタープライズソフトウェアアプリケーション環境(Fusion Applications環境など)から取得するテーブルを判定したり、サービスとその処理を順番に実行する方法を判定したりできる。一方、第2の顧客Bのアクティブ化計画では、同様に、その顧客のエンタープライズソフトウェアアプリケーション環境から取得するテーブルを判定したり、サービスとその処理を順番に実行する方法を判定したりできる。
【0078】
図6は、一実施形態による、データを変換、分析、または視覚化するためのシステムの使用を示す図である。
【0079】
図6に示されるように、一実施形態によれば、本明細書に開示されるシステムおよび方法は、分析成果物およびそれらの間の関係に関して分析環境のユーザに洞察(インサイト)を可能にするデータ視覚化環境192を提供するために使用することができる。その後、モデルを使用して、例えばユーザインターフェースを介して、ネットワークチャートや成果物(例えば、ユーザ、ロール、DVプロジェクト、データセット、接続、データフロー、シーケンス、MLモデル、MLスクリプト)間の関係や系統の視覚化として、そのような分析成果物間の関係を視覚化できる。
【0080】
一実施形態によれば、クライアントアプリケーションは、コンピュータシステムまたは処理装置によって実行可能なソフトウェアまたはコンピュータ可読プログラムコードとして実装することができ、例えばソフトウェアアプリケーションのユーザインターフェースまたはウェブブラウザインターフェースなどのユーザインターフェースを有する。クライアントアプリケーションは、インターネット/HTTPまたは分析システムへの他のタイプのネットワーク接続を介して、またはクラウド環境の例では、環境によって提供されるクラウドサービスを介してデータを取得またはアクセスできる。
【0081】
一実施形態によれば、ユーザインターフェースは、以下でさらに詳しく説明するように、例えば、グラフ、チャート、その他のタイプのデータ分析やデータフローの視覚化を生成するために、ユーザがデータセットを表示したり、ユーザインターフェースを操作してデータを変換、分析、視覚化したりできるようにすることを含む、セルフサービステキスト分析を可能にする様々なデータフローアクションタイプを含んでいてもよいし、アクセスを提供してもよい。
【0082】
一実施形態によれば、分析システムは、例えば1つまたは複数のデータソース接続を介して、1つまたは複数のデータソースからデータセットを取得、受信、または準備できるようにする。ここで説明するシステムおよび方法を使用して変換、分析、または視覚化できるデータの種類の例には、HCM、HR、またはERPデータ、電子メールまたはテキストメッセージ、またはデータベース、データストレージサービス、もしくは他の種類のデータリポジトリもしくはデータソースの1つまたは複数で提供される、その他の自由形式または非構造化テキストデータが含まれる。
【0083】
例えば、一実施形態によれば、データ分析または視覚化情報の要求は、上述のようにクライアントアプリケーションおよびユーザインターフェースを介して受信され、(クラウド環境の例では、クラウドサービスを介して)分析システムに伝達され得る。システムは、要求されたデータ分析または視覚化情報を生成してクライアントに返す際に使用するために、ユーザ/ビジネスコンテキストに対応する適切なデータセットを取得できる。例えば、データ分析システムは、SELECTステートメントや論理SQL命令などを使用してデータセットを取得できる。
【0084】
一実施形態によれば、システムは、様々なアルゴリズム処理を適用することによって、データフローまたは入力データのセットの理解を反映するモデルまたはデータフローを作成し、データに関連する視覚化または他の種類の有用な情報を生成することができる。モデルまたはデータフローは、例えば、データフローまたは入力データのセットに対して動作する1つまたは複数のデータフローアクション194、195またはステップを含む、データフローまたは入力データのセットに様々な処理または技術を適用することによって、データセットエディタ193内でさらに修正することができる。ユーザは、ユーザインターフェースを介してシステムと対話し、データ分析、データ視覚化196、またはデータに関連付けられた他のタイプの有用な情報を生成するデータフローアクションの使用を制御できる。
【0085】
一実施形態によれば、データセットは、データの視覚化および分析要件のためにユーザが構築できるセルフサービスのデータモデルである。データセットには、データソースの接続情報、テーブル、列、データの強化と変換が含まれる。ユーザは複数のワークブックおよびデータフローでデータセットを使用できる。
【0086】
一実施形態によれば、ユーザがデータセットを作成および構築するとき、ユーザは、例えば、様々な種類の接続またはスプレッドシートから選択でき、データベース接続内の複数のテーブル、Oracleデータソース、またはローカルサブジェクト領域のデータに基づいてデータセットを作成することができ、または、様々な接続およびサブジェクト領域のテーブルのデータに基づいてデータセットを作成することができる。
【0087】
例えば、一実施形態によれば、ユーザは、Autonomous Data Warehouse接続からのテーブル、Spark接続からのテーブル、およびローカルサブジェクトエリアからのテーブルを含むデータセットを構築でき、テーブル間の結合を指定でき、データセット内の列を変換して強化することができる。
【0088】
一実施形態によれば、データセットに関連する追加の成果物、特徴、および操作には、例えば、以下が含まれる。
【0089】
利用可能な接続の表示:データセットは、データソースへの1つまたは複数の接続を使用して、分析と視覚化のためのデータにアクセスし、データを提供する。ユーザの接続リストには、ユーザが構築した接続と、アクセスおよび使用する権限を持つ接続が含まれる。
【0090】
接続からデータセットを作成すること:ユーザがデータセットを作成するとき、1つまたは複数のデータソース接続からテーブルを追加し、結合を追加し、データを強化できる。
【0091】
データセットに複数の接続を追加すること:データセットには複数の接続を含めることができる。さらに接続を追加すると、ユーザはデータセットの構築に必要なすべてのテーブルとデータにアクセスして結合できるようになる。ユーザは複数のテーブルをサポートするデータセットにさらに接続を追加できる。
【0092】
データセットテーブル結合の作成:結合はデータセットのテーブル間の関係を示す。ユーザがファクトとディメンションに基づいてデータセットを作成しており、結合がソーステーブルにすでに存在する場合、結合はデータセットに自動的に作成される。ユーザが複数の接続とスキーマからデータセットを作成している場合は、ユーザがテーブル間の結合を手動で規定できる。
【0093】
一実施形態によれば、ユーザは、データフローを使用して、データを組み合わせ、編成し、統合することによってデータセットを作成することができる。データフローを使用すると、ユーザはデータを整理および統合して、自分または他のユーザが視覚化できる厳選されたデータセットを作成できる。
【0094】
例えば、一実施形態によれば、ユーザはデータフローを、データセットを作成したり、異なるソースからのデータを結合したり、データを集計したり、機械学習モデルを訓練したり、予測機械学習モデルをデータに適用したりするために使用し得る。
【0095】
一実施形態によれば、上述のデータセットエディタにより、ユーザはアクションまたはステップを追加することができ、各ステップは、例えば、データの追加、テーブルの結合、列のマージ、データの変換、またはデータの保存などの特定の機能を実行する。ユーザがステップを追加または変更すると、各ステップが検証される。データフローを構成したら、それを実行してデータセットを生成または更新できる。
【0096】
一実施形態によれば、ユーザは、データセット、対象領域、またはデータベース接続からデータをキュレーションすることができる。ユーザはデータフローを個別にまたは順番に実行できる。ユーザはデータフローに複数のデータソースを含めて、それらを結合する方法を指定できる。ユーザは、データフローからの出力データをデータセットまたはサポートされているデータベースタイプに保存できる。
【0097】
一実施形態によれば、データフローに関連する追加の成果物、機能、および操作には、例えば、以下が含まれる。
【0098】
列の追加:ターゲットデータセットにカスタム列を追加する。
データの追加:データソースをデータフローに追加する。例えば、ユーザが2つのデータセットを結合する場合、両方のデータセットをデータフローに追加する。
【0099】
集計:例えば、カウント、合計、平均など集計関数を適用してグループの合計を作成する。
【0100】
ブランチ:データフローから複数の出力を作成する。
フィルタ:ユーザが興味のあるデータのみを選択する。
【0101】
結合:共通の列に基づいたデータベース結合を使用して、複数のデータソースからのデータを結合する。
【0102】
グラフ分析:2つの頂点間の距離やホップ数の計算などの地理空間分析を実行する。
上記は例として提供されており、一実施形態によれば、他のタイプのステップをデータフローに追加して、データセットを変換したり、データ分析や視覚化を提供したりすることができる。
【0103】
データセットの分析と視覚化
一実施形態によれば、システムは、ユーザが、例えば複数のデータソースから供給されたデータセットまたはデータを探索するために、ユーザインターフェース内に表示するためのデータセット、分析、または視覚化を生成できるようにする機能を提供する。
【0104】
図7~
図18は、一実施形態による、データ分析環境で使用するためのユーザインターフェースの様々な例を示す。
【0105】
図7~
図18に示されるユーザインターフェースおよび機能は、本明細書で説明される様々な機能を説明する目的で、例として提供されており、様々な実施形態に従って、ユーザインターフェースおよび機能の代替例を提供することができる。
【0106】
図7~
図8に示すように、一実施形態によれば、ユーザは、例えば、組織のデータに対する分析またはクエリを送信するために、データ分析環境にアクセスすることができる。
【0107】
例えば、一実施形態によれば、ユーザは様々なタイプの接続の中から選択して、データベース接続、Oracleサブジェクト領域、Oracle ADW接続、またはスプレッドシート、ファイル、その他のタイプのデータソースなどの表のデータに基づいてデータセットを作成できる。このように、データセットはセルフサービスデータモデルとして動作し、ユーザはそこからデータ分析や視覚化を構築できる。
【0108】
図9~
図10に示すように、一実施形態によれば、データセットエディタは、ユーザがアクセス権限を有している接続のリストを表示し、ユーザがテーブル、結合、および/または強化されたデータを含むデータセットを作成または編集できるようにすることができる。エディタにはデータソース接続のスキーマとテーブルを表示でき、ユーザはそこからデータセットダイアグラムにドラッグアンドドロップできる。特定の接続自体がスキーマとテーブルのリストを提供しない場合、ユーザは適切なテーブルに対して手動クエリを使用できる。接続を追加すると、関連するテーブルとデータにアクセスして結合し、データセットを構築できるようになる。
【0109】
図11~
図12に示すように、一実施形態によれば、データセットエディタ内で結合図がテーブルとデータセット内の結合を表示する。データソースで規定されている結合は、例えばテーブル間で見つかった列名の一致に基づいて結合を作成することにより、データセット内のテーブル間で自動的に作成できる。
【0110】
一実施形態によれば、ユーザがテーブルを選択すると、プレビューデータ領域にテーブルのデータのサンプルが表示される。表示される結合リンクとアイコンは、結合されているテーブルと使用されている結合のタイプを示す。ユーザは、あるテーブルを別のテーブルにドラッグアンドドロップすることで結合を作成でき、結合をクリックしてその構成を表示または更新でき、または、列のtype属性をクリックして、例えば測定値から属性にタイプを変更できる。
【0111】
一実施形態によれば、システムは、視覚化のためのソース固有の最適化されたクエリを生成することができ、データセットはデータモデルとして扱われ、視覚化を満たすために必要なテーブルのみがクエリで使用される。
【0112】
デフォルトでは、データセットの粒度は最も粒度の低いテーブルによって判定される。ユーザはデータセット内の任意のテーブルに測定値を作成できる。ただし、これにより、1対多または多対多の関係の片側の測定値が重複する可能性がある。
図13に示す実施形態によれば、これに対処するために、ユーザは、カーディナリティの片側にテーブルを設定して粒度を維持し、その詳細レベルを維持することができる。
【0113】
図14に示すように、一実施形態によれば、データセットテーブルは、システムがテーブルをキャッシュにロードするかどうか、あるいはテーブルがそのデータをデータソースから直接受け取るかどうかを判定するデータアクセス設定に関連付けることができる。
【0114】
一実施形態によれば、テーブルに対して自動キャッシュモードが選択されると、システムはテーブルデータをキャッシュにロードまたは再ロードし、これにより、ワークブックなどからテーブルのデータが更新されるときのパフォーマンスが向上し、テーブルおよびデータセットレベルでリロードメニューオプションが表示される。
【0115】
一実施形態によれば、テーブルに対してライブモードが選択されると、システムはテーブルデータをデータソースから直接取得し、ソースシステムはテーブルのデータソースクエリを管理する。このオプションは、データがOracle ADWなどの高性能データウェアハウスに記憶されている場合に役立ち、また、最新のデータが確実に使用されるようにする。
【0116】
一実施形態によれば、データセットが複数のテーブルを使用する場合、一部のテーブルは自動キャッシュを使用することができ、他のテーブルはライブデータを含むことができる。同じ接続を使用した複数のテーブルのリロード中に、1つのテーブルのデータのリロードが失敗した場合、現在自動キャッシュを使用するように設定されているテーブルは、ライブモードを使用してデータを取得するように切り替えられる。
【0117】
一実施形態によれば、システムにより、ユーザは、分析に利用できるようになる前に、データを充実させ、変換することができる。ワークブックが作成され、データセットがワークブックに追加されると、システムはデータの代表的なサンプルに対して列レベルのプロファイリングを実行する。データのプロファイリング後、ユーザは、例えば、都市の緯度と経度や郵便番号などのGPSエンリッチメントなど、データセット内の認識可能な列に対して提供される変換とエンリッチメントの推奨事項を実装できる。
【0118】
一実施形態によれば、データセットに適用されるデータ変換およびエンリッチメントの変更は、そのデータセットを使用するワークブックおよびデータフローに影響を与える。例えば、ユーザがデータセットを共有するワークブックを開くと、ワークブックが更新またはリフレッシュされたデータを使用していることを示すメッセージを受け取る。
【0119】
一実施形態によれば、データフローは、データを整理および統合して、ユーザが視覚化できる厳選されたデータセットを生成する手段を提供する。例えば、ユーザはデータフローを使用して、データセットの作成、様々なソースからのデータの結合、データの集約、機械学習モデルの訓練、または予測機械学習モデルのデータへの適用を行うことができる。
【0120】
図15に示すように、一実施形態によれば、データフロー内で各ステップは、例えばデータの追加、テーブルの結合、列のマージ、データの変換、またはデータの保存などの特定の機能を実行する。構成が完了すると、データフローを実行して、BETWEEN、LIKE、INなどのSQL演算子、条件式、関数の使用など、データセットを生成または更新する操作を実行できる。
【0121】
一実施形態によれば、データフローは、データセットをマージし、データをクレンジングし、結果を新しいデータセットに出力するために使用することができる。データフローは個別に実行することも、順番に実行することもできる。シーケンス内のデータフローが失敗した場合、シーケンス内で加えられたすべての変更がロールバックされる。
【0122】
図16~
図18に示すように、一実施形態によれば、例えば複数のデータソースから供給されたデータセットまたはデータを探索し、洞察を追加するために、視覚化をユーザインターフェース内に表示することができる。
【0123】
例えば、一実施形態によれば、ユーザはワークブックを作成し、データセットを追加し、その列をキャンバス上にドラッグアンドドロップして視覚化を作成することができる。システムは、キャンバスの内容に基づいて視覚化を自動的に生成でき、ユーザが選択できる1つまたは複数の視覚化タイプが自動的に選択される。例えば、ユーザが収入測定値をキャンバスに追加する場合、データ要素は文法パネルの値領域に配置され、タイル視覚化タイプが選択される。ユーザは引き続きデータ要素をキャンバスに直接追加して、視覚化を構築できる。
【0124】
一実施形態によれば、システムは、特定のデータセットに対して最良の洞察を提供すると予想される視覚化を提案することによって、自動生成されたデータ視覚化(自動生成された洞察、自動洞察)を提供することができる。ユーザは、ワークブックキャンバス内の関連する視覚化にマウスを移動するなどして、インサイトの自動生成された概要を確認できる。
【0125】
自動洞察
一実施形態によれば、本明細書に開示されるシステムおよび方法は、分析環境に接続されたデータセットのデータ視覚化(本明細書では「可視化すること」または「ビズ」とも呼ばれる)を構築する使いやすい方法を提供する。例えば、以前にアップロードされたデータセットを分析環境(前述のOracle Analytics Cloudなど)にアップロードまたは接続すると、このシステムおよび方法は、ユーザに複数のデータ視覚化を自動的に提供して、例えば、ユーザインターフェースの分析ペインから選択するか、選択してユーザインターフェースの分析ペインにドラッグすることができる。
【0126】
一実施形態によれば、本明細書で説明されるシステムおよび方法は、提供されたデータセット(例えば、アップロードされたデータセットまたは分析環境内にすでに存在するデータセット)に基づいて、データセット(例えば、その中の列)を分析して、データ視覚化内に表示できる主要な列を特定することができる。このような分析の際、システムおよび方法はさらに、例えばユーザインターフェースを介して、例えば分析環境のユーザによる選択のために、選択された多数のデータ視覚化を提供することができる。
【0127】
一実施形態によれば、そのようなシステムおよび方法は、エンドユーザにとって有益な、多数の高度に記述的で望ましいデータ視覚化を選択および分析のために自動的に提供するという利点を有する。
【0128】
図19は、一実施形態による、自動洞察機能の全体的なフローの図である。
図19は、CSVファイルやEXCELファイルなどのデータセット、または分析クラウドデータストアにインポートされるデータベースに以前にアップロードされたデータを示している。このようなデータセットへの接続により、ユーザインターフェースなどを介して、多数のデータ視覚化を自動的にユーザに表示できる。
【0129】
より具体的には、一実施形態によれば、上述のように、1つまたは複数のデータセット1901および1902をデータ分析環境1903に接続することができる。これらのデータセットは、CSV、EXCEL、またはその他のファイルタイプや形式を含むがこれらに限定されない、任意の数のデータ形式を含み得る。このようなデータセットは、(例えば、ユーザによって、または自動/スケジュールされたアップロードを介して)新しくアップロードすることも、リンクされたデータベースを介してデータ分析環境内にすでに存在していることもできる。
【0130】
一実施形態によれば、データ分析環境は、リンクされたデータの分析に基づいて、ユーザインターフェース1904、例えばグラフィカルユーザインターフェースを介して多数のデータ視覚化を表示することができる。このようなデータ視覚化は、例えば表示および/または分析のために選択される所望のデータ視覚化を示す入力を受け取ることができる選択可能な形式を含み得る。
【0131】
図20は、一実施形態による、自動洞察機能のユーザ体験のフローチャートである。
一実施形態によれば、ユーザの観点から、ユーザがデータセットを作成するか、OACなどの分析環境に接続する2010と、人工知能/機械学習処理は、データセットを内省することができ2020、そのような内省から、オプションのデータ視覚化のビュー(キャンバス)をユーザに提供することができる2030。次いで、ユーザは、どの視覚化をユーザインターフェース2040のワークスペースに取り込むかを選択することができる。
【0132】
図21は、一実施形態による、自動洞察機能のフローチャートである。
一実施形態によれば、システムおよび方法は、記憶された、リンクされた、またはアップロード2110されたデータセットに関連する様々な統計を計算することができる。次に、システムおよび方法は、1つまたは複数のスコアリング機構またはルールを利用して、データ視覚化の洞察に関して最も高いスコアを付けると決定2120された(例えば、希薄ではないデータ列、他のデータ列との関係を構成するデータ列など)データの列(またはデータセットの構成方法に応じて行-ただし、説明の残りの部分では、参照しやすいように「列」という用語を使用する)のセットを識別できる。さらに、このスコアリング段階では、2つ以上のデータ列間の計算を生成してスコアリングすることもできる(例えば、コスト/利益の比率、総売上高と従業員数の比率など)。
【0133】
一実施形態によれば、次に、システムおよび方法は、ステップ2120において、データ視覚化のうち特に重要であるか、または有用である可能性が高いと特定された列の数Nに基づいて、数Mのデータ視覚化が生成され、スコア付けされて、有意義なデータ視覚化を表示する可能性が高いM個のデータ視覚化のセットYが選択される2130。
【0134】
一実施形態によれば、システムおよび方法は、次いで、ユーザインターフェース2140を介して、プレゼンテーションのために最高得点のデータ視覚化のセットをレンダリングすることができる。
【0135】
図22は、一実施形態による、自動洞察機能のフローチャートである。
一実施形態によれば、データセット2200は、分析環境によってアップロード、リンク、またはアクセスされ得る。このデータセットから、データセットの様々な統計を計算することができる2210。これらには、例えば、基本統計2211、時間指標2212などの日付および/または時間統計、頻度統計2213、列間の相関関係2214(例えば、利益を収益で除算することによる利益率の計算など)、およびプロファイラ統計2215が含まれ得る。次に、これらのデータセット統計は、列スコアリング2220で利用される(例えば、列スコアリングのために計算されるスコア、複数の列スコアまたは列スコアと呼ぶことができる)。
【0136】
一実施形態によれば、複数の列の各列に対して生成されるスコアは、データセットの複数の列のそれぞれについて統計の各セットを操作する構成可能なルールのセットの利用に基づくことができる。
【0137】
一実施形態によれば、これらの統計から、システムおよび方法は、列ルールスコアリングエンジンを介して列をスコアリングすることに進むことができる。
【0138】
一実施形態によれば、列ルールスコアリングエンジン2223は、データセットおよびそれに関連する統計が与えられると、データセット2200の列に関する分布統計を計算することができる。分布統計を使用して、システムおよび方法は、どの列が例えば高密度でデータセットを代表しているかを識別することができる。システムおよび方法は、列、ディメンション、指標のセットに対してこれを実行する。同様に、システムおよび方法は、時間フィールドを考慮して、データセットのデータの傾向を分析する日付を選択することができる。この時間フィールドは、どの時間フィールドがデータ視覚化に最も役立つかを決定するために決定できる。システムおよび方法は、このステップから、一般にデータセット内の元の列数よりも少ない一連の列/一のセットを生成する。このシステムおよび方法は、列を抽出するだけでなく、列間の比率を構築することもできる-例えば、データセットからコストと売上を抽出し、次いで、コストと売上の比率を自動的に計算し、比率、インデックス、正規化されたデータなど、計算された列のスコアが優れている場合はそれを視覚化にして表示する。
【0139】
一実施形態によれば、以下は、例えば列が中程度の基数を有する場合の例示的な列スコアリングルールを示すチャートである。
【0140】
【0141】
一実施形態によれば、上記の表1に示すように、データの列をスコアリングするために様々なルールを利用することができる。これらのルールには、列の選択、ユーザ関心フラグ、NULL(ヌル)パーセンテージ、基数、NULL(ヌル)ペナルティ、整数、キーワード、テキスト長などが含まれるが、これらに限定されない。
【0142】
一実施形態によれば、システムおよび方法は、例えば以下の尺度に従ってデータ列をスコアリングすることができる。
【0143】
・関心を持っているユーザ - 列に変更を加えると、その列はユーザが関心を持っているとマークされる
・Nullパーセンテージ - 高密度な列のスコアが増加する
・基数/ブール値 - 適切な基数を持つ列のスコアが増加する
・10進数 - 10進数値のスコアが減少する
・Null(ヌル)ペナルティ - NULLの割合が高いとスコアが減少する
・整数- 整数値の場合、スコアが減少する
・キーワード - 特定のキーワードを含む列のスコアが低くなる
・テキストの長さ - 適切なテキスト長の平均を持つ列のスコアが増加する
・頻度- 頻度が低い場合、スコアが減少する(項目メンバー)
・指標
- 単一性 - 単一性が高い場合、スコアが増加する
- 歪度 - 通常のベル形状の場合、スコアが増加する
- 尖度 - 歪んだ指標の場合、スコアが増加する
- キーワード - 時間/IDパーセント、平均、ランキング
- 指標密度 -指標の密度が高い場合、スコアが増加する
- 指標ID - IDのような列はスコアが低くなる
- IQR - 平均および比率はスコアが低くなる
- 属性の競合 - 列を属性として識別したプロファイル
- 基数タイブレーク - 低基数列のタイブレーカ
- マイナスのペナルティ - マイナスの列のスコアは低くなる
- 緯度経度スコア
一実施形態によれば、表1の上記のルールは、中程度の基数を持つデータセット内の列に適用できるが、データセット内のデータの各列にスコアが付けられるように、データセット内のデータのすべての列に他のルールセットを提供することもできる。スコアリングデータ列には、MS密度2221、配給IQR2222、およびクリーンタイムスパンスコア2224も含まれ得る。
【0144】
一実施形態によれば、システムおよび方法は、次いで、データセット内のデータ列をスコアリングでき、視覚化スコアリング2230で使用するのに最も意味のあるN列のデータ(指標および測定値)のセットを選択する(例えば、視覚化スコアリングのために計算されるスコア、複数の視覚化スコアまたは視覚化スコアと呼ぶことができる)。
【0145】
一実施形態によれば、データセットからスコア付けされ選択されたN個の列のデータが渡されると、システムおよび方法は、ルールのセットに基づいて、N個のデータ列に基づいてM個のデータ視覚化2231を生成できる。これらのルールには、様々なタイプのデータ列に対してどのタイプのデータ視覚化を利用するかを決定するためのルールを含み得る。例えば、このルールセットは、データの列について計算された様々な統計に応じて、どのタイプのデータ視覚化を利用するかを選択するためのルールを含み得る(例えば、或るN列のデータに対して棒グラフの視覚化を選択し、他の或るN列のデータに対して散布図を選択する)。
【0146】
一実施形態によれば、N個のデータ列として説明されるが、ここで、このN個のデータ列は、データ列間の比率が計算された場合など、データセット2200からの直接のデータ列と必ずしも相関しているわけではないことに注意されたい。
【0147】
一実施形態によれば、決定されたN個のデータ列に基づいてこれらM個のデータ視覚化を生成する際に、構造化言語クエリ(LSQL)2223を利用して、データセットから要求されたデータを引き出すことができる。さらに、これらのM個のデータ視覚化を生成するとき、システムおよび方法は、潜在的により価値のあるデータ視覚化を生成するために、データの列に対して追加の操作を実行できる。これらの操作は、データ列間の比率の計算、データの正規化、データのインデックス付けなどを含み得る。
【0148】
一実施形態によれば、M個のデータ視覚化が生成されると、データ視覚化スコアリングエンジン2232を利用して、生成されたM個のデータ視覚化のそれぞれをスコアリングすることができる。データ視覚化の各タイプ(棒グラフ、散布図、円グラフ、折れ線グラフなど)について、或るまたは全てのルールを利用して、M個のデータ視覚化それぞれについてスコアを生成することができる。例えば、生成された各データ視覚化内の変動に基づいてスコアリングを行うことができる。外れ値、明確な傾向(折れ線グラフの傾きなど)を示すデータ視覚化、および、一般に、より大きな視覚的コントラストを示すデータ視覚化(例えば、プロットされたデータ間の視覚的に高いコントラストが表示されるデータ表示などにより、システムのユーザにとってより有益であると考えられるデータ視覚化)は、そうでないものよりスコアが高くなり得る。
【0149】
一実施形態によれば、例えば散布図の場合、システムおよび方法は分散分析(各点から散布図上のデータ点に適合する傾向線までの平均距離)を利用することができる。より高い分散分析スコアを持つデータセットの列の散布図(近似トレンドラインからより離れた多くの点があることを意味する)は、より低い分散分析スコアを持つデータセットの他の列の散布図(データポイントが緊密にグループ化されたプロットを意味する)よりも高いスコアになる。
【0150】
一実施形態によれば、M個の視覚化をスコアリングする際に、特定の要素を考慮して、スコアリングエンジン2232によってM個の視覚化がどのようにスコアリングされるかを決定することができる。これらには、例えば、高コントラスト、明らかな傾向線が含まれる。データプロットまたはデータポイントのコントラストを示すデータ視覚化は、一般に、コントラストが低いデータ視覚化(例えば、平坦な線を示すデータ視覚化)よりもユーザにとって優れている/より有益/興味を引くものである。例えば、高密度の時間レベルに依存するデータ視覚化では、それに関連する多数の傾向グラフをプロットすることができる。その後、データ視覚化で傾向データを探すときに、システムおよび方法は明らかな傾向線を持つグラフを表示することができる。
【0151】
一実施形態によれば、システムおよび方法がM個の視覚化を獲得すると、作成されたM個の視覚化から、上位Y(最高スコア)の視覚化2234が選択され、有限数の視覚化をユーザインターフェースで選択可能な方法で表示する2241ユーザインターフェースレンダリング2240を介して表示される。
【0152】
一実施形態によれば、上位Y個の視覚化がユーザインターフェースを介して表示される一方で、システムおよび方法は、上位Y個の視覚化のいずれかまたはすべてがユーザインターフェースを介して却下または破棄された場合、システムおよび方法がユーザインターフェースを介してM個の視覚化の次に高いスコアを表示し続けることができるように、M個の視覚化の他の高スコアを追跡し続けることができる。
【0153】
一実施形態によれば、上記の説明は、Y個の視覚化が最も高いスコアを獲得するトピック内のM個の上位視覚化を生成する際に利用されるデータセットからのN個の上位データ列などの或る整数を利用する。これらの整数値は、データ分析環境のシステムおよび方法によって自動的に設定することも、そのような環境のユーザによって設定することもできる。これらの値の例は、(指標と測定値)のN=10列、トピック内の視覚化の数250、およびこれら250の視覚化の上位10件の視覚化である。
【0154】
図23は、一実施形態による、分析データの自動洞察を生成するための方法のフローチャートである。
【0155】
一実施形態によれば、ステップ2310で、本方法は、テナントによるデータの記憶のために、分析アプリケーション環境によるデータウェアハウスへのアクセスを提供する、1つまたは複数のプロセッサを含むコンピュータを提供することができる。
【0156】
一実施形態によれば、ステップ2320で、方法は、分析アプリケーション環境で、複数の列を含むデータセットを受信することができる。
【0157】
一実施形態によれば、ステップ2330で、この方法は、データセットの複数の列のそれぞれについて一組の統計を計算することができる。
【0158】
一実施形態によれば、ステップ2340で、方法は、複数の列のそれぞれについての統計の各セットに基づいて、複数の列の各列についてスコアを生成することができる。
【0159】
一実施形態によれば、ステップ2350で、方法は複数の列のセットを選択することができ、その選択は各列のスコアに基づいて行われる。
【0160】
一実施形態によれば、ステップ2360で、方法は、複数の列の選択されたセットについて複数のデータ視覚化を生成することができる。
【0161】
一実施形態によれば、ステップ2370で、方法は、ユーザインターフェースを介して表示するために、ルールのセットに基づいて、複数のデータ視覚化のセットを選択することができる。
【0162】
一実施形態によれば、複数の列の各列に対して生成されるスコアは、データセットの複数の列のそれぞれに対する統計の各セットを操作する構成可能なルールのセットを利用することができる。
【0163】
一実施形態によれば、ユーザインターフェースを介して表示する複数のデータ視覚化を選択するために利用されるルールのセットは、視覚的コントラストの高いデータ視覚化を視覚的コントラストの低いデータ視覚化よりも高くスコアリングするルールを含むことができる。
【0164】
様々な実施形態によれば、本明細書の教示は、本開示の教示に従ってプログラムされた1つまたは複数のプロセッサ、メモリおよび/またはコンピュータ可読記憶媒体を含む、1つまたは複数の従来の汎用または専用コンピュータ、コンピューティングデバイス、機械、またはマイクロプロセッサを使用して都合よく実装され得る。ソフトウェア技術の当業者には明らかなように、適切なソフトウェアコーディングは、本開示の教示に基づいて、熟練したプログラマーによって容易に作成され得る。
【0165】
いくつかの実施形態では、本明細書の教示は、本教示の処理のいずれかを実行するようにコンピュータをプログラムするために使用できる命令が記憶された非一時的なコンピュータ可読記憶媒体(複数の媒体)であるコンピュータプログラム製品を含むことができる。このような記憶媒体の例としては、ハードディスクドライブ、ハードディスク、ハードドライブ、固定ディスク、またはその他の電気機械データ記憶装置、フロッピー(登録商標)ディスク、光ディスク、DVD、CD-ROM、マイクロドライブ、および光磁気ディスク、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、フラッシュメモリデバイス、磁気カードまたは光カード、ナノシステム、または命令および/またはデータの非一時的な記憶に適した他のタイプの記憶媒体またはデバイスが挙げられるが、これらに限定されない。
【0166】
前述の説明は、例示と説明を目的として提供されたものである。網羅的であることや、開示された正確な形式に保護の範囲を限定することを意図したものではない。多くの修正および変形が当業者には明らかであろう。
【0167】
例えば、ここで提供される例のいくつかは、エンタープライズソフトウェアアプリケーションまたはデータ環境(例えば、Oracle Fusion Applications環境など)を使用した、または、サービスとしてのソフトウェア(SaaS)またはクラウド環境(Oracle Analytics CloudやOracle Cloud Infrastructure環境など)のコンテキスト内での分析アプリケーション環境の動作を示しているが、様々な実施形態によれば、本明細書で説明されるシステムおよび方法は、他のタイプのエンタープライズソフトウェアアプリケーションまたはデータ環境、クラウド環境、クラウドサービス、クラウドコンピューティング、または他のコンピューティング環境とともに使用することができる。
【0168】
実施形態は、本教示の原理およびその実際の応用を最もよく説明するために選択され説明されており、それによって他の当業者が、企図される特定の用途に適した様々な修正を加えた様々な実施形態を理解できるようにする。範囲は以下の特許請求の範囲およびその均等物によって規定されることが意図されている。
【国際調査報告】