(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-27
(45)【発行日】2024-06-04
(54)【発明の名称】推奨チャートを生成するグラフィカルユーザインターフェースを提供する方法、プログラム、及び装置
(51)【国際特許分類】
G06F 3/0481 20220101AFI20240528BHJP
G06F 3/04842 20220101ALI20240528BHJP
G06N 3/02 20060101ALI20240528BHJP
【FI】
G06F3/0481
G06F3/04842
G06N3/02
(21)【出願番号】P 2020096836
(22)【出願日】2020-06-03
【審査請求日】2023-05-19
(32)【優先日】2019-06-27
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】ジャオ ジアン
【審査官】遠藤 孝徳
(56)【参考文献】
【文献】米国特許出願公開第2013/0097177(US,A1)
【文献】特開2010-92116(JP,A)
【文献】米国特許出願公開第2017/0017360(US,A1)
【文献】特許第6101985(JP,B2)
【文献】特開2016-21225(JP,A)
【文献】特開2006-114013(JP,A)
【文献】特許第6404889(JP,B2)
【文献】米国特許第6792595(US,B1)
【文献】米国特許出願公開第2019/0294631(US,A1)
【文献】特許第4550074(JP,B2)
【文献】特許第5423030(JP,B2)
【文献】特開2018-49459(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/048 - 3/04895
G06N 3/00 - 3/126
(57)【特許請求の範囲】
【請求項1】
推奨チャートを生成するグラフィカルユーザインターフェース(GUI)を提供する方法であって、
プロセッサが、
前記GUI上に第1のビューを提供し、前記第1のビューがマップ上に複数のチャートの表現を提供するように構成され、前記複数のチャートの表現が、前記複数のチャートの複数のベクトルへの符号化ベクトル化から導出される類似度に基づいて、前記第1のビュー上の前記マップ内に分布され、
前記第1のビューの前記マップ内の領域を選択すると、前記選択された領域と、前記選択された領域内又は前記選択された領域に近接する前記複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成し、
前記GUIの第2のビューに前記推奨チャートを表示し、
前記推奨チャートと前記複数のチャートとの間の類似度に基づいて、前記第1のビューの前記マップ上の前記領域内に前記推奨チャート
に対応するチャートの表現を
追加する、
方法。
【請求項2】
前記複数のチャートの前記複数のベクトルへの前記符号化ベクトル化は、文法変分自己符号化器(GVAE)によって訓練されたベクトル化プロセスによって行われる、請求項1に記載の方法。
【請求項3】
前記複数のチャートの表現は、前記複数のベクトル間の前記類似度に基づいて前記複数のチャートの表現のそれぞれの間の距離を決定するように構成された次元削減法により決定されるように、前記第1のビューの前記マップ内に分布される、請求項1に記載の方法。
【請求項4】
前記選択された領域と、前記選択された領域内又は前記選択された領域に近接する前記複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成することは、
前記選択された領域内の点をサンプリングし、
前記選択された領域内の点に対応するベクトルを決定し、
前記ベクトルを復号されたチャートに変換するように構成されたベクトル復号化プロセスを実行し、
前記復号されたチャートを前記推奨チャートとして提供すること、
を含む、請求項1に記載の方法。
【請求項5】
前記第1のビューの前記マップ内に分布された前記複数のチャートの表現から表現の選択を受信するために、前記チャートを生成するソースコードを編集するテキストエディタと、前記チャートを修正するドロップダウンコントロールとを備える第3のビューを生成すること
を更に含む、請求項1に記載の方法。
【請求項6】
前記第1のビューの前記マップ内に分布された前記複数のチャートの表現から表現の選択を受信するために、前記複数のチャートの表現に対応する前記複数のベクトルからのベクトルを、チャートに変換するように構成されたベクトル復号化プロセスを行い、
表示のために前記チャートを生成すること、
を更に含む、請求項1に記載の方法。
【請求項7】
推奨チャートを生成するグラフィカルユーザインターフェース(GUI)を提供するプログラムであって、
前記GUI上に第1のビューを提供し、前記第1のビューがマップ上に複数のチャートの表現を提供するように構成され、前記複数のチャートの表現が、前記複数のチャートの複数のベクトルへの符号化ベクトル化から導出される類似度に基づいて、前記第1のビュー上の前記マップ内に分布され、
前記第1のビューの前記マップ内の領域を選択すると、前記選択された領域と、前記選択された領域内又は前記選択された領域に近接する前記複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成し、
前記GUIの第2のビューに前記推奨チャートを表示し、
前記推奨チャートと前記複数のチャートとの間の類似度に基づいて、前記第1のビューの前記マップ上の前記領域内に前記推奨チャート
に対応するチャートの表現を
追加すること、
を含む方法をコンピュータに実行させる、プログラム。
【請求項8】
前記複数のチャートの前記複数のベクトルへの前記符号化ベクトル化は、文法変分自己符号化器(GVAE)によって訓練されたベクトル化プロセスによって行われる、請求項7に記載のプログラム。
【請求項9】
前記複数のチャートの表現は、前記複数のベクトル間の前記類似度に基づいて前記複数のチャートの表現のそれぞれの間の距離を決定するように構成された次元削減法により決定されるように、前記第1のビューの前記マップ内に分布される、請求項7に記載のプログラム。
【請求項10】
前記選択された領域と、前記選択された領域内又は前記選択された領域に近接する前記複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成することは、
前記選択された領域内の点をサンプリングし、
前記選択された領域内の前記点に対応するベクトルを決定し、
前記ベクトルを復号されたチャートに変換するように構成されたベクトル復号化プロセスを実行し、
前記復号されたチャートを前記推奨チャートとして提供すること、
を含む、請求項7に記載のプログラム。
【請求項11】
前記方法が、
前記第1のビューの前記マップ内に分布された前記複数のチャートの表現から表現の選択を受信するために、前記チャートを生成するソースコードを編集するテキストエディタと、前記チャートを修正するドロップダウンコントロールと、を備える第3のビューを生成すること
を更に含む、請求項7に記載のプログラム。
【請求項12】
前記方法が、
前記第1のビューの前記マップ内に分布された前記複数のチャートの表現から表現の選択を受信するために、前記複数のチャートの表現に対応する前記複数のベクトルからのベクトルを、チャートに変換するように構成されたベクトル復号化プロセスを行い、
表示のために前記チャートを生成すること、
を更に含む、請求項7に記載のプログラム。
【請求項13】
推奨チャートを生成するグラフィカルユーザインターフェース(GUI)を提供するように構成された装置であって、
前記GUI上に第1のビューを提供し、前記第1のビューがマップ上に複数のチャートの表現を提供するように構成され、前記複数のチャートの表現が、前記複数のチャートの複数のベクトルへの符号化ベクトル化から導出される類似度に基づいて前記第1のビュー上の前記マップ内に分布され、
前記第1のビューの前記マップ内の領域を選択すると、前記選択された領域と、前記選択された領域内又は前記選択された領域に近接する前記複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成し、
前記GUIの第2のビューに前記推奨チャートを表示し、
前記推奨チャートと前記複数のチャートとの間の類似度に基づいて、前記第1のビューの前記マップ上の前記領域内に前記推奨チャート
に対応するチャートの表現を
追加すること、
を行うように構成される、プロセッサ、
を備える、装置。
【請求項14】
前記複数のチャートの前記複数のベクトルへの前記符号化ベクトル化は、文法変分自己符号化器(GVAE)によって訓練されたベクトル化プロセスによって行われる、請求項13に記載の装置。
【請求項15】
前記複数のチャートの表現は、前記複数のベクトル間の前記類似度に基づいて前記複数のチャートの表現のそれぞれの間の距離を決定するように構成された次元削減法により決定されるように、前記第1のビューの前記マップ内に分布される、請求項13に記載の装置。
【請求項16】
前記プロセッサは、
前記選択された領域内の点をサンプリングし、
前記選択された領域内の前記点に対応するベクトルを決定し、
前記ベクトルを復号されたチャートに変換するように構成されたベクトル復号化プロセスを実行し、
前記復号されたチャートを前記推奨チャートとして提供すること、
を行うことによって、前記選択された領域と、前記選択された領域内又は前記選択された領域に近接する前記複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成するように構成される、請求項13に記載の装置。
【請求項17】
前記プロセッサは、
前記第1のビューの前記マップ内に分布された前記複数のチャートの表現から表現の選択を受信するために、前記チャートを生成するソースコードを編集するテキストエディタと、前記チャートを修正するドロップダウンコントロールと、を備える第3のビューを生成する
ように更に構成される、請求項13に記載の装置。
【請求項18】
前記プロセッサは、
前記第1のビューの前記マップ内に分布された前記複数のチャートの表現から表現の選択を受信するために、前記複数のチャートの表現に対応する前記複数のベクトルからのベクトルを、チャートに変換するように構成されたベクトル復号化プロセスを行い、
表示のために前記チャートを生成すること、
を行うように更に構成される、請求項13に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、機械学習に関し、より具体的には、機械学習を利用し、グラフィカルユーザインターフェース(GUI)を介して適切なデータチャートを生成し、対話的にデータ探索を指示する方法、プログラム、及び装置を対象とする。
【背景技術】
【0002】
探索的視覚分析(exploratory visual analysis:EVA)は、分析者がデータの様々な部分でチャートをプロットするなどの視覚的な方法を使用して、興味深い調査結果を特定し、データに基づいた意思判定を行う反復プロセスである。EVAは、分析者がデータに精通していない場合、又は、完全に自動化された方法を開発することが難しく、データ探索において領域知識が強く要求される曖昧な仮説及び不明確なタスクを有している場合に、有用であり得る。このEVAアプローチは、関連技術における多くの市販ツールによって広く促進され、サポートされている。
【0003】
残念ながら、データセットが大きく複雑になる場合(例えば、多くのデータ数及び属性を含む場合)、EVAプロセスは困難になる。視覚分析に利用する属性、データの一部、及びチャートを符号化するために多数の選択肢が存在するため、探索空間が過度に大きくなる。関連技術の解決策の1つは、複数の分析者に共同設定においてEVAを実行させることを含む。例えば、各分析者は個別にデータの様々な観点を検査し、その後、ある時点でそれらの結果(例えば、データチャート)を結合又は引き渡し、そのようなプロセスを繰り返し実行し続けることができる。
【0004】
探索的視覚分析(EVA)は、ユーザからの領域知識をデータ分析プロセスに統合することにより利用することができる。データセットがより大きく複雑で、マルチユーザの共同作業が必要な場合、このプロセスは困難になり得る。しかし、このような分析を効果的に要約し、データ探索のための推奨及び指示を更に示すことは、依然として関連技術の実装における課題である。
【0005】
EVA実装のためにインターフェースを提供する際に考慮する必要がある、いくつかの問題がある。例えば、複数の分析者から作成されたチャートから情報を学習することができるようにし、内在する調査結果の効果的なレビューを容易にするためのインターフェースを提供する必要がある。過去の研究を十分に理解することは、分析者間の知識ベースの構築及び調整にとって重要であり得る。別の例では、学習した情報を利用してデータ探索の将来の方向を決定することができるように、インターフェースを改良する必要がある。視覚的な探索は、未知の場所にある未知のターゲットのためにデータ空間を検索することを含み、チャート用の多種多様な視覚符号化オプションを伴う。したがって、この手動プロセスで有益なガイダンスを提供することは、分析者が最小限の労力で目標を達成するための重要なGUI機能であり得る。
【先行技術文献】
【非特許文献】
【0006】
【文献】Powerbi, 2019年6月26日検索; https://powerbi.microsoft.com/en-us/
【文献】Project jupyter, 2019年6月26日検索; http://jupyter.org/
【文献】Tableau software; 2019年6月26日検索, https://www.tableau.com/
【文献】BREHMER, M. et al. "A Multi-Level Typology of Abstract Visualization Tasks" IEEE Transactions on Visualization and Computer Graphics, 2013, pp.2376-2385, 19巻12号
【文献】DIBIA, V. et al. "Data2Vis: Automatic Generation of Data Visualizations Using Sequence to Sequence Recurrent Neural Networks" CORR, 2018年11月, arXiv:1804.03126
【文献】ISENBERG, P. et al. "Collaborative Visualization: Definition, Challenges, and Research Agenda" Information I Visualization Journal (IVS), SAGE, 2011年, Special Issue on Information Visualization: State of the Field and New Research Directions, 2011年11月5日, pp.310-326, 10 (4)
【文献】JANKUN-KELLY, TJ., et al. "A Model and Framework for Visualization Exploration" IEEE Transactions on Visualization and Computer Graphics, 2007年3月, pp. 357-369, 13(2)
【文献】KUSNER, M. et al. "Grammar Variational Autoencoder" ICML"17 Proceedings of the 34th International Conference on Machine Learning, 2007年8月6日~11日, pp. 1945-1954; Volume 70; オーストラリア国ニューサウスウェールズ州シドニー
【文献】MACKINLAY, J. et al. "Show Me: Automatic Presentation for Visual Analysis" IEEE Transactions on Visualization and Computer Graphics, 2007年11月, pp. 1137-1144; 13(6)
【文献】MAHYAR, N. et al. "Supporting Communication and Coordination in Collaborative Sensemaking" IEEE Transactions Ibn Visualization and Computer Graphics, 2014年12月, pp. 1633-1642, 20(12)
【文献】PELTONEN, J. et al. "Information retrieval approach to meta-visualization" Machine Learning, 2015年5月; pp. 189-229, 99(2)
【文献】SARVGHAD, A. et al. "Exploiting Analysis History to Support Collaborative Data Analysis" In Proceedings of Graphics Interface Conference, 2015年6月3日~5日, pp. 123-130, カナダ国ノヴァスコシア州ハリファックス
【文献】SATYANARAYAN, A. et al. "Vega-Lite: A Grammar of Interactive Graphics" IEEE Transactions on Visualization and Computer Graphics, 2017年1月, pp. 341-350, 23(1)
【文献】TOBIASZ, M. et al. "Lark: Coordinating Co-located Collaboration with Information Visualization" IEEE Transactions on I Visualization and Computer Graphics, 2009年11月/12月, pp. 1065-1072, 15(6)
【文献】VARTAK, M. et al. "SEEDB: Automatically Generating Query Visualizations" Proceedings of VLDB Endowment, 2014年9月1日~5日, pp. 1581-1584, 7巻13号
【文献】WONGSUPHASAWAT, K. et al. "Towards A General-Purpose Query Language for Visualization Recommendation" In Proceedings of the Workshop on Human-in-the-Loop Data Analytics, HILDA '16, 2016年6月26日, アメリカ合衆国カリフォルニア州サンフランシスコ
【文献】WONGSUPHASAWAT, K. et al. "Voyager: Exploratory Analysis via Faceted Browsing of Visualization Recommendations" IEEE Transactions on Visualization and Computer Graphics, 2015年10月25日; pp. 649-658, 22 (1)
【文献】WONGSUPHASAWAT, K. et al. "Voyager 2: Augmenting Visual Analysis with Partial View Specifications" In Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems, CHI '17, 2017年5月6日~11日, pages 2648-2659, アメリカ合衆国コロラド州デンバー
【文献】XU, S. et al. "Chart Constellations: Effective Chart Summarization for Collaborative and Multi-User Analyses" Eurographics Conference on Visualization (EuroVis) 2018年, pp. 75-86, 37巻3号
【文献】ZHAO, J. et al. "Supporting Handoff in Asynchronous Collaborative Sensemaking Using Knowledge-Transfer Graphs" IEEE Transactions on Visualization and Computer Graphics, 2017年12月18日, pp. 340-350, 24(1)
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、グラフィカルユーザインターフェース(GUI)を介して推奨データチャートを生成し、対話的なデータ探索を可能とする方法、プログラム、及び装置を提供することを課題とする。
【課題を解決するための手段】
【0008】
上述した課題に対処するために、本明細書に記載の例示的な実施形態は、メタ可視化アプローチを利用し、マルチユーザ探索的視覚分析において生成されたデータチャートの視覚的要約を提供するGUIツール、並びに有望な将来のデータ探索のための対話的指示を含む。本明細書に記載のGUIツールの例示的な実施形態は、深層学習技術(例えば、文法変分自己符号化器(grammar variational autoencoder:GVAE))を利用して、チャートのコンパクトなベクトル表現を学習し、それらの表現を意味及び類似度で2次元キャンバス(例えば、2次元マップ)上に可視化する。この要約から、分析者は、現在の視覚探索空間内のチャートのクラスタ、トレンド、及び穴(欠陥)を特定することができる。さらに、GUIツールの例示的な実施形態は、選択された局所領域に基づいてチャートの推奨を提供し、かつチャート生成のために訓練された自己符号化器を使用することによって、空間の対話的検査を可能にする。したがって、分析者は、推奨されたチャートを精緻化することにより、そのような情報を利用して分析を進めることができる。
【0009】
本開示の態様は、推奨されたチャートを生成するためのグラフィカルユーザインターフェース(GUI)を提供する方法を含むことができ、本方法は、GUI上に第1のビューを提供し、第1のビューがマップ上に複数のチャートの表現を提供するように構成され、複数のチャートの表現が、複数のチャートの複数のベクトルへの符号化ベクトル化(encoded vectorization)から導出される類似度に基づいて第1のビュー上のマップ内に分布され、第1のビュー上のマップ内の領域を選択すると、選択された領域と、選択された領域内又は選択された領域に近接する複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成し、GUIの第2のビューに推奨チャートを表示し、推奨チャートと複数のチャートとの間の類似度に基づいて、第1のビューのマップ上の領域内に推奨チャートの別の表現を提供すること、を含む。
【0010】
複数のチャートの複数のベクトルへの符号化ベクトル化は、文法変分自己符号化器(GVAE)によって訓練されたベクトル化プロセスによって行われてもよい。
【0011】
複数のチャートの表現は、複数のベクトル間の類似度に基づいて複数のチャートの表現のそれぞれの間の距離を決定するように構成された次元削減法により決定されるように、第1のビューのマップ内に分布されてもよい。
【0012】
本方法は、選択された領域と、選択された領域内又は選択された領域に近接する複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成することは、選択された領域内の点をサンプリングし、選択された領域内の点に対応するベクトルを決定し、ベクトルを復号されたチャートに変換するように構成されたベクトル復号化プロセスを実行し、復号されたチャートを推奨チャートとして提供すること、を含んでもよい。
【0013】
本方法は、第1のビューのマップ内に分布された複数のチャートの表現から表現の選択を受信するために、チャートを生成するソースコードを編集するテキストエディタと、チャートを修正するドロップダウンコントロールとを備える第3のビューを生成することを更に含んでもよい。
【0014】
本方法は、第1のビューのマップ内に分布された複数のチャートの表現から表現の選択を受信するために、複数のチャートの表現に対応する複数のベクトルからのベクトルを、チャートに変換するように構成されたベクトル復号化プロセスを行い、表示のためにチャートを生成すること、を更に含んでもよい。
【0015】
本開示の態様は、推奨チャートを生成するグラフィカルユーザインターフェース(GUI)を提供するプログラムを含むことができ、このプログラムは、GUI上に第1のビューを提供し、第1のビューがマップ上に複数のチャートの表現を提供するように構成され、複数のチャートの表現が、複数のチャートの複数のベクトルへの符号化ベクトル化から導出される類似度に基づいて第1のビュー上のマップ内に分布され、第1のビュー上のマップ内の領域を選択すると、選択された領域と、選択された領域内又は選択された領域に近接する複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成し、GUIの第2のビューにチャート推奨を表示し、チャート推奨と複数のチャートとの間の類似度に基づいて、第1のビューのマップ上の領域内にチャート推奨の別の表現を提供すること、を含む方法をコンピュータに実行させる。
【0016】
複数のチャートの複数のベクトルへの符号化ベクトル化は、文法変分自己符号化器(GVAE)によって訓練されたベクトル化プロセスによって行われてもよい。
【0017】
複数のチャートの表現は、複数のベクトル間の類似度に基づいて複数のチャートの表現のそれぞれの間の距離を決定するように構成された次元削減法により決定されるように、第1のビューのマップ内に分布されてもよい。
【0018】
選択された領域と、選択された領域内又は選択された領域に近接する複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成することは、選択された領域内の点をサンプリングし、選択された領域内の点に対応するベクトルを決定し、ベクトルを復号されたチャートに変換するように構成されたベクトル復号化プロセスを実行し、復号されたチャートを推奨チャートとして提供すること、を含んでもよい。
【0019】
本方法が、第1のビューのマップ内に分布された複数のチャートの表現から表現の選択を受信するために、チャートを生成するソースコードを編集するテキストエディタと、チャートを修正するドロップダウンコントロールと、を備える第3のビューを生成することを更に含んでもよい。
【0020】
本方法が、第1のビューのマップ内に分布された複数のチャートの表現から表現の選択を受信するために、複数のチャートの表現に対応する複数のベクトルからのベクトルを、チャートに変換するように構成されたベクトル復号化プロセスを行い、表示のためにチャートを生成すること、を更に含んでもよい。
【0021】
本開示の態様は、推奨チャートを生成するグラフィカルユーザインターフェース(GUI)を提供するシステムを含むことができ、本システムは、GUI上に第1のビューを提供する第1のビュー提供手段であって、第1のビューがマップ上に複数のチャートの表現を提供するように構成され、複数のチャートの表現が、複数のチャートの複数のベクトルへの符号化ベクトル化から導出される類似度に基づいて第1のビュー上のマップ内に分布される、提供手段と、第1のビュー上のマップ内の領域を選択すると、選択された領域と、選択された領域内又は選択された領域に近接する複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成する生成手段と、GUIの第2のビューにチャート推奨を表示する表示手段と、チャート推奨と複数のチャートとの間の類似度に基づいて、第1のビュー上のマップ上の領域内にチャート推奨の別の表現を提供するチャート推奨提供手段と、を含む。
【0022】
本開示の態様は、推奨チャートを生成するグラフィカルユーザインターフェース(GUI)を提供するように構成された装置を含むことができ、本装置は、GUI上に第1のビューを提供し、第1のビューがマップ上に複数のチャートの表現を提供するように構成され、複数のチャートの表現が、複数のチャートの複数のベクトルへの符号化ベクトル化から導出される類似度に基づいて第1のビュー上のマップ内に分布され、第1のビュー上のマップ内の領域を選択すると、選択された領域と、選択された領域内又は選択された領域に近接する複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成し、GUIの第2のビューにチャート推奨を表示し、チャート推奨と複数のチャートとの間の類似度に基づいて、第1のビュー上のマップ上の領域内にチャート推奨の別の表現を提供すること、を行うように構成される、プロセッサを含む。
【0023】
複数のチャートの複数のベクトルへの符号化ベクトル化は、文法変分自己符号化器(GVAE)によって訓練されたベクトル化プロセスによって行われてもよい。
【0024】
複数のチャートの表現は、複数のベクトル間の類似度に基づいて複数のチャートの表現のそれぞれの間の距離を決定するように構成された次元削減法により決定されるように、第1のビューのマップ内に分布されてもよい。
【0025】
プロセッサは、選択された領域内の点をサンプリングし、選択された領域内の点に対応するベクトルを決定し、ベクトルを復号されたチャートに変換するように構成されたベクトル復号化プロセスを実行し、復号されたチャートを推奨チャートとして提供すること、
を行うことによって、選択された領域と、選択された領域内又は選択された領域に近接する複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成するように構成されてもよい。
【0026】
プロセッサは、第1のビューのマップ内に分布された複数のチャートの表現から表現の選択を受信するために、チャートを生成するソースコードを編集するテキストエディタと、チャートを修正するドロップダウンコントロールと、を備える第3のビューを生成するように更に構成されてもよい。
【0027】
プロセッサは、第1のビューのマップ内に分布された複数のチャートの表現から表現の選択を受信するために、複数のチャートの表現に対応する複数のベクトルからのベクトルを、チャートに変換するように構成されたベクトル復号化プロセスを行い、表示のためにチャートを生成すること、を行うように更に構成されてもよい。
【図面の簡単な説明】
【0028】
【
図1】例示的な実施形態による、提案されたGUIツールのフロントエンド及びバックエンドを含む例示的なシステム図である。
【
図2(a)】例示的な実施形態による、データ可視化のための例示的な仕様を示す図である。
【
図2(b)】例示的な実施形態による、GVAEを利用することによる符号化及び復号化の例を示す図である。
【
図3】例示的な実施形態による、ネットワーク構造の一例を示す図である。
【
図4】例示的な実施形態による、GUIツールのスクリーンショットの例示的な部分を示す図である。
【
図5(a)】例示的な実施形態による、GUIツールの例示的なビューを示す図である。
【
図5(b)】例示的な実施形態による、GUIツールの例示的なビューを示す図である。
【
図5(c)】例示的な実施形態による、GUIツールの例示的なビューを示す図である。
【
図5(d)】例示的な実施形態による、GUIツールを介してチャート推奨を生成するための例示的なフロー図である。
【
図6】いくつかの例示的な実施形態での使用に適した例示的なコンピュータ装置を有する例示的なコンピューティング環境を示す図である。
【発明を実施するための形態】
【0029】
以下の発明を実施するための形態は、図面の更なる詳細及び本出願の例示的な実施形態を提供する。図と図の間で重複する要素の参照番号及び説明は、明確性のために省略される。本明細書全体を通して使用される用語は、例として提供されており、限定することを意図していない。例えば、「自動」という用語の使用は、本出願の実施形態を実践する当業者の所望の実装に応じて、実装の特定の態様に対するユーザ又は管理者の制御を含む、完全自動又は半自動の実装を含み得る。選択は、ユーザインターフェース又は他の入力手段を介してユーザによって行われるか、又は所望のアルゴリズムを介して実施され得る。本明細書に記載の例示的な実施形態は、単独で又は組み合わせて利用することができ、例示的な実施形態の機能性は、所望の実装に従って任意の手段によって実施することができる。
【0030】
図1は、例示的な実施形態による、提案されたGUIツールのフロントエンド及びバックエンドを含む例示的なシステム図を示す。例示的な実施形態は、バックエンド分析エンジン及びフロントエンド視覚インターフェースを有するウェブベースアプリケーションの形態であってよいGUIツールを含み、このアーキテクチャが
図1に示されている。
【0031】
GUIツールのバックエンドは、データ記憶及び分析モジュール101、チャートエンコーダ102、並びにチャートデコーダ103を含むことができる。データ記憶及び分析モジュール101は、チャート及びそれらの関連情報を記録し、基本的な計算タスクを処理する。チャートエンコーダ102は、データチャートを数値ベクトルに変換するように構成され、チャートデコーダは逆の動作を行うように構成される。エンコーダ及びデコーダは、文法変分自己符号化器(GVAE)100と呼ばれる深層学習モデルを通して訓練される。
【0032】
フロントエンドは、3つの対話可能に調整されたビュー、即ち、1)選択されたチャートを表示、編集、及び作成するための検査ビュー110、2)共同視覚探索分析中に生成されたすべてのチャートを提示する要約ビュー120、並びに3)提案されたチャートを示す推奨ビュー130、を有するGUIを含むことができる。
【0033】
図1の矢印は、一般的なデータフローを示す。より具体的には、入力チャートは、データ記憶及び分析モジュール101において処理され、次いで、チャートエンコーダ102に供給されてベクトル表現が生成され、これは2次元意味空間上でチャートの視覚的要約を作成するために更に使用される。要約ビューから、ユーザは、現在の分析の全体像を取得し、有望な方向を特定し、推奨ビュー130に表示されたチャート推奨を活用することができる。提案されたチャートは、ユーザによって、例えば、2次元空間内の関心領域を選択するなどの、対話的指示を介して提供される。チャートデコーダ103は、ユーザ入力及び既存のチャートに基づいて、推奨を生成するために使用されるチャートを自動的に生成する。さらに、元のチャート及び推奨チャートを含むすべてのチャートを検査ビューで検査し、バックエンドに記録される新しいチャートを作成するために更に調整することができる。
【0034】
本明細書に記載されるように、例示的な実施形態は、文法変分自己符号化器(GVAE)100を使用して、データチャートのエンコーダ102及びデコーダ103を訓練する。本目的は、教師なし学習法を用いてチャートのベクトル表現を取得し、任意のベクトルをチャートに逆変換することができるようにすることである。チャートエンコーダ102によって提供されるベクトルに基づいて、例示的な実施形態は、チャート間の意味的距離を計算し、その距離を利用して次元削減を実行することができ、したがって、意味論を用いて下位次元空間においてチャートを要約する。さらに、チャートデコーダ103に基づいて、例示的な実施形態は、空間内のベクトルからチャートを生成して、ユーザに推奨を提供することができる。
【0035】
例示的な実施形態は、VegaLiteなどの任意の宣言型言語をデータ可視化に使用して、データチャートを木構造で表すことができる。
図2(a)は、例示的な実施形態による、データ可視化のための例示的な仕様を示す。
図2(a)に示す例は、ネストされた書式(例えば、木構造)を有するJavaScript Object Notation(JSON)オブジェクトであるVegaLite仕様を含むが、データチャートを表すための他の仕様を利用することも可能であり、本明細書に記載の例示的な実施形態は、特にこれらに限定されない。GVAEアプローチに続いて、この構造は、ルールの集合によって生成された文脈自由文法木と見なされ、各ルールはワンホット(one-hot)ベクトルで表される。これらのベクトルは、深層畳み込みニューラルネットワークである符号化部として一緒にタイル化される。復号化部は、非正規化対数確率ベクトル(又は「ロジット(logits)」)の集合を生成する回帰型ニューラルネットワークである。各ロジットベクトルはルールに逆マッピングされ、文法木が生成されることができる。GVAEアプローチなどの深層学習モデルアプローチを使用することによりチャートはベクトル化され、次いでベクトル化チャートは、チャートが互いにどの程度類似しているかを決定するために、最近傍などの類似度プロセスを介して比較されることができる。
【0036】
図2(b)は、例示的な実施形態による、GVAEを利用することによる符号化及び復号化の例を示す。高レベルでは、GVAEは、
図2(a)からのデータチャートのVegaLite表現で適用される。変分自己符号化器(VAE)は、連続する潜在空間内の変数zから、その変数へのデータ点xをマッピングするためのエンコーダ及びデコーダの両方を学習するように構成される。本明細書に記載の例示的な実施形態では、xはデータチャートであり、zはチャート類似度を計算するために利用され得るコンパクトなベクトル表現である。
【0037】
VAEの基礎に基づいて、GVAEは、文脈自由文法(context-free grammar:CFG)によって支配される解析木としてxを用いてエンコーダ及びデコーダマッピングを直接学習するように構成される。CFGの定義は、記号(例えば、非終端記号や終端記号など)の集合及びルール(例えば、非終端から終端記号及び非終端記号の少なくとも一方のシーケンスへのマッピング)の集合を含む。したがって、CFGは、すべての葉ノードが終端記号になるまで再帰的にルールを適用することにより生成される、可能性のある木の集合を決定する。CFGを活用するGVAEの1つの利点は、従来のVAEと比較して、デコーダで有効なデータサンプルを生成する可能性が高いことである。
【0038】
チャートのVegaLite仕様は当然のことながら木構造であるため、各チャートはCFG内のルールの集合によって生成される解析木と見なされ得る。例えば、
図2(a)は、データチャート、並びにそのVegaLite仕様、及びJSON木を生成するルールを示す。本明細書に記載の例示的な実施形態は、特定のデータセットに依存しないチャートのエンコーダ及びデコーダを学習するためにGVAEを使用する。したがって、VegaLiteのデータフィールドは共通のトークンに置き換えられ、特に、定量的フィールドはNUM(数値)に、カテゴリ/順序フィールドはSTR(文字列)に置き換えられる。さらに、例示的な実施形態は、データ及びスキーマの仕様など、視覚的な符号化に関連しない仕様を除外する。
【0039】
上述したデータの前処理により、GVAEは、
図2(b)に示すような計算アーキテクチャを使用することによって、バックエンドのチャートエンコーダ102及びデコーダ103を学習するように訓練される。チャートエンコーダ102によって使用される符号化プロセスは、(e1)VegaLite木を形成するルールを抽出すること、(e2)ワンホットベクトルの集合でルールを表現すること、及び(e3)これらのベクトルを多層畳み込みニューラルネットワーク(CNN)に供給した後、全結合層に供給し、これらのベクトルを潜在変数(すなわち、チャートのベクトル表現)にマッピングすることを含む。デコーダ103によって使用される復号化プロセスは、(d1)潜在変数を、多層回帰型ニューラルネットワーク(RNN)でベクトルの集合(ロジット)に逆変換すること、(d2)これらのベクトルによって表されるルールを導出すること、及び(d3)ルールの集合に基づいてVegaLite木を再構築することを含む。
【0040】
図3は、例示的な実施形態による、ネットワーク構造の一例を示す。例示的な実施形態では、エンコーダ102は、3つの畳み込み層を含み、これらはすべてフィルタサイズ4及びカーネルサイズ3を有し、その後に256個のニューロンを有する全結合層が続く。デコーダ103は、3つのゲート付き回帰型ユニット(GRU)層を含み、これらはすべて256個のニューロンの隠れた次元を有する。自己符号化器の目標とする潜在次元は実験において20である。4300個のVegaLite仕様(21500例にアップサンプリングした)を含む訓練のための試験データセットを適用することにより、実験結果は、モデルの調整後により高い再構成の精度(例えば、90%以上)を達成できることを示している。データセットに依存しないようにするために、データ属性名は標準トークンに置き換えられる。例えば、数値属性は「NUM」に、カテゴリ属性は「STR」に置き換えられる。したがって、このような例示的な実施形態を通じて、GVAEなどの深層モデル技術を使用することによりチャートをベクトル化することは、依然として高い再構成の精度を可能にし、それによって、チャートをより圧縮された形式でデータベースに記憶することができ、かつ、類似度を決定するために最近傍などの機械学習技術を適用することができる形式(データベクトル)でチャートを記憶することができることが示されている。
【0041】
図4は、例示的な実施形態による、GUIツールのスクリーンショットの例示的な部分を示す。前述したように、GUIツールのインターフェースは、検査ビュー、要約ビュー、及び推奨ビューという、3つの対話可能に調整されたペイン(ウィンドウ枠)を含み、これらは
図4にすべて統合されている。各ビューは、
図5(a)~
図5(c)に関してより詳細に提供される。
図4のこの例示的な実施形態では、要約ビューにおけるチャート表現の選択に基づいて、チャートが前景に表示される。このチャートは、
図1のデコーダ103に関して説明したように、選択されたチャート表現に関連付けられたベクトルを復号化することによって生成される。
【0042】
図5(a)~
図5(c)は、例示的な実施形態による、GUIツールの例示的なビューを示す。具体的には、
図5(a)は検査ビューの一例を示す。検査ビューには、一連の標準コントロール501及びテキストエディタ502が含まれており、ユーザはVegaLite言語に基づいて選択されたチャートを対話式に表示及び修正することができる。ユーザは、所望の実施に応じて、ドロップダウンコントロールから属性を選択するか、又はエディタにおいてチャートの仕様を直接編集することができる。
【0043】
図5(b)及び
図5(c)は、例示的な実施形態による、要約ビューの態様を示す。要約ビューは、チャート埋め込みパネル511、データテーブル512、及びチャートリストパネル(
図5(c))を含む。チャート埋め込みパネル511は、ユーザによって2次元空間に作成されたすべてのチャートを、次元削減技術を用いて表現する。本明細書に記載の例示的な実施形態では、バックエンドによって生成されるチャートのベクトル表現に基づいて、多次元スケーリング(MDS)などの次元削減法を使用することができる。それにより、ベクトルに対して実行されるMDSプロセスは、本明細書に記載の例示的な実施形態が、類似度測定に基づいて分布される2次元空間(例えば、マップ)内にベクトル化チャートを投影することを可能にする。リストされた各チャートは、チャート埋め込みパネル511に示されるように、2次元空間内に分布される表現に関連付けられる。この例示的な実施形態では、各表現は円形のグリフの形式であり、内側の円の色はチャートを作成したユーザの個人識別を示し、外側の部分はチャートで使用されたデータ属性を示す(異なる色又は色のシェード(影)は異なるデータ属性を示す)。ユーザは、各グリフにカーソルを合わせて、ツールチップにおいて実際のデータチャートを見ることができる。さらに、データテーブル512は、各行がチャートのレコードを示し、各列が属性を示す、元のデータセットを示している。所望の実施に応じて、データ属性は、チャート埋め込みパネル内の属性に対応して色分けされる。最後に、
図5(c)のチャートリストパネルは、所望の実装に従ってナビゲーションを可能にするために、すべてのチャートを表示する。
【0044】
チャートエンコーダによって生成された埋め込み機能を活用することによって、例示的な実施形態は、次元削減に基づく序列化技術を利用して、2次元意味空間上にチャートを投影することができる。例示的な実施形態ではMDSが利用されるが、t-SNEなどの所望の実装に従って他の次元削減法を利用してもよく、或いは潜在次元2を有するエンコーダを直接訓練してもよい。重み付き距離メトリックに従ってMDSを使用することによって重み付き距離を決定する例示的な実施形態では、各チャートの埋め込みベクトルのユークリッド距離又は2組のデータフィールド間のジャカール距離のうちの1つ以上に適用される重みを含む任意の関数を、所望の実装に従って重み付き距離メトリックに対して使用することができる。
【0045】
図5(b)に示すように、チャート表現は、チャート埋め込みパネル511内に分布され、それらの類似度に基づいた距離だけ離間されることができる。このような例示的な実施形態では、類似度は、機械学習プロセス(例えば、最近傍)に基づいて導出され、MDSなどの次元削減法は、類似度に基づいてベクトル間の距離を決定するように構成される。このように距離をチャート埋め込みパネル511に示すように可視化して、距離をマップのように表現することができ、表現間の空間はベクトル化された類似度を示すことができる。
【0046】
要約ビュー内のチャート埋め込みパネル511から、ユーザは、パネル上の任意の空白スペースをクリックすることによって、チャートの推奨を求めることができる。
図5(b)に示すように、大きなシェード付きの円が、チャートによって形成される現在の解析空間の局所的な範囲を示し、この円で囲まれた領域内にチャート推奨が構築される。ユーザは、空間を反復的に探索し、所望の実装に基づいて様々な局所領域における推奨を得ることができる。さらに、ユーザは、検査ビューにおいて推奨されたチャートを改良し、それを現在の解析に追加することができる。円のシェードが選択された領域を決定するために使用されるが、所望の実装に従って、他の実施形態(例えば、マウスカーソル又はジェスチャにより自由形式で定義された囲まれた領域や矩形など)を利用することができる。
図5(d)は、例示的な実施形態による、GUIツールを介してチャート推奨を生成するための例示的なフロー図を示す。
【0047】
531では、このプロセスは、選択された領域(例えば、
図5(b)に示すシェード付き円領域)内の1つ以上の点をサンプリングする。選択された領域内で選ばれた点及び点の数を決定するためのサンプリングは、任意の所望の実装に従って行うことができる。532では、このプロセスは、選択された領域内の1つ以上のサンプリングされた点に対応するベクトルを決定する。
図5(b)のチャート埋め込みパネル511の例は、距離がチャート表現に関連付けられたベクトル間の類似度を表すマップの形態であるため、これらのベクトルは利用される類似度メトリックに従って生成することができる。例えば、選択された領域内又はそれに近接するチャートは、選択された領域内又はそれに近接するチャートに対応するデータに対するデータテーブル512から決定することができる。対応するデータに基づいて、ベクトル間の類似度を決定する機械学習プロセス(例えば、最近傍)に従って、対応するサンプリングされた点に対してベクトルを生成することができ、MDSなどの次元削減法により、距離がサンプリングされた点のベクトルと既知のチャートのベクトルとの間の類似度を表すので、サンプリングされた点と、類似度に基づいて選択された領域内又は選択された領域に近接するチャートに対応するデータとの間の距離を決定することができる。533では、このプロセスは、
図1のデコーダ103に関して説明したように、ベクトルを復号されたチャートに変換するように構成されたベクトル復号化プロセスを実行する。534では、このプロセスは、復号されたチャートを推奨チャートとして提供する(例えば、表示する)。例示的な実施形態において、
図5(c)に示すように推奨ビューを改良するために、
図5(c)の右列に生成されたチャートを示すように、1つの列をチャート推奨に特化することができる。
【0048】
図6は、いくつかの例示的な実施形態での使用に適した例示的なコンピュータ装置を有する例示的なコンピューティング環境を示す。コンピューティング環境605内のコンピュータ装置600は、1つ若しくは複数の処理部、コア、若しくはプロセッサ610、メモリ615(例えば、RAM、ROMなど)、内部記憶装置620(例えば、磁気、光学、固体素子、及び有機記憶装置の少なくとも一つ)、及び入出力インターフェース625の少なくとも一つを含むことができ、これらのいずれも、情報を通信するための通信機構若しくはバス630上で結合されるか、又はコンピュータ装置605に組み込むことができる。入出力インターフェース625はまた、所望の実装に応じて、カメラから画像を受信するか、又はプロジェクタ若しくはディスプレイに画像を提供するように構成される。
【0049】
コンピュータ装置605は、入力/ユーザインターフェース635及び出力装置/インターフェース640に通信可能に結合することができる。入力/ユーザインターフェース635及び出力装置/インターフェース640の一方又は両方は、有線又は無線のインターフェースであってもよく、取り外し可能であってもよい。入力/ユーザインターフェース635は、入力を提供するために使用され得る任意のデバイス、構成要素、センサ、又は物理的若しくは仮想的なインターフェース(例えば、ボタン、タッチスクリーンインターフェース、キーボード、ポインティング/カーソル制御、マイクロホン、カメラ、点字、モーションセンサ、光学式リーダなど)を含んでもよい。出力装置/インターフェース640は、ディスプレイ、テレビ、モニタ、プリンタ、スピーカ、点字などを含んでもよい。いくつかの例示的な実施形態では、入力/ユーザインターフェース635及び出力装置/インターフェース640は、コンピュータ装置605に埋め込まれるか、又は物理的に結合され得る。他の例示的な実施形態では、他のコンピュータ装置は、コンピュータ装置605用の入力/ユーザインターフェース635及び出力装置/インターフェース640として機能するか、又はこれらの機能を提供してもよい。
【0050】
コンピュータ装置605の例としては、高度モバイル装置(例えば、スマートフォン、車両及び他の機械における装置、人間及び動物によって運ばれる装置など)、モバイル装置(例えば、タブレット、ノートブック、ラップトップ、パーソナルコンピュータ、ポータブルテレビ、ラジオなど)、及び移動用に設計されていない装置(例えば、デスクトップコンピュータ、他のコンピュータ、情報端末、1つ以上のプロセッサが内部に組み込まれるか又はそのプロセッサに結合されたテレビ、ラジオなど)が挙げられ得るが、これらに限定されない。
【0051】
コンピュータ装置605は、同じ又は異なる構成の1つ又は複数のコンピュータ装置を含む、任意の数のネットワーク化された構成要素、装置、並びにシステムと通信するための外部記憶装置645及びネットワーク650に(例えば、入出力インターフェース625を介して)通信可能に結合されることができる。コンピュータ装置605又は任意の接続されたコンピュータ装置は、サーバ、クライアント、シンサーバ、汎用機械、特殊用途機械、又は別のラベルとして機能するか、これらのサービスを提供するか、又はこれらとして見なされ得る。
【0052】
入出力インターフェース625としては、コンピューティング環境600内の少なくともすべての接続された構成要素、装置、及びネットワークとの間で情報を通信するための任意の通信又は入出力プロトコル若しくは規格(例えば、イーサネット(登録商標)、802.11x、ユニバーサルシステムバス、WiMax(登録商標)、モデム、セルラーネットワークプロトコルなど)を使用する有線又は無線インターフェースが挙げられ得るが、これらに限定されない。ネットワーク650は、任意のネットワーク又はネットワークの組合せ(例えば、インターネット、ローカルエリアネットワーク、広域ネットワーク、電話ネットワーク、セルラーネットワーク、衛星ネットワークなど)であってよい。
【0053】
コンピュータ装置605は、一時的媒体及び非一時的媒体を含む、コンピュータ使用可能又はコンピュータ可読媒体を用いて、使用及び通信の少なくとも一方を行うことができる。一時的媒体としては、伝送媒体(例えば、金属ケーブル、光ファイバ)、信号、搬送波などが挙げられる。非一時的媒体としては、磁気媒体(例えば、ディスク及びテープ)、光学媒体(例えば、CD ROM、デジタルビデオディスク、ブルーレイディスク)、固体素子媒体(例えば、RAM、ROM、フラッシュメモリ、固体素子記憶装置)、及び他の不揮発性記憶装置又はメモリが挙げられる。
【0054】
コンピュータ装置605は、いくつかの例示的なコンピューティング環境において、技術、方法、アプリケーション、プロセス、又はコンピュータ実行可能命令を実施するために使用することができる。コンピュータ実行可能命令は、一時的媒体から取り出されることができ、非一時的媒体に記憶され、かつそこか取り出されることができる。実行可能命令は、任意のプログラミング言語、スクリプト言語、及び機械言語(例えば、C、C++、C#、Java(登録商標)、Visual Basic(登録商標)、Python(登録商標)、Perl(登録商標)、JavaScript(登録商標)など)のうちの1つ以上から生成可能である。
【0055】
プロセッサ610は、ネイティブ環境又は仮想環境において、任意のオペレーティングシステム(OS)(図示せず)の下で実行することができる。論理部660、アプリケーションプログラミングインターフェース(API)部665、入力部670、出力部675、及び異なる構成部が相互にOS及び他のアプリケーション(図示せず)と通信するためのユニット間通信機構695を含む、1つ以上のアプリケーションを配備することができる。記載した構成部及び要素は、設計、機能、構成又は実施において変化させることができ、提供された説明に限定されない。プロセッサ610は、中央処理装置(CPU)などのハードウェアプロセッサの形態であってもよく、ハードウェアとソフトウェアとの組合せであってもよい。
【0056】
いくつかの例示的な実施形態において、情報又は実行命令がAPI部665によって受信されると、それは、1つ以上の他の構成部(例えば、論理部660、入力部670、出力部675)に通信されることができる。場合によっては、論理部660は、上述のいくつかの例示的な実施形態において、構成部間の情報フローを制御し、API部665、入力部670、出力部675によって提供されるサービスを指示するように構成されてもよい。例えば、1つ以上のプロセス又は実装のフローは、論理部660単独で、又はAPI部665とともに制御されてもよい。入力部670は、例示的な実施形態に記載の計算に対して入力を得るように構成されてもよく、出力部675は、例示的な実施形態に記載の計算に基づいて出力を提供するように構成されてもよい。
【0057】
プロセッサ610は、
図4及び
図5(a)~
図5(c)に示すように推奨されたチャートを生成するグラフィカルユーザインターフェース(GUI)を提供するように構成することができ、本方法は、GUI上に第1のビューを提供し、第1のビューがマップに複数のチャートの表現を提供するように構成され、複数のチャートの表現が、
図5(b)に示すように、複数のチャートの複数のベクトルへの符号化ベクトル化から導出される類似度に基づいて第1のビュー上のマップ内に分布され、
図5(b)に示すような第1のビュー上のマップ内の領域を選択すると、選択された領域と、選択された領域内又は選択された領域に近接する複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成し、
図5(c)の右列に示すようなGUIの第2のビューにチャート推奨を表示することを含む。別の例示的な実施形態では、推奨チャートが許容可能であると判定された場合、チャート推奨と複数のチャートとの間の類似度に基づいて、チャート推奨の表現を、
図5(b)に示すようにマップ上に配置することができる(すなわち、チャート埋め込みパネル511上の選択された領域内のサンプリングされた点に別の表現が生成される)。追加された表現は、ベクトル類似度に基づいて他の表現から離間される。
【0058】
例示的な実施形態では、複数のチャートの複数のベクトルへの符号化ベクトル化は、
図1に記載のように文法変分自己符号化器(GVAE)によって訓練されたベクトル化プロセスによって行うことができる。
【0059】
図5(b)に示すように、複数のチャートの表現は、複数のベクトル間の類似度に基づいて複数のチャートの表現のそれぞれの間の距離を決定するように構成された次元削減法(例えば、MDSなど)により決定されるように、第1のビューのマップ内に分布することができる。
図1で説明したように、GVAEなどの深層学習モデルを利用するため、チャートをベクトルに符号化し、再びベクトルからチャートに復号することができる。チャートは機械学習プロセスを介してベクトルに符号化されるため、最近傍などの機械学習プロセスを利用して類似度計算を行い、MDSなどの次元削減法を利用して、決定された類似度に基づいてチャート間の距離を決定することができる。このような距離は、
図5(b)に示すようにマップ上にチャート表現を配置するために利用することができる。
【0060】
図5(d)に記載されるように、プロセッサ610は、選択された領域内の点をサンプリングし、選択された領域内の点に対応するベクトルを決定し、ベクトルを復号されたチャートに変換するように構成されたベクトル復号化プロセスを実行し、かつ復号されたチャートを推奨チャートとして提供することによって、選択された領域と、選択された領域内又は選択された領域に近接する複数のチャートのうちの1つ以上との間の類似度から導出される推奨チャートを生成するように構成することができる。
【0061】
図5(a)に示すように、
図5(b)のチャート又は
図5(c)のチャートの表現を選択することにより、
図5(a)に示すような別のビューを生成することができる。したがって、プロセッサ610は、
図5(b)に示すように第1のビューのマップ内に分布された複数のチャートの表現から表現の選択を受信するために、
図5(a)に示すようにチャートを生成するソースコードを編集するテキストエディタ502、及び所望の実装に従ってチャートを修正するドロップダウンコントロール501を含む第3のビューを生成するように構成することができる。
【0062】
図4に示すように、チャート表現は、任意の所望の実装(例えば、タッチインターフェース、マウスカーソルの選択など)に従って選択可能であるように構成され、プロセッサ610は、第1のビューのマップ内に分布された複数のチャートの表現から表現の選択を受信するために、デコーダ103に関して説明したように、複数のチャートの表現に対応する複数のベクトルからのベクトルを、チャートに変換するように構成されたベクトル復号化プロセスを実行し、
図4の前景チャートに示すように、表示のためにチャートを生成するように構成され得る。
【0063】
チャートをベクトルに符号化し、ベクトルを復号してチャートに戻すベクトル化プロセスを含む、本明細書に記載の例示的な実施形態を通して、
図5(b)に示すように類似度に基づいてマップ上のチャートの表現を関連付けるGUIを提供することが可能である。このような技術は、チャートのベクトル化が適用されるチャート間の類似度を決定するための最近傍などの機械学習技術を可能にし、ベクトル化プロセスを伴わずにチャート間の類似度を決定するための機械学習技術を適用する場合と比較して処理時間を節約するため、関連技術に対して改良されている。ベクトル化により、MDSを用いて、最近傍プロセスによりベクトル化チャート間で決定される類似度に基づいてマップなどの2次元空間上にチャート表現を投影することもできる。
【0064】
さらに、このような実装は、表現間の領域を選択し、サンプリングすることができるGUIビューを支援する。
図5(b)に示すように、チャート表現が類似度に応じて距離で分離されるため、類似度に関して逆の処理を実行することに基づいて、選択された領域内でサンプリングされたデータ点に対してベクトルを決定することができ、これにより、サンプリングされた点からの類似度及び既知のチャートが距離に基づいて既知となり、既知のチャートのベクトルを基準点として用いて、サンプリングされた点のベクトルを導出することができる。ベクトルが得られると、
図1に示すようにデコーダ103を利用して、ベクトルをチャート推奨に変換し、
図5(c)に示すように提供することができる。
【0065】
さらに、
図5(b)に示すように、チャート表現をマップ上に配置することができるため、チャート表現が類似度によって分離されることにより、チャート表現間の空間を示すGUIを提供することができる。このような例示的な実施形態を通じて、ユーザは、データ探索及びチャート推奨の生成のために、チャート表現間の領域を選択することができる。このようなGUI機能がなければ、ユーザが現在生成されているチャートのセットを考慮して他のどのチャートを探索すべきかを判定することは困難であるため、このような例示的な実施形態は関連技術に対する改良である。
【0066】
発明を実施するための形態のいくつかの部分は、コンピュータ内の演算のアルゴリズム及び記号表現に関して提示される。これらのアルゴリズム記述及び記号表現は、データ処理技術における当業者が、その革新の本質を他の当業者に伝えるために使用する手段である。アルゴリズムは、所望の最終状態又は結果に至る一連の定義された工程である。例示的な実施形態では、実行される工程は、有形の結果を達成するために有形量の物理的操作を必要とする。
【0067】
特に明記しない限り、上述の説明から明らかなように、「処理」、「コンピューティング」、「計算」、「決定」、「表示」などの用語を使用する説明は、コンピュータシステムのレジスタ及びメモリ内の物理的(電子的)量として表されるデータを、コンピュータシステムのメモリ若しくはレジスタ又は他の情報記憶装置、伝送装置若しくは表示装置内の物理的量として同様に表される他のデータに操作及び変換するコンピュータシステム又は他の情報処理装置の動作及びプロセスを含み得ることが理解されよう。
【0068】
例示的な実施形態はまた、本明細書の動作を実行するための装置に関連してもよい。この装置は、必要な目的のために特別に構成されてもよく、又は1つ以上のコンピュータプログラムによって選択的に起動又は再構成される1つ以上の汎用コンピュータを含んでもよい。このようなコンピュータプログラムは、コンピュータ可読記憶媒体又はコンピュータ可読信号媒体など、コンピュータ可読媒体に記憶されてもよい。コンピュータ可読記憶媒体は、光ディスク、磁気ディスク、読み出し専用メモリ、ランダムアクセスメモリ、固体素子装置及びドライブ、又は電子情報を記憶するのに適した任意の他の種類の有形若しくは非一時的媒体など、有形媒体を含むことができるが、これらに限定されない。コンピュータ可読信号媒体は、搬送波などの媒体を含んでもよい。本明細書に提示されるアルゴリズム及び表示は、いかなる特定のコンピュータ又は他の装置にも本質的に関連しない。コンピュータプログラムは、所望の実装の動作を実行する命令を含む純粋なソフトウェア実装を含むことができる。
【0069】
様々な汎用システムが、本明細書の実施例に従ったプログラム及びモジュールとともに使用されてもよく、又は所望の方法工程を実行するためのより専用装置を構築することが好都合であることが判明する場合もある。さらに、例示的な実施形態は、任意の特定のプログラミング言語を参照して説明されていない。本明細書に記載されるように例示的な実施形態の教示を実施するために、様々なプログラミング言語が使用され得ることが理解されよう。プログラミング言語の命令は、1つ以上の処理装置、例えば、中央処理装置(CPU)、プロセッサ、又はコントローラによって実行され得る。
【0070】
当技術分野において既知であるように、上述した動作は、ハードウェア、ソフトウェア、又はソフトウェアとハードウェアのいくつかの組合せによって実行することができる。例示的な実施形態の様々な態様は、回路及び論理装置(ハードウェア)を使用して実装されてもよいが、他の態様は、機械可読媒体(ソフトウェア)に記憶された命令を使用して実装されてもよく、これはプロセッサによって実行される場合、プロセッサに本出願の実施形態を行うための方法を実行させる。さらに、本出願のいくつかの例示的な実施形態は、ハードウェアにおいてのみ実行されてもよいが、他の例示的な実施形態は、ソフトウェアにおいてのみ実行されてもよい。さらに、記載された様々な機能は、単一の構成部で実行することも、任意の数の方法で多数の構成要素にわたって分散させることもできる。ソフトウェアによって実行される場合、これらの方法は、コンピュータ可読媒体に記憶された命令に基づいて、汎用コンピュータなどのプロセッサによって実行され得る。必要に応じて、これらの命令は、圧縮及び暗号化の少なくとも一方を行った形式で媒体に記憶することができる。
【0071】
さらに、本出願の教示の明細書及び実践を考慮することにより、本出願の他の実施形態は当業者に明らかである。説明された例示的な実施形態の様々な態様及び構成要素は、単独で又は任意の組合せで使用されてもよい。本明細書及び例示的な実施形態は単に例示と見なされ、本出願の真の範囲及び趣旨は以下の特許請求の範囲で示されるものとする。