(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024169352
(43)【公開日】2024-12-05
(54)【発明の名称】グラフ分析アルゴリズムによるグラフの説明可能性の向上
(51)【国際特許分類】
G06N 5/045 20230101AFI20241128BHJP
G06N 3/04 20230101ALI20241128BHJP
【FI】
G06N5/045
G06N3/04 100
【審査請求】未請求
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2024080914
(22)【出願日】2024-05-17
(31)【優先権主張番号】18/322495
(32)【優先日】2023-05-23
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.PYTHON
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】マックスロー マイケル
(72)【発明者】
【氏名】内野 寛治
(57)【要約】 (修正有)
【課題】グラフ分析アルゴリズムによるグラフの説明可能性を向上させる方法、記憶倍媒体及びシステムを提供する。
【解決手段】方法は、1つ以上のサブグラフを含むグラフ構造化データのデータセットを取得し、グラフ構造化データのデータセットのグラフ説明可能な人工知能(GXAI)技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定し、相関に基づいて、複数のグラフ分析アルゴリズムのランク付きリストを生成し、グラフ構造データのデータセットの1つ以上のサブグラフ間の類似性を示す一般的特性を決定し、複数のグラフ分析アルゴリズムのランク付きリストに基づいて、閾値数のグラフ分析アルゴリズムを一般的特性に割り当て、一般的特性及び閾値数のグラフ分析アルゴリズムを含む割り当てテーブルを生成し、表示を、割り当てテーブルを視覚化するグラフィカルユーザインタフェース(GUI)内で生成する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
グラフ構造化データのデータセットを取得するステップであって、前記データセットは1つ以上のサブグラフを含む、ステップと、
グラフ構造化データの前記データセットのグラフ説明可能な人工知能(GXAI)技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップと、
前記相関に基づいて、前記複数のグラフ分析アルゴリズムのランク付きリストを生成するステップと、
グラフ構造化データの前記データセットの一般的特性を決定するステップであって、前記一般的特性が1つ以上のサブグラフ間の類似性を示す、ステップと、
前記複数のグラフ分析アルゴリズムのランク付きリストに基づいて、閾値数の分析アルゴリズムを前記一般的特性に割り当てるステップと、
前記一般的特性及び前記閾値数のグラフ分析アルゴリズムを含む割り当てテーブルを生成するステップと、
前記割り当てテーブルを視覚化するグラフィカルユーザインタフェース(GUI)内の表示を生成するステップと、
を含む方法。
【請求項2】
前記GXAI技術を使用することは、
グラフ構造化データの前記データセット及びグラフニューラルネットワーク(GNN)に基づいて、機械学習(ML)モデルをトレーニングするステップと、
GNN説明器によって、グラフ構造化データの前記データセットの各ノード又はエッジが前記MLモデルのトレーニングにどのように貢献するかを示す数値貢献スコアを生成するステップと、
を含む、請求項1に記載の方法。
【請求項3】
グラフ構造化データの前記データセットのGXAI技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップは、
前記GXAI技術を使用して、第1分析の第1ベクトルを生成するステップと、
前記複数のグラフ分析アルゴリズムを使用して、第2分析の第2ベクトルを生成するステップと、
前記第1ベクトル及び前記第2ベクトルに基づいて類似性スコアを計算するステップと、
を含む、請求項1に記載の方法。
【請求項4】
前記相関に基づいて、前記グラフ分析アルゴリズムの前記ランク付きリストを生成するステップは、
少なくとも第1列及び第2列を有するランクテーブルを生成するステップであって、前記第1列は前記グラフ分析アルゴリズムを含み、前記第2列は前記グラフ分析アルゴリズムのランクを示す、ステップと、
前記相関に基づいて、前記グラフ分析アルゴリズムをランク番号でランク付けするステップと、
前記ランクテーブルを前記ランク番号に従ってソートするステップと、
前記ランクテーブルを出力するステップと、
を含む、請求項1に記載の方法。
【請求項5】
グラフ構造化データの前記データセットの前記一般的特性を決定するステップは、
前記1つ以上のサブグラフの各々についてベクトルを生成するステップと、
前記1つ以上のサブグラフの前記ベクトルの平均ベクトルを計算するステップと、
を含む、請求項1に記載の方法。
【請求項6】
前記グラフ構造化データの第2データセットを取得するステップと、
前記グラフ構造化データの第2データセットの第2一般的特性を決定するステップと、
前記第2一般的特性が前記一般的特性に類似していることを決定するステップと、
前記割り当てテーブルを読み出すステップと、
前記割り当てテーブルに存在する閾値数の分析アルゴリズムを前記第2一般的特性に割り当てるステップと、
前記第2一般的特性及び前記閾値数のグラフ分析アルゴリズムを含む第2割り当てテーブルを生成するステップと、
前記第2割り当てテーブルを視覚化する前記GUI内の表示を生成するステップと、
を更に含む請求項1に記載の方法。
【請求項7】
グラフ構造化データの第2データセットを取得するステップと、
グラフ構造化データの前記第2データセットの第2一般的特性を決定するステップと、
前記第2一般的特性が前記一般的特性に類似していないことを決定するステップと、
グラフ構造化データの前記第2データセットのGXAI技術を使用した分析と前記複数のグラフ分析アルゴリズムを使用した分析との間の第2相関に基づいて、前記複数のグラフ分析アルゴリズムの第2ランク付きリストを生成するステップと、
を更に含む請求項1に記載の方法。
【請求項8】
命令を格納するように構成された1つ以上の非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されたことに応答してシステムに動作を実行させ、前記動作は、
グラフ構造化データのデータセットを取得するステップであって、前記データセットは1つ以上のサブグラフを含む、ステップと、
グラフ構造化データの前記データセットのグラフ説明可能な人工知能(GXAI)技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップと、
前記相関に基づいて、前記複数のグラフ分析アルゴリズムのランク付きリストを生成するステップと、
グラフ構造化データの前記データセットの一般的特性を決定するステップであって、前記一般的特性が1つ以上のサブグラフ間の類似性を示す、ステップと、
前記複数のグラフ分析アルゴリズムのランク付きリストに基づいて、閾値数の最高性能グラフ分析アルゴリズムを前記一般的特性に割り当てるステップと、
前記一般的特性及び前記閾値数の最高性能グラフ分析アルゴリズムを含む割り当てテーブルを生成するステップと、
前記割り当てテーブルを視覚化するグラフィカルユーザインタフェース(GUI)内の表示を生成するステップと、
を含む、1つ以上の非一時的コンピュータ可読記憶媒体。
【請求項9】
前記GXAI技術を使用することは、
グラフ構造化データの前記データセット及びグラフニューラルネットワーク(GNN)に基づいて、機械学習(ML)モデルをトレーニングするステップと、
GNN説明器によって、グラフ構造化データの前記データセットの各ノード又はエッジが前記MLモデルのトレーニングにどのように貢献するかを示す数値貢献スコアを生成するステップと、
を含む、請求項8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
【請求項10】
グラフ構造化データの前記データセットのGXAI技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップは、
前記GXAI技術を使用して、第1分析の第1ベクトルを生成するステップと、
前記複数のグラフ分析アルゴリズムを使用して、第2分析の第2ベクトルを生成するステップと、
前記第1ベクトル及び前記第2ベクトルに基づいて、ピアソン相関係数又はコサイン類似度を計算するステップと、
を含む、請求項8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
【請求項11】
前記相関に基づいて、前記グラフ分析アルゴリズムの前記ランク付きリストを生成するステップは、
少なくとも第1列及び第2列を有するランクテーブルを生成するステップであって、前記第1列は前記グラフ分析アルゴリズムを含み、前記第2列は前記グラフ分析アルゴリズムのランクを示す、ステップと、
前記相関に基づいて、前記グラフ分析アルゴリズムをランク番号でランク付けするステップであって、より低いランク番号がより強い相関を反映する、ステップと、
前記ランクテーブルを前記ランク番号に従ってソートするステップと、
前記ランクテーブルを出力するステップと、
を含む、請求項8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
【請求項12】
グラフ構造化データの前記データセットの前記一般的特性を決定するステップは、
前記1つ以上のサブグラフの各々についてベクトルを生成するステップと、
前記1つ以上のサブグラフの前記ベクトルの平均ベクトルを計算するステップと、
を含む、請求項8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
【請求項13】
前記動作は、
前記グラフ構造化データの第2データセットを取得するステップと、
前記グラフ構造化データの第2データセットの第2一般的特性を決定するステップと、
前記第2一般的特性が前記一般的特性に類似していることを決定するステップと、
前記割り当てテーブルを読み出すステップと、
前記割り当てテーブルに存在する閾値数の分析アルゴリズムを前記第2一般的特性に割り当てるステップと、
前記第2一般的特性及び前記閾値数のグラフ分析アルゴリズムを含む第2割り当てテーブルを生成するステップと、
前記第2割り当てテーブルを視覚化する前記GUI内の表示を生成するステップと、
を更に含む、請求項8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
【請求項14】
前記動作は、
グラフ構造化データの第2データセットを取得するステップと、
グラフ構造化データの前記第2データセットの第2一般的特性を決定するステップと、
前記第2一般的特性が前記一般的特性に類似していないことを決定するステップと、
グラフ構造化データの前記第2データセットのGXAI技術を使用した分析と前記複数のグラフ分析アルゴリズムを使用した分析との間の第2相関に基づいて、前記複数のグラフ分析アルゴリズムの第2ランク付きリストを生成するステップと、
を更に含む、請求項8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
【請求項15】
システムであって、
1つ以上のプロセッサと、
命令を格納するように構成された1つ以上の非一時的コンピュータ可読記憶媒体と、
を含み、前記命令は、実行されたことに応答して前記システムに動作を実行させ、前記動作は、
グラフ構造化データのデータセットを取得するステップであって、前記データセットは1つ以上のサブグラフを含む、ステップと、
グラフ構造化データの前記データセットのグラフ説明可能な人工知能(GXAI)技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップと、
前記相関に基づいて、前記複数のグラフ分析アルゴリズムのランク付きリストを生成するステップと、
グラフ構造化データの前記データセットの一般的特性を決定するステップであって、前記一般的特性が1つ以上のサブグラフ間の類似性を示す、ステップと、
前記複数のグラフ分析アルゴリズムのランク付きリストに基づいて、閾値数の最高性能グラフ分析アルゴリズムを前記一般的特性に割り当てるステップと、
前記一般的特性及び前記閾値数の最高性能グラフ分析アルゴリズムを含む割り当てテーブルを生成するステップと、
前記割り当てテーブルを視覚化するグラフィカルユーザインタフェース(GUI)内の表示を生成するステップと、
を含む、システム。
【請求項16】
前記GXAI技術を使用することは、
グラフ構造化データの前記データセット及びグラフニューラルネットワーク(GNN)に基づいて、機械学習(ML)モデルをトレーニングするステップと、
GNN説明器によって、グラフ構造化データの前記データセットの各ノード又はエッジが前記MLモデルのトレーニングにどのように貢献するかを示す数値貢献スコアを生成するステップと、
を含む、請求項15に記載のシステム。
【請求項17】
グラフ構造化データの前記データセットのGXAI技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップは、
前記GXAI技術を使用して、第1分析の第1ベクトルを生成するステップと、
前記複数のグラフ分析アルゴリズムを使用して、第2分析の第2ベクトルを生成するステップと、
前記第1ベクトル及び前記第2ベクトルに基づいて、ピアソン相関係数又はコサイン類似度を計算するステップと、
を含む、請求項15に記載のシステム。
【請求項18】
前記相関に基づいて、前記グラフ分析アルゴリズムの前記ランク付きリストを生成するステップは、
少なくとも第1列及び第2列を有するランクテーブルを生成するステップであって、前記第1列は前記グラフ分析アルゴリズムを含み、前記第2列は前記グラフ分析アルゴリズムのランクを示す、ステップと、
前記相関に基づいて、前記グラフ分析アルゴリズムをランク番号でランク付けするステップであって、より低いランク番号がより強い相関を反映する、ステップと、
前記ランクテーブルを前記ランク番号に従ってソートするステップと、
前記ランクテーブルを出力するステップと、
を含む、請求項15に記載のシステム。
【請求項19】
グラフ構造化データの前記データセットの前記一般的特性を決定するステップは、
前記1つ以上のサブグラフの各々についてベクトルを生成するステップと、
前記1つ以上のサブグラフの前記ベクトルの平均ベクトルを計算するステップと、
を含む、請求項15に記載のシステム。
【請求項20】
前記動作は、
前記グラフ構造化データの第2データセットを取得するステップと、
前記グラフ構造化データの第2データセットの第2一般的特性を決定するステップと、
前記第2一般的特性が前記一般的特性に類似していることを決定するステップと、
前記割り当てテーブルを読み出すステップと、
前記割り当てテーブルに存在する閾値数の分析アルゴリズムを前記第2一般的特性に割り当てるステップと、
前記第2一般的特性及び前記閾値数のグラフ分析アルゴリズムを含む第2割り当てテーブルを生成するステップと、
前記第2割り当てテーブルを視覚化する前記GUI内の表示を生成するステップと、
を更に含む、請求項15に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示で説明する実施形態は、概してグラフ分析アルゴリズムによるグラフの説明可能性の向上に関する。
【背景技術】
【0002】
グラフ構造内のデータセットは、グラフ分析アルゴリズムを使用して分析することができる。例えば、グラフ分析アルゴリズムは、パターン及び異常を含むデータセットの全体構造に関する情報を提供することができる。しかしながら、多数のグラフ分析アルゴリズムが存在する可能性があり、これは、どのグラフ分析アルゴリズムをデータセットに使用すべきかを決定することを困難にする可能性がある。
【0003】
本開示で請求される主題は、任意の欠点を解決する実施形態又は上述のような環境でのみ動作する実施形態に限定されない。むしろ、この背景技術は、本開示に記載の幾つかの実施形態が実施され得る一例である技術領域を説明するためにのみ提供される。
【発明の概要】
【0004】
例示的な実施形態では、方法は、グラフ構造化データのデータセットを取得することを含むことができ、データセットは1つ以上のサブグラフを含む。方法は、データセットのグラフ説明可能な人工知能(graph explainable artificial intelligence (GXAI))技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定することを更に含むことができる。相関に基づいて、複数のグラフ分析アルゴリズムのランク付きリストを生成することができる。方法は、グラフ構造化データのデータセットの一般的特性を決定することを更に含むことができ、一般的特性は1つ以上のサブグラフ間の類似性を示す。方法は、複数のグラフ分析アルゴリズムのランク付きリストに基づいて、閾値数のグラフ分析アルゴリズムを一般的特性に割り当てることを更に含み得る。一般特性及び閾値数のグラフ分析アルゴリズムを含む割り当てテーブルを生成することができる。表示は、割り当てテーブルを視覚化するグラフィカルユーザインタフェース(GUI)内で生成することができる。
【0005】
実施形態の目的及び利点は、請求項において特に指摘される要素、特徴、及び組み合わせにより少なくとも実現され達成される。
【0006】
前述の一般的説明及び以下の詳細な説明は両方とも例として与えられ、説明のためであり、請求される本発明の限定ではない。
【図面の簡単な説明】
【0007】
例示的な実施形態は、以下の添付の図面の使用を通じて更なる特殊性及び詳細事項により記載され説明される。
【0008】
【
図1】グラフ分析アルゴリズムを分類するための例示的な処理フローを示す図である。
【0009】
【
図2】グラフ分析アルゴリズムを分類する例示的な方法のフローチャートを示す。
【0010】
【
図3】データセットのグラフ分析アルゴリズムを選択するための例示的な方法のフローチャートである。
【0011】
【
図4】グラフ分析アルゴリズムのランクテーブルを生成する例示的な方法のフローチャートを示す。
【0012】
【
図5】本開示の少なくとも1つの実施形態により全て構成された例示的なコンピューティングシステムを示す。
【発明を実施するための形態】
【0013】
情報はデータセットに含まれてもよく、データセットはグラフ形式(「グラフ構造化データ」と呼ばれる)で提示されてもよい。グラフ構造化データは、グラフ説明可能な人工知能(GXAI)技術又はグラフ分析アルゴリズムを使用して分析されてもよい。グラフ分析アルゴリズムは、行動パターンの予測、重要なノード又はエッジの識別、及び対応するデータセットの異常な特性の識別など、グラフ構造化データに関する洞察及び説明を提供することができる。GXAI技術は、グラフ構造化データを機械学習モデル又はその他の人工知能対応コンピューティングシステムに提供して、対応するデータセットを評価することを含む場合がある。GXAI技術は、グラフ構造化データの洞察及び分析を提供することができ、これは、異なる観点をカバーしたり、グラフ分析アルゴリズムの結果よりも包括的な分析を提供したりする場合がある。しかしながら、GXAI技術によって提供される結果は、データサイエンティストなどのユーザにとって理解するのが難しい場合がある。なぜなら、GXAI結果は、見慣れない、従来とは異なる、又は複雑なフォーマットで提示される場合があるからである。従って、このような結果は、ユーザフレンドリではない場合がある。追加で又は代替的に、GXAI結果は、グラフ構造化データに関する多様なメトリック又は詳細をカバーする場合がある。そのため、GXAI結果をレビューするユーザは、GXAI結果を適切に又は効果的に解釈することができず、AIモデルのデータセットを評価するために所望の情報に到達するために、多くの層をドリルダウンする必要がある場合がある。例えば、特定のGXAI技術を使用してグラフ構造化データの特定のデータセットを分析すると、特定のデータセットに含まれる各ノード又はエッジに対応する貢献スコアが得られ、この貢献スコアは、各ノード又はエッジが、特定のデータセットの特定の分類又は回帰分析にどのように貢献するかを示す。
【0014】
本開示は、とりわけ、特定のタイプのグラフ構造化データのデータセットに対してより効果的であり得るグラフ分析アルゴリズムを識別するために使用できる方法及び/又はシステムに関する。
【0015】
幾つかの実施形態では、方法は、GXAI結果と、グラフ構造化データの同じデータセットに関連するグラフ分析アルゴリズム結果との間の相関を決定することを含むことができる。この相関は、各グラフ分析アルゴリズムがグラフ構造化データのデータセットをどの程度よく分析するかについてのより良い理解をユーザに提供することができる。グラフ分析アルゴリズムは、相関に従ってランク付けすることができ、閾値数のグラフ分析アルゴリズムを、グラフ構造化データのデータセットの第1一般的特性に割り当てることができる。データセットの第1一般的特性は、グラフ構造化データのデータセット内に含めることができる複数のサブグラフ間の共通特性を示すことができる。この割り当てにより、ユーザは、特定のグラフ分析アルゴリズムを第1一般的特性に関連付けることができ、これにより、他のデータセットの分析のためのグラフ分析アルゴリズムの選択の効率を向上させることができる。例えば、幾つかの例では、グラフ構造化データの第2データセットは、第1一般的特性に類似した第2一般的特性を有することができる。第1一般的特性に割り当てられたグラフ分析アルゴリズムに基づいて、グラフ構造化データの第2データセットに対してどのグラフ分析アルゴリズムが有効であるかを決定することができる。このように、本開示の幾つかの実施形態に従って、グラフ分析アルゴリズムをランク付けし、グラフ分析アルゴリズムをグラフ構造化データのデータセットの一般的特性に割り当てることにより、グラフ構造化データのデータセットの分析の効率及び解釈可能性を向上させることができる。
【0016】
図を参照すると、
図1は、本開示の少なくとも1つの実施形態に従って、グラフ分析アルゴリズムを分類するための例示的な処理フロー100を示す図である。幾つかの実施形態では、処理100は、グラフ構造化データのデータセット110を取得するように構成された特徴付けモジュール120を含むことができる。
【0017】
幾つかの実施形態では、データセット110は、データの視覚的解釈を提供し、データセット110の異なる変数間の関係を表すことができる。例えば、データセット110は、金融取引の集合を含むことができる。データセット110は、異なる人又はエンティティが関与する金融取引を視覚化することができる。幾つかの実施形態では、データセット110は、1つ以上のサブグラフを含むことができる。例えば、金融取引の各集合は、データセット110内のサブグラフとして表すことができる。例えば、例示的なサブグラフは、金融取引に関与する特定の個人及び/又はエンティティをノードとして含むことができる。サブグラフは、特定の個人及び/又はエンティティが関与した異なる金融取引を表すことができ、各取引はエッジによって表される。例えば、エッジは、とりわけ、購入、払い戻し、支払いなどを含むことができる。幾つかの実施形態では、データセット110は、1つ以上のサブグラフに編成することができる。例えば、データセット110は、銀行に関連する金融取引を含むことができる。これらの例では、データセット110は、異なるパラメータに従って1つ以上のサブグラフに編成することができる。例えば、1つ以上のサブグラフは各々、払い戻しや預金など、銀行が関与した取引の種類を含むことができる。別の例では、1つ以上のサブグラフは各々、個人や企業などの異なる種類の顧客との取引を含むことができる。
【0018】
幾つかの実施形態では、1つ以上のグラフ分析アルゴリズムを得ることができる。1つ以上のグラフ分析アルゴリズムは、グラフ構造化データのデータセットの1つ以上の側面を表すために使用することができるグラフ構造化データの任意の分析技術を含むことができる。例えば、1つ以上の選択されたグラフ分析アルゴリズムは、行動パターンの予測、重要なノード及びエッジの識別、及び/又はデータセット110の異常な特性の識別を含むことができる。幾つかの実施形態では、1つ以上のグラフ分析アルゴリズムは、公衆に利用可能なグラフ分析アルゴリズムを含むことができる。例えば、幾つかの実施形態では、1つ以上のグラフ分析アルゴリズムは、公開リポジトリ及び/又はグラフ分析アルゴリズムの集合を含む公開ライブラリから入手することができる。例えば、数百のグラフ分析アルゴリズムの実装を含むPythonライブラリであるNetworkXを使用して、1つ以上のグラフ分析アルゴリズムを取得することができる。他の任意の適切なリポジトリ及び/又はグラフ分析アルゴリズムの集合を含むライブラリを使用することができる。
【0019】
幾つかの実施形態では、グラフ分析アルゴリズムの集合からグラフ分析アルゴリズムのサブセットを選択することができる。例えば、1つ以上のグラフ分析アルゴリズムは、グラフ分析アルゴリズムの集合の一部を含むことができる。幾つかの実施形態では、選択は、1つ以上のグラフ分析アルゴリズムを分類するように構成されている処理100に基づいて行うことができる。例えば、処理100は、1つ以上のグラフ分析アルゴリズムのうちのどれがデータセット110に対してより効果的であるかを予め決定することができる。幾つかの実施形態では、事前決定は、データセット110の異なる特徴に基づいて行うことができる。例えば、データセット110が多数のノードを有する場合、ノードに関連するグラフ分析アルゴリズムを選択することができる。別の例では、データセット110は少数のノードのみを有することができる。これらの例では、ノードインデックス分析などのグラフ分析アルゴリズムを適用できない場合がある。幾つかの実施形態では、選択は、利用可能なグラフ分析アルゴリズムのタイプに基づいて行うことができる。例えば、各タイプのアルゴリズムの一定数を含めることができる。例えば、最短経路、クリーク検出、カラーリング、及びクラスタリングなどの各タイプに関連する5つのグラフ分析アルゴリズムを選択することができる。
【0020】
幾つかの実施形態では、グラフ分析アルゴリズムの種類は、他の種類のグラフ分析アルゴリズムの中でも、コミュニティ検出(ノードのグループがどのようにクラスタ化されているかを評価するように構成されてもよい)、類似性(1つ以上のサブグラフ間などのデータセット110内のデータ間の類似性の程度を決定するように構成されてもよい)、中心性(中心ノードを識別するように構成されてもよい)、ヒューリスティックリンク予測(スコア関数に基づいて将来の潜在的リンクを予測するように構成されてもよい)、彩色アルゴリズム(各頂点に異なるカラーラベルを割り当てるように構成されてもよい)、及び経路探索及び探索(ノード間の経路を探索するように構成されてもよい)を含むことができる。
【0021】
幾つかの実施形態では、データセット110は、グラフニューラルネットワーク(graph neural network (GNN))を使用して分析することができる。例えば、機械学習(machine-learning (ML))モデルは、GNNを使用してトレーニングすることができる。グラフ構造化データを分析するために、MLモデルをデータセット110上でトレーニングすることができる。例えば、MLモデルをトレーニングして、グラフ構造化データのノード、エッジ、及びグラフレベルでGNN予測を生成することができる。例えば、MLモデルによって実行されるGNN予測は、とりわけ、ノードラベリング、ノード及びエッジ予測、クラスタリングを含むことができる。幾つかの実施形態では、MLモデルをトレーニングするために異なるGNNアーキテクチャを使用することができる。例えば、グラフ同型ネットワーク(graph isomorphism network (GIN))、グラフ畳み込みネットワーク(graph convolutional network (GCT))、及び/又はグラフアテンションネットワーク(graph attention network (GAT))を使用することができる。幾つかの実施形態では、任意の他の適切なGNNアーキテクチャを使用することができる。
【0022】
幾つかの実施形態では、GNN予測を評価して、信頼性、潜在的バイアス、及び/又はエラーを検出することができる。追加で又は代替的に、GNN予測の意思決定処理を検出することができる。幾つかの実施形態では、意思決定処理を説明するために、1つ以上の説明方法を利用することができる。例えば、1つ以上の説明方法には、特に、SA、Guided BP、CAM、Grad-CAM、GNNExplainer、PGExplainer、GraphMask、ZORRO、原因スクリーニング、SubgraphX、LRP、Excitation BP、GNN-LRP、PGM-Explainer、XGNNなどが含まれる。幾つかの実施形態では、1つ以上の説明方法は、1つ以上の説明方法を特徴付ける様々な設計要素を含むことができる。設計要素の幾つかの例は、タイプ、学習(例えば、学習手順の有無)、タスク(例えば、各方法が適用できるタスク)、ターゲット(例えば、説明の対象)、ブラックボックス(GNNが説明中にブロックボックスとして扱われるかどうか)、フロー(説明のための計算フロー)、及び設計(説明方法がグラフ構造化データのための特定の設計を有するかどうか)を含むことができる。これら及び他の実施形態では、1つ以上の説明方法の各々は、1つ以上の設計要素を含むことができる。
【0023】
幾つかの実施形態では、処理100は、GXAI分析結果130及びグラフ分析結果135を取得するように構成された相関モジュール140を含むことができる。例えば、GXAI分析結果130は、1つ以上の説明方法から取得することができ、グラフ分析結果135は、1つ以上のグラフ分析アルゴリズムから取得することができる。幾つかの実施形態では、GXAI分析結果130及びグラフ分析結果135は、処理100によって計算することができる。幾つかの実施形態では、GXAI分析結果130及びグラフ分析結果135は、別のシステムから提供することができ、又はデータ記憶装置から読み出すことができる。
【0024】
幾つかの実施形態では、GXAI分析結果130は、貢献スコアを含むことができる。例えば、特定のGXAI分析技術を使用してグラフ構造化データの特定のデータセットを分析すると、特定のデータセットに含まれる各ノード又はエッジに対応する貢献スコアが得られ、貢献スコアは、各ノード又はエッジが特定のデータセットの特定の分類又は回帰分析にどのように貢献するかを示す(つまり、特定のエッジ又は特定のノードがGXAI分析に、より強く影響する)。
【0025】
幾つかの実施形態では、貢献スコアは、ベクトルの各要素がグラフ構造化データの特定のデータセットの各々のエッジ又はノードに対応するように、ベクトル表現として格納することができる。特定のエッジ又は特定のノードに対する大きな貢献スコアが大きいほど、特定のエッジ又は特定のノードがGXAI分析の分類又は回帰結果に対してより大きな貢献を提供することを示してもよい(つまり、特定のエッジ又は特定のノードがGXAI分析に、より強く影響する)。これら及び他の実施形態では、GXAI分析のベクトル表現の要素(すなわち、各ノード又はエッジの貢献スコア)を正規化して、GXAI分析のベクトル表現と後述する様々なグラフ分析アルゴリズムの結果との比較を容易にすることができる。
【0026】
幾つかの実施形態では、グラフ分析結果135は、グラフ構造化データのデータセット110に関する洞察及び説明を含むことができる。例えば、グラフ分析結果135は、グラフ分析アルゴリズムをデータセット110に適用した結果を含むことができる。
【0027】
これら及び他の実施形態では、GXAI分析結果130及びグラフ分析結果135は、グラフ構造化データの分析の1つ以上のベクトル表現として格納することができる。例えば、グラフ構造化データの特定のデータセットのノードに基づく特定の分析は、ノードベクトルを生成することができる。ここで、ノードベクトルの各要素は、特定のデータセットの特定のノードに関連付けられた分析結果に対応する。別の例では、グラフ構造化データの特定のデータセットのエッジに基づく特定の分析は、エッジベクトルを生成することができる。ここで、エッジベクトルの各要素は、特定のデータセットの特定のエッジに関連付けられた分析結果に対応する。
【0028】
相関モジュール140は、GXAI分析結果130及びグラフ分析結果135に基づいて相関スコア145を決定することができる。相関モジュール140は、例えば、GXAI分析結果130及びグラフ分析結果135の各々に対応するベクトル表現を取得して、ベクトル表現間の類似性の程度を決定することができる。例えば、ベクトル表現に基づいてピアソン(Pearson)相関係数を計算することができる。追加で又は代替的に、ベクトル表現間のコサイン類似度を決定することができる。この例及び他の例では、GXAI分析結果130とグラフ分析結果135との間の類似性の程度を相関スコア145として表すことができる。幾つかの実施形態では、相関スコア145を表形式で表すことができる。例えば、相関モジュール140は、グラフ分析アルゴリズムを含む少なくとも第1列と、グラフ分析アルゴリズムに対応する相関スコア145を含む第2列とを含む相関テーブルを生成することができる。
【0029】
幾つかの実施形態では、処理100は、相関スコア145及びグラフ分析アルゴリズムを取得するように構成されたランク付けモジュール150を含むことができる。これら及び他の実施形態では、ランク付けモジュール150は、相関スコア145に基づいて、グラフ分析アルゴリズムのランク付きリスト155を生成するように構成することができる。例えば、幾つかの実施形態では、グラフ分析アルゴリズムは、対応する相関スコアの降順にリストすることができる。例えば、ランク付けモジュール150は、少なくとも第1列及び第2列を有するランク付きリスト155を生成することができる。幾つかの実施形態では、第1列は、グラフ分析アルゴリズムを含み、第2列は、第1列の中の対応するグラフ分析アルゴリズムのランクを含むことができる。これら及び他の実施形態では、ランク付けモジュール150は、相関スコア145に従い、取得したグラフ分析アルゴリズムをソートするように構成することができる。例えば、グラフ分析アルゴリズムは、相関スコア145の降順にソートすることができる。幾つかの実施形態では、ランク付きリスト155に含まれるグラフ分析アルゴリズムは、順序に従ってランク付けされ、相関スコア145に従ってソートすることができる。例えば、最も高い相関スコアを有するグラフ分析アルゴリズムは、最も高いランク(例えば、1)を与えることができる。ランク付きリスト155内のグラフ分析アルゴリズムの各々は、ランク付けされることができる。幾つかの実施形態では、ランク付きリスト155の生成が図示され、本開示の
図4に関してより詳細に説明することができる。
【0030】
幾つかの実施形態では、処理100はデータセット110を取得するように構成された特徴付けモジュール120を含むことができる。幾つかの実施形態では、特徴付けモジュール120は、データセット110の一般的特性125を決定するよう構成されてよい。一般的特性125は、データセット110に含まれる1つ以上のサブグラフ間の類似性を示すことができる。幾つかの実施形態では、1つ以上のサブグラフ間の類似性は、グラフトポロジー、ノード接続、及びノード近傍など、1つ以上のサブグラフ間の構造的類似性を含むことができる。例えば、クラスタリングアルゴリズムをデータセット110に適用して、データセット110の一般的特性125を決定することができる。例えば、クラスタリングアルゴリズムは、1つ以上のサブグラフ内のノードをグループ又はクラスタに分割することができる。分割は、グラフ構造及び/又はグラフ上のノードの位置等のトポロジ基準に基づいて行うことができる。例えば、k平均法クラスタリングを使用することができ、これは、複数の重心を識別し、各ノードを最も近い重心に一致させるように構成することができる。重心は、各重心に接続されたノードの平均値を決定することによって最適化することができる。例えば、各重心に接続されたノードが重心から同様の距離にあるように、重心を最適化することができる。幾つかの実施形態では、データセット110の一般的特性125は、複数の重心、重心からのノードの平均距離、及び重心に接続されたノードの数、のうちの1つ以上を含むことができる。
【0031】
幾つかの実施形態では、一般的特性125は、数値的に表すことができる。例えば、幾つかの実施形態では、一般的特性125は、ベクトルとして表すことができる。これら及び他の実施形態では、1つ以上のサブグラフの各々をベクトル表現に変換することができる。ベクトル表現は、任意の適切なグラフ埋め込み技術を使用して生成することができる。例えば、グラフ埋め込み技術は、1つ以上のサブグラフの各々を、1つ以上のサブグラフの特徴を捕捉する固定長ベクトルにマップすることができる任意の技術を含むことができる。一般的特性125は、1つ以上のサブグラフの各々のベクトル表現の平均を計算することによって決定することができる。
【0032】
幾つかの実施形態では、処理100は、割り当てモジュール160を含むことができる。割り当てモジュール160は、一般的特性125及びランク付きリスト155を取得するように構成することができる。幾つかの実施形態では、割り当てモジュールは、一般的特性125をランク付きリスト155にリストされた1つ以上のグラフ分析アルゴリズムに割り当てるか又は関連付ける割り当てテーブル165を生成するように構成することができる。例えば、最高性能のグラフ分析アルゴリズムを一般的特性125に割り当てることができる。例えば、最高性能のグラフ分析アルゴリズムは、ランク付きリスト155から導き出すことができる最も高い相関スコアを有するグラフ分析アルゴリズムであってもよい。幾つかの実施形態では、割り当てテーブル165は、少なくとも特性列及びアルゴリズム列を含むことができる。幾つかの実施形態では、特性列は、一般的特性125を含むことができる。これら及び他の実施形態では、アルゴリズム列は、1つ以上のグラフ分析アルゴリズムを含むことができる。例えば、アルゴリズム列は、ランク付きリスト155の第1列を含むことができる。例えば、グラフ分析アルゴリズムは、相関スコア145に基づいてランク付けされた順序でアルゴリズム列にリストすることができる。
【0033】
幾つかの実施形態では、閾値数のグラフ分析アルゴリズムを割り当てテーブル165に含めることができる。例えば、幾つかの実施形態では、閾値数は、割り当てテーブル165に含まれるべきグラフ分析アルゴリズムの数を定めることができる。例えば、最高ランクを有するグラフ分析アルゴリズムの数が割り当てテーブル165に含まれてよい。幾つかの実施形態では、閾値数は、データセット110を分析しようとするユーザ(例えば、データサイエンティスト)によって提供することができる。幾つかの実施形態では、閾値数は、データセット110のサイズに基づいて決定することができる。例えば、より大きなデータセットは、より高い閾値数を有することができる。更に別の実施形態では、閾値数は、ランク付きリスト155にリストされているグラフ分析アルゴリズムの数に基づいて決定することができる。例えば、閾値数は、ランク付きリスト155内のグラフ分析アルゴリズムの総数の10%とすることができる。
【0034】
幾つかの実施形態では、割り当てテーブル165は、GUIモジュール170によって取得することができ、GUIモジュール170は、GUI175に特定の方法で情報を提示させるように構成することができる。例えば、GUIモジュール170は、割り当てテーブル165を提示するようにGUI175に指示するように構成することができる。追加で又は代替的に、GUIモジュール170は、相関スコア145を取得して表示するように構成することができる。例えば、GUI175は、GUI175のユーザが対話してデータセット110内の1つ以上のサブグラフを選択することができるドロップダウンメニュー(又は任意の他のグラフィカル選択ツール)を含むことができる。サブグラフ要約は、ドロップダウンメニューを介して選択された特定のサブグラフに関する要約情報を含むことができる。例えば、サブグラフ要約は、GXAI説明可能性スコア(例えば、特定のサブグラフに関連する貢献スコアの要素)、特定のサブグラフに含まれるノードの数、特定のサブグラフに含まれるエッジの数、又は特定のサブグラフに関連する任意の他の統計を含むことができる。これら及び他の実施形態では、サブグラフ要約は、特定のグラフ分析アルゴリズムによって生成されたグラフ分析結果を更に含むことができる。
【0035】
幾つかの実施形態では、GUI175は、データセット110に関連する様々な統計の要約を表示することができる。例えば、要約は、データセット110に含まれるサブグラフの数、サブグラフの各々と共に含まれるノードの平均数、サブグラフの各々に関連するエッジの平均数、データセット110を取得した機械学習モデルのトレーニング精度、データセット110を取得した機械学習モデルのテスト精度、又は特定のデータセットに関連する任意の他の統計を含むことができる。幾つかの実施形態では、データセット110に関連する様々な統計の要約は、どのグラフ分析アルゴリズムがデータセット110に最も適合するかを識別する際に、ユーザを支援することができる。例えば、データセット110に適用される1つ以上のグラフ分析アルゴリズムは、提示された要約に基づいて選択することができる。例えば、タイプグラフ分析アルゴリズムは、データセット110に存在するデータのタイプに基づいて選択することができる。幾つかの実施形態では、要約は、割り当てテーブル165に含まれるべき閾値数のグラフ分析アルゴリズムを決定する際にユーザを支援することができる。例えば、ユーザは、より複雑なデータセットに、より高い閾値数を決定することができる。
【0036】
変更、追加、又は省略が、本開示の範囲から逸脱することなく処理100に対して行われてよい。例えば、処理100は、図示され本開示で説明されるよりも多数又は少数の要素を含んでよい。
【0037】
図2は、本開示の少なくとも一実施形態によるグラフ分析アルゴリズムを分類するための例示的な方法200のフローチャートを示す。方法200は、任意の適切なシステム、機器、又は装置により実行されてよい。例えば、
図5のコンピューティングシステム500は、方法200に関連付けられた動作のうちの1つ以上を実行してよい。別個のブロックにより示したが、方法200のブロックのうちの1つ以上に関連するステップ及び動作は、特定の実装に依存して、追加ブロックに分けられ、少ないブロックに結合され、又は削除されてよい。
【0038】
方法200は、ブロック202で、グラフ構造化データのデータセットを取得するステップを含んでよい。幾つかの実施形態では、データセットは、1つ以上のサブグラフを含むことができる。1つ以上のサブグラフの各々は、1つ以上のノード及び1つ以上のエッジを含むことができる。幾つかの実施形態では、1つ以上のサブグラフは、1つ以上のノードを共有することができる。これら及び他の実施形態では、1つ以上のサブグラフは、1つ以上のエッジを共有できない。
【0039】
ブロック204で、GXAI技術を使用したグラフ構造化データのデータセットの分析と、1つ以上のグラフ分析アルゴリズムを使用した分析との間の相関を決定することができる。幾つかの実施形態では、GXAI分析は、グラフ構造化データのデータセットの1つ以上の側面を分析することができる任意の機械学習支援又は人工知能支援グラフ分析技術を含むことができる。追加で又は代替的に、機械学習モジュールは、サブグラフ及びGNNで識別されたパターンに関するラベル又は注釈を既に含む1つ以上のサブグラフを含むグラフ構造化データのトレーニングデータセットを使用してトレーニングすることができる。例えば、GXAI分析は、グラフニューラルネットワーク又は任意の他のGXAIアルゴリズムを使用してクラスタリングアルゴリズム又はパターン認識ルーチンを実行するように構成された機械学習モジュールを含むコンピューティングシステムによって実行することができる。GXAIアルゴリズムは、グラフ構造化データの1つ以上のデータセットのトポロジを分析し、分析されたトポロジに基づいて予測を行うように構成することができる。幾つかの実施形態では、1つ以上の説明器を使用してGXAIアルゴリズムの仕様を決定することができる。例えば、1つ以上の説明器は、提供される説明のタイプ、学習手順が含まれるかどうか、各説明器が何のタスクに適用できるか、説明のターゲット、計算フロー又は説明、及び説明方法がグラフデータに対して特定の設計を有するかどうかを記述することができる。
【0040】
幾つかの実施形態では、GXAI分析は、エッジに基づく又はノードに基づく貢献スコアを決定することができる。貢献スコアは、ベクトル表現として格納することができ、ベクトルの各要素がグラフ構造化データの特定のデータセットの各々のエッジ又はノードに対応するようにする。特定のエッジ又は特定のノードに対する大きな貢献スコアが大きいほど、特定のエッジ又は特定のノードがGXAI分析の分類又は回帰結果に対してより大きな貢献を提供することを示してもよい(つまり、特定のエッジ又は特定のノードがGXAI分析に、より強く影響する)。これら及び他の実施形態では、GXAI分析のベクトル表現の要素(すなわち、各ノード又はエッジの貢献スコア)を正規化して、GXAI分析のベクトル表現と後述する様々なグラフ分析アルゴリズムの結果との比較を容易にすることができる。
【0041】
幾つかの実施形態では、グラフ分析アルゴリズムは、グラフ構造化データのデータセットの1つ以上の側面を表すために使用されるグラフ構造化データの任意の分析技術を含むことができる。グラフ分析アルゴリズムは、データセットに含まれるグラフ構造化データのノードを分析することができる。追加又は代替として、グラフ分析アルゴリズムは、データセットに含まれるグラフ構造化データのエッジを分析することができる。特定のグラフ分析アルゴリズムの例は、グラフ構造化データのデータセットの中で生じるノード及びエッジの1つ以上のパターンを識別するネットワークモチーフ分析を含むことができ、このパターンは、グラフ構造化データのランダム化ネットワークに存在するノード及びエッジ構成よりも頻繁に発生する。
【0042】
特定のグラフ分析アルゴリズムの別の例は、グラフ構造化データのデータセットの各ノードに、各ノードがデータセットに対して有する影響を示す値が割り当てられるノードベースのPageRank分析を含むことができる。特定のノードの影響は、例えば、特定のノードを他のノードに接続するエッジの数に従って決定することができる。PageRank分析において、各ノードについて決定された値は、ベクトルの各エントリがグラフ構造化データのデータセットのノードに対応するベクトルとして表されてもよい。追加で又は代替的に、PageRank分析によって決定された値は(例えば、全ての値を最大値で割ることによって)正規化されてもよい。それにより、正規化されたベクトルによって表されるPageRank分析の結果が、他のグラフ分析アルゴリズムの結果又はGXAI分析技術の結果とより容易に比較され得るようになる。
【0043】
特定のグラフ分析アルゴリズムの別の例は、グラフ構造化データのデータセットの各エッジに、各ノードがデータセットに対して有する影響を示す値が割り当てられるエッジベースの最短経路分析を含むことができる。特定のエッジの影響は、例えば、特定のエッジがグラフ構造化データの任意の2つのノード間の最短経路に現れる回数に基づいて決定されてもよい。各エッジは、ベクトルのエントリとして表されてもよく、エントリの値は、エッジが2つのノード間の最短経路に含まれる回数を示してもよい。追加で又は代替的に、最短経路分析によって決定されたベクトル値は、最短経路ベクトルとPageRankベクトルなどの他の任意のベクトルとの間の比較を容易にするために正規化されてもよい。
【0044】
幾つかの実施形態では、第1結果と第2結果との間の相関は、第1結果に対応する第1ベクトル(例えば、GXAI分析の結果のベクトル表現)と、第2結果に対応する第2ベクトル(例えば、グラフ分析アルゴリズムの結果のベクトル表現)との比較を含んでもよい。第1ベクトルと第2ベクトルとの間の比較は、任意のベクトル比較技術を使用して達成されてもよい。幾つかの実施形態では、相関は、第1ベクトルと第2ベクトルとに基づく類似性スコアを含んでもよい。例えば、これら及び他の実施形態では、類似性スコアは、コサイン類似性又はピアソン相関係数を含んでもよい。例えば、コサイン類似度を使用すると、類似性スコア0は相関がないことを示し、類似性スコア1は強い相関を示すことができる。ピアソン相関係数については、類似性スコア0は相関がないことを示し、負の類似性スコア又は正の類似性スコアは強い相関を示すことができる。
【0045】
ブロック206で、相関に基づいて、1つ以上のグラフ分析アルゴリズムのランク付きリストを生成することができる。幾つかの実施形態では、相関及び1つ以上のグラフ分析アルゴリズムを取得することができる。ランク付きリストは、相関の順にグラフ分析アルゴリズムを列挙することができる。例えば、1つ以上のグラフ分析アルゴリズムは、相関の降順に列挙することができる。
【0046】
幾つかの実施形態では、ランク付きリストは、表として生成することができる。例えば、表は、1つ以上のグラフ分析アルゴリズムを含む第1列を含むことができる。追加で又は代替的に、表は、相関を含む第2列を含むことができる。例えば、相関スコアは、特定の順序で表に並べられてもよい。例えば、相関スコアは、降順に並べることができる。幾つかの実施形態では、相関スコアは、昇順に並べることができる。これらの実施形態及び他の実施形態では、1つ以上のグラフ分析アルゴリズムは、対応する相関スコアに従ってテーブル内で並べることができる。
【0047】
ブロック208で、グラフ構造化データのデータセットの一般的特性を決定することができる。幾つかの実施形態では、一般的特性は、データセット内に含まれる1つ以上のサブグラフ間の類似性を示すことができる。幾つかの実施形態では、一般的特性は、数値的に決定することができる。例えば、一般的特性は、1つ以上のサブグラフ間の類似性を示す平均ベクトルとして表すことができる。例えば、1つ以上のサブグラフの各々に対するベクトルを生成することができる。ベクトルは、Graph2Vecなどの任意の適切な技術を使用して生成することができる。平均ベクトルは、1つ以上のサブグラフの各々に対するベクトルの平均を計算することによって生成することができる。
【0048】
ブロック210において、閾値数の最高性能のグラフ分析アルゴリズムを一般的特性に割り当てることができる。幾つかの実施形態では、割り当ては、少なくとも1つ以上のグラフ分析アルゴリズムのランク付きリストに基づくことができる。例えば、ランク付きリストは、相関スコアの降順で1つ以上のグラフ分析アルゴリズムをリストすることができる。これら及び他の実施形態では、閾値数は、割り当てられるべき特定の数のグラフ分析アルゴリズムを決定することができる。例えば、最も高い相関スコアを有する特定の数のグラフ分析アルゴリズムを一般的特性に割り当てることができる。
【0049】
幾つかの実施形態では、閾値数は、相関スコア閾値を定義することができる。例えば、閾値数は、超えられる特定の相関スコアを定義することができる。例えば、閾値数によって設定された特定の相関スコアを超える相関スコアを有する任意の数のグラフ分析アルゴリズムを一般的特性に割り当てることができる。
【0050】
ブロック212で、一般的特性及び閾値数の最高性能のグラフ分析アルゴリズムを含む割り当てテーブルを生成することができる。例えば、割り当てテーブルは、少なくとも第1列及び第2列を含むことができる。第1列は一般的特性を含み、第2列は一般的特性に割り当てられたグラフ分析アルゴリズムを含み得る。
【0051】
ブロック214において、割り当てテーブルを視覚化するGUI内の表示が生成され得る。例えば、GUIは、第1列が一般的特性を含み、第2列がグラフ分析アルゴリズムを含む割り当てテーブルを表示するように構成され得る。幾つかの実施形態において、GUIは、異なるフォーマットで割り当てテーブルを表示し得る。例えば、GUIは、リスト又は任意の適切なグラフィック的説明として割り当てテーブルを表示し得る。追加で又は代替的に、GUIは、グラフ構造化データのデータセットに関連する様々な統計の要約を表示するように構成され得る。幾つかの実施形態において、GUI内での割り当てテーブルの表示は、GUI175上での割り当てテーブル165の表示に関して
図1に関して説明したような1つ以上の動作を含み得る。
【0052】
変更、追加、又は省略が、本開示の範囲から逸脱することなく方法200に対して行われてよい。例えば、方法200の動作は、異なる順序で実施されてよい。追加又は代替として、2以上の動作が同時に実行されてよい。更に、概説された工程及び動作は例として提供されたものであり、工程及び動作の幾つかは、記載した実施形態の本質を減じることなく、任意であり、少ない工程及び動作に結合され、又は追加の工程及び動作に拡張されてよい。
【0053】
例えば、方法200は、グラフ構造化データの第2データセットを取得し、グラフ構造化データの第2データセットの第2一般的特性を決定することを更に含むことができる。第2一般的特性は、一般的特性と比較することができる。第2一般的特性が一般的特性と類似していることの決定に応答して、第2一般的特性と、割り当てテーブルから検索することができる閾値数のグラフ分析アルゴリズムとを含む第2割り当てテーブルを生成することができる。
【0054】
幾つかの実施形態では、第2一般的特性は、一般的特性と類似していなくてよい。これら及び他の実施形態では、グラフ分析アルゴリズムの第2ランク付きリストは、グラフ構造化データの第2データセットの、GXAI技術を使用した分析とグラフ分析アルゴリズムを使用した分析との間の第2相関に基づいて生成することができる。
【0055】
図3は、本開示の少なくとも一実施形態による、データセットのグラフ分析アルゴリズムを選択する例示的な方法のフローチャートを示す。方法300は、任意の適切なシステム、機器、又は装置により実行されてよい。例えば、
図5のコンピューティングシステム500は、方法300に関連付けられた動作のうちの1つ以上を実行してよい。別個のブロックにより示したが、方法300のブロックのうちの1つ以上に関連するステップ及び動作は、特定の実装に依存して、追加ブロックに分けられ、少ないブロックに結合され、又は削除されてよい。
【0056】
ブロック302で、グラフ構造化データのデータセットを取得することができる。幾つかの実施形態では、グラフ構造化データのデータセットは、1つ以上のサブグラフを含むことができる。1つ以上のサブグラフは、グラフ構造化データのデータセットにおけるグラフであってもよい。例えば、1つ以上のサブグラフは各々、データセットの一部である頂点及びエッジのサブセットを含むことができる。幾つかの実施形態では、データセットは、ユーザによって提供されてもよい。例えば、ユーザは、どのデータセットが分析されるべきかを指定してもよい。幾つかの実施形態では、データセットは、データ記憶装置から取得されてもよい。追加で又は代替的に、データセットは、別のシステムから提供されてもよい。データセットは、グラフ形式で表すことができる任意のタイプのデータを含んでもよい。例えば、幾つかの実施形態では、データセットは、金融取引の集合を含んでもよい。各集合は、データセットのサブグラフとして表すことができる。例えば、ノードは、金融取引に関与する人又はエンティティを表すことができ、エッジは、2つのノード間の特定の取引を表すことができる。幾つかの実施形態では、エッジは、方向を有する矢印として表すことができる。例えば、エッジは、特定のノードから別のノードを指すことができる。幾つかの実施形態では、エッジは、特定の方向を持たないノード間の接続として表すことができる。
【0057】
ブロック304で、データセットの一般的特性が既知であるかどうかを決定することができる。例えば、幾つかの実施形態では、データセットを提供するユーザは、データセットの一般的特性を認識することができる。幾つかの実施形態では、データセットの一般的特性が事前に決定されていてもよい。幾つかの実施形態では、一般的特性が別のシステムによって決定されていてもよい。幾つかの実施形態では、データセットは、データセットに関連付けられた一般的特性を含むことができる。例えば、一般的特性をデータセットと共に提供することができる。一般的特性が既知であるとの決定に応答して、方法300はブロック306に進むことができる。
【0058】
ブロック306で、データセットの一般的特性を読み出すことができる。例えば、幾つかの実施形態では、一般的特性をデータ記憶装置から読み出すことができる。別の例として、一般的特性は、データセットを提供するユーザによって提供することができる。幾つかの実施形態では、一般的特性は、データセットを伴うことができる。
【0059】
幾つかの実施形態では、データセットの一般的特性は知られていなくてもよい。例えば、データセットは、一般的特性が以前に決定されていなくてもよい未知のデータセットであってもよい。これらの場合、方法300は、ブロック304からブロック308に進むことができる。ブロック308で、データセットの一般的特性を決定することができる。幾つかの実施形態では、一般的特性は、データセット内の1つ以上のサブグラフ間の類似性を示すことができる。
【0060】
幾つかの実施形態では、1つ以上のサブグラフ間の類似性は、グラフトポロジー、ノード接続、及びノード近傍など、1つ以上のサブグラフ間の構造的類似性を含むことができる。これら及び他の実施形態では、クラスタリングアルゴリズムを使用して、一般的特性を決定することができる。例えば、クラスタリングアルゴリズムを使用して、1つ以上のサブグラフ内のノードをグループ又はクラスタに分割することができる。分割は、グラフ構造及び/又はグラフ上のノードの位置等のトポロジ基準に基づいて行うことができる。金融取引の集合を含むデータセットの例を続けると、特定のクラスタは、銀行を表す特定のノードに接続されたノードを含むことができる。例えば、クラスタは、銀行と直接金融取引を行う全ての個人又は団体(エンティティ)を含むことができる。幾つかの例では、特定のクラスタは、銀行での着信送金及び銀行からの発信送金を表す別々のクラスタに分割することができる。例えば、クラスタは、銀行に預金する全てのノードを含むことができ、別のクラスタは、銀行から預金を引き出す全てのノードを含むことができる。幾つかの実施形態では、任意の適切なクラスタリングアルゴリズムを使用することができる。例えば、とりわけ、Markov Clusterアルゴリズム、Molecular Complex Detection、Highly Connected Subgraphs、及びRestricted Neighborhood Search Clusteringを使用して、データセットの一般的特性を決定することができる。
【0061】
幾つかの実施形態では、一般的特性をベクトル形式で提示することができる。例えば、一般的特性は、1つ以上のサブグラフに対応する1つ以上のベクトルを平均する平均ベクトルとして提示することができる。これら及び他の実施形態では、1つ以上のサブグラフは、Graph2Vecなどの任意の適切なグラフ埋め込み方法を使用して、1つ以上のベクトルに変換することができる。これら及び他の実施形態では、1つ以上のベクトルは、同じ長さであるように構成することができる。例えば、1つ以上のベクトルは、所定の固定長であるように構成することができる。
【0062】
ブロック310で、データセットの一般的特性が、以前のデータセットの既存の一般的特性と類似しているかどうかを決定することができる。幾つかの実施形態では、以前のデータセットは、対応するグラフ分析アルゴリズムが
図1の処理100に従って決定された1つ以上のデータセットを含むことができる。幾つかの実施形態では、既存の一般的特性をデータ記憶装置又はメモリに格納することができる。これら及び他の実施形態では、一般的特性を既存の一般的特性の各々と比較することができる。例えば、幾つかの実施形態では、一般的特性と既存の一般的特性の各々との間の比較に対応する比較スコアを決定することができる。幾つかの実施形態では、一般的特性と既存の一般的特性とは、各々、ベクトル表現であってもよい。これら及び他の実施形態では、一般的特性と既存の一般的特性との間の比較は、コサイン類似度などの任意のベクトル比較メトリックを含むことができる。例えば、比較スコアは、0と1との間の値として表すことができ、0は類似度がないことを示し、1は強い類似度を示す。幾つかの実施形態では、類似度閾値を比較スコアに適用することができる。例えば、類似度閾値は、0と1との間の数であることができる。比較スコアが類似度閾値を満たす場合、一般的特性は、対応する既存の一般的特性に類似していると決定することができる。比較スコアは、類似度閾値以上であることによって、類似度閾値を満たすことができる。
【0063】
幾つかの実施形態では、一般的特性は、1つ以上の既存の一般的特性に類似することができる。これらの場合、方法300は、ブロック312に進むことができる。ブロック312では、類似の既存の一般的特性に関連するグラフ分析アルゴリズムの1つ以上のランク付きリストを読み出すことができる。1つ以上のランク付きリストは、各々、対応する相関スコアに従ってランク付けされた1つ以上のグラフ分析アルゴリズムを含むことができる。例えば、1つ以上のランク付きリストは、以前のデータセットに関して生成されていてもよい。幾つかの実施形態では、1つ以上のランク付きリストは、
図1のランク付きリスト155及び/又は
図4の方法400と同様の方法で生成されていてもよい。幾つかの実施形態では、1つ以上のランク付きリストに存在するグラフ分析アルゴリズムは、一般的特性に関連付けられてもよい。例えば、1つ以上のランク付きリストが既存の一般的特性に割り当てられたのと同じ方法で、1つ以上のランク付きリストを一般的特性に割り当ててもよい。幾つかの実施形態では、1つ以上のランク付きリスト内に存在するグラフ分析アルゴリズムは、データセットの分析に適したグラフ分析アルゴリズムを含んでもよい。例えば、最高ランク(例えば、1)のグラフ分析アルゴリズムは、データセットに最も適していてもよい。これら及び他の実施形態では、ランク付きリストは、システム及び/又はユーザに、データセットを分析するために選択されてもよいグラフ分析アルゴリズムのリストを提供してもよい。
【0064】
幾つかの実施形態では、一般的特性は、既存の一般的特性のいずれとも類似していなくてもよい。例えば、比較スコアのいずれも類似性閾値を満たさない場合がある。これら及び他の実施形態では、方法300はブロック314に進み、データセットを使用してグラフ分析アルゴリズムを処理することができる。例えば、
図2の方法200は、データセットを入力として使用して実行することができる。
【0065】
変更、追加、又は省略が、本開示の範囲から逸脱することなく方法300に対して行われてよい。例えば、方法300の動作は、異なる順序で実施されてよい。追加又は代替として、2以上の動作が同時に実行されてよい。更に、概説された工程及び動作は例として提供されたものであり、工程及び動作の幾つかは、記載した実施形態の本質を減じることなく、任意であり、少ない工程及び動作に結合され、又は追加の工程及び動作に拡張されてよい。
【0066】
図4は、本開示の少なくとも1つの実施形態による、グラフ分析アルゴリズムのランクテーブルを生成する例示的な方法のフローチャートを示す。方法400は、任意の適切なシステム、機器、又は装置により実行されてよい。例えば、
図1のランク付けモジュール150及び/又は
図5のコンピューティングシステム500は、方法400に関連する1つ以上の動作を実行することができる。別個のブロックにより示したが、方法400のブロックのうちの1つ以上に関連するステップ及び動作は、特定の実装に依存して、追加ブロックに分けられ、少ないブロックに結合され、又は削除されてよい。幾つかの実施形態では、方法400は、ランク付けモジュール150が
図1のランク付きリスト155を生成するために取り得る動作に対応し得る。
【0067】
ブロック401において、少なくともグラフ分析アルゴリズム及びグラフ分析アルゴリズムに対応する相関スコアを含む相関テーブルが得られ得る。例えば、相関テーブルは、
図1の相関モジュール140によって生成された相関テーブルに対応し得る。例えば、第1列はグラフ分析アルゴリズムを含み、第2列は対応する相関スコアを含み得る。幾つかの実施形態において、相関スコアは、
図1の相関スコア145に対応し得る。
【0068】
ブロック402において、ランクテーブルは、少なくとも第1列及び第2列を有して生成され得る。幾つかの実施形態では、第1列は、グラフ分析アルゴリズムを含み、第2列は、第1列の中のグラフ分析アルゴリズムに対応するランクを含むことができる。幾つかの実施形態において、第1列は分析された全てのグラフ分析アルゴリズムにより初期化されてよい。これら及び他の実施形態において、第1列は、任意の順序で初期化され得る。例えば、第1列は、グラフ分析アルゴリズムが得られた順序で初期化されてもよい。これら及び他の実施形態では、相関テーブル及びランクテーブルは、グラフ分析アルゴリズムの同じリストを含んでもよい。幾つかの実施形態では、ランクテーブル内のグラフ分析アルゴリズムは、相関テーブル内のグラフ分析アルゴリズムと同じ順序で初期化されてもよい。幾つかの実施形態では、第2列は、0に初期化されてもよい。例えば、グラフ分析アルゴリズムは、ランク付けされていなくてもよい。
【0069】
ブロック404で、グラフ分析アルゴリズムが相関テーブル内に残っているかどうかを決定することができる。例えば、グラフ分析アルゴリズムがランクテーブル内でランク付けされていない場合、グラフ分析アルゴリズムは、相関テーブル内に残っていると記述することができる。例えば、グラフ分析アルゴリズムに対応する第2列が0のままである場合、グラフ分析アルゴリズムは、ランクテーブル内でランク付けされていなくてもよい。グラフ分析アルゴリズムが残っていないと決定したことに応答して、方法400はブロック406に進むことができる。ブロック406で、ランクテーブルを確定して出力することができる。
【0070】
少なくとも1つのグラフ分析アルゴリズムが相関テーブル内に残っていると決定したことに応答して、方法400はブロック408に進むことができる。ブロック408で、相関テーブル内のグラフ分析アルゴリズムを、対応する相関スコアに従ってソートすることができる。例えば、グラフ分析アルゴリズムは、相関スコアの降順にソートすることができる。
【0071】
ブロック410で、第1列内のグラフ分析アルゴリズムに対応するランクテーブルの第2列にランクを追加することができる。例えば、ソート後の相関テーブルの先頭のグラフ分析アルゴリズムに、ランクとして1を与えることができる。例えば、対応するグラフ分析アルゴリズムをランクテーブル内に配置し、ランクテーブルの第2列内の対応する0を、与えられたランクで更新することができる。相関テーブル内の第2グラフ分析アルゴリズムに、ランクとして2を与えることができる。幾つかの実施形態では、ランクテーブル内のグラフ分析アルゴリズムにランクを与える処理は、全てのグラフ分析アルゴリズムにランクが与えられるまで繰り返すことができる。例えば、方法400は、相関テーブル内に残っているグラフ分析アルゴリズムがなくなるまでブロック404に戻ることができる。幾つかの実施形態では、各グラフ分析アルゴリズムにランクが与えられた後、ランクテーブルをランクに従ってソートすることができる。例えば、最高ランク(例えば、1)を有するグラフ分析アルゴリズムがリストの先頭になるように、ランクテーブルをソートすることができる。変更、追加、又は省略が、本開示の範囲から逸脱することなく方法400に対して行われてよい。例えば、方法400の動作は、異なる順序で実施されてよい。追加又は代替として、2以上の動作が同時に実行されてよい。更に、概説された工程及び動作は例として提供されたものであり、工程及び動作の幾つかは、記載した実施形態の本質を減じることなく、任意であり、少ない工程及び動作に結合され、又は追加の工程及び動作に拡張されてよい。
【0072】
図5は、本開示の少なくとも一実施形態による、光信号増幅に使用することができる例示的なシステム500を示すブロック図である。システム500は、プロセッサ510、メモリ512、通信ユニット516、ディスプレイ518、及びユーザインタフェースユニット520を含み、これらは全て通信可能に結合され得る。幾つかの実施態様において、システム500は、本開示に記載された方法の1つ以上を実行するために使用することができる。例えば、システム500は、
図1に記載された方法の実行を補助するために使用することができる。例えば、システム500は、本開示の少なくとも一実施形態によるグラフ分析アルゴリズムを分類するために使用できる。
【0073】
通常、プロセッサ510は、種々のコンピュータハードウェア又はソフトウェアモジュールを含む、任意の適切な専用又は汎用コンピュータ、コンピューティングエンティティ、又は処理装置を含んでよく、任意の適切なコンピュータ可読記憶媒体に格納された命令を実行するよう構成されてよい。例えば、プロセッサ510は、マイクロプロセッサ、マイクロコントローラ、グラフィック処理ユニット(GPU)又はテンソル処理ユニット(TPU)のような並列プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、又はプログラム命令を解釈し及び/又は実行し及び/又はデータを処理するよう構成される任意の他のデジタル若しくはアナログ回路を含んでよい。
【0074】
図5には単一のプロセッサが示されるが、プロセッサ610は、任意の数のネットワーク又は物理的位置に渡り分散され、個々に又は共同で本願明細書に記載された任意の数の動作を実行するよう構成される、任意の数のプロセッサを含んでよいことが理解される。幾つかの実施形態では、プロセッサ510は、プログラム命令を解釈し及び/又は実行し、及び/又はメモリ512に格納されたデータを処理してよい。幾つかの実施形態では、プロセッサ510は、メモリ512に格納されたプログラム命令を実行してよい。
【0075】
例えば、幾つかの実施形態では、プロセッサ510は、タスク実行に関連するメモリ512に記憶されたプログラム命令を実行して、システム500が命令によって指示されたように、それに関連する操作の実行を実行する又は実行を指示することができる。これら及び他の実施形態では、命令は、
図2~4の方法200、300、200及び/又は
図1に記載された処理フローの1つ以上のブロックを実行するために使用することができる。
【0076】
メモリ512は、コンピュータ実行可能命令を運び又は有するコンピュータ可読記憶媒体又は1つ以上のコンピュータ可読記憶媒体、又はそれに記憶されたデータ構造を含んでよい。このようなコンピュータ可読記憶媒体は、プロセッサ510のような汎用又は専用コンピュータによりアクセスされ得る任意の市販の媒体であってよい。
【0077】
例として、限定ではなく、このようなコンピュータ可読記憶媒体は、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、電気的消去可能なプログラマブル読み出し専用メモリ(EEPROM)、コンパクトディスク読み出し専用メモリ(CD-ROM)、又は他の光ディスク記憶装置、磁気ディスク記憶装置、又は他の磁気記憶装置、フラッシュメモリ素子(例えば、個体メモリ装置)、又はコンピュータ実行可能命令若しくはデータ構造の形式で特定のプログラムコードを運ぶ又は格納するために使用され得る且つ汎用又は専用コンピュータによりアクセスされ得る任意の他の記憶媒体、を含む非一時的コンピュータ可読媒体を含んでよい。上記の組み合わせも、コンピュータ可読記憶媒体の範囲に含まれてよい。
【0078】
コンピュータ実行可能命令は、例えば、本開示に記載されているように、プロセッサ510に特定の操作又は操作のグループを実行させるように構成された命令及びデータを含み得る。これら及び他の実施形態では、本開示で説明されるような用語「非一時的」は、Federal Circuit decision of In re Nuijten, 500 F.3d 1346 (Fed. Cir. 2007)における特許可能な主題の範囲に含まれない一時的媒体の種類のみを除外するものと考えられるべきである。上記の組み合わせも、コンピュータ可読媒体の範囲に含まれてよい。
【0079】
通信ユニット516は、ネットワークを介して情報を送信し又は受信するよう構成される、任意のコンポーネント、装置、システム、又はそれらの組み合わせを含んでよい。幾つかの実施形態では、通信ユニット516は、他の場所、同じ場所にある装置、又は同じシステム内の他のコンポーネントと通信してよい。例えば、通信ユニット516は、モデム、ネットワークカード(無線又は有線)、光通信装置、赤外線通信装置、無線通信装置(例えば、アンテナ)、及び/又はチップセット(例えば、Bluetooth(登録商標)装置、802.6装置(例えば、都市域ネットワーク(MAN))、WiFi装置、WiMax装置、セルラ通信設備、等)、等を含んでよい。通信ユニット516は、ネットワーク及び/又は本開示に記載の任意の他の装置又はシステムとのデータ交換を可能にしてよい。
【0080】
ディスプレイ518は、LCD、LED、点字端末、又は他のタイプのディスプレイのような、1つ又は複数のディスプレイとして構成することができる。ディスプレイ518は、プロセッサ510によって指示されたビデオ、テキストキャプション、ユーザインタフェース、及び他のデータを提示するように構成することができる。
【0081】
ユーザインタフェースユニット520は、ユーザがシステム500とインタフェースすることを可能にする任意の装置を含むことができる。例えば、ユーザインタフェースユニット520は、他の装置の中で、マウス、トラックパッド、キーボード、ボタン、カメラ及び/又はタッチスクリーンを含むことができる。ユーザインタフェースユニット520は、ユーザから入力を受け取り、プロセッサ510に入力を提供することができる。幾つかの実施形態では、ユーザインタフェースユニット520とディスプレイ518を組み合わせることができる。
【0082】
変更、追加、又は省略が、本開示の範囲から逸脱することなくシステム500に対して行われてよい。例えば、幾つかの実施形態ではシステム500は、明示され又は記載されないことのある任意の数の他のコンポーネントを含んでよい。更に、特定の実装に応じて、システム600は、図示及び説明されているコンポーネントの1つ以上を含まないことができる。
【0083】
上述のように、本願明細書に記載の実施形態は、以下に更に詳細に議論されるように、種々のコンピュータハードウェア又はソフトウェアモジュールを含む特定用途向け又は汎用コンピュータ(例えば、
図5のプロセッサ510)の使用を含んでよい。更に、上述のように、本願明細書に記載の実施形態は、格納されたコンピュータ実行可能命令又はデータ構造を有するコンピュータ可読媒体(例えば、
図5のメモリセル512)を用いて実装されてよい。
【0084】
一般的な慣行に従って、図面に示される様々な特徴は、縮尺通り描画されないことがある。本開示に示される図は、特定の機器(例えば、装置、システム等)又は方法の実際の図であることを意図したものではなく、開示の様々な実施形態を説明するために使用される単なる理想化された表現である。従って、様々な特徴の寸法は、明確にするために任意に拡大又は縮小することができる。更に、図面の一部は、明確にするために簡略化することができる。従って、図面は、所与の機器(例えば、装置)の全ての構成要素又は特定の方法の全ての操作を示していない場合がある。
【0085】
本明細書で及び特に添付の特許請求の範囲(例えば、添付の請求項本体)で使用される用語は、通常、「広義」の用語として意図される(例えば、用語「含む」は「含むが、これに限定されない」と解釈されるべきであり、用語「有する」は「有するが、これに限定されない」と解釈されるべきである、等)。
【0086】
更に、特定数の導入された請求項の列挙が意図される場合、このような意図は、請求項中に明示的に示され、このような列挙のない場合、このような意図は存在しない。例えば、理解の支援として、以下の添付の請求項は、請求項の列挙を導入するために、導入フレーズ「少なくとも1つ」及び「1つ以上」の使用を含み得る。しかしながら、このようなフレーズの使用は、同じ請求項が導入フレーズ「1つ以上」又は「少なくとも1つ」及び不定冠詞「a」又は「an」を含むときでも(例えば、「a」及び/又は「an」は「少なくとも1つ」又は「1つ以上」を意味すると解釈されるべきである)、不定冠詞「a」又は「an」による請求項の列挙の導入が、このような導入された請求項の列挙を含む任意の特定の請求項を、1つのこのような列挙のみを含む実施形態に限定することを意味すると考えられるべきではない。つまり、同じことが、請求項の列挙を導入するために使用される定冠詞の使用にも当てはまる。
【0087】
更に、特定数の導入された請求項の列挙が明示的に記載される場合、このような列挙が、少なくとも列挙された数を意味すると解釈されるべきであることが理解される(例えば、他の修飾のない「2つの列挙」の記載は、少なくとも2つの列挙、又は2以上の列挙を意味する)。更に、「A、B、及びC等のうちの少なくとも1つ」又は「A、B、及びC等のうちの1つ以上」と同様の記載が使用される例では、通常、このような構成は、A単独で、B単独で、C単独で、A及びBを一緒に、A及びCを一緒に、B及びCを一緒に、又はA、B、及びCを一緒に、等を含むことを意図する。例えば、用語「及び/又は」の使用は、この方法で解釈されることが意図される。
【0088】
更に、2以上の選択的な用語を表す任意の離接的な語又はフレーズは、説明、請求項、又は図面にあるかにかかわらず、用語のうちの1つ、用語のうちのいずれか、又は両方の用語を含む可能性を想定すると理解されるべきである。例えば、フレーズ「A又はB」は、「A」又は「B」又は「A及びB」の可能性を含むと理解されるべきである。
【0089】
更に、用語「第1」、「第2」、「第3」等の使用は、必ずしも本明細書で特定の順序又は要素の数を暗示するために使用されない。通常、用語「第1」、「第2」、「第3」等は、一般的識別子として異なる要素間を区別するために使用される。用語「第1」、「第2」、「第3」等が特定の順序を意味するという表示がない場合、これらの用語は特定の順序を意味すると理解されるべきではない。更に、用語「第1」、「第2」、「第3」等が要素の特定の数を意味するという表示がない場合、これらの用語は要素の特定の数を意味すると理解されるべきではない。例えば、第1ウィジェットは第1側面を有するものとして記述することができ、第2ウィジェットは第2側面を有するものとして記述することができる。第2ウィジェットに関する「第2側面」という用語の使用は、第2ウィジェットのそのような側面を第1ウィジェットの「第1側面」から区別することであり、第2ウィジェットが2つの側面を有することを意味するものではない。
【0090】
本明細書に記載された全ての例及び条件付き言語は、読者が本発明及び本発明が技術を更に発展させることに貢献する概念を理解するのを支援する教示目的を意図しており、そのような具体的に列挙された例及び条件に限定されないと解釈されるべきである。本開示の実施形態は詳細に記載されたが、本開示の精神及び範囲から逸脱することなく、これらに種々の変更、代替、及び選択が行われ得ることが理解されるべきである。
【0091】
以上の実施形態に加えて、更に以下の付記を開示する。
(付記1)
グラフ構造化データのデータセットを取得するステップであって、前記データセットは1つ以上のサブグラフを含む、ステップと、
グラフ構造化データの前記データセットのグラフ説明可能な人工知能(GXAI)技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップと、
前記相関に基づいて、前記複数のグラフ分析アルゴリズムのランク付きリストを生成するステップと、
グラフ構造化データの前記データセットの一般的特性を決定するステップであって、前記一般的特性が1つ以上のサブグラフ間の類似性を示す、ステップと、
前記複数のグラフ分析アルゴリズムのランク付きリストに基づいて、閾値数の分析アルゴリズムを前記一般的特性に割り当てるステップと、
前記一般的特性及び前記閾値数のグラフ分析アルゴリズムを含む割り当てテーブルを生成するステップと、
前記割り当てテーブルを視覚化するグラフィカルユーザインタフェース(GUI)内の表示を生成するステップと、
を含む方法。
(付記2)
前記GXAI技術を使用することは、
グラフ構造化データの前記データセット及びグラフニューラルネットワーク(GNN)に基づいて、機械学習(ML)モデルをトレーニングするステップと、
GNN説明器によって、グラフ構造化データの前記データセットの各ノード又はエッジが前記MLモデルのトレーニングにどのように貢献するかを示す数値貢献スコアを生成するステップと、
を含む、付記1に記載の方法。
(付記3)
グラフ構造化データの前記データセットのGXAI技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップは、
前記GXAI技術を使用して、第1分析の第1ベクトルを生成するステップと、
前記複数のグラフ分析アルゴリズムを使用して、第2分析の第2ベクトルを生成するステップと、
前記第1ベクトル及び前記第2ベクトルに基づいて類似性スコアを計算するステップと、
を含む、付記1に記載の方法。
(付記4)
前記相関に基づいて、前記グラフ分析アルゴリズムの前記ランク付きリストを生成するステップは、
少なくとも第1列及び第2列を有するランクテーブルを生成するステップであって、前記第1列は前記グラフ分析アルゴリズムを含み、前記第2列は前記グラフ分析アルゴリズムのランクを示す、ステップと、
前記相関に基づいて、前記グラフ分析アルゴリズムをランク番号でランク付けするステップと、
前記ランクテーブルを前記ランク番号に従ってソートするステップと、
前記ランクテーブルを出力するステップと、
を含む、付記1に記載の方法。
(付記5)
グラフ構造化データの前記データセットの前記一般的特性を決定するステップは、
前記1つ以上のサブグラフの各々についてベクトルを生成するステップと、
前記1つ以上のサブグラフの前記ベクトルの平均ベクトルを計算するステップと、
を含む、付記1に記載の方法。
(付記6)
前記グラフ構造化データの第2データセットを取得するステップと、
前記グラフ構造化データの第2データセットの第2一般的特性を決定するステップと、
前記第2一般的特性が前記一般的特性に類似していることを決定するステップと、
前記割り当てテーブルを読み出すステップと、
前記割り当てテーブルに存在する閾値数の分析アルゴリズムを前記第2一般的特性に割り当てるステップと、
前記第2一般的特性及び前記閾値数のグラフ分析アルゴリズムを含む第2割り当てテーブルを生成するステップと、
前記第2割り当てテーブルを視覚化する前記GUI内の表示を生成するステップと、
を更に含む付記1に記載の方法。
(付記7)
グラフ構造化データの第2データセットを取得するステップと、
グラフ構造化データの前記第2データセットの第2一般的特性を決定するステップと、
前記第2一般的特性が前記一般的特性に類似していないことを決定するステップと、
グラフ構造化データの前記第2データセットのGXAI技術を使用した分析と前記複数のグラフ分析アルゴリズムを使用した分析との間の第2相関に基づいて、前記複数のグラフ分析アルゴリズムの第2ランク付きリストを生成するステップと、
を更に含む付記1に記載の方法。
(付記8)
命令を格納するように構成された1つ以上の非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されたことに応答してシステムに動作を実行させ、前記動作は、
グラフ構造化データのデータセットを取得するステップであって、前記データセットは1つ以上のサブグラフを含む、ステップと、
グラフ構造化データの前記データセットのグラフ説明可能な人工知能(GXAI)技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップと、
前記相関に基づいて、前記複数のグラフ分析アルゴリズムのランク付きリストを生成するステップと、
グラフ構造化データの前記データセットの一般的特性を決定するステップであって、前記一般的特性が1つ以上のサブグラフ間の類似性を示す、ステップと、
前記複数のグラフ分析アルゴリズムのランク付きリストに基づいて、閾値数の最高性能グラフ分析アルゴリズムを前記一般的特性に割り当てるステップと、
前記一般的特性及び前記閾値数の最高性能グラフ分析アルゴリズムを含む割り当てテーブルを生成するステップと、
前記割り当てテーブルを視覚化するグラフィカルユーザインタフェース(GUI)内の表示を生成するステップと、
を含む、1つ以上の非一時的コンピュータ可読記憶媒体。
(付記9)
前記GXAI技術を使用することは、
グラフ構造化データの前記データセット及びグラフニューラルネットワーク(GNN)に基づいて、機械学習(ML)モデルをトレーニングするステップと、
GNN説明器によって、グラフ構造化データの前記データセットの各ノード又はエッジが前記MLモデルのトレーニングにどのように貢献するかを示す数値貢献スコアを生成するステップと、
を含む、付記8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
(付記10)
グラフ構造化データの前記データセットのGXAI技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップは、
前記GXAI技術を使用して、第1分析の第1ベクトルを生成するステップと、
前記複数のグラフ分析アルゴリズムを使用して、第2分析の第2ベクトルを生成するステップと、
前記第1ベクトル及び前記第2ベクトルに基づいて、ピアソン相関係数又はコサイン類似度を計算するステップと、
を含む、付記8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
(付記11)
前記相関に基づいて、前記グラフ分析アルゴリズムの前記ランク付きリストを生成するステップは、
少なくとも第1列及び第2列を有するランクテーブルを生成するステップであって、前記第1列は前記グラフ分析アルゴリズムを含み、前記第2列は前記グラフ分析アルゴリズムのランクを示す、ステップと、
前記相関に基づいて、前記グラフ分析アルゴリズムをランク番号でランク付けするステップであって、より低いランク番号がより強い相関を反映する、ステップと、
前記ランクテーブルを前記ランク番号に従ってソートするステップと、
前記ランクテーブルを出力するステップと、
を含む、付記8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
(付記12)
グラフ構造化データの前記データセットの前記一般的特性を決定するステップは、
前記1つ以上のサブグラフの各々についてベクトルを生成するステップと、
前記1つ以上のサブグラフの前記ベクトルの平均ベクトルを計算するステップと、
を含む、付記8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
(付記13)
前記動作は、
前記グラフ構造化データの第2データセットを取得するステップと、
前記グラフ構造化データの第2データセットの第2一般的特性を決定するステップと、
前記第2一般的特性が前記一般的特性に類似していることを決定するステップと、
前記割り当てテーブルを読み出すステップと、
前記割り当てテーブルに存在する閾値数の分析アルゴリズムを前記第2一般的特性に割り当てるステップと、
前記第2一般的特性及び前記閾値数のグラフ分析アルゴリズムを含む第2割り当てテーブルを生成するステップと、
前記第2割り当てテーブルを視覚化する前記GUI内の表示を生成するステップと、
を更に含む、付記8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
(付記14)
前記動作は、
グラフ構造化データの第2データセットを取得するステップと、
グラフ構造化データの前記第2データセットの第2一般的特性を決定するステップと、
前記第2一般的特性が前記一般的特性に類似していないことを決定するステップと、
グラフ構造化データの前記第2データセットのGXAI技術を使用した分析と前記複数のグラフ分析アルゴリズムを使用した分析との間の第2相関に基づいて、前記複数のグラフ分析アルゴリズムの第2ランク付きリストを生成するステップと、
を更に含む、付記8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
(付記15)
システムであって、
1つ以上のプロセッサと、
命令を格納するように構成された1つ以上の非一時的コンピュータ可読記憶媒体と、
を含み、前記命令は、実行されたことに応答して前記システムに動作を実行させ、前記動作は、
グラフ構造化データのデータセットを取得するステップであって、前記データセットは1つ以上のサブグラフを含む、ステップと、
グラフ構造化データの前記データセットのグラフ説明可能な人工知能(GXAI)技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップと、
前記相関に基づいて、前記複数のグラフ分析アルゴリズムのランク付きリストを生成するステップと、
グラフ構造化データの前記データセットの一般的特性を決定するステップであって、前記一般的特性が1つ以上のサブグラフ間の類似性を示す、ステップと、
前記複数のグラフ分析アルゴリズムのランク付きリストに基づいて、閾値数の最高性能グラフ分析アルゴリズムを前記一般的特性に割り当てるステップと、
前記一般的特性及び前記閾値数の最高性能グラフ分析アルゴリズムを含む割り当てテーブルを生成するステップと、
前記割り当てテーブルを視覚化するグラフィカルユーザインタフェース(GUI)内の表示を生成するステップと、
を含む、システム。
(付記16)
前記GXAI技術を使用することは、
グラフ構造化データの前記データセット及びグラフニューラルネットワーク(GNN)に基づいて、機械学習(ML)モデルをトレーニングするステップと、
GNN説明器によって、グラフ構造化データの前記データセットの各ノード又はエッジが前記MLモデルのトレーニングにどのように貢献するかを示す数値貢献スコアを生成するステップと、
を含む、付記15に記載のシステム。
(付記17)
グラフ構造化データの前記データセットのGXAI技術を使用した分析と複数のグラフ分析アルゴリズムを使用した分析との間の相関を決定するステップは、
前記GXAI技術を使用して、第1分析の第1ベクトルを生成するステップと、
前記複数のグラフ分析アルゴリズムを使用して、第2分析の第2ベクトルを生成するステップと、
前記第1ベクトル及び前記第2ベクトルに基づいて、ピアソン相関係数又はコサイン類似度を計算するステップと、
を含む、付記15に記載のシステム。
(付記18)
前記相関に基づいて、前記グラフ分析アルゴリズムの前記ランク付きリストを生成するステップは、
少なくとも第1列及び第2列を有するランクテーブルを生成するステップであって、前記第1列は前記グラフ分析アルゴリズムを含み、前記第2列は前記グラフ分析アルゴリズムのランクを示す、ステップと、
前記相関に基づいて、前記グラフ分析アルゴリズムをランク番号でランク付けするステップであって、より低いランク番号がより強い相関を反映する、ステップと、
前記ランクテーブルを前記ランク番号に従ってソートするステップと、
前記ランクテーブルを出力するステップと、
を含む、付記15に記載のシステム。
(付記19)
グラフ構造化データの前記データセットの前記一般的特性を決定するステップは、
前記1つ以上のサブグラフの各々についてベクトルを生成するステップと、
前記1つ以上のサブグラフの前記ベクトルの平均ベクトルを計算するステップと、
を含む、付記15に記載のシステム。
(付記20)
前記動作は、
前記グラフ構造化データの第2データセットを取得するステップと、
前記グラフ構造化データの第2データセットの第2一般的特性を決定するステップと、
前記第2一般的特性が前記一般的特性に類似していることを決定するステップと、
前記割り当てテーブルを読み出すステップと、
前記割り当てテーブルに存在する閾値数の分析アルゴリズムを前記第2一般的特性に割り当てるステップと、
前記第2一般的特性及び前記閾値数のグラフ分析アルゴリズムを含む第2割り当てテーブルを生成するステップと、
前記第2割り当てテーブルを視覚化する前記GUI内の表示を生成するステップと、
を更に含む、付記15に記載のシステム。
【符号の説明】
【0092】
110 データセット
120 特徴付けモジュール
125 一般的特性
130 グラフ説明可能な人工知能結果
135 グラフ分析結果
140 相関モジュール
145 相関スコア
150 ランク付けモジュール
155 ランク付きリスト
160 割り当てモジュール
165 割り当てテーブル
170 グラフィカルユーザインタフェース(GUI)モジュール