(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024167902
(43)【公開日】2024-12-04
(54)【発明の名称】機械学習のための装置及びコンピュータ実装された方法
(51)【国際特許分類】
G06N 5/022 20230101AFI20241127BHJP
G06N 20/00 20190101ALI20241127BHJP
G06F 16/901 20190101ALI20241127BHJP
【FI】
G06N5/022
G06N20/00
G06F16/901
【審査請求】未請求
【請求項の数】11
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024082383
(22)【出願日】2024-05-21
(31)【優先権主張番号】10 2023 204 758.6
(32)【優先日】2023-05-22
(33)【優先権主張国・地域又は機関】DE
(71)【出願人】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(74)【代理人】
【識別番号】100114890
【弁理士】
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【弁理士】
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【弁理士】
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100134315
【弁理士】
【氏名又は名称】永島 秀郎
(74)【代理人】
【識別番号】100162880
【弁理士】
【氏名又は名称】上島 類
(72)【発明者】
【氏名】ヨウムナ サラー マフムード イスマイール
(72)【発明者】
【氏名】ダリア ステパノワ
(72)【発明者】
【氏名】チュン キエン チャン
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175FA01
5B175KA12
(57)【要約】
【課題】機械学習のための装置及びコンピュータ実装された方法に関する。
【解決手段】本方法は、知識グラフのエンティティの埋め込みを提供すること(804)と、知識グラフに依存して、エンティティについての特徴の集合を決定すること(806)と、特徴の集合からの1つの特徴をエンティティに提供すること(808)であって、特徴は、モデルを用いて当該特徴に割り当てられたスコアに依存して選択される、こと(808)とを含み、モデルは、特徴の集合を、エンティティの埋め込みについての予測に射影し、予測と埋め込みとの間の差に依存してスコアを決定するように構成されている。
【選択図】
図8
【特許請求の範囲】
【請求項1】
機械学習のためのコンピュータ実装された方法であって、
前記方法は、
知識グラフ(200)のエンティティの埋め込みを提供すること(804)と、
前記知識グラフ(200)に依存して、前記エンティティについての特徴の集合を決定すること(806)と、
前記特徴の集合からの1つの特徴を前記エンティティに提供すること(808)であって、前記特徴は、モデルを用いて当該特徴に割り当てられたスコアに依存して選択される、こと(808)と、
を含み、
前記モデルは、前記特徴の集合を、前記エンティティの埋め込みについての予測に射影し、前記予測と前記埋め込みとの間の差に依存して前記スコアを決定するように構成されている、
ことを特徴とする方法。
【請求項2】
前記特徴の集合を決定すること(806)は、前記知識グラフ(200)の少なくとも1つの関係又は少なくとも1つのエンティティに依存して少なくとも1つの特徴を決定することを含む、
請求項1に記載の方法。
【請求項3】
前記特徴の集合を決定すること(806)は、
前記知識グラフ(200)内で前記エンティティが、前記知識グラフ(200)の別のエンティティとの間で有する関係に関する情報、及び/又は、
前記知識グラフ(200)内で前記エンティティとの間の関係を有する、前記知識グラフ(200)の別のエンティティに関する情報、及び/又は、
前記知識グラフ(200)内で前記エンティティの所定の近傍に存在する別のエンティティ又は関係に関する情報、及び/又は、
前記エンティティが、前記知識グラフ(200)の別のエンティティに対して若しくは前記知識グラフ(200)内の他の複数のエンティティに対して有する関係の量に関する情報、及び/又は、
前記知識グラフ内で前記エンティティの所定の近傍に存在する関係又はエンティティの量に関する情報
を含むための少なくとも1つの特徴を決定することを含む、
請求項1又は2に記載の方法。
【請求項4】
前記特徴の集合を提供すること(806)は、前記知識グラフ(200)内の前記エンティティに割り当てられた出行する関係又は入来する関係の数を示すための量に関する情報を提供することを含む、
請求項3に記載の方法。
【請求項5】
前記特徴の集合を決定すること(806)は、
前記知識グラフ(200)内の前記エンティティと前記知識グラフ(200)の別のエンティティとの間の関係の非存在に関する情報、及び/又は、
前記知識グラフ(200)内で前記エンティティとの間の関係を有する、前記知識グラフの別のエンティティの非存在に関する情報、及び/又は、
前記エンティティの所定の近傍にある前記知識グラフ(200)内の別のエンティティ若しくは関係の不在に関する情報
を含むための少なくとも1つの特徴を決定することを含む、
請求項1乃至4のいずれか一項に記載の方法。
【請求項6】
前記知識グラフ(200)は、ラベルを備えた関係を含み、
前記特徴の集合を提供すること(806)は、前記関係のラベルを示すための、前記関係又は前記エンティティ又は前記別のエンティティに関する情報を決定することを含む、
請求項1乃至5のいずれか一項に記載の方法。
【請求項7】
前記特徴の集合を提供すること(806)は、
前記エンティティを自身の始点若しくは終点として有する少なくとも1つの経路、特に所与の長さの少なくとも1つの経路を示す特徴、又は、
前記エンティティを自身の始点若しくは終点として有する少なくとも1つの経路、特に所与の長さの経路が存在しないことを示す特徴
を提供することを含む、
請求項1乃至6のいずれか一項に記載の方法。
【請求項8】
前記方法は、
前記モデルを用いて前記特徴の集合のうちの複数の特徴にそれぞれのスコアを割り当てることと、
前記複数の特徴に割り当てられたスコアの平均を決定することと、
前記特徴に割り当てられたスコアと前記平均との間の比較の結果に依存して、前記特徴の集合から前記特徴を選択することと、
を含む、
請求項1乃至7のいずれか一項に記載の方法。
【請求項9】
前記エンティティは、技術的システム(106)におけるイベントを表し、
前記知識グラフ(200)は、前記エンティティを、前記知識グラフ(200)のうちの前記イベントのカテゴリを表すエンティティに関連付け、
前記知識グラフ(200)は、前記カテゴリを表すエンティティを、前記技術的システム(106)又は別の技術的システムにおける異なるイベントを表す少なくとも1つの他のエンティティに関連付け、
前記方法は、
前記技術的システム(106)において発生したイベントを検出すること、
前記技術的システム(106)を起動させること、又は、
前記特徴と、前記少なくとも1つの他のエンティティに割り当てられた所定の特徴との間の比較に依存して、前記技術的システム(106)の故障を自動的に検出すること
を含む、
請求項1乃至8のいずれか一項に記載の方法。
【請求項10】
機械学習のための装置(100)であって、
前記装置(100)は、
少なくとも1つのプロセッサ(102)と、
少なくとも1つのメモリ(104)と、
を備え、
前記少なくとも1つのメモリ(104)は、前記少なくとも1つのプロセッサ(102)によって実行可能であって、かつ、前記少なくとも1つのプロセッサ(102)によって実行された場合に、請求項1乃至9のいずれか一項に記載の方法を前記装置に実施させるための命令を格納している、
ことを特徴とする装置(100)。
【請求項11】
コンピュータプログラムであって、
前記コンピュータプログラムは、コンピュータによって実行可能であって、かつ、前記コンピュータによって実行された場合に、請求項1乃至9のいずれか一項に記載の方法を前記コンピュータに実施させるための命令を含む
ことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
背景
本発明は、機械学習のための装置及びコンピュータ実装された方法に関する。
【背景技術】
【0002】
発明の開示
機械学習のためのコンピュータ実装された方法及び装置は、知識グラフ埋め込み又は知識グラフ埋め込みモデルのためのモデル説明を生成し、すなわち、特に特定の所定のタスクに対して元々のエンティティ埋め込みと同様に機能する、エンティティの解釈可能な表現を生成する。
【発明の概要】
【課題を解決するための手段】
【0003】
コンピュータ実装された方法である本方法は、知識グラフのエンティティの埋め込みを提供することと、知識グラフに依存して、エンティティについての特徴の集合を決定することと、特徴の集合からの1つの特徴をエンティティに提供することであって、特徴は、モデルを用いて当該特徴に割り当てられたスコアに依存して選択される、こととを含み、モデルは、特徴の集合を、エンティティの埋め込みについての予測に射影し、予測と埋め込みとの間の差に依存してスコアを決定するように構成されている。任意の所与のモデルによって事前に計算された知識グラフと、知識グラフのエンティティの埋め込みとが与えられると、本方法は、それぞれの埋め込みに近似する、エンティティについての解釈可能な特徴を生成する。解釈可能な特徴は、例えばブール特徴ベクトルを含む。取得された特徴ベクトルは、エンティティの近傍から抽出された情報をエンコードする。
【0004】
特徴の集合を決定することは、知識グラフの少なくとも1つの関係又は少なくとも1つのエンティティに依存して少なくとも1つの特徴を決定することを含み得る。この特徴は、関係又はエンティティに基づく説明を提供する。
【0005】
特徴の集合を決定することは、知識グラフ内でエンティティが、知識グラフの別のエンティティとの間で有する関係に関する情報、及び/又は、知識グラフ内でエンティティとの間の関係を有する、知識グラフの別のエンティティに関する情報、及び/又は、知識グラフ内でエンティティの所定の近傍に存在する別のエンティティ若しくは関係に関する情報、及び/又は、エンティティが、知識グラフの別のエンティティに対して若しくは知識グラフ内の他の複数のエンティティに対して有する関係の量に関する情報、及び/又は、知識グラフ内でエンティティの所定の近傍に存在する関係若しくはエンティティの量に関する情報を含むための少なくとも1つの特徴を決定することを含み得る。これらの特徴は、知識グラフ内の関係又はエンティティの存在に基づく説明を提供する。
【0006】
特徴の集合を提供することは、知識グラフ内のエンティティに割り当てられた出行する関係又は入来する関係の数を示すための量に関する情報を提供することを含み得る。これらの特徴は、関係についての統計に基づく説明を提供する。
【0007】
特徴の集合を決定することは、知識グラフ内のエンティティと、知識グラフの別のエンティティとの間の関係の非存在に関する情報、及び/又は、知識グラフ内でエンティティとの間の関係を有する、知識グラフの別のエンティティの非存在に関する情報、及び/又は、エンティティの所定の近傍にある知識グラフ内の別のエンティティ又は関係の不在に関する情報を含むための少なくとも1つの特徴を決定することを含み得る。これらの特徴は、知識グラフ内の関係又はエンティティの非存在又は不在に基づく説明を提供する。
【0008】
知識グラフは、ラベルを備えた関係を含むことができ、特徴の集合を提供することは、関係のラベルを示すための、関係又はエンティティ又は別のエンティティに関する情報を決定することを含む。この特徴は、ラベルに基づく説明を提供する。
【0009】
特徴の集合を提供することは、エンティティを自身の始点若しくは終点として有する少なくとも1つの経路、特に所与の長さの少なくとも1つの経路を示す特徴、又は、エンティティを自身の始点若しくは終点として有する少なくとも1つの経路、特に所与の長さの経路が存在しないことを示す特徴を提供することを含み得る。この特徴は、1つ又は複数の経路に基づく説明を提供する。
【0010】
本方法は、モデルを用いて特徴の集合のうちの複数の特徴にそれぞれのスコアを割り当てることと、複数の特徴に割り当てられたスコアの平均を決定することと、特徴に割り当てられたスコアと平均との間の比較の結果に依存して、特徴の集合から特徴を選択することとを含み得る。したがって、説明は、最も関連する特徴に基づいている。説明は、閾値よりも大きいスコアを有する特徴に基づくことができる。
【0011】
エンティティは、技術的システムにおけるイベントを表すことができ、知識グラフは、エンティティを、知識グラフのうちのイベントのカテゴリを表すエンティティに関連付け、知識グラフは、カテゴリを表すエンティティを、技術的システム又は別の技術的システムにおける異なるイベントを表す少なくとも1つの他のエンティティに関連付け、本方法は、技術的システムにおいて発生したイベントを検出すること、技術的システムを起動させること、又は、特徴と、少なくとも1つの他のエンティティに割り当てられた所定の特徴との間の比較に依存して、技術的システムの故障を自動的に検出することを含む。これにより、技術的システムは、説明可能な方式により自動的に動作させられる。
【0012】
知識グラフのエンティティのエンコーディングを決定するための装置は、少なくとも1つのプロセッサと、少なくとも1つのメモリと、を備え、少なくとも1つのメモリは、少なくとも1つのプロセッサによって実行可能であって、かつ、少なくとも1つのプロセッサによって実行された場合に、本方法を本装置に実施させるための命令を格納している。
【0013】
コンピュータプログラムは、コンピュータによって実行可能であって、かつ、コンピュータによって実行された場合に、本方法をコンピュータに実施させるための命令を含む。
【0014】
以下の説明及び図面から、本発明のさらなる実施形態を導き出すことができる。
【図面の簡単な説明】
【0015】
【
図1】技術的システムを動作させるための装置を概略的に示す図である。
【
図2】例示的な知識グラフを概略的に示す図である。
【
図3】例示的な知識グラフの断片を概略的に示す図である。
【
図4】断片のエンティティについての例示的な特徴ベクトルを概略的に示す図である。
【
図5】例示的な知識グラフのエンティティについての例示的な特徴ベクトルを概略的に示す図である。
【
図6】例示的な知識グラフのエンティティの数値表現を概略的に示す図である。
【
図7】例示的な知識グラフのエンティティのエンコーディングを概略的に示す図である。
【発明を実施するための形態】
【0016】
【0017】
装置100は、少なくとも1つのプロセッサ102と、少なくとも1つのメモリ104と、を備えている。少なくとも1つのメモリ104は、少なくとも1つのプロセッサ102によって実行可能な命令であって、かつ、少なくとも1つのプロセッサ102によって実行された場合に、本方法を装置100に実施させるための命令を格納している。
【0018】
装置100は、技術的システム106を動作させるように構成されるものとしてよい。
【0019】
技術的システム106は、現実世界における物理的システムである。技術的システム106は、ロボットであるものとしてよい。技術的システム106は、製造機械、車両、家電製品、電動工具、パーソナルアシストシステム、又は、エントランス制御システムであるものとしてよい。
【0020】
技術的システム106においてイベントが発生する可能性がある。イベントは、技術的システム106の内部機械状態の変化であるものとしてもよいし、又は、技術的システム106の環境の変化であるものとしてもよい。
【0021】
技術的システム106は、イベントを検出するためのセンサ又はコントローラを含み得る。装置100は、イベントを検出するためのセンサを含み得る。
【0022】
装置100は、知識グラフGのエンティティEのエンコーディング
【数1】
を決定するように構成されている。
【0023】
知識グラフGは、イベントを表すエンティティと、イベントのカテゴリを表すエンティティとを含み得る。知識グラフGは、イベントを表すエンティティと、カテゴリを表すエンティティとの間の関係を示す関係を含み得る。エンティティEは、知識グラフGのノードによって表される。知識グラフGは、エッジを含む。2つのエンティティの間の関係は、エッジによって表され、このエッジは、関係に関連付けられ、2つのエンティティを表す2つのノードを接続している。
【0024】
エンコーディング
【数2】
は、n個のエンティティE=e
1,・・・,e
nについてのp個の特徴F={f
1,・・・,f
p}と、これらのエンティティEの数値表現
【数3】
とに依存して決定される。数値表現
【数4】
は、例えば知識グラフGの所定の知識グラフ埋め込みである。数値表現は、知識グラフ埋め込みモデル
【数5】
であり、ここで、dは、埋め込みの次元である。
【0025】
特徴Fは、知識グラフG内のエンティティEに割り当てられた、m個の関係R={r1,・・・,rm}に関する情報をエンコードする。
【0026】
知識グラフGは、例えば、<主語、述語、目的語>の3つ組の集合として、又は、論理形式の述語(主語、目的語)において、エンコードされた事実情報を表す。
【0027】
知識グラフGは、例えば、100超、1000超、10000超又は100000超のエンティティを含む。
【0028】
知識グラフGは、例えば、100超、1000超、10000超又は100000超の関係を含む。
【0029】
知識グラフ埋め込みモデル
【数6】
を、リンク予測又はエンティティ分類のために構成された深層学習法によって評価することができる。
【0030】
所与のエンティティeiに割り当てられる特徴は、例えばそのエンティティeiに割り当てられる特徴ベクトルviによって表される。
【0031】
エンティティEのエンコーディング
【数7】
は、エンティティEのエンコーディング
【数8】
を、これらのエンティティEの数値表現
【数9】
に射影するような関数Wが存在するように、特徴Fに依存して決定される。特徴F又は特徴ベクトルv
iを、エンコーディング
【数10】
と共に決定することができる。
【0032】
関数Wは、例えば、この関数Wの予測に対するこの関数Wの入力のそれぞれの部分の重要性についての洞察を提供することができる回帰モデルである。関数Wは、この関数Wの入力として、例えば知識グラフのエンティティEと、関係Rと、エッジとから構築される特徴Fのベクトルを受け取り、この入力から、特定の知識グラフノード埋め込みを再生することを学習する。知識グラフノード埋め込みは、解釈される知識グラフ埋め込みモデル
【数11】
に属する。
【0033】
図2は、n=11個のエンティティとm=5個の関係とを備えた例示的な知識グラフ200を概略的に示している。
【0034】
知識グラフ200は、例えば第1の製造業者を表す第1のエンティティ202と、例えば第2の製造業者を表す第2のエンティティ204と、例えば第3の製造業者を表す第3のエンティティ206と、例えば第4の製造業者を表す第4のエンティティ208と、例えば第1の個人を表す第5のエンティティ210と、例えば第2の個人を表す第6のエンティティ212と、例えば第1の国を表す第7のエンティティ214と、例えば第2の国を表す第8のエンティティ216と、例えば第1の製品を表す第9のエンティティ218と、例えば第2の製品を表す第10のエンティティ220と、例えば第3の製品を表す第11のエンティティ222とを含む。
【0035】
知識グラフ200は、例えば“produces(製造する)”である第1の有向の関係224と、例えば“competitorOf(~の競合他社)”である第2の有向の関係226と、例えば“workAt(~で働く)”である第3の有向の関係228と、例えば“livesIn(~に住んでいる)”である第4の有向の関係230と、例えば“exportedTo(~に輸出される)”である第5の有向の関係232とを含む。
【0036】
第1のエンティティ202と第9のエンティティ218とは、第1の有向の関係224によって接続されている。第2のエンティティ204と第9のエンティティ218とは、第1の有向の関係224によって接続されている。
【0037】
第4のエンティティ208と第2のエンティティ204とは、第2の有向の関係224によって接続されている。第3のエンティティ206と第10のエンティティ220とは、第1の有向の関係224によって接続されている。第4のエンティティ208と第11のエンティティ222とは、第1の有向の関係224によって接続されている。
【0038】
第2のエンティティ204と第3のエンティティ206とは、第2の有向の関係226によって接続されている。
【0039】
第5のエンティティ210と第3のエンティティ206とは、第3の有向の関係226によって接続されている。第5のエンティティ210と第8のエンティティ216とは、第4の有向の関係230によって接続されている。
【0040】
第6のエンティティ212と第4のエンティティ208とは、第3の有向の関係226によって接続されている。第6のエンティティ212と第7のエンティティ214とは、第4の有向の関係230によって接続されている。
【0041】
第11のエンティティ222と第7のエンティティ214とは、第5の有向の関係232によって接続されている。第10のエンティティ220と第8のエンティティ216とは、第5の有向の関係232によって接続されている。
【0042】
図3は、例示的な知識グラフ200の断片300を概略的に示している。
【0043】
図4は、断片300の第3のエンティティ206についての例示的な特徴ベクトル400を概略的に示している。
【0044】
特徴ベクトル400は、p=19個の特徴F={f1,・・・,f19}をコード化する。本例によれば、知識グラフ200に従って、1は、TRUEである特徴をコード化し、0は、FALSEである特徴をコード化する。本例によれば、知識グラフ200に従って、Rは、ラベルを備えた、出行する方向の関係をコード化し、R-は、ラベルを備えた、入来する方向の関係をコード化する。
【0045】
図5は、例示的な知識グラフ200のエンティティについて、特徴F={f
1,・・・,f
19}を含む例示的な特徴ベクトル500を概略的に示している。特徴ベクトルにおいて、黒色に塗りつぶされた円は、1すなわちTRUEをコード化し、白色に塗りつぶされた円は、0すなわちFALSEをコード化する。
【0046】
図6は、知識グラフ200の埋め込み600を概略的に示している。埋め込み600は、埋め込みの次元d=7を備えた、例示的な知識グラフ200のエンティティE=e
1,・・・,e
11の数値表現
【数12】
を含む。
【0047】
図7は、例示的な知識グラフ200のエンティティのエンコーディング700、すなわち、エンコーディング
【数13】
を概略的に示している。
【0048】
図8は、エンティティEのエンコーディング
【数14】
を決定するための方法のフローチャートを示している。
【0049】
本方法は、ステップ802を含む。
【0050】
ステップ802は、知識グラフGを提供することを含む。
【0051】
知識グラフGは、エンティティE={e1,・・・,en}と、m個の関係R={r1,・・・,rm}とを含む。知識グラフGは、ラベルを備えた関係を含み得る。
【0052】
本方法は、知識グラフG内のデータを圧縮するために、埋め込みに基づくエンティティ表現を使用することができる。
【0053】
例えば、知識グラフ200には、エンティティ202,・・・,222と、有向の関係224,・・・,232とが提供される。
【0054】
本方法は、ステップ804を含む。
【0055】
ステップ804は、知識グラフ埋め込みモデル
【数15】
を提供することを含む。
【0056】
知識グラフ埋め込みモデル
【数16】
は、エンティティEを、これらのエンティティEの数値表現
【数17】
に射影するように構成されている。
【0057】
例えば、11個のエンティティ202,・・・,222に対して、エンティティe
1,・・・,e
11についての数値表現
【数18】
が決定される。
【0058】
一例によれば、知識グラフ埋め込みモデル
【数19】
は、エンティティEのうちの1つのエンティティe∈Eを、このエンティティeの数値表現
【数20】
に射影するように構成されている。
【0059】
本方法は、ステップ806を含む。
【0060】
ステップ806は、知識グラフG内の所与のエンティティの近傍に関する所与のエンティティ情報についてエンコードする、エンティティEについての特徴Fを提供することを含む。エンティティeの近傍は、本例においては、このエンティティeが有する関係によって特徴付けられ、及び/又は、このエンティティeとの間の関係r∈Rを有する、知識グラフG内のエンティティによって特徴付けられる。近傍は、知識グラフG内でこのエンティティeとの間の関係rを有する単一のエンティティe’を含み得る。複数の特徴のうちの少なくとも1つの特徴は、知識グラフ内のエンティティと、知識グラフの別のエンティティとの間の関係の存在又は非存在に関する情報を含み得る。
【0061】
複数の特徴のうちの少なくとも1つの特徴は、知識グラフ内でエンティティとの間の関係を有する、知識グラフの別のエンティティの存在又は非存在に関する情報を含み得る。
【0062】
複数の特徴のうちの少なくとも1つの特徴は、知識グラフ内でエンティティの所定の近傍にある別のエンティティ又は関係の存在又は不在に関する情報を含み得る。
【0063】
本方法は、特徴を生成することを含み得る。
【0064】
本方法は、知識グラフG内のデータを圧縮するために、特徴ベクトルに基づくエンティティ表現を使用することができる。
【0065】
本方法は、エンティティEについての特徴の集合を構築し、その際、特定のエンティティeについての特徴は、知識グラフG内の、この特定のエンティティeの近傍に基づいている。特徴の初期集合は、手動により構築されるものとしてもよいし、又は、例えば、ルール学習を使用して自動的に計算されるものとしてもよい。
【0066】
一例においては、エンティティに対して解釈可能な特徴ベクトル表現が決定され、こうした解釈可能な特徴ベクトル表現は、場合によっては知識グラフ埋め込みモデル
【数21】
にとって意義があるだろう。
【0067】
一例によれば、複数のエンティティEのうちの1つのエンティティe∈Eについての、複数の特徴Fのうちの1つの特徴f∈Fが、複数の関係Rのうちの、このエンティティeに割り当てられた1つの関係r∈Rに依存して決定される。
【0068】
一例によれば、あるエンティティが、所与の関係に参加しているか否かを示す特徴が提供される。
【0069】
関係rに対して特徴∃rを設けることができ、この特徴∃rは、1つのエンティティについて、このエンティティが、あるエンティティとの間に出行する関係(outgoing relation)を有することを記述する。関係rに対して特徴∃r-を設けることができ、この特徴∃r-は、1つのエンティティについて、このエンティティが、あるエンティティとの間に入来する関係(incoming relation)を有することを記述する。
【0070】
一例によれば、少なくとも1つのエンティティが、所与のラベルを備えた関係を介してあるエンティティに接続されていることを示す特徴、又は、所与のラベルを備えた関係を介した接続が存在しないことを示す特徴が提供される。例えば、∃R{e’}は、1つのエンティティについて、このエンティティが、あるエンティティe’への、ラベルを備えた出行する関係を有することを記述する。例えば、∃R-{e’}は、1つのエンティティについて、このエンティティが、あるエンティティe’からの、ラベルを備えた入来する関係を有することを記述する。
【0071】
例示的な知識グラフ200内の第2のエンティティ204の場合には、こうした特徴は、∃R{220},∃R-{204}である。
【0072】
一例によれば、あるエンティティが、所与の関係を介してあるエンティティに接続されているか否かを示す特徴が提供される。例えば、∃r.{e’}は、1つのエンティティについて、このエンティティが、あるエンティティe’との間に出行する関係を有することを記述する。例えば、∃r-.{e’}は、あるエンティティに関して、このエンティティが、あるエンティティe’との間に入来する関係を有することを記述する。
【0073】
例示的な知識グラフ200内の第2のエンティティ204の場合には、こうした特徴は、∃224.{220},∃226-.{204}である。
【0074】
一例によれば、所与のエンティティを自身の始点又は終点として有する経路、特に所与の長さkの経路を示す特徴が提供される。
【0075】
例示的な知識グラフ200内の第3のエンティティ206の場合であって、かつ、k=2の場合には、第3のエンティティ206についての1つの経路特徴は、∃224.∃232である。
【0076】
一例によれば、所与のエンティティを自身の始点又は終点として有する経路、特に所与の長さkの経路が、知識グラフ内に存在しないことを示す特徴が提供される。
【0077】
一例によれば、エンティティに対する出行する関係又は入来する関係の量を示す特徴が提供される。
【0078】
例えば、コンストラクタのために=k.Rという表記を使用することができる:
【数22】
【0079】
例えば、コンストラクタのために=k.R
-という表記を使用することができる:
【数23】
【0080】
例えば、例示的な知識グラフ200内の第3のエンティティ206の場合には、こうした特徴は、=1.R及び=1.R-である。なぜなら、第3のエンティティ206に対する1つの出行する関係と、1つの入来する関係とが存在するからである。
【0081】
p個の特徴を、集合F={f
1,・・・,f
p}の中に含めることができる。エンティティに対して解釈可能なブールベクトルを決定することができ、その際、1つの解釈可能なブールベクトル
【数24】
が、1つのエンティティに対して決定され、かつ、
|fv
e|=|F|であり、かつ、知識グラフG内のエンティティeに対してf
iが保持される場合には
【数25】
であるように、そうでない場合には
【数26】
であるように、決定される。
【0082】
例示的な特徴ベクトル400は、第3のエンティティ206についてのp=19個の特徴を含む。
【0083】
本方法は、ステップ808を含む。
【0084】
ステップ808は、特徴の集合からの1つの特徴をエンティティに提供することを含む。
【0085】
特徴の集合からの1つの特徴が、知識グラフのエンティティに提供され、この特徴は、モデルを用いて当該特徴に割り当てられたスコアに依存して選択される。特徴の集合からの、各自のそれぞれのスコアに依存して選択された複数の特徴を、エンティティに提供することができる。
【0086】
モデルは、特徴の集合を、エンティティの埋め込みについての予測に射影し、予測と埋め込みとの間の差に依存してスコアを決定するように構成されている。
【0087】
本方法は、知識グラフ埋め込み又は知識グラフ埋め込みモデルを解釈するために、1つ又は複数のそれぞれの特徴を、知識グラフの複数のエンティティに提供することを含み得る。
【0088】
モデルは、本例においては、エンティティEのエンコーディング
【数27】
を、これらのエンティティEの数値表現
【数28】
に射影するような関数Wが存在するように、エンティティEのエンコーディング
【数29】
を、特徴Fに依存して決定するように構成されている。
【0089】
モデルは、特徴の集合に依存して埋め込みについての予測を決定するように構成されたランダムフォレスト回帰モデルであるものとしてよい。
【0090】
本方法は、エンティティ埋め込み、すなわち、数値表現
【数30】
を、特徴ベクトルに基づくエンティティ表現から、すなわち、エンコーディング
【数31】
から再構築するというタスクに対して、ランダムフォレスト回帰モデルを訓練することを使用することができる。
【0091】
一例によれば、エンティティeのエンコーディング
【数32】
を、このエンティティeの数値表現
【数33】
に射影するような関数Wが存在するように、エンティティEのエンコーディング
【数34】
が、特徴Fに依存して決定される。
【0092】
エンティティEのエンコーディング
【数35】
を、複数の特徴Fから選択された特徴に依存して決定することができる。
【0093】
本方法は、取得された特徴Fから、エンティティ埋め込み
【数36】
に格納された情報を捕捉している特徴を選択することができる。
【0094】
本方法は、特徴を選択するために、埋め込まれた特徴を選択する技術を使用することができる。例えば、解釈可能な特徴の部分集合が選択され、この部分集合については、ランダムフォレスト回帰モデルが、それぞれのタスクに対して最高の精度を達成している。
【0095】
特徴Fを、エンコーディング
【数37】
に対する、これらの特徴Fの重要性に依存して選択することができる。本例におけるスコアは、関連性を示す。
【0096】
一例によれば、特徴Fを、エンティティEの数値表現
【数38】
に射影するためのモデルMが提供される。
【0097】
モデルMは、複数の特徴Fのうちの1つの特徴f∈Fの、射影に対する重要性を示すスコアを出力するように構成されている。
【0098】
スコアは、例えば射影の誤差に依存して、例えばモデルMを用いた特徴Fの射影と、エンティティEの数値表現
【数39】
との間の二乗誤差に依存して決定される。
【0099】
このことはつまり、エンティティEのエンコーディング
【数40】
を、特徴Fに依存して決定することができるということを意味する。
【0100】
例えば、特徴fに対するスコアが閾値を超えている場合には、この特徴fに依存して、エンティティEのエンコーディング
【数41】
が決定される。そうでない場合には、特徴fに依存することなく、エンティティEのエンコーディング
【数42】
が決定される。
【0101】
例えば、複数の特徴に対してスコアが決定される。閾値は、例えば複数の特徴に対して決定されたスコアの平均である。
【0102】
このことはつまり、本方法が、モデルを用いて特徴の集合のうちの複数の特徴にそれぞれのスコアを割り当てることを含むことができるということを意味する。
【0103】
このことはつまり、本方法が、複数の特徴に割り当てられたスコアの平均を決定することを含むことができるということを意味する。
【0104】
このことはつまり、本方法が、特徴に割り当てられたスコアと平均との間の比較の結果に依存して、特徴の集合から特徴を選択することを含むことができるということを意味する。
【0105】
知識グラフ埋め込みモデル
【数43】
は、徹底的なモデル分析及びデバッグ目的のために役立つ解釈可能なモデルである。
【0106】
本方法は、ステップ810を含み得る。
【0107】
ステップ810においては、技術的システム106が動作させられる。
【0108】
一例によれば、知識グラフは、技術的システム106におけるイベントを表す第1のエンティティと、技術的システム106又は異なる技術的システムにおける異なるイベントを表す第2のエンティティとを含む。知識グラフは、例えば知識グラフのうちの第1のエンティティを表すノードを、知識グラフのうちの別のノードに接続しているエッジを含み、この別のノードは、知識グラフのうちのイベントのカテゴリを表すエンティティを表す。知識グラフは、例えば第2のエンティティを、カテゴリを表すエンティティに関連付ける。第1のエンティティには、第1の特徴又は第1の特徴ベクトルが提供される。第2のエンティティには、第2の特徴又は第2の特徴ベクトルが提供される。
【0109】
ステップ810は、技術的システム106において発生したイベントを検出することを含み得る。
【0110】
ステップ810は、技術的システム106を起動させること、又は、特徴と、少なくとも1つの他のエンティティに割り当てられた所定の特徴との間の比較に依存して、技術的システム106の故障を自動的に検出することを含み得る。
【0111】
第1のエンティティと第2のエンティティとが1つの特定のカテゴリに分類されると、本方法は、これらのエンティティに提供されている1つ又は複数の共通の特徴を、自動的に識別することができる。
【0112】
1つ又は複数の共通の特徴は、それぞれの分類結果についての可能性のある説明を提供する。
【0113】
如何なる共通の特徴も存在しないということは、イベントのうちの1つがそのカテゴリに誤って割り当てられているということを示すことができる。少なくとも1つの共通の特徴が存在するということは、イベントがそのカテゴリに正しく割り当てられているということを示すことができる。共通の特徴は、技術的システム106又は技術的システム106の動作のうちのどの部分によってイベントが引き起こされたかを示す説明を提供することができる。
【0114】
1つ又は複数の共通の特徴が、それぞれの分類結果についての可能性のある説明を提供する場合には、知識グラフ内で、あるカテゴリに割り当てられたイベントが検出されると、そのカテゴリによって提示されるアクションに従って、技術的システム106を起動させることができる。
【0115】
1つ又は複数の共通の特徴が、それぞれの分類結果についての可能性のある説明を提供する場合には、知識グラフ内で、故障を示すカテゴリに割り当てられたイベントが検出されると、技術的システム106を停止させることができる。
【0116】
例えば製造ドメインにおける、本方法についての使用事例は、故障イベントを特定のカテゴリ(例えば、高リスク、低リスク)に分類することを含む。
【0117】
故障イベントの予測は、エンコーディング
【数44】
によって決定される。故障イベントの一般的な分析とは別に、すなわち、高リスクのカテゴリ又は低リスクのカテゴリの一方への分類とは別に、エンコーディング
【数45】
は、それぞれの予測についての説明を以下のようにして生成する。
【0118】
故障イベントを表す所与のエンティティe
iが、知識グラフ埋め込みモデル
【数46】
に依拠して、高リスク又は低リスクのいずれかを表す特定のクラスcに分類されると、e
iの特徴ベクトルv
iが、本方法を用いて生成され、そのクラスcに所属することが既知であるエンティティの特徴ベクトルと比較される。それぞれの特徴ベクトルに基づいて、e
iがそのクラスcの他のエンティティと共有する特徴f
jが、すなわち、これらの特徴が、それぞれの分類結果についての可能性のある説明に相当する。
【外国語明細書】