特開2024-167902 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ローベルト　ボツシユ　ゲゼルシヤフト　ミツト　ベシユレンクテル　ハフツングの特許一覧

特開2024-167902機械学習のための装置及びコンピュータ実装された方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024167902

(43)【公開日】2024-12-04

(54)【発明の名称】機械学習のための装置及びコンピュータ実装された方法

(51)【国際特許分類】

G06N 5/022 20230101AFI20241127BHJP

G06N 20/00 20190101ALI20241127BHJP

G06F 16/901 20190101ALI20241127BHJP

【ＦＩ】

G06N5/022

G06N20/00

G06F16/901

【審査請求】未請求

【請求項の数】11

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2024082383

(22)【出願日】2024-05-21

(31)【優先権主張番号】10 2023 204 758.6

(32)【優先日】2023-05-22

(33)【優先権主張国・地域又は機関】DE

(71)【出願人】

【識別番号】390023711

【氏名又は名称】ローベルトボツシユゲゼルシヤフトミツトベシユレンクテルハフツング

【氏名又は名称原語表記】ＲＯＢＥＲＴＢＯＳＣＨＧＭＢＨ

【住所又は居所原語表記】Ｓｔｕｔｔｇａｒｔ，Ｇｅｒｍａｎｙ

(74)【代理人】

【識別番号】100114890

【弁理士】

【氏名又は名称】アインゼル・フェリックス＝ラインハルト

(74)【代理人】

【識別番号】100098501

【弁理士】

【氏名又は名称】森田拓

(74)【代理人】

【識別番号】100116403

【弁理士】

【氏名又は名称】前川純一

(74)【代理人】

【識別番号】100134315

【弁理士】

【氏名又は名称】永島秀郎

(74)【代理人】

【識別番号】100162880

【弁理士】

【氏名又は名称】上島類

(72)【発明者】

【氏名】ヨウムナサラーマフムードイスマイール

(72)【発明者】

【氏名】ダリアステパノワ

(72)【発明者】

【氏名】チュンキエンチャン

【テーマコード（参考）】

5B175

【Ｆターム（参考）】

5B175FA01

5B175KA12

(57)【要約】

【課題】機械学習のための装置及びコンピュータ実装された方法に関する。
【解決手段】本方法は、知識グラフのエンティティの埋め込みを提供すること（８０４）と、知識グラフに依存して、エンティティについての特徴の集合を決定すること（８０６）と、特徴の集合からの１つの特徴をエンティティに提供すること（８０８）であって、特徴は、モデルを用いて当該特徴に割り当てられたスコアに依存して選択される、こと（８０８）とを含み、モデルは、特徴の集合を、エンティティの埋め込みについての予測に射影し、予測と埋め込みとの間の差に依存してスコアを決定するように構成されている。
【選択図】図８

【特許請求の範囲】

【請求項1】

機械学習のためのコンピュータ実装された方法であって、
前記方法は、
知識グラフ（２００）のエンティティの埋め込みを提供すること（８０４）と、
前記知識グラフ（２００）に依存して、前記エンティティについての特徴の集合を決定すること（８０６）と、
前記特徴の集合からの１つの特徴を前記エンティティに提供すること（８０８）であって、前記特徴は、モデルを用いて当該特徴に割り当てられたスコアに依存して選択される、こと（８０８）と、
を含み、
前記モデルは、前記特徴の集合を、前記エンティティの埋め込みについての予測に射影し、前記予測と前記埋め込みとの間の差に依存して前記スコアを決定するように構成されている、
ことを特徴とする方法。

【請求項2】

前記特徴の集合を決定すること（８０６）は、前記知識グラフ（２００）の少なくとも１つの関係又は少なくとも１つのエンティティに依存して少なくとも１つの特徴を決定することを含む、
請求項１に記載の方法。

【請求項3】

前記特徴の集合を決定すること（８０６）は、
前記知識グラフ（２００）内で前記エンティティが、前記知識グラフ（２００）の別のエンティティとの間で有する関係に関する情報、及び／又は、
前記知識グラフ（２００）内で前記エンティティとの間の関係を有する、前記知識グラフ（２００）の別のエンティティに関する情報、及び／又は、
前記知識グラフ（２００）内で前記エンティティの所定の近傍に存在する別のエンティティ又は関係に関する情報、及び／又は、
前記エンティティが、前記知識グラフ（２００）の別のエンティティに対して若しくは前記知識グラフ（２００）内の他の複数のエンティティに対して有する関係の量に関する情報、及び／又は、
前記知識グラフ内で前記エンティティの所定の近傍に存在する関係又はエンティティの量に関する情報
を含むための少なくとも１つの特徴を決定することを含む、
請求項１又は２に記載の方法。

【請求項4】

前記特徴の集合を提供すること（８０６）は、前記知識グラフ（２００）内の前記エンティティに割り当てられた出行する関係又は入来する関係の数を示すための量に関する情報を提供することを含む、
請求項３に記載の方法。

【請求項5】

前記特徴の集合を決定すること（８０６）は、
前記知識グラフ（２００）内の前記エンティティと前記知識グラフ（２００）の別のエンティティとの間の関係の非存在に関する情報、及び／又は、
前記知識グラフ（２００）内で前記エンティティとの間の関係を有する、前記知識グラフの別のエンティティの非存在に関する情報、及び／又は、
前記エンティティの所定の近傍にある前記知識グラフ（２００）内の別のエンティティ若しくは関係の不在に関する情報
を含むための少なくとも１つの特徴を決定することを含む、
請求項１乃至４のいずれか一項に記載の方法。

【請求項6】

前記知識グラフ（２００）は、ラベルを備えた関係を含み、
前記特徴の集合を提供すること（８０６）は、前記関係のラベルを示すための、前記関係又は前記エンティティ又は前記別のエンティティに関する情報を決定することを含む、
請求項１乃至５のいずれか一項に記載の方法。

【請求項7】

前記特徴の集合を提供すること（８０６）は、
前記エンティティを自身の始点若しくは終点として有する少なくとも１つの経路、特に所与の長さの少なくとも１つの経路を示す特徴、又は、
前記エンティティを自身の始点若しくは終点として有する少なくとも１つの経路、特に所与の長さの経路が存在しないことを示す特徴
を提供することを含む、
請求項１乃至６のいずれか一項に記載の方法。

【請求項8】

前記方法は、
前記モデルを用いて前記特徴の集合のうちの複数の特徴にそれぞれのスコアを割り当てることと、
前記複数の特徴に割り当てられたスコアの平均を決定することと、
前記特徴に割り当てられたスコアと前記平均との間の比較の結果に依存して、前記特徴の集合から前記特徴を選択することと、
を含む、
請求項１乃至７のいずれか一項に記載の方法。

【請求項9】

前記エンティティは、技術的システム（１０６）におけるイベントを表し、
前記知識グラフ（２００）は、前記エンティティを、前記知識グラフ（２００）のうちの前記イベントのカテゴリを表すエンティティに関連付け、
前記知識グラフ（２００）は、前記カテゴリを表すエンティティを、前記技術的システム（１０６）又は別の技術的システムにおける異なるイベントを表す少なくとも１つの他のエンティティに関連付け、
前記方法は、
前記技術的システム（１０６）において発生したイベントを検出すること、
前記技術的システム（１０６）を起動させること、又は、
前記特徴と、前記少なくとも１つの他のエンティティに割り当てられた所定の特徴との間の比較に依存して、前記技術的システム（１０６）の故障を自動的に検出すること
を含む、
請求項１乃至８のいずれか一項に記載の方法。

【請求項10】

機械学習のための装置（１００）であって、
前記装置（１００）は、
少なくとも１つのプロセッサ（１０２）と、
少なくとも１つのメモリ（１０４）と、
を備え、
前記少なくとも１つのメモリ（１０４）は、前記少なくとも１つのプロセッサ（１０２）によって実行可能であって、かつ、前記少なくとも１つのプロセッサ（１０２）によって実行された場合に、請求項１乃至９のいずれか一項に記載の方法を前記装置に実施させるための命令を格納している、
ことを特徴とする装置（１００）。

【請求項11】

コンピュータプログラムであって、
前記コンピュータプログラムは、コンピュータによって実行可能であって、かつ、前記コンピュータによって実行された場合に、請求項１乃至９のいずれか一項に記載の方法を前記コンピュータに実施させるための命令を含む
ことを特徴とするコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

背景
本発明は、機械学習のための装置及びコンピュータ実装された方法に関する。

【背景技術】

【0002】

発明の開示
機械学習のためのコンピュータ実装された方法及び装置は、知識グラフ埋め込み又は知識グラフ埋め込みモデルのためのモデル説明を生成し、すなわち、特に特定の所定のタスクに対して元々のエンティティ埋め込みと同様に機能する、エンティティの解釈可能な表現を生成する。

【発明の概要】

【課題を解決するための手段】

【0003】

コンピュータ実装された方法である本方法は、知識グラフのエンティティの埋め込みを提供することと、知識グラフに依存して、エンティティについての特徴の集合を決定することと、特徴の集合からの１つの特徴をエンティティに提供することであって、特徴は、モデルを用いて当該特徴に割り当てられたスコアに依存して選択される、こととを含み、モデルは、特徴の集合を、エンティティの埋め込みについての予測に射影し、予測と埋め込みとの間の差に依存してスコアを決定するように構成されている。任意の所与のモデルによって事前に計算された知識グラフと、知識グラフのエンティティの埋め込みとが与えられると、本方法は、それぞれの埋め込みに近似する、エンティティについての解釈可能な特徴を生成する。解釈可能な特徴は、例えばブール特徴ベクトルを含む。取得された特徴ベクトルは、エンティティの近傍から抽出された情報をエンコードする。

【0004】

特徴の集合を決定することは、知識グラフの少なくとも１つの関係又は少なくとも１つのエンティティに依存して少なくとも１つの特徴を決定することを含み得る。この特徴は、関係又はエンティティに基づく説明を提供する。

【0005】

特徴の集合を決定することは、知識グラフ内でエンティティが、知識グラフの別のエンティティとの間で有する関係に関する情報、及び／又は、知識グラフ内でエンティティとの間の関係を有する、知識グラフの別のエンティティに関する情報、及び／又は、知識グラフ内でエンティティの所定の近傍に存在する別のエンティティ若しくは関係に関する情報、及び／又は、エンティティが、知識グラフの別のエンティティに対して若しくは知識グラフ内の他の複数のエンティティに対して有する関係の量に関する情報、及び／又は、知識グラフ内でエンティティの所定の近傍に存在する関係若しくはエンティティの量に関する情報を含むための少なくとも１つの特徴を決定することを含み得る。これらの特徴は、知識グラフ内の関係又はエンティティの存在に基づく説明を提供する。

【0006】

特徴の集合を提供することは、知識グラフ内のエンティティに割り当てられた出行する関係又は入来する関係の数を示すための量に関する情報を提供することを含み得る。これらの特徴は、関係についての統計に基づく説明を提供する。

【0007】

特徴の集合を決定することは、知識グラフ内のエンティティと、知識グラフの別のエンティティとの間の関係の非存在に関する情報、及び／又は、知識グラフ内でエンティティとの間の関係を有する、知識グラフの別のエンティティの非存在に関する情報、及び／又は、エンティティの所定の近傍にある知識グラフ内の別のエンティティ又は関係の不在に関する情報を含むための少なくとも１つの特徴を決定することを含み得る。これらの特徴は、知識グラフ内の関係又はエンティティの非存在又は不在に基づく説明を提供する。

【0008】

知識グラフは、ラベルを備えた関係を含むことができ、特徴の集合を提供することは、関係のラベルを示すための、関係又はエンティティ又は別のエンティティに関する情報を決定することを含む。この特徴は、ラベルに基づく説明を提供する。

【0009】

特徴の集合を提供することは、エンティティを自身の始点若しくは終点として有する少なくとも１つの経路、特に所与の長さの少なくとも１つの経路を示す特徴、又は、エンティティを自身の始点若しくは終点として有する少なくとも１つの経路、特に所与の長さの経路が存在しないことを示す特徴を提供することを含み得る。この特徴は、１つ又は複数の経路に基づく説明を提供する。

【0010】

本方法は、モデルを用いて特徴の集合のうちの複数の特徴にそれぞれのスコアを割り当てることと、複数の特徴に割り当てられたスコアの平均を決定することと、特徴に割り当てられたスコアと平均との間の比較の結果に依存して、特徴の集合から特徴を選択することとを含み得る。したがって、説明は、最も関連する特徴に基づいている。説明は、閾値よりも大きいスコアを有する特徴に基づくことができる。

【0011】

エンティティは、技術的システムにおけるイベントを表すことができ、知識グラフは、エンティティを、知識グラフのうちのイベントのカテゴリを表すエンティティに関連付け、知識グラフは、カテゴリを表すエンティティを、技術的システム又は別の技術的システムにおける異なるイベントを表す少なくとも１つの他のエンティティに関連付け、本方法は、技術的システムにおいて発生したイベントを検出すること、技術的システムを起動させること、又は、特徴と、少なくとも１つの他のエンティティに割り当てられた所定の特徴との間の比較に依存して、技術的システムの故障を自動的に検出することを含む。これにより、技術的システムは、説明可能な方式により自動的に動作させられる。

【0012】

知識グラフのエンティティのエンコーディングを決定するための装置は、少なくとも１つのプロセッサと、少なくとも１つのメモリと、を備え、少なくとも１つのメモリは、少なくとも１つのプロセッサによって実行可能であって、かつ、少なくとも１つのプロセッサによって実行された場合に、本方法を本装置に実施させるための命令を格納している。

【0013】

コンピュータプログラムは、コンピュータによって実行可能であって、かつ、コンピュータによって実行された場合に、本方法をコンピュータに実施させるための命令を含む。

【0014】

以下の説明及び図面から、本発明のさらなる実施形態を導き出すことができる。

【図面の簡単な説明】

【0015】

【図1】技術的システムを動作させるための装置を概略的に示す図である。

【図2】例示的な知識グラフを概略的に示す図である。

【図3】例示的な知識グラフの断片を概略的に示す図である。

【図4】断片のエンティティについての例示的な特徴ベクトルを概略的に示す図である。

【図5】例示的な知識グラフのエンティティについての例示的な特徴ベクトルを概略的に示す図である。

【図6】例示的な知識グラフのエンティティの数値表現を概略的に示す図である。

【図7】例示的な知識グラフのエンティティのエンコーディングを概略的に示す図である。

【図8】方法のフローチャートである。

【発明を実施するための形態】

【0016】

図１は、装置１００を概略的に示している。

【0017】

装置１００は、少なくとも１つのプロセッサ１０２と、少なくとも１つのメモリ１０４と、を備えている。少なくとも１つのメモリ１０４は、少なくとも１つのプロセッサ１０２によって実行可能な命令であって、かつ、少なくとも１つのプロセッサ１０２によって実行された場合に、本方法を装置１００に実施させるための命令を格納している。

【0018】

装置１００は、技術的システム１０６を動作させるように構成されるものとしてよい。

【0019】

技術的システム１０６は、現実世界における物理的システムである。技術的システム１０６は、ロボットであるものとしてよい。技術的システム１０６は、製造機械、車両、家電製品、電動工具、パーソナルアシストシステム、又は、エントランス制御システムであるものとしてよい。

【0020】

技術的システム１０６においてイベントが発生する可能性がある。イベントは、技術的システム１０６の内部機械状態の変化であるものとしてもよいし、又は、技術的システム１０６の環境の変化であるものとしてもよい。

【0021】

技術的システム１０６は、イベントを検出するためのセンサ又はコントローラを含み得る。装置１００は、イベントを検出するためのセンサを含み得る。

【0022】

装置１００は、知識グラフＧのエンティティＥのエンコーディング

【数1】

を決定するように構成されている。

【0023】

知識グラフＧは、イベントを表すエンティティと、イベントのカテゴリを表すエンティティとを含み得る。知識グラフＧは、イベントを表すエンティティと、カテゴリを表すエンティティとの間の関係を示す関係を含み得る。エンティティＥは、知識グラフＧのノードによって表される。知識グラフＧは、エッジを含む。２つのエンティティの間の関係は、エッジによって表され、このエッジは、関係に関連付けられ、２つのエンティティを表す２つのノードを接続している。

【0024】

エンコーディング

【数2】

は、ｎ個のエンティティＥ＝ｅ_１，・・・，ｅ_ｎについてのｐ個の特徴Ｆ＝｛ｆ_１，・・・，ｆ_ｐ｝と、これらのエンティティＥの数値表現

【数3】

とに依存して決定される。数値表現

【数4】

は、例えば知識グラフＧの所定の知識グラフ埋め込みである。数値表現は、知識グラフ埋め込みモデル

【数5】

であり、ここで、ｄは、埋め込みの次元である。

【0025】

特徴Ｆは、知識グラフＧ内のエンティティＥに割り当てられた、ｍ個の関係Ｒ＝｛ｒ_１，・・・，ｒ_ｍ｝に関する情報をエンコードする。

【0026】

知識グラフＧは、例えば、＜主語、述語、目的語＞の３つ組の集合として、又は、論理形式の述語（主語、目的語）において、エンコードされた事実情報を表す。

【0027】

知識グラフＧは、例えば、１００超、１０００超、１００００超又は１０００００超のエンティティを含む。

【0028】

知識グラフＧは、例えば、１００超、１０００超、１００００超又は１０００００超の関係を含む。

【0029】

知識グラフ埋め込みモデル

【数6】

を、リンク予測又はエンティティ分類のために構成された深層学習法によって評価することができる。

【0030】

所与のエンティティｅ_ｉに割り当てられる特徴は、例えばそのエンティティｅ_ｉに割り当てられる特徴ベクトルｖ_ｉによって表される。

【0031】

エンティティＥのエンコーディング

【数7】

は、エンティティＥのエンコーディング

【数8】

を、これらのエンティティＥの数値表現

【数9】

に射影するような関数Ｗが存在するように、特徴Ｆに依存して決定される。特徴Ｆ又は特徴ベクトルｖ_ｉを、エンコーディング

【数10】

と共に決定することができる。

【0032】

関数Ｗは、例えば、この関数Ｗの予測に対するこの関数Ｗの入力のそれぞれの部分の重要性についての洞察を提供することができる回帰モデルである。関数Ｗは、この関数Ｗの入力として、例えば知識グラフのエンティティＥと、関係Ｒと、エッジとから構築される特徴Ｆのベクトルを受け取り、この入力から、特定の知識グラフノード埋め込みを再生することを学習する。知識グラフノード埋め込みは、解釈される知識グラフ埋め込みモデル

【数11】

に属する。

【0033】

図２は、ｎ＝１１個のエンティティとｍ＝５個の関係とを備えた例示的な知識グラフ２００を概略的に示している。

【0034】

知識グラフ２００は、例えば第１の製造業者を表す第１のエンティティ２０２と、例えば第２の製造業者を表す第２のエンティティ２０４と、例えば第３の製造業者を表す第３のエンティティ２０６と、例えば第４の製造業者を表す第４のエンティティ２０８と、例えば第１の個人を表す第５のエンティティ２１０と、例えば第２の個人を表す第６のエンティティ２１２と、例えば第１の国を表す第７のエンティティ２１４と、例えば第２の国を表す第８のエンティティ２１６と、例えば第１の製品を表す第９のエンティティ２１８と、例えば第２の製品を表す第１０のエンティティ２２０と、例えば第３の製品を表す第１１のエンティティ２２２とを含む。

【0035】

知識グラフ２００は、例えば“produces（製造する）”である第１の有向の関係２２４と、例えば“competitorOf（～の競合他社）”である第２の有向の関係２２６と、例えば“workAt（～で働く）”である第３の有向の関係２２８と、例えば“livesIn（～に住んでいる）”である第４の有向の関係２３０と、例えば“exportedTo（～に輸出される）”である第５の有向の関係２３２とを含む。

【0036】

第１のエンティティ２０２と第９のエンティティ２１８とは、第１の有向の関係２２４によって接続されている。第２のエンティティ２０４と第９のエンティティ２１８とは、第１の有向の関係２２４によって接続されている。

【0037】

第４のエンティティ２０８と第２のエンティティ２０４とは、第２の有向の関係２２４によって接続されている。第３のエンティティ２０６と第１０のエンティティ２２０とは、第１の有向の関係２２４によって接続されている。第４のエンティティ２０８と第１１のエンティティ２２２とは、第１の有向の関係２２４によって接続されている。

【0038】

第２のエンティティ２０４と第３のエンティティ２０６とは、第２の有向の関係２２６によって接続されている。

【0039】

第５のエンティティ２１０と第３のエンティティ２０６とは、第３の有向の関係２２６によって接続されている。第５のエンティティ２１０と第８のエンティティ２１６とは、第４の有向の関係２３０によって接続されている。

【0040】

第６のエンティティ２１２と第４のエンティティ２０８とは、第３の有向の関係２２６によって接続されている。第６のエンティティ２１２と第７のエンティティ２１４とは、第４の有向の関係２３０によって接続されている。

【0041】

第１１のエンティティ２２２と第７のエンティティ２１４とは、第５の有向の関係２３２によって接続されている。第１０のエンティティ２２０と第８のエンティティ２１６とは、第５の有向の関係２３２によって接続されている。

【0042】

図３は、例示的な知識グラフ２００の断片３００を概略的に示している。

【0043】

図４は、断片３００の第３のエンティティ２０６についての例示的な特徴ベクトル４００を概略的に示している。

【0044】

特徴ベクトル４００は、ｐ＝１９個の特徴Ｆ＝｛ｆ_１，・・・，ｆ_１９｝をコード化する。本例によれば、知識グラフ２００に従って、１は、ＴＲＵＥである特徴をコード化し、０は、ＦＡＬＳＥである特徴をコード化する。本例によれば、知識グラフ２００に従って、Ｒは、ラベルを備えた、出行する方向の関係をコード化し、Ｒ^－は、ラベルを備えた、入来する方向の関係をコード化する。

【0045】

図５は、例示的な知識グラフ２００のエンティティについて、特徴Ｆ＝｛ｆ_１，・・・，ｆ_１９｝を含む例示的な特徴ベクトル５００を概略的に示している。特徴ベクトルにおいて、黒色に塗りつぶされた円は、１すなわちＴＲＵＥをコード化し、白色に塗りつぶされた円は、０すなわちＦＡＬＳＥをコード化する。

【0046】

図６は、知識グラフ２００の埋め込み６００を概略的に示している。埋め込み６００は、埋め込みの次元ｄ＝７を備えた、例示的な知識グラフ２００のエンティティＥ＝ｅ_１，・・・，ｅ_１１の数値表現

【数12】

を含む。

【0047】

図７は、例示的な知識グラフ２００のエンティティのエンコーディング７００、すなわち、エンコーディング

【数13】

を概略的に示している。

【0048】

図８は、エンティティＥのエンコーディング

【数14】

を決定するための方法のフローチャートを示している。

【0049】

本方法は、ステップ８０２を含む。

【0050】

ステップ８０２は、知識グラフＧを提供することを含む。

【0051】

知識グラフＧは、エンティティＥ＝｛ｅ_１，・・・，ｅ_ｎ｝と、ｍ個の関係Ｒ＝｛ｒ_１，・・・，ｒ_ｍ｝とを含む。知識グラフＧは、ラベルを備えた関係を含み得る。

【0052】

本方法は、知識グラフＧ内のデータを圧縮するために、埋め込みに基づくエンティティ表現を使用することができる。

【0053】

例えば、知識グラフ２００には、エンティティ２０２，・・・，２２２と、有向の関係２２４，・・・，２３２とが提供される。

【0054】

本方法は、ステップ８０４を含む。

【0055】

ステップ８０４は、知識グラフ埋め込みモデル

【数15】

を提供することを含む。

【0056】

知識グラフ埋め込みモデル

【数16】

は、エンティティＥを、これらのエンティティＥの数値表現

【数17】

に射影するように構成されている。

【0057】

例えば、１１個のエンティティ２０２，・・・，２２２に対して、エンティティｅ_１，・・・，ｅ_１１についての数値表現

【数18】

が決定される。

【0058】

一例によれば、知識グラフ埋め込みモデル

【数19】

は、エンティティＥのうちの１つのエンティティｅ∈Ｅを、このエンティティｅの数値表現

【数20】

に射影するように構成されている。

【0059】

本方法は、ステップ８０６を含む。

【0060】

ステップ８０６は、知識グラフＧ内の所与のエンティティの近傍に関する所与のエンティティ情報についてエンコードする、エンティティＥについての特徴Ｆを提供することを含む。エンティティｅの近傍は、本例においては、このエンティティｅが有する関係によって特徴付けられ、及び／又は、このエンティティｅとの間の関係ｒ∈Ｒを有する、知識グラフＧ内のエンティティによって特徴付けられる。近傍は、知識グラフＧ内でこのエンティティｅとの間の関係ｒを有する単一のエンティティｅ’を含み得る。複数の特徴のうちの少なくとも１つの特徴は、知識グラフ内のエンティティと、知識グラフの別のエンティティとの間の関係の存在又は非存在に関する情報を含み得る。

【0061】

複数の特徴のうちの少なくとも１つの特徴は、知識グラフ内でエンティティとの間の関係を有する、知識グラフの別のエンティティの存在又は非存在に関する情報を含み得る。

【0062】

複数の特徴のうちの少なくとも１つの特徴は、知識グラフ内でエンティティの所定の近傍にある別のエンティティ又は関係の存在又は不在に関する情報を含み得る。

【0063】

本方法は、特徴を生成することを含み得る。

【0064】

本方法は、知識グラフＧ内のデータを圧縮するために、特徴ベクトルに基づくエンティティ表現を使用することができる。

【0065】

本方法は、エンティティＥについての特徴の集合を構築し、その際、特定のエンティティｅについての特徴は、知識グラフＧ内の、この特定のエンティティｅの近傍に基づいている。特徴の初期集合は、手動により構築されるものとしてもよいし、又は、例えば、ルール学習を使用して自動的に計算されるものとしてもよい。

【0066】

一例においては、エンティティに対して解釈可能な特徴ベクトル表現が決定され、こうした解釈可能な特徴ベクトル表現は、場合によっては知識グラフ埋め込みモデル

【数21】

にとって意義があるだろう。

【0067】

一例によれば、複数のエンティティＥのうちの１つのエンティティｅ∈Ｅについての、複数の特徴Ｆのうちの１つの特徴ｆ∈Ｆが、複数の関係Ｒのうちの、このエンティティｅに割り当てられた１つの関係ｒ∈Ｒに依存して決定される。

【0068】

一例によれば、あるエンティティが、所与の関係に参加しているか否かを示す特徴が提供される。

【0069】

関係ｒに対して特徴∃ｒを設けることができ、この特徴∃ｒは、１つのエンティティについて、このエンティティが、あるエンティティとの間に出行する関係(outgoing relation)を有することを記述する。関係ｒに対して特徴∃ｒ^－を設けることができ、この特徴∃ｒ^－は、１つのエンティティについて、このエンティティが、あるエンティティとの間に入来する関係（incoming relation）を有することを記述する。

【0070】

一例によれば、少なくとも１つのエンティティが、所与のラベルを備えた関係を介してあるエンティティに接続されていることを示す特徴、又は、所与のラベルを備えた関係を介した接続が存在しないことを示す特徴が提供される。例えば、∃Ｒ｛ｅ’｝は、１つのエンティティについて、このエンティティが、あるエンティティｅ’への、ラベルを備えた出行する関係を有することを記述する。例えば、∃Ｒ^－｛ｅ’｝は、１つのエンティティについて、このエンティティが、あるエンティティｅ’からの、ラベルを備えた入来する関係を有することを記述する。

【0071】

例示的な知識グラフ２００内の第２のエンティティ２０４の場合には、こうした特徴は、∃Ｒ｛２２０｝，∃Ｒ^－｛２０４｝である。

【0072】

一例によれば、あるエンティティが、所与の関係を介してあるエンティティに接続されているか否かを示す特徴が提供される。例えば、∃ｒ．｛ｅ’｝は、１つのエンティティについて、このエンティティが、あるエンティティｅ’との間に出行する関係を有することを記述する。例えば、∃ｒ^－．｛ｅ’｝は、あるエンティティに関して、このエンティティが、あるエンティティｅ’との間に入来する関係を有することを記述する。

【0073】

例示的な知識グラフ２００内の第２のエンティティ２０４の場合には、こうした特徴は、∃２２４．｛２２０｝，∃２２６^－．｛２０４｝である。

【0074】

一例によれば、所与のエンティティを自身の始点又は終点として有する経路、特に所与の長さｋの経路を示す特徴が提供される。

【0075】

例示的な知識グラフ２００内の第３のエンティティ２０６の場合であって、かつ、ｋ＝２の場合には、第３のエンティティ２０６についての１つの経路特徴は、∃２２４．∃２３２である。

【0076】

一例によれば、所与のエンティティを自身の始点又は終点として有する経路、特に所与の長さｋの経路が、知識グラフ内に存在しないことを示す特徴が提供される。

【0077】

一例によれば、エンティティに対する出行する関係又は入来する関係の量を示す特徴が提供される。

【0078】

例えば、コンストラクタのために＝ｋ．Ｒという表記を使用することができる：

【数22】

【0079】

例えば、コンストラクタのために＝ｋ．Ｒ^－という表記を使用することができる：

【数23】

【0080】

例えば、例示的な知識グラフ２００内の第３のエンティティ２０６の場合には、こうした特徴は、＝１．Ｒ及び＝１．Ｒ^－である。なぜなら、第３のエンティティ２０６に対する１つの出行する関係と、１つの入来する関係とが存在するからである。

【0081】

ｐ個の特徴を、集合Ｆ＝｛ｆ_１，・・・，ｆ_ｐ｝の中に含めることができる。エンティティに対して解釈可能なブールベクトルを決定することができ、その際、１つの解釈可能なブールベクトル

【数24】

が、１つのエンティティに対して決定され、かつ、
｜ｆｖ_ｅ｜＝｜Ｆ｜であり、かつ、知識グラフＧ内のエンティティｅに対してｆ_ｉが保持される場合には

【数25】

であるように、そうでない場合には

【数26】

であるように、決定される。

【0082】

例示的な特徴ベクトル４００は、第３のエンティティ２０６についてのｐ＝１９個の特徴を含む。

【0083】

本方法は、ステップ８０８を含む。

【0084】

ステップ８０８は、特徴の集合からの１つの特徴をエンティティに提供することを含む。

【0085】

特徴の集合からの１つの特徴が、知識グラフのエンティティに提供され、この特徴は、モデルを用いて当該特徴に割り当てられたスコアに依存して選択される。特徴の集合からの、各自のそれぞれのスコアに依存して選択された複数の特徴を、エンティティに提供することができる。

【0086】

モデルは、特徴の集合を、エンティティの埋め込みについての予測に射影し、予測と埋め込みとの間の差に依存してスコアを決定するように構成されている。

【0087】

本方法は、知識グラフ埋め込み又は知識グラフ埋め込みモデルを解釈するために、１つ又は複数のそれぞれの特徴を、知識グラフの複数のエンティティに提供することを含み得る。

【0088】

モデルは、本例においては、エンティティＥのエンコーディング

【数27】

を、これらのエンティティＥの数値表現

【数28】

に射影するような関数Ｗが存在するように、エンティティＥのエンコーディング

【数29】

を、特徴Ｆに依存して決定するように構成されている。

【0089】

モデルは、特徴の集合に依存して埋め込みについての予測を決定するように構成されたランダムフォレスト回帰モデルであるものとしてよい。

【0090】

本方法は、エンティティ埋め込み、すなわち、数値表現

【数30】

を、特徴ベクトルに基づくエンティティ表現から、すなわち、エンコーディング

【数31】

から再構築するというタスクに対して、ランダムフォレスト回帰モデルを訓練することを使用することができる。

【0091】

一例によれば、エンティティｅのエンコーディング

【数32】

を、このエンティティｅの数値表現

【数33】

に射影するような関数Ｗが存在するように、エンティティＥのエンコーディング

【数34】

が、特徴Ｆに依存して決定される。

【0092】

エンティティＥのエンコーディング

【数35】

を、複数の特徴Ｆから選択された特徴に依存して決定することができる。

【0093】

本方法は、取得された特徴Ｆから、エンティティ埋め込み

【数36】

に格納された情報を捕捉している特徴を選択することができる。

【0094】

本方法は、特徴を選択するために、埋め込まれた特徴を選択する技術を使用することができる。例えば、解釈可能な特徴の部分集合が選択され、この部分集合については、ランダムフォレスト回帰モデルが、それぞれのタスクに対して最高の精度を達成している。

【0095】

特徴Ｆを、エンコーディング

【数37】

に対する、これらの特徴Ｆの重要性に依存して選択することができる。本例におけるスコアは、関連性を示す。

【0096】

一例によれば、特徴Ｆを、エンティティＥの数値表現

【数38】

に射影するためのモデルＭが提供される。

【0097】

モデルＭは、複数の特徴Ｆのうちの１つの特徴ｆ∈Ｆの、射影に対する重要性を示すスコアを出力するように構成されている。

【0098】

スコアは、例えば射影の誤差に依存して、例えばモデルＭを用いた特徴Ｆの射影と、エンティティＥの数値表現

【数39】

との間の二乗誤差に依存して決定される。

【0099】

このことはつまり、エンティティＥのエンコーディング

【数40】

を、特徴Ｆに依存して決定することができるということを意味する。

【0100】

例えば、特徴ｆに対するスコアが閾値を超えている場合には、この特徴ｆに依存して、エンティティＥのエンコーディング

【数41】

が決定される。そうでない場合には、特徴ｆに依存することなく、エンティティＥのエンコーディング

【数42】

が決定される。

【0101】

例えば、複数の特徴に対してスコアが決定される。閾値は、例えば複数の特徴に対して決定されたスコアの平均である。

【0102】

このことはつまり、本方法が、モデルを用いて特徴の集合のうちの複数の特徴にそれぞれのスコアを割り当てることを含むことができるということを意味する。

【0103】

このことはつまり、本方法が、複数の特徴に割り当てられたスコアの平均を決定することを含むことができるということを意味する。

【0104】

このことはつまり、本方法が、特徴に割り当てられたスコアと平均との間の比較の結果に依存して、特徴の集合から特徴を選択することを含むことができるということを意味する。

【0105】

知識グラフ埋め込みモデル

【数43】

は、徹底的なモデル分析及びデバッグ目的のために役立つ解釈可能なモデルである。

【0106】

本方法は、ステップ８１０を含み得る。

【0107】

ステップ８１０においては、技術的システム１０６が動作させられる。

【0108】

一例によれば、知識グラフは、技術的システム１０６におけるイベントを表す第１のエンティティと、技術的システム１０６又は異なる技術的システムにおける異なるイベントを表す第２のエンティティとを含む。知識グラフは、例えば知識グラフのうちの第１のエンティティを表すノードを、知識グラフのうちの別のノードに接続しているエッジを含み、この別のノードは、知識グラフのうちのイベントのカテゴリを表すエンティティを表す。知識グラフは、例えば第２のエンティティを、カテゴリを表すエンティティに関連付ける。第１のエンティティには、第１の特徴又は第１の特徴ベクトルが提供される。第２のエンティティには、第２の特徴又は第２の特徴ベクトルが提供される。

【0109】

ステップ８１０は、技術的システム１０６において発生したイベントを検出することを含み得る。

【0110】

ステップ８１０は、技術的システム１０６を起動させること、又は、特徴と、少なくとも１つの他のエンティティに割り当てられた所定の特徴との間の比較に依存して、技術的システム１０６の故障を自動的に検出することを含み得る。

【0111】

第１のエンティティと第２のエンティティとが１つの特定のカテゴリに分類されると、本方法は、これらのエンティティに提供されている１つ又は複数の共通の特徴を、自動的に識別することができる。

【0112】

１つ又は複数の共通の特徴は、それぞれの分類結果についての可能性のある説明を提供する。

【0113】

如何なる共通の特徴も存在しないということは、イベントのうちの１つがそのカテゴリに誤って割り当てられているということを示すことができる。少なくとも１つの共通の特徴が存在するということは、イベントがそのカテゴリに正しく割り当てられているということを示すことができる。共通の特徴は、技術的システム１０６又は技術的システム１０６の動作のうちのどの部分によってイベントが引き起こされたかを示す説明を提供することができる。

【0114】

１つ又は複数の共通の特徴が、それぞれの分類結果についての可能性のある説明を提供する場合には、知識グラフ内で、あるカテゴリに割り当てられたイベントが検出されると、そのカテゴリによって提示されるアクションに従って、技術的システム１０６を起動させることができる。

【0115】

１つ又は複数の共通の特徴が、それぞれの分類結果についての可能性のある説明を提供する場合には、知識グラフ内で、故障を示すカテゴリに割り当てられたイベントが検出されると、技術的システム１０６を停止させることができる。

【0116】

例えば製造ドメインにおける、本方法についての使用事例は、故障イベントを特定のカテゴリ（例えば、高リスク、低リスク）に分類することを含む。

【0117】

故障イベントの予測は、エンコーディング

【数44】

によって決定される。故障イベントの一般的な分析とは別に、すなわち、高リスクのカテゴリ又は低リスクのカテゴリの一方への分類とは別に、エンコーディング

【数45】

は、それぞれの予測についての説明を以下のようにして生成する。

【0118】

故障イベントを表す所与のエンティティｅ_ｉが、知識グラフ埋め込みモデル

【数46】

に依拠して、高リスク又は低リスクのいずれかを表す特定のクラスｃに分類されると、ｅ_ｉの特徴ベクトルｖ_ｉが、本方法を用いて生成され、そのクラスｃに所属することが既知であるエンティティの特徴ベクトルと比較される。それぞれの特徴ベクトルに基づいて、ｅ_ｉがそのクラスｃの他のエンティティと共有する特徴ｆ_ｊが、すなわち、これらの特徴が、それぞれの分類結果についての可能性のある説明に相当する。

【図1】