(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024155887
(43)【公開日】2024-10-31
(54)【発明の名称】ファクトを機械学習するための、特に知識ベースを充填するための、コンピュータ実装される方法及び装置
(51)【国際特許分類】
G06N 20/00 20190101AFI20241024BHJP
G06N 5/025 20230101ALI20241024BHJP
【FI】
G06N20/00
G06N5/025
【審査請求】未請求
【請求項の数】13
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024068343
(22)【出願日】2024-04-19
(31)【優先権主張番号】10 2023 203 660.6
(32)【優先日】2023-04-20
(33)【優先権主張国・地域又は機関】DE
(71)【出願人】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(74)【代理人】
【識別番号】100114890
【弁理士】
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【弁理士】
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【弁理士】
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100134315
【弁理士】
【氏名又は名称】永島 秀郎
(74)【代理人】
【識別番号】100162880
【弁理士】
【氏名又は名称】上島 類
(72)【発明者】
【氏名】ルーカス ランゲ
(72)【発明者】
【氏名】ハイケ アーデル-ヴー
(72)【発明者】
【氏名】ヤニク シュトレートゲン
(57)【要約】
【課題】ファクトを機械学習するための、特に知識ベースを充填するための装置及びコンピュータ実装される方法に関する。
【解決手段】本方法においては、文字列が提供され(302)、文字列の部分の埋め込みの第1のセットが特定され(304)、文字列の部分の埋め込みの第2のセットが特定され(306)、相互に対応する埋め込みに対して、セットから、ファクトを予測するための変数のうちのそれぞれ1つの変数が特定され(308)、ファクトが、特に知識ベースにおいて、変数に依存して特定される(310)。
【選択図】
図3
【特許請求の範囲】
【請求項1】
ファクトを機械学習するための、特に知識ベースを充填するための、コンピュータ実装される方法であって、
文字列が提供され(302)、
前記文字列の部分の埋め込みの第1のセットが特定され(304)、
前記文字列の部分の埋め込みの第2のセットが特定され(306)、
前記ファクトが、特に前記知識ベースにおいて、前記ファクトを予測するための変数に依存して特定され(310)、
相互に対応する埋め込みに対して、前記セットから、前記ファクトを予測するための前記変数のうちのそれぞれ1つの変数が特定される(308)
ことを特徴とする方法。
【請求項2】
前記変数は、前記第2のセットが対応する埋め込みを含まない前記第1のセットからの埋め込みには依存せずに特定される(308)、
請求項1に記載の方法。
【請求項3】
前記第2のセットが対応する埋め込みを含まない前記第1のセットからの埋め込みに対して、埋め込みが前記文字列には依存せずに提供され、前記ファクトを予測するための前記変数のうちの1つの変数が、前記第1のセットからの前記埋め込みと、前記文字列には依存せずに提供された前記埋め込みとに依存して特定される(308)、
請求項1又は2に記載の方法。
【請求項4】
前記第2のセットが対応する埋め込みを含まない前記第1のセットからの第1の埋め込みに対して、前記第2のセットが対応する埋め込みを含む前記第1のセットからの第2の埋め込みが特定され、前記ファクトを予測するための前記変数のうちの1つの変数が、前記第1の埋め込み及び前記第2の埋め込み並びに前記第2の埋め込みに対応する前記埋め込みに依存して、前記第2のセットから特定される(308)、
請求項1乃至3のいずれか一項に記載の方法。
【請求項5】
前記ファクトを予測するための前記変数が、前記第1の埋め込み及び前記第2の埋め込み並びに前記第2の埋め込みに対応する前記埋め込みに依存して、前記第1の埋め込みと前記第2の埋め込みとの平均に依存して特定される(308)、
請求項4に記載の方法。
【請求項6】
相互に対応する埋め込みが、前記文字列の前記部分の順序における自身の位置に依存して特定される(308)、
請求項1乃至5のいずれか一項に記載の方法。
【請求項7】
相互に対応する埋め込みが、共通の文字に依存して、特に、前記文字列の各部分の開始部で特定される(308)、
請求項1乃至6のいずれか一項に記載の方法。
【請求項8】
前記文字列は、前記第1のセットからの前記埋め込みに一義的に対応付けられる部分の第1のリストに分割され(304)、
前記文字列は、前記第2のセットからの前記埋め込みに一義的に対応付けられる部分の第2のリストに分割され(306)、
前記リストの相互に対応する部分は、前記リストにおいて当該部分が配置されている順序に依存して定義されており、対応する前記埋め込みは、前記リストの相互に対応する当該部分に依存して特定される(308)、
請求項1乃至7のいずれか一項に記載の方法。
【請求項9】
埋め込みの前記第1のセットは、第1の語彙に依存して特定され(304)、
埋め込みの前記第2のセットは、前記第1の語彙とは異なる第2の語彙に依存して特定される(306)、
請求項1乃至8のいずれか一項に記載の方法。
【請求項10】
前記文字列は、前記文字列の特定の文字によって、及び/又は、単語分離及び/又は音節分離及び/又は字分離のルールによって、前記文字列の前記部分に分解される(302)、
請求項1乃至9のいずれか一項に記載の方法。
【請求項11】
前記変数を特定するために、前記セットから、相互に対応する埋め込みが連結され、加えられ、又は、掛け合わされる(308)、
請求項1乃至10のいずれか一項に記載の方法。
【請求項12】
ファクトを機械学習するための、特に知識ベースを充填するための装置(100)であって、
少なくとも1つのプロセッサ(102)と、
少なくとも1つのメモリ(104)と、
を含み、
前記少なくとも1つのプロセッサ(102)は、命令を実行するように構成されており、前記命令が前記少なくとも1つのプロセッサ(102)上で実行されるときに、請求項1乃至11のいずれか一項に記載の方法が実施され、
前記少なくとも1つのメモリ(104)は、前記命令を格納するように構成されている
ことを特徴とする装置(100)。
【請求項13】
ファクトを機械学習するための、特に知識ベースを充填するためのプログラムであって、
少なくとも1つのプロセッサ(102)上で実行されるときに、請求項1乃至11のいずれか一項に記載の方法が実施されるための命令を含む
ことを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
背景技術
本発明は、ファクトを機械学習するための、特に知識ベースを充填するための、コンピュータ実装される方法及び装置に関する。
【背景技術】
【0002】
ファクトを機械学習するためには、文字列の埋め込みに依存してファクトを特定するモデルが使用される。モデルは、文章の単語分離法を使用して、文字列の部分を特定する。埋め込みは、これら個々の部分について特定される。これによって、情報の損失が生じることとなる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
発明の開示
ファクトを機械学習するための、特に知識ベースを充填するための、コンピュータ実装される方法及び装置は、このような損失を回避する。
【課題を解決するための手段】
【0004】
この方法においては、文字列が提供され、文字列の部分の埋め込みの第1のセットが特定され、文字列の部分の埋め込みの第2のセットが特定され、ファクトが、特に知識ベースにおいて、ファクトを予測するための変数に依存して特定され、相互に対応する埋め込みに対して、これらのセットから、ファクトを予測するための変数のうちのそれぞれ1つの変数が特定されることが想定される。変数は、メタ埋め込みであり、このメタ埋め込みは、その埋め込みが相互に対応する文字列の部分から特定される。このことは、埋め込み語彙に応じて、単語分離法において生じる文字列の部分に1つの埋め込みが対応付けられること、又は、この部分に複数の埋め込みが対応付けられることを意味する。これによって、単語分離法に相当する又は単語分離法よりも精確な細分性が得られる。これによって、部分ごとに1つより多くの埋め込みが生じた場合に、情報の損失がより少なくなる。
【0005】
好ましくは、これらの変数は、第2のセットが対応する埋め込みを含まない第1のセットからの埋め込みには依存せずに特定される。これは、第2のセットにおける対応する埋め込みを伴わない第1のセットの埋め込みが考慮されないままであることを意味する。
【0006】
好ましくは、第2のセットが対応する埋め込みを含まない第1のセットからの埋め込みに対して、埋め込みが文字列には依存せずに提供され、ファクトを予測するための変数のうちの1つの変数が、第1のセットからの埋め込みと、文字列には依存せずに提供された埋め込みとに依存して特定される。これは、第2のセットにおける対応する埋め込みを伴わない第1のセットの埋め込みが考慮されることを意味する。
【0007】
好ましくは、第2のセットが対応する埋め込みを含まない第1のセットからの第1の埋め込みに対して、第2のセットが対応する埋め込みを含む第1のセットからの第2の埋め込みが特定され、ファクトを予測するための変数のうちの1つの変数が、第1の埋め込み及び第2の埋め込み及び第2の埋め込みに対応する埋め込みに依存して、第2のセットから特定される。これは、第2のセットにおける対応する埋め込みを伴わない第1のセットの埋め込みが、第2のセットにおいて対応する埋め込みが存在している第1のセットからの埋め込みと共に考慮されることを意味する。
【0008】
好ましくは、ファクトを予測するための変数が、第1の埋め込み及び第2の埋め込み及び第2の埋め込みに対応する埋め込みに依存して、第1の埋め込みと第2の埋め込みとの平均に依存して特定される。これによって、2つの埋め込みが共に考慮される。
【0009】
好ましくは、相互に対応する埋め込みが、文字列の部分の順序における自身の位置に依存して特定される。これによって、文字列の分離の順序で対応する部分同士が、相互に対応付けられる。
【0010】
好ましくは、相互に対応する埋め込みが、共通の文字に依存して、特に、文字列の各部分の開始部で特定される。これによって、文字列の分離における文字に基づいて、対応する部分同士が、相互に対応付けられる。
【0011】
好ましくは、文字列は、第1のセットからの埋め込みに一義的に対応付けられる部分の第1のリストに分割され、文字列は、第2のセットからの埋め込みに一義的に対応付けられる部分の第2のリストに分割され、リストの相互に対応する部分は、リストにおいてこれらの部分が配置されている順序に依存して定義されており、対応する埋め込みは、リストの相互に対応する部分に依存して特定される。
【0012】
好ましくは、埋め込みの第1のセットは、第1の語彙に依存して特定され、埋め込みの第2のセットは、第1の語彙とは異なる第2の語彙に依存して特定される。第1の語彙及び第2の語彙は、異なる埋め込みに到る、異なる埋め込み語彙である。
【0013】
好ましくは、文字列は、文字列の特定の文字によって、及び/又は、単語分離及び/又は音節分離及び/又は字分離のルールによって、文字列の部分に分解される。
【0014】
好ましくは、変数を特定するために、セットから、相互に対応する埋め込みが連結され、加えられ、又は、掛け合わされる。
【0015】
ファクトを機械学習するための、特に知識ベースを充填するための装置は、少なくとも1つのプロセッサと、少なくとも1つのメモリと、を含み、少なくとも1つのプロセッサは、命令を実行するように構成されており、この命令が少なくとも1つのプロセッサ上で実行されるときに、この方法が実施され、少なくとも1つのメモリは、命令を格納するように構成されている。
【0016】
ファクトを機械学習するための、特に知識ベースを充填するためのプログラムは、少なくとも1つのプロセッサ上で実行されるときに、この方法が実施されるための命令を含む。
【0017】
さらなる有利な実施形態は、以下の説明及び図面から明らかになる。
【図面の簡単な説明】
【0018】
【
図2】ファクトを予測するためのモデルの一部分のアーキテクチャを示す図である。
【
図3】機械学習するための方法におけるステップを示す図である。
【発明を実施するための形態】
【0019】
図1には、機械学習するための装置100の概略図が概略的に示されている。
【0020】
装置100は、少なくとも1つのプロセッサ102と、少なくとも1つのメモリ104とを含む。
【0021】
少なくとも1つのプロセッサ102は、命令を実行するように構成されており、この命令が実行されるときに、少なくとも1つのプロセッサ102上で、機械学習するための方法が実施される。
【0022】
少なくとも1つのメモリ104は、命令を格納するように構成されている。
【0023】
ファクトを機械学習するためのプログラムは、命令を含む。少なくとも1つのプロセッサ102は、プログラムを実行するように構成されている。
【0024】
少なくとも1つのメモリ104は、この例においては、知識ベース、たとえばナレッジグラフを格納するように構成されている。
【0025】
知識ベースはファクトを含む。ファクトは、たとえば主語、目的語及び述語によって表され、述語は、主語と目的語との間の関係を特徴付ける。
【0026】
ファクトは、様々なデータタイプ、たとえばテキストデータ、画像データ又はオーディオデータに関する知識を表すことができる。ファクトは、セマンティックセグメンテーションに対し使用し得る。
【0027】
知識ベースは、たとえば、100個より多くの、1000個より多くの、10000個より多くの、又は、100000個より多くのファクトを含む。
【0028】
図2には、ファクトを予測するためのモデル200の一部分のアーキテクチャが概略的に示されている。
【0029】
モデル200は、文字列用の入力側202とファクト用の出力側204とを含む。モデル200は、文字列に依存してファクトを特定するように構成されている。
【0030】
たとえば、文字列は、主語及び目的語を表す文字を含み、ファクトは、主語、目的語及び述語を含み、述語は、主語及び目的語に対するモデル200によって予測される。
【0031】
モデル200は、入力側202と出力側204との間に第1の層206を含み、第1の層206は、文字列と、第1の語彙とに依存して、文字列の部分の埋め込みを特定するように構成されている。モデル200は、入力側202と出力側204との間に第2の層208を含み、第2の層208は、文字列と、第2の語彙とに依存して、文字列の部分の埋め込みを特定するように構成されている。第1の語彙及び第2の語彙は、この例においては、互いに異なる埋め込み語彙である。
【0032】
第1の層206は、入力変数として文字列を使用する。第1の層206は、文字列を、文字列の部分の埋め込みにマッピングする。
【0033】
第2の層208は、入力変数として文字列を使用する。第2の層208は、文字列を、文字列の部分の埋め込みにマッピングする。
【0034】
たとえば、第1の層206は、文字列Acetaminophenを、部分「Ace」、「tami」及び「nophen」の埋め込みにマッピングする。たとえば、第2の層208は、文字列Acetaminophenを、部分「Acetami」及び「nophen」にマッピングする。
【0035】
第1の層206は、この例においては第1の埋め込み層E1である。第2の層208は、この例においては第2の埋め込み層E2である。n個の語彙に対して、n個の層、すなわち、n個の埋め込み層E1,E2,…,Enが設けられるものとしてよい。埋め込み層E1,E2,…,Enが生じさせる分離は、それぞれ異なるものとしてよい。
【0036】
部分の埋め込みに基づいて、文字列が自身の複数の部分に分離される。この分離は、文字列自体を自身の複数の部分に分離することを必要としない。
【0037】
モデル200は、第1の層206と第2の層208との間に第3の層210を含み、第3の層210は、第1の層206及び第2の層208からの相互に対応する埋め込みを、ファクトを予測するための変数にまとめるように構成されている。
【0038】
種々異なる語彙の埋め込みを特定するために、2つより多くの層、たとえばn個の層を設けることが想定され得る。これらの層からの相互に対応する埋め込みを、予測するための変数にまとめることが想定され得る。
【0039】
モデル200は、第1の層206と出力側204との間に、及び、第2の層208と出力側204との間に、変数に依存してファクトを予測するための関数212を含む。
【0040】
関数212は、たとえば、変数を、符号化された変数にマッピングするように構成されているエンコーダ214と、符号化された変数を出力側204におけるファクトにマッピングするように構成されているデコーダ216とを含む。
【0041】
関数212は、たとえば、変換器モデル、リカレント再帰型ネットワーク(RRN)、長・短期記憶(LSTM)、又は、別のニューラルネットワークとして実装されている。第3の層210は、この例においては、関数212の第1の層である。
【0042】
これは、たとえば、変換器モデルの場合、この変換器モデルの第1の層においてメタ埋め込みが作成されることを意味する。これによって、変換器モデルは、2つ以上の異なる語彙を取り扱うことができる。これによって、付加的なドメイン固有の埋め込み又は言語固有の埋め込みが統合される。
【0043】
図3には、機械学習するための方法におけるステップが示されている。
【0044】
この方法は、ファクトを機械学習するために実施される。この例においては、これらのファクトによって、知識ベースが充填される。
【0045】
ステップ302において、文字列が提供される。
【0046】
たとえば、Acetaminophenという単語が提供される。
【0047】
ステップ304において、文字列の部分の埋め込みの第1のセットが特定される。
【0048】
埋め込みの第1のセットは、たとえば、第1の語彙に依存して特定される。
【0049】
この例においては、文字列は部分の第1のリストに分割される。第1のリストの部分は、第1のセットからの埋め込みに一義的に対応付けられる。
【0050】
たとえば、第1の語彙によって、Aceに対する埋め込みと、tamiに対する埋め込みと、nophenに対する埋め込みとが特定される。
【0051】
ステップ306において、文字列の部分の埋め込みの第2のセットが特定される。
【0052】
埋め込みの第2のセットは、たとえば、第1の語彙とは異なる第2の語彙に依存して特定される。
【0053】
たとえば、第2の語彙によって、Acetamiに対する埋め込みと、nophenに対する埋め込みとが特定される。
【0054】
この例においては、文字列は部分の第2のリストに分割される。第2のリストの部分は、第2のセットからの埋め込みに一義的に対応付けられる。
【0055】
埋め込みの2つより多くのセットを特定することが想定され得る。これらのセットは、たとえば、相互に異なる語彙に依存して特定される。文字列をセットごとに、部分のリストに分割することが想定され得る。各リストの部分は、各リストに対応付けられるセットの埋め込みに一義的に対応付けられる。
【0056】
ステップ308において、これらのセットからの相互に対応する埋め込みに対して、ファクトを予測するためのそれぞれ1つの変数が特定される。
【0057】
これらのセットからの相互に対応する埋め込みは、たとえば、変数を特定するために連結され、加えられ、又は、掛け合わされる。
【0058】
相互に対応する埋め込みは、たとえば、文字列の部分の順序における自身の位置に依存して特定される。
【0059】
たとえば、順序に基づいて、Ace及びAcetamiが、順序における最初として、したがって対応するものとして特定される。
【0060】
相互に対応する埋め込みは、たとえば、共通の文字に依存して、特に文字列の各部分の開始部で特定される。
【0061】
たとえば、一致する文字列における単語の始まりに基づいて、「Ace」が、部分Ace及びAcetamiにおいて、対応するものとして特定される。
【0062】
第2のセットが対応する埋め込みを含まない第1のセットからの埋め込みには依存せずに変数が特定されることが想定され得る。
【0063】
たとえば、第1のセットから、tamiに対する埋め込みは使用されない。
【0064】
第1のセットが対応する埋め込みを含まない第2のセットからの埋め込みには依存せずに変数が特定されることが想定され得る。
【0065】
少なくとも1つの別のセットが対応する埋め込みを含まないセットからの埋め込みに対して、埋め込みが文字列には依存せずに提供されることが想定され得る。
【0066】
たとえば、第1のセットから、tamiに対する埋め込みが使用され、かつ、このために対応する埋め込みが設けられる。
【0067】
少なくとも1つの別のセットが対応する埋め込みを含まないセットからの埋め込みに対して、対応する埋め込みを含まないセットごとに、埋め込みが文字列には依存せずに提供されることが想定され得る。
【0068】
少なくとも1つの別のセットが対応する埋め込みを含まないセットからの埋め込みに依存して、及び、文字列には依存せずに提供された少なくとも1つの埋め込みに依存して、ファクトを予測するための変数のうちの1つの変数が特定されることが想定され得る。
【0069】
第2のセットが対応する埋め込みを含まない第1のセットからの第1の埋め込みに対して、第2のセットが対応する埋め込みを含む第1のセットからの第2の埋め込みが特定されることが想定され得る。
【0070】
ファクトを予測するための変数のうちの1つの変数が、第1の埋め込み及び第2の埋め込み及び第2の埋め込みに対応する埋め込みに依存して、第2のセットから特定されることが想定され得る。
【0071】
ファクトを予測するための変数は、たとえば、第1の埋め込みと第2の埋め込みとの平均に依存して、第2の埋め込みに対応する埋め込みに依存して特定される。
【0072】
リストの相互に対応する部分が、リストにおいてこれらの部分が配置されている順序に依存して定義されていることが想定され得る。
【0073】
対応する埋め込みが、たとえば、リストの相互に対応する部分に依存して特定される。
【0074】
ステップ310において、ファクトが、ファクトを予測するための変数に依存して特定される。
【0075】
ファクトは、この例においては、知識ベースに格納される。知識ベースは、たとえばナレッジグラフである。
【0076】
ファクトは、たとえば、文字列から抽出される情報に関する。
【0077】
たとえば、ファクトは、主語、目的語及び述語を含み、述語は、主語と目的語との間の関係を定義する。主語は、この例においては、医薬品、たとえばAcetaminophenを表す知識ベースのエンティティである。目的語は、この例においては、グループ、たとえばNichtopioid-Analgetika(非オピオイド鎮痛薬)を表す知識ベースのエンティティである。文字列は、たとえば主語、この例においてはAcetaminophenを含む。この方法は、たとえば、医薬品のグループへの主語の帰属を特定するために使用される。関係は、たとえば、主語の、ファクトの目的語において指定されたグループへの帰属である。文字列から抽出される情報は、たとえば目的語、この例においては、Nichtopioid-Analgetikaである。
【0078】
ファクトは、文字列の別の分類、すなわち、別の対応付けにも関連し得る。
【0079】
ファクトは、知識ベースを充填すること、又は、たとえば、神経言語プログラミング(NLP)の以下の適用分野、すなわち、
文字列の機械翻訳、
文字列からの情報抽出、
特にDialog Systemにおける文字列に対する応答、
文字列の分類又は回帰に基づくビデオ分析又はオーディオ分析、
文字列の分類又は回帰に基づく時系列分析、
文字列の分類又は回帰に基づく異常識別
のうちの1つに関連し得る。
【0080】
変数はメタ埋め込みであり、メタ埋め込みは、この例においては、変換器モデルの第1の層の代わりとなる。変数の特定は、変換器モデルによってアドレッシングされ得る他のタスクに適用され得る。これは、列挙したNLPタスク、他のNLPタスク及び非NLPタスクに関する。
【0081】
変換器モデルは、たとえば1つの埋め込み層から成り、この埋め込み層の後には複数のエンコーダ層及び/又はデコーダ層が続く。メタ埋め込みは、変換器モデルのこの第1の埋め込み層の埋め込みをメタ埋め込みによって置き換える。
【0082】
代替的に、メタ埋め込みは、他のモデルアーキテクチャ及び埋め込み法でも利用可能であり、これによって、これらを、概して、単語よりも精確な細分性で結びつけることができる。
【手続補正書】
【提出日】2024-07-12
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ファクトを機械学習するための、特に知識ベースを充填するための、コンピュータ実装される方法であって、
文字列が提供され(302)、
前記文字列の部分の埋め込みの第1のセットが特定され(304)、
前記文字列の部分の埋め込みの第2のセットが特定され(306)、
前記ファクトが、特に前記知識ベースにおいて、前記ファクトを予測するための変数に依存して特定され(310)、
相互に対応する埋め込みに対して、前記第1及び第2のセットから、前記ファクトを予測するための前記変数のうちのそれぞれ1つの変数が特定される(308)
ことを特徴とする方法。
【請求項2】
前記変数は、前記第2のセットが対応する埋め込みを含まない前記第1のセットからの埋め込みには依存せずに特定される(308)、
請求項1に記載の方法。
【請求項3】
前記第2のセットが対応する埋め込みを含まない前記第1のセットからの埋め込みに対して、埋め込みが前記文字列には依存せずに提供され、前記ファクトを予測するための前記変数のうちの1つの変数が、前記第1のセットからの前記埋め込みと、前記文字列には依存せずに提供された前記埋め込みとに依存して特定される(308)、
請求項1に記載の方法。
【請求項4】
前記第2のセットが対応する埋め込みを含まない前記第1のセットからの第1の埋め込みに対して、前記第2のセットが対応する埋め込みを含む前記第1のセットからの第2の埋め込みが特定され、前記ファクトを予測するための前記変数のうちの1つの変数が、前記第1の埋め込み及び前記第2の埋め込み並びに前記第2の埋め込みに対応する前記埋め込みに依存して、前記第2のセットから特定される(308)、
請求項1に記載の方法。
【請求項5】
前記ファクトを予測するための前記変数が、前記第1の埋め込み及び前記第2の埋め込み並びに前記第2の埋め込みに対応する前記埋め込みに依存して、前記第1の埋め込みと前記第2の埋め込みとの平均に依存して特定される(308)、
請求項4に記載の方法。
【請求項6】
相互に対応する埋め込みが、前記文字列の前記部分の順序における自身の位置に依存して特定される(308)、
請求項1に記載の方法。
【請求項7】
相互に対応する埋め込みが、共通の文字に依存して、特に、前記文字列の各部分の開始部で特定される(308)、
請求項1に記載の方法。
【請求項8】
前記文字列は、前記第1のセットからの前記埋め込みに一義的に対応付けられる部分の第1のリストに分割され(304)、
前記文字列は、前記第2のセットからの前記埋め込みに一義的に対応付けられる部分の第2のリストに分割され(306)、
前記第1及び第2のリストの相互に対応する部分は、前記第1及び第2のリストにおいて当該部分が配置されている順序に依存して定義されており、対応する前記埋め込みは、前記第1及び第2のリストの相互に対応する当該部分に依存して特定される(308)、
請求項1に記載の方法。
【請求項9】
埋め込みの前記第1のセットは、第1の語彙に依存して特定され(304)、
埋め込みの前記第2のセットは、前記第1の語彙とは異なる第2の語彙に依存して特定される(306)、
請求項1に記載の方法。
【請求項10】
前記文字列は、前記文字列の特定の文字によって、及び/又は、単語分離及び/又は音節分離及び/又は字分離のルールによって、前記文字列の前記部分に分解される(302)、
請求項1に記載の方法。
【請求項11】
前記変数を特定するために、前記セットから、相互に対応する埋め込みが連結され、加えられ、又は、掛け合わされる(308)、
請求項1に記載の方法。
【請求項12】
ファクトを機械学習するための、特に知識ベースを充填するための装置(100)であって、
少なくとも1つのプロセッサ(102)と、
少なくとも1つのメモリ(104)と、
を含み、
前記少なくとも1つのプロセッサ(102)は、命令を実行するように構成されており、前記命令が前記少なくとも1つのプロセッサ(102)上で実行されるときに、請求項1に記載の方法が実施され、
前記少なくとも1つのメモリ(104)は、前記命令を格納するように構成されている
ことを特徴とする装置(100)。
【請求項13】
ファクトを機械学習するための、特に知識ベースを充填するためのプログラムであって、
少なくとも1つのプロセッサ(102)上で実行されるときに、請求項1に記載の方法が実施されるための命令を含む
ことを特徴とするプログラム。
【外国語明細書】