特許7283575 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7283575学習方法、学習装置および学習プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-05-22

(45)【発行日】2023-05-30

(54)【発明の名称】学習方法、学習装置および学習プログラム

(51)【国際特許分類】

G06N 5/02 20230101AFI20230523BHJP

G06N 20/00 20190101ALI20230523BHJP

【ＦＩ】

G06N5/02

G06N20/00

【請求項の数】 6

(21)【出願番号】P 2021560832

(86)(22)【出願日】2019-11-27

(86)【国際出願番号】 JP2019046458

(87)【国際公開番号】W WO2021106118

(87)【国際公開日】2021-06-03

【審査請求日】2022-04-19

(73)【特許権者】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】岡嶋成司

(72)【発明者】

【氏名】鵜飼孝典

【審査官】藤原敬利

(56)【参考文献】

【文献】BALAZEVIC, Ivana, et al.，Multi-relational Poincare Graph Embeddings，arXiv:1905.09791v3，version v3，[online], arXiv (Cornell University)，2019年10月27日，Pages 1-13，[retrieved on 2020.01.31], Retrieved from the Internet: <URL: https://arxiv.org/pdf/1905.09791v3.pdf

【文献】NICKEL, Maximilian, et al.，Poincare Embeddings for Learning Hierarchical Representations，Proceedings of the Neural Information Processing Systems (NIPS) 2017，[online]，2017年12月05日，Pages 1-10，[retrieved on 2020.01.31], Retrieved from the Internet: <URL: http://papers.nips.cc/paper/7213-poinc

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ５／０２

Ｇ０６Ｎ２０／００

(57)【特許請求の範囲】

【請求項1】

ナレッジグラフにおけるインスタンス情報およびオントロジー情報にベクトル表現を与える埋め込み処理に関する学習方法であって、
ユークリッド空間上における第１のインスタンス情報のベクトル表現を取得し、
双曲空間上における第１のオントロジー情報のベクトル表現を取得し、
前記第１のインスタンス情報の双曲空間への写像に基づいて、取得した前記第１のオントロジー情報のベクトル表現を変更した第２のオントロジー情報を生成し、
前記第２のオントロジー情報のユークリッド空間への写像に基づいて、取得した前記第１のインスタンス情報のベクトル表現を変更した第２のインスタンス情報を生成し、
前記第２のオントロジー情報と前記第２のインスタンス情報との対応関係を、リンク予測をするために学習する
処理をコンピュータが実行する学習方法。

【請求項2】

銭第２のインスタンス情報を生成する処理は、前記第１のインスタンス情報のベクトル表現を、写像後の前記第１のオントロジー情報のベクトル表現に近づけるように更新し、前記第２のインスタンス情報を生成する処理を含む、
ことを特徴とする請求項１に記載の学習方法。

【請求項3】

前記第２のオントロジー情報を生成する処理は、写像後の前記第１のインスタンス情報の原点からの距離を、前記第１のオントロジー情報の原点からの距離に揃える正規化を行ってから、前記第１のオントロジー情報のベクトル表現を、写像後の正規化を行った前記第１のインスタンス情報のベクトル表現に近づけるように更新し、前記第２のオントロジー情報を生成する処理を含む、
ことを特徴とする請求項１に記載の学習方法。

【請求項4】

前記学習する処理は、前記第２のオントロジー情報のベクトル表現から算出された前記第２のインスタンス情報のベクトル表現を用いて、予測対象のインスタンス情報のリンク予測を行い、リンク予測の結果を出力する処理を含む、
ことを特徴とする請求項１に記載の学習方法。

【請求項5】

ナレッジグラフにおけるインスタンス情報およびオントロジー情報にベクトル表現を与える埋め込み処理に関する学習装置であって、
ユークリッド空間上における第１のインスタンス情報のベクトル表現を取得し、双曲空間上における第１のオントロジー情報のベクトル表現を取得し、前記第１のインスタンス情報の双曲空間への写像に基づいて、取得した前記第１のオントロジー情報のベクトル表現を変更した第２のオントロジー情報を生成する第１の生成部と、
前記第２のオントロジー情報のユークリッド空間への写像に基づいて、取得した前記第１のインスタンス情報のベクトル表現を変更した第２のインスタンス情報を生成する第２の生成部と、
前記第２のオントロジー情報と前記第２のインスタンス情報との対応関係を、リンク予測をするために学習する学習部と、
を有することを特徴とする学習装置。

【請求項6】

ナレッジグラフにおけるインスタンス情報およびオントロジー情報にベクトル表現を与える埋め込み処理に関する学習プログラムであって、
ユークリッド空間上における第１のインスタンス情報のベクトル表現を取得し、
双曲空間上における第１のオントロジー情報のベクトル表現を取得し、
前記第１のインスタンス情報の双曲空間への写像に基づいて、取得した前記第１のオントロジー情報のベクトル表現を変更した第２のオントロジー情報を生成し、
前記第２のオントロジー情報のユークリッド空間への写像に基づいて、取得した前記第１のインスタンス情報のベクトル表現を変更した第２のインスタンス情報を生成し、
前記第２のオントロジー情報と前記第２のインスタンス情報との対応関係を、リンク予測をするために学習する
処理をコンピュータに実行させる学習プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、学習方法などに関する。

【背景技術】

【0002】

ＲＤＦ（Resource Description Framework）のグラフ埋め込みによるベクトル表現の学習が開示されている（例えば、非特許文献１参照）。グラフ埋め込みとは、ＲＤＦのリンク予測をするために、グラフのノードおよびリンクにベクトル表現を与える技術である。

【0003】

ここで、ＲＤＦは、実体を示すインスタンスと概念を示すオントロジーからなる。インスタンスは、グラフ構造を示す。オントロジーは、概念の階層構造を示す。図１０は、ＲＤＦデータの参考例を示す図である。図１０に示すように、左図には、インスタンスが表わされ、右図には、オントロジーが表わされている。インスタンスは、グラフ構造である。オントロジーは、概念の階層構造である。そして、インスタンスとオントロジーとは、対応付けられている。一例として、インスタンスが示す「Ｋａｗａｓａｋｉ」は、「Ｐｌａｃｅ」という概念と対応付けられている。インスタンスが示す「Ｉｃｈｉｒｏ」は、「Ｐｅｒｓｏｎ」という概念と対応付けられている。

【0004】

このようなＲＤＦにおいて、インスタンスとオントロジーそれぞれに精度の高いベクトル表現を与える技術が望まれている。例えば、非特許文献１では、インスタンスとオントロジーを組み合わせて学習することで、精度の高いベクトル表現を実現する。かかる技術では、インスタンスとオントロジーをそれぞれ異なるユークリッド空間上で表現し、インスタンスのオントロジー空間への写像が、対応するオントロジーに近づくように、インスタンスとオントロジーのベクトル表現を学習する。

【先行技術文献】

【非特許文献】

【0005】

【文献】Junheng Hao et al “Universal Representation Learning of Knowledge Bases by Jointly Embedding Instances and Ontological Concepts”

【発明の概要】

【発明が解決しようとする課題】

【0006】

しかしながら、オントロジーのような階層関係をベクトル表現しようとすると、ユークリッド空間上で埋め込み手法の制約を満たすことができないという問題がある。すなわち、ユークリッド空間への埋め込みでは、ベクトルの配置に埋め込み手法の制約があるため、階層の深いオントロジーをベクトル表現するのが難しい。なお、オントロジーをユークリッド空間上に精度良く埋め込むためには、次元数を高くすれば良いが、次元数を抑える場合には、階層の深いオントロジーをベクトル表現するのが難しい。

【0007】

ここで、ユークリッド空間にオントロジーのような階層関係をうまく表現できないことを、図１１を参照して説明する。図１１は、ユークリッド空間にオントロジーの階層関係をうまく表現できないことを示す図である。図１１に示すように、ユークリッド空間にオントロジーの階層関係を埋め込もうとすると、階層が深くなる程、埋め込み手法の制約を満たさなくなるため、階層関係をうまく表現できない。すなわち、オントロジーの階層が深くなる程、ユークリッド空間を超える場合があるので、概念の上位下位関係がうまく表現できない。ここでは、「Ｃｉｔｙ」は「ＰｏｐｕｌａｔｅｄＰｌａｃｅ」の一種（is_a）であるという階層関係を表現できるが、「ＰｏｐｕｌａｔｅｄＰｌａｃｅ」は「Ｐｌａｃｅ」の一種（is_a）であるという階層関係をうまく表現できない。すなわち、「Ｐｌａｃｅ」は、ユークリッド空間上で埋め込み手法の制約を満たさないので、「ＰｏｐｕｌａｔｅｄＰｌａｃｅ」と「Ｐｌａｃｅ」との上位下位の階層関係をうまく表現できない。

【0008】

この結果、従来技術では、インスタンスとオントロジーを組み合わせて学習しても、精度の高いベクトル表現を実現できない。

【0009】

本発明は、１つの側面では、インスタンスとオントロジーそれぞれに精度の高いベクトル表現を実現することを目的とする。

【課題を解決するための手段】

【0010】

１つの態様では、学習方法は、ナレッジグラフにおけるインスタンス情報およびオントロジー情報のベクトル表現の学習方法であって、ユークリッド空間上における第１のインスタンス情報のベクトル表現を取得し、双曲空間上における第１のオントロジー情報のベクトル表現を取得し、前記第１のインスタンス情報の双曲空間への写像に基づいて、取得した前記第１のオントロジー情報のベクトル表現を変更した第２のオントロジー情報を生成し、前記第２のオントロジー情報のユークリッド空間への写像に基づいて、取得した前記第１のインスタンス情報のベクトル表現を変更した第２のインスタンス情報を生成し、前記第２のオントロジー情報と前記第２のインスタンス情報との対応関係を、リンク予測をするために学習する、処理をコンピュータが実行する。

【発明の効果】

【0011】

１実施態様によれば、インスタンスとオントロジーそれぞれに精度の高いベクトル表現を実現することができる。

【図面の簡単な説明】

【0012】

【図1】図１は、実施例に係る学習装置の構成を示す機能ブロック図である。

【図2】図２は、実施例に係るＲＤＦデータの一例を示す図である。

【図3】図３は、実施例に係るグラフ埋め込み処理の一例を示す図である。

【図4】図４は、実施例に係る変換処理の一例を示す図である。

【図5】図５は、実施例に係る対応関係学習処理の一例を示す図である。

【図6】図６は、実施例に係る予測処理の一例を示す図である。

【図7】図７は、実施例に係る学習処理のフローチャートの一例を示す図である。

【図8】図８は、実施例に係る予測処理のフローチャートの一例を示す図である。

【図9】図９は、学習プログラムを実行するコンピュータの一例を示す図である。

【図10】図１０は、ＲＤＦデータの参考例を示す図である。

【図11】図１１は、ユークリッド空間にオントロジーの階層関係をうまく表現できないことを示す図である。

【発明を実施するための形態】

【0013】

以下に、本願の開示する学習方法、学習装置および学習プログラムの実施例を図面に基づいて詳細に説明する。なお、本発明は、実施例により限定されるものではない。

【実施例】

【0014】

［学習装置の構成］
図１は、実施例に係る学習装置の構成を示す機能ブロック図である。学習装置１は、ＲＤＦのグラフ埋め込みにおいて、インスタンスをユークリッド空間に、オントロジーを双曲空間に、ベクトルを埋め込む。そして、学習装置１は、ユークリッド空間のインスタンスと双曲空間のオントロジーを関連付けるために、ユークリッド空間のベクトルと双曲空間のベクトルとの間の変換を学習する。

【0015】

学習装置１は、制御部１０と、記憶部２０とを有する。

【0016】

制御部１０は、ＣＰＵ（Central Processing Unit）などの電子回路に対応する。そして、制御部１０は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、これらによって種々の処理を実行する。制御部１０は、埋め込み部１１、変換部１２、対応関係学習部１３および予測部１４を有する。なお、対応関係学習部１３は、第１の生成部および第２の生成部の一例である。予測部１４は、出力部の一例である。

【0017】

記憶部２０は、例えば、ＲＡＭ、フラッシュメモリ（Flash Memory）などの半導体メモリ素子、または、ハードディスク、光ディスクなどの記憶装置である。記憶部２０は、ＲＤＦデータ２１および学習データ２２を有する。

【0018】

ＲＤＦデータ２１は、ウェブ上の情報のメタデータを記述するためのデータ構造を示す。ＲＤＦデータ２１には、インスタンス間の関係を表す３つ組の群と、上位下位関係を持つ概念の組の群と、インスタンスとタイプの対応関係の組の群とを有する。

【0019】

インスタンス間の関係を表す３つ組は、インスタンス、リンクおよびインスタンスの３つのデータを１組とする。言い換えれば、インスタンス間の関係を表す３つ組は、主語、述語、目的語の３つのデータを１組とする。そして、それぞれの組は、「主語の述語は目的語である」という関係性を持つ。上位下位関係を持つ概念の組は、上位概念と下位概念の２つのデータを１組とする。インスタンスとタイプの対応関係の組は、インスタンスのデータとタイプのデータを１組とする。ここでいうタイプは、概念に対応する。

【0020】

ここで、ＲＤＦデータ２１の一例を、図２を参照して説明する。図２は、実施例に係るＲＤＦデータの一例を示す図である。図２に示すように、インスタンス間の関係を表す３つ組は、インスタンス、リンクおよびインスタンスを対応付けて記憶する。概念の組は、上位概念および下位概念を対応付けて記憶する。インスタンスとタイプの対応関係の組は、インスタンスとタイプとを対応付けて記憶する。

【0021】

一例として、インスタンス間の関係を表す３つ組には、（インスタンス、リンク、インスタンス）として（“Ichiro”、“brother”、“Jiro”）が記憶されている。（“Ichiro”、“brother”、“Jiro”）は「“Ichiro”の“brother”は“Jiro”である」という関係性を持つ。また、（“Hanako”、“friend”、“Jiro”）が記憶されている。（“Hanako”、“friend”、“Jiro”）は「“Hanako”の“friend”は“Jiro”である」という関係性を持つ。また、（“Ichiro”、“birthplace”、“Kawasaki”）が記憶されている。（“Ichiro”、“birthplace”、“Kawasaki”）は「“Ichiro”の“birthplace”は“Kawasaki”である」という関係性を持つ。

【0022】

また、一例として、概念の組には、（上位概念、下位概念）として（“Place”、“City”）が記憶されている。また、（“Place”、“Park”）が記憶されている。また、（“Thing”、“Person”）が記憶されている。

【0023】

また、一例として、インスタンスとタイプの組には、（インスタンス、タイプ）として（“Kawasaki”、“Place”）が記憶されている。また、（“Hanako”、“Person”）が記憶されている。また、（“Jiro”、“Person”）が記憶されている。

【0024】

図１に戻って、学習データ２２は、ＲＤＦデータ２１を学習した結果のデータである。例えば、学習データ２２には、ＲＤＦデータ２１に含まれるインスタンス間の関係を表す３つ組、概念の組およびインスタンスとタイプの対応関係の組に含まれるそれぞれの文字列ごとの学習済みのベクトルの集合が含まれる。

【0025】

埋め込み部１１は、インスタンス情報をユークリッド空間にベクトル表現で埋め込む。例えば、埋め込み部１１は、インスタンス情報のベクトル表現の次元数をＮ次元とする。埋め込み部１１は、ＴｒａｎｓＥなどの埋め込みモデルにより、Ｎ次元の単位球内に、インスタンス情報をベクトル表現で配置する。一例として、埋め込み部１１は、ＲＤＦデータ２１に含まれるインスタンス間の関係を表すそれぞれの３つ組について、以下の処理を行う。すなわち、埋め込み部１１は、主語を示すインスタンスのベクトルに述語を示すリンクのベクトルを加えたベクトルが、目的語を示すインスタンスのベクトルに近づくようにベクトルの配置を学習する。そして、埋め込み部１１は、学習の結果を学習データ２２に保存する。学習データ２２には、インスタンス間の関係を表す３つ組のインスタンス、リンクおよびインスタンスのそれぞれのベクトルの集合が含まれる。

【0026】

また、埋め込み部１１は、オントロジー情報を双曲空間にベクトル表現で埋め込む。例えば、埋め込み部１１は、オントロジー情報のベクトル表現の次元数を、インスタンス情報のベクトル表現の次元数より低いＭ次元（Ｍ＜Ｎ）とする。埋め込み部１１は、双曲空間のモデルとしてＰｏｉｎｔａｒｅｂａｌｌを用いて、オントロジー情報の各概念をＭ次元の単位球内にベクトル表現で配置する。Ｐｏｉｎｃａｒｅｂａｌｌを用いるのは、勾配法でベクトル表現を最適化できるためである。一例として、埋め込み部１１は、双曲空間で、ＲＤＦデータ２１に含まれる概念の組の概念同士の距離が近づくようにベクトルの配置を学習する。これにより、埋め込み部１１は、Ｎ次元より低いＭ次元の空間であっても、ベクトルの配置に埋め込み手法の制約を受けないで、階層の深いオントロジーをベクトルで配置することができる。そして、埋め込み部１１は、学習の結果を学習データ２２に保存する。学習データ２２には、概念の組の上位概念、下位概念のそれぞれのベクトルの集合が含まれる。

【0027】

ここで、ｄ次元のＰｏｉｎｃａｒｅｂａｌｌモデルは、以下の式（１）で表わせる。なお、式（１）のＲ^ｄは、ｄ次元の球体であることを示す。ｘは、各概念のベクトル表現である。

【数1】

【0028】

また、Ｐｏｉｎｃａｒｅｂａｌｌ上の２点間の距離は、以下の式（２）のように定義される。式（２）では、ｕとｖの２点間の距離が定義されている。

【数2】

【0029】

なお、埋め込み部１１は、Ｐｏｉｎｃａｒｅｂａｌｌをオントロジーに適用する場合、上位と下位との関係を持つ概念同士の距離が短くなるようにＲｉｅｍａｎｎｉａｎＳＧＤという双曲空間で実行可能なＳＧＤで各概念のベクトルを計算すれば良い。

【0030】

変換部１２は、インスタンス情報を双曲空間へ写像する。例えば、変換部１２は、ランダムプロジェクションを利用して、距離関係をある程度保ったままＮ次元からＭ次元への次元削減を行う。但し、ここでいう距離関係とは、ユークリッド距離のことをいう。一例として、変換部１２は、インスタンスを双曲空間へ写像する行列Ｓを利用して、インスタンス情報を双曲空間へ写像する。行列Ｓは、［１，－１］の一様乱数を利用して生成したＮ×Ｍ行列である。

【0031】

また、変換部１２は、オントロジー情報をインスタンス空間へ写像する。例えば、変換部１２は、ランダムプロジェクションを利用して、距離関係をある程度保ったままＭ次元からＮ次元への次元拡張を行う。但し、ここでいう距離関係とは、ユークリッド距離のことをいう。一例として、変換部１２は、オントロジーをユークリッド空間へ写像する行列Ｒを利用して、オントロジー情報をユークリッド空間へ写像する。行列Ｒは、［１，－１］の一様乱数を利用して生成したＭ×Ｎ行列である。

【0032】

対応関係学習部１３は、インスタンスとオントロジーの対応関係のベクトルの配置を学習する。

【0033】

例えば、対応関係学習部１３は、ＲＤＦデータ２１に含まれるインスタンスとタイプの対応関係の組を取得する。対応関係学習部１３は、タイプのベクトルのユークリッド空間への写像に基づいて、インスタンスのベクトル表現を変更したインスタンス情報を生成する。一例として、対応関係学習部１３は、ユークリッド空間上で、インスタンスのベクトルを、対応関係のタイプの写像した後（変換後）のベクトルに近づくように更新する。

【0034】

また、対応関係学習部１３は、変更したインスタンスのベクトルの双曲空間への写像に基づいて、タイプのベクトル表現を変更したオントロジー情報を生成する。一例として、対応関係学習部１３は、双曲空間上で、タイプのベクトルを、更新されたインスタンスの写像した後（変換後）のベクトルに近づくように更新する。但し、オントロジーの空間は双曲空間なので、対応関係学習部１３は、写像した後（変換後）のインスタンスの原点からの距離を、対応関係のタイプの原点からの距離に揃える正規化を行ってから、原点を中心とした当該距離の半径を有する球面に沿ってタイプをインスタンスに近づくように更新する。正規化を行う理由は、原点からの距離は概念（タイプ）の階層の深さを表わしており、概念とインスタンスとの関係による影響を与えたくないからである。このため、対応関係学習部１３は、原点からの距離を保ちつつ近づけるようにする。

【0035】

また、対応関係学習部１３は、対応関係の学習の結果を学習データ２２に保存する。学習データ２２には、対応関係の組のインスタンス、タイプのそれぞれのベクトルの集合が含まれる。

【0036】

予測部１４は、学習済みのベクトルを用いて、入力された３つ組の中の１つの予測対象を予測する。例えば、予測部１４は、ユーザ端末２から入力された３つ組を受け取る。予測部１４は、学習データ２２に含まれる学習済みのベクトルの集合を用いて、受け付けた３つ組の中の１つの予測対象を、以下のように予測する。予測部１４は、学習済みのベクトルの集合から、受け付けた３つ組の中の１つの予測対象の文字列以外の２つの文字列に対応するベクトルを取得する。そして、予測部１４は、学習済みのベクトルの集合から１つずつベクトルを選択する。そして、予測部１４は、予測対象以外の文字列のベクトルおよび選択したベクトルを用いて、主語を示すインスタンスのベクトルに述語を示すリンクのベクトルを加えたベクトルから目的語を示すインスタンスのベクトルを引いたベクトルが予め定められたスコアより小さいベクトルを検索する。予測部１４は、検索できたベクトルに対応する文字列を予測対象として予測する。一例として、受け付けた３つ組が（ｅ１，ｒ，ｅ２）であり、リンク先のインスタンスを予測する場合には、ｅ２が予測対象となる。そこで、予測部１４は、ｅ１のベクトルＶ_ｅ１にｒのベクトルＶ_ｒを加えたベクトルから選択したベクトルＶ_ｅ２を引いたベクトルがスコアより小さくなるような選択したベクトルＶ_ｅ２を検索する。そして、予測部１４は、検索できた、選択したベクトルＶ_ｅ２に対応する文字列ｅ２を予測対象として予測する。なお、スコアは、ベクトルの許容誤差を示すものである。

【0037】

［グラフ埋め込み処理の一例］
図３は、実施例に係るグラフ埋め込み処理の一例を示す図である。図３に示すように、左図がインスタンスのユークリッド空間へのグラフ埋め込みである。右図がオントロジーの双曲空間へのグラフ埋め込みである。ユークリッド空間は、Ｎ次元である。双曲空間は、Ｎ次元より低いＭ次元である。

【0038】

埋め込み部１１は、ＴｒａｎｓＥなどの埋め込みモデルにより、Ｎ次元の単位球内に、各インスタンスをベクトル表現で配置する。ここでは、Ｎ次元の単位球内に、“ｊｉｒｏ”というインスタンス、“ｔａｒｏ”というインスタンス、“ｋａｗａｓａｋｉ”というインスタンスがそれぞれベクトル表現ｅ_ｊｉｒｏ、ｅ_ｔａｒｏ、ｅ_{ｋａｗａｓａｋｉ}で配置される。

【0039】

また、埋め込み部１１は、双曲空間のモデルとしてＰｏｉｎｃａｒｅｂａｌｌを用いて、オントロジーの各概念をＭ次元の単位球内にベクトル表現で配置する。ここでは、Ｍ次元の単位球内に、上位下位関係を持つ概念の組（“ｔｈｉｎｇ”、“ｐｅｒｓｏｎ”）、（“ｔｈｉｎｇ”、“ｐｌａｃｅ”）、（“ｐｌａｃｅ”、“ｃｉｔｙ”）がそれぞれベクトル表現ｃ_{ｔｈｉｎｇ}、ｃ_{ｐｅｒｓｏｎ}、ｃ_{ｐｌａｃｅ}、ｃ_ｃｉｔｙで配置される。

【0040】

［変換処理の一例］
図４は、実施例に係る変換処理の一例を示す図である。図４に示すように、変換部１２は、オントロジーを、Ｍ次元のオントロジーの双曲空間からＮ次元のインスタンスのユークリッド空間へ写像する。すなわち、変換部１２は、例えばランダムプロジェクションを利用して、距離関係をある程度保ったまま、オントロジーを、Ｍ次元のオントロジーの双曲空間からＮ次元のインスタンスのユークリッド空間へ次元拡張する。Ｒは、オントロジーをインスタンスのユークリッド空間へ写像する行列である。ここでは、“ｐｌａｃｅ”という概念のベクトルｃ_{ｐｌａｃｅ}が、ユークリッド空間へ写像され、ｃ‘_{ｐｌａｃｅ}というベクトルに変換されている。

【0041】

また、変換部１２は、インスタンスを、Ｎ次元のユークリッド空間からＭ次元のオントロジーの双曲空間へ写像する。すなわち、変換部１２は、例えばランダムプロジェクションを利用して、距離関係をある程度保ったまま、インスタンスを、Ｎ次元のインスタンスのユークリッド空間からＭ次元のオントロジーの双曲区間へ次元削減する。Ｓは、インスタンスをオントロジーの双曲空間へ写像する行列である。ここでは、“ｋａｗａｓａｋｉ”というインスタンスのベクトルｅ_{ｋａｗａｓａｋｉ}が、双曲空間へ写像され、ｅ‘_{ｋａｗａｓａｋｉ}というベクトルに変換されている。

【0042】

［対応関係学習処理の一例］
図５は、実施例に係る対応関係学習処理の一例を示す図である。図５に示すように、対応関係学習部１３は、インスタンスのユークリッド空間上で、インスタンスのベクトルを、対応関係のタイプの写像した後（変換後）のベクトルに近づくように更新する。ここでは、インスタンスとタイプの対応関係の組として（“ｋａｗａｓａｋｉ”，“ｐｌａｃｅ”）が取得されたとする。“ｋａｗａｓａｋｉ”というインスタンスのベクトルは、インスタンスのユークリッド空間上のｅ_{ｋａｗａｓａｋｉ}である。“ｐｌａｃｅ”という概念のベクトルは、オントロジーの双曲空間上のｃ_{ｐｌａｃｅ}である。対応関係学習部１３は、インスタンスのユークリッド空間上で、インスタンスのベクトルｅ_{ｋａｗａｓａｋｉ}を、対応関係のタイプのベクトルｃ_{ｐｌａｃｅ}を行列Ｒで写像した後（変換後）のベクトルｃ´_{ｐｌａｃｅ}に近づくように更新する。

【0043】

加えて、対応関係学習部１３は、オントロジーの双曲空間上で、タイプのベクトルを、更新されたインスタンスの写像した後（変換後）のベクトルに近づくように更新する。ここでは、対応関係学習部１３は、オントロジーの双曲空間上で、タイプのベクトルｃ_{ｐｌａｃｅ}を、ユークリッド空間上で更新されたインスタンスのベクトルｅ_{ｋａｗａｓａｋｉ}の写像した後（変換後）のベクトルｅ´_{ｋａｗａｓａｋｉ}に近づくように更新する。このとき、オントロジーの空間は双曲空間なので、対応関係学習部１３は、以下の処理を行う。対応関係学習部１３は、変換後のインスタンスｅ´_{ｋａｗａｓａｋｉ}の原点からの距離を、タイプｃ_{ｐｌａｃｅ}の原点からの距離に揃える正規化を行ってから、原点を中心とした球面に沿ってタイプｃ_{ｐｌａｃｅ}をインスタンスｅ´_{ｋａｗａｓａｋｉ}に近づくように更新する。具体的には、対応関係学習部１３は、変換後のｅ_{ｋａｗａｓａｋｉ}を行列Ｓで写像してｆ_Ｓ（ｅ_{ｋａｗａｓａｋｉ}）（＝ｅ´_{ｋａｗａｓａｋｉ}）を計算する。そして、対応関係学習部１３は、ｅ´_{ｋａｗａｓａｋｉ}の原点からの距離がｃ_{ｐｌａｃｅ}の原点からの距離と同じになるように、ｅ´_{ｋａｗａｓａｋｉ}を式（３）のように正規化する。そして、対応関係学習部１３は、ｃ_{ｐｌａｃｅ}を正規化後のｅ´_{ｋａｗａｓａｋｉ}に近づくように更新する。
（||ｃ_{ｐｌａｃｅ}||／||ｅ´_{ｋａｗａｓａｋｉ}||）×ｅ´_{ｋａｗａｓａｋｉ} ・・・式（３）

【0044】

［予測処理の一例］
図６は、実施例に係る予測処理の一例を示す図である。なお、図６では、上図に示した学習済みのベクトルの集合を保存した学習データ２２が利用されるものとする。

【0045】

ここでは、“Ｉｃｈｉｒｏ”の“ｂｒｏｔｈｅｒ”が何であるかの問い合わせ（“Ｉｃｈｉｒｏ”，“ｂｒｏｔｈｅｒ”，“？”）について説明する。「？」は、インスタンスの予測対象を示す予測変数を意味する。また、スコアは、例えば（０．５０，０．５０）とする。

【0046】

予測部１４は、学習済みのベクトルの集合から１つずつインスタンスのベクトルを選択する。そして、予測部１４は、予測対象以外の文字列のベクトルおよび選択したベクトルを用いて、インスタンスのベクトルにリンクのベクトルを加えたベクトルからインスタンスのベクトルを引いたベクトルがスコアより小さいベクトルを検索する。ここでは、予測部１４は、選択したベクトルごとに、インスタンスを示す“Ｉｃｈｉｒｏ”のベクトルｖ（Ｉｃｈｉｒｏ）にリンクを示す“ｂｒｏｔｈｅｒ”のベクトルｖ（ｂｒｏｔｈｅｒ）を加えたベクトルから、選択したベクトルを引いたベクトルを計算する。そして、予測部１４は、計算したベクトルがスコアより小さいベクトルになるかどうかを判定する。

【0047】

そして、予測部１４は、検索できたベクトルに対応する文字列を予測対象として予測する。ここでは、予測部１４は、ｖ（Ｉｃｈｉｒｏ）（＝（０．５０，０．５０））にｖ（ｂｒｏｔｈｅｒ）（＝（０．２０，０．２０））を加えたベクトルから、選択したｖ（Ｊｉｒｏ）（＝（０．７５，０．６０））を引いたベクトルを計算すると、（－０．０５，０．００）となる。したがって、予測部１４は、計算したベクトルがスコア（０．５０，０．５０）より小さいので、選択したｖ（Ｊｉｒｏ）に対応する“Ｊｉｒｏ”を予測対象として予測する。

【0048】

また、別の例として、“Ｈａｎａｋｏ”が“Ｉｃｈｉｒｏ”の何であるかの問い合わせ（“Ｈａｎａｋｏ”，“？”，“Ｉｃｈｉｒｏ”）について説明する。「？」は、インスタンスの予測対象を示す予測変数を意味する。また、スコアは、例えば（０．５０，０．５０）とする。

【0049】

予測部１４は、学習済みのベクトルの集合から１つずつリンクのベクトルを選択する。そして、予測部１４は、予測対象以外の文字列のベクトルおよび選択したベクトルを用いて、インスタンスのベクトルにリンクのベクトルを加えたベクトルからインスタンスのベクトルを引いたベクトルがスコアより小さいベクトルを検索する。ここでは、予測部１４は、選択したベクトルごとに、インスタンスを示す“Ｈａｎａｋｏ”のベクトルｖ（Ｈａｎａｋｏ）に選択したリンクのベクトルを加えたベクトルから、インスタンスを示す“Ｉｃｈｉｒｏ”のベクトルｖ（Ｉｃｈｉｒｏを引いたベクトルを計算する。そして、予測部１４は、計算したベクトルがスコアより小さいベクトルになるかどうかを判定する。

【0050】

そして、予測部１４は、検索できたベクトルに対応する文字列を予測対象として予測する。ここでは、予測部１４は、ｖ（Ｈａｎａｋｏ）（＝（０．２０，０．５０））に選択したｖ（ｓｉｓｔｅｒ）（＝（－０．２５，０．２０））を加えたベクトルから、ｖ（Ｉｃｈｉｒｏ）（＝（０．５０，０．５０））を引いたベクトルを計算すると、（－０．０５，０．２０）となる。したがって、予測部１４は、計算したベクトルがスコアより小さいので、選択したｖ（ｓｉｓｔｅｒ）に対応する“ｓｉｓｔｅｒ”を予測対象として予測する。

【0051】

［学習処理のフローチャート］
図７は、実施例に係る学習処理のフローチャートの一例を示す図である。なお、図７で用いられる「margin」は、スコアを示すハイパーパラメータのことをいう。

【0052】

埋め込み部１１は、全てのベクトルを乱数で初期化する（ステップＳ１１）。例えば、埋め込み部１１は、ＲＤＦデータ２１に含まれるインスタンス、リンク、概念に対する全てのベクトルを乱数で初期化する。また、変換部１２は、変換行列Ｒ，Ｓを［１，－１］の一様乱数で初期化する（ステップＳ１２）。なお、Ｒは、Ｍ×Ｎ行列である。Ｓは、Ｎ×Ｍ行列である。

【0053】

埋め込み部１１は、ＲＤＦデータ２１から、インスタンス間の関係を表す３つ組（ｅ１，ｒ，ｅ２）、上位下位関係を持つ概念の組（ｃ１，ｃ２）、インスタンスとそのタイプの組（ｅ３，ｃ３）を一組ずつ取り出す（ステップＳ１３）。なお、ｅ１，ｒ，ｅ２，ｅ３．ｃ１，ｃ２およびｃ３は、それぞれベクトルである。

【0054】

埋め込み部１１は、||ｅ１＋ｒ－ｅ２||がmarginより大きいか否かを判定する（ステップＳ１４）。||ｅ１＋ｒ－ｅ２||がmarginより大きいと判定した場合には（ステップＳ１４；Ｙｅｓ）、埋め込み部１１は、ｅ１＋ｒ－ｅ２が０に近づくようにｅ１，ｒ，ｅ２を更新する（ステップＳ１５）。すなわち、埋め込み部１１は、例えばＴｒａｎｓＥを用いて、主語を示すインスタンスのベクトルｅ１に述語を示すリンクのベクトルｒを加えたベクトルが、目的語を示すインスタンスのベクトルｅ２に近づくようにベクトルの配置を学習する。そして、埋め込み部１１は、ステップＳ１６に移行する。

【0055】

一方、||ｅ１＋ｒ－ｅ２||がmargin以下であると判定した場合には（ステップＳ１４；Ｎｏ）、埋め込み部１１は、ステップＳ１６に移行する。

【0056】

ステップＳ１６において、埋め込み部１１は、ｄ_ｐ（ｃ１，ｃ２）がmarginより大きいか否かを判定する（ステップＳ１６）。ｄ_ｐ（ｃ１，ｃ２）は、式（２）のｄ（ｕ，ｖ）を用いて計算すれば良い。ｄ_ｐ（ｃ１，ｃ２）がmarginより大きいと判定した場合には（ステップＳ１６；Ｙｅｓ）、埋め込み部１１は、ｄ_ｐ（ｃ１，ｃ２）が０に近づくようにｃ１，ｃ２を更新する（ステップＳ１７）。すなわち、埋め込み部１１は、双曲空間のモデルとして例えばＰｏｉｎｃａｒｅｂａｌｌを用いて、上位と下位との関係を持つ概念同士の距離が近づくようにベクトルの配置を学習する。そして、埋め込み部１１は、ステップＳ１８に移行する。

【0057】

一方、ｄ_ｐ（ｃ１，ｃ２）がmargin以下であると判定した場合には（ステップＳ１６；Ｎｏ）、埋め込み部１１は、ステップＳ１８に移行する。

【0058】

ステップＳ１８において、対応関係学習部１３は、||ｅ３－ｆ_Ｒ（ｃ３）||がmarginより大きいか否かを判定する（ステップＳ１８）。ｆ_Ｒ（ｃ３）は、変換部１２が行列Ｒを用いて概念ベクトルｃ３をユークリッド空間へ写像した結果を示すベクトルである。

【0059】

||ｅ３－ｆ_Ｒ（ｃ３）||がmarginより大きいと判定した場合には（ステップＳ１８；Ｙｅｓ）、対応関係学習部１３は、ｅ３－ｆ_Ｒ（ｃ３）が０に近づくようにｅ３を更新する（ステップＳ１９）。すなわち、対応関係学習部１３は、インスタンス空間上で、インスタンスのベクトルｅ３を、対応関係のタイプｃ３の写像した後（変換後）のベクトルｆ_Ｒ（ｃ３）に近づくように更新する。そして、対応関係学習部１３は、ステップＳ２０に移行する。

【0060】

一方、||ｅ３－ｆ_Ｒ（ｃ３）||がmargin以下であると判定した場合には（ステップＳ１８；Ｎｏ）、対応関係学習部１３は、ステップＳ２０に移行する。

【0061】

ステップＳ２０において、対応関係学習部１３は、ｄ_ｐ（ｃ３，（||ｃ３||／||ｆ_Ｓ（ｅ３）||））×ｆ_Ｓ（ｅ３））がmarginより大きいか否かを判定する（ステップＳ２０）。ｆ_Ｓ（ｅ３）は、変換部１２が行列Ｓを用いてインスタンスベクトルｅ３を双曲空間へ写像した結果を示すベクトルである。ｄ_ｐ（・・，・・）は、式（２）のｄ（ｕ，ｖ）を用いて計算すれば良い。

【0062】

ｄ_ｐ（ｃ３，（||ｃ３||／||ｆ_Ｓ（ｅ３）||））×ｆ_Ｓ（ｅ３））がmarginより大きいと判定した場合には（ステップＳ２０；Ｙｅｓ）、対応関係学習部１３は、ｄ_ｐ（ｃ３，（||ｃ３||／||ｆ_Ｓ（ｅ３）||））×ｆ_Ｓ（ｅ３））が０に近づくようにｃ３を更新する（ステップＳ２１）。すなわち、対応関係学習部１３は、双曲空間上で、タイプのベクトルｃ３を、更新したインスタンスの写像した後（変換後）のベクトル（||ｃ３||／||ｆ_Ｓ（ｅ３）||））×ｆ_Ｓ（ｅ３）に近づくように更新する。なお、（||ｃ３||／||ｆ_Ｓ（ｅ３）||））×ｆ_Ｓ（ｅ３）は、オントロジーの空間が双曲空間なので、変換後のインスタンスｆ_Ｓ（ｅ３）の原点からの距離を、対応関係のタイプｃ３の原点からの距離に揃える正規化を行った結果のベクトルである。正規化を行う理由は、双曲空間上の原点からの距離は概念（タイプ）の階層の深さを表わしており、概念とインスタンスとの関係による影響を与えたくないからである。そして、対応関係学習部１３は、ステップＳ２２に移行する。

【0063】

一方、ｄ_ｐ（ｃ３，（||ｃ３||／||ｆ_Ｓ（ｅ３）||））×ｆ_Ｓ（ｅ３））がmargin以下であると判定した場合には（ステップＳ２０；Ｎｏ）、対応関係学習部１３は、ステップＳ２２に移行する。

【0064】

ステップＳ２２において、埋め込み部１１は、ベクトルの更新がなくなった、または規定回数を繰り返したか否かを判定する（ステップＳ２２）。ベクトルの更新がなくなっていない、且つ規定回数を繰り返していないと判定した場合には（ステップＳ２２；Ｎｏ）、埋め込み部１１は、次の処理を行うべく、ステップＳ１３に移行する。

【0065】

一方、ベクトルの更新がなくなった、または規定回数を繰り返したと判定した場合には（ステップＳ２２；Ｙｅｓ）、埋め込み部１１は、学習処理を終了する。

【0066】

なお、実施例では、対応関係学習部１３は、||ｅ３－ｆ_Ｒ（ｃ３）||がmarginより大きい場合には、ｅ３－ｆ_Ｒ（ｃ３）が０に近づくようにｅ３を更新する。この後、対応関係学習部１３は、ｄ_ｐ（ｃ３，（||ｃ３||／||ｆ_Ｓ（更新後のｅ３）||））×ｆ_Ｓ（更新後のｅ３））がmarginより大きい場合には、ｄ_ｐ（ｃ３，（||ｃ３||／||ｆ_Ｓ（更新後のｅ３）||））×ｆ_Ｓ（更新後のｅ３））が０に近づくようにｃ３を更新すると説明した。しかしながら、対応関係学習部１３は、逆であっても良い。すなわち、対応関係学習部１３は、ｄ_ｐ（ｃ３，（||ｃ３||／||ｆ_Ｓ（ｅ３）||））×ｆ_Ｓ（ｅ３））がmarginより大きい場合には、ｄ_ｐ（ｃ３，（||ｃ３||／||ｆ_Ｓ（ｅ３）||））×ｆ_Ｓ（ｅ３））が０に近づくようにｃ３を更新する。この後、対応関係学習部１３は、||ｅ３－ｆ_Ｒ（更新後のｃ３）||がmarginより大きい場合には、ｅ３－ｆ_Ｒ（更新後のｃ３）が０に近づくようにｅ３を更新しても良い。

【0067】

［予測処理のフローチャート］
図８は、実施例に係る予測処理のフローチャートの一例を示す図である。なお、図８では、スコアを示すハイパーパラメータを「margin」とする。また、埋め込み部１１および対応関係学習部１３によって学習された学習データ２２が生成されたとする。学習データ２２には、インスタンス間の関係を表す３つ組の学習済みのベクトルの集合Ｖが含まれている。

【0068】

図８に示すように、予測部１４は、予測する予測対象を含む３つ組（ｅ１，ｒ，ｅ２）を取り出す（ステップＳ３１）。予測部１４は、予測対象がｅ１であるか否かを判定する（ステップＳ３２）。予測対象がｅ１であると判定した場合には（ステップＳ３２；Ｙｅｓ）、予測部１４は、学習済みのベクトルの集合ＶからベクトルＶ_ｒとＶ_ｅ２を取り出す（ステップＳ３３）。予測部１４は、Ｖからベクトルを１つ取り出す（ステップＳ３３Ａ）。そして、予測部１４は、Ｖから全てのベクトルを取り出したか否かを判定する（ステップＳ３４）。

【0069】

全てのベクトルを取り出していないと判定した場合には（ステップＳ３４；Ｎｏ）、予測部１４は、Ｖから取り出したベクトルをＶ_ｅ１として、｜Ｖ_ｅ２－Ｖ_ｒ－Ｖ_ｅ１｜がmarginより小さいか否かを判定する（ステップＳ３５）。なお、｜Ｖ_ｅ２－Ｖ_ｒ－Ｖ_ｅ１｜は、｜Ｖ_ｅ１＋Ｖ_ｒ－Ｖ_ｅ２｜と同義である。｜Ｖ_ｅ２－Ｖ_ｒ－Ｖ_ｅ１｜がmargin以上と判定した場合には（ステップＳ３５；Ｎｏ）、予測部１４は、次のベクトルを取り出すべく、ステップＳ３３Ａに移行する。

【0070】

一方、｜Ｖ_ｅ２－Ｖ_ｒ－Ｖ_ｅ１｜がmarginより小さいと判定した場合には（ステップＳ３５；Ｙｅｓ）、予測部１４は、Ｖ_ｅ１を予測対象として出力する（ステップＳ３６）。そして、予測部１４は、次のベクトルを取り出すべく、ステップＳ３３Ａに移行する。

【0071】

ステップＳ３４において、全てのベクトルを取り出したと判定した場合には（ステップＳ３４；Ｙｅｓ）、予測部１４は、予測処理を終了する。

【0072】

ステップＳ３２において、予測対象がｅ１でないと判定した場合には（ステップＳ３２；Ｎｏ）、予測部１４は、ステップＳ３７に移行する。

【0073】

ステップＳ３７において、予測部１４は、予測対象がｒであるか否かを判定する（ステップＳ３７）。予測対象がｒであると判定した場合には（ステップＳ３７；Ｙｅｓ）、予測部１４は、学習済みのベクトルの集合ＶからベクトルＶ_ｅ１とＶ_ｅ２を取り出す（ステップＳ３８）。予測部１４は、Ｖからベクトルを１つ取り出す（ステップＳ３８Ａ）。そして、予測部１４は、Ｖから全てのベクトルを取り出したか否かを判定する（ステップＳ３９）。

【0074】

全てのベクトルを取り出していないと判定した場合には（ステップＳ３９；Ｎｏ）、予測部１４は、Ｖから取り出したベクトルをＶ_ｒとして、｜Ｖ_ｅ２－Ｖ_ｒ－Ｖ_ｅ１｜がmarginより小さいか否かを判定する（ステップＳ４０）。｜Ｖ_ｅ２－Ｖ_ｒ－Ｖ_ｅ１｜がmargin以上であると判定した場合には（ステップＳ４０；Ｎｏ）、予測部１４は、次のベクトルを取り出すべく、ステップＳ３８Ａに移行する。

【0075】

一方、｜Ｖ_ｅ２－Ｖ_ｒ－Ｖ_ｅ１｜がmarginより小さいと判定した場合には（ステップＳ４０；Ｙｅｓ）、予測部１４は、Ｖ_ｒを予測対象として出力する（ステップＳ４１）。そして、予測部１４は、次のベクトルを取り出すべく、ステップＳ３８Ａに移行する。

【0076】

ステップＳ３９において、全てのベクトルを取り出したと判定した場合には（ステップＳ３９；Ｙｅｓ）、予測部１４は、予測処理を終了する。

【0077】

ステップＳ３７において、予測対象がｒでないと判定した場合には（ステップＳ３７；Ｎｏ）、予測部１４は、ステップＳ４２に移行する。

【0078】

ステップＳ４２において、予測部１４は、予測対象がｅ２であると判断し、学習済みのベクトルの集合ＶからベクトルＶ_ｅ１とＶ_ｒを取り出す（ステップＳ４２）。予測部１４は、Ｖからベクトルを１つ取り出す（ステップＳ４２Ａ）。そして、予測部１４は、Ｖから全てのベクトルを取り出したか否かを判定する（ステップＳ４３）。

【0079】

全てのベクトルを取り出していないと判定した場合には（ステップＳ４３；Ｎｏ）、予測部１４は、Ｖから取り出したベクトルをＶ_ｅ２として、｜Ｖ_ｅ２－Ｖ_ｒ－Ｖ_ｅ１｜がmarginより小さいか否かを判定する（ステップＳ４４）。｜Ｖ_ｅ２－Ｖ_ｒ－Ｖ_ｅ１｜がmargin以上であると判定した場合には（ステップＳ４４；Ｎｏ）、予測部１４は、次のベクトルを取り出すべく、ステップＳ４２Ａに移行する。

【0080】

一方、｜Ｖ_ｅ２－Ｖ_ｒ－Ｖ_ｅ１｜がmarginより小さいと判定した場合には（ステップＳ４４；Ｙｅｓ）、予測部１４は、Ｖ_ｅ２を予測対象として出力する（ステップＳ４５）。そして、予測部１４は、次のベクトルを取り出すべく、ステップＳ４２Ａに移行する。

【0081】

ステップＳ４３において、全てのベクトルを取り出したと判定した場合には（ステップＳ４３；Ｙｅｓ）、予測部１４は、予測処理を終了する。

【0082】

なお、実施例では、予測部１４が、学習済みのベクトルを用いて、入力された３つ組の中の１つの予測対象を予測すると説明した。しかしながら、予測部１４は、これに限定されず、学習済みのベクトルを用いて、入力された概念の組の中の１つの予測対象を予測しても良い。すなわち、予測部１４は、一方の概念に対応する他方の概念を予測しても良い。また、予測部１４は、学習済みのベクトルを用いて、入力されたインスタンスとタイプの対応関係の組の中の１つの予測対象を予測しても良い。すなわち、予測部１４は、インスタンスに対応する概念を予測しても良いし、概念に対応するインスタンスを予測しても良い。

【0083】

［実施例の効果］
上記実施例によれば、学習装置１は、ユークリッド空間上における第１のインスタンス情報のベクトル表現を取得する。学習装置１は、双曲空間上における第１のオントロジー情報のベクトル表現を取得する。学習装置１は、第１のインスタンス情報の双曲空間への写像に基づいて、取得した第１のオントロジー情報のベクトル表現を変更した第２のオントロジー情報を生成する。学習装置１は、第２のオントロジー情報のユークリッド空間への写像に基づいて、取得した第１のインスタンス情報のベクトル表現を変更した第２のインスタンス情報を生成する。学習装置１は、第２のオントロジー情報と第２のインスタンス情報との対応関係を、リンク予測をするために学習する。かかる構成によれば、学習装置１は、インスタンスとオントロジーそれぞれに精度の高いベクトル表現を生成することができる。すなわち、学習装置１は、双曲空間にオントロジーの階層関係を埋め込むことで、階層の深いオントロジーについても、概念の上位下位関係をうまく表現できるようになり、概念に対応するインスタンスも高い精度のベクトル表現を与えることができる。この結果、学習装置１は、精度の高いリンク予測をすることができる。

【0084】

また、上記実施例によれば、学習装置１は、第１のインスタンス情報のベクトル表現を、双曲空間からユークリッド空間へ写像後の第１のオントロジー情報のベクトル表現に近づけるように更新し、第２のインスタンス情報を生成する。かかる構成によれば、学習装置１は、インスタンスのベクトル表現を、双曲空間からユークリッド空間へ写像後のオントロジーのベクトル表現に近づけるようにすることで、ユークリッド空間に精度の良いインスタンスのベクトル表現を埋め込むことが可能となる。

【0085】

また、上記実施例によれば、学習装置１は、写像後の前記第１のインスタンス情報の原点からの距離を、前記第１のオントロジー情報の原点からの距離に揃える正規化を行う。学習装置１は、正規化を行った第１のインスタンス情報のベクトル表現に近づけるように更新し、第２のオントロジー情報を生成する。かかる構成によれば、学習装置１は、オントロジーを双曲空間にすることによる影響であって、オントロジーとインスタンスとの関係による影響を与えないように、原点からの距離を保ちつつ近づけることができる。

【0086】

また、上記実施例によれば、学習装置１は、第２のオントロジー情報のベクトル表現から算出された第２のインスタンス情報のベクトル表現を用いて、予測対象のインスタンス情報のリンク予測を行い、リンク予測の結果を出力する。かかる構成によれば、学習装置１は、精度の良いリンク予測をすることができる。

【0087】

［その他］
なお、図示した学習装置１の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、学習装置１の分散・統合の具体的態様は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、埋め込み部１１を、インスタンスをユークリッド空間に埋め込む埋め込み部と、概念を双曲空間に埋め込む埋め込み部とに分散しても良い。また、変換部１２を、インスタンスを双曲空間へ写像する変換部と、概念をユークリッド空間へ写像する変換部とに分散しても良い。また、埋め込み部１１と、変換部１２と、対応関係学習部１３とを１つの学習部として統合しても良い。また、記憶部２０を学習装置１の外部装置としてネットワーク経由で接続するようにしても良い。

【0088】

また、上記実施例では、学習装置１を、学習処理と予測処理とを含む構成として説明した。しかしながら、学習処理を行う学習装置と予測処理を行う予測装置とに分離する構成としても良い。

【0089】

また、上記実施例で説明した各種の処理は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図１に示した学習装置１と同様の機能を実現する学習プログラムを実行するコンピュータの一例を説明する。ここでは、学習装置１と同様の機能を実現する学習プログラムを一例として説明する。図９は、学習プログラムを実行するコンピュータの一例を示す図である。

【0090】

図９に示すように、コンピュータ２００は、各種演算処理を実行するＣＰＵ２０３と、ユーザからのデータの入力を受け付ける入力装置２１５と、表示装置２０９を制御する表示制御部２０７とを有する。また、コンピュータ２００は、記憶媒体からプログラムなどを読取るドライブ装置２１３と、ネットワークを介して他のコンピュータとの間でデータの授受を行う通信制御部２１７とを有する。また、コンピュータ２００は、各種情報を一時記憶するメモリ２０１と、ＨＤＤ（Hard Disk Drive）２０５を有する。そして、メモリ２０１、ＣＰＵ２０３、ＨＤＤ２０５、表示制御部２０７、ドライブ装置２１３、入力装置２１５、通信制御部２１７は、バス２１９で接続されている。

【0091】

ドライブ装置２１３は、例えばリムーバブルディスク２１０用の装置である。ＨＤＤ２０５は、学習プログラム２０５ａおよび学習処理関連情報２０５ｂを記憶する。

【0092】

ＣＰＵ２０３は、学習プログラム２０５ａを読み出して、メモリ２０１に展開し、プロセスとして実行する。かかるプロセスは、学習装置１の各機能部に対応する。学習処理関連情報２０５ｂは、ＲＤＦデータ２１および学習データ２２に対応する。そして、例えばリムーバブルディスク２１０が、学習プログラム２０５ａなどの各情報を記憶する。

【0093】

なお、学習プログラム２０５ａについては、必ずしも最初からＨＤＤ２０５に記憶させておかなくても良い。例えば、コンピュータ２００に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ（Compact Disk Read Only Memory）、ＤＶＤ（Digital Versatile Disk）、光磁気ディスク、ＩＣ（Integrated Circuit）カードなどの「可搬用の物理媒体」に当該プログラムを記憶させておく。そして、コンピュータ２００がこれらから学習プログラム２０５ａを読み出して実行するようにしても良い。

【符号の説明】

【0094】

１学習装置
１０制御部
１１埋め込み部
１２変換部
１３対応関係学習部
１４予測部
２０記憶部
２１ＲＤＦデータ
２２学習データ
２ユーザ端末

【図1】