(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-18
(45)【発行日】2023-05-26
(54)【発明の名称】エッジ特徴に依存するグラフ内関係で畳み込むグラフ変数推定モデル、装置及び方法
(51)【国際特許分類】
G06N 3/04 20230101AFI20230519BHJP
【FI】
G06N3/04 100
(21)【出願番号】P 2020055994
(22)【出願日】2020-03-26
【審査請求日】2022-01-18
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【氏名又は名称】早原 茂樹
(74)【代理人】
【識別番号】100141313
【氏名又は名称】辰巳 富彦
(72)【発明者】
【氏名】小西 達也
【審査官】渡辺 順哉
(56)【参考文献】
【文献】特開2021-140552(JP,A)
【文献】加藤暢之 ほか,所在地情報とGraph Convolutionによる賃貸物件価格推定の一手法,第12回データ工学と情報マネジメントに関するフォーラム,日本,データ工学研究専門委員会 日本データベース学会 データベースシステム研究会,2020年03月02日,[retrieved on 2022.11.29], Retrieved from the Internet: <URL: https://proceedings-of-deim.github.io/DEIM2020/papers/J2-1.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06Q 10/00-10/10
G06Q 30/00-30/08
G06Q 50/00-50/20
G06Q 50/26-99/00
(57)【特許請求の範囲】
【請求項1】
グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードの特徴を表すノード特徴量
と、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量とを畳み込んで、自身の特徴を表すノード特徴量を生成する
ことを特徴とするグラフ変数推定モデル。
【請求項2】
グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードの特徴を表すノード特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成
し、
当該グラフは、互いにコミュニケーションを行い得るノードとしての複数のコミュニケーション主体を含むグループを表現したものであり、当該グループには、当該コミュニケーションの状況によって決定される、当該グラフ内関係としての動的なサブグループが形成され、当該目的変数は、当該コミュニケーション主体が当該サブグループに属するか否かに影響され得る事象に係る値をとる変数である
ことを特徴とするグラフ変数推定モデル。
【請求項3】
当該中間層の各仮想ノードは、当該集合に含まれるグラフ内関係毎に、当該グラフ内関係についての畳み込み結果に対し、当該グラフ内関係について決定された又は学習された重みを付与して、自身の特徴を表すノード特徴量を生成することを特徴とする請求項1又は2に記載のグラフ変数推定モデル。
【請求項4】
前記複数の中間層の最後段からの出力を受け取り、当該グラフについて推定される当該目的変数に係る値を出力する目的変数推定層を更に有することを特徴とする請求項1から3のいずれか1項に記載のグラフ変数推定モデル。
【請求項5】
当該目的変数は、当該グラフのノードに係る目的変数、当該グラフのエッジに係る目的変数、及び当該グラフの全体又は一部に係る目的変数のうちの少なくとも1つであることを特徴とする請求項1から4のいずれか1項に記載のグラフ変数推定モデル。
【請求項6】
グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において、当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成する
ことを特徴とするグラフ変数推定モデル。
【請求項7】
請求項1から
6のいずれか1項に記載されたグラフ変数推定モデルを用いて、入力されたグラフ情報から、当該グラフ情報に係るグラフについて推定される目的変数に係る情報を出力することを特徴とするグラフ変数推定装置。
【請求項8】
グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルを用いた、コンピュータ
によって実施されるグラフ変数推定方法であって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係を設定するステップと、
当該中間層の各仮想ノードにおいて、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノー
ドの特徴を表すノード特徴量
と、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量とを畳み込み、当該各仮想ノードの特徴を表すノード特徴量を生成するステップと
を有することを特徴とするグラフ変数推定方法。
【請求項9】
グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルを用いた、コンピュータ
によって実施されるグラフ変数推定方法であって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係を設定するステップと、
当該中間層の各仮想ノードにおいて、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードについて、当該仮想ノードの特徴を表すノード特徴量を畳み込み、当該各仮想ノードの特徴を表すノード特徴量を生成するステップと
を有
し、
当該グラフは、互いにコミュニケーションを行い得るノードとしての複数のコミュニケーション主体を含むグループを表現したものであり、当該グループには、当該コミュニケーションの状況によって決定される、当該グラフ内関係としての動的なサブグループが形成され、当該目的変数は、当該コミュニケーション主体が当該サブグループに属するか否かに影響され得る事象に係る値をとる変数である
ことを特徴とするグラフ変数推定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、グラフの構造から当該グラフに係る情報を推定する技術に関する。
【背景技術】
【0002】
複数の構成員の集合としての組織においては、当該組織や当該構成員に関して発生し得る様々な事象を予測して、当該組織の管理・運営に役立てたいとのニーズが少なからず存在する。
【0003】
このようなニーズに応えた技術例として、例えば特許文献1には、会社等の従業員が所定の時期に休職するか否かを予測することができる休職予測システムが開示されている。このシステムは具体的に、従業員の勤務時間を含むデータと、従業員の休職の有無を示すデータとの関係を学習し、従業員が所定の時期に休職するリスクを予測する予測モデルを構築する予測モデル構築手段と、予測対象となる従業員の勤務時間を含むデータと予測モデルとに基づいて、予測対象となる従業員が所定の時期に休職するリスクを予測する予測手段とを備えている。
【0004】
一方で近年、画像認識や自然言語解析といったような分野で目覚ましい成果をあげてきた深層学習(ディープラーニング)をグラフ構造に適用し、当該グラフに係る情報を推定するGNN(Graph Neural Networks)の技術が、大きな進展をみせている。
【0005】
このGNNを用いれば、例えば組織をグラフに見立て、各構成員をその中のノードとし、さらにノード(構成員)間の関係をエッジで表現することによって、当該組織や当該構成員に関して発生し得る事象を、当該グラフに係る情報の推定問題として予測可能となるのである。
【0006】
また現在、このようなGNNの中でも、非特許文献1で提案されているR-GCN(Relational Graph Convolutional Networks)が大きな注目を集めている。このR-GCNは、グラフ内のノード間に複数の関係が存在する状況において、これらの関係毎にグラフの特徴量を畳み込み、グラフに係る情報の推定精度の向上を図ったアルゴリズムとなっている。
【先行技術文献】
【特許文献】
【0007】
【非特許文献】
【0008】
【文献】Michael Schlichtkrull, Thomas N. Kipf, Peter Bloem, Rianne van den Berg, Ivan Titov, Max Welling, “Modeling Relational Data with Graph Convolutional Networks”, European Semantic Web Conference (ESWC 2018): The Semantic Web, pp.593-607, 2018年
【発明の概要】
【発明が解決しようとする課題】
【0009】
上述した特許文献1に記載された技術は、個々の従業員の勤怠データから当該従業員の休職リスクを算出するものである。しかしながら、従業員の休職は、職場におけるメンタルヘルスの状況も遠因としており、個々の従業員の勤怠状況からだけではなく、当該従業員と上司・同僚・部下との関係や、さらには職場の雰囲気等からも大きな影響を受けることが知られている。したがって、特許文献1に記載された技術では、十分に高い精度の休職リスクの予測値を得ることは困難となっている。
【0010】
一方、このような問題に対し、上述したR-GCNを用いれば、組織(グラフ)における構成員(ノード)間の関係(エッジ)も推定処理に取り込むことができ、当該組織の実情に合致したより精度の高い推定処理を行える可能性がある。
【0011】
しかしながら、例えば従業員の休職問題にR-GCNを適用するにしても、組織(グラフ)の特徴量の集約・抽出は自明ではなく、さらに、例えば上司・同僚・部下との関係や職場の雰囲気等は通常、固定されたものではなく時間変化を起こす動的なものと考えられ、このような動的な関係を如何に取り込むかについては全くの未解決となっている。
【0012】
そこで、本発明は、グラフに内在するグラフ内関係をより確実に取り込んで、当該グラフに係る情報を推定することができるグラフ変数推定モデル、グラフ変数推定装置、及びグラフ変数推定方法を提供することを目的とする。
【課題を解決するための手段】
【0013】
本発明によれば、グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードの特徴を表すノード特徴量と、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量とを畳み込んで、自身の特徴を表すノード特徴量を生成する
ことを特徴とするグラフ変数推定モデルが提供される。
また、本発明によれば、
グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードの特徴を表すノード特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成し、
当該グラフは、互いにコミュニケーションを行い得るノードとしての複数のコミュニケーション主体を含むグループを表現したものであり、当該グループには、当該コミュニケーションの状況によって決定される、当該グラフ内関係としての動的なサブグループが形成され、当該目的変数は、当該コミュニケーション主体が当該サブグループに属するか否かに影響され得る事象に係る値をとる変数である
ことを特徴とするグラフ変数推定モデルが提供される。
【0015】
また、本発明によるグラフ変数推定モデルにおいて、当該中間層の各仮想ノードは、当該集合に含まれるグラフ内関係毎に、当該グラフ内関係についての畳み込み結果に対し、当該グラフ内関係について決定された又は学習された重みを付与して、自身の特徴を表すノード特徴量を生成することも好ましい。
【0016】
さらに、本発明によるグラフ変数推定モデルは、複数の中間層の最後段からの出力を受け取り、当該グラフについて推定される当該目的変数に係る値を出力する目的変数推定層を更に有することも好ましい。
【0017】
また、本発明によるグラフ変数推定モデルにおける、推定対象となる当該目的変数は、当該グラフのノードに係る目的変数、当該グラフのエッジに係る目的変数、及び当該グラフの全体又は一部に係る目的変数のうちの少なくとも1つであることも好ましい。
【0019】
本発明によれば、また、グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において、当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成する
ことを特徴とするグラフ変数推定モデルが提供される。
【0020】
本発明によれば、さらに、以上に述べたようなグラフ変数推定モデルを用いて、入力されたグラフ情報から、当該グラフ情報に係るグラフについて推定される目的変数に係る情報を出力することを特徴とするグラフ変数推定装置が提供される。
【0021】
本発明によれば、さらにまた、グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルを用いた、コンピュータによって実施されるグラフ変数推定方法であって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係を設定するステップと、
当該中間層の各仮想ノードにおいて、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードの特徴を表すノード特徴量と、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量とを畳み込み、当該各仮想ノードの特徴を表すノード特徴量を生成するステップと
を有するグラフ変数推定方法が提供される。
また、本発明によれば、グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルを用いた、コンピュータによって実施されるグラフ変数推定方法であって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係を設定するステップと、
当該中間層の各仮想ノードにおいて、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードについて、当該仮想ノードの特徴を表すノード特徴量を畳み込み、当該各仮想ノードの特徴を表すノード特徴量を生成するステップと
を有し、
当該グラフは、互いにコミュニケーションを行い得るノードとしての複数のコミュニケーション主体を含むグループを表現したものであり、当該グループには、当該コミュニケーションの状況によって決定される、当該グラフ内関係としての動的なサブグループが形成され、当該目的変数は、当該コミュニケーション主体が当該サブグループに属するか否かに影響され得る事象に係る値をとる変数である
ことを特徴とするグラフ変数推定方法が提供される。
【発明の効果】
【0022】
本発明のグラフ変数推定モデル、グラフ変数推定装置、及びグラフ変数推定方法によれば、グラフに内在するグラフ内関係をより確実に取り込んで、当該グラフに係る情報を推定することができる。
【図面の簡単な説明】
【0023】
【
図1】本発明によるグラフ変数推定モデルを用いてグラフ変数推定処理を実施するグラフ変数推定装置の一実施形態を示す模式図である。
【
図2】本発明に係る「動的グラフ内関係」の設定の一具体例を説明するための模式図である。
【発明を実施するための形態】
【0024】
以下、本発明の実施形態について、図面を用いて詳細に説明する。
【0025】
[グラフ変数推定装置,グラフ変数推定モデル]
図1は、本発明によるグラフ変数推定モデルを用いてグラフ変数推定処理を実施するグラフ変数推定装置の一実施形態を示す模式図である。
【0026】
図1に示した本実施形態のグラフ変数推定装置2は、複数の構成要素(例えば従業員)を含む所定のグループ(例えば会社A)における、
(a)個々の構成要素(従業員)に係る情報(例えば、従業員の属性情報や勤怠データ、さらにはこれらの値の平均や分散といったような統計量等)や、
(b)構成要素(従業員)間のコミュニケーション若しくは作用・結び付きに係る情報(例えば、従業員間でやり取りされるメールやチャットに係る量)
に基づき、
(c)構成要素(従業員)やグループ(会社A)に係る情報である目的変数(例えば、特定の従業員が将来のある時点又は期間で休職する確率である休職リスク)
を推定する装置となっている。
【0027】
より具体的に、このグラフ変数推定装置2では、グループ(会社A)をグラフに見立て、構成要素(従業員)をノードとし、さらに、構成要素(従業員)間のコミュニケーション若しくは作用・結び付きに係る情報をエッジで表現した上で、
上記(a)の情報を、ノードに係る特徴量(ノード特徴量)とし、
上記(b)の情報を、エッジに係る特徴量(エッジ特徴量)として、
グラフ変数推定モデル1を用いて、上記(c)の目的変数であるグラフ変数(休職リスク)を推定しているのである。
【0028】
ここで、このようなグラフ変数推定処理の要であるグラフ変数推定モデル1は、本実施形態においてGCN(Graph Convolutional Networks)アルゴリズムを用いて構築されたモデルであり、グラフ(グループ,会社)内に存在する「グラフ内関係」であって、ノード(構成要素,従業員)間のコミュニケーション若しくは作用・結び付きの状況(エッジ状態)に依存して動的に変化するような「動的グラフ内関係」を含む「グラフ内関係」毎に、上記の特徴量を畳み込んで、推定値としてのグラフ変数(目的変数,休職リスク)を出力するモデルとなっている。
【0029】
ちなみに上述したような、エッジ状態に依存して動的に変化する「動的グラフ内関係」は、グラフ(グループ,会社)内における、それに属するノード(構成要素,従業員)が動的に変化する動的サブグラフ(動的サブグループ)を規定するものとも解される。そうすると、推定値としてのグラフ変数(目的変数,休職リスク)は、コミュニケーション若しくは作用・結び付きの主体であるノード(構成要素,従業員)が、当該動的サブグラフ(動的サブグループ)に属するか否かにも影響される変数と捉えることもできるのである。
【0030】
同じく
図1において、グラフ変数推定モデル1はより具体的に、
(A)グラフに係るグラフ情報(例えばノード特徴量やエッジ特徴量)を入力とし、当該グラフのノードに対応する「仮想ノード」を有する複数の「中間層」において当該グラフ情報(ノード特徴量やエッジ特徴量)を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルとなっており、
(B)複数の「中間層」の各々における各「仮想ノード」は、設定された少なくとも1つの「動的グラフ内関係」を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の「中間層」における当該グラフ内関係に該当する「仮想ノード」の特徴を表すノード特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成する
ことを特徴としている。
【0031】
また、上記(B)の「動的グラフ内関係」は、後に
図2を用いて詳細に説明するが、
(C)当該グラフにおけるエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つ設定される
ものとなっている。このように「動的グラフ内関係」は、エッジ特徴量の値が変化してこの値の属する値範囲も変化するに伴い、「動的に」変化する関係となっているのである。
【0032】
例えば、会社Aの各従業員における将来の休職リスクを推定するケースにおいて、エッジ特徴量として例えば「(当該エッジで結ばれるノードとしての)従業員の間における所定単位期間での電子メールの本数」が規定されている場合に、「動的グラフ内関係」として例えば、
(a)「動的グラフ内関係r_1」:当該本数が10通未満である関係、
(b)「動的グラフ内関係r_2」:当該本数が10通以上であって20通未満である関係、
(c)「動的グラフ内関係r_3」:当該本数が20通以上である関係
を設定することができる。このような関係は、エッジ特徴量(電子メールの本数)によって自動的に算定されるものであり、且つ当該エッジ特徴量の変化に応じて例えば日々変化していく動的なものとなっている。
【0033】
ここで、グラフ変数推定モデル1に含まれる「中間層」における各従業員に相当する各「仮想ノード」は、上記(a)~(c)の「動的グラフ内関係」の各々について、各従業員と当該動的グラフ内関係にある他の従業員に相当する(前段の中間層の)「仮想ノード」のノード特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成する。
【0034】
このように、グラフ変数推定モデル1は、上述したような「動的グラフ内関係」を含むグラフ内関係をより確実に取り込むことにより、グラフ変数(目的変数,休職リスク)をより高い精度で推定することも可能にするのである。
【0035】
この点たしかに、上述した休職リスクを推定するケースにおいて、単に各従業員の勤怠データ(ノード特徴量)を考慮するだけではなく、上記(a)~(c)に示したような「動的グラフ内関係」、すなわち従業員同士のコミュニケーションの度合い・頻度で形成される動的な従業員のサブグループをも勘案することによって、より高い精度の休職リスク推定結果をもたらすことができると考えられる。しかしながら従来、このような「動的グラフ内関係」を適宜設定して推定モデルに取り込むことは困難であった。
【0036】
これに対し、グラフ変数推定モデル1は、上記(C)で規定されたように、各エッジにおけるエッジ特徴量の値に基づき「動的グラフ内関係」を自動設定可能としたことによって、当該「動的グラフ内関係」をも勘案したグラフ変数(目的変数,休職リスク)推定処理を実現したのである。これにより、グラフに内在する動的な関係も反映した、より精度の高いグラフ変数(目的変数,休職リスク)の推定値を得ることも可能となる。
【0037】
ちなみに、上記(C)の「動的グラフ内関係」はいわば、ノード間の関係性を表現したエッジ特徴量を離散化・量子化して、畳み込み処理を可能にしたものとも言える。このような工夫により、例えば上記の休職リスクを推定するケースでは、会社Aにおける上司、同僚や部下といった労務人事的知見とともに、これらの仕事上の各関係におけるコミュニケーションの度合い・頻度といったような、職場の活性化度や働き易さに関係する可変的な情報をも、休職リスク推定に取り込むことができるのである。
【0038】
またさらに、
図1に示したグラフ変数推定モデル1においては、その好適な実施形態として、
(D)複数の「中間層」の各々における各「仮想ノード」は、設定された少なくとも1つの「動的グラフ内関係」を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の「中間層」における当該グラフ内関係に該当する「仮想ノード」を結ぶ「仮想エッジ」の特徴を表すエッジ特徴量も畳み込んで、自身の特徴を表すノード特徴量を生成する
ことも好ましい。
【0039】
この場合、前段の「中間層」の「仮想ノード(の特徴量)」だけではなく、「仮想エッジ(の特徴量)」をも「動的グラフ内関係」に基づいて畳み込むので、動的に変化するコミュニケーション若しくは作用・結び付きの状況をも適宜、直接的に取り込むことができ、これにより、より精度の高いグラフ変数(目的変数,休職リスク)の推定処理を実施することが可能となる。
【0040】
なお上述したように、グラフ変数推定モデル1の上記構成は、当該モデルを実現する機械学習アルゴリズム、本実施形態ではGCNアルゴリズム、を具現したプログラムの構造を表現したものであるが、特に、本技術分野において先進的なR-GCN(Relational Graph Convolutional Networks)アルゴリズムに係るものとすることが好ましい。
【0041】
[モデル構成,装置構成,グラフ変数推定プログラム]
以下、グラフ変数推定モデル1及びグラフ変数推定装置2の構成・機能を詳細に説明する。このうちグラフ変数推定モデル1は、
図1に示したように、グラフ変数推定装置2に搭載された本発明によるグラフ変数推定プログラムに取り込まれてグラフ変数推定処理の主要ステップを実行可能にするモデルであり、その構成要素として、
(ア)グラフ特徴量抽出部10と、(イ)目的変数推定部11と
を有している。
【0042】
ここで最初に、上記(ア)のグラフ特徴量抽出部10へ入力されるグラフ情報である、「ノード特徴量」及び「エッジ特徴量」の説明を行う。
【0043】
「ノード特徴量」は、各ノードについて算出され、当該ノードに係るノード情報を特徴量成分とするベクトル量であり、例えばノードとして従業員を設定した場合、このノード情報として、
(a)従業員の性別、年齢、居住地や、勤続年数といったような属性情報、
(b)従業員の(所定期間における)勤務時間、残業時間、有給休暇取得日数、職制、休職履歴等のうちの少なくとも1つを含む勤怠データや、さらには、
(c)上記(a)や(b)の値における(所属の部署毎に又は会社A全体で計算した)平均や分散等の統計量
を採用することができる。また勿論、目的変数を従業員(ノード)毎の休職リスクとした場合において、休職という事象に関係する可能性のある従業員に係る他の情報も、ノード特徴量に採用することが可能である。
【0044】
次いで「エッジ特徴量」は、ノード間を接続する各エッジについて算出され、当該エッジに係るエッジ情報を特徴量成分とするベクトル量であり、例えばノードとして従業員を設定した場合、このエッジ情報として、
(d)従業員間でやり取りされる電子メールやチャット等による従業員同士のコミュニケーションに係る情報(例えば、(所定期間においてやり取りされる)メールやチャットの本数、メールやチャットに含まれる所定の単語の出現回数若しくは出現頻度、(ニューラルネットワーク等を用いた公知の特徴量化手法によって生成される)メールやチャットに含まれる文を埋め込み表現したベクトル、メールやチャットに対する絵文字リアクションの有無若しくはその数等)や、
(e)従業員の間における職制上の関係(例えば、上司と部下の関係、同僚の関係、同じ課に属する関係等)
を採用してもよい。また勿論、目的変数を従業員(ノード)毎の休職リスクとした場合において、休職という事象に関係する可能性のある従業員間の状態・事象に係る他の情報も、エッジ特徴量に採用することが可能である。
【0045】
次に、上記(ア)のグラフ特徴量抽出部10において、畳み込み処理の際に活用される(動的グラフ内関係を含む)「グラフ内関係」について説明する。
【0046】
グラフ内関係は、すでに説明した「動的グラフ内関係」と、それ以外の「静的グラフ内関係」とに分けられる。このうち「動的グラフ内関係」は、所定のエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つ設定される関係であり、エッジ特徴量の値が変化して、当該値の属する値範囲も変化するに伴い、動的に変化するものとなっている。
【0047】
例えばすでに説明した内容ではあるが、会社Aの各従業員における将来の休職リスクを推定するケースにおいて、エッジ特徴量として例えば「(当該エッジで結ばれるノードとしての)従業員の間における所定単位期間での電子メールの本数」が規定されている場合に、「動的グラフ内関係」として例えば、
(a)「動的グラフ内関係r_1」:当該本数が10通未満である関係、
(b)「動的グラフ内関係r_2」:当該本数が10通以上であって20通未満である関係、
(c)「動的グラフ内関係r_3」:当該本数が20通以上である関係
を設定することができるのである。
【0048】
ここで、上記(a)~(c)の「動的グラフ内関係」を決定するエッジ特徴量(電子メールの本数)は通常、日々又は刻々と変化する量であり、そのため、当該「動的グラフ内関係」も、当該エッジ特徴量の時間的な変化に応じて例えば日々又は刻々と変化していくものとなっている。
【0049】
また他の例として、エッジ特徴量を、「従業員の間における職制上の関係(例えば、上司と部下の関係、同僚の関係等)」とした場合、「動的グラフ内関係」として例えば、
(d)「動的グラフ内関係r_4」:当該職制上の関係を表す数値(エッジ特徴量の値)が、「上司と部下の関係」を示す数値(例えば"2")である関係、
(e)「動的グラフ内関係r_5」:当該職制上の関係を表す数値(エッジ特徴量の値)が、「同僚の関係」を示す数値(例えば"1")である関係
を設定することもできる。
【0050】
ここで、上記(d)及び(e)の「動的グラフ内関係」を決定するエッジ特徴量(職制上の関係)も、比較的長期となる期間でみれば変化し得る量であり、そのため、当該「動的グラフ内関係」も、当該エッジ特徴量の経時的な変化に応じて変化していくものとなっている。
【0051】
なお、「動的グラフ内関係」は、当該関係における影響を与える向き及びその影響の度合いをそれぞれ、エッジの向き及びその特徴量で表現した有向エッジによって(又は当該有向エッジも含めて)規定されるものであってもよい。例えば、上記(d)のような「上司と部下の関係」の場合に、「上司」のノードから「部下」のノードへの向きと、あるエッジ特徴量とを有する有向エッジによって、「(相手のノードに対し)自らが部下である」といったような「動的グラフ内関係」を規定することも可能となる。ここで、このような「動的グラフ内関係」を規定することによって、(後に詳細に説明するが、)仮想ノードのノード特徴量算出の際、例えばある部下にとって「上司」となる仮想ノードに関する特徴量を畳み込んで、当該上司が当該部下へ与える影響を確実に取り込むことも可能となるのである。ちなみに、このような有向エッジは、1つのノードのペアに対し、異なる向きやエッジ特徴量を有するものとして複数設定されてもよい。
【0052】
一方、「静的グラフ内関係」は、エッジ特徴量とはリンクしていない、「動的グラフ内関係」以外のグラフ内関係であり、例えば、静的な(時間変化しない)ノード特徴量の値に依存して設定される関係とすることができる。例えばノード特徴量を、「従業員の性別」とした場合、「静的グラフ内関係」として例えば、
(f)「静的グラフ内関係r_6」:従業員の性別(ノード特徴量の値)が「女性」(例えば"2")である関係、
(g)「静的グラフ内関係r_7」:従業員の性別(ノード特徴量の値)が「男性」(例えば"1")である関係
を設定することができる。
【0053】
さらに「静的グラフ内関係」として、例えば「従業員間における特定のレポートや論文の共同作成者(共著者)の関係」といったものを設定することも可能である。この場合、「従業員(作成者,著者)」と「レポート,論文」といったような異なる概念のものを結びつける静的な関係が設定されている、と捉えることができる。
【0054】
図2は、本発明に係る「動的グラフ内関係」の設定の一具体例を説明するための模式図である。
【0055】
図2に示した関係設定例によれば、動的グラフ内関係r_p,r_q,r_r,・・・が、ノードiとノードjとを結ぶエッジのエッジ特徴量e
i,jの値に依存して設定されている。具体的には、
(a)グラフ内関係r_p:エッジ特徴量e
i,jの値が、a以上であってb未満の値範囲内である関係、
(b)グラフ内関係r_q:エッジ特徴量e
i,jの値が、cである関係、
(c)グラフ内関係r_r:エッジ特徴量e
i,jの値が、d以上であってe未満の値範囲内である関係、
・・・
が設定されている。なお当然に、
図2に示した値a~eを含む数直線範囲は、エッジ特徴量e
i,jの取り得る値範囲となっている。
【0056】
ここで、各エッジにおいてエッジ特徴量e
i,jの値が変化すれば、それに伴って、
図2に模式的に示したグラフ構造における、動的グラフ内関係r_p,r_q,r_r,・・・の設定範囲や分布の様子も変化するのである。
【0057】
ちなみに、各エッジにおいてエッジ特徴量ei,jの値が時間的に変化しても、動的グラフ内関係r_p,r_q,r_r,・・・の設定範囲や分布の様子は変化しない状況、さらには、各エッジにおいてそもそもエッジ特徴量ei,jの値が変化しない状況もあり得るが、このような状況でも、動的グラフ内関係r_p,r_q,r_r,・・・は、エッジ特徴量に依存して変わり得るという意味で「動的」といえるのである。
【0058】
このように本実施形態において、「動的グラフ内関係」は、エッジ特徴量に係るハイパーパラメータとしての閾値によって自動的に規定される動的な関係性を表現したものとなっている。すなわち例えば、所定の知見に基づいて当該閾値を設定しさえすれば、「動的グラフ内関係」自体は、自動的に生成されてグラフ変数推定処理に組み込み可能となるのである。
【0059】
図1に戻って、(上記(ア)の)グラフ特徴量抽出部10は、以上に説明したようなグラフ情報(「ノード特徴量」や「エッジ特徴量」)を入力とし、「動的グラフ内関係」を含むグラフ内関係をもって当該グラフ情報を畳み込んで仮想グラフ特徴量を生成し、自らの後段に接続された目的変数推定部11へ当該仮想グラフ特徴量を出力する。
【0060】
より具体的にグラフ特徴量抽出部10は、本実施形態において、推定すべきグラフ変数(目的変数)に係るグラフにおける複数のノードにそれぞれ対応する複数の仮想ノードを有する中間層が、複数連結された構成を有している。
【0061】
ここで、中間層を示すインデックスをlとし、中間層内の仮想ノードを示すインデックスをiとして、中間層(l)内の仮想ノードiにおけるノード特徴量をhi
(l)と表現する。このようにノード特徴量を表現した場合、lは0~L(Lは(中間層数-1))の整数値をとり、iは1~N(Nは1つの中間層での仮想ノード数)の整数値をとることになる。ただし、最初の中間層(0)内の仮想ノードは、推定すべきグラフ変数(目的変数)に係るグラフのノードそのものであり、ノード特徴量hi
(0)は、当該グラフのノードのノード特徴量となる。なお中間層(0)は、このようなノード特徴量hi
(0)(やエッジ特徴量)を、(図示していない)入力層からそのまま受け取ることとしてもよく、または、入力層そのものであってもよい。
【0062】
また、「動的グラフ内関係」を含む、設定されたグラフ内関係の集合をRとし、集合Rに属するグラフ内関係をr(r∈R)とし、さらに、関係rにおいて仮想ノードiに隣接する(仮想ノードiとの間で関係rを有する)仮想ノードの集合をNi
rとし、集合Ni
rに属する仮想ノードを示すインデックスをj(j∈Ni
r)とすると、中間層(l+1)内の仮想ノードiにおけるノード特徴量hi
(l+1)は、次式
(1) hi
(l+1)=σ(ΣrΣjci,r
-1・Ar
(l)・hj
(l)+C(l)・hi
(l))
をもって算出される。
【0063】
ここで上式(1)において、lは0~(L-1)の整数値をとるものとする。また、σはランプ関数(ReLU)等の活性化関数であり、Σrは集合Rにおけるr(r∈R)についての総和(summation)であり、Σjは集合Ni
rにおけるノードj(j∈Ni
r)についての総和(summation)である。ちなみに、関係rは、中間層によらず所与のものとして固定されている。また、ci,rは関係rにおける仮想ノードiについての正規化定数であって、関係rにおける仮想ノードiの隣接ノード数とも解釈される値となっており、固定値又は学習可能な変数として設定される。さらに、Ar
(l)及びC(l)は、学習される内部パラメータ(行列)である。
【0064】
このように、中間層(l+1)の各仮想ノードiは、「動的グラフ内関係」を含むグラフ内関係の集合Rに含まれるグラフ内関係r毎に、前段の中間層(l)における当該グラフ内関係rに該当する仮想ノードjの特徴を表すノード特徴量hj
(l)を畳み込んで、自身の特徴を表すノード特徴量hi
(l+1)を生成している。すなわち、仮想ノードのノード特徴量を生成するにあたり、「動的グラフ内関係」を含めてグラフ内関係rを適切に取り込むことが可能となっているのである。
【0065】
また、上式(1)によるノード特徴量生成処理とは別の実施形態として、エッジ特徴量も合せて畳み込むノード特徴量生成処理を実施することも可能である。
【0066】
この場合、中間層(l)内の仮想ノードiと仮想ノードj(j∈Ni
r)とを結ぶ仮想エッジ(i,j)のエッジ特徴量を、ei,jと表現する。ここで、エッジ特徴量ei,jは本実施形態において、最初の中間層(0)を含め全ての中間層に関し同一の値をとるのであり、言い換えれば、当初、グラフ特徴量抽出部10に入力されたエッジ特徴量が、このエッジ特徴量ei,jとして各中間層に引き継がれていくのである。
【0067】
このようなエッジ特徴量ei,jも合せて畳み込む実施形態においては、中間層(l+1)内の仮想ノードiにおけるノード特徴量hi
(l+1)は、次式
(2) hi
(l+1)=σ(ΣrΣjci,r
-1・(Ar
(l)・hj
(l)+Br
(l)・ei,j)+C(l)・hi
(l))
をもって算出される。ここで、lは0~(L-1)の整数値をとるものとする。また、Br
(l)は、Ar
(l)やC(l)と同じく学習される内部パラメータ(行列)となっている。
【0068】
このように上式(2)を用いたノード特徴量生成処理においては、「動的グラフ内関係」を含むグラフ内関係の集合Rに含まれるグラフ内関係r毎に、前段の中間層(l)における当該グラフ内関係rに該当する仮想ノードiと仮想ノードjとを結ぶ、若しくは仮想ノードiから仮想ノードjへの向きも含めて両者を結ぶ仮想エッジ(i,j)のエッジ特徴量ei,j(本実施形態ではl値によらない一定のエッジ特徴量ei,j)も畳み込んで、ノード特徴量hi
(l+1)が生成されるのである。すなわちこの場合においても、仮想ノードのノード特徴量を生成するにあたり、「動的グラフ内関係」を含めてグラフ内関係rを適切に取り込むことが可能となっている。
【0069】
またさらに、上式(2)によるノード特徴量生成処理は、関係r(r∈R)での畳み込みにおいてエッジ特徴量ei,jも加味した分だけ、推定すべきグラフ変数(目的変数)に係るグラフの特徴を、より確実に抽出する処理となっているのである。
【0070】
また、上式(1)や上式(2)によるノード特徴量生成処理とはさらに異なる実施形態として、ノード特徴量は用いず、エッジ特徴量を畳み込むノード特徴量生成処理を実施することも可能である。この場合、中間層(l+1)内の仮想ノードiにおけるノード特徴量hi
(l+1)は、次式
(3) hi
(l+1)=σ(ΣrΣjci,r
-1・Br
(l)・ei,j+C(l)・hi
(l))
をもって算出される。ここで、lは0~(L-1)の整数値をとるものとする。
【0071】
このように上式(3)を用いたノード特徴量生成処理においては、「動的グラフ内関係」を含むグラフ内関係の集合Rに含まれるグラフ内関係r毎に、前段の中間層(l)における当該グラフ内関係rに該当する仮想ノードiと仮想ノードjとを結ぶ、若しくは仮想ノードiから仮想ノードjへの向きも含めて両者を結ぶ仮想エッジ(i,j)のエッジ特徴量ei,j(本実施形態ではl値によらない一定のエッジ特徴量ei,j)を畳み込んで、ノード特徴量hi
(l+1)が生成されるのである。すなわちこの場合においても、仮想ノードのノード特徴量を生成するにあたり、「動的グラフ内関係」を含めてグラフ内関係rを適切に取り込むことが可能となっている。
【0072】
以上、式(1)~(3)を用いて各中間層におけるノード特徴量生成処理に係る3つの実施形態を説明したが、いずれにしても、最後の中間層(L)で算出される最終的なノード特徴量:
h1
(L),h2
(L),・・・,hN
(L)
と、さらに必要であればエッジ特徴量ei,jとが、仮想グラフ特徴量として目的変数推定部11へ出力されるのである。
【0073】
ここで、上記の最終的なノード特徴量h1
(L),h2
(L),・・・,hN
(L)は、特徴量を算出する中間層(l+l)において、その前段となる中間層(l)における仮想グラフの状態を、(動的グラフ内関係に対応する)動的なサブグループを含むサブグラフ群の各々をもって(中間層(l+l)の各仮想ノードiへ向けて)集約するといった処理を、中間層(1)から順次、積み重ねて実施した結果と捉えることができる。
【0074】
また1つの例として、中間層(l+1)のノード特徴量hi
(l+1)は、lが0から順次大きくなるにつれ、その次元数(特徴量ベクトル成分数)がより小さくなるように設定されてもよい。例えば入力されるノード特徴量hi
(0)が100次元であるのに対し、最終的なノード特徴量hi
(L)を例えば10次元に縮約することができる。このような場合においても、グラフ特徴量抽出部10は、推定すべきグラフ変数(目的変数)に係るグラフの特徴を、低次元に縮約しつつ抽出するのであるが、この縮約処理の際、特徴量集約の条件として「動的グラフ内関係」を巧みに取り入れ可能とするのである。
【0075】
さらに、式(1)~(3)を用いた上記の3つの実施形態のいずれにおいても、中間層(l+1)内の各仮想ノードiは、集合Rに含まれるグラフ内関係r毎に、当該グラフ内関係rについての畳み込み結果に対し、当該グラフ内関係rについて決定された又は学習された重みci,r
-1(ci,rは正規化定数)を掛けて重み付けを行い、自身のノード特徴量hi
(l+1)を生成している。ここで、この重みci,r
-1を学習される値とすることによって、生成するノード特徴量hi
(l+1)に対する(動的グラフ内関係を含む)グラフ内関係rの寄与の程度を、適切に調整することも可能となるのである。
【0076】
例えば、エッジ特徴量として「従業員間における所定単位期間での電子メールの本数」が規定されていて、動的グラフ内関係r_1及び動的グラフ内関係r_2としてそれぞれ「当該本数が10通未満である関係」及び「当該本数が10通以上であって20通未満である関係」を設定した場合に、学習処理によって例えば、動的グラフ内関係r_1の重みci,r_1
-1が動的グラフ内関係r_2の重みci,r_2
-1よりも大きくなり、その結果、動的グラフ内関係r_1が、目的変数である休職リスクの推定により大きな影響を及ぼす、といったようなより好適なモデルを構築することも可能となるのである。
【0077】
ここで、式(1)~(3)を用いた上記の3つの実施形態の比較を行う。最初に、式(1)に係る実施形態においては、ノード特徴量hi
(l+1)の算出において、エッジ特徴量ei,jは、式(1)中に明示的には存在せず、「動的グラフ内関係」による畳み込みの形で大まかな(量子化された)特徴として取り込まれている。その結果、特徴量抽出処理の負担が低減し、さらに構築されたグラフ変数推定モデル1のオーバーフィッティングも、抑制又は回避可能となるのである。
【0078】
これに対し、式(2)に係る実施形態、及び式(3)に係る実施形態においては、ノード特徴量hi
(l+1)の算出において、エッジ特徴量ei,jは式(2)及び(3)中に明示的に存在している。その結果、エッジ特徴量ei,jは、「動的グラフ内関係」による畳み込みの形で大まかな(量子化された)特徴として取り込まれる一方で、自らの生の値をもって、抽出される特徴の調整も行っていると捉えることができる。その結果、グラフ特徴量抽出部10においてより好適な特徴量を抽出することも可能となり、最終的にグラフ変数の推定精度が向上することも期されるのである。
【0079】
同じく
図1において、(上記(イ)の)目的変数推定部11は、グラフ特徴量抽出部10から仮想グラフ特徴量を受け取り、グラフ変数(目的変数)を推定する。すなわち、グラフ特徴量抽出部10で生成された仮想グラフ特徴量を入力として、推定値としてのグラフ変数(目的変数)に係る値を出力する。
【0080】
具体的に目的変数推定部11は、例えば会社Aの各従業員における将来の休職リスクを推定するケースにおいて、例えばニューラルネットワークの全結合層で構成されており、出力層を構成する各ニューロンの出力値が、各従業員における休職リスク値(例えば0~1の間の値)となるように設定されていてもよい。
【0081】
ここで当然ではあるが、目的変数推定部11で推定される目的変数(グラフ変数)は、上記のケースにおける各従業員の休職リスク値のように、ノード単位の指標に係る変数に限定されるものではない。実際、グラフ情報(ノード特徴量やエッジ特徴量)を入力とするグラフ変数推定モデル1において推定可能な目的変数は、
(a)ノードに係る又はノード単位の指標:例えば、従業員の休職リスクや、SNS(Social Networking Service)ユーザのクリック率・コンバージョン率等、
(b)エッジに係る又はエッジ単位の指標:例えば、(各ウェブページをノードとするケースにおける)ウェブページ間の遷移確率や、(交差点や基点をノードとするケースにおける)エッジとしての道路の交通量等、
(c)グラフに係る又はグラフ単位の指標:例えば、会社全体の活性度指標や、(互いに結合している原子・分子・基等をノードとするケースにおける)生成化合物の特性等、
(d)グラフ内に形成される(当該グラフの一部としての)サブグラフに係る又はサブグラフ単位の指標:例えば、会社内の事業部毎の活性度指標等
との4つの種別に分類され、いずれの種別の目的変数も、推定対象として採用可能となっている。
【0082】
またいずれにしても、目的変数推定部11は、実行すべきタスク、すなわち推定すべき目的変数の態様に応じ、例えば公知の様々な機械学習アルゴリズムをもって構成可能なモデル部分となっているのである。
【0083】
さらにこの場合、所定のグラフ(例えば会社Aを表現するグラフ)について構築された1つのグラフ特徴量抽出部10に対し、当該グラフについての推定すべき目的変数に応じ、当該目的変数推定用の目的変数推定部11を接続してグラフ変数推定モデル1を構成することも可能である。例えば、当該グラフに関して汎用の(共通仕様の)グラフ特徴量抽出部10を準備しておけば、目的変数推定部11のラインアップの中から、推定すべき目的変数用の目的変数推定部11を選択して、グラフ変数推定モデル1を簡便に構築することも可能となるのである。この場合、グラフ特徴量抽出部10は、モデル構成の共通部分として高い汎用性を有するモデルモジュールとして機能するのである。
【0084】
次に同じく
図1を用いて、以上に説明したようなグラフ変数推定モデル1を搭載し、入力されたグラフ情報から、当該グラフ情報に係るグラフについての所定の目的変数を推定する(推定値としての当該目的変数に係る値を出力する)グラフ変数推定装置2について説明する。
【0085】
グラフ変数推定装置2は、入力部21と、学習部22と、グラフ変数推定部23と、出力部24とを備えており、このうち学習部22及びグラフ変数推定部23は、本発明によるグラフ変数推定プログラムの一実施形態を保存したプロセッサ・メモリの機能と捉えることができる。またこのことから、グラフ変数推定装置2は、グラフ変数推定の専用装置であってもよいが、本発明によるグラフ変数推定プログラムを搭載した、例えばクラウドサーバ、非クラウドのサーバ装置、パーソナル・コンピュータ(PC)、ノート型若しくはタブレット型コンピュータ、又はスマートフォン等とすることも可能である。
【0086】
同じく
図1において、グラフ変数推定装置2の入力部21は、通信機能を備えていて、例えば外部に設置されたサーバ(例えば社内の勤怠管理サーバ)のデータベースから、目的変数(例えば休職リスク)情報に係る正解ラベル(例えば休職の有無)の付されたグラフ情報(ノード特徴量やエッジ特徴量)を受信し、所定のデータ形式に変換した上で、学習部22に保存させる。また、入力部21は、例えばオペレータによって入力された、動的グラフ内関係を含むグラフ内関係の設定情報(例えば各動的グラフ内関係を規定する閾値の情報)も受け取り、学習部22へ出力する。
【0087】
学習部22は、
(a)受け取ったグラフ内関係の設定情報とエッジ特徴量とに基づいて、動的グラフ内関係を含むグラフ内関係を設定し、
(b)設定したグラフ内関係に基づき、自ら保存している正解ラベルの付されたグラフ情報群を用いて、グラフ変数推定モデル1を学習によって構築し、グラフ変数推定部23へ出力する。
【0088】
グラフ変数推定部23は、入力部21より受け取った、推定すべき目的変数(例えば休職リスク)に係るグラフ(例えば会社A)のグラフ情報(ノード特徴量やエッジ特徴量)を、学習部22から受け取った学習済みのグラフ変数推定モデル1へ入力し、その出力として、所望の目的変数の推定値(例えば各従業員の休職リスクに係る値)を取得して、出力部24へ出力する。
【0089】
出力部24は、受け取った目的変数推定値に係る情報を例えば、ディスプレイに表示させたり、(通信機能を備えている場合に)外部の情報処理装置に送信したりすることができる。ここで、表示・送信される目的変数推定値に係る情報は、例えば「従業員αについて、来年度休職するリスクは**%と低く、要サポートレベルを大きく下回っている」旨の情報となる。
【0090】
以上詳細に説明したように、本発明によるグラフ変数推定モデルは、動的グラフ内関係を含むグラフ内関係をより確実に取り込むことにより、目的変数としてのグラフ変数をより高い精度で推定することができる。
【0091】
ここで、動的グラフ内関係はいわば、ノード間の関係性を表現したエッジ特徴量を離散化・量子化して、畳み込み処理を可能にしたものであり、このような工夫によって、例えば上述したような会社の従業員の休職リスクを推定するケースにおいては、会社における上司、同僚や部下といった労務人事的知見とともに、これらの仕事上の各関係におけるコミュニケーションの度合い・頻度といったような、職場の活性化度や働き易さに関係する可変的な情報をも、休職リスク推定に取り込むことができるのである。
【0092】
また、本発明は特に、現在盛んに研究開発の進められているGNNの技術において、グラフに内在する上述したような動的グラフ内関係を、推定処理に取り込み可能とする手法を提示するものであり、グラフに係る目的変数の推定精度を向上させるだけでなく、その適用分野の拡大にも貢献するものと考えられる。
【0093】
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0094】
1 グラフ変数推定モデル
10 グラフ特徴量抽出部
11 目的変数推定部
2 グラフ変数推定装置
21 入力部
22 学習部
23 グラフ変数推定部
24 出力部