IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特許7496803対象間の関係の表現を生成可能な対象関係情報生成モデル、並びに対象関係推定装置及び方法
<>
  • 特許-対象間の関係の表現を生成可能な対象関係情報生成モデル、並びに対象関係推定装置及び方法 図1
  • 特許-対象間の関係の表現を生成可能な対象関係情報生成モデル、並びに対象関係推定装置及び方法 図2
  • 特許-対象間の関係の表現を生成可能な対象関係情報生成モデル、並びに対象関係推定装置及び方法 図3
  • 特許-対象間の関係の表現を生成可能な対象関係情報生成モデル、並びに対象関係推定装置及び方法 図4
  • 特許-対象間の関係の表現を生成可能な対象関係情報生成モデル、並びに対象関係推定装置及び方法 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-30
(45)【発行日】2024-06-07
(54)【発明の名称】対象間の関係の表現を生成可能な対象関係情報生成モデル、並びに対象関係推定装置及び方法
(51)【国際特許分類】
   G06N 3/08 20230101AFI20240531BHJP
   G06Q 50/10 20120101ALI20240531BHJP
   G06N 3/044 20230101ALI20240531BHJP
【FI】
G06N3/08
G06Q50/10
G06N3/044
【請求項の数】 11
(21)【出願番号】P 2021144005
(22)【出願日】2021-09-03
(65)【公開番号】P2023037332
(43)【公開日】2023-03-15
【審査請求日】2023-07-14
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(74)【代理人】
【識別番号】100141313
【弁理士】
【氏名又は名称】辰巳 富彦
(72)【発明者】
【氏名】石川 雄一
(72)【発明者】
【氏名】小林 亮博
(72)【発明者】
【氏名】栗木 優一
【審査官】福西 章人
(56)【参考文献】
【文献】国際公開第2019/049491(WO,A1)
【文献】特開2016-091535(JP,A)
【文献】新崎 誠ほか,Long short-term memoryを用いた人物グループ属性推定の検討,電子情報通信学会技術研究報告 Vol.117 No.514,日本,2018年03月11日,pp.195-200
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06Q 50/10
(57)【特許請求の範囲】
【請求項1】
各対象の行動に係る情報から、当該対象間の関係を推定するコンピュータを機能させる対象関係情報生成モデルであって、
当該対象毎に設定された対象ユニットであって、当該対象の行動に係る情報である対象行動情報を受け取り、前の時点で自ら生成した隠れ状態情報である自隠れ状態情報に対し当該対象行動情報を反映させて、新たな自隠れ状態情報を生成する回帰ニューラルネットワーク(RNN)セルを有する対象ユニットとしてコンピュータを機能させ、
少なくとも1つの当該対象ユニットは、
当該対象と他の対象との組を識別する識別情報から、当該組内の関係を表現する情報である対象関係表現情報であって当該関係の推定結果として捉えられる対象関係表現情報を生成する、当該RNNセルと合わせて訓練される対象関係表現生成部と、
当該他の対象に係る当該対象ユニットから前の時点で出力された隠れ状態情報である他隠れ状態情報を受け取り、当該他隠れ状態情報に対し、当該対象関係表現情報を反映させて調整を行い、調整済み他隠れ状態情報を生成する他隠れ状態調整部と
を更に有し、
前記少なくとも1つの当該対象ユニットの当該RNNセルは、当該自隠れ状態情報に対し当該調整済み他隠れ状態情報も反映させて、当該新たな自隠れ状態情報を生成する
ことを特徴とする対象関係情報生成モデル。
【請求項2】
当該識別情報は、当該他の対象から当該対象への向きの情報も含む他自識別情報であって、当該対象関係表現情報は、当該他の対象から当該対象への向きの関係性を表現する情報である、又は
当該識別情報は、当該他自識別情報と、当該対象から当該他の対象への向きの情報も含む自他識別情報とを含み、当該対象関係表現情報は、当該対象と当該他の対象との相互の関係性を表現する情報である
ことを特徴とする請求項1に記載の対象関係情報生成モデル。
【請求項3】
前記他隠れ状態調整部は、自らを含む当該対象ユニットに係る当該RNNセルが当該対象行動情報を受け取った際、当該他の対象に係る当該対象ユニットに係る当該RNNセルにおいて最近に生成された又は生成された直後の当該他隠れ状態情報を受け取り、当該調整済み他隠れ状態情報を生成することを特徴とする請求項1又は2に記載の対象関係情報生成モデル。
【請求項4】
前記他隠れ状態調整部は、自らを含まない他の当該対象ユニットに係る当該RNNセルが当該対象行動情報を受け取った際、該他の当該対象ユニットに係る当該RNNセルにおいて生成された直後の当該他隠れ状態情報を受け取って、当該調整済み他隠れ状態情報を生成し、
前記他隠れ状態調整部から当該調整済み他隠れ状態情報を受け取った当該RNNセルは、当該対象行動情報を受け取っていない場合に、当該行動がない状態に対応するダミー行動情報を代わりに受け取って、新たな当該自隠れ状態情報を生成する
ことを特徴とする請求項1から3のいずれか1項に記載の対象関係情報生成モデル。
【請求項5】
前記少なくとも1つの当該対象ユニットの当該RNNセルは、当該対象行動情報を受け取った際、自らを含まない他の当該対象ユニットに係る当該RNNセルから、最後に受け取った当該他隠れ状態情報よりも新しい、当該対象行動情報の反映された当該他隠れ状態情報が出力されていない場合に、当該他隠れ状態情報がない状態に対応するダミー他隠れ状態情報を代わりに入力として、新たな当該自隠れ状態情報を生成することを特徴とする請求項1から4のいずれか1項に記載の対象関係情報生成モデル。
【請求項6】
前記他隠れ状態調整部は、当該対象関係表現情報と当該他隠れ状態情報との間で次元数が異なっている場合に当該次元数を揃えた上で、当該他隠れ状態情報の各要素に対し、当該対象関係表現情報における対応する規格化された要素を積算することによって、当該調整済み他隠れ状態情報を生成することを特徴とする請求項1から5のいずれか1項に記載の対象関係情報生成モデル。
【請求項7】
当該対象行動情報は、当該対象の発話に係る発話内容表現情報であり、当該対象関係表現情報は、当該対象と他の対象との会話内容に基づく、当該対象と当該他の対象との関係の推定結果として捉えられることを特徴とする請求項1から6のいずれか1項に記載の対象関係情報生成モデル。
【請求項8】
前記対象関係表現生成部は、生成した当該対象関係表現情報を、当該行動に基づく当該対象と当該他の対象との関係の推定結果として出力することを特徴とする請求項1から7のいずれか1項に記載の対象関係情報生成モデル。
【請求項9】
当該RNNセルは、新たな当該隠れ状態情報を生成するべくセルに入力される情報に対し所定の処理を施す忘却ゲート、更新ゲート、リセットゲート、入力ゲート及び出力ゲートのうちの少なくとも1つを備えていることを特徴とする請求項1から8のいずれか1項に記載の対象関係情報生成モデル。
【請求項10】
請求項1から9のいずれか1項に記載の対象関係情報生成モデルを訓練して得られた学習済みの前記対象関係表現生成部を用いて、当該対象と当該他の対象との関係に係る情報を推定し、出力することを特徴とする対象関係推定装置。
【請求項11】
請求項1から9のいずれか1項に記載の対象関係情報生成モデルに対し訓練を行い、
当該訓練によって得られた学習済みの前記対象関係表現生成部を用いて、当該対象と当該他の対象との関係に係る情報を推定し、出力する
ことを特徴とする、コンピュータによって実施される対象関係推定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、人間関係といったような対象間の関係を定量化する技術に関する。
【背景技術】
【0002】
近年、各種商品・サービスの提供分野において、アイテムレコメンドや広告ターゲティング等を推進させるべく、ユーザの行動を予測する技術の開発が盛んに進められている。ここで従来、ユーザの行動予測は主に、ユーザ自身の行動ログから行動パターンを抽出し、この行動パターンを訓練済みの予測モデルへ取り込むことによって実施されてきた。
【0003】
例えば非特許文献1には、ユーザの過去の行動に係る時系列データによって再帰型ニューラルネットワーク(Recurrent Neural Network,RNN)を訓練・構築し、RNNによってユーザの行動予測を実施する技術が開示されている。このRNNを用いた技術においては、ユーザ自身の過去の行動パターンが抽出され、この行動パターンが順次、予測時点毎の行動予測に使用される。また、このRNNは複数のユーザの行動ログをもって訓練されているので、結果的に、行動パターンの類似する他のユーザの行動パターンも行動予測の際に考慮されるものとなっている。
【0004】
さらに、この非特許文献1に記載された技術では、RNNの訓練課程においてユーザの特性・属性の分散表現も学習可能となっている。この特性・属性の分散表現は、ユーザの特性・属性が反映された多次元ベクトルとして取得される。ここで、互いに特性・属性が類似するユーザの分散表現は、互いに類似するものとなるのである(例えばコサイン類似度が高かったり、ユークリッド距離が短かったりする)。例えば、RNNに映画の視聴履歴ログが入力された場合、この特性・属性の分散表現にはユーザの映画の好みが反映され、また、音楽の再生履歴ログが入力された場合、そこにはユーザの音楽の好みが反映されることになる。
【先行技術文献】
【非特許文献】
【0005】
【文献】Donkers, T., Loepp, B., & Ziegler, J., "Sequential user-based recurrent neural network recommendations", RecSys'17 - Proceedings of the 11th ACM Conference on Recommender Systems, pp. 152-160, 2017年, <https://doi.org/10.1145/3109859.3109877>
【発明の概要】
【発明が解決しようとする課題】
【0006】
以上述べたような、ユーザの過去の行動ログに基づき行動予測を実施する技術は従来、数多く検討されてきた。また上述したように、属性等の類似するユーザの行動ログも利用して予測モデルの訓練を行い、行動予測の精度を維持・向上させることも行われてきた。
【0007】
ここで現実の人間社会を鑑みると、ユーザの行動は、何らかの関係にある他のユーザの行動から影響を受けることが少なくない。例えばユーザが、身近な友人の視聴している音楽や動画の影響を受けて自ら再生・視聴する音楽や動画を選択したり、 同僚や上司の影響を受けて読む本を選んだり、著名人やいわゆるインフルエンサーが身に着けている服飾品の影響を受けてファッションアイテムを選択したりすることは、日常的にみられるのである。
【0008】
しかしながら、非特許文献1に記載された上記の技術を含め、従来の技術では、所定の人間関係にある他のユーザの行動に係る情報も用いて、予測対象のユーザの行動を予測することは何ら行われてこなかった。そもそも従来、用いるべき他のユーザの行動に係る情報を規定する(この他のユーザと予測対象のユーザとの)人間関係に係る情報を、予測モデルに取り込むこと自体何らなされておらず、想定すらされてこなかった。
【0009】
これに対し、所定の人間関係にある他のユーザの行動から受ける影響も考慮して行動予測を実施することができれば、現実の人間社会での実情が反映可能となるので、行動予測の精度が大幅に向上することが期待される。ここで本願発明者等は、そのためには、他のユーザと予測対象のユーザとの人間関係に係る情報を、予測モデル(機械学習アルゴリズム)が理解可能な表現形式にしなければならないと考えた。また、このような予測モデルが取り込み可能な人間関係に係る情報を創作できれば、その情報は、人間関係にかかわる分野における行動予測以外の用途にも利用することができるとも考えた。
【0010】
そこで、本発明は、(人間といったような)対象の間の関係の表現を生成可能な対象関係情報生成モデルを提供することを目的とする。また、生成した当該表現を用いて対象関係に係る情報を推定することの可能な対象関係推定装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明によれば、各対象の行動に係る情報から、当該対象間の関係を推定するコンピュータを機能させる対象関係情報生成モデルであって、
当該対象毎に設定された対象ユニットであって、当該対象の行動に係る情報である対象行動情報を受け取り、前の時点で自ら生成した隠れ状態情報である自隠れ状態情報に対し当該対象行動情報を反映させて、新たな自隠れ状態情報を生成する回帰ニューラルネットワーク(RNN)セルを有する対象ユニットとしてコンピュータを機能させ、
少なくとも1つの当該対象ユニットは、
当該対象と他の対象との組を識別する識別情報から、当該組内の関係を表現する情報である対象関係表現情報であって当該関係の推定結果として捉えられる対象関係表現情報を生成する、当該RNNセルと合わせて訓練される対象関係表現生成部と、
当該他の対象に係る当該対象ユニットから前の時点で出力された隠れ状態情報である他隠れ状態情報を受け取り、当該他隠れ状態情報に対し、当該対象関係表現情報を反映させて調整を行い、調整済み他隠れ状態情報を生成する他隠れ状態調整部と
を更に有し、
上記の少なくとも1つの当該対象ユニットの当該RNNセルは、当該自隠れ状態情報に対し当該調整済み他隠れ状態情報も反映させて、当該新たな自隠れ状態情報を生成する
ことを特徴とする対象関係情報生成モデルが提供される。
【0012】
この本発明による対象関係情報生成モデルにおいて、(a)当該識別情報は、当該他の対象から当該対象への向きの情報も含む他自識別情報であって、当該対象関係表現情報は、当該他の対象から当該対象への向きの関係性を表現する情報である、又は(b)当該識別情報は、当該他自識別情報と、当該対象から当該他の対象への向きの情報も含む自他識別情報とを含み、当該対象関係表現情報は、当該対象と当該他の対象との相互の関係性を表現する情報であることも好ましい。
【0013】
また、本発明による対象関係情報生成モデルにおける他隠れ状態調整部は、自らを含む当該対象ユニットに係る当該RNNセルが当該対象行動情報を受け取った際、当該他の対象に係る当該対象ユニットに係る当該RNNセルにおいて最近に生成された又は生成された直後の当該他隠れ状態情報を受け取り、当該調整済み他隠れ状態情報を生成することも好ましい。
【0014】
さらに、本発明による対象関係情報生成モデルにおける一実施形態として、
他隠れ状態調整部は、自らを含まない他の当該対象ユニットに係る当該RNNセルが当該対象行動情報を受け取った際、該他の当該対象ユニットに係る当該RNNセルにおいて生成された直後の当該他隠れ状態情報を受け取って、当該調整済み他隠れ状態情報を生成し、
他隠れ状態調整部から当該調整済み他隠れ状態情報を受け取った当該RNNセルは、当該対象行動情報を受け取っていない場合に、当該行動がない状態に対応するダミー行動情報を代わりに受け取って、新たな当該自隠れ状態情報を生成する
ことも好ましい。
【0015】
また、本発明による対象関係情報生成モデルにおける他の実施形態として、少なくとも1つの当該対象ユニットの当該RNNセルは、当該対象行動情報を受け取った際、自らを含まない他の当該対象ユニットに係る当該RNNセルから、最後に受け取った当該他隠れ状態情報よりも新しい、当該対象行動情報の反映された当該他隠れ状態情報が出力されていない場合に、当該他隠れ状態情報がない状態に対応するダミー他隠れ状態情報を代わりに入力として、新たな当該自隠れ状態情報を生成することも好ましい。
【0016】
さらに、本発明に係る他隠れ状態調整部についての一実施形態として、当該他隠れ状態調整部は、当該対象関係表現情報と当該他隠れ状態情報との間で次元数が異なっている場合に当該次元数を揃えた上で、当該他隠れ状態情報の各要素に対し、当該対象関係表現情報における対応する規格化された要素を積算することによって、当該調整済み他隠れ状態情報を生成することも好ましい。
【0017】
また、本発明による対象関係情報生成モデルの一適用例として、当該対象行動情報は、当該対象の発話に係る発話内容表現情報であり、当該対象関係表現情報は、当該対象と他の対象との会話内容に基づく、当該対象と当該他の対象との関係の推定結果として捉えられることも好ましい。
【0018】
さらに、本発明による対象関係情報生成モデルにおいて、対象関係表現生成部は、生成した当該対象関係表現情報を、当該行動に基づく当該対象と当該他の対象との関係の推定結果として出力することも好ましい。
【0019】
また、本発明に係るRNNセルについての一実施形態として、当該RNNセルは、新たな当該隠れ状態情報を生成するべくセルに入力される情報に対し所定の処理を施す忘却ゲート、更新ゲート、リセットゲート、入力ゲート及び出力ゲートのうちの少なくとも1つを備えていることも好ましい。
【0020】
本発明によれば、また、以上に述べた対象関係情報生成モデルを訓練して得られた学習済みの対象関係表現生成部を用いて、当該対象と当該他の対象との関係に係る情報を推定し、出力する対象関係推定装置が提供される。
【0021】
本発明によれば、さらに、以上に述べた対象関係情報生成モデルに対し訓練を行い、
当該訓練によって得られた学習済みの対象関係表現生成部を用いて、当該対象と当該他の対象との関係に係る情報を推定し、出力する
ことを特徴とする、コンピュータによって実施される対象関係推定方法が提供される。
【発明の効果】
【0022】
本発明の対象関係情報生成モデルによれば、(人間といったような)対象の間の関係の表現を生成することができる。また、本発明の対象関係推定装置及び方法によれば、生成した当該表現を用いて対象関係に係る情報を推定することが可能となる。
【図面の簡単な説明】
【0023】
図1】本発明による対象関係情報生成モデルの一実施形態を示す模式図である。
図2】本発明に係る他隠れ状態調整部及びRNNセルにおける内部構成の一実施形態を説明するための機能ブロック図である。
図3】本発明による対象関係情報生成モデルにおける他の実施形態を示す模式図である。
図4】本発明による対象関係情報生成モデルにおける更なる他の実施形態を示す模式図である。
図5】本発明による人間関係推定装置の一実施形態を示す機能ブロック図である。
【発明を実施するための形態】
【0024】
以下、本発明の実施形態について、図面を用いて詳細に説明する。
【0025】
[対象関係情報生成モデル]
図1は、本発明による対象関係情報生成モデルの一実施形態を示す模式図である。
【0026】
図1に示した本実施形態の対象関係情報生成モデル1は、
(a)ある対象であるユーザjとの人間関係(対象関係)を推定すべき対象であるユーザiについての、ある行動ドメイン(例えば「アイテム購入」や「動画閲覧」等)での行動に係る情報である「対象行動情報」、及び相手となるユーザjについての「対象行動情報」を用いて、
(b)ユーザiとユーザjとの人間関係(対象関係)を推定する、具体的には当該人間関係(対象関係)を表現した「人間関係分散表現」(対象関係表現情報)を生成する
機械学習モデルである。
【0027】
具体的に、対象関係情報生成モデル1は、
(A1)対象毎に(図1ではユーザi及びユーザjの各々について)設定された対象ユニット(11,21)であって、当該対象の「対象行動情報」veを受け取り、前の時点で自ら生成した隠れ状態情報である「自隠れ状態情報」に対しこの「対象行動情報」veを反映させて、新たな「自隠れ状態情報」を生成する回帰ニューラルネットワーク(RNN)セル(11n,21n)を有する対象ユニット(11,21)
としてコンピュータを機能させる。
【0028】
ここで、これら複数の対象ユニット(11,12)のうち、少なくとも1つの対象ユニット(図1では11)は、
(B)自らに係る対象(ユーザi)と他の対象(ユーザj)との組を識別するユーザ間識別情報ri,jから、当該組内の関係を表現する情報である「人間関係分散表現」(対象関係表現情報)rei,jであって当該関係の推定結果として捉えられる「人間関係分散表現」(対象関係表現情報)rei,jを生成する、上記のRNNセル(11n)と合わせて訓練される対象関係表現生成部(11r)と、
(C)他の対象(ユーザj)に係る対象ユニット(21)から前の時点(例えば時点t)で出力された隠れ状態情報である「他隠れ状態情報」(hj t)を受け取り、この「他隠れ状態情報」(hj t)に対し、「人間関係分散表現」(対象関係表現情報)rei,jを反映させて調整を行い、「調整済み他隠れ状態情報」(hrj t)を生成する他隠れ状態調整部(この場合、時点t+1での11a)と
を更に有し、
(A2)当該少なくとも1つの対象ユニット(図1では11)のRNNセル(例えば時刻t+1での11n)は、前の時点(図1では時点t-1)で自ら生成した「自隠れ状態情報」(hi t-1)に対し上記(C)の「調整済み他隠れ状態情報」(hrj t)も反映させて、新たな「自隠れ状態情報」(hi t+1)を生成するのである。
【0029】
このように、対象関係情報生成モデル1において、当該少なくとも1つの対象ユニット(図1では11)の対象関係表現生成部(11r)は、
・前の時点の「自隠れ状態情報」に対し、「対象行動情報」veのみならず、「人間関係分散表現」(対象関係表現情報)rei,jによって調整された「調整済み他隠れ状態情報」も反映させて新たな「自隠れ状態情報」を生成するRNNセル(11n)
と合わせて(後に説明するように)訓練されることによって、ユーザiとユーザjとの人間関係(対象関係)の推定結果として捉えられる「人間関係分散表現」(対象関係表現情報)rei,jを生成することが可能となる。
【0030】
すなわち、対象関係情報生成モデル1は、従来定量化が困難であった対象間(例えばユーザ間)の対象関係(人間関係)を表現する情報を、当該対象(当該ユーザ)の「対象行動情報」veから生成することができるのである。
【0031】
また、ここで生成される「人間関係分散表現」(対象関係表現情報)rei,jは、本実施形態において、ユーザ間識別情報ri,j(例えばone-hotベクトル)を受け取った対象関係表現生成部(11r)が出力する、多次元の(例えば数~数百次元の)ユーザ表現ベクトルであり、例えば多数の数値の羅列に係る情報となっている。
【0032】
このような「人間関係分散表現」(対象関係表現情報)rei,jは、本願発明者等が、単語分散表現に代表される公知の分散表現(埋め込み(embedding))技術にヒントを得て創作したものであり、human(object) relation embedding vectorと称することも可能な情報になっている。
【0033】
ここで、人工知能による自然言語処理において欠かせない技術となっている単語分散表現は、分布仮説:「ある使用される単語は周囲の単語によって決定される」に基づき、単語を、ベクトル空間内に埋め込まれた1つの点(ベクトル)と捉える技術である。具体的には、1つ1つの単語が、例えば数百次元の(多数の数値の羅列である)word embedding vectorで表現され、意味の近い単語同士ほどこのベクトル間の距離が小さくなる。すなわちword embedding vectorは、対応する単語の意味が埋め込まれたものとなっているのである。また、word embedding vector同士の演算も可能となっており、例えば有名な例として、"king"-"man"+"woman"="queen"といったような加減算を行うことが可能である。
【0034】
これと同様にして、本発明に係るhuman(object) relation embedding vector(人間関係分散表現,対象関係表現情報)も、対応するユーザ(対象)の組における組内での人間関係(対象関係)の特徴が埋め込まれたものと捉えることができ、それ故、ベクトル間距離を人間関係(対象関係)の類似度としたり、またベクトル同士の演算を行ったりして、人間関係(対象関係)に関し、さらに有益な情報が導出・生成可能となることも期待されるのである。
【0035】
また、「人間関係分散表現」(対象関係表現情報)rei,jは、分散表現による表現情報となっているので、その情報粒度は、例えば単に人間関係を親子関係、友人関係や、師弟関係等に分類する場合と比較して、各段に高いものとすることができる。またそれ故、「人間関係分散表現」(対象関係表現情報)rei,jは通常、人間が直接に解釈できるものにはなっていないが、例えば、様々な用途の機械学習モデルにおける入力データとして利用し、人工知能が例えばユーザ間の人間関係を理解して、当該ユーザに対し種々様々な好適なサービス、例えば当該ユーザの社会生活・人間関係の実情に配慮したパーソナライズドサービスを適宜、提供するようなことも可能になると期待される。
【0036】
またさらに、後に図5を用いて詳細に説明するが、「人間関係分散表現」(対象関係表現情報)rei,jを用いることによって、ユーザの組における人間関係の種別の推定や、人間関係の質・程度の推定も可能となるのである。
【0037】
ちなみに、対象関係情報生成モデル1は本実施形態において、各対象ユニットの出力層から、当該対象ユニットに係るユーザ(対象)における、次に行われる行動の予測結果を出力するものとなっている。ここで、対象ユニット11は結局、生成した「人間関係分散表現」(対象関係表現情報)rei,jを用いてユーザiの行動予測を実施しているのである。すなわち、ユーザ間(ユーザiとユーザjの間)の人間関係も考慮して、より高い精度の行動予測を実施可能にしている。例えば、ユーザiとユーザjとが近しい友人関係にあって、ユーザiはユーザjによる行動(例えば動画閲覧)の影響を強く受け得る場合において、ユーザiの行動予測を、このユーザjとの人間関係の分散表現を取り入れてより高い精度で実施することもできるのである。
【0038】
また本実施形態において、上記(A1)の「対象行動情報」veは、「アイテム購入」や「動画閲覧」といったようなある行動ドメインでの行動に係る情報となっているが、例えば予め設定された複数種の行動ドメインでの行動に係る情報であってもよい。また勿論、「対象行動情報」veは商品やサービスの取得に係る情報以外の情報とすることもでき、表現情報(表現ベクトル)化が可能な行動であれば種々様々な対象に係る行動が、「対象行動情報」veに係る行動として採用可能となっている。
【0039】
例えば、対象関係情報生成モデル1を用い、あるユーザ(対象)と他のユーザ(他の対象)との会話内容から、このユーザと他のユーザとの人間関係を表現した「人間関係分散表現」(対象関係表現情報)rei,jを抽出することを考える。この場合、このユーザに係るRNNセル(図1では11n)へ入力される「対象行動情報」veは、このユーザの発話に係る発話内容表現情報、例えば単語分散表現情報とすることができ、一方、他のユーザに係るRNNセル(図1では21n)へ入力される「対象行動情報」veは、当該他のユーザの発話に係る発話内容表現情報、例えば単語分散表現情報とすることができるのである。
【0040】
また、本発明による対象関係情報生成モデルにおいて、対象ユニットの数、すなわち考慮する対象(ユーザ)の数は、当然、以上に述べたような2つに限定されるものではなく、3つ以上とすることも可能である。例えば、図1に示したように、ユーザkに係る対象ユニット22を設定し、ユーザiに係る対象ユニット11は、この対象ユニット22から出力される「他隠れ状態情報」も受け取って、新たな「自隠れ状態情報」を生成してもよい。
【0041】
この場合具体的に、対象ユニット11の(時点t+6における)対象関係表現生成部11rは、自らに係るユーザiと、(時点t+5における)対象ユニット22から受け取った「他隠れ状態情報」(hk t+5)に係るユーザkとの組を識別するユーザ間識別情報ri,kから、当該組内の関係を表現する情報である「人間関係分散表現」(対象関係表現情報)rei,kであって、ユーザiとユーザkとの人間関係の推定結果として捉えられる「人間関係分散表現」(対象関係表現情報)rei,kを生成することができるのである。
【0042】
ちなみにこの場合、時点t+6における他隠れ状態調整部11aは、ユーザkに係る対象ユニット22から、直近の前の時点である時点t+5で出力された「他隠れ状態情報」(hk t+5)を受け取り、この「他隠れ状態情報」(hk t+5)に対し、「人間関係分散表現」(対象関係表現情報)rei,kを反映させて調整を行い、「調整済み他隠れ状態情報」(hrk t+5)を生成することになる。
【0043】
ここで、時点t+6における他隠れ状態調整部11aは、対象ユニット22から時点t+5で出力された「他隠れ状態情報」(hk t+5)の方が、対象ユニット21から時点t+3で出力された「他隠れ状態情報」(hj t+3)よりも直近である(新しい)ので、「他隠れ状態情報」(hk t+5)の方を取り込む設定となっていてもよい。または、すでに取り込んだ同一の「他隠れ状態」は再度取り込まない限定の下、対象ユニット21からの「他隠れ状態情報」と対象ユニット22からの「他隠れ状態情報」とを交互に取り込む、若しくは、一方を所定数だけ連続して取り込んだ後は他方を所定数だけ連続して取り込む等の設定とすることも可能である。
【0044】
またさらに、本発明の対象関係情報生成モデルにおいては、後に図4を用いて説明するように、対象関係表現生成部(11r)と、他の対象ユニットから「他隠れ状態情報」を受け取って処理する他隠れ状態調整部(11a)とを備えた対象ユニットを(図1では対象ユニット11の1つだが)複数設けて、例えば各ユーザ間の人間関係の表現情報を生成する(人間関係を推定する)ことも可能となっている。
【0045】
[モデル構成,対象関係情報生成方法]
以下、本実施形態の対象関係情報生成モデル1の構成について、より詳細に説明を行う。同じく図1によれば、対象関係情報生成モデル1は本実施形態において、
(ア)行動分散表現抽出部(行動表現生成部)11vと、ユーザ分散表現抽出部(ユーザ表現生成部)11uと、人間関係分散表現抽出部(対象関係表現生成部)11rと、他隠れ状態調整部11aと、RNNセル11nと、出力層11oとを有する対象ユニット11、及び
(イ)行動分散表現抽出部21vと、ユーザ分散表現抽出部21uと、RNNセル21nと、出力層21oとを有する対象ユニット21
を(コンピュータに搭載されたプログラムによって具現される機能構成部として)備えている。
【0046】
ここで図1には対象ユニット22も示されているが、対象ユニット22の機能構成部である行動分散表現抽出部22v、ユーザ分散表現抽出部22u、RNNセル22n、及び出力層22oはそれぞれ、対象ユニット21における同名の機能構成部と同様の構造及び機能を有しており、以下その説明を省略する。
【0047】
ちなみに、図1は、上述した(ア)及び(イ)の機能構成部(図1の左端側の機能ブロック群)が実行する処理を、時間経過の向きが右向きとなっている時間軸上で展開した様子を示している。ここで、この時間軸における時点の表記についてであるが、この時点は、いずれかの対象ユニットにおいて対象行動情報veがRNNセルに取り入れられる毎に"1"だけ増分される値を示す。例えば、対象ユニット11に係る時点t+4から見て、対象ユニット21が対象行動情報vej t+3をRNNセル21に取り入れる時点t+3は、1つ「前の時点」となるのである。
【0048】
また本実施形態では、異なる対象ユニットにおいて行動(対象行動情報ve)が完全に同一の時点で(すなわち全くの同時に)発生することはないとの前提の下、各時点においては、いずれか1つの対象ユニットだけが対象行動情報veをRNNセルに取り入れるものとしている。
【0049】
以下、上述した各機能構成部について具体的に説明を行う。同じく図1において、対象ユニット11の行動分散表現抽出部(行動表現生成部)11vは、(例えば時点t+1において)ユーザiが行った行動を識別する行動識別情報であるone-hotベクトル(vi t+1)を入力として、このone-hotベクトル(vi t+1)に対し、行動分散表現抽出演算子としての行列Wvを作用させて(積算して)、ユーザiの行動に係る対象行動情報である行動分散表現(vei t+1)を生成する。ここで、この行動分散表現(vei t+1)には、例えば行動が「動画閲覧」である場合、(モデル訓練の結果として)その動画の出演者やジャンルといったような動画に係る種々様々な情報が埋め込まれていることが期待される。
【0050】
また、対象ユニット11のユーザ分散表現抽出部(ユーザ表現生成部)11uは、ユーザiのユーザ識別情報であるone-hotベクトルuiを入力として、このone-hotベクトルuiに対し、ユーザ分散表現抽出演算子としての行列Wuを作用させて(積算して)、ユーザiのユーザ分散表現(uei)を生成する。ここで、このユーザ分散表現(uei)には、例えば行動が「動画閲覧」である場合、(モデル訓練の結果として)ユーザiの動画の好みといったようなユーザiの種々様々な属性情報が埋め込まれていることが期待される。
【0051】
なお、このユーザ分散表現抽出部11uは、モデル出力の精度向上を目的に設定されたものであるが、対象関係情報生成モデル1は人間関係分散表現(対象関係表現情報)rei,jによってユーザiに係る情報をすでに取り入れているので、省略することも可能である(すなわちユーザ分散表現(uei)を取り扱わないこともできる)。
【0052】
同じく図1において、対象ユニット11の人間関係分散表現抽出部(対象関係表現生成部)11rは、ユーザiとユーザj(他の対象)との組を識別するユーザ間識別情報であるone-hotベクトルri,jを入力として、このone-hotベクトルri,jに対し、人間関係分散表現抽出演算子としての行列Wrを作用させて(積算して)、当該組内の関係(ユーザiとユーザj(他の対象)との人間関係)を表現する人間関係分散表現(対象関係表現情報)rei,jを生成する。ここでこの人間関係分散表現rei,jは、人間関係分散表現抽出部11rを(後に説明するように)RNNセル11nと合わせて訓練されたものとすることによって、ユーザiとユーザj(他の対象)との人間関係の推定結果として捉えられる量となっている。
【0053】
なお本実施形態において、one-hotベクトル(ユーザ間識別情報)ri,jは、ユーザj(他の対象)からユーザiへの向きの情報も含む「他自識別情報」となっている。すなわち、one-hotベクトルri,jとone-hotベクトルrj,iとは互いに一致しない異なるベクトルとなるように設定されている。またしたがって、人間関係分散表現rei,jは、ユーザj(他の対象)からユーザiへの向きの関係性を表現する分散表現情報となる。例えば、ユーザjがユーザiの親である場合に、one-hotベクトルri,jは「親から子への向きとしてのユーザjからユーザiへの向き」を識別する情報となり、上記のような訓練の結果、人間関係分散表現rei,jは「親子関係における親から子への向きの関係性としてのユーザjからユーザiへの向きの関係性」を表現する情報となるのである。
【0054】
ここで変更態様として、人間関係分散表現抽出部11rへ入力するユーザ間識別情報として、上記の「他自識別情報」と、ユーザiからユーザj(他の対象)への向きの情報も含む「自他識別情報」とを含むものとすることもできる。すななち、ユーザ間識別情報として、one-hotベクトルri,jとone-hotベクトルrj,i(≠ri,j)とをともに使用してもよい(人間関係分散表現抽出部11rへともに入力してもよい)。この場合、生成される人間関係分散表現rei,jは「ユーザiとユーザjとの相互の関係性」を表現する情報、例えば「両者は親子の関係にある旨」を表現する情報となるのである。また更なる変更態様として、ユーザ間識別情報は、向きの情報を含まないものとすることも可能である。この場合、ユーザ識別情報としてone-hotベクトルri,j(=rj,i)を使用することになる。
【0055】
また、対象関係情報生成モデル1は本実施形態において、後に説明するように行動予測情報も出力するモデルとなっているが、主要な成果として対象関係表現情報を出力するモデルとすることもできる。この場合、人間関係分散表現抽出部(対象関係表現生成部)11rは、以上に述べたように生成した人間関係分散表現(対象関係表現情報)rei,jを、ユーザi及びユーザjの行動に基づく両者の人間関係の推定結果として出力する、例えばrei,j出力用の出力層を有することになる。
【0056】
同じく図1において、対象ユニット11の他隠れ状態調整部11aは、(例えば時点t+1において)自らを含む対象ユニット11に係るRNNセル11nが行動分散表現抽出部11vから行動分散表現(vei t+1)を受け取った際、
(a)ユーザj(他の対象)に係る対象ユニット21において最近に生成された又は生成された直後の(図1では時点tで生成された)他隠れ状態情報(hj t)を受け取り、
(b)この他隠れ状態情報(hj t)に対し、人間関係分散表現抽出部11rから受け取った人間関係分散表現rei,jを反映させて調整を行い、調整済み他隠れ状態情報(hrj t)を生成する。
なお、本実施形態における他隠れ状態調整部11aの具体的な内部構成は、後に図2を用いて詳細に説明を行う。
【0057】
同じく図1において、対象ユニット11のRNNセル11nは、(例えば時点t+1において)行動分散表現抽出部11vから行動分散表現(vei t+1)を受け取った際、
(a)直近の前の時点(図1では時点t-1)で自ら生成した自隠れ状態情報(hi t-1
に対し、
(b)この受け取った行動分散表現(vei t+1)と、
(c)ユーザ分散表現抽出部11uから受け取ったユーザ分散表現(uei)と、
(d)他隠れ状態調整部11aから受け取った調整済み他隠れ状態情報(hrj t)と
を反映させて、
(e)新たな自隠れ状態情報(hi t+1)と、
(f)出力層11oを介し出力される行動予測情報であって、次にユーザiがとると予測される行動に係る情報である行動予測情報(vpi t+2)と
を生成する。
【0058】
図2は、本発明に係る他隠れ状態調整部11a及びRNNセル11nにおける内部構成の一実施形態を説明するための機能ブロック図である。
【0059】
最初に図2に示すように、他隠れ状態調整部11aは本実施形態において、次元数調整部11a1と、規格化部11a2と、積算部11a3とを有する。このうち次元数調整部11a1は、(例えば時点t+1において)入力される人間関係分散表現rei,jと他隠れ状態情報(hj t)との間で次元数が異なっている場合に当該次元数を揃える処理を行う。具体的には、人間関係分散表現rei,jに対し次元数変換行列Wdを作用させて(積算して)、rei,jベクトルの次元数をhj tベクトルの次元数と同一にする。次いで、規格化部11a2は、次元数の調整された人間関係分散表現rei,jにおける各ベクトル要素の値を、例えばtanh関数を用いて-1から1までの値に規格化する。
【0060】
最後に、積算部11a3は、(ユーザjの行動内容が埋め込まれている)他隠れ状態情報(hj t)の各ベクトル要素に対し、人間関係分散表現rei,jにおける対応する規格化されたベクトル要素(-1~1の値)を積算することによって、調整済み他隠れ状態情報(hrj t)を生成する。すなわち、積算部11a3は、ユーザjに係る対象ユニット21(図1)から受け取った他隠れ状態情報(hj t)を、「ユーザjとの人間関係の下でユーザiがユーザjの行動内容から受けた影響」が反映された形に調整するのである。ここで、他隠れ状態情報(hj t)における(ユーザjの行動が埋め込まれた)ベクトル要素のうち、ユーザiの行動に大きく影響するものには、1近傍の値又は-1近傍の値が乗じられ、一方、ユーザiの行動への影響が小さいものについては、0近傍の値が乗じられることになる。
【0061】
なお、他隠れ状態調整部11aはその内部構成として、図2に示した構成部以外の様々な処理ユニットを採用することが可能である。例えば、人間関係分散表現rei,jの次元数と他隠れ状態情報(hj t)の次元数を予め同一に設定しておき、次元数調整処理を省略してもよい。また、人間関係分散表現rei,jの規格化の際、sigmoid関数等の他の関数を用いることもできる。さらに、他隠れ状態情報(hj t)と人間関係分散表現rei,jとに対し、積算処理を行うのではなく、例えば加減算処理を行ったり連結処理を行ったりすることも可能である。すなわち、ユーザjとの人間関係を表現した人間関係分散表現rei,jをもって、他隠れ状態情報(hj t)を調整可能な処理ならば種々様々な処理が採用可能となっている。
【0062】
次に同じく図2において、RNNセル11nは本実施形態において、RNNを構成可能な公知のGRU(Gated Recurrent Unit)を採用した構成となっており、以下に示す機能構成部(a)~(f)を備えている。
(a)[T]:複数の入力ベクトルに重み行列を積算し、さらに積算結果にバイアスベクトルを加算して、得られたベクトルを出力する。なお、図2における2つの[T]はそれぞれ独立した(互いに異なる)重み行列及びバイアスベクトルを有する。
(b)[σ]:入力ベクトルの各要素をsigmoid関数へ入力し、得られたベクトルを出力する。なお、図2における2つの[σ]は、それぞれリセットゲートr及び更新ゲートuとして機能する。
(c)[○の中に・]:2つの入力ベクトルの対応する要素同士を乗じ、得られたベクトルを出力する。
(d)[-1]:入力ベクトルの各要素に-1を乗じ、得られたベクトルを出力する。
(e)[tanh]:入力ベクトルの各要素をtanh関数へ入力し、得られたベクトル(隠れ状態候補k)を出力する。
(f)[+]:2つの入力ベクトルの要素同士を足し合わせ、 得られたベクトルを出力する。
【0063】
ここで、更新ゲートu(一方の[σ])は、入力された行動分散表現(vei t+1)、ユーザ分散表現(uei)や、調整済み他隠れ状態情報(hrj t)を変換した情報に基づき、1つ前の(最後の)自隠れ状態情報(hi t-1)からどれだけの情報を保持し取り込むかを決定する。また、リセットゲートr(他方の[σ])は、1つ前の(最後の)自隠れ状態情報(hi t-1)から捨てるべき情報を決定する。RNNセル11nは、このような処理によって、ユーザjとの人間関係によって調整された(ユーザjの行動が反映されている)調整済み他隠れ状態情報(hrj t)を反映させた新たな自隠れ状態情報(hi t+1)を生成することが可能となるのである。
【0064】
なお、RNNセル11nはその内部構成として、図2に示した構成部以外の様々なRNNユニットを採用することが可能であり、例えば、入力ゲート、出力ゲート及び忘却ゲートを備えたLSTM(Long-Short Term Memory)を採用してもよい。いずれにしても、RNNセル11nについては、新たな隠れ状態情報を生成するべくセルに入力される情報に対し所定の処理を施す忘却ゲート、更新ゲート、リセットゲート、入力ゲート及び出力ゲートのうちの少なくとも1つを備えた構成とすることも好ましいのである。
【0065】
図1に戻って、対象ユニット21の行動分散表現抽出部(行動表現生成部)21vは(例えば時点tにおいて)ユーザjが行った行動を識別する行動識別情報であるone-hotベクトル(vj t)を入力として、このone-hotベクトル(vj t)に対し、行動分散表現抽出演算子としての行列Wvを作用させて(積算して)、ユーザjの行動に係る対象行動情報である行動分散表現(vej t)を生成する。ちなみに当然ではあるが、ここでの行列Wvは、訓練の結果として、行動分散表現抽出部11vの行列Wvとは別の演算子として生成・更新される。
【0066】
また、対象ユニット21のユーザ分散表現抽出部(ユーザ表現生成部)21uは、ユーザjのユーザ識別情報であるone-hotベクトルujを入力として、このone-hotベクトルujに対し、ユーザ分散表現抽出演算子としての行列Wuを作用させて(積算して)、ユーザjのユーザ分散表現(uej)を生成する。ちなみにここでの行列Wuも、訓練の結果として、ユーザ分散表現抽出部11uの行列Wuとは別の演算子として生成・更新される。
【0067】
同じく図1において、対象ユニット21のRNNセル21nは、「他の対象ユニットから受け取った他隠れ状態情報を(人間関係をもって)調整した結果としての調整済み他隠れ状態情報」を入力としないこと以外、対象ユニット11のRNNセル11nと同様の構造・機能を有し、同様の変更態様や別実施形態をとり得るRNNセルとなっている。
【0068】
具体的にRNNセル21nは、(例えば時点tにおいて)行動分散表現抽出部21vから行動分散表現(vej t)を受け取った際、
(a)直近の前の時点(図1では時点t-3)で自ら生成した自隠れ状態情報(hj t-3
に対し、
(b)この受け取った行動分散表現(vej t)と、
(c)ユーザ分散表現抽出部21uから受け取ったユーザ分散表現(uej)と
を反映させて、
(d)新たな自隠れ状態情報(hj t
を生成する。ちなみに、RNNセル21nも出力層21oを介し、次にユーザjがとると予測される行動に係る情報である行動予測情報(vpj)を生成してもよいが、本実施形態ではこの後説明するように、RNNセル21nは、すでに訓練済みのものを採用するので、行動予測情報を生成する必要はない。
【0069】
以上、図1及び図2を用いて、対象ユニット11及び対象ユニット21の各機能構成部における情報処理につき、ある時点(例えば時点t+1)での処理を例にして説明を行ったが、説明した情報処理は勿論、図1に示したように、対象となるユーザの行動(行動分散表現)が発生する時点において同様に実行されるのである。
【0070】
[対象関係情報生成モデルの訓練]
以下、同じく図1を用いて、対象関係情報生成モデル1の訓練(学習)について説明を行う。最初に、対象ユニット21、すなわちRNN21n、行動分散表現抽出部21v、及びユーザ分散表現抽出部21uは、すでに訓練済みのものを使用する(対象ユニット11とは独立して、RNNの従来手法により予め訓練を行っておく)。
【0071】
一方、対象ユニット11については訓練を行うが具体的は、行動識別情報(one-hotベクトルvi)、ユーザ識別情報(one-hotベクトルui)、ユーザ間識別情報(one-hotベクトルri,j)、及び(訓練済みの対象ユニット21から出力された)他隠れ状態情報(hj)を対象ユニット11へ入力し、その出力層11oから行動予測情報(vpi)を出力させる。
【0072】
次いで、この行動予測情報(vpi)と実際の行動に係る正解データ(行動識別情報(vi)若しくは行動分散表現(vei))との差異をロス(損失)とし、このロスを用いる公知のRNN訓練手法であるBPTT(Back Propagation Through Time)法を応用することによって、RNN11n、他隠れ状態調整部11a、人間関係分散表現抽出部11r、行動分散表現抽出部11v、及びユーザ分散表現抽出部11u内における各種パラメータ(重み係数、重み行列やバイアスベクトル等)の学習を行う。なおここで、訓練済みの対象ユニット21についても誤差逆伝播を及ぼし、各種パラメータを更新させてもよい。勿論、誤差逆伝播を及ぼさず、そのままとすることも可能である。
【0073】
以上に説明したような訓練処理によって、人間関係分散表現抽出部11r(行列Wr)は、RNN11nと合わせて訓練される中で、ユーザjの行動がユーザiの行動に及ぼす影響を反映した情報、言い換えると(互いの関係の詳細によって行動に及ぼす影響が決まる可能性の高いことから)ユーザiから見てユーザjはどのような関係にある人物であるかに係る情報であると解釈可能な「人間関係分散表現」(対象関係表現情報)rei,jを生成するようになるのである。
【0074】
ちなみにこの訓練済みの人間関係分散表現抽出部11rを、外部へ取り出した上で、「指定した人物間の人間関係の分散表現を抽出する抽出器」として、独立して利用することも可能である。
【0075】
[モデルの他の実施形態]
図3は、本発明による対象関係情報生成モデルにおける他の実施形態を示す模式図である。
【0076】
図3に示した本実施形態の対象関係情報生成モデル1は、図1に示した実施形態と同様、対象ユニット11及び対象ユニット21としてコンピュータを機能させ、図1に示した実施形態と同様、ユーザi及びユーザjの行動識別情報(vi,vj)を入力とした上で、人間関係分散表現抽出部11rにおいて人間関係分散表現rei,jを生成するモデルとなっている。
【0077】
しかしながら本実施形態の対象関係情報生成モデル1においては、図1のモデル1とは異なり、
(a)対象ユニット11の他隠れ状態調整部11aは(例えば時点t+3において)、自らを含まない他の対象ユニット(図1では21)に係るRNNセル(21n)が(同じ時点t+3において)行動分散表現(vej t+3)を受け取った際、この他の対象ユニット(21)に係るRNNセル(21n)において生成された直後の他隠れ状態情報(hj t+3)を受け取り、(同じく時点t+3において)調整済み他隠れ状態情報(hrj t+3)を生成し、
(b)(同じく時点t+3において)他隠れ状態調整部11aから調整済み他隠れ状態情報(hrj t+3)を受け取ったRNNセル11は、(本実施形態の設定では1時点1行動であって当然にそうなるが)ユーザiの行動分散表現(対象行動情報)を受け取っていない場合に、(ユーザiによる)行動がない状態に対応する「ダミー行動情報」eveを代わりに受け取って、新たな自隠れ状態情報(hi t+3)を生成する。
【0078】
ここで、上記(b)の「ダミー行動情報」eveは、ダミー行動識別情報(例えばダミーであることを示すone-hotベクトル)evを入力とした行動分散表現抽出部11vが生成する情報とすることができる。または、ベクトル要素が全て同値(例えば0)である、又は特定パターンの値群となっている(例えば0と1とが交互に並んでいる又はランダムな値の連続となっている)多次元ベクトルを「ダミー行動情報」eveとして予め設定しておいてもよい。
【0079】
このように本実施形態では、対象ユニット11のRNNセル11nは、図1に示した実施形態のようにユーザiが行動した際(行動分散表現veiが生成された際)にのみ新たな自隠れ状態情報hiを生成するのではなく、他の対象ユニットのRNNセルが行動分散表現vejを受け取った際、それと同時点(図3では時点t+3)においても、「ダミー行動情報」eveを用いて新たな自隠れ状態情報hiを生成する。
【0080】
その結果、対象ユニット11のRNNセル11nにおいて行動予測を行う際、この予測時点よりも前の(過去となる)時点においていずれかの対象ユニットで発生した行動が全て反映された自隠れ状態情報を用いることができ、これにより、この予測時点までに発生した(ユーザi及びユーザjによる)全ての行動を考慮した行動予測を行うことが可能となるのである。
【0081】
一方、図1の実施形態では、対象ユニット11のRNNセル11nは、例えば時点t+2において行動分散表現vei t+2を受け取った後、時点t+4において行動分散表現vei t+4を受け取り、この時点t+4において、自隠れ状態情報hi t+2を用いて行動予測を行っている(行動予測情報vpi t+6を出力している)。ここで、この予測に用いた自隠れ状態情報hi t+2には、時点t+3において対象ユニット21で発生したユーザjの行動(行動分散表現vej t+3)は当然ながら何ら反映されていない。このように、図1の実施形態ではRNNセル11nは、時点t+4における行動予測において、それまでに発生した行動の一部を反映させていない自隠れ状態情報hiを用いることになっているのである。
【0082】
これに対し、図3に示した本実施形態のRNNセル11nは、対象ユニット21において行動の発生した時点t+3においても、「ダミー行動情報」eveを用いて新たな自隠れ状態情報hi t+3を生成しており、その結果、本実施形態の対象関係情報生成モデル1は、この時点t+3における行動予測や、さらには時点t+4における行動予測において、それまでに発生した行動の全てを反映させた自隠れ状態情報hi t+2や自隠れ状態情報hi t+3を用いてより精度の高い行動予測を行うことが可能となるのである。
【0083】
また、以上に述べたようなより精度の高い行動予測を伴う行動予測処理・自隠れ状態生成処理を訓練時に実施することによって、より精度の高い(より確実に関係の実情が埋め込まれた)人間関係分散表現rei,jを生成することも可能となるのである。なお、時点t+2における行動予測情報vpi t+4は、この時点t+2と予測時点t+4との間となる時点t+3において(対象ユニット21で)行動が発生していることを受け、この訓練の際には使用されず、代わりに時点t+3における行動予測情報vpi t+4が訓練に用いられることも好ましい。
【0084】
図4は、本発明による対象関係情報生成モデルにおける更なる他の実施形態を示す模式図である。
【0085】
図4に示した本実施形態の対象関係情報生成モデル1’は、複数の(図4では3つの)対象ユニット(12,13,14)としてコンピュータを機能させ、ここで各対象ユニット(12,13,14)は、図1に示した対象ユニット11と同様の内部構成及び機能を有しており、言い換えると、各対象ユニット(12,13,14)における行動分散表現抽出部(12v,13v,14v)、ユーザ分散表現抽出部(12u,13u,14u)、人間関係分散表現抽出部(12r,13r,14r)、他隠れ状態調整部(12a,13a,14a)、RNNセル(12n,13n,14n)及び出力層(12o,13o,14o)はそれぞれ、対象ユニット11(図1)における同名の機能構成部と同様の構造及び機能を有している。
【0086】
したがって、各対象ユニット(12,13,14)は、対応するユーザ(i,j,k)の行動識別情報(vi,vj,vk)を入力とした上で、人間関係分散表現抽出部(12r,13r,14r)において人間関係分散表現reを生成することができるのである。
【0087】
なお、対象関係情報生成モデル1’においても、以上に説明してきた実施形態と同様、異なる対象ユニットにおいて行動(行動分散表現ve)が完全に同一の時点で(すなわち全くの同時に)発生することはないとの前提の下、各時点においては、いずれか1つの対象ユニットだけが行動分散表現veを取り入れるものとしている。
【0088】
ここで本実施形態の対象関係情報生成モデル1’では、より具体的に、
(a)自らに係るユーザの行動分散表現veを行動分散表現抽出部から受け取ったRNNセル(例えば時点t+4における14n)は、自らを含まない他の対象ユニットに係るRNNセル(12n,13n)から、最後に受け取った他隠れ状態情報(hi t+2,hj t+3)よりも新しい(行動分散表現veの反映された)他隠れ状態情報が出力されていない場合に、他隠れ状態情報がない状態に対応する「ダミー他隠れ状態情報」ehを代わりに入力として、新たな自隠れ状態情報(hk t+4)を生成し、
(b)上記(a)のRNNセル(14n)の属する対象ユニット(14)以外の残りの対象ユニット(12,13)における人間関係分散表現抽出部(12r,13r)は、自らに係るユーザと上記(a)のRNNセル(14n)に係るユーザとのユーザ間識別情報であるone-hotベクトル(ri,k,rj,k)を入力として人間関係分散表現(rei,k,rej,k)を生成して、他隠れ状態調整部(12a,13a)へ出力し、
(c)上記(b)の人間関係分散表現(rei,k,rej,k)を受け取った他隠れ状態調整部(12a,13a)は、上記(a)のRNNセル(14n)から受け取った自隠れ状態情報(hk t+4)を、この人間関係分散表現(rei,k,rej,k)をもって調整して調整済み人間関係分散表現(hrk t+4,hrk t+4)を生成して、RNNセル(12n,13n)へ出力し、
(d)上記(c)の調整済み人間関係分散表現(hrk t+4,hrk t+4)を受け取ったRNNセル(12n,13n)は、この調整済み人間関係分散表現(hrk t+4,hrk t+4)と、(自らに係るユーザの行動は発生していないので)代わりに準備された「ダミー行動情報」eveと、ユーザ分散表現(uei,uej)とを、前の時点(時点t+3)で生成した自隠れ状態情報(hi t+3,hj t+3)に反映させ、新たな自隠れ状態情報(hi t+4,hj t+4)を生成するのである。
【0089】
対象関係情報生成モデル1’は、以上に説明した処理を各時点において繰り返し実施することによって、複数のユーザの間における人間関係を表現した人間関係分散表現(対象関係表現情報)を生成することができる。例えば図4において、ユーザiに係る対象ユニット12の人間関係分散表現抽出部12rは、ユーザiとユーザjとの人間関係分散表現rei,j、及びユーザiとユーザkとの人間関係分散表現rei,kを生成することができる。また、ユーザjに係る人間関係分散表現抽出部13rはrej,i及びrej,kを、さらにユーザkに係る人間関係分散表現抽出部14rはrek,i及びrek,jを生成することが可能となっているのである。
【0090】
ここで、人間関係分散表現reは、2つの添え字を入れ替えると異なる値となる量(例えばrei,j≠rej,i)とすることもでき、2つの添え字の入れ替えについて不変な量(例えばrei,j=rej,i)にも設定可能である。さらに他の実施形態として、いずれの人間関係分散表現抽出部(12r,13r,14r)も、ユーザi、ユーザj及びユーザkの3人の組を識別するユーザ間識別情報ri,j,kを入力として、これら3人のユーザの人間関係分散表現rei,j,k(この場合、rei,j,kは添え字の入れ替えについて不変)を生成することもできる。
【0091】
また、上記(a)の「ダミー他隠れ状態情報」ehは、ベクトル要素が全て同値(例えば0)である、又は特定パターンの値群となっている(例えば0と1とが交互に並んでいる又はランダムな値の連続となっている)多次元ベクトルとして予め設定しておくことができる。ここでこのようなダミー情報を用いる理由であるが、例えば時点t+4におけるRNNセル14nは、他の対象ユニットに係るRNNセル(12n,13n)から、他隠れ状態情報(hi t+2,hj t+3)をすでに受け取った状態にあり、改めて当該他隠れ状態情報(hi t+2,hj t+3)を取り込む必要がないので、代わりに「ダミー他隠れ状態情報」ehを取り入れるのである。さらに、上記(d)の「ダミー行動情報」eveは、図3に示した実施形態のダミー行動情報と同じものであってもよい。
【0092】
また、以上に説明した対象関係情報生成モデル1’において、各対象ユニット(12,13,14)は、すでに説明した対象ユニット11(図1)と同様の手法をもって、まとめて訓練することができる。すなわち、対象関係情報生成モデル1’の訓練においては、対象ユニット21(図1)のような予め訓練済みの対象ユニット(RNNセル)を準備しておく必要がないのである。
【0093】
ここで、行動予測情報vpを用いたロスの算出は、予測時点で行動した(行動分散表現veが生成された)ユーザに係る対象ユニット(12,13,14)でのみ実施する。例えば図4において、行動の予測された時点t+1で行動したのはユーザiであるので、行動予測情報vpを用いたロスの算出は、ユーザiに係る対象ユニット12で実施されるのである。
【0094】
なお、図4に示した対象関係情報生成モデル1’は、互いに隠れ状態情報をやり取りする対象ユニットを3つ備えているが、勿論これに限定されるものではない。すなわち、このような対象ユニットを2つ、又は4つ以上設定して、2人のユーザ間の、又は4人以上のユーザ間の人間関係分散表現reを生成することも可能となっている。
【0095】
[対象関係推定装置,対象関係推定プログラム]
図5は、本発明による対象関係推定装置の一実施形態を示す機能ブロック図である。
【0096】
図5に示した本実施形態の人間関係推定装置(対象関係推定装置)5は、搭載した対象関係情報生成モデル1(図1図3)又は対象関係情報生成モデル1’(図4)を訓練して得られた学習済みの人間関係分散表現抽出部(対象関係表現生成部)、本実施形態では(ユーザiとユーザjとの人間関係分散表現rei,jを生成する)人間関係分散表現抽出部11r(図1図3)を用いて、関係推定対象ユーザ(本実施形態ではユーザi及びユーザj)の「人間関係に係る情報」、本実施形態では「人間関係の種別及び質(好感度や関係の強さ等)」を生成し、出力する。
【0097】
具体的に図5において、人間関係推定推定装置5の入力部501は、通信機能を備えていて、例えば外部に設置された行動ドメイン関連の管理サーバ(例えばウェブショッピング管理サーバや動画配信管理サーバ)から、多数のユーザにおけるある行動ドメインでの行動に係る時系列情報を取得し、訓練部511へ出力する。また、関係推定対象ユーザであるユーザi及びユーザjの組を指定する情報を受け取り、人間関係分散表現生成部512へ出力する。
【0098】
また、入力部501は、当該多数のユーザに対して行った、他のユーザとの人間関係の種別のアンケート結果情報、及び当該他のユーザとの間で互いに相手をどのように見ているか(例えば、上司、配偶者や教師としての好ましさや好感度等)に係るアンケート結果情報を管理したアンケート結果管理サーバから、これらのアンケート結果情報を取得し、訓練部511へ出力する。
【0099】
訓練部511は、受け取った多数のユーザにおけるある行動ドメインでの行動に係る時系列情報から学習データを生成して学習データ保存部502に保存し、この学習データを適宜用いて対象関係情報生成モデル(1,1’)の訓練を実施する。
【0100】
人間関係分散表現生成部512は、受け取ったユーザi及びユーザjの組を指定する情報から、(関係推定対象ユーザである)ユーザi及びユーザjの組を識別するユーザ間識別情報(one-hotベクトル)ri,jを生成して、このユーザ間識別情報i,jを、上記のように対象関係情報生成モデル(1,1’)を訓練することによって得られた学習済みの人間関係分散表現抽出部11rへ入力し、この人間関係分散表現抽出部11rから人間関係分散表現rei,jを取得する。また、同様にして多数のユーザにおけるユーザ組の各々を指定する情報から、当該ユーザ組に係る人間関係分散表現reを取得する。
【0101】
ここで人間関係分散表現rei,jはすで説明したように、関係推定対象ユーザであるユーザi及びユーザjにおける人間関係の分散表現と捉えることができ、すなわちhuman relation embedding vectorとみなすことができるものとなっている。人間関係分散表現生成部512は、このような人間関係分散表現rei,jを、外部の情報処理装置において利用させるべく、通信機能を有する出力部94を介して当該外部の情報処理装置へ送信してもよい。
【0102】
また訓練部511は、入力部501から受け取ったアンケート結果情報と、人間関係分散表現生成部512から受け取った(当該アンケート結果情報のユーザの組に対応する)人間関係分散表現reとから学習データを生成して学習データ保存部502に保存し、この学習データを適宜用いて人間関係推定モデル8の訓練を実施する。ここで、人間関係推定モデル8は、説明変数を人間関係分散表現とし、目的変数を、当該人間関係分散表現で表現された人間関係の種別(例えば、親子関係、夫婦関係、上司・部下の関係等)とその質(例えば相手に対する好感度や関係の強さの度合い)とするモデルとなっている。
【0103】
人間関係推定部513は、人間関係分散表現生成部512から受け取った(ユーザiとユーザjの関係を表現する)人間関係分散表現rei,jを、訓練済みの人間関係推定モデル8へ入力し、この人間関係推定モデル8から、ユーザiとユーザjにおける人間関係の種別(友人関係や上司・部下の関係等)及び質(好感度や関係の強さ等)の推定結果を取得する。また当該推定結果を、外部の情報処理装置において利用させるべく、通信機能を有する出力部94を介して当該外部の情報処理装置へ送信してもよい。
【0104】
ここで、訓練部511、人間関係分散表現生成部512、及び人間関係推定部513は、本発明による人間関係推定方法の一実施形態を実施する主要機能構成部であり、また、本発明による人間関係推定プログラムの一実施形態を保存したプロセッサ・メモリの機能と捉えることもできる。またこのことから、人間関係推定装置5は、人間関係推定の専用装置であってもよいが、本発明による人間関係推定プログラムを搭載した、例えばクラウドサーバ、非クラウドのサーバ装置、パーソナル・コンピュータ(PC)、ノート型若しくはタブレット型コンピュータ、又はスマートフォン等とすることも可能である。
【0105】
以上詳細に説明したように、本発明によれば、従来定量化が困難であった対象間(例えばユーザ間)の対象関係(人間関係)を表現する対象関係(人間関係)表現情報を、当該対象(当該ユーザ)の行動に係る情報である対象行動情報(ユーザ行動情報)から生成することが可能となる。ここで、この対象関係表現情報は、分散(埋め込み)表現とすることができ、この場合、情報粒度の格段に高い情報とすることも可能となる。
【0106】
例えば、この対象関係表現情報を、様々な用途の機械学習モデルにおける入力データとして利用し、人工知能が例えばユーザ間の人間関係を理解して、当該ユーザに対し種々様々な好適なサービス、例えば当該ユーザの社会生活・人間関係の実情に配慮したパーソナライズドサービスを適宜、提供するようなこともできると期待される。 またさらに、この対象関係表現情報を用いることによって、例えばユーザの組における人間関係の種別の推定や、人間関係の質・程度の推定も可能となる。
【0107】
また、例えば子供達に対し質の高い、且つ個々の性格に合った教育を提供するために、本発明によって生成した、当該子供達の間の、又は教師と各子供との間の人間関係情報を活用することもできる。すなわち本発明によれば、国連が主導する持続可能な開発目標(SDGs)の目標4「すべての人々に包摂的かつ公平で質の高い教育を提供し、生涯学習の機会を促進する」に貢献することも可能となるのである。
【0108】
さらに、例えば大人達に対し、環境に害を及ぼさないディーセント・ワーク(働きがいのある人間らしい仕事)や、質の高い、且つ個々の性格に適した仕事を提供するために、本発明によって生成した、当該大人達の間の、又は上司と各大人(社員)との間の人間関係情報を活用することもできる。すなわち本発明によれば、国連が主導するSDGsの目標8「すべての人々のための包摂的かつ持続可能な経済成長、雇用およびディーセント・ワークを推進する」に貢献することも可能となるのである。
【0109】
またさらに、例えば消費者に対し、当該消費者の家族関係や友人関係の状況に沿った、持続可能な消費とライフスタイルについての教育を提供するために、本発明によって生成した、当該消費者の家族関係情報や友人関係情報を活用することもできる。すなわち本発明によれば、国連が主導するSDGsの目標12「持続可能な消費と生産のパターンを確保する」に貢献することも可能となるのである。
【0110】
上述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。上述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0111】
1、1’ 対象関係情報生成モデル
11、12、13、14、21、22 対象ユニット
11a、12a、13a、14a 他隠れ状態調整部
11a1 次元数調整部
11a2 規格化部
11a3 積算部
11n、12n、13n、14n、21n、22n RNNセル
11r、12r、13r、14r 人間関係分散表現抽出部(対象関係表現生成部)
11o、12o、13o、14o、21o、22o 出力層
11u、12u、13u、14u、21u、22u ユーザ分散表現抽出部(ユーザ表現生成部)
11v、12v、13v、14v、21v、22v 行動分散表現抽出部(行動表現生成部)
5 人間関係推定装置(対象関係推定装置)
501 入力部
502 学習データ保存部
503 出力部
511 訓練部
512 人間関係分散表現生成部
513 人間関係推定部
8 人間関係推定モデル
図1
図2
図3
図4
図5