IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特許7495363ドメイン非依存RNNを利用したパーソナリティ情報生成モデル、装置及び方法
<>
  • 特許-ドメイン非依存RNNを利用したパーソナリティ情報生成モデル、装置及び方法 図1
  • 特許-ドメイン非依存RNNを利用したパーソナリティ情報生成モデル、装置及び方法 図2
  • 特許-ドメイン非依存RNNを利用したパーソナリティ情報生成モデル、装置及び方法 図3
  • 特許-ドメイン非依存RNNを利用したパーソナリティ情報生成モデル、装置及び方法 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-27
(45)【発行日】2024-06-04
(54)【発明の名称】ドメイン非依存RNNを利用したパーソナリティ情報生成モデル、装置及び方法
(51)【国際特許分類】
   G06Q 30/02 20230101AFI20240528BHJP
【FI】
G06Q30/02
【請求項の数】 10
(21)【出願番号】P 2021015575
(22)【出願日】2021-02-03
(65)【公開番号】P2022118820
(43)【公開日】2022-08-16
【審査請求日】2023-02-10
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(74)【代理人】
【識別番号】100141313
【弁理士】
【氏名又は名称】辰巳 富彦
(72)【発明者】
【氏名】石川 雄一
【審査官】田上 隆一
(56)【参考文献】
【文献】特開2019-215862(JP,A)
【文献】国際公開第2016/002133(WO,A1)
【文献】特開2019-191937(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
複数の行動ドメインにおけるユーザの行動ドメインに係る情報から、当該ユーザのパーソナリティを推定するコンピュータを機能させるパーソナリティ情報生成モデルであって、
当該行動ドメイン毎に設定された複数の行動表現生成部であって、各々が、当該行動ドメインにおける当該ユーザの行動の内容を識別する情報から、当該行動ドメインにおける当該ユーザの行動を表現する情報である行動表現情報を生成する、複数の行動表現生成部と、
当該行動ドメイン毎に設定された複数のドメイン特定回帰ニューラルネットワーク(RNN)セルであって、各々が、当該行動ドメインにおける当該ユーザの当該行動表現情報を受け取り、当該ユーザの当該行動表現情報を前回受け取った時点で自ら生成した、RNNの隠れ状態情報に相当するドメイン特定隠れ状態情報に対し、今回受け取った当該ユーザの当該行動表現情報を反映させて、同じくRNNの隠れ状態情報に相当する新たなドメイン特定隠れ状態情報を生成する複数のドメイン特定RNNセルと、
当該ユーザを識別する情報から、当該ユーザを表現する情報であるユーザ表現情報を生成するユーザ表現生成部と、
生成された当該ドメイン特定隠れ状態情報と、生成された当該ユーザ表現情報とを受け取り、当該ユーザの当該ドメイン特定隠れ状態情報を前回受け取った時点で自ら生成した、RNNの隠れ状態情報に相当するドメイン非依存隠れ状態情報に対し、今回受け取った当該ユーザの当該ドメイン特定隠れ状態情報及び当該ユーザ表現情報を反映させて、同じくRNNの隠れ状態情報に相当する新たなドメイン非依存隠れ状態情報を生成するドメイン非依存RNNセルと
してコンピュータを機能させ
前記複数のドメイン特定RNNセル及び前記ドメイン非依存RNNセルと合わせて、RNNの誤差逆伝播法によって訓練された前記ユーザ表現生成部は、当該ユーザの当該ユーザ表現情報を、当該ユーザに係るドメイン非依存的な且つ静的な情報という意味で当該ユーザのパーソナリティを表現した情報として生成する
とを特徴とするパーソナリティ情報生成モデル。
【請求項2】
前記ドメイン非依存RNNセルは、当該ドメイン特定RNNセルにおいて最近に生成された又は生成された直後の当該ドメイン特定隠れ状態情報を受け取り、当該ドメイン非依存隠れ状態情報を生成することを特徴とする請求項1に記載のパーソナリティ情報生成モデル。
【請求項3】
当該ドメイン特定RNNセルから出力された当該ドメイン特定隠れ状態情報に対し所定の形の変換処理を施し、当該変換処理の施された該ドメイン特定隠れ状態情報を前記ドメイン非依存RNNセルへ入力する第1の変換処理部としてコンピュータを更に機能させることを特徴とする請求項1又は2に記載のパーソナリティ情報生成モデル。
【請求項4】
当該ドメイン特定RNNセルは、当該行動表現情報を受け取る時点からみて最近に生成された当該ドメイン非依存隠れ状態情報も受け取り、該ドメイン非依存隠れ状態情報も用いて当該ドメイン特定隠れ状態情報を生成することを特徴とする請求項1から3のいずれか1項に記載のパーソナリティ情報生成モデル。
【請求項5】
前記ドメイン非依存RNNセルから出力された当該ドメイン非依存隠れ状態情報に対し所定の形の変換処理を施し、当該変換処理の施された該ドメイン非依存隠れ状態情報を当該ドメイン特定RNNセルへ入力する第2の変換処理部としてコンピュータを更に機能させることを特徴とする請求項4に記載のパーソナリティ情報生成モデル。
【請求項6】
前記ユーザ表現生成部は、生成した当該ユーザ表現情報を、当該ユーザのパーソナリティを表現した情報として出力することを特徴とする請求項1から5のいずれか1項に記載のパーソナリティ情報生成モデル。
【請求項7】
前記ドメイン非依存RNNセルは、生成した当該ドメイン非依存隠れ状態情報を、当該ユーザの動的な心理状態に係る情報である動的心理状態情報として出力することを特徴とする請求項1から6のいずれか1項に記載のパーソナリティ情報生成モデル。
【請求項8】
前記複数のドメイン特定RNNセル及び前記ドメイン非依存RNNセルの各々は、新たな隠れ状態情報を生成するべくセルに入力される情報に対し所定の処理を施す忘却ゲート、更新ゲート及びリセットゲートのうちの少なくとも1つを備えていることを特徴とする請求項1から7のいずれか1項に記載のパーソナリティ情報生成モデル。
【請求項9】
請求項1から8のいずれか1項に記載のパーソナリティ情報生成モデルを訓練して得られた学習済みの前記ユーザ表現生成部を用いて、当該ユーザのパーソナリティを表現した情報を生成し、出力することを特徴とするパーソナリティ推定装置。
【請求項10】
請求項1から8のいずれか1項に記載のパーソナリティ情報生成モデルに対し、RNNの誤差逆伝播法によって訓練を行い、
当該訓練によって得られた訓練済みの前記ユーザ表現生成部を用いて、当該ユーザに係るドメイン非依存的な且つ静的な情報という意味で当該ユーザのパーソナリティを表現した情報となっている、当該ユーザの当該ユーザ表現情報を生成し、出力する
ことを特徴とする、コンピュータにおけるパーソナリティ推定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザのパーソナリティや心理状態を推定する技術に関する。
【背景技術】
【0002】
人間の性格、人格、気質や、個性、さらには価値観といったような精神面の指標を全体的に捉えた特性であるパーソナリティは、各種商品・サービスの購入・選択といった様々な行動領域(行動ドメイン)における行動内容に少なからぬ影響を与えることが知られている。このため近年、ユーザの行動を予測したり、提供する商品・サービスをパーソナライズしたりすることを目的として、ユーザのパーソナリティを把握する試みが盛んに行われている。
【0003】
今日、人間のパーソナリティは「特性論」と呼ばれる考え方に従い把握するのが一般的である。この特性論では、人間のパーソナリティは、複数の特性で構成されていて各特性の高低(スコア)で表現することができるとしている。例えば、特性論に基づくパーソナリティモデルの代表例である「Big Five」は、人間のパーソナリティが知的好奇心(O: Openness to experience)、誠実性(C: Conscientiousness)、外向性(E: Extraversion)、協調性(A: Agreeableness)、及び情緒安定性(N: Neuroticism)の5つの特性で構成されるとしており、人間の性格をこれら5特性(OCEAN)のスコアの組で表現する。
【0004】
このようなパーソナリティを測定する手法として、質問紙調査がよく用いられる。例えば、Big Five測定用の質問紙として代表的な「Big Five Scales」は、合計60の項目からなる質問群を被験者に回答させるものであり、例えば知的好奇心(O)の測定においては、「独創的な」や「多才の」等の質問に対し「まったくあてはまらない(1点)」~「非常にあてはまる(7点)」の7段階で回答させ、全質問の合計得点で知的好奇心(O)のスコアを決定する仕組みとなっている。
【0005】
一方、膨大なユーザに対し質問紙調査を実施することは多大なコストがかかることを踏まえ、最初に少数のユーザに対して質問紙調査を実施し、その回答結果と当該ユーザの行動データとを用いて当該ユーザのパーソナリティを推定する技術の研究も広く行われている。
【0006】
非特許文献1はこのような技術のサーベイ論文であり、例えば、SNS(Social Networking Service)への投稿内容や、SNSで繋がっている友人の数、携帯端末の発信履歴や、端末位置情報に基づき導出される移動パターン、さらには通話における発話の速度・抑揚や、声の大小等、様々なユーザの行動データを用いて、当該ユーザのパーソナリティを推定する技術が紹介されている。
【先行技術文献】
【非特許文献】
【0007】
【文献】A. Vinciarelli and G. Mohammadi, "A Survey of Personality Computing,", IEEE Transactions on Affective Computing, vol. 5, no. 3, pp. 273-291, 2014年,<https://doi.org/10.1109/TAFFC.2014.2330816>
【文献】Donkers, T., Loepp, B., & Ziegler, J., "Sequential user-based recurrent neural network recommendations", RecSys'17 - Proceedings of the 11th ACM Conference on Recommender Systems, pp. 152-160, 2017年, <https://doi.org/10.1145/3109859.3109877>
【発明の概要】
【発明が解決しようとする課題】
【0008】
以上説明したように従来、パーソナリティの測定手法として様々な技術が開発されてきたが、これらの技術に共通する解決すべき課題として、(a)測定粒度(情報粒度)の粗さと、(b)信頼性の低さとが挙げられる。
【0009】
最初に(a)測定粒度の粗さであるが、これは、ユーザの行動データから当該ユーザのパーソナリティを推定する技術を含め、「特性論」に基づきパーソナリティを把握する技術に顕著な課題となっている。例えば、Big Fiveの5つの特性は元来、辞書から抜き出した膨大な数の性格表現単語を、統計的な手法によって5つの類似概念単語グループに集約し、この集約結果に基づいて人間が解釈し易いように決定されたものである。
【0010】
ここで、この集約の過程において、性格表現単語の本来有する意味合いにおける細かな若しくは微妙な相違部分が失われてしまっている。例えば、Big Fiveのうちの1つである誠実性(C)は、「真面目」「勤勉」「計画性がある」等の性格表現を一特性に集約したものとなっており、この誠実性(C)の測定結果として得られるのは単一のスコアに過ぎず、集約前の性格表現1つ1つの意味合いの相違部分は、測定結果から失われているのである。
【0011】
次に(b)信頼性の低さであるが、これは特に、質問紙調査によるパーソナリティ測定を含む技術に顕著な課題となっている。例えば、質問紙の質問に対する被験者の回答態度には通常、相当のばらつきが存在する。具体的には、自分の本来の考えではなく「こうあるべき」との考えに基づいて回答を行うケースや、回答自体を面倒な作業と捉えて出鱈目な回答を行うケースが生じることも少なくない。その結果、パーソナリティの測定結果における信頼性が低下してしまうのである。
【0012】
また、仮に本来想定する(素直な且つ真面目な)回答態度が担保されたとしても、そもそも質問紙調査で設定されるような質問項目や回答方法では、測定対象とする特性の領域全てを測定し切れない可能性が高く、測定結果における信頼性は低くならざるを得ない。例えば、Big Fiveの質問紙は20種以上存在するが、質問数、質問表現や、(5段階で回答するか、はい/いいえで回答するか等の)回答方法は、それぞれで相当に異なるものとなっている。またその影響もあって、同一の被験者であっても回答する質問紙の種別によって測定結果が相違することは広く知られており、2つの質問紙間において、協調性(A)の測定結果の相関rが0.40を下回るケースも発生している。
【0013】
さらに、ユーザの行動データから当該ユーザのパーソナリティを推定する技術においても、使用する推定モデルは通常、質問紙調査による測定結果を用いて訓練・構築されるので、以上に説明した(b)信頼性の低さが、解決すべき重大な課題となっているのである。
【0014】
このような現状を受け、本願発明者は、質問紙調査による測定結果を用いずに、商品・サービスのレコメンド(推薦)技術の分野において研究されている動的なユーザ表現学習(Sequential URL, Sequential User Representation Learning)技術を応用することによって、上記の2つの課題を解決するパーソナリティ推定が実現することに思い至った。
【0015】
ここでSequential URL技術は、音楽再生や、動画閲覧、さらには広告クリックや、アイテム購買等に係る時系列の行動データから、(例えば音楽や映画の好みといったような)ユーザ属性の分散表現を獲得する技術である。例えば非特許文献2には、このSequential URL技術として、ユーザの映画視聴についての時系列行動データを、回帰ニューラルネットワーク(RNN, Recurrent Neural Network)の一種であるGRU(Gated Recurrent Unit)へ入力し、ユーザ属性の分散表現を獲得する技術が開示されている。
【0016】
具体的に、この非特許文献2に記載された技術では、ユーザの識別情報を入力とする分散表現抽出部から出力された当該ユーザの分散表現と、当該ユーザによって視聴された映画の識別情報を入力とする分散表現抽出器から出力された当該映画の分散表現とを入力とするGRUセルが開示されている。ここで非特許文献2は、十分な量のデータによってこのGRUセル及び分散表現抽出器を訓練することによって、分散表現抽出部から出力される当該ユーザの分散表現には、静的であって容易には変化しないユーザ属性、例えば当該ユーザの映画の好み、が反映されるとしている。
【0017】
しかしながら、このようなSequential URL技術によって獲得されるユーザ属性の分散表現は当然ながら、使用する行動データの属する行動ドメイン(領域)に強く依存する量となっており、到底、ユーザの(精神面の指標を全体的に捉えた特性である)パーソナリティと解釈されるものとはなっていない。例えば、映画視聴との行動ドメインに係る行動データを用いた場合、例えば当該ユーザの映画の好み、といったような映画視聴に係るユーザ属性しか抽出することができない。またそれ故従来、Sequential URL技術を用いてユーザのパーソナリティを推定する試みは、何らなされてこなかったのである。
【0018】
そこで、本発明は、情報粒度及び信頼性のより高いパーソナリティ情報を生成することができるパーソナリティ情報生成モデル、パーソナリティ推定装置、及びパーソナリティ推定方法を提供することを目的とする。
【課題を解決するための手段】
【0019】
本発明によれば、複数の行動ドメインにおけるユーザの行動ドメインに係る情報から、当該ユーザのパーソナリティを推定するコンピュータを機能させるパーソナリティ情報生成モデルであって、
当該行動ドメイン毎に設定された複数の行動表現生成部であって、各々が、当該行動ドメインにおける当該ユーザの行動の内容を識別する情報から、当該行動ドメインにおける当該ユーザの行動を表現する情報である行動表現情報を生成する、複数の行動表現生成部と、
当該行動ドメイン毎に設定された複数のドメイン特定回帰ニューラルネットワーク(RNN)セルであって、各々が、当該行動ドメインにおける当該ユーザの当該行動表現情報を受け取り、当該ユーザの当該行動表現情報を前回受け取った時点で自ら生成した、RNNの隠れ状態情報に相当するドメイン特定隠れ状態情報に対し、今回受け取った当該ユーザの当該行動表現情報を反映させて、同じくRNNの隠れ状態情報に相当する新たなドメイン特定隠れ状態情報を生成する複数のドメイン特定RNNセルと、
当該ユーザを識別する情報から、当該ユーザを表現する情報であるユーザ表現情報を生成するユーザ表現生成部と、
生成された当該ドメイン特定隠れ状態情報と、生成された当該ユーザ表現情報とを受け取り、当該ユーザの当該ドメイン特定隠れ状態情報を前回受け取った時点で自ら生成した、RNNの隠れ状態情報に相当するドメイン非依存隠れ状態情報に対し、今回受け取った当該ユーザの当該ドメイン特定隠れ状態情報及び当該ユーザ表現情報を反映させて、同じくRNNの隠れ状態情報に相当する新たなドメイン非依存隠れ状態情報を生成するドメイン非依存RNNセルと
してコンピュータを機能させ
複数のドメイン特定RNNセル及びドメイン非依存RNNセルと合わせて、RNNの誤差逆伝播法によって訓練されたユーザ表現生成部は、当該ユーザの当該ユーザ表現情報を、当該ユーザに係るドメイン非依存的な且つ静的な情報という意味で当該ユーザのパーソナリティを表現した情報として生成する
ことを特徴とするパーソナリティ情報生成モデルが提供される。
【0020】
この本発明によるパーソナリティ情報生成モデルにおいて、ドメイン非依存RNNセルは、当該ドメイン特定RNNセルにおいて最近に生成された又は生成された直後の当該ドメイン特定隠れ状態情報を受け取り、当該ドメイン非依存隠れ状態情報を生成することも好ましい。
【0021】
また、本発明によるパーソナリティ情報生成モデルの一実施形態として、本モデルは、当該ドメイン特定RNNセルから出力された当該ドメイン特定隠れ状態情報に対し所定の形の変換処理を施し、当該変換処理の施されたドメイン特定隠れ状態情報をドメイン非依存RNNセルへ入力する第1の変換処理部としてコンピュータを更に機能させることも好ましい。
【0022】
さらに、本発明によるパーソナリティ情報生成モデルにおいて、当該ドメイン特定RNNセルは、当該行動表現情報を受け取る時点からみて最近に生成された当該ドメイン非依存隠れ状態情報も受け取り、このドメイン非依存隠れ状態情報も用いて当該ドメイン特定隠れ状態情報を生成することも好ましい。
【0023】
また、本発明によるパーソナリティ情報生成モデルの他の実施形態として、本モデルは、ドメイン非依存RNNセルから出力された当該ドメイン非依存隠れ状態情報に対し所定の形の変換処理を施し、当該変換処理の施されたドメイン非依存隠れ状態情報を当該ドメイン特定RNNセルへ入力する第2の変換処理部としてコンピュータを更に機能させることも好ましい。
【0024】
さらに、本発明によるパーソナリティ情報生成モデルにおいて、ユーザ表現生成部は、生成した当該ユーザ表現情報を、当該ユーザのパーソナリティを表現した情報として出力することも好ましい。また、ドメイン非依存RNNセルは、生成した当該ドメイン非依存隠れ状態情報を、当該ユーザの動的な心理状態に係る情報である動的心理状態情報として出力することも好ましい。
【0025】
また、本発明に係る複数のドメイン特定RNNセル及びドメイン非依存RNNセルの各々は、新たな隠れ状態情報を生成するべくセルに入力される情報に対し所定の処理を施す忘却ゲート、更新ゲート及びリセットゲートのうちの少なくとも1つを備えていることも好ましい。
【0026】
本発明によれば、また、以上に述べたパーソナリティ情報生成モデルを訓練して得られた学習済みのユーザ表現生成部を用いて、当該ユーザのパーソナリティを表現した情報を生成し、出力するパーソナリティ推定装置が提供される。
【0027】
本発明によれば、さらに、
以上に述べたパーソナリティ情報生成モデルに対し、RNNの誤差逆伝播法によって訓練を行い、
当該訓練によって得られた訓練済みの前記ユーザ表現生成部を用いて、当該ユーザに係るドメイン非依存的な且つ静的な情報という意味で当該ユーザのパーソナリティを表現した情報となっている、当該ユーザの当該ユーザ表現情報を生成し、出力する
ことを特徴とするコンピュータにおけるパーソナリティ推定方法が提供される。
【発明の効果】
【0028】
本発明のパーソナリティ情報生成モデル、パーソナリティ推定装置、及びパーソナリティ推定方法によれば、測定粒度及び信頼性のより高いパーソナリティ情報を生成することができる。
【図面の簡単な説明】
【0029】
図1】本発明によるパーソナリティ情報生成モデルの一実施形態を示す模式図である。
図2】本発明に係るドメイン特定RNNセル及びドメイン非依存RNNセルにおける内部構成の一実施形態を示す機能ブロック図である。
図3】本発明によるパーソナリティ情報生成モデルで生成される各種情報の特徴を説明するための模式図、及び本発明によるパーソナリティ推定装置の一実施形態を示す機能ブロック図である。
図4】本発明によるパーソナリティ情報生成モデルの他の実施形態を示す模式図である。
【発明を実施するための形態】
【0030】
以下、本発明の実施形態について、図面を用いて詳細に説明する。
【0031】
[パーソナリティ情報生成モデル]
図1は、本発明によるパーソナリティ情報生成モデルの一実施形態を示す模式図である。
【0032】
図1に示した本実施形態のパーソナリティ情報生成モデル1は、
(a)パーソナリティ推定対象である推定対象ユーザにおける複数の行動ドメイン(図1では「アイテム購入」及び「動画閲覧」の2つ)に関する情報である「行動ドメイン情報」を用いて、
(b)推定対象ユーザのパーソナリティを表現した情報である「パーソナリティ情報」を生成する
機械学習モデルである。
【0033】
具体的に、パーソナリティ情報生成モデル1は、
(A)複数の行動ドメインの行動ドメイン毎に設定されたドメイン特定回帰ニューラルネットワーク(RNN)セルであって、当該行動ドメインにおける推定対象ユーザの「ドメイン行動情報」を受け取り、前の時点で自ら生成した隠れ状態情報である「ドメイン特定隠れ状態情報」に対し「ドメイン行動情報」を反映させて、新たな「ドメイン特定隠れ状態情報」を生成する複数のドメイン特定RNNセル(図1ではDSL(Domain Specific Layer)1セル11及びDSL2セル12の2つ)と、
(B)推定対象ユーザを識別する情報である「ユーザ識別情報」から、推定対象ユーザを表現する情報である「ユーザ表現情報」を生成するユーザ表現生成部(図1ではユーザ分散表現抽出部10u)と、
(C)上記(A)で生成された「ドメイン特定隠れ状態情報」と、上記(B)で生成された「ユーザ表現情報」とを受け取り、前の時点で自ら生成した隠れ状態情報である「ドメイン非依存隠れ状態情報」に対し、「ドメイン特定隠れ状態情報」及び「ユーザ表現情報」を反映させて、新たな「ドメイン非依存隠れ状態情報」を生成するドメイン非依存RNNセル(図1ではDIL(Domain Independent layer)10)と
してコンピュータを機能させる機械学習モデルとなっている。
【0034】
ここで本実施形態において、上記(A)の「行動ドメイン情報」は、推定対象ユーザの当該行動ドメインにおける(購入や閲覧といった)行動の内容を示す情報(例えば購入したアイテムや閲覧した動画の識別情報)を受け取った行動表現生成部(図1ではアイテム分散表現抽出部11iや動画分散表現抽出部12m)において生成される行動表現情報となっている。したがって、「行動ドメイン情報」(行動表現情報)は、各行動ドメインにおいて行動が発生する度に生成され、その結果、全体として時系列データ群をなすものとなる。
【0035】
また、上記(B)のユーザ表現生成部(ユーザ分散表現抽出部10u)は、後に詳細に説明するが、複数のドメイン特定RNNセル(DSL1セル11及びDSL2セル12)と合せて訓練されるのであり、結果的に当該訓練後は、特定の行動ドメインに偏らないドメイン非依存の表現生成演算(分散表現抽出演算)を実行する。これにより、ここで生成される「ユーザ表現情報」は、推定対象ユーザの「パーソナリティ情報」として把握されるものとなるのである。
【0036】
このように、パーソナリティ情報生成モデル1は、例えば従来使用されてきた、信頼性に関し課題を有する質問紙調査による測定結果を用いることなく又はそれに依存することなく、推定対象ユーザの「行動ドメイン情報」から、信頼性のより高い「パーソナリティ情報」を生成することができるのである。
【0037】
またさらに、このような「パーソナリティ情報」は本実施形態において、推定対象ユーザの「ユーザ識別情報」(例えば当該ユーザを示すone-hotベクトル)を受け取ったユーザ表現生成部(ユーザ分散表現抽出部10u)が出力する、多次元の(例えば数十~数百次元の)ユーザ表現ベクトルであり、例えば多数の数値の羅列となっている。
【0038】
このユーザ表現ベクトルは、本願発明者が、単語分散表現に代表される公知の分散表現(埋め込み(embedding))技術にヒントを得て創作したものであり、以後、パーソナリティ表現ベクトル、又はpersonality embedding vectorとも称することとする。
【0039】
ここで、人工知能による自然言語処理において欠かせない技術となっている単語分散表現では、1つ1つの単語が、例えば数百次元の(多数の数値の羅列である)word embedding vectorで表現され、意味の近い単語同士ほどこのベクトル間の距離が小さくなる。すなわちword embedding vectorは、対応する単語の意味が埋め込まれたものと捉えることができる。また、word embedding vector同士の演算も可能となっており、例えば有名な例として、"king"-"man"+"woman"="queen"といったような加減算を行うことが可能となっている。
【0040】
これと同様にして、本発明に係るpersonality embedding vectorも、対応するユーザのパーソナリティの特徴が埋め込まれたものと捉えることができ、それ故、ベクトル間距離をパーソナリティの類似度としたり、またベクトル同士の演算を行ったりして、パーソナリティに関しさらに有益な情報が導出・生成可能となることも期待されるのである。
【0041】
いずれにしても、パーソナリティ情報生成モデル1で生成される「パーソナリティ情報」(personality embedding vector)は、分散表現による表現情報となっているので、その情報粒度は、(パーソナリティを5次元で表現する)Big Fiveに代表される従来のパーソナリティ指標と比較して各段に高いものとなっている。
【0042】
さらに、分散表現としての「パーソナリティ情報」は、人間が直接に解釈できるものではないが、例えば、様々な用途の機械学習モデルにおける入力データとして利用され、人工知能がユーザのパーソナリティを理解して、当該ユーザの行動予測やサービスのパーソナライズ等を実施するようなことも可能になると期待される。
【0043】
なお、本発明によるパーソナリティ情報生成モデルにおいて、ドメイン特定RNNセルの数、すなわち取り扱う行動ドメインの数は、当然、図1に示したような2つに限定されるものではなく、3つ以上とすることも可能である。また、取り扱う行動ドメインも、図1に示したアイテム購入や動画閲覧に限定されるものではなく、行動主体のパーソナリティに依存する又はその影響を受け得る行動に係るドメインであれば種々様々なものが、本発明に係る行動ドメインとして採用可能である。例えば、行動ドメイン「広告クリック」の時系列データが取得される場合に、「広告クリック」に係るドメイン行動情報を取り込むドメイン特定DNNセルを追加して、パーソナリティ情報生成モデルを構成してもよい。
【0044】
ここで、「パーソナリティ情報」や上述した「ドメイン非依存隠れ状態情報」は、このように互いに異なる複数の又は多数の行動ドメインに係るセルからの「ドメイン特定隠れ状態情報」を受けてドメイン非依存化しているのであり、このうち特に「パーソナリティ情報」は、後に図3を用いて詳細に説明するが、推定対象ユーザにおける静的且つドメイン非依存の特性としてのパーソナリティに係る情報と捉えることが可能となるのである。
【0045】
[モデル構成,パーソナリティ推定方法]
以下、本実施形態のパーソナリティ情報生成モデル1の構成について、より詳細に説明を行う。同じく図1によれば、パーソナリティ情報生成モデル1は、
(ア)行動ドメイン「アイテム購入」に係るドメイン特定RNNセルとしてのDSL1セル11と、ユーザ分散表現抽出部11uと、アイテム分散表現抽出部11iと、出力層11oと、
(イ)行動ドメイン「動画閲覧」に係るドメイン特定RNNセルとしてのDSL2セル12と、ユーザ分散表現抽出部12uと、動画分散表現抽出部12mと、出力層12oと、
(ウ)ドメイン非依存RNNセルとしてのDILセル10と、ユーザ表現生成部としてのユーザ分散表現抽出部10uと、出力層10oと
を、コンピュータ(に搭載されたプログラム)によって具現される機能構成部として備えている。
【0046】
ここで図1には、上述した(ア)~(ウ)の機能構成部(図1の左端側の機能ブロック群)が実行する処理を、時間経過の向きが右向きとなっている時間軸上で展開した様子が示されている。なお、上記(ア)~(ウ)の各々について設定された計3つの時間軸は、それぞれ独自の値をとる時点についての時間軸となっている。
【0047】
また、各時間軸における時点の表記であるが、例えばDSL2セル12に係る時点(t2+1)は、DSL2セル12が時点t2でドメイン行動情報(動画embedding vector)を受け取った後、次にドメイン行動情報(動画embedding vector)を受け取った時点を意味するものとする。ここでその次に受け取った時点は当然、(t2+2)となる。さらに、時点(t2+1)から見て、時点t2は「前の時点」となるのである。また、この時点(t2+1)で処理を行うDSL2セル12を、以後行う説明の便宜上、DSL2セル12(t2+1)と称することにする。またさらに、DSL1セル11やDILセル10についても以後、同様の処理時点の表記、及び処理時点を含む表記を行うこととする。
【0048】
以下、上述した各機能構成部について具体的に説明を行う。同じく図1において、時点t1におけるアイテム分散表現抽出部11iであるアイテム分散表現抽出部11i(t1)は、時点t1において「(推定対象ユーザである)ユーザUserAによってアイテムitem1が購入された」とのイベントを受けて、
(a)アイテムitem1のアイテム識別情報であるone-hotベクトルi1(t1)を受け取り、
(b)受け取ったone-hotベクトルi1(t1)に対し、アイテム分散表現抽出演算子としての行列Wi DSL1を作用させて(積算して)、アイテムitem1のアイテム表現ベクトル(ドメイン行動情報)r_i1(t1)を生成する。
【0049】
また、時点t1におけるユーザ分散表現抽出部11uであるユーザ分散表現抽出部11u(t1)は、上記(a)のone-hotベクトルi1(t1)の受け取りに合わせ、
(c)ユーザUserAのユーザ識別情報であるone-hotベクトルua(t1)を受け取り、
(d)受け取ったone-hotベクトルua(t1)に対し、ユーザ分散表現抽出演算子としての行列Wu DSL1を作用させて(積算して)、ユーザUserAの行動ドメイン「アイテム購入」に係るユーザ表現ベクトルr_ua(t1)を生成する。
【0050】
同じく図1において、時点t1におけるDSL1セル11であるDSL1セル11(t1)は、
(e)上記(b)で生成されたアイテム表現ベクトル(ドメイン行動情報)r_i1(t1)と、上記(d)で生成されたユーザ表現ベクトルr_ua(t1)とを受け取り、さらに、
(f)(この後詳細に説明するが、)上記(e)のドメイン行動情報(r_i1(t1))を受け取る時点t1からみて最近に(図1では時点tIに)生成されたドメイン非依存隠れ状態情報hDIL,(tI)も受け取り、
(g)前の時点(t1-1)で自ら生成したドメイン特定隠れ状態情報hDSL1,(t1-1)に対し、受け取ったアイテム表現ベクトル(ドメイン行動情報)r_i1(t1)、ユーザ表現ベクトルr_ua(t1)及びドメイン非依存隠れ状態情報hDIL,(tI)を反映させて、新たなドメイン特定隠れ状態情報hDSL1,(t1)を生成する(この生成処理については、後に図2を用いてより具体的に説明する)。
【0051】
以上、アイテム分散表現抽出部11i、ユーザ分散表現抽出部11u、及びDSL1セル11における時点t1での処理について説明を行ったが、勿論他の時点での処理、例えば次の時点(t1+1)に係るアイテム分散表現抽出部11i(t1+1)、ユーザ分散表現抽出部11u(t1+1)、及びDSL1セル11(t1+1)での処理、についても上記(a)~(g)と同様の処理が実行される。
【0052】
さらに、他の行動ドメイン(動画閲覧)に係る動画分散表現抽出部12m、ユーザ分散表現抽出部12u、及びDSL2セル12における各時点での処理、例えば時点t2に係る動画分散表現抽出部12m(t2)、ユーザ分散表現抽出部12u(t2)、及びDSL2セル12(t2)での処理、についても、上記(a)~(g)と同様の処理が実行される。ただし、この場合、例えば時点t2での動画分散表現抽出部12m(t2)は、
(b’)受け取った(ユーザUserAによって閲覧された動画Mov1を示す)one-hotベクトルm1(t2)に対し、動画分散表現抽出演算子としての行列Wm DSL2を作用させて(積算して)、動画Mov1の動画表現ベクトル(ドメイン行動情報)r_m1(t2)を生成する
のである。また、DSL2セル12(t2)は、このドメイン行動情報r_m1(t2)を取り入れて処理を行うことになる。
【0053】
同じく図1において、時点tIにおけるユーザ分散表現抽出部(ユーザ表現生成部)10uであるユーザ分散表現抽出部10u(tI)は、
(h)ユーザUserAのユーザ識別情報であるone-hotベクトルua(tI)を受け取り、
(i)受け取ったone-hotベクトルua(tI)に対し、ユーザ分散表現抽出演算子としての行列Wu DILを作用させて(積算して)、ユーザUserAの行動ドメインに依存しないユーザ表現ベクトルr_ua(tI)を生成する。
【0054】
また、時点tIにおけるDILセル10であるDILセル10(tI)は、
(j)上記(i)で生成されたユーザ表現ベクトルr_ua(tI)を受け取り、さらに、
(k)時点tIからみて最近に(図1では時点t2に)生成されたドメイン特定隠れ状態情報hDSL2,(t2)も受け取り、
(l)前の時点(tI-1)で自ら生成したドメイン非依存隠れ状態情報hDIL,(tI-1)に対し、受け取ったユーザ表現ベクトルr_ua(tI)及びドメイン特定隠れ状態情報hDSL2,(t2)を反映させて、新たなドメイン非依存隠れ状態情報hDIL,(tI)を生成する(この生成処理についても、後に図2を用いてより具体的に説明する)。
【0055】
なお、以上説明した処理(h)~(l)に係る時点tIは、例えば定期的に(所定時間経過毎に)設定された時点(の1つ)とすることも可能ではあるが、本実施形態ではより好適な設定として、いずれかのドメイン特定RNNセル(図1ではDSL1セル11及びDSL2セル12のいずれか)においてドメイン特定隠れ状態情報が生成された直後の時点となっている。
【0056】
言い換えると、例えば以上に説明した場合においては、時点t2においてDSL2セル12(t2)がドメイン特定隠れ状態情報hDSL2,(t2)を生成したのを受けて、その直後(すなわち時点tI)に、上記処理(h)~(l)が発動するのである。またさらに、同じく図1に示したように、時点t1においてDSL1セル11(t1)がドメイン特定隠れ状態情報hDSL1,(t1)を生成したのを受け、その直後(時点tI+1)に、生成された直後のドメイン特定隠れ状態情報hDSL1,(t1)を受け取って、上記処理(h)~(l)と同様の処理が実行されるのである。
【0057】
このように本実施形態では、DILセル10は、いずれかのドメイン特定RNNセルでドメイン特定隠れ状態情報が生成される度に、当該ドメイン特定隠れ状態情報を受け取って、「ドメイン非依存隠れ状態情報」を生成する。
【0058】
ここで図1において、推定対象であるユーザUserAは、「(時点t2で)動画Mov1を閲覧」→「(時点t1で)アイテムitem1を購入」→「(時点t2+1で)動画Mov2を閲覧」をこの順で行っている。DILセル10は、これらの行動に係る表現ベクトル(ドメイン行動情報)を順次受け取ったドメイン特定RNNセルで生成されたドメイン特定隠れ状態情報を順次受け取り、これにより、これらのドメイン特定隠れ状態情報の生成(受け取り)順序や前後関係の情報も加味されており、特定の行動ドメインでの行動内容だけに依存することのない(ドメイン非依存化した)「ドメイン非依存隠れ状態」を生成することが可能となるのである。
【0059】
さらに本実施形態では、上記(f)で述べたように、このような特徴的な「ドメイン非依存隠れ状態」が適宜、ドメイン特定RNNセル(DSL1セル11やDSL2セル12)への入力として用いられる。その結果、後にDILセル10が受け取るドメイン特定隠れ状態情報も、上述したような特徴が反映されたものとなり、その結果、「ドメイン非依存隠れ状態」のドメイン非依存化が促進する。言い換えると、DILセル10はさらに、特定の行動ドメインに依存しない、推定対象ユーザの全体的な属性を反映した情報処理を実行することができるようになるのである。
【0060】
図2は、本発明に係るドメイン特定RNNセル及びドメイン非依存RNNセルにおける内部構成の一実施形態を示す機能ブロック図である。
【0061】
最初に図2(A)には、時点tpでのドメイン特定RNNセルであるDSL(p)セル(10+p)(tp)(p=1, 2, ・・・)の内部構成が示されている。具体的に、DSL(p)セル(10+p)(tp)は、RNNを構成可能な公知のGRU(Gated Recurrent Unit)を採用した構成となっており、以下に示す機能構成部(a)~(f)を備えている。
(a)[T]:複数の入力ベクトルに重み行列を積算し、さらに積算結果にバイアスベクトルを加算して、得られたベクトルを出力する。なお、図2(A)における2つの[T]はそれぞれ独立した(互いに異なる)重み行列及びバイアスベクトルを有する。
(b)[σ]:入力ベクトルの各要素をsigmoid関数へ入力し、得られたベクトルを出力する。図2(A)における2つの[σ]は、それぞれリセットゲートr及び更新ゲートuとして機能する。
(c)[○の中に・]:2つの入力ベクトルの要素同士を乗じ、得られたベクトルを出力する。
(d)[-1]:入力ベクトルの各要素に-1を乗じ、得られたベクトルを出力する。
(e)[tanh]:入力ベクトルの各要素をtanh関数へ入力し、得られたベクトル(隠れ状態候補k)を出力する。
(f)[+]:2つの入力ベクトルの要素同士を足し合わせ、 得られたベクトルを出力する。
【0062】
ここで、更新ゲートu(一方の[σ])は、入力されたr_ua(tp)、r_ip(tp)や、hDIL,(tI-1)を変換した情報に基づき、1つ前の(最後の)ドメイン特定隠れ状態情報hDSLp,(tp-1)からどれだけの情報を保持し取り込むかを決定する。また、リセットゲートr(他方の[σ])は、1つ前の(最後の)ドメイン特定隠れ状態情報hDSLp,(tp-1)から捨てるべき情報を決定する。DSL(p)セル(10+p)(tp)は、このような処理によって、対応する行動ドメインに係る行動の時系列データとなっているドメイン行動情報における動的な(時間に依存する)情報を反映した「ドメイン特定隠れ状態情報」を生成することが可能となるのである。
【0063】
次いで図2(B)には、時点tIでのドメイン非依存RNNセルであるDILセル10(tI)の内部構成が示されている。このDILセル10(tI)は、上述したDSL(p)セル(10+p)(tp)と同様の構成となっており、具体的には上記機能構成部(a)~(f)を含むGRUを採用した構成となっている。
【0064】
これにより、DILセル10(tI)は、複数のドメイン行動情報における動的な(時間に依存する)情報を反映した複数のドメイン特定隠れ状態情報を取り込んでドメイン非依存化した、推定対象ユーザの属性に関する動的な(時間に依存する)情報となっている「ドメイン非依存隠れ状態情報」を生成することが可能となるのである。
【0065】
なお、図2(A)に示したドメイン特定RNNセル(DSL(p)セル(10+p)(tp))においても、図2(B)に示したドメイン非依存RNNセル(DILセル10(tI))においても、内部構成としてGRU以外の様々なRNNユニットを採用することが可能であり、例えば、入力ゲート、出力ゲート及び忘却ゲートを備えたLSTM(Long-Short Term Memory)を採用してもよい。いずれにしても、パーソナリティ情報生成モデル1における複数のドメイン特定RNNセル及びドメイン非依存RNNセルの各々については、新たな隠れ状態情報を生成するべくセルに入力される情報に対し所定の処理を施す忘却ゲート、更新ゲート及びリセットゲートのうちの少なくとも1つを備えた構成とすることも好ましいのである。
【0066】
<パーソナリティ情報生成モデルの訓練>
図1に戻って、ここでパーソナリティ情報生成モデル1の訓練(トレーニング)について説明を行う。
【0067】
最初に、DSL1セル11、アイテム分散表現抽出部11i及びユーザ分散表現抽出部11uの訓練(トレーニング)においては、多数のユーザについて各ユーザが購入したアイテムの識別情報であるone-hotベクトルの時系列データを準備し、これを順次アイテム分散表現抽出部11iへ入力する。また合わせて、当該ユーザのユーザ識別情報であるone-hotベクトルをユーザ分散表現抽出部11uへ入力する。これにより、DSL1セル11は、各時点において前の時点でのドメイン特定隠れ状態情報を更新して当該時点でのドメイン特定隠れ状態情報を生成し、これを受けて出力層11oが、購入アイテムの予測結果(次の時点に当該ユーザが購入すると予測されるアイテムの識別情報、又は各候補アイテムの購入される確率)を出力する(本実施形態において、出力層11oはそのような出力を行うように設定されている)。
【0068】
ここで、出力されたアイテムの予測結果と正解のアイテムの識別情報(実際に購入されたアイテムのone-hotベクトル)との差異を損失とし、公知のRNNの誤差逆伝播法を用いて、DSL1セル11内の各パラメータ([T]の重み行列やバイアスベクトルを決めるパラメータ等)や、行列Wi DSL1及び行列Wu DSL1を決めるパラメータを調整する訓練を行うのである。
【0069】
なお、DSL2セル12、動画分散表現抽出部12m及びユーザ分散表現抽出部12uの訓練についても、上記のDSL1セル11等の訓練と同様にして実施することができる。具体的にこの場合、出力層12oから出力された閲覧動画の予測結果(次の時点に当該ユーザが閲覧すると予測される動画の識別情報、又は各候補動画の閲覧される確率)と正解の動画の識別情報(実際に閲覧された動画のone-hotベクトル)との差異を損失とし、公知のRNNの誤差逆伝播法を用いて、DSL2セル12内の各パラメータ([T]の重み行列やバイアスベクトルを決めるパラメータ等)や、行列Wm DSL2及び行列Wu DSL2を決めるパラメータを調整する訓練を行うのである。さらに、3つ目又はそれ以降のドメイン特定RNNセル系が設定されている場合も、同様にして訓練することが可能である。
【0070】
次いで、DILセル10及びユーザ分散表現抽出部10uの訓練においては、各ドメイン特定RNNセル(DSL1セル11及びDSL2セル12の各々)における上述した損失を、各ドメイン特定RNNセルとDILセル10との間のリンクを通して、DILセル10及びユーザ分散表現抽出部10uへ逆伝播させて訓練を行う。例えば、図1において、DSL1セル11での時点t1までの入力に基づく購入アイテムの予測結果と正解アイテムの識別情報との差異である損失は、ドメイン非依存隠れ状態情報hDIL,(tI)の伝達されるリンクを通して逆伝播し、DILセル10内の各パラメータ([T]の重み行列やバイアスベクトルを決めるパラメータ等)や、ユーザ分散表現抽出部10uの行列Wu DILを決めるパラメータの訓練に用いられるのである。
【0071】
すなわち本実施形態において、DILセル10及びユーザ分散表現抽出部10uの訓練は、ドメイン非依存RNNセル独自の教師データを用いることなく、ドメイン特定RNNセル(DSL1セル11及びDSL2セル12)からの誤差逆伝播のみで実施されるのである。
【0072】
図3は、本発明によるパーソナリティ情報生成モデルで生成される各種情報の特徴を説明するための模式図、及び本発明によるパーソナリティ推定装置の一実施形態を示す機能ブロック図である。
【0073】
図3の上方に示したように、パーソナリティを含む広い意味でのユーザの属性は、
(a)動的な(時間に依存する、又は時間変化し易い)属性か、静的な(時間に依存しない、又は時間変化し難い)属性か、及び
(b)ドメイン依存的な(特定の行動ドメインにのみ影響を与える、又は特定の行動ドメインに係るものである)属性か、ドメイン非依存的な(様々な行動ドメインの行動に影響し得る、又は特定の行動ドメインにのみ係るものではない)属性か
といった観点から、4つのグループに分類することができる。具体的に図3において、当該4つのグループはそれぞれ、上記(a)に係る横軸と上記(b)に係る縦軸とで構成されるユーザ属性グラフにおける第1~第4象限に係るグループとなっている。
【0074】
ここでユーザ属性の1つであるパーソナリティは、静的であって且つドメイン非依存であるので、第1象限に係るグループに属することになる。したがって、あるユーザについての行動ドメインに係る時系列データを用いて、当該ユーザのパーソナリティを推定する場合には、その推定の過程で、ユーザ属性情報からこの第1象限に相当する成分のみを分離抽出する必要が生じる。しかしながら、例えば上述した従来技術としてのSequential URL技術によっても、このような分離抽出を行うことはできなかった。
【0075】
これに対し、 パーソナリティ情報生成モデル1における学習済み(訓練済み)のDILセル10及びユーザ分散表現抽出部10uは、DILセル10が複数のドメイン特定RNNセル(DSL1セル11及びDSL2セル12)からドメイン特定隠れ状態情報を適宜受け取り、さらに各ドメイン特定RNNセルへ適宜ドメイン非依存隠れ状態情報を与えてきた過程でドメイン非依存化しており、このうち特に、ユーザ分散表現抽出部10u(の行列Wu DIL)は、ユーザの識別情報を受けて当該ユーザの静的な属性に係る情報を出力するようになっている。
【0076】
その結果、ユーザ分散表現抽出部10u(の行列Wu DIL)の出力するユーザ表現ベクトルr_uaは、静的且つドメイン非依存に対応する第1象限に属するユーザ属性の情報となり、したがって、「パーソナリティ情報」であるパーソナリティ表現ベクトル(personality embedding vector)とみなすことができるのである。ここで勿論、ユーザ分散表現抽出部10uは、生成したパーソナリティ表現ベクトル(personality embedding vector)を、「パーソナリティ情報」としてモデルの外部へ出力してもよい。さらに、この学習済み(訓練済み)のユーザ分散表現抽出部10u(の行列Wu DIL)を取り出し、パーソナリティ表現抽出器として利用することも可能である。
【0077】
また、学習済み(訓練済み)のDILセル10は、上述したようにドメイン非依存化しているので、このDILセル10から出力されるドメイン非依存隠れ状態情報hDILは、行動ドメイン全般に影響し得る又は特定の行動ドメインに依存しない、処理時点に係るユーザ属性を反映した情報となっている。すなわち、このドメイン非依存隠れ状態情報hDILは、動的且つドメイン非依存に対応する第2象限に属するユーザ属性の情報となり、したがって、ユーザの動的な心理状態に係る情報である動的心理状態情報とみなすことができるのである。ここで勿論、DILセル10は、生成したメイン非依存隠れ状態情報hDILを、動的心理状態情報としてモデルの外部へ出力してもよい。
【0078】
ちなみに、この動的心理状態情報には、例えばユーザの疲労度、感情状態や、ムード(忙しい/暇である、気分が良い/悪い等)が該当する。DILセル10は、このような動的に変化し且つ様々な行動ドメインの行動に影響し得るユーザ属性を生成することも可能となっているのである。ここで、所定期間において複数生成された時系列データとしての動的心理状態情報は、当該所定期間におけるユーザの動的心理状態の変遷を表す情報と捉えることもできるのである。
【0079】
また、以上説明したことをまとめると、パーソナリティ情報生成モデル1は、DILセル10及び複数のドメイン特定RNNセル(DSL1セル11及びDSL2セル12)を、互いに隠れ状態情報をやり取りさせつつ稼働させることによって、ドメイン依存の(第3及び第4象限の)ユーザ属性と、ドメイン非依存の(第1及び第2象限の)ユーザ属性とを分離していることが理解されるのである。
【0080】
さらにそのやり取りにおいて、自身の生成した隠れ状態情報を、その順序や前後関係も反映した形で(すなわち各種行動発生の時系列性も反映した形で)相手のセルに取り込ませることによって、結局、DILセル10とそれに繋がったユーザ分散表現抽出部10uとの間における動的な(第2象限の)ユーザ属性と、静的な(第1象限の)ユーザ属性との分離がより促進されるようになることも理解される。
【0081】
ちなみに、各ドメイン特定RNNセル(DSL1セル11及びDSL2セル12の各々)が出力するドメイン特定隠れ状態情報は、該当する行動ドメインの行動についての動的な(時間に依存する、又は時間変化し易い)ユーザ属性を反映した情報となっており、すなわち第3象限のユーザ属性に係る情報であると理解される。ここで具体的に、この第3象限のユーザ属性は、アイテム購入履歴や動画閲覧履歴等に係る心理状態情報、例えば「見続けた特定ジャンルの映画に飽きてしまったという感情」や「別のジャンルの映画を見たいとの感情」、さらには「見続けた映画の中で気に入った俳優が出演している他の映画に興味を抱くという感情」といったような、ユーザの経た履歴故に生じる心理状態の情報と捉えることができる。
【0082】
また、合わせて訓練されたユーザ分散表現抽出部(11u,12u)が出力するユーザ表現ベクトルr_uaは、該当する行動ドメインの行動についての静的な(時間に依存しない、又は時間変化し難い)ユーザ属性を反映した情報となっており、すなわち第4象限のユーザ属性(例えば購入アイテムの傾向や動画の好み)に係る情報であると理解されるのである。
【0083】
ここで勿論、このような第3象限のユーザ属性に係る情報も、第4象限のユーザ属性に係る情報も、モデル外に出力されて、様々な場面で(例えば、該当する行動ドメインに関係する企業でのマーケティング活動において)利用されることも可能となる。
【0084】
[モデルの他の実施形態]
図4は、本発明によるパーソナリティ情報生成モデルの他の実施形態を示す模式図である。
【0085】
図4に示すように、本実施形態のパーソナリティ情報生成モデル1’は、
(a1)DSL1セル11から出力されたドメイン特定隠れ状態情報hDSL1に対し所定の形の変換処理(f1out)を施し、変換処理(f1out)の施されたドメイン特定隠れ状態情報f1out(hDSL1)をDILセル10へ入力する、第1の変換処理部としての変換処理部11f1outと、
(a2)DSL2セル12から出力されたドメイン特定隠れ状態情報hDSL2に対し所定の形の変換処理(f2out)を施し、変換処理(f2out)の施されたドメイン特定隠れ状態情報f2out(hDSL2)をDILセル10へ入力する、第1の変換処理部としての変換処理部12f2outと
を備えている。
【0086】
ちなみに図4では、変換処理部11f1out及び変換処理部12f2outがそれぞれ、時点t1及び時点(t2+1)に展開された場合の状況が示されている。また、このような第1の変換処理部は、設定されたドメイン特定RNNセルの数(図4では2つ)だけ用意されることも好ましい。
【0087】
さらに、各変換処理(f1out,f2out)は例えば、ドメイン特定隠れ状態情報に対し重み行列を積算する処理であってもよく、それにバイアスベクトルを更に足し合わせる処理であってもよい。またさらに、それをsigmoid関数、tanh関数や、ReLu関数等へ入力して得られた値を出力する処理とすることも可能である。いずれにしても、第1の変換処理部(変換処理部11f1out及び変換処理部12f2out)を設定してこのような変換処理を実行することによって、各行動ドメインにおけるユーザの行動がドメイン非依存の動的なユーザ属性(図3における第2象限のユーザ属性)に与える影響を調整することができるのである。
【0088】
ここで、このドメイン非依存の動的なユーザ属性は、疲労度、眠気、感情や、ムードといったような動的心理特性となるが、このような特性に対し各行動ドメインにおけるユーザの行動がどの程度の影響を与えるかは、行動ドメイン毎に異なってくると考えらえる。例えば、日用品のショッピングサイトにおける購買行動よりも、動画配信サービスにおける動画閲覧行動のほうが、疲労度、感情や、ムードに与える影響は大きいと考えられる。したがって、ドメイン特定RNNセル毎に(異なる変換処理を実行する)第1の変換処理部を設定することで、このような影響の調整が可能となるのである。
【0089】
また、本実施形態のパーソナリティ情報生成モデル1’は、さらに、
(b1)DILセル10から出力されたドメイン非依存隠れ状態情報hDILに対し所定の形の変換処理(f1in)を施し、変換処理(f1in)の施されたドメイン非依存隠れ状態情報f1in(hDIL)をDSL1セル11へ入力する、第2の変換処理部としての変換処理部11f1inと、
(b2)DILセル10から出力されたドメイン非依存隠れ状態情報hDILに対し所定の形の変換処理(f2in)を施し、変換処理(f2in)の施されたドメイン非依存隠れ状態情報f2in(hDIL)をDSL2セル12へ入力する、第2の変換処理部としての変換処理部12f2inと、
を備えている。
【0090】
ちなみに図4では、変換処理部11f1in及び変換処理部12f2inについてもそれぞれ、時点t1及び時点(t2+1)に展開された場合の状況が示されている。また、このような第2の変換処理部についても、設定されたドメイン特定RNNセルの数(図4では2つ)だけ用意されることも好ましい。
【0091】
さらに各変換処理(f1in,f2in)も、第1変換処理部における変換処理(f1inやf2in)と同様の形の処理とすることができる。いずれにしても、第2の変換処理部(変換処理部11f1in及び変換処理部12f2in)を設定してこのような変換処理を実行することによっても、結局、行動ドメインに依存しないユーザ属性が、各行動ドメインに依存する動的なユーザ属性(図3における第3象限のユーザ属性,動的心理状態情報)に与える影響を調整することが可能となるのである。
【0092】
また、以上に説明した第1の変換処理部も第2の変換処理部も、DSL1セル11やDSL2セル12と合わせて訓練されることも好ましい。これにより、上述したような各行動ドメインの行動が及ぼす影響の調整を、より確実に実施することが担保される。
【0093】
[パーソナリティ推定装置,パーソナリティ推定プログラム]
以下、図3に戻って、以上に説明したようなパーソナリティ情報生成モデル1又はパーソナリティ情報生成モデル1’(図4)を搭載しており、推定対象ユーザのパーソナリティを推定するパーソナリティ推定装置9について説明する。ちなみに以下、本装置はパーソナリティ情報生成モデル1を搭載したものとして説明を行う。
【0094】
図3の下部に示した本実施形態のパーソナリティ推定装置9は、搭載したパーソナリティ情報生成モデル1を訓練して得られた学習済みのユーザ分散表現抽出部10u(ユーザ表現生成部)を用いて、推定対象ユーザの「パーソナリティ情報」を生成し、出力する。
【0095】
具体的に図3において、パーソナリティ推定装置9の入力部91は、通信機能を備えていて、例えば外部に設置された行動ドメイン関連の管理サーバ(例えばウェブショッピング管理サーバや動画配信管理サーバ)から、多数のユーザにおける各行動ドメインでの行動に係る時系列情報を取得し、訓練部92へ出力する。また、推定対象ユーザに係る情報を受け取り、パーソナリティ推定部93へ出力する。
【0096】
訓練部92は、受け取った多数のユーザにおける各行動ドメインでの行動に係る時系列情報から教師データを生成し、これを用いてパーソナリティ情報生成モデル1の訓練を実施する。
【0097】
パーソナリティ推定部93は、受け取った推定対象ユーザに係る情報から、推定対象ユーザのユーザ識別情報(one-hotベクトル)を生成して、これを、訓練を受けたパーソナリティ情報生成モデル1における学習済みのユーザ分散表現抽出部10u(ユーザ表現生成部)へ入力し、このユーザ分散表現抽出部10uから、推定対象ユーザのユーザ表現ベクトルを取得する。このユーザ表現ベクトルはすで説明したように、推定対象ユーザのパーソナリティの分散表現と捉えることができ、すなわちパーソナリティ表現ベクトル(personality embedding vector)とみなすことができるものとなっている。
【0098】
出力部94は、受け取ったパーソナリティ表現ベクトル(personality embedding vector)を、推定対象ユーザの「パーソナリティ情報」として(通信機能を備えている場合に)外部へ送信したり、(表示機能を備えている場合に)表示したりする。
【0099】
ここで、訓練部92及びパーソナリティ推定部93は、本発明によるパーソナリティ推定方法の一実施形態を実施する主要機能構成部であり、また、本発明によるパーソナリティ推定プログラムの一実施形態を保存したプロセッサ・メモリの機能と捉えることもできる。またこのことから、パーソナリティ推定装置9は、パーソナリティ推定の専用装置であってもよいが、本発明によるパーソナリティ推定プログラムを搭載した、例えばクラウドサーバ、非クラウドのサーバ装置、パーソナル・コンピュータ(PC)、ノート型若しくはタブレット型コンピュータ、又はスマートフォン等とすることも可能である。
【0100】
以上詳細に説明したように、本発明によれば、例えば従来使用されてきた質問紙調査による測定結果を用いることなく又はそれに依存することなく、推定対象ユーザの行動ドメイン情報から、情報粒度及び信頼性のより高いパーソナリティ情報を生成することができる。さらに、このように生成したユーザのパーソナリティ情報を用いて、例えばマーケティングの分野において、提供する商品・サービスをパーソナライズし、例えば好適な又は有効なレコメンド等を実施することも可能となるのである。
【0101】
また、例えば子供達に対し質の高い、且つ個々の性格に合った教育を提供するために、本発明によって生成した当該子供達の(その行動内容から推定した)パーソナリティ情報を活用することもできる。すなわち本発明によれば、国連が主導する持続可能な開発目標(SDGs)の目標4「すべての人々に包摂的かつ公平で質の高い教育を提供し、生涯学習の機会を促進する」に貢献することも可能となるのである。
【0102】
さらに、例えば大人達に対し、環境に害を及ぼさないディーセント・ワーク(働きがいのある人間らしい仕事)や、質の高い、且つ個々の性格に適した仕事を提供するために、本発明によって生成した当該大人達の(その行動内容から推定した)パーソナリティ情報を活用することもできる。すなわち本発明によれば、国連が主導するSDGsの目標8「すべての人々のための包摂的かつ持続可能な経済成長、雇用およびディーセント・ワークを推進する」に貢献することも可能となるのである。
【0103】
またさらに、例えば消費者に対し、当該消費者の性格や生活行動の現状に沿った、持続可能な消費とライフスタイルについての教育を提供するために、本発明によって生成した当該消費者の(その行動内容から推定した)パーソナリティ情報や生活行動履歴・消費活動履歴を活用することもできる。すなわち本発明によれば、国連が主導するSDGsの目標12「持続可能な消費と生産のパターンを確保する」に貢献することも可能となるのである。
【0104】
上述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。上述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0105】
1、1’ パーソナリティ情報生成モデル
10 DILセル(ドメイン非依存RNNモデル)
10o、11o、12o 出力層
10u ユーザ分散表現抽出部(ユーザ表現生成部)
11 DSL1セル(ドメイン特定RNNモデル)
11f1in、11f1out、12f2in、12f2out 変換処理部
11i アイテム分散表現抽出部
11u、12u ユーザ分散表現抽出部
12 DSL2セル(ドメイン特定RNNモデル)
12m 動画分散表現抽出部
9 パーソナリティ推定装置
91 入力部
92 訓練部
93 パーソナリティ推定部
94 出力部
図1
図2
図3
図4