(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-05-30
(45)【発行日】2024-06-07
(54)【発明の名称】情報処理装置、情報処理方法、およびプログラム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20240531BHJP
【FI】
G06Q50/10
(21)【出願番号】P 2023124134
(22)【出願日】2023-07-31
【審査請求日】2023-07-31
【新規性喪失の例外の表示】特許法第30条第2項適用 ウェブサイトの公開日:令和5年5月10日 ウェブサイトのアドレス:https://arxiv.org/abs/2305.13931
(73)【特許権者】
【識別番号】399037405
【氏名又は名称】楽天グループ株式会社
(74)【代理人】
【識別番号】100109380
【氏名又は名称】小西 恵
(74)【代理人】
【識別番号】100109036
【氏名又は名称】永岡 重幸
(72)【発明者】
【氏名】石川 詩苑
(72)【発明者】
【氏名】劉 雲青
【審査官】塩屋 雅弘
(56)【参考文献】
【文献】米国特許出願公開第2009/0265290(US,A1)
【文献】米国特許出願公開第2020/0286154(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
k個(kは2以上の自然数)の位置にn個(nは2以上の自然数)のアイテムそれぞれが配置される確率を表す配置確率を取得する取得部と、
前記n個のアイテムを、前記n個のアイテムの特徴の抽象表現を表すm個(mは2以上の自然数)の埋め込みベクトルに変換する変換部と、
前記n個のアイテムから前記m個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出する算出部と、
前記配置確率の分布と前記割当確率の分布を用いて、前記k個の位置それぞれに対して前記m個の埋め込みベクトルそれぞれが配置される確率表現を導出する導出部と、
を有することを特徴とする情報処理装置。
【請求項2】
前記割当確率において、前記n個のアイテムのそれぞれについて、アイテムを前記埋め込みベクトルに割り当てる条件付確率の和は1である、ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記n個のアイテムはそれぞれa個(aは2以上の自然数)の特徴と関連付けられており、
前記変換部は、前記a個の特徴と関連付けられた前記n個のアイテムを、前記m個の埋め込みベクトルに変換し、ここで、mはaより小さい、ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記割当確率に基づいて、ユーザが、前記m個の埋め込みベクトルが配置された前記k個の位置それぞれを認識する確率を表す位置バイアスを推定する推定部を更に有する、ことを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記割当確率に基づいて、ユーザが、前記m個の埋め込みベクトルが配置された前記k個の位置それぞれを認識する確率を表す第1の位置バイアスを推定する第1の推定部と、
前記配置確率に基づいて、ユーザが、前記n個のアイテムが配置された前記k個の位置それぞれを認識する確率を表す第2の位置バイアスを推定する第2の推定部とを更に有する、ことを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記配置確率の分布の偏りを算出する偏り算出部を更に有し、
前記配置確率の分布の偏りが所定のレベル以上の場合に、前記第1の推定部が前記第1の位置バイアスを推定し、
前記配置確率の分布の偏りが前記所定のレベル未満の場合に、前記第2の推定部が前記第2の位置バイアスを推定する、
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記偏り算出部は、前記配置確率の分布において、前記k個の位置のうち、前記n個のアイテムが配置された割合を、前記配置確率の分布の偏りとして算出する、ことを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記偏り算出部は、前記k個の位置における前記n個のアイテムの一様分布に対する前記配置確率の分布の類似度を、前記配置確率の分布の偏りとして算出する、ことを特徴とする請求項6に記載の情報処理装置。
【請求項9】
前記偏り算出部は、前記類似度を、カルバックライブラー情報量により算出する、ことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
k個(kは2以上の自然数)の位置にn個(nは2以上の自然数)のアイテムそれぞれが配置される確率を表す配置確率を取得することと、
前記n個のアイテムを、前記n個のアイテムの特徴の抽象表現を表すm個(dは2以上の自然数)の埋め込みベクトルに変換することと、
前記n個のアイテムから前記m個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出することと、
前記配置確率の分布と前記割当確率の分布を用いて、前記k個の位置それぞれに対して前記m個の埋め込みベクトルそれぞれが配置される確率表現を導出すること、
を含むことを特徴とする情報処理方法。
【請求項11】
情報処理方法をコンピュータに実行させるためのプログラムであって、前記情報処理方法は、
k個(kは2以上の自然数)の位置にn個(nは2以上の自然数)のアイテムそれぞれが配置される確率を表す配置確率を取得することと、
前記n個のアイテムを、前記n個のアイテムの特徴の抽象表現を表すm個(mは2以上の自然数)の埋め込みベクトルに変換することと、
前記n個のアイテムから前記m個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出することと、
前記配置確率の分布と前記割当確率の分布を用いて、前記k個の位置それぞれに対して前記m個の埋め込みベクトルそれぞれが配置される確率表現を導出すること、
を含む、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
近年、ユーザが利用するウェブサービスにおいて、商品や検索結果といったあらゆるアイテムのランキングが広く提供されている。このようなランキングを構築するために、ユーザによるクリック履歴といった、クリックデータが利用されている。
クリックデータは、ユーザの明示的な発言や評価でなく、ユーザの行動によって生成されるため、暗黙のフィードバックと呼ぶことができる。すなわち、クリックデータは、ユーザが好き嫌いを言うのではなく、システムやウェブサイトと対話する際に、実際にどのように行動したかを反映するものでありうる。このような点から、クリックデータは、暗黙のうちに豊富なフィードバックを提供するため、パーソナライズされたランキングを改善するために活用されている。
【0003】
ユーザは、画面に表示された複数のアイテムから任意のアイテムを選択してクリックする際、アイテムを確認してクリックするため、アイテムの位置がその確認およびクリックに影響しうる。このような、アイテムの位置に応じたユーザによる確認の偏りは、位置バイアス(Position bias)と呼ばれる。非特許文献1には、アイテムが配置された位置とアイテムのクリック履歴に基づいて、回帰型EM(Expectation-Maximization)アルゴリズムに従って位置バイアスを推定する技術が開示されている。
【先行技術文献】
【非特許文献】
【0004】
【文献】Xuanhui Wang, et al., “Position Bias Estimation for Unbiased Learning to Rank in Personal Search”, Proceedings of the 11th ACM International Conference on Web Search and Data Mining (WSDM), ACM (2018), pp. 610-618
【発明の概要】
【発明が解決しようとする課題】
【0005】
複数のアイテムが表示される画面において、当該複数のアイテムのそれぞれは、固定的な位置に配置されることが多い。例えば、カルーセル広告において、各アイテムの配置と順番は、当該広告の作成者によって予め決められている。このように、複数のアイテムそれぞれが固定的な位置に配置される状況では、アイテムが配置される位置に偏りが生じることになる。すなわち、アイテムを配置可能な複数の位置に対して、実際のアイテムの配置位置に偏りが生じる。
上記文献では、このような、アイテムの配置位置に偏りが生じる場合において、当該配置位置の偏りの影響を考慮して位置バイアスを推定する仕組みは開示されていなかった。
【0006】
本開示では、上記課題に鑑みて、アイテムの配置位置に偏りが生じる場合であっても、当該偏りの影響を考慮して位置バイアスを推定するためのアルゴリズムを確立することを目的とする。
【課題を解決するための手段】
【0007】
本開示の一態様による情報処理装置は、k個(kは2以上の自然数)の位置にn個(nは2以上の自然数)のアイテムそれぞれが配置される確率を表す配置確率を取得する取得部と、前記n個のアイテムを、前記n個のアイテムの特徴の抽象表現を表すm個(mは2以上の自然数)の埋め込みベクトルに変換する変換部と、前記n個のアイテムから前記m個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出する算出部と、前記配置確率の分布と前記割当確率の分布を用いて、前記k個の位置それぞれに対して前記m個の埋め込みベクトルそれぞれが配置される確率表現を導出する導出部と、を有する。
【0008】
本開示の一態様による情報処理方法は、k個(kは2以上の自然数)の位置にn個(nは2以上の自然数)のアイテムそれぞれが配置される確率を表す配置確率を取得することと、前記n個のアイテムを、前記n個のアイテムの特徴の抽象表現を表すm個(dは2以上の自然数)の埋め込みベクトルに変換することと、前記n個のアイテムから前記m個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出することと、前記配置確率の分布と前記割当確率の分布を用いて、前記k個の位置それぞれに対して前記m個の埋め込みベクトルそれぞれが配置される確率表現を導出すること、を含む。
【0009】
本開示の一態様によるプログラムは、情報処理方法をコンピュータに実行させるためのプログラムであって、前記情報処理方法は、k個(kは2以上の自然数)の位置にn個(nは2以上の自然数)のアイテムそれぞれが配置される確率を表す配置確率を取得することと、前記n個のアイテムを、前記n個のアイテムの特徴の抽象表現を表すm個(mは2以上の自然数)の埋め込みベクトルに変換することと、前記n個のアイテムから前記m個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出することと、前記配置確率の分布と前記割当確率の分布を用いて、前記k個の位置それぞれに対して前記m個の埋め込みベクトルそれぞれが配置される確率表現を導出すること、を含む。
【発明の効果】
【0010】
本発明によれば、アイテムの配置位置の偏りの影響を考慮して位置バイアスを推定するためのアルゴリズムが提供される。
【図面の簡単な説明】
【0011】
【
図2A】
図2Aは、一実施形態による配置確率π(i,k)の分布の例を示す。
【
図2B】
図2Bは、一実施形態による割当確率P(e|i)の分布の例を示す。
【
図2C】
図2Cは、一実施形態による配置確率π(e,k)の分布の例を示す。
【
図3】
図3は、埋め込みベクトルの生成を説明するための図である。
【
図4】
図4は、一本実施形態によるアルゴリズムを示す。
【
図6】
図6は、複数のアイテムが複数の位置に配置されたコンテンツの例を示す。
【
図7】
図7は、実施形態による情報処理装置のハードウェア構成例を示す。
【発明を実施するための形態】
【0012】
以下、添付図面を参照して、本発明を実施するための実施形態について詳細に説明する。以下に開示される構成要素のうち、同一機能を有するものには同一の符号を付し、その説明を省略する。なお、以下に開示される実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正または変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
【0013】
本実施形態では、非特許文献1に開示された、ユーザがアイテムをクリックする確率の確率モデルを表す位置ベースクリックモデル(Position-based click model)を改良した確率モデルを用いる。まず、当該文献に開示された、従来の位置ベースクリックモデルについて説明し、その後、当該従来の位置ベースクリックモデルを改良したモデルに基づく回帰型EMアルゴリズムに従って位置バイアスを推定するための構成について説明する。なお、本開示において、「確率」という語は、未知の可能性を指すのではなく、対象の事象が起こる割合として理解されてよい。
【0014】
[従来の位置ベースクリックモデル]
非特許文献1に開示された位置ベースクリックモデルについて説明する。ここでは、ウェブサービスに関連して表示画面上に表示(配置)された、リコメンドする1つ以上のアイテム(例えば、広告や商品)から、ユーザが任意のアイテムをクリックすることを想定する。
アイテムiを、リコメンドするアイテムとする。また、変数Cを、報酬変数とする。クリックを報酬の対象とする場合、変数Cが「1」の場合は、表示されたアイテムがクリックされたことを示し、変数Cが「0」の場合は、表示されたアイテムがクリックされなかったことを示す。また、ユーザuを、ユーザuに特有な1つ以上のユーザ属性(ユーザ装置やユーザ自身に関する情報)を含むユーザコンテキストを有するユーザとする。また、位置kを、複数の表示可能(配置可能)な位置において、アイテムが表示された位置とする。
【0015】
位置ベースクリックモデルにおいて、アイテムi、ユーザu、および位置kを条件としたクリック確率P(C=1|i,u,k)は、2つの潜在的な確率の乗算として、(1)式のように表される。
【数1】
ここで、P(E=1|k)は、位置kがユーザによって認識(Examination)される確率を表す。当該認識は、無意識に、もしくは明確に意識せずに、位置kを認識することを含みうる。また、P(R=1|i,u)は、アイテムiとユーザuに関連性(Relevance)が存在する確率を表す。ここで、関連性とは、ユーザuのユーザコンテキストが、アイテムのアイテム特徴と関連があることを意味する。例えば、ユーザuのユーザコンテキストが「車を所有している」というユーザ属性を含む場合、ユーザuは、自動車関連商品のアイテムと関連があるということができる。
このように、(1)式に示す位置ベースクリックモデルは、ユーザがある位置を認識し、その位置のアイテムと当該ユーザに関連性がある場合に、当該ユーザは当該アイテムをクリックするという仮定の下に成り立っている。
【0016】
以下の説明では、(1)式の右辺における2つの確率を、それぞれ、アイテムとユーザの関連性μ(i,u)と、位置バイアスθkと表す。すなわち、μ(i,u)=P(R=1|i,u)と、θk=P(E=1|k)とする。非特許文献1では、関連性μ(i,u)と位置バイアスθkを、回帰型EMアルゴリズムを用いて推定している。回帰型EMアルゴリズムでは、期待値を計算する期待値(E:Expectation)ステップと、当該期待値を最大化する最大化(M:Maximization)ステップを交互に繰り返すことにより、確率モデルに含まれる確率(すなわち、関連性μ(i,u)と位置バイアスθk)を最尤推定している。
【0017】
表示画面においてアイテムを配置することができる位置は複数存在しうるが、一般的に、広告の作成者やマーケティング担当者による経験や専門知識により、アイテムは、固定的な位置に配置されることが多い。すなわち、(1)式を参照すると、位置kがとりうる複数の位置において、アイテムiが配置される位置は、当該複数の位置の全てではないことが多い。このような、アイテムを配置可能な複数の位置に対して、実際のアイテムの配置位置に偏りが生じる場合に、従来の位置ベースクリックモデルでは、位置バイアスを正確に表現できず、回帰型EMアルゴリズムを用いて正確な位置バイアスを推定できなかった。
【0018】
本実施形態では、複数のアイテムが、複数の埋め込みベクトルに変換され、当該複数の複数の埋め込みベクトルに基づいて、改良型の位置ベースクリックモデルが定義される。そして、当該改良型の位置ベースクリックモデルで表現された、アイテムとユーザの関連性と位置バイアスとが、回帰型EMアルゴリズムを用いて推定される。
【0019】
[情報処理システムの構成]
図1に、本実施形態における情報処理システム1の構成例を示す。情報処理システム1は、その一例として、
図1に示すように、情報処理装置10と、ユーザにより使用されるユーザ装置11を含んで構成される。情報処理装置10とユーザ装置11は通信可能に構成される。なお、以下の説明において、
図1では、1台のユーザ装置11が示されているが、複数のユーザ装置が情報処理装置10に互いに通信可能に構成されてよい。また、ユーザ装置11という語は、当該複数のユーザ装置のいずれかであると理解されてよい。
【0020】
ユーザ装置11は、例えば、スマートフォン、タブレット端末、スマートテレビといった表示部を有するデバイスである。ユーザ装置11は、5G(第5世代移動通信システム)といった公衆網や、無線LAN(Local Area Network)等の無線通信網を介して、情報処理装置10と通信可能に構成されている。ユーザ装置11がスマートフォンやタブレット端末といった、液晶ディスプレイ等の表示部に装備されたGUI(Graphic User Interface)を有するデバイスの場合、ユーザはGUIにより各種操作を行うことができる。当該操作は、指やスタイラス等によりタップ操作、スライド操作、スクロール操作等、表示画面に表示された画像等のコンテンツに対する各種の操作を含む。
【0021】
なお、ユーザ装置11は、
図1に示すような形態のデバイスに限らず、デスクトップ型のPC(Personal Computer)や、ノート型のPCといったデバイスであってもよい。その場合、各ユーザによる操作は、マウスやキーボードといった入力装置を用いて行われうる。また、ユーザ装置11は、表示部を別に備えてもよい。
【0022】
情報処理装置10は、マーケットプレイス等の電子商取引プラットフォームを提供するサーバ装置であってよく、ユーザ装置11は、情報処理装置10から提供されるウェブサービス(インターネット関連サービス)を利用することができる。なお、情報処理装置10が上記サーバ装置である場合に限定されず、ユーザ装置11は、情報処理装置10とは別の不図示のサーバ装置から提供されるウェブサービスを、情報処理装置10を介して利用する構成であってもよい。
【0023】
ユーザは、ユーザ装置11の表示画面に表示された、ウェブサービスで提供される複数のアイテム(例えば、広告や商品)のうち、任意のアイテムをクリック(選択動作)することができる。クリックされたアイテムが商品の場合は、クリック後に、商品の説明や購入手続きのための情報がユーザ装置11の表示部に表示されうる。また、クリックされたアイテムが広告の場合は、広告の具体的な内容がユーザ装置11の表示部に表示されうる。
【0024】
情報処理装置10は、ユーザ装置11にウェブサービスを提供し、当該ウェブサービスにおけるユーザの行動を観測し、そのレポートを受信するように構成される。例えば、情報処理装置10は、ユーザの行動履歴を示すレポートの受信を有効に設定することにより、ウェブサービスにおけるユーザの行動履歴を反映した観測データを取得することができる。
本実施形態では、情報処理装置10は、ユーザ装置11の表示部に表示された複数のアイテムのいずれかに対する、ユーザによるクリック動作を含むユーザの行動履歴を観測する。情報処理装置10が取得する観測データは、ユーザコンテキスト、アイテムの位置の情報、アイテムのアイテム情報、およびクリック情報の少なくともいずれかが含まれる。
【0025】
ユーザコンテキストは、ユーザに特有な1つ以上のユーザ属性(ユーザ装置11やユーザ自身に関する情報)を含む。ユーザ属性は、例えば、ユーザの氏名やユーザの住所、商品の配送先の情報、ユーザが保持するクレジットカードの情報、ユーザのデモグラフィック情報を含む。デモグラフィック情報は、性別、年齢、居住地域、職業、家族構成等の人口統計学的なユーザ属性を示す情報である。
ユーザ属性は、例えば、ユーザが、ウェブサービスを利用するために登録することができる。これに加えて、または、これに代えて、情報処理装置10は、ユーザが閲覧したウェブページや過去にクリックした場所等を分析して、ユーザ属性を取得することができる。
【0026】
アイテムの位置の情報は、ユーザ装置11の表示部において、ユーザがクリックしたアイテムの位置に関する情報を含む。
アイテムの情報は、当該アイテムを識別するための情報を含む。また、当該アイテムの情報は、色やサイズといった、1つ以上のアイテム特徴を含んでもよい。
クリックの情報は、クリックの有無を示す情報である。
【0027】
情報処理装置10は、このような観測データと、アイテムの表示に関する所定の構成情報に基づいて、データセットを生成する。当該構成情報は、ユーザ装置の表示画面において表示される複数のアイテムの情報(アイテム特徴を含む)と、アイテムを配置可能な全ての位置(複数の位置)の情報を含む。そして、情報処理装置10は、当該データセットに含まれる複数のアイテムを複数の埋め込みベクトルに変換し、当該埋め込みベクトルを用いた改良型の位置ベースクリックモデルに従って位置バイアスを定義する。当該改良型の位置ベースクリックモデルは、上記の(1)式の従来の位置ベースクリックモデルを改良したモデルに相当する。そして、情報処理装置10は、当該位置バイアスを、回帰型EMアルゴリズムを用いて推定する。本実施形態における回帰型EMアルゴリズムは、非特許文献1に開示される回帰型EMアルゴリズムを改良したものに相当する。以下の説明において、前者を改良型の回帰型EMアルゴリズム、後者を従来の回帰型EMアルゴリズムとも称する。
以下、情報処理装置10の動作に沿って、改良型の位置ベースクリックモデル、および改良型の回帰型EMアルゴリズムについて、説明する。
【0028】
[情報処理装置の動作]
情報処理装置10は、ユーザ装置11に提供したウェブサービスに対してn回(nは2以上の自然数)に渡って観測データを取得し、当該観測データと所定の構成情報に基づいてデータセットDを生成する。1回の観測は、一定期間の時間における観測でありうる。なお、本実施形態では、情報処理装置10は、観測データと所定の構成情報に基づいてデータセットDを生成することを想定する。しかしながら、データセットDを生成するための元データはこれらに限定されず、ユーザのクリック動作を観測することによりデータセットDを生成できれば他のデータであってもよい。
【0029】
生成したデータセットDは、以下の(2)式のように表される。
【数2】
ここで、インデックスjは、1からn番目の観測のいずれかを表すインデックスである。ユーザu
jは、観測jにおいて、ユーザuに特有なコンテキスト(すなわち、1つ以上のユーザの属性)を有するユーザである。ユーザ属性は、例えば、ユーザの年齢や性別である。
アイテムi
jは、観測jにおけるアイテムiであり、それぞれ複数のアイテム特徴に関連付けられる。アイテム特徴は、例えば、色やサイズといったアイテムを識別するための特徴である。本実施形態において、アイテムi
jの種類はn個とするが、これに限定されない。
クリックc
jは、観測jにおける報酬変数であり、本実施形態では、ユーザu
jによりアイテムi
jがクリックされた場合に「1」をとり、アイテムi
jがクリックされなかった場合に「0」をとる。
位置k
jは、観測jにおける、複数の表示可能(配置可能)な位置Kのうちの、いずれかの位置である(k
j∈K)。
なお、以下の説明において、ユーザu
j、アイテムi
j、クリックc
j、および位置k
jをインデックスjに限定せずに一般化して称する場合、それぞれ、ユーザu、アイテムa、クリックc、および位置kと称する。
【0030】
全てのとりうる(i,k)ペアを含むアクションのセットを、A={(i,k)}とおき、ユーザuを当該アクションの分布にマッピングする関数、言い換えると、アイテムiを位置kに配置するポリシー(ルール)を、πとおく。本実施形態では、アイテムiを位置k(k∈K)に配置する(割り当てる)確率(以下、配置確率とも称する)をπ(i,k)で表す。
多くの場合、当該ポリシーは、マーケティング担当者が、経験や専門知識に基づいて決定することが多い。その結果、配置確率π(i,k)の分布は、ほとんどが決定論的で、静的なものとなっている。本実施形態では、データセットDは、このような従来のポリシーに従ったデータセットであり、全てのとりうる(i,k)ペアに対する、データセットDにおける(i, k)のペアの種類は限られているものとする。
【0031】
情報処理装置10は、データセットDを取得すると、データセットDに対する配置確率π(i,k)を算出する。データセットDに対する配置確率π(i,k)は、複数のアイテム配置可能な位置Kの各位置に対して、データセットDに含まれるアイテムiがどのような確率(割合)で配置されるかを表す。
また、前述のように、本実施形態ではデータセットDにおける(i, k)のペアの種類は限られる。情報処理装置10は、このような疎らなペア(i,k)の度合いを定量化するために、配置確率π(i, k)の分布の偏りを示す指標(以下、配置分布指標とも称する)を算出する。
【0032】
第1の例として、配置分布指標を、スパース率(Sparsity ratio)Jで表すと、当該指標は(3)式のように表すことができる。スパース率は、配置分布における非欠損値(例えば、欠損値はデータセットDにおいて欠損している(i,k)を指す)の割合を表す。
【数3】
ここで、|I||K|は、全てのとりうる(i,k)ペアの数を表す(|I|はアイテムセットのサイズ、|K|は、位置セットのサイズを表す)。また、|{(i,k)∈D}|は、データセットDにおける、(i,k)ペアの数(ユニークカウント)を表す。
【0033】
また、第2の例として、配置分布指標を、全てのとりうる位置kに対して一様にn個のアイテムiが配置された一様分布に対する配置確率の分布の類似度で表すことができる。当該類似度の一例は、カルバックライブラー情報量(Kullback-Leibler divergence)D
KLであり、当該指標は(4)式のように表すことができる。
【数4】
ここで、π
uniform(i,k)は、全てのとりうる位置kに対して一様にアイテムiが配置された場合の配置確率を示し、π
biased(i,k)は、データセットDに対する配置確率を示す。
【0034】
(3)式に示すスパース率Jは、(i,k)が、実際にどの程度の割合で観測されているかを示す。よって、スパース率Jが小さいほど、(i,k)が実際に観測された割合が低く、可能な全配置位置に対してアイテムの配置が疎であることを示す。一方、(4)式に示すカルバックライブラー情報量DKLが大きいほど、一様分布との乖離(非類似度)が大きく、アイテムの配置位置に偏りが生じていることを示す。情報処理装置10は、このような配置分布指標を算出することにより、データセットDにおけるアイテムの配置位置の偏りの度合いを把握することができる。
【0035】
図2Aに、データセットDに対する配置確率π(i,k)の分布の例を示す。具体的には、
図2Aは、全アイテム:アイテムi
0、i
1、i
2、アイテムを配置可能な全ての位置:k
0、k
1、k
2である場合に、アイテムが各位置にどのような確率(割合)で配置されるかを示す、配置確率π
b(i,k
0)、π
b(i,k
1)、π
b(i,k
2)、の例を示す。なお、
図2Aの表において、データセットDに対するπ
biased(i,k)を、配置確率π
b(i,k)で表している。
当該表に示すように、データセットDでは、アイテムi
0が位置k
0に固定的に配置され、アイテムi
1が位置k
1に固定的に配置され、アイテムi
2が位置k
2に固定的に配置されている。すなわち、データセットDでは、アイテムと配置位置のペアが、(i
0,k
0)、(i
1,k
1)、(i
2,k
2)に偏っていることがわかる。
【0036】
図2Aに示すデータセットDに対する配置確率π(i,k)の分布の場合、(3)式に従って、データセットDに対するスパース率Jは、(5)式のように算出することができる。
【数5】
【0037】
また、(4)式に従って、データセットDに対するカルバックライブラー情報量D
KLは、(6)式のように算出することができる。
【数6】
【0038】
上述したように、データセットDでは、(i,k)ペアについて、取りうるすべての(i,k)に対して偏りが生じている。すなわち、データセットDにおける(i,k)ペアには、偏りや疎の問題が生じている。そして、このようなデータセットDと(1)式を用いて、従来技術に従って位置バイアスを推定する場合、データセットDに含まれる(i,k)ペアの偏りや疎の問題により、当該推定が正しく行われない可能性がある。
【0039】
このような問題に対処するために、情報処理装置10は、データセットDにおける複数のアイテムから、複数の埋め込みベクトルを生成する。具体的には、情報処理装置10は、データセットDにおけるn個のアイテムij(j=1からn)から、m個の埋め込みベクトルe(e∈E(Eは埋め込みベクトルの集合))を生成する。埋め込みベクトルeは、複数のアイテム特徴を抽象化した潜在的コンテキスト(Latent contexts)を表すベクトルに対応する。
【0040】
埋め込みベクトルeについて、
図3を参照して具体的に説明する。
図3は、本実施形態による埋め込みベクトルの生成を説明するための図である。
本実施形態では、アイテムiはn個存在し、各アイテムは、a個(aは2以上の自然数)のアイテム特徴に関連付けられているものとする。アイテム特徴は、色やサイズといったアイテムを識別するための特徴である。まず、情報処理装置10は、データセットDに含まれるn個のアイテムiから、n×aの行列(アイテム×アイテム特徴)を準備する。n×aの行列の各列は、特徴ベクトルに対応し、各特徴ベクトルは、n個のアイテムそれぞれの各アイテム特徴を表現する。
【0041】
情報処理装置10は、n×aの行列(アイテム×アイテム特徴)を、n×mの行例(アイテム×潜在的コンテキスト)に変換(マッピング)する。当該変換は、LSI(Latest semantic indexing)や、VAE(Variational auto-encoder)といった、公知の特徴表現抽出の技術により実施することができる。変換後のn×mの行列の各列は、埋め込みベクトルに対応し、各埋め込みベクトルは、n個のアイテムそれぞれの潜在的コンテキストを表す。これにより、m個の埋め込みベクトルが生成される。埋め込みベクトルは、a個のアイテム特徴を抽象化したベクトルに対応し、抽象化した特徴ベクトルと称することもできる。
【0042】
LSIやVAEを用いてn×aの行列をn×mの行列に変換することにより、次元が削減され、すなわち、mはaより小さくなる。例えば、LSIでは、複数のアイテムのアイテム特徴において意味の近いものをまとめることにより、次元を減らすことができる。また、VAEにおいても、圧縮処理により、次元を減らすことができる。このように、n×mの行列のサイズは、n×aのサイズより小さくなることにより、データセットDにおける、疎な(i,k)ペアは、より密な(e,k)ペアに変換されることになる。
【0043】
アイテムiから埋め込みベクトルeへの割り当ての確率(アイテムiを条件とした埋め込みベクトルeの確率)を、割当確率P(e|i)で表す。
図2Bに、データセットDに対する割当確率P(e|i)の分布の例を示す。具体的には、
図2Bは、全アイテム:アイテムi
0、i
1、i
2、埋め込みベクトルの数m=2である場合の、割当確率P(e|i)の分布の例を示す。本実施形態では、各アイテムiについて、割当確率P(e|i)の合計(アイテムiを埋め込みベクトルeに割り当てる条件付確率の和)が1になるように、P(e|i)を算出する。すなわち、Σ
e∈E(e|i)=1である。
図2Bでは例えば、位置i
0から埋め込みベクトルe
0への割当確率P(e
0|i
0)は1/2であり、位置i
0から埋め込みベクトルe
1への割当確率P(e
1|i
0)は1/2であるため、P(e
0|i
0)+P(e
1|i
0)=1となる。位置i
1と位置i
2ついても、それぞれ、P(e
0|i
1)+P(e
1|i
1)=1/3+2/3=1、P(e
0|i
2)+P(e
1|i
2)=1/4+3/4=1となる。
【0044】
(1)式の右辺に示すアイテムとユーザの関連性は、割当確率P(e|i)と埋め込みベクトルeを用いて、(7)式のように表すことができる。
【数7】
情報処理装置10は、割当確率P(e|i)と(7)式から、以下の(8)式の条件付き確率に基づいて、クリックCから報酬wをサンプリングすることができる。(8)式は、(1)式に示すクリックの確率P(C=1|i,u,k)に割当確率P(e|i)を乗算した場合に、報酬wが1をとる確率を表す。
【数8】
【0045】
情報処理装置10は、以上のように、埋め込みベクトルeを生成し報酬wをサンプリングすることにより、データセットDから、以下の(9)式に示すような埋め込みベクトルeと報酬wを含んだデータセットD
eを生成することができる。
【数9】
【0046】
また、(1)式に示す従来の位置ベースクリックモデルは、埋め込みベクトルeを用いて、埋め込みベクトル付きの、改良型の位置ベースクリックモデルとして、(10)式のように表すことができる。
【数10】
【0047】
以下の説明では、(10)式の右辺における2つの確率を、それぞれ、埋め込みベクトルとユーザの関連性μ(e,u)と、位置バイアスθekと表す。すなわち、μ(e,u)=P(R=1|e,u)と、θek=P(E=1|k)とする。(1)式に示す位置バイアスθkと区別して、(10)式に示す位置バイアスθekは、ユーザuが、m個の埋め込みベクトルが配置されたk個の位置それぞれを認識する確率を表す。
【0048】
前述のように、本実施形態では、各アイテムiについて、割当確率P(e|i)の合計を1となるようにP(e|i)を算出し、以下の(11)式のようにP(e|i)を定義する。
【数11】
ここで、e
i,l(∈E)は、埋め込みベクトルの行列(
図3に示すアイテム×潜在的コンテキスト)における各要素を指す。e
i,lは、埋め込み空間における表現(埋め込み空間表現)に対応する。また、(11)式におけるlとl’は、潜在的コンテキストを表し、l’とlは独立したパラメータである。
【0049】
2つのアイテムiとアイテムi’が類似している場合、それらに対応する埋め込み空間表現ei,lとei’,lも類似し、割当確率P(e|i)とP(e|i’)の分布も類似すると仮定する。
このような仮定に基づくと、データセットDにおける(i0,k0)と(i1,k1)といった特定の(アイテム、位置)のペアを観測する場合であっても、割当確率P(e0|i0)、P(e1|i0)、P(e0|i1)、P(e1|i1)を得ることができる。データセットDeを用いることにより、埋め込みベクトルe0とe1のそれぞれ対して、両方の位置に対するデータ(すなわち、埋め込みベクトルe0の場合は、(e0,k0)と(e0,k1))を利用できるので、前述したような、偏りや疎の問題を解決することができる。
【0050】
情報処理装置10は、データセットDにおける各位置kについて、配置確率π(i,k)の分布と割当確率P(e|i)の分布を用いて、埋め込みベクトルeが配置される確率表現を表す配置確率π(e,k)を導出する。本実施形態では、配置確率π(e,k)は、割当確率P(e|i)と配置確率π(i,k)との乗算の和を用いて導出(算出)する。
図2Cに、
図2Bのような割当確率P(e|i)の場合の、配置確率π(e,k)の例を示す。配置確率π(e,k)は、
図2Bに示す割当確率P(e|i)と、
図2Aに示すデータセットDにおける配置確率π
b(i,k)に基づく、データセットD
eに対する配置確率π(e,k)を示す。
【0051】
配置確率π(e
p,k
q)は、データセットD
eにおける全アイテムiについての、割当確率P(e
p|i)と配置確率π
b(i,k
q)との乗算の和で算出することができる。
例えば、
図2Cにおいて、配置確率π(e
0,k
0)は、以下の(12)式のように算出することができる。
【数12】
ここで、jは、データセットD
eにおけるアイテムのインデックスを示す。
【0052】
図2Cに示すように、配置確率π(e,k)は、
図2Aに示す配置確率π
b(i,k)と比較して、データの偏りや疎の問題が解消されていることがわかる。よって、埋め込みベクトルeと位置kを含むデータセットD
eを用いることにより、位置バイアスをより正確に推定することが期待される。
【0053】
次に、情報処理装置10は、データセットDeを用いて、位置バイアスを推定する。従来では、非特許文献1に記載される回帰型EMアルゴリズムを用いて、(1)式に示した従来の位置ベースクリックモデルに示される位置バイアスを推定した。すなわち、回帰型RMアルゴリズムを適用して、期待値ステップと最大化ステップを繰り返すことにより、関連性μ(i,u)と位置バイアスθkを最適化した。
【0054】
本実施形態では、改良型の回帰型RMアルゴリズムとして、まず、期待値ステップにおいて、ある時刻tに対するt+1の反復において、隠れ変数EとRの分布を、θ
ek
(t)とμ
(t)(e,u)から推定する。θ
ek
(t)とμ
(t)(e,u)はそれぞれ、時刻tにおける、(10)式を参照して説明した、位置バイアスθ
ekと、埋め込みベクトルとユーザの関連性μ(e,u)である。
【数13】
【0055】
(13)式から、データセットDeの全てのデータポイントについて、確率P(E=1|u,e,w,k)と確率P(R=1|u,e,w,k)を計算することができる。確率P(E=1|u,e,w,k)は、ユーザu、埋め込みベクトルe、報酬w、位置kを条件とした場合に、ユーザuと埋め込みベクトルeの関連性が存在する(=1)確率を表す。また、確率P(E=1|u,e,w,k)は、ユーザu、埋め込みベクトルe、報酬w、位置kを条件とした場合に、位置kがユーザuによって認識される確率を表す。
【0056】
最大化ステップでは、期待値ステップからの確率を用いて、θ
ek
(t+1)とμ
(t+1)(e,k)を計算する。
【数14】
ここで、k’とe’はそれぞれ、位置kと埋め込みベクトルeを表すが、位置kと埋め込みベクトルeは独立したパラメータである。また、(14)式において、分母のIは、指示関数(Indicator function)を表す。すなわち、I
k’=kは、k’=kの時に1をとり、それ以外の場合は0をとる関数である。同様に、I
e’=eは、e’=eの時に1をとり、それ以外の場合は0をとる関数である。
【0057】
(13)式と(14)式に基づく、本実施形態による改良型の回帰型EMアルゴリズムを、
図4に示す。以下、当該アルゴリズムにおける処理を順に説明する。
処理1
入力として、ユーザ(ユーザコンテキスト)u、アイテムi、クリックc、および位置kを含むデータセット:D、位置バイアス:θ
ek、埋め込みベクトルとユーザの関連性:μ(e,u)、および割当確率P(e|i)を受け取る。θ
ekは、所定の初期値でありうる。また、μ(e,u)は、空の回帰モデルでありうる。
処理2~4
データセットDに含まれる全てのユーザu、アイテムi、クリックc、および位置kについて、割当確率P(e|i)を伴うクリックcから、報酬wをサンプリングする。具体的には、(8)式に従って、w∈{0、1}、すなわち、0または1をとる報酬wをサンプリングする。
処理5
処理4においてサンプリングされた報酬wの集合とデータセットDから、ユーザ(ユーザコンテキスト)u、アイテムi、報酬w、および位置kを含むデータセットD
eを準備(生成)する。
処理6~14
処理7~13を、処理14の条件を満たすまで反復する(時刻tから時刻t+1の繰り返し)。
処理7
集合Sを空集合とする。
処理8~11
データセットD
eに含まれる全てのユーザu、埋め込みベクトルe、クリックc、および位置kについて、(13)式に基づいて、確率P(R=1|u,e,w,k)からr∈{0、1}、すなわち、0または1をとる関連性rをサンプリングする。続いて、ユーザu、埋め込みベクトルe、関連性rと集合Sとの和集合Sを生成する。
処理12
μ(e,u)とSを入力として、GBDT(勾配ブースティング決定木(Gradient Boosted Decision Tree))に従って、μ(e,u)を更新する。アイテムとユーザの関連性は、非線形性となりうるため、ここではGBDT方法を使用してμ(e,u)を学習する。
処理13
(14)式に従って、θ
ekを更新する。
処理14
時刻tと時刻t+1で更新されたθ
ekの値の差が所定の値以下の場合に、収束条件を満たしたと判断し、終了する。所定の値は、例えば10
-3である。ここで、時刻tと時刻t+1で更新されたθ
ekの値に加えて、時刻tと時刻t+1で更新されたμ(e,u)の差が所定の値以下の場合に、収束条件を満たしたと判断し、終了してもよい。
処理15
θ
kとμ(e,u)を返す。
【0058】
このように、本実施形態では、アイテムの配置位置を示す(i, k)のペアの種類が限られるデータセットDであっても、アイテムiが埋め込みベクトルeに変換され、(e, k)ペアを含むデータセットD
eが生成される。そして、
図4に示す改良型の回帰型EMアルゴリズムに従って位置バイアスθ
ekが推定される。これにより、従来の回帰型EMアルゴリズムに従って位置バイアスθ
kを推定する場合より、精度高く位置バイアスθ
ekを推定することが可能となる。
【0059】
情報処理装置10は、
図4に示す改良型の回帰型EMアルゴリズムに従って位置バイアスθ
ekを推定すると、当該推定した位置バイアスθ
ekに基づいて、各ユーザに対するアイテムの配置位置を調整してもよい。具体的には、まず、情報処理装置10は、(1)式に示す位置ベースクリックモデルにおける、アイテムとユーザの関連性μ(i,u)=P(R=1|i,u)を、従来の回帰型EMアルゴリズムを用いて推定し、ユーザuに関連性の高い1つ以上のアイテムを特定する。これに加えて、あるいは、これに代えて、情報処理装置10は、ユーザuに関連性の高い順に、1つ以上のアイテムを特定してもよい。
【0060】
続いて、情報処理装置10は、(10)式に示す改良型の位置ベースクリックモデルにおける位置バイアスθ
ek=P(E=1|k)を、
図4に示す改良型の回帰型EMアルゴリズムを用いて推定する。そして、情報処理装置10は、推定した位置バイアスθ
ekに基づいて、ユーザuが認識する可能性が高い位置を特定し、当該特定した位置に、当該特定した1以上のアイテムを配置する(マッチングする)。これにより、ユーザuが当該1以上のアイテムをクリックする可能性が高くなり、すなわち、CTR(クリック率)が向上し、広告効果が高くなりうる。
【0061】
[情報処理装置の機能構成]
図5に、本実施形態による情報処理装置10の構成例を示す。情報処理装置10は、第1データセット生成部101、偏り算出部102、埋め込みベクトル生成部103、割当確率算出部104、第2データセット生成部105、確率表現導出部106、関連性推定部107、位置バイアス推定部108、コンテンツ作成部109、およびコンテンツ提供部110を有する。
【0062】
第1データセット生成部101は、ウェブサービスにおけるユーザの行動履歴を反映したデータセットDを生成する。例えば、第1データセット生成部101は、ウェブサービスにおけるユーザの行動履歴の観測データと、アイテムの表示に関する所定の構成情報に基づいて、データセットDを生成する。上述のように、データセットDは、1からn番目の各観測における、ユーザu、アイテムi、クリックc、および位置kを含んで構成される。アイテムiは、a個のアイテム特徴に関連付けられている。
また、第1データセット生成部101は、データセットDに対する配置確率π(i,k)を算出して取得する。データセットDに対する配置確率π(i,k)の分布の一例は、
図2Aに示されている。
【0063】
偏り算出部102は、第1データセット生成部101により算出された配置確率π(i,k)の分布の偏りを示す指標を示す配置分布指標を算出する。本実施形態では、上述したように、(3)式で定義されるスパース率Jと、(4)式で定義されるカルバックライブラー情報量DKLを算出する。スパース率Jは、値が小さいほど、アイテムの配置位置に偏りが生じていることを示す。一方、カルバックライブラー情報量DKLは、値が大きいほど、アイテムの配置位置に偏りが生じていることを示す。
【0064】
埋め込みベクトル生成部103は、データセットDに含まれるn個のアイテムiを、当該n個のアイテムiのアイテム特徴の抽象表現を表すm個の埋め込みベクトルeに変換する。本実施形態では、埋め込みベクトル生成部103は、
図3を参照して説明したように、データセットDに含まれるn個のアイテムiから、n×aの行列(アイテム×アイテム特徴)を準備する。そして、埋め込みベクトル生成部103は、当該行列を、n×m(アイテム×潜在的コンテキスト)の行列に変換(マッピング)する。埋め込みベクトル生成部103は、変換後のn×mの行列の各列を、埋め込みベクトルeとして生成する。
【0065】
割当確率算出部104は、データセットDに含まれるn個のアイテムiからm個の埋め込みベクトルeへの割当の確率(アイテムiを条件としため込みベクトルeの確率)を表す割当確率P(e|i)を算出する。データセットDに対する割当確率P(e|i)の分布の一例は、
図2Bに示されている。割当確率算出部104は、各アイテムiについて、割当確率P(e|i)の合計が1になるように、P(e|i)を算出することができる。
【0066】
第2データセット生成部105は、データセットDeを生成する。具体的には、上述のように、第2データセット生成部105は、割当確率算出部104により算出された割当確率P(e|i)を伴うクリックcから、(8)式に従って、0または1をとる報酬wをサンプリングする。続いて、第2データセット生成部105は、報酬wの集合とデータセットDから、ユーザu、アイテムi、報酬w、および位置kを含むデータセットDeを生成する。
【0067】
確率表現導出部106は、データセットDにおける各位置kについて、配置確率π(i,k)の分布と割当確率P(e|i)の分布を用いて、埋め込みベクトルeが配置される確率表現を表す配置確率π(e,k)を導出する。確率表現導出部106は、配置確率π(e,k)を、割当確率P(e|i)と配置確率π(i,k)との乗算の和を用いて導出(算出)することができる。確率表現の分布の一例は、
図2Cに示されている。
【0068】
関連性推定部107は、データセットDにおけるアイテムiとユーザuの関連性μ(i,u)を推定する。具体的には、関連性推定部107は、(1)式に示す関連性μ(i,u)を、従来の回帰型EMアルゴリズムを用いて推定する。
【0069】
位置バイアス推定部108は、データセットD
eに対する位置バイアスθ
ekを推定する。具体的には、位置バイアス推定部108は、(10)式に示す位置バイアスθ
ekを、
図4に示す改良型の回帰型EMアルゴリズムを用いて推定する。
これに代えて、あるいは、これに加えて、位置バイアス推定部108は、データセットDに対する位置バイアスθ
kを推定してもよい。具体的には、位置バイアス推定部108は、(1)式に示す位置バイアスθ
kを、従来の回帰型EMアルゴリズムを用いて推定する。
【0070】
位置バイアス推定部108は、偏り算出部102により算出された配置分布指標に基づいて、従来の回帰型EMアルゴリズムと、改良型の回帰型EMアルゴリズムのいずれかを用いて位置バイアスを推定するかを切り替えてもよい。
例えば、配置分布指標として、スパース率Jを用いる場合、位置バイアス推定部108は、スパース率Jが所定の値以下(配置分布の欠損値の数が所定のレベル以上)の場合に、(10)式に示す位置バイアスθ
ekを、
図4に示す改良型の回帰型EMアルゴリズムを用いて推定することができる。一方、位置バイアス推定部108は、スパース率Jが当該所定の値より大きい(配置分布の欠損値の数が所定のレベル未満)の場合に、(1)式に示す位置バイアスθ
kを、従来の回帰型EMアルゴリズムを用いて推定することができる。
また、別の例として、配置分布指標として、カルバックライブラー情報量D
KLを用いる場合、位置バイアス推定部108は、情報量D
KLが所定の値以上(配置分布の偏りが所定のレベル以上)の場合に、(10)式に示す位置バイアスθ
ekを、
図4に示す改良型の回帰型EMアルゴリズムを用いて推定することができる。一方、位置バイアス推定部108は、情報量D
KLが当該所定の値より小さい(配置分布の偏りが所定のレベル未満)の場合に、(1)式に示す位置バイアスθ
kを、従来の回帰型EMアルゴリズムを用いて推定することができる。
このように、アイテムの配置位置に偏りが生じていない場合には、データセットD
eを生成せずに、データセットDから従来の手法により位置バイアスθ
kを推定することにより、処理負荷を抑えることが可能となる。
【0071】
コンテンツ作成部109は、関連性推定部107により推定されたデータセットDにおけるアイテムiとユーザuの関連性μ(i,u)と、位置バイアス推定部108により推定された位置バイアスθkまたは位置バイアスθekに基づいてユーザuに提供するコンテンツを作成する。コンテンツが複数の広告(すなわち、アイテム)を含む広告コンテンツの場合、コンテンツ作成部109は、関連性μ(i,u)に基づいて、ユーザuと関連性の高い順に、当該複数の広告を順序付けする。そして、コンテンツ生成部109は、位置バイアスθkまたは位置バイアスθekに基づいて、当該順序付けした広告を各位置に割り当てて、広告コンテンツを作成する。
コンテンツ提供部110は、コンテンツ作成部109により作成されたコンテンツを、ユーザuに提供する。例えば、コンテンツ提供部110は、作成されたコンテンツを、ユーザuが使用するユーザ装置の表示部に表示させる。
【0072】
このように、本実施形態による情報処理装置10では、まず、第1データセット生成部101が、データセットDに対する、複数の位置に複数のアイテムそれぞれが配置される確率を表す配置確率π(i,k)を取得する。その後、埋め込みベクトル生成部103が、当該複数アイテムを、複数の埋め込みベクトルに変換する。そして、割当確率算出部104が、当該複数のアイテムから当該複数の埋め込みベクトルへの割当の確率を表す割当確率P(e|i)を算出する。続いて、確率表現導出部106が、当該配置確率の分布と当該割当確率の分布を用いて、当該複数の位置それぞれについて、当該複数の埋め込みベクトルそれぞれが配置される確率表現を示す配置確率π(e,k)を導出する。位置バイアス推定部108は、(10)式に示す位置バイアスθ
ekを、
図4に示す改良型の回帰型EMアルゴリズムを用いて推定する。
【0073】
さらに、情報処理装置10では、コンテンツ作成部109が、ユーザが認識する可能性が高い位置に、当該ユーザと関連性の高いアイテムを配置するようにコンテンツを作成し、コンテンツ提供部110が、当該生成されたコンテンツをユーザに提供することができる。
【0074】
複数のアイテムが複数の位置に配置されたコンテンツの例を
図6に示す。
図6において、上部は、広告アイテム611、612、および613を、それぞれ位置601、602、および603に固定的に配置した広告コンテンツ60を示す。ここで、関連性推定部107が推定したユーザuと各広告アイテムの関連性のうち、ユーザuと広告アイテム612の関連性が最も高く、ユーザuと広告アイテム613、611の関連性が順に続いたものと仮定する。さらに、位置バイアス推定部108が推定した各位置に対する位置バイアスθ
ek(もしくは位置バイアスθ
k)のうち、位置601に対する位置バイアスが最も高く、位置602、603に対する位置バイアスが続いたものと仮定する。この場合、コンテンツ作成部109は、
図6の下部のように、広告アイテム612、613、および611を、それぞれ位置601、602、および603に割り当てた広告コンテンツ61を作成する。そして、コンテンツ提供部110は、当該作成された広告コンテンツ61をユーザuに提供する。例えば、コンテンツ提供部110は、広告コンテンツ61を、ユーザuのユーザ装置11の表示部に表示させるように制御する。
【0075】
ユーザuのユーザ装置11の表示部には、広告コンテンツ61において、より関心の高い広告アイテム612が、位置バイアスの高い位置601に配置されること。これにより、ユーザuにとってよりパーソナライズされた表示形態になるだけでなく、ユーザuにより広告アイテム612をクリックする確率が高くなり、CVR(コンバージョン率)が向上し、効果的なマーケティングが実現されうる。
【0076】
[情報処理装置10のハードウェア構成]
次に、情報処理装置10のハードウェア構成例について説明する。また、ユーザ装置11も同様のハードウェア構成を有しうる。
図7は、本実施形態による情報処理装置10のハードウェア構成の一例を示すブロック図である。
本実施形態による情報処理装置10は、単一または複数の、あらゆるコンピュータ、モバイルデバイス、または他のいかなる処理プラットフォーム上にも実装することができる。
図7を参照して、情報処理装置10は、単一のコンピュータに実装される例が示されているが、本実施形態による情報処理装置10は、複数のコンピュータを含むコンピュータシステムに実装されてよい。複数のコンピュータは、有線または無線のネットワークにより相互通信可能に接続されてよい。
【0077】
図7に示すように、情報処理装置10は、CPU(Central Processing Unit)701と、ROM(Read Only Memory)702と、RAM(Random Access Memory)703と、HDD(Hard Disk Drive)704と、入力部705と、表示部706と、通信I/F707と、GPU(Graphics Processing Unit)708と、システムバス709とを備えてよい。情報処理装置10はまた、外部メモリを備えてよい。
CPU701は、情報処理装置10における動作を統括的に制御するものであり、データ伝送路であるシステムバス709を介して、各構成部(702~708)を制御する。
【0078】
ROM702は、CPU701が処理を実行するために必要な制御プログラム等を記憶する不揮発性メモリである。なお、当該プログラムは、HDD704、SSD(Solid State Drive)等の不揮発性メモリや着脱可能な記憶媒体(不図示)等の外部メモリに記憶されていてもよい。
RAM703は、揮発性メモリであり、CPU701の主メモリ、ワークエリア等として機能する。すなわち、CPU701は、処理の実行に際してROM702から必要なプログラム等をRAM703にロードし、当該プログラム等を実行することで各種の機能動作を実現する。
【0079】
HDD704は、例えば、CPU701がプログラムを用いた処理を行う際に必要な各種データや各種情報等を記憶している。また、HDD704には、例えば、CPU701がプログラム等を用いた処理を行うことにより得られた各種データや各種情報等が記憶される。
入力部705は、キーボードやマウス等のポインティングデバイスにより構成される。
表示部706は、液晶ディスプレイ(LCD)等のモニターにより構成される。表示部706は、入力部705と組み合わせて構成されることにより、GUI(Graphical User Interface)として機能してもよい。
【0080】
通信I/F707は、情報処理装置10と外部装置との通信を制御するインタフェースである。
通信I/F707は、ネットワークとのインタフェースを提供し、ネットワークを介して、外部装置との通信を実行する。通信I/F707を介して、外部装置との間で各種データや各種パラメータ等が送受信される。本実施形態では、通信I/F707は、イーサネット(登録商標)等の通信規格に準拠する有線LAN(Local Area Network)や専用線を介した通信を実行してよい。ただし、本実施形態で利用可能なネットワークはこれに限定されず、無線ネットワークで構成されてもよい。この無線ネットワークは、Bluetooth(登録商標)、ZigBee(登録商標)、UWB(Ultra Wide Band)等の無線PAN(Personal Area Network)を含む。また、Wi-Fi(Wireless Fidelity)(登録商標)等の無線LAN(Local Area Network)や、WiMAX(登録商標)等の無線MAN(Metropolitan Area Network)を含む。さらに、4G、5G等の無線WAN(Wide Area Network)を含む。なお、ネットワークは、各機器を相互に通信可能に接続し、通信が可能であればよく、通信の規格、規模、構成は上記に限定されない。
GPU708は、画像処理に特化したプロセッサである。GPU708は、CPU701と協働して、所定の処理を行うことができる。
【0081】
図5に示す情報処理装置10の各要素のうち少なくとも一部の機能は、CPU701がプログラムを実行することで実現することができる。ただし、
図5に示す情報処理装置10の各要素のうち少なくとも一部の機能が専用のハードウェアとして動作するようにしてもよい。この場合、専用のハードウェアは、CPU701の制御に基づいて動作する。
【0082】
[ユーザ属性]
上述のように、本実施形態において、ユーザコンテキストは、ユーザに関連付けられる1つ以上のユーザ属性を有する。ここで、ユーザ属性の例について言及する。
ユーザ属性は、ユーザが有する装置(ユーザ装置)やユーザについての事実特徴(事実情報)を含む。事実特徴は、ユーザ装置やユーザから実際に、または、客観的に得られる、事実に基づく特徴(情報)でありうる。
また、ユーザ属性は、事実特徴を学習済みの機械学習モデルに適用して推定されたユーザ属性(推定ユーザ属性)を含んでもよい。当該機械学習モデルは、例えば、対象のユーザの事実特徴を入力として、複数のユーザ属性それぞれが当該対象のユーザに該当する(適合する)確率(該当確率)を出力するように構成される。該当確率から、推定ユーザ属性を決定することができる。
【0083】
[アイテム特徴]
上述のように、本実施形態において、アイテムは、複数のアイテム特徴に関連付けられる。ここで、アイテム特徴の例について言及する。
アイテムの特徴は、アイテムを識別する情報(アイテムID)、当該アイテムのジャンル(上位分類)を識別する情報、当該アイテムが販売されているショップを識別する情報(ショップID)等を含んでもよい。アイテム特徴は、取引履歴に応じて、アイテムIDとジャンルID間、アイテムIDとショップID間の取引情報(取引回数等)も含むことができる。
【0084】
なお、上記において特定の実施形態が説明されているが、当該実施形態は単なる例示であり、本発明の範囲を限定する意図はない。本明細書に記載された装置及び方法は上記した以外の形態において具現化することができる。また、本発明の範囲から離れることなく、上記した実施形態に対して適宜、省略、置換及び変更をなすこともできる。かかる省略、置換及び変更をなした形態は、請求の範囲に記載されたもの及びこれらの均等物の範疇に含まれ、本発明の技術的範囲に属する。
【0085】
本実施形態の開示は以下の構成を含む。
[1]k個(kは2以上の自然数)の位置にn個(nは2以上の自然数)のアイテムそれぞれが配置される確率を表す配置確率を取得する取得部と、
前記n個のアイテムを、前記n個のアイテムの特徴の抽象表現を表すm個(mは2以上の自然数)の埋め込みベクトルに変換する変換部と、
前記n個のアイテムから前記m個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出する算出部と、
前記配置確率の分布と前記割当確率の分布を用いて、前記k個の位置それぞれに対して前記m個の埋め込みベクトルそれぞれが配置される確率表現を導出する導出部と、
を有する、情報処理装置。
【0086】
[2]前記割当確率において、前記n個のアイテムのそれぞれについて、アイテムを前記埋め込みベクトルに割り当てる条件付確率の和は1である、[1]に記載の情報処理装置。
【0087】
[3]前記n個のアイテムはそれぞれa個(aは2以上の自然数)の特徴と関連付けられており、
前記変換部は、前記a個の特徴と関連付けられた前記n個のアイテムを、前記m個の埋め込みベクトルに変換し、ここで、mはaより小さい、[1]に記載の情報処理装置。
【0088】
[4]前記割当確率に基づいて、ユーザが、前記m個の埋め込みベクトルが配置された前記k個の位置それぞれを認識する確率を表す位置バイアスを推定する推定部を更に有する、[1]から[3]のいずれかに記載の情報処理装置。
【0089】
[5]前記割当確率に基づいて、ユーザが、前記m個の埋め込みベクトルが配置された前記k個の位置それぞれを認識する確率を表す第1の位置バイアスを推定する第1の推定部と、
前記配置確率に基づいて、ユーザが、前記n個のアイテムが配置された前記k個の位置それぞれを認識する確率を表す第2の位置バイアスを推定する第2の推定部とを更に有する、[1]から[4]のいずれかに記載の情報処理装置。
【0090】
[6]前記配置確率の分布の偏りを算出する偏り算出部を更に有し、
前記配置確率の分布の偏りが所定のレベル以上の場合に、前記第1の推定部が前記第1の位置バイアスを推定し、
前記配置確率の分布の偏りが前記所定のレベル未満の場合に、前記第2の推定部が前記第2の位置バイアスを推定する、
[5]に記載の情報処理装置。
【0091】
[7]前記偏り算出部は、前記配置確率の分布において、前記k個の位置のうち、前記n個のアイテムが配置された割合を、前記配置確率の分布の偏りとして算出する、[6]に記載の情報処理装置。
【0092】
[8] 前記偏り算出部は、前記k個の位置における前記n個のアイテムの一様分布に対する前記配置確率の分布の類似度を、前記配置確率の分布の偏りとして算出する、[6]に記載の情報処理装置。
【0093】
[9]前記偏り算出部は、前記類似度を、カルバックライブラー情報量により算出する、[8]に記載の情報処理装置。
【符号の説明】
【0094】
1:情報処理システム、10:情報処理装置10、11:ユーザ装置、101:第1データセット生成部、102:偏り算出部、103:埋め込みベクトル生成部、104:割当確率算出部、105:第2データセット生成部、106:確率表現導出部、107:関連性推定部、108:位置バイアス推定部、109:コンテンツ作成部、110:コンテンツ提供部
【要約】
【課題】アイテムの配置位置に偏りが生じる場合であっても、当該偏りの影響を考慮して位置バイアスを推定するためのアルゴリズムを確立する。
【解決手段】情報処理装置は、k個(kは2以上の自然数)の位置にn個(nは2以上の自然数)のアイテムそれぞれが配置される確率を表す配置確率を取得し、該n個のアイテムを、該n個のアイテムの特徴の抽象表現を表すm個(mは2以上の自然数)の埋め込みベクトルに変換し、該n個のアイテムから該m個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出し、該配置確率の分布と該割当確率の分布を用いて、該k個の位置それぞれに対して該m個の埋め込みベクトルそれぞれが配置される確率表現を導出する。
【選択図】
図5