特許7496923 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 楽天株式会社の特許一覧

特許7496923情報処理装置、情報処理方法、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
2C
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2024-05-30

(45)【発行日】2024-06-07

(54)【発明の名称】情報処理装置、情報処理方法、およびプログラム

(51)【国際特許分類】

G06Q 50/10 20120101AFI20240531BHJP

【ＦＩ】

G06Q50/10

【請求項の数】 11

(21)【出願番号】P 2023124134

(22)【出願日】2023-07-31

【審査請求日】2023-07-31

【新規性喪失の例外の表示】特許法第３０条第２項適用ウェブサイトの公開日：令和５年５月１０日ウェブサイトのアドレス：ｈｔｔｐｓ：／／ａｒｘｉｖ．ｏｒｇ／ａｂｓ／２３０５．１３９３１

(73)【特許権者】

【識別番号】399037405

【氏名又は名称】楽天グループ株式会社

(74)【代理人】

【識別番号】100109380

【弁理士】

【氏名又は名称】小西恵

(74)【代理人】

【識別番号】100109036

【弁理士】

【氏名又は名称】永岡重幸

(72)【発明者】

【氏名】石川詩苑

(72)【発明者】

【氏名】劉雲青

【審査官】塩屋雅弘

(56)【参考文献】

【文献】米国特許出願公開第２００９／０２６５２９０（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０２０／０２８６１５４（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

(57)【特許請求の範囲】

【請求項1】

ｋ個（ｋは２以上の自然数）の位置にｎ個（ｎは２以上の自然数）のアイテムそれぞれが配置される確率を表す配置確率を取得する取得部と、
前記ｎ個のアイテムを、前記ｎ個のアイテムの特徴の抽象表現を表すｍ個（ｍは２以上の自然数）の埋め込みベクトルに変換する変換部と、
前記ｎ個のアイテムから前記ｍ個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出する算出部と、
前記配置確率の分布と前記割当確率の分布を用いて、前記ｋ個の位置それぞれに対して前記ｍ個の埋め込みベクトルそれぞれが配置される確率表現を導出する導出部と、
を有することを特徴とする情報処理装置。

【請求項2】

前記割当確率において、前記ｎ個のアイテムのそれぞれについて、アイテムを前記埋め込みベクトルに割り当てる条件付確率の和は１である、ことを特徴とする請求項１に記載の情報処理装置。

【請求項3】

前記ｎ個のアイテムはそれぞれａ個（ａは２以上の自然数）の特徴と関連付けられており、
前記変換部は、前記ａ個の特徴と関連付けられた前記ｎ個のアイテムを、前記ｍ個の埋め込みベクトルに変換し、ここで、ｍはａより小さい、ことを特徴とする請求項１に記載の情報処理装置。

【請求項4】

前記割当確率に基づいて、ユーザが、前記ｍ個の埋め込みベクトルが配置された前記ｋ個の位置それぞれを認識する確率を表す位置バイアスを推定する推定部を更に有する、ことを特徴とする請求項１に記載の情報処理装置。

【請求項5】

前記割当確率に基づいて、ユーザが、前記ｍ個の埋め込みベクトルが配置された前記ｋ個の位置それぞれを認識する確率を表す第１の位置バイアスを推定する第１の推定部と、
前記配置確率に基づいて、ユーザが、前記ｎ個のアイテムが配置された前記ｋ個の位置それぞれを認識する確率を表す第２の位置バイアスを推定する第２の推定部とを更に有する、ことを特徴とする請求項１に記載の情報処理装置。

【請求項6】

前記配置確率の分布の偏りを算出する偏り算出部を更に有し、
前記配置確率の分布の偏りが所定のレベル以上の場合に、前記第１の推定部が前記第１の位置バイアスを推定し、
前記配置確率の分布の偏りが前記所定のレベル未満の場合に、前記第２の推定部が前記第２の位置バイアスを推定する、
ことを特徴とする請求項５に記載の情報処理装置。

【請求項7】

前記偏り算出部は、前記配置確率の分布において、前記ｋ個の位置のうち、前記ｎ個のアイテムが配置された割合を、前記配置確率の分布の偏りとして算出する、ことを特徴とする請求項６に記載の情報処理装置。

【請求項8】

前記偏り算出部は、前記ｋ個の位置における前記ｎ個のアイテムの一様分布に対する前記配置確率の分布の類似度を、前記配置確率の分布の偏りとして算出する、ことを特徴とする請求項６に記載の情報処理装置。

【請求項9】

前記偏り算出部は、前記類似度を、カルバックライブラー情報量により算出する、ことを特徴とする請求項８に記載の情報処理装置。

【請求項10】

ｋ個（ｋは２以上の自然数）の位置にｎ個（ｎは２以上の自然数）のアイテムそれぞれが配置される確率を表す配置確率を取得することと、
前記ｎ個のアイテムを、前記ｎ個のアイテムの特徴の抽象表現を表すｍ個（ｄは２以上の自然数）の埋め込みベクトルに変換することと、
前記ｎ個のアイテムから前記ｍ個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出することと、
前記配置確率の分布と前記割当確率の分布を用いて、前記ｋ個の位置それぞれに対して前記ｍ個の埋め込みベクトルそれぞれが配置される確率表現を導出すること、
を含むことを特徴とする情報処理方法。

【請求項11】

情報処理方法をコンピュータに実行させるためのプログラムであって、前記情報処理方法は、
ｋ個（ｋは２以上の自然数）の位置にｎ個（ｎは２以上の自然数）のアイテムそれぞれが配置される確率を表す配置確率を取得することと、
前記ｎ個のアイテムを、前記ｎ個のアイテムの特徴の抽象表現を表すｍ個（ｍは２以上の自然数）の埋め込みベクトルに変換することと、
前記ｎ個のアイテムから前記ｍ個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出することと、
前記配置確率の分布と前記割当確率の分布を用いて、前記ｋ個の位置それぞれに対して前記ｍ個の埋め込みベクトルそれぞれが配置される確率表現を導出すること、
を含む、プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法、およびプログラムに関する。

【背景技術】

【0002】

近年、ユーザが利用するウェブサービスにおいて、商品や検索結果といったあらゆるアイテムのランキングが広く提供されている。このようなランキングを構築するために、ユーザによるクリック履歴といった、クリックデータが利用されている。
クリックデータは、ユーザの明示的な発言や評価でなく、ユーザの行動によって生成されるため、暗黙のフィードバックと呼ぶことができる。すなわち、クリックデータは、ユーザが好き嫌いを言うのではなく、システムやウェブサイトと対話する際に、実際にどのように行動したかを反映するものでありうる。このような点から、クリックデータは、暗黙のうちに豊富なフィードバックを提供するため、パーソナライズされたランキングを改善するために活用されている。

【0003】

ユーザは、画面に表示された複数のアイテムから任意のアイテムを選択してクリックする際、アイテムを確認してクリックするため、アイテムの位置がその確認およびクリックに影響しうる。このような、アイテムの位置に応じたユーザによる確認の偏りは、位置バイアス（Position bias）と呼ばれる。非特許文献１には、アイテムが配置された位置とアイテムのクリック履歴に基づいて、回帰型ＥＭ（Expectation-Maximization）アルゴリズムに従って位置バイアスを推定する技術が開示されている。

【先行技術文献】

【非特許文献】

【0004】

【文献】Xuanhui Wang, et al., “Position Bias Estimation for Unbiased Learning to Rank in Personal Search”, Proceedings of the 11th ACM International Conference on Web Search and Data Mining (WSDM), ACM (2018), pp. 610-618

【発明の概要】

【発明が解決しようとする課題】

【0005】

複数のアイテムが表示される画面において、当該複数のアイテムのそれぞれは、固定的な位置に配置されることが多い。例えば、カルーセル広告において、各アイテムの配置と順番は、当該広告の作成者によって予め決められている。このように、複数のアイテムそれぞれが固定的な位置に配置される状況では、アイテムが配置される位置に偏りが生じることになる。すなわち、アイテムを配置可能な複数の位置に対して、実際のアイテムの配置位置に偏りが生じる。
上記文献では、このような、アイテムの配置位置に偏りが生じる場合において、当該配置位置の偏りの影響を考慮して位置バイアスを推定する仕組みは開示されていなかった。

【0006】

本開示では、上記課題に鑑みて、アイテムの配置位置に偏りが生じる場合であっても、当該偏りの影響を考慮して位置バイアスを推定するためのアルゴリズムを確立することを目的とする。

【課題を解決するための手段】

【0007】

本開示の一態様による情報処理装置は、ｋ個（ｋは２以上の自然数）の位置にｎ個（ｎは２以上の自然数）のアイテムそれぞれが配置される確率を表す配置確率を取得する取得部と、前記ｎ個のアイテムを、前記ｎ個のアイテムの特徴の抽象表現を表すｍ個（ｍは２以上の自然数）の埋め込みベクトルに変換する変換部と、前記ｎ個のアイテムから前記ｍ個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出する算出部と、前記配置確率の分布と前記割当確率の分布を用いて、前記ｋ個の位置それぞれに対して前記ｍ個の埋め込みベクトルそれぞれが配置される確率表現を導出する導出部と、を有する。

【0008】

本開示の一態様による情報処理方法は、ｋ個（ｋは２以上の自然数）の位置にｎ個（ｎは２以上の自然数）のアイテムそれぞれが配置される確率を表す配置確率を取得することと、前記ｎ個のアイテムを、前記ｎ個のアイテムの特徴の抽象表現を表すｍ個（ｄは２以上の自然数）の埋め込みベクトルに変換することと、前記ｎ個のアイテムから前記ｍ個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出することと、前記配置確率の分布と前記割当確率の分布を用いて、前記ｋ個の位置それぞれに対して前記ｍ個の埋め込みベクトルそれぞれが配置される確率表現を導出すること、を含む。

【0009】

本開示の一態様によるプログラムは、情報処理方法をコンピュータに実行させるためのプログラムであって、前記情報処理方法は、ｋ個（ｋは２以上の自然数）の位置にｎ個（ｎは２以上の自然数）のアイテムそれぞれが配置される確率を表す配置確率を取得することと、前記ｎ個のアイテムを、前記ｎ個のアイテムの特徴の抽象表現を表すｍ個（ｍは２以上の自然数）の埋め込みベクトルに変換することと、前記ｎ個のアイテムから前記ｍ個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出することと、前記配置確率の分布と前記割当確率の分布を用いて、前記ｋ個の位置それぞれに対して前記ｍ個の埋め込みベクトルそれぞれが配置される確率表現を導出すること、を含む。

【発明の効果】

【0010】

本発明によれば、アイテムの配置位置の偏りの影響を考慮して位置バイアスを推定するためのアルゴリズムが提供される。

【図面の簡単な説明】

【0011】

【図1】図１は、情報処理システムの構成例を示す。

【図2A】図２Ａは、一実施形態による配置確率π（ｉ，ｋ）の分布の例を示す。

【図2B】図２Ｂは、一実施形態による割当確率Ｐ（ｅ｜ｉ）の分布の例を示す。

【図2C】図２Ｃは、一実施形態による配置確率π（ｅ，ｋ）の分布の例を示す。

【図3】図３は、埋め込みベクトルの生成を説明するための図である。

【図4】図４は、一本実施形態によるアルゴリズムを示す。

【図5】図５は、情報処理装置の機能構成例を示す。

【図6】図６は、複数のアイテムが複数の位置に配置されたコンテンツの例を示す。

【図7】図７は、実施形態による情報処理装置のハードウェア構成例を示す。

【発明を実施するための形態】

【0012】

以下、添付図面を参照して、本発明を実施するための実施形態について詳細に説明する。以下に開示される構成要素のうち、同一機能を有するものには同一の符号を付し、その説明を省略する。なお、以下に開示される実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正または変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。

【0013】

本実施形態では、非特許文献１に開示された、ユーザがアイテムをクリックする確率の確率モデルを表す位置ベースクリックモデル（Position-based click model）を改良した確率モデルを用いる。まず、当該文献に開示された、従来の位置ベースクリックモデルについて説明し、その後、当該従来の位置ベースクリックモデルを改良したモデルに基づく回帰型ＥＭアルゴリズムに従って位置バイアスを推定するための構成について説明する。なお、本開示において、「確率」という語は、未知の可能性を指すのではなく、対象の事象が起こる割合として理解されてよい。

【0014】

［従来の位置ベースクリックモデル］
非特許文献１に開示された位置ベースクリックモデルについて説明する。ここでは、ウェブサービスに関連して表示画面上に表示（配置）された、リコメンドする１つ以上のアイテム（例えば、広告や商品）から、ユーザが任意のアイテムをクリックすることを想定する。
アイテムｉを、リコメンドするアイテムとする。また、変数Ｃを、報酬変数とする。クリックを報酬の対象とする場合、変数Ｃが「１」の場合は、表示されたアイテムがクリックされたことを示し、変数Ｃが「０」の場合は、表示されたアイテムがクリックされなかったことを示す。また、ユーザｕを、ユーザｕに特有な１つ以上のユーザ属性（ユーザ装置やユーザ自身に関する情報）を含むユーザコンテキストを有するユーザとする。また、位置ｋを、複数の表示可能（配置可能）な位置において、アイテムが表示された位置とする。

【0015】

位置ベースクリックモデルにおいて、アイテムｉ、ユーザｕ、および位置ｋを条件としたクリック確率Ｐ（Ｃ＝１｜ｉ，ｕ，ｋ）は、２つの潜在的な確率の乗算として、（１）式のように表される。

【数1】

ここで、Ｐ（Ｅ＝１｜ｋ）は、位置ｋがユーザによって認識（Examination）される確率を表す。当該認識は、無意識に、もしくは明確に意識せずに、位置ｋを認識することを含みうる。また、Ｐ（Ｒ＝１｜ｉ，ｕ）は、アイテムｉとユーザｕに関連性（Relevance）が存在する確率を表す。ここで、関連性とは、ユーザｕのユーザコンテキストが、アイテムのアイテム特徴と関連があることを意味する。例えば、ユーザｕのユーザコンテキストが「車を所有している」というユーザ属性を含む場合、ユーザｕは、自動車関連商品のアイテムと関連があるということができる。
このように、（１）式に示す位置ベースクリックモデルは、ユーザがある位置を認識し、その位置のアイテムと当該ユーザに関連性がある場合に、当該ユーザは当該アイテムをクリックするという仮定の下に成り立っている。

【0016】

以下の説明では、（１）式の右辺における２つの確率を、それぞれ、アイテムとユーザの関連性μ（ｉ，ｕ）と、位置バイアスθ_ｋと表す。すなわち、μ（ｉ，ｕ）＝Ｐ（Ｒ＝１｜ｉ，ｕ）と、θ_ｋ＝Ｐ（Ｅ＝１｜ｋ）とする。非特許文献１では、関連性μ（ｉ，ｕ）と位置バイアスθ_ｋを、回帰型ＥＭアルゴリズムを用いて推定している。回帰型ＥＭアルゴリズムでは、期待値を計算する期待値（Ｅ：Expectation）ステップと、当該期待値を最大化する最大化（Ｍ：Maximization）ステップを交互に繰り返すことにより、確率モデルに含まれる確率（すなわち、関連性μ（ｉ，ｕ）と位置バイアスθ_ｋ）を最尤推定している。

【0017】

表示画面においてアイテムを配置することができる位置は複数存在しうるが、一般的に、広告の作成者やマーケティング担当者による経験や専門知識により、アイテムは、固定的な位置に配置されることが多い。すなわち、（１）式を参照すると、位置ｋがとりうる複数の位置において、アイテムｉが配置される位置は、当該複数の位置の全てではないことが多い。このような、アイテムを配置可能な複数の位置に対して、実際のアイテムの配置位置に偏りが生じる場合に、従来の位置ベースクリックモデルでは、位置バイアスを正確に表現できず、回帰型ＥＭアルゴリズムを用いて正確な位置バイアスを推定できなかった。

【0018】

本実施形態では、複数のアイテムが、複数の埋め込みベクトルに変換され、当該複数の複数の埋め込みベクトルに基づいて、改良型の位置ベースクリックモデルが定義される。そして、当該改良型の位置ベースクリックモデルで表現された、アイテムとユーザの関連性と位置バイアスとが、回帰型ＥＭアルゴリズムを用いて推定される。

【0019】

［情報処理システムの構成］
図１に、本実施形態における情報処理システム１の構成例を示す。情報処理システム１は、その一例として、図１に示すように、情報処理装置１０と、ユーザにより使用されるユーザ装置１１を含んで構成される。情報処理装置１０とユーザ装置１１は通信可能に構成される。なお、以下の説明において、図１では、１台のユーザ装置１１が示されているが、複数のユーザ装置が情報処理装置１０に互いに通信可能に構成されてよい。また、ユーザ装置１１という語は、当該複数のユーザ装置のいずれかであると理解されてよい。

【0020】

ユーザ装置１１は、例えば、スマートフォン、タブレット端末、スマートテレビといった表示部を有するデバイスである。ユーザ装置１１は、５Ｇ（第５世代移動通信システム）といった公衆網や、無線ＬＡＮ（Local Area Network）等の無線通信網を介して、情報処理装置１０と通信可能に構成されている。ユーザ装置１１がスマートフォンやタブレット端末といった、液晶ディスプレイ等の表示部に装備されたＧＵＩ（Graphic User Interface）を有するデバイスの場合、ユーザはＧＵＩにより各種操作を行うことができる。当該操作は、指やスタイラス等によりタップ操作、スライド操作、スクロール操作等、表示画面に表示された画像等のコンテンツに対する各種の操作を含む。

【0021】

なお、ユーザ装置１１は、図１に示すような形態のデバイスに限らず、デスクトップ型のＰＣ（Personal Computer）や、ノート型のＰＣといったデバイスであってもよい。その場合、各ユーザによる操作は、マウスやキーボードといった入力装置を用いて行われうる。また、ユーザ装置１１は、表示部を別に備えてもよい。

【0022】

情報処理装置１０は、マーケットプレイス等の電子商取引プラットフォームを提供するサーバ装置であってよく、ユーザ装置１１は、情報処理装置１０から提供されるウェブサービス（インターネット関連サービス）を利用することができる。なお、情報処理装置１０が上記サーバ装置である場合に限定されず、ユーザ装置１１は、情報処理装置１０とは別の不図示のサーバ装置から提供されるウェブサービスを、情報処理装置１０を介して利用する構成であってもよい。

【0023】

ユーザは、ユーザ装置１１の表示画面に表示された、ウェブサービスで提供される複数のアイテム（例えば、広告や商品）のうち、任意のアイテムをクリック（選択動作）することができる。クリックされたアイテムが商品の場合は、クリック後に、商品の説明や購入手続きのための情報がユーザ装置１１の表示部に表示されうる。また、クリックされたアイテムが広告の場合は、広告の具体的な内容がユーザ装置１１の表示部に表示されうる。

【0024】

情報処理装置１０は、ユーザ装置１１にウェブサービスを提供し、当該ウェブサービスにおけるユーザの行動を観測し、そのレポートを受信するように構成される。例えば、情報処理装置１０は、ユーザの行動履歴を示すレポートの受信を有効に設定することにより、ウェブサービスにおけるユーザの行動履歴を反映した観測データを取得することができる。
本実施形態では、情報処理装置１０は、ユーザ装置１１の表示部に表示された複数のアイテムのいずれかに対する、ユーザによるクリック動作を含むユーザの行動履歴を観測する。情報処理装置１０が取得する観測データは、ユーザコンテキスト、アイテムの位置の情報、アイテムのアイテム情報、およびクリック情報の少なくともいずれかが含まれる。

【0025】

ユーザコンテキストは、ユーザに特有な１つ以上のユーザ属性（ユーザ装置１１やユーザ自身に関する情報）を含む。ユーザ属性は、例えば、ユーザの氏名やユーザの住所、商品の配送先の情報、ユーザが保持するクレジットカードの情報、ユーザのデモグラフィック情報を含む。デモグラフィック情報は、性別、年齢、居住地域、職業、家族構成等の人口統計学的なユーザ属性を示す情報である。
ユーザ属性は、例えば、ユーザが、ウェブサービスを利用するために登録することができる。これに加えて、または、これに代えて、情報処理装置１０は、ユーザが閲覧したウェブページや過去にクリックした場所等を分析して、ユーザ属性を取得することができる。

【0026】

アイテムの位置の情報は、ユーザ装置１１の表示部において、ユーザがクリックしたアイテムの位置に関する情報を含む。
アイテムの情報は、当該アイテムを識別するための情報を含む。また、当該アイテムの情報は、色やサイズといった、１つ以上のアイテム特徴を含んでもよい。
クリックの情報は、クリックの有無を示す情報である。

【0027】

情報処理装置１０は、このような観測データと、アイテムの表示に関する所定の構成情報に基づいて、データセットを生成する。当該構成情報は、ユーザ装置の表示画面において表示される複数のアイテムの情報（アイテム特徴を含む）と、アイテムを配置可能な全ての位置（複数の位置）の情報を含む。そして、情報処理装置１０は、当該データセットに含まれる複数のアイテムを複数の埋め込みベクトルに変換し、当該埋め込みベクトルを用いた改良型の位置ベースクリックモデルに従って位置バイアスを定義する。当該改良型の位置ベースクリックモデルは、上記の（１）式の従来の位置ベースクリックモデルを改良したモデルに相当する。そして、情報処理装置１０は、当該位置バイアスを、回帰型ＥＭアルゴリズムを用いて推定する。本実施形態における回帰型ＥＭアルゴリズムは、非特許文献１に開示される回帰型ＥＭアルゴリズムを改良したものに相当する。以下の説明において、前者を改良型の回帰型ＥＭアルゴリズム、後者を従来の回帰型ＥＭアルゴリズムとも称する。
以下、情報処理装置１０の動作に沿って、改良型の位置ベースクリックモデル、および改良型の回帰型ＥＭアルゴリズムについて、説明する。

【0028】

［情報処理装置の動作］
情報処理装置１０は、ユーザ装置１１に提供したウェブサービスに対してｎ回（ｎは２以上の自然数）に渡って観測データを取得し、当該観測データと所定の構成情報に基づいてデータセットＤを生成する。１回の観測は、一定期間の時間における観測でありうる。なお、本実施形態では、情報処理装置１０は、観測データと所定の構成情報に基づいてデータセットＤを生成することを想定する。しかしながら、データセットＤを生成するための元データはこれらに限定されず、ユーザのクリック動作を観測することによりデータセットＤを生成できれば他のデータであってもよい。

【0029】

生成したデータセットＤは、以下の（２）式のように表される。

【数2】

ここで、インデックスｊは、１からｎ番目の観測のいずれかを表すインデックスである。ユーザｕ_ｊは、観測ｊにおいて、ユーザｕに特有なコンテキスト（すなわち、１つ以上のユーザの属性）を有するユーザである。ユーザ属性は、例えば、ユーザの年齢や性別である。
アイテムｉ_ｊは、観測ｊにおけるアイテムｉであり、それぞれ複数のアイテム特徴に関連付けられる。アイテム特徴は、例えば、色やサイズといったアイテムを識別するための特徴である。本実施形態において、アイテムｉ_ｊの種類はｎ個とするが、これに限定されない。
クリックｃ_ｊは、観測ｊにおける報酬変数であり、本実施形態では、ユーザｕ_ｊによりアイテムｉ_ｊがクリックされた場合に「１」をとり、アイテムｉ_ｊがクリックされなかった場合に「０」をとる。
位置ｋ_ｊは、観測ｊにおける、複数の表示可能（配置可能）な位置Ｋのうちの、いずれかの位置である（ｋ_ｊ∈Ｋ）。
なお、以下の説明において、ユーザｕ_ｊ、アイテムｉ_ｊ、クリックｃ_ｊ、および位置ｋ_ｊをインデックスｊに限定せずに一般化して称する場合、それぞれ、ユーザｕ、アイテムａ、クリックｃ、および位置ｋと称する。

【0030】

全てのとりうる（ｉ，ｋ）ペアを含むアクションのセットを、Ａ＝｛（ｉ，ｋ）｝とおき、ユーザｕを当該アクションの分布にマッピングする関数、言い換えると、アイテムｉを位置ｋに配置するポリシー（ルール）を、πとおく。本実施形態では、アイテムｉを位置ｋ（ｋ∈Ｋ）に配置する（割り当てる）確率（以下、配置確率とも称する）をπ（ｉ，ｋ）で表す。
多くの場合、当該ポリシーは、マーケティング担当者が、経験や専門知識に基づいて決定することが多い。その結果、配置確率π（ｉ，ｋ）の分布は、ほとんどが決定論的で、静的なものとなっている。本実施形態では、データセットＤは、このような従来のポリシーに従ったデータセットであり、全てのとりうる（ｉ，ｋ）ペアに対する、データセットＤにおける（ｉ, ｋ）のペアの種類は限られているものとする。

【0031】

情報処理装置１０は、データセットＤを取得すると、データセットＤに対する配置確率π（ｉ，ｋ）を算出する。データセットＤに対する配置確率π（ｉ，ｋ）は、複数のアイテム配置可能な位置Ｋの各位置に対して、データセットＤに含まれるアイテムｉがどのような確率（割合）で配置されるかを表す。
また、前述のように、本実施形態ではデータセットＤにおける（ｉ, ｋ）のペアの種類は限られる。情報処理装置１０は、このような疎らなペア（ｉ，ｋ）の度合いを定量化するために、配置確率π（ｉ, ｋ）の分布の偏りを示す指標（以下、配置分布指標とも称する）を算出する。

【0032】

第１の例として、配置分布指標を、スパース率（Sparsity ratio）Jで表すと、当該指標は（３）式のように表すことができる。スパース率は、配置分布における非欠損値（例えば、欠損値はデータセットＤにおいて欠損している（ｉ，ｋ）を指す）の割合を表す。

【数3】

ここで、｜Ｉ｜｜Ｋ｜は、全てのとりうる（ｉ，ｋ）ペアの数を表す（｜Ｉ｜はアイテムセットのサイズ、｜Ｋ｜は、位置セットのサイズを表す）。また、｜｛（ｉ，ｋ）∈Ｄ｝｜は、データセットＤにおける、（ｉ，ｋ）ペアの数（ユニークカウント）を表す。

【0033】

また、第２の例として、配置分布指標を、全てのとりうる位置ｋに対して一様にｎ個のアイテムｉが配置された一様分布に対する配置確率の分布の類似度で表すことができる。当該類似度の一例は、カルバックライブラー情報量（Kullback-Leibler divergence）Ｄ_ＫＬであり、当該指標は（４）式のように表すことができる。

【数4】

ここで、π_{ｕｎｉｆｏｒｍ}（ｉ，ｋ）は、全てのとりうる位置ｋに対して一様にアイテムｉが配置された場合の配置確率を示し、π_{ｂｉａｓｅｄ}（ｉ，ｋ）は、データセットＤに対する配置確率を示す。

【0034】

（３）式に示すスパース率Ｊは、（ｉ，ｋ）が、実際にどの程度の割合で観測されているかを示す。よって、スパース率Ｊが小さいほど、（ｉ，ｋ）が実際に観測された割合が低く、可能な全配置位置に対してアイテムの配置が疎であることを示す。一方、（４）式に示すカルバックライブラー情報量Ｄ_ＫＬが大きいほど、一様分布との乖離（非類似度）が大きく、アイテムの配置位置に偏りが生じていることを示す。情報処理装置１０は、このような配置分布指標を算出することにより、データセットＤにおけるアイテムの配置位置の偏りの度合いを把握することができる。

【0035】

図２Ａに、データセットＤに対する配置確率π（ｉ，ｋ）の分布の例を示す。具体的には、図２Ａは、全アイテム：アイテムｉ_０、ｉ_１、ｉ_２、アイテムを配置可能な全ての位置：ｋ_０、ｋ_１、ｋ_２である場合に、アイテムが各位置にどのような確率（割合）で配置されるかを示す、配置確率π_ｂ（ｉ，ｋ_０）、π_ｂ（ｉ，ｋ_１）、π_ｂ（ｉ，ｋ_２）、の例を示す。なお、図２Ａの表において、データセットＤに対するπ_{ｂｉａｓｅｄ}（ｉ，ｋ）を、配置確率π_ｂ（ｉ，ｋ）で表している。
当該表に示すように、データセットＤでは、アイテムｉ_０が位置ｋ_０に固定的に配置され、アイテムｉ_１が位置ｋ_１に固定的に配置され、アイテムｉ_２が位置ｋ_２に固定的に配置されている。すなわち、データセットＤでは、アイテムと配置位置のペアが、（ｉ_０，ｋ_０）、（ｉ_１，ｋ_１）、（ｉ_２，ｋ_２）に偏っていることがわかる。

【0036】

図２Ａに示すデータセットＤに対する配置確率π（ｉ，ｋ）の分布の場合、（３）式に従って、データセットＤに対するスパース率Ｊは、（５）式のように算出することができる。

【数5】

【0037】

また、（４）式に従って、データセットＤに対するカルバックライブラー情報量Ｄ_ＫＬは、（６）式のように算出することができる。

【数6】

【0038】

上述したように、データセットＤでは、（ｉ，ｋ）ペアについて、取りうるすべての（ｉ，ｋ）に対して偏りが生じている。すなわち、データセットＤにおける（ｉ，ｋ）ペアには、偏りや疎の問題が生じている。そして、このようなデータセットＤと（１）式を用いて、従来技術に従って位置バイアスを推定する場合、データセットＤに含まれる（ｉ，ｋ）ペアの偏りや疎の問題により、当該推定が正しく行われない可能性がある。

【0039】

このような問題に対処するために、情報処理装置１０は、データセットＤにおける複数のアイテムから、複数の埋め込みベクトルを生成する。具体的には、情報処理装置１０は、データセットＤにおけるｎ個のアイテムｉ_ｊ（ｊ＝１からｎ）から、ｍ個の埋め込みベクトルｅ（ｅ∈Ｅ（Ｅは埋め込みベクトルの集合））を生成する。埋め込みベクトルｅは、複数のアイテム特徴を抽象化した潜在的コンテキスト（Latent contexts）を表すベクトルに対応する。

【0040】

埋め込みベクトルｅについて、図３を参照して具体的に説明する。図３は、本実施形態による埋め込みベクトルの生成を説明するための図である。
本実施形態では、アイテムｉはｎ個存在し、各アイテムは、ａ個（ａは２以上の自然数）のアイテム特徴に関連付けられているものとする。アイテム特徴は、色やサイズといったアイテムを識別するための特徴である。まず、情報処理装置１０は、データセットＤに含まれるｎ個のアイテムｉから、ｎ×ａの行列（アイテム×アイテム特徴）を準備する。ｎ×ａの行列の各列は、特徴ベクトルに対応し、各特徴ベクトルは、ｎ個のアイテムそれぞれの各アイテム特徴を表現する。

【0041】

情報処理装置１０は、ｎ×ａの行列（アイテム×アイテム特徴）を、ｎ×ｍの行例（アイテム×潜在的コンテキスト）に変換（マッピング）する。当該変換は、ＬＳＩ（Latest semantic indexing）や、ＶＡＥ（Variational auto-encoder）といった、公知の特徴表現抽出の技術により実施することができる。変換後のｎ×ｍの行列の各列は、埋め込みベクトルに対応し、各埋め込みベクトルは、ｎ個のアイテムそれぞれの潜在的コンテキストを表す。これにより、ｍ個の埋め込みベクトルが生成される。埋め込みベクトルは、ａ個のアイテム特徴を抽象化したベクトルに対応し、抽象化した特徴ベクトルと称することもできる。

【0042】

ＬＳＩやＶＡＥを用いてｎ×ａの行列をｎ×ｍの行列に変換することにより、次元が削減され、すなわち、ｍはａより小さくなる。例えば、ＬＳＩでは、複数のアイテムのアイテム特徴において意味の近いものをまとめることにより、次元を減らすことができる。また、ＶＡＥにおいても、圧縮処理により、次元を減らすことができる。このように、ｎ×ｍの行列のサイズは、ｎ×ａのサイズより小さくなることにより、データセットＤにおける、疎な（ｉ，ｋ）ペアは、より密な（ｅ，ｋ）ペアに変換されることになる。

【0043】

アイテムｉから埋め込みベクトルｅへの割り当ての確率（アイテムｉを条件とした埋め込みベクトルｅの確率）を、割当確率Ｐ（ｅ｜ｉ）で表す。図２Ｂに、データセットＤに対する割当確率Ｐ（ｅ｜ｉ）の分布の例を示す。具体的には、図２Ｂは、全アイテム：アイテムｉ_０、ｉ_１、ｉ_２、埋め込みベクトルの数ｍ＝２である場合の、割当確率Ｐ（ｅ｜ｉ）の分布の例を示す。本実施形態では、各アイテムｉについて、割当確率Ｐ（ｅ｜ｉ）の合計（アイテムｉを埋め込みベクトルｅに割り当てる条件付確率の和）が１になるように、Ｐ（ｅ｜ｉ）を算出する。すなわち、Σ_ｅ∈Ｅ（ｅ｜ｉ）＝１である。図２Ｂでは例えば、位置ｉ_０から埋め込みベクトルｅ_０への割当確率Ｐ（ｅ_０｜ｉ_０）は１／２であり、位置ｉ_０から埋め込みベクトルｅ_１への割当確率Ｐ（ｅ_１｜ｉ_０）は１／２であるため、Ｐ（ｅ_０｜ｉ_０）＋Ｐ（ｅ_１｜ｉ_０）＝１となる。位置ｉ_１と位置ｉ_２ついても、それぞれ、Ｐ（ｅ_０｜ｉ_１）＋Ｐ（ｅ_１｜ｉ_１）＝１／３＋２／３＝１、Ｐ（ｅ_０｜ｉ_２）＋Ｐ（ｅ_１｜ｉ_２）＝１／４＋３／４＝１となる。

【0044】

（１）式の右辺に示すアイテムとユーザの関連性は、割当確率Ｐ（ｅ｜ｉ）と埋め込みベクトルｅを用いて、（７）式のように表すことができる。

【数7】

情報処理装置１０は、割当確率Ｐ（ｅ｜ｉ）と（７）式から、以下の（８）式の条件付き確率に基づいて、クリックＣから報酬ｗをサンプリングすることができる。（８）式は、（１）式に示すクリックの確率Ｐ（Ｃ＝１｜ｉ，ｕ，ｋ）に割当確率Ｐ（ｅ｜ｉ）を乗算した場合に、報酬ｗが１をとる確率を表す。

【数8】

【0045】

情報処理装置１０は、以上のように、埋め込みベクトルｅを生成し報酬ｗをサンプリングすることにより、データセットＤから、以下の（９）式に示すような埋め込みベクトルｅと報酬ｗを含んだデータセットＤ_ｅを生成することができる。

【数9】

【0046】

また、（１）式に示す従来の位置ベースクリックモデルは、埋め込みベクトルｅを用いて、埋め込みベクトル付きの、改良型の位置ベースクリックモデルとして、（１０）式のように表すことができる。

【数10】

【0047】

以下の説明では、（１０）式の右辺における２つの確率を、それぞれ、埋め込みベクトルとユーザの関連性μ（ｅ，ｕ）と、位置バイアスθ_ｅｋと表す。すなわち、μ（ｅ，ｕ）＝Ｐ（Ｒ＝１｜ｅ，ｕ）と、θ_ｅｋ＝Ｐ（Ｅ＝１｜ｋ）とする。（１）式に示す位置バイアスθ_ｋと区別して、（１０）式に示す位置バイアスθ_ｅｋは、ユーザｕが、ｍ個の埋め込みベクトルが配置されたｋ個の位置それぞれを認識する確率を表す。

【0048】

前述のように、本実施形態では、各アイテムｉについて、割当確率Ｐ（ｅ｜ｉ）の合計を１となるようにＰ（ｅ｜ｉ）を算出し、以下の（１１）式のようにＰ（ｅ｜ｉ）を定義する。

【数11】

ここで、ｅ_ｉ，ｌ（∈Ｅ）は、埋め込みベクトルの行列（図３に示すアイテム×潜在的コンテキスト）における各要素を指す。ｅ_ｉ，ｌは、埋め込み空間における表現（埋め込み空間表現）に対応する。また、（１１）式におけるｌとｌ’は、潜在的コンテキストを表し、ｌ’とｌは独立したパラメータである。

【0049】

２つのアイテムｉとアイテムｉ’が類似している場合、それらに対応する埋め込み空間表現ｅ_ｉ，ｌとｅ_ｉ’，ｌも類似し、割当確率Ｐ（ｅ｜ｉ）とＰ（ｅ｜ｉ’）の分布も類似すると仮定する。
このような仮定に基づくと、データセットＤにおける（ｉ_０，ｋ_０）と（ｉ_１，ｋ_１）といった特定の（アイテム、位置）のペアを観測する場合であっても、割当確率Ｐ（ｅ_０｜ｉ_０）、Ｐ（ｅ_１｜ｉ_０）、Ｐ（ｅ_０｜ｉ_１）、Ｐ（ｅ_１｜ｉ_１）を得ることができる。データセットＤ_ｅを用いることにより、埋め込みベクトルｅ_０とｅ_１のそれぞれ対して、両方の位置に対するデータ（すなわち、埋め込みベクトルｅ_０の場合は、（ｅ_０，ｋ_０）と（ｅ_０，ｋ_１））を利用できるので、前述したような、偏りや疎の問題を解決することができる。

【0050】

情報処理装置１０は、データセットＤにおける各位置ｋについて、配置確率π（ｉ，ｋ）の分布と割当確率Ｐ（ｅ｜ｉ）の分布を用いて、埋め込みベクトルｅが配置される確率表現を表す配置確率π（ｅ，ｋ）を導出する。本実施形態では、配置確率π（ｅ，ｋ）は、割当確率Ｐ（ｅ｜ｉ）と配置確率π（ｉ，ｋ）との乗算の和を用いて導出（算出）する。
図２Ｃに、図２Ｂのような割当確率Ｐ（ｅ｜ｉ）の場合の、配置確率π（ｅ，ｋ）の例を示す。配置確率π（ｅ，ｋ）は、図２Ｂに示す割当確率Ｐ（ｅ｜ｉ）と、図２Ａに示すデータセットＤにおける配置確率π_ｂ（ｉ，ｋ）に基づく、データセットＤ_ｅに対する配置確率π（ｅ，ｋ）を示す。

【0051】

配置確率π（ｅ_ｐ，ｋ_ｑ）は、データセットＤ_ｅにおける全アイテムｉについての、割当確率Ｐ（ｅ_ｐ｜ｉ）と配置確率π_ｂ（ｉ，ｋ_ｑ）との乗算の和で算出することができる。
例えば、図２Ｃにおいて、配置確率π（ｅ_０，ｋ_０）は、以下の（１２）式のように算出することができる。

【数12】

ここで、ｊは、データセットＤ_ｅにおけるアイテムのインデックスを示す。

【0052】

図２Ｃに示すように、配置確率π（ｅ，ｋ）は、図２Ａに示す配置確率π_ｂ（ｉ，ｋ）と比較して、データの偏りや疎の問題が解消されていることがわかる。よって、埋め込みベクトルｅと位置ｋを含むデータセットＤ_ｅを用いることにより、位置バイアスをより正確に推定することが期待される。

【0053】

次に、情報処理装置１０は、データセットＤ_ｅを用いて、位置バイアスを推定する。従来では、非特許文献１に記載される回帰型ＥＭアルゴリズムを用いて、（１）式に示した従来の位置ベースクリックモデルに示される位置バイアスを推定した。すなわち、回帰型ＲＭアルゴリズムを適用して、期待値ステップと最大化ステップを繰り返すことにより、関連性μ（ｉ，ｕ）と位置バイアスθ_ｋを最適化した。

【0054】

本実施形態では、改良型の回帰型ＲＭアルゴリズムとして、まず、期待値ステップにおいて、ある時刻ｔに対するｔ＋１の反復において、隠れ変数ＥとＲの分布を、θ_ｅｋ ^（ｔ）とμ^（ｔ）（ｅ，ｕ）から推定する。θ_ｅｋ ^（ｔ）とμ^（ｔ）（ｅ，ｕ）はそれぞれ、時刻ｔにおける、（１０）式を参照して説明した、位置バイアスθ_ｅｋと、埋め込みベクトルとユーザの関連性μ（ｅ，ｕ）である。

【数13】

【0055】

（１３）式から、データセットＤ_ｅの全てのデータポイントについて、確率Ｐ（Ｅ＝１｜ｕ，ｅ，ｗ，ｋ）と確率Ｐ（Ｒ＝１｜ｕ，ｅ，ｗ，ｋ）を計算することができる。確率Ｐ（Ｅ＝１｜ｕ，ｅ，ｗ，ｋ）は、ユーザｕ、埋め込みベクトルｅ、報酬ｗ、位置ｋを条件とした場合に、ユーザｕと埋め込みベクトルｅの関連性が存在する（＝１）確率を表す。また、確率Ｐ（Ｅ＝１｜ｕ，ｅ，ｗ，ｋ）は、ユーザｕ、埋め込みベクトルｅ、報酬ｗ、位置ｋを条件とした場合に、位置ｋがユーザｕによって認識される確率を表す。

【0056】

最大化ステップでは、期待値ステップからの確率を用いて、θ_ｅｋ ^{（ｔ＋１）}とμ^{（ｔ＋１）}（ｅ，ｋ）を計算する。

【数14】

ここで、ｋ’とｅ’はそれぞれ、位置ｋと埋め込みベクトルｅを表すが、位置ｋと埋め込みベクトルｅは独立したパラメータである。また、（１４）式において、分母のＩは、指示関数（Indicator function）を表す。すなわち、Ｉ_ｋ’＝ｋは、ｋ’＝ｋの時に１をとり、それ以外の場合は０をとる関数である。同様に、Ｉ_ｅ’＝ｅは、ｅ’＝ｅの時に１をとり、それ以外の場合は０をとる関数である。

【0057】

（１３）式と（１４）式に基づく、本実施形態による改良型の回帰型ＥＭアルゴリズムを、図４に示す。以下、当該アルゴリズムにおける処理を順に説明する。
処理１
入力として、ユーザ（ユーザコンテキスト）ｕ、アイテムｉ、クリックｃ、および位置ｋを含むデータセット：Ｄ、位置バイアス：θ_ｅｋ、埋め込みベクトルとユーザの関連性：μ（ｅ，ｕ）、および割当確率Ｐ（ｅ｜ｉ）を受け取る。θ_ｅｋは、所定の初期値でありうる。また、μ（ｅ，ｕ）は、空の回帰モデルでありうる。
処理２～４
データセットＤに含まれる全てのユーザｕ、アイテムｉ、クリックｃ、および位置ｋについて、割当確率Ｐ（ｅ｜ｉ）を伴うクリックｃから、報酬ｗをサンプリングする。具体的には、（８）式に従って、ｗ∈｛０、１｝、すなわち、０または１をとる報酬ｗをサンプリングする。
処理５
処理４においてサンプリングされた報酬ｗの集合とデータセットＤから、ユーザ（ユーザコンテキスト）ｕ、アイテムｉ、報酬ｗ、および位置ｋを含むデータセットＤ_ｅを準備（生成）する。
処理６～１４
処理７～１３を、処理１４の条件を満たすまで反復する（時刻ｔから時刻ｔ＋１の繰り返し）。
処理７
集合Ｓを空集合とする。
処理８～１１
データセットＤ_ｅに含まれる全てのユーザｕ、埋め込みベクトルｅ、クリックｃ、および位置ｋについて、（１３）式に基づいて、確率Ｐ（Ｒ＝１｜ｕ，ｅ，ｗ，ｋ）からｒ∈｛０、１｝、すなわち、０または１をとる関連性ｒをサンプリングする。続いて、ユーザｕ、埋め込みベクトルｅ、関連性ｒと集合Ｓとの和集合Ｓを生成する。
処理１２
μ（ｅ，ｕ）とＳを入力として、ＧＢＤＴ（勾配ブースティング決定木（Gradient Boosted Decision Tree））に従って、μ（ｅ，ｕ）を更新する。アイテムとユーザの関連性は、非線形性となりうるため、ここではＧＢＤＴ方法を使用してμ（ｅ，ｕ）を学習する。
処理１３
（１４）式に従って、θ_ｅｋを更新する。
処理１４
時刻ｔと時刻ｔ＋１で更新されたθ_ｅｋの値の差が所定の値以下の場合に、収束条件を満たしたと判断し、終了する。所定の値は、例えば１０^－３である。ここで、時刻ｔと時刻ｔ＋１で更新されたθ_ｅｋの値に加えて、時刻ｔと時刻ｔ＋１で更新されたμ（ｅ，ｕ）の差が所定の値以下の場合に、収束条件を満たしたと判断し、終了してもよい。
処理１５
θ_ｋとμ（ｅ，ｕ）を返す。

【0058】

このように、本実施形態では、アイテムの配置位置を示す（ｉ, ｋ）のペアの種類が限られるデータセットＤであっても、アイテムｉが埋め込みベクトルｅに変換され、（ｅ, ｋ）ペアを含むデータセットＤ_ｅが生成される。そして、図４に示す改良型の回帰型ＥＭアルゴリズムに従って位置バイアスθ_ｅｋが推定される。これにより、従来の回帰型ＥＭアルゴリズムに従って位置バイアスθ_ｋを推定する場合より、精度高く位置バイアスθ_ｅｋを推定することが可能となる。

【0059】

情報処理装置１０は、図４に示す改良型の回帰型ＥＭアルゴリズムに従って位置バイアスθ_ｅｋを推定すると、当該推定した位置バイアスθ_ｅｋに基づいて、各ユーザに対するアイテムの配置位置を調整してもよい。具体的には、まず、情報処理装置１０は、（１）式に示す位置ベースクリックモデルにおける、アイテムとユーザの関連性μ（ｉ，ｕ）＝Ｐ（Ｒ＝１｜ｉ，ｕ）を、従来の回帰型ＥＭアルゴリズムを用いて推定し、ユーザｕに関連性の高い１つ以上のアイテムを特定する。これに加えて、あるいは、これに代えて、情報処理装置１０は、ユーザｕに関連性の高い順に、１つ以上のアイテムを特定してもよい。

【0060】

続いて、情報処理装置１０は、（１０）式に示す改良型の位置ベースクリックモデルにおける位置バイアスθ_ｅｋ＝Ｐ（Ｅ＝１｜ｋ）を、図４に示す改良型の回帰型ＥＭアルゴリズムを用いて推定する。そして、情報処理装置１０は、推定した位置バイアスθ_ｅｋに基づいて、ユーザｕが認識する可能性が高い位置を特定し、当該特定した位置に、当該特定した１以上のアイテムを配置する（マッチングする）。これにより、ユーザｕが当該１以上のアイテムをクリックする可能性が高くなり、すなわち、ＣＴＲ（クリック率）が向上し、広告効果が高くなりうる。

【0061】

［情報処理装置の機能構成］
図５に、本実施形態による情報処理装置１０の構成例を示す。情報処理装置１０は、第１データセット生成部１０１、偏り算出部１０２、埋め込みベクトル生成部１０３、割当確率算出部１０４、第２データセット生成部１０５、確率表現導出部１０６、関連性推定部１０７、位置バイアス推定部１０８、コンテンツ作成部１０９、およびコンテンツ提供部１１０を有する。

【0062】

第１データセット生成部１０１は、ウェブサービスにおけるユーザの行動履歴を反映したデータセットＤを生成する。例えば、第１データセット生成部１０１は、ウェブサービスにおけるユーザの行動履歴の観測データと、アイテムの表示に関する所定の構成情報に基づいて、データセットＤを生成する。上述のように、データセットＤは、１からｎ番目の各観測における、ユーザｕ、アイテムｉ、クリックｃ、および位置ｋを含んで構成される。アイテムｉは、ａ個のアイテム特徴に関連付けられている。
また、第１データセット生成部１０１は、データセットＤに対する配置確率π（ｉ，ｋ）を算出して取得する。データセットＤに対する配置確率π（ｉ，ｋ）の分布の一例は、図２Ａに示されている。

【0063】

偏り算出部１０２は、第１データセット生成部１０１により算出された配置確率π（ｉ，ｋ）の分布の偏りを示す指標を示す配置分布指標を算出する。本実施形態では、上述したように、（３）式で定義されるスパース率Jと、（４）式で定義されるカルバックライブラー情報量Ｄ_ＫＬを算出する。スパース率Ｊは、値が小さいほど、アイテムの配置位置に偏りが生じていることを示す。一方、カルバックライブラー情報量Ｄ_ＫＬは、値が大きいほど、アイテムの配置位置に偏りが生じていることを示す。

【0064】

埋め込みベクトル生成部１０３は、データセットＤに含まれるｎ個のアイテムｉを、当該ｎ個のアイテムｉのアイテム特徴の抽象表現を表すｍ個の埋め込みベクトルｅに変換する。本実施形態では、埋め込みベクトル生成部１０３は、図３を参照して説明したように、データセットＤに含まれるｎ個のアイテムｉから、ｎ×ａの行列（アイテム×アイテム特徴）を準備する。そして、埋め込みベクトル生成部１０３は、当該行列を、ｎ×ｍ（アイテム×潜在的コンテキスト）の行列に変換（マッピング）する。埋め込みベクトル生成部１０３は、変換後のｎ×ｍの行列の各列を、埋め込みベクトルｅとして生成する。

【0065】

割当確率算出部１０４は、データセットＤに含まれるｎ個のアイテムｉからｍ個の埋め込みベクトルｅへの割当の確率（アイテムｉを条件としため込みベクトルｅの確率）を表す割当確率Ｐ（ｅ｜ｉ）を算出する。データセットＤに対する割当確率Ｐ（ｅ｜ｉ）の分布の一例は、図２Ｂに示されている。割当確率算出部１０４は、各アイテムｉについて、割当確率Ｐ（ｅ｜ｉ）の合計が１になるように、Ｐ（ｅ｜ｉ）を算出することができる。

【0066】

第２データセット生成部１０５は、データセットＤ_ｅを生成する。具体的には、上述のように、第２データセット生成部１０５は、割当確率算出部１０４により算出された割当確率Ｐ（ｅ｜ｉ）を伴うクリックｃから、（８）式に従って、０または１をとる報酬ｗをサンプリングする。続いて、第２データセット生成部１０５は、報酬ｗの集合とデータセットＤから、ユーザｕ、アイテムｉ、報酬ｗ、および位置ｋを含むデータセットＤ_ｅを生成する。

【0067】

確率表現導出部１０６は、データセットＤにおける各位置ｋについて、配置確率π（ｉ，ｋ）の分布と割当確率Ｐ（ｅ｜ｉ）の分布を用いて、埋め込みベクトルｅが配置される確率表現を表す配置確率π（ｅ，ｋ）を導出する。確率表現導出部１０６は、配置確率π（ｅ，ｋ）を、割当確率Ｐ（ｅ｜ｉ）と配置確率π（ｉ，ｋ）との乗算の和を用いて導出（算出）することができる。確率表現の分布の一例は、図２Ｃに示されている。

【0068】

関連性推定部１０７は、データセットＤにおけるアイテムｉとユーザｕの関連性μ（ｉ，ｕ）を推定する。具体的には、関連性推定部１０７は、（１）式に示す関連性μ（ｉ，ｕ）を、従来の回帰型ＥＭアルゴリズムを用いて推定する。

【0069】

位置バイアス推定部１０８は、データセットＤ_ｅに対する位置バイアスθ_ｅｋを推定する。具体的には、位置バイアス推定部１０８は、（１０）式に示す位置バイアスθ_ｅｋを、図４に示す改良型の回帰型ＥＭアルゴリズムを用いて推定する。
これに代えて、あるいは、これに加えて、位置バイアス推定部１０８は、データセットＤに対する位置バイアスθ_ｋを推定してもよい。具体的には、位置バイアス推定部１０８は、（１）式に示す位置バイアスθ_ｋを、従来の回帰型ＥＭアルゴリズムを用いて推定する。

【0070】

位置バイアス推定部１０８は、偏り算出部１０２により算出された配置分布指標に基づいて、従来の回帰型ＥＭアルゴリズムと、改良型の回帰型ＥＭアルゴリズムのいずれかを用いて位置バイアスを推定するかを切り替えてもよい。
例えば、配置分布指標として、スパース率Jを用いる場合、位置バイアス推定部１０８は、スパース率Jが所定の値以下（配置分布の欠損値の数が所定のレベル以上）の場合に、（１０）式に示す位置バイアスθ_ｅｋを、図４に示す改良型の回帰型ＥＭアルゴリズムを用いて推定することができる。一方、位置バイアス推定部１０８は、スパース率Jが当該所定の値より大きい（配置分布の欠損値の数が所定のレベル未満）の場合に、（１）式に示す位置バイアスθ_ｋを、従来の回帰型ＥＭアルゴリズムを用いて推定することができる。
また、別の例として、配置分布指標として、カルバックライブラー情報量Ｄ_ＫＬを用いる場合、位置バイアス推定部１０８は、情報量Ｄ_ＫＬが所定の値以上（配置分布の偏りが所定のレベル以上）の場合に、（１０）式に示す位置バイアスθ_ｅｋを、図４に示す改良型の回帰型ＥＭアルゴリズムを用いて推定することができる。一方、位置バイアス推定部１０８は、情報量Ｄ_ＫＬが当該所定の値より小さい（配置分布の偏りが所定のレベル未満）の場合に、（１）式に示す位置バイアスθ_ｋを、従来の回帰型ＥＭアルゴリズムを用いて推定することができる。
このように、アイテムの配置位置に偏りが生じていない場合には、データセットＤ_ｅを生成せずに、データセットＤから従来の手法により位置バイアスθ_ｋを推定することにより、処理負荷を抑えることが可能となる。

【0071】

コンテンツ作成部１０９は、関連性推定部１０７により推定されたデータセットＤにおけるアイテムｉとユーザｕの関連性μ（ｉ，ｕ）と、位置バイアス推定部１０８により推定された位置バイアスθ_ｋまたは位置バイアスθ_ｅｋに基づいてユーザｕに提供するコンテンツを作成する。コンテンツが複数の広告（すなわち、アイテム）を含む広告コンテンツの場合、コンテンツ作成部１０９は、関連性μ（ｉ，ｕ）に基づいて、ユーザｕと関連性の高い順に、当該複数の広告を順序付けする。そして、コンテンツ生成部１０９は、位置バイアスθ_ｋまたは位置バイアスθ_ｅｋに基づいて、当該順序付けした広告を各位置に割り当てて、広告コンテンツを作成する。
コンテンツ提供部１１０は、コンテンツ作成部１０９により作成されたコンテンツを、ユーザｕに提供する。例えば、コンテンツ提供部１１０は、作成されたコンテンツを、ユーザｕが使用するユーザ装置の表示部に表示させる。

【0072】

このように、本実施形態による情報処理装置１０では、まず、第１データセット生成部１０１が、データセットＤに対する、複数の位置に複数のアイテムそれぞれが配置される確率を表す配置確率π（ｉ，ｋ）を取得する。その後、埋め込みベクトル生成部１０３が、当該複数アイテムを、複数の埋め込みベクトルに変換する。そして、割当確率算出部１０４が、当該複数のアイテムから当該複数の埋め込みベクトルへの割当の確率を表す割当確率Ｐ（ｅ｜ｉ）を算出する。続いて、確率表現導出部１０６が、当該配置確率の分布と当該割当確率の分布を用いて、当該複数の位置それぞれについて、当該複数の埋め込みベクトルそれぞれが配置される確率表現を示す配置確率π（ｅ，ｋ）を導出する。位置バイアス推定部１０８は、（１０）式に示す位置バイアスθ_ｅｋを、図４に示す改良型の回帰型ＥＭアルゴリズムを用いて推定する。

【0073】

さらに、情報処理装置１０では、コンテンツ作成部１０９が、ユーザが認識する可能性が高い位置に、当該ユーザと関連性の高いアイテムを配置するようにコンテンツを作成し、コンテンツ提供部１１０が、当該生成されたコンテンツをユーザに提供することができる。

【0074】

複数のアイテムが複数の位置に配置されたコンテンツの例を図６に示す。図６において、上部は、広告アイテム６１１、６１２、および６１３を、それぞれ位置６０１、６０２、および６０３に固定的に配置した広告コンテンツ６０を示す。ここで、関連性推定部１０７が推定したユーザｕと各広告アイテムの関連性のうち、ユーザｕと広告アイテム６１２の関連性が最も高く、ユーザｕと広告アイテム６１３、６１１の関連性が順に続いたものと仮定する。さらに、位置バイアス推定部１０８が推定した各位置に対する位置バイアスθ_ｅｋ（もしくは位置バイアスθ_ｋ）のうち、位置６０１に対する位置バイアスが最も高く、位置６０２、６０３に対する位置バイアスが続いたものと仮定する。この場合、コンテンツ作成部１０９は、図６の下部のように、広告アイテム６１２、６１３、および６１１を、それぞれ位置６０１、６０２、および６０３に割り当てた広告コンテンツ６１を作成する。そして、コンテンツ提供部１１０は、当該作成された広告コンテンツ６１をユーザｕに提供する。例えば、コンテンツ提供部１１０は、広告コンテンツ６１を、ユーザｕのユーザ装置１１の表示部に表示させるように制御する。

【0075】

ユーザｕのユーザ装置１１の表示部には、広告コンテンツ６１において、より関心の高い広告アイテム６１２が、位置バイアスの高い位置６０１に配置されること。これにより、ユーザｕにとってよりパーソナライズされた表示形態になるだけでなく、ユーザｕにより広告アイテム６１２をクリックする確率が高くなり、ＣＶＲ（コンバージョン率）が向上し、効果的なマーケティングが実現されうる。

【0076】

［情報処理装置１０のハードウェア構成］
次に、情報処理装置１０のハードウェア構成例について説明する。また、ユーザ装置１１も同様のハードウェア構成を有しうる。
図７は、本実施形態による情報処理装置１０のハードウェア構成の一例を示すブロック図である。
本実施形態による情報処理装置１０は、単一または複数の、あらゆるコンピュータ、モバイルデバイス、または他のいかなる処理プラットフォーム上にも実装することができる。
図７を参照して、情報処理装置１０は、単一のコンピュータに実装される例が示されているが、本実施形態による情報処理装置１０は、複数のコンピュータを含むコンピュータシステムに実装されてよい。複数のコンピュータは、有線または無線のネットワークにより相互通信可能に接続されてよい。

【0077】

図７に示すように、情報処理装置１０は、ＣＰＵ（Central Processing Unit）７０１と、ＲＯＭ（Read Only Memory）７０２と、ＲＡＭ（Random Access Memory）７０３と、ＨＤＤ（Hard Disk Drive）７０４と、入力部７０５と、表示部７０６と、通信Ｉ／Ｆ７０７と、ＧＰＵ（Graphics Processing Unit）７０８と、システムバス７０９とを備えてよい。情報処理装置１０はまた、外部メモリを備えてよい。
ＣＰＵ７０１は、情報処理装置１０における動作を統括的に制御するものであり、データ伝送路であるシステムバス７０９を介して、各構成部（７０２～７０８）を制御する。

【0078】

ＲＯＭ７０２は、ＣＰＵ７０１が処理を実行するために必要な制御プログラム等を記憶する不揮発性メモリである。なお、当該プログラムは、ＨＤＤ７０４、ＳＳＤ（Solid State Drive）等の不揮発性メモリや着脱可能な記憶媒体（不図示）等の外部メモリに記憶されていてもよい。
ＲＡＭ７０３は、揮発性メモリであり、ＣＰＵ７０１の主メモリ、ワークエリア等として機能する。すなわち、ＣＰＵ７０１は、処理の実行に際してＲＯＭ７０２から必要なプログラム等をＲＡＭ７０３にロードし、当該プログラム等を実行することで各種の機能動作を実現する。

【0079】

ＨＤＤ７０４は、例えば、ＣＰＵ７０１がプログラムを用いた処理を行う際に必要な各種データや各種情報等を記憶している。また、ＨＤＤ７０４には、例えば、ＣＰＵ７０１がプログラム等を用いた処理を行うことにより得られた各種データや各種情報等が記憶される。
入力部７０５は、キーボードやマウス等のポインティングデバイスにより構成される。
表示部７０６は、液晶ディスプレイ（ＬＣＤ）等のモニターにより構成される。表示部７０６は、入力部７０５と組み合わせて構成されることにより、ＧＵＩ（ＧｒａｐｈｉｃａｌＵｓｅｒＩｎｔｅｒｆａｃｅ）として機能してもよい。

【0080】

通信Ｉ／Ｆ７０７は、情報処理装置１０と外部装置との通信を制御するインタフェースである。
通信Ｉ／Ｆ７０７は、ネットワークとのインタフェースを提供し、ネットワークを介して、外部装置との通信を実行する。通信Ｉ／Ｆ７０７を介して、外部装置との間で各種データや各種パラメータ等が送受信される。本実施形態では、通信Ｉ／Ｆ７０７は、イーサネット（登録商標）等の通信規格に準拠する有線ＬＡＮ（Local Area Network）や専用線を介した通信を実行してよい。ただし、本実施形態で利用可能なネットワークはこれに限定されず、無線ネットワークで構成されてもよい。この無線ネットワークは、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＺｉｇＢｅｅ（登録商標）、ＵＷＢ（Ultra Wide Band）等の無線ＰＡＮ（Personal Area Network）を含む。また、Ｗｉ－Ｆｉ（Wireless Fidelity）（登録商標）等の無線ＬＡＮ（Local Area Network）や、ＷｉＭＡＸ（登録商標）等の無線ＭＡＮ（Metropolitan Area Network）を含む。さらに、４Ｇ、５Ｇ等の無線ＷＡＮ（Wide Area Network）を含む。なお、ネットワークは、各機器を相互に通信可能に接続し、通信が可能であればよく、通信の規格、規模、構成は上記に限定されない。
ＧＰＵ７０８は、画像処理に特化したプロセッサである。ＧＰＵ７０８は、ＣＰＵ７０１と協働して、所定の処理を行うことができる。

【0081】

図５に示す情報処理装置１０の各要素のうち少なくとも一部の機能は、ＣＰＵ７０１がプログラムを実行することで実現することができる。ただし、図５に示す情報処理装置１０の各要素のうち少なくとも一部の機能が専用のハードウェアとして動作するようにしてもよい。この場合、専用のハードウェアは、ＣＰＵ７０１の制御に基づいて動作する。

【0082】

［ユーザ属性］
上述のように、本実施形態において、ユーザコンテキストは、ユーザに関連付けられる１つ以上のユーザ属性を有する。ここで、ユーザ属性の例について言及する。
ユーザ属性は、ユーザが有する装置（ユーザ装置）やユーザについての事実特徴（事実情報）を含む。事実特徴は、ユーザ装置やユーザから実際に、または、客観的に得られる、事実に基づく特徴（情報）でありうる。
また、ユーザ属性は、事実特徴を学習済みの機械学習モデルに適用して推定されたユーザ属性（推定ユーザ属性）を含んでもよい。当該機械学習モデルは、例えば、対象のユーザの事実特徴を入力として、複数のユーザ属性それぞれが当該対象のユーザに該当する（適合する）確率（該当確率）を出力するように構成される。該当確率から、推定ユーザ属性を決定することができる。

【0083】

［アイテム特徴］
上述のように、本実施形態において、アイテムは、複数のアイテム特徴に関連付けられる。ここで、アイテム特徴の例について言及する。
アイテムの特徴は、アイテムを識別する情報（アイテムＩＤ）、当該アイテムのジャンル（上位分類）を識別する情報、当該アイテムが販売されているショップを識別する情報（ショップＩＤ）等を含んでもよい。アイテム特徴は、取引履歴に応じて、アイテムＩＤとジャンルＩＤ間、アイテムＩＤとショップＩＤ間の取引情報（取引回数等）も含むことができる。

【0084】

なお、上記において特定の実施形態が説明されているが、当該実施形態は単なる例示であり、本発明の範囲を限定する意図はない。本明細書に記載された装置及び方法は上記した以外の形態において具現化することができる。また、本発明の範囲から離れることなく、上記した実施形態に対して適宜、省略、置換及び変更をなすこともできる。かかる省略、置換及び変更をなした形態は、請求の範囲に記載されたもの及びこれらの均等物の範疇に含まれ、本発明の技術的範囲に属する。

【0085】

本実施形態の開示は以下の構成を含む。
［１］ｋ個（ｋは２以上の自然数）の位置にｎ個（ｎは２以上の自然数）のアイテムそれぞれが配置される確率を表す配置確率を取得する取得部と、
前記ｎ個のアイテムを、前記ｎ個のアイテムの特徴の抽象表現を表すｍ個（ｍは２以上の自然数）の埋め込みベクトルに変換する変換部と、
前記ｎ個のアイテムから前記ｍ個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出する算出部と、
前記配置確率の分布と前記割当確率の分布を用いて、前記ｋ個の位置それぞれに対して前記ｍ個の埋め込みベクトルそれぞれが配置される確率表現を導出する導出部と、
を有する、情報処理装置。

【0086】

［２］前記割当確率において、前記ｎ個のアイテムのそれぞれについて、アイテムを前記埋め込みベクトルに割り当てる条件付確率の和は１である、［１］に記載の情報処理装置。

【0087】

［３］前記ｎ個のアイテムはそれぞれａ個（ａは２以上の自然数）の特徴と関連付けられており、
前記変換部は、前記ａ個の特徴と関連付けられた前記ｎ個のアイテムを、前記ｍ個の埋め込みベクトルに変換し、ここで、ｍはａより小さい、［１］に記載の情報処理装置。

【0088】

［４］前記割当確率に基づいて、ユーザが、前記ｍ個の埋め込みベクトルが配置された前記ｋ個の位置それぞれを認識する確率を表す位置バイアスを推定する推定部を更に有する、［１］から［３］のいずれかに記載の情報処理装置。

【0089】

［５］前記割当確率に基づいて、ユーザが、前記ｍ個の埋め込みベクトルが配置された前記ｋ個の位置それぞれを認識する確率を表す第１の位置バイアスを推定する第１の推定部と、
前記配置確率に基づいて、ユーザが、前記ｎ個のアイテムが配置された前記ｋ個の位置それぞれを認識する確率を表す第２の位置バイアスを推定する第２の推定部とを更に有する、［１］から［４］のいずれかに記載の情報処理装置。

【0090】

［６］前記配置確率の分布の偏りを算出する偏り算出部を更に有し、
前記配置確率の分布の偏りが所定のレベル以上の場合に、前記第１の推定部が前記第１の位置バイアスを推定し、
前記配置確率の分布の偏りが前記所定のレベル未満の場合に、前記第２の推定部が前記第２の位置バイアスを推定する、
［５］に記載の情報処理装置。

【0091】

［７］前記偏り算出部は、前記配置確率の分布において、前記ｋ個の位置のうち、前記ｎ個のアイテムが配置された割合を、前記配置確率の分布の偏りとして算出する、［６］に記載の情報処理装置。

【0092】

［８］前記偏り算出部は、前記ｋ個の位置における前記ｎ個のアイテムの一様分布に対する前記配置確率の分布の類似度を、前記配置確率の分布の偏りとして算出する、［６］に記載の情報処理装置。

【0093】

［９］前記偏り算出部は、前記類似度を、カルバックライブラー情報量により算出する、［８］に記載の情報処理装置。

【符号の説明】

【0094】

１：情報処理システム、１０：情報処理装置１０、１１：ユーザ装置、１０１：第１データセット生成部、１０２：偏り算出部、１０３：埋め込みベクトル生成部、１０４：割当確率算出部、１０５：第２データセット生成部、１０６：確率表現導出部、１０７：関連性推定部、１０８：位置バイアス推定部、１０９：コンテンツ作成部、１１０：コンテンツ提供部

【要約】

【課題】アイテムの配置位置に偏りが生じる場合であっても、当該偏りの影響を考慮して位置バイアスを推定するためのアルゴリズムを確立する。
【解決手段】情報処理装置は、ｋ個（ｋは２以上の自然数）の位置にｎ個（ｎは２以上の自然数）のアイテムそれぞれが配置される確率を表す配置確率を取得し、該ｎ個のアイテムを、該ｎ個のアイテムの特徴の抽象表現を表すｍ個（ｍは２以上の自然数）の埋め込みベクトルに変換し、該ｎ個のアイテムから該ｍ個の埋め込みベクトルへの割り当ての確率を表す割当確率を算出し、該配置確率の分布と該割当確率の分布を用いて、該ｋ個の位置それぞれに対して該ｍ個の埋め込みベクトルそれぞれが配置される確率表現を導出する。
【選択図】図５