(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024028005
(43)【公開日】2024-03-01
(54)【発明の名称】抽出装置、抽出方法及び抽出プログラム
(51)【国際特許分類】
G06Q 30/0201 20230101AFI20240222BHJP
【FI】
G06Q30/02 300
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022131298
(22)【出願日】2022-08-19
(11)【特許番号】
(45)【特許公報発行日】2023-08-29
(71)【出願人】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】瀬賀 信一郎
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049BB02
(57)【要約】
【課題】コンテンツの配信効果を高めることのできる利用者を抽出する。
【解決手段】本願に係る抽出装置は、取得部と、特定部と、スコア算出部と、操作率算出部と、抽出部と、を有する。取得部は、利用者の行動履歴を取得する。特定部は、利用者に対して配信をするコンテンツの特徴を特定する。スコア算出部は、コンテンツの特徴に対する行動履歴の類似度の度合いを示す類似度スコアを行動履歴に基づいて利用者ごとに算出する。操作率算出部は、利用者に配信したコンテンツに対して利用者が操作を行った割合を示す操作率を利用者ごとに算出する。抽出部は、類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
利用者の行動履歴を取得する取得部と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定部と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出部と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出部と、
前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出部と、
を有することを特徴とする抽出装置。
【請求項2】
前記操作率算出部は、前記利用者が前記コンテンツに対して行った複数の異なる操作に対してそれぞれ前記操作率を算出し、
前記抽出部は、前記類似度スコアが高い複数の前記利用者の中から、前記操作率算出部で算出した複数の前記操作率のいずれもが高い前記利用者を抽出する請求項1に記載の抽出装置。
【請求項3】
前記抽出部は、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する請求項1または2に記載の抽出装置。
【請求項4】
前記抽出部は、前記操作率が前記操作率に対して設定される閾値以上となる前記利用者を前記操作率が高い前記利用者として抽出する請求項3に記載の抽出装置。
【請求項5】
前記抽出部は、前記操作率の前記閾値を変化させることにより、抽出する複数の前記利用者の前記平均操作率を前記目標操作率に近付ける請求項4に記載の抽出装置。
【請求項6】
前記抽出部は、前記類似度スコアが前記類似度スコアに対して設定される閾値以上の前記利用者の中から前記操作率が高い前記利用者を抽出する請求項3に記載の抽出装置。
【請求項7】
前記抽出部は、前記類似度スコアの前記閾値を変化させることにより、抽出する複数の前記利用者の前記平均操作率を前記目標操作率に近付ける請求項6に記載の抽出装置。
【請求項8】
前記抽出部は、前記類似度スコアと前記操作率との乗算に基づいて算出される値が、前記類似度スコアと前記操作率との乗算に基づいて算出される値に対して設定される下限値以上の前記利用者の中から前記操作率が高い前記利用者を抽出する請求項3に記載の抽出装置。
【請求項9】
抽出装置が実行する抽出方法であって、
利用者の行動履歴を取得する取得工程と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定工程と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出工程と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出工程と、
前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出工程と、
を含むことを特徴とする抽出方法。
【請求項10】
利用者の行動履歴を取得する取得手順と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定手順と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出手順と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出手順と、
前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出手順と、
をコンピュータに実行させるための抽出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、抽出装置、抽出方法及び抽出プログラムに関する。
【背景技術】
【0002】
近年、インターネットを介した情報配信が盛んに行われている。このような情報配信の一例として、配信対象となる広告の類似度や、広告配信先となる利用者の情報等に基づいて、CTR(Click Through Rate)等のクリック率を推定し、推定されたクリック率に応じて、配信対象となる広告を選択する技術が知られている。
【0003】
例えば、配信対象となる広告の構成要素や広告同士の類似度に基づいて、CTRを予測し、予測したCTRを用いて配信対象となる広告を選択する技術が知られている。また、広告を選択した利用者の属性に基づいて、仮想CTRを算出し、広告の配信先となる利用者の属性と算出した仮想CTRとに応じて、配信対象となる広告を選択する技術が知られている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2014-006684号公報
【特許文献2】特開2014-182473号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、広告の配信先となる利用者の属性に基づいて広告の配信を行っても、利用者の中には、クリック率が低い利用者が存在するため、広告の構成要素と利用者の属性とに関連性があったとしても、このような利用者への広告の配信は、クリック率の低下につながり易くなる。つまり、配信された広告に対して選択等の操作を行わない利用者は、広告を配信しても広告に対して操作を行う可能性が低いため、広告に対して操作を行わない利用者に対して広告を配信しても、配信した広告の数に対する広告効果が低くなり易くなる。これらのように、配信された広告等のコンテンツに対してクリック等の操作を行わない利用者は、コンテンツを配信してもコンテンツを選択して視認する等の操作を行う可能性が低いため、コンテンツに対して操作を行わない利用者に対してコンテンツを配信しても、配信をする効果が低くなり易くなる。
【0006】
本願は、上記に鑑みてなされたものであって、コンテンツの配信効果を高めることのできる利用者を抽出することのできる抽出装置、抽出方法及び抽出プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本願に係る抽出装置は、利用者の行動履歴を取得する取得部と、前記利用者に対して配信をするコンテンツの特徴を特定する特定部と、前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出部と、前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出部と、前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出部と、を有することを特徴とする。
【発明の効果】
【0008】
実施形態の一態様によれば、コンテンツの配信効果を高めることのできる利用者を抽出することができる、という効果を奏する。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態に係る情報提供装置が実行する抽出処理の一例を示す図である。
【
図2】
図2は、実施形態に係る情報提供装置の構成例を示す図である。
【
図3】
図3は、利用者のIDリストの模式図である。
【
図4】
図4は、
図3示す利用者のIDリストより高操作率IDを抽出する際の説明図である。
【
図5】
図5は、実施形態に係る情報提供装置が実行する抽出処理の流れの一例を示すフローチャートである。
【
図6】
図6は、広告のクリック率と広告コンバージョン率が高い利用者のIDを抽出する際の説明図である。
【
図7】
図7は、操作率の指標1と指標2が高い利用者のIDを抽出する際の説明図である。
【
図8】
図8は、ハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る抽出装置、抽出方法及び抽出プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。
【0011】
[実施形態]
〔1.情報提供装置が表示する処理について〕
まず、
図1を用いて、抽出装置の一例となる情報提供装置10が実行する抽出処理の一例について説明する。
図1は、実施形態に係る情報提供装置が実行する抽出処理の一例を示す図である。
【0012】
なお、以下の説明では、情報提供装置10が実行する抽出処理として、利用者の行動履歴や広告に関するコンテンツの配信履歴、配信されたコンテンツに対する操作履歴(以下、「ログ」と記載する。)から、利用者の行動履歴とコンテンツの特徴との類似性を算出し、コンテンツを操作する操作率が高い利用者を抽出する処理の一例について記載するが、実施形態は、これに限定されるものではない。情報提供装置10は、ニュースフィードや画像等、任意のコンテンツの配信履歴とコンテンツに対するログから、コンテンツを操作する操作率が高い利用者を抽出してもよい。
【0013】
また、以下の説明において、広告とは、営利若しくは非営利の広告だけではなく、ボランティアの募集、公共広告、公共に対する通知、その他任意のコンテンツを含む概念である。また、広告は、いわゆる広告関連の情報を含むコンテンツのみならず、利用者に興味を抱かせ、任意の対象に関する情報、または、任意の対象と関連するコンテンツ(例えば、ランディングページ等)に含まれる情報を広く報知するものであれば、画像、動画像、テキスト、図形、記号、ハイパーリンク、その他任意のコンテンツがテキストと共に含まれていてよい。
【0014】
〔1-1.情報提供装置の一例〕
情報提供装置10は、インターネット等の所定のネットワークN(例えば、
図2を参照。)を介して、ログサーバ100や配信サーバ200、利用者が使用する端末装置300と通信可能な情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。なお、情報提供装置10は、ネットワークNを介して、任意の数のログサーバ100や配信サーバ200と通信可能であってもよく、例えば、図示を省略した各種の外部サーバと通信可能であってよい。また、
図1では、端末装置300は、1つのみが図示されているが、端末装置300は、ネットワークNを介して多数の端末装置300が通信可能になっている。
【0015】
ログサーバ100は、ログを管理するサーバ装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、ログサーバ100は、利用者が端末装置300によってアクセスしたウェブサイト、利用者が使用する端末装置300に配信されたウェブコンテンツ、利用者が使用する端末装置300に配信された広告のコンテンツ、配信されたコンテンツのうち利用者が端末装置300によって選択したコンテンツ、利用者のデモグラフィック属性やサイコグラフィック属性等、コンテンツの配信に伴う各種のログデータを取得、管理する。なお、ログサーバ100が発揮する機能は、周知のログサーバと同様であるものとして、詳細な説明を省略する。
【0016】
配信サーバ200は、利用者が使用する端末装置300に対してコンテンツの配信を行う情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、配信サーバ200は、ウェブコンテンツにアクセスした利用者の各種属性や行動履歴に基づいて、利用者が選択して操作をする可能性が高いコンテンツを選択し、選択したコンテンツの配信を行う。より具体的な例を挙げると、配信サーバ200は、利用者の行動履歴に基づいて広告のリスティングを行い、リスティングの結果選択される広告の配信を行う。
【0017】
端末装置300は、デスクトップ型のPC(Personal Computer)やノート型のPC、スマートフォンやタブレット等のスマートデバイスであり、ネットワークNを介して任意のサーバ装置と通信を行うことができる装置である。端末装置300は、利用者が入力操作を行う入力装置と、利用者に対して出力を行う出力装置とを有している。出力装置は、利用者に対して情報を表示する表示部になっている。入力装置は、例えば、マウスやキーボードが用いられたり、表示部と一体となったタッチパネルが用いられたりしてもよい。
【0018】
ここで、端末装置300は、利用者の操作によりウェブページなどのウェブコンテンツを表示する場合は、ウェブコンテンツの配信を行うウェブサーバに対してウェブコンテンツの配信要求を送信する。かかる場合、端末装置300は、ウェブコンテンツの配信を受け付けると、ウェブコンテンツ内に配置される広告の配信要求を配信サーバ200に送信する。
【0019】
かかる場合、配信サーバ200は広告画像を端末装置300に配信する。そして、端末装置300は、配信サーバ200から受け付けた広告画像をウェブページ内に配置して表示する。また、端末装置300は、カーソルを広告画像とあわせてクリックしたり、広告画像を利用者がタップしたりした場合等、広告画像を選択する操作が行われた場合は、広告画像と対応するランディングページの表示を行うとともに、かかる広告画像が選択された旨の通知を配信サーバ200に送信する。また、これらのように利用者が端末装置300に対して行った操作は、ログデータとしてログサーバ100で取得する。
【0020】
〔1-2.抽出処理の一例〕
ここで、利用者が選択等の操作をする可能性が高いコンテンツを配信するため、利用者の属性や行動履歴とコンテンツの特徴とを比較し、利用者の行動履歴に対する関連性が高い特徴を有するコンテンツを、当該利用者に対して配信するといった態様が考えられる。しかしながら、利用者の中には、配信されたコンテンツに対してあまり操作を行わない利用者も存在する。このような、コンテンツに対して操作を行わない利用者は、行動履歴に対して関連性の高いコンテンツが配信されたとしても、選択等の操作をコンテンツに対して行わないため、コンテンツの配信効果が低くなり易くなる。そこで、本実施形態に係る情報提供装置10は、以下の抽出処理を実行する。
【0021】
〔1-3.利用者の行動履歴について〕
まず、情報提供装置10は、利用者の行動履歴を取得する。この場合における利用者の行動履歴は、例えば、利用者がネットワーク上で検索を行った際の検索キーワードや、利用者が検索結果に基づいて操作を行った際における遷移先ドメインや、ドメインを遷移した際における遷移元ドメインから遷移先ドメインへの流れ等が挙げられる。これらのように取得する利用者の行動履歴は、利用者ごとに設定される利用者の識別情報であるIDに紐づけられる。
【0022】
〔1-4.コンテンツの特徴の特定について〕
また、情報提供装置10は、利用者に対して配信をするコンテンツの特徴を特定する。コンテンツの特徴は、例えば、コンテンツによって示される商品やサービス、イベント情報の属性等のコンテンツによって示される情報の属性や、コンテンツが利用者に対して興味を催させるものであったり購買を促すものであったりする等のコンテンツ自体の属性等が挙げられる。
【0023】
〔1-5.類似度スコアの算出について〕
また、情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度の度合いを示す類似度スコアを、利用者の行動履歴に基づいて利用者ごとに算出する。類似度スコアは、コンテンツの特徴と利用者の行動履歴との類似度、或いは関連性を、数値化したものになっており、コンテンツの特徴に対する利用者の行動履歴の類似度を、数値の大小に応じて利用者間で比較することができるようにしたものになっている。算出した類似度スコアは、利用者のIDに付与される。また、類似度スコアは、利用者の行動履歴に対して、コンテンツの特徴ごとに算出される。このため、利用者のIDに付与される類似度スコアは、利用者に配信されるコンテンツの特徴ごとに、それぞれのコンテンツの特徴に応じたスコアが付与される。
【0024】
〔1-6.操作率の算出について〕
また、情報提供装置10は、利用者に配信したコンテンツに対して利用者が操作を行った割合を示す操作率を、利用者ごとに算出する。利用者に配信したコンテンツに対する利用者の操作率としては、例えば、配信されたコンテンツを利用者が選択する率であるクリック率、即ち、CTR(Click Through Rate)が挙げられる。コンテンツに対する利用者の操作率としては、他に、配信されたコンテンツに基づいて購買操作を行う率や、飲食店や宿泊施設、イベント等の予約操作を行う率などが挙げられる。利用者に配信したコンテンツに対する利用者の操作率を算出する際には、コンテンツに対して利用者が行った操作の内容ごとに操作率を算出する。算出した操作率は、コンテンツに対して利用者が行った操作の内容ごとの操作率が、利用者のIDに付与される。
【0025】
〔1-7.操作率が高い利用者の抽出について〕
また、情報提供装置10は、類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する。例えば、任意のコンテンツに対する任意の操作の操作率が高い利用者を抽出する際には、利用者のIDに付与される、当該コンテンツの特徴に対する類似スコアが高い複数の利用者の中から、当該任意の操作率が高い利用者を抽出する。これを実現するため、情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度スコアについて、複数の利用者のIDに付与されるコンテンツの特徴ごとの類似度スコアを、スコアの高い順にリスト化する。即ち、IDに付与されている類似度スコアがスコアの高い順となる、複数の利用者のIDのリストを作成する。類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する際には、操作率を抽出するコンテンツの特徴に対応する類似度スコアが高い順に作成したIDのリストより、操作率が高い利用者を抽出する。
【0026】
これにより、複数の利用者に対して広告等のコンテンツを配信する際において、コンテンツに対して興味を示す可能性が高い利用者を抽出することができ、コンテンツを配信した際に利用者がコンテンツを視認したり商品を購入したりする等の、コンテンツの配信効果を高めることができる利用者を抽出することができる。例えば、コンテンツが広告である場合は、コンテンツの配信効果として広告効果を高めることができる。
【0027】
〔1-8.抽出処理の一例について〕
次に、
図1を用いて、情報提供装置10が実行する抽出処理の一例について説明する。まず、情報提供装置10は、ログサーバ100で管理されているログデータより、利用者の行動履歴を取得する(ステップS1)。即ち、情報提供装置10は、利用者が端末装置300を用いてネットワーク上で検索を行った際の検索キーワードや、利用者が検索結果に基づいて端末装置300を操作した際における遷移先ドメインや、ドメインを遷移した際における遷移元ドメインから遷移先ドメインへの流れ等を、利用者の行動履歴としてログサーバ100より取得する。これらのように利用者の行動履歴を取得する情報提供装置10は、ログデータに含まれる多数の利用者の行動履歴をそれぞれ取得する。
【0028】
また、情報提供装置10は、利用者に対して配信をするコンテンツの特徴を特定する(ステップS2)。情報提供装置10は、配信サーバ200から配信される予定のあるコンテンツに含まれる情報の分野や種類等のコンテンツの特徴を、コンテンツに基づいて特定する。利用者に対して配信をするコンテンツが広告である場合は、広告で表示する商品やサービスの分野等の広告の特徴を特定する。
【0029】
利用者の行動履歴を取得し、コンテンツの特徴を特定した情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度スコアを算出してリスト化する(ステップS3)。類似度スコアは、コンテンツの特徴ごとに算出する。また、類似度スコアは利用者ごとに算出し、利用者のIDに付与する。このため、利用者のIDには、コンテンツの特徴ごとにコンテンツの特徴に対する類似度スコアが付与される。類似度スコアのリスト化は、各利用者のIDに付与されるコンテンツの特徴ごとの類似度スコアを、コンテンツの特徴ごとにリストにすることにより行われる。
【0030】
つまり、各利用者のIDには、コンテンツの特徴ごとに複数の類似度スコアが付与されているが、これらの類似度スコアのうち、各利用者のIDにおける同じコンテンツの特徴に対する類似度スコアのリストを、IDと対応させたIDリスト50として作成する。各利用者のIDと類似度スコアとを対応させたIDリスト50は、例えば、類似度スコアが高い順にして作成する。これにより、任意のコンテンツの特徴に対する利用者の行動履歴の類似の相対的な度合いを、IDリスト50上で類似度スコア同士を比較することにより判断することを可能にできる。
【0031】
IDリスト50を作成したら、情報提供装置10は、配信されたコンテンツに対する利用者の操作率を算出する(ステップS4)。情報提供装置10は、利用者の操作率を、ログサーバ100で管理されているログデータに基づいて、コンテンツの特徴ごとに算出する。つまり、IDリスト50は、コンテンツの特徴ごとに作成されているため、利用者の操作率をコンテンツの特徴ごとに算出することより、IDリスト50に示される類似度スコアに対応する特徴を有するコンテンツの操作率を算出する。この場合におけるコンテンツに利用者の操作率としては、例えば、コンテンツが広告である場合、配信された広告を利用者が選択する率であるクリック率、即ち、CTR(Click Through Rate)が挙げられる。配信されたコンテンツに対する利用者の操作率として広告のクリック率を算出する場合は、利用者ごとにクリック率を算出する。このため、IDリスト50に挙げられるIDごとに、当該IDリスト50に対応する特徴を有する広告のクリック率を算出する。
【0032】
コンテンツに対する利用者の操作率を算出したら、情報提供装置10は、操作率が高い利用者を抽出する(ステップS5)。詳しくは、情報提供装置10は、IDリスト50の中から、類似度スコアが高く、且つ、操作率が高い利用者のIDを抽出する。例えば、IDリスト50における類似度スコアと操作率とにそれぞれ閾値が設定され、類似度スコアが類似度スコアに対して設定される閾値以上で、操作率が操作率に対して設定される閾値以上となる利用者を、操作率が高い利用者として抽出する。つまり、IDリスト50における類似度スコアには、閾値としてScore1が設定され、操作率であるクリック率にはCTR1が設定される場合は、類似度スコアがScore1以上で、クリック率がCTR1以上の複数の利用者のIDを、類似度スコアが高く、且つ、クリック率が高い利用者のIDである高操作率ID55として抽出する。
【0033】
高操作率ID55を抽出したら、抽出した利用者のIDのリストを配信サーバ200に提供する(ステップS6)。つまり、高操作率ID55には、類似度スコアが高く、且つ、クリック率が高い、即ち、操作率が高い複数の利用者のIDであるため、情報提供装置10は、抽出した高操作率ID55のリストを配信サーバ200に提供することにより、類似度スコアが高く、且つ、操作率が高い複数の利用者のIDを提供する。
【0034】
高操作率ID55が提供された配信サーバ200は、抽出された利用者に向けてコンテンツを配信する(ステップS7)。つまり、高操作率ID55として抽出された利用者のIDは、コンテンツに対する興味が高く、且つ、クリックして選択を行う等の操作を行う可能性が高いIDになっている。このため、例えば、コンテンツが広告である場合は、高操作率ID55として抽出されたIDを使用する利用者は、広告の内容に対する興味が高く、且つ、広告をクリックして閲覧を行う等の操作を行う可能性が高くなっている。従って、高操作率ID55として抽出されたIDを用いて使用される端末装置300に対して、高操作率ID55が抽出されたIDリスト50の作成に用いられた特徴を有するコンテンツを配信することにより、配信されたコンテンツに対して利用者がクリック等の操作を行う可能性を高めることができる。
【0035】
〔2.情報提供装置の構成〕
以下、上記した情報提供装置10が有する機能構成の一例について説明する。
図2は、実施形態に係る情報提供装置の構成例を示す図である。
図2に示すように、情報提供装置10は、通信部20、記憶部30及び制御部40を有する。
【0036】
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、ログサーバ100や配信サーバ200、端末装置300との間で情報の送受信を行う。
【0037】
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、利用者データベース31及びコンテンツデータベース32を記憶する。
【0038】
利用者データベース31には、利用者に関する各種の情報が登録される。利用者データベース31には、例えば、「利用者ID」、「利用者特徴情報」、「アクセス先」、「アクセス日時」、「配信コンテンツ」、「検索キーワード」等といった情報が登録されている。
【0039】
ここで、「利用者ID」とは、利用者を識別する識別子である。また、「利用者特徴情報」とは、利用者のデモグラフィック属性やサイコグラフィック属性等、コンテンツのリスティングに用いられる各種利用者の特徴である。また、「アクセス先」とは、対応付けられた「利用者ID」が示す利用者がアクセスしたウェブサイト等のアクセス先を示す情報である。また、「アクセス日時」とは、対応付けられた「利用者ID」が示す利用者が対応付けられた「アクセス先」が示すウェブサイト等にアクセスした日時を示す情報である。また、「配信コンテンツ」とは、対応付けられた「利用者ID」が示す利用者が対応付けられた「アクセス先」が示すウェブサイト等にアクセスした際に配信されたコンテンツのコンテンツIDである。また、「検索キーワード」とは、利用者がウェブサイト上で検索を行った際に用いたキーワードである。
【0040】
コンテンツデータベース32には、コンテンツに関する各種の情報が登録される。コンテンツデータベース32には、例えば、「コンテンツID」、「コンテンツの種類」、「コンテンツの内容」、「コンテンツのキーワード」等といった情報が登録されている。
【0041】
ここで、「コンテンツID」とは、コンテンツを識別する識別子である。また、「コンテンツの種類」は、広告やニュース等、コンテンツの種類を示す情報である。また、「コンテンツの内容」は、コンテンツにより表示される内容についての情報であり、例えば、コンテンツが広告の場合は、広告によって表示される商品の種類の情報であり、コンテンツがニュースの場合は、ニュースのジャンルについての情報である。また、「コンテンツのキーワード」は、コンテンツの内容やジャンルを代表するキーワードについての情報である。
【0042】
制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報提供装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
【0043】
制御部40は、取得部41、特定部42、スコア算出部43、操作率算出部44、抽出部45を有する。取得部41は、利用者に関する各種の情報とコンテンツに関する各種の情報とをログサーバ100から取得する。その際に、取得部41は、利用者のIDごとに、利用者の特徴情報やアクセス先、アクセス日時、配信コンテンツ、検索キーワード等を取得し、取得した利用者に関する情報を、利用者のIDに対応付けて利用者データベース31に登録する。これにより、取得部41は、利用者の行動履歴を取得する。つまり、取得部41は、ログサーバ100によって管理されている、利用者が検索を行った際の検索キーワードやアクセス先、アクセス日時、配信コンテンツ等を利用者の行動履歴として取得し、利用者のIDに対応付けて利用者データベース31に登録する。
【0044】
また、取得部41は、コンテンツのIDごとに、コンテンツの種類やコンテンツの内容、コンテンツのキーワード等を取得し、取得したコンテンツに関する情報を、のIDに対応付けてコンテンツデータベース32に登録する。
【0045】
特定部42は、利用者に対して配信をするコンテンツの特徴を特定する。より具体的には、特定部42は、配信サーバ200から配信される予定のあるコンテンツに含まれる情報の分野や種類等のコンテンツの特徴を、コンテンツに基づいて特定する。例えば、特定部42は、コンテンツデータベース32を参照し、コンテンツによって示される商品やサービス、イベント情報の属性等のコンテンツによって示される情報の属性や、コンテンツが利用者に対して興味を催させるものであったり購買を促すものであったりする等のコンテンツ自体の属性等を、コンテンツの特徴として特定する。
【0046】
スコア算出部43は、特定部42で特定したコンテンツの特徴に対する、取得部41で取得した利用者の行動履歴の類似度スコアを、利用者の行動履歴に基づいて利用者ごとに算出する。その際に、スコア算出部43は、コンテンツの特徴ごとに利用者の行動履歴の類似度スコアを算出し、算出した類似度スコアをそれぞれ利用者のIDに付与する。さらに、スコア算出部43は、算出した類似度スコアに基づいて利用者のIDのリストを作成する。
【0047】
図3は、利用者のIDリストの模式図である。利用者のIDリスト50は、各利用者のIDに付与されるコンテンツの特徴ごとの類似度スコアを、コンテンツの特徴ごとにリストにすることにより作成する。コンテンツの特徴ごとに、各利用者のIDと類似度スコアとを対応させたIDリスト50は、類似度スコアが高い順にして作成する。これにより、任意のコンテンツの特徴に対する各利用者の行動履歴の類似の相対的な度合いを、利用者同士の間で比較することができ、例えば、相対的に類似度スコアが高い利用者を抽出することができる。
【0048】
操作率算出部44は、利用者に配信したコンテンツに対する利用者の操作率を、利用者ごとに算出する。例えば、操作率算出部44は、利用者データベース31を参照し、利用者に対して配信されたコンテンツを利用者が選択する率であるクリック率(CTR)や、配信されたコンテンツに基づいて購買操作を行う率や、飲食店や宿泊施設、イベント等の予約操作を行う率を、コンテンツに対する利用者の操作率として算出する。その際に、操作率算出部44は、クリックによってコンテンツを選択する際の操作率や、コンテンツに基づいて商品の購入する際の操作率等をそれぞれ算出することにより、コンテンツに対する操作率を、操作の種類ごとに算出する。また、操作率算出部44は、コンテンツに対する利用者の操作率を、コンテンツの特徴ごとに算出する。算出した操作率は、コンテンツの特徴と、コンテンツに対する操作の種類とを対応づけて利用者にIDに付与し、利用者データベース31に登録する。
【0049】
抽出部45は、類似度スコアが高い複数の利用者の中から、配信されたコンテンツに対する操作率が高い利用者を抽出する。具体的には、抽出部45は、類似度スコアが高い順に作成した利用者のIDリスト50を参照し、IDリスト50の中から、配信されたコンテンツに対する操作率が高い利用者を抽出する。
【0050】
図4は、
図3示す利用者のIDリストより高操作率IDを抽出する際の説明図である。IDリスト50は、コンテンツの特徴ごとに作成されるため、抽出部45は、操作率が高い利用者を抽出しようとしているコンテンツの特徴に対応して作成されたIDリスト50の中から、配信されたコンテンツに対する操作率が高い利用者のIDを抽出する。例えば、コンテンツに対する操作率が、コンテンツであるに広告に対するクリック率(CTR)である場合は、抽出部45は、広告に対する類似度スコアに基づいて作成されたIDリスト50の中から、広告に対するクリック率が高い利用者のIDを抽出する。
【0051】
具体的には、抽出部45は、類似度スコアと操作率とに対してそれぞれ閾値を設定し、類似度スコアが類似度スコアに対して設定される閾値以上で、且つ、操作率が操作率に対して設定される閾値以上となる利用者を、操作率が高い利用者として抽出する。これにより、操作率が高い利用者を抽出する際に、類似度スコアが小さい利用者や、操作率が小さい利用者を抽出することを抑制する。例えば、IDリスト50における類似度スコアには、閾値としてScore1を設定し、操作率であるクリック率には、閾値としてCTR1を設定する。このように、類似度スコアとクリック率とに対して設定される閾値に対して、抽出部45は、利用者のIDに付与されるCTRが、CTR≧CTR1で、IDに付与される類似度スコアが、類似度スコア≧Score1となる複数の利用者のIDを、類似度スコアが高く、且つ、クリック率が高い利用者のIDである高操作率ID55として抽出する。
【0052】
また、抽出部45は、複数の利用者の平均の操作率である平均操作率を、目標となる操作率である目標操作率に近付けることのできる複数の利用者を抽出することも可能になっている。複数の利用者の平均操作率を目標操作率に近付けることのできる複数の利用者を抽出する際には、操作率の閾値を変化させすることにより、抽出する複数の利用者の平均操作率を目標操作率に近付ける。例えば、目標操作率として、目標となるクリック率である目標CTRを設定する場合は、クリック率の閾値であるCTR1を変化させることにより、抽出する複数の利用者の平均操作率である平均CTRを、目標CTRに近付ける。
【0053】
具体的には、IDリスト50に含まれる利用者のIDの件数をNとし、目標CTRをCTRGOALとする場合、下記の式(1)に示すように、N件のIDのそれぞれのCTRの平均である平均CTRを、CTRGOALに近付けるようにCTR1を変化させる。
【0054】
【0055】
さらに、抽出部45は、複数の利用者の平均操作率を、目標操作率に近付ける際には、類似度スコアの閾値も変化させる。つまり、抽出部45は、類似度スコアの閾値であるScore1も変化させることにより、平均CTRをCTRGOALに近付ける。抽出部45は、これらのように、操作率の閾値や類似度スコアの閾値を繰り返し変化させることにより、複数の利用者の平均操作率を目標操作率に近付ける。
【0056】
なお、抽出部45は、コンテンツに対する操作率が高い利用者を抽出する際には、類似度スコアと操作率との乗算に基づいて算出される値が、類似度スコアと操作率との乗算に基づいて算出される値に対して設定される下限値A以上の利用者の中から、操作率が高い利用者を抽出するのが好ましい。
【0057】
つまり、複数の類似度スコアと複数のCTRとの乗算に基づいて算出される複数の値をIDリスト50上に表すと、高操作率ID55におけるCTR1となる部分とScore1となる部分とを結ぶ曲線部56により示される(
図4参照)。このため、コンテンツに対する操作率が高い利用者を抽出する際には、CTRが曲線部56よりも高く、類似度スコアも曲線部56より高いIDを、高操作率ID55として抽出する。このように、曲線部56も用いて高操作率ID55を抽出する際において、類似度スコアと操作率との乗算に基づいて算出される値に対して下限値Aを設定することにより、曲線部56を調節できるため、高操作率ID55に含まれるIDを調節することができる。
【0058】
また、曲線部56も用いて高操作率ID55を抽出する際において、複数の利用者の平均操作率を目標操作率に近付ける場合には、操作率の閾値であるCTR1や、類似度スコアの閾値であるScore1を変化させる他に、類似度スコアと操作率との乗算に基づいて算出される値に対して設定される下限値Aも変化させる。つまり、曲線部56が、類似度スコア×CTRを示すものである場合は、類似度スコアとCTRと下限値Aとの関係は、類似度スコア×CTR≧Aになるため、下限値Aを変化させることにより、抽出される類似度スコアやCTRを変化させることができる。これにより、平均操作率を変化させることができるため、平均操作率を変化させて平均操作率を目標操作率に近付けることができる。
【0059】
〔3.情報提供装置が実行する処理の流れの一例〕
続いて、
図5を用いて、情報提供装置10が実行する抽出処理の流れについて説明する。
図5は、実施形態に係る情報提供装置が実行する抽出処理の流れの一例を示すフローチャートである。
【0060】
例えば、情報提供装置10は、利用者の行動履歴を取得する(ステップS101)。そして、情報提供装置10は、利用者に対して配信をするコンテンツの特徴を特定する(ステップS102)。利用者の行動履歴を取得し、コンテンツの特徴を特定したら、コンテンツの特徴に対する、利用者の行動履歴の類似度スコアを算出する(ステップS103)。類似度スコアを算出したら、情報提供装置10は、類似度スコアが高い順となる利用者のIDリスト50を作成する(ステップST104)。
【0061】
また、情報提供装置10は、配信されたコンテンツに対する利用者の操作率を算出する(ステップS105)。利用者の操作率を算出したら、情報提供装置10は、操作率が高い利用者を抽出する(ステップS106)。つまり、情報提供装置10は、IDリスト50に含まれる複数の利用者の中から、類似度スコアが高く、且つ、操作率が高い複数の利用者のIDである高操作率ID55を抽出する。高操作率ID55を抽出したら、抽出した利用者のIDに向けて、コンテンツを配信する(ステップS107)。これにより、情報提供装置10は、類似度スコアが高く、且つ、コンテンツに対する操作率が高い利用者にコンテンツを配信することができる。
【0062】
〔4.変形例〕
上記では、情報提供装置10による抽出処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報提供装置10が実行する抽出処理のバリエーションについて説明する。
【0063】
〔4-1.コンテンツに対する操作率について〕
上述した例では、情報提供装置10の抽出部45で、コンテンツに対する操作率が高い利用者を抽出する際に、クリック率が高い利用者を抽出していたが、抽出部45では、コンテンツに対する複数の操作率が高い利用者を抽出してもよい。つまり、情報提供装置10の制御部40が有する操作率算出部44は、利用者がコンテンツに対して行った複数の異なる操作に対してそれぞれ操作率を算出し、抽出部45は、類似度スコアが高い複数の利用者の中から、操作率算出部44で算出した複数の操作率のいずれもが高い利用者を抽出してもよい。
【0064】
図6は、広告のクリック率と広告コンバージョン率が高い利用者のIDを抽出する際の説明図である。操作率算出部44は、コンテンツに対する操作率として、例えば、
図6に示すように、広告のクリック率(CTR)の他に、広告のコンバージョン率(CVI)を算出してもよい。この場合、抽出部45は、CTRに対しては閾値として下限CTRを設定し、CVIに対しては閾値として下限CVIを設定し、類似度スコアが類似度スコアに対して設定される閾値である下限類似度スコア以上となる複数の利用者のIDのうち、CTRが下限CTR以上で、CVIが下限CVIとなる利用者のIDを、高操作率ID55として抽出する。
【0065】
また、抽出部45は、利用者の平均CTRが目標CTRに近付くように下限CTRを変化させて調整し、利用者の平均CVIが目標CVIに近付くように下限CVIを変化させて調整する。これにより、平均CTRや平均CVIを、目標CTRや目標CVIに近付けることのできる高操作率ID55を抽出することができる。
【0066】
〔4-2.コンテンツに対する操作率の種類について〕
また、類似度スコアが高い複数の利用者の中から、複数の操作率のいずれもが高い利用者を抽出する際における操作率は、広告のクリック率(CTR)や広告のコンバージョン率(CVI)以外であってもよい。
【0067】
図7は、操作率の指標1と指標2が高い利用者のIDを抽出する際の説明図である。コンテンツに対する操作率は、広告のクリック率(CTR)や広告のコンバージョン率(CVI)の他に、様々な操作に対する操作率が想定されるが、類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する際には、操作率の種類ごとに下限値と目標値を設定するのが好ましい。例えば、操作率が高い利用者を抽出する際における複数の操作率が、
図7に示すように指標1と指標2とである場合は、指標1に対しては指標1の下限値と目標値が設定され、指標2に対しては指標2の下限値と目標値が設定される。この場合、抽出部45は、類似度スコアが類似度スコアに対して設定される下限類似度スコア以上となる複数の利用者のIDのうち、指標1が指標1の下限値で、指標2が指標2の下限値となる利用者のIDを、高操作率ID55として抽出する。
【0068】
また、抽出部45は、指標1の平均値が指標1の目標値に近付くように指標1の下限値を変化させて調整し、指標2の平均値が指標2の目標値に近付くように指標2の下限値を変化させて調整する。これにより、指標1の平均値や指標2の平均値を、指標1の目標値や指標2の目標値に近付けることのできる高操作率ID55を抽出することができる。
【0069】
類似度スコアが高い複数の利用者の中から、複数の操作率のいずれもが高い利用者を抽出する際には、類似度スコアと、複数の操作率の指標とより抽出するため、
図7に示すように、IDリスト50を、複数の操作率の指標の数N+1次元空間で作成することにより、高操作率ID55を抽出することができる。
【0070】
〔4-3.装置構成〕
情報提供装置10は、フロントエンドサーバと、バックエンドサーバとで実現されてもよい。このような場合、フロントエンドサーバには、
図2に示す取得部41、特定部42が配置され、バックエンドサーバには、スコア算出部43、操作率算出部44、抽出部45が配置される。また、記憶部30に登録された各データベース31、32は、外部のストレージサーバに保持されていてもよい。
【0071】
〔4-4.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0072】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0073】
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0074】
〔4-5.プログラム〕
また、上述した実施形態に係る情報提供装置10は、例えば
図8に示すような構成のコンピュータ1000によって実現される。
図8は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0075】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
【0076】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
【0077】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0078】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0079】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0080】
例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。
【0081】
〔5.効果〕
上述したように、情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度の度合いを示す類似度スコアを利用者の行動履歴に基づいて利用者ごとに算出し、利用者に配信したコンテンツに対して利用者が操作を行った割合を示す操作率を利用者ごとに算出する。そして、情報提供装置10は、類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。従って、情報提供装置10で抽出した利用者に向けてコンテンツを配信することにより、コンテンツの特徴に対する行動履歴の類似度スコアが高くても、コンテンツに対する操作を行う可能性が低い利用者に対してコンテンツを配信することを抑制できる。
【0082】
また、情報提供装置10は、利用者がコンテンツに対して行った複数の異なる操作に対してそれぞれ操作率を算出し、類似度スコアが高い複数の利用者の中から、複数の操作率のいずれもが高い利用者を抽出する。このため、コンテンツに対する操作として複数の種類の操作が想定される場合でも、それぞれの操作に対する操作率が高い利用者を抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
【0083】
また、情報提供装置10は、複数の利用者の平均の操作率である平均操作率を、目標となる操作率である目標操作率に近付けることのできる複数の利用者を抽出する。このため、コンテンツに対する操作率が高い操作率が高い利用者を効果的に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
【0084】
また、情報提供装置10は、操作率が操作率に対して設定される閾値以上となる利用者を操作率が高い利用者として抽出するため、コンテンツに対する操作率が高い利用者を適切に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
【0085】
また、情報提供装置10は、操作率の閾値を変化させることにより、抽出する複数の利用者の平均操作率を目標操作率に近付ける。このため、コンテンツに対する操作率が高い操作率が高い利用者を効果的に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
【0086】
また、情報提供装置10は、類似度スコアが類似度スコアに対して設定される閾値以上の利用者の中から操作率が高い利用者を抽出する。このため、コンテンツの特徴に対する類似度スコアが高く、コンテンツに対する操作率が高い利用者を適切に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
【0087】
また、情報提供装置10は、類似度スコアの閾値を変化させることにより、抽出する複数の利用者の平均操作率を目標操作率に近付ける。このため、コンテンツの特徴に対する類似度スコアが高く、コンテンツに対する操作率が高い操作率が高い利用者を効果的に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
【0088】
また、情報提供装置10は、類似度スコアと操作率との乗算に基づいて算出される値が、類似度スコアと操作率との乗算に基づいて算出される値に対して設定される下限値以上の利用者の中から操作率が高い利用者を抽出する。このため、コンテンツの特徴に対する類似度スコアが高く、コンテンツに対する操作率が高い操作率が高い利用者を適切に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
【0089】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0090】
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、提供部は、提供手段や提供回路に読み替えることができる。
【符号の説明】
【0091】
10 情報提供装置
20 通信部
30 記憶部
31 利用者データベース
32 コンテンツデータベース
40 制御部
41 取得部
42 特定部
43 スコア算出部
44 操作率算出部
45 抽出部
50 IDリスト
55 高操作率ID
56 曲線部
100 ログサーバ
200 配信サーバ
300 端末装置
【手続補正書】
【提出日】2023-03-06
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
利用者の行動履歴を取得する取得部と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定部と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出部と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出部と、
前記類似度スコアが高い複数の前記利用者の中から、前記操作率が前記操作率に対して設定される閾値以上となる前記利用者を前記操作率が高い前記利用者として、前記操作率の前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出部と、
を有することを特徴とする抽出装置。
【請求項2】
利用者の行動履歴を取得する取得部と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定部と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出部と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出部と、
前記類似度スコアが高い複数の前記利用者の中から、前記類似度スコアが前記類似度スコアに対して設定される閾値以上の前記利用者の中から前記操作率が高い前記利用者として、前記類似度スコアの前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出部と、
を有することを特徴とする抽出装置。
【請求項3】
前記操作率算出部は、前記利用者が前記コンテンツに対して行った複数の異なる操作に対してそれぞれ前記操作率を算出し、
前記抽出部は、前記類似度スコアが高い複数の前記利用者の中から、前記操作率算出部で算出した複数の前記操作率のいずれもが高い前記利用者を抽出する請求項1または2に記載の抽出装置。
【請求項4】
前記抽出部は、前記類似度スコアと前記操作率との乗算に基づいて算出される値が、前記類似度スコアと前記操作率との乗算に基づいて算出される値に対して設定される下限値以上の前記利用者の中から前記操作率が高い前記利用者を抽出する請求項3に記載の抽出装置。
【請求項5】
抽出装置が実行する抽出方法であって、
利用者の行動履歴を取得する取得工程と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定工程と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出工程と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出工程と、
前記類似度スコアが高い複数の前記利用者の中から、前記操作率が前記操作率に対して設定される閾値以上となる前記利用者を前記操作率が高い前記利用者として、前記操作率の前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出工程と、
を含むことを特徴とする抽出方法。
【請求項6】
利用者の行動履歴を取得する取得手順と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定手順と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出手順と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出手順と、
前記類似度スコアが高い複数の前記利用者の中から、前記操作率が前記操作率に対して設定される閾値以上となる前記利用者を前記操作率が高い前記利用者として、前記操作率の前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出手順と、
をコンピュータに実行させるための抽出プログラム。
【請求項7】
抽出装置が実行する抽出方法であって、
利用者の行動履歴を取得する取得工程と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定工程と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出工程と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出工程と、
前記類似度スコアが高い複数の前記利用者の中から、前記類似度スコアが前記類似度スコアに対して設定される閾値以上の前記利用者の中から前記操作率が高い前記利用者として、前記類似度スコアの前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出甲千絵と、
を含むことを特徴とする抽出方法。
【請求項8】
利用者の行動履歴を取得する取得手順と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定手順と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出手順と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出手順と、
前記類似度スコアが高い複数の前記利用者の中から、前記類似度スコアが前記類似度スコアに対して設定される閾値以上の前記利用者の中から前記操作率が高い前記利用者として、前記類似度スコアの前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出手順と、
をコンピュータに実行させるための抽出プログラム。
【手続補正書】
【提出日】2023-06-23
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
利用者の行動履歴を取得する取得部と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定部と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出部と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出部と、
前記類似度スコアが高い複数の前記利用者の中から、前記操作率が前記操作率に対して設定される閾値以上となる前記利用者を前記操作率が高い前記利用者として、前記操作率の前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出部と、
を有することを特徴とする抽出装置。
【請求項2】
利用者の行動履歴を取得する取得部と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定部と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出部と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出部と、
前記類似度スコアが高い複数の前記利用者の中から、前記類似度スコアが前記類似度スコアに対して設定される閾値以上の前記利用者の中から前記操作率が高い前記利用者として、前記類似度スコアの前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出部と、
を有することを特徴とする抽出装置。
【請求項3】
前記操作率算出部は、前記利用者が前記コンテンツに対して行った複数の異なる操作に対してそれぞれ前記操作率を算出し、
前記抽出部は、前記類似度スコアが高い複数の前記利用者の中から、前記操作率算出部で算出した複数の前記操作率のいずれもが高い前記利用者を抽出する請求項1または2に記載の抽出装置。
【請求項4】
前記抽出部は、前記類似度スコアと前記操作率との乗算に基づいて算出される値が、前記類似度スコアと前記操作率との乗算に基づいて算出される値に対して設定される下限値以上の前記利用者の中から前記操作率が高い前記利用者を抽出する請求項3に記載の抽出装置。
【請求項5】
抽出装置が実行する抽出方法であって、
利用者の行動履歴を取得する取得工程と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定工程と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出工程と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出工程と、
前記類似度スコアが高い複数の前記利用者の中から、前記操作率が前記操作率に対して設定される閾値以上となる前記利用者を前記操作率が高い前記利用者として、前記操作率の前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出工程と、
を含むことを特徴とする抽出方法。
【請求項6】
利用者の行動履歴を取得する取得手順と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定手順と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出手順と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出手順と、
前記類似度スコアが高い複数の前記利用者の中から、前記操作率が前記操作率に対して設定される閾値以上となる前記利用者を前記操作率が高い前記利用者として、前記操作率の前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出手順と、
をコンピュータに実行させるための抽出プログラム。
【請求項7】
抽出装置が実行する抽出方法であって、
利用者の行動履歴を取得する取得工程と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定工程と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出工程と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出工程と、
前記類似度スコアが高い複数の前記利用者の中から、前記類似度スコアが前記類似度スコアに対して設定される閾値以上の前記利用者の中から前記操作率が高い前記利用者として、前記類似度スコアの前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出工程と、
を含むことを特徴とする抽出方法。
【請求項8】
利用者の行動履歴を取得する取得手順と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定手順と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出手順と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出手順と、
前記類似度スコアが高い複数の前記利用者の中から、前記類似度スコアが前記類似度スコアに対して設定される閾値以上の前記利用者の中から前記操作率が高い前記利用者として、前記類似度スコアの前記閾値を変化させることにより、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する抽出手順と、
をコンピュータに実行させるための抽出プログラム。