(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-22
(45)【発行日】2023-03-30
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
G06Q 30/0251 20230101AFI20230323BHJP
【FI】
G06Q30/0251
(21)【出願番号】P 2021068563
(22)【出願日】2021-04-14
【審査請求日】2021-06-18
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110000637
【氏名又は名称】弁理士法人樹之下知的財産事務所
(72)【発明者】
【氏名】吉井 和輝
(72)【発明者】
【氏名】武田 悠佑
(72)【発明者】
【氏名】藤野 拓海
(72)【発明者】
【氏名】山田 寛
【審査官】加内 慎也
(56)【参考文献】
【文献】特開2015-230717(JP,A)
【文献】特開2020-087480(JP,A)
【文献】米国特許出願公開第2016/0328481(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
ユーザの行動の種別である行動種別と、当該行動の対象のタイトルと、当該行動が実施された時点とを含む行動履歴情報を取得する行動履歴取得部と、
時系列に沿った複数の前記行動履歴情報を
、入力される1つの行動履歴情報に対する教師データとして用い、
時系列に沿った一連の前記行動履歴情報の関連性を機械学習し、前記行動履歴情報が入力されることで、
入力された前記行動履歴情報
及び当該行動履歴情報に関連する複数の前記行動履歴情報のそれぞれに対応した前記対象を示す推奨情報を出力するモデルを生成するモデル生成部と、
を備える情報処理装置。
【請求項2】
前記対象を階層構造のジャンルに分類した際の各階層のジャンルを記憶するジャンル記憶部を備え、
前記モデル生成部は、各前記行動履歴情報の前記行動種別、前記タイトル、及び前記対象に対応した前記ジャンルを連結したテキスト情報を前記教師データとして生成する
請求項1に記載の情報処理装置。
【請求項3】
ユーザの行動の種別である行動種別と、当該行動の対象のタイトルとを含む行動履歴情報を取得する行動履歴取得部と、
前記対象を階層構造のジャンルに分類した際の各階層のジャンルを記憶するジャンル記憶部と、
時系列に沿った複数の前記行動履歴情報と各前記行動履歴情報の前記対象に対応した前記ジャンルとに基づいて生成された、前記行動種別、前記タイトル、及び前記対象に対応した前記ジャンルを連結したテキスト情報を
、入力される1つの行動履歴情報に対する教師データとし
て用い、
時系列に沿った一連の前記行動履歴情報の関連性を機械学習し、前記行動履歴情報が入力されることで、
入力された前記行動履歴情報
及び当該行動履歴情報に関連する複数の前記行動履歴情報のそれぞれに対応した前記対象を示す推奨情報を出力するモデルを生成するモデル生成部と、
を備える情報処理装置。
【請求項4】
前記モデルから出力された前記推奨情報に基づいて、前記ユーザにレコメンド情報を配信する配信部を備える、
請求項1から請求項3のいずれか1項に記載の情報処理装置。
【請求項5】
コンピュータによりモデルを生成する情報処理方法であって、
前記コンピュータは、行動履歴取得部、及びモデル生成部を備え、
前記行動履歴取得部が、ユーザの行動の種別である行動種別と、当該行動の対象のタイトルと、当該行動が実施された時点とを含む行動履歴情報を取得する行動履歴取得ステップと、
前記モデル生成部が、時系列に沿った複数の前記行動履歴情報を
、入力される1つの行動履歴情報に対する教師データとし
て用い、
時系列に沿った一連の前記行動履歴情報の関連性を機械学習し、前記行動履歴情報が入力されることで、
入力された前記行動履歴情報
及び当該行動履歴情報に関連する複数の前記行動履歴情報のそれぞれに対応した前記対象を示す推奨情報を出力する前記モデルを生成するモデル生成ステップと、
を実施する情報処理方法。
【請求項6】
コンピュータによりモデルを生成する情報処理方法であって、
前記コンピュータは、行動履歴取得部、モデル生成部、及びジャンル記憶部を備え、
前記ジャンル記憶部は、ユーザの行動の対象を階層構造のジャンルに分類した際の各階層のジャンルを記憶し、
前記行動履歴取得部が、前記ユーザの前記行動の種別である行動種別と、当該行動の前記対象のタイトルとを含む行動履歴情報を取得する行動履歴取得ステップと、
前記モデル生成部が、
時系列に沿った複数の前記行動履歴情報と各前記行動履歴情報の前記対象に対応した前記ジャンルとに基づいて生成された、前記行動種別、前記タイトル、及び前記対象に対応した前記ジャンルを連結したテキスト情報を
、入力される1つの行動履歴情報に対する教師データとし
て用い、
時系列に沿った一連の前記行動履歴情報の関連性を機械学習し、前記行動履歴情報が入力されることで、
入力された前記行動履歴情報
及び当該行動履歴情報に関連する複数の前記行動履歴情報のそれぞれに対応した前記対象を示す推奨情報を出力する前記モデルを生成するモデル生成ステップと、
を実施する情報処理方法。
【請求項7】
コンピュータに読み取り実行可能な情報処理プログラムであって、
前記コンピュータを請求項1から請求項4のいずれか1項に記載の情報処理装置として機能させる、情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザに対する情報のレコメンド等に応用可能なモデルを生成する情報処理装置、情報処理方法、及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、ユーザに対して情報をレコメンドするシステムが知られている(例えば、特許文献1参照)。このシステムでは、ユーザが所有する携帯端末からユーザの行動履歴情報を取得し、将来におけるレコメンド情報の有用度を、分類モデルを用いて算出し、有用度が高いレコメンド情報をユーザに配信する。また、レコメンド情報に対するユーザの反応を反応履歴情報として取得する。
そして、このシステムでは、所定時刻前の行動履歴情報と、所定時刻後の反応履歴情報とを用いて、分類モデルを生成する。モデルの生成では、教師データを構成する行動履歴情報が示すユーザの行動を示す特徴量ベクトルを生成し、反応履歴情報がレコメンド情報に対応する行動を含む場合を正例、反応履歴情報がレコメンド情報に対応しない場合に負例として機械学習を行う。すなわち、この分類モデルは、ユーザの各々の行動に対応した特徴ベクトルを入力として、レコメンド情報に対応する行動が行われた確率を有用度として出力する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載のようなシステムで用いられる従来の分類モデルは、ユーザの個々の行動情報を教師データとしてモデルを生成する。この場合、各行動情報の特徴ベクトルにより、それぞれの行動の類似度を算出することはできるが、その行動情報のみに基づいた情報となる。例えば、オンラインショッピングを利用するユーザが、商品Aのコンテンツを閲覧(第1行動)、商品Bのコンテンツを閲覧(第2行動)との順で行動を行った場合、各々の行動に対するベクトルを算出することで、商品Aに対する特徴ベクトル、商品Bに対する特徴ベクトルを算出できる。しかし、商品Aを見た後に商品Bを見た、といった一連の流れが考慮されない。つまり、ユーザの行動履歴が入力されることで、第1行動に対して商品Aに類似する商品、第2行動に対して商品Bに類似する商品を、モデルから出力される各商品の有用度(スコア)に基づいて判定することができる。しかしながら、第1行動に対して、商品Bやその類似する商品をレコメンドすることはできない。このような実情に鑑み、ユーザの行動に対応してより広い範囲の情報を出力可能なモデルが求められている。
【0005】
本発明は、ユーザの行動に対して広い範囲の情報を出力可能なモデルを生成する情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の情報処理装置は、ユーザの行動の種別である行動種別と、当該行動の対象のタイトルと、当該行動が実施された時点とを含む行動履歴情報を取得する行動履歴取得部と、時系列に沿った複数の前記行動履歴情報を教師データとして用い、前記行動履歴情報が入力されることで、前記行動履歴情報に対応した前記対象を示す推奨情報を出力するモデルを生成するモデル生成部と、を備える。
【発明の効果】
【0007】
本発明では、時系列に沿った複数の行動履歴情報を教師データとしてモデルを生成する。よって、連続するユーザの行動履歴の遷移を考慮した機械学習が可能となる。このような機械学習によって生成されたモデルでは、ユーザの行動に対する推奨対象の範囲をより広げることができる。つまり、ユーザの1つの行動履歴のみでは、推奨対象とされなかった対象でも、前後の行動履歴を学習することで、推奨対象となる可能性が高くなり、ユーザに対して、より広い範囲で推奨対象をレコメンドできる。
【図面の簡単な説明】
【0008】
【
図1】本発明に係る一実施形態の情報処理システムの概略構成を示す概略図。
【
図2】本実施形態の情報処理装置の概略構成を示すブロック図。
【
図3】本実施形態の情報処理方法に係る目標値の設定処理を示すフローチャート。
【
図4】本実施形態の情報処理方法に係るレコメンド情報の配信処理を示すフローチャート。
【発明を実施するための形態】
【0009】
以下、本発明に係る一実施形態について図面に基づいて説明する。
[1.情報処理システムの全体構成]
図1は、本実施形態の情報処理システムの概略構成を示す概略図である。
図1に示すように、本実施形態の情報処理システム1は、情報処理装置であるサーバ装置10と、ユーザ端末20とが、インターネット等のネットワークを介して通信可能に接続されている。
この情報処理システム1では、例えば、ユーザ端末20で、所定のコンテンツ等を表示させた際に、サーバ装置10からユーザ端末20に、お勧め商品等を紹介するレコメンド情報を配信してコンテンツ内に表示させる。なお、コンテンツは、所定のアプリケーションを実行した際にディスプレイに表示される情報であり、例えば、ブラウザ上で閲覧可能なウェブページや、メールソフト等で閲覧可能なメッセージ、ゲーム等の所定のアプリケーションを実行した際に表示される画像等を含む。
【0010】
[2.サーバ装置10の構成]
図2は、サーバ装置10の概略構成を示すブロック図である。
サーバ装置10は、コンピュータにより構成され、本発明の情報処理装置として機能する。このサーバ装置10は、通信部11と、記憶部12と、制御部13と、等を含んで構成されている。なお、サーバ装置10を構成するコンピュータの数は特に限定されない。例えば、1台のコンピュータによってサーバ装置10が構成されてもよく、複数のコンピュータをネットワークで接続して構築されるクラウドサーバをサーバ装置10としてもよい。
通信部11は、例えばLAN等を介してネットワーク(インターネット)に接続されており、ユーザ端末20等と通信する。
【0011】
[2-1.記憶部12の構成]
記憶部12は、例えばメモリ、ハードディスク等により構成されたデータ記録装置である。この記憶部12は、ユーザ情報記憶部121、レコメンド対象記憶部122、ジャンル記憶部123等を備えている。また、記憶部12には、サーバ装置10を制御するための情報処理プログラム(ソフトウェア)が記録されている。なお、ここでは、サーバ装置10の記憶部12に、ユーザ情報記憶部121、レコメンド対象記憶部122、及びジャンル記憶部123が設けられる例を示すが、サーバ装置10とネットワークを介して通信可能に接続された他のデータサーバやクラウドストレージに、これらの各種データベースが設けられる構成としてもよい。
【0012】
[2-1―1.ユーザ情報記憶部121に記憶される情報]
ユーザ情報記憶部121は、本システムを利用するユーザに関する各種情報を記録したデータベースであり、個々のユーザ毎のユーザ情報が記憶されている。
このユーザ情報には、例えば、ユーザID、ユーザ名、及びユーザ属性等のユーザ自身の情報の他、ユーザの行動履歴情報が含まれる。
【0013】
ユーザIDは、ユーザを識別するための識別情報である。ユーザ名は、ユーザIDで特定されるユーザのアカウント名である。ユーザ属性は、ユーザIDで特定されるユーザに関する各種情報であり、例えば、ユーザの性別、年齢、居所、職業、年収、趣味等の様々なユーザに関する情報が記録される。
【0014】
ユーザの行動履歴情報としては、インターネット上の各種オンライン行動の他、各オフライン行動の履歴を含めてもよい。オンライン行動としては、例えば、オンラインショッピングにおける行動、検索処理に係る行動、ニュース等の所定のコンテンツにおける閲覧行動、SNS(ソーシャルネットワーキングサービス)におけるフォロー、ニュースコンテンツにおける記事の閲覧等が挙げられる。
また、オフライン行動としては、例えば、ユーザ端末20で計測されるユーザの移動履歴(位置履歴)、ユーザ端末の操作履歴、店舗等で行った電子決済による決済履歴等が挙げられる。
本実施形態では、一例として、オンラインショッピングにおける行動による行動履歴情報を挙げる。また、オンラインショッピングにおける行動として、本実施形態では、ユーザが商品を閲覧した場合の閲覧履歴、商品をウォッチリストやお気に入り等のショートカット登録を行った場合の登録履歴、商品を購入した旨の購入履歴を例示する。これらの行動履歴には、それぞれ、行動の種別(閲覧、登録、購入等)、行動の対象のタイトル(商品名)、行動が実施された時点(タイムスタンプ)が含まれる。
【0015】
[2-1―2.レコメンド対象記憶部122に記憶される情報]
レコメンド対象記憶部122は、ユーザ端末20に送信するレコメンド情報に含ませる対象の広告情報が記録される。広告情報には、例えば広告ID、対象のタイトル、対象ジャンル、対象詳細情報等が含まれる。
広告IDは、広告情報を識別する識別情報である。
対象のタイトルは、広告対象(対象)の名称である。
対象ジャンルは、広告対象を階層構造のジャンルに分類した際の各階層のジャンル名を記憶する。ここでの階層構造とは、複数の第一カテゴリ、各第一カテゴリの下位として従属する第二カテゴリ、第二カテゴリの下位として従属する第三カテゴリ等のように、複数の階層カテゴリをツリー状に分類した構造である。例えば、広告対象が「〇〇車純正バンパー」である場合、第一カテゴリが「自動車」、第二カテゴリが「パーツ」、第三カテゴリが「バンパー」、とのカテゴリが記録される。
対象詳細情報は、広告対象の詳細な各種情報であり、例えば、対象商品の価格、対象商品の出品者の連絡先、支払い方法、対象商品の画像、対象商品や出品者に対する評価等が含まれてもよい。
【0016】
なお、広告情報は、商品を出品(販売)する出品者が登録する情報であるが、上記の全ての情報が出品者により登録されていなくてもよく、少なくとも対象のタイトルが含まれていればよい。例えば、対象ジャンルについて、サーバ装置10が、対象のタイトルに対応するジャンルをジャンル記憶部123から読み取り広告情報に登録してもよい。
【0017】
[2-1―3.ジャンル記憶部123に記憶される情報]
ジャンル記憶部123には、上述した対象に対応するジャンルが記録されている。
具体的には、ジャンル記憶部123には、上述したような階層構造のジャンルが記録されており、最下層のカテゴリに対して、対応する広告対象が関連付けられている。例えば、最下層のカテゴリに対して、広告対象のタイトルが関連付けられて記憶されていてもよく、広告対象の商品コード(製造コード)等が関連付けられて記憶されていてもよい。
【0018】
[2-2.制御部13の機能構成]
制御部13は、CPU(Central Processing Unit)等の演算回路、RAM(Random Access Memory)等の記録回路により構成される。制御部13は、記憶部12等に記録されている情報処理プログラムをRAMに展開し、RAMに展開されたプログラムとの協働により各種処理を実行する。そして、制御部13は、記憶部12に記録された情報処理プログラムを読み込み実行することで、
図2に示すように、ユーザ情報登録部131、行動履歴取得部132、モデル生成部133、及びレコメンド配信部134等として機能する。
【0019】
ユーザ情報登録部131は、インターネットを介してユーザ端末20からユーザに関する登録情報を取得し、ユーザ情報記憶部121のユーザ情報の更新、または、ユーザ情報の新規登録を実施する。
行動履歴取得部132は、ユーザ端末20からユーザの行動履歴情報を取得し、取得したユーザ情報記憶部121の対応するユーザ情報の行動情報として登録する。
【0020】
モデル生成部133は、取得したユーザの行動履歴情報に基づいて、ユーザの行動に対してレコメンドする推奨対象(広告対象)を出力するモデルを生成する。
当該モデルは、入力されたユーザの行動履歴情報の特徴ベクトルに対して、類似するベクトルの推奨対象を出力する。出力される推奨対象は、特徴ベクトルが類似する所定数の広告対象であってもよく、類似度が所定割合以上となる全ての推奨対象であってもよい。
【0021】
このモデル生成部133は、第一生成部133A、及び第二生成部133Bを含む。
第一生成部133Aは、ユーザ情報の行動情報、及びジャンル記憶部123のジャンル情報に基づいて、モデルを生成するための教師データを生成する。
本実施形態では、第一生成部133Aは、行動履歴情報のタイムスタンプに基づき、時系列に沿って複数の行動履歴情報をソートし、かつ、行動の対象に関して、そのジャンルを付与した教師データを生成する。なお、第一生成部133Aにより生成される教師データに関する詳細な説明は後述する。
【0022】
第二生成部133Bは、第一生成部133Aにより生成された教師データを用いて、モデルを生成する。つまり、時系列に沿った複数の行動履歴を有し、かつ、各行動の対象に対してジャンルが関連付けられた教師データを特徴ベクトルに変換して機械学習を行うことで、行動履歴情報を入力とし、レコメンドする推奨対象を示す推奨情報を出力するモデルを生成する。
【0023】
レコメンド配信部134は、モデルから出力された推奨対象の広告情報をレコメンド情報としてユーザ端末20に送信する。
【0024】
[3.ユーザ端末20の構成]
ユーザ端末20は、ユーザが保有する端末装置であり、例えばスマートフォン、タブレット端末、パーソナルコンピュータ等のコンピュータにより構成されている。ユーザ端末20の具体的な構成の図示は省略するが、ユーザ端末20は、一般的なコンピュータが有する基本的な構成を有する。すなわち、ユーザ端末20は、ユーザの操作を受け付ける入力操作部、画像情報を表示させるディスプレイ、各種情報を記録する記録装置、各種情報を演算処理する演算回路(CPU等)を備えている。
【0025】
[4.情報処理方法]
次に、サーバ装置10における情報処理方法について説明する。
[4-1.モデルの生成]
図3は、本実施形態の情報処理方法に係るモデルの生成処理を示すフローチャートである。
本実施形態では、ユーザがユーザ端末20からサーバ装置10にアクセスし、情報処理システム1を利用する旨のユーザ登録処理、またはユーザ情報を更新する旨の登録更新処理を行うことで、ユーザ端末20からサーバ装置10にユーザ登録情報が送信される。サーバ装置10のユーザ情報登録部131は、ユーザ端末20から送信されるユーザ登録情報を取得すると、ユーザ情報をユーザ情報記憶部121に新規登録、または既存ユーザ情報の更新を行う(ステップS1)。
【0026】
また、ユーザ登録を行ったユーザがユーザ端末20を操作して所定の動作を行うことで、行動履歴情報が、ユーザIDとともにサーバ装置10に送信される。サーバ装置10の行動履歴取得部132は、ユーザ端末20から取得した行動履歴情報を、対応するユーザ情報に記憶して蓄積する(ステップS2:行動履歴取得ステップ)。
【0027】
次に、モデル生成部133は、蓄積した行動履歴情報に基づいてモデルを生成する。モデルの生成は、例えば、サーバ装置10の管理者により指定されたタイミングであってもよく、1か月毎等の所定期間間隔で実施されてもよい。また、モデルの劣化を判定し、劣化していると判定された場合にモデルが新たに生成されてもよい。
【0028】
モデル生成部133は、まず、第一生成部133Aにより、モデルを生成するための教師データを生成するための行動履歴情報を抽出する(ステップS3)。
ここで、第一生成部133Aは、ユーザ情報記憶部121に記憶されたユーザ情報から、ランダムに複数のユーザ情報を抽出し、その行動履歴情報を読み取ってもよく、全てのユーザ情報の行動履歴情報を読み取ってもよい。また、ユーザ情報のユーザ属性に基づいて、ユーザ情報を複数のクラスタにクラスタリングし、各クラスタから所定数のユーザ情報をランダムに抽出し、その行動履歴情報を読み取ってもよい。また、各ユーザ情報から取得する行動履歴情報としては、例えば、直近1か月等の一定期間の行動履歴であってもよく、全ての行動履歴情報であってもよい。
【0029】
抽出した行動履歴情報には、上述したように、タイムスタンプが付されているため、ユーザ毎の時系列に沿った行動を把握することができる。そして、第一生成部133Aは、ユーザ毎の時系列に沿った行動履歴情報を教師データとして生成する。この際、第一生成部133Aは、行動履歴情報の行動種別、及び対象のタイトルに、行動の対象のカテゴリを付加し、ユーザ毎の複数の行動履歴情報を時系列に沿って並べた教師データを生成する(ステップS4)。
具体的には、第一生成部133Aは、行動履歴情報に記録される行動の対象に対応するジャンルを、ジャンル記憶部123から検索する。そして、第一生成部133Aは、各行動履歴情報に関し、行動履歴情報の行動の種別と、行動の対象のタイトルと、対象に対応するジャンルとを、テキスト情報として所定の順番で連結する。
例えば、「TitleA」の商品Aを「閲覧(view)」した行動履歴情報と、「TitleB」の商品Bを「ウォッチリストに登録(watchlist)」した行動履歴情報とが連続し、商品Aに対して、第一カテゴリ「categoryα1」、第二カテゴリ「categoryβ1」が検索され、商品Bに対して、第一カテゴリ「categoryα2」、第二カテゴリ「categoryβ2」が検索されたとする。この場合、商品Aを閲覧した行動履歴情報に対して、例えば、「view_TitleA_categoryα1_categoryβ1」とのテキスト情報が生成される。また、商品Bをウォッチリストに登録した行動履歴情報に対して、例えば、「watchlist_TitleB_categoryα2_categoryβ2」とのテキスト情報が生成される。
そして、第一生成部133Aは、上記のように生成したテキスト情報をユーザ毎に時系列に沿って並べた教師データを生成する。本実施形態では、上述のように、行動種別とタイトルとジャンルとが連結したテキスト情報が、ユーザ毎に時系列に沿って並び、異なるユーザのデータ間には、間に区切り情報が挿入される。よって、ユーザU1が、10時00分に第1行動を行い、ユーザU2が10時01分に第2行動を行い、ユーザU1が10時02分に第3行動を行った場合でも、ユーザU1の第1行動及び第3行動の行動履歴情報に基づくテキスト情報の間に、ユーザU2の第2行動の行動履歴情報に基づくテキスト情報が入ることがない。このため、各ユーザの一連の動作の遷移を正しく学習させることが可能となる。
なお、上記のテキスト情報では、行動の種別、行動の対象、第一カテゴリ、第二カテゴリの順で連結した例を示すが、これらの順番は特に限定されない。
【0030】
この後、第二生成部133Bは、ステップS4で生成した教師データを用いて、モデルを生成する(ステップS5)。具体的には、第二生成部133Bは、例えば、fastText等の手法を用いて、ステップS4で生成された教師データを機械学習させることで、行動履歴情報に対する特徴ベクトルを算出するモデルを生成する。このモデルは、行動履歴情報を入力することで、その行動履歴情報の特徴ベクトルを算出し、かつ、当該行動履歴情報に対して近い特徴ベクトルの推奨対象(ユーザに推奨すべき商品等)を示す推奨情報を出力する。ステップS4及びステップS5は本発明のモデル生成ステップに相当する。
【0031】
上述したように、本実施形態では、モデルを生成するための教師データは、時系列に沿った行動履歴情報と、対象のカテゴリを含む。したがって、前後の行動により選択された対象同士の特徴ベクトルを近づけることができ、かつ、カテゴリが共通する対象同士の特徴ベクトルも近づけることができる。
例えば、商品Aを閲覧した行動履歴情報の後に、商品Bをウォッチリストに登録した行動履歴情報が得られる場合について説明する。従来のように、1つの行動履歴情報のみを入力データとすると、閲覧された商品Aと、ウォッチリスト登録された商品Bとの特徴ベクトルを近づけることができず、商品Aの特徴ベクトルと、商品Bの特徴ベクトルは、それぞれ独立した特徴ベクトルとなる。また、商品Aや商品Bのカテゴリが指定されていないため、商品Aや商品Bと類似する推奨対象を選択する範囲が限られ、例えば商品Aや商品Bのタイトル名の一部が入る商品、タイトル名が類似する商品等に限られる。
これに対して、本実施形態では、上記のように、閲覧された商品Aと、ウォッチリスト登録された商品Bとの特徴ベクトルが近くなるように、特徴ベクトルが算出される。このため、商品Aを閲覧したユーザに対して、商品Aと類似する商品のみならず、商品Bや商品Bと類似する商品を推奨対象として選択することが可能となる。また、商品Aや商品Bのカテゴリが含まれることで、商品Aや商品Bと同一のジャンル内の他の商品を推奨対象として選択できる。つまり、商品Aや商品Bと、全く異なるタイトル名の商品であっても、同一ジャンルである場合は、その商品を推奨対象とすることができる。
【0032】
[4-2.レコメンド情報の配信処理]
次に、レコメンド情報の配信処理について説明する。
図4は、レコメンド情報の配信処理を示すフローチャートである。
ユーザ端末20は、ユーザの操作により、所定の行動履歴情報が得られると、その行動履歴情報をサーバ装置10に送信する。
これにより、サーバ装置10の行動履歴取得部132は、ステップS2と同様、ユーザ端末20から行動履歴情報を取得する(ステップS11)。
そして、レコメンド配信部134は、得られた行動履歴情報をステップS5で生成されたモデルに入力し、モデルから主力される行動履歴情報に対応した推奨対象を示す推奨情報を取得する(ステップS12)。
この後、レコメンド配信部134は、取得した推奨情報に対応する広告情報を含むレコメンド情報を生成し、ユーザ端末20に送信する(ステップS13)。これにより、レコメンド情報を受信したユーザ端末20は、ディスプレイ上に、所定のソート条件で並ぶ広告情報をレコメンド情報として表示することが可能となる。
【0033】
[5.本実施形態の作用効果]
本実施形態では、サーバ装置10は、記憶部12と制御部13とを備え、制御部13は、記憶部12に記憶される情報処理プログラムを読み込み実行することで、行動履歴取得部132、及びモデル生成部133として機能する。行動履歴取得部132は、ユーザの行動の種別である行動種別と、当該行動の対象のタイトルと、当該行動が実施された時点とを含む行動履歴情報を取得する。モデル生成部133は、時系列に沿った複数の行動履歴情報を教師データとし、行動履歴情報が入力されることで、行動履歴情報に対応した推奨対象を出力するモデルを生成する。
このように、ユーザの1つの行動履歴ではなく、連続した複数のユーザの行動履歴をソートした教師データに基づいてモデルを生成することで、連続する複数の行動種別によって選択された対象を学習することができる。つまり、従来のように、1つの行動種別とその対象のみを学習するモデルでは、出力される推奨対象の範囲も限られてくるが、本実施形態のように、複数の行動履歴を関連付けた教師データを学習することで、これらの行動の対象同士の特徴ベクトルを近づけることができ、広い範囲の推奨対象を出力可能なモデルを生成できる。
【0034】
本実施形態では、教師データとして、行動履歴情報の行動種別、及び対象のタイトル、及び、ジャンル記憶部123から検索された対象のジャンル(カテゴリ)を含み、これらを連結したテキスト情報を用いる。これにより、第二生成部133Bは、fastTextの手法により、連結された各項目(複数の行動履歴情報の行動種別、タイトル、ジャンル)の特徴ベクトルを近づけることができる。
【0035】
本実施形態では、制御部13は、記憶部12に記憶される情報処理プログラムを読み込み実行することで、レコメンド配信部134として機能し、モデル生成部133から出力された推奨情報に基づいて、ユーザにレコメンド情報を配信する。これにより、上述したように、ユーザの行動履歴情報に対して、従来よりも広い範囲の広告情報を対象としたレコメンド情報を配信することができる。
【0036】
[6.変形例]
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の目的を達成できる範囲で、以下に示される変形をも含むものである。
【0037】
(変形例1)
上記実施形態では、オンラインショッピングサービスにおける商品を対象としたレコメンドの配信を例示したが、その他のサービスにも本発明を適用することができる。例えば、ニュースの配信などにおいて、ユーザが閲覧したニュース記事、ユーザがブックマーク登録したニュース記事などを行動履歴情報として取得してもよい。この場合、ニュースコンテンツに対する各行動履歴情報と、閲覧した記事のジャンルとを用いて、上記実施形態と同様にしてモデルを生成することができる。
【0038】
(変形例2)
上記実施形態では、時系列に沿った行動履歴情報を教師データとして機械学習させる例を示したが、各行動履歴情報に対して、直前の行動履歴情報を関連付けた遷移情報を生成してもよい。例えば、「TitleA」の商品Aを「閲覧(view)」した行動履歴情報と、「TitleB」の商品Bを「ウォッチリストに登録(watchlist)」した行動履歴情報とが連続し、商品Aに対して、第一カテゴリ「categoryα1」、第二カテゴリ「categoryβ1」が検索され、商品Bに対して、第一カテゴリ「categoryα2」、第二カテゴリ「categoryβ2」が検索されたとする。この場合、第一生成部133Aは、「商品B」を「ウォッチリストに登録」した行動履歴情報に対して、直前の行動履歴情報を連結させて、「watchlist_TitleB_categoryα2_categoryβ2_view_TitleA_categoryα1_categoryβ1」とのテキスト情報の入力データを生成してもよい。
【0039】
(変形例3)
上記実施形態では、第一生成部133Aは、時系列の沿った複数の行動履歴情報に、対象に対するジャンルを付加した教師データを用いる例を示したが、行動履歴情報に対してジャンルが付加されなくてもよい。つまり、行動履歴情報の行動の種別及び行動の対象をテキスト情報として連結させ、複数の当該行動履歴情報がソートされた教師データとを用いてもよい。この場合でも、行動履歴の遷移を考慮したモデルを生成することができ、従来のモデルに比べて、広い範囲の推奨対象を出力することができる。
【0040】
あるいは、第一生成部133Aは、1つの行動履歴情報に対して、対象のジャンルを付加したテキスト情報を教師データとして生成してもよい。つまり、複数の行動履歴情報が時系列に並んでいなくても、各行動履歴情報に含まれる時点を教師データとして加えて用いてもよい。
【0041】
第一生成部133Aは、ユーザ毎の行動履歴情報を時系列にソートした教師データを生成した。これに対して、ユーザ毎にモデルを生成してもよい。この場合、対象となるユーザの時系列に沿った行動履歴情報を教師データとして用いればよい。
【符号の説明】
【0042】
1…情報処理システム、10…サーバ装置(情報処理装置)、12…記憶部、13…制御部、20…ユーザ端末、121…ユーザ情報記憶部、122…レコメンド対象記憶部、123…ジャンル記憶部、131…ユーザ情報登録部、132…行動履歴取得部、133…モデル生成部、133A…第一生成部、133B…第二生成部、134…レコメンド配信部。