IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

<>
  • 特許-情報処理システム、および情報処理方法 図1
  • 特許-情報処理システム、および情報処理方法 図2
  • 特許-情報処理システム、および情報処理方法 図3
  • 特許-情報処理システム、および情報処理方法 図4
  • 特許-情報処理システム、および情報処理方法 図5
  • 特許-情報処理システム、および情報処理方法 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-04
(45)【発行日】2024-01-15
(54)【発明の名称】情報処理システム、および情報処理方法
(51)【国際特許分類】
   G06Q 30/0282 20230101AFI20240105BHJP
【FI】
G06Q30/0282
【請求項の数】 14
(21)【出願番号】P 2022041213
(22)【出願日】2022-03-16
(62)【分割の表示】P 2020046115の分割
【原出願日】2020-03-17
(65)【公開番号】P2022078311
(43)【公開日】2022-05-24
【審査請求日】2022-05-20
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(74)【代理人】
【識別番号】100181124
【弁理士】
【氏名又は名称】沖田 壮男
(74)【代理人】
【識別番号】100194087
【弁理士】
【氏名又は名称】渡辺 伸一
(72)【発明者】
【氏名】井関 洋平
(72)【発明者】
【氏名】黒川 拓真
(72)【発明者】
【氏名】商 亮
(72)【発明者】
【氏名】伊藤 翔平
(72)【発明者】
【氏名】竹中 光
(72)【発明者】
【氏名】藤木 貴之
(72)【発明者】
【氏名】堀野 将晴
【審査官】樋口 龍弥
(56)【参考文献】
【文献】特開2010-272015(JP,A)
【文献】特表2017-509070(JP,A)
【文献】特表2017-535866(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
利用者によって指定されたクエリを取得する取得部と、
前記取得部により取得されたクエリと、前記クエリを含む名称を有しまたは類似する名称を有する紹介対象に関連付けられた一以上の素性であって前記紹介対象を含むコンテンツを利用者に提供したときの前記コンテンツに対する利用者の行動を示す行動情報に含まれ素性とに基づく一以上の指標を、予め学習された学習済モデルに入力することで、前記クエリに対する紹介対象のランキングを決定する決定部と、を備え、
前記素性は、利用者の行動が集計された集計素性を含み、
所定の周期で第1装置により提供された前記紹介対象と他装置におけるランキングに用いられる前記集計素性とを含む行動情報を取得し、取得した行動情報を前記取得部と前記決定部とを含む第2装置に提供する処理装置を更に備え、
前記処理装置は、第1周期で第1装置により提供された前記行動情報に含まれる集計素性が、第1周期よりも前の第2周期で得られた前記集計素性に基づいて導出された基準値よりも所定度合以上乖離している場合、前記行動情報を前記第2装置に提供しない、
情報処理システム。
【請求項2】
利用者によって指定されたクエリを取得する取得部と、
前記取得部により取得されたクエリと、前記クエリを含む名称を有しまたは類似する名称を有する紹介対象に関連付けられた一以上の素性であって前記紹介対象を含むコンテンツを利用者に提供したときの前記コンテンツに対する利用者の行動を示す行動情報に含まれ素性とに基づく一以上の指標を、予め学習された学習済モデルに入力することで、前記クエリに対する紹介対象のランキングを決定する決定部と、を備え、
前記素性は、利用者の行動が集計された集計素性を含み、
前記取得部と前記決定部とを含む第2装置が取得する集計素性は部分的に最新の日付が揃っていない場合があり、
前記第2装置は、前記紹介対象ごとの集計素性間で日付が全て揃っている部分のみを、当該揃っている日付を少なくとも最終日付とした集計素性で学習された前記学習済モデルに入力する、
情報処理システム。
【請求項3】
利用者によって指定されたクエリを取得する取得部と、
前記取得部により取得されたクエリと、前記クエリを含む名称を有しまたは類似する名称を有する紹介対象に関連付けられた一以上の素性であって前記紹介対象を含むコンテンツを利用者に提供したときの前記コンテンツに対する利用者の行動を示す行動情報に含まれ素性とに基づく一以上の指標を、予め学習された学習済モデルに入力することで、前記クエリに対する紹介対象のランキングを決定する決定部と、
行動情報の素性のうちから、所定の度合以上の頻度で前記紹介対象を含むコンテンツを利用者の端末装置に提供する提供サーバ装置にアクセスしていた装置に関連付けられた行動情報に含まれる素性を除外し、除外した素性を前記取得部と前記決定部とを含む第2装置に提供する処理装置と、
を備える情報処理システム。
【請求項4】
利用者によって指定されたクエリを取得する取得部と、
前記取得部により取得されたクエリと、前記クエリを含む名称を有しまたは類似する名称を有する紹介対象に関連付けられた一以上の素性であって前記紹介対象を含むコンテンツを利用者に提供したときの前記コンテンツに対する利用者の行動を示す行動情報に含まれ素性とに基づく一以上の指標を、予め学習された学習済モデルに入力することで、前記クエリに対する紹介対象のランキングを決定する決定部と、
所定の規則によって素性が整理されたデータセットを有し、前記データセットのうちから設定された素性を抽出し、抽出した素性を前記取得部と前記決定部とを含む第2装置に提供する第1装置と、
を備える情報処理システム。
【請求項5】
前記学習済モデルは、前記行動情報に含まれる素性と、前記行動情報に含まれる前記コンテンツにおける前記紹介対象に対するコンバージョンの結果とに基づいて、前記コンバージョンの度合が高い紹介対象が前記ランキングで上位に位置するように学習されたモデルである、
請求項1から4のうちいずれか1項に記載の情報処理システム。
【請求項6】
前記紹介対象は、商品またはサービスである、
請求項1から5のうちいずれか1項に記載の情報処理システム。
【請求項7】
前記素性は、前記利用者が紹介対象に着目したコンテンツにアクセスした回数である、
請求項1から6のうちいずれか1項に記載の情報処理システム。
【請求項8】
前記素性は、前記紹介対象である商品またはサービスの特徴を示す情報を含む、
請求項1から7のうちいずれか1項に記載の情報処理システム。
【請求項9】
前記素性は、前記紹介対象である商品またはサービスの名称と前記クエリとの類似度を示す情報を含む、
請求項1から8のうちいずれか1項に記載の情報処理システム。
【請求項10】
前記素性は、
前記利用者が紹介対象に着目したコンテンツにアクセスした回数、
前記紹介対象である商品またはサービスの特徴を示す情報、および
前記紹介対象である商品またはサービスの名称と前記クエリとの類似度を示す情報
を含む、
請求項1から9のうちいずれか1項に記載の情報処理システム。
【請求項11】
ランキングを決定する決定装置のコンピュータが、
利用者によって指定されたクエリを取得し、
前記取得したクエリと、前記クエリを含む名称を有しまたは類似する名称を有する紹介対象に関連付けられた一以上の素性であって前記紹介対象を含むコンテンツを利用者に提供したときの前記コンテンツに対する利用者の行動を示す行動情報に含まれ素性とに基づく一以上の指標を、予め学習された学習済モデルに入力することで、前記クエリに対する紹介対象のランキングを決定し、
前記素性は、利用者の行動が集計された集計素性を含み、
処理装置のコンピュータが、
所定の周期で第1装置により提供された前記紹介対象と他装置におけるランキングに用いられる前記集計素性とを含む行動情報を取得し、取得した行動情報を前記決定装置に提供し、
第1周期で第1装置により提供された前記行動情報に含まれる集計素性が、第1周期よりも前の第2周期で得られた前記集計素性に基づいて導出された基準値よりも所定度合以上乖離している場合、前記行動情報を前記決定装置に提供しない、
情報処理方法。
【請求項12】
ランキングを決定する決定装置のコンピュータが、
利用者によって指定されたクエリを取得し、
前記取得したクエリと、前記クエリを含む名称を有しまたは類似する名称を有する紹介対象に関連付けられた一以上の素性であって前記紹介対象を含むコンテンツを利用者に提供したときの前記コンテンツに対する利用者の行動を示す行動情報に含まれ素性とに基づく一以上の指標を、予め学習された学習済モデルに入力することで、前記クエリに対する紹介対象のランキングを決定し、
前記素性は、利用者の行動が集計された集計素性を含み、
前記決定装置が取得する集計素性は部分的に最新の日付が揃っていない場合があり、
前記紹介対象ごとの集計素性間で日付が全て揃っている部分のみを、当該揃っている日付を少なくとも最終日付とした集計素性で学習された前記学習済モデルに入力する、
情報処理方法。
【請求項13】
ランキングを決定する決定装置のコンピュータが、
利用者によって指定されたクエリを取得し、
前記取得したクエリと、前記クエリを含む名称を有しまたは類似する名称を有する紹介対象に関連付けられた一以上の素性であって前記紹介対象を含むコンテンツを利用者に提供したときの前記コンテンツに対する利用者の行動を示す行動情報に含まれ素性とに基づく一以上の指標を、予め学習された学習済モデルに入力することで、前記クエリに対する紹介対象のランキングを決定し、
処理装置のコンピュータが、
行動情報の素性のうちから、所定の度合以上の頻度で前記紹介対象を含むコンテンツを利用者の端末装置に提供する提供サーバ装置にアクセスしていた装置に関連付けられた行動情報に含まれる素性を除外し、除外した素性を前記決定装置に提供する、
情報処理方法。
【請求項14】
ランキングを決定する決定装置のコンピュータが、
利用者によって指定されたクエリを取得し、
前記取得したクエリと、前記クエリを含む名称を有しまたは類似する名称を有する紹介対象に関連付けられた一以上の素性であって前記紹介対象を含むコンテンツを利用者に提供したときの前記コンテンツに対する利用者の行動を示す行動情報に含まれ素性とに基づく一以上の指標を、予め学習された学習済モデルに入力することで、前記クエリに対する紹介対象のランキングを決定し、
第1装置のコンピュータが、
所定の規則によって素性が整理されたデータセットを有し、前記データセットのうちから設定された素性を抽出し、抽出した素性を前記決定装置に提供する、
情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
従来、ウエブサイトを訪問する訪問者のウエブサイトでの行動を示すセグメント情報を生成し、解析条件に合致するセグメント情報を用いて解析を行い、この解析結果を表示部に表示するセグメント解析装置が開示されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2013-235572号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記従来の技術では、利用者の意図に沿った情報を取得することができない場合があった。
【0005】
本発明は、このような事情を考慮してなされたものであり、利用者の意図に沿った情報を取得することができる情報処理システム、情報処理方法、およびプログラムを提供することを目的の一つとする。
【課題を解決するための手段】
【0006】
本発明の一態様は、情報処理システムは、利用者によって指定されたクエリを取得する取得部と、前記取得部により取得されたクエリと、前記クエリを含む名称を有しまたは類似する名称を有する紹介対象に関連付けられた一以上の素性であって前記紹介対象を含むコンテンツを利用者に提供したときの前記コンテンツに対する利用者の行動を示す行動情報に含まれ素性とに基づく一以上の指標を、予め学習された学習済モデルに入力することで、前記クエリに対する紹介対象のランキングを決定する決定部と、を備える。
【発明の効果】
【0007】
本発明の一態様によれば、利用者の意図に沿った情報を提供することができる。
【図面の簡単な説明】
【0008】
図1】情報処理システム1の機能構成の一例を示す図である。
図2】商品情報62の内容の一例を示す図である。
図3】学習済モデル64の概念図である。
図4】バリデーション機能について説明するための図である。
図5】情報処理システム1が実行する処理について説明するための図である。
図6】第2実施形態の情報処理システム1により実行される処理について説明するための図である。
【発明を実施するための形態】
【0009】
以下、図面を参照し、本発明の情報処理システム、情報処理方法、およびプログラムの実施形態について説明する。
【0010】
[概要]
情報処理システム1は、第1装置と、第2装置とを含む。第1装置と、第2装置とは、それぞれ一以上のプロセッサにより実現される。第1装置と第2装置とは一つの装置であってもよい。第1装置は、紹介対象を含むコンテンツに対する利用者の行動を示す行動情報であって紹介対象と他装置におけるランキングに用いられる素性とを含む行動情報を取得し、取得した行動情報を他の装置に提供する。第2装置は、第1装置により提供された紹介対象と素性とが関連付けられた情報が記憶される記憶部と、利用者によって指定されたクエリを取得する取得部と、取得部により取得されたクエリと、クエリを含む名称を有し、または類似する名称を有する紹介対象に関連付けられた一以上の素性とに基づく一以上の指標を、予め学習された学習済モデルに入力することで、前記クエリに対する紹介対象のランキングを決定する決定部と、を備える。
【0011】
紹介対象は、例えば、商品またはサービスである。素性は、利用者の行動が集計された集計素性を含む。この集計素性は、利用者が紹介対象に着目したコンテンツ(例えば商品の紹介コンテンツや商品の詳細を示すコンテンツ)にアクセスした回数である。
【0012】
学習済モデルは、第1装置が取得した行動情報に含まれる素性(例えば集計素性)と、行動情報に含まれるコンテンツにおける紹介対象に対するコンバージョンの結果とに基づいて、コンバージョンの度合が高い紹介対象がランキングで上位に位置するように学習されたモデルである。コンバージョンとは、利用者が紹介対象に着目したことであり、例えば、利用者が、紹介対象の商品をカートに入れたり、購入したりしたことを示す情報である。
【0013】
<第1実施形態>
[構成]
図1は、情報処理システム1の機能構成の一例を示す図である。情報処理システム1は、例えば、端末装置10、ショッピングサーバ30と、検索装置50と、処理システム100とを備える。
【0014】
処理システム100に含まれる第1記憶装置120は「第1装置」の一例であり、検索装置50は「第2装置」の一例である。処理システム100に含まれる第1情報処理装置は「処理装置」の一例である。
【0015】
端末装置10と、ショッピングサーバ30とは、ネットワークNWを介して互いに通信する。ネットワークNWは、例えばインターネット、無線基地局、プロバイダなどを含む。また、ショッピングサーバ30と、検索装置50または処理システム100(第1記憶装置120)とは、WAN(Wide Area Network)やLAN(Local Area Network)、専用回線などの所定の通信網(或いはネットワークNW)を介して通信する。
【0016】
[端末装置]
端末装置10は、利用者によって使用される装置であり、例えば、スマートフォンなどの携帯電話、タブレット型コンピュータ、ノート型コンピュータ、デスクトップ型コンピュータなどである。端末装置10では、ブラウザやアプリケーションプログラムなどのUA(User Agent)が起動し、以下の動作を行う。利用者が、端末装置10を操作して、ショッピングサーバ30にアクセスして、クエリを入力すると、端末装置10が、入力したクエリに関連する商品を検索するようにショッピングサーバ30に依頼する。端末装置10は、ショッピングサーバ30により提供されたコンテンツを取得し、コンテンツを自装置の表示部に表示させる。そして、利用者は、コンテンツに対して操作を行うことで、所望の商品の詳細を閲覧したり、商品を購入する処理を行ったりすることができる。
【0017】
[ショッピングサーバ]
ショッピングサーバ30は、端末装置10の依頼に応じて、検索装置50に商品のランキング結果を送信することを依頼する。ショッピングサーバ30は、検索装置50により提供されたランキング結果を含むコンテンツを端末装置10に提供する。
【0018】
[検索装置]
検索装置50は、例えば、取得部52と、処理部(決定部)54と、記憶部60とを備える。取得部52、および処理部54は、CPU(Central Processing Unit)等のハードウェアプロセッサが、記憶装置に記憶されたプログラムを実行することにより実現される。また、これらの機能部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。また、上記のプログラムは、予め記憶装置に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体に格納されており、記憶媒体が検索装置50のドライブ装置に装着されることで記憶装置にインストールされてもよい。
【0019】
記憶部60は、例えば、ROM(Read Only Memory)、フラッシュメモリ、SDカード、RAM(Random Access Memory)、HDD(Hard Disc Drive)、レジスタ等によって実現される。また、記憶部60の一部または全部は、NAS(Network Attached Storage)や外部ストレージサーバ装置等であってもよい。記憶部60には、例えば、商品情報62と、学習済モデル64とが記憶される。モデルとは、所定の関数や、ニューラルネットワークなどの所定のモデルである。
【0020】
取得部52は、ショッピングサーバ30または処理システム100により提供された情報を取得する。例えば、取得部52は、処理システム100から商品情報62を取得する。商品情報62は、処理システム100に含まれる第2情報処理装置150により提供された情報であり、処理システム100に含まれる第1記憶装置120が、ショッピングサーバ30から取得した情報である。
【0021】
図2は、商品情報62の内容の一例を示す図である。商品情報62は、例えば、商品ID、商品名、商品のカテゴリ、および素性(素性情報)が互いに関連付けられた情報である。素性は、例えば、商品の価格などの商品の属性または特徴や、商品を含むコンテンツが閲覧されたPV(Page View)数、クエリと商品名との類似度、ユーザに関する情報(例えばデモグラフィックデータ)などである。例えば、処理部54が、対象のクエリと、商品名とに基づいて、コサイン類似度等を求めて、上記の類似度を取得してもよいし、予め各クエリと商品名との類似度が商品情報62に関連付けられていてもよい。例えば、PVは、集計素性の一例である。集計素性は、PV以外の集計データや統計データであってもよい。また、商品情報62には、コンバージョン結果が含まれていてもよい。
【0022】
また、取得部52は、処理システム100の学習装置200から学習済モデル64を取得する。
【0023】
処理部54は、ショッピングサーバ30の依頼に応じて、商品のランキング結果を生成し、生成したランキング結果をショッピングサーバ30に提供する。処理部54は、ショッピングサーバ30に提供されたクエリと、クエリに応じた素性とに基づく指標(例えばクエリまたは素性をベクトル化または正規化した情報)を、学習済モデル64に入力し、学習済モデル64が出力した商品のスコアを取得する。
【0024】
図3は、学習済モデル64の概念図である。学習済モデル64は、上記の指標が入力されると、コンバージョン結果が高い商品のスコアが高くなるように、スコアを出力するモデルである。学習済モデル64は、後述する学習装置200により生成されたモデルである。
【0025】
[処理システム]
図1の説明に戻る。処理システム100は、例えば、第1記憶装置120、第1情報処理装置130、第2記憶装置140、第2情報処理装置150、および学習装置200を備える。
【0026】
第1記憶装置120は、ショッピングサーバ30が取得した利用者の行動情報を取得する。行動情報とは、例えば、ランキング結果を含むコンテンツに対する利用者の行動であって、例えば、商品に関する情報に加え、商品のコンテンツを閲覧したか否かを示す情報(PV)や、コンバージョン結果を含む。行動情報は、例えば、前述した図3に示した商品情報62の内容に加え、コンバージョン結果を含む情報である。
【0027】
行動情報は、所定の規則によって素性が整理された(所定のフォーマットで表現された)データセットである。行動情報は、所定の条件や素性を指定してデータの検索が可能なように生成された情報である。所定の規則とは、SQLなどのプログラム言語に依存する規則である。例えば、第1記憶装置120の処理部が、ショッピングサーバ30から得られた情報を集計したり、統計的な処理をしたりして行動情報を生成する。
【0028】
第1情報処理装置130は、所定の周期で第1記憶装置120に記憶された行動情報に含まれる情報を取得し、取得した情報を検索装置50に提供するために第2記憶装置140に提供する。例えば、第1情報処理装置130は、商品情報62に相当する情報または行動情報を第2記憶装置140に提供する。
【0029】
第1情報処理装置130は、フィルタリング機能を有している。フィルタリング機能とは、第1情報処理装置130が、所定の条件を満たす素性情報を除外し、除外した素性情報を第2記憶装置140に提供する機能である。所定の条件とは、ボットなどのようにアクセスを大量に繰り返している利用者の素性情報であること、所定の頻度(高頻度)でショッピングサーバ30にアクセスしている利用者の素性情報であることである。また、第1情報処理装置130は、後述するバリデーション機能を有する。
【0030】
第2記憶装置140は、第1情報処理装置130により提供された素性情報を取得し、取得した情報を記憶する。
【0031】
第2情報処理装置150は、ショッピングサーバ30に出店している仮想店舗の管理者が提供した店舗情報を取得する。店舗情報は、例えば、仮想店舗で販売している商品の情報であり、例えば、商品の説明など商品に付随する付随情報である。第2情報処理装置150は、第2記憶装置140に記憶された情報を取得し、取得した情報に上記の付随情報を付加して配信情報を生成する。そして、第2情報処理装置150は、上記の配信情報を検索装置50が処理するのみ適した形式に変換して、配信情報を検索装置50に提供する。
【0032】
これにより、検索装置50は、配信情報に基づく上述した商品情報62を得ることができる。
【0033】
[バリデーション機能]
第1情報処理装置130は、所定の周期で第1記憶装置120により提供された商品と検索装置50におけるランキングに用いられる集計素性とを含む行動情報を取得し、取得した行動情報を第2装置に提供する。この際、第1情報処理装置130は、第1周期で第1記憶装置120により提供された行動情報に含まれる集計素性が、第1周期よりも前の第2周期で得られた集計素性に基づいて導出された基準値よりも所定度合以上乖離している場合、行動情報を第2装置に提供しない。
【0034】
第1情報処理装置130は、例えば、所定の商品群に関する素性情報を検索装置50に提供する場合において、所定の商品群の基準の素性情報と、提供する対象の素性情報とに所定度合以上乖離が存在する場合、対象の素性情報に異常が存在すると判定する。この場合、第1情報処理装置130は、対象の素性情報を第2記憶装置140に提供しない。
【0035】
図4は、バリデーション機能について説明するための図である。図示する例では、素性情報は、商品群AのPV数であるものとして説明するが、バリデーション機能で処理される素性情報は、PVとは異なる情報であってもよい。例えば、PV以外の集計データや統計データであってもよい。基準PVは、例えば、所定期間における商品群AのPV数の中央値や平均値、最頻値など基準にするPV数である。対象PVは、対象とする期間(例えば所定期間と同等の長さの期間)におけるPV数である。
【0036】
図4に示すように、対象PV数が、基準PV数よりも閾値X以上少ない、または多い場合、対象PV数は異常と判定される。閾値Xは、例えば、商品群AのPV数のばらつき度合に基づいて得られた値であって、例えば、標準偏差σやσの複数倍である。
【0037】
上記のように閾値X以上乖離が存在する対象PVは、正確ではないPVであることがある。仮に、正確でないPVの情報を検索装置50に提供されると、検索装置50は、このPVを用いてランキング結果を得るため、正確でないランキング結果を利用者に提供することがある。
【0038】
これに対して、本実施形態では、上記のように第1情報処理装置130が、正確でないと推定されるPVを異常と判定して、このPVを検索装置50に提供しないため、正確でないランキング結果が利用者に提供されることが抑制される。
【0039】
[学習装置]
図1の説明に戻る。学習装置200は、例えば、学習部210と、記憶部220とを含む。学習部210は、例えば、CPU等のハードウェアプロセッサが、記憶装置に記憶されたプログラムを実行することにより実現される。記憶部220には、例えば、行動情報222と、学習済モデル224とが記憶されている。学習済モデル224は、学習部210が行動情報222を用いて生成したモデルである。
【0040】
学習部210は、学習済モデル224を生成する。学習済モデル224は、第1記憶装置120が取得した行動情報に含まれる素性情報と、行動情報に含まれるコンテンツにおける紹介対象に対するコンバージョン結果とに基づいて、コンバージョンの度合が高い紹介対象がランキングで上位に位置するように学習されたモデルである。
【0041】
例えば、学習部210は、行動情報222に含まれる素性情報とクエリとを含む学習データとコンバージョン結果を含む教師データとを用いた学習を行う。学習部210は、素性情報とクエリとがモデルに入力された場合にコンバージョン結果が高い商品のスコアが高くなるようにモデルに含まれるパラメータを調整し、パラメータが調整された学習済モデル224を生成する。生成された学習済モデル224は、検索装置50に提供され、検索装置50の記憶部60に学習済モデル64として記憶される。
【0042】
[情報処理システムが実行する処理のまとめ]
図5は、情報処理システム1が実行する処理について説明するための図である。第1記憶装置120は、ショッピングサーバ30から行動情報を取得する(S1)。更に、第1記憶装置120は、取得した行動情報を学習装置200に提供し(S2)、学習装置200は、行動情報に基づいて学習済モデル224が生成する。この学習済モデル224は、検索装置50に提供される(S3)。
【0043】
次に、第1記憶装置120は、行動情報のうち少なくとも商品に関連付けられた素性情報を検索装置50に提供する(S4)。ショッピングサーバ30の依頼に応じて、検索装置50は、素性情報と、利用者が指定したクエリとを学習済モデル224に入力し、学習済モデル224が出力したスコアに基づいて、商品のランキングを決定し、決定したランキング結果を依頼者(例えばショッピングサーバ30)に提供する(S5)。
【0044】
上記のように、第1記憶装置120が、学習装置200と、検索装置50とに、同様の素性情報を提供する。学習装置200は、この素性情報を用いて学習済モデル224を生成し、検索装置50は、生成された学習済モデル224に、学習で用いられた素性情報を入力して、スコアを得る。
【0045】
上記により、学習装置200と、検索装置50とにおいて用いられる素性の種別は、同様であるため、検索装置50は、より精度の高いスコアを得ることができる。更に、素性情報に含める素性を追加する場合、第1記憶装置120が、学習装置200および検索装置50に提供する素性情報に、素性を追加することにより、容易に素性を追加した精度の高いスコアが出力されるシステムが構築される。
【0046】
以上説明した第1実施形態によれば、情報処理システム1は、行動情報を他の装置に提供する第1記憶装置120と、検索装置50と、を備え、検索装置50が、クエリと、クエリを含む名称を有し、または類似する名称を有する紹介対象に関連付けられた一以上の素性とに基づく一以上の指標を、予め学習された学習済モデルに入力することで、クエリに対する紹介対象のランキングを決定することにより、利用者の意図に沿った情報を得ることができ、この情報を利用者に提供することができる。この結果、利用者は、意図に沿った情報を得ることができる。
【0047】
<第2実施形態>
以下、第2実施形態について説明する。第2実施形態では、素性に日時が関連付けられ、情報処理システム1は、日時を参照して、各種処理(例えば学習)を行う。以下、第1実施形態との相違点を中心に説明する。
【0048】
第2実施形態では、検索装置50が、取得する集計素性は部分的に最新の日付が揃っていない場合がある。検索装置50は、商品ごとの集計素性間で日付が全て揃っている部分のみを、当該揃っている日付を少なくとも最終日付とした集計素性で学習された学習済モデル64に入力する。第2実施形態では、学習済モデル224の生成に用いられる集計素性に関連付けられた日付と、検索装置50において学習済モデル224に入力される集計素性に関連付けられた日付とは同一である。
【0049】
図6は、第2実施形態の情報処理システム1により実行される処理について説明するための図である。ショッピングサーバ30および検索装置50は、数億の商品を取り扱っている。第1記憶装置120に記憶された数億の商品に関する情報(素性情報等)は、適宜、検索装置50に提供されるが、上記のように数億の商品があり、データ量が膨大であるため、リアルタイムで商品に関する情報は検索装置50に提供されずに、タイムラグが生じる場合がある。
【0050】
第1記憶装置120は、順次、商品群ごとの行動情報を検索装置50に提供し、検索装置50は、第1特定日における第1商品群の行動情報と、第1特定日における第2商品群の行動情報とを異なる日に取得する。図6に示すように、例えば、現在を1月5日であるとすると、第1記憶装置120は、1月1日から1月4日までの行動情報を得ている。具体的には、1月1日から1月4日までのA商品のPVと、1月1日から1月4日までのB商品のPVとを得ている。検索装置50は、1月1日から1月4日までのA商品のPV、および1月1日から1月2日までのB商品のPVを得ているが、タイムタグによって1月3日から1月4日までのB商品のPVを得ていない。
【0051】
このような状況を想定し、学習部210は、1月1日から1月2日のA商品およびB商品のPVを学習データとして用いて学習済モデル224(学習済モデル64)を生成する。そして、検索装置50は、A商品またはB商品のスコアを得る場合、1月1日から1月2日のA商品またはB商品のPVを学習済モデル64に入力して、学習済モデル64により出力されたスコアに基づいて、商品のランキングを生成する。
【0052】
仮に、学習済モデル64(224)が、1月1日から1月4日までのA商品およびB商品のPVを用いて学習を行うことを想定する。そうすると、検索装置50が入力する1月1日から1月2日のB商品のPVと、学習済モデル64が利用した学習データのPVとが異なることになり、学習済モデル64の生成で考慮されていないPVの傾向に基づくスコアが学習済モデル64により出力されることとなる。
【0053】
これに対して、本実施形態の情報処理システム1は、素性情報に対して日付が関連付けられている。そして、情報処理システム1は、検索装置50が有している素性情報と日付けが共通する素性情報を用いて学習した学習済モデル64を生成し、生成した学習済モデル64をランキングの生成に用いる。この結果、より精度の高い商品のランキング結果が生成される。
【0054】
以上説明した第2実施形態によれば、検索装置50は、第2特定日および第3特定日における第3紹介対象の行動情報と、第2特定日における第4紹介対象の行動情報とを有し、第3特定日における第4紹介対象の行動情報を有していない場合、第2特定日における第3紹介対象の行動情報に含まれる素性と第4紹介対象の行動情報に含まれる素性とを用いて第3紹介対象と紹介対象とのランキングを決定することにより、より精度よく利用者の意図に沿った情報を得ることができる。
【0055】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【符号の説明】
【0056】
1‥情報処理システム、10‥端末装置、30‥ショッピングサーバ、50‥検索装置、52‥取得部、54‥処理部、60‥記憶部、62‥商品情報、64‥学習済モデル、100‥処理システム、120‥第1記憶装置、130‥第1情報処理装置、140‥第2記憶装置、150‥第2情報処理装置、200‥学習装置、210‥学習部、220‥記憶部、222‥行動情報、224‥学習済モデル
図1
図2
図3
図4
図5
図6