IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許7231322学習装置、学習方法、学習プログラム及びプログラム
<>
  • 特許-学習装置、学習方法、学習プログラム及びプログラム 図1
  • 特許-学習装置、学習方法、学習プログラム及びプログラム 図2
  • 特許-学習装置、学習方法、学習プログラム及びプログラム 図3
  • 特許-学習装置、学習方法、学習プログラム及びプログラム 図4
  • 特許-学習装置、学習方法、学習プログラム及びプログラム 図5
  • 特許-学習装置、学習方法、学習プログラム及びプログラム 図6
  • 特許-学習装置、学習方法、学習プログラム及びプログラム 図7
  • 特許-学習装置、学習方法、学習プログラム及びプログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-20
(45)【発行日】2023-03-01
(54)【発明の名称】学習装置、学習方法、学習プログラム及びプログラム
(51)【国際特許分類】
   G06Q 30/0202 20230101AFI20230221BHJP
   G06F 16/00 20190101ALI20230221BHJP
   G06N 20/00 20190101ALI20230221BHJP
   G16Z 99/00 20190101ALI20230221BHJP
【FI】
G06Q30/0202
G06F16/00
G06N20/00 130
G16Z99/00
【請求項の数】 10
(21)【出願番号】P 2017137434
(22)【出願日】2017-07-13
(65)【公開番号】P2019020930
(43)【公開日】2019-02-07
【審査請求日】2020-03-09
【審判番号】
【審判請求日】2021-12-20
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】野村 拓也
(72)【発明者】
【氏名】工藤 和也
【合議体】
【審判長】渡邊 聡
【審判官】佐藤 智康
【審判官】松田 直也
(56)【参考文献】
【文献】特開2013-228812(JP,A)
【文献】特開2004-203531(JP,A)
【文献】特開2004-294264(JP,A)
【文献】特表2013-503391(JP,A)
【文献】国際公開第2015/49802(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
所定の対象を購入した第1ユーザの検索履歴情報を含む第1ユーザ情報の特徴を抽出し、検索履歴情報を含むユーザ情報の特徴が前記第1ユーザ情報の特徴と類似するユーザであって前記第1ユーザと異なる第2ユーザを選択する選択部と、
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報所定の重みを割り当て、前記第2ユーザ情報前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習部と、
を備えることを特徴とする学習装置。
【請求項2】
前記学習部は、
前記第1ユーザ情報に第1の重みを割り当てるとともに、前記選択部によって選択された前記第2ユーザの前記第2ユーザ情報に、当該第1の重みよりも小さい第2の重みを割り当て、前記モデルを学習する、
ことを特徴とする請求項1に記載の学習装置。
【請求項3】
所定の対象を購入した第1ユーザの検索履歴情報を含む第1ユーザ情報に基づく当該第1ユーザの行動履歴に係る特徴を抽出し、検索履歴情報を含むユーザ情報の行動履歴に係る特徴が前記第1ユーザ情報の行動履歴に係る特徴と類似するユーザであって前記第1ユーザと異なる第2ユーザを選択する選択部と、
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報所定の重みを割り当て、前記第2ユーザ情報前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習部と、
を備えることを特徴とする学習装置。
【請求項4】
前記学習部は、
前記第1ユーザ情報に第1の重みを割り当てるとともに、前記選択部によって選択された前記第2ユーザの前記第2ユーザ情報に、第2の重みを割り当て、前記モデルを学習する、
ことを特徴とする請求項3に記載の学習装置。
【請求項5】
コンピュータが実行する学習方法であって、
所定の対象を購入した第1ユーザの検索履歴情報を含む第1ユーザ情報の特徴を抽出し、検索履歴情報を含むユーザ情報の特徴が前記第1ユーザ情報の特徴と類似するユーザであって前記第1ユーザと異なる第2ユーザを選択する選択工程と、
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報所定の重みを割り当て、前記第2ユーザ情報前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習工程と、
を含むことを特徴とする学習方法。
【請求項6】
所定の対象を購入した第1ユーザの検索履歴情報を含む第1ユーザ情報の特徴を抽出し、検索履歴情報を含むユーザ情報の特徴が前記第1ユーザ情報の特徴と類似するユーザであって前記第1ユーザと異なる第2ユーザを選択する選択手順と、
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報所定の重みを割り当て、前記第2ユーザ情報前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習手順と、
をコンピュータに実行させることを特徴とする学習プログラム。
【請求項7】
コンピュータが実行する学習方法であって、
所定の対象を購入した第1ユーザの検索履歴情報を含む第1ユーザ情報に基づく当該第1ユーザの行動履歴に係る特徴を抽出し、検索履歴情報を含むユーザ情報の行動履歴に係る特徴が前記第1ユーザ情報の行動履歴に係る特徴と類似するユーザであって前記第1ユーザと異なる第2ユーザを選択する選択工程と、
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報所定の重みを割り当て、前記第2ユーザ情報前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習工程と、
を含むことを特徴とする学習方法。
【請求項8】
所定の対象を購入した第1ユーザの検索履歴情報を含む第1ユーザ情報に基づく当該第1ユーザの行動履歴に係る特徴を抽出し、検索履歴情報を含むユーザ情報の行動履歴に係る特徴が前記第1ユーザ情報の行動履歴に係る特徴と類似するユーザであって前記第1ユーザと異なる第2ユーザを選択する選択手順と、
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報所定の重みを割り当て、前記第2ユーザ情報前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習手順と、
をコンピュータに実行させることを特徴とする学習プログラム。
【請求項9】
所定の対象を購入した第1ユーザの検索履歴情報を含む第1ユーザ情報の特徴を抽出し、検索履歴情報を含むユーザ情報の特徴が前記第1ユーザ情報の特徴と類似するユーザであって前記第1ユーザと異なる第2ユーザを選択し、
前記第1ユーザ情報の特徴に基づいて、前記第1ユーザ情報所定の重みを割り当て、所定の方法で算出した前記第1ユーザ情報と前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を用いて、前記第2ユーザ情報当該類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測する行動予測モデルを学習させる、学習用データを備えたコンピュータに対し、
入力層と出力層とを有し、前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、前記第1要素と前記第1要素の所定の重みとに基づいて値が算出される第2要素と、前記入力層に入力された前記第1ユーザ情報及び前記第2ユーザ情報について、前記出力層以外の各層に属する各要素を前記第1要素として、前記第1要素と前記第1要素の所定の重みとに基づく所定の演算を行う前記行動予測モデルの前記入力層に入力することにより、演算結果を示す出力値を前記行動予測モデルの前記出力層から出力し、前記第1ユーザ情報及び前記第2ユーザ情報に対応する所定の重みに応じて決定される正解値と前記出力値との比較に基づく学習を行なうよう、
機能させるためのプログラム。
【請求項10】
所定の対象を購入した第1ユーザの検索履歴情報を含む第1ユーザ情報の特徴を抽出し、検索履歴情報を含むユーザ情報の特徴が前記第1ユーザ情報の特徴と類似するユーザであって前記第1ユーザと異なる第2ユーザを選択し、
前記第1ユーザ情報の特徴に基づいて当該ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測する行動予測モデルとして、前記第1ユーザ情報に所定の重みを割り当てた第1ユーザ情報、所定の方法で算出した前記第1ユーザ情報と前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を用いて、前記第2ユーザ情報に当該類似性に応じた重みを割り当てた第2ユーザ情報が入力される入力層と、
出力層と、
前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、
前記第1要素と前記第1要素の所定の重みとに基づいて値が算出される第2要素と、を含む前記行動予測モデルであって、
前記入力層に入力された前記第1ユーザ情報及び前記第2ユーザ情報について、前記出力層以外の各層に属する各要素を前記第1要素として、前記第1要素と前記第1要素の所定の重みとに基づく所定の演算を行うことにより、それぞれのユーザの情報の提供に用いられるスコアの値を前記出力層から出力し、前記第1ユーザ情報及び前記第2ユーザ情報に対応する所定の重みに応じて決定される正解値と前記スコアの値との比較に基づいて学習された前記行動予測モデルとして、
コンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、学習方法、学習プログラム及びプログラムに関する。
【背景技術】
【0002】
従来、特定のユーザに関するユーザ情報を用いて、当該特定のユーザと行動が類似する類似ユーザを特定する技術が知られている。例えば、特定のユーザに関するユーザ情報に基づいて、当該特定のユーザの行動についての行動予測モデルを生成し、生成された行動予測モデルを用いて、当該特定のユーザと行動が類似する類似ユーザを特定する技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2016-177649
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記の従来技術では、特定のユーザと行動が類似する類似ユーザを特定することができるとは限らない。例えば、上記の従来技術では、特定のユーザに関するユーザ情報が不十分な場合には、行動予測モデルの精度が低くなるため、特定のユーザと行動が類似する類似ユーザを特定することができるとは限らない。
【0005】
本願は、上記に鑑みてなされたものであって、特定のユーザと行動が類似する類似ユーザを特定することができる学習装置、学習方法、学習プログラム、学習用データ及びモデルを提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る学習装置は、第1行動を行った第1ユーザの第1ユーザ情報との類似性に基づいて、当該第1ユーザと異なる第2ユーザを選択する選択部と、前記選択部によって選択された前記第2ユーザが前記第1行動を行ったものとした場合の前記第2ユーザの第2ユーザ情報と、前記第1ユーザ情報とを用いて、前記第1行動の予測モデルを学習する学習部と、を備えたことを特徴とする。
【発明の効果】
【0007】
実施形態の一態様によれば、特定のユーザと行動が類似する類似ユーザを特定することができるという効果を奏する。
【図面の簡単な説明】
【0008】
図1図1は、実施形態に係るネットワークシステムの構成例を示す図である。
図2図2は、実施形態に係る学習装置による学習処理の一例を示す図である。
図3図3は、実施形態に係る学習装置の構成例を示す図である。
図4図4は、実施形態に係る購入履歴情報記憶部の一例を示す図である。
図5図5は、実施形態に係る検索履歴情報記憶部の一例を示す図である。
図6図6は、実施形態に係る学習装置による学習処理手順を示すフローチャートである。
図7図7は、変形例に係る学習処理の一例を示す図である。
図8図8は、学習装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る学習装置、学習方法、学習プログラム、学習用データ及びモデルを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る学習装置、学習方法、学習プログラム、学習用データ及びモデルが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
〔1.ネットワークシステムの構成〕
まず、図1を用いて、実施形態に係るネットワークシステム1の構成について説明する。図1に示すように、実施形態に係るネットワークシステム1には、端末装置10~10(総称して「10」)と、情報提供装置20と、学習装置100とが含まれる。端末装置10、情報提供装置20、学習装置100は、それぞれネットワークNと有線又は無線により接続される。なお、図1では、ネットワークシステム1に、1台の情報提供装置20と、1台の学習装置100とが含まれる例を示したが、ネットワークシステム1には、複数台の情報提供装置20や、複数台の学習装置100が含まれてもよい。
【0011】
端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、デスクトップ型PC(Personal Computer)、タブレット型PC、スマートフォン、PDA(Personal Digital Assistant)を含む、任意のタイプの情報処理装置であってもよい。
【0012】
情報提供装置20は、各種情報を端末装置10に提供するサーバ装置である。例えば、情報提供装置20は、端末装置10に対してウェブサイトを提供する。なお、ウェブサイトは、ショッピングサイト、ニュースサイト、オークションサイト、天気予報サイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、アンケートサイト、ウェブブログを含む、任意のタイプのウェブサイトであってよい。また、ウェブサイトは、ショッピング、ニュース、オークション、天気予報、ファイナンス(株価)、路線情報、地図情報、アンケートなどのコンテンツを含む、任意のタイプのポータルサイトであってよい。ただし、「ウェブサイト」という用語は、「アプリケーション」を含むように広義に解釈し得る。例えば、「ポータルサイト」という用語は、スマートフォン上で実行するアプリケーションのポータルサイトを意味するものと解釈し得る。
【0013】
また、情報提供装置20は、ウェブサイトを通して、端末装置10のユーザに関連するユーザ情報を受信する。そして、情報提供装置20は、ウェブサイトを通して受信されたユーザ情報を、学習装置100に提供する。
【0014】
学習装置100は、情報提供装置20から提供されたユーザ情報から規則性や法則性を学習するサーバ装置である。例えば、学習装置100は、情報提供装置20から提供されたユーザ情報を用いて、ユーザの行動についての予測モデルを学習する。
【0015】
〔2.学習処理〕
次に、図2を用いて、実施形態に係る学習装置による学習処理の一例について説明する。図2は、実施形態に係る学習装置による学習処理の一例を示す説明図である。
【0016】
はじめに、学習装置100は、端末装置10のユーザに関連するユーザ情報を、情報提供装置20から受信する。例えば、学習装置100は、情報提供装置20によって提供されるウェブサイト上でのユーザの行動についての行動履歴情報を、情報提供装置20から受信する。図1の例では、行動履歴情報は、ユーザの購入履歴情報を含む。
【0017】
続いて、学習装置100は、ユーザ情報に含まれる複数のユーザのうちから、特定の行動を行ったユーザを、当該特定の行動についての予測モデルの学習に用いる「正解ユーザ」として選択する。例えば、学習装置100は、ユーザの購入履歴情報を参照し、特定の商品を購入したユーザを、特定の商品の購入についての予測モデルの学習に用いる正解ユーザとして選択する。図1の例では、学習装置100は、パソコンを購入したユーザを、パソコンの購入についての予測モデルM1の学習に用いる正解ユーザC1として選択する。
【0018】
図2では、例示を目的として、パソコンを購入した複数のユーザを、複数の正解ユーザC1の集合E1として示している。図2の例では、複数の正解ユーザC1の集合E1は、ユーザU1、ユーザU2及びユーザU3を含む。図2中では図示していないが、複数の正解ユーザC1の集合E1は、ユーザU1、ユーザU2及びユーザU3以外の複数の正解ユーザC1を含み得る。
【0019】
続いて、学習装置100は、特定の行動を行ったユーザのユーザ情報との類似性に基づいて、ユーザ情報に含まれる複数のユーザのうちから、当該特定の行動を行ったユーザと異なるユーザを、当該特定の行動についての予測モデルの学習に用いる「補助ユーザ」として選択する。例えば、学習装置100は、特定の行動と類似する行動を行ったユーザを、補助ユーザとして選択する。
【0020】
1つの例では、学習装置100は、ユーザの購入履歴情報に含まれる複数の商品を参照し、参照された商品の間で上位分類が共通するか否かに基づいて、補助ユーザを選択することができる。図1の例では、学習装置100は、パソコンに対応する上位分類「情報端末」をユーザ情報から読み出し、読みだした上位分類「情報端末」に対応する商品「スマートフォン」を購入したユーザを、パソコンの購入についての予測モデルM1の学習に用いる補助ユーザA1として選択する。
【0021】
図2では、例示を目的として、スマートフォンを購入した複数のユーザを、複数の補助ユーザA1の集合E2として示している。図2の例では、複数の補助ユーザA1の集合E2は、ユーザU4、ユーザU5、ユーザU6及びユーザU7を含む。図2中では図示していないが、複数の補助ユーザA1の集合E2は、ユーザU4、ユーザU5、ユーザU6及びユーザU7以外の複数の補助ユーザA1を含み得る。
【0022】
続いて、学習装置100は、正解ユーザのユーザ情報に、第1の重みを割り当てる。図1の例では、学習装置100は、正解ユーザC1のユーザ情報に、重み「1」を割り当てる(ステップS11)。ここで、重みは、ユーザの行動についての予測モデルを学習する際に用いられるパラメータである。具体的には、重みは、ユーザ情報が予測モデルの学習に与える影響の大きさを示すパラメータである。一例として、重みは、勾配降下法における学習率(学習係数とも呼ばれる)に補正係数として乗ぜられ得る。
【0023】
続いて、学習装置100は、補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報に、第1の重みよりも小さい第2の重みを割り当てる。図1の例では、学習装置100は、補助ユーザA1がパソコンを購入したものとした場合の補助ユーザA1のユーザ情報に、「1」よりも小さい重みを割り当てる(ステップS12)。
【0024】
続いて、学習装置100は、補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報と、正解ユーザのユーザ情報とを用いて、当該特定の行動の予測モデルを学習する。図1の例では、補助ユーザA1がパソコンを購入したものとした場合の補助ユーザA1のユーザ情報と、パソコンを購入した正解ユーザC1のユーザ情報とを用いて、パソコンの購入についての予測モデルM1を学習する(ステップS13)。例えば、学習装置100は、所定のユーザの検索履歴情報を説明変数とし、当該所定のユーザがパソコンを購入する確率を目的変数とする予測モデルM1を学習する。
【0025】
その後、学習装置100は、学習された予測モデルを、情報提供装置20に提供する。図1の例では、学習装置100は、パソコンの購入についての予測モデルM1を、情報提供装置20に提供する。
【0026】
このように、実施形態に係る学習装置100は、特定の行動を行った正解ユーザのユーザ情報との類似性に基づいて、当該特定の行動を行った正解ユーザと異なるユーザを、当該特定の行動についての予測モデルの学習に用いる補助ユーザとして選択する。そして、学習装置100は、補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報と、特定の行動を行った正解ユーザのユーザ情報とを用いて、当該特定の行動の予測モデルを学習する。
【0027】
これにより、実施形態に係る学習装置100は、特定のユーザと行動が類似する類似ユーザを特定することができる。より詳細に説明すると、一般的に、ユーザの行動についての予測モデルの精度は、当該行動を行った正解ユーザのユーザ情報の量に依存する。学習装置100は、正解ユーザのユーザ情報の量が不十分である場合でも、正解ユーザのユーザ情報に加えて、補助ユーザのユーザ情報を用いて、ユーザの行動についての予測モデルを学習することができる。この結果、学習装置100は、正解ユーザのユーザ情報の量が不十分である場合でも、正解ユーザと行動が類似する類似ユーザを精度よく特定することができる。以下、このような学習処理を実現する学習装置100について詳細に説明する。
【0028】
〔3.学習装置の構成〕
次に、図3を用いて、実施形態に係る学習装置100の構成について説明する。図3は、実施形態に係る学習装置100の構成例を示す図である。図3に示すように、学習装置100は、通信部110と、ユーザ情報記憶部120と、制御部130とを有する。なお、提供装置100は、提供装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(液晶ディスプレイ等)を有してもよい。
【0029】
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。図1に示すように、通信部110は、ネットワークNと有線又は無線により接続され、ネットワークNを介して、端末装置10や情報提供装置20との間で情報の送受信を行う。
【0030】
(ユーザ情報記憶部120)
ユーザ情報記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3に示すように、ユーザ情報記憶部120は、購入履歴情報記憶部121と、検索履歴情報記憶部122と、予測モデル情報記憶部123とを記憶する。
【0031】
(購入履歴情報記憶部121)
購入履歴情報記憶部121は、ユーザの購入履歴情報を記憶する。例えば、購入履歴情報記憶部121は、受信部131によって受信されたユーザの購入履歴情報を記憶する。ここで、図4に、実施形態に係る購入履歴情報記憶部121の一例を示す。図4の例では、購入履歴情報記憶部121には、「購入履歴情報」が「ユーザID」ごとに記憶される。例示として、「購入履歴情報」には、項目「商品」、「購入時刻」、「下位分類」及び「上位分類」が含まれる。
【0032】
「ユーザID」は、端末装置10のユーザを識別するための識別子を示す。情報提供装置20と端末装置10との間でHTTP(Hypertext Transfer Protocol)クッキー等が送受信される場合には、HTTPクッキーにユーザIDが設定されてもよい。
【0033】
「商品」は、ユーザが情報提供装置20によって提供されるウェブサイトにおいて購入した商品を示す。「購入時刻」は、ユーザが商品を購入した時刻を示す。「下位分類」は、商品が属する商品グループの下位区分を示す。「上位分類」は、商品が属する商品グループを示す。すなわち、図4は、ユーザID「U1」で識別されるユーザが、下位分類「パソコン」及び上位分類「情報端末」に属する商品「パソコンX1」を、「2017年6月20日午後11時59分」に購入したことを示している。
【0034】
(検索履歴情報記憶部122)
検索履歴情報記憶部122は、ユーザの検索履歴情報を記憶する。例えば、検索履歴情報記憶部122は、受信部131によって受信されたユーザの検索履歴情報を記憶する。ここで、図5に、実施形態に係る検索履歴情報記憶部122の一例を示す。図5の例では、検索履歴情報記憶部122には、「検索履歴情報」が「ユーザID」ごとに記憶される。例示として、「検索履歴情報」には、項目「検索クエリ」及び「検索時刻」が含まれる。
【0035】
「検索クエリ」は、ユーザが情報提供装置20によって提供されるウェブサイトにおいて入力した検索クエリを示す。「検索時刻」は、ユーザが検索クエリを入力した時刻を示す。すなわち、図5は、ユーザID「U1」で識別されるユーザが、検索クエリ「パソコン」を、「2017年6月20日午後11時59分」に入力したことを示している。
【0036】
(予測モデル情報記憶部123)
予測モデル情報記憶部123は、選択部132によって選択された学習用データを記憶する。ここで、予測モデル情報記憶部123に記憶されている学習用データは、各ユーザのユーザ情報と、各ユーザに対応付けられるパラメータであって、各ユーザの学習における影響度を示すパラメータとを含む学習用データであって、入力層と出力層とを有し、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、入力層に入力されたユーザ情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うモデルの入力層に入力されることにより、演算結果を示す出力値をモデルの出力層から出力させ、ユーザ情報に対応するパラメータに応じて決定される正解値と出力値との比較に基づく学習を行なうよう、コンピュータを機能させるための学習用データである。例えば、予測モデル情報記憶部123に記憶されている学習用データは、正解ユーザ及び補助ユーザのそれぞれのユーザ情報と、正解ユーザ及び補助ユーザにそれぞれ対応付けられるパラメータであって、正解ユーザ及び補助ユーザのそれぞれの学習における影響度を示すパラメータとを含む学習用データであって、入力層と出力層とを有し、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、入力層に入力されたユーザ情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うモデルの入力層に入力されることにより、演算結果を示す出力値をモデルの出力層から出力させ、ユーザ情報に対応するパラメータに応じて決定される正解値と出力値との比較に基づく学習を行なうよう、コンピュータを機能させるための学習用データである。
【0037】
また、予測モデル情報記憶部123は、学習部133によって学習された予測モデルを記憶する。ここで、予測モデル情報記憶部123に記憶されている予測モデルは、ユーザの学習における影響度を示すパラメータが対応付けられたユーザ情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、ユーザの情報の提供に用いられるスコアの値を出力層から出力する、ユーザ情報に対応するパラメータに応じて決定される正解値と出力値との比較に基づいて学習されるよう、コンピュータを機能させ生成されたモデルである。例えば、予測モデル情報記憶部123に記憶されている予測モデルは、ユーザ情報が予測モデルの学習に与える影響の大きさを示すパラメータが対応付けられたユーザ情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、ユーザ情報に対応するユーザが特定の行動を行う確率に関する値を出力層から出力する、ユーザ情報に対応するパラメータに応じて決定される正解値と出力値との比較に基づいて学習されるよう、コンピュータを機能させ生成されたモデルである。
【0038】
ここで、予測モデルが「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、予測モデルが含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。
【0039】
また、予測モデルがDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、予測モデルが含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。
【0040】
(制御部130)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、学習装置100内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部130は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
【0041】
制御部130は、図3に示すように、受信部131と、選択部132と、学習部133と、提供部134とを有し、以下に説明する情報処理の機能や作用を実現又は実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
【0042】
(受信部131)
受信部131は、端末装置10のユーザに関連するユーザ情報を、情報提供装置20から受信する。例えば、受信部131は、情報提供装置20によって提供されるウェブサイト上でのユーザの行動についての行動履歴情報を、情報提供装置20から受信する。具体的には、受信部131は、ユーザの購入履歴情報とユーザの検索履歴情報とを含む行動履歴情報を、情報提供装置20から受信する。
【0043】
また、受信部131は、情報提供装置20から受信したユーザ情報を、ユーザ情報記憶部120に格納する。例えば、受信部131は、情報提供装置20から受信したユーザの購入履歴情報を、購入履歴情報記憶部121に格納する。また、例えば、受信部131は、情報提供装置20から受信したユーザの検索履歴情報を、検索履歴情報記憶部122に格納する。
【0044】
(選択部132)
選択部132は、ユーザ情報に含まれる複数のユーザのうちから、特定の行動を行ったユーザを、当該特定の行動についての予測モデルの学習に用いる「正解ユーザ」として選択する。そして、選択部132は、特定の行動を行ったユーザのユーザ情報との類似性に基づいて、ユーザ情報に含まれる複数のユーザのうちから、当該特定の行動を行ったユーザと異なるユーザを、当該特定の行動についての予測モデルの学習に用いる「補助ユーザ」として選択する。そして、選択部132は、選択された正解ユーザのユーザ情報と、選択された補助ユーザのユーザ情報とを、学習用データとして予測モデル情報記憶部123に格納する。
【0045】
説明のための一例として、図4に示される例において、選択部132が、購入履歴情報記憶部121に記憶されている購入履歴情報に含まれる複数のユーザのうちから、「パソコンの購入についての予測モデル」の学習に用いる補助ユーザを選択する例を考える。
【0046】
はじめに、選択部132は、購入履歴情報に含まれる下位分類「パソコン」を参照する。そして、選択部132は、参照した下位分類「パソコン」に属する商品を購入したユーザを、「パソコンの購入についての予測モデル」の学習に用いる正解ユーザとして選択する。例えば、選択部132は、ユーザID「U1」で識別されるユーザを、正解ユーザとして選択する。
【0047】
続いて、選択部132は、下位分類「パソコン」に対応する上位分類「情報端末」を参照する。その後、選択部132は、下位分類「パソコン」に属する商品を購入していない複数のユーザのうちから、参照した上位分類「情報端末」に属する商品を購入したユーザを、「パソコンの購入についての予測モデル」の学習に用いる補助ユーザとして選択する。図4の例では、選択部132は、下位分類「スマートフォン」に属する商品を購入したユーザを、補助ユーザとして選択する。例えば、選択部132は、ユーザID「U4」で識別されるユーザを、補助ユーザとして選択する。
【0048】
(学習部133)
学習部133は、選択部132によって選択された正解ユーザのユーザ情報に、第1の重みを割り当てる。また、学習部133は、選択部132によって選択された補助ユーザのユーザ情報に、第1の重みよりも小さい第2の重みを割り当てる。そして、学習部133は、補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報と、正解ユーザのユーザ情報とを用いて、当該特定の行動の予測モデルを学習する。そして、学習部133は、学習された予測モデルを、予測モデル情報記憶部123に格納する。学習部133によって行われる予測モデルの学習は、線形回帰、ロジスティック回帰、ニューラルネットワーク、サポートベクターマシン、決定木学習などを含むことができるが、これらに限定されない。
【0049】
説明のための一例として、図4図5に示される例において、学習部133が、スマートフォンを購入した補助ユーザがパソコンを購入したものとした場合の補助ユーザの検索履歴情報と、パソコンを購入した正解ユーザの検索履歴情報とを用いて、「パソコンの購入についての予測モデル」を学習する例を考える。
【0050】
はじめに、学習部133は、パソコンを購入したユーザの検索履歴情報に重み「1」を割り当てる。ここで、重みは、「パソコンの購入についての予測モデル」を学習する際に用いられるパラメータである。具体的には、重みは、「パソコンの購入についての予測モデル」の学習に与える影響の大きさを示すパラメータである。
【0051】
1つの例では、学習部133は、検索履歴情報記憶部122に記憶されている検索履歴情報を用いて、勾配降下法によって、所定のユーザの検索クエリの検索回数を説明変数とし、当該所定のユーザがパソコンを購入する確率を目的変数とする予測モデルを学習することができる。この場合、重みは、勾配降下法における学習率に補正係数として乗ぜられる。例えば、学習率に補正係数として乗ぜられた重みに基づいて、勾配降下法のステップサイズが調整される。
【0052】
続いて、学習部133は、スマートフォンを購入したユーザの検索履歴情報に、「1」よりも小さい所定の重み(例えば、「0.8」)を割り当てる。1つの例では、学習部133は、パソコンを購入したユーザの検索履歴情報とスマートフォンを購入したユーザの検索履歴情報との間の類似性に基づいて、「1」よりも小さい所定の重みを決定することができる。例えば、学習部133は、TF-IDF(Term Frequency - Inverse Document Frequency)を用いて、検索履歴情報に含まれる検索クエリに重みを割り当て、検索クエリに割り当てられた重みを成分とするクエリベクトルを算出する。そして、学習部133は、パソコンを購入したユーザの検索履歴情報から算出されたクエリベクトルとスマートフォンを購入したユーザの検索履歴情報から算出されたクエリベクトルとの間のコサイン類似度に基づいて、「1」よりも小さい所定の重みを決定する。
【0053】
その後、学習部133は、パソコンを購入したユーザの検索履歴情報を用いて、所定のユーザの検索クエリの検索回数を説明変数とし、当該所定のユーザがパソコンを購入する確率を目的変数とする予測モデルを学習する。また、学習部133は、スマートフォンを購入した補助ユーザの検索履歴情報を、パソコンを購入したユーザの検索履歴情報として用いて、所定のユーザの検索クエリの検索回数を説明変数とし、当該所定のユーザがパソコンを購入する確率を目的変数とする予測モデルを学習する。
【0054】
いくつかの実施形態において、学習部133は、選択部132によって選択された正解ユーザのユーザ情報に含まれる正解値(すなわち、教師出力)に、第1の重みを乗ずることができる。また、学習部133は、選択部132によって選択された補助ユーザのユーザ情報に含まれる正解値に、第1の重みよりも小さい第2の重みを乗ずることができる。例えば、学習部133は、パソコンを購入したユーザの正解値(例えば、「1」)に、第1の重み(例えば、「1」)を乗ずることができる。また、例えば、学習部133は、スマートフォンを購入したユーザの正解値(例えば、「1」)に、第2の重み(例えば、「0.8」を乗ずることができる。
【0055】
そして、いくつかの実施形態において、学習部133は、第1の重みが乗ぜられた正解値を含む正解ユーザのユーザ情報と、第2の重みが乗ぜられた正解値を含む補助ユーザのユーザ情報とを用いて、特定の行動の予測モデルを学習することができる。説明のための例として、パソコンの購入についての予測モデルは、線形回帰モデルとして表現されることがある。この例では、学習部133は、正解ユーザのユーザ情報及び補助ユーザのユーザ情報に正規方程式(Normal Equationとも呼ばれる)を適用することで、パソコンの購入についての線形回帰モデルを学習することができる。
【0056】
(提供部134)
提供部134は、学習部133によって学習された予測モデルを、情報提供装置20に提供する。また、学習部133によって学習された予測モデルの出力データを、情報提供装置20に提供してもよい。例えば、提供部134は、予測モデルに従った情報処理により、所定のユーザのユーザ情報を入力層に入力する。そして、提供部134は、入力データを中間層と出力層に伝播させることで出力層から、所定のユーザが特定の行動を行う確率に関する値を出力させる。図4図5の例では、提供部134は、所定のユーザがパソコンを購入する確率を表すデータを、情報提供装置20に提供してもよい。
【0057】
いくつかの実施形態において、提供部134は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、所定のユーザが特定の行動を行う確率に関する値の算出を行うことができる。具体的には、予測モデルは、所定のユーザに関するユーザ情報(例えば、検索履歴情報)が入力された場合に、所定のユーザが特定の行動を行う確率に関する値を出力するように係数が設定される。提供部134は、このような予測モデルを用いて、所定のユーザが特定の行動を行う確率に関する値を算出することができる。なお、学習部133がGAN(Generative Adversarial Networks)を用いた学習処理を行う場合、予測モデルは、GANの一部を構成するモデルであってもよい。
【0058】
〔4.学習処理のフロー〕
次に、実施形態に係る学習装置100による学習処理の手順について説明する。図6は、実施形態に係る学習装置100による学習処理手順を示すフローチャートである。
【0059】
図6に示すように、学習装置100の受信部131は、端末装置10のユーザに関連するユーザ情報を、情報提供装置20から受信する(ステップS101)。
【0060】
続いて、選択部132は、受信部131によって受信されたユーザ情報に含まれる複数のユーザのうちから、特定の行動を行ったユーザを、当該特定の行動についての予測モデルの学習に用いる「正解ユーザ」として選択する(ステップS102)。続いて、選択部132は、特定の行動を行ったユーザのユーザ情報との類似性に基づいて、受信部131によって受信されたユーザ情報に含まれる複数のユーザのうちから、当該特定の行動を行ったユーザと異なるユーザを、当該特定の行動についての予測モデルの学習に用いる「補助ユーザ」として選択する(ステップS103)。
【0061】
続いて、学習部133は、選択部132によって選択された正解ユーザのユーザ情報に、第1の重みを割り当てる(ステップS104)。続いて、学習部133は、選択部132によって選択された補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報に、第1の重みよりも小さい第2の重みを割り当てる(ステップS105)。続いて、学習部133は、補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報と、正解ユーザのユーザ情報とを用いて、当該特定の行動の予測モデルを学習する(ステップS106)。
【0062】
続いて、提供部134は、学習部133によって学習された予測モデルを、情報提供装置20に提供する(ステップS107)。
【0063】
〔5.変形例〕
上述してきた実施形態に係る学習装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下に、上記の学習装置100の他の実施形態について説明する。
【0064】
〔5-1.補助ユーザの動的選択〕
上述した学習装置100の選択部132は、正解ユーザC1が行った特定の行動と類似する行動を行ったユーザを、補助ユーザA1として選択した。しかし、この例に限られず、選択部132は、正解ユーザC1のユーザ情報に基づく正解ユーザの特徴に関連する当該正解ユーザ情報との類似性に基づいて、補助ユーザを選択してもよい。以下の説明では、図7を用いて、補助ユーザの動的選択について説明する。
【0065】
図7は、変形例に係る学習処理の一例を示す図である。はじめに、選択部132は、受信部131によって受信されたユーザ情報に含まれる複数のユーザのうちから、特定の行動を行ったユーザを、当該特定の行動についての予測モデルの学習に用いる「正解ユーザ」として選択する。図7の例では、選択部132は、パソコンを購入したユーザを、パソコンの購入についての予測モデルM2の学習に用いる正解ユーザC1として選択する。図7では、例示を目的として、パソコンを購入した複数のユーザを、複数の正解ユーザC1の集合E1として示している。
【0066】
続いて、学習部133は、正解ユーザC1のユーザ情報を用いて、正解ユーザC1が行った特定の行動についての予測モデルを学習する。図7の例では、学習部133は、パソコンを購入した正解ユーザC1のユーザ情報を用いて、パソコンの購入についての予測モデルM2を学習する。そして、学習部133は、学習された予測モデルM2の出力データに基づいて、正解ユーザC1の特徴情報を抽出する。図7の例では、学習部133は、検索クエリ「パソコン」、「スペック」の検索回数を、正解ユーザC1の特徴情報として抽出する。
【0067】
1つの実施形態では、学習部133は、所定のユーザの検索クエリの検索回数を説明変数とし、当該所定のユーザがパソコンを購入する確率を目的変数とするロジスティック回帰モデルを学習する。そして、学習部133は、学習されたロジスティック回帰モデルの回帰係数に基づいて、主要な説明変数を決定する。そして、学習部133は、決定された主要な説明変数を、正解ユーザC1の特徴情報として抽出する。
【0068】
続いて、選択部132は、学習部133によって抽出された正解ユーザC1の特徴情報との類似性に基づいて、ユーザ情報に含まれる複数のユーザのうちから、正解ユーザC1と異なるユーザを、正解ユーザC1が行った特定の行動についての予測モデルの学習に用いる「補助ユーザ」として選択する。図7の例では、選択部132は、検索クエリ「パソコン」、「スペック」の検索回数に基づいて、検索履歴情報記憶部122に記憶されている検索履歴情報に含まれるユーザのうちから、正解ユーザC1と異なるユーザを、パソコンの購入についての予測モデルM3の学習に用いる補助ユーザA2として選択する。図7では、例示を目的として、選択された複数の補助ユーザを、複数の補助ユーザA2の集合E3として示している。
【0069】
続いて、学習部133は、正解ユーザC1の特徴情報と選択部132によって選択された補助ユーザA2のユーザ情報との間の類似性に基づいて、補助ユーザA2ごとの類似性スコアを算出する。図7の例では、学習部133は、補助ユーザA2の検索クエリ「パソコン」、「スペック」の検索回数を説明変数とし、当該補助ユーザA2がパソコンを購入する確率を目的変数とする予測モデルM2の出力データに基づいて、補助ユーザA2ごとの類似性スコアを算出する。
【0070】
続いて、学習部133は、正解ユーザC1のユーザ情報に、第1の重みを割り当てる。図7の例では、学習部133は、正解ユーザC1のユーザ情報に、重み「1」を割り当てる。
【0071】
続いて、学習部133は、算出された補助ユーザA2ごとの類似性スコアに基づいて、補助ユーザA2が特定の行動を行ったものとした場合の補助ユーザA2のユーザ情報に、第1の重みよりも小さい第2の重みを割り当てる。図7の例では、学習部133は、補助ユーザA2の類似性スコアに等しい第2の重みを、当該補助ユーザA2のユーザ情報に割り当てる。
【0072】
続いて、学習部133は、補助ユーザA2が特定の行動を行ったものとした場合の補助ユーザA2のユーザ情報と、正解ユーザC1のユーザ情報とを用いて、当該特定の行動の予測モデルを再学習する。図7の例では、学習部133は、補助ユーザA2がパソコンを購入したものとした場合の補助ユーザA2のユーザ情報と、パソコンを購入した正解ユーザC1のユーザ情報とを用いて、パソコンの購入についての予測モデルM3を学習する。そして、学習部133は、学習された予測モデルM3の出力データに基づいて、正解ユーザC1の集合E1と補助ユーザA2の集合E3の和集合E4に属するユーザの特徴情報を抽出する。図7の例では、学習部133は、検索クエリ「パソコン」、「値段」の検索回数を、和集合E4に属するユーザの特徴情報として抽出する。
【0073】
続いて、選択部132は、正解ユーザC1の集合E1と補助ユーザA2の集合E3の和集合E4に属するユーザの特徴情報との類似性に基づいて、ユーザ情報に含まれる複数のユーザのうちから、正解ユーザC1、補助ユーザA2と異なるユーザを、類似ユーザR1として選択する。図7の例では、選択部132は、検索クエリ「パソコン」、「値段」の検索回数に基づいて、検索履歴情報記憶部122に記憶されている検索履歴情報に含まれるユーザのうちから、正解ユーザC1、補助ユーザA2と異なるユーザを、類似ユーザR1として選択する。図7では、例示を目的として、選択された複数の類似ユーザを、複数の類似ユーザR1の集合E5として示している。
【0074】
その後、学習部133は、和集合E4に属するユーザの特徴情報と選択部132によって選択された類似ユーザR1のユーザ情報との間の類似性に基づいて、類似ユーザR1ごとの類似性スコアを算出する。図7の例では、学習部133は、類似ユーザR1の検索クエリ「パソコン」、「値段」の検索回数を説明変数とし、当該類似ユーザR1がパソコンを購入する確率を目的変数とする予測モデルM3の出力値に基づいて、類似ユーザR1ごとの類似性スコアを算出する。
【0075】
〔5-2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0076】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0077】
例えば、図3に示したユーザ情報記憶部120の一部又は全部は、学習装置100によって保持されるのではなく、ストレージサーバ等に保持されてもよい。この場合、学習装置100は、ストレージサーバにアクセスすることで、購入履歴情報や検索履歴情報等の各種情報を取得する。
【0078】
〔5-3.ハードウェア構成〕
また、上述してきた実施形態に係る提供装置100は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0079】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一時的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
【0080】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
【0081】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0082】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0083】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0084】
例えば、コンピュータ1000が学習装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムまたはデータ(例えば、予測モデル)を実行することにより、制御部130の機能を実現する。
【0085】
〔6.効果〕
上述してきたように、実施形態に係る学習装置100は、選択部132と、学習部133とを有する。選択部132は、第1行動(例えば、特定の行動)を行った第1ユーザ(例えば、正解ユーザ)の第1ユーザ情報との類似性に基づいて、当該第1ユーザと異なる第2ユーザ(例えば、補助ユーザ)を選択する。学習部133は、選択部132によって選択された第2ユーザが第1行動を行ったものとした場合の当該第2ユーザの第2ユーザ情報と、第1ユーザ情報とを用いて、第1行動の予測モデルを学習する。
【0086】
これにより、学習装置は、第1ユーザのユーザ情報の量が不十分である場合でも、第1ユーザのユーザ情報に加えて、第1ユーザのユーザ情報との類似性に基づいて選択された第2ユーザのユーザ情報を用いて、第1ユーザの行動についての精度の高い予測モデルを学習することができる。この結果、学習装置100は、特定のユーザのユーザ情報の量が不十分である場合でも、特定のユーザと行動が類似する類似ユーザを特定することができる。
【0087】
また、実施形態に係る学習装置100において、選択部132は、第1ユーザ情報である第1行動と類似する第2行動を行った第2ユーザを選択する。
【0088】
これにより、学習装置100は、第1ユーザと行動傾向が類似する第2ユーザのユーザ情報を用いて、第1ユーザの行動についての精度の高い予測モデルを学習することができる。この結果、学習装置100は、特定のユーザのユーザ情報の量が不十分である場合でも、特定のユーザと行動が類似する類似ユーザを特定することができる。
【0089】
また、実施形態に係る学習装置100において、学習部133は、第1ユーザ情報に第1の重みを割り当てるともに、選択部132によって選択された第2ユーザが第1行動を行ったものとした場合の第2ユーザの第2ユーザ情報に、当該第1の重みよりも小さい第2の重みを割り当て、予測モデルを学習する。
【0090】
これにより、学習装置100は、第2の重みを用いて、第2ユーザの第2ユーザ情報が予測モデルの学習に与える影響を、第1ユーザの行動についての予測モデルの学習に適合するように補正することができる。この結果、学習装置100は、特定のユーザのユーザ情報の量が不十分である場合でも、特定のユーザと行動が類似する類似ユーザを特定することができる。
【0091】
また、実施形態に係る学習装置100において、選択部132は、第1ユーザ情報に基づく第1ユーザの特徴に関連する当該第1ユーザ情報との類似性に基づいて、第2ユーザを選択する。
【0092】
これにより、学習装置100は、第1ユーザと特徴が類似する第2ユーザのユーザ情報を用いて、第1ユーザの行動についての予測モデルを学習することができる。この結果、学習装置100は、特定のユーザと行動が類似する類似ユーザを特定することができる。
【0093】
また、実施形態に係る学習装置100において、学習部133は、第1ユーザ情報に第1の重みを割り当てるともに、第1ユーザ情報に基づく第1ユーザの特徴に関連する第1ユーザ情報と第2ユーザ情報との間の類似性に基づいて、選択部132によって選択された第2ユーザが第1行動を行ったものとした場合の第2ユーザの第2ユーザ情報に、第2の重みを割り当て、予測モデルを学習する。
【0094】
これにより、学習装置100は、第2ユーザの第2ユーザ情報が予測モデルの学習に与える影響を、予測モデルの精度を向上させるように決定することができる。この結果、学習装置100は、特定のユーザと行動が類似する類似ユーザを特定することができる。
【0095】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0096】
また、上述した学習装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
【0097】
また、特許請求の範囲に記載した「手段」は、「部(section、module、unit)」や「回路」などに読み替えることができる。例えば、取得手段は、取得部や取得回路に読み替えることができる。
【符号の説明】
【0098】
1 ネットワークシステム
10 端末装置
20 情報提供装置
100 学習装置
121 購入履歴情報記憶部
122 検索履歴情報記憶部
123 予測モデル情報記憶部
131 受信部
132 選択部
133 学習部
134 提供部
図1
図2
図3
図4
図5
図6
図7
図8