IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許7561178学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム
<>
  • 特許-学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム 図1
  • 特許-学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム 図2
  • 特許-学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム 図3
  • 特許-学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム 図4
  • 特許-学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム 図5
  • 特許-学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム 図6
  • 特許-学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム 図7
  • 特許-学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム 図8
  • 特許-学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム 図9
  • 特許-学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム 図10
  • 特許-学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-25
(45)【発行日】2024-10-03
(54)【発明の名称】学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラム
(51)【国際特許分類】
   G06F 16/9535 20190101AFI20240926BHJP
   G06Q 30/0601 20230101ALI20240926BHJP
【FI】
G06F16/9535
G06Q30/0601 330
【請求項の数】 13
(21)【出願番号】P 2022209348
(22)【出願日】2022-12-27
(65)【公開番号】P2024093154
(43)【公開日】2024-07-09
【審査請求日】2023-01-19
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(74)【代理人】
【識別番号】100181124
【弁理士】
【氏名又は名称】沖田 壮男
(74)【代理人】
【識別番号】100194087
【弁理士】
【氏名又は名称】渡辺 伸一
(72)【発明者】
【氏名】藤野 拓海
(72)【発明者】
【氏名】武田 悠佑
(72)【発明者】
【氏名】積田 大介
(72)【発明者】
【氏名】吉井 和輝
(72)【発明者】
【氏名】山本 康生
【審査官】原 秀人
(56)【参考文献】
【文献】米国特許出願公開第2022/0245926(US,A1)
【文献】米国特許出願公開第2020/0043508(US,A1)
【文献】特表2020-536337(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06Q 30/0601
(57)【特許請求の範囲】
【請求項1】
ウェブサービスにおいてコンテンツとして提供されるアイテム群の各アイテムについて他のアイテムとの関連性を学習する装置であって、
学習対象アイテムについて、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示す教師データと、前記学習対象アイテムのアイテム属性とを用いて距離学習(Metric Learning)を行う学習部を備え、
前記学習部は、
所定のベクトル空間において、着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるように前記アイテム群のベクトル空間を学習するものであり、
学習対象アイテムのアイテム属性と前記教師データとに基づいて第1ベクトル空間を学習する第1学習部と、
前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して前記正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づいて第2ベクトル空間を学習する第2学習部と、
を備え、
前記着目アイテムのベクトルは、前記第1ベクトル空間における前記着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとを結合したものであり、
前記ポジティブリストは、前記学習対象アイテムに対するスコアが上位の第1アイテムのうち、前記第1アイテムに対する前記スコアが上位の第2アイテムに前記学習対象アイテムを含むアイテムを示すデータであり、
前記スコアは、着目アイテムの他のアイテムについて、前記着目アイテムとの親和性を示すスコアである、
学習装置。
【請求項2】
ウェブサービスにおいてコンテンツとして提供されるアイテム群の各アイテムについて他のアイテムとの関連性を学習する装置であって、
学習対象アイテムについて、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示す教師データと、前記学習対象アイテムのアイテム属性とを用いて距離学習(Metric Learning)を行う学習部を備え、
前記学習部は、所定のベクトル空間において、着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるように前記アイテム群のベクトル空間を学習するものであり、
前記学習部は、自己注意(Self-Attention)機構による高次の交互作用によって前記アイテム属性の入力素性を実質的に増加させて前記距離学習を行う、
学習装置。
【請求項3】
学習対象アイテムのアイテム属性と教師データとに基づく距離学習(Metric Learning)により学習された第1ベクトル空間と、前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づく距離学習により学習された第2ベクトル空間とを記憶する記憶部と、
前記第1ベクトル空間における着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとに基づいて前記着目アイテムに対してレコメンドするアイテムを決定するレコメンド決定部と、
を備え、
前記教師データは、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された前記正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示すデータであり、
前記距離学習は、
アイテム属性に基づくベクトル空間において、前記着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるようにウェブサービスにおいてコンテンツとして提供されるアイテム群のベクトル空間を学習するものであり、
学習対象アイテムのアイテム属性と前記教師データとに基づいて第1ベクトル空間を学習する第1学習と、
前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して前記正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づいて第2ベクトル空間を学習する第2学習と、
を含み、
前記着目アイテムのベクトルは、前記第1ベクトル空間における前記着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとを結合したものであり、
前記ポジティブリストは、前記学習対象アイテムに対するスコアが上位の第1アイテムのうち、前記第1アイテムに対する前記スコアが上位の第2アイテムに前記学習対象アイテムを含むアイテムを示すデータであり、
前記スコアは、着目アイテムの他のアイテムについて、前記着目アイテムとの親和性を示すスコアである、
情報処理装置。
【請求項4】
学習対象アイテムのアイテム属性と教師データとに基づく距離学習(Metric Learning)により学習された第1ベクトル空間と、前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づく距離学習により学習された第2ベクトル空間とを記憶する記憶部と、
前記第1ベクトル空間における着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとに基づいて前記着目アイテムに対してレコメンドするアイテムを決定するレコメンド決定部と、
を備え、
前記教師データは、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された前記正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示すデータであり、
前記距離学習は、アイテム属性に基づくベクトル空間において、前記着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるようにウェブサービスにおいてコンテンツとして提供されるアイテム群のベクトル空間を学習するものであり、
自己注意(Self-Attention)機構による高次の交互作用によって前記アイテム属性の入力素性を実質的に増加させて前記距離学習を行う、
情報処理装置。
【請求項5】
前記レコメンド決定部は、前記着目アイテムおよび他のアイテムについて、前記第1ベクトルと前記第2ベクトルとを結合した第3ベクトルを求め、前記第3ベクトル同士のコサイン類似度に基づいて前記他のアイテムを前記着目アイテムに対してレコメンドするか否かを判定する、
請求項3または4に記載の情報処理装置。
【請求項6】
コンピュータが、ウェブサービスにおいてコンテンツとして提供されるアイテム群の各アイテムについて他のアイテムとの関連性を学習する方法であって、
前記コンピュータが、
学習対象アイテムについて、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示す教師データと、前記学習対象アイテムのアイテム属性とを用いて距離学習(Metric Learning)を行うものであり、
前記距離学習は、
アイテム属性に基づくベクトル空間において、着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるように前記アイテム群のベクトル空間を学習するものであり、
学習対象アイテムのアイテム属性と前記教師データとに基づいて第1ベクトル空間を学習する第1学習と、
前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して前記正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づいて第2ベクトル空間を学習する第2学習と、
を含み、
前記着目アイテムのベクトルは、前記第1ベクトル空間における前記着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとを結合したものであり、
前記ポジティブリストは、前記学習対象アイテムに対するスコアが上位の第1アイテムのうち、前記第1アイテムに対する前記スコアが上位の第2アイテムに前記学習対象アイテムを含むアイテムを示すデータであり、
前記スコアは、着目アイテムの他のアイテムについて、前記着目アイテムとの親和性を示すスコアである、
学習方法。
【請求項7】
コンピュータが、ウェブサービスにおいてコンテンツとして提供されるアイテム群の各アイテムについて他のアイテムとの関連性を学習する方法であって、
前記コンピュータが、
学習対象アイテムについて、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示す教師データと、前記学習対象アイテムのアイテム属性とを用いて距離学習(Metric Learning)を行うものであり、
前記距離学習は、アイテム属性に基づくベクトル空間において、着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるように前記アイテム群のベクトル空間を学習するものであり、
自己注意(Self-Attention)機構による高次の交互作用によって前記アイテム属性の入力素性を実質的に増加させて前記距離学習を行う、
学習方法。
【請求項8】
学習対象アイテムのアイテム属性と教師データとに基づく距離学習(Metric Learning)により学習された第1ベクトル空間と、前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づく距離学習により学習された第2ベクトル空間とを記憶する記憶部を備えたコンピュータが、
前記第1ベクトル空間における着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとに基づいて前記着目アイテムに対してレコメンドするアイテムを決定するものであり、
前記教師データは、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された前記正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示すデータであり、
前記距離学習は、
アイテム属性に基づくベクトル空間において、前記着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるようにウェブサービスにおいてコンテンツとして提供されるアイテム群のベクトル空間を学習するものであり、
学習対象アイテムのアイテム属性と前記教師データとに基づいて第1ベクトル空間を学習する第1学習と、
前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して前記正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づいて第2ベクトル空間を学習する第2学習と、
を含み、
前記着目アイテムのベクトルは、前記第1ベクトル空間における前記着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとを結合したものであり、
前記ポジティブリストは、前記学習対象アイテムに対するスコアが上位の第1アイテムのうち、前記第1アイテムに対する前記スコアが上位の第2アイテムに前記学習対象アイテムを含むアイテムを示すデータであり、
前記スコアは、着目アイテムの他のアイテムについて、前記着目アイテムとの親和性を示すスコアである、
レコメンド決定方法。
【請求項9】
学習対象アイテムのアイテム属性と教師データとに基づく距離学習(Metric Learning)により学習された第1ベクトル空間と、前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づく距離学習により学習された第2ベクトル空間とを記憶する記憶部を備えたコンピュータが、
前記第1ベクトル空間における着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとに基づいて前記着目アイテムに対してレコメンドするアイテムを決定するものであり、
前記教師データは、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された前記正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示すデータであり、
前記距離学習は、アイテム属性に基づくベクトル空間において、前記着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるようにウェブサービスにおいてコンテンツとして提供されるアイテム群のベクトル空間を学習するものであり、
自己注意(Self-Attention)機構による高次の交互作用によって前記アイテム属性の入力素性を実質的に増加させて前記距離学習を行う、
レコメンド決定方法。
【請求項10】
コンピュータに、ウェブサービスにおいてコンテンツとして提供されるアイテム群の各アイテムについて他のアイテムとの関連性を学習させるためのプログラムであって、
前記コンピュータに、
学習対象アイテムについて、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示す教師データと、前記学習対象アイテムのアイテム属性とを用いて距離学習(Metric Learning)を行わせるためのプログラムであり、
前記距離学習は、
アイテム属性に基づくベクトル空間において、着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるように前記アイテム群のベクトル空間を学習するものであり、
学習対象アイテムのアイテム属性と前記教師データとに基づいて第1ベクトル空間を学習する第1学習と、
前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して前記正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づいて第2ベクトル空間を学習する第2学習と、
を含み、
前記着目アイテムのベクトルは、前記第1ベクトル空間における前記着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとを結合したものであり、
前記ポジティブリストは、前記学習対象アイテムに対するスコアが上位の第1アイテムのうち、前記第1アイテムに対する前記スコアが上位の第2アイテムに前記学習対象アイテムを含むアイテムを示すデータであり、
前記スコアは、着目アイテムの他のアイテムについて、前記着目アイテムとの親和性を示すスコアである、
プログラム。
【請求項11】
コンピュータに、ウェブサービスにおいてコンテンツとして提供されるアイテム群の各アイテムについて他のアイテムとの関連性を学習させるためのプログラムであって、
前記コンピュータに、
学習対象アイテムについて、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示す教師データと、前記学習対象アイテムのアイテム属性とを用いて距離学習(Metric Learning)を行わせるためのプログラムであり、
前記距離学習は、アイテム属性に基づくベクトル空間において、着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるように前記アイテム群のベクトル空間を学習するものであり、
自己注意(Self-Attention)機構による高次の交互作用によって前記アイテム属性の入力素性を実質的に増加させて前記距離学習を行わせる、
プログラム。
【請求項12】
学習対象アイテムのアイテム属性と教師データとに基づく距離学習(Metric Learning)により学習された第1ベクトル空間と、前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づく距離学習により学習された第2ベクトル空間とを記憶する記憶部を備えたコンピュータに、
前記第1ベクトル空間における着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとに基づいて前記着目アイテムに対してレコメンドするアイテムを決定させるためのプログラムであり、
前記教師データは、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された前記正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示すデータであり、
前記距離学習は、
アイテム属性に基づくベクトル空間において、前記着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるようにウェブサービスにおいてコンテンツとして提供されるアイテム群のベクトル空間を学習するものであり、
学習対象アイテムのアイテム属性と前記教師データとに基づいて第1ベクトル空間を学習する第1学習と、
前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して前記正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づいて第2ベクトル空間を学習する第2学習と、
を含み、
前記着目アイテムのベクトルは、前記第1ベクトル空間における前記着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとを結合したものであり、
前記ポジティブリストは、前記学習対象アイテムに対するスコアが上位の第1アイテムのうち、前記第1アイテムに対する前記スコアが上位の第2アイテムに前記学習対象アイテムを含むアイテムを示すデータであり、
前記スコアは、着目アイテムの他のアイテムについて、前記着目アイテムとの親和性を示すスコアである、
プログラム。
【請求項13】
学習対象アイテムのアイテム属性と教師データとに基づく距離学習(Metric Learning)により学習された第1ベクトル空間と、前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づく距離学習により学習された第2ベクトル空間とを記憶する記憶部を備えたコンピュータに、
前記第1ベクトル空間における着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとに基づいて前記着目アイテムに対してレコメンドするアイテムを決定させるためのプログラムであり、
前記教師データは、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された前記正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示すデータであり、
前記距離学習は、アイテム属性に基づくベクトル空間において、前記着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるようにウェブサービスにおいてコンテンツとして提供されるアイテム群のベクトル空間を学習するものであり、
自己注意(Self-Attention)機構による高次の交互作用によって前記アイテム属性の入力素性を実質的に増加させて前記距離学習を行わせる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラムに関する。
【背景技術】
【0002】
従来、PCやスマートフォンなどの情報処理端末に対する商材等のコンテンツ配信において、利用者の閲覧履歴に基づいておススメのコンテンツ(以下「レコメンド」ともいう。)を配信することが行われている。このような分野では、おススメのコンテンツを決定するために、テキストデータの集合から関連データを抽出する技術が用いられる場合がある。例えば、特許文献1には、トピックモデルを用いたデータ抽出方法が提案されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特許第5542732号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、利用者へのレコメンドにアダルトコンテンツなど不適切な商材が露出してしまう場合があった。
【0005】
本発明は、このような事情を考慮してなされたものであり、利用者に対してより適切なレコメンドを提供することが可能な学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラムを提供することを目的の一つとする。
【課題を解決するための手段】
【0006】
本発明の一態様は、ウェブサービスにおいてコンテンツとして提供されるアイテム群の各アイテムについて他のアイテムとの関連性を学習する装置であって、学習対象アイテムについて、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示す教師データと、前記学習対象アイテムのアイテム属性とを用いて距離学習(Metric Learning)を行う学習部を備え、前記学習部は、所定のベクトル空間において、着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるように前記アイテム群のベクトル空間を学習するものである。
【0007】
本発明の一態様は、学習対象アイテムのアイテム属性と教師データとに基づく距離学習(Metric Learning)により学習された第1ベクトル空間と、前記学習対象アイテムのアイテム属性、および、前記学習対象アイテムに対して正例アイテムとして実際に選択されたアイテムを示すポジティブリストと、前記教師データとに基づく距離学習により学習された第2ベクトル空間とを記憶する記憶部と、前記第1ベクトル空間における着目アイテムのベクトルである第1ベクトルと、前記第2ベクトル空間における前記着目アイテムのベクトルである第2ベクトルとに基づいて前記着目アイテムに対してレコメンドするアイテムを決定するレコメンド決定部と、を備える情報処理装置であって、前記教師データは、前記学習対象アイテムの選択に続く所定の選択数の範囲内で選択された前記正例アイテムと、前記範囲内で選択されなかった負例アイテムとを示すデータであり、前記距離学習は、所定のベクトル空間において、前記着目アイテムのベクトルと前記正例アイテムのベクトルとの距離が近く、且つ、前記着目アイテムのベクトルと前記負例アイテムのベクトルとの距離が遠くなるようにウェブサービスにおいてコンテンツとして提供されるアイテム群のベクトル空間を学習するものである。
【発明の効果】
【0008】
本発明の一態様によれば、利用者に対してより適切なレコメンドを提供することが可能な学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラムを提供することができる。
【図面の簡単な説明】
【0009】
図1】実施形態の情報処理システム1のシステム構成の一例を示す図である。
図2】学習装置100の構成の一例を示す図である。
図3】情報処理装置200の構成の一例を示す図である。
図4】第1学習処理の流れの一例を示す図である。
図5】第1学習処理の概要を示す図である。
図6】距離学習の概要を示す図である。
図7】第2学習処理の流れの一例を示す図である。
図8】ポジティブリストの概要を示す図である。
図9】第2学習処理の概要を示す図である。
図10】レコメンド決定処理の流れの一例を示す図である。
図11】レコメンド決定処理の概要を示す図である。
【発明を実施するための形態】
【0010】
[概要]
以下、図面を参照し、本発明の学習装置、学習方法、情報処理装置、レコメンド決定方法、およびプログラムの実施形態について説明する。学習装置および情報処理装置は、一以上のプロセッサにより実現される。学習装置および情報処理装置は、クラウドサービスを提供する装置であってもよいし、ツールやファームウェアなどのプログラムがインストールされ、単体で処理を実行可能な装置であってもよい。学習装置は、インターネットやWANなどのネットワークに接続されていてもよいし、接続されていなくてもよい。すなわち、学習装置および情報処理装置を実現するためのコンピュータ装置について特段の制約は存在せず、以下に説明する処理を実行可能なものであれば、如何なるコンピュータ装置によって学習装置および情報処理装置が実現されてもよい。
【0011】
[構成]
図1は、本実施形態の情報処理システム1のシステム構成の一例を示す図である。情報処理システム1は、利用者に所定のアイテム群に関するコンテンツを提供するシステムである。アイテム群は、同じ種類に分類されるアイテムの集合であれば特定のものに限定されないが、本実施形態では、アイテム群が書籍の集合である場合について説明する。この場合、情報処理システム1は、アイテム群に含まれる書籍に関する情報をコンテンツとして利用者に提供するものとする。この場合の情報処理システム1は、例えば、書籍の販売システムであってもよいし、書籍の閲覧システムであってもよい。ここで、情報処理システム1は、アイテム群に含まれる書籍の一覧を利用者に提供するとともに、提供した一覧の中から利用者が所望する書籍の選択を受け付け、選択された書籍に関するコンテンツを利用者に提供することができるものとする。利用者に提供される書籍の一覧は、アイテム群に含まれる全ての書籍の一覧であってもよいし、種々の観点で分類された書籍の一覧であってもよい。さらに、情報処理システム1は、利用者によりいずれかの書籍が選択されたことに応じて、選択された書籍に関連するおススメの書籍(以下「レコメンド」ともいう。)を選定して利用者に提示する機能を有するものとする。
【0012】
情報処理システム1は、例えば、学習装置100と、情報処理装置200と、利用者端末装置300と、を備える。学習装置100は、機械学習によりアイテム群に含まれる各書籍の関連性を学習する装置である。学習装置100は、上記関連性の学習結果として、所定のベクトル空間において、着目書籍のベクトルと正例書籍のベクトルとの距離が近く、且つ、着目書籍のベクトルと負例書籍のベクトルとの距離が遠くなるように学習されたアイテム群のベクトル空間を生成する。正例書籍および負例書籍については後述する。なお、正例書籍は「正例アイテム」の一例であり、負例書籍は「負例アイテム」の一例である。
【0013】
情報処理装置200は、アイテム群に含まれる書籍に関するコンテンツを利用者に提供する。コンテンツの提供に関し、情報処理装置200は、上述の書籍の一覧を利用者に提供するとともに、一覧から書籍の選択を受け付ける。情報処理装置200は、選択された書籍についてレコメンドする書籍を選定して利用者に提示する。情報処理装置200は、学習装置100による上記関連性の学習結果に基づいて、利用者にレコメンドする書籍をアイテム群の中から選定する。
【0014】
利用者端末装置300は、利用者が情報処理装置200から上記コンテンツの提供サービスを受ける際に使用する情報処理端末である。例えば、利用者端末装置300は、PCやスマートフォン、タブレットなどの通信端末である。利用者端末装置300は、情報処理装置200から書籍の一覧を取得して表示するとともに、一覧の中からいずれかの書籍を選択する操作を受け付け、選択された書籍を情報処理装置200に通知する。利用者端末装置300は、通知した書籍に関する情報とともに、当該書籍についてレコメンドされた書籍の一覧を情報処理装置200から取得して表示する。
【0015】
学習装置100と、情報処理装置200と、利用者端末装置300とは、通信ネットワークNWを介して互いに通信可能である。通信ネットワークNWは、例えば、インターネット、移動体通信ネットワーク、LAN(Local Area Network)及びWAN(Wide Area Network)等である。また、例えば、LANは、Ethernet等の所定規格の有線LAN(Local Area Network)又はWi-Fi及びBluetooth(登録商標)等の各種規格の無線LANであってもよい。通信ネットワークNWは、有線通信の伝送路であってもよく、無線通信の伝送路であってもよく、無線通信の伝送路および有線通信の伝送路の組み合わせであってもよい。
【0016】
図2は、学習装置100の構成の一例を示す図である。学習装置100は、例えば、通信部110と、スコア算出部120と、第1学習部130と、第2学習部140と、記憶部150と、を備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
【0017】
通信部110は、学習装置100を通信ネットワークNWに接続する通信インタフェースである。学習装置100は、通信部110を介して情報処理装置200および利用者端末装置300と通信可能である。
【0018】
スコア算出部120は、2つの書籍の間の親和性を示す指標値(以下「スコア」という。)を算出する。例えば、第1の書籍Sと、書籍Sの後に選択される第2の書籍Tとのスコアはおよそ次の式(1)で計算される。
【0019】
スコア=(第1の書籍Sの後で第2の書籍Tが選択された数)÷(第2の書籍Tの人気度) ・・・(1)
【0020】
(1)式の右辺第2項における「第2の書籍Tの人気度」は、書籍の人気度を定量的または定性的に示し得るものであればよく、特定の方法で計算されるものに限定されない。また、スコアは、所定の下限値から上限値までの間の値をとるように正規化されてもよい。スコアは、第1の書籍Sを選択した利用者に対して第2の書籍Tをレコメンドするか否かの判断指標として用いられてもよい。
【0021】
第1学習部130は、アイテム群に含まれる学習対象の書籍について、他の書籍との関連性を機械学習の手法により学習する。第1学習部130は、利用者による書籍の選択において、学習対象書籍の直後に選択された書籍(以下「正例書籍」という。)を学習対象書籍との関連性が高い書籍として学習し、学習対象書籍の直後に選択されなかった書籍(以下「負例」という。)を学習対象書籍との関連性が低い書籍として学習する。なお、ここでいう「直後」の書籍とは、学習対象書籍の次に選択された書籍であってもよいし、学習対象書籍の次を1番目として所定数番目までに選択された書籍であってもよい。所定数は、学習対象書籍と類似性が高い範囲の想定に基づいて適宜設計されてよい。また、「直後」は、上記のような順番の近接性に加え、選択タイミングの近接性を含む概念であってもよい。例えば、「直後」の書籍は、学習対象書籍の選択後の所定数番目までに選択された書籍であり、且つ、学習対象書籍の選択タイミングから所定時間内に選択された書籍であってもよい。
【0022】
例えば、第1学習部130は、このような関連性の高さを所定のベクトル空間におけるベクトル間の距離として学習する距離学習(Metric Learning)の手法により、書籍間の関連性を学習する。より具体的には、第1学習部130は、学習対象書籍について正例書籍および負例書籍を示すデータと、学習対象書籍、正例書籍および負例書籍のアイテム属性とに基づいて書籍間の関連性を学習する。ここで、学習対象書籍の正例書籍および負例書籍を示すデータは教師データとして第1学習部130に与えられる。第1学習部130は、このような関係性の学習結果として、アイテム群に含まれる各書籍の上記ベクトル空間における座標(すなわちベクトル)を示す第1ベクトル空間情報を生成する。
【0023】
第2学習部140は、第1学習部130と同様に、アイテム群に含まれる学習対象の書籍について、他の書籍との関連性を機械学習の手法により学習する。第2学習部140は、距離学習によって上記関連性を学習する点で第1学習部130と共通するものの、書籍の類似性に関して書籍の選択実績がより強く影響するように学習を行う点で第1学習部130と異なる。より具体的には、第2学習部140は、上記の教師データおよびアイテム属性に加え、学習対象書籍に関するポジティブリストに基づいて書籍間の関連性を学習する。ポジティブリストは、学習結果に書籍の選択実績をより強く反映させるためのデータであり、上述のスコアに基づいて生成される。ポジティブリストの詳細は後述する。第2学習部140は、このような関係性の学習結果として、アイテム群に含まれる各書籍の上記ベクトル空間における座標(すなわちベクトル)を示す第2ベクトル空間情報を生成する。
【0024】
記憶部150は、HDDやフラッシュメモリ、RAM(Random Access Memory)などの記憶装置により実現される。記憶部150には、例えば、第1学習モデル151と、第2学習モデル152と、教師データ153と、アイテム情報154と、第1ベクトル空間情報M1と、第2ベクトル空間情報M2と、が記憶される。第1学習モデル151は、第1学習部130が書籍間の関連性を学習する際に使用する距離学習モデルである。第2学習モデル152は、第2学習部140が書籍間の関連性を学習する際に使用する距離学習モデルである。
【0025】
教師データ153は、学習対象書籍について正例書籍または/および負例書籍を示すデータである。教師データ153は、人手によって作成されたものであってもよいし、利用者による書籍選択の履歴情報をもとに機械的に作成されたものであってもよい。アイテム情報154は、学習対象書籍、正例書籍、および負例書籍に関する情報であり、それぞれのアイテム属性を含む。第1ベクトル空間情報M1は、第1学習部130が、第1学習モデル151により書籍間の関連性を学習した結果を示す情報である。第2ベクトル空間情報M2は、第2学習部140が、第2学習モデル152により書籍間の関連性を学習した結果を示す情報である。
【0026】
図3は、情報処理装置200の構成の一例を示す図である。情報処理装置200は、例えば、通信部210と、コンテンツ配信部220と、レコメンド決定部240と、記憶部250と、を備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
【0027】
通信部210は、情報処理装置200を通信ネットワークNWに接続する通信インタフェースである。情報処理装置200は、通信部210を介して学習装置100および利用者端末装置300と通信可能である。
【0028】
コンテンツ配信部220は、利用者に対してアイテム群の書籍に関するコンテンツを提供する。コンテンツ配信部220は、利用者端末装置300からの要求に応じて、利用者が指定した書籍に関するコンテンツの配信データを生成して利用者端末装置300に送信する。例えば、コンテンツ配信部220は、記憶部250に格納されているコンテンツ情報251(後述)に基づいて配信データを作成する。コンテンツ情報251は、コンテンツの配信データを生成するのに必要な各種情報が含まれる。例えば、コンテンツ情報251には、アイテム群に関するアイテム情報や画像データなどが含まれる。コンテンツ情報251は、コンテンツの配信に先立って予め記憶部250に格納されているものである。
【0029】
レコメンド決定部240は、第1ベクトル空間情報M1および第2ベクトル空間情報M2をもとに、着目書籍を選択中(閲覧中)の利用者に対してレコメンドする書籍を決定する。具体的には、レコメンド決定部240は、着目書籍と他の書籍のそれぞれについて、第1ベクトル空間情報M1に基づく第1ベクトルと、第2ベクトル空間情報M2に基づく第2ベクトルとを認識し、第1ベクトルと第2ベクトルとを結合して第3ベクトルを生成する。レコメンド決定部240は、着目書籍の第3ベクトルと、他の書籍の第3ベクトルとの間のコサイン類似度を計算し、算出したコサイン類似度が所定値以上である他の書籍を着目書籍に対するレコメンドとして決定する。なお、着目書籍は「着目アイテム」の一例である。
【0030】
記憶部250は、HDDやフラッシュメモリ、RAM(Random Access Memory)などの記憶装置により実現される。記憶部250には、例えば、第1ベクトル空間情報M1と、第2ベクトル空間情報M2と、コンテンツ情報251と、閲覧履歴情報252と、が記憶される。第1ベクトル空間情報M1および第2ベクトル空間情報M2は、学習装置100から供給される。第1ベクトル空間情報M1および第2ベクトル空間情報M2は、学習装置100と情報処理装置200との間で、通信によって送受信されてもよいし、取り外し可能な記憶媒体を介して受け渡されてもよい。
【0031】
閲覧履歴情報252は、利用者による書籍の閲覧履歴(選択履歴)を示す情報である。閲覧履歴情報252は、例えば、利用者IDに、利用者が閲覧した書籍の書籍ID、閲覧時刻、書籍IDに係る書籍の直後に利用者が閲覧した書籍の書籍IDなどが対応付けられた情報である。閲覧履歴情報252は、コンテンツの配信状況(書籍の閲覧状況)に応じて適宜更新されるものとする。例えば、閲覧履歴情報252は、コンテンツ配信部220によって更新されてもよい。
【0032】
図4は、学習装置100が第1ベクトル空間情報M1を生成する処理(以下「第1学習処理」という。)の流れの一例を示す図である。まず、第1学習部130が、アイテム情報154をもとに、第1学習処理向けに用意された教師データに含まれる各書籍についてアイテム属性を示す属性データを生成する(ステップS101)。続いて、第1学習部130は、ステップS101で生成した属性データと教師データとに基づいて距離学習を行うことにより、与えられた書籍間の関連性を学習する(ステップS102)。第1学習部130は、学習結果として第1ベクトル空間情報M1を生成して記憶部150に保存する(ステップS103)。
【0033】
図5は、第1学習処理の概要を示す図である。図5の例の第1学習処理L1は、「タイトル」、「著者」、「出版社」、「大ジャンル」、「中ジャンル」を含むアイテム属性R1を入力として、アイテム群のベクトル空間における着目書籍のベクトルを出力するものである。出力するベクトルの次元数は特定のものに限定されないが、例えば128である。第1学習処理L1は、例えば、図5に示されるように、深層ニューラルネットワークの全結合層A1に2層の自己注意機構(図中の“Self-attention×2”)A2を組み込んだ構成によって実現される。なお、第1学習処理L1の構成は、距離学習に十分な複雑度を実現できるものであれば図5の構成に限定されない。すなわち、第1学習処理L1の構成は、2層の自己注意機構に全結合層を接続した構成に限定されず、また、使用されるニューラルネットワークも自己注意機構や深層ニューラルネットワークに限定されない。例えば図5の例において、距離学習に十分な複雑度を実現できる場合には自己注意機構A2が省略されてもよいし、距離学習に十分な複雑度を実現するために自己注意機構A2が他のニューラルネットワークに置き換えられてもよい。このような構成をとることにより、第1学習処理L1において、著者、出版社、ジャンルが同じであっても、自己注意機構A2により高次の交互作用を考慮して入力素性を実質的に増やし、より精度良く書籍間の関連性を学習することができる。
【0034】
図6は、距離学習の概要を示す図である。距離学習は、類似する(特徴が似ている)アイテムのベクトル同士が近くなり、類似しないアイテムのベクトル同士が遠くなるようにアイテム群のベクトルを学習する手法である。距離学習では、類似するアイテム同士での距離が類似しないアイテム同士での距離よりも大きい場合に損失(ペナルティ)を発生させ、類似しないアイテム同士での距離が類似するアイテム同士の距離よりも十分に大きい場合に損失を発生させないようにアイテム群についてベクトルが学習される。損失の一例として(2)式のTriplet-Lossが挙げられる。
【0035】
Triplet-Loss=max{D(VA,VP)-D(VA,VN)
+margin,0} ・・・(2)
【0036】
(2)式において、D(VA,VP)は、書籍AのベクトルVAと書籍PのベクトルVPとの間の距離(以下「第1距離」という。)を表し、D(VA,VN)は、書籍AのベクトルVAと書籍NのベクトルVNとの間の距離(以下「第2距離」という。)を表す。ここで、書籍Pおよび書籍Nは、書籍Aについて教師データとして与えられる書籍である。書籍Pは、書籍Aについて類似の書籍として与えられるものであり、書籍Nは、書籍Aについて非類似の書籍として与えられるものである。本実施形態では、書籍Aの直後に閲覧された(選択された)書籍は書籍Aに類似する書籍であるとの想定のもと、書籍Aの直後に閲覧された書籍を書籍Pとして与える。これとは逆に、書籍Aの直後に閲覧されなかった(選択されなかった)書籍は書籍Aに類似しない書籍であるとの想定のもと、書籍Aの直後に閲覧されなかった書籍を書籍Nとして与える。すなわち、この場合の教師データは、書籍Pを書籍Aに対する正例として与え、書籍Nを書籍Aに対する負例として与えるものである。
【0037】
このような損失を定義して距離学習を行うことにより、第1学習部130は、第1距離と第2距離との差がmargin以上となるように書籍のベクトルを学習することができる。すなわち、第1学習部130は、学習対象の書籍の直後に選択された書籍が学習対象書籍に近く、また、学習対象の書籍の直後に選択されなかった書籍が学習対象書籍から遠くなるように学習対象書籍のベクトルを学習するものである。なお、第1学習部130は、学習データに含まれる書籍のうち、第1距離と第2距離との差がmargin以上であるものについては学習を省略するように構成されてもよい。また、本実施形態の距離学習では、書籍のアイテム属性を入力として当該書籍のベクトルを出力する関係性を学習しているので、アイテム属性が類似する書籍同士が近くなるようにベクトルが学習される。
【0038】
図7は、学習装置100が第2ベクトル空間情報M2を生成する処理(以下「第2学習処理」という。)の流れの一例を示す図である。まず、第2学習部140が、アイテム情報154をもとに、第2学習処理向けに用意された教師データに含まれる各書籍についてアイテム属性を示す属性データを生成する(ステップS201)。この処理は、図4で説明したステップS101と同じ処理であるので、第1学習処理と共通化されてもよい。なお、教師データは、第1学習処理と第2学習処理とで同じものが使用されてもよいし、それぞれに異なる教師データが用意されてもよい。
【0039】
続いて、第2学習部140は、学習対象書籍についてポジティブリストを作成する(ステップS202)。ポジティブリストは、上述のとおり、スコアに基づいて選定された学習対象書籍と親和性の高い書籍の一覧である。スコアは、スコア算出部120によって算出される。
【0040】
続いて、第2学習部140は、ステップS201で生成した属性データと、教師データと、ステップS202で生成したポジティブリストとに基づいて距離学習を行うことにより、各書籍間の関連性を学習する(ステップS203)。第2学習部140は、学習結果として第2ベクトル空間情報M2を生成して記憶部150に保存する(ステップS204)。
【0041】
図8は、ポジティブリストの概要を示す図である。ポジティブリストは、例えば、図8に示されるようなホットベクトルの形式で表される。例えば、ポジティブリストPLは、学習対象書籍の後(直後を含む)に選択された各書籍のうちスコアが上位のもの(例えば上位30件など)を“1”とし、それ以外の書籍を“0”としたベクトルによって表すことができる。例えば、図8の例において、ポジティブリストPLは、学習対象書籍Sに対するスコアが上位の書籍A、書籍B、および書籍Cのうち、各書籍に対するスコアが上位の書籍に学習対象書籍Sを含む書籍Aおよび書籍Cを示す。ここで、「書籍Xに対するスコア」とは、書籍Xを着目書籍とした場合における、他の書籍の書籍Xに対するスコアである。この例では、書籍Bは、スコア上位に学習対象書籍Sを含まないのでポジティブリストから除外されている。このように、スコアは、書籍のペア(図5の例では、学習対象書籍S(着目書籍)と書籍Aのペア、書籍Sと書籍Bのペア、および書籍Sと書籍Cのペア)に対してどちらを学習対象書籍(着目書籍)とするかによって非対称であるので、本実施形態では、どちらを選んでも高いスコアとなる書籍をポジティブリストに含めるようにしている。なお、スコア上位の判定基準や閾値は必要に応じて適宜設計されてよい。例えば、閾値以上のスコアを有する書籍が上位と判定されてもよいし、スコアの順位が閾値以上の書籍が上位と判定されてもよい。
【0042】
図9は、第2学習処理の概要を示す図である。図9の例の第2学習処理L2は、図5で例示した第1学習処理の構成において、自己注意機構A2の入力にポジティブリストPLをさらに追加した構成である。このような構成をとることにより、第2学習処理L2では、第1学習処理L1と同様に、自己注意機構による高次の交互作用によってアイテム属性の入力素性を実質的に増加させて書籍間の関連性を学習しつつ、さらに、学習対象の書籍Sとの類似性を認識する上で書籍の選択実績に基づくスコアがより強く反映されるようにすることができる。言い換えれば、第2学習処理は、距離学習において、所定の条件を満たす特定書籍(自書籍に対する書籍Sのスコアが高く、且つ書籍Sに対する自書籍のスコアが高い書籍)の影響が第1学習処理よりも強く反映されるようにするものであり、アイテム属性のみを入力する第1学習処理に比べて、実際の選択結果をより重視して関連性を学習するものである、ということができる。
【0043】
図10は、情報処理装置200が着目書籍についてレコメンドする書籍を決定する処理(以下「レコメンド決定処理」という。)の流れの一例を示す図である。まず、レコメンド決定部240が、着目書籍と、その他の書籍のそれぞれについて、第1ベクトル空間情報M1をもとに上述の第1ベクトルを取得する(ステップS301)。第1ベクトルは、第1ベクトル空間情報M1に係るベクトル空間(アイテム属性重視の空間)において各書籍の座標(位置)を示すものである。
【0044】
続いて、レコメンド決定部240が、着目書籍と、その他の書籍のそれぞれについて、第2ベクトル空間情報M2をもとに上述の第2ベクトルを取得する(ステップS302)。第2ベクトルは、第2ベクトル空間情報M2に係るベクトル空間(選択実績重視の空間)において各書籍の座標(位置)を示すものである。
【0045】
続いて、レコメンド決定部240が、着目書籍と、その他の書籍のそれぞれについて、ステップS301およびS302で推定された第1ベクトルおよび第2ベクトルを結合して第3ベクトルを生成する(ステップS303)。レコメンド決定部240は、着目書籍の第3ベクトルと、その他の書籍の第3ベクトルとに基づいて着目書籍に対するレコメンドを決定する(ステップS304)。
【0046】
図11は、レコメンド決定処理の概要を示す図である。例えば、レコメンド決定部240は、注目書籍と、その他の書籍との間で、第3ベクトル同士でのコサイン類似度を計算する。例えば、第1ベクトルおよび第2ベクトルがそれぞれ128次元のベクトルとして推定される場合、レコメンド決定部240は、それらを結合した256次元の第3ベクトル同士でコサイン類似度を計算する。レコメンド決定部240は、計算したコサイン類似度を所定の閾値と比較することにより、注目書籍と、その他の書籍との類似性を判定する。
【0047】
例えば、レコメンド決定部240は、注目書籍とその他の書籍Tとのコサイン類似度が閾値以上である場合には、書籍Tを注目書籍のレコメンドとすることを判定し、当該コサイン類似度が閾値未満である場合には、書籍Tを注目書籍のレコメンドとしないことを判定してもよい。ベクトル間のコサイン類似度は、ベクトル間の距離に相関するので、レコメンドをコサイン類似度により判定することは、距離学習の結果、ベクトル空間において互いに近くに配置された書籍をレコメンドとすることに相当する。
【0048】
以上のように構成された実施形態の情報処理システム1によれば、利用者に対してより適切なレコメンドを提供することが可能となる。
【0049】
<変形例>
学習装置100は、第1学習部130および第2学習部140のいずれか一方を備えるように構成されてもよい。この場合、情報処理装置200は、学習装置100の構成に対応して、第1ベクトル空間情報M1および第2ベクトル空間M2のうちのいずれか一方を用いてレコメンドを決定するように構成されてもよい。例えば、学習装置100が第1学習部130(または第2学習部140)のみを備える場合、情報処理装置200は、学習装置100の構成に対応する第1ベクトル空間情報M1(または第2ベクトル空間情報M2)を用いてレコメンドを決定してもよい。この場合、情報処理装置200は、第1ベクトル空間情報M1(または第2ベクトル空間情報M2)に係るベクトル空間において、着目書籍の座標から閾値の範囲内に存在する他の書籍をレコメンドとして決定してもよい。また、学習装置100および情報処理装置200は一体に構成されてもよい。
【0050】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【符号の説明】
【0051】
1…情報処理システム、100…学習装置、110…通信部、120…スコア算出部、130…第1学習部、140…第2学習部、150…記憶部、151…第1学習モデル、152…第2学習モデル、153…教師データ、154…アイテム情報、200…情報処理装置、210…通信部、220…コンテンツ配信部、240…レコメンド決定部、250…記憶部、251…コンテンツ情報、252…閲覧履歴情報、300…利用者端末装置、A1…全結合層、A2…自己注意機構(Self-attention)、M1…第1ベクトル空間情報、M2…第2ベクトル空間情報
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11