IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

<>
  • 特許-推定装置、推定方法及び推定プログラム 図1
  • 特許-推定装置、推定方法及び推定プログラム 図2
  • 特許-推定装置、推定方法及び推定プログラム 図3
  • 特許-推定装置、推定方法及び推定プログラム 図4
  • 特許-推定装置、推定方法及び推定プログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-24
(45)【発行日】2022-07-04
(54)【発明の名称】推定装置、推定方法及び推定プログラム
(51)【国際特許分類】
   G06Q 30/02 20120101AFI20220627BHJP
【FI】
G06Q30/02 310
【請求項の数】 4
(21)【出願番号】P 2019034497
(22)【出願日】2019-02-27
(65)【公開番号】P2020140362
(43)【公開日】2020-09-03
【審査請求日】2020-12-17
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100166006
【弁理士】
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100124084
【弁理士】
【氏名又は名称】黒岩 久人
(74)【代理人】
【識別番号】100153280
【弁理士】
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】米川 慧
(72)【発明者】
【氏名】牛 コウ
(72)【発明者】
【氏名】黒川 茂莉
(72)【発明者】
【氏名】小林 亜令
【審査官】小山 和俊
(56)【参考文献】
【文献】特開2014-229252(JP,A)
【文献】aimstar Ver.8,けいはんな情報通信フェア2018 ,2018年10月25日
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
既存商品を購買した顧客を示す顧客情報と、前記顧客が購買した前記既存商品を示す商品情報と、前記顧客が前記既存商品を購買した日付を示す日付情報とが関連付けられた複数の履歴情報と、未販売の新規商品に関する情報と、複数の前記既存商品に関する情報とを取得する履歴情報取得部と、
複数の商品それぞれの特性を示す情報が入力されることにより前記複数の商品間の類似度を出力する機械学習モデルであって、第1期間に第1商品を購買した顧客が前記第1期間よりも後の第2期間に前記第1商品と異なる第2商品を購買する第1確率と、前記第1期間に前記第1商品を購買しなかった顧客が前記第2期間に前記第2商品を購入する第2確率と、を用いて算出したオッズ比に基づいて算出される損失関数を用いて学習することにより生成された前記機械学習モデルに対して、前記複数の既存商品に関する情報に基づく前記既存商品ごとに、当該既存商品の特性を示す情報と前記新規商品に関する情報に基づく前記新規商品の特性を示す情報とを入力することによって前記機械学習モデルが出力した前記類似度に基づいて、前記新規商品に類似する前記既存商品を推定する類似商品推定部と、
前記複数の履歴情報が示す複数の前記既存商品の購買傾向に基づいて、前記類似商品推定部が推定した前記既存商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定し、推定した推定結果に基づいて、前記顧客ごとに、前記新規商品が現在から前記所定の期間を経過するまでの間に購買されるか否かを推定する購買有無推定部と、
前記購買有無推定部が推定した結果に基づいて、前記顧客ごとに、前記新規商品が現在から前記所定の期間を経過するまでの間に購買されるか否かを示す情報を出力する出力部と、
を有する推定装置。
【請求項2】
前記機械学習モデルは、
前記第1商品の特性と前記第2商品の特性とに基づく前記第1商品の特徴ベクトルと前記第2商品の特徴ベクトルとのペアを所定のパラメータを用いて特徴表現に符号化する符号化器と、
前記オッズ比及び前記特徴表現により規定される前記損失関数を最小化するように前記パラメータを学習して最適化する学習部と、
前記特徴表現を用いて算出した類似度を前記第1商品と前記第2商品との類似度として出力する出力部と、
を有する、
請求項に記載の推定装置。
【請求項3】
コンピュータが実行する、
既存商品を購買した顧客を示す顧客情報と、前記顧客が購買した前記既存商品を示す商品情報と、前記顧客が前記既存商品を購買した日付を示す日付情報とが関連付けられた複数の履歴情報と、未販売の新規商品に関する情報と、複数の前記既存商品に関する情報とを取得するステップと、
複数の商品それぞれの特性を示す情報が入力されることにより前記複数の商品間の類似度を出力する機械学習モデルであって、第1期間に第1商品を購買した顧客が前記第1期間よりも後の第2期間に前記第1商品と異なる第2商品を購買する第1確率と、前記第1期間に前記第1商品を購買しなかった顧客が前記第2期間に前記第2商品を購入する第2確率と、を用いて算出したオッズ比に基づいて算出される損失関数を用いて学習することにより生成された前記機械学習モデルに対して、前記複数の既存商品に関する情報に基づく前記既存商品ごとに、当該既存商品の特性を示す情報と前記新規商品に関する情報に基づく前記新規商品の特性を示す情報とを入力することによって前記機械学習モデルが出力した前記類似度に基づいて、前記新規商品に類似する前記既存商品を推定するステップと、
前記複数の履歴情報が示す複数の前記既存商品の購買傾向に基づいて、推定した前記既存商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定し、推定した推定結果に基づいて、前記顧客ごとに、前記新規商品が現在から前記所定の期間を経過するまでの間に購買されるか否かを推定するステップと、
推定した結果に基づいて、前記顧客ごとに、前記新規商品が現在から前記所定の期間を経過するまでの間に購買されるか否かを示す情報を出力するステップと、
を有する推定方法。
【請求項4】
コンピュータを、
既存商品を購買した顧客を示す顧客情報と、前記顧客が購買した前記既存商品を示す商品情報と、前記顧客が前記既存商品を購買した日付を示す日付情報とが関連付けられた複数の履歴情報と、未販売の新規商品に関する情報と、複数の前記既存商品に関する情報とを取得する履歴情報取得部、
複数の商品それぞれの特性を示す情報が入力されることにより前記複数の商品間の類似度を出力する機械学習モデルであって、第1期間に第1商品を購買した顧客が前記第1期間よりも後の第2期間に前記第1商品と異なる第2商品を購買する第1確率と、前記第1期間に前記第1商品を購買しなかった顧客が前記第2期間に前記第2商品を購入する第2確率と、を用いて算出したオッズ比に基づいて算出される損失関数を用いて学習することにより生成された前記機械学習モデルに対して、前記複数の既存商品に関する情報に基づく前記既存商品ごとに、当該既存商品の特性を示す情報と前記新規商品に関する情報に基づく前記新規商品の特性を示す情報とを入力することによって前記機械学習モデルが出力した前記類似度に基づいて、前記新規商品に類似する前記既存商品を推定する類似商品推定部、
前記複数の履歴情報が示す複数の前記既存商品の購買傾向に基づいて、前記類似商品推定部が推定した前記既存商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定し、推定した推定結果に基づいて、前記顧客ごとに、前記新規商品が現在から前記所定の期間を経過するまでの間に購買されるか否かを推定する購買有無推定部、及び
前記購買有無推定部が推定した結果に基づいて、前記顧客ごとに、前記新規商品が現在から前記所定の期間を経過するまでの間に購買されるか否かを示す情報を出力する出力部、
として機能させる推定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、商品が購買されるか否かを推定する推定装置、推定方法及び推定プログラムに関する。
【背景技術】
【0002】
従来、顧客が商品を購入した履歴を示す履歴情報に基づいて、顧客の購買傾向を分析するシステムが知られている。特許文献1には、顧客の購買履歴データ(履歴情報)を購買商品軸及び店舗距離軸に分類し、分類した購買商品軸及び店舗距離軸に基づいて顧客個々の特徴ある購買動向を分析する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2018-180575号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の技術を用いることで、商品の購入履歴に基づいて、過去に購入された実績がある商品の将来の販売量を予測することはできるが、未販売の新規商品をはじめとする過去に購買された実績がない商品の将来の販売量を予測することは難しかった。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、未販売の新規商品が購入されるか否かを推定することができる推定装置、推定方法及び推定プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様に係る推定装置は、既存商品を購買した顧客を示す顧客情報と、前記顧客が購買した前記既存商品を示す商品情報と、前記顧客が前記既存商品を購買した日付を示す日付情報とが関連付けられた複数の履歴情報を取得する履歴情報取得部と、複数の前記履歴情報が示す複数の前記既存商品の購買傾向に基づいて、前記顧客ごとに、前記既存商品と異なる未販売の新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定する購買有無推定部と、前記購買有無推定部が推定した結果に基づいて、前記顧客ごとに、前記新規商品が現在から前記所定の期間を経過するまでの間に購買されるか否かを示す情報を出力する出力部と、を有する。
【0007】
前記推定装置は、前記新規商品に関する情報と、複数の前記既存商品に関する情報とを取得する商品情報取得部と、前記新規商品に関する情報に基づく前記新規商品の特性と、前記複数の既存商品に関する情報に基づく前記複数の既存商品それぞれの特性とに基づいて、前記新規商品に類似する前記既存商品を推定する類似商品推定部とをさらに有し、前記購買有無推定部は、前記類似商品推定部が推定した前記既存商品が現在から前記所定の期間を経過するまでの間に購買されるか否かを推定した結果に基づいて、前記新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定してもよい。
【0008】
前記類似商品推定部は、複数の商品それぞれの特性を示す情報が入力されることにより前記複数の商品間の類似度を出力する機械学習モデルを用いて、前記新規商品に類似する前記既存商品を推定してもよい。
【0009】
前記機械学習モデルは、第1期間に第1商品を購買した顧客が前記第1期間よりも後の第2期間に前記第1商品と異なる第2商品を購買する第1確率と、前記第1期間に前記第1商品を購買しなかった顧客が前記第2期間に前記第2商品を購入する第2確率と、を用いて算出したオッズ比に基づいて算出される損失関数を用いて学習することにより生成されたモデルであってもよい。
【0010】
前記機械学習モデルは、前記第1商品の特性と前記第2商品の特性とに基づく前記第1商品の特徴ベクトルと前記第2商品の特徴ベクトルとのペアを所定のパラメータを用いて特徴表現に符号化する符号化器と、前記オッズ比及び前記特徴表現により規定される前記損失関数を最小化するように前記パラメータを学習して最適化する学習部と、前記特徴表現を用いて算出した類似度を前記第1商品と前記第2商品との類似度として出力する出力部と、を有してもよい。
【0011】
本発明の第2の態様に係る推定方法は、コンピュータが実行する、既存商品を購買した顧客を示す顧客情報と、前記顧客が購買した前記既存商品を示す商品情報と、前記顧客が前記既存商品を購買した日付を示す日付情報とが関連付けられた複数の履歴情報を取得するステップと、前記複数の履歴情報が示す複数の商品の購買傾向に基づいて、前記顧客ごとに、前記既存商品と異なる未販売の新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定するステップと、推定した結果に基づいて、前記顧客ごとに、前記新規商品が現在から前記所定の期間を経過するまでの間に購買されるか否かを示す情報を出力するステップと、を有する。
【0012】
本発明の第3の態様に係る推定プログラムは、コンピュータを、既存商品を購買した顧客を示す顧客情報と、前記顧客が購買した前記既存商品を示す商品情報と、前記顧客が前記既存商品を購買した日付を示す日付情報とが関連付けられた複数の履歴情報を取得する履歴情報取得部、前記複数の履歴情報が示す複数の商品の購買傾向に基づいて、前記顧客ごとに、前記既存商品と異なる未販売の新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定する購買有無推定部、及び前記購買有無推定部が推定した結果に基づいて、前記顧客ごとに、前記新規商品が現在から前記所定の期間を経過するまでの間に購買されるか否かを示す情報を出力する出力部、として機能させる。
【発明の効果】
【0013】
本発明によれば、未販売の新規商品が購入されるか否かを推定することができるという効果を奏する。
【図面の簡単な説明】
【0014】
図1】推定装置の概要を説明するための図である。
図2】推定装置の構成を示す図である。
図3】機械学習モデルの構成を示す図である。
図4】機械学習モデルの学習処理の流れを示すフローチャートである。
図5】推定装置の処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0015】
[推定装置1の概要]
図1は、推定装置1の概要を説明するための図である。推定装置1は、例えばコンピュータである。
【0016】
まず、推定装置1は、顧客が既存商品を購入した履歴を示す複数の履歴情報を取得する(図1の(1))。既存商品は、既に販売されている商品である。履歴情報は、既存商品を購買した顧客を示す顧客情報と、顧客が購買した既存商品を示す商品情報と、顧客が既存商品を購買した日付を示す日付情報とが関連付けられた情報である。
【0017】
推定装置1は、取得した複数の履歴情報が示す複数の既存商品の購買傾向に基づいて、顧客ごとに、既存商品と異なる未販売の新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定する(図1の(2))。新規商品は、履歴情報に存在する既存商品に類似する商品であって、履歴情報に存在しない商品である。
【0018】
そして、推定装置1は、推定した結果に基づいて、顧客ごとに、新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを示す推定情報を出力する(図1の(3))。所定の期間は、例えば、1週間又は1か月等である。このようにすることで、推定装置1は、新規商品が購入されるか否かを推定することができる。
以下、推定装置1の構成について説明する。
【0019】
[推定装置1の構成]
図2は、推定装置1の構成を示す図である。推定装置1は、記憶部11及び制御部12を有する。記憶部11は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体である。記憶部11は、制御部12が実行する各種のプログラムを記憶する。記憶部11は、既存商品に類似する新規商品を推定するために用いられる機械学習モデルMを記憶している。詳細については後述するが、機械学習モデルMは、所定のオッズ比に基づいて算出される損失関数を用いて学習することにより生成されたモデルである。
【0020】
制御部12は、例えばCPU(Central Processing Unit)である。制御部12は、記憶部11に記憶されているプログラムを実行することにより、推定装置1に係る機能を制御する。制御部12は、プログラムを実行することにより、履歴情報取得部121、商品情報取得部122、類似商品推定部123、購買有無推定部124、推定情報出力部125及びモデル学習部126として機能する。
【0021】
履歴情報取得部121は、既存商品を購買した顧客を示す顧客情報と、顧客が購買した既存商品を示す商品情報と、顧客が既存商品を購買した日付を示す日付情報とが関連付けられた複数の履歴情報を取得する。顧客情報は、顧客を識別するための情報であり、例えば、顧客の名前又は顧客ID等である。商品情報は、商品を識別するための情報であり、例えば、商品の名称又は商品ID等である。
【0022】
履歴情報取得部121は、例えば、推定装置1を使用する使用者が複数の履歴情報を入力(例えばアップロード)することにより、複数の履歴情報を取得する。また、例えば、複数の履歴情報が予め記憶部11に記憶されており、履歴情報取得部121は、使用者が不図示の情報端末(例えばコンピュータ)の操作部において推定処理を実行するための操作をしたことを契機として、記憶部11に記憶されている複数の履歴情報を取得してもよい。
【0023】
商品情報取得部122は、商品に関する情報を取得する。商品に関する情報は、商品情報と、商品の内容を説明したテキスト情報とを含む。具体的には、商品情報取得部122は、まだ販売されていない新規商品に関する情報と、すでに販売されている複数の既存商品に関する情報とを商品に関する情報として取得する。
【0024】
商品情報取得部122は、例えば、使用者が新規商品に関する情報と複数の既存商品に関する情報とを入力することにより、新規商品に関する情報と複数の既存商品に関する情報を取得する。また、例えば、新規商品に関する情報と複数の既存商品に関する情報とが予め記憶部11に記憶されており、商品情報取得部122は、使用者が操作部において推定処理を実行するための操作をしたことを契機として、記憶部11に記憶されている新規商品に関する情報と複数の既存商品に関する情報とを取得してもよい。
【0025】
類似商品推定部123は、新規商品に関する情報に基づく新規商品の特性と、複数の既存商品に関する情報に基づく複数の既存商品それぞれの特性とに基づいて、新規商品に類似する既存商品を推定する。新規商品の特性は、例えば、新規商品に関する情報に含まれるテキスト情報が示す商品の内容である。既存商品の特性は、例えば、既存商品に関する情報に含まれるテキスト情報が示す商品の内容である。
【0026】
具体的には、類似商品推定部123は、複数の商品それぞれの特性を示す情報が入力されることにより複数の商品間の類似度を出力する機械学習モデルMを用いて、新規商品に類似する既存商品を推定する。
【0027】
類似商品推定部123は、例えば、複数の履歴情報に存在する既存商品ごとに、新規商品の特性を示すテキスト情報と当該既存商品の特性を示すテキスト情報とを機械学習モデルMに入力することにより機械学習モデルMが出力した類似度のうち、新規商品に最も類似することを示す類似度に対応する既存商品を、新規商品に類似する既存商品として推定する。「既存商品の特性を示すテキスト情報」は、既存商品に関する情報において当該既存商品に対応する履歴情報に含まれている商品情報に関連付けられているテキスト情報である。このように、推定装置1は、新規商品に類似する既存商品を推定対象にすることにより、複数の履歴情報が示す複数の既存商品の購買傾向に基づいて、顧客が既存商品に類似する新規商品を購買するか否かを推定することができる。
【0028】
購買有無推定部124は、複数の履歴情報が示す複数の既存商品の購買傾向に基づいて、顧客ごとに、新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定する。具体的には、購買有無推定部124は、類似商品推定部123が推定した既存商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定した結果に基づいて、新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定する。
【0029】
購買有無推定部124は、公知の技術を用いて、類似商品推定部123が推定した既存商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定することができる。購買有無推定部124は、例えば、任意の分類器(例えば、機械学習により設定された分類器、又はルールベースにより設定された分類器等)を用いて、類似商品推定部123が推定した既存商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定してもよい。
【0030】
また、例えば、購買有無推定部124は、まず、顧客ごとに、当該顧客に対応する複数の履歴情報に基づいて、類似商品推定部123が推定した既存商品の購買間隔を推定し、推定した既存商品の購買間隔と、直前に既存商品が購買された日付とに基づいて、既存商品が購買される次回の日付を推定する。そして、購買有無推定部124は、推定した既存商品が購買される次回の日付が、現在から所定の期間を経過するまでの間に含まれるか否かを判定することにより、類似商品推定部123が推定した既存商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定する。
【0031】
推定情報出力部125は、購買有無推定部124が推定した結果に基づいて、顧客ごとに、新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを示す推定情報を出力する。具体的には、推定情報出力部125は、新規商品に類似する既存商品が所定の期間を経過するまでの間に購買されるか否かを購買有無推定部124が推定した結果に基づいて、顧客ごとに、新規商品が、現在から所定の期間を経過するまでの間に購買されるか否かを示す推定情報を出力する。推定情報出力部125は、例えば、不図示の表示部に推定情報を表示させることにより出力する。このように、推定装置1が出力した推定情報を用いることにより、使用者は、新規商品の購買予測をすることができる。なお、推定情報出力部125は、類似商品推定部123が推定した既存商品が、現在から所定の期間を経過するまでの間に購買されるか否かを示す推定情報を出力してもよい。
【0032】
モデル学習部126は、履歴情報取得部121が取得した複数の履歴情報と、商品情報取得部122が取得した複数の既存商品に関する情報とを学習データ(例えばバッチサイズを64とする学習データ)として、機械学習モデルMを更新する。
【0033】
ところで、推定装置1が、新規商品の特性と既存商品の特性とを用いて商品間の類似度を推定した場合であっても、精度良く推定することができない場合がある。例えば、電化製品をはじめとする耐久消費財においては、購買間隔が長いため、顧客がある電化製品を購買した後に、購買した電化製品に類似する他の電化製品をすぐに購買するとは限らない。このような顧客の購買傾向を考慮すると、複数の商品の特性が類似している場合であっても、必ずしも複数の商品間の類似度が高くなるとは限らない。そのため、複数の商品間の類似度を推定する場合、統計的有意性を考慮する必要がある。
【0034】
そこで、モデル学習部126は、統計的有意性を考慮した所定のオッズ比を用いて、機械学習モデルMを更新する。所定のオッズ比は、第1期間に第1商品を購買した顧客が第1期間よりも後の第2期間に第1商品と異なる第2商品を購買する第1確率と、第1期間に第1商品を購買しなかった顧客が第2期間に第2商品を購入する第2確率と、を用いて算出された数値である。第1期間及び第2期間は、例えば、同じ長さであり、連続した期間である。また、第1期間及び第2期間は、例えば、上記所定の期間と同じ長さである。
【0035】
具体的には、まず、モデル学習部126は、複数の履歴情報に基づいて、顧客が第1期間に購入した第1商品と、当該顧客が第2期間に購入した第2商品とのペアごとに、所定のオッズ比を算出する。そして、モデル学習部126は、第1商品と第2商品とのペアごとに、当該第1商品の特性を示すテキスト情報と、当該第2商品の特性を示すテキスト情報と、算出した所定のオッズ比とを機械学習モデルMに入力することにより、機械学習モデルMを更新する。このようにすることで、推定装置1は、商品の特性と、顧客の購買傾向とを加味した複数の商品間の類似度を機械学習モデルMに出力させることができる。
【0036】
モデル学習部126は、所定の検定法(例えばフィッシャーの正確確率検定)を用いて、所定のオッズ比の95%信頼区間の上限値及び下限値を算出してもよい。この場合、モデル学習部126は、第1商品と第2商品とのペアごとに、当該オッズ比の95%信頼区間の上限値及び下限値をさらに機械学習モデルMに入力することにより、機械学習モデルMを更新してもよい。
【0037】
ここで、第1商品をiとし、第2商品をjとし、第1確率をpとし、第2確率をqとした場合、モデル学習部126は、オッズ比ORを、OR=p(1-q)/q(1-p)の式を用いて算出することができる。
【0038】
[機械学習モデルMの構成]
続いて、機械学習モデルMの構成について説明する。図3は、機械学習モデルMの構成を示す図である。上述のとおり、機械学習モデルMは、所定のオッズ比に基づいて算出される損失関数(例えば対比損失)を用いて学習することにより生成されたモデルである。機械学習モデルMは、例えば、全結合型ニューラルネットワークを含んでいる。機械学習モデルMは、ベクトル変換部M1と、符号化器M2と、類似度出力部M3と、パラメータ学習部M4とを有する。
【0039】
ベクトル変換部M1は、例えば入力層である。ベクトル変換部M1は、機械学習モデルMに学習データとして入力された第1商品の特性を示すテキスト情報及び第2商品の特性を示すテキスト情報を、第1商品の特徴ベクトルと第2商品の特徴ベクトルとに変換する。ベクトル変換部M1は、例えば、機械学習モデルMに学習データとして入力された第1商品の特性を示すテキスト情報及び第2商品の特性を示すテキスト情報を、公知の技術(例えばDoc2Vec)を用いて複数の次元(例えば128次元)を有する第1商品の特徴ベクトルと第2商品の特徴ベクトルとに変換する。
【0040】
符号化器M2は、例えば、活性化関数がランプ関数(ReLU)であり、ユニット数が64個である中間層と、活性化関数が線形関数であり、ユニット数が64個である出力層を含む。符号化器M2は、第1商品の特性と第2商品の特性とに基づく第1商品の特徴ベクトルと第2商品の特徴ベクトルとのペアを所定のパラメータを用いて特徴表現に符号化し出力する。所定のパラメータは、後述するパラメータ学習部M4が最適化したパラメータである。特徴表現は、第1商品に対応するベクトルと、第2商品に対応するベクトルとを含む。
【0041】
類似度出力部M3は、符号化器M2が出力した特徴表現を用いて算出した類似度を第1商品と第2商品との類似度として出力する。類似度出力部M3は、例えば、符号化器M2が出力した特徴表現のコサイン類似度を出力する。なお、類似度出力部M3が出力する類似度は、コサイン類似度に限らない。類似度出力部M3は、例えば、出力する類似度として、符号化器M2が出力した特徴表現を用いて、マンハッタン距離、ユークリッド距離及びMAX距離のうちのいずれかを算出してもよい。
【0042】
パラメータ学習部M4は、モデル学習部126が機械学習モデルMに入力した所定のオッズ比及び符号化器M2が出力した特徴表現により規定される損失関数を最小化するように符号化器M2のパラメータを学習して最適化する。パラメータ学習部M4は、所定の調整方法(例えば、ミニバッチ確率的勾配法又はAdam(Adaptive Moment Estimation)等)を用いて、損失関数を最小化するように符号化器M2のパラメータを学習して最適化してもよい。
【0043】
パラメータ学習部M4は、例えば、損失関数(対比損失)における指標関数としてコサイン関数を用いて損失計算をしてもよい。パラメータ学習部M4は、損失関数における正例及び負例それぞれに対応する損失を用いて損失計算をしてもよい。パラメータ学習部M4は、例えば、損失関数において、オッズ比の95%信頼区間の下限値が1より大きい場合、正例の損失をオッズ比で重み付け、オッズ比の95%信頼区間の上限値が1より小さい場合、負例の損失をオッズ比の逆数で重み付けて損失計算をしてもよい。この場合、正負比は、1に調整されてもよい。
【0044】
また、パラメータ学習部M4は、例えば、損失関数において、オッズ比の95%信頼区間の下限値が1より小さく、かつオッズ比の95%信頼区間の上限値が1より大きい場合、損失計算をしなくてもよい。パラメータ学習部M4は、例えば、損失関数における正例及び負例それぞれの重みが無限である場合、観測中の最大値に置き換えて損失計算をしてもよい。
【0045】
ここで、オッズ比の95%信頼区間の上限値をORとし、オッズ比の95%信頼区間の下限値をORとし、正例のマージンをmとし、負例のマージンをmとし、特徴表現を(e、e)とした場合、以下の式(1)を損失関数として損失Lを求めることができる。
【数1】
【0046】
このように、推定装置1は、最適化された符号化器M2を含む機械学習モデルMを用いることにより、第1期間と第2期間とにおける購買行動の関連性が加味された商品間の類似度に基づいて、新規商品に類似する既存商品を推定することができる。
【0047】
[機械学習モデルMの学習処理]
続いて、機械学習モデルMの学習処理の流れについて説明する。図4は、機械学習モデルMの学習処理の流れを示すフローチャートである。本フローチャートは、履歴情報取得部121が、複数の履歴情報を取得し、商品情報取得部122が、複数の既存商品に関する情報を取得したことを契機として開始する(S1、S2)。
【0048】
モデル学習部126は、履歴情報取得部121が取得した複数の履歴情報に基づいて、第1商品と第2商品とのペアごとに、所定のオッズ比を算出する(S3)。モデル学習部126は、第1商品と第2商品とのペアごとに、算出した所定のオッズ比と、当該第1商品の特性を示すテキスト情報と、当該第2商品の特性を示すテキスト情報とを機械学習モデルMに入力する(S4)。
【0049】
機械学習モデルMのベクトル変換部M1は、機械学習モデルMに学習データとして入力された第1商品の特性を示すテキスト情報及び第2商品の特性を示すテキスト情報を、第1商品の特徴ベクトルと第2商品の特徴ベクトルとに変換し、変換した特徴ベクトルを出力する(S5)。機械学習モデルMの符号化器M2は、第1商品の特性と第2商品の特性とに基づく第1商品の特徴ベクトルと第2商品の特徴ベクトルとのペアを所定のパラメータを用いて特徴表現に符号化する(S6)。
【0050】
そして、機械学習モデルMのパラメータ学習部M4は、モデル学習部126が機械学習モデルMに入力した所定のオッズ比及び符号化器M2が第1商品の特徴ベクトルと第2商品の特徴ベクトルとのペアを所定のパラメータを用いて符号化した特徴表現により規定される損失関数を最小化するように符号化器M2のパラメータを学習して最適化する(S7)。
【0051】
モデル学習部126は、例えば、無作為に選択した10パーセントの学習データを検証データとして、10ステップごとに検証損失の最小値の更新状況を検証してもよい。この場合において、モデル学習部126は、検証損失の最小値が10回連続で更新されなかった場合、又は検証損失の最小値の更新が所定の回数に達した場合に学習を停止してもよい。そして、モデル学習部126は、検証損失が最小となったときのパラメータを、符号化器M2のパラメータとして決定してもよい。
【0052】
[推定装置1の処理]
続いて、推定装置1の処理の流れについて説明する。図5は、推定装置1の処理の流れを示すフローチャートである。本フローチャートは、履歴情報取得部121が、複数の履歴情報を取得し、商品情報取得部122が、新規商品に関する情報と複数の既存商品に関する情報とを取得したことを契機として開始する(S11、S12)。
【0053】
類似商品推定部123は、複数の商品それぞれの特性を示す情報が入力されることにより複数の商品間の類似度を出力する機械学習モデルMを用いて、新規商品に類似する既存商品を推定する(S13)。購買有無推定部124は、類似商品推定部123が推定した既存商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定した結果に基づいて、新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定する(S14)。
【0054】
そして、推定情報出力部125は、購買有無推定部124が推定した結果に基づいて、顧客ごとに、新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを示す推定情報を出力する(S15)。
【0055】
[本実施の形態における効果]
以上説明したとおり、推定装置1は、複数の商品の購買傾向に基づいて、顧客ごとに、新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを推定し、推定した結果に基づいて、顧客ごとに、未販売の新規商品が現在から所定の期間を経過するまでの間に購買されるか否かを示す情報を出力する。このようにすることで、推定装置1は、新規商品が購入されるか否かを推定することができる。推定装置1は、新規商品に類似する既存商品を推定対象にすることにより、複数の履歴情報が示す複数の既存商品の購買傾向に基づいて、顧客が既存商品に類似する新規商品を購買するか否かを推定することができる。また、推定装置1は、複数の履歴情報に基づいて算出した所定のオッズ比を用いて、機械学習モデルMを更新することにより、商品の特性と、顧客の購買傾向とを加味した複数の商品間の類似度を機械学習モデルMに出力させることができる。
【0056】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0057】
1 推定装置
11 記憶部
12 制御部
121 履歴情報取得部
122 商品情報取得部
123 類似商品推定部
124 購買有無推定部
125 推定情報出力部
126 モデル学習部
M 機械学習モデル
M1 ベクトル変換部
M2 符号化器
M3 類似度出力部
M4 パラメータ学習部
図1
図2
図3
図4
図5