特許第6899805号(P6899805)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 楽天株式会社の特許一覧

特許6899805特性推定装置、特性推定方法、及び特性推定プログラム等
<>
  • 特許6899805-特性推定装置、特性推定方法、及び特性推定プログラム等 図000002
  • 特許6899805-特性推定装置、特性推定方法、及び特性推定プログラム等 図000003
  • 特許6899805-特性推定装置、特性推定方法、及び特性推定プログラム等 図000004
  • 特許6899805-特性推定装置、特性推定方法、及び特性推定プログラム等 図000005
  • 特許6899805-特性推定装置、特性推定方法、及び特性推定プログラム等 図000006
  • 特許6899805-特性推定装置、特性推定方法、及び特性推定プログラム等 図000007
  • 特許6899805-特性推定装置、特性推定方法、及び特性推定プログラム等 図000008
  • 特許6899805-特性推定装置、特性推定方法、及び特性推定プログラム等 図000009
  • 特許6899805-特性推定装置、特性推定方法、及び特性推定プログラム等 図000010
  • 特許6899805-特性推定装置、特性推定方法、及び特性推定プログラム等 図000011
  • 特許6899805-特性推定装置、特性推定方法、及び特性推定プログラム等 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6899805
(24)【登録日】2021年6月17日
(45)【発行日】2021年7月7日
(54)【発明の名称】特性推定装置、特性推定方法、及び特性推定プログラム等
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20210628BHJP
【FI】
   G06Q50/10
【請求項の数】12
【全頁数】25
(21)【出願番号】特願2018-173297(P2018-173297)
(22)【出願日】2018年9月18日
(65)【公開番号】特開2020-35409(P2020-35409A)
(43)【公開日】2020年3月5日
【審査請求日】2019年1月21日
(31)【優先権主張番号】特願2018-157945(P2018-157945)
(32)【優先日】2018年8月27日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】399037405
【氏名又は名称】楽天グループ株式会社
(74)【代理人】
【識別番号】110000958
【氏名又は名称】特許業務法人 インテクト国際特許事務所
(74)【代理人】
【識別番号】100120189
【弁理士】
【氏名又は名称】奥 和幸
(74)【代理人】
【識別番号】100135518
【弁理士】
【氏名又は名称】青木 隆
(72)【発明者】
【氏名】伴 果純
(72)【発明者】
【氏名】見原 敬基
(72)【発明者】
【氏名】吉冨 志穂
(72)【発明者】
【氏名】小川 広大
【審査官】 小山 和俊
(56)【参考文献】
【文献】 特開2010−204966(JP,A)
【文献】 米国特許出願公開第2018/0197094(US,A1)
【文献】 市川 裕介,Web行動履歴を用いたユーザ嗜好特性推定技術の検討,マルチメディア,分散,協調とモバイル(DICOMO2008)シンポジウム,社団法人情報処理学会,2008年 7月 2日,第1786-1792頁
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00−99/00
(57)【特許請求の範囲】
【請求項1】
アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類する分類手段と、
前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断する判断手段と、
前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する生成手段と、
前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定する推定手段と、
を備えることを特徴とする特性推定装置。
【請求項2】
前記第2ユーザの行動履歴が更新された場合、前記推定手段は、当該更新された行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を再推定することにより更新することを特徴とする請求項1に記載の特性推定装置。
【請求項3】
前記第2ユーザの行動履歴が更新された場合、前記学習済みモデルにおける所定の分類基準において、推定された特性に属する前記第2ユーザの出現率が同等となる条件、および、推定された特性に属する前記第2ユーザが所定の一致度を有する条件、を満たすように、前記所定の分類基準を変更する変更手段を更に備えることを特徴とする請求項1または2に記載の特性推定装置。
【請求項4】
前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、当該更新された行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データを用いて前記学習済みモデルを更新する更新手段を更に備えることを特徴とする請求項1乃至3のいずれか一項に記載の特性推定装置。
【請求項5】
前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、前記判断手段は、当該更新された、前記教師ユーザの行動履歴が前記特性に関連して設定された基準を満たすか否かを判断することを特徴とする請求項4に記載の特性推定装置。
【請求項6】
前記生成手段は、前記行動履歴が前記基準を満たさないと判断された第1ユーザを教師ユーザとして採用しないことを特徴とする請求項1乃至5のいずれか一項に記載の特性推定装置。
【請求項7】
前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、当該更新された行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データを用いて前記学習済みモデルを更新する更新手段を更に備え、
前記学習済みモデルの更新間隔は、前記第2ユーザの特性の更新間隔よりも長いことを特徴とする請求項2に記載の特性推定装置。
【請求項8】
前記特性に関連して設定された基準は、前記特性ごとに設定された基準であることを特徴とする請求項1乃至7のいずれか一項に記載の特性推定装置。
【請求項9】
前記特性に関連して設定された基準は、前記特性を横断した連続性を有する基準であることを特徴とする請求項1乃至7のいずれか一項に記載の特性推定装置。
【請求項10】
前記特性に関連して設定された基準は、ユーザ全体の行動履歴に基づく行動分布と前記特性との対応関係を示す基準であることを特徴とする請求項1乃至7のいずれか一項に記載の特性推定装置。
【請求項11】
コンピュータにより実行される特性推定方法であって、
アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類するステップと、
前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、
前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、
前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、
を含むことを特徴とする特性推定方法。
【請求項12】
アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類するステップと、
前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、
前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、
前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、
をコンピュータに実行させることを特徴とする特性推定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザの特性を推定する方法等の技術分野に関する。
【背景技術】
【0002】
従来から、インターネット等の通信ネットワークにおいて、多くのユーザを複数種類の特性の何れかに分類(セグメント化)し、分類されたユーザの特性に応じて情報を提供することが行われている。例えば、マーケティングの分野では、オピニオンリーダとしてイノベータと呼ばれる特性を持つユーザに訴求することが効果的であることが知られている。ユーザの特性を推定する手法として、ユーザに対してアンケートを行うことで推定する手法や、ユーザによる情報へのアクセス履歴を分析することで推定する手法等がある。特許文献1には、ユーザの特性を推定する手法が開示されている。具体的には、特許文献1の手法は、教師ユーザに対するアンケートの結果に基づいて特定された、教師ユーザの特性を目的変数とし、教師ユーザのアクセス履歴に基づいて生成された、教師ユーザの行動データを説明変数とする特性推定モデルを生成し、この特性推定モデルと推定ユーザの行動データとから推定ユーザの特性を推定するようになっている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2009−289068号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1の技術では、特性判別に用いるアンケートの質問の基礎となる仮説との関係が不明であり、また、当該特性を判別するための仮説の妥当性を評価するという思想もない。
【0005】
そこで、本発明は、上記点等に鑑みてなされたものであり、対象者のアンケート結果に基づいて実証的な特性推定を可能にした特性推定装置、特性推定方法、及び特性推定プログラム等を提供することを課題とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、請求項1に記載の発明は、アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類する分類手段と、前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断する判断手段と、前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する生成手段と、前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定する推定手段と、を備えることを特徴とする。
【0007】
この発明によれば、対象者のアンケート結果に基づいて実証的な特性推定を行うことができる。
【0008】
請求項2に記載の発明は、請求項1に記載の特性推定装置において、前記第2ユーザの行動履歴が更新された場合、前記推定手段は、当該更新された行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を再推定することにより更新することを特徴とする。
【0009】
この発明によれば、第2ユーザについて推定される特性を当該第2ユーザの行動履歴の変化に対応させることができる。
【0010】
請求項3に記載の発明は、請求項1または2に記載の特性推定装置において、前記第2ユーザの行動履歴が更新された場合、前記学習済みモデルにおける所定の分類基準において、推定された特性に属する前記第2ユーザの出現率が同等となる条件、および、推定された特性に属する前記第2ユーザが所定の一致度を有する条件、を満たすように、前記所定の分類基準を変更する変更手段を更に備えることを特徴とする。
【0011】
この発明によれば、特性が推定された第2ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。
【0012】
請求項4に記載の発明は、請求項1乃至3のいずれか一項に記載の特性推定装置において、前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、当該更新された行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データを用いて前記学習済みモデルを更新する更新手段を更に備えることを特徴とする。
【0013】
この発明によれば、教師ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。
【0014】
請求項5に記載の発明は、請求項4に記載の特性推定装置において、前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、前記判断手段は、当該更新された、前記教師ユーザの行動履歴が前記特性に関連して設定された基準を満たすか否かを判断することを特徴とする。
【0015】
この発明によれば、教師ユーザの行動履歴の変化に追従して、実証的な判断を含めて学習済みモデルによる推定精度を高めていくことができる。
【0016】
請求項6に記載の発明は、請求項1乃至5のいずれか一項に記載の特性推定装置において、前記生成手段は、前記行動履歴が前記基準を満たさないと判断された第1ユーザを教師ユーザとして採用しないことを特徴とする。
【0017】
この発明によれば、推定により特定される拡張集合の基点となる教師データの段階からその実証性や客観性を確保維持することができる。
【0018】
請求項7に記載の発明は、請求項2に記載の特性推定装置において、前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、当該更新された行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データを用いて前記学習済みモデルを更新する更新手段を更に備え、前記学習済みモデルの更新間隔は、前記第2ユーザの特性の更新間隔よりも長いことを特徴とする。
【0019】
この発明によれば、学習済みモデルの更新を最低限に留め、装置の負荷を低減することができる。
【0020】
請求項11に記載の発明は、コンピュータにより実行される特性推定方法であって、アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類するステップと、前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、を含むことを特徴とする。
【0021】
請求項12に記載の発明は、アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類するステップと、前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、をコンピュータに実行させることを特徴とする。
【発明の効果】
【0025】
本発明によれば、対象者のアンケート結果に基づいて実証的な特性推定を行うことができる。
【図面の簡単な説明】
【0026】
図1】特性推定装置の基本動作の流れを示すフロー図である。
図2】特性推定装置の基本動作の概念図である。
図3】通信システムSの概要構成の一例を示す図である。
図4】(A)は、特性推定サーバ3のハードウェア構成例を示す図であり、(B)は、特性推定サーバ3の制御部31の機能ブロック例を示す図である。
図5】ユーザ情報データベース301の内容の一例を示す図である。
図6】学習済みモデルの例として、決定木における条件分岐の例を示す概念図である。
図7】システム制御部33により実行される学習済みモデル生成処理の一例を示すフローチャートである。
図8】システム制御部33により実行される特性推定処理の一例を示すフローチャートである。
図9】システム制御部33により実行される特性更新処理の一例を示すフローチャートである。
図10】システム制御部33により実行される学習済みモデル更新処理の一例を示すフローチャートである。
図11】アンケートの改善項目としてアンケート選択肢が特定された場合における改善内容を示す概念図である。
【発明を実施するための形態】
【0027】
以下、図面を参照して本発明の実施形態について説明する。なお、以下の実施形態においては、第1ユーザを対象ユーザと称し、第2ユーザを推定ユーザと称するものとする。対象ユーザとは、アンケートの対象者であり、後述する基準を満たす教師ユーザが含まれる。推定ユーザとは、対象ユーザとは異なるユーザであり、教師ユーザの教師データを用いて生成された学習済みモデルから特性が推定されるユーザである。なお、対象ユーザ及び推定ユーザは、それぞれのユーザに付与されたユーザID(識別情報)により識別される。以下の説明においては、対象ユーザ及び推定ユーザを総称して、単に、ユーザという場合がある。
【0028】
[1.特性推定装置の基本動作]
はじめに、図1を参照して、本発明に係る特性推定装置の基本動作について説明する。図1は、特性推定装置の基本動作を示す概念図であり、図2は、特性推定装置の基本動作の概念図である。
【0029】
図1及び図2に示すように、先ず、特性推定装置(分類手段)は、アンケート(質問調査)に回答した複数の対象ユーザのそれぞれの回答(アンケート結果)に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類(セグメント化)する(フェーズF1)。ユーザの特性には、行動特性や市場における出現分布などに基づく仮説があり、アンケート結果に基づく特性分類は、対象ユーザの主観的、意識的な判断に基づく仮説検証ということができる。ユーザの特性の例として、イノベータ理論に沿った複数の特性(イノベータ、アーリーアダプタ、アーリーマジョリティ、レイトマジョリティ、及びラガード)が挙げられるが、これに限定されるものではなく、例えば、ユーザの人生における価値観等を考慮した特性を採用することができる。
【0030】
次に、特性推定装置(判断手段)は、アンケートに回答した対象ユーザの行動履歴が所定の基準(客観的な基準)を満たすか否かを対象ユーザ毎に判断し、当該対象ユーザのうち行動履歴が上記基準を満たすと判断された対象ユーザを教師ユーザとして特定する(フェーズF2)。ここで、行動履歴は、対象ユーザの実際の行為に基づく客観的な事実(事象)を表すものである。教師ユーザの行動履歴から抽出される行動情報と教師ユーザの特性との組が、後述する学習済みモデルの生成にあたり教師データとして用いられる。上記基準は、例えば、アンケートと共通の仮説に基づき特性に関連して設定されるものであり、アンケートと関連する基準を含む。上記基準の例としては、新製品を予約注文しているかどうか、トレンド商品を購入または検索しているかどうか、などが挙げられる。教師データの作成過程において、アンケートに回答した対象ユーザの行動履歴(つまり、客観的な事実に基づくデータ)を用いることで、対象ユーザの意識に頼ることにより起こりうる不完全性、不確実性を補完することができる。例えば、「何月何日にWebサイトAを訪問したか」といった対象ユーザの記憶に頼った細かなデータの正確性に不安が残るという現象に基づく不確実性を、当該対象ユーザの行動履歴で補完することができる。これにより、正確性が担保された状態で活用可能な情報が増え、教師データの精度向上が期待できる。なお、当該基準は、当該基準のみにより行動履歴を検証することで特性を分類することも可能な基準である。
【0031】
行動履歴が上記基準を満たすか否かは、例えば、個々の事象から蓋然性の高い特性を導き出す帰納的な仮説検証項目群(アンケートと共通の仮説モデルに基づく検証項目群)を特性ごとに設定(仮説検証項目は特性間で重複してもよい)し、この項目群に対する該当率が所定の割合を超えたか否かを判断することにより行われるとよい。ここで、仮説検証項目群に対する該当率は、行動履歴から抽出された行動情報(購買データ等の実データ)に基づいて算出される。このような判断は、対象ユーザの客観的な事実に基づく仮説検証ということができる。そして、該当率が所定の割合を超えた対象ユーザが教師ユーザとして特定される。一方、該当率が所定の割合を超えない対象ユーザは教師ユーザとして採用されない。該当率が所定の割合を超えない場合には、アンケートによる主観的評価と客観的評価とが乖離している場合(即ち、仮説に合わない場合)のほかに、当該対象ユーザの購買データ等の実データが十分ではなく証明できないという場合が該当する。つまり、証明困難な場合にも、対象ユーザは教師ユーザとして採用されず、その対象ユーザの行動情報と特性との組は教師データから除外される。これらの処理により、推定により特定される拡張集合の基点となる教師データの段階からその実証性や客観性を確保維持でき、後段の推定時に実証性や客観性を踏まえた状態で推定処理を進めることができる。
【0032】
次に、特性推定装置(生成手段)は、基準を満たすと判断された対象ユーザを教師ユーザとし、教師ユーザの行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する(フェーズF3)。つまり、特性推定装置は、教師ユーザの行動情報と特性とを教師データとして学習した学習済みモデルを生成する。これにより、対象ユーザの主観的な判断に基づく仮説検証と、対象ユーザの客観的な事実に基づく仮説検証を踏まえて実証的な特性推定を可能にする。
【0033】
次に、特性推定装置(推定手段)は、推定ユーザの行動履歴から抽出された行動情報と学習済みモデルとを用いて当該推定ユーザの特性を推定(予測)する(フェーズF4)。つまり、推定ユーザの行動履歴から抽出された行動情報が、学習済みモデルに入力されることで推定ユーザの特性が出力される。学習済みモデルは、例えば、複数の特性のそれぞれを目的変数とし1つの行動情報を説明変数としてモデル化されているので、推定ユーザ一人について複数の目的変数のそれぞれのセグメントに対する当てはまり度が算出され、その中で最大当てはまり度を算出したセグメントが採用されて推定ユーザの特性が決定される。例えば、後述する図6において、最大当てはまり度を算出したセグメントSe1の特性01が推定ユーザの特性として決定される。
【0034】
[2.通信システムSの概要構成及び機能]
次に、図3を参照して、本発明が適用される通信システムSの概要構成について説明する。図3は、通信システムSの概要構成の一例を示す図である。
【0035】
図3に示すように、通信システムSは、アンケート管理サーバ(リサーチサーバ)1、行動履歴管理サーバ2、及び特性推定サーバ3等を含んで構成される。アンケート管理サーバ1、及び行動履歴管理サーバ2は、それぞれ、特性推定サーバ3との間で、例えばイントラネットを介して通信可能になっている。なお、アンケート管理サーバ1、行動履歴管理サーバ2、及び特性推定サーバ3は、1つのサーバにより構成されてもよい。
【0036】
(2−1.アンケート管理サーバ1)
アンケート管理サーバ1は、対象ユーザに対して実施されたアンケートの結果を管理するサーバである。例えば、アンケート管理サーバ1は、アンケートに係る質問情報を複数の対象ユーザのそれぞれのユーザ端末UTm(m=1,2,3・・・)へインターネット等の通信ネットワークNWを介して送信し、アンケートに係る回答情報をそれぞれのユーザ端末UTmから受信し、それぞれの回答情報が示す回答をアンケート結果として、それぞれの対象ユーザのユーザIDに対応付けてアンケートデータベース(DB)101に格納する。なお、ユーザ端末UTmには、対象ユーザに使用されるものと、推定ユーザに使用されるものとがある。ユーザ端末UTmの例として、パーソナルコンピュータ、スマートフォン、タブレット、及びゲーム機等が挙げられる。
【0037】
アンケートに係る質問情報及び回答情報は、電子メールで対象ユーザのユーザ端末UTmへ送信されてもよいし、対象ユーザのユーザ端末UTmのブラウザやアプリケーションによるリクエストに応じて当該ユーザ端末UTmへ送信されてもよい。アンケートに係る質問情報には、対象ユーザの特性を判別するための複数の質問(アンケートの質問事項(設問))及び各質問に対する回答の選択肢(アンケート選択肢であり、例えば、5つ)が記述されており、アンケートに係る回答情報には、各質問に対して選択された回答が記述されている。なお、アンケート管理サーバ1は、本発明に係る特性推定装置の分類手段の機能を有してもよい。
【0038】
(2−2.行動履歴管理サーバ2)
行動履歴管理サーバ2は、オンラインまたはオフラインでユーザにより行われた行動の履歴(行動履歴)を管理するサーバである。例えば、行動履歴管理サーバ2は、ユーザ端末UTmや処理端末STn(n=1,2,3・・・)から通信ネットワークNWを介してアクセス可能なサーバSAo(o=1,2,3・・・)から、それぞれのユーザ(対象ユーザ及び推定ユーザ)の行動履歴を収集し、それぞれの行動履歴をそれぞれのユーザのユーザIDに対応付けて行動履歴データベース201に格納する。なお、処理端末STnの例として、例えば店舗に設置され、ユーザが所持する決済用カード(例えば、電子マネー決済やクレジット決済等が可能なICカード等)またはユーザ端末UTm(例えば、電子マネー決済やクレジット決済等が可能な決済用アプリケーションが搭載されたスマートフォン等)と通信可能な決済処理端末が挙げられる。また、処理端末STnの例として、商品等の展示会やイベント等の会場に設置された入場処理端末が挙げられる。
【0039】
サーバSAoの例として、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、トラベル予約サーバ、テレビ視聴解析サーバ、決済処理サーバ、動画/楽曲ストリーミングサーバ、SNS(Social Networking Service)サーバ、チケット発行管理サーバ、及び実行動追跡サーバ等が挙げられる。ここで、より多くのサーバSAoから広く、ユーザの行動履歴を収集することができれば、学習済みモデルを用いた推定精度を向上させることが可能となる。そのため、ユーザを識別するユーザIDが、より多くのサーバSAo間で共通する、または関連付けるように構成することが望ましい。
【0040】
行動履歴には、通信ネットワークNWを介してユーザがオンラインでおこなった行動(例えば、商品またはサービス等の検索、商品またはサービス等の閲覧、商品またはサービスに対する支払(購入)、商品またはサービス等に対する投稿等)の履歴ばかりでなく、ユーザが実店舗に赴いてオフラインでおこなった行動(例えば、商品やサービスに対する支払等)の履歴、さらにはユーザが商品等の展示会やイベント等に赴いて入場した行動の履歴等を含むとよい。行動履歴の例として、商品またはサービスの検索履歴、商品またはサービスの閲覧履歴、商品またはサービスのブックマーク登録履歴(お気に入り登録)、商品またはサービスの予約履歴(商品の場合、購入予約履歴)、商品またはサービスに対する支払履歴(商品の場合、購入履歴)、商品またはサービスに対するコメント(クチコミ)またはツイート等の投稿履歴、商品としての動画または楽曲の再生履歴、及び商品の展示会やイベント等の会場への入場履歴等が挙げられ、どの行動履歴が特性推定サーバ3により利用されるかは例えば管理者等により任意に設定される。
【0041】
検索履歴及び閲覧履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。検索履歴には、商品またはサービスの情報の公開日時(つまり、ユーザにより検索可能になった日時)、商品またはサービスの検索日時、検索条件(検索に用いられたキーワード)、及び検索対象の商品またはサービスの情報(例えば、ID、名称、カテゴリー、価格)等が含まれる。閲覧履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。閲覧履歴には、商品またはサービスの情報の公開日時(つまり、ユーザにより閲覧可能になった日時)、商品またはサービスの閲覧日時、及び閲覧対象の商品またはサービスの情報(例えば、ID、名称、カテゴリー、価格)等が含まれる。
【0042】
なお、閲覧履歴は、テレビ放送の電波受信によりテレビ画面に表示された商品またはサービスの閲覧履歴であってもよい。この場合、例えばユーザ端末UTm(例えば、スマートフォン)が搭載するマイクにより取得された音声データがテレビ視聴解析サーバにより取得される。そして、テレビ視聴解析サーバは、取得した音声データとオリジナル(マスタ)の音声データとを照合してユーザがどの時間の映像を視聴していたかを判定することで、商品またはサービスの閲覧日時、及び閲覧された商品またはサービスの情報を特定し、閲覧履歴として記憶する。或いは、テレビ画面にユーザへの選択ボタンの選択を促す情報を表示させ、例えばユーザ端末UTm(例えば、スマートフォン)に表示された選択ボタンがユーザにより押下されると、その押下信号がテレビ視聴解析サーバにより取得される。そして、テレビ視聴解析サーバは、取得した押下信号の取得日時からユーザがどの時間の映像を視聴していたかを判定することで、商品またはサービスの閲覧日時、及び閲覧された商品またはサービスの情報を特定し、閲覧履歴として記憶する。
【0043】
ブックマーク登録履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。ブックマーク登録履歴には、商品またはサービスの情報の公開日時、商品またはサービスのブックマーク登録日時、及びブックマーク登録対象の商品またはサービスの情報等が含まれる。予約履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。予約履歴には、商品またはサービスの情報の公開日時、商品またはサービスの予約日時、及び予約対象の商品またはサービスの情報等が含まれる。支払履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、トラベル予約サーバ、及び決済処理サーバに記憶される。支払履歴には、商品またはサービスの情報の公開日時、商品またはサービスに対する支払日時、及び支払対象の商品またはサービスの情報等が含まれる。
【0044】
投稿履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、トラベル予約サーバ、動画/楽曲ストリーミングサーバ、及びSNSサーバに記憶される。投稿履歴には、商品またはサービスの情報の公開日時、商品またはサービスに対するコメントまたはツイート等の投稿日時、投稿内容、投稿対象の商品またはサービスの情報等が含まれる。なお、投稿履歴には、投稿したユーザのフォロワー数が含まれるとよい。再生履歴は、例えば、動画/楽曲ストリーミングサーバに記憶される。再生履歴には、商品(動画または楽曲)の情報の公開日時、商品の再生日時、及び再生対象の商品の情報等が含まれる。
【0045】
入場履歴は、例えば、チケット発行管理サーバに記憶される。入場履歴には、商品の展示会やイベント等の会場への入場日時、及び展示対象の商品の情報等が含まれる。例えば、チケット発行管理サーバにより発行されたチケットが会場に設置された処理端末STnにより検知されると、発行されたチケットの番号等がチケット発行管理サーバにより取得される。そして、チケット発行管理サーバは、取得したチケットの番号等の取得時刻から入場日時を判定し、当該チケットの番号等から展示対象の商品の情報を特定し、入場履歴として記憶する。
【0046】
なお、入場履歴は、実行動追跡サーバに記憶される場合もある。ユーザ端末UTmがGPS(Global Positioning System)機能、及びGPS機能により検出された位置情報(
緯度及び経度)を取得して実行動追跡サーバに送信するアプリケーションを搭載する場合、取得した位置情報を例えば所定時間間隔で実行動追跡サーバへ送信する。そして、実行動追跡サーバは、ユーザ端末UTmから受信した位置情報及び受信日時と、予め用意されたリストに記述される展示会やイベント等の会場の位置情報及び実施日時とを照合することで、ユーザが実際に当該会場に行ったと判定した場合、その会場への入場日時、及び展示対象の商品の情報等を含む入場履歴を記憶する。
【0047】
(2−3.特性推定サーバ3)
特性推定サーバ3は、単独で、またはアンケート管理サーバ1と共に、本発明に係る特性推定装置として機能するサーバである。図4(A)は、特性推定サーバ3のハードウェア構成例を示す図であり、図4(B)は、特性推定サーバ3のシステム制御部33の機能ブロック例を示す図である。なお、図示しないが、特性推定サーバ3にはオペレータの端末が接続可能になっている。
【0048】
図4(A)に示すように、特性推定サーバ3は、通信部31、記憶部32、及びシステム制御部33等を備え、これらの構成要素はシステムバス34に接続されている。通信部31は、例えばイントラネットに接続され、アンケート管理サーバ1及び行動履歴管理サーバ2との間の通信状態の制御を行う。
【0049】
記憶部32は、例えば、ハードディスクドライブ等により構成されており、OS及び本発明の特性推定プログラム等の各種プログラムを記憶する。なお、特性推定プログラムは、所定のサーバから特性推定サーバ3にダウンロードされてもよいし、CD、DVD、BDなどの記録媒体に記録(コンピュータにより読み取り可能に記録)されており、当該記録媒体から読み込まれて記憶部32に記憶されるようにしてもよい。
【0050】
また、記憶部32には、ユーザ情報データベース301等が構築されている。図5は、ユーザ情報データベース301の内容の一例を示す図である。図5に示すユーザ情報データベース301には、例えば所定のサイトの利用会員としてアカウントが発行された各ユーザのユーザID、ユーザ名、ユーザ種別、及び特性等が対応付けられて格納されている。ここで、ユーザ種別は、教師ユーザであるか否かを示す(図中、“1”が教師ユーザを示す)。ユーザの特性は、5つの特性01〜05のうち何れかの特性が付与されている。なお、ユーザ情報データベース301において特性が空欄のユーザは、まだ特性が推定されていないユーザである。
【0051】
システム制御部33(本発明におけるコンピュータの一例)は、CPU(Central Processing Unit)33a,ROM(Read Only Memory)33b,及びRAM(Random Access
Memory)33c等を備え、OS上で特性推定プログラム等を実行する。システム制御部
33は、特性推定プログラムを実行することにより、図4(B)に示すように、対象ユーザ分類部331、教師ユーザ特定部332、モデル生成部333、特性推定部334、モデル更新部335、及び分類基準変更部336等として機能する。なお、対象ユーザ分類部331は、本発明における分類手段の一例である。教師ユーザ特定部332は、本発明における判断手段の一例である。モデル生成部333は、本発明における生成手段の一例である。特性推定部334は、本発明における推定手段の一例である。モデル更新部335は、本発明における更新手段の一例である。分類基準変更部336は、本発明における変更手段の一例である。
【0052】
(2−3−1.対象ユーザ分類部331)
先ず、対象ユーザ分類部331は、アカウントが発行された全ユーザの中から決定された複数の対象ユーザ(つまり、全ユーザの中の一部のユーザ)のそれぞれに対するアンケートの結果をアンケート管理サーバ1のアンケートデータベース101から取得し、複数の対象ユーザのそれぞれの回答に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類する。このような分類方法は種々考えられるが、例えば、質問に対する回答の選択肢と配点(得点の元になる点数)との対応関係を記述する回答配点表データと、合計得点(スコア)と特性との対応関係を記述する特性判別条件データ(換言すると、セグメント定義データ)とが用いられるとよい。
【0053】
一例として、回答配点表データでは、選択肢1(あてはまる)には+2点、選択肢2(まあまああてはまる)には+1点、選択肢3(どちらともいえない)には0点、選択肢4(あまりあてはまらない)には−1点、選択肢5(あてはまらない)には−2点、・・・というように対応付けられている。また、一例として、特性判別条件データでは、合計得点12点以上には特性C01(例えば、イノベータ)、合計得点5〜11には特性C02(例えば、アーリーアダプタ)、合計得点−2〜4には特性C03(例えば、アーリーマジョリティ)、・・・というように対応付けられている。
【0054】
例えば、対象ユーザ分類部331は、上記回答配点表データを参照することで、各質問に対する回答(何れかの選択肢)に対応する得点を質問毎に決定し、決定した各得点を全質問について合計することで合計得点を算出(対象ユーザ毎に算出)する。そして、対象ユーザ分類部331は、特性判別条件データを参照し、算出した合計得点に対応する特性を対象ユーザに付与することで、当該複数の対象ユーザを複数の特性のうちのいずれかの特性に分類(対象ユーザ毎に分類)する。こうして、対象ユーザに付与された特性は、当該対象ユーザのユーザIDに対応付けられてユーザ情報データベース301に格納されることになる。
【0055】
なお、アンケート管理サーバ1が複数の対象ユーザのそれぞれの回答に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類してもよい。この場合、対象ユーザ分類部331は、対象ユーザ(ユーザID)と特性との対応関係を示す情報をアンケート管理サーバ1から取得することになる。
【0056】
(2−3−2.教師ユーザ特定部332)
次に、教師ユーザ特定部332は、複数の対象ユーザのそれぞれの行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得し、取得した行動履歴がアンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを対象ユーザ毎に判断し、当該対象ユーザのうち行動履歴が上記基準を満たすと判断された対象ユーザを教師ユーザとして特定する。ここで、「特性に関連して設定された基準」には、「特性ごとに設定された基準」、「特性を横断した連続性を有する基準」、及び「ユーザ全体の行動履歴に基づく行動分布と特性との対応関係を示す基準」のうち、少なくとも何れか一つが含まれる。特性ごとに設定された基準を満たすか否かの判断には、例えば、アンケートの質問事項や回答の選択肢に使われる用語と共通する属性の情報(商品名やサービス名など)を検索しているか、当該情報における商品を購買しているか、当該情報におけるサービスを利用しているか、または、商品名やサービス名だけでなく、共通のブランド、店舗を含む検索、これに関わる行動(購買行動や利用行動など)をしているか、を判断することを含むとよい。さらに、この基準を満たすか否かの判断には、アンケートの質問事項等に関連する地域や時期の検索、当該地域や時期に行動(購買行動や利用行動など)をしているかを判断することを含むとよい。
【0057】
また、特性を横断した連続性を有する基準を満たすか否かの判断の例として、特定の商品(例えば、トレンド商品)が一般公開されてから対象ユーザがそのウェブページにアクセスするまでの時間(アクセスタイミング)に基づいて、当該公開から例えば3日以内に上記ウェブページにアクセスしていたのか(この場合、特性01に該当)、或いは、4日以降かつ14日以内に上記ウェブページにアクセスしていたのか(この場合、特性02に該当)、を判断することが挙げられる。この場合、例えば、特性01に分類された対象ユーザが、4日以降かつ14日以内に上記ウェブページにアクセスしていた場合、当該基準を満たさないとして教師ユーザから除外される。また、ユーザ全体の行動履歴に基づく行動分布(換言すると、実行動データ集合の分布)と特性との対応関係を示す基準の例として、ある分野(例えば、自動車分野)のソーシャルメディアのアクセスログの全体分布(行動分布)において特性01から特性05の中で、特性01や特性02は特性04や特性05よりも当該分野のソーシャルメディアにおける情報発信量や情報受信量が多いという基準が挙げられる。この場合、例えば、アンケートにより特性01に分類された対象ユーザの情報発信量が当該ソーシャルメディアのアクセスログの全体分布のうち、下位レベル(例えば、平均以下の分布層)に含まれる場合、当該基準を満たさないとして教師ユーザから除外される。
【0058】
教師ユーザを特定するための好適な例として、教師ユーザ特定部332は、個々の事象から蓋然性の高い特性を導き出す帰納的な仮説検証項目群を特性ごとに設定(仮説検証項目は特性間で重複してもよい)し、対象ユーザの行動履歴から抽出された行動情報に基づいて、当該仮説検証項目群に対する該当率が所定の割合を超えたか否かを判断し、当該該当率が所定の割合を超えた対象ユーザ(つまり、基準を満たすと判断された対象ユーザ)を教師ユーザとして特定するとよい。ここで、仮説検証項目群に対する該当率は、例えば、複数の仮説検証項目のそれぞれに対する該当有無(該当するか否か)を対象ユーザの行動履歴に基づいて算出した結果に基づく(=該当数/仮説検証項目の総数)。仮説検証項目群は、アンケートと共通の仮説に基づき特性ごとに設定されるものであり、例えば、アンケートの質問及び回答の選択肢に対応し、アンケートの質問及び回答の選択肢を補完する項目群とするとよい。これにより、例えば、あるトレンド商品や新製品を購入した対象ユーザがアンケート結果に基づき特性01と判別されたときに、その対象ユーザについての仮説検証項目群に対する該当率から当該特性01の確からしさを判断(換言すると、特性01であることを実証)することができる。例えば、特定の商品(例えば、新製品)またはサービスの予約注文の有無、特定の商品(例えば、トレンド商品)またはサービスの検索または閲覧の有無、特定の商品(例えば、トレンド商品)の購入の有無、特定のサービスの利用の有無、公開された情報(例えば、特定の商品またはサービスの情報)へのユーザのアクセスタイミング、公開された情報(例えば、特定の商品またはサービスの情報)に対するユーザの情報発信量、及び公開された情報に対するユーザの行動力(例えば、特定の商品の展示会やイベント等の会場へ行ったか否か)などに基づいて仮説検証項目群が設定される。
【0059】
ここで、情報発信量とは、例えば、コメント(またはツイート)の投稿数と、1コメント(または1ツイート)あたりのデータ量(文字数でもよい)とのうちの少なくとも何れか一方である。また、アクセスタイミングは、例えば、情報(例えば、商品またはサービスの情報)が公開された日から3日以内までのアクセス、情報が公開された日から4日〜14日までのアクセス、・・・というように複数段階に分けることができる。情報発信量は、公開された情報に対するコメント投稿数100件以上(または、1コメントあたりの文字数が300文字以上)、公開された情報に対するコメント投稿数60件〜99件(または、1コメントあたりの文字数が100〜299文字)、・・・というように複数段階に分けることができる。教師ユーザ特定部332は、ユーザのフォロワー数に基づいて仮説検証項目群を設定してもよい。なお、前述の基準を用いることにより、特性推定サーバ3は、特性を横断した連続性を有する仮説検証項目(例えば、アクセスタイミング)における複数段階のうち、どの段階に該当するかを対象ユーザの行動履歴に基づいて判断し、当該判断された段階(例えば、公開された日から3日以内までのアクセス)と、アンケート結果に基づき分類された当該対象ユーザの特性と、が関連(または合致)する場合に当該対象ユーザを教師ユーザとして特定してもよい。また、特性推定サーバ3は、ユーザ全体の行動履歴に基づく行動分布と特性との対応関係を示す仮説検証項目において、当該行動分布中のどのレベルに該当するかを対象ユーザの行動履歴に基づいて判断し、当該判断されたレベル(例えば、下位レベル)と、アンケート結果に基づき分類された当該対象ユーザの特性と、が関連(または合致)する場合に当該対象ユーザを教師ユーザとして特定してもよい。
【0060】
(2−3−3.モデル生成部333)
次に、モデル生成部333は、教師ユーザ特定部332により特定された教師ユーザの行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する。ここで、行動情報は、例えば複数項目のデータを設定可能なデータフォーマットに行動履歴から抽出されたデータを設定することで得られる。この項目の例として、特定の商品またはサービスの予約注文の有無、特定の商品またはサービスの検索または閲覧の有無、特定の商品の購入の有無、特定のサービスの利用の有無、検索回数(または検索頻度)、検索条件、閲覧回数(または閲覧頻度)、支払回数(または支払頻度)、投稿回数(投稿頻度)、アクセスタイミング、情報発信量などが挙げられる。
【0061】
学習済みモデルには、例えば、決定木が採用される。決定木とは、所定の分岐ルール(分類基準の一例)にしたがって条件分岐によりセグメントを分割して分類する手法である。このような決定木において、複数の目的変数のそれぞれのセグメントに対する当てはまり度が算出される。図6は、決定木における条件分岐の例を示す概念図である。図6に示すセグメント内には、それぞれの特性と特定された人数の割合(出現率)を示している。図6に示すセグメントSe1及びSe2内の“x”,“xx”は、それぞれ、数値を示しており、“x”よりも“xx”の方が大きい数値であることを示す。
【0062】
例えば、アンケートにより分類された教師データは、特性01〜特性05に分類され、それぞれの特性について人数の割合(出現率)が特定される。この集合が、様々な説明変数を用いて目的変数とする特性毎に分類される。ここでは、例えば、商品ABCの購入(X1)、商品XYZの購入(X2)、所定のトレンドを表現するキーワードの検索(X3)、を含む項目が説明変数となる分岐ルールが設定されたことになる。これらを説明変数として決定木を用いて分類していくと、例えば、セグメントSe1は一つの特性01の出現率xxが規定値yy以上になったことを示す。この場合の説明変数は分岐ルールを参照するとX1とX2となる。このように、一つの目的変数である特性01の当てはまり度が所定の基準以上となるように分岐ルールが設定され、説明変数X1、X2を用いた分類として特定される。同様に、セグメントSe2は特性02の出現率xxが規定以上となるような分岐ルールにより説明変数X1、X2、X3とした特性02の集合として特定される。
【0063】
なお、学習済みモデルの生成において、複数の教師ユーザのそれぞれの教師データのうち、一部の教師データをトレーニングデータとして学習済みモデルを構築し、残りの一部をテストデータとして学習済みモデルの検証を行うとよい。また、学習済みモデルを生成するための教師有りの機械学習のアルゴリズムは、特に限定されるものではないが、例えば、勾配ブースティング(Gradient Boosting)、または勾配ブースティングとランダム
フォレスト(Random Forests)を組み合わせたXGBoostが用いられてもよい。勾配ブース
ティングは、複数の決定木を作成して集団で学習させる方法であり、学習済みモデルとして複数の決定木を構築し、1つ前までの決定木の情報を用いて新たな決定木を構築していくブースティングを行うようになっている。具体的には、1つ前の決定木では予測できなかった損失関数の勾配を目的変数として新たな決定木が構築される。各決定木において、説明変数は根から枝に行く途中で条件により分類され、末端の葉に辿り着くと、当該末端の葉に与えられた値が予測値として返されるようになっている。XGBoostは、勾配ブース
ティングの方法と基本的には同じであるが、ランダムフォレストを採用しているため、全ての説明変数が使用されるのではなく、ランダムに決定された割合で説明変数の数が選定されて決定木が構築される。
【0064】
(2−3−4.特性推定部334)
次に、特性推定部334は、例えば所定のサイトの利用会員としてアカウントが発行された全ユーザの中から推定対象として決定された推定ユーザ(教師ユーザ以外のユーザ)の行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得し、取得した行動履歴から抽出された行動情報と、モデル生成部333により生成された学習済みモデルとを用いて、当該推定ユーザの特性を推定する。すなわち、特性推定部334は、行動履歴から抽出された行動情報を学習済みモデルに入力することで当該行動情報に対する特性(予測値)を得る。こうして推定ユーザについて推定された特性は、当該推定ユーザのユーザIDに対応付けられてユーザ情報データベース301に格納されることになる。なお、推定ユーザの行動履歴が更新された場合、特性推定部334は、当該更新された行動履歴から抽出された行動情報と、学習済みモデルとを用いて当該推定ユーザの特性を再推定することにより更新するとよい。これにより、推定ユーザついて推定される特性を当該推定ユーザの行動履歴の変化に対応させることができる。
【0065】
(2−3−5.モデル更新部335)
対象ユーザの行動履歴が更新されることで教師ユーザの行動履歴が更新された場合、モデル更新部335は、当該更新された行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データを用いて学習済みモデル(学習済みモデルにおける係数(パラメータ))を更新する。これにより、例えば所定期間毎に変化するトレンド(流行)等に応じて学習済みモデルを更新することができる。この場合において、教師ユーザ特定部332は、更新された、教師ユーザの行動履歴が上記基準を満たすか否かを判断し、モデル更新部335は、当該基準を満たすと判断された教師ユーザの更新された行動履歴から抽出された行動情報を説明変数とし、当該教師ユーザの特性を目的変数とした学習データを用いて学習済みモデルを更新するとよい。これにより、教師ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。
【0066】
また、教師ユーザの行動履歴が更新されることによる学習済みモデルの更新間隔は、推定ユーザの特性の更新(再推定)間隔よりも長くなるようにするとよい。これにより、教師ユーザの行動履歴が更新されることによる学習済みモデルの更新を最低限に留め、サーバ負荷を低減することができる。なお、モデル更新部335は、推定ユーザの特性が推定された場合、当該推定ユーザの行動履歴から抽出された行動情報を説明変数とし、当該推定ユーザの推定された特性を目的変数とした学習データを用いて学習済みモデルを更新してもよい。
【0067】
(2−3−6.分類基準変更部336)
推定ユーザの行動履歴が更新された場合、分類基準変更部336は、上記学習済みモデルにおける所定の分岐ルールにおいて、推定された特性に属する推定ユーザの出現率が同等となる条件、および、推定された特性に属する推定ユーザが所定の一致度を有する条件、を満たすように、当該分岐ルールを変更する。この理由を以下に説明する。
【0068】
推定ユーザの行動履歴が変化することにより、例えば、図6に示す「商品XYZ」を購入
した人数が増えると、分岐ルールでは、特性01の出現率(例えば、10%)が増加してしまう。そのため、特性01の出現率が例えば10%で同等に維持されるよう(つまり、推定
された特性に属する推定ユーザの出現率が同等となる条件を満たすよう)、分岐ルールを変更する(この変更は、学習済みモデルの変更に相当)。分岐ルールを変更の例として、説明変数の「商品XYZ」購入(X2)の重み付け(係数)を変えること、説明変数の「商品XYZ」購入(X2)を「商品ABC」購入(X1)に入れ替えること、「商品ABC」購入(X1)の分岐を新たに追加すること、などの分岐構成を変えることが挙げられる。言い換えれば、推定ユーザの行動履歴が変更されると、学習済みモデルの変数構成や重みづけが変わるので、その変更を加味して全体最適なモデルを作り直す。
【0069】
しかし、出現率を同等に維持するだけでは全く違う分類になってしまうことが想定されるので、制約条件として、学習済みモデルの変更前後で個々の推定ユーザが他の特性に移ってしまう割合を低く設定(例えば、学習済みモデルの変更前後の一致度を9割以上に設定)する(つまり、推定された特性に属する推定ユーザが所定の一致度を有する条件を満たすように設定する)。これにより、特性が推定された推定ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。
【0070】
なお、推定ユーザの行動履歴が更新されることによる(分類基準変更部336による)学習済みモデルの変更間隔は、教師ユーザの行動履歴が更新されることによる(モデル更新部335による)学習済みモデルの更新間隔よりも短くなるようにするとよい。これにより、教師ユーザの行動履歴が更新されることによる学習済みモデルの更新を最低限に留め、サーバ負荷を低減することができる。
【0071】
[3.特性推定サーバ3の各種処理]
次に、特性推定サーバ3のシステム制御部33により実行される各種処理について説明する。
【0072】
(3−1.学習済みモデル生成処理)
先ず、図7を参照して、システム制御部33により実行される学習済みモデル生成処理について説明する。図7は、システム制御部33により実行される学習済みモデル生成処理の一例を示すフローチャートである。
【0073】
図7に示す学習済みモデル生成処理は、例えばオペレータからの指示に応じて開始される。図7に示す処理が開始されると、システム制御部33は、ユーザ情報データベース301から特定可能な複数の対象ユーザ(予め決定された複数の対象ユーザ)のそれぞれのアンケート結果をアンケート管理サーバ1のアンケートデータベース101から取得する(ステップS1)。例えば、システム制御部33は、それぞれの対象ユーザのユーザID(またはユーザ名)が記述された対象ユーザリストを含む要求をアンケート管理サーバ1へ送信することで、それぞれの対象ユーザのアンケート結果をアンケート管理サーバ1から取得する。こうして取得されたアンケート結果は、例えば、それぞれの対象ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。
【0074】
次いで、システム制御部33は、上記複数の対象ユーザのそれぞれの行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS2)。例えば、システム制御部33は、上記対象ユーザリストを含む要求を行動履歴管理サーバ2へ送信することで、それぞれの対象ユーザの行動履歴を行動履歴管理サーバ2から取得する。こうして取得された行動履歴は、例えば、それぞれの対象ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。
【0075】
次いで、システム制御部33は、アンケート結果及び行動履歴が取得された対象ユーザの中から対象ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS3)。
【0076】
次いで、システム制御部33(対象ユーザ分類部331)は、ステップS3で選定された対象ユーザのアンケート結果(回答)に基づいて、当該対象ユーザが予め設定された複数の特性のうちのいずれかの特性に分類されるかを特定する(ステップS4)。これにより特定された特性は、例えば、当該対象ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。
【0077】
次いで、システム制御部33(教師ユーザ特定部332)は、ステップS3で選定された対象ユーザの行動履歴がアンケートと共通の仮説に基づき設定された基準を満たすか否かを判断する(ステップS5)。システム制御部33(教師ユーザ特定部332)は、当該対象ユーザの行動履歴が当該基準を満たすと判断した場合(ステップS5:YES)、当該対象ユーザを教師ユーザとして特定し(ステップS6)、ステップS7へ進む。こうして教師ユーザとして特定された対象ユーザのユーザID(またはユーザ名)に対応付けられて、教師ユーザを示すユーザ種別がメモリに記憶される。一方、システム制御部33(教師ユーザ特定部332)は、当該対象ユーザの行動履歴が当該基準を満たさないと判断した場合(ステップS5:NO)、当該対象ユーザを教師ユーザとして特定せずにステップS7へ進む。
【0078】
ステップS7では、システム制御部33は、アンケート結果及び行動履歴が取得された対象ユーザのうち、まだ選定されていない対象ユーザがあるか否かを判定する。システム制御部33は、まだ選定されていない対象ユーザがあると判定した場合には(ステップS7:YES)、ステップS3へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない対象ユーザがないと判定した場合には(ステップS7:NO)、ステップS8へ進む。
【0079】
ステップS8では、システム制御部33(モデル生成部333)は、ステップS6で特定された教師ユーザのそれぞれの行動履歴から抽出された行動情報を説明変数とし、ステップS6で特定された教師ユーザのそれぞれの特性を目的変数とした学習データにより学習した学習済みモデルを生成する。こうして生成された学習済みモデルは、後述する特性推定処理において用いられる。
【0080】
次いで、システム制御部33は、それぞれの対象ユーザについてステップS4で特定された特性を、それぞれの対象ユーザのユーザIDに対応付けてユーザ情報データベース301に格納し、さらに、ステップS6で教師ユーザとして特定された対象ユーザについては、教師ユーザを示すユーザ種別を、当該対象ユーザのユーザID(またはユーザ名)に対応付けてユーザ情報データベース301に格納し(ステップS9)、図7に示す処理を終了する。
【0081】
なお、学習済みモデル生成処理は、対象ユーザに対して新たにアンケートが実施された場合、再び実行されることになる。
【0082】
(3−2.特性推定処理)
次に、図8を参照して、システム制御部33により実行される特性推定処理について説明する。図8は、システム制御部33により実行される特性推定処理の一例を示すフローチャートである。
【0083】
図8に示す特性推定処理は、例えばオペレータからの指示に応じて開始される。図8に示す処理が開始されると、システム制御部33は、ユーザ情報データベース301から特定可能な1以上の推定ユーザ(例えば、特性がまだ推定されていない1以上の推定ユーザ)の行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS11)。例えば、システム制御部33は、推定ユーザのユーザID(またはユーザ名)が記述された推定ユーザリストを含む要求を行動履歴管理サーバ2へ送信することで、推定ユーザの行動履歴を行動履歴管理サーバ2から取得する。こうして取得された行動履歴は、例えば、推定ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。
【0084】
次いで、システム制御部33は、行動履歴が取得された推定ユーザの中から推定ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS12)。
【0085】
次いで、システム制御部33(特性推定部334)は、ステップS12で選定された推定ユーザの行動履歴から抽出された行動情報を学習済みモデルに入力することで当該行動情報に対する特性を推定する(ステップS13)。こうして推定された特性は、例えば、当該推定ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。このように、アンケートの対象者でない推定ユーザ群にまで拡張して特性を付与することができる。
【0086】
なお、システム制御部33(モデル更新部335)は、ステップS13で特性が推定された推定ユーザの行動履歴から抽出された行動情報を説明変数とし、当該推定ユーザの推定された特性を目的変数とした学習データを用いて学習済みモデルを更新してもよい。
【0087】
次いで、システム制御部33は、行動履歴が取得された推定ユーザのうち、まだ選定されていない推定ユーザがあるか否かを判定する(ステップS14)。システム制御部33は、まだ選定されていない推定ユーザがあると判定した場合には(ステップS14:YES)、ステップS12へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない推定ユーザがないと判定した場合には(ステップS14:NO)、ステップS15へ進む。
【0088】
ステップS15では、システム制御部33は、推定ユーザについてステップS13で推定された特性を、推定ユーザのユーザIDに対応付けてユーザ情報データベース301に格納し、図8に示す処理を終了する。
【0089】
なお、特性推定処理は、新たにアカウントが発行されたユーザに対して実行されることになる。
【0090】
(3−3.特性更新処理)
次に、図9を参照して、システム制御部33により実行される特性更新処理について説明する。図9は、システム制御部33により実行される特性更新処理の一例を示すフローチャートである。
【0091】
図9に示す特性更新処理は、例えば所定時間間隔(例えば、24時間毎、または1週間毎)に実行される。図9に示す処理が開始されると、システム制御部33は、行動履歴が更新されたユーザのリストを行動履歴管理サーバ2から取得する(ステップS21)。このリストには、例えば、行動履歴が更新されたユーザのユーザID(またはユーザ名)が記述されている。
【0092】
次いで、システム制御部33は、ユーザ情報データベース301を参照することで、ステップS21で取得されたリストから推定ユーザを特定し、特定した1以上の推定ユーザの更新後の行動履歴を、上記ステップS11と同じように、行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS22)。
【0093】
次いで、システム制御部33は、更新後の行動履歴が取得された推定ユーザの中から推定ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS23)。
【0094】
次いで、システム制御部33(特性推定部334)は、ステップS23で選定された推定ユーザの更新後の行動履歴から抽出された行動情報を、上記学習済みモデルに入力することで当該行動情報に対する特性を再推定する(ステップS24)。こうして再推定された特性は、例えば、当該推定ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。
【0095】
なお、システム制御部33(分類基準変更部336)は、ステップS24の前または後において、上記学習済みモデルにおける所定の分岐ルールにおいて、推定された特性に属する推定ユーザの出現率が同等となる条件、および、推定された特性に属する推定ユーザが所定の一致度を有する条件、を満たすように、当該分岐ルールを変更するとよい。
【0096】
次いで、システム制御部33は、更新後の行動履歴が取得された推定ユーザのうち、まだ選定されていない推定ユーザがあるか否かを判定する(ステップS25)。システム制御部33は、まだ選定されていない推定ユーザがあると判定した場合には(ステップS25:YES)、ステップS23へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない推定ユーザがないと判定した場合には(ステップS25:NO)、ステップS26へ進む。
【0097】
ステップS26では、システム制御部33は、推定ユーザについてステップS24で再推定された特性を、推定ユーザのユーザIDに対応付けてユーザ情報データベース301に格納(上書き更新)し、図9に示す処理を終了する。
【0098】
(3−4.学習済みモデル更新処理)
次に、図10を参照して、システム制御部33により実行される学習済みモデル更新処理について説明する。図10は、システム制御部33により実行される学習済みモデル更新処理の一例を示すフローチャートである。
【0099】
図10に示す学習済みモデル更新処理は、特性更新処理よりも長い時間間隔(例えば、半年毎、または1年毎)に実行される。図10に示す処理が開始されると、システム制御部33は、行動履歴が更新されたユーザのリストを行動履歴管理サーバ2から取得する(ステップS31)。
【0100】
次いで、システム制御部33は、ユーザ情報データベース301を参照することで、ステップS31で取得されたリストから教師ユーザを所定数以上特定できたか否かを判定する(ステップS32)。この所定数は、ユーザ情報データベース301から特定可能な教師ユーザの総数の例えば1%〜5%の割合に応じた数としてもよい。システム制御部33は、取得されたリストから教師ユーザを所定数以上特定できたと判定した場合には(ステップS32:YES)、ステップS33へ進む。一方、システム制御部33は、取得されたリストから教師ユーザを所定数以上特定できないと判定した場合には(ステップS32:NO)、図10に示す処理を終了する。
【0101】
ステップS33では、システム制御部33は、行動履歴が更新された教師ユーザの特性をユーザ情報データベース301から取得する。次いで、システム制御部33は、行動履歴が更新された教師ユーザの更新後の行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS34)。
【0102】
次いで、システム制御部33は、行動履歴が更新された教師ユーザの中から教師ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS35)。
【0103】
次いで、システム制御部33(教師ユーザ特定部332)は、ステップS35で選定された教師ユーザの更新後の行動履歴がアンケートと共通の仮説に基づき設定された基準を満たすか否かを判断する(ステップS36)。システム制御部33(教師ユーザ特定部332)は、当該教師ユーザの更新後の行動履歴が当該基準を満たすと判断した場合(ステップS36:YES)、当該教師ユーザを特定し(ステップS37)、ステップS38へ進む。一方、システム制御部33(教師ユーザ特定部332)は、当該教師ユーザの更新後の行動履歴が当該基準を満たさないと判断した場合(ステップS36:NO)、教師ユーザとして特定せず(採用せず)にステップS38へ進む。
【0104】
なお、別の例として、ステップS35〜S38の処理は行われないように構成してもよい。すなわち、教師ユーザの行動履歴が更新された場合、システム制御部33は、教師ユーザの更新後の行動履歴が上記基準を満たすか否かを判断することなく、教師ユーザの更新後の行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データを用いて学習済みモデルを更新してもよい。
【0105】
ステップS38では、システム制御部33は、行動履歴が更新された教師ユーザのうち、まだ選定されていない教師ユーザがあるか否かを判定する。システム制御部33は、まだ選定されていない教師ユーザがあると判定した場合には(ステップS38:YES)、ステップS35へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない教師ユーザがないと判定した場合には(ステップS38:NO)、ステップS39へ進む。
【0106】
ステップS39では、システム制御部33(モデル更新部335)は、ステップS37で特定された教師ユーザの更新後の行動履歴(ステップS34で取得された行動履歴)から抽出された行動情報を説明変数とし、ステップ37で特定された教師ユーザの特性(ステップS33で取得された特性)を目的変数とした学習データを用いて学習済みモデルを更新し、図10に示す処理を終了する。
【0107】
なお、学習済みモデル更新処理により更新された学習済みモデルは、その後に推定ユーザの特性が推定される場合に用いられる。
【0108】
以上説明したように、上記実施形態によれば、特性推定サーバ3は、アンケートに回答した複数の対象ユーザのそれぞれの回答に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類し、それぞれの対象ユーザの行動履歴が所定の基準を満たすか否かを判断する。そして、特性推定サーバ3は、基準を満たすと判断された対象ユーザを教師ユーザとし、教師ユーザの行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成し、推定ユーザの行動履歴から抽出された行動情報と、生成された学習済みモデルとを用いて当該推定ユーザの特性を推定するように構成したので、対象ユーザのアンケート結果に基づいて実証的な特性推定を行うことができる。すなわち、対象ユーザの主観的、意識的な判断に基づく仮説検証と、対象ユーザの客観的な事実に基づく仮説検証を踏まえて実証的な特性推定を可能にした。
【0109】
また、上記実施形態では、対象ユーザのアンケートで起こりうる不完全性、不確実性を当該対象ユーザの行動履歴で補うことで、学習済みモデルの生成に用いる教師データの精度を向上することができようになったが、これに加えて、アンケートによる特性分類の結果に基づいて作成された段階の教師データ(プレ教師データ)についても改善することができる。すなわち、特性推定サーバ3(特性分類装置の分類手段及び判断手段の一例)は、上述したように、アンケートに回答した複数の対象ユーザのそれぞれの回答に基づいて、対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類し、当該対象ユーザの行動履歴がアンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断する。そして、特性推定サーバ3(特性分類装置の特定手段の一例)は、当該基準を満たすか否かの判断結果からアンケートの改善項目(改善点)を特定する。例えば、当該基準を満たすか否かの判断結果から、どのような質問事項(アンケートの質問事項)が特性の分類判定(セグメント判定)に有用または無用であったか、どのようなアンケート選択肢(質問に対する回答の選択肢)が特性の分類判定に有用または無用であったか、どのような分類方法(特性の分類に用いられる算出方法)が特性の分類判定に適していたかを判断することで、アンケートの改善項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法の少なくとも何れか1つ)を特定する。これにより、アンケートの品質向上に寄与することができる。
【0110】
例えば、特性推定サーバ3は、アンケートと共通の仮説に基づき特性ごとに設定された複数の仮説検証項目のそれぞれに対する該当有無を対象ユーザの行動履歴に基づいて判断し、その判断結果(つまり、複数の仮説検証項目のそれぞれに対する該当有無)に基づいて、アンケートに関する複数の項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法)のうち少なくとも1つの項目を改善項目として特定するとよい。また、特性推定サーバ3は、特性を横断した連続性を有する仮説検証項目(例えば、アクセスタイミング)において複数段階のうち、どの段階に該当するかを対象ユーザの行動履歴に基づいて判断し、その判断結果に基づいて、アンケートに関する複数の項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法)のうち少なくとも1つの項目を改善項目として特定してもよい。例えば、当該判断された段階と、アンケート結果に基づき分類された特性と、が関連(または合致)しないことに対して影響を与えている項目が改善項目として特定される。また、特性推定サーバ3は、ユーザ全体の行動履歴に基づく行動分布と特性との対応関係を示す仮説検証項目において、当該行動分布中のどのレベルに該当するかを対象ユーザの行動履歴に基づいて判断し、その判断結果に基づいて、アンケートに関する複数の項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法)のうち少なくとも1つの項目を改善項目として特定してもよい。例えば、当該判断されたレベルと、アンケート結果に基づき分類された特性と、が関連(または合致)しないことに対して影響を与えている項目が改善項目として特定される。
【0111】
図11は、アンケートの改善項目としてアンケート選択肢が特定された場合における改善内容を示す概念図である。図11(A)では、アンケート選択肢の分割の可能性が見い出されることで、アンケート選択肢2が分割されている。図11(B)では、アンケート選択肢において異なるデータ傾向が見いだされることで、アンケート選択肢2の一部分がアンケート選択肢1に統合されている。その他、図示しないが、アンケートの改善項目として分類方法が特定された場合、複数の分類方法のうち、より適した分類方法が選定される。例えば、対象ユーザの回答に基づきいずれかの特性に分類される際、アンケートにおけるトレンド商品購買に関する質問でyes(あてはまる)との回答に対して+5点として採点され、結果として、当該対象ユーザの特性が特性01として判別(分類)された場合において、当該対象ユーザの行動履歴が基準を満たさない(つまり、対象ユーザは特性01に該当しない)場合がありうる。この場合、トレンド商品購買に関する質問で「あてはまる」との回答に対して+5点としたことが適当ではなかった、つまり、分類方法が適当でなかったとして、当該分類方法がアンケートの改善項目として特定される。これにより、分類方法に影響を与える質問の内容変更、当該質問の配点変更(つまり、質問に対する選択肢の重み付けの変更)、または当該質問自体の削除等が行われる。また、アンケートの質問1でyesを+2点、noを0点、質問2でyesを+1点、noを−1点として、例えば合計3点以上の対象ユーザが特性01として判別された場合において、当該対象ユーザの行動履歴が基準を満たさず、特性01には不適切な場合がありうる。この場合にも、分類方法がアンケートの改善項目として特定され、アンケートの質問の内容変更、当該質問の配点変更、または当該質問自体の削除等が行われる。つまり、特性判別に用いる計算ロジックが適正化される。
【0112】
なお、以上のように本発明の一実施形態を説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲で上記実施形態から種々構成等に変更を加えてもよく、その場合も本発明の技術的範囲に含まれる。
【符号の説明】
【0113】
1 アンケート管理サーバ
2 行動履歴管理サーバ
3 特性推定サーバ
31 通信部
32 記憶部
33 システム制御部
34 システムバス
101 アンケートデータベース
201 行動履歴データベース
301 ユーザ情報データベース
UTm ユーザ端末
STn 処理端末
SAo サーバ
NW 通信ネットワーク
S 通信システム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11