特許第5984144号(P5984144)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターナショナル・ビジネス・マシーンズ・コーポレーションの特許一覧

特許5984144情報処理装置、情報処理方法、及び、プログラム
<>
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000006
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000007
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000008
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000009
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000010
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000011
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000012
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000013
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000014
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000015
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000016
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000017
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000018
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000019
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000020
  • 特許5984144-情報処理装置、情報処理方法、及び、プログラム 図000021
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5984144
(24)【登録日】2016年8月12日
(45)【発行日】2016年9月6日
(54)【発明の名称】情報処理装置、情報処理方法、及び、プログラム
(51)【国際特許分類】
   G06Q 30/02 20120101AFI20160823BHJP
【FI】
   G06Q30/02 312
【請求項の数】12
【全頁数】19
(21)【出願番号】特願2013-246269(P2013-246269)
(22)【出願日】2013年11月28日
(65)【公開番号】特開2015-106164(P2015-106164A)
(43)【公開日】2015年6月8日
【審査請求日】2015年11月27日
【早期審査対象出願】
(73)【特許権者】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
(74)【代理人】
【識別番号】100108501
【弁理士】
【氏名又は名称】上野 剛史
(74)【代理人】
【識別番号】100112690
【弁理士】
【氏名又は名称】太佐 種一
(72)【発明者】
【氏名】高橋 力矢
(72)【発明者】
【氏名】水田 秀行
【審査官】 関 博文
(56)【参考文献】
【文献】 特開2004−258796(JP,A)
【文献】 特開2008−299684(JP,A)
【文献】 特表2011−516947(JP,A)
【文献】 斎 礼 外4名,通販業における需要予測支援のためのエキスパートシステムの開発と評価,電気学会論文誌C,日本,社団法人電気学会,1998年 2月 1日,Vol.118−C No.2,pp.242−248
【文献】 古川 一郎 外2名,マーケティング・サイエンス入門,日本,株式会社有斐閣 江草 貞治,2011年 4月25日,第2版,pp.298−300
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00−99/00
(57)【特許請求の範囲】
【請求項1】
個体に対して与えられたイベント系列に対する個体の反応を示す反応系列の履歴データに基づいて、個体自身に対するイベントに応じた個体の反応を予測する第1回帰モデルを生成する第1モデル生成部と、
イベント系列に対する個体の反応を示す反応系列の履歴データと、前記第1回帰モデルにより予測した反応系列の予測データとの差分に基づき、当該個体における他の個体からの影響に応じた反応成分である影響成分系列を算出する影響算出部と、
を備える情報処理装置。
【請求項2】
前記影響算出部は、前記イベント系列に対する個体の反応を示す反応系列を平滑化したデータと、前記第1回帰モデルにより予測した反応系列の予測データとの差分に基づき、前記影響成分系列を算出する請求項1に記載の情報処理装置。
【請求項3】
複数の個体のそれぞれについて算出した前記影響成分系列に基づいて、前記複数の個体間の影響関係を検出する関係検出部を更に備える請求項1または2に記載の情報処理装置。
【請求項4】
前記関係検出部は、前記複数の個体について算出した複数の影響成分系列に基づいて、前記複数の個体を2以上のグループに分類する請求項3に記載の情報処理装置。
【請求項5】
前記関係検出部は、前記複数の影響成分系列のそれぞれの間の類似度に基づいて、前記複数の個体を2以上のグループに分類する請求項4に記載の情報処理装置。
【請求項6】
前記関係検出部は、前記複数の個体について算出した複数の影響成分系列のそれぞれの間の類似度に基づいて、各個体と当該個体に対して影響成分系列の類似度が高い順に選択した2以上の他の個体とをグループとして分類する請求項4に記載の情報処理装置。
【請求項7】
前記関係検出部は、各個体と当該個体に対して影響成分系列の類似度が高い順に選択した予め定められた数の他の個体とをグループとして分類する請求項6に記載の情報処理装置。
【請求項8】
前記グループに含まれる個体について、個体自身に対するイベント系列と、グループ内の各個体の反応数または反応量の合計値の系列とに応じた個体の反応を予測する第2回帰モデルを生成する第2モデル生成部を更に備える請求項4から7のいずれか一項に記載の情報処理装置。
【請求項9】
前記第1モデル生成部は、消費者に対して与えられたイベント系列に対する消費者の購買情報を示す反応系列の履歴データに基づいて前記第1回帰モデルを生成し、
前記第2モデル生成部は、前記グループに含まれる消費者について、消費者自身に対するイベント系列と、前記グループにおける購買量または購買額の合計値の系列とに応じた消費者の反応を予測する前記第2回帰モデルを生成する
請求項に記載の情報処理装置。
【請求項10】
分類した複数の前記グループのうち、他の個体からの影響度が他のグループと比較してより高いグループを抽出するグループ抽出部を更に備える請求項4からのいずれか一項に記載の情報処理装置。
【請求項11】
コンピュータにより実行される情報処理方法であって、
個体に対して与えられたイベント系列に対する個体の反応を示す反応系列の履歴データに基づいて、個体自身に対するイベントに応じた個体の反応を予測する第1回帰モデルを生成する第1モデル生成段階と、
イベント系列に対する個体の反応を示す反応系列の履歴データと、前記第1回帰モデルにより予測した反応系列の予測データとの差分に基づき、当該個体における他の個体からの影響に応じた反応成分である影響成分系列を算出する影響算出段階と、
を備える情報処理方法。
【請求項12】
コンピュータに実行されると、当該コンピュータを、
個体に対して与えられたイベント系列に対する個体の反応を示す反応系列の履歴データに基づいて、個体自身に対するイベントに応じた個体の反応を予測する第1回帰モデルを生成する第1モデル生成部と、
イベント系列に対する個体の反応を示す反応系列の履歴データと、前記第1回帰モデルにより予測した反応系列の予測データとの差分に基づき、当該個体における他の個体からの影響に応じた反応成分である影響成分系列を算出する影響算出部と、
して機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及び、プログラムに関する。
【背景技術】
【0002】
消費者の購買行動にはクチコミが影響することが知られていた(例えば、非特許文献1参照)。また、消費者に対して発生する複数のイベント間の依存性をモデル化する方法が知られている(例えば、非特許文献2及び3参照)。
[非特許文献1] J. Berger et al., "What Do People Talk About? Drivers of Immediate and Ongoing Word-of-Mouth", Journal of Marketing Research, vol.48, no.5, pp.869-880, 2011.
[非特許文献2] S. Rajaram et al., "Poisson-networks: A model for structured point processes," in Proceedings of the 10th International Workshop on Artificial Intelligence and Statistics (AISTATS 2005), 2005.
[非特許文献3] A. Gunawardana et al., "A model for temporal dependencies in event streams," in Advances in Neural Information Processing Systems 24, J. Shawe-Taylor, R. Zemel, P. Bartlett, F. Pereira, and K. Weinberger, Eds., 2011, pp. 1962-1970.
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかし、非特許文献2及び3等の方法を用いて、多数の消費者間の依存関係によりクチコミの消費行動への影響をモデル化しようとすると、消費者数の二乗に比例する非常に多数のパラメータが必要となり、現実的に許容可能な計算時間及び予測精度が得られない。
【課題を解決するための手段】
【0004】
本発明の第1の態様においては、複数のアイテムの中からユーザに推奨するアイテムの組を選択する情報処理装置であって、複数のアイテムのそれぞれについて、アイテム自体のスコアが高い場合に高く、他に選択されるアイテムに対する類似度が高い場合に低くなる優先度を算出し、優先度に基づいて、複数のアイテムの中からアイテムの組を選択する選択部と、選択したアイテムの組に含まれる各アイテムを、ユーザに提示すべきアイテムとして出力する出力部と、を備える情報処理装置、当該情報処理装置により実行される情報処理方法、及び、当該情報処理装置に用いられるプログラムを提供する。
【0005】
なお、上記の発明の概要は、本発明の特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0006】
図1】本実施形態の情報処理装置10の構成を示す。
図2】本実施形態の情報処理装置10の処理フローを示す。
図3】本実施形態のS110における処理フローを示す。
図4】本実施形態のS120における処理フローを示す。
図5】本実施形態のS140における処理フローを示す。
図6】本実施形態のイベント系列及び反応系列の一例を示す。
図7】本実施形態の第1回帰モデルにより予測される予測データを示す。
図8】本実施形態の影響成分系列の一例を示す。
図9】本実施形態における影響成分系列のパターンの一例を示す。
図10】本実施形態におけるグループ分けの一例を示す。
図11】本実施形態におけるグループ反応系列の一例を示す。
図12】本実施形態における個体重みベクトル及びグループ重みベクトルを示す。
図13】本実施形態の変形例における情報処理装置10の処理フローを示す。
図14】本変形例のS240における処理フローを示す。
図15】本変形例におけるグループ生成の一例を示す。
図16】コンピュータ1900のハードウェア構成の一例を示す。
【発明を実施するための形態】
【0007】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0008】
図1は、本実施形態の情報処理装置10の構成を示す。情報処理装置10は、個体に対して与えられたイベント系列及び当該イベント系列に対する反応系列から、クチコミ等の他の個体からの影響を反映した個体の反応の回帰モデルを生成する。情報処理装置10は、履歴取得部102、第1モデル生成部104、影響算出部106、関係検出部108、第2モデル生成部110、及び、グループ抽出部112を備える。
【0009】
履歴取得部102は、個体に対して与えられたイベント系列、及び、当該イベント系列に対する個体の反応を示す反応系列の履歴データを取得する。履歴取得部102は、取得したイベント系列及び反応系列の履歴データを第1モデル生成部104、影響算出部106、及び、第2モデル生成部110に供給する。
【0010】
第1モデル生成部104は、イベント系列、及び、当該イベント系列に対する反応系列の履歴データに基づいて、個体自身に対するイベントに応じた個体の反応を予測する第1回帰モデルを学習等により生成する。第1モデル生成部104は、第1回帰モデルを影響算出部106に供給する。
【0011】
影響算出部106は、イベント系列の履歴データ及び第1回帰モデルから反応系列の予測データを生成し、反応系列の履歴データと、第1回帰モデル等により生成した予測データとの差分に基づき、当該個体における他の個体からの影響に応じた反応成分である影響成分系列を算出する。影響成分系列は、イベント系列を第1回帰モデルに適用して説明できない反応系列の成分であり、本実施形態の情報処理装置10はこれをクチコミ等の他の個体からの影響により生じた成分と仮定する。影響算出部106は、影響成分系列を関係検出部108に供給する。
【0012】
関係検出部108は、複数の個体のそれぞれについて算出した影響成分系列に基づいて、複数の個体間の影響関係を検出する。例えば、クチコミ等の他の個体からの影響が類似する個体同士はクチコミが流通する単一のグループに属するであろうという仮定に基づき、関係検出部108は、影響成分系列に基づいて、影響成分系列が類似する個体同士を集めることにより、複数の個体を2以上のグループに分類する。
【0013】
関係検出部108は、影響成分系列及び複数の個体をグループ分けした結果をグループ抽出部112に供給する。また、関係検出部108は、複数の個体をグループ分けした結果を第2モデル生成部110に供給する。
【0014】
第2モデル生成部110は、グループ分けの結果に基づき、グループごとにグループに応じた統計量のグループ反応系列を生成し、グループに含まれる個体について、個体自身に対するイベント系列と、当該グループ反応系列とに応じた個体の反応を予測する第2回帰モデルを生成する。
【0015】
グループ抽出部112は、関係検出部108が分類した複数のグループのうち、他の個体からの影響度が他のグループと比較してより高いグループを抽出する。
【0016】
このように本実施形態の情報処理装置10は、イベント系列から生成される第1回帰モデルにより予想される結果と実際の結果との誤差である影響成分系列を導出し、影響成分系列に基づいて個体をグループ分けし、グループごとのグループ反応系列を反映した第2回帰モデルを生成する。そして、情報処理装置10は、第2回帰モデルに基づいて個体の反応を予測することで、個体数の二乗に応じた多数のパラメータを設定することなくクチコミ等の他の個体からの影響を反映したモデルを生成できる。
【0017】
図2は、本実施形態の情報処理装置10の処理フローを示す。本実施形態において、情報処理装置10は、S100からS150までの処理を実行することにより、第2回帰モデルを生成し、クチコミの影響が大きいグループを抽出する。
【0018】
まず、S100において、履歴取得部102は、個体に対して与えられたイベント系列、及び、当該イベント系列に対する個体の反応を示す反応系列の履歴データを取得する。例えば、履歴取得部102は、データベース等から、イベント系列の履歴データとして、消費者に対して過去に与えられた商品の広告、メール配信、及び/又は、消費者のウェブ閲覧履歴等の時系列データを取得してよい。
【0019】
また、履歴取得部102は、反応系列の履歴データとして、イベント系列に対する個体の反応数及び/又は反応量の時系列データを取得してよい。例えば、履歴取得部102は、反応系列の履歴データとして、データベース等から、消費者の購買情報を示す情報(一例として、商品の購買回数、購買量及び/又は購買金額、並びに、購買日時等)の時系列データを取得してよい。
【0020】
ここで、履歴取得部102は、イベント系列の履歴データの少なくとも一部として、反応系列の少なくとも一部の履歴データを含めてよい。履歴取得部102は、取得したイベント系列及び反応系列の履歴データを第1モデル生成部104、影響算出部106、及び、第2モデル生成部110に供給する。
【0021】
次に、S110において、第1モデル生成部104が、イベント系列及び反応系列の履歴データに基づいて、個体自身に対するイベントに応じた個体の反応を予測する第1回帰モデルを生成する。第1モデル生成部104は、イベント系列の少なくとも一部が反応系列を含む場合、第1回帰モデルとして自己回帰モデルを生成してよい。第1モデル生成部104は、個体自身へ入力される入力イベント(及び/又は個体が出力する反応イベント)のみを説明変数として用いて第1回帰モデルを生成する。第1モデル生成部104は、生成した第1回帰モデルを影響算出部106に供給する。なお、S110の具体的な処理内容は後に説明する。
【0022】
次に、S120において、影響算出部106は、影響成分系列を算出する。例えば、まず影響算出部106は、複数の個体について、イベント系列の履歴データ及び第1回帰モデルから反応系列の予測データを生成する。次に、影響算出部106は、履歴データにおける反応系列を予め定められた時間間隔を有する複数の期間により平滑化したデータと、第1回帰モデル等により生成した反応系列の予測データとの差分に基づき、個体における他の個体からの影響に応じた反応成分である影響成分系列を、複数の個体について算出する。
【0023】
一例として、影響算出部106は、履歴データの時系列及び第1回帰モデルによる予測データの時系列における、予め定められた間隔(例えば、1日、1週間、又は、1ヶ月)あたりの反応数(例えば、購買回数)又は反応量(例えば、購買金額)の差分の時系列を、影響成分系列として算出してよい。なお、S120の具体的な処理内容は後に説明する。
【0024】
次に、S130において、関係検出部108は、複数の影響成分系列のそれぞれの間の類似度に基づいて、複数の個体を2以上のグループに分類する。例えば、関係検出部108は、m平均法等を用いて、影響成分系列から形成されるベクトル同士の距離が近い個体同士が同一のグループに属するように、複数の個体を複数のグループにクラスタリングする。
【0025】
影響成分系列は、イベント系列を第1回帰モデルに当てはめて説明できない反応系列の成分の系列である。これは、個体の反応系列が、広告配信等に対応するイベント系列及び自己の購買行動に対応する反応系列自体のみでなく、クチコミ等の他の個体からの入力系列により生じるためと考えられる。
【0026】
ここで、影響成分系列が類似する、即ち、影響成分系列のベクトルの距離が近い複数の個体には、類似するクチコミ等の入力系列が生じていると考えられる。例えば、対象期間の前半で影響成分系列の成分が大きくなり、対象期間の後半で影響成分系列の成分が小さくなる複数の個体は、いずれも比較的早い時期にクチコミから大きな影響を受けて購買行動を活発化し、対象期間の後半ではクチコミの影響をあまり受けないと考えられる。このような複数の個体は、例えば、流行に比較的敏感な単一のグループに属すると便宜的に仮定できる。
【0027】
また、例えば、対象期間の前半で影響成分系列の成分が小さく、対象期間の後半で影響成分系列の成分が大きくなる複数の個体は、いずれも早い時期にはクチコミの影響を受けずに購買行動を行い、対象期間の後半ではクチコミの影響を大きく受けると考えられる。このような複数の個体は、例えば、流行に比較的鈍感な単一のグループに属すると便宜的に仮定できる。
【0028】
従って、関係検出部108は、影響成分系列に基づいて複数の個体をグループ分けすることで、複数の個体をクチコミに対する影響のパターンごとに分類する。関係検出部108は、影響成分系列及び複数の個体をグループ分けした結果をグループ抽出部112に供給する。また、関係検出部108は、複数の個体をグループ分けした結果を第2モデル生成部110に供給する。
【0029】
次に、S140において、第2モデル生成部110は、グループに含まれる個体について、個体自身に対するイベント系列及び当該個体の属するグループのグループ反応系列に応じた個体の反応を予測する第2回帰モデルを生成する。すなわち、第2モデル生成部110は、個体自身に入力されるイベント(及び/又は個体が出力する反応イベント)に加え、グループ内の他の個体による影響を説明変数に加えた第2回帰モデルを生成する。
【0030】
例えば、第2モデル生成部110は、グループ反応系列として、グループ内の各個体の反応数または反応量の合計値の系列を用いて第2回帰モデルを生成してよい。一例として、第2モデル生成部110は、グループ反応系列として、グループ内の各個体の反応数の合計値(例えば、グループにおける購買回数の合計値)または反応量の合計値(例えば、グループにおける購買量又は購買額の合計値)の系列を用いて、消費者の反応を予測する第2回帰モデルを生成してよい。
【0031】
また、第2モデル生成部110は、個体自身のイベント系列としてS110において第1モデル生成部104が用いたイベント系列を用いて、第2回帰モデルを生成してよい。例えば、第2モデル生成部110は、個体自身に対するイベント系列として、グループに含まれる消費者自身に対する商品の広告等の時系列データを用いてよい。なお、S140の具体的な処理内容は後に説明する。
【0032】
次に、S150において、グループ抽出部112は、関係検出部108が分類した複数のグループのうち、他の個体からの影響度が他のグループと比較してより高いグループを抽出する。例えば、グループ抽出部112は、複数のグループのうち、影響成分系列の単一の期間における最大値、又は、影響成分系列の大きさの全期間の合計値が他のグループよりも大きいグループを、他の個体からの影響度が高いグループとして抽出してよい。これにより、グループ抽出部112は、クチコミ等の他の個体からの影響が他のグループよりも大きい個体を含むグループを抽出する。
【0033】
図3は、本実施形態のS110における処理フローを示す。第1モデル生成部104は、S112からS116までの処理を実行することにより、S110の処理を実行する。
【0034】
まず、S112において、第1モデル生成部104は、イベント系列の状態ベクトルを生成する。例えば、第1モデル生成部104は、イベント系列に係る期間を、予め定められた間隔Δt(例えば、1日、1週間、又は、1ヶ月)でn個の単位期間T1〜nに分割し、各単位期間T1〜nにおけるイベント系列のイベントに対応する状態ベクトルを生成する。第1モデル生成部104は、全ての個体に対して、イベント系列に含まれる全単位期間の状態ベクトルを生成してよい。
【0035】
一例として、ある個体iに対して、第1週目の期間Tにおいてダイレクトメールが2回送信され、テレビCMが1回放送され、その結果、当該個体iが第1週に合計1000円分ある商品を購買した場合、第1モデル生成部104は、個体iの第1週の状態ベクトルxi1=(2,1,1000)を生成してよい。また、個体iに対して、第2週目の期間Tにおいてダイレクトメールが2回送信され、テレビCMが1回も放送されず、その結果、個体iが合計500円分ある商品を購買した場合、第1モデル生成部104は、個体iの第2週の状態ベクトルxi2=(2,0,500)を生成してよい。
【0036】
次に、S114において、第1モデル生成部104は、生成した状態ベクトルを特徴ベクトルに変換する。例えば、第1モデル生成部104は、予め設計された任意の写像関数Φ:Rd1→Rd2により、状態ベクトルxijを対応する特徴ベクトルΦ(xij)に変換する。なお、d1は状態ベクトルの次元、d2は特徴ベクトルの次元である。d1及びd2は、同一であってよい。
【0037】
一例として、第1モデル生成部104は、状態ベクトルxijに2次の相関項を加えることにより、状態ベクトルxijを特徴ベクトルΦ(xij)に変換してもよい。一例として、第1モデル生成部104は、状態ベクトルxijの各要素に逓減的な関数(例えば、f(x)=x/(x+a)。aは定数)を適用することにより、状態ベクトルxijを特徴ベクトルΦ(xij)に変換してもよい。これらに代えて、第1モデル生成部104は、状態ベクトルxijを変換せずにそのまま特徴ベクトルΦ(xij)としてもよい。
【0038】
次に、S116において、第1モデル生成部104は、確率関数が最大となるように各個体に設定した重みベクトルを最適化する。具体的には、まず、第1モデル生成部104は、反応系列の履歴データから、各期間Tにおける個体iの反応した回数である反応数yijを取得する。第1モデル生成部104は、反応数yijに代えて、個体iの反応した量を示す反応量yijを用いてもよい。以下では、第1モデル生成部104が反応数yijを用いた場合について説明する。
【0039】
次に、第1モデル生成部104は、個体iの各期間jに対して特徴ベクトルΦ(xij)と重みベクトルwとの内積によるスカラースコアを計算する。次に、第1モデル生成部104は、計算されたスカラースコアの指数関数と期間Tの長さΔtとの積が期待値となるポアソン分布から反応数yijが生成される確率の対数を算出する。最後に、第1モデル生成部104は、全ての期間における対数確率の合計が最大化されるように重みベクトルwを最適化する。
【0040】
一例として、第1モデル生成部104は、数式1の最適化問題を解くことによって、i=1〜mとなるm個の個体のそれぞれに設定される重みベクトルwを最適化する。なお、bはバイアス項である。すなわち、第1モデル生成部104は、複数の個体のそれぞれについてポアソン回帰分析を行う。第1モデル生成部104は、数式1を最適化する手法として、最尤推定、MAP推定、及び、ベイズ推定等を使用してよい。ここで、第1モデル生成部104は、バイアス項b及び/又は重みベクトルwとして、個体iに依存しないバイアス項b及び/又は重みベクトルwを用いてもよい。
【数1】
【0041】
ここで、第1モデル生成部104は、数式1の確率関数lとして、単位時間あたりのイベント発生回数の期待値がスカラースコアの指数関数となるポアソン過程において、対象の期間の間に反応回数のイベントが発生する確率に基づく対数確率質量関数から、更に反応回数に対する正規化項を除去した関数を用いてもよい。第1モデル生成部104は、正規化項を除去することにより、時間の不可逆性を考慮した最適化を実行することができる。
【0042】
一例として、第1モデル生成部104は、確率関数lとして、以下の式に示す関数を用いてよい。
【数2】
ただし、yは反応回数、zはスカラースコアであり反応回数の期待値に関する対数となる値、τは対象の期間の長さを示す。
【0043】
このように、第1モデル生成部104は、複数の個体に対する重みベクトルwを最適化することで、第1回帰モデルを生成する。
【0044】
図4は、本実施形態のS120における処理フローを示す。影響算出部106は、S122からS126までの処理を実行することにより、S120の処理を実行する。
【0045】
まず、S122において、影響算出部106は、複数の個体についてのイベント系列の状態ベクトルを生成する。影響算出部106は、S112の処理と同様の方法で、イベント系列に係る期間を、予め定められた間隔Δt(例えば、1日、1週間、又は、1ヶ月)でn個の単位期間T1〜nに分割し、各単位期間T1〜nにおけるイベント系列のイベントに対応する状態ベクトルを生成する。
【0046】
ここで、影響算出部106が状態ベクトルの生成に用いるイベント系列は、S112で用いたイベント系列と同一期間における同一イベント系列であってよく、これに代えて、別の期間における別のイベント系列であってもよい。
【0047】
次に、S124において、影響算出部106は、個体iの複数の単位期間T1〜nのそれぞれに対応する複数の状態ベクトルxi1〜xinから、複数の期間T1〜nのそれぞれに対応する個体iの反応の大きさを示す反応数yi1〜yin(又は反応量yi1〜yin。合わせて単に反応数yi1〜yinとする)を推定する。
【0048】
例えば、まず、影響算出部106は、S114と同様の方法で、複数の状態ベクトルxijを複数の特徴ベクトルΦ(xij)に変換する。次に、影響算出部106は、j=1〜nとなる複数の期間Tのそれぞれについて、個体iの特徴ベクトルΦ(xij)と第1回帰モデルに含まれる重みベクトルwとの内積により得られるスカラースコアを算出する。影響算出部106は、スカラースコアを独立変数とし、ネイピア数を底とする指数関数と時間間隔Δtとの積から、j=1〜nとなる複数の期間Tにおける平均反応数(又は平均反応量。合わせて単に平均反応数とする)をそれぞれ算出して反応系列の予測データとする。
【0049】
次に、S126において、影響算出部106は、履歴データにおける反応系列と、反応系列の予測データとの差分を生成する。例えば、まず、影響算出部106は、履歴データにおける反応系列に係る期間を、間隔Δtを有するn個の期間T1〜nに分割し、期間T1〜nにおける反応系列の反応数を算出する。次に、影響算出部106は、S124で算出した期間T1〜nにおける個体iの平均反応数と期間T1〜nにおける個体iの反応系列の反応数との差分を算出することで、個体iの期間T1〜nにおける影響成分系列を算出する。
【0050】
図5は、本実施形態のS140における処理フローを示す。第2モデル生成部110は、S142からS146までの処理を実行することにより、S140の処理を実行する。
【0051】
まず、S142において、第2モデル生成部110は、グループ反応系列を生成する。例えば、第2モデル生成部110は、S130で生成されたp個のグループについて、グループ内の個体の反応数及び/又は反応量の合計値を算出する。一例として、第2モデル生成部110は、期間Tにおけるグループcの反応数等の合計値を表すグループ状態ベクトルzcjを、j=1〜nの全期間について算出する。
【0052】
また、第2モデル生成部110は、個体ごとのイベント系列の状態ベクトルを生成する。第2モデル生成部110は、S112の処理と同様の処理により、個体ごとのイベント系列の状態ベクトルを生成してよい。
【0053】
次に、S144において、第2モデル生成部110は、グループ状態ベクトルzcjからグループ特徴ベクトルΨ(zcj)を算出する。第2モデル生成部110は、S114と同様の手法により、写像関数を用いてグループ特徴ベクトルΨ(zcj)を算出してよい。また、第2モデル生成部110は、S114と同様の方法で、個体ごとの状態ベクトルxijから複数の個体の特徴ベクトルΦ(xij)を生成する。
【0054】
次に、S146において、第2モデル生成部110は、確率関数が最大となるように各グループに設定したグループ重みベクトルを最適化する。具体的には、まず、第2モデル生成部110は、S116の処理と同様に、反応系列の履歴データから、各期間Tにおける個体iの実際の反応数yijを取得する。
【0055】
次に、S146において、第2モデル生成部110は、確率関数が最大となるように各グループに設定した個体重みベクトルwc[i]及びグループ重みベクトルθc[i]c'を最適化する。ここで、個体重みベクトルwc[i]は、個体iが属するグループc[i]に属する個体に共通するベクトルである。また、グループ重みベクトルθc[i]c'は、個体iが属するグループc[i]がグループc'のグループ反応系列から影響を受ける度合いを示すベクトルであってよい。なお、グループc'は、グループc[i]と同一のグループが含まれてよい。
【0056】
次に、第2モデル生成部110は、期間jに対して、個体iの属するグループc[i]の個体重みベクトルwc[i]と特徴ベクトルΦ(xij)との内積による第1スカラースコアを計算する。また、期間jに対して、個体iの属するグループc[i]及びグループc'のグループ重みベクトルθc[i]c'と、グループc'のグループ反応系列から生成されたグループ特徴ベクトルΨ(zc'j)との内積による第2スカラースコアを、p個のグループc'に対して生成して合算する。
【0057】
次に、第2モデル生成部110は、計算された第1スカラースコア及び第2スカラースコアの和の指数関数と期間Tの時間間隔Δtとの積が期待値となるポアソン分布から反応数yijが生成される確率の対数を算出する。最後に、第2モデル生成部110は、全ての期間における対数確率の合計が最大化されるように個体重みベクトルwc[i]、及び、グループ重みベクトルθc[i]c'を最適化する。
【0058】
一例として、第2モデル生成部110は、数式3の最適化問題を解くことによって、c=1〜pとなるp個のグループのそれぞれに設定されるバイアス項bc[i]、個体重みベクトルwc[i]、及び、p×p個の組み合わせに対して設定されるグループ重みベクトルθcc'を最適化する。すなわち、第2モデル生成部110は、複数の個体のそれぞれについてポアソン回帰分析を行う。第2モデル生成部110は、数式3を最適化する手法として、最尤推定、MAP推定、及び、ベイズ推定等を使用してよい。また、第2モデル生成部110は、グループごとのバイアス項bc[i]、個体重みベクトルwc[i]、及び/又はグループ重みベクトルθcc'の代わりに、個体iごとのバイアス項b、重みベクトルw、及び/又は、重みベクトルθic'を用いてもよい。
【数3】
【0059】
第2モデル生成部110は、確率関数lとして、S116で用いた数式2の関数を用いてよい。
【0060】
このように、本実施形態の情報処理装置10は、回帰モデルの説明変数としてイベント系列のみでなくグループ反応系列を含めることで、クチコミの影響を反映した第2回帰モデルを生成することができる。また、本実施形態の情報処理装置10は、クチコミの影響を受けやすいグループを抽出することができるので、例えば、このようなグループに対して広告配信を実行することで商品の販売に正のフィードバック効果を生じさせ、効率的に販促活動を進めることができる。
【0061】
図6は、本実施形態のイベント系列及び反応系列の一例を示す。S100において、履歴取得部102は、図6(a)に示すように第1週から第n週までの複数の消費者に対してイベントとして与えられたダイレクトメールの回数、CMの回数、及び、消費者の購買額(又は購買の合計額)を含むイベント系列を取得してよい。
【0062】
図6(b)に示すように、履歴取得部102は、第1週から第n週までの複数の消費者の購買額を含む反応系列を取得してよい。図6(a)及び(b)に示すように、本実施形態においてイベント系列は反応系列を含む。これにより、第1モデル生成部104及び第2モデル生成部110は、自己回帰モデルを生成することができる。履歴取得部102は、購買ごとに生成され、ダイレクトメール、CM、購買の日時、及び、各購買の購買額を含む購買記録データを取得して、図6に係る1週間の間隔を有するイベント系列及び反応系列を生成してもよい。
【0063】
図7は、本実施形態の第1回帰モデルにより予測される予測データの一例を示す。S120において、影響算出部106は、図6に示すイベント系列及び反応系列に基づいて第1回帰モデルを生成し、当該第1回帰モデルにより図7に示す反応系列の予測データを生成してよい。
【0064】
図8は、本実施形態の影響成分系列の一例を示す。S120において、影響算出部106は、図6に示す反応系列及び図7に示す予測データの差分から、図8に示す影響成分系列を生成してよい。
【0065】
図9は、本実施形態における影響成分系列のパターンの一例を示す。影響算出部106は、一部の個体aについて、図9の実線aに示すように、期間の前半では成分が正に大きくなり、対象期間の後半で成分が小さくなる影響成分系列を生成する。このような個体aは、流行に比較的敏感な単一のグループに属すると考えられる。
【0066】
また、影響算出部106は、一部の個体bについて、図9の破線bに示すように、期間の前半では成分がほぼ0となり、対象期間の後半で成分が正に大きくなる影響成分系列を生成する。このような個体bは、流行に比較的鈍感な単一のグループに属すると考えられる。
【0067】
また、影響算出部106は、一部の個体cについて、図9の点線cに示すように、期間の前半では成分がほぼ0となり、対象期間の後半で成分が負に大きくなる影響成分系列を生成する。このような個体cは、流行に対して否定的な見解を有する単一のグループに属すると考えられる。
【0068】
図10は、本実施形態におけるグループ分けの一例を示す。図10に示すように、本実施形態の関係検出部108は、全個体を影響成分系列に基づいて複数のグループ1〜3に分類する。
【0069】
図11は、本実施形態におけるグループ反応系列の一例を示す。S140において、第2モデル生成部110は、図11に示すように、第1週から第n週までの各グループに含まれる消費者の購買額の合計を含む反応系列を取得してよい。
【0070】
図12は、本実施形態における個体重みベクトル及びグループ重みベクトルを示す。図12に示すように、第2モデル生成部110は、S146においてグループ1〜3に対して、個体グループベクトルw1〜3及びグループ個体ベクトルθ11〜33を算出する。
【0071】
図13は、本実施形態の変形例に係る情報処理装置10の処理フローを示す。本変形例において、情報処理装置10は、複数の個体を予め定められた数のグループに分類する代わりに、個体ごとに当該個体と影響成分系列が近い別の個体を含むグループを生成することにより、第2回帰モデルを生成する。本変形例において、情報処理装置10は、S200、S210、及び、S220の処理を、S100、S110、及び、S120の処理と同様に実行してよい。
【0072】
S230において、関係検出部108は、複数の個体について算出した複数の影響成分系列のそれぞれの間の類似度に基づいて、各個体と当該個体に対して影響成分系列の類似度が高い順に選択した2以上の他の個体とをグループとして分類する。例えば、関係検出部108は、k近傍法を用いて、各個体と当該個体に対して影響成分系列の類似度が高い順に選択した予め定められた数の他の個体とをグループとして分類してよい。
【0073】
これに代えて、関係検出部108は、ε近傍法を用いて、各個体と当該個体に対して影響成分系列の類似度が予め定められた範囲内の他の個体とをグループとして分類してよい。また、更に関係検出部108は、k近傍法又はε近傍法に基づきスペクトラルクラスタリングを適用して、個体と類似する他の個体とをグループとして分類してよい。これにより、本変形例の関係検出部108は、複数の個体に対して、各個体に固有のグループをそれぞれ生成する。
【0074】
S240において、第2モデル生成部110は、各個体について、個体自身に対するイベント系列及び当該個体を含むグループのグループ反応系列に応じた個体の反応を予測する第2回帰モデルを生成する。S240の処理の具体的内容は後述する。
【0075】
S250において、情報処理装置10は、S150の処理と同様の処理を実行してよい。
【0076】
図14は、本変形例のS240における処理フローを示す。第2モデル生成部110は、S242からS246までの処理を実行することにより、S240の処理を実行する。
【0077】
まず、S242において、第2モデル生成部110は、グループ反応系列を生成する。例えば、第2モデル生成部110は、S230で生成された個体ごとのグループについて、S142と同様にグループ内の複数の個体の反応数及び/又は反応量の合計値を表すグループ状態ベクトルzijを算出することにより、個体ごとのグループ反応系列を生成する。また、第2モデル生成部110は、個体ごとのイベント系列の状態ベクトルも生成する。
【0078】
次に、S244において、第2モデル生成部110は、S144と同様の処理により、グループ状態ベクトルzijからグループ特徴ベクトルΨ(zij)を生成し、状態ベクトルxijから特徴ベクトルΦ(xij)を生成する。
【0079】
次に、S246において、第2モデル生成部110は、各個体iについて、ポアソン回帰分析を行い、数式4の最適化問題を解くことによって、個体重みベクトルw及びグループ重みベクトルθを最適化する。第2モデル生成部110は、数式4を最適化する手法として、最尤推定、MAP推定、及び、ベイズ推定等を使用してよい。第2モデル生成部110は、確率関数lとして、S116で用いた数式2の関数を用いてよい。ここで、第2モデル生成部110は、バイアス項b及び/又は重みベクトルwとして、個体iに依存しないバイアス項b及び/又は重みベクトルwを用いてもよい。
【数4】
【0080】
このように、本変形例の情報処理装置10は、回帰モデルの説明変数として個体ごとに生成したグループのグループ反応系列を含めることで、クチコミの影響を高い精度に反映した第2回帰モデルを生成することができる。
【0081】
図15は、本変形例におけるグループ生成の一例を示す。図15に示すように、本変形例の関係検出部108は、個体1に対して、個体1と個体1に対し1〜3番目に影響成分系列が類似する個体2〜個体4とを含む近傍数k=3のグループを形成する。関係検出部108は、個体2〜4に対しても、それぞれに近傍数k=3のグループを形成する。これにより、本変形例の情報処理装置10は、個体ごとの固有のグループを生成する。
【0082】
本実施形態及び変形例の情報処理装置10は、1つのイベント(ダイレクトメール等)に対して状態ベクトル内に1つの成分及び重みベクトル内に1つの成分を生成したが、これに代えて1つのイベントに対して状態ベクトル内に複数の成分及び重みベクトル内に複数の成分を生成してもよい。また、本実施形態及び変形例の情報処理装置10は、予め定められた間隔Δtにおける期間T1〜nに対応する状態ベクトルを生成する代わりに、イベントが発生した間隔Δt'1〜q(qはイベントの発生数−1)における期間T1〜qに対応する状態ベクトルを生成してもよい。これにより、情報処理装置10は、イベントに対する個体の応答をより高い精度でモデル化することができる。
【0083】
また、本実施形態及び変形例の情報処理装置10の第1モデル生成部104及び第2モデル生成部110は、ポアソン回帰分析を用いて第1回帰モデル及び第2回帰モデルを生成したが、ポアソン回帰分析以外の回帰分析、たとえば最小二乗誤差回帰や最小絶対誤差回帰、あるいは対数正規回帰により、第1回帰モデル及び第2回帰モデルを生成してもよい。
【0084】
図16は、情報処理装置10として機能するコンピュータ1900のハードウェア構成の一例を示す。本実施形態に係るコンピュータ1900は、ホスト・コントローラ2082により相互に接続されるCPU2000、RAM2020、グラフィック・コントローラ2075、及び表示装置2080を有するCPU周辺部と、入出力コントローラ2084によりホスト・コントローラ2082に接続される通信インターフェイス2030、ハードディスクドライブ2040、及びCD−ROMドライブ2060を有する入出力部と、入出力コントローラ2084に接続されるROM2010、フレキシブルディスク・ドライブ2050、及び入出力チップ2070を有するレガシー入出力部を備える。
【0085】
ホスト・コントローラ2082は、RAM2020と、高い転送レートでRAM2020をアクセスするCPU2000及びグラフィック・コントローラ2075とを接続する。CPU2000は、ROM2010及びRAM2020に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ2075は、CPU2000等がRAM2020内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置2080上に表示させる。これに代えて、グラフィック・コントローラ2075は、CPU2000等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
【0086】
入出力コントローラ2084は、ホスト・コントローラ2082と、比較的高速な入出力装置である通信インターフェイス2030、ハードディスクドライブ2040、CD−ROMドライブ2060を接続する。通信インターフェイス2030は、有線又は無線によりネットワークを介して他の装置と通信する。また、通信インターフェイスは、通信を行うハードウェアとして機能する。ハードディスクドライブ2040は、コンピュータ1900内のCPU2000が使用するプログラム及びデータを格納する。CD−ROMドライブ2060は、CD−ROM2095からプログラム又はデータを読み取り、RAM2020を介してハードディスクドライブ2040に提供する。
【0087】
また、入出力コントローラ2084には、ROM2010と、フレキシブルディスク・ドライブ2050、及び入出力チップ2070の比較的低速な入出力装置とが接続される。ROM2010は、コンピュータ1900が起動時に実行するブート・プログラム、及び/又は、コンピュータ1900のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ2050は、フレキシブルディスク2090からプログラム又はデータを読み取り、RAM2020を介してハードディスクドライブ2040に提供する。入出力チップ2070は、フレキシブルディスク・ドライブ2050を入出力コントローラ2084へと接続するとともに、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を入出力コントローラ2084へと接続する。
【0088】
RAM2020を介してハードディスクドライブ2040に提供されるプログラムは、フレキシブルディスク2090、CD−ROM2095、又はICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、RAM2020を介してコンピュータ1900内のハードディスクドライブ2040にインストールされ、CPU2000において実行される。
【0089】
コンピュータ1900にインストールされ、コンピュータ1900を情報処理装置10として機能させるプログラムは、履歴取得モジュールと、第1モデル生成モジュールと、影響算出モジュールと、関係検出モジュールと、第2モデル生成モジュールと、グループ抽出モジュールとを備える。これらのプログラム又はモジュールは、CPU2000等に働きかけて、コンピュータ1900を、履歴取得部102と、第1モデル生成部104と、影響算出部106と、関係検出部108と、第2モデル生成部110と、グループ抽出部112としてそれぞれ機能させてよい。
【0090】
これらのプログラムに記述された情報処理は、コンピュータ1900に読込まれることにより、ソフトウェアと上述した各種のハードウェア資源とが協働した具体的手段である履歴取得部102と、第1モデル生成部104と、影響算出部106と、関係検出部108と、第2モデル生成部110と、グループ抽出部112として機能する。そして、これらの具体的手段によって、本実施形態におけるコンピュータ1900の使用目的に応じた情報の演算又は加工を実現することにより、使用目的に応じた特有の情報処理装置10が構築される。
【0091】
一例として、コンピュータ1900と外部の装置等との間で通信を行う場合には、CPU2000は、RAM2020上にロードされた通信プログラムを実行し、通信プログラムに記述された処理内容に基づいて、通信インターフェイス2030に対して通信処理を指示する。通信インターフェイス2030は、CPU2000の制御を受けて、RAM2020、ハードディスクドライブ2040、フレキシブルディスク2090、又はCD−ROM2095等の記憶装置上に設けた送信バッファ領域等に記憶された送信データを読み出してネットワークへと送信し、もしくは、ネットワークから受信した受信データを記憶装置上に設けた受信バッファ領域等へと書き込む。このように、通信インターフェイス2030は、DMA(ダイレクト・メモリ・アクセス)方式により記憶装置との間で送受信データを転送してもよく、これに代えて、CPU2000が転送元の記憶装置又は通信インターフェイス2030からデータを読み出し、転送先の通信インターフェイス2030又は記憶装置へとデータを書き込むことにより送受信データを転送してもよい。
【0092】
また、CPU2000は、ハードディスクドライブ2040、CD−ROMドライブ2060(CD−ROM2095)、フレキシブルディスク・ドライブ2050(フレキシブルディスク2090)等の外部記憶装置に格納されたファイルまたはデータベース等の中から、全部または必要な部分をDMA転送等によりRAM2020へと読み込ませ、RAM2020上のデータに対して各種の処理を行う。そして、CPU2000は、処理を終えたデータを、DMA転送等により外部記憶装置へと書き戻す。このような処理において、RAM2020は、外部記憶装置の内容を一時的に保持するものとみなせるから、本実施形態においてはRAM2020及び外部記憶装置等をメモリ、記憶部、または記憶装置等と総称する。
【0093】
本実施形態における各種のプログラム、データ、テーブル、データベース等の各種の情報は、このような記憶装置上に格納されて、情報処理の対象となる。なお、CPU2000は、RAM2020の一部をキャッシュメモリに保持し、キャッシュメモリ上で読み書きを行うこともできる。このような形態においても、キャッシュメモリはRAM2020の機能の一部を担うから、本実施形態においては、区別して示す場合を除き、キャッシュメモリもRAM2020、メモリ、及び/又は記憶装置に含まれるものとする。
【0094】
また、CPU2000は、RAM2020から読み出したデータに対して、プログラムの命令列により指定された、本実施形態中に記載した各種の演算、情報の加工、条件判断、情報の検索・置換等を含む各種の処理を行い、RAM2020へと書き戻す。例えば、CPU2000は、条件判断を行う場合においては、本実施形態において示した各種の変数が、他の変数または定数と比較して、大きい、小さい、以上、以下、等しい等の条件を満たすか否かを判断し、条件が成立した場合(又は不成立であった場合)に、異なる命令列へと分岐し、またはサブルーチンを呼び出す。
【0095】
また、CPU2000は、記憶装置内のファイルまたはデータベース等に格納された情報を検索することができる。例えば、第1属性の属性値に対し第2属性の属性値がそれぞれ対応付けられた複数のエントリが記憶装置に格納されている場合において、CPU2000は、記憶装置に格納されている複数のエントリの中から第1属性の属性値が指定された条件と一致するエントリを検索し、そのエントリに格納されている第2属性の属性値を読み出すことにより、所定の条件を満たす第1属性に対応付けられた第2属性の属性値を得ることができる。
【0096】
以上に示したプログラム又はモジュールは、外部の記録媒体に格納されてもよい。記録媒体としては、フレキシブルディスク2090、CD−ROM2095の他に、DVD又はCD等の光学記録媒体、MO等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワーク又はインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ1900に提供してもよい。
【0097】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0098】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0099】
10 情報処理装置、102 履歴取得部、104 第1モデル生成部、106 影響算出部、108 関係検出部、110 第2モデル生成部、112 グループ抽出部、1900 コンピュータ、2000 CPU、2010 ROM、2020 RAM、2030 通信インターフェイス、2040 ハードディスクドライブ、2050 フレキシブルディスク・ドライブ、2060 CD−ROMドライブ、2070 入出力チップ、2075 グラフィック・コントローラ、2080 表示装置、2082 ホスト・コントローラ、2084 入出力コントローラ、2090 フレキシブルディスク、2095 CD−ROM
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16